La fisica di Feynman - Edizione Millennium, Vol. 1 • Meccanica • Radiazione • Calore [1, IIIª ed.] 9788808478153


124 39 35MB

italian Pages 588 Year 2017

Report DMCA / Copyright

DOWNLOAD PDF FILE

Table of contents :
Gli Autori
Prefazione a La Fisica di Feynman - Edizione Millennium
Prefazione alla prima edizione italiana
Introduzione di Feynman
Indice
01 Atomi in moto
1.1 Introduzione
1.2 La materia è composta di atomi
1.3 Processi atomici
1.4 Reazioni chimiche
02 Fondamenti della fisica
2.1 Introduzione
2.2 La fisica prima del 1920
2.3 Fisica quantistica
2.4 Nuclei e particelle
03 Le relazioni della fisica con le altre scienze
3.1 Introduzione
3.2 La chimica
3.3 La biologia
3.4 L’astronomia
3.5 La geologia
3.6 La psicologia
3.7 Come mai è andata così?
04 Conservazione dell’energia
4.1 Che cos’è l’energia?
4.2 Energia potenziale gravitazionale
4.3 Energia cinetica
4.4 Altre forme di energia
05 Tempo e distanza
5.1 Il moto
5.2 Il tempo
5.3 Piccoli intervalli tempo
5.4 Intervalli lunghi di tempo
5.5 Unità e campioni di tempo
5.6 Grandi distanze
5.7 Piccole distanze
06 Probabilità
6.1 Caso e probabilità
6.2 Fluttuazioni
6.3 Moto casuale
6.4 Una distribuzione di probabilità
6.5 Il principio di indeterminazione
07 La teoria della gravitazione
7.1 Moti planetari
7.2 Le leggi di Keplero
7.3 Sviluppo della dinamica
7.4 Legge della gravitazione di Newton
7.5 Gravitazione universale
7.6 L’esperimento di Cavendish
7.7 Che cos’è la gravità?
7.8 Gravità e relatività
08 Il moto
8.1 Descrizione del moto
8.2 Velocità
8.3 Velocità come derivata
8.4 Distanza come integrale
8.5 Accelerazione
09 Le leggi della dinamica di Newton
9.1 Quantità di moto e forza
9.2 Velocità e velocità vettoriale
9.3 Componenti di velocità, accelerazione e forza
9.4 Che cos’è la forza?
9.5 Significato delle equazioni dinamiche
9.6 Soluzione numerica delle equazioni
9.7 Moti planetari
10 Conservazione della quantità di moto
10.1 La terza legge di Newton
10.2 Conservazione della quantità di moto
10.3 La quantità di moto si conserva!
10.4 Quantità di moto ed energia
10.5 Quantità di moto relativistica
11 Vettori
11.1 La simmetria in fisica
11.2 Traslazioni
11.3 Rotazioni
11.4 Vettori
11.5 Algebra vettoriale
11.6 Le leggi di Newton nella notazione vettoriale
11.7 Prodotto scalare di vettori
12 Caratteristiche della forza
12.1 Che cos’è una forza?
12.2 Attrito
12.3 Forze molecolari
12.4 Forze fondamentali. I campi
12.5 Forze apparenti
12.6 Forze nucleari
13 Lavoro ed energia potenziale (1)
13.1 Energia di un corpo che cade
13.2 Lavoro fatto dalla gravità
13.3 Additività dell’energia
13.4 Campo gravitazionale di oggetti grandi
14 Lavoro ed energia potenziale (2)
14.1 Lavoro
14.2 Moto vincolato
14.3 Forze conservative
14.4 Forze non conservative
14.5 Potenziali e campi
15 La teoria speciale della relatività
15.1 Il principio di relatività
15.2 La trasformazione di Lorentz
15.3 L’esperimento di Michelson-Morley
15.4 Trasformazioni di tempo
15.5 La contrazione di Lorentz
15.6 Simultaneità
15.7 Quadrivettori
15.8 Dinamica relativistica
15.9 Equivalenza di massa ed energia
16 Energia e quantità di moto relativistiche
16.1 La relatività e i filosofi
16.2 Il paradosso dei gemelli
16.3 Trasformazione delle velocità
16.4 Massa relativistica
16.5 Energia relativistica
17 Spazio-tempo
17.1 La geometria dello spazio-tempo
17.2 Intervalli nello spazio-tempo
17.3 Passato, presente e futuro
17.4 Ancora sui quadrivettori
17.5 Algebra dei quadrivettori
18 Rotazione in due dimensioni
18.1 Il centro di massa
18.2 Rotazione di un corpo rigido
18.3 Momento della quantità di moto
18.4 Conservazione del momento della quantità di moto
19 Centro di massa e momento di inerzia
19.1 Proprietà del centro di massa
19.2 Localizzazione del centro di massa
19.3 Ricerca del momento di inerzia
19.4 Energia cinetica di rotazione
20 Rotazione nello spazio
20.1 Momenti in tre dimensioni
20.2 Le equazioni della rotazione usando prodotti vettoriali
20.3 Il giroscopio
20.4 Momento della quantità di moto di un corpo solido
21 L’oscillatore armonico
21.1 Equazioni di erenziali lineari
21.2 L’oscillatore armonico
21.3 Moto armonico e moto circolare
21.4 Condizioni iniziali
21.5 Oscillazioni forzate
22 Algebra
22.1 Addizione e moltiplicazione
22.2 Le operazioni inverse
22.3 Astrazione e generalizzazione
22.4 Approssimazione dei numeri irrazionali
22.5 Numeri complessi
22.6 Esponenti immaginari
23 Risonanza
23.1 Numeri complessi e moto armonico
23.2 Oscillatore forzato con smorzamento
23.3 Risonanza elettrica
23.4 La risonanza in natura
24 Transitori
24.1 L’energia di un oscillatore
24.2 Oscillazioni smorzate
24.3 Transitori elettrici
25 Sistemi lineari
25.1 Equazioni di erenziali lineari
25.2 Sovrapposizione di soluzioni
25.3 Oscillazioni nei sistemi lineari
25.4 Le analogie in fisica
25.5 Impedenze in serie e in parallelo
26 Ottica:
il principio del tempo minimo
26.1 La luce
26.2 Riflessione e rifrazione
26.3 Il principio di Fermat del tempo minimo
26.4 Applicazioni del principio di Fermat
26.5 Un enunciato più preciso del principio di Fermat
26.6 Come funziona
27 Ottica geometrica
27.1 Introduzione
27.2 Distanza focale di una superficie sferica
27.3 La distanza focale di una lente
27.4 Ingrandimento
27.5 Lenti composte
27.6 Aberrazioni
27.7 Potere risolutivo
28 Radiazione elettromagnetica
28.1 Elettromagnetismo
28.2 Radiazione
28.3 Il radiatore a dipolo
28.4 Interferenza
29 Interferenza
29.1 Onde elettromagnetiche
29.2 Energia della radiazione
29.3 Onde sinusoidali
29.4 Due radiatori a dipolo
29.5 La matematica dell’interferenza
30 Diffrazione
30.1 L’ampiezza risultante dovuta a n oscillatori uguali
30.2 Il reticolo di di razione
30.3 Potere risolutivo di un reticolo
30.4 L’antenna parabolica
30.5 Pellicole colorate e cristalli
30.6 Di razione di schermi opachi
30.7 II campo di un piano di cariche oscillanti
31 L’origine dell’indice di rifrazione
31.1 L’indice di rifrazione
31.2 Il campo dovuto al mezzo
31.3 Dispersione
31.4 Assorbimento
31.5 L’energia trasportata da un’onda elettrica
31.6 Di razione della luce da uno schermo
32 Smorzamento per radiazione e diffusione della luce
32.1 Resistenza di radiazione
32.2 La rapidità di radiazione dell’energia
32.3 Smorzamento dovuto alla radiazione
32.4 Sorgenti indipendenti
32.5 Di usione della luce
33 Polarizzazione
33.1 Il vettore elettrico della luce
33.2 Polarizzazione della luce di usa
33.3 Birifrangenza
33.4 Polarizzatori
33.5 Attività ottica
33.6 L’intensità della luce riflessa
33.7 Rifrazione anomala
34 Effetti relativistici nella radiazione
34.1 Sorgenti in movimento
34.2 Scoperta del moto «apparente»
34.3 Radiazione di sincrotrone
34.4 Radiazione cosmica di sincrotrone
34.5 Radiazione di frenamento
34.6 L’e etto Doppler
34.7 Il quadrivettore ω , k
34.8 Aberrazione
34.9 La quantità di moto della luce
35 Visione del colore
35.1 L’occhio umano
35.2 Il colore dipende dall’intensità
35.3 Misura della sensazione del colore
35.4 Il diagramma cromatico
35.5 Il meccanismo della visione del colore
35.6 Fisiochimica della visione del colore
36 Meccanismo della visione
36.1 La sensazione del colore
36.2 La fisiologia dell’occhio
36.3 I bastoncelli
36.4 L’occhio composto (degli insetti)
36.5 Altri occhi
36.6 Neurologia della visione
37 Comportamento quantistico
37.1 Meccanica atomica
37.2 Un esperimento eseguito con pallottole
37.3 Un esperimento eseguito con onde
37.4 Un esperimento eseguito con elettroni
37.5 L’interferenza delle onde di elettroni
37.6 Osservazione degli elettroni
37.7 Primi princìpi della meccanica quantistica
37.8 Il principio di indeterminazione
38 Relazione fra i punti di vista ondulatorio e corpuscolare
38.1 Ampiezze dell’onda di probabilità
38.2 Misura della posizione e della quantità di moto
38.3 Di razione nei cristalli
38.4 Le dimensioni dell’atomo
38.5 Livelli energetici
38.6 Implicazioni filosofiche
39 La teoria cinetica dei gas
39.1 Proprietà della materia
39.2 La pressione di un gas
39.3 Compressibilità della radiazione
39.4 Temperatura ed energia cinetica
39.5 La legge dei gas ideali
40 I princìpi della meccanica statistica
40.1 L’atmosfera esponenziale
40.2 La legge di Boltzmann
40.3 Evaporazione di un liquido
40.4 La distribuzione delle velocità molecolari
40.5 I calori specifici dei gas
40.6 Il fallimento della fisica classica
41 Il moto browniano
41.1 Equipartizione dell’energia
41.2 Equilibrio termico della radiazione
41.3 L’equipartizione e l’oscillatore quantistico
41.4 Il cammino casuale
42 Applicazioni della teoria cinetica
42.1 Evaporazione
42.2 Emissione termoionica
42.3 Ionizzazione termica
42.4 Cinetica chimica
42.5 Le leggi della radiazione di Einstein
43 La diffusione
43.1 Collisioni tra molecole
43.2 Il cammino libero medio
43.3 La velocità di trascinamento
43.4 Conduttività ionica
43.5 Di usione molecolare
43.6 Conducibilità termica
44 Le leggi della termodinamica
44.1 Macchine termiche: la prima legge
44.2 La seconda legge
44.3 Macchine reversibili
44.4 Il rendimento di una macchina ideale
44.5 La temperatura termodinamica
44.6 Entropia
Riassunto delle leggi della termodinamica
45 Chiarimenti sulla termodinamica
45.1 Energia interna
45.2 Applicazioni
45.3 L’equazione di Clausius-Clapeyron
46 Ruota dentata e dente d’arresto
46.1 Come funziona una ruota dentata
46.2 La ruota dentata come macchina
46.3 Reversibilità in meccanica
46.4 Irreversibilità
46.5 Ordine ed entropia
47 Il suono e l’equazione dell’onda
47.1 Le onde
47.2 La propagazione del suono
47.3 L’equazione dell’onda
47.4 Soluzioni dell’equazione dell’onda
47.5 La velocità del suono
48 Battimenti
48.1 Somma di due onde
48.2 Note di battimento e modulazione
48.3 Bande laterali
48.4 Treni d’onde localizzati
48.5 Ampiezze di probabilità per le particelle
48.6 Onde in tre dimensioni
48.7 Modi di vibrazione normali
49 Modi di vibrazione
49.1 La riflessione delle onde
49.2 Onde limitate, con frequenze naturali
49.3 Modi di vibrazione in due dimensioni
49.4 Pendoli accoppiati
49.5 Sistemi lineari
50 Armoniche
50.1 Toni musicali
50.2 La serie di Fourier
50.3 Qualità e assonanza
50.4 I coe cienti di Fourier
50.5 Il teorema dell’energia
50.6 Risposte non lineari
51 Le onde
51.1 Onde di prua
51.2 Onde d’urto
51.3 Onde nei solidi
51.4 Onde superficiali
52 La simmetria nelle leggi fisiche
52.1 Operazioni di simmetria
52.2 Simmetria nello spazio e nel tempo
52.3 Simmetria e leggi di conservazione
52.4 Riflessioni speculari
52.5 Vettori polari e assiali
52.6 Qual è la destra?
52.7 La parità non si conserva!
52.8 Antimateria
52.9 Simmetrie rotte
Indice analitico
Recommend Papers

La fisica di Feynman - Edizione Millennium, Vol. 1 • Meccanica • Radiazione • Calore [1, IIIª ed.]
 9788808478153

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

Gli Autori

Richard Feynman Richard P. Feynman è nato nel 1918 a New York e ha conseguito il dottorato nel 1942 alla Princeton University. Malgrado la giovane età ha svolto un ruolo chiave nel Progetto Manhattan, condotto a Los Alamos durante la Seconda guerra mondiale. In seguito Feynman ha insegnato alla Cornell University e al California Institute of Technology. Nel 1965 ha ricevuto il Nobel per la fisica, insieme a Julian Schwinger e Sin-Itiro Tomonaga, per le sue ricerche sull’elettrodinamica quantistica, più di preciso per aver risolto alcune inconsistenze della teoria. Ha inoltre formulato una teoria matematica per spiegare il fenomeno della superfluidità nell’elio liquido. Tempo dopo ha svolto con Murray Gell-Mann ricerche fondamentali sulle interazioni deboli, per esempio sul decadimento beta. Nell’ultima parte della sua vita Feynman ha contribuito in maniera essenziale allo sviluppo della teoria dei quark, elaborando il modello a partoni per descrivere le collisioni di protoni ad alta energia. Oltre a questi risultati teorici, Feynman ha introdotto in fisica nuove tecniche per calcoli fondamentali e notazioni innovative; una fra tutte, i diagrammi di Feynman, che sono diventati imprescindibili e che, forse più di qualsiasi altro formalismo nella storia recente della scienza, hanno influenzato in profondità la concezione e il calcolo di processi fisici fondamentali. Feynman aveva grandi doti didattiche. Fra i suoi molti riconoscimenti, era particolarmente orgoglioso della Medaglia Ørsted per l’insegnamento della fisica, assegnatagli nel 1972. La Fisica di Feynman, pubblicata originariamente nel 1963, è stata descritta su Scientific American come «tosta, ma nutriente e ricca di sapore. Venticinque anni dopo, è ormai il manuale di riferimento tanto per gli insegnanti quanto per i migliori studenti dei primi anni». Per diffondere la comprensione della fisica nel grande pubblico, Feynman ha scritto La legge fisica e QED: la strana teoria della luce e della materia. Ha al suo attivo anche diversi testi avanzati divenuti dei classici, e manuali per studenti e ricercatori. Richard Feynman è stato anche un’attiva figura pubblica. Com’è ben noto, ha fatto parte della commissione che ha indagato sul disastro del Challenger, svolgendo la famo-

sa dimostrazione della fragilità delle guarnizioni O-ring a basse temperature: un esperimento elegante per cui sono bastati un morsetto e un bicchiere d’acqua ghiacciata. È forse meno nota la sua partecipazione, negli anni Sessanta, al California State Curriculum Committee. Incaricato di selezionare i libri di testo per le scuole dello stato, Feynman criticò aspramente il basso livello di quei manuali. Nessun elenco delle innumerevoli imprese di Feynman in campo scientifico e didattico potrebbe restituire per intero la sua figura. Come ben sanno i suoi lettori, la personalità vivace e sfaccettata di Feynman risalta in tutte le sue opere, anche nei testi più tecnici. Oltre a svolgere ricerca in fisica, in vari momenti della sua vita Feynman ha riparato radio, scassinato serrature, creato opere d’arte, danzato, suonato i bongos e perfino decifrato geroglifici Maya. Era un esempio perfetto di atteggiamento empirico e sempre curioso verso il mondo circostante. Richard Feynman è morto a Los Angeles il 15 febbraio 1988.

Robert Leighton Robert B. Leighton è nato a Detroit nel 1919. Nel corso della sua vita ha svolto ricerche pioneristiche in vari campi della fisica: stato solido, raggi cosmici, fisica solare, fotografia planetaria, astronomia infrarossa, millimetrica e submillimetrica; ha inoltre contribuito alla nascita della moderna fisica delle particelle. Famoso per i suoi innovativi progetti di strumenti scientifici, era anche un insegnante apprezzatissimo: ancor prima di partecipare alla stesura de La Fisica di Feynman, ha scritto il manuale di grande successo Principles of Modern Physics. Nei primi anni Cinquanta Leighton ha dato un notevole contributo a dimostrare che il muone decade in un elettrone e due neutrini, e ha realizzato la prima misura dello spettro energetico dell’elettrone risultante. Dopo la scoperta delle particelle strane, Leighton ne ha osservato per primo il decadimento, spiegandone varie proprietà. Pochi anni dopo Leighton ha inventato gli spettroeliografi a effetto Doppler e a effetto Zeeman. Grazie allo spettroeliografo a effetto Zeeman, insieme ai suoi studenti ha creato una mappa ad altissima risoluzione del campo

IV

Gli Autori

magnetico solare, giungendo a scoperte sorprendenti: la «super granulazione», e oscillazioni dell’ordine di cinque minuti nelle velocità superficiali locali del Sole; è così nato il nuovo campo della sismologia solare. Leighton ha poi progettato e costruito strumenti con cui realizzare immagini più nitide dei pianeti, e ha inaugurato un altro campo di ricerca: l’ottica adattiva. Le immagini dei pianeti a opera di Leighton sono state considerate le migliori fino agli anni Sessanta, quando è iniziata l’era dell’esplorazione spaziale con le sonde. All’inizio degli anni Sessanta Leighton ha creato un nuovo ed economico telescopio a infrarossi e ha realizzato la prima mappa del cielo a 2,2 µm, individuando così nella nostra galassia un numero sorprendentemente alto di oggetti indistinguibili a occhio nudo perché troppo freddi. A metà degli anni Sessanta ha diretto gli studi sulle immagini nelle missioni Mariner 4, 6 e 7 che il Jet Propulsion Laboratory ha inviato verso Marte. Nello stesso laboratorio, Leighton ha dato un contributo decisivo alla creazione del primo sistema di televisione digitale nello spazio profondo, e ha partecipato alle prime ricerche sull’elaborazione e il miglioramento delle immagini. Negli anni Settanta Leighton è passato a occuparsi dello sviluppo di antenne grandi ed economiche utilizzabili per l’interferometria millimetrica e l’astronomia submillimetrica. Una volta di più le sue spiccate doti sperimentali hanno aperto un nuovo campo di ricerca, tuttora attivamente studiato con vari telescopi, come l’Owens Valley Radio Observatory in California e l’Atacama Large Millimeter/submillimeter Array (ALMA) in Cile. Robert Leighton è morto il 9 marzo 1997 a Pasadena, in California.

Matthew Sands Matthew Sands è nato nel 1919 a Oxford, nel Massachusetts; ha conseguito il Bachelor of Arts alla Clark University nel 1940 e il Master of Arts alla Rice University nel 1941. Durante la Seconda guerra mondiale ha partecipato al Progetto Manhattan, a Los Alamos, occupandosi di elet-

© 978-8808-22107-0

tronica e strumentazione. Dopo la guerra ha contribuito a fondare la Los Alamos Federation of Atomic Scientists, che si opponeva a usi ulteriori delle armi nucleari. Nello stesso periodo ha conseguito il dottorato al MIT, studiando i raggi cosmici sotto la direzione di Bruno Rossi. Nel 1950 il Caltech ha assunto Sands perché partecipasse alla costruzione di un elettrosincrotrone da 1,5 GeV e ne seguisse il funzionamento. Sands è stato il primo a dimostrare, sul piano teorico e sperimentale, l’importanza degli effetti quantistici negli acceleratori di elettroni. Dal 1960 al 1966 Sands ha fatto parte della Commission on College Physics e ha supervisionato le riforme nel corso di laurea in fisica del Caltech sfociate nella creazione de La Fisica di Feynman. Nello stesso periodo è stato consulente sulle armi nucleari e il disarmo per il President’s Science Advisory Committee, la Arms Control and Disarmament Agency e il Department of Defense. Nel 1963 Sands è diventato vicedirettore per la costruzione e la gestione dello Stanford Linear Accelerator, al laboratorio SLAC, dove si è anche occupato del collisionatore da 3 GeV, Stanford Positron Electron Asymmetric Rings (SPEAR). Dal 1969 al 1985 Sands è stato professore di fisica alla University of California a Santa Cruz, di cui è anche stato Vice Chancellor for Science dal 1969 al 1972. Nel 1972 l’American Association of Physics Teachers gli ha conferito il Distinguished Service Award. Ha continuato a occuparsi di ricerca con gli acceleratori di particelle anche da professore emerito, fino al 1994. Nel 1998 la American Physical Society ha conferito a Sands il Robert R. Wilson Prize «per i suoi vari contributi alla fisica degli acceleratori e allo sviluppo di collisionatori a protoni e a elettronipositroni». Negli anni della pensione Sands ha seguito insegnanti di scienze delle scuole primarie e secondarie di Santa Cruz, aiutandoli a creare attività didattiche in laboratorio e al computer. Ha inoltre curato la pubblicazione dei Consigli per risolvere i problemi di fisica, cui ha partecipato nell’Edizione completa de La Fisica di Feynman. Matthew Sands è morto il 13 settembre 2014 a Santa Cruz, in California.

Prefazione a La Fisica di Feynman - Edizione Millennium

È passato quasi mezzo secolo da quando Feynman ha tenuto al Caltech il corso di fisica generale da cui sono stati tratti i tre volumi de La Fisica di Feynman. In questi cinque decenni la nostra concezione del mondo fisico ha fatto enormi progressi, ma La Fisica di Feynman non ha perso di attualità. Grazie agli straordinari metodi didattici e all’intuito fisico di Feynman, le sue lezioni non hanno perso il loro smalto dall’epoca della prima edizione. Principianti ed esperti di fisica le studiano in tutto il mondo; se ne contano almeno una decina di traduzioni, e nella sola lingua inglese ne sono state stampate oltre un milione e mezzo di copie. È forse l’unico testo di fisica ad aver avuto una risonanza tanto vasta e duratura. Con l’Edizione Millennium, La Fisica di Feynman entra nell’era dell’editoria elettronica. Grazie alle nuove tecnologie, il testo e le equazioni sono stati espressi in LaTeX, linguaggio elettronico di composizione tipografica, e tutte le figure sono state ricreate con moderni programmi di grafica. La versione a stampa di questa edizione non ne esce stravolta: è quasi identica agli originali volumi rossi ben noti agli studenti di fisica e apprezzati da decenni. Le differenze principali risiedono nell’ampliamento e miglioramento dell’indice analitico, nella correzione di 885 errori scovati dai lettori nei cinque anni seguenti alla prima ristampa dell’edizione precedente, e nella facilità con cui si potranno apportare correzioni eventualmente segnalate dai lettori futuri. Ne riparlerò più avanti.

Ricordi delle lezioni di Feynman I tre volumi de La Fisica di Feynman sono un vero e proprio trattato di didattica. Sono anche una documentazione storica delle lezioni di fisica generale tenute da Feynman nel 1961-1964, obbligatorie per gli studenti dei primi due anni di tutte le facoltà scientifiche del Caltech. Mi sono sempre chiesto, e forse anche i lettori, che effetto abbiano avuto le lezioni di Feynman sugli studenti che le hanno frequentate. Nella sua Introduzio-

ne a questi volumi, Feynman era piuttosto pessimista: «non credo che il mio corso abbia avuto molto successo con gli studenti». Matthew Sands, nella sua rievocazione in Consigli per risolvere i problemi di fisica, esprime un parere assai più positivo. Per curiosità, nella primavera del 2005 ho contattato a voce o per e-mail un insieme quasi casuale di diciassette studenti che hanno seguito il corso di Feynman negli anni 1961-63 (tra i circa centocinquanta originari), includendone alcuni che l’avevano trovato molto difficile, e altri che l’avevano assimilato senza problemi; studenti di biologia, chimica, ingegneria, geologia, matematica e astronomia, oltre che di fisica. I ricordi sono forse diventati più rosei col passare degli anni, ma per circa l’80% degli studenti le lezioni di Feynman sono state il clou degli anni universitari. «Era come andare a messa». «Ne uscivi cambiato», era «un’esperienza unica, forse la cosa più importante che mi ha dato il Caltech». «Studiavo biologia, ma le lezioni di Feynman svettavano su tutti gli altri corsi [...] anche se devo ammettere che all’epoca non riuscivo a risolvere gli esercizi e non li consegnavo quasi mai». «Ero tra gli studenti meno promettenti del corso, ma non ho mai fatto un’assenza. [...] Ricordo bene l’entusiasmo della scoperta trasmesso da Feynman e posso riviverlo ancora oggi. [...] Nelle sue lezioni c’era un [...] coinvolgimento emotivo che probabilmente è andato perso nella versione stampata». Al contrario, molti studenti hanno ricordi negativi, soprattutto per due ragioni: (1) «Le lezioni non insegnavano a risolvere i problemi. Feynman era troppo abile. Conosceva diversi trucchi e le approssimazioni utilizzabili, rispetto ai principianti poteva avvantaggiarsi di un intuito basato sulla sua esperienza e genialità». Consci di questa lacuna del corso, Feynman e colleghi vi hanno parzialmente rimediato con il materiale incluso nei Consigli per risolvere i problemi di fisica: tre lezioni di Feynman sulla risoluzione di problemi e un insieme di esercizi completi di soluzione compilato da Robert B. Leighton e Rochus Vogt. (2) «C’erano aspetti molto frustranti: l’incertezza sul probabile argomento della lezione seguente, la mancanza di un libro di testo o di una bibliografia in qual-

VI

Prefazione a La Fisica di Feynman - Edizione Millennium

che modo collegata a quanto visto a lezione, e quindi l’impossibilità di leggere qualcosa in anticipo. [...] In aula trovavo le lezioni interessanti e comprensibili, ma diventavano sanscrito una volta fuori [quando cercavo di ricostruirne i dettagli]». Questo problema, naturalmente, è stato risolto grazie ai tre volumi della versione stampata de La Fisica di Feynman. Sono poi diventati il libro di testo degli studenti del Caltech per molti anni e a oggi rimangono una delle maggiori eredità di Feynman.

Storia delle correzioni La Fisica di Feynman è stata prodotta molto rapidamente da Feynman e dai suoi coautori, Robert B. Leighton e Matthew Sands, che hanno sfruttato e poi ampliato le registrazioni audio e le foto della lavagna realizzate durante le lezioni di Feynman(1). Data la velocità a cui hanno lavorato Feynman, Leighton e Sands, era inevitabile che nella prima edizione fossero sfuggiti molti errori. Negli anni seguenti Feynman aveva accumulato lunghe liste di presunti errori, scovati dagli studenti e dai professori del Caltech e dai lettori di tutto il mondo. Negli anni Sessanta e nei primi anni Settanta Feynman ha sottratto del tempo alle sue molteplici attività per controllare gran parte degli errori presunti nei volumi I e II e correggerli nelle edizioni seguenti. Ma poiché il suo senso del dovere ha avuto la peggio rispetto all’eccitazione di fare nuove scoperte, Feynman non è mai arrivato a rivedere gli errori del volume III(2). Dopo la sua morte prematura, nel 1988, alcune liste di errori in tutti e tre i volumi sono state depositate negli archivi del Caltech e completamente dimenticate. Nel 2002, Ralph Leighton (figlio di Robert Leighton, ormai deceduto, e grande amico di Feynman) mi ha informato dell’esistenza dei vecchi errori e di una nuova lunga lista stilata dal suo amico Michael Gottlieb. Leighton ha proposto che il Caltech pubblicasse una nuova edizione de La Fisica di Feynman, correggendo tutti gli errori e accompagnandola a un nuovo volume di materiale supplementare, Consigli per risolvere i problemi di fisica, che stava preparando insieme a Gottlieb. (1)

Per una descrizione della genesi delle lezioni di Feynman e de La Fisica di Feynman, si vedano la prefazione di Feynman e le introduzioni a ciascun volume, la rievocazione di Matthew Sands nei Consigli per risolvere i problemi di fisica, e anche la prefazione speciale all’Edizione commemorativa de La Fisica di Feynman, scritta nel 1989 da David Goodstein e Gerry Neugebauer e inclusa anche nell’Edizione completa del 2005.

(2)

Nel 1975 ha iniziato a rivedere gli errori del terzo volume, ma preso da altri impegni ha lasciato la cosa a metà, senza apportare correzioni.

© 978-8808-22107-0

Feynman era il mio eroe e uno dei miei amici più cari. Quando ho visto la lista di errori e l’indice del nuovo volume proposto, ho subito accettato di dirigere il progetto per conto del Caltech (la patria accademica di Feynman per tanti anni, cui aveva ceduto tutti i diritti e gli obblighi per La Fisica di Feynman, congiuntamente a Leighton e Sands). Dopo un anno e mezzo di lavoro meticoloso da parte di Gottlieb, e una revisione minuziosa di Michael Hartl (un brillante ricercatore post-dottorato del Caltech che ha ricontrollato tutti gli errori e il nuovo volume), nel 2005 è uscita l’Edizione completa de La Fisica di Feynman, dove erano stati corretti circa 200 errori, accompagnata dai Consigli per risolvere i problemi di fisica di Feynman, Gottlieb e Leighton. Credevo proprio che quell’edizione sarebbe stata definitiva. Ma non avevo previsto la reazione entusiasta dei lettori di tutto il mondo all’appello di Gottlieb a scovare altri errori e segnalarli al sito che Gottlieb ha creato e continua a curare, The Feynman Lectures Website, www.feynmanlectures.info. Nei cinque anni successivi, sono stati segnalati 965 nuovi errori che sono sopravvissuti alla verifica scrupolosa di Gottlieb, Hartl e Nate Bode (un brillante studente di dottorato del Caltech, che ha preso il posto di Hartl nella verifica degli errori per conto del Caltech). Di questi 965 errori assodati, 80 sono stati corretti nella quarta ristampa della versione originale dell’Edizione completa (agosto 2006) e i restanti 885 sono stati corretti nella prima ristampa della nuova Edizione Millennium (332 nel volume I, 263 nel volume II e 200 nel volume III). Per maggiori informazioni sugli errori, si veda www.feynmanlectures.info. La ripulitura de La Fisica di Feynman dagli errori è chiaramente diventata un’impresa globale, seguita da una vasta comunità di appassionati. A nome del Caltech vorrei ringraziare i cinquanta lettori che hanno dato il proprio contributo dal 2005 a oggi, e i molti altri che lo faranno in futuro. Tutti i nomi sono elencati al seguente indirizzo: www.feynmanlectures.info/flp_errata.html. La stragrande maggioranza degli errori rientra in tre categorie: (1) refusi nel testo; (2) refusi ed errori matematici nelle equazioni, tabelle e figure – errori di segno o cifre sbagliate (per esempio un 5 al posto di un 4), elementi mancanti come pedici, segni di sommatoria, parentesi e termini nelle equazioni; (3) riferimenti sbagliati a capitoli, tabelle e figure. Errori di questo genere, benché non particolarmente gravi per i fisici esperti, possono frustrare e confondere i lettori principali cui Feynman aveva destinato il libro: gli studenti. È notevole che, tra tutti e 1165 gli errori corretti sotto la mia supervisione, quelli che considererei veri e propri errori di fisica siano soltanto una manciata. Un esempio si trova nel paragrafo 5.10 del volume II, dove ora è scritto «[...] distribuzioni statiche di cariche all’interno di un conduttore chiuso messo a terra non possono pro-

© 978-8808-22107-0

Prefazione a La Fisica di Feynman, Edizione Millennium

durre alcun campo [elettrico] all’esterno» (nelle edizioni precedenti mancava la precisazione «messo a terra»). Feynman ha ricevuto la segnalazione di questo errore da vari lettori, fra cui Beulah Elizabeth Cox, studentessa all’università The College of William and Mary, che in un esame aveva fatto affidamento sulla frase sbagliata di Feynman. Nel 1975 Feynman ha scritto a Cox(3): «il suo professore ha ragione a non darle punti, perché la sua risposta è sbagliata – come le ha dimostrato con il teorema di Gauss. Nella scienza bisogna credere alla logica e al ragionamento, non all’autorità. Lei ha quindi letto e inteso il libro correttamente. Io ho commesso un errore; in altre parole, il libro è sbagliato. Probabilmente stavo pensando al caso di una sfera conduttrice messa a terra, o forse al fatto che spostare le cariche in posizioni differenti all’interno di un conduttore non ha alcun effetto su ciò che accade all’esterno. Non so bene come mai, ma ho preso una cantonata; e l’ha presa anche lei, perché mi ha creduto».

Genesi della nuova Edizione Millennium Tra il novembre del 2005 e il luglio del 2006, il sito The Feynman Lectures Website (www.feynmanlectures.info) ha ricevuto 340 segnalazioni di errori. La cosa notevole è che in gran parte provenivano da una persona sola: Rudolf Pfeiffer, all’epoca ricercatore post-dottorato in fisica all’università di Vienna. L’editore, Addison Wesley, ha corretto 80 errori ma esitava a procedere per via dei costi: i libri erano stampati in fotolitografia, a partire da immagini fotografiche delle pagine risalenti agli anni Sessanta. Per correggere un errore occorreva rifare la composizione tipografica dell’intera pagina; per evitare l’introduzione di errori nuovi, la pagina veniva ricomposta due volte da persone diverse, poi confrontata e rivista da altri: un sistema davvero costoso, se gli errori da correggere sono centinaia. Gottlieb, Pfeiffer e Ralph Leighton, frustrati dalla situazione, hanno ideato un progetto per facilitare la correzione di tutti gli errori, mirato anche alla produzione di versioni elettroniche de La Fisica di Feynman. Nel 2007 hanno sottoposto la loro idea a me, in quanto rappresentante del Caltech. Ero entusiasta, ma esitante. Dopo aver visto ulteriori dettagli, tra cui un capitolo di prova della versione elettronica, ho consigliato al Caltech di coadiuvare Gottlieb, Pfeiffer e Leighton nella realizzazione pratica della loro idea. Il progetto è stato approvato da tre successivi direttori della Division of Physics, Mathematics and Astro(3)

Deviazioni perfettamente ragionevoli dalle vie battute: le lettere di Richard Feynman, a cura di Michelle Feynman, traduzione di Franco Ligabue (Adelphi, Milano, 2006), p. 244.

VII

nomy del Caltech – Tom Tombrello, Andrew Lange e Tom Soifer – e i complessi dettagli legali e contrattuali sono stati chiariti dal consigliere del Caltech per la proprietà intellettuale, Adam Cochran. Con la pubblicazione di questa nuova Edizione Millennium, il progetto è stato realizzato con successo, malgrado la sua complessità. Più di preciso: Pfeiffer e Gottlieb hanno convertito in LaTeX tutti e tre i volumi de La Fisica di Feynman. Le figure sono state ridisegnate in moderna forma elettronica in India, sotto la guida del traduttore tedesco de La Fisica di Feynman, Henning Heinze, a beneficio dell’edizione tedesca. Gottlieb e Pfeiffer hanno concesso l’uso non esclusivo delle loro equazioni in LaTeX nella versione tedesca (pubblicata da Oldenbourg) in cambio dell’uso non esclusivo delle figure di Heinze nella versione inglese dell’Edizione Millennium. Pfeiffer e Gottlieb hanno controllato scrupolosamente tutto il testo e le equazioni in LaTeX e tutte le figure ridisegnate, apportando le correzioni necessarie. Per conto del Caltech, io e Nate Bode abbiamo fatto controlli a campione sul testo, le equazioni e le figure; siamo stati piacevolmente sorpresi di non trovare alcun errore. Pfeiffer e Gottlieb sono stati di una precisione e accuratezza incredibili. Pfeiffer e Gottlieb hanno incaricato John Sullivan della Huntington Library di digitalizzare le foto della lavagna delle lezioni di Feynman del 1962-64, e la George Blood Audio di digitalizzare le registrazioni delle letture – con l’incoraggiamento e il sostegno finanziario di Carver Mead, professore del Caltech, l’assistenza logistica di Shelley Erwin, archivista del Caltech, e l’assistenza legale di Cochran. Le questioni legali non erano di poco conto: il Caltech aveva autorizzato Addison Wesley a pubblicare l’edizione stampata negli anni Sessanta, la versione audio delle lezioni di Feynman e una variante di un’edizione elettronica negli anni Novanta. All’inizio del nuovo millennio, tramite una serie di acquisizioni, i diritti per la stampa erano stati trasferiti al gruppo editoriale Pearson, mentre quelli per le versioni audio ed elettronica erano stati trasferiti al gruppo editoriale Perseus. Cochran, con l’aiuto di Ike Williams, un legale specializzato nell’editoria, è riuscito a riunificare tutti questi diritti sotto l’egida di Perseus / Basic Books, rendendo possibile la nuova Edizione Millennium.

Ringraziamenti Desidero ringraziare a nome del Caltech le persone che hanno reso possibile l’Edizione Millennium. In particolare quelle che, come già accennato, hanno svolto un ruolo essenziale: Ralph Leighton, Michael Gottlieb, Tom Tombrello, Michael Hartl, Rudolf Pfeiffer, Henning Heinze, Adam Cochran, Carver Mead, Nate Bode,

VIII

Prefazione a La Fisica di Feynman - Edizione Millennium

Shelley Erwin, Andrew Lange, Tom Soifer, Ike Williams e i cinquanta lettori che hanno inviato correzioni (elencati su www.feynmanlectures.info). Ringrazio anche Michelle Feynman (figlia di Richard Feynman) per i consigli e l’instancabile sostegno, Alan Rice del Caltech per i consigli e l’aiuto dietro le quinte, Stephan Puchegger e Calvin Jackson per aver consigliato e assistito Pfeiffer nella conversione de La Fisica di Feynman in LaTeX, Michael Figl, Manfred Smolik e Andreas Stangl per di-

© 978-8808-22107-0

scussioni sulla correzione degli errori; infine, Perseus/ Basic Books e (per le edizioni precedenti) Addison Wesley. KIP S. THORNE Feynman Professor of Theoretical Physics, Emeritus California Institute of Technology

Ottobre 2010

Le risorse multimediali All’indirizzo online.universita.zanichelli.it / feynman sono disponibili i link per consultare il testo originale in lingua inglese messo a disposizione dal California Institute of Technology. Inoltre, chi acquista il libro può scaricare gratuitamente l’ebook, seguendo le istruzioni presenti nel sito sopra

indicato. L’ebook si legge con l’applicazione Booktab, che si scarica gratis da AppStore (sistemi operativi Apple) o da Google Play (sistemi operativi Android). Per accedere alle risorse protette è necessario registrarsi su myzanichelli.it inserendo la chiave di attivazione personale contenuta nel libro.

Prefazione alla prima edizione italiana

Il corso di lezioni di Feynman riscosse fin dal suo apparire numerosi giudizi positivi. Colpiva, nel libro, la freschezza del linguaggio, un linguaggio più «parlato» che «scritto», l’originalità dell’esposizione, ma soprattutto l’acume critico e la profondità con cui i diversi argomenti venivano presentati. Dal punto di vista didattico si trattava in molti casi di un modo nuovo e moderno di insegnare la fisica. Raramente, di fronte ad argomenti complessi, Feynman scende al compromesso di semplificare la materia, ma in generale, affronta le difficoltà, anche se con rara abilità riesce a farle sembrare più facili. Per il lettore privo di una buona conoscenza della lingua inglese, le difficoltà del linguaggio si aggiungono alle difficoltà di comprensione dei concetti esposti. Per questo

crediamo di aver fatto opera gradita ai lettori italiani accettando il non facile compito di traduzione. Il libro esce nell’edizione italiana in una versione bilingue, con testo originale a fronte (*). La traduzione è quindi necessariamente letterale, oltre il limite di eleganza e di scorrevolezza che una traduzione più libera avrebbe permesso. In questo modo crediamo di aver rispettato totalmente lo spirito con cui è stato scritto il libro, libro che riteniamo particolarmente utile per ampliare la preparazione di fisica generale, per il colloquio di cultura generale e per la preparazione di esami di concorso. E. CLEMENTEL, S. FOCARDI, L. MONARI Bologna, maggio 1968

Bibliografia italiana e siti web Freeman Dyson, Turbare l’universo, Bollati Boringhieri, Torino, 2010: è la bellissima autobiografia di questo geniale fisico-matematico inglese. In un capitolo di questo libro, magistrale dal punto di vista narrativo, viene raccontato come Feynman elaborò la teoria dei diagrammi, per la quale vinse il premio Nobel, attraverso la sua descrizione di uomo e di scienziato. Lawrence M. Krauss, L’uomo dei quanti. La vita e la scienza di Richard Feynman, Codice Edizioni, Torino, 2011: il ritratto originale ed emozionante dell’uomo che è diventato una vera e propria leggenda per un’intera generazione di scienziati. Volumi di Richard Feynman disponibili in edizione italiana

La legge fisica, Bollati Boringhieri, Torino, 1993: raccolta di conferenze su cosa è la fisica e come funziona. D.L. Goodstein, J.R. Goodstein, Il moto dei pianeti intorno al sole, Zanichelli, Bologna, 1997: raccolta delle lezioni in cui Feynman analizza le leggi del moto dei pianeti seguendo le orme di Newton e utilizzando solo strumenti geometrici semplici (fuori catalogo).

James Gleick, Genio, la vita e la scienza di Richard Feynman, Garzanti, Milano, 1994 e 1998: la più completa biografia finora pubblicata. Presenta una minuziosa ricerca delle fonti e un’accurata ricostruzione dell’ambiente in cui Feynman si trovò a vivere e a operare (fuori catalogo). Sei pezzi facili, Adelphi, Milano, 2000: raccolta di alcune introduzioni tratte dai primi capitoli de La Fisica di Feynman.

Il piacere di scoprire, Adelphi, Milano, 2002: una raccolta di saggi vari, tra i quali la relazione con cui Feynman dimostrò che il disastro dello Space Shuttle Challenger, nel 1986, fu causato da una semplice guarnizione di gomma. Sei pezzi meno facili, Adelphi, Milano, 2004: raccolta di altre introduzioni su argomenti di fisica quantistica. Deviazioni perfettamente ragionevoli dalle vie battute, Adelphi, Milano, 2006: una raccolta di lettere rese disponibili dalla figlia Michelle, con i destinatari più disparati: eminenti scienziati, ma anche ammiratori, studenti, gente comune. Lettere che confermano la leggendaria versatilità di Feynman e la sua anticonformistica vocazione dialettica. (*)

Per questa edizione, come indicato a pag. VIII, il testo inglese è disponibile tra le risorse multimediali.

X

Prefazione alla prima edizione italiana

«Sta scherzando Mr. Feynman!» Vita e avventure di uno scienziato curioso, Zanichelli, Bologna, 2007: racconto di una vita piena di eventi incredibili, resi possibili da un impasto unico di acuta intelligenza, curiosità irrefrenabile, costante scetticismo e radicato umorismo. «Che t’importa di ciò che dice la gente?» Altre avventure di uno scienziato curioso, Zanichelli, Bologna, 2007: il testamento spirituale di Feynman, redatto, nel suo ultimo anno di vita, assieme all’amico Ralph Leighton. Il senso delle cose, Adelphi, Milano, 2010: raccolta di tre conferenze sulla natura della scienza, sui rapporti tra la scienza, la religione e la politica, e sull’impatto della scienza nella società. QED, la strana teoria della luce e della materia, Adelphi, Milano, 2010: raccolta di lezioni in cui, senza far uso della matematica, spiega la teoria quantistica dei campi. Un vero coup de theatre. Le battute memorabili di Feynman, Adelphi, Milano, 2017: idee, intuizioni, battute, riflessioni raccolte dalla figlia Michelle tra carte personali, registrazioni di conferenze, lezioni e interviste del padre, a testimonianza di un’insaziabile curiosità e di una intelligenza analitica giocosa e spietata.

© 978-8808-22107-0

R.B. Leighton, M.L. Sands, La Fisica di Feynman, edizione completa, Zanichelli, Bologna, 2007. La raccolta delle Feynman Lectures on Physics, il cosiddetto Libro Rosso della fisica, già edita in Italia da Masson. Incredibile a dirsi, esiste in commercio anche la registrazione su CD del sonoro originale delle lezioni per poterle ascoltare dalla voce di Feynman.

Per i più volenterosi segnaliamo: R. Feynman, A. Hibbs, Quantum Mechanics and Path Integrals, Mc Graw-Hill, New York, 1965: uno dei testi cardine della letteratura scientifica, solo per addetti ai lavori. www.caltech.edu È il sito del California Institute of Technology, l’università dove Feynman ha insegnato per decenni; la sua cattedra è attualmente ricoperta da Kip Thorne. Questo sito è ricchissimo di materiale su Feynman, e comprende anche una ricca sezione fotografica e le sue pubblicazioni scientifiche. www.feynman.com e www.richard-feynman.net Sono i

siti (quasi) ufficiali su Feynman creati da appassionati cultori del personaggio. Rappresentano la partenza ideale per ulteriori ricerche su Feynman, grazie anche al web ring a lui dedicato.

Introduzione di Feynman

Queste sono le lezioni di fisica che ho tenuto negli ultimi due anni agli studenti del secondo corso e alle matricole del Caltech (California Institute of Technology). Le lezioni naturalmente non sono ripetute parola per parola – sono state pubblicate, talvolta ampliando talvolta riassumendo l’argomento. Le lezioni formano soltanto una parte del corso completo. L’intero gruppo di 180 studenti si riuniva in una grande aula due volte la settimana per ascoltare queste lezioni, e poi si divideva in piccoli gruppi di 15 o 20 studenti nelle sezioni per le ripetizioni sotto la guida di un assistente. In più vi era una sessione di laboratorio una volta alla settimana. Lo scopo particolare che cercavamo di raggiungere con queste lezioni era di conservare l’interesse degli studenti più entusiasti e più svegli provenienti dalle scuole superiori e ammessi al Caltech. Essi hanno appreso quanto sia interessante ed eccitante la fisica – la teoria della relatività, la meccanica quantistica e altre idee moderne. Al termine dei due anni dei nostri precedenti corsi parecchi studenti si sentivano scoraggiati perché venivano loro presentate ben poche idee affascinanti. Essi dovevano studiare piani inclinati, elettrostatica e così via, e dopo due anni questo era proprio avvilente. Il problema era se si potesse o no fare un corso che salvasse lo studente più bravo e più interessato mantenendo il suo entusiasmo. Le presenti lezioni non intendono essere in alcun modo una rassegna, ma sono molto serie. Pensai di indirizzarle al migliore della classe e di fare in modo, se possibile, che persino lo studente più intelligente fosse incapace di comprendere completamente tutto il contenuto delle lezioni – suggerendo di applicare idee e concetti in varie direzioni estranee alla linea maestra di applicazione. Per questa ragione comunque ho cercato costantemente di rendere tutta l’esposizione la più esatta possibile, per mettere in rilievo ogni caso in cui equazioni e idee si adattavano al campo della fisica, e come – quando si fosse andati più a fondo – sarebbero state modificate le cose. Pensavo anche che per

questi studenti era importante indicare che cosa essi – se sufficientemente intelligenti – avrebbero dovuto essere in grado di dedurre da quanto già detto, e che cosa veniva introdotto come componente nuovo. Quando entravano in ballo nuove idee cercavo o di dedurle, se erano deducibili, oppure di spiegare che si trattava di una nuova idea che non aveva alcun rapporto con cose già imparate e che non si poteva dimostrare – ma semplicemente aggiungere. All’inizio di queste lezioni ho supposto che gli studenti conoscessero già dalla scuola superiore cose quali l’ottica geometrica, semplici concetti di chimica e così via. D’altronde non mi è parso che vi fosse una qualsiasi ragione di fare le lezioni con un determinato ordine, nel senso che non avrei potuto far menzione di qualcosa finché non fossi stato pronto a discuterla nei particolari. C’erano da fare cenni a molti argomenti senza una discussione completa. Queste discussioni più complete sarebbero venute in seguito, quando la preparazione fosse stata più avanzata. Esempi ne sono le discussioni sull’induttanza e sui livelli energetici, che vengono dapprima presentati in modo molto qualitativo e sono in seguito sviluppati più completamente. Nello stesso tempo in cui mi indirizzavo allo studente più attivo, volevo anche curarmi dello studente per il quale le impennate e le applicazioni collaterali sono semplicemente causa di disorientamento e dal quale non ci si può affatto aspettare che impari la maggior parte della materia della lezione. Per tale studente ho voluto che vi fosse almeno un nucleo centrale, o spina dorsale della materia, che egli potesse comprendere. Anche se non poteva capire tutto nella lezione avevo la speranza che non se ne sarebbe innervosito. Non mi aspettavo che capisse tutto, ma soltanto i lineamenti centrali e più diretti. Occorre naturalmente una certa intelligenza da parte sua per vedere quali siano i teoremi e le idee fondamentali, e quali siano le questioni secondarie e le applicazioni più avanzate che egli potrà capire soltanto negli anni seguenti.

XII

Introduzione di Feynman

Nel presentare queste lezioni vi era una seria difficoltà. Nel modo in cui il corso veniva fatto, non vi era alcuna reazione degli studenti per indicare, a chi le presentava, se le lezioni venivano bene assimilate. Questa è indubbiamente una difficoltà molto seria, e io non so quanto buone in realtà fossero le lezioni stesse. L’intera cosa fu essenzialmente un esperimento. E se dovessi ripeterlo non lo rifarei allo stesso modo – spero di non doverlo ripetere! Penso tuttavia che l’esperimento si risolse – per quanto concerne la fisica – del tutto soddisfacentemente nel primo anno. Nel secondo anno io non fui altrettanto soddisfatto. Nella prima parte del corso, che tratta dell’elettricità e del magnetismo, non riuscii a trovare alcun modo realmente unico o diverso di presentarla – nessun modo che fosse particolarmente più eccitante del modo solito di presentazione. Così non penso di aver fatto molto nelle lezioni sull’elettricità e il magnetismo. Alla fine del secondo anno avevo pensato originariamente di proseguire, dopo l’elettricità e il magnetismo, facendo alcune lezioni in più sulle proprietà dei materiali, ma principalmente per parlare di cose quali i modi fondamentali, le soluzioni dell’equazione di diffusione, i sistemi vibranti, le funzioni ortogonali, ... sviluppando i primi stadi di quelli che comunemente sono detti «i metodi matematici della fisica». In retrospettiva penso che se dovessi rifare il corso tornerei all’idea originale. Ma poiché non era in progetto che io dovessi ripetere tali lezioni, fu suggerito che poteva essere una buona idea cercare di dare un’introduzione alla meccanica quantistica – cosa che il lettore troverà nel terzo volume. È perfettamente chiaro che gli studenti che vogliono specializzarsi in fisica possono attendere fino al terzo anno per la meccanica quantistica. D’altra parte si arguiva che parecchi degli studenti del corso studiano fisica come fondamento ai loro interessi primari in altri campi. E il modo solito di trattare la meccanica quantistica rende tale soggetto quasi inaccessibile per la grande maggioranza degli studenti, perché essi devono spendere tanto tempo per impararla. Eppure nelle sue applicazioni effettive – specialmente in quelle più complesse di ingegneria elettrotecnica e di chimica – l’intero meccanismo della trattazione mediante le equazioni differenziali non è in realtà usato. Così ho cercato di descrivere i princìpi della meccanica quantistica in un modo che non richiedesse che uno già conoscesse la matematica delle equazioni differenziali a derivate parziali. Anche per un fisico penso che sia una cosa interessante il presentare la meccanica quantistica così a rovescio – per diverse ragioni che risulteranno chiare dalle lezioni stesse. Tuttavia penso che l’esperimento, per quanto riguarda la meccanica quantistica, non sia stato un completo successo – in gran parte per il fatto che in realtà non ho avuto tempo sufficiente verso la fine (avrei dovuto avere, per esempio, tre o quattro lezioni in più per trattare con maggior completezza argomenti quali le bande di energia e la dipendenza spaziale delle ampiezze). Inoltre, non avevo mai presentato prima l’argomento in questo modo, per cui la mancanza di una risposta era partico-

© 978-8808-22107-0

larmente grave. Credo ora che la meccanica quantistica debba essere presentata in un tempo successivo. Può darsi che un giorno abbia la possibilità di rifarla. Allora la farò bene. La mancanza di lezioni sul come risolvere i problemi dipende dal fatto che vi erano sezioni preposte a tale compito. Benché abbia svolto tre lezioni del primo anno su come risolvere i problemi, esse non sono incluse qui. Vi era anche una lezione sulla guida inerziale, che era certamente appropriata dopo la lezione sui sistemi rotanti, ma che è stata sfortunatamente omessa. La quinta e la sesta lezione sono in realtà dovute a Matthew Sands, essendo io fuori città. Il problema, naturalmente, è quanto bene sia riuscito questo esperimento. Il mio punto di vista – che però non sembra essere condiviso dalla maggior parte delle persone che hanno lavorato con gli studenti – è pessimista. lo non penso di aver fatto molto bene nei riguardi degli studenti. Se osservo come la maggioranza di loro ha affrontato i problemi agli esami, penso che il sistema abbia fallito. Naturalmente i miei amici mi sottolineano che vi erano una o due dozzine di studenti che – sorprendentemente – capirono quasi tutto in tutte le lezioni e che furono attivissimi nel lavorare col materiale e nell’affrontare parecchi punti con entusiasmo e interesse. Queste persone hanno ora, io credo, una preparazione di base di prima classe in fisica e sono, dopo tutto, quelli ai quali avevo cercato di indirizzarmi. Ma allora, «Il potere dell’insegnamento è raramente di molta efficacia tranne che in quelle felici situazioni dove è quasi superfluo» (Gibbons). Pure, non volevo lasciare indietro completamente alcuno studente come forse ho fatto. Penso che un modo di aiutare di più gli studenti sarebbe di dedicare un lavoro più intenso allo sviluppo di un insieme di problemi atti a illustrare alcune delle idee delle lezioni. I problemi offrono una buona opportunità di allargare la materia delle lezioni e di rendere più realistiche, più complete e più salde nella mente le idee che sono state esposte. Penso, tuttavia, che non esista alcuna soluzione a questo problema dell’istruzione oltre a quella di rendersi conto che il miglior insegnamento può essere realizzato soltanto quando vi sia un rapporto individuale e diretto fra uno studente e un buon insegnante – una situazione in cui lo studente discute le idee, riflette sulle cose, conversa sulle cose. È impossibile imparare molto, presenziando semplicemente a una lezione, o anche risolvendo semplicemente i problemi che vengono assegnati. Ma nei nostri tempi dobbiamo insegnare a un così gran numero di studenti che dobbiamo cercare di trovare un qualche surrogato della situazione ideale. Forse le mie lezioni possono dare un certo contributo. Forse in qualche piccolo posto dove vi siano docenti singoli per i singoli studenti, essi possono avere qualche ispirazione o qualche idea dalle lezioni. Forse essi si divertiranno meditandole – o proseguendo nello sviluppo di qualche idea.

RICHARD P. FEYNMAN Giugno 1963

Indice

1

Atomi in moto 1.1 1.2 1.3 1.4

2

Fondamenti della fisica 2.1 2.2 2.3 2.4

3

1 2 5 7 11 11 13 16 18 22

Introduzione La chimica La biologia L’astronomia La geologia La psicologia Come mai è andata così?

22 22 23 27 29 29 30

Conservazione dell’energia

32

4.1 4.2 4.3 4.4

5

Introduzione La fisica prima del 1920 Fisica quantistica Nuclei e particelle

Le relazioni della fisica con le altre scienze 3.1 3.2 3.3 3.4 3.5 3.6 3.7

4

Introduzione La materia è composta di atomi Processi atomici Reazioni chimiche

1

Che cos’è l’energia? Energia potenziale gravitazionale Energia cinetica Altre forme di energia

Tempo e distanza 5.1 5.2 5.3 5.4 5.5 5.6 5.7

Il moto Il tempo Piccoli intervalli tempo Intervalli lunghi di tempo Unità e campioni di tempo Grandi distanze Piccole distanze

32 33 37 37 41 41 41 42 44 45 46 48

XIV

Indice

6

© 978-8808-22107-0

Probabilità 6.1 6.2 6.3 6.4 6.5

7

La teoria della gravitazione 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8

8

Moti planetari Le leggi di Keplero Sviluppo della dinamica Legge della gravitazione di Newton Gravitazione universale L’esperimento di Cavendish Che cos’è la gravità? Gravità e relatività

Il moto 8.1 8.2 8.3 8.4 8.5

9

Caso e probabilità Fluttuazioni Moto casuale Una distribuzione di probabilità Il principio di indeterminazione

Descrizione del moto Velocità Velocità come derivata Distanza come integrale Accelerazione

Le leggi della dinamica di Newton 9.1 9.2 9.3 9.4 9.5 9.6 9.7

Quantità di moto e forza Velocità e velocità vettoriale Componenti di velocità, accelerazione e forza Che cos’è la forza? Significato delle equazioni dinamiche Soluzione numerica delle equazioni Moti planetari

10 Conservazione della quantità di moto 10.1 10.2 10.3 10.4 10.5

La terza legge di Newton Conservazione della quantità di moto La quantità di moto si conserva! Quantità di moto ed energia Quantità di moto relativistica

11 Vettori 11.1 11.2 11.3 11.4 11.5 11.6 11.7

La simmetria in fisica Traslazioni Rotazioni Vettori Algebra vettoriale Le leggi di Newton nella notazione vettoriale Prodotto scalare di vettori

51 51 53 55 57 60 62 62 63 63 64 66 70 70 72 74 74 76 79 80 81 85 85 86 87 88 89 90 91 96 96 97 100 103 104 106 106 107 108 110 112 114 115

Indice

© 978-8808-22107-0

12 Caratteristiche della forza

118

Che cos’è una forza? Attrito Forze molecolari Forze fondamentali. I campi Forze apparenti Forze nucleari

118 120 123 124 128 130

12.1 12.2 12.3 12.4 12.5 12.6

13 Lavoro ed energia potenziale (1) 13.1 13.2 13.3 13.4

Energia di un corpo che cade Lavoro fatto dalla gravità Additività dell’energia Campo gravitazionale di oggetti grandi

131 131 134 137 138

14 Lavoro ed energia potenziale (2)

141

Lavoro Moto vincolato Forze conservative Forze non conservative Potenziali e campi

141 143 143 146 148

15 La teoria speciale della relatività

152

14.1 14.2 14.3 14.4 14.5

15.1 15.2 15.3 15.4 15.5 15.6 15.7 15.8 15.9

Il principio di relatività La trasformazione di Lorentz L’esperimento di Michelson-Morley Trasformazioni di tempo La contrazione di Lorentz Simultaneità Quadrivettori Dinamica relativistica Equivalenza di massa ed energia

16 Energia e quantità di moto relativistiche 16.1 16.2 16.3 16.4 16.5

La relatività e i filosofi Il paradosso dei gemelli Trasformazione delle velocità Massa relativistica Energia relativistica

17 Spazio-tempo 17.1 17.2 17.3 17.4 17.5

La geometria dello spazio-tempo Intervalli nello spazio-tempo Passato, presente e futuro Ancora sui quadrivettori Algebra dei quadrivettori

152 154 155 157 159 160 161 161 163 165 165 167 168 170 173 176 176 178 179 180 183

XV

XVI

Indice

© 978-8808-22107-0

18 Rotazione in due dimensioni 18.1 18.2 18.3 18.4

Il centro di massa Rotazione di un corpo rigido Momento della quantità di moto Conservazione del momento della quantità di moto

19 Centro di massa e momento di inerzia 19.1 19.2 19.3 19.4

Proprietà del centro di massa Localizzazione del centro di massa Ricerca del momento di inerzia Energia cinetica di rotazione

20 Rotazione nello spazio 20.1 20.2 20.3 20.4

Momenti in tre dimensioni Le equazioni della rotazione usando prodotti vettoriali Il giroscopio Momento della quantità di moto di un corpo solido

21 L’oscillatore armonico 21.1 21.2 21.3 21.4 21.5

Equazioni differenziali lineari L’oscillatore armonico Moto armonico e moto circolare Condizioni iniziali Oscillazioni forzate

22 Algebra 22.1 22.2 22.3 22.4 22.5 22.6

Addizione e moltiplicazione Le operazioni inverse Astrazione e generalizzazione Approssimazione dei numeri irrazionali Numeri complessi Esponenti immaginari

23 Risonanza 23.1 23.2 23.3 23.4

Numeri complessi e moto armonico Oscillatore forzato con smorzamento Risonanza elettrica La risonanza in natura

24 Transitori 24.1 L’energia di un oscillatore 24.2 Oscillazioni smorzate 24.3 Transitori elettrici

185 185 187 189 191 193 193 196 197 200 203 203 207 208 211 212 212 213 215 216 218 219 219 220 221 222 226 228 230 230 232 235 237 242 242 244 246

Indice

© 978-8808-22107-0

25 Sistemi lineari 25.1 25.2 25.3 25.4 25.5

Equazioni differenziali lineari Sovrapposizione di soluzioni Oscillazioni nei sistemi lineari Le analogie in fisica Impedenze in serie e in parallelo

26 Ottica: il principio del tempo minimo 26.1 26.2 26.3 26.4 26.5 26.6

La luce Riflessione e rifrazione Il principio di Fermat del tempo minimo Applicazioni del principio di Fermat Un enunciato più preciso del principio di Fermat Come funziona

27 Ottica geometrica 27.1 27.2 27.3 27.4 27.5 27.6 27.7

Introduzione Distanza focale di una superficie sferica La distanza focale di una lente Ingrandimento Lenti composte Aberrazioni Potere risolutivo

249 249 251 253 255 257 259 259 260 261 263 266 267 268 268 269 271 273 274 275 276

28 Radiazione elettromagnetica

278

Elettromagnetismo Radiazione Il radiatore a dipolo Interferenza

278 281 282 283

28.1 28.2 28.3 28.4

29 Interferenza 29.1 29.2 29.3 29.4 29.5

Onde elettromagnetiche Energia della radiazione Onde sinusoidali Due radiatori a dipolo La matematica dell’interferenza

30 Diffrazione 30.1 30.2 30.3 30.4 30.5 30.6 30.7

L’ampiezza risultante dovuta a n oscillatori uguali Il reticolo di diffrazione Potere risolutivo di un reticolo L’antenna parabolica Pellicole colorate e cristalli Diffrazione di schermi opachi Il campo di un piano di cariche oscillanti

285 285 286 287 288 290 294 294 297 300 301 302 303 304

XVII

XVIII

Indice

© 978-8808-22107-0

31 L’origine dell’indice di rifrazione 31.1 31.2 31.3 31.4 31.5 31.6

L’indice di rifrazione Il campo dovuto al mezzo Dispersione Assorbimento L’energia trasportata da un’onda elettrica Diffrazione della luce da uno schermo

32 Smorzamento per radiazione e diffusione della luce 32.1 32.2 32.3 32.4 32.5

Resistenza di radiazione La rapidità di radiazione dell’energia Smorzamento dovuto alla radiazione Sorgenti indipendenti Diffusione della luce

33 Polarizzazione 33.1 33.2 33.3 33.4 33.5 33.6 33.7

Il vettore elettrico della luce Polarizzazione della luce diffusa Birifrangenza Polarizzatori Attività ottica L’intensità della luce riflessa Rifrazione anomala

34 Effetti relativistici nella radiazione 34.1 34.2 34.3 34.4 34.5 34.6 34.7 34.8 34.9

Sorgenti in movimento Scoperta del moto «apparente» Radiazione di sincrotrone Radiazione cosmica di sincrotrone Radiazione di frenamento L’effetto Doppler Il quadrivettore Ʒ, k Aberrazione La quantità di moto della luce

35 Visione del colore 35.1 35.2 35.3 35.4 35.5 35.6

L’occhio umano Il colore dipende dall’intensità Misura della sensazione del colore Il diagramma cromatico Il meccanismo della visione del colore Fisiochimica della visione del colore

36 Meccanismo della visione 36.1 36.2 36.3 36.4

La sensazione del colore La fisiologia dell’occhio I bastoncelli L’occhio composto (degli insetti)

308 308 311 313 316 317 318 320 320 321 323 324 326 330 330 332 332 334 335 336 338 341 341 342 344 346 347 348 350 352 352 355 355 356 358 361 362 364 367 367 369 372 373

Indice

© 978-8808-22107-0

36.5 Altri occhi 36.6 Neurologia della visione

375 376

37 Comportamento quantistico

381

37.1 37.2 37.3 37.4 37.5 37.6 37.7 37.8

Meccanica atomica Un esperimento eseguito con pallottole Un esperimento eseguito con onde Un esperimento eseguito con elettroni L’interferenza delle onde di elettroni Osservazione degli elettroni Primi princìpi della meccanica quantistica Il principio di indeterminazione

38 Relazione fra i punti di vista ondulatorio e corpuscolare 38.1 38.2 38.3 38.4 38.5 38.6

Ampiezze dell’onda di probabilità Misura della posizione e della quantità di moto Diffrazione nei cristalli Le dimensioni dell’atomo Livelli energetici Implicazioni filosofiche

39 La teoria cinetica dei gas 39.1 39.2 39.3 39.4 39.5

Proprietà della materia La pressione di un gas Compressibilità della radiazione Temperatura ed energia cinetica La legge dei gas ideali

381 382 383 385 386 387 390 392 394 394 395 398 399 401 402 405 405 406 410 411 414

40 I princìpi della meccanica statistica

417

L’atmosfera esponenziale La legge di Boltzmann Evaporazione di un liquido La distribuzione delle velocità molecolari I calori specifici dei gas Il fallimento della fisica classica

417 418 419 421 424 425

40.1 40.2 40.3 40.4 40.5 40.6

41 Il moto browniano 41.1 41.2 41.3 41.4

Equipartizione dell’energia Equilibrio termico della radiazione L’equipartizione e l’oscillatore quantistico Il cammino casuale

42 Applicazioni della teoria cinetica 42.1 42.2 42.3 42.4 42.5

Evaporazione Emissione termoionica Ionizzazione termica Cinetica chimica Le leggi della radiazione di Einstein

428 428 431 434 436 440 440 443 444 446 448

XIX

XX

Indice

© 978-8808-22107-0

43 La diffusione 43.1 43.2 43.3 43.4 43.5 43.6

Collisioni tra molecole Il cammino libero medio La velocità di trascinamento Conduttività ionica Diffusione molecolare Conducibilità termica

44 Le leggi della termodinamica

451 451 453 455 457 458 460 462

Macchine termiche: la prima legge La seconda legge Macchine reversibili Il rendimento di una macchina ideale La temperatura termodinamica Entropia

462 464 465 469 471 472

45 Chiarimenti sulla termodinamica

477

44.1 44.2 44.3 44.4 44.5 44.6

45.1 Energia interna 45.2 Applicazioni 45.3 L’equazione di Clausius-Clapeyron

46 Ruota dentata e dente d’arresto 46.1 46.2 46.3 46.4 46.5

Come funziona una ruota dentata La ruota dentata come macchina Reversibilità in meccanica Irreversibilità Ordine ed entropia

47 Il suono e l’equazione dell’onda 47.1 47.2 47.3 47.4 47.5

Le onde La propagazione del suono L’equazione dell’onda Soluzioni dell’equazione dell’onda La velocità del suono

48 Battimenti 48.1 48.2 48.3 48.4 48.5 48.6 48.7

Somma di due onde Note di battimento e modulazione Bande laterali Treni d’onde localizzati Ampiezze di probabilità per le particelle Onde in tre dimensioni Modi di vibrazione normali

49 Modi di vibrazione 49.1 La riflessione delle onde 49.2 Onde limitate, con frequenze naturali

477 480 482 487 487 488 491 492 493 496 496 498 499 501 503 505 505 507 508 510 512 514 515 517 517 518

Indice

49.3 Modi di vibrazione in due dimensioni 49.4 Pendoli accoppiati 49.5 Sistemi lineari

50 Armoniche 50.1 50.2 50.3 50.4 50.5 50.6

Toni musicali La serie di Fourier Qualità e assonanza I coefficienti di Fourier Il teorema dell’energia Risposte non lineari

51 Le onde 51.1 51.2 51.3 51.4

Onde di prua Onde d’urto Onde nei solidi Onde superficiali

52 La simmetria nelle leggi fisiche 52.1 52.2 52.3 52.4 52.5 52.6 52.7 52.8 52.9

Operazioni di simmetria Simmetria nello spazio e nel tempo Simmetria e leggi di conservazione Riflessioni speculari Vettori polari e assiali Qual è la destra? La parità non si conserva! Antimateria Simmetrie rotte

Indice analitico

520 523 524 526 526 527 528 530 533 533 537 537 538 540 543 547 547 547 550 550 552 554 555 556 558 559

Le risorse multimediali All’indirizzo online università zanichelli / feynman

sono disponibili i link per consultare il testo originale in lingua inglese messo a disposizione dal California Institute of Technology. Inoltre, chi acquista il libro può scaricare gratuitamente l’ebook, seguendo le istruzioni presenti nel sito sopra indicato. L’ebook si legge con l’applicazione Booktab, che si scarica gratis da AppStore (sistemi operativi Apple) o da Google Play (sistemi operativi Android). Per accedere alle risorse protette è necessario registrarsi su myzanichelli inserendo la chiave di attivazione personale contenuta nel libro.

XXI

Atomi in moto

1.1

Introduzione

Questo corso biennale di fisica viene presentato partendo dal punto di vista che il lettore intenda diventare un fisico. Ciò, naturalmente, non si verifica necessariamente, ma è quanto ogni professore, di qualsiasi materia, presume! Se il lettore diverrà un fisico, avrà molto da studiare: duecento anni del campo di conoscenza più rapidamente sviluppatosi che esista, tanta conoscenza che in effetti il lettore penserà di non poter apprendere tutta in quattro anni, e in realtà non lo potrà; dovrà seguire anche dei corsi di specializzazione! Abbastanza sorprendentemente, malgrado la spaventosa massa di lavoro compiuto durante tutto questo tempo, è possibile condensare in gran parte l’enorme quantità dei risultati – cioè trovare leggi che riassumono l’intera nostra conoscenza. Ma, anche così, le leggi sono tanto difficili da recepire, che sarebbe sleale nei confronti del lettore iniziare l’indagine di questo arduo argomento senza qualche idea dei rapporti che legano tra loro i vari campi della scienza. Sulla base di queste osservazioni preliminari, i primi tre capitoli tracceranno, dunque, le relazioni tra la fisica e le altre scienze, i rapporti tra una scienza e l’altra e il significato di scienza, in modo da aiutarci a sviluppare una «percezione» dell’argomento. Potreste chiedervi perché mai non possiamo insegnare la fisica dando semplicemente le leggi fondamentali a pagina uno e mostrando poi come funzionano in tutte le possibili circostanze, come facciamo con la geometria euclidea, dove prima stabiliamo gli assiomi e poi ne traiamo ogni genere di deduzioni. (Quindi, non soddisfatti di apprendere la fisica in quattro anni, volete impararla in quattro minuti?) Non possiamo far questo per due ragioni. Primo, non conosciamo ancora tutte le leggi fondamentali: vi è una frontiera di ignoranza che va espandendosi. Secondo, la corretta esposizione delle leggi della fisica implica alcune idee poco familiari, che richiedono cognizioni di alta matematica per la loro descrizione. Quindi è necessaria una considerevole quantità di istruzione preliminare anche solo per imparare cosa significano le parole. No, non è possibile procedere in questo modo. Possiamo procedere soltanto punto per punto. Ciascun punto o parte dell’insieme della natura è sempre solo un’approssimazione all’intera verità, ossia a quella che, per quanto ne sappiamo, è l’intera verità. Infatti, tutto ciò che conosciamo è solo un qualche genere di approssimazione, perché sappiamo di non conoscere ancora tutte le leggi. Quindi le cose devono essere apprese solo per essere nuovamente disimparate, oppure, cosa più probabile, per essere corrette. Il principio della scienza, quasi la sua definizione, è il seguente: La prova di tutta la conoscenza è l’esperimento. L’esperimento è il solo giudice della «verità» scientifica. Ma qual è la sorgente della conoscenza? Da dove vengono le leggi che devono essere provate? L’esperienza stessa aiuta a produrre tali leggi, nel senso che ci fornisce dei suggerimenti. Ma è pure necessaria l’immaginazione per creare da questi suggerimenti le grandi generalizzazioni, cioè per indovinare i meravigliosi, semplici, ma molto strani schemi che vi stanno sotto, e poi sperimentare al fine di verificare nuovamente se abbiamo indovinato gli schemi giusti. Questo processo immaginativo è talmente difficile che nella fisica si attua una divisione del lavoro: vi sono i fisici teorici, che immaginano, deducono e cercano di intuire nuove leggi ma non fanno esperimenti, e i fisici sperimentali, che fanno esperimenti, immaginano, deducono e cercano di indovinare.

1

2

Capitolo 1 • Atomi in moto

© 978-8808-22107-0

Abbiamo detto che le leggi della natura sono approssimate: che dapprima scopriamo quelle «sbagliate» e poi quelle «giuste». Ora, in che modo può un’esperienza risultare «sbagliata»? Innanzi tutto, in modo assai banale: per esempio, se vi è qualcosa di sbagliato che non avete notato nell’apparecchiatura. Ma cose di questo genere possono essere facilmente localizzate e verificate ripetutamente. Dunque, senza badare a queste cose di minor conto, come possono i risultati di un’esperienza essere sbagliati? Solo se sono poco precisi. Per esempio, la massa di un oggetto non sembra cambiare mai: una trottola in moto ha lo stesso peso di una ferma. Così fu inventata una «legge»: la massa è costante e non dipende dalla velocità. Ora si è scoperto che quella «legge» è inesatta. Si è scoperto che la massa aumenta col crescere della velocità, ma aumenti sensibili richiedono velocità vicine a quella della luce. Una legge corretta è: se un oggetto si muove con una velocità inferiore a cento miglia al secondo, la massa è costante entro una parte su un milione. In questa forma approssimata la legge è valida. Così, in pratica, si può pensare che la nuova legge non comporti una differenza significativa. Bene, sì e no. Per velocità normali possiamo certamente dimenticarla e usare la semplice legge della massa costante come una buona approssimazione. Ma, in caso di alte velocità, siamo in errore e, più alta è la velocità, maggiore è l’errore. Infine, cosa più interessante, con la legge approssimata siamo completamente in errore dal punto di vista filosofico. Anche se la massa cambia soltanto di pochissimo, l’intera nostra rappresentazione del mondo deve essere modificata. Questo è un fatto caratteristico relativo alla filosofia, ossia alle idee che stanno dietro alle leggi. Anche un effetto molto piccolo richiede talvolta profondi cambiamenti nei nostri concetti. Ora, che cosa dovremmo insegnare per prima cosa? Dovremmo forse insegnare la legge corretta ma poco familiare, con le sue strane e difficili idee concettuali, per esempio la teoria della relatività, lo spazio-tempo a quattro dimensioni e così via? O dovremmo prima insegnare la semplice legge della «massa costante» che è solo approssimativa ma non implica idee così difficili? La prima è più eccitante, più straordinaria e più divertente, ma la seconda è più semplice da afferrare all’inizio, ed è un primo passo verso una comprensione reale dell’altra idea. Questo dilemma si ripresenta continuamente nell’insegnamento della fisica. In tempi diversi lo risolveremo in modi diversi, però a ogni stadio vale la pena di imparare quello che è noto al momento, quale sia il grado della sua precisione, come si inserisca nel resto e come lo si possa cambiare quando ne sapremo di più. Procediamo ora con lo schema, o quadro generale, della nostra comprensione della scienza al giorno d’oggi (della fisica in particolare, ma anche di altre scienze contigue), di modo che, quando più avanti ci concentreremo su qualche punto specifico, avremo una certa idea dello sfondo, del perché quel particolare punto sia interessante, e come esso si inserisca in una struttura più ampia. Dunque, qual è la nostra visione globale del mondo?

1.2

La materia è composta di atomi

Se per effetto di un qualche cataclisma l’intera conoscenza scientifica dovesse andare distrutta e un’unica frase venisse tramandata alle successive generazioni di esseri viventi, quale affermazione conterrebbe l’informazione più ampia nel minor numero di parole? Io credo che sia l’ipotesi atomica (o teoria atomica, o comunque la si voglia chiamare), secondo cui tutte le cose sono formate di atomi, piccole particelle che girano in moto perpetuo attraendosi l’un l’altra quando si trovano a breve distanza, ma che si respingono quando vengono pressate l’una contro l’altra. In quest’unica affermazione, come vedrete, è contenuta un’enorme quantità d’informazione sul mondo, se la si considera con un minimo d’immaginazione e la si medita appena un po’. Per illustrare la potenza dell’idea atomica, supponiamo di avere una goccia d’acqua delle dimensioni di un quarto di pollice. Anche se la osserviamo molto attentamente, non vediamo altro che acqua: acqua omogenea, continua. Pure ingrandendola con il miglior microscopio ottico che si possa trovare – all’incirca un ingrandimento di duemila volte – allora la goccia d’acqua sarebbe approssimativamente quaranta piedi da un estremo all’altro, cioè sarebbe grande circa quanto una stanza spaziosa, e se la osservassimo piuttosto accuratamente, vedremmo ancora

© 978-8808-22107-0

1.2 • La materia è composta di atomi

l’acqua relativamente omogenea – ma vedremmo qua e là piccole cose a forma di pallone che nuotano avanti e indietro. Molto interessante. Sono i parameci. A questo punto potreste fermarvi e lasciarvi incuriosire dai parameci, con le loro ciglia vibratili e i corpi che si contorcono, così da non andare oltre, tranne forse che per ingrandire ancora di più i parameci e osservarli internamente. Questo, naturalmente, è un argomento che riguarda la biologia, ma al momento lo sorvoliamo e guardiamo ancora più attentamente l’acqua in se stessa, ingrandendola altre duemila volte. Ora la goccia d’acqua si estende per circa quindici miglia da un estremo all’altro e, se la osserviamo molto attentamente, notiamo una specie di brulichio, qualcosa che non ha più un’apparenza omogenea e ha, invece, FIGURA 1.1 Acqua ingrandita un miliardo di volte. l’aspetto di una folla presente a una partita di calcio vista da molto lontano. Per vedere a cosa sia dovuto questo brulichio, lo ingrandiremo altre duecentocinquanta volte e avremo davanti agli occhi qualcosa di simile a ciò che è mostrato nella FIGURA 1.1. È una rappresentazione dell’acqua ingrandita un miliardo di volte, ma idealizzata sotto diversi aspetti. In primo luogo, le particelle sono disegnate in maniera semplice, con bordi netti, il che è inesatto. In secondo luogo, per semplicità esse sono abbozzate quasi schematicamente in una sistemazione bidimensionale, mentre naturalmente esse si muovono secondo tre dimensioni. Notate che esistono due specie di «bolle» o circoli per rappresentare gli atomi di ossigeno (neri) e di idrogeno (grigi), e che ogni ossigeno ha due idrogeni legati a sé. (Ogni gruppetto formato da un ossigeno con i suoi due idrogeni è chiamato molecola.) La rappresentazione è ulteriormente idealizzata in quanto le vere particelle in natura si agitano e rimbalzano continuamente, girandosi e torcendosi l’una intorno all’altra. Dovete quindi immaginarvi questa come una rappresentazione dinamica piuttosto che statica. Un’altra cosa che non può essere illustrata in un disegno è il fatto che le particelle sono «appiccicate insieme», che si attraggono l’un l’altra, che questa è tirata da quella ecc. L’intero gruppo è «incollato insieme», per così dire. D’altra parte, le particelle non possono compenetrarsi tra loro. Se tentate di comprimerne due, l’una troppo aderente all’altra, esse si respingono. Gli atomi hanno un raggio di 1 o 2 · 10 8 cm. Alla lunghezza di 10 8 cm si dà anche il nome angstrom (Å), quindi possiamo dire che gli atomi hanno un raggio di 1 o 2 Å. Un’altra maniera per ricordarne la misura è la seguente: se una mela è ingrandita fino ad avere le dimensioni della Terra, gli atomi della mela avranno circa le dimensioni iniziali della mela. Immaginiamo ora questa grande goccia d’acqua con tutte queste particelle che si agitano insieme e si rincorrono l’un l’altra. L’acqua conserva il suo volume; non si separa, a causa dell’attrazione delle molecole fra di loro. Se la goccia è su un piano inclinato, dove può muoversi da un punto all’altro, l’acqua scorrerà, ma non scomparirà affatto – le parti non si scinderanno – a causa dell’attrazione molecolare. Ora il movimento di agitazione è ciò che noi rappresentiamo come calore: quando aumentiamo la temperatura aumentiamo il moto. Se riscaldiamo l’acqua, l’agitazione aumenta, e aumenta il volume fra gli atomi, e se il riscaldamento continua, arriva il momento in cui la forza di attrazione tra le molecole non è sufficiente a tenerle insieme ed esse si allontanano separandosi l’una dall’altra. Naturalmente questo è il modo con cui produciamo il vapore ricavandolo dall’acqua: aumentando la temperatura; le particelle si scindono e volano via a causa del moto accresciuto. Nella FIGURA 1.2 è mostrata una rappresentazione del vapore. Questa rappresentazione del vapore, in un certo senso, è sbagliata: alla normale pressione atmosferica in un’intera stanza possono esservi solo poche molecole, e certo non ve ne sarebbero tre in questa figura. La maggior parte dei riquadri di queste dimensioni non ne conterrebbe nessuna – ma accidentalmente qui ne abbiamo due e mezzo o tre (tanto per non lasciare la figura completamente vuota). Ora nel caso del vapore, noi vediamo le caratteristiche molecole più chiaramente che nel caso dell’acqua. Per semplicità, le molecole sono disegnate in modo che vi sia un angolo di 120° fra gli atomi di idrogeno. In realtà l’angolo misura 105°30, e la distanza fra il centro di un idrogeno e il centro dell’ossigeno è di 0,957 Å, quindi conosciamo molto bene questa molecola. FIGURA 1.2 Vapore ingrandito un miliardo di volte.

3

4

Capitolo 1 • Atomi in moto

© 978-8808-22107-0

Vediamo quali sono alcune delle proprietà del vapore acqueo o di qualunque altro gas. Le molecole, essendo separate l’una dall’altra, rimbalzano contro le pareti. Immaginate una stanza contenente un certo numero di palle da tennis (più o meno un centinaio) che rimbalzano intorno in continuo movimento. Quando esse bombardano la parete, tale bombardamento allontana la parete. (Che noi dovremo naturalmente respingere indietro.) Ciò significa che il gas esercita una forza intermittente che i nostri sensi grossolani (non essendo noi ingranditi un miliardo di volte) avvertono solo come spinta media. Se vogliamo confinare un gas dobbiamo applicare una pressione. La FIGURA 1.3 mostra un recipiente tipo per contenere i gas (usato in tutti i libri di testo), vale a dire un cilindro all’interno del quale è posto un pistone. Ora, non ha importanza alcuna quali siano le forme delle molecole d’acqua, così, per semplicità, le disegneremo come palle da tennis o puntini. Tali oggetti sono in continuo movimento in tutte le direzioni. Tante molecole vanno a colpire continuamente il pistone e, per impedire che esso venga progressivamente spinto fuori dal cilindro (colpito da questo continuo picchiettare), dovremo spingerlo giù con una certa forza, che chiamiamo pressione (in realtà, la forza è data dal prodotto della pressione per l’area). Chiaramente la forza è proporzionale all’area, perché se aumentiamo l’area ma manteniamo uguale il numero delle molecole per centimetro cubo, aumentiamo il numero di collisioni con il pistone nelle stesse proporzioni in cui è stata aumentata l’area. Mettiamo ora in questo recipiente il doppio di molecole, in modo da raddoppiare la densità e lasciarle alla stessa velocità, cioè alla stessa temperatura. Con una buona approssimazione il FIGURA 1.3 Gas numero delle collisioni verrà raddoppiato e, poiché ciascuna sarà tanto «energica» quanto quelle in un cilindro munito di prima, la pressione sarà proporzionale alla densità. Se consideriamo la vera natura delle forze di pistone. tra gli atomi, ci aspetteremmo una leggera diminuzione di pressione a causa delle attrazioni tra gli atomi e un leggero aumento per il volume limitato che essi occupano. Nondimeno, con un’ottima approssimazione, se la densità è sufficientemente bassa cosicché non vi siano molti atomi, la pressione sarà proporzionale alla densità. Possiamo anche vedere qualche altra cosa: se aumentiamo la temperatura senza variare la densità del gas, cioè se aumentiamo la velocità degli atomi, che accadrà alla pressione? Ebbene, gli atomi colpiranno più forte perché si muovono più celermente, e, in aggiunta, essi colpiranno più spesso cosicché la pressione aumenterà. Vedete quanto siano semplici le idee della teoria atomica. Consideriamo un’altra situazione. Supponiamo che il pistone muova verso l’interno, di modo che gli atomi vengano lentamente compressi in uno spazio più ristretto. Che accade quando un atomo colpisce il pistone in movimento? Evidentemente esso guadagna velocità dalla collisione. Potete provarlo facendo per esempio rimbalzare una pallina da ping pong contro una racchetta che muove in avanti: troverete che essa se ne distacca con velocità maggiore di quella con cui l’ha colpita. (Esempio particolare: se per caso un atomo è fermo e il pistone lo colpisce, esso si muoverà sicuramente.) Dunque gli atomi sono «più caldi» quando si allontanano dal pistone di quanto non lo fossero prima di colpirlo. Quindi tutti gli atomi che sono nel recipiente avranno guadagnato velocità. Ciò significa che, quando comprimiamo lentamente un gas, la temperatura del gas aumenta. Dunque, sotto una lenta compressione un gas aumenterà di temperatura, e sotto una lenta espansione raffredderà. Ritorniamo alla nostra goccia d’acqua e vediamo un altro aspetto del suo comportamento. Supponiamo di diminuire la temperatura della goccia d’acqua. Supponiamo che l’agitazione delle molecole e degli atomi nell’acqua sia in continua diminuzione. Sappiamo che tra gli atomi esistono delle forze di attrazione, sicché dopo un po’ essi non saranno capaci di agitarsi altrettanto bene. Ciò che accadrà a temperatura molto bassa è indicato nella FIGURA 1.4: le molecole si bloccheranno in una nuova struttura che è quella del ghiaccio. Questa particolare rappresentazione schematica del ghiaccio non è corretta, perché è soltanto bidimensionale, ma dal punto di vista qualitativo è giusta. Il fatto interessante è che il materiale presenta una posizione definita per ogni atomo, e potete facilmente rendervi conto che se in un qualche modo tenessimo tutti gli atomi a un estremo della goccia secondo un certo ordine, ogni atomo in un determinato posto, allora, esFIGURA 1.4 Ghiaccio ingrandito un miliardo di volte.

© 978-8808-22107-0

1.3 • Processi atomici

sendo rigida la struttura dei collegamenti, l’altro estremo che si trova a distanza di miglia (nella nostra scala ingrandita) occuperà una posizione definita. Così, se teniamo un ago di ghiaccio a un estremo, l’altro estremo resiste a una nostra spinta laterale, a differenza dell’acqua in cui la struttura è spezzata a causa dell’aumento nel moto di agitazione, cosicché gli atomi si muovono tutti in modi diversi. La differenza fra i solidi e i liquidi è dunque che in un solido gli atomi sono disposti secondo qualche tipo di reticolo, chiamato reticolo cristallino e, a grande distanza, non hanno una posizione casuale; la posizione degli atomi in una zona del cristallo è determinata da quella di altri che si trovano a distanza di milioni di atomi in un’altra zona del cristallo. La FIGURA 1.4 è una rappresentazione schematica del ghiaccio e, benché essa mostri diverse caratteristiche proprie del ghiaccio, non è la struttura reale. Una delle caratteristiche esatte è che vi è una parte della simmetria che è esagonale. Potete vedere che, se facciamo ruotare la figura di 60° attorno a un asse, essa ritorna uguale a se stessa: dunque, vi è una simmetria nel ghiaccio che rende conto della struttura a sei lati dei fiocchi di neve. Un’altra cosa che possiamo vedere dalla FIGURA 1.4 è perché il ghiaccio si restringe quando si scioglie. La particolare struttura cristallina del ghiaccio mostrata contiene molti «buchi», come li contiene la reale struttura del ghiaccio. Quando la struttura si decompone, questi buchi possono essere occupati da molecole. La maggior parte delle sostanze semplici, a eccezione dell’acqua e dei metalli, nel liquefarsi si dilata, perché gli atomi sono strettamente stipati nel solido cristallino e sciogliendosi hanno bisogno di più spazio per agitarsi, però una struttura aperta, come nel caso dell’acqua, si contrae. Ora, benché il ghiaccio abbia una forma cristallina «rigida», la sua temperatura può cambiare: il ghiaccio contiene calore. Se vogliamo, possiamo cambiarne la quantità di calore. Cos’è il calore nel caso del ghiaccio? Gli atomi non stanno fermi. Essi si agitano e vibrano. Così, anche se vi è un ordine definito nel cristallo – una struttura definita – tutti gli atomi vibrano «sul posto»; quando aumentiamo la temperatura essi vibrano con ampiezza sempre maggiore, finché a forza di agitarsi si spostano. Noi chiamiamo ciò fusione. Quando abbassiamo la temperatura, la vibrazione diminuisce sempre di più finché, allo zero assoluto, vi è un minimo di vibrazione che gli atomi possono avere, ma non zero. Questo minimo di moto che gli atomi possono avere non è sufficiente per fondere una sostanza, con una sola eccezione: l’elio. L’elio diminuisce semplicemente i moti atomici il più possibile, ma anche allo zero assoluto vi è ancora un moto sufficiente a impedirgli di solidificare. L’elio, anche allo zero assoluto, non gela, a meno che la pressione sia resa così forte da schiacciare gli atomi gli uni contro gli altri. Se aumentiamo la pressione possiamo farlo solidificare.

1.3

Processi atomici

Questo per quanto riguarda la descrizione di solidi, liquidi e gas dal punto di vista atomico. Comunque l’ipotesi atomica descrive anche dei processi, e quindi ci soffermeremo a esaminare un certo numero di processi da un punto di vista atomico. Il primo processo che esamineremo è associato alla superficie dell’acqua. Che accade alla superficie dell’acqua? Renderemo ora la rappresentazione più complicata – e più realistica – immaginando che la superficie si trovi a contatto con l’aria. La FIGURA 1.5 mostra la superficie dell’acqua a contatto con l’aria. Come prima, vediamo le molecole dell’acqua formanti una massa di acqua liquida, ma ora vediamo anche la superficie dell’acqua. Al disopra della superficie troviamo un certo numero di cose: prima di tutto vi sono delle molecole d’acqua come nel vapore. Questo è il vapore acqueo, che si trova sempre al disopra dell’acqua liquida. (Tra il vapore acqueo e l’acqua esiste un equilibrio che verrà discusso in seguito.) In più troviamo alcune altre molecole: qui due atomi di ossigeno legati insieme fra di loro formano Ossigeno Idrogeno Azoto una molecola di ossigeno, là due atomi di azoto anch’essi attaccati l’uno all’altro formano una molecola di azoto. L’aria consiste quasi interamente di azoto, ossigeno, un po’ di vapore acqueo e quantità minori di anidride FIGURA 1.5 Acqua che evapora nell’aria.

5

6

Capitolo 1 • Atomi in moto

© 978-8808-22107-0

carbonica, argo e altre sostanze. Dunque, al disopra della superficie dell’acqua vi è l’aria, un gas che contiene una certa quantità di vapore acqueo. Ora, che accade in questa rappresentazione? Le molecole che si trovano dentro l’acqua si agitano continuamente. Di tanto in tanto, una che si trova alla superficie viene per caso colpita un po’ più forte del solito ed è spinta via. È difficile vedere questo fatto nel disegno, perché esso è una rappresentazione statica. Ma possiamo immaginare che una molecola vicina alla superficie sia appena stata colpita e stia volando via o che un’altra, dopo essere stata colpita, stia sfuggendo. Così, molecola per molecola, l’acqua scompare: evapora. Ma se chiudiamo il recipiente al disopra, dopo un po’ troviamo un gran numero di molecole d’acqua tra le molecole d’aria. Di tanto in tanto, una di queste molecole di vapore vola giù fino all’acqua e vi si attacca di nuovo. Così vediamo che ciò che appare come una cosa morta e insignificante – un bicchiere d’acqua con un coperchio rimasto lì forse per vent’anni – in realtà nasconde un interessante fenomeno dinamico che si svolge continuamente. Per i nostri occhi, per la nostra limitata capacità visiva nulla muta, ma se potessimo vederlo ingrandito un miliardo di volte vedremmo che dal suo punto di vista esso muta continuamente: molecole lasciano la superficie, molecole ritornano indietro. Perché noi non vediamo alcun cambiamento? Perché il numero delle molecole che se ne vanno è esattamente pari a quello delle molecole che ritornano! Alla lunga «non accade nulla». Se poi togliamo il coperchio del recipiente e soffiamo via l’aria umida sostituendola con aria secca, il numero delle molecole che se ne vanno sarà esattamente lo stesso di prima perché ciò dipende dall’agitazione dell’acqua, ma il numero delle molecole che tornano indietro è grandemente ridotto perché vi sono molte meno molecole di acqua al disopra dell’acqua stessa. Quindi saranno di più quelle che escono di quelle che entrano, e l’acqua evaporerà. Dunque se desiderate fare evaporare l’acqua accendete il ventilatore! Eccoci a qualcosa d’altro: quali sono le molecole che se ne vanno? Quando una molecola si allontana, ciò è dovuto a un’accidentale sovraccumulazione di energia, un minimo in più dell’energia solita, che è necessaria per vincere le attrazioni delle molecole vicine. Quindi, dato che quelle che se ne vanno hanno un’energia maggiore della media, quelle che restano hanno un moto medio minore di quello che avevano prima. Così, se evapora, il liquido gradatamente si raffredda. Naturalmente, quando una molecola di vapore passa dall’aria all’acqua sottostante, all’avvicinarsi della molecola alla superficie si manifesta una grande, improvvisa attrazione. Questa accelera la molecola entrante e si risolve in una generazione di calore. Così quando se ne vanno, le molecole sottraggono calore e quando ritornano lo generano. Naturalmente, quando non vi è evaporazione risultante, l’effetto è nullo: l’acqua non cambia temperatura. Se invece soffiamo sull’acqua, sì da conservare una continua preponderanza nel numero delle molecole che evaporano, allora l’acqua si raffredda. Dunque, soffiate sul brodo, se volete raffreddarlo! Naturalmente, dovreste rendervi conto che i processi appena descritti sono più complicati di quanto abbiamo indicato. Non solo l’acqua entra nell’aria, ma, di tanto in tanto, anche una molecola di ossigeno o di azoto si introdurrà e «andrà persa» nella massa delle molecole d’acqua, e viaggerà nell’acqua. Così l’aria si dissolve nell’acqua; molecole di ossigeno e azoto entreranno nell’acqua e l’acqua conterrà aria. Se all’improvviso togliamo l’aria dal recipiente, le molecole d’aria se ne andranno più rapidamente di come vi sono entrate, e nel far ciò produrranno delle bolle. Questo fatto è molto pericoloso per i palombari, come forse sapete. Ora passiamo a un altro processo. Nella FIGURA 1.6 vediamo, da un punto di vista atomico, un solido che si dissolve nell’acqua. Se mettiamo nell’acqua un cristallo di sale, cosa succederà? Il sale è un solido, un cristallo, una struttura organizzata di «atomi di sale». La FIGURA 1.7 mostra la struttura tridimensionale del sale comune, il cloruro di sodio. A rigor di termini, il cristallo non è composto da atomi, ma da ciò che chiamiamo ioni. Uno ione è un atomo che ha alcuni elettroni in più oppure ha perduto alcuni elettroni. In un cristallo di sale troviamo ioni di cloro (atomi di cloro con un elettrone in più) e ioni di sodio (atomi di sodio con un elettrone in meno). Cloro Sodio Nel sale solido tutti gli ioni stanno attaccati gli uni agli altri per attrazione elettrica, ma quando li mettiamo nell’acqua, a causa dell’attrazione sugli ioni da parte dell’ossigeno negativo e dell’idrogeno positivo, avviene che FIGURA 1.6 Sale che si scioglie nell’acqua.

© 978-8808-22107-0

1.4 • Reazioni chimiche

alcuni ioni si liberano. Nella FIGURA 1.6 vediamo uno ione di cloro che si libera e altri atomi fluttuanti nell’acqua sotto forma di ioni. Questa Cristallo a (Å) rappresentazione è stata fatta con una certa cura. Notate, per esempio, che Salgemma Na 5,64 Cl gli estremi di idrogeno delle molecole d’acqua si trovano più facilmente Silvina K 6,28 Cl vicini allo ione cloro, mentre vicino allo ione sodio è più probabile trovare Ag 5,54 Cl l’estremo di ossigeno, perché il sodio è positivo e l’estremo di ossigeno Mg 4,20 O dell’acqua è negativo ed essi si attraggono elettricamente. Da questa figura, Galena Pb 5,97 S possiamo dire se il sale si stia sciogliendo nell’acqua o stia cristallizzando Pb 6,14 Se dall’acqua? Naturalmente non possiamo dirlo perché, mentre alcuni atomi Pb 6,34 Te stanno lasciando il cristallo altri lo raggiungono. Il processo è un processo Distanza tra due ioni contigui: d = a/2 dinamico, proprio come nel caso dell’evaporazione, e dipende dal fatto che la quantità di sale presente nell’acqua sia maggiore o minore di quella necessaria per l’equilibrio. Per equilibrio intendiamo quella situazione in z cui la quantità di atomi che se ne vanno è esattamente pari a quella degli atomi che tornano indietro. Se non vi è quasi sale nell’acqua, sono più numerosi gli atomi che se ne vanno di quelli che ritornano, e il sale si 8 4 scioglie. Se, d’altro canto, vi sono troppi «atomi di sale», ne tornano in numero maggiore di quanti ne partano e il sale cristallizza. 2 Incidentalmente, accenniamo al fatto che il concetto di molecola di 7 3 una sostanza è solo approssimativo ed esiste solo per una certa classe di 6 a sostanze. Nel caso dell’acqua è chiaro che i tre atomi sono in realtà attaccati d 1 insieme. Ciò non è altrettanto chiaro nel caso del cloruro di sodio allo stato 5 solido. Vi è soltanto una disposizione degli ioni di sodio e di cloro in x una struttura cubica. Non vi è alcun modo naturale di raggrupparli come «molecole di sale». Ritornando alla nostra discussione sulla soluzione e la precipitazione, FIGURA 1.7 Struttura cristallina di alcuni sali. se aumentiamo la temperatura della soluzione di sale, la quantità di atomi che vengono sottratti aumenta, come del resto aumenta la quantità di atomi che ritornano indietro. In generale, riesce molto difficile prevedere come andrà a finire, se si scioglierà una maggiore o minore quantità del solido. La maggior parte delle sostanze si scioglie di più all’aumentare della temperatura, ma alcune sostanze si sciolgono meno.

1.4

Reazioni chimiche

In tutti i processi fin qui descritti, gli atomi e gli ioni non hanno cambiato compagno, ma naturalmente vi sono circostanze in cui gli atomi variano le combinazioni, formando nuove molecole. Ciò è illustrato nella FIGURA 1.8. Un processo in cui avviene la risistemazione dei compagni atomici è ciò che chiamiamo reazione chimica. Gli altri processi fin qui descritti sono denominati processi fisici, ma non vi è differenza netta fra i due. (La natura non si occupa di come definiamo un processo, essa si interessa unicamente di continuare a crearlo.) Questa figura si suppone rappresenti del carbonio che brucia nell’ossigeno. Nel caso dell’ossigeno, due atomi di ossigeno si attaccano l’uno all’altro molto strettamente. (Perché non si attaccano tre o anche quattro atomi? Questa è una delle caratteristiche del tutto peculiari di tali processi atomici. Gli atomi sono molto speciali: a essi piacciono certi particolari compagni, certe particolari direzioni, e così via. È compito della fisica analizzare perché ognuno di loro vuole quello che vuole. A ogni modo, due atomi di ossigeno formano, saturati e felici, una molecola.) Si suppone che gli atomi di carbonio si trovino in un cristallo solido, che potrebbe essere grafite o diamante(1) . Ora, una delle molecole di ossigeno (1)

Si può bruciare un diamante nell’aria.

FIGURA

1.8

Carbonio che brucia in ossigeno.

7

y

8

Capitolo 1 • Atomi in moto

© 978-8808-22107-0

può, per esempio, passare al carbonio, e ciascun atomo può raccogliere un atomo di carbonio e volare via in una nuova combinazione – «carbonio-ossigeno» – che è una molecola di quel gas chiamato ossido di carbonio. Gli si dà il nome chimico CO. È molto semplice: le lettere «CO» sono praticamente una rappresentazione di quella molecola. Ma il carbonio attrae l’ossigeno molto più di quanto l’ossigeno attragga l’ossigeno o il carbonio attragga il carbonio. Quindi, in questo processo, l’ossigeno può entrare con una piccola energia, ma l’ossigeno e il carbonio si investiranno l’un l’altro con un tremendo sovvertimento, e ogni cosa vicina a essi raccoglierà energia. Una gran quantità di energia di moto, energia cinetica, viene così generata. Ciò, naturalmente, significa bruciare; noi otteniamo calore dalla combinazione di ossigeno e carbonio. Il calore si presenta, di solito, sotto forma di moto molecolare del gas caldo, ma in certe circostanze può essere così intenso da generare luce. È così che si ottengono le fiamme. Per di più, l’ossido di carbonio non è del tutto soddisfatto. È possibile per lui legarsi a un altro ossigeno, cosicché possiamo avere una reazione molto più complicata in cui l’ossigeno sta combinandosi con il carbonio, mentre, al tempo stesso, accade una collisione con una molecola di ossido di carbonio. Un atomo di ossigeno si potrebbe unire al CO e formare infine una molecola composta da un carbonio e da due ossigeni, che viene indicata con CO2 e chiamata diossido di carbonio (o anidride carbonica). Se bruciamo il carbonio con pochissimo ossigeno in una reazione molto rapida (per esempio, nel motore di un’automobile, dove l’esplosione è tanto veloce da non avere il tempo di produrre CO2 ) si forma una notevole quantità di ossido di carbonio. In riordinamenti del genere si sprigiona una gran quantità di energia, che dà origine a esplosioni, fiamme ecc., a secondo delle reazioni. I chimici hanno studiato questi assestamenti degli atomi e hanno trovato che ogni sostanza è una sistemazione di atomi. Per illustrare questo concetto consideriamo un altro esempio. Se entriamo in un campo di violette, sappiamo che cos’è «quel profumo». È un qualche genere di molecola, o sistemazione di atomi, che si è fatta strada dentro i nostri nasi. Prima di tutto, come ha fatto a entrare? Ciò è piuttosto semplice. Se il profumo corrisponde a un qualche tipo di molecola che si trova nell’aria agitandosi all’intorno e sbattuta in ogni dove, può essere penetrato accidentalmente nei nostri nasi. Certo non ha un desiderio particolare di entrare nel nostro naso. È semplicemente una povera parte indifesa di una folla tumultuante di molecole, e, nei suoi vagabondaggi senza meta, a questo particolare pezzetto di materia capita di trovarsi nel naso. Ora, i chimici possono prendere speciali molecole, quali il profumo delle violette, analizzarle e dirci l’esatta disposizione degli atomi nello spazio. Sappiamo che la molecola del diossido di carbonio è diritta e simmetrica: O C O. (Ciò può anche venire determinato facilmente con metodi fisici.) Però, anche per le strutture di atomi assai più complicate che esistono nella chimica, si possono scoprire gli ordinamenti degli atomi con un lungo e notevole processo di lavoro di ricerca. La FIGURA 1.9 è una rappresentazione dell’aria in prossimità di una violetta; nell’aria troviamo di nuovo azoto, ossigeno e vapore acqueo. (Perché vi è del vapore acqueo? Perché la violetta è umida. Tutte le piante traspirano.) Comunque vediamo anche un «mostro» formato di atomi di carbonio, di idrogeno e di ossigeno, FIGURA 1.9 Profumo di violette. che hanno scelto una certa struttura particolare in cui sono organizzati. È un ordinamento molto più complicato di quello del diossido di carbonio, anzi è una struttura enormemente complicata. Sfortunatamente non siamo in grado di raffigurare tutto ciò che è realmente conosciuto su questa struttura dal punto di vista chimico, perché l’esatta struttura di tutti gli atomi è conosciuta in realtà in tre dimensioni, mentre la nostra figura ha solo due dimensioni. I sei carboni che formano l’anello non formano un anello piatto, ma una specie di anello «ondulato». Tutti gli angoli e le distanze sono noti. Dunque, una formula chimica è semplicemente una rappresentazione di una tale molecola. Quando un chimico scrive una cosa di questo tipo sulla lavagna, egli tenta di «disegnare», per così dire, in due dimensioni. Per esempio, noi vediamo un «anello» di carboni e una «catena» di carboni che pendono all’estremità di esso, con un ossigeno che è il secondo a partire dall’estremo, tre idrogeni legati a quel carbonio, due carboni e tre idrogeni attaccati qui ecc. Come fa il chimico a determinare una struttura come questa? Egli mescola insieme bottiglie piene di roba, e, se risulta rosso questo gli dice che si tratta di un idrogeno e due carboni legati in

© 978-8808-22107-0

1.4 • Reazioni chimiche

questo punto; se risulta blu, invece, non è così, non lo è affatto. Questo è uno dei campi di indagine più fantastici che siano mai stati esplorati: la chimica organica. Per scoprire l’ordinamento degli atomi in queste strutture terribilmente complicate, il chimico osserva che cosa succede quando mescola due sostanze diverse. I fisici non hanno mai creduto davvero che i chimici in realtà sapessero di che stavano parlando quando descrivevano l’ordine degli atomi. Da circa vent’anni, però, è divenuto possibile, in certi casi, osservare tali molecole (non complicate come questa, ma alcune contenenti parti di essa) per mezzo di un metodo fisico ed è stato possibile localizzare ciascun atomo non guardando i colori ma misurando dove si trova. E... guarda un po’! I chimici sono quasi sempre nel giusto. Risulta infatti che nel profumo delle violette vi sono tre molecole leggermente diverse, le quali differiscono solo nella disposizione degli atomi di idrogeno. Un problema della chimica è quello di dare un nome alle sostanze in modo che sappiamo di che si tratta. Trovate un nome per questa struttura! CH3 CH3 (FIGURA 1.10) Il nome non deve soltanto definire la struttura, ma deve anche O H H H dire che qui vi è un atomo di ossigeno, lì un idrogeno – esattamente ciò C CH3 C C C C C CH3 che ogni atomo è e dove si trova. Così possiamo ben comprendere come i H nomi chimici debbano essere complessi per poter essere completi. Il nome C CH3 H C di questa sostanza nella forma più completa è 4-(2, 2, 3, 6 tetrametile-5C H cicloesanile)-3-butene-2-one, e ciò dà un’idea della sua struttura. Possiamo H renderci conto delle difficoltà che si presentano ai chimici e anche della ragione di tali lunghi nomi. Non è che essi desiderino essere incomprensibili, ma hanno un problema estremamente difficile nel tentare di descrivere le FIGURA 1.10 La sostanza rappresentata è l’α-irone. molecole a parole! Come facciamo a sapere che esistono gli atomi? Per mezzo di uno dei trucchi precedentemente menzionati: facciamo l’ipotesi che esistano gli atomi, e uno dopo l’altro i risultati seguono secondo il modo previsto, come dovrebbero se le cose sono fatte di atomi. Vi è una prova ancora più diretta, e ne è un buon esempio quanto segue: gli atomi sono così piccoli che non potete vederli con un microscopio ottico – anzi nemmeno con un microscopio elettronico. (Con un microscopio ottico potete vedere solo cose che sono molto più grandi.) Ora, se gli atomi sono sempre in moto, diciamo nell’acqua, e noi introduciamo nell’acqua una grossa palla di qualche genere, una palla molto più grossa degli atomi, essa si agiterà all’intorno – molto similmente a quanto avviene in una partita di palla a spinta(2) , dove una palla di grandi dimensioni è spinta qua e là da un gran numero di persone. Le persone spingono in varie direzioni e la palla si muove nel campo in modo irregolare. Così, nella stessa maniera, la «grande palla» si muoverà, a causa della disuguaglianza degli urti da un lato all’altro, da un istante a quello successivo. Pertanto, se osserviamo delle particelle minuscole (i colloidi), che sono nell’acqua, attraverso un eccellente microscopio, vedremo un continuo zig-zagare delle particelle, che rappresenta il risultato del bombardamento degli atomi. Questo è chiamato moto browniano. Possiamo vedere un’altra prova dell’esistenza degli atomi nella struttura dei cristalli. In molti casi le strutture dedotte da analisi fatte con i raggi X concordano nelle loro «strutture» spaziali con le forme realmente mostrate dai cristalli presenti in natura. Gli angoli tra le varie «facce» di un cristallo concordano, entro secondi di arco, con angoli dedotti dall’ipotesi che un cristallo è formato da molti «strati» di atomi. Ogni cosa è costituita di atomi. Questa è l’ipotesi chiave. L’ipotesi più importante di tutta la biologia, per esempio, è che tutto ciò che gli animali fanno, lo fanno gli atomi. In altre parole, non vi è nulla che gli esseri viventi facciano che non possa essere inteso partendo dal punto di vista che essi sono composti di atomi, i quali agiscono secondo le leggi della fisica. Ciò non era noto fin dall’inizio: occorse un certo lavoro sperimentale e teorico per suggerire questa ipotesi, ma ora essa è accettata ed è la teoria più utile che vi possa essere per promuovere nuove idee nel campo biologico. Se un pezzo di acciaio o un pezzo di sale, formati da atomi l’uno vicino all’altro, possono avere proprietà così interessanti; se l’acqua – che non è composta da altro che questi piccoli corpuscoli,

(2)

Gioco anglosassone che consiste nello spingere un pallone, di circa 2 metri di diametro, nella porta avversaria. (N.d.T.)

9

10

Capitolo 1 • Atomi in moto

© 978-8808-22107-0

per miglia e miglia della stessa sostanza sulla terra – può formare onde e schiuma, creare rumore di scroscio e disegnare strane forme mentre scorre sul cemento; se tutto ciò, la vita di un corso d’acqua, può essere nient’altro che un mucchio di atomi, quante altre cose sono possibili? Se invece di disporre gli atomi in un qualche disegno definito e sempre nuovamente ripetuto più e più volte, o anche formare piccoli cumuli di complessità come il profumo delle violette, creiamo una disposizione sempre diversa da posto a posto, con differenti tipi di atomi disposti in molti modi, che cambia continuamente e non si ripete, non è forse probabile che essa si comporti tanto più meravigliosamente? È possibile che l’«oggetto» che va avanti e indietro davanti a voi e che vi parla sia un gran mucchio di questi atomi disposti in una struttura assai complessa, tale che la pura e semplice complessità di essa sconcerti l’immaginazione per ciò che può fare? Quando diciamo che siamo un ammasso di atomi non intendiamo dire che siamo semplicemente un ammasso di atomi, perché un ammasso di atomi non ripetitivo potrebbe benissimo riflettere la vostra immagine nello specchio.

Fondamenti della fisica

2.1

Introduzione

In questo capitolo esamineremo le idee essenziali che possediamo riguardo alla fisica, cioè alla natura delle cose come le vediamo al momento attuale. Non tratteremo la storia di come ci sia noto che tutte queste idee sono vere; imparerete questi particolari a tempo debito. Le cose che ci interessano nella scienza appaiono in miriadi di forme e con gran numero di attributi. Per esempio, se siamo sulla spiaggia e guardiamo il mare, vediamo l’acqua, le onde che si frangono, la schiuma, il moto agitato dell’acqua, ne udiamo il suono, sentiamo l’aria e i venti, vediamo le nuvole, il sole e il cielo blu, la luce; vi è la sabbia e vi sono rocce di varia durezza e stabilità, colore e struttura. Vi sono animali e alghe marine, fame e malattie, e lo spettatore sulla spiaggia; vi può essere perfino felicità e pensiero. Qualsiasi altro luogo della natura presenta una varietà simile di cose e influenze. Le cose sono sempre così complicate in qualsiasi luogo. La curiosità pretende che poniamo delle domande, che tentiamo di collegare le cose tra loro e di comprendere questa moltitudine di aspetti, forse risultante dall’azione di un numero relativamente piccolo di cose e forze elementari agenti in una infinita varietà di combinazioni. Per esempio: la sabbia è qualcosa di diverso dalle rocce? Vale a dire, non è forse la sabbia nient’altro che un gran numero di pietre minutissime? La luna è una grande roccia? Se comprendessimo le rocce, comprenderemmo anche la sabbia e la luna? Il vento è una perturbazione dell’aria analoga al moto agitato dell’acqua del mare? Quali caratteristiche hanno in comune i diversi moti? Cosa hanno in comune le differenti specie di suoni? Quanti colori diversi esistono? E così via. In questo modo cerchiamo, gradualmente, di analizzare tutte le cose, di mettere in relazione tra di loro cose che a prima vista appaiono distinte, con la speranza di riuscire a ridurre il numero delle cose diverse, e, di conseguenza, comprenderle meglio. Alcune centinaia di anni or sono, si scoprì un metodo per trovare risposte parziali a tali interrogativi. Osservazione, ragionamento ed esperimento costituiscono quello che chiamiamo metodo scientifico. Dovremo limitarci alla pura e semplice descrizione della nostra sostanziale visione di ciò che talvolta prende il nome di fisica fondamentale, ossia delle idee fondamentali che sono sorte dall’applicazione del metodo scientifico. Che cosa intendiamo per «comprendere» qualche cosa? Possiamo immaginare che questo complicato apparato di cose in movimento che costituisce «il mondo» sia qualcosa di simile a una gran partita a scacchi giocata dagli dei, e che noi siamo spettatori della partita. Noi non sappiamo quali siano le regole del gioco. Tutto ciò che ci è consentito è di osservare lo svolgersi del gioco. Naturalmente se osserviamo abbastanza a lungo possiamo, alla fine, afferrare alcune delle regole. Le regole del gioco sono ciò che intendiamo per fisica fondamentale. Anche se conoscessimo tutte le regole, potremmo ugualmente non essere in grado di comprendere perché durante la partita venga fatta una certa mossa, semplicemente per il fatto che è troppo complicata, e le nostre menti sono limitate. Se giocate a scacchi, sapete che è facile apprendere tutte le regole, e tuttavia è spesso assai difficile scegliere la mossa migliore o capire perché un giocatore faccia una certa mossa. Così è in natura, solo che lo è molto di più; ma può darsi che alla fine riusciamo a scoprire tutte le regole. In realtà, ora non le conosciamo tutte. (Ogni tanto avviene qualcosa di simile a un arrocco, che ancora non comprendiamo.) A parte il fatto che non conosciamo tutte le regole, ciò che in realtà possiamo spiegare con quelle regole è molto limitato, perché la maggior parte delle

2

12

Capitolo 2 • Fondamenti della fisica

© 978-8808-22107-0

situazioni sono talmente complicate che non ci è possibile seguire le fasi della partita usando le regole, né tanto meno dire che cosa succederà. Dobbiamo, quindi, limitarci alla più fondamentale questione delle regole del gioco. Se conosciamo le regole, riteniamo di «comprendere» il mondo. Come possiamo dire se le regole che «assumiamo» sono veramente giuste, dal momento che non riusciamo ad analizzare completamente la partita? Vi sono, grosso modo, tre modi per decidere. Primo, possono presentarsi delle situazioni in cui la natura è ordinata, oppure siamo noi a ordinarla, in modo che sia semplice, e quindi sia formata di così poche parti da consentirci di predire esattamente ciò che accadrà, e in tal modo di controllare come funzionano le nostre regole. (In un angolo della scacchiera può darsi vi siano solo pochi pezzi in azione, e questa situazione la possiamo analizzare esattamente.) Una seconda via per controllare le regole è di far uso di regole meno specifiche, derivate da esse. Per esempio, la regola che determina la mossa di un alfiere sulla scacchiera è che esso si muove soltanto in diagonale. Si può dedurre, non importa quante mosse possono essere fatte, che un certo alfiere si troverà sempre su un quadrato rosso. Così, senza essere in grado di seguire i particolari, possiamo sempre verificare la nostra idea relativa alla mossa dell’alfiere cercando di scoprire se si trova sempre su un quadrato rosso. Naturalmente vi si troverà per un bel pezzo, finché, all’improvviso, scopriremo che si trova su un quadrato nero (ciò che è accaduto naturalmente è che nel frattempo è stato mangiato, un’altra pedina ha attraversato la scacchiera per andare a regina e si è trasformata in un alfiere su quadrato nero). Così avviene in fisica. Per un lungo periodo possiamo avere una regola che funziona benissimo in maniera completa, anche se non riusciamo a seguirne i particolari, e poi, a un certo punto, possiamo scoprire una nuova regola. Dal punto di vista della fisica fondamentale, i fenomeni più interessanti si verificano naturalmente nelle situazioni nuove, nei punti in cui le regole non funzionano – non dove le regole funzionano! Questo è il modo di scoprire nuove regole. La terza maniera per dire se le nostre idee sono giuste è relativamente grezza, ma è probabilmente la più efficace di tutte. Nel senso che vale per grossolane approssimazioni. Anche se non siamo in grado di dire perché Alekhine muova questo particolare pezzo, forse possiamo approssimativamente comprendere che egli sta raccogliendo i suoi pezzi intorno al re per proteggerlo, più o meno, dato che quella è la cosa sensata da farsi in tali circostanze. Nello stesso modo, possiamo spesso comprendere la natura, più o meno, pur non essendo in grado di vedere che cosa stia facendo ogni piccolo pezzo, in rapporto alla nostra comprensione del gioco. Dapprincipio i fenomeni della natura sono stati grossolanamente suddivisi in classi, quali calore, elettricità, meccanica, magnetismo, proprietà delle sostanze, fenomeni chimici, luce o ottica, raggi X, fisica nucleare, gravitazione, fenomeni concernenti i mesoni ecc. Però, lo scopo è vedere l’intera natura nei diversi aspetti di un unico complesso di fenomeni. Questo è il problema della fisica teorica fondamentale dei nostri giorni: scoprire le leggi che stanno dietro all’esperimento; amalgamare queste classi. Dal punto di vista storico siamo sempre stati in grado di amalgamarle; ma col passare del tempo si scoprono cose nuove. Eravamo in una situazione di perfetta fusione dei fenomeni, quando, all’improvviso vennero scoperti i raggi X. Incorporammo qualcosa di più e furono scoperti i mesoni. Quindi a ogni stadio della partita, il gioco appare sempre piuttosto confuso. Si è raggiunto un alto grado di fusione, ma rimangono molti fili e capi sospesi, in tutte le direzioni. Questa è, oggi, la situazione che cercheremo di descrivere. Alcuni esempi storici di amalgamazione sono i seguenti. Considerate anzitutto il calore e la meccanica. Quando gli atomi sono in moto, quanto maggiore è il moto, tanto più calore contiene il sistema, quindi il calore e tutti gli effetti della temperatura possono essere rappresentati dalle leggi della meccanica. Un’altra straordinaria amalgamazione si ebbe con la scoperta della relazione tra elettricità, magnetismo e luce, che risultarono essere aspetti diversi della medesima cosa, che oggi chiamiamo campo elettromagnetico. Un’altra amalgamazione è rappresentata dall’unificazione dei fenomeni chimici, le proprietà delle diverse sostanze e il comportamento delle particelle atomiche, unificazione che si attua nella meccanica quantistica della chimica. La domanda che ci si pone, naturalmente, è la seguente: è possibile amalgamare tutto e scoprire semplicemente che questo mondo rappresenta i diversi aspetti di un’unica cosa? Nessuno lo sa. Tutto ciò che sappiamo è che, nel procedere, possiamo amalgamare pezzi, ma troviamo anche che alcuni pezzi non si incastrano, continuando a cercare di comporre il rompicapo. Non si sa ovviamente se vi è un numero finito di pezzi e anche se l’incastro abbia un contorno. Non lo si

© 978-8808-22107-0

2.2 • La fisica prima del 1920

saprà mai fino a che il quadro non sarà completo, se mai lo sarà. Ciò che desideriamo fare qui è di vedere fino a che punto questo processo di amalgamazione è andato avanti, e qual è la situazione nel momento attuale per quanto riguarda la comprensione dei fenomeni fondamentali mediante il minor numero di princìpi. In parole povere, di che sono composte le cose e quanti elementi vi sono?

2.2

La fisica prima del 1920

È un po’ difficile cominciare subito con il modo di vedere attuale, sicché prima analizzeremo come erano viste le cose intorno al 1920, poi estrarremo alcuni concetti da quella descrizione. Prima del 1920, la rappresentazione del nostro mondo era di questo tipo: la «scena» su cui l’universo è posto è lo spazio tridimensionale della geometria, come è descritto da Euclide, e le cose cambiano in un mezzo chiamato tempo. Gli elementi sulla scena sono le particelle, per esempio gli atomi, che hanno alcune proprietà. Primo, la proprietà d’inerzia: se una particella è in moto, essa continua ad andare nella stessa direzione a meno che delle forze non agiscano su di essa. Il secondo elemento è rappresentato dalle forze, che allora si pensava fossero di due tipologie: la prima era una forza d’interazione enormemente complicata che manteneva i vari atomi in differenti combinazioni, determinando se il sale si sarebbe sciolto più o meno velocemente con l’aumento di temperatura. L’altra forza nota era un’interazione a lunga distanza – una forma di attrazione piana e dolce – che variava inversamente al quadrato della distanza ed era chiamata gravitazione. Questa legge era conosciuta ed era molto semplice. Perché le cose rimangono in moto quando si muovono o perché esiste una legge gravitazionale, naturalmente, non era noto. Ciò di cui ci occupiamo qui è di dare una descrizione della natura. Dunque, da questo punto di vista, un gas e, a dire il vero, tutta la materia, non è altro che una miriade di particelle in moto. Così molte delle cose che vedevamo stando sulla riva del mare possono essere immediatamente collegate. Primo, la pressione: essa deriva dalla collisione degli atomi con le pareti o qualche altra cosa; la velocità degli atomi, se essi in media si muovono tutti in una stessa direzione, costituisce il vento; i moti casuali interni formano il calore. Vi sono onde di densità eccedente dove si sono raccolte troppe particelle, e così, spostandosi rapidamente, esse spingono lontano gruppi di particelle, e via di seguito. Quest’onda di densità eccendente è il suono. È un successo straordinario essere in grado di comprendere tanto. Alcune di queste cose sono state descritte nel precedente capitolo. Quali tipi di particelle esistono? A quell’epoca si riteneva ve ne fossero 92: in definitiva erano state scoperte 92 diverse specie di atomi. Essi avevano nomi differenti, legati alle loro proprietà chimiche. La parte successiva del problema fu la seguente: quali sono le forze a breve distanza? Perché il carbonio attrae un ossigeno o forse due ma non tre? Qual è il meccanismo di interazione fra gli atomi? È la gravitazione? La risposta è no. La gravità è assolutamente troppo debole. Ma immaginatevi una forza analoga alla gravità, che varia inversamente al quadrato della distanza, ma enormemente più forte e con la seguente differenza. Nella gravità ogni cosa attrae ogni altra cosa, ma ora immaginatevi che vi siano due generi di «cose», e che questa nuova forza (che è ovviamente la forza elettrica) abbia la proprietà che gli uguali si respingono e che i contrari si attraggono. La «cosa» che porta questa forte interazione è chiamata carica. Dunque qual è la situazione? Supponiamo di avere due opposti che si attraggono l’un l’altro, un «più» e un «meno», e che essi siano strettamente legati insieme. Supponiamo di avere un’altra carica a una certa distanza. Sentirebbe essa una qualche attrazione? Non ne sentirebbe praticamente nessuna, perché se le prime due sono di grandezza uguale, l’attrazione per l’una e la repulsione per l’altra si equilibrano. Di conseguenza a una qualsiasi distanza apprezzabile si manifesta una forza piccolissima. D’altra parte se ci avviciniamo molto con la carica isolata, si manifesta attrazione, perché la repulsione delle cariche uguali e l’attrazione delle opposte tende ad avvicinare maggiormente le cariche opposte e ad allontanare maggiormente quelle uguali. Quindi la repulsione sarà minore dell’attrazione. Questo è il motivo per cui gli atomi, i quali sono composti di cariche elettriche positive e negative, sentono pochissima forza quando sono

13

14

Capitolo 2 • Fondamenti della fisica

© 978-8808-22107-0

separati da una distanza apprezzabile (a parte la gravità). Quando si avvicinano, essi possono «vedersi intimamente» l’un l’altro e modificare la loro distribuzione di cariche, col risultato di avere un’interazione molto forte. La base ultima di un’interazione fra gli atomi è elettrica. Dal momento che questa forza è tanto grande, tutti i «più» e i «meno» normalmente si riuniranno in una combinazione più stretta possibile. Tutte le cose, anche noi stessi, sono fatte di minutissime parti di segno «più» e di segno «meno», che interagiscono assai fortemente e sono tutte perfettamente equilibrate. Ogni tanto, accidentalmente, è possibile raschiare via alcuni «meno» o alcuni «più» (di solito è più facile togliere i «meno»), e in tali circostanze troviamo che la forza elettrica non è più equilibrata e quindi ci è possibile vedere gli effetti delle attrazioni elettriche. Per dare un’idea di quanto l’elettricità sia più forte della gravitazione, consideriamo due grani di sabbia di un millimetro di diametro, posti a una distanza di trenta metri. Se la forza tra di loro non fosse equilibrata, se ogni cosa attraesse ogni altra cosa e non vi fosse repulsione fra le cariche uguali, cosicché non vi sarebbero effetti di annullamento, che forza avremmo? Tra i due vi sarebbe una forza di tre milioni di tonnellate! Vedete che è sufficiente un piccolissimo eccesso o difetto nel numero delle cariche negative o positive per produrre effetti elettrici apprezzabili. Questa è, ovviamente, la ragione per cui non potete vedere la differenza tra una cosa elettricamente carica e una scarica: le particelle interessate sono così poche che esse praticamente non apportano nessuna differenza al peso o alla misura di un oggetto. Mediante questa rappresentazione gli atomi furono più facilmente comprensibili. Si pensò che essi avessero un «nucleo» al centro, di carica elettrica positiva e di grande massa e che il nucleo fosse circondato da un certo numero di «elettroni» molto leggeri e di carica negativa. Ora procederemo un po’ nel nostro racconto col far notare che nel nucleo stesso furono trovate due specie di particelle, protoni e neutroni, quasi dello stesso peso e assai pesanti. I protoni hanno carica elettrica, mentre i neutroni sono neutri. Se abbiamo un atomo con sei protoni nel nucleo, e questo è circondato da sei elettroni (le particelle negative nel mondo comune della materia sono tutti elettroni ed essi sono molto leggeri, se paragonati ai protoni e ai neutroni che formano i nuclei), questo atomo sarebbe il numero sei nella tavola chimica, ed è chiamato carbonio. L’atomo numero otto è chiamato ossigeno ecc., perché le proprietà chimiche dipendono dagli elettroni che sono all’esterno, e in effetti solo da quanti elettroni vi sono. Così le proprietà chimiche di una sostanza dipendono solo da un numero, il numero degli elettroni. L’intera lista degli elementi chimici in realtà potrebbe essere chiamata l, 2, 3, 4, 5 ecc. Invece di dire «carbonio», potremmo dire «elemento sei», intendendo sei elettroni, ma, naturalmente, quando gli elementi furono scoperti, non si sapeva che essi potevano essere numerati in questo modo e, in secondo luogo, ciò renderebbe tutto piuttosto complicato. È meglio avere a disposizione nomi e simboli per questi elementi, piuttosto che chiamarli ognuno con un numero. Riguardo alla forza elettrica venne scoperto dell’altro. L’interpretazione naturale dell’interazione elettrica è semplicemente che due oggetti si attraggono l’un l’altro: «più» contro «meno». Però si scoprì che questa era un’idea inadeguata a rappresentare la situazione. Una rappresentazione più adeguata consiste nel dire che l’esistenza della carica positiva distorce, in un certo senso, o crea una «condizione» nello spazio, cosicché quando introduciamo la carica negativa, essa sente una forza. Tale potenzialità di produrre una forza si chiama campo elettrico. Quando introduciamo un elettrone in un campo elettrico, diciamo che esso viene «tirato». Dunque, abbiamo due regole: (a) la carica crea un campo e (b) le cariche nei campi subiscono forze e si muovono. La ragione di ciò diventerà chiara quando discuteremo i seguenti fenomeni: se carichiamo elettricamente un corpo, diciamo un pettine, e poniamo poi un pezzo di carta carico a una certa distanza e muoviamo il pettine avanti e indietro, la carta risponde puntando sempre in direzione del pettine. Se lo agitiamo più in fretta, si scopre che la carta rimane un po’ indietro, cioè vi è un ritardo nell’azione. (Al primo stadio, quando spostiamo il pettine abbastanza lentamente, troviamo una complicazione, che è il magnetismo. Le influenze magnetiche hanno a che fare con cariche in moto relativo, così le forze magnetiche e quelle elettriche possono in realtà essere attribuite a un unico campo, come due aspetti diversi della stessa, identica cosa. Un campo elettrico variabile non può esistere senza magnetismo.) Se spostiamo la carta carica ancora più lontano, il ritardo è maggiore. Allora si osserva una cosa interessante. Benché le forze tra due oggetti carichi presentino un’intensità inversa al quadrato della distanza, si trova che, quando agitiamo una carica, l’influenza

© 978-8808-22107-0

2.2 • La fisica prima del 1920

si estende molto più lontano di quanto non immagineremmo a prima vista. Vale a dire che l’effetto diminuisce più lentamente dell’inverso del quadrato. Vi è un’analogia: se ci troviamo in uno specchio d’acqua e in prossimità galleggia un sughero, noi possiamo spostarlo «direttamente» spingendo l’acqua con un altro sughero. Se guardaste soltanto i due sugheri, vedreste unicamente che l’uno si muove immediatamente in risposta al moto dell’altro: tra essi si attua un qualche genere di «interazione». Naturalmente ciò che in realtà noi facciamo è di turbare l’acqua; l’acqua disturba poi l’altro sughero. Potremmo creare una «legge» per cui, se si sospinge un poco l’acqua, un oggetto vicino, nell’acqua, dovrebbe muoversi. Se fosse più lontano, naturalmente il secondo sughero si muoverebbe appena, perché noi muoviamo l’acqua localmente. D’altra parte, se agitiamo il sughero interviene un nuovo fenomeno per cui il movimento dell’acqua sposta l’acqua in quel punto ecc., e le onde si allontanano, cosicché, con l’oscillazione, si manifesta un’influenza molto più lontana, un’influenza oscillatoria, che non può essere compresa con l’interazione diretta. Quindi l’idea dell’interazione diretta deve essere sostituita da quella dell’esistenza dell’acqua, o nel caso elettrico, da quello che chiamiamo campo elettromagnetico. Il campo elettromagnetico può trasportare delle TABELLA 2.1 Lo spettro elettromagnetico. onde; alcune di esse sono luce, altre sono usate nelle Frequenza trasmissioni radio, ma il loro nome generale è onde Nome (oscillazioni/s) elettromagnetiche. Queste onde oscillatorie possono avere varie frequenze (TABELLA 2.1). L’unica cosa ve102 Perturbazione elettrica ramente diversa da un’onda all’altra è la frequenza di 5 6 5 · 10 –10 Trasmissione radio oscillazione. Se agitiamo una carica avanti e indietro sempre più rapidamente, e ne osserviamo gli effet108 FM-TV ti, otteniamo un’intera serie di diversi tipi di effetti, 10 10 Radar che vengono tutti unificati specificando soltanto un 14 15 5 · 10 –10 Luce numero, il numero delle oscillazioni al secondo. 18 La comune «presa» di corrente elettrica nei circui10 Raggi X ti che si trovano nelle pareti di un fabbricato ha una 1021 Raggi nucleari frequenza di circa 100 cicli al secondo. Se aumentia24 mo la frequenza fino a 500 o 1000 kilocicli al secondo 10 Raggi «artificiali» (l kilociclo = 1000 cicli) – noi siamo «nell’aria»(1) – 27 10 Raggi nei raggi cosmici questo è l’intervallo di frequenza che viene usato per le trasmissioni radio. (Naturalmente ciò non ha niente a che fare con l’aria! Possiamo avere le trasmissioni radio anche in mancanza d’aria.) Se aumentiamo ancora la frequenza entriamo nell’intervallo che viene usato per le trasmissioni FM e per la TV. Andando ancora oltre incontriamo certe onde corte usate per esempio nel radar. Salendo ancora con le frequenze non abbiamo bisogno di uno strumento per «vedere» il fenomeno, possiamo vederlo con gli occhi. Nell’intervallo di frequenza che va da 5 · 1014 a 1015 cicli al secondo i nostri occhi vedrebbero l’oscillazione del pettine carico, se potessimo farlo vibrare così in fretta, come luce rossa, azzurra o violetta a seconda dalla frequenza. Le frequenze al di sotto di questo intervallo sono dette infrarosse e quelle al di sopra ultraviolette. Il fatto che ci sia dato di vedere in un particolare intervallo di frequenza, dal punto di vista del fisico non rende quella parte dello spettro elettromagnetico più singolare delle altre, ma dal punto di vista umano, com’è naturale, essa è più interessante. A frequenze ancora più alte abbiamo i raggi X, i quali non sono altro che luce di altissima frequenza. Ancora più in alto abbiamo i raggi gamma. Questi due termini, raggi X e raggi gamma, sono usati quasi come sinonimi. Di solito i raggi elettromagnetici provenienti dai nuclei sono detti raggi gamma, mentre quelli ad alta energia prodotti dagli atomi sono chiamati raggi X, ma a parità di frequenza essi sono fisicamente indistinguibili, indipendentemente dalla loro sorgente. A frequenze ancora più elevate, per esempio a 1024 cicli al secondo, troviamo che ci è possibile produrre tali onde artificialmente, per esempio mediante il sincrotrone che c’è qui al Caltech. (1) L’espressione «on the air» (letteralmente «nell’aria») usata dall’autore, nell’ambito delle comunicazioni radiotelevisive, significa «in onda». A ciò è dovuto il gioco di parole intraducibile, giustificato dall’inciso successivo. (N.d.T.)

15

Comportamento approssimativo Campo

Onde

Particelle

16

Capitolo 2 • Fondamenti della fisica

© 978-8808-22107-0

Possiamo trovare onde elettromagnetiche di frequenza straordinariamente alta – con oscillazioni fino a mille volte più rapide di quelle del sincrotrone – nelle onde che si trovano nei raggi cosmici. Queste onde non possono essere da noi controllate.

2.3

Fisica quantistica

Avendo descritto il concetto di campo elettromagnetico e avendo visto che tale campo può trasportare delle onde, scopriamo subito che queste onde in realtà si comportano in una maniera strana che sembra discostarsi dal comportamento delle onde. A frequenze più alte esse si comportano assai similmente a particelle! È la meccanica quantistica, scoperta poco dopo il 1920, che spiega questo strano comportamento. Negli anni precedenti il 1920 la rappresentazione dello spazio come tridimensionale, e del tempo come cosa a sé, fu trasformata da Einstein, prima in una combinazione che definiamo spazio-tempo e poi in uno spazio-tempo curvo per rappresentare la gravitazione. Così la «scena» si è trasformata nello spazio-tempo e la gravitazione è presumibilmente una modifica dello spazio-tempo. Poi si scoprì che anche le regole del moto delle particelle erano inesatte. Le regole meccaniche dell’«inerzia» e della «forza», cioè le leggi di Newton, sono sbagliate nel mondo degli atomi. Anzi, si scoprì che i fenomeni su piccola scala si comportano in maniera del tutto diversa dai fenomeni su grande scala. È questo che rende la fisica difficile – e molto interessante. È difficile perché il modo in cui le cose si comportano su piccola scala è assai «innaturale»; noi non ne abbiamo un’esperienza diretta. Qui le cose si comportano diversamente da tutto ciò che conosciamo, cosicché è impossibile descrivere tale comportamento per vie che non siano quelle analitiche. È difficile e richiede grande immaginazione. La meccanica quantistica ha diversi aspetti. In primo luogo, l’idea che una particella abbia una posizione e una velocità definite non è più ammessa: è sbagliata. Per dare un esempio di quanto sia errata la fisica classica, vi è, nella meccanica quantistica, una regola che afferma che non è possibile sapere contemporaneamente dove si trova un certo oggetto e a che velocità si sta muovendo. L’incertezza circa la quantità di moto e quella sulla posizione sono complementari, e il prodotto delle due è costante. Possiamo scrivere la legge così: x p > ~/2, ma ci spiegheremo con maggior precisione più avanti. Questa regola è la spiegazione di un paradosso assai oscuro: se gli atomi sono composti di cariche «più» e di cariche «meno», perché le cariche negative non si pongono semplicemente sulle cariche positive (esse si attraggono fra loro) e non vengono a contatto in modo da annullarle completamente? Perché gli atomi sono così grandi? Perché il nucleo si trova al centro ed è circondato dagli elettroni? Dapprima si pensò che ciò avvenisse perché il nucleo era molto grande; invece no, il nucleo è piccolissimo. Un atomo ha un diametro di circa 10 8 cm. Il nucleo ha un diametro di circa 10 13 cm. Se avessimo un atomo e desiderassimo vederne il nucleo, dovremmo ingrandirlo fino a che l’intero atomo non avesse le dimensioni di una stanza spaziosa, e anche allora il nucleo sarebbe una semplice macchiolina appena visibile a occhio nudo; tuttavia quasi tutto il peso dell’atomo si trova in quel nucleo infinitesimale. Cosa trattiene gli elettroni dal cadere nel nucleo? Questo principio: se essi si trovassero nel nucleo, ne conosceremmo la posizione esattamente, e il principio di indeterminazione richiederebbe allora che essi possedessero una quantità di moto molto grande (ma indeterminata), cioè una grandissima energia cinetica. Con questa energia essi si staccherebbero dal nucleo. Gli elettroni arrivano a un compromesso: lasciano essi stessi un piccolo spazio per tale indeterminazione e poi oscillano con un movimento minimo secondo tale regola. (Ricorderete che quando un cristallo è raffreddato fine allo zero assoluto, gli atomi non cessano di muoversi, ma continuano ad agitarsi. Perché? Se essi smettessero di muoversi, noi sapremmo dove si trovano e che sono in quiete, e ciò è contro il principio di indeterminazione. In realtà noi non possiamo sapere dove essi si trovano né a che velocità si muovono, quindi devono essere in movimento continuo!) Un’altra trasformazione interessantissima nelle idee e nella filosofia della scienza dovuta alla meccanica quantistica è la seguente: non è possibile prevedere esattamente che cosa accadrà in qualsiasi circostanza. Per esempio, è possibile predisporre un atomo a emettere luce, e siamo in grado di misurare quando ha emesso luce raccogliendo un fotone, particella che presto descrive-

© 978-8808-22107-0

2.3 • Fisica quantistica

remo. Tuttavia non possiamo predire quando emetterà la luce o, nel caso di molti atomi, quale di essi la emetterà. Si potrebbe supporre che ciò sia dovuto ad alcuni «meccanismi» interni che non abbiamo osservato sufficientemente. No, non vi sono meccanismi interni; la natura, come noi oggi siamo in grado di capirla, si comporta in modo tale che è fondamentalmente impossibile fare una previsione precisa di ciò che esattamente accadrà in un dato esperimento. Questa è una cosa sconcertante; infatti i filosofi avevano affermato in precedenza che uno dei requisiti fondamentali della scienza è quello per cui, ogniqualvolta vengono ricreate le stesse condizioni, deve verificarsi la stessa cosa. Questo semplicemente non è vero; non è una condizione fondamentale della scienza. La realtà è che non sempre accade la stessa cosa e che noi possiamo soltanto trovare statisticamente una media di quanto accade. Nondimeno, la scienza non è completamente crollata. I filosofi, incidentalmente, dicono un mucchio di cose su ciò che è assolutamente necessario per la scienza, e questo è sempre, per quanto si può vedere, piuttosto ingenuo e verosimilmente sbagliato. Per esempio, un qualche filosofo ha affermato che è fondamentale, per il lavoro scientifico, che se un esperimento è compiuto a Stoccolma, diciamo, e poi lo stesso esperimento è fatto per esempio a Quito, debbono essere ottenuti gli stessi risultati. Questo è del tutto falso. Non è necessario che la scienza faccia questo; può essere un risultato dell’esperienza ma non è necessario che lo sia. Per esempio, se uno degli esperimenti è di guardare il cielo e assistere all’aurora boreale a Stoccolma, non la vedrete certamente a Quito; quello è un fenomeno particolare. «Ma», direte voi, «questo è qualcosa che ha a che fare con l’esterno; è possibile rinchiudersi in una scatola a Stoccolma, tirare giù il coperchio e ottenere qualche differenza?». Sicuramente. Se prendiamo un pendolo su un giunto cardanico, lo tiriamo su e poi lo lasciamo andare, il pendolo oscillerà quasi su un piano, ma non esattamente. Il piano continua lentamente a cambiare a Stoccolma, ma non a Quito. Eppure le persiane sono chiuse. Il fatto che ciò sia accaduto non provoca la rovina della scienza. Qual è l’ipotesi fondamentale della scienza, la sua filosofia fondamentale? Lo abbiamo dichiarato nel primo capitolo: la prova unica della validità di un qualsiasi concetto è l’esperimento. Se risulta che la maggior parte degli esperimenti funzionano allo stesso modo sia a Quito sia a Stoccolma, allora quella «maggior parte di esperimenti» verrà usata per formulare una qualche legge generale, e gli esperimenti che non riescono uguali diremo che sono stati il risultato delle condizioni ambientali della zona di Stoccolma. Inventeremo una qualche maniera di riassumere i risultati dell’esperimento, e non abbiamo bisogno di essere informati prima del tempo su quale sarà il modo di riassumere. Se ci dicono che lo stesso esperimento produrrà sempre il medesimo risultato, va tutto bene, ma se quando lo cerchiamo, il risultato non è quello, non è quello e basta. Noi dobbiamo soltanto prendere ciò che vediamo, e quindi formulare tutti gli altri nostri concetti in funzione della nostra reale esperienza. Per tornare di nuovo alla meccanica quantistica e alla fisica fondamentale, non possiamo naturalmente entrare ora nei dettagli sui princìpi della meccanica quantistica, perché essi sono piuttosto difficili da comprendere. Supporremo che essi esistano e procederemo a descrivere quali ne sono alcune delle conseguenze. Una delle conseguenze è che cose che eravamo abituati a considerare come onde si comportano anche come particelle e le particelle come onde; in realtà ogni cosa si comporta alla stessa maniera. Non vi è distinzione fra un’onda e una particella. Dunque la meccanica quantistica unifica in un tutto l’idea del campo e delle sue onde, e quella delle particelle. Ora, è vero che quando la frequenza è bassa, l’aspetto di campo del fenomeno è più evidente, o più utile come descrizione approssimativa in termini di esperienza quotidiana. Ma man mano che la frequenza aumenta, gli aspetti particellari del fenomeno diventano più evidenti con l’apparato con cui di solito facciamo le misure. Infatti, benché abbiamo ricordato parecchie frequenze, nessun fenomeno che coinvolga direttamente una frequenza è stato ancora scoperto al di sopra di circa 1012 cicli al secondo. Noi deduciamo soltanto le frequenze più alte dall’energia delle particelle, per mezzo di una regola che suppone valido il concetto onda-particella della meccanica quantistica. Così abbiamo una nuova visione dell’interazione elettromagnetica. Abbiamo un nuovo genere di particella da aggiungere all’elettrone, al protone e al neutrone. Tale nuova particella è chiamata fotone. La nuova visione dell’interazione fra elettroni e fotoni, che è la teoria elettromagnetica corretta secondo la meccanica quantistica, è detta elettrodinamica quantistica. Questa teoria fondamentale dell’interazione di luce e materia, ovvero campo elettrico e cariche, è il nostro

17

18

Capitolo 2 • Fondamenti della fisica

© 978-8808-22107-0

massimo successo nella fisica, fino a oggi. In quest’unica teoria abbiamo le regole fondamentali per spiegare tutti i normali fenomeni a eccezione della gravitazione e dei processi nucleari. Per esempio, dall’elettrodinamica quantistica vengono tutte le leggi elettriche, meccaniche e chimiche note: le leggi sulla collisione delle palle da biliardo, i moti dei fili nei campi magnetici, il calore specifico dell’ossido di carbonio, il colore delle insegne al neon, la densità del sale e le reazioni di idrogeno e ossigeno per produrre l’acqua sono tutte conseguenze di quest’unica legge. Tutti questi particolari possono venire elaborati se la situazione è abbastanza semplice da permetterci di fare un’approssimazione, il che non succede quasi mai, ma spesso riusciamo a capire più o meno ciò che accade. Oggi come oggi non si trovano eccezioni alle leggi dell’elettrodinamica quantistica al di fuori del nucleo, e là non sappiamo se vi sia un’eccezione, perché semplicemente ignoriamo cosa accade nel nucleo. In linea di principio, dunque, l’elettrodinamica quantistica è la teoria dell’intera chimica, e della vita, se la vita in definitiva si riduce a chimica e quindi a fisica, dato che la chimica già vi è ridotta (essendo ormai nota quella parte della fisica connessa alla chimica). Inoltre, la stessa elettrodinamica quantistica, questa cosa fantastica, predice un gran numero di novità. In primo luogo, esprime le proprietà dei fotoni ad altissima energia, dei raggi gamma ecc. Essa ha predetto un altro fatto assai notevole: oltre all’elettrone dovrebbe esistere un’altra particella, della stessa massa ma di carica opposta, chiamata positrone, e queste due particelle unendosi potrebbero annichilirsi l’un l’altra con emissione di luce o di raggi gamma. (Dopo tutto, luce e raggi gamma sono la medesima cosa, infatti essi rappresentano unicamente punti diversi di una scala di frequenza.) La generalizzazione del fatto che per ogni particella esiste un’antiparticella risulta vera. Nel caso degli elettroni, l’antiparticella ha un altro nome (è chiamata infatti positrone), ma per la maggior parte delle altre particelle, la si denomina antiquesto o antiquello, come antiprotone o antineutrone. Nell’elettrodinamica quantistica sono introdotti soltanto due numeri, e la maggior parte degli altri numeri del mondo fisico si suppone che ne derivino. I due numeri introdotti sono la massa e la carica dell’elettrone. In realtà ciò non è del tutto vero, perché abbiamo a disposizione per la chimica tutto un insieme di numeri che ci dicono quanto pesano i nuclei. Questo ci introduce nella parte successiva.

2.4

Nuclei e particelle

Di che cosa sono composti i nuclei e come sono tenuti insieme? Si è scoperto che i nuclei sono tenuti insieme da forze enormi. Quando esse vengono liberate, l’energia che si sprigiona è enorme, se paragonata all’energia chimica: ha la stessa proporzione dell’esplosione di una bomba atomica in rapporto a un’esplosione di TNT, perché, ovviamente, la bomba atomica ha a che fare con trasformazioni interne al nucleo, mentre l’esplosione di TNT ha a che fare con trasformazioni degli elettroni all’esterno degli atomi. La questione che si presenta è la seguente: quali sono le forze che tengono uniti i protoni e i neutroni nel nucleo? Proprio come l’interazione elettrica può essere associata a una particella, un fotone, Yukawa lanciò l’idea che le forze fra neutroni e protoni abbiano anch’esse un campo di qualche genere, e che quando questo campo si agita, si comporti come una particella. Quindi potevano esistere nel mondo altre particelle, oltre i protoni e i neutroni, ed egli fu in grado di dedurre le proprietà di tali particelle dalle caratteristiche già note delle forze nucleari. Per esempio, predisse che avrebbero avuto una massa 200 o 300 volte quella di un elettrone; e, guarda caso, nei raggi cosmici si scoprì una particella proprio con questa massa! Ma più tardi risultò non essere la particella cercata. Essa venne denominata mesone µ o muone. Comunque, poco più tardi, nel 1947 o 1948, si scoprì un’altra particella, il mesone ⇡, o pione, che soddisfaceva il criterio di Yukawa. Oltre il protone e il neutrone, dunque, per ottenere delle forze nucleari dobbiamo aggiungere il pione. Ora voi direte: «Fantastico! Con questa teoria noi facciamo della nucleodinamica quantistica usando i pioni proprio come voleva Yukawa. Vediamo se funziona e tutto sarà spiegato.» Sfortunatamente risulta che i calcoli relativi a questa teoria sono talmente difficili che nessuno è mai stato in grado di calcolare quali siano le conseguenze della teoria, o di verificarla sperimentalmente, per quanto gli esperimenti siano andati avanti per

2.4 • Nuclei e particelle

+e

1395

Stranezza e raggruppamento S = –2 S = –2

S = –1 1189 S = –1

p 938

BARIONI

quasi vent’anni! Sicché siamo rimasti bloccati con una teoria, e non sappiamo se sia giusta o sbagliata, ma sappiamo che è un po’ sbagliata o almeno incompleta. Mentre stavamo gingillandoci con la teoria, cercando di calcolare le conseguenze della teoria stessa, gli sperimentali hanno scoperto alcune cose. Per esempio, essi avevano già scoperto questo mesone µ o muone, mentre noi non sappiamo ancora dove va messo. Inoltre nei raggi cosmici fu trovato un gran numero di altre particelle «in sovrappiù». Il risultato è che oggi abbiamo circa trenta particelle ed è molto difficile capire le relazioni di tutte queste particelle e che cosa la natura richieda da loro, o quali siano i rapporti fra l’una e l’altra. Oggi non comprendiamo queste varie particelle come aspetti diversi della stessa cosa, e il fatto che abbiamo tante particelle non collegate è la dimostrazione che abbiamo molte informazioni slegate senza una teoria valida. Dopo i grandi successi dell’elettrodinamica quantistica, vi è un certo numero di cognizioni di fisica nucleare che è allo stato di conoscenza grezza, qualcosa che è per metà esperienza e per metà teoria, che presuppone un tipo di forza tra neutroni e protoni e che sta a osservare quello che accadrà, ma che non può in pratica comprendere l’origine della forza. A parte ciò, abbiamo fatto pochissimi progressi. Abbiamo raccolto un numero enorme di elementi TABELLA 2.2 Particelle elementari. chimici. Nel caso della chimica comparve all’improvCarica viso fra questi elementi una relazione inaspettata, che Massa (MeV) è contenuta nella tavola periodica di Mendeleev. Per –e 0 esempio il sodio e il potassio hanno circa le stesse 1400 proprietà chimiche e si trovano nella stessa colonna della tavola di Mendeleev. Abbiamo cercato di costruire, per le nuove parti1319 1300 1311 celle, una tavola simile a quella di Mendeleev. Una tavola simile è stata elaborata separatamente da Gell1200 Mann negli Stati Uniti e da Nishijima in Giappone. 1196 1191 La base della loro classificazione è un nuovo numero, come la carica elettrica, che può essere assegnato 1100 1115 a ciascuna particella, chiamato «stranezza», S. Questo numero si conserva, come la carica elettrica, in 1000 reazioni che hanno luogo tramite forze nucleari. n Nella TABELLA 2.2 sono elencate tutte le particelle. 939 900 Non possiamo discuterle molto in questo momento, ma la tabella vi mostrerà almeno quante cose non sappiamo. Sotto ciascuna particella è indicata la massa 800 in una unità di misura chiamata MeV: 1 MeV è pari a 1,783·10 27 grammi. Il motivo per cui fu scelta questa 700 unità è storico e per il momento non ci occuperemo di ciò. Le particelle di massa più elevata sono poste 600 più in alto nella tabella; vediamo che un neutrone e un protone hanno quasi la stessa massa. Nelle colonne abbiamo sistemato le particelle con uguale carica elet500 498 494 trica; nella colonna centrale sono elencate le particelle neutre, nella colonna a destra ci sono quelle che hanno 400 carica positiva, mentre a sinistra ci sono quelle con carica negativa. Le particelle sono indicate con una linea 300 continua e le «risonanze» con una linea tratteggiata. Dalla tabella sono state omesse parecchie particelle, tra le quali le importanti particelle di massa zero 200 e carica zero, il fotone e il gravitone, i quali non entrano nello schema di classificazione barione-mesone139,6 135,0 100 leptone, e pure alcune delle risonanze più recenti (K*, 105,6 ', ⌘). Le antiparticelle dei mesoni sono elencate nella e– tabella, ma quelle dei leptoni e dei barioni dovrebbero 0 0,51 0 essere elencate in un’altra tabella che avrebbe esatta-

19

S=0

S=0 S=0

494

139,6

S = ±1

S=0

LEPTONI

MESONI

© 978-8808-22107-0

20

Capitolo 2 • Fondamenti della fisica

© 978-8808-22107-0

mente lo stesso aspetto di questa, riflessa rispetto alla colonna di carica zero. Anche se tutte le particelle, a eccezione di elettrone, neutrino, fotone, gravitone e protone, sono instabili, i prodotti di decadimento sono stati indicati solo per le risonanze. Le assegnazioni di stranezza non si possono applicare ai leptoni, dal momento che essi non interagiscono fortemente con i nuclei. Tutte le particelle che si trovano insieme ai neutroni e ai protoni sono dette barioni, e sono le seguenti: vi è una «lambda», con una massa di 1115 MeV, e altre tre, chiamate «sigma», positiva, neutra e negativa, con masse quasi identiche. Vi sono gruppi o multipletti con quasi la stessa massa entro l’uno o il due per cento. Ciascuna particella di un multipletto ha la medesima stranezza. Il primo multipletto è il doppietto protone-neutrone, poi vi è un singoletto (la lambda), quindi il tripletto sigma e infine il doppietto «xi». Recentemente, nel 1961, sono state scoperte altre particelle. Ma sono poi particelle? Esse vivono per un tempo così breve, disintegrandosi quasi instantaneamente, appena formate, che non sappiamo se debbano essere considerate come nuove particelle oppure come un qualche genere di interazione di «risonanza» di una certa energia definita fra i prodotti ⇤ e ⇡ in cui esse si disintegrano. Le altre particelle interessate nell’interazione nucleare, in aggiunta ai barioni, sono chiamate mesoni. Prima ci sono i pioni, che si presentano in tre varietà, positiva, negativa e neutra; essi formano un altro multipletto. Abbiamo anche scoperto nuove particelle chiamate mesoni K, i quali si presentano come un doppietto K+ e K0 . Inoltre ogni particella ha la propria antiparticella, a meno che una particella non sia anche l’antiparticella di se stessa. Per esempio, ⇡ e ⇡+ sono antiparticelle, ma ⇡0 è antiparticella di se stessa. K e K+ sono antiparticelle e anche K0 e K0 . Inoltre nel 1961 abbiamo trovato anche altri mesoni, o probabili mesoni, che si disintegrano quasi all’istante. Una cosa chiamata ! che decade in tre pioni, ha massa 780 in questa scala, e, seppure un po’ meno sicuro, un oggetto che si disintegra in due pioni. Queste particelle chiamate mesoni e barioni, e le antiparticelle dei mesoni, sono nella tabella, ma le antiparticelle dei barioni vanno poste in un’altra tabella «riflessa» rispetto alla colonna di carica zero. Proprio come la tavola di Mendeleev era ottima a eccezione del fatto che vi era un certo numero di elementi, appartenenti alle terre rare, che ne restavano fuori, così abbiamo un certo numero di cose che rimangono fuori da questa tavola: particelle che non interagiscono fortemente nei nuclei, non hanno a che fare con un’interazione nucleare e non hanno una forte interazione (intendo il tipo di interazione forte dell’energia nucleare). Esse sono denominate leptoni e sono le seguenti: vi è l’elettrone che ha, in questa scala, una massa piccolissima, soltanto 0,510 MeV. Poi vi è il mesone µ, il muone, che ha una massa molto maggiore, 206 volte quella di un elettrone. Per quanto se ne può dire, a giudicare dagli esperimenti fatti finora, la differenza tra l’elettrone e il muone non consiste in altro che nella massa. Tutto funziona esattamente alla stessa maniera nel muone e nell’elettrone, eccetto che l’uno è più pesante dell’altro. Perché ce n’è uno più pesante? A che scopo? Non lo sappiamo. Inoltre esiste un leptone neutro, chiamato neutrino, che ha massa zero. In effetti, ora si sa che esistono due diverse specie di neutrini, uno legato agli elettroni e l’altro ai muoni. Infine abbiamo altre due particelle che non interagiscono fortemente con quelle nucleari: una è il fotone e forse, se anche il campo gravitazionale ha un analogo nella meccanica quantistica (una teoria quantistica della gravitazione non è stata ancora elaborata), ci sarà anche una particella, il gravitone, che avrà massa zero. Cos’è questa «massa zero»? Le masse qui indicate sono quelle delle particelle a riposo. Il fatto che una particella abbia massa zero significa, in un certo senso, che non può essere a riposo. Un fotone non è mai a riposo, ma si muove sempre a 300 000 km/s. Comprenderemo meglio cosa significa massa quando parleremo della teoria della relatività, il che avverrà a tempo debito. Ci troviamo, dunque, di fronte a un gran numero di particelle, le quali, nel loro insieme, appaiono come componenti fondamentali della materia. Fortunatamente queste particelle non sono tutte diverse nelle loro mutue interazioni. Infatti fra le particelle pare vi siano appena quattro tipi d’interazione, che in ordine di forza decrescente sono la forza nucleare, le interazioni elettriche, l’interazione del decadimento beta e la gravità. Il fotone si accoppia a tutte le particelle cariche e la forza dell’interazione è misurata da un certo numero, che è 1/137. La legge particolareggiata di questo accoppiamento è conosciuta, essa è l’elettrodinamica quantistica. La gravità è accoppiata a ogni tipo di energia, ma il suo accoppiamento è estremamente debole, molto più debole di quello dell’elettricità. Anche questa legge è nota. Poi vi sono i cosiddetti decadimenti deboli – il

2.4 • Nuclei e particelle

© 978-8808-22107-0

TABELLA

2.3

Interazioni elementari.

Accoppiamento Fotone con particelle cariche

Forza (*) 10–2 –40

Legge Legge nota

Gravità con ogni tipo di energia

10

Legge nota

Decadimenti deboli

10–5

Legge parzialmente nota

Mesoni con barioni

1

Legge sconosciuta (alcune regole note)

( )

* La «forza» è una misura adimensionale della costante di accoppiamento relativa a ciascuna interazione ( significa «dell’ordine di»).

decadimento beta, per esempio, il quale fa sì che il neutrone si disintegri, relativamente adagio, in protone, elettrone e neutrino. Questa legge è solo parzialmente nota. La cosiddetta interazione forte, interazione mesone-barione, ha una forza pari a 1 in questa scala e la legge è del tutto sconosciuta, benché vi sia un certo numero di regole note, come quella per cui, in qualsiasi reazione, il numero dei barioni non cambia (TABELLA 2.3). Questa è pertanto la sconcertante condizione della fisica di oggi. Per riassumerla, direi questo: all’esterno del nucleo, sembra che conosciamo tutto; internamente a esso, è valida la meccanica quantistica – non si sono trovate violazioni ai princìpi della meccanica quantistica. Diremmo che la scena su cui poniamo tutta la nostra conoscenza è quella dello spazio-tempo relativistico; la gravità è implicata nello spazio-tempo. Noi non sappiamo come ebbe inizio l’universo, e non abbiamo mai fatto esperimenti che verifichino esattamente i nostri concetti di spazio e tempo, al di sotto di una certa distanza minima, sicché sappiamo soltanto che i nostri concetti funzionano al di sopra di quella distanza. Dovremmo anche aggiungere che le regole del gioco sono i princìpi della meccanica quantistica, e che quei princìpi si applicano, per quanto ne possiamo dire, sia alle nuove particelle sia alle vecchie. L’origine delle forze nei nuclei ci porta a nuove particelle, ma sfortunatamente esse appaiono in gran profusione e ci manca una totale comprensione dei loro rapporti, benché sappiamo già che vi sono fra loro alcuni rapporti assai sorprendenti. Sembra che, poco per volta e brancolando, ci avviamo verso la comprensione del mondo delle particelle subatomiche, ma in realtà non sappiamo quanta strada avremo ancora da percorrere prima di raggiungere la meta.

21

3

Le relazioni della fisica con le altre scienze

3.1

Introduzione

La fisica è, fra le scienze, la più fondamentale e completa e ha avuto un profondo effetto su tutto lo sviluppo scientifico. Infatti la fisica è l’equivalente attuale di ciò che si usava definire filosofia naturale, da cui è derivata la maggior parte delle scienze moderne. Studenti di diverse discipline si trovano a studiare la fisica a causa del ruolo fondamentale che essa gioca in tutti i fenomeni. In questo capitolo cercheremo di indicare quali sono i problemi fondamentali nelle altre scienze, ma naturalmente è impossibile, in così breve spazio, trattare realmente i complessi, sottili e affascinanti argomenti di questi altri campi. La mancanza di uno spazio adeguato ci impedisce anche di discutere le relazioni della fisica con l’ingegneria, l’industria, la società e la guerra, o anche le notevoli relazioni fra matematica e fisica. (Dal nostro punto di vista la matematica non è una scienza, nel senso che non è una scienza naturale. La prova della sua validità non è l’esperimento.) Incidentalmente dobbiamo, da subito, chiarire che se una cosa non è una scienza, non è necessariamente un male. Per esempio, l’amore non è una scienza. Quindi se si afferma che qualcosa non è una scienza, ciò non implica una valutazione negativa, significa solo che non è una scienza.

3.2

La chimica

Forse la scienza che è più profondamente influenzata dalla fisica è la chimica. Storicamente, nei primi sviluppi della chimica, fu trattata quasi interamente quella che ora chiamiamo chimica inorganica, cioè la chimica delle sostanze che non sono legate con la materia vivente. Fu necessario un considerevole lavoro di analisi per scoprire l’esistenza dei numerosi elementi e le loro relazioni: come essi formano i diversi, relativamente semplici, composti trovati nelle rocce, nella terra ecc. Questa prima chimica è stata molto importante per la fisica. L’interazione fra le due scienze è stata grandissima, poiché la teoria atomica è stata convalidata in larga misura da esperimenti di chimica. La teoria della chimica, cioè quella relativa alle reazioni, è stata riassunta benissimo nella tavola periodica di Mendeleev, che ci presenta molte strane relazioni fra i vari elementi e raccoglie le leggi secondo le quali una sostanza si combina, con quale altra e in che modo; il che costituisce la chimica inorganica. Tutte queste leggi sono state successivamente spiegate in linea di principio dalla meccanica quantistica, cosicché la chimica teorica è in effetti fisica. D’altra parte, si deve sottolineare che questa spiegazione è in linea di principio. Abbiamo discusso altrove la differenza fra il conoscere le regole del gioco degli scacchi e l’essere capaci di giocare. Così che possiamo conoscere le regole, ma possiamo non giocare molto bene. Risulta assai difficile predire esattamente che cosa accadrà in una data reazione chimica; nondimeno la parte più profonda della chimica teorica deve confluire nella meccanica quantistica. Vi è anche un’altra branca della fisica e della chimica che è stata sviluppata da entrambe le scienze insieme e che è estremamente importante. È il metodo della statistica applicato a una situazione in cui vi sono leggi meccaniche, che è detto, appunto, meccanica statistica. Un gran numero di atomi sono coinvolti in ogni situazione chimica e abbiamo visto che gli atomi si

© 978-8808-22107-0

3.3 • La biologia

agitano in un modo veramente complicato e casuale. Se potessimo analizzare ogni situazione e fossimo in grado di seguire in dettaglio il moto di ogni molecola, potremmo sperare di calcolare che cosa accadrebbe, ma la quantità di numeri necessaria per mantenere traccia di tutte queste molecole supera talmente le capacità di qualsiasi calcolatore, e certamente le capacità della mente, che è stato importante sviluppare un metodo per trattare tali complicate situazioni. La meccanica statistica, dunque, è la scienza dei fenomeni del calore, o termodinamica. La chimica inorganica è, come scienza, ridotta ormai essenzialmente a ciò che si chiama chimica fisica e chimica quantistica: la chimica fisica per studiare le velocità di reazione e ciò che sta accadendo in dettaglio (Come si urtano le molecole? Quale parte se ne va per prima? ecc.), e la chimica quantistica per aiutarci a capire che cosa accade in termini di leggi fisiche. L’altra branca della chimica è la chimica organica, la chimica delle sostanze che sono associate alla materia vivente. Per un certo tempo si è creduto che queste sostanze fossero così straordinarie da non poter essere prodotte per trasformazione da materiali inorganici. Questo non è affatto vero: esse sono proprio come le sostanze della chimica inorganica, ma vi sono coinvolte più complicate sistemazioni di atomi. La chimica organica è ovviamente in strettissima relazione con la biologia, che le fornisce le sostanze, e con l’industria; inoltre, parecchia chimica fisica e meccanica quantistica può essere applicata altrettanto bene ai composti organici come agli inorganici. Però i problemi fondamentali della chimica organica non sono in questi aspetti, ma piuttosto nell’analisi e sintesi delle sostanze che si formano nei sistemi biologici, nella materia vivente. Questo porta impercettibilmente, passo dopo passo, verso la biochimica, e quindi alla biologia stessa, ossia alla biologia molecolare.

3.3

La biologia

In questo modo arriviamo alla scienza della biologia, che è lo studio della materia vivente. Nei primi tempi della biologia, i biologi ebbero a che fare con il problema puramente descrittivo di scoprire quali cose viventi esistessero, sicché essi dovevano soltanto considerare aspetti come i peli degli arti delle pulci. Dopo che questi argomenti furono trattati con un grandissimo interesse, i biologi cominciarono a studiare il meccanismo interno dei corpi viventi, prima da un punto di vista grossolano, naturalmente, a causa dell’enorme sforzo richiesto per entrare nei dettagli più sottili. Vi fu una prima interessante relazione tra fisica e biologia quando la biologia aiutò la fisica nella scoperta della conservazione dell’energia, che fu dimostrata per la prima volta da Mayer, in relazione con la quantità di calore assorbita ed emessa da una creatura vivente. Se osserviamo più da vicino i processi biologici di esseri viventi, vediamo parecchi fenomeni fisici: la circolazione del sangue, le pompe, la pressione ecc. Vi sono i nervi: sappiamo che cosa accade quando camminiamo su una pietra tagliente, e che in un qualche modo l’informazione giunge in alto partendo dalla gamba. È interessante come questo avvenga. Nel loro studio dei nervi, i biologi sono giunti alla conclusione che essi sono sottilissimi tubi con una parete complessa, anch’essa pure sottilissima; attraverso questa parete la cellula pompa ioni, cosicché vi sono ioni positivi all’esterno e ioni negativi all’interno, come in un condensatore. Ora questa membrana ha un’interessante proprietà; se essa «si scarica» in un punto, cioè se alcuni ioni sono in grado di attraversare una zona, cosicché il voltaggio risulti qui ridotto, l’influenza elettrica si fa sentire sugli ioni circostanti, e interessa la membrana in modo che anche gli ioni nei punti vicini l’attraversano. Questo a sua volta esercita un’influenza più avanti ecc.; si forma così un’onda di «penetrabilità» della membrana che viaggia lungo la fibra quando è «eccitata», a un estremo, dall’aver messo il piede su una pietra tagliente. Quest’onda è simile a una lunga sequenza di tessere di domino disposte in verticale: se la prima viene fatta cadere, questa spinge la successiva ecc. Naturalmente in questo modo verrà trasmesso soltanto un messaggio, a meno che le tessere di domino non vengano risistemate; similmente, nelle cellule nervose, vi sono processi che di nuovo pompano lentamente fuori gli ioni, per ottenere che il nervo sia pronto per un nuovo impulso. È così che sappiamo che cosa stiamo facendo (o almeno dove siamo). Naturalmente gli effetti elettrici legati a questi impulsi dei nervi possono essere raccolti da appositi strumenti e, poiché vi sono

23

24

Capitolo 3 • Le relazioni della fisica con le altre scienze

© 978-8808-22107-0

effetti elettrici, ovviamente la fisica degli effetti elettrici ha avuto una grandissima influenza sulla comprensione del fenomeno. L’effetto opposto è che, da qualche punto nel cervello, un messaggio è inviato lungo un nervo. Che cosa accade alla fine del nervo? Là il nervo si suddivide in ramificazioni connesse a una struttura vicina a un muscolo, detta placca motrice. Per ragioni che non sono esattamente comprese, quando l’impulso raggiunge la fine del nervo, piccole quantità di una sostanza chimica detta acetilcolina sfrecciano via (cinque o dieci molecole alla volta) e interessano la fibra muscolare, facendola contrarre: semplice! Che cosa fa contrarre un muscolo? Un muscolo è costituito da un gran numero di fibre strette insieme, contenenti due differenti sostanze, miosina e actomiosina, ma il meccanismo mediante il quale la reazione chimica causata dall’acetilcolina può modificare le dimensioni della molecola non è ancora conosciuto. Quindi i processi fondamentali del muscolo che producono movimenti meccanici non sono conosciuti. La biologia è un campo talmente esteso che vi è una moltitudine di altri problemi che non possiamo non ricordare: problemi di come funzioni la visione (che cosa fa la luce nell’occhio), come funzioni l’udito ecc. (Il modo in cui funziona il pensiero lo discuteremo in seguito, nella psicologia.) Ora, questi meccanismi biologici che abbiamo discusso non sono, dal punto di vista biologico, realmente fondamentali all’essenza della vita, nel senso che, anche se li avessimo capiti, non saremmo in grado di capire la vita stessa. Per intenderci, gli uomini che studiano i nervi sentono il loro lavoro molto importante, poiché dopo tutto non si possono avere animali senza nervi. Ma si può avere vita senza nervi. Le piante non hanno né nervi né muscoli, ma esse lavorano e sono comunque vive. Così, per i problemi fondamentali della biologia, dobbiamo guardare più profondamente; quando lo facciamo scopriamo che tutte le forme viventi hanno parecchie caratteristiche in comune. L’aspetto più comune è che sono costituite da cellule, entro ciascuna delle quali vi è un complesso meccanismo di elaborazione chimica. Nelle cellule delle piante, per esempio, vi è un meccanismo per assorbire la luce e generare saccarosio, che è consumato nel buio per mantenere in vita la pianta. Quando la pianta viene mangiata il saccarosio stesso genera nell’animale una serie di reazioni chimiche strettissimamente legate alla fotosintesi delle piante (e al suo effetto opposto nel buio). Nelle cellule dei sistemi viventi vi sono molte sofisticate reazioni chimiche, in cui un composto si trasforma in un altro e in un altro ancora. Per dare un’idea degli enormi sforzi che sono stati fatti nello studio della biochimica, lo schema di FIGURA 3.1 riassume le nostre conoscenze soltanto su una piccola parte delle numerose serie di reazioni che si svolgono nelle cellule, forse l’uno per cento di esse. Qui vediamo un’intera serie di molecole che variano dall’una all’altra in una sequenza o in un ciclo di passi piuttosto piccoli. Questo è detto ciclo di Krebs, il ciclo respiratorio. Ognuna delle reazioni chimiche e ognuno dei passi è abbastanza semplice, nei termini della variazione che avviene nella molecola, ma – e questa è una scoperta di grande importanza in biochimica – queste variazioni sono relativamente difficili da realizzare in laboratorio. Se abbiamo una sostanza e un’altra molto simile, la prima non si trasforma affatto nell’altra, perché le due forme sono comunemente separate da una barriera di energia o «colle». Consideriamo questa analogia: se avessimo bisogno di spostare un oggetto da un posto a un altro, allo stesso livello ma dall’altra parte di un colle, potremmo spingerlo sulla cima, ma per fare questo è necessario spendere un po’ di energia. Così la maggior parte delle reazioni chimiche non avvengono perché vi si frappone quella che è chiamata energia di attivazione. Per aggiungere un atomo in più a una sostanza chimica bisogna portarlo abbastanza vicino, in modo che si abbia un qualche riordinamento; allora si attaccherà. Ma se non possiamo dargli abbastanza energia perché possa avvicinarsi sufficientemente, esso non raggiungerà lo scopo: potrà andare un po’ su per il «colle», ma poi tornerà indietro. Però se potessimo prendere letteralmente le molecole in mano e spingere e tirare gli atomi in modo da aprire un varco per infilarvi il nuovo atomo, e spingerlo dentro, avremmo trovato un altro modo, aggirando il colle, che non richiederebbe energia in più e la reazione diventerebbe facile. Ora, nelle cellule vi sono in realtà molecole molto grandi, molto maggiori di quelle di cui abbiamo descritto i cambiamenti, che in qualche complicata maniera assecondano le molecole più piccole in modo opportuno, affinché la reazione possa avvenire con facilità. Queste grandissime e complicate molecole sono dette enzimi. (Furono dapprima chiamati fermenti, poiché furono originariamente scoperti nella fermentazione dello zucchero.

3.3 • La biologia

© 978-8808-22107-0

25

Infatti alcune delle prime reazioni del ciclo furono scoperte in questa occasione.) In presenza di un enzima la reazione avverrà. Un enzima è fatto da una sostanza detta proteina. Gli enzimi sono molto grandi e complessi e ciascuno di essi è differente, dato che ciascuno è fatto per il controllo di una certa speciale reazione. Nella FIGURA 3.1 i nomi degli enzimi sono indicati per ogni reazione. (Talvolta lo stesso enzima può controllare due reazioni.) Sottolineiamo che gli enzimi stessi non sono direttamente coinvolti nella reazione. Essi non cambiano, ma semplicemente permettono a un atomo di spostarsi da un punto a un altro. Fatto questo, l’enzima è pronto a ripetere l’operazione per la molecola successiva, come una macchina in una fabbrica. Naturalmente vi deve essere una sorgente di certi atomi e un modo di eliminarne altri. Prendiamo l’idrogeno, per esempio: vi sono enzimi che hanno in sé gruppi speciali che trasportano idrogeno per tutte le reazioni chimiche. Per esempio, vi sono tre o quattro enzimi che riducono l’idrogeno, che sono usati dappertutto nel nostro ciclo in punti diversi. È interessante osservare come il meccanismo che libera dell’idrogeno in un punto, prenda tale idrogeno e lo utilizzi in qualche altro punto. La più importante caratteristica del ciclo di FIGURA 3.1 è la trasformazione da GDP a GTP (da guanosindifosfato a guanosintrifosfato) poiché una sostanza ha molta più energia dell’altra. Proprio come vi è uno «scompartimento» in certi enzimi per trasportare in giro atomi di idrogeno, vi sono speciali «scompartimenti» trasportanti energia che coinvolgono il gruppo trifosfato. Così GTP ha più energia che GDP e, se il ciclo si sta svolgendo in un verso, noi stiamo producendo molecole che hanno eccesso di energia e che possono andare ad azionare qualche altro ciclo che richiede energia, per esempio la contrazione di un muscolo. Un muscolo non si contrarrà a meno che non vi sia GTP. Possiamo prendere fibre muscolari, metterle in acqua, aggiungere GTP e le fibre si contraggono, trasformando GTP in GDP se sono presenti i giusti enzimi. Così il sistema fondamentale consiste nella trasformazione GDP-GTP; nel buio il GTP che è stato immagazzinato durante il giorno è usato per compiere l’intero ciclo in verso opposto. Un enzima, vedete, non si occupa del verso della reazione, perché se lo facesse violerebbe una delle leggi della fisica. La fisica è di grande importanza nella biologia e nelle altre scienze anche per un’altra ragione, che ha a che fare con le tecniche sperimentali. In effetti, se non vi fosse stato il grande sviluppo della fisica sperimentale, oggigiorno questi cicli biochimici non sarebbero conosciuti. La ragione

Acetilcoenzima A –

COO Citrogenasi CH2 C=O CoA-SH COO– Ossalacetato

ica al

-m

PN

iD

as

Fumarasi

COO– H–C C–H COO–

en

H2 O

DPNH + H+

g ro

id

De

COO– CH2 DPN+ H–C–OH – COO L-Malato

CH2–COO– HO–C–COO– CH2–COO– Citrato Aconitasi

H 2O CH2–COO– C–COO– CH–COO– cis-Aconitato

Aconitasi

H2O

CH2–COO– CH–COO– Ciclo dell’acido citrico HO–CH–COO– Fumarato d-Isocitrato TPN+ Deidrogenasi isocitrica Fe++ flavina H2 Deidrogenasi succinica TPNH + H+ COO– De CH2–COO– Fe++ flavina idr CH2 CH–COO– og Succinato en as CH2 O=C–COO– i is Ossalsuccinato oc COO– Mg++ itr CoA–SH ica GTP Deidrogenasi Mn++ P (ITP) COO– – -chetoglutarica CO2 COO CH2 S CH2 HOPO3–– GDP ThPP, LA CH 2 S CH2 (IDP) C=O O=C–S–CoA – CO2 COO Succinilcoenzima A + + -Chetoglutarato DPNH + H DPN

FIGURA

Krebs.

3.1

Il ciclo di

26

Capitolo 3 • Le relazioni della fisica con le altre scienze

© 978-8808-22107-0

è che il metodo più usato per analizzare questi sistemi eccezionalmente complessi consiste nel contrassegnare gli atomi che sono usati nelle reazioni. Così se potessimo introdurre nel ciclo un po’ di anidride carbonica con un «contrassegno verde»; quindi misurassimo dopo tre secondi dov’è il segno verde, e ancora dopo dieci secondi ecc., potremmo seguire il corso delle reazioni. Che cosa sono i «contrassegni verdi»? Sono isotopi diversi. Ricordiamo che le proprietà chimiche degli atomi sono determinate dal numero di elettroni, non dalla massa del nucleo. Ma vi possono essere, per esempio nel carbonio, sei neutroni o sette neutroni insieme ai sei protoni che tutti i nuclei di carbonio hanno. Chimicamente i due atomi C12 e C13 sono la stessa cosa, ma differiscono in peso e hanno diverse proprietà nucleari, e quindi sono distinguibili. Usando questi isotopi di diversi pesi o anche isotopi radioattivi quali il C14 , che forniscono mezzi più sensibili per seguire le tracce di quantità molto piccole, è possibile seguire le reazioni. Ora torniamo alla descrizione di enzimi e proteine. Non tutte le proteine sono enzimi, ma tutti gli enzimi sono proteine. Vi sono parecchie proteine, come le proteine muscolari e le proteine strutturali – queste ultime sono, per esempio, nella cartilagine, nei capelli, nella pelle ecc. – che non sono degli enzimi. Però le proteine sono una sostanza molto caratteristica della materia vivente: innanzitutto costituiscono tutti gli enzimi e, in secondo luogo, costituiscono la maggior parte di tutta la materia vivente. Le proteine hanno una struttura molto interessante e semplice. Sono una serie, o una catena, di diversi amminoacidi. Vi sono 20 differenti amminoacidi, ciascuno dei quali può combinarsi con ciascun altro per formare catene in cui la spina dorsale è CO NH ecc. Le proteine non sono altro che catene di varie unità di questi 20 amminoacidi. Ogni amminoacido probabilmente serve a qualche scopo speciale. Alcuni, per esempio, hanno un atomo di zolfo in un certo punto; quando due atomi di zolfo stanno nella stessa proteina, formano un legame, cioè legano la catena insieme in due punti formando un anello. Un altro ha atomi in più di ossigeno che lo rendono una sostanza acida, un altro ha la caratteristica di una base. Alcuni di essi hanno grossi raggruppamenti sporgenti da un lato, cosicché occupano molto spazio. Uno degli amminoacidi, la prolina, non è in realtà un amminoacido ma un imminoacido. Vi è una lieve differenza, col risultato che quando la prolina è nella catena, vi è un avvitamento nella catena. Se desiderassimo produrre una particolare proteina, daremmo queste istruzioni: mettere qui uno di questi ganci di zolfo; poi, aggiungere qualcosa per occupare spazio; poi aggiungere qualcosa per ottenere un avvitamento nella catena. In questo modo otterremo una catena complicata da osservare, agganciata insieme e avente qualche complessa struttura; questo è presumibilmente proprio il modo in cui tutti i vari enzimi sono fatti. Uno dei grandi trionfi in tempi recenti (dal 1960), è stato scoprire l’esatta configurazione spaziale atomica di certe proteine, formate da circa 56 o 60 amminoacidi. Di oltre mille atomi (quasi duemila se contiamo gli atomi di idrogeno) è stata individuata la posizione nella complessa struttura di due proteine. La prima di queste è stata l’emoglobina. Uno degli aspetti negativi di questa scoperta è che non possiamo vedere nient’altro dalla struttura, non capiamo perché funzioni in quel modo. Naturalmente questo è il prossimo problema da affrontare. Un altro problema è: come fanno gli enzimi a sapere cosa sono? Una mosca con gli occhi rossi produce una piccola mosca con gli occhi rossi, quindi l’informazione di produrre pigmenti rossi per l’intero insieme di enzimi deve essere passata da una mosca all’altra. Ciò è dovuto a una sostanza nel nucleo della cellula, non una proteina, chiamata DNA (abbreviazione di acido desossiribonucleico). Questa è la sostanza chiave che viene trasferita da una cellula all’altra (per esempio, le cellule dello sperma consistono per lo più di DNA) e porta l’informazione di come fare gli enzimi. Il DNA è il «programma». Come appare e come lavora il programma? In primo luogo il programma deve essere capace di riprodursi. In secondo luogo deve essere in grado di dare istruzioni alla proteina. Per quanto riguarda la riproduzione possiamo pensare che proceda in modo simile alla riproduzione della cellula. Le cellule diventano semplicemente più grosse e poi si dividono a metà. Sarà così anche per le molecole di DNA, che dunque diventano più grandi e poi si dividono a metà? Ogni atomo non cresce certamente per poi dividersi a metà! No, è impossibile riprodurre una molecola a meno di usare qualche modo più ingegnoso. La struttura della sostanza DNA fu studiata per molto tempo, prima chimicamente, per scoprirne la composizione, e poi con i raggi X, per trovarne la struttura spaziale. II risultato fu la seguente notevole scoperta: la molecola di DNA è una coppia di catene attorcigliate l’una

© 978-8808-22107-0

3.4 • L’astronomia

all’altra. La spina dorsale di ciascuna di queste catene, che sono analoghe alle catene di proteine ma chimicamente del tutto diverse, è una serie di O O zuccheri e di gruppi fosfato, come mostrato nella FIGURA 3.2. Ora vediamo Ribosio B:A Ribosio come la catena può contenere istruzioni, perché se noi spezzassimo la catena nel mezzo, avremmo una serie BAADC... e ogni cosa vivente potrebbe avere O O O O una serie diversa. Così, forse, in qualche modo, le istruzioni specifiche per P P la fabbricazione di proteine sono contenute nelle serie specifiche di DNA. OH HO O O Attaccati a ogni zucchero lungo l’asse, e per legare insieme le due catene, vi sono alcune coppie di legami trasversali. Però essi non sono tutti Ribosio A:B Ribosio dello stesso tipo; ve ne sono quattro tipi, detti adenina, timina, citosina e guanina, che indicheremo con A, B, C e D. L’interessante è che solo alcune O O O O coppie possono stare opposte l’una all’altra, per esempio A con B e C con P P D. Queste coppie sono poste sulle due catene in modo che esse «aderiscono OH HO O O insieme», e hanno una forte energia di interazione. Però C non aderirà ad Ribosio A:B Ribosio A, e B non aderirà a C; essi aderiranno solo in coppia, A con B e C con D. Quindi se uno è C, l’altro deve essere D ecc. Qualsiasi lettera vi sia in una O O O O catena, deve avere la sua specifica lettera complementare sull’altra catena. P P Che cosa dunque possiamo dire sulla riproduzione? Supponiamo di OH HO O O rompere questa catena in due. Come possiamo farne un’altra simile a questa? Se, nelle sostanze delle cellule, vi è un reparto di fabbricazione in Ribosio D:C Ribosio grado di produrre fosfato, zucchero e unità A, B, C, D, non sistemate in una O O catena, le sole che si legheranno alla nostra catena divisa saranno le unità O O giuste, i complementi di BAADC... , vale a dire, ABBCD... Così quello che P P accade è che la catena si spezza a metà durante la divisione della cellula, OH HO O O una metà in definitiva per andare con una cellula, l’altra metà per finire Ribosio D:C Ribosio nell’altra cellula; una volta separate, una nuova catena complementare si forma per ciascuna mezza catena. O O Viene poi il problema: qual è il modo preciso in cui l’ordine delle unità A, B, C, D determina la sistemazione degli amminoacidi nella proteina? Questo è il problema fondamentale non risolto nella biologia odierna. I FIGURA 3.2 Struttura schematica del DNA. primi indizi sono però questi: vi sono nelle cellule minuscole particelle dette ribosomi, e si è scoperto che quello è il posto in cui si formano le proteine. Ma i ribosomi non sono nel nucleo, dove è il DNA con le sue istruzioni. Questo sembra una difficoltà. Però si sa anche che piccole parti di molecola escono dal DNA, non tanto grandi quanto la molecola di DNA che porta tutta l’informazione stessa, ma come una piccola sezione di essa. Questa è detta RNA, ma ciò non è essenziale. È una specie di piccola copia del DNA. L’RNA, che in qualche modo porta un messaggio su quale specie di proteina debba essere prodotta, va sul ribosoma. Questo è noto. Quando il messaggio viene ricevuto, la proteina è sintetizzata nel ribosoma. Anche questo si sa. Però i dettagli di come gli amminoacidi entrano e sono sistemati in base a un codice che è contenuto nell’RNA, ancora rimangono sconosciuti. Non sappiamo come leggerlo. Anche se conoscessimo, per esempio, «l’allineamento» A, B, C, C, A non potremmo dirvi quale proteina sarà prodotta. Certamente nessun argomento o campo di studio, al giorno d’oggi, sta facendo su numerosi fronti più progressi della biologia, e se scegliessimo la più importante ipotesi fra tutte, che guida via via ogni tentativo di capire la vita, essa è che tutte le cose sono costituite da atomi, e che ogni cosa fatta dalla materia vivente può essere capita in termini di movimenti e di oscillazioni degli atomi.

3.4

L’astronomia

In questa spiegazione lampo del mondo intero dobbiamo ora volgerci all’astronomia. L’astronomia è più antica della fisica. Infatti dette l’avvio alla fisica, mostrando la bella semplicità del moto delle stelle e dei pianeti, la cui comprensione fu l’inizio della fisica.

27

28

Capitolo 3 • Le relazioni della fisica con le altre scienze

© 978-8808-22107-0

Ma la più notevole scoperta fra tutte quelle dell’astronomia è che le stelle sono fatte di atomi dello stesso tipo di quelli della Terra.(1) Come è stato ottenuto ciò? Gli atomi liberano luce che ha definite frequenze, qualcosa di simile al timbro di uno strumento musicale, che ha altezze o frequenze sonore definite. Quando ascoltiamo delle note diverse possiamo separarle, ma quando osserviamo con i nostri occhi un insieme di colori non possiamo dire le parti di cui è costituito, perché l’occhio non è in grado di distinguere, come fa l’orecchio. Però con uno spettroscopio possiamo analizzare le frequenze delle onde luminose e in questo modo possiamo vedere proprio le note emesse dagli atomi nelle varie stelle. In realtà due elementi chimici sono stati scoperti prima su una stella poi sulla Terra. L’elio fu scoperto sul Sole, da cui il nome, e il tecnezio fu scoperto in certe stelle fredde. Questo ci permette naturalmente di fare progressi nella comprensione delle stelle, dato che sono costituite dalla stessa specie di atomi che sono sulla Terra. Ora abbiamo una conoscenza talmente elevata degli atomi, specialmente riguardo al loro comportamento nelle condizioni di alta temperatura ma a densità non molto grande, che possiamo analizzare per mezzo della meccanica statistica il comportamento della sostanza stellare. Anche se non possiamo riprodurne le condizioni sulla Terra, usando le leggi fondamentali della fisica possiamo spesso dire con precisione, o quasi, quello che accadrà. È così che la fisica aiuta l’astronomia. Per quanto strano possa sembrare, comprendiamo la distribuzione della materia all’interno del Sole molto meglio della sua distribuzione all’interno della Terra. Quello che succede all’interno di una stella è compreso meglio di quanto si potrebbe supporre dalla difficoltà del dover osservare un puntino luminoso attraverso un telescopio, dato che possiamo calcolare che cosa dovrebbero fare gli atomi nelle stelle, nella maggior parte delle circostanze. Una delle scoperte più impressionanti è stata l’origine dell’energia delle stelle, che le fa continuare ad ardere. Uno degli uomini che fecero questa scoperta era fuori con la sua ragazza la notte dopo che aveva capito che sulle stelle dovevano prodursi reazioni nucleari per farle brillare. La ragazza disse: «guarda come brillano le stelle!». Egli rispose: «Sì, e ora io sono l’unico uomo al mondo che sa perché brillano». Lei rise semplicemente di lui. Non fu impressionata dall’essere fuori con l’unico uomo che, in quel momento, sapeva perché le stelle brillino. Bene, è triste essere soli, ma questa è la situazione in questo mondo. È «l’ardere» nucleare dell’idrogeno che fornisce l’energia del Sole: l’idrogeno viene convertito in elio. Di più, in ultima analisi, la produzione dei vari elementi chimici nel centro delle stelle procede dall’idrogeno. La sostanza di cui siamo costituiti è stata «cotta» un tempo in una stella e poi eruttata. Come facciamo a saperlo? Perché vi è un indizio. La proporzione dei differenti isotopi – quanto C12 , quanto C13 ecc. – è qualcosa che non viene mai alterato da reazioni chimiche, perché le reazioni chimiche sono le stesse per entrambi. Le proporzioni sono puramente il risultato di reazioni nucleari. Osservando le proporzioni degli isotopi nel freddo, spento tizzone che siamo noi, possiamo scoprire come era la fornace in cui si formò la materia di cui siamo composti. Quella fornace era simile alle stelle, e così è estremamente probabile che i nostri elementi siano stati «prodotti» nelle stelle ed eruttati nelle esplosioni che noi chiamiamo novae e supernovae. L’astronomia è così vicina alla fisica che studieremo parecchie questioni astronomiche andando avanti.

(1) Come sto correndo in questo argomento! Che densità di contenuto in ogni affermazione di questa breve storia. «Le stelle sono fatte degli stessi atomi della Terra.» Io di solito scelgo un piccolo problema come questo per fare una lezione. I poeti dicono che la scienza distrugge la bellezza delle stelle – semplici globi di atomi di gas. Niente è «semplice». Anche io posso vedere le stelle di notte, in un deserto e sentirle. Ma vedo meno o di più? La vastità dei cieli sollecita la mia immaginazione – colpito da questo carosello il mio piccolo occhio coglie luce vecchia di un milione di anni. Una vasta struttura – di cui sono parte – forse la mia sostanza è stata eruttata da qualche stella dimenticata, come una, ora, sta eruttando lassù. O vederle con il grande occhio di Palomar, balzare via da un comune punto di partenza dove erano forse tutte insieme. Che cos’è tale struttura, o il suo significato, o il suo perché? Non nuoce al mistero il saperne qualcosa. Perché la realtà è tanto più meravigliosa di quanto artista alcuno del passato immaginasse! Perché i poeti del presente non ne parlano? Che uomini sono i poeti che parlerebbero di Giove se fosse simile a un uomo, ma se egli è un’immensa sfera rotante di metano e di ammoniaca restano in silenzio?

© 978-8808-22107-0

3.5

3.6 • La psicologia

La geologia

Occupiamoci ora di quelle che chiamiamo scienze della terra o geologia. Innanzitutto la meteorologia e il tempo. Naturalmente gli strumenti della meteorologia sono strumenti fisici, e lo sviluppo della fisica sperimentale ha reso possibili questi strumenti, come abbiamo spiegato prima. Però la teoria della meteorologia non è mai stata soddisfacentemente elaborata dai fisici. «Bene», voi dite, «non c’è nient’altro che aria, e noi conosciamo le equazioni dei movimenti dell’aria». D’accordo. «Così se conosciamo la condizione dell’aria oggi, perché non possiamo calcolare la condizione dell’aria domani?» In primo luogo, non sappiamo realmente quale sia la condizione di oggi, turbinando e serpeggiando l’aria ovunque. Essa risulta molto delicata e anche instabile. Se mai avete visto l’acqua scorrere sopra una diga, e trasformarsi in un gran numero di bolle e di gocce, quando cade, capirete che cosa intendo per instabile. Conoscete la condizione dell’acqua prima che vada sullo sfioratore; essa è perfettamente piana; ma al momento di cadere, dove cominciano gli spruzzi? Che cosa determina quanto grandi dovranno essere e dove saranno? Questo non si sa, perché l’acqua è instabile. Anche una massa d’aria piana in movimento, che risale sul fianco di una montagna, si muove secondo complicati vortici e turbini. In parecchi campi troviamo questa situazione di flusso turbolento, che non siamo ancora in grado di analizzare. Abbandoniamo rapidamente il soggetto del tempo e discutiamo di geologia! Il problema fondamentale della geologia è: che cosa ha reso la Terra quello che è? I più ovvi processi sono davanti ai vostri occhi, i processi di erosione dei fiumi, i venti ecc. È abbastanza facile capire questo, ma per ogni pezzetto di erosione vi è un’uguale quantità di qualcosa d’altro che aumenta. Le montagne non sono oggi più basse, in media, di quanto siano state in passato. Devono esservi processi che formano montagne. Troverete, se studiate la geologia, che vi sono processi orogenetici e processi vulcanici, che nessuno capisce ma che costituiscono metà della geologia. Il fenomeno dei vulcani non è in realtà compreso. Che cosa produce un terremoto, in definitiva non si sa. Si sa che se qualcosa spinge qualcos’altro, questo si spezza e si allontana – questo è tutto giusto. Ma che cosa spinge e perché? Secondo la teoria vi sono, all’interno della Terra, correnti – correnti circolanti dovute alla differenza di temperatura fra l’interno e l’esterno – che nei loro moti spingono leggermente la superficie. Così, se vi sono due opposte circolazioni, prossime l’una all’altra, la materia si raccoglierà nella regione dove queste si incontrano, e creerà catene di montagne che si troveranno a disagio in condizioni di tensione e così produrranno vulcani e terremoti. Che altro sull’interno della Terra? Si sa moltissimo sulla velocità delle onde sismiche e sulla densità di distribuzione dei terremoti. Però i fisici sono stati incapaci di elaborare una buona teoria di quanto densa dovrebbe essere una sostanza alle pressioni prevedibili al centro della Terra. In altre parole, non possiamo calcolare molto bene le proprietà della materia in queste circostanze. Ce la caviamo molto meno bene con la Terra di quanto facciamo con le condizioni della materia nelle stelle. La matematica relativa sembra un po’ troppo difficile, finora, ma forse non passerà molto prima che qualcuno capisca che questo è un problema importante e lo risolva realmente. L’altro aspetto, naturalmente, è che, se anche noi conoscessimo la densità, non potremmo calcolare le correnti che circolano. Nemmeno possiamo realmente ricavare le proprietà delle rocce ad alta pressione. Non possiamo dire con quale stabilità si «distribuiscano» le rocce; tutte cose che devono essere dedotte per via sperimentale.

3.6

La psicologia

Consideriamo poi la scienza della psicologia. Incidentalmente la psicanalisi non è una scienza: è tutt’al più un processo medico, forse più simile alla stregoneria. Essa ha una teoria su che cosa causi la malattia – gruppi di differenti «spiriti» ecc. Lo stregone ha la teoria che una malattia quale la malaria sia causata da uno spirito che viene nell’aria; essa però non viene curata scuotendovi sopra un serpente, ma si cura con il chinino. Così, se foste ammalati vi consiglierei di andare dallo stregone, perché egli è l’uomo che, nella tribù, conosce meglio di tutti la malattia; d’altra parte la

29

30

Capitolo 3 • Le relazioni della fisica con le altre scienze

© 978-8808-22107-0

sua conoscenza non è scienza. La psicanalisi non è stata verificata accuratamente da esperimenti, e non vi è modo di trovare un elenco del numero dei casi in cui essa funziona, e del numero dei casi in cui non funziona ecc. Le altre branche della psicologia, che coinvolgono, per esempio, la fisiologia dei sensi – che cosa accade nell’occhio, e che cosa accade nel cervello – sono, se volete, meno interessanti. Eppure qualche piccolo ma reale progresso è stato fatto nello studio di questi fenomeni. Uno dei più interessanti problemi tecnici può o non può essere chiamato psicologia. Il problema centrale della mente o, se volete, del sistema nervoso, è questo: quando un animale impara qualche cosa, può fare qualcosa di diverso da quanto avrebbe potuto fare prima, e le sue cellule cerebrali devono pure essere cambiate, in qualche modo, se esse sono costituite da atomi. In che modo sono diverse? Non sappiamo dove guardare o che cosa cercare quando qualcosa è entrato nella memoria. Non sappiamo che cosa questo significhi o quale cambiamento vi sia nel sistema nervoso quando qualcosa viene memorizzato. Questo è un importantissimo problema che non è stato risolto. Presumendo tuttavia che la memoria sia qualcosa di materiale, il cervello è una massa talmente grande di fili e di nervi connessi fra loro che probabilmente non può essere analizzato in maniera diretta. Vi è qualcosa di simile a questo nelle macchine calcolatrici o nei calcolatori, in quanto essi hanno pure un insieme di linee e alcuni elementi analoghi, forse, alle sinapsi, o alle connessioni nervose. Questo è un interessantissimo argomento che non abbiamo il tempo di discutere oltre: le relazioni fra i calcolatori e il pensiero. Ci si deve render conto, naturalmente, che questo argomento ci dirà molto poco sulle complessità reali del comportamento umano ordinario. Tutti gli esseri umani sono tanto diversi. Passerà molto tempo prima di arrivarci. Dobbiamo partire da molto più indietro. Se potessimo scoprire come funziona un cane avremmo fatto un bel passo avanti. I cani sono più facili da capire, ma nessuno finora sa come funzionino i cani.

3.7

Come mai è andata così?

Perché la fisica possa essere utile alle altre scienze, in modo teorico, oltre che per l’invenzione di strumenti, la scienza in questione deve fornire ai fisici una descrizione dell’oggetto in linguaggio fisico. Se gli chiedono «Perché una rana salta?», il fisico non può rispondere. Se gli descrivono come è fatta una rana, gli dicono che vi sono parecchie molecole, vi sono nervi ecc., ciò è diverso. Se ci diranno, più o meno, a che cosa la Terra o le stelle sono simili, allora possiamo fare dei calcoli. Perché una teoria fisica sia di qualche utilità dobbiamo sapere dove sono situati gli atomi. Per capire la chimica dobbiamo sapere esattamente quali atomi sono presenti, diversamente non possiamo analizzarla. Questa è soltanto una limitazione, naturalmente. Vi è un altro genere di problema nelle scienze sorelle che non esiste nella fisica; possiamo chiamarlo, per mancanza di un termine migliore, la questione storica. Come mai è andata così? Se capiamo tutto della biologia, vorremo conoscere come le cose che sono sulla Terra sono arrivate a questo punto. Vi è la teoria dell’evoluzione, una parte importante della biologia. In geologia non solo vogliamo sapere come si sono formate le montagne, ma come l’intera Terra si formò all’inizio, l’origine del Sistema solare ecc. Ciò, naturalmente, ci conduce alla necessità di sapere che tipo di materia c’era nella Terra. In che modo si sono evolute le stelle? Quali erano le condizioni iniziali? Questo è il problema della storia dell’astronomia. Molto è stato scoperto attorno alla formazione delle stelle, alla formazione degli elementi di cui siamo costituiti e anche un po’ sull’origine dell’universo. Non vi è una questione storica che sia studiata nella fisica oggi. Non abbiamo problemi come: «Ecco le leggi della fisica, come hanno ottenuto tale forma?». Non immaginiamo per ora che le leggi della fisica siano in qualche modo variabili nel tempo, che nel passato fossero diverse da oggi. Naturalmente possono esserlo e nel momento in cui troviamo che lo sono, la questione storica della fisica verrà legata al resto della storia dell’universo e allora i fisici si porranno gli stessi problemi degli astronomi, dei geologi e dei biologi. Infine vi è un problema fisico che è comune a parecchi campi, che è molto antico e che non è stato risolto. Non è il problema di trovare nuove particelle fondamentali, ma qualcosa

© 978-8808-22107-0

3.7 • Come mai è andata così?

lasciato in sospeso più di un secolo tempo fa. Nessun fisico è stato in realtà capace di analizzarlo matematicamente in modo soddisfacente, a dispetto della sua importanza nelle scienze sorelle. È l’analisi dei fluidi circolanti o turbolenti. Se osserviamo l’evoluzione di una stella, giungiamo a un punto in cui possiamo dedurre che sta per iniziare la convezione, e dopo di ciò non possiamo più dedurre quello che dovrebbe accadere. Alcuni milioni di anni dopo, la stella esplode, ma non siamo in grado di darne la ragione. Non possiamo analizzare il tempo. Non conosciamo i meccanismi dei moti che dovrebbero essere all’interno della Terra. La forma più semplice del problema è di prendere un tubo che sia molto lungo e spingere l’acqua attraverso il tubo ad alta velocità. Ci domandiamo: per spingere una data quantità di acqua attraverso tale tubo, quanta pressione è necessaria? Nessuno può analizzarlo servendosi dei princìpi elementari e delle proprietà dell’acqua. Se l’acqua scorre molto lentamente o se usiamo qualcosa di vischioso come il miele, allora possiamo farlo esattamente. Lo troverete nel vostro libro di testo. Quello che in realtà non possiamo fare è analizzare realmente l’acqua fluente attraverso un tubo. Questo è il problema centrale che dovremo risolvere un giorno e che non abbiamo ancora risolto. Un poeta una volta disse: «L’intero universo è in un bicchiere di vino». Non sapremo probabilmente mai in che senso intendeva questo, perché i poeti non scrivono per essere capiti. Ma è vero che se osserviamo un bicchiere di vino abbastanza da vicino, vediamo l’intero universo. Vi sono le cose di fisica, il liquido in movimento che evapora in dipendenza dal vento e dal tempo, le riflessioni nel cristallo, e la nostra immaginazione aggiunge gli atomi. Il cristallo è una distillazione di rocce della terra, e nella sua composizione vediamo i segreti dell’età dell’universo, e l’evoluzione delle stelle. Quali strane combinazioni di elementi chimici ci sono nel vino? Come vi sono arrivate? Vi sono i fermenti, gli enzimi, i substrati e i prodotti. Nel vino troviamo una grande generalizzazione: tutta la vita è fermentazione. Nessuno può scoprire la chimica del vino senza scoprire, come ha fatto Louis Pasteur, la causa di molte malattie. Come è vivido il chiaretto, che stampa la sua esistenza nella consapevolezza di chi lo osserva! Se le nostre piccole menti, per qualche convenienza, dividono questo bicchiere di vino, questo universo, in parti – fisica, biologia, geologia, astronomia, psicologia, e così via – ricordiamo che la natura non lo sa! Così rimettiamo tutto insieme, non dimenticando a cosa esso è destinato. Lasciamo che ci dia ancora un ultimo piacere: beviamolo e dimentichiamo!

31

4

Conservazione dell’energia

4.1

Che cos’è l’energia?

In questo capitolo cominciamo uno studio più dettagliato dei diversi aspetti della fisica, avendo concluso la descrizione generale. Per illustrare le idee e il tipo di ragionamento usato in fisica teorica, esamineremo ora una delle leggi fondamentali della fisica: la conservazione dell’energia. Esiste una proprietà, o se preferite una legge, che governa tutti i fenomeni naturali conosciuti fino a oggi. Non si conosce eccezione a questa legge: essa è esatta nel limite delle nostre conoscenze. La legge è chiamata conservazione dell’energia. Essa stabilisce che vi è una certa quantità, che chiamiamo energia, che non cambia nei molteplici mutamenti subiti dalla natura. Il concetto è astratto, poiché si tratta di un principio matematico; esso afferma che esiste una quantità numerica che non cambia qualsiasi cosa accada. Non è la descrizione di un meccanismo o di un fenomeno concreto, è soltanto il fatto singolare di poter calcolare un numero e, dopo aver osservato i mutamenti capricciosi della natura, ricalcolarlo ottenendo sempre lo stesso risultato. (Qualcosa di simile al movimento di un alfiere sui quadrati rossi della scacchiera, qualunque sia il numero delle mosse – ignoriamo i dettagli – esso si trova sempre sul rosso. È una legge di questo tipo.) Trattandosi di un concetto astratto ne illustreremo il significato per analogia. Immaginiamo un bambino, per esempio «Dennis la peste», che abbia dei dadi assolutamente indistruttibili, che non possano essere suddivisi in pezzi. Ogni dado è uguale all’altro. Supponiamo che abbia 28 dadi. Sua madre lo mette con i suoi 28 dadi in una stanza, al mattino. Alla sera, essendo curiosa, conta accuratamente i dadi e scopre una legge fenomenale. Non importa che cosa Dennis abbia fatto con i dadi, questi sono sempre 28! Ciò continua per un certo numero di giorni, finché un giorno i dadi sono solo 27. Una piccola ricerca ne svela uno sotto il tappeto: la mamma deve cercare ovunque per accertarsi che il numero dei dadi non sia cambiato. Un giorno, tuttavia, il numero appare diverso: vi sono solo 26 dadi. Un’accurata indagine mostra che la finestra era aperta, e uno sguardo all’aperto permette di ritrovare gli altri due dadi. Un altro giorno, un conteggio accurato indica che vi sono ben 30 dadi! Ciò causa una notevole apprensione finché si scopre che Bruce è venuto in visita, portando con sé i suoi dadi, e ne ha lasciati alcuni a casa di Dennis. Dopo aver sistemato i dadi in più, la mamma chiude la finestra e non permette a Bruce di entrare. Tutto sta andando nel modo giusto finché una volta, contando, trova solo 25 dadi. Però nella stanza c’è una scatola, una scatola per i giocattoli, e la mamma si accinge ad aprirla, ma il bambino dice «No, non devi aprire la mia scatola!», mettendosi a strillare. Alla mamma viene impedito di aprire la scatola. Essendo estremamente curiosa, e anche ingegnosa, inventa un trucco! Sa che ogni dado pesa 3 once, così pesa la scatola quando ha sotto gli occhi tutti i 28 dadi e misura 16 once. Più tardi, desiderando controllare, pesa di nuovo la scatola, sottrae 16 once e divide per tre. Scopre così quanto segue: ! (peso della scatola) 16 once numero di + = costante (4.1) dadi visibili 3 once In seguito trova qualche discordanza, ma osservazioni accurate indicano che l’acqua sporca della vasca da bagno non è più allo stesso livello. Il bambino sta gettando dadi nell’acqua, la mamma non può vederli perché l’acqua è sporca, ma può trovare quanti dadi sono nell’acqua aggiungendo

© 978-8808-22107-0

4.2 • Energia potenziale gravitazionale

alla formula un altro termine. Poiché il livello iniziale dell’acqua era di 6 pollici e ogni dado solleva l’acqua di 1/4 di pollice, la nuova formula sarà: ! (peso della scatola) 16 once numero di + + dadi visibili 3 once (4.2) (livello dell’acqua) 6 pollici + = costante 1/4 pollice Con il graduale aumento della complessità dell’ambiente familiare, la mamma di Dennis trova tutta una serie di termini che rappresentano i modi di calcolare il numero dei dadi, che sono in posti dove le è impossibile vederli. Come risultato ottiene una formula complicata, una quantità da calcolare, che rimane sempre la stessa in ogni situazione che si presenta. Qual è l’analogia fra questo e la conservazione dell’energia? L’aspetto più importante che dobbiamo astrarre da questa immagine è che non si tratta di dadi. Aboliamo il primo termine nella (4.1) e nella (4.2) e ci troveremo a calcolare cose più o meno astratte. L’analogia è evidente nei seguenti punti. Primo: quando ci mettiamo a calcolare l’energia, talvolta una parte di essa abbandona il sistema e talvolta, invece, vi si introduce. Per verificare la conservazione dell’energia dobbiamo fare attenzione a non averne né tolta né introdotta. Secondo: l’energia ha un gran numero di forme diverse e vi è una formula per ciascuna di esse. Abbiamo l’energia gravitazionale, l’energia cinetica, l’energia termica, l’energia elastica, l’energia elettrica, l’energia chimica, l’energia radiante, l’energia nucleare e l’energia di massa. Se sommiamo le formule relative a ciascuno di questi contributi, vediamo che il totale non cambia, eccetto per quanto riguarda l’energia che entra e che esce. È importante tener presente che, nella fisica odierna, non abbiamo cognizione di ciò che è l’energia. Non abbiamo un modello che esprima l’energia come somma di termini definiti. Non è così. Tuttavia vi sono formule per calcolare alcune quantità numeriche e se le sommiamo tutte otterremo «28», sempre lo stesso numero. Si tratta di un’astrazione, in quanto non ci insegna il meccanismo o le cause delle varie formule.

4.2

Energia potenziale gravitazionale

La conservazione dell’energia può essere compresa solo se abbiamo una formula per ognuna delle sue forme. Discuterò la formula dell’energia gravitazionale vicino alla superficie terrestre, e la deriverò in un modo che non ha niente a che fare con la sua origine storica, ma è soltanto una linea di ragionamento, inventata per questa particolare lezione, che vi dimostrerà come sia possibile dedurre da pochi fatti, mediante un ragionamento serrato, una gran quantità di cose sulla natura. Si tratta di un esempio sul genere di lavoro in cui sono implicati i fisici teorici. È modellato su un ottimo argomento di Carnot sull’efficienza della macchina a vapore.(1) Consideriamo le macchine per sollevare pesi: macchine che hanno la proprietà di sollevare un peso abbassandone un altro. Facciamo inoltre un’ipotesi: non esiste niente di simile al moto perpetuo ottenibile da queste macchine solleva-pesi. (Che non esista infatti il moto perpetuo è un enunciato generale della legge di conservazione dell’energia.) Dobbiamo definire accuratamente il moto perpetuo. Cominciamo dalla leva. Se, quando abbiamo sollevato e abbassato alcuni pesi e riportato la macchina alla situazione iniziale, troviamo che il risultato netto è che abbiamo sollevato un peso, allora abbiamo realizzato una macchina a moto perpetuo, perché possiamo usare quel peso sollevato per far funzionare qualcos’altro. Ammesso che la macchina che ha eseguito il sollevamento sia tornata esattamente nella posizione iniziale e che essa sia completamente autonoma – cioè non abbia ricevuto l’energia per sollevare quel peso da una sorgente esterna – ci troviamo in una situazione simile a quella creata dai dadi di Bruce. (1) Il nostro scopo è non tanto il risultato, (4.3), che in effetti voi probabilmente conoscete già, quanto la possibilità di arrivare a esso con un ragionamento teorico.

33

34

Capitolo 4 • Conservazione dell’energia

© 978-8808-22107-0

Nella FIGURA 4.1 è mostrata una semplicissima macchina per sollevare pesi. Questa macchina solleva tre unità di peso. Mettiamo tre unità di peso su un piatto della bilancia e un’unità di peso sull’altro piatto. Però, per farla lavorare, dobbiamo togliere un piccolo peso dal piatto di sinistra. D’altra parte potremmo sollevare un’unità di peso abbassando le tre unità di peso, se bariamo un po’ togliendo un piccolo peso dall’altro piatto. FIGURA 4.1 Macchina semplice per sollevare pesi. Naturalmente constatiamo che con una leva reale dobbiamo aggiungere qualcosa dall’esterno per metterla in funzione. Trascuriamo questo, per il momento. Le macchine ideali, sebbene non esistano, non richiedono alcun intervento estraneo. Una macchina che usiamo in pratica può essere, in un certo senso, quasi reversibile: cioè se essa sarà in grado di sollevare tre unità di peso abbassando un’unità di peso, potrà d’altra parte sollevare allo stesso livello un peso quasi uguale a quello unitario abbassando gli altri tre. Immaginiamo che vi siano due classi di macchine, quelle non reversibili, che includono tutte le macchine reali, e quelle reversibili, che naturalmente non possono essere realizzate per quanto accurati possiamo essere nel progettare perni, leve ecc. Supponiamo, tuttavia, che vi sia una macchina di questo genere – una macchina reversibile – che abbassi un’unità di peso (una libbra o una qualsiasi altra unità) di uno spostamento unitario e nello stesso tempo sollevi tre unità di peso. Chiamiamo questa macchina reversibile macchina A. Supponiamo che questa particolare macchina reversibile sollevi tre unità di peso di un tratto X. Supponiamo poi di avere un’altra macchina, la macchina B, che non sia necessariamente reversibile, e che abbassi un’unità di peso di un tratto unitario, ma sollevi tre unità peso di un tratto Y . Possiamo ora provare che Y non è maggiore di X; in altre parole, è impossibile costruire una macchina che possa sollevare un peso più in alto di quanto possa essere sollevato da una macchina reversibile. Vediamo perché. Supponiamo che Y sia maggiore di X. Prendiamo un’unità di peso e abbassiamola di un tratto unitario con la macchina B, il che solleva le tre unità di peso di un tratto Y . Allora potremmo abbassare il peso da Y a X, ottenendo forza motrice gratis, e usare la macchina reversibile A, funzionante a rovescio, per abbassare tre unità di peso di un tratto X e per sollevare un’unità di peso di un tratto unitario. Questo riporterà il peso unitario alla posizione iniziale e lascerà ambedue le macchine pronte per essere usate di nuovo! Se Y fosse maggiore di X avremmo quindi un moto perpetuo che abbiamo supposto impossibile. Con queste ipotesi abbiamo dedotto che Y non è maggiore di X, cosicché di tutte le macchine che possono essere costruite, la macchina reversibile è la migliore. Possiamo anche vedere che tutte le macchine reversibili devono sollevare esattamente allo stesso livello. Supponiamo che anche B sia reversibile. L’affermazione che Y non è maggiore di X resta naturalmente valida, ma possiamo ripetere il ragionamento in un altro modo, usando le macchine nell’ordine inverso, e provare che X non è maggiore di Y . Questa è un’osservazione molto importante, poiché ci permette di analizzare l’altezza a cui macchine diverse sollevano un peso senza occuparci del meccanismo interno. Se qualcuno costruisse un’elaboratissima serie di leve capace di sollevare tre unità di peso a una certa altezza abbassando di uno spostamento unitario un’unità di peso, e se noi confrontiamo questa macchina con una leva semplice che faccia la stessa cosa e sia fondamentalmente reversibile, sappiamo subito che la prima macchina non solleverà i pesi a un’altezza maggiore della seconda ma, probabilmente, a un’altezza minore. Se quella macchina è reversibile sappiamo anche esattamente a quale altezza solleverà. Riassumendo: ogni macchina reversibile, non importa come funzioni, che abbassa di un piede una libbra, solleva sempre il peso di tre libbre a una stessa altezza X. Questa è chiaramente una legge universale di grande utilità. Il prossimo quesito sarà, naturalmente, quanto vale X? Supponiamo di avere una macchina reversibile che sollevi tre pesi a un’altezza X, abbassandone uno. Poniamo in una rastrelliera fissa tre palle, come è mostrato nella FIGURA 4.2. Una palla è messa su un supporto a un piede di altezza da terra. La macchina può sollevare tre palle, abbassandone una di uno spostamento unitario. Abbiamo fatto in modo che la piattaforma che sostiene le tre palle abbia il basamento e i due ripiani esattamente distanziati di un tratto X, e che la rastrelliera contenente le tre palle sia distanziata di X, (a). Per prima cosa facciamo rotolare le palle, orizzontalmente, dalla rastrelliera ai ripiani della piattaforma, (b), e supponiamo che ciò non comporti consumo di energia, poiché non variamo l’altezza. A questo punto entra in funzione la macchina reversibile, abbassa la palla sola fino al pavimento e solleva la piattaforma di un tratto

4.2 • Energia potenziale gravitazionale

© 978-8808-22107-0

35

4.2 Una macchina reversibile. FIGURA

3x

1 ft x (a) Inizio

(b) Carica le palle

(c) 1 lb solleva 3 lb di un tratto x

3x

1 ft x

(d) Scarica le palle

(e) Ritorna allo stato iniziale

(f) Fine

X, (c). Abbiamo sistemato ingegnosamente la rastrelliera in modo che le palle siano di nuovo allineate coi ripiani della piattaforma. Scarichiamo quindi le palle nella rastrelliera, (d); dopo aver scaricato le palle, riportiamo la macchina nella sua posizione iniziale, (e). Abbiamo così tre palle su tre supporti e una per terra. Ma la cosa strana è che, in un certo qual modo, non abbiamo sollevato affatto due di esse, poiché, dopo tutto, vi erano palle sui supporti 2 e 3 già prima. L’effetto risultante è stato di avere sollevato una palla di un tratto 3X. Ora, se 3X fosse maggiore di un piede, potremmo abbassare la palla per riportare la macchina alla condizione iniziale, (f), e potremmo far funzionare nuovamente l’apparato. Quindi 3X non può essere maggiore di un piede, perché se lo fosse realizzeremmo il moto perpetuo. Parimenti possiamo provare che un piede non può essere maggiore di 3X, facendo funzionare tutta la macchina in senso inverso, trattandosi di una macchina reversibile. Quindi 3X non è né maggiore né minore di un piede; in definitiva, con il solo ragionamento, troviamo che X = 1/3 di piede. La generalizzazione è chiara: una libbra scende di un certo tratto facendo funzionare una macchina reversibile, allora la macchina può sollevare p libbre dello stesso tratto diviso per p. Un altro modo di esprimere il risultato è che tre libbre moltiplicate per il tratto di sollevamento, che nel nostro problema era X, sono uguali a una libbra moltiplicata per il tratto di caduta, che nel nostro caso era di un piede. Se moltiplichiamo tutti i pesi per le altezze dal pavimento alle quali si trovano e, dopo aver fatto funzionare la macchina moltiplichiamo di nuovo tutti i pesi per le altezze, il risultato non cambierà. (Dobbiamo generalizzare l’esempio dal caso in cui si muoveva un solo peso a quello in cui, quando abbassiamo un peso, ne solleviamo diversi – ma questo è facile.) Chiamiamo energia potenziale gravitazionale la somma dei pesi moltiplicati per le altezze – energia che un oggetto ha, a causa della sua posizione nello spazio, relativa alla Terra. La formula dell’energia gravitazionale, finché non siamo troppo lontani dalla Terra (con l’aumentare dell’altezza diminuisce la forza) sarà *.energia potenziale+/ . gravitazionale / = (peso) · (altezza) , di un oggetto -

(4.3)

È un modo bellissimo di ragionare. L’unica difficoltà è che forse non è esatto. (Dopotutto, la natura non è obbligata a seguire i nostri ragionamenti.) Per esempio il moto perpetuo potrebbe anche essere possibile. Qualche ipotesi potrebbe essere sbagliata o qualche errore potrebbe essere stato fatto nel ragionamento, così è sempre necessaria una verifica. In effetti si trova sperimentalmente che il ragionamento è esatto. Il nome generale dell’energia che dipende dalla posizione di un oggetto relativa alla posizione di un altro oggetto è energia potenziale. In questo caso particolare, naturalmente, noi la chiamiamo energia potenziale gravitazionale. Se avessimo eseguito del lavoro contrastando forze elettriche,

Capitolo 4 • Conservazione dell’energia

36

© 978-8808-22107-0

invece di forze gravitazionali, cioè se avessimo «sollevato» cariche, allontanandole da altre cariche, con un sistema di leve, allora l’energia si chiamerebbe energia potenziale elettrica. Il principio generale è che la variazione di energia è data dalla forza moltiplicata per lo spostamento subito dalla forza, e che la variazione di energia in generale è ! ! variazione spostamento su cui = (forza) · (4.4) di energia agisce la forza Nel seguito del corso ritorneremo su molte altre specie di energia. Il principio di conservazione dell’energia è utilissimo per dedurre ciò che accade in un certo numero di circostanze. Nella scuola superiore abbiamo imparato una quantità di leggi intorno ai diversi modi di usare pulegge 1 lb e leve. Possiamo ora constatare che queste «leggi» sono tutte la stessa cosa, W e che non dovevamo imparare 75 regole per rendercene conto. Un semplice 3 5 3 5 1 lb esempio è costituito da un piano inclinato privo di attrito, rappresentato da 4 4 un triangolo i cui lati misurano 3, 4 e 5 piedi (FIGURA 4.3). Sosteniamo il peso di una libbra posto sul piano inclinato con una puleggia alla cui altra W (a) (b) estremità appendiamo un peso W . Desideriamo conoscere quanto debba pesare W per equilibrare la libbra posta sul piano. Come possiamo dedurre ciò? Se il sistema è perfettamente bilanciato, esso è reversibile, così possiaFIGURA 4.3 Un piano inclinato privo di attrito. mo muoverlo avanti e indietro e considerare la situazione seguente. Nella situazione iniziale, (a), la libbra è in basso e il peso W in alto. Quando W è sceso in modo reversibile (b), abbiamo la libbra in alto e il peso W abbassato di un tratto uguale alla lunghezza del piano inclinato, ossia di cinque piedi. Abbiamo sollevato una libbra di soli tre piedi, e abbiamo abbassato W libbre di cinque piedi. Quindi W = 3/5 di libbra. Va osservato che abbiamo dedotto questo risultato dalla conservazione dell’energia, e non per mezzo della composizione delle forze. L’abilità, però, è relativa. Questo risultato può essere dedotto in un altro modo, che è ancora più brillante, scoperto da Stevino e scritto sulla sua tomba. La FIGURA 4.4 spiega perché W debba essere 3/5 di libbra, dato che la catena non gira intorno. È evidente che la parte inferiore della catena si equilibra da se stessa, così che l’azione dei cinque pesi da un lato, deve essere bilanciata dall’azione dei tre pesi sull’altro lato, o comunque nel rapporto dei cateti. Vedete, osservando la figura, che W deve essere 3/5 di libbra. (Se otterrete un epitaffio del genere sulla vostra tomba, vuol dire che siete stati bravi.) Illustreremo ora il principio di conservazione dell’energia con un problema più complicato, il martinetto a vite mostrato nella FIGURA 4.5. Un’asta lunga 20 pollici è usata per girare la vite, che ha 10 passi per pollice. Vorremmo sapere che forza debba essere esercitata sull’asta per sollevare una tonnellata (2000 libbre). Se vogliamo sollevare la tonnellata, diciamo, di un pollice, FIGURA 4.4 L’epitaffio di dobbiamo far ruotare l’asta dieci volte. Quando ha compiuto un giro, il suo estremo, ruotando, ha Stevino. coperto approssimativamente 126 pollici. L’asta deve così percorrere 1260 pollici, e se usassimo varie pulegge ecc., solleveremmo la tonnellata con un peso incognito più piccolo W applicato all’estremità dell’asta. Così ricaviamo che W è pressappoco uguale a 1,6 libbre. Questo è un risultato della legge di conservazione dell’energia. Occupiamoci ora dell’esempio abbastanza complicato mostrato nella FIGURA 4.6. Una sbarra lunga 8 piedi è appoggiata a un’estremità. In mezzo alla sbarra c’è un peso di 60 libbre e alla distanza di due piedi dal supporto c’è un peso di 100 libbre. Quale dovrà essere lo sforzo per sostenere l’estremità della sbarra in modo che il sistema sia in equilibrio, trascurando il peso della sbarra? Supponiamo di attaccare una puleggia a un’estremità della sbarra e di appendere

1t FIGURA

4.5

Un martinetto

8'

10 passi per pollice

60

a vite.

4.6

Asta caricata sostenuta a un estremo. FIGURA

4'

20''

W

2' 100

4.4 • Altre forme di energia

© 978-8808-22107-0

37

un peso alla puleggia. Quanto dovrà pesare W per controbilanciare il tutto? Immaginiamo che il peso scenda di un tratto arbitrario: per esempio supponiamo che scenda di 4 pollici. Di quanto si solleveranno i due pesi appoggiati sulla sbarra? Il punto centrale sale di due pollici e il punto a un quarto di distanza dall’estremità fissa si solleva di un pollice. Quindi il principio che la somma delle altezze per i pesi non varia, ci insegna che il peso W per 4 pollici verso il basso, più 60 libbre per 2 pollici verso l’alto, più 100 libbre per 1 pollice verso l’alto, deve dare zero: 4W + (2)(60) + (1)(100) = 0

)

W = 55 lb

(4.5)

Quindi occorre un peso di 55 libbre per equilibrare la sbarra. In questo modo possiamo dedurre le leggi dell’«equilibrio»: la statica delle complicate strutture dei ponti e così via. Questo procedimento è chiamato principio dei lavori virtuali, perché per applicare questo ragionamento dobbiamo immaginare che la struttura si muova un po’, anche se in realtà essa non si muove o non può essere mossa. Ci immaginiamo un piccolissimo movimento per applicare il principio di conservazione dell’energia.

4.3

Energia cinetica

Per illustrare un altro tipo di energia consideriamo un pendolo (FIGURA 4.7). Se tiriamo la massa da un lato e l’abbandoniamo, essa oscilla avanti e indietro. Nel suo moto essa diminuisce in altezza andando dai lati verso il centro. Dove finisce l’energia potenziale? L’energia gravitazionale scompare quando la massa è nel punto più basso, nonostante ciò la massa proseguirà ancora verso l’alto. L’energia gravitazionale deve aver assunto un’altra forma. Evidentemente è in virtù del suo moto che la massa è in grado di salire ancora, così abbiamo la conversione dell’energia gravitazionale in un’altra forma di energia, quando la massa raggiunge il punto più basso. Dobbiamo trovare una formula per l’energia di moto. Ricordando i nostri ragionamenti intorno alle macchine reversibili, possiamo facilmente vedere che nel moto del pendolo, quando viene raggiunto il punto più basso, deve esserci una quantità di energia che gli permette di risalire a una certa altezza, e che non ha niente a che vedere col meccanismo per mezzo del quale sale e col percorso che segue nella salita. Così abbiamo un’equivalenza, qualcosa di simile a quella scritta per i dadi del bambino. Abbiamo un’altra forma per rappresentare l’energia. È facile dire di che si tratti. L’energia cinetica in basso è uguale al peso moltiplicato per l’altezza che potrebbe raggiungere in dipendenza della sua velocità: E.C. = W H. Ciò che ci occorre è una formula che ci dia l’altezza mediante una relazione che ha a che fare col moto degli oggetti. Se lanciamo qualcosa con una certa velocità, diciamo verso l’alto, questa raggiungerà una certa altezza; non sappiamo ancora quale sia, ma essa dipende dalla velocità: vi è una formula per questo. Allora per trovare la formula dell’energia cinetica per un oggetto che si muove a velocità V , dobbiamo calcolare l’altezza che raggiungerebbe e moltiplicarla per il peso. Troveremo presto che possiamo scriverla nel seguente modo: WV 2 E.C. = (4.6) 2g Naturalmente il fatto che il moto abbia energia non ha niente a che vedere col fatto che siamo in un campo gravitazionale. Non importa da cosa il moto abbia avuto origine. Questa è una formula generale valida per svariati valori della velocità. La (4.3) e la (4.6) sono entrambe formule approssimate, la prima perché non è esatta quando le altezze sono grandi, cioè quando le altezze sono tanto grandi che la gravità risulta diminuita; la seconda a causa della correzione relativistica ad alte velocità. Però quando avremo finalmente la formula esatta dell’energia, allora la legge di conservazione dell’energia sarà corretta.

4.4

Altre forme di energia

Possiamo continuare in questo modo per descrivere l’esistenza di altre forme di energia. Per prima cosa consideriamo l’energia elastica. Se tiriamo una molla verso il basso, dobbiamo compiere

FIGURA

4.7

Pendolo.

38

Capitolo 4 • Conservazione dell’energia

© 978-8808-22107-0

un lavoro, perché una volta abbassata, con essa possiamo sollevare pesi. Quindi, quando è in tensione, essa ha la possibilità di compiere lavoro. Se calcolassimo le somme dei pesi per le altezze i conti non tornerebbero: dobbiamo aggiungere qualcos’altro nel calcolo, tener conto del fatto che la molla è in tensione. Energia elastica è la formula per una molla tesa. Quant’è l’energia? Se lasciamo andare la molla, l’energia elastica, quando la molla attraversa la sua posizione d’equilibrio, si trasforma in energia cinetica, così molla ed energia cinetica di moto si alternano nelle oscillazioni attraverso stadi successivi di tensione e di compressione. (Entra anche nel processo oscillatorio una certa quantità di energia gravitazionale, ma si può fare questo esperimento «orizzontalmente» se volete.) L’oscillazione continua fino a che le perdite – Aha! Abbiamo barato fin da principio mettendo piccoli pesi per sollevare oggetti o dicendo che le macchine sono reversibili, o che vanno indefinitamente, ma alla fine constatiamo che si fermano. Dov’è l’energia quando la molla smette di oscillare? Questo ci porta a un’altra forma di energia: l’energia termica. All’interno della molla o di una leva vi sono cristalli che sono costituiti da insiemi di atomi e, usando grande cura e delicatezza nella sistemazione delle parti, possiamo far sì che al ruotare di una cosa sull’altra nessun atomo subisca scuotimenti di sorta. Ma dobbiamo essere accuratissimi. Comunemente quando qualcosa rotola, vi sono sobbalzi e ondeggiamenti a causa dell’irregolarità del materiale, e gli atomi internamente cominciano a oscillare. Così perdiamo di vista una parte di energia; dopo che il moto è rallentato troviamo che gli atomi stanno oscillando all’interno in un modo casuale e confuso. Abbiamo ancora energia cinetica, è vero, ma non associata ad alcun moto visibile. Fantasie! Come sappiamo che vi sia energia cinetica? Risulta che con termometri si può trovare che in effetti la molla o la leva sono più calde, e che vi è realmente un aumento di energia cinetica di una quantità definita. Chiamiamo energia termica questa forma di energia, ma sappiamo che in realtà non è una forma nuova, ma solo l’energia cinetica del moto interno. (Una delle difficoltà di tutti questi esperimenti con la materia, che facciamo su larga scala, è che non possiamo dimostrare realmente la conservazione dell’energia e che non possiamo in realtà costruire macchine reversibili, perché ogni volta che muoviamo un blocco di materiale, gli atomi non rimangono assolutamente indisturbati, e così un po’ di movimento entra a caso nel sistema atomico. Non possiamo vederlo, ma possiamo misurarlo coi termometri ecc.) Vi sono diverse altre forme di energia e naturalmente non possiamo descriverle con maggiori dettagli ora. Vi è l’energia elettrica, che è relativa alle attrazioni e alle repulsioni di cariche elettriche. Vi è l’energia radiante, l’energia della luce, che sappiamo essere una forma di energia elettrica, perché la luce può essere rappresentata come oscillazioni del campo elettromagnetico. Vi è l’energia chimica, l’energia che viene liberata nelle reazioni chimiche. In realtà, l’energia elastica è, fino a un certo punto, simile all’energia chimica, poiché l’energia chimica è l’energia di attrazione degli atomi, e così pure l’energia elastica. Le nostre attuali conoscenze ci indicano che l’energia chimica è costituita di due parti: energia cinetica degli elettroni all’interno degli atomi, la parte cinetica, ed energia elettrica di interazione fra elettroni e protoni, la parte elettrica. Quindi arriviamo all’energia nucleare, l’energia che è coinvolta nell’assestamento delle particelle all’interno del nucleo, e per questa energia abbiamo delle formule, ma non le leggi fondamentali. Sappiamo che non è elettrica, né gravitazionale, né puramente chimica, ma ignoriamo che cosa sia. Sembra che sia un’ulteriore forma di energia. Infine, legata alla teoria della relatività, esiste una modifica delle leggi dell’energia cinetica, per effetto della quale l’energia cinetica è associata con un’altra cosa chiamata energia di massa. Un oggetto possiede energia per il puro fatto di esistere. Se abbiamo un positrone e un elettrone in quiete senza far niente – non importa né gravità né altro – ed essi si incontrano e spariscono, si libererà una certa quantità di energia radiante, e questa quantità può essere calcolata. Tutto ciò che occorre conoscere è la massa dell’oggetto, ma non c’è dipendenza dalla natura dell’oggetto – facciamo sparire due oggetti e otteniamo una certa quantità di energia. La formula fu trovata da Einstein ed è E = mc2 . È ovvio dal nostro ragionamento che la legge di conservazione dell’energia è utilissima per analizzare fenomeni, come abbiamo illustrato in alcuni esempi, senza conoscere tutte le formule. Se avessimo le formule per ogni genere di energia potremmo analizzare come molti processi si svolgono senza entrare nei dettagli. Quindi le leggi di conservazione sono molto interessanti. Sorge naturalmente il problema di quante altre leggi di conservazione esistono in fisica. Vi

© 978-8808-22107-0

4.4 • Altre forme di energia

sono altre due leggi di conservazione che sono analoghe alla conservazione dell’energia. Una è chiamata conservazione della quantità di moto. L’altra è chiamata conservazione del momento della quantità di moto. In seguito tratteremo più a lungo questi argomenti. In ultima analisi, noi non comprendiamo in profondità le leggi di conservazione. Non comprendiamo la conservazione dell’energia. Non comprendiamo l’energia come un certo numero di piccoli agglomerati. Voi potete aver sentito dire che i fotoni sono emessi come agglomerati e che l’energia di un fotone è la costante di Planck moltiplicata per la frequenza. Ciò è esatto, ma, poiché la frequenza della luce può essere qualsiasi, non vi è una legge che dica che l’energia debba essere una certa quantità definita. A differenza dei dadi di Dennis, ogni quantità di energia è possibile, almeno secondo le nostre attuali conoscenze. Così non capiamo questa energia come qualcosa che si può contare al momento, ma soltanto come una quantità matematica, il che è una condizione astratta e piuttosto strana. Nella meccanica quantistica risulta che la conservazione dell’energia è strettamente legata a un’altra importante proprietà dell’universo, per cui le cose non dipendono dal tempo assoluto. Possiamo progettare un esperimento ed eseguirlo a un dato momento e poi ripetere lo stesso esperimento in un tempo successivo, e si comporterà esattamente nello stesso modo. Non possiamo sapere se questo sia rigorosamente esatto o no. Se supponiamo che sia esatto, e aggiungiamo i princìpi della meccanica quantistica, allora possiamo dedurre il principio di conservazione dell’energia. È una cosa piuttosto sottile e interessante e non è facile da spiegare. Le altre leggi di conservazione sono anch’esse legate allo stesso modo. Nella meccanica quantistica la conservazione della quantità di moto è associata con l’ipotesi che, dovunque si esegua l’esperimento, i risultati siano sempre gli stessi. Come l’indipendenza dallo spazio ha a che fare con la conservazione della quantità di moto, l’indipendenza dal tempo ha a che fare con la conservazione dell’energia, e infine non importa se ruotiamo l’apparato sperimentale, così l’invarianza dell’universo rispetto all’orientamento angolare è legata alla conservazione del momento della quantità di moto. Oltre queste vi sono altre tre leggi di conservazione, che sono esatte al giorno d’oggi e che sono molto più semplici da capire, perché sono del tipo dei dadi di Dennis, che possono venire contati. La prima delle tre è la conservazione della carica, che significa semplicemente che, se contate quante cariche elettriche positive avete e sottraete le cariche negative, il numero non cambia mai. Potete riuscire a liberarvi di una carica positiva per mezzo di una carica negativa, ma non potete creare un eccesso di cariche positive rispetto alle negative. Le altre due leggi sono analoghe a questa: una è chiamata la conservazione dei barioni. Esiste un certo numero di particelle strane, un neutrone o un protone ne sono esempi, che sono chiamate barioni. In una reazione qualsiasi in natura, se contiamo quanti barioni sono entrati nel processo, osserviamo che il numero dei barioni(2) che ne sono usciti sarà esattamente lo stesso. Vi è un’altra legge, la conservazione dei leptoni. Possiamo dire che il gruppo delle particelle chiamate leptoni sono: elettrone, mesone mu e neutrino. Vi è un antielettrone che è il positrone, cioè un 1 leptone. Contando il numero totale dei leptoni in una reazione, si vede che il numero iniziale e finale non cambia. Almeno per quel che ne sappiamo oggi. Queste sono le sei leggi di conservazione; tre di esse, complesse, coinvolgono spazio e tempo; le altre tre, invece, sono semplici, nel senso che vi è un qualche cosa che semplicemente va contato. Riguardo alla conservazione dell’energia, noteremo che l’energia disponibile è tutt’altra cosa: vi è un insieme di movimenti oscillatori negli atomi dell’acqua marina, poiché il mare ha una certa temperatura, ma è impossibile organizzarli in un moto definito, senza prendere energia altrove. Cioè, benché sappiamo di fatto che l’energia si conserva, non è così facile conservare energia disponibile all’utilità dell’uomo. Le leggi che governano la quantità di energia disponibile sono chiamate leggi della termodinamica e implicano un concetto chiamato entropia per i processi termodinamici irreversibili. Soffermiamoci infine sul problema di dove è possibile oggi ottenere sorgenti di energia. Le nostre forniture di energia provengono dal Sole, dalla pioggia, dal carbone, dall’uranio e dall’idrogeno. Il Sole produce la pioggia e anche il carbone, sicché entrambi sono frutto del Sole.

(2)

Contando gli antibarioni come 1 barione.

39

40

Capitolo 4 • Conservazione dell’energia

© 978-8808-22107-0

Benché l’energia si conservi, la natura non sembra interessarsi a questo. Essa libera una quantità di energia dal Sole, ma solo una parte su due miliardi cade sulla Terra. La natura possiede la conservazione dell’energia, ma non se ne cura; sperpera energia in tutte le direzioni. Abbiamo già ottenuto energia dall’uranio; possiamo anche ottenere energia dall’idrogeno, ma oggi solo in una condizione pericolosa ed esplosiva. Una volta controllata nelle reazioni termonucleari, risulta che l’energia ottenuta da 10 boccali (9,5 litri) d’acqua al secondo, equivale a tutta la potenza elettrica generata negli Stati Uniti. Con 150 galloni (570 litri) al minuto, avreste abbastanza combustibile per fornire tutta l’energia usata oggi negli Stati Uniti! Perciò sta ai fisici immaginare come liberarci dal bisogno di energia. Ciò è possibile.

Tempo e distanza

5.1

5

Il moto

In questo capitolo considereremo alcuni aspetti dei concetti di tempo e di distanza. È già stato messo in evidenza precedentemente che la fisica, come tutte le scienze, dipende dall’osservazione. Si può anche affermare che lo sviluppo delle scienze fisiche nella loro forma presente è dipeso, in gran parte, dall’accento che è stato posto sulle osservazioni quantitative. Soltanto da osservazioni quantitative si può giungere a relazioni quantitative, che sono il cuore della fisica. A molti piace far coincidere gli inizi della fisica con l’opera di Galileo, risalente a 350 anni or sono, e considerare Galileo stesso come il primo fisico. Fino a quel tempo lo studio del moto era stato una questione filosofica, basata su argomenti che si riducevano a essere oggetto di ragionamento. La maggior parte degli argomenti risaliva ad Aristotele e agli altri filosofi greci, ed era considerata come «provata». Galileo fu scettico e fece un esperimento sul moto che era sostanzialmente questo: egli fece rotolare una palla su una guida inclinata e osservò il moto (FIGURA 5.1). Egli però non si limitò a guardare; misurò quanto lontano andasse la palla in un certo tempo. Il modo di misurare una distanza era ben conosciuto molto tempo prima di Galileo, ma non vi erano sistemi accurati di misura del tempo, particolarmente dei tempi brevi. Benché egli abbia in seguito inventato orologi più soddisfacenti (non quanto quelli che conosciamo noi, però), i primi esperimenti di Galileo sul moto furono fatti usando il suo polso per definire uguali intervalli di tempo. Facciamo lo stesso anche noi. Possiamo contare i battiti del polso, mentre la palla scende lungo la «Partenza» rotaia: «uno, due, tre, quattro, cinque, sei, sette, otto,...». Preghiamo un «Uno» amico di fare un piccolo segno nel punto in cui si trova la palla a ogni D µ t2 «Due» battito del polso; possiamo dunque misurare la distanza percorsa dalla 1 2 3 «Tre» palla dal punto di partenza in uno, due, tre... intervalli di tempo uguali. 4 5 6 7 8 Galileo espose il risultato delle sue osservazioni in questo modo: se le 9 10 posizioni della palla sono segnate a 1, 2, 3, 4... unità di tempo dall’istante in cui la palla è lasciata libera, questi punti distano dal punto di partenza in proporzione ai numeri 1, 4, 9, 16,... Oggi diremmo che la distanza è FIGURA 5.1 Una palla scende su un binario inclinato. proporzionale al quadrato del tempo: D / t2 Lo studio del moto, che è fondamentale per tutta la fisica, implica le domande: «Dove? Quando?».

5.2

Il tempo

Consideriamo, anzitutto, che cosa intendiamo per tempo. Che cosa è il tempo? Sarebbe bello se potessimo trovare una buona definizione di tempo. Il dizionario Webster definisce «un tempo» come «un periodo», e quest’ultimo come «un tempo», il che non sembra essere molto utile. Forse dovremmo dire: «Il tempo è ciò che accade quando non accade nient’altro». Che pure non ci

42

Capitolo 5 • Tempo e distanza

© 978-8808-22107-0

porta molto lontano. Può darsi che vada altrettanto bene se accettiamo il fatto che il tempo è una delle cose che probabilmente non possiamo definire (nel senso di una definizione da dizionario), e diciamo allora che d’altra parte il tempo è quello che già sappiamo: è quanto aspettiamo! Ciò che importa in ogni modo non è come definiamo il tempo, ma come lo misuriamo. Un modo di misurare il tempo è di utilizzare qualcosa che accade via via di seguito, secondo fasi regolari: qualcosa di periodico. Per esempio, un giorno. I giorni sembrano passare via via di seguito. Ma quando riflettete su questo potete domandarvi: «I giorni sono periodici? Sono regolari? Tutti i giorni hanno la stessa durata?». Certamente si ha l’impressione che i giorni in estate siano più lunghi dei giorni in inverno. Naturalmente alcuni giorni invernali possono apparire spaventosamente lunghi a chi si annoia. Certamente avete udito dire talvolta: «Ma questo è stato un giorno lunghissimo!». Quello che sembra più certo, però, è che i giorni siano tutti circa uguali in media. Esiste un mezzo con cui possiamo provare che i giorni hanno la stessa durata, ogni giorno rispetto al successivo o almeno in media? Un modo è quello di fare un confronto con un altro fenomeno periodico. Vediamo come può essere fatto un confronto del genere con una clessidra. Con una clessidra possiamo creare un fenomeno periodico, se abbiamo qualcuno che resti giorno e notte a rigirarla ogni volta che l’ultimo granello di sabbia è sceso. Potremmo contare allora le inversioni della clessidra da un mattino all’altro. Troveremmo questa volta che il numero delle «ore» (cioè le inversioni della clessidra) non è lo stesso ogni «giorno». Dovremmo dubitare del Sole, della clessidra o di entrambi. Dopo aver riflettuto ci potrebbe accadere di contare le «ore» da mezzogiorno a mezzogiorno. (Il mezzogiorno è qui definito non come le 12:00 dell’orologio, ma come l’istante in cui il Sole è al punto più alto.) Troveremmo questa volta che il numero delle «ore» è lo stesso ogni giorno. Adesso abbiamo fiducia che «ora» e «giorno» abbiano entrambi una periodicità regolare, cioè indichino successivi e uguali intervalli di tempo, sebbene non abbiamo provato che l’uno e l’altro siano realmente periodici. Qualcuno può chiedersi se non vi possa essere qualche entità onnipotente che rallenti lo scorrere della sabbia durante la notte e l’affretti durante il giorno. Il nostro esperimento non dà naturalmente risposta a simili quesiti. Tutto quello che possiamo dire è che troviamo una regolarità di un certo genere che si accorda con una regolarità di un altro genere. Possiamo giusto dire che basiamo la nostra definizione di tempo sulla ripetizione di qualche evento apparentemente periodico.

5.3

Piccoli intervalli tempo

Osserviamo che nel processo di controllo sulla riproducibilità del giorno, abbiamo ottenuto un importante sottoprodotto. Abbiamo trovato il modo di misurare più accuratamente le frazioni di un giorno. Abbiamo trovato un modo di suddividere il tempo in intervalli più piccoli. Possiamo portare oltre il processo e imparare a misurare intervalli di tempo ancora più piccoli? Galileo concluse che un pendolo compie oscillazioni in intervalli uguali di tempo, fino a che l’ampiezza dell’oscillazione si mantiene piccola. Una prova fatta confrontando il numero delle oscillazioni di un pendolo in un’«ora», mostra infatti che è così. Possiamo in questo modo ottenere frazioni di ora. Se usiamo un congegno meccanico per contare le oscillazioni – e per mantenerle – abbiamo l’orologio a pendolo dei nostri nonni. Accordiamoci sul fatto che se il pendolo oscilla 3600 volte in un’ora (e se vi sono 24 di queste ore in un giorno), chiameremo «secondo» ogni periodo del pendolo. Abbiamo allora suddiviso la nostra unità di tempo iniziale in circa 105 parti. Possiamo applicare gli stessi princìpi per dividere il secondo in intervalli via via più piccoli. Non è possibile, voi lo capite, costruire un pendolo meccanico che vada veloce comunque si voglia; ora però possiamo fabbricare pendoli elettrici, chiamati oscillatori, che possono fornire un fenomeno periodico con un piccolissimo periodo di oscillazione. In questi oscillatori elettronici vi è una corrente elettrica che oscilla in maniera analoga all’oscillare della piastra del pendolo. Possiamo costruire una serie di oscillatori elettronici simili, ognuno con un periodo dieci volte più piccolo del precedente. Possiamo «calibrare» ogni oscillatore, per mezzo del precedente più

5.3 • Piccoli intervalli tempo

© 978-8808-22107-0

43

lento, contando il numero di oscillazioni che fa mentre l’altro ne compie una. Quando il periodo di oscillazione nel nostro orologio è più piccolo di una frazione di secondo, non possiamo contare le oscillazioni senza l’aiuto di qualche congegno che aumenti il nostro potere di osservazione. Un congegno del genere è l’oscilloscopio a raggi catodici, che agisce come una specie di microscopio per i tempi piccoli. Questo dispositivo disegna su uno schermo fluorescente un grafico della corrente elettrica (o della tensione) in funzione del tempo. Collegando successivamente l’oscilloscopio a due degli oscillatori – in modo che esso disegni un diagramma prima della corrente di un oscillatore, poi della corrente dell’altro – avremo due grafici simili a quelli mostrati nella FIGURA 5.2. Possiamo facilmente determinare il numero dei periodi dell’oscillatore più veloce durante un periodo dell’oscillatore più lento. Con le moderne tecniche elettroniche, sono stati costruiti oscillatori con periodi brevi, fino a 10 12 secondi, e sono stati calibrati (con metodi di confronto simili a quello che abbiamo descritto) in funzione della nostra unità campione di tempo, il secondo. Con l’invenzione e il perfezionamento del «laser», o amplificatore di luce, in questi ultimi anni è stato possibile costruire oscillatori con periodi ancora più piccoli di 10 12 secondi, ma non è stato per ora possibile calibrarli coi metodi già descritti, benché indubbiamente ciò sarà presto possibile. Intervalli di tempo inferiori a 10 12 secondi sono stati misurati, ma con una tecnica diversa. In effetti è stata usata una differente definizione di «tempo». Un modo è stato quello di osservare la distanza di due avvenimenti su un oggetto in movimento. Se, per esempio, i fari di una macchina in movimento vengono accesi e quindi spenti, possiamo ricavare quanto tempo sono stati accesi, se conosciamo le posizioni della macchina quando i fari sono stati accesi e spenti e la sua velocità. Il tempo è dato dalla lunghezza del tratto percorso a luci accese diviso per la velocità. Negli ultimi anni, proprio una tecnica del genere è stata usata per misurare la vita media dei mesoni ⇡0 . Osservando con un microscopio le sottili tracce lasciate su una emulsione fotografica su cui erano stati creati mesoni ⇡0 , si è trovato che un mesone ⇡0 (di cui si sapeva che viaggiava a una certa velocità vicina a quella della luce) copre, in media, un percorso di circa 10 7 metri prima di disintegrarsi. Quindi vive solo per circa 10 16 secondi. Si deve sottolineare che qui abbiamo usato una definizione del «tempo» alquanto differente da quella precedente. Però, finché non appaiono incongruenze nella nostra comprensione, siamo abbastanza fiduciosi che le nostre definizioni siano sufficientemente equivalenti. Allargando ulteriormente il campo delle nostre tecniche – e se è necessario delle nostre definizioni – possiamo dedurre la durata temporale di eventi fisici ancora più rapidi. Possiamo parlare del periodo di una vibrazione nucleare, della vita media delle particelle strane scoperte recentemente e ricordate nel capitolo 2. La loro intera vita occupa una frazione di tempo di soli 10 24 secondi, approssimativamente il tempo che impiega la luce (che si muove alla più alta velocità conosciuta) per attraversare il nucleo dell’idrogeno (il più piccolo oggetto conosciuto). Che altro dire intorno a tempi ancora più piccoli? Esiste il «tempo» su una scala ancora più piccola? Ha senso parlare di intervalli minori di tempo se non possiamo misurare – o forse anche concepire in maniera ragionevole – cose che accadono in un tempo più breve? Forse no. Queste sono alcune delle questioni aperte che voi potrete porvi, e alle quali potrete forse rispondere, nei prossimi venti o trenta anni.

5.2 Due immagini dello schermo di un oscilloscopio. In (a) l’oscilloscopio è collegato a un oscillatore. In (b) è collegato a un oscillatore il cui periodo è un decimo di quello dell’oscillatore precedente. FIGURA

(a)

(b)

Capitolo 5 • Tempo e distanza

44

5.4

© 978-8808-22107-0

Intervalli lunghi di tempo

Consideriamo ora intervalli di tempo più lunghi di un giorno. La misura dei tempi lunghi è facile; possiamo infatti contare i giorni: fino a quando 1 qualcuno resta a contarli. Per prima cosa troviamo che vi è un’altra periodicità naturale: l’anno, circa 365 giorni. Abbiamo anche scoperto che la natura ha in alcuni casi provveduto a registrare gli anni, con gli anelli 1/2 degli alberi o coi sedimenti dei fiumi. In alcuni casi possiamo usare questi registratori naturali del tempo per determinare il tempo che è trascorso da 1/4 qualche evento passato. 1/8 Quando, per la misura di grandi intervalli di tempo, non possiamo Tempo T 2T 3T contare gli anni, dobbiamo ricorrere ad altri sistemi di misura. Uno dei più felici è l’uso, come «orologio», di materiale radioattivo. In questo caso non FIGURA 5.3 Diminuzione della radioattività al abbiamo un fenomeno periodico come per il giorno o per il pendolo, ma un crescere del tempo. L’attività diminuisce nuovo tipo di «regolarità». Troviamo che la radioattività di un particolare di un mezzo in ogni «tempo di dimezzamento» T. campione di materiale decresce di una stessa frazione per ogni uguale e successivo aumento della sua età. Se costruiamo un diagramma della radioattività osservata in funzione del tempo (espresso in giorni), otteniamo una curva simile a quella mostrata nella FIGURA 5.3. Osserviamo che se la radioattività si riduce a 1/2 in T giorni (chiamati «tempo di dimezzamento»), allora decresce di 1/4 in altri T giorni, e così via. In un arbitrario intervallo di tempo t vi sono t/T «tempi di dimezzamento», e la frazione rimasta dopo questo tempo t è (1/2)t/T . Se sapessimo che un pezzo di materia, diciamo di legno, conteneva, quando si è formato, una quantità Intervalli di tempo A di materia radioattiva, e trovassimo con una misura Anni Secondi Esempi Vita media di diretta che ora ne contiene una quantità B, potremmo calcolare l’età dell’oggetto, t, risolvendo l’equazione ????? Radioattività

1018

Età dell’universo Età della Terra

109

1 2

U238 1015 Comparsa dell’uomo

106 1012

Età delle piramidi Ra226

103 109

Età degli Stati Uniti Vità di un uomo

H3

1 106 103 1 10–3 10–6 –9

Un giorno La luce va dal Sole alla Terra Un battito del cuore Periodo di un’onda sonora Periodo di un’onda radio

10 10–12 10–15

Luce che percorre un piede Periodo di una rotazione molecolare Periodo di una vibrazione atomica

10–18 10–21

La luce attraversa un atomo

Neutrone

Muone Mesone

Mesone

10–24

Periodo di una vibrazione nucleare La luce attraversa un nucleo ??????

±

0

Particella strana

! t/T

=

B A

Vi sono, fortunatamente, casi in cui possiamo conoscere la radioattività contenuta nell’oggetto all’epoca della sua formazione. Sappiamo, per esempio, che l’anidride carbonica, nell’aria, contiene una piccola frazione dell’isotopo radioattivo del carbonio, il C14 (mantenuta costante dall’azione dei raggi cosmici). Se misuriamo tutto il carbonio contenuto in un oggetto, sappiamo che una certa frazione di tale quantità era originariamente C14 radioattivo; conosciamo, quindi, la quantità iniziale A da introdurre nella formula precedente. Il C14 ha un tempo di dimezzamento pari a 5000 anni. Con misure accurate possiamo trovare la quantità residua fino a 20 tempi di dimezzamento e possiamo quindi «datare» oggetti organici fino a 100 000 anni di età. Vorremmo conoscere, e pensiamo di conoscere, la vita di oggetti ancora più antichi. Molte delle nostre cognizioni sono basate su misure di altri isotopi radioattivi che hanno tempi di dimezzamento diversi. Se usiamo per le misure un isotopo con un tempo di dimezzamento più lungo, allora abbiamo la possibilità di misurare tempi più lunghi. L’uranio, per esempio, ha un isotopo il cui tempo di dimezzamento è di circa

© 978-8808-22107-0

5.5 • Unità e campioni di tempo

109 anni, cosicché se alcuni materiali si sono formati con uranio conglobato 109 anni fa, oggi sarà rimasta solo una metà dell’uranio. L’uranio, quando si disintegra, si muta in piombo. Consideriamo un pezzo di roccia formatasi molto tempo fa durante un qualche processo chimico. Il piombo, avendo natura chimica diversa dall’uranio, apparirebbe in una parte della roccia e l’uranio in un’altra parte: uranio e piombo sarebbero separati. Se osserviamo oggi la parte di roccia dove inizialmente c’era solo uranio, troveremo una certa frazione di uranio e una certa frazione di piombo. Confrontando queste frazioni possiamo dedurre quale percentuale di uranio è scomparsa trasformandosi in piombo. Con questo metodo è stato determinato che l’età di alcune rocce risale a diversi miliardi di anni. Un’estensione di questo metodo, non sfruttando rocce particolari, ma osservando soltanto l’uranio e il piombo contenuti negli oceani e utilizzando valori mediati su tutta la Terra, è stata usata per determinare (negli ultimi anni) che l’età della Terra stessa è approssimativamente 4,5 miliardi di anni. È incoraggiante il fatto che l’età della Terra sia la stessa dell’età dei meteoriti che cadono su di essa, anche questa calcolata col metodo dell’uranio. Risulta che la Terra si formò da rocce fluttuanti nello spazio e che i meteoriti sono, verosimilmente, un avanzo di quel materiale. Quindi l’età dell’universo è di almeno cinque miliardi di anni. Oggi si ritiene che almeno la nostra parte dell’universo abbia avuto inizio dieci o dodici miliardi di anni fa. Non sappiamo che cosa sia accaduto prima di allora. In effetti possiamo di nuovo chiederci: ha senso il problema? Ha significato parlare di un tempo anteriore?

5.5

Unità e campioni di tempo

Abbiamo ammesso implicitamente che è conveniente partire da alcune unità di tempo, un giorno o un secondo, e riferire tutti gli altri tempi a multipli o a frazioni di queste unità. Che cosa prenderemo come campione fondamentale di tempo? Prenderemo il polso umano? Se paragoniamo i battiti del polso, troviamo che essi sembrano variare parecchio. Nel confrontare due orologi, invece, si trova che non variano così tanto. Potete allora dire: «Bene, scegliamo un orologio!». Ma l’orologio di chi? C’è una storia di un ragazzo svizzero che desiderava che tutti gli orologi della sua città suonassero mezzogiorno nello stesso istante. Così egli andò in giro cercando di convincere tutti dell’importanza di questo. Ciascuno affermò che sarebbe stata un’idea meravigliosa purché tutti gli altri orologi suonassero mezzogiorno insieme al proprio! È piuttosto difficile decidere quale orologio debba essere preso come campione. Fortunatamente tutti noi abbiamo in comune un orologio: la Terra. Per molto tempo il periodo di rotazione della Terra è stato preso come campione fondamentale di tempo. Via via che le misure sono divenute più precise, è stato trovato, però, che la rotazione della Terra non è esattamente periodica, se misurata con i migliori orologi. Questi orologi «migliori» sono quelli che abbiamo ragione di credere esatti, per il fatto che vanno d’accordo l’uno con l’altro. Crediamo oggi che, per varie ragioni, alcuni giorni siano più lunghi di altri, alcuni giorni più corti, e in media il periodo di rotazione della Terra aumenti di poco col passare dei secoli. Fino a quando, molto recentemente, non è stato trovato qualcosa di meglio del periodo di rotazione della Terra, tutti gli orologi si sono riferiti alla durata del giorno e il secondo è stato definito come 1/86 400 del giorno medio. Recentemente abbiamo fatto progressi nel campo di alcuni oscillatori naturali, che crediamo ci procurino un riferimento temporale più costante della Terra, e che sono basati su fenomeni naturali disponibili a tutti. Questi sono i cosiddetti «orologi atomici». Il loro periodo interno fondamentale è quello di una vibrazione atomica, che è molto poco sensibile alla temperatura o ad altri effetti esterni. Questi orologi segnano il tempo con una precisione di uno su 109 o meglio ancora. Negli ultimi due anni, un orologio atomico perfezionato, che sfrutta le vibrazioni dell’atomo di idrogeno, è stato progettato e costruito dal professor Norman Ramsey, presso l’Università di Harvard. Egli crede che questo orologio possa essere 100 volte ancora più preciso. Le misure ora in corso dimostreranno se questo è vero oppure no.

45

Capitolo 5 • Tempo e distanza

46

© 978-8808-22107-0

È prevedibile che, poiché è stato possibile costruire orologi molto più precisi del tempo astronomico, gli scienziati raggiungano presto un accordo per definire l’unità di tempo mediante uno degli orologi atomici campione.

5.6

Anni luce

Metri

1027 10

9

10

6

1024 1021 103 1018 1 1015 1012 109 106 103 1 10–3 10–6 10–9 10–12 10–15

Grandi distanze

Passiamo ora al problema della distanza. Quanto lontane, o quanto grandi sono le cose? Ognuno sa che un modo per misurare una distanza è partire con un’asta e contare. Oppure partire con un pollice e contare. Cominciare con un’unità e contare. Come misurare le cose più piccole? Come suddividere le distanze? Nello stesso modo usato per suddividere il tempo: prendiamo un’unità più piccola e contiamo il numero di queste unità necessario per fare un’unità maggiore. Così possiamo misurare lunghezze sempre più piccole. Ma non sempre intendiamo per distanza ciò che si ottiene contando con un metro. Sarebbe difficile misurare la distanza orizzontale fra due cime di montagne usando soltanto il metro. Abbiamo trovato con l’esperienza che la distanza può essere misurata con un altro sistema: la triangolazione. Benché questo significhi che abbiamo in realtà usato una diversa definizione di distanza, i sistemi, quando possono essere usati entrambi, vanno d’accordo l’uno con l’altro. Lo spazio è più o meno ciò che Euclide pensava che fosse, cosicché i due tipi di definizione di distanza sono concordanti. Poiché sulla Terra c’è accordo, abbiamo una certa fiducia nell’uso della triangolazione per misurare distanze ancora più grandi. Per esempio, siamo stati in grado di usare la Distanze triangolazione per misurare la quota del primo SputEsempi nik (FIGURA 5.4). Abbiamo trovato che il satellite era a ????? un’altezza di circa 5 · 105 metri. Con misure più accuLimite dell’universo rate può essere misurata con questo stesso sistema la distanza della Luna. Due telescopi posti in due diversi punti della Terra possono fornire i due angoli che ci Dalla galassia più vicina occorrono. È stato calcolato in questo modo che la Luna dista da noi 4 · 108 metri. Dal centro della nostra galassia Non possiamo fare lo stesso con il Sole, o almeno nessuno finora ci è riuscito. La precisione con cui si può mettere a fuoco un dato punto del Sole e con cui Dalla stella più vicina si possono misurare gli angoli non è tale da permetterci di misurare la distanza del Sole. Come possiamo allora misurare tale distanza? Dobbiamo trovare un’eRaggio dell’orbita di Plutone stensione dell’idea di triangolazione. Misuriamo, con osservazioni astronomiche del punto in cui essi apDal Sole paiono situati, le distanze relative di tutti i pianeti e otteniamo un’immagine del Sistema solare con le opDalla Luna portune distanze relative per ogni corpo, ma non con Quota dello Sputnik distanze assolute. È allora necessaria una misura assoluta che è stata ottenuta in diversi modi. Uno dei modi, Altezza di un pilone per antenna TV creduto fino a poco tempo fa il più preciso, era di miAltezza di un bambino surare la distanza fra la Terra ed Eros, uno dei piccoli asteroidi che passano vicino alla Terra di tanto in tanUn grano di sale to. Con la triangolazione applicata a questo piccolo oggetto si può ottenere la scala di misura necessaria. Un virus Conoscendo le distanze relative del resto del Sistema solare, possiamo trovare la distanza, per esempio, fra Raggio di un atomo Terra e Sole e fra Terra e Plutone. L’anno scorso c’è stato un grande passo avanti nelRaggio di un nucleo la nostra conoscenza sulla scala del Sistema solare. Al ?????? Jet Propulsion Laboratory è stata misurata con grande

5.6 • Grandi distanze

© 978-8808-22107-0

47

5.4 La quota di uno Sputnik è determinata mediante la triangolazione. FIGURA

Stella

5.5 La distanza delle stelle vicine può essere misurata mediante la triangolazione, usando come linea di base il diametro dell’orbita terrestre. FIGURA

2

1

Terra posizione invernale

Sole

Terra posizione estiva

L

precisione la distanza fra Terra e Venere per mezzo di una osservazione diretta radar. Questo, naturalmente, è un altro mezzo, diverso dai precedenti, per calcolare una distanza. Conosciamo la velocità di propagazione della luce (e quindi la velocità di propagazione delle onde radar), e facciamo l’ipotesi che sia la stessa in ogni punto fra Terra e Venere. Inviamo onde radio e misuriamo il tempo fino al ritorno dell’onda riflessa. Dal tempo deduciamo la distanza, conoscendo la velocità. Abbiamo in realtà un’altra definizione della misura di una distanza. Come misurare la distanza di una stella, che è molto più lontana? Fortunatamente possiamo ricorrere al metodo della triangolazione, poiché la Terra, muovendosi attorno al Sole, ci dà una lunga base per misurare gli oggetti esterni al Sistema solare. Se mettiamo a fuoco con un telescopio una stella in estate e poi in inverno, possiamo sperare di determinare gli angoli con precisione sufficiente per poter misurare la distanza della stella (FIGURA 5.5). Che fare se le stelle sono troppo lontane per usare la triangolazione? Gli astronomi sono sempre alla ricerca di nuovi sistemi per misurare le distanze. Essi hanno scoperto, per esempio, di poter stimare le dimensioni e la luminosità di una stella dal suo colore. Il colore e la luminosità di diverse stelle vicine – le cui distanze sono conosciute per mezzo della triangolazione – sono stati misurati, e si è trovato che, nella maggioranza dei casi, vi è una relazione diretta fra il colore e la luminosità intrinseca della stella. Se si misura il colore di una stella distante, si può usare la relazione colore-luminosità per determinare la luminosità intrinseca della stella. Misurando quanto appaia lucente la stella dalla Terra (o forse dovremmo dire quanto debole appaia), possiamo calcolare quanto sia lontana. (Per una data luminosità intrinseca, la luminosità apparente diminuisce col quadrato della distanza.) Una buona conferma della correttezza di questo metodo di misura delle distanze stellari è data dai risultati ottenuti per gruppi di stelle conosciute come ammassi globulari. L’immagine di uno di questi gruppi è mostrata nella FIGURA 5.6. Anche solo guardando la fotografia ci si convince che queste stelle stanno tutte insieme. Lo stesso risultato è ottenuto misurando la distanza col metodo colore-luminosità. Uno studio su diversi ammassi globulari dà un’altra informazione. Si è trovato che vi è un’alta concentrazione di tali ammassi in una certa parte del cielo, e che la maggior parte di essi si trovano circa alla stessa distanza da noi. Unendo questa informazione ai risultati di altre osservazioni, possiamo concludere che questa concentrazione di ammassi stellari segna il centro della nostra galassia. Conosciamo allora la distanza dal centro della galassia: circa 1020 metri. Conoscendo le dimensioni della nostra galassia, abbiamo una chiave per la misura di distanze ancora più grandi: le distanze di altre galassie. Nella FIGURA 5.7 è mostrata la fotografia di una galassia che ha quasi la stessa forma della nostra. Probabilmente ha anche le stesse dimensioni. (I risultati di altre osservazioni danno corpo all’idea che le galassie abbiano tutte circa la stessa estensione.) Se essa ha le dimensioni della nostra possiamo ottenere la sua distanza. Misuriamo l’angolo sotteso nel cielo; conosciamo il suo diametro e possiamo calcolare la sua distanza: ancora triangolazione! Fotografie di galassie estremamente distanti sono state ottenute recentemente col telescopio gigante di Palomar. Una è mostrata nella FIGURA 5.8. Si pensa oggi che alcune di queste galassie

48

Capitolo 5 • Tempo e distanza

5.6 Un ammasso di stelle vicino al centro della nostra galassia. La loro distanza dalla Terra è pari a 30 mila anni luce, ossia circa 3 · 1020 metri. FIGURA

© 978-8808-22107-0

5.7 Una galassia a spirale simile alla nostra. Presumendo che il suo diametro sia simile a quello della nostra galassia, possiamo stimare la sua distanza per mezzo delle sue dimensioni apparenti. Essa dista dalla Terra 30 milioni di anni luce (circa 3 · 1023 metri). FIGURA

siano circa a metà strada dal limite dell’universo (distante 1026 metri), la distanza più grande che possiamo contemplare!

5.7

Piccole distanze

Pensiamo ora alle distanze più piccole. Suddividere il metro è facile. Senza molta difficoltà possiamo tracciare mille intervalli uguali che sommati diano un metro. Con difficoltà un po’ maggiore, ma in un modo simile (usando un buon microscopio), possiamo tracciare mille suddivisioni uguali del millimetro, per ottenere una scala graduata in micron (un milionesimo di metro). È difficile continuare con scale più piccole perché non possiamo «vedere» oggetti più piccoli della lunghezza d’onda della luce visibile (circa 5 · 10 7 metri). Non è necessario che ci fermiamo, però, a quello che possiamo vedere. Con un microscopio elettronico possiamo continuare il processo facendo fotografie su scala ancora più piccola, diciamo fino a 10 8 metri (FIGURA 5.9). Con misure indirette – con una specie di triangolazione su scala microscopica – possiamo continuare su scale via via minori. Anzitutto, dall’osservazione di come la luce di piccola lunghezza d’onda (raggi X) è riflessa da un insieme di segni posti a distanza nota

5.8 L’oggetto più distante, 3C295 nella costellazione di Boote (indicato dalla freccia), misurato fino a oggi (1960), col telescopio da 200 pollici di Palomar. FIGURA

5.9 Fotografia al microscopio elettronico di alcune molecole di virus. La sfera «grande» serve per calibrare e ha un raggio di 2 · 10 7 metri (2000 Å). FIGURA

5.7 • Piccole distanze

© 978-8808-22107-0

l’uno dall’altro, determiniamo la lunghezza d’onda delle vibrazioni luminose. Quindi, dalla figura di diffusione della stessa luce, ottenuta con un cristallo, possiamo determinare la posizione relativa degli atomi nel cristallo, ottenendo risultati che si accordano con le misure degli spazi atomici determinate con sistemi chimici. Troviamo in questo modo che gli atomi hanno un diametro di circa 10 10 metri. Resta una grande «zona vuota» nella scala delle dimensioni fisiche, fra la dimensione atomica tipica di circa 10 10 metri e le dimensioni nucleari di 10 15 metri, 10 5 volte più piccole. Per le dimensioni nucleari risulta conveniente un diverso sistema di misura. Misuriamo l’area apparente, , chiamata sezione d’urto efficace. Se vogliamo il raggio possiamo ottenerlo da = ⇡r 2 , poiché i nuclei sono quasi sferici. La misura di una sezione d’urto nucleare può essere fatta mandando un fascio di particelle ad alta energia attraverso una sottile lastra di materiale e osservando il numero di particelle che non ha attraversato la lastra. Queste particelle ad alta energia attraversano in linea retta la sottile nube di elettroni e vengono fermate e deflesse solo se urtano la massa concentrata di un nucleo. Supponiamo di avere una lastra di materiale spessa 1 centimetro. Vi saranno allora circa 108 strati atomici. Ma i nuclei sono tanto piccoli che vi è una minima probabilità che un nucleo sia allineato con un altro. Possiamo immaginare che una rappresentazione estremamente ingrandita della situazione – osservata dal fascio delle particelle – si presenti come in FIGURA 5.10. La probabilità che una particella tanto piccola urti un nucleo durante l’attraversamento è data dall’area totale coperta dalle sezioni dei nuclei divisa per l’area totale della figura. Supponiamo di sapere che nell’area A della nostra lastra vi siano N atomi (ognuno con un nucleo, naturalmente). Allora l’area totale «coperta» dai nuclei è N /A. Sia n1 il numero di particelle del fascio che arriva alla lastra e n2 il numero che passa dall’altra parte. La frazione di particelle che non ha attraversato la lastra è (n1 n2 )/n1 , che sarà uguale alla frazione di area coperta dai nuclei. Possiamo quindi ottenere il raggio del nucleo con la seguente equazione(1) ⇡r 2 =

=

A n1 n2 N n1

Con un esperimento del genere troviamo che i raggi dei nuclei sono da 1 a 6 volte 10 15 metri. L’unità di lunghezza 10 15 metri è chiamata fermi, in onore di Enrico Fermi (1901-1954). Che cosa troviamo a distanze più piccole? Possiamo misurare distanze più piccole? Tali questioni non hanno tuttora una risposta. È stato suggerito che il mistero non ancora risolto delle forze nucleari possa essere spiegato soltanto modificando un poco la nostra idea di spazio, o di misura, su queste piccole distanze. Si può pensare che sarebbe una buona idea usare come unità di lunghezza alcune lunghezze naturali, diciamo il raggio della Terra o una sua frazione. Il metro era originariamente inteso come un’unità del genere e fu definito (⇡/2) · 10 7 volte il raggio della Terra. Non è né conveniente né molto esatto determinare l’unità di lunghezza in questo modo. Per lungo tempo il metro è stato definito, secondo accordi internazionali, come la distanza fra due tacche su una sbarra, conservata in uno speciale laboratorio in Francia. Più recentemente è stato constatato che questa definizione non è né precisa come sarebbe utile che fosse, né permanente e universale come piacerebbe che fosse. Attualmente si sta considerando di adottare una nuova definizione, un prefissato (arbitrario) numero di lunghezze d’onda di una determinata linea spettrale.

Le misure di spazio e di tempo danno risultati che dipendono dagli osservatori. Due osservatori che si muovono l’uno rispetto all’altro non misureranno gli stessi tempi e le stesse distanze, misurando quelle che sembrano le stesse cose. Le distanze e gli intervalli di tempo hanno diverse ampiezze, in dipendenza dal sistema di coordinate (o «sistema di riferimento») usato per fare le misure. Studieremo questo argomento con maggiori dettagli in un altro capitolo. (1) Questa equazione è giusta solo se l’area coperta dai nuclei è una piccola frazione dell’area totale, cioè se (n 1 n2 )/n1 è molto minore di 1. Altrimenti dobbiamo fare una correzione per il fatto che alcuni nuclei saranno, in parte, coperti dai nuclei davanti.

49

5.10 Come ci immagineremmo di vedere un blocco di carbone, spesso 1 centimetro, se osservassimo soltanto i nuclei. FIGURA

50

Capitolo 5 • Tempo e distanza

© 978-8808-22107-0

Misure perfettamente precise di distanza e di tempo non sono consentite dalle leggi della natura. In precedenza abbiamo accennato che gli errori di misura sulla posizione di un oggetto saranno almeno di ~ x 2 p dove ~ è una costante fisica fondamentale detta costante di Planck ridotta e p è l’errore con cui conosciamo la quantità di moto (massa per velocità) dell’oggetto di cui stiamo misurando la posizione. È stato ricordato anche che l’incertezza nelle misure di posizione è legata alla natura ondulatoria delle particelle. La relatività del tempo e dello spazio implica che anche le misure di tempo abbiano un errore minimo, dato da ~ t 2 E dove E è l’errore con cui conosciamo l’energia del processo di cui stiamo misurando la durata temporale. Se vogliamo conoscere con maggior precisione quando accadde qualcosa, dobbiamo diminuire la nostra conoscenza su ciò che è accaduto, perché la nostra conoscenza dell’energia coinvolta nel processo sarà minore. Anche l’incertezza di tempo è legata alla natura ondulatoria della materia.

6

Probabilità

6.1

Caso e probabilità

«Probabilità» è una parola usata comunemente ogni giorno. I bollettini radio sulle previsioni meteorologiche possono dire: «Vi è il sessanta per cento di probabilità che piova». Voi potete dire: «Vi è una piccola probabilità che io viva fino a cento anni». Anche gli scienziati usano il vocabolo probabilità. Un sismologo può essere interessato al seguente problema: «Qual è la probabilità che vi sia un terremoto di un certo grado nella California meridionale l’anno prossimo?». Un fisico può porsi il problema: «Qual è la probabilità che un particolare contatore Geiger registri venti conteggi nei prossimi dieci secondi?». Un politico o uno statista può interessarsi alla questione: «Qual è la probabilità che vi sia una guerra nucleare nei prossimi dieci anni?». Voi potete essere interessati alla probabilità di imparare qualcosa da questo capitolo. Per probabilità, intendiamo qualcosa di simile a una congettura. Perché facciamo congetture? Facciamo congetture quando vogliamo emettere un giudizio, ma abbiamo informazioni incomplete o conoscenze incerte. Facciamo congetture sull’essenza delle cose, o su che cosa verosimilmente potrà accadere. Spesso facciamo una congettura perché dobbiamo prendere una decisione. Per esempio: devo prendere con me l’impermeabile domani? Tenendo conto di quale movimento della terra progetterò un nuovo edificio? Dovrò costruirmi un rifugio per la pioggia radioattiva? Devo cambiare la mia posizione nei negoziati internazionali? Andrò a lezione oggi? Talvolta facciamo congetture perché desideriamo, nei limiti della nostra conoscenza, dire più che si può intorno a qualche situazione. In realtà qualsiasi generalizzazione è di natura congetturale. Ogni teoria fisica è una specie di lavoro di congetture. Vi sono buone supposizioni e ve ne sono di cattive. La teoria della probabilità è un sistema per fare supposizioni migliori. Il linguaggio della probabilità ci permette di parlare quantitativamente di qualche situazione che può essere altamente variabile, ma che ha un comportamento medio coerente. Consideriamo il lancio di una moneta. Se sia il lancio sia la moneta sono «onesti», non abbiamo modo di sapere cosa aspettarci come risultato di ogni lancio particolare. Tuttavia intuiamo che in un gran numero di lanci vi sarà un numero circa uguale di teste e di croci. Diciamo: «La probabilità che un lancio dia testa è 0,5». Parliamo di probabilità solo quando riflettiamo su azioni che saranno fatte nel futuro. Come «probabilità» di un particolare risultato di un’osservazione intendiamo la nostra stima della frazione più probabile di osservazioni ripetute che darà quel particolare risultato. Se immaginiamo di ripetere un’osservazione – come guardare il lancio di una moneta – N volte, e se chiamiamo N A la nostra stima del più probabile numero di osservazioni che darà un certo risultato A, diciamo il risultato «testa», allora con P(A), la probabilità di osservare A, intendiamo P(A) =

NA N

(6.1)

Questa definizione richiede alcuni commenti. Anzitutto, possiamo parlare di una probabilità di qualche avvenimento soltanto se il fatto è un possibile risultato di qualche osservazione che sia ripetibile. Non è chiaro se avrebbe senso chiedere: «Qual è la probabilità che vi sia un fantasma in quella casa?».

La vera logica di questo mondo è nel calcolo delle probabilità. James Clerk Maxwell

52

Capitolo 6 • Probabilità

© 978-8808-22107-0

Voi potete obiettare che nessuna situazione è esattamente ripetibile. È giusto. Ogni differente osservazione avrà almeno una diversa collocazione nel tempo o nello spazio. Tutto quello che possiamo dire è che le osservazioni ripetute dovrebbero, per i nostri scopi, apparire equivalenti. Dovremmo presumere almeno che ogni osservazione sia fatta partire da una situazione preparata in modo equivalente, e particolarmente con lo stesso grado di ignoranza iniziale. (Se sbirciamo le carte in mano al giocatore avversario, la stima sulle nostre possibilità di vittoria sarà diversa da come sarebbe se non lo facessimo!) Sottolineiamo che N e N A nell’equazione (6.1) non stanno a rappresentare numeri basati su osservazioni reali: N A è la miglior stima di ciò che sarebbe successo in N osservazioni immaginate. La probabilità dipende quindi dalla nostra conoscenza e dalla nostra abilità nel fare le stime. In effetti dal nostro buon senso! Fortunatamente vi è un certo accordo nel buon senso su un gran numero di cose, cosicché persone diverse faranno la stessa stima. Le probabilità, tuttavia, non devono essere numeri «assoluti». Dipendendo dal nostro livello di ignoranza, possono cambiare se cambia la nostra conoscenza. Forse avrete notato un altro aspetto piuttosto «soggettivo» della nostra definizione di probabilità. Abbiamo definito N A come «la stima del più probabile numero...». Con questo non intendiamo che ci aspettiamo di osservare esattamente N A, ma che ci aspettiamo un numero vicino a N A, e che il numero N A è più probabile di qualsiasi altro numero vicino. Se gettiamo una moneta, diciamo 30 volte, non ci aspetteremo in realtà che il numero di teste sia esattamente 15, ma un numero vicino al 15, diciamo 12, 13, 14, 15, 16 o 17. Tuttavia, se dobbiamo scegliere, affermeremo che 15 teste è più probabile di ogni altro numero. Scriveremo P(testa) = 0, 5. Perché abbiamo scelto 15 come più probabile di qualsiasi altro numero? Dobbiamo aver ragionato fra noi nel modo seguente: se NT è il più probabile numero di teste in un numero totale di lanci N, allora il più probabile numero di croci NC è (N NT ). (Stiamo supponendo che ogni lancio dia o testa o croce, e nessun risultato «diverso»!) Ma se la moneta non è truccata, non vi è preferenza fra testa o croce. Fino a quando non abbiamo ragione di pensare che la moneta (o il lancio) siano truccati, dobbiamo dare uguali probabilità per testa o croce. Così dobbiamo fissare NC = NT . Ne segue che NC = NT = N/2, ossia P(T) = P(C) = 0, 5. Possiamo generalizzare il nostro ragionamento a ogni situazione in cui vi siano m diversi ma «equivalenti» (cioè ugualmente verosimili) risultati possibili di un’osservazione. Se un’osservazione può produrre m diversi risultati, e non abbiamo ragione di credere che qualcuno di questi sia più probabile degli altri, allora la probabilità di un particolare risultato A è P(A) = 1/m. Se vi sono 7 palle di colori diversi in una scatola e ne prendiamo una «a caso» (cioè senza guardare), la probabilità di ottenere una palla di un colore particolare è 1/7. La probabilità che una «estrazione cieca» da un mazzo di 52 carte coperte e mischiate dia il dieci di cuori è 1/52. La probabilità di ottenere un doppio uno coi dadi è di 1/36. Nel capitolo 5 abbiamo descritto le dimensioni di un nucleo in relazione alla sua area apparente, o «sezione d’urto». Così facendo abbiamo in realtà parlato di probabilità. Quando mandiamo una particella di alta energia su una sottile lastra di materiale, vi è una certa probabilità che essa passi attraverso la lastra e una certa probabilità che colpisca un nucleo. (Poiché il nucleo è tanto piccolo che non possiamo vederlo, non possiamo mirare direttamente al nucleo. Dobbiamo «tirare alla cieca».) Se nella nostra lastra vi sono n atomi e è l’area della sezione geometrica del nucleo di ogni atomo, allora l’area totale «oscurata» coperta dai nuclei sarà n . In un gran numero N di tiri a caso, ci aspettiamo che il numero di urti NU su un qualunque nucleo stia in rapporto a N come l’area oscurata sta all’area totale della lastra: NU n = N A

(6.2)

Possiamo quindi dire che la probabilità che una particella proiettile subisca un urto passando attraverso la lastra è n PU = (6.3) A dove n/A è il numero di atomi per unità d’area nella lastra.

6.2 • Fluttuazioni

© 978-8808-22107-0

6.2

53

Fluttuazioni

Vedremo ora di usare le nostre idee sulla probabilità per considerare con x x x xxx x xx x x 11 T alcuni maggiori dettagli il problema: «Quante teste mi aspetto di ottenere xx xx x x 19 C xx x x xxxxxxxxx realmente gettando una moneta N volte?». Prima di rispondere al problema, tuttavia, osserviamo che cosa accade in un «esperimento» del genere. La T x x x x xxx x x x x 11 FIGURA 6.1 mostra i risultati ottenuti nelle prime tre esecuzioni di un tale C xxxx xxxx x x xxxx xx x xx 19 esperimento, nel quale N = 30. Le sequenze di «teste» e di «croci» sono mostrate proprio come sono state ottenute. Il primo gioco ha dato 11 teste; il T x xxx xx x xxx xx x xx x 16 C x xx x xx xx xx x x x x 14 secondo ancora 11; il terzo 16. In tre prove non abbiamo avuto neppure una volta 15 teste. Dobbiamo cominciare a sospettare della moneta? O abbiamo sbagliato a pensare che il numero più probabile di «teste» in questo gioco FIGURA 6.1 Successioni di teste e di croci osservate sia 15? Per ottenere un totale di 100 esperimenti di 30 lanci ciascuno, ne in tre giochi, ciascuno di 30 lanci. sono stati eseguiti altri 97. I risultati sono riportati nella TABELLA 6.1. Osservando i numeri nella tabella, vediamo che la maggior parte dei risultati è «vicina» al 15, nel senso che essi stanno fra il 12 e il 18. Possiamo ottenere una migliore capacità di apprezzare i dettagli di questi risultati se facciamo un diagramma della loro distribuzione. Contiamo il numero dei giochi in cui si è ottenuto il risultato k e tracciamo un segmento per ciascun k. Un diagramma di questo tipo è mostrato nella FIGURA 6.2. Un risultato di 15 teste è stato ottenuto in 13 giochi. Un risultato di 14 teste è stato pure ottenuto 13 volte. I risultati 16 e 17 sono stati ottenuti ciascuno più di 13 volte. Dobbiamo concludere che vi è qualche tendenza in favore delle teste? Che la nostra «migliore stima» non sia abbastanza buona? Dovremmo concludere che il «più probabile» risultato per una esecuzione di 30 lanci sia in realtà 16 teste? Un momento! In tutti i giochi, complessivamente, vi sono stati 3000 lanci. E il numero totale di teste ottenuto è stato 1493. La frazione di lanci che ha dato testa è 0,498, molto vicina alla metà, ma leggermente inferiore a essa. Non ne dedurremo certamente che la probabilità di ottenere testa è maggiore di 0,5! Il fatto che un particolare insieme di osservazioni abbia dato più spesso 16 teste, è una fluttuazione. Noi ci aspettiamo tuttora che il più probabile numero di teste sia 15. Possiamo chiederci: «Qual è la probabilità che un gioco di 30 lanci dia 15 teste, o 16, oppure un qualsiasi altro numero?» Abbiamo detto che nel gioco di un lancio la probabilità di ottenere testa è 0,5 e la probabilità di non ottenere testa è 0,5. In un gioco di due lanci, vi sono quattro TABELLA

6.1

Numero di teste ottenute in 100 successivi esperimenti di 30 lanci di una moneta.

11 16 17 15 17 16 19 18 15 13 11 17 17 12 20 23 11 16 17 14 16 12 15 10 18 17 13 15 14 15 16 12 11 22 12 20 12 15 16 12 16 10 15 13 14 16 15 16 13 18 14 14 13 16 15 19 21 14 12 15 16 11 16 14 17 14 11 16 17 16 19 15 14 12 18 15 14 21 11 16 17 17 12 13 14 17

9

13 19 13 14 12 15 17 14 10 17 17 12 11

15 Nk

Osservato in questo esperimento

Numero probabile 5

k 0

6.2 Sommario dei risultati di 100 giochi, ciascuno di 30 lanci. Le righe verticali indicano il numero di giochi Nk con i quali è stato ottenuto un risultato di k teste. La curva tratteggiata mostra il numero atteso di giochi col risultato k, ottenuto da un calcolo di probabilità. FIGURA

10

0

5

10

15

20

25

30

Capitolo 6 • Probabilità

54

Modi

T C

Primo lancio

1 T C T 1 C

Modi

Modi 1

1 T C 2 1

Secondo lancio

T C T C

© 978-8808-22107-0

Risultato Probabilità 3T 1/8 1

3

2T

3/8 1

3 1

1T 0T

3/8 1/8

Terzo lancio

6.3 Diagramma che mostra il numero di modi in cui si può ottenere un risultato di 0, 1, 2 o 3 teste, in un gioco di 3 lanci. FIGURA

1

1 2 1

1 3 3 1

4 6 4 1

1 5 10 10 5 1

1

Risultato 6

6

5

15

4

20

3

15

2

6

1

1

0

6.4 Diagramma simile a quello di FIGURA 6.3, relativo a un gioco di 6 lanci. FIGURA

possibili risultati: TT, TC, CT, CC. Poiché ognuno di questi risultati è ugualmente probabile, concludiamo che (a) la probabilità di ottenere due teste è 1/4, (b) la probabilità di ottenere una testa è 2/4, (c) la probabilità di ottenere zero teste è 1/4. Vi sono due modi per ottenere una testa, ma un modo solo per ottenere sia zero sia due teste. Consideriamo ora un gioco di tre lanci. Il terzo lancio ha uguale probabilità di dare testa o croce. Vi è un solo modo di ottenere tre teste: dobbiamo aver ottenuto due teste dai primi due lanci, e poi testa nell’ultimo. Vi sono, però, tre modi di ottenere due teste. Possiamo aver lanciato croce dopo aver lanciato due teste (un modo) o possiamo aver lanciato testa dopo aver ottenuto una sola testa nei primi due lanci (due modi). Così per i risultati di 3T, 2T, 1T, 0T abbiamo che il numero di modi di uguale probabilità è 1, 3, 3, l, con un totale di 8 possibili sequenze diverse. Le probabilità sono 1/8, 3/8, 3/8, 1/8. L’argomento che abbiamo trattato può essere riassunto da un diagramma simile a quello della FIGURA 6.3. È chiaro come il diagramma debba essere continuato per giochi con un maggiore numero di lanci. La FIGURA 6.4 mostra un diagramma di questo tipo per un gioco di sei lanci. Il numero dei «modi» a ogni punto del diagramma è il numero di differenti «cammini» (successioni di teste o di croci) che possono essere percorsi dal punto di partenza. La posizione sulla verticale ci dà il numero totale delle teste lanciate. L’insieme dei numeri che appaiono in tale diagramma, è noto come triangolo di Pascal. I numeri sono anche conosciuti come coefficienti binomiali, perché appaiono anche nello sviluppo di (a + b)n . Se chiamiamo n il numero dei lanci e k il numero di teste ottenute, allora i numeri del diagramma sono abitualmente indicati col simbolo n k . Osserviamo, incidentalmente, che i coefficienti binomiali possono anche essere calcolati con l’espressione ! n n! = (6.4) k k!(n k)! dove n!, chiamato «n fattoriale», rappresenta il prodotto n(n 1)(n 2) . . . 3 · 2 · 1. Siamo ora in grado di calcolare la probabilità P(k, n) di un risultato di k teste in n lanci, usando la definizione dell’equazione (6.1). Il numero totale di possibili successioni è 2n (perché ci sono due possibilità per ogni lancio), e il numero di modi di ottenere k teste è nk , tutti ugualmente probabili; così abbiamo ! n 1 P(k, n) = (6.5) k 2n

Poiché P(k, n) è la frazione di giochi in cui ci aspettiamo di ottenere k teste, allora in 100 giochi ci aspettiamo di ottenere k teste un numero di volte pari a 100 · P(k, 30). La curva tratteggiata nella FIGURA 6.2 passa attraverso i punti calcolati da 100 · P(k, 30). Vediamo che ci aspettiamo di ottenere un risultato di 15 teste in 14 o 15 giochi, benché questo risultato sia stato osservato in 13 giochi. Ci aspettiamo un risultato di 16 in 13 o 14 giochi, ma lo abbiamo ottenuto in 16 giochi. Tali fluttuazioni fanno «parte del gioco». Il metodo che abbiamo usato può essere applicato alla situazione più generale in cui vi siano soltanto due possibili risultati per ogni singola osservazione. Indichiamo i due risultati con V (per «vittoria») e con S (per «sconfitta»). Nel caso generale la probabilità di V e di S, in un singolo

6.3 • Moto casuale

© 978-8808-22107-0

55

evento, non è necessariamente la stessa. Sia p la probabilità di ottenere il risultato V . Allora q, la probabilità di S, è necessariamente (1 p). In un insieme di n prove, la probabilità P(k, n) che V sia ottenuto k volte è ! n k n k P(k, n) = p q (6.6) k

Questa funzione di probabilità è chiamata probabilità di Bernoulli, o anche probabilità binomiale.

6.3

Moto casuale

Vi è un altro interessante problema in cui è richiesta l’idea della probabilità. È il problema del «moto casuale». Nella versione più semplice, immaginiamo un «gioco» in cui un «giocatore» parte dal punto x = 0 e a ogni mossa deve fare un passo avanti (in direzione +x) oppure indietro (in direzione x). La scelta è fatta a caso, determinata, per esempio, con il lancio di una moneta. Come descrivere il moto risultante? Nella sua forma generale il problema è legato al moto degli atomi (o di altre particelle) in un gas – detto moto browniano – e anche alla combinazione degli errori nelle misure. Vedrete che il problema del moto casuale è strettamente legato al problema del lancio di una moneta già discusso. Per prima cosa osserviamo alcuni esempi di moto casuale. Possiamo caratterizzare la progressione del moto con la distanza netta D N percorsa in N passi. Mostriamo nel grafico della FIGURA 6.5 tre esempi di percorsi di un moto casuale. (Abbiamo usato per la serie casuale delle scelte i risultati dei lanci di moneta mostrati in FIGURA 6.1.) Che cosa possiamo dire su questo moto? Possiamo subito chiedere: «Quale distanza si raggiungerà in media»? Dobbiamo aspettarci che l’avanzamento medio sia zero, perché è ugualmente probabile l’andare avanti o indietro. Però abbiamo la sensazione che all’aumentare di N aumenti la probabilità di una deviazione maggiore dal punto di partenza. Possiamo quindi chiederci quale sia la distanza media percorsa in valore assoluto, cioè quale sia la media di |D|. È però più conveniente usare un’altra misura dell’«avanzamento», il quadrato della distanza: D2 è positivo sia per il moto positivo sia per quello negativo ed è perciò una ragionevole misura di questo moto casuale. Possiamo dimostrare che il valore atteso di D2N è proprio N, il numero dei passi fatti. Per «valore atteso» intendiamo il valore probabile (la nostra migliore congettura), che pensiamo come il comportamento medio atteso in molte sequenze ripetute. Rappresentiamo un simile valore atteso con hD2N i e possiamo riferirci a esso anche come alla «media dei quadrati delle distanze». Dopo un passo, D2 è sempre +1, quindi abbiamo hD12 i = 1. (Tutte le distanze sono misurate in rapporto a una unità costituita da un passo. Non continueremo a scrivere le unità di distanza.)

DN 5

0

6.5 Avanzamento fatto in un moto casuale. La coordinata orizzontale N è il numero totale di passi fatti; la coordinata verticale DN è la distanza netta percorsa dalla posizione di partenza. FIGURA

–5

–10

N 0

10

20

30

56

Capitolo 6 • Probabilità

© 978-8808-22107-0

Il valore atteso di D2N per N > 1 può essere ottenuto da D N 1 . Se dopo (N 1) passi abbiamo D N 1 , allora dopo N passi abbiamo

DN

Per i quadrati si ha

8 > DN 1 + 1 > > > > > =< oppure > > > > > > DN 1 1 :

8 > D2N 1 + 2D N 1 + 1 > > > > > > D2N = < (6.7) oppure > > > > > > > D2 : N 1 2D N 1 + 1 In un certo numero di serie indipendenti ci aspettiamo di ottenere ogni valore metà delle volte, così il valore medio che ci aspettiamo è proprio la media fra i due valori possibili. Il valore atteso di D2N è allora D2N 1 + 1. In generale ci aspetteremo per D2N 1 il suo «valore atteso» hD2N 1 i (per definizione!). Quindi hD2N i = hD2N 1 i + 1 (6.8) Abbiamo già visto che hD12 i = 1; ne segue che hD2N i = N

(6.9)

un risultato particolarmente semplice! Se vogliamo un numero che esprima una distanza, piuttosto che il quadrato di una distanza, per rappresentare «l’allontanamento dal punto di origine» in un moto casuale, possiamo usare la «distanza quadratica media» Drms : p p (6.10) Drms = hD2 i = N Abbiamo puntualizzato che il moto casuale è strettamente simile nel suo calcolo matematico al gioco del lancio della moneta, considerato all’inizio del capitolo. Se immaginiamo la direzione di ogni passo in corrispondenza con i risultati di testa o di croce nel lancio di una moneta, allora D è proprio NT NC , la differenza fra i numeri di teste e di croci. Poiché NT + NC = N, numero totale di passi (e di lanci), abbiamo D = 2NT N. Abbiamo ricavato prima un’espressione della distribuzione attesa di NT (detto anche k) e abbiamo ottenuto il risultato dell’equazione (6.5). Essendo N costante, abbiamo la corrispondente distribuzione di D. (Poiché per ogni testa oltre N/2 vi è una croce «mancante», abbiamo il fattore 2 fra NT e D.) Il diagramma della FIGURA 6.2 rappresenta la distribuzione delle distanze che possiamo ottenere in 30 passi a caso (dove k = 15 deve essere letto D = 0; k = 16, D = 2; ecc.). Lo scarto di NT dal suo valore atteso N/2 è NT

N D = 2 2

(6.11)

!

(6.12)

Lo scarto quadratico medio è NT

N 2

rms

=

1p N 2

In p accordo col nostro risultato di Drms , ci aspettiamo che la distanza «tipica» in 30 passi sia 30 = 5,5, ossia un k tipico sarà circa 5,5/2 = 2,8 unità da 15. Vediamo che la «larghezza» della curva in FIGURA 6.2, misurata dal centro, è proprio di circa 3 unità, in accordo con questo risultato. Siamo ora in condizione di considerare un problema che abbiamo finora evitato. Come dire se una moneta è «onesta» o «truccata»? Possiamo dare ora almeno una risposta parziale. Da una moneta onesta ci aspettiamo che la frazione di volte in cui appare testa sia 0,5, cioè, hNT i = 0,5 N

(6.13)

6.4 • Una distribuzione di probabilità

© 978-8808-22107-0

57

6.6 Frazione N T /N dei lanci che hanno dato testa in una particolare successione di N lanci di una moneta. FIGURA

NT

1,0

N

? 0,5 ?

N 0

1

2

4

8

16

32

64

128

256 512 1024 2048 4096

Ci aspettiamo anche che un NT reale scarti da N/2 di circa di p 1 N 1 = p N 2 2 N

p

N/2, o che la frazione NT /N scarti

Più grande è N, più vicina a 1/2 ci aspettiamo la frazione NT /N. Nella FIGURA 6.6 è mostrato il diagramma della frazione NT /N per i lanci di moneta già riportati in questo capitolo. Vediamo la tendenza per la frazione di teste ad approssimarsi a 0,5 per N grande. Sfortunatamente per ogni serie di lanci o per combinazioni di serie non vi è garanzia che lo scarto osservato sia vicino allo scarto atteso. Vi è sempre una possibilità finita che una grande fluttuazione – una lunga sequenza di teste o di croci – dia uno scarto p arbitrariamente grande. Tutto quello che possiamo dire è che se lo scarto è vicino all’atteso 1/2 N (diciamo entro un fattore di 2 o 3), non abbiamo ragione di avere dubbi sull’onestà della moneta. Se lo scarto è molto più grande possiamo sospettare, ma non abbiamo prove, che la moneta sia truccata (o che il lanciatore sia furbo!). Non abbiamo ancora considerato come trattare il caso di una moneta o di qualche oggetto simile da «sorteggio» (diciamo una pietra che possa cadere sempre soltanto in due diverse posizioni), che abbiamo buone ragioni di credere abbia una diversa probabilità di dare testa o croce. Abbiamo definito P(T) = hNT i/N. Come sapremo quale NT aspettarci? In alcuni casi la miglior cosa da fare è di osservare il numero delle teste ottenute in un gran numero di lanci. In mancanza di qualcosa di meglio stabiliamo hNT i = NT (osservati). (Come potremmo aspettarci qualcos’altro?) Dobbiamo renderci conto, però, che in un caso simile un diverso esperimento, o un diverso osservatore, può concludere p che P(T) sia diverso. Ci aspetteremo però che le varie risposte si accordino entro lo scarto 1/2 N (se P(T) è vicino a 1/2). Un fisico sperimentale di solito dice che una probabilità «determinata sperimentalmente» ha un «errore», e scrive P(T) =

1 NT ± p N 2 N

(6.14)

È implicito in un’espressione del genere che vi sia una probabilità «vera» o «corretta» che potrebbe essere calcolata se avessimo cognizioni sufficienti, e che l’osservazione possa essere «erronea» a causa di una fluttuazione. Non vi è però modo di fare un ragionamento simile che sia logicamente consistente. Probabilmente è meglio considerare che il concetto di probabilità è soggettivo, che è sempre basato su conoscenze incerte e che la sua valutazione quantitativa è soggetta a variare via via che otteniamo maggiori informazioni.

6.4

Una distribuzione di probabilità

Ritorniamo ora al moto casuale e consideriamo una sua modificazione. Supponiamo che in aggiunta alla scelta casuale della direzione (+x o x) di ogni passo, anche la lunghezza del passo vari in modo imprevedibile, con la sola condizione che in media la lunghezza del passo sia di una

58

Capitolo 6 • Probabilità

© 978-8808-22107-0

6.7 Densità di probabilità per arrivare alla distanza D dal punto di partenza in un moto casuale di N passi. (D è misurata in unità di passo quadratico medio.) FIGURA

p (x)

N = 10 000 passi N = 40 000 passi N = 160 000 passi D –600

–400

–200

0

200

400

600

unità. Questo caso rappresenta meglio qualcosa di simile al moto termico di una molecola in un gas. Se chiamiamo S la lunghezza di un passo, allora S può avere qualsiasi valore, ma più spesso sarà «vicino» a l. Per essere precisi poniamo hS 2 i = 1 o, in modo equivalente, Srms = 1. La nostra derivazione per hD2 i procederà come prima eccetto che l’equazione (6.8) sarà ora modificata e si leggerà hD2N i = hD2N 1 i + hS 2 i = hD2N 1 i + 1 (6.15) Abbiamo, come prima, che hD2N i = N

(6.16)

Che cosa ci aspettiamo ora come distribuzione delle distanze D? Qual è, per esempio, la probabilità che sia D = 0 dopo 30 passi? La risposta è zero! La probabilità che D possa avere un particolare valore è zero perché non vi è alcuna possibilità che la somma dei passi all’indietro (di varia lunghezza) uguagli esattamente la somma dei passi in avanti. Non possiamo disegnare un grafico simile a quello della FIGURA 6.2. Possiamo, però, ottenere una rappresentazione simile a quella della FIGURA 6.2 se ci domandiamo non quale sia la probabilità di ottenere D esattamente uguale a 0, l o 2, ma invece quale sia la probabilità di ottenere D vicino a 0, 1 o 2. Definiamo P(x, x) come la probabilità che D giaccia nell’intervallo x posto in x (diciamo da x a x + x). Ci aspettiamo che per x piccolo, la probabilità che D giaccia nell’intervallo sia proporzionale a x, l’ampiezza dell’intervallo. Quindi possiamo scrivere P(x, x) = p(x) x (6.17) La funzione p(x) è detta densità di probabilità. La forma di p(x) dipende da N, il numero dei passi fatti, e anche dalla distribuzione delle lunghezze dei singoli passi. Non possiamo dimostrarlo p (x) qui, ma per N grande, p(x) è la stessa per ogni distribuzione ragionevole delle lunghezze dei singoli passi, e dipende solo da N. Nella FIGURA 6.7 ∆x abbiamo fatto il grafico di p(x) per tre valori di N. Noterete che la «semip larghezza» (apertura tipica da x = 0) di queste curve è N, come abbiamo dimostrato che deve essere. Potete notarepanche che il valore di p(x) vicino a zero è inversamente proporzionale a N. Questo succede perché le curve hanno tutte una forma simile e le aree sotto le curve devono essere tutte uguali. Poiché p(x) x è la probabilità di trovare D in x quando x è piccolo, possiamo determinare la probabilità di trovare D in un intervallo arbitrario da x 1 a x 2 , dividendo 0 x1 x2 x l’intervallo in un numero di piccoli incrementi x e valutando la somma dei termini p(x) x per ogni incremento. La probabilità che D si trovi in FIGURA 6.8 La probabilità che la distanza D percorsa qualche punto fra x 1 e x 2 , che possiamo scrivere P(x 1 < D < x 2 ), è uguale in un moto casuale sia compresa tra x 1 e x 2 , è l’area sotto la curva p(x) da x 1 a x 2 . all’area tratteggiata in FIGURA 6.8. Più piccoli facciamo gli incrementi x,

6.4 • Una distribuzione di probabilità

© 978-8808-22107-0

più preciso è il nostro risultato. Possiamo quindi scrivere ⌅ X P(x 1 < D < x 2 ) = p(x) x =

x2

p(x) dx

(6.18)

x1

L’area sotto l’intera curva è la probabilità che D si trovi in qualche parte (cioè, abbia un qualunque valore fra x = 1 e x = +1). Questa probabilità è sicuramente uguale a 1. Dobbiamo quindi avere ⌅ +1 p(x) dx = 1 (6.19) 1 p Poiché nella FIGURA p 6.7 le curve si allargano in proporzione a N, le loro altezze saranno proporzionali a 1/ N per mantenere l’area totale pari a 1. La funzione densità di probabilità che abbiamo descritto è una delle più comuni. È conosciuta come densità di probabilità normale o gaussiana. Ha la forma matematica p(x) =

1 p e 2⇡

x 2 /2

2

(6.20)

p dove si chiama errore quadratico medio ed èpdato, nel nostro caso, da = N, oppure, se il passo quadratico medio è diverso da 1, da = N Srms . Abbiamo sottolineato prima che il moto di una molecola o di una particella in un gas è simile al moto casuale. Supponiamo di aprire una bottiglia di un composto organico, in modo che un po’ del suo vapore esca nell’aria. Se vi sono correnti d’aria, cosicché l’aria circoli, le correnti trasportano con loro il vapore. Ma anche in un’aria perfettamente ferma, il vapore si propaga gradualmente all’esterno – si diffonde – fino a che non è penetrato in tutta la stanza. Possiamo scoprirlo dal colore o dall’odore. Le singole molecole del vapore si spargono nell’aria ferma a causa del moto molecolare prodotto dalle collisioni con altre molecole. Se conosciamo la dimensione media del «passo», e il numero dei passi fatti in un secondo, possiamo trovare la probabilità che una o più molecole si trovino a una certa distanza dal loro punto di partenza, dopo un particolare intervallo di tempo. Al passare del tempo, aumentano i passi e il gas si propaga secondo le curve successive della FIGURA 6.7. In uno dei prossimi capitoli vedremo come le dimensioni e le frequenze del passo siano legate alla temperatura e alla pressione di un gas. Abbiamo detto che la pressione di un gas è dovuta all’urto delle mop (v ) lecole contro le pareti del contenitore. Volendo fare una descrizione più o quantitativa, vorremmo sapere quanto sono veloci le molecole quando rimN · p (v ) balzano, poiché la collisione dipende da quella velocità. Non possiamo tuttavia parlare della velocità delle molecole. È necessario usare una descrizione probabilistica. Una molecola può avere qualsiasi velocità ma alcune velocità sono più probabili di altre. Descriviamo ciò che accade dicendo che la probabilità che una qualsiasi molecola abbia una velocità compresa fra v e v + v è p(v) v, dove p(v), la densità di probabilità, è una data funzione della velocità v. v vp v1 v2 Vedremo in seguito come Maxwell, usando il buonsenso e il concetto di probabilità, sia stato capace di trovare un’espressione matematica per p(v). La forma(1) della funzione p(v) è mostrata in FIGURA 6.9. Le velocità FIGURA 6.9 Distribuzione delle velocità delle possono avere qualunque valore, ma è molto più probabile che abbiano molecole in un gas. valori vicini al valore più probabile o atteso v p . Spesso interpretiamo la curva di FIGURA 6.9 in un modo un po’ diverso. Se consideriamo le molecole poste in un contenitore (diciamo del volume di 1 litro), allora vi è un grandissimo numero di molecole presenti (N ⇡ 1022 ). Poiché p(v) v è la probabilità che una molecola abbia una velocità compresa in v, con la nostra definizione di probabilità intendiamo che il numero atteso h Ni di molecole con velocità compresa nell’intervallo v sia dato da h Ni = N p(v) v (1)

L’espressione di Maxwell è p(v) = Cv 2 e che la probabilità totale sia uno.

av 2 ,

(6.21)

dove a è una costante legata alla temperatura e C è scelto in modo

59

Capitolo 6 • Probabilità

60

© 978-8808-22107-0

Chiamiamo N p(v) la «distribuzione di velocità». L’area sotto la curva, compresa fra le due velocità v1 e v2 , per esempio l’area tratteggiata nella FIGURA 6.9, rappresenta – per la curva N p(v) – il numero atteso di molecole con velocità comprese fra v1 e v2 . Poiché con un gas siamo comunemente alle prese con p un gran numero di molecole, ci attendiamo che gli scarti dai numeri attesi siano piccoli (come 1/ N), così spesso trascuriamo di dire il numero «atteso», e diciamo invece: «Il numero di molecole con velocità fra v1 e v2 è dato dall’area sotto la curva». Ricordiamo però che queste affermazioni sono sempre relative a numeri probabili.

6.5

Il principio di indeterminazione

Le idee della probabilità sono certamente utili nel descrivere il comportamento di qualcosa come 1022 molecole di un campione di gas, perché è chiaramente impossibile il solo tentare di scrivere la posizione o la velocità di ogni molecola. Quando la probabilità fu applicata la prima volta a simili problemi, fu considerata una soluzione di comodo: un modo di trattare [∆x ] con situazioni molto complicate. Ora crediamo che le idee della probabilità siano essenziali per la descrizione di avvenimenti atomici. Secondo la meccanica quantistica, la teoria matematica delle particelle, vi è sempre x0 x qualche incertezza nella specificazione delle posizioni e delle velocità. Nel caso migliore, possiamo dire che vi è una certa probabilità che una qualsiasi (b) p 2( x ) particella abbia una posizione vicina a una certa coordinata x. Possiamo esprimere una densità di probabilità p1 (x), tale che p1 (x) x sia la probabilità che la particella si trovi fra x e x + x. Se la particella è ragionevolmente ben localizzata, diciamo vicino a x 0 , la funzione p1 (x) [∆v ] potrebbe essere data dal diagramma della FIGURA 6.10a. Allo stesso modo dobbiamo specificare la velocità della particella per mezzo di una densità di probabilità p2 (v) tale che p2 (v) v rappresenti la probabilità che la velocità v0 v della particella si trovi compresa fra v e v + v. Uno dei risultati fondamentali della meccanica quantistica è che le due FIGURA 6.10 Densità di probabilità relative funzioni p1 (x) e p2 (v) non possano essere scelte indipendentemente e, all’osservazione della posizione e della velocità in particolare, non possano essere ristrette entrambe arbitrariamente. Se di una particella. chiamiamo [ x] la «larghezza» tipica della curva p1 (x) e [ v] quella della curva p2 (v) (come è mostrato in figura), la natura richiede che il prodotto delle due larghezze debba essere almeno grande come il numero ~/2m, dove m è la massa della particella. Possiamo scrivere questa relazione fondamentale nel modo seguente p 1( x )

(a)

[ x] · [ v]

~ 2m

(6.22)

Questa equazione è un enunciato del principio di indeterminazione di Heisenberg, che abbiamo in precedenza ricordato. Dato che il secondo membro dell’equazione (6.22) è una costante, questa equazione dice che se cerchiamo di «localizzare» una particella costringendola a essere in un punto particolare, essa finisce per avere un’alta velocità. Oppure se cerchiamo di forzarla ad andare molto lentamente, o a una precisa velocità, essa si «espande» cosicché non sappiamo con precisione dove si trovi. Le particelle si comportano in modo bizzarro! Il principio di indeterminazione descrive un’incertezza intrinseca che esiste in ogni tentativo di descrivere la natura. La nostra più precisa descrizione della natura deve essere fatta in termini di probabilità. Vi sono alcune persone alle quali non piace questo modo di descrivere la natura. Esse pensano in qualche modo che, se potessero soltanto sapere che cosa stia succedendo realmente a una particella, potrebbero conoscerne simultaneamente velocità e posizione. Nei primi tempi di sviluppo della meccanica quantistica, Einstein era molto tormentato da questo problema. Egli era solito scuotere la testa e dire, «Ma certamente Dio non getta i dadi per determinare il moto degli elettroni!». Egli si tormentò a lungo su questo problema e, probabilmente, non si è in realtà

6.5 • Il principio di indeterminazione

© 978-8808-22107-0

61

mai riconciliato col fatto che questa è la miglior descrizione della natura che si possa dare. Vi sono ancora uno o due fisici che si stanno occupando del problema, nella convinzione intuitiva che sia possibile in qualche modo descrivere il mondo in maniera diversa e che tutta questa indeterminazione nel modo di essere delle cose possa venire soppressa. Però nessuno, finora, ci è riuscito. La necessaria indeterminazione nella specificazione della posizione di una particella diventa estremamente importante quando vogliamo descrivere la struttura degli atomi. Nell’atomo dell’idrogeno, che ha un nucleo formato da un protone e un elettrone all’esterno del nucleo, l’indeterminazione nella posizione dell’elettrone è grande quanto l’atomo stesso! Non possiamo, quindi, parlare propriamente del movimento dell’elettrone in un’«orbita» intorno al protone. Il massimo che possiamo dire è che vi è una certa probabilità p(r) V di osservare l’elettrone in un elemento di volume V alla distanza r dal protone. La densità di probabilità p(r) è data dalla meccanica quantistica. Per un atomo indisturbato di idrogeno si ha p(r) = Ae

2r/a

Il numero a è il raggio «tipico» a partire dal quale la funzione decresce rapidamente. Poiché è piccola la probabilità di trovare l’elettrone a distanze dal nucleo molto maggiori di a, possiamo pensare ad a come al «raggio dell’atomo», circa 10 10 metri. Possiamo formarci un’immagine dell’atomo dell’idrogeno immaginando una «nube» la cui densità è proporzionale alla densità di probabilità di osservare l’elettrone. Un esempio di tale nube è mostrato nella FIGURA 6.11. Così la nostra migliore «immagine» di un atomo di idrogeno è un nucleo circondato da una «nube di elettroni» (anche se in realtà intendiamo una «nube di probabilità»). L’elettrone è da qualche parte ma la natura ci permette soltanto di conoscere la probabilità di trovarlo in un posto particolare. Nei loro sforzi di imparare quanto più possibile intorno alla natura, i fisici moderni hanno trovato che certe cose non possono essere mai «conosciute» con certezza. Molte delle nostre conoscenze devono sem- FIGURA 6.11 Un modo di visualizzare un atomo di idrogeno. pre rimanere incerte. Il massimo della nostra conoscenza è in termini di La densità (bianco) della nube rappresenta la densità probabilità. di probabilità di osservare l’elettrone.

7

La teoria della gravitazione

7.1

Moti planetari

In questo capitolo discuteremo una delle più straordinarie generalizzazioni della mente umana. Mentre ammiriamo la mente umana, dovremmo rimanere anche in reverenziale stupore di fronte alla natura, che segue senza eccezioni un semplice ed elegante principio come la legge della gravitazione. Che cos’è questa legge della gravitazione? È il fatto che ogni oggetto nell’universo attrae ogni altro oggetto con una forza che è, per due corpi, proporzionale alla massa di ciascuno e varia inversamente al quadrato della distanza che li separa. Questo enunciato può essere espresso matematicamente dall’equazione F=G

mm 0 r2

Se aggiungiamo a ciò il fatto che un oggetto risponde a una forza accelerando nella direzione della forza con un’intensità inversamente proporzionale alla massa dell’oggetto, avremmo detto tutto quello che occorre perché un matematico con sufficiente talento possa dedurre tutte le conseguenze di questi due princìpi. Tuttavia, dato che non si può pretendere che voi abbiate già un sufficiente talento, discuteremo le conseguenze con più dettagli, e non vi lasceremo soltanto con questi due semplici princìpi. Racconteremo brevemente la storia della scoperta della legge relativa alla gravitazione e discuteremo alcune delle sue conseguenze, i suoi effetti storici, i misteri che una simile legge implica, e alcuni completamenti della legge fatti da Einstein; discuteremo anche la relazione fra questa legge e le altre leggi di fisica. Questi argomenti non possono essere svolti in un solo capitolo, ma saranno trattati a tempo debito e in vari capitoli. La storia comincia con le osservazioni degli antichi sui moti dei pianeti e prosegue con la successiva deduzione che essi giravano attorno al Sole, un fatto che fu riscoperto più tardi da Copernico. Un po’ più di lavoro richiese la scoperta di come i pianeti girassero esattamente intorno al Sole ed esattamente con quale moto. Agli inizi del quindicesimo secolo vi fu un grande dibattito sul fatto se i pianeti girassero intorno al Sole o meno. Tycho Brahe ebbe un’idea diversa da tutte le altre proposte dagli antichi: la sua idea era che questi dibattiti sulla natura dei moti dei pianeti sarebbero stati meglio risolti se le reali posizioni dei pianeti nel cielo fossero state misurate con sufficiente accuratezza. Se la misura avesse mostrato esattamente come i pianeti si muovevano, allora forse sarebbe stato possibile stabilire la validità dell’uno o dell’altro punto di vista. Fu un’idea rivoluzionaria il fatto che per scoprire qualcosa fosse meglio fare alcuni accurati esperimenti che ricorrere a profondi argomenti filosofici. Seguendo questa idea, Tycho Brahe studiò le posizioni dei pianeti per molti anni nel suo osservatorio sull’isola Hven, nei pressi di Copenhagen. Egli approntò voluminose tabelle, che furono poi studiate dal matematico Keplero, dopo la morte di Tycho. E Keplero ricavò dai dati alcune bellissime, rimarchevoli, ma semplici leggi riguardanti il moto planetario.

7.3 • Sviluppo della dinamica

© 978-8808-22107-0

63 FIGURA

∆t

2b r1

r2

∆t

r 1 + r 2 = 2a

7.2

Le leggi di Keplero

Per prima cosa Keplero trovò che ogni pianeta gira attorno al Sole secondo una curva detta ellisse, di cui il Sole occupa un fuoco. Un’ellisse non è precisamente un ovale, ma una curva molto particolare e precisa che può essere ottenuta usando due chiodi, uno per ogni fuoco, una funicella e una matita; più matematicamente, è il luogo di tutti i punti la somma delle cui distanze da due punti fissi (i fuochi) è una costante. O, se volete, è un cerchio schiacciato (FIGURA 7.1). La seconda osservazione di Keplero fu che i pianeti non girano attorno al Sole con velocità uniforme, ma si muovono più in fretta quando sono più vicini al Sole e più lentamente quando sono più lontani dal Sole, precisamente nel modo seguente: supponiamo che un pianeta sia osservato in due tempi successivi, diciamo a una settimana di distanza, e che sia tracciato il raggio vettore(1) verso il pianeta per ogni posizione osservata. L’arco orbitale attraversato dal pianeta durante la settimana e i due raggi vettori delimitano una certa area piana, evidenziata dal tratteggio nella FIGURA 7.2. Se due osservazioni simili vengono fatte a una settimana di distanza, nella parte dell’orbita più lontana dal Sole (dove il pianeta si muove più lentamente), l’area delimitata come la precedente è esattamente equivalente a essa. Quindi, in accordo con la seconda legge, la velocità orbitale di ogni pianeta è tale che il raggio «spazza» aree uguali in tempi uguali. Molto più tardi, infine, fu scoperta da Keplero una terza legge: questa legge ha caratteristiche molto diverse dalle altre due, poiché non interessa un singolo pianeta, ma mette in relazione un pianeta con l’altro. Questa legge stabilisce che quando vengono paragonati il periodo orbitale e la dimensione dell’orbita di una coppia di pianeti, i periodi sono proporzionali alla dimensione dell’orbita elevata alla potenza 3/2. In questo enunciato il periodo è l’intervallo di tempo necessario a un pianeta per percorrere completamente la propria orbita, e la dimensione è misurata dalla lunghezza del massimo diametro dell’orbita ellittica, tecnicamente noto come asse maggiore. Più semplicemente, se i pianeti percorressero orbite circolari, come pressappoco fanno, il tempo richiesto per compiere un’orbita sarebbe proporzionale alla potenza 3/2 del diametro (o del raggio). Le tre leggi di Keplero sono pertanto le seguenti: 1 Ogni pianeta si muove attorno al Sole su un’ellisse di cui il Sole occupa uno dei fuochi. 2 Il raggio vettore dal Sole al pianeta spazza aree uguali in intervalli di tempo uguali. 3 I quadrati dei periodi di ogni coppia di pianeti sono proporzionali ai cubi dei semiassi maggiori delle loro rispettive orbite: T / a3/2 .

7.3

Sviluppo della dinamica

Mentre Keplero scopriva queste leggi, Galileo studiava le leggi del moto. Il problema era: che cosa fa muovere i pianeti? (In quel tempo una delle teorie proposte era che i pianeti si muovessero (1)

Il raggio vettore è una linea tracciata dal Sole a ogni punto dell’orbita del pianeta.

Un’ellisse.

7.2 Legge delle aree di Keplero. FIGURA

2a

7.1

64

Capitolo 7 • La teoria della gravitazione

© 978-8808-22107-0

perché dietro di loro vi erano angeli invisibili, che battendo le ali spingevano avanti i pianeti. Vedrete che tale teoria è stata modificata! Risulta che per far ruotare i pianeti, gli angeli invisibili devono volare in una diversa direzione, e non hanno ali. Per il resto è una teoria abbastanza simile!) Galileo scoprì un importantissimo fatto intorno al moto, che fu essenziale per la comprensione di queste leggi. Cioè il principio di inerzia: se un oggetto in movimento non tocca niente ed è completamente indisturbato, viaggerà eternamente, seguendo una linea retta a velocità uniforme. (Perché segue tale moto? Non lo sappiamo, ma è così.) Newton modificò questa idea, affermando che il solo modo di cambiare il moto di un corpo è di usare una forza. Se il corpo accelera, una forza è stata applicata nella direzione del moto. D’altro canto, se il moto ha cambiato direzione, è stata applicata una forza trasversalmente. Così Newton aggiunse l’idea che è necessaria una forza per cambiare la velocità o la direzione del moto di un corpo. Per esempio, se una pietra è legata a una fune ed è fatta girare rapidamente, essa richiede una forza per mantenersi sulla traiettoria circolare. Dobbiamo tirare la fune. Infatti la legge dice che l’accelerazione prodotta dalla forza è inversamente proporzionale alla massa, oppure la forza è proporzionale alla massa per l’accelerazione. Maggiore è la massa dell’oggetto, maggiore è la forza richiesta per produrre una data accelerazione. (La massa può essere misurata mettendo altre pietre in fondo alla stessa fune e facendole viaggiare sulla stessa traiettoria circolare, alla stessa velocità. In questo modo si trova che la forza necessaria è più o meno grande; una massa maggiore richiede una forza maggiore.) L’idea brillante che deriva da queste considerazioni è che non è necessaria alcuna forza tangenziale per mantenere un pianeta sulla sua orbita (gli angeli non devono volare tangenzialmente) poiché il pianeta seguirebbe comunque questa direzione. Se non vi fosse niente a disturbarlo, il pianeta continuerebbe in linea retta. Ma il moto reale devia dalla linea lungo la quale il corpo viaggerebbe se non vi fossero forze, con deviazione essenzialmente perpendicolare al moto. In altre parole, a causa del principio di inerzia, la forza necessaria al controllo del moto di un pianeta attorno al Sole, non è una forza diretta attorno al Sole, ma verso il Sole. (Se vi è una forza verso il Sole, il Sole può essere l’angelo, naturalmente!)

7.4

Legge della gravitazione di Newton

Per una migliore comprensione della teoria del moto, Newton valutò giustamente che il Sole fosse la sede o l’organizzazione delle forze che governano il moto dei pianeti. Newton dimostrò a se stesso (e forse saremo capaci di verificarlo presto) che il fatto che aree uguali sono spazzate in tempi uguali è una precisa indicazione della proposizione che tutte le deviazioni sono esattamente radiali – che la legge delle aree è una conseguenza diretta del fatto che tutte le forze sono dirette esattamente verso il Sole. In seguito, analizzando la terza legge di Keplero, è possibile dimostrare che più lontano è il pianeta più deboli sono le forze. Se vengono paragonati due pianeti posti a diversa distanza dal Sole, l’analisi mostra che le forze sono inversamente proporzionali ai quadrati delle rispettive distanze dal Sole. Combinando le due leggi, Newton concluse che deve esserci una forza, inversa al quadrato della distanza, diretta come la linea che congiunge i due oggetti. Essendo un uomo considerevolmente sensibile alle generalizzazioni, Newton suppose, naturalmente, che questa relazione avesse un’applicazione più generale di quella relativa al Sole che trattiene i pianeti. Si sapeva già, per esempio, che il pianeta Giove aveva satelliti che gli ruotavano attorno, come la Luna ruota attorno alla Terra, e Newton si sentì sicuro del fatto che ogni pianeta tratteneva i suoi satelliti per mezzo di una forza. Egli già sapeva della forza che ci trattiene sulla Terra. Così suggerì che questa fosse una forza universale: ogni cosa attira ogni altra cosa. Il problema successivo era stabilire se l’attrazione che la Terra esercitava sulle persone fosse la «stessa» esercitata sulla Luna, cioè inversa al quadrato della distanza. Se un oggetto sulla superficie della Terra cade di 16 piedi nel primo secondo dopo l’abbandono dello stato di quiete, di quanto cadrà la Luna nello stesso tempo? Potremmo dire che la Luna non cade affatto. Ma se sulla Luna non agisse alcuna forza, essa proseguirebbe in linea retta, mentre invece viaggia lungo

7.4 • Legge della gravitazione di Newton

© 978-8808-22107-0

65

7.3 Dispositivo che dimostra l’indipendenza dei moti orizzontali e verticali. FIGURA

x

Elettromagnete

S

S

FIGURA

h2

Collisione!

h1

h1 = h2

2R – S R

una traiettoria circolare, cosicché, in realtà, cade rispetto alla posizione in cui si troverebbe se non vi fosse alcuna forza. Dal raggio dell’orbita lunare (che è circa 240 000 miglia) e da quanto impiega per girare attorno alla Terra (approssimativamente 29 giorni), possiamo calcolare quale tratto di orbita la Luna percorre in un secondo e quindi di quanto cade in un secondo(2) . Questa distanza risulta essere all’incirca 1/20 di pollice in un secondo. Ciò calza a perfezione con la legge dell’inverso del quadrato, essendo il raggio della Terra di 4000 miglia; se qualcosa che si trova a 4000 miglia dal centro della Terra cade di 16 piedi in un secondo, qualcosa a 240 000 miglia, o 60 volte più lontano, dovrebbe cadere soltanto di 1/3600 di 16 piedi, che infatti è circa 1/20 di pollice. Desiderando sottoporre a una prova, mediante calcoli simili, questa teoria della gravitazione, Newton fece i suoi calcoli con grande accuratezza e trovò una così grave discrepanza che considerò la teoria come contraddetta dai fatti, e non pubblicò i suoi risultati. Sei anni più tardi una nuova misura delle dimensioni della Terra dimostrò che gli astronomi avevano usato una misura di distanza dalla Luna sbagliata. Quando Newton seppe questo, rifece i calcoli con i numeri corretti e ottenne un magnifico accordo. Questa idea della Luna che «cade» è un po’ sconcertante poiché, come vedete, non si avvicina. L’idea è sufficientemente interessante da meritare un’ulteriore spiegazione: la Luna cade nel senso che essa si allontana dalla linea retta lungo la quale proseguirebbe se non vi fossero forze. Consideriamo un esempio sulla superficie terrestre; un oggetto abbandonato vicino alla superficie della Terra cade di 16 piedi nel primo secondo. Un oggetto lanciato orizzontalmente cadrà pure di 16 piedi; quantunque si muova orizzontalmente, tuttavia cadrà degli stessi 16 piedi nello stesso tempo. La FIGURA 7.3 illustra un apparato che lo dimostra. Sul binario orizzontale c’è una palla che sta per essere spinta in avanti di un piccolo tratto. Alla stessa altezza c’è una palla che sta per cadere verticalmente, vi è poi un interruttore elettrico sistemato in modo tale da far sì che nel preciso istante in cui la prima palla lascia il binario, la seconda palla sia lasciata cadere. Che esse giungano alla stessa quota, nel medesimo tempo, è testimoniato dal fatto che collidono per aria. Un oggetto, quale una palla da fucile, lanciato orizzontalmente, può compiere in un secondo un lungo percorso – forse 2000 piedi – ma si abbasserà sempre di 16 piedi se la mira è stata orizzontale. Che cosa accade se noi spariamo un proiettile sempre più veloce? Non dimentichiamo che la superficie della Terra è curva. Se lo lanciamo abbastanza veloce, quando cadrà di 16 piedi, potrà venirsi a trovare alla stessa altezza da terra in cui si trovava prima. Come può essere ciò? Esso cade ancora ma la terra sotto è curva, così il proiettile cade «attorno» alla Terra. Il problema è: quale distanza deve percorrere in 1 secondo perché la terra si trovi 16 piedi sotto l’orizzonte? Nella FIGURA 7.4 vediamo la Terra col suo raggio di 4000 miglia e la tangente, la via in linea retta che il proiettile percorrerebbe se non vi fossero forze. Per effetto di uno straordinario teorema di geometria, secondo il quale la nostra tangente è media proporzionale fra le due parti del diametro tagliato da una corda di uguale lunghezza, vediamo che la distanza orizzontale percorsa è media proporzionale fra i 16 piedi di caduta e le 8000 miglia del diametro della Terra. La radice quadrata (2) Cioè di quanto si allontana l’orbita della Luna al di sotto della linea retta tangente al punto in cui si trovava 1 secondo prima.

7.4

Accelerazione centripeta di un’orbita circolare. Dalla geometria piana x/S = (2R S)/x ⇡ 2R/x, dove: R è il raggio della Terra (4000 miglia); x è la distanza «percorsa orizzontalmente» in 1 s; S è il tratto di «caduta» in 1 s (16 piedi).

66

Capitolo 7 • La teoria della gravitazione

© 978-8808-22107-0

di (16/5280) · 8000(3) risulta molto vicina a 5 miglia. In questo modo vediamo che se la palla si muove alla velocità di 5 miglia al secondo, essa continuerà a cadere verso la terra con la stessa rapidità di 16 piedi ogni secondo, ma non si avvicinerà mai perché la terra continua ad allontanarsi sotto di lei, curvando. Fu così che il Signor Gagarin si mantenne per 25 000 miglia nello spazio mentre viaggiava attorno alla Terra approssimativamente a 5 miglia al secondo. (Egli viaggiò un po’ più velocemente perché era più in alto rispetto al livello del suolo.) Ogni grande scoperta di una nuova legge è utile soltanto se le deduzioni che possiamo ricavare superano le informazioni utilizzate. Ora Newton usò la seconda e la terza legge di Keplero per dedurre la sua legge di gravitazione. Che cosa predisse? Primo, la sua analisi del moto della Luna fu una predizione, poiché egli collegò la caduta degli oggetti sulla superficie della Terra con la caduta della Luna. Secondo, il problema era: l’orbita è ellittica? Vedremo in un successivo capitolo come sia possibile calcolare esattamente il moto, e infatti si può provare che la traiettoria deve essere un’ellisse,(4) cosicché, per spiegare la prima legge di Keplero non è necessaria nessun’altra informazione. In questo modo Newton fece la sua prima poderosa predizione. La legge della gravitazione spiega diversi fenomeni prima incomprensibili. Per esempio l’attrazione della Luna sulla Terra causa le maree, fino ad allora misteriose. La Luna attira in alto l’acqua sotto di lei e produce le maree – altri, già prima, avevano riflettuto su questo, ma non erano altrettanto intelligenti come Newton e così pensarono che non vi dovesse essere che una sola marea durante il giorno. Il ragionamento era che la Luna attira l’acqua sotto di lei creando un’alta e una bassa marea, e poiché la Terra ruota sotto di lei, questo fa si che in un luogo la marea salga e scenda ogni 24 ore. In realtà la marea sale e scende ogni 12 ore. Un’altra scuola di pensiero rivendicò che l’alta marea dovesse essere dal lato opposto della Terra perché, così essi argomentavano, la Luna attira la Terra lontano dall’acqua! Entrambe queste teorie sono errate. In realtà è provato questo fatto: le attrazioni della Luna sulla Terra e sull’acqua «si equilibrano» al centro. Ma l’acqua che è più vicina alla Luna è attirata più della media e l’acqua che è più lontana è attirata meno della media. In più, l’acqua può scorrere più di quanto non possa fare la rigida Terra. Il giusto quadro è una combinazione di questi due fatti. Che cosa intendiamo con «equilibrare»? Che cosa fa equilibrio? Se la Luna attira la Terra verso di sé, perché la Terra non cade direttamente «sulla» Luna? Perché la Terra fa lo stesso gioco della Luna, girando in cerchio attorno a un punto che è posto nella Terra, ma non nel suo centro. La Luna non ruota esattamente attorno alla Terra, ma la Luna Terra e la Luna ruotano entrambe attorno a una posizione centrale, ciascuna Punto attorno al quale B ruotano Terra e Luna cadendo verso questa posizione, come mostra la FIGURA 7.5. Questo moto attorno al centro comune è ciò che equilibra la caduta di ognuna di loro. Così nemmeno la Terra va in linea retta, ma viaggia lungo un’orbita circolare. L’acqua lontana non è «equilibrata» perché l’attrazione lunare qui è più Acqua debole che al centro della Terra, dove fa equilibrio alla «forza centrifuga». C Il risultato di questo sbilanciamento è che l’acqua sale, allontanandosi dal A Terra centro della Terra. Dalla parte vicina alla Luna l’attrazione è maggiore e lo sbilanciamento è nel verso opposto, ma sempre con un allontanamento dal centro della Terra. Il risultato netto è che vi sono due rigonfiamenti di FIGURA 7.5 Il sistema Terra-Luna con le maree. marea.

7.5

Gravitazione universale

Che cos’altro possiamo capire una volta compresa la gravità? Tutti sanno che la Terra è rotonda. Perché è rotonda? È facile; ciò è dovuto alla gravitazione. Si può capire che la Terra sia tonda semplicemente a causa del fatto che ogni cosa attrae ogni altra cosa, e così la Terra ha attratto (3) La proporzione da stabilire è la seguente: x : 16 piedi = 8000 miglia : x (FIGURA 7.4). Trasformando tutto in miglia p e tenendo conto che 1 miglio = 5280 piedi, si ha x : (16/5280) = 8000 : x, da cui segue x 2 = (16/5280) · 8000, ossia la relazione scritta nel testo. (N.d.T.) (4) La dimostrazione non è riportata in questo corso.

© 978-8808-22107-0

7.5 • Gravitazione universale

insieme se stessa tanto quanto ha potuto! Andando oltre, la Terra non è esattamente una sfera in quanto è rotante, e ciò genera effetti centrifughi che tendono a opporsi alla gravità vicino all’equatore. Risulta che la Terra dovrebbe essere ellittica e di questa ellisse possiamo ottenere le giuste dimensioni. Possiamo in questo modo dedurre che il Sole, la Luna e la Terra dovrebbero essere (pressoché) sferici, proprio per la legge di gravitazione. Che altro possiamo fare con la legge della gravitazione? Se osserviamo i satelliti di Giove possiamo comprendere tutto sul come essi girano attorno al pianeta. Incidentalmente, un tempo ci fu una certa difficoltà nello studio delle lune di Giove, difficoltà che merita di essere notata. Questi satelliti furono studiati molto accuratamente da Rømer, il quale notò che talvolta sembravano essere in anticipo sull’orario previsto, tal’altra in ritardo. (Si possono determinare i loro orari aspettando un lungo intervallo di tempo e ricavando quanto tempo occorre in media alle lune per compiere un’orbita.) Ora, essi erano in anticipo quando Giove era particolarmente vicino alla Terra e in ritardo quando Giove era più lontano dalla Terra. Sarebbe stata una cosa molto difficile da spiegare con la legge di gravitazione: sarebbe stata, infatti, la morte di questa straordinaria teoria se non vi fosse stata un’altra spiegazione. Se una legge non funziona anche in un solo posto dove deve funzionare, è necessariamente sbagliata. Ma la ragione di questa discrepanza era molto semplice e bella: occorre un po’ di tempo per vedere le lune di Giove a causa del tempo che la luce impiega a giungere da Giove alla Terra. Quando Giove è più vicino alla Terra il tempo è più breve, quando è più lontano il tempo è più lungo. Questo è il motivo per cui le lune sembrano essere, rispetto alla media, un po’ in anticipo o un po’ in ritardo, in dipendenza dal fatto che siano più vicine o più lontane dalla Terra. Questo fenomeno dimostrò che la luce non si propaga istantaneamente, e fornì la prima stima della velocità della luce. Ciò risale al 1676. Se tutti i pianeti si spingono e si tirano l’uno con l’altro, la forza che controlla il moto, diciamo, di Giove attorno al Sole non è soltanto la forza del Sole; vi è anche un’azione, per esempio, da Saturno. Questa forza, in realtà, non è grande perché il Sole ha una massa molto maggiore di Saturno, ma vi è una qualche attrazione, così l’orbita di Giove non dovrebbe essere un’ellisse perfetta, e non lo è; è lievemente diversa e «oscilla» attorno alla perfetta orbita ellittica. Un moto di questo tipo è un po’ più complicato. Sono stati fatti tentativi di analizzare i moti di Giove, di Saturno e di Urano in base alla legge di gravitazione. Gli effetti di ciascuno di questi pianeti su ciascun altro furono calcolati per vedere se le piccole deviazioni e irregolarità dei loro moti non potessero essere completamente spiegate con questa sola legge. Ecco, per Giove e Saturno tutto andò bene, ma Urano era «bizzarro». Si comportava in modo estremamente caratteristico. Non si spostava secondo un’ellisse perfetta, fatto giustificato dall’attrazione di Giove e di Saturno. Ma ciò non bastava a giustificare l’orbita di Urano, al punto che la legge della gravitazione corse il pericolo di essere abbandonata. Due astronomi, Adams e Le Verrier, indipendentemente, in Inghilterra e in Francia, formularono un’altra ipotesi: l’esistenza di un altro pianeta, scuro e invisibile, che non era mai stato osservato. Questo pianeta, N, poteva attrarre Urano. Essi calcolarono dove avrebbe dovuto trovarsi un pianeta simile per provocare le perturbazioni osservate. Inviarono messaggi ai rispettivi osservatori, dicendo, «Signori, puntate il vostro telescopio in un punto così e così e vedrete un nuovo pianeta». Spesso tutto dipende dalle persone con cui si lavora e dal fatto che vi prestino o meno attenzione. Gli scienziati dell’osservatorio prestarono attenzione a Le Verrier, osservarono il cielo e scoprirono l’esistenza del pianeta. L’altro osservatorio allora iniziò subito l’osservazione nei giorni che seguirono la scoperta e anch’esso vide il pianeta. Questa scoperta dimostrò che le leggi di Newton sono rigorosamente esatte per il Sistema solare; ma possono essere estese oltre le distanze relativamente piccole dei più vicini pianeti? La prima verifica è contenuta nella questione: le stelle si attirano l’una con l’altra come i pianeti? Ne abbiamo chiara evidenza positiva nelle stelle doppie. La FIGURA 7.6 mostra una stella doppia: due stelle molto vicine l’una all’altra (vi è anche inquadrata una terza stella, cosicché possiamo sapere che la fotografia non è stata rigirata). Le stelle sono anche mostrate come apparvero parecchi anni dopo (foto in basso). Vediamo che, relativamente alla stella «fissa», l’asse della coppia ha ruotato, cioè le due stelle stanno girando una attorno all’altra. Ruotano in accordo alla legge di Newton?

67

7.6 Un sistema di stelle doppie. FIGURA

68

Capitolo 7 • La teoria della gravitazione

7.7 Orbita di Sirio B rispetto a Sirio A.

© 978-8808-22107-0

FIGURA

.1 19 99. 00 9 .4 19 0 19 1. 02 2 .1 19 03 .1

99

19

04

.8

18

18

1896.9

18

97

.9

180°

270°

90° 1862 1866 1890

1870 1874 1886

0

2

4

6

1882

8

1878

10

12

Accurate misure delle posizioni relative di uno di questi sistemi di stelle doppie sono mostrate in FIGURA 7.7. Vi vediamo una bella ellisse la cui rilevazione, iniziata nel 1862, giunse a compimento attorno al 1904 (ormai sarà stata compiuta un’altra orbita). Tutto coincide con le leggi di Newton eccetto che la stella Sirio A non è nel fuoco. Perché questo? Perché il piano dell’ellisse non è nel «piano del cielo». Noi non osserviamo il piano dell’orbita perpendicolarmente, e quando un’ellisse è osservata con una certa inclinazione rimane un’ellisse ma il fuoco non appare nella giusta posizione. In questo modo possiamo analizzare le stelle doppie che si muovono l’una rispetto all’altra in accordo con le esigenze della legge gravitazionale. Che la legge della gravitazione è vera a distanze anche maggiori è indicato nella FIGURA 7.8. Se uno non vede l’azione della gravitazione qui, non ha anima! Questa immagine mostra una delle cose più belle del cielo: un ammasso globulare di stelle. Ognuno di questi puntini è una stella. Sebbene esse appaiano raggruppate in modo compatto verso il centro, ciò è dovuto alla fallibilità dei nostri strumenti. In realtà anche le distanze fra le stelle più centrali sono molto grandi ed esse si scontrano molto raramente. Vi sono più stelle all’interno che all’esterno e via via che ci allontaniamo dal centro diminuiscono sempre più. È ovvio che vi è attrazione fra queste stelle. È chiaro che la gravitazione esiste sulla scala di queste enormi dimensioni, forse 100 000 volte le dimensioni del Sistema solare. Andiamo avanti e osserviamo un’intera galassia, mostrata nella FIGURA 7.9. La forma di questa galassia indica un’ovvia tendenza ad agglomerarsi della materia che la compone. Naturalmente non possiamo provare che la legge, in questo caso, sia proprio di proporzionalità inversa al quadrato della distanza, ma soltanto che, a queste enormi dimensioni vi è ancora un’attrazione che tiene insieme tutte le cose. Si può dire, «Bene, tutto queFIGURA 7.8 Ammasso globulare di stelle. sto è molto intelligente, ma perché non è proprio un globo?». Perché sta ruotando e possiede un momento della quantità di moto che non può esaurire nella contrazione; si contrae essenzialmente in un piano. (Incidentalmente, se cercate un buon problema, gli esatti dettagli di come si siano formati i bracci e ciò che determina le forme di queste galassie non sono stati ancora compresi.) È comunque chiaro che la forma della galassia è dovuta alla gravitazione, anche se le complessità della sua struttura non ci hanno ancora permesso di analizzarla completamente. In una galassia abbiamo una scala da circa 50 000 a 100 000 anni luce. La distanza della Terra dal Sole è di 8,3 minuti luce, così potete avere un’idea dell’enormità di queste dimensioni. La gravità sembra esistere anche a dimensioni maggiori, come indicato dalla FIGURA 7.10, che mostra parecchie «piccole» cose raggruppate insieme. Si tratta di un ammasso galattico, del tutto

7.5 • Gravitazione universale

© 978-8808-22107-0

FIGURA

7.9

Una galassia.

FIGURA

7.10

Ammasso di galassie.

simile a un ammasso stellare. Così le galassie si attirano l’un l’altra a tali distanze che anch’esse sono raggruppate in ammassi. Forse la gravitazione esiste anche a distanze al di sopra di decine di milioni di anni luce; per quanto ne sappiamo ora, la gravità sembra andare fino all’infinito, diminuendo inversamente al quadrato della distanza. Non soltanto possiamo comprendere le nebulose, ma dalla legge di gravitazione possiamo anche procurarci alcune idee intorno all’origine delle stelle. Se abbiamo una grande nube di polvere e di gas, come è indicato in FIGURA 7.11, le attrazioni gravitazionali reciproche delle varie parti possono far formare piccoli raggruppamenti. Appena visibili nella figura sono delle «piccole» macchie scure, che possono essere l’inizio di cumuli di polvere e gas che, per gravitazione, cominciano a formare stelle. Se abbiamo assistito o meno alla formazione di una stella è ancora da discutere. La FIGURA 7.12 mostra l’unico fatto sperimentale che ci suggerisce che vi abbiamo assistito. Alla sinistra c’è un’immagine di una regione di gas con alcune stelle, presa nel 1947, e alla destra c’è un’altra immagine, presa soltanto 7 anni più tardi, che mostra due nuovi punti luminosi. Il gas si è accumulato? La gravità ha agito abbastanza energicamente e lo ha raccolto in un globo sufficientemente grande da far sì che la reazione nucleare stellare parta dall’interno e lo trasformi in una stella? Forse sì e forse no. Non è ragionevole che in soli sette anni possiamo essere stati così fortunati da vedere una stella cambiarsi in una forma visibile; è molto meno probabile che possiamo averne viste due!

FIGURA

7.11

Nube di polvere interstellare.

FIGURA

7.12

Formazione di nuove stelle?

69

Capitolo 7 • La teoria della gravitazione

70

7.6

© 978-8808-22107-0

L’esperimento di Cavendish

La gravitazione, dunque, si estende su enormi distanze. Ma, se vi è una forza fra ogni coppia di oggetti, dovremmo essere in grado di misurare la forza fra i nostri oggetti. Invece di osservare le stelle che ruotano l’una attorno all’altra, perché non possiamo prendere una palla di piombo e una pallina e osservare la pallina che va verso la palla di piombo? La difficoltà di questo esperimento quando è eseguito in un modo così semplice, è l’estrema debolezza della forza. Tutto deve essere affrontato con estrema cura, il che significa coprire l’apparato per isolarlo dall’aria, accertarsi che non sia carico elettricamente e così via; allora la forza può essere misurata. Fu misurata per la prima volta da Cavendish con un apparato che è mostrato schematicamente in FIGURA 7.13. Questo primo esperimento dimostrò la forza diretta fra due grandi palle di piombo fisse e due palle più piccole, sempre di piombo, fissate alle estremità di un braccio sostenuto da una sottilissima fibra, detta fibra di torsione. Misurando quanto si torce la fibra, si può misurare la forza, verificare che essa è inversamente proporzionale al quadrato della distanza e determinare la sua intensità. Così si può dedurre accuratamente il coefficiente G nella formula F=G

m m' m' m

7.13 Diagramma semplificato del dispositivo usato da Cavendish per verificare la legge della gravitazione universale per piccoli oggetti e misurare la costante gravitazionale G. FIGURA

mm 0 r2

Tutte le masse e le distanze sono conosciute. Voi dite: «Noi già lo sapevamo per la Terra». Sì, ma non conoscevamo la massa della Terra. Conoscendo G da questo esperimento e sapendo il valore della forza di attrazione della Terra, noi possiamo indirettamente conoscere il valore della massa della Terra! Questo esperimento è stato chiamato «pesata della Terra». Cavendish stesso affermò di pesare la Terra, ma quello che egli stava misurando era il coefficiente G della legge di gravità. Questo è l’unico modo con cui può essere determinata la massa della Terra. Tale coefficiente risulta essere G = 6,670 · 10

11

N·m2/kg2

È difficile esagerare l’importanza dell’effetto prodotto sulla storia della scienza da questo grande successo della teoria della gravitazione. Confrontate la confusione, la mancanza di fiducia, la conoscenza incompleta che prevaleva nelle età precedenti, quando vi erano interminabili dibattiti e paradossi, con la chiarezza e la semplicità di questa legge – questo fatto che tutti i satelliti, i pianeti e le stelle abbiano una legge tanto semplice che li governa, e inoltre che l’uomo possa comprenderla e dedurre come i pianeti debbano muoversi! Questa è la ragione dei successi delle scienze negli anni seguenti, perché questo fece sperare che gli altri fenomeni dell’universo potessero anch’essi ubbidire a leggi tanto semplici e belle.

7.7

Che cos’è la gravità?

Ma è questa una legge così semplice? Qual è il suo meccanismo? Tutto quello che abbiamo fatto è di descrivere come la Terra gira attorno al Sole, ma non abbiamo detto che cosa la fa girare. Newton non fece ipotesi su questo; si accontentò di trovare quello che accadeva senza penetrarne il meccanismo. Nessuno da allora ha scoperto il meccanismo. Questo carattere astratto è caratteristico delle leggi della fisica. La legge di conservazione dell’energia è un teorema che concerne quantità che devono essere calcolate e sommate insieme, senza menzione al meccanismo, e similmente le grandi leggi della meccanica sono leggi quantitative matematiche il cui meccanismo non è accessibile. Perché per descrivere la natura possiamo usare la matematica senza un meccanismo che la sostenga? Non si sa. Dobbiamo andare avanti perché in tal modo ricaviamo di più.

© 978-8808-22107-0

7.7 • Che cos’è la gravità?

71

00 00 0

Sono stati proposti molti meccanismi sulla gravitazione. È interessante considerarne uno, su cui molte persone hanno riflettuto nel tempo. Inizialmente uno è tutto eccitato e felice quando lo scopre, poi presto trova che non è vero. Fu proposto la prima volta verso il 1750. Supponiamo che vi siano molte particelle che si muovano nello spazio ad altissima velocità in tutte le direzioni, e che vengano assorbite soltanto debolmente nell’attraversare la materia. Quando sono assorbite comunicano alla Terra un impulso. Però, poiché ve ne sono un numero uguale in tutte le direzioni, tutti gli impulsi si fanno equilibrio. Ma quando il Sole è molto vicino, le particelle che vengono verso la Terra attraverso il Sole sono parzialmente assorbite, così ne giungono dal Sole meno che dalle altre direzioni. Quindi la Terra sente un netto impulso verso il Sole e non ci si mette molto a vedere che è inversamente proporzionale al quadrato della distanza – a causa della variazione dell’angolo solido sotteso dal Sole al variare della distanza. Cosa c’è di sbagliato in tale meccanismo? Esso implica alcune conseguenze che non sono accettabili. Questa idea particolare ha la seguente complicazione: la Terra, muovendosi attorno al Sole, dovrebbe venire in urto con più particelle che giungono dalle direzioni davanti a essa che da quelle alle sue spalle (quando correte sotto la pioggia, la pioggia sulla faccia è più forte che sulla nuca!). Quindi vi sarebbero più impulsi dati alla Terra di fronte; la Terra sentirebbe una resistenza al moto e rallenterebbe nella sua orbita. Si può calcolare quanto occorrerebbe alla Terra per fermarsi a causa di questa resistenza, e tale tempo non sarebbe abbastanza lungo da permettere alla Terra di restare sulla sua orbita, quindi questo meccanismo non può funzionare. Non è stato inventato alcun meccanismo che «spieghi» la gravità senza predire qualche altro fenomeno che non esiste. Ora discuteremo la possibile relazione della gravità con le altre forze. Al giorno d’oggi non vi è spiegazione della gravitazione in termini di altre forze. Non è un aspetto dell’elettricità o qualcosa di simile, cosicché non abbiamo spiegazione. Però la gravitazione e altre forze sono molto simili, ed è interessante notarne le analogie. Per esempio, la forza elettrica fra due oggetti carichi appare del tutto simile alla legge di gravitazione: la forza elettrica è una costante, preceduta dal segno meno, moltiplicata per il prodotto delle cariche, e varia inversamente al quadrato della distanza. Essa ha verso opposto alla forza gravitazionale, dato che le cariche uguali si respingono. Ma non è estremamente rimarchevole il fatto che entrambe le leggi implichino la stessa funzione della distanza? Forse gravitazione ed elettricità sono molto più strettamente legate di quanto pensiamo. Sono stati fatti molti tentativi per unificarle; la cosiddetta teoria del campo unificato non è che un tentativo molto elegante di combinare elettricità e gravitazione; ma, paragonando gravitazione ed elettricità, la cosa più interessante è ciò che riguarda le intensità relative delle forze. Ogni teoria che le comprenda entrambe dovrebbe anche dedurre l’intensità della gravità. Se consideriamo, facendo riferimento a unità naturali, la repulsione di due elettroni (carica universale della natura) dovuta all’elettricità e l’attrazione di due elettroni dovuta alle loro masse, possiamo misurare il rapporto fra repulsione elettrica e attrazione gravitazionale. Il rapporto è indipendente dalla distanza ed è una costante fondamentale della natura. Esso è mostrato in FIGURA 7.14. L’attrazione gravitazionale in rapporto alla Attrazione gravitazionale repulsione elettrica fra due elettroni è 1 diviso per 4,17 · 1042 ! = Repulsione elettrica Il problema è: da dove viene fuori un numero tanto grande? Non è accidentale come il rapporto del volume della Terra col volume di una pulce. = 1/4,17 · 1042 = Abbiamo considerato due aspetti naturali della stessa cosa, un elettrone. = 1/4,170 000 0 Questo fantastico numero è una costante naturale e implica qualcosa di 00 00 00 profondo nella natura. Da dove può uscire un numero così gigantesco? 0 Qualcuno dice che troveremo un giorno «l’equazione universale», e in essa una delle radici sarà questo numero. È molto difficile trovare un’equazione per la quale un numero così fantastico sia una radice naturale. Altre possibilità sono state considerate; una è di riferirlo all’età dell’universo. Chiaramente dobbiamo trovare altrove un altro numero grande. Ma esprimeremo in anni l’età dell’universo? No, poiché gli anni non sono 00 000 «naturali»; essi sono stati inventati dall’uomo. Come esempio di qualcosa di naturale consideriamo il tempo impiegato dalla luce per attraversare un protone, 10 24 secondi. Se paragoniamo questo tempo con l’età dell’uni- FIGURA 7.14 Intensità relativa delle interazioni verso, 2·1010 anni, la risposta è 10 42 . Esso ha circa lo stesso numero di zeri elettrica e gravitazionale fra due elettroni. 00 000 000 00

00

00

000

0

72

Capitolo 7 • La teoria della gravitazione

© 978-8808-22107-0

alla sua destra, così è stato proposto che la costante gravitazionale sia legata all’età dell’universo. Se così fosse la costante gravitazionale cambierebbe col tempo, perché invecchiando l’universo il rapporto fra l’età dell’universo e il tempo impiegato dalla luce per attraversare un protone dovrebbe gradualmente aumentare. È possibile che la costante gravitazionale vari col tempo? Naturalmente i cambiamenti sarebbero tanto piccoli che è molto difficile verificarlo. Una prova che possiamo prendere in considerazione è determinare quali siano stati gli effetti delle variazioni durante gli ultimi 109 anni, che è approssimativamente il tempo passato dall’apparizione della vita sulla Terra a oggi, e un decimo dell’età dell’universo. In questo tempo la costante di gravità dovrebbe essere aumentata all’incirca del 10%. Risulta che se consideriamo la struttura del Sole – l’equilibrio fra il peso della sua materia e la rapidità con la quale l’energia radiante è generata in esso – possiamo dedurre che, se la gravità fosse il 10% più forte, la lucentezza del Sole sarebbe molto maggiore del 10%: sarebbe aumentata con la sesta potenza della costante di gravità! Se calcoliamo quello che accadrebbe all’orbita della Terra al variare della gravità, troviamo che la Terra sarebbe stata più vicina. Nell’insieme la Terra sarebbe stata di circa 100 gradi più calda e tutta l’acqua non sarebbe stata nel mare ma vapore nell’aria, così la vita non avrebbe potuto aver origine nel mare. Quindi non crediamo che la costante di gravità cambi con l’età dell’universo. Ma argomenti simili a quello che abbiamo prospettato non sono del tutto convincenti e il problema non è completamente esaurito. È un fatto che la forza di gravità è proporzionale alla massa, la quantità che è fondamentalmente una misura di inerzia: di quanta fatica costi trattenere qualcosa che sta girando in cerchio. Quindi due oggetti, uno pesante e uno leggero che girano attorno a un oggetto più grande nello stesso cerchio e alla stessa velocità a causa della gravità, staranno insieme perché il ruotare richiede una forza che è maggiore per una massa maggiore. Cioè la gravità per una data massa è più forte proprio nell’esatta proporzione, per cui i due oggetti procederanno insieme. Se un oggetto fosse dentro l’altro resterebbe all’interno; è un equilibrio perfetto. Quindi Gagarin o Titov troverebbero cose «senza peso» all’interno della navicella spaziale; se fosse loro successo di lasciar andare un pezzetto di gesso, per esempio, esso avrebbe ruotato attorno alla Terra esattamente nello stesso modo dell’intera navicella spaziale, e così sarebbe sembrato che il gesso rimanesse sospeso nello spazio davanti a loro. È molto interessante il fatto che questa forza sia esattamente proporzionale alla massa con estrema precisione, poiché se non fosse esattamente proporzionale vi sarebbe qualche effetto in virtù del quale inerzia e peso differirebbero. L’assenza di un effetto del genere è stata verificata con gran cura per mezzo di un esperimento fatto per la prima volta nel 1909 da Eötvös e più recentemente da Dicke. Per tutte le sostanze sperimentate le masse e i pesi sono esattamente proporzionali entro un fattore di l su 1 000 000 000, o meno. È un esperimento veramente notevole.

7.8

Gravità e relatività

Un altro tema meritevole di discussione è la modifica di Einstein della legge della gravitazione di Newton. A dispetto dell’entusiasmo suscitato, la legge della gravitazione di Newton non è corretta! Essa fu modificata da Einstein per tener conto della teoria della relatività. Secondo Newton l’effetto della gravitazione è istantaneo, cioè se muovessimo una massa si sentirebbe istantaneamente una nuova forza a causa della nuova posizione di quella massa; se così fosse, potremmo inviare segnali a velocità infinita. Einstein avanzò argomenti che suggeriscono che non possiamo inviare segnali con velocità maggiore di quella della luce, così la legge della gravitazione deve essere errata. Correggendola, per tener conto dei ritardi, abbiamo una nuova legge, chiamata legge della gravitazione di Einstein. Una caratteristica di questa nuova legge, che è facilissima da capire, è questa: nella teoria della relatività di Einstein, ogni cosa che ha energia ha massa: massa nel senso che è attratta gravitazionalmente. Anche la luce che ha energia, ha una «massa». Quando un fascio di luce, che possiede energia, passa oltre il Sole, vi è un’attrazione dal Sole su di esso. Così la luce non va dritta, ma viene deflessa. Durante l’eclissi di Sole, per

© 978-8808-22107-0

7.8 • Gravità e relatività

esempio, le stelle che stanno attorno al Sole dovrebbero apparire spostate da dove esse sarebbero se il Sole non ci fosse, e ciò è stato osservato. Infine, paragoniamo la gravitazione con altre teorie. In anni recenti abbiamo scoperto che ogni massa è fatta di minuscole particelle e che vi sono diverse specie di interazioni, come le forze nucleari ecc. Nessuna di queste forze nucleari o elettriche è stata in grado finora di spiegare la gravitazione. Gli aspetti meccanico-quantistici della natura non sono stati ancora estesi alla gravitazione. Quando la scala è così piccola che abbiamo bisogno degli effetti quantistici, gli effetti gravitazionali sono così deboli che il bisogno di una teoria quantistica della gravitazione non si è ancora rivelato. D’altra parte per la coerenza delle nostre teorie fisiche sarebbe importante vedere se la legge di Newton, modificata nella legge di Einstein, possa essere modificata ulteriormente per essere coerente col principio di indeterminazione. Quest’ultima modifica non è stata ancora completata.

73

8

Il moto

8.1

TABELLA 8.1 Distanza s, in funzione del tempo t, percorsa da un’automobile.

t (min)

s (piedi)

0 1 2 3 4 5 6 7 8 9

0 1200 4000 9000 9500 9600 13 000 18 000 23 500 24 000

Descrizione del moto

Per trovare le leggi che regolano i differenti cambiamenti che hanno luogo nei corpi al trascorrere del tempo, dobbiamo essere in grado di descrivere i cambiamenti e avere qualche metodo per registrarli. Il cambiamento più semplice che si osserva in un corpo è il mutamento apparente della sua posizione col tempo, che noi chiamiamo moto. Consideriamo alcuni oggetti solidi con un segno permanente, che possiamo osservare e che chiameremo punto. Discuteremo il moto del piccolo segno che potrebbe essere il tappo del radiatore di un’automobile o il centro di una palla che cade, e cercheremo di descrivere il fatto che si muove e come si muove. Questi esempi potrebbero sembrare banali, ma nella descrizione del moto intervengono diverse sottigliezze. Molti cambiamenti, come, per esempio, la velocità di deriva di una nuvola che si sta spostando molto lentamente, ma si sta formando o vaporizzando rapidamente, o il cambiamento di idea di una donna, sono più difficili da descrivere del moto di un punto su un oggetto solido. Non conosciamo un modo semplice per analizzare un cambiamento di idea, ma poiché la nuvola può essere rappresentata o descritta mediante molte molecole, forse, in linea di principio, possiamo descrivere il moto della nuvola descrivendo il moto di tutte le sue singole molecole. In maniera analoga, forse anche i cambiamenti di idee possono avere una corrispondenza nei cambiamenti degli atomi all’interno del cervello, ma ancora non abbiamo questo tipo di conoscenza. A ogni modo questo è il motivo per cui cominciamo col moto dei punti; forse dovremmo pensarli come atomi, ma probabilmente è meglio essere inizialmente più imprecisi e pensarli semplicemente come piccoli oggetti: piccoli, cioè, rispetto alla distanza percorsa. Per esempio, nel descrivere il movimento di un’automobile che sta andando a cento miglia all’ora, non dobbiamo distinguere fra il davanti e il dietro della macchina. Senza dubbio vi sono piccole differenze, ma per semplicità diciamo «l’automobile», e non importa che i nostri punti non siano punti assoluti: per gli scopi attuali non è necessario essere estremamente precisi. Inoltre, per una prima considerazione dell’argomento, trascureremo le tre dimensioni del mondo. Dovremo concentrarci sul moto in una direzione, come quello di un’automobile su una strada. Dopo aver visto come descrivere il moto in una dimensione, ritorneremo alle tre dimensioni. Voi potete dire: «questa è una banalità», e infatti lo è. Come descrivere un moto unidimensionale, diciamo di un’automobile? Niente di più semplice. Fra i diversi modi possibili uno potrebbe essere il seguente. Per determinare la posizione di un’automobile a istanti differenti, misuriamo la sua distanza dal punto di partenza e registriamo tutte le osservazioni. Nella TABELLA 8.1 il parametro s rappresenta la distanza dell’automobile dal punto di partenza, espressa in piedi, e il parametro t il tempo espresso in minuti. La prima riga nella tabella rappresenta distanza zero e tempo zero: l’automobile non è ancora partita. Dopo 1 minuto è partita e ha percorso 1200 piedi. Quindi in 2 minuti va più lontano; osservate che nel secondo minuto ha percorso una distanza maggiore: ha accelerato; ma fra il terzo e il quarto minuto, e ancor più fra il quarto e il quinto minuto, è accaduto qualcosa: si è forse fermata a un semaforo? Quindi acquista di nuovo velocità e arriva a 13 000 piedi di distanza al termine di 6 minuti, a 18 000 piedi al termine di 7 minuti e a 23 500 piedi in 8 minuti; dopo 9 minuti è arrivata soltanto a 24 000 piedi di distanza perché nell’ultimo minuto è stata fermata da un poliziotto.

8.1 • Descrizione del moto

© 978-8808-22107-0

75

400

8.1 Diagramma della distanza, in funzione del tempo, per un’automobile.

300

FIGURA

FIGURA

Tratto di caduta (piedi)

Distanza (piedi) 25 000 20 000

8.2 Diagramma della distanza, in funzione del tempo, per un corpo che cade.

15 000 200

10 000

100

5000

2

4

6

8

10

1

Tempo (min)

2

3

4

5

Tempo (s)

Questo è un modo di descrivere il moto. Un altro modo è dato dall’impiego di un grafico. Se riportiamo il tempo sull’asse orizzontale e la distanza su quello verticale, otteniamo una curva simile a quella mostrata in FIGURA 8.1. Al crescere del tempo, la distanza cresce, dapprima molto lentamente poi più rapidamente e di nuovo molto lentamente verso i 4 minuti; quindi cresce di nuovo per pochi minuti e infine ai 9 minuti l’aumento della distanza appare cessato. Queste osservazioni possono essere fatte dal grafico, senza una tabella. Ovviamente per una descrizione completa si dovrebbe sapere dove si trova l’automobile anche nei punti intermedi fra un minuto e il successivo, ma supponiamo che il diagramma abbia un senso, cioè che l’automobile occupi una posizione in tutti i tempi intermedi. Il moto di un’automobile è complicato. Come altro esempio prendiamo qualcosa che si muove in un modo più semplice, seguendo leggi più semplici: una palla che cade. La TABELLA 8.2 dà il tempo in secondi e la distanza in piedi per un corpo che cade. A zero secondi la palla parte da zero piedi e al termine di 1 secondo è caduta di 16 piedi. Dopo 2 secondi è caduta di 64 piedi, dopo 3 secondi di 144 piedi e così via; se i numeri della tabella vengono riportati in un diagramma, otteniamo la curva parabolica di FIGURA 8.2. L’equazione di questa curva può essere scritta come s = 16 t 2

(8.1)

Questa formula ci permette di calcolare le distanze a ogni istante. Potreste dire che dovrebbe esserci una formula anche per il primo grafico. In realtà una tale formula si può scrivere astrattamente come s = f (t) (8.2) la quale significa che s è una quantità dipendente da t o, in linguaggio matematico, s è funzione di t. Poiché non sappiamo di quale funzione si tratti, non vi è modo di poterla scrivere in una forma algebrica definita. Abbiamo visto due esempi di moto, descritti adeguatamente mediante concetti molto semplici, senza sottigliezze. Tuttavia le sottigliezze ci sono, e ce ne sono diverse. In primo luogo, che cosa intendiamo con tempo e spazio? Risulta che questi profondi quesiti filosofici devono essere analizzati in fisica con molta cura, il che non è facile da farsi. La teoria della relatività mostra che le nostre idee di spazio e di tempo non sono così semplici come si può pensare a prima vista. Tuttavia per i nostri scopi attuali e per la precisione di cui abbiamo bisogno inizialmente, non è necessario essere molto accurati nel definire le cose con precisione. Forse direte: «È terribile! Ho imparato che nella scienza ogni cosa deve essere definita precisamente». Non possiamo definire ogni cosa con precisione! Se tentiamo di farlo finiamo in quella paralisi del pensiero che coinvolge due filosofi, seduti l’uno di fronte all’altro, il primo dei quali dice: «Tu non sai ciò di cui stai parlando!». E il secondo replica: «Che cosa intendi con sai? Che cosa intendi con parlando? Che cosa intendi con tu?», e così via. Per discutere in modo costruttivo, dobbiamo essere d’accordo che stiamo parlando pressappoco della stessa cosa. Sul tempo ne sapete quanto basta per il momento, ma ricordate che vi sono alcune sottigliezze che devono essere discusse: le vedremo in seguito.

8.2 Distanza s, in funzione del tempo t, percorsa da un corpo che cade. TABELLA

t (s)

s (piedi)

0 1 2 3 4 5 6

0 16 64 144 256 400 576

76

Capitolo 8 • Il moto

© 978-8808-22107-0

Un’altra sottigliezza coinvolta, già altrove riportata, è che dovrebbe esser possibile immaginare che il punto in movimento che stiamo osservando sia sempre situato in qualche posizione. (Naturalmente, quando lo stiamo guardando c’è, ma può essere che quando guardiamo altrove non ci sia.) Risulta che nel moto degli atomi anche tale concetto è falso: non possiamo trovare un contrassegno su un atomo e osservare che si muove. Nella meccanica quantistica dovremo considerare tale sottigliezza. Ma impariamo anzitutto a vedere quali sono i problemi prima di introdurre le complicazioni, e in seguito saremo in una situazione migliore per fare correzioni, alla luce della più recente conoscenza sull’argomento. Accetteremo quindi un punto di vista elementare riguardo a tempo e spazio. Sappiamo che cosa siano questi concetti in maniera approssimativa, e quelli che hanno guidato un’automobile sanno che cosa significhi velocità.

8.2

Velocità

Anche se sappiamo approssimativamente che cosa significhi «velocità», restano alcune sottigliezze piuttosto profonde; consideriamo il fatto che gli eruditi greci non furono mai capaci di descrivere in modo adeguato problemi in cui interveniva la velocità. La sottigliezza comincia quando cerchiamo di capire esattamente che cosa si intende per «velocità». I greci finirono per fare gran confusione su questo argomento, e dovette essere scoperta una nuova branca della matematica, oltre la geometria e l’algebra dei greci, degli arabi e dei babilonesi. Come dimostrazione della difficoltà, cerchiamo di risolvere con la semplice algebra, questo problema: un pallone sta gonfiandosi in modo tale che il suo volume aumenta di 100 cm3 /s; a quale velocità cresce il raggio quando il volume è 1000 cm3 ? I greci erano alquanto disorientati da problemi di questo tipo, essendo naturalmente aiutati in questo da alcuni greci confusionari. Per dimostrare che a quei tempi vi erano difficoltà nei ragionamenti relativi alla velocità, Zenone inventò un gran numero di paradossi, dei quali ne ricorderemo uno per illustrare il suo punto di vista, secondo il quale vi sono difficoltà ovvie nell’occuparsi del moto. «Ascoltate», egli diceva, «il seguente ragionamento: Achille corre 10 volte più veloce della tartaruga, tuttavia non potrà mai raggiungerla. Supponiamo di dare inizio a una gara di velocità in cui la tartaruga abbia 100 metri di vantaggio su Achille; allora quando Achille ha percorso i 100 metri fino al punto in cui era la tartaruga, questa è avanzata di 10 metri avendo corso a un decimo della velocità di Achille. Ora Achille ha da percorrere altri 10 metri per riuscire a raggiungere la tartaruga, ma arrivando alla fine del suo percorso trova che la tartaruga è ancora un metro davanti a lui; percorrendo un altro metro trova la tartaruga avanti di 10 centimetri, e così via, all’infinito. Quindi a ogni istante la tartaruga è sempre in vantaggio su Achille, e Achille non potrà mai raggiungere la tartaruga». Cosa c’è di sbagliato in questo? C’è che un intervallo di tempo può essere suddiviso in un numero infinito di parti, proprio come la lunghezza di una linea può essere divisa in un numero infinito di parti, dividendo ripetutamente per due. E così, sebbene nel ragionamento vi sia un numero infinito di passi fino al punto in cui Achille raggiunge la tartaruga, questo non implica che occorra un tempo infinito. Vediamo da questo esempio che vi sono in verità alcune sottigliezze, nei ragionamenti relativi alla velocità. Per comprendere le sottigliezze in modo più chiaro vi ricordo una barzelletta che certamente avrete già sentito. Una signora in automobile viene fermata da un vigile; il vigile le si avvicina e dice: «Signora, lei sta andando a 60 miglia all’ora!». La signora risponde: «È impossibile, sto viaggiando da 7 minuti soltanto. È ridicolo: come posso andare a 60 miglia all’ora, se non è un’ora che sto viaggiando?». Come le rispondereste se foste il vigile? Naturalmente se foste realmente il vigile, non ci sarebbero sottigliezze; voi direste semplicemente: «Lo racconti al giudice!». Ma supponiamo di non avere questa scappatoia, di affrontare il problema in modo più onesto e intellettuale e di cercare di spiegare a questa signora che cosa intendiamo con l’idea che lei stesse andando a 60 miglia all’ora. Che cosa intendiamo esattamente? Diciamo: «Quello che vogliamo dire, signora, è questo: se lei continuasse ad andare nello stesso modo come sta andando adesso, nella prossima ora farebbe 60 miglia». La signora potrebbe rispondere: «Il mio piede non era

© 978-8808-22107-0

8.2 • Velocità

sull’acceleratore, e l’automobile stava rallentando, così se continuassi ad andare in quel modo, non percorrerei 60 miglia». Oppure consideriamo la palla che cade e supponiamo di volerne conoscere la velocità dopo 3 secondi, se la palla continua ad andare nel modo in cui sta andando. Cosa significa ciò? Mantenere l’accelerazione? Andare più veloce? No! Mantenere la stessa velocità. Ma è quanto stiamo cercando di definire! Perché se la palla continua ad andare come sta andando, essa continuerà ad andare come sta andando. Quindi bisogna definire meglio la velocità. Che cosa deve essere mantenuto costante? La signora potrebbe anche arguire in questo modo: «Se continuassi ad andare come sto andando, ancora per un’ora, finirei contro il muro alla fine della strada!». Non è così facile da dire quello che intendiamo. Diversi fisici pensano che la misura sia la sola definizione di ogni cosa. Ovviamente, allora, dovremmo usare lo strumento che misura la velocità – il tachimetro – e dire: «Signora, guardi, il suo tachimetro segnava 60». Così lei direbbe: «Il mio tachimetro è rotto, non segna affatto». Significa forse che l’automobile è ferma? Crediamo che ci sia qualcosa da misurare prima di costruire il tachimetro. Soltanto in questo caso possiamo dire, per esempio, «Il tachimetro non sta funzionando bene» oppure «Il tachimetro è rotto». Si tratterebbe di un’affermazione priva di significato se la velocità, indipendentemente dal tachimetro, non avesse senso. Così, ovviamente, c’è nella nostra mente un concetto che è indipendente dal tachimetro e il tachimetro ha senso soltanto come misura applicata a questo concetto. Vediamo se possiamo ottenere una definizione migliore del concetto. Diciamo: «Sì, naturalmente, signora, lei urterebbe quel muro prima di un’ora, ma se viaggiasse per un secondo, farebbe 88 piedi; lei andrebbe a 88 piedi al secondo e, continuando ad andare, nel secondo successivo percorrerebbe 88 piedi; e il muro è più lontano di questa distanza». Lei direbbe: «Sì, ma non vi sono leggi che vietino di andare a 88 piedi al secondo! C’è soltanto una legge che vieta di andare a 60 miglia all’ora». «Ma», replichiamo, «è la stessa cosa». Se veramente è la stessa cosa, non dovrebbe essere necessario far uso di questa circonlocuzione sugli 88 piedi al secondo. Infatti la palla che cade non potrebbe andare allo stesso modo neppure per un secondo, perché sta cambiando velocità e noi dovremo definire in qualche modo la velocità. Ora sembra che stiamo procedendo nel modo giusto. Va pressappoco così: se la signora mantenesse l’andatura per 1/1000 di un’ora, percorrerebbe 1/1000 di 60 miglia. In altre parole essa non deve mantenere l’andatura per l’intera ora; il punto è che per un momento lei sta andando a quella velocità. Ora, ciò che intendiamo è che se la signora viaggiasse per un tempo un po’ più lungo, la distanza percorsa in più sarebbe uguale a quella percorsa da un’automobile che viaggiasse con una velocità costante di 60 miglia all’ora. Forse l’idea degli 88 piedi per secondo è giusta; vediamo che tratto la signora ha percorso nell’ultimo secondo: dividiamo per 88 piedi e se il risultato è 1 la velocità era 60 miglia all’ora. In altre parole possiamo trovare la velocità nel modo seguente; domandiamoci: di quanto ci spostiamo in un piccolissimo intervallo di tempo? Dividiamo la distanza per il tempo e il risultato è la velocità. Ma l’intervallo di tempo dovrebbe essere preso più piccolo possibile, più piccolo è e meglio è, poiché durante l’intervallo di tempo potrebbero aver luogo alcuni cambiamenti. Sarebbe un’idea assurda considerare un intervallo di un’ora per un corpo che cade. Se prendiamo un secondo, il risultato è abbastanza buono per un’automobile, poiché durante questo tempo la velocità non può cambiare molto, ma non è altrettanto buono per un corpo che cade; così per ottenere la velocità sempre più accuratamente dovremmo usare intervalli di tempo via via più piccoli. Quello che dovremmo fare è prendere un milionesimo di secondo, trovare di quanto si è spostata l’automobile e dividere la distanza per questo intervallo di tempo. Il risultato è la distanza percorsa per secondo, ciò che noi chiamiamo velocità, cosicché possiamo definirla in tal modo. Questa è una risposta che avrà successo con la signora, o piuttosto questa è la definizione che useremo. La precedente definizione implica un concetto nuovo, concetto che non era noto ai greci in una forma generale. Tale idea è di prendere una distanza infinitesima e il corrispondente intervallo di tempo infinitesimo, farne il rapporto e osservare che cosa accade quando l’intervallo di tempo usato diventa sempre più piccolo. In altre parole, prendere il limite della distanza percorsa divisa

77

78

Capitolo 8 • Il moto

© 978-8808-22107-0

per il tempo impiegato, quando il tempo considerato diventa via via più piccolo, all’infinito. Questa idea fu di Newton e di Leibniz, indipendentemente, ed è l’inizio di una nuova branca della matematica chiamata calcolo differenziale. Il calcolo fu inventato per descrivere il moto e fu applicato per la prima volta al problema di definire che cosa si intende per andare a «60 miglia all’ora». Cerchiamo di definire un po’ meglio la velocità. Supponiamo che in un piccolo intervallo di tempo ✏ l’automobile, o un altro corpo, percorra una piccola distanza x; allora la velocità v è definita come x v= ✏ approssimazione che diventa sempre migliore via via che si fa uso di un ✏ sempre più piccolo. Se si desidera un’espressione matematica, possiamo dire che la velocità è uguale al limite dell’espressione x/✏ quando ✏ diventa sempre più piccolo, ossia v = lim

✏ !0

x ✏

(8.3)

Non possiamo fare la stessa cosa con la signora dell’automobile, perché la tabella è incompleta. Sappiamo soltanto dove essa si trovava di minuto in minuto; possiamo avere un’idea solo approssimativa del fatto che essa stesse andando a 5000 piedi/min durante il settimo minuto, ma non sappiamo se esattamente al settimo minuto essa abbia aumentato la velocità e se la velocità fosse per esempio di 4900 piedi/min all’inizio del sesto minuto e se sia attualmente di 5100 piedi/min, o qualche altra, poiché non conosciamo esattamente in dettaglio la situazione intermedia. Così potremmo, in realtà, calcolare la velocità da una tabella di questo tipo soltanto se essa fosse stata completata con un numero infinito di dati. D’altra parte, quando abbiamo una formula matematica completa, come nel caso di un corpo che cade (equazione (8.1)), allora è possibile calcolare la velocità, poiché è possibile calcolare la posizione a qualsiasi istante. Consideriamo, come esempio, il problema di determinare la velocità di una palla che cade, a un particolare istante, 5 secondi. Un modo per far questo è di vedere dalla TABELLA 8.2 quello che la palla ha fatto durante il quinto secondo: si è spostata di 400 256 = 144 piedi, viaggiando così a 144 piedi/s; però questo è sbagliato, perché la velocità sta cambiando; essa è in media, durante questo intervallo, 144 piedi/s, ma la palla sta aumentando di velocità e, in realtà, al termine dell’intervallo, va più veloce di 144 piedi/s. Vogliamo trovare esattamente di quanto. La tecnica da usare in questo procedimento è la seguente: sappiamo dove si trovava la palla allo scoccare dei 5 s. Dopo 5,1 s, la distanza complessiva percorsa è 16 (5,1)2 = 416,16 piedi (vedi equazione (8.1)). Dopo 5 s la palla era caduta di 400 piedi e nell’ultimo decimo di secondo di 416,16 400 = 16,16 piedi. Poiché 16,16 piedi in 0,1 s equivale a 161,6 piedi/s, questo è più o meno il valore della velocità, ma non è del tutto corretto. A quale istante corrisponde questa velocità: a 5 s, a 5,1 s o all’istante intermedio 5,05 s? Lasciamo perdere: il problema era di trovare la velocità dopo 5 secondi e noi non abbiamo esattamente quel valore; dobbiamo lavorare meglio. Così, prendiamo 1 millesimo di secondo dopo i 5 s, ossia 5,001 s, e calcoliamo la caduta totale come s = 16 (5,001)2 = 16 (25,010 001) = 400,160 016 piedi Negli ultimi 0,001 s la palla è caduta di 0,160 016 piedi, e se dividiamo questo numero per 0,001 s otteniamo la velocità di 160,016 piedi/s. Questo è un valore più vicino, molto vicino, ma non ancora esatto. Dovrebbe ora essere evidente quello che dobbiamo fare per trovare esattamente la velocità. Per eseguire il calcolo matematico enunciamo il problema in un modo un po’ più astratto: trovare la velocità a un particolare istante t 0 che nel problema originale era 5 s. La distanza percorsa al tempo t 0 , che indichiamo con s0 , è 16 t 02 , ossia, in questo caso, 400 piedi. Per trovare la velocità, domandiamoci: «Al tempo t 0 + (una piccola quantità), ossia t 0 + ✏, dov’è il corpo?». La nuova posizione è 16 (t 0 +✏)2 = 16 t 02 +32 t 0 ✏ +16 ✏ 2 . Così è più in là di prima, poiché prima si trovava a 16 t 02 . Chiameremo questa distanza s0 + (una piccola quantità aggiuntiva), ossia s0 + x (se x è la quantità in più). Ora, se sottraiamo la distanza all’istante t 0 da quella all’istante t 0 + ✏, otteniamo x, la distanza percorsa in più, come x = 32 t 0 ✏ + 16 ✏ 2

8.3 • Velocità come derivata

© 978-8808-22107-0

Il valore di prima approssimazione della velocità è v=

x = 32 t 0 + 16 ✏ ✏

(8.4)

Il valore esatto della velocità è quello del rapporto x/✏ quando ✏ diventa trascurabilmente piccolo. In altre parole, dopo aver fatto il rapporto, prendiamo il limite quando ✏ diventa sempre più piccolo, cioè si approssima a 0. L’equazione si riduce a v (al tempo t 0 ) = 32 t 0 Essendo nel nostro caso t 0 = 5 s, la soluzione è v = 32 · 5 = 160 piedi/s. Alcune righe sopra, dove abbiamo preso ✏ prima come 0,1 s e successivamente come 0,001 s, il valore ottenuto per v era un po’ più grande di questo, ma adesso vediamo che la velocità reale è esattamente 160 piedi/s.

8.3

Velocità come derivata

Il procedimento che abbiamo sviluppato è usato così spesso in matematica che per convenienza alle nostre quantità ✏ e x sono state assegnate notazioni particolari. In questa notazione l’✏ usato sopra diventa t e x diventa s. Questo t indica «una quantità aggiuntiva di t», e contiene implicitamente la possibilità di poter essere reso più piccolo. Il prefisso non è un moltiplicatore, così come sen ✓ non significa s · e · n · ✓: definisce semplicemente un incremento temporale, e ci ricorda la sua particolare caratteristica. s ha un significato analogo per la distanza s. Poiché non è un fattore, esso non può essere cancellato nel rapporto s/ t per dare s/t, proprio come il rapporto sen ✓/ sen 2✓ non può essere ridotto a 1/2, semplificando. In questa notazione la velocità è uguale al limite di s/ t, al diminuire di t, ossia v = lim

t!0

s t

(8.5)

Questa espressione, in realtà, è uguale a quella precedente, l’equazione (8.3), che conteneva ✏ e x, ma ha il vantaggio di mostrare che qualcosa sta cambiando e di rappresentare ciò che sta cambiando. Incidentalmente otteniamo con buona approssimazione un’altra legge, la quale ci dice che lo spostamento di un punto che si muove è dato dalla velocità per l’intervallo temporale, ossia s = v t. Questo enunciato è vero soltanto se la velocità non cambia durante l’intervallo di tempo e questa condizione è vera soltanto al limite per t che va a 0. I fisici preferiscono scrivere ds = v dt, poiché con dt indicano t quando è molto piccolo; con questo significato l’espressione è valida con un’approssimazione stretta. Se t fosse troppo grande, la velocità potrebbe cambiare durante questo intervallo e l’approssimazione diverrebbe meno precisa. Per un tempo dt che tende a zero, ds = v dt esattamente. Con questa notazione possiamo scrivere l’equazione (8.5) come v = lim

t!0

s ds = t dt

La quantità ds/dt si chiama «derivata di s rispetto a t» (questo linguaggio aiuta a seguire il corso di ciò che è stato cambiato), e il complicato processo per trovarla si chiama «fare una derivata o differenziare». I ds e i dt che appaiono separatamente si chiamano differenziali di s e di t. Per familiarizzare con le parole, diciamo che abbiamo trovato la derivata della funzione 16 t 2 , o che la derivata (rispetto a t) di 16 t 2 è 32 t. Quando si impara a usare le parole, le idee si capiscono più facilmente. Come esercizio calcoliamo la derivata di una funzione più complicata. Consideriamo la formula s = At 3 + Bt + C, che può rappresentare il moto di un punto. I simboli A, B e C indicano costanti numeriche, come nella ben nota forma generale di un’equazione quadratica. Partendo dalla formula del moto vogliamo trovare la velocità a ogni istante. Per trovare nel modo più

79

80

Capitolo 8 • Il moto

© 978-8808-22107-0

TABELLA

8.3

Una piccola raccolta di derivate.

Funzione

Derivata

s = tn

ds = nt n –1 dt

s = cu

ds du =c dt dt

s = u + v + w + ...

ds du dv dw = + + + ... dt dt dt dt

s=c

ds =0 dt

s = u a v b w c ...

ds a du b dv c dw =s + + +... dt u dt v dt w dt

(

)

s, u, v, w sono funzioni arbitrarie di t ; a, b, c, n sono costanti arbitrarie.

elegante la velocità, cambiamo t in t + t e osserviamo che allora s diventa s + un certo s; troviamo quindi s in funzione di t. Vale a dire s + s = A (t + t)3 + B (t + t) + C = = At 3 + Bt + C + 3At 2 t + B t + 3At ( t)2 + A ( t)3 ma poiché risulta

s = At 3 + Bt + C s = 3At 2 t + B t + 3At ( t)2 + A ( t)3

Ma noi non vogliamo s: vogliamo s diviso per t. Dividiamo per t la precedente equazione, ottenendo s = 3At 2 + B + 3At ( t) + A ( t)2 t Quando t va a 0, il limite di s/ t è ds/dt e vale ds = 3At 2 + B dt Questo è il processo fondamentale del calcolo, la differenziazione delle funzioni. Esso è anche più semplice di quanto sembri. Osserviamo che quando gli sviluppi contengono un qualsiasi termine con t elevato al quadrato, al cubo o a una potenza di ordine superiore, questi termini possono essere eliminati subito, perché vanno a 0 quando si fa il limite. Dopo un po’ di esercizio il processo diventa più facile, poiché si conosce ciò che va trascurato. Esistono diverse regole o formule per differenziare diversi tipi di funzioni. Esse possono essere ricordate a memoria o trovate in apposite tabelle. Una breve lista di derivate si trova nella TABELLA 8.3.

8.4

Distanza come integrale

Dobbiamo ora discutere il problema inverso. Supponiamo di avere, anziché una tabella di distanze, una tabella di velocità a tempi diversi a partire da zero. Per la palla che cade, i tempi e le velocità sono riportati nella TABELLA 8.4. Si potrebbe costruire una tabella simile relativa alla velocità dell’automobile, registrando le letture del tachimetro ogni minuto o ogni mezzo minuto. Se sappiamo a ogni istante a quale velocità sta andando la macchina, possiamo determinare di quanto si sposta?

8.5 • Accelerazione

© 978-8808-22107-0

Il problema è esattamente l’inverso di quello risolto in precedenza: ora abbiamo dato la velocità e chiesto di trovare la distanza. Come trovare la distanza conoscendo la velocità? Se la velocità dell’automobile non è costante, e la signora va a 60 miglia all’ora per un momento, quindi riduce la velocità e poi l’aumenta e così via, come possiamo determinare la distanza percorsa? È facile. Usiamo lo stesso concetto ed esprimiamo la distanza mediante infinitesimi. Diciamo: «Durante il primo secondo la sua velocità era così e così, e dalla formula s = v t possiamo calcolare di quanto si è spostata l’automobile a quella velocità nel primo secondo». Nel secondo successivo la velocità è quasi la stessa, ma leggermente diversa; possiamo calcolare di quanto si è spostata la signora in questo secondo, moltiplicando per il tempo la nuova velocità. Procediamo allo stesso modo per ogni secondo fino alla fine del viaggio. Abbiamo così un certo numero di piccole distanze, e la distanza totale sarà la somma di tutte queste piccole P distanze. Cioè, la distanza sarà la somma delle velocità moltiplicate per i tempi, ossia s = v t, dove la lettera greca ⌃ (sigma) sta a indicare la somma. Per essere più precisi, essa è la somma della velocità a un certo istante, diciamo l’i-esimo, moltiplicata per t: X s= v(t i ) t (8.6) i

La regola per i tempi è che t i+1 = t i + t. Tuttavia la distanza ottenuta con questo metodo non è esatta, poiché la velocità cambia durante l’intervallo di tempo t. Se prendiamo degli intervalli di tempo abbastanza piccoli, la somma è più precisa, così che possiamo prenderli sempre più piccoli fino a ottenere la precisione desiderata. Il valore esatto di s è X s = lim v(t i ) t (8.7) t!0

i

I matematici hanno ideato per questo limite un simbolo, analogo al simbolo del differenziale. si trasforma in «d» per ricordarci che l’intervallo di tempo è il più piccolo possibile; la velocità è ⇤ allora chiamata v al tempo t, e l’addizione è scritta come una somma con una «s» grande, (dal latino summa), che è stata deformata e che è chiamata segno di integrale. Così scriviamo ⌅ s = v(t) dt (8.8) Questo processo di sommare insieme tutti questi termini è chiamato integrazione ed è il processo inverso ⇤della differenziazione. La derivata di questo integrale è v, così un operatore, d, annulla l’altro, . Si possono ottenere le formule per gli integrali usando a rovescio le formule per le derivate, poiché esse sono legate le une alle altre inversamente. Così si può costruire la tabella degli integrali differenziando ogni sorta di funzione. Da ogni formula che contiene un differenziale otteniamo una formula integrale invertendola. Ogni funzione può essere differenziata analiticamente, cioè l’operazione si può eseguire algebricamente e porta a una funzione definita. Non è possibile, invece, scrivere in una maniera semplice un valore analitico per un integrale qualsiasi. Potete calcolarlo, per esempio, facendo la somma di prima, ripetendola con un intervallo t più piccolo, e poi con un intervallo ancora più piccolo fino a ottenere un risultato quasi esatto. In generale, data una particolare funzione, non è possibile trovare analiticamente quale sia l’integrale. Si può sempre cercare di trovare una funzione che, differenziata, dia la funzione desiderata, ma può darsi che non la si trovi e che non esista nel senso di essere esprimibile mediante funzioni già note.

8.5

Accelerazione

Il successivo passo nello sviluppo delle equazioni del moto consiste nell’introdurre un’altra idea che, oltre il concetto di velocità, porta a quello di variazione di velocità, chiedendoci: «come cambia la velocità?». Nei capitoli precedenti abbiamo discusso casi in cui forze producono variazioni di velocità. Forse avrete udito, con grande emozione, che alcune automobili possono

81

8.4 Velocità v in funzione del tempo t di una palla che cade. TABELLA

t (s)

v (piedi/s)

0 1 2 3 4

0 32 64 96 128

82

Capitolo 8 • Il moto

© 978-8808-22107-0

arrivare da ferme a 60 miglia all’ora in dieci secondi netti. Da un’impresa di questo genere possiamo vedere con quale rapidità varia la velocità, però soltanto in media. Ciò che discuteremo ora è il grado di complessità successivo, cioè come cambia la velocità. In altre parole, in un secondo, di quanti piedi al secondo varia la velocità, cioè di quanti piedi al secondo per secondo? In precedenza abbiamo derivato la formula v = 32 t, i cui valori sono riportati nella TABELLA 8.4, per la velocità di un corpo che cade; vogliamo trovare ora di quanto varia, per secondo, la velocità; questa quantità si chiama accelerazione. Si definisce accelerazione la rapidità di variazione della velocità nel tempo. Dalla discussione precedente ne sappiamo ormai abbastanza per scrivere l’accelerazione come la derivata dv/dt così come la velocità è la derivata della distanza. Se differenziamo la formula v = 32 t otteniamo, per un corpo che cade, dv a= = 32 (8.9) dt (Per differenziare il termine 32 t possiamo utilizzare il risultato ottenuto in un problema precedente, dove abbiamo visto che la derivata di Bt è semplicemente B, una costante. Così, ponendo B = 32, otteniamo subito che la derivata di 32 t è 32.) Questo significa che la velocità di un corpo che cade cambia sempre di 32 piedi al secondo, per secondo. Vediamo anche dalla TABELLA 8.4 che la velocità cresce, ogni secondo, di 32 piedi/s. Questo è un caso molto semplice, perché di solito le accelerazioni non sono costanti. Il motivo per cui, in questo caso, l’accelerazione è costante è che è costante la forza agente sul corpo che cade, e la legge di Newton dice che l’accelerazione è proporzionale alla forza. Come ulteriore esempio, troviamo l’accelerazione nel problema che abbiamo già risolto per la velocità. Partendo da s = At 3 + Bt + C abbiamo ottenuto, per v = ds/dt,

v = 3At 2 + B

Poiché l’accelerazione è la derivata della velocità rispetto al tempo, dobbiamo differenziare l’ultima espressione di sopra. Ricordiamo la regola che la derivata dei due termini di destra è uguale alla somma delle derivate dei singoli termini. Per differenziare il primo di questi, invece di passare di nuovo attraverso il processo fondamentale, osserviamo che abbiamo già differenziato un termine quadratico quando differenziammo 16t 2 , e il risultato fu di raddoppiare il coefficiente numerico e di cambiare t 2 in t; presumiamo che la stessa cosa accadrà questa volta e potrete voi stessi controllare il risultato. La derivata di 3At 2 sarà allora 6At. Successivamente differenziamo B, un termine costante; ma per una regola stabilita precedentemente, la derivata di B è zero; di conseguenza questo termine non contribuisce all’accelerazione. Quindi il risultato finale è a=

dv = 6At dt

Stabiliamo, come riferimento, due formule molto utili, che si possono ottenere mediante integrazione. Se un corpo parte dalla quiete e si muove con accelerazione costante g, la sua velocità v a ogni istante t è data da v = gt La distanza che copre nello stesso tempo è s=

1 2 gt 2

Per la scrittura delle derivate si usano diverse notazioni matematiche. Poiché la velocità è ds/dt e l’accelerazione è la derivata temporale della velocità, possiamo anche scrivere ! d2 s d ds = 2 (8.10) a= dt dt dt che sono modi comuni di scrivere una derivata seconda.

8.5 • Accelerazione

© 978-8808-22107-0

Abbiamo un’altra legge secondo cui la velocità è uguale all’integrale dell’accelerazione. È esattamente l’opposto di a = dv/dt; abbiamo visto che la distanza è l’integrale della velocità, quindi la distanza si può trovare integrando due volte l’accelerazione. Nella precedente discussione il moto era unidimensionale, e lo spazio a disposizione ci permette soltanto una breve discussione sul moto in tre dimensioni. Consideriamo una particella P che si muove in tre dimensioni in un modo qualunque. All’inizio del capitolo abbiamo discusso il caso unidimensionale di un’automobile in movimento, considerando la distanza dell’automobile dal suo punto di partenza, a tempi diversi. Abbiamo poi discusso la velocità in funzione delle variazioni nel tempo di queste distanze e l’accelerazione in funzione delle variazioni di velocità. Possiamo trattare il moto tridimensionale in modo analogo. Sarà più semplice illustrare il moto su un diagramma bidimensionale, e quindi estendere i concetti alle tre dimensioni. Scegliamo una coppia di assi ortogonali, e determiniamo la posizione della particella a ogni istante misurando la sua distanza da ciascun asse. Così ogni posizione è espressa in funzione di una distanza x e di una distanza y e il moto può essere descritto costruendo una tabella nella quale si danno entrambe queste distanze come funzioni del tempo. (L’estensione di questo procedimento richiede soltanto un altro asse, perpendicolare ai primi due, per misurare una terza distanza, la distanza z. Le distanze sono misurate in questo caso a partire da piani coordinati, invece che da assi.) Avendo costruito una tabella con le distanze x e y, come possiamo determinare la velocità? Troviamo dapprima le componenti della velocità in ogni direzione. La parte orizzontale, o componente x, delle velocità è la derivata rispetto al tempo della distanza x, ossia vx =

dx dt

(8.11)

In modo simile, la parte verticale della velocità, o componente y, è vy =

dy dt

(8.12)

Nella terza dimensione

dz (8.13) dt Date le componenti della velocità, come possiamo trovare la velocità lungo la reale traiettoria del moto? Nel caso bidimensionale, consideriamo due successive posizioni della particella separate da una piccola distanza s e da un piccolo intervallo di tempo t 2 t 1 = t. Nel tempo t la particella si muove orizzontalmente di un tratto x ⇡ vx t e verticalmente di un tratto y ⇡ vy t. (Il simbolo «⇡» va letto «è approssimativamente».) La distanza realmente percorsa è approssimativamente q vz =

s⇡

x

2

+

y

2

(8.14)

come mostrato nella FIGURA 8.3. La velocità approssimata durante questo intervallo può essere ottenuta dividendo per t e mandando t a zero, come abbiamo fatto all’inizio del capitolo. Otteniamo allora la velocità come s !2 !2 q ds dx dy v= = + = vx2 + vy2 (8.15) dt dt dt Per tre dimensioni il risultato è

v=

q

vx2 + vy2 + vz2

(8.16)

Possiamo definire le accelerazioni nello stesso modo in cui abbiamo definito le velocità: abbiamo una componente x dell’accelerazione a x che è la derivata di vx , componente x della velocità (cioè, a x = d2 x/dt 2 , derivata seconda di x rispetto a t), e così via. Consideriamo un bell’esempio di moto composto piano. Prenderemo il moto di una palla che si muove orizzontalmente con una velocità costante u e che nello stesso tempo cade verticalmente con accelerazione costante g; qual è il moto? Possiamo dire dx/dt = vx = u. Poiché la velocità vx è costante, x = ut (8.17)

83

84

8.3 Descrizione del moto di un corpo in due dimensioni e calcolo della sua velocità.

Capitolo 8 • Il moto

© 978-8808-22107-0

FIGURA

8.4 La parabola descritta da un corpo che cade con una velocità iniziale orizzontale. FIGURA

y

y

∆ s ≈ !(∆ x )2 + (∆y)2

x

∆y ≈ vy ∆ t

t2 t1

∆ x ≈ vx ∆ t

x

e poiché l’accelerazione verso il basso g è costante, la distanza y di caduta dell’oggetto può essere scritta come 1 2 y= gt (8.18) 2 Qual è la curva della sua traiettoria, cioè qual è la relazione tra y e x? Possiamo eliminare t dell’equazione (8.18), poiché t = x/u. Facendo tale sostituzione troviamo che y=

g 2 x 2u2

(8.19)

Questa relazione tra y e x può essere considerata come l’equazione della traiettoria della palla in movimento. Quando si esegue il grafico di questa equazione si ottiene una curva detta parabola; ogni corpo in caduta libera sparato in una direzione qualsiasi viaggerà lungo una parabola, come mostrato in FIGURA 8.4.

Le leggi della dinamica di Newton

9.1

Quantità di moto e forza

La scoperta delle leggi della dinamica, o delle leggi del moto, fu un momento straordinario nella storia della scienza. Prima di Newton, i moti di oggetti come i pianeti erano un mistero, ma dopo Newton la loro comprensione fu completa. Divennero calcolabili anche le piccole deviazioni dalle leggi di Keplero dovute alle perturbazioni dei pianeti. I moti dei pendoli, oscillatori con molle e pesi incorporati, poterono essere tutti analizzati completamente dopo che furono enunciate le leggi di Newton. Lo stesso avviene per noi con questo capitolo: prima di questo capitolo non avremmo potuto calcolare come si muove una massa posta all’estremità di una molla; ancor meno avremmo potuto calcolare le perturbazioni sul pianeta Urano dovute a Giove e a Saturno. Dopo questo capitolo saremo in grado di calcolare, non solo il moto di una massa oscillante, ma anche le perturbazioni su Urano prodotte da Giove e da Saturno! Galileo fece un grande progresso nella comprensione del moto quando scoprì il principio di inerzia: se un oggetto è lasciato solo, se non è disturbato, continua a muoversi con velocità costante in linea retta se era inizialmente in movimento, oppure continua a stare in quiete se era del tutto immobile. Naturalmente ciò non avviene mai nella realtà, perché se facciamo scivolare un oggetto su un tavolo, esso si ferma, ma questo avviene per il fatto che non è abbandonato a se stesso, ma striscia sul tavolo. Ci voleva una certa immaginazione per trovare la regola giusta, e ciò si deve a Galileo. Naturalmente il problema successivo da affrontare è una regola per trovare come un oggetto muta velocità se qualcosa interviene su di esso. Questo è stato il contributo di Newton. Newton formulò tre leggi: la prima legge fu una semplice riaffermazione del principio di inerzia di Galileo già descritto. La seconda legge fornì un mezzo specifico per determinare come cambia la velocità sotto influenze diverse chiamate forze. La terza legge descrive le forze fino a un certo punto, e discuteremo ciò in un’altra occasione. Qui discutiamo soltanto la seconda legge, secondo la quale il moto di un oggetto viene modificato dalle forze in questo modo: la rapidità temporale della variazione di una quantità chiamata quantità di moto è proporzionale alla forza. Presto esprimeremo questa legge matematicamente, ma prima spieghiamone il concetto. La quantità di moto non è la stessa cosa della velocità. In fisica si usa un gran numero di vocaboli, ed essi hanno tutti un significato preciso, per quanto possano non avere un significato altrettanto preciso nel linguaggio corrente. La quantità di moto ne è un esempio e dobbiamo definirla esattamente. Se applichiamo una certa spinta con le braccia su un oggetto leggero, esso si muove facilmente; se spingiamo con altrettanta forza un altro oggetto molto più pesante, nel senso comune del termine, esso si muoverà molto meno rapidamente. In realtà dobbiamo cambiare le parole «leggero» e «pesante» nelle espressioni con massa minore e con massa maggiore, essendovi fra il peso di un oggetto e la sua inerzia una differenza che va compresa. (Qual è lo sforzo per far muovere un oggetto e quanto esso pesa sono due cose diverse.) Peso e inerzia sono proporzionali, e sulla superficie terrestre sono spesso espressi da numeri uguali, il che causa allo studente una certa confusione. Su Marte i pesi sarebbero diversi, ma la forza necessaria per vincere l’inerzia sarebbe la stessa. Usiamo il termine massa come misura quantitativa dell’inerzia, e possiamo misurare la massa, per esempio, facendo ruotare un oggetto a una certa velocità e misurando quanta forza occorre per

9

86

Capitolo 9 • Le leggi della dinamica di Newton

© 978-8808-22107-0

mantenerlo sulla traiettoria circolare. In questo modo troviamo una certa massa per ogni oggetto. Ora la quantità di moto di un oggetto è il prodotto di due parti: la sua massa e la sua velocità. Quindi la seconda legge di Newton può essere scritta matematicamente in questo modo: d (mv) (9.1) dt Ora vi sono parecchi punti da considerare. Nell’esprimere una legge simile a questa usiamo molte idee intuitive, implicazioni e ipotesi che inizialmente sono combinate in modo approssimativo all’interno della nostra «legge». In seguito possiamo ritornare indietro e studiare con maggior dettaglio che cosa esattamente ogni termine significhi, ma se tentiamo di far questo troppo presto generiamo confusione. Così all’inizio prendiamo molte cose per date. Anzitutto che la massa di un oggetto sia costante; in realtà non lo è, ma partiremo con l’approssimazione di Newton che la massa sia costante, sempre la stessa, e che, inoltre, quando uniamo due oggetti le loro masse si sommino. Queste idee furono naturalmente sottintese da Newton quando scrisse la sua equazione, altrimenti essa sarebbe senza senso. Per esempio, supponiamo che la massa vari inversamente alla velocità; allora la quantità di moto non cambierebbe mai in nessuna circostanza, così la legge non significa niente a meno che non sappiate come la massa vari con la velocità. Per cominciare diciamo che essa non cambia. Poi vi sono alcune implicazioni concernenti la forza. Con una grossolana approssimazione pensiamo alla forza come a una specie di attrazione o di spinta che esercitiamo coi nostri muscoli, ma possiamo definirla più accuratamente ora che abbiamo questa legge del moto. La cosa più importante da capire è che questa relazione non implica soltanto variazioni di intensità della quantità di moto o della velocità, ma anche della loro direzione. Se la massa è costante, allora l’equazione (9.1) può anche essere scritta come F=

dv = ma (9.2) dt L’accelerazione a è la rapidità di variazione della velocità, e la seconda legge di Newton dice di più del fatto che l’effetto di una data forza varia inversamente alla massa; dice anche che la direzione della variazione di velocità e la direzione della forza sono le stesse. In questo modo comprendiamo che una variazione nella velocità, o un’accelerazione, ha significato più ampio che nel linguaggio comune: la velocità di un oggetto in movimento può cambiare aumentando o diminuendo (quando rallenta, diciamo che accelera con una accelerazione negativa), o cambiando la sua direzione di moto. Un’accelerazione perpendicolare alla velocità è stata discussa nel capitolo 7. Là abbiamo visto che un oggetto che si muove su una traiettoria circolare di raggio R con una certa velocità v lungo il cerchio, si allontana dalla linea retta di un tratto uguale a ! 1 v2 2 t 2 R F=m

se t è molto piccolo. Così la formula dell’accelerazione perpendicolare al moto è

v2 (9.3) R e una forza perpendicolare alla velocità obbligherà un oggetto a percorrere una traiettoria curva il cui raggio di curvatura può essere trovato dividendo la forza per la massa per ottenere l’accelerazione, e successivamente usando la (9.3). a=

9.2

Velocità e velocità vettoriale

Per rendere più preciso il nostro linguaggio dobbiamo dare un’ulteriore definizione sul nostro uso dei vocaboli velocità e velocità vettoriale(1) . Comunemente pensiamo che velocità e velocità (1) Non esistono nella lingua italiana due vocaboli diversi per esprimere questi due diversi concetti (in inglese con speed si indica la velocità e con velocity la velocità vettoriale). In fisica la parola «velocità» è comprensiva di intensità e direzione. (N.d.T.)

9.3 • Componenti di velocità, accelerazione e forza

© 978-8808-22107-0

87

9.1 Piccolo spostamento di un oggetto. FIGURA

z

9.2 Variazione di velocità in cui intensità e direzione cambiano entrambe. FIGURA

z

∆z ∆s ∆x ∆y y

y x

x

vettoriale siano la stessa cosa, e infatti nel linguaggio comune non c’è distinzione. Ma in fisica abbiamo tratto vantaggio dall’esistenza dei due termini e abbiamo deciso di usarli per distinguere due diversi concetti. Distinguiamo quindi velocità vettoriale, che comprende intensità e direzione, da velocità, con cui intendiamo l’intensità della velocità senza includere la direzione. Possiamo esprimere ciò con maggior precisione descrivendo come le coordinate x, y e z di un oggetto cambiano nel tempo. Supponiamo, per esempio, che a un certo istante un oggetto sia in movimento, come mostrato in FIGURA 9.1. In un dato piccolo intervallo di tempo t, si muoverà di un tratto x in direzione x, y in direzione y e z in direzione z. L’effetto totale di questi tre cambiamenti di coordinate è uno spostamento s lungo la diagonale di un parallelepipedo, i cui lati sono x, y e z. In termini di velocità, lo spostamento x è la componente x della velocità moltiplicata per t, e similmente per y e z: x = vx t

9.3

y = vy t

z = vz t

(9.4)

Componenti di velocità, accelerazione e forza

Nelle equazioni (9.4) abbiamo scomposto la velocità nelle sue componenti esprimendo quanto rapidamente si sposti l’oggetto nelle direzioni x, y e z. La velocità vettoriale è completamente definita, sia come intensità sia come direzione, se diamo i valori numerici delle sue tre componenti rettangolari: dx dy dz vx = vy = vz = (9.5) dt dt dt D’altra parte, la velocità dell’oggetto è q ds = |v| = vx2 + vy2 + vz2 (9.6) dt

Supponiamo poi che, in seguito all’azione di una forza, la velocità cambi assumendo un’altra direzione e una diversa intensità, come mostrato in FIGURA 9.2. Possiamo analizzare questa situazione, apparentemente complessa, piuttosto semplicemente se valutiamo le variazioni delle componenti x, y e z della velocità. La variazione della componente di velocità nella direzione x in un tempo t è vx = a x t, dove a x è quella che chiamiamo la componente x dell’accelerazione. Similmente vediamo che vy = ay t e vz = az t. In questi termini vediamo che la seconda legge di Newton, dicendo che la forza è nella stessa direzione dell’accelerazione, equivale in realtà a

88

Capitolo 9 • Le leggi della dinamica di Newton

© 978-8808-22107-0

tre leggi, nel senso che la componente della forza nella direzione x, y o z è uguale alla massa per la rapidità di variazione della corrispondente componente della velocità: ! ! dvx d2 x =m = ma x Fx = m dt dt 2 ! ! dvy d2 y (9.7) Fy = m =m = may dt dt 2 ! ! dvz d2 z =m Fz = m = maz dt dt 2 Proprio come velocità e accelerazione sono state scomposte nelle componenti proiettando su tre assi coordinati un segmento di linea, che rappresenta la loro intensità e la loro direzione, così, allo stesso modo, una forza in una data direzione è rappresentata da certe componenti nelle direzioni x, y e z: Fx = F cos(x, F) Fy = F cos(y, F) (9.8) Fz = F cos(z, F) dove F è l’intensità della forza e (x, F) rappresenta l’angolo fra l’asse x e la direzione di F ecc. La seconda legge di Newton è data in forma completa nelle equazioni (9.7). Se conosciamo le forze che agiscono su un oggetto e le scomponiamo nelle componenti x, y e z, allora possiamo ricavare il moto dell’oggetto da queste equazioni. Consideriamo un semplice esempio. Supponiamo che non vi siano forze nelle direzioni y e z, essendoci una forza solo in direzione x, diciamo verticalmente. L’equazione (9.7) ci dice che vi sarà variazione della velocità in direzione verticale, ma non in direzione orizzontale. Questo è stato dimostrato con uno speciale apparato nel capitolo 7 (vedi FIGURA 7.3). Un corpo che cade si muove orizzontalmente senza nessuna variazione nel moto orizzontale, mentre si muove verticalmente nello stesso modo in cui si muoverebbe se non vi fosse moto orizzontale. In altre parole i moti nelle direzioni x, y e z sono indipendenti se anche le forze lo sono.

9.4

Che cos’è la forza?

Per usare le leggi di Newton, dobbiamo avere qualche formula che riguarda la forza; queste leggi dicono di fare attenzione alle forze. Se un oggetto accelera, qualche agente è all’opera; troviamolo. Il nostro programma per il futuro della dinamica deve essere trovare le leggi per la forza. Newton stesso si diede, oltre alle leggi, alcuni esempi. Nel caso della gravità egli diede una formula specifica per la forza. Nel caso di altre forze egli diede qualche informazione nella sua terza legge, che studieremo nel prossimo capitolo, e che ha a che fare con l’uguaglianza di azione e reazione. Estendendo il nostro precedente esempio, quali sono le forze agenti su un oggetto vicino alla superficie terrestre? Vicino alla superficie terrestre la forza nella direzione verticale dovuta alla gravità è proporzionale alla massa dell’oggetto ed è quasi indipendente dall’altezza per altezze piccole in confronto al raggio della terra R: F=G

mM = mg R2

dove g = GM/R2 è chiamata accelerazione di gravità. Così la legge di gravità ci dice che il peso è proporzionale alla massa; la forza è in direzione verticale ed è la massa per g. Ancora troviamo che il moto in direzione orizzontale è a velocità costante. Il moto interessante è in direzione verticale e la seconda legge di Newton ci dice che mg = m

d2 x dt 2

(9.9)

9.5 • Significato delle equazioni dinamiche

© 978-8808-22107-0

89

Eliminando m troviamo che l’accelerazione in direzione x è costante e uguale a g. Questa naturalmente è la ben nota legge della caduta libera dei gravi che conduce alle equazioni vx = v0 + gt 1 x = x 0 + v0 t + gt 2 2

(9.10)

Come altro esempio, supponiamo di essere stati capaci di costruire un congegno (FIGURA 9.3) che applica una forza proporzionale alla distanza e diretta in verso opposto: una molla. Se trascuriamo la gravità, che è naturalmente bilanciata dalla tensione iniziale della molla, e discutiamo solo di ulteriori forze, vediamo che se tiriamo la massa in basso, la molla la tira verso l’alto, mentre se spingiamo la massa verso l’alto la molla la spinge in basso. Questa macchina è stata progettata accuratamente in modo che la forza sia maggiore più noi spingiamo la massa in alto, in esatta proporzione all’entità dello spostamento dalla condizione di equilibrio, e la forza diretta verso l’alto è esattamente proporzionale allo spostamento verso il basso. Se osserviamo la dinamica di questa macchina, vediamo un moto piuttosto bello: su, giù, su, giù,... Il problema è: le equazioni di Newton descrivono correttamente questo moto? Vediamo se possiamo calcolare esattamente qual è il moto di tale oscillazione periodica, applicando la legge di Newton (9.7). Nel caso presente, l’equazione è kx = m

dvx dt

(9.11)

Qui abbiamo una situazione nella quale la velocità in direzione x cambia con una rapidità proporzionale a x. Non guadagniamo nulla conservando molte costanti, così immagineremo o che la scala dei tempi è cambiata o che per caso le unità sono tali che ci capita di avere k/m = 1. In questo modo potremo provare a risolvere l’equazione dvx = x dt

(9.12)

Per procedere dobbiamo sapere che cos’è vx , ma naturalmente sappiamo che la velocità è la rapidità di variazione della posizione.

9.5

Significato delle equazioni dinamiche

Tentiamo ora di analizzare ciò che l’equazione (9.12) significa. Supponiamo che a un dato tempo t l’oggetto abbia una certa velocità vx e una posizione x. Qual è la velocità e qual è la posizione a un tempo di poco successivo t + ✏? Se possiamo rispondere a questo quesito il nostro problema è risolto, perché possiamo partire con una data situazione e calcolare quanto essa muti al primo istante, all’istante successivo, all’istante ancora dopo e così via, e in questo modo sviluppiamo gradualmente il moto. Per specificare, supponiamo che al tempo t = 0 abbiamo x = 0 e vx = 0. Perché l’oggetto si dovrà muovere? Perché vi è una forza che agisce su di esso in ogni posizione, tranne che per x = 0. Se x > 0, quella forza è diretta verso l’alto. Quindi la velocità, che è zero, comincia a variare a causa della legge del moto. Una volta che la velocità comincia a crescere, l’oggetto comincia a salire e così via. Ora a ogni tempo t, se ✏ è molto piccolo, possiamo esprimere la posizione al tempo t + ✏ in funzione della posizione al tempo t, e della velocità al tempo t, con un’approssimazione molto buona, come x(t + ✏) = x(t) + ✏ vx (t)

(9.13)

Più piccolo è ✏ più accurata è questa espressione, ma rimane abbastanza accurata anche se ✏ non è trascurabilmente piccolo. Ora, che altro sulla velocità? Per ottenere la velocità successiva, la velocità al tempo t + ✏, dobbiamo conoscere come varia la velocità, cioè l’accelerazione. E come

x

Posizione di equilibrio

m

9.3 Massa appesa a una molla. FIGURA

Capitolo 9 • Le leggi della dinamica di Newton

90

© 978-8808-22107-0

troviamo l’accelerazione? Qui interviene la legge della dinamica. La legge della dinamica ci dice qual è l’accelerazione. Dice che l’accelerazione è x: vx (t + ✏) = vx (t) + ✏ a x (t)

(9.14)

vx (t + ✏) = vx (t)

(9.15)

✏ x(t)

L’equazione (9.14) è semplicemente cinematica; essa dice che una velocità varia a causa della presenza di accelerazione. Ma l’equazione (9.15) è dinamica, poiché mette in relazione l’accelerazione con la forza; dice che con questo particolare tempo in questo particolare problema, possiamo sostituire l’accelerazione con x(t). Quindi, se conosciamo sia x sia v a un dato tempo, conosciamo l’accelerazione che ci dà la nuova velocità, e conosciamo la nuova posizione, cioè come funziona il meccanismo. La velocità varia un poco a causa della forza, la posizione varia un poco a causa della velocità.

9.6

Soluzione numerica delle equazioni

Risolviamo ora realmente il problema. Supponiamo di prendere ✏ = 0,10 s. Dopo aver fatto tutto il calcolo, se troviamo che ✏ non è sufficientemente piccolo, possiamo tornare indietro e ripetere il calcolo con ✏ = 0,01 s. Partendo col nostro valore iniziale x(0) = 1,00, qual è x(0,1)? È la vecchia posizione x(0) più la velocità (che è zero) per 0,10 s. Così x(0,1) è ancora 1,00 poiché non ha ancora iniziato a muoversi. Ma la nuova velocità a 0,10 s sarà la vecchia velocità v(0) = 0 più ✏ per l’accelerazione. L’accelerazione è x(0) = 1,00. Quindi v(0,1) = 0,00 TABELLA 9.1 Soluzione dell’equazione dvx /dt = x. (Intervallo ✏ = 0,10 s.)

Ora, al tempo t = 0,20 s abbiamo:

0,10 · 1,00 = 0,10

x(0,2) = x(0,1) + ✏ v(0,1) = 1,00 t

x

vx

ax

0,0

1,000

–1,000

0,1

0,995

0,000 –0,050

0,2

0,980

0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6

0,955 0,921 0,877 0,825 0,764 0,696 0,621 0,540 0,453 0,362 0,267 0,169 0,070 –0,030

–0,150 –0,248 –0,343 –0,435 –0,523 –0,605 –0,682 –0,751 –0,814 –0,868 –0,913 –0,949 –0,976 –0,993 –1,000

–0,995 –0,980 –0,955 –0,921 –0,877 –0,825 –0,764 –0,696 –0,621 –0,540 –0,453 –0,362 –0,267 –0,169 –0,070 +0,030

v(0,2) = v(0,1) + ✏ a(0,1) = 0,10

0,10 · 0,10 = 0,99

0,10 · 1,00 = 0,20

E così, via via, possiamo calcolare il moto successivo, e questo è proprio ciò che faremo. Tuttavia ai fini pratici vi sono alcuni piccoli espedienti coi quali possiamo accrescere la precisione. Se continuassimo questo calcolo come lo abbiamo iniziato, troveremmo un moto piuttosto approssimato, poiché ✏ = 0,10 s è un intervallo abbastanza grossolano: dovremmo usare un intervallo molto più piccolo, diciamo ✏ = 0,01 s. Ma per esaminare un ragionevole intervallo totale di tempo dovremmo ripetere il calcolo molte volte; organizzeremo quindi il lavoro in modo da aumentare la precisione dei calcoli, mantenendo lo stesso grossolano intervallo ✏ = 0,10 s. Ciò è fattibile inserendo un ingegnoso miglioramento nella tecnica di analisi. Notiamo che la nuova posizione è la vecchia posizione più l’intervallo di tempo ✏ per la velocità. Ma la velocità quando? La velocità all’inizio dell’intervallo di tempo è una e la velocità al termine dell’intervallo di tempo è un’altra. Il miglioramento consiste nell’usare la velocità al punto medio dell’intervallo. Se conosciamo la velocità ora, ma la velocità sta variando, non possiamo ottenere una risposta giusta considerando la velocità attuale. Dovremmo usare qualche velocità fra la velocità «attuale» e la velocità al «termine dell’intervallo». Le stesse considerazioni vanno applicate alla velocità: per calcolare le variazioni di velocità, dovremmo usare l’accelerazione all’istante intermedio fra i due tempi ai quali la velocità deve essere calcolata. Così le equazioni che useremo in realtà saranno qualcosa di simile a questo: la

9.7 • Moti planetari

© 978-8808-22107-0

91

posizione ultima è uguale alla posizione iniziale più ✏ per la velocità al tempo corrispondente al punto medio dell’intervallo. Similmente la velocità in questo punto medio è la velocità a un tempo antecedente di ✏ (che è al centro dell’intervallo precedente) più ✏ per l’accelerazione al tempo t. Cioè usiamo le equazioni ✓ ✏◆ x(t + ✏) = x(t) + ✏ v t + 2 ✓ ✓ ✏◆ ✏◆ (9.16) v t+ =v t + ✏ a(t) 2 2 a(t) = x(t)

Rimane soltanto un piccolissimo problema: quanto vale v(✏/2)? All’inizio abbiamo dato v(0), non v( ✏/2). Per ottenere il nostro calcolo di partenza, usiamo una particolare equazione, vale a dire, v(✏/2) = v(0) + (✏/2) a(0). Ora siamo pronti per eseguire il nostro calcolo. Per convenienza, possiamo organizzare il lavoro sotto forma di una tabella, con colonne per il tempo, la posizione, la velocità e l’accelerazione e con la velocità su linee intermedie, come mostrato nella TABELLA 9.1. Una tabella simile è, naturalmente, un modo conveniente di rappresentare i valori numerici ottenuti dal gruppo di equazioni (9.16), e infatti non è mai necessario scrivere le equazioni stesse. Riempiamo semplicemente i vari spazi della tabella uno per uno. Questa tabella ci dà ora un’ottima idea del moto: esso parte da fermo, x all’inizio ottiene un piccolo aumento di velocità (negativa) e perde qualcosa nella distanza. L’accelerazione è un po’ minore, ma esso guadagna ancora 1,0 in velocità. Proseguendo guadagna velocità sempre più lentamente, finché, dopo essere passato da x = 0 a circa t = 1,50 s, possiamo facilmente prevedere che esso continuerà, ma ora si troverà dall’altro lato; la posizione x 0,5 diventa negativa e l’accelerazione positiva. Così la velocità diminuisce. È interessante paragonare questi numeri con la funzione x = cos(t), come è fatto nella FIGURA 9.4. L’accordo è entro la precisione delle tre cifre signifi0 0,5 1,0 1,5 t (s) cative del nostro calcolo! Vedremo in seguito che x = cos(t) è la soluzione matematica esatta della nostra equazione di moto, ma è un’impressionante dimostrazione del potere dell’analisi numerica che un così facile calcolo FIGURA 9.4 Diagramma del moto di una massa dia risultati così precisi. appesa a una molla.

9.7

Moti planetari

L’analisi precedente è molto bella per il moto di una molla oscillante, ma possiamo analizzare il moto di un pianeta attorno al Sole? Vediamo se possiamo giungere, con una certa approssimazione, a individuare un’ellisse per l’orbita. Supporremo che il Sole sia infinitamente pesante, nel senso che non includeremo il suo moto. Supponiamo che un pianeta parta da un certo punto e si muova a una certa velocità; esso gira attorno al Sole secondo un certo movimento curvo e noi cercheremo di analizzare, per mezzo delle leggi del moto di Newton e per mezzo della sua legge della gravitazione, quale sia la curva. Come? A un dato momento il pianeta si trova in una qualche posizione nello spazio. Se la distanza radiale dal Sole in questa posizione è detta r, allora sappiamo che vi è una forza diretta verso l’interno che, in accordo alla legge della gravitazione, è uguale a una costante per il prodotto delle masse del Sole e del pianeta diviso per il quadrato della distanza. Per proseguire nell’analisi dobbiamo dedurre l’accelerazione prodotta da questa forza. Ci necessiteranno le componenti dell’accelerazione lungo due direzioni, che chiamiamo x e y. Così se noi specifichiamo la posizione del pianeta a un dato momento dando x e y (supporremo che z sia sempre zero, poiché non vi è forza in direzione z e, se non vi è velocità iniziale vz , non ci sarà niente che renda z diverso da zero), la forza è diretta lungo la linea che congiunge il pianeta al Sole, come mostrato in FIGURA 9.5.

Capitolo 9 • Le leggi della dinamica di Newton

92

Pianeta (x, y)

Fx y

Fy F

© 978-8808-22107-0

Da questa figura vediamo che la componente orizzontale della forza sta alla forza completa come la distanza orizzontale x sta all’ipotenusa r, poiché i due triangoli sono simili. Inoltre, se x è positivo, Fx è negativo. Cioè Fx x = r |F | ossia

r

Fx = |F | Sole

FIGURA

9.5

x

La forza di gravità agente su un pianeta.

x x = GMm 3 r r

Ora usiamo la legge della dinamica per trovare che questa componente della forza è uguale alla massa del pianeta per la rapidità di variazione della sua velocità nella direzione x. Così troviamo le seguenti leggi: ! dvx x m = GMm 3 dt r ! dvy y m = GMm 3 dt r q r = x2 + y2

(9.17)

Questo, dunque, è l’insieme di equazioni che dobbiamo risolvere. Inoltre, per semplificare il lavoro numerico, supporremo che l’unità di tempo o la massa del Sole siano state prese (oppure la fortuna sia dalla nostra parte) in modo che GM ⌘ 1. Per il nostro esempio specifico supporremo che la posizione iniziale del pianeta sia x = 0,500 e y = 0,000, e che la velocità sia in partenza tutta in direzione y con intensità 1,630. Ora, come faremo il calcolo? Faremo ancora una tabella con colonne per il tempo, la posizione x, la componente x della velocità, vx , e la componente x dell’accelerazione, a x ; poi, separate da una doppia linea, tre colonne per posizione, velocità e accelerazione in direzione y. Per ottenere le accelerazioni abbiamo bisogno dell’equazione (9.17); essa ci dice che l’accelerazione in direzione x è x/r 3 , l’accelerazione in direzione y è y/r 3 e r è la radice quadrata di x 2 + y 2 . In questo modo, dati x e y, dobbiamo fare un piccolo calcolo collaterale, estraendo la radice quadrata della somma dei quadrati per trovare r; quindi, per essere pronti a calcolare le due accelerazioni, è utile calcolare anche 1/r 3 . Questo lavoro può essere fatto abbastanza agevolmente usando una tabella di quadrati, cubi e numeri reciproci: poi dobbiamo soltanto moltiplicare x per 1/r 3 , operazione che facciamo con un regolo calcolatore. Il nostro calcolo procede così, coi seguenti passaggi, usando intervalli di tempo ✏ = 0,100. Valori iniziali a t = 0: x(0) = 0,500 y(0) = 0,000 vx (0) = 0,000 vy (0) = +1,630 Da questi troviamo: r(0)

= 0,500

3

1/r (0) = 8,000 a x (0) = 4,000 ay (0) = 0,000 Possiamo così calcolare le velocità vx (0,05) e vy (0,05): vx (0,05) = 0,000 4,000 · 0,050 = 0,200 vy (0,05) = 1,630 + 0,000 · 0,050 = 1,630

9.7 • Moti planetari

© 978-8808-22107-0

93

Ora cominciano i calcoli: x(0,1) = 0,500

0,20 · 0,1

= 0,480

y(0,1) = 0,0 + 1,63 · 0,1 p r = 0,4802 + 0,1632

= 0,163

1/r 3 = 1/ 0,5073

= 7,677

a x (0,1) = 0,480 · 7,677

= 3,685

ay (0,1) = 0,163 · 7,677

vx (0,15) = 0,200 vy (0,15) = 1,630 x(0,2) = 0,480

= 0,507

= 1,250

3,685 · 0,1 = 0,568

1,250 · 0,1 = 1,505

0,568 · 0,1

y(0,2) = 0,163 + 1,505 · 0,1

= 0,423 = 0,313

ecc.

In questo modo otteniamo i valori che sono riportati nella TABELLA 9.2 e, in una ventina di passaggi, abbiamo inseguito il pianeta per mezza orbita attorno al t = 1,0 Sole! Nella FIGURA 9.6 sono tracciate le coordinate x t = 0,5 e y riportate nella TABELLA 9.2. I punti rappresentano t = 1,5 le posizioni che si susseguono nel tempo a distanza 0,5 di un decimo di unità l’uno dall’altro; vediamo che all’inizio il pianeta si muove rapidamente e che alla fine si muove lentamente, e la forma della curva resta t = 2,0 determinata. In questo modo vediamo che realmente sappiamo come calcolare il moto dei pianeti! –1,0 –0,5 Sole Vediamo ora come possiamo calcolare il moto di Nettuno, di Giove, di Urano o di qualsiasi altro pianeta. Se abbiamo una grande quantità di pianeti, e ammet- FIGURA 9.6 Calcolo del moto di un pianeta attorno al Sole. tiamo che si muova anche il Sole, possiamo fare la stessa cosa? Naturale che possiamo. Calcoliamo la forza su un particolare pianeta, diciamo il pianeta i, che ha una posizione x i , yi , zi (i = 1 può rappresentare il Sole, i = 2 Mercurio, i = 3 Venere e così via). Dobbiamo conoscere le posizioni di tutti i pianeti. La forza agente su uno è dovuta a tutti gli altri corpi che sono situati, diciamo, nelle posizioni x j , y j , z j . Quindi le equazioni sono N xi x j dvix X mi = Gmi m j dt r i3j j=1 mi

N dviy X yi y j = Gmi m j dt r i3j j=1

mi

N zi z j dviz X = Gmi m j dt r i3j j=1

Inoltre, definiamo r i j come distanza fra i due pianeti i e j; questa è uguale a q r i j = (x i x j )2 + (yi y j )2 + (zi z j )2

(9.18)

(9.19)

Dunque, ⌃ significa una somma su tutti i valori di j – tutti gli altri corpi – eccetto naturalmente per j = 1. Così tutto ciò che dobbiamo fare è mettere più colonne, molte più colonne. Sono necessarie

t=0 0,5

x

94

Capitolo 9 • Le leggi della dinamica di Newton

© 978-8808-22107-0

p

Soluzione delle equazioni dvx /dt = x /r 3 , dvy /dt = y /r 3 , r = x2 + y2 . Intervallo ✏ = 0,100. Orbita: vy = 1,63, vx = 0, x = 0,5, y = 0 a t = 0. TABELLA

t 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2

9.2

x

vx

0,500 0,480 0,423 0,337 0,232 0 , 11 5 –0,006 –0,127 –0,244 –0,356 –0,461 –0,558 –0,646 –0,725 –0,795 –0,856 –0,908 –0,950 –0,982 –1,005 –1,018 –1,022 –1,017

–0,200 –0,568 –0,858 –1,054 –1,165 – 1 , 2 11 –1,209 –1,175 – 1 , 11 9 –1,048 –0,969 –0,883 –0,794 –0,702 –0,608 –0,514 –0,420 –0,325 –0,229 –0,134 –0,038 +0,057

2,3 Intersezione con l’asse x a 2,101 s Periodo = 4,20 s vx = 0 a 2,086 s Valore dell’intersezione: x = –1,022

ax

y

–4,000

0,000

–3,685 –2,897 –1,958 – 1 , 11 2 –0,454 +0,018 +0,342 +0,559 +0,702 +0,796 +0,856 +0,895 +0,919 +0,933 +0,942 +0,947 +0,950 +0,952 +0,953 +0,955 +0,957 +0,959

0,163 0,313 0,443 0,546 0,623 0,676 0,706 0,718 0,713 0,694 0,664 0,623 0,573 0,516 0,453 0,385 0,313 0,238 0,160 0,081 0,002 –0,078

vy 1,630 1,505 1,290 1,033 0,772 0,527 0,308 0 , 11 7 –0,048 –0,189 –0,309 – 0 , 4 11 –0,497 –0,569 –0,630 –0,680 –0,720 –0,751 –0,774 –0,790 –0,797 –0,797

ay

r

1/ r 3

0,000

0,500

8,000

–1,251

0,507

7,677

–2,146

0,527

6,847

–2,569

0,556

5,805

–2,617

0,593

4,794

–2,449

0,634

3,931

–2,190

0,676

3,241

– 1 , 9 11

0,718

2,705

–1,646

0,758

2,292

–1,408

0,797

1,974

–1,200

0,833

1,728

–1,019

0,867

1,536

–0,862

0,897

1,385

–0,726

0,924

1,267

–0,605

0,948

1,174

–0,498

0,969

1,100

–0,402

0,986

1,043

–0,313

1,000

1,000

–0,230

1,010

0,969

–0,152

1,018

0,949

–0,076

1,022

0,938

–0,002

1,022

0,936

+0,074

1,020

0,944

–0,790

Semiasse maggiore = (1,022 + 0,500)/2 = 0,761 vy = 0,797 Tempo previsto: (0,761)3/2 = = (0,663) = 2,082

nove colonne per i moti di Giove, nove per i moti di Saturno e cosi via. Quando abbiamo tutte le posizioni iniziali e tutte le velocità possiamo calcolare tutte le accelerazioni con l’equazione (9.18), calcolando prima tutte le distanze, usando l’equazione (9.19). Quanto tempo occorrerà per far questo? Se lo fate a casa occorrerà un tempo lunghissimo! Ma al giorno d’oggi abbiamo macchine che fanno rapidissimamente i calcoli aritmetici; un’ottima macchina calcolatrice può impiegare un microsecondo, cioè un milionesimo di secondo, per fare un’addizione. Per fare una moltiplicazione impiega di più, diciamo 10 microsecondi. Può essere che in un ciclo di calcolo, dipende dal problema, possiamo avere 30 moltiplicazioni o qualcosa di simile, cosicché un ciclo prenderà 300 microsecondi. Ciò significa che possiamo fare 3000 cicli di calcolo al secondo. Per ottenere una precisione, diciamo di uno su un miliardo, ci occorrerebbero 4 · 105 cicli corrispondenti a una rivoluzione di un pianeta attorno al Sole. Ciò corrisponde a un tempo di calcolo di 130 secondi, ossia circa 2 minuti. Quindi impieghiamo soltanto 2 minuti per

© 978-8808-22107-0

9.7 • Moti planetari

seguire Giove attorno al Sole, con tutte le perturbazioni di tutti i pianeti, con la precisione di uno su un miliardo! (Risulta che l’errore varia circa come il quadrato dell’intervallo ✏. Se facciamo l’intervallo un migliaio di volte più piccolo, il calcolo sarà un milione di volte più accurato. Così prendiamo l’intervallo 10 000 volte più piccolo.) Abbiamo iniziato questo capitolo senza sapere come calcolare neppure il moto di una massa attaccata a una molla. Ora, armati dello straordinario potere delle leggi di Newton, possiamo calcolare non solo moti molto semplici, ma anche, con l’aiuto di una normale macchina calcolatrice, i moti straordinariamente complessi dei pianeti, fino al grado di precisione desiderato!

95

10

Conservazione della quantità di moto

10.1

La terza legge di Newton

In linea di principio, in meccanica, tutti i problemi possono essere risolti partendo dalla seconda legge del moto di Newton, che stabilisce la relazione fra l’accelerazione di un corpo e la forza agente su di esso. Per esempio, per determinare il moto di alcuni tipi di corpi materiali, si possono usare i metodi numerici sviluppati nel capitolo precedente. Ci sono però buone ragioni per approfondire lo studio delle leggi di Newton. Per prima cosa esistono moti abbastanza semplici che possono essere analizzati non solo con metodi numerici, ma anche facendo uso dell’analisi matematica. Per esempio, sebbene sia noto che l’accelerazione di un corpo che cade è 32 piedi/s2 , e da questo si possa calcolare il moto con metodi numerici, è molto più facile e più soddisfacente analizzare il moto e trovare la soluzione generale, s = s0 + v0 t + 16 t 2 . Analogamente, sebbene si possano calcolare con metodi numerici le posizioni di un oscillatore armonico, è anche possibile dimostrare analiticamente che la soluzione generale è una semplice funzione coseno del tempo, per cui non è necessario procedere in mezzo a tutte quelle complicazioni aritmetiche, dato che esiste un modo semplice e più preciso per ottenere il risultato. Allo stesso modo, sebbene il moto di un corpo attorno al Sole, determinato dalla gravitazione, possa essere calcolato punto per punto coi metodi numerici del capitolo 9, che mostrano la forma generale dell’orbita, è anche interessante ottenerne la forma esatta che, come l’analisi dimostra, è una ellisse perfetta. Sfortunatamente, sono veramente molto pochi i problemi che possono essere risolti esattamente mediante l’analisi. Nel caso dell’oscillatore armonico, per esempio, se la forza elastica non è proporzionale allo spostamento, ma è qualcosa di più complesso, si deve ritornare al metodo numerico. Oppure, se i corpi in movimento attorno al Sole sono due, e quindi il numero totale dei corpi da considerare è tre, l’analisi non può descrivere il moto in una forma semplice, e in pratica il problema deve essere risolto numericamente. Questo è il famoso problema dei tre corpi, che per tanto tempo tenne testa alle capacità di analisi dell’uomo; è interessantissimo considerare quanto tempo sia stato necessario per rendersi conto che forse i mezzi dell’analisi matematica sono limitati e può essere necessario fare uso di metodi numerici. Oggi un numero enorme di problemi che non possono essere risolti analiticamente, vengono risolti con metodi numerici e il vecchio problema dei tre corpi, che era ritenuto così difficile, è risolto senza complicazioni esattamente nella stessa maniera descritta nel capitolo precedente, facendo, sostanzialmente, dell’aritmetica. Tuttavia esistono anche circostanze in cui nessuno dei metodi è utilizzabile: i problemi semplici possono essere risolti con l’analisi, quelli un po’ più difficili, numericamente, con metodi aritmetici, ma i problemi molto complicati non possono essere risolti con nessuno dei due metodi. Un problema complicato è, per esempio, l’urto fra due automobili, o il moto delle molecole di un gas. In un millimetro cubo di gas vi sono innumerevoli particelle e sarebbe ridicolo cercare di fare dei calcoli con tante variabili (circa 1017 , cento milioni di miliardi). Ogni altro problema simile a quello del moto delle molecole o degli atomi di un gas, o di un pezzo di ferro, o delle stelle in un ammasso globulare, a differenza del moto di due o tre pianeti attorno al Sole, non può essere risolto direttamente, per cui dobbiamo cercare altri metodi. Per i casi che non possono essere studiati in dettaglio, occorre conoscere alcune proprietà generali, cioè teoremi o princìpi generali che sono conseguenza delle leggi di Newton. Uno di

© 978-8808-22107-0

10.2 • Conservazione della quantità di moto

questi è il principio di conservazione dell’energia, che è stato discusso nel capitolo 4. Un altro è il principio di conservazione della quantità di moto, che è l’argomento di questo capitolo. Un altro motivo per approfondire lo studio della meccanica è che ci sono certi aspetti del moto che si ripetono in molte situazione diverse, per cui è conveniente studiarli in una particolare situazione. Per esempio, studieremo l’urto; diverse specie di urto hanno molte caratteristiche in comune. Nella dinamica dei fluidi non fa molta differenza di quale fluido si tratti, essendo simili le leggi dinamiche. Altri problemi che studieremo sono le vibrazioni e le oscillazioni e, in particolare, i fenomeni caratteristici delle onde meccaniche: il suono, vibrazioni di verghe ecc. Nella discussione delle leggi di Newton, è stato detto che queste leggi sono una specie di avviso che dice: «Attenzione alle forze», e che Newton affermò soltanto due cose sulla natura delle forze. Nel caso della gravitazione, egli enunciò la legge completa della forza. Nel caso delle forze molto complicate agenti fra atomi, egli non conosceva le esatte leggi delle forze; tuttavia scoprì un principio, una proprietà generale delle forze, che è espressa nel suo terzo principio. Tutta la conoscenza di Newton sulla natura delle forze è dunque racchiusa nelle leggi di gravitazione e in questo principio, senza altri dettagli. Il principio è che la reazione è uguale all’azione. Il suo significato è contenuto nell’esempio seguente: supponiamo di avere due corpi di piccole dimensioni, per esempio due particelle, e che la prima agisca sulla seconda, respingendola con una certa forza. Nello stesso istante, secondo il terzo principio di Newton, la seconda particella esercita sulla prima una uguale forza repulsiva, diretta in verso opposto alla precedente; inoltre queste forze agiscono lungo la stessa retta d’azione. Questa è l’ipotesi, o il principio, proposta da Newton ed essa sembra abbastanza accurata, sebbene non esatta (discuteremo in seguito gli errori). Per il momento considereremo vero che l’azione è uguale alla reazione. Naturalmente se esiste una terza particella, non allineata alle altre due, questo principio non significa che la forza totale agente sulla prima è uguale alla forza totale agente sulla seconda, perché la terza particella, per esempio, esercita la sua azione repulsiva su ciascuna delle altre due. Il risultato è che l’effetto sulle prime due particelle è diretto secondo direzioni differenti e le forze agenti sulle prime due particelle non sono, in generale, né uguali né opposte. Tuttavia le forze agenti su ciascuna particella possono essere scomposte in componenti, essendo ognuna di esse il contributo di ciascuna delle altre particelle interagenti. Allora a ogni coppia di particelle corrispondono le componenti dovute alla mutua interazione, che hanno modulo uguale e verso opposto.

10.2

Conservazione della quantità di moto

Quali sono le interessanti conseguenze delle relazioni che abbiamo appena discusso? Supponiamo che le particelle interagenti, per semplicità, siano due, di diversa massa, e indicate con 1 e 2. Le azioni che esse si scambiano sono uguali e contrarie; quali sono le conseguenze? Per la seconda legge di Newton, la forza è il rapporto fra la variazione della quantità di moto e l’intervallo di tempo corrispondente, così possiamo concludere che la variazione nel tempo della quantità di moto p1 della particella 1 è uguale e di segno contrario alla stessa grandezza relativa alla particella 2, ossia dp1 dp2 = (10.1) dt dt Se le variazioni nel tempo sono sempre uguali e contrarie, ne segue che la variazione totale della quantità di moto della particella 1 è uguale e contraria alla variazione totale della quantità di moto della particella 2; questo significa che, se sommiamo la quantità di moto della particella 1 a quella della particella 2, la variazione nel tempo della somma, per effetto delle mutue forze (chiamate forze interne) tra particelle, è zero; cioè d(p1 + p2 ) =0 (10.2) dt Tutto questo naturalmente nell’ipotesi che non esistano altre forze. Se la variazione nel tempo di questa somma è sempre zero, questo rappresenta un altro modo di dire che la quantità p1 + p2 non

97

98

Capitolo 10 • Conservazione della quantità di moto

© 978-8808-22107-0

cambia. (Questa quantità, talvolta, è scritta m1 v1 + m2 v2 , ed è chiamata quantità di moto totale delle due particelle.) Abbiamo così ottenuto il risultato che la quantità di moto totale di due particelle non cambia qualunque siano le mutue interazioni fra loro. Questo enunciato esprime la legge di conservazione della quantità di moto in questo particolare esempio. Concludiamo dicendo che se tra due particelle agisce una qualsiasi forza, comunque complessa, e se misuriamo o calcoliamo m1 v1 + m2 v2 , cioè la somma delle due quantità di moto, prima e dopo che agiscano le forze, il risultato deve essere uguale, cioè la quantità di moto totale è costante. Se generalizziamo l’argomento al caso di tre o più particelle che interagiscano in circostanze più complesse, è evidente che finché le forze sono interne, la quantità di moto totale di tutte le particelle rimane costante, poiché un aumento di quantità di moto di una particella per effetto di un’altra è esattamente compensato da una diminuzione della quantità di moto della seconda particella per effetto della prima. Cioè tutte le forze interne si equilibrano e quindi non possono alterare la quantità di moto totale delle particelle. Allora, se non ci sono forze agenti dall’esterno (forze esterne), non esistono forze che possano modificare la quantità di moto totale; quindi la quantità di moto totale è costante. Vale la pena descrivere ciò che accade se vi sono forze che non provengono da mutue azioni delle particelle in questione: supponiamo di isolare le particelle interagenti. Se esistono soltanto mutue interazioni, allora, come prima, la quantità di moto totale delle particelle non cambia, comunque siano complesse le forze. D’altra parte, supponiamo che vi siano anche forze esercitate da particelle esterne al gruppo isolato. Ogni forza esercitata su corpi del sistema da parte di corpi esterni, sarà chiamata forza esterna. Nel seguito dimostreremo un utilissimo teorema: la somma di tutte le forze esterne è uguale alla derivata rispetto al tempo della quantità di moto totale delle particelle del sistema. La conservazione della quantità di moto totale di un certo numero di particelle interagenti può essere espressa come m1 v1 + m2 v2 + m3 v3 + . . . = cost. (10.3) se non vi sono forze esterne a risultante non nulla. Le masse e le corrispondenti velocità delle particelle sono indicate con 1, 2, 3, 4,... L’enunciato generale della seconda legge di Newton per ciascuna particella, ossia d F= (mv) (10.4) dt vale in particolare per le componenti della forza e della quantità di moto in qualunque direzione; così la componente lungo l’asse x della forza agente su una particella è uguale alla corrispondente componente della variazione nel tempo della quantità di moto della particella, ossia Fx =

d (mvx ) dt

(10.5)

e analogamente per le direzioni y e z. Quindi l’equazione (10.3) è in realtà un insieme di tre equazioni, una per ogni direzione. Oltre alla legge di conservazione della quantità di moto c’è un’altra interessante conseguenza della seconda legge di Newton che sarà dimostrata in seguito, e per il momento semplicemente enunciata. Si tratta del principio secondo cui le leggi della fisica appaiono le stesse sia che stiamo fermi sia che ci muoviamo con velocità uniforme lungo una linea retta. Per esempio, un ragazzo che fa rimbalzare una palla su un aereo che sta volando a velocità costante, trova che la palla rimbalza nello stesso modo in cui rimbalzerebbe a terra. Anche se l’aereo si sta muovendo ad altissima velocità: a meno che la velocità non cambi, le leggi appaiono al ragazzo le stesse, come quando l’aereo è fermo. Questo è il cosiddetto principio di relatività. Nel modo in cui lo usiamo qui lo chiameremo «relatività galileiana» per distinguerlo da un’analisi più accurata fatta da Einstein, che studieremo in seguito. Abbiamo appena derivato dalle leggi di Newton la legge di conservazione della quantità di moto e potremmo procedere da essa per derivare le leggi particolari che descrivono urti e collisioni. Tanto per cambiare, e anche per illustrare un tipo di ragionamento che potrebbe essere usato in fisica in altre circostanze, quali, per esempio, si avrebbero se non conoscessimo le leggi

© 978-8808-22107-0

10.2 • Conservazione della quantità di moto

di Newton, discuteremo le leggi dell’urto e delle collisioni da un punto di vista completamente differente, arrivandoci per altra via. Baseremo la discussione sul principio di relatività galileiana, sopra enunciato, giungendo alla legge di conservazione della quantità di moto. Cominceremo con l’assumere che la natura appaia la stessa sia che la osserviamo viaggiando a una certa velocità sia che la osserviamo da fermi. Prima di discutere collisioni nelle quali due corpi urtano e restano attaccati oppure si urtano e rimbalzano via, considereremo il caso di due corpi tenuti insieme da una molla, o da qualcosa di simile, e successivamente liberati improvvisamente e respinti da un’altra molla o, per esempio, mediante una piccola esplosione. Inoltre considereremo il moto in una sola direzione. Facciamo dapprima l’ipotesi che i due oggetti siano esattamente uguali, perfettamente simmetrici, e che abbia luogo fra essi una piccola esplosione. Dopo l’esplosione uno dei corpi si muoverà, supponiamo verso destra, con velocità v. Allora sembra ragionevole che l’altro si muova verso sinistra con velocità v. Se gli oggetti sono simili non vi è motivo per cui la destra o la sinistra siano preferite, cosicché i due corpi formeranno un insieme simmetrico. È questo un esempio di un tipo di ragionamento che è utilissimo in tanti problemi, ma che non sarebbe emerso se fossimo partiti dalle formule. Il primo risultato dell’esperimento è che oggetti uguali hanno velocità uguali, ma supponiamo ora che i due oggetti siano fatti di materiali diversi, rame e alluminio, e che abbiano la stessa massa. Facciamo ora l’ipotesi che se nell’esperimento le due masse sono uguali, anche se gli oggetti non sono identici, le velocità siano uguali. Qualcuno potrebbe obiettare: «Lei sa bene che potrebbe rovesciare il ragionamento, senza bisogno di fare ipotesi. Lei poteva definire uguali due masse che acquistano, nell’esperimento, la stessa velocità». Accettiamo il suggerimento e facciamo avvenire una piccola esplosione fra il rame e un grosso pezzo di alluminio, così che il rame voli via e l’alluminio indietreggi appena. C’era troppo alluminio cosicché lo riduciamo finché ne rimane un piccolissimo pezzo e ripetiamo l’esplosione. Questa volta l’alluminio va via volando e il rame indietreggia appena. Non c’era abbastanza alluminio. Evidentemente la giusta soluzione sta fra le due, cosicché la raggiungiamo cambiando il pezzo di alluminio finché le velocità diventano uguali. Molto bene: accettiamo di rovesciare il ragionamento e diciamo che quando le velocità sono uguali, le masse sono uguali. Questa è giusto una definizione e sembra notevole che si possano trasformare leggi fisiche in pure definizioni. Ciò nonostante, vi sono contenute alcune leggi fisiche e se accettiamo questa come definizione di masse uguali, troviamo immediatamente una delle leggi, come vedremo. Supponiamo di sapere dall’esperimento precedente che due pezzi di materia A e B (di rame e alluminio) hanno masse uguali e confrontiamo nella stessa maniera un terzo corpo, per esempio un pezzo d’oro, con il corpo di rame, assicurandoci che la sua massa sia uguale a quella del rame. Se eseguiamo l’esperimento con il corpo di alluminio e quello d’oro, non c’è alcun motivo logico per cui queste masse debbano essere uguali; tuttavia l’esperimento dimostra che esse lo sono. Così dall’esperimento troviamo una nuova legge che potrebbe essere enunciata come segue: se due masse sono uguali a una terza massa (secondo la definizione data in base all’esperimento), allora sono uguali fra loro. (Questo enunciato non deriva automaticamente da un enunciato simile relativo a quantità matematiche.) Da questo esempio possiamo vedere come si possano rapidamente trarre conclusioni se non si è precisi. Non è esattamente una definizione dire che le masse sono uguali quando le velocità sono uguali, perché dire che le masse sono uguali lascia supporre le leggi matematiche dell’uguaglianza, che a loro volta implicano una previsione su un esperimento. Come secondo esempio supponiamo che, facendo l’esperimento con un’esplosione di una certa intensità, che dà luogo a certe velocità, A e B risultino uguali; se usiamo un’esplosione di intensità maggiore, saranno uguali oppure no le velocità ottenute in questo caso? Anche qui non c’è alcuna legge logica che permette di rispondere alla domanda, ma l’esperimento mostra che le velocità sono uguali. Così ecco un’altra legge che può essere enunciata: se due corpi hanno masse uguali misurate a una certa velocità, essi hanno masse uguali quando sono misurate a un’altra velocità. Da questo esempio vediamo che ciò che sembrava soltanto una definizione, in realtà implica alcune leggi fisiche. Per gli sviluppi seguenti assumeremo come vero che masse uguali acquistano velocità uguali e opposte, se fra di esse avviene un’esplosione. Per il caso inverso faremo un’altra ipotesi: se due oggetti identici, che si muovono nella stessa direzione e in verso contrario con uguale velocità,

99

100

Capitolo 10 • Conservazione della quantità di moto

10.1 Sezione trasversale di una rotaia con sospensione ad aria.

© 978-8808-22107-0

FIGURA

Respingente a molla Carrello

Piccoli fori (getti)

Capsula da pistola giocattolo Elettrodo detonatore

Alimentazione dell’aria compressa

10.2 Sezione longitudinale dei carrelli con inserita la capsula esplosiva. FIGURA

Cilindro

10.3 Schema dell’esperimento di azione e reazione con masse uguali.

Pistone

Respingente a molla

FIGURA

v=0 (a) –v

v (b) (c) –v

v

(d) v=0 (e)

urtano e restano attaccati per effetto di una colla, come si muoveranno dopo l’urto? Anche questa è una situazione simmetrica, senza preferenza per la destra o per la sinistra, cosicché faremo l’ipotesi che essi rimangano fermi. Supporremo anche che due oggetti qualunque di uguale massa, anche se fatti di differenti materiali, restino fermi dopo l’urto se, provenienti da opposte direzioni con la stessa velocità, si urtano restando attaccati insieme.

10.3

La quantità di moto si conserva!

Possiamo verificare sperimentalmente le ipotesi precedentemente enunciate: primo, se due oggetti, in quiete e di massa uguale, vengono separati con un’esplosione, si allontanano con la stessa velocità; secondo, se due oggetti, di massa uguale, che si avvicinano con la stessa velocità, urtano e restano attaccati, si fermano. Questo si può fare per mezzo di una meravigliosa invenzione, una rotaia con sospensione ad aria(1) che non è soggetta ad attrito, quell’attrito che metteva continuamente in imbarazzo Galileo (FIGURA 10.1). Egli non poteva fare esperimenti con oggetti striscianti, poiché essi non strisciavano liberamente, mentre noi, oggi, con un tocco magico possiamo liberarci dell’attrito. I nostri oggetti strisceranno senza difficoltà, a velocità costante, come proclamato da Galileo. Questo si ottiene sostenendo con aria gli oggetti. Poiché l’aria fa pochissimo attrito, un oggetto scivola via a velocità praticamente costante, quando a esso non sono applicate forze. Useremo quindi due blocchi scorrevoli che sono stati costruiti accuratamente in modo che abbiano lo stesso peso o la stessa massa (quello realmente misurato fu il peso, ma sappiamo che il peso è proporzionale alla massa), e porremo fra i due blocchi, in un cilindro chiuso, una piccola capsula esplosiva (FIGURA 10.2). Inizialmente i blocchi si troveranno al centro del binario fermi e li separeremo facendo esplodere la capsula con una scintilla elettrica. Che cosa accadrà? Se le velocità, quando essi si separano, sono uguali, arriveranno alle estremità del binario allo stesso instante, rimbalzeranno indietro con velocità praticamente opposte, arriveranno simultaneamente al centro da dove erano partiti, e si fermeranno. È una buona verifica; quando la si esegue il risultato è quello descritto (FIGURA 10.3). Vogliamo ora descrivere ciò che accade in una situazione meno semplice. Supponiamo di avere due masse uguali, una che si muove con velocità v e l’altra ferma, che si urtano e restano attaccate (1)

H.V. Neher e R.B. Leighton, Amer. Jour. of Phys. 31, 255 (1963).

10.3 • La quantità di moto si conserva!

© 978-8808-22107-0

101

10.4 Urto anelastico fra masse uguali osservato da due diversi riferimenti. FIGURA

Urto visto dal centro di massa

Urto visto da un’automobile con velocità –v

–v

v m

m

v=0 m m

2v Prima dell’urto

v=0 m

m

Urto visto dal laboratorio v1

m

v2

m

v Dopo l’urto

v m

m

Urto visto da un’automobile

m

m

Prima dell’urto

Dopo l’urto

v1 –v2 m

v=0 m

(v1 –v2)/2 m m

(urto anelastico); che cosa accadrà? La massa complessiva 2m si sposta con una velocità incognita. Quale velocità? Questo è il problema. Per trovare la risposta, facciamo l’ipotesi che se ci muoviamo su un’automobile, le leggi della fisica appaiano le stesse che se fossimo fermi. Sappiamo che due masse uguali, che si muovono in direzioni opposte con uguale velocità v, si fermano quando urtano e supponiamo che, mentre l’urto avviene, stiamo osservando da un’automobile che si muove con velocità v. Che cosa ci appare? Poiché stiamo viaggiando con una delle due masse che si stanno avvicinando, questa ci apparirà come se avesse velocità nulla. L’altra massa, invece, che si avvicina alla prima con velocità v, sembrerà venirci incontro con velocità 2v (FIGURA 10.4). Infine le due masse insieme, dopo l’urto, appariranno in movimento con velocità v. Quindi concludiamo che un oggetto che urta con velocità 2v un oggetto uguale, in quiete, si muoverà dopo l’urto, insieme a esso, con velocità v. Oppure, in modo matematicamente equivalente, un oggetto che, con velocità v, ne urta uno uguale, in quiete, restando attaccato a esso, produrrà un oggetto che si muove con velocità v/2. Si osservi che, se sommiamo i prodotti delle masse per le velocità prima dell’urto, mv + 0, si ottiene lo stesso risultato se moltiplichiamo la massa per la velocità del sistema dopo l’urto, 2m · v/2. Questo ci insegna ciò che accade quando una massa in moto con velocità v ne urta una ferma. Esattamente nello stesso modo possiamo dedurre quello che accade quando due oggetti uguali, aventi velocità qualsiasi, si urtano. Supponiamo che due corpi uguali, aventi velocità rispettivamente v1 e v2 , si urtino e restino attaccati. Qual è la loro velocità v dopo l’urto? Di nuovo osserviamo da un’automobile, che si muove, per esempio, con velocità v2 , in modo che un corpo appaia fermo. L’altro sembrerà avere una velocità v1 v2 , per cui ci troveremo in un caso uguale al precedente. Dopo l’urto essi si muoveranno, rispetto all’automobile, con velocità (v1 v2 )/2. Qual è allora la velocità rispetto al suolo? Essa è (FIGURA 10.5) v=

1 (v1 2

v2 ) + v2 =

Osserviamo di nuovo che

1 (v1 + v2 ) 2

v1 + v2 (10.6) 2 Così, usando questo principio, possiamo analizzare ogni specie di collisione nella quale due corpi di massa uguale si urtano e restano attaccati. Infatti, sebbene si sia trattato il problema in una sola dimensione, si possono scoprire tante cose su collisioni molto più complicate, immaginando di osservarle da un’automobile che si muove in qualsiasi direzione obliqua. Il principio resterebbe lo stesso ma i dettagli si complicherebbero. Per verificare sperimentalmente se un oggetto, che si muove con velocità v, urtandone un altro, uguale e in quiete, forma un oggetto che si muove con velocità v/2, possiamo fare il seguente esperimento, utilizzando il sistema di sospensione ad aria. Sistemiamo sulla rotaia tre oggetti di massa uguale, due dei quali inizialmente collegati con la solita capsula esplosiva e il terzo vicino a essi, ma separato e dotato di una ventosa in modo che possa attaccarsi a un oggetto che lo urti. Un istante dopo l’esplosione abbiamo due oggetti di massa m che si muovono con velocità v uguali e opposte. Poco dopo uno di questi urta il terzo oggetto, formando un oggetto di massa 2m, che si muove, noi crediamo, con velocità v/2. Come verificare che sia realmente v/2? Sistemando le posizioni iniziali delle masse sulla rotaia in modo che le distanze dagli estremi non siano uguali ma stiano nel rapporto 2 a 1. Così la prima massa che continua a muoversi con velocità v, coprirà mv1 + mv2 = 2m

10.5 Altro urto anelastico osservato da due diversi riferimenti. FIGURA

Capitolo 10 • Conservazione della quantità di moto

102 FIGURA

© 978-8808-22107-0

10.6

Esperimento per verificare che una massa m quando urta con velocità v un’altra massa uguale inizialmente ferma, dà luogo a una massa 2m che si muove con velocità v 0 = v /2.

∆ 2D + ∆

m

m

–v m

2D

v m ∆

–v m

m

D

0 m

D

∆ v' 2m

in un dato tempo una distanza doppia di quella percorsa dalle masse che sono legate insieme (occorre anche tener conto della piccola distanza percorsa dal secondo oggetto prima di urtare il terzo). La massa m e la massa 2m dovrebbero raggiungere gli estremi allo stesso istante, e se eseguiamo la verifica troviamo che questo è vero (FIGURA 10.6). Discutiamo ora ciò che accade se le due masse sono differenti. Inneschiamo l’esplosione fra una massa m e una massa 2m. Che cosa accade allora? Se, come risultato dell’esplosione, m si muove con velocità v, con quale velocità si muove 2m? L’esperimento ora descritto può essere ripetuto ponendo a distanza zero la seconda e la terza massa e quando lo eseguiamo troviamo lo stesso risultato, cioè le masse m e 2m acquistano velocità v e v/2. Così la reazione diretta tra m e 2m dà lo stesso risultato della reazione simmetrica tra m e m, seguita da un urto in cui una di queste e una terza massa m restano attaccate. Inoltre troviamo che le masse m e 2m, ritornando dalle estremità della rotaia con le loro velocità (quasi) esattamente invertite, si fermeranno se nell’urto restano attaccate. Poniamoci ora la domanda seguente. Che cosa accade se una massa m che si muove con velocità v urta, restando attaccata, una massa 2m inizialmente in quiete? È molto facile rispondere usando il principio di relatività galileiana e osservando la collisione che abbiamo descritto da un’automobile in movimento con velocità v/2 (FIGURA 10.7). Dall’automobile le velocità appaiono v10 = v v20 =

vauto = v + v 2

vauto =

v 3 = v 2 2 v v + =0 2 2

Dopo l’urto, la massa 3m appare in movimento con velocità v/2. Così abbiamo la risposta che il rapporto delle velocità prima e dopo l’urto è 3 a l: se un oggetto di massa m urta un oggetto fermo di massa 2m, l’intero oggetto si muove, legato insieme, con una velocità 1/3 di quella iniziale. Di nuovo la regola generale è che la somma dei prodotti delle masse per le velocità resta costante: mv + 0 = 3m · v/3; in questo modo stiamo costruendo gradualmente, pezzo per pezzo, il teorema di conservazione della quantità di moto. Fin qui abbiamo trattato esempi di urti fra una massa m e una massa 2m. Con le stesse argomentazioni possiamo prevedere gli urti fra masse m e 3m, 2m e 3m ecc. Nella FIGURA 10.8 è illustrato il caso 2m contro 3m, con masse inizialmente ferme. In ogni caso si trova che la massa del primo oggetto per la sua velocità più la massa del secondo oggetto per la sua velocità è uguale al prodotto della massa per la velocità dell’oggetto finale. Questi sono tutti esempi di conservazione della quantità di moto. Partendo da casi semplici, simmetrici, abbiamo dimostrato la legge per casi più complessi. Potremmo, infatti, eseguire la

FIGURA 10.7 Urto anelastico fra le masse m e 2m osservato da due diversi riferimenti.

10.8

Azione e reazione fra le masse 2m e 3m. FIGURA

Urto visto dal centro di massa v

–v /2

m

2m 0 3m

Urto visto da un’automobile

Prima dell’urto

Dopo l’urto

3v /2

0

m

2m v/2 3m

0 m

0 m –v m

0 m

0 m v m

0 m

0 m

0 m

0 m 0 m

m

–v/2 m

v/2 m m

m

–v/2 m

m

v/3 m

m

10.4 • Quantità di moto ed energia

© 978-8808-22107-0

dimostrazione per ogni rapporto razionale fra le masse e, poiché ogni rapporto è estremamente vicino a un rapporto razionale, trattare ogni rapporto con la precisione voluta.

10.4

Quantità di moto ed energia

Tutti gli esempi precedenti sono casi elementari in cui i corpi urtano e restano attaccati oppure sono inizialmente attaccati e vengono separati mediante un’esplosione. Tuttavia esistono situazioni in cui i corpi non si attaccano come, per esempio, nel caso di due corpi di masse uguali e di uguali velocità che si urtano e rimbalzano. Per breve tempo essi sono in contatto e sono ambedue compressi. All’istante di massima compressione essi hanno velocità nulla e l’energia è immagazzinata nei corpi elastici come in una molla compressa. Questa energia deriva dall’energia cinetica che i corpi avevano prima della collisione e che si annulla nell’istante in cui la loro velocità è zero. La perdita di energia cinetica è tuttavia solo momentanea. Questo stato di compressione è analogo alla capsula che libera energia in un’esplosione. I corpi sono immediatamente decompressi in una specie di esplosione e si allontanano; ma ormai conosciamo questo caso: i corpi si allontanano con uguali velocità. Tuttavia questa velocità di rimbalzo è, in generale, minore della velocità iniziale, poiché non tutta l’energia è disponibile per l’esplosione, e questo dipende del materiale. Se il materiale è morbido, l’energia cinetica non è recuperata, ma se è qualcosa di più rigido, una parte dell’energia cinetica è di solito riguadagnata. Nell’urto, il resto dell’energia cinetica è trasformato in calore e in energia di vibrazione. I corpi si scaldano e vibrano. In breve tempo l’energia di vibrazione si trasforma in calore. È possibile costruire i corpi che si urtano utilizzando materiali estremamente elastici, come l’acciaio, con respingenti a molla progettati con cura in modo che l’urto generi pochissimo calore e vibrazione. In queste condizioni le velocità di rimbalzo sono praticamente uguali alle velocità iniziali; un urto di questo tipo si chiama elastico. Il fatto che le velocità prima e dopo l’urto siano uguali non dipende dalla conservazione della quantità di moto, ma dalla conservazione dell’energia cinetica. Il fatto che le velocità dei corpi che rimbalzano dopo una collisione simmetrica siano uguali e opposte fra loro dipende dalla conservazione della quantità di moto. Potremmo, in maniera simile, analizzare urti fra corpi di diverse masse, con differenti velocità iniziali, e diversi gradi di elasticità, determinando le velocità finali e la perdita di energia cinetica, ma non scenderemo in dettagli per questi processi. Gli urti elastici sono particolarmente interessanti per i sistemi che non hanno «ingranaggi, ruote o parti interne». Infatti quando si verifica un urto non vi è alcuna parte nella quale l’energia possa essere immagazzinata, poiché gli oggetti che si allontanano si trovano nelle stesse condizioni in cui erano quando urtavano. Quindi gli urti fra oggetti molto elementari sono sempre elastici o pressoché elastici. Per esempio, gli urti fra atomi o molecole in un gas sono considerati perfettamente elastici. Sebbene questa sia una eccellente approssimazione, anche questi urti non sono perfettamente elastici; altrimenti non si potrebbe capire come un gas possa emettere energia sotto forma di luce o calore radiante. Qualche volta, per una collisione, in un gas, viene emesso un raggio infrarosso di bassa energia, ma questo evento è molto raro e la quantità di energia emessa è piccolissima. Così, nella maggior parte dei casi, gli urti di molecole nei gas si considerano perfettamente elastici. Come esempio interessante consideriamo un urto elastico fra due oggetti di massa uguale. Se essi si avvicinano con la stessa velocità, si allontaneranno, per simmetria, con la stessa velocità. Consideriamo lo stesso esempio nel caso in cui uno dei corpi si muova con velocità v e l’altro sia fermo. Che cosa accade? Abbiamo già visto prima come procedere. Osserviamo l’urto da un’automobile che si muove nella direzione di uno degli oggetti con una velocità tale che esso appaia simmetrico, e troviamo che se il corpo fermo è urtato elasticamente da un altro corpo di massa uguale, il corpo in movimento si ferma e quello che era fermo si muove con la stessa velocità che aveva l’altro: i due corpi si scambiano semplicemente le velocità. Questo comportamento può essere facilmente dimostrato con un opportuno dispositivo. Più in generale, se ambedue i corpi si muovono, con differenti velocità, essi, urtando, si scambiano le velocità.

103

104

Capitolo 10 • Conservazione della quantità di moto

© 978-8808-22107-0

Un altro esempio di interazione quasi elastica viene dal magnetismo. Se sistemiamo su due carrelli scorrevoli una coppia di magneti a ferro di cavallo in modo che si respingano, quando uno di essi si avvicina all’altro lo spinge via fermandosi, mentre il secondo se ne va, senza attrito. Il principio di conservazione della quantità di moto è utilissimo poiché ci permette di risolvere molti problemi senza conoscerne i dettagli. Per esempio, abbiamo potuto prevedere le velocità di allontanamento dei corpi senza conoscere i particolari sui movimenti dei gas nell’esplosione della capsula. Un altro esempio interessante è la propulsione a razzo. Un razzo, la cui massa M è grande, espelle un piccolo frammento di massa m, con velocità V elevatissima relativamente al razzo. Il razzo, nel caso fosse stato inizialmente fermo, si muoverebbe di conseguenza con una piccola velocità v. Usando il principio di conservazione della quantità di moto possiamo calcolare che questa velocità è m v= V M Così, finché viene espulso del materiale, il razzo continua a guadagnare velocità. La propulsione di un razzo è essenzialmente uguale al rinculo di un fucile: non c’è bisogno di aria su cui «appoggiarsi» per spingere.

10.5

Quantità di moto relativistica

In tempi recenti la legge di conservazione della quantità di moto ha subito alcune modifiche. Tuttavia anche oggi la legge resta valida, dato che le modifiche si riferiscono alle definizioni. Nella teoria della relatività vale la conservazione della quantità di moto; le particelle hanno una massa e la quantità di moto è ancora definita come mv, massa per velocità, ma la massa cambia con la velocità, quindi anche la quantità di moto cambia. La massa varia con la velocità secondo la legge m0 m= r (10.7) v2 1 c2 dove m0 è la massa del corpo fermo e c la velocità della luce. È facile vedere dalla formula che la differenza fra m e m0 è trascurabile a meno che non sia molto grande e che per le comuni velocità l’espressione della quantità di moto si riduce alla vecchia formula. Le componenti della quantità di moto per una singola particella sono scritte come m0 v x px = r v2 1 c2 m0 vy py = r v2 1 c2

(10.8)

m 0 vz pz = r v2 1 c2 dove v 2 = vx2 + vy2 + vz2 . Se si sommano le componenti nella direzione x per tutte le particelle che interagiscono, prima e dopo l’urto, le somme sono uguali; cioè la quantità di moto si conserva lungo l’asse x. Lo stesso vale in ogni altra direzione. Nel capitolo 4 abbiamo detto che la legge di conservazione dell’energia non è valida a meno che non ci rendiamo conto che l’energia può apparire sotto forme diverse, energia elettrica, meccanica, radiante, termica e così via. In alcuni casi, come per esempio quello dell’energia termica, si potrebbe dire che l’energia sia «nascosta». Questo esempio può suggerire la domanda:

© 978-8808-22107-0

10.5 • Quantità di moto relativistica

«Esistono forme nascoste di quantità di moto, forse di tipo termico?». La risposta è che è molto difficile nascondere la quantità di moto per le seguenti ragioni. Il moto casuale degli atomi di un corpo dà una misura dell’energia termica se si sommano i quadrati delle velocità. Questa somma sarà positiva non avendo un carattere direzionale. Il calore esiste sia che il corpo si muova come un tutto oppure no, e la conservazione dell’energia sotto forma di calore non è molto ovvia. D’altra parte se si sommano le velocità che possiedono una certa direzione e si trova un risultato diverso da zero, significa che vi è una deriva dell’intero corpo in quella particolare direzione, e una tale macroscopica quantità di moto viene facilmente osservata. Così una quantità di moto persa in un moto interno casuale non esiste, poiché il corpo ha quantità di moto diversa da zero soltanto quando si muove come un tutto. Quindi, la quantità di moto, come grandezza meccanica, è difficile da nascondere. Tuttavia essa può essere nascosta, per esempio nel campo elettromagnetico. Questo è un altro effetto della relatività. Secondo Newton, le azioni a distanza sono istantanee, mentre in realtà questo non è vero; in situazioni in cui esistono forze elettriche, per esempio, se una carica elettrica viene improvvisamente spostata dalla sua posizione, gli effetti su un’altra carica, posta in un’altra posizione, non compaiono istantaneamente, ma vi è un piccolo ritardo. In casi come questo, anche se le forze sono uguali, i conti sulla quantità di moto non tornano: c’è un breve intervallo di tempo durante il quale vi è un’anomalia, perché per un certo tempo la prima carica subirà una reazione e guadagnerà quantità di moto, mentre la seconda carica non sentirà niente e non cambierà la sua quantità di moto. Occorre tempo perché la perturbazione attraversi la distanza fra le cariche, il che avviene alla velocità di 186 000 miglia/s. In quel breve intervallo di tempo, quindi, la quantità di moto delle particelle non si conserva. Naturalmente, dopo che la seconda carica ha sentito l’effetto della prima e tutto si è calmato, l’equazione della quantità di moto sarà perfettamente verificata, ma, durante quel piccolo intervallo di tempo, la quantità di moto non si conserva. Interpretiamo questo fatto dicendo che, durante questo intervallo di tempo, oltre alla quantità di moto mv della particella, vi è un’altra specie di quantità di moto, che è quella del campo elettromagnetico. Se aggiungiamo alla quantità di moto delle particelle quella del campo, allora la quantità di moto si conserva sempre, in ogni istante. Il fatto che il campo elettromagnetico possegga quantità di moto ed energia lo rende molto reale. Così, per spiegarci meglio, l’idea originale che esistono soltanto forze fra particelle deve essere modificata nel senso che una particella produce un campo e un campo agisce su un’altra particella, e il campo stesso possiede le medesime proprietà, come il contenuto di energia e la quantità di moto, proprie delle particelle. Facciamo un altro esempio: un campo elettromagnetico si propaga per onde, che noi chiamiamo luce; la luce trasporta con sé anche quantità di moto, cosicché quando urta un oggetto vi trasporta una certa entità di quantità di moto per secondo; questo equivale a una forza, poiché se l’oggetto illuminato riceve una certa entità di quantità di moto per secondo, la sua quantità di moto cambia e la situazione è la stessa che si avrebbe se su di esso agisse una forza. La luce esercita una pressione quando colpisce un oggetto; questa pressione è piccolissima, ma misurabile con strumenti sufficientemente sensibili. In meccanica quantistica la quantità di moto è una quantità differente, non più mv. È difficile definire esattamente che cosa significhi velocità di una particella, ma la quantità di moto esiste ancora. In meccanica quantistica la differenza è che quando le particelle sono rappresentate come particelle, la quantità di moto è sempre mv, ma quando le particelle sono rappresentate come onde, la quantità di moto è misurata dal numero di onde per centimetro: più grande è questo numero di onde, maggiore è la quantità di moto. Nonostante la differenza, la legge di conservazione della quantità di moto continua a valere anche in meccanica quantistica. Benché, in meccanica quantistica, la legge F = ma non sia verificata e tutte le derivazioni di Newton relative alla conservazione della quantità di moto siano sbagliate, questa particolare legge si mantiene valida!

105

11

Vettori

11.1

La simmetria in fisica

In questo capitolo introduciamo un argomento che è tecnicamente conosciuto in fisica come simmetria delle leggi fisiche. Il vocabolo «simmetria» è usato qui con uno speciale significato e quindi è necessario che venga definito. Quand’è che una cosa è simmetrica? Come possiamo definirla? Per esempio, quando abbiamo un’immagine simmetrica, un lato è, in un certo qual modo, la ripetizione dell’altro. Il professor Hermann Weyl ha dato questa definizione della simmetria: «Una cosa è simmetrica se può essere sottoposta a una determinata operazione ed essa appare esattamente la stessa di prima». Per esempio, se osserviamo il profilo di un vaso che si presenta simmetrico fra destra e sinistra e ruotiamo il vaso di 180° attorno all’asse verticale, il profilo non cambia. Adotteremo la definizione di simmetria nella forma più generale di Weyl e in tale forma discuteremo la simmetria delle leggi fisiche. Supponiamo di costruire una macchina complessa in un determinato posto, con un insieme di complicate interazioni, e palle che rimbalzano intorno esercitando forze fra loro e così via. Supponiamo ora di costruire esattamente lo stesso genere di apparecchiatura da qualche altra parte, costruendo pezzo su pezzo, con le stesse dimensioni e lo stesso orientamento, ogni cosa esattamente identica, solo spostata lateralmente di una certa distanza. Allora, se facciamo partire le due macchine nelle stesse condizioni iniziali, con esatta corrispondenza, ci domandiamo: una macchina si comporterà esattamente come l’altra? Seguirà tutti i movimenti con esatto parallelismo? Naturalmente la risposta può essere no, perché se scegliamo il posto sbagliato per la nostra macchina, essa potrebbe trovarsi all’interno di un un muro, e le interferenze del muro potrebbero impedirne il funzionamento. Tutte le nostre idee in fisica richiedono, per la loro applicazione, una certa dose di buon senso; infatti non sono idee puramente matematiche o astratte. Dobbiamo capire che cosa intendiamo quando diciamo che i fenomeni sono gli stessi quando muoviamo l’apparato in una nuova posizione. Intendiamo muovere tutto quello che crediamo attinente; se il fenomeno non è più lo stesso, pensiamo che non è stato mosso qualcosa di pertinente e procediamo a cercare che cosa è. Se non lo troviamo, allora affermiamo che le leggi della fisica non hanno questa simmetria. D’altra parte possiamo trovarlo – ci aspettiamo di trovarlo – se le leggi della fisica hanno tale simmetria; guardando attorno, per esempio, possiamo scoprire che il muro esercita una certa pressione sull’apparato. La domanda fondamentale è: se definiamo le cose abbastanza bene, se tutte le forze essenziali sono incluse nell’apparato, se tutte le parti attinenti sono mosse da un posto a un altro, le leggi saranno le stesse? La macchina funzionerà allo stesso modo? È chiaro che ciò che dobbiamo fare è muovere tutto l’apparato e le cose essenziali che hanno influenza su di esso, ma non ogni cosa nell’universo – pianeti, stelle e tutto il resto – perché se facciamo questo abbiamo di nuovo lo stesso fenomeno, per la banale ragione che siamo esattamente tornati al punto di partenza. No, non possiamo muovere tutto. Ma risulta in pratica che con un po’ di intelligenza riguardo ciò che va spostato, il meccanismo funzionerà. In altre parole, se non entriamo in una parete, se conosciamo l’origine delle forze esterne, e facciamo in modo che anche queste siano spostate, allora il meccanismo funzionerà ugualmente in un luogo come in qualsiasi altro.

11.2 • Traslazioni

© 978-8808-22107-0

11.2

Traslazioni

Limiteremo la nostra analisi alla sola meccanica, per la quale abbiamo ora sufficienti conoscenze. Nei precedenti capitoli abbiamo visto che le leggi della meccanica possono essere riassunte in un gruppo di tre equazioni per ogni particella: m

d2 x = Fx dt 2

m

d2 y = Fy dt 2

m

d2 z = Fz dt 2

(11.1)

Ciò significa che esiste un modo di misurare x, y e z su tre assi perpendicolari, e le forze lungo tali direzioni, in modo che queste leggi risultino verificate. Tutto questo deve essere misurato a partire da una certa origine, ma dove poniamo l’origine? Tutto ciò che Newton direbbe dapprima è che esiste un punto da cui possiamo fare le misure, forse il centro dell’universo, così che queste leggi siano corrette. Ma è subito dimostrabile che non possiamo mai trovare il centro, dato che non fa differenza usare qualche y y' altra origine. Joe Moe In altre parole, supponiamo che vi siano due persone: Joe, che ha l’origine in un punto, e Moe, che ha un sistema parallelo, la cui origine è diversa (FIGURA 11.1). Ora, quando Joe misura la posizione del punto nello spazio, la trova a x, y e z (tralasceremo abitualmente z per il fatto che a x' genera confusione riportarlo nella figura). Moe, d’altra parte, misurando lo x x' x stesso punto, otterrà una diversa x (per distinguerla la chiameremo x 0), e in linea di principio una diversa y, benché nel nostro esempio y e y 0 siano numericamente uguali. Così abbiamo FIGURA 11.1 Due sistemi di coordinate paralleli. x0 = x

y0 = y

a

z0 = z

(11.2)

Per completare la nostra analisi dobbiamo sapere che cosa otterrebbe Moe sulle forze. Si suppone che la forza agisca lungo qualche linea, e per forza in direzione x intendiamo la parte della forza totale che è in direzione x, che è l’intensità della forza per il coseno dell’angolo con l’asse x. Ora vediamo che Moe userebbe esattamente la stessa proiezione usata da Joe, cosicché abbiamo un gruppo di equazioni Fx0 = Fx Fy0 = Fy

(11.3)

Fz0 = Fz Queste sarebbero le relazioni fra le quantità osservate da Joe e da Moe. Il problema è, se Joe conosce le leggi di Newton e se Moe cerca di scrivere le leggi di Newton, saranno valide le leggi anche per lui? In altre parole, supponendo che le equazioni (11.1) siano giuste e le equazioni (11.2) e (11.3) diano la relazione delle misure, le equazioni

sono vere oppure no?

m

d2 x 0 = Fx0 dt 2

(11.4a)

m

d2 y 0 = Fy0 dt 2

(11.4b)

m

d2 z 0 = Fz0 dt 2

(11.4c)

107

108

Capitolo 11 • Vettori

© 978-8808-22107-0

Per provare queste equazioni differenzieremo due volte la formula che dà x 0. Prima di tutto d x0 d = (x dt dt

a) =

dx dt

da dt

Supponiamo che l’origine di Moe sia fissa (non in movimento) rispetto all’origine di Joe; quindi che a sia una costante e da/dt = 0, così troviamo che d x0 d x = dt dt e quindi

d2 x 0 d2 x = 2 dt 2 dt

Pertanto l’equazione (11.4a) diventa

d2 x = Fx0 dt 2 (Supponiamo anche che le masse misurate da Joe e Moe siano uguali.) Così l’accelerazione per la massa è la stessa di quella del compagno. Abbiamo anche trovato la formula per Fx0 , perché sostituendo dall’equazione (11.1), troviamo che m

Fx0 = Fx Quindi le leggi osservate da Moe appaiono le stesse; anch’egli può scrivere le leggi di Newton con differenti coordinate, ed esse saranno esatte. Ciò significa che non vi è un unico modo di definire l’origine dell’universo, poiché le leggi appariranno le stesse, da qualsiasi posizione vengano osservate. Anche questo è vero: se vi è un dispositivo in un posto con un certo tipo di meccanismo, lo stesso dispositivo in un altro posto si comporterà allo stesso modo. Perché? Perché una macchina quando è analizzata da Moe ha esattamente le stesse equazioni dell’altra analizzata da Joe. Poiché le equazioni sono le stesse, il fenomeno appare lo stesso. Così la prova che un dispositivo in una nuova posizione funziona esattamente come nella posizione primitiva è la stessa cosa del provare che le equazioni, spostando l’origine nello spazio, riproducono se stesse. Quindi diciamo che le leggi di fisica sono simmetriche rispetto alle traslazioni, simmetriche nel senso che le leggi non cambiano quando facciamo una traslazione delle nostre coordinate. Naturalmente è del tutto ovvio intuitivamente che ciò sia giusto, ma è interessante e piacevole discuterne la matematica.

11.3

Rotazioni

Quanto sopra è la prima di una serie di proposizioni sempre più complicate concernenti la simmetria di una legge fisica. Il prossimo quesito è che non dovrebbe far differenza in che direzione scegliamo gli assi. In altre parole, se costruiamo un dispositivo in qualche posto e lo osserviamo operare, e vicino costruiamo lo stesso genere di dispositivo e lo ruotiamo di un angolo rispetto al primo, funzionerà nello stesso modo? Ovviamente no se, per esempio, è un grande orologio a pendolo! Se un orologio a pendolo sta verticalmente, funziona bene, ma, se è inclinato, il pendolo cade sulla parete della custodia e non accade più niente. Il teorema è dunque falso nel caso dell’orologio a pendolo, salvo che non includiamo la Terra, che esercita attrazione sul pendolo. Quindi possiamo fare una previsione sugli orologi a pendolo se crediamo nella simmetria delle leggi fisiche per la rotazione: qualche cosa d’altro, oltre al meccanismo, entra nel funzionamento di un orologio a pendolo, qualcosa di estraneo che dovremo cercare. Possiamo anche predire che gli orologi a pendolo non funzioneranno allo stesso modo quando sono in posizione diversa rispetto a questa misteriosa sorgente di asimmetria, forse la Terra. Infatti, sappiamo che un orologio a pendolo su un satellite artificiale, per esempio, non oscillerebbe perché non vi è forza effettiva, e su Marte avrebbe una diversa frequenza. Gli orologi a pendolo coinvolgono qualcosa di più del

11.3 • Rotazioni

© 978-8808-22107-0

109

loro meccanismo interno, coinvolgono qualcosa di estraneo. Una volta ravvisato questo fattore, vediamo che dobbiamo far girare la Terra insieme all’apparato. Naturalmente non dobbiamo preoccuparci per questo, è facile da effettuare; si aspetta semplicemente un momento o due e la Terra gira; allora l’orologio a pendolo oscilla ancora nella nuova posizione così come faceva prima. Mentre ruotiamo nello spazio, i nostri angoli cambiano continuamente rispetto a un riferimento assoluto; questa variazione non sembra infastidirci molto, perché nella nuova posizione ci sembra di essere nella stessa condizione di prima. Questo tende a generare confusione, perché è vero che nella nuova posizione ruotata le leggi sono le stesse che nella posizione prima della rotazione, ma non è vero che quando facciamo ruotare una cosa essa segue le stesse leggi che segue quando non la stiamo ruotando. Se eseguiamo esperimenti sufficientemente raffinati, possiamo dire che la Terra sta ruotando, ma non che ha ruotato. In altre parole non possiamo individuare la sua posizione angolare, ma possiamo dire che sta girando. Possiamo ora discutere gli effetti dell’orientamento angolare sulle leggi fisiche. Vediamo se lo stesso gioco con Joe e Moe funziona ancora. Questa volta, per evitare inutili complicazioni, supporremo che Joe e Moe usino la stessa origine (abbiamo già dimostrato che gli assi possono subire traslazioni). Supponiamo che gli assi di Moe abbiano ruotato rispetto a quelli di Joe di un angolo ✓. I due sistemi di coordinate sono mostrati nella FIGURA 11.2, che è limitata a due dimensioni. Consideriamo un punto P avente coordinate (x, y) nel sistema di Joe e (x 0, y 0) nel sistema di Moe. Cominceremo, come nel caso precedente, con l’esprimere le coordinate x 0 e y 0 in funzione di x, y e ✓. A questo scopo anzitutto abbassiamo le perpendicolari da P a tutti e quattro gli assi e tracciamo AB perpendicolare a PQ. L’esame della figura mostra che x 0 può essere scritto come la somma di due lunghezze sull’asse x 0 e y 0 come la differenza di due lunghezze lungo AB. Tutte queste lunghezze sono espresse in funzione di x, y e ✓ nelle equazioni (11.5), a cui abbiamo aggiunto un’equazione per la terza dimensione. x 0 = x cos ✓ + y sen ✓ y 0 = y cos ✓

x sen ✓

(11.5)

0

z =z Il prossimo passo è analizzare la relazione tra le forze come sono viste da due osservatori, seguendo lo stesso metodo generale di prima. Supponiamo che una forza F, che è già stata analizzata come avente componenti Fx e Fy (secondo quanto visto da Joe), agisca su una particella di massa m, posta nel punto P in FIGURA 11.2. Per semplicità spostiamo entrambi i sistemi di assi in modo che l’origine sia in P, come mostrato in FIGURA 11.3. Moe vede le componenti di F lungo i suoi assi come Fx0 e Fy0 . Fx ha componenti lungo entrambi gli assi x 0 e y 0, e Fy , similmente, ha componenti lungo entrambi questi assi. Per esprimere Fx0 in funzione di Fx e Fy , sommiamo queste componenti lungo l’asse x 0 e, in modo simile, possiamo esprimere Fy0 in funzione di Fx e Fy . I risultati sono Fx0 = Fx cos ✓ + Fy sen ✓ Fy0 = Fy cos ✓

Fx sen ✓

(11.6)

Fz0 = Fz y

y

y'

y'

P(x',y' ) P(x,y) y sen

B Q

F Fy Fy'

x'

x cos

11.2 Due sistemi di coordinate aventi differenti orientamenti angolari. FIGURA

(Moe)

x' Fx'

(Joe) O

A

x

O

Fx

x

11.3 Componenti di una forza nei due sistemi di coordinate. FIGURA

110

Capitolo 11 • Vettori

© 978-8808-22107-0

È interessante notare un caso che è di estrema importanza: le formule (11.5) e (11.6), per le coordinate di P e le componenti di F, rispettivamente, sono di forma identica. Come prima, si presume che le leggi di Newton siano giuste nel sistema di Joe, e che siano espresse dalle equazioni (11.1). Il problema, di nuovo, è se Moe può applicare le leggi di Newton: risulteranno corretti i risultati per il suo sistema di assi ruotati? In altre parole, se supponiamo che le equazioni (11.5) e (11.6) diano la relazione delle misure, le equazioni m

d2 x 0 = Fx0 dt 2

m

d2 y 0 = Fy0 dt 2

m

d2 z 0 = Fz0 dt 2

(11.7)

sono esatte oppure no? Per provare queste equazioni calcoliamo i primi e i secondi membri indipendentemente, e confrontiamo i risultati. Per calcolare i primi membri, moltiplichiamo le equazioni (11.5) per m, e differenziamo due volte rispetto al tempo, supponendo costante l’angolo. Risulta m

d2 x 0 d2 x d2 y = m cos ✓ + m sen ✓ dt 2 dt 2 dt 2

m

d2 y 0 d2 y = m cos ✓ dt 2 dt 2

m

d2 z 0 d2 z = m dt 2 dt 2

m

d2 x sen ✓ dt 2

(11.8)

Calcoliamo i secondi membri delle equazioni (11.7), sostituendo le equazioni (11.1) nelle equazioni (11.6). Si ottiene Fx0 = m

d2 x d2 y cos ✓ + m 2 sen ✓ 2 dt dt

Fy0 = m

d2 y cos ✓ dt 2

Fz0 = m

d2 z dt 2

m

d2 x sen ✓ dt 2

(11.9)

Vedete! I secondi membri delle equazioni (11.8) e (11.9) sono identici, così concludiamo che se le leggi di Newton sono esatte per un sistema di assi, esse sono altresì valide per qualsiasi altro sistema di assi. Questo risultato, che è stato ora stabilito sia per le traslazioni sia per le rotazioni degli assi, ha alcune conseguenze. Primo, nessuno può pretendere che i suoi particolari assi siano unici, ma naturalmente essi possono essere più convenienti per alcuni particolari problemi. Per esempio è comodo avere la gravità lungo un asse, ma questo non è fisicamente necessario. Secondo, ciò significa che un dispositivo che sia completamente autosufficiente, con tutte le forze generatrici completamente interne al dispositivo stesso, ruotato di un angolo funzionerebbe allo stesso modo.

11.4

Vettori

Non solo le leggi di Newton, ma anche tutte le altre leggi della fisica, per quanto ne sappiamo a tutt’oggi, hanno le due proprietà che chiamiamo invarianza (o simmetria) per la traslazione e

11.4 • Vettori

© 978-8808-22107-0

la rotazione degli assi. Queste proprietà sono così importanti che è stata sviluppata una tecnica matematica per trarre vantaggio da ciò, nello scrivere e nell’usare le leggi fisiche. L’analisi precedente ha richiesto un considerevole e noioso lavoro di matematica. Per ridurre i particolari al minimo nell’analisi di simili questioni, è stato escogitato un efficace meccanismo matematico. Questo sistema, detto analisi vettoriale, dà il titolo a questo capitolo; strettamente parlando, tuttavia, questo è un capitolo sulla simmetria delle leggi fisiche. Con i metodi dell’analisi precedente saremmo in grado di fare tutto quanto è richiesto per ottenere i risultati che desideriamo, ma in pratica desideriamo fare le cose più rapidamente e facilmente, così usiamo la tecnica dei vettori. Abbiamo cominciato col notare alcune caratteristiche di due classi di grandezze che sono importanti in fisica. (In realtà ve ne sono più di due, ma partiremo da queste.) Una di queste, diciamo il numero di patate in un sacco, la chiamiamo grandezza ordinaria, o quantità priva di direzione, ossia uno scalare. La temperatura è un esempio di una grandezza di questo genere. Altre grandezze che sono importanti in fisica hanno una direzione, per esempio la velocità: dobbiamo sapere da che parte un corpo si muove, non solo conoscere l’intensità della sua velocità. Anche la quantità di moto e la forza hanno direzione, come lo spostamento: quando qualcuno si sposta da un punto a un altro nello spazio, possiamo conservare traccia del tratto percorso, ma se vogliamo conoscere anche dove è andato, dobbiamo specificare direzione e verso. Tutte le grandezze che hanno una direzione – come, per esempio, uno spostamento nello spazio – sono dette vettori. Un vettore è costituito da tre numeri. Per rappresentare uno spostamento nello spazio, diciamo dall’origine a un particolare punto P, la cui posizione è (x, y, z), abbiamo in realtà bisogno di tre numeri, ma introduciamo un unico simbolo matematico, r, che è diverso da ogni altro simbolo matematico usato finora(1) . Esso non è un singolo numero, rappresenta tre numeri: x, y e z. Rappresenta tre numeri, ma in realtà non è soltanto questi tre numeri, perché se usassimo un diverso sistema di coordinate i tre numeri cambierebbero in x 0, y 0 e z 0. Però vogliamo mantenere un formalismo matematico semplice e useremo la stessa indicazione per rappresentare i tre numeri (x, y, z) e i tre numeri (x 0, y 0, z 0). Cioè usiamo la stessa indicazione per rappresentare il primo gruppo di tre numeri per un sistema di coordinate, e il secondo gruppo di tre numeri se stiamo usando l’altro sistema di coordinate. Ciò ha il vantaggio che, quando cambiamo il sistema di coordinate, non dobbiamo cambiare le lettere nelle equazioni. Se scriviamo un’equazione in funzione di x, y, z, e poi usiamo un altro sistema, dobbiamo cambiarle in x 0, y 0, z 0, ma scriveremo soltanto r, con la convenzione che esso rappresenti (x, y, z) se usiamo un sistema di assi, o (x 0, y 0, z 0) se usiamo un altro sistema di assi, e così via. I tre numeri che descrivono la grandezza in un dato sistema di coordinate sono detti le componenti del vettore nella direzione degli assi coordinati di quel sistema. Cioè usiamo lo stesso simbolo per tre lettere che corrispondono allo stesso oggetto, visto da differenti assi. Il fatto stesso che possiamo dire «lo stesso oggetto» implica un’intuizione fisica sulla realtà di uno spostamento nello spazio che è indipendente dalle componenti in funzione delle quali lo misuriamo. Così il simbolo r rappresenterà la stessa cosa, non importa come ruotiamo gli assi. Supponiamo ora che vi sia un’altra grandezza fisica avente direzione, qualunque altra grandezza, alla quale si possano pure associare tre numeri, come la forza, e questi tre numeri cambino in altri tre numeri, secondo una determinata regola matematica, se cambiamo gli assi. Deve essere la stessa regola che cambia (x, y, z) in (x 0, y 0, z 0). In altre parole una quantità fisica associata a tre numeri che si trasformano come le componenti di uno spostamento nello spazio è un vettore. Un’equazione del tipo F=r sarebbe dunque valida in qualsiasi sistema di coordinate se è valida in uno. Questa equazione, naturalmente, sostituisce le tre equazioni Fx = x (1)

Fy = y

Fz = z

Nella stampa, i vettori sono rappresentati in neretto; nei manoscritti si usa una freccia: ~ r.

111

112

Capitolo 11 • Vettori

© 978-8808-22107-0

o alternativamente Fx0 = x 0

Fy0 = y 0

Fz0 = z 0

Il fatto che una relazione fisica possa essere espressa mediante un’equazione vettoriale ci assicura che la relazione non varia per una semplice rotazione del sistema di coordinate. Questa è la ragione per cui i vettori sono tanto utili in fisica. Esaminiamo ora alcune delle proprietà dei vettori. Come esempi di vettori possiamo citare la velocità, la quantità di moto, la forza e l’accelerazione. Per parecchi scopi è conveniente rappresentare una quantità vettoriale con una freccia che indichi direzione e verso in cui sta agendo. Perché possiamo rappresentare, diciamo, la forza con una freccia? Perché ha le stesse proprietà matematiche di trasformazione di uno «spostamento nello spazio». In questo modo la rappresentiamo in un diagramma come se fosse uno spostamento, usando una scala tale che un’unità di forza, ossia 1 N, corrisponda a una data opportuna lunghezza. Fatto questo, tutte le forze possono essere rappresentate con delle lunghezze dato che un’equazione come F = kr dove k è una qualche costante, è un’equazione perfettamente legittima. Così possiamo rappresentare sempre le forze per mezzo di linee, cosa che è molto conveniente, perché una volta tracciata la linea non abbiamo più bisogno degli assi. Naturalmente possiamo subito calcolare le tre componenti, quando cambiano al ruotare degli assi, perché questo è soltanto un problema geometrico.

11.5

Algebra vettoriale

Dobbiamo ora descrivere le leggi, ossia le regole, per combinare i vettori in vari modi. La prima di queste combinazioni è l’addizione di due vettori. Supponiamo che a sia un vettore che in un qualche particolare sistema di coordinate abbia le tre componenti (a x, ay, az ) e che b sia un altro vettore che abbia le tre componenti (bx, by, bz ). Costruiamo ora tre nuovi numeri (a x + bx, ay + by, az + bz ). Questi numeri formano un vettore? «Bene», possiamo dire, «questi sono tre numeri, e tre numeri formano un vettore». No, non ogni gruppo di tre numeri forma un vettore! Perché essi costituiscano un vettore, non è solo necessario che siano tre numeri, ma devono essere legati a un sistema di coordinate in modo che, se ruotiamo il sistema di coordinate, i tre numeri «si trasformano», ciascuno in un altro, e risultano «combinati», secondo la precisa legge che abbiamo già descritto. Così il problema è: se ruotiamo il sistema di coordinate in modo che (a x, ay, az ) diventino (a x0 , ay0 , az0 ) e (bx, by, bz ) diventino (b0x, by0 , bz0 ), che cosa diventano (a x + bx, ay + by, az + bz )? Diventano (a x0 + b0x, ay0 + by0 , az0 + bz0 ) oppure no? La risposta naturalmente è sì, perché le trasformazioni del tipo (11.5) costituiscono ciò che chiamiamo una trasformazione lineare. Se applichiamo tali trasformazioni ad a x e bx per ottenere a x0 + b0x , troviamo che a x + bx trasformato è in effetti uguale ad a x0 + b0x . Quando a e b sono «sommati insieme», in questo senso, essi formeranno un vettore che possiamo chiamare c e scriveremo c= a+b Ora c ha l’interessante proprietà secondo cui c= b+a come vediamo subito dalle sue componenti. Inoltre a + (b + c) = (a + b) + c cioè possiamo sommare i vettori in qualsiasi ordine. Qual è il significato geometrico di a + b? Supponiamo che a e b siano rappresentati da linee su un foglio di carta, che cosa sarà c? Questo è mostrato nella FIGURA 11.4. Vediamo che possiamo

11.5 • Algebra vettoriale

© 978-8808-22107-0

113 FIGURA

y

11.4

Addizione di

11.5

Sottrazione

vettori.

y c

FIGURA

d

di vettori.

b b

a

a –b O O

x d=a–b

x

sommare le componenti di b a quelle di a in modo più conveniente se mettiamo il rettangolo che rappresenta le componenti di b contiguo a quello che rappresenta le componenti di a, nel modo indicato. Poiché b «giace» esattamente nel suo rettangolo, come a nel proprio, è lo stesso che porre la «coda» di b sulla «punta» di a, e il vettore c sarà dalla coda di a alla punta di b. Naturalmente, se volessimo sommare a e b in un altro modo, porremmo la coda di a sulla punta di b e, per le proprietà geometriche dei parallelogrammi, otterremmo per c lo stesso risultato. Notate che i vettori possono essere sommati in questo modo senza riferimenti ad assi coordinati. Supponiamo di moltiplicare un vettore per un numero ↵; che cosa significa? Definiamo con ciò un nuovo vettore le cui componenti sono ↵a x , ↵ay e ↵az . Lasciamo come problema per lo studente la dimostrazione che questo è un vettore. Consideriamo ora la sottrazione di vettori. Possiamo definire la sottrazione allo stesso modo dell’addizione, ma invece di sommare le componenti, le sottraiamo. Oppure possiamo definire la sottrazione definendo un vettore negativo, b = 1b e poi sommando le componenti. Si arriva alla stesso risultato mostrato in FIGURA 11.5. Tale figura mostra l’uguaglianza d=a

b = a + ( b)

Notiamo ancora che la differenza a b può essere trovata facilmente da a e da b usando la relazione equivalente a = b + d. Così la differenza è ancora più facile da trovare della somma: tracciamo semplicemente il vettore da b ad a, per ottenere a b! Passiamo ora alla velocità. Perché la velocità è un vettore? Se la posizione è data da tre coordinate (x, y, z), cos’è la velocità? La velocità è data da dx/dt, dy/dt e dz/dt. È questo un vettore o no? Differenziando le espressioni nelle equazioni (11.5) possiamo dedurre se dx 0/dt si trasforma nel modo giusto. Vediamo che le componenti dx/dt e dy/dt si trasformano in accordo alle stesse leggi di x e y, e quindi la derivata temporale è un vettore. Pertanto la velocità è un vettore. Possiamo scrivere la velocità in modo interessante come v=

dr dt

Cosa sia la velocità e perché sia un vettore può anche essere capito in modo più grafico: qual è lo spostamento di una particella nel piccolo intervallo di tempo t? Risposta: r. Così se una particella è «qui» a un istante e «là» a un altro istante, allora la differenza vettoriale delle posizioni r = r2 r1 , che è nella direzione di moto mostrata in FIGURA 11.6, divisa per l’intervallo di tempo t = t 2 t 1 , è il vettore «velocità media». In altre parole, per velocità vettoriale intendiamo il limite, quando t tende a 0, della differenza fra il raggio vettore al tempo t + t e al tempo t, divisa per t: r dr v = lim = (11.10) t!0 t dt Così la velocità è un vettore perché è la differenza fra due vettori.

2 r2

∆r = r2 – r1 1 r1

O

11.6 Spostamento di una particella in un piccolo intervallo di tempo �t = t 2 t 1 .

FIGURA

114

Capitolo 11 • Vettori

© 978-8808-22107-0

Questa è anche l’esatta definizione di velocità perché le sue componenti sono dx/dt, dy/dt e dz/dt. In effetti vediamo da questa discussione che, se differenziamo qualsiasi vettore rispetto al tempo, produciamo un nuovo vettore. Abbiamo così vari modi di produrre nuovi vettori: • moltiplicare per una costante; • differenziare rispetto al tempo; • sommare o sottrarre due vettori.

11.6

Le leggi di Newton nella notazione vettoriale

Per scrivere le leggi di Newton in forma vettoriale, dobbiamo fare un passo avanti, e definire il vettore accelerazione. Questo è la derivata temporale del vettore velocità, ed è facile dimostrare che le sue componenti sono le derivate seconde di x, y e z rispetto a t: a=

dv d dr d2 r = = 2 dt dt dt dt ax =

dvx d2 x = 2 dt dt

ay =

dvy d2 y = 2 dt dt

az =

dvz d2 z = 2 dt dt

(11.11)

(11.12)

Con questa definizione, quindi, le leggi di Newton possono essere scritte in questo modo: ma = F m

d2 r =F dt 2

(11.13) (11.14)

Ora, il problema di provare l’invarianza delle leggi di Newton per rotazione di coordinate è questo: provare che a è un vettore; questo l’abbiamo appena fatto. Provare che F è un vettore; lo supponiamo. Così se la forza è un vettore, allora, dato che sappiamo che l’accelerazione è un vettore, l’equazione (11.13) apparirà la stessa in ogni sistema di coordinate. Scriverla in una forma che non contenga esplicitamente gli x, y e z ha il vantaggio che da ora in poi non è necessario che scriviamo tre leggi ogni volta che scriviamo le equazioni di Newton o altre leggi della fisica. Scriviamo quella che sembra essere una sola legge, ma in realtà, naturalmente, si tratta di tre leggi per ogni particolare sistema di assi, perché ogni equazione vettoriale implica l’affermazione che l’uguaglianza vale per ciascuna delle componenti. Il fatto che l’accelerazione sia la rapidità di variazione del vettore velocità, ci aiuta a calcolare l’accelerazione in alcune situazioni piuttosto complicate. Supponiamo, per esempio, che una particella si muova secondo una curva complicata (FIGURA 11.7) e che, a un dato istante t, essa abbia una certa velocità v1 ma a un altro istante t 2 , un poco dopo, abbia una diversa velocità v2 . Cos’è l’accelerazione? Risposta: l’accelerazione è la differenza fra le velocità, divisa per il piccolo intervallo di tempo, quindi abbiamo bisogno della differenza fra le due velocità. Come ottenere la differenza delle velocità? Per sottrarre due vettori, tracciamo il vettore fra le estremità di v2 e v1 : cioè tracciamo v come differenza dei due vettori; è giusto? No! Questo va bene solo quando le origini dei vettori sono nello stesso punto! Non ha senso se spostiamo il vettore in qualche altro punto e poi tracciamo una linea congiungente gli estremi, dunque attenzione! Dobbiamo tracciare un nuovo diagramma per sottrarre i vettori. Nella FIGURA 11.8, v1 e v2 sono entrambi tracciati paralleli e uguali ai loro corrispondenti della FIGURA 11.7, e ora possiamo discutere l’accelerazione. Naturalmente l’accelerazione è semplicemente v/ t.

11.7 • Prodotto scalare di vettori

© 978-8808-22107-0

115

11.7 Una traiettoria curva. FIGURA

v1 ∆v = v2 – v1 v1

s r1

r2 ∆

∆v = v2 – v1

v2 ∆v^



R

v2

O

∆v||

È interessante notare che possiamo pensare la differenza di velocità costituita da due parti (e quindi possiamo pensare che l’accelerazione abbia due componenti): v k nella direzione tangente alla traiettoria e v? perpendicolare alla traiettoria, come indicato nella FIGURA 11.8. L’accelerazione tangente alla traiettoria è naturalmente proprio la variazione della lunghezza del vettore, cioè, la variazione dell’intensità di velocità v: dv (11.15) dt L’altra componente di accelerazione, perpendicolare alla curva, è facilmente calcolabile usando le FIGURE 11.7 e 11.8. Nel breve intervallo di tempo t la variazione dell’angolo fra v1 e v2 sarà il piccolo angolo ✓. Se l’intensità della velocità è detta v, allora naturalmente ak =

v? = v ✓

e l’accelerazione sarà

✓ t

a? = v

Ora abbiamo bisogno di conoscere ✓/ t, che può essere trovato in questo modo: se, a un dato momento, la curva viene approssimata a un cerchio di un certo raggio R, allora in un tempo t la distanza s è, naturalmente, v t, dove v è il modulo della velocità. ✓=

v t R

ossia

quindi troviamo a? =

✓ v = t R

v2 R

(11.16)

come abbiamo visto in precedenza.

11.7

Prodotto scalare di vettori

Andiamo un po’ oltre nell’esaminare le proprietà dei vettori. È facile vedere che la lunghezza di uno spostamento nello spazio sarebbe la stessa in qualunque sistema di coordinate. Cioè, se un particolare spostamento r è rappresentato da x, y e z in un sistema di coordinate e da x 0, y 0 e z 0 in un altro sistema di coordinate, sicuramente la distanza r = |r | sarebbe la stessa in entrambi. Ora q r = x2 + y2 + z2 e anche

r0 =

q

x0 2 + y0 2 + z0 2

Ciò che intendiamo verificare è che queste due quantità sono uguali. È molto più conveniente non crearci la complicazione di estrarre la radice quadrata, discutiamo quindi il quadrato della distanza; cioè verifichiamo se x2 + y2 + z2 = x 0 2 + y 0 2 + z 0 2

(11.17)

11.8 Diagramma per il calcolo dell’accelerazione. FIGURA

116

Capitolo 11 • Vettori

© 978-8808-22107-0

Ci mancherebbe altro che non lo fosse! Se sostituiamo l’equazione (11.5), troviamo infatti che è così. Dunque vediamo che vi sono altri tipi di equazioni che sono esatti per qualunque coppia di sistemi di coordinate. In ciò è implicito qualcosa di nuovo. Possiamo produrre una nuova quantità, una funzione di x, y e z, detta funzione scalare, una quantità che non ha direzione ma che è la stessa in entrambi i sistemi. Da un vettore possiamo trarre uno scalare. Dobbiamo trovare per questo una regola generale. È chiaro di quale regola si tratti proprio dal caso considerato: sommare i quadrati delle componenti. Definiamo ora una cosa nuova che chiamiamo a · a. Questo non è un vettore, ma uno scalare; è un numero che è lo stesso in tutti i sistemi di coordinate e che è definito come la somma dei quadrati delle tre componenti del vettore: a · a = a2x + ay2 + az2

(11.18)

Ora direte: «Ma rispetto a quali assi?». Esso non dipende dagli assi, la risposta è la stessa per ogni sistema di assi. Così abbiamo un nuovo tipo di quantità, un nuovo invariante o scalare prodotto da un vettore «elevato al quadrato». Se ora definiamo la seguente quantità per ogni coppia di vettori a e b: a · b = a x bx + ay by + az bz (11.19) troviamo che anche questa quantità, calcolata nei sistemi con accento e senza accento, rimane sempre la stessa. Per dimostrarlo notiamo che ciò è vero per a · a, b · b e c · c, ove c = a + b. Quindi la somma dei quadrati (a x + bx )2 + (ay + by )2 + (az + bz )2 sarà invariante: a x + bx

2

= a x 0 + bx 0

+ ay + by 2

2

+ az + bz

+ ay0 + by0

2

2

=

+ az0 + bz0

2

(11.20)

Se si sviluppano entrambi i termini di questa equazione, allora vi saranno prodotti misti proprio del tipo che appare nell’equazione (11.19), come pure le somme dei quadrati delle componenti di a e di b. L’invarianza dei termini del tipo dell’equazione (11.18) lascia allora invariati anche i prodotti incrociati (11.19). La quantità a · b è detta prodotto scalare di due vettori, a e b, e ha molte interessanti e utili proprietà. Per esempio, è facile provare che a · (b + c) = a · b + a · c

(11.21)

Inoltre, vi è un semplice procedimento geometrico per calcolare a · b senza dover calcolare le componenti di a e di b: a · b è il prodotto della lunghezza di a e della lunghezza di b per il coseno dell’angolo compreso. Perché? Supponiamo di scegliere un particolare sistema di coordinate, in cui l’asse x giace lungo a; in tali circostanze, la sola componente di a è a x , che ovviamente è l’intera lunghezza di a. Così l’equazione (11.19) si riduce a a · b = a x bx cioè alla lunghezza di a per la componente di b nella direzione di a, ossia, b cos ✓: a · b = ab cos ✓ Quindi in questo particolare sistema di coordinate abbiamo provato che a · b è la lunghezza di a per la lunghezza di b per cos ✓. Ma se ciò è giusto in un sistema di coordinate è giusto in tutti i sistemi, perché a · b è indipendente dal sistema di coordinate. Qual è l’utilità del prodotto scalare? Vi sono casi in fisica in cui ne abbiamo bisogno? Sì, ne abbiamo sempre bisogno. Per esempio, nel capitolo 4 l’energia cinetica è stata chiamata mv 2 /2, ma se l’oggetto si muove nello spazio dovrebbe essere il quadrato della velocità nelle direzioni x, y e z, e quindi la formula dell’energia cinetica secondo l’analisi vettoriale è E.C. =

⌘ 1 ⇣ 1 m (v · v) = m vx2 + vy2 + vz2 2 2

(11.22)

11.7 • Prodotto scalare di vettori

© 978-8808-22107-0

L’energia non ha direzione. La quantità di moto ha direzione; si tratta di un vettore ed è data dalla massa per il vettore velocità. Un altro esempio di prodotto scalare è il lavoro prodotto da una forza quando un oggetto è spinto da un punto a un altro. Non abbiamo ancora definito il lavoro, ma è equivalente alla variazione di energia, come nel sollevamento dei pesi, quando una forza F agisce lungo una distanza s: lavoro = F · s (11.23) Talvolta è molto conveniente parlare della componente di un vettore in una data direzione (per esempio la direzione verticale perché questa è la direzione della gravità). Per tali scopi è utile introdurre ciò che definiamo vettore unitario, nella direzione che vogliamo studiare. Per vettore unitario intendiamo un vettore il cui prodotto scalare per se stesso è uguale all’unità. Chiamiamo i questo vettore unitario; allora i · i = 1. Quindi se vogliamo la componente di un vettore nella direzione di i, vediamo che il prodotto scalare a · i è a cos ✓, cioè la componente di a nella direzione di i. Questo è un bel modo di ottenere la componente; in effetti, ci fa ottenere tutte le componenti e ci permette di scrivere una formula molto simpatica. Supponiamo che in un dato sistema di coordinate, x, y e z vengano definiti tre vettori: i, vettore unitario nella direzione x, j, vettore unitario nella direzione y, e k, vettore unitario nella direzione z. Notiamo anzitutto che i · i = 1. Quanto vale i · j? Quando due vettori sono perpendicolari il loro prodotto scalare è zero. Quindi i·i=1 i· j=0

j· j=1

i·k=0

j·k=0

(11.24) k·k=1

Con queste definizioni qualsiasi vettore può essere scritto nella forma a = a x i + ay j + az k

(11.25)

In questo modo possiamo risalire dalle componenti del vettore al vettore stesso. Questa discussione sui vettori non è per nulla completa. Però, piuttosto che cercare di approfondire l’argomento ora, impareremo prima a usare in situazioni fisiche alcune delle idee discusse fin qui. Poi, quando saremo completamente padroni di questa materia di base, troveremo più facile approfondire l’argomento senza confonderci. Vedremo in seguito che è utile definire un altro tipo di prodotto fra due vettori, detto prodotto vettoriale e scritto come a ⇥ b. Però affronteremo una discussione su tali argomenti in un capitolo successivo.

117

12

Caratteristiche della forza

12.1

Che cos’è una forza?

Benché sia interessante e meriti di occupare il nostro tempo studiare le leggi fisiche semplicemente perché ci aiutano a capire e a utilizzare la natura, bisogna ogni tanto fermarsi un momento e pensare: «Cosa significano realmente?». Il significato di ogni affermazione è un argomento che ha interessato e tormentato i filosofi da tempo immemorabile, e il significato delle leggi fisiche è anche più interessante, poiché si crede generalmente che queste leggi rappresentino qualche genere di conoscenza reale. Il significato della conoscenza è un profondo problema filosofico, ed è sempre importante domandarsi: «Che cosa significa?». Ci chiediamo: «Qual è il senso delle leggi fisiche di Newton, che scriviamo come F = ma? Qual è il significato di forza, massa e accelerazione?». Bene, possiamo percepire intuitivamente il significato di massa, e possiamo definire l’accelerazione se conosciamo il significato di posizione e di tempo. Non discuteremo questi significati, ma ci concentreremo sul nuovo concetto di forza. La risposta è ugualmente semplice: «Se un corpo accelera, allora una forza agisce su di esso». Questo è ciò che le leggi di Newton dicono, così la più precisa e la più bella definizione immaginabile di forza può essere semplicemente il dire che la forza è la massa di un oggetto per l’accelerazione. Supponiamo di avere una legge che dica che la conservazione della quantità di moto è valida se la somma di tutte le forze esterne è zero; nasce allora il problema: «Che cosa significa che la somma di tutte le forze esterne è zero?». Un modo simpatico di rispondere potrebbe essere: «Quando è costante la quantità di moto totale, allora la somma delle forze esterne è zero». Deve esserci qualcosa di scorretto in tutto ciò, perché non dice proprio niente di nuovo. Se abbiamo scoperto una legge fondamentale che afferma che la forza è uguale alla massa per l’accelerazione e allora definiamo la forza come la massa per l’accelerazione, non abbiamo ricavato niente. Potremmo anche definire la forza intendendo che un oggetto in movimento su cui non agiscono forze continua a muoversi in linea retta con velocità costante. Se allora osserviamo che un oggetto non si muove in linea retta a velocità costante, possiamo dire che una forza agisce su di esso. Ora queste cose non possono essere certamente il contenuto della fisica, essendo definizioni in un circolo chiuso. L’affermazione di Newton riportata sopra, però, sembra essere una più precisa definizione della forza, una definizione che piace al matematico; nonostante ciò è completamente inutile, perché nessuna predizione può essere fatta da una definizione. Si può sedere in poltrona tutto il giorno e definire parole a proprio piacimento, ma trovare che cosa accade quando due palle urtano l’una contro l’altra, o quando un peso è attaccato a una molla, è tutta un’altra questione, essendo qualcosa completamente al di fuori di una scelta di definizioni il modo in cui due corpi si comportano. Per esempio, se avessimo scelto di dire che un oggetto abbandonato a se stesso mantiene la sua posizione, e non si muove, allora vedendo qualcosa di vagante potremmo dire che ciò è dovuto a una «gorce»(1) : una «gorce» è la rapidità di variazione della posizione. Ora abbiamo una nuova splendida legge, ogni cosa sta ferma tranne quando agisce una gorce. Vedete che ciò sarebbe analogo alla definizione di forza data sopra e non conterrebbe informazioni. (1)

Parola priva di significato ottenuta dall’autore cambiando l’iniziale della parola force (forza). (N.d.T.)

© 978-8808-22107-0

12.1 • Che cos’è una forza?

Il contenuto reale della legge di Newton è questo: si suppone che la forza abbia alcune proprietà indipendenti in aggiunta alla legge F = ma; ma le specifiche proprietà indipendenti che la forza ha non sono completamente descritte da Newton o da chiunque altro, quindi la legge fisica F = ma è una legge incompleta. Ciò implica che se studiamo la massa per l’accelerazione e chiamiamo forza il prodotto, cioè, se studiamo le caratteristiche della forza come programma a cui siamo interessati, troveremo che le forze hanno una certa semplicità; la legge è un buon mezzo per analizzare la natura, è un suggerimento che le forze saranno semplici. Ora il primo esempio di tali forze fu la legge completa di gravitazione che fu espressa da Newton, e, nello stabilire la legge, egli rispose alla domanda: «Che cos’è la forza?». Se non vi fosse altro che la gravitazione, allora la combinazione di questa legge e della legge della forza (seconda legge del moto) sarebbe una teoria completa, ma vi è molto più che la gravitazione e noi vogliamo usare le leggi di Newton in molte situazioni diverse. Quindi per procedere dobbiamo dire qualcosa sulle proprietà della forza. Per esempio, nel trattare la forza si fa sempre la tacita ipotesi che essa sia uguale a zero finché non è presente qualche corpo fisico, e che se troviamo una forza che non è uguale a zero, troviamo anche qualcosa nelle vicinanze che è l’origine della forza. Questo presupposto è completamente diverso dal caso della «gorce» che abbiamo considerato sopra. Una delle più importanti caratteristiche della forza è che ha un’origine materiale, e questo non è soltanto una definizione. Newton diede ancora una regola riguardante la forza: le forze tra corpi interagenti sono uguali e opposte, ovvero: azione uguale a reazione. Risulta però che tale regola non è del tutto esatta. Infatti la legge F = ma non è del tutto giusta; se fosse una definizione dovremmo dire che è sempre esatta; ma non lo è. Lo studente può obiettare: «Non mi piace questa imprecisione, vorrei avere qualcosa di esattamente definito; infatti si dice in certi libri che ogni scienza è una disciplina esatta in cui ogni cosa è definita». Se insistete su una precisa definizione di forza, non l’otterrete mai! Anzitutto perché la seconda legge di Newton non è esatta, e in secondo luogo perché per capire le leggi fisiche dovete comprendere che sono tutte un qualche tipo di approssimazione. Ogni semplice idea è approssimata; come spiegazione consideriamo un oggetto,... cos’è un oggetto? I filosofi dicono sempre: «Bene, prendiamo per esempio una sedia». Nel momento in cui dicono questo voi sapete che essi non sanno più di che stanno parlando. Che cos’è una sedia? Bene, una sedia è una certa cosa laggiù... certa? come certa? Gli atomi evaporano da essa di tanto in tanto – non molti atomi, alcuni –, la sporcizia le cade sopra e si dissolve nella vernice, così definire con precisione una sedia, dire esattamente quali atomi sono sedia, quali atomi sono aria, o sono sporcizia, o sono vernice che appartiene alla sedia è impossibile. Pertanto la massa di una sedia può essere definita solo approssimativamente. Allo stesso modo è impossibile definire la massa di un singolo oggetto, perché non vi sono singoli oggetti lasciati a se stessi nell’universo: ogni oggetto è una mescolanza di un insieme di cose e possiamo trattarlo soltanto con una serie di approssimazioni e di idealizzazioni. Lo stratagemma sono le idealizzazioni. Con un’approssimazione eccellente di forse una parte su 1010 , il numero degli atomi in una sedia non cambia in un minuto e, se non siamo troppo meticolosi, possiamo idealizzare la sedia come una cosa definita; nello stesso modo studieremo le caratteristiche della forza, in un modo ideale, se non siamo troppo meticolosi. Si può non essere soddisfatti della visione approssimata della natura che la fisica tenta di ottenere (il tentativo è sempre quello di aumentare l’accuratezza dell’approssimazione), e preferire una definizione matematica. Ma le definizioni matematiche non funzioneranno mai in un mondo reale. Una definizione matematica sarà buona per la matematica, in cui tutta la logica può essere sviluppata completamente, ma il mondo fisico è complesso, come abbiamo mostrato con un certo numero di esempi, come quelli delle onde dell’oceano e di un bicchiere di vino. Quando cerchiamo di isolarne le parti, di parlare di una massa, il vino e il bicchiere, come possiamo sapere qual è l’uno e qual è l’altro quando uno si dissolve nell’altro? Le forze agenti su una singola cosa implicano già un’approssimazione, e se abbiamo un sistema che parla del mondo reale, allora tale sistema, almeno fino a oggi, deve implicare approssimazioni di qualche tipo. Questo sistema è completamente diverso dal caso della matematica, in cui ogni cosa può essere definita, e poi non si sa che cosa stiamo discutendo. Infatti il vanto della matematica è che

119

120

Capitolo 12 • Caratteristiche della forza

© 978-8808-22107-0

non si è tenuti a dire di che cosa stiamo parlando. Il vanto è che le leggi, gli argomenti e la logica sono indipendenti da «ciò» che è. Se abbiamo qualsiasi altro insieme di oggetti che obbediscono allo stesso sistema di assiomi della geometria euclidea, allora se diamo nuove definizioni e le utilizziamo secondo una logica corretta, tutte le conseguenze saranno corrette, qualunque sia il soggetto. Nella natura però, quando tracciamo una linea o stabiliamo una linea usando un fascio di luce e un teodolite, come facciamo nell’eseguire rilevazioni, misuriamo una linea in senso euclideo? No, stiamo facendo un’approssimazione; il crocefilo ha una certa larghezza, ma una linea geometrica non ha larghezza, e così, se la geometria euclidea può essere usata per fare rilevazioni o meno è una questione fisica, non una questione matematica. Comunque, da un punto di vista sperimentale, non da un punto di vista matematico, abbiamo bisogno di sapere se le leggi di Euclide si applicano al tipo di geometria usato per misurare la Terra; così facciamo l’ipotesi che siano applicabili e ciò va abbastanza bene; ma non esattamente, perché le linee di rilevazione non sono in realtà linee geometriche. Se tali linee euclidee, che sono in realtà astratte, siano applicabili o meno alle linee sperimentali è un problema di sperimentazione; non è un problema al quale si possa rispondere con la pura ragione. Allo stesso modo, non possiamo dire che F = ma sia soltanto una definizione, dedurre ogni cosa in modo puramente matematico e ridurre la meccanica a una teoria matematica, poiché la meccanica è una descrizione della natura. Stabilendo idonei postulati è sempre possibile costruire un sistema matematico, proprio come fece Euclide, ma non possiamo fare una matematica del mondo, perché, prima o poi, dobbiamo verificare se gli assiomi sono validi per gli oggetti della natura. In questo modo ci troviamo immediatamente coinvolti con questi complicati e «sporchi» oggetti della natura, ma con approssimazioni sempre più accurate.

12.2

Attrito

Le considerazioni precedenti mostrano che un’esatta comprensione delle leggi di Newton richiede una discussione sulle forze, ed è lo scopo di questo capitolo introdurre una simile discussione, una specie di completamento delle leggi di Newton. Abbiamo già studiato le definizioni di accelerazione e i concetti relativi, ora dobbiamo studiare le proprietà della forza, e questo capitolo, a differenza dei capitoli precedenti, non sarà molto preciso, perché le forze sono molto complicate. Per iniziare con una forza particolare, consideriamo la resistenza aerodinamica su un aereo che vola nell’aria. Qual è la legge per tale forza? (Sicuramente vi è una legge per ogni forza, dobbiamo avere una legge!) Si può difficilmente pensare che la legge per tale forza sia semplice. Provate a immaginare che cosa produce una resistenza su un aereo in volo attraverso l’aria – l’aria che sbatte violentemente sulle ali, i vortici che si creano dietro, le perturbazioni attorno alla fusoliera e molte altre complicazioni – e vedete che non può trattarsi di una legge semplice. D’altra parte è notevole il fatto che la forza di resistenza su un aereo sia approssimativamente una costante per il quadrato della velocità, ossia F ⇡ cv 2 . Ora, qual è la classe di una tale legge? È analoga a F = ma? Niente affatto, perché in primo luogo questa legge è qualcosa di empirico che si ottiene approssimativamente con prove in una galleria del vento. Voi dite: «Bene, anche F = ma può essere empirica!». Questo non è il motivo della differenza. La differenza non sta nel fatto che sia empirica, ma nel fatto che, stando a quanto capiamo della natura, questa legge è il risultato di un’enorme complessità di eventi e non è, fondamentalmente, una cosa semplice. Se continuiamo a studiarla sempre di più, facendo misure via via più accurate, la legge diventerà sempre più complicata, non meno. In altre parole, studiando questa legge della resistenza su un aereo sempre più da vicino, troviamo che è sempre più «sbagliata» e più approfonditamente la studiamo, e più accurate facciamo le misure, più complicata diventa la verità; quindi, da questo punto di vista, non la consideriamo il risultato di un semplice, fondamentale processo, in accordo con la nostra originale supposizione. Per esempio, se la velocità è estremamente bassa, così bassa che un comune aereo non sarebbe in grado di volare, allora la legge cambia e l’attrito dipende quasi linearmente dalla velocità. Per dare un altro esempio, la resistenza di attrito su una palla o su una bolla o qualcos’altro che si muove lentamente attraverso un liquido viscoso, tipo il miele, è proporzionale alla velocità, ma

121

12.2 • Attrito

© 978-8808-22107-0

per un moto tanto veloce da creare turbolenze nel fluido (il miele non lo fa, ma l’acqua e l’aria sì), allora la resistenza diventa più strettamente proporzionale al quadrato della velocità (F = cv 2 ), e se la velocità continua a crescere, anche questa legge comincia a fare difetto. Chi dice: «Bene, il coefficiente cambia un po’», svia il discorso. In secondo luogo, vi sono altre grosse complicazioni: questa forza su un aereo può essere divisa o analizzata come una forza sulle ali, una forza sulla parte anteriore e così via? Indubbiamente questo può essere fatto, se siamo interessati alle coppie di torsione sulle varie parti, ma allora dobbiamo procurarci leggi particolari per la forza sulle ali e così via. È un fatto sorprendente che la forza su un’ala sia subordinata all’altra ala; in altre parole, se smontiamo l’aereo e spingiamo solamente un’ala nell’aria, allora la forza non è la stessa di come sarebbe se vi fosse il resto dell’aereo. La ragione, naturalmente, è che una parte del vento che batte sul davanti gira attorno alle ali e cambia la forza sulle ali. Sembra un miracolo che vi sia una legge empirica tanto semplice, che possa essere usata nel progettare aerei, ma questa legge non è della stessa classe delle leggi fondamentali della fisica e un ulteriore suo approfondimento la renderà soltanto sempre più complicata. Uno studio di come il coefficiente c dipenda dalla forma frontale dell’aereo è, a dir poco, snervante. Non vi è una semplice legge per determinare il coefficiente in funzione della forma dell’aereo. Al contrario la legge di gravitazione è semplice e uno studio ulteriore indica soltanto una sua maggiore semplicità. Abbiamo discusso due casi di attrito risultanti da un veloce movimento nell’aria e da un lento movimento nel miele. Vi è un altro genere di attrito, detto attrito radente o attrito di scorrimento, che si ha quando un corpo solido scivola su un altro. In questo caso è necessaria una forza per mantenere il moto. Questa è detta forza di attrito, e anche la sua origine è un argomento molto complicato. Entrambe le superfici di contatto sono irregolari a livello atomico. Vi sono molti punti di contatto in cui sembra che gli atomi si attacchino l’uno all’altro e poi, quando il corpo che scorre è spinto via, gli atomi si disgiungono e ne segue una vibrazione; deve accadere qualcosa di simile. In passato si è pensato che il meccanismo di questo attrito fosse semplicissimo, che le superfici fossero piene di irregolarità, e che l’attrito fosse originato dal sollevamento del corpo che scivola sulle protuberanze; ma questo non può essere, perché non vi è perdita di energia in tali processi, mentre in effetti si consuma energia. Il meccanismo della perdita di energia è che, quando il corpo che scorre salta sulle protuberanze, le protuberanze si deformano e allora generano onde, moti atomici e, dopo un po’, calore nei due corpi. Ora, è molto interessante che ancora una volta, empiricamente, questo attrito possa essere descritto approssimativamente da una legge semplice. Questa legge è che la forza necessaria per vincere l’attrito e per trascinare un oggetto su di un altro dipende dalla forza normale (cioè perpendicolare alla superficie) fra le due superfici che sono a contatto. In realtà, con un’approssimazione abbastanza buona, la forza di attrito è proporzionale a questa forza normale e ha un coefficiente più o meno costante, cioè

Direzione del moto

F R

F = µN

N

(12.1)

in cui µ è detto coefficiente di attrito (FIGURA 12.1). Benché questo coefficiente non sia esattamente costante, la formula è una buona regola empirica per valutare approssimativamente la forza che è necessaria in certe situazioni pratiche o ingegneristiche. Se la forza normale, o la velocità del moto, diventa troppo grande, la legge cade in difetto a causa dell’eccessivo calore generato. È importante sottolineare che ognuna di queste leggi empiriche ha i suoi limiti, oltre i quali non può in realtà funzionare. Che la formula F = µN sia approssimativamente corretta può essere dimostrato da un semplice esperimento. Fissiamo un piano, inclinato di un piccolo angolo θ, e poniamo un blocco di peso W sul piano. Incliniamo poi il piano di un angolo maggiore, finché il blocco comincia a scivolare per il suo peso proprio. La componente del peso diretta in basso lungo il piano è W sen θ, e deve essere uguale alla forza di attrito F quando il blocco scivola uniformemente. La componente del peso normale al piano è W cos θ, e questa è la forza normale N. Con questi valori la formula diventa W sen θ = µW cos θ

12.1 Relazione fra la forza di attrito e la forza normale per un contatto di scorrimento.

FIGURA

122

Capitolo 12 • Caratteristiche della forza

© 978-8808-22107-0

da cui segue µ=

sen ✓ = tg ✓ cos ✓

Se questa legge fosse rigorosamente esatta, un oggetto comincerebbe a scivolare a una certa inclinazione definita. Se lo stesso blocco viene appesantito ponendogli sopra pesi ulteriori allora, sebbene W sia aumentato, tutte le forze nella formula sono aumentate nella stessa proporzione, e W scompare dalla formula. Se rimane costante, il blocco appesantito scivolerà ancora alla stessa inclinazione. Quando l’angolo ✓ viene determinato per tentativi col peso originale, si trova che con il peso maggiorato il blocco scivolerà circa allo stesso angolo di inclinazione. Ciò avverrà anche quando un peso è parecchie volte più grande dell’altro; possiamo quindi concludere che il coefficiente di attrito è indipendente dal peso. Nell’esecuzione di questo esperimento è degno di nota il fatto che, quando il piano è inclinato all’incirca secondo il corretto angolo ✓, il blocco non scivola regolarmente ma a scatti. In un punto può fermarsi, e in un altro accelerare. Questo comportamento indica che il coefficiente di attrito è soltanto approssimativamente una costante, e varia da punto a punto lungo il piano. Lo stesso comportamento irregolare viene osservato se il blocco è appesantito o meno. Tali variazioni sono causate dai diversi gradi di levigatura o di durezza del piano, e forse da sporcizia, ossidi o altri elementi materiali estranei. Le tabelle che hanno la pretesa di elencare valori di µ per «acciaio su acciaio», «rame su rame», e simili, sono tutte sbagliate, perché ignorano i fattori ricordati sopra, che in realtà determinano µ. L’attrito non è mai dovuto a «rame su rame» ecc., ma alle impurità attaccate al rame. In esperimenti del tipo descritto sopra, l’attrito è pressoché indipendente dalla velocità. Molti credono che l’attrito che deve essere vinto per ottenere che un oggetto inizi a muoversi (attrito statico), superi la forza richiesta per mantenere in moto il corpo che scivola (attrito radente), ma con metalli asciutti è molto arduo dimostrare la differenza. L’opinione probabilmente nasce da esperimenti in cui sono presenti piccole quantità di olio o di lubrificante, o dove i blocchi, per esempio, sono sostenuti da piani flessibili o altri supporti flessibili, cosicché si presentano legati. È molto difficile fare accurati esperimenti quantitativi sull’attrito, e le leggi dell’attrito non sono ancora state analizzate in modo appropriato, a dispetto dell’enorme importanza ingegneristica che una simile analisi avrebbe. Benché la legge F = µN sia abbastanza accurata, una volta che le superfici siano standardizzate, la ragione di questa forma della legge in realtà non è compresa. Mostrare che il coefficiente µ è quasi indipendente dalla velocità richiede degli esperimenti raffinati, poiché l’attrito apparente si riduce sensibilmente se la superficie più in basso vibra molto rapidamente. Quando l’esperimento è fatto ad altissima velocità, ci si deve assicurare che gli oggetti non vibrino l’uno relativamente all’altro, poiché le apparenti diminuzioni di attrito ad alte velocità sono spesso dovute a vibrazioni. In ogni caso questa legge dell’attrito è un’altra di quelle leggi semiempiriche che non sono completamente comprese, e guardando a tutto il lavoro che è stato compiuto, è sorprendente che non sia stata raggiunta una maggior comprensione del fenomeno. Al giorno d’oggi, infatti, è impossibile anche stimare il coefficiente di attrito fra due sostanze. È stato osservato che il tentativo di misurare µ per sostanze pure che scorrono, come rame su rame, ha condotto a risultati spuri, perché le superfici in contatto non sono di puro rame, ma sono mescolanze di ossidi e di altre impurità. Se cerchiamo di ottenere rame assolutamente puro, se puliamo e lucidiamo le superfici, degassiamo i materiali sotto vuoto, e prendiamo ogni concepibile precauzione, ancora non otteniamo µ. Perché se incliniamo l’apparato fino alla posizione verticale, il corpo che dovrebbe scorrere non scenderà: i due pezzi di rame sono fissati insieme! Il coefficiente µ, che è ordinariamente minore dell’unità per superfici ragionevolmente dure, diventa parecchie volte l’unità! La ragione di questo inaspettato comportamento è che quando gli atomi in contatto sono tutti della stessa specie, non hanno modo di «sapere» che si trovano in due diversi pezzi di rame. Quando vi sono altri atomi, di ossidi o di grassi, e più complicati e sottili strati contaminanti fra i due pezzi, gli atomi lo «sanno» quando non sono dalla stessa parte. Quando consideriamo che sono le forze fra gli atomi che tengono legato insieme il rame come un solido, diverrà chiaro che è impossibile ottenere il giusto coefficiente di attrito per metalli puri.

12.3 • Forze molecolari

© 978-8808-22107-0

123

Lo stesso fenomeno può essere osservato in un semplice esperimento fatto in casa con un piatto di vetro liscio e un largo bicchiere di vetro. Se il bicchiere è posto sul piatto e tirato con una funicella, scivola abbastanza bene e si può percepire il coefficiente di attrito; è un po’ irregolare ma è un coefficiente. Se ora bagniamo il piatto e il fondo del bicchiere e tiriamo di nuovo, troviamo che resiste, e se osserviamo attentamente troveremo graffi, perché l’acqua è capace di togliere il grasso e le altre contaminazioni della superficie, e quindi abbiamo in realtà un contatto vetro su vetro; questo contatto è tanto buono e resiste tanto alla separazione che il vetro viene strappato via; cioè si graffia.

12.3

Forze molecolari

Discuteremo ora le caratteristiche delle forze molecolari. Queste sono forF ze fra gli atomi e sono l’origine ultima dell’attrito. Le forze molecolari non hanno mai avuto una spiegazione soddisfacente su una base di fisiRepulsione ca classica, occorre la meccanica quantistica per capirle completamente. Empiricamente, però, la forza fra gli atomi è illustrata schematicamente in FIGURA 12.2, in cui la forza F fra due atomi è rappresentata come una funzione della distanza r fra essi. 0 Vi sono casi diversi. Nella molecola dell’acqua, per esempio, le cariche d negative si trovano più sull’ossigeno, e le posizioni medie delle cariche neF = k/r 7 gative o delle cariche positive non sono nello stesso punto; di conseguenza, Attrazione un’altra molecola vicina sente una forza relativamente grande, che è detta forza dipolo-dipolo. Però per parecchi sistemi le cariche sono molto meglio equilibrate, in particolare per l’ossigeno gassoso, che è perfettamente FIGURA 12.2 La forza fra due atomi in funzione simmetrico. In questo caso, benché le cariche negative e le cariche positive della distanza che li separa. siano disperse in tutta la molecola, la distribuzione è tale che il centro delle cariche negative e il centro delle cariche positive coincidono. Una molecola i cui centri non coincidono è detta molecola polare, e il prodotto della carica per la separazione che intercorre fra i centri è detto momento di dipolo. Una molecola non polare è una molecola in cui i centri delle cariche coincidono. Per tutte le molecole non polari in cui tutte le forze elettriche si neutralizzano, risulta nondimeno che la forza a grandissime distanze è un’attrazione e varia inversamente alla settima potenza della distanza, ossia F = k/r 7 , dove k è una costante che dipende dalle molecole. Il perché lo impareremo soltanto quando studieremo la meccanica quantistica. Quando vi sono dipoli, le forze sono maggiori. Quando gli atomi o le molecole si trovano troppo vicini si respingono con una repulsione molto intensa; questo è ciò che ci evita di cadere attraverso il pavimento! Queste forze molecolari possono essere dimostrate in un modo abbastanza diretto: uno di questi è l’esperimento sull’attrito del bicchiere di vetro fatto scorrere; un altro consiste nel prendere due superfici accuratissimamente molate e levigate l’una contro l’altra, che siano il più possibile piane, cosicché le superfici possano essere messe strettamente a contatto. Un esempio di tali superfici sono i blocchi di Johansson, che sono usati nelle officine meccaniche come campioni per fare misure accurate di lunghezza. Se uno di tali blocchi è fatto scivolare su un altro con molta cura e quello sopra viene sollevato, l’altro aderirà e sarà sollevato anch’esso dalle forze molecolari, esemplificando l’attrazione diretta fra gli atomi di un blocco e gli atomi di un altro blocco. Nondimeno queste forze molecolari di attrazione non sono ancora fondamentali nel senso in cui è fondamentale la gravitazione; esse sono dovute alle interazioni estremamente complesse di tutti gli elettroni e i nuclei di una molecola con gli elettroni e i nuclei di un’altra. Ogni formula apparentemente semplice che otteniamo rappresenta una somma di complicazioni, così non abbiamo ancora colto i fenomeni fondamentali. Poiché le forze molecolari attraggono a grandi distanze e respingono a piccole distanze, come mostrato nella FIGURA 12.2, possiamo costruire solidi in cui tutti gli atomi sono tenuti insieme dalle loro attrazioni e tenuti separati dalla repulsione che sorge quando sono troppo vicini. A una

r

124

Capitolo 12 • Caratteristiche della forza

© 978-8808-22107-0

certa distanza d (dove la curva di FIGURA 12.2 taglia l’asse), le forze sono zero, il che significa che sono tutte equilibrate, cosicché le molecole restano a quella distanza l’una dall’altra. Se le molecole sono spinte a stringersi insieme a distanze minori di d, manifestano tutte una repulsione, rappresentata dalla parte di curva sopra l’asse r. Lo spingere le molecole soltanto lievemente più vicine richiede una grande forza, perché la repulsione molecolare cresce molto rapidamente a distanze minori di d. Se le molecole sono leggermente allontanate vi è una lieve attrazione, che aumenta all’aumentare della separazione. Se esse sono tirate con forza sufficiente, si separeranno permanentemente: il legame è rotto. Se le molecole sono avvicinate o allontanate di un tratto piccolissimo a partire da d, la distanza corrispondente sulla curva di FIGURA 12.2 è pure piccolissima, e può essere approssimata a una linea retta. Quindi in parecchie circostanze, se lo spostamento non è troppo grande, la forza è proporzionale allo spostamento. Questo principio è conosciuto come legge di Hooke, o legge dell’elasticità, secondo la quale in un corpo la forza che cerca di restituirlo alla condizione originale quando esso è distorto, è proporzionale alla distorsione. Questa legge naturalmente rimane valida solo se la distorsione è relativamente piccola; quando diventa troppo grande il corpo risulterà deformato o spezzato, a seconda del tipo di distorsione. L’intensità della forza per cui la legge di Hooke è valida dipende dal materiale; per esempio per l’impasto da pane o lo stucco la forza è piccolissima, ma per l’acciaio è relativamente grande. La legge di Hooke può essere esattamente dimostrata con una lunga molla a spirale fatta di acciaio e sospesa verticalmente. Un peso opportuno sospeso all’estremità più bassa della molla produce una piccola torsione per tutta la lunghezza del filo che si risolve in una piccola deflessione verticale per ogni spira, fino a produrre un grande spostamento se vi sono molte spire. Se si misura l’allungamento totale prodotto, diciamo da un peso di 100 grammi, si trova che pesi addizionali di 100 grammi produrranno ciascuno un allungamento addizionale che è quasi uguale alla deformazione che è stata misurata per i primi 100 grammi. Questo rapporto costante tra forza e spostamento comincia a cambiare quando la molla è sovraccarica, cioè quando la legge di Hooke non vale più.

12.4

Forze fondamentali. I campi

Discuteremo ora le uniche forze restanti che sono fondamentali. Le diciamo fondamentali nel senso che le loro leggi sono fondamentalmente semplici. Discuteremo per prima la forza elettrica. Gli oggetti trasportano cariche elettriche che consistono semplicemente di elettroni e di protoni. Se due corpi qualsiasi sono carichi elettricamente vi è fra loro una forza elettrica, e se le intensità delle cariche sono q1 e q2 rispettivamente, la forza varia inversamente al quadrato della distanza fra le cariche, ossia q1 q2 F = cost. 2 r Per cariche di segno opposto, questa legge è simile alla legge di gravitazione, ma per cariche dello stesso segno la forza è repulsiva e il segno (o verso) è invertito. Le cariche q1 e q2 possono essere intrinsecamente positive o negative, e in ogni specifica applicazione della formula il verso della forza sarà giusto se alle cariche q è dato il segno appropriato, più o meno; la forza è diretta lungo la linea che congiunge le due cariche. La costante nella formula dipende, naturalmente, dalle unità di misura che vengono usate per la forza, la carica e la distanza. Nella pratica corrente la carica è misurata in coulomb (C), la distanza in metri (m) e la forza in newton (N). Per ottenere che la forza risulti espressa propriamente in newton, la costante – che per ragioni storiche è scritta come 1/(4⇡✏ 0 ) – assume il valore numerico 1 = 8,99 · 109 (N · m2 )/C2 4⇡✏ 0 essendo ✏ 0 = 8,854 · 10

12

C2 /(N · m2 )

(12.2)

12.4 • Forze fondamentali. I campi

© 978-8808-22107-0

Quindi la legge della forza per cariche statiche è F=

q1 q2 r 4⇡✏ 0 r 3

(12.3)

In natura la carica più importante di tutte è la carica di un singolo elettrone, che è 1,60·10 19 C. Nel lavorare, anziché con grandi cariche, con le forze elettriche fra le particelle fondamentali, parecchi preferiscono la combinazione (qel )2 /4⇡✏ 0 , dove qel è definita come la carica di un elettrone. Questa combinazione ricorre frequentemente, e per semplificare i calcoli è stata definita con il simbolo e2 ; il suo valore numerico nel sistema di unità mks risulta essere (1,52 · 10 14 )2 . Il vantaggio di usare la costante in questa forma è che la forza fra due elettroni, espressa in newton, può essere scritta semplicemente come e2 /r 2 , con r in metri, senza tutte le varie costanti. Le forze elettriche sono molto più complicate di come questa semplice formula indichi, perché la formula dà la forza fra due oggetti soltanto quando gli oggetti sono statici. Considereremo fra breve il caso più generale. Nell’analisi delle forze di tipo più fondamentale (non come la forza di attrito, ma come la forza elettrica o la forza gravitazionale), è stato sviluppato un concetto interessante e molto importante. Poiché a prima vista le forze sono molto più complicate di come è indicato dalle leggi dell’inverso del quadrato, e queste leggi rimangono valide soltanto quando i corpi interagenti sono fermi, è necessario un metodo più perfezionato per trattare le complicatissime forze che sorgono quando i corpi si mettono in movimento in modo complesso. L’esperienza ha dimostrato che un approccio noto come concetto di «campo» è di grande utilità per l’analisi di forze di questo tipo. Per illustrare, per esempio, l’idea per la forza elettrica, supponiamo di avere due cariche elettriche q1 e q2 , localizzate rispettivamente nei punti P e R. Come sappiamo la forza fra le cariche è data da F=

q1 q2 r 4⇡✏ 0 r 3

Per analizzare questa forza usando il concetto di campo, diciamo che la carica q1 in P produce una «condizione» in R, così che quando la carica q2 è posta in R, essa «sente» la forza. Questo è un modo, forse strano, di descriverla; diciamo che la forza F su q2 in R può essere scritta in due parti. Essa è q2 moltiplicata per una quantità E che dovrebbe esservi indipendentemente dalla presenza di q2 (purché manteniamo tutte le altre cariche nelle loro posizioni). E, diciamo, è la «condizione» prodotta da q1 e F è la risposta di q2 a E. E è detto campo elettrico ed è un vettore. La formula per il campo elettrico E, che è prodotto in R da una carica q1 in P, è la carica q1 per la costante 1/4⇡✏ 0 divisa per r 2 (r è la distanza da P a R); il campo agisce nella direzione del raggio vettore (il raggio vettore r diviso per la sua stessa lunghezza). L’espressione per E è E=

q1 r 4⇡✏ 0 r 3

(12.4)

Scriviamo allora (12.5)

F = q2 E

che esprime la forza, il campo e la carica nel campo. Qual è lo scopo di tutto questo? Lo scopo è di dividere l’analisi in due parti. Una parte dice che qualcosa produce un campo. L’altra parte dice che qualcosa subisce l’azione del campo. Permettendoci di trattare le due parti indipendentemente, questa separazione dell’analisi semplifica il calcolo di un problema in parecchie situazioni. Se diverse cariche sono presenti, calcoliamo prima il campo elettrico totale prodotto in R da tutte le cariche, e poi, conoscendo la carica che è posta in R, troviamo la forza su di essa. Nel caso della gravitazione possiamo fare esattamente la stessa cosa. In questo caso la forza è F = G m1 m2

r r3

Possiamo fare un’analoga analisi, come segue: la forza su un corpo in un campo gravitazionale è la massa di quel corpo per il campo C. La forza su m2 è la massa m2 per il campo C prodotto da m1 ; cioè F = m2 C

125

126

Capitolo 12 • Caratteristiche della forza

© 978-8808-22107-0

Allora il campo C prodotto da un corpo di massa m1 è C = G m1

r r3

ed è diretto radialmente, come nel caso elettrico. Contrariamente a quanto possa apparire a prima vista, questa separazione di una parte da un’altra non è una banalità. Sarebbe banale soltanto un altro modo di scrivere la stessa cosa, se le leggi della forza fossero semplici, ma le leggi della forza sono così complicate che risulta che i campi hanno una realtà che è quasi indipendente dagli oggetti che li creano. Si può fare qualcosa come scuotere una carica e produrre un effetto, un campo a una certa distanza; se si cessa allora di scuotere la carica il campo mantiene traccia di tutto il passato, poiché l’interazione fra due particelle non è istantanea. È desiderabile avere qualche modo di ricordare che cosa è accaduto precedentemente. Se la forza su una carica dipende da dove si trovava ieri un’altra carica, come infatti succede, allora abbiamo bisogno di un apparato che mantenga traccia di quanto è accaduto ieri, e tale è il carattere di un campo. Così quando le forze diventano più complicate, il campo diviene via via più reale, e questa tecnica diviene sempre meno una separazione artificiale. Nell’analizzare le forze usando i campi, abbiamo bisogno di due tipi di leggi pertinenti i campi. La prima è la risposta al campo e dà le equazioni del moto. Per esempio la legge di risposta di una massa al campo gravitazionale è che la forza è uguale alla massa per il campo gravitazionale; oppure, se vi è anche una carica sul corpo, la risposta della carica al campo elettrico è uguale alla carica per il campo elettrico. La seconda parte dell’analisi della natura in queste situazioni consiste nel formulare le leggi che determinano l’intensità del campo e come esso è prodotto. Queste leggi sono dette talvolta equazioni del campo. Impareremo di più su questo a tempo debito, ma scriviamo ora alcune cose su questo argomento. Innanzitutto, il fatto più rimarchevole, che è rigorosamente valido e che può essere facilmente compreso, è che il campo elettrico totale prodotto da un certo numero di sorgenti è la somma vettoriale dei campi elettrici prodotti dalla prima sorgente, dalla seconda sorgente e così via. In altre parole, se abbiamo numerose cariche che producono un campo, e se producono, ciascuna da sola, una il campo E1 , un’altra il campo E2 , e così via, allora possiamo semplicemente addizionare i vettori per ottenere il campo totale. Questo principio può essere espresso come E = E1 + E2 + E3 + . . .

(12.6)

ossia, in virtù della definizione data sopra, E=

X qi ri 4⇡✏ 0 r i3 i

(12.7)

Gli stessi metodi possono essere applicati alla gravitazione? La forza fra due masse m1 e m2 è stata espressa da Newton come r F = G m1 m2 3 r Ma secondo il concetto di campo possiamo dire che m1 crea un campo C in tutto lo spazio circostante, tale che la forza su m2 è data da (12.8)

F = m2 C Per analogia con il caso elettrico, Ci = G mi

ri r i3

(12.9)

e il campo gravitazionale prodotto da diverse masse è C = C1 + C2 + C3 + . . .

(12.10)

Nel capitolo 9, calcolando un caso di moto planetario, abbiamo usato essenzialmente questo principio. Abbiamo semplicemente sommato tutti i vettori forza per ottenere la forza risultante su un pianeta. Se dividiamo per la massa del pianeta in questione, otteniamo l’equazione (12.10).

12.4 • Forze fondamentali. I campi

© 978-8808-22107-0

127 FIGURA

0

12.3

raggi catodici.

+V

z + y N –

x

S

Acceleratore di elettroni Sorgente di elettroni (filamento incandescente)

Schermo fluorescente

Le equazioni (12.6) e (12.10) esprimono ciò che è conosciuto come il principio di sovrapposizione dei campi. Questo principio stabilisce che il campo totale dovuto a tutte le sorgenti è la somma dei campi dovuti a ogni sorgente. Per quanto ne sappiamo oggi, per l’elettricità questa è una legge assolutamente rispettata, che è valida anche quando la legge della forza è complicata a causa dei moti delle cariche. Vi sono violazioni apparenti, ma un’analisi più accurata ha sempre dimostrato che queste erano dovute all’aver trascurato certe cariche in movimento. Però, benché il principio di sovrapposizione si applichi esattamente alle forze elettriche, non è esatto per la gravità, se il campo è troppo forte e l’equazione di Newton (12.10) è soltanto approssimata, secondo la teoria gravitazionale di Einstein. Strettamente legata alla forza elettrica vi è un altro tipo di forza, detta forza magnetica, e anche questa è analizzata in termini di campo. Alcune delle relazioni qualitative fra le forze elettriche e magnetiche possono essere illustrate da un esperimento con un tubo a raggi catodici (FIGURA 12.3). A un’estremità di tale tubo vi è una sorgente che emette un flusso di elettroni. All’interno del tubo vi sono dispositivi per accelerare gli elettroni a velocità elevate, e per inviarne alcuni in uno stretto fascio fino a uno schermo fluorescente all’altra estremità del tubo. Una macchia di luce brilla al centro dello schermo dove gli elettroni lo colpiscono, e questo ci permette di ricostruire il percorso degli elettroni. Lungo il cammino verso lo schermo, il fascio di elettroni passa attraverso uno stretto spazio fra una coppia di armature metalliche parallele che sono sistemate, diciamo, orizzontalmente. Si può applicare tra le armature una tensione in modo che l’una o l’altra armatura possa essere resa negativa a piacere. Quando è presente tale tensione, fra le armature vi è un campo elettrico. La prima parte dell’esperimento consiste nell’applicare una tensione negativa all’armatura inferiore, il che significa che sono stati collocati sull’armatura più bassa elettroni in soprannumero. Poiché cariche dello stesso segno si respingono, la macchia di luce sullo schermo istantaneamente si sposta verso l’alto. (Potremmo anche dire, in altri termini, che gli elettroni hanno «sentito» il campo e hanno risposto deflettendo verso l’alto.) Invertiamo successivamente la tensione rendendo negativa l’armatura superiore. La macchia di luce sullo schermo ora cade al di sotto del centro, mostrando che gli elettroni nel fascio sono stati respinti da quelli dell’armatura posta sopra di essi. (Potremmo dire, di nuovo, che gli elettroni hanno «risposto» al campo, che è ora in verso opposto.) La seconda parte dell’esperimento consiste nel togliere tensione dalle armature e provare l’effetto di un campo magnetico sul fascio di elettroni. Questo è prodotto per mezzo di un magnete a ferro di cavallo, i cui poli sono abbastanza distanziati da stare a cavallo del tubo. Supponiamo di tenere il magnete sotto il tubo orientato come la lettera U, con i poli verso l’alto, da una parte e dall’altra del tubo. Vediamo che la macchia di luce è deflessa, diciamo verso l’alto, quando il magnete si avvicina al tubo dal basso. Così sembra che il magnete respinga il fascio di elettroni. Però non è così semplice, perché se capovolgiamo il magnete senza scambiare i poli tra loro, e ora ci avviciniamo al tubo dall’alto, la macchia si muove ancora verso l’alto, così il fascio

Tubo a

128

Capitolo 12 • Caratteristiche della forza

© 978-8808-22107-0

di elettroni non è respinto; al contrario, questa volta sembra essere attratto. Ora ricominciamo daccapo, riportando il magnete al suo iniziale orientamento a U e mantenendolo sotto il tubo come prima. La macchia è ancora deflessa verso l’alto. Ruotiamo ora il magnete di 180° attorno al suo asse verticale, cosicché esso si ritrova ancora nella posizione a U, ma con i poli invertiti tra loro. La macchia balza verso il basso e lì rimane anche se capovolgiamo il magnete e lo avviciniamo dall’alto, come abbiamo fatto prima. Per comprendere questo particolare comportamento, dobbiamo avere una nuova combinazione di forze. Lo spieghiamo in questo modo: attraverso il magnete da un polo all’altro vi è un campo magnetico. Questo campo ha un verso che va sempre da un polo particolare (che possiamo contrassegnare) verso l’altro. Capovolgendo il magnete non cambia il verso del campo, ma scambiando i poli tra loro, il verso del campo risulta invertito. Per esempio se la velocità degli elettroni fosse orizzontale nella direzione x e se il campo magnetico fosse anch’esso orizzontale ma in direzione y, la forza magnetica sugli elettroni in movimento sarebbe in direzione z, cioè, verso l’alto o il basso, in dipendenza del fatto che il campo sia diretto nella direzione positiva o negativa di y. Anche se non daremo ora la legge corretta della forza fra cariche che si muovono in modo arbitrario, una rispetto all’altra, perché sarebbe troppo complicato, ne presenteremo un aspetto: la legge completa delle forze se i campi sono conosciuti. La forza su un oggetto carico dipende dal suo moto; se, quando l’oggetto è fermo in un dato posto, vi è qualche forza, questa è considerata proporzionale alla carica, essendo il coefficiente quello che noi chiamiamo campo elettrico. Quando l’oggetto si muove, la forza può essere diversa, e la correzione, la «parte» nuova della forza, risulta essere esattamente linearmente dipendente dalla velocità, ma perpendicolare a v e a un’altra quantità vettoriale che chiamiamo induzione magnetica B. Se le componenti del campo elettrico E e dell’induzione magnetica B sono, rispettivamente, (Ex, Ey, Ez ) e (Bx, By, Bz ), e se la velocità v ha le componenti (vx, vy, vz ), allora la forza totale elettrica e magnetica su una carica q in movimento ha le componenti Fx = q (Ex + vy Bz

vz By )

Fy = q (Ey + vz Bx

vx Bz )

Fz = q (Ez + vx By

vy Bx )

(12.11)

Se, per esempio, la sola componente del campo magnetico fosse By e la sola componente della velocità fosse vx , allora il solo termine rimasto nella forza magnetica sarebbe una forza in direzione z, perpendicolare sia a B sia a v.

12.5

Forze apparenti

Il prossimo genere di forze che discuteremo può essere chiamato forza apparente. Nel capitolo 11 abbiamo discusso la relazione fra due persone, Joe e Moe, che usano diversi sistemi di coordinate. Supponiamo che le posizioni di una particella misurate da Joe e da Moe siano rispettivamente x e x 0; allora le leggi sono le seguenti: x = x0 + s

y = y0

z = z0

dove s è lo spostamento del sistema di Moe rispetto a quello di Joe. Se supponiamo che le leggi del moto siano corrette per Joe, come appaiono per Moe? Osserviamo anzitutto che d x d x 0 ds = + dt dt dt Precedentemente abbiamo considerato il caso in cui s era costante, e abbiamo trovato che s non creava differenze nelle leggi del moto, perché ds/dt = 0; in ultima analisi, quindi, le leggi di fisica erano le stesse in entrambi i sistemi. Ma un altro caso che possiamo considerare è che sia

12.5 • Forze apparenti

© 978-8808-22107-0

129

s = ut, dove u è una velocità rettilinea uniforme. Allora s non è costante e ds/dt non è zero, ma è u, una costante. Però l’accelerazione d2 x/dt 2 è ancora uguale a d2 x 0/ dt 2 , poiché du/dt = 0. Questo prova la legge che abbiamo visto nel capitolo 10, cioè che se ci muoviamo in linea retta a velocità uniforme le leggi della fisica appariranno le stesse che ci appaiono quando stiamo fermi. È questa la trasformazione galileiana. Ma vogliamo discutere il caso interessante in cui s è ancora più complicato, diciamo 1 s = at 2 2 Allora ds d2 s = at e =a dt dt 2 cioè l’accelerazione è uniforme; oppure, in un caso ancora più complicato, l’accelerazione può essere una funzione del tempo. Ciò significa che, benché le leggi della forza dal punto di vista di Joe apparirebbero come d2 x m 2 = Fx dt le leggi della forza viste da Moe apparirebbero come m

d2 x 0 = Fx0 = Fx dt 2

ma

Cioè, poiché il sistema di coordinate di Moe è in accelerazione rispetto a quello di Joe, vi si introduce il termine supplementare ma, e Moe dovrà correggere le sue forze di tale quantità per ottenere che le leggi di Newton funzionino. In altre parole vi è un’apparente misteriosa forza nuova di origine sconosciuta che interviene, naturalmente, perché Moe ha un errato sistema di coordinate. Questo è un esempio di una forza apparente; altri esempi sorgono in sistemi di coordinate in rotazione. Un altro esempio di forza apparente è quella che è spesso chiamata «forza centrifuga». Un osservatore in un sistema di coordinate rotanti, per esempio in una scatola rotante, troverà misteriose forze, non spiegate da alcuna delle note sorgenti di forze, che spingono gli oggetti all’esterno contro le pareti. Queste forze sono dovute semplicemente al fatto che l’osservatore non ha un sistema di coordinate di Newton, che è il sistema più semplice di coordinate. Una forza apparente può essere illustrata da un interessante esperimento in cui spingiamo un secchio d’acqua lungo un tavolo, con una certa accelerazione. La gravità agisce sull’acqua verso il basso, ma a causa dell’accelerazione orizzontale vi è anche una forza apparente che agisce orizzontalmente in verso opposto all’acceleraa a zione. La risultante della gravità e della forza apparente forma un angolo rispetto alla verticale, e durante l’accelerazione la superficie dell’acqua sarà perpendicolare alla forza risultante, cioè inclinata di un angolo rispetto g g al tavolo, con l’acqua che sta più in alto nel lato posteriore del secchio. Quando cessa la spinta sul secchio e il secchio decelera a causa dell’attrito, la forza apparente è invertita, e l’acqua sta più in alto nella parte anteriore FIGURA 12.4 Illustrazione di una forza apparente. del secchio (FIGURA 12.4). Un’importantissima caratteristica delle forze apparenti è che esse sono sempre proporzionali alle masse; lo stesso vale per la gravità. Esiste, quindi, la possibilità che la gravità stessa sia una forza apparente. Non può darsi che la gravitazione sia semplicemente dovuta al fatto che non abbiamo il giusto sistema di coordinate? Dopotutto possiamo sempre ottenere una forza proporzionale alla massa se immaginiamo che un corpo stia accelerando. Per esempio, un uomo chiuso in una scatola che sta immobile sulla Terra si trova trattenuto sul pavimento della scatola con una certa forza che è proporzionale alla sua massa. Ma se non vi fosse affatto la Terra e la scatola fosse ferma, l’uomo all’interno galleggerebbe nello spazio. D’altra parte, se non vi fosse assolutamente la Terra e qualcosa tirasse la scatola con un’accelerazione g, allora l’uomo nella scatola, studiando i fenomeni fisici, troverebbe una forza apparente che lo tira verso il pavimento, proprio come la gravità.

130

Capitolo 12 • Caratteristiche della forza

© 978-8808-22107-0

Einstein propose la famosa ipotesi che le accelerazioni diano un’imitazione della gravitazione, che le forze di accelerazione (le forze apparenti) non possano essere distinte dalla gravità; non è possibile dire quanto di una data forza sia gravità e quanto forza apparente. Può apparire completamente giusto considerare la gravità una forza apparente, dire che siamo tutti tenuti in basso perché stiamo accelerando verso l’alto, ma cosa dire delle persone in Madagascar, dall’altra parte della Terra: stanno accelerando anch’esse? Einstein trovò che la gravità potrebbe essere considerata una forza apparente soltanto in un punto e a un dato tempo, e fu portato dalle sue considerazioni a suggerire che la geometria dell’universo sia più complicata dell’ordinaria geometria euclidea. Questa discussione è soltanto qualitativa e non pretende di dare nient’altro che un’idea generale. Per dare una rudimentale idea di come la gravitazione potrebbe essere il risultato di forze apparenti, presentiamo un’illustrazione che è puramente geometrica e non rappresenta la situazione reale. Supponiamo che noi tutti viviamo in due dimensioni, senza sapere nulla di una terza. Pensiamo di essere su un piano, ma supponiamo di essere in realtà sulla superficie di una sfera. E supponiamo di lanciare un oggetto lungo la superficie, senza forze su di esso. Dove andrà? Sembrerà che vada in linea retta, ma esso deve rimanere sulla superficie di una sfera, dove la distanza minima fra due punti è un cerchio massimo; così esso segue un cerchio massimo. Se lanciamo un altro oggetto nello stesso modo, ma in un’altra direzione, esso segue un altro cerchio massimo. Poiché pensiamo di essere su un piano, ci aspettiamo che questi due corpi continueranno a divergere linearmente col tempo, ma un’osservazione accurata mostrerà che se vanno abbastanza lontani, essi si avvicineranno di nuovo come se si attirassero l’un l’altro. Ma essi non si attirano l’un l’altro – c’è soltanto qualcosa di «misterioso» in questa geometria. Questa particolare illustrazione non descrive correttamente il modo in cui la geometria di Einstein è «misteriosa», ma illustra che se deformiamo sufficientemente la geometria è possibile che tutta la gravitazione sia collegata in qualche modo a forze apparenti; questa è l’idea generale della teoria della gravitazione di Einstein.

12.6

Forze nucleari

Concludiamo questo capitolo con una breve discussione sulle sole altre forze conosciute, che sono dette forze nucleari. Queste forze sono all’interno del nucleo degli atomi, e benché se ne parli molto, nessuno ha mai calcolato la forza fra due nuclei, e finora non vi è legge conosciuta per le forze nucleari. Queste forze hanno un raggio di azione estremamente piccolo, che è proprio circa quanto le dimensioni del nucleo, forse 10 13 cm. Con particelle tanto piccole e a simili minuscole distanze, sono valide soltanto le leggi della meccanica quantistica, non le leggi di Newton. In un’analisi nucleare non possiamo più pensare in termini di forza, e in effetti possiamo sostituire il concetto di forza col concetto di energia di interazione di due particelle, un argomento che discuteremo in seguito. Ogni formula che può essere scritta per le forze nucleari è un’approssimazione piuttosto sommaria che trascura parecchie complicazioni; una può essere qualcosa di simile a quel che segue: le forze all’interno del nucleo non variano inversamente al quadrato della distanza, ma si estinguono esponenzialmente su una certa distanza r, come espresso dalla relazione ! 1 r F = 2 exp r0 r

dove la distanza r 0 è dell’ordine di 10 13 cm. In altre parole, le forze scompaiono quando le particelle sono a grande distanza, benché siano molto forti entro un raggio di azione di 10 13 cm. Per quanto se ne sa oggi, le leggi delle forze nucleari sono molto complesse; non le capiamo in modo semplice, e l’intero problema dell’analisi del meccanismo fondamentale che sta dietro le forze nucleari è insoluto. Tentativi di soluzione hanno portato alla scoperta di numerose strane particelle, i mesoni ⇡, per esempio, ma l’origine di queste forze rimane oscura.

13

Lavoro ed energia potenziale (1)

13.1

Energia di un corpo che cade

Nel capitolo 4 abbiamo discusso la conservazione dell’energia. In quella discussione non abbiamo fatto uso delle leggi di Newton, ma, naturalmente, è di grande interesse vedere come avvenga che l’energia sia effettivamente conservata in accordo con queste leggi. Per chiarezza inizieremo con l’esempio più semplice possibile, quindi svilupperemo esempi via via più complessi. L’esempio più semplice di conservazione dell’energia è la caduta verticale di un oggetto, che si muove soltanto in direzione verticale. Un oggetto che cambia la propria altezza sotto l’influenza della sola gravità, ha energia cinetica T (o E.C.), dovuta al suo moto durante la caduta, ed energia potenziale mgh, abbreviata con U (o E.P.), la somma delle quali è costante: 1 2 mv + mgh = cost. 2 E.C.

E.P.

ossia T + U = cost.

(13.1)

Vorremmo ora dimostrare che questa affermazione è esatta. Che cosa significa dimostrare che è esatta? Per la seconda legge di Newton possiamo facilmente dire come si muove l’oggetto, ed è facile dedurre come la velocità vari col tempo, cioè che essa cresce proporzionalmente al tempo e che l’altezza varia come il quadrato del tempo. Quindi, se misuriamo l’altezza a partire da un’origine dove l’oggetto è fermo, non è un miracolo che l’altezza risulti uguale al quadrato della velocità moltiplicato per un certo numero di costanti. Osserviamo però questo un po’ più da vicino. Ricaviamo direttamente dalla seconda legge di Newton come dovrebbe cambiare l’energia cinetica, facendo la derivata rispetto al tempo dell’energia cinetica e usando poi le leggi di Newton. Quando differenziamo mv 2 /2 rispetto al tempo, otteniamo ! dT d 1 2 1 dv dv = mv = m2v = mv (13.2) dt dt 2 2 dt dt poiché m è supposta costante. Ma per la seconda legge di Newton m cosicché

dv =F dt

dT = Fv (13.3) dt In generale il risultato sarà F · v , ma nel nostro caso unidimensionale lasciamolo come prodotto della forza per la velocità. Ora, nel nostro semplice esempio la forza è costante, uguale a mg, una forza verticale (il segno meno significa che agisce verso il basso), e la velocità, naturalmente, è la rapidità di variazione col tempo della posizione verticale, o altezza h. Così la rapidità di variazione dell’energia cinetica

132

Capitolo 13 • Lavoro ed energia potenziale (1)

© 978-8808-22107-0

è mg(dh/dt), quantità che, miracolo dei miracoli, è la rapidità di variazione (col segno ) di qualche altra cosa! È la rapidità di variazione temporale di mgh! Quindi al trascorrere del tempo, le variazioni di energia cinetica e della quantità mgh sono uguali e opposte, cosicché la somma delle due quantità rimane costante. C.V.D. Abbiamo dimostrato dalla seconda legge di Newton relativa al moto, che, per forze costanti, l’energia si conserva quando aggiungiamo l’enerh gia potenziale mgh all’energia cinetica mv 2 /2. Osserviamo ancora questo risultato e vediamo se può essere generalizzato, così da aumentare le nostre conoscenze. Funziona soltanto per un corpo che cade liberamente o è più generale? Ci aspettiamo dalla nostra discussione sulla conservazione dell’energia che esso funzioni per un oggetto che si muove da un punto dh/dt v all’altro di un qualche tipo di curva in assenza di attrito, sotto l’influenza della gravità (FIGURA 13.1). Se l’oggetto raggiunge una certa altezza h, x partendo dall’altezza iniziale H, allora dovrebbe valere la stessa formula anche se la velocità è ora in una qualche direzione diversa da quella verticale. Vorremmo capire perché la legge è ancora valida. Seguiamo lo stesso FIGURA 13.1 Un oggetto in movimento lungo una traiettoria priva di attrito sotto l’influenza della gravità. procedimento analitico trovando la rapidità temporale di variazione dell’energia cinetica. Questa sarà ancora mv(dv/dt), ma m(dv/dt) è la rapidità di variazione del modulo della quantità di moto, cioè la forza nella direzione del moto: la forza tangenziale Ft . Quindi dT dv = mv = Ft v dt dt Ora la velocità è la rapidità di variazione della distanza lungo la curva, cioè ds/dt, e la forza tangenziale Ft non è mg, ma è ridotta dal rapporto fra la distanza verticale dh e la distanza ds lungo la traiettoria. In altre parole Ft = mg sen ✓ = mg

dh ds

pertanto Ft

ds dh ds dh = mg = mg dt ds dt dt

poiché i ds si semplificano. Otteniamo dunque mg(dh/dt), che è uguale alla rapidità con cui cambia mgh, come prima. Per capire esattamente la validità della conservazione dell’energia in generale nella meccanica, discuteremo ora un certo numero di concetti che ci aiuteranno nell’analisi. Discutiamo per prima cosa la rapidità di variazione dell’energia cinetica in generale in tre dimensioni. L’energia cinetica in tre dimensioni è ⌘ 1 ⇣ T = m vx2 + vy2 + vz2 2 Quando differenziamo questa equazione rispetto al tempo otteniamo tre termini spaventosi: ! dvy dT dvx dvz = m vx + vy + vz (13.4) dt dt dt dt

Ma m(dvx /dt) è la forza Fx che agisce sull’oggetto nella direzione x. Così il secondo membro dell’equazione (13.4) è Fx vx + Fy vy + Fz vz . Ricordando l’analisi vettoriale, riconosciamo questo termine come F · v; quindi dT =F·v (13.5) dt Questo risultato può essere ottenuto più rapidamente come segue: se a e b sono due vettori e se entrambi dipendono dal tempo, la derivata di a · b è, in generale, d db da (a · b) = a · + ·b dt dt dt

(13.6)

13.1 • Energia di un corpo che cade

© 978-8808-22107-0

Usiamo allora questa relazione nel caso a = b = v: ! ! d 1 2 d 1 dv ds mv = mv · v = m ·v=F·v=F· dt 2 dt 2 dt dt

(13.7)

Poiché i concetti di energia cinetica, e di energia in generale, sono molto importanti, sono stati assegnati vari nomi ai termini più significativi in equazioni come questa. mv 2 /2 è chiamato, come sappiamo, energia cinetica. F · v è chiamato potenza: la forza agente su un oggetto per la velocità dell’oggetto (prodotto «scalare» fra vettori) è la potenza trasferita all’oggetto dalla forza. Abbiamo così un meraviglioso teorema: la rapidità di variazione dell’energia cinetica di un oggetto è uguale alla potenza spesa dalle forze agenti su di esso. Per studiare la conservazione dell’energia, vogliamo però analizzare questo ancora più da vicino. Valutiamo la variazione di energia cinetica in un piccolissimo intervallo di tempo dt. Se moltiplichiamo per dt il primo e l’ultimo membro dell’equazione (13.7), troviamo che la variazione differenziale dell’energia cinetica è il prodotto «scalare» della forza per la distanza infinitesima percorsa: dT = F · ds (13.8) Integrando otteniamo T=



1

2

F · ds

(13.9)

Che cosa significa? Significa che se un oggetto si muove in un modo qualunque, sotto l’influenza di una forza, lungo una traiettoria curvilinea, allora la variazione di E.C., quando esso passa da un punto all’altro lungo la curva, è uguale all’integrale della componente della forza lungo la curva per lo spostamento differenziale ds, essendo l’integrale calcolato fra i due punti. Anche questo integrale ha un nome; è detto lavoro eseguito dalla forza sull’oggetto. Vediamo immediatamente che la potenza è uguale al lavoro fatto al secondo. Vediamo anche che è solo la componente della forza in direzione del moto che contribuisce al lavoro fatto. Nel nostro semplice esempio le forze erano solo verticali e avevano una sola componente, diciamo Fz , uguale a mg. Comunque si muova l’oggetto in queste circostanze, per esempio cadendo lungo una parabola, F · ds, che può essere scritto come Fx dx + Fy dy + Fz dz, si riduce a Fz dz = mg dz, poiché le altre componenti della forza sono nulle. Quindi nel nostro semplice caso ⌅ 2 ⌅ z2 F · ds = mg dz = mg(z2 z1 ) (13.10) 1

z1

così troviamo nuovamente che, per l’energia potenziale, conta solo l’altezza verticale dalla quale cade l’oggetto. Una parola sulle unità. Poiché le forze si misurano in newton, e per ottenere un lavoro dobbiamo moltiplicarle per una distanza, il lavoro si misura in newton per metro (N · m), ma in genere si preferisce dire joule (J) anziché newton-metro. Un newton-metro si chiama joule; il lavoro si misura in joule. La potenza è allora misurata in joule al secondo (J/s), che è anche chiamato watt (W). Se moltiplichiamo la potenza per il tempo, il risultato è il lavoro fatto. Il lavoro fatto nelle nostre case dalla società elettrica, tecnicamente, è uguale ai watt per i secondi. È qui che incontriamo un termine come il kilowattora (kW/h), corrispondente a 1000 watt per 3600 secondi, ossia 3,6 · 106 J. Facciamo ora un altro esempio sulla legge di conservazione dell’energia. Consideriamo un oggetto che inizialmente possiede energia cinetica, sta muovendosi molto velocemente e scivola con attrito sul pavimento. Si ferma. All’inizio l’energia cinetica non è zero, ma alla fine è zero; c’è un lavoro fatto dalle forze, poiché nel caso in cui vi è attrito, vi è sempre una componente della forza in direzione opposta a quella del moto e così l’energia va costantemente perduta. Ma prendiamo ora una massa all’estremità di un perno oscillante, senza attrito, in un piano verticale, nel campo gravitazionale. Ciò che succede qui è differente, poiché quando la massa sta andando verso l’alto la forza è diretta verso il basso, e quando la massa ritorna in basso la forza è ancora diretta verso il basso. In questo modo F · ds ha un segno durante la salita e il segno opposto durante la discesa. In ogni punto corrispondente delle traiettorie ascendente e discendente, i valori

133

134

Capitolo 13 • Lavoro ed energia potenziale (1)

© 978-8808-22107-0

di F · ds sono esattamente uguali in grandezza, ma di segno opposto, cosicché, in questo caso, il risultato netto dell’integrale sarà zero. Così, l’energia cinetica con la quale la massa ritorna al punto più basso è la stessa che aveva quando ne è partita; questo è il principio di conservazione dell’energia. (Si noti che quando vi sono forze di attrito, la conservazione dell’energia sembra, a prima vista, non valere. Dobbiamo trovare un’altra forma di energia. Risulta infatti, che si genera calore in un oggetto quando esso striscia su un altro con attrito, ma per il momento supponiamo di ignorarlo.)

13.2

Lavoro fatto dalla gravità

Il prossimo problema da discutere è molto più difficile del precedente; riguarda il caso in cui le forze non sono costanti o semplicemente verticali, come invece erano nei casi che abbiamo trattato. Consideriamo, per esempio, un pianeta che si muove attorno al Sole, o un satellite che si muove nello spazio intorno alla Terra. Per prima cosa considereremo il moto di un oggetto che parte da un certo punto l e cade, diciamo, direttamente verso il Sole o verso la Terra (FIGURA 13.2). Vi sarà in questa circostanza una legge di conservazione m M dell’energia? La sola differenza è che, in questo caso, durante il moto, la 2 1 forza cambia; non è semplicemente una costante. Come sappiamo, la forza è GM/r 2 per la massa m, dove m è la massa in moto. Ora, certamente, quando un corpo cade verso la Terra, l’energia cinetica aumenta all’auFIGURA 13.2 Una piccola massa m cade sotto l’influenza della gravità verso una grande massa M. mentare del tratto di caduta, proprio come fa quando non ci preoccupiamo della variazione della forza con l’altezza. Il punto è se sia possibile trovare un’altra formula, diversa da mgh, per l’energia potenziale, una diversa funzione della distanza dalla Terra in modo che la conservazione dell’energia continui a essere valida. Questo caso unidimensionale è facile da trattare per il fatto che sappiamo che la variazione di energia cinetica è uguale all’integrale, da un estremo all’altro del moto, di GMm/r 2 per lo spostamento dr: ⌅ 2 GMm T2 T1 = dr (13.11) r2 1 Non occorrono coseni in questo caso perché la forza e lo spostamento sono nella stessa direzione. È facile integrare dr/r 2 ; il risultato è 1/r , quindi l’equazione (13.11) diventa ! 1 1 T2 T1 = +GMm (13.12) r2 r1 Abbiamo in questo modo una diversa formula per l’energia potenziale. L’equazione (13.12) ci dice che la quantità mv 2 /2 GMm/r, calcolata nel punto l, nel punto 2, o in qualsiasi altro punto, ha un valore costante. Abbiamo la formula dell’energia potenziale in un campo gravitazionale per il moto verticale. Sorge ora un interessante problema. Possiamo realizzare il moto perpetuo in un campo gravitazionale? Il campo gravitazionale varia; in posizioni diverse esso ha intensità e direzioni diverse. Potremmo, usando una rotaia fissa, senza attrito, fare qualcosa di simile a questo: partire da un certo punto, sollevare l’oggetto fino a un qualche altro punto, quindi muoverlo lungo un arco fino a un terzo punto, abbassarlo di una certa distanza, poi muoverlo con una certa pendenza e tirarlo verso l’esterno in qualche altro modo, cosicché, quando lo riportiamo al punto di partenza, una certa quantità di lavoro sia stata eseguita dalla forza gravitazionale e l’energia cinetica dell’oggetto sia stata aumentata? Possiamo progettare la curva in modo che esso torni indietro muovendosi un po’ più velocemente di prima, cosicché ruoti, ruoti e ruoti, dandoci il moto perpetuo? Poiché il moto perpetuo è impossibile, dovremmo trovare che anche questo è impossibile. Dovremmo scoprire la seguente affermazione: poiché non vi è attrito, l’oggetto dovrebbe tornare indietro con velocità né maggiore, né minore: dovrebbe essere capace di continuare a ruotare e ruotare

13.2 • Lavoro fatto dalla gravità

© 978-8808-22107-0

135

su qualsiasi traiettoria chiusa. Enunciato in altro modo, il lavoro totale fatto nel descrivere un ciclo completo deve essere zero per le forze di gravità, perché se non fosse zero guadagneremmo energia, ruotando. (Se il lavoro risulta minore di zero, cosicché quando ruotiamo in un verso otteniamo una velocità minore, allora, semplicemente, ruotiamo in verso opposto, perché le forze, naturalmente, dipendono solo dalla posizione, non dalla direzione; se in un verso il lavoro è positivo, nell’altro verso è negativo, così, a meno che esso non sia zero, otteniamo il moto perpetuo, ruotando in uno dei due versi.) Il lavoro è realmente zero? Cerchiamo di dimostrare che lo è. Dapprima spiegheremo più o meno perché è zero, e in seguito esamineremo il problema un po’ meglio dal punto di vista matematico. Supponiamo di usare una traiettoria semplice come quella mostrata in FIGURA 13.3, in cui una piccola massa è portata dal punto l al punto 2, quindi è fatta ruotare lungo un cerchio fino a 3, riportata indietro fino a 4, poi a 5, 6, 7 e 8 e infine di nuovo a l. Tutte le linee sono puramente radiali o circolari con M come centro. Quant’è il lavoro che si fa nel portare m lungo questa traiettoria? Fra i punti l e 2, esso è GMm per la differenza di 1/r fra questi due punti: W12 =



1

2

F · ds =



1

2

GMm 1 dr = GMm 2 r2 r

1 r1

!

Da 2 a 3 la forza è esattamente perpendicolare alla traiettoria, cosicché W23 ⌘ 0 . Il lavoro da 3 a 4è ! ⌅ 4 1 1 W34 = F · ds = GMm r4 r3 3

Nello stesso modo troviamo che

W45 = 0 W67 = 0

W56

1 = GMm r6

1 r5

W78

1 = GMm r8

1 r7

! !

W81 = 0 Pertanto

1 W = GMm r2

1 1 + r1 r4

1 1 + r3 r6

1 1 + r5 r8

1 r7

!

Ma osserviamo che r 2 = r 3 , r 4 = r 5 , r 6 = r 7 e r 8 = r 1 . Quindi W = 0. Possiamo naturalmente essere curiosi di sapere se questa non sia una curva troppo banale. Che accade se usiamo una curva reale? Cerchiamo di eseguire il calcolo su una curva reale. Anzitutto potremmo osservare che una curva chiusa reale potrebbe essere sempre sufficientemente approssimata a una serie di movimenti a dente di sega, come quelli della FIGURA 13.4, e che quindi, ecc., C.V.D., ma senza una piccola analisi non è ovvio che il lavoro fatto muovendosi attorno a un triangolo, pur piccolo, sia zero. Ingrandiamo uno dei triangoli, come mostrato in FIGURA 13.4. Il lavoro fatto nell’andare da a a b e da b a c lungo il triangolo è lo stesso lavoro fatto andando

13.3 Percorso chiuso in un campo gravitazionale. FIGURA

1 8

m

7

a

6

F

5

2

4

M 3

13.4 Percorso chiuso «continuo» che mostra un segmento ingrandito, approssimato mediante una serie di passi radiali e circolari, e un’immagine ingrandita di un passo. FIGURA

M

c

s

y

x b

136

Capitolo 13 • Lavoro ed energia potenziale (1)

© 978-8808-22107-0

direttamente da a a c? Supponiamo che la forza agisca in una certa direzione; a titolo di esempio, prendiamo il triangolo in modo tale che il lato bc sia in quella direzione. Supponiamo anche che il triangolo sia così piccolo che la forza risulti sostanzialmente costante sull’intero triangolo. Quanto vale il lavoro fatto per andare da a a c? Esso è ⌅ c Wac = F · ds = F s cos ✓ a

poiché la forza è costante. Calcoliamo ora il lavoro fatto muovendosi lungo gli altri due lati del triangolo. Lungo il lato verticale ab la forza è perpendicolare a ds, cosicché qui il lavoro è zero. Lungo il lato orizzontale bc ⌅ c

Wbc =

b

F · ds = F x

Vediamo, in questo modo, che il lavoro fatto muovendosi lungo i lati di un triangolino è uguale a quello fatto muovendosi lungo l’ipotenusa, poiché s cos ✓ è uguale a x. Abbiamo dimostrato in precedenza che la risposta è zero per qualsiasi traiettoria, composta da una serie di dentellature, come quelle della FIGURA 13.3, e che facciamo lo stesso lavoro se, anziché muoverci lungo le dentellature, tagliamo per gli spigoli (finché le dentellature sono abbastanza fini, e possiamo sempre renderle fini); quindi, il lavoro fatto muovendosi su una qualsiasi curva chiusa, in un campo gravitazionale, è zero. Questo è un risultato notevolissimo: ci insegna qualcosa che in precedenza non sapevamo sul moto dei pianeti. Ci insegna che quando un pianeta si muove attorno al Sole (senza nessun altro oggetto attorno, né altre forze) si muove in maniera tale che il quadrato della velocità in qualsiasi punto meno alcune costanti divise per il raggio in quel punto è sempre lo stesso in ogni punto dell’orbita. Per esempio, più vicino al Sole si trova il pianeta, più veloce esso si muove, ma di quanto? Della seguente quantità: se invece di far ruotare il pianeta attorno al Sole, cambiassimo la direzione (ma non l’intensità) della sua velocità, e lo facessimo muovere radialmente, quindi lo lasciassimo cadere da un raggio particolare al raggio che interessa, la nuova velocità sarebbe la stessa che esso aveva nell’orbita reale, poiché questo è proprio un altro esempio di traiettoria complicata. Finché torniamo alla stessa distanza, l’energia cinetica sarà la stessa. Così, sia che il moto sia quello reale, indisturbato, oppure che gli venga mutata la direzione mediante guide, mediante vincoli privi di attrito, l’energia cinetica con la quale il pianeta arriva in un punto, sarà la stessa. Così, quando facciamo un’analisi numerica del moto del pianeta nella sua orbita, come abbiamo fatto in precedenza, possiamo verificare se abbiamo fatto o meno errori apprezzabili, calcolando a ogni passo questa quantità costante, l’energia; essa non deve cambiare. Per l’orbita della TABELLA 9.2 l’energia cambia(1) , cambia di circa 1,5% dall’inizio alla fine. Perché? O perché abbiamo usato intervalli finiti, cioè per il metodo numerico, oppure perché abbiamo fatto qualche lieve errore, da qualche parte, nel calcolo aritmetico. Consideriamo l’energia in un altro caso: il problema di una massa collegata a una molla. Quando spostiamo la massa dalla sua posizione di equilibrio, la forza di ripristino è proporzionale allo spostamento. In queste circostanze, possiamo ricavare una legge per la conservazione dell’energia? Sì, poiché il lavoro fatto da tale forza è ⌅ x ⌅ x 1 2 W= F dx = k x dx = kx (13.13) 2 0 0 Quindi per una massa attaccata a una molla, abbiamo che l’energia cinetica della massa oscillante più k x 2 /2 è una costante. Vediamo come funziona. Tiriamo in basso la massa; essa è ferma e dunque la sua velocità è zero. Ma x non è zero, x è al suo massimo, così vi è una certa energia, l’energia potenziale, naturalmente. Abbandonando ora la massa, cominciano ad accadere un certo numero di cose (i dettagli non saranno discussi), ma a ogni istante l’energia cinetica più l’energia potenziale deve essere una costante. Per esempio, dopo che la massa sta oltrepassando il punto (1)

L’energia è (vx2 + vy2 )/2

1/r nelle unità della TABELLA 9.2.

13.3 • Additività dell’energia

© 978-8808-22107-0

di equilibrio originario, la posizione x è uguale a zero, e questo accade quando v 2 è massimo, e come essa guadagna in x 2 perde in v 2 e così via. Quindi, mentre la massa va su e giù, si mantiene una compensazione fra x 2 e v 2 . In questo modo abbiamo ottenuto un’altra regola, che l’energia potenziale di una molla è k x 2 /2, se la forza è k x.

13.3

Additività dell’energia

Passiamo ora alla considerazione più generale di ciò che accade quando vi è un gran numero di oggetti. Supponiamo di avere il complicato problema di molti oggetti che contrassegniamo con i = 1, 2, 3, . . . , che esercitano tutti attrazioni gravitazionali l’uno sull’altro. Che cosa accade allora? Dimostreremo che se sommiamo le energie cinetiche di tutte le particelle e aggiungiamo a questa somma, per tutte le coppie di particelle, la somma delle loro mutue energie potenziali gravitazionali, GMm/r i j , il totale è una costante: X1 2

i

X Gmi m j = cost. ri j coppie i j

mi vi2 +

(13.14)

Come dimostrarlo? Differenziamo entrambi i membri rispetto al tempo e otteniamo zero. Quando differenziamo mi vi2 /2, otteniamo le derivate della velocità, che sono le forze, proprio come nell’equazione (13.5). Mediante la legge della forza, che conosciamo dalla legge della gravità di Newton, sostituiamo queste forze e ci accorgiamo che quello che è rimasto è uguale alla derivata rispetto al tempo di X Gmi m j ri j coppie i j La derivata temporale dell’energia cinetica è X X d X1 dvi mi vi2 = mi · vi = Fi · vi = dt i 2 dt i i X X Gmi m j *. = ri j +/ · vi 3 ri j i , j -

La derivata temporale dell’energia potenziale è d dt

X Gmi m j X Gmi m j dr i j = + ri j dt r i2j coppie i j coppie i j

Ma ri j = quindi

q

xi

dr i j 1 = dt 2r i j

= ri j ·

xj "

2

+ yi

yj

2

2 xi

xj

d xi dt

+ 2 yi

yj

d yi dt

+ 2 zi

zj

dzi dt

vi

vj ri j

= ri j ·

+ zi

zj

2

! dxj + dt ! d yj + dt !# dz j = dt

vj vi + r ji · ri j r ji

(13.15)

137

138

Capitolo 13 • Lavoro ed energia potenziale (1)

© 978-8808-22107-0

poiché ri j = r ji , mentre r i j = r ji . Così d dt

# X Gmi m j X " Gmi m j Gm j mi = r i j · vi + r ji · v j ri j r i3j r 3ji coppie i j coppie i j

(13.16)

P P P Dobbiamo ora osservare con attenzione che cosa significhino i { j } e coppie i j . Nell’equazione P P (13.15), i { j } significa che i assume tutti i valori i = 1, 2, 3, . . . a turno, e che per ogni valore di i, l’indice j assume tutti i valori eccetto i. Così se i = 3, j assume i valori 1, 2, 4, . . . P Nell’equazione (13.16), d’altra parte, coppie i j significa che dati valori di i e di j capitano una sola volta. Così la coppia di particelle 1 e 3 contribuisce alla somma con un solo termine. Per mantenere traccia di questo possiamo convenire che i assuma tutti i valori i = 1, 2, 3, . . . , e per ogni i, j assuma soltanto valori maggiori di i. Così, se i = 3, j potrebbe avere soltanto i valori 4, 5, 6, . . . Ma teniamo presente che per ogni valore di i e di j vi sono due contributi alla somma, uno relativo a vi e l’altro a v j , e che questi termini hanno lo stesso aspetto di quelli dell’equazione (13.15), dove tutti i valori di i e di j (eccettuato i = j) sono inclusi nella somma. Quindi, confrontando i termini uno a uno, vediamo che le equazioni (13.16) e (13.15) sono precisamente la stessa equazione ma di segno opposto, cosicché la derivata temporale dell’energia cinetica più l’energia potenziale è in effetti zero. Così vediamo che, per diversi oggetti, l’energia cinetica è la somma dei contributi di ogni singolo oggetto, e che l’energia potenziale è altrettanto semplice, essendo di nuovo semplicemente una somma di contributi, le energie di tutte le coppie. Possiamo capire perché ciascun termine debba essere l’energia di ogni coppia nel modo seguente: supponiamo di voler trovare il lavoro totale che si deve fare per portare gli oggetti a certe distanze l’uno dall’altro. Possiamo far questo in diversi passi, portandoli dall’infinito, dove non vi sono forze, a uno a uno. Per primo portiamo il numero 1, il che non richiede lavoro perché altri oggetti non sono ancora presenti per esercitare una forza su di esso. Successivamente portiamo il numero 2, il che richiede un certo lavoro, vale a dire W12 = Gm1 m2 /r 12 . Ora, e questo è un punto importante, supponiamo di portare nella posizione 3 l’oggetto successivo. A ogni istante, la forza agente sul numero 3 può essere scritta come somma di due forze: la forza esercitata dal numero 1 e quella esercitata dal numero 2. Quindi il lavoro fatto è la somma dei lavori fatti da ciascuna, poiché se F3 può essere sviluppata nella somma di due forze, F3 = F13 + F23 allora il lavoro è



F3 · ds =



F13 · ds +



F23 · ds = W13 + W23

Cioè, il lavoro fatto è la somma dei lavori eseguiti contro la prima forza e contro la seconda forza, come se ciascuna di esse agisse indipendentemente. Procedendo in questo modo, vediamo che il lavoro totale necessario per costruire una data configurazione di oggetti è precisamente il valore dato nell’equazione (13.14) come energia potenziale. È per il fatto che la gravità obbedisce al principio di sovrapposizione delle forze che possiamo scrivere l’energia potenziale come somma su ogni coppia di particelle.

13.4

Campo gravitazionale di oggetti grandi

Calcoleremo ora i campi che si incontrano in alcune circostanze fisiche che implicano distribuzioni di massa. Non abbiamo considerato finora distribuzioni di massa, ma soltanto particelle, così è interessante calcolare le forze quando esse sono prodotte da qualcosa di più di una semplice particella. Per prima cosa, troveremo la forza gravitazionale, agente su una massa, prodotta da una lamina piana di materiale di estensione infinita. La forza agente su una unità di massa posta in un dato punto P, prodotta da questa lamina di materiale (FIGURA 13.5) sarà diretta, naturalmente, verso la lamina. Sia a la distanza del punto dalla lamina e sia µ la massa per area unitaria di questa immensa lamina. Supporremo che µ sia costante; si tratta di una lamina di materiale uniforme.

13.4 • Campo gravitazionale di oggetti grandi

© 978-8808-22107-0

139

13.5 La forza gravitazionale F agente su un punto materiale prodotta da una lamina piana e infinita di materia. FIGURA

ds d

O a

dm

C r dC

dCx

a

r

y

O

R dx

P

P

x

x

Ora, quale piccolo campo dC è prodotto dalla massa dm che giace fra ⇢ e ⇢ + d⇢ dal punto O della lamina, essendo O il punto della lamina più vicino a P? Risposta: dC = G dm

r r3

Ma questo campo è diretto come r e sappiamo che resterà soltanto la sua componente x, quando sommeremo tutti i piccoli vettori dC, per produrre C. La componente x di dC è dCx = G dm

rx a = G dm 3 r3 r

Ora, tutte le masse dm, che sono alla stessa distanza r da P, produrranno lo stesso dCx ; così possiamo scrivere immediatamente per dm la massa totale nell’anello fra ⇢ e ⇢ + d⇢, vale a dire dm = µ2⇡ ⇢ d⇢ (2⇡ ⇢ d⇢ è l’area dell’anello di raggio ⇢ e larghezza d⇢, se d⇢ ⌧ ⇢). Quindi dCx = G µ2⇡ ⇢ d⇢

a r3

Poiché r 2 = ⇢2 + a2 , si ha ⇢ d⇢ = r dr. Perciò ⌅ 1 dr 1 Cx = 2⇡G µa = 2⇡G µa 2 a a r

! 1 = 2⇡G µ 1

(13.17)

Quindi la forza è indipendente dalla distanza a! Perché? Abbiamo fatto un errore? Si potrebbe pensare che più lontani andiamo, più debole sia la forza. Ma no! Se siamo vicini, la maggior parte della materia si trova ad attirare con un angolo sfavorevole; se siamo lontani più materia è situata in modo più favorevole per esercitare un’attrazione verso il piano. A ogni distanza, la materia che è più efficace sta in un certo cono. Quando siamo più lontani, la forza è più piccola, inversamente al quadrato della distanza, ma nello stesso cono, nello stesso angolo, vi è molta più materia, proprio in proporzione al quadrato della distanza! Questa analisi può essere resa rigorosa osservando appunto che il contributo differenziale in ogni dato cono è in effetti indipendente dalla distanza, a causa della variazione reciproca, al variare della distanza, dell’intensità della forza dovuta a una data massa e della quantità di massa inclusa nel cono. La forza non è in realtà costante, naturalmente, perché, quando andiamo dall’altra parte della lamina cambia segno. Abbiamo anche, in effetti, risolto un problema di elettricità: se abbiamo una lamina elettricamente carica, con una quantità di carica per area unitaria, allora il campo elettrico in un punto esterno alla lamina è uguale a /2✏ 0 , ed è diretto verso l’esterno se la lamina è carica di segno positivo, e verso l’interno se la lamina è carica di segno negativo. Per dimostrare questo, notiamo semplicemente che G, per la gravità, gioca lo stesso ruolo di 1/(4⇡✏ 0 ) per l’elettricità. Supponiamo ora di avere due lamine, con una carica positiva + su una e una carica negativa sull’altra, posta a distanza D dalla prima. Com’è il campo? Esternamente alle due lamine è zero. Perché? Perché una lamina attrae e l’altra respinge e la forza è indipendente dalla distanza, cosicché le due forze si equilibrano! Di più, la forza tra le due lamine è chiaramente doppia di quella dovuta a una lamina, vale a dire E = /✏ 0 , ed è diretta dalla lamina positiva a quella negativa. Veniamo ora a un problema molto interessante e importante la cui soluzione è sempre stata considerata implicita, vale a dire, che la forza prodotta dalla Terra in un punto sulla superficie o

13.6 Sottile guscio sferico di massa o di carica. FIGURA

140

Capitolo 13 • Lavoro ed energia potenziale (1)

© 978-8808-22107-0

all’esterno è la stessa che si avrebbe se tutta la massa della Terra fosse concentrata nel suo centro. La validità di questa supposizione non è ovvia, perché quando siamo vicini, una parte di massa è molto vicina a noi, una parte è lontana e così via. Quando sommiamo tutti insieme gli effetti, sembra un miracolo che la forza totale sia esattamente la stessa che otterremmo se ponessimo tutta la massa nel centro! Dimostriamo ora l’esattezza di questo miracolo. Per farlo, però, considereremo invece dell’intera Terra un sottile guscio cavo uniforme. Detta m la massa totale del guscio, calcoliamo l’energia potenziale di una particella di massa m 0 a una distanza R dalla sfera (FIGURA 13.6) e dimostriamo che l’energia potenziale è la stessa che risulterebbe se la massa m fosse un punto nel centro. (L’energia potenziale è più facile da trattare del campo, perché non dobbiamo impazzire con gli angoli, ma sommiamo semplicemente le energie potenziali di tutti i pezzetti di massa.) Se chiamiamo x la distanza dal centro di una certa sezione piana, allora tutta la massa che è in una fetta dx è alla stessa distanza r da P, e l’energia potenziale dovuta a questo anello è Gm 0 dm/r. Quanta massa si trova nella fettina dx? Una quantità dm = 2⇡y µ ds =

2⇡y µ dx 2⇡y µ dxa = = 2⇡a µ dx sen ✓ y

dove µ = m/4⇡a2 è la densità superficiale di massa sul guscio sferico. (È una regola generale che l’area di una zona sferica sia proporzionale alla sua larghezza assiale.) Quindi l’energia potenziale dovuta a dm è Gm 0 dm Gm 02⇡a µ dx dW = = r r Ma vediamo che r 2 = y 2 + (R

x)2 = y 2 + x 2 + R2

2Rx = a2 + R2

Dato che 2r dr = 2R dx abbiamo dW = quindi risulta W=

Gm 02⇡a µ R



dx = r

ossia

2Rx

dr R

Gm 02⇡a µ dr R R a

R+a

dr =

Gm 02⇡a µ 2a = R

(13.18) Gm 0(4⇡a2 µ) Gm 0 m = = R R Così, per un sottile guscio sferico, l’energia potenziale di una massa m 0, esterna al guscio, è la stessa che si avrebbe se la massa del guscio fosse concentrata nel suo centro. La Terra può essere immaginata come una serie di gusci sferici, ciascuno dei quali dà un contributo di energia che dipende solo dalla sua massa e dalla distanza dal centro; sommando insieme tutti i contributi, otteniamo la massa totale, e quindi la Terra si comporta come se tutta la materia fosse nel suo centro! Ma guardate cosa succede se il nostro punto è interno al guscio. Facendo lo stesso calcolo, con P interno, otteniamo ancora la differenza dei due r, ma ora nella forma a R (a+ R) = 2R, ossia il doppio della distanza dal centro (col segno ). In altre parole, W risulterà W = Gm 0 m/a, che è indipendente da R e indipendente dalla posizione, cioè la stessa energia indipendentemente da dove ci troviamo all’interno. Quindi nessuna forza; nessun lavoro viene fatto quando ci muoviamo internamente. Se l’energia potenziale è la stessa indipendentemente da dove è posto l’oggetto, dentro la sfera, non ci può essere forza agente su di esso. Così non vi è forza all’interno, vi è soltanto una forza esterna, e la forza esterna è la stessa che si avrebbe se tutta la massa fosse nel centro.

Lavoro ed energia potenziale (2)

14.1

Lavoro

Nel capitolo precedente abbiamo presentato numerose nuove idee e risultati che giocano un ruolo centrale in fisica. Queste idee sono tanto importanti che sembra valga la pena impiegare un intero capitolo per un loro più attento esame. In questo capitolo non ripeteremo le «dimostrazioni» o gli artifici specifici per mezzo dei quali sono stati ottenuti i risultati, ma ci concentreremo invece su una discussione delle idee stesse. Nell’apprendere un argomento di natura tecnica in cui la matematica svolge un determinato ruolo, si è posti di fronte al compito di capire e di fissare nella memoria un’enorme quantità di fatti e di concetti, tenuti insieme da certi rapporti che possono essere «provati» o «dimostrati» come esistenti fra loro. È facile confondere la dimostrazione con la relazione che essa stabilisce. Chiaramente, la cosa importante da imparare e da ricordare è la relazione, non la dimostrazione. In ogni situazione particolare possiamo dire: «Può essere dimostrato che... (una determinata cosa è vera)», oppure possiamo dimostrarlo concretamente. Quasi sempre, la particolare dimostrazione che viene usata è, prima di tutto, architettata in forma tale che possa essere scritta subito e facilmente sulla lavagna o sulla carta, e in modo tale da risultare il più possibile scorrevole. Di conseguenza la dimostrazione può apparire ingannevolmente semplice, quando in effetti l’autore potrebbe aver impiegato ore nel tentare diversi modi di calcolare la stessa cosa, fino a trovare quello più efficace, così da essere in grado di far vedere che la dimostrazione può essere svolta nel tempo più breve possibile. Quando vediamo una dimostrazione, la cosa che deve essere ricordata non è la dimostrazione stessa, ma piuttosto che può essere dimostrato che la tal cosa è vera. Naturalmente quando la dimostrazione coinvolge alcuni procedimenti matematici, o «artifici» mai visti prima, l’attenzione deve essere prestata non precisamente all’artificio, ma all’idea matematica che l’artificio implica. È certo che fra tutte le dimostrazioni che vengono fatte in un corso come questo, nessuna è stata ricordata dal tempo in cui l’autore studiava come matricola di fisica. Al contrario, egli ricorda semplicemente che la tal cosa è vera e, per spiegare come ciò possa essere dimostrato, inventa una dimostrazione nel momento in cui occorre. Chiunque abbia realmente imparato un argomento dovrebbe essere in grado di seguire un procedimento simile, ma non serve ricordare le dimostrazioni. Questo è il motivo per cui in questo capitolo eviteremo le prove delle varie affermazioni fatte precedentemente, e riassumeremo semplicemente i risultati. La prima idea che deve essere assimilata è il lavoro prodotto da una forza. La parola «lavoro» in fisica non è quella nel senso comune di «Lavoratori del mondo unitevi!», ma corrisponde a un concetto diverso. Il lavoro in fisica è espresso come ⌅ F · ds detto «integrale di linea di F per ds»; ciò significa che se la forza, per esempio, ha una certa direzione e l’oggetto su cui la forza compie lavoro si sposta lungo un’altra determinata direzione, allora soltanto la componente della forza nella direzione dello spostamento produce un lavoro. Se, per esempio, la forza fosse costante e lo spostamento fosse una distanza finita s, allora il

14

142

Capitolo 14 • Lavoro ed energia potenziale (2)

© 978-8808-22107-0

lavoro prodotto nel muovere la forza costante per quella distanza sarebbe soltanto la componente della forza lungo s per s. La legge è «forza per distanza», ma in realtà intendiamo soltanto la componente della forza nella direzione dello spostamento per s o, equivalentemente, la componente dello spostamento nella direzione della forza per F. È evidente che nessun lavoro è prodotto da una forza perpendicolare allo spostamento. Ora, se il vettore spostamento s è sviluppato nelle sue componenti, cioè se lo spostamento reale è s e vogliamo considerarlo effettivamente come una componente di spostamento x in direzione x, y in direzione y e z in direzione z, allora il lavoro fatto per trasferire un oggetto da un posto a un altro, può essere calcolato in tre parti, considerando il lavoro prodotto lungo x, lungo y e lungo z. Il lavoro prodotto lungo la direzione x implica soltanto quella componente della forza, vale a dire Fx , e così via; quindi il lavoro è Fx x + Fy y + Fz z Quando la forza non è costante, e abbiamo un moto complesso su una linea curva, allora dobbiamo scomporre la traiettoria in un insieme di piccoli s, sommare il lavoro fatto trasportando l’oggetto lungo ogni s, e calcolare il limite quando s tende a zero. Questo è il significato dell’«integrale di linea». Tutto quello che abbiamo appena detto è contenuto nella formula ⌅ W = F · ds È giusto dire che questa è una formula meravigliosa, ma un’altra cosa è capire che cosa significa, o quali conseguenze ne derivano. La parola «lavoro» in fisica ha un significato assai diverso da quello usato nelle circostanze comuni, quindi deve essere chiaramente evidenziato che in alcune particolari situazioni i due significati differiscono notevolmente. Per esempio, secondo la definizione fisica di lavoro, se una persona tiene sollevato per un po’ un peso di cento libbre, non compie un lavoro. Nondimeno, ognuno sa che egli comincia a sudare, a tremare, ad avere il respiro pesante, come se stesse correndo su per una scalinata. Tuttavia il correre su per le scale è considerato un lavoro (nel correre giù per le scale, si guadagna lavoro dall’esterno secondo la fisica), ma nel sostenere semplicemente un oggetto in una posizione fissa non si compie lavoro. È chiaro che la definizione fisica di lavoro differisce dalla definizione fisiologica, per ragioni che considereremo brevemente. È un fatto che nel sostenere un peso una persona compie lavoro «fisiologico». Perché dovrebbe sudare? Perché dovrebbe avere necessità di consumare alimenti per mantenere sollevato il peso? Perché il suo meccanismo interno lavora a tutto gas solo per tenere sollevato il peso? In realtà il peso potrebbe essere tenuto sollevato senza sforzo ponendolo su un tavolo; dunque il tavolo quietamente e con calma, senza alcun rifornimento di energia, è capace di mantenere lo stesso peso alla stessa altezza! La situazione fisiologica è qualcosa di simile a quanto segue. Vi sono nel corpo umano e in altri animali due tipi di muscoli: un tipo, detto muscolo striato o scheletrico, è il tipo di muscolo che abbiamo nelle braccia, per esempio, che è sotto controllo volontario; l’altro tipo, detto muscolo liscio, è simile al muscolo negli intestini o, nel mollusco, al grande muscolo adduttore che chiude la conchiglia. I muscoli lisci lavorano molto lentamente, ma possono mantenere una «posizione»; vale a dire, se il mollusco prova a chiudere la sua conchiglia in una certa posizione, manterrà tale posizione anche se vi è una forza molto grande che tenta di cambiargliela. Esso manterrà la posizione sotto carico per ore senza stancarsi perché è molto simile a una tavola che tiene sollevato un peso; esso si «fissa» in una certa posizione e le molecole vi si serrano temporaneamente, senza che venga prodotto lavoro: nessuno sforzo è generato dal mollusco. Il fatto che dobbiamo produrre sforzo per mantenere un peso è semplicemente dovuto alla struttura del muscolo striato. Quello che accade è che quando un impulso nervoso raggiunge una fibra muscolare, la fibra produce una piccola contrazione e poi si rilassa, cosicché, quando sosteniamo qualcosa, enormi scariche di impulsi nervosi arrivano nel muscolo, numerose contrazioni mantengono il peso, mentre altre fibre si rilassano. Possiamo vedere questo, naturalmente: quando sosteniamo un carico pesante e ci stanchiamo, cominciamo a tremare. La ragione è che le

14.3 • Forze conservative

© 978-8808-22107-0

143

scariche stanno arrivando irregolarmente, e il muscolo è affaticato e non reagisce con sufficiente prontezza. Perché un simile inefficiente schema? Non sappiamo esattamente il perché, ma l’evoluzione non è stata capace di sviluppare muscoli lisci veloci. Il muscolo liscio sarebbe molto più efficace per sostenere pesi perché si resterebbe immobili ed esso si serrerebbe; non vi sarebbe implicato lavoro e non sarebbe chiesta energia. Però esso ha lo svantaggio di essere molto lento nell’operare. Ritornando ora alla fisica, possiamo domandarci perché vogliamo calcolare il lavoro prodotto. La risposta è che è interessante e utile farlo perché il lavoro prodotto su una particella dalla risultante di tutte le forze che agiscono su di essa è esattamente uguale alla variazione dell’energia cinetica di tale particella. Cioè, se un oggetto viene spinto, esso acquista velocità, e (v 2 ) =

14.2

2 F· s m

Moto vincolato

Un’altra interessante caratteristica della forza e del lavoro è questa: supponiamo di avere un binario curvo o inclinato, e una particella che debba muoversi lungo il binario, ma senza attrito. Oppure possiamo avere un pendolo con una cordicella e un peso; la fune costringe il peso a muoversi in un cerchio attorno al perno. Il perno può venire spostato se si fa in modo che la fune incontri un piolo, cosicché la via seguita dal peso è lungo due cerchi di raggi diversi. Questi sono esempi di ciò che definiamo vincoli fissi, senza attrito. In un moto con vincolo fisso privo di attrito, non viene prodotto lavoro dal vincolo, poiché le forze del vincolo sono sempre perpendicolari rispetto al moto. Per «forze del vincolo» intendiamo quelle forze che sono applicate direttamente all’oggetto dal vincolo stesso: la forza di contatto col binario o la tensione nella corda. Le forze coinvolte nel moto di una particella che scende lungo un pendio per effetto della gravità sono piuttosto complicate, poiché vi è una forza di vincolo, una forza gravitazionale e così via. Però, se basiamo il nostro calcolo del moto sulla conservazione dell’energia e sulla sola forza Direzione del moto gravitazionale, otteniamo il risultato giusto. Questo sembra piuttosto strano, Forza del perché non è in senso stretto il giusto modo di procedere: dovremmo usare Forza di vincolo gravità la forza risultante. Nondimeno, il lavoro fatto dalla sola forza gravitazionale risulterà essere la variazione dell’energia cinetica, poiché il lavoro prodotto dalla parte vincolare della forza è zero (FIGURA 14.1). FIGURA 14.1 Forze agenti su un corpo che scivola La caratteristica importante qui è che se una forza può essere analizzata (senza attrito). come somma di due o più «parti», allora il lavoro prodotto dalla forza risultante lungo una data curva è la somma dei lavori prodotti dalle varie forze «componenti» nelle quali la forza viene analizzata. Così, se analizziamo la forza come se fosse la somma vettoriale di diversi effetti, la forza gravitazionale più le forze vincolari ecc. o la componente x di tutte le forze e la componente y di tutte le forze, o qualsiasi altro modo in cui desideriamo eseguire la suddivisione, allora il lavoro fatto dalla forza è uguale alla somma dei lavori fatti da tutte le parti in cui abbiamo diviso la forza nell’eseguire l’analisi.

14.3

Forze conservative

In natura vi sono certe forze, come quella di gravità, per esempio, che hanno una notevolissima proprietà che diciamo «conservativa» (il che non coinvolge alcuna idea politica, è ancora uno di quei «vocaboli stravaganti»). Se calcoliamo quanto lavoro è eseguito da una forza che sposta un oggetto da un punto all’altro, lungo una certa traiettoria curva, in generale il lavoro dipende dalla curva, ma in alcuni casi particolari no. Se non dipende dalla curva diciamo che la forza è una forza

Capitolo 14 • Lavoro ed energia potenziale (2)

144

2

A

B

P 1

14.2 Percorsi possibili fra due punti in un campo di forze. FIGURA

© 978-8808-22107-0

conservativa. In altre parole, se l’integrale della forza per la distanza per andare dalla posizione 1 alla posizione 2 in FIGURA 14.2 è calcolato lungo la curva A e poi lungo la curva B, otteniamo lo stesso numero di joule; se ciò avviene per questa coppia di punti su tutte le curve, e se la stessa affermazione vale a prescindere da quale coppia di punti consideriamo, allora diciamo che la forza è conservativa. In tali circostanze, l’integrale del lavoro per andare da 1 a 2 può essere calcolato in modo semplice e possiamo dare una formula per il risultato. Normalmente non è così facile, perché dobbiamo anche specificare la curva, ma quando abbiamo un caso in cui il lavoro non dipende dalla curva, allora naturalmente il lavoro dipende soltanto dalle posizioni 1 e 2. Per dimostrare questo concetto, consideriamo quanto segue. Prendiamo un punto «di riferimento» P, in una posizione arbitraria (FIGURA 14.2). Allora, l’integrale di linea del lavoro da 1 a 2, che vogliamo calcolare, può essere valutato come il lavoro compiuto per andare da 1 a P più il lavoro fatto per andare da P a 2, poiché le forze sono conservative e il lavoro non dipende dalla curva. Ora il lavoro fatto per andare dalla posizione P a una particolare posizione nello spazio è una funzione di tale posizione nello spazio. Naturalmente dipende in realtà anche da P, ma noi manteniamo il punto arbitrario P permanentemente fisso per l’analisi. Se si fa ciò, allora il lavoro prodotto per andare dal punto P al punto 2 è qualche funzione della posizione finale di 2. Essa dipende da dove si trova il punto 2; se andiamo a qualche altro punto otteniamo una riposta diversa. Chiameremo questa funzione di posizione U(x, y, z), e quando ci riferiremo a qualche particolare punto 2, le cui coordinate siano (x 2, y2, z2 ), scriveremo U(2), come abbreviazione di U(x 2, y2, z2 ). Il lavoro compiuto per andare dal punto 1 al punto P può essere scritto anche andando in senso inverso lungo il cammino di integrazione, invertendo tutti i ds. Cioè il lavoro fatto per andare da 1 a P è uguale al lavoro fatto per andare da P a 1 cambiato di segno: ⌅ P ⌅ 1 ⌅ 1 F · ds = F · ( ds) = F · ds 1

P

P

Così il lavoro fatto andando da P a 1 è U(1), e da P a 2 è U(2). Quindi l’integrale da 1 a 2 è uguale a U(2) più ( U(1) in senso inverso), ossia +U(1) U(2): ⌅ 1 ⌅ 2 U(1) = F · ds U(2) = F · ds P



1

P

2

F · ds = U(1)

U(2)

(14.1)

La quantità U(1) U(2) è detta variazione dell’energia potenziale, e noi chiamiamo U l’energia potenziale. Diremo che quando l’oggetto è situato nella posizione 2, esso ha energia potenziale U(2), mentre nella posizione 1 ha energia potenziale U(1). Se è posto nella posizione P, ha energia potenziale zero. Se avessimo usato un altro punto, diciamo Q invece di P, risulterebbe (e lo lasceremo a voi da dimostrare) che l’energia potenziale è cambiata solo per l’aggiunta di una costante. Poiché la conservazione dell’energia dipende soltanto dalle variazioni, non ha importanza se aggiungiamo una costante all’energia potenziale. Quindi il punto P è arbitrario. Ora abbiamo le due affermazioni seguenti: 1 il lavoro prodotto da una forza è uguale alla variazione dell’energia cinetica della particella; 2 matematicamente, per una forza conservativa, il lavoro fatto è la variazione cambiata di segno di una funzione U, che chiamiamo energia potenziale. Come conseguenza di queste due, arriviamo all’affermazione che se agiscono soltanto forze conservative, la somma dell’energia cinetica T e dell’energia potenziale U rimane costante: T + U = cost.

(14.2)

Discutiamo ora le formule per l’energia potenziale in un certo numero di casi. Se abbiamo un campo gravitazionale uniforme, cioè se non andiamo ad altezze paragonabili al raggio della Terra, allora la forza è una forza costante verticale e il lavoro fatto è semplicemente la forza per la distanza verticale. Quindi U(z) = mgz (14.3)

14.3 • Forze conservative

© 978-8808-22107-0

e il punto P, che corrisponde al valore zero di energia potenziale, è un qualsiasi punto nel piano z = 0. Avremmo anche potuto dire che l’energia potenziale è mg(z 6), se avessimo voluto: nella nostra analisi tutti i risultati sarebbero naturalmente gli stessi, tranne il valore dell’energia potenziale a z = 0, che sarebbe 6 mg. Questo non cambia niente perché nell’energia potenziale contano solo le differenze. L’energia necessaria per comprimere una molla lineare a distanza x dal punto d’equilibrio è U(x) =

1 2 kx 2

(14.4)

e lo zero dell’energia potenziale è nel punto x = 0, la posizione di equilibrio della molla. Potremmo ancora una volta aggiungere qualsiasi costante vogliamo. L’energia potenziale di gravitazione per masse puntiformi M e m, poste a distanza r l’una dall’altra, è Mm U(r) = G (14.5) r La costante è stata scelta in modo che il potenziale sia zero all’infinito. Naturalmente la stessa formula si applica alle cariche elettriche, perché è la stessa legge: U(r) =

1 q1 q2 4⇡✏ 0 r

(14.6)

Usiamo ora realmente una di queste formule, per vedere se capiamo che cosa significa. Problema: con quale velocità dobbiamo lanciare un razzo dalla Terra perché se ne allontani? Soluzione: la somma dell’energia cinetica e dell’energia potenziale deve essere costante; quando sarà lontano milioni di miglia, e quando è appena in grado di andarsene, supponendo che in questa condizione sia appena in grado di muoversi, cioè abbia una velocità prossima a zero. Sia a il raggio della Terra e M la sua massa. L’energia cinetica più l’energia potenziale è allora inizialmente data da 1 mM mv 2 G 2 a Al termine del moto le due energie devono essere uguali. L’energia cinetica è presa in modo da essere zero alla fine del moto, poiché si suppone che il razzo si allontani appena, a velocità praticamente zero, e l’energia potenziale è GmM divisa per l’infinito, che fa zero. Quindi il termine costante è zero, e questo ci dice che il quadrato della velocità deve essere 2GM/a. Ma GM/a2 è ciò che chiamiamo accelerazione di gravità g, quindi v 2 = 2ga A che velocità deve viaggiare un satellite per mantenersi in orbita attorno alla Terra? Abbiamo già 2 calcolato questo in precedenza p e abbiamo trovato che v = GM/a. Quindi per allontanarci dalla Terra abbiamo bisogno di 2 volte la velocità che ci occorre per girare attorno alla Terra vicino alla sua superficie. Abbiamo bisogno, in altre parole, di due volte più energia (poiché l’energia va come il quadrato della velocità) per lasciare la Terra, di quanta ne occorre per girarle attorno. E infatti la prima esperienza che storicamente è stata fatta con i satelliti fu di mandarne uno attorno alla Terra, il che ha richiesto una velocità di 5 miglia per secondo. Successivamente ne fu lanciato uno allontanandolo permanentemente dalla Terra e ciò richiese il doppio di energia, cioè una velocità di circa 7 miglia per secondo. Continuando la nostra discussione sulle caratteristiche dell’energia potenziale, consideriamo l’interazione di due molecole, o due atomi, per esempio due atomi di ossigeno. Quando essi sono molto distanti, la forza è una forza di attrazione, che varia inversamente alla settima potenza della distanza, e quando sono molto vicini la forza è una repulsione molto grande. Se integriamo l’inverso della settima potenza per ricavare il lavoro fatto, troviamo che l’energia potenziale U, che è una funzione della distanza radiale fra i due atomi di ossigeno, per grandi distanze varia inversamente alla sesta potenza della distanza. Se tracciamo la curva dell’energia potenziale U(r) come in FIGURA 14.3, cominciamo così a grandi r con l’inverso della sesta potenza, ma, se riduciamo progressivamente la distanza,

145

146

Capitolo 14 • Lavoro ed energia potenziale (2)

© 978-8808-22107-0

raggiungiamo un punto d dove vi è un minimo di energia potenziale. Il minimo di energia potenziale a r = d significa questo: se partiamo da d e ci spostiamo di un piccolo tratto, una distanza piccolissima, il lavoro fatto, che è la variazione nell’energia potenziale quando ci spostiamo di questa r distanza, è pressoché zero, perché la variazione dell’energia potenziale al minimo della curva è molto piccola. In questo punto non vi è forza e dunque questo è il punto di equilibrio. Un altro modo di vedere che questo è il punto U (r ) 1/r 6 se r >> d di equilibrio è che allontanarsi da d in qualsiasi direzione richiede lavoro. d Quando i due atomi di ossigeno si sono stabilizzati, cosicché non possa più essere liberata energia dalla forza che si esercita fra loro, essi si trovano nello stato di energia più bassa e saranno a questa distanza d. Questo è il FIGURA 14.3 L’energia potenziale fra due atomi in funzione della loro distanza. modo in cui appare una molecola di ossigeno quando è fredda. Quando la scaldiamo, gli atomi si agitano e si allontanano e infatti possiamo separarli, ma ciò richiede una certa quantità di lavoro o energia, che è la differenza di energia potenziale fra r = d e r = 1. Quando cerchiamo di spingere gli atomi molto vicini l’uno all’altro, l’energia sale molto rapidamente, perché essi si respingono reciprocamente. La ragione per cui mettiamo in evidenza questo fatto è che l’idea di forza non è particolarmente adatta alla meccanica quantistica; è molto più naturale l’idea di energia. Troviamo che, benché le forze e le velocità si «dissolvano» e scompaiano quando consideriamo le più avanzate forze tra la materia nucleare e fra le molecole e così via, il concetto di energia rimane. Quindi troviamo curve di energia potenziale nei libri di meccanica quantistica, ma molto raramente vediamo una curva relativa alla forza fra due molecole, poiché a quel punto le persone che si occupano di questi problemi pensano in termini di energia più che di forza. Proseguendo notiamo che se più forze conservative agiscono su un oggetto nello stesso tempo, allora l’energia potenziale dell’oggetto è la somma delle energie potenziali di ciascuna delle singole forze. Questa è la stessa affermazione ricordata prima, poiché se la forza può essere rappresentata come somma vettoriale di forze, allora il lavoro fatto dalla forza totale è la somma dei lavori fatti dalle forze parziali, e può essere analizzato come variazione delle energie potenziali di ognuna di esse separatamente. Così l’energia potenziale totale è la somma di tanti piccoli contributi. Potremmo generalizzare ciò al caso di un sistema di parecchi oggetti interagenti l’uno con l’altro, quali Giove, Saturno, Urano ecc., oppure ossigeno, azoto, carbonio ecc., che agiscono l’uno sull’altro a coppie con forze che sono tutte conservative. In queste circostanze, l’energia cinetica dell’intero sistema è semplicemente la somma delle energie cinetiche di tutti i singoli atomi o pianeti, o qualsiasi altra cosa, e l’energia potenziale del sistema è la somma, relativamente alle coppie di particelle, dell’energia potenziale della mutua interazione di ogni singola coppia, come se le altre non ci fossero. (Questo in realtà non è corretto per le forze molecolari, e la formula è qualcosa di più complicato; certamente è esatto per la gravitazione di Newton, ed è giusto come approssimazione anche per le forze molecolari. Per le forze molecolari vi è un’energia potenziale, ma è talvolta una funzione delle posizioni degli atomi più complicata di una semplice somma di termini di coppie.) Nel caso speciale della gravità, quindi, l’energia potenziale è la somma, su tutte le coppie i e j, dei termini Gmi m j /r i j , come indicato nell’equazione (13.14). L’equazione (13.14) esprime matematicamente la seguente affermazione: la somma dell’energia cinetica totale e dell’energia potenziale totale non cambia col tempo. Quando i vari pianeti ruotano, percorrendo le loro orbite e spostandosi reciprocamente, se calcoliamo l’energia cinetica totale e l’energia potenziale totale, troviamo che la loro somma rimane costante. U (r )

14.4

Forze non conservative

Abbiamo dedicato un tempo considerevole per discutere le forze conservative; che cosa diremo delle forze non conservative? Approfondiremo l’argomento più di quanto non si faccia solitamente, e arriveremo alla conclusione che non esistono forze non conservative! In realtà, tutte

© 978-8808-22107-0

14.4 • Forze non conservative

le forze fondamentali nella natura appaiono conservative. Questa non è una conseguenza delle leggi di Newton. Infatti, per quanto ne sapeva Newton, le forze avrebbero potuto essere non conservative, come apparentemente è l’attrito. Quando diciamo che l’attrito apparentemente lo è, usiamo un punto di vista moderno, essendo stato scoperto che tutte le forze elementari, le forze fra le particelle a livello fondamentale, sono conservative. Se, per esempio, analizziamo un sistema quale il grande ammasso globulare stellare che abbiamo visto in fotografia, con migliaia di stelle tutte interagenti, allora la formula per l’energia potenziale totale è semplicemente un termine più un altro termine ecc., sommati su tutte le coppie di stelle, e l’energia cinetica è la somma di tutte le energie cinetiche di tutte le stelle prese individualmente. Ma l’ammasso globulare vaga, come un tutto, anche nello spazio e, se fossimo abbastanza lontani da esso e non ne vedessimo i dettagli, potremmo pensarlo come oggetto singolo. Quindi, se vi fossero forze applicate a esso, alcune di queste forze potrebbero finire per spingerlo in avanti come un tutto, e noi vedremmo il centro dell’insieme in movimento. D’altra parte, alcune delle forze potrebbero essere, per così dire, «sprecate» per aumentare l’energia cinetica o potenziale delle «particelle» che compongono il sistema. Supponiamo, per esempio, che l’azione di queste forze faccia espandere l’intero ammasso stellare e faccia muovere più in fretta le particelle. L’energia totale dell’intero sistema è in realtà conservata, ma vista dall’esterno, coi nostri occhi imperfetti che non possono penetrare la confusione dei moti interni, e pensando semplicemente all’energia cinetica del moto dell’intero oggetto come se fosse un’unica particella, potrebbe sembrare che l’energia non si conservi, ma questo è dovuto a una lacuna nella valutazione di ciò che vediamo. E infatti così risulta essere: l’energia totale dell’universo, cinetica più potenziale, è una costante quando la osserviamo abbastanza accuratamente. Quando studiamo la materia con più dettaglio, a livello atomico, non è sempre facile separare l’energia totale di una cosa in due parti, energia cinetica ed energia potenziale, e tale separazione non è sempre necessaria. È quasi sempre possibile farlo, così diciamo che è sempre possibile, e che l’energia potenziale più l’energia cinetica dell’universo è costante. Dunque l’energia totale potenziale-più-cinetica insita nella terra è costante, e se la «terra» è una parte di materia isolata, l’energia è costante se non vi sono forze esterne. Ma, come abbiamo visto, una parte di energia cinetica o potenziale può essere interna (per esempio, i moti interni delle molecole), nel senso che non la notiamo. Sappiamo che in un bicchiere d’acqua ogni cosa è in agitazione, tutte le parti sono continuamente in movimento, così vi è una certa energia cinetica interna, alla quale ordinariamente possiamo non prestare attenzione. Non notiamo il moto degli atomi che produce calore, e così non lo chiamiamo energia cinetica, ma il calore è fondamentalmente energia cinetica. L’energia potenziale interna può anche essere sotto forma, per esempio, di energia chimica: quando bruciamo benzina si libera energia, perché le energie potenziali degli atomi nella nuova sistemazione atomica sono minori che nella sistemazione precedente. Non è strettamente possibile trattare il calore come se fosse pura energia cinetica, perché c’entra un po’ della potenziale, e viceversa per l’energia chimica; così riuniamo le due energie e diciamo che l’energia totale cinetica e potenziale insita in un oggetto è parte calore e parte energia chimica, e così via. In ogni modo, tutte queste differenti forme di energia interna sono talvolta considerate come energie «perse» nel senso descritto prima; ciò sarà chiarito quando studieremo la termodinamica. Come altro esempio, consideriamo che quando c’è attrito non è vero che l’energia cinetica va perduta, anche se un oggetto che scivola si ferma e l’energia cinetica sembra scomparire. L’energia cinetica, infatti, non va perduta perché gli atomi all’interno si agitano con energia cinetica maggiore di prima e, benché non possiamo vederlo, possiamo misurarlo determinando la temperatura. Naturalmente se ignoriamo l’energia termica, il teorema della conservazione dell’energia appare falso. Un’altra situazione in cui la conservazione dell’energia non sembra vera è quando studiamo soltanto parte di un sistema. Naturalmente il teorema della conservazione dell’energia non apparirà valido se qualcosa sta interagendo con qualcos’altro all’esterno e noi ci dimentichiamo di tener conto di tale interazione. Nella fisica classica l’energia potenziale implica soltanto gravitazione ed elettricità, ma oggi abbiamo l’energia nucleare e anche altre forme di energia. La luce, per esempio, implicherebbe una nuova forma di energia nella teoria classica, ma possiamo anche immaginare, se vogliamo,

147

148

Capitolo 14 • Lavoro ed energia potenziale (2)

© 978-8808-22107-0

che l’energia associata alla luce sia l’energia cinetica di un fotone, e allora la nostra formula (14.2) rimarrebbe esatta.

14.5

Potenziali e campi

Discuteremo ora alcune idee legate all’energia potenziale e al concetto di campo. Supponiamo di avere due grandi oggetti A e B e un terzo oggetto molto piccolo che sia attratto gravitazionalmente dai due con una certa forza risultante F. Abbiamo già notato nel capitolo 12 che la forza gravitazionale agente su una particella può essere scritta come il prodotto della sua massa m per un altro vettore C, che dipende soltanto dalla posizione della particella: F = mC Possiamo analizzare la gravitazione, allora, immaginando che vi sia un certo vettore C in ogni posizione dello spazio che «agisce» su qualsiasi massa che vi poniamo, ma che esiste per se stesso sia che noi in realtà gli forniamo una massa su cui «agire» o meno. C ha tre componenti, e ciascuna di queste componenti è una funzione di (x, y, z), una funzione della posizione nello spazio. Chiamiamo campo una cosa del genere, e diciamo che gli oggetti A e B generano il campo, cioè che essi «producono» il vettore C. Quando un oggetto è posto in un campo, la forza su di esso è uguale alla sua massa per il valore del vettore campo nel punto dove è posto l’oggetto. Possiamo fare lo stesso con l’energia potenziale. Poiché l’energia potenziale, l’integrale di ( forza) · (ds), può essere scritta come m per l’integrale di ( campo) · (ds), una semplice variazione di scala, vediamo che l’energia potenziale U(x, y, z) di un oggetto situato in un punto (x, y, z) dello spazio può essere scritta come m volte un’altra funzione che possiamo chiamare potenziale . L’integrale ⌅ C · ds =

è proprio come l’integrale



F · ds = U

e fra i due vi è soltanto un fattore di scala: ⌅ ⌅ U= F · ds = m C · ds = m

(14.7)

Conoscendo questa funzione (x, y, z) in ogni punto dello spazio, possiamo calcolare immediatamente l’energia potenziale di un oggetto in ogni punto dello spazio, vale a dire U(x, y, z) = m (x, y, z) Un lavoro piuttosto banale, sembra. Ma in realtà non è banale, poiché talvolta è molto più semplice descrivere il campo dando il valore di per ogni punto dello spazio, piuttosto che dare C. Al posto di tre complicate componenti di una funzione vettoriale, possiamo scrivere la funzione scalare . Inoltre è molto più facile calcolare , che le singole componenti di C, quando il campo è prodotto da parecchie masse, dato che il potenziale è uno scalare che sommiamo semplicemente, senza preoccuparci della direzione. Inoltre il campo C può essere ricavato facilmente da , come vedremo presto. Supponiamo di avere le masse puntiformi m1, m2, . . . nei punti 1, 2, . . . e di voler conoscere il potenziale in un certo punto arbitrario p. Esso è semplicemente la somma dei potenziali in p dovuti alle singole masse prese una per una: (p) =

X Gmi r ip i

i = 1, 2, . . .

(14.8)

14.5 • Potenziali e campi

© 978-8808-22107-0

Nell’ultimo capitolo abbiamo usato questa formula, che dà il potenziale come la somma dei potenziali dovuti a tutti i diversi oggetti, per calcolare a il potenziale dovuto a un guscio sferico di materia, sommando in un punto i contributi al potenziale di tutte le parti del guscio. Il risultato di questo calcolo è mostrato graficamente nella FIGURA 14.4. Esso è negativo, ha il (r ) = –Gm /r valore zero per r = 1 e varia come 1/r fino al raggio a, quindi è costante all’interno. All’esterno del guscio il potenziale è Gm/r, dove m è la (r ) = cost. = –Gm /a massa del guscio, che è esattamente lo stesso di come sarebbe stato se tutta la massa fosse situata al centro. Ma non è esattamente lo stesso in tutti i punti, perché all’interno del guscio il potenziale risulta essere Gm/a, FIGURA 14.4 Potenziale prodotto da un ed è una costante! Quando il potenziale è costante, non vi è campo, ossia guscio sferico di raggio a. quando l’energia potenziale è costante non vi è forza, perché se muoviamo un oggetto da un punto all’altro in qualsiasi posto all’interno della sfera, il lavoro fatto dalla forza è esattamente zero. Perché? Perché il lavoro fatto muovendo l’oggetto da un punto all’altro è uguale a meno la variazione dell’energia potenziale (ossia, il corrispondente integrale di campo è la variazione del potenziale). Ma l’energia potenziale è la stessa in ogni coppia di punti interni, così la variazione di energia potenziale è zero, e quindi non si esegue lavoro andando da un qualsiasi punto all’altro all’interno del guscio. Il solo modo perché il lavoro possa essere zero per tutte le direzioni dello spostamento è che non vi siano assolutamente forze. Questo ci dà un’indicazione di come possiamo ottenere la forza o il campo, data l’energia potenziale. Supponiamo che l’energia potenziale di un oggetto sia conosciuta nella posizione x, y, z e che desideriamo conoscere qual è la forza agente sull’oggetto. Non sarà sufficiente conoscere il potenziale solo in questo punto, come vedremo; è richiesta la conoscenza del potenziale anche nei punti vicini. Perché? Come possiamo calcolare la componente x della forza? (Se possiamo farlo, naturalmente, possiamo trovare anche le componenti y e z, e conosceremo allora l’intera forza.) Ora, se spostassimo un oggetto di un piccolo tratto x, il lavoro prodotto dalla forza sull’oggetto sarebbe la componente x della forza per x, se x è sufficientemente piccolo, e questo sarebbe uguale alla variazione dell’energia potenziale nell’andare da un punto all’altro: W= Abbiamo usato semplicemente la formula ⌅

U = Fx x

F · ds =

(14.9)

U

ma per un tratto molto piccolo. Ora dividiamo per x e così troviamo che la forza è Fx =

U x

(14.10)

Naturalmente questo non è esatto, ciò che in realtà vogliamo è il limite dell’equazione (14.10) quando x diventa sempre più piccolo, poiché essa è esatta soltanto al limite di un x infinitesimo. Riconosciamo questa come la derivata di U rispetto a x e saremmo quindi portati a scrivere dU/dx. Ma U dipende da x, y e z e i matematici hanno inventato un diverso simbolo per ricordarci di stare molto attenti quando differenziamo una funzione del genere, per ricordarci che stiamo considerando che solo x varia, mentre y e z non variano. Invece di una «d» essi fanno semplicemente un «6 al contrario», ossia «@». (La «@» avrebbe dovuto essere usata fin dall’inizio del calcolo perché siamo sempre tentati di cancellare la «d», ma non cancelleremmo mai una «@»!) Così essi scrivono @U/@ x; inoltre, in casi di necessità, se vogliono essere molto precisi, segnano accanto una linea con un piccolo yz in basso: (@U/@ x|yz ), che significa «fare la derivata di U rispetto a x, mantenendo y e z costanti». Molto spesso tralasceremo di segnare che cosa rimane costante perché ciò è di solito evidente dal contesto, così comunemente non useremo la linea con y e z. Però useremo sempre una «@» invece di una «d», come avvertimento che si tratta di una derivata con qualche altra variabile tenuta costante. Essa viene chiamata derivata parziale; è una derivata in cui variamo soltanto x.

149

r

150

Capitolo 14 • Lavoro ed energia potenziale (2)

© 978-8808-22107-0

Quindi, troviamo che la forza in direzione x è uguale a meno la derivata parziale di U rispetto a x: @U Fx = (14.11) @x In modo simile la forza in direzione y può essere trovata differenziando U rispetto a y, mantenendo x e z costanti, e la terza componente, naturalmente, è la derivata rispetto a z mantenendo y e x costanti: @U @U Fy = Fz = (14.12) @y @z Questo è il modo per arrivare dall’energia potenziale alla forza. Otteniamo il campo dal potenziale esattamente allo stesso modo: Cx =

@ @x

Cy =

@ @y

Cz =

@ @z

(14.13)

Incidentalmente, ricorderemo qui un’altra notazione che in realtà non useremo per un bel po’ di tempo: poiché C è un vettore e ha componenti x, y e z, i simboli @/@ x, @/@ y e @/@z che producono le componenti x, y e z sono qualcosa di simile ai vettori. I matematici hanno inventato un nuovo magnifico simbolo, r, detto «grad» o «gradiente», che non è una quantità, ma un operatore che genera un vettore da uno scalare. Esso ha le seguenti «componenti»: la componente x è @/@ x, la componente y è @/@ y e la componente z è @/@z; quindi possiamo scrivere le formule precedenti nel modo seguente: F = rU (14.14) C= r

L’uso di r ci dà un modo rapido di verificare se abbiamo una reale equazione vettoriale o meno, ma in realtà le equazioni (14.14) hanno lo stesso significato delle equazioni (14.11), (14.12) e (14.13); è solo un altro modo di scriverle, e poiché non vogliamo scrivere tre equazioni ogni volta, scriviamo invece rU. Un ulteriore esempio di campi e di potenziali riguarda l’elettricità. Nel caso dell’elettricità la forza su un oggetto stazionario è la carica per il campo elettrico: F = qE. (In generale, naturalmente, la componente x della forza in un problema elettrico ha anche una parte che dipende dal campo magnetico. È facile dimostrare dall’equazione (12.10) che la forza su una particella causata da campi magnetici è sempre perpendicolare alla velocità, e anche perpendicolare al campo. Poiché la forza dovuta al magnetismo su una carica in movimento è perpendicolare alla velocità, non viene eseguito lavoro dal magnetismo su una carica in movimento, essendo il moto normale alla forza. Quindi nel calcolare i teoremi dell’energia cinetica in campi elettrici e magnetici, possiamo trascurare il contributo del campo magnetico poiché esso non cambia l’energia cinetica.) Supponiamo che vi sia soltanto un campo elettrico. Allora possiamo calcolare l’energia, ossia il lavoro fatto, nello stesso modo usato per la gravità, e calcoliamo una quantità che è meno l’integrale di E · ds, da un punto fisso arbitrario al punto in cui facciamo il calcolo; l’energia potenziale in un campo elettrico è proprio la carica per questa quantità : ⌅ (r) = E · ds U=q Prendiamo come esempio il caso di due piastre parallele di metallo, ognuna con una carica superficiale di ± per area unitaria. Questo dispositivo viene definito condensatore ad armature parallele. In precedenza abbiamo trovato che vi è forza zero all’esterno delle piastre e che vi è un campo elettrico costante fra di esse, diretto dal + al e di intensità /✏ 0 (FIGURA 14.5). Vorremmo sapere quanto lavoro dovrebbe essere fatto per trasportare una carica da un’armatura all’altra. Il lavoro sarebbe l’integrale di (forza) · (ds), che può essere scritto come la carica per il valore del potenziale sulla piastra 1 meno il valore del potenziale sulla piastra 2: ⌅ 2 W= F · ds = q( 1 2) 1

14.5 • Potenziali e campi

© 978-8808-22107-0

151

Possiamo in realtà calcolare l’integrale perché la forza è costante e, se chiamiamo d la distanza fra le armature, allora l’integrale è facile: ⌅

1

2

q F · ds = ✏0



1

2

dx =

q d ✏0

La differenza di potenziale, = d/✏ 0 , è detta differenza di tensione, e è misurato in volt. Quando diciamo che una coppia di armature è caricata a una certa tensione, ciò che intendiamo è che la differenza di potenziale elettrico fra le due piastre è di tanti volt. Per un condensatore costituito da due armature parallele con una carica superficiale ± , la tensione, ossia la differenza di potenziale, della coppia di armature è d/✏ 0 .

+

1

+

+

+

+

+

+

+

+

+

+

+

E

2

FIGURA

d





14.5





















Campo fra armature parallele.

15

La teoria speciale della relatività

15.1

Il principio di relatività

Per oltre duecento anni le equazioni del moto enunciate da Newton furono ritenute in grado di descrivere correttamente la natura, e la prima volta che fu scoperto un errore in queste leggi, fu pure trovato il modo di correggerlo. Entrambi, errore e correzione, furono scoperti da Einstein nel 1905. La seconda legge di Newton, che abbiamo espresso con l’equazione F=

d (mv) dt

fu enunciata con il tacito presupposto che m sia una costante, ma ora sappiamo che ciò non è vero, e che la massa di un corpo cresce con la velocità. Nella formula corretta di Einstein m è espressa dalla relazione m0 m= r (15.1) v2 1 c2 dove la «massa a riposo» m0 rappresenta la massa di un corpo che non è in movimento e c è la velocità della luce, che vale circa 3 · 105 km/s, corrispondenti a circa 186 000 miglia/s. (Per coloro che desiderano impararne quel tanto che basta per risolvere problemi, questo è tutto quello che c’è nella teoria della relatività: essa cambia le leggi di Newton introducendo un fattore di correzione alla massa.) Dalla formula (15.1) è facile vedere che l’aumento di massa con la velocità è piccolissimo in circostanze comuni. Se la velocità è grande perfino quanto quella di un satellite che orbita attorno alla Terra a 5 miglia/s, allora v/c = 5/186 000: l’introduzione di questo valore nella formula mostra che la correzione relativa alla massa è soltanto di uno su due o tre miliardi, il che è quasi impossibile da osservare. In realtà, la validità della formula è stata ampiamente confermata dall’osservazione di diversi tipi di particelle, che si muovono a velocità che si estendono praticamente fino alla velocità della luce. Però, poiché l’effetto è ordinariamente così piccolo, appare notevole il fatto che sia stato scoperto teoricamente prima che sperimentalmente. Empiricamente, a una velocità sufficientemente elevata, l’effetto è molto grande, ma non fu scoperto in questo modo. Quindi è interessante vedere come una legge che implicava una modifica tanto delicata (al tempo della sua scoperta) sia stata messa in luce da una combinazione di esperimenti e di ragionamenti di fisica. Contributi alla scoperta furono portati da numerosi scienziati, il cui lavoro, come risultato finale, portò alla teoria di Einstein sulla relatività. In realtà vi sono due teorie di Einstein sulla relatività. Questo capitolo riguarda la teoria speciale della relatività, che risale al 1905. Nel 1915 Einstein pubblicò una teoria aggiuntiva, detta teoria generale della relatività. Questa teoria successiva si occupa dell’estensione della teoria speciale al caso della legge di gravitazione; non discuteremo qui la teoria generale. Il principio di relatività fu enunciato la prima volta da Newton, in uno dei suoi corollari sulle leggi del moto: «I moti dei corpi all’interno di un dato spazio sono gli stessi fra loro, sia che lo spazio sia in quiete sia che si muova uniformemente in linea retta». Ciò significa, per esempio, che se una nave spaziale sta muovendosi a velocità uniforme, tutti gli esperimenti fatti nella nave

15.1 • Il principio di relatività

© 978-8808-22107-0

spaziale e tutti i fenomeni nella nave spaziale appariranno gli stessi come se la nave non fosse in movimento, purché, naturalmente, non si guardi all’esterno. Questo è il significato del principio di relatività. Si tratta di un’idea abbastanza semplice, e il solo problema è se sia vero che in tutti gli esperimenti eseguiti all’interno di un sistema in movimento le leggi della fisica sono le stesse quali sarebbero se il sistema fosse immobile. Esaminiamo dapprima se le leggi di Newton appay y' iono le stesse nel sistema in movimento. Supponiamo Moe Joe che Moe sia in movimento in direzione x con una velocità uniforme u e che misuri la posizione di un P(x, y, z) certo punto P, mostrato in FIGURA 15.1. Egli indica la u «distanza x» del punto P, nel suo sistema di coordiP(x', y',z' ) nate, come x 0. Joe è immobile, e misura la posizione ut dello stesso punto, indicandone la coordinata nel suo O O' x sistema come x. La relazione delle coordinate nei due sistemi è chiara dal diagramma. Dopo il tempo t l’origine di Moe si è mossa di un tratto ut, e se i due FIGURA 15.1 Due sistemi di coordinate in moto relativo uniforme lungo i loro assi x. sistemi originariamente coincidevano, si ha: x0 = x y0 = y z0 = z t0 = t

ut (15.2)

Se sostituiamo questa trasformazione di coordinate nelle leggi di Newton troviamo che queste leggi si trasformano in leggi identiche nel sistema con apici; cioè le leggi di Newton hanno la stessa forma in un sistema in movimento e in un sistema fermo, quindi è impossibile distinguere, facendo esperimenti di meccanica, se il sistema è o no in movimento. Il principio di relatività è stato usato in meccanica per lungo tempo. Fu impiegato da vari scienziati, in particolare da Huygens, per ottenere le leggi relative alle collisioni fra palle da biliardo, circa nello stesso modo che abbiamo usato nel capitolo 10 per discutere la conservazione della quantità di moto. Nel secolo scorso l’interesse a questo riguardo fu accresciuto come risultato degli studi sui fenomeni dell’elettricità, del magnetismo e della luce. Una lunga serie di studi accurati di questi fenomeni eseguiti da parecchi scienziati culminò nelle equazioni di Maxwell del campo elettromagnetico, che descrivono elettricità, magnetismo e luce in un sistema uniforme. Però le equazioni di Maxwell non sembravano obbedire al principio di relatività. Cioè se trasformiamo le equazioni di Maxwell con la sostituzione espressa dalle equazioni (15.2), la loro forma non rimane la stessa; quindi, in una nave spaziale in movimento i fenomeni elettrici e ottici sarebbero diversi da quelli osservati in una nave ferma. Così si potrebbero usare questi fenomeni ottici per determinare la velocità della nave; in particolare si potrebbe determinare la velocità assoluta della nave facendo opportune misure ottiche o elettriche. Una delle conseguenze delle equazioni di Maxwell è che se vi è una perturbazione nel campo cosicché si generi luce, queste onde elettromagnetiche si propagano in tutte le direzioni allo stesso modo e alla stessa velocità c, ossia 300 000 km/s. Un’altra conseguenza delle equazioni di Maxwell è che se la sorgente della perturbazione è in movimento, la luce percorre lo spazio alla stessa velocità c. Questo è analogo al caso del suono, essendo la velocità delle onde sonore ugualmente indipendente dal moto della sorgente. Questa indipendenza dal moto della sorgente, nel caso della luce, propone un interessante problema. Supponiamo di essere in moto su un’automobile a una velocità u, e che della luce proveniente da dietro ci stia superando con velocità c. Differenziando la prima delle equazioni (15.2) si ha d x0 d x = dt dt

u

il cui significato è che, secondo la trasformazione galileiana, la velocità apparente della luce che ci oltrepassa, come la misuriamo sull’automobile, non dovrebbe essere c, ma c u. Per

153

x'

154

Capitolo 15 • La teoria speciale della relatività

© 978-8808-22107-0

esempio, se l’automobile sta facendo 100 000 miglia/s, e la luce va a 186 000 miglia/s, allora, apparentemente, la luce che sta oltrepassando la macchina dovrebbe percorrere 86 000 miglia/s. In ogni caso, misurando la velocità della luce che oltrepassa l’automobile (se la trasformazione galileiana è esatta per la luce), si potrebbe determinare la velocità dell’automobile stessa. Una quantità di esperimenti basati su questo concetto generale furono fatti per determinare la velocità della Terra, ma tutti fallirono: essi non portarono a determinare nessuna velocità. Dovremo discutere in dettaglio uno di questi esperimenti, per mostrare esattamente che cosa fu fatto e di che cosa si trattava; si trattava di qualcosa, naturalmente; c’era qualcosa di sbagliato nelle equazioni della fisica. Che cosa poteva essere?

15.2

La trasformazione di Lorentz

Quando il fallimento delle equazioni della fisica nel caso visto sopra venne alla luce, il primo pensiero fu che il guaio dovesse essere nelle nuove equazioni dell’elettrodinamica di Maxwell, che a quel tempo avevano soltanto vent’anni. Apparve ovvio che queste equazioni dovessero essere sbagliate, così la cosa da fare era cambiarle in un modo tale che, per la trasformazione galileiana, il principio di relatività fosse soddisfatto. Quando ciò fu tentato, i nuovi termini che dovevano essere introdotti nelle equazioni portarono a previsioni di nuovi fenomeni elettrici che non esistevano affatto quando furono cercati sperimentalmente, così questo tentativo dovette essere abbandonato. Allora gradualmente divenne chiaro che le leggi di Maxwell dell’elettrodinamica erano corrette, e l’errore doveva essere cercato altrove. Nello stesso tempo, H.A. Lorentz osservò una cosa notevole e curiosa quando fece le seguenti sostituzioni nelle equazioni di Maxwell: x x0 = r

1

ut u2 c2

y0 = y (15.3)

z0 = z t t0 = r

ux c2 u2 1 c2

vale a dire, le equazioni di Maxwell restano nella stessa forma quando questa trasformazione è applicata a esse! Le equazioni (15.3) sono conosciute come trasformazione di Lorentz. Einstein, seguendo un suggerimento avanzato originariamente da Poincaré, propose allora che tutte le leggi fisiche dovessero essere tali da rimanere invariate sotto una trasformazione di Lorentz. In altre parole, dovremmo cambiare non le leggi dell’elettrodinamica, ma le leggi della meccanica. Come dovremo cambiare le leggi di Newton perché rimangano invariate per la trasformazione di Lorentz? Se questo è lo scopo fissato, dobbiamo riscrivere le equazioni di Newton in modo che le condizioni che abbiamo imposto siano soddisfatte. Come risultò, la sola richiesta è che la massa m nelle equazioni di Newton deve essere sostituita dall’espressione data nell’equazione (15.1). Se viene fatto questo cambiamento, le leggi di Newton e le leggi dell’elettrodinamica vanno d’accordo. Dunque, se usiamo la trasformazione di Lorentz nel confrontare le misure di Moe con quelle di Joe, non saremo mai in grado di scoprire se l’uno o l’altro sia in movimento, perché la forma di tutte le equazioni sarà la stessa in entrambi i sistemi di coordinate! È interessante discutere che cosa significa il fatto che sostituiamo la vecchia trasformazione fra coordinate e tempo con una nuova trasformazione, poiché quella vecchia (di Galileo) appare evidente per se stessa e la nuova (di Lorentz) ha un aspetto strano. Vogliamo sapere se è logicamente e sperimentalmente possibile che la nuova, e non la vecchia, trasformazione possa essere

15.3 • L’esperimento di Michelson-Morley

© 978-8808-22107-0

155

corretta. Per dedurlo non è sufficiente studiare le leggi della meccanica ma, come fece Einstein, dobbiamo anche analizzare le nostre idee di spazio e di tempo per capire questa trasformazione. Dovremo discutere queste idee e le loro implicazioni nella meccanica abbastanza a lungo, così diciamo in anticipo che lo sforzo sarà giustificato, poiché i risultati si accordano con l’esperienza.

15.3

L’esperimento di Michelson-Morley

Come ricordato sopra, furono fatti tentativi per determinare la velocità assoluta della Terra attraverso l’ipotetico «etere» che si supponeva riempisse tutto lo spazio. Il più famoso di questi esperimenti è quello fatto da Michelson-Morley nel 1887. Occorsero 18 anni prima che i risultati negativi dell’esperimento fossero finalmente spiegati da Einstein. L’esperimento di Michelson-Morley fu eseguito con un dispositivo simile a quello mostrato schematicamente in FIGURA 15.2. Questa apparecchiatura consiste essenzialmente di una sorgente di luce A, una lastra di vetro parzialmente argentato B, e due specchi C ed E, il tutto montato su una base rigida. Gli specchi sono posti a uguali distanze L da B. La lastra B divide un fascio di luce che arriva, e i due fasci risultanti proseguono in direzioni fra loro perpendicolari, fino agli specchi, dove sono riflessi indietro verso B. Ritornando a B, i due fasci sono ricomposti come due fasci sovrapposti D e F. Se il tempo impiegato dalla luce per andare da B a E e ritorno è lo stesso tempo impiegato per andare da B a C e ritorno, i fasci emergenti D e F saranno in fase e si rinforzeranno l’un l’altro, ma se i due tempi sono lievemente diversi, i fasci saranno lievemente sfasati e si avrà interferenza. Se il dispositivo è «immobile» nell’etere, i tempi dovrebbero essere esattamente uguali, ma se esso è in movimento verso destra con velocità u, dovrebbe esserci una differenza nei tempi. Vediamo perché. Prima di tutto, calcoliamo il tempo necessario alla luce per andare da B a E e ritorno. Diciamo che il tempo perché la luce vada dalla lamina B allo specchio E è t 1 e il tempo per il ritorno è t 2 . Ora, mentre la luce viaggia da B allo specchio, il dispositivo si muove di un tratto ut 1 , così la luce

C

C'

L

u L B

A

B'

E

E'

Sorgente

Onde in fase

Onde fuori fase

∆x = 0

∆x > 0

15.2 Diagramma schematico dell’esperimento di Michelson-Morley. FIGURA

D F

D' F'

156

Capitolo 15 • La teoria speciale della relatività

© 978-8808-22107-0

deve percorrere una distanza L + ut 1 alla velocità c. Possiamo anche esprimere questa distanza come ct 1 , così abbiamo L ct 1 = L + ut 1 ossia t1 = c u (Questo risultato è ovvio anche dal punto di vista che la velocità della luce relativa all’apparecchiatura è c u, così il tempo è la lunghezza L divisa per c u.) In un modo simile può essere calcolato il tempo t 2 . Durante questo tempo la lamina B avanza di un tratto ut 2 , quindi il tratto di ritorno della luce è L ut 2 . Abbiamo pertanto ct 2 = L

ossia

ut 2

Il tempo totale è t1 + t2 =

t2 =

L c+u

2Lc c 2 u2

Per convenienza in un futuro confronto dei tempi, scriviamo questa relazione come t1 + t2 =

2L/c u2 1 c2

(15.4)

Il nostro secondo calcolo sarà per il tempo t 3 che la luce impiega per andare da B allo specchio C. Come prima, durante il tempo t 3 lo specchio C si sposta a destra di un tratto ut 3 , nella posizione C 0; nello stesso tempo, la luce percorre una distanza ct 3 lungo l’ipotenusa di un triangolo che è BC 0. Per questo triangolo rettangolo abbiamo (ct 3 )2 = L 2 + (ut 3 )2 ossia

⇣ u2 t 32 = c2

L 2 = c2 t 32

da cui otteniamo

t3 = p

L

c2

⌘ u2 t 32

u2

Per il viaggio di ritorno da C 0 la distanza è la stessa, come si può vedere dalla simmetria della figura; quindi anche il tempo di ritorno è lo stesso, e il tempo totale è 2t 3 . Con una piccola risistemazione formale possiamo scrivere 2t 3 = p

2L c2

u2

2L/c =r u2 1 c2

(15.5)

Siamo ora in grado di confrontare i tempi impiegati dai due fasci di luce. Nelle espressioni (15.4) e (15.5) i numeratori sono identici, e rappresentano il tempo che sarebbe impiegato se il dispositivo fosse immobile. Nei denominatori, il termine u2 /c2 sarà piccolo, a meno che u non sia di grandezza paragonabile a c. I denominatori rappresentano le modifiche nei tempi causate dal moto del dispositivo. E osservate che queste modifiche non sono le stesse: il tempo per andare a C e ritorno è un po’ minore del tempo per andare a E e ritorno, anche se gli specchi sono equidistanti da B, e tutto quello che dobbiamo fare è misurare con precisione tale differenza. Si presenta qui un punto tecnico di secondaria importanza: supponiamo che le due lunghezze L non siano esattamente uguali. In effetti non possiamo di sicuro renderle esattamente uguali. In tal caso ruotiamo semplicemente l’apparecchiatura di 90°, cosicché BC sia lungo la linea del moto e BE perpendicolare al moto. Qualsiasi piccola differenza di lunghezza diviene allora priva di importanza, e ciò che cerchiamo è uno slittamento nelle frange di interferenza quando ruotiamo il dispositivo. Nel realizzare l’esperimento, Michelson e Morley orientarono il dispositivo in modo che la linea BE fosse quasi parallela al moto della Terra lungo la sua orbita (in certi momenti del giorno

15.4 • Trasformazioni di tempo

© 978-8808-22107-0

e della notte). Questa velocità orbitale è di circa 18 miglia/s, e qualsiasi «velocità dell’etere» dovrebbe essere almeno altrettanto in un qualche momento del giorno o della notte e in un qualche periodo dell’anno. Il dispositivo era ampiamente sensibile per l’osservazione di un tale effetto, ma non fu trovata alcuna differenza di tempo: la velocità della Terra attraverso l’etere non poté essere rilevata. Il risultato dell’esperimento fu nullo. Il risultato dell’esperimento di Michelson-Morley fu molto imbarazzante e creò estremo turbamento. La prima fruttuosa idea per trovare una via di uscita dal vicolo cieco venne da Lorentz. Egli suggerì che i corpi materiali si contraggono quando sono in movimento e che tale accorciamento è soltanto nella direzione del moto e anche che, se la lunghezza è L 0 quando un corpo è fermo, allora quando si muove con velocità u parallela alla sua lunghezza, la nuova lunghezza che chiamiamo L k (L-parallela), è data da L k = L0

r

1

u2 c2

(15.6)

Quando questa modifica viene applicata all’interferometro di p Michelson-Morley la distanza da B a C non cambia, ma la distanza da B a E è diminuita fino a L 1 u2 /c2 . Quindi l’equazione (15.5) non è cambiata, ma la L dell’equazione (15.4) deve essere cambiata in accordo con l’equazione (15.6). Quando facciamo ciò otteniamo r 2L u2 1 c c2 = 2L/c t1 + t2 = (15.7) r 2 u u2 1 1 c2 c2 Paragonando questo risultato con l’equazione (15.5) vediamo che t 1 + t 2 = 2 t 3 . Così se il dispositivo si contrae nel modo descritto possiamo capire perché l’esperimento di MichelsonMorley non produce alcun risultato. Benché l’ipotesi della contrazione avesse felicemente spiegato il risultato negativo dell’esperimento, essa rimase esposta all’obiezione che fu inventata con l’espresso proposito di rendere ragione della difficoltà, e che era troppo artificiosa. Tuttavia in parecchi altri esperimenti fatti per scoprire un vento d’etere, nacquero simili difficoltà, finché fu chiaro che la natura stava «complottando» per contrastare l’uomo, introducendo un qualche fenomeno nuovo per annullare ogni fenomeno che egli pensava avrebbe permesso di misurare u. Infine, come fece notare Poincaré, fu riconosciuto il fatto che un complotto totale è esso stesso una legge di natura! Poincaré propose che vi fosse una legge di natura per effetto della quale non fosse possibile scoprire un vento d’etere con qualsiasi esperimento; il che vuol dire che non c’è modo di determinare una velocità assoluta.

15.4

Trasformazioni di tempo

Nel verificare se l’idea di contrazione è in armonia con i fatti di altri esperimenti, risulta che tutto si mostra corretto purché anche i tempi siano modificati nel modo espresso nella quarta equazione del gruppo (15.3). Questo perché il tempo t 3 , calcolato per il percorso da B a C e ritorno, non è lo stesso quando viene calcolato da un uomo che esegue l’esperimento in una navicella spaziale in movimento, rispetto a quando è calcolato da un osservatore fermo che sta guardando la navicella spaziale. Per l’uomo nella navicella il tempo è semplicemente 2L/c, ma per l’altro osservatore è (equazione (15.5)) 2L/c r u2 1 c2 In altre parole, quando chi è all’esterno vede l’uomo nella navicella spaziale che accende un sigaro, tutte le azioni appaiono più lente del normale, mentre per l’uomo all’interno, ogni cosa

157

158

Capitolo 15 • La teoria speciale della relatività

© 978-8808-22107-0

si muove con velocità normale. Così non soltanto devono accorciarsi le lunghezze, ma anche gli strumenti di misura del tempo («gli orologi») devono apparentemente rallentare. Cioè, quando l’orologio nella navicella spaziale segna il trascorrere di 1 secondo, come appare all’uomo nella navicella, esso mostra, all’uomo che sta fuori, un tempo pari a 1

secondi u2 1 c2 Questo rallentamento degli orologi in un sistema in movimento è un fenomeno molto strano e merita una spiegazione. Per capirlo dobbiamo osservare il meccanismo dell’orologio e vedere che cosa accade quando esso è in movimento. Poiché ciò è piuttosto difficile, prendiamo in considerazione un tipo di orologio molto semplice, ma piuttosto singolare (l’«orologio a luce»): si tratta di un’asta rigida con uno specchio a ciascuna delle due estremità; quando facciamo partire un segnale luminoso fra gli specchi, la luce continua ad andare su e giù facendo un click ogni volta che giunge in basso, come un normale orologio a tic-tac. Costruiamo due di tali orologi, esattamente con le stesse lunghezze, e sincronizziamoli facendoli partire insieme; essi Specchio allora vanno sempre d’accordo poiché hanno la stessa lunghezza, e la luce viaggia sempre a velocità c. Diamo uno di questi orologi all’uomo perché lo porti nella sua navicella spaziale, dove monta l’asta perpendicolarmente alla direzione di moto della navicella; in tal caso la lunghezza dell’asta non y' cambierà. Come sappiamo che le lunghezze perpendicolari non cambiano? Sistema D Gli uomini possono accordarsi per fare contrassegni su ciascuna delle aste S' x' dirette come l’asse y, quando si oltrepassano l’un l’altro. Per simmetria i due contrassegni devono trovarsi alle stesse coordinate y e y 0, perché altrimenti, quando si incontrano per confrontare i risultati, un segno sarà Impulso Impulso sopra o sotto l’altro, e potremmo dire chi era in realtà in movimento. ricevuto emesso (a) (fotocellula) (flash) Vediamo ora che cosa accade all’orologio in movimento. Prima di prenderlo a bordo, l’uomo si era convinto che era un buon orologio campione e durante il viaggio nella navicella spaziale egli non vedrà niente di strano. Se lo vedesse, saprebbe di essere in movimento: se qualsiasi cosa cambiasSpecchio se a causa del moto, egli potrebbe sapere di essere in movimento. Ma il principio di relatività dice che questo è impossibile in un sistema in mou /2 y to uniforme, quindi niente è cambiato. D’altra parte, quando l’osservatore Sistema all’esterno guarda l’orologio in moto, vede che la luce, nell’andare da uno S x D specchio all’altro, sta «in realtà» percorrendo un cammino a zig-zag, poiché c /2 c /2 l’asta si muove trasversalmente per tutto il tempo. Abbiamo già analizzato un tale moto a zig-zag a proposito dell’esperimento di Michelson-Morley. Se in un dato tempo l’asta si muove in avanti di un tratto proporzionale a u (FIGURA 15.3), la distanza che la luce percorre nello stessoptempo è Impulso Impulso u proporzionale a c, e quindi la distanza verticale è proporzionale a c2 u2 . emesso ricevuto Cioè occorre un tempo più lungo alla luce per andare da un’estremità (b) all’altra, nell’orologio in movimento, di quanto non occorra nell’orologio fermo. Quindi il tempo apparente fra i click è maggiore per l’orologio in movimento, nella stessa proporzione mostrata dall’ipotenusa del triangolo (che è l’origine delle espressioni sotto radice quadrata nelle nostre equazioc ni). Dalla figura è anche chiaro che, maggiore è u, più lentamente sembra ! c2 – u2 che funzioni l’orologio in movimento. Non soltanto questo particolare tipo di orologio funziona più lentamente, ma se è giusta la teoria della relatività, u (c) qualsiasi altro orologio, su qualsiasi principio si basi, sembrerebbe funzionare più lento e nella stessa proporzione: possiamo dirlo senza ulteriore FIGURA 15.3 (a) «Orologio a luce» in quiete analisi. Perché questo? nel sistema S 0 . (b) Lo stesso orologio in movimento Per rispondere a questa domanda, supponiamo di avere altri due orologi nel sistema S. (c) Illustrazione della traiettoria esattamente simili con ruote e corone dentate, oppure basati su un decadidiagonale percorsa dal fascio di luce in un «orologio a luce» in movimento. mento radioattivo, o su qualche altro principio. Sistemiamo questi orologi r

15.5 • La contrazione di Lorentz

© 978-8808-22107-0

in modo che entrambi funzionino in esatto sincronismo con i nostri primi orologi. Quando la luce va in alto e ritorna nei primi orologi e annuncia il suo arrivo con un click, anche i nuovi modelli completano un certo tipo di ciclo, che annunciano simultaneamente in coincidenza con un lampo, un bong o un altro segnale. Uno di questi orologi è portato nella navicella spaziale insieme a quello del primo tipo. Forse questo orologio non funzionerà più lentamente, ma continuerà a mantenere lo stesso ritmo della sua copia immobile, mostrandosi in disaccordo con l’altro orologio in movimento. Ma se così accadesse, l’uomo nella navicella potrebbe usare questo disaccordo fra i suoi due orologi per determinare la velocità della sua navicella, il che abbiamo supposto impossibile. Non abbiamo bisogno di sapere niente sul meccanismo del nuovo orologio che potrebbe produrre tale effetto: sappiamo semplicemente che qualsiasi sia la ragione, lo si vedrà andare indietro, proprio come il primo. Ora se tutti gli orologi in movimento funzionano più lentamente, se nessun modo di misurare il tempo produce altro risultato se non una minore rapidità, dovremo proprio dire, in un certo senso, che il tempo stesso appare più lento in una navicella spaziale. Tutti i fenomeni là – la frequenza del polso dell’uomo, i suoi processi di pensiero, il tempo che egli impiega per accendere un sigaro, il tempo che occorre per crescere e invecchiare – tutte queste cose devono essere rallentate nella stessa proporzione; poiché egli non può sapere di essere in movimento. I biologi e i medici talvolta dicono che non è del tutto certo che il periodo di sviluppo di un cancro sia più lungo in una navicella spaziale, ma dal punto di vista di un fisico moderno è quasi certo; altrimenti si potrebbe usare la rapidità di sviluppo di un cancro per determinare la velocità della navicella! Un esempio molto interessante del rallentamento del tempo con il moto è fornito dai mesoni mu (muoni), particelle che si disintegrano spontaneamente dopo una vita media di 2,2 · 10 6 s. Essi arrivano sulla Terra con i raggi cosmici e possono anche essere prodotti artificialmente in laboratorio. Alcuni di essi si disintegrano in aria, ma i rimanenti si disintegrano soltanto dopo aver incontrato un ostacolo materiale ed essersi fermati. È chiaro che, durante la sua breve vita, un muone non può percorrere, anche alla velocità della luce, molto più di 600 m. Ma benché i muoni siano creati nell’alta atmosfera, a circa 10 km di altezza, ciò nondimeno essi vengono trovati, nei raggi cosmici, in un laboratorio quaggiù. Come può essere? La risposta è che i diversi muoni si muovono a diverse velocità, alcune delle quali molto vicine alla velocità della luce. Mentre dal loro punto di vista essi vivono soltanto circa 2 µs, dal nostro punto di vista essi vivono molto più a lungo: abbastanzapa lungo da poter raggiungere la Terra. Il fattore di incremento del tempo è già stato dato come 1/ 1 u2 /c2 . La vita media è stata misurata molto accuratamente per i muoni di differenti velocità, e i valori sono in stretto accordo con la formula. Non sappiamo perché il mesone si disintegra e quale sia il suo meccanismo, ma sappiamo che il suo comportamento soddisfa il principio di relatività. Questa è l’utilità del principio di relatività: ci permette di fare previsioni anche su cose di cui altrimenti non sapremmo molto. Per esempio, prima di avere una qualsiasi idea su ciò che fa disintegrare il mesone, possiamo tuttavia predire che quando esso è in movimento a una velocità di p 9/10 della velocità della luce, la lunghezza apparente del tempo della sua durata è (2,2 · 10 6 )/ 1 92 /102 s; e la nostra predizione funziona: questo è il bello.

15.5

La contrazione di Lorentz

Ritorniamo ora alla trasformazione di Lorentz (15.3) e cerchiamo di ottenere una migliore comprensione della relazione tra i sistemi di coordinate (x, y, z, t) e (x 0, y 0, z 0, t 0), che chiameremo sistemi S e S 0, o sistemi di Joe e Moe rispettivamente. Abbiamo già notato che la prima equazione è basata sul suggerimento di Lorentz di contrazione nella direzione x; come possiamo provare che ha luogo una contrazione? Nell’esperimento di Michelson-Morley, ora valutiamo giustamente che il braccio trasversale BC non può cambiare lunghezza, per il principio di relatività; nondimeno il risultato nullo dell’esperimento richiede che i tempi debbano essere uguali. Così perché l’esperimento p dia risultato nullo, il braccio longitudinale BE deve apparire più corto, della radice quadrata 1 u2 /c2 . Che cosa significa questa contrazione in termini di misure fatte da Joe e

159

160

Capitolo 15 • La teoria speciale della relatività

© 978-8808-22107-0

da Moe? Supponiamo che Moe, muovendosi col sistema S 0 nella direzione x, stia misurando la coordinata x 0 di un certo punto, con un metro. Egli riporta il metro x 0 volte, cosicché pensa che la distanza sia x 0 metri. Dal punto di vista di Joe nel sistema S, però, Moe sta usando una riga accorciata, così la distanza «reale» misurata è s u2 x0 1 metri c2 Quindi se il sistema S 0 si è allontanato di una distanza ut dal sistema S, l’osservatore S direbbe che lo stesso punto, misurato nelle sue coordinate, è a una distanza s u2 x = x0 1 + ut c2 ossia

x x0 = r

ut

u2 c2 che è la prima equazione della trasformazione di Lorentz. 1

15.6

Simultaneità

In modo analogo, a causa della differenza nelle scale del tempo, l’espressione a denominatore è introdotta nella quarta equazione della trasformazione di Lorentz. Il termine più interessante in tale equazione è ux/c2 nel numeratore, perché è del tutto nuovo e inaspettato. Che cosa significa? Se osserviamo con attenzione la situazione, vediamo che eventi che avvengono in due posti separati nello stesso tempo, secondo quanto vede Moe in S 0, non accadono nello stesso tempo secondo quanto visto da Joe in S. Se un evento accade nel punto x 1 al tempo t 0 e un altro evento in x 2 al tempo t 0 (lo stesso tempo), troviamo che i due tempi corrispondenti t 10 e t 20 differiscono di una quantità u (x 1 x 2 ) 2 t 20 t 10 = c r u2 1 c2 Questa circostanza è detta «mancanza della simultaneità a distanza», e per rendere il concetto un po’ più chiaro consideriamo il seguente esperimento. Supponiamo che un uomo che si muove in una navicella spaziale (sistema S 0) abbia posto un orologio alle due estremità della navicella e sia interessato nell’assicurarsi che i due orologi siano in sincronismo. Come possono essere sincronizzati gli orologi? Vi sono diversi modi. Un modo che implica pochissimo calcolo consisterebbe, per prima cosa, nell’individuare con esattezza il punto di mezzo fra gli orologi. Quindi da questa base inviamo un segnale luminoso che percorrerà entrambi i cammini alla stessa velocità e arriverà a entrambi gli orologi, è chiaro, allo stesso tempo. Questo arrivo simultaneo dei segnali può essere usato per sincronizzare gli orologi. Supponiamo allora che l’uomo in S 0 sincronizzi i suoi orologi con questo particolare metodo. Vediamo se un osservatore nel sistema S sarebbe d’accordo sul sincronismo degli orologi. L’uomo in S 0 ha ragione di credere che lo sono, perché non sa di essere in movimento. Ma l’uomo in S argomenta che, poiché la navicella sta muovendosi in avanti, l’orologio a prua si sta allontanando dal segnale luminoso, quindi la luce deve percorrere più di mezzo cammino per raggiungerlo; l’orologio posteriore, invece, sta avanzando e va incontro al segnale luminoso, cosicché questa distanza risulta accorciata. Quindi il segnale raggiunge l’orologio posteriore prima, benché l’uomo in S 0 pensi che i segnali arrivino simultaneamente. Vediamo così che quando l’uomo nella navicella spaziale pensa che i tempi in due posizioni siano simultanei, uguali valori t 0 nel suo sistema di coordinate devono corrispondere a valori differenti di t in un altro sistema di coordinate!

15.8 • Dinamica relativistica

© 978-8808-22107-0

15.7

Quadrivettori

Vediamo cos’altro possiamo scoprire nella trasformazione di Lorentz. È interessante notare che la trasformazione fra gli x 0 e i t 0 è analoga nella forma alla trasformazione degli x e y che abbiamo studiato nel capitolo 11 per una rotazione di coordinate. Allora avevamo x 0 = x cos ✓ + y sen ✓ y 0 = y cos ✓ x sen ✓

(15.8)

in cui il nuovo x 0 e il nuovo y 0 combinano i vecchi x e y; similmente, nella trasformazione di Lorentz troviamo un nuovo x 0 che è una combinazione di x e t e un nuovo t 0 che è una combinazione di t e di x. Quindi la trasformazione di Lorentz è analoga a una rotazione; si tratta però di una «rotazione» nello spazio e nel tempo, che sembra uno strano concetto. Una verifica dell’analogia con la rotazione può essere fatta calcolando la quantità x0 2 + y0 2 + z0 2

c2 t 0 2 = x 2 + y 2 + z 2

c2 t 2

(15.9)

In questa equazione i primi tre termini di ogni membro rappresentano, nella geometria tridimensionale, il quadrato delle distanze tra un punto e l’origine (superficie di una sfera) che rimane immutato (invariante) indipendentemente dalla rotazione degli assi coordinati. Similmente, l’equazione (15.9) mostra che vi è una certa combinazione che include il tempo, che è invariante rispetto a una trasformazione di Lorentz. Così l’analogia con una rotazione è completa, ed è di un genere tale che i vettori, cioè quantità che implicano «componenti» che si trasformano nello stesso modo delle coordinate e del tempo, sono utili anche a proposito di relatività. Contempliamo così un’estensione del concetto di vettori, che abbiamo fin qui considerato aventi soltanto componenti spaziali, per includere una componente temporale. Cioè ci aspettiamo che vi saranno vettori con quattro componenti, tre delle quali sono simili alle componenti di un vettore comune, e a queste sarà associata una quarta componente che è l’analogo della parte temporale. Questo concetto sarà analizzato ulteriormente nei prossimi capitoli, dove troveremo che se i concetti del paragrafo precedente sono applicati alla quantità di moto, la trasformazione dà tre parti spaziali che sono simili alle componenti della comune quantità di moto, e una quarta componente, la parte temporale, che è l’energia.

15.8

Dinamica relativistica

Siamo ora pronti per indagare, più in generale, quale forma prendono le leggi della meccanica sotto la trasformazione di Lorentz. (Abbiamo fin qui spiegato come cambiano tempo e lunghezza, ma non come otteniamo la formula modificata per m, equazione (15.1). Faremo questo nel prossimo capitolo.) Per vedere le conseguenze della modifica di Einstein di m per la meccanica newtoniana, partiamo dalla legge newtoniana che la forza è la rapidità di variazione della quantità di moto, ossia d F= (mv) dt La quantità di moto è data ancora da mv, ma, quando usiamo il nuovo m, questa diviene p = mv = r

m0 v 1

v2 c2

(15.10)

Questa è la modifica di Einstein alle leggi di Newton. Con questa modifica, se azione e reazione rimangono uguali (esse possono non esserlo in dettaglio, ma lo sono in un lungo periodo), vi sarà conservazione della quantità di moto nello stesso modo di prima, ma la quantità che viene

161

162

Capitolo 15 • La teoria speciale della relatività

© 978-8808-22107-0

conservata non è il vecchio mv, con la sua massa costante, ma la quantità espressa dalla (15.10), che ha la massa modificata. Quando si fa questo cambiamento nella formula della quantità di moto, la conservazione della quantità di moto è ancora valida. Vediamo ora come varia la quantità di moto con la velocità. Nella meccanica newtoniana essa è proporzionale alla velocità e, secondo la (15.10), su un considerevole intervallo di velocità, ma piccolo rispetto a c; quasi lo stesso succede nella meccanica relativistica, perché l’espressione della radice quadrata differisce soltanto lievemente da 1. Ma quando v è quasi uguale a c, l’espressione della radice quadrata tende a zero, e quindi la quantità di moto va all’infinito. Che cosa accade se una forza costante agisce a lungo su un corpo? Nella meccanica newtoniana il corpo continua ad acquistare velocità finché va più veloce della luce. Ma ciò è impossibile nella meccanica relativistica. In relatività il corpo continua ad acquistare non velocità, ma quantità di moto, che può aumentare senza limite perché la massa è in aumento. Dopo un certo tempo non vi è praticamente più accelerazione nel senso di variazione della velocità, ma la quantità di moto continua ad aumentare. Naturalmente, ogni volta che una forza produce una variazione molto piccola della velocità di un corpo, diciamo che il corpo ha un bel po’ d’inerzia, e ciò è esattamente quello che dice la nostra formula per la massa relativistica (equazione (15.10)): essa dice che l’inerzia è molto grande quando v è grande quasi come c. Come esempio di questo effetto, si consideri che per deflettere gli elettroni ad alta velocità, nel sincrotrone che viene usato qui al Caltech, abbiamo bisogno di un campo magnetico che è 2000 volte più intenso di quello che ci saremmo aspettati in base alle leggi di Newton. In altre parole, la massa degli elettroni nel sincrotrone è 2000 volte la loro massa normale ed è grande quanto quella di un protone! Che m debba essere 2000 volte m0 significa che 1 v 2 /c2 deve essere 1/4 000 000, e ciò significa che v differisce da c di una parte su 8 000 000, quindi gli elettroni viaggiano piuttosto vicini alla velocità della luce. Se gli elettroni e la luce partissero entrambi dal sincrotrone (considerato lontano 200 m) e corressero verso il Bridge Lab, chi arriverebbe prima? La luce, naturalmente, perché la luce viaggia sempre più veloce(1) . Quanto prima? Questo è troppo difficile da dire; diciamo invece di quale distanza la luce è in testa: la distanza è di circa 1/40 di millimetro, ossia 1/4 dello spessore di un foglio di carta! Quando gli elettroni vanno a quella velocità le loro masse sono enormi, ma la loro velocità non può superare la velocità della luce. Osserviamo ora alcune ulteriori conseguenze della variazione relativistica della massa. Consideriamo il moto delle molecole in un piccolo serbatoio di gas. Quando il gas viene riscaldato la velocità delle molecole aumenta, quindi la massa è accresciuta e il gas è più pesante. Una formula approssimativa per esprimere l’aumento della massa, nel caso in cui la velocità sia piccola, può essere trovata sviluppando il termine m0 r

1

= m0 *1 v2 , c2

v2 + c2 -

1/2

in una serie di potenze, usando il teorema binomiale. Otteniamo m0 *1 ,

v2 + c2 -

1/2

1 v2 3 v4 = m0 *1 + + +...+ 2 c2 8 c4 , -

Vediamo chiaramente dalla formula che la serie converge rapidamente quando v è piccolo, e i termini dopo i primi due o tre sono trascurabili. Quindi possiamo scrivere ! 1 1 m m0 + m0 v 2 2 (15.11) 2 c nella quale il secondo termine del secondo membro esprime l’aumento di massa dovuto alla velocità molecolare. Quando la temperatura aumenta, v 2 aumenta proporzionalmente, così possiamo (1) Gli elettroni vincerebbero in realtà la gara contro la luce visibile a causa dell’indice di rifrazione dell’aria. Un raggio gamma se la caverebbe meglio.

15.9 • Equivalenza di massa ed energia

© 978-8808-22107-0

dire che l’aumento di massa è proporzionale all’aumento di temperatura. Ma poiché m0 v 2 /2 è l’energia cinetica nell’antico senso newtoniano, possiamo anche dire che l’aumento di massa di tutta questa quantità di gas è uguale all’aumento di energia cinetica diviso per c2 , ossia m=

15.9

(E.C.) c2

Equivalenza di massa ed energia

L’osservazione precedente indusse Einstein a suggerire che la massa di un corpo possa essere espressa più semplicemente, piuttosto che con la formula (15.1), dicendo che la massa è uguale al contenuto totale di energia diviso c2 . Se l’equazione (15.11) è moltiplicata per c2 il risultato è 1 mc2 = m0 c2 + m0 v 2 + . . . (15.12) 2 Qui il termine al primo membro esprime l’energia totale di un corpo e riconosciamo l’ultimo termine come la comune energia cinetica. Einstein interpretò il grande termine costante, m0 c2 , come facente parte dell’energia totale del corpo, un’energia intrinseca nota come «energia a riposo». Traiamo le conseguenze dell’aver assunto, con Einstein, che l’energia di un corpo equivalga sempre a mc2 . Come risultato interessante troveremo la formula (15.1) per la variazione della massa con la velocità, che abbiamo semplicemente supposto finora. Partiamo col corpo in quiete, quando la sua energia è m0 c2 . Applichiamo poi al corpo una forza, che lo mette in moto e gli dà energia cinetica; quindi, poiché l’energia è aumentata, la massa è aumentata: questo è implicito nell’ipotesi iniziale. Finché dura la forza, energia e massa continuano entrambe ad aumentare. Abbiamo già visto (capitolo 13) che la rapidità di variazione dell’energia col tempo è uguale alla forza per la velocità, ossia dE =F·v (15.13) dt Sappiamo anche (capitolo 9, equazione (9.1)) che F = d(mv)/dt. Quando queste relazioni sono unite alla definizione di E, l’equazione (15.13) diventa d(mc2 ) d(mv) =v· (15.14) dt dt Vediamo di risolvere questa equazione rispetto a m. Per far questo usiamo dapprima l’espediente matematico di moltiplicare entrambi i membri per 2m, il che cambia l’equazione in dm d(mv) = 2mv · (15.15) dt dt Dobbiamo eliminare le derivate, cosa che può essere fatta integrando entrambi i membri. La quantità (2m) dm/dt può essere riconosciuta come la derivata temporale di m2 , e 2mv · d(mv)/dt è la derivata temporale di (mv)2 . Quindi l’equazione (15.15) equivale a c2 (2m)

d(m2 ) d(m2 v 2 ) = (15.16) dt dt Se le derivate di due quantità sono uguali, le quantità stesse differiscono al più per una costante, diciamo C. Quindi possiamo scrivere c2

m2 c2 = m2 v 2 + C

(15.17)

Dobbiamo definire la costante C più esplicitamente. Poiché l’equazione (15.17) deve essere vera per tutte le velocità, possiamo scegliere il caso particolare in cui v = 0, e dire che in questo caso la massa è m0 . La sostituzione di questi valori nell’equazione (15.17) dà m02 c2 = 0 + C

163

164

Capitolo 15 • La teoria speciale della relatività

© 978-8808-22107-0

Possiamo ora usare questo valore di C nell’equazione (15.17), che diventa m2 c2 = m2 v 2 + m02 c2

(15.18)

Dividendo per c2 e riordinando i termini si ha

da cui segue

m2 *1 ,

v2 + = m02 c2 m0

(15.19) v2 1 c2 Questa è la formula (15.1), ed è esattamente ciò che è necessario per l’accordo fra massa ed energia nell’equazione (15.12). Normalmente queste variazioni di energia rappresentano variazioni estremamente piccole di massa, poiché il più delle volte non possiamo generare molta energia da una data quantità di materia; ma in una bomba atomica con una energia esplosiva equivalente a 20 kilotoni di TNT, per esempio, può essere mostrato che il residuo dopo l’esplosione è 1 grammo più leggero della massa iniziale del materiale reagente a causa dell’energia liberata, cioè l’energia liberata aveva massa di 1 grammo, secondo la relazione m= r

E = (mc2 ) Questa teoria dell’equivalenza di massa ed energia è stata perfettamente verificata in esperimenti nei quali la materia è annichilita, cioè totalmente convertita in energia: un elettrone e un positone si incontrano in quiete con una massa a riposo m0 . Quando essi si incontrano, si disintegrano e vengono emessi due raggi gamma, ciascuno con l’energia misurata di m0 c2 . Questo esperimento fornisce una determinazione diretta dell’energia legata all’esistenza della massa a riposo di una particella.

Energia e quantità di moto relativistiche

16.1

La relatività e i filosofi

In questo capitolo continueremo a discutere il principio di relatività di Einstein e Poincaré, come esso ha influenzato i nostri concetti di fisica e le altre branche del pensiero umano. Poincaré diede il seguente enunciato del principio di relatività: «Secondo il principio di relatività, le leggi dei fenomeni fisici devono essere le stesse per un osservatore fisso come per un osservatore che abbia rispetto al primo un moto uniforme di traslazione, cosicché non abbiamo, né è possibile che si abbia, nessun mezzo per distinguere se siamo o non siamo animati da un moto del genere». Quando questa idea investì il mondo, causò grande emozione fra i filosofi, particolarmente fra i «filosofi da cocktail-party», che dicono: «Oh, è molto semplice: la teoria di Einstein dice che tutto è relativo!». Infatti, un numero sorprendentemente grande di filosofi, non soltanto i frequentatori dei cocktail-party (ma piuttosto che imbarazzarli, li definiremo «filosofi da cocktailparty»), sosterrà: «Che tutto è relativo è una conseguenza di Einstein, e ha profonde influenze sulle nostre idee». In più, essi dicono: «È stato dimostrato in fisica che i fenomeni dipendono dal nostro sistema di riferimento». Abbiamo udito ciò molte volte, ma è difficile farsi spiegare che cosa significhi. Probabilmente i sistemi di riferimento a cui si è alluso originariamente erano i sistemi di coordinate che usiamo nell’analisi della teoria della relatività. Così il fatto che «le cose dipendono dal vostro sistema di riferimento» si suppone abbia avuto un profondo influsso sul pensiero moderno. Ci si può ben chiedere il perché, dato che, dopotutto, il fatto che le cose dipendano dal punto di vista di ognuno è un’idea così semplice che certamente non può esser stato necessario arrivare a tutto il sovvertimento della teoria fisica della relatività, per scoprirlo. Che ciò che uno vede dipenda dal suo sistema di riferimento è certamente noto a chiunque passeggia, poiché egli vede un pedone che si avvicina, prima davanti poi dietro; non vi è niente di più profondo nella maggior parte della filosofia che si dice derivata dalla teoria della relatività dell’affermazione: «Una persona appare diversa vista davanti da come appare dietro». La vecchia storiella dell’elefante che diversi uomini ciechi descrivono in modi diversi è un altro esempio, forse, della teoria della relatività dal punto di vista del filosofo. Ma certamente vi devono essere nella teoria della relatività cose più profonde della semplice affermazione secondo la quale «Una persona appare diversa davanti da come appare dietro». Naturalmente la relatività è qualcosa di più profondo, poiché possiamo fare previsioni definite per mezzo di essa. Certamente sarebbe straordinario se potessimo predire il comportamento della natura da questa semplice e sola affermazione. Vi sono altri filosofi che si sentono molto a disagio riguardo alla teoria della relatività, secondo la quale non possiamo determinare la nostra velocità assoluta senza guardare qualcosa di esterno, e che direbbero: «È ovvio che non si può misurare la propria velocità senza guardare l’esterno. È di per sé evidente che è privo di senso parlare della velocità di una cosa senza guardare l’esterno; i fisici sono piuttosto stupidi per aver pensato altrimenti, ma si sono accorti soltanto ora che è così. Se noi filosofi ci fossimo soltanto resi conto di quali erano i problemi che i fisici avevano, avremmo potuto stabilire immediatamente con un semplice lavoro intellettuale che è impossibile dire a quale velocità ci si muove senza osservare l’esterno, e avremmo dato un enorme

16

166

Capitolo 16 • Energia e quantità di moto relativistiche

© 978-8808-22107-0

contributo alla fisica». Questi filosofi sono sempre con noi, lottando alla periferia per cercare di dirci qualcosa, ma non hanno in realtà mai compreso le sottigliezze e le profondità del problema. La nostra incapacità di rivelare il moto assoluto è un risultato dell’esperienza e non un risultato di pura evidenza, come possiamo facilmente dimostrare. In primo luogo Newton credeva che fosse vero che uno non potesse dire a che velocità stesse andando se si muoveva in linea retta con velocità uniforme. In effetti Newton per primo enunciò il principio di relatività e una citazione fatta nell’ultimo capitolo era un’affermazione di Newton. Perché allora i filosofi non fecero tutto questo chiasso attorno al fatto che «tutto è relativo», o cose del genere, al tempo di Newton? Perché non avvenne, fino allo sviluppo della teoria di Maxwell sull’elettrodinamica, che vi fossero leggi fisiche che suggerivano che si potesse misurare la propria velocità senza osservazione esterna; presto fu trovato sperimentalmente che non si poteva. Ora è assolutamente, definitivamente, filosoficamente necessario che non si sia in grado di dire quanto velocemente ci si sta muovendo senza osservare l’esterno? Una delle conseguenze della relatività fu lo sviluppo di una filosofia che diceva: «Voi potete definire soltanto ciò che potete misurare! Poiché è di per sé evidente che non si può misurare una velocità senza vedere rispetto a che cosa la si sta misurando, quindi è chiaro che la velocità assoluta non ha significato. I fisici avrebbero dovuto rendersi conto che essi possono parlare soltanto di ciò che possono misurare». Ma il problema è tutto qui: se si può o no definire la velocità assoluta è lo stesso problema di potere o meno rilevare in un esperimento, senza osservare l’esterno, se si è in movimento. In altre parole, che una cosa sia misurabile o meno non è qualcosa che va deciso a priori col solo ragionamento, ma qualcosa che può essere deciso soltanto dall’esperienza. Dato che la velocità della luce è 186 000 miglia/s, si troveranno pochi filosofi i quali affermeranno tranquillamente che è di per sé evidente che se la luce percorre 186 000 miglia/s, all’interno di una macchina, e se la macchina sta andando a 100 000 miglia/s, allora la luce oltrepassa un osservatore sulla Terra ancora alla velocità di 186 000 miglia/s. Questo è un fatto che li disorienta: proprio quelli che pretendono sia ovvio, trovano, quando presentate loro un fatto specifico, che ovvio non è. Infine vi sono anche filosofi che affermano che non si può rivelare nessun moto tranne che per osservazione esterna. In fisica ciò è semplicemente falso. È vero, non si può percepire un moto uniforme in linea retta, ma se l’intera stanza stesse ruotando certamente lo sapremmo, perché tutti verrebbero spinti contro la parete – vi sarebbe ogni tipo di effetti «centrifughi». Che la Terra ruoti sul suo asse può essere determinato senza guardare le stelle, per esempio per mezzo del cosiddetto pendolo di Foucault. Quindi non è vero che «tutto è relativo»; è soltanto la velocità uniforme che non può essere rilevata senza osservare l’esterno. La rotazione uniforme attorno a un asse fisso può esserlo. Quando questo viene detto a un filosofo, egli è molto turbato di non aver in realtà capito il fenomeno; poiché a lui sembra impossibile che si sia in grado di determinare una rotazione attorno a un asse senza osservare l’esterno. Se il filosofo è sufficientemente in gamba, dopo un po’ potrebbe osservare: «Ho capito. In realtà non abbiamo qualcosa di simile a una rotazione assoluta; noi in realtà stiamo ruotando relativamente alle stelle. E così qualche influenza esercitata dalle stelle sugli oggetti deve causare la forza centrifuga». Ora per quanto ne sappiamo ciò è vero; non abbiamo modo a tutt’oggi di dire se vi sarebbe forza centrifuga se non vi fossero attorno stelle e nebulose. Non siamo stati in grado di fare l’esperimento di spostare tutte le nebulose e poi di misurare la nostra rotazione, così semplicemente non lo sappiamo. Dobbiamo ammettere che il filosofo può aver ragione. Egli ritorna quindi tutto contento, e dice: «È assolutamente necessario che in ultima analisi le cose nell’universo stiano così: la rotazione assoluta non significa niente; essa è soltanto relativa alle nebulose». Gli rispondiamo allora: «Amico mio, è o non è ovvio che la velocità uniforme in linea retta, relativa alle nebulose, non dovrebbe produrre effetti all’interno dell’automobile?». Ora che il moto non è più assoluto, ma è un moto relativo alle nebulose, questa diventa una domanda misteriosa, e un problema al quale si può rispondere soltanto per mezzo dell’esperienza. Quali sono allora le influenze filosofiche della teoria della relatività? Se ci limitiamo alle influenze nel senso di quali generi di nuove idee e di nuovi suggerimenti sono stati ispirati ai fisici dal principio della relatività, potremmo descriverne alcuni come segue. La prima scoperta è essenzialmente che anche quelle idee che sono state mantenute per un lunghissimo periodo e che sono state accuratamente verificate, possono essere sbagliate. Fu una scoperta sconvolgente, infatti, che le leggi di Newton fossero errate, dopo tutti gli anni in cui erano apparse giuste.

16.2 • Il paradosso dei gemelli

© 978-8808-22107-0

Naturalmente, è chiaro, non è che gli esperimenti fossero sbagliati, ma furono eseguiti soltanto in un limitato intervallo di velocità, tanto piccolo che gli effetti relativistici non sarebbero stati evidenti. Nondimeno, ora abbiamo un punto di vista molto più umile nei confronti delle nostre leggi fisiche: tutto può essere sbagliato! In secondo luogo, se abbiamo un gruppo di concetti «strani» quali quello che il tempo va più lentamente quando ci si muove, e così via, che ci piacciano o meno è una questione irrilevante. Il solo problema rilevante è se le idee siano coerenti con ciò che è stato trovato sperimentalmente. In altre parole, le «idee strane» hanno bisogno soltanto di accordarsi con l’esperienza e la sola ragione che abbiamo per discutere il comportamento degli orologi e così via è di dimostrare che, benché la nozione della dilatazione del tempo sia strana, essa è coerente col nostro modo di misurare il tempo. Infine, vi è un terzo suggerimento che è un poco più tecnico ma che è risultato di enorme utilità nello studio delle altre leggi fisiche, ed è quello di osservare la simmetria delle leggi o, più specificamente, di osservare i modi in cui le leggi possono essere trasformate mantenendo la stessa forma. Quando abbiamo discusso la teoria dei vettori abbiamo notato che le leggi fondamentali del moto non cambiano quando ruotiamo il sistema di coordinate, e ora impariamo che esse non cambiano quando cambiamo le variabili spazio e tempo in un certo modo, dato dalla trasformazione di Lorentz. Così questa idea di studiare i modelli o le operazioni per le quali le leggi fondamentali non vengono cambiate si è dimostrata molto utile.

16.2

Il paradosso dei gemelli

Per continuare la nostra discussione della trasformazione di Lorentz e degli effetti relativistici, consideriamo il famoso cosiddetto «paradosso» di Pietro e Paolo, che si suppongono gemelli, nati contemporaneamente. Quando sono abbastanza grandi per guidare una nave spaziale, Paolo vola lontano ad altissima velocità. Poiché Pietro, che è rimasto sulla Terra, vede Paolo andare tanto veloce, tutti gli orologi di Paolo gli sembrano più lenti, i suoi battiti del cuore vanno più lenti, tutto va più lento dal punto di vista di Pietro. Naturalmente, Paolo non nota niente di insolito, ma se viaggia lassù per un po’ e poi ritorna sarà più giovane di Pietro, l’uomo rimasto sulla Terra. Questo è esatto in realtà; è una delle conseguenze della teoria della relatività che è stata chiaramente dimostrata. Proprio come i mesoni durano più a lungo quando sono in movimento, così anche Paolo durerà più a lungo quando è in movimento. Questo è chiamato un «paradosso» soltanto dalle persone che credono che il principio di relatività significhi che ogni moto è relativo; essi replicano: «Eh, dal punto di vista di Paolo non possiamo dire che Pietro era in movimento e quindi sarebbe apparso invecchiare più lentamente? Per simmetria il solo risultato possibile è che entrambi dovrebbero avere la stessa età quando si incontrano». Ma perché essi ritornino insieme e facciano il confronto, Paolo deve o fermarsi alla fine del cammino e fare un confronto degli orologi, o più semplicemente deve tornare indietro, e chi torna indietro deve essere l’uomo che era in movimento, ed egli sa questo, dato che ha dovuto invertire la rotta. Quando ha invertito la rotta sono successe un mucchio di cose insolite nella sua nave spaziale – si sono accesi i razzi, degli oggetti sono stati scaraventati contro la parete, e così via – mentre Pietro non ha percepito nulla. Così il modo di enunciare la legge è di dire che l’uomo che ha percepito le accelerazioni, che ha visto le cose cadere contro le pareti e così via, è colui che sarebbe più giovane; questa è la differenza fra loro in senso «assoluto», certamente corretta. Quando abbiamo discusso il fatto che i mesoni mu in movimento vivono più a lungo, abbiamo usato come esempio il loro moto in linea retta nell’atmosfera. Ma possiamo anche produrre mesoni mu in laboratorio e costringerli ad andare secondo una traiettoria curva per mezzo di un magnete, e anche in tale moto accelerato, essi durano più a lungo, ed è esattamente quanto durerebbero muovendosi in linea retta. Benché non si sia predisposto un esperimento esplicitamente perché possiamo liberarci del paradosso, si potrebbe confrontare un mesone mu che è lasciato fermo con uno che ha compiuto un intero giro e si troverebbe sicuramente che quello che ha viaggiato lungo il cerchio si è conservato più a lungo. Benché non abbiamo in realtà condotto un esperimento usando un cerchio completo, in effetti ciò

167

168

Capitolo 16 • Energia e quantità di moto relativistiche

© 978-8808-22107-0

non è necessario, naturalmente, perché tutto collima perfettamente. Questo può non soddisfare coloro che insistono col dire che ogni singolo fatto deve essere direttamente dimostrato, ma noi prediciamo con fiducia il risultato dell’esperimento in cui Paolo compie un giro completo.

16.3

Trasformazione delle velocità

La principale differenza fra la relatività di Einstein e la relatività di Newton è che le leggi di trasformazione che collegano le coordinate e i tempi fra sistemi che si muovono relativamente l’uno all’altro sono differenti. La legge corretta della trasformazione, quella di Lorentz, è x x0 = r

1

ut u2 c2

y0 = y z0 = z

t t =r 0

(16.1) ux c2 u2 1 c2

Queste equazioni corrispondono al caso relativamente semplice in cui il moto relativo di due osservatori è lungo i loro comuni assi x. Naturalmente sono possibili altre direzioni del moto, ma la trasformazione più generale di Lorentz è piuttosto complicata, con tutte e quattro le grandezze mescolate insieme. Continueremo a usare questa forma più semplice, poiché contiene tutte le caratteristiche essenziali della relatività. Discutiamo ora altre conseguenze di questa trasformazione. In primo luogo è interessante risolvere inversamente queste equazioni. Cioè qui abbiamo un insieme di equazioni lineari, quattro equazioni con quattro incognite, ed esse possono essere risolte inversamente per x, y, z, t in funzione di x 0, y 0, z 0, t 0. Il risultato è molto interessante, poiché ci dice come un sistema di coordinate «fermo» appaia dal punto di vista di un sistema «in movimento». Naturalmente, dato che i moti sono relativi con velocità uniforme, l’uomo «in movimento» può dire, se vuole, che in realtà è l’altra persona che si muove, mentre lui invece è fermo. E dato che egli si muove nel verso opposto, dovrebbe ottenere la stessa trasformazione, ma con il segno della velocità opposto. Ciò è precisamente quello che otteniamo rielaborando le (16.1) cosicché vi è coerenza. Se non risultasse così, avremmo un motivo reale per preoccuparci! x 0 + ut 0 x=r u2 1 c2 0 y=y z = z0 ux 0 t0 + 2 t=r c u2 1 c2

(16.2)

Discutiamo ora l’interessante problema dell’addizione di velocità nella relatività. Ricordiamo che uno dei primi rompicapi fu il fatto che la luce viaggia a 186 000 miglia/s in tutti i sistemi, anche quando questi sono in moto relativo. Questo è un caso particolare del problema più generale esemplificato da quanto segue. Supponiamo che un oggetto all’interno di una nave spaziale viaggi a 100 000 miglia/s e la navicella spaziale stessa stia viaggiando a 100 000 miglia/s; a quale velocità si muove l’oggetto all’interno della nave spaziale dal punto di vista di un osservatore

16.3 • Trasformazione delle velocità

© 978-8808-22107-0

all’esterno? Ci verrebbe da dire 200 000 miglia/s, che è una velocità maggiore di quella della luce. Questo è molto seccante, poiché l’oggetto non dovrebbe andare a velocità maggiore di quella della luce! Il problema generale è il seguente. Supponiamo che l’oggetto all’interno della navicella dal punto di vista dell’uomo all’interno si stia muovendo con velocità v, e che la stessa nave spaziale abbia una velocità u rispetto alla Terra. Vogliamo sapere con quale velocità vx questo oggetto si sta muovendo dal punto di vista dell’uomo sulla Terra. Questo naturalmente è ancora un caso particolare in cui il moto è nella direzione x. Vi sarà anche una trasformazione per le velocità in direzione y, o per qualsiasi direzione; queste possono essere calcolate se richieste. All’interno della navicella la velocità è vx0 , il che significa che lo spostamento x 0 è uguale alla velocità per il tempo: x 0 = vx0 t 0

(16.3)

Ora dobbiamo soltanto calcolare quali sono la posizione e il tempo dal punto di vista dell’osservatore all’esterno per un oggetto che ha le relazioni (16.2) fra x 0 e t 0. Così sostituiamo semplicemente la (16.3) nella prima delle (16.2) e otteniamo vx0 t 0 + ut 0 x= r u2 1 c2

(16.4)

Ma qui troviamo x espresso in funzione di t 0. Per ottenere la velocità vista dall’osservatore esterno, dobbiamo dividere la sua distanza per il suo tempo non per il tempo dell’altro uomo! Così dobbiamo anche calcolare il tempo come visto dall’esterno, che è u (vx0 t 0) c2 u2 1 c2

t0 + t= r

(16.5)

Ora dobbiamo trovare il rapporto x/t, che vale vx =

x u + vx0 = uvx0 t 1+ 2 c

(16.6)

Questa è la legge che cerchiamo: la velocità risultante, la «somma» delle due velocità, non è semplicemente la somma algebrica delle due velocità (sappiamo che non può esserlo o siamo nei guai), ma è «corretta» dal termine 1 + uv/c2 . Vediamo ora ciò che accade. Supponiamo che siate in movimento all’interno della nave spaziale a una velocità che è la metà di quella della luce e che la navicella spaziale stessa stia andando a una velocità che è la metà di quella della luce. Dunque u è c/2 e v è c/2, ma nel denominatore uv è un quarto, pertanto c c + 2 2 = 4c v= 1 5 1+ 4 Quindi, in relatività, «metà» e «metà» non fa «uno», fa soltanto «4/5». Naturalmente piccole velocità possono essere addizionate senza difficoltà nel modo usuale, poiché fino a quando le velocità sono piccole rispetto alla velocità della luce, possiamo trascurare il fattore 1 + uv/c2 ; ma le cose sono del tutto diverse e piuttosto interessanti a velocità elevate. Prendiamo un caso limite. Così per divertirci, supponiamo che all’interno della nave spaziale l’uomo stia osservando la luce stessa. In altre parole, v = c, e in più la nave spaziale è in movimento. Come apparirà questo all’uomo sulla Terra? La risposta sarà v=

u+c u+c uc = c u + c = c 1+ 2 c

169

170

Capitolo 16 • Energia e quantità di moto relativistiche

© 978-8808-22107-0

Quindi, se qualcosa è in movimento alla velocità della luce all’interno della navicella, essa apparirà in movimento alla velocità della luce anche all’uomo sulla Terra! Questo è bene, perché infatti è quanto la teoria della relatività di Einstein era stata progettata per fare, come prima cosa – e ci sarebbe mancato altro che non funzionasse! Naturalmente vi sono casi in cui il moto non è in direzione della traslazione uniforme. Per esempio vi può essere un oggetto interno alla navicella che si sta muovendo proprio «verso l’alto» con velocità vy0 rispetto alla navicella che sta muovendosi «orizzontalmente». Ora facciamo semplicemente la stessa cosa, soltanto che usiamo gli y invece degli x, con il risultato y = y 0 = vy 0 t 0 Quindi se vx0 = 0 vy =

y = vy 0 t

s

1

u2 c2

(16.7)

p Così una velocità trasversale non è più vy0 , ma vy0 1 u2 /c2 . Abbiamo trovato questo risultato sostituendo e combinando le equazioni della trasformazione, ma possiamo anche vederlo direttamente dal principio di relatività per la seguente ragione (è sempre bene cercare di vedere anche se possiamo scoprire la ragione). Abbiamo già discusso (FIGURA 15.3) come un possibile orologio possa funzionare quando è in movimento. La luce sembra viaggiare a un certo angolo alla velocità c nel sistema fisso, mentre va semplicemente secondo un percorso verticale con la stessa velocità nel sistema in movimento. Abbiamo trovato che la componente verticalep della velocità nel sistema fisso è minore della velocità della luce del fattore 1 u2 /c2 (vedi equazione (15.3)). Ma supponiamo Luce ora di far andare avanti e indietro nello stesso «orologio» una particella materiale a una certa frazione intera 1/n della velocità della luce (FIGURA 16.1). u u Allora quando la particella è andata avanti e indietro una volta, la luce lo avrà fatto esattamente n volte. Cioè ogni «click» dell’orologio a particella coinciderà con l’ennesimo «click» dell’orologio a luce. Questo fatto deve Particella essere vero anche quando l’intero sistema è in movimento, perché il fenomeno fisico della coincidenza sarà una coincidenza in qualsiasi riferimento. Quindi, poiché la velocità cy è minore della velocità della luce, la velocità vy della particella deve essere minore della corrispondente velocità dello FIGURA 16.1 Traiettorie descritte da un raggio di luce stesso rapporto con la radice quadrata! Questa è la ragione per cui la radice e da una particella all’interno di un orologio quadrata appare in qualsiasi velocità verticale. in movimento.

16.4

Massa relativistica

Abbiamo visto nel capitolo precedente che la massa di un oggetto aumenta con la velocità, ma non è stata data dimostrazione di questo, nel senso che non abbiamo portato argomenti analoghi a quelli sul comportamento degli orologi. Però, possiamo dimostrare che, come conseguenza della relatività, più qualche altra ipotesi ragionevole, la massa deve variare in questo modo. (Dobbiamo dire «qualche altra ipotesi» poiché non possiamo provare niente fino a che abbiamo alcune leggi che supponiamo vere, se ci aspettiamo di fare deduzioni significative.) Per evitare la necessità di studiare le leggi di trasformazione della forza, analizzeremo un urto, dove non abbiamo bisogno di conoscere niente sulle leggi della forza, tranne che supporremo la conservazione della quantità di moto e dell’energia. Inoltre supporremo che la quantità di moto di una particella che è in movimento sia un vettore e sia sempre diretta nella direzione della velocità. Però non supporremo che la quantità di moto sia una costante per la velocità, come fece Newton, ma soltanto che essa sia una qualche funzione della velocità. Scriviamo così il vettore quantità di moto come un certo coefficiente per il vettore velocità: p = mv v (16.8)

16.4 • Massa relativistica

© 978-8808-22107-0

171

Sottoscriviamo una v al coefficiente per ricordarci che è una funzione della velocità, e chiameremo «massa» questo coefficiente mv . Naturalmente, quando la velocità è piccola si tratta della stessa massa che misureremmo negli esperimenti a bassa velocità ai quali siamo abituati. Ora cercheremo di dimostrare che la formula per mv deve essere mv = r

m0

1

v2 c2

arguendo dal principio della relatività che le leggi della fisica devono essere le stesse in ogni sistema di coordinate. Supponiamo di avere due particelle, quali due protoni, che sono assolutamente uguali e che si muovono l’una verso l’altra con velocità esattamente uguali. La loro quantità di moto totale è zero. Ora che cosa può accadere? Dopo l’urto le loro direzioni di moto devono essere esattamente opposte l’una all’altra, poiché se esse non fossero esattamente opposte vi sarebbe un vettore quantità di moto totale diverso da zero, e la quantità di moto non risulterebbe conservata. Inoltre esse devono avere le stesse velocità, perché sono oggetti esattamente simili; in effetti, esse devono avere la stessa velocità con la quale sono partite, poiché supponiamo che l’energia sia conservata in questi urti. Così il diagramma di una collisione elastica, una collisione reversibile, apparirà come in FIGURA 16.2a: tutte le frecce sono della stessa lunghezza, tutte le velocità sono uguali. Supporremo che tali collisioni possano sempre essere predisposte, che qualsiasi angolo ✓ possa verificarsi e che tali urti possano avvenire a qualsiasi velocità. Di seguito, notiamo che questo stesso urto può essere visto in modo diverso ruotando gli assi, e semplicemente per convenienza ruoteremo gli assi in modo che l’asse orizzontale tagli a metà l’angolo ✓ (FIGURA 16.2b). È lo stesso urto ridisegnato, solo con gli assi ruotati. Ecco ora il vero trucco: osserviamo questo urto dal punto di vista di qualcuno che viaggia in un’auto che si muove con una velocità uguale alla componente orizzontale della velocità di una particella. Come appare l’urto? Appare come se la particella 1 stesse andando in linea retta verso l’alto, poiché ha perduto la componente orizzontale, e torni di nuovo verso il basso in linea retta, per il fatto stesso che non ha quella componente. Cioè l’urto appare come mostrato in FIGURA 16.3a. La particella 2, però, stava andando in un altro modo, e quando la oltrepassiamo sembra volare a una velocità spaventosa e secondo un angolo più piccolo, ma possiamo renderci conto che gli angoli prima e dopo l’urto sono gli stessi. Indichiamo con u la componente orizzontale della velocità della particella 2, e con w la velocità verticale della particella 1. Ora il problema è: quanto vale la velocità verticale u tg ↵? Se lo sapessimo, potremmo ottenere l’espressione corretta per la quantità di moto, usando la legge di conservazione della quantità di moto nella direzione verticale. Chiaramente la componente orizzontale della quantità di moto è conservata: è la stessa prima e dopo l’urto per entrambe le particelle, ed è zero per la particella 1. Così ci basta usare la legge di conservazione soltanto per la velocità verso l’alto u tg ↵. Ma possiamo ottenere la velocità verso l’alto semplicemente osservando lo stesso urto mentre ci muoviamo nell’altro verso! Se osserviamo l’urto della FIGURA 16.3a da un’auto in movimento con velocità u verso sinistra, vediamo lo stesso urto tranne che è «capovolto», come mostrato in FIGURA 16.3b. Ora la particella 2 è quella che va su e giù con velocità w, mentre la particella 1 ha acquistato la velocità orizzontale u. Naturalmente ora sappiamo quanto vale la velocità u tg ↵: z'

z''

z 2 1

2

1

2 /2

/2

/2

/2

1

1

2

v

2

(b)

2

v

w

w

u x

u

u w 1

(a)

2

x'

1 v

u v

w 1 (a)

(b)

16.2 Due osservazioni di un urto elastico fra oggetti uguali in movimento alla stessa velocità e con verso opposto. FIGURA

2

1

x''

16.3 Ancora due osservazioni dell’urto, da auto in movimento. FIGURA

172

Capitolo 16 • Energia e quantità di moto relativistiche

© 978-8808-22107-0

p essa è w 1 u2 /c2 (vedi equazione (16.7)). Sappiamo che la variazione nella quantità di moto verticale della particella che si muove verticalmente è p = 2mw w (2, perché si muove verso l’alto e indietro verso il basso). La particella che p si muove obliquamente ha una certa velocità v le cui componenti abbiamo trovato essere u e w 1 u2 /c2 , e la cui massa è mv . La variazione della quantità di moto verticale di questa particella è quindi r u2 0 p = 2mv w 1 c2 perché, secondo la legge ipotizzata (16.8), la componente della quantità di moto è sempre la massa corrispondente al modulo della velocità per la componente della velocità nella direzione di interesse. Perché la quantità di moto totale sia zero le quantità di moto verticali devono annullarsi e il rapporto fra la massa in movimento con velocità v e la massa in movimento con velocità w deve quindi essere r mw u2 = 1 (16.9) mv c2 Prendiamo il caso limite in cui w sia infinitesimo. Se w è veramente molto piccolo, è chiaro che v e u sono praticamente uguali. In questo caso, mw ! m0 e mv ! mu . Il grande risultato è mu = r

m0 1

(16.10)

u2 c2

È un esercizio interessante verificare ora se l’equazione (16.9) sia veramente giusta per valori arbitrari di w, assumendo che l’equazione (16.10) sia la formula corretta per la massa. Notate che la velocità v necessaria nell’equazione (16.9) può essere calcolata dal triangolo rettangolo: v 2 = u 2 + w 2 *1 ,

u2 + c2 -

Si troverà che è automaticamente verificata, benché l’abbiamo usata soltanto nel limite di w piccolo. Ora, accettiamo che la quantità di moto è conservata e che la massa dipende dalla velocità secondo l’equazione (16.10) e vediamo di scoprire che cos’altro possiamo concludere. Consideriamo quella che comunemente è chiamata una collisione anelastica. Per semplicità supporremo che due oggetti dello stesso tipo, che si muovono l’uno contro l’altro con uguale velocità w, si urtino e si incollino insieme, per diventare un nuovo oggetto fermo, come mostrato in FIGURA 16.4a. La massa m di ciascun oggetto dipende da w e, come sappiamo, è 1 2 w –w Prima della collisione m0 m0 m0 m= r w2 Dopo la collisione M 1 c2 (a) Se ammettiamo la conservazione della quantità di moto e il principio di relatività, possiamo dimostrare un fatto interessante sulla massa del nuovo oggetto che è stato formato. Immaginiamo una velocità infinitesima u w+u –w + u 1 2 Prima dellla collisione perpendicolare a w (possiamo fare lo stesso con valori finiti di u, ma è più m0 u m0 facile da capire con una velocità infinitesima), poi osserviamo lo stesso Dopo la collisione urto come se stessimo viaggiando con un ascensore a velocità u. Quello M (b) che vediamo è mostrato nella FIGURA 16.4b. L’oggetto composto ha una massa sconosciuta M. Ora l’oggetto 1 si muove con una componente della velocità verso l’alto u e una componente orizzontale che è praticamente FIGURA 16.4 Due osservatori di una collisione uguale a w, e così pure fa l’oggetto 2. Dopo l’urto abbiamo la massa M che anelastica fra oggetti di uguale massa.

16.5 • Energia relativistica

© 978-8808-22107-0

si muove verso l’alto con velocità u, considerata molto piccola rispetto alla velocità della luce, e piccola anche rispetto a w. La quantità di moto deve essere conservata, così stimiamo la quantità di moto nella direzione verso l’alto prima e dopo l’urto. Prima dell’urto abbiamo p ⇡ 2mw u, mentre dopo l’urto la quantità di moto è evidentemente p0 = Mu u, ma Mu è essenzialmente lo stesso che M0 , dato che u è tanto piccolo. Queste quantità di moto devono essere uguali per la conservazione della quantità di moto, e quindi M0 = 2mw

(16.11)

La massa dell’oggetto che si forma quando due oggetti uguali si urtano deve essere doppia della massa degli oggetti che si uniscono. Potete dire: «Sì, naturalmente, questa è la conservazione della massa». Ma non «Sì, naturalmente», così con facilità, perché queste masse sono state aumentate rispetto alle masse che avremmo se fossero ferme, tuttavia contribuiscono alla massa totale, non le masse che gli oggetti hanno quando sono immobili, ma masse maggiori. Per quanto questo possa sembrare stupefacente, perché la conservazione della quantità di moto funzioni quando due oggetti si uniscono, la massa che essi formano deve essere maggiore delle masse a riposo degli oggetti, anche se gli oggetti sono fermi dopo l’urto!

16.5

Energia relativistica

Nell’ultimo capitolo abbiamo dimostrato che, come risultato della dipendenza della massa dalla velocità e delle leggi di Newton, le variazioni dell’energia cinetica di un oggetto risultanti dal lavoro totale prodotto dalle forze su di esso risultano sempre essere T = (mu

m0 c 2 m0 ) c 2 = r u2 1 c2

m0 c 2

(16.12)

Siamo andati ancora oltre e abbiamo supposto che l’energia totale sia la massa per c2 . Ora continuiamo questa discussione. Supponiamo che i nostri due oggetti con la stessa massa che collidono possano ancora essere «visti» all’interno di M. Per esempio, un protone e un neutrone sono «appiccicati», ma si muovono ancora qua e là dentro M. Quindi, benché possiamo aspettarci che la massa M sia 2m0 , abbiamo trovato che non è 2m0 , ma 2mw . Poiché 2mw è quello che viene introdotto, ma 2m0 sono le masse in quiete degli oggetti all’interno, l’eccesso di massa dell’oggetto composto è uguale all’energia cinetica introdotta. Questo significa, naturalmente, che l’energia possiede inerzia. Nel capitolo precedente abbiamo discusso il riscaldamento di un gas e mostrato che, poiché le molecole di un gas sono in movimento e le cose in movimento sono più pesanti, quando immettiamo energia in un gas le sue molecole si muovono più velocemente cosicché il gas diventa più pesante. Ma in effetti l’argomento è completamente generale e la nostra discussione dell’urto anelastico mostra che la massa c’è, che si tratti o no di energia cinetica. In altre parole, se due particelle si uniscono e producono energia potenziale o di qualsiasi altra forma, se le parti sono rallentate superando ostacoli, producendo lavoro contro le forze interne, o qualsiasi altra cosa, allora è ancora vero che la massa è l’energia totale che è stata introdotta. Così vediamo che la conservazione della massa che abbiamo dedotto prima è equivalente alla conservazione dell’energia, e quindi non vi è posto nella teoria della relatività per collisioni strettamente anelastiche, come accadeva nella meccanica newtoniana. Secondo la meccanica newtoniana è del tutto lecito per due corpi urtarsi e formare così un oggetto di massa 2m0 che non è in nessun modo distinto da quello che risulterebbe se i corpi fossero uniti lentamente. Naturalmente sappiamo dalla legge di conservazione dell’energia che vi è più energia cinetica all’interno, ma essa non incide sulla massa, secondo le leggi di Newton. Ma ora vediamo che questo è impossibile; a causa dell’energia cinetica coinvolta nell’urto, l’oggetto risultante sarà più pesante; quindi sarà un oggetto differente. Quando mettiamo insieme gli oggetti con delicatezza essi formano qualcosa la cui massa è 2m0 ; quando li uniamo con forza,

173

174

Capitolo 16 • Energia e quantità di moto relativistiche

© 978-8808-22107-0

essi formano qualcosa la cui massa è maggiore. Quando la massa è differente, possiamo dire che l’oggetto è diverso. Così, necessariamente, la conservazione dell’energia deve procedere con la conservazione della quantità di moto nella teoria della relatività. Questo ha conseguenze interessanti. Per esempio supponiamo di avere un oggetto la cui massa M sia misurata, e supponiamo che accada qualcosa cosicché esso si rompa improvvisamente in due parti uguali che si muovono a velocità w, così che ciascuna di esse abbia massa mw . Supponiamo che queste parti incontrino abbastanza materia da rallentarle fino a fermarle; allora esse avranno massa m0 . Quanta energia avranno ceduto alla materia quando sono state fermate? Ognuna darà una quantità (mw m0 )c2 , per il teorema che abbiamo dimostrato prima. Questa quantità di energia è lasciata nel materiale in qualche forma, come calore, energia potenziale, o qualsiasi altra forma. Ora 2mw = M, quindi l’energia liberata è E = (M

2m0 )c2

Questa equazione, per esempio, fu usata per stimare quanta energia sarebbe stata liberata per fissione dalla bomba atomica. (Benché i frammenti non siano esattamente uguali, essi sono quasi uguali.) La massa dell’atomo di uranio era nota – era stata misurata in precedenza – e gli atomi in cui si scinde, iodio, xeno e così via, erano tutti di massa nota. Per masse non intendiamo le masse mentre gli atomi sono in movimento, intendiamo le masse quando gli atomi sono fermi. In altre parole, sia M sia m0 sono note. Quindi, sottraendo i due numeri, si può calcolare quanta energia sarà liberata se M può essere portata a dividersi a «metà». Per questa ragione il povero vecchio Einstein fu chiamato, su tutti i giornali, «padre» della bomba atomica. Naturalmente il significato di ciò era che egli avrebbe potuto dirci prima del tempo quanta energia sarebbe stata liberata, se gli avessimo detto quale processo sarebbe avvenuto. L’energia che sarebbe stata liberata quando un atomo di uranio subiva fissione fu stimata circa sei mesi prima della prima prova diretta, e appena l’energia fu liberata qualcuno la misurò direttamente (e se la formula di Einstein non avesse funzionato, essi l’avrebbero misurata in ogni modo), e nel momento in cui la misurarono essi non ebbero più bisogno della formula. Naturalmente non sminuiremo Einstein, ma piuttosto criticheremo i giornali e parecchie descrizioni popolari riguardanti la causa di eventi che riguardano la storia della fisica e della tecnologia. Il problema di come ottenere che la cosa accada in una maniera rapida ed efficace è un argomento completamente diverso. Il risultato è altrettanto importante in chimica. Per esempio, se pesassimo la molecola di anidride carbonica e paragonassimo la sua massa con quella del carbonio e dell’ossigeno, troveremmo quanta energia sarebbe liberata quando carbonio e ossigeno formano l’anidride carbonica. La sola difficoltà qui è che le differenze fra le masse sono così piccole che la cosa risulta tecnicamente molto difficile da realizzare. Rivolgiamoci ora al quesito se dovremmo aggiungere m0 c2 all’energia cinetica e dire d’ora in avanti che l’energia totale di un oggetto è mc2 . In primo luogo, se potessimo ancora vedere le parti componenti con masse a riposo m0 all’interno di M, allora potremmo dire che una parte della massa M dell’oggetto composto è la massa meccanica a riposo delle parti, parte di essa è energia cinetica delle parti, e parte di essa è energia potenziale delle parti. Ma abbiamo scoperto, in natura, particelle di diversi generi che subiscono reazioni proprio come quella che abbiamo trattato sopra, nelle quali con tutto lo studio del mondo, non possiamo vedere le parti all’interno. Per esempio, quando un mesone K si disintegra in due pioni lo fa in accordo alla legge (16.11), ma l’idea che un K sia fatto da due mesoni ⇡ è un’idea che non serve a nulla, poiché esso si disintegra anche in tre mesoni ⇡! Quindi abbiamo una nuova idea: non abbiamo bisogno di sapere di che cosa gli oggetti sono fatti internamente, non possiamo e non abbiamo bisogno di identificare, all’interno di una particella, quale dell’energia è energia a riposo delle parti nelle quali disintegrerà. Non è conveniente e spesso non è possibile separare l’energia totale mc2 di un oggetto in energia a riposo delle parti interne, in energia cinetica delle parti ed energia potenziale delle parti; invece parliamo semplicemente dell’energia totale della particella. «Spostiamo l’origine» dell’energia aggiungendo una costante m0 c2 a ogni cosa, e diciamo che l’energia totale di una particella è la massa in moto per c2 , e quando l’oggetto è fermo, l’energia è la massa in quiete per c2 .

16.5 • Energia relativistica

© 978-8808-22107-0

Infine, troviamo che la velocità v, la quantità di moto P e l’energia totale E sono messe in relazione in un modo piuttosto semplice. Il fatto che la massa in moto a velocità v è la massa p m0 a riposo divisa per 1 v 2 /c2 , abbastanza sorprendentemente, è usato raramente. Invece, le seguenti relazioni sono facilmente dimostrabili, e risultano essere molto utili: E2

P2 c2 = m02 c4

(16.13)

Ev c

(16.14)

e Pc =

175

17

Spazio-tempo

17.1

La geometria dello spazio-tempo

La teoria della relatività ci mostra che le relazioni fra le posizioni e i tempi, misurati in diversi sistemi di coordinate, non sono quelle che ci saremmo aspettati sulla base delle nostre idee intuitive. È molto importante capire completamente i rapporti fra spazio e tempo impliciti nella trasformazione di Lorentz, e quindi, in questo capitolo, considereremo a fondo l’argomento. La trasformazione di Lorentz fra le posizioni e i tempi (x, y, z, t) misurati da un osservatore «fermo», e le corrispondenti coordinate e il tempo (x 0, y 0, z 0, t 0) misurati all’interno di una nave spaziale «in movimento» con velocità u, sono x x0 = r

1

ut u2 c2

y0 = y z0 = z

t t =r 0

(17.1) ux c2 u2 1 c2

Confrontiamo queste equazioni con l’equazione (11.5) che si riferisce a misure in due sistemi, uno dei quali in questo caso è ruotato rispetto all’altro: x 0 = x cos ✓ + y sen ✓ y 0 = y cos ✓ x sen ✓ z0 = z

(17.2)

In questo caso particolare, Moe e Joe stanno misurando con assi x e x 0 che formano un angolo. In ogni caso notiamo che le quantità «con apice» sono «combinazioni» delle quantità «prive di apice»: il nuovo x 0 è una combinazione di x e di y, e così pure il nuovo y 0. È utile un’analogia: quando osserviamo un oggetto vi è una cosa ovvia che possiamo chiamare «larghezza apparente», e un’altra che possiamo chiamare «profondità». Ma le due idee, larghezza e profondità, non sono proprietà fondamentali dell’oggetto, dato che, se facciamo un passo di lato, e osserviamo la stessa cosa da un angolo diverso, otteniamo una diversa larghezza e una diversa profondità, e possiamo sviluppare alcune formule per calcolare le nuove dimensioni dalle vecchie per mezzo degli angoli in gioco. Queste formule sono le equazioni (17.2). Si può dire che una data profondità è una specie di «combinazione» dell’intera profondità e dell’intera larghezza. Se fosse impossibile muoversi e se vedessimo sempre un dato oggetto dalla stessa posizione, allora l’intera questione sarebbe priva di importanza: vedremmo sempre la «vera» larghezza e la «vera» profondità, ed esse sembrerebbero avere qualità del tutto diverse, poiché una appare come un angolo ottico sotteso, e l’altra implica una messa a fuoco degli occhi o addirittura l’intuizione;

17.1 • La geometria dello spazio-tempo

© 978-8808-22107-0

apparirebbero cose molto diverse e non verrebbero mai mischiate. È per il fatto che possiamo girare attorno all’oggetto che ci rendiamo conto che profondità e larghezza sono, in un modo o nell’altro, semplicemente due aspetti diversi della stessa cosa. Non possiamo considerare allo stesso modo le trasformazioni di Lorentz? Anche qui abbiamo una combinazione di posizioni e di tempo. Una differenza fra una misura di spazio e una misura di tempo produce una nuova misura di spazio. In altre parole, nelle misure di spazio fatte da un uomo vi è mescolata una piccola quantità del tempo che vede l’altro. La nostra analogia ci permette di generare questo concetto: la «realtà» di un oggetto che stiamo osservando è qualcosa di più (parlando sommariamente e intuitivamente) della sua «larghezza» e della sua «profondità» perché esse dipendono da come lo osserviamo; quando ci spostiamo in una nuova posizione, il nostro cervello ricalcola immediatamente larghezza e profondità. Ma il nostro cervello non ricalcola immediatamente coordinate e tempo quando ci muoviamo ad alta velocità, perché non abbiamo esperienza effettiva di moto a velocità quasi uguale a quella della luce, per apprezzare il fatto che anche tempo e spazio hanno la stessa natura. È come se fossimo sempre immobili in una posizione tale da poter osservare soltanto la larghezza di un oggetto, non essendo in grado di muovere apprezzabilmente la testa in un modo o nell’altro; se potessimo farlo, lo capiamo ora, vedremmo un po’ del tempo dell’altro uomo – vedremmo, per così dire, un pochino «dietro». Cercheremo dunque di pensare gli oggetti in una nuova specie di mondo, con spazio e tempo mescolati insieme, nello stesso senso che gli oggetti nello spazio del nostro mondo comune sono reali e possono essere osservati da diverse direzioni. Considereremo poi che gli oggetti che occupano spazio e che si estendono per una certa durata di tempo, occupino una specie di «bolla» in un nuovo tipo di mondo, e che noi quando ci muoviamo a diverse velocità osserviamo questa «bolla» da diversi punti di vista. Questo nuovo mondo, questa entità geometrica in cui le «bolle» esistono occupando una posizione e prendendo una certa quantità di tempo, è detto spazio-tempo. Un dato punto (x, y, z, t) nello spazio-tempo è detto evento. Immaginiamo, per esempio, di tracciare le posizioni x orizzontalmente, e le y e le z in altre due direzioni, entrambe mutuamente «perpendicolari» e «perpendicolari» rispetto al foglio (!), e di tracciare il tempo verticalmente. Ora una particella in moto come appare in un simile diagramma? Se la particella è immobile, essa ha una certa x e, al passare del tempo, continua ad avere la stessa x; così la sua «traiettoria» è una linea che corre parallela all’asse t (FIGURA 17.1a). Se invece la particella si muove verso l’esterno, allora al passare del tempo x cresce (FIGURA 17.1b). Così, per esempio, una particella che cominci ad allontanarsi e poi rallenti, dovrebbe avere per moto qualcosa di simile a ciò che è mostrato in FIGURA 17.1c. In altre parole, una particella stabile che non si disintegri è rappresentata da una linea nello spazio-tempo. Una particella che si disintegra verrebbe rappresentata da una linea biforcuta, perché si trasformerebbe in due altre cose a partire dal punto di disintegrazione. E la luce? La luce viaggia a velocità c, e sarebbe rappresentata da una linea avente una determinata inclinazione fissa (FIGURA 17.1d). Ora secondo il nostro nuovo concetto, se a una particella accade un dato evento, diciamo se improvvisamente si disintegra in un dato punto dello spazio-tempo in due nuove particelle che seguono nuove tracce, e questo evento interessante capita per un certo valore di x e per un certo valore di t, allora ci aspetteremmo, se ciò ha un qualche significato, di dover prendere una nuova coppia di assi e girarla, e quella ci darà il nuovo t e il nuovo x nel nostro nuovo sistema, come mostrato in FIGURA 17.2a. Ma questo è sbagliato, perché le equazioni (17.1) non sono esattamente la stessa trasformazione matematica delle equazioni (17.2). Notate per esempio la differenza di

ct'

ct

ct

ct

ct'

Lento (a)

(b)

(d)

x'

(c)

x' x

Veloce x0

x

ct' x'

Non corretto

Corretto

(a)

(b)

x

177

17.1 Traiettorie nello spazio-tempo. (a) Traiettoria di una particella a riposo nel punto x = x 0 . (b) Traiettoria di una particella che parte da x = x 0 e si muove a velocità costante. (c) Traiettoria di una particella che parte ad alta velocità e in seguito rallenta. (d) Traiettoria della luce. FIGURA

17.2 Due rappresentazioni di una particella che si disintegra. FIGURA

178

Capitolo 17 • Spazio-tempo

© 978-8808-22107-0

segno fra le due, e il fatto che una è scritta in termini di cos ✓ e sen ✓, mentre l’altra è espressa da quantità algebriche. (Naturalmente non è impossibile che le quantità algebriche possano essere scritte come seni e coseni, ma in realtà non possono.) Nondimeno i due sistemi di espressioni sono molto simili. Come vedremo, in realtà non è possibile pensare allo spazio-tempo come a una reale comune geometria, a causa di quella differenza di segno. Infatti, anche se non insisteremo su questo punto, risulta che un uomo in movimento deve usare un sistema di assi che sono ugualmente inclinati rispetto al raggio luminoso, usando uno speciale tipo di proiezione parallela agli assi x 0 e t 0 per i suoi x 0 e t 0, come mostrato in FIGURA 17.2b. Non ci occuperemo della geometria perché non ci è di grande aiuto; è più facile lavorare con le equazioni.

17.2

Intervalli nello spazio-tempo

Benché la geometria dello spazio-tempo non sia euclidea, nel senso comune del termine, vi è una geometria che è molto simile, ma particolare sotto certi aspetti. Se questa idea di geometria è giusta, vi dovrebbero essere alcune funzioni delle coordinate e del tempo che sono indipendenti dal sistema di coordinate. Per esempio, per rotazioni ordinarie, se prendiamo due punti, uno nell’origine per semplicità, e l’altro da un’altra parte, entrambi i sistemi avrebbero la stessa origine, e la distanza da questa all’altro punto sarebbe la stessa in entrambi. Questa è una proprietà che è indipendente dal modo particolare di misurarla. Il quadrato della distanza è x 2 + y 2 + z 2 . Ora, che cosa succede nello spazio-tempo? Non è difficile da dimostrare che abbiamo anche qui qualcosa che rimane costante, vale a dire la combinazione c2 t 2

x2

y2

z2

è la stessa prima e dopo la trasformazione: c2 t 0 2

x02

y0 2

z 0 2 = c2 t 2

x2

y2

z2

(17.3)

Questa quantità è quindi qualcosa che, come la distanza, è in un certo senso «reale»; essa è detta intervallo fra i due punti dello spazio-tempo, uno dei quali è, in questo caso, nell’origine. (In realtà, naturalmente, si tratta del quadrato dell’intervallo, proprio come x 2 + y 2 + z 2 è il quadrato della distanza.) Gli abbiamo dato un nome diverso poiché si tratta di una geometria diversa, ma la cosa interessante è soltanto che vi sono alcuni segni invertiti e che vi è una c. Sbarazziamoci di c; essa è un’assurdità se stiamo per avere uno spazio meraviglioso in cui le x e le y sono intercambiabili. Una delle confusioni che potrebbe essere causata da qualcuno senza esperienza sarebbe di misurare le larghezze, diciamo, mediante l’angolo sotteso dall’occhio, e misurare le profondità in modo diverso, quale la tensione dei muscoli necessaria per mettere a fuoco, cosicché le profondità sarebbero misurate in piedi e le larghezze in metri. Allora si otterrebbe un gruppo di equazioni enormemente complicato nel fare trasformazioni come la (17.2), e non si sarebbe in grado di vedere la chiarezza e la semplicità della cosa per una semplicissima ragione tecnica, che la stessa cosa è stata misurata con due diverse unità. Ora nelle equazioni (17.1) e (17.3) la natura ci dice che il tempo e lo spazio sono equivalenti; il tempo diviene spazio; essi dovrebbero essere misurati con le stesse unità. Quale distanza rappresenta un «secondo»? È facile calcolarlo dalla (17.3). È 3 · 108 metri, la distanza che la luce percorrerebbe in un secondo. In altre parole se misurassimo tutte le distanze e i tempi con le stesse unità, i secondi, allora la nostra unità di distanza sarebbe 3 · 108 metri, e le equazioni sarebbero più semplici. Oppure, un altro modo per rendere uguali le unità è misurare il tempo in metri. Che cos’è un metro di tempo? Un metro di tempo è il tempo che impiega la luce per percorrere un metro, ed è quindi 1/3 · 10 8 secondi , ossia 3,3 miliardesimi di secondo! Vorremmo, in altre parole, scrivere tutte le nostre equazioni in un sistema di unità in cui c = 1.

17.3 • Passato, presente e futuro

© 978-8808-22107-0

Se tempo e spazio sono misurati nella stessa unità, come suggerito, allora le equazioni vengono ovviamente molto semplificate. Esse sono x ut x0 = p 1 u2 y0 = y

(17.4)

z0 = z t ux t0 = p 1 u2 t02

x02

y0 2

z0 2 = t2

x2

y2

z2

(17.5)

Se siamo poi incerti o «spaventati» che, dopo aver introdotto questo sistema con c = 1, non saremo più in grado di rimettere a posto le nostre equazioni, la risposta è che è vero tutto il contrario. È molto più facile ricordarle senza p la c ed è sempre facile introdurre di nuovo la c, badando alle dimensioni. Per esempio in 1 u2 , sappiamo che non possiamo sottrarre il quadrato di una velocità che ha dimensioni, dal numero puro 1, così sappiamo che dobbiamo dividere u2 per c2 per renderlo adimensionale, e questo è il modo di procedere. La differenza fra spazio-tempo e spazio comune, e il carattere di intervallo riferito a una distanza, è molto interessante. Secondo la formula (17.5), se consideriamo un punto che in un dato sistema di coordinate ha tempo zero, e soltanto spazio, allora il quadrato dell’intervallo risulta negativo e abbiamo un intervallo immaginario, la radice quadrata di un numero negativo. Gli intervalli possono essere nella teoria sia reali sia immaginari. Il quadrato di un intervallo può essere sia negativo sia positivo, a differenza della distanza, che ha un quadrato positivo. Quando un intervallo è immaginario, diciamo che i due punti hanno fra loro un intervallo di tipo spaziale (anziché immaginario), perché l’intervallo è più tipicamente di spazio che di tempo. D’altra parte, se due oggetti sono nella stessa posizione in un dato sistema di coordinate, ma differiscono soltanto nel tempo, allora il quadrato del tempo è positivo, le distanze sono zero e il quadrato dell’intervallo è positivo; questo è un intervallo detto di tipo temporale. Nel nostro diagramma dello spazio-tempo, quindi, avremmo una rappresentazione di questo tipo: a 45° vi sono due linee (in realtà, in quattro dimensioni esse saranno «coni», detti coni di luce) e i punti su queste linee sono tutti a intervallo zero dall’origine. Quando la luce parte da un dato punto è sempre separata da esso da un intervallo zero, come vediamo dall’equazione (17.5). Incidentalmente, abbiamo giusto dimostrato che se la luce viaggia a velocità c in un sistema, viaggia nell’altro con la stessa velocità c, per il fatto che se l’intervallo è lo stesso in entrambi i sistemi, cioè zero in uno e zero nell’altro, allora affermare che la velocità di propagazione della luce è invariante è lo stesso che dire che l’intervallo è zero.

17.3

Passato, presente e futuro

La regione spazio-temporale che circonda un dato punto dello spazio-tempo può essere divisa in tre regioni, come mostrato in FIGURA 17.3. In una regione abbiamo intervalli di tipo spaziale e in due regioni intervalli di tipo temporale. Fisicamente queste tre regioni nelle quali è diviso lo spazio-tempo attorno a un determinato punto, hanno un’interessante relazione fisica con tale punto: un oggetto fisico o un segnale può andare da un punto nella regione 2 all’evento O muovendosi con una velocità minore di quella della luce. Quindi eventi in questa regione possono influenzare il punto O, possono avere su di esso un’influenza dal passato. Infatti, naturalmente, un oggetto in P sull’asse negativo t è precisamente nel «passato» rispetto a O; ha le stesse coordinate spaziali di O, soltanto che è antecedente. Quanto è accaduto là allora interessa O ora. (Sfortunatamente è così che va la vita.) Un altro oggetto in Q può raggiungere O muovendosi con una certa velocità minore di c, così se questo oggetto fosse in

179

Capitolo 17 • Spazio-tempo

180

© 978-8808-22107-0

una nave spaziale in movimento sarebbe di nuovo il passato del punto avente le stesse coordinate spaziali. Cioè in un altro sistema di coordinate Futuro l’asse del tempo potrebbe attraversare sia O sia Q. Dunque tutti i punti della Cono luce 3 O regione 2 sono nel «passato» di O, e tutto ciò che accade in questa regione può influenzare O. Quindi la regione 2 è talvolta detta passato influente 1 1 o passato che ha influenza; esso è il luogo di tutti gli eventi che possono x R influenzare il punto O in un qualche modo. Q P 2 Cono luce La regione 3, d’altra parte, è una regione che possiamo influenzare da Passato O, possiamo «colpire» cose sparando «pallottole» a velocità inferiore a c. Così questo è il mondo il cui futuro può essere influenzato da noi, e possiamo chiamarlo futuro influenzabile. Ora la cosa interessante sul rimanente FIGURA 17.3 La regione spazio-tempo attorno a un punto posto nell’origine. spazio-tempo, cioè la regione 1, è che noi non possiamo né influenzarla da O, né essa può influenzarci ora in O, poiché niente può andare a velocità maggiore di quella della luce. Naturalmente quello che accade in R può influenzarci più tardi; cioè, se il Sole sta esplodendo «proprio ora», occorrono otto minuti prima che noi lo sappiamo, e non è possibile che ci influenzi prima di allora. Quello che intendiamo con «proprio ora» è una cosa misteriosa che non possiamo definire e che non possiamo influenzare, ma che può influenzarci più tardi, o che potremmo avere influenzato se avessimo fatto qualcosa abbastanza lontano nel passato. Quando osserviamo la stella Alfa Centauri, la vediamo com’era quattro anni prima; potremmo domandarci come appare «ora». «Ora» significa nello stesso momento nel nostro particolare sistema di coordinate. Possiamo vedere Alfa Centauri solamente per mezzo della luce che ha inviato dal nostro passato, quattro anni prima, ma non sappiamo che cosa stia facendo «ora»; occorreranno quattro anni prima che quello che sta facendo «ora» possa influenzarci. L’Alfa Centauri «ora» è un concetto o un’idea della nostra mente; non è qualcosa che sia realmente fisicamente definibile al momento, poiché dobbiamo aspettare per osservarla, non possiamo nemmeno definirla esattamente «ora». Inoltre l’«adesso» dipende dal sistema di coordinate. Se, per esempio, l’Alfa Centauri fosse in movimento, un osservatore là non sarebbe d’accordo con noi perché porrebbe i suoi assi secondo un certo angolo, e il suo «ora» sarebbe un tempo diverso. Abbiamo già parlato del fatto che la simultaneità non è una cosa unica. Vi sono indovini e persone che affermano di conoscere il futuro, e vi sono storie meravigliose attorno all’uomo che scopre improvvisamente di avere conoscenza del futuro influenzabile. Bene, vi sono molti paradossi derivati da questo, perché se conosciamo qualcosa che sta per accadere, allora possiamo essere sicuri di evitarlo facendo la cosa giusta al momento giusto e così via. Ma in realtà non vi sono indovini che possano dirci nemmeno il presente! Non c’è nessuno che possa dirci che cosa in realtà sta accadendo proprio ora, a qualsiasi distanza ragionevole, perché ciò è inosservabile. Potremmo porci noi stessi questo problema, la cui soluzione lasciamo allo studente: si avrebbe qualche paradosso se divenisse improvvisamente possibile conoscere cose che sono negli intervalli di tipo spaziale della regione 1? t

17.4

Ancora sui quadrivettori

Ritorniamo ora alla nostra considerazione dell’analogia della trasformazione di Lorentz e delle rotazioni degli assi spaziali. Abbiamo imparato l’utilità di raggruppare altre quantità che hanno le stesse proprietà di trasformazione delle coordinate, per formare quelli che chiamiamo vettori, linee orientate. Nel caso delle comuni rotazioni vi sono parecchie quantità che si trasformano nello stesso modo di x, y e z per effetto della rotazione: per esempio la velocità ha tre componenti, una componente x, una y e una z; vista da un diverso sistema di coordinate, nessuna delle componenti è la stessa, ma tutte sono trasformate in valori nuovi. Ma, in un modo o in un altro, la velocità «stessa» ha una realtà maggiore di qualunque delle sue componenti particolari, e noi la rappresentiamo con una linea orientata. Noi quindi ci domandiamo: è o non è vero che vi sono quantità che si trasformano, o che sono collegate, in un sistema in movimento e in un sistema immobile, nello stesso modo di x, y, z e t?

17.4 • Ancora sui quadrivettori

© 978-8808-22107-0

Dalla nostra esperienza coi vettori, sappiamo che tre delle quantità, x, y e z, costituirebbero le tre componenti di un comune vettore nello spazio, ma la quarta componente si comporterebbe come un comune scalare per una rotazione spaziale, perché non varia fino a che non andiamo a sistemi di coordinate in movimento. È allora possibile associare ad alcuni dei nostri «vettori tridimensionali» conosciuti, un quarto oggetto, che potremmo chiamare la «componente temporale», in modo tale che i quattro oggetti insieme «ruotino» allo stesso modo della posizione e del tempo nello spaziotempo? Mostreremo ora che vi è in effetti almeno un oggetto di questo tipo (ve ne sono parecchi in realtà): le tre componenti della quantità di moto e l’energia come componente temporale, si trasformano insieme per formare quello che chiamiamo un «quadrivettore». Nel dimostrare questo, poiché è piuttosto seccante dover scrivere le c dappertutto, useremo lo stesso accorgimento che abbiamo usato nelle equazioni (17.4) per le unità di energia, di massa e di quantità di moto. Energia e massa, per esempio, differiscono soltanto di un fattore c2 che è semplicemente una questione di unità, così potremo dire che l’energia è la massa. Evitando di scrivere c2 , poniamo E = m, e poi, naturalmente, se vi fosse qualche difficoltà introdurremmo la giusta potenza di c cosicché le unità tornerebbero a posto nell’ultima equazione, ma non in quelle intermedie. In questo modo le nostre equazioni per l’energia e la quantità di moto sono m0 E=m= p 1 v2 m0 v p = mv = p 1 v2

(17.6)

Inoltre in queste unità, abbiamo E2

p2 = m02

(17.7)

Per esempio, se misuriamo l’energia in elettronvolt, che cosa significa una massa di 1 eV? Significa la massa la cui energia di riposo è 1 eV, cioè m0 c2 è 1 eV. Per esempio la massa a riposo di un elettrone è 0,511 · 106 eV. Ora, come apparirebbero la quantità di moto e l’energia in un nuovo sistema di coordinate? Per saperlo dovremo trasformare le equazioni (17.6), cosa che possiamo fare perché sappiamo come si trasforma la velocità. Supponiamo che, quando lo misuriamo, un oggetto abbia una certa velocità, ma quando osserviamo lo stesso oggetto da una nave spaziale che è essa stessa in movimento con velocità u, in tale sistema usiamo un apice per designare la quantità corrispondente. Al fine di semplificare inizialmente le cose considereremo il caso in cui la velocità v sia in direzione di u. (In seguito, possiamo fare il caso più generale.) Quanto vale v 0, la velocità vista dalla nave spaziale? Essa è la velocità composta, la «differenza» fra v e u. Per la legge che abbiamo ricavato prima, v u v0 = (17.8) 1 uv Calcoliamo ora la nuova energia E 0, l’energia come la vedrebbe la persona nella nave spaziale. Quella persona userebbe la stessa massa a riposo, naturalmente, ma userebbe v 0 per la velocità. Ciò che dobbiamo fare è il quadrato di v 0, sottrarlo da 1, prendere la radice quadrata, e poi il reciproco: v 2 2uv + u2 v0 2 = 1 2uv + u2 v 2 1

v0 2 =

=

2uv + u2 v 2 v 2 + 2uv 1 2uv + u2 v 2

1

1

=

v 2 u2 + u2 v 2 (1 v 2 )(1 u2 ) = 1 2uv + u2 v 2 (1 uv)2

Quindi p

u2

1 1

v 02

=p 1

1

uv p v2 1

u2

(17.9)

181

Capitolo 17 • Spazio-tempo

182

© 978-8808-22107-0

L’energia E 0 è semplicemente m0 per l’espressione sopra. Ma noi vogliamo esprimere l’energia in funzione dell’energia e della quantità di moto senza apici, e notiamo che

0

m0

E =p 1

m0 uv = p 2 v 1 u2

ossia

E E0 = p

p

m0 1

v2 p

p 1

m0 v

1 u2

v2

u

upx 1

u2

(17.10)

che ci rendiamo conto avere esattamente la stessa forma di t t0 = p

ux 1

u2

Successivamente dobbiamo trovare le nuova quantità di moto px0 . Questa è semplicemente l’energia E 0 per v 0, ed è anche espressa semplicemente in funzione di E e di p: px0 = E 0 v 0 = p

m0 (1 1

v2

uv) v u m0 v m0 u =p p p 2 1 uv 1 u 1 v 2 1 u2

Quindi px uE px0 = p 1 u2

(17.11)

che riconosciamo avere esattamente la stessa forma di x ut x0 = p 1 u2 Quindi le trasformazioni per la nuova energia e la nuova quantità di moto in funzione della vecchia energia e della vecchia quantità di moto sono esattamente le stesse delle trasformazioni per t 0 in funzione di t e di x, e per x 0 in funzione di x e di t: tutto quello che dobbiamo fare è sostituire E ogni volta che vediamo t nelle (17.4), e sostituire px ogni volta che vediamo x, e allora le equazioni (17.4) diverranno le equazioni (17.10) e (17.11). Questo implicherebbe, se tutto funziona, una regola aggiuntiva cioè che py0 = py e che pz0 = pz . Il provarlo richiederebbe di tornare indietro e studiare il moto in direzione trasversale. In realtà abbiamo studiato questo tipo di moto nel precedente capitolo. Abbiamo analizzato un urto complicato e abbiamo notato che, in effetti, la quantità di moto trasversale non cambia quando è osservata da un sistema in movimento, così abbiamo già verificato che py0 = py e pz0 = pz . La trasformazione completa è dunque px uE px0 = p 1 u2 py0 = py pz0 = pz E upx E0 = p 1 u2

t p

x

17.4 Il quadrivettore quantità di moto di una particella. FIGURA

(17.12)

In queste trasformazioni, quindi, abbiamo scoperto quattro quantità che si trasformano come x, y, z e t e che chiamiamo il quadrivettore quantità di moto. Poiché la quantità di moto è un quadrivettore, essa può essere rappresentata, in un diagramma spazio-tempo di una particella in movimento, con una «freccia» tangente alla traiettoria come mostrato in FIGURA 17.4. Questa freccia ha una componente temporale uguale all’energia, e le sue componenti spaziali rappresentano la sua quantità di moto tridimensionale; questa freccia è più «reale» sia dell’energia sia della quantità di moto, poiché queste dipendono semplicemente da come osserviamo il diagramma.

17.5 • Algebra dei quadrivettori

© 978-8808-22107-0

17.5

Algebra dei quadrivettori

La notazione per i quadrivettori è diversa da quella per i vettori tridimensionali. Nel caso di vettori tridimensionali, se parlassimo della comune quantità di moto, la scriveremmo come p. Se volessimo essere più specifici, potremmo dire che essa ha tre componenti che sono, per gli assi in questione, px , py e pz , oppure potremmo semplicemente riferirci alla componente generica come a pi e dire che i potrebbe essere sia x sia y sia z, e che queste sono le tre componenti; cioè, immaginiamo che i sia una qualunque delle tre direzioni x, y o z. La notazione che usiamo per i quadrivettori è analoga a questa: scriviamo pµ e µ sta per le quattro direzioni possibili t, x, y o z. Potremmo, naturalmente, usare qualsiasi notazione vogliamo; non ridete delle notazioni: inventatene, esse sono efficaci. In effetti la matematica è, in gran parte, invenzione di notazioni migliori. L’intero concetto di vettore quadrimensionale è un miglioramento nella notazione, affinché le trasformazioni possano essere più facilmente ricordate. Aµ , dunque, è un generico quadrivettore, ma per il caso particolare della quantità di moto, pt si identifica con l’energia, px è la quantità di moto in direzione x, py è quella in direzione y e pz è quella in direzione z. Per sommare i quadrivettori, addizioniamo le componenti corrispondenti. Se vi è un’equazione fra quadrivettori, allora l’equazione è valida per ciascuna componente. Per esempio, se la legge di conservazione della quantità di moto tridimensionale è esatta nelle collisioni fra particelle, cioè se la somma delle quantità di moto per un gran numero di particelle interagenti o collidenti deve essere costante, ciò deve significare che le somme di tutte le quantità di moto in direzione x, in direzione y e in direzione z, per tutte le particelle, devono ciascuna essere costante. Questa legge da sola sarebbe impossibile nella relatività, poiché è incompleta; è come parlare di sole due componenti di un vettore tridimensionale. È incompleta perché se ruotiamo gli assi, mischiamo le varie componenti, così dobbiamo includere tutte e tre le componenti nella nostra legge. Allo stesso modo, in relatività, dobbiamo completare la legge della conservazione della quantità di moto estendendola per includere la componente temporale. È assolutamente necessario che questa si integri alle altre tre, altrimenti non vi può essere invarianza relativistica. La conservazione dell’energia è la quarta equazione che si accompagna alla conservazione della quantità di moto, per creare una valida relazione quadrivettoriale nella geometria dello spazio e del tempo. Così la legge della conservazione dell’energia e della quantità di moto nella notazione quadrimensionale è X X pµ = pµ (17.13) particelle entranti

particelle uscenti

ossia, con una notazione leggermente diversa, X X piµ = p jµ i

(17.14)

j

dove i = 1, 2, . . . si riferisce alle particelle che entrano nell’urto, j = 1, 2, . . . si riferisce alle particelle che escono dall’urto, e µ può assumere il valore x, y, z o t. Domanda: «Rispetto a quali assi?». Non fa differenza. La legge è valida per ogni componente, usando assi qualsiasi. Nell’analisi dei vettori abbiamo discusso un’altra cosa, il prodotto scalare di due vettori. Consideriamo ora la cosa corrispondente nello spazio-tempo. Nella rotazione comune scoprimmo che vi era una quantità invariabile: x 2 + y 2 + z 2 . Nelle quattro dimensioni troviamo che la quantità corrispondente è t 2 x 2 y 2 z 2 (equazione (17.3)). Come possiamo scriverlo? Un modo sarebbe di scrivere un qualche tipo di cosa quadrimensionale con in mezzo un segno di forma quadrata, come Aµ Bµ ; una delle notazioni che viene usata in realtà è X0 Aµ Aµ = A2t A2x A2y A2z (17.15) µ

P

L’apice su significa che il primo termine, il termine «temporale», è positivo, ma gli altri tre termini hanno segno meno. Questa quantità, dunque, sarà la stessa in qualsiasi sistema di coordinate e possiamo chiamarla quadrato della lunghezza del quadrivettore.

183

184

Capitolo 17 • Spazio-tempo

© 978-8808-22107-0

Per esempio, qual è il quadrato della quantità di moto quadrivettoriale di una singola particella? Sarà uguale a pt2 p2x py2 pz2 ossia, in altre parole, E 2 p2 , perché sappiamo che pt è E. Che cos’è E 2 p2 ? Deve essere qualche cosa che è la stessa in qualsiasi sistema di coordinate. In particolare deve essere la stessa per un sistema di coordinate in movimento con la particella, rispetto al quale essa appare in quiete. Se la particella è ferma non vi sarà quantità di moto. Così in tale sistema di coordinate vi è solamente l’energia della particella, che è uguale alla massa a riposo. Quindi E 2 p2 = m02 Vediamo così che il quadrato della lunghezza di questo vettore, il quadrivettore quantità di moto, è uguale a m02 . Dal quadrato di un vettore possiamo inventare il «prodotto scalare», ossia il prodotto che dia uno scalare: se aµ è un quadrivettore e bµ è un altro quadrivettore, allora il prodotto scalare è X0 aµ bµ = at bt a x bx ay by az bz (17.16) che è lo stesso in tutti i sistemi di coordinate. Infine, menzioneremo alcune cose la cui massa a riposo m0 è zero. Un fotone di luce, per esempio. Un fotone è simile a una particella in quanto trasporta un’energia e una quantità di moto. L’energia di un fotone è una certa costante, detta costante di Planck, per la frequenza del fotone stesso: E=h

Un fotone del genere trasporta anche una quantità di moto, e la quantità di moto di un fotone (o in effetti di qualsiasi altra particella) è h divisa per la lunghezza d’onda: p=

h

Ma per un fotone vi è una relazione definita tra la frequenza e la lunghezza d’onda: =

c

(il numero di onde per secondo, per la lunghezza d’onda di ciascuna, è la distanza che la luce percorre in 1 secondo, che, naturalmente, è c). Vediamo così immediatamente che l’energia di un fotone deve essere la quantità di moto per c, ossia se c = 1, l’energia e la quantità di moto sono uguali. Il che equivale a dire che la massa a riposo è zero. Occupiamoci ancora di questo, ciò è piuttosto strano. Se una particella ha massa a riposo uguale a zero, che cosa accade quando si p ferma? Non si ferma mai! Va sempre a velocità c. La formula usuale per l’energia è m0 / 1 v 2 . Ora, possiamo dire che m0 = 0 e v = 1, cosicché l’energia è zero? Non possiamo dire che è zero; il fotone in realtà può avere (e infatti ha) energia anche se non ha massa a riposo, energia che possiede appunto in quanto si propaga costantemente alla velocità della luce! Sappiamo anche che la quantità di moto di ogni particella è uguale alla sua energia totale per la sua velocità: se c = 1, p = vE ossia, nelle comuni unità, p=

vE c2

Per qualsiasi particella in movimento alla velocità della luce, p = E se c = 1. Le formule per l’energia di un fotone visto da un sistema in movimento sono, naturalmente, date dalle equazioni (17.12), ma per la quantità di moto dobbiamo sostituire l’energia moltiplicata per c (o per 1 in questo caso). La differenza nell’energia dopo la trasformazione significa che vi sono frequenze differenti. Questo si chiama effetto Doppler, e si può calcolare facilmente dalle equazioni (17.12), usando anche E = p ed E = h . Come disse Minkowski, «Lo spazio in se stesso e il tempo in se stesso diverranno semplici ombre, e sopravviverà soltanto una specie di legame fra loro».

18

Rotazione in due dimensioni

18.1

Il centro di massa

Nel precedente capitolo abbiamo studiato la meccanica dei punti, ossia di piccole particelle la cui struttura interna non ci interessa. Nei prossimi capitoli studieremo l’applicazione delle leggi di Newton a oggetti più complessi. Quando il mondo diviene più complesso, diviene anche più interessante, e troveremo che i fenomeni legati con la meccanica di un oggetto più complesso rispetto a un semplice punto, sono in realtà del tutto sorprendenti. Naturalmente questi fenomeni non implicano altro che le leggi di Newton, ma talvolta è difficile credere che sia in funzione soltanto la legge F = ma. Gli oggetti più complessi con cui abbiamo a che fare possono essere di vario genere: acqua corrente, galassie rotanti e così via. Per cominciare, il più semplice oggetto «complesso» da analizzare è quello che chiamiamo un corpo rigido, un oggetto solido che ruota mentre si muove. Però anche un oggetto così semplice può avere un moto molto complicato, e perciò considereremo per prima cosa gli aspetti più semplici di tale moto, in cui un corpo esteso ruota attorno a un asse fisso. Un dato punto di un tale corpo si muove allora in un piano perpendicolare a tale asse. La rotazione di un corpo attorno a un asse fisso è detta rotazione piana o rotazione in due dimensioni. Generalizzeremo in seguito i risultati alle tre dimensioni, ma facendo ciò troveremo che, diversamente dalla normale meccanica di una particella, le rotazioni sono difficili da comprendere, a meno che non ci facciamo prima una solida base in due dimensioni. Il primo interessante teorema relativo al moto di oggetti complessi può essere osservato in funzione se lanciamo in aria un oggetto fatto da un piccolo masso fissato con una corda a un estremo di un bastone di legno. Sappiamo naturalmente che questo oggetto compie una parabola, poiché abbiamo studiato il problema per una particella. Ma ora il nostro oggetto non è una particella: esso ruota nell’aria, tuttavia descrive una parabola, è chiaro. Che cosa descrive una parabola? Certamente non un punto sul bordo del masso, poiché esso sta oscillando, né quello alla fine del bastone, né quello al centro del bastone, né il centro del piccolo masso. Ma qualcosa percorre una traiettoria parabolica, vi è un «centro» effettivo che si muove lungo una parabola. Così il nostro primo teorema sugli oggetti complessi ha lo scopo di dimostrare che esiste un punto medio matematicamente definibile, ma che non è necessariamente un punto dell’oggetto stesso, che descrive una parabola. Questo teorema è chiamato teorema del centro di massa, e la sua dimostrazione è la seguente. Possiamo considerare qualsiasi oggetto come costituito di un insieme di piccole particelle, gli atomi, con varie forze fra loro. Sia i un indice che definisce ciascuna delle particelle. (Ve ne sono milioni, così i arriva fino a 1023 , o qualcosa di simile.) Allora la forza sulla particella i-esima è, naturalmente, la massa per l’accelerazione di quella particella: Fi = mi

d2 ri dt 2

(18.1)

Per alcuni dei capitoli che seguono i nostri oggetti in movimento saranno oggetti in cui tutte le parti si muovono a velocità molto minore di quella della luce, e useremo per tutte le quantità

186

Capitolo 18 • Rotazione in due dimensioni

© 978-8808-22107-0

l’approssimazione non relativistica. In queste circostanze la massa è costante, cosicché Fi =

d2 mi ri dt 2

(18.2)

Se ora sommiamo le forze agenti su tutte le particelle, cioè se consideriamo la somma di tutte le Fi agenti sulle particelle, otteniamo la forza totale F. Dall’altro lato dell’equazione otteniamo lo stesso risultato come se sommassimo prima di differenziare: ◆ X d2 ✓X Fi = F = 2 mi r i (18.3) dt i i

Quindi la forza totale è la somma delle derivate seconde delle masse per le loro posizioni. Ora la forza totale su tutte le particelle è la forza esterna. Perché? Benché sulle particelle agiscano tutti i tipi di forze a causa della corda, delle oscillazioni, degli urti e delle attrazioni, delle forze atomiche e di chi sa cosa, e noi le dobbiamo sommare tutte insieme, siamo salvati dalla terza legge di Newton. Per ogni coppia di particelle, l’azione e la reazione sono uguali, così che, quando sommiamo tutte le equazioni, se fra due particelle qualsiasi agiscono forze, esse vengono cancellate nella somma; quindi il risultato netto è costituito soltanto da quelle forze che derivano da altre particelle che non sono incluse nell’oggetto, qualunque esso sia, su cui eseguiamo la somma. Così se l’equazione (18.3) è la somma su un certo numero di particelle che insieme sono chiamate l’«oggetto», allora la forza esterna su tutto l’oggetto è uguale alla somma di tutte le forze su tutte le particelle che lo costituiscono. Ora sarebbe bello se potessimo scrivere l’equazione (18.3) come la massa totale per una certa accelerazione. Possiamo farlo. Indichiamo con M la somma di tutte le masse, cioè la massa totale. Se definiamo un certo vettore R come X mi r i R= (18.4) M i l’equazione (18.3) sarà semplicemente

F=

d2 (M R) d2 R = M dt 2 dt 2

(18.5)

poiché M è una costante. Così troviamo che la forza esterna è la massa totale per l’accelerazione di un punto immaginario la cui posizione è R. Questo punto è chiamato centro di massa del corpo. È un punto in qualche luogo nel «mezzo» dell’oggetto, una specie di r medio in cui i diversi ri hanno pesi o importanza proporzionali alle masse. Discuteremo questo importante teorema in maggior dettaglio in un capitolo successivo, e ci limiteremo quindi a sottolineare due punti: in primo luogo, se le forze esterne fossero nulle, se l’oggetto fluttuasse in uno spazio vuoto, potrebbe agitarsi, oscillare, avvitarsi e fare ogni genere di movimento. Ma il centro di massa, questa posizione inventata artificialmente, calcolata, che si trova in qualche punto nel corpo, si muoverà con una velocità costante. In particolare, se esso è inizialmente in quiete resterà in quiete. Così se abbiamo una specie di contenitore, per esempio una nave spaziale, con persone dentro, e calcoliamo la posizione del centro di massa e troviamo che è fermo, allora il centro di massa continuerà a rimanere fermo se non vi sono forze esterne agenti sul contenitore. Naturalmente la nave spaziale può muoversi un po’ nello spazio, ma questo è causato dal fatto che le persone camminano avanti e indietro all’interno; quando uno cammina verso la parte anteriore, la nave retrocede in modo da mantenere la posizione media di tutte le masse esattamente nello stesso punto. La propulsione a razzo è quindi assolutamente impossibile a causa del fatto che non possiamo muovere il centro di massa? No; ma naturalmente troviamo che, per spingere avanti una parte del razzo che ci interessa, deve essere lanciata via una parte che non ci interessa. In altre parole, se partiamo con un razzo a velocità zero ed espelliamo gas dalla parte posteriore, allora questa piccola quantità di gas va da una parte mentre la nave spaziale va dall’altra, ma il centro di massa rimane esattamente dove era prima. Così semplicemente muoviamo la parte che ci interessa rispetto a quella che non ci interessa.

18.2 • Rotazione di un corpo rigido

© 978-8808-22107-0

Il secondo punto relativo al centro di massa, che è il motivo per cui lo abbiamo introdotto ora nella nostra discussione, è che può essere trattato separatamente dai moti «interni» di un oggetto, e può quindi venire ignorato nella discussione sulla rotazione.

18.2

Rotazione di un corpo rigido

Discutiamo ora le rotazioni. Naturalmente un oggetto comune non ruota semplicemente, esso oscilla, si deforma e si piega, così per semplificare l’argomento discuteremo il moto di un inesistente oggetto ideale che chiamiamo corpo rigido. Con questo termine indichiamo un oggetto in cui le forze fra gli atomi sono così forti e di natura tale che le forze che sono necessarie per muoverlo non lo deformano. Quando si sposta, la sua forma rimane essenzialmente la stessa. Se volessimo studiare il moto di un tale corpo, e decidere di ignorare il moto del suo centro di massa, vi è una sola cosa che gli resta da fare, cioè ruotare. Dobbiamo descrivere questo. Come? Supponiamo che vi sia una qualche linea del corpo che resti fissa (che può includere il centro di massa oppure no), e che il corpo stia ruotando attorno a questa linea particolare come attorno a un asse. Come definiamo la rotazione? Ciò è abbastanza facile perché se segniamo un punto da qualche parte sull’oggetto, ovunque tranne che sull’asse, possiamo dire sempre esattamente dove si trova l’oggetto, se soltanto sappiamo dov’è andato questo punto. La sola cosa necessaria per descrivere la posizione di tale punto è un angolo. Quindi la rotazione consiste in uno studio delle variazioni di un angolo con il tempo. Per studiare la rotazione, osserviamo l’angolo del quale ha ruotato il corpo. Naturalmente non stiamo riferendoci a qualsiasi angolo particolare all’interno dell’oggetto stesso; non è che dobbiamo tracciare qualche angolo sull’oggetto. Stiamo parlando della variazione angolare della posizione dell’intero insieme, da un istante all’altro. Per prima cosa studiamo la cinematica delle rotazioni. L’angolo cambierà con il tempo e così come abbiamo parlato di posizione e di velocità in una dimensione, possiamo parlare di posizione angolare e di velocità angolare in una rotazione piana. In effetti vi è una forma di relazione molto interessante fra la rotazione bidimensionale e lo spostamento unidimensionale, in cui quasi tutte le quantità hanno la loro analoga. In primo luogo abbiamo l’angolo ✓ che definisce di quanto il corpo ha ruotato; questo sostituisce la distanza y, che definisce il tratto di spostamento lineare. Allo stesso modo abbiamo la velocità di rotazione !=

d✓ dt

che esprime l’entità della variazione dell’angolo in un secondo, così come v = ds/dt descrive la velocità di un oggetto, ossia quale distanza essa percorre in un secondo. Se l’angolo viene misurato in radianti, allora la velocità angolare sarà tanti radianti per secondo. Maggiore è la velocità angolare, più in fretta ruota l’oggetto, più rapida è la variazione dell’angolo. Possiamo andare oltre: possiamo differenziare la velocità angolare rispetto al tempo, e chiamare ↵=

d! d2 ✓ = 2 dt dt

accelerazione angolare. Questa sarebbe l’analoga dell’accelerazione comune. Naturalmente ora dovremo mettere in relazione la dinamica della rotazione con le leggi della dinamica delle particelle di cui l’oggetto è costituito, così dobbiamo trovare in che modo si muove una particella particolare quando la velocità angolare ha un certo valore. Per fare questo prendiamo una certa particella che è posta a distanza r dall’asse e diciamo che essa è in una certa posizione P(x, y) a un dato istante, nel modo solito (FIGURA 18.1). Se a un dato istante che segue, dopo un tempo t, l’angolo dell’intero oggetto ha ruotato di ✓, allora la particella è stata trasportata con esso. Essa è alla stessa distanza radiale da O che aveva prima, ma è stata trasportata in Q. La prima cosa che desidereremmo conoscere è quanto cambia la distanza x e quanto la distanza y. Se OP è indicato con r, allora la lunghezza PQ è r ✓, a causa della definizione di

187

Capitolo 18 • Rotazione in due dimensioni

188

angolo. La variazione di x è allora semplicemente la proiezione di r ✓ in direzione x: y x = PQ sen ✓ = r ✓ = y ✓ (18.6) r Similmente y = +x ✓ (18.7)

y vx v

vy

Q ∆

P(x,y) r

O

y

x

x

18.1 Cinematica della rotazione bidimensionale. FIGURA

© 978-8808-22107-0

Se l’oggetto sta girando con una determinata velocità angolare, troviamo, dividendo entrambi i termini della (18.6) e della (18.7) per t, che la velocità della particella è vx = !y (18.8) vy = +!x

Naturalmente, se vogliamo trovare l’intensità della velocità, scriviamo semplicemente q q q v = vx2 + vy2 = !2 y 2 + !2 x 2 = ! x 2 + y 2 = !r

(18.9)

Non dovrebbe essere un mistero che il valore dell’intensità di questa velocità è !r; infatti dovrebbe essere di per sé evidente, dato che la distanza percorsa è r e la distanza percorsa in un secondo è r ✓/ t, ossia r!. Passiamo ora a considerare la dinamica della rotazione. Qui deve essere introdotto un nuovo concetto, la forza. Vediamo se possiamo inventare qualcosa che chiameremo momento(1) , che rispetto alla rotazione ha la stessa relazione che la forza ha rispetto al movimento lineare. Una forza è la cosa necessaria per produrre un moto lineare, e la cosa che fa sì che qualcosa ruoti è una «forza rotante» ossia una «forza torcente», cioè un momento. Qualitativamente il momento è una «torsione», ma che cos’è quantitativamente? Otterremo quantitativamente la teoria dei momenti studiando il lavoro prodotto nel far ruotare un oggetto, perché un modo molto elegante di definire una forza è di dire quanto lavoro produce quando agisce per un determinato spostamento. Cercheremo di mantenere l’analogia fra le quantità lineari e le quantità angolari, uguagliando il lavoro che compiamo quando facciamo ruotare qualcosa di un po’, mentre vi sono forze che agiscono sull’oggetto, al momento per l’angolo di rotazione. In altre parole la definizione di momento deve essere introdotta in modo tale che il teorema del lavoro abbia un esatto analogo: la forza per la distanza è il lavoro, e il momento per l’angolo deve essere lavoro. Consideriamo per esempio un corpo rigido di un qualche tipo con varie forze agenti su di esso, e un asse attorno al quale il corpo ruota. Concentriamoci all’inizio su una forza e supponiamo che questa forza sia applicata a un certo punto (x, y). Quanto lavoro sarebbe prodotto se girassimo l’oggetto di un piccolissimo angolo? Questo è facile. Il lavoro fatto è W = Fx x + Fy y

(18.10)

Sostituendo le equazioni (18.6) e (18.7) per x e y, otteniamo W = (xFy

yFx ) ✓

(18.11)

Cioè la quantità di lavoro compiuto è in effetti uguale all’angolo del quale abbiamo ruotato l’oggetto, moltiplicato per una strana combinazione di forza e di distanza. Questa «strana combinazione» è ciò che chiamiamo momento. Così, definendo la variazione del lavoro come il momento per l’angolo, abbiamo ora la formula per il momento in funzione delle forze. (Ovviamente, il momento non è un’idea completamente nuova indipendente dalla meccanica di Newton: il momento deve avere un’espressione definita in funzione della forza.) Quando vi sono parecchie forze in azione, il lavoro che viene fatto è naturalmente la somma dei lavori prodotti da tutte le forze, così che W sarà un insieme di termini, tutti sommati insieme, per tutte le forze, ciascuno dei quali è però proporzionale a ✓. Possiamo mettere in evidenza (1) Letteralmente: «che chiameremo il torchio (dal latino torquere, torcere)». Il nome torchio non è usato in italiano con questo significato. Useremo anche in seguito la parola momento (sottintendendo momento della forza) e saltando la frase in cui, nel testo originale, viene introdotta la parola «momento». (N.d.T.)

18.3 • Momento della quantità di moto

© 978-8808-22107-0

e quindi dire che il lavoro è uguale alla somma di tutti i momenti dovuti a tutte le diverse forze agenti, per ✓. Questa somma possiamo chiamarla momento totale. Così i momenti si sommano con le comuni leggi algebriche, ma vedremo più tardi che ciò dipende soltanto dal fatto che stiamo lavorando in un piano. Ciò è simile alla cinematica unidimensionale, dove le forze si addizionano semplicemente in modo algebrico, ma soltanto perché esse sono tutte nella stessa direzione. In tre dimensioni è più complicato. Così, per la rotazione bidimensionale, abbiamo: ⌧i = x i Fyi ⌧=

X

yi Fxi ⌧i

(18.12) (18.13)

Bisogna sottolineare che il momento è riferito a un determinato asse. Se si sceglie un asse diverso, cosicché tutti gli x i e gli yi cambiano, anche il valore del momento generalmente cambia. Indugiamo ora brevemente per notare che la nostra precedente introduzione di momento, attraverso il concetto di lavoro, ci dà un risultato molto importante per un oggetto in equilibrio: se tutte le forze agenti su un oggetto sono in equilibrio sia per traslazione sia per rotazione, non solo la forza totale è zero, ma è zero anche la somma di tutti i momenti, poiché se un oggetto è in equilibrio, nessun lavoro è fatto dalle forze per un piccolo spostamento. Quindi, poiché W = ⌧ ✓ = 0, la somma di tutti i momenti deve essere zero. Così vi sono due condizioni per l’equilibrio: che la somma delle forze sia zero, e che la somma dei momenti sia zero. Dimostrate che è sufficiente essere sicuri che la somma dei momenti rispetto a un qualsiasi asse (in due dimensioni) sia zero. Consideriamo ora una singola forza, e cerchiamo di rappresentare geometricamente a che cosa ammonti xFy yFx . In FIGURA 18.2 vediamo una O ∆ forza F agente nel punto r. Quando l’oggetto ha ruotato di un piccolo Ft angolo ✓, il lavoro fatto, naturalmente, è la componente della forza in r r0 Fr direzione dello spostamento per lo spostamento. In altre parole, è soltanr∆ to la componente tangenziale della forza che conta, e questa deve essere F P S moltiplicata per la distanza r ✓. Quindi vediamo che il momento è uguale alla componente tangenziale della forza (perpendicolare al raggio) per il raggio. Questo è comprensibile mediante il nostro comune concetto di mo- FIGURA 18.2 Il momento prodotto da una forza. mento, perché se la forza fosse interamente radiale, non imprimerebbe una «torsione» al corpo; è evidente che l’effetto torcente dovrebbe coinvolgere soltanto la parte della forza non diretta radialmente, e ciò significa che parliamo della componente tangenziale. Inoltre, è chiaro che una data forza ha effetto maggiore su un braccio lungo che vicina all’asse. Infatti, se prendiamo il caso in cui spingiamo direttamente sull’asse non imprimiamo nessuna torsione! Così si capisce che l’entità della torsione, o momento, è proporzionale sia alla distanza radiale sia alla componente tangenziale della forza. Vi è anche una terza formula relativa al momento che è molto interessante. Abbiamo visto che il momento è la forza per il raggio per il seno dell’angolo ↵ (FIGURA 18.2). Ma se prolunghiamo la linea di azione della forza e tracciamo la linea OS, la distanza perpendicolare alla linea di azione della forza (il braccio della forza), notiamo che questo braccio è più corto di r proprio nella stessa proporzione in cui la parte tangenziale della forza è minore della forza totale. Quindi la formula del momento può anche essere scritta come l’intensità della forza per la lunghezza del braccio. L’origine della parola momento è oscura, ma può essere collegata al fatto che «momento» è derivato dal latino movimentum, e che la capacità di una forza di muovere un oggetto (usando la forza su una leva o un piede di porco) aumenta con la lunghezza del braccio di leva. In matematica «momento» significa pesato rispetto alla distanza da un asse.

18.3

Momento della quantità di moto

Benché abbiamo considerato finora soltanto il caso particolare di un corpo rigido, le proprietà dei momenti e delle loro relazioni matematiche sono interessanti anche quando un oggetto non

189

190

Capitolo 18 • Rotazione in due dimensioni

© 978-8808-22107-0

è rigido. Infatti possiamo dimostrare un notevolissimo teorema: proprio come la forza esterna è la rapidità di variazione di una quantità p, che chiamiamo quantità di moto totale di un insieme di particelle, così il momento esterno è la rapidità di variazione di una quantità L che chiamiamo momento della quantità di moto del gruppo di particelle. Per dimostrarlo, consideriamo un sistema di particelle su cui vi siano alcune forze agenti e troveremo che cosa accade al sistema come risultato dei momenti dovuti a queste forze. In primo luogo, naturalmente, consideR reremo semplicemente una particella. Nella FIGURA 18.3 vi è una particella v Q di massa m e un asse O; la particella non ruota necessariamente descrivenQ' m do un cerchio attorno a O, essa può muoversi secondo un’ellisse, come un P pianeta che gira attorno al Sole, o secondo una qualche altra curva. Essa r si muove in un modo qualunque, vi sono forze agenti su di essa, e accelera O secondo la solita formula che la componente x della forza è la massa per la componente x dell’accelerazione ecc. Ma vediamo che cosa fa il momento. Il momento è uguale a xFy yFx , e la forza nelle direzioni x o y è la massa FIGURA 18.3 Una particella si muove attorno a un asse O. per l’accelerazione nelle direzioni x o y: d2 y d2 x ym (18.14) dt 2 dt 2 Ora, benché questa non sembri essere la derivata di una quantità semplice, è in effetti la derivata della quantità xm(dy/dt) ym(dx/dt): " # d dy dx xm ym = dt dt dt ⌧ = xFy

= xm

yFx = xm

d2 y d x d y + m dt dt dt 2

ym

d2 x dt 2

dy dx m = dt dt

(18.15)

d2 y d2 x ym dt 2 dt 2 Quindi è vero che il momento è la rapidità di variazione di qualcosa con il tempo! Facciamo attenzione al «qualcosa», gli diamo un nome: lo chiamiamo L, momento della quantità di moto: = xm

dy dx ym = xpy ypx (18.16) dt dt Benché la nostra attuale discussione non sia relativistica, la seconda forma per L data sopra è relativisticamente corretta. Così abbiamo trovato che vi è anche un analogo rotazionale per la quantità di moto e che questo analogo, il momento della quantità di moto, è dato da un’espressione in funzione delle componenti della quantità di moto, che è proprio uguale alla formula per il momento in funzione delle componenti della forza! Così se vogliamo conoscere il momento della quantità di moto di una particella attorno a un asse, prendiamo soltanto la componente della quantità di moto che è tangenziale, e la moltiplichiamo per il raggio. In altre parole, quello che conta per il momento della quantità di moto, non è a quale velocità essa sta allontanandosi dall’origine, ma a quale velocità sta ruotando attorno all’origine. Soltanto la parte tangenziale della quantità di moto conta per il momento della quantità di moto. Inoltre, più si allunga la linea della quantità di moto, maggiore diventa il momento della quantità di moto. Inoltre, poiché le proprietà geometriche sono le stesse, si parli di p o di F, è vero che esiste un braccio (non lo stesso braccio della forza che agisce sulla particella!) che si ottiene allungando la linea della quantità di moto e trovando la distanza perpendicolare all’asse. Così il momento della quantità di moto è il modulo della quantità di moto per il suo braccio. Per il momento della quantità di moto abbiamo quindi tre formule, proprio come abbiamo tre formule per il momento: L = xm

L = xpy

ypx

L = r ptang L = p · braccio

(18.17)

© 978-8808-22107-0

18.4 • Conservazione del momento della quantità di moto

Come il momento, il momento della quantità di moto dipende dalla posizione dell’asse rispetto al quale deve essere calcolato. Prima di passare a trattare più di una particella, applichiamo i risultati sopra ottenuti a un pianeta che gira attorno al Sole. In quale direzione è la forza? La forza è verso il Sole. Qual è allora il momento agente sull’oggetto? Naturalmente questo dipende da dove fissiamo l’asse, ma otteniamo un risultato molto semplice se lo prendiamo nel Sole stesso, perché il momento è la forza per il braccio, oppure la componente della forza perpendicolare a r, per r. Ma non vi è forza tangenziale, dunque non vi è momento rispetto a un asse passante per il Sole! Quindi il momento della quantità di moto di un pianeta che ruota attorno al Sole deve rimanere costante. Vediamo che cosa significa. La componente tangenziale della velocità, per la massa, per il raggio, sarà costante, dato che questo è il momento della quantità di moto e dato che la rapidità di variazione del momento della quantità di moto è il momento, e, in questo problema, il momento è zero. Naturalmente, poiché anche la massa è costante, questo significa che la velocità tangenziale per il raggio è una costante. Ma questo è qualcosa che già sapevamo per il moto di un pianeta. Supponiamo di considerare un piccolo intervallo di tempo t. Quale tratto percorrerà il pianeta per andare da P a Q (FIGURA 18.3)? Quale area spazzerà? Trascurando la piccolissima area QQ 0 P rispetto all’area molto maggiore OPQ, si ha semplicemente metà della base PQ per l’altezza OR. In altre parole, l’area spazzata in un tempo unitario sarà uguale alla velocità per il braccio della velocità (per un mezzo). Così la rapidità della variazione dell’area è proporzionale al momento della quantità di moto, che è costante. Dunque la legge di Keplero delle aree uguali in tempi uguali è una descrizione a parole dell’enunciato della legge di conservazione del momento della quantità di moto, quando non vi è un momento prodotto dalla forza.

18.4

Conservazione del momento della quantità di moto

Considereremo ora che cosa accade quando vi è un gran numero di particelle, cioè quando un oggetto è costituito di molte parti con molte forze agenti fra di esse e su di esse dall’esterno. Naturalmente sappiamo già che, attorno a un dato asse fisso, il momento sulla particella i-esima (che è la forza agente sulla particella i-esima per il braccio di tale forza) è uguale alla rapidità di variazione del momento della quantità di moto di tale particella, e che il momento della quantità di moto della particella i-esima è la sua quantità di moto per il braccio della quantità di moto. Supponiamo ora di addizionare i momenti ⌧i relativi a tutte le particelle, e chiamiamo momento totale ⌧ la somma. Allora questo sarà la rapidità di variazione della somma dei momenti delle quantità di moto di tutte le particelle L i , e ciò definisce una nuova quantità che chiamiamo il momento totale della quantità di moto L. Proprio come la quantità di moto totale di un oggetto è la somma delle quantità di moto di tutte le parti, così il momento della quantità di moto è la somma dei momenti delle quantità di moto di tutte le parti. Quindi la rapidità di variazione di L totale è il momento totale: X X dL i dL ⌧= ⌧i = = (18.18) dt dt Ora può sembrare che il momento totale sia una cosa complicata. Vi devono essere considerate tutte le forze interne e tutte le forze esterne. Ma se prendiamo la legge di azione e reazione di Newton per dire, non soltanto che azione e reazione sono uguali, ma anche che esse sono dirette esattamente in verso opposto lungo la stessa linea (Newton può aver detto o meno questo in realtà, ma l’ha tacitamente ammesso), allora i due momenti sugli oggetti interagenti, dovuti alla loro mutua interazione, saranno uguali e opposti poiché i bracci risultano uguali per qualsiasi asse. Quindi i momenti interni si fanno equilibrio esattamente due a due, e così abbiamo il notevole teorema che la rapidità di variazione del momento totale della quantità di moto rispetto a un asse qualunque è uguale al momento esterno rispetto a quell’asse! X dL ⌧= ⌧i = ⌧est = (18.19) dt Abbiamo pertanto un teorema molto efficace relativo al moto di un vasto insieme di particelle, che ci permette di studiare il moto complessivo senza doverci occupare del dettagliato meccanismo

191

192

Capitolo 18 • Rotazione in due dimensioni

© 978-8808-22107-0

interno. Questo teorema vale per qualsiasi insieme di oggetti, sia che essi formino un corpo rigido oppure no. Un caso estremamente importante del teorema precedente è la legge di conservazione del momento della quantità di moto: se su un sistema di particelle non agiscono momenti esterni, il momento della quantità di moto rimane costante. Un caso speciale di grande importanza è quello di un corpo rigido, cioè un oggetto di forma definita, che sta semplicemente ruotando. Consideriamo un oggetto fisso nelle sue dimensioni geometriche, e che sta ruotando attorno a un asse fisso. Le varie parti dell’oggetto mantengono le stesse relazioni una rispetto all’altra in ogni istante. Cerchiamo ora di trovare il momento totale della quantità di moto di tale oggetto. Se la massa di una delle sue particelle è mi e la sua posizione è in (x i, yi ), allora il problema è di trovare il momento della quantità di moto di tale particella, poiché il momento totale della quantità di moto è la somma dei momenti delle quantità di moto di tutte le particelle che compongono il corpo. Per un oggetto che si sta muovendo lungo un’orbita circolare, il momento delle quantità di moto, naturalmente, è la massa per la velocità per la distanza dall’asse, e la velocità è uguale alla velocità angolare per la distanza dall’asse: L i = mi vi r i = mi r i2 !

(18.20)

da cui, sommando su tutte le particelle i, otteniamo L = I!

(18.21)

X

(18.22)

dove I=

mi r i2

i

Questo è l’analogo della legge secondo la quale la quantità di moto è la massa per la velocità. La velocità è sostituita dalla velocità angolare, mentre la massa è sostituita da una cosa nuova che chiamiamo momento di inerzia I, che è l’analogo della massa. Le equazioni (18.21) e (18.22) dicono che un corpo presenta inerzia alla rotazione e che questa dipende non soltanto dalle masse, ma da quanto esse sono lontane dall’asse. Così, se abbiamo due oggetti con la stessa massa, quando poniamo le masse lontane dall’asse, l’inerzia di rotazione sarà più grande. Questo è facilmente dimostrabile con l’apparato che è mostrato in FIGURA 18.4, dove un peso M è trattenuto da una rapida caduta per il fatto che deve far ruotare la grossa sbarra caricata con pesi alle estremità. Quando m le masse m sono vicine all’asse, M accelera con una certa rapidità. Ma quando cambiamo il momento di inerzia ponendo le due masse m molto più lontane dall’asse, allora vediamo che M accelera molto meno rapidamente di prima, perché il corpo ha molta più inerzia rispetto alla rotazione. m Il momento di inerzia è l’inerzia rispetto alla rotazione, ed è la somma dei M contributi di tutte le masse per le loro distanze dall’asse elevate al quadrato. Vi è un’importante differenza fra massa e momento di inerzia che è molto netta. La massa di un oggetto non cambia mai, ma il suo momento FIGURA 18.4 L’«inerzia per rotazione» dipende dal braccio delle masse. di inerzia può essere cambiato. Se stiamo su una piattaforma rotante senza attrito con le braccia distese, e sosteniamo alcuni pesi nelle mani ruotando lentamente, possiamo cambiare il nostro momento di inerzia ritirando le braccia, ma la nostra massa non cambia. Quando facciamo questo, succedono cose straordinarie a causa della legge di conservazione del momento della quantità di moto: se il momento esterno è zero, allora il momento della quantità di moto (il momento di inerzia per omega) rimane costante. Inizialmente ruotavamo con un grande momento di inerzia I1 a una bassa velocità angolare !1 e il momento della quantità di moto era I1 !1 . Poi abbiamo cambiato il nostro momento di inerzia ritirando le braccia, portandolo, diciamo, a un valore minore I2 . Allora il prodotto I!, che deve rimanere lo stesso perché il momento della quantità di moto deve rimanere costante, è diventato I2 !2 . Quindi I1 !1 = I2 !2 . Pertanto, se riduciamo il momento di inerzia, dobbiamo aumentare la velocità angolare.

19

Centro di massa e momento di inerzia

19.1

Proprietà del centro di massa

Nel capitolo precedente abbiamo trovato che, se un gran numero di forze agisce su una complessa massa di particelle, facciano esse parte di un corpo rigido o no o costituiscano una nube stellare o qualsiasi altra cosa, e troviamo la somma di tutte le forze (cioè, naturalmente, di tutte le forze esterne, poiché le forze interne si equilibrano), allora se consideriamo il corpo come un insieme, ed esso ha una massa totale M, esiste un certo punto «all’interno» del corpo, detto centro di massa, tale che la forza esterna risultante produce un’accelerazione di questo punto, proprio come se l’intera massa vi fosse concentrata. Discutiamo ora il centro di massa con un po’ più di particolari. La posizione del centro di massa (abbreviato CM) è data dall’equazione X

mi r i RCM = X mi

(19.1)

Questa naturalmente è un’equazione vettoriale, che comprende in realtà tre equazioni, una per ciascuna delle tre direzioni. Considereremo soltanto la direzione x, perché se possiamo comprendere questa, possiamo comprendere anche le altre due: X

mi x i XCM = m X mi

Che cosa significa questa equazione? Supponiamo per un momento che l’oggetto sia diviso in piccole parti, tutte di massa m; allora la massa totale è semplicemente il numero di parti N per la massa di una parte, diciamo 1 grammo, o qualsiasi altra unità. Quindi questa equazione dice semplicemente che se addizioniamo tutte le x e poi dividiamo per il numero delle cose che abbiamo sommato, abbiamo: X X xi xi XCM = m = mN N In altre parole, XCM è la media di tutte le x se le masse sono uguali. Ma supponiamo che una sia come peso doppia delle altre. Allora nella somma quella x entrerebbe due volte. Ciò è facile da capire, perché possiamo pensare questa massa doppia come divisa in due masse uguali, esattamente uguali alle altre; allora facendo la media, naturalmente, dobbiamo contare x due volte, poiché là vi sono due masse. Così X è la posizione media, nella direzione x, di tutte le masse, venendo contata ogni massa un numero di volte proporzionale alla massa stessa, come se essa fosse divisa in «piccoli grammi». Da ciò è facile dimostrare che X deve essere compresa fra la maggiore e la minore delle x, e quindi giace all’interno dell’involucro che include l’intero corpo. Non deve essere necessariamente nel materiale che costituisce il corpo, perché il corpo potrebbe essere un cerchio, come un anello, e il centro di massa è nel centro dell’anello, non nell’anello stesso.

194

Capitolo 19 • Centro di massa e momento di inerzia

© 978-8808-22107-0

Naturalmente, se un oggetto è in qualche modo simmetrico, per esempio un rettangolo, che ha un piano di simmetria, il centro di massa sta da A qualche parte sul piano di simmetria. In realtà nel caso del rettangolo vi sono due piani di simmetria, e ciò lo localizza univocamente. Ma se si CM tratta semplicemente di un qualsiasi oggetto simmetrico, allora il centro di B gravità giace in qualche punto sull’asse di simmetria, perché in tale caso vi sono tante x positive quante negative. Un’altra interessante asserzione è la seguente, ed è molto curiosa. ImFIGURA 19.1 Il centro di massa (CM) di un corpo maginiamo un oggetto che sia costituito da due parti, A e B (FIGURA 19.1). composto giace sulla linea congiungente i centri di massa delle parti componenti. Allora il centro di massa dell’intero oggetto può essere calcolato come segue. In primo luogo troviamo il centro di massa dalla parte A, poi quello dalla parte B. Quindi troviamo la massa totale di ciascuna parte M A e MB . Consideriamo poi un nuovo problema in cui una massa puntiforme M A è nel centro di massa dell’oggetto A, e un’altra massa puntiforme MB è nel centro di massa dell’oggetto B. Il centro di massa di queste due masse puntiformi è il centro di massa dell’intero oggetto. In altre parole, se sono stati calcolati i centri di massa delle varie parti di un oggetto, non dobbiamo ripartire dal principio per trovare il centro di massa dell’intero oggetto: dobbiamo semplicemente collegare le parti, trattando ciascuna come una massa puntiforme situata nel centro di massa della parte stessa. Vediamo perché. Supponiamo di voler calcolare il centro di massa di un certo oggetto; alcune delle sue particelle sono consiP derate appartenenti all’oggetto A e altre appartenenti all’oggetto B. La somma totale mi x i può P P essere spezzata in due parti: la somma A mi x i per il solo oggetto A e la somma B mi x i per il solo oggetto B. Ora se stessimo calcolando il centro di massa dell’oggetto A soltanto, avremmo esattamente la prima di queste somme, e sappiamo che questa da sola è M A X A, la massa totale delle particelle in A per la posizione del centro di massa di A, poiché questo è il teorema del centro di massa applicato all’oggetto A. Allo stesso modo, osservando soltanto l’oggetto B, otteniamo MB X B , e naturalmente, sommando i due prodotti, si ha: X X M XCM = mi x i + mi x i = M A X A + MB X B (19.2) A

B

Ora poiché M è evidentemente la somma di M A e MB , vediamo che l’equazione (19.2) può essere interpretata come uno speciale esempio della formula del centro di massa, per due oggetti puntiformi, uno di massa M A posto in X A e l’altro di massa MB posto in X B . Il teorema relativo al moto del centro di massa è molto interessante, e ha svolto un ruolo importante nello sviluppo della nostra comprensione della fisica. Supponiamo di presumere che la legge di Newton sia esatta, per le piccole parti componenti di un oggetto molto più grande. Allora questo teorema dimostra che la legge di Newton è corretta anche per l’oggetto più grande, anche se non studiamo i particolari dell’oggetto ma soltanto la forza totale agente su di esso e la sua massa. In altre parole, la legge di Newton ha la peculiare proprietà che se è esatta su una determinata piccola scala, è esatta anche su una scala maggiore. Se non consideriamo una palla da «baseball» come un oggetto terribilmente complesso, fatto di miriadi di particelle interagenti, ma studiamo soltanto il moto del centro di massa e le forze esterne sulla palla, troviamo F = ma, dove F è la forza esterna agente sulla palla, m la sua massa e a l’accelerazione del suo centro di massa. Così F = ma è una legge che riproduce se stessa su di una scala più vasta. (Dovrebbe esistere un vocabolo particolare, tratto dal greco per esempio, per descrivere una legge che riproduce la legge stessa su scala maggiore.) Naturalmente, si potrebbe sospettare che le prime leggi scoperte dall’uomo fossero quelle che dovrebbero riprodurre se stesse su una scala maggiore. Perché? Perché la scala effettiva dei meccanismi fondamentali e dei moti dell’universo è di dimensioni atomiche, che sono così piccole rispetto alle nostre osservazioni che non riusciamo mai ad avvicinare tale scala con le osservazioni ordinarie. Così le prime cose scoperte devono essere valide per oggetti di dimensione non straordinaria relativamente alla scala atomica. Se le leggi per piccole particelle non riproducessero se stesse su scala più grande non scopriremmo tali leggi molto facilmente. Che dire del problema inverso? Devono le leggi su piccola scala essere le stesse di quelle su scala maggiore? Naturalmente in natura non è necessariamente così, che le leggi a un livello atomico debbano essere le stesse di quelle su una scala più grande. Supponiamo che le leggi esatte del moto degli atomi siano

© 978-8808-22107-0

19.1 • Proprietà del centro di massa

date da qualche strana equazione che non ha la proprietà che quando andiamo a una scala maggiore riproduciamo la stessa legge, ma che invece ha la proprietà che se andiamo a una scala maggiore possiamo approssimarla con una certa espressione cosicché, se estendiamo via via tale espressione, essa si mantiene riproducendosi su scale sempre più grandi. Questo è possibile, e in effetti questo è il modo in cui vanno le cose. Le leggi di Newton sono «la coda» delle leggi atomiche, estrapolate fino a dimensioni molto grandi. Le leggi reali del moto delle particelle su una piccola scala sono molto strane, ma se prendiamo un gran numero di esse e le componiamo, esse approssimano, ma approssimano soltanto, le leggi di Newton. Le leggi di Newton ci permettono di andare a scale sempre più alte, e appare sempre trattarsi della stessa legge. In realtà essa diviene sempre più accurata via via che la scala diventa più grande. Questo fattore di riproduzione delle leggi di Newton è dunque in realtà non un lineamento fondamentale della natura, ma un’importante caratteristica storica. Non avremmo mai scoperto le leggi fondamentali delle particelle atomiche alla prima osservazione, perché le prime osservazioni sono troppo approssimative. In realtà, risulta che le leggi atomiche fondamentali, che chiamiamo meccanica quantistica, sono del tutto diverse dalle leggi di Newton, e sono difficili da capire perché tutte le nostre esperienze dirette sono con oggetti su larga scala e gli atomi su piccola scala si comportano in modo diverso da qualsiasi altro oggetto su larga scala. Così non possiamo dire, «Un atomo è proprio come un pianeta che gira attorno al Sole», o qualcosa di simile. Non assomiglia a niente che ci sia familiare, perché non vi è niente di simile a esso. Quando applichiamo la meccanica quantistica a cose via via più grandi, le leggi relative al comportamento di parecchi atomi insieme non riproducono se stesse, ma producono nuove leggi, che sono le leggi di Newton, che poi continuano a riprodurre se stesse da, diciamo, dimensioni di micro-microgrammi, che comunque rappresentano miliardi e miliardi di atomi, su su fino alle dimensioni della Terra e oltre. Ritorniamo ora al centro di massa. Il centro di massa è talvolta chiamato centro di gravità, per la ragione che, in parecchi casi, la gravità può essere considerata uniforme. Supponiamo di avere dimensioni abbastanza piccole in modo che la forza di gravità sia non soltanto proporzionale alla massa, ma sia ovunque parallela a una certa direzione fissa. Consideriamo allora un oggetto in cui su ciascuna delle masse che lo costituiscono agiscano forze gravitazionali. Sia mi la massa di una parte. Allora la forza gravitazionale su tale parte è mi per g. Ora il problema è: dove possiamo applicare una singola forza per equilibrare la forza gravitazionale sull’intero oggetto, cosicché esso, se è un corpo rigido, non ruoti? La risposta è che questa forza deve passare attraverso il centro di massa, e dimostriamo ciò nel modo seguente. Affinché il corpo non giri, il momento prodotto da tutte le forze deve dare come somma zero, perché se vi è un momento vi è una variazione del momento della quantità di moto, e quindi una rotazione. Così dobbiamo calcolare il totale di tutti i momenti su tutte le particelle, e vedere qual è il momento rispetto a un qualsiasi dato asse; esso dovrebbe essere zero se questo asse è nel centro di massa. Ora, misurando x orizzontalmente e y verticalmente, sappiamo che i momenti sono le forze in direzione y, per il braccio x (vale a dire la forza per il braccio rispetto al quale misuriamo il momento). Ora il momento totale è la somma X X ⌧= mi gx i = g mi x i (19.3) P così se il momento totale deve essere zero, la somma mi x i deve essere zero. Ma X mi x i = M XCM

la massa totale per la distanza del centro di massa dall’asse. Così la distanza x del centro di massa dall’asse è zero. Naturalmente abbiamo controllato il risultato soltanto per la distanza x, ma se usiamo l’esatto centro di massa l’oggetto sarà equilibrato in tutte le direzioni, perché se lo giriamo di 90°, avremo le y al posto delle x. In altre parole, quando un oggetto è sostenuto nel suo centro di massa, non vi è momento su di esso se agisce un campo gravitazionale parallelo. Nel caso in cui l’oggetto sia tanto grande che risulti significativo il non parallelismo delle forze gravitazionali, allora il centro in cui si deve applicare la forza di equilibrio non è semplice da descrivere, ed esso è leggermente diverso dal centro di massa. Questa è la ragione per la quale si deve distinguere fra centro di massa e centro di gravità. Il fatto che un oggetto sostenuto esattamente nel centro di massa sarà in equilibrio in tutte le posizioni ha un’altra interessante conseguenza. Se, invece della

195

Capitolo 19 • Centro di massa e momento di inerzia

196

© 978-8808-22107-0

gravitazione, abbiamo una forza apparente dovuta ad accelerazione, possiamo usare esattamente lo stesso procedimento matematico per trovare la posizione del sostegno cosicché non vi siano momenti prodotti dalla forza inerziale di accelerazione. Supponiamo che l’oggetto sia tenuto in qualche modo dentro una scatola, e che la scatola, e ogni cosa contenuta in essa, stia accelerando. Sappiamo che, dal punto di vista di qualcuno a riposo rispetto a questa scatola che sta accelerando, vi sarà una forza efficace dovuta all’inerzia. Cioè, per fare avanzare l’oggetto insieme alla scatola, dobbiamo spingere su di esso per accelerarlo, e questa forza è «bilanciata» dalla «forza d’inerzia», che è una forza apparente uguale alla massa per l’accelerazione della scatola. Per l’uomo nella scatola, questa è la stessa situazione come se l’oggetto fosse in un campo gravitazionale uniforme il cui valore «g» è uguale all’accelerazione a. Così la forza inerziale dovuta all’accelerazione di un oggetto non ha momento rispetto al centro di massa. Questo fatto ha una conseguenza molto interessante. In un sistema inerziale che non sta accelerando, il momento è sempre uguale alla rapidità di variazione del momento della quantità di moto. Tuttavia rispetto a un asse che passa per il centro di massa di un oggetto che sta accelerando, è ancora vero che il momento è uguale alla rapidità di variazione del momento della quantità di moto. Anche se il centro di massa sta accelerando, possiamo ancora scegliere un asse speciale, vale a dire un asse passante per il centro di massa, tale che sarà ancora vero che il momento è uguale alla rapidità di variazione del momento della quantità di moto rispetto a quell’asse. Così il teorema che il momento è uguale alla rapidità di variazione del momento della quantità di moto è vero in due casi generali: • un asse fisso in uno spazio inerziale; • un asse passante per il centro di massa, anche se l’oggetto può essere in accelerazione.

19.2

H

Localizzazione del centro di massa

Le tecniche matematiche per il calcolo dei centri di massa sono, naturalmente, nella sfera della matematica, e tali problemi forniscono dei buoni esercizi per il calcolo integrale. Dopo aver imparato il calcolo però, e volendo sapere come individuare i centri di massa, è bene conoscere alcuni artifici che possono essere usati allo scopo. Uno di questi artifici fa uso di quello che è chiamato il teorema di Pappo. Esso funziona in questo modo: se consideriamo una qualsiasi area chiusa contenuta in un piano e generiamo un solido muovendola nello spazio in modo che ciascun punto si muova sempre perpendicolarmente al piano dell’area, il solido risultante ha un volume totale uguale all’area della sezione trasversale per la distanza percorsa dal centro di massa! Certamente questo è vero se muoviamo l’area in linea retta perpendicolarmente a se stessa, ma se la muoviamo in cerchio o secondo qualche altra curva, allora essa genera un volume piuttosto particolare. Per una traiettoria curva, la parte esterna percorre un tratto più lungo, la parte interna più breve, e questi effetti si controbilanciano. Così, se vogliamo localizzare il centro di massa di una lastra piana di densità uniforme, possiamo ricordare che il volume generato facendola ruotare attorno a un asse è la distanza percorsa dal centro di massa per l’area della lastra. Per esempio, se vogliamo trovare il centro di massa di un triangolo rettangolo di base D e altezza H (FIGURA 19.2), possiamo risolvere il problema nel seguente modo. Immaginiamo un asse lungo H, e ruotiamo il triangolo attorno all’asse di 360°. Ciò genera un cono. La distanza che la coordinata x del centro di massa ha percorso è 2⇡x. L’area che viene spostata è l’area del triangolo, H D/2. Così la distanza x del centro di x massa per l’area del triangolo è il volume sviluppato, che è naturalmente D ⇡D2 H/3. Quindi 2⇡x

19.2 Triangolo rettangolo e cono circolare retto, generato dalla rotazione del triangolo. FIGURA

H D ⇡D2 H = 2 3

da cui

x=

D 3

In maniera simile, ruotando attorno all’altro asse, o per simmetria, troviamo y = H/3. Infatti, il centro di massa di qualsiasi area triangolare uniforme

19.3 • Ricerca del momento di inerzia

© 978-8808-22107-0

è il punto in cui le tre mediane, cioè le linee condotte dai vertici al punto medio dei lati opposti, s’incontrano. Tale punto è a 1/3 della lunghezza di ciascuna mediana. Suggerimento: dividere il triangolo in un insieme di piccole parti, ciascuna parallela alla base. Notare che la linea mediana biseca ciascuna parte, e quindi il centro di massa deve giacere su questa linea. Consideriamo ora una figura più complessa. Supponiamo che si desideri trovare la posizione del centro di massa di un disco semicircolare uniforme, cioè un disco tagliato a metà. Dove si trova il suo centro di massa? Per un disco intero, è naturalmente nel centro, ma per un mezzo disco è più difficile da individuare. Sia r il raggio e x la distanza del centro di massa dal bordo rettilineo del disco. Facciamolo ruotare attorno a questo bordo preso come asse per generare una sfera. Allora il centro di massa si è spostato di 2⇡x, l’area è ⇡r 2 /2 (perché si tratta soltanto di un mezzo cerchio). Il volume generato è, naturalmente, 4⇡r 3 /3, quindi 2⇡x

⇡r 2 4 3 = ⇡r 2 3

da cui

x=

4 r 3 ⇡

Vi è un altro teorema di Pappo che è un caso particolare del precedente, e quindi ugualmente vero. Supponiamo che, invece di un disco solido semicircolare, abbiamo un pezzo semicircolare di filo con densità di massa uniforme lungo il filo stesso, e vogliamo trovare il suo centro di massa. In questo caso non vi è massa all’interno ma solo sul filo. Allora risulta che l’area che è sviluppata da una linea piana curva, quando viene mossa come prima, è la distanza percorsa dal centro di massa per la lunghezza della linea. (La linea può essere pensata come un’area molto stretta, e le si può applicare il precedente teorema.)

19.3

Ricerca del momento di inerzia

Discutiamo ora il problema di come trovare i momenti di inerzia di vari oggetti. La formula per il momento di inerzia rispetto all’asse z di un oggetto è X ⇣ ⌘ I= mi x 2i + yi2

oppure

I=

⌅ ⇣

⌅ ⇣ ⌘ ⌘ x 2 + y 2 dm = x 2 + y 2 ⇢ dV

(19.4)

Cioè, dobbiamo sommare le masse, ciascuna moltiplicata per il quadrato della sua distanza (x 2i + yi2 ) dall’asse. Notiamo che questo non è il quadrato della distanza tridimensionale, ma soltanto della distanza bidimensionale, anche per un oggetto tridimensionale. In linea di massima, ci limiteremo agli oggetti bidimensionali, ma la formula per la rotazione rispetto all’asse z è la stessa anche nelle tre dimensioni. Come esempio semplice consideriamo una barra che ruota attorno a un asse perpendicolare passante per un estremo (FIGURA 19.3). Ora dobbiamo L sommare tutte le masse per i quadrati delle distanze x (essendo tutte zero le y in questo caso). Ciò che intendiamo con «il sommare», è naturalmente x dx l’integrale di x 2 per i piccoli elementi di massa. Se dividiamo la barra in piccoli elementi di lunghezza dx, i corrispondenti elementi di massa sono proporzionali a dx, e se dx fosse la lunghezza dell’intera barra la massa FIGURA 19.3 Barra diritta di lunghezza L, rotante attorno a un asse passante per un suo estremo. sarebbe M. Quindi M dm = dx L e ⌅ L ⌅ M M L 2 M L2 I= x2 dx = x dx = (19.5) L L 0 3 0 Le dimensioni del momento di inerzia sono sempre la massa per il quadrato della lunghezza, così tutto quello che in realtà dovevamo ricavare era il fattore 1/3.

197

198

Capitolo 19 • Centro di massa e momento di inerzia

© 978-8808-22107-0

Ora quanto vale I se l’asse di rotazione è nel centro della barra? Potremmo semplicemente rifare di nuovo l’integrale, facendo variare x da L/2 a +L/2. Ma facciamo qualche considerazione sul momento di inerzia. Possiamo immaginare la barra come costituita da due barre, ciascuna di massa M/2 e lunghezza L/2 ; i momenti di inerzia delle due barre piccole sono uguali e sono entrambi dati dalla formula (19.5). Quindi il momento di inerzia cercato è I=

2 (M/2) (L/2)2 M L2 = 3 12

(19.6)

Così è molto più facile far ruotare un bastone attorno al suo centro che farlo ruotare attorno a un’estremità. Naturalmente potremmo calcolare i momenti di inerzia dei vari altri corpi che interessano. Però, mentre tali problemi costituiscono una certa quantità di importanti esercizi di calcolo, non hanno per noi un’importanza fondamentale in quanto tali. Vi è però un interessante teorema che è molto utile. Supponiamo di avere un oggetto e di voler trovare il suo momento di inerzia rispetto a un qualche asse. Ciò significa che vogliamo trovare l’inerzia necessaria per farlo girare attorno a tale asse. Ora, se imperniamo l’oggetto nel suo centro di massa cosicché l’oggetto non giri quando ruota attorno all’asse (perché non vi è momento agente su di esso per effetti inerziali, e quindi non ruoterà quando cominciamo a muoverlo), allora le forze necessarie per spingerlo attorno all’asse sono le stesse come se tutta la massa fosse concentrata nel centro di massa, e il momento d’inerzia 2 , dove R sarebbe semplicemente I1 = M RCM CM è la distanza dall’asse al centro di massa. Ma naturalmente questa non è la formula giusta per il momento di inerzia di un oggetto che sta in realtà ruotando, perché non soltanto il suo centro è in movimento circolare, il che contribuirebbe con una quantità I1 al momento di inerzia, ma dobbiamo anche farlo ruotare attorno al suo centro di massa. Così non è irragionevole dover aggiungere a I1 il momento di inerzia ICM attorno al centro di massa. Quindi è una buona ipotesi che il momento totale di inerzia rispetto a qualsiasi asse sia 2 I = ICM + M RCM (19.7) Questo teorema è detto teorema dell’asse parallelo, e può essere facilmente dimostrato. Il momento di inerzia rispetto a qualsiasi asse è la massa per la somma delle x i e delle yi , ciascuna al quadrato: X⇣ ⌘ I= x 2i + yi2 mi Ci concentreremo sulle x, ma naturalmente le y si comportano allo stesso modo. Ora x è la distanza di una particolare massa puntiforme dall’origine, ma consideriamo come apparirebbe se misurassimo x 0 dal CM invece che x dall’origine. Per prepararci a questa analisi scriviamo x i = x i0 + XCM Elevando al quadrato otteniamo 2 x 2i = x i0 2 + 2XCM x i0 + XCM

Così, quando viene moltiplicato per mi e sommato su tutti gli i, che cosa accade? Estraendo le costanti dal simbolo di somma, otteniamo X X X 2 Ix = mi x i0 2 + 2XCM mi x i0 + XCM mi

2 . Nella seconda somma vi sono due parti, La terza somma è facile; essa è semplicemente M XCM P 0 una di esse è mi x i che è la massa totale per la coordinata x 0 del centro di massa. Ma questa non dà alcun contributo perché x 0 è misurata dal centro di massa, e in questi assi di riferimento la posizione media di tutte le particelle, pesata sulle masse, è zero. La prima somma, naturalmente, è la parte x di ICM . Così arriviamo all’equazione (19.7), proprio come avevamo supposto. Controlliamo con un esempio la (19.7). Vediamo semplicemente se funziona per la barra. Rispetto a un asse che passa per un estremo il momento di inerzia sarebbe M L 2 /3, perché

19.3 • Ricerca del momento di inerzia

© 978-8808-22107-0

l’abbiamo calcolato. Il centro di massa di una barra, naturalmente, è nel centro della barra a una distanza L/2. Troveremmo quindi che !2 M L2 M L2 L = +M 3 12 2 Poiché un quarto più un dodicesimo è un terzo, non abbiamo fatto errori. Incidentalmente, non avevamo in realtà bisogno di usare un integrale per trovare il momento di inerzia (19.5). Se facciamo semplicemente l’ipotesi che esso sia M L 2 per , un coefficiente ignoto, e poi usiamo l’argomento relativo alle due metà per ottenere /4 per la (19.6), allora dalla nostra discussione sul trasferimento degli assi possiamo dimostrare che = /4 + 1/4, così deve essere 1/3. Vi è sempre un altro modo di fare una cosa! Applicando il teorema dell’asse parallelo, è naturalmente importante ricordare che l’asse per ICM deve essere parallelo all’asse attorno al quale si cerca il momento di inerzia. Vale la pena ricordare un’ulteriore proprietà del momento di inerzia, perché è spesso utile nel trovare il momento di inerzia di un certo tipo di oggetti. Questa proprietà è che se si ha una figura piana e un gruppo di assi coordinati con l’origine sul piano e l’asse z perpendicolare al piano, allora il momento di inerzia di questa figura rispetto all’asse z è uguale alla somma dei momenti di inerzia rispetto agli assi x e y. Questo si dimostra facilmente notando che X ⇣ ⌘ X Ix = mi yi2 + zi2 = mi yi2 (poiché zi = 0 ). Similmente,

Iy = ma Iz =

X

X

⇣ ⌘ X mi x 2i + zi2 = mi x 2i

X ⇣ ⌘ X mi x 2i + yi2 = mi x 2i + mi yi2 = Ix + Iy

Per fare un esempio, il momento di inerzia di una lamina rettangolare uniforme di massa M, larghezza w e lunghezza L, rispetto a un asse perpendicolare alla lamina e passante per il suo centro è semplicemente ⇣ ⌘ M w2 + L2 I= 12 perché il suo momento di inerzia rispetto a un asse nel suo piano, e parallelo alla sua lunghezza, è Mw 2 /12, cioè, proprio come per una barra di lunghezza w, e il momento di inerzia rispetto all’altro asse è M L 2 /12, come per una barra di lunghezza L. Per riassumere, il momento di inerzia di un oggetto rispetto a un dato asse che noi chiameremo asse z, ha le seguenti proprietà. 1 Il momento di inerzia è Iz =

X i

⇣ ⌘ ⌅ ⇣ ⌘ mi x 2i + yi2 = x 2 + y 2 dm

2 Se l’oggetto è costituito di un certo numero di parti, il momento di inerzia di ciascuna delle quali sia conosciuto, il momento di inerzia totale è la somma dei momenti di inerzia delle parti. 3 Il momento di inerzia rispetto a qualsiasi asse dato è uguale al momento di inerzia attorno a un asse parallelo che passa per il CM più la massa totale per il quadrato della distanza dall’asse al CM. 4 Se l’oggetto è una figura piana, il momento di inerzia rispetto a un asse perpendicolare al piano è uguale alla somma dei momenti di inerzia rispetto a due assi qualsiasi reciprocamente perpendicolari giacenti nel piano e intersecanti l’asse perpendicolare. I momenti di inerzia di un certo numero di strutture elementari aventi densità di massa uniformi sono riportati nella TABELLA 19.1 mentre i momenti di inerzia di alcuni altri oggetti, che possono essere dedotti dalla TABELLA 19.1, usando le proprietà sopra ricordate, sono dati nella TABELLA 19.2.

199

200

Capitolo 19 • Centro di massa e momento di inerzia

TABELLA

19.1

Momenti di inerzia di alcuni oggetti elementari.

Oggetto

Asse z

Iz

Asta sottile, lunghezza L

Perpendicolare all’asta, passante per il centro

1 ML2 12

Anello sottile, raggi r1, r2

Perpendicolare all’anello, passante per il centro

1 M (r12 + r22) 2

Sfera, raggio r

Passante per il centro

2 Mr 2 5

TABELLA

19.2

Momenti di inerzia di alcuni oggetti più complessi.

Oggetto

19.4

© 978-8808-22107-0

Asse z

Iz

Lamina rettangolare, lati a, b

Parallelo a b, passante per il centro

1 Ma2 12

Lamina rettangolare, lati a, b

Perpendicolare alla lamina, passante per il centro

1 M (a 2 + b 2) 12

Anello sottile, raggi r1, r2

Qualsiasi diametro

1 M (r 2 + r 2) 1 2 4

Parallelepipedo pieno, lati a, b, c

Parallelo a c, passante per il centro

1 M (a 2 + b 2) 12

Cilindro pieno, raggio r, altezza L

Parallelo a L, passante per il centro

1 Mr 2 2

Cilindro pieno, raggio r, altezza L

Perpendicolare a L, passante per il centro

1 M r 2 + 1 M L2 4 12

Energia cinetica di rotazione

Proseguiamo ora la discussione della dinamica. Nell’analogia fra il moto lineare e il moto angolare che abbiamo trattato nel capitolo 18, abbiamo usato il teorema del lavoro, ma non abbiamo parlato dell’energia cinetica. Qual è l’energia cinetica di un corpo rigido rotante attorno a un determinato asse con velocità angolare !? Possiamo indovinare immediatamente la risposta esatta, usando le nostre analogie. Il momento di inerzia corrisponde alla massa, la velocità angolare corrisponde alla velocità, e così l’energia cinetica dovrebbe essere I!2 /2, e infatti lo è, come sarà ora dimostrato. Supponiamo che l’oggetto stia ruotando attorno a un certo asse cosicché ciascun punto abbia una velocità la cui intensità è !r i, dove r i è il raggio dal punto particolare all’asse. Allora se mi è la massa di tale punto, l’energia cinetica totale dell’intero oggetto è semplicemente la somma delle energie cinetiche di tutte le piccole parti: T=

1X 1X mi vi2 = mi (r i !)2 2 2

Ora !2 è una costante, la stessa per tutti i punti. Così T=

1 2X 1 ! mi r i2 = I!2 2 2

(19.8)

Alla fine del capitolo 18 abbiamo sottolineato che vi sono alcuni interessanti fenomeni collegati a un oggetto che non sia rigido, ma che passi da una condizione rigida con un definito momento di inerzia, a un’altra condizione rigida. Vale a dire, nel nostro esempio della piattaforma girevole, avevamo un certo momento di inerzia I1 con le braccia stese in fuori, e una certa velocità angolare !1 . Quando ritiravamo le braccia, avevamo un diverso momento di inerzia I2, e una diversa

19.4 • Energia cinetica di rotazione

© 978-8808-22107-0

velocità angolare !2, ma eravamo di nuovo «rigidi». Il momento della quantità di moto rimaneva costante, perché non vi era momento rispetto all’asse verticale della piattaforma girevole. Questo significa che I1 !1 = I2 !2 Ora, che cosa si può dire sull’energia? Questa è una questione interessante. Con le braccia ritirate giriamo più velocemente ma il nostro momento d’inerzia è minore, e sembra che le energie possano essere uguali. Ma non lo sono, perché quello che si mantiene costante è I!, non I!2 . Così se confrontiamo l’energia cinetica prima e dopo, l’energia cinetica prima è 1 1 I1 !12 = L!1 2 2 dove L = I1 !1 = I2 !2 è il momento della quantità di moto. Successivamente, per le stesse considerazioni, abbiamo T=

1 L!2 2

e, poiché !2 > !1 , l’energia cinetica di rotazione è maggiore di quanto era prima. Così avevamo una certa energia quando le nostre braccia erano in fuori, e, quando le ritiravamo, giravamo più velocemente e avevamo maggiore energia cinetica. Che cosa è accaduto al teorema della conservazione dell’energia? Qualcuno deve aver prodotto lavoro. Noi abbiamo compiuto lavoro! Quando abbiamo fatto del lavoro? Quando muoviamo un peso orizzontalmente, non facciamo alcun lavoro. Se si regge una cosa a braccio teso e si ritira il braccio, non si fa alcun lavoro. Ma ciò accade quando non stiamo ruotando! Quando stiamo ruotando vi è una forza centrifuga sui pesi. Essi tentano di volare via, così quando ruotiamo dobbiamo tirare i pesi in verso opposto alla forza centrifuga. Quindi il lavoro che compiamo contro la forza centrifuga dovrebbe essere in accordo con la differenza delle energie di rotazione, e naturalmente lo è. Da qui proviene l’energia cinetica in più. Vi è anche un’altra caratteristica interessante che possiamo trattare soltanto in modo descrittivo, come argomento di interesse generale. Questa caratteristica è un po’ più avanzata, ma vale la pena di rilevarla perché è curiosa e produce parecchi effetti interessanti. Consideriamo ancora l’esperimento della piattaforma rotante. Consideriamo il corpo e le braccia separatamente, dal punto di vista dell’uomo che sta ruotando. Dopo aver ritirato i pesi, l’intero oggetto gira più in fretta, ma osserviamo, la parte centrale del corpo non è cambiata, eppure sta girando più in fretta di prima, dopo l’evento. Così se abbiamo tracciato un cerchio attorno al corpo che sta all’interno, e consideriamo soltanto gli oggetti all’interno del cerchio, il loro momento della quantità di moto risulterebbe cambiato; essi stanno girando più velocemente. Quindi vi deve essere un momento esercitato sul corpo mentre ritiriamo le braccia. Nessun momento può essere esercitato dalla forza centrifuga, perché essa è radiale. Ciò significa dunque che, tra le forze che si sviluppano in un sistema ruotante, la forza centrifuga non è tutto, vi è un’altra forza. Questa altra forza è detta forza di Coriolis e ha la stranissima proprietà che quando muoviamo qualche cosa in un sistema rotante, questa appare spinta lateralmente. Come la forza centrifuga essa è una forza apparente. Ma se viviamo in un sistema rotante, e muoviamo qualcosa radialmente, troviamo che dobbiamo anche spingerla lateralmente per muoverla radialmente. Questa spinta laterale che dobbiamo esercitare è quella che faceva ruotare il nostro corpo. Sviluppiamo ora una formula per vedere come funziona in realtà la forza di Coriolis. Supponiamo che Moe stia seduto su una giostra che gli appare immobile. Ma dal punto di vista di Joe, che è fermo sulla superficie della terra e che conosce le giuste leggi della meccanica, la giostra sta ruotando. Supponiamo di aver disegnato una linea radiale sulla giostra e che Moe stia muovendo alcune masse radialmente lungo questa linea. Vorremmo dimostrare che per far questo è richiesta una forza trasversale. Possiamo far ciò, facendo attenzione al momento della quantità di moto della massa. Essa sta sempre ruotando con la stessa velocità angolare !, cosicché il momento della quantità di moto è L = mvtang r = m (!r) r = m!r 2

201

202

Capitolo 19 • Centro di massa e momento di inerzia

© 978-8808-22107-0

Così quando la massa è vicina al centro, essa ha un momento della quantità di moto relativamente piccolo, ma se la muoviamo in una nuova posizione più lontana, se aumentiamo r, m ha un momento della quantità di moto maggiore, per cui, per muoverla lungo il raggio, si deve esercitare un momento. (Per camminare lungo il raggio in una giostra, ci si deve inclinare da una parte e spingere lateralmente. Provatelo una volta o l’altra.) Il momento che è richiesto è la rapidità di variazione di L col tempo, quando m si muove lungo il raggio. Se m si muove soltanto lungo il raggio, rimane costante, così che il momento è ⌧ = FC r =

⌘ dL d ⇣ dr = m!r 2 = 2m!r dt dt dt

dove FC è la forza di Coriolis. Quello che in realtà vogliamo sapere è che forza laterale deve essere esercitata da Moe per muovere m verso l’esterno a velocità vr = dr/dt. Questa è FC =

⌧ = 2m!vr r

Ora che abbiamo una formula per la forza di Coriolis, osserviamo la situazione un po’ più accuratamente, per vedere se possiamo comprendere l’origine di questa forza da un punto di vista più elementare. Notiamo che la forza di Coriolis è la stessa per qualsiasi raggio, ed è evidentemente presente anche nell’origine! Ma è particolarmente facile da capire proprio nell’origine, osservando quel che accade dal sistema inerziale di Joe, che è fermo sulla superficie della terra. La FIGURA 19.4 mostra tre successive osservazioni di m proprio mentre oltrepassa l’origine a t = 0. A causa della rotazione della giostra, vediamo che m non si muove in linea retta, ma secondo una traiettoria curva tangente 1 3 al diametro della giostra dove r = 0. Per far curvare m, vi deve essere una 1 3 forza per accelerarla nello spazio assoluto. Questa è la forza di Coriolis. 2 2 2 Questo non è l’unico caso in cui interviene la forza di Coriolis. Possiamo anche dimostrare che se un oggetto si sta muovendo con velocità costante 3 1 lungo la circonferenza di un cerchio, vi è una forza di Coriolis. Perché? Moe vede una velocità vM lungo il cerchio. D’altra parte Joe vede m andare FIGURA 19.4 Tre successive osservazioni lungo il cerchio con una velocità vJ = vM +!r, perché m è anche trasportato di un punto che si muove radialmente dalla giostra. Quindi noi sappiamo qual è in realtà la forza, vale a dire la su una piattaforma girevole in rotazione. forza centripeta totale dovuta alla velocità vJ , ossia mvJ2 /r ; questa è la forza reale. Ora dal punto di vista di Moe, questa forza centripeta è costituita di tre parti. Possiamo scriverla completamente nel modo seguente: Fr =

mvJ2 = r

2 mvM r

2mvM !

m!2 r

Ora, Fr è la forza che Moe vedrebbe. Cerchiamo di capirla. Moe apprezzerebbe il primo termine? «Sì», direbbe, «anche se io non stessi ruotando vi sarebbe una forza centripeta se mi muovessi lungo un cerchio con velocità vM ». Questa è semplicemente la forza centripeta che Moe si aspetterebbe e che non ha niente a che fare con la rotazione. In più, Moe è completamente consapevole che vi è un’altra forza centripeta che agirebbe anche su oggetti che sono immobili sulla sua giostra. Questo è il terzo termine. Ma vi è un altro termine in aggiunta a questi, vale a dire il secondo termine, che è ancora 2m!v. La forza di Coriolis FC era tangenziale quando la velocità era radiale, e ora è radiale essendo tangenziale la velocità. In realtà un’espressione ha un segno meno rispetto all’altra. La forza è sempre nella stessa direzione, rispetto alla velocità, non importa in che direzione sia la velocità. La forza è perpendicolare rispetto alla velocità e ha intensità 2m!v.

Rotazione nello spazio

20.1

Momenti in tre dimensioni

In questo capitolo discuteremo una delle più notevoli e divertenti conseguenze della meccanica, il comportamento di una ruota che gira. Per far questo dobbiamo per prima cosa estendere la formulazione matematica del moto di rotazione, i princìpi del momento della quantità di moto, il momento e così via, allo spazio tridimensionale. Non useremo queste equazioni in tutta la loro generalità e non studieremo tutte le loro conseguenze, perché questo prenderebbe parecchi anni, e noi dobbiamo passare presto ad altri argomenti. In un corso introduttivo possiamo presentare soltanto le leggi fondamentali e applicarle a pochissime situazioni di particolare interesse. Per prima cosa notiamo che, se abbiamo una rotazione in tre dimensioni, si tratti di un corpo rigido o di un altro sistema, quello che abbiamo dedotto per due dimensioni rimane valido. Cioè è ancora vero che xFy yFx è il momento «nel piano xy», ossia il momento «rispetto all’asse z». Risulta anche che questo momento è ancora uguale alla rapidità di variazione di xpy ypx , perché se ritorniamo alla derivazione dell’equazione (18.15) dalle leggi di Newton vediamo che non è stato necessario supporre che il moto fosse in un piano; quando differenziamo xpy ypx , otteniamo xFy yFx , così questo teorema rimane valido. La quantità xpy ypx , allora, la chiamiamo momento della quantità di moto appartenente al piano xy, o momento della quantità di moto rispetto all’asse z. Essendo vero questo, possiamo usare qualsiasi altra coppia di assi e ottenere un’altra equazione. Per esempio, possiamo usare il piano yz, ed è chiaro dalla simmetria che se sostituiamo semplicemente y a x e z a y, troveremo yFz zFy per il momento e ypz zpy sarà il momento della quantità di moto associato al piano yz. Naturalmente potremmo considerare un altro piano, il piano zx, e per questo, differenziando zpx xpz troveremmo zFx xFz . Che queste tre equazioni possano essere dedotte dal moto di una singola particella è assolutamente chiaro. Inoltre, se sommassimo insieme grandezze quali xpy ypx per parecchie particelle e chiamassimo tale somma momento della quantità di moto totale, ne otterremmo tre tipi per i tre piani x y, yz e zx, e se facessimo lo stesso con le forze, parleremmo anche del momento nei piani x y, yz e zx. In questo modo avremmo le leggi secondo cui il momento esterno relativo a qualsiasi piano è uguale alla rapidità di variazione del momento della quantità di moto legato a tale piano. Questa è una semplice generalizzazione di quanto abbiamo scritto per le due dimensioni. Ma ora si può dire: «Ah, ma ci sono altri piani; dopo tutto non possiamo prendere qualche altro piano a un certo angolo, e calcolare il momento su tale piano partendo dalle forze? Poiché dovremmo scrivere un altro gruppo di equazioni per ciascun piano simile, avremmo tutta una serie di equazioni!». Abbastanza curiosamente risulta che se calcolassimo la combinazione x 0 Fy0 y 0 Fx0 per un altro piano, misurando x 0, Fy0 ecc., in tale piano il risultato può essere scritto come una certa combinazione delle tre espressioni per i piani x y, yz e zx. Non vi è niente di nuovo. In altre parole, se conosciamo quali sono i momenti nei piani x y, yz e zx, allora il momento in ogni altro piano, e corrispondentemente anche il momento della quantità di moto, può essere scritto come una certa combinazione di questi: 6% di uno e 92% di un altro, e così via. Analizzeremo ora tale proprietà. Supponiamo che nel sistema x, y, z Joe abbia calcolato tutti i momenti, e tutti i momenti della quantità di moto rispetto ai suoi piani. Moe ha gli assi x 0, y 0 e z 0 in altre direzioni. Per rendere le cose un po’ più facili supporremo che siano stati ruotati soltanto gli assi x e y. Le x 0 e le y 0

20

204

Capitolo 20 • Rotazione nello spazio

© 978-8808-22107-0

di Moe sono nuove, ma la sua z 0 capita che sia la stessa. Cioè egli ha piani nuovi, diciamo, per yz e zx. Egli ha quindi nuovi momenti e nuovi momenti della quantità di moto da calcolare. Per esempio il suo momento nel piano x 0 y 0 sarebbe uguale a x 0 Fy0 y 0 Fx0 , e così via. Quello che ora dobbiamo fare è trovare la relazione tra i nuovi momenti e i vecchi momenti, così saremo in grado di stabilire un legame fra un gruppo di assi e l’altro. Qualcuno può dire: «Ciò appare del tutto simile a quello che abbiamo fatto con i vettori». E in effetti è esattamente quello che abbiamo intenzione di fare. Egli allora può dire: «Bene, il momento non è appunto un vettore?». Esso certamente risulta un vettore, ma non lo si sa subito, senza prima aver fatto un’analisi. Così, nei passi che seguono, faremo un’analisi. Non discuteremo ogni passo in dettaglio, dato che vogliamo soltanto illustrare il procedimento. I momenti calcolati da Joe sono ⌧xy = xFy

yFx

⌧yz = yFz

z Fy

⌧zx = z Fx

xFz

(20.1)

Facciamo a questo punto una digressione per notare che in casi come questo possiamo ottenere il segno sbagliato per alcune quantità se le coordinate non sono trattate nel giusto modo. Perché non scriviamo ⌧yz = zFy yFz ? Il problema nasce dal fatto che un sistema di coordinate può essere o «destrorso» o «sinistrorso». Avendo scelto, arbitrariamente, un segno per, diciamo ⌧xy , allora le espressioni corrette per le altre due quantità devono sempre essere trovate intercambiando le lettere xyz in uno dei due ordini seguenti: x z

%

x &

oppure z

y

.

! y

Moe ora calcola i momenti nel suo sistema: ⌧x0 y0 = x 0 Fy0

y 0 Fx0

⌧y0 z0 = y 0 Fz0

z 0 Fy0

0

⌧z0 x0 = z Fx0

(20.2)

0

x Fz0

Supponiamo ora che un sistema di coordinate sia ruotato di un angolo fisso, in modo tale che gli assi z e z 0 siano gli stessi. (Questo angolo non ha niente a che fare con oggetti ruotanti, né con ciò che si sta muovendo all’interno del sistema di coordinate. È semplicemente la relazione fra gli assi usati da un osservatore e gli assi usati dall’altro, ed è costante per ipotesi.) Così le coordinate dei due sistemi sono legate dalle relazioni x 0 = x cos ✓ + y sen ✓ y 0 = y cos ✓

x sen ✓

(20.3)

0

z =z Similmente, poiché la forza è un vettore, essa si trasforma nel nuovo sistema nello stesso modo di x, y e z, poiché un oggetto è un vettore se, e soltanto se, le diverse componenti si trasformano nello stesso modo di x, y e z: Fx0 = Fx cos ✓ + Fy sen ✓ Fy0 = Fy cos ✓

Fx sen ✓

(20.4)

Fz0 = Fz Ora possiamo trovare come si trasforma il momento semplicemente sostituendo in (20.2) le espressioni (20.3) al posto di x 0, y 0 e z 0 e quelle date dalla (20.4) al posto di Fx0 , Fy0 e Fz0 . Così per

20.1 • Momenti in tre dimensioni

© 978-8808-22107-0

⌧x0 y0 abbiamo una serie piuttosto lunga di termini e (piuttosto sorprendentemente a prima vista) risulta che si arriva proprio a xFy yFx , che riconosciamo come il momento nel piano x y: ⌧x0 y0 = (x cos ✓ + y sen ✓)(Fy cos ✓ 2

2

Fx sen ✓)

(y cos ✓

2

x sen ✓)(Fx cos ✓ + Fy sen ✓) =

2

= xFy (cos ✓ + sen ✓) yFx (sen ✓ + cos ✓) + + xFx ( sen ✓ cos ✓ + sen ✓ cos ✓) + yFy (sen ✓ cos ✓

sen ✓ cos ✓)

ossia ⌧x0 y0 = xFy

yFx = ⌧xy

(20.5)

Tale risultato è chiaro, perché se giriamo soltanto i nostri assi nel piano, la torsione attorno a z in tale piano non è diversa da prima, perché il piano è lo stesso! Ciò che sarà più interessante è l’espressione per ⌧y0 z0 perché questo è un nuovo piano. Ora facciamo esattamente la stessa cosa con il piano y 0 z 0; risulta: ⌧y0 z0 = (y cos ✓ x sen ✓)Fz z(Fy cos ✓ Fx sen ✓) = = (yFz zFy ) cos ✓ + (zFx xFz ) sen ✓ ossia ⌧y0 z0 = ⌧yz cos ✓ + ⌧zx sen ✓ Infine, facciamo la stessa operazione per

z0x0

(20.6)

:

⌧z0 x0 = z(Fx cos ✓ + Fy sen ✓) (x cos ✓ + y sen ✓)Fz = = (zFx xFz ) cos ✓ (yFz zFy ) sen ✓ ossia ⌧z0 x0 = ⌧zx cos ✓

⌧yz sen ✓

(20.7)

Volevamo ottenere una regola per trovare i momenti rispetto ai nuovi assi in funzione dei momenti rispetto ai vecchi assi e ora l’abbiamo. Come possiamo ricordarla? Se osserviamo attentamente la (20.5), la (20.6) e la (20.7), vediamo che vi è una stretta relazione fra queste equazioni e le equazioni per x, y e z. Se in qualche modo potessimo chiamare ⌧xy la componente z di qualcosa, diciamo la componente z di ⌧, allora tutto sarebbe giusto; interpreteremmo la (20.5) come trasformazione vettoriale, dato che la componente z rimarrebbe invariata, proprio come dovrebbe. Parimenti, se associamo al piano yz la componente x del nostro vettore ora inventato, e al piano zx la componente y, allora queste relazioni di trasformazione diventano ⌧z0 = ⌧z ⌧x0 = ⌧x cos ✓ + ⌧y sen ✓ ⌧y0 = ⌧y cos ✓

(20.8)

⌧x sen ✓

che è proprio la regola per i vettori! Quindi abbiamo dimostrato che possiamo identificare la combinazione di xFy yFx con quella che comunemente chiamiamo la componente z di un certo vettore inventato in modo artificioso. Benché un momento sia una torsione su un piano, e non abbia a priori carattere vettoriale, matematicamente si comporta come un vettore. Questo vettore è perpendicolare al piano di torsione, e la sua lunghezza è proporzionale all’intensità della torsione. Le tre componenti di una simile quantità si trasformeranno come un vero vettore. Così rappresentiamo i momenti per mezzo dei vettori; a ciascun piano su cui si suppone agisca il momento, associamo una linea perpendicolare. Ma «perpendicolare» non specifica il segno. Per ottenere il segno giusto dobbiamo adottare una regola che ci dice che se il momento fosse in un certo verso sul piano xy, allora l’asse che vogliamo collegare con esso è nella direzione positiva di z. Cioè qualcuno deve definirci la «destra» e la «sinistra». Supponendo che il sistema di coordinate x, y, z sia un sistema destrorso, allora la regola sarà la seguente: se pensiamo alla torsione come se stessimo girando una vite avente passo destrorso, allora la direzione del vettore che associeremo con la torsione è nella direzione in cui avanzerebbe la vite.

205

206

Capitolo 20 • Rotazione nello spazio

© 978-8808-22107-0

Perché il momento è un vettore? È un miracolo della buona sorte poter associare un singolo asse con un piano, e quindi il poter associare un vettore con il momento; è una particolare proprietà dello spazio tridimensionale. Nello spazio bidimensionale il momento è un comune scalare, e non occorre associare a esso alcuna direzione. Nelle tre dimensioni è un vettore. Se avessimo quattro dimensioni, saremmo in grandi difficoltà, perché (se avessimo per esempio il tempo come quarta dimensione) non avremmo soltanto piani quali x y, yz e zx, ma avremmo anche i piani t x, t y e t z. Ve ne sarebbero sei e non si possono rappresentare sei quantità come un vettore in quattro dimensioni. Vivremo a lungo nelle tre dimensioni, quindi è bene osservare che il trattamento matematico precedente non dipende dal fatto che x era una posizione e F una forza; esso dipende soltanto dalle leggi di trasformazione per i vettori. Quindi se, invece di x, avessimo usato la componente x di qualche altro vettore, non avrebbe fatto alcuna differenza. In altre parole, se dovessimo calcolare a x by ay bx, dove a e b sono dei vettori, e chiamare ciò la componente z di qualche nuova quantità c, allora queste nuove quantità formano un vettore c. Ci occorre una notazione matematica per la relazione del nuovo vettore, con le sue tre componenti, con i vettori a e b. La notazione che è stata escogitata per questo è c = a ⇥ b. Abbiamo allora in aggiunta al comune prodotto scalare, nella teoria dell’analisi vettoriale, un nuovo tipo di prodotto, detto prodotto vettoriale. Così, se c = a ⇥ b, questo è lo stesso che scrivere cx = ay bz az by cy = az bx

a x bz

cz = a x by

ay bx

(20.9)

Se invertiamo l’ordine di a e b, chiamando a, b e b, a, avremo il segno di c invertito, perché cz sarà bx ay by a x . Quindi il prodotto vettoriale è diverso dalla comune moltiplicazione, dove ab = ba; per il prodotto vettoriale, b ⇥ a = a ⇥ b. Da questo possiamo dimostrare subito che se a = b, il prodotto vettoriale è zero: a ⇥ a = 0. Il prodotto vettoriale è molto importante per rappresentare le caratteristiche della rotazione, ed è importante che comprendiamo la relazione geometrica fra i tre vettori a, b e c. Naturalmente la relazione in termini di componenti è data nelle equazioni (20.9) e da quella si può determinare qual è la relazione geometrica. La risposta è, primo, che il vettore c è perpendicolare a entrambi i vettori a e b. (Provate a calcolare c · a, e vedrete se esso non si riduce a zero.) Secondo, l’intensità di c risulta essere l’intensità di a per l’intensità di b per il seno dell’angolo compreso fra i due. In che direzione punta c? Immaginiamo di portare a su b con un angolo minore di 180°; una vite con un passo destrorso girando in questo modo avanzerà nel verso di c. Il fatto che diciamo una vite destrorsa invece che una vite sinistrorsa è una convenzione e fa ricordare costantemente che se a e b sono vettori «onesti» nel senso comune del termine, il nuovo tipo di «vettore» che abbiamo creato da a ⇥ b è artificiale, ossia lievemente diverso nel suo carattere da a e da b, perché è stato creato con una regola speciale. Se a e b sono chiamati vettori ordinari, abbiamo un nome particolare per essi, li chiamiamo vettori polari. Esempi di tali vettori sono la coordinata r, la forza F, la quantità di moto p, la velocità v, il campo elettrico E ecc.; questi sono comuni vettori polari. I vettori che implicano un prodotto vettoriale nella loro definizione sono detti vettori assiali o pseudovettori. Esempi di pseudovettori sono, naturalmente, il momento e il momento della quantità di moto L. Risulta inoltre che la velocità angolare ! è uno pseudovettore, come lo è il campo magnetico B. Al fine di completare le proprietà matematiche dei vettori, dovremmo conoscere tutte le regole per la loro moltiplicazione, usando prodotti scalari e vettoriali. Per le nostre applicazioni del momento, avremo poco bisogno di questo, ma per amore di completezza, scriviamo qui sotto tutte le regole per la moltiplicazione dei vettori, in modo da poterne usare i risultati in seguito. Queste sono le seguenti: a ⇥ (b + c) = a ⇥ b + a ⇥ c (↵a) ⇥ b = ↵(a ⇥ b) a · (b ⇥ c) = (a ⇥ b) · c

(20.10a) (20.10b) (20.10c)

20.2 • Le equazioni della rotazione usando prodotti vettoriali

© 978-8808-22107-0

a ⇥ (b ⇥ c) = b(a · c) a⇥a=0

a · (a ⇥ b) = 0

20.2

c(a · b)

(20.10d) (20.10e) (20.10f)

Le equazioni della rotazione usando prodotti vettoriali

Domandiamoci ora se qualche equazione in fisica può essere scritta usando il prodotto vettoriale. La risposta, naturalmente, è che parecchie equazioni possono essere scritte così. Per esempio, vediamo immediatamente che il momento è il prodotto vettoriale del vettore posizione per la forza: ⌧ = r⇥F (20.11) Questa è una sintesi vettoriale delle tre equazioni ⌧x = yFz zFy ecc. Per la stessa ragione, il vettore momento della quantità di moto, se è presente soltanto una particella, è la distanza dall’origine moltiplicata per il vettore quantità di moto: L=r⇥p

(20.12)

Per una rotazione nello spazio tridimensionale, la legge della dinamica, analoga alla F = d p/dt di Newton, è che il vettore momento è la rapidità di variazione rispetto al tempo del vettore momento della quantità di moto: dL ⌧= (20.13) dt Se sommiamo la (20.13) su parecchie particelle, il momento esterno agente sul sistema è la rapidità di variazione del momento totale della quantità di moto: ⌧est =

dL tot dt

(20.14)

Un altro teorema: se il momento totale esterno è zero, allora il vettore momento totale della quantità di moto del sistema è una costante. Questa legge è chiamata legge di conservazione del momento della quantità di moto. Se non vi è momento agente su un dato sistema, il suo momento della quantità di moto non può variare. Che dire sulla velocità angolare? È un vettore? Abbiamo già discusso la rotazione di un oggetto solido attorno a un asse fisso, ma per un momento supponiamo di stare girando l’oggetto simultaneamente attorno a due assi. Esso potrebbe essere in rotazione attorno a un asse all’interno di una scatola, mentre la scatola sta girando attorno a un altro asse. Il risultato netto di tali moti combinati è che l’oggetto semplicemente ruota attorno a un nuovo asse! La cosa meravigliosa relativa a questo nuovo asse è che può essere calcolato in questo modo. Se la rapidità di rotazione nel piano x y è rappresentata come un vettore nella direzione z la cui lunghezza è uguale alla rapidità di rotazione nel piano, e se nella direzione y è tracciato un altro vettore, che è la rapidità di rotazione nel piano zx, allora se addizioniamo questi come vettori, con la regola del parallelogramma, l’intensità del vettore risultante ci dice a quale velocità sta girando l’oggetto, e la direzione ci dice in quale piano. Ciò vuol dire semplicemente che la velocità angolare è un vettore, dal quale traiamo le intensità delle rotazioni nei tre piani come proiezioni perpendicolari a tali piani.(1) Come semplice applicazione dell’uso del vettore velocità angolare, possiamo valutare la potenza che è spesa dal momento agente su un corpo rigido. La potenza, naturalmente, è la rapidità di variazione del lavoro rispetto al tempo; nelle tre dimensioni la potenza risulta essere P=⌧·! (1) Che questo sia giusto può essere dedotto dalla composizione degli spostamenti delle particelle del corpo durante un tempo infinitesimo t. Non è evidente per se stesso, ed è lasciato a coloro ai quali interessa, il tentare di dimostrarlo.

207

Capitolo 20 • Rotazione nello spazio

208

© 978-8808-22107-0

Tutte le formule che abbiamo scritto per la rotazione piana possono essere generalizzate alle tre dimensioni. Per esempio, se un corpo rigido sta ruotando attorno a un certo asse con velocità angolare !, potremmo chiederci: «Qual è la velocità di un punto a una certa posizione radiale r?». Lasceremo come problema allo studente il mostrare che la velocità di una particella in un corpo rigido è data da v=!⇥r

dove ! è la velocità angolare e r la posizione. Ancora, come altro esempio di prodotto vettoriale, abbiamo considerato una formula, per la forza di Coriolis, che può anche essere scritta usando il prodotto vettoriale: FC = 2mv ⇥ ! Cioè, se una particella è in movimento con velocità v in un sistema di coordinate che stia in realtà ruotando, con velocità angolare !, e vogliamo pensare in funzione del sistema di coordinate rotante, allora dobbiamo aggiungere la pseudoforza FC .

20.3

Il giroscopio

Ritorniamo ora alla legge di conservazione del momento della quantità di moto. Questa legge può essere dimostrata con una ruota che giri velocemente, ossia un giroscopio, come segue (FIGURA 20.1). Se stiamo su una sedia girevole e teniamo la ruota in movimento con il suo asse orizzontale, la ruota ha un momento della quantità di moto attorno all’asse orizzontale. Il momento della quantità di moto attorno all’asse verticale non può cambiare a causa del perno (privo di attrito) della sedia, così se giriamo l’asse della ruota ponendolo verticale, allora la ruota avrebbe un momento della quantità di moto attorno all’asse verticale perché essa sta ora ruotando attorno a tale asse. Ma il sistema (sedia, noi stessi e ruota) non può avere una componente verticale, così noi e la sedia dobbiamo girare nel verso opposto alla rotazione della ruota, per controbilanciarla. In primo luogo analizziamo con maggior dettaglio ciò che abbiamo appena descritto. Quello che è sorprendente, e che dobbiamo capire, è l’origine delle forze che fanno ruotare noi e la sedia quando giriamo l’asse del giroscopio verso la verticale. La FIGURA 20.2 mostra la ruota che gira rapidamente attorno all’asse y. Quindi la sua velocità angolare è attorno a tale asse e in tale direzione è anche il suo momento della quantità di moto. Supponiamo ora di voler far girare la ruota attorno all’asse x a una piccola velocità angolare ⌦; quali forze sono richieste? Dopo un breve intervallo di tempo t, l’asse è ruotato in una nuova posizione, inclinata di un angolo ✓ rispetto all’orizzontale. Poiché la maggior parte del momento della quantità di moto è dovuta alla rotazione sull’asse (il contributo dovuto alla rotazione lenta è molto piccolo), vediamo che il vettore momento della quantità di moto è cambiato. Qual è la variazione del momento della quantità di moto? Il momento della quantità di moto non cambia di intensità, ma cambia in direzione di una quantità ✓. L’intensità del vettore L è L = L 0 ✓, cosicché il momento, che è la rapidità temporale di variazione del momento della quantità di moto, è ⌧=

L ✓ = L0 = L0 ⌦ t t

Tenendo conto delle direzioni delle diverse grandezze, vediamo che Prima

Dopo

⌧ = ⌦ ⇥ L0

20.1 Prima: l’asse è orizzontale; il momento della quantità di moto attorno all’asse verticale è zero. Dopo: l’asse è verticale; il momento attorno all’asse verticale è ancora zero; l’uomo e la sedia girano in verso opposto a quello della ruota. FIGURA

(20.15)

Così se ⌦ e L 0 sono entrambi orizzontali, come mostrato nella figura, ⌧ è verticale. Per produrre un momento simile si devono applicare agli estremi dell’asse della ruota le forze orizzontali F e F. Come vengono applicate queste forze? Dalle nostre mani, quando cerchiamo di ruotare l’asse della

20.3 • Il giroscopio

© 978-8808-22107-0

209 FIGURA

20.2

Un

giroscopio.

,L z



–F

∆L

F 0

L0

20.3 Una trottola in rapida rotazione. Si noti che la direzione del vettore momento è la direzione della precessione. FIGURA

L1 1

F

y

x

ruota nella direzione verticale. Ma la terza legge di Newton richiede che forze uguali e opposte (e momenti uguali e opposti) agiscano su di noi. Ciò causa la nostra rotazione in verso opposto attorno all’asse verticale z. Questo risultato può essere esteso a una trottola in rapida rotazione. Nel caso familiare di una trottola rotante, la gravità, agendo sul suo centro di massa, produce un momento attorno al punto di contatto con il pavimento (FIGURA 20.3). Questo momento è in direzione orizzontale, e causa la precessione della trottola con l’asse che si muove descrivendo un cono circolare attorno alla verticale. Se ⌦ è la velocità angolare (verticale) di precessione, di nuovo troviamo che ⌧=

dL = ⌦ ⇥ L0 dt

Quindi, quando applichiamo un momento a una trottola che ruota rapidamente, la direzione del moto di precessione è la direzione del momento, ossia perpendicolare alla forza che produce il momento. Possiamo ora affermare di capire la precessione dei giroscopi, e infatti matematicamente la comprendiamo. Tuttavia questo è un fatto matematico che, in un certo senso, appare come un «miracolo». Risulterà, via via che ci addentriamo nella fisica, che parecchie cose semplici possono essere dedotte matematicamente più rapidamente di quanto possano in realtà essere capite in modo semplice o fondamentale. Questa è una strana caratteristica, e man mano che ci addentreremo in questioni sempre più avanzate vi saranno circostanze in cui la matematica produrrà risultati che nessuno in realtà è stato capace di comprendere in nessun modo diretto. Un esempio è l’equazione di Dirac, che appare in una forma semplicissima ed elegante, ma le cui conseguenze sono difficili da comprendere. Nel nostro caso particolare, la precessione di una trottola appare simile a una specie di miracolo che implica angoli retti e cerchi, torsioni e viti destrorse. Quello che dovremmo cercare di fare è di capirlo in un modo più fisico. Come possiamo spiegare il momento in funzione delle forze reali e delle accelerazioni? Notiamo che quando la ruota è in precessione, le particelle che girano attorno alla ruota non si stanno in realtà muovendo in un piano, dato che la ruota è in precessione (FIGURA 20.4). Come abbiamo spiegato in precedenza (FIGURA 19.4), le particelle che stanno attraversando l’asse di precessione si muovono su traiettorie curve, e questo richiede l’applicazione di una forza laterale. Questa è fornita dal nostro spingere sull’asse della ruota, che comunica quindi la forza al cerchio mediante i raggi. «Aspetta», dice qualcuno, «che cosa succede alle particelle che stanno tornando indietro dal lato opposto?» Non ci vuole molto per decidere che deve esserci una forza in verso opposto su quel lato. La forza netta che dobbiamo applicare è quindi zero. Le forze si fanno equilibrio, ma una di esse deve essere applicata su un lato della ruota, e l’altra sull’altro lato. Potremmo applicare direttamente queste forze, ma poiché la ruota è rigida, abbiamo potuto farlo spingendo l’asse, poiché le forze possono essere trasmesse attraverso i raggi. Quello che abbiamo finora dimostrato è che se la ruota è in precessione, essa può equilibrare il momento dovuto alla gravità o qualche altro momento applicato. Ma tutto quello che abbiamo mostrato è che questa è una soluzione di un’equazione. Cioè, se è dato il momento, e se abbiamo inizialmente l’opportuna rotazione, allora la ruota subirà precessione dolcemente e uniformemente. Ma non abbiamo dimostrato (e infatti non è esatto) che una precessione uniforme è il moto più generale che un corpo rotante può subire, come risultato di un dato momento. Il moto

Capitolo 20 • Rotazione nello spazio

210

20.4 Il moto delle particelle nella ruota di FIGURA 20.2, che sta girando e il cui asse sta ruotando, avviene su linee curve.

© 978-8808-22107-0

FIGURA

20.5

Moto reale della punta dell’asse del giroscopio sotto l’effetto della gravità, subito dopo l’abbandono dell’asse mantenuto in precedenza fisso. FIGURA

Dopo

Ora

Prima

generale implica anche una «oscillazione» attorno alla precessione media. Questa «oscillazione» è chiamata nutazione. Alcune persone amano dire che quando si esercita un momento su un giroscopio, esso ruota e subisce una precessione, e che il momento produce la precessione. È molto strano che quando si abbandona improvvisamente un giroscopio, esso non cada sotto l’azione della gravità, ma si muova invece lateralmente! Come mai la forza di gravità diretta in basso che conosciamo e percepiamo lo fa andare lateralmente? Tutte le formule del mondo quali la (20.15) non ce lo dicono, perché la (20.15) è un’equazione particolare, valida soltanto dopo che il giroscopio è in esatta precessione. Quello che accade in realtà nei particolari è quanto segue. Se mantenessimo l’asse assolutamente fisso, cosicché non potesse in alcun modo subire precessione (ma con la ruota che gira) allora non vi sarebbe momento agente, nemmeno un momento dovuto alla gravità, perché questo è equilibrato dalle nostre dita. Ma se noi improvvisamente lo lasciamo andare, allora ci sarà immediatamente il momento dovuto alla gravità. Chiunque con le sue facoltà mentali penserebbe che la ruota dovesse cadere, e ciò è quello che infatti comincia a fare, come si può vedere se la ruota non sta girando troppo in fretta. Il giroscopio in realtà cade come ci saremmo aspettati. Ma quando cade comincia a ruotare, e se la rotazione dovesse continuare sarebbe necessario un momento. In assenza di un momento in questa direzione, il giroscopio comincia a «cadere» in verso opposto a quello della forza mancante. Questo dà al giroscopio una componente del moto attorno all’asse verticale, come avrebbe in una regolare precessione. Ma il moto reale «va oltre» la regolare velocità precessionale, e l’asse in realtà risale di nuovo al livello da cui era partito. La traiettoria percorsa dall’estremità dell’asse è una cicloide (la traiettoria seguita da un ciottolo che si è conficcato nel battistrada di un pneumatico di automobile). Di solito questo moto è troppo rapido perché gli occhi possano seguirlo, e si smorza rapidamente a causa dell’attrito nella sospensione cardanica, lasciando soltanto il regolare movimento precessionale (FIGURA 20.5). Più lenta gira la ruota, più ovvia è la nutazione. Quando il moto si stabilizza, l’asse è un po’ più basso di com’era in partenza. Perché? (Questi sono i particolari più complicati, ma li presentiamo perché non vogliamo dare al lettore l’idea che il giroscopio sia un vero miracolo. È una cosa meravigliosa ma non è un miracolo.) Se mantenessimo l’asse assolutamente orizzontale e improvvisamente lo lasciassimo andare, allora la semplice equazione della precessione ci direbbe che esso è in precessione, che sta ruotando in un piano orizzontale. Ma ciò è impossibile! Benché prima l’abbiamo trascurato, la ruota ha un certo momento di inerzia attorno all’asse di precessione, e se si sta muovendo attorno a tale asse, sia pure lentamente, ha un piccolo momento della quantità di moto attorno a tale asse. Da dove proviene? Se i perni sono perfetti non vi è momento attorno all’asse verticale. Come avviene che subisce precessione se non vi è variazione nel momento della quantità di moto? La risposta è che il moto cicloide dell’estremità dell’asse si smorza nel moto medio regolare, del centro del cerchio ruotante equivalente. Cioè si stabilizza un po’ più in basso. Poiché è basso, il momento della quantità di moto di rotazione ha ora una piccola componente verticale, che è esattamente quanto è necessario per la precessione. Così, vedete, deve abbassarsi un poco per poter ruotare. Esso deve concedere qualcosa alla gravità; spostando il suo asse un po’ verso il basso, mantiene la rotazione attorno all’asse verticale. Questo dunque è il modo di funzionare di un giroscopio.

20.4 • Momento della quantità di moto di un corpo solido

© 978-8808-22107-0

20.4

211

Momento della quantità di moto di un corpo solido

Prima di lasciare l’argomento delle rotazioni tridimensionali, discuteremo, almeno qualitativamente, alcuni effetti delle rotazioni tridimensionali che non sono evidenti per se stessi. L’effetto principale è che, in generale, il momento della quantità di moto di un corpo rigido non è necessariamente nella stessa direzione della velocità angolare. Consideriamo una ruota che è attaccata su un’asta in modo asimmetrico, L1 = I 1 1 ma, stiamo attenti, con l’asse che attraversa il centro di gravità (FIGURA 20.6). 1 Quando imprimiamo alla ruota una rotazione attorno all’asse, tutti sanno L che vi sarà oscillazione nei sostegni a causa del modo asimmetrico in cui l’abbiamo montata. Qualitativamente sappiamo che nel sistema ruotante vi L2 = I 2 2 è una forza centrifuga agente sulla ruota, che cerca di lanciare la sua massa 2 più lontana possibile dall’asse. Questo tende ad allineare il piano della ruota in modo che sia perpendicolare all’asse. Per resistere a questa tendenza, viene esercitato un momento dai supporti. Se vi è un momento esercitato FIGURA 20.6 Il momento della quantità di moto dai supporti, vi deve essere una rapidità di variazione del momento della di un corpo rotante non è necessariamente parallelo quantità di moto. Come può esservi una rapidità di variazione del momento alla velocità angolare. della quantità di moto, quando stiamo semplicemente facendo ruotare la ruota attorno all’asse? Supponiamo di dividere la velocità angolare ! nelle componenti !1 e !2 perpendicolare e parallela al piano della ruota. Qual è il momento della quantità di moto? I momenti di inerzia attorno a questi due assi sono differenti, così le componenti del momento della quantità di moto, che (soltanto in questi particolari e speciali assi) sono uguali ai momenti di inerzia per le corrispondenti componenti della velocità angolare, stanno in un rapporto diverso da quello delle componenti della velocità angolare. Quindi il vettore momento della quantità di moto è in una direzione nello spazio non allineata all’asse. Quando giriamo l’oggetto, dobbiamo ruotare nello spazio il vettore momento della quantità di moto, così dobbiamo esercitare momenti sull’asta. Benché sia troppo complicato dimostrarlo qui; vi è un’importantissima z e interessante proprietà del momento di inerzia che è semplice da descrivere z e da usare, e che è la base della nostra analisi precedente. Questa proprietà è la seguente: qualsiasi corpo rigido, anche irregolare come una patata, possiede tre assi reciprocamente perpendicolari che attraversano il centro C z di massa, tali che il momento di inerzia rispetto a uno di questi assi ha il massimo valore possibile rispetto a qualsiasi asse che passi per il CM, L il momento di inerzia rispetto a un altro degli assi ha il minimo valore y B y possibile e il momento di inerzia rispetto al terzo asse è intermedio fra i x y due (o uguale a uno di essi). Questi assi sono chiamati assi principali del A x corpo, e hanno l’importante proprietà che se il corpo sta ruotando attorno x a uno di essi, il suo momento della quantità di moto è nella stessa direzione della velocità angolare. Per un corpo avente assi di simmetria, gli assi principali sono gli assi di simmetria. Se prendiamo gli assi x, y e z diretti come gli assi principali FIGURA 20.7 La velocità angolare e il momento della (FIGURA 20.7), e chiamiamo A, B e C i corrispondenti momenti princi- quantità di moto di un corpo rigido (A>B >C). pali di inerzia, possiamo facilmente calcolare il momento della quantità di moto e l’energia cinetica di rotazione del corpo per qualsiasi velocità angolare !. Se decomponiamo ! nelle componenti ! x, !y e !z , lungo gli assi x, y e z, e usiamo i vettori unitari i, j, k, di nuovo lungo x, y e z, possiamo scrivere il momento della quantità di moto come L = A! x i + B!y j + C!z k

(20.16)

L’energia cinetica di rotazione è E.C. =

⌘ 1 1⇣ 2 A! x + B!y2 + C!z2 = L · ! 2 2

(20.17)

21

L’oscillatore armonico

21.1

Equazioni differenziali lineari

Nello studio della fisica il corso è comunemente diviso in una serie di argomenti, come la meccanica, l’elettricità, l’ottica ecc., e si studia un argomento dopo l’altro. Per esempio, questo corso ha finora trattato soprattutto la meccanica. Però ripetutamente accade un fatto strano: le equazioni che compaiono in diversi campi della fisica, e anche in altre scienze, sono spesso quasi esattamente le stesse, cosicché parecchi fenomeni hanno manifestazioni equivalenti in diversi altri campi. Per fare l’esempio più semplice, la propagazione delle onde sonore è per molti versi analoga alla propagazione delle onde luminose. Se studiamo in modo particolareggiato l’acustica scopriamo che molto del lavoro da fare è lo stesso di quello che ci sarebbe se studiassimo in modo altrettanto particolareggiato l’ottica. Così lo studio di un fenomeno in un campo può permettere un’estensione della nostra conoscenza in un altro campo. È meglio renderci conto fin dall’inizio che tali estensioni sono possibili, perché altrimenti si può non comprendere la ragione per cui si dedica una grande quantità di tempo e di energia a quello che appare essere soltanto una piccola parte della meccanica. L’oscillatore armonico, che ci accingiamo a studiare, ha strette analogie in parecchi altri campi; benché partiamo con l’esempio meccanico di un peso attaccato a una molla, o di un pendolo con una piccola oscillazione, o di certi altri dispositivi meccanici, noi stiamo in realtà studiando una determinata equazione differenziale. Questa equazione appare così tante volte in fisica e in altre scienze e in realtà è legata a così tanti fenomeni che il vantaggio che ne deriva da un suo studio attento giustifica pienamente il tempo che gli dedicheremo. Alcuni dei fenomeni che implicano questa equazione sono: le oscillazioni di una massa attaccata a una molla; le oscillazioni della carica che fluisce avanti e indietro in un circuito elettrico; le vibrazioni di un diapason che genera onde sonore; le vibrazioni analoghe degli elettroni in un atomo, che generano onde luminose; le equazioni che regolano un servosistema, come un termostato che cerca di regolare una temperatura; complicate interazioni nelle reazioni chimiche; lo sviluppo di una colonia di batteri in interazione con la disponibilità di cibo e con i veleni che i batteri producono; volpi che mangiano conigli, che si cibano d’erba, e così via. Tutti questi fenomeni seguono equazioni che sono molto simili l’una all’altra, e questo è il motivo per cui studiamo l’oscillatore meccanico in modo tanto dettagliato. Queste equazioni sono chiamate equazioni differenziali lineari con coefficienti costanti. Un’equazione differenziale lineare con coefficienti costanti è un’equazione differenziale che consiste in una somma di diversi termini, ciascuno dei quali è una derivata della variabile dipendente rispetto alla variabile indipendente, moltiplicata per una costante. Quindi, nella forma più generale, abbiamo: an

dn x + an dt n

1

dn 1 x dx + · · · + a1 + a0 x = f (t) dt dt n 1

(21.1)

detta equazione differenziale lineare di ordine n con coefficienti costanti (ciascun coefficiente ai è costante).

21.2 • L’oscillatore armonico

© 978-8808-22107-0

21.2

213

L’oscillatore armonico

Forse il sistema meccanico più semplice il cui moto segue un’equazione differenziale lineare con coefficienti costanti è una massa attaccata a una molla: anzitutto la molla si tende per equilibrare la gravità; una volta equilibrata, allora discutiamo lo spostamento verticale della massa dalla sua posizione di equilibrio (FIGURA 21.1). Chiameremo x questo spostamento verso l’alto e supporremo che anche la molla sia perfettamente lineare, nel qual caso la forza che tira indietro quando la molla è tesa è esattamente proporzionale all’entità dell’allungamento. Cioè la forza è k x (con il segno meno per ricordarci che è una forza che tira indietro). Quindi la massa per l’accelerazione deve essere uguale a k x: d2 x = kx dt 2

m

(21.2)

Per semplicità, supponiamo che accada (oppure cambiamo l’unità di misura del tempo) che il rapporto k/m = 1. Studieremo prima l’equazione d2 x = x dt 2

(21.3)

In seguito ritorneremo all’equazione (21.2) con k e m esplicitamente presenti. Abbiamo già analizzato in dettaglio numericamente l’equazione (21.3); quando abbiamo introdotto l’argomento della meccanica, abbiamo risolto questa equazione (vedi equazione (9.12)) per trovare il moto. Per integrazione numerica abbiamo trovato una curva (FIGURA 9.4) che mostrava che se m era inizialmente spostato, ma fermo, si sarebbe abbassato e sarebbe passato per il punto zero; non seguimmo allora il moto ulteriormente, ma sappiamo naturalmente che esso continua ad andare su e giù: oscilla. Quando abbiamo calcolato il moto numericamente, abbiamo trovato che passava per il punto di equilibrio a t = 1,570. La durata dell’intero ciclo è quattro volte tanto, ossia t 0 = 6,28 «secondi». Questo fu trovato numericamente prima di conoscere bene il calcolo. Supponiamo che nel frattempo il Dipartimento di Matematica abbia tirato fuori una funzione che, differenziata due volte, sia uguale a se stessa con il segno meno. (Naturalmente c’è la possibilità di arrivare a questa funzione in maniera diretta, ma è più complicato del conoscere già qual è la risposta.) La funzione è x = cos t Se differenziamo questa funzione, troviamo dx = dt

sen t

e

d2 x = dt 2

cos t = x

La funzione x = cos t parte da t = 0, con x = 1 e velocità iniziale nulla; questa era la situazione da cui siamo partiti quando abbiamo fatto il nostro lavoro numerico. Ora che sappiamo che x = cos t, possiamo calcolare un valore esatto per il tempo al quale dovrebbe passare per x = 0. La risposta è t = ⇡/2, ossia t = 1,57080. Ci eravamo sbagliati sull’ultima cifra a causa degli errori dell’analisi numerica, tuttavia eravamo molto vicini! Ora per proseguire col problema originale ritorniamo con le unità di tempo ai secondi reali. Qual è allora la soluzione? Prima di tutto, possiamo pensare di poter ottenere le costanti k e m moltiplicando cos t per qualcosa. Così proviamo l’equazione x = A cos t e troviamo

d2 x dx = A sen t e = A cos t = x dt dt 2 Scopriamo dunque, sconvolti, che non siamo riusciti a risolvere l’equazione (21.2), ma che abbiamo di nuovo ottenuto l’equazione (21.3)!

m

x 0

21.1 Massa attaccata a una molla: un semplice esempio di oscillatore armonico. FIGURA

214

Capitolo 21 • L’oscillatore armonico

© 978-8808-22107-0

Tale fatto illustra una delle più importanti proprietà delle equazioni differenziali lineari: se moltiplichiamo una soluzione dell’equazione per una costante qualsiasi, essa è ancora una soluzione. La ragione matematica di questo è chiara. Se x è una soluzione e noi moltiplichiamo entrambi i membri dell’equazione, diciamo per A, vediamo che anche tutte le derivate sono moltiplicate per A, e quindi Ax è proprio una buona soluzione dell’equazione originale come lo era x. L’aspetto fisico di questo è il seguente. Se abbiamo un peso attaccato a una molla e lo tiriamo in basso due volte tanto, la forza è due volte più grande, l’accelerazione risultante è due volte tanto, la velocità acquistata in un dato tempo è doppia, doppia è la distanza percorsa in un dato tempo; ma esso deve coprire una distanza doppia per ritornare all’origine perché è stato tirato in basso di una distanza doppia. Così occorre lo stesso tempo per ritornare all’origine indipendentemente dallo spostamento iniziale. In altre parole, con un’equazione lineare, il moto ha lo stesso andamento nel tempo indipendentemente da quanto «forte» esso sia. Quello che abbiamo fatto non era la cosa giusta da fare: abbiamo imparato soltanto che possiamo moltiplicare la soluzione per qualsiasi cosa, e questo soddisfa ancora quell’equazione, ma non un’equazione diversa. Dopo un po’ di prove e riprove per ottenere un’equazione con una differente costante che moltiplica x troviamo che dobbiamo alterare la scala del tempo. In altre parole l’equazione (21.2) ha una soluzione della forma x = cos (!0 t)

(21.4)

(È importante renderci conto che, nel caso presente, !0 non è la velocità angolare di un corpo rotante, ma esauriamo tutte le lettere se non ci è permesso di usare la stessa lettera per più di una grandezza.) La ragione per cui poniamo uno «0» come pedice a ! è che avremo altri omega fra poco; ricordiamoci che !0 si riferisce al moto naturale dell’oscillatore. Proviamo ora l’equazione (21.4) e questa volta avremo più successo, dato che dx = !0 sen (!0 t) dt

e

d2 x = !02 cos (!0 t) = !02 x dt 2

Abbiamo quindi risolto l’equazione che volevamo risolvere. L’equazione d2 x = !02 x dt 2 è l’equazione (21.2) se !02 = k/m. La prossima cosa su cui dobbiamo investigare è il significato fisico di !0 . Sappiamo che la funzione coseno ripete se stessa quando l’angolo a cui si riferisce è 2⇡. Così x = cos(!0 t) ripeterà il suo moto, cioè compirà un ciclo completo, quando l’«angolo» cambia di 2⇡. La quantità !0 t è spesso chiamata la fase del moto. Per cambiare !0 t di 2⇡, il tempo deve cambiare di una quantità t 0 , detta periodo di un’oscillazione completa; naturalmente t 0 deve essere tale che !0 t 0 = 2⇡. Cioè !0 t 0 deve render conto di un ciclo dell’angolo, dopodiché tutto si ripeterà allo stesso modo: se aumentiamo t di t 0 , aggiungiamo 2⇡ alla fase. Quindi r 2⇡ m t0 = = 2⇡ (21.5) !0 k Così, se avessimo una massa più pesante, impiegherebbe più tempo per oscillare avanti e indietro attaccata a una molla. Questo perché ha più inerzia, mentre le forze sono le stesse, quindi occorre un tempo più lungo per ottenere il movimento della massa. Oppure, se la molla è più robusta si muoverà più rapidamente, e questo è giusto: il periodo è minore se la molla è più robusta. Notate che il periodo di oscillazione di una massa attaccata a una molla non dipende assolutamente da come è stata fatta partire, da quanto la tiriamo in basso. Il periodo è determinato, ma l’ampiezza dell’oscillazione non è determinata dall’equazione del moto (21.2). L’ampiezza è determinata, in effetti, da come facciamo partire la molla, da ciò che chiamiamo le condizioni iniziali o condizioni di partenza. In realtà non abbiamo affatto trovato la soluzione più generale possibile dell’equazione (21.2). Vi sono altre soluzioni. Dovrebbe essere chiaro il perché: perché la totalità dei casi coperti da

21.3 • Moto armonico e moto circolare

© 978-8808-22107-0

215

x = a cos(!0 t) parte con uno spostamento iniziale e senza velocità iniziale. Ma è possibile, per esempio, per la massa, partire a x = 0, possiamo allora darle un impulso iniziale cosicché abbia una certa velocità per t = 0. Un moto simile non è rappresentato da un coseno, ma da un seno. Per metterla in un altro modo, se x = cos(!0 t) è una soluzione, allora non è ovvio che se ci accadesse di entrare nella stanza a un certo istante (che chiameremmo «t = 0») e vedessimo la massa mentre sta passando per x = 0, essa continuerebbe ad andare allo stesso modo? Quindi, x = cos(!0 t) non può essere la soluzione più generale; deve essere possibile spostare l’origine del tempo, per così dire. Come esempio potremmo scrivere la soluzione in questo modo: ⇥ x = a cos !0 (t

t1)



dove t 1 è una certa costante. Questo corrisponde anche a spostare l’origine del tempo a un nuovo istante. Inoltre, possiamo sviluppare cos (!0 t + ) = cos (!0 t) cos

sen (!0 t) sen

oppure x = A cos (!0 t) + B sen (!0 t) dove A = a cos e B = a sen . Ognuna di queste forme è un modo possibile di scrivere la soluzione generale e completa di (21.2): cioè, ogni soluzione che esiste al mondo dell’equazione differenziale d2 x/dt 2 = !02 x può essere scritta indifferentemente in uno dei seguenti modi: ⇥ x = a cos !0 (t

t1)

x = a cos (!0 t + )



x = A cos (!0 t) + B sen (!0 t)

(21.6a) (21.6b) (21.6c)

Alcune delle quantità delle (21.6) hanno un nome: !0 è detta pulsazione; è il numero di radianti di cui la fase cambia in un secondo. Essa è determinata dall’equazione differenziale. Le altre costanti non sono determinate dall’equazione, ma da come è iniziato il moto. Di queste costanti, a misura il massimo spostamento raggiunto dalla massa, ed è chiamata ampiezza dell’oscillazione. La costante è talvolta chiamata fase dell’oscillazione, ma ciò genera confusione perché altri chiamano fase !0 t + , e dicono che la fase cambia col tempo. Possiamo dire che è uno sfasamento da un certo zero definito. Mettiamola in modo diverso: differenti corrispondono a moti in differenti fasi. Questo è giusto, ma il voler chiamare la fase o no è un’altra questione.

21.3

Moto armonico e moto circolare

Il fatto che intervengono coseni nella soluzione dell’equazione (21.2) suggerisce che vi possa essere qualche relazione con i cerchi. Questo è artificioso, naturalmente, perché non vi è in realtà alcun cerchio implicato nel moto lineare: oscilla semplicemente su e giù. Possiamo mettere in evidenza che abbiamo, in effetti, già risolto quell’equazione differenziale quando stavamo studiando la meccanica del moto circolare. Se una particella si muove su un cerchio con una velocità costante v, il raggio vettore dal centro del cerchio alla particella ruota di un angolo la cui ampiezza è proporzionale al tempo. Se chiamiamo questo angolo ✓ (FIGURA 21.2) abbiamo: ✓=

vt R

e

d✓ v = !0 = dt R

Sappiamo poi che vi è un’accelerazione a=

v2 = !02 R R

y

v a R

x

21.2 Particella che si muove su una traiettoria circolare a velocità costante. FIGURA

216

Capitolo 21 • L’oscillatore armonico

© 978-8808-22107-0

che è diretta verso il centro. Ora sappiamo anche che la posizione x, a un dato momento, è il raggio del cerchio moltiplicato per cos ✓ e che y è il raggio moltiplicato per sen ✓: x = R cos ✓ y = R sen ✓ Che dire dell’accelerazione? Qual è la componente x dell’accelerazione, d2 x/dt 2 ? Abbiamo già calcolato ciò geometricamente: è il modulo dell’accelerazione per il coseno dell’angolo di proiezione, con un segno meno perché è diretta verso il centro; quindi: a x = a cos ✓ = !02 R cos ✓ = !02 x

(21.7)

In altre parole, quando una particella si muove su un cerchio, la componente orizzontale del suo moto ha un’accelerazione che è proporzionale allo spostamento orizzontale dal centro. Naturalmente abbiamo anche la soluzione per il moto circolare: x = R cos (!0 t) L’equazione (21.7) non dipende dal raggio del cerchio, così per un cerchio di raggio qualsiasi si trova la stessa equazione per un dato !0 . Quindi, per diverse ragioni, ci aspettiamo che lo spostamento di una massa attaccata a una molla risulterà essere proporzionale a cos(!0 t) e sarà, in effetti, lo stesso moto che vedremmo se osservassimo la componente x della posizione di un oggetto rotante lungo un cerchio con velocità angolare !0 . Come verifica di questo si può predisporre un esperimento per dimostrare che il moto oscillante di una massa attaccata a una molla è lo stesso di quello di un punto che ruota lungo un cerchio. In FIGURA 21.3 un fascio di luce proietta le ombre di un perno di biella posto su un albero, e di una massa oscillante posta a fianco. Se abbandoniamo la massa al tempo giusto dal punto giusto, e se la velocità dell’albero è regolata con cura in modo che le frequenze si uguaglino, ciascuna ombra dovrebbe seguire esattamente l’altra. Si può anche controllare la soluzione numerica che abbiamo ottenuto prima con la funzione coseno, e vedere che si accorda molto bene. Sottolineiamo che, essendo il moto circolare uniforme così strettamen2 1 te legato da un punto di vista matematico al moto oscillatorio, possiamo 1 Luce 2 analizzare il moto oscillatorio in modo più semplice se lo immaginiamo del 0 Ombre come la proiezione di qualcosa che ruota in cerchio. In altre parole, benché proiettore la distanza y non significhi niente nel problema dell’oscillatore, possiamo anche integrare artificialmente l’equazione (21.2) con un’altra equazione, usando y, e mettere insieme le due. Se facciamo questo saremo in grado di analizzare il nostro oscillatore unidimensionale con moti circolari, che è molto più facile del dover risolvere un’equazione differenziale. L’espediente nel fare questo è di usare i numeri complessi, un procedimento che FIGURA 21.3 Dimostrazione dell’equivalenza fra moto introdurremo nel prossimo capitolo. armonico semplice e moto circolare uniforme.

21.4

Condizioni iniziali

Consideriamo ora che cosa determina le costanti A e B, o a e . Naturalmente queste sono determinate da come facciamo iniziare il moto. Se facciamo partire il moto semplicemente con un piccolo spostamento, si ha un tipo di oscillazione; se lo facciamo partire con uno spostamento iniziale e poi lo spingiamo verso l’alto, quando lo abbandoniamo, otteniamo un moto diverso. Le costanti A e B, ossia a e , o qualsiasi altro sia il modo di scriverle, sono naturalmente determinate dal modo in cui il moto è iniziato, non da qualche altra caratteristica della situazione. Queste sono chiamate le condizioni iniziali. Vorremmo collegare le condizioni iniziali alle costanti. Benché questo possa essere fatto usando una qualunque delle forme delle (21.6), risulta essere più semplice se usiamo l’equazione (21.6c).

21.4 • Condizioni iniziali

© 978-8808-22107-0

Supponiamo che per t = 0 siamo partiti con uno spostamento iniziale x 0 e con una certa velocità v0 . Questo è il modo più generale in cui possiamo fare iniziare il moto. (È vero, non possiamo specificare l’accelerazione con cui il moto è iniziato, poiché quella è determinata dalla molla, una volta che abbiamo specificato x 0 .) Calcoliamo ora A e B. Partiamo con l’equazione per x: x = A cos (!0 t) + B sen (!0 t) Poiché avremo bisogno in seguito anche della velocità, differenziamo x e otteniamo v = !0 A sen (!0 t) + !0 B cos (!0 t) Queste espressioni sono valide per tutti i t, ma conosciamo in particolare x e v per t = 0. Così se poniamo t = 0 in queste equazioni, al primo membro otteniamo x 0 e v0 , perché è quanto valgono x e v per t = 0; sappiamo anche che il coseno di zero è uno, e il seno di zero è zero. Quindi otteniamo x0 = A · 1 + B · 0 = A

e

v0 = !0 A · 0 + !0 B · 1 = !0 B

Quindi per questo caso particolare troviamo che A = x0

B=

v0 !0

Da questi valori di A e di B, possiamo ottenere, se vogliamo, a e . Questa è la conclusione della nostra soluzione, ma vi è una cosa fisicamente interessante da verificare: la conservazione dell’energia. Poiché non vi sono perdite dovute all’attrito l’energia deve essere conservata. Usiamo la formula x = a cos (!0 t + ) allora v = !0 a sen (!0 t + ) Cerchiamo di scoprire ora qual è l’energia cinetica T, e qual è l’energia potenziale U. L’energia potenziale a ogni istante è k x 2 /2, dove x è lo spostamento e k è la costante della molla. Se sostituiamo x, usando l’espressione sopra, otteniamo U=

1 2 1 2 k x = ka cos2 (!0 t + ) 2 2

Naturalmente l’energia potenziale non è costante; il potenziale non diventa mai negativo, dato che vi è sempre una certa energia nella molla, ma la quantità di energia fluttua con x. L’energia cinetica d’altra parte è mv 2 /2, e sostituendo otteniamo T=

1 1 mv 2 = m!02 a2 sen2 (!0 t + ) 2 2

Ora l’energia cinetica è zero quando x è al massimo, perché allora non vi è velocità; d’altra parte essa è massima quando x passa per zero, perché allora la massa si muove più in fretta. Questa variazione dell’energia cinetica è giusto l’opposto di quella dell’energia potenziale. Ma l’energia totale deve essere una costante. Se notiamo che k = m!02 , vediamo che T +U =

f g 1 1 m!02 a2 cos2 (!0 t + ) + sen2 (!0 t + ) = m!02 a2 2 2

L’energia dipende dal quadrato dell’ampiezza; se abbiamo il doppio dell’ampiezza, otteniamo un’oscillazione che ha quattro volte tanto di energia. L’energia potenziale media è metà della massima e, quindi, metà del totale, e l’energia cinetica media è ugualmente metà dell’energia totale.

217

218

Capitolo 21 • L’oscillatore armonico

21.5

© 978-8808-22107-0

Oscillazioni forzate

Passiamo ora a trattare l’oscillatore armonico forzato, cioè un oscillatore in cui vi è una forza esterna agente che lo mantiene in moto. L’equazione allora è la seguente: m

d2 x = k x + F(t) dt 2

(21.8)

Vorremmo scoprire che cosa accade in tali circostanze. La forza esterna che mantiene il moto può avere vari tipi di dipendenza funzionale dal tempo; la prima che analizzeremo è molto semplice, supporremo che la forza sia oscillante: F(t) = F0 cos (!t)

(21.9)

Notate però che questo ! non è necessariamente !0 : abbiamo ! sotto il nostro controllo; la forza applicata può avere diverse frequenze. Così cerchiamo di risolvere l’equazione (21.8) con la particolare forza (21.9). Qual è la soluzione della (21.8)? Una soluzione particolare (discuteremo il caso più generale in seguito) è x = C cos (!t) (21.10) dove la costante deve essere determinata. In altre parole, possiamo supporre che se manteniamo la spinta avanti e indietro, la massa proseguirebbe avanti e indietro al passo con la forza. Possiamo verificarlo. Inserendo la (21.10) e la (21.9) nella (21.8) otteniamo m!2 C cos (!t) = m!02 C cos (!t) + F0 cos (!t)

(21.11)

Abbiamo anche sostituito k = m!02 , cosicché alla fine capiremo meglio l’equazione. Ora, poiché il coseno appare dovunque possiamo eliminarlo e questo dimostra che la (21.10) è in effetti una soluzione, ammesso che scegliamo bene C. La risposta è che C deve essere C=

F0 ⇣ 2 !0 m

!2



(21.12)

Cioè m oscilla alla stessa frequenza della forza, ma con un’ampiezza che dipende dalla frequenza della forza e anche dalla frequenza del moto naturale dell’oscillatore. Ciò significa, primo che se ! è molto piccolo rispetto a !0 , allora lo spostamento e la forza sono nella stessa direzione. D’altra parte, se agitiamo l’oscillatore avanti e indietro molto in fretta, allora la (21.12) ci dice che C è negativo se ! è sopra la frequenza naturale !0 dell’oscillatore armonico. (Chiameremo !0 la frequenza naturale dell’oscillatore armonico e ! la frequenza applicata.) A frequenze molto alte il denominatore può diventare molto grande, e non vi è allora un’ampiezza molto grande. Naturalmente la soluzione che abbiamo trovato è la soluzione soltanto se le cose sono partite nel modo giusto, perché altrimenti vi è una parte che comunemente si estingue dopo un po’. Quest’altra parte è chiamata risposta transitoria alla F(t), mentre la (21.10) e la (21.12) sono chiamate risposta stazionaria. Secondo la nostra formula (21.12) dovrebbe accadere anche una cosa molto notevole: se ! ha quasi esattamente lo stesso valore di !0 , allora C dovrebbe tendere all’infinito. Così se regoliamo la frequenza della forza in modo che sia «in sincronia» con la frequenza naturale, dovremmo ottenere uno spostamento enorme. Questo è ben noto a chiunque abbia spinto un bambino sull’altalena: non va molto bene chiudere gli occhi e spingere a caso a una certa velocità. Se ci accade di avere la giusta fase, allora l’altalena va molto alta, ma se abbiamo una fase sbagliata, allora talvolta possiamo trovarci a spingere quando dovremmo tirare e così via, e l’altalena non funziona correttamente, cioè cala la sua ampiezza di oscillazione. Se facciamo ! esattamente uguale a !0 , l’ampiezza di oscillazione risulterebbe infinita, il che è naturalmente impossibile. La ragione per cui ciò non accade è che c’è qualcosa di sbagliato nell’equazione, vi sono alcuni altri termini di attrito, e altre forze, che non sono nella (21.8) ma che esistono nel mondo reale. Così l’ampiezza non raggiunge l’infinito per qualche ragione; può essere che la molla si spezzi!

Algebra

22.1

Addizione e moltiplicazione

Nel nostro studio sui sistemi oscillanti avremo occasione di usare una delle più notevoli, quasi stupefacenti, formule di tutta la matematica. Dal punto di vista del fisico potremmo introdurre questa formula in due minuti o poco più, e ritenerci soddisfatti. Ma la scienza è tanto per il godimento intellettuale quanto per l’utilità pratica, così invece di dedicare soltanto alcuni minuti a questo sorprendente gioiello, lo circonderemo con la sua incastonatura nel grande schema di quella branca della matematica che è detta algebra elementare. Ora potreste chiedere: «Che cosa c’entra la matematica in una lezione di fisica?». Abbiamo parecchie giustificazioni possibili: la prima, naturalmente, è che la matematica è uno strumento importante, ma questa sarebbe una scusa soltanto per dare la formula in due minuti. D’altra parte, nella fisica teorica scopriamo che tutte le nostre leggi possono essere scritte in forma matematica; e questo ha una certa semplicità e bellezza. Così, in ultima analisi, per capire la natura può essere necessario avere una più profonda comprensione delle relazioni matematiche. Ma la ragione reale è che il soggetto è piacevole, e benché noi uomini spezzettiamo la natura in diversi modi, e abbiamo corsi diversi nei diversi dipartimenti, tale compartimentazione è in realtà artificiale, e dovremmo prendere i nostri piaceri intellettuali dove li troviamo. Un’altra ragione per osservare ora l’algebra più accuratamente, anche se la maggior parte di noi ha studiato l’algebra al liceo, è che quella era la prima volta che la studiavamo; nessuna delle equazioni ci era familiare, ed era un lavoro arduo, proprio come lo è ora la fisica. È spesso un gran piacere guardare indietro per vedere quale territorio è stato coperto e qual è la gran mappa o il piano dell’intero insieme. Forse un giorno qualcuno del Dipartimento di Matematica presenterà una lezione sulla meccanica in modo tale da mostrare cos’era che stavamo cercando di imparare nel corso di fisica! Il soggetto dell’algebra non sarà sviluppato esattamente dal punto di vista di un matematico, perché i matematici sono principalmente interessati a come i vari fatti matematici vengono dimostrati, a quante ipotesi sono assolutamente necessarie e a ciò che invece non è necessario. Essi non sono altrettanto interessati al risultato di ciò che dimostrano. Per esempio, possiamo trovare il teorema di Pitagora interessantissimo; che la somma dei quadrati dei lati di un triangolo rettangolo sia uguale al quadrato dell’ipotenusa è un fatto interessante, una cosa semplice in modo curioso che possiamo apprezzare senza discutere la questione di come dimostrarlo, o di quali assiomi siano necessari. Così, con lo stesso spirito descriveremo qualitativamente, se possiamo metterla così, il sistema dell’algebra elementare. Diciamo algebra elementare per il fatto che vi è una branca della matematica chiamata algebra moderna nella quale alcune regole quali ab = ba sono abbandonate, ed essa è ancora chiamata algebra, ma non la discuteremo. Per discutere l’argomento partiamo da metà. Supponiamo di conoscere già che cosa sono gli interi, che cosa è zero e che cosa significa aumentare un numero di una unità. Voi potete dire: «Ciò non significa cominciare da metà!». Ma questa è la metà dal punto di vista matematico, dato che potremmo andare più indietro e descrivere la teoria degli insiemi per derivare alcune proprietà degli interi. Ma noi non stiamo andando in tale direzione, quella della filosofia matematica e della logica matematica, ma piuttosto nell’altra direzione, dall’ipotesi che sappiamo che cosa sono gli interi e che sappiamo come contare.

22

220

Capitolo 22 • Algebra

© 978-8808-22107-0

Se partiamo con un certo numero a, un intero, e contiamo successivamente un’unità b volte, il numero a cui arriviamo lo chiamiamo a + b, e ciò definisce l’addizione di interi. Una volta definita l’addizione possiamo allora considerare questo: se partiamo con niente e addizioniamo a esso a, per b volte consecutivamente, chiameremo il risultato moltiplicazione di interi e la indichiamo con b · a. Possiamo anche avere una successione di moltiplicazioni: se partiamo con 1 e moltiplichiamo per a, per b volte in successione, chiamiamo ciò elevazione a potenza: a b . Come conseguenza di queste definizioni può essere facilmente dimostrata la veridicità delle seguenti relazioni: a+b= b+a

(22.1a)

a + (b + c) = (a + b) + c

(22.1b)

ab = ba

(22.1c)

a (b + c) = ab + ac

(22.1d)

(ab) c = a (bc)

(22.1e)

(ab)c = a c bc

(22.1f)

a b a c = a(b+c)

(22.1g)

(a b )c = a(bc)

(22.1h)

a+0= a

(22.1i)

a·1=a

(22.1j)

a1 = a

(22.1k)

Questi risultati sono ben conosciuti e non ritorneremo su questo punto, li elenchiamo semplicemente. Naturalmente 1 e 0 hanno particolari proprietà; per esempio: a + 0 = a, a · 1 = a, a1 = a. In questa discussione dobbiamo anche assumere l’esistenza di qualche altra proprietà, come la continuità e l’ordinamento, che sono molto difficili da definire; lo lasceremo fare alla teoria rigorosa. Inoltre è del tutto giusto che abbiamo scritto troppe «regole»; alcune di esse possono essere deducibili dalle altre, ma non ci preoccuperemo di questi argomenti.

22.2

Le operazioni inverse

In aggiunta alle operazioni dirette di addizione, moltiplicazione ed elevazione a potenza, abbiamo anche le operazioni inverse, che sono definite come segue. Supponiamo che siano dati a e c e che vogliamo trovare quali valori di b soddisfino alle equazioni: a + b = c, ab = c, ba = c. L’operazione chiamata sottrazione è chiara: se abbiamo l’addizione a + b = c, allora b = c a definisce la sottrazione. L’operazione chiamata divisione è anch’essa chiara: se abbiamo la moltiplicazione ab = c, allora b = c/a definisce la divisione – una soluzione dell’equazione ab = c «a rovescio». Se abbiamo la potenza ba = p c e ci domandiamo: «Che cos’è b?», esso è chiamato la radice a di ordine a di c e scriviamo b = c. Per esempio se ci poniamo il quesito: «Quale intero elevato alla terza potenza è uguale a 8?», la risposta è chiamata radice cubica di 8, ed è 2. Inoltre, poiché ba e a b non sono uguali, vi sono due problemi inversi associati con le potenze e l’altro problema inverso è: «A quale potenza deve essere elevato 2 per ottenere 8?». Questa operazione è chiamata logaritmo e, se a b = c, scriviamo b = loga c. Il fatto che il logaritmo abbia una notazione più «scomoda», non significa che sia meno elementare delle altre operazioni,

22.3 • Astrazione e generalizzazione

© 978-8808-22107-0

almeno quando è applicato agli interi. Benché i logaritmi in un corso di algebra vengano introdotti tardi, in pratica essi sono, naturalmente, altrettanto semplici delle radici; essi sono precisamente un diverso tipo di soluzione di un’equazione algebrica. Le operazioni dirette e inverse vengono riassunte nel modo seguente: Addizione a+b=c

Sottrazione b=c a

Moltiplicazione ab = c

Divisione b = c/a

Potenza ba = c

Radice p a b= c

Potenza ab = c

Logaritmo b = loga c

(22.2)

Ora, qui è l’idea. Le relazioni, ossia le regole, sono corrette per gli interi, dato che conseguono dalle definizioni di addizione, moltiplicazione ed elevazione a potenza. Stiamo per discutere se possiamo o meno allargare la classe degli oggetti che a, b e c rappresentano cosicché essi obbediscano a queste stesse regole; anche se i processi per a + b e così via non saranno definibili mediante l’azione diretta di addizionare 1, per esempio, o di successive moltiplicazioni per interi.

22.3

Astrazione e generalizzazione

Quando cerchiamo di risolvere semplici equazioni algebriche usando tutte queste definizioni, scopriamo presto alcuni problemi insolubili, come il seguente. Supponiamo di cercare di risolvere l’equazione b = 3 5. Ciò significa, secondo la nostra definizione di sottrazione, che dobbiamo trovare un numero che, quando è addizionato a 5 dia 3. E naturalmente non vi è un tale numero, dato che consideriamo soltanto gli interi positivi; questo è un problema insolubile. Però, il piano, la grande idea, è questa: astrazione e generalizzazione. Dall’intera struttura dell’algebra, regole più interi, astraiamo le definizioni originali di addizione e moltiplicazione, ma abbandoniamo le regole (22.1) e (22.2), e assumiamo che siano valide in generale su una classe più ampia di numeri, anche se esse sono derivate originariamente su una classe più piccola. Così, piuttosto che usare simbolicamente gli interi per definire le regole, usiamo le regole come definizioni dei simboli che rappresentano un più generale tipo di numero. Come esempio, lavorando con le regole soltanto, possiamo dimostrare che 3 5 = 0 2. Infatti possiamo dimostrare che si possono fare tutte le sottrazioni, ammesso che definiamo un intero gruppo di nuovi numeri: 0 1, 0 2, 0 3, 0 4 e così via, detti interi negativi. Dunque possiamo usare tutte le altre regole, quali a(b + c) = ab + ac e via di seguito, per trovare quali sono le regole per moltiplicare i numeri negativi, e scopriremo infatti che tutte le regole possono essere mantenute con gli interi negativi come con gli interi positivi. Abbiamo così aumentato la sfera degli oggetti su cui le regole funzionano, ma il significato dei simboli è diverso. Non si può dire, per esempio, che 2 moltiplicato per 5 significa realmente addizionare 5 successivamente 2 volte. Questo non significa niente. Ma nondimeno ogni cosa funzionerà bene secondo le regole. Un interessante problema sorge nel fare le potenze. Supponiamo di voler scoprire che cosa significa a3 5 . Sappiamo soltanto che 3 5 è una soluzione del problema x + 5 = 3, poiché (3 5) + 5 = 3. Conoscendo questo, sappiamo che a3 5 a5 = a3 . Quindi sappiamo anche, dalla definizione di divisione, che a3 a3 5 = 5 a Con un piccolo lavoro in più, questo può essere ridotto a 1/a2 . Così troviamo che le potenze negative sono i reciproci delle potenze positive, ma 1/a2 è un simbolo senza significato, dato che

221

222

Capitolo 22 • Algebra

© 978-8808-22107-0

se a è un intero positivo o negativo il quadrato di esso è maggiore di 1, e non sappiamo ancora ciò che intendiamo con 1 diviso per un numero maggiore di 1! Avanti! Il grande piano è di continuare il processo di generalizzazione; ogni volta che troviamo un altro problema che non possiamo risolvere estendiamo il nostro regno dei numeri. Consideriamo la divisione: non possiamo trovare un numero che sia un intero, anche un intero negativo, che sia uguale al risultato di dividere 3 per 5. Ma se supponiamo che anche tutti i numeri frazionari soddisfino le regole, possiamo parlare della moltiplicazione e dell’addizione delle frazioni, e tutto funziona bene come prima. Facciamo un altro esempio sulle potenze: cos’è a3/5 ? Sappiamo soltanto che (3/5)5 = 3, dato che questa era la definizione di 3/5. Così sappiamo anche che (a3/5 ) 5 = a(3/5) 5 = a3 , perché questa è una delle regole. Allora dalla definizione dalla radice troviamo che p 5 a3/5 = a3 In questo modo, dunque, possiamo definire ciò che intendiamo con l’introdurre le frazioni al posto dei vari simboli, usando le regole stesse per aiutarci a determinare la definizione – ciò non è arbitrario. È un fatto notevole che tutte le regole valgano per gli interi positivi e negativi, come pure per le frazioni! Proseguiamo nel processo di generalizzazione. Vi sono delle altre equazioni che non possiamo risolvere? Sì, ve ne sono. Per esempio è impossibile risolvere quest’equazione: p b = 21/2 = 2 È impossibile trovare un numero che sia razionale (una frazione) il cui quadrato è uguale a 2. È molto facile per noi ai nostri giorni rispondere a questo quesito. Conosciamo il sistema decimale, e così non abbiamo difficoltà nel valutare esattamente il significato di decimale infinito come un tipo di approssimazione alla radice quadrata di 2. Storicamente quest’idea presentava grande difficoltà per i Greci. Il definire realmente con precisione il senso di questo richiede che aggiungiamo qualcosa di essenziale sulla continuità e sulla numerabilità, e in effetti proprio il passo più difficile nel processo di generalizzazione è esattamente in questo punto. Ciò è stato fatto formalmente e rigorosamente da Dedekind. Però, senza preoccuparci del rigore matematico della cosa, è piuttosto semplice capire che quello che intendiamo è che troveremo un’intera sequenza di frazioni approssimate, frazioni perfette (dato che qualunque decimale, dovunque sia arrestato, è naturalmente razionale), che va sempre avanti, avvicinandosi sempre più al risultato desiderato. Questo è sufficiente per ciò che vogliamo discutere, ci permette di occuparci dei numeri irrazionali e di calcolare cose quali la radice quadrata di 2 fino all’accuratezza che desideriamo, purché ci diamo abbastanza da fare.

22.4

Approssimazione dei numeri irrazionali

Il prossimo problema riguarda le potenze irrazionali. Supponiamo di voler definire, per esempio, p 2 10 . In linea di principio la risposta è abbastanza semplice. Se approssimiamo la radice quadrata di 2 fino a un certo numero di cifre decimali, allora la potenza è razionale, e possiamo prendere la p radice approssimata, usando il metodo di cui sopra, e ottenere un’approssimazione di 10 2 . Poi possiamo sviluppare fino ad alcune cifre decimali in più (rimane sempre razionale), prendere la radice adatta, questa volta una radice di ordine superiore perché vi è un denominatore più grande nella frazione, e ottenere un’approssimazione migliore. Naturalmente otterremo certe radici di ordine estremamente elevato, e il lavoro diventerà estremamente difficoltoso. Come possiamo affrontare questo problema? Nei calcoli delle radici quadrate, delle radici cubiche e di altre radici di ordine non elevato, vi è un processo aritmetico utilizzabile con cui possiamo ottenere una cifra decimale dopo l’altra. Ma la mole di lavoro necessaria per calcolare le potenze irrazionali e i logaritmi a esse associati (il problema inverso) è così grande che non vi è nessun semplice processo aritmetico che possiamo

© 978-8808-22107-0

22.4 • Approssimazione dei numeri irrazionali

usare. Quindi sono state approntate tavole che ci permettono di calcolare queste potenze e sono chiamate tavole dei logaritmi, oppure tavole delle potenze, a seconda del modo in cui la tavola è costruita. È semplicemente una questione di risparmio di tempo: se dobbiamo elevare un certo numero a una potenza irrazionale, possiamo cercarlo sulle tavole piuttosto che stare a eseguire il calcolo. Naturalmente un calcolo del genere è semplicemente un problema tecnico, ma è interessante e di grande valore storico. p In primo luogo, non abbiamo soltanto da risolvere il problema x = 10 2 , ma dobbiamo risolvere anche il problema 10x = 2, ossia x = log10 2. Questo non è un problema in cui come risultato dobbiamo definire un nuovo tipo di numero, è semplicemente un problema di calcolo. La risposta consiste semplicemente in un numero irrazionale, un decimale infinito, non in una nuova specie di numero. Discutiamo ora il problema di calcolare le soluzioni di equazioni di questo tipo. Il concetto generale è in realtà molto semplice. Se calcolassimo 101 , 10p4/10, 101/100 , 104/1000 e così via, e li moltiplicassimo tutti insieme, otterremmo 101,414... ossia 10 2 , questo è il concetto generale su cui si basa il processo. Ma invece di calcolare 101/10 e così via, calcoleremo 101/2 , 101/4 e via di seguito. Prima di cominciare, dovremmo spiegare perché facciamo tanto lavoro col numero 10 invece che con qualche altro numero. Naturalmente ci rendiamo conto che le tavole dei logaritmi sono di grande utilità pratica, del tutto estranea al problema matematico di estrarre radici, perché con qualsiasi base abbiamo logb (ac) = logb a + logb c (22.3) Abbiamo grande familiarità col fatto che si può usare tutto ciò in modo pratico per moltiplicare i numeri se abbiamo una tavola di logaritmi. L’unica questione è, con quale base b li calcoleremo? Non fa differenza quale base si usi; possiamo usare ogni volta lo stesso principio, e se stiamo usando logaritmi con una qualsiasi base particolare, possiamo trovare i logaritmi in qualsiasi altra base semplicemente cambiando la scala, un fattore moltiplicativo. Se moltiplichiamo l’equazione (22.3) per 61, essa rimane valida, e se avessimo una tavola di logaritmi in base b, e qualcuno moltiplicasse tutto il contenuto della nostra tavola per 61, non avremmo differenze essenziali. Supponiamo di conoscere i logaritmi di tutti i numeri in base b. In altre parole, possiamo risolvere l’equazione ba = c per qualsiasi c per il fatto che abbiamo una tavola. Il problema è di trovare il logaritmo dello stesso numero c, con una certa altra base, diciamo la base x. Vorremmo 0 risolvere x a = c. È facile da farsi, poiché possiamo sempre scrivere x = bt , che definisce t conoscendo x e b. In realtà t = logb x. Allora se introduciamo questo e risolviamo rispetto ad a 0, 0 0 vediamo che (bt )a = bt a = c. In altre parole ta 0 è il logaritmo di c in base b. Così a 0 = a/t. Dunque i logaritmi in base x sono semplicemente 1/t, che è una costante, moltiplicata per i logaritmi in base b. Quindi qualsiasi tavola di logaritmi è equivalente a qualsiasi altra tavola di logaritmi se moltiplichiamo per una costante, e la costante è 1/ logb x. Questo ci consente di scegliere una base particolare, e per convenienza prendiamo la base 10. (Può sorgere il problema se vi sia una qualsiasi base naturale, una base in cui le cose siano in qualche modo più semplici, e cercheremo di trovare una risposta in seguito. Per il momento useremo la base 10.) Ora vediamo come calcolare i logaritmi. Cominciamo col calcolare successive radici quadrate di 10, per tentativi successivi. I risultati sono mostrati nella TABELLA 22.1. Le potenze di 10 sono date nella prima colonna, e il risultato, 10s , è dato nella terza colonna. Dunque 101 = 10. La potenza 101/2 può essere facilmente calcolata, perché è la radice quadrata di 10, e vi è un procedimanto semplice e noto per estrarre la radice quadrata di qualsiasi numero.(1) Usando questo procedimento troviamo che la prima radice quadrata è 3,16228. Quanto ci è utile? Ci dice già qualcosa, ci dice come ottenere 100,5 , così ora conosciamo almeno un logaritmo, se ci accade di aver bisogno del logaritmo di 3,16228, sappiamo che la risposta è vicino a 0,50000. Ma dobbiamo fare un po’ meglio; abbiamo chiaramente bisogno di più informazioni. Così estraiamo ancora la radice quadrata, e troviamo 101/4 , che è 1,77828. Ora abbiamo il logaritmo di più numeri rispetto a prima, 1,250 è il logaritmo di 17,78 e, incidentalmente, se accade che qualcuno (1)

Vi è un procedimento aritmetico definito, ma il modo più facile per trovare la radice quadrata di un qualsiasi numero N è di scegliere un a sufficientemente vicino, trovare N/a, mediare a0 = [a + (N/a)]/2 e usare questo a0 medio per la successiva scelta di a. La convergenza è molto rapida: il numero delle cifre significative raddoppia ogni volta.

223

224

Capitolo 22 • Algebra

© 978-8808-22107-0

TABELLA

22.1

Potenza s

Radici quadrate successive di 10.

1024 s

10s

(10s – 1)/s

1024

10,00000

9,00

1/2

512

3,16228

4,32

1/4

256

1,77828

3,113

1/8

128

1,33352

2,668

1/16

64

1,15478

2,476

1/32

32

1,074607

2,3874

1/64

16

1,036633

2,3445

1/128

8

1,018152

2,3234211

1/256

4

1,0090350

2,3130104

1/512

2

1,0045073

2,307753

1/1024

1

1,0022511

2,305126

1

26

∆/1024 (∆Æ0)



1 + 0,0022486 ∆

2,3025

chieda 100,75 , possiamo ottenerlo, perché si tratta di 100,5+0,25 ; è quindi il prodotto del secondo e del terzo numero. Se possiamo ottenere abbastanza numeri nella colonna s da essere in grado di comporre quasi qualsiasi numero, allora moltiplicando le cose appropriate della colonna 3, possiamo ottenere 10 elevato a qualsiasi potenza; questa è l’idea. Così calcoliamo dieci successive radici quadrate di 10 e questo è il lavoro principale coinvolto dai calcoli. Perché non continuiamo per ottenere un’accuratezza sempre maggiore? Perché cominciamo a osservare qualcosa. Quando eleviamo 10 a una potenza molto piccola, otteniamo 1 più una piccola quantità. La ragione di ciò è chiara, perché dobbiamo trovare la 1000-esima potenza di 101/1000 per ritornare a 10, così è meglio non partire con un numero troppo grande; esso deve essere vicino a 1. Quello che notiamo è che i piccoli numeri che devono essere aggiunti a 1 cominciano ad apparire come se li dividessimo semplicemente per 2 ogni volta; vediamo che 1815 diviene 903, quindi 450, 225; così è chiaro che, con un’eccellente approssimazione, se estraiamo un’altra radice, otterremo qualcosa come 1,00112, e piuttosto che fare in realtà tutte le radici quadrate, facciamo una congettura sul limite ultimo. Quando prendiamo una piccola frazione /1024 per che si approssima a zero, quale sarà la risposta? Naturalmente sarà un certo numero vicino a 1+0,0022511 . Non esattamente 1+0,0022511 , però – possiamo ottenere un valore migliore con il seguente espediente: sottraiamo 1 e dividiamo per la potenza s. Questo dovrebbe correggere tutti gli eccessi portandoli allo stesso valore. Vediamo che essi sono con ottima approssimazione uguali. In alto nella tabella non sono uguali, ma come scendono, essi si avvicinano sempre più a un valore costante. Qual è il valore? Osserviamo di nuovo per vedere come procede la serie, come è cambiata con s. È cambiata di 211, di 104, di 53 e di 26. Queste variazioni sono ovviamente metà l’una dell’altra, o quasi, man mano che scendiamo. Quindi se continuassimo, le variazioni sarebbero 13, 7, 3, 2 e 1, più o meno, ossia un totale di 26. Così dobbiamo proseguire soltanto di 26, e quindi troviamo che il numero esatto è 2,3025. (In realtà vedremo in seguito che il numero esatto sarebbe 2,3026, ma per mantenerlo realistico non cambieremo niente nell’aritmetica.) Da questa tabella possiamo ora calcolare qualsiasi potenza di 10 componendo la potenza in 1024-esimi. Calcoliamo ora realmente un logaritmo; il processo che useremo è quello da cui in realtà derivano le tavole dei logaritmi. Il procedimento è mostrato nella TABELLA 22.2 e i valori numerici sono mostrati nella TABELLA 22.1 (colonne 2 e 3). Supponiamo di volere il logaritmo di 2. Cioè, vogliamo sapere a quale potenza dobbiamo elevare 10 per ottenere 2. Possiamo elevare 10 alla potenza 1/2? No; è troppo grande. In altre parole possiamo vedere che la risposta sarà maggiore di 1/4 e minore di 1/2. Togliamo il fattore 101/4 ; dividiamo 2 per 1,778... e otteniamo 1,124... e così via; ora sappiamo che abbiamo sottratto 0,250000 dal logaritmo. Il numero 1,124... è ora il numero di cui ci occorre il logaritmo. Quando avremo finito riaddizioneremo 1/4, ossia 256/1024. Osserviamo ora sulla tabella il

22.4 • Approssimazione dei numeri irrazionali

© 978-8808-22107-0

TABELLA

22.2

Calcolo di un logaritmo: log10 2.

2 ÷ 1,77828 = 1,124682 1,124682 ÷ 1,074607 = 1,046598 ecc.



2 = (1,77828)(1,074607)(1,036633)(1,0090350)(1,000573) = = 10 = 10



1 (256 + 32 + 16 + 4 + 0,254) 1024

0,30103

= 10

308,254 1024

(

=

573 = 0,254 2249

(

log10 2 = 0,30103

numero seguente, appena inferiore a 1,124...: esso è 1,074607. Dividiamo quindi per 1,074607 e otteniamo 1,046598. Da questo scopriamo che 2 può essere costituito dal prodotto dei numeri che sono nella TABELLA 22.1, nel modo seguente: 2 = (1,77828) (1,074607) (1,036633) (1,0090350) (1,000573) È rimasto un fattore 1,000573, naturalmente, che è al di fuori dell’intervallo della nostra tabella. Per ottenere il logaritmo di questo fattore, usiamo il risultato che 10 /1024 ⇡ 1 + 2,3025 /1024. Troviamo = 0,254. Quindi la nostra risposta è 10 alla seguente potenza: (256 + 32 + 16 + 4 + + 0,254)/1024. Addizionando questi otteniamo 308,254/1024. Dividendo otteniamo 0,30103, così sappiamo che log10 2 = 0,30103, che è esatto fino alla quinta cifra! Questo è il modo in cui i logaritmi furono calcolati originariamente da Briggs di Halifax, nel 1620. Egli affermava: «Ho calcolato successivamente cinquantaquattro radici quadrate di 10». Sappiamo che egli calcolò in realtà soltanto le prime ventisette, dato che le rimanenti possono essere ottenute con questo trucco usando il . Il suo lavoro implicò il calcolo della radice quadrata di 10 ventisette volte, che non è molto più delle dieci volte che abbiamo fatto noi; però fu un lavoro maggiore perché egli calcolò sedici cifre decimali, e poi ridusse la risposta a quattordici decimali quando la pubblicò, in modo che non vi fossero errori di arrotondamento. Egli fece con questo metodo tavole di logaritmi fino a quattordici cifre decimali, il che è veramente noioso. Ma tutte le tavole di logaritmi, per trecento anni, furono derivate dalle tavole di Briggs riducendo il numero di cifre decimali. Soltanto nei tempi moderni, con il WPA e le macchine calcolatrici, si sono rese disponibili nuove tavole calcolate indipendentemente. Vi sono oggi metodi molto più efficienti per calcolare i logaritmi, usando determinati sviluppi in serie. Nel processo descritto sopra abbiamo scoperto qualcosa di piuttosto interessante, e cioè che per piccole potenze ✏ possiamo facilmente calcolare 10✏ ; abbiamo scoperto che 10✏ = 1 + 2,3025✏, da una semplice analisi numerica. Naturalmente questo significa che anche 10n/2,3025 = 1 + n se n è molto piccolo. Ora i logaritmi con qualsiasi altra base sono semplicemente multipli dei logaritmi in base 10. La base 10 fu usata soltanto perché abbiamo dieci dita, e la sua aritmetica è facile, ma se ci poniamo il problema per una base matematica naturale, che non abbia niente a che vedere con il numero delle dita degli esseri umani, dobbiamo cercare di cambiare la nostra scala di logaritmi in qualche maniera conveniente e naturale, e il metodo che è stato scelto è di ridefinire i logaritmi moltiplicando per 2,3025... tutti i logaritmi in base 10. Questo corrisponde allora a usare una certa altra base, e questa è detta base naturale, o base e. Notate che loge (1 + n) ⇡ n, ossia en ⇡ 1 + n per n ! 0. È abbastanza facile trovare che cos’è e: e = 101/2,3025 o 100,434294... , una potenza irrazionale. La nostra tabella delle radici quadrate successive di 10 può essere usata per calcolare, non soltanto i logaritmi, ma anche qualsiasi potenza di 10; così usiamola per calcolare questa base naturale e. Per convenienza trasformiamo 0,434294... in 444,73/1024. Ora 444,73 è 256+128+32+16+2+0,73. Quindi e, poiché è un esponente di una somma, sarà un prodotto dei numeri (1,77828) (1,33352) (1,074607) (1,036633) (1,018152) (1,009035) (1,001643) = 2,7184

225

226

Capitolo 22 • Algebra

© 978-8808-22107-0

(Il solo problema è l’ultimo termine, che è 0,73 e che non è nella tabella, ma sappiamo che se è abbastanza piccolo, la risposta è 1 + 2,3025 .) Quando moltiplichiamo tutti questi insieme otteniamo 2,7184 (dovrebbe essere 2,7183, ma è abbastanza buono). L’uso di tali tabelle, quindi, è il mezzo con cui sono calcolati le potenze irrazionali e i logaritmi di numeri irrazionali. Questo tiene conto degli irrazionali.

22.5

Numeri complessi

Risulta ora che dopo tutto questo lavoro non possiamo ancora risolvere qualsiasi equazione! Per esempio, qual è la radice quadrata di 1 ? Supponiamo di dover trovare x 2 = 1. Il quadrato di nessun numero razionale, né irrazionale, né di alcuna cosa che abbiamo visto finora è uguale a 1. Così dobbiamo di nuovo generalizzare i nostri numeri a una classe ancora più ampia. Supponiamo che una soluzione specifica di x 2 = 1 abbia un nome, la chiameremo i; i ha per definizione la proprietà che il suo quadrato è 1. Questo è tutto quello che diremo di esso; naturalmente vi è più di una radice dell’equazione x 2 = 1. Qualcuno potrebbe scrivere i, ma un altro potrebbe dire: «No, io preferisco i. Il mio i è il vostro i con il segno negativo». Essa è una soluzione altrettanto buona, e poiché la sola definizione è che i è tale che i 2 = 1, deve essere vero che qualsiasi equazione possiamo scrivere è ugualmente esatta se il segno di i è cambiato ovunque. Questo è chiamato «prendere il complesso coniugato». Ora costruiremo numeri addizionando successivi i, moltiplicando i per altri numeri, addizionandoli e via di seguito, secondo tutte le regole che abbiamo. In questo modo troviamo che i numeri possono essere scritti tutti nella forma p + iq, dove p e q sono quelli che chiamiamo numeri reali, cioè i numeri che abbiamo definito finora. Il numero i è chiamato unità immaginaria. Qualsiasi multiplo reale di i è chiamato immaginario puro. Il numero più generale a è della forma p + iq ed è chiamato numero complesso. Le cose non peggiorano se per esempio moltiplichiamo due numeri di questo tipo, diciamo (r + is)(p + iq). Usando le regole, otteniamo (r + is)(p + iq) = = r p + r(iq) + (is)p + (is)(iq) = = r p + i(rq) + i(sp) + (ii)(sq) = = (r p sq) + i(rq + sp)

(22.4)

poiché ii = i 2 = 1. Quindi tutti i numeri che ora soddisfano alle regole (22.1) hanno questa forma matematica. Ora direte: «Questo può andare avanti all’infinito! Abbiamo definito potenze di immaginari e tutto il resto, e una volta terminato qualcun altro arriverà con un’equazione che non può essere risolta, come x 6 + 3x 2 = 2. Dobbiamo allora generalizzare tutto di nuovo!». Ma risulta che con questa invenzione in più, appunto la radice quadrata di 1, ogni equazione algebrica può essere risolta! Questo è un fatto straordinario la cui dimostrazione dobbiamo lasciare al Dipartimento di Matematica. Le dimostrazioni sono molto belle e molto interessanti, ma certamente non evidenti per se stesse. Infatti la supposizione più ovvia è che dovremmo continuare sempre a inventare. Ma il miracolo più grande di tutti è che non dobbiamo farlo. Questa è l’ultima invenzione. Dopo questa invenzione dei numeri complessi, troviamo che le regole continuano a essere valide anche per i numeri complessi, e abbiamo finito di inventare cose nuove. Possiamo trovare le potenze complesse di qualsiasi numero complesso, possiamo risolvere qualsiasi equazione scritta algebricamente in funzione di un numero finito di questi simboli. Non troviamo nessun numero nuovo. La radice quadrata di i, per esempio, ha un risultato definito, non è qualcosa di nuovo; i i significa qualcosa. Lo discuteremo ora. Abbiamo già discusso la moltiplicazione, e l’addizione è altrettanto facile; se sommiamo due numeri complessi, (p + iq) + (r + is), la risposta è (p + r) + i(q + s). Ora possiamo addizionare e moltiplicare numeri complessi. Ma il problema reale, naturalmente, è di calcolare le potenze complesse dei numeri complessi. Risulta che in realtà il problema non è più difficile del calcolo

22.5 • Numeri complessi

© 978-8808-22107-0

227

delle potenze complesse dei numeri reali. Così concentriamoci ora sul problema di calcolare 10 elevato a una potenza complessa, non semplicemente una potenza irrazionale, ma 10r+is . Naturalmente dobbiamo usare sempre le nostre regole (22.1) e (22.2). Quindi 10r+is = 10r 10is

(22.5)

Ma 10r sappiamo già come calcolarlo e possiamo sempre moltiplicare qualsiasi cosa per qualcosa d’altro; quindi il problema è di calcolare soltanto 10is . Chiamiamolo come un certo numero complesso, x + iy. Problema: dato s, trovare x e y. Ora se 10is = x + iy allora il complesso coniugato di quest’equazione deve essere altrettanto vero, così che 10

is

=x

iy

(Così vediamo che possiamo dedurre un certo numero di cose senza in realtà calcolare niente, usando le nostre regole.) Deduciamo un’altra cosa interessante moltiplicando queste insieme: 10is 10

is

= 100 = 1 = (x + iy)(x

iy) = x 2 + y 2

(22.6)

Così se troviamo x, abbiamo anche y. Ora il problema è come calcolare 10 elevato a una potenza immaginaria. Quale indicazione abbiamo? Possiamo lavorare sulle nostre regole fino a che non andiamo oltre, ma esiste un’indicazione ragionevole: se possiamo calcolare la potenza per qualsiasi s particolare, possiamo farlo per tutto il resto. Se conosciamo 10is per qualsiasi s e lo vogliamo per due volte s, allora possiamo elevare al quadrato il numero e così via. Ma come possiamo calcolare 10is , anche per un particolare valore di s? Per farlo dovremo fare un’ipotesi addizionale che veramente non è nell’elenco delle altre regole, ma che conduce a ragionevoli risultati, e ci permette di fare progressi: quando la potenza è piccola supporremo che la «legge» 10✏ = 1 + 2,3025 ✏ sia giusta, quando ✏ diviene molto piccolo, non soltanto per ✏ reale, ma pure per ✏ complesso. Quindi cominciamo con l’ipotesi che questa legge sia vera in generale, e che ci dica che 10is = 1 + 2,3025 is, per s ! 0. Così ammettiamo che se s è molto piccolo, diciamo una parte su 1024, abbiamo un’approssimazione piuttosto buona per 10is . Facciamo ora una tabella con la quale possiamo calcolare tutte le potenze immaginarie di 10, cioè calcolare x e y. Ciò viene fatto nel modo seguente. La prima potenza con la quale iniziamo è 1/1024, che presumiamo sia molto vicina a 1 + 2,3025 i/1024. Così partiamo con 10i/1024 = 1,00000 + 0,0022486 i e se continuiamo moltiplicando il numero per se stesso, possiamo ottenere una potenza immaginaria di ordine superiore. Infatti possiamo semplicemente invertire il procedimento usato nel costruire la tavola dei logaritmi, e calcolare il quadrato, la quarta potenza, l’ottava potenza ecc., della (22.7) e in questo modo costruire i valori mostrati nella TABELLA 22.3. Notiamo una cosa interessante: i numeri x sono positivi all’inizio ma poi diventano negativi. Esamineremo questo un po’ più a fondo tra un momento. Ma prima possiamo essere curiosi di trovare per quale numero s la parte reale di 10is è zero. Il valore y sarebbe 1 e così avremmo 10is = 1i, ossia is = log10 i. Come esempio dell’uso di questa tabella, proprio come abbiamo calcolato prima il log10 2, usiamo ora la TABELLA 22.3 per trovare log10 i. Quali dei numeri che appaiono nella TABELLA 22.3 dobbiamo moltiplicare tra loro per ottenere un risultato immaginario puro? Dopo alcuni tentativi ed errori, scopriamo che per ridurre x al massimo, la miglior cosa è moltiplicare «512» per «128». Questo dà 0,13056 + 0,99159 i. Scopriamo allora che dovremmo moltiplicare questo risultato per un numero la cui parte immaginaria è circa uguale al valore della parte reale

(22.7)

22.3 Successivi quadrati di 10i/1024 = 1 + 0,0022486 i. TABELLA

Potenza is

1024 s

10is

i /1024

1

1,00000 + 0,00225i (*)

i /512

2

1,00000 + 0,00450i

i /256

4

0,99996 + 0,00900i

i /128

8

0,99984 + 0,01800i

i /64

16

0,99936 + 0,03599i

i /32

32

0,99742 + 0,07193i

i /16

64

0,98967 + 0,14349i

i /8

128

0,95885 + 0,28402i

i /4

256

0,83872 + 0,54467i

i /2

512

0,40679 + 0,91365i

i /1

1024

– 0,66928 + 0,74332i

(*) Dovrebbe essere 0,0022486i.

Capitolo 22 • Algebra

228

© 978-8808-22107-0

che stiamo cercando di sopprimere. Così scegliamo «64» il cui valore y è 0,14349, poiché questo è il più vicino a 0,13056. Otteniamo allora 0,01308 + 1,00008 i. Ora abbiamo passato il segno e dobbiamo dividere per 0,99996 + 0,00900 i. Come facciamo? Cambiando il segno di i e moltiplicando per 0,99996 0,00900 i (che funziona se x 2 + y 2 = 1). Continuando in questo modo troviamo l’intera potenza a cui deve essere elevato 10 per dare i, è i(512 + 128 + 64 4 + 2 + 0,20)/1024, ossia 698,20 i/1024. Se eleviamo 10 a tale potenza possiamo ottenere i. Quindi log10 i = 0,68184 i.

22.6

Esponenti immaginari

Per esaminare ulteriormente l’argomento dell’elevamento a potenze immaginarie e complesse, osserviamo le potenze di 10 prendendo potenze successive, non raddoppiando la potenza ogni volta, in modo da seguire ulteriormente la TABELLA 22.3 e vedere che cosa TABELLA 22.4 Successive potenze di 10i/8 . accade a quei termini negativi. Questo è mostrato nella TABELLA 22.4, in cui prendiamo 10i/8 e continuiamo semplicemente a moltiplicare. Vediamo ip/8 p = potenza · 8/i 10 che x decresce, passa attraverso zero, arriva quasi a 1 (se entrassimo fra p = 10 e p = 11 arriverebbe ovviamente a 1) e ritorna indietro. Anche il 0 + 1,00000 + 0,00000i valore di y sta andando avanti e indietro. 1 + 0,95882 + 0,28402i In FIGURA 22.1 i punti rappresentano i numeri che appaiono nella TA2 + 0,83867 + 0,54465i BELLA 22.4 e le linee sono semplicemente tracciate per aiutare la vostra 3 + 0,64944 + 0,76042i osservazione visiva. Così vediamo che i numeri x e y oscillano; 10is si ri4 + 0,40672 + 0,91356i pete, è una quantità periodica e, come tale, è abbastanza facile da spiegare, 5 + 0,13050 + 0,99146i 6 – 0,15647 + 0,98770i poiché se una certa potenza è i, allora la quarta potenza di essa sarebbe 7 – 0,43055 + 0,90260i i 2 al quadrato. Sarebbe ancora +1, e quindi, poiché 100,68 i è uguale a i, 8 – 0,66917 + 0,74315i prendendo la quarta potenza scopriamo che 102,72 i è uguale a +1. Quindi, 9 – 0,85268 + 0,52249i se volessimo 103,00 i , per esempio, lo scriveremmo come 102,72 i per 100,28 i . 10 – 0,96596 + 0,25880i In altre parole, ha un periodo, si ripete. Naturalmente ci accorgiamo a che 11 – 0,99969 – 0,02620i cosa assomigliano le curve! Esse hanno l’aspetto del seno e del coseno, e 12 – 0,95104 – 0,30905i le chiameremo, per un momento, seno algebrico e coseno algebrico. Però, 14 – 0,62928 – 0,77717i invece di usare la base 10, le porremo nella nostra base naturale, il che cam16 – 0,10447 – 0,99453i bia soltanto la scala orizzontale; così indichiamo 2,3025s con t, e scriviamo 18 + 0,45454 – 0,89098i 10is = eit , dove t è un numero reale. Ora eit = x + iy, e lo scriveremo 20 + 0,86648 – 0,49967i come il coseno algebrico di t più i per il seno algebrico di t. Quindi 22 + 0,99884 + 0,05287i 24

+ 0,80890 + 0,58836i

eit = cos t + i sen t

(22.8)

Quali sono le proprietà di cos t e sen t? Per prima cosa sappiamo, per esempio, che x 2 + y 2 deve essere 1; l’abbiamo dimostrato prima ed è ugualmente esatto per la base e come per la base 10. Quindi cos2 t + sen2 t = 1. Sappiamo anche che, per piccoli t si ha eit = 1 + it, e quindi cos t è

+1

10is = x + iy y

+0,5 0,5

1,0

0

–0,5 FIGURA

22.1

Rappresentazione grafica dei valori di TABELLA 22.4.

–1

x

1,5

2,0

2,5

3,0

22.6 • Esponenti immaginari

© 978-8808-22107-0

229

quasi 1 e sen t è quasi t, e così accade che tutte le varie proprietà di queste notevoli funzioni, che derivano dal fare le potenze immaginarie, siano le stesse del seno e del coseno in trigonometria. Il periodo è lo stesso? Troviamolo. Elevato a quale potenza e è uguale a i? Qual è il logaritmo di i in base e? L’abbiamo ricavato prima, in base 10 era 0,68184 i, ma quando cambiamo la nostra scala logaritmica in e, dobbiamo moltiplicare per 2,3025, e se lo facciamo risulta 1,570. Questo sarà chiamato «⇡/2 algebrico». Ma, vediamo, esso differisce dal ⇡/2 regolare soltanto per l’ultima cifra decimale, e questo, naturalmente, è il risultato degli errori della nostra aritmetica! Così abbiamo creato due nuove funzioni in una maniera puramente algebrica, il coseno e il seno, che appartengono all’algebra e soltanto all’algebra. Diveniamo consapevoli, alla fine, di scoprire le stesse funzioni che sono naturali nella geometria. Quindi, in ultima analisi, vi è una connessione fra algebra e geometria. Riassumiamo con questo la più notevole formula matematica: ei✓ = cos ✓ + i sen ✓

(22.9)

Questo è il nostro gioiello. Possiamo mettere in relazione la geometria con l’algebra rappresentando i numeri complessi in un piano; la posizione orizzontale di un punto è x, la posizione verticale di un punto è y (FIGURA 22.2). Rappresentiamo ogni numero complesso, x + iy. Allora se la distanza radiale di questo punto è chiamata r e l’angolo è chiamato ✓, la legge algebrica è che x + iy è scritto nella forma rei✓ , dove le relazioni geometriche fra x, y, r e ✓ sono quelle mostrate. Questa, quindi, è l’unificazione di algebra e geometria. Quando abbiamo iniziato questo capitolo, armati soltanto delle nozioni fondamentali sugli interi e sul contare, avevamo una pallida idea della potenza dei processi di astrazione e generalizzazione. Usando l’insieme delle «leggi» algebriche, o proprietà dei numeri, le equazioni (22.1) e le definizioni delle operazioni inverse (22.2), siamo stati in grado qui, da soli, di fabbricare non soltanto dei numeri, ma anche cose utili quali le tavole di logaritmi, di potenze e di funzioni trigonometriche (perché queste sono lo stesso delle potenze immaginarie dei numeri reali), tutto semplicemente estraendo dieci successive radici quadrate di dieci!

y r x

FIGURA

y x

22.2

Rappresentazione del numero complesso x + iy = r ei ✓ .

23

Risonanza

23.1 Asse immaginario r y

Asse reale

x

23.1 Un numero complesso può essere rappresentato da un punto nel «piano complesso». FIGURA

Numeri complessi e moto armonico

In questo capitolo continueremo la nostra discussione dell’oscillatore armonico e, in particolare, dell’oscillatore armonico forzato, usando una nuova tecnica di analisi. Nel precedente capitolo abbiamo introdotto il concetto dei numeri complessi, che hanno parti reali e parti immaginarie e che possono essere rappresentati su un diagramma nel quale l’ordinata rappresenta la parte immaginaria e l’ascissa la parte reale. Se a è un numero complesso possiamo scriverlo come a = ar + iai , dove il pedice «r» indica la parte reale e il pedice «i» la parte immaginaria di a. Riferendoci alla FIGURA 23.1, vediamo che possiamo anche scrivere un numero complesso a nella duplice forma a = x + iy = rei✓ essendo r 2 = x 2 + y 2 = (x + iy)(x

iy) = aa⇤

(Il complesso coniugato di a, scritto a⇤ , è ottenuto invertendo il segno di i in a.) Così rappresenteremo un numero complesso in entrambe le due forme, una parte reale più una parte immaginaria, o un modulo r e un cosiddetto angolo di fase ✓. Dati r e ✓, x e y sono chiaramente x = r cos ✓

y = r sen ✓

Inversamente, dato un numero complesso nella forma a = x + iy, si ha r=

q

x2 + y2

tg ✓ =

y x

dove tg ✓ è quindi il rapporto tra la parte immaginaria e la parte reale di a. Ci apprestiamo ad applicare i numeri complessi alla nostra analisi dei fenomeni fisici col seguente artificio. Abbiamo esempi di cose che oscillano: l’oscillazione può avere una forza motrice che è una certa costante per cos(!t). Ora, una forza come F = F0 cos(!t), può essere scritta come la parte reale di un numero complesso F = F0 ei!t poiché ei!t = cos (!t) + i sen (!t) La ragione per cui lo facciamo è che è più facile lavorare con una funzione esponenziale che con un coseno. Così, l’artificio sta tutto nel rappresentare le nostre funzioni oscillanti come le parti reali di certe funzioni complesse. Il numero complesso F = F0 ei!t , che abbiamo così definito, non è una forza fisica «reale», perché nessuna forza fisica è in realtà complessa; le forze «reali» non hanno una parte immaginaria, soltanto una parte reale. Parleremo però di «forza» F = F0 ei!t , ma naturalmente la forza effettiva è la parte reale di tale espressione. Facciamo un altro esempio. Supponiamo di voler rappresentare una forza che è un’onda cosinusoidale sfasata con un ritardo di fase . Questa naturalmente sarebbe la parte reale di F0 ei(!t ) , ma per le proprietà degli esponenziali possiamo scrivere ei(!t ) = ei!t e i . Così

23.1 • Numeri complessi e moto armonico

© 978-8808-22107-0

vediamo che l’algebra degli esponenziali è molto più facile di quella dei seni e dei coseni; questa è la ragione per cui abbiamo scelto di usare i numeri complessi. Scriveremo spesso F = F0 e

i

ˆ i!t ei!t = Fe

(23.1)

Mettiamo un piccolo segno ( ˆ ) sulla F per ricordarci che questa quantità è un numero complesso; qui il numero è Fˆ = F0 e i Risolviamo ora un’equazione, usando i numeri complessi, per vedere se possiamo risolvere un problema per qualche caso reale. Per esempio, cerchiamo di risolvere d2 x k x F F0 + = = cos (!t) m m m dt 2

(23.2)

in cui F è la forza che fa funzionare l’oscillatore e x è lo spostamento. Ora, per assurdo che possa sembrare, supponiamo che x e F siano in realtà numeri complessi, soltanto per ragioni matematiche. Vale a dire, x ha una parte reale e una parte immaginaria moltiplicata per i, e F ha una parte reale e una parte immaginaria moltiplicata per i. Ora se avessimo una soluzione della (23.2) con numeri complessi e sostituissimo i numeri complessi nell’equazione, otterremmo d2 (x r + ix i ) k(x r + ix i ) Fr + iFi + = m m dt 2 ossia

2 d2 x r k x r * d x i + k x i + = Fr + i Fi + + i 2 m m - m m dt 2 , dt Poiché se due numeri complessi sono uguali, le loro parti reali devono essere uguali, deduciamo perciò che la parte reale di x soddisfa l’equazione con la parte reale della forza. Dobbiamo però sottolineare che questa separazione in una parte reale e in una parte immaginaria non è valida in generale, ma è valida soltanto per equazioni lineari, cioè per le equazioni nelle quali x appare in ogni termine solo alla prima potenza o alla potenza zero. Per esempio, se vi fosse nell’equazione un termine x 2 , allora quando sostituiamo x r + ix i , otterremmo (x r + ix i )2 , ma separato nelle parti reali e immaginarie, questo produrrebbe (x 2r x 2i ) come parte reale e 2i x r x i come parte immaginaria. Così vediamo che la parte reale dell’equazione non implicherebbe solo x 2r , ma anche x 2i . In questo caso otteniamo un’equazione differente da quella che volevamo risolvere, con x i , il fattore totalmente artificiale introdotto nella nostra analisi, mescolato fra i termini. Proviamo ora il nostro nuovo metodo per il problema dell’oscillatore forzato, che sappiamo già come risolvere. Vogliamo risolvere l’equazione (23.2) come prima, ma diciamo che stiamo tentando di risolvere ˆ i!t d2 x k x Fe + = (23.3) m m dt 2 ˆ i!t è un numero complesso. Naturalmente anche x sarà complesso, ma ricordiamo la dove Fe regola: prendere la parte reale per trovare quello che in realtà sta accadendo. Cerchiamo così di risolvere la (23.3) per la soluzione delle oscillazioni forzate; discuteremo in seguito le altre soluzioni. La soluzione delle oscillazioni forzate ha la stessa frequenza della forza applicata, ha una certa ampiezza di oscillazione e una certa fase, e così anch’essa può essere rappresentata con un certo numero complesso x, ˆ la cui ampiezza rappresenta l’oscillazione di x, e la cui fase rappresenta il ritardo, proprio come per la forza. Ora una magnifica caratteristica di una funzione esponenziale è che d ⇣ i!t ⌘ xe ˆ = i! xe ˆ i!t dt Quando differenziamo una funzione esponenziale, abbassiamo l’esponente come un semplice moltiplicatore. La derivata seconda fa la stessa cosa, essa abbassa un altro i!, e così è molto semplice scrivere immediatamente, a vista, qual è l’equazione per x: ˆ ogni volta che vediamo una differenziazione moltiplichiamo semplicemente per i!. (La differenziazione è ora altrettanto

231

232

Capitolo 23 • Risonanza

© 978-8808-22107-0

facile della moltiplicazione! Quest’idea di usare gli esponenziali in equazioni differenziali lineari è quasi altrettanto importante dell’invenzione dei logaritmi, in cui la moltiplicazione è sostituita dall’addizione. Qui la differenziazione è sostituita dalla moltiplicazione.) Così la nostra equazione diviene k Fˆ (i!)2 xˆ + xˆ = (23.4) m m (Abbiamo eliminato il fattore comune ei!t .) Vedete quanto è semplice! Le equazioni differenziali sono immediatamente convertite, a vista, in pure equazioni algebriche. Poiché (i!)2 = !2 , virtualmente abbiamo la soluzione a vista: Fˆ

xˆ =

k m

m

!2

!

Questa espressione può essere lievemente semplificata con la sostituzione k/m = !02 , che dà xˆ =

Fˆ ⇣

m !02

!2



(23.5)

Questa, naturalmente, è la soluzione che avevamo prima; siccome m(!02 !2 ) è un numero reale, gli angoli di fase di Fˆ e di xˆ sono gli stessi (o forse differenti per 180°, se !2 > !02 ), come detto precedentemente. Il modulo, che misura l’ampiezza dell’oscillazione, è legato all’ampiezza di Fˆ dal fattore 1/[m(!02 !2 )], e questo fattore diventa enorme quando ! è quasi uguale a !0 . Così quando applichiamo la giusta frequenza otteniamo una risposta molto grande (se sosteniamo un pendolo all’estremità di una fune e lo scuotiamo proprio alla giusta frequenza, possiamo farlo oscillare molto alto).

23.2

Oscillatore forzato con smorzamento

Questo allora è il modo in cui analizziamo il moto oscillatorio con una tecnica matematica più elegante. Ma l’eleganza della tecnica non è completamente rivelata in un problema siffatto, che può essere risolto facilmente con altri metodi. Risulta evidente soltanto quando la si applica a problemi più difficili. Risolviamo quindi un problema più difficile, che aggiunge anche una caratteristica relativamente realistica al problema precedente. L’equazione (23.5) ci dice che se la frequenza ! fosse esattamente uguale a !0 , avremmo una risposta infinita. In realtà, naturalmente, non si ha una risposta infinita, perché qualche altra cosa, come l’attrito, che finora abbiamo ignorato, limita la risposta. Aggiungiamo quindi all’equazione (23.2) un termine di attrito. Di solito un problema di questo tipo è molto difficile a causa del carattere e della complessità del termine di attrito. Vi sono, però, parecchie circostanze nelle quali la forza di attrito è proporzionale alla velocità con cui l’oggetto si muove. Un esempio di tale attrito è l’attrito nel movimento lento di un oggetto nell’olio o in un liquido viscoso. Non vi sono forze quando l’oggetto sta fermo, ma più veloce esso si muove, più veloce l’olio deve scorrere attorno all’oggetto, e maggiore è la resistenza. Quindi supporremo che, in aggiunta ai termini della (23.2), vi sia un altro termine, una forza di resistenza proporzionale alla velocità: Fr = c

dx dt

Nella nostra analisi matematica, sarà conveniente scrivere la costante c come m per , in modo da semplificare un po’ l’equazione. Questo è proprio lo stesso espediente che usiamo con k quando lo sostituiamo con m!02 , appunto per semplificare l’algebra. Così la nostra equazione sarà m

d2 x dx +c + kx = F dt dt 2

(23.6)

23.2 • Oscillatore forzato con smorzamento

© 978-8808-22107-0

ossia, ponendo c = m , k = m!02 e dividendo per la massa m, d2 x + dt 2

dx F + !02 x = dt m

(23.6a)

Ora abbiamo l’equazione nella forma più conveniente da risolvere. Se è molto piccolo rappresenta un attrito molto piccolo; se è molto grande vi è un attrito enorme. Come risolviamo questa nuova equazione differenziale lineare? Supponiamo che la forza motrice sia uguale a F0 cos(!t + ) ; potremmo introdurre questa espressione nella (23.6a) e cercare di risolverla, ma ˆ i!t invece la risolveremo con il nostro nuovo metodo. Scriviamo così F come parte reale di Fe i!t e x come parte reale di xe ˆ , e sostituiamo nell’equazione (23.6a). Non è nemmeno necessario fare effettivamente la sostituzione, perché vediamo a occhio che l’equazione diventa f

g Fˆ (i!)2 xˆ + (i!) xˆ + !02 xˆ ei!t = ei!t m

(23.7)

(In realtà se cercassimo di risolvere l’equazione (23.6a) con il nostro vecchio metodo diretto, apprezzeremmo realmente la magia del metodo «complesso».) Se dividiamo per ei!t entrambi i ˆ che è membri, allora possiamo ottenere la risposta xˆ alla data forza F, xˆ =

Fˆ ⇣

m !02

!2 + i !

(23.8)



Così xˆ è dato di nuovo da Fˆ volte un certo fattore. Non vi è un nome tecnico per questo fattore, né una lettera particolare per esso, ma ai fini della discussione possiamo chiamarlo R: R= Quindi la (23.8) si scrive come

1 ⇣

m !02

!2 + i !



xˆ = Fˆ R

(23.9)

(Benché le lettere e !0 siano di uso molto comune, questo R non ha un nome particolare.) Questo fattore R può essere scritto sia come p + iq sia come un certo modulo ⇢ per ei✓ . Nel caso che sia scritto come ⇢ei✓ , vediamo che cosa significa. Ora, Fˆ = F0 ei e la forza effettiva F è la parte reale di F0 ei ei!t , cioè, F0 cos(!t + ). Inoltre, l’equazione (23.9) ci dice che xˆ è uguale a Fˆ R. Così, scrivendo R = ⇢ei✓ , otteniamo xˆ = R Fˆ = ⇢ei✓ F0 ei = ⇢F0 ei(✓+

)

Infine, andando anche più indietro, vediamo che la x fisica, che è la parte reale di xe ˆ i!t , è i(✓+ ) i!t i(✓+ +!t) è uguale alla parte reale di ⇢F0 e e . Ma ⇢ e F0 sono reali, e la parte reale di e semplicemente cos(!t + + ✓). Quindi x = ⇢F0 cos(!t + + ✓)

(23.10)

Questo ci dice che l’ampiezza della risposta è l’intensità della forza F, moltiplicata per un certo fattore di ingrandimento ⇢: questo ci dà la «grandezza» dell’oscillazione. Ci dice anche, però, che x non oscilla in fase con la forza, che ha la fase , ma è sfasato di una quantità ✓ in più. Quindi ⇢ e ✓ rappresentano l’ampiezza e lo sfasamento della risposta. Calcoliamo ora quanto vale ⇢. Se abbiamo un numero complesso, il quadrato del modulo è uguale al numero per il suo complesso coniugato; quindi ⇢2 =

m2



!02

!2

1 ⌘⇣ + i ! !02

!2

i !

⌘ =

m2

⇣

1 !2

!02

In più, l’angolo di fase ✓ è facile da trovare, perché se scriviamo 1 1 1 = i✓ = e R ⇢ ⇢e

i✓

⇣ = m !02

!2 + i !



⌘2

(23.11) +

2 !2

233

Capitolo 23 • Risonanza

234

© 978-8808-22107-0

2 0°

–90° 0

–180°

0

FIGURA

23.2

Diagramma di ⇢2 in funzione di ω.

FIGURA

23.3

Diagramma di ✓ in funzione di ω.

vediamo che tg ✓ =

! !2

!02

(23.12)

Esso è negativo perché tg( ✓) = tg ✓. Il valore di ✓ risulta negativo per tutti gli !, e questo corrisponde allo spostamento x in ritardo rispetto alla forza F. La FIGURA 23.2 mostra come ⇢2 varia in funzione della frequenza (⇢2 è fisicamente più interessante di ⇢, perché ⇢2 è proporzionale al quadrato dell’ampiezza, ossia più o meno all’energia che è sviluppata nell’oscillatore dalla forza). Vediamo che se è molto piccolo, allora 1/(!02 !2 )2 è il termine più importante e la risposta cerca di andare verso l’infinito quando ! = !0 . Ora «l’infinito» non è in realtà infinito perché se ! = !0 , c’è ancora il termine 1/ 2 !2 . Lo sfasamento varia come mostrato in FIGURA 23.3. In alcune circostanze otteniamo una formula lievemente diversa dalla (23.8), detta anch’essa formula di «risonanza», e si potrebbe pensare che ciò rappresenti un fenomeno diverso, ma non è così. La ragione è che se è molto piccolo, la parte più interessante della curva è nelle vicinanze di ! = !0 , e possiamo sostituire la (23.8) con una formula approssimata che è molto accurata se è piccolo e ! è vicino a !0 . Se ! è quasi !0 , valgono le approssimazioni: !02

!2 = (!0

!)(!0 + !) ⇡ 2!0 (!0

!)

! ⇡ !0

Usando queste approssimazioni nella (23.8), vediamo che ✓ !02 !2 + i ! ⇡ 2!0 !0 ! + i quindi

xˆ ⇡

Fˆ ✓

2m!0 !0

!+i

2



se

⌧ !0

2

◆ e ! ⇡ !0

(23.13)

È facile trovare la formula corrispondente per ⇢2 . Essa è ⇢2 ⇡

26 4m2 !02 66(!0 64

1 !)2 +

2 37

7 4 77 5

Lasciamo allo studente la dimostrazione di quanto segue: se prendiamo come unità la massima altezza della curva di ⇢2 in funzione di !, e consideriamo la larghezza ! della curva a metà dell’altezza massima, l’intera larghezza della curva a metà dell’altezza massima è ! = , supponendo che sia piccolo. La risonanza è via via più netta, man mano che si riducono gli effetti di attrito. Come altra misura di larghezza, alcuni usano una quantità Q che è definita come Q = !0 / . Più stretta è la risonanza, maggiore è Q: Q = 1000 significa una risonanza la cui larghezza è soltanto un millesimo della frequenza. Il Q della curva di risonanza mostrata in FIGURA 23.2 è 5.

23.3 • Risonanza elettrica

© 978-8808-22107-0

235

L’importanza del fenomeno della risonanza consiste nel fatto che esso avviene in parecchie altre circostanze, e così quanto rimane di questo capitolo descriverà alcune di queste altre circostanze.

23.3

Risonanza elettrica

Le più semplici ed estese applicazioni tecniche della risonanza sono nell’elettricità. Nel mondo dell’elettricità vi è un certo numero di oggetti che possono essere collegati per creare circuiti elettrici. Questi elementi passivi di circuito, come vengono spesso chiamati, sono di tre tipi fondamentali, benché ciascun tipo contenga anche qualcosa degli altri due. Prima di descriverli in maggior dettaglio, notiamo che l’intero concetto del nostro oscillatore meccanico come una massa all’estremità di una molla è soltanto un’approssimazione. Tutta la massa non è in realtà contenuta nella «massa»; parte della massa è nell’inerzia della molla. Similmente, tutta l’elasticità non è nella «molla»; la massa stessa ha una piccola elasticità e, benché possa sembrarlo, non è rigida in modo assoluto, e quando va su e giù, si flette sempre un po’ sotto l’azione della molla che la tira. La stessa cosa è vera in elettricità. Vi è un’approssimazione in cui possiamo concentrare le cose negli «elementi di circuito» che si considerano avere caratteristiche pure, ideali. Non è qui il momento opportuno di discutere tale approssimazione, supporremo semplicemente che sia accurata nelle circostanze descritte. I tre tipi fondamentali di elementi di circuito sono i seguenti. Il primo è detto condensatore (FIGURA 23.4); un esempio è costituito da due piastre piane metalliche tenute separate a una piccolissima distanza da un materiale isolante. Quando le piastre sono caricate vi è una certa differenza di tensione, cioè una certa differenza di potenziale fra di esse. La stessa differenza di potenziale appare fra i terminali A e B, perché se vi fosse una qualsiasi differenza di potenziale lungo i fili di collegamento l’elettricità fluirebbe immediatamente. Così vi è una certa differenza di tensione V fra le piastre se vi è una certa carica elettrica, rispettivamente +q e q, su di esse. Fra le piastre vi sarà un certo campo elettrico; abbiamo anche trovato una formula per esso (capitoli 13 e 14): d qd V= = (23.14) ✏0 ✏0 A dove d è la distanza e A l’area della piastra. Notiamo che la differenza di potenziale è una funzione lineare della carica. Se non abbiamo piastre parallele, ma elettrodi isolati che sono di qualsiasi altra forma, la differenza di potenziale è ancora esattamente proporzionale alla carica, ma la costante di proporzionalità può non essere altrettanto facile da calcolare. Tuttavia, tutto quello che abbiamo bisogno di sapere è che la differenza di potenziale ai capi di un condensatore è proporzionale alla carica: q V= C la costante di proporzionalità è 1/C, dove C è la capacità dell’oggetto. Il secondo tipo di elemento di circuito è chiamato resistore; esso oppone resistenza al fluire della corrente elettrica. Risulta che i fili metallici e parecchie altre sostanze resistono al fluire della corrente elettrica in questa maniera: se vi è una differenza di tensione da un capo all’altro di un pezzo di una certa sostanza, esiste una corrente elettrica I = dq/dt che è proporzionale alla differenza della tensione elettrica: dq V = RI = R (23.15) dt Il coefficiente di proporzionalità è chiamato resistenza R. Questa relazione può già esservi familiare: è la legge di Ohm. Se pensiamo alla carica q su un condensatore come all’analogo dello spostamento x di un sistema meccanico, vediamo che la corrente I = dq/dt è l’analogo della velocità, 1/C è analogo a una costante elastica k e R è l’analogo del coefficiente resistivo c = m dell’equazione (23.6). Ora è molto interessante il fatto che esista un altro elemento di circuito che è l’analogo della massa! Si tratta di una spirale che crea all’interno un campo magnetico quando è percorsa da corrente.

A q

++++++ q –––––– B Condensatore

C

D Resistore

E

F Induttore

23.4 I tre elementi passivi di un circuito. FIGURA

Capitolo 23 • Risonanza

236

© 978-8808-22107-0

Un campo magnetico variabile sviluppa nella spirale una tensione che è proporzionale a dI/dt (questo è il funzionamento di un trasformatore, infatti). Il campo magnetico è proporzionale a una corrente, e la tensione indotta (chiamata così) in una spirale di questo tipo è proporzionale alla rapidità di variazione della corrente: V=L

R

L

C

1

V

2

23.5 Circuito oscillatorio elettrico con resistenza, induttanza e capacità. FIGURA

dI d2 q =L 2 dt dt

(23.16)

dove L è il coefficiente di autoinduzione (o induttanza), ed è l’analogo della massa di un circuito oscillante meccanico. Supponiamo di costruire un circuito in cui abbiamo collegato in serie i tre elementi di circuito (FIGURA 23.5); allora la tensione ai capi dell’intero insieme da 1 a 2 è il lavoro prodotto nel trasportare una carica attraverso il circuito, ed è dato dalla somma di diversi contributi: da un capo all’altro dell’induttanza d2 q VL = L 2 dt tra i capi della resistenza dq VR = R dt tra i capi del condensatore q VC = C La somma di questi termini è uguale alla tensione applicata V : L

d2 q dq q +R + = V (t) dt C dt 2

(23.17)

Vediamo ora che questa equazione ha esattamente la stessa forma dell’equazione meccanica (23.6), e naturalmente può essere risolta esattamente nello stesso modo. Supponiamo che V (t) sia oscillatorio: stiamo facendo funzionare il circuito grazie a un generatore con un’oscillazione sinusoidale pura. Allora possiamo scrivere il nostro V (t) come un Vˆ complesso con il sottinteso che esso deve essere in ultima analisi moltiplicato per ei!t , e che deve essere presa la parte reale per trovare il valore vero di V . Allo stesso modo può essere così analizzata la carica q, e quindi esattamente alla stessa maniera dell’equazione (23.8) scriviamo l’equazione corrispondente: la derivata seconda di qˆ è (i!)2 q; ˆ la derivata prima è (i!)q. Dunque l’equazione (23.17) si trasforma in " # 1 2 L(i!) + R(i!) + qˆ = Vˆ C ossia Vˆ qˆ = 1 L(i!)2 + R(i!) + C che possiamo scrivere nella forma qˆ =

Vˆ L



!02

!2 + i !



(23.18)

in cui !02 = 1/LC e = R/L. È esattamente lo stesso denominatore che avevamo nel caso meccanico, con esattamente le stesse proprietà di risonanza! La corrispondenza fra i casi elettrico e meccanico è delineata nella TABELLA 23.1. Dobbiamo ricordare un piccolo particolare tecnico. Nella letteratura sull’elettricità è usata una diversa notazione. (Da un campo all’altro, l’argomento non è in realtà qualcosa di diverso, ma il modo di scrivere le notazioni è spesso p diverso.) In primo luogo invece di i, in elettrotecnica, è usato comunemente j, per indicare 1. (Dopotutto i deve essere la corrente!) Ancora, gli ingegneri preferirebbero una relazione fra Vˆ e Iˆ piuttosto che fra Vˆ e q, ˆ proprio perché essi sono

23.4 • La risonanza in natura

© 978-8808-22107-0

TABELLA

23.1

Corrispondenza fra proprietà meccaniche ed elettriche.

Caratteristica generale

Proprietà meccanica

Proprietà elettrica

Variabile indipendente

Tempo (t )

Tempo (t )

Variabile dipendente

Posizione (x )

Carica (q )

Inerzia

Massa (m )

Induttanza (L )

Resistenza

Coefficiente di resistenza (c = m)

Resistenza (R = L )

Rigidità

Rigidità (k )

(Capacità)–1 = (1/C )

Frequenza di risonanza

2 0

= k /m

Periodo

t0 = 2

Fattore di merito

Q=

!m/k 0/

2 0

= 1/L C

t0 = 2 Q=

!L/C 0 L /R

ˆ più abituati a quel modo. Così, poiché Iˆ = dq/dt ˆ = i! q, ˆ possiamo semplicemente sostituire I/i! a qˆ e ottenere ! 1 Vˆ = R + i!L + Iˆ = Zˆ Iˆ (23.19) i!C

Un altro modo consiste nel riscrivere l’equazione (23.17), per far sì che appaia più familiare; la si vede spesso scritta in questo modo: ⌅ dI 1 t L + RI + I dt = V (t) (23.20) dt C 0 In ogni caso, troviamo che la relazione (23.19) fra la tensione Vˆ e la corrente Iˆ è proprio la stessa della (23.18) tranne che è divisa per i!, e ciò produce l’equazione (23.19). La quantità R + i!L + 1/(i!C) è un numero complesso, ed è talmente usata in elettrotecnica che ha un nome: ˆ Così possiamo scrivere Vˆ = Zˆ I. ˆ La ragione per cui gli è chiamata impedenza complessa, Z. ingegneri preferiscono questa forma sta nel fatto che quando erano giovani hanno imparato che V = RI per le resistenze, al tempo in cui conoscevano soltanto resistenze e corrente continua. Ora essi sono diventati più istruiti e hanno circuiti in corrente alternata, così vogliono che l’equazione ˆ la sola differenza consiste nel fatto che la resistenza è sembri la stessa. Dunque scrivono Vˆ = Zˆ I; sostituita da una cosa più complicata, una quantità complessa. Così insistono di non poter usare quello che chiunque altro nel mondo usa per i numeri immaginari, essi devono usare per questo una j; è un miracolo che non insistano anche perché la lettera Z sia una R! (Essi poi si trovano nei guai quando parlano delle densità di corrente, per le quali usano anche j. Le difficoltà della scienza sono in gran parte legate alle difficoltà di notazione, alle unità e a tutte le altre cose artificiali che sono state inventate dall’uomo, non dalla natura.)

23.4

La risonanza in natura

Benché abbiamo discusso in dettaglio il caso elettrico, potremmo anche soffermarci caso dopo caso in parecchi campi, e mostrare esattamente come l’equazione della risonanza sia la stessa. Vi sono parecchie circostanze in natura nelle quali qualcosa è «oscillante» e nelle quali si verifica il fenomeno della risonanza. L’abbiamo affermato in un capitolo precedente; ora dimostriamolo. Se camminiamo per il nostro studio togliendo i libri dagli scaffali e sfogliandoli per trovare un esempio di una curva che corrisponda alla FIGURA 23.2 e che provenga dalla stessa equazione, che cosa troviamo? Proprio per dimostrare l’ampia sfera di azione ottenuta prendendo il più piccolo campione possibile, occorrono soltanto cinque o sei libri per produrre una gran serie di fenomeni che mostrano risonanze.

237

Capitolo 23 • Risonanza

238

23.6 Risposta dell’atmosfera a eccitazione esterna. La curva (a) è la risposta prevista se la marea atmosferica S2 è di origine gravitazionale: l’amplificazione sul picco è 100:1. La curva (b) deriva dall’ingrandimento osservato e dalla fase della marea M 2 . [Munk e MacDonald, «Rotation of the Earth», Cambridge University Press (1960).]

© 978-8808-22107-0

FIGURA

FIGURA

23.7

Trasmissione di radiazione infrarossa attraverso un sottile velo (0,17 �m) di cloruro di sodio. [R.B. Barnes, Z. Physik 75, 723 (1932). Kittel, Introduction to Solid State Physics, Wiley (1956).]

2 (a)

Cicli al giorno

(a)

10 (b) 5

100

3

Trasmissione (%)

1

80 60 40 20 0

0 12h42

12h00

10h20

40

45

50

55

60

65

70

Lunghezza d’onda ( m)

I primi due provengono dalla meccanica, il primo su vasta scala: l’atmosfera dell’intera Terra. Se l’atmosfera, che supponiamo circondi la Terra uniformemente da ogni parte, viene attirata da un lato dalla Luna, o piuttosto viene schiacciata e allungata in una doppia marea, se potessimo lasciarla andare, andrebbe agitandosi su e giù; si tratta di un oscillatore. Questo oscillatore è guidato dalla Luna, che sta effettivamente ruotando attorno alla Terra; qualsiasi componente della forza, diciamo in direzione x, ha una componente di tipo coseno, e così la risposta dell’atmosfera terrestre all’attrazione di marea della Luna è quella di un oscillatore. La risposta attesa dell’atmosfera è mostrata in FIGURA 23.6, curva (b) (la curva (a) è un’altra curva teorica in discussione nel libro dal cui contesto è tratta la figura). Ora si può pensare di avere soltanto un punto su questa curva di risonanza, poiché abbiamo soltanto una frequenza, quella corrispondente alla rotazione della Terra sotto la Luna, che si compie in un periodo di 12,42 ore: 12 ore per la Terra (la marea è una protuberanza doppia), più un qualcosa poiché la Luna sta ruotando. Ma dall’ampiezza delle maree atmosferiche e dalla fase, l’entità del ritardo, possiamo ottenere sia ⇢ sia ✓. Da questi possiamo ottenere !0 e , e così tracciare l’intera curva. Questo non è un felice esempio di scienza. Da due numeri otteniamo due numeri e da questi due numeri tracciamo una bella curva, che naturalmente passa proprio per il punto che l’ha determinata! La curva non è di alcuna utilità a meno che non possiamo misurare qualcos’altro, cosa che, spesso, nel caso della geofisica è molto difficile. Ma in questo particolare caso vi è un’altra cosa che possiamo dimostrare teoricamente e che deve avere lo stesso andamento della frequenza naturale !0 : cioè, se qualcuno disturbasse l’atmosfera, essa oscillerebbe con frequenza !0 . Ora vi fu un netto disturbo del genere nel 1883; il vulcano Krakatoa esplose, metà dell’isola sparì, e provocò un’esplosione così potente nell’atmosfera che il periodo di oscillazione dell’atmosfera poté essere misurato. Risultò di 10 ore e mezzo. L’!0 ottenuto dalla FIGURA 23.6 risulta di 10 ore e 20 minuti, così abbiamo almeno una verifica sulla realtà della nostra comprensione delle maree atmosferiche. Passiamo ora alle oscillazioni meccaniche su piccola scala. Questa volta prendiamo un cristallo di cloruro di sodio, che ha ioni sodio e ioni cloro, gli uni vicini agli altri, come descritto in uno dei primi capitoli. Questi ioni sono elettricamente carichi, positivi e negativi alternativamente. Ora vi è un’interessante oscillazione possibile. Supponiamo di poter indirizzare tutte le cariche positive a destra e tutte le cariche negative a sinistra, e poi di lasciarle; esse oscillerebbero allora avanti e indietro, il reticolo di sodio contrario al reticolo di cloro. Come possiamo realizzare una cosa del genere? È facile perché se applichiamo un campo elettrico al cristallo, esso spingerà le cariche positive in un verso e le cariche negative in quello opposto! Così, avendo un campo elettrico esterno possiamo forse far oscillare il cristallo. La frequenza del campo elettrico necessaria, però, è tanto alta che corrisponde alla radiazione infrarossa! Così cerchiamo di trovare una curva di risonanza, misurando l’assorbimento della luce infrarossa da parte del cloruro di sodio. Una curva del genere è mostrata in FIGURA 23.7. L’ascissa non è la frequenza, è espressa in lunghezze d’onda, ma questo è semplicemente un dettaglio tecnico, naturalmente, perché per un’onda vi è una relazione definita tra frequenza e lunghezza d’onda; così essa è in realtà una scala di frequenze, e una certa frequenza corrisponde alla frequenza di risonanza.

23.4 • La risonanza in natura

© 978-8808-22107-0

239

2,0

1,6

10

1,4 1,2 1,0

42 Oe

0,8

Quantità di raggi

Perdita totale di energia non magnetica nella cavità e nel campione

Perdita di energia magnetica nel campione

1,8

8 6 4

0,6

2

0,4 0,2

300

0 8100 8200 8300 8400 8500 8600 8700 8800

1 10 400

500

=0 600

Energia dei protoni (keV)

Campo magnetico statico in oersted (Oe)

23.8 Perdita di energia magnetica in un composto organico paramagnetico in funzione dell’intensità del campo magnetico applicato. [Holden e collaboratori, Phys. Rev. 75, 1614 (1949).] FIGURA

23.9 L’intensità della radiazione gamma emessa dal litio in funzione dell’energia dei protoni incidenti. La curva tratteggiata è una curva teorica calcolata per protoni con un momento della quantità di moto ` = 0. [Bonner e Evans, Phys. Rev. 73, 666 (1948).] FIGURA

Ma che cosa si può dire sulla larghezza della curva? Che cosa la determina? Vi sono parecchi casi in cui la larghezza che è vista sulla curva non è in realtà la larghezza naturale che si avrebbe teoricamente. Vi sono due ragioni del fatto che vi possa essere una curva più larga della curva teorica. Se gli oggetti non hanno tutti la stessa frequenza, come potrebbe accadere se il cristallo fosse deformato in certe regioni, cosicché in queste zone la frequenza di oscillazione risulterebbe leggermente diversa da altre zone, allora quello che otterremmo sarebbero molte curve di risonanza una sopra l’altra; così, in definitiva, si avrebbe una curva più larga. L’altro tipo di larghezza è semplicemente questo: forse non possiamo misurare la frequenza con sufficiente precisione – se apriamo la fenditura dello spettrometro facendola abbastanza larga, anche se pensiamo di avere una sola frequenza, in realtà abbiamo un certo intervallo !, quindi possiamo non avere il potere risolutivo necessario per vedere una curva stretta. Lì per lì non possiamo dire se la larghezza in FIGURA 23.7 è naturale, o se è dovuta alla non omogeneità nel cristallo o alla larghezza eccessiva della fenditura dello spettrometro. Volgiamoci ora a un esempio più elaborato, e cioè all’oscillazione di un magnete. Se abbiamo un magnete, con poli nord e sud, in un campo magnetico costante, l’estremo N del magnete sarà attirato da una parte e l’estremo S dall’altra, e vi sarà in generale un momento su di esso, cosicché oscillerà attorno alla sua posizione di equilibrio, come un ago di bussola. Però i magneti di cui stiamo parlando sono atomi. Questi atomi hanno un momento della quantità di moto; il momento non produce un semplice moto nella direzione del campo, ma invece, naturalmente, una precessione. Ora, osservata lateralmente, qualsiasi componente sta «oscillando», e possiamo disturbare o forzare tale oscillazione e misurare un assorbimento. La curva di FIGURA 23.8 rappresenta una tipica curva di risonanza di questo tipo. Dal punto di vista tecnico quanto è stato fatto qui è lievemente diverso. La frequenza del campo laterale che viene usato per forzare questa oscillazione viene sempre mantenuta costante, mentre ci saremmo aspettati che gli sperimentatori l’avessero variata e avessero tracciato il diagramma. Essi avrebbero potuto fare così, ma tecnicamente era più facile per loro lasciare fissa la frequenza ! e variare l’intensità del campo magnetico costante, che corrisponde a cambiare !0 nella nostra formula. Essi tracciarono il diagramma della curva di risonanza in funzione di !0 . In ogni modo questa è una risonanza tipica con un certo !0 e un certo .

240

23.10 Per gentile concessione del dottor R. Mössbauer.

Capitolo 23 • Risonanza

© 978-8808-22107-0

FIGURA

∆I I – 2 · 10– 5

0

–4

0

2 · 10– 5

+4

4 · 10– 5

+8

∆E (eV)

v (cm/s)

– 0,4%

– 0,8%

– 1,2%

Andiamo ancora oltre. Il nostro prossimo esempio si riferisce al nucleo atomico. I moti dei protoni e dei neutroni nel nucleo sono oscillatori, sotto certi punti di vista, e possiamo dimostrarlo col seguente esperimento. Bombardiamo un atomo di litio con protoni, e scopriamo che una certa reazione, che produce raggi , ha in realtà un massimo molto netto, tipico della risonanza. Nella FIGURA 23.9 notiamo però una differenza rispetto agli altri casi: la scala orizzontale non è una frequenza, è un’energia! La ragione è che nella meccanica quantistica quello che noi pensiamo secondo il concetto classico come energia risulterà essere in realtà legato a una frequenza di un’ampiezza d’onda. Quando analizziamo qualcosa che nella semplice fisica su larga scala ha a che vedere con una frequenza, troviamo che quando facciamo esperimenti di meccanica quantistica con materia atomica, otteniamo la curva corrispondente in funzione dell’energia. In effetti questa curva è, in un certo senso, una dimostrazione di questa relazione. Essa dimostra che tra frequenza ed energia esiste una profonda relazione, ciò che, naturalmente, è vero. Vediamo ora un altro esempio che implica anch’esso un livello di energia nucleare, ma un livello molto, molto più stretto. Nella FIGURA 23.10 !0 corrisponde a un’energia di 100 000 eV mentre la larghezza è approssimativamente 10 5 eV; in altre parole, questa curva ha un Q di 1010 ! Quando questa curva fu misurata rappresentava il più grande Q di qualsiasi oscillatore che fosse mai stato misurato. Fu misurata dal dottor Mössbauer, e gli valse il premio Nobel. La scala orizzontale qui è la velocità, poiché la tecnica per ottenere le frequenze lievemente diverse fu di usare l’effetto Doppler, muovendo la sorgente rispetto all’assorbitore. Si può vedere quanto sia delicato l’esperimento quando ci rendiamo conto che la velocità in gioco è di alcuni centimetri al secondo! Sulla scala reale della figura, la frequenza zero corrisponderebbe a un punto circa 1010 cm a sinistra, leggermente fuori dal foglio! Infine, se osserviamo un fascicolo del Physical Review, diciamo quello del 1° gennaio 1962, troveremo una curva di risonanza? Ogni fascicolo ha una curva di risonanza, e la FIGURA 23.11 è la curva di risonanza di questo. Tale curva risulta molto interessante. È la risonanza trovata in una certa reazione tra particelle strane, una reazione in cui un mesone K e un protone interagiscono. La risonanza si rivela osservando quanti di questi tipi di particelle escono dalla reazione, e in dipendenza da quali e quante ne escono, si ottengono curve diverse, ma della stessa forma e con il picco alla stessa energia. Determiniamo così che vi è una risonanza a una certa energia per il mesone K . Ciò presumibilmente significa che vi è un certo tipo di stato o condizione, corrispondente a questa risonanza, che può essere ottenuto mettendo insieme un mesone K e un protone. Questa è una nuova particella o risonanza. Oggi non sappiamo se chiamare un picco del genere una «particella» o semplicemente una risonanza. Quando vi è una risonanza molto netta, essa corrisponde a un’energia ben definita, proprio come se vi fosse una particella di tale energia presente in natura. Quando la risonanza

23.4 • La risonanza in natura

© 978-8808-22107-0

241 FIGURA

(mb)

(a) 3

K –+ p

+

+

+



2

1

0

(b)

(mb) 15

K –+ p

K 0+ n

10

5

0 200

300

400

500

PK (MeV/c)

diviene più larga, allora non sappiamo dire se vi è una particella che non vive molto a lungo, o semplicemente una risonanza nella probabilità della reazione. Nel secondo capitolo è stato trattato questo argomento sulle particelle, ma quando fu scritto il secondo capitolo questa risonanza era sconosciuta, così il nostro diagramma dovrebbe comprendere ancora un’altra particella!

23.11

Dipendenza dalla quantità di moto della sezione d’urto delle reazioni (a) e (b). Le curve inferiori rappresentano il presunto fondo non risonante, mentre quelle superiori contengono in aggiunta la risonanza sovrapposta. [Ferro-Luzzi e collaboratori, Phys. Rev. Lett. 8, 28 (1962).]

24

Transitori

24.1

L’energia di un oscillatore

Benché questo capitolo sia intitolato «Transitori», alcune sue parti appartengono, in un certo senso, all’ultimo capitolo sull’oscillazione forzata. Una delle caratteristiche di un’oscillazione forzata che non abbiamo ancora discusso è l’energia dell’oscillazione. Consideriamo ora tale energia. Quanta energia cinetica vi è in un oscillatore meccanico? Essa è proporzionale al quadrato della velocità. Veniamo ora a un punto importante. Consideriamo una quantità arbitraria A, che può essere ˆ i!t , un numero la velocità o qualcos’altro che vogliamo discutere. Quando scriviamo A = Ae complesso, l’esatto e corretto A, nel mondo fisico, è soltanto la parte reale; quindi, se per qualche ragione vogliamo usare il quadrato di A, non è giusto elevare al quadrato il numero complesso e poi prendere la parte reale, perché la parte reale del quadrato di un numero complesso non è proprio il quadrato della parte reale, ma coinvolge anche la parte immaginaria. Così, quando vogliamo trovare l’energia dobbiamo abbandonare per un momento la notazione complessa, per vedere quali sono i processi interni di funzionamento. ˆ il numero complesso, è scritto come Il corretto A fisico è la parte reale di A0 ei(!t+ ) , dove A, A0 ei , perciò A = A0 cos(!t + ). Il quadrato di questa quantità fisica reale è A2 = A20 cos2 (!t + ). Quindi il quadrato della quantità oscilla da un massimo a zero, come il quadrato del coseno. Il quadrato del coseno ha un massimo di 1 e un minimo di 0, e il suo valore medio è 1/2. In parecchie circostanze non siamo interessati all’energia in ogni momento specifico durante l’oscillazione; per un gran numero di applicazioni desideriamo semplicemente conoscere la media di A2 , la media del quadrato di A su un periodo di tempo grande rispetto al periodo di oscillazione. In queste circostanze, può essere usata la media del quadrato del coseno, così abbiamo il teorema seguente: se A è rappresentato da un numero complesso, allora la media di A2 è uguale a A20 /2. ˆ (Ciò può essere scritto in parecchi Ora A20 è il quadrato del modulo del numero complesso A. 2 ⇤ ˆ ˆ ˆ modi: alcuni amano scrivere | A| ; altri scrivono A A , cioè Aˆ moltiplicato per il suo complesso coniugato.) Useremo questo teorema diverse volte. Consideriamo ora l’energia in un oscillatore forzato. L’equazione per l’oscillatore forzato è d2 x dx + m + m!02 x = F(t) (24.1) 2 dt dt Nel nostro problema, naturalmente, F(t) è una funzione coseno di t. Analizziamo ora la situazione: quanto lavoro viene compiuto dalla forza esterna F? Il lavoro fatto dalla forza per secondo, cioè la potenza, è la forza per la velocità. (Sappiamo che il lavoro elementare in un tempo dt è F dx e la potenza è F dx/dt.) Quindi !2 26 3 dx d x d2 x dx 2 d x 77 6 P=F =m6 + !0 x + m (24.2) dt dt 77 dt 64 dt dt 2 5 Ma i primi due termini del secondo membro possono anche essere scritti come !2 2 3 d 66 1 dx 1 2 2 77 m + m! x 0 7 dt 66 2 dt 2 75 4 m

24.1 • L’energia di un oscillatore

© 978-8808-22107-0

come si verifica immediatamente, differenziando. Vale a dire il termine entro parentesi è una pura derivata di due termini che sono facili da comprendere: uno è l’energia cinetica di moto e l’altro è l’energia potenziale della molla. Chiamiamo questa quantità energia immagazzinata, cioè l’energia immagazzinata nell’oscillazione. Supponiamo di volere la potenza media su parecchi cicli quando l’oscillatore viene forzato ed è stato fatto funzionare per un lungo tempo. In un lungo periodo l’energia immagazzinata non cambia: la sua derivata dà zero come effetto medio. In altre parole, se mediamo la potenza su un lungo periodo, tutta l’energia finisce in definitiva nel termine resistivo m(dx/dt)2 . Vi è una certa energia contenuta nell’oscillazione, ma quella non cambia nel tempo, se mediamo su parecchi cicli. Quindi la potenza media hPi è !2 dx hPi = h m i (24.3) dt Usando il nostro metodo di scrivere i numeri complessi e il teorema per il quale hA2 i = A20 /2, possiamo trovare questa potenza media. Se x = xe ˆ i!t allora

dx = i! xe ˆ i!t dt Quindi, in queste circostanze, la potenza media potrebbe essere scritta come 1 m!2 x 20 (24.4) 2 Nella notazione per circuiti elettrici dx/dt è sostituito dalla corrente I (I è dq/dt, dove q corrisponde a x) e m corrisponde alla resistenza R. Così la rapidità della perdita di energia – la potenza consumata dalla funzione forzante – è la resistenza nel circuito per la media del quadrato della corrente: 1 hPi = R hI 2 i = R I02 (24.5) 2 Questa energia, naturalmente, va nel riscaldamento della resistenza; talvolta è chiamata perdita per riscaldamento o effetto Joule. Un’altra interessante caratteristica da discutere è quanta energia viene immagazzinata. Questa non è la stessa della potenza, perché, benché la potenza sia stata consumata all’inizio per immagazzinare una certa energia, dopo questo il sistema continua ad assorbire potenza, fino a che esistono perdite per riscaldamento (resistive). A ogni istante vi è una certa quantità di energia immagazzinata, così vorremmo calcolare anche l’energia media immagazzinata hEi. Abbiamo già calcolato qual è la media di (dx/dt)2 , così troviamo !2 ⌘1 1 dx 1 1 ⇣ hEi = m h i + m!02 hx 2 i = m !2 + !02 x2 (24.6) 2 dt 2 2 2 0 hPi =

Ora, quando un oscillatore è molto efficiente, e se ! è vicino a !0 , cosicché | x| ˆ sia grande, l’energia immagazzinata è molto alta: possiamo ottenere molta energia immagazzinata da una forza relativamente piccola. La forza compie una grande quantità di lavoro per ottenere che parta l’oscillazione, ma per mantenerla stazionaria tutto quello che deve fare è vincere l’attrito. L’oscillatore può possedere una grande quantità di energia se l’attrito è molto piccolo, e anche se sta fortemente oscillando, non va perduta molta energia. L’efficienza di un oscillatore può essere misurata dalla quantità di energia immagazzinata, confrontata con il lavoro fatto dalla forza a ogni oscillazione. Come si paragona l’energia immagazzinata con il lavoro fatto in un ciclo? Questo è chiamato il Q del sistema, e Q è definito come 2⇡ per l’energia media immagazzinata, diviso per il lavoro compiuto per ciclo. (Se dicessimo il lavoro fatto per radiante invece che per ciclo, allora 2⇡ scomparirebbe.) ⌘ 1 ⇣ 2 m ! + !02 hx 2 i !2 + !2 0 = (24.7) Q = 2⇡ 2 2⇡ 2 ! 2 2 m! hx i !

243

244

Capitolo 24 • Transitori

© 978-8808-22107-0

Q non è molto utile, a meno che non sia molto grande. Quando è relativamente grande dà la misura della bontà dell’oscillatore. Si è cercato di definire Q nel modo più semplice e più utile; le varie definizioni differiscono un po’ l’una dall’altra, ma se Q è molto grande, tutte le definizioni concordano. La definizione più generalmente accettata è l’equazione (24.7), che dipende da !. Per un buon oscillatore, vicino alla risonanza, possiamo semplificare un poco la (24.7) prendendo ! = !0 , e abbiamo allora Q = !0 / , che è la definizione di Q che abbiamo usato prima. Cos’è Q per un circuito elettrico? Per trovarlo dobbiamo semplicemente sostituire L a m, R a m e 1/C a m!02 (TABELLA 23.1). Il Q alla risonanza è L!/R, dove ! è la frequenza di risonanza. Se consideriamo un circuito con un Q elevato, ciò significa che la quantità di energia immagazzinata nell’oscillazione è molto grande a confronto con la quantità di lavoro fatto per ciclo dal meccanismo che forza le oscillazioni.

24.2

Oscillazioni smorzate

Riferiamoci ora al nostro principale tema di discussione: i transitori. Con transitorio s’intende una soluzione dell’equazione differenziale quando non è presente nessuna forza, ma il sistema non è semplicemente a riposo. (Naturalmente, se esso è immobile all’origine e senza forze che agiscano, è un problema piacevole, esso rimane lì!) Supponiamo che l’oscillazione abbia inizio in altro modo: diciamo che è stata diretta da una forza per un po’, quindi togliamo la forza. Che cosa accade? Facciamoci anzitutto un’idea grossolana di quello che accadrà per un sistema con Q molto elevato. Per tutto il tempo in cui agisce la forza, l’energia immagazzinata rimane la stessa e vi è una certa quantità di lavoro fatto per mantenerla. Supponiamo ora di levare la forza, e che non venga più compiuto alcun lavoro; allora le perdite che consumano l’energia del rifornimento non possono consumare più a lungo tale energia: non vi è più l’agente esterno. Le perdite dovranno consumare, per così dire, l’energia che è immagazzinata. Supponiamo che Q/2⇡ = 1000. Allora il lavoro fatto per ciclo è un millesimo dell’energia immagazzinata. Non è ragionevole, dato che sta oscillando senza alcuna forza che lo guida, che in un ciclo il sistema perda un millesimo della sua energia E, che ordinariamente gli sarebbe stata fornita dall’esterno, e che esso continuerà a oscillare sempre perdendo 1/1000 della sua energia per ogni ciclo? Così, come ipotesi, per un sistema a Q relativamente alto, supporremo che la seguente equazione possa essere approssimativamente giusta (lo faremo in seguito con esattezza e risulterà essere giusta!): dE E = ! dt Q

(24.8)

È approssimata per il fatto che è esatta soltanto per Q grande. Per ciascun radiante il sistema perde una frazione 1/Q dell’energia immagazzinata E. Così in un dato intervallo di tempo dt, l’energia cambierà di una quantità ! dt/Q, dato che il numero di radianti associato al tempo dt è ! dt. Qual è la frequenza? Supponiamo che il sistema si muova tanto dolcemente, quasi senza forza, che se lo abbandoniamo oscillerà essenzialmente alla stessa frequenza anche da solo. Supporremo così che ! sia la frequenza di risonanza !0 . Deduciamo allora dall’equazione (24.8) che l’energia immagazzinata varierà come E = E0 e !0 t/Q = E0 e t (24.9) Questa sarebbe la misura dell’energia a qualsiasi istante. Quale sarebbe approssimativamente la formula dell’ampiezza dell’oscillazione in funzione del tempo? La stessa? No! La quantità di energia in una molla, diciamo, va come il quadrato dello spostamento; l’energia cinetica va come il quadrato della velocità; così l’energia totale va come il quadrato dello spostamento. Così lo spostamento, l’ampiezza dell’oscillazione, decrescerà con metà rapidità a causa del quadrato. In altre parole, prevediamo che la soluzione per il moto transitorio smorzato sarà un’oscillazione con frequenza vicina alla frequenza di risonanza !0 , in cui l’ampiezza del moto ondulatorio sinusoidale diminuirà come e t/2 : x = A0 e

t/2

cos (!0 t)

(24.10)

24.2 • Oscillazioni smorzate

© 978-8808-22107-0

Questa equazione e la FIGURA 24.1 ci danno un’idea di x ciò che dovremmo aspettarci; ora cerchiamo di analizzare il moto esattamente, risolvendo l’equazione e – t/2 differenziale del moto stesso. Così, partendo dall’equazione (24.1) senza forze e – t/2 cos esterne, come la risolviamo? Essendo fisici non dobbiamo preoccuparci tanto del metodo quanto di quale 0 sia la soluzione. Armati della nostra precedente esperienza cerchiamo come soluzione una curva esponenziale, x = Aei↵t . (Perché proviamo questo? È la cosa più facile da differenziare!) Mettiamo questa nella (24.1) (con F(t) = 0), usando la regola che ogni volta che differenziamo x rispetto al tempo moltiplichia- FIGURA 24.1 Oscillazione smorzata cosinusoidale. mo per i↵. Così, in realtà, la sostituzione è del tutto semplice. In questo modo la nostra equazione ha il seguente aspetto: ⇣ ⌘ ↵ 2 + i ↵ + !02 Aei↵t = 0 (24.11)

Il risultato netto deve essere zero per tutti i tempi, il che è impossibile a meno che (a) A = 0, che non è affatto una soluzione – l’oscillatore sta fermo –, oppure (b) ↵ 2 + i↵ + !02 = 0

(24.12)

Se possiamo risolvere questa equazione e trovare un ↵, allora avremo una soluzione in cui non è necessario che A sia zero! r ↵=i

2

2

!02

±

(24.13)

4

2 /4 sia Per il momento supporremo che sia abbastanza piccolo rispetto a !0 , cosicché !02 chiaramente positivo e non vi sia alcun problema nel fare la radice quadrata. L’unica cosa seccante è che otteniamo due soluzioni! Esse sono: r

↵1 = i

2

2

!02

+

=i

4

r

2

+!

(24.14)

2

!02

=i ! (24.15) 2 4 2 Consideriamo la prima, supponendo di non aver notato che la radice quadrata ha due valori possibili. Sappiamo allora che una soluzione per x è ↵2 = i

x 1 = Aei↵1 t dove A è una costante qualsiasi. Ora, nel sostituire ↵1 , poiché comparirà parecchie volte ed è lungo da scrivere, chiameremo r !02

2

4

=!

2

+ i!

Quindi

i↵1 = e otteniamo

x 1 = Ae[

( /2) + i!

]t

o, ciò che è lo stesso, a causa delle magnifiche proprietà dell’esponenziale, x 1 = Ae

( /2) t i! t

e

(24.16)

In primo luogo, riconosciamo questa come un’oscillazione, un’oscillazione a frequenza ! che non è esattamente la frequenza !0 , ma è piuttosto vicina a !0 se si tratta di un buon sistema.

245

0t

t

246

Capitolo 24 • Transitori

© 978-8808-22107-0

In secondo luogo, l’ampiezza dell’oscillazione va decrescendo esponenzialmente! Se prendiamo, per esempio, la parte reale della (24.16), otteniamo x 1 = Ae

( /2) t

cos ! t

(24.17)

Questa è molto più simile alla soluzione da noi prevista (24.10) tranne che la frequenza in realtà è ! . Questo è l’unico errore, quindi si tratta della stessa cosa: l’idea è giusta. Ma non va tutto benissimo! Non va benissimo il fatto che vi sia un’altra soluzione. L’altra soluzione è ↵2 , e vediamo che la differenza consiste soltanto nell’inversione del segno di ! : x 2 = Be ( /2) t e i! t (24.18) Che cosa significa questo? Dimostreremo presto che se x 1 e x 2 sono entrambi una possibile soluzione dell’equazione (24.1) con F = 0, allora x 1 + x 2 è ancora una soluzione della stessa equazione! Così la soluzione generale x ha la forma matematica ⇣ ⌘ x = e ( /2) t Aei! t + Be i! t (24.19)

Possiamo ora chiederci perché ci preoccupiamo di dare quest’altra soluzione, dato che eravamo così soddisfatti della prima. A che scopo la soluzione in più, poiché naturalmente sappiamo di dover prendere soltanto la parte reale? Noi sappiamo di dover prendere la parte reale, ma come faceva la matematica a sapere che volevamo solo la parte reale? Quando avevamo una forza motrice F(t) diversa da zero, introducemmo una forza artificiale per procedere con essa, e la parte immaginaria dell’equazione, per così dire, era guidata in modo definito. Ma quando poniamo F(t) ⌘ 0, la nostra convenzione che x dovrebbe essere soltanto la parte reale di qualsiasi cosa scriviamo è soltanto nostra e le equazioni matematiche non lo sanno ancora. Il mondo fisico ha una soluzione reale, ma la risposta di cui eravamo soddisfatti prima non è reale, è complessa. L’equazione non sa che noi prenderemo arbitrariamente la parte reale, quindi deve regalarci, per così dire, un tipo di soluzione complessa coniugata, in modo che, mettendole insieme, possiamo ottenere una soluzione veramente reale; questo è quello che fa per noi la ↵2 . Perché x sia reale, Be i! t dovrà essere il complesso coniugato di Aei! t , in modo che la parte immaginaria scompaia. Così risulta che B è il complesso coniugato di A e la nostra soluzione reale è ⇣ ⌘ x = e ( /2) t Aei! t + A⇤ e i! t (24.20)

Pertanto la nostra soluzione reale è un’oscillazione con uno sfasamento e uno smorzamento, proprio come si era detto.

24.3

Transitori elettrici

Vediamo se quanto sopra è stato descritto funziona realmente. Costruiamo il circuito elettrico mostrato nella FIGURA 24.2, in cui applichiamo a un oscilloscopio la tensione ai capi dell’induttanza L, dopo aver dato improvvisamente tensione chiudendo l’interruttore S. Questo è un circuito oscillante e genera un transitorio di qualche tipo. Corrisponde alla circostanza in cui applichiamo improvvisamente una forza C e il sistema comincia a oscillare. È l’analogo elettrico di un oscillatore meccanico smorzato, e osserviamo l’oscillazione su un oscilloscopio, dove V dovremmo vedere le curve che stavamo cercando di analizzare. r L (Il moto orizzontale dell’oscilloscopio è mantenuto a velocità uniforme, S R mentre il moto verticale è la tensione ai capi dell’induttanza. Il resto del circuito è soltanto un dettaglio tecnico. Ci piacerebbe ripetere l’esperimento parecchie volte, poiché la persistenza dell’immagine non è abbastanza buona per vedere soltanto una traccia sullo schermo. Così ripetiamo via via l’eFIGURA 24.2 Circuito elettrico per la dimostrazione sperimento, chiudendo l’interruttore 60 volte in un secondo; ogni volta che dei transitori.

24.3 • Transitori elettrici

© 978-8808-22107-0

247

24.3 Transitori del circuito di FIGURA 24.2 rilevati dall’oscilloscopio. Le oscillazioni smorzate corrispondono a valori di Q progressivamente decrescenti. FIGURA

(a)

(b)

(c)

(d)

chiudiamo l’interruttore, facciamo anche partire lo spazzolamento orizzontale dell’oscilloscopio, e ciò disegna le curve più e più volte.) Nelle FIGURE dalla 24.3a alla 24.3d vediamo esempi di oscillazioni smorzate, fotografate effettivamente su uno schermo di oscilloscopio. La FIGURA 24.3a mostra un’oscillazione smorzata in un circuito che ha un alto Q e un piccolo . Essa non si estingue molto in fretta, oscilla parecchie volte mentre si va estinguendo. Ma vediamo che cosa accade quando diminuiamo Q in modo che l’oscillazione cessi più rapidamente. Possiamo diminuire Q aumentando la resistenza R nel circuito. Quando aumentiamo la resistenza nel circuito, si smorza più in fretta (FIGURA 24.3b). Se aumentiamo la resistenza nel circuito ancora di più, si smorza ancora più in fretta (FIGURA 24.3c). Ma quando la portiamo oltre un certo valore, non vediamo più alcuna oscillazione! Questo succede perché i nostri occhi non sono abbastanza buoni? Se aumentiamo la resistenza ancora di più, otteniamo una curva simile a quella della FIGURA 24.3d, che non sembra avere alcuna oscillazione, forse tranne una. Come possiamo spiegare tutto ciò con la matematica? La resistenza è, naturalmente, proporzionale al termine del congegno meccanico. Specificamente è R/L. Ora, se aumentiamo nelle soluzioni (24.14) e (24.15), delle quali eravamo prima così soddisfatti, nasce il caos quando /2 supera !0 ; dobbiamo quindi scriverle in modo diverso, ovvero r 2

↵1 = i

2

+i

4

r

!02

2

!02 2 4 Sono queste ora le due soluzioni, e, seguendo la stessa linea di ragionamento matematico di prima, troviamo ancora due soluzioni ei↵1 t ed ei↵2 t . Se ora sostituiamo il valore di ↵1 , otteniamo ↵2 = i

x = Ae

i

"

/2 +

q

2 /4

# !02 t

un bel decadimento esponenziale senza oscillazioni. Similmente l’altra soluzione è x = Be

"

/2

q

2 /4

# !02 t

Notate che la radice quadrata può superare /2, perché anche se !0 = 0, un termine è appunto uguale all’altro. Ma !02 è sottratto da 2 /4, così la radice quadrata è minore di /2, e il termine entro parentesi è quindi sempre un numero positivo. Grazie al cielo! Perché? Perché se fosse

248

Capitolo 24 • Transitori

© 978-8808-22107-0

negativo troveremmo e elevato a un fattore positivo per t, il che significherebbe che l’apparato sta esplodendo! Introducendo una resistenza sempre maggiore nel circuito, sappiamo che non esploderà: tutto il contrario. Così ora abbiamo due soluzioni, ciascuna delle quali ha da sola un decadimento esponenziale, ma una con una «rapidità di decadimento» maggiore dell’altra. La soluzione generale è naturalmente una combinazione delle due; i coefficienti nella combinazione dipendono da come inizia il moto, cioè da quali sono le condizioni iniziali del problema. Nel modo particolare col quale partiamo con questo circuito, A è negativo e B è positivo, così otteniamo la differenza di due curve esponenziali. Discutiamo ora come possiamo trovare i due coefficienti A e B (o A e A⇤ ), se sappiamo come il moto ha avuto inizio. Supponiamo che a t = 0 si abbia x = x 0 e dx/dt = v0 . Se poniamo t = 0, x = x 0 e dx/dt = v0 nelle espressioni ⇣ ⌘ x = e ( /2) t Aei! t + A⇤ e i! t dx =e dt

( /2) t

"✓

2



+ i!

troviamo, tenendo conto che e0 = ei0 = 1,

Ae

i! t

+



2

i!





Ae

i! t

#

x 0 = A + A⇤ = 2Ar v0 =

2 ⇤ dove A = Ar + i Ai e A = Ar

A + A⇤ + i!

A⇤ =

A

2

x 0 + i! 2i Ai

i Ai . Così troviamo

Ar =

x0 2

v0 +

e

2 2!

Ai =

x0

(24.21)

Questo determina completamente A e A⇤ , e quindi la curva completa della soluzione del transitorio, in funzione di come comincia. Incidentalmente, possiamo scrivere la soluzione in un altro modo se notiamo che ei✓ + e i✓ = 2 cos ✓ ei✓

e

i✓

= 2i sen ✓

Possiamo dunque scrivere la soluzione completa come

x=e dove

( /2) t

26 37 v0 + x 0 66 7 2 66 x 0 cos ! t + sen ! t 777 ! 66 77 4 5 r

! = + !02

(24.22)

2

4 Questa è l’espressione matematica del modo in cui un’oscillazione si smorza. Non faremo uso diretto di essa, ma vi sono un certo numero di punti che vorremmo sottolineare, che sono veri in casi più generali. Prima di tutto il comportamento di un sistema del genere senza forze esterne è espresso da una somma, o sovrapposizione, di puri esponenziali nel tempo (che abbiamo scritto come ei↵t ). Questa è una buona soluzione da tentare in tali circostanze. I valori di ↵ possono essere in generale complessi; la parte immaginaria rappresenta lo smorzamento. Infine, l’intimo rapporto matematico fra la funzione sinusoidale ed esponenziale discusso nel capitolo 22, spesso appare fisicamente come un passaggio dal comportamento oscillatorio al comportamento esponenziale quando qualche parametro fisico (in questo caso la resistenza, ) supera un certo valore critico.

25

Sistemi lineari

25.1

Equazioni differenziali lineari

In questo capitolo discuteremo certi aspetti dei sistemi oscillanti che hanno un carattere un po’ più generale e non riguardano soltanto i sistemi particolari che abbiamo discusso. Per il nostro sistema particolare, l’equazione differenziale che abbiamo appena risolto è m

d2 x dx + m + m!02 x = F(t) 2 dt dt

(25.1)

Ora questa particolare combinazione di «operazioni» sulla variabile x ha l’interessante proprietà che, se sostituiamo x + y a x, allora otteniamo la somma delle stesse operazioni fatte su x e y; oppure, se moltiplichiamo x per a, otteniamo a volte la stessa combinazione. Questo è facile da provare. Proprio come in una notazione «stenografica», dato che ci siamo stancati di scrivere tutte quelle lettere che compaiono nella (25.1), useremo invece il simbolo L(x). Quando vediamo questo termine, significa il primo membro della (25.1) con x sostituito. Con questo modo di scrivere, L(x + y), significherebbe quanto segue: L(x + y) = m

d2 (x + y) d(x + y) + m + m!02 (x + y) dt dt 2

(25.2)

(Scriviamo L con una sottolineatura per ricordarci che non si tratta di una funzione ordinaria.) Talvolta chiameremo questa una notazione operatoriale, ma non fa differenza come la chiamiamo, è semplicemente «stenografica». La nostra prima affermazione è stata L(x + y) = L(x) + L(y)

(25.3)

che naturalmente segue dal fatto che a(x + y) = ax + ay d(x + y) d x d y = + dt dt dt ecc. La nostra seconda affermazione è stata, per a costante, L(ax) = aL(x)

(25.4)

(In realtà, la (25.3) e la (25.4) sono strettamente legate, perché se poniamo x + x nella (25.3) è come mettere a = 2 nella (25.4), e così via.) In problemi più complessi vi possono essere più derivate, e più termini in L; la questione che interessa è se le due equazioni (25.3) e (25.4) vengono conservate o meno. Se lo sono, chiameremo

250

Capitolo 25 • Sistemi lineari

© 978-8808-22107-0

un tale problema, problema lineare. In questo capitolo discuteremo alcune proprietà che esistono per il fatto che il sistema è lineare, per apprezzare la generalità di alcuni risultati che abbiamo ottenuto nella nostra particolare analisi di un’equazione specifica. Studiamo ora alcune proprietà delle equazioni differenziali lineari, avendole già illustrate con l’equazione specifica (25.1) che abbiamo studiato in dettaglio. La prima proprietà interessante è questa: supponiamo di dover risolvere l’equazione differenziale per un transitorio, l’oscillazione libera senza forza motrice. Cioè vogliamo risolvere L(x) = 0

(25.5)

Supponiamo che, con qualche artificio, abbiamo trovato una soluzione particolare, che chiameremo x 1 . Cioè, abbiamo una x 1 per la quale L(x 1 ) = 0. Ora notiamo che anche ax 1 è una soluzione alla stessa equazione; quindi possiamo moltiplicare questa soluzione particolare per una costante qualsiasi e ottenere una nuova soluzione: se

L(x 1 ) = 0 allora

L(ax 1 ) = aL(x 1 ) = a · 0 = 0

In altre parole, se avessimo un moto di una certa «grandezza», allora un moto «grande» il doppio sarebbe ancora una soluzione. Supponiamo poi che, ancora con qualche artificio, abbiamo non solo trovato una soluzione x 1 , ma anche un’altra soluzione, x 2 . (Ricordate che quando abbiamo sostituito x = ei↵t per trovare i transitori, abbiamo trovato due valori per ↵, cioè due soluzioni, x 1 e x 2 .) Dimostriamo ora che anche la combinazione x 1 + x 2 è una soluzione. In altre parole, se poniamo x = x 1 + x 2 , x è ancora una soluzione dell’equazione: se

L(x 1 ) = 0 e

L(x 2 ) = 0 allora

L(x 1 + x 2 ) = L(x 1 ) + L(x 2 ) = 0 + 0 = 0

Quindi, se abbiamo trovato un certo numero di soluzioni per il moto di un sistema lineare, possiamo sommarle l’un l’altra. Combinando questi due concetti, vediamo, naturalmente, che possiamo anche sommare sei parti di una e due dell’altra: se x 1 è una soluzione, lo è pure ↵x 1 . Quindi qualsiasi somma di queste due soluzioni, come ↵x 1 + x 2 , è ancora una soluzione. Se accade che siamo in grado di trovare tre soluzioni, allora scopriamo che qualsiasi combinazione delle tre soluzioni è ancora una soluzione, e così via. Risulta che il numero di quelle che chiamiamo soluzioni indipendenti (1) , ottenute per il nostro problema dell’oscillatore, è soltanto due. Il numero di soluzioni indipendenti che si trovano nel caso generale dipende da quello che è chiamato il numero di gradi di libertà. Ora non discuteremo questo nei particolari, ma se abbiamo un’equazione differenziale di secondo ordine, vi sono soltanto due soluzioni indipendenti, e le abbiamo trovate entrambe; abbiamo così la soluzione più generale. Occupiamoci ora di un’altra proposizione che si riferisce alla situazione in cui il sistema è soggetto a una forza esterna. Supponiamo che l’equazione sia L(x) = F(t)

(25.6)

e supponiamo di aver trovato una sua soluzione particolare. Diciamo che la soluzione di Joe è x J e che L(x J ) = F(t). Supponiamo di voler trovare ancora un’altra soluzione; supponiamo di sommare alla soluzione di Joe una di quelle che era una soluzione dell’equazione libera (25.5), diciamo x 1 . Allora vediamo dalla (25.3) che L(x J + x 1 ) = L(x J ) + L(x 1 ) = F(t) + 0 = F(t)

(25.7)

Quindi alla soluzione «forzata» possiamo sommare qualsiasi altra soluzione «libera», e avremo ancora una soluzione. La soluzione libera è chiamata soluzione transitoria. Quando non abbiamo alcuna forza agente e improvvisamente ne introduciamo una, non otteniamo immediatamente la soluzione stazionaria che abbiamo ricavato con la soluzione sinusoidale, ma per un po’ vi è un transitorio che prima o poi sparisce, se aspettiamo abbastanza (1)

Le soluzioni che non possono essere espresse come combinazioni lineari l’una dell’altra sono dette indipendenti.

25.2 • Sovrapposizione di soluzioni

© 978-8808-22107-0

251

a lungo. La soluzione «forzata» non si smorza, poiché si mantiene essendo spinta dalla forza. In ultima analisi, per lunghi periodi di tempo la soluzione è unica, ma inizialmente i moti sono diversi per le diverse circostanze, in dipendenza da come il sistema è stato messo in moto.

25.2

Sovrapposizione di soluzioni

Veniamo ora a un altro interessante problema. Supponiamo di avere una certa particolare forza motrice Fa (diciamo una forza oscillatoria con un certo ! = ! a , ma le nostre conclusioni saranno corrette per qualsiasi forma funzionale di Fa ) e di avere risolto il moto forzato (con o senza i transitori; non fa differenza). Supponiamo ora che agisca qualche altra forza, diciamo Fb , e risolviamo lo stesso problema, ma per questa forza diversa. Supponiamo poi che qualcuno dica: «Ho per voi un nuovo problema da risolvere: ho la forza Fa + Fb ». Possiamo farlo? Naturalmente sì, perché la soluzione è la somma delle due soluzioni x a e x b per le forze prese separatamente: una circostanza davvero molto notevole. Se usiamo la (25.3) vediamo che L(x a + x b ) = L(x a ) + L(x b ) = Fa (t) + Fb (t)

(25.8)

Questo è un esempio di quello che viene detto principio di sovrapposizione Fa + Fb per sistemi lineari, ed è molto importante. Esso significa quanto segue: se abbiamo una forza complessa, che può essere divisa opportunamente in una somma di parti distinte, ciascuna delle quali è in qualche modo Fa semplice, nel senso che, per ciascuna particolare parte in cui abbiamo diviso la forza, possiamo risolvere l’equazione, allora si ha la soluzione per Fb l’intera forza, perché possiamo semplicemente rimettere insieme le parti della soluzione, nello stesso modo in cui la forza totale è composta da parti distinte (FIGURA 25.1). Diamo un altro esempio del principio di sovrapposizione. Nel capitolo xa + xb 12 abbiamo detto che era una delle grandi proprietà delle leggi dell’elettricità il fatto che, se abbiamo una certa distribuzione di cariche qa e calcoliamo il campo elettrico E a creato da queste cariche in un certo punto P, e se, d’altra parte, abbiamo un altro gruppo di cariche qb e calcoliamo il campo Eb dovuto a queste nel punto P, allora, se entrambe le distribuzioni di carica sono presenti nello stesso tempo, il campo E in P è la somma xa di E a ed Eb . In altre parole, se conosciamo il campo dovuto a una certa carica, allora il campo dovuto a parecchie cariche è semplicemente la somxb ma vettoriale dei campi di queste cariche prese individualmente. Questo è esattamente analogo alla proposizione di cui sopra: se conosciamo il risultato di due forze prese una per volta, e se la forza considerata è la somma di FIGURA 25.1 Un esempio del principio di queste due forze, allora la risposta è la somma delle corrispondenti risposte sovrapposizione per sistemi lineari. individuali (FIGURA 25.2). La ragione per cui questo è vero in elettricità è che le grandi leggi dell’elettricità, le equazioni di Maxwell, che determinano il campo elettrico, risultano essere equazioni differenziali lineari, cioè hanno la proprietà (25.3). Quello che corrisponde alla forza è la carica generante il campo elettrico e l’equazione che determina il campo elettrico in funzione della carica è lineare. Come altro interessante esempio di questa proposizione domandiamoci in che modo è posP sibile «sintonizzarci» su una particolare stazione radio nello stesso tempo in cui tutte le stazioni radio stanno trasmettendo. La stazione radio trasmette, fondamentalmente, un campo elettrico Ea Eb qa oscillante di altissima frequenza che agisce sulla nostra antenna radio. È vero che l’ampiezza E qb dell’oscillazione del campo è variata, modulata per trasportare il segnale della voce, ma ciò è molto lento e non ce ne preoccuperemo. Quando uno sente «Questa stazione sta trasmettendo alla frequenza di 780 kilocicli», questo indica che 780 000 oscillazioni per secondo è la frequenza del FIGURA 25.2 Il principio campo elettrico della stazione trasmittente, e questo spinge su e giù gli elettroni a quella frequenza di sovrapposizione in nella nostra antenna. Ora nello stesso tempo possiamo avere un’altra stazione radio nella stessa elettrostatica.

252

Capitolo 25 • Sistemi lineari

© 978-8808-22107-0

città, che irradia a una diversa frequenza, diciamo 550 kilocicli al secondo; dunque gli elettroni nella nostra antenna vengono anche spinti a tale frequenza. Ora il problema è: come possiamo separare i segnali che giungono a questa unica radio a 780 kilocicli da quelli che giungono a 550 kilocicli? Certamente non sentiamo contemporaneamente entrambe le stazioni. Per il principio di sovrapposizione, la risposta del circuito elettrico della radio – la prima parte del quale è un circuito lineare – alle forze agenti dovute al campo elettrico Fa + Fb , è x a + x b . Sembra quindi che |x | xa non li sbroglieremo mai. Infatti proprio il principio di sovrapposizione sembra insistere sul fatto che non possiamo evitare di averli entrambi nel nostro sistema. Ma ricordate, per un circuito risonante, la curva di risposta, il valore di x per F unitario, in funzione della frequenza, appare come in FIGURA 25.3. Se fosse un circuito a Q molto elevato, la risposta xb mostrerebbe un massimo molto netto. Supponiamo ora che le due stazioni siano paragonabili quanto a potenza, cioè le due forze abbiano la stessa b c a intensità. La risposta che otteniamo è la somma di x a e x b . Ma nella FIGURA 25.3 x a è enorme mentre x b è piccolo. Così, malgrado il fatto FIGURA 25.3 Curva di risonanza fortemente che i due segnali siano uguali come intensità, quando passano attraverso il sintonizzata. ben definito circuito risonante della radio accordato su ! a , la frequenza di trasmissione di una stazione, allora la risposta a questa stazione è molto maggiore che all’altra. Quindi la risposta completa con entrambi i segnali agenti è costituita quasi interamente da ! a ; in questo modo abbiamo selezionato la stazione voluta. Ora che dire della sintonia? Come sintonizziamo la stazione? Variamo !0 cambiando la L o la C del circuito, poiché la frequenza del circuito ha a che fare con la combinazione di L e di C. In particolare, la maggior parte delle radio sono costruite in modo che si possa cambiare la capacità. Quando risintonizziamo la radio, possiamo mettere in un’altra posizione il dispositivo per cercare le stazioni, in modo che la frequenza naturale del circuito viene spostata, diciamo a !c . In tali circostanze non si sente né una stazione, né l’altra; c’è silenzio, purché non ci sia un’altra stazione alla frequenza !c . Se continuiamo a cambiare la capacità fino a che la curva di risonanza è a !b , allora naturalmente sentiamo l’altra stazione. Così funziona la sintonia in una radio; si tratta sempre del principio di sovrapposizione, combinato con una risposta risonante.(2) Per concludere questa discussione, descriviamo qualitativamente che cosa accade se proseguiamo nell’analisi di un problema lineare con una data forza, quando la forza è molto complessa. Tra i vari procedimenti possibili, vi sono due modi generali particolarmente utili di risolvere il problema. Uno è questo: supponete che possiamo risolvere il problema per particolari forze note, come sinusoidi di diversa frequenza. Sappiamo che è un gioco da bambini risolverlo per sinusoidi. Così abbiamo i cosiddetti casi «gioco da bambini». Ora il problema è se la nostra forza complicatissima può essere rappresentata come la somma di due o più forze del tipo «gioco da bambini». Nella FIGURA 25.1 avevamo già una curva abbastanza complessa e naturalmente possiamo renderla più complessa se vi mettiamo dentro altre sinusoidi. In effetti, è vero anche l’inverso: praticamente qualsiasi curva può essere ottenuta sommando un numero infinito di sinusoidi di lunghezza d’onda (o frequenza) diversa, per ciascuna delle quali conosciamo la soluzione. Dobbiamo semplicemente conoscere quanto di ciascuna sinusoide inserire per ottenere la F data, e allora la nostra soluzione x è la corrispondente somma delle sinusoidi F, ciascuna moltiplicata per il suo effettivo rapporto di x a F. Questo metodo di soluzione è detto metodo delle trasformate di Fourier o analisi di Fourier. Non faremo un’analisi di questo genere proprio ora, abbiamo voluto soltanto descrivere l’idea implicita nel metodo. Un altro modo in cui il nostro problema complesso può essere risolto è il seguente, assai interessante. Supponiamo che con un tremendo sforzo mentale fosse possibile risolvere il nostro problema per una forza particolare, vale a dire un impulso. La forza è rapidamente applicata e tolta; questo è tutto. In realtà abbiamo bisogno di trovare la soluzione soltanto per un impulso di (2) Nei moderni ricevitori supereterodina l’operazione reale è più complessa. Gli amplificatori sono tutti accordati su una frequenza fissa (detta frequenza IF) e un oscillatore di frequenza variabile sintonizzabile è combinato con il segnale di ingresso in un circuito non lineare per produrre una nuova frequenza (la differenza tra la frequenza del segnale e quella dell’oscillatore) uguale alla frequenza IF, che viene allora amplificata. Ciò sarà discusso nel capitolo 50.

25.3 • Oscillazioni nei sistemi lineari

© 978-8808-22107-0

un certo valore unitario, dato che qualsiasi altro valore può essere ottenuto F moltiplicando per un fattore appropriato. Sappiamo che la risposta x a un impulso è un’oscillazione smorzata. Ora che cosa possiamo dire su qualche altra forza, per esempio una forza simile a quella della FIGURA 25.4? Una simile forza può essere paragonata a una successione di colpi di martello. Prima non vi è forza, e improvvisamente vi è una forza persistente – un impulso, un impulso, un impulso,... e poi basta. In altre parole, immaginiamo la forza continua come una serie di impulsi molto vicini. Ora conosciamo il risultato per un impulso, quindi il risultato per un’intera serie di impulsi sarà un’intera serie di oscillazioni smorzate: ci sarà la curva FIGURA 25.4 Una forza complessa può essere per il primo impulso, e poi (leggermente più tardi) quella per il secondo trattata come una successione di impulsi. impulso, poi quella per il terzo impulso e così via. In questo modo possiamo rappresentare, matematicamente, la soluzione completa per funzioni arbitrarie se conosciamo la soluzione per un impulso. Otteniamo la soluzione per qualsiasi altra forza semplicemente integrando. Questo metodo è detto metodo della funzione di Green. Una funzione di Green è una risposta a un impulso, e il metodo di analizzare qualsiasi forza mettendo insieme le risposte a impulsi è detto metodo della funzione di Green. I princìpi fisici coinvolti in entrambi questi schemi sono tanto semplici, implicando soltanto l’equazione lineare, che possono essere prontamente compresi, ma i problemi matematici che vi sono implicati, le complesse integrazioni e via di seguito sono un po’ troppo difficili per affrontarli ora. Molto probabilmente tornerete su questo argomento il giorno in cui avrete maggior pratica della matematica. Ma il concetto è in verità molto semplice. Infine, facciamo alcune osservazioni sul perché i sistemi lineari sono tanto importanti. La risposta è semplice: perché possiamo risolverli! Secondo (e importantissimo), perché le leggi fondamentali di fisica sono spesso lineari. Le equazioni di Maxwell per le leggi dell’elettricità sono lineari, per esempio. Le grandi leggi della meccanica quantistica risultano essere, per quanto ne sappiamo, equazioni lineari. Questo è il motivo per cui dedichiamo tanto tempo alle equazioni lineari: perché se comprendiamo le equazioni lineari, siamo pronti, in linea di principio, a capire moltissime cose. Ricordiamo un’altra situazione in cui si trovano equazioni lineari. Quando gli spostamenti sono piccoli, parecchie funzioni possono essere approssimate linearmente. Per esempio, se abbiamo un pendolo semplice, l’equazione corretta per il suo moto è d2 ✓ = dt 2

g sen ✓ L

(25.9)

Questa equazione può essere risolta mediante funzioni ellittiche, ma il modo più facile di risolverla è numericamente, come si è visto nel capitolo 9 dedicato alle leggi newtoniane del moto. Un’equazione non lineare non può essere risolta, di solito, che numericamente. Ora, per un piccolo ✓, sen ✓ è praticamente uguale a ✓, e abbiamo un’equazione lineare. Risulta che vi sono parecchie circostanze in cui piccoli effetti sono lineari: per l’esempio in questione, l’oscillazione di un pendolo lungo piccoli archi. Come altro esempio, se tiriamo un po’ una molla, la forza è proporzionale all’estensione. Se tiriamo più forte rompiamo la molla e la forza è una funzione completamente diversa della distanza! Le equazioni lineari sono importanti. In verità esse sono tanto importanti che forse per il cinquanta per cento del tempo sia in fisica sia in ingegneria siamo occupati a risolvere equazioni lineari.

25.3

Oscillazioni nei sistemi lineari

Riesaminiamo gli argomenti trattati negli ultimi capitoli. È molto facile che la fisica degli oscillatori sia oscurata dalla matematica. La fisica in realtà è molto semplice e, se possiamo dimenticare per un momento la matematica, vedremo che possiamo capire quasi tutto quello che accade in un sistema oscillante. Per prima cosa, se abbiamo soltanto una molla e un peso, è facile capire

253

t

254

Capitolo 25 • Sistemi lineari

© 978-8808-22107-0

perché il sistema oscilla: è una conseguenza dell’inerzia. Tiriamo la massa in basso e la forza la tira indietro verso l’alto; nel passare per lo zero, che è il punto in cui vorrebbe stare, non può arrestarsi immediatamente; a causa della sua quantità di moto continua a muoversi e passa dall’altra parte, e così va avanti e indietro. Se non vi fosse attrito ci aspetteremmo sicuramente un moto oscillatorio, e infatti lo abbiamo. Ma se vi è anche un po’ di attrito, allora nel ciclo di ritorno, l’oscillazione non sarà altrettanto ampia come la prima volta. Ora che accade, ciclo dopo ciclo? Ciò dipende dal tipo e dall’entità dell’attrito. Supponiamo di poter architettare un tipo di forza di attrito che rimanga sempre nella stessa proporzione rispetto alle altre forze, di inerzia ed elastica, al variare dell’ampiezza delle oscillazioni. In altre parole, per oscillazioni più piccole l’attrito dovrebbe essere più debole che per oscillazioni grandi. Comunemente l’attrito non ha questa proprietà, così deve essere accuratamente inventato un tipo particolare di attrito proprio allo scopo di creare un attrito che sia direttamente proporzionale alla velocità – cosicché per grandi oscillazioni è più forte e per piccole oscillazioni più debole. Se ci accade di avere un attrito di questo tipo, allora alla fine di ognuno dei cicli il sistema è nella stessa condizione in cui era alla partenza, a parte il fatto che è un po’ ridotto. Tutte le forze sono più piccole nella stessa proporzione: la forza della molla è ridotta, gli effetti di inerzia sono minori, perché le accelerazioni sono ora più deboli, e anche l’attrito è minore per il nostro accurato progetto. In realtà, quando abbiamo un tale genere di attrito, troviamo che ogni oscillazione è esattamente uguale alla prima, tranne che ridotta in ampiezza. Se il primo ciclo riduce l’ampiezza, diciamo, al 90% di quella che era alla partenza, il ciclo successivo l’abbasserà al 90% del 90%, e via di seguito: le ampiezze delle oscillazioni sono ridotte progressivamente della stessa frazione in ogni ciclo. Una funzione esponenziale è una curva che fa proprio questo. Essa cambia dello stesso fattore in ciascun intervallo di tempo identico. Vale a dire, se l’ampiezza di un ciclo è data da quella del ciclo precedente per un certo fattore a, allora l’ampiezza del successivo ha un fattore a2 , quella dopo ancora un fattore a3 , e così via. Quindi l’ampiezza A di una oscillazione è data dall’ampiezza iniziale A0 per un fattore costante elevato al numero dei cicli percorsi: A = A0 a n

(25.10)

Naturalmente n / t, pertanto la soluzione generale sarà un certo tipo di oscillazione, seno o coseno di !t, per un’ampiezza che va più o meno come bt . Ma b può essere scritto come e c , se b è positivo e minore di 1. Questo è il motivo per cui la soluzione appare come e ct cos(!0 t). Cosa accade se l’attrito non è artificiale, per esempio se si tratta del comune sfregamento su un tavolo, cosicché la forza di attrito è una certa quantità costante, indipendente dall’ampiezza dell’oscillazione, che inverte la sua direzione ogni mezzo ciclo? Allora l’equazione non è più lineare, diventa difficile da risolvere, e deve essere risolta con il metodo numerico descritto nel capitolo 9, oppure considerando ciascun mezzo ciclo separatamente. Il metodo numerico è il più potente di tutti, e può risolvere qualsiasi equazione. È soltanto quando abbiamo un problema semplice che possiamo usare l’analisi matematica. L’analisi matematica non è la grande cosa che si dice che sia; risolve soltanto le equazioni più semplici. Appena le equazioni diventano un po’ più complesse, non possono più essere risolte analiticamente. Ma il metodo x0 numerico che è stato illustrato all’inizio del corso può occuparsi di qualsiasi equazione di interesse fisico. Proseguendo, che dire della curva di risonanza? Perché vi è una risonanza? Primo, immaginiamo per un momento che non vi sia attrito e che abbiamo qualcosa che possa oscillare da solo. Se colpissimo il pendolo proprio ogni volta che passa, naturalmente potremmo farlo andare come un matto. Ma se chiudiamo gli occhi, e quindi non lo osserviamo, e lo colpiamo a intervalli di tempo arbitrari e uguali, che cosa accadrà? Talvolta ci troveremo a colpirlo quando sta andando nel verso contrario. Se applichia0 mo la giusta cadenza e ogni colpo è dato esattamente al momento giusto, il pendolo va più in alto, sempre più in alto. Così, senza attrito otteniamo una curva che appare simile alla curva continua di FIGURA 25.5 per diverse FIGURA 25.5 Curve di risonanza relative a diverse quantità di attrito. frequenze. Qualitativamente, la curva di risonanza si capisce; per ottenere

25.4 • Le analogie in fisica

© 978-8808-22107-0

l’esatta forma della curva vale probabilmente la pena descriverla matematicamente. La curva va verso l’infinito quando ! ! !0 , dove !0 è la frequenza naturale dell’oscillatore. Supponiamo ora che vi sia un po’ di attrito. Quando lo spostamento dell’oscillatore è piccolo, l’attrito non lo influenza molto; la curva di risonanza è la stessa tranne in prossimità della risonanza. Qui, invece di diventare infinita, la curva diviene soltanto così alta che il lavoro fatto dal nostro colpetto ogni volta è sufficiente a compensare la perdita d’energia per l’attrito durante il ciclo. Quindi, l’apice della curva è arrotondato: non va all’infinito. Se l’attrito cresce, il massimo della curva diventa ancora più arrotondato. Ora qualcuno può dire: «Pensavo che le ampiezze delle curve dipendessero dall’attrito». Questo è perché la curva è comunemente disegnata in modo che il suo massimo sia un’unità. Però, l’espressione matematica è anche più semplice da capire se disegniamo tutte le curve sulla stessa scala; allora tutto quello che accade è che l’attrito riduce il massimo! Se vi è meno attrito possiamo salire di più nel piccolo pinnacolo prima che l’attrito lo tagli, così esso appare relativamente stretto. Quindi, più alto è il picco della curva, più stretta è la larghezza a metà altezza. Infine, prendiamo il caso in cui vi sia un attrito enorme. Risulta che se vi è troppo attrito, il sistema non oscilla affatto. L’energia contenuta nella molla è appena in grado di muovere la massa contro la forza di attrito, e così essa lentamente scivola fino al punto di equilibrio.

25.4

Le analogie in fisica

Il prossimo aspetto di questa rassegna è notare che le masse e le molle non sono i soli sistemi lineari; ve ne sono altri. In particolare vi sono sistemi elettrici, detti circuiti lineari, nei quali troviamo un analogo completo dei sistemi meccanici. Non abbiamo imparato esattamente perché ciascuno degli oggetti in un circuito elettrico funziona nel modo in cui funziona – questo non deve essere capito ora; possiamo asserire come un fatto sperimentalmente verificabile che essi si comportano come dichiarato. Per esempio, prendiamo la circostanza più semplice possibile. Abbiamo un pezzo di filo, che è appunto una resistenza, e abbiamo applicato a esso una differenza di potenziale V . Ora V significa questo: se trasportiamo una carica q attraverso il filo da un terminale all’altro, il lavoro fatto è qV . Maggiore è la differenza di potenziale, più lavoro viene fatto quando la carica «cade», come si usa dire, dal terminale a più alto potenziale al terminale a potenziale più basso. Quindi la carica libera energia andando da un’estremità all’altra. Ora le cariche non corrono semplicemente in linea retta da un’estremità all’altra; gli atomi del filo offrono una certa resistenza alla corrente, e questa resistenza obbedisce alla seguente legge, per quasi tutte le sostanze comuni: se vi è una corrente I, cioè un certo numero di cariche per secondo che cadono in basso, il numero di cariche per secondo che cade attraverso il filo è proporzionale alla forza con cui vengono spinte, cioè alla differenza di potenziale applicata: dq V = IR = R (25.11) dt Il coefficiente R è detto resistenza, e l’equazione è chiamata legge di Ohm. L’unità di resistenza è detta ohm (⌦), che è uguale a un volt per ampere (1 = 1 V/1 A). Nelle situazioni meccaniche, ottenere una simile forza di attrito proporzionale alla velocità è difficile; in un sistema elettrico è molto facile, e questa legge è estremamente accurata per la maggior parte dei metalli. Spesso siamo interessati al lavoro compiuto in un secondo, alla perdita di energia, o all’energia liberata dalle cariche quando esse cadono attraverso il filo. Quando trasportiamo una carica q attraverso una tensione V , il lavoro è qV , quindi il lavoro fatto per secondo è V (dq/dt), ossia V I, o ancora I R · I = I 2 R. Questa è chiamata perdita per calore: questo è il calore generato nella resistenza in un secondo, per la conservazione dell’energia. È questo calore che fa funzionare una comune lampada a incandescenza. Naturalmente vi sono altre interessanti proprietà dei sistemi meccanici, come la massa (inerzia), e risulta che vi è un analogo elettrico anche per l’inerzia. È possibile costruire un qualcosa, detto induttore, avente una proprietà chiamata induttanza, tale che una corrente, una volta partita attraverso l’induttanza, non si vuole fermare. Occorre una differenza di potenziale per cambiare

255

256

Capitolo 25 • Sistemi lineari

© 978-8808-22107-0

la corrente! Se la corrente è costante non vi è tensione ai capi di un’induttanza. I circuiti in corrente continua non sanno niente dell’induttanza; è soltanto quando cambiamo la corrente che si mostrano gli effetti dell’induttanza. L’equazione è V=L

dI d2 q =L 2 dt dt

(25.12)

e l’unità di induttanza, detta henry (H), è tale che 1 volt applicato a un’induttanza di 1 henry produce una variazione di 1 ampere per secondo nella corrente. L’equazione (25.12) è l’analogo della legge di Newton per l’elettricità, se vogliamo: V corrisponde a F, L corrisponde a m e I corrisponde alla velocità! Tutte le equazioni conseguenti per i due tipi di sistemi avranno le stesse derivazioni perché, in tutte le equazioni, possiamo cambiare qualsiasi lettera con la sua lettera analoga corrispondente e otteniamo la stessa equazione; ogni cosa che deduciamo avrà una corrispondenza nei due sistemi. Ora, quale grandezza elettrica corrisponde alla molla meccanica, in cui vi era una forza proporzionale alla tensione? Se partiamo con F = k x e sostituiamo F ! V e x ! q, otteniamo V = ↵q. Risulta che esiste una cosa del genere, infatti essa è la sola dei tre elementi di circuito che possiamo in realtà capire, dato che abbiamo studiato una coppia di piastre parallele e abbiamo trovato che se vi fosse su ciascuna piastra una carica di uguale valore, ma di segno opposto, il campo elettrico fra esse sarebbe proporzionale alla grandezza della carica. Così il lavoro fatto nello spostare una carica unitaria attraverso lo spazio da una piastra all’altra è esattamente proporzionale alla carica. Questo lavoro è la definizione della differenza di potenziale, ed è l’integrale di linea del campo elettrico da un’armatura all’altra. Si ha che, per ragioni storiche, la costante di proporzionalità non è chiamata C, ma 1/C. Avrebbe potuto essere chiamata C, ma non lo fu. Così abbiamo q V= (25.13) C L’unità di capacità C è il farad (F); una carica di 1 coulomb su ciascuna armatura di un condensatore da 1 farad produce una differenza di potenziale di 1 volt. Queste sono le nostre analogie, e l’equazione corrispondente al circuito oscillante diviene la seguente, per diretta sostituzione di L a m e q a x ecc: m

d2 x dx + m + kx = F 2 dt dt

(25.14)

d2 q dq q +R + =V (25.15) 2 dt C dt Ora tutto ciò che abbiamo imparato sulla (25.14) può essere trasformato per applicarlo alla (25.15). Ogni conseguenza è la stessa; la stessa a tal punto che vi è qualcosa di brillante che possiamo fare. Supponiamo di avere un sistema meccanico veramente complesso, non semplicemente una massa attaccata a una molla, ma parecchie masse attaccate a parecchie molle, legate insieme. Che cosa fare? Risolverlo? Forse; ma osservate, possiamo costruire un circuito elettrico, che avrà le stesse equazioni dell’oggetto che stiamo cercando di analizzare! Per esempio, se volessimo analizzare una massa attaccata a una molla, perché non possiamo costruire un circuito elettrico in cui usiamo un’induttanza proporzionale alla massa, un resistenza proporzionale al corrispondente m , 1/C proporzionale a k, tutti nello stesso rapporto? Allora, naturalmente, questo circuito elettrico sarà l’esatto analogo del nostro dispositivo meccanico, nel senso che, qualunque cosa faccia q in risposta a V (anche V è reso corrispondente alle forze agenti), così farebbe x in risposta alla forza! Così se abbiamo un sistema complesso con un gruppo di elementi interconnessi, possiamo collegare un gruppo di resistenze, induttanze e capacità per imitare il sistema meccanicamente complesso. Qual è il vantaggio di ciò? Un problema è esattamente altrettanto difficile (o facile) dell’altro, perché essi sono esattamente equivalenti. Il vantaggio non consiste nel fatto che è più semplice risolvere le equazioni matematiche dopo aver scoperto che abbiamo un circuito elettrico (benché questo sia il metodo usato dagli ingegneri elettrotecnici!), ma invece la ragione reale per prendere in considerazione l’analogo è che è più facile costruire il circuito elettrico e cambiare qualcosa nel sistema. L

25.5 • Impedenze in serie e in parallelo

© 978-8808-22107-0

257

Supponete di aver progettato un’automobile e di voler sapere quanto scuoterà nel percorrere un certo tipo di strada sassosa. Costruiamo un circuito elettrico con induttanze per rappresentare l’inerzia delle ruote, costanti di elasticità, come capacità, per rappresentare l’elasticità delle ruote e resistenze per rappresentare gli ammortizzatori e così via per le altre parti dell’automobile. Poi abbiamo bisogno di una strada sassosa. Benissimo, applichiamo una tensione da un generatore, che rappresenti un certo tipo di gibbosità, e poi osserviamo quanto oscilli la ruota sinistra misurando la carica su un certo condensatore. Avendo eseguito la misura (è facile da fare), troviamo che sta sobbalzando troppo. Abbiamo bisogno di più ammortizzatori o di meno ammortizzatori? Con una cosa complicata come un’automobile, dobbiamo realmente cambiare l’ammortizzatore e risolvere tutto di nuovo? No!, dobbiamo semplicemente girare una manopola; il numero dieci del quadrante corrisponde all’ammortizzatore numero tre, così introduciamo un ammortizzatore più robusto. Gli urti sono peggiori? Benissimo, cerchiamo di ridurre l’ammortizzatore. Gli urti sono ancora peggiori? Cambiamo la durezza della molla (giriamo al 17), e aggiustiamo tutte queste cose elettricamente, girando semplicemente una manopola. Questo è chiamato calcolatore analogico. È uno strumento che imita il problema che vogliamo risolvere creando un altro problema, che ha la stessa equazione, ma in un’altra circostanza della natura che è più facile da costruire, da misurare, da regolare, da demolire!

25.5

Impedenze in serie e in parallelo

Infine, vi è un importante dettaglio che non entra affatto nella natura di una rassegna. Si riferisce a un circuito elettrico in cui vi è più di un elemento circuitale. Per esempio, quando abbiamo un’induttanza, una resistenza e un condensatore connessi come in FIGURA 24.2, notiamo che tutta la carica passa attraverso ciascuno dei tre elementi, cosicché la corrente di un oggetto simile con le parti collegate a una a una, è la stessa in tutti i punti lungo il filo. Poiché la corrente è la stessa in ciascun elemento, il potenziale ai capi di R è I R, ai capi di L è L(dI/dt), e così via. Così la caduta totale di potenziale è la somma di queste cadute, e questo porta all’equazione (25.15). Usando i numeri complessi abbiamo trovato che potevamo risolvere l’equazione per il moto stazionario ˆ Ora Zˆ è detta in risposta a una forza sinusoidale. Abbiamo in questo modo trovato che Vˆ = Zˆ I. impedenza di questo particolare circuito. Essa ci dice che se applichiamo una tensione sinusoidale ˆ Vˆ , otteniamo una corrente I. Supponiamo ora di avere un circuito più complesso che abbia due parti, ciascuna delle quali ha rispettivamente impedenza Zˆ 1 e Zˆ 2 ; mettiamole in serie (FIGURA 25.6a) e applichiamo una tensione. Che cosa accade? Ora è un po’ più complicato, ma se Iˆ è la corrente attraverso Zˆ 1 , la differenza di potenziale ai capi di Zˆ 1 è Vˆ1 = IˆZˆ 1 ; similmente la tensione ai capi di Zˆ 2 è Vˆ2 = IˆZˆ 2 . La stessa corrente passa attraverso entrambi. Quindi la tensione totale è la somma delle tensioni ˆ Questo significa che la tensione ai capi delle due sezioni ed è uguale a Vˆ = Vˆ1 + Vˆ2 = ( Zˆ 1 + Zˆ 2 ) I. ˆ ˆ ˆ ai capi del circuito completo può essere scritta V = I Zs , dove la Zˆ s del sistema collegato in serie è la somma delle due Zˆ delle parti separate: 1

Zˆ s = Zˆ 1 + Zˆ 2

Z2

2

(a) Serie

(25.16)

Questo non è il solo modo in cui gli elementi possono essere collegati. Possiamo anche collegarli in un altro modo, detto collegamento in parallelo (FIGURA 25.6b). Ora vediamo che una data tensione ai capi dei terminali, se i fili di collegamento sono conduttori perfetti, è effettivamente applicata a entrambe le impedenze, e causerà correnti in ciascuna indipendentemente. Quindi la corrente attraverso Zˆ 1 è uguale a Iˆ1 = Vˆ / Zˆ 1 . La corrente in Zˆ 2 è Iˆ2 = Vˆ / Zˆ 2 . Si tratta della stessa tensione. Ora la corrente totale che viene fornita ai terminali è la somma delle correnti nelle due sezioni: Vˆ Vˆ Iˆ = + ˆ Z1 Zˆ 2

Z1

Z1 1

2 Z2 (b) Parallelo

25.6 Due impedenze collegate in serie e in parallelo. FIGURA

258

Capitolo 25 • Sistemi lineari

© 978-8808-22107-0

Questo può essere scritto come Vˆ = Quindi

Iˆ 1 1 + ˆ ˆ Z1 Z2

= IˆZˆ p

1 1 1 = + ˆ ˆ ˆ Zp Z1 Z2

(25.17)

Circuiti più complessi possono talvolta essere semplificati prendendo parti di essi, calcolando la successione delle impedenze delle parti e mettendo insieme il circuito, passo dopo passo, usando le regole sopra. Se abbiamo qualsiasi tipo di circuito con parecchie impedenze collegate in tutti i modi possibili, e se includiamo le tensioni nella forma di piccoli generatori senza impedenza (quando facciamo passare cariche attraverso esso, il generatore aggiunge una tensione V ), allora si applicano i seguenti princìpi: • in qualsiasi nodo, la somma delle correnti nel nodo è zero, cioè tutta la corrente che entra deve uscire; • se trasportiamo una carica lungo una qualsiasi maglia, fino a tornare al punto da cui era partita, il lavoro totale prodotto è zero. Queste regole sono chiamate leggi di Kirchhoff per i circuiti elettrici. La loro sistematica applicazione ai circuiti complessi spesso semplifica l’analisi di tali circuiti. Le ricordiamo qui insieme con le equazioni (25.16) e (25.17), nell’eventualità che vi siate già imbattuti in tali circuiti che dovete analizzare in laboratorio. Esse saranno discusse di nuovo con maggior dettaglio il prossimo anno.

Ottica: il principio del tempo minimo

26.1

La luce

Questo è il primo di diversi capitoli sull’argomento della radiazione elettromagnetica. La luce, con la quale vediamo, è soltanto una piccola parte di un vasto spettro dello stesso genere di cosa, essendo le varie parti di questo spettro distinte da diversi valori di una certa quantità che varia. Questa quantità variabile potrebbe essere chiamata «lunghezza d’onda». Al suo variare nello spettro visibile, la luce cambia all’apparenza il colore dal rosso al violetto. Se dovessimo esplorare sistematicamente lo spettro dalle lunghezze d’onda più lunghe verso le più corte, inizieremmo con quelle che sono comunemente chiamate onde radio. Le onde radio sono tecnicamente disponibili in un vasto intervallo di lunghezze d’onda, alcune anche più lunghe di quelle usate nelle trasmissioni regolari; le trasmissioni radio regolari hanno lunghezze d’onda corrispondenti a circa 500 m. Poi vi sono le cosiddette «onde corte», cioè onde radar, onde millimetriche e così via. Non vi sono reali linee di demarcazione fra un intervallo e l’altro di lunghezze d’onda, perché la natura non ci fece dono di margini netti. I numeri associati con un dato nome per le onde sono soltanto approssimativi e, naturalmente, altrettanto lo sono i nomi che diamo ai diversi intervalli. Poi, molto più giù, attraverso le onde millimetriche, arriviamo a quello che chiamiamo l’infrarosso e quindi allo spettro visibile. Andando poi nell’altro verso, entriamo in una regione detta ultravioletto. Dove termina l’ultravioletto, iniziano i raggi X, ma non possiamo definire con esattezza dove accada questo; il punto è approssimativamente a 10 8 m, ossia a 10 2 µm. Questi sono raggi X «molli»; vi sono poi i comuni raggi X e i raggi X molto duri; poi i raggi e via di seguito, per valori sempre più piccoli di questa dimensione chiamata lunghezza d’onda. Entro questo vasto intervallo di lunghezze d’onda, vi sono tre o più regioni di approssimazione che sono particolarmente interessanti. In una di queste esiste una condizione in cui le lunghezze d’onda in gioco sono molto piccole rispetto alle dimensioni del dispositivo utilizzabile per il loro studio; inoltre, le energie dei fotoni, usando la teoria quantistica, sono piccole rispetto alla sensibilità in energia del dispositivo. Sotto queste condizioni possiamo fare una prima grossolana approssimazione con un metodo chiamato ottica geometrica. Se, d’altra parte, le lunghezze d’onda sono paragonabili alle dimensioni del dispositivo, cosa che è difficile da predisporre con la luce visibile ma è più facile con le onde radio, e se le energie del fotone sono ancora trascurabilmente piccole, allora può essere fatta un’approssimazione molto utile studiando il comportamento delle onde, ancora trascurando la meccanica quantistica. Questo metodo è basato sulla teoria classica della radiazione elettromagnetica, che sarà discussa in un capitolo successivo. Poi, se andiamo a lunghezze d’onda molto piccole dove possiamo trascurare il carattere ondulatorio, ma dove i fotoni hanno un’energia molto grande rispetto alla sensibilità del nostro dispositivo, le cose ridiventano semplici. Questa è la semplice rappresentazione mediante fotoni che descriveremo soltanto approssimativamente. Il quadro completo che unifica l’intero argomento in un solo modello non ci sarà accessibile per molto tempo. In questo capitolo la nostra discussione è limitata alla regione dell’ottica geometrica nella quale dimentichiamo la lunghezza d’onda e il carattere corpuscolare della luce, che saranno spiegati a tempo debito. Non dobbiamo nemmeno preoccuparci di dire cos’è la luce, ma dedurre semplicemente il suo comportamento su una scala grande rispetto alle dimensioni di interesse. Tutto questo deve essere detto per sottolineare il fatto che quanto stiamo per esporre sull’argomento

26

260

Capitolo 26 • Ottica: il principio del tempo minimo

© 978-8808-22107-0

è soltanto un’approssimazione molto rozza; questo è uno dei capitoli che dovremo d’altra parte «disimparare». Ma lo disimpareremo subito, dato che passeremo quasi immediatamente a un metodo più accurato. Benché l’ottica geometrica sia appunto un’approssimazione, essa è di grande importanza tecnica e di grande interesse storico. Presenteremo questo argomento sottolineandone gli aspetti storici più che altro per dare qualche idea dello sviluppo di una teoria fisica o di un concetto fisico. In primo luogo, la luce è, naturalmente, familiare a chiunque, ed è stata familiare da tempo immemorabile. Ora, un problema è: in virtù di quale processo vediamo la luce? Vi sono state parecchie teorie ma finalmente ne fu stabilita una, secondo la quale vi è qualcosa che entra nell’ occhio – che rimbalza dagli oggetti nell’occhio. Abbiamo sentito tale idea per tanto tempo che l’accettiamo e ci è quasi impossibile renderci conto che uomini intelligentissimi abbiano proposto teorie contrarie – che qualcosa esca dall’occhio e percepisca l’oggetto, per esempio. Alcune altre importanti osservazioni sono che, nell’andare da un punto all’altro, la luce procede in linea retta, se non vi è niente sul percorso, e che i raggi non sembrano interferire l’uno con l’altro. Cioè la luce s’incrocia in tutte le direzioni nella stanza, ma la luce che interseca la nostra linea di visione non influisce sulla luce che ci arriva da un certo oggetto. Questo fu un tempo un potentissimo argomento contro la teoria corpuscolare della luce; esso fu usato da Huygens. Se la luce fosse come tante frecce lanciate lontano, come potrebbero altre frecce attraversarla tanto facilmente? Tali argomenti filosofici non sono di molto peso. Si potrebbe sempre dire che la luce è costituita da frecce che passano le une attraverso le altre!

26.2

26.1 L’angolo di incidenza è uguale all’angolo di riflessione. FIGURA

26.2 Un raggio di luce è rifratto quando passa da un mezzo a un altro. FIGURA

Riflessione e rifrazione

La precedente discussione ci ha detto abbastanza del concetto fondamentale dell’ottica geometrica: ora dobbiamo introdurci un po’ più nelle caratteristiche quantitative. Sin qui abbiamo la luce che va soltanto in linea retta fra due punti; studiamo ora il comportamento della luce quando colpisce vari materiali. L’oggetto più semplice è uno specchio, e la legge per uno specchio è che quando la luce colpisce lo specchio, essa non continua ad andare in linea retta ma rimbalza dallo specchio in una nuova linea retta, che varia quando cambiamo l’inclinazione dello specchio. Il problema per gli antichi era: qual è la relazione fra i due angoli coinvolti? È una relazione semplicissima, scoperta da lungo tempo. La luce che colpisce uno specchio si propaga in modo che i due angoli fra ciascun fascio e lo specchio siano uguali. Per qualche ragione è consuetudine misurare gli angoli dalla normale alla superficie dello specchio. Così la cosiddetta legge di riflessione (FIGURA 26.1) è ✓i = ✓r (26.1) Questo è un problema abbastanza semplice, ma un problema più difficile si incontra quando la luce passa da un mezzo a un altro, per esempio dall’aria all’acqua; anche qui vediamo che non si propaga in linea retta. Nell’acqua il raggio ha un’inclinazione rispetto al suo percorso nell’aria (FIGURA 26.2); se cambiamo l’angolo ✓ i cosicché scenda più vicino alla verticale, allora l’angolo di «deviazione» non è altrettanto grande. Ma se incliniamo il fascio di luce a un angolo piuttosto grande, allora l’angolo di deviazione è molto grande. Il problema è: qual è la relazione di un angolo con un altro? Anche questo imbarazzò per lungo tempo gli antichi, e su questo punto essi non trovarono mai la risposta! È però uno dei pochi punti di tutta la fisica greca su cui si possa trovare qualche risultato sperimentale elencato. Claudio Tolomeo fece una lista dell’angolo nell’acqua per ciascuno di un certo numero di diversi angoli nell’aria. La TABELLA 26.1 mostra gli angoli nell’aria, in gradi, e l’angolo corrispondente misurato nell’acqua. (Comunemente viene detto che gli scienziati greci non fecero mai alcun esperimento. Ma sarebbe impossibile ottenere questa tavola di valori senza la conoscenza della legge corretta, tranne che per mezzo dell’esperimento. Dovrebbe essere notato, però, che questi non rappresentano misure accurate e indipendenti per ciascun angolo, ma soltanto alcuni numeri interpolati da poche misure, perché tutti si adattano perfettamente a una parabola.)

26.3 • Il principio di Fermat del tempo minimo

© 978-8808-22107-0

Questo dunque è uno dei passi importanti nello sviluppo della legge fisica: primo, osserviamo un effetto, poi lo misuriamo e lo annotiamo in una tabella; quindi cerchiamo di trovare la regola per cui una cosa può essere collegata all’altra. Questa tavola numerica fu compilata nel 140 d.C., ma non fu che nel 1621 che qualcuno trovò finalmente la regola che metteva in relazione i due angoli! La regola, trovata da Willebrord Snell, un matematico olandese, è la seguente: se ✓ i è l’angolo nell’aria e ✓ r è l’angolo nell’acqua, allora risulta che il seno di ✓ i è uguale a una certa costante moltiplicata per il seno di ✓ r :

261

26.1 Angoli di incidenza e riflessione nel passaggio aria-acqua. TABELLA

Angolo in aria

Angolo in acqua

10°



20°

15-1/2°

(26.2)

30°

22-1/2°

40°

29°

Per l’acqua il numero n è approssimativamente 1,33. L’equazione (26.2) è detta legge di Snell; essa ci permette di predire come si piegherà la luce nel passare dall’aria all’acqua. La TABELLA 26.2 mostra gli angoli in aria e in acqua secondo la legge di Snell. Notate il notevole accordo con la lista di Tolomeo.

50°

35°

60°

40-1/2°

70°

45-1/2°

80°

50°

sen ✓ i = n sen ✓ r

26.3

Il principio di Fermat del tempo minimo

Ora, nell’ulteriore sviluppo della scienza, vogliamo più che una semplice formula. In primo luogo abbiamo un’osservazione, poi abbiamo numeri che misuriamo, quindi abbiamo una legge che compendia tutti i numeri. Ma la vera gloria della scienza è che possiamo trovare un modo di pensare tale che la legge risulti evidente. Il primo ragionamento che rese evidente la legge sul comportamento della luce fu scoperto da Fermat nel 1650 circa, ed è chiamato il principio del tempo minimo, o principio di Fermat. La sua idea è questa: di tutti i possibili cammini che la luce può seguire per andare da un punto a un altro, essa segue il cammino che richiede il tempo più breve. Dimostriamo per prima cosa che questo è vero per il caso dello specchio, che questo semplice principio contiene sia la legge della propagazione in linea retta, sia la legge dello specchio. Così, stiamo crescendo nella nostra comprensione! Cerchiamo di trovare la soluzione al seguente problema. Nella FIGURA 26.3 sono mostrati due punti, A e B, e uno specchio piano M M 0. Qual è il modo per andare da A a B nel tempo più breve? La risposta è andare direttamente da A a B! Ma se aggiungiamo la regola in più che la luce deve colpire lo specchio e ritornare, nel tempo più breve, la risposta non è tanto facile. Un modo potrebbe essere di andare il più rapidamente possibile allo specchio e quindi andare a B, lungo il cammino ADB. Naturalmente abbiamo allora il lungo tratto DB. Se ci spostiamo un po’ a destra fino a E, aumentiamo leggermente la prima distanza, ma diminuiamo grandemente la seconda, e così la lunghezza totale, e quindi il tempo impiegato nel percorso, è minore. Come possiamo trovare il punto C per il quale il tempo è minimo? Possiamo trovarlo molto elegantemente con un espediente geometrico. Costruiamo dall’altra parte di M M 0 un punto artificiale B 0 che è alla stessa distanza sotto il piano M M 0 di quella a cui si trova il punto B sopra il piano. Poi tracciamo la linea E B 0. Ora, poiché BF M è un angolo retto e BF = F B 0, E B è uguale a E B 0. Quindi la somma delle due distanze AE + E B, che è proporzionale al tempo impiegato dalla luce per percorrerle a velocità costante, è anche la somma totale delle due lunghezze AE + E B 0. Quindi il problema diventa, quand’è che la somma delle due lunghezze è minima? La risposta è facile: quando la linea passa attraverso il punto C come linea retta da A a B 0! In altre parole dobbiamo trovare il punto in cui arriviamo muovendoci verso il punto artificiale, e questo sarà quello giusto. Ora se ACB 0 è una linea retta, allora l’angolo BCF è uguale all’angolo B 0CF e di conseguenza all’angolo AC M. Così l’affermazione che l’angolo di incidenza è uguale all’angolo di riflessione è equivalente all’affermazione che la luce va allo specchio in modo tale da giungere al punto B nel minor tempo possibile. Originariamente l’affermazione che la luce viaggia in modo tale da andare allo specchio e all’altro punto lungo la distanza più breve possibile fu fatta da Erone di Alessandria, non si tratta dunque di una teoria moderna. Fu questo che ispirò Fermat a suggerire a se stesso che forse la rifrazione operava su una base simile. Ma per la rifrazione, la luce, ovviamente, non segue il percorso di minima distanza, così Fermat sperimentò l’idea che la luce impieghi il minimo tempo.

26.2 Legge di Snell: angoli in aria e in acqua. TABELLA

Angolo in aria

Angolo in acqua

10°

7-1/2°

20°

15°

30°

22°

40°

29°

50°

35°

60°

40-1/2°

70°

45°

80°

48°

Capitolo 26 • Ottica: il principio del tempo minimo

262

26.3 Illustrazione del principio del tempo minimo.

© 978-8808-22107-0

FIGURA

N

A

B A

26.4 Illustrazione del principio di Fermat nella rifrazione. FIGURA

M'

M D

E

C

F

B'

t

X C

x

26.5 Il tempo minimo corrisponde al punto C, ma i punti vicini corrispondono a circa lo stesso tempo. FIGURA

E

Aria Vetro

C X

x F

N'

B

Prima di passare ad analizzare la rifrazione, dovremmo fare un’ulteriore osservazione riguardo allo specchio. Se abbiamo una sorgente di luce nel punto B ed essa invia luce verso lo specchio, allora vediamo che la luce che va in A dal punto B giunge ad A esattamente nello stesso modo di come sarebbe giunta in A se vi fosse un oggetto in B 0 e non vi fosse lo specchio. Ora l’occhio, naturalmente, percepisce soltanto la luce che lo penetra fisicamente, così se abbiamo un oggetto in B e uno specchio che fa giungere la luce nell’occhio esattamente allo stesso modo di come sarebbe arrivata se l’oggetto fosse in B 0, allora il sistema occhio-cervello interpreta ciò, supponendo di non sapere troppo, come l’esistenza di un oggetto in B 0. Dunque l’illusione che vi sia un oggetto dietro allo specchio è semplicemente dovuta al fatto che la luce che sta entrando nell’occhio, vi sta entrando esattamente nella stessa maniera in cui sarebbe entrata se vi fosse stato un oggetto là dietro (tranne che per lo sporco sullo specchio, o per la nostra conoscenza dell’esistenza dello specchio, o altro, che è corretto nel cervello). Dimostriamo ora che il principio del tempo minimo darà la legge della rifrazione di Snell. Dobbiamo però fare una supposizione sulla velocità della luce nell’acqua. Supporremo che la velocità della luce nell’acqua sia minore della velocità della luce nell’aria di un certo fattore n. Nella FIGURA 26.4, il nostro problema è ancora quello di andare da A a B nel minor tempo. Per illustrare che la cosa migliore da fare non è andare semplicemente in linea retta, immaginiamo che una bella ragazza sia caduta da una barca, e che stia gridando aiuto nell’acqua nel punto B. La linea indicata con x è la linea costiera. Noi siamo sulla terra ferma nel punto A, vediamo l’incidente, possiamo correre e nuotare. Ma possiamo correre più veloci di quanto possiamo nuotare. Che facciamo? Andiamo in linea retta? (Sì, senza dubbio!) Però, usando un po’ più di intelligenza ci renderemmo conto che sarebbe vantaggioso percorrere una distanza un po’ più grande sulla terra per diminuire la distanza nell’acqua, poiché nell’acqua andiamo molto più lenti. (Seguendo questa linea di ragionamento diremmo che la giusta cosa da fare è di calcolare molto accuratamente quello che dovrebbe esser fatto!) In ogni modo cerchiamo di dimostrare che la soluzione finale del problema è il percorso ACB, e che questo percorso richiede il minor tempo di tutti i percorsi possibili. Se esso è il percorso più breve, ciò significa che se prendiamo qualsiasi altro percorso, questo sarà più lungo. Così se volessimo fare il diagramma del tempo impiegato in funzione della posizione del punto X, otterremmo una curva in qualche modo simile a quella della FIGURA 26.5, dove il punto C corrisponde al più breve di tutti i tempi possibili. Questo significa che, se muoviamo il punto X nei punti vicini a C, in prima approssimazione, non vi è essenzialmente variazione del tempo perché la pendenza è zero al minimo della curva. Così il nostro modo di trovare la legge sarà di considerare che cambiamo la posizione di un tratto piccolissimo e di richiedere che non vi sia essenzialmente nessuna variazione nel tempo. (Naturalmente vi è una variazione infinitesima di secondo ordine; dovremmo avere un incremento positivo per spostamenti in entrambe le direzioni da C.) Consideriamo dunque un punto assai vicino a X, calcoliamo quanto si impiegherebbe per andare da A a B lungo i due percorsi, e confrontiamo il nuovo percorso con il vecchio. È molto facile da fare. Vogliamo che la differenza sia naturalmente quasi zero se la distanza XC è piccola. Per prima cosa osserviamo il cammino sulla terra ferma. Se tracciamo una perpendicolare X E, vediamo che questo cammino viene accorciato di una quantità EC. Diciamo che guadagniamo, non avendo da percorrere questa

26.4 • Applicazioni del principio di Fermat

© 978-8808-22107-0

263

distanza in più. D’altra parte nell’acqua, tracciando una corrispondente perpendicolare, CF, troviamo che dobbiamo percorrere una distanza in più X F, e questo è ciò che perdiamo. Ossia, in tempo, guadagniamo il tempo che avrebbe richiesto il percorrere la distanza EC, ma perdiamo il tempo che sarebbe stato richiesto per percorrere la distanza X F. Tali tempi devono essere uguali poiché, in prima approssimazione, non vi è variazione nel tempo. Ma supponendo che nell’acqua la velocità sia 1/n di quella nell’aria, allora dobbiamo avere (26.3)

EC = n X F Vediamo quindi che quando abbiamo il punto giusto XC sen E XC = n XC sen XCF ossia, eliminando la lunghezza dell’ipotenusa comune XC e notando che E XC = EC N = ✓ i

e

XCF ⇡ BC N 0 = ✓ r

(quando X è vicino a C)

abbiamo sen ✓ i = n sen ✓ r

(26.4)

Così vediamo che, per andare da un punto a un altro nel tempo minimo, quando il rapporto delle velocità è n, la luce dovrebbe incidere a un angolo tale che il rapporto fra i seni degli angoli ✓ i e ✓ r sia il rapporto delle velocità nei due mezzi.

26.4

Applicazioni del principio di Fermat

Consideriamo ora alcune delle conseguenze interessanti del principio del tempo minimo. La prima è il principio di reciprocità. Se per andare da A a B abbiamo trovato il percorso del tempo più breve, allora per andare nel verso opposto (supponendo che la luce vada alla stessa velocità in qualsiasi direzione), il tempo minimo sarà impiegato sullo stesso percorso, e quindi, se la luce può essere inviata su un percorso, può essere inviata anche sullo stesso percorso nel verso opposto. Un esempio interessante è un blocco di vetro a facce piane parallele, posto a un certo angolo rispetto a un fascio di luce. La luce, andando attraverso il blocco dal punto A al punto B (FIGURA 26.6) non va in linea retta, ma diminuisce invece il tempo impiegato per attraversare il blocco rendendo l’angolo nel blocco meno inclinato, benché perda un pochino nell’aria. Il fascio è semplicemente spostato parallelamente a se stesso poiché gli angoli d’ingresso e d’uscita sono gli stessi. Un terzo interessante fenomeno è il fatto che quando vediamo il Sole che tramonta, esso è già sotto l’orizzonte! Esso non appare come se fosse sotto l’orizzonte, ma lo è (FIGURA 26.7). L’atmosfera della Terra è rarefatta in alto e densa negli strati bassi. La luce viaggia più lentamente nell’aria di come faccia nel vuoto e così la luce del Sole può raggiungere più rapidamente il punto S oltre l’orizzonte se, invece di andare semplicemente in linea retta, evita le regioni dense dove viaggia più lentamente, attraversandole con un’inclinazione maggiore. Quando il Sole sembra scendere sotto l’orizzonte, è in realtà già ben al di sotto di esso. Un altro esempio di questo

26.6 Un fascio di luce è spostato lateralmente quando passa attraverso un blocco trasparente. FIGURA

Sole apparente Atmosfera A

B'

Cammino della luce

26.7 Vicino all’orizzonte il Sole apparente è più alto del Sole reale di circa 1/2 grado. FIGURA

B

Terra

Sole reale

264

Capitolo 26 • Ottica: il principio del tempo minimo

© 978-8808-22107-0

fenomeno è il miraggio che spesso si vede viaggiando su strade infuocate. Uno vede «acqua» sulla strada, ma quando arriva là, è secco come il deserto! Il fenomeno è il seguente. Quello che in realtà stiamo vedendo è la luce Strada o sabbia calda del cielo «riflessa» sulla strada: la luce proveniente dal cielo, dirigendosi verso la strada, può finire nel nostro occhio, come mostrato in FIGURA 26.8. Perché? L’aria è molto calda proprio sopra la strada ma è più fredda in FIGURA 26.8 Un miraggio. alto. L’aria più calda è più espansa dell’aria più fredda ed è più rarefatta, e questo riduce meno la velocità della luce. Vale a dire che la luce va più veloce nella regione calda che nella regione fredda. Quindi la luce, anziché decidere di arrivare in modo rettilineo, ha anche una traiettoria a tempo minimo, con la quale entra per un po’ nella regione lungo la quale va più veloce, per guadagnar tempo. Così essa può seguire una curva. Come altro importante esempio del principio del tempo minimo, supponiamo di voler predisporre una situazione in cui abbiamo tutta la luce proveniente da un punto P raccolta insieme verso un altro punto P 0 (FIGURA 26.9). Questo significa, naturalmente, che la luce può andare in linea retta da P a P 0. Questo è vero. Ma come possiamo predisporre le cose in modo che la luce non vada soltanto in linea retta, ma che anche la luce uscente da P verso Q finisca in P 0? Vogliamo rinviare tutta la luce a quello che chiamiamo un fuoco. Come? Se la luce segue sempre il percorso del tempo minimo, allora certamente non seguirebbe tutti questi altri percorsi. Il solo modo perché la luce possa essere perfettamente soddisfatta di seguire diverse traiettorie adiacenti è di rendere i loro tempi perfettamente uguali! Altrimenti sceglierebbe quella di tempo minimo. Quindi il problema di fare un sistema focheggiante è semplicemente quello di predisporre un dispositivo in modo che alla luce occorra lo stesso tempo per andare lungo tutti i diversi percorsi! Questo è facile da fare. Supponete che abbiamo un pezzo di vetro in cui la luce va più lentamente di quanto faccia nell’aria (FIGURA 26.10). Consideriamo ora un raggio che va in aria lungo il cammino PQP 0. Questo è un cammino più lungo che da P direttamente a P 0 e indubbiamente richiede un tempo più lungo. Ma se inserissimo un pezzo di vetro proprio dell’esatto spessore (calcoleremo in seguito lo spessore) esso può compensare esattamente l’eccesso di tempo che impiegherebbe la luce per andare secondo il percorso inclinato! In tali circostanze possiamo fare in modo che il tempo che la luce impiega per attraversarlo direttamente sia uguale al tempo che impiega per andare lungo il percorso PQP 0. Similmente se prendiamo un raggio PRR 0 P 0 che sia parzialmente inclinato, esso non è altrettanto lungo quanto PQP 0, e noi non abbiamo bisogno di altrettanta compensazione come per il percorso diretto, ma una certa compensazione è necessaria. Finiamo con un pezzo di vetro quale quello della FIGURA 26.10. Con questa forma tutta la luce proveniente da P andrà in P 0. Questo, naturalmente, ci è ben noto, e chiamiamo lente convergente una struttura del genere. Nel prossimo capitolo calcoleremo realmente quale forma deve avere la lente convergente per fare un fuoco perfetto. Prendete un altro esempio: supponiamo di voler sistemare alcuni specchi in modo che la luce da P vada sempre in P 0 (FIGURA 26.11). Su qualsiasi percorso essa va a un certo specchio e torna indietro, e tutti i tempi devono essere uguali. Qui la luce viaggia sempre nell’aria, così tempo e distanza sono proporzionali. Quindi l’affermazione che tutti i tempi sono gli stessi è uguale all’affermazione che la distanza totale è la stessa. Così la somma delle due distanze r 1 e r 2 deve essere una costante. Un’ellisse è quella curva che ha la proprietà che la somma delle distanze da due punti è una costante per qualsiasi punto dell’ellisse; così possiamo essere sicuri che la luce da un fuoco andrà nell’altro. Luce dal cielo

Q' Q P FIGURA 26.9 Una «scatola chiusa» ottica.

26.10 Sistema ottico focheggiante. FIGURA

P

Sistema ottico

P'

P' R

R'

26.4 • Applicazioni del principio di Fermat

© 978-8808-22107-0

Lo stesso principio vale per raccogliere la luce di una stella. Il grande telescopio di Palomar da 200 pollici è costruito sul seguente principio. Immaginiamo una stella lontar1 na miliardi di miglia; desidereremmo far sì che tutta la luce che ne proviene giungesse a P un fuoco. Naturalmente non possiamo tracciare i raggi che vanno completamente fino alla stella, ma nondimeno vogliamo controllare se i tempi sono uguali. Beninteso, sappiamo che quando i vari raggi sono arrivati a un certo piano K K 0 perpendicolare ai ragFIGURA 26.11 gi, tutti i tempi in questo piano sono uguali (FIGURA 26.12). I raggi devono allora giun- ellissoidale. gere allo specchio e procedere verso P 0 in tempi uguali. Cioè dobbiamo trovare una curva che abbia la proprietà che la somma delle distanze X X 0 + X 0 P 0 sia una costante, indipendentemente da dove sia preso X. Un modo facile di trovarla è di estendere la lunghezza della linea X X 0 fino al piano LL 0. Ora se predisponiamo la nostra curva in modo che A0 A00 = A0 P 0, B 0 B 00 = B 0 P 0, C 0C 00 = C 0 P 0 e via di seguito, avremo la nostra curva, perché allora, naturalmente, AA0 + A0 P 0 = AA0 + A0 A00 sarà costante. Così la nostra curva è il luogo di tutti i punti equidistanti da una linea e da un punto. Una curva del genere è chiamata parabola; lo specchio è fatto a forma di parabola. Gli esempi sopra illustrano il principio su cui tali dispositivi ottici possono essere progettati. Le curve esatte possono essere calcolate usando il principio che, per andare perfettamente a fuoco, i tempi impiegati nel percorso devono essere esattamente uguali per tutti i raggi di luce, essendo K A B C D X altresì minori dei tempi di qualsiasi altro percorso molto vicino. Discuteremo ulteriormente questi dispositivi ottici focheggianti nel A' P' prossimo capitolo; discutiamo ora l’ulteriore sviluppo della teoria. Quando viene sviluppato un nuovo principio teorico, come il principio del temB' X' po minimo, la nostra prima inclinazione può essere di dire: «Bene questo C' D' è molto carino, è piacevole; ma il problema è, è davvero di aiuto nella comprensione della fisica?». Qualcuno può dire: «Sì, osserva quante cose L A'' B'' C'' D'' X'' possiamo ora comprendere!». Un altro dice: «Molto bene, ma anch’io posso capire gli specchi. Ho bisogno di una curva tale che ogni piano tangente formi angoli uguali con i due raggi. Posso, inoltre, calcolare una lente per- FIGURA 26.12 Specchio parabolico. ché ogni raggio che giunge a essa è curvato secondo un angolo dato dalla legge di Snell». Evidentemente l’enunciato del tempo minimo e l’enunciato che gli angoli sono uguali nella riflessione, e che i seni degli angoli sono proporzionali nella rifrazione, sono la stessa cosa. È dunque semplicemente un problema filosofico o estetico? Si possono portare argomenti a sostegno di entrambe le parti. Però, l’importanza di un principio potente è che predice cose nuove. È facile dimostrare che vi sono numerose cose nuove predette dal principio di Fermat. Supponiamo anzitutto che vi siano tre mezzi, vetro, acqua e aria, e che noi eseguiamo un esperimento di rifrazione e misuriamo l’indice n di ciascun mezzo rispetto all’altro. Chiamiamo n12 l’indice dell’aria (1) rispetto all’acqua (2); n13 l’indice dell’aria (1) rispetto al vetro (3). Se misurassimo l’acqua rispetto al vetro troveremmo un altro indice, che chiameremo n23 . Ma non vi è alcuna ragione a priori per la quale dovrebbe esserci una connessione qualsiasi fra n12 , n13 e n23 . D’altra parte, secondo l’idea del tempo minimo, vi è una relazione definita. L’indice n12 è il rapporto fra le due cose, la velocità nell’aria e la velocità nell’acqua; n13 è il rapporto tra la velocità nell’aria e la velocità nel vetro; n23 è il rapporto fra la velocità nell’acqua e la velocità nel vetro. Quindi eliminiamo l’aria e otteniamo n23 =

v2 v1 /v3 n13 = = v3 v1 /v2 n12

(26.5)

In altre parole, prediciamo che l’indice per una nuova coppia di materiali può essere ottenuto dagli indici dei materiali singoli, entrambi rispetto all’aria o rispetto al vuoto. Così se misuriamo la velocità della luce in tutti i materiali, e da questo otteniamo un singolo numero per ciascun materiale, vale a dire il suo indice rispetto al vuoto, chiamato ni ( n1 è la velocità nell’aria rispetto alla velocità nel vuoto ecc.), allora la nostra formula è facile. L’indice per due materiali qualsiasi iejè nj vi ni j = = (26.6) vj ni

265

r2 P'

Specchio

K'

L'

266

Capitolo 26 • Ottica: il principio del tempo minimo

© 978-8808-22107-0

Usando soltanto la legge di Snell, non vi è base per una predizione di questo tipo(1) . Ma naturalmente questa predizione funziona. La relazione (26.5) fu nota molto presto, e fu un potentissimo argomento in favore del principio del tempo minimo. Un altro argomento in favore del principio del tempo minimo, un’altra predizione, è che se misuriamo la velocità della luce nell’acqua, sarà minore che nell’aria. Questa è una predizione di un tipo completamente diverso. È una predizione brillante, perché tutto quello che abbiamo misurato finora sono angoli; qui abbiamo una predizione teorica che è del tutto diversa dalle osservazioni dalle quali Fermat dedusse l’idea del tempo minimo. Risulta infatti che la velocità nell’acqua è minore della velocità nell’aria, proprio della proporzione che è necessaria per ottenere il giusto indice!

26.5

Un enunciato più preciso del principio di Fermat

In realtà possiamo enunciare un po’ più accuratamente il principio del tempo minimo. Non è stato enunciato correttamente. È ingiustamente detto principio del tempo minimo e siamo andati avanti con la descrizione inesatta, per convenienza, ma dobbiamo ora vedere qual è l’enunciato esatto. Supponiamo di avere uno specchio come in FIGURA 26.3. Che cosa fa pensare alla luce di dover andare verso lo specchio? Il percorso del tempo minimo è chiaramente AB. Così alcune persone possono dire: «Qualche volta esso è il tempo massimo». Non è il tempo massimo, perché certamente un percorso curvo richiederebbe un tempo ancora più lungo! L’enunciato corretto è il seguente: un raggio che segue un certo particolare percorso ha la proprietà che, se facciamo una piccola variazione (diciamo uno spostamento dell’uno per cento) nel raggio in una maniera qualsiasi, diciamo nella posizione in cui arriva allo specchio, o nella forma della curva o qualsiasi altra cosa, non vi sarà variazione del primo ordine nel tempo; vi sarà soltanto una variazione del secondo ordine nel tempo. In altre parole il principio è che la luce segue un percorso tale che vi sono parecchi altri percorsi molto vicini che richiedono quasi esattamente lo stesso tempo. La seguente è un’altra difficoltà che riguarda il principio del tempo minimo, e tale che le persone che non amano questo tipo di teoria non ingoierebbero mai. Con la teoria di Snell possiamo «comprendere» la luce. La luce viaggia, vede una superficie, cambia direzione perché fa qualcosa alla superficie. L’idea di causalità, che essa passa da un punto a un altro, e poi ancora a un altro e così via, è facile da capire. Ma il principio del tempo minimo è un principio filosofico completamente diverso sul modo di operare della natura. Invece di dire che è una cosa causale, che quando facciamo una cosa, accade qualcos’altro e così via, esso dice questo: noi creiamo la situazione e la luce decide qual è il tempo più breve, o quello estremo, e sceglie tale percorso. Ma che cosa fa, come lo trova? Annusa i percorsi vicini e li confronta l’uno con l’altro? La risposta è sì, lo fa in un certo senso. Questa è la caratteristica che naturalmente non è conosciuta nell’ottica geometrica e in cui è implicato il concetto di lunghezza d’onda; la lunghezza d’onda ci dice approssimativamente a che distanza la luce debba «annusare» il percorso per controllarlo. È arduo dimostrare questo fatto su vasta scala con la luce, poiché le lunghezze d’onda sono tremendamente piccole. Ma con le onde radio, diciamo onde di 3 cm, le distanze su cui le onde radio operano un controllo, sono più grandi. Se abbiamo una sorgente D di onde radio, un rivelatore e una fenditura, come in FIGURA 26.13, i raggi S vanno naturalmente da S a D poiché è una linea retta e se restringiamo la D' fenditura tutto va bene – essi vanno ancora. Ma ora se spostiamo il rivelatore A lateralmente fino a D 0, le onde non vanno attraverso la larga fenditura da S a D 0, dato che verificano parecchi percorsi vicini, e dicono: «No, amico mio, tutti questi corrispondono a tempi diversi». D’altra parte se impediamo FIGURA 26.13 Passaggio di onde radio attraverso alla radiazione di verificare i cammini restringendo la fenditura fino a una una fenditura sottile. (1) Benché possa essere dedotto se vien fatta l’ipotesi addizionale che l’aggiunta di uno strato di una sostanza alla superficie di un’altra non cambia l’eventuale angolo di rifrazione nel secondo materiale.

26.6 • Come funziona

© 978-8808-22107-0

267

fessura strettissima, allora vi è un solo percorso possibile e la radiazione lo prende! Con una fenditura sottile più radiazione raggiunge D 0 di quanta non lo raggiunga con una fenditura larga! L’effetto può essere visto nelle semplici condizioni seguenti. Trovate una piccola vivida luce, diciamo una lampada da strada trasparente che brilla da lontano, oppure il riflesso del sole sul paraurti curvo dell’automobile. Mettete poi due dita davanti a un occhio, per fare apparire la luce attraverso la fenditura, e stringete delicatamente fino a portare a zero la luce. Vedrete che l’immagine della luce che era prima un piccolo punto, diviene assai allungata e si estende persino in una lunga linea. La ragione è che le dita sono molto avvicinate, e la luce che si suppone vada in linea retta si sparpaglia entro un certo angolo, cosicché quando giunge nell’occhio arriva da diverse direzioni. Noterete anche, se siete molto attenti, dei massimi laterali e anche un insieme di frange lungo i bordi. Inoltre il tutto è colorato. Tutto ciò verrà spiegato a tempo debito, ma per ora è una dimostrazione del fatto che la luce non sempre procede in linea retta, ed è una dimostrazione eseguibile molto facilmente.

26.6

Come funziona

Diamo infine un quadro molto sommario di quello che accade in realtà, di come l’intera cosa realmente funzioni, partendo da quello che ora crediamo sia il punto di vista esatto, preciso secondo la dinamica quantistica, ma descritto qui soltanto qualitativamente. Seguendo la luce da A a B in FIGURA 26.3, troviamo che la luce non sembra avere affatto natura ondulatoria. Al contrario i raggi sembrano essere costituiti di fotoni ed essi in realtà producono dei click in un contatore di fotoni, se ne stiamo usando uno. Lo splendore della luce è proporzionale al numero medio di fotoni che arrivano per secondo, e quello che calcoliamo è la probabilità che un fotone vada da A a B, diciamo colpendo lo specchio. La legge per tale probabilità è la seguente, molto strana. Prendete qualsiasi cammino e trovate il tempo per tale cammino; poi prendete un numero complesso, oppure tracciate un piccolo vettore complesso, ⇢ei✓ , il cui angolo ✓ è proporzionale al tempo. Il numero di giri per secondo è la frequenza della luce. Ora prendete un altro percorso; a esso corrisponde per esempio un tempo diverso, così il vettore relativo a esso è ruotato di un diverso angolo – essendo l’angolo sempre proporzionale al tempo. Prendete tutti i cammini possibili e sommate un piccolo vettore per ciascuno; la risposta è che la probabilità d’arrivo del fotone è proporzionale al quadrato della lunghezza del vettore finale, dall’inizio alla fine! Mostriamo ora come ciò implichi il principio del tempo minimo per uno specchio. Consideriamo tutti i raggi, tutti i cammini possibili ADB, AE B, ACB ecc. in FIGURA 26.3. Il cammino ADB dà un certo piccolo contributo, ma il percorso seguente, AE B, prende un tempo del tutto diverso, così il suo angolo ✓ è completamente diverso. Diciamo che il punto C corrisponde al tempo minimo, dove se cambiamo i percorsi i tempi non cambiano. Così per un po’ i tempi cambiano, poi incominciano a cambiare sempre meno via via che ci avviciniamo al punto C (FIGURA 26.14). Quindi le frecce che dobbiamo sommare arrivano quasi esattamente con lo stesso angolo per un certo periodo vicino a C, e poi gradualmente il tempo comincia ad aumentare di nuovo e le fasi ruotano in verso opposto, e così via. Alla fine abbiamo un nodo parecchio stretto. La probabilità totale è la distanza da un estremo all’altro, elevata al quadrato. La quasi totalità di tale probabilità accumulata capita nella regione dove tutte le frecce sono nella stessa direzione (ossia in fase). Tutti i contributi dovuti ai percorsi che hanno tempi molto diversi al variare del percorso si annullano puntando in direzioni diverse. Questo è il motivo per cui se copriamo le parti estreme E dello specchio, esso riflette ancora quasi esattamente lo stesso, perché tutto C quello che abbiamo fatto è stato di togliere una parte del diagramma all’inD terno delle spirali che si trovano agli estremi, e ciò produce soltanto una piccolissima variazione nella luce. Così questa è la relazione fra la moderna rappresentazione di fotoni con una probabilità di arrivo che dipende da un FIGURA 26.14 Somma di ampiezze di probabilità per diversi cammini contigui. accumulo di vettori, e il principio del tempo minimo.

27

Ottica geometrica

27.1

In questo capitolo discuteremo alcune applicazioni elementari dei concetti esposti nel capitolo precedente e un certo numero di dispositivi pratici, usando l’approssimazione detta ottica geometrica. Questa è un’approssimazione molto utile nel progetto pratico di diversi sistemi e strumenti ottici. L’ottica geometrica è o semplicissima oppure molto complicata. Con questo intendiamo che possiamo sia studiarla soltanto superficialmente, tanto da poter progettare strumenti alla buona, usando regole che sono tanto semplici che non abbiamo quasi bisogno di occuparcene qui, poiché sono praticamente a livello del liceo, oppure, se vogliamo conoscere i piccoli errori nelle lenti e altri simili dettagli, l’argomento diviene tanto complicato che è troppo avanzato per essere discusso qui! Se uno ha un reale, dettagliato problema nel progetto di una lente, che includa l’analisi di aberrazioni, allora è consigliabile che legga dei libri sull’argomento, oppure che segua il percorso dei raggi attraverso le varie superfici (che è quello che i libri insegnano a fare), usando la legge di rifrazione da una parte all’altra, e trovi dove vanno per vedere se formano un’immagine soddisfacente. Alcuni hanno detto che questo è troppo noioso, ma oggi, con le macchine calcolatrici, è il modo giusto di procedere. Si può impostare il problema e fare il calcolo per un raggio dopo l’altro, con grande facilità. Così l’argomento in realtà è in ultima analisi molto semplice, e non implica nuovi princìpi. Inoltre risulta che le regole, sia dell’ottica elementare sia dell’ottica più avanzata, sono raramente caratteristiche di altri campi, così non vi è alcuna ragione particolare per seguire l’argomento molto a lungo, con un’importante eccezione. La più avanzata e astratta teoria dell’ottica geometrica fu elaborata da Hamilton, e risulta che essa ha molte importanti applicazioni in meccanica. Essa in realtà è più importante in meccanica che in ottica e così abbandoniamo la teoria di Hamilton come argomento di alta meccanica analitica, che è studiato nell’ultimo anno o nella scuola di perfezionamento. Rendendoci conto che l’ottica geometrica dà un contributo minimo, eccetto che per il suo proprio interesse, passiamo ora a discutere le proprietà elementari di semplici sistemi ottici sulla base dei princìpi delineati nel precedente capitolo. Per procedere ci occorre una formula geometrica, che è la seguente: se abbiamo un triangolo con una piccola altezza h e una lunga base d, allora la diagonale s (ne avremo bisogno per trovare la differenza di tempo fra due diverse strade) è più lunga della base (FIGURA 27.1). Quanto più lunga? La differenza = s d può essere trovata in diversi modi. Un modo è questo. Vediamo che s 2 d 2 = h2

∆ h

s

ossia (s

d

27.1 Geometria che si presenta nella formazione delle immagini da parte di superfici curve. FIGURA

Introduzione

Ma s

d=

d)(s + d) = h2

e s + d ⇡ 2s, quindi

h2 (27.1) 2s Questa è tutta la geometria che ci occorre per discutere la formazione delle immagini da parte di superfici curve! ⇡

27.2 • Distanza focale di una superficie sferica

© 978-8808-22107-0

27.2

Distanza focale di una superficie sferica

La prima e la più semplice situazione da discutere è una singola superficie rifrangente, che separa due mezzi con diversi indici di rifrazione (FIGURA 27.2). Lasciamo allo studente il caso di indici di rifrazione arbitrari, perché i concetti, non la situazione specifica, sono sempre la cosa più importante, e il problema è abbastanza facile da eseguire in qualsiasi caso. Così supporremo che a sinistra la velocità sia l e a destra sia 1/n, dove n è l’indice di rifrazione. La luce viaggia più lentamente nel vetro di un fattore n. Supponiamo ora di avere un punto O, alla distanza s dalla superficie frontale del vetro, e un altro punto O 0 alla distanza s 0 all’interno del vetro, P s s' e desideriamo adattare la superficie curva in modo tale che ogni raggio R proveniente da O che colpisce la superficie, in un qualsiasi punto P, sarà O V Q C deviato in modo da procedere verso il punto O 0. Perché ciò sia vero, dobbiamo modellare la superficie in modo che il tempo impiegato dalla luce Aria Vetro per andare da O a P, cioè la distanza OP divisa per la velocità della luce (la velocità qui è unitaria), più n · O 0 P, che è il tempo che la luce impiega FIGURA 27.2 Messa a fuoco con una singola per andare da P a O 0, sia uguale a una costante indipendente dal punto P. superficie rifrangente. Questa condizione ci fornisce un’equazione per determinare la superficie. La risposta è che la superficie è una complicatissima curva di quarto grado, e lo studente può divertirsi cercando di calcolarla con la geometria analitica. È più semplice cercare di risolvere un caso particolare che corrisponde a s ! 1, poiché allora la curva è di secondo grado ed è meglio riconoscibile. È interessante confrontare questa curva con la curva parabolica che abbiamo trovato per uno specchio focalizzante quando la luce proviene dall’infinito. Così la superficie opportuna non può essere costruita facilmente – mettere a fuoco la luce da un punto all’altro richiede una superficie piuttosto complicata. Risulta in pratica che comunemente non cerchiamo di costruire tali superfici complicate, ma facciamo un compromesso. Invece di cercare di ottenere che tutti i raggi vadano nel fuoco, sistemiamo le cose in modo che soltanto i raggi abbastanza vicini all’asse OO 0 arrivino nel fuoco. Gli altri più lontani possono deviare se vogliono, sfortunatamente, poiché la superficie ideale è complicata e noi usiamo invece una superficie sferica con la curvatura esatta sull’asse. È talmente più facile costruire una sfera piuttosto che altre superfici, che è vantaggioso per noi trovare che cosa accade ai raggi che colpiscono una superficie sferica, supponendo che soltanto i raggi vicini all’asse saranno messi perfettamente a fuoco. Quei raggi che sono vicini all’asse sono talvolta chiamati raggi parassiali, e ciò che stiamo analizzando sono le condizioni per la messa a fuoco di raggi parassiali. Discuteremo in seguito gli errori introdotti dal fatto che tutti i raggi non sono sempre vicini all’asse. Così, supponendo che P sia vicino all’asse, tracciamo la perpendicolare PQ cosicché l’altezza PQ sia h. Per un momento immaginiamo che la superficie sia un piano passante per P. In tal caso, il tempo necessario per andare da O a P sarebbe superiore al tempo per andare da O a Q, e inoltre il tempo da P a O 0 sarebbe superiore al tempo da Q a O 0. Ma questo è il motivo per cui il vetro deve essere curvo, perché l’eccedenza totale del tempo deve essere compensata dal ritardo nel passare da V a Q! Ora il tempo in eccesso lungo il percorso OP è h2 /2s e il tempo in eccesso nell’altro percorso è nh2 /2s 0. Questo tempo in eccesso, che deve essere aggiustato dal ritardo nel percorrere V Q, differisce da quello che sarebbe stato nel vuoto, poiché è presente un mezzo. In altre parole il tempo per andare da V a Q non è quello che sarebbe in linea retta nell’aria, ma è minore di un fattore n, così che il ritardo su questa distanza è allora (n 1)V Q. E ora, quanto è grande V Q? Se il punto C è il centro della sfera e se il suo raggio è R vediamo dalla solita formula che la distanza V Q è uguale a h2 /2R. Quindi scopriamo che la legge che collega le distanze s e s 0, e che ci dà il raggio di curvatura R della superficie di cui abbiamo bisogno, è

ossia

269

h2 nh2 (n 1) h2 + = 2s 2s 0 2R

(27.2)

1 n n 1 + = s s0 R

(27.3)

O'

270

Capitolo 27 • Ottica geometrica

© 978-8808-22107-0

Se abbiamo una posizione O e un’altra posizione O 0, e vogliamo mettere a fuoco la luce da O a O 0, allora possiamo calcolare con questa formula il raggio di curvatura R della superficie richiesta. Ora ne risulta, ed è interessante, che la stessa lente con la stessa curvatura R avrà la proprietà di messa a fuoco per altre distanze, vale a dire, per qualsiasi coppia di distanze tali che la somma dei loro reciproci, uno dei quali moltiplicato per n, sia una costante. In questo modo una data lente (finché ci limitiamo ai raggi parassiali) metterà a fuoco non soltanto da O a O 0, ma fra un infinito numero di altre coppie di punti, finché tali coppie di punti soddisfano la relazione che 1/s + n/s 0 sia una costante, caratteristica della lente. In particolare un caso interessante è quello in cui s ! 1. Possiamo vedere dalla formula che, al crescere di un s, l’altro decresce. In altre parole, se il punto O si allontana, il punto O 0 si avvicina e viceversa. Quando il punto O va verso l’infinito, il punto O 0 continua a muoversi verso l’interno fino a che raggiunge una certa distanza detta distanza focale f 0, all’interno del materiale. Se arrivano raggi paralleli, essi incontreranno l’asse a una distanza f 0. Similmente potremmo immaginare le cose in verso opposto. (Ricordiamo la regola di reciprocità: se la luce va da O a O 0, andrà naturalmente anche da O 0 a O.) Quindi, se avessimo una sorgente di luce all’interno del vetro, potremmo voler sapere dove si trova il fuoco. In particolare, se la luce nel vetro fosse all’infinito (stesso problema) dove andrebbe a fuoco all’esterno? Questa distanza è detta f . Naturalmente possiamo anche metterla in altro modo. Se avessimo una sorgente di luce in f e se la luce attraversasse la superficie, allora si allontanerebbe come un fascio di raggi paralleli. Possiamo facilmente trovare quanto valgono f e f 0: n n 1 = 0 f R

ossia

f0 =

1 n 1 = f R

ossia

f =

Rn n 1

(27.4)

R

(27.5)

n

1

Vediamo una cosa interessante: se dividiamo ciascuna distanza focale per il corrispondente indice di rifrazione otteniamo lo stesso risultato! Questo teorema in effetti è generale. È vero per qualsiasi sistema di lenti, comunque complicato, così è interessante da ricordare. Non abbiamo provato qui che è generale – l’abbiamo semplicemente osservato per una singola superficie, ma accade che sia vero in generale che le due lunghezze focali di un sistema siano collegate in questo modo. Talvolta l’equazione (27.3) è scritta nella forma 1 1 n + 0 = s s f

(27.6)

Questa è più utile della (27.3) per il fatto che possiamo misurare f più facilmente di quanto possiamo misurare la curvatura e l’indice di rifrazione della lente: se non siamo interessati al progetto di una lente, o a sapere in che modo è fatta, ma la prendiamo semplicemente da uno scaffale, la grandezza interessante è f non n, l e R! Una situazione interessante capita se s diventa minore di f . Che cosa accade allora? Se s < f , allora (1/s) > (1/ f ), e quindi s 0 è negativo; la nostra equazione ci dice che la luce si metterà a fuoco soltanto con un valore negativo di s 0, qualunque cosa ciò significhi! Ciò ha un significato molto interessante e ben definito. La formula rimane ancora utile, in altre parole, anche quando i numeri sono negativi. Quello che significa è mostrato in FIGURA 27.3. Se tracciamo i raggi che divergono da O, essi saranno deviati, è vero, alla superficie, e non convergeranno in un fuoco, perché O è così vicino che essi sono «più che paralleli». Tuttavia, essi divergono come se provenissero da un punto O 0 all’esterno del vetro. Questa è un’immagine apparente, talvolta detta immagine virtuale. L’immagine O 0 in FIGURA 27.2 è detta immagine reale. Se la luce giunge realmente in un punto, esso è un’immagine reale. Ma se la luce sembra provenire da un punto, un punto fittizio diverso dal punto originale, esso è un’immagine virtuale. Così quando s 0 risulta negativo, significa che O 0 è dall’altra parte della superficie, e tutto va bene. Consideriamo ora il caso interessante in cui R è uguale all’infinito; allora abbiamo 1 n + =0 s s0

27.3 • La distanza focale di una lente

© 978-8808-22107-0

271 FIGURA

27.3

Immagine

virtuale. O

27.4 Una superficie piana dà un’immagine in O della luce proveniente da O0 . FIGURA

O'

O' O Aria

Vetro

In altre parole, s 0 = ns, che significa che se osserviamo da un mezzo denso all’interno di un mezzo rarefatto, e vediamo un punto nel mezzo rarefatto, esso appare più profondo di un fattore n. Similmente, possiamo usare la stessa equazione all’inverso, cosicché se osserviamo attraverso una superficie piana un oggetto che è a una certa distanza all’interno del mezzo denso, apparirà come se la luce non provenisse da tanto lontano (FIGURA 27.4). Quando osserviamo dall’alto il fondo di una piscina, non ci appare tanto profondo quanto è in realtà, per un fattore 3/4, che è il reciproco dell’indice di rifrazione dell’acqua. Potremmo proseguire, naturalmente, passando a discutere lo specchio sferico. Ma se uno si rende conto dei concetti implicati dovrebbe essere in grado di dedurlo da solo. Lasciamo quindi allo studente ricavare la formula per lo specchio sferico, ma ricordiamo che è bene adottare certe convenzioni concernenti le distanze implicate: 1 la distanza s dell’oggetto è positiva se il punto O è alla sinistra della superficie; 2 la distanza dell’immagine s 0 è positiva se il punto O 0 è alla destra della superficie; 3 il raggio di curvatura della superficie è positivo se il centro è alla destra della superficie. In FIGURA 27.2, per esempio, s, s 0 e R sono tutti positivi; in FIGURA 27.3, s e R sono positivi, ma s 0 è negativo. Se avessimo usato una superficie concava, la nostra formula (27.3) darebbe ancora il risultato corretto, se semplicemente prendessimo R negativo. Nel ricavare la formula corrispondente per uno specchio, usando le convenzioni dette sopra, troverete che se mettete n = 1 nella formula (27.3) (come se il materiale dietro lo specchio avesse un indice 1 ), ne risulta la formula valida per uno specchio! Benché la derivazione della formula (27.3) sia semplice ed elegante, usando il tempo minimo, si può naturalmente ricavare la stessa formula usando la legge di Snell, ricordando che gli angoli sono tanto piccoli che i seni degli angoli possono essere sostituiti dagli angoli stessi.

27.3

La distanza focale di una lente

Passiamo ora a considerare un’altra situazione, una situazione molto pratica. La maggior parte delle lenti che usiamo hanno due superfici, non semplicemente una. Come influisce questo sui risultati? Supponiamo di avere due superfici di diversa curvatura con vetro che riempie lo spazio fra esse (FIGURA 27.5). Vogliamo studiare il problema della messa a fuoco da un punto O a un punto alterno O 0. Come possiamo fare? La risposta è: per prima cosa usiamo la formula (27.3) per la prima superficie, dimenticando la seconda superficie. Questo ci dirà che la luce che era divergente da O apparirà convergente o divergente, a seconda del segno, da un certo altro punto, diciamo O 0. Consideriamo ora un nuovo problema. Abbiamo una differente superficie fra vetro e aria, in cui i raggi convergono verso un certo punto O 0. Dove convergeranno realmente? Usiamo di nuovo la stessa formula! Troviamo che essi convergono in O 00. Così, se necessario, possiamo attraversare 75 superfici usando semplicemente la stessa formula successivamente, da una alla successiva! Vi sono alcune formule di classe piuttosto elevata che ci risparmierebbero una considerevole energia le poche volte della nostra vita in cui ci capitasse di dover seguire la luce attraverso cinque superfici, ma è più facile seguire appunto la luce attraverso cinque superfici quando si presenta

Capitolo 27 • Ottica geometrica

272

27.5 Formazione dell’immagine con una lente a due superfici.

© 978-8808-22107-0

FIGURA

P R2 R1

h

27.6

Lente sottile con due raggi di curvatura positivi. FIGURA

T

O

n

2

O'

Q

O'

1

n2

O''

n1

n1

il problema, piuttosto che ricordare una quantità di formule, dato che può capitare di non dovere mai seguire la luce attraverso nessuna superficie! In ogni caso, il principio è che quando attraversiamo una superficie troviamo una nuova posizione, un nuovo punto focale, e allora prendiamo il punto come punto di partenza per la superficie seguente, e via di seguito. Per farlo realmente, poiché sulla seconda superficie stiamo andando da n a 1 anziché da 1 a n, e poiché in molti sistemi vi sono più tipi di vetro, così che vi sono indici n1 , n2 ,..., abbiamo in realtà bisogno di una generalizzazione della formula (27.3) per un caso in cui vi sono due diversi indici, n1 , n2 , anziché soltanto n. Allora non è difficile provare che la forma generale della (27.3) è n1 n2 n2 n1 + 0 = s s R

(27.7)

Particolarmente semplice è il caso speciale in cui le due superfici sono molto vicine – così vicine che possiamo ignorare piccoli errori dovuti allo spessore. Se disegniamo la lente come mostrato in FIGURA 27.6, possiamo porci questo quesito: come deve essere costruita la lente per mettere a fuoco la luce da O a O 0? Supponiamo che la luce giunga esattamente al bordo della lente, nel punto P. Allora l’eccesso di tempo nell’andare da O a O 0 è n1 h 2 n1 h 2 + 2s 2s 0 ignorando per un momento la presenza dello spessore T di vetro di indice n2 . Ora, per rendere il tempo per il percorso diretto uguale a quello per il percorso OPO 0, dobbiamo usare un pezzo di vetro il cui spessore T al centro sia tale che il ritardo introdotto dall’attraversamento di tale spessore sia sufficiente a compensare il tempo in più del percorso di prima. Quindi lo spessore della lente al centro deve essere dato dalla relazione n1 h 2 n1 h 2 + = (n2 2s 2s 0

(27.8)

n1 ) T

Possiamo anche esprimere T in funzione dei raggi R1 e R2 delle due superfici. Facendo attenzione alla nostra convenzione 3, troviamo così per R1 < R2 (lente convessa), T=

h2 2R1

h2 2R2

(27.9)

Quindi, finalmente otteniamo n1 n1 + 0 = n2 s s

n1

1 R1

1 R2

!

(27.10)

Ora notiamo di nuovo che se uno dei punti è all’infinito, l’altro sarà in un punto che diremo distanza focale f . La distanza focale f è data da ! 1 1 1 = n 1 (27.11) f R1 R2 dove n = n2 /n1 .

27.4 • Ingrandimento

© 978-8808-22107-0

273

Se ora prendiamo il caso opposto, dove s va all’infinito, vediamo che s 0 è alla distanza focale Questa volta le distanze focali sono uguali. (Questo è un altro caso particolare della regola generale che il rapporto delle due distanze focali è il rapporto degli indici di rifrazione nei due mezzi in cui i raggi vanno a fuoco. In questo particolare sistema ottico, gli indici iniziale e finale sono gli stessi, così le due distanze focali sono uguali.) Dimenticando per un momento la formula reale per la distanza focale, se compriamo una lente che qualcuno ha progettato con determinati raggi di curvatura e un certo indice, potremmo misurare la distanza focale, diciamo, vedendo dove va a fuoco un punto all’infinito. Una volta che avessimo la distanza focale, sarebbe meglio scrivere la nostra equazione direttamente in funzione della distanza focale, e allora la formula sarebbe f 0.

1 1 1 + = s s0 f

(27.12)

Vediamo ora come funziona la formula e che cosa implica in circostanze differenti. Per prima cosa essa implica che se s o s 0 è infinito l’altro è f . Ciò significa che la luce parallela va a fuoco a una distanza f , e in effetti definisce f . Un’altra cosa interessante che dice è che entrambi i punti si muovono nella stessa direzione. Se uno si muove verso destra anche l’altro lo fa. Un’altra cosa che essa dice è che s e s 0 sono uguali se essi sono entrambi uguali a 2 f . In altre parole, se vogliamo una situazione simmetrica, troviamo che essi andranno entrambi a fuoco a una distanza 2f.

27.4

Ingrandimento

Finora abbiamo discusso la messa a fuoco soltanto per punti sull’asse. Discutiamo ora anche la formazione delle immagini di oggetti non esattamente sull’asse, ma un pochino al di fuori, cosicché possiamo comprendere le proprietà dell’ingrandimento. Quando sistemiamo una lente in modo da mettere a fuoco la luce proveniente da un piccolo filamento su un «punto» dello schermo, notiamo che sullo schermo otteniamo un’«immagine» dello stesso filamento, tranne che di una dimensione maggiore o minore del filamento vero. Questo deve significare che la luce va a fuoco da ciascun punto del filamento. Per comprendere ciò un po’ meglio, analizziamo il sistema lente sottile mostrato schematicamente in FIGURA 27.7. Conosciamo i seguenti fatti: • qualsiasi raggio che arriva parallelo da una parte procede verso un certo particolare punto detto fuoco dall’altra parte, a una distanza f dalla lente; • qualsiasi raggio che arriva alla lente dal fuoco da una parte esce parallelo all’asse dall’altra parte. Questo è tutto quello che ci è necessario per confermare la formula (27.12) con la geometria, come descritto di seguito. Q P Supponiamo di avere un oggetto a una certa distanza x dal fuoco; sia y y y l’altezza dell’oggetto. Sappiamo allora che uno dei raggi, vale a dire PQ, R W f x' x sarà deviato in modo da passare attraverso il fuoco R dall’altra parte. Ora, f X V U y' y' se la lente metterà a fuoco il punto P, possiamo trovare dove, se troviamo semplicemente dove va un altro raggio, poiché il nuovo fuoco sarà dove i T S due si intersecano di nuovo. Dobbiamo usare la nostra inventiva soltanto per trovare l’esatta direzione di un altro raggio. Ma ricordiamo che un raggio parallelo passa attraverso il fuoco e viceversa: un raggio che passa per il FIGURA 27.7 Geometria della formazione delle fuoco uscirà parallelo! Così tracciamo il raggio PT attraverso U. (È vero immagini per una lente sottile. che i raggi reali impegnati nella messa a fuoco possono essere molto più limitati dei due che abbiamo tracciato, ma essi sono più difficili da rappresentare, così fingiamo di poter usare questo raggio.) Poiché esso dovrebbe uscire parallelo, tracciamo T S parallelo a XW . L’intersezione S è il punto di cui abbiamo bisogno. Questo determinerà la posizione esatta e l’esatta altezza. Chiamiamo y 0 l’altezza e x 0 la distanza dal fuoco. Ora possiamo derivare una

Capitolo 27 • Ottica geometrica

274

© 978-8808-22107-0

formula della lente. Usando i triangoli simili PVU e T XU, troviamo y0 y = f x

(27.13)

Similmente, dai triangoli SW R e QX R, otteniamo y0 y = 0 x f

(27.14)

Risolvendo ciascuna rispetto a y 0/y, troviamo che y0 x0 f = = y f x

(27.15)

L’equazione (27.15) è la famosa formula della lente; in essa c’è tutto quello che abbiamo bisogno di sapere sulle lenti: essa ci dice l’ingrandimento, y 0/y, in funzione delle distanze e delle distanze focali. Essa collega anche le due distanze x e x 0 con f : x x0 = f 2

(27.16)

che ha una forma molto più semplice su cui lavorare dell’equazione (27.12). Lasciamo allo studente di dimostrare che se poniamo s=x+ f s0 = x 0 + f l’equazione (27.12) è identica all’equazione (27.16).

27.5

Senza in realtà derivarlo, descriveremo brevemente il risultato generale quando abbiamo diverse lenti. Se abbiamo un sistema di parecchie lenti, come possiamo analizzarlo? Questo è facile. Cominciamo con un certo oggetto e calcoliamo dov’è la sua immagine dovuta alla prima lente, usando la formula (27.16) o (27.12) o qualsiasi altra formula equivalente, oppure tracciando diagrammi. Così troviamo un’immagine. Poi trattiamo quest’immagine come sorgente per la lente successiva, e usiamo la seconda lente con la sua distanza focale, qualunque essa sia, per trovare di nuovo un’immagine. Inseguiamo semplicemente la cosa attraverso la successione delle lenti. È tutto quello che c’è da fare per questo. Non implica niente di nuovo in linea di principio, così non entreremo nei particolari. Vi è, però, un risultato netto molto interessante degli effetti di qualsiasi successione di lenti sulla luce che parte e termina nello stesso mezzo, diciamo l’aria. Qualsiasi strumento ottico – un telescopio o un microscopio con qualsiasi numero di lenti e specchi – ha la seguente proprietà. Esistono due piani, detti piani principali del sistema (questi piani sono spesso abbastanza vicini alla prima superficie della prima lente e all’ultima superficie dell’ultima lente), che hanno le seguenti proprietà:

y

x'

x

y' f

f 1

FIGURA

Lenti composte

27.8

sistema ottico.

2

Illustrazione dei piani principali di un

• se la luce entra nel sistema parallelamente dalla prima parte, essa va in un fuoco, a una distanza dal secondo piano principale uguale alla distanza focale, proprio come se il sistema fosse costituito da una lente sottile posta in questo piano; • se la luce parallela giunge nell’altro verso, essa va in un fuoco alla stessa distanza f dal primo piano principale, di nuovo come se lì fosse posta una lente sottile (FIGURA 27.8).

27.6 • Aberrazioni

© 978-8808-22107-0

Naturalmente, se misuriamo le distanze x e x 0, e y e y 0 come prima, la formula (27.16) che abbiamo scritto per la lente sottile è assolutamente generale, ammesso che misuriamo la distanza focale dai piani principali e non dal centro della lente. Così accade che per una lente sottile i piani principali sono coincidenti. È proprio come se prendessimo una lente sottile, la tagliassimo nel mezzo, separassimo le parti e non tenessimo conto del fatto che sono separate. Ogni raggio che arriva, esce immediatamente dall’altra parte del secondo piano dallo stesso punto da cui è entrato nel primo piano! I piani principali e la distanza focale possono essere trovati entrambi con l’esperimento o con il calcolo, e allora tutte le proprietà del sistema ottico sono descritte. È molto interessante che il risultato non sia complicato, quando abbiamo finito completamente con un tale, notevole, complesso sistema ottico.

27.6

Aberrazioni

Prima di sentirci troppo eccitati per quanto sono meravigliose le lenti, dobbiamo affrettarci ad aggiungere che vi sono anche serie limitazioni, per il fatto che ci siamo limitati, strettamente parlando, ai raggi parassiali, cioè ai raggi vicini all’asse. Una lente reale avente una dimensione finita rivelerà, generalmente, aberrazioni. Per esempio un raggio che è sull’asse, naturalmente, passa attraverso il fuoco; un raggio che è molto vicino all’asse andrà ancora molto bene nel fuoco. Ma come ci allontaniamo il raggio comincia a deviare dal fuoco, forse non riuscendo ad arrivarci, e un raggio che colpisce il bordo in alto, viene giù e manca completamente il fuoco per un ampio margine. Così, invece di ottenere un’immagine puntiforme otteniamo una macchia. Questo effetto è chiamato aberrazione sferica, perché è una proprietà delle superfici sferiche che usiamo al posto della struttura giusta. Questo potrebbe essere rimediato per qualsiasi specifica distanza dell’oggetto, cambiando la forma della superficie della lente, o forse usando parecchie lenti sistemate in modo che le aberrazioni delle singole lenti tendano a eliminarsi l’un l’altra. Le lenti hanno un altro difetto: la luce di colori differenti ha diverse velocità, ossia diversi indici di rifrazione, nel vetro, e quindi la distanza focale di una data lente è diversa per colori differenti. Così se formiamo l’immagine di un punto bianco questa sarà colorata, perché quando mettiamo a fuoco il rosso, il blu è sfuocato e viceversa. Questa proprietà è chiamata aberrazione cromatica. Vi sono anche altri difetti. Se l’oggetto è fuori dell’asse, allora il fuoco in realtà non è più perfetto, quando diventa abbastanza lontano dall’asse. Il modo più facile di verificare questo fatto è di mettere a fuoco una lente e poi inclinarla in modo che i raggi le giungano molto obliqui rispetto all’asse. Allora l’immagine formata sarà di solito assai approssimativa, e può non esservi alcun punto in cui vada a fuoco bene. Quindi vi sono parecchi tipi di errori nelle lenti ai quali il progettista ottico cerca di rimediare, usando diverse lenti per compensare con l’una i difetti dell’altra. Quanto dobbiamo essere accurati nell’eliminare le aberrazioni? È possibile costruire un sistema ottico assolutamente perfetto? Supponiamo di aver costruito un sistema ottico che dovrebbe inviare la luce esattamente in un punto. Ora, ragionando dal punto di vista del tempo minimo, possiamo trovare una condizione di quanto perfetto debba essere il sistema? Il sistema avrà qualche tipo di apertura d’ingresso per la luce. Se prendiamo il raggio più lontano dall’asse che può arrivare nel fuoco (se il sistema è perfetto, naturalmente), i tempi per tutti i raggi sono esattamente uguali. Ma niente è perfetto, così il problema è: quanto può essere sbagliato il tempo per questo raggio e non essere meritevole di ulteriore correzione? Questo dipende da quanto perfetta vogliamo l’immagine. Ma supponiamo di voler fare l’immagine più perfetta possibile. Allora, naturalmente, la nostra impressione è che dobbiamo sistemare le cose in modo che ogni raggio impieghi per quanto possibile lo stesso tempo. Ma risulta che questo non è vero, che oltre un certo punto stiamo cercando di fare qualcosa che è troppo sottile, perché la teoria dell’ottica geometrica non funziona! Ricordate che il principio del tempo minimo non è una formulazione esatta, diversamente dal principio di conservazione dell’energia o dal principio di conservazione della quantità di moto. Il principio del tempo minimo è soltanto un’approssimazione, ed è interessante sapere quale

275

276

Capitolo 27 • Ottica geometrica

© 978-8808-22107-0

errore è permesso senza produrre qualsiasi apparente differenza. La risposta è che se abbiamo sistemato le cose in modo che fra il raggio massimo – il raggio peggiore, il raggio più lontano – e il raggio centrale, la differenza nel tempo è minore di circa il periodo che corrisponde a un’oscillazione della luce, allora non vi è vantaggio da un ulteriore miglioramento. La luce è qualcosa di oscillatorio con una frequenza definita che è in relazione alla lunghezza d’onda, e se noi predisponiamo che la differenza di tempo per i diversi raggi sia minore di circa un periodo, non vi è utilità ad andare oltre.

27.7

Potere risolutivo

Un altro problema interessante – un importantissimo problema tecnico che riguarda tutti gli strumenti ottici – è quanto potere risolutivo possiedono. Se costruiamo un microscopio, vogliamo vedere gli oggetti che stiamo osservando. Ciò significa, per esempio, che se stiamo osservando un batterio con una macchia a ciascuna estremità, vogliamo vedere che vi sono due punti quando li ingrandiamo. Si può pensare che tutto quello che dobbiamo fare è ottenere un ingrandimento sufficiente – possiamo sempre aggiungere una lente, possiamo ingrandire sempre di più, e con l’ingegnosità dei progettisti, tutte le aberrazioni sferiche e cromatiche possono essere eliminate, e non vi è alcuna ragione perché non possiamo continuare a ingrandire l’immagine. Così le limitazioni di un microscopio non consistono nel fatto che sia impossibile costruire una lente che ingrandisca più di 2000 diametri. Possiamo costruire un sistema di lenti che ingrandisce 10 000 diametri, ma potremmo lo stesso non distinguere due punti che sono troppo vicini a causa delle limitazioni dell’ottica geometrica, per il fatto che il tempo minimo non è qualcosa di esatto. Per scoprire la legge che determina quanto lontani devono essere due punti perché nell’immagine appaiano come punti separati, si può usare un S sistema elegantissimo, legato al tempo impiegato dai diversi raggi. D P' t1 Supponete ora di trascurare le aberrazioni, e immaginate che per un T particolare punto P (FIGURA 27.9) tutti i raggi dall’oggetto all’immagine T t2 P impieghino esattamente lo stesso tempo. (Non è vero perché non si tratta R di un sistema perfetto, ma questo è un altro problema.) Ora prendete un altro punto vicino, P 0, e domandatevi se la sua immagine sarà distinta da T. In altre parole, se possiamo scorgere la differenza fra essi. Naturalmente, FIGURA 27.9 Il potere risolutivo di un sistema ottico. secondo l’ottica geometrica dovrebbero esservi due immagini puntiformi, ma quello che vediamo può essere piuttosto confuso e possiamo non essere in grado di distinguere che ci sono due punti. La condizione affinché il secondo punto sia messo a fuoco in un punto distintamente differente dal primo è che i due tempi impiegati dai raggi estremi P 0 ST e P 0 RT su ciascun bordo della grande apertura delle lenti per andare da un estremo all’altro, non devono essere uguali, dai due possibili oggetti puntiformi a una data immagine puntiforme. Perché? Perché se i tempi fossero uguali, naturalmente andrebbero entrambi a fuoco nello stesso punto. Così i tempi non sono uguali. Ma di quanto devono differire così da poter dire che entrambi non giungono in un fuoco comune e da poter distinguere i due punti immagine? La regola generale per la risoluzione di qualsiasi strumento ottico è questa: due diverse sorgenti puntiformi possono essere risolte soltanto se una sorgente va a fuoco in un punto tale che i tempi impiegati dai raggi massimi dell’altra sorgente per raggiungere tale punto, confrontati col vero punto immagine di questa, differiscono per più di un periodo. È quindi necessario che la differenza di tempo fra il raggio più alto e il raggio più basso rispetto al punto sbagliato superi un certo valore, vale a dire, approssimativamente, il periodo di oscillazione della luce: 1 (27.17) t2 t1 > dove è la frequenza della luce (numero di oscillazioni per secondo; anche velocità divisa per la lunghezza d’onda).

27.7 • Potere risolutivo

© 978-8808-22107-0

Se la distanza di separazione dei due punti è detta D e se l’angolo di apertura della lente è detto ✓, allora si può dimostrare che la (27.17) è esattamente equivalente all’affermazione: D>

n

sen ✓

dove n è l’indice di rifrazione in P e è la lunghezza d’onda. Le cose più piccole che possiamo vedere sono quindi delle stesse dimensioni della lunghezza d’onda della luce. Esiste per i telescopi una formula corrispondente che ci dà la minima differenza angolare fra due stelle che siano appena distinguibili. (1)

(1)

L’angolo è circa /D, dove D è il diametro della lente. Riuscite a capire il perché?

277

28

Radiazione elettromagnetica

28.1

Elettromagnetismo

I momenti più drammatici nello sviluppo della fisica sono quelli in cui hanno luogo grandi sintesi per cui si scopre a un tratto che dei fenomeni che in precedenza erano apparsi diversi, sono soltanto differenti aspetti della stessa realtà. La storia della fisica è la storia di tali sintesi, e la base del successo della scienza fisica sta principalmente nel fatto che siamo capaci di sintetizzare. Forse il momento più drammatico nello sviluppo della fisica durante il diciannovesimo secolo capitò a J.C. Maxwell in un giorno del 1860, quando egli collegò le leggi dell’elettricità e del magnetismo con le leggi del comportamento della luce. Come risultato, furono parzialmente chiarite le proprietà della luce – quella antica e indefinibile sostanza che è tanto misteriosa e importante che si sentì necessario predisporre per essa una creazione speciale nello scrivere la Genesi. Maxwell poté dire, una volta condotta a termine la sua scoperta: «Vi siano elettricità e magnetismo, e ci sarà la luce!». Vi fu una lunga preparazione per questo momento culminante nella scoperta graduale e nello svelarsi delle leggi dell’elettricità e del magnetismo. Questa storia la riserveremo per uno studio dettagliato nel prossimo anno. Però la storia è, in breve, la seguente. Le proprietà gradualmente scoperte dell’elettricità e del magnetismo, delle forze elettriche di attrazione e di repulsione e delle forze magnetiche, dimostrarono che, benché queste forze fossero piuttosto complesse, tutte diminuivano inversamente al quadrato della distanza. Sappiamo, per esempio, che la semplice legge di Coulomb per cariche stazionarie dice che il campo di forza elettrico varia in ragione inversa al quadrato della distanza. Come conseguenza, per distanze sufficientemente grandi vi è una piccolissima influenza di un sistema di cariche su un altro. Maxwell notò che le equazioni o le leggi che erano state scoperte fino ad allora erano mutuamente inconsistenti quando cercava di metterle insieme, e perché l’intero sistema fosse consistente, egli dovette aggiungere un altro termine alle sue equazioni. Con questo nuovo termine risultò una predizione sorprendente, che una parte dei campi elettrici e magnetici dovrebbe diminuire molto più lentamente con la distanza che con la legge dell’inverso del quadrato, vale a dire, inversamente alla prima potenza della distanza! E così egli si rese conto che le correnti elettriche in un punto possono influenzare altre cariche assai lontane e predisse gli effetti fondamentali che ci sono oggi familiari – trasmissioni radio, radar e via di seguito. Sembra un miracolo che qualcuno, parlando in Europa, possa, con semplici influenze elettriche, essere sentito migliaia di miglia lontano, a Los Angeles. Com’è possibile? È a causa del fatto che i campi non variano con la legge dell’inverso del quadrato, ma soltanto inversamente alla prima potenza della distanza. Infine, poi, anche la luce stessa fu riconosciuta consistere in influenze elettriche e magnetiche che si estendono su vaste distanze, generate da un’oscillazione degli elettroni negli atomi di rapidità quasi incredibile. Tutti questi fenomeni li riassumiamo nella parola radiazione o, più specificamente, radiazione elettromagnetica, essendovi anche uno o due altri tipi di radiazione. Quasi sempre radiazione significa radiazione elettromagnetica. E così è congiunto l’universo. I moti atomici di una stella lontana hanno ancora a questa grande distanza un’influenza, sufficiente a mettere in moto elettroni nel nostro occhio, e così noi sappiamo delle stelle. Se questa legge non esistesse saremmo tutti letteralmente all’oscuro relativamente al mondo esterno! E gli sconvolgimenti elettrici in una galassia lontana cinque

28.1 • Elettromagnetismo

© 978-8808-22107-0

miliardi di anni luce – che è l’oggetto più lontano che abbiamo finora trovato – possono ancora influenzare in modo significativo e rivelabile le correnti nella grande «scodella» frontale di un radiotelescopio. Ed è così che vediamo le stelle e le galassie. Questo notevole fenomeno è ciò che discuteremo in questo capitolo. All’inizio di questo corso di fisica abbiamo tracciato a grandi linee un’immagine dell’universo, ma siamo ora meglio preparati a comprenderne alcuni aspetti, e così ritorneremo ora su alcune sue parti più dettagliatamente. Incominciamo descrivendo la posizione della fisica alla fine del diciannovesimo secolo. Tutto quello che si sapeva allora sulle leggi fondamentali può essere riassunto come segue. Per prima cosa vi erano leggi delle forze: una forza era la legge di gravitazione, che abbiamo descritto diverse volte; la forza su un oggetto di massa m, dovuta a un altro oggetto di massa M, è data da GmM er F= (28.1) r2 dove er è un vettore unitario diretto da m a M e r è la distanza fra le masse. Poi, le leggi dell’elettricità e del magnetismo, come erano conosciute alla fine del diciannovesimo secolo e che sono queste: le forze elettriche agenti su una carica q possono essere descritte da due campi, chiamati E e B, e dalla velocità v della carica q, mediante l’equazione F = q(E + v ⇥ B)

(28.2)

Per completare questa legge dobbiamo dire quali sono le formule per E e B in una data circostanza: se numerose cariche sono presenti, E e B sono ciascuno la somma di contributi, uno per ciascuna singola carica. Così se possiamo trovare E e B prodotti da una singola carica, ci basta sommare tutti gli effetti per tutte le cariche nell’universo per ottenere E e B totali! Questo è il principio di sovrapposizione. Qual è la formula per il campo elettrico e il campo magnetico prodotti da una carica singola? Risulta che è molto complicata, e occorre un alto grado di studio e di raffinatezza per valutarla. Ma non è questo il punto. Annotiamo la legge ora, soltanto per dare al lettore un’impressione della bellezza della natura, per così dire, cioè che è possibile riassumere tutte le conoscenze fondamentali su una pagina, con notazioni che gli sono ora familiari. Questa legge per i campi di una singola carica è completa e accurata, per quanto ne sappiamo finora (eccetto per la meccanica quantistica), ma appare piuttosto complicata. Non ne studieremo ora tutte le parti; l’annotiamo soltanto per darne un’impressione, per mostrare che può essere scritta, e in modo che possiamo vedere, anzitempo, approssimativamente che aspetto ha. In realtà, il modo più vantaggioso per scrivere le leggi corrette dell’elettricità e del magnetismo non è il modo in cui le scriveremo ora, ma implica le cosiddette equazioni di campo, che impareremo nel prossimo anno. Ma le notazioni matematiche per queste sono differenti e nuove, e così scriviamo la legge in una forma poco conveniente per il calcolo, ma con notazioni che conosciamo ora. Il campo elettrico, E, è dato da E=

q 4⇡✏ 0

! 26 0 3 0 2 66 er + r d er 0 + 1 d er 0 777 . c dt r 02 64 r 02 c2 dt 2 75

(28.3)

Che cosa ci dicono i vari termini? Prendiamo il primo termine E=

q er 0 4⇡✏ 0 r 02

Questa è naturalmente la legge di Coulomb, che già conosciamo: q è la carica che produce il campo; er 0 è il vettore unitario nella direzione del punto P dove E è misurato, r è la distanza da P a q. Ma la legge di Coulomb è sbagliata. Le scoperte del diciannovesimo secolo dimostrarono che le influenze non possono viaggiare più veloci di una certa velocità fondamentale c, che ora noi chiamiamo velocità della luce. Non è corretto che il primo termine sia la legge di Coulomb, non soltanto perché non è possibile sapere dove la carica è ora, e a quale distanza è ora, ma anche perché l’unica cosa che può influenzare il

279

280

Capitolo 28 • Radiazione elettromagnetica

© 978-8808-22107-0

campo a un dato punto e a un dato tempo è il comportamento delle cariche nel passato. Quanto nel passato? Il ritardo di tempo, ossia il cosiddetto tempo ritardato, è il tempo impiegato per andare con velocità c dalla carica al punto del campo P. Il ritardo è r 0/c. Così per tener conto di questo ritardo temporale, mettiamo su r un piccolo apice, per indicare quanto era lontana q quando l’informazione che ora arriva in P ha lasciato q. Solo per un momento supponiamo che la carica trasporti luce, e che la luce possa soltanto arrivare in P con velocità c. Allora quando osserviamo q, non vediamo dove si trova ora, naturalmente, ma dove era a un certo tempo precedente. Quella che appare nella nostra formula è la direzione apparente er 0 – la direzione che aveva – la cosiddetta direzione ritardata – e alla distanza ritardata r 0. Ciò sarebbe pure abbastanza facile da capire, ma è sbagliato. Il tutto è molto più complicato. Vi sono molti più termini. Il termine successivo è come se la natura stesse cercando di tener conto che l’effetto è ritardato, se possiamo metterla tanto crudamente. Suggerisce che dovremmo calcolare il campo ritardato di Coulomb e aggiungervi una correzione, che è la rapidità di variazione per il ritardo temporale che usiamo. La natura sembra che stia tentando d’indovinare quello che sarà il campo al presente, prendendo la rapidità di variazione e moltiplicandola per il tempo ritardato. Ma non siamo ancora alla fine. Vi è un terzo termine – la derivata seconda, rispetto a t, del vettore unitario nella direzione della carica. Ora la formula è completa, e questo è tutto quello che contribuisce a un campo elettrico prodotto da una carica che si muove arbitrariamente. Il campo magnetico è dato da B = er 0 ⇥

E c

(28.4)

Abbiamo annotato queste equazioni soltanto allo scopo di mostrare la bellezza della natura, o in un certo senso, il potere della matematica. Non pretendiamo di capire perché sia possibile scrivere così tanto in un così breve spazio, ma la (28.3) e la (28.4) contengono il meccanismo con cui funzionano i generatori elettrici, come opera la luce, tutti i fenomeni dell’elettricità e del magnetismo. Naturalmente, per completare il racconto abbiamo anche bisogno di conoscere qualcosa sul comportamento dei materiali implicati – le proprietà della materia – che non sono descritte convenientemente dalla (28.3). Per concludere la nostra descrizione del mondo del diciannovesimo secolo, dobbiamo ricordare un’altra grande sintesi che accadde in quel secolo, una sintesi con la quale ha avuto moltissimo a che fare anche Maxwell, e che fu la sintesi dei fenomeni del calore e della meccanica. Studieremo presto questo argomento. Quello che doveva essere aggiunto nel ventesimo secolo era che le leggi della dinamica di Newton furono trovate tutte sbagliate, e per correggerle doveva essere introdotta la meccanica quantistica. Le leggi di Newton sono approssimativamente valide quando la scala delle cose è sufficientemente grande. Le leggi della meccanica quantistica, combinate alle leggi dell’elettricità, sono state unite soltanto recentemente per formare un insieme di leggi chiamate elettrodinamica quantistica. In più, furono scoperti numerosi nuovi fenomeni, il primo dei quali fu la radioattività, scoperta da Becquerel nel 1898, proprio sul finire del diciannovesimo secolo. Questo fenomeno della radioattività fu investigato per sviluppare la nostra conoscenza del nucleo e di nuovi tipi di forze che non sono né gravitazionali né elettriche, ma nuove particelle con interazioni diverse, argomento che non è stato ancora chiarito. Per quei puristi che ne sanno di più (i professori ai quali capita di leggere questo), dovremmo aggiungere che quando diciamo che la (28.3) è una completa espressione della conoscenza dell’elettrodinamica, non siamo del tutto precisi. C’era un problema che non era del tutto risolto alla fine del diciannovesimo secolo. Quando proviamo a calcolare il campo prodotto da tutte le cariche includendo la stessa carica sulla quale vogliamo che il campo agisca, ci troviamo nei pasticci cercando di trovare la distanza, per esempio di una carica da se stessa, e dividendo qualcosa per tale distanza, che è zero. Il problema di come trattare la parte di questo campo che è generato dalla stessa carica su cui vogliamo che il campo agisca non è oggi ancora risolto. Così lo abbandoniamo; non abbiamo ancora una soluzione completa di tale rompicapo, e così eviteremo il rompicapo fino a quando potremo.

28.2 • Radiazione

© 978-8808-22107-0

28.2

Radiazione

Questo è, dunque, un sommario della rappresentazione dell’universo. Usiamolo ora per discutere i fenomeni chiamati radiazione. Per discutere questi fenomeni dobbiamo isolare nell’equazione (28.3) soltanto la parte che varia inversamente alla distanza e non al quadrato della distanza. Risulta che quando finalmente troviamo tale parte, essa è tanto semplice nella sua forma che è legittimo studiare l’ottica e l’elettrodinamica in modo elementare prendendola come «la legge» del campo elettrico prodotto a distanza da una carica in movimento. La prenderemo temporaneamente come una legge, dato che la impareremo in dettaglio il prossimo anno. Dei termini che compaiono nella (28.3) il primo va evidentemente inversamente al quadrato della distanza, e il secondo è soltanto una correzione per il ritardo, così è facile dimostrare che entrambi variano inversamente al quadrato della distanza. Tutti gli effetti ai quali siamo interessati provengono dal terzo termine, che non è molto complicato, dopotutto. Ciò che questo termine dice è: osservate la carica e notate la direzione del vettore unitario (possiamo proiettare la sua estremità sulla superficie di una sfera unitaria). Quando la carica si muove, il vettore unitario oscilla, e l’accelerazione di tale vettore unitario è ciò che stiamo cercando. Questo è tutto. Quindi E=

q d2 e r 0 4⇡✏ 0 c2 dt 2

(28.5)

è un enunciato delle leggi di radiazione, perché questo è l’unico termine importante quando andiamo lontano quanto basta perché i campi varino inversamente alla distanza. (Le parti che vanno come il quadrato sono talmente diminuite che non siamo interessati a loro.) Ora possiamo avanzare un po’ di più nello studio della (28.5) per vedere che cosa significa. Supponiamo che una carica si stia muovendo in un modo qualsiasi, e che la stiamo osservando da una certa distanza. Immaginiamo per un momento che in un certo senso essa sia «illuminata» (benché sia la luce che stiamo cercando di spiegare); immaginiamola come un piccolo punto bianco. Allora vedremmo questo punto bianco che si muove. Ma non vediamo esattamente come si sta muovendo proprio ora, a causa del ritardo di cui abbiamo parlato. Quello che conta è come si stava muovendo prima. Il vettore unitario er 0 è diretto verso la posizione apparente della carica. Naturalmente, l’estremo di er 0 si muove su una leggera curva, in modo che la sua accelerazione ha due componenti. Una è la parte trasversale, perché la sua estremità va su e giù, e l’altra è la parte radiale perché esso si mantiene su una sfera. È facile dimostrare che la seconda è molto più piccola e varia come l’inverso del quadrato di r quando r è molto grande. Questo è facile da vedere, perché quando immaginiamo di muovere una data sorgente sempre più lontano, allora le oscillazioni di er 0 appaiono sempre più piccole, inversamente alla distanza, ma la componente radiale dell’accelerazione sta variando molto più rapidamente che inversamente alla distanza. Così, per fini pratici, tutto quello che dobbiamo fare è proiettare il moto su un piano a distanza unitaria. Quindi troviamo la seguente regola: immaginiamo di osservare una carica in movimento e che ogni cosa che vediamo sia ritardata – come un pittore che cerca di dipingere una scena su uno schermo a distanza unitaria. Un vero pittore, naturalmente, non tiene conto del fatto che la luce sta andando a una certa velocità, ma dipinge il mondo come lo vede. Vogliamo vedere che aspetto avrebbe il suo quadro. Così vediamo un punto, rappresentante la carica, che si muove sul quadro. L’accelerazione di quel punto è proporzionale al campo elettrico. Questo è tutto – tutto ciò che ci serve. Così l’equazione (28.5) è la formula completa e corretta per la legge di radiazione; anche gli effetti della relatività sono tutti contenuti in essa. Però spesso vogliamo applicarla a una circostanza ancora più semplice in cui le cariche si spostano soltanto di una piccola distanza, a una velocità relativamente ridotta. Dato che esse stanno muovendosi lentamente, non percorrono una distanza apprezzabile dal punto in cui sono partite, cosicché il ritardo nel tempo è praticamente costante. Allora la legge è ancora più semplice, poiché il tempo di ritardo è fisso. Così immaginiamo che la carica stia eseguendo un moto minimo a una distanza effettivamente costante. Il ritardo alla distanza r è r/c. Allora la nostra regola diviene la seguente: se l’oggetto carico è in movimento con moto piccolissimo ed è spostato lateralmente di una distanza x(t), allora l’angolo di cui è spostato

281

282

Capitolo 28 • Radiazione elettromagnetica

© 978-8808-22107-0

il vettore unitario er 0 , è x/r e, poiché r è praticamente costante, la componente x di d2 er 0 /dt 2 è semplicemente l’accelerazione dello stesso x a un tempo antecedente, e così finalmente abbiamo la legge che vogliamo, che è q Ex (t) = a x (t r/c) (28.6) 4⇡✏ 0 c2 r Soltanto la componente di a x perpendicolare alla linea di visione è importante. Vediamo perché è così. Evidentemente, se la carica si sta avvicinando o allontanando in linea retta rispetto a noi, il vettore unitario in quella direzione non oscilla affatto, e non ha accelerazione. Così è soltanto il moto trasversale che è importante, soltanto l’accelerazione che vediamo proiettata sullo schermo.

28.3

Il radiatore a dipolo

Come nostra «legge» fondamentale della radiazione elettromagnetica, supporremo che la (28.6) sia vera, cioè che il campo elettrico prodotto da una carica in accelerazione che si sta muovendo non relativisticamente a una distanza grandissima r tenda a tale forma. Il campo elettrico varia inversamente a r ed è proporzionale all’accelerazione della carica, proiettata sul «piano di visione», e questa accelerazione non è l’accelerazione del momento, ma l’accelerazione che essa aveva a un tempo precedente, essendo l’entità del ritardo un tempo r/c. In quello che resta di questo capitolo discuteremo questa legge in modo da poterla capire meglio fisicamente, dato che stiamo per usarla per spiegare tutti i fenomeni della luce e della propagazione radio, quali riflessione, rifrazione, interferenza, diffrazione e diffusione. È la legge centrale, ed è tutto quello che ci occorre. Tutto il resto dell’equazione (28.3) fu annotato soltanto per porre la base, così che potessimo comprendere dove si adatta la (28.6) e come nasce. Discuteremo ulteriormente la (28.3) nel prossimo anno. Nel frattempo l’accetteremo per vera, ma non semplicemente su una base teorica. Possiamo escogitare diversi esperimenti che illustrano il carattere della legge. Per fare questo, abbiamo bisogno di una carica che accelera. Dovrebbe essere una singola carica, ma se possiamo fare muovere insieme parecchie cariche, tutte allo stesso modo, sappiamo che il campo sarà la somma degli effetti di ciascuna delle singole cariche; semplicemente li sommiamo. Come esempio consideriamo due pezzi di filo collegati a un generatore, come mostrato nella FIGURA 28.1. L’idea è che il generatore crea una diffeA renza di potenziale, ossia un campo che allontana dalla parte A gli elettroni e li spinge in B a un certo momento, e poi, in un tempo infinitesimamente successivo, capovolge l’effetto e tira via gli elettroni da B e li pompa indietro verso A! Così in questi due fili le cariche, diciamo, accelerano verso B Generatore l’alto nel filo A e verso l’alto nel filo B in un istante, e in un istante successivo accelerano verso il basso nel filo A e verso il basso nel filo B. Il fatto che abbiamo bisogno di due fili e di un generatore è semplicemente dovuto FIGURA 28.1 Un generatore di segnali ad alta frequenza spinge le cariche su e giù lungo due fili. al fatto che questo è un modo di farlo. Il risultato netto è che abbiamo semplicemente una carica che accelera su e giù come se A e B fossero un singolo filo. Un filo che è molto corto rispetto alla distanza che la luce percorre in un periodo di oscillazione è detto oscillatore a dipolo elettrico. Così abbiamo la circostanza di cui avevamo bisogno per applicare la nostra legge, che ci dice che questa carica produce un campo elettrico, e così abbiamo bisogno di uno strumento per rivelare un campo elettrico, e lo strumento che abbiamo è la stessa cosa – una coppia di fili come A e B! Se un campo elettrico è applicato a un dispositivo simile, produrrà una forza che tirerà gli elettroni su in entrambi i fili o giù in entrambi i fili. Questo segnale è rivelato per mezzo di un rettificatore montato fra A e B, e un filo molto sottile trasporta l’informazione all’interno di un amplificatore, dove viene amplificata in modo che possiamo sentire il tono di audiofrequenza con il quale la radiofrequenza è modulata. Quando questa sonda percepisce un campo elettrico, vi sarà un forte rumore proveniente dall’altoparlante, e quando non vi è campo elettrico che la comanda non vi sarà rumore.

28.4 • Interferenza

© 978-8808-22107-0

283

Dato che la stanza in cui stiamo misurando le onde contiene altri oggetti, il nostro campo elettrico muoverà gli elettroni in questi altri oggetti; 3 il campo elettrico fa andare su e giù queste altre cariche, e andando su e giù, anche queste producono un effetto sulla nostra sonda. Così perché l’esperimento abbia successo dobbiamo mantenere le cose abbastanza vicine, 2 in modo che le influenze dalle pareti e da noi stessi – le onde riflesse – siano relativamente piccole. Quindi non risulterà che il fenomeno appaia 1 perfettamente e precisamente in accordo con l’equazione (28.6), ma sarà G r sufficientemente vicino da fare apprezzare la legge. D Ora accendiamo il generatore e sentiamo il segnale audio. Troviamo un forte campo quando il rivelatore D è parallelo al generatore G nel punto 1 (FIGURA 28.2).Troviamo lo stesso valore del campo a qualsiasi angolo azimutale attorno all’asse G, poiché non ha effetti direzionali. D’altra parte quando il rivelatore è in 3 il campo è zero. Questo è giusto, perché la nostra formula si riferisce al campo per il quale l’accelerazione della carica è proiettata perpendicolarmente alla linea di visione. Quindi, quando guardiamo FIGURA 28.2 Campo elettrico istantaneo giù verso G la carica è in movimento allontanandosi e avvicinandosi a D, su una sfera con il centro in una carica localizzata e non vi è effetto. Questo verifica la prima regola, cioè che non vi è effetto oscillante linearmente. quando la carica è in movimento diretta verso di noi. In secondo luogo, la formula dice che il campo elettrico dovrebbe essere perpendicolare a r e nel piano di G e r; così se poniamo D in 1, ma lo ruotiamo di 90°, non dovremmo ottenere segnale. E questo è proprio quello che troviamo; il campo elettrico è infatti verticale e non orizzontale. Quando muoviamo D portandolo a qualche angolo intermedio, vediamo che il segnale più intenso capita quando esso è orientato come mostrato, poiché, benché G sia verticale, esso non produce un campo che è semplicemente parallelo a se stesso: è la proiezione dell’accelerazione perpendicolare alla linea di visione che conta. Il segnale è più debole in 2 che in 1 per effetto della proiezione.

28.4

Interferenza

In seguito possiamo verificare ciò che accade quando abbiamo due sorgenti fianco a fianco a pochi centimetri l’una dall’altra (FIGURA 28.3). La legge è che le due sorgenti dovrebbero sommare i loro effetti nel punto 1; quando entrambe le sorgenti sono collegate allo stesso generatore e sono entrambe in movimento su e giù allo stesso modo, cosicché il campo elettrico totale è la somma dei due campi ed è due volte più intenso di come era prima. Interviene ora una possibilità interessante. Supponiamo di far accelerare entrambe le cariche in S1 e S2 su e giù, ma di ritardare la cadenza di S2 in modo che esse risultino sfasate di 180°. Allora il campo prodotto da S1 sarà in un verso e il campo prodotto da S2 sarà nel verso opposto a qualsiasi istante, e quindi non dovremmo ottenere alcun effetto nel punto 1. La fase di oscillazione è accuratamente regolabile per mezzo di un cavo che trasporta il segnale a S2 . Cambiando la ∆

S1 2

D

D

1

S2

R 1

28.3 Illustrazione dell’interferenza di sorgenti. FIGURA

2 3

S1

D Vista dall’alto

S2

28.4 Illustrazione del carattere vettoriale della combinazione delle sorgenti. FIGURA

284

Capitolo 28 • Radiazione elettromagnetica

© 978-8808-22107-0

lunghezza di questo cavo, cambiamo il tempo impiegato dal segnale per arrivare in S2 e così cambiamo la fase di quell’oscillazione. Regolando questa lunghezza, possiamo infatti trovare un punto in cui non è rimasto più segnale, a dispetto del fatto che S1 e S2 sono in movimento! Il fatto che esse sono entrambe in movimento può essere provato, perché se ne eliminiamo una, possiamo vedere il moto dell’altra. Così entrambe insieme possono produrre zero se ogni cosa è regolata in modo corretto. Ora è molto interessante dimostrare che la somma di due campi è in effetti una somma vettoriale. L’abbiamo appunto verificato per un moto in su e uno in giù, ma verifichiamolo per due direzioni non parallele. In primo luogo riportiamo S1 e S2 alla stessa fase; cioè, esse si muovono di nuovo insieme. Ma ora ruotiamo S1 di 90°, come mostrato in FIGURA 28.4. Dovremmo ora avere nel punto 1 la somma dei due effetti, uno dei quali è verticale e l’altro orizzontale. Il campo elettrico è la somma vettoriale di questi due segnali in fase – essi sono entrambi forti nello stesso momento e passano insieme per zero; il campo totale dovrebbe essere un segnale R a 45°. Se giriamo D per ottenere il massimo rumore, dovrebbe essere attorno ai 45° e non verticale. E se lo ruotiamo perpendicolarmente a tale direzione, dovremmo ottenere zero, che è facile da misurare. Infatti, osserviamo proprio un comportamento del genere! Ora, che cosa si può dire sul ritardo? Come possiamo dimostrare che il segnale è ritardato? Potremmo, con un gran numero di apparecchi, misurare il tempo a cui arriva, ma vi è un altro modo molto semplice. Riferendoci ancora alla FIGURA 28.3, supponiamo che S1 e S2 siano in fase. Esse stanno entrambe oscillando insieme, e producono campi elettrici uguali nel punto 1. Ma supponiamo di andare a un certo punto 2 che è più vicino a S2 e più lontano da S1 . Allora, secondo il principio che l’accelerazione dovrebbe essere ritardata di una quantità uguale a r/c, se i ritardi non sono uguali, i segnali non sono più in fase. In questo modo dovrebbe essere possibile trovare una posizione nella quale le distanze di D da S1 e da S2 differiscano di una certa quantità , in modo tale che non vi sia segnale risultante. Cioè la distanza deve essere la distanza che l’onda percorre in una mezza oscillazione del generatore. Possiamo andare oltre, e trovare un punto in cui la differenza è maggiore di un intero ciclo, vale a dire, il segnale della prima antenna raggiunge il punto 3 con un ritardo nel tempo che è maggiore di quello del segnale della seconda antenna, proprio dell’intervallo di tempo impiegato dalla corrente elettrica per oscillare una volta, e quindi i due campi elettrici prodotti in 3 sono di nuovo in fase. Nel punto 3 il segnale è di nuovo forte. Questo completa la nostra discussione della verifica sperimentale di alcune delle caratteristiche importanti dell’equazione (28.6). Naturalmente, non abbiamo in realtà verificato la variazione 1/r dell’intensità del campo elettrico, o il fatto che vi è anche un campo magnetico che accompagna il campo elettrico. Il far questo richiederebbe tecniche piuttosto raffinate e a questo punto difficilmente aumenterebbe la nostra comprensione. In ogni caso, abbiamo verificato quelle caratteristiche che sono della massima importanza per le nostre applicazioni successive, e ritorneremo a studiare alcune delle altre proprietà delle onde elettromagnetiche il prossimo anno.

29

Interferenza

29.1

Onde elettromagnetiche

In questo capitolo discuteremo l’argomento del capitolo precedente in modo più matematico. Abbiamo dimostrato qualitativamente che vi sono massimi e minimi nel campo di radiazione originato da due sorgenti, e il nostro problema ora è di descrivere il campo nei dettagli matematici, non soltanto qualitativamente. Abbiamo già analizzato fisicamente il significato della formula (28.6) in modo del tutto soddisfacente, ma vi sono alcuni punti da trattare matematicamente. In primo luogo, se una carica è accelerata su e giù lungo a' una linea, in un moto la cui ampiezza è molto piccola, il campo a un certo angolo ✓ dall’asse del moto è in una direzione perpendicolare alla linea di visione e in un piano contenente sia l’accelerazione sia la linea di visione (FIGURA 29.1). Se la distanza è chiamata r, allora al tempo t il campo elettrico ha intensità E(t) =

qa(t r/c) sen ✓ 4⇡✏ 0 c2 r

r

E

(29.1) FIGURA

29.1

Il campo elettrico E dovuto a una carica

dove a(t r/c) è l’accelerazione al tempo (t r/c), detta accelerazione positiva la cui accelerazione ritardata è a0 . ritardata. Ora sarebbe interessante tracciare una rappresentazione del campo sotto diverse condizioni. La cosa che è interessante, naturalmente, è il fattore a(t r/c) e, per capirlo, possiamo prendere il caso più semplice, ✓ = 90°, e tracciare graficamente il campo. Quello che stavamo pensando prima era di trovarci in una posizione e di chiederci come il campo elettrico variasse in quel punto col tempo. Invece di far questo, ora vedremo come appare il campo elettrico in diverse posizioni nello spazio a un dato istante. Quello che vogliamo è una fotografia «istantanea» che ci dica qual è il campo nei diversi punti. Naturalmente esso dipende dall’accelerazione della carica. Supponiamo che la carica all’inizio abbia un certo moto particolare: era inizialmente ferma e improvvisamente ha accelerato in qualche modo, come mostrato in FIGURA 29.2, e poi si è fermata. Poi, un attimo più tardi, misuriamo il campo in un punto diverso. Possiamo allora asserire che il campo apparirà come mostrato in FIGURA 29.3. A ogni punto il campo è determinato dall’accelerazione della carica in un tempo precedente, precedente di una quantità pari al ritardo r/c. Il campo in punti via via più lontani è determinato dall’accelerazione in tempi via via anteriori. Così la curva in FIGURA 29.3 è in realtà, in un certo senso, un diagramma «invertito» dell’accelerazione in funzione del tempo; la distanza è collegata al tempo da un fattore di scala costante c, che spesso prendiamo come unità. Questo si vede facilmente considerando il comportamento matematico di a(t r/c). Evidentemente, se sommiamo un piccolo intervallo di tempo t, otteniamo lo stesso valore per a(t r/c) che avremmo se avessimo sottratto una piccola distanza: r = c t. Enunciato in un altro modo: se sommiamo un piccolo intervallo di tempo t, possiamo restituire a(t r/c) al suo precedente valore aggiungendo una piccola distanza r = c t. Cioè, al trascorrere del tempo, il campo si muove come un’onda dalla sorgente verso l’esterno. Questa è la ragione per cui talvolta diciamo che la luce si propaga per onde. Ciò equivale a dire che il campo è ritardato, ossia a dire che il campo elettrico si muove verso l’esterno al passare del tempo.

Capitolo 29 • Interferenza

286 FIGURA

© 978-8808-22107-0

29.2

L’accelerazione di una data carica in funzione del tempo.

29.3 Il campo elettrico in funzione della posizione a un tempo successivo. (La variazione 1/r è ignorata.)

E

a

t

FIGURA

r

Un interessante caso particolare è quello in cui la carica q si muove su e giù con moto oscillatorio. Il caso che abbiamo studiato sperimentalmente nel capitolo precedente era il caso in cui lo spostamento x a qualsiasi tempo t era uguale a una certa costante x 0 , l’ampiezza dell’oscillazione, per cos(!t). In questo caso l’accelerazione è a = !2 x 0 cos(!t) = a0 cos(!t)

(29.2)

!2 x 0 . Introducendo questa formula nella (29.1), ⇥ ⇤ a0 cos !(t r/c) E = q sen ✓ (29.3) 4⇡✏ 0 rc2

dove a0 è il massimo dell’accelerazione, troviamo

Ora, ignorando l’angolo ✓ e i fattori costanti, vediamo che aspetto ha come funzione della posizione o come funzione del tempo.

29.2

Energia della radiazione

Prima di tutto, in qualsiasi particolare momento o in qualsiasi punto particolare, l’intensità del campo varia inversamente alla distanza r, come abbiamo accennato precedentemente. Ora dobbiamo mettere in rilievo che il contenuto di energia di un’onda, ossia gli effetti energetici che un tale campo elettrico può avere, sono proporzionali al quadrato del campo, perché, se per esempio, abbiamo un certo tipo di carica o un oscillatore nel campo elettrico, allora, se facciamo agire il campo sull’oscillatore, esso lo fa muovere. Se questo è un oscillatore lineare, l’accelerazione, la velocità e lo spostamento prodotti dal campo elettrico agente sulla carica sono tutti proporzionali al campo. Così, l’energia cinetica che si manifesta nella carica è proporzionale al quadrato del campo. Quindi accetteremo il fatto che l’energia che il campo può cedere a un sistema sia proporzionale in qualche modo al quadrato del campo. Questo significa che l’energia che la sorgente può cedere diminuisce via via che ci allontaniamo; in realtà essa varia inversamente al quadrato della distanza. Ma questo ha un’interpretazione molto semplice: se volessimo raccogliere tutta l’energia possibile dall’onda in un certo cono a una distanza B r2 r 1 (FIGURA 29.4) e fare lo stesso a un’altra distanza r 2 , troveremmo che la A quantità d’energia per area unitaria in qualsiasi punto va inversamente al quadrato di r, ma l’area della superficie intercettata dal cono va direttamenC te come il quadrato di r. Quindi l’energia che possiamo ottenere dall’onda r1 B 1 entro un dato angolo conico è la stessa, comunque siamo lontani! In parA1 C1 ticolare, l’energia totale che potremmo ricavare dall’intera onda ponendo D oscillatori assorbenti tutt’intorno è una certa quantità fissa. D1 Il fatto che l’ampiezza di E varia come 1/r è lo stesso di dire che vi è un flusso di energia che non è mai perduto, un’energia che va e va, O estendendosi su un’area effettiva sempre più vasta. Perciò vediamo che dopo che una carica ha oscillato, essa ha perduto una certa energia che non FIGURA 29.4 L’energia che fluisce entro il cono può mai riprendere; l’energia continua ad andare sempre più lontano senza OABCD è indipendente dalla distanza r alla quale è diminuzione. Così se siamo sufficientemente lontani, in modo che la nostra misurata.

29.3 • Onde sinusoidali

© 978-8808-22107-0

approssimazione fondamentale sia abbastanza buona, la carica non può recuperare l’energia che è stata, come diciamo, irradiata. Naturalmente l’energia esiste ancora da qualche parte, ed è disponibile per essere raccolta da altri sistemi. Studieremo questa «perdita» d’energia più a fondo nel capitolo 32. Consideriamo ora più accuratamente come l’onda (29.3) vari in funzione del tempo in un dato punto, e in funzione della posizione a un dato tempo. Di nuovo ignoriamo la variazione 1/r e le costanti.

29.3

Onde sinusoidali

Per prima cosa fissiamo la posizione r, e osserviamo il campo in funzione del tempo. Esso è oscillatorio con frequenza angolare !. La frequenza angolare ! può essere definita come la rapidità di variazione della fase con il tempo (radianti al secondo). Abbiamo già studiato una cosa del genere, così ormai dovrebbe esserci del tutto familiare. Il periodo è il tempo necessario per un’oscillazione, un ciclo completo, e l’abbiamo pure calcolato; esso è 2⇡/!, poiché ! per il periodo è un ciclo del coseno. Introduciamo ora una nuova quantità che è usata moltissimo in fisica. Questa ha a che fare con la situazione opposta, in cui fissiamo t e osserviamo l’onda in funzione della distanza r. Naturalmente notiamo che, anche come funzione di r, l’onda (29.3) è oscillatoria. Cioè, a parte 1/r, che stiamo ignorando, vediamo che E oscilla quando cambiamo la posizione. Così, in analogia con !, possiamo definire una quantità detta il numero d’onde, indicata con il simbolo k. Questa è definita come la rapidità di variazione della fase con la distanza (radianti per metro). Cioè, quando ci muoviamo nello spazio a un tempo fisso, la fase cambia. Vi è un’altra quantità che corrisponde al periodo, e possiamo chiamarla periodo spaziale, ma è comunemente chiamata la lunghezza d’onda, e indicata col simbolo . La lunghezza d’onda è la distanza occupata da un ciclo completo. È facile vedere, allora, che la lunghezza d’onda è 2⇡/k, poiché k per la lunghezza d’onda darebbe il numero di radianti di cui l’intera cosa cambia, essendo il prodotto della rapidità di variazione dei radianti per metro, per il numero dei metri, e dobbiamo produrre una variazione di 2⇡ per ogni ciclo. Così k = 2⇡ è esattamente analogo a !t 0 = 2⇡. Ora nella nostra particolare onda vi è una relazione definita tra la frequenza e la lunghezza d’onda, ma le definizioni date sopra di k e ! sono in realtà del tutto generali. Cioè la lunghezza d’onda e la frequenza possono non essere collegate nello stesso modo in altre circostanze fisiche. Però, nella nostra circostanza la rapidità di variazione della fase con la distanza è facilmente determinata, poiché, se chiamiamo la fase ✓ r◆ =! t c e differenziamo (parzialmente) rispetto alla distanza r, la rapidità di variazione @ /@r, è @ ! =k= @r c

(29.4)

Vi sono molti modi di rappresentare la stessa cosa, quali = ct 0

(29.5)

! = ck

(29.6)

=c

(29.7)

! = 2⇡c

(29.8)

Perché la lunghezza d’onda è uguale a c per il periodo? Questo è molto facile, naturalmente, perché se non ci muoviamo e aspettiamo che trascorra un periodo, le onde, che si propagano

287

Capitolo 29 • Interferenza

288

© 978-8808-22107-0

alla velocità c, percorreranno una distanza ct 0 , e avranno naturalmente percorso appunto una lunghezza d’onda. In una situazione fisica diversa da quella della luce, k non è necessariamente collegato a ! in questo semplice modo. Se chiamiamo x la distanza lungo un asse, allora la formula per un’onda di tipo coseno che si muove in direzione x con un numero d’onda k e una frequenza angolare ! sarà scritta in generale come cos(!t k x). Ora che abbiamo introdotto l’idea di lunghezza d’onda, possiamo dire qualcosa di più attorno alle circostanze in cui la (29.1) è una formula legittima. Ricordiamo che il campo è fatto di diverse parti, una delle quali varia inversamente a r, un’ altra che varia inversamente a r 2 e altre che variano ancora più rapidamente. Varrebbe la pena di conoscere in quali circostanze la parte 1/r del campo è la parte più importante, mentre le altre parti sono relativamente piccole. Naturalmente, la risposta è «se andiamo ‘abbastanza lontano’», poiché i termini che variano inversamente al quadrato alla fine diventano trascurabili se paragonati con il termine 1/r. Che distanza è «abbastanza lontano»? La risposta è, qualitativamente, che gli altri termini siano più piccoli del termine 1/r di una quantità dell’ordine di /r. Così, fino a quando siamo al di là di alcune lunghezze d’onda, la (29.1) è un’eccellente approssimazione del campo. Talvolta la regione al di là di alcune lunghezze d’onda è detta «zona d’onda».

29.4

0 2

2

4

4

2

2 0

(a)

4 2

2

0

0

2

2 4

(b)

29.5 Le intensità nelle varie direzioni emesse da due oscillatori a dipolo distanti mezza lunghezza d’onda: (a) in fase (α = 0), (b) sfasati di mezzo periodo (α = π). FIGURA

Due radiatori a dipolo

Discutiamo ora la matematica coinvolta nel combinare gli effetti di due oscillatori per trovare il campo risultante in un dato punto. Questo è molto facile in alcuni casi che abbiamo considerato nel capitolo precedente. Descriveremo in primo luogo gli effetti qualitativamente, poi quantitativamente. Prendiamo il caso semplice in cui gli oscillatori siano situati con i loro centri nello stesso piano orizzontale del rivelatore, e la linea di vibrazione sia verticale. La FIGURA 29.5a mostra la vista dall’alto di due oscillatori del genere, e in questo particolare esempio essi sono alla distanza di mezza lunghezza d’onda in direzione nord-sud, e oscillano insieme con la stessa fase, che chiamiamo fase zero. Ora, vorremmo conoscere l’intensità della radiazione nelle varie direzioni. Per intensità intendiamo la quantità di energia che il campo trasporta al di là di noi per secondo, quantità proporzionale al quadrato del campo, mediato nel tempo. Così la cosa da osservare, quando vogliamo sapere quanto intensa sia la luce, è il quadrato del campo elettrico, non il campo elettrico stesso. (Il campo elettrico ci dice l’intensità della forza percepita da una carica stazionaria, ma la quantità d’energia che sta passando, in watt per metri quadrati, è proporzionale al quadrato del campo elettrico. Deriveremo la costante di proporzionalità nel prossimo capitolo.) Se osserviamo l’apparato dal lato ovest, entrambi gli oscillatori contribuiscono ugualmente e in fase, così il campo elettrico è due volte più intenso di quello che sarebbe per un singolo oscillatore. Quindi l’intensità è quattro volte quella che vi sarebbe se vi fosse soltanto un oscillatore. (I numeri nella FIGURA 29.5 rappresentano quale sarebbe l’intensità in questo caso, confrontata con quella che vi sarebbe se vi fosse soltanto un singolo oscillatore di potenza unitaria.) Ora, in entrambe le direzioni nord e sud lungo la linea degli oscillatori, poiché essi sono distanti mezza lunghezza d’onda, l’effetto di un oscillatore risulta essere sfasato rispetto all’altro esattamente di mezza oscillazione, e quindi i campi si annullano. A un certo particolare angolo intermedio (in realtà a 30°) l’intensità è 2, e decresce, 4, 2, 0 e via di seguito. Dobbiamo imparare come trovare questi numeri per altri angoli. È questione di sommare due oscillazioni con fasi diverse. Osserviamo rapidamente alcuni altri casi interessanti. Supponiamo che gli oscillatori siano ancora distanti mezza lunghezza d’onda, ma la fase di uno è messa mezzo periodo indietro rispetto all’altro nella sua oscillazione (FIGURA 29.5b). Nella direzione ovest l’intensità è ora zero, poiché un oscillatore «spinge» quando l’altro «tira». Ma nella direzione nord il segnale dall’oscillatore vicino giunge a un certo tempo e il segnale dell’altro oscillatore arriva mezzo periodo più tardi. Ma quest’ultimo era originariamente mezzo periodo indietro nel tempo, e quindi è ora esattamente

© 978-8808-22107-0

29.4 • Due radiatori a dipolo

sincronizzato con il primo, e così l’intensità in questa direzione è di 4 unità. L’intensità nella direzione a 30° è ancora 2, come possiamo provare più avanti. Arriviamo ora a un caso interessante, che ci rivela una caratteristica eventualmente utile. Osserviamo che una delle ragioni per cui le relazioni di fase degli oscillatori sono interessanti riguarda i trasmettitori radio direzionali. Per esempio, se costruiamo un sistema di antenne e vogliamo inviare un segnale radio, diciamo, alle Hawaii, sistemiamo le antenne come in FIGURA 29.5a e trasmettiamo con le nostre due antenne in fase, poiché le Hawaii sono a ovest rispetto a noi. Poi decidiamo che domani trasmetteremo verso Alberta, nel Canada. Poiché quella è a nord, non a ovest, tutto quello che dobbiamo fare è invertire la fase di una delle nostre antenne, e potremo trasmettere a nord. Così possiamo costruire sistemi di antenne con varie possibilità. Quella da noi scelta è una delle più semplici possibili; possiamo farlo molto più complicato, e cambiando le fasi nelle varie antenne possiamo inviare i fasci nelle varie direzioni e inviare la maggior parte della potenza nella direzione nella quale vogliamo trasmettere, senza mai muovere l’antenna! In entrambi i precedenti casi, però, mentre stiamo trasmettendo verso Alberta stiamo sciupando una certa quantità di potenza su Easter Island(1) , e sarebbe interessante chiederci se è possibile inviarla in un verso soltanto. A prima vista possiamo pensare che con una coppia di antenne di questo tipo il risultato sarà sempre simmetrico. Consideriamo un caso che risulta asimmetrico, per mostrare la possibile varietà. Se le antenne sono distanti un quarto di lunghezza d’onda e se quella a nord è indietro nel tempo di un quarto di periodo rispetto a quella a sud, che cosa accade allora (FIGURA 29.6)? In direzione ovest otteniamo 2, come vedremo in seguito. Nella direzione sud otteniamo zero, perché il segnale dell’antenna a sud arriva a un certo tempo; quello dell’antenna a nord arriva 90° più tardi nel tempo, ma è già di 90° indietro nella sua propria fase, quindi arriva, complessivamente sfasato di 180°, e non vi è effetto. D’altra parte nella direzione nord, il segnale nord arriva prima del segnale sud di 90° in tempo, dato che è più vicino di un quarto di lunghezza d’onda. Ma la sua fase è aggiustata in modo che oscilli 90° indietro rispetto al tempo, il che compensa esattamente la differenza per il ritardo, e quindi i due segnali appaiono insieme in fase, rendendo l’intensità del campo doppia e l’energia quattro volte più grande. Così usando un po’ di abilità nel distanziare e nel mettere in fase le nostre antenne, possiamo inviare tutta la potenza in un verso. Ma essa è ancora distribuita su un grande intervallo angolare. Possiamo sistemare le cose in modo che essa sia concentrata ancora più nettamente in una direzione particolare? Consideriamo di nuovo il caso delle Hawaii, dove stiamo inviando il fascio in direzione est-ovest, ma esso è sparso su un bell’angolo, perché anche a 30° otteniamo metà dell’intensità – stiamo sprecando potenza. Possiamo far meglio? Prendiamo una situazione in cui la distanza fra le antenne è di dieci lunghezze d’onda (FIGURA 29.7), che è molto più strettamente paragonabile alla situazione nella quale abbiamo condotto gli esperimenti nel capitolo precedente, con una distanza di diverse lunghezze d’onda anziché una piccola frazione di una lunghezza d’onda. Qui la rappresentazione è del tutto diversa. Se gli oscillatori sono distanti 10 (prendiamo il caso in fase, per renderlo più facile), vediamo che nella direzione est-ovest, essi sono in fase, e otteniamo una forte intensità, quattro volte quella che avremmo ottenuto se vi fosse stato solo uno di essi. D’altra parte, spostandosi di un piccolissimo angolo i tempi d’arrivo differiscono di 180° e l’intensità è zero. Per essere precisi, se tracciamo una linea da ciascun oscillatore a un punto distante e la differenza fra le due distanze è /2, una mezza oscillazione, allora essi saranno sfasati. Così questo primo zero capita quando questo accade. (La figura non è in scala; è soltanto uno schizzo approssimativo.) Ciò significa che noi abbiamo veramente un fascio molto netto nella direzione voluta, perché se ci muoviamo appena perdiamo tutta la nostra intensità. Sfortunatamente per gli scopi pratici, se pensassimo di costruire un apparato radio trasmittente e raddoppiassimo la distanza , allora ci troveremmo sfasati di un intero ciclo, che è lo stesso che essere di nuovo esattamente in fase! Così otteniamo molti massimi e minimi successivi, proprio come abbiamo trovato nel capitolo 28 con la distanza di 2,5 . Come possiamo sbarazzarci di tutti questi massimi in più, o «lobi», come sono chiamati?

(1)

Isola del Pacifico, pressappoco a sud di Los Angeles. (N.d.T.)

289

4

2

2

0

29.6 Una coppia di antenne a dipolo che dà la massima potenza in una direzione. FIGURA

290

Capitolo 29 • Interferenza

© 978-8808-22107-0

29.7 Andamento dell’intensità per due dipoli distanti 10 λ. FIGURA

6 5 4 3 2 1

29.8 Un’antenna a sei dipoli e parte dell’andamento dell’intensità. FIGURA

a un punto distante



I

30°

Potremmo liberarci dei lobi non desiderati in un modo piuttosto interessante. Supponiamo di sistemare un altro gruppo di antenne fra le due che già abbiamo. Cioè le antenne esterne distano ancora 10 , ma fra esse, diciamo ogni 2 , abbiamo posto un’altra antenna, e le mettiamo tutte in fase (FIGURA 29.8). Vi sono ora sei antenne, e se osservassimo l’intensità in direzione est-ovest, dovrebbe, naturalmente, essere molto maggiore con sei antenne che con una. Il campo sarebbe sei volte superiore e l’intensità trentasei volte maggiore (il quadrato del campo). Otteniamo trentasei unità di intensità in quella direzione. Ora, se osserviamo i punti vicini troviamo uno zero come prima, approssimativamente, ma se andiamo oltre, dove eravamo soliti ottenere un «picco» notevole, otteniamo ora un «picco» molto più piccolo. Cerchiamo di vedere il perché. La ragione è che, benché possiamo aspettarci di ottenere un grande picco quando la distanza è esattamente uguale alla lunghezza d’onda, è vero che i dipoli 1 e 6 sono allora in fase e cooperano nel cercare di ottenere una certa intensità in tale direzione, ma i dipoli 3 e 4 sono all’incirca sfasati di mezza lunghezza d’onda rispetto a 1 e 6 e, benché 1 e 6 spingano insieme, anche 3 e 4 spingono insieme, ma in fase opposta. Quindi vi è una piccolissima intensità in questa direzione – ma vi è qualcosa; esse non si equilibrano esattamente. Questa situazione si ripete; otteniamo piccolissimi picchi, e abbiamo il fascio intenso nella direzione voluta. Ma in questo particolare esempio accadrà qualcos’altro: vale a dire, poiché la distanza fra successivi dipoli è 2 , è possibile trovare un angolo per il quale la distanza fra dipoli successivi è esattamente una lunghezza d’onda, in modo che gli effetti di tutti sono in fase di nuovo. Ciascuno è ritardato rispetto al seguente di 360°, così ritornano tutti in fase e abbiamo un altro fascio intenso in quella direzione! È facile evitare in pratica che questo accada perché è possibile porre i dipoli a una distanza minore di una lunghezza d’onda. Se si aggiungono antenne, a distanza l’una dall’altra inferiore a una lunghezza d’onda, allora questo non può accadere. Ma il fatto che questo può accadere per dati angoli, se la separazione è maggiore di una lunghezza d’onda, è un fenomeno molto utile e interessante in altre applicazioni – non nella trasmissione radio, ma nei reticoli di diffrazione.

29.5

La matematica dell’interferenza

Abbiamo concluso l’analisi qualitativa dei fenomeni dei radiatori a dipolo, e dobbiamo imparare ad analizzarli quantitativamente. Per trovare l’effetto di due sorgenti a un dato angolo particolare nel caso più generale, quando i due oscillatori hanno una certa fase intrinseca relativa ↵ l’uno rispetto all’altro e le intensità A1 e A2 non sono uguali, troviamo che dobbiamo sommare due coseni aventi la stessa frequenza, ma fasi differenti. È molto facile trovare questa differenza di fase: essa è costituita da un ritardo dovuto alla differenza nella distanza e della fase intrinseca, incorporata nell’oscillazione. Matematicamente, dobbiamo trovare la somma R delle due onde: R = A1 cos (!t +

1)

+ A2 cos (!t +

2)

Come la eseguiamo? In realtà è molto facile, e pensiamo di sapere già come farla. Però dobbiamo sottolineare il procedimento con qualche dettaglio. Per prima cosa, possiamo, se siamo abili in matematica e ne sappiamo abbastanza di coseni e di seni, calcolarla semplicemente. Il caso del

29.5 • La matematica dell’interferenza

© 978-8808-22107-0

291

genere più semplice è quello in cui A1 e A2 sono uguali, diciamo che essi sono entrambi uguali ad A. In tali circostanze, per esempio (potremmo chiamare questo il metodo trigonometrico di risolvere il problema), abbiamo ⇥ ⇤ R = A cos(!t + 1 ) + cos(!t + 2 ) (29.9) In passato, nel corso di trigonometria, abbiamo probabilmente imparato la regola per cui ! ! A+ B A B cos A + cos B = 2 cos cos (29.10) 2 2

Se conosciamo questa regola, possiamo immediatamente scrivere R come ! ! 1 2 1 2 R = 2A cos cos !t + + 2 2 2

(29.11)

Così troviamo che abbiamo un’onda oscillatoria con una nuova fase e una nuova ampiezza. In generale, il risultato sarà un’onda oscillatoria con una nuova ampiezza AR , che possiamo chiamare ampiezza risultante, oscillante alla stessa frequenza ma con una diversa fase R , detta fase risultante. In vista di questo, il nostro caso particolare ha il seguente risultato: che l’ampiezza risultante è ! 1 2 (29.12) AR = 2A cos 2 e la fase risultante è la media delle due fasi, e abbiamo completamente risolto il nostro problema. Supponiamo ora di non ricordarci che la somma di due coseni è due volte il coseno della semisomma per il coseno della semidifferenza. Allora possiamo usare un altro metodo di analisi che è più geometrico. Qualsiasi funzione cos(!t) può essere considerata come la proiezione orizzontale di un vettore rotante. Supponete che vi sia un vettore A1 , di lunghezza A1 , in rotazione col tempo in modo che l’angolo che forma con l’asse orizzontale sia !t + 1 . (Trascureremo tra un momento !t e vedremo che non crea differenza.) Supponiamo di fare un’istantanea al tempo t = 0, benché in realtà l’immagine stia ruotando con velocità angolare ! (FIGURA 29.9). La proiezione di A1 sull’asse orizzontale è precisamente A1 cos(!t + 1 ). Ora a t = 0 la seconda onda potrebbe essere rappreseny tata da un altro vettore A2 , di lunghezza A2 e a un angolo 2 , anch’esso AR rotante. Essi ruotano entrambi con la stessa velocità angolare !, e quindi A2 le posizioni relative dei due sono fisse. Il sistema ruota come un corpo 2 A1 rigido. La proiezione orizzontale di A2 è A2 cos(!t + 2 ). Ma sappiamo dalla teoria dei vettori che se sommiamo i due vettori nel modo comune, x 1 R con la regola del parallelogramma, e tracciamo il vettore risultante A R , la componente x del risultante è la somma delle componenti x degli altri due vettori. Ciò risolve il nostro problema. È facile provare che questo dà il risultato corretto per il caso particolare che abbiamo trattato sopra, dove A1 = A2 = A. In questo caso, vediamo dalla FIGURA 29.9 che A R giace a FIGURA 29.9 Metodo geometrico per la combinazione di due onde di tipo coseno. metà fra A1 e A2 e forma con ciascuno di essi un angolo di ( 2 1 )/2. L’intero diagramma è pensato come rotante in verso Quindi vediamo che antiorario con frequenza angolare ω. ! AR = 2A cos

2

1

2 come prima. Inoltre, come vediamo dal triangolo, la fase di A R , quando ruota, è l’angolo medio fra quelli di A1 e A2 quando le due ampiezze sono uguali. Chiaramente possiamo anche risolvere il caso in cui le ampiezze non siano uguali, altrettanto facilmente. Possiamo chiamare questo il modo geometrico di risolvere il problema. Vi è ancora un altro modo di risolvere il problema, che è il metodo analitico. Cioè, invece di dover effettivamente fare un disegno come in FIGURA 29.9, possiamo scrivere qualcosa che dice la stessa cosa del disegno: invece di disegnare vettori, scriviamo un numero complesso per rappresentare ciascuno di essi. Le parti reali dei numeri complessi sono le vere quantità fisiche. Così nel nostro caso particolare le onde potrebbero essere scritte in questo modo: A1 ei(!t+

1)

e

A2 ei(!t+

2)

292

Capitolo 29 • Interferenza

© 978-8808-22107-0

le cui parti reali sono rispettivamente A1 cos (!t +

e

1)

A2 cos (!t +

2)

Ora possiamo sommare le due: R = A1 ei(!t+ ossia

1)

+ A2 ei(!t+

Rˆ = A1 ei

1

2)

⇣ = A1 ei

+ A2 ei

2

1

= AR ei

+ A2 ei

2



ei!t

(29.13) (29.14)

R

Questo risolve il problema, poiché rappresenta il risultato come un numero complesso di modulo AR e fase R . Per vedere come funziona questo metodo, troviamo l’ampiezza AR che è la «lunghezza» di ˆ Per ottenere la «lunghezza» di una quantità complessa moltiplichiamo sempre la quantità per R. il suo complesso coniugato, che dà la lunghezza al quadrato. Il complesso coniugato è la stessa espressione, ma con il segno degli i invertito. Così abbiamo ⇣ ⌘⇣ ⌘ A2R = A1 ei 1 + A2 ei 2 A1 e i 1 + A2 e i 2 (29.15) Moltiplicando questo otteniamo A21 + A22 (qui le e si elidono) e per i termini misti abbiamo f g A1 A2 ei( 1 2 ) + ei( 2 1 ) Ora

ei✓ + e

i✓

= cos ✓ + i sen ✓ + cos ✓

i sen ✓

vale a dire ei✓ + e

i✓

= 2 cos ✓

Il nostro risultato finale è quindi A2R = A21 + A22 + 2A1 A2 cos (

2

1)

(29.16)

Come vediamo, questo si accorda con la lunghezza di AR in FIGURA 29.9, ottenuta usando le regole della trigonometria. Così la somma dei due effetti ha l’intensità A21 che otterremmo con uno soltanto di essi, più l’intensità A22 che otterremmo con l’altro soltanto, più una correzione. Questa correzione la chiamiamo effetto di interferenza. Essa è in realtà soltanto la differenza fra quello che otteniamo semplicemente sommando le intensità e quello che in realtà accade. La chiamiamo interferenza sia che sia positiva oppure negativa. (Interferenza nel linguaggio comune suggerisce abitualmente opposizione o ostacolo, ma spesso in fisica non usiamo il linguaggio nel modo in cui era originariamente progettato!) Se il termine di interferenza è positivo, chiamiamo tale caso interferenza costruttiva, per quanto brutto possa suonare per chiunque non sia un fisico! Il caso opposto è chiamato interferenza distruttiva. Vediamo ora come applicare la nostra formula generale (29.16) al caso dei due oscillatori nelle particolari situazioni che abbiamo discusso qualitativamente. Per applicare questa formula generale, è soltanto necessario trovare quale differenza di fase 1 2 esiste fra i segnali che arrivano a un dato punto. (Dipende soltanto dalla differenza di fase, naturalmente, e non dalla fase stessa.) Così consideriamo al punto P i il caso in cui i due oscillatori, di uguale ampiezza, sono separati da una certa distanza d e hanno fase relativa intrinseca ↵. (Quando la fase di uno è d zero, la fase dell’altro è ↵.) Allora ci chiediamo quale sarà l’intensità in una certa direzione azimutale ✓ dalla linea est-ovest. [Notate che questo non è i lo stesso ✓ che appare nella (29.1). Siamo dibattuti fra l’usare un simbolo non convenzionale come U / o il simbolo convenzionale ✓ (FIGURA 29.10).] La relazione di fase si trova notando che la differenza in distanza da P ai FIGURA 29.10 Due oscillatori di uguale ampiezza, due oscillatori è d sen ✓, così che il contributo alla differenza di fase da con una differenza di fase fra di essi.

29.5 • La matematica dell’interferenza

© 978-8808-22107-0

questo è il numero delle lunghezze d’onda contenute in d sen ✓ moltiplicato per 2⇡. (I più raffinati potrebbero voler moltiplicare il numero d’onda k, che è la rapidità di variazione di fase con la distanza, per d sen ✓; è esattamente lo stesso.) La differenza di fase dovuta alla differenza di distanza è così 2⇡d sen ✓/ , ma vi è una fase addizionale ↵, dovuta alla cadenza degli oscillatori. Così la differenza di fase all’arrivo sarà 2

1

= ↵ + 2⇡d

sen ✓

(29.17)

Questo serve in tutti i casi. Così tutto quello che dobbiamo fare è sostituire questa espressione nella (29.16) per il caso A1 = A2 , e possiamo calcolare tutti i diversi risultati per due antenne di uguale intensità. Vediamo ora che cosa accade nei nostri diversi casi. La ragione per cui sappiamo, per esempio, che l’intensità è 2 a 30° in FIGURA 29.5 è la seguente: i due oscillatori distano /2, quindi a 30°, d sen ✓ = /4. Pertanto 2⇡ ⇡ = 2 1 = 4 2 e così il termine di interferenza è zero. (Stiamo sommando due vettori a 90°.) Il risultato è p l’ipotenusa di un triangolo rettangolo a 45°, che è 2 volte l’unità di ampiezza; elevandola al quadrato otteniamo due volte l’intensità di un solo oscillatore. Tutti gli altri casi possono essere calcolati in questo stesso modo.

293

30

Diffrazione

30.1

L’ampiezza risultante dovuta a n oscillatori uguali

Questo capitolo è una continuazione diretta del precedente, benché il nome sia stato cambiato da interferenza a diffrazione. Nessuno è mai stato capace di definire in modo soddisfacente la differenza tra interferenza e diffrazione. È soltanto una questione di uso e non vi è alcuna importante differenza fisica specifica fra di esse. Il meglio che possiamo fare, approssimativamente parlando, è dire che quando vi sono soltanto poche sorgenti, diciamo due, che interferiscono, allora il risultato è comunemente detto interferenza, ma se vi è un gran numero di sorgenti, sembra si usi più spesso la parola diffrazione. Così non ci preoccuperemo del fatto che si tratti di interferenza o diffrazione, ma continueremo direttamente da dove abbiamo interrotto a metà l’argomento nel capitolo precedente. Quindi, ora discuteremo la situazione in cui vi sono n oscillatori ugualmente distanziati, tutti di uguale ampiezza, ma di fase diversa, l’uno rispetto all’altro, sia perché guidati in fase differentemente, sia perché li stiamo osservando da un angolo tale che vi sia una differenza nel ritardo di tempo. Per una ragione o per l’altra, dobbiamo sommare qualcosa di simile a questo: ( ⇥ ⇤) R = A cos (!t) + cos !t + + cos !t + 2 + · · · + cos !t + (n 1) (30.1) dove è la differenza di fase tra un oscillatore e il successivo, visti in una direzione particolare. Specificamente sen ✓ = ↵ + 2⇡d

Ora dobbiamo sommare insieme tutti i termini. Lo faremo geometricamente. Il primo è di lunghezza A, e ha fase zero. Il seguente è ancora di lunghezza A e ha una fase uguale a . Quello dopo è ancora di lunghezza A e ha una fase uguale a 2 , e via di seguito. Stiamo evidentemente percorrendo il perimetro di un poligono equiangolare con n lati (FIGURA 30.1). I vertici, naturalmente, giacciono tutti su una circonferenza, e possiamo trovare molto facilmente l’ampiezza risultante se troviamo il raggio di tale circonferenza. Supponete che Q sia il centro del cerchio. Allora sappiamo che l’angolo OQS è proprio un angolo di fase . (Questo è perché il raggio QS sta rispetto ad A2 nella stessa relazione geometrica di QO rispetto ad A1 , così essi formano fra loro un angolo .) Quindi il raggio r deve essere tale che ✓ ◆ A = 2r sen 2 il che fissa r. Ma il grande angolo OQT è uguale a n , e così troviamo che ✓ ◆ AR = 2r sen n 2

Combinando questi due risultati per eliminare r, otteniamo ✓ ◆ sen n 2 AR = A ✓ ◆ sen 2

(30.2)

30.1 • L’ampiezza risultante dovuta a n oscillatori uguali

© 978-8808-22107-0

295

L’intensità risultante è pertanto y

sen2 I = I0



sen2



n 2 ✓ ◆

(30.3)

AR = 2A cos

A6

AR

r

A5

2

Q

Analizziamo ora questa espressione e studiamo qualcuna delle sue conseguenze. In primo luogo, possiamo controllarla per n = 1. Essa funziona: I = I0 . In seguito la controlliamo per n = 2: scrivendo ✓ ◆ ✓ ◆ sen = 2 sen cos 2 2

troviamo che

T

2

A4

f r A3

f O

✓ ◆

nf 2

M

FIGURA

A1

30.1

A2

S

L’ampiezza risultante di n = 6 sorgenti

che si accorda con la (29.12). ugualmente distanziate con differenze di fase Ora l’idea che ci ha condotto a considerare la somma di diverse sorgenti successive nette . è stata che forse si ottiene un’intensità molto più forte in una direzione piuttosto che in un’altra; che i massimi vicini che sarebbero stati presenti se vi fossero state soltanto due sorgenti forse si abbassano di intensità. Per vedere questo effetto tracciamo la curva che risulta dalla (30.3) facendo n enormemente grande e disegnando la regione vicina a = 0. In primo luogo se è esattamente 0 abbiamo 0/0, ma se è infinitesimo, il rapporto dei due seni al quadrato è semplicemente n2 , poiché il seno e l’angolo sono approssimativamente uguali. Così l’intensità del massimo della curva è uguale a n2 volte l’intensità di un oscillatore. Ciò è facile da vedere, perché se gli oscillatori sono tutti in fase, allora i piccoli vettori non formano alcun angolo uno rispetto all’altro e tutti gli n si sommano, cosicché l’ampiezza è n volte più grande, e l’intensità n2 volte maggiore. All’aumentare della fase il rapporto dei due seni comincia a diminuire e la prima volta che si annulla è quando n /2 = ⇡, perché sen ⇡ = 0. In altre parole, = 2⇡/n corrisponde al primo minimo della curva (FIGURA 30.2). Secondo quello che accade con le frecce in FIGURA 30.1, il primo minimo capita quando tutte le frecce ritornano al punto di partenza; questo significa che l’angolo totale accumulato in tutte le frecce, la differenza totale di fase tra il primo e l’ultimo oscillatore, deve essere 2⇡ per completare il cerchio. Passiamo ora al massimo seguente, e vediamo che in realtà è molto più piccolo del primo, come avevamo sperato. Non andremo esattamente nella posizione del massimo, dato che sia il numeratore sia il denominatore della (30.3) sono variabili, ma sen( /2) varia molto più lentamente rispetto a sen(n /2) quando n è grande, così quando sen2 (n /2) = 1 siamo molto vicini al massimo. Il massimo successivo di sen2 (n /2) capita a n /2 = 3⇡/2, ossia = 3⇡/n. Questo corrisponde al fatto che le frecce hanno percorso il cerchio una volta e mezzo. Introducendo nella formula = 3⇡/n per determinare l’ampiezza del massimo, troviamo che sen2 (3⇡/2) = 1 nel numeratore (perché è per questo motivo che abbiamo scelto questo angolo), e nel denominatore abbiamo sen2 (3⇡/2n). Ora, se n è sufficientemente grande, questo angolo è molto piccolo e il seno è uguale all’angolo; così per tutti gli scopi pratici, possiamo porre ! 3⇡ 3⇡ = sen 2n 2n Quindi troviamo che l’intensità a questo massimo è I = I0

x

4n2 9⇡ 2

Ma n2 I0 era la massima intensità, e così abbiamo 4/9⇡ 2 volte la massima intensità, che è circa 0,045, meno del 5% dell’intensità massima! Naturalmente, più oltre, vi sono intensità decrescenti. Così abbiamo un massimo centrale molto netto con ai lati massimi secondari molto deboli.

Capitolo 30 • Diffrazione

296

© 978-8808-22107-0

I n 2I0 1,0

 10 d 1 2 3 0

1

2

3

4

30.2 L’intensità in funzione dell’angolo di fase per un gran numero di oscillatori di uguale intensità. FIGURA

s

n

L

5

30.3 Un apparato lineare di n oscillatori uguali, forzati con fasi αs = sα.

FIGURA

È possibile dimostrare che l’area dell’intera curva, che include tutti i piccoli picchi, è uguale a 2⇡nI0 , ossia due volte l’area del rettangolo tratteggiato in FIGURA 30.2. Consideriamo ancora come possiamo applicare l’equazione (30.3) in diverse circostanze, e cerchiamo di capire quello che sta accadendo. Consideriamo le nostre sorgenti come se fossero tutte su una linea, com’è disegnato in FIGURA 30.3. Ve ne sono n, tutte distanziate dello stesso tratto d, e supporremo che la fase intrinseca relativa, ognuna rispetto alla successiva, sia ↵. Allora, se stiamo osservando in una data direzione ✓ rispetto alla normale, vi è una fase addizionale 2⇡d sen ✓/ a causa del ritardo di tempo fra una sorgente e la successiva, di cui abbiamo discusso prima. Così sen ✓ = ↵ + 2⇡d = ↵ + kd sen ✓ (30.4) Prima discuteremo il caso ↵ = 0. Cioè tutti gli oscillatori sono in fase, e vogliamo sapere qual è l’intensità in funzione dell’angolo ✓. Per calcolarla, dobbiamo semplicemente introdurre nella formula (30.3) il valore = kd sen ✓ e vedere ciò che accade. In primo luogo vi è un massimo quando = 0. Ciò significa che quando tutti gli oscillatori sono in fase vi è una forte intensità nella direzione ✓ = 0. D’altra parte, un problema interessante è: dove si trova il primo minimo? Esso capita quando = 2⇡/n. In altre parole, quando 2⇡d

sen ✓

=

2⇡ n

otteniamo il primo minimo della curva. Se eliminiamo i 2⇡ in modo da poterla osservare un po’ meglio, la formula dice che nd sen ✓ = (30.5) Cerchiamo ora di capire fisicamente perché otteniamo un minimo in tale posizione. nd è la lunghezza totale L dell’apparato. Facendo riferimento alla FIGURA 30.3, vediamo che nd sen ✓ = L sen ✓ = Quello che la (30.5) ci dice è che quando è uguale a una lunghezza d’onda, otteniamo un minimo. Perché otteniamo un minimo quando = ? Perché i contributi dei diversi oscillatori sono allora uniformemente distribuiti in fase da 0° a 360°. Le frecce (FIGURA 30.1) percorrono un intero cerchio – noi stiamo addizionando vettori uguali in tutte le direzioni e una somma del genere è zero. Così, quando abbiamo un angolo tale che = , otteniamo un minimo. Questo è il primo minimo. Vi è un’altra importante caratteristica nella formula (30.3), nel senso che se l’angolo è aumentato di un qualsiasi multiplo di 2⇡, non crea differenze nella formula. Così otterremo altri forti massimi per = 2⇡, 4⇡, 6⇡ e così via. Vicino a ciascuno di questi grandi massimi si ripete

30.2 • Il reticolo di diffrazione

© 978-8808-22107-0

il disegno della FIGURA 30.2. Possiamo chiederci: qual è la circostanza geometrica che conduce a questi altri grandi massimi? La condizione è che = 2⇡m, dove m è un qualsiasi intero. Cioè 2⇡d

sen ✓

= 2⇡m

Dividendo per 2⇡, vediamo che d sen ✓ = m

(30.6)

Questa appare simile alla formula (30.5). No, quella formula era nd sen ✓ = . La differenza è che qui dobbiamo osservare le singole sorgenti, e quando diciamo d sen ✓ = m , questo significa che abbiamo un angolo ✓ tale che = m . In altre parole, ciascuna sorgente contribuisce con un certo ammontare, e le sorgenti successive sono sfasate per un multiplo intero di 360°, e quindi contribuiscono in fase, perché essere sfasate di 360° è lo stesso che essere in fase. Così esse contribuiscono tutte in fase e producono un massimo altrettanto buono come quello per m = 0 di cui abbiamo discusso prima. Per quanto riguarda i picchi secondari, l’intera forma della figura è del tutto uguale a quella vicina a = 0, con esattamente gli stessi minimi su ciascun lato ecc. Così un tale apparato invierà fasci in varie direzioni – ciascun fascio avente un forte massimo centrale e un certo numero di deboli «lobi laterali» . Ci si riferisce ai vari fasci intensi come al fascio di ordine zero, del primo ordine, ecc., secondo il valore di m; m è detto ordine del fascio. Richiamiamo l’attenzione sul fatto che se d è minore di , l’equazione (30.6) non può avere soluzione tranne che per m = 0, così che se la spaziatura è troppo piccola vi è soltanto un fascio possibile, il fascio di ordine zero centrato attorno a ✓ = 0. (Naturalmente, vi è anche un fascio in direzione opposta.) Per ottenere grandi massimi secondari, dobbiamo avere la spaziatura d dell’apparato maggiore di una lunghezza d’onda.

30.2

Il reticolo di diffrazione

Tecnicamente con fili e antenne è possibile fare in modo che tutte le fasi dei piccoli oscillatori, o antenne, siano uguali. Il problema è se e come possiamo fare una cosa del genere con la luce. Non possiamo a tutt’oggi costruire letteralmente delle piccole stazioni radio a frequenza ottica, collegarle con fili infinitesimi e guidarle tutte con una data fase. Ma vi è un modo molto facile di fare ciò che equivale alla stessa cosa. Supponiamo di avere un insieme di fili paralleli, ugualmente distanziati di un tratto d, e una sorgente a radiofrequenza lontanissima, praticamente all’infinito, che genera un campo elettrico che arriva a ciascuno dei fili con la stessa fase (è tanto lontano che il ritardo temporale risulta lo stesso per tutti i fili). (Si possono calcolare casi con apparati curvi, ma prendiamone uno piano.) Allora il campo elettrico esterno forzerà gli elettroni su e giù in ciascun filo. Cioè, il campo che proviene dalla sorgente originale agiterà gli elettroni su e giù, e, muovendosi, questi rappresentano nuovi generatori. Questo fenomeno è detto diffusione: un’onda luminosa proveniente da una certa sorgente può indurre un moto di elettroni in un pezzo di materia, e questi moti generano le loro proprie onde. Quindi tutto quello che è necessario è approntare un insieme di fili, ugualmente distanziati, forzarli con una sorgente a radiofrequenza, lontana, e abbiamo la situazione desiderata, senza un’intera serie di collegamenti speciali. Se l’incidenza è normale, le fasi saranno uguali e otterremo esattamente la circostanza di cui stavamo discutendo. Quindi, se la spaziatura dei fili è maggiore della lunghezza d’onda, otterremo una forte intensità di diffusione nella direzione normale, e in certe altre direzioni date dalla (30.6). Questo può essere fatto anche con la luce! Invece dei fili usiamo una lastra piana di vetro su cui facciamo delle tacche in modo che ciascuna tacca diffonda un po’ diversamente dal resto del vetro. Se allora si fa cadere la luce sul vetro, ciascuna delle tacche rappresenterà una sorgente, e se spaziamo le linee di una distanza piccolissima, ma non più vicine di una lunghezza d’onda (il che è in ogni modo tecnicamente pressoché impossibile), allora potremmo aspettarci un fenomeno miracoloso: la luce non soltanto passerà in linea retta attraverso il vetro, ma vi sarà anche un intenso fascio a un angolo finito, che dipende dalla spaziatura delle tacche! Tali oggetti sono stati in realtà costruiti e sono di uso comune – essi sono chiamati reticoli di diffrazione.

297

298

Capitolo 30 • Diffrazione

© 978-8808-22107-0

In una delle sue forme un reticolo di diffrazione consiste semplicemente di una lastra piana di vetro, trasparente e incolore, con incisioni. Vi sono spesso diverse centinaia di incisioni in un millimetro, disposte con molta cura in modo da essere ugualmente distanziate. L’effetto di un tale reticolo può essere visto sistemando un proiettore in modo da inviare su uno schermo una linea di luce stretta, verticale (l’immagine di una fenditura). Quando introduciamo il reticolo nel fascio, con le sue incisioni verticali, vediamo che la linea vi è ancora ma, in più, su ciascun lato abbiamo un’altra intensa chiazza di luce colorata. Questa, naturalmente, è l’immagine della fenditura estesa su una vasta gamma angolare, dato che l’angolo ✓ nella (30.6) dipende da , e luci di diversi colori, come sappiamo, corrispondono a diverse frequenze, e quindi diverse lunghezze d’onda. La maggior lunghezza d’onda visibile è il rosso, e, poiché d sen ✓ = , questa richiede un ✓ maggiore. E troviamo, in realtà, che il rosso si trova sotto l’angolo maggiore a partire dall’immagine centrale! Vi dovrebbe anche essere un fascio dall’altro lato, e infatti ne vediamo uno sullo schermo. Inoltre, vi può essere un’altra soluzione della (30.6) quando m = 2. Vediamo vagamente che vi è qualcosa là – molto debole – e vi sono anche altri fasci al di là. Abbiamo proprio discusso sul fatto che tutti questi fasci dovrebbero essere della stessa intensità, ma vediamo che in realtà non lo sono, e infatti nemmeno i primi a destra e a sinistra sono uguali! La ragione è che il reticolo è stato accuratamente costruito in modo da produrre tale effetto. Come? Se il reticolo consistesse di incisioni sottilissime, di ampiezza infinitesima, regolarmente spaziate, allora tutte le intensità sarebbero effettivamente uguali. Ma, in realtà, pur avendo considerato il caso più semplice, potremmo anche aver considerato un apparato di coppie di antenne, in cui ciascun membro della coppia ha una certa intensità e una certa fase relativa. In questo caso è possibile ottenere intensità che sono diverse nei diversi ordini. Un reticolo è spesso fatto con piccoli tagli a «dente di sega» invece di piccole incisioni simmetriche. Disponendo accuratamente i «denti di sega» può essere inviata più luce in un particolare ordine dello spettro che negli altri. In pratica, in un reticolo desidereremmo avere più luce possibile in uno degli ordini. Questo può sembrare un punto complicato da introdurre, ma è una cosa molto intelligente da fare, dato che rende il reticolo più utile. Finora abbiamo trattato il caso in cui tutte le fasi delle sorgenti sono uguali. Ma abbiamo anche una formula per quando le fasi differiscono l’una rispetto alla successiva di un angolo ↵. Questo richiede di collegare le nostre antenne con un leggero sfasamento fra ciascuna di esse. Possiamo farlo con la luce? Sì, possiamo farlo molto facilmente, supponendo che vi sia una sorgente di luce all’infinito, fuori asse, così che la luce giunga con un angolo ✓ in e diciamo di voler discutere il fascio diffuso che esce con un angolo ✓ out (FIGURA 30.4). Il ✓ out è lo stesso ✓ di prima, ma il ✓ in è semplicemente un mezzo per fare in modo che la fase di ciascuna sorgente sia diversa: la luce proveniente dalla sorgente lontana per prima colpisce un’incisione, poi la successiva, poi la successiva, e via di seguito, con uno sfasamento l’una rispetto all’altra, che, come vediamo, è ↵ = 2⇡d

sen ✓ in

Quindi abbiamo la formula per un reticolo in cui la luce arriva ed esce con un certo angolo: ! sen ✓ out sen ✓ in = 2⇡d (30.7) Cerchiamo di calcolare dove otteniamo grandi intensità in queste circostanze. La condizione per grandi intensità è, naturalmente, che dovrebbe essere un multiplo di 2⇡. Vi sono diversi punti interessanti da notare. Un caso di grande interesse è quello che corrisponde a m = 0, dove d è minore di ; infatti questa è l’unica soluzione. In questo caso vediamo che sen ✓ out = sen ✓ in , che significa che la luce esce nella stessa direzione della luce che eccita il reticolo. Possiamo pensare che la luce «passa indisturbata attraverso il reticolo». No, è di una luce diversa che stiamo parlando. La luce che passa indisturbata attraverso il reticolo proviene dalla sorgente originale; quella di cui stiamo parlando è la nuova luce che è generata dalla diffusione. Risulta che la luce diffusa sta andando nella stessa direzione della luce originale, in realtà essa può interferire con quella – una caratteristica che studieremo in seguito.

30.2 • Il reticolo di diffrazione

© 978-8808-22107-0

299

30.4 La differenza di percorso per i raggi diffusi dalle incisioni adiacenti di un reticolo è d sen ✓ out d sen ✓ in . FIGURA

L

30.5 Il diagramma di intensità di una linea continua di oscillatori ha un unico forte massimo e diversi deboli «lobi laterali». FIGURA

d

Vi è un’altra soluzione per lo stesso caso. Per un dato ✓ in , ✓ out può essere il supplemento di ✓ in . Così, non soltanto otteniamo un fascio nella stessa direzione del fascio incidente, ma uno anche in un’altra direzione, che se la consideriamo accuratamente, è tale che l’angolo di incidenza è uguale all’angolo di diffusione. Chiamiamo questo fascio riflesso. Così cominciamo a capire il meccanismo fondamentale della riflessione: la luce che arriva genera moti degli atomi nel riflettore, e il riflettore allora rigenera una nuova onda, e una delle soluzioni per la direzione di diffusione, la sola soluzione se la distanza di separazione fra i centri diffusori è piccola rispetto a una lunghezza d’onda, è che l’angolo con cui esce la luce sia uguale all’angolo con cui la luce arriva! Poi discutiamo il caso particolare quando d tende a 0. Cioè abbiamo giusto un pezzo solido di materiale, per così dire, ma di lunghezza finita. Inoltre vogliamo che lo sfasamento da un centro diffusore al successivo vada a zero. In altre parole, sistemiamo sempre più antenne fra le altre, in modo che ognuna delle differenze di fase diventi più piccola, ma il numero delle antenne aumenti in modo tale che la differenza totale di fase tra un estremo della fila e l’altro sia costante. Vediamo che cosa accade alla (30.3) se manteniamo costante la differenza di fase n da un estremo all’altro (diciamo n = ), lasciando che il numero vada all’infinito e lo sfasamento di ciascuna vada a zero. Ma ora è così piccolo che sen = , e se riconosciamo anche n2 I0 come Im , la massima intensità al centro del fascio, troviamo I = 4Im

sen2 ( /2) 2

(30.8)

Questo caso limite è ciò che è mostrato nella FIGURA 30.2. In tali circostanze troviamo lo stesso tipo generale di figura come nel caso di separazione finita con d < ; tutti i lobi laterali sono praticamente gli stessi di prima, ma non vi sono massimi di ordine superiore. Se i centri diffusori sono tutti in fase, otteniamo un massimo nella direzione ✓ out = 0, e un minimo quando la distanza è uguale a , proprio come per d e n finiti. Così possiamo anche analizzare una distribuzione continua di centri diffusori o di oscillatori, usando gli integrali invece delle somme. Come esempio, supponete che vi sia una lunga fila di oscillatori, con cariche oscillanti nella direzione della fila (FIGURA 30.5). La massima intensità proveniente da un tale dispositivo è perpendicolare alla fila. Vi è un po’ di intensità sopra e sotto il piano equatoriale, ma è molto debole. Con questo risultato, possiamo trattare una situazione più complicata. Supponiamo di avere un insieme di tali file, ciascuna che produce un fascio soltanto nel piano perpendicolare alla fila. Trovare l’intensità nelle diverse direzioni proveniente da una serie di lunghi fili, anziché da fili infinitesimi, è lo stesso problema come per i fili infinitesimi fintanto che siamo nel piano centrale perpendicolare ai fili; sommiamo semplicemente il contributo di ciascuno dei fili lunghi. Questo è il motivo per cui, sebbene abbiamo analizzato in realtà soltanto piccole antenne, possiamo anche aver usato un reticolo con fenditure lunghe e strette. Ognuna delle lunghe fenditure produce un effetto soltanto nella sua propria direzione, non sotto e sopra, ma esse sono tutte disposte l’una accanto all’altra orizzontalmente, così producono interferenza in quel modo. In questo modo possiamo costruire situazioni più complicate avendo varie distribuzioni di diffusori in file, piani o nello spazio. La prima cosa che abbiamo fatto è stata considerare i diffusori su una fila, e abbiamo appunto esteso l’analisi a strisce; possiamo quindi risolvere il problema effettuando le somme necessarie, sommando i contributi dai singoli centri diffusori. Il principio è sempre lo stesso.

300

Capitolo 30 • Diffrazione

30.3

© 978-8808-22107-0

Potere risolutivo di un reticolo

Siamo ora nella condizione di capire numerosi interessanti fenomeni. Per esempio, considerate l’uso di un reticolo per separare lunghezze d’onda. Abbiamo osservato che l’intero spettro era sparso sullo schermo, così un reticolo può essere usato come uno strumento per separare la luce nelle sue differenti lunghezze d’onda. Uno dei problemi interessanti è: supponendo che vi siano due sorgenti di frequenze leggermente differenti, o di lunghezze d’onda leggermente differenti, quanto dovrebbero essere vicine in lunghezza d’onda per far sì che il reticolo non sia in grado di dire che vi sono realmente due differenti lunghezze d’onda? Il rosso e il blu erano chiaramente separati. Ma quando un’onda è rossa e l’altra è leggermente più rossa, molto vicina, quanto possono essere vicine? Questo è detto potere risolutivo del reticolo, e un modo di analizzare il problema è il seguente. Supponete che per la luce di un certo colore il massimo del fascio diffratto capiti a un certo angolo. Se cambiamo la lunghezza d’onda, la fase 2⇡d sen ✓/ è diversa, così naturalmente il massimo capita a un angolo diverso. Questo è il motivo per cui il rosso e il blu sono separati. Che differenza in angolo deve esserci affinché siamo in grado di vederli separati? Se i due massimi sono esattamente l’uno sull’altro, naturalmente non possiamo vederli. Se un massimo di un colore è abbastanza lontano dall’altro massimo, allora possiamo vedere che nella distribuzione della luce vi è un doppio picco. Per essere in grado di distinguere appena il doppio FIGURA 30.6 Illustrazione del criterio di Rayleigh. Il massimo di una figura cade sul primo minimo dell’altra. picco, di solito si usa il seguente semplice criterio, chiamato criterio di Rayleigh (FIGURA 30.6). Consiste nel fatto che il primo minimo di un picco dovrebbe cadere in corrispondenza del massimo dell’altro picco. Ora è molto facile calcolare quale differenza in lunghezza d’onda si ha quando un minimo cade sull’altro massimo. Il modo migliore di farlo è geometricamente. Per avere un massimo per lunghezza d’onda 0, la distanza (FIGURA 30.3) deve essere n 0, e se stiamo osservando il fascio di ordine m-esimo, essa è mn 0. In altre parole sen ✓ = 2⇡m 2⇡d 0 così nd sen ✓, che è , è 0 volte n, ossia mn 0. Per l’altro fascio, di lunghezza d’onda , vogliamo avere un minimo a questo angolo. Cioè vogliamo che sia esattamente una lunghezza d’onda più di mn : = mn + = mn 0 Così se 0 = + troviamo =

1 mn

(30.9)

Il rapporto / è chiamato potere risolutivo di un reticolo; vediamo che è uguale al numero totale di righe del reticolo, moltiplicato per l’ordine. Non è difficile dimostrare che questa formula è equivalente a quella che stabilisce che l’errore nella frequenza è uguale al reciproco della differenza di tempo fra due percorsi estremi che vengono fatti interferire:(1)

(1)

=

1 T

=

mn c

Nel nostro caso T =

c

dove c è la velocità della luce. La frequenza è =

c

quindi

=

c 2

30.4 • L’antenna parabolica

© 978-8808-22107-0

Infatti, questo è il miglior modo per ricordarlo, perché la formula generale funziona non soltanto per reticoli, ma per ogni altro strumento qualsiasi, mentre la formula particolare (30.9) dipende dal fatto che stiamo usando un reticolo.

30.4

L’antenna parabolica

Consideriamo ora un altro problema sul potere risolutivo. Questo ha a che fare con l’antenna di un radiotelescopio, usato per determinare la posizione delle radiosorgenti nel cielo, cioè l’ampiezza del loro angolo. Naturalmente, se usassimo una qualsiasi antenna e trovassimo segnali, non sapremmo da quale direzione provengono. Noi siamo molto interessati a sapere se la sorgente è in un punto o in un altro. Un modo con cui possiamo scoprirlo è di predisporre un’intera serie di dipoli ugualmente distanziati sulla campagna australiana. Poi prendiamo tutti i fili provenienti da queste antenne e alimentiamo lo stesso ricevitore, in modo tale che tutti i ritardi nelle linee di alimentazione siano uguali. Così il ricevitore riceve segnali da tutti i dipoli in fase. Cioè somma tutte le onde da ciascuno dei dipoli nella stessa fase. Ora che cosa accade? Se la sorgente è direttamente al di sopra dell’apparato, all’infinito o quasi, le sue onde radio ecciteranno tutte le antenne nella stessa fase, così esse alimenteranno tutte insieme il ricevitore. Supponete ora che la sorgente radio sia a un piccolo angolo ✓ dalla verticale. Allora le varie antenne ricevono i segnali un poco sfasati. Il ricevitore somma insieme tutti questi segnali sfasati, e così non otteniamo niente se l’angolo ✓ è troppo grande. Quanto può essere grande l’angolo? Risposta: otteniamo zero se l’angolo /L = ✓ (FIGURA 30.3) corrisponde a uno sfasamento di 360°, cioè se è la lunghezza d’onda . Questo perché i contributi vettoriali formano insieme un poligono completo con risultante zero. L’angolo più piccolo che può essere risolto da un apparato di antenne di lunghezza L è ✓=

L Notate che il diagramma di ricezione di un’antenna di questo tipo è esattamente lo stesso della distribuzione di intensità che otterremmo se invertissimo il ricevitore e ne facessimo un trasmettitore. Questo è un esempio di ciò che si chiama principio di reciprocità. Risulta infatti essere generalmente vero per qualsiasi sistemazione di antenne, angoli, e via di seguito, che se calcoliamo in primo luogo quali sarebbero le intensità relative nelle varie direzioni se il ricevitore fosse invece un trasmettitore, allora la sensibilità direzionale relativa di un ricevitore con lo stesso collegamento esterno, lo stesso apparato di antenne, è la stessa dell’intensità relativa di emissione che avrebbe se fosse un trasmettitore. Alcune antenne radio sono fatte in un modo diverso. Invece di avere un’intera serie di dipoli in una lunga linea, con un insieme di fili di alimentazione, possiamo disporli non in linea retta ma in linea curva, e porre il ricevitore in un certo punto dove può rivelare le onde diffuse. Questa curva è ingegnosamente progettata in modo che se le onde radio provengono dall’alto, e i fili diffondono, producendo una nuova onda, i fili sono sistemati in modo che le onde diffuse raggiungano il ricevitore tutte nello stesso tempo (FIGURA 26.12). In altre parole, la curva è una parabola, e quando la sorgente è esattamente sul suo asse, otteniamo nel fuoco un’intensità molto forte. In questo caso capiamo molto chiaramente qual è il potere risolutivo di un tale strumento. La sistemazione delle antenne su una curva parabolica non è un punto essenziale. È soltanto un modo conveniente per ottenere tutti i segnali allo stesso punto con nessun ritardo relativo e senza fili di alimentazione. L’angolo che un tale strumento può risolvere è ancora ✓ = /L, dove L è la separazione fra la prima e l’ultima antenna. Non dipende dalla spaziatura delle antenne e queste possono essere molto vicine o in realtà essere un unico pezzo di metallo. Stiamo ora descrivendo uno specchio di telescopio, naturalmente. Abbiamo trovato il potere risolutivo di un telescopio! (Talvolta il potere risolutivo viene espresso come ✓ = 1,22

L

301

302

Capitolo 30 • Diffrazione

© 978-8808-22107-0

dove L è il diametro del telescopio. La ragione per cui non abbiamo esattamente /L è questa: quando abbiamo calcolato che ✓ = /L, abbiamo supposto che tutte le linee di dipolo fossero uguali in intensità, ma quando abbiamo un telescopio circolare, che è il modo con cui di solito si fanno i telescopi, dai bordi esterni non giunge un segnale altrettanto grande, perché non è come un quadrato, dove otteniamo la stessa intensità lungo tutto un lato. Otteniamo qualcosa di meno perché stiamo usando soltanto parte del telescopio; così possiamo renderci conto che il diametro effettivo è un po’ più corto del diametro vero e proprio, e questo è quanto ci dice il fattore 1,22. In ogni caso, appare un po’ pedante introdurre tale precisione nella formula del potere risolutivo.(2) )

30.5

Pellicole colorate e cristalli

I precedenti, dunque, sono alcuni degli effetti dell’interferenza ottenuta addizionando le varie onde. Ma vi sono numerosi altri esempi e anche se non comprendiamo ancora il meccanismo fondamentale, un giorno lo capiremo, possiamo comprendere già ora come accade l’interferenza. Per esempio, quando un’onda luminosa colpisce una superficie di un materiale di indice n, diciamo a incidenza normale, una parte della luce è riflessa. Non siamo ora in una situazione tale da capire la ragione della riflessione; la discuteremo più tardi. Ma supponiamo di sapere che una parte della luce è riflessa sia nell’entrare sia nell’uscire da un mezzo rifrangente. Allora se osserviamo la riflessione di una sorgente luminosa da parte di una pellicola sottile, vediamo la somma di due onde; se gli spessori sono abbastanza piccoli, queste due onde produrranno un’interferenza, costruttiva o distruttiva, in dipendenza dai segni delle fasi. Può essere, per esempio, che per la luce rossa otteniamo una riflessione rinforzata, ma per la luce blu, che ha una diversa lunghezza d’onda, forse otteniamo una riflessione con interferenza distruttiva, cosicché vediamo una vivida riflessione rossa. Se cambiamo lo spessore, cioè se osserviamo in un altro punto dove la pellicola è più spessa, tutto può essere invertito, interferendo il rosso e non il blu, così è vivido il blu, o il verde, o il giallo, o chissacché. Vediamo quindi diversi colori quando osserviamo pellicole sottili e i colori cambiano se osserviamo ad angoli diversi, perché possiamo renderci conto che le differenze di tempo sono diverse ad angoli diversi. Così ci rendiamo immediatamente conto di altre centinaia di migliaia di situazioni che implicano i colori che vediamo su sottili strati d’olio, o bolle di sapone ecc. da angoli diversi. Ma il principio è sempre lo stesso: stiamo soltanto sommando onde a fasi diverse. Come altra importante applicazione della diffrazione, possiamo ricordare la seguente. Abbiamo usato un reticolo e abbiamo visto l’immagine diffratta sullo schermo. Se avessimo usato luce monocromatica, essa sarebbe stata in un certo punto specifico. Poi ci sarebbero state anche varie immagini di ordine superiore. Dalle posizioni delle immagini, potremmo dire quanto distavano le linee del reticolo, se conoscessimo la lunghezza d’onda della luce. Dalla differenza nell’intensità delle varie immagini potremmo trovare la forma delle incisioni del reticolo, se il reticolo era costituito di fili, di incisioni a dente di sega, o di qualsiasi altra cosa, senza essere in grado di vederli. Questo principio è usato per scoprire le posizioni degli atomi in un cristallo. La sola complicazione consiste nel fatto che il cristallo è tridimensionale; esso è una ripetizione tridimensionale di una struttura di atomi. Non possiamo usare luce comune, perché dobbiamo usare qualcosa la cui lunghezza d’onda sia minore della separazione fra gli atomi, altrimenti non otteniamo alcun effetto; allora dobbiamo usare radiazioni di piccolissima lunghezza d’onda, cioè raggi X. Così inviando raggi X in un cristallo e notando quanto è intensa la riflessione nei vari ordini, possiamo determinare la sistemazione degli atomi all’interno senza essere in grado di vederli con l’occhio! È in questo modo che conosciamo la sistemazione degli atomi nelle varie sostanze, il che ci ha permesso di tracciare nel primo capitolo le figure che mostrano la disposizione degli atomi nel (2) Questo perché il criterio di Rayleigh è in primo luogo un’idea approssimata. Esso vi dice dove inizia a diventare arduo il dire se l’immagine è data da una o da due stelle. In realtà, se possono essere fatte misure sufficientemente accurate dell’esatta distribuzione di intensità sull’immagine diffratta, il fatto che sono due sorgenti che creano l’immagine può essere provato anche se ✓ è minore di /L.

30.6 • Diffrazione di schermi opachi

© 978-8808-22107-0

303

sale e via di seguito. Ritorneremo in seguito su questo argomento e lo discuteremo in maggiore dettaglio; al momento non aggiungiamo altro su questo notevolissimo concetto.

30.6

Diffrazione di schermi opachi

Veniamo ora a una situazione interessantissima. Supponete di avere una lamina opaca con fori e luce da uno dei suoi lati. Vogliamo sapere qual è l’intensità luminosa sull’altro lato. Quello che parecchi dicono è che la luce brilla attraverso i fori, e produce un effetto sull’altro lato. Risulterà che si ottiene la soluzione corretta, con un’eccellente approssimazione, se si suppone che vi siano sorgenti distribuite con densità uniforme lungo i fori aperti, e che le fasi di queste sorgenti siano le stesse che sarebbero state se il materiale opaco fosse assente. Naturalmente, in realtà, non vi sono sorgenti nei fori, infatti questo è il solo posto in cui certamente non vi sono sorgenti. Nondimeno otteniamo le corrette figure di diffrazione considerando i fori come gli unici punti in cui vi siano sorgenti; questo è un fatto piuttosto strano. Spiegheremo in seguito perché è vero, ma per ora supponiamo che lo sia. Nella teoria della diffrazione vi è un altro genere di diffrazione che dovremmo discutere brevemente. Di solito non viene discusso in un corso elementare, come questo, soltanto perché le formule matematiche implicate nel sommare questi piccoli vettori sono un po’ elaborate. Altrimenti è esattamente la stessa cosa che stiamo facendo dall’inizio. Tutti i fenomeni di interferenza sono la stessa cosa; non vi è implicato niente di molto più avanzato, soltanto le circostanze sono più complicate ed è più difficile sommare i vettori, questo è tutto. Supponiamo di avere luce proveniente dall’infinito che proietta l’ombra C di un oggetto. La FIGURA 30.7 mostra uno schermo su cui è prodotta l’ombra R E di un oggetto AB da una sorgente di luce molto lontana confrontata con s una lunghezza d’onda. Ora ci aspetteremmo che all’esterno dell’ombra sia h tutto luminoso, e all’interno tutto buio. In realtà, se riportiamo l’intensità D P in funzione della posizione vicino al bordo dell’ombra, l’intensità sale e B aumenta molto, ondeggia e oscilla in un modo molto strano vicino a questo Oggetto Schermo bordo (FIGURA 30.9). Discuteremo ora la ragione di questo. Se usiamo il opaco Q A teorema che non abbiamo ancora dimostrato, allora possiamo sostituire al problema reale un gruppo di sorgenti effettive uniformemente distribuite sullo spazio aperto oltre l’oggetto. FIGURA 30.7 Una sorgente luminosa lontana proietta Immaginiamo un gran numero di antenne molto vicine; vogliamo l’in- su uno schermo l’ombra di un oggetto opaco. tensità in un dato punto P. Questo sembra proprio uguale a ciò che abbiamo appena fatto. Non del tutto; perché il nostro schermo non è all’infinito. Non vogliamo l’intensità all’infinito, ma a un punto finito. Per calcolare l’intensità in un certo punto particolare, dobbiamo sommare i contributi di tutte le antenne. In primo luogo vi è una antenna in D, esattamente di fronte a P; se ci alziamo un po’ in angolo, diciamo a una altezza h, allora vi è un aumento nel ritardo (vi è anche una variazione nell’ampiezza a causa della variazione nella distanza, ma questo è un effetto molto piccolo se siamo sufficientemente lontani ed è molto meno importante della differenza nelle fasi). Ora la differenza di percorso EP DP è h2 /2s, cosicché la differenza di fase è proporzionale al quadrato della distanza da D, mentre nel nostro lavoro precedente s era infinito e la differenza di fase era linearmente proporzionale a h. Quando le fasi sono linearmente proporzionali, ogni vettore si somma a un angolo costante col vettore successivo. Ciò di cui ora abbiamo bisogno è una curva, fatta sommando moltissimi vettori infinitesimi con il requisito che l’angolo che essi formano aumenterà, non linearmente, ma come il quadrato della lunghezza della curva. Il costruire tale curva richiede una matematica un po’ avanzata, ma possiamo sempre costruirla tracciando realmente le frecce e misurando gli angoli. In ogni caso, otteniamo la meravigliosa curva (detta spirale di Cornu) mostrata nella FIGURA 30.8. Ora come usiamo questa curva? Se vogliamo l’intensità, diciamo, al punto P, sommiamo moltissimi contributi di differenti fasi dal punto D su fino all’infinito, e dal punto D giù fino al punto BP . Così partiamo dal punto BP in FIGURA 30.8, e tracciamo una serie di frecce di angolo sempre crescente. Quindi il

Capitolo 30 • Diffrazione

304



© 978-8808-22107-0

BQ

I I0

1,0

BP ∞

R D BP

P

0,25 Q BR

x0

30.8 La somma delle ampiezze per parecchi oscillatori in fase i cui ritardi di fase variano come il quadrato della distanza dal punto D della FIGURA 30.7. FIGURA

x

30.9 L’intensità vicino al bordo di un’ombra. Il bordo dell’ombra geometrica è x 0 .

FIGURA

contributo totale sopra il punto BP segue tutta la curva a spirale. Se arrestassimo l’integrazione a un certo punto, allora l’ampiezza totale sarebbe un vettore da B a quel punto; in questo particolare problema stiamo andando all’infinito, così la risposta totale è il vettore B P1 . Ora, la posizione sulla curva che corrisponde al punto BP sull’oggetto, dipende da dove è posto il punto P, poiché il punto D, il punto di flesso, corrisponde sempre alla posizione del punto P. Così, in dipendenza da dove è situato P, sopra B, il punto di inizio cadrà in varie posizioni sulla parte sinistra più bassa della curva, e il vettore risultante B P1 avrà parecchi massimi e minimi (FIGURA 30.9). D’altra parte, se siamo in Q, sull’altro lato di P, allora stiamo usando soltanto un estremo della spirale e non l’altro. In altre parole, non partiamo nemmeno da D, ma da BQ , così da questa parte otteniamo l’intensità che diminuisce continuamente all’inoltrarsi di Q nell’ombra. Un punto che possiamo immediatamente calcolare con facilità, per dimostrare che l’abbiamo realmente capito, è l’intensità esattamente di fronte al bordo. L’intensità qui è 1/4 di quella della luce incidente. Motivo: esattamente al bordo (così il punto terminale B della freccia è in D nella FIGURA 30.8) abbiamo metà della curva che avremmo ottenuto se fossimo lontani nella regione luminosa. Se il nostro punto R è lontano nella regione luminosa noi andiamo da un estremo della curva all’altro, cioè percorriamo un intero vettore unitario; ma se siamo al bordo dell’ombra, abbiamo soltanto metà dell’ampiezza, cioè 1/4 dell’intensità. In questo capitolo abbiamo trovato l’intensità prodotta nelle varie direzioni da diverse distribuzioni di sorgenti. Come esempio finale deriveremo una formula di cui avremo bisogno nel prossimo capitolo sulla teoria dell’indice di rifrazione. Fino a questo punto le intensità relative sono state sufficienti al nostro scopo, ma questa volta troveremo la formula completa per il campo nella seguente situazione.

30.7

II campo di un piano di cariche oscillanti

Supponiamo di avere un piano pieno di sorgenti, tutte oscillanti insieme, con il loro moto nel piano e aventi tutte la stessa ampiezza e la stessa fase. Qual è il campo a una distanza dal piano finita, ma grandissima? (Non possiamo stare molto vicini, naturalmente, perché non abbiamo le formule valide per il campo vicino alle sorgenti.) Se chiamiamo x y il piano delle cariche, allora vogliamo trovare il campo nel punto P lontano sull’asse z (FIGURA 30.10). Supponiamo che vi siano ⌘ cariche per unità d’area del piano, e che ognuna di esse abbia una carica q. Tutte le cariche si muovono di moto armonico semplice, con la stessa direzione,

30.7 • II campo di un piano di cariche oscillanti

© 978-8808-22107-0

305

ampiezza e fase. Sia x 0 cos(!t) il moto di ciascuna carica rispetto alla sua posizione media. Ossia, usando la notazione complessa e ricordando che la parte reale rappresenta il moto reale, il moto può essere descritto da x 0 ei!t . Troviamo ora il campo nel punto P prodotto da tutte le cariche, trovando il campo prodottovi da ciascuna carica q e sommando poi i contributi di tutte le cariche. Sappiamo che il campo di radiazione è proporzionale all’accelerazione della carica, che è !2 x 0 ei!t (ed è lo stesso per ogni carica). Il campo elettrico di cui abbiamo bisogno, nel punto P, dovuto alla carica nel punto Q è proporzionale all’accelerazione della carica q, ma dobbiamo ricordare che il campo nel punto P all’istante t è dato dall’accelerazione della carica al tempo precedente t 0 = t r/c, dove r/c è il tempo che occorre alle onde per percorrere la distanza r da Q a P. Quindi il campo in P è proporzionale a !2 x 0 ei!(t r/c) (30.10) Usando questo valore per l’accelerazione vista da P, nella nostra formula per il campo elettrico a grandi distanze da una carica che irradia, otteniamo: ! q !2 x 0 ei!(t r/c) campo elettrico in P = (appross.) (30.11) da una carica in Q r 4⇡✏ 0 c2 Ora questa formula non è del tutto esatta, perché avremmo dovuto usare non l’accelerazione della carica ma la sua componente perpendicolare alla Q linea QP. Supporremo però che il punto P sia così lontano, rispetto alla Carica oscillante distanza del punto Q dall’asse (la distanza ⇢ in FIGURA 30.10), per quelle r variazioni di cui dobbiamo tener conto, da poter trascurare il fattore coseno P (che comunque sarebbe quasi uguale a 1). z Per ottenere il campo totale in P, sommiamo ora gli effetti di tutte le cariche nel piano. Dovremmo naturalmente fare una somma vettoriale. d Ma, poiché la direzione del campo elettrico è quasi la stessa per tutte le cariche, possiamo, in accordo con l’approssimazione che abbiamo già fatto, Piano di cariche oscillanti limitarci a sommare i moduli dei campi. Nella nostra approssimazione il campo in P dipende soltanto dalla distanza r, quindi tutte le cariche alla stessa r producono campi uguali. Così sommiamo, per prima cosa, i campi FIGURA 30.10 Campo di radiazione di un piano di di quelle cariche in un anello di larghezza d⇢ e raggio ⇢. Poi, facendo cariche oscillanti. l’integrale su tutti i ⇢, otterremo il campo totale. Il numero di cariche nell’anello è il prodotto della superficie dell’anello 2⇡ ⇢ d⇢, per ⌘, il numero di cariche per area unitaria. Abbiamo, allora: ⌅ q !2 x 0 ei!(t r/c) campo totale in P = ⌘ 2⇡ ⇢ d⇢ (30.12) 2 r 4⇡✏ 0 c Vogliamo valutare questo integrale da ⇢ = 0 a ⇢ = 1. La variabile t, naturalmente, deve essere tenuta costante mentre facciamo l’integrale, in modo che le sole quantità variabili siano ⇢ e r. Tralasciando tutti i fattori costanti, incluso il fattore ei!t per il momento, l’integrale che ci interessa è ⌅ ⇢ = 1 i!r/c e ⇢ d⇢ (30.13) r ⇢=0 Per fare questo integrale abbiamo bisogno di usare la relazione fra r e ⇢: r 2 = ⇢2 + z 2

(30.14)

Poiché z è indipendente da ⇢, quando prendiamo il differenziale di questa equazione, otteniamo 2r dr = 2⇢ d⇢ che è un risultato fortunato, poiché nel nostro integrale possiamo sostituire ⇢ d⇢ con r dr e r si semplificherà con quello nel denominatore. L’integrale di cui abbiamo bisogno è allora quello più semplice ⌅ r =1

r =z

e

i!r/c

dr

(30.15)

Capitolo 30 • Diffrazione

306

30.11 Soluzione grafica ⇤ 1 i ωdell’integrale r/c dr. z e In figura si ha: ✓ = ωz/c �✓ = ω�r/c.

© 978-8808-22107-0

FIGURA

30.12

Soluzione grafica dell’integrale ⇤1 i ωr/c dr. z ⌘e FIGURA

Asse immaginario

Asse reale

∆r Somma

Asse immaginario

Partenza: r = z

∆r

r

∆r C



Asse reale

A

∆r ∆r

Integrare un esponenziale è facilissimo. Dividiamo per il coefficiente di r nell’esponente e valutiamo l’esponenziale ai limiti. Ma i limiti di r non sono gli stessi dei limiti di ⇢. Quando ⇢ = 0, abbiamo r = z, così i limiti di r sono da z all’infinito. Otteniamo per l’integrale g c f i1 e e (i!/c)z (30.16) i!

dove abbiamo scritto 1 per (!/c)1, poiché entrambi significano semplicemente un numero molto grande! Ora e i1 è una quantità misteriosa. La sua parte reale, per esempio, è cos( 1), che, matematicamente parlando, è completamente indefinito (anche se ci aspettiamo che assuma qualche valore – oppure tutti (?) – fra +1 e 1). Ma in una situazione fisica, esso può significare qualcosa del tutto ragionevole, e comunemente può essere preso uguale a zero. Per vedere che questo è così nel nostro caso, torniamo a considerare di nuovo l’integrale originale (30.15). Possiamo interpretare la (30.15) come una somma di parecchi piccoli numeri complessi, ciascuno di ampiezza r, e con l’angolo ✓ = !r/c nel piano complesso. Possiamo cercare di valutare la somma con un metodo grafico. Nella FIGURA 30.11 abbiamo tracciato le prime cinque parti della somma. Ciascun segmento della curva ha lunghezza r ed è posto a un angolo ✓ = ! r/c rispetto al pezzo precedente. La somma per queste prime cinque parti è rappresentata dalla freccia che va dal punto di partenza alla fine del quinto segmento. Continuando a sommare parti tracceremo un poligono fino a che ritorneremo al punto di partenza (approssimativamente) per ridescrivere quindi il cerchio ancora una volta. Sommando altre parti, continuiamo semplicemente a ruotare, rimanendo vicini a un cerchio il cui raggio si dimostra facilmente che è c/!. Possiamo vedere ora perché l’integrale non dà una risposta definita! Ma ora dobbiamo ritornare alla fisica della situazione. In qualsiasi situazione reale il piano delle cariche non può essere infinito in estensione, ma a un certo punto deve terminare. Se esso terminasse bruscamente e fosse di forma esattamente circolare, il nostro integrale avrebbe un qualche valore sul cerchio in FIGURA 30.11. Se, però, facciamo sì che il numero delle cariche nel piano si riduca gradualmente a una certa distanza dal centro (o anche che si arresti improvvisamente ma in una forma irregolare cosicché, per ⇢ più grande, non è più l’intero anello di larghezza d⇢ che dà contributi), allora il coefficiente ⌘ nell’integrale esatto decrescerebbe verso zero. Poiché stiamo sommando parti più piccole ma ancora rotanti dello stesso angolo, il tracciato del nostro integrale diverrebbe allora una curva che è una spirale. La spirale terminerebbe finalmente nel centro del nostro cerchio originario, come tracciato in FIGURA 30.12. L’integrale fisicamente corretto è il numero complesso A nella figura rappresentato dal tratto che va dal punto di partenza al centro del cerchio, che è proprio uguale a c e i!

i!z/c

(30.17)

come potete calcolare voi stessi. Questo è lo stesso risultato che otterremmo dall’equazione (30.16) se ponessimo e i1 = 0.

30.7 • II campo di un piano di cariche oscillanti

© 978-8808-22107-0

(Vi è anche un’altra ragione per cui il contributo all’integrale diminuisce gradatamente per grandi valori di r, ed è il fattore che abbiamo omesso per la proiezione dell’accelerazione sul piano perpendicolare alla linea PQ.) Naturalmente siamo interessati soltanto alle situazioni fisiche, così prenderemo e i1 = 0. Ritornando alla nostra formula originale (30.12) per il campo e reintroducendo tutti i fattori che vanno con l’integrale, abbiamo il risultato (ricordando che 1/i = i): campo totale in P =

⌘q i!x 0 ei!(t 2✏ 0 c

z/c)

(30.18)

È interessante notare che i!x 0 ei!t è proprio uguale alla velocità delle cariche, cosicché possiamo anche scrivere l’equazione per il campo come campo totale in P =

⇤ ⌘q ⇥ velocità delle cariche al tempo t 2✏ 0 c

z/c

(30.19)

che è un po’ strana, perché il ritardo è semplicemente quello relativo alla distanza z, che è la distanza più breve da P al piano delle cariche. Ma è così che risulta – fortunatamente una formula piuttosto semplice. (Possiamo aggiungere, incidentalmente, che, benché la nostra derivazione sia valida soltanto per distanze lontane dal piano delle cariche oscillanti, risulta che la formula (30.18) o la (30.19) sono corrette per qualsiasi distanza z, anche per z < .)

307

31

L’origine dell’indice di rifrazione

31.1

L’indice di rifrazione

Abbiamo detto in precedenza che la luce si propaga più lentamente nell’acqua che nell’aria, e più lentamente, anche se di poco, nell’aria che nel vuoto. Questo effetto è descritto dall’indice di rifrazione n. Ora desidereremmo capire come può scaturire una simile velocità ridotta. In particolare dovremmo cercare di vedere qual è il rapporto con alcune ipotesi fisiche, o definizioni, fatte precedentemente, che erano le seguenti: • il campo elettrico totale in qualsiasi circostanza fisica può sempre essere rappresentato dalla somma dei campi di tutte le cariche nell’universo; • il campo di una singola carica è dato, sempre, dalla sua accelerazione valutata con un ritardo alla velocità c (per il campo di radiazione). Ma, per un pezzo di vetro, potreste pensare: «Oh no, dovreste modificare tutto questo. Dovreste dire che è ritardato alla velocità c/n». Questo però non è corretto, e dobbiamo capire perché non lo è. È approssimativamente vero che la luce o qualsiasi onda elettrica sembra propagarsi alla velocità c/n attraverso un mezzo il cui indice di rifrazione è n, ma i campi sono ancora prodotti dai moti di tutte le cariche – incluse le cariche in movimento nel mezzo – e con questi contributi fondamentali di campo che si propagano in ultima analisi alla velocità c. Il nostro problema è capire come risulta una velocità apparentemente minore. Cercheremo di capirne l’effetto in un caso molto semplice. Una sorgente che chiameremo «la sorgente esterna» è posta a una grande distanza da una lastra sottile di materiale trasparente, diciamo vetro. Cerchiamo di ottenere informazioni sul campo a una grande distanza dall’altro lato della lastra. La situazione è illustrata dallo schema della FIGURA 31.1, dove S e P sono immaginati lontanissimi dalla lastra. In accordo con i princìpi che Qual è il campo elettrico qui? abbiamo enunciato precedentemente, un campo eletOnda in arrivo trico qualsiasi che sia lontano da tutte le cariche in Es + Eb Es S + movimento è la somma (vettoriale) dei campi prodotti P Onda «trasmessa» dalla sorgente esterna (in S) e dei campi prodotti da Eb Sorgente di ciascuna delle cariche nella lastra di vetro, ognuno onda elettrica Onda «riflessa» Lastra di vetro con il suo proprio ritardo alla velocità c. Ricordate che il contributo di ciascuna carica non è modificato dalla presenza delle altre cariche. Questi sono i nostri FIGURA 31.1 Onde elettriche che attraversano uno strato princìpi fondamentali. Il campo in P può essere scritto di materiale trasparente. E=

X

Eciascuna carica

(31.1)

tutte le cariche

oppure E = Es +

X

Eciascuna carica tutte le altre cariche

(31.2)

© 978-8808-22107-0

31.1 • L’indice di rifrazione

dove Es è il campo dovuto alla sola sorgente e sarebbe precisamente il campo in P se non vi fosse presente nessun mezzo. Ci aspettiamo che il campo in P sia diverso da Es se vi sono altre cariche in movimento. Perché dovrebbero esservi cariche in movimento nel vetro? Sappiamo che ogni materiale consiste di atomi che contengono elettroni. Quando il campo elettrico della sorgente agisce su questi atomi esso costringe gli elettroni a oscillare su e giù, perché esercita una forza sugli elettroni. E gli elettroni in movimento generano un campo – essi costituiscono nuovi radiatori. Questi nuovi radiatori sono legati alla sorgente S, dato che sono forzati dal campo della sorgente. Il campo totale non è semplicemente il campo della sorgente S, ma è modificato dal contributo addizionale delle altre cariche in movimento. Questo significa che il campo non è lo stesso di quello che vi era prima che vi fosse il vetro, ma è modificato, e risulta che è modificato in modo tale che il campo all’interno del vetro appare in movimento a una diversa velocità. Questo è il concetto che vorremmo elaborare quantitativamente. Ora questo è, nel caso esatto, discretamente complicato, poiché, pur avendo detto che tutte le altre cariche in movimento sono forzate dal campo della sorgente, ciò non è del tutto vero. Se pensiamo a una carica particolare, essa sente non soltanto la sorgente, ma come ogni altra cosa nel mondo, essa sente tutte le cariche che sono in movimento. In particolare, sente le cariche che sono in movimento in qualche altro luogo nel vetro. Così il campo totale agente su una carica particolare è la combinazione dei campi delle altre cariche, i cui moti dipendono da che cosa questa particolare carica sta facendo! Potete vedere che occorrerebbe un complicato gruppo di equazioni per ottenere la formula esatta e completa. Così complicato che rinviamo questo problema all’anno prossimo. Calcoleremo invece un caso molto semplice al fine di capire tutti i princìpi fisici con chiarezza. Prendiamo una circostanza in cui gli effetti degli altri atomi siano molto piccoli rispetto agli effetti della sorgente. In altre parole, prendiamo un mezzo in cui il campo totale non sia modificato molto dal moto delle altre cariche. Questo corrisponde a un mezzo in cui l’indice di rifrazione è molto vicino a 1, il che accadrà, per esempio, se la densità degli atomi è molto piccola. Il nostro calcolo sarà valido per qualsiasi caso in cui l’indice sia per qualsiasi ragione molto vicino a 1. In questo modo eviteremo le complicazioni della soluzione completa più generale. Incidentalmente, dovreste osservare che vi è un altro effetto causato dal moto delle cariche nella lastra. Queste cariche irradieranno onde anche indietro verso la sorgente S. Questo campo che torna indietro è la luce che vediamo riflessa dalle superficie dei mezzi trasparenti. Essa non proviene semplicemente dalla superficie. La radiazione riflessa proviene da tutti i punti all’interno, ma risulta che l’effetto totale equivale alla riflessione dalle superfici. Gli effetti della riflessione sono al di là della nostra attuale approssimazione, dato che ci limiteremo al calcolo per un mezzo con un indice così vicino a 1 che pochissima luce è riflessa.

Prima di procedere col nostro studio su come viene ricavato l’indice di rifrazione, dovremmo convincerci che tutto quanto è richiesto per capire la rifrazione è capire perché la velocità apparente dell’onda è diversa nei vari mezzi. La deviazione dei raggi luminosi avviene proprio per il fatto che la velocità effettiva delle onde è diversa nei vari mezzi. Per ricordarvi come ciò avviene abbiamo tracciato nella FIGURA 31.2 diverse successive creste di un’onda elettrica che arriva dal vuoto sulla superficie di un blocco di vetro. La freccia perpendicolare alle creste dell’onda indica la direzione di propagazione dell’onda. Ora tutte le oscillazioni dell’onda devono avere la stessa frequenza. (Abbiamo visto che le oscillazioni forzate hanno la stessa frequenza della sorgente forzante.) Questo significa, anche, che le creste dell’onda per le onde su entrambi i lati della superficie devono avere la stessa spaziatura lungo la superficie perché devono propagarsi insieme, in modo che la carica presente sulla superficie di separazione percepirà una sola frequenza. La minima distanza fra le creste dell’onda, comunque, è la lunghezza d’onda, che è la velocità divisa per la frequenza. Dalla parte del vuoto essa è 2⇡c 0 = !

309

Capitolo 31 • L’origine dell’indice di rifrazione

310

© 978-8808-22107-0

mentre dall’altra parte è = oppure

Vuoto

2⇡v !

2⇡c !n se v = c/n è la velocità dell’onda. Dalla figura possiamo vedere che il solo modo per le onde di «adattarsi» bene alla superficie di separazione è la propagazione delle onde nel mezzo a un angolo differente rispetto alla superficie. Dalla geometria della figura potete vedere che per un «adattamento» dobbiamo avere =

Creste d’onda

Vetro

0

sen ✓ 0 ossia FIGURA

31.2

di velocità.

=

sen ✓

sen ✓ 0 =n sen ✓

Relazione fra rifrazione e variazione

che è la legge di Snell. Considereremo, per il resto della nostra discussione, soltanto il perché la luce abbia una velocità effettiva c/n nel mezzo di indice n, e non ci preoccuperemo più a lungo, in questo capitolo, della deviazione della direzione della luce.

Ritorniamo ora alla situazione mostrata in FIGURA 31.1: vediamo che ciò che dobbiamo fare è calcolare il campo prodotto in P da tutte le cariche oscillanti nella lastra di vetro. Chiameremo questa parte del campo Ea , ed è proprio la somma scritta come secondo termine nell’equazione (31.2). Quando la sommiamo al termine Es , dovuto alla sorgente, avremo il campo totale in P. Questa è, probabilmente, la cosa più complicata che faremo quest’anno, ma è complicata soltanto in quanto vi sono molte parti che devono essere messe insieme; ciascuna parte, però, è molto semplice. Diversamente dalle altre derivazioni dove diciamo: «Dimenticate la derivazione e guardate soltanto il risultato!», in questo caso non abbiamo bisogno del risultato quanto della derivazione. In altre parole, la cosa da capire ora è il meccanismo fisico per la produzione dell’indice. Per vedere dove stiamo andando, calcoliamo per prima cosa quale dovrebbe essere il «campo di correzione» Ea se il campo totale in P deve apparire simile alla radiazione proveniente dalla sorgente rallentata nel passare attraverso la sottile lastra. Se la lastra non avesse effetto su di essa, il campo di un’onda che si propaga verso destra (lungo l’asse z) sarebbe " ✓ # z◆ Es = E0 cos ! t (31.3) c o, usando la notazione esponenziale,

Es = E0 ei!(t

z/c)

(31.4)

Ora che cosa accadrebbe se l’onda si propagasse più lentamente nell’attraversare la lastra? Chiamiamo z lo spessore della lastra. Se non vi fosse la lastra, l’onda percorrerebbe la distanza z nel tempo z/c. Ma se appare propagarsi alla velocità c/n allora impiegherebbe il tempo più lungo n z/c o il tempo addizionale t = (n

1)

z c

Dopodiché continuerebbe a propagarsi ancora alla velocità c. Teniamo conto del ritardo in più nell’attraversamento della lastra sostituendo t nell’equazione (31.4) con t t oppure con t (n 1) z/c. Così l’onda, dopo l’inserimento della lastra, dovrebbe essere scritta Edopo la lastra = E0 ei![t

(n 1) z/c z/c]

(31.5)

31.2 • Il campo dovuto al mezzo

© 978-8808-22107-0

311

Possiamo anche scrivere questa equazione come i!(n 1) z/c

Edopo la lastra = e

E0 ei!(t

z/c)

(31.6)

che dice che l’onda dopo la lastra è ottenuta dall’onda che esisterebbe senza la lastra, cioè da Es , moltiplicando per il fattore e i!(n 1) z/c . Ora sappiamo che moltiplicare una funzione oscillante come ei!t per un fattore ei✓ dice semplicemente che cambiamo la fase dell’oscillazione di un angolo, che è, naturalmente, conseguenza del ritardo in più nell’attraversare lo spessore z. Esso ha ritardato la fase di una quantità !(n 1) z/c (ritardato, a causa del segno meno nell’esponente). Abbiamo detto precedentemente che la lastra dovrebbe sommare un campo Ea al campo originario Es = E0 ei!(t z/c) ma abbiamo trovato invece che l’effetto della lastra è di moltiplicare il campo per un fattore che ne varia la fase. Però, questo in realtà va bene perché possiamo ottenere lo stesso risultato sommando un opportuno numero complesso. È particolarmente facile trovare il numero giusto da sommare nel caso che z sia piccolo, perché ricorderete che se x è un numero piccolo allora e x è quasi uguale a 1 + x. Possiamo scrivere, quindi, e

i!(n 1) z/c

⇡1

1)

i!(n

z c

(31.7)

Usando questa uguaglianza nell’equazione (31.6), abbiamo Edopo la piastra = E0 ei!(t | {z A

z/c)

1) z

i!(n c

} |

Il termine A è appunto il campo della sorgente,

Es = E0 ei!(t

E0 ei!(t {z B

z/c)

(31.8)

}

z/c)

mentre il termine B deve essere proprio uguale a Ea , Ea =

1) z

i!(n c

E0 ei!(t

z/c)

ovvero il campo prodotto alla destra della lastra dalle cariche oscillanti della lastra – espresso qui in funzione dell’indice di rifrazione n, e dipendente, naturalmente, dall’intensità dell’onda proveniente dalla sorgente.

Di quello che abbiamo fatto finora si può facilmente avere un’idea se osserviamo il diagramma dei numeri complessi in FIGURA 31.3. Tracciamo per prima cosa il numero Es (scegliamo certi valori per z e t cosicché Es risulti orizzontale, ma questo non è necessario). Il ritardo dovuto al rallentamento nella lastra ritarderebbe la fase di questo numero, cioè ruoterebbe Es di un angolo negativo. Ma questo è equivalente a sommare il piccolo vettore Ea approssimativamente perpendicolare a Es . Ciò è semplicemente quello che significa il fattore i nel secondo termine dell’equazione (31.8). Esso dice che se Es è reale, allora Ea è immaginario negativo o che, in generale, Es ed Ea formano un angolo retto.

31.2

Asse immaginario Angolo = ω(n – 1) Es

E do

po la

lastr

∆z c

Asse reale Ea

a

=E

s

+E

a

31.3 Diagramma per onda trasmessa a un particolare t e a un particolare z.

FIGURA

Il campo dovuto al mezzo

Dobbiamo ora chiederci: il campo Ea ottenuto nel secondo termine dell’equazione (31.8) è il genere di campo che ci aspetteremmo da cariche oscillanti nella lastra? Se possiamo dimostrare

312

Capitolo 31 • L’origine dell’indice di rifrazione

© 978-8808-22107-0

che lo è, allora avremo calcolato cosa dovrebbe essere l’indice n! (Poiché n è il solo numero non fondamentale nell’equazione (31.8).) Vediamo ora di calcolare quale campo Ea produrranno le cariche nel mezzo. Per aiutarvi a ricordare i molti simboli che abbiamo usato finora, e che useremo nel calcolo che rimane da eseguire, li abbiamo tutti riuniti insieme qui di seguito: Es = campo della sorgente Ea = campo prodotto dale cariche della lastra z = spessore della lastra z = distanza dalla lastra n = indice di rifrazione ! = frequenza (angolare) della radiazione N = numero i cariche per unità di volume della lastra ⌘ = numero i ariche per area unitaria della lastra qe = carica portata da un elettrone m = massa di un elettrone !0 = frequenza di risonanza di un elettrone legato a un atomo Se la sorgente S (FIGURA 31.1) è lontana, a sinistra, allora il campo Es avrà la stessa fase ovunque sulla lastra, così possiamo scrivere che nelle vicinanze della lastra Es = E0 ei!(t

z/c)

(31.9)

Proprio sulla lastra, dove z = 0, avremo Es = E0 ei!t (sulla lastra)

(31.10)

Ciascun elettrone negli atomi della lastra sentirà questo campo elettrico e sarà forzato su e giù (supponiamo che la direzione di E0 sia verticale) dalla forza elettrica qE. Per trovare quale moto ci aspettiamo per gli elettroni, supporremo che gli atomi siano piccoli oscillatori, cioè che gli elettroni siano legati elasticamente agli atomi, il che significa che se viene applicata a un elettrone una forza il suo spostamento dalla sua posizione normale sarà proporzionale alla forza. Potete pensare che questo sia uno strano modello di atomo se avete sentito parlare degli elettroni come rotanti rapidamente in orbite. Ma questa è soltanto una rappresentazione molto semplificata. La rappresentazione corretta di un atomo, che è data dalla teoria della meccanica ondulatoria, dice che, per quanto riguarda i problemi concernenti la luce, gli elettroni si comportano come se fossero trattenuti da molle. Quindi supporremo che gli elettroni subiscano una forza lineare di richiamo che, insieme con la loro massa m, li fa comportare come piccoli oscillatori, con una frequenza di risonanza !0 . Abbiamo già studiato oscillatori del genere, e sappiamo che l’equazione del loro moto è scritta in questo modo: d2 x m * 2 + !02 x + = F , dt -

(31.11)

dove F è la forza motrice. Per il nostro problema, la forza motrice viene dal campo elettrico dell’onda emessa dalla sorgente, così usiamo l’espressione F = qe Es = qe E0 ei!t

(31.12)

dove qe è la carica elettrica portata dall’elettrone, e per Es usiamo l’espressione Es = E0 ei!t dalla (31.10). La nostra equazione del moto per l’elettrone è allora d2 x m * 2 + !02 x + = qe E0 ei!t , dt -

(31.13)

31.3 • Dispersione

© 978-8808-22107-0

Abbiamo già risolto questa equazione, e sappiamo che la soluzione è x = x 0 ei!t

(31.14)

dove, sostituendo nella (31.13), troviamo che qe E0 m(!02 !2 )

(31.15)

qe E0 ei!t m(!02 !2 )

(31.16)

x0 = cosicché x=

Abbiamo ciò che ci era necessario conoscere: il moto degli elettroni nella lastra. Ed è lo stesso per ogni elettrone, a eccezione del fatto che la posizione media (lo «zero» del moto) è naturalmente differente per ciascun elettrone. Siamo ora in grado di trovare il campo Ea che questi atomi producono nel punto P, poiché abbiamo già ricavato (alla fine del capitolo 30) il campo prodotto da una lamina di cariche che si muovono tutte insieme. Ritornando indietro all’equazione (30.19) vediamo che il campo Ea in P è esattamente una costante negativa per la velocità delle cariche ritardata nel tempo della quantità z/c. Differenziando x nell’equazione (31.16) per ottenere la velocità e introducendovi il ritardo – oppure ponendo semplicemente x 0 dalla (31.15) nella (30.18) – si ottiene Ea =

⌘qe 2✏ 0 c

26 qe E0 66i! ei!(t 64 m(!02 !2 )

3 77 5

z/c) 77

(31.17)

Proprio come ci aspettavamo, il moto forzato degli elettroni ha prodotto un’onda addizionale che si propaga verso destra (come il fattore ei!(t z/c) mette in evidenza), e l’ampiezza di quest’onda è proporzionale al numero di atomi per area unitaria nella lastra (il fattore ⌘) ed è anche proporzionale all’intensità del campo sorgente (il fattore E0 ). Poi vi sono alcuni fattori che dipendono dalle proprietà atomiche (qe , m e !0 ) come dovremmo aspettarci. La cosa più importante, però, è che questa formula (31.17) per Ea appare molto simile all’espressione per Ea che ottenemmo nell’equazione (31.8) dicendo che l’onda originale era ritardata passando attraverso un mezzo con un indice di rifrazione n. Le due espressioni, infatti, saranno identiche se ⌘qe2 (n 1) z = (31.18) 2✏ 0 m(!02 !2 ) Osservate che entrambi i termini sono proporzionali a z, poiché ⌘, il numero di atomi per area unitaria, è uguale a N z, dove N è il numero di atomi per unità di volume della lastra. Sostituendo N z a ⌘ ed eliminando z, otteniamo il nostro risultato più importante, una formula per l’indice di rifrazione in funzione delle proprietà degli atomi del mezzo e della frequenza della luce: n =1+

N qe2 2✏ 0 m(!02 !2 )

(31.19)

Questa equazione dà la «spiegazione» dell’indice di rifrazione che volevamo ottenere.

31.3

Dispersione

Osservate che nel procedimento precedente abbiamo ottenuto qualcosa di molto interessante. Perché abbiamo non soltanto un numero per l’indice di rifrazione che può essere calcolato dalle quantità atomiche fondamentali, ma abbiamo anche imparato come l’indice di rifrazione dovrebbe variare con la frequenza ! della luce. Questo è qualcosa che non avremmo mai capito dalla semplice affermazione che «la luce viaggia più lentamente in un materiale trasparente».

313

314

Capitolo 31 • L’origine dell’indice di rifrazione

© 978-8808-22107-0

Abbiamo ancora il problema, naturalmente, di sapere quanti atomi per unità di volume vi siano, e quale sia la loro frequenza naturale !0 . Non conosciamo ancora esattamente questa perché è diversa per ogni mezzo, e non possiamo dare ora una teoria generale. La formulazione di una teoria generale delle proprietà delle diverse sostanze – le loro frequenze naturali, e via di seguito – è possibile soltanto con la meccanica quantistica atomica. In più, materiali diversi hanno proprietà diverse e indici diversi, così non possiamo aspettarci, in ogni modo, di ottenere una formula generale per l’indice che si applicherà a tutte le sostanze. Però discuteremo la formula che abbiamo ottenuto in varie circostanze possibili. In primo luogo, per la maggior parte dei gas comuni (per esempio, l’aria, la maggior parte dei gas incolori, l’idrogeno, l’elio e via di seguito) le frequenze naturali degli elettroni oscillatori corrispondono alla luce ultravioletta. Queste frequenze sono maggiori delle frequenze della luce visibile, cioè !0 è molto maggiore di ! della luce visibile, e in una prima approssimazione possiamo ignorare !2 rispetto a !02 . Troviamo allora, per un gas, che l’indice è quasi costante. Questo è ancora vero per la maggior parte delle altre sostanze trasparenti, quali il vetro. Se osserviamo un po’ più da vicino la nostra espressione, però, notiamo che quando ! aumenta, togliendo qualcosa di più al denominatore, anche l’indice aumenta. Così n aumenta lentamente con la frequenza. L’indice è maggiore per la luce blu che per la rossa. Questa è la ragione per cui un prisma fa deviare la luce più nel blu che nel rosso. Il fatto che l’indice dipende dalla frequenza è detto fenomeno della dispersione, poiché è la base del fatto che la luce viene «dispersa» da un prisma in uno spettro. L’equazione per l’indice di rifrazione in funzione della frequenza è detta equazione di dispersione. Così abbiamo ottenuto un’equazione di dispersione. (Negli ultimi anni le «equazioni di dispersione» sono andate trovando un nuovo uso nella teoria delle particelle elementari.) La nostra equazione di dispersione suggerisce altri effetti interessanti. Se abbiamo una frequenza naturale !0 che sta nella regione visibile, oppure se misuriamo l’indice di rifrazione di un materiale quale il vetro nell’ultravioletto, dove ! è vicino a !0 , vediamo che a frequenze molto vicine alla frequenza naturale, l’indice può divenire enormemente grande perché il denominatore può andare a zero. In seguito supponiamo che ! sia maggiore di !0 . Questo accadrebbe, per esempio, se prendessimo un materiale come il vetro, e inviassimo su di esso della radiazione X. Infatti, poiché molti materiali, che sono opachi alla luce visibile, come per esempio la grafite, sono trasparenti ai raggi X, possiamo anche parlare dell’indice di rifrazione del carbone per i raggi X. Tutte le frequenze naturali degli atomi del carbone sarebbero molto più basse della frequenza che stiamo usando nei raggi X, poiché la radiazione X ha una frequenza altissima. L’indice di rifrazione è quello dato dalla nostra equazione di dispersione se poniamo !0 uguale a zero (cioè trascuriamo !02 rispetto a !2 ). Una situazione simile capiterebbe se inviassimo onde radio (o luce) su un gas di elettroni liberi. Nella parte alta dell’atmosfera, gli elettroni vengono liberati dai loro atomi dalla luce ultravioletta proveniente dal Sole ed essi rimangono lassù come elettroni liberi. Per gli elettroni liberi !0 = 0 (non vi è forza elastica di ritorno). Porre !0 = 0 nella nostra equazione di dispersione, produce la formula corretta per l’indice di rifrazione per le onde radio nella stratosfera, dove N sta ora a rappresentare la densità degli elettroni liberi (numero per unità di volume) nella stratosfera. Ma osserviamo ancora l’equazione: se mandiamo un fascio di raggi X nella materia, o di onde radio (o qualsiasi onda elettrica) sugli elettroni liberi, il termine !02 !2 diviene negativo, cioè otteniamo il risultato che n è minore di uno. Ciò significa che la velocità effettiva delle onde nella sostanza è maggiore di c! Può essere esatto questo? È esatto. A dispetto del fatto che si è detto che non si può inviare alcun segnale più veloce della velocità della luce, è nondimeno vero che l’indice di rifrazione dei materiali a una particolare frequenza può essere sia maggiore sia minore di 1. Questo significa semplicemente che lo sfasamento prodotto dalla luce diffusa può essere sia positivo sia negativo. Può essere dimostrato, però, che la velocità alla quale si può inviare un segnale non è determinata dall’indice a una certa frequenza, ma dipende da qual è l’indice a molte frequenze. Quello che l’indice ci dice è la velocità alla quale si propagano i nodi (o le creste) dell’onda. Il nodo di un’onda non è per se stesso un segnale. In un’onda perfetta, che non ha modulazioni di alcun genere, che è, cioè, un’oscillazione costante, non si può in realtà dire quando «parte», così non può essere usata come segnale di tempo. Per inviare un segnale si deve cambiare in qualche modo l’onda, fare in essa

31.3 • Dispersione

© 978-8808-22107-0

315

una dentellatura, renderla un po’ più larga o un po’ più stretta. Ciò significa che si deve avere nell’onda più di una frequenza, e si può mostrare che la Partenza E (a) velocità alla quale i segnali si propagano non dipende soltanto dall’indiOnda senza ce, ma dal modo in cui l’indice cambia con la frequenza. Anche questo t mezzo argomento dobbiamo rinviarlo (fino al capitolo 48). Allora calcoleremo la velocità reale dei segnali attraverso un pezzo di vetro, e vedrete che non sarà maggiore della velocità della luce, benché i nodi, che sono punti E matematici, si propaghino più veloci della luce. (b) Onda Proprio per dare un piccolo cenno di come ciò accade, noterete che trasmessa t la reale difficoltà sta nel fatto che le risposte delle cariche sono opposte con n > 1 al campo, cioè il segno si è invertito. Così nella nostra espressione per x Ritardo di fase (equazione (31.16)) lo spostamento della carica è in direzione opposta al campo forzante, perché !02 !2 è negativo per !0 piccolo. La formula E (c) dice che quando il campo elettrico sta tirando in una direzione, la carica si Onda trasmessa muove nella direzione opposta. t con n > 1 Come accade che la carica stia andando in direzione opposta? Non Anticipo di fase parte certamente in direzione opposta quando il campo viene inizialmente applicato. Quando il moto inizia vi è un transitorio, che si stabilizza dopo un po’, e soltanto allora la fase dell’oscillazione della carica è opposta al FIGURA 31.4 «Segnali» ondulatori. campo forzante. Ed è allora che la fase del campo trasmesso può apparire in anticipo rispetto all’onda della sorgente. È questo anticipo di fase che s’intende quando diciamo che la «velocità di fase» o la velocità dei nodi è maggiore di c. In FIGURA 31.4 diamo un’idea schematica di come le onde possano apparire nel caso in cui l’onda sia improvvisamente fatta partire (per produrre un segnale). Si vede dal diagramma che il segnale (cioè la partenza dell’onda) non è precedente per l’onda cha va a finire con un anticipo di fase. Osserviamo ora di nuovo la nostra equazione di dispersione. Dovremmo sottolineare che la nostra analisi dell’indice di rifrazione dà un risultato alquanto più semplice di quello che trovereste realmente in natura. Per essere del tutto accurati dobbiamo aggiungere alcune rifiniture. In primo luogo ci aspetteremmo che il nostro modello dell’oscillatore atomico dovrebbe avere una certa forza smorzante (altrimenti una volta partito oscillerebbe eternamente, e non ci aspettiamo che ciò accada). Abbiamo risolto precedentemente (equazione (23.8)) il moto di un oscillatore smorzato e il risultato è che il denominatore nell’equazione (31.16), e quindi nella (31.19), è cambiato da !02 !2 a !02 !2 + i !, dove è il coefficiente di smorzamento. Abbiamo bisogno di una seconda modifica per tener conto del fatto che vi sono diverse frequenze risonanti per un particolare tipo di atomo. È facile sistemare la nostra equazione di dispersione immaginando che vi sono parecchi differenti tipi di oscillatori, ma che ciascun oscillatore agisce separatamente, e così sommiamo semplicemente i contributi di tutti gli oscillatori. Diciamo che vi sono Nk elettroni per unità di volume, la cui frequenza naturale è !k e il cui fattore di smorzamento è k . Avremo allora, per la nostra equazione di dispersione n =1+

qe2 X 2✏ 0 m k !k2

Nk !2 + i

k!

(31.20)

Abbiamo finalmente un’espressione completa che descrive l’indice di rifrazione che è osservato per molte sostanze.(1) L’indice descritto da questa formula varia con la frequenza approssimativamente come la curva mostrata in FIGURA 31.5. Noterete che fino a quando ! non è troppo vicino a una delle frequenze di risonanza, la pendenza della curva è positiva. Una simile pendenza positiva è detta dispersione «normale» (dato che è chiaramente l’evento

n

1 0

FIGURA

ω1

31.5

ω2

ω

L’indice di rifrazione in funzione della

frequenza.

(1) In realtà, benché l’equazione (31.20) sia ancora valida nella meccanica quantistica, la sua interpretazione è un poco diversa. Nella meccanica quantistica anche un atomo con un elettrone, come l’idrogeno, ha diverse frequenze di risonanza. Quindi Nk non è in realtà il numero degli elettroni aventi frequenza ! k , ma è sostituito invece da N fk , dove N è il numero degli atomi per unità di volume e fk (detto forza dell’oscillatore) è un fattore che ci dice quanto intensamente l’atomo esibisce ciascuna delle sue frequenze di risonanza ! k .

316

Capitolo 31 • L’origine dell’indice di rifrazione

© 978-8808-22107-0

più comune). Molto vicino alla frequenza di risonanza, però, vi è una piccola banda di ! per la quale la pendenza è negativa. Una simile pendenza negativa viene spesso riportata come dispersione «anomala» (nel senso di anormale), perché apparve insolita quando fu osservata la prima volta, molto tempo prima che qualcuno sapesse ancora che esistevano cose come gli elettroni. Dal nostro punto di vista entrambe le pendenze sono del tutto «normali»!

31.4

Assorbimento

Forse avete osservato qualcosa di un po’ strano nell’ultima espressione, l’equazione (31.20), che abbiamo ottenuto per la nostra equazione di dispersione. A causa del termine i che introduciamo per tener conto dello smorzamento, l’indice di rifrazione è ora un numero complesso! Che cosa significa questo? Calcolando quali sono le parti reali e immaginarie di n possiamo scrivere n = n0

i n 00

(31.21)

dove n 0 e n 00 sono numeri reali. (Usiamo il segno meno davanti a i n 00 perché allora n 00 risulterà essere un numero positivo, come potete dimostrare per conto vostro.) Possiamo vedere quello che significa un tale indice complesso ritornando all’equazione (31.6), che è l’equazione dell’onda dopo che essa passa attraverso una lastra di materiale con un indice n. Se introduciamo in questa equazione il nostro n complesso, e la riordiniamo, otteniamo Edopo la lastra = e Gli ultimi due fattori e

!n00 z/c

e

i!(n0 1) z/c

i!(n0 1) z/c

E0 ei!(t

E0 ei!(t

z/c)

(31.22)

z/c)

sono proprio della forma che avevamo prima, e descrivono ancora un’onda la cui fase è stata ritardata dell’angolo !(n 0 1) z/c nell’attraversare il mezzo. Il primo termine e

!n00 z/c

invece, è nuovo ed è un fattore esponenziale con un esponente reale, dato che c’erano due i che si sono elisi. Dunque, l’esponente è negativo, così il fattore è un numero reale minore di uno. Esso descrive una diminuzione dell’ampiezza del campo, e, come ci aspetteremmo, di una quantità che è tanto maggiore, quanto più grande è z. Quando 1’onda attraversa il mezzo, essa viene indebolita. Il mezzo «assorbe» parte dell’onda. L’onda esce dall’altra parte con energia minore. Non dovremmo essere sorpresi di questo, perché lo smorzamento che introduciamo per gli oscillatori è infatti una forza di attrito e ci si deve aspettare che causi una perdita di energia. Vediamo che la parte immaginaria n 00 di un indice complesso di rifrazione rappresenta un assorbimento (o «attenuazione») dell’onda. Infatti, n 00 è talvolta chiamato «indice di assorbimento». Possiamo anche porre in rilievo che una parte immaginaria dell’indice n corrisponde a piegare il vettore Ea in FIGURA 31.3 verso l’origine. È chiaro perché il campo trasmesso è allora diminuito. Normalmente, per esempio come nel vetro, l’assorbimento della luce è molto piccolo. Questo ci si deve aspettare dalla nostra equazione (31.20), perché la parte immaginaria del denominatore, i k !, è molto più piccola del termine !k2 !2 . Ma se la frequenza della luce ! è molto vicina a !k allora il termine di risonanza !k2 !2 può diventare piccolo rispetto a i k ! e l’indice diviene quasi completamente immaginario. L’assorbimento della luce diventa l’effetto dominante. È proprio questo effetto che dà le linee scure nello spettro luminoso che riceviamo dal Sole. La luce proveniente dalla superficie solare è passata attraverso l’atmosfera del Sole (come pure quella della Terra), e la luce è stata fortemente assorbita alle frequenze di risonanza degli atomi nell’atmosfera solare. L’osservazione di queste linee spettrali nella luce del Sole ci permette di dire le frequenze di risonanza degli atomi e di qui la composizione chimica dell’atmosfera solare. Lo stesso genere di osservazioni ci informa dei materiali nelle stelle. Da tali misure sappiamo che gli elementi chimici nel Sole e nelle stelle sono gli stessi di quelli che troviamo sulla Terra.

31.5 • L’energia trasportata da un’onda elettrica

© 978-8808-22107-0

31.5

L’energia trasportata da un’onda elettrica

Abbiamo visto che la parte immaginaria dell’indice significa assorbimento. Useremo ora questa conoscenza per calcolare quanta energia è trasportata da un’onda luminosa. Abbiamo riportato precedentemente un’argomentazione per cui l’energia trasportata dalla luce è proporzionale a E 2 , la media temporale del quadrato del campo elettrico nell’onda. La diminuzione in E dovuta all’assorbimento deve significare una perdita di energia che andrebbe in un certo attrito degli elettroni e, possiamo ipotizzarlo, finirebbe come calore nel materiale. Se consideriamo la luce che arriva su un’area unitaria, diciamo un centimetro quadrato, della nostra lastra in FIGURA 31.1, allora possiamo scrivere la seguente equazione di bilancio energetico (se supponiamo che l’energia sia conservata, come supponiamo!): energia entrata al secondo = energia uscita al secondo + lavoro fatto al secondo

(31.23)

Per il primo termine possiamo scrivere ↵Es2 , dove ↵ è la costante di proporzionalità finora sconosciuta che mette in relazione il valore medio di E 2 con l’energia che viene trasportata. Per il secondo termine dobbiamo includere la parte proveniente dagli atomi del mezzo che irradiano, così dovremmo usare ↵(Es + Ea )2 , oppure, eseguendo il quadrato, ↵(Es2 + 2Es Ea + Ea2 ). Tutti i nostri calcoli sono stati fatti per un sottile strato di materiale il cui indice non è troppo lontano da 1, cosicché Ea dovrebbe essere sempre molto minore di Es (proprio per rendere i calcoli più facili). Continuando con le nostre approssimazioni, dovremmo quindi trascurare il termine Ea2 , perché è molto più piccolo di Es Ea . Voi potete dire: «Allora dovrebbe anche trascurare Es Ea , perché è molto più piccolo di Es2 ». È vero che Es Ea è molto più piccolo di Es2 , ma dobbiamo mantenere Es Ea o la nostra approssimazione sarà quella che sarebbe se trascurassimo completamente la presenza del mezzo! Un modo di controllare che i nostri calcoli sono consistenti è di verificare che i termini che usiamo sono sempre proporzionali a N z, la densità degli atomi nel materiale, e che trascuriamo termini che sono proporzionali a (N z)2 o qualsiasi potenza maggiore di N z. La nostra è quella che sarebbe chiamata un’«approssimazione a bassa densità». Nello stesso spirito potremmo notare che la nostra equazione sull’energia ha trascurato l’energia nell’onda riflessa. Ma questo è giusto dato che anche questo termine è proporzionale a (N z)2 , poiché l’ampiezza dell’onda riflessa è proporzionale a N z. Per l’ultimo termine nell’equazione (31.23) vogliamo calcolare la rapidità con cui l’onda entrante compie lavoro sugli elettroni. Sappiamo che il lavoro è la forza per la distanza, così la rapidità di eseguire lavoro (detta anche potenza) è la forza per la velocità. È in realtà F · v, ma non abbiamo bisogno di crearci preoccupazioni col prodotto scalare quando forza e velocità sono nella stessa direzione, come lo sono qui (tranne che per un possibile segno meno). Così per ciascun atomo prendiamo qe Es v per la rapidità media di eseguire lavoro. Poiché vi sono N z atomi per unità d’area, l’ultimo termine nell’equazione (31.23) dovrebbe essere N zqe Es v. La nostra equazione sull’energia appare ora come ↵Es2 = ↵Es2 + 2↵Es Ea + N zqe Es v

(31.24)

I termini Es2 si eliminano, e abbiamo 2↵Es Ea = N zqe Es v

(31.25)

Ora ritorniamo all’equazione (30.19), che ci dice che per z grande Ea =

N zqe v(ritardato di z/c) 2✏ 0 c

(31.26)

(ricordando che ⌘ = N z). Introducendo l’equazione (31.26) nel termine di sinistra della (31.25), otteniamo N z qe 2↵ Es (z) v(ritardato di z/c) 2✏ 0 c

317

318

Capitolo 31 • L’origine dell’indice di rifrazione

© 978-8808-22107-0

Però Es (z) è Es (negli atomi) ritardato di z/c. Poiché la media è indipendente dal tempo, è la stessa ora come ritardata di z/c, ossia è Es (nell’atomo) v, la stessa media che appare nel termine di destra della (31.25). I due termini sono quindi uguali se ↵ =1 ✏ 0c

o

↵ = ✏ 0c

(31.27)

Abbiamo scoperto che se l’energia deve essere conservata, l’energia trasportata in un’onda elettrica per area unitaria e per tempo unitario (o ciò che abbiamo chiamato intensità) deve essere data da ✏ 0 cE 2 . Se chiamiamo S l’intensità, abbiamo 8 9 intensità > > > > > > = = ✏ 0 cE 2 o S=< > > > > energia/area/tempo > > : ;

(31.28)

dove la barra significa la media temporale. Abbiamo un bel compenso supplementare dalla nostra teoria dell’indice di rifrazione!

31.6

Diffrazione della luce da uno schermo

È ora il momento giusto per occuparci di un argomento piuttosto diverso che possiamo trattare con il formalismo di questo capitolo. Nel capitolo precedente abbiamo detto che quando abbiamo uno schermo opaco e la luce può attraversare alcuni fori, la distribuzione dell’intensità – la figura di diffrazione – potrebbe essere ottenuta immaginando che le aperture siano sostituite da sorgenti (oscillatori) uniformemente distribuite sull’apertura stessa. In altre parole, l’onda diffratta è la stessa come se l’apertura fosse una nuova sorgente. Dobbiamo spiegare la ragione di ciò, dato che l’apertura è, naturalmente, proprio dove non vi sono sorgenti, dove non vi sono cariche accelerate. Domandiamoci per prima cosa: «Cos’è uno schermo opaco?». Supponiamo di avere uno schermo completamente opaco fra una sorgente S e un osservatore in P, come in FIGURA 31.6a. Se lo schermo è «opaco» non vi è campo in P. Perché non vi è campo? In accordo con i princìpi fondamentali dovremmo ottenere il campo in P come il campo Es della sorgente ritardata, più il campo di tutte le altre cariche circostanti. Ma come abbiamo visto sopra le cariche nello schermo saranno messe in moto dal campo Es , e questi moti generano un nuovo campo che, se lo schermo è opaco, deve annullare esattamente il campo Es sul lato posteriore dello schermo. Voi dite: «Che miracolo che si equilibrino esattamente! Supponete che non fosse esattamente giusto!». Se non fosse esattamente vero (ricordate che questo schermo opaco ha un certo spessore), il campo verso la parte posteriore dello schermo non sarebbe esattamente zero. Così, non essendo zero, metteS P E = Es E=0 rebbe in moto alcune altre cariche nel materiale dello schermo, e creerebbe Schermo opaco un piccolo campo in più, che cerca di equilibrare il totale. Così, se facciamo (a) lo schermo sufficientemente spesso, non vi è campo residuo, poiché si hanno condizioni abbastanza favorevoli affinché la cosa finalmente si quieti. In E = Es E = Es + Eparete funzione delle nostre formule sopra diremmo che lo schermo ha un indice S P grande e immaginario, cosicché l’onda viene esponenzialmente assorbiForo ta nell’attraversarlo. Sapete, naturalmente, che una lastra sufficientemente Parete (b) sottile del materiale più opaco, anche oro, è trasparente. Vediamo ora che cosa accade con un materiale opaco che abbia dei Parete fori, come in FIGURA 31.6b. Che cosa ci aspettiamo per il campo in P? S P Il campo in P può essere rappresentato come una somma di due parti: il Tappo campo dovuto alla sorgente S più il campo dovuto alla parete, cioè dovuto E = Es + E'parete + E'tappo E = Es (c) al moto delle cariche nelle pareti. Potremmo aspettarci che i moti delle cariche nelle pareti siano complicati, ma possiamo calcolare quale campo essi producono in un modo piuttosto semplice. FIGURA 31.6 Diffrazione prodotta da uno schermo.

31.6 • Diffrazione della luce da uno schermo

© 978-8808-22107-0

Supponiamo di prendere lo stesso schermo, ma di tapparne i fori, come indicato in

FIGU-

31.6c. Immaginiamo che i tappi siano esattamente dello stesso materiale della parete. Badate, i tappi vanno dove c’erano i fori nel caso (b). Ora calcoliamo il campo in P, che indichiamo E P . Il campo in P è certamente zero nel caso (c), ma è anche uguale al campo prodotto dalla sorgente RA

più il campo dovuto a tutti i moti degli atomi nelle pareti e nei tappi. Possiamo scrivere le seguenti equazioni: caso (b): caso (c):

E P = Es + Eparete 0 0 E P0 = Es + Eparete + Etappo =0

dove gli accenti si riferiscono al caso in cui ci sono i tappi, ma Es è, naturalmente, lo stesso in entrambi i casi. Ora se sottraiamo le due equazioni otteniamo E P = (Eparete

0 Eparete )

0 Etappo

Ora, se i fori non sono troppo piccoli (diciamo diverse lunghezze d’onda da un capo all’altro), non ci aspetteremmo che la presenza dei tappi cambiasse i campi che arrivano alle pareti tranne che possibilmente per un piccolo tratto attorno ai bordi dei fori. Trascurando questo piccolo effetto 0 possiamo porre Eparete = Eparete e ottenere che 0 E P = Etappo

Abbiamo il risultato che il campo in P quando vi sono fori in uno schermo – caso (b) – è lo stesso (tranne per il segno) del campo che è prodotto da quella parte di una parete opaca completa che è situata dove sono i fori! (Il segno non è troppo interessante, poiché siamo comunemente interessati all’intensità che è proporzionale al quadrato del campo.) Esso sembra un sorprendente argomento di avanti-indietro. È, però, non soltanto vero (approssimativamente per fori non troppo piccoli) ma utile, ed è la giustificazione della comune teoria della diffrazione. 0 Il campo Etappo è calcolato in qualsiasi caso particolare ricordando che il moto delle cariche ovunque nello schermo è proprio quello che annullerà il campo Es sul retro dello schermo. Una volta che conosciamo questi moti, sommiamo i campi di radiazione in P, dovuti semplicemente alle cariche nei tappi. Sottolineiamo ancora che questa teoria della diffrazione è soltanto approssimata, e andrà bene 0 soltanto se i fori non sono troppo piccoli. Per fori troppo piccoli il termine Etappo sarà piccolo e 0 allora la differenza fra Eparete ed Eparete (differenza che abbiamo preso uguale a zero) può essere 0 confrontabile o più grande del piccolo termine Etappo , e la nostra approssimazione non sarà più valida.

319

32

Smorzamento per radiazione e diffusione della luce

32.1

Resistenza di radiazione

Nel capitolo precedente abbiamo imparato che quando un sistema oscilla l’energia è trasportata lontano, e abbiamo dedotto una formula per l’energia irradiata da un sistema oscillante. Se conosciamo il campo elettrico, allora la media del quadrato del campo per ✏ 0 c è la quantità di energia che passa per metro quadrato per secondo attraverso una superficie normale alla direzione in cui si propaga la radiazione: S = ✏ 0 c hE 2 i (32.1) Qualsiasi carica oscillante irradia energia; per esempio, un’antenna forzata irradia energia. Se il sistema irradia energia, allora per render conto della conservazione dell’energia dobbiamo trovare che viene somministrata dell’energia lungo i fili che conducono all’antenna. Cioè per il circuito forzante l’antenna agisce come una resistenza, ossia un punto in cui l’energia può andare «perduta» (l’energia non è in realtà perduta; in effetti è irradiata, ma per quanto si riferisce al circuito, l’energia è perduta). In una comune resistenza, l’energia «perduta» si trasforma in calore; in questo caso l’energia «perduta» esce nello spazio. Ma dal punto di vista della teoria del circuito, senza considerare dove va l’energia, l’effetto netto sul circuito è lo stesso – vi è «perdita» di energia dal circuito. Quindi l’antenna appare al generatore come se avesse una resistenza, anche se può essere fatta con rame perfettamente puro. In realtà, se è ben costruita apparirà quasi come una pura resistenza, con piccolissima induttanza o capacità, perché vorremmo irradiare fuori dall’antenna quanta più energia possibile. Questa resistenza che un’antenna presenta è chiamata resistenza di radiazione. Se una corrente I sta andando all’antenna, allora la rapidità media con cui la potenza è trasferita all’antenna è la media del quadrato della corrente per la resistenza. La rapidità alla quale la potenza è irradiata dall’antenna è proporzionale al quadrato della corrente nell’antenna, naturalmente, poiché tutti i campi sono proporzionali alle correnti, e l’energia liberata è proporzionale al quadrato del campo. Il coefficiente di proporzionalità fra la potenza irradiata e hI 2 i è la resistenza di radiazione. Un problema interessante è: a che cosa è dovuta questa resistenza di radiazione? Prendiamo un semplice esempio: diciamo che le correnti sono forzate su e giù in una antenna. Troviamo che dobbiamo spendere del lavoro se l’antenna deve irradiare energia. Se prendiamo un corpo carico e lo acceleriamo su e giù esso irradia energia; se non fosse carico non irradierebbe energia. Una cosa è calcolare per mezzo della conservazione dell’energia quanta energia è perduta, un’altra cosa rispondere al problema: contro quale forza stiamo compiendo lavoro? Questa è una domanda interessante e molto difficile alla quale non è mai stato risposto esaurientemente e in modo soddisfacente per quanto riguarda gli elettroni, benché invece lo si sia fatto per le antenne. Quello che accade è questo: in un’antenna i campi prodotti dalle cariche in movimento da una parte dell’antenna reagiscono sulle cariche in movimento in un’altra parte dell’antenna. Possiamo calcolare queste forze e scoprire quanto lavoro esse compiono, e così trovare la legge esatta per la resistenza di radiazione. Quando diciamo «possiamo calcolare» – questo non è del tutto giusto – noi, non lo possiamo, a causa del fatto che non abbiamo ancora studiato le leggi dell’elettricità per piccole distanze; soltanto a grandi distanze sappiamo qual è il campo elettrico. Abbiamo visto

32.2 • La rapidità di radiazione dell’energia

© 978-8808-22107-0

321

la formula (28.3), ma attualmente è troppo complicato per noi calcolare i campi all’interno della zona d’onda. Naturalmente, poiché la conservazione dell’energia è valida, possiamo calcolare il risultato esattamente senza conoscere i campi a piccole distanze. (In realtà, usando questa discussione a rovescio, risulta che si può trovare la formula per le forze a piccole distanze soltanto conoscendo il campo a grandissime distanze, usando le leggi di conservazione dell’energia, ma non ci addentreremo in ciò qui.) Il problema nel caso di un elettrone singolo è questo: se vi è soltanto una carica, su cosa può agire la forza? Fu proposto nella vecchia teoria classica, che la carica fosse una piccola palla, e che una parte della carica agisse sull’altra parte. A causa del ritardo nell’azione da un capo all’altro del minuscolo elettrone, la forza non è esattamente in fase col moto. Cioè se abbiamo l’elettrone immobile, sappiamo che «l’azione è uguale alla reazione». Così le diverse forze interne sono uguali e non vi è forza netta. Ma se l’elettrone sta accelerando, allora, a causa del ritardo di tempo da un capo all’altro di esso, la forza che sta agendo sul davanti dal dietro dell’elettrone non è esattamente la stessa della forza che agisce sul dietro dal davanti, a causa del ritardo nell’effetto. Questo ritardo nel tempo produce una mancanza di equilibrio, così, come effetto netto, la cosa si trattiene tirandosi i lacci delle scarpe!(1) Questo modello dell’origine della resistenza all’accelerazione, la resistenza di radiazione di una carica in movimento, è sfociato in molte difficoltà, a causa del fatto che il nostro attuale concetto dell’elettrone è che non si tratta di una «piccola palla»; questo problema non è mai stato risolto. Nondimeno possiamo calcolare esattamente, naturalmente, quale deve essere la forza netta della resistenza di radiazione, cioè quanta perdita vi deve essere quando acceleriamo una carica, a dispetto della mancanza di conoscenza diretta del meccanismo di come tale forza funzioni.

32.2

La rapidità di radiazione dell’energia

Ora calcoleremo l’energia totale irradiata da una carica accelerata. Per mantenere la discussione generale, prenderemo il caso di una carica che accelera in qualsiasi modo, ma non relativisticamente. Nel momento in cui l’accelerazione è, diciamo, verticale, sappiamo che il campo elettrico che è generato è la carica moltiplicata per la proiezione dell’accelerazione ritardata, divisa per la distanza. Così conosciamo il campo elettrico in qualsiasi punto, e quindi conosciamo il quadrato del campo elettrico e in questo modo anche l’energia ✏ 0 cE 2 che esce attraverso un’area unitaria per secondo. La quantità ✏ 0 c appare spessissimo nelle espressioni relative alla propagazione di onde radio. Il suo reciproco è detto impedenza del vuoto, ed è un numero facile da ricordare: esso vale 1/✏ 0 c = 377 . Così la potenza in watt per metro quadro (W · m2 ) è uguale alla media del quadrato del campo, divisa per 377. Usando la nostra espressione (29.1) per il campo elettrico, troviamo che S=

q2 a 02 sen2 ✓ 16⇡ 2 ✏ 0 r 2 c3

(32.2)

è la potenza per metro quadrato irradiata nella direzione. Notiamo che va inversamente al quadrato della distanza, come abbiamo detto prima. Supponiamo ora di volere l’energia totale irradiata in tutte le direzioni: allora dobbiamo integrare la (32.2) su tutte le direzioni. In primo luogo moltiplichiamo per l’area, per trovare la quantità che fluisce entro un piccolo angolo d✓ (FIGURA 32.1). Abbiamo bisogno dell’area di una sezione sferica. Il ragionamento da seguire è questo: se r è il raggio, allora la larghezza della zona anulare è r d✓, e la circonferenza è 2⇡r sen ✓, perché r sen ✓ è il raggio del cerchio. Quindi l’area della piccola parte della sfera è 2⇡r sen ✓ per r d✓: dA = 2⇡r 2 sen ✓ d✓ (1)

r a'

(32.3)

L’autore si riferisce a una novella per bambini, diffusa nel mondo anglosassone, nella quale si racconta di un bambino che salì sulla luna tirandosi su per i lacci delle scarpe. (N.d.T.)

32.1 L’area di una zona sferica è 2πr sen✓ rd✓ . FIGURA

322

Capitolo 32 • Smorzamento per radiazione e diffusione della luce

© 978-8808-22107-0

Moltiplicando il flusso (32.2), la potenza per metro quadrato, per l’area in metri quadrati inclusa nel piccolo angolo d✓, troviamo la quantità di energia che è liberata in questa direzione fra ✓ e ✓ + d✓; poi la integriamo su tutti gli angoli ✓ da 0° a 180°: ⌅ ⌅ ⇡ q2 a 02 sen3 ✓ d✓ (32.4) P = S dA = 8⇡✏ 0 c3 0 Scrivendo

sen3 ✓ = (1

non è difficile dimostrare che





cos2 ✓) sen ✓

sen3 ✓ d✓ =

0

4 3

Tenendo conto di ciò, otteniamo infine P=

q2 a 02 6⇡✏ 0 c3

(32.5)

Questa espressione merita alcune osservazioni. Prima di tutto, siccome il vettore a 0 aveva una certa direzione, a 02 nella (32.5) sarebbe il quadrato del vettore a 0, cioè a 0 · a 0, la lunghezza del vettore al quadrato. In secondo luogo, il flusso (32.2) è stato calcolato usando l’accelerazione ritardata, cioè l’accelerazione all’istante in cui è stata irradiata l’energia che passa ora attraverso la sfera. Vorremmo dire che questa energia è stata in effetti liberata in questo istante precedente. Questo non è esattamente vero; è soltanto un concetto approssimato. Il momento esatto in cui l’energia viene liberata non può essere definito con precisione. Tutto quello che possiamo in realtà calcolare con precisione è quello che accade in un moto completo, quale un’oscillazione o qualcosa in cui alla fine l’accelerazione cessa. Allora quello che troviamo è che il flusso totale di energia per ciclo è la media del quadrato dell’accelerazione, per un ciclo completo. Questo è quanto dovrebbe in realtà apparire nella (32.5). Se invece si tratta di un moto con accelerazione iniziale e finale uguale a zero, allora l’energia totale che è volata via è l’integrale temporale dell’equazione (32.5). Per illustrare le conseguenze della formula (32.5) quando abbiamo un sistema oscillante, vediamo quello che accade se lo spostamento x della carica sta oscillando in modo che l’accelerazione a sia !2 x 0 ei!t . La media del quadrato dell’accelerazione per un ciclo (ricordate che dobbiamo stare molto attenti quando eleviamo al quadrato cose scritte con la notazione dei numeri complessi – in realtà è il coseno, e la media di cos2 !t è 1/2) è ha 02 i = Quindi

1 4 2 ! x0 2

q2 !4 x 20

(32.6) 12⇡✏ 0 c3 Le formule che stiamo discutendo ora sono relativamente avanzate e più o meno moderne; esse datano dall’inizio del ventesimo secolo, e sono famosissime. A causa del loro valore storico, è importante per noi essere in grado di leggerle nei vecchi libri. In realtà i vecchi libri usavano anche un sistema di unità diverso dal nostro attuale sistema mks. Però, tutte queste complicazioni possono essere superate nelle formule finali che trattano di elettroni per mezzo della seguente regola: la quantità qe2 /4⇡✏ 0 , dove qe è la carica dell’elettrone (in coulomb), storicamente era stata scritta come e2 . È molto facile calcolare che e nel sistema mks è numericamente uguale a 1,5188 · 10 14 , perché sappiamo che, numericamente, P=

qe = 1,6020610 · 10

19

e

1 = 8,98748 · 109 4⇡✏ 0

Quindi useremo spesso l’abbreviazione conveniente e2 =

qe2 4⇡✏ 0

(32.7)

32.3 • Smorzamento dovuto alla radiazione

© 978-8808-22107-0

Se usiamo il precedente valore numerico per e nelle formule più vecchie e le trattiamo come se fossero scritte nelle unità mks otterremo gli esatti risultati numerici. Per esempio la vecchia forma della (32.5) è 2e2 a 02 P= 3c3 D’altronde, l’energia potenziale di un protone e di un elettrone alla distanza r è qe2 /4⇡✏ 0 r ossia e2 /r, con e = 1,5188 · 10 14 unità mks.

32.3

Smorzamento dovuto alla radiazione

Ora, il fatto che un oscillatore perda una certa energia significherebbe che se abbiamo una carica all’estremità di una molla (o un elettrone in un atomo) di frequenza naturale !0 , la facciamo cominciare a oscillare e poi la abbandoniamo, non oscillerà per sempre, anche se è nello spazio vuoto milioni di miglia lontano da qualsiasi cosa. Non vi è olio, non c’è resistenza, nel senso comune; nessuna «viscosità». Ma nondimeno non oscillerà «per sempre», perché se l’oscillatore è carico irradia energia, e quindi l’oscillazione andrà lentamente smorzandosi. Quanto lentamente? Qual è il Q di un tale oscillatore, causato da effetti elettromagnetici, la cosiddetta resistenza di radiazione o smorzamento per radiazione dell’oscillatore? Il Q di qualsiasi sistema oscillante è il contenuto di energia totale dell’oscillatore in qualsiasi momento diviso la perdita di energia per radiante: W Q= dW / d Oppure, poiché

dW dW / dt dW / dt = = d d / dt !

un altro modo di scriverlo è Q=

!W dW / dt

(32.8)

Se per un dato Q questo ci dice come l’energia dell’oscillazione si smorza, abbiamo dW = dt

! W Q

che ha la soluzione W = W0 e

!t/Q

se W0 è l’energia iniziale (a t = 0). Per trovare il Q di un radiatore, ritorniamo alla (32.8) e usiamo la (32.6) per dW / dt. Ora che cosa usiamo per l’energia W dell’oscillatore? L’energia cinetica dell’oscillatore è mv 2 /2, e l’energia cinetica media è 1 m!2 x 20 4 Ma ricordiamo che, per l’energia totale di un oscillatore, in media, metà è energia cinetica e metà è energia potenziale, e così raddoppiamo il risultato, e troviamo per l’energia totale dell’oscillatore W=

1 m!2 x 20 2

(32.9)

Che cosa usiamo per la frequenza nelle nostre formule? Usiamo la frequenza naturale !0 perché, per tutti gli scopi pratici, questa è la frequenza alla quale il nostro atomo sta irradiando, e per m usiamo la massa dell’elettrone me . Allora, facendo le divisioni e le semplificazioni necessarie, la formula si riduce a 1 4⇡e2 = (32.10) Q 3 me c 2

323

324

Capitolo 32 • Smorzamento per radiazione e diffusione della luce

© 978-8808-22107-0

(Per vederla meglio, e in una forma più storica, la scriviamo usando la nostra abbreviazione qe2 = e2 4⇡✏ 0 e il fattore !0 /c, che era stato tralasciato, è stato scritto come 2⇡/ .) Poiché Q è senza dimensioni, la combinazione e2 /me c2 deve essere una proprietà soltanto della carica e della massa dell’elettrone, una proprietà intrinseca dell’elettrone, e deve essere una lunghezza. A essa è stato dato un nome, il raggio classico dell’elettrone, perché i primi modelli atomici, che furono inventati per spiegare la resistenza di radiazione sulla base della forza di una parte dell’elettrone agente sulle altre parti, avevano tutti bisogno di un elettrone le cui dimensioni fossero di questo generale ordine di grandezza. Però questa quantità non significa più che noi crediamo che l’elettrone abbia in realtà un raggio del genere. Numericamente il valore del raggio è e2 r0 = = 2,82 · 10 15 m (32.11) me c 2 Calcoliamo ora effettivamente il Q di un atomo che sta emettendo luce – diciamo un atomo di sodio. Per un atomo di sodio, la lunghezza d’onda è approssimativamente 6000 Å, nella parte gialla dello spettro visibile, e questa è una tipica lunghezza d’onda. Quindi Q=

3 ⇡ 5 · 107 4⇡r 0

(32.12)

così il Q di un atomo è dell’ordine di 108 . Questo significa che un oscillatore atomico oscillerà per 108 radianti o circa 107 oscillazioni, prima che la sua energia si riduca di un fattore 1/e. La frequenza di oscillazione della luce, = c/ , corrispondente a 6000 Å è dell’ordine di 1015 cicli/s e quindi la vita media – il tempo che occorre perché l’energia di un atomo che irradia si riduca di un fattore 1/e – è dell’ordine di 10 8 s. In circostanze ordinarie, atomi che irradiano liberamente impiegano circa questo tempo per irradiare. Questo è vero solamente per atomi che sono nello spazio vuoto, non disturbati in alcun modo. Se l’elettrone è in un solido e deve colpire altri atomi o altri elettroni, allora vi sono resistenze addizionali e differente smorzamento. Il termine di resistenza effettiva nella legge della resistenza per l’oscillatore può essere trovato dalla relazione 1 = Q !0 e ricordiamo che la grandezza di determina la larghezza della curva di risonanza (FIGURA 23.2). Abbiamo così appena finito di calcolare le larghezze delle righe spettrali per atomi che irradiano liberamente! Poiché = 2⇡c/!, troviamo che = 2⇡c

32.4

! 2⇡c 4⇡r 0 = 2⇡c 2 = = = = 1,18 · 10 3 !2 !0 Q!0 Q

14

m

(32.13)

Sorgenti indipendenti

In preparazione al nostro secondo argomento, la diffusione della luce, dobbiamo ora discutere una certa caratteristica del fenomeno di interferenza che abbiamo precedentemente trascurato. Si tratta del problema di quando l’interferenza non si verifica. Se abbiamo due sorgenti S1 e S2 , con ampiezze A1 e A2 , e facciamo un’osservazione in una certa direzione in cui le fasi di arrivo dei due segnali sono 1 e 2 (una combinazione del tempo reale di oscillazione e del tempo ritardato, che dipende dalla posizione di osservazione), allora l’energia che riceviamo può essere trovata combinando i due numeri complessivi, i vettori A1 e A2 uno a un angolo 1 e l’altro a un angolo 2 (come abbiamo fatto nel capitolo 29) e troviamo che l’energia risultante è proporzionale a A2R = A21 + A22 + 2A1 A2 cos (

1

2)

(32.14)

© 978-8808-22107-0

32.4 • Sorgenti indipendenti

Ora, se il termine misto 2A1 A2 cos ( 1 2 ) non vi fosse, l’energia totale ricevuta in una data direzione sarebbe semplicemente la somma delle energie, A21 + A22 , liberate da ciascuna sorgente separatamente, che è quanto ci aspettiamo normalmente. Cioè l’intensità combinata della luce che brilla su qualcosa, e proviene da due sorgenti, è la somma delle intensità delle due luci. D’altra parte, se abbiamo sistemato per bene le cose e abbiamo un termine misto, non si ha una somma del genere, perché vi è anche una certa interferenza. Se vi sono circostanze in cui questo termine non è importante, allora diremmo che l’interferenza è apparentemente perduta. Naturalmente in natura c’è sempre, ma possiamo non essere in grado di rilevarla. Consideriamo alcuni esempi. Supponete, in primo luogo, che le due sorgenti siano distanti 7 000 000 000 di lunghezze d’onda, che non è una situazione impossibile. Allora in una data direzione è vero che vi è un valore ben definito di queste differenze di fase. Ma, d’altra parte, se ci muoviamo semplicemente di un capello in una direzione, di alcune lunghezze d’onda, che non è una gran distanza (il nostro occhio ha già un’apertura tanto grande che mediamo gli effetti su un intervallo molto ampio paragonato a una lunghezza d’onda), allora cambiamo la fase relativa, e il coseno cambia molto rapidamente. Se prendiamo la media dell’intensità su una piccola regione, allora il coseno, che diventa positivo, negativo, positivo, negativo, quando ci muoviamo, si media a zero. Quindi se mediamo nelle regioni in cui la fase varia molto rapidamente con la posizione, non otteniamo interferenza. Altro esempio. Supponete che due sorgenti siano due oscillatori radio indipendenti – non un singolo oscillatore alimentato da due fili, il che garantisce che le due fasi sono mantenute costanti, ma due sorgenti indipendenti – e che non siano esattamente sintonizzate sulla stessa frequenza (è molto difficile averle esattamente alla stessa frequenza senza in realtà collegarle). In questo caso abbiamo quelle che chiamiamo due sorgenti indipendenti. Naturalmente, poiché le frequenze non sono esattamente uguali, benché siano fatte partire in fase, una di esse comincia ad avere un piccolo vantaggio rispetto all’altra, e abbastanza presto esse si trovano sfasate, poi la prima si avvantaggia ancora un po’ e abbastanza presto esse sono di nuovo in fase. Così la differenza di fase fra le due varia gradualmente col tempo, ma se la nostra osservazione è tanto approssimativa che non possiamo vedere tale breve tempo, se mediamo su un tempo molto più lungo, allora, benché l’intensità aumenti e diminuisca come accade con quelli che chiamiamo «battimenti» nel suono, se questi aumenti e diminuzioni sono troppo rapidi da seguire per il nostro dispositivo, allora di nuovo questo termine sparisce mediandosi. In altre parole, in tutte le circostanze in cui lo sfasamento viene mediato, non abbiamo interferenza! Si trovano diversi libri che affermano che due distinte sorgenti di luce non interferiscono mai. Questo non è un enunciato di fisica, ma è semplicemente un’affermazione del grado di sensibilità della tecnica degli esperimenti nel tempo in cui fu scritto il libro. Quello che accade in una sorgente luminosa è che dapprima irradia un atomo, poi irradia un altro atomo, e via di seguito, e abbiamo visto che gli atomi irradiano un treno di onde soltanto per circa 10 8 s; dopo 10 8 s qualche atomo ha probabilmente cominciato a irradiare, poi un altro atomo prende a irradiare, e via di seguito. Così le fasi possono in realtà rimanere le stesse soltanto per 10 8 s. Quindi, se facciamo la media per un tempo molto maggiore di 10 8 s, non vediamo interferenza fra due diverse sorgenti, perché esse non possono mantenere fisse le loro fasi per un tempo superiore a 10 8 s. Con fotocellule è possibile una rilevazione molto rapida, e si può dimostrare che vi è un’interferenza che varia con il tempo, su e giù, in circa 10 8 s. Ma la maggior parte dei dispositivi di rilevazione, naturalmente, non osservano tali piccolissimi intervalli di tempo e così non vedono l’interferenza. Certamente con l’occhio, che media su un tempo di un decimo di secondo, non vi è possibilità alcuna di vedere un’interferenza fra due comuni sorgenti differenti. Recentemente è divenuto possibile creare sorgenti di luce che eludono questo effetto facendo irradiare tutti gli atomi insieme nel tempo. Il dispositivo che fa questo è una cosa molto complicata, e va compreso tramite la meccanica quantistica. È chiamato laser, ed è possibile produrre da un laser una sorgente in cui la frequenza di interferenza, il tempo in cui la fase si mantiene costante, è molto maggiore di 10 8 s. Può essere dell’ordine di un centesimo, di un decimo, o anche di un secondo, e così, con fotocellule comuni si può cogliere l’interferenza fra due diversi laser. Si può facilmente rilevare la pulsazione dei battimenti fra due sorgenti laser. Presto, non c’è dubbio,

325

326

Capitolo 32 • Smorzamento per radiazione e diffusione della luce

© 978-8808-22107-0

qualcuno sarà in grado di mostrare due sorgenti che illuminano una parete, in cui i battimenti sono tanto lenti da poter vedere l’alternarsi di luce e di buio sulla parete! Un altro caso in cui l’interferenza si media è quello in cui, invece di avere soltanto due sorgenti, ne abbiamo molte. In questo caso, scriveremmo l’espressione per A2R come somma di un’intera serie di ampiezze, numeri complessi elevati al quadrato, e otterremmo il quadrato di ciascuno, tutti sommati insieme, più termini misti fra ciascuna coppia, e se le circostanze sono tali che questi ultimi si mediano, allora non vi saranno effetti di interferenza. Può essere che le varie sorgenti siano situate in posizioni a caso tali che, benché sia anche definita la differenza di fase fra A2 e A3 , essa sia molto diversa da quella tra A1 e A2 ecc. Così otterremmo un’intera serie di coseni, molti positivi, molti negativi, tutti che spariscono nella media. È così che in molte circostanze non vediamo gli effetti dell’interferenza, ma vediamo soltanto un’intensità totale collettiva, uguale alla somma di tutte le intensità.

32.5

Diffusione della luce

Quanto sopra ci conduce a un effetto che capita nell’aria come conseguenza delle posizioni irregolari degli atomi. Quando stavamo discutendo l’indice di rifrazione, abbiamo visto che un fascio di luce incidente fa irradiare di nuovo gli atomi. Il campo elettrico del fascio incidente forza gli elettroni su e giù, ed essi irradiano a causa della loro accelerazione. Questa radiazione diffusa si combina per dare un fascio nella stessa direzione del fascio incidente, ma di fase un po’ diversa, e questa è l’origine dell’indice di rifrazione. Ma che cosa possiamo dire della quantità di luce irradiata in qualche altra direzione? Ordinariamente, se gli atomi sono perfettamente disposti in un bel disegno, è facile dimostrare che non otteniamo niente in altre direzioni, perché stiamo sommando moltissimi vettori con le loro fasi sempre variabili, e il risultato è zero. Ma se gli oggetti sono situati a caso, allora l’intensità totale in qualsiasi direzione è la somma delle intensità che sono diffuse da ciascun atomo, come abbiamo appunto discusso. Inoltre, gli atomi nel gas si muovono effettivamente, cosicché, benché la fase relativa di due atomi sia ora una quantità definita, in seguito la fase sarebbe del tutto diversa, e quindi ciascun termine di coseno sparirà nella media. Quindi, per trovare quanta luce è diffusa in una data direzione da un gas, studiamo semplicemente gli effetti di un atomo e moltiplichiamo l’intensità che irradia per il numero degli atomi. Precedentemente abbiamo sottolineato che il fenomeno di diffusione della luce di questa natura è l’origine dell’azzurro del cielo. La luce del Sole passa attraverso l’aria, e quando guardiamo di fianco al Sole – diciamo 90° rispetto al fascio – vediamo luce blu; quello che ora dobbiamo calcolare è quanta luce vediamo e perché è azzurra. Se il fascio incidente ha il campo elettrico(2) E = Eˆ 0 ei!t nel punto in cui è situato l’atomo, sappiamo che un elettrone nell’atomo vibrerà su e giù in risposta a questo E (FIGURA 32.2). Dall’equazione (23.8), l’ampiezza sarà xˆ =

qe Eˆ 0 m(!02 !2 + i !)

(32.15)

Potremmo includere lo smorzamento e la possibilità che l’atomo agisca come diversi oscillatori di diversa frequenza e sommare le varie frequenze, ma per semplicità prendiamo soltanto un oscillatore e trascuriamo lo smorzamento. Allora la risposta al campo elettrico esterno, che abbiamo già usato nel calcolo dell’indice di rifrazione, è semplicemente xˆ = (2)

qe Eˆ 0 m(!02 !2 )

(32.16)

Quando il segno ˆ appare su un vettore, significa che le componenti del vettore sono complesse: Eˆ = (Eˆ x , Eˆ y , Eˆ z ).

32.5 • Diffusione della luce

© 978-8808-22107-0

Dovremmo ora calcolare facilmente l’intensità della luce che è emessa, nelle varie direzioni, usando la formula (32.2) e l’accelerazione corrispondente all’ xˆ suddetto. Piuttosto che far questo, però, calcoleremo semplicemente la quantità totale di luce diffusa in tutte le direzioni, appunto per risparmiare tempo. La quantità totale di energia luminosa per secondo, diffusa in tutte le direzioni dal singolo atomo, è naturalmente data dall’equazione (32.6). Così, mettendo insieme le varie parti e raggruppandole, otteniamo P=

Fascio incidente (non polarizzato)

– +

32.2 Un fascio di radiazione investe un atomo e induce le cariche (elettroni) dell’atomo a muoversi. Gli elettroni in movimento, a loro volta, irradiano in varie direzioni.

FIGURA

qe4 1 8⇡ !4 = ✏ 0 cE02 2 2 2 4 2 !02 )2 2 3 16⇡ ✏ 0 me c (! In definitiva, la potenza totale diffusa, irradiata in tutte le direzioni, è espressa dalla relazione 8⇡r 02 1 !4 ✏ 0 cE02 2 3 (!2 !02 )2

(32.17)

Abbiamo scritto il risultato nella forma sopra riportata, dato che è facile da ricordare: in primo luogo, l’energia totale diffusa è proporzionale al quadrato del campo incidente. Che cosa significa questo? Ovviamente il quadrato del campo incidente è proporzionale all’energia che arriva per secondo. Infatti, l’energia incidente per metro quadrato per secondo è ✏ 0 c per la media hE 2 i del quadrato del campo elettrico, e se E0 è il valore massimo di E, allora hE 2 i =

Atomo

Radiazione diffusa

qe2 E02 qe2 !4 = 12⇡✏ 0 c3 me2 (!2 !02 )2

P=

327

1 2 E 2 0

In altre parole, l’energia totale diffusa è proporzionale all’energia per metro quadrato che arriva; maggiore è lo splendore della luce del Sole che brilla nel cielo, più splendente apparirà il cielo. Poi, quale frazione della luce incidente viene diffusa? Immaginiamo un «bersaglio» con una certa area, diciamo , nel fascio (non un reale bersaglio materiale, perché questo diffrangerebbe la luce, e via di seguito; intendiamo un’area immaginaria tracciata nello spazio). La quantità totale di energia che passerebbe attraverso questa superficie in una data circostanza è proporzionale sia all’intensità incidente sia a , e sarebbe ! 1 2 P= ✏ 0 cE0 (32.18) 2 Ora introduciamo un concetto: diciamo che l’atomo diffonde una quantità totale di intensità che è la quantità che cadrebbe su una certa area geometrica, e diamo la risposta dando quell’area. La risposta allora è indipendente dall’intensità incidente; essa è il rapporto fra l’energia diffusa e l’energia incidente per metro quadrato. In altre parole, il rapporto energia totale diffusa per secondo energia incidente per metro quadro per secondo

è un’area

Il significato di quest’area è che, se tutta l’energia che ha urtato tale area dovesse essere schizzata in tutte le direzioni, allora quella è la quantità di energia che sarebbe diffusa dall’atomo. Quest’area è detta sezione d’urto per diffusione; il concetto di sezione d’urto è usato costantemente, ogni volta che avviene qualche fenomeno che è proporzionale all’intensità del fascio. In tali casi si descrive sempre l’entità del fenomeno dicendo quale avrebbe dovuto essere l’area effettiva per raccogliere una tale parte del fascio. Non significa in ogni modo che tale oscillatore abbia in realtà una tale area. Se non vi fosse nient’altro che un elettrone libero oscillante su e giù, non vi sarebbe un’area direttamente collegata a esso, fisicamente. Si tratta semplicemente di un

328

Capitolo 32 • Smorzamento per radiazione e diffusione della luce

© 978-8808-22107-0

modo di presentare la risposta per un certo tipo di problemi; ci dice semplicemente quale area il fascio incidente dovrebbe colpire per render conto della quantità di energia che ne esce. Così, per il nostro caso, 8⇡r 02 !4 (32.19) s = 3 (!2 !02 )2 (il pedice «s» sta per scattering, diffusione). Osserviamo alcuni esempi. In primo luogo, se andiamo a una frequenza naturale molto bassa !0 , o a elettroni completamente liberi, per i quali !0 = 0, allora la frequenza ! si semplifica e la sezione d’urto è una costante. Questo limite a bassa frequenza, ossia la sezione d’urto per elettrone libero, è conosciuto come sezione d’urto di diffusione Thomson. Si tratta di un’area le cui dimensioni trasversali sono approssimativamente 10 15 m, più o meno, cioè 10 30 m2 , che è piuttosto piccola! D’altra parte, se prendiamo il caso della luce nell’aria, ricordiamo che per l’aria le frequenze naturali degli oscillatori sono più alte della frequenza della luce che usiamo. Questo significa che, in prima approssimazione, possiamo trascurare !2 nel denominatore, e troviamo che la diffusione è proporzionale alla quarta potenza della frequenza. Vale a dire, la luce che è a una frequenza superiore, diciamo, di un fattore due, è diffusa con un’intensità sedici volte maggiore, che è una differenza piuttosto grande. Questo significa che la luce blu che ha circa due volte la frequenza dell’estremità rossa dello spettro, è diffusa in misura di gran lunga maggiore della luce rossa. Così quando osserviamo il cielo appare quello splendido azzurro che vediamo sempre! Vi sono diversi punti da trattare a proposito dei risultati precedenti. Un problema interessante è perché mai vediamo le nuvole? Da dove provengono le nuvole? Tutti sanno che si tratta di condensazione del vapore acqueo. Ma, naturalmente, il vapore acqueo è già nell’atmosfera prima che condensi, così perché non lo vediamo? Dopo che condensa è perfettamente visibile. Prima non c’era, ora c’è. Così il mistero di dove provengono le nuvole non è in realtà un mistero infantile del tipo «Da dove viene l’acqua, babbo?», ma deve essere spiegato. Abbiamo appunto spiegato che ogni atomo diffonde luce, e naturalmente anche il vapore acqueo diffonderà la luce. Il mistero è perché, quando l’acqua è condensata nelle nubi, diffonde una quantità di luce enormemente maggiore? Considerate che cosa accadrebbe se, invece di un singolo atomo, avessimo un agglomerato di atomi, diciamo due, molto vicini rispetto alla lunghezza d’onda della luce. Ricordate, gli atomi sono soltanto un angstrom circa da un capo all’altro, mentre la lunghezza d’onda della luce è circa 5000 Å, così quando formano un gruppo, alcuni atomi insieme, essi possono essere molto vicini rispetto alla lunghezza d’onda della luce. Allora quando il campo elettrico agisce, entrambi gli atomi si muoveranno insieme. Il campo elettrico che è diffuso sarà allora la somma dei due campi elettrici in fase, cioè due volte l’ampiezza che vi sarebbe con un singolo atomo, e l’energia che è diffusa è quindi quattro volte quella che si avrebbe con un singolo atomo, non il doppio! Così gruppi di atomi irradiano o diffondono più energia che come singoli atomi. La nostra affermazione che le fasi sono indipendenti è basata sul presupposto che vi è una differenza di fase reale e grande fra due atomi qualsiasi, il che è vero soltanto se essi sono separati da diverse lunghezze d’onda e disposti a caso, o in movimento. Ma se essi sono l’uno accanto all’altro, diffondono necessariamente in fase e hanno un’interferenza coerente che produce un aumento nella diffusione. Se abbiamo N atomi in un gruppo, che è una minuscola gocciolina di acqua, allora ciascun atomo sarà forzato dal campo elettrico circa nello stesso modo di prima (l’effetto di un atomo sull’altro non è importante; è semplicemente per giungere al concetto, in ogni modo) e l’ampiezza della diffusione per ciascuno è la stessa, così il campo totale diffuso è aumentato di N volte. L’intensità della luce che è diffusa è allora aumentata del quadrato, ossia N 2 volte. Ci saremmo aspettati con gli atomi sparsi nello spazio, N volte l’energia di 1, mentre otteniamo N 2 volte l’energia di 1! Ciò è a dire, la diffusione dell’acqua in agglomerati di N molecole ciascuno è N volte più intensa della diffusione dei singoli atomi. Così all’agglomerarsi dell’acqua aumenta la diffusione. Aumenta all’infinito? No! In che momento questa analisi comincia a non essere valida? Quanti atomi possiamo mettere insieme prima di non poter proseguire con questo argomento? Risposta: se la goccia d’acqua diventa così grande che da un estremo all’altro vi sia una lunghezza

© 978-8808-22107-0

32.5 • Diffusione della luce

329

d’onda circa, allora gli atomi non sono più tutti in fase essendo troppo distanti l’uno dall’altro. Così quando continuiamo ad aumentare le dimensioni delle goccioline otteniamo una sempre maggiore diffusione, fino al momento in cui la goccia raggiunge circa le dimensioni di una lunghezza d’onda, e allora la diffusione non aumenterà più con la stessa rapidità al crescere della goccia. Inoltre, l’azzurro scompare, perché per grandi lunghezze d’onda le gocce possono essere più grandi, prima di raggiungere questo limite, di come lo possono essere per piccole lunghezze d’onda. Benché le onde corte diffondano più, per atomo, delle onde lunghe, vi è un aumento maggiore per l’estremità rossa dello spettro che per l’estremità blu quando tutte le gocce sono maggiori della lunghezza d’onda, così il colore è spostato dal blu verso il rosso. Ora possiamo fare un esperimento che dimostra questo. Possiamo costruire particelle che sono molto piccole all’inizio, e poi gradualmente aumentano di dimensione. Usiamo una soluzione di iposolfito di sodio con acido solforico, che precipita sottilissimi granuli di zolfo. Quando lo zolfo precipita, i granuli iniziano dapprima molto piccoli, e la diffusione è lievemente bluastra. Quando aumenta la precipitazione, la diffusione diviene più intensa e diverrà biancastra man mano che le particelle diventano più grandi. In più la luce che attraversa direttamente la soluzione avrà perso il blu. Questo è il motivo per cui il tramonto è rosso, naturalmente, perché la luce che giunge al nostro occhio passando attraverso uno strato d’aria ha avuto molta della componente blu diffusa, così è giallo-rossa. Infine vi è un’altra importante caratteristica, che in realtà appartiene al prossimo capitolo, sulla polarizzazione, ma è così interessante che la Fascio incidente (non polarizzato) mettiamo in rilievo ora. Si tratta del fatto che il campo elettrico della L’elettrone si muove k luce diffusa tende a vibrare in una particolare direzione. Il campo elettrico nel piano della luce incidente è oscillante in un certo modo, e l’oscillatore forzato perpendicolare a k – va nella stessa direzione, e se siamo situati circa perpendicolarmente al + Atomo fascio, vedremo luce polarizzata, cioè, luce in cui il campo elettrico sta andando soltanto in un modo. In generale, gli atomi possono vibrare in qualsiasi direzione perpendicolarmente al fascio, ma se essi sono forzati direttamente verso di noi o in direzione opposta, non ce ne accorgiamo. Così La radiazine diffusa se la luce incidente ha un campo elettrico che varia e oscilla in qualsiasi perpendicolare a k direzione, il che chiamiamo luce non polarizzata, allora la luce che esce è polarizzata in un piano dal fascio a 90° vibra in una direzione soltanto! (FIGURA 32.3) Vi è una sostanza detta polaroid che ha la proprietà che quando la luce la attraversa, soltanto la parte del campo elettrico lungo un asse particolare FIGURA 32.3 Illustrazione dell’origine della può passare. Possiamo usare questo come prova della polarizzazione, e polarizzazione di radiazione diffusa infatti troviamo che la luce diffusa dalla soluzione iposolfitica è fortemente perpendicolarmente rispetto al fascio incidente. polarizzata.

33

Polarizzazione

33.1

Il vettore elettrico della luce

In questo capitolo considereremo quei fenomeni che dipendono dal fatto che il campo elettrico che descrive la luce è un vettore. Nei precedenti capitoli non ci siamo interessati della direzione di oscillazione del campo elettrico, tranne che per notare che il vettore elettrico giace in un piano perpendicolare alla direzione di propagazione. La direzione particolare in questo piano non ci interessava. Consideriamo ora quei fenomeni la cui caratteristica principale è la particolare direzione di oscillazione del campo elettrico. Nella luce idealmente monocromatica, il campo elettrico deve oscillare a una frequenza definita, ma, poiché la componente x e la componente y possono oscillare indipendentemente a una frequenza definita, dobbiamo in primo luogo considerare l’effetto risultante prodotto dalla sovrapposizione di due oscillazioni indipendenti perpendicolari l’una all’altra. Quale tipo di campo elettrico è costituito di una componente x e di una componente y che oscillano alla stessa frequenza? Se si somma a una vibrazione x una certa quantità di vibrazione y con la stessa fase, il risultato è una vibrazione in una nuova direzione nel piano x y. La FIGURA 33.1 illustra la sovrapposizione di differenti ampiezze per la vibrazione x e la vibrazione y. Ma le risultanti mostrate in FIGURA 33.1 non sono le uniche possibilità; in tutti questi casi abbiamo supposto che la vibrazione x e la vibrazione y siano in fase, ma non è necessario che sia così. Potrebbe accadere che la vibrazione x e la vibrazione y siano sfasate. Quando la vibrazione x e la vibrazione y non sono in fase, il vettore campo elettrico si muove lungo un’ellisse, e possiamo rappresentare questo in un modo familiare. Se sospendiamo una palla a un supporto per mezzo di una lunga corda, in modo che possa oscillare liberamente in un piano orizzontale, essa eseguirà oscillazioni sinusoidali. Se immaginiamo le coordinate x e y con la loro y y y origine nella posizione di riposo della palla, la palla può oscillare in entrambe le direzioni x e y con la stessa frequenza pendolare. Selezionando opportunax x x mente spostamento e velocità iniziali, possiamo mettere in oscillazione la palla lungo l’asse x o l’asse y, o lungo qualsiasi linea retta nel piano x y. Questi moti Ey = 1 Ey = 1 Ey = 1 della palla sono analoghi alle oscillazioni del vettore Ex = 0 Ex = 1/2 Ex = 1 campo elettrico illustrate in FIGURA 33.1. In ciascun caso, dato che le vibrazioni x e y raggiungono i loro y y y massimi e minimi nello stesso tempo, le oscillazioni x e y sono in fase. Ma sappiamo che il moto più gex x x nerale della palla è un moto ellittico, che corrisponde alle oscillazioni in cui i moti nelle direzioni x e y non sono in fase. La sovrapposizione delle vibrazioni x e y Ey = 0 Ey = 1 Ey = –1 non in fase è illustrata nella FIGURA 33.2 per una certa Ex = 1 Ex = –1 Ex = 1 varietà di angoli fra la fase della vibrazione x e quella della vibrazione y. Il risultato generale è che il vettore elettrico si muove su un’ellisse. Il moto in linea retta è FIGURA 33.1 Sovrapposizione di vibrazioni x e y in fase.

33.1 • Il vettore elettrico della luce

© 978-8808-22107-0

331 FIGURA

(a)

(b)

(c)

LHC

Ex = cosωt; 1

Ex = cosωt; 1

Ey = cosωt; 1

Ey = cos(ωt + π/4); ei π/4

(d)

(e)

Ex = cosωt; 1 Ey = –senωt; i

(f)

Ex = cosωt; 1

Ex = cosωt; 1

Ex = cosωt; 1

Ey = cos(ωt + 3π/4); ei 3π/4

Ey = –cosωt; –1

Ey = –cos(ωt + π/4); –ei π/4

(g)

(h)

(i)

RHC

Ex = cosωt; 1

Ex = cosωt; 1

Ex = cosωt; 1

Ey = senωt; –i

Ey = –cos(ωt + 3π/4); –ei 3π/4

Ey = cosωt; 1

un particolare caso corrispondente alla differenza di fase zero (o un multiplo intero di ⇡); il moto circolare corrisponde ad ampiezze uguali con una differenza di fase di 90° (o qualsiasi multiplo intero dispari di ⇡/2). In FIGURA 33.2 abbiamo indicato i vettori campo elettrico nelle direzioni x e y usando i numeri complessi, che sono una rappresentazione conveniente in cui esprimere la differenza di fase. Non confondete le componenti reali e immaginarie del vettore elettrico complesso in questa notazione con le coordinate x e y del campo. Le coordinate x e y nelle FIGURE 33.1 e 33.2 sono campi elettrici reali che possiamo misurare. Le componenti reale e immaginaria di un vettore campo elettrico complesso sono soltanto una convenienza matematica e non hanno significato fisico. Ora un po’ di terminologia. La luce è polarizzata linearmente (talvolta detta polarizzata su un piano) quando il campo elettrico oscilla su una linea retta; la FIGURA 33.1 illustra la polarizzazione lineare. Quando l’estremità del vettore campo elettrico si muove su un’ellisse, la luce è polarizzata ellitticamente. Quando l’estremità del vettore campo elettrico si muove su una circonferenza, abbiamo polarizzazione circolare. Se l’estremità del vettore elettrico, quando lo osserviamo mentre la luce viene in linea retta verso di noi, ruota in direzione antioraria, chiameremo questa polarizzazione circolare destrorsa. La FIGURA 33.2g illustra la polarizzazione circolare destrorsa, e la FIGURA 33.2c mostra la polarizzazione circolare sinistrorsa. In entrambi i casi la luce sta uscendo dalla pagina. La nostra convenzione per la classificazione della polarizzazione circolare sinistrorsa e destrorsa è coerente con quella che è usata oggi per tutte le altre particelle in fisica che presentano polarizzazione (per esempio gli elettroni). Però, in alcuni libri di ottica vengono usate convenzioni opposte, così si deve stare attenti. Abbiamo considerato luce polarizzata linearmente, circolarmente ed ellitticamente, il che comprende tutto tranne il caso della luce non polarizzata. Ora, come può la luce essere non polarizzata quando sappiamo che deve vibrare su una o su un’altra di queste ellissi? Se la luce non è assolutamente monocromatica, o se le fasi x e y non sono mantenute perfettamente insieme

33.2

Sovrapposizione di vibrazioni x e y con ampiezze uguali ma differenti fasi relative. Le componenti E x ed E y sono espresse in entrambe le notazioni reale e complessa.

332

Capitolo 33 • Polarizzazione

© 978-8808-22107-0

in modo che il campo elettrico vibri prima in una direzione, poi nell’altra, la polarizzazione va mutando costantemente. Ricordate che un atomo emette durante 10 8 s, e se un atomo emette una certa polarizzazione, e poi un altro atomo emette luce con una polarizzazione diversa, le polarizzazioni cambieranno ogni 10 8 s. Se la polarizzazione cambia più rapidamente di quanto possiamo percepirla, allora diciamo che la luce non è polarizzata, perché tutti gli effetti della polarizzazione si mediano. Nessuno degli effetti d’interferenza della polarizzazione si svelerebbe con la luce non polarizzata. Ma come vediamo dalla definizione, la luce è non polarizzata soltanto se siamo incapaci di scoprire se la luce è polarizzata o meno.

33.2

Polarizzazione della luce diffusa

Il primo esempio dell’effetto della polarizzazione che abbiamo già discusso è la diffusione della luce. Considerate un fascio di luce, per esempio proveniente dal Sole, risplendente nell’aria. Il campo elettrico produrrà oscillazioni delle cariche nell’aria, e il moto di queste cariche irradierà luce con la sua massima intensità in un piano normale rispetto alla direzione di vibrazione delle cariche. Il fascio proveniente dal Sole è non polarizzato, così la direzione di polarizzazione cambia costantemente, e la direzione di vibrazione delle cariche nell’aria cambia costantemente. Se consideriamo la luce diffusa a 90°, la vibrazione delle particelle cariche irradia verso l’osservatore soltanto quando la vibrazione è perpendicolare alla linea di visione dell’osservatore, e allora la luce sarà polarizzata lungo la direzione di vibrazione. Così la diffusione è un esempio di un modo per produrre la polarizzazione.

33.3

Birifrangenza

Un altro interessante effetto della polarizzazione è il fatto che vi sono sostanze per le quali l’indice di rifrazione è diverso per luce linearmente polarizzata in una direzione e linearmente polarizzata in un’altra direzione. Supponiamo di avere un certo materiale consistente in molecole lunghe, non sferiche, più lunghe che larghe, e supponiamo che queste molecole siano sistemate nella sostanza con i loro assi lunghi paralleli. Allora che cosa accade quando il campo elettrico oscillante attraversa questa sostanza? Supponete che a causa della struttura della molecola, gli elettroni nella sostanza rispondano più facilmente alle oscillazioni nella direzione parallela agli assi delle molecole di quanto essi risponderebbero se il campo elettrico cercasse di spingerli perpendicolarmente rispetto all’asse molecolare. In questo modo ci aspettiamo una diversa risposta per la polarizzazione in una direzione rispetto alla polarizzazione perpendicolare a quella direzione. Chiamiamo asse ottico la direzione degli assi delle molecole. Quando la polarizzazione è nella direzione dell’asse ottico, l’indice di rifrazione è diverso da quello che sarebbe se la direzione di polarizzazione fosse perpendicolare all’asse. Una simile sostanza è detta birifrangente. Essa ha due rifrangenze, cioè due indici di rifrazione, in dipendenza dalla direzione di polarizzazione all’interno della sostanza. Quale tipo di sostanza può essere birifrangente? In una sostanza birifrangente vi deve essere una certa quantità di allineamento, per una ragione o per l’altra, di molecole asimmetriche. Certamente un cristallo cubico, che ha la simmetria di un cubo, non può essere birifrangente. Ma cristalli lunghi, aghiformi, senza dubbio contengono molecole asimmetriche, e si osserva questo effetto molto facilmente. Vediamo quali effetti ci aspetteremmo se inviassimo luce polarizzata attraverso una lastra di sostanza birifrangente. Se la polarizzazione è parallela all’asse ottico, la luce sarà trasmessa con una velocità; se la polarizzazione è perpendicolare all’asse, la luce sarà trasmessa con una velocità differente. Una situazione interessante si presenta quando, diciamo, la luce è polarizzata linearmente a 45° rispetto all’asse ottico. Ora la polarizzazione a 45°, lo abbiamo già osservato, può essere rappresentata come una sovrapposizione delle polarizzazioni x e y di uguale ampiezza e in fase, come mostrato in FIGURA 33.2a. Poiché le polarizzazioni x e y si propagano con diverse velocità, le loro fasi cambiano a una rapidità diversa, quando la luce passa attraverso la sostanza.

© 978-8808-22107-0

33.3 • Birifrangenza

Così, benché all’inizio le vibrazioni x e y siano in fase, all’interno del materiale la differenza di fase fra le vibrazioni x e y è proporzionale alla profondità della sostanza. Al procedere della luce attraverso il materiale la polarizzazione cambia, come mostrato nella serie di diagrammi in FIGURA 33.2. Se lo spessore della lastra è tale da introdurre uno sfasamento di 90° fra le polarizzazioni x e y, come in FIGURA 33.2c, la luce uscirà polarizzata circolarmente. Un simile spessore è detto lamina a quarto d’onda, poiché introduce una differenza di fase di un quarto di ciclo fra le polarizzazioni x e y. Se luce linearmente polarizzata è inviata attraverso due lamine a quarto d’onda, risulterà di nuovo polarizzata piana, ma perpendicolare alla direzione originale, come possiamo vedere dalla FIGURA 33.2e. Si può facilmente illustrare questo fenomeno con un pezzo di cellophan. Il cellophan è costituito da molecole lunghe, fibrose, e non è isotropo, poiché le fibre giacciono di preferenza in una certa direzione. Per dimostrare la birifrangenza abbiamo bisogno di un fascio di luce linearmente polarizzata, e possiamo convenientemente ottenere questo facendo passare luce non polarizzata attraverso una lastra di polaroid. Il polaroid, che discuteremo in seguito con maggior dettaglio, ha l’utile proprietà di trasmettere con assorbimento minimo la luce che è linearmente polarizzata parallelamente all’asse del polaroid, mentre la luce polarizzata con direzione perpendicolare all’asse del polaroid è fortemente assorbita. Quando facciamo passare luce non polarizzata attraverso una lastra di polaroid, soltanto la parte del fascio non polarizzato che vibra parallela all’asse del polaroid l’attraversa, in modo che il fascio trasmesso è linearmente polarizzato. Questa stessa proprietà del polaroid è anche utile nel rilevare la direzione di polarizzazione di un fascio polarizzato linearmente, o nel determinare se un fascio è linearmente polarizzato o meno. Si fa semplicemente passare il fascio di luce attraverso la lastra di polaroid e si ruota il polaroid nel piano perpendicolare al fascio. Se il fascio è linearmente polarizzato, non sarà trasmesso attraverso la lastra quando l’asse del polaroid è normale alla direzione di polarizzazione. Il fascio trasmesso è soltanto lievemente attenuato quando l’asse della lastra di polaroid è ruotato di 90°. Se l’intensità trasmessa è indipendente dall’orientamento del polaroid, il fascio non è linearmente polarizzato. Per dimostrare la birifrangenza del cellophan, usiamo due lastre di polaroid, come mostrato in FIGURA 33.3. La prima ci dà un fascio linearmente Cellophan polarizzato che facciamo passare attraverso il cellophan e poi attraverso la seconda lastra di polaroid, che serve a rilevare qualsiasi effetto il cellophan possa avere avuto sulla luce polarizzata che lo ha attraversato. Se innanzitutto poniamo gli assi delle due lastre di polaroid l’uno perpendicolare all’altro e togliamo il cellophan, la luce non sarà trasmessa attraverso Polaroid il secondo polaroid. Se ora introduciamo il cellophan fra le due lastre di polaroid e ruotiamo la lastra attorno all’asse del fascio, osserviamo che in generale il cellophan fa sì che un po’ di luce possa attraversare il secondo FIGURA 33.3 Dimostrazione sperimentale polaroid. Però, vi sono due orientamenti della lastra di cellophan, perpendi- della birifrangenza del cellophan. colari l’uno all’altro, che non consentono alla luce di attraversare il secondo I vettori elettrici della luce sono indicati linee punteggiate. Gli assi delle lastre polaroid. Questi orientamenti per cui la luce linearmente polarizzata è tra- da di polaroid lungo i quali la luce passa smessa attraverso il cellophan senza effetti sulla direzione di polarizzazione e gli assi ottici del cellophan sono indicati devono essere la direzione parallela e la direzione perpendicolare all’asse da frecce. Il fascio incidente non è polarizzato. ottico della lastra di cellophan. Supponiamo che la luce attraversi il cellophan con due diverse velocità in questi due diversi orientamenti, ma sia trasmessa senza cambiamento nella direzione di polarizzazione. Quando il cellophan è girato a mezza strada fra questi due orientamenti, come mostrato in FIGURA 33.3, vediamo che la luce trasmessa attraverso la seconda lastra di polaroid è brillante. Accade appunto che il comune cellophan usato commercialmente per i pacchi è molto vicino a uno spessore di mezza lunghezza d’onda per la maggior parte dei colori della luce bianca. Una lamina simile ruoterà di 90° l’asse della luce polarizzata linearmente se il fascio incidente linearmente polarizzato fa un angolo di 45° rispetto all’asse ottico, cosicché il fascio che emerge dal cellophan vibrerà allora nella direzione giusta per attraversare la seconda lastra di polaroid. Se usiamo luce bianca per la nostra dimostrazione, la lastra di cellophan sarà esattamente di uno spessore di mezza onda soltanto per una particolare componente della luce bianca, e il fascio trasmesso avrà il colore di questa componente. Il colore trasmesso dipende dallo spessore

333

334

Capitolo 33 • Polarizzazione

© 978-8808-22107-0

della lamina di cellophan, e possiamo variare l’effettivo spessore del cellophan inclinandolo in modo che la luce attraversi il cellophan diagonalmente, conseguentemente con un percorso più lungo nel cellophan. Quando la lastra è inclinata, il colore trasmesso cambia. Con cellophan di diversi spessori si possono costruire filtri che trasmetteranno colori diversi. Questi filtri hanno l’interessante proprietà di trasmettere un colore quando le due lastre di polaroid hanno i loro assi perpendicolari, e il colore complementare quando gli assi delle due lastre di polaroid sono paralleli. Un’altra interessante applicazione delle molecole allineate è del tutto pratica. Alcune materie plastiche sono composte di molecole lunghissime e complicate tutte intrecciate insieme. Quando la materia plastica è solidificata con molta cura, le molecole sono tutte intrecciate in una massa, in modo che sono tanto allineate in una direzione quanto in un’altra, e così la materia plastica non è particolarmente birifrangente. Comunemente vi sono tensioni e sollecitazioni che sono intervenute quando il materiale si è solidificato, in modo che il materiale non è perfettamente omogeneo. Tuttavia, se applichiamo una tensione a un pezzo di questo materiale plastico, è come se stessimo tirando un intero groviglio di lacci e vi sarà un maggior numero di lacci preferibilmente allineati paralleli alla tensione che in qualsiasi altra direzione. Così, quando si applica una tensione ad alcune materie plastiche, esse diventano birifrangenti e si possono vedere gli effetti della birifrangenza facendo passare luce polarizzata attraverso la plastica. Se esaminiamo la luce trasmessa attraverso una lastra di polaroid, si osserveranno disegni di frange luminose e scure (a colori, se viene usata luce bianca). I disegni si muovono quando viene applicata una tensione al campione; contando le frange e vedendo dove si trova la maggior parte di esse, si può determinare l’entità della tensione. Gli ingegneri usano questo fenomeno come un mezzo per trovare le tensioni in pezzi di forma strana che sono difficili da calcolare. Un altro interessante esempio di un modo per ottenere birifrangenza è per mezzo di una sostanza liquida. Considerate un liquido composto di lunghe molecole asimmetriche che trasportano una carica media positiva o negativa vicino agli estremi della molecola, cosicché la molecola è un dipolo elettrico. Negli urti all’interno del liquido le molecole saranno comunemente orientate a caso, con tante molecole dirette in una direzione quante in un’altra. Se applichiamo un campo elettrico le molecole tenderanno ad allinearsi, e nel momento in cui si allineano il liquido diviene birifrangente. Con due lastre di polaroid e una cella trasparente contenente un simile liquido polare, possiamo predisporre un apparato che ha la proprietà di trasmettere la luce soltanto quando viene applicato il campo elettrico. Così abbiamo un interruttore elettrico per la luce, che è detto cella di Kerr. Questo effetto, che un campo elettrico può produrre birifrangenza in certi liquidi, è detto l’effetto Kerr.

33.4

Polarizzatori

Finora abbiamo considerato sostanze in cui l’indice di rifrazione è diverso per la luce polarizzata in direzioni diverse. Di grande valore pratico sono quei cristalli e altre sostanze in cui non soltanto l’indice, ma anche il coefficiente di assorbimento è diverso per luce polarizzata in direzioni diverse. Con gli stessi argomenti che hanno descritto il concetto di birifrangenza, è comprensibile che l’assorbimento possa variare con la direzione in cui le cariche sono forzate a vibrare in una sostanza anisotropa. La tormalina è un vecchio famoso esempio e il polaroid è un altro esempio. Il polaroid consiste di un sottile strato di piccoli cristalli di herapatite (un sale di iodio e chinino) tutti allineati con i loro assi paralleli. Questi cristalli assorbono la luce quando le oscillazioni sono in una direzione, ma non l’assorbono in maniera apprezzabile quando le oscillazioni sono nell’altra direzione. Supponiamo di inviare su una lastra di polaroid luce polarizzata linearmente a un angolo ✓ con la direzione che lascia passare la luce. Quale intensità passerà? Questa luce incidente può essere separata in una componente perpendicolare alla direzione che lascia passare, che è proporzionale a sen ✓, e una componente lungo la direzione che lascia passare, che è proporzionale a cos ✓. L’ampiezza che esce dal polaroid è soltanto la parte cos ✓: la componente sen ✓ viene assorbita. L’ampiezza che attraversa il polaroid è minore dell’ampiezza che è entrata di un fattore cos ✓.

33.5 • Attività ottica

© 978-8808-22107-0

335

L’energia che attraversa il polaroid, cioè l’intensità della luce, è proporzionale al quadrato di cos ✓; quindi cos2 ✓ è l’intensità trasmessa quando la luce entra polarizzata a un angolo ✓ rispetto alla direzione che lascia passare la luce. L’intensità assorbita, naturalmente, è sen2 ✓. Un interessante paradosso è presentato dalla seguente situazione. Sappiamo che non è possibile inviare un fascio di luce attraverso due lastre di polaroid con i loro assi incrociati ad angolo retto. Ma se introduciamo una terza lastra di polaroid fra le prime due, con il suo asse a 45° rispetto agli assi incrociati, un po’ dì luce viene trasmessa. Sappiamo che il polaroid assorbe luce, ma non ne crea. Nondimeno l’aggiunta di un terzo polaroid a 45° permette il passaggio di più luce. L’analisi di questo fenomeno è lasciata come esercizio allo studente. Uno dei più interessanti esempi di polarizzazione non è in cristalli complicati o in sostanze particolari, ma in una delle più semplici e familiari situazioni: la riflessione della luce da una superficie. Lo crediate o no, quando la luce è riflessa da una superficie di vetro può essere polarizzata, i i e la spiegazione fisica di ciò è molto semplice. Fu scoperto empiricamente 90° da Brewster che la luce riflessa da una superficie è completamente polarizzata se il fascio riflesso e il fascio rifratto nel materiale formano un angolo retto. La situazione è illustrata in FIGURA 33.4. Se il fascio incidente r è polarizzato nel piano di incidenza, non vi sarà affatto riflessione. Soltanto se il fascio incidente è polarizzato perpendicolarmente al piano di incidenza sarà riflesso. La ragione è molto facile da capire. Nel materiale FIGURA 33.4 Riflessione di luce polarizzata riflettente la luce è polarizzata trasversalmente, e sappiamo che è il moto linearmente all’angolo di Brewster. La direzione delle cariche nel materiale che genera il fascio emergente, che chiamiamo di polarizzazione è indicata da frecce tratteggiate; fascio riflesso. La sorgente di questa luce cosiddetta riflessa non consiste i pallini indicano la polarizzazione normale al foglio. semplicemente nel fatto che il fascio incidente viene riflesso; la nostra più profonda comprensione di questo fenomeno ci dice che il fascio incidente forza un’oscillazione delle cariche nel mezzo, che a sua volta genera il fascio riflesso. Dalla FIGURA 33.4 è chiaro che soltanto le oscillazioni normali alla pagina possono irradiare nella direzione della riflessione, e conseguentemente il fascio riflesso sarà polarizzato perpendicolarmente al piano di incidenza. Se il raggio incidente è polarizzato nel piano di incidenza, non vi sarà luce riflessa. Questo fenomeno si dimostra senza difficoltà facendo riflettere un fascio linearmente polarizzato su un pezzo di vetro piatto. Se il vetro viene ruotato in modo da presentare diversi angoli di incidenza al fascio polarizzato, si osserva una netta attenuazione dell’intensità riflessa quando l’angolo di incidenza passa attraverso l’angolo di Brewster. Questa attenuazione si osserva soltanto se il piano di polarizzazione giace nel piano di incidenza. Se il piano di polarizzazione è perpendicolare al piano di incidenza, si osserva la solita intensità riflessa a tutti gli angoli.

33.5

Attività ottica

Un altro notevole effetto della polarizzazione si osserva nei materiali composti da molecole che non sono simmetriche per riflessione: molecole strutturate come un cavatappi, come una mano guantata, o di qualsiasi forma che, se viste attraverso uno specchio, sarebbero invertite nello stesso modo in cui un guanto della mano sinistra si riflette come un guanto della mano destra. Supponete che tutte le molecole nella sostanza siano uguali, cioè nessuna è l’immagine speculare di un’altra. Una tale sostanza y può mostrare un interessante effetto detto attività ottica, a causa della quale, Ey Ey quando una luce linearmente polarizzata passa attraverso la sostanza, la z1+A Ex direzione di polarizzazione ruota attorno all’asse del fascio. 0 z1 z2 La comprensione del fenomeno dell’attività ottica richiede qualche calx colo, ma possiamo vedere qualitativamente come l’effetto potrebbe avvenire, senza in realtà eseguire calcoli. Considerate una molecola asimmetrica a forma di spirale, come mostrato in FIGURA 33.5. Le molecole non hanno FIGURA 33.5 Una molecola con una forma che non è simmetrica quando è riflessa in uno specchio. bisogno in realtà di essere formate come un cavatappi per mostrare attività Un fascio di luce, polarizzata linearmente in direzione ottica, ma questa è una forma semplice che prenderemo come esempio y, investe la molecola.

336

Capitolo 33 • Polarizzazione

© 978-8808-22107-0

tipico di quelle che non hanno simmetria per riflessione. Quando un fascio di luce linearmente polarizzato lungo la direzione y investe questa molecola, il campo elettrico forzerà le cariche su e giù lungo l’elica, generando così una corrente in direzione y e irradiando un campo elettrico Ey polarizzato in direzione y. Però se gli elettroni sono vincolati a muoversi lungo la spirale, essi devono muoversi anche nella direzione x quando sono forzati su e giù. Quando una corrente fluisce lungo la spirale, fluisce anche verso il foglio a z = z1 e fuori dal foglio a z = z1 + A, se A è il diametro della nostra spirale molecolare. Si potrebbe supporre che la corrente in direzione x non produca radiazione netta, poiché le correnti sono in direzioni opposte sui lati opposti della spirale. Però, se consideriamo le componenti x del campo elettrico che arrivano in z = z2 , vediamo che il campo irradiato dalla corrente in z = z1 + A e il campo irradiato da z = z1 arrivano in z2 separati nel tempo di una quantità A/c, e quindi separati in fase di ⇡ + ! A/c. Poiché la differenza di fase non è esattamente ⇡, i due campi non si annullano esattamente, e rimaniamo con una piccola componente x nel campo elettrico generata dal moto degli elettroni nella molecola, mentre il campo elettrico forzante ha soltanto una componente y. Questa piccola componente x, sommata alla grande componente y, produce un campo risultante lievemente inclinato rispetto all’asse y, la direzione originale di polarizzazione. Quando la luce attraversa il materiale, la direzione di polarizzazione ruota attorno all’asse del fascio. Tracciando alcuni esempi e considerando le correnti che saranno messe in moto da un campo elettrico incidente, ci si può convincere che l’esistenza dell’attività ottica e il segno di rotazione sono indipendenti dall’orientamento delle molecole. Lo zucchero di granoturco è una comune sostanza che possiede attività ottica. Il fenomeno si dimostra facilmente con una lastra di polaroid per produrre un fascio linearmente polarizzato, una cella di trasmissione contenente lo zucchero e una seconda lastra di polaroid per determinare la rotazione della direzione di polarizzazione quando la luce attraversa lo zucchero.

33.6

L’intensità della luce riflessa

Consideriamo ora quantitativamente il coefficiente di riflessione in funzione dell’angolo. La FIGURA 33.6a mostra un fascio di luce che colpisce una superficie di vetro, dove è parzialmente riflesso e parzialmente rifratto nel vetro. Supponiamo che il fascio incidente, di ampiezza unitaria, sia linearmente polarizzato perpendicolarmente al piano del foglio. Chiameremo b l’ampiezza dell’onda riflessa e a l’ampiezza dell’onda rifratta. Le onde rifratta e riflessa saranno, naturalmente, linearmente polarizzate, e i vettori campo elettrico delle onde incidente, riflessa e rifratta sono tutti paralleli fra loro. La FIGURA 33.6b mostra la stessa situazione, ma ora supponiamo che l’onda incidente, di ampiezza unitaria, sia polarizzata nel piano del foglio. Ora chiamiamo rispettivamente B e A le ampiezze dell’onda riflessa e rifratta. Vogliamo calcolare quanto è forte la riflessione nelle due situazioni illustrate nelle FIGURE 33.6a e 33.6b. Sappiamo che quando l’angolo fra il fascio b B –1 –1 riflesso e il fascio rifratto è un angolo retto, non vi sarà onda riflessa in FIGURA 33.6b, ma vediamo se possiamo a A ottenere una risposta quantitativa, una formula esatta i i r r per B e b in funzione dell’angolo di incidenza i. i i Il principio che dobbiamo capire è il seguente. Le correnti che sono generate nel vetro producono due onde. Per prima cosa, esse producono l’onda riflessa. 1 1 Vetro Vetro Inoltre, sappiamo che se non vi fossero correnti generate nel vetro, l’onda incidente continuerebbe indisturbata nel vetro. Ricordate che sono tutte le sorgenti nel mondo a produrre il campo risultante. La sorgente FIGURA 33.6 Un’onda incidente di ampiezza unitaria è riflessa e rifratta del fascio di luce incidente produce un campo di amda una superficie di vetro. In (a) l’onda incidente è linearmente polarizzata piezza unitaria che dovrebbe muoversi nel vetro lungo perpendicolarmente al piano del foglio. In (b) l’onda incidente è polarizzata la linea tratteggiata nella figura. Questo campo non linearmente nella direzione mostrata dal vettore elettrico tratteggiato.

33.6 • L’intensità della luce riflessa

© 978-8808-22107-0

viene osservato, e quindi le correnti generate nel vetro devono produrre un campo di ampiezza 1 che si muove lungo la linea tratteggiata. Usando questo fatto, calcoleremo l’ampiezza delle onde rifratte, a e A. In FIGURA 33.6a vediamo che il campo di ampiezza b è irradiato dal moto delle cariche interne al vetro che rispondono al campo a all’interno del vetro, e che quindi b è proporzionale ad a. Potremmo supporre che, poiché le nostre due figure sono esattamente la stessa, salvo per la direzione di polarizzazione, il rapporto B/A abbia lo stesso valore del rapporto b/a. Questo non è affatto vero però, poiché nella FIGURA 33.6b le direzioni di polarizzazione non sono tutte parallele l’una all’altra, come lo sono in FIGURA 33.6a. È soltanto la componente di A che è perpendicolare a B, A cos(i + r), che produce effettivamente B. L’esatta espressione di proporzionalità è allora b B = a A cos (i + r)

(33.1)

Ora usiamo un trucco. Sappiamo che in entrambi i casi a e b della FIGURA 33.6 il campo elettrico nel vetro deve produrre oscillazioni delle cariche che generano un campo di ampiezza 1, polarizzato parallelamente al fascio incidente, e che si muove in direzione della linea tratteggiata. Ma vediamo dalla parte b della figura che soltanto la componente di A che è normale alla linea tratteggiata ha la giusta polarizzazione per produrre questo campo, mentre in FIGURA 33.6a l’intera ampiezza a è efficace, poiché la polarizzazione dell’onda a è parallela alla polarizzazione dell’onda di ampiezza 1. Quindi possiamo scrivere A cos (i a

r)

=

1 1

(33.2)

dato che le due ampiezze del primo membro dell’equazione (33.2) producono entrambe l’onda di ampiezza 1. Dividendo l’equazione (33.1) per l’equazione (33.2), otteniamo B cos (i + r) = b cos (i r)

(33.3)

un risultato che possiamo verificare rispetto a quello che già sappiamo. Se poniamo i + r = 90°, l’equazione (33.3) dà B = 0, come Brewster dice che dovrebbe essere, così i nostri risultati, almeno finora, non sono sbagliati in modo evidente. Abbiamo supposto ampiezze unitarie per le onde incidenti, cosicché |B|2 /12 è il coefficiente di riflessione per onde polarizzate nel piano di incidenza e |b|2 /12 è il coefficiente di riflessione per onde polarizzate perpendicolarmente al piano di incidenza. Il rapporto di questi due coefficienti di riflessione è determinato dall’equazione (33.3). Ora operiamo un miracolo, e calcoliamo non soltanto il rapporto, ma ciascun coefficiente |B|2 e |b|2 separatamente! Sappiamo dalla conservazione dell’energia che l’energia dell’onda rifratta deve essere uguale all’energia incidente meno l’energia nell’onda riflessa, 1 |B|2 in un caso, 1 |b|2 nell’altro. Di più, l’energia che passa nel vetro in FIGURA 33.6b sta all’energia che passa nel vetro in FIGURA 33.6a come il rapporto dei quadrati delle ampiezze rifratte | A|2 /|a|2 . Ci si può chiedere se sappiamo in realtà come calcolare l’energia all’interno del vetro, perché, dopotutto, vi sono energie di moto degli atomi in aggiunta all’energia nel campo elettrico. Ma è ovvio che tutti i vari contributi all’energia totale saranno proporzionali al quadrato dell’ampiezza del campo elettrico. Quindi possiamo scrivere 1 1

|B|2 | A|2 = 2 |b| |a|2

(33.4)

Sostituiamo ora l’equazione (33.2) per eliminare A/a nell’espressione sopra, ed esprimiamo B in funzione di b per mezzo dell’equazione (33.3): 26 661 64

|b|2

3 1 1 cos2 (i + r) 77 = cos2 (i r) 775 1 |b|2 cos2 (i

r)

(33.5)

337

338

Capitolo 33 • Polarizzazione

© 978-8808-22107-0

Questa equazione contiene soltanto un’ampiezza incognita, b. Risolvendo rispetto a |b|2 , otteniamo sen2 (i r) |b|2 = (33.6) sen2 (i + r) e, con l’aiuto della (33.3), |B|2 =

tg2 (i r) tg2 (i + r)

(33.7)

Così abbiamo trovato il coefficiente di riflessione |b|2 per un’onda incidente polarizzata perpendicolarmente al piano d’incidenza, e anche il coefficiente di riflessione |B|2 per un’onda incidente polarizzata nel piano d’incidenza! È possibile proseguire con argomenti di questa natura e stabilire che b è reale. Per provarlo, si deve considerare un caso in cui la luce stia arrivando da entrambi i lati della superficie di vetro nello stesso tempo, una situazione non facile da predisporre sperimentalmente, ma divertente da analizzare teoricamente. Se analizziamo questo caso generale, possiamo provare che b deve essere reale, e quindi in realtà che ± sen (i r) b= sen (i + r) È anche possibile determinarne il segno considerando il caso di una sottilissima lamina in cui vi è riflessione dalla superficie frontale e posteriore, e calcolando quanta luce viene riflessa. Sappiamo quanta luce dovrebbe essere riflessa da una lamina sottile, dato che sappiamo quanta corrente viene generata, e abbiamo anche calcolato i campi prodotti da tali correnti. Con questi argomenti si può dimostrare che b=

sen (i r) sen (i + r)

B=

tg (i r) tg (i + r)

(33.8)

Queste espressioni per i coefficienti di riflessione in funzione degli angoli di incidenza e rifrazione sono chiamate formule di riflessione di Fresnel. Se consideriamo il limite quando gli angoli i e r vanno a zero, troviamo per il caso d’incidenza normale che (i r)2 B2 ⇡ b2 ⇡ (i + r)2 per entrambe le polarizzazioni, poiché i seni sono praticamente uguali agli angoli come pure le tangenti. Ma sappiamo che sen i/ sen r = n, e quando gli angoli sono piccoli, i/r ⇡ n. Così è facile dimostrare che il coefficiente di riflessione per l’incidenza normale è B2 = b2 =

(n 1)2 (n + 1)2

È interessante calcolare quanta luce viene riflessa a incidenza normale dalla superficie dell’acqua, per esempio. Per l’acqua n = 4/3, cosicché il coefficiente di riflessione è (1/7)2 ⇡ 2%. A incidenza normale soltanto il due per cento della luce è riflessa dalla superficie dell’acqua.

33.7

Rifrazione anomala

L’ultimo effetto della polarizzazione che considereremo fu in realtà uno dei primi a essere scoperto: la rifrazione anomala. Dei marinai di ritorno dall’Islanda riportarono in Europa cristalli di spato d’Islanda (CaCO3 ) che avevano la divertente proprietà di fare apparire raddoppiata ogni cosa vista attraverso il cristallo, cioè come due immagini. Questo giunse all’attenzione di Huygens, e giocò un importante ruolo nella scoperta della polarizzazione. Come accade spesso, i fenomeni che sono scoperti per primi sono, in ultima analisi, i più difficili da spiegare. È soltanto

© 978-8808-22107-0

33.7 • Rifrazione anomala

339

dopo che abbiamo capito interamente un concetto fisico che possiamo accuratamente scegliere quei fenomeni che dimostrano il concetto più Fronte d’onda chiaramente e semplicemente. La rifrazione anomala è un caso particolare della birifrangenza, che abbiamo già considerato. La rifrazione anomala si verifica quando l’asse Ex Asse ottico, l’asse lungo delle nostre molecole asimmetriche, non è parallelo alla ottico superficie del cristallo. In FIGURA 33.7 sono disegnati due pezzi di materiale birifrangente, con l’asse ottico come indicato. Nella figura in alto, il fascio di luce incidente Fronte che cade sul materiale è polarizzato linearmente in una direzione perpenEy d’onda dicolare all’asse ottico del materiale. Quando questo fascio colpisce la superficie del materiale, ciascun punto sulla superficie agisce come sorgente di un’onda che si propaga nel cristallo con velocità v? , la velocità Asse ottico della luce nel cristallo quando il piano di polarizzazione è normale all’asse ottico. Il fronte d’onda è semplicemente l’inviluppo o luogo di tutte queste piccole onde sferiche, e questo fronte d’onda si muove in linea retta attraverso il cristallo ed esce dall’altra parte. Questo è proprio il comportamento FIGURA 33.7 Il diagramma in alto mostra la del raggio ordinario attraverso un cristallo abituale che ci aspetteremmo, e questo raggio è chiamato raggio ordinario. traiettoria birifrangente. Il raggio straordinario è mostrato Nella figura in basso la luce polarizzata linearmente cadendo sul cri- nel diagramma in basso. L’asse ottico giace stallo ha la sua direzione di polarizzazione ruotata di 90°, cosicché l’asse nel piano del foglio. ottico giace nel piano di polarizzazione. Quando consideriamo ora le piccole onde che hanno origine in qualsiasi punto sulla superficie del cristallo, vediamo che esse non si propagano come onde sferiche. La luce che si propaga lungo l’asse ottico viaggia con velocità v? perché la polarizzazione è perpendicolare all’asse ottico, mentre la luce che si propaga perpendicolarmente all’asse ottico viaggia con velocità v k perché la polarizzazione è parallela all’asse ottico. In un materiale birifrangente v k , v? , e nella figura v k < v? . Un’analisi più completa mostrerà che le onde si propagano sulla superficie di un ellissoide, con l’asse ottico come asse maggiore dell’ellissoide. L’inviluppo di queste onde ellittiche è il fronte d’onda che procede attraverso il cristallo nella direzione mostrata. Di nuovo sulla superficie posteriore il fascio sarà deflesso proprio come fu deflesso sulla superficie frontale, così che la luce emerge parallela al raggio incidente, ma spostata rispetto a esso. Chiaramente, questo fascio non segue la legge di Snell, ma va in una direzione straordinaria. È quindi chiamato raggio straordinario. Quando un fascio non polarizzato colpisce un cristallo a rifrazione anomala, esso viene separato in un raggio ordinario, che si propaga attraverso il cristallo in modo normale, e un raggio straordinario, che viene spostato mentre attraversa il cristallo. Questi due raggi emergenti sono polarizzati linearmente perpendicolarmente l’uno all’altro. Che questo sia vero può essere dimostrato senza difficoltà con una lastra di polaroid per analizzare la polarizzazione dei raggi emergenti. Possiamo anche dimostrare che la nostra interpretazione di questo fenomeno è corretta inviando luce polarizzata linearmente nel cristallo. Orientando in modo opportuno la direzione di polarizzazione nel fascio incidente, possiamo far traversare questa luce senza che si scinda, oppure possiamo farle attraversare il cristallo senza scindersi ma con uno spostamento. Abbiamo rappresentato tutti i vari casi di polarizzazione nelle FIGURE 33.1 e 33.2 come sovrapposizione di due casi particolari di polarizzazione, vale a dire x e y in diverse quantità e fasi. Si sarebbero potute usare altre coppie altrettanto bene. La polarizzazione lungo due qualsiasi assi perpendicolari x 0, y 0 inclinati rispetto a x e y servirebbe altrettanto bene (per esempio, qualsiasi polarizzazione può essere costituita da sovrapposizioni dei casi a ed e della FIGURA 33.2). Tuttavia, è interessante che quest’idea possa essere estesa anche ad altri casi. Per esempio, qualunque polarizzazione lineare può essere realizzata sovrapponendo opportune quantità di polarizzazioni circolari sinistrorsa e destrorsa a fasi opportune (casi c e g della FIGURA 33.2), poiché due vettori uguali rotanti in direzioni opposte si sommano per dare un unico vettore oscillante in FIGURA 33.8 Due vettori linea retta (FIGURA 33.8). Se la fase di uno è spostata rispetto a quella dell’altro, la linea è ruotanti in verso opposto inclinata. Così tutte le rappresentazioni della FIGURA 33.1 potrebbero essere classificate come di uguale ampiezza «la sovrapposizione di quantità uguali di luce polarizzata circolarmente destrorsa e sinistrorsa si sommano per produrre un vettore in una direzione con varie fasi relative». Quando la componente sinistra ritarda rispetto alla destra nella fase, fissa, ma con ampiezza la direzione della polarizzazione lineare cambia. Quindi i materiali otticamente attivi sono in oscillante.

340

Capitolo 33 • Polarizzazione

33.9 Una carica in movimento su un cerchio in risposta alla luce polarizzata circolarmente.

un certo senso birifrangenti. Le loro proprietà possono essere descritte dicendo che essi hanno indici diversi per luce polarizzata circolarmente destrorsa e sinistrorsa. La sovrapposizione di luce circolarmente polarizzata destrorsa e sinistrorsa di diverse intensità produce luce polarizzata ellitticamente. La luce polarizzata circolarmente ha un’altra interessante proprietà: essa trasporta un momento della quantità di moto (rispetto alla direzione di propagazione). Per illustrare questo, supponiamo che una luce del genere investa un atomo rappresentato da un oscillatore armonico che può essere spostato ugualmente bene in qualsiasi direzione nel piano x y. Allora lo spostamento x dell’elettrone risponderà alla componente Ex del campo, mentre la componente y risponderà, analogamente, all’uguale componente Ey del campo con un ritardo di fase di 90°. Cioè l’elettrone rispondendo descrive un cerchio, con velocità angolare !, in risposta al campo elettrico rotante della luce (FIGURA 33.9). In dipendenza delle caratteristiche di smorzamento della risposta dell’oscillatore, la direzione dello spostamento a dell’elettrone, e la direzione della forza qe E su di esso non sono necessariamente le stesse, ma ruotano insieme. E può avere una componente perpendicolare ad a, così viene eseguito lavoro sul sistema e viene esercitata una coppia ⌧. Il lavoro fatto per secondo è ⌧!. Su un periodo di tempo T l’energia assorbita è ⌧!T, mentre ⌧T è il momento della quantità di moto ceduto alla materia che assorbe energia. Vediamo quindi che un fascio di luce destrorsa polarizzata circolarmente contenente un’energia totale E trasporta un momento della quantità di moto (con vettore diretto lungo la direzione di propagazione) E/!. Quando questo fascio è assorbito quel momento della quantità di moto è ceduto all’assorbitore. La luce circolare sinistrorsa trasporta un momento della quantità di moto di segno opposto, E/!.

y

E a

ω x

FIGURA

© 978-8808-22107-0

34

Effetti relativistici nella radiazione

34.1

Sorgenti in movimento

In questo capitolo descriveremo numerosi effetti eterogenei legati alla radiazione, e poi avremo finito con la teoria classica della propagazione della luce. Nella nostra analisi della luce, siamo andati piuttosto lontano e considerevolmente in dettaglio. I soli fenomeni di qualche rilievo associati con la radiazione elettromagnetica che non abbiamo discusso sono ciò che accade se le onde radio sono contenute in una scatola con pareti riflettenti, essendo le dimensioni della scatola paragonabili a una lunghezza d’onda, oppure sono trasmesse per un lungo tubo. I fenomeni delle cosiddette cavità risonanti e guide d’onda li discuteremo in seguito; useremo in primo luogo un altro esempio fisico – il suono – e quindi ritorneremo a questo argomento. Eccettuato questo, il presente capitolo è la nostra ultima considerazione sulla teoria classica della luce. Possiamo riassumere tutti gli effetti che discuteremo ora sottolineando che essi hanno a che fare con gli effetti delle sorgenti in movimento. Non supporremo più che la sorgente sia localizzata, con il suo moto a velocità relativamente piccola vicino a un punto fisso. Ricordiamo che le leggi fondamentali dell’elettrodinamica dicono che, a grandi distanze da una carica in movimento, il campo elettrico è dato dalla formula E=

q d2 e R0 2 4⇡✏ 0 c dt 2

(34.1)

La derivata seconda del vettore unitario e R0 , che è orientato verso l’apparente direzione della carica, è la caratteristica determinante del campo elettrico. Questo vettore unitario non è orientato verso la posizione attuale della carica, naturalmente, ma piuttosto nella direzione in cui sembra che sia la carica, se l’informazione viaggia soltanto alla velocità finita c dalla carica all’osservatore. Associato al campo elettrico è il campo magnetico, sempre perpendicolare al campo elettrico e perpendicolare alla direzione apparente della sorgente, dato dalla formula B = e R0 ⇥

E c

Finora abbiamo considerato soltanto il caso in cui i moti siano a velocità non relativistica, cosicché non si deve considerare alcun moto apprezzabile in direzione della sorgente. Ora generalizzeremo maggiormente e studieremo il caso in cui il moto sia a una velocità arbitraria, e vedremo quali differenti effetti ci si possono aspettare in tali circostanze. Prenderemo il moto a una velocità arbitraria, ma naturalmente supporremo ora che il rilevatore sia molto lontano dalla sorgente. Sappiamo già dalla nostra discussione nel capitolo 28 che le sole cose che contano in d2 e R0 /dt 2 sono le variazioni nella direzione di e R0 . Siano (x, y, z) le coordinate della carica, con z misurata lungo la direzione di osservazione (FIGURA 34.1). A un dato momento nel tempo, diciamo al momento ⌧, le tre componenti della posizione sono x(⌧), y(⌧), z(⌧) e la distanza R è, con buona approssimazione, uguale a R(⌧) = R0 + z(⌧).

(34.2)

x (τ) y (τ) z (τ)

y

eR'

T A

P R0

x

O z

34.1 Traiettoria di una carica in movimento. La vera posizione al tempo ⌧ è in T, ma la posizione ritardata è in A.

FIGURA

342

Capitolo 34 • Effetti relativistici nella radiazione

© 978-8808-22107-0

Ora la direzione del vettore e R0 dipende principalmente da x e da y, ma quasi per nulla da z: le componenti trasversali del vettore unitario sono x/R e y/R, e quando differenziamo queste componenti otteniamo nel denominatore cose quali R2 : d ✓ x ◆ dx 1 = dt R dt R

dz x dt R2

Così quando siamo abbastanza lontani gli unici termini di cui dobbiamo preoccuparci sono le variazioni di x e di y. Pertanto fuori il fattore R0 otteniamo Ex =

q d2 x 0 4⇡✏ 0 c2 R0 dt 2

Ey =

q d2 y 0 2 4⇡✏ 0 c R0 dt 2

(34.3)

dove R0 è la distanza, più o meno, da q; prendiamola uguale alla distanza OP dall’origine delle coordinate (x, y, z). Così il campo elettrico è una costante moltiplicata per una semplicissima cosa, le derivate seconde delle coordinate x e y. (Potremmo esprimerci più matematicamente chiamando x e y le componenti trasversali del vettore posizione della carica, r, ma questo non aggiungerebbe niente alla chiarezza dell’esposizione.) Naturalmente, ci rendiamo conto che le coordinate devono essere misurate al tempo ritardato. Qui, troviamo che z(⌧) influenza il ritardo. Qual è il tempo ritardato? Se il tempo di osservazione è detto t (il tempo in P) allora il tempo ⌧ al quale questo corrisponde ad A non è il tempo t, ma è ritardato della distanza totale che la luce deve percorrere, divisa per la velocità della luce. In prima approssimazione, questo ritardo è R0 /c, una costante (una caratteristica non interessante), ma nell’approssimazione successiva dobbiamo includere gli effetti della posizione in direzione z al tempo ⌧, poiché se q è un po’ più indietro, vi è un ritardo un po’ maggiore. Questo è un effetto che abbiamo trascurato prima, ed è la sola variazione necessaria per rendere validi i nostri risultati per tutte le velocità. Quello che dobbiamo fare ora è scegliere un certo valore di t, calcolare da esso il valore di ⌧ e trovare dove sono x e y a quel ⌧. Questi sono allora i valori ritardati x e y, che chiamiamo x 0 e y 0, le cui derivate seconde determinano il campo. Così ⌧ è determinato da t =⌧+ e

R0 z(⌧) + c c

x 0(t) = x(⌧) y 0(t) = y(⌧)

(34.4)

Queste sono equazioni complesse, ma è abbastanza facile dare una rappresentazione geometrica per descrivere la loro soluzione. Questa rappresentazione ci darà una buona indicazione qualitativa di come vanno le cose, ma è ancora necessaria una gran quantità di matematica particolareggiata per dedurre i risultati precisi di un problema complesso.

34.2

Scoperta del moto «apparente»

L’equazione di cui sopra ha una semplificazione interessante. Se trascuriamo il ritardo costante R0 /c, che non interessa, che significa soltanto che dobbiamo cambiare l’origine di t di una costante, allora l’equazione ci dice che ct = c⌧ + z(⌧) x 0 = x(⌧) y 0 = y(⌧)

(34.5)

34.2 • Scoperta del moto «apparente»

© 978-8808-22107-0

343

34.2 Una soluzione geometrica dell’equazione (34.5) per trovare x 0 (t). FIGURA

x' (t)

x

z(τ)



10

10

5

5 z

ct

0 All’osservatore

0

Ora dobbiamo trovare x 0 e y 0 in funzione di t, non di ⌧, e possiamo far questo nel seguente modo: le equazioni (34.5) dicono che dovremmo prendere il moto reale e sommarlo a una costante (la velocità della luce) moltiplicata per ⌧. Quello che risulta come significato è mostrato in FIGURA 34.2. Prendiamo il moto reale della carica (mostrato a sinistra) e immaginiamo che mentre sta muovendosi venga spazzata via dal punto P a velocità c (non ci sono contrazioni dovute alla relatività o qualcosa di simile, questa è semplicemente una somma matematica di c⌧). In questo modo otteniamo un nuovo moto, in cui la coordinata della linea di vista è ct, come mostrato a destra. (La figura mostra il risultato per un moto piuttosto complesso in un piano, ma naturalmente il moto può non essere in un piano – può essere anche più complesso del moto in un piano.) Il punto è che la distanza orizzontale (cioè lungo la linea di vista) ora non è più la vecchia z, ma è z+c⌧, e quindi è ct. Così abbiamo trovato una rappresentazione della curva, x 0 (e y 0) in funzione di t! Tutto quello che dobbiamo fare per trovare il campo è osservare l’accelerazione di questa curva, cioè differenziarla due volte. Così la risposta finale è: per trovare il campo elettrico per una carica in movimento, prendete il moto della carica e trasferitelo indietro alla velocità c per «aprirlo»; allora la curva così tracciata è una curva delle posizioni di x 0 e y 0 in funzione di t. L’accelerazione di questa curva dà il campo elettrico in funzione di t. O, se vogliamo, possiamo ora immaginare che questa intera curva «rigida» si muova in avanti alla velocità c lungo il piano di vista, in modo che il punto di intersezione con il piano di vista abbia le coordinate x 0 e y 0. L’accelerazione di questo punto produce il campo elettrico. Questa soluzione è altrettanto esatta della formula dalla quale siamo partiti – è semplicemente una rappresentazione geometrica. Se il moto è relativamente lento, per esempio se abbiamo un oscillatore che va su e giù lentamente, allora quando trasliamo il moto alla velocità della luce, otterremo, naturalmente, una semplice curva cosinusoidale, e questo dà una formula che abbiamo considerato per lungo tempo: dà il campo prodotto da una carica oscillante. Un esempio più interessante è costituito da un elettrone che si muove rapidamente, molto vicino alla velocità della luce, su una circonferenza. Se osserviamo nel piano del cerchio, l’x 0(t) ritardato appare come mostrato in FIGURA 34.3. Cos’è questa curva? Se immaginiamo un raggio vettore dal centro del cerchio alla carica, e se estendiamo questa linea radiale un poco oltre la carica, proprio un poco se sta andando veloce, allora arriviamo a un punto che va sulla traiettoria alla velocità della luce. Quindi quando trasferiamo indietro il moto alla velocità della luce, ciò corrisponde ad avere una ruota con una carica su di essa che rotola indietro (senza scivolare) a velocità c; così troviamo una curva che è molto vicina x' (t )

x

5

5

10

10

34.3

FIGURA La curva x 0 (t) di una particella

0

0 z

ct

in movimento a una velocità costante v = 0,94c, lungo un cerchio.

Capitolo 34 • Effetti relativistici nella radiazione

344

© 978-8808-22107-0

a una cicloide: è detta ipocicloide. Se la carica sta viaggiando molto vicina alla velocità della luce, le «cuspidi» sono in effetti molto nette; se andasse esattamente alla velocità della luce esse sarebbero delle vere cuspidi, infinitamente acute. «Infinitamente acute» è interessante; significa che vicino a una cuspide la derivata seconda è enorme. Una volta in ciascun ciclo otteniamo un impulso netto del campo elettrico. Questo non è affatto quello che otterremmo da un moto non relativistico, dove ogni volta che la carica compie una rotazione vi è un’oscillazione che è circa della stessa «intensità» per tutto il tempo. Invece vi sono impulsi molto netti del campo elettrico distanziati a intervalli di tempo 1/T0 , dove T0 è il periodo di rivoluzione. Questi intensi campi elettrici sono emessi in uno stretto cono nella direzione del moto della carica. Quando la carica si sta allontanando da P, vi è una curvatura molto piccola e vi è pochissimo campo irradiato nella direzione di P.

34.3

Radiazione di sincrotrone

Nel sincrotrone abbiamo elettroni molto veloci che si muovono su orbite circolari; essi stanno viaggiando a velocità molto vicina a c, ed è possibile vedere la radiazione come luce reale! Discutiamo questo in maggior dettaglio. Nel sincrotrone abbiamo elettroni che girano su circonferenze in un campo magnetico uniforme. In primo luogo, vediamo perché essi descrivono dei cerchi. Dall’equazione (28.2), sappiamo che la forza esercitata su una particella in un campo magnetico è data da (34.6)

F = qv ⇥ B

p + ∆p C p A

∆p F

D

R

ed è perpendicolare sia al campo sia alla velocità. Come sempre, la forza è uguale alla rapidità di variazione della quantità di moto col tempo. Se il campo è diretto verso l’alto uscendo dal foglio, la quantità di moto della particella e la forza su di essa sono come mostrato in FIGURA 34.4. Poiché la forza è perpendicolare alla velocità, l’energia cinetica, e quindi la velocità, rimane costante. Tutto quello che il campo magnetico fa, è cambiare la direzione di moto. In un breve intervallo di tempo t, il vettore quantità di moto cambia perpendicolarmente a se stesso di una quantità p=F t O

B

e quindi p ruota di un angolo ✓=

p qvB t = p p

34.4 Una particella carica si muove lungo una traiettoria circolare (o elicoidale) in un campo magnetico uniforme. FIGURA

poiché |F| = qvB. Ma nello stesso tempo la particella ha percorso una distanza s = v t. Evidentemente, le due linee AB e CD si intersecheranno in un punto O tale che O A = OC = R, dove s = R ✓. Combinando con le precedenti espressioni, segue che R

✓ qvBR = R! = v = t p

da cui otteniamo p = qBR

(34.7)

qvB p

(34.8)

e !=

Poiché questo stesso argomento può essere applicato durante l’istante successivo, il successivo ancora, e via di seguito, concludiamo che la particella deve muoversi su un cerchio di raggio R, con velocità angolare !.

34.3 • Radiazione di sincrotrone

© 978-8808-22107-0

Il risultato che la quantità di moto della particella è uguale alla carica per il raggio per il campo magnetico è una legge importantissima che viene usata moltissimo. È importante per scopi pratici, perché abbiamo particelle elementari che hanno tutte la stessa carica e le osserviamo in un campo magnetico, possiamo misurare i raggi di curvatura delle loro orbite e, conoscendo il campo magnetico, determinare così la quantità di moto delle particelle. Se moltiplichiamo entrambi i termini dell’equazione (34.7) per c, ed esprimiamo q in funzione della carica elettronica, possiamo misurare la quantità di moto in unità di elettronvolt. In tali unità la nostra formula diventa pc (eV) = (3 · 108 )

q BR qe

(34.9)

dove B, R e la velocità della luce sono tutte espresse nel sistema mks, l’ultima essendo, numericamente, 3 · 108 . L’unità mks del campo magnetico è chiamata weber per metro quadrato. Vi è una unità più vecchia ancora di uso comune chiamata gauss: 1 weber/m2 = 104 gauss. Per dare un’idea dell’intensità dei campi magnetici, il campo più intenso che si può comunemente produrre in ferro è circa 1,5 · 104 gauss; oltre questo valore, il vantaggio di usare ferro scompare. Oggi, elettromagneti con filo superconduttore sono in grado di produrre campi costanti di intensità superiore a 105 gauss, cioè 10 unità mks. Il campo della Terra è all’equatore pochi decimi di gauss. Ritornando all’equazione (34.9) potremmo immaginare il sincrotrone che funziona a un miliardo di elettronvolt, così per un miliardo di elettronvolt si avrebbe pc = 109 eV. (Ritorneremo all’energia fra un momento.) Allora, se avessimo un B corrispondente, diciamo, a 10 000 gauss, che è un buon campo robusto, un’unità mks, allora vediamo che R dovrebbe essere 3,3 metri. Il raggio effettivo del sincrotrone di Caltech è 3,7 metri, il campo è un po’ più intenso, e l’energia è 1,5 miliardi. Ma si tratta dello stesso concetto. Così ora abbiamo la consapevolezza del perché il sincrotrone ha le dimensioni che ha. Abbiamo calcolato la quantità di moto, ma sappiamo che l’energia totale, includendo l’energia a riposo, è data da q W = p2 c2 + m2 c4

e per un elettrone l’energia a riposo corrispondente a mc2 è 0,511 · 106 eV, così, quando pc = = 109 eV possiamo trascurare mc2 , e per tutti gli scopi pratici W = pc quando le velocità sono relativistiche. Dire che l’energia di un elettrone è un miliardo di elettronvolt è praticamente lo stesso di dire che la quantità di moto per c è un miliardo di elettronvolt. Se W = 109 eV, è facile dimostrare che la velocità differisce dalla velocità della luce soltanto di una parte su otto milioni! Ora consideriamo la radiazione emessa da una simile particella. Una particella che si muove su un cerchio di raggio 3,3 metri, ossia su una circonferenza di 20 metri, compie un giro approssimativamente nello stesso tempo impiegato dalla luce a percorrere 20 metri. Così la lunghezza d’onda che dovrebbe essere emessa da una simile particella sarebbe 20 metri – nella regione delle onde radio corte. Ma a causa dell’effetto di addensamento che abbiamo discusso (FIGURA 34.3), e a causa del fatto che la distanza di cui dobbiamo estendere il raggio per raggiungere la velocità c è soltanto una parte su otto milioni del raggio, le cuspidi dell’ipocicloide sono enormemente acute rispetto alla loro reciproca distanza. L’accelerazione, che implica una derivata seconda rispetto al tempo, acquista due volte il «fattore di compressione» di 8 · 106 perché la scala del tempo è ridotta due volte di otto milioni nelle vicinanze della cuspide. Così potremmo aspettarci che l’effettiva lunghezza d’onda sia molto più corta, dell’ordine di 64 volte 1012 più piccola di 20 metri, e questo corrisponde alla regione dei raggi X. (In realtà, la cuspide stessa non è l’intero fattore determinante; si deve anche includere una certa regione attorno alla cuspide. Questo cambia il fattore alla potenza 3/2 anziché al quadrato, ma ci lascia ancora oltre la regione ottica.) Così, anche se un elettrone che si muove lentamente avesse irradiato onde radio da 20 metri, l’effetto relativistico ridurrebbe a tal punto la lunghezza d’onda da permetterci di vederla! Chiaramente la luce dovrebbe essere polarizzata, con il campo elettrico perpendicolare al campo magnetico uniforme.

345

Capitolo 34 • Effetti relativistici nella radiazione

346

© 978-8808-22107-0

Per renderci ulteriormente conto di ciò che osserveremmo, supponiamo di dover prendere una luce di questo tipo (per semplificare le cose, dato che Impulso da questi impulsi sono tanto separati nel tempo, prenderemo semplicemente un elettrone un impulso) e dirigerla su un reticolo di diffrazione, che è un insieme di fili diffusori. Dopo che questo impulso si è allontanato dal reticolo, che Radiazione B cosa vediamo? (Dovremmo vedere luce rossa, luce blu e via di seguito, A diffusa dal reticolo se vediamo qualcosa.) Che cosa vediamo? L’impulso colpisce il reticolo di fronte, e tutti gli oscillatori nel reticolo, insieme, sono violentemente Z mossi su e di nuovo giù, una sola volta. Essi allora producono effetti in P varie direzioni, come mostrato in FIGURA 34.5. Ma il punto P è più vicino a BA un’estremità del reticolo che all’altra, così in questo punto il campo elettrico arriva prima dal filo A, poi da B, e via di seguito; alla fine arriva l’impulso FIGURA 34.5 La luce che colpisce un reticolo dall’ultimo filo. In breve, la somma delle riflessioni provenienti da tutti con un impulso singolo, netto, è diffusa in varie i fili successivi è come mostrata in FIGURA 34.6a; si tratta di un campo direzioni in differenti colori. elettrico che è una serie di impulsi ed è molto simile a un’onda sinusoidale la cui lunghezza è la distanza fra gli impulsi, proprio come avverrebbe per la luce monocromatica che colpisce il reticolo! Così otteniamo davvero luce colorata. Ma, per lo stesso motivo, non otterremo luce da qualsiasi tipo di «impulso»? No. Supponete che la curva sia molto più dolce; allora sommeremmo tutte le onde diffuse insieme, separate da un piccolo intervallo di tempo fra loro (FIGURA 34.6b. Vediamo allora che il campo non oscillerebbe affatto, la curva sarebbe molto (a) dolce, poiché ciascun impulso non varierebbe molto nell’intervallo di tempo fra gli impulsi. La radiazione elettromagnetica emessa da particelle cariche relativistiche circolanti in un campo magnetico è detta radiazione di sincrotrone. È così chiamata per ovvie ragioni, ma (b) non è limitata specificamente ai sincrotroni o anche a laboratori legati alla terra. È eccitante e interessante che capiti anche in natura! Z

34.6 Il campo elettrico totale dovuto a una serie di (a) impulsi netti e (b) impulsi dolci. FIGURA

34.4

Radiazione cosmica di sincrotrone

Nell’anno 1054 le civiltà cinese e giapponese erano fra le più avanzate nel mondo; esse erano consapevoli dell’universo esterno, e registrarono, in quell’anno, cosa molto notevole, l’esplosione di una stella brillante. (È sorprendente che nessuno dei monaci europei, che hanno scritto tutti i libri del medioevo, si preoccupasse anche di scrivere che una stella era esplosa nel cielo, però non lo fecero.) Oggi possiamo fotografare tale stella, e quello che vediamo è mostrato in FIGURA 34.7. All’esterno vi è una gran massa di filamenti rossi che è prodotta dagli atomi del gas rarefatto «risonanti» alle loro frequenze naturali; questo produce un brillante spettro a righe con diverse frequenze. Accade in questo caso che il rosso sia dovuto all’azoto. D’altra parte, nella regione centrale vi è una misteriosa macchia confusa di luce in una continua distribuzione di frequenza, cioè non vi sono speciali frequenze associate ad atomi particolari. Tuttavia questa non è polvere «illuminata» da stelle vicine, che è un modo con cui si può ottenere uno spettro continuo. Possiamo vedere stelle attraverso essa, dunque è trasparente, ma emette luce. In FIGURA 34.8 osserviamo lo stesso oggetto, usando la luce in una regione dello spettro che non ha alcuna linea luminosa spettrale, cosicché vediamo soltanto la regione centrale. Ma in questo caso, inoltre, sono stati posti sul telescopio polarizzatori, e le due viste corrispondono a due orientamenti a 90° tra loro. Vediamo che le fotografie sono diverse! Ciò significa che la luce è polarizzata. La ragione presumibilmente è che vi è campo magnetico locale e parecchi elettroni molto veloci stanno ruotando in quel campo magnetico. Abbiamo appena illustrato come gli elettroni potrebbero percorrere il campo in una traiettoria circolare. Possiamo sommare a questo, naturalmente, qualsiasi moto uniforme in direzione del campo, poiché la forza, qv ⇥ B, non ha componente in questa direzione e, come abbiamo già sottolineato, la radiazione di sincrotrone è evidentemente polarizzata in una direzione perpendicolare alla proiezione del campo magnetico sul piano di vista. Ponendo insieme questi due fatti, vediamo che in una regione in cui una fotografia è luminosa e l’altra è scura, la luce deve avere il suo campo elettrico completamente polarizzato in una

34.5 • Radiazione di frenamento

© 978-8808-22107-0

34.7 La Nebulosa del Cancro vista con tutti i colori (fotografia realizzata senza l’impiego di alcun filtro). FIGURA

34.8 La Nebulosa del Cancro vista attraverso un filtro blu e un polaroid. Vettore elettrico (a) verticale e (b) orizzontale. FIGURA

direzione. Questo significa che vi è un campo magnetico perpendicolare a questa direzione, mentre nelle altre regioni, dove vi è una forte emissione nell’altra fotografia, il campo magnetico deve essere nell’altra direzione. Se osserviamo accuratamente la FIGURA 34.8, possiamo notare che vi è, approssimativamente parlando, un gruppo generale di «linee» che vanno in una direzione in una fotografia e perpendicolarmente a questa direzione nell’altra. Le immagini mostrano una specie di struttura fibrosa. Presumibilmente le linee del campo magnetico tenderanno a estendersi a distanze relativamente grandi continuando nella stessa direzione, e così, presumibilmente, vi sono lunghe regioni di campo magnetico con tutti gli elettroni che girano a spirale attorno a una direzione, mentre in un’altra regione il campo è nell’altra direzione e gli elettroni ruotano a spirale ancora attorno a quella direzione. Che cosa mantiene l’energia degli elettroni così alta per tanto tempo? Dopo tutto sono passati 900 anni dall’esplosione – come possono continuare ad andare tanto veloci? Come essi mantengano la loro energia e come tutto ciò continui ad andare avanti non è stato ancora del tutto compreso.

34.5

Radiazione di frenamento

Sottolineeremo poi brevemente un altro interessante effetto di una particella che si muove molto velocemente e che irradia energia. Questo concetto è molto simile a quello che abbiamo appena discusso. Supponete che vi siano particelle cariche in un pezzo di materia e che un elettrone velocissimo, diciamo, ci passi vicino (FIGURA 34.9). Allora, a causa del campo elettrico attorno al nucleo atomico, l’elettrone è attirato, accelerato, cosicché la traiettoria del suo moto ha una leggera deviazione o una curvatura. Se l’elettrone sta viaggiando molto vicino alla velocità della luce, qual è il campo elettrico prodotto nella direzione c? Ricordate la nostra regola: prendiamo il moto reale, lo trasliamo indietro alla velocità c e questo ci dà una curva la cui curvatura misura il campo elettrico. Esso stava venendo verso di noi alla velocità v, così otteniamo un moto all’indietro, con l’intera rappresentazione compressa entro una distanza minore nella proporzione in cui c v è minore di c. Così, se 1 v/c ⌧ 1, vi è una curvatura molto netta e rapida in B 0, e quando prendiamo la derivata seconda di questa otteniamo un campo molto elevato nella direzione del moto. Quindi, quando elettroni molto energetici si muovono attraverso la materia, buttano fuori radiazione. Questo fenomeno è chiamato radiazione di frenamento o Bremsstrahlung(1) . In realtà, il sincrotrone è usato, non tanto per produrre elettroni di alta energia (in realtà, se fossimo in grado di estrarli più convenientemente dalla macchina, non diremmo questo) quanto (1) Radiazione di frenamento in tedesco si dice Bremsstrahlung. Il termine Bremsstrahlung è usato comunemente da fisici di tutte le lingue. (N.d.T.)

347

Capitolo 34 • Effetti relativistici nella radiazione

348

34.9 Un elettrone veloce che passa vicino a un nucleo irradia energia nella direzione del suo moto.

© 978-8808-22107-0

FIGURA

x' C D

B

A

x

x'

A' B'

Nucleo

B' B

D'

A ct

z

A' ct

34.10

FIGURA Le curve x-z e x 0 -t di un oscillatore

in movimento.

per produrre fotoni molto energetici – i raggi gamma – facendo passare gli elettroni energetici attraverso un «bersaglio» di tungsteno solido, e facendo loro irradiare fotoni per mezzo di questo effetto di frenamento.

34.6

L’effetto Doppler

Passiamo ora a considerare alcuni altri esempi degli effetti delle sorgenti in movimento. Supponiamo che la sorgente sia un atomo stazionario che sta oscillando a una delle sue frequenze naturali, !0 . Sappiamo allora che la frequenza della luce che osserveremmo è !0 . Ma prendiamo ora un altro esempio, in cui abbiamo un simile oscillatore oscillante con una frequenza !1 , e nello stesso tempo l’intero atomo, l’intero oscillatore, si sta muovendo in una direzione verso l’osservatore, a velocità v. Allora il moto reale nello spazio, naturalmente, è come mostrato in FIGURA 34.10a. Ora facciamo il nostro solito gioco, sommiamo c⌧; vale a dire, trasferiamo indietro l’intera curva e troviamo allora che esso oscilla come in FIGURA 34.10b. In un dato intervallo di tempo ⌧, quando l’oscillatore avrebbe percorso la distanza v⌧, nel diagramma x 0 in funzione di ct esso percorre una distanza (c v)⌧. Così tutte le oscillazioni di frequenza !1 nel tempo ⌧ vengono ora trovate nell’intervallo ✓ v◆ t= 1 ⌧ c Esse sono schiacciate insieme, e siccome questa curva ci raggiunge a velocità c, vedremo la luce di una frequenza più alta, più alta proprio del fattore di compressione (1 v/c). Così osserviamo !=

!1 1

v c

(34.10)

Possiamo, naturalmente, analizzare questa situazione in vari altri modi. Supponete che l’atomo stesse emettendo, invece di onde sinusoidali, una serie di impulsi, tu, tu, tu, a una certa frequenza !1 . A quale frequenza sarebbero ricevuti da noi? Il primo che arriva ha un certo ritardo, ma il successivo è ritardato meno perché nello stesso tempo l’atomo si avvicina al ricevitore. Quindi, l’intervallo fra i «tu» diminuisce a causa del moto. Se analizziamo la geometria della situazione, troviamo che la frequenza degli impulsi è aumentata del fattore 1/(1 v/c). È ! = !0 /(1 v/c), allora, la frequenza che sarebbe osservata se prendessimo un atomo normale, con una frequenza naturale !0 , in moto verso il ricevitore a velocità v? No, come sappiamo bene, la frequenza naturale !1 di un atomo in movimento non è la stessa di quella misurata quando è fermo, a causa della dilatazione relativistica nella rapidità del trascorrere del tempo. Così se !0 fosse la vera frequenza naturale, allora la frequenza naturale modificata !1 sarebbe r v2 !1 = !0 1 (34.11) c2 Quindi la frequenza osservata è r v2 !0 1 c2 != (34.12) v 1 c Lo spostamento di frequenza osservato nella situazione sopra è detto effetto Doppler: se qualcosa si muove verso di noi la luce che emette appare più violetta, e se si allontana appare più rossa.

34.6 • L’effetto Doppler

© 978-8808-22107-0

Daremo ora due ulteriori derivazioni di questo stesso interessante e importante risultato. Supponete ora che la sorgente sia ferma e stia emettendo onde alla frequenza !0 , mentre l’osservatore è in movimento con velocità v verso la sorgente. Dopo un certo periodo di tempo t l’osservatore si sarà spostato in una nuova posizione, a una distanza vt da dove si trovava a t = 0. Quanti radianti di fase avrà visto passare? Un certo numero, !0 t, ha attraversato qualsiasi punto fisso, e inoltre l’osservatore ne ha oltrepassati alcuni in più per il suo stesso moto, vale a dire un numero vtk 0 (il numero di radianti per metro, per la distanza). Così il numero totale di radianti nel tempo t, ossia la frequenza osservata, sarebbe !1 = !0 + k 0 v. Abbiamo fatto questa analisi dal punto di vista di un uomo fermo; vorremmo sapere come apparirebbe all’uomo che è in movimento. Qui dobbiamo di nuovo preoccuparci della differenza di velocità degli orologi dei due osservatori, e p questa volta ciò significa che dobbiamo dividere per 1 v 2 /c2 . Così se k0 è il numero d’onde, il numero di radianti per metro nella direzione del moto, e !0 è la frequenza, allora la frequenza osservata per un uomo in movimento è !0 + k 0 v !=r v2 1 c2

(34.13)

Nel caso della luce, sappiamo che k0 = !0 /c. Così, in questo particolare problema, l’equazione si leggerebbe ✓ v◆ !0 1 + c != r (34.14) v2 1 c2 che appare completamente diversa dalla formula (34.12)! La frequenza che osserveremmo se ci muovessimo verso una sorgente è diversa dalla frequenza che osserveremmo se la sorgente si muovesse verso di noi? Naturalmente no! La teoria della relatività dice che queste due devono essere esattamente uguali. Se fossimo matematici sufficientemente esperti riconosceremmo probabilmente che queste due espressioni matematiche sono esattamente uguali! Infatti, la necessaria uguaglianza delle due espressioni è uno dei mezzi con cui alcuni amano dimostrare che la relatività richiede una dilatazione del tempo, perché se non introducessimo i due fattori radice quadrata, esse non sarebbero più uguali. Poiché sappiamo della relatività, analizziamola in un terzo modo ancora, che può apparire un po’ più generale. (In realtà è la stessa cosa, poiché non importa come la facciamo!) Secondo la teoria della relatività vi è una relazione fra posizione e tempo come vengono osservati da un uomo e la posizione e il tempo come vengono osservati da un altro uomo che è in movimento rispetto al primo. Abbiamo scritto queste relazioni tempo fa (capitolo 16). Questa è la trasformazione di Lorentz e la sua inversa: x + vt x0 = r v2 1 c2

x0 x=r

vx t+ 2 t0 = r c v2 1 c2

t0 t =r

1

vt 0 v2 c2

vx0 c2 v2 1 c2

(34.15)

Se fossimo fermi sulla superficie della terra, la forma dell’onda sarebbe cos(!t k x) ; tutti i nodi, i massimi e i minimi seguirebbero questa forma. Ma che cosa vedrebbe un uomo in moto osservando la stessa onda fisica? Dove il campo è zero, le posizioni di tutti i nodi sono le stesse (quando il campo è zero, chiunque misura il campo come zero); ciò è un invariante relativistico. Così la forma è la stessa anche per l’altro uomo, eccetto che dobbiamo trasformarla nel suo

349

350

Capitolo 34 • Effetti relativistici nella radiazione

© 978-8808-22107-0

sistema di riferimento: vx0 *. 0 2 .. t k x) = cos .! r c .. v2 1 c2 ,

cos (!t

Se raggruppiamo i termini nelle parentesi, otteniamo

cos (!t

essendo

*. . ! + kv 0 k x) = cos .. r t .. v2 1 c2 ,

x0 kr

1

+/ vt 0 // / v 2 // c2 -

! + k + v 2 // c x 0/ = cos (! 0t 0 r / v 2 // 1 c2 -

k 0 x 0)

(34.16)

! k+v 2 ! + kv c 0 ! =r k =r v2 v2 1 1 c2 c2 Questa è ancora un’onda, un’onda cosinusoidale, in cui vi è una certa frequenza ! 0, una costante che moltiplica t 0, e una certa altra costante k 0 che moltiplica x 0. Chiamiamo k 0 il numero d’onde, ossia il numero di onde per metro, per l’altro uomo. Quindi l’altro uomo vedrà una nuova frequenza e un nuovo numero d’onde dati da 0

e

! + kv !0 = r v2 1 c2

(34.17)

! k+v 2 c k0 = r (34.18) v2 1 c2 Se osserviamo la (34.17) vediamo che è la stessa formula (34.13), che abbiamo ottenuto con un argomento più fisico.

34.7

Il quadrivettore ω, k

Le relazioni indicate nelle equazioni (34.17) e (34.18) sono interessantissime perché dicono che la nuova frequenza ! 0 è una combinazione della vecchia frequenza ! e del vecchio numero d’onde k, e che il nuovo numero d’onde è una combinazione del vecchio numero d’onde e della vecchia frequenza. Ora il numero d’onde è la rapidità di variazione della fase con la distanza, e la frequenza è la rapidità di variazione della fase con il tempo, e in queste espressioni vediamo una stretta analogia con la trasformazione di Lorentz della posizione e del tempo: se ! è pensato come simile a t, e k è pensato come simile a x diviso per c2 , allora il nuovo ! 0 sarà simile a t 0, e il nuovo k 0 sarà simile a x 0/c2 . Vale a dire, sotto la trasformazione di Lorentz ! e k si trasformano allo stesso modo di t e x. Essi costituiscono quello che chiamiamo quadrivettore; quando una grandezza ha quattro componenti che si trasformano come il tempo e lo spazio è un quadrivettore. Tutto sembra che vada bene allora, tranne che per una piccola cosa: abbiamo detto che un quadrivettore deve avere quattro componenti; dove sono le altre due componenti? Abbiamo visto che ! e k sono simili a tempo e spazio in una direzione dello spazio, ma non in tutte le direzioni, così dobbiamo in seguito studiare il problema della propagazione della luce nello spazio tridimensionale, non soltanto in una direzione come siamo andati facendo finora.

34.7 • Il quadrivettore ω, k

© 978-8808-22107-0

Supponete che abbiamo un sistema di coordinate x, y e z, e un’onda che si propaga, i cui fronti d’onda sono mostrati in FIGURA 34.11. La lunghezza d’onda dell’onda è , ma la direzione di moto dell’onda non capita che sia nella direzione di uno degli assi. Qual è la formula per un’onda del genere? La risposta è chiaramente cos(!t k s), dove k = 2⇡/ e s è la distanza lungo la direzione di moto dell’onda – la componente della posizione spaziale nella direzione del moto. Mettiamola in questo modo: se r è il vettore posizione di un punto nello spazio, allora s = r · ek , dove ek è un vettore unitario nella direzione del moto. Cioè s è semplicemente r cos(r, ek ), la componente della distanza nella direzione del moto. Quindi la nostra onda è cos (!t k ek · r) Ora risulta molto conveniente definire un vettore k, detto vettore d’onda, che ha intensità uguale al numero d’onde, 2⇡/ , ed è orientato nella direzione di propagazione delle onde: 2⇡ek k= = k ek

y

λ ek

34.11 Onda piana che si propaga in una direzione obliqua. FIGURA

(34.19)

k · r)

oppure come cos (!t

kx x

ky y

k z z)

Qual è il significato di una componente di k, diciamo k x ? Chiaramente k x è la rapidità di variazione della fase rispetto a x. Riferendoci alla FIGURA 34.11, vediamo che la fase varia quando cambiamo x, come se ci fosse un’onda che si muovesse secondo x, ma di una lunghezza d’onda maggiore. La «lunghezza d’onda nella direzione x» è maggiore della lunghezza d’onda vera, naturale, della secante dell’angolo fra la direzione reale di propagazione e l’asse x: x

=

cos ↵

r

x

Usando questo vettore, la nostra onda può essere scritta come cos (!t

351

(34.20)

Quindi la rapidità di variazione della fase, che è proporzionale al reciproco di x , è più piccola di un fattore cos ↵; che è proprio come varierebbe k x – sarebbe il valore assoluto di k, per il coseno dell’angolo fra k e l’asse x! Questa, allora, è la natura del vettore d’onda che usiamo per rappresentare un’onda in tre dimensioni. Le quattro quantità !, k x , k y e k z si trasformano in relatività come un quadrivettore, dove ! corrisponde al tempo e k x , k y e k z corrispondono alle componenti x, y e z del quadrivettore. Nella nostra precedente discussione di relatività speciale (capitolo 17) abbiamo imparato che vi sono modi di fare i prodotti scalari relativistici con i quadrivettori. Se usiamo il vettore di posizione x µ , dove µ sta per le quattro componenti (il tempo e le tre componenti spaziali), e se chiamiamo k µ il vettore d’onda, dove l’indice µ ha ancora quattro valori, il tempo e tre P componenti spaziali, allora il prodotto scalare di x µ e k µ è scritto 0 k µ x µ (vedi capitolo 17). Questo prodotto scalare è un invariante, indipendente dal sistema di coordinate; a che cosa è uguale? Dalla definizione di questo prodotto scalare in quattro dimensioni, esso è X0 k µ x µ = !t k x x k y y k z z (34.21)

P Sappiamo dal nostro studio dei vettori che 0 k µ x µ è invariante sotto trasformazione di Lorentz, poiché k µ è un quadrivettore. Ma questa quantità è precisamente quella che appare come argomento del coseno per un’onda piana, e deve essere necessariamente invariante sotto una trasformazione di Lorentz. Non possiamo avere una formula con qualcosa che cambia nell’argomento del coseno, poiché sappiamo che la fase dell’onda non può cambiare quando cambiamo il sistema di coordinate.

Capitolo 34 • Effetti relativistici nella radiazione

352

34.8 S

S

v (a)

(b)

34.12 Una sorgente S distante è vista (a) da un telescopio stazionario e (b) da un telescopio che si muove trasversalmente. FIGURA

© 978-8808-22107-0

Aberrazione

Nel derivare le equazioni (34.17) e (34.18) abbiamo preso un esempio semplice dove accadeva che k fosse nella direzione del moto, ma, naturalmente, possiamo generalizzare anche ad altri casi. Per esempio, supponiamo che vi sia una sorgente che emette luce in una certa direzione dal punto di vista di un uomo fermo, ma che noi ci stiamo muovendo, diciamo, con la Terra (FIGURA 34.12). Da quale direzione sembra giungere la luce? Per calcolarlo dovremo scrivere le quattro componenti di k µ e applicare la trasformazione di Lorentz. La risposta però può essere trovata col seguente argomento: dobbiamo puntare il nostro telescopio inclinato per vedere la luce. Perché? Perché la luce sta arrivando in basso a velocità c e noi stiamo muovendoci lateralmente a velocità v, così il telescopio deve essere inclinato in avanti in modo che quando la luce scende entri «diritta» nel tubo. È molto facile vedere che la distanza orizzontale è vt quando la distanza verticale è ct, e quindi, se ✓ 0 è l’angolo di inclinazione, tg ✓ 0 = v/c. Perfetto! Perfetto, infatti, tranne che per una piccola cosa: ✓ 0 non è l’angolo al quale dovremmo mettere il telescopio rispetto alla Terra, poiché abbiamo fatto la nostra analisi dal punto di vista di un osservatore «fisso». Quando abbiamo detto la distanza orizzontale è vt, l’uomo sulla terra avrebbe trovato una distanza differente dato che misurava con un regolo «contratto». Risulta che per l’effetto di contrazione

che è equivalente a

tg ✓ = r

v/c 1

v2 c2

(34.22)

v (34.23) c Sarà istruttivo per lo studente derivare questo risultato, usando la trasformazione di Lorentz. Quest’effetto, che un telescopio debba essere inclinato, è detto aberrazione, ed è stato osservato. Come possiamo osservarlo? Chi può dire dove dovrebbe essere una data stella? Supponete che per vedere una stella dobbiamo osservare una direzione sbagliata; come sappiamo che è la direzione sbagliata? Perché la Terra gira attorno al Sole. Oggi dobbiamo puntare il telescopio in un modo; sei mesi dopo dobbiamo inclinare il telescopio nella direzione opposta. Questa è la ragione per cui possiamo dire che esiste un effetto del genere. sen ✓ =

34.9

La quantità di moto della luce

Ora ci rivolgiamo a un altro argomento. In tutta la nostra discussione dei precedenti capitoli, non abbiamo mai detto niente sugli effetti del campo magnetico che è associato alla luce. Ordinariamente gli effetti del campo S magnetico sono molto piccoli, ma vi è un effetto interessante e importante, v che è una conseguenza del campo magnetico. Supponete che la luce stia arrivando da una sorgente e stia agendo su F una carica forzando tale carica su e giù. Supporremo che il campo elettrico B z y sia in direzione x, cosicché il moto della carica sia pure in direzione x; essa ha una posizione x e una velocità v, come mostrato in FIGURA 34.13. Il campo magnetico è perpendicolare al campo elettrico. Ora, quando il FIGURA 34.13 La forza magnetica su una carica che è forzata dal campo elettrico è nella direzione del campo elettrico agisce sulla carica e la muove su e giù, che cosa fa? fascio di luce. Il campo magnetico agisce sulla carica (diciamo un elettrone) soltanto quando è in movimento; ma l’elettrone è in movimento, è forzato dal campo elettrico, così i due campi lavorano insieme: mentre la cosa sta andando su e giù ha una velocità e vi è una forza su di essa, Bvq; ma in quale direzione è questa forza? È nella direzione di propagazione della luce. Quindi, quando la luce colpisce una carica ed essa oscilla in risposta alla luce, vi è una forza nella direzione del fascio di luce. Questa è chiamata pressione di radiazione o pressione della luce. E

x

34.9 • La quantità di moto della luce

© 978-8808-22107-0

Determiniamo qual è l’intensità della pressione di radiazione. Evidentemente essa è F = qvB o, poiché tutto sta oscillando, è la media temporale di questa, hFi. Dalla (34.2) l’intensità del campo magnetico è uguale all’intensità del campo elettrico divisa per c, così abbiamo bisogno di trovare la media del campo elettrico, per la velocità, per la carica, per 1/c: hFi =

q hvFi c

Ma la carica q per il campo E è la forza elettrica su una carica, e la forza sulla carica per la velocità è il lavoro dW /dt che viene eseguito sulla carica! Quindi la forza, la «quantità di moto di spinta», che è trasferita in un secondo dalla luce, è uguale a 1/c per l’energia assorbita dalla luce per secondo! Questa è una regola generale, poiché non abbiamo detto quanto forte era l’oscillazione, o se alcune delle cariche si annullano. In qualsiasi circostanza in cui la luce viene assorbita, vi è una pressione. La quantità di moto che la luce cede è sempre uguale all’energia assorbita, divisa per c: hFi =

dW 1 dt c

(34.24)

Che la luce trasporta energia già lo sappiamo. Capiamo ora che essa trasporta anche quantità di moto e, inoltre, che la quantità di moto trasportata è sempre 1/c per l’energia. Quando una luce è emessa da una sorgente vi è un effetto di rinculo: la stessa cosa all’inverso. Se un atomo emette un’energia W in una certa direzione, allora vi è una quantità di moto di rinculo W p= c Se la luce è riflessa normalmente da uno specchio, otteniamo il doppio della forza. Non andremo oltre usando la teoria classica della luce. Naturalmente sappiamo che vi è una teoria quantistica, e che in diverse situazioni la luce agisce come una particella. L’energia di una particella di luce è una costante per la frequenza: W = h = ~!

(34.25)

Ci rendiamo conto ora che la luce trasporta anche una quantità di moto uguale all’energia divisa per c, così è anche vero che queste particelle effettive, questi fotoni, trasportano una quantità di moto W ~! p= = = ~k (34.26) c c La direzione della quantità di moto è, naturalmente, la direzione di propagazione della luce. Così, in forma vettoriale W = ~! p = ~k (34.27) Sappiamo anche, naturalmente, che l’energia e la quantità di moto di una particella dovrebbero formare un quadrivettore. Abbiamo appena scoperto che ! e k formano un quadrivettore. Quindi è una buona cosa che le (34.27) abbiano la stessa costante in entrambi i casi; ciò significa che la teoria quantistica e la teoria della relatività sono mutuamente consistenti. Le equazioni (34.27) possono essere scritte più elegantemente come pµ = ~k µ un’equazione relativistica, per una particella associata con un’onda. Anche se abbiamo discusso questo soltanto per fotoni, per i quali k (il valore assoluto di k) è uguale a !/c e p = W /c, la relazione è molto più generale. Nella meccanica quantistica tutte le particelle, non soltanto i fotoni, mostrano proprietà ondulatorie, ma la frequenza e il numero d’onde delle onde sono legati all’energia e alla quantità di moto delle particelle dalle (34.27) (dette relazioni di de Broglie) anche quando p non è uguale a W /c.

353

354

Capitolo 34 • Effetti relativistici nella radiazione

© 978-8808-22107-0

Nel precedente capitolo abbiamo visto che un fascio di luce polarizzata circolarmente destrorsa o sinistrorsa trasporta anche un momento della quantità di moto in una quantità proporzionale all’energia E dell’onda. Nella rappresentazione quantistica un fascio di luce polarizzata circolarmente è considerato come un flusso di fotoni, ciascuno che trasporta un momento della quantità di moto ±~ lungo la direzione di propagazione. Questo è quanto avviene della polarizzazione dal punto di vista corpuscolare – i fotoni trasportano momento della quantità di moto come pallottole da fucile rotanti. Ma questa rappresentazione a «pallottole» è in realtà altrettanto incompleta della rappresentazione «ondulatoria» e dovremo discutere questi concetti più compiutamente in un prossimo capitolo sul comportamento quantistico.

35

Visione del colore

35.1

L’occhio umano

Il fenomeno dei colori dipende parzialmente dal mondo fisico. Discutiamo i colori delle bolle di sapone e così via come prodotti dall’interferenza. Ma, naturalmente, il fenomeno dipende anche dall’occhio, o da quello che accade dietro l’occhio, nel cervello. La fisica definisce la luce che entra nell’occhio, ma dopo questo, le nostre sensazioni sono il risultato di processi fotochimici-neurali e di risposte fisiologiche. Vi sono molti interessanti fenomeni legati alla visione che implicano un insieme di fenomeni fisici e di processi fisiologici, e per apprezzare interamente il fenomeno naturale, come lo vediamo, si deve oltrepassare la fisica nel senso comune del termine. Non chiediamo scusa di queste escursioni all’interno di altri campi, perché la separazione dei campi, come abbiamo messo in rilievo, è semplicemente una convenienza umana e una cosa che esula dalla natura. La natura non è interessata alle nostre separazioni e molti dei fenomeni interessanti costituiscono dei legami fra i campi. Nel capitolo 3 abbiamo già discusso il rapporto tra la fisica e le altre scienze in termini generali, ma ora stiamo per esaminare in certi dettagli un campo specifico in cui la fisica e altre scienze sono molto, molto strettamente legate. Tale area è la visione. In particolare discuteremo la visione del colore. In questo capitolo discuteremo principalmente i fenomeni osservabili della visione umana, e nel capitolo successivo considereremo gli aspetti fisiologici della visione, sia nell’uomo sia in altri animali. Tutto inizia con l’occhio; così, per capire quali fenomeni vediamo, è richiesta una certa conoscenza dell’occhio. Nel prossimo capitolo discuteremo con un certo dettaglio come funzionano le varie parti dell’occhio, e come esse sono interconnesse col sistema nervoso. Per ora descriveremo soltanto brevemente come funziona l’occhio (FIGURA 35.1). La luce entra nell’occhio attraverso la cornea; abbiamo già discusso come viene curvata e come si forma l’immagine su uno strato detto retina sul fondo dell’occhio, così che parti

Cristallino

Cornea

Umor acqueo

Iride

Legamento sospensorio

Coroide

Muscolo ciliare

Retina

Umor vitreo

1

1

2a

2a

2b 3 4

2b 3 4

5a 5b 5c

5a 5b 5c

6

6

7

7

8

8

9 10

9 10

FIGURA

Sclera Macula lutea Nervo ottico

35.1

L’occhio.

35.2 Struttura della retina (la luce entra dal basso). FIGURA

356

Capitolo 35 • Visione del colore

© 978-8808-22107-0

differenti della retina ricevono luce da parti differenti del campo visivo esterno. La retina non è assolutamente uniforme: vi è una zona, una macchia, nel centro del nostro campo visivo, che usiamo quando stiamo cercando di vedere cose molto accuratamente, e nel quale abbiamo la maggior acutezza visiva; essa è chiamata fovea o macula. Le parti laterali dell’occhio, come possiamo immediatamente valutare dalla nostra esperienza nell’osservare le cose, non sono altrettanto efficienti per vedere in particolare, come è il centro dell’occhio. Vi è anche una macchia nella retina in cui terminano i nervi che portano tutte le informazioni; questa è una macchia cieca. Qui non vi è parte sensitiva della retina, ed è possibile dimostrare che se chiudiamo, diciamo, l’occhio sinistro e osserviamo direttamente qualcosa, e poi muoviamo un dito o un altro piccolo oggetto fuori dal campo visivo esso improvvisamente scompare in qualche punto. Il solo uso pratico che conosciamo di questo fatto è che un certo fisiologo divenne un grande favorito alla corte del re di Francia facendolo rilevare al re; nelle noiose sedute che egli aveva con i suoi cortigiani, il re poteva dilettarsi col «taglio delle loro teste» osservandone una e vedendo la testa di un altro scomparire. La FIGURA 35.2 mostra un’immagine ingrandita dell’interno della retina in una forma alquanto schematica. Nelle diverse parti della retina vi sono diversi tipi di strutture. Gli oggetti situati più densamente vicino alla periferia della retina sono detti bastoncelli. Più vicini alla fovea troviamo, oltre queste cellule a bastoncino, anche cellule a cono. Descriveremo in seguito la struttura di queste cellule. Come ci avviciniamo alla fovea il numero dei coni aumenta, e nella fovea stessa non vi è in realtà nient’altro che cellule coniche strettamente raggruppate, tanto strettamente che i coni sono molto più sottili, ossia più stretti qui che in qualsiasi altro punto. Così dobbiamo renderci conto che vediamo con i coni giusto nel mezzo del campo visivo, ma come ci portiamo alla periferia abbiamo altre cellule, i bastoncelli. Ora la cosa interessante è che nella retina ciascuna delle cellule che è sensibile alla luce non è connessa con una fibra direttamente al nervo ottico, ma è collegata a molte altre cellule, che sono esse stesse collegate l’una all’altra. Vi sono diversi tipi di cellule: vi sono cellule che trasportano l’informazione verso il nervo ottico, ma ve ne sono altre che sono principalmente interconnesse «orizzontalmente». Vi sono essenzialmente quattro tipi di cellule, ma non entreremo ora in questi dettagli. La cosa principale da sottolineare è che il segnale luminoso è già «pensato».Vale a dire, l’informazione delle varie cellule non va direttamente al cervello, punto per punto, ma nella retina un certo numero di informazioni è già stato riassunto, combinando l’informazione proveniente da diversi ricevitori visivi. È importante capire che alcuni fenomeni di funzione cerebrale avvengono nell’occhio stesso.

35.2

Il colore dipende dall’intensità

Uno dei più sorprendenti fenomeni della visione è l’adattamento dell’occhio al buio. Se entriamo nel buio da una stanza fortemente illuminata, non possiamo vedere bene per un po’, ma gradualmente le cose appaiono sempre più visibili, e finalmente possiamo vedere qualcosa dove non avevamo potuto veder niente prima. Se l’intensità della luce è molto bassa, le cose che vediamo non hanno colore. Si sa che questa visione con adattamento al buio è quasi interamente dovuta ai bastoncelli, mentre la visione nella luce brillante è dovuta ai coni. Come risultato vi sono numerosi fenomeni che possiamo facilmente valutare a causa di questo trasferimento di funzione, dai coni e dai bastoncelli insieme, ai bastoncelli soltanto. Vi sono molte situazioni in cui, se l’intensità della luce fosse maggiore, potremmo vedere i colori, e troveremmo queste cose proprio belle. Un esempio è che attraverso un telescopio vediamo quasi sempre immagini in «bianco e nero» di nebulose deboli, ma W.C. Miller degli Osservatori di monte Wilson e di Palomar ha avuto la pazienza di fare fotografie a colori di alcuni di questi oggetti. Nessuno ha mai visto realmente questi colori con l’occhio, ma non sono colori artificiali, è semplicemente che l’intensità della luce non è abbastanza forte perché i coni del nostro occhio li distinguano. Fra i più spettacolari di questi oggetti vi sono la Nebulosa ad Anello e la Nebulosa del Cancro. La prima mostra un bel blu nella parte interna, con un bagliore

35.2 • Il colore dipende dall’intensità

© 978-8808-22107-0

357

rosso nell’alone esterno, mentre l’altra mostra una nebbia generale bluastra permeata da filamenti luminosi rosso-arancio. Alla luce brillante, apparentemente, i bastoncelli hanno una sensibilità bassissima, ma, nel buio, al passare del tempo acquistano la loro capacità di reagire alla luce. Le variazioni nell’intensità luminosa alle quali ci si può adattare sono dell’ordine di un milione a uno. La natura non fa tutto questo semplicemente con un solo tipo di cellule, ma trasmette il compito da cellule che reagiscono alla luce vivida, le cellule che vedono il colore, i coni, ai bastoncelli, cellule adatte alla bassa intensità, che si aggiustano all’oscurità. Fra le conseguenze interessanti di questo trasferimento c’è, in primo luogo, la non esistenza del colore, e in secondo luogo la differenza nella lucentezza relativa di oggetti differentemente colorati. Risulta che i bastoncelli leggono meglio verso il blu di quello che fanno i coni, e i coni possono leggere luce profondamente rossa, per esempio, mentre i bastoncelli trovano questa assolutamente impossibile da leggere. Così la luce rossa è nera per quanto riguarda i bastoncelli. Così due pezzi di carta colorata, diciamo blu e rossa, in cui il rosso può essere anche più luminoso del blu in buona luce, appariranno nell’oscurità, completamente invertiti. È un effetto molto sorprendente. Se siamo nell’oscurità e possiamo trovare una rivista o qualcosa di colorato, e, prima di sapere di sicuro quali sono i colori, giudichiamo le aree più luminose e più buie, e se trasportiamo allora la rivista nella luce, possiamo vedere questo notevolissimo spostamento fra quello che era il colore più luminoso e quello che non lo era. Il fenomeno è detto effetto Purkinje. Nella FIGURA 35.3 la curva tratteggiata rappresenta la sensibilità dell’occhio nel buio, cioè mentre usa i bastoncelli, mentre la curva continua rappresenta la sensibilità nella luce. Vediamo che il picco di sensibilità dei bastoncelli è nella regione del verde e che quello dei coni è più nella regione del giallo. Se vi è una pagina colorata di rosso (il rosso è circa 650 nm), possiamo vederla se è brillantemente illuminata, ma nell’oscurità è pressoché invisibile. Un altro effetto del fatto che i bastoncelli intervengono nel buio e che non vi sono bastoncelli nella fovea, è che quando osserviamo in linea retta qualcosa nel buio, la nostra visione non è affatto altrettanto acuta di quando osserviamo lateralmente. Una stella debole o una nebulosa può talvolta essere vista meglio osservandola un poco obliquamente piuttosto che direttamente, perché non abbiamo bastoncelli sensibili in mezzo alla fovea. Un altro effetto interessante dovuto al fatto che il numero dei coni diminuisce quando ci inoltriamo a lato del campo visivo è che anche in luce vivida il colore scompare quando l’oggetto si allontana lateralmente. Il modo di provare questo fatto è di guardare in una certa particolare direzione fissa, fare entrare un amico da un lato con cartoncini colorati e cercare di decidere di quali colori si tratti prima che siano proprio di fronte all’osservatore. Si trova che si possono vedere i cartoncini molto prima di determinare il colore. Nel fare questo, è consigliabile entrare dal lato opposto alla macchia cieca, perché altrimenti è piuttosto disorientante vedere quasi il colore, poi non veder niente, poi di nuovo vedere il colore. 100

Visibilità relativa

80

60

40

20 0 700 80

35.3 Sensibilità spettrale dell’occhio. Curva tratteggiata, bastoncelli; curva continua, coni. FIGURA

60

40

20 600 80

60

40

20 500 80

Lunghezza d’onda (nm)

60

40

20 400

358

Capitolo 35 • Visione del colore

© 978-8808-22107-0

Un altro interessante fenomeno è che la periferia della retina è molto sensibile al moto. Benché non possiamo veder bene dall’angolo del nostro occhio, se un piccolo insetto si muove e non ci aspettiamo che niente si muova in quel punto, abbiamo una reazione immediata. Dentro di noi i «collegamenti» sono tutti fatti in modo da osservare qualcosa che si agiti a lato del campo.

35.3

Misura della sensazione del colore

Passiamo ora alla visione dei coni, alla visione più luminosa, e arriviamo alla questione che più caratterizza la visione dei coni, e cioè il colore. Come sappiamo, la luce bianca può essere separata da un prisma in un intero spettro di lunghezze d’onda che ci appare di differenti colori; questo è quello che i colori sono, naturalmente: apparenze. Qualsiasi sorgente di luce può essere analizzata da un reticolo o da un prisma, e si può determinarne la distribuzione spettrale, cioè «l’entità» di ciascuna lunghezza d’onda. Una certa luce può avere moltissimo blu, parecchio rosso, pochissimo giallo e così via. Questo è tutto molto preciso nel senso della fisica, ma il problema è: di quale colore apparirà la luce? È evidente che i diversi colori dipendono in qualche modo dalla distribuzione spettrale della luce, ma il problema è trovare quali caratteristiche della distribuzione spettrale producono le varie sensazioni. Per esempio, che cosa dobbiamo fare per ottenere un colore verde? Tutti sappiamo che possiamo semplicemente prendere una parte dello spettro che sia verde. Ma è questo il solo modo di ottenere verde, o arancio, o qualsiasi altro colore? Vi è più di una distribuzione spettrale che produce lo stesso effetto visivo apparente? La risposta è assolutamente sì. Vi è un numero molto limitato di effetti visivi, in realtà semplicemente una molteplicità tridimensionale di essi, come vedremo brevemente, ma vi è un infinito numero di curve differenti che possiamo tracciare per la luce che proviene da sorgenti differenti. Ora il problema che dobbiamo discutere è: in quali condizioni differenti distribuzioni di luce appaiono esattamente dello stesso colore all’occhio? La tecnica psicofisica più efficace nel giudicare il colore è di usare l’occhio come uno strumento di zero. Cioè, non cerchiamo di definire che cosa costituisce una sensazione verde, o di misurare in quali circostanze otteniamo una sensazione verde, poiché risulta che questo è estremamente complicato. Invece, studiamo le condizioni sotto le quali due stimoli sono indistinguibili. Allora non dobbiamo decidere se due persone vedono la stessa sensazione in differenti circostanze, ma soltanto se, nel caso in cui per una persona due sensazioni sono la stessa cosa, esse lo sono anche per un’altra. Non dobbiamo decidere se, quando si vede qualcosa di verde, quello che si sente all’interno è lo stesso di quello che sente qualcun altro quando vede qualcosa di verde; non sappiamo niente di questo. Per illustrare le possibilità, possiamo usare una serie di quattro proiettori con filtri e le cui luminosità sono regolabili con continuità su un vasto intervallo: uno ha un filtro rosso e produce una macchia di luce rossa su uno schermo, il successivo ha un filtro verde e fa una macchia verde, il terzo ha un filtro blu, e il quarto è un cerchio bianco con una macchia nera in mezzo. Ora se accendiamo una certa luce rossa, e poi vi introduciamo un certo verde, vediamo che nell’area di sovrapposizione esso produce una sensazione che non è quella che chiamiamo verde rossiccio, ma un nuovo colore, giallo in questo caso particolare. Cambiando proporzioni del rosso e del verde passiamo attraverso varie sfumature di arancio e via di seguito. Se abbiamo sistemato le cose per un certo giallo, possiamo anche ottenere lo stesso giallo, non mescolando questi due colori ma mescolandone qualche altro, forse un filtro giallo con luce bianca, o qualcosa di simile a questo, per ottenere la stessa sensazione. In altre parole è possibile comporre i vari colori in più modi, mescolando le luci dai vari filtri. Quello che abbiamo appena scoperto può essere espresso analiticamente come segue. Un giallo particolare, per esempio, può essere rappresentato da un certo simbolo Y , che è la «somma» di certe quantità di luce filtrata dal rosso (R) e luce filtrata dal verde (G). Usando due numeri, diciamo r e g, per descrivere quanto sono vivide (R) e (G) possiamo scrivere una formula per questo giallo: Y = r R + gG (35.1)

35.3 • Misura della sensazione del colore

© 978-8808-22107-0

Il problema è, possiamo comporre tutti i diversi colori sommando due o tre luci di diversi colori fissi? Vediamo che cosa si può fare a questo proposito. Non possiamo certamente ottenere tutti i colori diversi mescolando rosso e verde soltanto, perché, per esempio il blu non apparirà mai in tale mistura. Però, introducendo un po’ di blu, si può fare in modo che la regione centrale, in cui si sovrappongono tutte e tre le macchie, appaia di un bel bianco. Mescolando i vari colori e osservando questa regione centrale, troviamo che possiamo ottenere un considerevole campo di colori in tale regione cambiando le proporzioni, e così non è impossibile che tutti i colori possano essere composti mescolando queste tre luci colorate. Discuteremo fino a che punto questo è vero; è in realtà essenzialmente corretto, e vedremo brevemente come definire meglio il problema. Per illustrare il nostro punto, muoviamo le macchie sullo schermo in modo che esse cadano tutte l’una sull’altra, e poi cerchiamo di uguagliare un particolare colore che appare nell’anello prodotto dalla quarta lampada. Quello che noi una volta pensavamo fosse «bianco» proveniente dalla quarta lampada appare ora giallognolo. Possiamo cercare di uguagliarlo sistemando il verde, il rosso e il blu come meglio possiamo per approssimazioni successive, e troviamo che possiamo approssimare piuttosto strettamente questa particolare sfumatura di color «crema». Così non è difficile credere che possiamo fare tutti i colori. Cercheremo di fare il giallo fra un momento, ma prima di farlo vi è un colore che potrebbe essere difficilissimo da ottenere. Le persone che fanno lezione sul colore compongono tutti i colori «brillanti» ma non fanno mai il marrone, ed è difficile ricordare di aver mai visto luce marrone. In realtà questo colore non viene mai usato per alcun effetto scenico, non si è mai visto un proiettore scenico di luce marrone; così pensiamo che possa essere impossibile comporre il marrone. Per verificare se sia possibile fare il marrone, sottolineiamo che la luce marrone è semplicemente qualcosa che non siamo abituati a vedere senza il suo sfondo. In realtà possiamo ottenerla mescolando una certa quantità di rosso e giallo. Per provare che stiamo osservando luce marrone, aumentiamo semplicemente la luminosità dello sfondo anulare contro cui vediamo la luce stessa, e vediamo che essa è in realtà quello che chiamiamo marrone! Il marrone è sempre un colore scuro vicino a uno sfondo più luminoso. Possiamo facilmente cambiare il carattere del marrone. Per esempio se togliamo un po’ di verde otteniamo un marrone rossiccio, apparentemente un marrone rosso cioccolata, e se introduciamo più verde, in proporzione, otteniamo quell’orribile colore di cui sono fatte tutte le uniformi dell’esercito, ma la luce di tale colore non è così orribile per se stessa; è un verde giallognolo, visto contro uno sfondo chiaro. Mettiamo ora un filtro giallo davanti alla quarta lampada e cerchiamo di uguagliarla. (L’intensità deve naturalmente essere entro il campo delle varie lampade; non possiamo uguagliare qualcosa che sia troppo luminoso, poiché non abbiamo abbastanza potenza nella lampada.) Ma possiamo uguagliare il giallo; usiamo una miscela di rosso e verde, e introduciamo un tocco di blu per farlo ancora più perfetto. Forse siamo pronti a credere che, in buone condizioni, possiamo uguagliare perfettamente un qualsiasi dato colore. Discutiamo ora le leggi della composizione del colore. In primo luogo abbiamo trovato che distribuzioni spettrali differenti possono produrre lo stesso colore; in seguito abbiamo visto che «qualsiasi» colore può essere composto sommando insieme tre colori particolari, rosso, blu e verde. La caratteristica più importante del mescolare i colori è questa: se abbiamo una certa luce, che possiamo chiamare X, e se appare indistinguibile da Y all’occhio (può essere una differente distribuzione spettrale, ma appare indistinguibile), chiamiamo «uguali» questi colori, nel senso che l’occhio li vede come uguali e scriviamo X =Y

(35.2)

Ecco una delle grandi leggi del colore: se due distribuzioni spettrali sono indistinguibili, e se sommiamo a ciascuna una certa luce, diciamo Z (se scriviamo X + Z, questo significa che facciamo brillare entrambe le luci nello stesso punto), e poi prendiamo Y e sommiamo la stessa quantità della stessa altra luce, Z, le nuove misture sono anch’esse indistinguibili: X +Z =Y +Z

(35.3)

Abbiamo appena uguagliato il nostro giallo; se facciamo brillare luce rosa sull’intera macchia, resterà ancora uguale. Così sommare qualsiasi altra luce a luci uguali lascia inalterato l’accordo.

359

360

Capitolo 35 • Visione del colore

© 978-8808-22107-0

In altre parole possiamo riassumere tutti questi fenomeni dei colori dicendo che, una volta che abbiamo trovato un accordo fra due luci colorate, viste l’una accanto all’altra nelle stesse circostanze, allora questo accordo rimarrà, e una luce può essere sostituita dall’altra luce in qualsiasi altra situazione di mistura di colori. Infatti risulta, ed è molto importante e interessante, che questo accordo del colore delle luci non dipende dalle caratteristiche dell’occhio al momento dell’osservazione: sappiamo che se osserviamo per un lungo tempo una superficie luminosa rossa o una luce rossa intensa, e poi guardiamo un foglio bianco, esso appare verdastro, e anche altri colori vengono alterati dal fatto che abbiamo guardato a lungo un rosso vivo. Se ora abbiamo un accordo fra, diciamo, due gialli, li osserviamo e li rendiamo uguali, poi osserviamo una superficie rossa luminosa per lungo tempo, quindi ritorniamo al giallo, forse non ci sembrerà più giallo; non so che colore apparirà, ma non sembrerà giallo. Nondimeno i gialli appariranno ancora accordati, e così, quando l’occhio si adatta a vari livelli di intensità l’accordo di colore funziona ancora, con l’ovvia eccezione di quando entriamo nella regione in cui l’intensità della luce diviene tanto bassa da esserci spostati dai coni ai bastoncelli; allora un accordo di colore non è più accordo, perché stiamo usando un sistema diverso. Il secondo principio della mescolanza del colore delle luci è questo: qualsiasi colore, nessuno escluso, può essere fatto da tre diversi colori, nel nostro caso, rosso, verde e blu. Mescolandoli opportunamente insieme, possiamo creare qualsiasi colore, come abbiamo dimostrato con i nostri due esempi. Inoltre, queste due leggi sono matematicamente molto interessanti. Per quelli che sono interessati alla matematica della cosa, risulta quanto segue. Supponiamo di prendere i nostri tre colori, che erano rosso, verde e blu, ma indichiamoli A, B e C e chiamiamoli i nostri colori primari. Dunque qualsiasi colore potrebbe essere composto da certe quantità di questi tre: diciamo una quantità a di colore A, una quantità b di colore B e una quantità c di colore C produce X: X = a A + bB + cC

(35.4)

Supponiamo ora che un altro colore Y sia fatto dagli stessi tre colori: Y = a 0 A + b 0 B + c 0C

(35.5)

Risulta allora che la mescolanza delle due luci (è una delle conseguenze delle leggi che abbiamo già ricordato) si ottiene facendo la somma delle componenti di X e di Y : Z = X + Y = (a + a 0)A + (b + b0)B + (c + c 0)C

(35.6)

È semplicemente la matematica della somma dei vettori, dove (a, b, c) sono le componenti di un vettore, e (a 0, b0, c 0) sono quelle dell’altro vettore, e la nuova luce Z è allora la «somma» dei vettori. Questo argomento ha sempre interessato fisici e matematici. Infatti Schrödinger scrisse un bellissimo saggio sulla visione del colore in cui sviluppava questa teoria dell’analisi vettoriale applicata alla mescolanza dei colori.(1) Ora un problema è: quali sono gli opportuni colori primari da usare? Non vi è qualcosa di simile «ai» colori primari corretti per quanto riguarda la mescolanza della luce. Possono esservi, per scopi pratici, tre vernici che sono più utili di altre per ottenere una maggiore quantità di colori eterogenei, ma non stiamo discutendo ora un argomento del genere. Tre differenti luci colorate qualsiasi, non importa quali (2) , possono sempre essere mischiate nella giusta proporzione per produrre qualsiasi colore, non importa quale. Possiamo dimostrare questo fatto fantastico? Invece di usare rosso, verde e blu, usiamo rosso, blu e giallo nel nostro proiettore. Possiamo usare rosso, blu e giallo per fare, diciamo, il verde? Mescolando questi tre colori in varie proporzioni, otteniamo una gamma completa di colori differenti, distribuiti su un intero spettro. Ma in realtà dopo molti tentativi ed errori, non troviamo mai niente che appaia simile al verde. Il problema è: possiamo fare il verde? La risposta è sì. Come? Proiettando un po’ di rosso sul verde, allora possiamo fare un accordo con una certa mescolanza di giallo e di blu! Così li abbiamo accordati, tranne che abbiamo dovuto truffare mettendo il rosso (1) (2)

Sitzber. Akad. Wiss. Wien (2a) 134, 471 (1925). Tranne, naturalmente, se uno dei tre può essere ottenuto mescolando gli altri due.

35.4 • Il diagramma cromatico

© 978-8808-22107-0

361

dall’altra parte. Ma poiché siamo in possesso di una certa raffinatezza matematica possiamo renderci conto che quello che in realtà abbiamo mostrato era non che X potrebbe sempre esser fatto, diciamo, di rosso, blu e giallo, ma mettendo il rosso dall’altra parte abbiamo trovato che il rosso più X potrebbe essere ricavato dal blu e dal giallo. Ponendolo nell’altro termine dell’equazione possiamo interpretarlo come una quantità negativa, così se permetteremo che i coefficienti in equazioni come la (35.4) possano essere sia positivi sia negativi, e se interpretiamo le quantità negative nel senso di doverle sommare all’altro membro, allora qualsiasi colore può essere uguagliato da qualsiasi altri tre colori, e non esistono cose quali «i» colori primari fondamentali. Possiamo chiederci se vi sono tre colori che possono essere usati solo in quantità positive per tutte le miscele. La risposta è no. Ogni gruppo di tre primari richiede quantità negative per alcuni colori, e quindi non vi è un modo unico di definire un primario. Nei libri elementari è detto che essi sono rosso, verde e blu, ma questo è semplicemente a causa del fatto che con questi è disponibile una più vasta gamma di colori senza il segno meno per alcune delle combinazioni.

35.4

Il diagramma cromatico

Discutiamo ora la combinazione dei colori a un livello matematico come un problema geometrico. Se qualsiasi colore è rappresentato dall’equazione (35.4), possiamo tracciarlo come un vettore nello spazio riportando lungo i tre assi le quantità a, b e c, e quindi un certo colore è un punto. Se un altro colore è a 0, b0 e c 0, tale colore è situato in qualche altro punto. La somma dei due, come sappiamo, è il colore che si ottiene sommando questi due vettori. Possiamo semplificare questo diagramma e rappresentare ogni cosa su un piano con la seguente osservazione: se avessimo una certa luce colorata, e raddoppiassimo semplicemente a, b e c, cioè se li facessimo più grandi ma sempre nello stesso rapporto, il colore sarebbe lo stesso, ma più vivo. Così se siamo d’accordo di ridurre tutto alla stessa intensità luminosa, allora possiamo proiettare tutto su un piano e questo è stato fatto nella FIGURA 35.4. Ne consegue che qualsiasi colore ottenuto mescolando due colori dati in una certa proporzione, giacerà in qualche punto su una linea tracciata fra i due punti. y

520

530

0,8

540 G

510

550

0,7

560 0,6

570 500

580

0,5

590 0,4

600

0,3

610 620 630 R

490

700 0,2 480

0,1

470 0

0

0,1

B 400 0,2

0,3

0,4

0,5

0,6

0,7

x

35.4 Diagramma cromatico campione. FIGURA

362

Capitolo 35 • Visione del colore

© 978-8808-22107-0

Coefficienti

Per esempio, una mistura cinquanta a cinquanta apparirà in mezzo fra loro, e 1/4 di uno e 3/4 dell’altro apparirà a 1/4 del cammino dall’uno all’altro, e via di seguito. Se usiamo un blu, un verde e un rosso, come primari, vediamo che tutti i colori che possiamo fare con coefficienti positivi sono all’interno del triangolo tratteggiato, che contiene pressoché tutti i colori che mai possiamo vedere, perché tutti i colori che mai possiamo vedere sono inclusi nell’area di forma piuttosto strana limitata dalla curva. Da dove è venuta quest’area? Una volta qualcuno fece una accuratissima armonizzazione di tutti i colori che possiamo vedere rispetto a tre colori particolari. Ma noi non dobbiamo verificare tutti i colori che possiamo vedere, dobbiamo verificare soltanto i puri colori spettrali, le righe nello spettro. Qualsiasi luce può essere considerata come una somma di quantità positive diverse di vari colori spettrali puri – puri dal punto di vista fisico. Una data luce avrà una certa quantità di rosso, giallo, blu e via di seguito – colori spettrali. Così se sappiamo quanto di ciascuno dei tre scelti come primari è necessario per fare ciascuna di queste componenti pure, possiamo calcolare quanto è necessario di ciascuno per fare il nostro dato colore. Così se troviamo quali sono i coefficienti del colore di tutti i colori spettrali per tre colori primari dati qualsiasi, allora possiamo trovare l’intera tavola di miscelamento dei colori. Un esempio di tali risultati sperimentali relativi al mescolamento di tre luci insieme è dato in FIGURA 35.5. Questa figura mostra la quantità di ciascuno dei tre differenti colori primari, rosso, verde e blu, che è richiesta +1,2 R G B per fare ciascuno dei colori spettrali. Il rosso è all’estremità sinistra dello 1,0 spettro, il giallo è il successivo e via di seguito, fino ad arrivare al blu. 0,8 Notate che in alcuni punti sono necessari i segni negativi. È da tali dati che è possibile localizzare la posizione di tutti i colori sul diagramma, dove 0,6 le coordinate x e y sono rapportate alle quantità dei diversi primari che 0,4 vengono usati. 0,2 Questo è il modo in cui è stata trovata la linea curva delimitante. Essa è il luogo dei puri colori spettrali. Ora qualsiasi altro colore può essere fatto 0 sommando righe spettrali, naturalmente, e così troviamo che ogni colore –0,2 che può essere prodotto collegando una parte di questa curva a un’altra è un 720 680 640 600 560 520 480 440 400 colore che è disponibile in natura. La linea retta collega l’estremo violetto Lunghezza d’onda (nm) dello spettro con l’estremo rosso. È il luogo dei porpora. All’interno della curva delimitante vi sono i colori che possono essere composti con luci, FIGURA 35.5 I coefficienti del colore per i colori puri e all’esterno vi sono i colori che non possono venire composti con luci, e spettrali in funzione di un certo gruppo di colori primari campione. nessuno li ha mai visti (tranne, è possibile, con l’immaginazione!).

35.5

Il meccanismo della visione del colore

Il prossimo aspetto dell’argomento è il seguente problema: perché i colori si comportano in questo modo? La teoria più semplice, proposta da Young e Helmholtz, suppone che nell’occhio vi siano tre diversi pigmenti che ricevono la luce e che questi abbiano diversi spettri di assorbimento, cosicché un pigmento assorbe fortemente, diciamo, nel rosso, un altro assorbe fortemente nel blu, un altro assorbe nel verde. Allora quando facciamo brillare su di essi una luce otterremo diverse quantità di assorbimento nelle tre regioni, e queste tre parti di informazione sono in qualche modo elaborate nel cervello, o nell’occhio, o chissà dove, per decidere di che colore si tratti. È facile dimostrare che tutte le regole della miscelatura dei colori sarebbero una conseguenza di questo enunciato. Vi è stato un notevole dibattito sull’argomento perché il problema successivo, naturalmente, è di trovare le caratteristiche di assorbimento di ciascuno dei tre pigmenti. Risulta, sfortunatamente, che, poiché possiamo trasformare le coordinate del colore in qualsiasi modo vogliamo, possiamo soltanto trovare tutti i tipi di combinazioni lineari delle curve di assorbimento con esperimenti di miscelatura del colore, ma non le curve per i singoli pigmenti. Gli studiosi hanno cercato vari modi di ottenere una curva specifica che descriva qualche particolare proprietà fisica dell’occhio. Una tale curva è chiamata curva della luminosità, mostrata

35.5 • Il meccanismo della visione del colore

© 978-8808-22107-0

y

363

y 520

515

0,8

540

510 550

0,7

530

0,8

540 510

520

515

530

550

0,7 560

505

0,6

570

500

570

500 580

0,5

560

505

0,6

580

0,5 590

0,4

495

610 620

490

0,3

590

0,4

600

495

600 610 620

490

0,3

750

750

0,2

0,2 480

0,1

480

0,1

470

0

470

450

0

FIGURA

0,1

35.6

450

0 0,2

0,3

0,4

0,5

0,6

Luoghi dei colori confusi dai deuteranopi.

0,7

x

0

FIGURA

0,1

35.7

0,2

0,3

0,4

0,5

Luoghi dei colori confusi dai protanopi.

in FIGURA 35.3. In questa figura vi sono due curve, una per gli occhi nell’oscurità e l’altra per gli occhi alla luce; l’ultima è la curva della luminosità dei coni. Questa è misurata trovando qual è la più piccola quantità di luce colorata di cui abbiamo bisogno per essere in grado di vederla appena. Questo misura la sensibilità dell’occhio nelle diverse regioni spettrali. Vi è un altro modo interessante per misurare questo. Se prendiamo due colori e li facciamo apparire in un’area, oscurando alternativamente l’uno o l’altro, vediamo uno sfarfallio se la frequenza è troppo bassa. Però, quando la frequenza aumenta, lo sfarfallio alla fine sparirà a una certa frequenza che dipende dallo splendore della luce, diciamo a sedici ripetizioni per secondo. Ora, se sistemiamo la luminosità o l’intensità di un colore rispetto all’altro, si arriva a un’intensità in cui il guizzo scompare a 16 cicli. Per ottenere uno sfarfallio alla luminosità così aggiustata dobbiamo andare a una frequenza molto più bassa, in modo da vedere uno sfarfallio del colore. Otteniamo così quello che chiamiamo uno sfarfallio di luminosità ad alta frequenza e, a bassa frequenza, uno sfarfallio di colore. È possibile uguagliare due colori per «uguale luminosità» con questa tecnica dello sfarfallio. I risultati sono quasi, ma non esattamente, gli stessi di quelli ottenuti misurando la soglia di sensibilità dell’occhio nel vedere luce debole con i coni. La maggior parte dei ricercatori usa il sistema dello sfarfallio come definizione della curva di luminosità. Ora, se nell’occhio vi sono tre pigmenti sensibili al colore, il problema è di determinare la forma dello spettro di assorbimento di ciascuno. Come? Sappiamo che vi sono persone daltoniche – l’8% della popolazione maschile e lo 0,5% della femminile. La maggior parte delle persone che sono daltoniche o anormali nella visione del colore hanno un grado di sensibilità diverso dagli altri per una variazione di colore, ma hanno ancora bisogno di tre colori da accordare. Però vi sono alcuni che sono chiamati dicromatici, per i quali qualsiasi colore può essere uguagliato usando soltanto due colori primari. L’ovvio suggerimento, allora, è di dire che essi sono privi di uno dei tre pigmenti. Se potessimo trovare tre tipi di daltonici dicromatici che hanno diverse regole di mescolanza del colore, un tipo dovrebbe mancare della pigmentazione rossa, un altro della verde e un altro di quella blu. Misurando tutti questi tipi possiamo misurare le tre curve! Risulta che vi sono tre tipi di daltonismo dicromatico; vi sono due tipi comuni e un terzo molto raro, e da questi tre è stato possibile dedurre gli spettri di assorbimento del pigmento. La FIGURA 35.6 mostra la mescolanza di colore di un particolare tipo di persona daltonica detta deuteranope. Per essa i luoghi dei colori costanti non sono punti, ma certe linee, lungo ciascuna

0,6

0,7

x

364

Capitolo 35 • Visione del colore

© 978-8808-22107-0

delle quali il colore le appare come lo stesso. Se la teoria secondo la quale essa manca di una delle tre parti di informazione è giusta, tutte queste 2,0 B linee devono intersecarsi in un punto. Se misuriamo accuratamente su questo diagramma esse si intersecano perfettamente. Ovviamente, però, G questo è stato fatto da un matematico e non rappresenta i dati reali! In 1,0 realtà se guardiamo l’ultima pubblicazione con i dati reali, risulta che nel R diagramma della FIGURA 35.6, il fuoco di tutte le linee non è esattamente nel punto giusto. Usando le linee nella figura sopra, non possiamo trovare 0 spettri ragionevoli; abbiamo bisogno di assorbimenti positivi e negativi in 4000 5000 6000 7000 differenti regioni. Ma usando i nuovi dati di Yustova, risulta che ciascuna delle curve di assorbimento è ovunque positiva. La FIGURA 35.7 mostra un differente tipo di daltonismo, quello del proFIGURA 35.8 Curve di sensibilità spettrale dei tanope, che ha un fuoco vicino all’estremità rossa della curva delimitante. ricevitori di un normale tricromatico. Yustova ottiene approssimativamente la stessa posizione in questo caso. Usando i tre diversi tipi di daltonismo, le tre curve di risposta del pigmento sono state finalmente determinate, e sono mostrate in FIGURA 35.8. Definitivamente? Forse. C’è un problema per quanto riguarda se sia giusta l’idea dei tre pigmenti, se il daltonismo risulta dalla mancanza di uno dei pigmenti, e anche se i dati della mescolanza del colore sono esatti. Differenti sperimentatori ottengono risultati diversi. Questo campo è ancora in forte sviluppo.

35.6

Fisiochimica della visione del colore

Ora, che dire della verifica di queste curve rispetto ai pigmenti reali dell’occhio? I pigmenti che possono essere ottenuti da una retina consistono principalmente di un pigmento detto porpora retinica. Le sue caratteristiche più notevoli sono, primo, che si trova nell’occhio di quasi tutti gli animali vertebrati, e secondo, che la sua curva di risposta si accorda meravigliosamente con la sensibilità dell’occhio, come mostrato in FIGURA 35.9, in cui sono riportati sulla stessa scala l’assorbimento della porpora visiva e la sensibilità dell’occhio adattato all’oscurità. Questo pigmento è evidentemente il pigmento col quale vediamo nel buio: la porpora retinica è il pigmento per i bastoncelli e non ha niente a che fare con la visione del colore. Questo fatto fu scoperto nel 1877. Anche oggi si può dire che i pigmenti del colore dei coni non sono mai stati ottenuti in provetta. Nel 1958 si sarebbe potuto dire che i pigmenti del colore non erano mai stati visti affatto. Ma da allora due di essi sono stati scoperti da Rushton con una tecnica molto semplice e molto bella. La difficoltà è, presumibilmente, che l’occhio, poiché è così poco sensibile alla luce intensa rispetto alla luce di bassa intensità, ha bisogno di molta porpora retinica con cui vedere, ma non di molti pigmenti del colore per vedere i colori. L’idea di Rushton è di lasciare il pigmento nell’occhio e di misurarlo comunque. Ciò che egli fa è questo. Vi è uno strumento chiamato oftalmoscopio per inviare la luce nell’occhio attraverso il cristallino e poi mettere a fuoco la luce che ritorna indietro. Con esso si può misurare quanta ne è riflessa. Così si misura il coefficiente di riflessione della luce che ha attraversato il pigmento due volte (riflessa da uno strato nella parte posteriore del bulbo oculare e che ritorna riattraversando ancora il pigmento del cono). La natura non è sempre così ben progettata. I coni sono progettati in modo così interessante che la luce che entra nel cono rimbalza attorno e dirige il suo moto giù nei piccoli punti sensibili all’apice. La luce va direttamente giù al punto sensibile, rimbalza sul fondo e ritorna indietro di nuovo, dopo aver attraversato una quantità considerevole di pigmento della visione del colore; inoltre, osservando la fovea, dove non ci sono bastoncelli, non ci si confonde con la porpora retinica. Ma il colore della retina è stato visto da molto tempo: è una specie di colore rosa-arancione; poi vi sono tutti i vasi sanguigni e il colore del materiale sul dietro, e così via. Come sappiamo quando stiamo osservando il pigmento? Risposta: in primo luogo prendiamo una persona daltonica, che ha meno pigmenti e per la quale è quindi più facile fare l’analisi. In secondo luogo i vari pigmenti, come la porpora retinica, hanno una variazione di intensità quando vengono illuminati dalla luce; quando facciamo brillare luce su di essi, cambiamo la loro

35.6 • Fisiochimica della visione del colore

Luminosità e assorbimento

© 978-8808-22107-0

Densità doppia P·54

1,0

0,03

0,02

0,6 0,02

0,4

0,01 0,01

0,2 0

400

500

600

500

Lunghezza d’onda (nm)

35.9 Curva di sensibilità di un occhio adattato al buio, confrontata con la curva di assorbimento della porpora retinica. FIGURA

Densità doppia P·59 0,03

0,04

0,8

365

550

600

650

Lunghezza d’onda (nm)

35.10 Spettro di assorbimento del pigmento del colore di un occhio daltonico protanope (quadrati) e un occhio normale (cerchietti). FIGURA

concentrazione. Così, mentre stava osservando lo spettro di assorbimento dell’occhio, Rushton inviò un altro fascio nell’intero occhio, il che cambia la concentrazione del pigmento, e misurò la variazione nello spettro, e la differenza naturalmente non ha niente a che fare con la quantità di sangue o col colore degli strati riflettenti e via di seguito, ma soltanto col pigmento, e in questa maniera Rushton ottenne una curva per il pigmento dell’occhio protanope, che è data nella FIGURA 35.10. La seconda curva nella FIGURA 35.10 è una curva ottenuta con un occhio normale. Questa fu ottenuta prendendo un occhio normale e, avendo già determinato che cosa fosse un pigmento, illuminando l’altro nel rosso dove il primo è insensibile. La luce rossa non ha effetto sull’occhio protanope, ma lo ha nell’occhio normale, e così si può ottenere la curva per il pigmento mancante. La forma di una curva si accorda perfettamente con la curva del verde di Yustova, ma la curva del rosso è un pochino spostata. Così forse stiamo arrivando sulla giusta strada. O forse no – l’ultimo lavoro con i deuteranopi non mostra la mancanza di alcun definito pigmento. Il colore non è un problema della fisica della luce in se stessa. Il colore è una sensazione, e la sensazione per diversi colori è diversa in circostanze diverse. Per esempio, se abbiamo una luce rosa, ottenuta sovrapponendo fasci incrociati di luce bianca e di luce rossa (tutto quello che possiamo fare con il bianco e il rosso è il rosa, ovviamente) possiamo mostrare che la luce bianca può apparire blu. Se poniamo un oggetto nei fasci, esso proietta due ombre – una illuminata soltanto dalla luce bianca e l’altra dalla luce rossa. Per la maggioranza delle persone l’ombra «bianca» di un oggetto appare blu, ma se continuiamo a estendere quest’ombra fino a che copre l’intero schermo, vediamo che improvvisamente appare bianca, non blu! Possiamo ottenere altri effetti della stessa natura mescolando luce rossa, gialla e bianca. Luci rossa, gialla e bianca possono produrre soltanto gialli arancioni e via di seguito. Così, se mescoliamo tali luci approssimativamente in proporzioni uguali otteniamo soltanto luce arancione. Nondimeno, proiettando differenti tipi di ombre nella luce, con varie sovrapposizioni di colori si ottiene veramente una serie di splendidi colori che non sono nella luce stessa (che è soltanto arancione), ma nelle nostre sensazioni. Vediamo chiaramente molti colori differenti che sono del tutto diversi da quelli «fisici» nel fascio. È molto importante rendersi conto che una retina sta già «pensando» alla luce; e sta paragonando quello che vede in una regione con quello che vede in un’altra, benché non coscientemente. Quello che sappiamo di come fa è l’argomento del prossimo capitolo.

366

Capitolo 35 • Visione del colore

© 978-8808-22107-0

Bibliografia

Committee on Colorimetry, Optical Society of America, The Science of Color, Thomas Y. Crowell Company, New York, 1953. H , S., S. S , and M. H. P Physiology, 1942, 25, 819-840. M ,C and E Company, Inc., 1950.

S

, «Energy, Quanta, and Vision,» Journal of General , Physiological Psychology, 2nd ed., McGraw-Hill Book

N , N. D. and E. N. Y , «Researches on Dichromatic Vision and the Spectral Sensitivity of the Receptors of Trichromats,» presented at Symposium No. 8, Visual Problems of Colour, Vol. II, National Physical Laboratory, Teddington, England, September 1957. Published by Her Majesty’s Stationery Office, London, 1958. R , W. A., «The Cone Pigments of the Human Fovea in Colour Blind and Normal», presented at Symposium No. 8, Visual Problems of Colour, Vol. I, National Physical Laboratory, Teddington, England, September 1957. Published by Her Majesty’s Stationery Office, London, 1958. W ,R S., Experimental Psychology, Henry Holt and Company, New York, 1938. Revised edition, 1954, by Robert S. Woodworth and H. Schlosberg.

Meccanismo della visione

36.1

36

La sensazione del colore

Nel discutere il senso della vista, dobbiamo renderci conto che (al di fuori di una galleria d’arte moderna!) non si vedono macchie di colore o macchie di luce a caso. Quando osserviamo un oggetto vediamo un uomo o una cosa; in altre parole il cervello interpreta ciò che vediamo. Come lo faccia non si sa, ma lo fa, naturalmente ad altissimo livello. Anche se noi evidentemente impariamo a riconoscere che aspetto ha un uomo dopo molta esperienza, vi sono numerose caratteristiche della visione che sono più elementari, ma che implicano anche loro di combinare le informazioni legate alle diverse parti di quello che vediamo. Per aiutarci a capire come otteniamo un’interpretazione dell’intera immagine, vale la pena di studiare i primi stadi dell’unificazione dell’informazione delle diverse cellule della retina. In questo capitolo ci concentreremo principalmente su tale aspetto della visione, pur se nel procedere ricorderemo anche numerosi aspetti secondari. Un esempio del fatto che abbiamo un accumulo, a un livello molto elementare, di informazioni da diverse parti dell’occhio nello stesso tempo, oltre il nostro controllo volontario o la nostra abilità nell’imparare, è quell’ombra blu prodotta dalla luce bianca quando entrambe le luci bianca e rossa stanno illuminando lo stesso schermo. Questo effetto almeno implica la conoscenza che lo sfondo dello schermo sia rosa, anche se, quando stiamo osservando l’ombra blu, è soltanto luce «bianca» che giunge in un punto particolare dell’occhio; in qualche punto sono state riunite delle informazioni. Più completo e familiare è il contesto, più l’occhio farà correzioni per le irregolarità. Infatti, Land ha mostrato che se mescoliamo tale blu apparente e il rosso in varie proporzioni usando due diapositive con assorbimento del rosso e del bianco in proporzioni diverse, si può fare in modo che ciò rappresenti una scena reale, con oggetti reali, piuttosto fedelmente. In questo caso otteniamo anche molti colori intermedi apparenti, analoghi a quelli che otterremmo mescolando il rosso e il blu-verde; appare un insieme quasi completo di colori, ma se li osserviamo molto attentamente essi non sono così buoni. Anche così è sorprendente quanto può essere ottenuto semplicemente dal rosso e dal bianco. Più la scena appare simile a una situazione reale, più la gente è in grado di compensare il fatto che tutta la luce non è in realtà che luce rosa! Un altro esempio è l’apparenza dei «colori» in un disco nero e bianco rotante, le cui aree nere e bianche sono come quelle mostrate in FIGURA 36.1. Quando il disco viene ruotato, le variazioni di luce e di buio a qualsiasi raggio sono esattamente le stesse; è soltanto il fondo che è diverso per i due tipi di «strisce». Eppure uno degli «anelli» appare colorato di un colore e l’altro di un altro.(1) Nessuno ancora capisce la ragione di quei colori, ma è chiaro che delle informazioni vengono messe insieme a un livello molto elementare, nell’occhio stesso, molto verosimilmente. Quasi tutte le teorie odierne sulla visione del colore sono d’accordo sul fatto che i dati della miscelatura del colore indicano che vi sono soltanto tre pigmenti nei coni dell’occhio, e che è l’assorbimento spettrale in questi tre pigmenti che produce fondamentalmente il senso del colore. Ma la sensazione totale che è collegata con le caratteristiche dell’assorbimento dei tre pigmenti (1) I colori dipendono dalla velocità di rotazione, dall’intensità dell’illuminazione e, fino a un certo grado, da chi guarda gli anelli e dall’attenzione con cui li fissa.

36.1 Quando un disco come questo è fatto ruotare, i colori appaiono soltanto in uno dei due «anelli» più scuri. Se viene invertito il senso di rotazione, i colori appaiono nell’altro anello. FIGURA

368

Capitolo 36 • Meccanismo della visione

© 978-8808-22107-0

agenti insieme non è necessariamente la somma delle sensazioni individuali. Noi tutti siamo d’accordo che il giallo semplicemente non sembra affatto verde rossastro; in realtà può essere una tremenda sorpresa per la maggioranza delle persone scoprire che la luce è, in realtà, una mistura di colori, perché presumibilmente la sensazione della luce è dovuta a qualche altro processo piuttosto che a una semplice miscelatura come un accordo musicale, dove vi sono le tre note allo stesso tempo e se ascoltiamo attentamente possiamo udirle una per una. Non possiamo guardare molto intensamente e vedere il rosso e il verde. Le prime teorie della visione dicevano che vi erano tre pigmenti e tre tipi di coni, ciascun tipo contenente un pigmento; che un nervo correva da ciascun cono al cervello, cosicché le tre informazioni erano trasportate al cervello; e poi nel cervello può accadere qualunque cosa. Questo, naturalmente, è un concetto incompleto: non vale scoprire che l’informazione è trasportata lungo il nervo ottico al cervello, perché non abbiamo nemmeno incominciato a risolvere il problema. Dobbiamo porci quesiti più fondamentali: fa qualche differenza il luogo dove l’informazione viene unificata? È importante che venga direttamente trasportata su nel cervello attraverso il nervo ottico, o potrebbe la retina fare prima una certa analisi? Abbiamo visto una rappresentazione della retina come una cosa molto complicata con moltissimi intercollegamenti (FIGURA 35.2) ed essa potrebbe fare alcune analisi. In realtà le persone che studiano anatomia e lo sviluppo dell’occhio, hanno dimostrato che la retina è, in effetti, cervello: nello sviluppo dell’embrione, una parte del cervello esce davanti, e lunghe fibre si sviluppano indietro, collegando gli occhi al cervello. La retina è organizzata proprio allo stesso modo in cui è organizzato il cervello e, come qualcuno ha splendidamente detto: «Il cervello ha sviluppato un modo di osservare il mondo». L’occhio è una parte del cervello che tocca, per così dire, la luce all’esterno. Così non è affatto inverosimile che una certa analisi del colore sia già stata fatta nella retina. Questo ci dà un’interessante opportunità. Nessuno degli altri sensi implica una così vasta estensione di calcolo, per dire, prima che il segnale raggiunga un nervo sul quale si possono fare misure. I calcoli per tutti gli altri sensi avvengono comunemente nel cervello stesso, dov’è molto difficile ottenere zone specifiche per fare misure, dato che vi sono moltissime interconnessioni. Qui, col senso della vista, abbiamo la luce, tre strati di cellule che fanno calcoli, e i risultati dei calcoli vengono trasmessi attraverso il nervo ottico. Così abbiamo la prima opportunità di osservare fisiologicamente come, forse, i primi strati del cervello funzionano nei loro primi passi. È così di doppio interesse, non è interessante semplicemente per la vista, ma lo è per l’intero problema della fisiologia. Il fatto che vi sono tre pigmenti non significa che vi debbano essere tre tipi di sensazioni. Una delle altre teorie della visione del colore è che vi siano in realtà schemi di colori che si oppongono (FIGURA 36.2). Cioè, una delle fibre nervose trasporta moltissimi impulsi se è il giallo a essere visto, e meno di quanto fa di solito per il blu. Un’altra fibra nervosa trasporta l’informazione del verde e del rosso nello stesso modo, e un’altra il bianco e il nero. In altre parole, in questa teoria qualcuno ha già iniziato a fare ipotesi sul sistema di collegamento, sul metodo di calcolo. I problemi che stiamo cercando di risolvere con ipotesi su questi primi calcoli sono problemi sui colori apparenti che sono visti su uno sfondo rosa, quello che accade quando l’occhio è adattato a diversi colori, e anche Risposte neurali i cosiddetti fenomeni psicologici. I fenomeni psicologici sono del tipo, per esempio, che il bianco non «dà l’impressione» del rosso, del giallo e del blu, b y g r w bk e questa teoria fu avanzata perché gli psicologi dicono che vi sono quattro colori puri apparenti: «vi sono quattro stimoli che hanno una considerevole capacità di evocare psicologicamente i semplici colori blu, giallo, verde α β γ e rosso rispettivamente. A differenza dal terra di Siena, dal magenta, dal porpora o dalla maggior parte dei colori distinguibili, questi semplici colori non sono mischiati nel senso che nessuno partecipa della natura dell’altro; specificamente, il blu non è giallognolo, rossastro, o verdastro e via di FIGURA 36.2 Connessioni neurali secondo la teoria seguito, questi sono psicologicamente colori primari». «degli opposti» della visione del colore. In figura si ha: Questo è un cosiddetto fatto psicologico. Per trovare da quale evidenza y b = k 1 (β + γ 2α) fu dedotto questo fatto psicologico, dobbiamo scandagliare con estrema r g = k 2 (α + γ 2β) accuratezza tutta la letteratura. w bk = k 3 (α + γ + β) k 4 (α + β + γ)

36.2 • La fisiologia dell’occhio

© 978-8808-22107-0

Nella moderna letteratura tutto quello che troviamo sull’argomento sono ripetizioni della stessa asserzione, ossia dell’asserzione di uno psicologo tedesco, che usa come una delle sue autorità Leonardo da Vinci, il quale, naturalmente, noi tutti sappiamo, fu un grande artista. Egli dice: «Leonardo pensava che vi fossero cinque colori». Poi andando ancora oltre, troviamo, in un libro ancora più vecchio, l’evidenza per tale argomento. Il libro dice qualcosa di simile a questo: «Il porpora è blu rossastro, l’arancione è giallo rossastro, ma può il rosso essere visto come arancio-porpora? Non sono il rosso e il giallo più unitari che l’arancio o il porpora? La persona media, richiesta di dire quali colori sono unitari, nomina il rosso, il giallo e il blu, questi tre, e alcuni osservatori aggiungono un quarto, il verde. Gli psicologi sono abituati ad accettare i quattro come colori salienti». Questa è la situazione nell’analisi psicologica di questo argomento: se tutti dicono che ve ne sono tre, e qualcuno dice che sono quattro, ed essi vogliono che sia quattro, sarà quattro. Questo mostra la difficoltà connessa alle ricerche psicologiche. È chiaro che abbiamo tali percezioni, ma è molto difficile ottenere molte informazioni su di esse. L’altra direzione da percorrere è la direzione fisiologica, per scoprire sperimentalmente che cosa in realtà accade nel cervello, nell’occhio, nella retina, o dove che sia, e forse per scoprire che alcune combinazioni di impulsi da varie cellule si muovono lungo certe fibre nervose. Incidentalmente i pigmenti primari non devono essere in cellule separate; si potrebbero avere cellule in cui vi sono misture di vari pigmenti, cellule con pigmenti rossi e verdi, cellule con tutti e tre (le informazioni di tutti e tre sono allora informazioni bianche), e via di seguito. Vi sono parecchi modi di fare i collegamenti e noi dobbiamo scoprire che modo ha usato la natura. Sarebbe sperabile, in ultima analisi, che, quando capiremo le connessioni fisiologiche, capiremo un po’ alcuni di questi aspetti della psicologia, così cerchiamo in tale direzione.

36.2

La fisiologia dell’occhio

Iniziamo parlando non soltanto della visione del colore, ma della visione in generale, proprio per rammentarci le interconnessioni nella retina, mostrata nella FIGURA 35.2. La retina è realmente simile alla superficie del cervello. Benché l’immagine reale attraverso un microscopio sia un po’ più complicata da osservare di questo disegno schematizzato, con un’analisi accurata si possono vedere tutte queste interconnessioni. Non vi è dubbio che una parte della superficie della retina sia collegata alle altre parti, e che le informazioni che escono sui lunghi assoni, che producono il nervo ottico, siano combinazioni di informazioni da parecchie cellule. Vi sono tre strati di cellule in una successione di funzione: vi sono cellule retinali, che sono quelle che la luce influenza, una cellula intermedia che prende le informazioni da una singola o da poche cellule retinali, le trasmette a diverse cellule in un terzo strato di cellule e le trasporta al cervello. Vi sono svariatissimi tipi di connessioni incrociate fra le cellule negli strati. Ora volgiamoci ad alcuni aspetti della struttura e del funzionamento dell’occhio (FIGURA 35.1). La messa a fuoco della luce è compiuta principalmente dalla cornea, per il fatto che ha una superficie curva che «devia» la luce. Questo è il motivo per cui non possiamo vedere chiaramente sott’acqua, perché in questo caso non abbiamo abbastanza differenza fra l’indice di rifrazione della cornea, che è 1,37, e quello dell’acqua, che è 1,33. Dietro la cornea vi è praticamente dell’acqua, con un indice di 1,33, e dietro questa vi è una lente che ha una struttura interessantissima: è una serie di strati, come una cipolla, tranne che è completamente trasparente, e ha un indice di 1,40 nel mezzo e 1,38 all’esterno. (Sarebbe bello se potessimo fare vetri ottici in cui potessimo regolare l’indice entro lo spessore, perché allora non dovremmo curvarli tanto quanto dobbiamo fare quando abbiamo un indice uniforme.) Inoltre, la forma di una cornea non è quella di una sfera. Una lente sferica ha una certa quantità di aberrazione sferica. La cornea è «più piatta» all’esterno di quanto è una sfera, in modo tale che l’aberrazione sferica per la cornea è minore di quella che sarebbe se vi introducessimo una lente sferica! La luce è messa a fuoco dal sistema cristallino-cornea sulla retina. Quando guardiamo le cose che sono più vicine e quelle più lontane, il cristallino si restringe o si allarga e cambia il fuoco per adattarsi alle diverse distanze.

369

Capitolo 36 • Meccanismo della visione

370 FIGURA

36.3

Temporale

Interconnessioni neurali per il funzionamento meccanico degli occhi. FIGURA

© 978-8808-22107-0

L

S

K

36.4

Connessioni neurali dagli occhi alla corteccia visiva.

R I

A

J

Nasale

A

A B

A

D

C C

P

C

H B

F G

D E

B

B

D

E

F Q

M N

F

E

O G

G

Per la regolazione che riguarda la quantità totale di luce c’è l’iride, quello che chiamiamo il colore dell’occhio, marrone o blu, a seconda delle persone; quando la quantità di luce aumenta o diminuisce, l’iride si stringe o si allarga. Osserviamo ora il meccanismo neurale per il controllo dell’adattamento della lente, il moto dell’occhio, i muscoli che fanno ruotare l’occhio nella cavità e l’iride, mostrati schematicamente in FIGURA 36.3. Di tutte le informazioni che provengono dal nervo ottico A, la grande maggioranza è distribuita in uno dei due fasci (di cui parleremo in seguito) e di là al cervello. Ma vi sono alcune fibre, che ci interessano ora, che non corrono direttamente alla corteccia visiva del cervello dove «vediamo» le immagini, ma invece vanno al cervello medio H. Queste sono le fibre che misurano la luce media e producono la regolazione dell’iride; oppure, se l’immagine appare confusa, esse cercano di correggere il cristallino; oppure, se vi è un’immagine doppia, esse cercano di regolare l’occhio per la visione binoculare. A ogni modo esse attraversano il cervello medio e ritornano all’occhio. In K vi sono i muscoli che guidano l’accomodamento del cristallino e in L un altro muscolo che raggiunge l’iride. L’iride ha due sistemi di muscoli. Uno è un muscolo circolare L che, quando è eccitato, tira e chiude l’iride; esso agisce molto rapidamente e i nervi sono direttamente collegati dal cervello con l’iride attraverso brevi assoni. I muscoli opposti sono muscoli radiali in modo che, quando le cose diventano buie e il muscolo circolare si rilassa, questi muscoli radiali tirano. Qui abbiamo, come in parecchie parti del corpo, una coppia di muscoli che lavorano in direzioni opposte, e quasi in tutti i casi del genere i sistemi nervosi che controllano i due sono regolati molto delicatamente, in modo che quando sono inviati segnali per contrarre un muscolo, sono automaticamente inviati segnali per rilassare l’altro. L’iride è un’eccezione: i nervi che fanno contrarre l’iride sono quelli che abbiamo già descritto, ma i nervi che fanno dilatare l’iride provengono da non si sa dove, entrano nel midollo spinale dietro il torace, nella sezione toracica, escono dal midollo spinale, vanno su attraverso i gangli del collo, girano completamente attorno e tornano indietro su nella testa per azionare l’altro terminale dell’iride. In realtà, il segnale va attraverso un sistema nervoso completamente diverso, non il sistema nervoso centrale, ma il sistema nervoso simpatico, così questo è un modo molto strano di far funzionare le cose. Abbiamo già sottolineato un’altra cosa strana riguardo all’occhio, cioè che le cellule sensibili alla luce sono dalla parte sbagliata, cosicché la luce deve attraversare diversi strati di altre cellule prima di giungere ai ricevitori – sono messi a rovescio! Così alcune delle caratteristiche sono meravigliose mentre altre apparentemente stupide. La FIGURA 36.4 mostra le connessioni dell’occhio alla parte del cervello che è più direttamente interessata al processo visivo. Le fibre del nervo ottico corrono in una certa area oltre D, detta genicolato laterale, dopodiché esse corrono a una sezione del cervello chiamata corteccia visiva. Notate che alcune delle fibre provenienti da ciascun occhio sono inviate all’altro lato del cervello,

© 978-8808-22107-0

36.2 • La fisiologia dell’occhio

così l’immagine formata è incompleta. I nervi ottici dal lato sinistro dell’occhio destro corrono attraverso il chiasma ottico B, mentre quelli del lato sinistro dell’occhio sinistro girano e fanno questa stessa strada. Così il lato sinistro del cervello riceve tutte le informazioni che provengono dal lato sinistro di ciascun bulbo oculare, cioè sul lato destro del campo visivo, mentre il lato destro del cervello vede il lato sinistro del campo visivo. Questo è il modo in cui viene unificata l’informazione da ciascuno dei due occhi per dirci quanto lontane sono le cose. Questo è il sistema di visione binoculare. I collegamenti fra la retina e la corteccia visiva sono interessanti. Se una parte della retina è recisa o distrutta in un modo qualsiasi, allora l’intera fibra morirà, e perciò possiamo dedurne dove è collegata. Risulta che essenzialmente le connessioni sono uno a uno – per ciascun punto nella retina vi è un punto nella corteccia visiva – e i punti che sono vicinissimi nella retina sono vicinissimi nella corteccia visiva. Così la corteccia visiva rappresenta ancora la sistemazione spaziale dei bastoncelli e dei coni, ma naturalmente molto distorta. Cose che sono nel centro del campo, che occupano una piccolissima parte della retina, sono espanse su molte, molte cellule nella corteccia visiva. È chiaro che è utile avere ancora vicine cose che sono originariamente vicine. L’aspetto più notevole dell’argomento, però, è il seguente. Il punto in cui si potrebbe pensare che sarebbe più importante avere cose vicine dovrebbe essere proprio nel mezzo del campo visivo. Crediatelo o no, la linea verticale di mezzo nel nostro campo visivo quando osserviamo qualcosa è di natura tale che le informazioni da tutti i punti sul lato destro di tale linea vanno al lato sinistro del cervello, e le informazioni dai punti sul lato sinistro vanno nel lato destro del cervello, e nel modo in cui quest’area è fatta, vi è un taglio giù nel mezzo così le cose che sono molto vicine proprio nel mezzo sono molto lontane nel cervello! In qualche modo le informazioni devono andare da un lato del cervello all’altro attraverso alcuni altri canali, cosa del tutto sorprendente. Il problema di come sia «collegata» questa rete è molto interessante. Il problema di quanto sia già collegato e di quanto si apprenda dall’esperienza è un vecchio problema. Si usava pensare molto tempo fa che forse non doveva essere affatto accuratamente collegata, essa era interconnessa soltanto approssimativamente, e quindi il bambino imparava dall’esperienza che quando una cosa è «lassù» produce una certa sensazione nel cervello. (I dottori ci dicono sempre quello che «sente» il bambino, ma come sanno quello che sente un bambino all’età di un anno?) Il bambino all’età di un anno ipoteticamente vede che un oggetto è «lassù», ottiene una certa sensazione e impara ad allungare la mano in «là» perché quando l’allunga in «qua» non funziona. Tale approssimazione probabilmente non è esatta, perché abbiamo già visto che in molti casi vi sono queste particolari connessioni dettagliate. Più illuminanti sono alcuni esperimenti molto notevoli fatti con una salamandra. (Incidentalmente con una salamandra vi è una diretta connessione incrociata, senza il chiasma ottico, poiché gli occhi sono su ciascun lato della testa e non hanno area comune. Le salamandre non hanno visione binoculare.) L’esperimento è questo. Possiamo tagliare il nervo ottico in una salamandra e il nervo si svilupperà di nuovo dagli occhi. Migliaia e migliaia di fibre cellulari così si ristabiliranno. Ora nel nervo ottico le fibre non sono adiacenti l’una all’altra – esso è simile a un grande cavo telefonico, costruito disordinatamente, tutte le fibre si intrecciano e girano, ma quando esso raggiunge il cervello sono tutte di nuovo separate. Quando tagliamo il nervo ottico della salamandra, il problema interessante è: si metterà in ordine? La risposta è notevole: sì. Se tagliamo il nervo della salamandra ed esso si risviluppa, la salamandra ha di nuovo buona acutezza visiva. Però se tagliamo il nervo ottico e capovolgiamo l’occhio e lo lasciamo crescere di nuovo, essa ha buona acutezza visiva, ma soffre di un terribile errore: quando la salamandra vede una mosca «lassù» essa salta verso di essa «in basso» e non impara mai. Quindi vi è qualche modo misterioso per mezzo del quale le migliaia e migliaia di fibre trovano le loro giuste posizioni nel cervello. Questo problema di quanto è collegato e di quanto non lo è, è un problema importante nella teoria dello sviluppo delle creature. La risposta non è nota, ma è oggetto di studio intenso. Lo stesso esperimento nel caso di un pesce rosso mostra che vi è un terribile groviglio, come una grande cicatrice o una complicazione, nel nervo ottico, dove lo tagliamo, ma malgrado questo, tutte le fibre si sviluppano di nuovo fino ai loro posti nel cervello. Per far questo, quando esse crescono nei vecchi canali del nervo ottico devono prendere diverse decisioni sulla direzione in

371

372

Capitolo 36 • Meccanismo della visione

© 978-8808-22107-0

cui dovrebbero svilupparsi. Come fanno questo? Sembra che vi siano sostanze chimiche alle quali differenti fibre rispondono differentemente. Immaginate l’enorme numero di fibre in sviluppo, ciascuna delle quali è individualmente differenziabile dalle vicine in qualche modo; nel rispondere alle sostanze chimiche quali che siano, risponde nell’unico modo sufficiente a trovare il suo proprio posto per la definitiva connessione nel cervello! Questa è una cosa interessante – fantastica. È uno dei grandi fenomeni della biologia recentemente scoperti ed è indubbiamente connesso a molti più antichi problemi non risolti della crescita, dell’organizzazione e dello sviluppo degli organismi, in modo particolare degli embrioni. Un altro fenomeno interessante ha a che fare con il moto dell’occhio. Gli occhi devono essere mossi per far coincidere le due immagini in differenti circostanze. Questi moti sono di tipi diversi: uno è per seguire qualcosa, il che richiede che entrambi gli occhi debbano andare nella stessa direzione, destra o sinistra, e l’altro è di puntarli verso lo stesso punto a varie distanze, il che richiede che essi si debbano muovere in modo opposto. I nervi che entrano nei muscoli dell’occhio sono già collegati proprio per simili scopi. Vi è un gruppo di nervi che tirerà i muscoli dell’interno di un occhio e dell’esterno dell’altro, e farà rilassare i muscoli opposti, cosicché i due occhi si muovano insieme. Vi è un altro centro in cui un’eccitazione farà sì che gli occhi si muovano l’uno verso l’altro, paralleli. Un occhio può essere girato nell’angolo esterno se l’altro occhio si muove verso il naso, ma è impossibile coscientemente o incoscientemente girare entrambi gli occhi verso l’esterno nello stesso tempo, non perché non vi siano muscoli, ma perché non vi è modo di inviare un segnale per girare entrambi gli occhi verso l’esterno, a meno che non abbiamo avuto un incidente o non sia avvenuto qualche fatto, per esempio un nervo sia stato tagliato. Benché i muscoli di un occhio possano certamente guidare l’occhio, nemmeno uno yogi è in grado di muovere entrambi gli occhi liberamente verso l’esterno sotto controllo volontario, perché non sembra che vi sia alcun modo di farlo. Siamo già collegati fino a un certo punto. Questo è un punto importante, perché la maggior parte dei primi libri di anatomia e psicologia non prende in considerazione o non sottolinea il fatto che siamo già tanto completamente collegati: essi affermano che ogni cosa è semplicemente appresa.

36.3

I bastoncelli

Esaminiamo con maggior dettaglio quello che accade nei bastoncelli. La FIGURA 36.5 mostra una microfotografia al microscopio elettronico del centro di un bastoncello (il bastoncello si estende in alto fuori campo). Vi sono strati dopo strati di strutture piane, mostrate ingrandite a destra, che contengono la sostanza rodopsina (porpora retinica), ossia il pigmento che produce gli effetti di visione nei bastoncelli. La rodopsina è una grande proteina che contiene un gruppo speciale chiamato retinene, che può essere estratto dalla proteina, e che è, indubbiamente, la OS principale causa dell’assorbimento della luce. Non capiamo la ragione dei piani, ma è molto verosimile che vi sia una qualche ragione per tenere pars rallele tutte le molecole di rodopsina. La struttura chimica della rodopsina sm ≈ 120 Å cf è stata in gran parte analizzata, ma vi può essere dentro anche un po’ di ≈ 40 Å 210 Å fisica. Può essere che tutte le molecole siano sistemate in un certo tipo di CC a allineamento cosicché quando una è eccitata, un elettrone che viene geneb rato, diciamo, può percorrere tutto il cammino giù fino a un certo punto C1 all’estremità per inviare il segnale, o qualcosa di simile. Questo argomento C2 è molto importante e non è stato risolto. È un campo in cui alla fine saranno er mi usate sia la biochimica sia la fisica dello stato solido, o qualcosa di simile IS a essa. Questo tipo di struttura a strati appare in altre circostanze in cui la luce è importante, per esempio nel cloroplastide nelle piante, dove la luce causa la fotosintesi. Se l’ingrandiamo troviamo la stessa cosa con quasi lo stesso genere di strati, ma qui abbiamo clorofilla, naturalmente, invece di FIGURA 36.5 Micrografia al microscopio elettronico retinene. La struttura chimica del retinene è mostrata in FIGURA 36.6. Esso di un bastoncello.

36.4 • L’occhio composto (degli insetti)

© 978-8808-22107-0

ha una serie di legami doppi alternati lungo la catena laterale, il che è caratteristico di quasi tutte le sostanze organiche che assorbono intensamente, quali la clorofilla, il sangue, e via di seguito. È impossibile per l’uomo fabbricare questa sostanza nelle sue stesse cellule, dobbiamo mangiarla. Così la mangiamo sotto forma di una particolare sostanza, che è esattamente la stessa del retinene tranne che vi è un idrogeno legato all’estremità destra; essa è detta vitamina A, e se non ne mangiamo abbastanza, non otteniamo rifornimento di retinene e l’occhio diventa quello che chiamiamo emmeralopo, perché allora non vi è abbastanza pigmento nella rodopsina per vedere di notte con i bastoncelli. La ragione per cui una simile serie di doppi legami assorbe luce molto intensamente è anch’essa conosciuta. Possiamo darne semplicemente un cenno: la serie alternata di doppi legami è detta un doppio legame coniugato; un doppio legame significa che vi è un elettrone in più, e questo elettrone in più è facilmente spostato a destra o sinistra. Quando la luce colpisce questa molecola, l’elettrone di ciascun doppio legame è spostato di un passo. Tutti gli elettroni nell’intera catena si spostano, come una successione di tessere del dominio che cadono, e anche se ciascuno si muove soltanto di un piccolo tratto (ci aspetteremmo che, in un singolo atomo, dovremmo muovere l’elettrone soltanto di un piccolo tratto), l’effetto netto è lo stesso come se un elettrone si fosse mosso da un’estremità all’altra! È come se un elettrone percorresse l’intera distanza avanti e indietro; in questo modo otteniamo un assorbimento molto più forte sotto l’influenza del campo elettrico, di quello che potremmo ottenere se potessimo spostare l’elettrone soltanto del tratto associato a un atomo. Così, poiché è facile muovere gli elettroni avanti e indietro, il retinene assorbe luce molto violentemente; questo è il meccanismo della sua parte fisico-chimica. FIGURA 36.6 La struttura del retinene.

36.4

L’occhio composto (degli insetti)

Ritorniamo ora alla biologia. L’occhio umano non è l’unico tipo di occhio. Nei vertebrati, quasi tutti gli occhi sono essenzialmente simili all’occhio umano. Però, negli animali inferiori vi sono molti altri tipi di occhi: occhi puntiformi, vari occhi a coppa, e altre strutture meno sensibili, che non abbiamo tempo di discutere. Ma vi è un altro occhio altamente sviluppato fra gli invertebrati, l’occhio composto degli insetti. (La maggioranza degli insetti che ha grandi occhi composti ha anche vari occhi addizionali più semplici.) L’ape è un insetto la cui visione è stata studiata molto accuratamente. È facile studiare le proprietà della visione delle api perché esse sono attratte dal miele, e possiamo fare esperimenti in cui identifichiamo il miele mettendolo su una carta blu o su una carta rossa, e vediamo a quale vanno le api. Con questo metodo sono state scoperte alcune cose molto interessanti sulla visione delle api. In primo luogo cercando di misurare quanto acutamente le api possono vedere la differenza di colore fra due pezzi di carta «bianca», alcuni ricercatori trovarono che non erano molto abili, e altri trovarono che erano fantasticamente abili. Anche se i due pezzi di carta erano quasi esattamente uguali le api potevano distinguere ancora la differenza. Gli sperimentatori usarono bianco di zinco per un pezzo di carta e bianco di piombo per l’altro e, benché questi ci appaiano esattamente uguali, l’ape poteva facilmente distinguerli dato che riflettono diversamente nell’ultravioletto. In questo modo fu scoperto che l’occhio dell’ape è sensibile su una più vasta gamma dello spettro rispetto al nostro occhio. Il nostro occhio funziona da 7000 Å a 4000 Å, dal rosso al violetto, ma quello dell’ape può vedere fino a 3000 Å, nell’ultravioletto! Questo produce differenti interessanti effetti. In primo luogo le api possono distinguere fra parecchi fiori che a noi sembrano simili. Naturalmente, dobbiamo renderci conto che i colori dei fiori non sono progettati per i nostri occhi, ma per quelli dell’ape; essi sono segnali per attirare le api a un fiore specifico. Sappiamo tutti che vi sono molti fiori «bianchi». Apparentemente il bianco non è molto interessante per le api, perché risulta che tutti i fiori bianchi hanno diverse proporzioni di riflessione nell’ultravioletto; essi non riflettono il cento per cento di ultravioletto come farebbe un vero bianco. Tutta la luce non torna indietro, l’ultravioletto manca, e questo è un colore proprio come per noi, se manca il blu, risulta il giallo. Così, tutti i fiori sono colorati per le api. Però, sappiamo anche che il rosso

373

Capitolo 36 • Meccanismo della visione

374

I cc o-pc c-pc rhb ret ret n

bm nf

36.7 Struttura di un ommatidio (una singola cellula di un occhio composto). FIGURA

© 978-8808-22107-0

non può essere visto dalle api. Così possiamo aspettarci che tutti i fiori rossi appaiano neri alle api. Non è così! Uno studio accurato dei fiori rossi mostra, in primo luogo, che anche con il nostro stesso occhio possiamo vedere che una grande maggioranza di fiori rossi ha una sfumatura bluastra, poiché essi riflettono nel complesso una quantità addizionale nel blu, che è la parte che l’ape vede. Inoltre gli sperimentatori mostrano anche che i fiori variano nella loro riflessione dell’ultravioletto sulle diverse parti dei petali e via di seguito. Così se potessimo vedere i fiori come li vedono le api essi sarebbero ancora più belli e variati! È stato dimostrato, però, che vi sono alcuni fiori rossi che non riflettono nel blu o nell’ultravioletto, e dovrebbero quindi apparire neri all’ape! Questo fu di un certo interesse per gli studiosi che si occupano di questo argomento, perché il nero non appare come un colore interessante, dato che è difficile distinguerlo da un’ombra sporca. Risultò in realtà che questi fiori non venivano visitati dalle api; questi sono i fiori visitati dai colibrì, e i colibrì possono vedere il rosso! Un altro interessante aspetto della visione dell’ape è che le api possono apparentemente stabilire la direzione del sole osservando una porzione di cielo sereno, senza vedere il sole stesso. Noi non possiamo facilmente fare altrettanto. Se osserviamo dalla finestra il cielo e vediamo che è sereno, da che parte è il sole? L’ape può dirlo, perché l’ape è decisamente sensibile alla polarizzazione della luce, e la luce diffusa dal cielo è polarizzata.(2) Vi è ancora disaccordo su come operi questa sensibilità. Non è ancora noto se è a causa del fatto che le riflessioni della luce sono diverse nelle diverse circostanze, o se l’occhio dell’ape è direttamente sensibile.(3) Si è anche detto che l’ape può notare un tremolio fino a 200 oscillazioni al secondo, mentre noi lo vediamo soltanto fino a 20. I moti delle api negli alveari sono molto rapidi; la zampa si muove e le ali vibrano, ma è molto difficile per noi vedere questi moti con il nostro occhio. Però, se potessimo vedere più rapidamente saremmo in grado di apprezzare il moto. È probabilmente molto importante per l’ape che il suo occhio abbia una tale rapida risposta. Discutiamo ora l’acutezza visiva che ci aspetteremmo dall’ape. L’occhio di un’ape è un occhio composto, ed è costituito da un gran numero di cellule speciali dette ommatidi, che sono predisposte in forma conica sulla superficie di una sfera (approssimativamente) sulla parte esterna della testa dell’ape. La FIGURA 36.7 mostra una rappresentazione di un simile ommatidio. In alto vi è un’area trasparente, una specie di «lente», ma in realtà è più simile a un filtro o a una guida di luce per far andare la luce giù lungo la stretta fibra, dove, presumibilmente avviene l’assorbimento. Dall’altra estremità della cellula esce la fibra nervosa. La fibra centrale è circondata ai lati da sei cellule che, in effetti, hanno secreto la fibra. Questa è una descrizione sufficiente per i nostri scopi. Il punto è che si tratta di una struttura di forma conica e molte di esse possono adattarsi l’una accanto all’altra, su tutta la superficie dell’occhio dell’ape. Discutiamo ora la risoluzione dell’occhio dell’ape. Se tracciamo linee (FIGURA 36.8) per rappresentare gli ommatidi sulla superficie che supponiamo sia una sfera di raggio r, possiamo in realtà calcolare quanto sia largo ogni ommatidio usando i nostri cervelli, e supponendo che l’evoluzione sia intelligente come noi! Se abbiamo un ommatidio molto grande non abbiamo grande risoluzione. Cioè, una cellula ottiene un’informazione da una direzione, e la cellula adiacente ottiene un’informazione da un’altra direzione, e così via, e l’ape non può vedere molto bene le cose fra le due. Così l’incertezza dell’acutezza visiva nell’occhio corrisponderà sicuramente a un angolo: l’angolo dell’estremità dell’ommatidio relativo al centro di curvatura dell’occhio. (Le cellule dell’occhio, naturalmente, esistono soltanto alla superficie della sfera; all’interno di questa c’è la testa dell’ape.) Questo angolo da un ommatidio al successivo, è naturalmente, il diametro degli ommatidi diviso per il raggio della superficie dell’occhio: (36.1) r Quindi possiamo dire: «Più piccolo facciamo , maggiore è l’acutezza visiva. Allora perché l’ape ✓g =

(2)

Anche l’occhio umano ha una leggera sensibilità alla polarizzazione della luce, e si può imparare a stabilire la direzione del sole! Il fenomeno che è qui implicato è detto spazzola di Haidinger; è una debole figura simile a una clessidra giallognola, che si vede nel centro del campo visivo quando si guarda a un’ampia distesa priva di caratteristiche, usando occhiali polarizzanti. Può anche essere vista nel cielo sereno senza occhiali polarizzanti se si ruota la testa indietro e avanti attorno all’asse di visione. (3) Risultati sperimentali ottenuti dopo che fu tenuta questa lezione indicano che l’occhio è direttamente sensibile.

36.5 • Altri occhi

© 978-8808-22107-0

375

36.8 Visione schematica della sistemazione degli ommatidi nell’occhio di un’ape. FIGURA

r r

36.9 La dimensione ottima per un ommatidio è δm . FIGURA

non usa appunto ommatidi sottilissimi?». Risposta: conosciamo abbastanza la fisica per renderci conto che se cerchiamo di inviare la luce attraverso una sottile fenditura, non possiamo vedere accuratamente in una data direzione a causa dell’effetto di diffrazione. La luce che giunge da diverse direzioni può entrare e, a causa della diffrazione, otterremo luce proveniente a un angolo ✓ d tale che ✓d =

(36.2)

Ora vediamo che se prendiamo troppo piccolo, allora ciascun ommatidio non guarda in una direzione soltanto, a causa della diffrazione! Se lo prendiamo troppo grande, ciascuno vede in una direzione definita, ma non ve ne sono abbastanza per ottenere una buona visione della scena. Così la distanza viene stabilita in modo da rendere minimo l’effetto complessivo di questi due. Se li sommiamo insieme, e troviamo il punto in cui la somma ha un minimo (FIGURA 36.9), vediamo che d( ✓ g + ✓ d ) 1 =0= (36.3) 2 d r che ci dà una distanza p = r (36.4) Se supponiamo che r sia attorno ai 3 mm e assumiamo che la luce vista dall’ape sia pari a 4000 Å, svolgendo i calcoli risulta q = (3 · 10 3 m)(4 · 10 7 m) = 3,5 · 10 5 m = 35 µm (36.5)

I testi dicono che il diametro è 30 µm, quindi l’accordo è piuttosto buono! Così, evidentemente, funziona davvero e possiamo capire che cosa determina le dimensioni dell’occhio dell’ape! È anche facile usare il numero sopra e ricavare quanto è realmente buono l’occhio dell’ape per la risoluzione angolare; è molto cattivo rispetto al nostro. Noi possiamo vedere cose che sono una trentina di volte più piccole, come dimensione apparente, di quelle che può vedere l’ape; l’ape ha un’immagine piuttosto confusa e sfocata rispetto a quello che noi possiamo vedere. Nondimeno va tutto bene, ed è il meglio che possono fare. Possiamo chiederci perché le api non sviluppino un occhio buono come il nostro, con un cristallino e via di seguito. Vi sono diverse interessanti ragioni. In primo luogo l’ape è troppo piccola; se avesse un occhio come i nostri, ma sulla sua scala, l’apertura sarebbe di circa 30 µm come dimensione e la diffrazione sarebbe così importante che non sarebbe in grado di veder molto in ogni caso. L’occhio non è buono se è troppo piccolo. In secondo luogo, se fosse tanto grande come la testa dell’ape, allora l’occhio occuperebbe l’intera testa dell’ape. La bellezza dell’occhio composto è che non occupa spazio, ed è semplicemente un sottilissimo strato sulla superficie dell’ape. Così quando discutiamo che avrebbero dovuto farlo a modo nostro, dobbiamo ricordare che avevano i loro propri problemi!

36.5

Altri occhi

Oltre alle api, molti altri animali possono vedere il colore. Pesci, farfalle, uccelli e rettili possono vedere il colore, ma si crede che la maggior parte dei mammiferi non possa vederlo. I primati

376

Capitolo 36 • Meccanismo della visione

© 978-8808-22107-0

possono vedere il colore. Gli uccelli vedono certamente il colore, e questo spiega il colore degli uccelli. Non vi sarebbe motivo di avere maschi tanto brillantemente colorati se le femmine non potessero notarlo! Cioè lo sviluppo di quel «chissacché» di sessuale che hanno gli uccelli è un risultato del fatto che la femmina è in grado di vedere il colore. Così la prossima volta che osserviamo un pavone e pensiamo alla brillante esposizione di sgargianti colori che esso mostra, e a quanto delicati sono tutti i colori, e quale meraviglioso senso estetico occorre per apprezzare tutto ciò, non dovremmo complimentarci col pavone, ma dovremmo complimentarci con l’acutezza visiva e il senso estetico della femmina del pavone, perché è questo che ha generato la bella scena! Tutti gli invertebrati hanno occhi scarsamente sviluppati o occhi composti, ma tutti i vertebrati hanno occhi molto simili al nostro, con un’eccezione. Se consideriamo la forma più elevata di animale, noi diciamo comunemente «Eccoci qua!», ma se assumiamo un punto di vista meno ispirato a pregiudizi e ci limitiamo agli invertebrati, in modo che non possiamo includere noi stessi, e ci domandiamo qual è l’animale invertebrato più elevato, la maggior parte degli zoologi è d’accordo nel dire che l’animale più elevato è il polpo. È molto interessante che oltre lo sviluppo del suo cervello, le sue reazioni L e via di seguito, che sono piuttosto buone per un invertebrato, esso abbia anche sviluppato indipendentemente un occhio diverso. Non è un occhio composto o un occhio puntiforme: ha una cornea, ha le palpebre, un’iride, un cristallino, due regioni d’acqua e una retina, dietro. È essenzialmente LL lo stesso occhio dei vertebrati! È un notevole esempio di una coincidenza I nell’evoluzione in cui la natura ha scoperto due volte la stessa soluzione R di un problema, con un leggero miglioramento. Nel polpo risulta anche, C sorprendentemente, che la retina è una parte del cervello che è uscita nello stesso modo nel suo sviluppo embrionale, come fa nei vertebrati, ma la cosa interessante, e diversa, è che le cellule sensibili alla luce sono all’interno, e le cellule che fanno il calcolo sono dietro di esse, anziché «a rovescio», come nel nostro occhio. Così vediamo, almeno, che non vi è buona ragione che esse siano a rovescio. L’altra volta che la natura ci provò, essa l’ottenne diritto! (FIGURA 36.10.) Gli occhi più grandi del mondo sono quelli della FIGURA 36.10 L’occhio di un polpo. seppia gigante: ne sono stati trovati con un diametro fino a 15 pollici!

36.6

Neurologia della visione

Uno dei punti principali del nostro argomento è l’interconnessione delle informazioni da una parte dell’occhio all’altra. Consideriamo l’occhio composto del granchio a ferro di cavallo(4) , sul quale è stata fatta una considerevole sperimentazione. Prima di tutto dobbiamo valutare quale genere di informazione può giungere lungo i nervi. Un nervo trasporta un tipo di disturbo che ha un effetto elettrico facile da rilevare, un tipo di disturbo ondulatorio che corre lungo il nervo e produce un effetto all’altra estremità: un lungo tratto di cellula nervosa detto assone trasporta l’informazione, e un certo tipo di impulso detto «spike» (5) si propaga se esso viene eccitato a un’estremità. Quando un impulso discende un nervo, un altro non può immediatamente seguirlo. Tutti gli impulsi sono della stessa dimensione, così non è che otteniamo impulsi maggiori quando si verifica una violenta eccitazione, ma abbiamo più impulsi per secondo. La dimensione dell’impulso è determinata dalla fibra. È importante rendersi conto di questo per vedere che cosa accade in seguito. La FIGURA 36.11a mostra l’occhio composto del granchio a ferro di cavallo; esso non è un gran che come occhio, ha soltanto circa un migliaio di ommatidi. La FIGURA 36.11b è una sezione trasversale della struttura; si possono vedere gli ommatidi con le fibre nervose che escono da essi e vanno al cervello. Ma notate che anche in un granchio vi sono piccole interconnessioni. Esse (4)

Granchi giganteschi, oggetto di numerosi studi da parte di zoologi e biofisici. (N.d.T.) Il nome inglese spike, usato per indicare un impulso rapido, di brevissima durata (il significato originale è «grosso chiodo»), viene usato correntemente in biofisica anche in Italia. (N.d.T.) (5)

36.6 • Neurologia della visione

© 978-8808-22107-0

377

36.11 L’occhio composto di un granchio a ferro di cavallo. (A) Vista normale. (B) Sezione trasversale. Le FIGURE 36.7, 36.11, 36.12, 36.14 sono riproduzioni autorizzate da Goldsmith, Sensory Communications, W.A. Rosenblith ed., Copyright 1961, Massachusetts Institute of Technology. FIGURA

sono molto meno elaborate che nell’occhio umano, e questo ci dà l’opportunità di studiare un esempio più semplice. Osserviamo ora gli esperimenti che sono stati fatti ponendo sottili elettrodi nel nervo ottico del granchio, e facendo brillare luce soltanto su uno degli ommatidi, cosa facile da fare con lenti. Se accendiamo una luce a un certo istante t 0 , e misuriamo gli impulsi elettrici che escono, troviamo che vi è un leggero ritardo e poi una rapida serie di scariche che gradualmente rallenta fino a una rapidità uniforme, come mostrato in FIGURA 36.12a. Quando la luce si spegne la scarica si arresta. Ora è molto interessante che se, mentre il nostro amplificatore è connesso a questa stessa fibra nervosa, facciamo brillare luce su un ommatidio differente non accada niente; non si ha segnale. Facciamo ora un altro esperimento: facciamo brillare della luce sull’ommatidio iniziale e otteniamo la stessa risposta, ma se accendiamo la luce anche su un altro assai vicino, gli impulsi vengono interrotti brevemente, poi vanno a una frequenza molto minore (FIGURA 36.12b). La frequenza di uno è inibita dagli impulsi provenienti dall’altro! In altre parole ciascuna fibra nervosa trasporta l’informazione da un ommatidio, ma la quantità che trasporta è impedita dai segnali provenienti dalle altre. Così, per esempio, se l’intero occhio è più o meno uniformemente illuminato, l’informazione proveniente da un qualsiasi ommatidio sarà relativamente debole, dato che è inibita da tanti altri. In effetti l’inibizione è additiva – se facciamo brillare luce su molti ommatidi vicini l’inibizione è molto grande. L’inibizione è maggiore quando gli ommatidi sono più vicini; se gli ommatidi sono abbastanza lontani l’uno dall’altro, l’inibizione è praticamente zero. Quindi è additiva e dipende dalla distanza; qui vi è un primo esempio di informazioni provenienti da diverse parti dell’occhio che sono combinate nell’occhio stesso. Possiamo vedere forse, se ci pensiamo un po’, che questo è uno stratagemma per accrescere il contrasto ai bordi degli oggetti, perché se una parte della scena è luminosa e una parte è buia, allora gli ommatidi nell’area illuminata danno impulsi che sono inibiti da tutta l’altra luce nelle vicinanze, così il segnale è relativamente debole. D’altra parte, un ommatidio al limite che ha dato un impulso «luminoso» è ancora inibito dagli altri nelle vicinanze, ma non ve ne sono molti

Luce

Plesso laterale

Ricevitori All’amplificatore

Nervo ottico

Luce

Plesso laterale Nervo ottico

Ricevitori All’amplificatore

36.12 La risposta alla luce delle fibre nervose dell’occhio di un granchio a ferro di cavallo. FIGURA

Capitolo 36 • Meccanismo della visione

378

© 978-8808-22107-0

come prima, perché alcuni sono neri; il segnale risultante è quindi più forte. Il risultato sarebbe una curva, qualcosa di simile a quella della FIGURA 36.13. Il granchio vedrà un rafforzamento del contorno. Risposta dell’ommatidio Il fatto che vi sia un intensificarsi dei contorni è risaputo da molto; infatti è una cosa notevole che è stata commentata dagli psicologi molte Illuminazione volte. Per disegnare un oggetto dobbiamo disegnare soltanto la sua linea di contorno. Come siamo abituati a guardare figure che hanno soltanto il contorno! Che cos’è il contorno? Il contorno è soltanto la differenza al x bordo fra luce e buio o fra un colore e un altro. Non è qualcosa di definito. Non è, crediatelo o no, che ogni oggetto abbia una linea attorno a esso. Non FIGURA 36.13 La risposta netta degli ommatidi vi è una linea del genere. È soltanto nella nostra disposizione psicologica di un granchio a ferro di cavallo vicino a un netto che vi è una linea; incominciamo a capire le ragioni per cui la «linea» è cambio di illuminazione. un indizio sufficiente per ottenere l’intera cosa. Presumibilmente il nostro stesso occhio funziona in modo simile – molto più complicato, ma simile. Infine, descriveremo brevemente il lavoro più elaborato, lo splendido avanzato lavoro che è stato compiuto sulla rana. Facendo un esperimento corrispondente su una rana, introducendo nel nervo ottico di una rana sottilissime sonde aghiformi ottimamente costruite, si possono ottenere i segnali che stanno viaggiando lungo un particolare assone, e, proprio come nel caso del granchio, troviamo che l’informazione non dipende solamente da un punto nell’occhio, ma è una somma di informazioni su diversi punti. La più recente descrizione del funzionamento dell’occhio della rana è la seguente. Si possono trovare quattro differenti tipi di fibre del nervo ottico, nel senso che vi sono quattro differenti tipi di risposte. Questi esperimenti non furono fatti facendo brillare a intervalli impulsi luminosi, perché questo non è quello che vede una rana. Una rana sta semplicemente lì accovacciata e i suoi occhi non si muovono mai, a meno che la foglia di giglio d’acqua su cui si siede non si muova avanti e indietro, e in questo caso i suoi occhi oscillano esattamente in modo che l’immagine resti stabile. Essa non ruota gli occhi. Se qualcosa si muove nel suo campo visivo, come un piccolo insetto (deve essere in grado di vedere qualcosa di piccolo che si muove sul fondo immobile), risulta che vi sono quattro differenti tipi di fibre che scaricano, le cui proprietà sono riassunte nella TABELLA 36.1. Rilevazione del bordo prolungata, non cancellabile, significa che se introduciamo un oggetto con un bordo nel campo visivo di una rana, allora vi sono numerosi impulsi in questa particolare fibra mentre l’oggetto è in movimento, ma essi si smorzano fino a un impulso prolungato che continua fino a che il bordo resta là, anche se è fermo. Se spegniamo la luce gli impulsi cessano. Se la riaccendiamo di nuovo mentre il bordo è immobile nel campo visivo, partono di nuovo. Essi non sono eliminabili. Un altro tipo di fibra è molto simile, tranne che se il bordo è diritto non funziona. Deve trattarsi di un bordo convesso con buio dietro! Come deve essere complicato il sistema di interconnessione nella retina dell’occhio della rana perché capisca che è stata introdotta una superficie convessa! Inoltre, benché questa fibra si mantenga un poco, essa non si mantiene tanto a lungo come l’altra, e se spegniamo la luce e la riaccendiamo ancora, l’impulso non si ricostruisce di nuovo. Dipende dal movimento d’ingresso della superficie convessa. L’occhio la vede entrare e ricorda che è là, ma se spegniamo semplicemente la luce un momento, esso la dimentica semplicemente e non la vede più. R

TABELLA

36.1

Tipi di risposta nelle fibre del nervo ottico di una rana.

Tipo

Velocità

Campo angolare

0,2-0,5 m/s



Rilevazione del bordo convesso (cancellabile)

0,5 m/s

2°-3°

Rilevazione della variazione di contrasto

1-2 m/s

7°-10°

Rilevazione della diminuzione della luce

Fino a 0,5 m/s

Fino a 15°

?

Molto grande

Rilevazione del bordo mantenuta (incancellabile)

Rilevazione del buio

© 978-8808-22107-0

36.6 • Neurologia della visione

Un altro esempio è la rilevazione della variazione nel contrasto. Se vi è un bordo in movimento avanti o indietro vi sono impulsi, ma se la cosa è ferma non vi sono impulsi affatto. Poi vi è un rilevatore della diminuzione dell’illuminazione. Se l’intensità della luce si abbassa, esso crea impulsi, ma se resta bassa o alta l’impulso cessa; funziona soltanto mentre la luce va diminuendo. Poi, finalmente, vi sono alcune fibre che sono rilevatori di buio – una cosa estremamente sorprendente – esse sono sempre eccitate! Se aumentiamo la luce trasmettono impulsi meno rapidamente, ma continuamente. Se diminuiamo la luce esse trasmettono impulsi più rapidamente, tutto il tempo. Nel buio si eccitano come pazzi, dicendo continuamente «È buio! È buio! È buio!». Ora queste risposte sembrano essere piuttosto complesse da classificare, e potremmo domandarci se gli esperimenti siano stati forse male interpretati. Ma è molto interessante che queste stesse classi siano molto chiaramente separate nell’anatomia della rana! Da altre misure, dopo che queste risposte erano state classificate (successivamente, ciò è quello che è importante), fu scoperto che la velocità dei segnali delle diverse fibre non era la stessa, così vi era un altro modo indipendente per controllare che tipo di fibra abbiamo trovato! Un altro interessante quesito è: da un’area di quale estensione una fibra particolare fa i suoi calcoli? La risposta è diversa per le diverse classi. La FIGURA 36.14 mostra la superficie del cosiddetto tectum di una rana, dove i nervi entrano nel cervello dal nervo ottico. Tutte le fibre nervose che giungono dal nervo ottico creano connessioni nei vari strati del tectum. Questa struttura stratificata è analoga 14 alla retina; ciò è in parte il motivo per cui sappiamo che 13 cervello e retina sono molto simili. Ora, prendendo un 12 elettrodo e introducendolo successivamente nei vari strati, possiamo vedere dove terminano i diversi tipi 11 di nervi ottici e lo splendido meraviglioso risultato è 10 che i diversi tipi di fibre terminano in strati differenti! 9 Le prime terminano nel tipo numero 1, le seconde nel numero 2, le terze e le quinte nello stesso punto e più 8 profonda di tutte è la numero 4. (Quale coincidenza, hanno ottenuto i numeri quasi nell’ordine giusto! No, questo è perché li hanno numerati in questo modo, a a la prima pubblicazione aveva i numeri in un ordine 7 diverso!) Possiamo brevemente riassumere quello che abbiamo appena imparato in questo modo: vi sono prea sumibilmente tre pigmenti. Vi possono essere molti 6 differenti tipi di cellule ricevitrici contenenti i tre pigmenti in diverse proporzioni, ma vi sono parecchie connessioni incrociate che possono permettere addizioni e sottrazioni attraverso l’addizione e il rinforzo 5 B 4 nel sistema nervoso. Così, prima di capire realmente 3 la visione del colore, dovremo capire la sensazione 2 D A finale. Questo argomento è un argomento aperto, ma F 1 queste ricerche con microelettrodi e così via ci daranno forse alla fine più informazioni su come vediamo il FIGURA 36.14 Il tectum di una rana. colore.

379

a a

C

E

380

Capitolo 36 • Meccanismo della visione

© 978-8808-22107-0

Bibliografia

Committee on Colorimetry, Optical Society of America, The Science of Color, Thomas Y. Crowell Company, New York, 1953. «Mechanisms of Vision», 2nd Supplement to Journal of General Physiology, Vol. 43, No. 6, Part 2, July 1960, Rockefeller Institute Press. Articoli specifici

D R , E., «Some Observations on the Ultrastructure and Morphogenesis of Photoreceptors», pp. 1-15. H , L. M. and D. J Mechanisms», pp. 63-80.

, «Perceived Color, Induction Effects, and Opponent-Response

R , W. A., ed., Sensory Communication, Massachusetts Institute of Technology Press, Cambridge, Mass., 1961. «Sight, Sense of», Encyclopaedia Britannica, Vol. 20, 1957, pp. 628-635.

Comportamento quantistico

37.1

Meccanica atomica

Nei capitoli precedenti abbiamo trattato le idee essenziali necessarie per la comprensione della maggior parte dei fenomeni importanti concernenti la luce o la radiazione elettromagnetica in generale. (Abbiamo lasciato per l’anno prossimo alcuni argomenti particolari. Specificamente, la teoria dell’indice di rifrazione dei materiali densi e la riflessione totale.) Ciò che abbiamo trattato è la «teoria classica» delle onde elettriche, che risulta essere una descrizione completamente adeguata della natura per un gran numero di fenomeni. Non ci siamo ancora dovuti preoccupare del fatto che l’energia luminosa arriva in granuli o «fotoni». Il prossimo argomento che vorremmo prendere in considerazione è il comportamento dei pezzi di materia relativamente grandi: per esempio, le loro proprietà meccaniche e termiche. Nel discutere queste troveremo che la teoria «classica» (o più vecchia) fallisce quasi immediatamente, perché la materia è in realtà costituita da particelle di dimensioni atomiche. Tuttavia tratteremo soltanto la parte classica, perché quella è l’unica parte che possiamo comprendere usando la meccanica classica che abbiamo imparato. Ma non avremo molto successo. Troveremo che nel caso della materia, a differenza della luce, saremo in difficoltà relativamente presto. Potremmo naturalmente ignorare continuamente gli effetti atomici, ma invece interporremo qui una piccola digressione nella quale descriveremo le idee fondamentali delle proprietà quantistiche della materia, cioè le idee quantistiche della fisica atomica, in modo che avrete qualche percezione di che cosa sia ciò che tralasciamo. Perché dovremo tralasciare alcuni argomenti importanti ai quali non potremo evitare di avvicinarci. Quindi faremo ora una introduzione alla meccanica quantistica, ma soltanto molto più avanti potremo entrare in realtà nell’argomento. La «meccanica quantistica» è la descrizione del comportamento della materia in tutti i dettagli e in particolare degli avvenimenti su scala atomica. Su piccolissima scala le cose si comportano differentemente da tutto ciò di cui avete qualsiasi esperienza diretta. Non si comportano come onde, non si comportano come particelle, non si comportano come nuvole o palle da biliardo o pesi attaccati a molle, o come qualunque cosa abbiate mai visto. Newton pensava che la luce fosse costituita da particelle, ma poi fu scoperto, come abbiamo visto, che si comporta come un’onda. Più tardi, tuttavia (all’inizio del ventesimo secolo) si trovò che la luce in realtà qualche volta si comporta come una particella. Storicamente, per esempio, si pensava che l’elettrone si comportasse come una particella e poi si trovò che sotto molti aspetti si comporta come un’onda. In realtà non si comporta come nessuna delle due. Ora abbiamo ceduto. Diciamo: «Esso non è simile a nessuna delle due». C’è una circostanza fortunata, tuttavia: gli elettroni si comportano proprio come la luce. Il comportamento quantistico degli oggetti atomici (elettroni, protoni, neutroni, fotoni e così via) è il medesimo per tutti, essi sono tutti «onde corpuscolari» o comunque vogliate chiamarli. Così ciò che impariamo sulle proprietà degli elettroni (che useremo come esempio) si applicherà anche a tutte le «particelle», inclusi i fotoni della luce. Il graduale accumulo di informazioni attorno al comportamento atomico e su piccola scala durante il primo quarto di questo secolo, che diede qualche indicazione sul comportamento delle cose piccole, produsse una confusione crescente che fu finalmente risolta nel 1926 e 1927 da Schrödinger, Heisenberg e Born. Essi finalmente ottennero una descrizione internamente

37

Capitolo 37 • Comportamento quantistico

382

© 978-8808-22107-0

consistente del comportamento della materia su piccola scala. In questo capitolo raccogliamo i lineamenti principali di quella descrizione. Dato che il comportamento atomico è molto dissimile dall’esperienza ordinaria, è assai difficile abituarsi a esso e appare peculiare e misterioso a tutti, sia al fisico novizio sia al veterano. Perfino gli esperti non lo comprendono nel modo che vorrebbero, ed è perfettamente ragionevole che non lo comprendano, perché tutta l’esperienza diretta e l’intuizione umana si applicano a oggetti grandi. Noi sappiamo come agiscono gli oggetti grandi, ma le cose su piccola scala non agiscono affatto in quella maniera. Sicché dobbiamo apprendere quanto le riguarda in modo astratto o immaginario e non per connessione con la nostra esperienza diretta. In questo capitolo affronteremo immediatamente l’elemento fondamentale del comportamento misterioso nella sua forma più strana. Scegliamo, da esaminare, un fenomeno che è impossibile, assolutamente impossibile, spiegare in un qualsivoglia modo classico, e che racchiude in sé l’essenza della meccanica quantistica. In realtà, esso contiene l’unico mistero. Non siamo in grado di spiegare il mistero nel senso di «spiegare» come esso agisca. Vi diremo come agisce. Col dirvi come agisce vi avremo detto le particolarità fondamentali dell’intera meccanica quantistica.

37.2

Un esperimento eseguito con pallottole

Per cercare di capire il comportamento quantistico degli elettroni, paragoneremo e metteremo in contrasto il loro comportamento, in un particolare apparato sperimentale, con il più noto comportamento di particelle, come le pallottole, e con il comportamento di onde, come le onde d’acqua. Considereremo prima il comportamento di proiettili nell’apparato sperimentale mostrato schematicamente nella FIGURA 37.1. Abbiamo una mitragliatrice che spara una raffica di pallottole. Non è una mitragliatrice molto buona, poiché sparge le pallottole (a caso) in un intervallo angolare abbastanza ampio, com’è indicato nella figura. Davanti alla mitragliatrice abbiamo una parete (fatta con una piastra corazzata) con due fori, grandi all’incirca quanto basta a lasciar passare una pallottola. Oltre la parete vi è un dispositivo d’arresto (diciamo una spessa parete di legno) che «assorbirà» le pallottole quando esse lo colpiscono. Davanti alla parete abbiamo un oggetto che chiameremo «rilevatore» di pallottole. Potrebbe essere una scatola contenente sabbia. Ogni pallottola che entrerà nel rilevatore sarà fermata e conservata. Quando vorremo, potremo vuotare la scatola e contare il numero di pallottole che sono state prese. Il rilevatore può essere spostato avanti e indietro (in quella che chiameremo direzione x). Con questo apparato siamo in grado di trovare sperimentalmente la risposta alla domanda: «Qual è la probabilità che una pallottola che passi attraverso i fori della parete arrivi al dispositivo d’arresto alla distanza x dal centro?» Per prima cosa dovreste rendervi conto che dobbiamo parlare di probabilità, perché non possiamo dire con precisione dove andrà a finire ciascuna particolare pallottola. Una pallottola cui capiti di colpire uno dei fori può rimbalzare sulle pareti del foro

Rilevatore mobile

x

x

P1

1

2

P2

Mitragliatrice

FIGURA

37.1

Esperimento di interferenza con pallottole. Nella figura (c) si ha: P 12 = P 1 + P 2 .

P12

x

Parete (a)

Dispositivo d’arresto (b)

(c)

37.3 • Un esperimento eseguito con onde

© 978-8808-22107-0

e finire da qualsiasi parte. Per «probabilità» intendiamo l’eventualità che la pallottola giunga al rilevatore, cosa che possiamo misurare contando il numero delle pallottole che arrivano al rilevatore in un certo tempo e poi facendo il rapporto fra questo numero e il numero totale delle pallottole che colpiscono il dispositivo d’arresto in quel tempo. Ovvero, se assumiamo che l’arma spari sempre con la stessa rapidità durante le misure, la probabilità di cui abbiamo bisogno è esattamente proporzionale al numero di pallottole che raggiungono il rilevatore in un intervallo di tempo prestabilito. Per i nostri scopi attuali ci piacerebbe immaginare un esperimento un po’ idealizzato in cui le pallottole non sono vere pallottole, ma pallottole indistruttibili – che non si possono spezzare a metà. Nel nostro esperimento troviamo che le pallottole arrivano sempre in blocco e quando troviamo qualcosa nel rilevatore, è sempre una pallottola intera. Se la velocità alla quale la mitragliatrice spara è resa molto bassa, scopriamo che a un dato momento o non arriva nulla al dispositivo d’arresto oppure arriva una e una sola pallottola – esattamente una. Inoltre, la misura del blocco certo non dipende dalla velocità di sparo della mitragliatrice. Diremo: «Le pallottole arrivano sempre in blocchi identici». Ciò che noi misuriamo col nostro rilevatore è la probabilità di arrivo di un blocco. E misuriamo la probabilità come funzione di x. Il risultato di tali misurazioni con questo apparato (non abbiamo ancora fatto l’esperimento, sicché stiamo veramente immaginando il risultato) è riportato nel diagramma della FIGURA 37.1c. Nel diagramma riportiamo la probabilità a destra e x verticalmente, di modo che la scala della x si adatti al disegno dell’apparato. Chiamiamo P12 la probabilità, perché le pallottole possono essere passate sia attraverso il foro 1 sia attraverso il foro 2. Non vi sorprenderà che P12 sia grande vicino alla metà del grafico ma diventi piccolo se x è molto grande. Tuttavia, può darsi vi chiediate perché mai P12 abbia il suo valore massimo a x = 0. Possiamo comprendere questo fatto se rifacciamo il nostro esperimento dopo aver coperto il foro 2, e ancora una volta coprendo il foro 1. Quando il foro 2 è coperto, le pallottole possono passare soltanto attraverso il foro 1, e noi otteniamo la curva designata P1 nella figura FIGURA 37.1b. Come vi aspettereste, il massimo di P1 si verifica al valore di x che si trova in linea retta con la mitragliatrice e il foro 1. Quando il foro 1 è chiuso, otteniamo la curva simmetrica P2 disegnata nella figura. P2 rappresenta la distribuzione delle probabilità per le pallottole che attraversano il foro 2. Confrontando le parti b e c della FIGURA 37.1, troviamo l’importante risultato che P12 = P1 + P2

(37.1)

Semplicemente le probabilità si sommano. L’effetto con entrambi i fori aperti è la somma degli effetti con ciascun foro aperto da solo. Chiameremo questo risultato osservazione di «non interferenza», per una ragione che vedremo più avanti. Questo, per quanto riguarda le pallottole. Esse arrivano in blocchi e la loro probabilità d’arrivo non mostra interferenza.

37.3

Un esperimento eseguito con onde

Consideriamo ora un esperimento eseguito con onde d’acqua. L’apparato è mostrato schematicamente nella FIGURA 37.2. Abbiamo una vaschetta poco profonda di acqua. Un piccolo oggetto, indicato come «sorgente delle onde», è spinto su e giù da un motore e produce onde circolari. Alla destra della sorgente abbiamo di nuovo una parete con due fori, e oltre quella vi è una seconda parete, la quale, per semplificare le cose, è un «assorbitore», sicché non vi è riflessione delle onde che vi arrivano. Ciò può essere fatto costruendo una «spiaggia» graduale di sabbia. Davanti alla spiaggia collochiamo un rilevatore che può essere mosso avanti e indietro nella direzione x, come prima. Il rilevatore è ora uno strumento che misura l’«intensità» del moto ondoso. Potete immaginare un dispositivo che misura l’altezza del moto dell’onda, ma la cui scala è graduata in proporzione al quadrato dell’altezza reale, cosicché la lettura è proporzionale all’intensità dell’onda. Dunque, il nostro rilevatore segna in proporzione all’energia portata dall’onda – o, piuttosto, alla quantità di energia portata al rilevatore nell’unità di tempo. Con questo apparato, la prima cosa da notare è che l’intensità può avere qualsiasi valore. Se la sorgente si muove appena di una piccolissima quantità, allora al rilevatore si manifesta

383

Capitolo 37 • Comportamento quantistico

384 FIGURA

© 978-8808-22107-0

37.2

Esperimento di interferenza con onde d’acqua. Nella figura (b) si ha: I1 = |hˆ 1 |2 I2 = |hˆ 2 |2 . Nella figura (c) si ha: I12 = |hˆ 1 + hˆ 2 |2 .

Rilevatore x

x

I1

1 Sorgente delle onde

2

Parete

I12

I2

Assorbitore

(a)

(b)

(c)

appena un minimo di moto ondulatorio. Quando vi è maggior moto nella sorgente, si manifesta maggiore intensità nel rilevatore. L’intensità dell’onda può avere assolutamente qualsiasi valore. Non possiamo dire che vi sia alcuna «tendenza a raggrumarsi» nell’intensità dell’onda. Misuriamo ora l’intensità dell’onda per vari valori di x (continuando a far funzionare la sorgente delle onde sempre nella stessa maniera). Otteniamo l’interessante curva indicata con I12 nella FIGURA 37.2c. Abbiamo già calcolato come possano prodursi tali figure quando studiammo l’interferenza delle onde elettriche. In questo caso osserveremmo che l’onda originaria è diffratta ai fori, e che da ciascun foro si diffondono nuove onde circolari. Se copriamo un solo foro alla volta e misuriamo la distribuzione d’intensità nel rilevatore troviamo le curve d’intensità, piuttosto semplici, mostrate nella FIGURA 37.2b. I1 è l’intensità dell’onda dal foro 1 (intensità che troviamo misurando quando il foro 2 è bloccato) e I2 è l’intensità dell’onda dal foro 2 (vista quando il foro 1 è bloccato). L’intensità I12 , che si osserva quando entrambi i fori sono aperti, certamente non è la somma di I1 e I2 . Noi diciamo che vi è «interferenza» delle due onde. In certe posizioni (dove la curva I12 ha i massimi) le onde sono «in fase» e le creste d’onda contribuiscono a dare una grande ampiezza e, quindi, una forte intensità. Diciamo che in tali posizioni le due onde «interferiscono costruttivamente». Tale interferenza costruttiva si produrrà dovunque la distanza tra il rilevatore e un foro sia più lunga (o più corta) della distanza fra il rilevatore e l’altro foro di un numero intero di lunghezze d’onda. Nei punti in cui le due onde arrivano al rilevatore con una differenza di fase pari a ⇡ (dove esse sono «fuori fase») il moto ondoso risultante nel rilevatore sarà la differenza delle due ampiezze. Le onde «interferiscono distruttivamente» e, per l’intensità dell’onda, otteniamo un valore basso. Ci aspettiamo tali valori bassi dovunque la distanza tra il foro 1 e il rilevatore è diversa dalla distanza tra il foro 2 e il rilevatore di un numero dispari di mezze lunghezze d’onda. I piccoli valori di I12 nella FIGURA 37.2 corrispondono ai luoghi in cui le due onde interferiscono distruttivamente. Ricorderete che la relazione quantitativa tra I1 , I2 e I12 può essere espressa nella seguente maniera: l’altezza istantanea nel rilevatore dell’onda d’acqua per l’onda dal foro 1 può venire scritta come (la parte reale di) hˆ 1 ei!t , dove «l’ampiezza» hˆ 1 è, in generale, un numero complesso. L’intensità è proporzionale al valore medio dell’altezza elevata al quadrato, ovvero, quando usiamo i numeri complessi, a | hˆ 1 |2 . Analogamente, per il foro 2 l’altezza è hˆ 2 ei!t e l’intensità è proporzionale a | hˆ 2 |2 . Quando entrambi i fori sono aperti, le altezze d’onda si sommano a dare l’altezza ( hˆ 1 + hˆ 2 )ei!t e l’intensità | hˆ 1 + hˆ 2 |2 . Omettendo, per i nostri fini attuali, la costante di proporzionalità, le relazioni appropriate alle onde interferenti sono I1 = | hˆ 1 |2 I2 = | hˆ 2 |2

(37.2)

I12 = | hˆ 1 + hˆ 2 |2 Noterete che il risultato è completamente diverso da quello ottenuto con le pallottole dell’equa-

37.4 • Un esperimento eseguito con elettroni

© 978-8808-22107-0

385

zione (37.1). Se sviluppiamo | hˆ 1 + hˆ 2 |2 vediamo che | hˆ 1 + hˆ 2 |2 = | hˆ 1 |2 + | hˆ 2 |2 + 2 | hˆ 1 | | hˆ 2 | cos dove

(37.3)

è la differenza di fase tra hˆ 1 e hˆ 2 . In termini di intensità potremmo scrivere p I12 = I1 + I2 + 2 I1 I2 cos

(37.4)

L’ultimo termine della (37.4) è il «termine d’interferenza». Questo per quanto riguarda le onde d’acqua. L’intensità può avere qualsiasi valore e mostra interferenza.

37.4

Un esperimento eseguito con elettroni

Ora immaginiamo un esperimento simile fatto con elettroni. È mostrato schematicamente nella FIGURA 37.3. Fabbrichiamo un fucile elettronico formato da un filo di tungsteno riscaldato da corrente elettrica e circondato da una scatola di metallo che ha un foro. Se il filo si trova a un voltaggio negativo rispetto alla scatola, gli elettroni emessi dal filo verranno accelerati in direzione della parete e alcuni passeranno attraverso il foro. Tutti gli elettroni uscenti dal fucile avranno (circa) la stessa energia. Davanti al fucile vi è di nuovo una parete (una sottile lastra di metallo) con due fori. Oltre la parete vi è un’altra lastra che servirà da «dispositivo d’arresto». Davanti al dispositivo d’arresto collochiamo un rilevatore mobile. Il rilevatore potrebbe essere un contatore Geiger, o, forse meglio, un moltiplicatore elettronico collegato a un altoparlante. Dovremmo dire immediatamente che non dovreste cercare di montare questo esperimento (come potreste aver fatto con i due già descritti). Questo esperimento non è mai stato fatto proprio in questo modo. Il guaio è che l’apparato dovrebbe venire approntato su scala piccola fino all’impossibile, per mostrare gli effetti cui siamo interessati. Noi stiamo facendo un «esperimento ideale» che abbiamo scelto perché facile da analizzare. Conosciamo i risultati che si otterrebbero perché vi sono molti esperimenti che sono stati fatti con la scala e le proporzioni scelte in modo da mostrare gli effetti che descriveremo. La prima cosa che osserviamo nel nostro esperimento con elettroni è che udiamo dei «click» distinti dal rilevatore (cioè dall’altoparlante). E tutti i «click» sono uguali. Non vi sono dei «mezzi click». Osserveremmo pure che i «click» arrivano molto irregolarmente. Un qualcosa come: click... click-click... click... click... click-click... click... ecc., proprio come avrete udito, senza dubbio, da un contatore Geiger in funzione. Se contiamo i click che giungono in un tempo sufficientemente lungo – diciamo in molti minuti – e poi contiamo di nuovo in un altro intervallo di tempo uguale, troviamo che i due numeri sono quasi del tutto uguali. Sicché possiamo parlare di velocità media a cui i click vengono uditi (tanti click in media al minuto). Quando spostiamo il rilevatore qua e là, il numero di click nell’unità di tempo aumenta o diminuisce ma la grandezza (intensità di suono) di ciascun click è sempre la stessa. Se abbassiamo

x

x Rilevatore P1

1 Fucile elettronico

P12

2 P2

Parete (a)

Dispositivo di arresto (b)

FIGURA

(c)

37.3

Esperimento di interferenza con elettroni. Nella figura (b) si ha: P1 = | 1 | 2 P2 = | 2 | 2 . Nella figura (c) si ha: P12 = | 1 + 2 |2 .

386

Capitolo 37 • Comportamento quantistico

© 978-8808-22107-0

la temperatura del filo metallico nel fucile il numero dei click diminuisce, ma ciascun click ha ancora il medesimo suono. Osserveremmo, ancora, che, se collocassimo due rilevatori separati al dispositivo d’arresto, darebbero un click o l’uno o l’altro, ma mai entrambi contemporaneamente (tranne che una volta ogni tanto se vi fossero due click molto vicini l’uno all’altro nel tempo, il nostro orecchio potrebbe non percepire la separazione tra i due). Ne deduciamo, perciò, che qualunque cosa arrivi al dispositivo d’arresto, arriva in «blocchi». Tutti i «blocchi» hanno le stesse dimensioni: giungono soltanto dei «blocchi» interi, ed essi giungono al dispositivo d’arresto uno alla volta. Diremo: «Gli elettroni giungono sempre in blocchi identici». Proprio come facemmo nel nostro esperimento con le pallottole, ora possiamo procedere per trovare sperimentalmente la risposta alla domanda: «Qual è la probabilità relativa che un “blocco” di elettroni arrivi al dispositivo d’arresto a diverse distanze x dal centro?». Come prima, otteniamo la probabilità relativa osservando il numero dei click mentre manteniamo costante l’attività del fucile. La probabilità che i blocchi arrivino a un particolare x è proporzionale al numero medio dei click nell’unità di tempo in quell’x. Il risultato del nostro esperimento è l’interessante curva indicata con P12 nella FIGURA 37.3c. Sì! È così che vanno gli elettroni.

37.5

L’interferenza delle onde di elettroni

Cerchiamo ora di analizzare la curva della FIGURA 37.3 per vedere se riusciamo a comprendere il comportamento degli elettroni. La prima cosa che diremmo è che dal momento che essi arrivano in blocchi, ciascun blocco, che possiamo pure chiamare elettrone, è giunto o attraverso il foro 1 o attraverso il foro 2. Scriviamo ciò sotto forma di una «proposizione»: Proposizione A: ciascun elettrone passa o attraverso il foro 1 o attraverso il foro 2. Assumendo la Proposizione A, tutti gli elettroni che arrivano al dispositivo d’arresto possono essere divisi in due classi: (1) quelli che giungono attraverso il foro 1 e (2) quelli che giungono attraverso il foro 2. Dunque, la curva da noi considerata deve essere la somma degli effetti degli elettroni che arrivano attraverso il foro 1 e di quelli che giungono attraverso il foro 2. Controlliamo quest’idea con l’esperimento. Per prima cosa, faremo la misura di quegli elettroni che arrivano attraverso il foro 1. Blocchiamo il foro 2 e facciamo i conteggi dei click del rilevatore. Dal numero dei click otteniamo P1 . Il risultato della misura è indicato dalla curva segnata P1 nella FIGURA 37.3b. Il risultato sembra del tutto ragionevole. In modo analogo misuriamo P2 , la distribuzione della probabilità per gli elettroni che arrivano attraverso il foro 2. Anche il risultato di questa misura è disegnato nella figura. Il risultato P12 ottenuto con entrambi i fori aperti, chiaramente, non è la somma di P1 e P2 , le probabilità per ciascun foro da solo. In analogia al nostro esperimento con le onde d’acqua, diciamo: «Vi è interferenza». Per gli elettroni:

P12 , P1 + P2

(37.5)

Come può verificarsi tale interferenza? Forse dovremmo dire: «Bene, ciò significa, presumibilmente, che non è vero che i blocchi passino o attraverso il foro 1 o il foro 2, perché se lo facessero, le probabilità dovrebbero sommarsi. Forse essi si muovono in modo più complicato. Si scindono in due e...». Ma no! Non possono, arrivano sempre in blocchi.... «Bene, forse alcuni passano attraverso 1 e poi tornano indietro attraverso 2, e poi di nuovo in giro per alcune altre volte, o per qualche altra via complicata... allora, chiudendo il foro 2, noi abbiamo alterato la possibilità che un elettrone che partiva attraverso il foro 1 arrivasse infine al dispositivo di arresto...». Ma, osservate! Vi sono alcuni punti in cui arrivano pochissimi elettroni quando entrambi i fori sono aperti, ma che ricevono molti elettroni se chiudiamo un foro, così il chiudere un foro ha aumentato il numero di quelli che vengono dall’altro. Notate, comunque, che, al centro del disegno, P12 è più del doppio di P1 + P2 . È come se chiudendo un foro diminuisse il numero degli elettroni che attraversano l’altro foro. Pare difficile spiegare entrambi gli effetti proponendo che gli elettroni viaggino per vie complicate.

37.6 • Osservazione degli elettroni

© 978-8808-22107-0

È tutto assai misterioso. E più ci guardate, più misterioso appare. Molte idee sono state architettate per tentare di spiegare la forma della curva di P12 mediante elettroni individuali che vanno qua e là per vie complicate attraverso i fori. Nessuna di esse ha avuto successo. Nessuna di esse riesce a ottenere la giusta curva per P12 in termini di P1 e P2 . Eppure, per quanto sorprendente, la matematica che serve a mettere in relazione P1 e P2 a P12 è estremamente semplice. Perché P12 è proprio come la curva I12 della FIGURA 37.2, e quella era semplice. Ciò che si verifica al dispositivo d’arresto può essere descritto da due numeri complessi che possiamo chiamare ˆ1 e ˆ2 (essi, naturalmente, sono funzioni di x). Il modulo quadrato di ˆ1 dà l’effetto con il solo foro 1 aperto. Cioè, P1 = | ˆ1 |2 . L’effetto con il solo foro 2 aperto è dato da ˆ2 nella stessa maniera. Cioè P2 = | ˆ2 |2 . E l’effetto combinato dei due fori è proprio P12 = | ˆ1 + ˆ2 |2 . La matematica è la stessa che abbiamo usato per le onde d’acqua! (È difficile vedere come si potrebbe ottenere un risultato così semplice da un gioco complesso di elettroni che vanno avanti e indietro attraverso la lamina per qualche strana traiettoria.) Conclusione: gli elettroni arrivano in blocchi, come particelle, e la probabilità di arrivo di questi blocchi è distribuita come la distribuzione d’intensità di un’onda. È in questo senso che un elettrone si comporta «talvolta come una particella e talvolta come un’onda». Incidentalmente, quando abbiamo trattato le onde classiche, abbiamo definito l’intensità come la media nel tempo del quadrato dell’ampiezza dell’onda, e abbiamo fatto uso dei numeri complessi come espediente matematico per semplificare l’analisi. Ma nella meccanica quantistica risulta che le ampiezze debbono essere rappresentate da numeri complessi. Le parti reali da sole non bastano. Questo è un particolare tecnico, per il momento, perché le formule hanno esattamente lo stesso aspetto. Poiché la probabilità di arrivo attraverso entrambi i fori è data così semplicemente, benché non sia pari a P1 + P2 , questo è in realtà tutto ciò che vi è da dire. Ma vi è un gran numero di sottigliezze implicite nel fatto che la natura opera in questa maniera. Ci piacerebbe illustrare ora per voi alcune di queste sottigliezze. Per prima cosa, dal momento che il numero che arriva a un punto particolare non è pari al numero che arriva attraverso 1 più il numero che arriva attraverso 2, come avremmo dedotto dalla Proposizione A, indubbiamente dovremmo concludere che la Proposizione A è falsa. Non è vero che gli elettroni passano o attraverso il foro 1 o attraverso il foro 2. Ma questo risultato può essere indagato con un altro esperimento.

37.6

Osservazione degli elettroni

Ora tenteremo il seguente esperimento. Al nostro apparato di elettroni aggiungiamo una sorgente luminosa molto intensa posta dietro la parete e tra i due fori, come indicato in FIGURA 37.4. Sappiamo che le cariche elettriche diffondono luce. Sicché quando un elettrone passa, comunque esso passi, sulla sua via verso il rilevatore, diffonderà un po’ di luce in direzione dei nostri occhi e potremo vedere dove va. Se, per esempio, un elettrone dovesse prendere la via attraverso il foro 2 che è disegnata nella FIGURA 37.4, vedremmo un lampo di luce giungere dalle vicinanze della posizione indicata con A nella figura. Se un elettrone passa attraverso il foro 1 ci aspetteremmo di vedere un lampo venire dalle vicinanze del foro superiore.Se dovesse accadere che riceviamo luce da entrambe le posizioni nello stesso tempo, perché l’elettrone si divide a metà... Facciamo l’esperimento! Ecco ciò che vediamo: ogni volta che udiamo un «click» dal nostro rilevatore di elettroni (al dispositivo d’arresto), vediamo anche un lampo di luce o vicino al foro 1 o vicino al foro 2, ma mai a tutti e due nello stesso tempo! E osserviamo lo stesso risultato dovunque collochiamo il rilevatore. Da questa osservazione deduciamo che quando guardiamo gli elettroni troviamo che essi vanno o attraverso un foro o attraverso l’altro. Dal punto di vista sperimentale la Proposizione A è necessariamente vera. Cos’è dunque errato nel nostro argomento contro la Proposizione A? Perché P12 non è esattamente uguale a P1 + P2 ? Torniamo all’esperimento. Seguiamo il corso degli elettroni e scopriamo che cosa fanno. Per ciascuna posizione (posizione-x) del rilevatore conteremo gli elettroni che arrivano e terremo nota anche del foro che hanno attraversato stando attenti ai lampi

387

388

Capitolo 37 • Comportamento quantistico

37.4 Un diverso esperimento con elettroni. Nella figura (c) si ha: P012 = P01 + P02 .

© 978-8808-22107-0

FIGURA

x

1 Fucile elettronico

2

(a)

x

Sorgente luminosa

P'1

A

P'12

P'2

(b)

(c)

di luce. Possiamo seguire il corso delle cose in questo modo: ogni qualvolta udiamo un «click» metteremo un segno nella colonna 1, se vediamo il lampo vicino al foro 1, e, se vediamo il lampo vicino al foro 2, registreremo un segno nella colonna 2. Ogni elettrone che arriva è registrato in una delle due classi: quelli che giungono attraverso 1 e quelli che giungono attraverso 2. Dal numero registrato nella colonna 1 otteniamo la probabilità P10 che un elettrone arrivi al rilevatore attraverso il foro 1; e dal numero registrato nella colonna 2 otteniamo P20 , la probabilità che un elettrone arrivi al rilevatore attraverso il foro 2. Se ora ripetiamo una misura del genere per molti valori di x, otteniamo le curve per P10 e P20 indicate nella FIGURA 37.4b. Bene, non è poi troppo sorprendente! Otteniamo per P10 qualcosa di molto simile a ciò che abbiamo ottenuto prima per P1 bloccando il foro 2, e P20 è simile a ciò che abbiamo ottenuto chiudendo il foro 1. Sicché non c’è alcuna complicazione come quella che gli elettroni attraversino entrambi i fori. Quando li osserviamo, gli elettroni passano proprio come ci aspetteremmo che passassero. Sia che i fori siano chiusi o aperti, quelli che vediamo arrivare attraverso il foro 1 sono distribuiti nella stessa maniera, aperto o chiuso che sia il foro 2. Ma, un momento! Cosa abbiamo ora come probabilità totale, probabilità che un elettrone arrivi al rilevatore per una qualsiasi strada? Abbiamo già quell’informazione. Noi fingiamo soltanto di non avere mai guardato i lampi di luce, e consideriamo in blocco i click del rilevatore che abbiamo divisi in due colonne. Dobbiamo soltanto addizionare i numeri. Come probabilità che un elettrone arrivi al dispositivo d’arresto passando attraverso l’uno o l’altro foro, troviamo 0 = P + P . Cioè, benché siamo riusciti a osservare attraverso quale foro arrivano i nostri P12 1 2 0 che non elettroni, non otteniamo più la vecchia curva dell’interferenza P12 , ma una nuova P12 mostra interferenze. Se spegniamo la luce, si ritrova P12 . Dobbiamo concludere che quando guardiamo gli elettroni la loro distribuzione sullo schermo è diversa da quando non li guardiamo. È forse il fatto di accendere la sorgente luminosa che altera le cose? La questione deve essere questa: che gli elettroni sono molto delicati, e la luce, quando diffonde gli elettroni, dà loro un urto che ne altera il moto. Sappiamo che il campo elettrico della luce che agisce su una carica esercita una forza su di essa. Sicché, forse ci dovremmo aspettare che il moto cambi. A ogni modo, la luce esercita una grande influenza sugli elettroni. Cercando di «osservare» gli elettroni ne abbiamo variato il moto. Cioè, l’urto dato dall’elettrone quando il fotone è da esso diffuso è tale da cambiare il moto dell’elettrone quanto basta perché, se mai esso avrebbe potuto dirigersi verso un massimo di P12 , si fermi invece in un punto minimo di P12 ; questo è il motivo per cui non vediamo più gli effetti ondulatori d’interferenza. Voi potreste pensare: «Non usare una sorgente così luminosa! Abbassa la luminosità! Allora le onde luminose saranno più deboli e non turberanno tanto gli elettroni. Di certo, rendendo la luce sempre più debole, di lì a poco l’onda sarà abbastanza debole da avere un effetto trascurabile». D’accordo. Proviamo. La prima cosa che osserviamo è che i lampi di luce diffusi dagli elettroni mentre passano non diventano più deboli. Il lampo è sempre della stessa intensità. L’unica cosa che accade all’abbassarsi della luce è che talvolta udiamo un «click» dal rilevatore ma non vediamo alcun lampo. L’elettrone è passato senza farsi «vedere». Ciò che stiamo osservando è il fatto che anche la luce agisce alla maniera degli elettroni; sapevamo che era «ondulatoria», ma ora troviamo che è anche «granulare». Essa arriva sempre

© 978-8808-22107-0

37.6 • Osservazione degli elettroni

– o è diffusa – in granuli che chiamiamo «fotoni». Quando abbassiamo l’intensità della sorgente luminosa non alteriamo la dimensione dei fotoni, solo il numero che viene emesso nell’unità di tempo. Ciò spiega perché, quando la nostra sorgente è debole, alcuni elettroni passano senza essere veduti. È accaduto che non vi fosse un fotone lì intorno nel momento in cui l’elettrone è passato. Tutto ciò è un po’ scoraggiante. Se è vero che ogniqualvolta «vediamo» l’elettrone vediamo il lampo di intensità uguale, allora gli elettroni che vediamo sono sempre quelli perturbati. Tentiamo a ogni modo l’esperimento con una luce debole. Ora, ogniqualvolta udiremo un click nel rilevatore terremo il conto in tre colonne: nella colonna l vi saranno gli elettroni visti dal foro 1, nella colonna 2 gli elettroni visti dal foro 2, e nella colonna 3 gli elettroni che non sono stati visti affatto. Al momento di sviluppare i nostri dati (calcolando le probabilità) troviamo questi risultati: quelli «visti dal foro 1» hanno una distribuzione uguale a P10 ; quelli «visti dal foro 2» hanno una distribuzione uguale a P20 (di modo che quelli «visti o dal foro 1 o dal foro 2» hanno 0 ); e quelli «non visti affatto» hanno una distribuzione «ondulatoria» una distribuzione pari a P12 proprio uguale a P12 della FIGURA 37.3! Se gli elettroni non sono osservati, abbiamo interferenza! Ciò è comprensibile. Quando non vediamo l’elettrone, nessun fotone lo disturba, e quando lo vediamo, un fotone lo ha disturbato. Vi è sempre lo stesso disturbo perché tutti i fotoni luminosi producono effetti di uguale entità e l’effetto dei fotoni diffusi è sufficiente a cancellare qualsiasi effetto d’interferenza. Non vi è un qualche modo di poter vedere gli elettroni senza disturbarli? In un capitolo precedente abbiamo imparato che la quantità di moto portata da un fotone è inversamente proporzionale alla sua lunghezza d’onda (p = h/ ). L’urto dato all’elettrone quando il fotone è diffuso in direzione dei nostri occhi certamente dipende dalla quantità di moto che il fotone porta. Aha! Se vogliamo disturbare gli elettroni solo debolmente non avremmo dovuto abbassare l’intensità della luce, ne avremmo dovuto diminuire la frequenza (ossia aumentare la lunghezza d’onda). Usiamo luce di colore più rosso. Potremmo anche usare luce infrarossa, ovvero onde radio (come il radar) e «vedere» dov’è andato l’elettrone con l’aiuto di qualche equipaggiamento che è in grado di «vedere» la luce di queste lunghezze d’onda più elevate. Se facciamo uso di luce «più garbata» forse possiamo evitare di disturbare tanto gli elettroni. Tentiamo l’esperimento con onde più lunghe. Continueremo a ripetere l’esperimento con luce di lunghezza d’onda ogni volta maggiore. Dapprima, nulla sembra mutare. I risultati sono gli stessi. Poi succede una cosa terribile. Ricorderete che quando studiammo il microscopio sottolineammo il fatto che, a causa della natura ondulatoria della luce, vi è un limite alla vicinanza di due oggetti se si vuole continuare a vederli come due oggetti distinti. Questa distanza è dell’ordine della lunghezza d’onda della luce. Sicché ora, quando rendiamo la lunghezza d’onda maggiore della distanza tra i nostri fori, vediamo un grosso lampo sfocato nel momento in cui la luce è diffusa dagli elettroni. Non possiamo più dire per quale foro sia passato l’elettrone! Sappiamo solo che se n’è andato da qualche parte. Ed è proprio con luce di questo colore che scopriamo che gli 0 cominci ad assomigliare a P – urti comunicati all’elettrone sono abbastanza piccoli perché P12 12 perché cominciamo ad avere qualche effetto d’interferenza. Ed è solo per lunghezze d’onda molto maggiori della distanza fra i due fori (quando non abbiamo alcuna possibilità di dire dov’è andato l’elettrone) che il disturbo dovuto alla luce diventa abbastanza piccolo in modo che otteniamo di nuovo la curva P12 mostrata nella FIGURA 37.3. Nel nostro esperimento troviamo che è impossibile disporre la luce in modo da poter dire per quale foro è passato l’elettrone, senza al tempo stesso alterarne la distribuzione. Fu lanciata da Heisenberg l’idea che le allora nuove leggi della natura potessero essere consistenti solo se vi erano alcune limitazioni fondamentali alle nostre capacità sperimentali non precedentemente riconosciute. Egli propose, come principio generale, il suo principio di indeterminazione, che possiamo enunciare in rapporto al nostro esperimento come segue: «È impossibile preparare un’apparecchiatura atta a determinare per quale foro passi l’elettrone, e che al tempo stesso non disturbi gli elettroni quanto basta per distruggere la figura d’interferenza». Se un apparato è in grado di determinare per quale foro passa l’elettrone, esso non può essere tanto delicato da non disturbare la figura d’interferenza in maniera essenziale. Nessuno ha mai trovato (e nemmeno immaginato) un modo di aggirare il principio di indeterminazione. Sicché dobbiamo ammettere che esso descrive una caratteristica fondamentale della natura.

389

390

Capitolo 37 • Comportamento quantistico

© 978-8808-22107-0

L’intera teoria della meccanica quantistica di cui ora facciamo uso per descrivere gli atomi, e, in realtà, tutta la materia, dipende dalla validità del principio di indeterminazione. Dal momento che la meccanica quantistica è una teoria così coronata da successo, la nostra fiducia nel principio di indeterminazione ne viene rafforzata. Ma se mai venisse scoperto un modo di «battere» il principio di indeterminazione, la meccanica quantistica darebbe risultati inconsistenti e dovrebbe essere scartata come teoria valida della natura. «Bene», direte, «e la Proposizione A? È vero o non è vero che l’elettrone o passa attraverso il foro 1 o passa attraverso il foro 2?». L’unica risposta che si può dare è che abbiamo scoperto dall’esperimento che vi è un certo modo particolare in cui dobbiamo pensare se non vogliamo incorrere in contraddizioni interne. Ciò che dobbiamo dire (per evitare di fare predizioni errate) è quanto segue. Se si guardano i fori, o, più precisamente, se si ha un’apparecchiatura capace di determinare se gli elettroni passano attraverso il foro 1 o il foro 2, allora si può dire che l’elettrone passa o attraverso il foro 1 o attraverso il foro 2. Ma, quando non si cerca di dire per quale via passa l’elettrone, quando non vi è nulla nell’esperimento per disturbare gli elettroni, allora non si può dire che un elettrone attraversa o il foro 1 o il foro 2. Se uno dice questo, e comincia a trarre deduzione dall’affermazione, commetterà errori nell’analisi. Questo è il filo logico su cui dobbiamo camminare se vogliamo descrivere con successo la natura.

Se il moto di tutta la materia – come quello degli elettroni – deve essere descritto mediante onde, che ne è x x P12 (mediata) delle pallottole del nostro primo esperimento? Perché P12 lì non abbiamo visto una figura d’interferenza? Risulta che, per quanto riguarda le pallottole, le lunghezze d’onda erano così piccole che le figure d’interferenza sono diventate molto sottili. Anzi, così sottili che con qualsiasi rilevatore di dimensioni finite non si riuscirebbero a distinguere i massimi e i minimi. Ciò che abbiamo visto è stato soltanto una specie di media, che è la curva classica. (a) (b) Nella FIGURA 37.5 abbiamo cercato di indicare schematicamente cosa succede con oggetti su larga scala. La FIGURA 37.5a mostra la distribuzione della FIGURA 37.5 Figura di interferenza con pallottole: (a) effettiva (schematizzata), (b) osservata. meccanica quantistica. Le rapide variazioni s’immagina rappresentino la figura d’interferenza che si ottiene per onde di lunghezza d’onda assai corta. Tuttavia, qualsiasi rilevatore fisico media parecchie oscillazioni della curva delle probabilità, cosicché le misure mostrano la curva continua disegnata nella FIGURA 37.5b.

37.7

Primi princìpi della meccanica quantistica

Scriveremo ora un sommario delle principali conclusioni dei nostri esperimenti. Metteremo però i risultati in una forma che li renda veri per una classe generale di tali esperimenti. Potremo scrivere il nostro sommario più facilmente se prima definiamo un «esperimento ideale» come un esperimento in cui non vi sono influenze esterne incerte, cioè, nessun moto o altre cose di cui non possiamo tener conto. Saremmo del tutto esatti se dicessimo: «Un esperimento ideale è un esperimento in cui tutte le condizioni iniziali e finali dell’esperimento sono completamente specificate». Ciò che chiamiamo «evento», è, in generale, proprio un complesso determinato di condizioni iniziali e finali. (Per esempio: «un elettrone lascia il fucile, arriva al rilevatore, e non succede altro».) Passiamo ora al nostro riassunto.

37.8 • Il principio di indeterminazione

© 978-8808-22107-0

Riassunto

1 La probabilità di un evento in un esperimento ideale è data dal quadrato del valore assoluto di un numero complesso chiamato ampiezza di probabilità: P = probabilità = ampiezza di probabilità P=| |

(37.6)

2

2 Quando un evento può manifestarsi in parecchi modi alternativi, l’ampiezza della probabilità dell’evento corrisponde alla somma delle ampiezze delle probabilità di ciascun modo considerato separatamente. Vi è interferenza: = P=|

1 1

+ +

2 2|

2

(37.7)

3 Se si compie un esperimento capace di determinare se in realtà si prende un’alternativa o un’altra, la probabilità dell’evento è data dalla somma delle probabilità per ciascuna alternativa. L’interferenza si perde: P = P1 + P2

(37.8)

Si potrebbe ancora chiedere: «Come funziona? Qual è il meccanismo dietro alla legge?». Nessuno ha trovato alcun meccanismo dietro alla legge. Nessuno può «spiegare» più di ciò che abbiamo appena «spiegato». Nessuno vi darà una rappresentazione più approfondita della situazione. Non abbiamo alcuna idea su un meccanismo più fondamentale da cui possano essere dedotti questi risultati. Vorremmo mettere l’accento su una differenza assai importante tra la meccanica classica e quella quantistica. Abbiamo parlato della probabilità che un elettrone arrivi in una data circostanza. Abbiamo dato per scontato che nel nostro apparato sperimentale (o perfino nel migliore possibile) sarebbe impossibile predire cosa accadrebbe esattamente. Possiamo soltanto predire la probabilità. Se ciò fosse vero significherebbe che la fisica ha rinunciato al problema di tentare di predire esattamente ciò che accadrà in una determinata circostanza. Sì! La fisica vi ha rinunciato. Noi non sappiamo come predire ciò che accadrebbe in una data circostanza, e ora crediamo sia impossibile e che l’unica cosa prevedibile sia la probabilità di eventi diversi. Bisogna riconoscere che questo è una diminuzione del nostro precedente ideale di capire la natura. Può essere un passo indietro, ma nessuno ha trovato il modo di evitarlo. Facciamo, ora, alcune osservazioni riguardo a un suggerimento che talvolta è stato dato per cercare di evitare la descrizione che abbiamo fatto: «Forse l’elettrone ha un qualche genere di attività interna – qualche variabile interna – di cui ancora non sappiamo. Forse è per questo che non possiamo predire ciò che accadrà. Se potessimo guardare l’elettrone più da vicino potremmo essere in grado di dire dove andrebbe a finire». Per quanto ne sappiamo ora, ciò è impossibile. Noi saremmo ancora in difficoltà. Supponiamo di assumere che dentro all’elettrone vi è un qualche genere di meccanismo il quale determina dove finirà. Quel meccanismo deve anche determinare quale foro attraverserà nel suo cammino. Ma non dobbiamo dimenticare che ciò che si trova all’interno dell’elettrone non dovrebbe dipendere da ciò che noi facciamo, e in particolare dal fatto che apriamo o chiudiamo uno dei fori. Sicché, se un elettrone ha già deciso, prima di partire (a) quale foro userà e (b) dove ha intenzione di parare, dovremmo trovare P1 per quegli elettroni che hanno scelto il foro 1, P2 per quelli che hanno scelto il foro 2, e, di necessità, la somma P1 + P2 per quelli che arrivano attraverso i due fori. Non sembra vi sia alcun modo di evitare ciò. Ma abbiamo verificato sperimentalmente che non è così. E nessuno è riuscito a trovare una via d’uscita da questo rompicapo. Sicché al momento dobbiamo limitarci a valutare le probabilità. Diciamo «al momento» ma nutriamo forti sospetti che si tratti di qualcosa che ci porteremo dietro sempre – che sia impossibile risolvere il rompicapo – che la natura sia realmente così.

391

392

Capitolo 37 • Comportamento quantistico

37.8

© 978-8808-22107-0

Il principio di indeterminazione

È così che Heisenberg enunciò originariamente il principio di indeterminazione: se si fa la misura su un oggetto qualsiasi e si riesce a determinarne la componente x della quantità di moto con una indeterminazione p, allora l’indeterminazione x che, al tempo stesso, è associata alla posizione x è tale che ~ x 2 p cioè le indeterminazioni nella posizione e nella quantità di moto a un qualsiasi istante debbono avere il prodotto maggiore o uguale alla metà della costante di Planck ridotta: ~ 2 Questo è un caso particolare del principio di indeterminazione che è stato enunciato sopra in maniera più generale. L’affermazione più generale è stata che non si può in alcun modo progettare un’apparecchiatura per determinare quale delle due alternative venga scelta, senza, al tempo stesso, distruggere la figura d’interferenza. Mostriamo, per un caso particolare, che il tipo di relazione data da Heisenberg deve essere vera per evitare di cacciarsi nei pasticci. Immagineremo una modifica dell’esperimento della FIGURA 37.3, in cui la parete con i fori consiste in una lamina montata su due rulli, sì da potersi muovere liberamente su e giù (nella direzione x), com’è mostrato nella FIGURA 37.6. Osservando attentamente Rulli il moto della lamina possiamo tentare di determinare pa il foro attraverso il quale un elettrone passa. Immagi∆px pb nate cosa succede quando il rilevatore viene posto a 1 Rilevatore x = 0. Ci aspetteremmo che un elettrone che attraversa il foro 1 debba essere deflesso in giù dalla lamina per raggiungere il rilevatore. Dato che la componenFucile 2 elettronico pa te verticale della quantità di moto dell’elettrone viene Libero di ∆px mutata, la lamina dovrà retrocedere con una uguale muoversi pb quantità di moto nella direzione opposta. La lamina riceverà una spinta verso l’alto. Se l’elettrone passa Parete Dispositivo attraverso il foro più basso, la lamina dovrebbe avverdi arresto tire una spinta verso il basso. È chiaro che per ogni posizione del rilevatore, la quantità di moto ricevuta FIGURA 37.6 Esperimento nel quale si misura il rinculo della parete. dalla lamina avrà un valore per un attraversamento del foro 1 e un valore diverso per un attraversamento del foro 2. Bene! Senza disturbare affatto gli elettroni, ma osservando unicamente la lamina, possiamo dire qual è la via usata dall’elettrone. Ora, per fare ciò è necessario conoscere la quantità di moto dello schermo prima che l’elettrone lo attraversi. Così, quando misureremo la quantità di moto dopo il passaggio dell’elettrone, potremo calcolare di quanto è cambiata la quantità di moto della lamina. Ma, ricordate, secondo il principio di indeterminazione, non possiamo al tempo stesso conoscere la posizione della lamina con una precisione arbitraria. Ma se non sappiamo esattamente dove si trovi la lamina, non possiamo dire con precisione dove sono i due fori. Essi saranno in un luogo diverso per ogni elettrone che passa. Ciò significa che il centro del nostro disegno d’interferenza avrà una posizione diversa per ogni elettrone. Le variazioni dalla figura d’interferenza saranno cancellate. Mostreremo quantitativamente nel prossimo capitolo che, se determiniamo la quantità di moto della lamina in maniera sufficientemente esatta da decidere dalla misura del rinculo quale sia stato il foro attraversato, l’indeterminazione, nella posizione x della lamina, secondo il principio di indeterminazione, sarà sufficiente a spostare la figura osservata nel rilevatore su e giù sulla direzione x circa della distanza fra un massimo e il suo minimo più vicino. Un tale spostamento irregolare è appunto sufficiente a confondere la figura, sicché non si osserva alcuna interferenza. x p

© 978-8808-22107-0

37.8 • Il principio di indeterminazione

Il principio di indeterminazione «protegge» la meccanica quantistica. Heisenberg si accorse che se fosse possibile misurare simultaneamente con maggiore esattezza la quantità di moto e la posizione, la meccanica quantistica crollerebbe. Così egli suggerì che ciò doveva essere impossibile. Poi molti si sedettero a cercare di immaginare dei modi per farlo, ma nessuno riuscì a trovare un modo per misurare la posizione e la quantità di moto di qualche cosa – uno schermo, un elettrone, una palla da biliardo, una cosa qualsiasi – con maggior esattezza. La meccanica quantistica conserva la sua rischiosa ma valida esistenza.

393

38

Relazione fra i punti di vista ondulatorio e corpuscolare

38.1

Ampiezze dell’onda di probabilità

In questo capitolo tratteremo la relazione fra i punti di vista ondulatorio e corpuscolare. Sappiamo già, dal precedente capitolo, che né il punto di vista ondulatorio né quello corpuscolare sono corretti. Di solito abbiamo cercato di presentare le cose esattamente, o, almeno, in maniera abbastanza precisa da non dover essere cambiate quando apprenderemo di più – può darsi vengano estese, ma non verranno cambiate! Ma, quando cerchiamo di parlare della rappresentazione ondulatoria o corpuscolare, entrambe sono approssimate, ed entrambe cambieranno. Perciò, quanto impariamo in questo capitolo, in un certo senso non sarà esatto; esso è una specie di discussione semi-intuitiva che sarà resa più rigorosa più avanti, ma certe cose verranno un tantino cambiate quando le interpreteremo correttamente nella meccanica quantistica. La ragione di tale procedimento, naturalmente, sta nel fatto che non abbiamo intenzione di entrare direttamente nella meccanica quantistica, ma vogliamo avere almeno una qualche idea del genere di effetti che troveremo. Inoltre, tutte le nostre esperienze hanno a che fare con onde e particelle, e di conseguenza è piuttosto utile usare le idee sulle onde e sulle particelle per comprendere qualcosa di ciò che accade in determinate circostanze prima di conoscere tutta la matematica sulle ampiezze quantomeccaniche. Cercheremo di illustrare i punti più deboli, mentre procediamo, ma la massima parte della trattazione è quasi del tutto esatta – è puramente una questione d’interpretazione. Prima di tutto, sappiamo che il nuovo modo di rappresentare il mondo nella meccanica quantistica – la nuova struttura – è di assegnare un’ampiezza a ciascun evento possibile, e se l’evento implica la ricezione di una sola particella, potremo dare l’ampiezza per trovare quell’unica particella in luoghi e tempi diversi. La probabilità di trovare la particella sarà poi proporzionale al quadrato del valore assoluto dell’ampiezza. In generale, l’ampiezza per trovare una particella in luoghi e tempi diversi varia con la posizione e il tempo. In un caso particolare l’ampiezza varia sinusoidalmente nello spazio e nel tempo come ei(!t k · r ) (non dimenticate che queste ampiezze sono numeri complessi, non numeri reali) e comporta una ben determinata frequenza ! e un numero d’onde k. Allora risulta che ciò corrisponde a una situazione limite classica dove avremmo creduto di avere una particella la cui energia E fosse nota e legata alla frequenza dalla relazione E = ~!

(38.1)

e la cui quantità di moto p fosse pure nota e legata al numero d’onde dalla relazione p = ~k

(38.2)

Ciò significa che l’idea di particella è limitata. L’idea di particella – la sua posizione, la sua quantità di moto ecc. – di cui facciamo tanto uso, è sotto certi aspetti insoddisfacente. Per esempio, se un’ampiezza per trovare una particella in luoghi diversi è data da ei(!t k · r ) , il cui modulo quadrato è una costante, ciò significherebbe che la probabilità di trovare una particella è uguale in tutti i punti. Ciò significa che non sappiamo dove si trova – si può trovare dovunque – vi è una grossa incertezza riguardo alla sua posizione.

© 978-8808-22107-0

38.2 • Misura della posizione e della quantità di moto

395

D’altra parte, se la posizione di una particella è più o meno conosciuta e se possiamo predirla abbastanza esattamente, la probabilità di trovarla in ∆x luoghi diversi deve essere limitata a una certa regione, la cui lunghezza chiamiamo x. Al di fuori di questa regione la probabilità è zero. Ora, questa probabilità corrisponde al modulo quadrato di un’ampiezza, e, se il modulo quadrato è zero, l’ampiezza sarà pure zero, cosicché avremo un treno d’onde la cui lunghezza è x (FIGURA 38.1), e la lunghezza d’onda (la distanza tra due nodi delle onde del treno d’onde) di quel treno d’onde FIGURA 38.1 Pacchetto d’onde di lunghezza �x. è ciò che corrisponde alla quantità di moto della particella. Qui c’imbattiamo in una strana cosa relativa alle onde; una cosa molto semplice che non ha niente a che fare, a rigore, con la meccanica quantistica. È qualcosa che chiunque lavori con le onde sa, anche se non sa niente di meccanica quantistica: cioè, che non possiamo determinare un’unica lunghezza d’onda per un treno d’onde corto. Un siffatto treno d’onde non ha una lunghezza d’onda ben precisa; vi è una indeterminatezza nel numero d’onde che è collegato alla limitata lunghezza del treno, e quindi vi è una indeterminatezza nella quantità di moto.

38.2

Misura della posizione e della quantità di moto

Consideriamo due esempi di quest’idea – per vedere la ragione per cui esiste un’incertezza nella posizione e/o nella quantità di moto, se la meccanica quantistica è giusta. Abbiamo anche visto che se non si verificasse una cosa del genere – se fosse possibile misurare simultaneamente la posizione e la quantità di moto di una qualsiasi cosa –avremmo un paradosso; è una fortuna che non ci troviamo di fronte a un tale paradosso, e il fatto che una siffatta indeterminatezza venga naturalmente dalla rappresentazione ondulatoria mostra che tutto è internamente consistente. Ecco un esempio che mostra la relazione tra la posizione e la quantità di moto in una circostanza facile a comprendersi. Supponiamo di avere una sola fenditura, e che le particelle provengano da molto lontano con una certa energia – cosicché arrivano tutte essenzialmente orizzontali (FIGURA 38.2). Ci concentreremo sulle componenti verticali della quantità di moto. Tutte queste particelle hanno una certa quantità di moto orizzontale p0 , diciamo, in senso classico. Così, classicamente, la quantità di moto verticale py , B prima che la particella attraversi il foro, è nota in modo ben preciso. La particella non si muove né in su né in giù, perché è venuta da una sorgente molto lontana – e così la quantità di moto verticale è naturalmente zero. Ma supponiamo ora che essa attraversi un foro di larghezza B. Dopo che è uscita attraverso il foro, ne conosceremo la posizione verticalmente (la posizione y) con notevole esattezza, cioè ±B. Quindi l’indeterminazione sulla posizione y è dell’ordine di B. FIGURA 38.2 Diffrazione di particelle che Ora potremmo anche voler dire, poiché sappiamo che la quantità di attraversano una fenditura. moto è assolutamente orizzontale, che py è zero; ma ciò è sbagliato. Una volta sapevamo che la quantità di moto era orizzontale, ma ora non lo sappiamo più. Prima che le particelle attraversassero il foro, non ne conoscevamo le posizioni verticali. Ora che abbiamo trovato la posizione verticale facendo passare la particella attraverso il foro, abbiamo perso le informazioni in merito alla quantità di moto verticale! Perché? Secondo la teoria delle onde, vi è un allargamento, o diffrazione, delle onde dopo che esse attraversano la fenditura, proprio come per la luce. Di conseguenza, vi è una certa probabilità che le particelle uscenti dalla fenditura non proseguano esattamente in linea retta. La figura è allargata dall’effetto di diffrazione, e l’angolo di allargamento, che possiamo definire come l’angolo del primo minimo, è una misura dell’indeterminazione nell’angolo finale. Come mai la figura si allarga? Dire che è allargata significa che vi è una qualche probabilità che la particella si stia muovendo in su o in giù, cioè che abbia una componente della quantità di moto in su o in giù. Diciamo probabilità e particella perché possiamo rilevare questa figura di diffrazione con un contatore di particelle, a esempio in C nella FIGURA 38.2; esso riceve l’intera

C

396

Capitolo 38 • Relazione fra i punti di vista ondulatorio e corpuscolare

© 978-8808-22107-0

particella, cosicché, in senso classico, la particella ha una quantità di moto verticale, per salire dalla fenditura fino a C. Per avere un’idea approssimativa dello sparpagliamento della quantità di moto, la quantità di moto verticale py ha uno sparpagliamento pari a p0 ✓, dove p0 è la quantità di moto orizzontale. E com’è grande ✓ nella figura allargata? Sappiamo che il primo minimo si verifica a un angolo ✓ tale che le onde da un estremo della fenditura debbono percorrere una lunghezza d’onda in più di quelle che arrivano dall’altro lato – l’abbiamo calcolato in precedenza (capitolo 30). Perciò ✓ = /B, e così py in questo esperimento è p0 /B. Notate che se rendiamo B più piccolo e facciamo una misura più esatta della posizione della particella, la figura di diffrazione si allarga. Ricordate che quando chiudemmo le fenditure nell’esperimento con le microonde, avemmo maggiore intensità ad angoli più grandi. Sicché più sottile rendiamo la fenditura, più larga diventa la figura e maggiore è la probabilità di trovare che la particella ha quantità di moto obliqua. Così l’indeterminazione nella quantità di moto verticale è inversamente proporzionale all’indeterminazione di y. Infatti vediamo che il prodotto dei due è uguale a p0 . Ma è la lunghezza d’onda e p0 è la quantità di moto, e in accordo con la meccanica quantistica, la lunghezza d’onda moltiplicata per la quantità di moto è la costante di Planck h. Sicché otteniamo la regola per cui le indeterminazioni nella quantità di moto verticale e nella posizione verticale hanno un prodotto dell’ordine di h: ~ y py (38.3) 2 Non possiamo preparare un sistema in cui conosciamo la posizione verticale di una particella e siamo in grado di predire come si muoverà verticalmente, con determinazione maggiore di quella data da (38.3). Cioè, l’indeterminazione nella quantità di moto verticale deve essere superiore a (~/2) y, dove y è l’indeterminazione nella nostra conoscenza della posizione. Talvolta qualcuno dice che la meccanica quantistica è tutta sbagliata. Quando la particella arrivava da sinistra, la sua quantità di moto verticale era zero. E ora che è passata attraverso la fenditura, è nota la sua posizione. Sia la posizione sia la quantità di moto sembrano essere note con arbitraria esattezza. È senz’altro vero che possiamo ricevere una particella, e al momento della ricezione determinare quale ne sia la posizione e quale avrebbe dovuto essere la quantità di moto per arrivare là. Questo è vero, ma non è a ciò che si riferisce la relazione di indeterminazione (38.3). L’equazione (38.3) si riferisce alla prevedibilità di una situazione, non a osservazioni circa il passato. Non serve dire «Sapevo quale fosse la quantità di moto prima che essa passasse attraverso la fenditura, e ora conosco la posizione», perché ora si è smarrita la conoscenza della quantità di moto. Il fatto che essa abbia attraversato la fenditura non ci permette più di predire la quantità di moto verticale. Noi parliamo di una teoria che possa predire le cose, non soltanto di misurazioni dopo il fatto. Quindi dobbiamo parlare di ciò che siamo capaci di predire. Affrontiamo ora la cosa dall’altro verso. Prendiamo un altro esempio del medesimo fenomeno, in modo un poco più quantitativo. Nell’esempio precedente abbiamo misurato la quantità di moto con un metodo classico. Cioè, abbiamo esaminato la direzione, la velocità e gli angoli, ecc., e abbiamo ottenuto così la quantità di moto con un’analisi classica. Ma, dal momento che la quantità di moto è legata al numero d’onde, esiste, in natura, ancora un altro modo di misurare la quantità di moto di una particella – fotone o altro – che non ha un analogo classico, poiché fa uso dell’equazione (38.2). Noi misuriamo la lunghezza d’onda delle onde. Cerchiamo di misurare, in questo modo, la quantità di moto. Immaginiamo di avere un reticolo con un gran numero di linee (FIGURA 38.3), e inviamo un fascio di particelle al reticolo. Abbiamo spesso trattato questo problema: se le particelle hanno una quantità di moto ben precisa, allora otterremo una figura ben netta in una certa direzione, a causa dell’interferenza. E abbiamo anche parlato di quanto esattamente possiamo determinare quella quantità di moto, vale a dire, di quale sia il potere risolutivo di un reticolo del genere. Invece di ricavarlo di nuovo, facciamo riferimento al capitolo 30, dove trovammo che l’indeterminazione relativa nella lunghezza d’onda che può essere misurata con un dato reticolo è 1/N m, dove N è il numero delle linee del reticolo e m è l’ordine della figura di diffrazione. Cioè =

1 Nm

(38.4)

38.2 • Misura della posizione e della quantità di moto

© 978-8808-22107-0

397

Ora, la formula (38.4) può essere riscritta come: 2

=

1 Nm

=

Nmλ = L

1 L

(38.5)

dove L è la distanza mostrata in FIGURA 38.3. Questa distanza rappresenta la differenza tra la distanza totale che la particella, o l’onda o quel che è, deve percorrere se è riflessa dal fondo del reticolo e la distanza che deve percorrere se è riflessa dalla cima del reticolo. Cioè, le onde che formano la figura di diffrazione sono onde provenienti da diverse parti del reticolo. Le prime che arrivano provengono dall’estremo inferiore del reticolo, dall’inizio del treno d’onde, e il resto di esse viene da parti successive del treno d’onde, provenendo da parti diverse del reticolo, finché arriva l’ultima ed essa implica un punto nel treno d’onde a distanza L dopo il primo punto. Così, per avere nel nostro spettro una linea netta corrispondente a FIGURA 38.3 Determinazione della quantità di moto una quantità di moto ben precisa, con un’indeterminazione data da (38.4), mediante l’uso di un reticolo di diffrazione. dobbiamo avere un treno d’onde di lunghezza pari almeno a L. Se il treno d’onde è troppo corto non usiamo l’intero reticolo. Le onde che formano lo spettro sono riflesse solo da un settore molto corto del reticolo se il treno d’onde è troppo corto, e il reticolo non lavorerà in maniera giusta – troveremo una grossa dispersione angolare. Per ottenerne una più stretta è necessario usare l’intero reticolo, cosicché almeno in un qualche momento l’intero treno d’onde diffonda simultaneamente da tutte le parti del reticolo. Dunque, il treno d’onde deve essere di lunghezza L, per avere nella lunghezza d’onda un’indeterminazione inferiore a quella data da (38.5). Incidentalmente ! 1 k = = (38.6) 2 2⇡ perciò

k=

2⇡ L

(38.7)

dove L è la lunghezza del treno d’onde. Ciò significa che, se abbiamo un treno d’onde di lunghezza inferiore a L, l’indeterminazione nel numero d’onde deve essere superiore a 2⇡/L. Ovvero l’indeterminazione nel numero d’onde per la lunghezza del treno d’onde – la chiameremo per un momento x – è superiore a 2⇡. La chiamiamo x perché quella è l’indeterminazione nella posizione della particella. Se il treno d’onde esiste soltanto in una lunghezza limitata, allora è lì che potremmo trovare la particella, nei limiti di un’indeterminazione x. Ora, questa proprietà delle onde, per cui la lunghezza del treno d’onde per l’indeterminazione del numero d’onde associato a essa è almeno 2⇡, è una proprietà nota a chiunque le studi. Non ha niente a che vedere con la meccanica quantistica. Il fatto è, semplicemente, che se abbiamo un treno d’onde limitato, non possiamo contare con troppa esattezza le onde in esso contenute. Cerchiamo un’altra via per vedere la ragione di ciò. Immaginiamo di avere un treno limitato di lunghezza L; allora, a causa del modo in cui deve diminuire agli estremi, come in FIGURA 38.1, il numero d’onde nella lunghezza L è incerto di circa ±1. Ma il numero d’onde in L è pari a k L/2⇡. Quindi, k è incerto, e otteniamo nuovamente il risultato (38.7), semplicemente una proprietà delle onde. La stessa cosa succede sia che le onde si trovino nello spazio, k sia il numero di radianti per centimetro e L la lunghezza del treno d’onde, sia che le onde si trovino nel tempo, ! sia il numero di oscillazioni per secondo e T la «lunghezza» del tempo in cui arriva il treno d’onde. Cioè, se abbiamo un treno d’onde che dura solo per un certo tempo finito T, la indeterminazione nella frequenza è data da !=

2⇡ T

(38.8)

Abbiamo cercato di sottolineare che queste sono proprietà unicamente tipiche delle onde; esse sono ben note, per esempio, nella teoria del suono. La questione è che nella meccanica quantistica interpretiamo il numero d’onde come misura della quantità di moto di una particella, con la regola che p = ~k, cosicché la relazione (38.7) ci

398

Capitolo 38 • Relazione fra i punti di vista ondulatorio e corpuscolare

© 978-8808-22107-0

dice che

h x Questa è, dunque, una limitazione dell’idea classica della quantità di moto. (Naturalmente, deve essere limitata in qualche modo se abbiamo intenzione di rappresentare le particelle per mezzo di onde!) È piacevole aver scoperto una regola che ci dà una qualche idea di quando si manifesta il fallimento delle idee classiche. p⇡

38.3

Diffrazione nei cristalli

Passiamo ora a considerare la riflessione delle onde corpuscolari da parte di un cristallo. Un cristallo è un oggetto spesso formato di una gran quantità di atomi simili – più avanti includeremo qualche complicazione – disposti in un bello schieramento. Il problema è di come disporre lo schieramento d sì da ottenere un massimo fortemente riflesso in una data direzione per un determinato fascio, diciamo, di luce (raggi X), elettroni, neutroni o qualsiasi altra cosa. Per ottenere una forte riflessione, la diffusione da parte di tutti gli atomi deve essere in fase. Non vi possono essere numeri uguali di atomi in fase e fuori fase, altrimenti le onde si annulleranno. Il modo per sistemare le cose consiste nel trovare le regioni di fase costante, come già abbiamo spiegato; esse sono dei piani che formano angoli uguali con le direzioni iniziale e finale (FIGURA 38.4). FIGURA 38.4 Diffusione delle onde dai piani reticolari Se consideriamo due piani paralleli, come in FIGURA 38.4, le onde diffuse di un cristallo. dai due piani saranno in fase a patto che la differenza delle distanze percorsa da un fronte d’onda sia un numero intero di lunghezza d’onda. Si può vedere che questa differenza è 2d sen ✓, dove d è la distanza perpendicolare tra i piani. Di conseguenza la condizione per avere una riflessione coerente è 2d sen ✓ = n (n = 1, 2, ...) (38.9)

38.5 Figura di diffrazione di raggi X: diffusione da salgemma. FIGURA

38.6 Figura di diffrazione di raggi X: diffusione da mioglobina. FIGURA

Se, per esempio, il cristallo è tale che gli atomi giacciano su piani che obbediscono alla condizione (38.9) con n = 1, allora vi sarà una forte riflessione. Se, invece, vi sono altri atomi della stessa natura (di densità uguale) che si trovano a mezza strada, allora anche i piani intermedi diffonderanno con altrettanta intensità, interferiranno con gli altri e non produrranno effetto alcuno. Sicché d in (38.9) si deve riferire a piani adiacenti; non possiamo prendere un piano che si trovi cinque strati più indietro e usare questa formula! Incidentalmente, i veri cristalli non sono generalmente così semplici come un singolo tipo d’atomo ripetuto in un certo modo. Al contrario, per fare un’analogia bidimensionale, essi assomigliano molto alla carta da parati, in cui vi è un certo tipo di figura che si ripete per tutta la carta. Per «figura» intendiamo, nel caso degli atomi, un certo ordinamento – calcio, un carbonio e tre ossigeni ecc., per il carbonato di calcio e così via – che può includere un numero relativamente grande di atomi. Ma qualsiasi cosa esso sia, la figura è ripetuta a formare una struttura. Questa figura fondamentale è denominata cella unitaria. La struttura fondamentale che si ripete determina ciò che chiamiamo tipo di reticolo; il tipo di reticolo può essere immediatamente determinato guardando le riflessioni e vedendo quale ne sia la simmetria. In altre parole, i punti in cui troviamo una qualche riflessione determinano il tipo di reticolo, ma per determinare cosa c’è in ciascuno degli elementi del reticolo bisogna prendere in considerazione l’intensità della diffusione nelle varie direzioni. Dipende dal tipo di reticolo in quali direzioni si ha diffusione, ma l’intensità della diffusione è determinata da ciò che c’è all’interno di ogni cella unitaria, e in tal modo si ricava la struttura dei cristalli. Nelle FIGURE 38.5 e 38.6 sono mostrate due fotografie delle figure di diffrazione di raggi X; esse illustrano, rispettivamente, la diffusione da salgemma e dalla mioglobina. Incidentalmente, se le spaziature dei piani più vicini sono inferiori a /2 succede una cosa interessante. In questo caso, la (38.9) non ha soluzione per n. Così se è maggiore del doppio

38.4 • Le dimensioni dell’atomo

© 978-8808-22107-0

399

38.7 Diffusione dei neutroni di una pila attraverso un blocco di grafite. FIGURA

Neutroni con λ corta

Pila

Grafite

Intensità Neutroni con λ lunga

Neutroni con λ corta

λ

della distanza tra i piani adiacenti, non vi è una figura di diffrazione laterale, e la luce – o qualunque altra cosa – attraverserà direttamente il materiale senza rimbalzare via o disperdersi. Sicché, nel caso della luce, dove è molto maggiore della spaziatura, naturalmente essa attraversa direttamente e non vi è figura di riflessione dai piani del cristallo. Questo fatto ha anche una conseguenza interessante nel caso delle pile che producono i neutroni (questi sono ovviamente particelle, non c’è dubbio!). Se prendiamo questi neutroni e li mandiamo dentro un lungo blocco di grafite, i neutroni si diffondono e si fanno strada (FIGURA 38.7). Essi si diffondono perché vengono fatti rimbalzare dagli atomi, ma per la precisione, nella teoria ondulatoria, essi vengono fatti rimbalzare dagli atomi a causa della diffrazione dai piani dei cristalli. Ne risulta che, se prendiamo un pezzo assai lungo di grafite, i neutroni che escono dall’estremità sono tutti di lunghezza d’onda lunga. Infatti, se si riporta in grafico l’intensità in funzione della lunghezza d’onda, non otteniamo nulla tranne che nel caso di lunghezze d’onda superiori a un certo minimo (FIGURA 38.8). In altre parole, in quella maniera possiamo ottenere dei neutroni molto lenti. Soltanto i neutroni più lenti riescono ad attraversare; essi non sono diffratti o diffusi dai piani dei cristalli della grafite, ma continuano l’attraversamento direttamente come la luce attraverso il vetro, e non sono diffusi fuori lateralmente. Esistono molte altre dimostrazioni della realtà delle onde dei neutroni e delle onde di altre particelle.

38.4

38.8 Intensità dei neutroni uscenti da una barra di grafite in funzione della lunghezza d’onda. FIGURA

λmin

Le dimensioni dell’atomo

Consideriamo ora un’altra applicazione della relazione di indeterminazione, equazione (38.3). Essa non deve venir presa troppo seriamente; l’idea è giusta, ma l’analisi non è molto accurata. L’idea ha a che fare con la determinazione delle dimensioni degli atomi, e con il fatto che, dal punto di vista classico, gli elettroni irradierebbero luce e cadrebbero a spirale fino ad adagiarsi sul nucleo. Ma ciò non può essere giusto dal punto di vista della meccanica quantistica perché, se lo fosse, sapremmo dove si trova ciascun elettrone e a che velocità si muove. Immaginiamo di avere un atomo di idrogeno e di misurare la posizione dell’elettrone; è necessario che non siamo in grado di predire esattamente dove sarà l’elettrone, altrimenti lo sparpagliamento della quantità di moto risulterebbe infinito. Ogni volta che guardiamo l’elettrone, esso si trova da qualche parte, ma ha un’ampiezza per essere in posti diversi, sicché vi è la probabilità di trovarlo in posti diversi. Questi posti non possono essere tutti nel nucleo; supporremo che vi sia uno sparpagliamento della posizione dell’ordine di a. Vale a dire che la distanza dell’elettrone dal nucleo è di solito circa a. Determineremo a minimizzando l’energia totale dell’atomo. Lo sparpagliamento della quantità di moto è approssimativamente ~/a a causa della relazione di indeterminazione, cosicché, se cerchiamo di misurare la quantità di moto dell’elettrone in qualche modo, per esempio facendogli diffondere raggi X, e ricercando l’effetto Doppler prodotto da un centro diffusore in moto, non ci aspetteremmo di trovare zero ogni volta – l’elettrone non è a riposo – ma le quantità di moto dovranno essere dell’ordine di p ⇡ ~/a. Allora l’energia cinetica sarà approssimativamente p2 ~2 1 mv 2 = = 2 2m 2ma2

400

Capitolo 38 • Relazione fra i punti di vista ondulatorio e corpuscolare

© 978-8808-22107-0

(In un certo senso, questa è una specie di analisi dimensionale per trovare in che modo l’energia cinetica dipenda dalla costante di Planck, da m e dalle dimensioni dell’atomo. Non occorre che fidiamo nella nostra risposta entro fattori come 2, ⇡ ecc. Non abbiamo neppure definito a con molta precisione.) Ora, l’energia potenziale è e2 diviso la distanza dal centro, cioè e2 /a, dove, ricordiamo, e2 è la carica di un elettrone al quadrato, divisa per 4⇡✏ 0 . Ora, la questione è che l’energia potenziale si riduce se a diventa più piccolo, ma più piccolo è a, maggiore è, a causa del principio di indeterminazione, la quantità di moto richiesta e di conseguenza, maggiore è l’energia cinetica. L’energia totale è E=

~2 2ma2

e2 a

(38.10)

Noi non sappiamo cosa sia a, ma sappiamo che l’atomo si aggiusterà facendo qualche genere di compromesso in modo che l’energia sia la più piccola possibile. Per minimizzare E, differenziamo rispetto ad a, poniamo la derivata uguale a zero, e risolviamo rispetto ad a. La derivata di E è dE = da

~2 e2 + 2 3 ma a

(38.11)

e il porre dE/da = 0 dà ad a il valore a0 =

~2 = 0,528 Å = 0,528 · 10 me2

10

m

(38.12)

Questa particolare distanza è chiamata raggio di Bohr, e così abbiamo appreso che le dimensioni atomiche sono dell’ordine degli angstrom, il che è giusto: questo va piuttosto bene – anzi, è sorprendente, dal momento che finora non abbiamo avuto basi per comprendere le dimensioni degli atomi! Gli atomi sono assolutamente impossibili dal punto di vista classico, dal momento che gli elettroni cadrebbero a spirale sul nucleo. Ora, se introduciamo il valore (38.12) al posto di a0 nella (38.10), per trovare l’energia, risulta E0 =

e2 = 2a0

me4 = 13,6 eV 2~2

(38.13)

Che significa energia negativa? Significa che l’elettrone ha meno energia quando si trova nell’atomo che quando è libero. Significa che esso è legato. Significa che occorre energia per gettar fuori l’elettrone; per ionizzare un atomo d’idrogeno occorre un’energia dell’ordine di 13,6 eV. Non abbiamo ragione di pensare che non sia due o tre volte tanto – o la metà – o 1/⇡ volte tanto, dato che abbiamo fatto uso di un argomento così approssimativo. Comunque, abbiamo barato, abbiamo usato tutte le costanti in modo tale che per caso venga fuori il numero giusto! Questo numero, 13,6 eV, è chiamato 1 rydberg di energia; esso rappresenta l’energia di ionizzazione dell’idrogeno. Così ora comprendiamo perché non sprofondiamo nel pavimento. Nel camminare, le nostre scarpe con la loro massa di atomi spingono contro il pavimento e la sua massa di atomi. Per comprimere maggiormente gli atomi, gli elettroni dovrebbero essere confinati in uno spazio più piccolo, e, per il principio di indeterminazione, le loro quantità di moto dovrebbero essere, in media, maggiori, il che significa grande energia; la resistenza alla compressione atomica è un effetto quanto-meccanico, non classico. Dal punto di vista classico, se dovessimo spingere più vicini tutti gli elettroni e i protoni, l’energia si ridurrebbe ancora di più, e la migliore disposizione delle cariche positive e delle cariche negative nella fisica classica sarebbe di averle tutte l’una sopra l’altra. Ciò era ben noto nella fisica classica e costituiva un rompicapo a causa dell’esistenza dell’atomo. Naturalmente, gli scienziati del tempo inventarono alcuni modi per uscire da quel pasticcio – ma non ha importanza, noi ora abbiamo il modo giusto! (Forse). Incidentalmente, benché non vi sia nessuna ragione di capire questo, al momento, in una situazione dove vi siano molti elettroni risulta che essi cercano di tenersi lontani gli uni dagli altri. Se un elettrone occupa un certo spazio, un altro non occuperà lo stesso spazio. Più precisamente, vi sono due possibilità di spin, cosicché due elettroni possono stare l’uno addosso all’altro, con

38.5 • Livelli energetici

© 978-8808-22107-0

401

uno che ruota in un verso e l’altro nel verso opposto. Ma, dopo, lì non possiamo metterne altri. Dobbiamo metterne altri in un altro posto, e questa è la vera ragione per cui i materiali offrono resistenza. Se potessimo mettere tutti gli elettroni nello stesso posto, essa si condenserebbe ancor più di quanto non faccia. È il fatto che gli elettroni non possano andare tutti gli uni sugli altri che rende solide le tavole e ogni altra cosa. Ovviamente, per capire le proprietà della materia dovremo fare uso della meccanica quantistica e non accontentarci della meccanica classica.

38.5

Livelli energetici

Energia

Abbiamo parlato dell’atomo nella sua condizione di energia più bassa possibile, ma risulta che l’elettrone può fare altre cose. Può muoversi e dimenarsi in una maniera più energica, di modo che vi sono molti diversi movimenti possibili per l’atomo. Secondo la meccanica quantistica, in condizioni stazionarie, per un atomo vi possono essere soltanto delle energie definite. Facciamo un diagramma (FIGURA 38.9) in cui riportiamo l’energia verticalmente e tracciamo una linea orizzontale per ciascun valore di energia consentito. Quando l’elettrone è libero, cioè quando esso ha energia positiva, può avere qualsiasi energia; può muoversi a qualsiasi velocità. Ma le energie degli elettroni legati non sono arbitrarie. L’atomo deve necessariamente avere un valore o un altro tra un insieme di valori E=0 permessi, come quelli in FIGURA 38.9. E3 Ora, chiamiamo E0 , E1 , E2 , E3 i valori dell’energia permessi. Se un E2 atomo si trova inizialmente in uno di questi «stati eccitati», E1 , E2 ecc., E1 esso non rimane in quello stato definitivamente. Presto o tardi scende a uno stato più basso e irradia energia sotto forma di luce. La frequenza della luce E0 emessa è determinata dalla conservazione dell’energia più l’informazione quanto-meccanica che la frequenza della luce è legata all’energia della luce dalla (38.1). Di conseguenza la frequenza della luce che viene liberata in FIGURA 38.9 Diagramma energetico di un atomo, una transizione dall’energia E3 all’energia E1 (per esempio) è che illustra diverse transizioni possibili. !31 =

E3

E1

(38.14)

~

Questa, allora, è una frequenza caratteristica dell’atomo e determina una riga di emissione spettrale. Un’altra transizione possibile sarebbe da E3 a E0 . Questa avrebbe una frequenza diversa !30 =

E3

E0 ~

(38.15)

Un’altra possibilità è quella per cui, se l’atomo fosse eccitato allo stato E1 , esso potrebbe decadere allo stato fondamentale E0 , emettendo un fotone di frequenza !10 =

E1

E0 ~

(38.16)

La ragione per cui riportiamo tre transizioni è per sottolineate una relazione interessante. È facile vedere dalle (38.14), (38.15) e (38.16) che !30 = !31 + !10

(38.17)

In generale, se troviamo due righe spettrali, ci aspetteremo di trovare un’altra riga in corrispondenza della somma delle frequenze (o della differenza delle frequenze), e che tutte le righe possano essere comprese trovando una serie di livelli tali che ciascuna riga corrisponda alla differenza d’energia di una qualche coppia di livelli. Questa notevole coincidenza delle frequenze spettrali fu notata prima della scoperta della meccanica quantistica, ed è chiamata principio di combinazione di Ritz. Esso rappresenta nuovamente un mistero dal punto di vista della meccanica classica. Non

402

Capitolo 38 • Relazione fra i punti di vista ondulatorio e corpuscolare

© 978-8808-22107-0

ritorniamo sul punto che la meccanica classica è un fallimento in campo atomico; ci sembra di averlo dimostrato abbastanza bene. Abbiamo già parlato del fatto che la meccanica quantistica è rappresentata da ampiezze che si comportano come onde, con certe frequenze e numeri d’onde. Osserviamo ora come avvenga, dal punto di vista delle ampiezze, che l’atomo ha stati di energia determinati. Questa è una cosa che non possiamo capire da ciò che abbiamo detto finora, ma siamo tutti a conoscenza del fatto che le onde delimitate hanno frequenze definite. Per esempio, se il suono è confinato in una canna d’organo, o qualcosa di simile, vi è più di un modo in cui il suono può vibrare, ma per ciascun modo del genere vi è una determinata frequenza. Così un oggetto in cui le onde sono confinate ha certe frequenze di risonanza. È dunque una proprietà delle onde confinate in un luogo delimitato – argomento su cui più avanti discuteremo in dettaglio con le formule – di esistere soltanto a determinate frequenze. E poiché esiste la relazione generale tra le frequenze dell’ampiezza e l’energia, non siamo sorpresi di trovare determinate energie associate agli elettroni legati negli atomi.

38.6

Implicazioni filosofiche

Consideriamo brevemente alcune implicazioni filosofiche della meccanica quantistica. Come sempre, vi sono due aspetti del problema: uno si configura nell’implicazione filosofica che riguarda la fisica, e l’altro, nell’estrapolazione di questioni filosofiche ad altri campi. Quando le idee filosofiche collegate alla scienza sono trascinate in un altro campo, esse vengono di solito completamente travisate. Di conseguenza limiteremo il più possibile le nostre osservazioni alla fisica stessa. Prima di tutto, l’aspetto più interessante è l’idea del principio di indeterminazione; il fatto di fare un’osservazione altera il fenomeno. È sempre stato noto che il fatto di fare osservazioni altera un fenomeno, ma il punto è che l’effetto non può essere trascurato o minimizzato o diminuito ad arbitrio risistemando l’apparato. Quando osserviamo un certo fenomeno non possiamo fare a meno di disturbarlo in una certa quantità minima, e il disturbo è necessario per la consistenza del punto di vista. L’osservatore fu talvolta importante nella fisica prequantistica, ma solo in senso piuttosto banale. Fu sollevato il problema: se un albero in una foresta cade e non vi è nessuno a sentirlo cadere, esso fa rumore? Un vero albero che cade in una vera foresta, fa rumore naturalmente, anche se lì non c’è nessuno. Anche se nessuno è presente per sentirlo cadere, rimangono altre tracce. Il suono scuoterà delle foglie, e qualora fossimo abbastanza attenti, da qualche parte troveremmo che qualche spina ha sfregato contro una foglia producendo un minuscolo graffio che non potrebbe venire spiegato se non assumendo che la foglia ha vibrato. Così, in un certo senso, dovremmo ammettere che un suono è stato prodotto. Potremmo chiedere: c’è stata una sensazione del suono? No, le sensazioni, presumibilmente, hanno a che fare con la coscienza. E se le formiche siano coscienti o se vi fossero formiche nella foresta, o se fosse cosciente l’albero, non lo sappiamo. Lasciamo il problema come sta. Un’altra cosa che qualcuno ha sottolineato, dallo sviluppo della meccanica quantistica, è l’idea che non dovremmo parlare di cose che non siamo in grado di misurare. (In realtà anche la teoria della relatività lo ha affermato.) A meno che una cosa non possa venire determinata per mezzo di misure, essa non trova posto in una teoria. E dal momento che un valore esatto della quantità di moto di una particella localizzata non può essere determinato mediante misure, esso dunque non trova posto nella teoria. L’idea che questo fosse lo sbaglio della teoria classica è una posizione errata. È un’analisi superficiale della situazione. Il puro fatto che non siamo in grado di misurare posizione e quantità di moto con esattezza non significa a priori che non sia possibile parlarne. Significa unicamente che non occorre che ne parliamo. La situazione delle scienze è questa: un’idea che non possa venire misurata o riferita direttamente all’esperimento può essere utile o può non esserlo. Non occorre che essa sia presente in una teoria. In altre parole, immaginiamo di paragonare la teoria classica del mondo e quella quanto-meccanica e supponiamo che dal punto di vista sperimentale sia vero che siamo in grado di misurare posizione e quantità di moto solo in modo inesatto. Il problema è se le idee dell’esatta posizione di una

© 978-8808-22107-0

38.6 • Implicazioni filosofiche

particella e della sua esatta quantità di moto siano valide o no. La teoria classica riconosce queste idee; la teoria quantistica, no. Ciò non significa, per se stesso, che la fisica classica sia sbagliata. Quando la nuova meccanica quantistica fu scoperta, i classici – che comprendevano tutti a eccezione di Heisenberg, Schrödinger e Born – dissero: «Guardate che la vostra teoria non è per niente buona perché non siete in grado di rispondere a domande quali: qual è l’esatta posizione di una particella?, per quale foro passa?, e altre». La risposta di Heisenberg fu: «Non occorre che io risponda a domande del genere, perché dal punto di vista sperimentale, non potete fare una domanda del genere». È ciò che non dobbiamo fare. Considerate due teorie (a) e (b); (a) contiene un’idea che non si può controllare direttamente ma che è usata nell’analisi, e l’altra, (b), non contiene quell’idea. Se esse non si accordano nelle predizioni, non si potrebbe affermare che (b) è sbagliata perché non può spiegare l’idea che è in (a), infatti quell’idea è una delle cose che non si possono verificare direttamente. È sempre bene sapere quali siano le idee che non si possono verificare direttamente, ma non è necessario sopprimerle tutte. Non è vero che si possa perseguire la scienza completamente facendo uso solo di quei concetti che sono direttamente suscettibili di esperimento. Nella meccanica quantistica stessa vi è un’ampiezza della funzione dell’onda, vi è un potenziale e vi sono molti costrutti che non possiamo misurare direttamente. Il fondamento di una scienza è la sua capacità di predire. Predire significa dire ciò che accadrà in un esperimento che non è mai stato fatto. Come possiamo fare ciò? Assumendo di sapere che cosa c’è, indipendentemente dall’esperimento. Dobbiamo estrapolare gli esperimenti a una regione in cui non sono stati fatti. Dobbiamo prendere i nostri concetti ed estenderli a zone in cui non sono ancora stati verificati. Se non facciamo così, non abbiamo predizioni. Quindi fu cosa perfettamente sensata per i fisici classici procedere tranquillamente e supporre che la posizione – che ovviamente significa qualcosa per una palla da «baseball» – avesse un significato anche per un elettrone. Non si trattò di stupidità. È stato un procedimento sensato. Oggi noi diciamo che la legge della relatività è ritenuta vera a tutte le energie, ma può darsi che un giorno capiti qualcuno a dirci com’eravamo stupidi. Non sappiamo in che punto siamo «stupidi» finché non «allunghiamo il collo»(1) , e quindi l’idea fondamentale è di allungare il collo. E l’unico modo di trovare che siamo in errore è quello di scoprire quali sono le nostre predizioni. È assolutamente necessario costruire. Abbiamo già fatto alcune osservazioni a proposito dell’indeterminazione della meccanica quantistica. Vale a dire, del fatto che non siamo ora in grado di predire che accadrà in una data circostanza fisica preparata il più accuratamente possibile. Se abbiamo un atomo in uno stato eccitato e che sta quindi per emettere un fotone, non possiamo dire quando emetterà il fotone. Esso ha una certa ampiezza per emettere il fotone in un qualsiasi momento, e noi possiamo soltanto predire una probabilità di emissione, non possiamo predire il futuro esattamente. Ciò ha dato origine a ogni specie di assurdità e interrogativi sul significato del libero arbitrio, e all’idea che il mondo è incerto. Naturalmente dobbiamo sottolineare che anche la fisica classica è indeterminata, in un certo senso. Si pensa di solito che quest’indeterminatezza, per cui ci è impossibile predire il futuro, è un importante fatto quanto-meccanico, e si dice che ciò spiega il comportamento della mente, le sensazioni di libero arbitrio ecc. Ma se il mondo fosse classico – se le leggi della meccanica fossero classiche – non c’è alcuna evidenza assoluta che la mente non sentirebbe più o meno alla stessa maniera. È vero, dal punto di vista classico, che se conoscessimo la posizione e la velocità di tutte le particelle del mondo, o di una scatola di gas, potremmo predire esattamente che cosa accadrebbe. E di conseguenza il mondo classico è deterministico. Immaginiamo, comunque, di avere un’esattezza finita e di non sapere esattamente dove si trova anche un solo atomo per esempio a una parte su un miliardo. Allora mentre procede questo colpisce un altro atomo, e poiché non ne conoscevamo la posizione con approssimazione migliore di uno su un miliardo dopo la collisione troviamo un errore ancora maggiore nella posizione. E quello, naturalmente, aumenta nella collisione successiva, sicché se cominciamo con un errore minuscolo esso rapidamente s’ingrandisce fino a una grandissima indeterminazione. Per fare un esempio: se dell’acqua cade in una diga, essa spruzza intorno. Se ci troviamo lì vicino di tanto in tanto una goccia ci verrà a (1) «To stick one’s neck out», letteralmente allungare il collo in fuori (sporgendo la testa) significa «esporsi a un rischio». In questo caso ovviamente significa tirare le conseguenze della teoria e fare predizioni, col rischio di trovarle sbagliate. (N.d.T.)

403

404

Capitolo 38 • Relazione fra i punti di vista ondulatorio e corpuscolare

© 978-8808-22107-0

cadere sul naso. Ciò sembra accadere del tutto a casaccio, ma un tale comportamento verrebbe predetto da leggi puramente classiche. L’esatta posizione di tutte le gocce dipende dai precisi movimenti dell’acqua prima che essa giunga sulla diga. Come? Nella caduta, le irregolarità più piccole vengono ingrandite, sicché le cose vanno del tutto a casaccio. È evidente che non possiamo predire realmente la posizione delle gocce a meno che non conosciamo il moto dell’acqua con assoluta esattezza. Per parlare con maggior precisione, data una precisione arbitraria esatta, non importa come, si può trovare un tempo lungo quanto basta perché non sia possibile fare predizioni valevoli per quel tempo così lungo. Ora, il punto è che tale durata di tempo non è molto grande. Se la precisione è di una parte su un miliardo, non è che il tempo sia di milioni d’anni. Il tempo, infatti, va solo logaritmicamente con l’errore e risulta che solo in un tempo molto, molto piccolo perdiamo tutte le informazioni. Se si prende la precisione di uno su miliardi e miliardi e miliardi – non importa quanti miliardi desideriamo, purché a un certo punto ci fermiamo – troveremo un tempo minore di quello che occorse per stabilire la precisione – dopodiché non potremo più predire che accadrà! Pertanto non è giusto dire che dall’evidente libertà e indeterminatezza della mente umana, avremmo dovuto renderci conto che la fisica classica «deterministica» non poteva sperare di comprenderla mai, e accogliere la meccanica quantistica come una liberazione da un universo «completamente meccanicistico». Perché già nella meccanica classica, da un punto di vista pratico, vi era indeterminabilità.

La teoria cinetica dei gas

39.1

Proprietà della materia

Con questo capitolo daremo inizio a un argomento nuovo che ci terrà impegnati per un certo tempo. Si tratta della prima parte dell’analisi delle proprietà della materia dal punto di vista fisico: in essa, riconoscendo che la materia è composta di moltissimi atomi, o parti elementari, che interagiscono elettricamente e obbediscono alle leggi della meccanica, cerchiamo di capire perché mai i diversi aggregati di atomi si comportino come fanno. È evidente che si tratta di un argomento arduo, e sottolineiamo fino dal principio che si tratta, infatti, di un argomento estremamente arduo, e che dovremo affrontarlo in maniera diversa da come abbiamo affrontato gli altri argomenti finora. Nel caso della meccanica e in quello della luce fummo in grado di cominciare con l’esposizione precisa di alcune leggi, come le leggi di Newton, o la formula del campo prodotto da una carica accelerata, tramite le quali fu possibile comprendere nella sua essenza un’intera serie di fenomeni, e che produssero una base alla nostra comprensione della meccanica e della luce da quel momento in poi. Vale a dire che potremo impararne di più, più avanti, però non apprenderemo una fisica diversa, ma soltanto metodi migliori di analisi matematica per trattare la situazione. Non possiamo usare questo metodo con efficacia nello studio delle proprietà della materia. Possiamo studiare la materia soltanto in modo assai elementare; si tratta di un argomento troppo complicato per analizzarlo direttamente partendo dalle sue leggi fondamentali specifiche, che non sono altro che le leggi della meccanica e dell’elettricità. Ma queste sono un po’ troppo lontane dalle proprietà che desideriamo studiare: occorrono troppi passaggi per giungere dalle leggi di Newton alle proprietà della materia e questi passaggi sono, in se stessi, abbastanza complicati. Cominceremo ad affrontare alcuni di questi passaggi, ma mentre molte delle nostre analisi saranno del tutto esatte, nel procedere esse diventeranno sempre meno esatte. Arriveremo ad avere una comprensione soltanto approssimativa delle proprietà della materia. Una delle ragioni che abbiamo per eseguire l’analisi in maniera così imperfetta consiste nel fatto che la matematica che la riguarda richiede una profonda comprensione della teoria della probabilità; noi non abbiamo l’intenzione di sapere dove in realtà si stia muovendo ogni atomo, ma piuttosto quanti, in media, si muovono qua e là e quali siano le probabilità per effetti diversi. Sicché questo argomento implica la conoscenza della teoria della probabilità; ma la nostra matematica non è ancora del tutto all’altezza e non vogliamo forzarla troppo. In secondo luogo, e ciò è più importante da un punto di vista fisico, il vero comportamento degli atomi non è in armonia con la meccanica classica, ma con quella quantistica, e non ci è possibile arrivare alla comprensione corretta dell’argomento finché non comprendiamo la meccanica quantistica. Qui, a differenza del caso delle palle da biliardo e delle automobili, la differenza tra le leggi della meccanica classica e quelle della meccanica quantistica è molto importante e significativa, di modo che molte cose che dedurremo dalla fisica classica saranno fondamentalmente sbagliate. Di conseguenza, certe cose andranno in parte disimparate; comunque, in ogni caso indicheremo quand’è che un risultato è sbagliato, sì da sapere proprio dove sono i «limiti». Una delle ragioni per cui abbiamo trattato la meccanica quantistica nei capitoli precedenti è stata quella di dare un’idea del perché, più o meno, la meccanica classica sia sbagliata nelle varie direzioni.

39

406

Capitolo 39 • La teoria cinetica dei gas

© 978-8808-22107-0

Perché trattiamo l’argomento, ora? Perché non aspettare sei mesi o un anno, finché non abbiamo una maggior padronanza della matematica probabilistica e impariamo un po’ di meccanica quantistica, per poterlo affrontare poi in maniera più fondamentale? La risposta è che si tratta di un argomento difficile e il miglior modo di apprenderlo è quello di apprenderlo adagio! La prima cosa da fare è procurarsi qualche idea, più o meno, di ciò che dovrebbe succedere in circostanze diverse, e poi, più tardi, quando conosceremo meglio le leggi, le formuleremo meglio. Chiunque volesse analizzare le proprietà della materia in un vero problema potrebbe voler cominciare con lo scrivere le equazioni fondamentali per poi cercare di risolverle con la matematica. Benché alcuni tentino di usare un tale metodo, essa fallisce in questo campo; i risultati brillanti vanno a coloro che cominciano da un punto di vista fisico, a chi ha un’idea approssimativa di dove ci si sta dirigendo e quindi comincia col fare il giusto tipo di approssimazioni, sapendo ciò che è importante e ciò che lo è meno in una data situazione complicata. Questi problemi sono così complessi che vale la pena di averne una comprensione elementare, sia pure inesatta e incompleta, e così questo sarà un argomento che esamineremo progressivamente, ogni volta con maggiore esattezza mentre procederemo nel nostro corso di fisica. Un’altra ragione per affrontare l’argomento fin da ora è che abbiamo già fatto uso di molte di queste idee in chimica, per esempio, e ne abbiamo perfino sentito parlare al liceo. È interessante conoscere le basi fisiche di queste cose. Per fare un esempio interessante, tutti noi sappiamo che volumi uguali di gas, alla stessa pressione e temperatura, contengono lo stesso numero di molecole. La legge delle proporzioni multiple per cui quando due gas si combinano in una reazione chimica, i volumi necessari stanno sempre in semplici proporzioni intere fu alla fine intesa da Avogadro come significante che uguali volumi hanno uguali numeri d’atomi. Ora, perché hanno uguali numeri d’atomi? Possiamo dedurre dalle leggi di Newton che il numero di atomi dovrebbe essere uguale? In questo capitolo ci volgeremo specificamente a quell’argomento. Nei capitoli successivi tratteremo vari altri fenomeni che implicano pressioni, volumi, temperatura e calore. Troveremo pure che l’argomento può venire affrontato da un punto di vista non atomico e che vi sono molte interdipendenze tra le proprietà delle sostanze. Per esempio, quando comprimiamo qualche cosa, essa si scalda; se noi la riscaldiamo, essa si espande. Tra questi due fatti, vi è una interdipendenza che può essere dedotta indipendentemente dal meccanismo che vi è alla base. Questo argomento è denominato termodinamica. La più approfondita comprensione della termodinamica viene, naturalmente, dal comprendere l’effettivo meccanismo che vi sta alla base, e questo è ciò che faremo: prenderemo il punto di vista atomico fin dall’inizio e lo useremo per capire le varie proprietà della materia e le leggi della termodinamica. Trattiamo dunque le proprietà dei gas dal punto di vista delle leggi della meccanica di Newton.

39.2

La pressione di un gas

Per prima cosa, sappiamo che un gas esercita una pressione, e dobbiamo comprendere chiaramente a che cosa ciò sia dovuto. Se le nostre orecchie fossero alcune volte più sensibili, udremmo un rumore di scroscio continuo. L’evoluzione non ha sviluppato l’orecchio fino a quel punto, perché sarebbe inutile se esso fosse tanto più sensibile – udremmo un chiasso continuo. La ragione di ciò sta nel fatto che il timpano è in contatto con l’aria, e l’aria è un insieme di molecole in perenne movimento che sbattono contro i timpani. Nel battere contro i timpani esse danno origine a un tambureggiamento irregolare – bum, bum, bum – che non udiamo perché gli atomi sono tanto piccoli, e la sensibilità dell’orecchio non è affatto sufficiente a percepirlo. Il risultato di questo continuo bombardamento è di allontanare la membrana del timpano, ma poiché naturalmente vi è un uguale bombardamento continuo di atomi dall’altra parte del timpano, la forza netta che si esercita su di esso è zero. Se dovessimo togliere l’aria da una parte, o variare le rispettive quantità d’aria dalle due parti, allora il timpano sarebbe spinto da una parte o dall’altra, perché il bombardamento da un lato sarebbe maggiore che dall’altro. Talvolta avvertiamo questo senso di disagio quando saliamo troppo in fretta in ascensore o in aereo, specialmente se abbiamo anche un brutto raffreddore (quando abbiamo il raffreddore, l’infiammazione chiude il condotto che

39.2 • La pressione di un gas

© 978-8808-22107-0

mette in comunicazione l’aria all’interno del timpano con quella esterna attraverso la gola, sicché le due pressioni non riescono subito a uguagliarsi). Nel considerare come analizzare la situazione dal punto di vista quantitativo, immaginiamo di avere un volume di gas in una scatola, a un estremo della quale vi è un pistone che è possibile muovere (FIGURA 39.1). Vorremmo trovare quale sia la forza che agisce sul pistone in conseguenza del fatto che nella scatola vi sono degli atomi. Il volume della scatola è V , e poiché gli atomi si muovono all’intorno internamente alla scatola con velocità diverse, essi urtano contro il pistone. Immaginiamo che non vi sia nulla, il vuoto, all’esterno del pistone. Che ne consegue? Se il pistone fosse lasciato stare e nessuno lo reggesse, ogniqualvolta esso venisse colpito raccoglierebbe una piccola quantità di moto e a poco a poco verrebbe spinto fuori dalla scatola. Quindi per impedire di farlo uscire dalla scatola, dobbiamo trattenerlo con una forza F. Il problema è: con quanta forza? Un modo di esprimere la forza è quello di parlare della forza per area unitaria: se A è l’area del pistone, la forza che agisce sul pistone sarebbe un numero moltiplicato per l’area. Definiamo, dunque, la pressione come la forza che dobbiamo applicare a un pistone, divisa per l’area del pistone: F P= (39.1) A Per accertarci che comprendiamo l’idea (dobbiamo comunque derivarla per un altro scopo), il lavoro differenziale dW fatto sul gas nel comprimerlo muovendo il pistone di una quantità differenziale dx sarebbe la forza moltiplicata per la distanza di cui lo comprimiamo, che, secondo la (39.1) sarebbe la pressione per l’area, per la distanza, che è uguale a meno la pressione per la variazione del volume: dW = F ( dx) = P A dx = P dV

(39.2)

(L’area A moltiplicata per la distanza dx è uguale alla variazione di volume.) C’è il segno meno perché, quando comprimiamo, facciamo diminuire il volume; se ci pensiamo, possiamo vedere che se un gas viene compresso, viene eseguito un lavoro sul gas. Che forza dobbiamo applicare per bilanciare l’urto delle molecole? Da ogni collisione il pistone ricava una certa quantità di moto. Una certa quantità di moto al secondo si riverserà nel pistone ed esso comincerà a muoversi. Per impedirgli di muoversi, dobbiamo cedergli dall’esterno il medesimo valore di quantità di moto al secondo con la nostra forza. Naturalmente, la forza è il valore della quantità di moto al secondo che dobbiamo immettere. La cosa si può vedere in altro modo: se lasciamo andare il pistone esso acquisterà velocità a causa dei bombardamenti; a ogni collisione acquista un po’ più di velocità e quindi la velocità aumenta. La rapidità con cui il pistone acquista velocità, o accelera, è proporzionale alla forza che agisce su di esso. Così, vediamo che la forza, di cui già abbiamo detto essere pari alla pressione moltiplicata l’area, è uguale alla quantità di moto al secondo comunicata al pistone dalle collisioni delle molecole. Calcolare le quantità di moto al secondo è cosa facile – possiamo farlo in due tappe: prima, troviamo la quantità di moto comunicata al pistone dall’urto di un particolare atomo col pistone, poi dobbiamo moltiplicare per il numero di collisioni al secondo che gli atomi hanno con la parete. La forza sarà il prodotto di questi due fattori. Ora, vediamo quali sono i due fattori: in primo luogo immagineremo che il pistone sia un perfetto «riflettore» per gli atomi. Se non lo è l’intera teoria è sbagliata, il pistone comincerà a scaldarsi e le cose cambieranno, ma più avanti, quando si stabilirà l’equilibrio, il risultato netto sarà che le collisioni risultano in realtà perfettamente elastiche. In media, ogni particella che arriva, riparte con la stessa energia. Quindi ci figureremo che il gas si trovi in una condizione di equilibrio e che non perdiamo energia verso il pistone perché il pistone è in stato di quiete. In circostanze del genere, se una particella arriva con una certa velocità, essa si allontana con la medesima velocità e, diremo, con la medesima massa. Se v è la velocità di un atomo e vx è la componente x di v, allora mvx sarà la componente x della quantità di moto «incidente»; ma abbiamo anche un’uguale componente di quantità di moto «uscente» e quindi la quantità di moto complessiva comunicata al pistone dalla particella in una collisione è 2mvx , perché la particella viene «riflessa». Ora, ci occorre il numero di collisioni fatte dagli atomi in un secondo o in una certa quantità di tempo dt; allora divideremo per dt. Quanti atomi colpiscono il pistone? Supponiamo che vi siano

407

A V x

F dx

39.1 Atomi di un gas in una scatola con un pistone privo di attrito. FIGURA

408

Capitolo 39 • La teoria cinetica dei gas

© 978-8808-22107-0

N atomi nel volume V , o n = N/V in ogni unità di volume. Per trovare quanti atomi colpiscono il pistone, osserviamo che, data una certa quantità di tempo t, se una particella ha una certa velocità in direzione del pistone lo colpirà durante il tempo t, purché essa sia abbastanza vicina. Se si trova troppo lontana, essa percorrerà soltanto una parte del cammino verso il pistone, nel tempo t, ma non raggiungerà il pistone. Di conseguenza è chiaro che solo quelle molecole che si trovano entro una distanza vx t dal pistone colpiranno il pistone nel tempo t. Quindi, il numero di collisioni in un tempo t è pari al numero degli atomi che si trovano nella regione entro la distanza vx t, e, dal momento che l’area del pistone è A, il volume occupato dagli atomi che colpiranno il pistone è vx t A. Ma il numero degli atomi che colpiranno il pistone è quel volume moltiplicato il numero di atomi per unità di volume, nvx t A. Naturalmente non vogliamo il numero di atomi che colpiscono in un tempo t, bensì il numero di atomi che colpiscono in un secondo, quindi, per ottenere nvx A, divideremo per il tempo t. (Questo tempo t potrebbe essere reso brevissimo; se vogliamo essere più raffinati, lo chiamiamo dt e poi differenziamo, ma è la stessa cosa.) Così troviamo che la forza è F = nvx A · 2mvx (39.3) Guardate, la forza è proporzionale all’area, se teniamo fissa la densità delle particelle nel cambiare l’area. La pressione è, allora, P = 2nmvx2 (39.4) Ora notiamo una piccola difficoltà in quest’analisi: per prima cosa, le molecole hanno tutte velocità diversa e si muovono in direzioni diverse. Quindi, tutti i vx2 saranno diversi! Pertanto, ciò che dobbiamo fare, naturalmente, è fare una media dei vx2 , dato che ognuno di essi porta il suo contributo. Ciò che vogliamo è il quadrato di vx , mediato su tutte le molecole: P = nm hvx2 i

(39.5)

Abbiamo dimenticato di includere il fattore 2? No; di tutti gli atomi, solo la metà è diretta verso il pistone. L’altra è diretta dall’altra parte, quindi il numero di atomi per unità di volume che colpiscono il pistone è soltanto n/2. Ora, poiché gli atomi rimbalzano intorno, è chiaro che non vi è nulla di particolare nella «direzione» x; gli atomi possono anche muoversi su e giù, avanti e indietro, dentro e fuori. Di conseguenza, sarà vero che hvx2 i, il moto medio degli atomi in una direzione, e la media nelle altre due direzioni, saranno tutti uguali: hvx2 i = hvy2 i = hvz2 i

(39.6)

È solo una questione matematica piuttosto complicata, dunque, il fatto di notare che essi sono ciascuno uguale a un terzo della loro somma, la quale è, naturalmente, il quadrato dell’intensità della velocità: 1 1 hvx2 i = hvx2 + vy2 + vz2 i = hv 2 i (39.7) 3 3 Ciò presenta il vantaggio che non dobbiamo preoccuparci di alcuna particolare direzione, e quindi riscriviamo la nostra formula della pressione in questa forma: * + 2 1 P= n mv 2 (39.8) 3 2 La ragione per cui abbiamo scritto come hmv 2 /2i l’ultimo fattore è che questo rappresenta l’energia cinetica del moto del centro di massa della molecola. Di conseguenza troviamo che * + 2 1 PV = N mv 2 (39.9) 3 2 Con questa equazione, se conosciamo le velocità, possiamo calcolare quant’è la pressione. Per fare un esempio molto semplice, prendiamo il gas elio, o qualsiasi altro gas, come il vapore di mercurio, o il vapore di potassio a temperatura abbastanza alta, o l’argo, in cui tutte le

39.2 • La pressione di un gas

© 978-8808-22107-0

molecole sono atomi singoli, per cui possiamo supporre che nell’atomo non vi è moto interno. Se avessimo una molecola complessa, potrebbe esserci qualche moto interno, vibrazioni mutue o qualche altra cosa. Supponiamo di potere trascurare ciò; si tratta, veramente, di una faccenda seria, su cui dovremo ritornare, ma risulta che va bene. Supponiamo che il moto interno degli atomi possa essere trascurato e che, di conseguenza, a questo scopo, l’energia cinetica del moto del centro di massa sia l’unica energia presente. Quindi, per un gas monoatomico, l’energia cinetica è l’energia totale. In generale, chiameremo U l’energia totale (talvolta essa è denominata energia interna totale – ci si può chiedere come mai, dal momento che non esiste un’energia esterna dei gas), cioè l’energia complessiva di tutte le molecole contenute nel gas, o nell’oggetto, qualunque esso sia. Per un gas monoatomico supporremo che l’energia totale U sia pari al numero di atomi moltiplicato per l’energia cinetica di ciascuno, poiché trascuriamo ogni possibilità di eccitazione o moto interno agli atomi stessi. In tali circostanze, avremmo PV =

2 U 3

(39.10)

Incidentalmente, qui possiamo fermarci e trovare la risposta alla domanda che segue: immaginiamo di prendere un barattolo di gas e di comprimere il gas lentamente; quale sarà la pressione che ci occorre per ridurre il volume? È facile scoprirlo, dal momento che la pressione è 2/3 dell’energia diviso V . Mentre lo comprimiamo, noi eseguiamo lavoro sul gas e perciò aumentiamo l’energia U. Quindi avremo un certo genere di equazione differenziale: se cominciamo in una data situazione con una certa energia e un certo volume, allora conosciamo la pressione. Ora, cominceremo a comprimere, ma nel momento stesso in cui lo facciamo, l’energia U aumenta e il volume V diminuisce, sicché la pressione salirà. Dovremo, dunque, risolvere un’equazione differenziale, e la risolveremo fra un momento. Dobbiamo prima sottolineare, comunque, che mentre comprimiamo questo gas, supponiamo che tutto il lavoro vada ad accrescere l’energia degli atomi all’interno. Potremmo chiederci: «Non è forse inevitabile? Dove potrebbe andare, altrimenti?». Risulta che può andare altrove. Attraverso le pareti vi sono quelle che chiamiamo «perdite di calore»: gli atomi caldi (vale a dire, che si muovono velocemente), i quali bombardano le pareti, riscaldano le stesse, e l’energia se ne va. Per il momento immagineremo che tale non sia il nostro caso. Al fine di una generalità un po’ più ampia, benché stiamo ancora facendo alcune ipotesi molto particolari, per quanto riguarda il nostro gas non scriveremo la (39.10) bensì PV = (

1) U

(39.11)

Si scrive ( 1) U per ragioni convenzionali, perché più avanti tratteremo di alcuni altri casi in cui il numero davanti a U non sarà 2/3 ma un numero diverso. Quindi, per fare le cose in generale, lo chiameremo 1, dato che viene chiamato così da circa cent’anni. Questo , dunque, sarà 5/3, poiché per un gas monatomico come l’elio 5/3 1 = 2/3. Abbiamo già osservato che, quando comprimiamo un gas, il lavoro fatto è P dV . Una compressione in cui non venga aggiunta o sottratta energia termica è chiamata compressione adiabatica, dal greco a (non) + dia (attraverso) + bainein (andare). (La parola adiabatica è usata in fisica in parecchi modi, e talvolta è difficile capire cosa vi sia di comune in essi.) Vale a dire, in una compressione adiabatica tutto il lavoro eseguito va a cambiare l’energia interna. Questo è il punto – che non vi sono altre perdite di energia – sicché allora avremo P dV = Ma dal momento che U=

dU PV 1

possiamo scrivere dU =

P dV + V dP 1

(39.12)

409

410

Capitolo 39 • La teoria cinetica dei gas

© 978-8808-22107-0

Perciò abbiamo P dV =

P dV + V dP 1

oppure, riordinando i termini, P dV = V dP ovvero Fortunatamente, assumendo che integrare: l’operazione dà

dV dP + =0 (39.13) V P sia costante, com’è per un gas monoatomico, possiamo ln V + ln P = ln C

dove ln C è la costante d’integrazione. Se prendiamo l’esponenziale di ambo i membri, ricaviamo la legge PV = C (costante) (39.14) In altre parole, in condizioni adiabatiche, dove la temperatura aumenta con la compressione poiché il calore non va disperso, la pressione moltiplicata per il volume elevato a 5/3 è una costante per un gas monoatomico! Benché si sia ricavato per via teorica, questo è, in realtà, il modo in cui i gas monoatomici si comportano sperimentalmente.

39.3

Compressibilità della radiazione

Possiamo dare un altro esempio della teoria cinetica di un gas, un esempio che non è tanto usato in chimica, ma è usato in astronomia. Dentro a una scatola in cui la temperatura è assai alta, abbiamo un gran numero di fotoni. (La scatola è, naturalmente, il gas contenuto in una stella molto calda. Il Sole non è abbastanza caldo; vi sono ancora troppi atomi, ma a temperature ancora più alte in certe stelle molto calde, possiamo trascurare gli atomi e immaginare che gli unici oggetti presenti nella scatola siano i fotoni.) Ora dunque, un fotone ha una certa quantità di moto p. (Ci troviamo sempre in un terribile pasticcio quando trattiamo la teoria cinetica: p è la pressione, ma p è anche la quantità di moto; v è il volume, ma anche la velocità; T è la temperatura, ma è anche l’energia cinetica o il tempo o il momento; bisogna non perdere la testa!) Questo p è la quantità di moto ed è un vettore. Ripercorrendo la stessa analisi di prima, è la componente x del vettore p che dà il «colpo», e il doppio della componente x del vettore p è la quantità di moto comunicata col colpo. Così 2px sostituisce 2mvx , e nel valutare il numero delle collisioni, vx è ancora vx , sicché, quando arriviamo in fondo, troviamo che la pressione nell’equazione (39.4) è, invece, P = 2npx vx

(39.15)

Quindi, nel fare la media, diventa n per la media di px vx (lo stesso fattore 2) e, finalmente, inserendo le altre due direzioni, troviamo PV =

N h p · vi 3

(39.16)

Ciò concorda con la formula (39.9), perché la quantità di moto è mv; è un po’ più generale, questo è tutto. La pressione moltiplicata per il volume è uguale al numero totale degli atomi moltiplicato per (p · v)/3, mediato. Ora, per i fotoni, cos’è ( p · v)? La quantità di moto e la velocità sono nella stessa direzione, e la velocità è quella della luce, così questa è la quantità di moto di ciascuno degli oggetti, moltiplicato la velocità della luce. La quantità di moto moltiplicata per la velocità della luce di ogni fotone è la sua energia: E = pc, sicché questi termini sono le energie di ciascuno dei fotoni, e, naturalmente, noi dovremmo prendere un’energia media moltiplicata per il numero dei fotoni. Quindi abbiamo 1/3 dell’energia contenuta nel gas: PV =

U (gas di fotoni) 3

(39.17)

39.4 • Temperatura ed energia cinetica

© 978-8808-22107-0

Per i fotoni, allora, dato che nella (39.11) ( 1) è 1/3, e quindi la radiazione in una scatola obbedisce alla legge: PV 4/3 = C

411

= 4/3, abbiamo scoperto che (39.18)

Così conosciamo la compressibilità della radiazione! È quella che viene usata nell’analisi del contributo della pressione di radiazione in una stella, è così che la calcoliamo, è così che varia quando comprimiamo. Che cose meravigliose sono ormai in nostro potere!

39.4

Temperatura ed energia cinetica

Finora non abbiamo trattato della temperatura; abbiamo di proposito evitato la temperatura. Quando comprimiamo un gas, sappiamo che l’energia delle molecole aumenta, e siamo soliti dire che il gas diventa più caldo; vorremmo sapere che ha a che fare ciò con la temperatura. Se tentiamo di fare l’esperimento, non adiabaticamente ma nel modo che chiamiamo a temperatura costante, cosa facciamo? Sappiamo che se si prendono due scatole di gas e le si lascia l’una accanto all’altra abbastanza a lungo, anche se al principio esse si trovavano in stati che diciamo a temperature diverse, finiranno per arrivare alla stessa temperatura. Ora, che significa ciò? Ciò significa che esse raggiungono una condizione che raggiungerebbero se le lasciassimo stare abbastanza a lungo! Ciò che intendiamo per temperatura uguale è proprio questo: la condizione finale delle cose quando esse sono rimaste a interagire tra loro per un tempo abbastanza lungo. Consideriamo, ora, ciò che succede se abbiamo due gas in contenitori separati da un pistone mobile, come in FIGURA 39.2 (solo per semplicità, prenderemo due gas monoatomici, per esempio l’elio e il neon). Nel contenitore (1) gli atomi hanno massa m1 , velocità v1 e vi sono n1 atomi per unità di volume, mentre nell’altro contenitore gli atomi hanno massa m2 , velocità v2 e vi sono n2 atomi per unità di volume. Quali sono le condizioni per l’equilibrio? Ovviamente, il bombardamento dalla parte sinistra deve essere tale da muovere il pistone verso destra e comprimere l’altro gas finché la pressione non ostacoli il movimento, e l’oggetto andrà avanti e indietro così finché, a poco a poco, si fermerà in una posizione in cui le pressioni siano uguali da entrambi i lati. Sicché, possiamo fare in modo che le pressioni siano uguali; ciò significa soltanto che le energie interne per unità di volume sono uguali, o che i numeri n moltiplicati per le energie cinetiche medie di ciascuna parte sono uguali. Ciò che dobbiamo cercare di dimostrare, infine, è che i numeri stessi sono uguali. Fin qui, tutto quel che sappiamo è che i numeri moltiplicati per le energie cinetiche sono uguali: * + * + 1 1 2 2 n1 m1 v1 = n2 m2 v2 2 2 dalla (39.8), poiché le pressioni sono uguali. Dobbiamo renderci conto che questa non è la sola condizione finale ma che qualcosa d’altro deve accadere più lentamente quando si stabilisce il vero equilibrio completo, corrispondente a temperature uguali. Per comprendere il concetto, immaginiamo che la pressione dalla parte sinistra fosse provocata dal fatto di avere una densità molto alta, ma una bassa velocità. Con un n grande e un v piccolo, possiamo avere la stessa pressione che con un n piccolo e un v grande. Gli atomi possono muoversi lentamente ma essere raggruppati quasi l’uno a contatto dell’altro, oppure ve ne possono essere meno ma che colpiscono più forte. Le cose resteranno così indefinitamente? Dapprincipio potremmo pensare di sì, ma poi a ripensarci troviamo che abbiamo trascurato un punto importante. Vale a dire, che il pistone intermedio non subisce una pressione costante; esso si muove da una parte all’altra proprio come il timpano di cui parlavamo prima, poiché i colpi non sono assolutamente uniformi. Non vi è una pressione continua e costante, ma un tambureggiamento – la pressione varia, e quindi il pistone si muove a scatti. Immaginiamo che gli atomi dalla parte destra non si muovano molto, e che quelli di sinistra siano pochi, distanti tra loro e molto energici. Il pistone, di tanto in tanto, riceverà un forte impulso da sinistra e sarà spinto contro gli atomi lenti di destra, imprimendo a essi maggiore velocità. (Quando un atomo urta il pistone, esso o acquista o

(1)

(2)

39.2 Atomi di due differenti gas monoatomici sono separati da un pistone mobile. FIGURA

Capitolo 39 • La teoria cinetica dei gas

412

u1

u1

u2 u2

39.3 Collisione fra molecole disuguali, vista nel sistema del CM. u1 = |v1 vCM | u2 = |v2 vCM | FIGURA

© 978-8808-22107-0

perde energia, a seconda che il pistone si stia muovendo da un lato o dall’altro quando l’atomo lo colpisce.) Così, come risultato delle collisioni il pistone si ritrova a scattare, scattare, scattare e ciò scuote l’altro gas – dà energia agli altri atomi ed essi acquistano movimenti più veloci, fino a equilibrare gli scatti che il pistone sta loro imprimendo. Il sistema raggiunge un equilibrio in cui il pistone si muove a una velocità quadratica media tale che acquista energia dagli atomi circa nella stessa proporzione in cui la restituisce loro. Sicché il pistone raggiunge una certa irregolarità media nella velocità, e trovarla è problema nostro. Quando l’avremo veramente trovata, potremo risolvere meglio il nostro problema, perché i gas aggiusteranno le loro velocità finché la rapidità con cui essi tentano di versare energia l’uno nell’altro attraverso il pistone diventerà uguale. È veramente difficile descrivere in dettaglio il comportamento del pistone in questa circostanza specifica; benché sia semplice da comprendere idealmente, risulta un po’ più difficile da analizzare. Prima di analizzare questo, consideriamo un altro problema in cui abbiamo una scatola di gas, ma contenente, ora, due diversi tipi di molecole di masse m1 e m2 e velocità v1 e v2 e così via; vi è ora una relazione molto più stretta. Se tutte le molecole n. 2 sono immobili, tale condizione non è destinata a sussistere, perché esse saranno urtate dalle molecole n. 1 e quindi acquisteranno velocità. Se esse sono tutte molto più veloci delle molecole n.1, probabilmente neppure questa condizione durerà – esse ricederanno l’energia alle molecole n. 1. Dunque quando entrambi i gas sono contenuti nella stessa scatola, il problema è quello di cercare la regola che determini le velocità relative dei due. Anche questo è un problema assai difficile, ma lo risolveremo come segue. Per prima cosa considereremo il seguente sottoproblema (questo è di nuovo uno di quei casi in cui – non importa la deduzione – alla fine il risultato è molto semplice da ricordare, ma la deduzione è proprio ingegnosa). Immaginiamo di avere due molecole, di massa diversa, che vengono a collisione, e che l’urto sia osservato nel sistema del centro di massa (CM). Osserviamo l’urto nel CM allo scopo di togliere una complicazione. Come sappiamo dalle leggi dell’urto, per la conservazione della quantità di moto e dell’energia, dopo che le molecole sono venute a collisione, l’unico modo in cui si possono muovere è tale che ciascuna conserva la propria velocità originaria – e cambia solo la propria direzione. Così avremo una collisione media che ha l’aspetto di quella in FIGURA 39.3. Immaginiamo, per un momento, di osservare tutti gli urti con il CM a riposo. Supponiamo di immaginare che le molecole, inizialmente, stiano tutte muovendosi in senso orizzontale. Naturalmente, dopo la prima collisione alcune si muoveranno formando un certo angolo con la direzione iniziale. In altre parole, se esse andassero tutte in senso orizzontale, almeno alcune, più tardi, si muoverebbero in senso verticale. Ora, in qualche altra collisione, esse entrerebbero da un’altra direzione, e poi sarebbero deviate ancora a un altro angolo. Sicché, anche se fossero del tutto organizzate al principio, esse verrebbero sparse intorno, a tutti gli angoli, e quelle sparse verrebbero sparse ancora e ancora e ancora. Alla fine, quale sarà la distribuzione? Risposta: sarà ugualmente probabile trovare una qualsiasi coppia che si muove in una qualsiasi direzione dello spazio. Dopodiché ulteriori collisioni non potrebbero cambiare la distribuzione. È ugualmente probabile che esse vadano in tutte le direzioni, ma come possiamo dire questo? Naturalmente non vi è nessuna probabilità che vadano in una qualche direzione specifica, perché una direzione specifica è troppo esatta, sicché dobbiamo parlare per unità di «qualche cosa». L’idea è che qualsiasi area su una sfera centrata in un punto di collisione avrà esattamente tante molecole che l’attraversano quante ne ha un’altra area uguale sulla sfera. Così il risultato delle collisioni sarà di distribuire le direzioni in modo che aree eguali su una sfera abbiamo uguali probabilità. Incidentalmente, se vogliamo soltanto trattare la direzione originaria e una qualche altra direzione a un angolo ✓ da essa, è una proprietà interessante il fatto che il differenziale dell’area di una sfera di raggio unitario sia sen ✓ d✓ · 2⇡ (FIGURA 32.1), e che sen ✓ d✓ sia lo stesso che il differenziale di cos ✓. Quindi ciò significa che è egualmente probabile che il coseno dell’angolo ✓ tra due direzioni qualsiasi abbia qualsiasi valore tra 1 e +1. Successivamente, dobbiamo preoccuparci del caso reale, in cui non abbiamo la collisione nel sistema CM, bensì due atomi che si vengono incontro con velocità vettoriali v1 e v2 . Che accade ora? Possiamo analizzare questa collisione con le velocità vettoriali v1 e v2 nella maniera seguente: prima diciamo che c’è un certo CM; la velocità del CM è data dalla velocità «media»,

39.4 • Temperatura ed energia cinetica

© 978-8808-22107-0

413

con pesi proporzionali alle masse, sicché la velocità di CM sarà vCM =

m1 v1 + m2 v2 m1 + m2

Se osserviamo questa collisione nel sistema CM, vedremo una collisione proprio uguale a quella di FIGURA 39.3, con una certa velocità relativa w. La velocità relativa è semplicemente v1 v2 . Ora, l’idea è che, in primo luogo, l’intero CM si stia muovendo e che nel CM c’è una velocità relativa w, e che le molecole vengono a collisione e ne escono in qualche nuova direzione. Tutto ciò accade mentre il CM continua a muoversi, senza alcuna variazione. Ora, quale distribuzione ne risulta? Dalla nostra discussione precedente concludiamo che: in equilibrio, tutte le direzioni di w relativamente alla direzione del moto del CM sono ugualmente probabili.(1) Non vi sarà alcuna particolare correlazione, alla fine, tra la direzione del moto della velocità relativa e quella del moto del CM. Se ci fosse, le collisioni, naturalmente, la sparpaglierebbero all’intorno, sicché essa risulterebbe offuscata. Quindi il coseno dell’angolo tra w e vCM in media è zero. Cioè hw · vCM i = 0 (39.19) Ma w · vCM può anche venire espresso con v1 e v2 : w · vCM =

(v1

v2 )(m1 v1 + m2 v2 ) (m1 v12 = m1 + m2

m2 v22 ) + (m2 m1 )(v1 · v2 ) m1 + m2

(39.20)

Per prima cosa, osserviamo v1 · v2 ; qual è la media di v1 · v2 ? Vale a dire, qual è la media della componente di velocità di una molecola nella direzione di un’altra? Senza dubbio vi è la stessa probabilità di trovare una data molecola che si muova in un senso o nell’altro. La media della velocità v2 in una qualsiasi direzione è zero. Quindi, sicuramente, nella direzione di v1 , v2 ha media zero. Sicché, la media di v1 · v2 è zero! Di conseguenza, concludiamo che la media di m1 v12 deve essere uguale alla media di m2 v22 . Vale a dire, l’energia cinetica media delle due deve essere uguale: * + * + 1 1 2 2 m1 v1 = m2 v2 (39.21) 2 2

Se in un gas abbiamo due specie di atomi, si può dimostrare, e riteniamo di averlo dimostrato, che la media dell’energia cinetica di uno è identica alla media dell’energia cinetica dell’altro, quando essi si trovino entrambi in equilibrio nello stesso gas contenuto nella medesima scatola. Ciò significa che quelli pesanti si muoveranno più lentamente di quelli leggeri; il che si può facilmente dimostrare sperimentando con «atomi» di massa diversa contenuti in una sacca d’aria. Ora vorremmo fare un altro passo avanti e dire che se abbiamo due diversi gas separati in una scatola, anch’essi avranno uguale energia cinetica media quando raggiungeranno finalmente l’equilibrio, anche se non sono nella stessa scatola. Possiamo trattare l’argomento in molti modi. Un modo consiste nel dire che se abbiamo un tramezzo fisso con un piccolo foro (FIGURA 39.4) tale che un gas possa filtrare attraverso il foro mentre l’altro no, perché le molecole sono troppo grosse, e se hanno raggiunto l’equilibrio, allora sappiamo che in una parte, dove sono mescolate, esse hanno la stessa energia cinetica media; ma alcune escono attraverso il foro senza perdita di energia cinetica, sicché l’energia cinetica media nel gas puro e in quello mescolato deve essere la stessa. Ciò non è troppo soddisfacente, perché per questo tipo di molecole potrebbero non esistere fori che separino un tipo dall’altro. Torniamo ora al problema del pistone. Possiamo presentare un argomento che dimostra che anche l’energia cinetica di questo pistone deve essere (1/2)m2 v22 . In realtà, quella sarebbe l’energia cinetica dovuta al moto puramente orizzontale del pistone, sicché, dimenticando il suo moto in 2 . Similmente, dall’equilibrio dall’altra parte, si su e in giù, dovrà essere uguale a (1/2)m2 v2x (1) Questo argomento, che fu quello usato da Maxwell, implica alcune sottigliezze. Benché la conclusione sia corretta, il risultato non segue puramente dalle considerazioni di simmetria di cui abbiamo fatto uso prima, poiché, andando in un sistema di riferimento che si muove attraverso il gas, potremmo trovare una distribuzione di velocità distorta. Non abbiamo trovato una dimostrazione semplice di questo risultato.

39.4 Due gas in una scatola con una membrana semipermeabile. FIGURA

414

Capitolo 39 • La teoria cinetica dei gas

© 978-8808-22107-0

2 . Sebbene questo non si trovi nel può dimostrare che l’energia cinetica del pistone è (1/2)m1 v1x mezzo del gas, ma da una parte, possiamo ancora argomentare, benché sia un po’ più difficile, che l’energia cinetica media del pistone e delle molecole di gas, come risultato di tutti gli urti, sono uguali. Se questo ancora non ci soddisfa, possiamo fare un esempio artificioso nel quale l’equilibrio è generato da un oggetto che può venir colpito da tutte le parti. Supponiamo di avere, conficcata attraverso il pistone, una sbarretta avente a ciascun estremo una palla, su un giunto cardanico scorrevole senza attrito. Ciascuna palla è tonda, come una molecola, e può essere colpita da tutte le parti. L’intero oggetto ha una certa massa totale m. Ora, come prima, abbiamo le molecole di gas con massa m1 e con massa m2 . Il risultato degli urti, per l’analisi che è stata fatta prima, è che l’energia cinetica di m, a causa delle collisioni con le molecole da una parte, deve essere in media (1/2)m1 v12 . Similmente, a causa delle collisioni con le molecole dall’altra parte, deve essere in media (1/2)m2 v22 . Quindi ambo le parti, quando sono in equilibrio termico, debbono avere la stessa energia cinetica. Così, sebbene abbiamo dimostrato questo risultato soltanto per un miscuglio di gas, esso si può estendere facilmente al caso in cui si hanno due gas differenti, separati, alla stessa temperatura. Quindi, quando abbiamo due gas alla medesima temperatura, le energie cinetiche medie dei moti dei CM sono uguali. L’energia cinetica media molecolare è una proprietà della sola «temperatura». Essendo una proprietà della temperatura e non del gas, la possiamo usare come definizione della temperatura. L’energia cinetica media di una molecola è così una certa funzione della temperatura. Ma chi ci dice quale scala usare per la temperatura? Possiamo definire arbitrariamente la scala della temperatura in modo che l’energia media sia proporzionale alla temperatura. Il modo migliore per farlo sarebbe chiamare «temperatura» l’energia media stessa: questa sarebbe la più semplice funzione possibile. Sfortunatamente, la scala della temperatura è stata scelta in modo diverso, così invece di chiamarla direttamente temperatura usiamo un fattore costante di conversione fra l’energia di una molecola e un grado di temperatura assoluta chiamato kelvin. La costante di proporzionalità è k = 1,38 · 10 23 J/K.(2) Così se T è la temperatura assoluta, la nostra definizione dice che l’energia cinetica media molecolare è (3/2)kT. (3/2 viene messo per convenienza in modo da liberarsene da qualche altra parte.) Sottolineiamo che l’energia cinetica associata con la componente del moto in qualsivoglia direzione particolare è soltanto (1/2)kT. Le tre direzioni indipendenti in cui si scompone il moto la rendono (3/2)kT.

39.5

La legge dei gas ideali

Ora, naturalmente, possiamo porre la nostra definizione di temperatura nell’equazione (39.9) e trovare così la legge che dà la pressione dei gas in funzione della temperatura: essa è che la pressione per il volume è uguale al numero totale di atomi per la costante universale k, per la temperatura: PV = N kT (39.22) Inoltre, alle stesse temperatura, pressione e volume, il numero di atomi è determinato; anch’esso è una costante universale! Così uguali volumi di gas diversi, alla stessa pressione e temperatura, hanno lo stesso numero di molecole a causa delle leggi di Newton. Questa è una conclusione sorprendente! In pratica, trattando con molecole, dato che i numeri sono tanto grandi, i chimici hanno artificiosamente scelto un numero specifico, un numero molto grande, e l’hanno chiamato in qualche altro modo. Essi hanno un numero che chiamano mole. Una mole è semplicemente un numero utile. Perché non abbiano scelto 1024 oggetti, così verrebbe fuori un numero tondo, è una (2) La scala centigrada è proprio questa scala Kelvin con lo zero scelto a 273,16 K; in questo modo si ha T = 273,16 + + la temperatura centigrada.

39.5 • La legge dei gas ideali

© 978-8808-22107-0

questione storica. Accadde che scelsero N0 = 6,02 · 1023 oggetti come numero conveniente di oggetti sul quale uniformarsi, e questo è chiamato una mole di oggetti. Così, invece di misurare il numero di molecole in unità, essi misurano in numeri di moli.(3) Utilizzando N0 possiamo scrivere il numero di moli, per il numero di atomi in una mole, per kT e se lo desideriamo, possiamo prendere il numero di atomi in una mole moltiplicato per k, che è una mole di k, e chiamarlo in qualche altro modo, e lo facciamo – lo chiamiamo R. Una mole di k è 8,317 J: R = N0 k = 8,317 J/(mol · K) Così troviamo la legge dei gas scritta anche come il numero di moli (anch’esso chiamato N) per RT, oppure il numero di atomi, per kT: PV = N RT

(39.23)

È la stessa cosa, c’è soltanto una scala diversa per misurare i numeri. Noi usiamo 1 come unità, e i chimici usano 6 · 1023 come unità! Ora facciamo un’ulteriore osservazione circa la nostra legge dei gas, che si riferisce alla legge per oggetti diversi dalle molecole monoatomiche. Abbiamo trattato soltanto il moto del CM degli atomi di un gas monoatomico. Che cosa accade se sono presenti forze? Per prima cosa consideriamo il caso in cui il pistone è trattenuto da una molla orizzontale, e vi sono forze su di esso. Naturalmente lo scambio di moto fra atomi e pistone a ogni istante non dipende dalla posizione istantanea del pistone. Le condizioni di equilibrio sono le stesse. Indipendentemente dalla posizione del pistone, la velocità del suo moto deve essere tale da passare energia alle molecole proprio nel modo giusto. Così la molla non comporta alcuna differenza. La velocità alla quale deve muoversi il pistone, in media, è la stessa. Così il nostro teorema che il valor medio dell’energia cinetica in una direzione è (1/2)kT, è vero sia che le forze siano presenti o no. Consideriamo, per esempio, una molecola biatomica composta degli atomi m A e m B . Ciò che abbiamo dimostrato è che il moto del CM della parte A e quello della parte B sono tali che * + * + 1 1 3 2 2 m Av A = m B vB = kT 2 2 2 Come può essere se sono legati insieme? Sebbene siano trattenuti insieme, mentre essi ruotano su se stessi e l’uno attorno all’altro, quando qualche cosa li urta scambiando energia con essi, la sola cosa che conta è la rapidità con cui si muovono. Questo soltanto determina la rapidità con cui scambiano energia nelle collisioni. In quel particolare istante la forza non è un punto essenziale. Pertanto è valido lo stesso principio, anche quando vi sono forze. Dimostriamo, finalmente, che la legge dei gas sussiste anche avendo trascurato il moto interno. In realtà prima non abbiamo considerato i moti interni; abbiamo trattato soltanto un gas monoatomico. Ma ora dimostreremo che un intero oggetto, considerato come un unico corpo di massa totale M, ha una velocità del CM tale che * + 1 3 2 MvCM = kT (39.24) 2 2 In altre parole, possiamo considerare sia i pezzi separati sia la cosa intera! Vediamo la ragione di ciò: la massa della molecola biatomica è M = m A + m B , e la velocità del centro di massa è uguale a m Av A + mB vB vCM = M 2 Ora noi abbiamo bisogno di hvCM i. Se eleviamo al quadrato vCM , otteniamo 2 vCM =

m2Av 2A + 2m A m B v A · v B + m2B vB2 M2

(3) Ciò che i chimici chiamano pesi molecolari sono le masse in grammi di una mole di una data molecola. La mole è definita in modo che la massa di una mole di atomi dell’isotopo 12 del carbonio (cioè con 6 protoni e 6 neutroni nel nucleo) sia esattamente 12 grammi.

415

416

Capitolo 39 • La teoria cinetica dei gas

© 978-8808-22107-0

Ora moltiplichiamo per M/2 e facciamo la media; otteniamo * + ! 1 1 3 3 3 m A m B hv A · v B i 2 MvCM = m A kT + m A m B hv A · v B i + m B kT = kT + 2 M 2 2 2 M (Abbiamo fatto uso del fatto che (m A + m B )/M = 1.) Ora che cosa è hv A · v B i ? (Sarà bene che venga zero!) Per trovarlo, facciamo uso della nostra ipotesi che la velocità relativa, w = v A v B non ha maggior probabilità di puntare in una direzione piuttosto che in un’altra – cioè, che la sua componente media in qualsiasi direzione è zero. Così facciamo l’ipotesi che hw · vCM i = 0 Ma che cos’è w · vCM ? È w · vCM = Quindi, siccome

(v A

v B ) · (m A v A + m B v B ) m Av 2A + (m B = M

m A)(v A · v B ) M

m B vB2

hm Av 2Ai = hm B vB2 i

il primo e l’ultimo termine in media si elidono, e rimaniamo con (m B

m A)hv A · v B i = 0

Così se m A , m B troviamo che hv A ·v B i = 0, e quindi che il moto dell’intera molecola, considerata come una singola particella di massa M, ha in media un’energia cinetica uguale a (3/2)kT. Incidentalmente, abbiamo anche dimostrato allo stesso tempo che l’energia cinetica media dei moti interni della molecola biatomica, trascurando il moto del CM, è (3/2)kT! Infatti, l’energia cinetica totale delle parti della molecola è 1 1 m Av 2A + m B vB2 2 2 la cui media è

3 3 kT + kT = 3kT 2 2 L’energia cinetica del moto del centro di massa è (3/2)kT, quindi l’energia cinetica media dei moti rotazionali e vibratori dei due atomi entro la molecola è la differenza, (3/2)kT. Il teorema concernente l’energia media del moto del CM è generale: per qualunque oggetto considerato come un tutto, vi siano forze presenti o no, per ciascuna direzione indipendente del moto esistente, l’energia cinetica media del moto è (1/2)kT. Queste «direzioni indipendenti del moto» sono chiamate qualche volta gradi di libertà del sistema. Il numero di gradi di libertà di una molecola composta di r atomi è 3r, perché ciascun atomo richiede tre coordinate per definire la sua posizione. L’intera energia cinetica della molecola si può esprimere sia come somma delle energie cinetiche dei vari atomi, sia come somma dell’energia cinetica del moto del CM più l’energia cinetica dei moti interni. Quest’ultima può qualche volta essere espressa come somma dell’energia cinetica rotazionale della molecola e dell’energia vibrazionale, ma questa è un’approssimazione. Il nostro teorema, applicato alla molecola r-atomica, dice che la molecola avrà, in media, (3/2)r kT joule di energia cinetica, di cui (3/2)kT è l’energia cinetica del moto del centro di massa dell’intera molecola, e il resto, (3/2)(r 1)kT, è energia cinetica rotazionale e vibrazionale interna.

I princìpi della meccanica statistica

40.1

L’atmosfera esponenziale

Abbiamo discusso alcune delle proprietà dei grandi numeri di atomi in collisione fra loro. L’argomento è chiamato teoria cinetica, una descrizione della materia dal punto di vista delle collisioni fra gli atomi. Fondamentalmente, asseriamo che le proprietà della materia in blocco dovrebbero essere spiegabili mediante il moto delle sue parti. Ci limitiamo per ora alle condizioni di equilibrio termico, cioè a una sottoclasse di tutti i fenomeni naturali. Le leggi della meccanica che si applicano proprio all’equilibrio termico sono chiamate meccanica statistica, e in questo paragrafo vogliamo familiarizzare con alcuni dei teoremi centrali di questo argomento. Già abbiamo uno dei teoremi della meccanica statistica, cioè che il valor medio dell’energia cinetica di qualunque moto alla temperatura assoluta T è (1/2)kT per ogni moto indipendente, cioè per ogni grado di libertà. Il che ci dice qualche cosa circa il valor medio del quadrato delle velocità degli atomi. Ora il nostro obiettivo è di imparare di più circa le posizioni degli atomi; di scoprire quanti di loro si troveranno nei diversi posti all’equilibrio termico, e anche di arrivare a un po’ più di dettagli relativamente alla distribuzione delle velocità. Anche se abbiamo la velocità quadratica media, non sappiamo rispondere a una domanda come: quanti atomi vanno tre volte più veloci della velocità quadratica media? Oppure quanti si muovono con velocità pari a un quarto della velocità quadratica media? Oppure hanno tutti quanti esattamente la stessa velocità? Così queste sono le domande alle quali tenteremo di rispondere: come sono distribuite le molecole nello spazio quando esistono forze agenti su di esse, e come sono distribuite in velocità? Risulta che le due questioni sono completamente indipendenti e che la distribuzione delle velocità è sempre la stessa. Abbiamo già ricevuto un accenno di quest’ultimo fatto quando abbiamo trovato che l’energia cinetica media è la stessa, (1/2)kT, indipendentemente dalle forze agenti sulle molecole. La distribuzione delle velocità delle molecole è indipendente dalle forze perché le frequenze di collisione non dipendono dalle forze. Cominciamo con un esempio: la distribuzione delle molecole in un’atmosfera come la nostra, ma senza venti o altri tipi di disturbi. Supponiamo di avere una colonna di gas che si estende per una grande altezza, e in equilibrio termico – diversamente dalla nostra atmosfera che come sappiamo si raffredda andando in alto. Potremmo notare che, se la temperatura fosse diversa alle diverse altezze, potremmo dimostrare la mancanza di equilibrio collegando una bacchetta ad alcune sfere sul fondo (FIGURA 40.1), dove esse acquisterebbero (1/2)kT dalle molecole e scuoterebbero, tramite la bacchetta, le sfere in cima, le quali scuoterebbero le molecole vicine. Così alla fine naturalmente la temperatura in un campo gravitazionale diventa la stessa a tutte le altezze. Se la temperatura è la stessa a tutte le altezze, il problema è di scoprire con quale legge l’atmosfera va rarefacendosi, salendo. Se N è il numero totale di molecole in un volume V di gas a pressione P, sappiamo che PV = N kT, ossia P = nkT, dove n = N/V è il numero di molecole per unità di volume. In altre parole, se conosciamo il numero di molecole per unità di volume, conosciamo la pressione, e viceversa: sono proporzionali l’uno all’altra, poiché la temperatura in questo problema è costante. Ma la pressione non è costante, deve aumentare al diminuire dell’altezza, perché deve reggere, per così dire, il peso di tutto il gas sovrastante.

40

Capitolo 40 • I princìpi della meccanica statistica

418

© 978-8808-22107-0

40.1 La pressione all’altezza h deve superare quella all’altezza h + dh del peso del gas intermedio. FIGURA

1,0 n(h ) n0 0,8 H2

40.2

Le densità normalizzate dell’ossigeno e dell’idrogeno in funzione dell’altezza nel campo gravitazionale terrestre, a temperatura costante. FIGURA

0,6 h + dh Meccanismo per uguagliare la temperatura

h

0,4

g

O2

0,2

0

0

20

40

60

80

Altezza (km)

Questa è l’indicazione dalla quale possiamo determinare come cambia la pressione con l’altezza. Se prendiamo un’area unitaria all’altezza h, allora la forza verticale da sotto, su quest’area unitaria, è la pressione P. La forza verticale che preme verso il basso all’altezza h + dh sarebbe la stessa in assenza della gravità, ma qui non lo è, perché la forza da sotto deve superare quella da sopra, del peso del gas nella sezione fra h e h + dh. Ora mg è la forza di gravità su ogni molecola, dove g è l’accelerazione dovuta alla gravità, e n dh è il numero totale di molecole nell’unità di sezione. Abbiamo quindi l’equazione differenziale Ph+dh

Ph = dP = mgn dh

Siccome P = nkT, e T è costante, possiamo eliminare P oppure n, diciamo P, e otteniamo dn = dh

mg n kT

Questa equazione differenziale ci dice come diminuisce la densità aumentando l’energia. Così abbiamo un’equazione per la densità di particelle n, che varia con l’altezza ma ha la derivata proporzionale a se stessa. Ora una funzione che ha la derivata proporzionale a se stessa è un’esponenziale, e la soluzione di questa equazione differenziale è n = n0 e

mgh/kT

(40.1)

Qui la costante di integrazione, n0 , è ovviamente la densità per h = 0 (che si può scegliere dovunque), e la densità diminuisce esponenzialmente con l’altezza. Notate che se abbiamo tipi differenti di molecole con differenti masse, esse diminuiscono con esponenziali differenti. Le più pesanti diminuirebbero con l’altezza più rapidamente delle leggere. Quindi ci aspetteremmo che, siccome l’ossigeno è più pesante dell’azoto, andando via via più in alto in un’atmosfera con azoto e ossigeno la percentuale di azoto dovesse crescere. In realtà ciò non accade nella nostra atmosfera, almeno ad altezze ragionevoli, perché c’è tanta agitazione che mescola di nuovo i gas tutti insieme. Non è un’atmosfera isoterma. Ciò nondimeno c’è tendenza dei materiali più leggeri, come l’idrogeno, a dominare ad altezze molto elevate nell’atmosfera, perché le masse più piccole continuano a esistere, quando tutte le altre esponenziali si sono ridotte a zero (FIGURA 40.2).

40.2

La legge di Boltzmann

Notiamo il fatto interessante che il numeratore dell’esponente dell’equazione (40.1) è l’energia potenziale di un atomo. Quindi possiamo anche enunciare questa particolare legge nel modo

40.3 • Evaporazione di un liquido

© 978-8808-22107-0

seguente: la densità in ogni punto è proporzionale a e

(energia potenziale di ciascun atomo)/kT

Questo può essere un fatto accidentale, cioè può essere vero soltanto per questo caso particolare del campo gravitazionale uniforme. Tuttavia possiamo dimostrare che è una proprietà più generale. Supponiamo che sulle molecole di un gas agisca qualche tipo di forza diversa dalla gravità. Per esempio le molecole possono essere cariche elettricamente e possono essere sottoposte a un campo elettrico o influenzate da un’altra carica che le attrae. Oppure, a causa delle attrazioni mutue sugli atomi da parte di ciascuno degli altri, o della parete, o di un solido o di qualche altra cosa, esiste una forza di attrazione che varia con la posizione e che agisce su tutte le molecole. Ora supponiamo, per semplicità, che le molecole siano tutte uguali e che la forza agisca su ciascuna di esse, così che la forza totale su un certo volume di gas sarebbe semplicemente il numero di molecole per la forza su ciascuna di esse. Per evitare complicazioni non necessarie, scegliamo un sistema di coordinate con l’asse x nella direzione della forza, F. Allo stesso modo di prima, se prendiamo due piani paralleli nel gas, separati da una distanza dx, allora la forza su ciascun atomo, moltiplicata per n atomi per cm3 (la generalizzazione del nmg precedente), per dx, deve essere bilanciata dalla variazione di pressione: Fn dx = dP = kT dn Ossia, per mettere questa legge in una forma che ci sarà utile in seguito, F = kT

d (ln n) dx

(40.2)

Per ora osserviamo che F dx è il lavoro che faremmo nel portare una molecola da x a x + dx, e se F deriva da un potenziale, cioè se il lavoro fatto può essere rappresentato da un’energia potenziale, allora questo sarebbe anche la differenza nell’energia potenziale (E.P.). Il differenziale dell’energia potenziale cambiato di segno è il lavoro fatto, F dx, e troviamo che d (ln n) =

d (E.P.) kT

ossia, dopo aver integrato, n = (cost.) e

(E.P.)/kT

(40.3)

Quindi ciò che abbiamo notato in un caso particolare risulta essere vero in generale. (Che accade se F non viene da un potenziale? Allora la (40.2) non ha assolutamente alcuna soluzione. L’energia può essere generata o persa dagli atomi che si muovono all’intorno su percorsi ciclici per i quali il lavoro fatto non è zero, e non si può mantenere assolutamente alcun equilibrio. Se le forze esterne agenti sugli atomi non sono conservative non può esistere equilibrio termico.) L’equazione (40.3), nota come legge di Boltzmann, è un altro dei princìpi della meccanica statistica: la probabilità di trovare molecole in una data disposizione spaziale varia esponenzialmente con l’opposto dell’energia potenziale di quella disposizione, diviso per kT. Questa, allora, ci potrebbe dire la distribuzione delle molecole: supponendo di avere in un liquido uno ione positivo, che attrae gli ioni negativi all’intorno, quanti ve ne sarebbero alle diverse distanze? Se è nota l’energia potenziale in funzione della distanza, allora la percentuale di essi alle diverse distanze è data da questa legge, e così via, per molte applicazioni.

40.3

Evaporazione di un liquido

Nella meccanica statistica più avanzata si tenta di risolvere l’importante problema seguente. Consideriamo un insieme di molecole che si attraggono l’una con l’altra, e supponiamo che la forza fra due qualunque di esse, diciamo i e j, dipenda soltanto dalla loro separazione r i j e possa essere rappresentata come derivata di una funzione potenziale V (r i j ).

419

Capitolo 40 • I princìpi della meccanica statistica

420

E.P. V(r)

r0

r

40.3 La funzione energia potenziale di due molecole, che dipende solo dalla loro separazione. FIGURA

© 978-8808-22107-0

La FIGURA 40.3 mostra una possibile forma di tale funzione. Per r > r 0 , l’energia diminuisce all’avvicinarsi delle molecole, perché si attraggono, poi l’energia aumenta molto nettamente quando esse si avvicinano ancora perché si respingono fortemente, il che è caratteristico, approssimativamente, del comportamento delle molecole. Supponiamo ora di avere un’intera scatola piena di tali molecole e di voler sapere come si dispongono in media. La risposta è e E.P./kT . In questo caso l’energia potenziale totale sarebbe la somma su tutte le coppie, supponendo che le forze siano tutte in coppie (in situazioni più complesse possono esistere forze a tre corpi, ma in elettricità, per esempio, l’energia potenziale è tutta in coppie). Allora la probabilità di trovare molecole in una qualunque combinazione particolare di r i j sarà proporzionale a " X # V (r i j ) exp kT i, j

Ora, se la temperatura è molto alta, così che kT |V (r 0 )|, l’esponente è relativamente piccolo quasi dappertutto, e la probabilità di trovare una molecola è quasi indipendente dalla posizione. Prendiamo il caso di due sole molecole: allora e E.P./kT sarebbe la probabilità di trovarle a varie mutue distanze r. Chiaramente nelle zone in cui il potenziale è più negativo la probabilità è più grande, e dove il potenziale va all’infinito la probabilità è quasi zero, il che capita per distanze molto brevi. Ciò significa che per gli atomi di un gas, a causa della repulsione mutua tanto forte, non c’è possibilità che si trovino l’uno sopra l’altro. Ma esiste una probabilità maggiore di trovarli per unità di volume al punto r 0 piuttosto che in qualsiasi altro punto. Di quanto maggiore, dipende dalla temperatura. Se la temperatura è molto grande paragonata con la differenza in energia fra r = r 0 e r = 1, l’esponenziale è sempre circa uguale all’unità. In questo caso, in cui l’energia cinetica media (circa kT) è molto maggiore dell’energia potenziale, le forze non fanno molta differenza. Ma al diminuire della temperatura, la probabilità di trovare le molecole alla distanza preferita r 0 aumenta gradualmente relativamente alla probabilità di trovarle altrove, e infatti, se kT è molto minore di |V (r 0 )|, in quelle vicinanze abbiamo un esponente positivo relativamente grande. In altre parole, in un dato volume è molto più probabile che le molecole si trovino alla distanza corrispondente alla minima energia piuttosto che lontane. Al diminuire della temperatura gli atomi si crollano addosso, si ammucchiano, e si riducono a liquidi, solidi e molecole, mentre scaldandoli evaporano. Il fabbisogno per determinare come evaporino le sostanze, come debbono andare esattamente le cose in una data circostanza, comporta ciò che segue. Primo, scoprire la corretta legge V (r) delle forze molecolari, che deve venire da qualche altra cosa, dalla meccanica quantistica, per esempio, o dall’esperimento. Ma, data la legge della forza fra le molecole, la scoperta P di ciò che stanno per fare un miliardo di molecole consiste nello studio della funzione e Vi j /kT . Abbastanza sorprendentemente, dato che è una funzione così semplice e l’idea così facile, dato il potenziale, il lavoro è enormemente complicato; la difficoltà è data dal tremendo numero di variabili. Nonostante tali difficoltà, l’argomento è molto eccitante e interessante. È spesso citato come esempio di «problema dei molti corpi» ed è veramente stato una cosa molto interessante. In quell’unica formula debbono essere contenuti tutti i dettagli, per esempio, sulla solidificazione del gas, o sulle forme dei cristalli che può avere il solido, e la gente ha tentato di farla funzionare, ma le difficoltà matematiche sono grandissime, non nello scrivere la legge, ma nel trattare con un numero così grande di variabili. Questa allora è la distribuzione delle particelle nello spazio. Questo è il limite della meccanica statistica classica, in pratica, perché se conosciamo le forze, possiamo in linea di principio trovare la distribuzione nello spazio, e la distribuzione delle velocità è qualcosa che possiamo ricavare una volta per tutte e non una cosa che è differente per i diversi casi. I grandi problemi risiedono nell’ottenere informazioni particolari dalla nostra soluzione formale e questo è l’argomento principale della meccanica statistica classica.

40.4 • La distribuzione delle velocità molecolari

© 978-8808-22107-0

40.4

421

La distribuzione delle velocità molecolari

Procediamo ora nella discussione della distribuzione delle velocità perché qualche volta è interessante o utile sapere quante molecole si muovano alle diverse velocità. Per fare ciò possiamo fare uso dei fatti che abbiamo scoperto per il gas nell’atmosfera. Supponiamo di avere un gas perfetto, come abbiamo già fatto nello scrivere l’energia potenziale, trascurando l’energia di attrazione mutua fra gli atomi. L’unica energia potenziale che abbiamo incluso nel nostro primo esempio è stata quella gravitazionale. Naturalmente se ci fossero forze tra gli atomi avremmo qualche cosa di più complicato. Così facciamo l’ipotesi che non vi siano forze fra gli atomi e, per un momento, trascuriamo anche le collisioni, riservandoci di giustificare più tardi questo procedimento. Abbiamo visto che all’altezza h vi sono meno molecole che all’altezza 0; secondo la formula (40.1) esse diminuiscono esponenzialmente con l’altezza. Come possono essercene meno alle altezze maggiori? Dopotutto, tutte le molecole che si muovono verso l’alto all’altezza 0 non arrivano a h? No! Perché alcune di quelle che si muovono verso l’alto all’altezza 0 vanno troppo adagio, e non possono arrampicarsi sulla collina di potenziale fino a h (FIGURA 40.4). Con questa indicazione possiamo calcolare quante debbano muoversi alle varie velocità, perché dalla (40.1) sappiamo quante si muovono con velocità inferiore a quella necessaria per arrampicarsi fino a una data distanza h. Queste sono appunto quelle che rendono conto del fatto che la densità a h è più bassa che a 0. Precisiamo meglio questa idea: contiamo quante molecole passano dal di sotto al di sopra del piano h = 0 (chiamandolo altezza = 0, non vogliamo dire che lì esista un pavimento; è soltanto una indicazione di convenienza, e c’è gas per h negativo). Queste molecole di gas si muovono attorno in ogni direzione, ma alcune di esse si muovono attraverso il piano e a ogni istante un certo numero al secondo di esse passano attraverso il piano dal basso verso l’alto con diverse velocità. Notiamo ora che, se chiamiamo u la velocità che è appena necessaria per raggiungere l’altezza h (energia cinetica mu2 /2 = mgh), allora il numero di molecole al secondo che passano attraverso il piano inferiore dirette verso l’alto con componente della velocità in direzione verticale maggiore di u è esattamente uguale al numero che passa attraverso il piano superiore con qualunque velocità diretta verso l’alto. Quelle molecole la cui velocità verticale non è superiore a u non possono passare attraverso il piano superiore. Vediamo quindi che (numero che passa h = 0 con vz > u) = (numero che passa h = h con vz > 0) Ma il numero che passa attraverso h con qualunque velocità maggiore di 0 è minore del numero che passa per l’altezza inferiore con qualunque velocità maggiore di 0, perché il numero di atomi è più grande; questo è tutto ciò di cui abbiamo bisogno. Già sappiamo che la distribuzione delle velocità è la stessa, dopo la discussione di prima circa il fatto che la temperatura è costante in tutta l’atmosfera. Così, siccome le distribuzioni di velocità sono le stesse, e accade proprio che di sotto ci sono più atomi, chiaramente il numero n>0 (h) che passa con velocità positiva all’altezza h, e il numero n>0 (0), che passa con velocità positiva all’altezza 0, sono nello stesso rapporto delle densità alle due altezze, che è e mgh/kt . Ma n>0 (h) = n>u (0), e quindi troviamo che n>u (0) =e n>0 (0)

mgh/kT

=e

mu 2 /2kT

dato che (1/2)mu2 = mgh. Così, in parole, il numero di molecole per unità di area per secondo 2 che passa per l’altezza 0 con componente z della velocità maggiore di u è e mu /2kT volte il numero totale che passa attraverso il piano con velocità maggiore di zero. Ora ciò non soltanto è vero all’altezza 0 scelta arbitrariamente, ma naturalmente è vero a qualunque altra altezza, e così le distribuzioni di velocità sono tutte uguali! (La proposizione finale non contiene l’altezza h, che è apparsa soltanto nell’argomento intermedio.) Il risultato è una proposizione generale che ci dà la distribuzione delle velocità. Essa ci dice che se pratichiamo un piccolo foro sul fianco di un tubo contenente gas, un foro molto piccolo, così che le collisioni

h=h

h=0

40.4 Soltanto le molecole che si muovono, a h = 0, verso l’alto con velocità sufficiente possono arrivare all’altezza h. FIGURA

422

Capitolo 40 • I princìpi della meccanica statistica

© 978-8808-22107-0

sono poche e distanti l’una dalla successiva, cioè più distanti del diametro del foro, allora le particelle che escono avranno velocità differenti, ma la frazione di particelle che esce a velocità 2 maggiore di u è e mu /2kT . Ora torniamo al fatto che abbiamo trascurato le collisioni: perché non fa alcuna differenza? Avremmo potuto svolgere lo stesso argomento non con un’altezza finita h, ma con un’altezza h infinitesima, tanto piccola che non ci sarebbe posto per collisioni fra 0 e h. Ma questo non era necessario: l’argomento è basato evidentemente su un’analisi delle energie in gioco, la conservazione dell’energia, e negli urti che hanno luogo c’è uno scambio di energie fra le molecole. Tuttavia noi non ci curiamo in realtà se seguiamo la medesima molecola, se c’è semplicemente scambio di energia con un’altra molecola. Così risulta che anche se il problema è analizzato con più cura (ed è più difficile naturalmente fare un lavoro rigoroso), ancora non c’è differenza nel risultato. È interessante che la distribuzione di velocità che abbiamo trovato è esattamente n>u / e

(E.C.)/kT

(40.4)

Questo modo di descrivere la distribuzione delle velocità, dando il numero di molecole che passano una data area con una certa componente minima z, non è il modo più conveniente di dare la distribuzione di velocità. Per esempio, più spesso si desidera conoscere quante molecole dentro al gas si muovono con una componente z della velocità compresa fra due valori dati, il che naturalmente non è dato direttamente dall’equazione (40.4). Desidereremmo enunciare il nostro risultato nella forma più convenzionale anche se ciò che abbiamo già scritto è assai generale. Notate che non è possibile dire che una molecola ha esattamente una certa velocità stabilita; nessuna di esse ha una velocità esattamente uguale a f (u ) 1,796 289 917 3 m/s. Così per fare un’affermazione significativa, dobbiamo chiederci quante si troveranno in un certo intervallo di velocità. Dobbiamo dire quante hanno velocità fra 1,796 e 1,797 e così via. In termini matematici, sia f (u) du la frazione di tutte le molecole che hanno velocità compresa fra u e u + du ossia, il che è la stessa cosa (se du è infinitesimo), la frazione di tutte quelle che hanno una velocità u entro un intervallo du. La FIGURA 40.5 mostra una possibile forma della funzione f (u) e la parte tratteggiata, di larghezza du e altezza media f (u), du u rappresenta questa frazione f (u) du. Cioè il rapporto fra l’area tratteggiata e l’area totale sottesa dalla curva è la parte di molecole con velocità u entro du. Se definiamo f (u) in modo che la frazione avente una velocità in questo FIGURA 40.5 Funzione di distribuzione delle velocità. intervallo sia data direttamente dall’area tratteggiata, allora l’area totale L’area tratteggiata è f (u) du, la frazione di particelle con velocità entro un intervallo du attorno a u. deve essere il 100% di esse, cioè, ⌅ 1 f (u) du = 1 (40.5) 1

Ora dobbiamo soltanto ottenere questa distribuzione per confrontarla col teorema che abbiamo ricavato prima. Per prima cosa domandiamoci: qual è l’espressione in funzione di f (u) del numero di molecole che attraversano al secondo un’area con ⇤ 1una velocità superiore a u? Da principio potremmo pensare che sia semplicemente l’integrale u f (u) du, ma non lo è, perché desideriamo il numero di molecole che attraversano l’area per secondo. Le più veloci passano più spesso, per così dire, delle più lente, e per esprimere quante ne passano bisogna moltiplicare per la velocità. (Abbiamo discusso ciò nel capitolo precedente quando abbiamo parlato del numero di collisioni.) In un dato tempo t il numero totale che passa attraverso la superficie è il numero di quelle che sono state capaci di arrivare alla superficie, e il numero che arriva proviene da una distanza ut. Così il numero di molecole che arrivano non è semplicemente il numero che c’è, ma il numero per unità di volume, moltiplicato per la distanza che esse percorrono nella corsa verso l’area attraverso la quale debbono passare, e la distanza è proporzionale a u. Così abbiamo bisogno dell’integrale ⇤ u f (u) du, un integrale indefinito con u come limite inferiore, e questo deve essere uguale a ciò 2 che abbiamo trovato prima, cioè e mu /2kT , con una costante di proporzionalità che otterremo

40.4 • La distribuzione delle velocità molecolari

© 978-8808-22107-0

più tardi:



1

u

u f (u) du = (cost.) e

mu 2 /2kT

(40.6)

Se differenziamo l’integrale rispetto a u, otteniamo la cosa che sta dentro all’integrale, cioè l’integrando (con un segno meno, dato che u è il limite inferiore), e se differenziamo l’altro membro, otteniamo u moltiplicato per il medesimo esponenziale (e alcune costanti). Gli u si eliminano e troviamo 2 f (u) du = Ce mu /2kT du (40.7) Conserviamo il du in ambo i membri come promemoria che si tratta di una distribuzione, che dice qual è la parte di molecole con velocità fra u e u + du. La costante C deve essere determinata in modo che l’integrale sia uguale a uno, secondo l’equazione (40.5). Possiamo dimostrare(1) che ⌅ 1 p 2 e x dx = ⇡ 1

Facendo uso di questo fatto, è facile trovare C=

p

m/2⇡kT

Siccome velocità e quantità di moto sono proporzionali, possiamo dire che anche la distribuzione delle quantità di moto è proporzionale a e (E.C.)/kT per intervallo unitario di quantità di moto. Risulta che questo teorema è vero anche in relatività, se è in termini di quantità di moto, mentre non lo è per la velocità, così è meglio impararlo per la quantità di moto piuttosto che per la velocità: f (p) dp = Ce (E.C.)/kT dp (40.8) Così troviamo che le probabilità di differenti condizioni di energia, cinetica e potenziale, sono entrambe date da e (energia)/kT , cosa assai bella e facile da ricordare. Finora abbiamo, naturalmente, soltanto la distribuzione delle velocità «verticalmente». Potremmo desiderare di chiederci: qual è la probabilità che una molecola si muova in un’altra direzione? Naturalmente queste distribuzioni sono connesse, e la distribuzione completa si può ottenere da quella che abbiamo perché la distribuzione completa dipende soltanto dal quadrato dell’intensità della velocità, non dalla componente z. Deve essere qualcosa indipendente dalla direzione e con una sola funzione, la probabilità dei differenti moduli. Abbiamo la distribuzione della componente z e quindi possiamo ottenere da essa la distribuzione delle altre componenti. Il risultato è che la probabilità è ancora proporzionale a e (E.C.)/kT , ma ora l’energia cinetica comprende tre parti, (1/2)mvx2 , (1/2)mvy2 e (1/2)mvz2 , sommate nell’esponente. Si può scriverlo come prodotto: ✓ ◆ 2 2 2 f (vx, vy, vz ) dvx dvy dvz / e mvx /2kT e mvy /2kT e mvz /2kT dvx dvy dvz (40.9) Potete vedere che questa formula deve essere giusta perché, primo, è funzione soltanto di v 2 , come si richiede e, secondo, le probabilità dei diversi valori di vz ottenuti integrando su vx e vy è appunto la (40.7). Ma questa funzione (40.9) può fare entrambe queste cose! (1)

Per ottenere il valore dell’integrale, sia I=

Allora I2 =



1

e

x2

dx

1



1 1

e



1

y2

e

x2

1

dy =



dx 1 1



1 1

e

(x 2 +y 2 )

dy dx

che è un integrale doppio sull’intero piano xy. Ma questo si può anche scrivere in coordinate polari come ⌅ 1 ⌅ 1 2 I2 = e r 2⇡r dr = ⇡ e t dt = ⇡ 0

0

423

424

Capitolo 40 • I princìpi della meccanica statistica

40.5

© 978-8808-22107-0

I calori specifici dei gas

Considereremo ora alcuni modi di sottoporre a verifica la teoria e di vedere quanto successo ha la teoria classica dei gas. Abbiamo visto prima che se U è l’energia interna di N molecole, allora PV = N kT = ( 1)U vale qualche volta, forse, per alcuni gas. Se si tratta di un gas monoatomico sappiamo che questo è uguale a 2/3 dell’energia cinetica del moto del centro di massa degli atomi. Se si tratta di un gas monoatomico, allora l’energia cinetica è uguale all’energia interna e quindi 1 = 2/3. Ma supponiamo che si tratti, diciamo, di una molecola più complicata che può ruotare su se stessa e vibrare, e supponiamo (risulta essere giusto secondo la meccanica classica) che anche le energie dei moti interni siano proporzionali a kT. Allora a una data temperatura, in aggiunta all’energia cinetica kT, la molecola ha energia rotazionale e vibrazionale interna. Allora il totale U non comprende solo l’energia cinetica interna, ma anche l’energia rotazionale, e otteniamo un diverso valore di . Tecnicamente, il miglior modo di misurare è misurare il calore specifico, che è la variazione di energia con la temperatura. Torneremo successivamente su questo punto. Per i nostri scopi presenti, possiamo supporre che si ricavi sperimentalmente dalla curva PV relativa alla compressione adiabatica. Calcoliamo per alcuni casi. Primo, per un gas monoatomico l’energia totale U è uguale all’energia cinetica, e sappiamo già che dovrebbe essere 5/3. Per un gas biatomico, possiamo prendere per esempio l’ossigeno, l’acido iodidrico, l’idrogeno, ecc., e possiamo pensare che il gas biatomico si possa rappresentare come due atomi tenuti assieme da qualche tipo di forza come quella della FIGURA 40.3. Possiamo anche supporre, e risulta completamente vero, che alle temperature di interesse per un gas biatomico le coppie di atomi tendano fortemente a stare alla distanza r 0 , la distanza del minimo potenziale. Se ciò non fosse vero, se la probabilità non variasse abbastanza fortemente da far in modo che la grande maggioranza si trovi vicino al minimo, dovremmo ricordare che il gas ossigeno è una mescolanza di O2 e di singoli atomi di ossigeno in proporzione non insignificante. Sappiamo che vi sono, in realtà, assai pochi atomi di ossigeno, il che significa che il minimo dell’energia potenziale è in modulo assai più grande di kT, come abbiamo visto. Dato che gli atomi sono così fortemente raggruppati intorno a r 0 , l’unica parte necessaria della curva è quella vicino al minimo che si può approssimare con una parabola. Un potenziale parabolico implica un oscillatore armonico e infatti, con eccellente approssimazione, la molecola di ossigeno si può rappresentare come due atomi collegati da una molla. Qual è l’energia totale di questa molecola a temperatura T? Sappiamo che per ciascuno dei due atomi, ciascuna delle energie cinetiche dovrebbe essere (3/2)kT, così l’energia cinetica di tutti e due è (3/2)kT + (3/2)kT. Possiamo anche porre ciò in modo differente: il medesimo 3/2 più 3/2 si può anche considerare come l’energia cinetica del centro di massa, 3/2, l’energia cinetica di rotazione, 2/2, e l’energia cinetica di vibrazione, 1/2. Sappiamo che l’energia cinetica di vibrazione è 1/2 dato che c’è soltanto una dimensione in gioco, e ciascun grado di libertà ha (1/2)kT. Riguardo alla rotazione, essa può aver luogo attorno all’uno o all’altro di due assi, così vi sono due moti indipendenti. Facciamo l’ipotesi che gli atomi siano TABELLA 40.1 Valori del rapporto γ fra i calori puntiformi e che non possano ruotare attorno alla linea che li congiunge; specifici per alcuni gas. questa è una cosa da ricordare perché se troviamo un disaccordo, può darsi che il guaio stia qui. γ Gas T (°C) Ma abbiamo un’altra cosa, che è l’energia potenziale della vibrazione: quant’è? In un oscillatore armonico l’energia cinetica media e l’energia 1,660 –180 He potenziale media sono uguali e quindi anche l’energia potenziale di vibra1,68 19 Kr 1,668 15 Ar zione è (1/2)kT. La somma delle energie è U = (7/2)kT, ossia kT è (2/7)U 1,404 100 H2 per atomo. Ciò significa che è 9/7, invece di 5/3, cioè = 1,286. 1,399 100 O2 Possiamo confrontare questi numeri con i relativi valori misurati mo1,40 100 HI strati nella TABELLA 40.1. Guardando prima all’elio, che è un gas monoa1,32 300 Br2 tomico, troviamo un valore assai vicino a 5/3 e l’errore è probabilmente 1,30 185 I2 sperimentale anche se a temperatura così bassa possono esservi alcune for1,310 15 NH3 ze fra gli atomi. Cripto e argo, entrambi monoatomici, vanno pure bene 1,22 15 C2H6 entro gli errori sperimentali.

40.6 • Il fallimento della fisica classica

© 978-8808-22107-0

Passiamo ai gas biatomici e troviamo l’idrogeno con 1,404, che non si accorda col valore teorico, 1,286. L’ossigeno, 1,399, è molto simile, ma di nuovo non è in accordo. L’acido iodidrico di nuovo è simile a 1,40. Comincia a sembrare che la risposta giusta sia 1,40, ma non lo è, perché se guardiamo al bromo vediamo 1,32, e allo iodio vediamo 1,30. Siccome 1,30 è ragionevolmente vicino a 1,286, si può dire che lo iodio si accordi abbastanza bene, ma l’ossigeno è molto lontano. Così qui abbiamo un dilemma. Abbiamo il risultato giusto per una molecola, sbagliato per un’altra molecola, e può darsi che occorra essere piuttosto ingegnosi per spiegarli entrambi. Guardiamo ora a una molecola ancora più complicata, con molte parti, per esempio C2 H6 , che è l’etano. Essa ha otto diversi atomi e tutti vibrano e ruotano in varie combinazioni, così che il totale dell’energia interna deve essere un numero enorme di kT, almeno 12kT per la sola energia cinetica, e 1 deve essere molto vicino a zero, ovvero quasi esattamente 1. Infatti è più basso, 1 ma 1,22 non è tanto più basso, è maggiore dell’1 12 calcolato dalla sola energia cinetica; tutto ciò è semplicemente incomprensibile! Inoltre il mistero è profondo perché la molecola biatomica non si può rendere assolutamente rigida. Anche se rendiamo indefinitamente più rigidi gli accoppiamenti, per quanto possa non vibrare tanto, continuerebbe tuttavia a vibrare. L’energia vibrazionale interna è ancora kT, dato che essa non dipende dalla forza dell’accoppiamento. Ma se potessimo immaginare rigidità assoluta, fermando tutte le vibrazioni per eliminare una variabile, allora per il caso biatomico otterremmo U = (5/2)kT e = 1,40. Questo va bene per H2 o O2 . D’altra parte avremmo ancora problemi perché , sia per l’idrogeno sia per l’ossigeno, varia con la temperatura! Dai valori misurati mostrati nella FIGURA 40.6, vediamo che per H2 , varia da circa 1,6 a 185 fino a 1,3 a 2000 . La variazione è più sostanziale nel caso dell’idrogeno che per l’ossigeno, ma tuttavia anche nell’ossigeno tende nettamente a salire al diminuire della temperatura.

40.6

Il fallimento della fisica classica

Così, tutto sommato, potremmo dire che abbiamo qualche difficoltà. Potremmo tentare qualche legge di forza diversa da quella di una molla, ma risulta che qualsiasi altra cosa può solo far crescere . Se includiamo più forme di energia, si avvicina di più all’unità contraddicendo i fatti. Tutte le cose teoriche classiche cui si può pensare serviranno soltanto a peggiorare la situazione. Il fatto è che in ogni atomo vi sono elettroni, e noi sappiamo dai loro spettri che vi sono moti interni; ciascuno degli elettroni dovrebbe avere almeno (1/2)kT di energia cinetica e qualcosa di energia potenziale, così quando si sommano questi contributi, diventa ancora più piccolo. È assurdo. È sbagliato. Il primo grande studio sulla teoria dinamica dei gas è dovuto a Maxwell nel 1859. Sulla base delle idee che abbiamo discusso egli riuscì a spiegare accuratamente moltissime relazioni conosciute, come la legge di Boyle, la teoria della diffusione, la viscosità dei gas e cose di cui tratteremo nel prossimo capitolo. Egli elencò tutti questi grandi successi in un riassunto finale e alla fine disse: «Finalmente, stabilendo una relazione necessaria fra i moti di traslazione e rotazione (sta parlando del teorema di (1/2)kT) di tutte le particelle non sferiche, abbiamo dimostrato che un sistema di tali particelle non poteva assolutamente soddisfare la relazione nota fra i due calori specifici». Si sta riferendo a (che, vedremo più avanti, è legato a due modi di misurare i calori specifici), e dice che sappiamo di non poter ottenere la risposta giusta. Dieci anni più tardi, in una conferenza, disse: «Vi ho ora presentato quella che io considero la maggiore difficoltà mai incontrata dalla teoria molecolare». Queste parole rappresentano la prima scoperta che le leggi della fisica classica erano sbagliate. Questa era la prima indicazione dell’esistenza di qualcosa di fondamentalmente impossibile, perché un teorema dimostrato rigorosamente non concordava con l’esperimento. Circa nel 1890, Jeans doveva parlare di nuovo di questo rompicapo. Si sente dire spesso che i fisici dell’ultima parte del diciannovesimo secolo pensavano di conoscere tutte le leggi fisiche significative e che l’unica cosa da fare era calcolare più cifre decimali. Può darsi che qualcuno l’abbia detto una volta e che altri l’hanno copiato. Ma un’attenta lettura della letteratura del tempo mostra che essi erano tutti preoccupati di qualche cosa. Jeans

425

426

Capitolo 40 • I princìpi della meccanica statistica

© 978-8808-22107-0

diceva di questo rompicapo che era un fenomeno molto misterioso e che sembrava che al diminuire della temperatura, certi tipi di moto «si congelassero». Se potessimo fare l’ipotesi che il moto vibrazionale, diciamo, non esistesse a bassa temperatura ed esistesse ad alta temperatura, allora potremmo immaginare che un gas possa esistere a una temperatura abbastanza bassa perché il moto vibrazionale non abbia luogo, quindi = 1,40, o a una temperatura più elevata alla quale esso comincia a intervenire, così diminuisce. La stessa cosa si potrebbe dire per la rotazione. Se possiamo eliminare la rotazione, diciamo che «si congela» a temperatura sufficientemente bassa, allora possiamo comprendere il fatto che il dell’idrogeno si avvicina a 1,66 all’abbassarsi della temperatura. Come possiamo comprendere tale fenomeno? Naturalmente il fatto che questi moti «si congelino» non può essere compreso con la meccanica classica. Fu compreso soltanto quando venne scoperta la meccanica quantistica. Senza dimostrazione, possiamo enunciare i risultati della meccanica statistica della teoria quanto-meccanica. Ricordiamo che, secondo la meccanica quantistica, un sistema che è legato da un potenziale, per le vibrazioni, per esempio, avrà un insieme discreto di livelli energetici, cioè stati di differente energia. Ora la domanda è: come si deve modificare la meccanica statistica secondo la teoria della meccanica quantistica? Risulta, ed è abbastanza interessante, che sebbene la maggior parte dei problemi siano più difficili nella meccanica quantistica che in quella classica, i problemi di meccanica statistica sono più facili nella teoria quantistica! Il semplice risultato che abbiamo nella meccanica classica n = n0 e

(energia)/kT

diventa l’importantissimo teorema seguente: se le energie dell’insieme di stati molecolari sono dette, per esempio, E0 , E1 , E2 ,..., Ei ,..., allora in equilibrio termico la probabilità di trovare una molecola nel particolare stato in cui ha energia Ei è proporzionale a e Ei /kT . Ciò dà la probabilità di essere nei vari stati. In altre parole, la probabilità relativa, la probabilità di essere nello stato E1 relativamente a quella di essere nello stato E0 è P1 e = P0 e

E1 /kT E0 /kT

(40.10)

che, naturalmente, è uguale a n1 = n0 e

(E1 E0 )/kT

(40.11)

poiché P1 = n1 /N e P0 = n0 /N. Così è meno probabile essere in uno stato di energia più elevata che più bassa. Il rapporto fra il numero di atomi nello stato superiore e il numero nello stato inferiore è e elevato alla potenza (meno la differenza delle energie diviso kT) – asserzione molto semplice. Ora risulta che per un oscillatore armonico i livelli di energia sono ugualmente spaziati. Chiamando E0 = 0 l’energia più bassa (in realtà non è zero, è un po’ differente, ma non importa se spostiamo tutte le energie di una costante), il primo livello è allora E1 = ~!, il secondo è 2~!, il terzo 3~!, e così via. Vediamo ora che cosa accade. Supponiamo di studiare le vibrazioni di una molecola biatomica, che approssimiamo come un oscillatore armonico. Domandiamoci qual è la probabilità relativa di trovare una molecola nello stato E1 piuttosto che nello stato E0 . La risposta è che la probabilità di trovarla nello stato E1 , relativamente a quella di trovarla nello stato E0 , diminuisce come e ~!/kT . Supponiamo ora che kT sia molto minore di ~! e avremo una situazione caratteristica di bassa temperatura. Allora la probabilità di essere nello stato E1 è estremamente piccola. Praticamente tutti gli atomi sono nello stato E0 . Se variamo la temperatura, ma la manteniamo bassa, allora la probabilità di essere nello stato E1 = ~! rimane infinitesima – l’energia dell’oscillatore rimane circa zero; non cambia con la temperatura finché la temperatura è molto minore di ~!. Tutti gli oscillatori sono nello stato più basso, e i loro moti sono in effetti «congelati»; non vi è alcun loro contributo al calore specifico. Dalla TABELLA 40.1 possiamo allora giudicare che a 100 , che significa 373 gradi assoluti, kT è molto minore dell’energia vibrazionale nelle molecole dell’ossigeno o dell’idrogeno, ma non è così nella molecola dello iodio. La ragione della differenza è che un atomo di iodio è

© 978-8808-22107-0

40.6 • Il fallimento della fisica classica

427

molto pesante, paragonato all’idrogeno, e sebbene in iodio e idrogeno le forze possono essere comparabili, la molecola di iodio è tanto pesante che la frequenza naturale di vibrazione è molto bassa rispetto alla frequenza naturale dell’idrogeno. Con ~! > kT a temperatura ambiente per l’idrogeno, ma più bassa per lo iodio, soltanto quest’ultimo, lo iodio, mostra l’energia vibrazionale classica. Quando aumentiamo la temperatura di un gas, partendo da un valore γ molto basso di T, con quasi tutte le molecole nello stato più basso, esse gradualmente cominciano ad avere un’apprezzabile probabilità di essere nel 1,6 H2 secondo stato, e poi nello stato successivo e così via. Quando la probabilità O2 è apprezzabile per molti stati, il comportamento del gas si avvicina a quello 1,4 dato dalla fisica classica perché gli stati quantizzati diventano quasi indistinguibili da un continuo di energie, e il sistema può quasi avere qualsiasi 1,286 energia. Così, al crescere della temperatura, dovremmo ottenere di nuovo i 1,2 risultati della fisica classica, come infatti sembra accada nella FIGURA 40.6. Nello stesso modo è possibile mostrare che anche gli stati rotazionali degli 1,0 1000 0 500 1500 2000 atomi sono quantizzati, ma gli stati sono tanto più ravvicinati fra loro, che in circostanze ordinarie kT è maggiore della spaziatura. Allora sono ecciTemperatura (°C) tati molti livelli e l’energia cinetica di rotazione del sistema partecipa alla maniera classica. L’unico esempio nel quale questo non è completamente FIGURA 40.6 Valori sperimentali di γ in funzione vero a temperatura ambiente è quello dell’idrogeno. della temperatura per idrogeno e ossigeno. La teoria Questa è la prima volta che abbiamo veramente dedotto, dal confronto classica predice γ = 1,286, indipendente dalla con l’esperimento, che nella fisica classica c’era qualcosa di errato e ab- temperatura. biamo cercato una soluzione della difficoltà nella meccanica quantistica in maniera molto simile a come si è fatto originariamente. Ci vollero 30 o 40 anni prima di scoprire la difficoltà successiva, e questa ebbe di nuovo a che fare con la meccanica statistica, ma questa volta la meccanica di un gas di fotoni. Questo problema venne risolto da Planck, nei primi anni di questo secolo.

41

Il moto browniano

41.1

Equipartizione dell’energia

Il moto browniano fu scoperto nel 1827 da Robert Brown, un botanico. Mentre studiava la vita microscopica egli notò piccole particelle di pollini di piante che si muovevano all’intorno nel liquido che egli stava guardando al microscopio e fu abbastanza saggio da comprendere che non erano viventi, ma erano solo piccoli frammenti di sporcizia che si muovevano all’intorno nell’acqua. In realtà egli contribuì a dimostrare che ciò non aveva nulla a che fare con la vita, prendendo dal suolo un vecchio frammento di quarzo in cui era intrappolata un po’ d’acqua. Doveva trovarsi lì rinchiusa da milioni e milioni di anni, ma in essa egli poteva scorgere lo stesso movimento. Ciò che si vede è che minuscole particelle si muovono in continuazione. Ciò, come si dimostrò più tardi, è uno degli effetti del moto molecolare, e possiamo comprenderlo qualitativamente se pensiamo a un gran pallone di cuoio visto da grande distanza su un campo da gioco pieno di un mucchio di gente che spinge da sotto il pallone in varie direzioni. Noi non riusciamo a vedere la gente perché ci figuriamo di trovarci troppo lontani, ma riusciamo a vedere la palla, e notiamo che si muove all’intorno in maniera piuttosto irregolare. Sappiamo anche, dai teoremi trattati in capitoli precedenti, che l’energia cinetica media di una piccola particella sospesa in un liquido o in un gas sarà (3/2)kT anche se è molto pesante rispetto a una molecola. Se è molto pesante, ciò significa che le velocità sono relativamente piccole, ma in realtà risulta che la velocità non è poi così piccola. In realtà, noi non riusciamo molto facilmente a vedere la velocità di una particella del genere, perché, benché l’energia cinetica media sia (3/2)kT, che rappresenta una velocità di un millimetro al secondo, più o meno, per un oggetto che ha un diametro di un micron o due, è assai difficile individuarla, persino al microscopio, perché la particella inverte continuamente direzione e non arriva da nessuna parte. Fino a che distanza si spinga, sarà trattato alla fine di questo capitolo. Questo problema fu risolto per la prima volta da Einstein al principio del nostro secolo. Incidentalmente, quando diciamo che l’energia cinetica media di questa particella è (3/2)kT, affermiamo di avere derivato tale risultato dalla teoria cinetica, vale a dire, dalle leggi di Newton. Scopriremo che possiamo derivare ogni sorta di cose – di cose meravigliose – dalla teoria cinetica, ed è assai interessante il fatto che si possa evidentemente trarre tanto da così poco. Naturalmente non intendiamo dire che le leggi di Newton sono «poco» – esse sono sufficienti allo scopo, a dire il vero – ciò che intendiamo è che noi non abbiamo fatto gran che. Come possiamo ricavarne tanto? La risposta è che abbiamo sempre continuato a fare una certa importante ipotesi che è: se un dato sistema è in equilibrio termico a una certa temperatura, si troverà pure in equilibrio termico con qualsiasi altra cosa alla medesima temperatura. Per esempio, se volessimo vedere come si muoverebbe una particella se venisse in realtà a collisione con l’acqua, potremmo immaginare che fosse presente un gas, composto di un’altra specie di particelle, di minuscole pallottoline che (supponiamo) non interagiscono con l’acqua, ma colpiscono soltanto la particella con «violente» collisioni. Immaginiamo che la particella abbia un’asta sporgente; tutto ciò che le pallottoline devono fare è di colpire l’asta. Sappiamo tutto di questo immaginario gas di pallottoline a temperatura T – è un gas ideale. L’acqua è complessa, ma un gas ideale è semplice. Ora, la nostra particella deve trovarsi in equilibrio con il gas di pallottoline. Di conseguenza il moto medio della particella deve essere ciò che otteniamo per le

41.1 • Equipartizione dell’energia

© 978-8808-22107-0

collisioni gassose, perché se essa non si muovesse alla velocità giusta in relazione all’acqua, ma, per esempio, a una velocità maggiore, ciò significherebbe che le pallottoline guadagnerebbero energia da essa e diventerebbero più calde dell’acqua. Ma noi le avevamo messe in moto alla medesima temperatura, e assumiamo che una cosa, una volta in equilibrio, rimanga in equilibrio – alcune parti di essa non diventano più calde né altre più fredde spontaneamente. Questa asserzione è vera e può essere dimostrata dalle leggi della meccanica, ma la dimostrazione è assai complicata e può essere fatta soltanto tramite l’uso di meccanica avanzata. È molto più facile dimostrarla nella meccanica quantistica che non in quella classica. Fu provata per la prima volta da Boltzmann, ma per ora noi l’accettiamo semplicemente per vera, e quindi possiamo asserire che la nostra particella deve avere (3/2)kT di energia se è colpita da pallottoline fittizie, sicché essa deve avere (3/2)kT anche quando è colpita dall’acqua alla stessa temperatura e togliamo via le pallottoline; perciò si ha (3/2)kT. È una strana linea di discussione, ma perfettamente valida. Oltre al moto delle particelle colloidali in virtù del quale per la prima volta si scoprì il moto browniano, vi è un certo numero di altri fenomeni, sia in laboratorio sia in situazioni diverse, dove si può vedere il moto browniano. Se cerchiamo di costruire l’apparecchiatura più delicata possibile, per esempio uno specchio piccolissimo su una sottile fibra di quarzo per un galvanometro balistico assai sensibile (FIGURA 41.1), lo specchio non sta fermo, ma scatta in continuazione – in continuazione – di modo che quando riflettiamo una luce su di esso e guardiamo la posizione della macchia luminosa, non abbiamo uno strumento perfetto perché lo specchio continua a spostarsi a piccoli scatti. Perché? Perché l’energia cinetica media di rotazione di questo specchio deve essere, in media, pari a (1/2)kT. Qual è l’angolo quadratico medio di cui lo specchio oscillerà? Immaginiamo di trovare il periodo di vibrazione naturale dello specchio urtandolo leggermente da un lato e osservando quanto occorre perché esso oscilli avanti e indietro, e immaginiamo di conoscere anche il momento di inerzia, I I. Conosciamo la formula dell’energia cinetica di rotazione, essa è data α dall’equazione (19.8): (a) 1 T = I!2 2 Questa è l’energia cinetica, e l’energia potenziale che l’accompagna sarà proporzionale al quadrato dell’angolo, cioè V=

1 2 ↵✓ 2

1 2 2 I! ✓ 2 0

1 2 2 1 I! h✓ i = kT 2 0 2 h✓ 2 i =

L

41.1 (a) Galvanometro sensibile a specchio. La luce proveniente da una sorgente L è riflessa su una scala da un piccolo specchio. (b) Disegno schematico della lettura della scala in funzione del tempo.

FIGURA

Ora, sappiamo che l’energia cinetica media è (1/2)kT, ma dal momento che si tratta di un oscillatore armonico anche l’energia potenziale media sarà (1/2)kT. Quindi

ossia

S

(b)

Ma se conosciamo il periodo t 0 e da esso calcoliamo la frequenza naturale !0 = 2⇡/t 0 , allora l’energia potenziale sarà V=

429

kT I!02

(41.1)

In tal modo possiamo calcolare le oscillazioni di uno specchio di galvanometro, e con quelle scoprire quali saranno le limitazioni del nostro strumento. Se vogliamo oscillazioni più piccole, dobbiamo raffreddare lo specchio. Una questione interessante è dove raffreddarlo. Ciò dipende dal punto in cui riceve i «colpetti». Se attraverso la fibra, lo raffredderemo in cima – se lo specchio è circondato da un gas e viene colpito soprattutto da collisioni del gas, è meglio raffreddare il gas. A dir la verità, se sappiamo da dove proviene lo smorzamento delle oscillazioni, risulta che quella è sempre anche la sorgente delle fluttuazioni, un punto su cui ritorneremo.

Capitolo 41 • Il moto browniano

430

L

C

R

(a)

C L

(b)

G

R

41.2 Circuito risonante ad alto Q. (a) Circuito reale a temperatura T. (b) Circuito fittizio, con una resistenza ideale (priva di rumore) e un «generatore di rumore» G. FIGURA

© 978-8808-22107-0

La stessa cosa si verifica, ed è abbastanza sorprendente, nei circuiti elettrici. Immaginiamo di costruire un amplificatore assai sensibile e fedele per una determinata frequenza e di avere all’entrata un circuito risonante (FIGURA 41.2) sì da renderlo assai sensibile a questa certa frequenza, come un ricevitore radio, ma uno veramente buono. Immaginiamo di voler discendere fino all’estremo limite delle cose, sicché prendiamo la differenza di potenziale, a esempio dall’induttanza, e l’inviamo nel resto dell’amplificatore. Naturalmente in qualsiasi circuito come questo si verifica una certa perdita. Non è un circuito risonante perfetto, ma è molto buono e vi è, poniamo, una piccola resistenza (mettiamo nel circuito il resistore, sicché possiamo vederlo, ma lo si immagina piccolo). Ora desidereremmo scoprire: quanto fluttua il voltaggio ai capi dell’induttanza? Risposta: sappiamo che (1/2)LI 2 è «l’energia cinetica»: l’energia associata a una bobina in un circuito risonante (capitolo 25). Di conseguenza il valore medio di (1/2)LI 2 è pari a (1/2)kT: ciò ci dice qual è la corrente quadratica media e dalla corrente quadratica media possiamo ricavare quale sia la differenza di potenziale quadratica media. Perché, se vogliamo la differenza di potenziale ai capi dell’induttanza, la formula è VˆL = i!L Iˆ e la media del quadrato del valore assoluto della differenza di potenziale, eseguita sull’induttanza, è espressa dalla relazione hVL2 i = L 2 !02 hI 2 i Introducendo

1 1 L hI 2 i = kT 2 2

otteniamo hVL2 i = L!02 kT

(41.2)

Così ora potremo progettare dei circuiti e dire quando otterremo ciò che è chiamato rumore di Johnson, che è il rumore associato alle fluttuazioni termiche! Da dove vengono le fluttuazioni questa volta? Vengono di nuovo dal resistore – derivano dal fatto che gli elettroni interni al resistore si muovono all’intorno perché si trovano in equilibrio termico con la materia che c’è nel resistore, e provocano delle fluttuazioni nella densità degli elettroni. Essi producono così dei minuscoli campi elettrici che azionano il circuito risonante. Gli ingegneri elettrotecnici danno la risposta in un altro modo. Dal punto di vista fisico, il resistore è effettivamente la sorgente di rumore. Comunque, possiamo sostituire il circuito reale dotato di un genuino, vero resistore fisico che produce rumore, con un circuito artificiale contenente un piccolo generatore il quale rappresenterà il rumore, e ora il resistore è ideale sotto un altro aspetto – non ne esce alcun rumore. Tutto il rumore sta nel generatore artificiale. E così, se conoscessimo le caratteristiche del rumore generato da un resistore, se ne avessimo la formula, potremmo calcolare ciò che il circuito farà in risposta a quel rumore. Dunque, ci occorre una formula per le fluttuazioni del rumore. Ora, il rumore prodotto dal resistore è a tutte le frequenze, dal momento che il resistore per se stesso non è risonante. Naturalmente il circuito risonante «ascolta» soltanto quella parte vicina alla frequenza giusta, ma il resistore contiene molte frequenze diverse. Possiamo descrivere quanto sia forte il generatore nella maniera seguente: la potenza media che il resistore assorbirebbe se fosse connesso direttamente attraverso il generatore di rumore sarebbe hE 2 i/R, se E fosse il voltaggio del generatore. Ma vorremmo sapere più in dettaglio quanta potenza vi è a ogni frequenza. Vi è molta poca potenza in qualsiasi frequenza da sola; si tratta di una distribuzione. Sia P(!) d! la potenza che il generatore erogherebbe nel campo di frequenza d! proprio attraverso lo stesso resistore. Possiamo dimostrare (lo dimostreremo per un altro caso, ma la matematica è esattamente la stessa) che la potenza risulta 2 (41.3) P(!) d! = kT d! ⇡ ed è indipendente dalla resistenza quando è messa in questo modo.

41.2 • Equilibrio termico della radiazione

© 978-8808-22107-0

41.2

Equilibrio termico della radiazione

Passiamo ora a considerare un problema ancora più complicato e interessante, che è il seguente. Immaginiamo di avere un oscillatore carico come quelli di cui parlavamo quando studiavamo la luce, per esempio un elettrone che oscilla su e giù in un atomo. Se oscilla su e giù, esso irradia luce. Ora, supponiamo che questo oscillatore si trovi in un gas molto rarefatto di altri atomi, e che di tanto in tanto gli atomi vengano a collisione con esso. In equilibrio, dopo un bel po’ di tempo, tale oscillatore guadagnerà un’energia tale che la sua energia cinetica di oscillazione sarà (1/2)kT, e dal momento che si tratta di un oscillatore armonico, tutta la sua energia di moto diverrà kT. Questa è, naturalmente, una descrizione erronea, fino a questo punto, perché l’oscillatore porta una carica elettrica, e, se ha un’energia kT, si scuote su e giù e irradia luce. Di conseguenza, è impossibile avere equilibrio di materia reale da sola senza che le cariche in essa contenute emettano luce, e, quando la luce viene emessa, si disperde energia, l’oscillatore perde il suo kT col passare del tempo, e così tutto il gas che viene a collisione con l’oscillatore a poco a poco si raffredda. E questo è, naturalmente, il modo in cui una stufa molto calda si raffredda in una notte fredda irradiando la luce verso il cielo, perché gli atomi fanno oscillare la loro carica ed essa continua a irradiare, e a poco a poco, a causa di tale irraggiamento, il moto rallenta. D’altra parte, se rinchiudiamo il tutto in una scatola di modo che la luce non si disperda all’infinito, possiamo alla fine ottenere l’equilibrio termico. Possiamo mettere il gas in una scatola dove possiamo dire che vi sono altri radiatori nelle pareti i quali rimandano indietro la luce, o, per fare un esempio più carino, possiamo immaginare che la scatola abbia pareti speculari. È più facile pensare a questo caso. Così assumiamo che tutta la radiazione uscente dall’oscillatore continua a muoversi all’intorno dentro la scatola. Poi, naturalmente, è vero che l’oscillatore comincia a irradiare, ma molto presto può conservare il suo kT di energia cinetica a dispetto del fatto che sta irradiando, perché è illuminato, per così dire, dalla propria luce riflessa dalle pareti della scatola. Ciò significa che dopo un po’ vi è una gran quantità di luce che fluisce all’intorno dentro la scatola e, benché l’oscillatore ne irradi un po’, la luce torna indietro e restituisce parte dell’energia che era stata irradiata. Stabiliremo ora quanta luce deve esservi in tale scatola a temperatura T per far sì che la riflessione della luce su questo oscillatore generi quanto basta di energia per rendere conto della luce che ha irradiato. Gli atomi di gas siano assai pochi e distanti fra loro, così da avere un oscillatore ideale senza resistenza a eccezione della resistenza di radiazione. Poi consideriamo che in equilibrio termico l’oscillatore sta facendo due cose al tempo stesso. Primo, ha un’energia media kT e noi calcoleremo la quantità di radiazione che emette. Secondo, tale radiazione dovrebbe essere esattamente pari alla quantità che risulterebbe dal fatto che la luce che giunge sull’oscillatore viene diffusa. Dal momento che non vi è alcun altro luogo in cui l’energia possa andare, questa radiazione efficace è in realtà proprio luce diffusa dovuta alla luce che vi è all’intorno. Calcoliamo prima l’energia irradiata dall’oscillatore al secondo, se l’oscillatore ha una certa energia. (Prendiamo a prestito dal capitolo 32 sulla resistenza di radiazione un certo numero di equazioni senza ritornare sulla loro derivazione.) L’energia irradiata per radiante diviso l’energia dell’oscillatore è detta 1/Q (equazione (32.8)): 1 dW 1 = Q dt !0 W Facendo uso della quantità , la costante di smorzamento, si può anche scrivere 1 = Q !0 dove !0 è la frequenza naturale dell’oscillatore – se è molto piccolo, Q è molto grande. L’energia irradiata al secondo è allora !0 W !0 W dW = = = W (41.4) dt Q !0

431

432

Capitolo 41 • Il moto browniano

© 978-8808-22107-0

L’energia irradiata al secondo è, quindi, semplicemente per l’energia dell’oscillatore. Ora, l’oscillatore dovrebbe avere un’energia media kT, sicché vediamo che kT è la quantità media di energia irradiata al secondo: * + dW = kT (41.5) dt Ora dobbiamo soltanto sapere che cos’è ; =

si trova facilmente con l’equazione (32.12):

2 !0 2 r 0 !0 = Q 3 c

(41.6)

dove r 0 = e2 /mc2 è il raggio classico dell’elettrone, e abbiamo posto = 2⇡c/!0 . Il nostro risultato finale per la quantità media di radiazione, nell’unità di tempo, di luce vicino alla frequenza !0 è perciò * + 2 dW 2 r 0 !0 kT = (41.7) dt 3 c

Poi ci chiediamo quanta luce deve giungere sull’oscillatore. Dovrà essere quanta ne basta perché l’energia che esso assorbe dalla luce (e tosto diffusa) sia proprio esattamente altrettanta. In altre parole, la luce emessa si spiega come luce diffusa dovuta alla luce che si riflette sull’oscillatore nella cavità. Sicché ora dobbiamo calcolare quanta luce viene diffusa dall’oscillatore se vi è una certa quantità – sconosciuta – di radiazione incidente su di esso. Sia I(!) d! la quantità di energia luminosa presente alla frequenza !, entro un certo intervallo d! (perché non esiste luce esattamente di una certa frequenza; è distribuita per tutto lo spettro). Sicché I(!) rappresenta una certa distribuzione spettrale che ora troveremo – rappresenta il colore di una fornace a temperatura T che vediamo quando apriamo il portello e guardiamo dentro all’apertura. Ora, quanta luce viene assorbita? Abbiamo calcolato la quantità di radiazione assorbita da un dato fascio luminoso incidente, e l’abbiamo calcolata in termini di sezione d’urto. È proprio come se dicessimo che viene assorbita tutta la luce che cade su una certa sezione d’urto. Sicché la quantità complessiva che viene nuovamente irradiata (diffusa) è l’intensità incidente I(!) d! moltiplicata per la sezione d’urto . La formula per la sezione d’urto che abbiamo ricavato dall’equazione (32.19) non conteneva lo smorzamento. Non è difficile ripetere nuovamente la derivazione e introdurre il termine di resistenza precedentemente trascurato. Se facciamo questo e calcoliamo allo stesso modo la sezione d’urto, otteniamo 8⇡r 02 !4 = (41.8) s 2 3 (! !02 )2 + 2 !2 Ora, come funzione della frequenza, s ha un valore significativo soltanto per ! molto vicina alla frequenza naturale !0 . (Ricordate che il Q per un oscillatore radiante è circa 108 .) L’oscillatore diffonde molto fortemente quando è pari a !0 , e molto debolmente per altri valori di !. Perciò possiamo sostituire ! con !0 e !2 !02 con 2!0 (! !0 ), e otteniamo s

= " 3 (!

2⇡r 02 !02 !0

)2

2

+

4

#

(41.9)

Ora l’intera curva è localizzata vicino a ! = !0 . (Non dobbiamo in realtà fare alcuna approssimazione, ma è molto più facile fare gli integrali se semplifichiamo un po’ l’equazione.) Ora moltiplichiamo l’intensità di un dato intervallo di frequenza per la sezione d’urto di diffusione, per ottenere la quantità di energia diffusa nell’intervallo d!. L’energia complessiva diffusa sarà allora l’integrale di questa per tutti gli !. Quindi dWs = dt



0

1

I(!)

s (!) d! =



0

1

"

2⇡r 02 !02 I(!)

3 (!

!0

)2

2

+

4

# d!

(41.10)

41.2 • Equilibrio termico della radiazione

© 978-8808-22107-0

433

Ora poniamo

dWs = 3 kT dt Perché tre? Perché quando abbiamo fatto la nostra analisi della sezione d’urto nel capitolo 32, abbiamo assunto che la polarizzazione fosse tale che la luce potesse forzare l’oscillatore. Se avessimo fatto uso di un oscillatore che si poteva muovere soltanto in una direzione, e la luce, poniamo, fosse stata polarizzata nel modo sbagliato, esso non avrebbe dato alcuna diffusione. Sicché, dobbiamo o fare la media della sezione d’urto di un oscillatore che può andare solo in una direzione, su tutte le direzioni d’incidenza e polarizzazione della luce, oppure, il che è più facile, possiamo immaginare un oscillatore che segue il campo in qualsiasi direzione esso punti. Un tale oscillatore, che può oscillare parimenti in tre direzioni, avrebbe energia media 3kT perché in quell’oscillatore vi sono tre gradi di libertà. Quindi dobbiamo usare 3 kT a causa dei 3 gradi di libertà. Calcoliamo ora l’integrale. Immaginiamo che la distribuzione spettrale incognita I(!) della luce sia una curva dolce e che non vari molto nella ristrettissima regione di frequenza in cui s ha il picco (FIGURA 41.3). Quindi l’unico contributo significativo si verifica quando ! è molto vicino a !0 , entro una quantità , che è assai piccola. Di conseguenza, dunque, benché I(!) possa essere una funzione sconosciuta e complicata, l’unico luogo in cui è importante è vicino a ! = !0 , e lì possiamo sostituire alla curva dolce una linea orizzontale – una «costante» – alla stessa altezza. In altre parole, prendiamo semplicemente I(!) fuori dal segno di integrale e lo chiamiamo I(!0 ). Possiamo anche portare fuori il resto delle costanti e metterle davanti all’integrale: ⌅ 1 2 2 2 d! ⇡r ! I(!0 ) = 3 kT (41.11) 2 3 0 0 0 (! !0 )2 + 4 L’integrale dovrebbe andare da 0 a 1, ma 0 è così lontano da !0 che la curva a quel punto è del tutto finita, sicché andremo invece a 1 – non fa differenza ed⇤ è molto più facile fare l’integrale. L’integrale è una funzione inversa della tangente della forma dx/(x 2 + a2 ). Se lo cerchiamo in un libro, vediamo che è uguale a ⇡/a. Sicché nel nostro caso diventa 2⇡/ . Di conseguenza, con qualche riordinamento, otteniamo 9 2 kT I(!0 ) = 2 2 2 (41.12) 4⇡ r 0 !0 Poi sostituiamo la formula (41.6) per (non preoccupatevi di scrivere !0 ; dal momento che ciò è vero per qualsiasi !0 , possiamo anche chiamarlo !) e ne esce allora la formula per I(!): I(!) =

!2 kT ⇡ 2 c2

(41.13)

E ciò ci dà la distribuzione della luce in una fornace ardente. Essa è chiamata radiazione di corpo nero. Nero, perché la cavità della fornace in cui guardiamo è nera quando la temperatura è zero. Secondo la teoria classica, la (41.13) rappresenta la distribuzione di energia della radiazione all’interno di una scatola chiusa a temperatura T. Per prima cosa notiamo una caratteristica notevole di tale espressione. La carica dell’oscillatore, la massa dell’oscillatore e tutte le proprietà

I(ω) 2T0

I(ω)

T0

I(ω0)

ω0 – γ/2

ω0 + γ/2 ω0

41.3 I fattori dell’integrando (41.10). Il picco è la curva di risonanza 1/(ω ω0 )2 + γ2 /4. Con buona approssimazione il fattore I(ω) può essere sostituito con I(ω0 ). FIGURA

ω

Radio

IR

Visibile

UV

FIGURA

Raggi X

ω

41.4

Distribuzione dell’intensità della radiazione di corpo nero a due temperature, secondo la fisica classica (curve continue). Le curve tratteggiate mostrano la distribuzione reale.

434

Capitolo 41 • Il moto browniano

© 978-8808-22107-0

specifiche dell’oscillatore scompaiono, perché una volta raggiunto l’equilibrio con un oscillatore, dobbiamo trovarci in equilibrio con qualsiasi altro oscillatore di massa diversa, altrimenti ci troveremo in difficoltà. Sicché questo è un importante tipo di verifica all’asserzione che l’equilibrio non dipende da ciò con cui ci troviamo in equilibrio, ma soltanto dalla temperatura. Ora, facciamo un disegno della curva I(!) (FIGURA 41.4). Esso ci dice quanta luce abbiamo a frequenze diverse. L’intensità contenuta nella nostra scatola, per intervallo unitario di frequenza, va, come vediamo, come il quadrato della frequenza, il che significa che se abbiamo una scatola a una temperatura qualsiasi, e se guardiamo i raggi X che ne escono, ve ne saranno tantissimi! Naturalmente sappiamo che ciò è falso. Quando apriamo la fornace e ci diamo un’occhiata, non bruciamo affatto i nostri occhi coi raggi X. È assolutamente falso. Inoltre, l’energia totale contenuta nella scatola, il totale di questa intensità sommata su tutte le frequenze, sarebbe l’area sotto questa curva infinita. Perciò, qualcosa è fondamentalmente, potentemente e assolutamente errato. Così la teoria classica è stata assolutamente incapace di descrivere correttamente la distribuzione di luce da un corpo nero, proprio com’è stata incapace di descrivere correttamente i calori specifici dei gas. I fisici sono ritornati più e più volte su questa derivazione da molti diversi punti di vista, ma non c’è scampo. Questa è la predizione della fisica classica. L’equazione (41.13), chiamata legge di Rayleigh, rappresenta la predizione della fisica classica, ed è palesemente assurda.

41.3

L’equipartizione e l’oscillatore quantistico

La difficoltà di cui sopra è stata un’altra parte del continuo problema della fisica classica che cominciò con la difficoltà del calore specifico dei gas, e ora è stato messo a fuoco sulla distribuzione della luce in un corpo nero. Com’è naturale, al tempo in cui i teorici studiavano questo fatto, vi erano anche molte misure della curva vera. E risultò che la curva corretta assomigliava alle curve tratteggiate della FIGURA 41.4. Vale a dire, i raggi X non c’erano. Se abbassiamo la temperatura, l’intera curva scende in proporzione a T, secondo la teoria classica, ma la curva osservata s’interrompe ancora prima a una temperatura più bassa. Così l’estremo di bassa frequenza della curva è giusto, ma l’estremo di alta frequenza è sbagliato. Perché? Quando Sir James Jeans si preoccupava dei calori specifici dei gas, notò che i moti che hanno frequenza alta «si congelano» quando la temperatura si abbassa troppo. Cioè, se la temperatura è troppo bassa e se la frequenza è troppo alta, gli oscillatori non hanno kT di energia in media. Ora, richiamate alla mente come funzionava la nostra derivazione della (41.13): tutto dipende dall’energia di un oscillatore in equilibrio termico. Il kT della (41.5) e lo stesso kT nella (41.13) sono l’energia media di un oscillatore armonico di frequenza ! a temperatura T. Dal punto di vista classico questo è kT, ma dal punto di vista sperimentale, no! – non quando la temperatura è troppo bassa o la frequenza dell’oscillatore è troppo alta. E così, la ragione per cui la curva si abbassa è la medesima ragione per cui sono errati i calori specifici dei gas. È più facile studiare la curva del corpo nero che non i calori specifici dei gas, che sono tanto complicati, perciò la nostra attenzione verrà accentrata sulla determinazione della vera curva del corpo nero, perché questa è una curva che ci dirà correttamente, a ogni frequenza, quale sia realmente l’energia media degli oscillatori armonici in funzione della temperatura. Planck studiò questa curva. Egli per prima cosa determinò la risposta empiricamente aggiustando la curva osservata con una bella funzione che si adattava molto bene. Così egli ebbe una formula empirica per l’energia media di un oscillatore armonico in funzione della frequenza. In altre parole egli aveva la formula giusta invece di kT, poi giocandoci sopra trovò una derivazione semplice di essa che implicava un’ipotesi molto particolare. Tale ipotesi era che l’oscillatore armonico può acquistare energie soltanto in quantità ~! alla volta. L’idea che esso possa avere assolutamente qualsiasi energia è falsa. Naturalmente, quello fu l’inizio della fine della meccanica classica. La primissima formula quanto-meccanica correttamente determinata verrà ricavata ora. Immaginiamo che i livelli di energia consentita di un oscillatore armonico fossero ugualmente

41.3 • L’equipartizione e l’oscillatore quantistico

© 978-8808-22107-0

435

spaziati a distanza ~!0 , di modo che l’oscillatore potesse acquistare soltanto queste diverse energie (FIGURA 41.5). Planck fece una discussione un po’ più complicata di quella che viene riportata qui, perché quello era l’inizio vero e proprio della meccanica quantistica ed egli dovette dimostrare alcune cose. Ma prenderemo come dato di fatto (e ciò fu da lui dimostrato in questo caso) che la probabilità di occupare un livello di energia E sia P(E) = ↵e

E/kT

Se procediamo così otterremo il risultato giusto. Supponiamo ora di avere un mucchio di oscillatori e che ciascuno sia un vibratore di frequenza !0 . Alcuni di questi vibratori si troveranno nello stato quantico più basso, altri nel successivo, e così via. Ciò che vorremmo conoscere è l’energia media di tutti questi oscillatori. Per trovarla, calcoliamo l’energia complessiva degli oscillatori e dividiamo per il numero di oscillatori. Quella sarà l’energia media per oscillatore in equilibrio termico, e sarà anche l’energia che si trova in equilibrio con la radiazione di corpo nero e che, nell’equazione (41.13) dovrebbe andare al posto di kT. Così sia N0 il numero di oscillatori che sono nello stato fondamentale (lo stato di più bassa energia); N1 il numero degli oscillatori nello stato E1 ; N2 il numero di quelli che sono nello stato E2 ; e così via. Secondo l’ipotesi (che non abbiamo dimostrato) per cui nella meccanica quantistica la legge che sostituisce la probabilità e E.P./kT o e E.C./kT della meccanica classica è che la probabilità diminuisca come e E/kT , dove E è l’energia in eccesso, assumeremo che il numero N1 di oscillatori che si trovano nel primo stato sarà il numero N0 di quelli che sono nello stato fondamentale, moltiplicato per e ~!/kT : N1 = N0 e

~!/kT

Similmente, N2 , il numero di oscillatori nel secondo stato, è N2 = N0 e Per semplificare l’algebra, poniamo e

~!/kT

2~!/kT

= x. Allora avremo semplicemente

N1 = N0 x N2 = N0 x 2 .. . Nn = N0 x n Prima deve essere calcolata l’energia complessiva di tutti gli oscillatori. Se un oscillatore è nello stato fondamentale, non vi è energia. Se è nel primo stato, l’energia è ~!, e di essi ve ne sono N1 , così N1 · ~! = ~!N0 x

è la quantità di energia che otteniamo da quelli. Quelli che si trovano nel secondo stato hanno 2~! e di essi ve ne sono N2 , così N2 · 2~! = 2~!N0 x 2

è la quantità di energia che otteniamo, e così via. Poi sommiamo tutto insieme per ottenere ⇣ ⌘ Etot = N0 ~! 0 + x + 2x 2 + 3x 3 + . . .

E ora, quanti oscillatori vi sono? Naturalmente, N0 è il numero che si trova nello stato fondamentale, N1 nel primo stato, e così via, e li sommiamo insieme: ⇣ ⌘ Ntot = N0 1 + x + x 2 + x 3 + . . . Così l’energia media è

⇣ ⌘ N0 ~! 0 + x + 2x 2 + 3x 3 + . . . Etot ⇣ ⌘ = hEi = Ntot N0 1 + x + x 2 + x 3 + . . .

(41.14)

N4

E4, P4

N3

E3, P3

N2

E2, P2

N1

E1, P1

N0

E0, P0

E0 = 0 P0 = A E1 = h ω P1 = A exp(– h ω/kt) E2 = 2 h ω P2 = A exp(–2 h ω/kt) E3 = 3 h ω P3 = A exp(–3 h ω/kt) E4 = 4 hω P4 = A exp(–4 h ω/kt)

41.5 I livelli di energia di un oscillatore armonico (E n = n hω) sono ugualmente spaziati. FIGURA

436

Capitolo 41 • Il moto browniano

© 978-8808-22107-0

Ora lasceremo al lettore il giocare a divertirsi con le due somme che appaiono qui. Quando abbiamo finito di sommare e di sostituire al posto di x nella somma, dovremmo ottenere, se non facciamo errori nella somma, ~! hEi = ~!/kT (41.15) e 1 Questa, allora, fu la prima formula della meccanica quantistica mai conosciuta, o mai discussa, e fu il magnifico culmine di decenni di perplessità. Maxwell sapeva che c’era qualcosa di sbagliato, e il problema era, che cosa era giusto? Questa è la risposta quantitativa di ciò che è giusto invece di kT. Questa espressione dovrebbe, naturalmente, avvicinarsi a kT quando ! ! 0 o T ! 1. Vedete se potete dimostrare che è così – imparate a usare la matematica. Questo è il famoso fattore di taglio che Jeans cercava, e se lo usiamo invece di kT nella (41.13) otteniamo la distribuzione della luce in una scatola nera: ~!3 d! I(!) d! = 2 2 ~!/kT (41.16) ⇡ c (e 1) Vediamo che per un grande !, anche se abbiamo !3 al numeratore, c’è al denominatore un e elevato a una potenza enorme, così che la curva scende di nuovo e non «salta per aria» – non otteniamo luce ultravioletta e raggi X dove non ce li aspettiamo! Qualcuno potrebbe lamentare che nella nostra derivazione della (41.16) abbiamo fatto uso della teoria quantistica dei livelli energetici dell’oscillatore armonico, ma della teoria classica nel determinare la sezione d’urto s . Ma la teoria quantistica della luce interagente con un oscillatore armonico dà esattamente il medesimo risultato della teoria classica. Questa, infatti, è la ragione per cui eravamo giustificati nel dedicare tanto tempo all’analisi dell’indice di rifrazione e della diffusione della luce, usando un modello di atomi come piccoli oscillatori – le formule quantistiche sono sostanzialmente le stesse. Torniamo ora al rumore di Johnson in un resistore. Abbiamo già sottolineato che la teoria di questo rumore è in realtà la stessa teoria della distribuzione classica di corpo nero. Infatti, in modo piuttosto sorprendente, abbiamo già detto che se la resistenza di un circuito non fosse una vera resistenza, ma un’antenna (un’antenna agisce come una resistenza perché irradia energia), una resistenza di radiazione, sarebbe facile per noi calcolare quanta dovrebbe essere la potenza. Sarebbe proprio la potenza che entra nell’antenna dalla luce che è all’intorno, e otterremmo la medesima distribuzione, cambiata soltanto di un fattore o due. Possiamo supporre che il resistore sia un generatore con uno spettro incognito di potenza P(!). Lo spettro è determinato dal fatto che questo stesso generatore, collegato a un circuito risonante di qualunque frequenza, come in FIGURA 41.2b, genera nell’induttanza una differenza di potenziale di ampiezza data dall’equazione (41.2). Si è quindi ricondotti al medesimo integrale di (41.10), e lo stesso metodo dà l’equazione (41.3). Per basse temperature il kT di (41.3) deve naturalmente essere sostituito da (41.15). Le due teorie (radiazione di corpo nero e rumore di Johnson) sono intimamente legate anche fisicamente, perché noi possiamo naturalmente collegare un circuito risonante a un’antenna, così la resistenza R è una pura resistenza di radiazione. Siccome la (41.2) non dipende dall’origine fisica della resistenza, sappiamo che il generatore G per una vera resistenza e per una resistenza di radiazione è lo stesso. Qual è l’origine della potenza P(!) generata se la resistenza R è un’antenna ideale in equilibrio con la zona circostante a temperatura T? È la radiazione I(!) nello spazio a temperatura T che raggiunge l’antenna e, come «segnali ricevuti», crea un effettivo generatore. Pertanto si può dedurre una relazione diretta di P(!) e I(!), che conduce allora da (41.13) a (41.3). Tutte le cose di cui abbiamo parlato – il cosiddetto rumore di Johnson, la distribuzione di Planck e la teoria corretta del moto browniano che stiamo per descrivere – sono sviluppi del primo decennio circa di questo secolo. Ora con questi punti e questa storia in mente, ritorniamo al moto browniano.

41.4

Il cammino casuale

Consideriamo come dovrebbe cambiare nel tempo la posizione di una particella che si agita, per tempi molto lunghi rispetto al tempo che intercorre fra «due calci». Considerate una piccola

41.4 • Il cammino casuale

© 978-8808-22107-0

particella in moto browniano che si sta agitando all’intorno con piccoli scatti perché è bombardata da tutte le parti da molecole d’acqua in moto irregolare. Domanda: dopo un dato intervallo di tempo, quanto lontano da dove ha iniziato il moto è probabile si trovi la particella? Questo problema fu risolto da Einstein e Smoluchowski. Se immaginiamo di dividere il tempo in piccoli intervalli, diciamo un centesimo di secondo più o meno, allora dopo il primo centesimo di secondo si sposta qui, nel centesimo successivo si sposta un po’ di più, nel successivo centesimo di secondo si sposta da qualche altra parte, e così via. Rispetto alla rapidità del bombardamento, un centesimo di secondo è un tempo molto lungo. Il lettore può verificare facilmente che il numero di urti che una singola molecola d’acqua riceve in un secondo è circa 1014 , così in un centesimo di secondo riceve 1012 urti, il che è molto! Pertanto dopo un centesimo di secondo non ricorderà ciò che è accaduto prima. In altre parole, le collisioni sono tutte a caso, cosicché un «passo» non è legato al «passo» precedente. È come il famoso problema del marinaio ubriaco: il marinaio esce dal bar e fa una serie di passi, ma ciascun passo è fatto secondo una direzione arbitraria, a caso (FIGURA 41.6). Il problema è: dopo un bel po’ di tempo, dov’è il marinaio? Naturalmente non lo sappiamo! È impossibile dirlo: egli è da qualche parte, più o meno a caso. Ma in media, dove si trova? In media, quanto si è allontanato dal bar? Abbiamo già risposto a questa domanda, perché una volta abbiamo trattato la sovrapposizione della luce proveniente da un intero complesso di sorgenti diverse con diverse fasi, e questo significava sommare un mucchio di frecce con angoli diversi (capitolo 32). Lì abbiamo scoperto che il valore medio del quadrato della distanza da un estremo all’altro di passi casuali, che era l’intensità della luce, è la somma delle intensità dei pezzi separati. E così, con lo stesso tipo di matematica, possiamo dimostrare immediatamente che se R N è la distanza vettoriale dall’origine dopo N passi, il valore medio del quadrato della distanza dall’origine è proporzionale al numero N di passi. Cioè hR2N i = N L 2 , dove L è la lunghezza di ciascun passo. Poiché nel nostro attuale problema, il numero di passi è proporzionale al tempo, il valor medio del quadrato della distanza è proporzionale al tempo: hR2 i = ↵t (41.17) Questo non significa che la distanza media sia proporzionale al tempo. Se la distanza media fosse proporzionale al tempo ciò significherebbe che il movimento avviene a una bella velocità uniforme. Il marinaio sta procedendo in modo relativamente sensibile, ma solo in maniera che il valore medio del quadrato della distanza è proporzionale al tempo. Questa è la caratteristica di un cammino casuale. Possiamo dimostrare molto facilmente che in ciascun passo successivo il quadrato della distanza aumenta, in media, di L 2 . Perché, se scriviamo RN = RN troviamo che

1

R2N = R N · R N = R2N = R2N

+L

1

+ 2R N

1

· L + L2

e facendo la media di molte prove, abbiamo hR2N i = hR2N 1 i + L 2 dal momento che hR N

1

· Li = 0. Così, per induzione, hR2N i = N L 2

(41.18)

Vorremmo ora calcolare il coefficiente ↵ nell’equazione (41.17), e per farlo dobbiamo aggiungere un complemento. Immagineremo che se dovessimo applicare una forza a questa particella (non avente a che fare con il moto browniano – stiamo affrontando un problema marginale, al momento), essa reagirebbe contro la forza nella seguente maniera. Per prima cosa, vi sarebbe dell’inerzia. Sia m il coefficiente d’inerzia, la massa efficace dell’oggetto (non necessariamente uguale alla vera massa della vera particella perché l’acqua deve muoversi intorno alla particella, se la tiriamo). Così, se parliamo di moto in una direzione, c’è un termine m(d2 x/dt 2 ) da una parte. E poi

437

B

S36

41.6 Cammino casuale di 36 passi di lunghezza l. Quanto dista S36 da B? Risposta: circa 6I, in media. FIGURA

438

Capitolo 41 • Il moto browniano

© 978-8808-22107-0

vogliamo anche assumere che se continuassimo a tirare regolarmente l’oggetto, si verificherebbe un frenamento su di esso, da parte del fluido, proporzionale alla velocità. Oltre all’inerzia del fluido, vi è una resistenza al movimento dovuta alla viscosità e alla complessità del fluido. È assolutamente essenziale che vi siano alcune perdite irreversibili, qualcosa di simile alla resistenza, perché esistano fluttuazioni. Non c’è modo di produrre il kT, a meno che non vi siano pure delle perdite. La sorgente delle fluttuazioni è legata molto intimamente a queste perdite. Discuteremo presto quale sia il meccanismo di questo frenamento – parleremo delle forze proporzionali alla velocità e della loro provenienza. Ma supponiamo, per il momento, che questa resistenza esista. La formula del moto provocato da una forza esterna, quando tiriamo la particella in maniera normale, sarà allora d2 x dx m 2 +µ = Fext (41.19) dt dt La quantità µ può essere determinata direttamente dall’esperimento. Per esempio, possiamo osservare la caduta della goccia per gravità. Sappiamo, allora, che la forza è mg, e µ è mg diviso per la velocità di caduta che la goccia assume alla fine. Oppure potremmo mettere la goccia in una centrifuga e vedere a che velocità sedimenta. O, se è carica, possiamo applicarle un campo elettrico. Così µ è una cosa misurabile, non una cosa fittizia, ed è nota per molti tipi di particelle colloidali ecc. Ora usiamo la medesima formula nel caso in cui la forza non sia esterna, ma uguale alle forze irregolari del moto browniano. Cercheremo, quindi, di determinare il valore medio del quadrato della distanza che l’oggetto percorre. Invece di prendere le distanze in tre dimensioni, prendiamo soltanto una dimensione e troviamo il valore medio di x 2 , tanto per prepararci. (Ovviamente il valore medio di x 2 è uguale al valore medio di y 2 e al valore medio di z 2 , e perciò il valore medio del quadrato della distanza è appunto tre volte ciò che stiamo per calcolare.) La componente x delle forze irregolari è, naturalmente, irregolare quanto qualsiasi altra componente. Qual è la rapidità di variazione di x 2 ? È dx 2 /dt = 2x(dx/dt), così ciò che dobbiamo trovare è il valore medio della posizione per la velocità. Mostreremo che questa è una costante e che, pertanto, il valore medio del quadrato del raggio aumenterà proporzionalmente al tempo, e vedremo con quale rapidità. Ora, se moltiplichiamo l’equazione (41.19) per x otteniamo mx

d2 x dx + µx = xFx 2 dt dt

Desideriamo il valore medio di x(dx/dt) rispetto al tempo, sicché prendiamo la media dell’intera equazione e studiamo i tre termini. Ora, che accade a x, se moltiplicato per la forza? Se per caso la particella ha percorso una certa distanza x, allora, siccome la forza è completamente irregolare e non sa da dove la particella sia partita, l’impulso successivo può essere in qualsiasi direzione relativamente a x. Se x è positivo non c’è ragione perché la forza media debba anche agire in quella direzione. È altrettanto probabile una direzione quanto l’altra. Le forze del bombardamento non agiscono in una direzione determinata. Così il valore di x moltiplicato per F è zero. D’altro canto, per il termine mx(d2 x/dt 2 ) dovremo avere un po’ di fantasia e scriverlo nel modo seguente: mx

d2 x d dx =m x dt dt dt 2

!

m

dx dt

!2

Introduciamo questi due termini e facciamo la media di entrambi. Vediamo quanto debba essere x moltiplicato per la velocità. Ora x per la velocità ha un valore medio che non varia col tempo, perché quando raggiunge una certa posizione non ha più il ricordo di dove si trovava prima, così le cose non cambiano più col tempo. Sicché, questa quantità è, in media, zero. Abbiamo lasciato la quantità mv 2 , e questa è l’unica cosa che sappiamo: (1/2)mv 2 ha valore medio (1/2)kT. Pertanto troviamo che * + * + d2 x dx mx 2 + µ x = hxFx i dt dt implica

hmv 2 i +

µ d 2 hx i = 0 2 dt

41.4 • Il cammino casuale

© 978-8808-22107-0

ossia

d 2 kT hx i = 2 dt µ

(41.20)

Di conseguenza, l’oggetto ha un valore medio del quadrato della distanza hR2 i, alla fine di un certo tempo t, pari a t hR2 i = 6kT (41.21) µ E così possiamo realmente determinare a che distanza giungono le particelle! Dobbiamo prima determinare come reagiscono a una forza costante, a che velocità si spostano se sottoposte a una forza nota (per trovare µ), e poi possiamo determinare che distanza raggiungono nei loro moti casuali. Questa equazione è stata di notevole importanza storica, perché fu uno dei primi modi di determinazione della costante k. Dopotutto, possiamo misurare µ, il tempo, la distanza raggiunta dalla particella, e possiamo farne la media. La ragione per cui la determinazione di k era importante è che, nella legge PV = RT per una mole, sappiamo che R, che può anche venire misurato, è pari al numero di atomi di una mole moltiplicato per k. Una mole fu definita in origine come tanti e tanti grammi di ossigeno-16 (ora si usa il carbonio), così, originariamente, il numero di atomi di una mole non era noto. Si tratta, naturalmente, di un problema di grande interesse e importanza. Quanto sono grossi gli atomi? Quanti ce ne sono? Così una delle prime determinazioni del numero di atomi fu fatta attraverso la determinazione della distanza cui giungeva un piccolo granello di sporcizia se lo si osservava pazientemente al microscopio, per un certo intervallo di tempo. E così furono determinati la costante di Boltzmann k e il numero di Avogadro N0 , perché R era già stato determinato.

439

42

Applicazioni della teoria cinetica

42.1

Evaporazione

In questo capitolo discuteremo alcune ulteriori applicazioni della teoria cinetica. Nel capitolo precedente abbiamo messo in luce un aspetto particolare della teoria cinetica, cioè che l’energia cinetica media di ciascun grado di libertà di una molecola o altro oggetto è (1/2)kT. D’altro canto la caratteristica centrale di ciò che andremo a discutere ora è il fatto che la probabilità di trovare una particella in diversi punti, per unità di volume, varia come e

E.P./kT

I fenomeni che desideriamo studiare sono relativamente complicati: un liquido che evapora, elettroni che escono dalla superficie di un metallo o una reazione chimica in cui sono coinvolti un gran numero di atomi. In tali casi non è più possibile ricavare dalla teoria cinetica nessuna asserzione semplice e corretta perché la situazione è troppo complicata. Pertanto questo capitolo, a meno che non sia indicato chiaramente il contrario, è molto inesatto. L’idea da mettere in evidenza è soltanto che con la teoria cinetica possiamo comprendere, più o meno, come dovrebbero andare le cose. Facendo uso di argomenti termodinamici, o di alcune misure empiriche di certe quantità critiche, possiamo ottenere una rappresentazione più accurata dei fenomeni. Tuttavia è molto utile sapere anche soltanto approssimativamente perché qualcosa si comporta come fa, così che quando la situazione è nuova oppure non ancora analizzata, possiamo dire, più o meno, che cosa dovrebbe accadere. Pertanto questa discussione è molto imprecisa ma essenzialmente giusta – giusta nell’idea, ma un po’ semplificata, diciamo, nei dettagli specifici. Il primo esempio che considereremo è l’evaporazione di un liquido. Supponiamo di avere una scatola di grande volume parzialmente riempita di liquido in equilibrio e di vapore a una certa temperatura. Supporremo che le molecole del vapore siano relativamente distanti le une dalle altre e che dentro al liquido le molecole siano raggruppate insieme l’una vicina all’altra. Il problema è di trovare quante molecole si trovano nella fase di vapore, rispetto al numero di molecole presenti nel liquido. Qual è la densità del vapore a una data temperatura, e come dipende dalla temperatura? Sia n il numero di molecole per unità di volume nel vapore. Questo numero, naturalmente, varia con la temperatura. Se aggiungiamo calore, otteniamo più evaporazione. Ora un’altra quantità, 1/Va , sia uguale al numero di atomi per unità di volume nel liquido: supponiamo che ogni molecola nel liquido occupi un certo volume, così che se ci sono più molecole di liquido, allora tutte insieme occupano un volume maggiore. Se Va è il volume occupato da una molecola, il numero di molecole in una unità di volume è una unità di volume divisa per il volume di ciascuna molecola. Inoltre supponiamo che esista una forza di attrazione fra le molecole per tenerle unite insieme nel liquido. Altrimenti non riusciamo a comprendere perché condensi. Così supponiamo che esista una tale forza e che ci sia un’energia di legame delle molecole nel liquido che si perde quando vaporizzano. Supporremo quindi che per trasportare una singola molecola dal liquido al vapore bisogna fare una certa quantità W di lavoro. Esiste, cioè, una certa differenza, W , fra l’energia che ha una molecola nel liquido rispetto a quella che avrebbe se fosse nel vapore, perché dobbiamo strapparla alle altre molecole che la attraggono.

© 978-8808-22107-0

42.1 • Evaporazione

Ora usiamo il principio generale che il numero di atomi per unità di volume in due differenti regioni è n2 = e (E2 E1 )/kT n1 Così il numero n per unità di volume nel vapore, diviso per il numero 1/Va per unità di volume nel liquido, è uguale a nVa = e W /kT (42.1) perché questa è la regola generale. È come l’atmosfera in equilibrio sotto la forza di gravità, in cui il gas è più denso in basso che in alto a causa del lavoro mgh che occorre per sollevare le molecole di gas fino all’altezza h. Nel liquido, le molecole sono più dense che nel vapore perché dobbiamo tirarle fuori attraverso la «collina» di energia W , e il rapporto delle densità è e W /kT . Questo è quanto volevamo dedurre – che la densità del vapore varia come e elevato a meno una certa energia su kT. I fattori che stanno davanti non sono per noi veramente interessanti, perché nella maggior parte dei casi la densità di vapore è molto più bassa di quella dei liquidi. Nelle circostanze in cui non siamo vicino al punto critico dove esse sono quasi identiche, ma in cui la densità del vapore è molto più bassa della densità dei liquidi, il fatto che n sia molto minore di 1/Va è determinato dal fatto che W è molto maggiore di kT. Sicché, formule come la (42.1) sono interessanti solo quando W è molto maggiore di kT, perché in quelle circostanze, dal momento che stiamo elevando e a meno una quantità enorme, se variamo un poco T, quell’enorme potenza varia un po’, e la trasformazione prodotta nel fattore esponenziale è molto più importante di qualsiasi trasformazione che possa verificarsi nei fattori che stanno di fronte. Perché dovrebbero verificarsi dei cambiamenti in fattori come Va ? Perché la nostra è stata un’analisi approssimativa. Dopotutto, in realtà non esiste un volume determinato per ogni molecola; quando variamo la temperatura, il volume Va non rimane costante. Il liquido si espande. Vi sono altre piccole particolarità come quella, e quindi la situazione reale è più complicata. Vi sono ovunque fattori dipendenti dalla temperatura che variano lentamente. Anzi, potremmo dire che W stesso varia leggermente con la temperatura, perché a temperatura più alta, a diverso volume molecolare, vi sarebbero attrazioni diverse in media, e così via. Sicché, mentre potremmo pensare che se abbiamo una formula in cui tutto varia in maniera sconosciuta con la temperatura allora è come se non avessimo nessuna formula, se ci rendiamo conto che l’esponente W /kT è, in generale, molto grande, vediamo che nella curva della densità del vapore in funzione della temperatura la maggior parte della variazione è dovuta al fattore esponenziale, e se prendiamo W come costante e il coefficiente 1/Va come quasi costante, si ha una buona approssimazione per piccoli intervalli lungo la curva. La maggior parte della variazione, in altre parole, è del tipo e W /kT . Risulta che esistono molti, molti fenomeni in natura che sono caratterizzati dal dover prendere a prestito energia da qualche parte, e nei quali la caratteristica centrale della variazione della temperatura è e elevato a meno l’energia divisa per kT. Questo è un fatto utile soltanto quando l’energia è grande rispetto a kT, così che la maggior parte della variazione è contenuta nella variazione di kT e non nella costante e in altri fattori. Consideriamo ora un altro modo di ottenere un risultato piuttosto simile per l’evaporazione, ma esaminandola più dettagliatamente. Per giungere alla (42.1) abbiamo semplicemente applicato una regola valida all’equilibrio, ma per comprendere meglio le cose, non è male tentare di esaminare dettagliatamente ciò che accade. Possiamo descrivere quello che accade anche nel modo seguente: le molecole che si trovano nel vapore bombardano continuamente la superficie del liquido e quando la colpiscono possono rimbalzare via o attaccarsi. C’è un fattore incognito perciò – forse 50 a 50, forse 10 a 90 – non lo sappiamo. Diciamo che si attaccano sempre – possiamo rianalizzare più tardi la cosa nell’ipotesi che esse non si attacchino sempre. Allora a un dato momento vi sarà un certo numero di atomi che condensano sulla superficie del liquido. Il numero di molecole che condensano, il numero di quelle che arrivano su un’area unitaria, è il numero n per unità di volume moltiplicato per la velocità v. Questa velocità delle molecole è legata alla temperatura, perché sappiamo che (1/2)mv 2 è uguale in media a (3/2)kT. Così v è una specie di velocità media. Naturalmente dovremmo integrare sugli angoli e ottenere un certo tipo di media, ma questa è approssimativamente proporzionale

441

442

Capitolo 42 • Applicazioni della teoria cinetica

© 978-8808-22107-0

alla velocità quadratica media, entro un certo fattore. Così Nc = nv

(42.2)

è il numero che arriva per unità di area e condensa. Al medesimo tempo, tuttavia, gli atomi del liquido si muovono irregolarmente all’intorno e di tanto in tanto uno di essi viene buttato fuori. Dobbiamo ora stimare ogni quanto tempo ne viene buttato fuori uno. L’idea sarà che all’equilibrio il numero di quelli che sono buttati fuori per secondo sia uguale al numero di quelli che arrivano al secondo. Quanti vengono buttati fuori? Per venire buttata fuori una particolare molecola deve aver acquistato accidentalmente energia in eccesso rispetto alle sue vicine – energia in considerevole eccesso, dato che essa è attratta molto fortemente dalle altre molecole del liquido. Ordinariamente non se ne va, dato che è attratta così fortemente, ma negli urti qualche volta una di esse acquista accidentalmente energia in eccesso. E la probabilità che acquisti l’energia W in più di cui essa ha bisogno nel nostro caso è molto piccola se W kT. Infatti la probabilità che un atomo abbia acquistato più di questa energia è e W /kT . Questo è il principio generale della teoria cinetica: la probabilità di prendere a prestito un’energia W sopra la media è e elevato a meno l’energia che dobbiamo prendere a prestito divisa per kT. Supponiamo che alcune molecole abbiamo preso questa energia. Dobbiamo ora stimare quante lasciano la superficie per secondo. Naturalmente il solo fatto che una molecola abbia l’energia necessaria non significa che evaporerà effettivamente, perché può essere sepolta troppo profondamente dentro al liquido oppure, anche se è vicina alla superficie, può non muoversi nella direzione giusta. Il numero di atomi che lasciano al secondo l’unità di area sarà qualcosa di questo genere: il numero di atomi vicini alla superficie, per unità di area, diviso per il tempo necessario per scappare, moltiplicato per la probabilità e W /kT che siano pronti a scappare nel senso che hanno energia sufficiente. Supponiamo che ogni molecola alla superficie del liquido possieda una sezione geometrica A. Allora il numero di molecole per unità di area di superficie liquida sarà 1/A. E ora, quanto tempo impiega una molecola a scappare? Se le molecole hanno una certa velocità media v, e debbono spostarsi, diciamo, di un diametro molecolare D, lo spessore del primo strato, allora il tempo necessario per superare quello spessore è il tempo necessario per fuggire, se la molecola ha energia sufficiente. Il tempo sarà D/v. Così il numero delle molecole che evaporano dovrebbe essere approssimativamente 1 v W /kT Ne = e (42.3) A D Ora l’area di ciascun atomo per lo spessore dello strato è approssimativamente uguale al volume Va occupato da un singolo atomo. E così, per avere equilibrio, dobbiamo avere Nc = Ne , ossia nv =

v e Va

W /kT

(42.4)

Possiamo eliminare le v dato che sono uguali; anche se una è la velocità di una molecola del vapore e l’altra è la velocità di una molecola che sta evaporando, esse sono uguali dato che sappiamo che la loro energia cinetica media (in una direzione) è (1/2)kT. Ma qualcuno può obiettare: «No! No! Queste sono quelle che si muovono in modo particolarmente veloce, sono quelle che hanno acquistato energia in eccesso». No in realtà, perché nel momento in cui cominciano a staccarsi dal liquido, esse debbono perdere l’energia in eccesso a favore dell’energia potenziale. Così, quando giungono alla superficie sono rallentate alla velocità v! È la stessa cosa che accadeva nella nostra trattazione della distribuzione delle velocità molecolari nell’atmosfera – in basso, le molecole avevano una certa distribuzione di energia. Quelle che arrivavano in alto avevano la medesima distribuzione d’energia perché quelle lente non arrivavano affatto e le veloci erano rallentate. Le molecole che evaporano hanno la medesima distribuzione energetica di quelle interne – fatto piuttosto rimarchevole. A ogni modo, è inutile cercare di discutere così attentamente intorno alla nostra formula a causa di altre inesattezze, come la probabilità di rimbalzare indietro invece che entrare nel liquido, e così via. Così abbiamo una grossolana idea della rapidità di evaporazione e condensazione e vediamo,

42.2 • Emissione termoionica

© 978-8808-22107-0

naturalmente, che la densità n del vapore varia nello stesso modo di prima, ma ora l’abbiamo compreso abbastanza dettagliatamente piuttosto che soltanto come una formula arbitraria. Questa comprensione più profonda ci permette di analizzare alcune cose. Per esempio, supponiamo di pompare via il vapore tanto in fretta da rimuoverlo con la stessa rapidità con cui si forma (se abbiamo pompe molto buone e se il liquido evapora molto lentamente); con che velocità avrebbe luogo l’evaporazione se mantenessimo il liquido a una temperatura T? Supponiamo di aver già misurato sperimentalmente la densità di vapore all’equilibrio, così che sappiamo quante molecole per unità di volume sono in equilibrio con il liquido a una data temperatura. Ora vorremmo sapere con che velocità evapora. Sebbene abbiamo fatto uso di un’analisi grossolana per quel che riguarda la parte di evaporazione, il numero di molecole di vapore che arrivano non è stato ricavato così male, a parte il fattore incognito del coefficiente di riflessione. Quindi possiamo far uso del fatto che il numero di molecole che partono, all’equilibrio, è uguale al numero di quelle che arrivano. È vero che il vapore viene spazzato via e quindi le molecole vengono soltanto fuori, ma se il vapore fosse lasciato tranquillo, raggiungerebbe la densità di equilibrio alla quale il numero di molecole che torna indietro sarebbe uguale al numero di quelle che evaporano. Pertanto possiamo vedere facilmente che il numero di molecole che escono dalla superficie per secondo è uguale al coefficiente di riflessione R incognito, moltiplicato per il numero di quelle che scenderebbero alla superficie al secondo se il vapore fosse ancora lì, perché questo è quanto bilancerebbe l’evaporazione all’equilibrio: Ne = nvR =

vR e Va

W /kT

(42.5)

Naturalmente, il numero di molecole che colpiscono il liquido dal vapore è facile da calcolare, dato che non è necessario che sappiamo tanto sulle forze come quando ci preoccupiamo del modo in cui le molecole riescono a sfuggire attraverso la superficie del liquido; è molto più facile trattare l’argomento al contrario.

42.2

Emissione termoionica

Possiamo dare un altro esempio di una situazione molto pratica simile all’evaporazione di un liquido – tanto simile che non vale la pena di farne un’analisi separata. È essenzialmente lo stesso problema. In una valvola da radio c’è una sorgente di elettroni, cioè un filamento di tungsteno riscaldato, e una piastra carica positivamente per attrarre gli elettroni. Ogni elettrone che esce dalla superficie del tungsteno è immediatamente spazzato via verso la piastra. Questa è la nostra «pompa» ideale, che «pompa» via gli elettroni continuamente. Ora il problema è: quanti elettroni al secondo possiamo ottenere da un pezzo di tungsteno, e come varia questo numero con la temperatura? La risposta a questo problema è uguale alla (42.5) perché risulta che in un pezzo di metallo gli elettroni sono attratti verso gli ioni o gli atomi del metallo. Per dirla rozzamente, sono attratti verso il metallo. Per far uscire un elettrone da un pezzo di metallo occorre una certa quantità di energia o lavoro. Questo lavoro varia con i diversi tipi di metallo. In realtà varia perfino col carattere della superficie di un dato tipo di metallo, ma il lavoro totale può essere di alcuni volt-elettroni, che, incidentalmente, è tipico dell’energia coinvolta nelle reazioni chimiche. Possiamo ricordare quest’ultimo fatto pensando che la differenza di potenziale di una cella chimica come una batteria da lampada tascabile, che è prodotto da reazioni chimiche, è circa 1 volt. Come possiamo trovare quanti elettroni escono al secondo? Sarebbe assai difficile analizzare gli effetti sugli elettroni uscenti; è più facile analizzare la situazione in senso contrario. Così potremmo cominciare immaginando di non avere trascinato via gli elettroni e che gli elettroni fossero come un gas e potessero ritornare al metallo. Allora all’equilibrio ci sarebbe una certa densità di elettroni che, naturalmente, sarebbe data da una formula uguale alla (42.1), ove Va è il volume per elettrone nel metallo, approssimativamente, e W è uguale a qe , dove è la cosiddetta funzione di lavoro, ossia la differenza di potenziale necessaria per tirar fuori un elettrone dalla

443

444

Capitolo 42 • Applicazioni della teoria cinetica

© 978-8808-22107-0

superficie. Questo ci direbbe quanti elettroni dovrebbero trovarsi nello spazio circostante e colpire il metallo in modo da bilanciare quelli che escono. E così è facile calcolare quanti ne escono se li spazziamo via tutti, perché il numero di quelli che escono è esattamente uguale al numero che entrerebbe con la densità del «vapore» di elettroni di cui sopra. In altre parole la risposta è che la corrente di elettricità che entra per unità di area è uguale alla carica di ciascun elettrone moltiplicata per il numero di elettroni che arrivano per secondo per unità di area, che è il numero per unità di volume moltiplicato per la velocità, come abbiamo visto molte volte: I = qe nv =

qe v e Va

qe /kT

(42.6)

Ora 1 eV corrisponde a kT a una temperatura di 11 600 K. Il filamento della valvola può funzionare, a una temperatura di 1100 K gradi, per esempio, sicché il fattore esponenziale è qualcosa di simile a e 10 ; quando variamo un po’ la temperatura, il fattore esponenziale varia molto. Così, nuovamente, la caratteristica centrale della formula è e qe /kT . In realtà il fattore posto davanti è del tutto sbagliato – risulta che il comportamento degli elettroni in un metallo non è descritto correttamente dalla teoria classica, bensì dalla meccanica quantistica, ma ciò non fa altro che trasformare un po’ il fattore che sta davanti. In realtà, nessuno è mai stato in grado di sistemare la cosa molto bene, anche se molti studiosi hanno fatto uso della più raffinata teoria quantistica nei loro calcoli. Il grosso problema è: W varia leggermente con la temperatura? Se lo fa, non si può distinguere un W che varia lentamente con la temperatura da un diverso coefficiente posto davanti. Vale a dire, se W variasse, diciamo linearmente, con la temperatura cosicché W = W0 + ↵kT allora avremmo e

W /kT

=e

(W0 +↵kT )/kT

=e



e

W0 /kT

Così un W che dipende linearmente dalla temperatura è equivalente a variare una «costante». È, veramente, proprio difficile e di solito infruttuoso tentare di ottenere con esattezza il coefficiente che sta davanti.

42.3

Ionizzazione termica

Si riferisce alla ionizzazione. Immaginiamo di avere, in un gas, un complesso di atomi che si trovano allo stato neutro, per esempio, ma che il gas sia molto caldo e gli atomi si possano ionizzare. Vorremmo sapere quanti ioni sono presenti in una data circostanza se abbiamo una certa densità di atomi per volume unitario a una certa temperatura. Consideriamo di nuovo una scatola in cui vi sono N atomi che possono contenere elettroni. (Se un elettrone è uscito da un atomo, quest’ultimo è chiamato ione, e se l’atomo è neutro, lo chiamiamo semplicemente atomo.) Supponiamo dunque che, a un dato momento qualsiasi, il numero di atomi neutri sia na , il numero di ioni ni e il numero di elettroni ne , tutti per volume unitario. Il problema è: qual è la relazione tra questi tre numeri? In primo luogo, abbiamo due condizioni o vincoli per i numeri. Per esempio, mentre variamo condizioni diverse, come la temperatura e così via, na + ni rimarrebbe costante perché questo sarebbe semplicemente il numero N di nuclei atomici che si trovano nella scatola. Se conserviamo fisso il numero di nuclei per volume unitario, e variamo, per esempio, la temperatura, col procedere della ionizzazione alcuni atomi si trasformerebbero in ioni, ma il numero complessivo degli atomi più gli ioni rimarrebbe invariato, vale a dire na + ni = N Un’altra condizione è che se tutto il gas deve essere elettricamente neutro (e se trascuriamo la doppia o tripla ionizzazione), ciò significa che il numero di ioni è pari al numero di elettroni a ogni istante, ovvero ni = ne

42.3 • Ionizzazione termica

© 978-8808-22107-0

Queste sono equazioni ausiliarie che esprimono semplicemente la conservazione degli atomi e la conservazione della carica. Queste equazioni sono vere e ne faremo uso alla fine quando esamineremo un problema reale. Vogliamo invece ottenere un’altra relazione tra le grandezze. Possiamo farlo nella maniera che segue. Di nuovo ricorriamo all’idea per cui per levare l’elettrone dall’atomo occorre una certa quantità di energia, che chiamiamo energia di ionizzazione, e, per far avere a tutte le formule lo stesso aspetto, vorremmo scriverla come W . Così, sia W pari all’energia che occorre per estrarre un elettrone da un atomo e formare un ione. Ora diciamo di nuovo che il numero di elettroni liberi per volume unitario nel «vapore» è pari al numero di elettroni legati negli atomi per volume unitario, moltiplicato per e elevato a meno la differenza di energia tra lo stato legato e lo stato libero, su kT. Questa è, di nuovo, l’equazione fondamentale. Come possiamo scriverla? Il numero di elettroni liberi per volume unitario sarebbe, naturalmente, ne perché quella è la definizione di ne . Ora, che dire sul numero di elettroni per volume unitario legati agli atomi? Il numero complessivo dei luoghi in cui potremmo porre gli elettroni è evidentemente na + ni , e supporremo che, quando essi sono legati, ciascuno sia legato entro un certo volume Va . Così il volume complessivo che è a disposizione per elettroni che sarebbero legati è (na + ni )Va , sicché potremmo voler scrivere la nostra formula come ne =

na e (na + ni )Va

W /kT

La formula è errata, comunque, in un particolare essenziale, che è il seguente: quando un elettrone si trova già in un atomo, un altro elettrone non può più raggiungere quel volume! In altre parole, non sono disponibili in realtà tutti i volumi di tutti i luoghi possibili per l’unico elettrone che sta cercando di decidere se essere o meno nel vapore o nella posizione condensata, perché in questo problema vi è un particolare in più per cui, quando un elettrone si dirige dove si trova un altro elettrone, non gli è consentito di andarci – viene respinto. Da tale ragione consegue che dovremmo calcolare solo quella parte del volume che è a disposizione di un elettrone per fermarcisi o meno. Vale a dire che quelle già occupate non contano nel volume complessivo a disposizione, ma l’unico volume concesso è quello degli ioni, dove l’elettrone può trovare posti liberi. Quindi, in queste circostanze, troviamo che un modo più elegante di scrivere la nostra formula è 1 W /kT ne ni = e (42.7) na Va Questa formula è chiamata equazione di ionizzazione di Saha. Vediamo, ora, se riusciamo a comprendere da un punto di vista qualitativo perché mai una formula come questa sia giusta, discutendo i fatti cinetici che avvengono. Per prima cosa, di tanto in tanto un elettrone giunge a uno ione ed essi si combinano a formare un atomo. Inoltre, di tanto in tanto, un atomo viene a collisione e si spezza in un ione e un elettrone. Ora, queste due velocità di processo devono essere uguali. A che velocità elettroni e ioni s’incontrano gli uni con gli altri? La velocità viene certamente aumentata se viene aumentato il numero di elettroni per volume unitario. Viene pure aumentata se viene aumentato il numero di ioni per volume unitario. Cioè la velocità complessiva a cui avviene la ricombinazione è senz’altro proporzionale al numero di elettroni moltiplicato per il numero di ioni. Ora, la velocità complessiva a cui avviene la ionizzazione a causa di collisioni deve dipendere linearmente dal numero di atomi che vi sono da ionizzare. E così le velocità si equilibreranno quando vi sarà una qualche relazione tra il prodotto ne ni e il numero di atomi na . Il fatto che questa relazione sia data da questa formula particolare, in cui W è l’energia di ionizzazione, significa, naturalmente, sapere un po’ di più, ma possiamo facilmente capire che la formula implicherebbe, di necessità, le concentrazioni di elettroni, ioni e atomi nella combinazione ne ni /na per produrre una costante indipendente dagli n e dipendente solo dalla temperatura, dalle sezioni d’urto atomiche e da altri fattori costanti. Possiamo anche osservare che, dal momento che l’equazione implica i numeri per volume unitario, se dovessimo fare due esperimenti con un dato numero complessivo N di atomi più ioni, cioè con un certo numero fisso di nuclei, ma usando scatole di volume diverso, gli n sarebbero tutti più piccoli nella scatola più grande. Ma dato che il rapporto ne ni /na permane uguale, il

445

446

Capitolo 42 • Applicazioni della teoria cinetica

© 978-8808-22107-0

numero complessivo di elettroni e ioni deve essere maggiore nella scatola più grande. Per vedere ciò, immaginiamo che dentro una scatola di volume V vi siano N nuclei, e che una frazione di essi f sia ionizzata. Allora fN = ni ne = V e (1 f )N na = V Quindi la nostra equazione diverrà f2 1

N e W /kT = f V Va

(42.8)

In altre parole; se consideriamo una densità di atomi sempre più piccola, o rendiamo sempre più grande il volume del contenitore, la frazione di elettroni e ioni f deve aumentare. Questa ionizzazione, da «espansione» al diminuire della densità, è la ragione per cui crediamo che a densità molto basse, come nello spazio freddo tra le stelle, possano essere presenti degli ioni, anche se possiamo non capire la cosa dal punto di vista dell’energia a disposizione. Per quanto occorrano molti, molti kT di energia per formarli, sono presenti degli ioni. Perché possono essere presenti degli ioni quando vi è tanto spazio intorno, mentre se aumentiamo la densità, gli ioni tendono a scomparire? Risposta: consideriamo un atomo. Di tanto in tanto, la luce, un altro atomo, uno ione, o qualsivoglia cosa conservi l’equilibrio termico, lo colpisce. Molto raramente, dato che occorre una quantità tanto grande di energia in eccesso, un elettrone esce e rimane uno ione. Ora, quell’elettrone, se lo spazio è immenso, vaga e vaga e forse non si avvicina a nulla per anni. Ma, molto raramente, esso ritorna verso un ione ed essi si combinano per formare un atomo. Così la frequenza con cui gli elettroni escono dagli atomi è molto bassa. Ma se il volume è immenso, un elettrone che è sfuggito impiega tanto tempo a trovare un altro ione con cui ricombinarsi che la sua probabilità di ricombinazione è molto, molto bassa; così, nonostante il grande eccesso di energia necessaria, vi può essere un numero ragionevole di elettroni.

42.4

Cinetica chimica

La stessa situazione da noi appena definita «ionizzazione» si verifica anche in una reazione chimica. Per esempio, se due oggetti A e B si combinano in un composto AB, se ci pensiamo un po’ vediamo che AB è ciò che abbiamo chiamato atomo, B è ciò che chiamiamo elettrone e A è ciò che chiamiamo ione. Con queste sostituzioni, le equazioni dell’equilibrio, sono, quanto alla forma, esattamente uguali: n AnB = ce W /kT (42.9) n AB Questa formula non è, naturalmente, esatta, dal momento che la «costante» c dipende dalla quantità di volume concessa ad A e B per combinarsi, e così via, ma con argomentazioni termodinamiche si può identificare quale sia il significato di W nel fattore esponenziale, e risulta che esso è assai vicino all’energia occorrente nella reazione. Supponiamo d’aver tentato d’interpretare questa formula come risultato di collisioni, in maniera molto simile a come interpretammo la formula dell’evaporazione, discutendo della quantità di elettroni che escono e di quelli che tornano nell’unità di tempo. Supponiamo che A e B si combinino una volta ogni tanto, in una collisione a formare un composto AB. E supponiamo che il composto AB sia una molecola complessa che si muove all’intorno e viene colpita da altre molecole, e che di tanto in tanto essa acquisti energia sufficiente per esplodere e scindersi di nuovo in A e B. Ora, nelle reazioni chimiche, risulta realmente che se gli atomi si avvicinano con energia troppo bassa, per quanto possa venire liberata l’energia nella reazione A + B ! AB, il fatto che

42.4 • Cinetica chimica

© 978-8808-22107-0

447

A e B si possano toccare l’un l’altro non provoca necessariamente l’inizio della reazione. Di solito si richiede che la collisione sia piuttosto violenta, anzi, per ottenere che la reazione avvenga davvero, una collisione «dolce» fra A e B può non essere sufficiente, anche se, nel processo, può venir liberata dell’energia. Sicché supponiamo che sia assai normale nelle reazioni chimiche, che, per far sì che A e B formino AB, essi non possano solo colpirsi l’un l’altro, ma debbano colpirsi l’un l’altro con sufficiente energia. Tale energia viene chiamata energia di attivazione – l’energia necessaria ad «attivare» la reazione. Denominiamo A⇤ l’energia di attivazione, l’energia in eccesso necessaria in una collisione perché la reazione possa realmente verificarsi. Allora la velocità Rf con cui A e B producono AB implicherebbe il numero di atomi di A moltiplicato per il numero di atomi di B, moltiplicato per la frequenza con cui un singolo atomo colpirebbe una certa sezione d’urto AB , moltiplicato per ⇤ un fattore e A /kT , che è la probabilità che essi abbiano sufficiente energia: Rf = n A n B v

AB e

A⇤ /kT

Ora dobbiamo trovare la velocità opposta, Rr . Vi è una certa probabilità che AB si dissoci. Per dissociarsi, esso deve avere non soltanto l’energia W di cui ha bisogno per separarsi appena, ma proprio com’era difficile per A e B unirsi, così vi è una specie di collinetta che A e B devono superare per separarsi nuovamente; essi devono avere, non solo energia sufficiente appena per prepararsi alla separazione ma un certo eccesso d’energia. È come inerpicarsi su una collina per giungere in una valle profonda; essi devono scalare la collina quando si uniscono, e devono arrampicarsi per uscire dalla valle e poi scavalcare la collina quando si separano (FIGURA 42.1). Così la velocità con cui AB va in A e B sarà ⇤ proporzionale al numero n AB presente, moltiplicato per e (W +A )/kT : Rr = c 0 n AB e

(W +A⇤ )/kT

(42.10)

E

A* A+B

W AB x

42.1 La relazione energetica per la reazione A + B ! AB.

FIGURA

(42.11)

Il c 0 includerà il volume degli atomi e la frequenza delle collisioni, che possiamo ricavare, come facemmo nel caso dell’evaporazione, con aree e tempi e spessori; ma non lo faremo. La principale caratteristica d’interesse per noi è che quando queste due velocità sono uguali, il loro rapporto è pari all’unità. Questo ci dice che n AnB = ce W /kT n AB come prima, dove c include le sezioni d’urto, le velocità e altri fattori indipendenti dagli n. La cosa interessante è che la velocità della reazione varia essa pure, come e cost./kT , benché la costante non sia uguale a quella che governa le concentrazioni; l’energia di attivazione A⇤ è assolutamente diversa dall’energia W . W governa le proporzioni di A, B e AB, che abbiamo in equilibrio, ma se vogliamo sapere a che velocità A + B va in AB, questa non è una questione d’equilibrio, e qui un’energia diversa, l’energia di attivazione, governa la rapidità della reazione tramite un fattore esponenziale. Inoltre, A⇤ non è una costante fondamentale come W . Supponete che alla superficie della parete – o in qualche altro luogo – A e B potessero temporaneamente attaccarsi in modo tale da potersi combinare più facilmente. In altre parole, potremmo trovare un «tunnel» attraverso la collina, o forse una collina più bassa. Per la conservazione dell’energia, quando avremo finito, avremo ancora ricavato AB da A e B, cosicché la differenza di energia W sarà affatto indipendente dal modo in cui è avvenuta la reazione, ma l’energia di attivazione A⇤ dipenderà moltissimo dal modo in cui si verificherà la reazione. Questo è il motivo per cui le velocità delle reazioni chimiche sono tanto sensibili alle condizioni esterne. Possiamo variare la velocità introducendo una superficie di tipo diverso, possiamo metterla in un «barile diverso» ed essa andrà a diversa velocità, se dipende dalla natura della superficie. Oppure, se introduciamo un terzo tipo di oggetto, esso può variare moltissimo la velocità: alcune sostanze producono variazioni enormi nella velocità semplicemente variando un poco A⇤ – esse sono denominate catalizzatori. Una reazione potrebbe praticamente non avvenire affatto

Capitolo 42 • Applicazioni della teoria cinetica

448

© 978-8808-22107-0

perché A⇤ è troppo grande a una data temperatura, ma quando introduciamo questa sostanza speciale, il catalizzatore, la reazione va veramente molto in fretta, perché A⇤ si è ridotto. Incidentalmente, vi è qualche difficoltà in una reazione siffatta, A più B che produce AB, perché non possiamo conservare sia l’energia sia la quantità di moto quando cerchiamo di unire due oggetti per formarne uno, più stabile. Di conseguenza, ci occorre almeno un certo oggetto C, sicché la reazione reale è molto più complessa. La velocità in avanti implicherebbe il prodotto n A n B nC , e potrebbe sembrare che la nostra formula stia andando male, ma no! Quando guardiamo la velocità con cui AB va nell’altro senso, troviamo che gli è pure necessario venire a collisione con C, sicché vi è un n AB nC nella velocità in senso inverso: gli nC si semplificano nella formula per le concentrazioni all’equilibrio. La legge dell’equilibrio, (42.9), che abbiamo scritto prima è assolutamente garantita per vera, qualunque possa essere il meccanismo della reazione!

42.5

Le leggi della radiazione di Einstein

Ci volgiamo, ora, a un’interessante situazione analoga, che ha a che fare con la legge di radiazione del corpo nero. Nel capitolo precedente ricavammo la legge di distribuzione della radiazione in una cavità, alla maniera di Planck, prendendo in considerazione la radiazione proveniente da un oscillatore. L’oscillatore doveva avere una certa energia media, e dato che oscillava, esso irradiava e continuava a pompare la radiazione dentro alla cavità finché non aveva ammucchiato una radiazione sufficiente a equilibrare l’assorbimento e l’emissione. In quella maniera trovammo che l’intensità di radiazione alla frequenza ! era data dalla formula I(!) d! =

m

(1)

(2)

(3) n

42.2 Transizioni fra due livelli energetici di un atomo: (1) assorbimento, (2) emissione spontanea, (3) emissione indotta. FIGURA

~!3 d! ⇡ 2 c2 (e~!/kT

1)

(42.12)

Tale risultato implicava l’ipotesi che l’oscillatore generatore della radiazione avesse livelli d’energia determinati, uniformemente spaziati. Noi non dicemmo che la luce dovesse essere un fotone o qualcosa del genere. Non ci fu discussione circa il modo in cui, quando un atomo va da un livello a un altro, l’energia doveva uscire in una sola unità d’energia, ~!, sotto forma di luce. L’idea originale di Planck fu che la materia era quantizzata, ma la luce no: gli oscillatori materiali non possono raccogliere un’energia qualsiasi, ma devono prenderla a blocchi. Inoltre, il guaio per quanto riguarda la derivazione, è che essa fu parzialmente classica. Calcolammo l’intensità della radiazione proveniente da un oscillatore secondo la fisica classica; poi ci volgemmo a dire: «No, quest’oscillatore ha un mucchio di livelli d’energia». Così, a poco a poco, per trovare il risultato giusto, il risultato completamente quantistico, si verificò uno sviluppo lento che culminò nella meccanica quantistica del 1927. Ma nel frattempo, vi fu un tentativo da parte di Einstein di trasformare il punto di vista di Planck per cui soltanto gli oscillatori di materia erano quantizzati, nell’idea che la luce era in realtà costituita da fotoni e poteva essere considerata in un certo modo come particelle di energia ~!. Inoltre, Bohr aveva fatto rilevare che qualsiasi sistema di atomi ha livelli d’energia, ma essi non sono necessariamente spaziati in modo uniforme come l’oscillatore di Planck. E così divenne necessario derivare nuovamente o almeno ridiscutere la legge della radiazione da un punto di vista più completamente quantistico. Einstein assunse che la formula finale di Planck fosse giusta, e usò quella formula per ottenere alcune nuove informazioni, precedentemente sconosciute, sull’interazione della radiazione con la materia. La sua trattazione procedette nella maniera che segue: consideriamo due livelli qualsiasi tra i tanti livelli di energia di un atomo, per esempio il livello m-esimo e il livello n-esimo (FIGURA 42.2). Einstein propose che quando un atomo del genere viene investito da luce della giusta frequenza, esso possa assorbire quel fotone di luce e fare una transizione dallo stato n allo stato m, e che la probabilità per secondo che ciò accada dipenda dai due livelli, naturalmente, ma sia proporzionale all’intensità della luce che lo investe. Chiamiamo Bnm la costante di proporzionalità, unicamente per ricordarci che essa non è una costante universale della natura, ma dipende dalla coppia particolare di livelli: alcuni livelli sono facilmente eccitabili; altri sono

42.5 • Le leggi della radiazione di Einstein

© 978-8808-22107-0

difficilmente eccitabili. Ora, quale sarà la formula per la rapidità di emissione da m a n? Einstein propose che dovesse constare di due parti. Primo, anche se non vi fosse luce, vi sarebbe una qualche probabilità che un atomo in uno stato eccitato cada in uno stato più basso, emettendo un fotone; questa, noi la chiamiamo emissione spontanea. È analoga all’idea che un oscillatore con una certa quantità di energia, anche nella fisica classica, non conserva quell’energia, ma la perde per radiazione. Così l’analogo della radiazione spontanea di un sistema classico è che se l’atomo si trova in uno stato eccitato vi sia una certa probabilità Amn , che dipende nuovamente dai livelli, perché esso scenda da m a n, e tale probabilità è indipendente dal fatto che la luce investa l’atomo o meno. Ma Einstein andò oltre, e per confronto con la teoria classica e per mezzo di altre argomentazioni, concluse che anche l’emissione era influenzata dalla presenza della luce – che quando della luce della frequenza giusta investe un atomo, esso ha una probabilità maggiore nell’unità di tempo di emettere un fotone, proporzionale all’intensità della luce, con una costante di proporzionalità Bmn . Più oltre, se deducessimo che tale coefficiente è zero, avremmo scoperto che Einstein era in errore. Naturalmente troveremo che egli aveva ragione. Così Einstein fece l’ipotesi che esistano tre tipi di processi: un assorbimento proporzionale all’intensità della luce, un’emissione proporzionale all’intensità della luce, chiamata emissione indotta, o, talvolta, emissione stimolata, e un’emissione spontanea indipendente dalla luce. Ora immaginiamo di avere, in equilibrio alla temperatura T, un certo numero Nn di atomi nello stato n e un altro numero Nm nello stato m. Allora il numero complessivo degli atomi che passano da n a m è il numero di quelli che si trovano nello stato n moltiplicato per la probabilità al secondo che, se uno si trova in n, salga a m. Così abbiamo una formula per il numero che va da n a m al secondo: Rn!m = Nn Bnm I(!) (42.13) Il numero che va da m a n è espresso nella stessa maniera del numero Nm che si trova in m, moltiplicato per la probabilità al secondo che ciascuno scenda a n. Questa volta la nostra espressione è Rm!n = Nm [Amn + Bmn I(!)] (42.14) Ora supporremo che, in equilibrio termico, il numero degli atomi che salgono debba essere pari al numero di quelli che scendono. Questo è, almeno, un modo in cui il numero resterà sicuramente costante a ogni livello.(1) Sicché consideriamo che queste due probabilità siano uguali, in equilibrio. Ma abbiamo un’altra informazione: sappiamo quant’è grande Nm paragonato a Nn : il loro rapporto è Nm = e (Em En )/kT Nn Ora Einstein assunse che l’unica luce efficace nel provocare la transizione da n a m è la luce che ha la frequenza corrispondente alla differenza di energia, sicché Em

En = ~!

in tutte le nostre formule. Così Nm = Nn e

~!/kT

(42.15)

Così, se rendiamo pari le due probabilità Nn Bnm I(!) = Nm [Amn + Bmn I(!)] e dividiamo per Nm , otteniamo Bnm I(!)e~!/kT = Amn + Bmn I(!)

(42.16)

Da questa equazione, possiamo calcolare I(!). È semplicemente I(!) =

Bnm

Amn ~!/kT e

Bmn

(42.17)

(1) Questo non è l’unico modo in cui si può far sì di conservare costante il numero degli atomi nei vari livelli, ma è quello che in realtà succede. Il fatto che ogni processo, in equilibrio termico, deve essere bilanciato dal suo esatto contrario è chiamato principio del bilancio dettagliato.

449

450

Capitolo 42 • Applicazioni della teoria cinetica

© 978-8808-22107-0

Ma Planck ci ha già detto che la formula deve essere la (42.12). Perciò, possiamo dedurre qualcosa: Bnm deve essere uguale a Bmn , dato che, altrimenti, non possiamo ottenere (e~!/kT 1). Così Einstein scoprì alcune cose che non sapeva come calcolare, cioè che la probabilità di emissione indotta e la probabilità di assorbimento debbono essere uguali. Ciò è interessante. E inoltre, perché la (42.17) e la (42.12) si accordino, Amn Bmn

deve essere

~!3 ⇡ 2 c2

(42.18)

Sicché, se, per esempio, conosciamo la probabilità di assorbimento per un dato livello, possiamo dedurre la probabilità di emissione spontanea e la probabilità di emissione indotta, o qualsiasi combinazione. Questo è il massimo cui Einstein, o qualsiasi altra persona, poteva giungere facendo uso di tali argomentazioni. Il calcolo effettivo della probabilità assoluta di emissione spontanea o di altre probabilità per qualsiasi transizione atomica specifica, richiede, naturalmente, una conoscenza del meccanismo dell’atomo, denominato elettrodinamica quantistica, che non fu scoperto se non undici anni più tardi. Questo lavoro di Einstein venne effettuato nel 1916. La possibilità dell’emissione indotta ha trovato, oggi, interessanti applicazioni. Se è presente della luce, essa tenderà a indurre la transizione verso il basso. La transizione aggiunge, allora, il suo ~! all’energia luminosa a disposizione, se vi fossero degli atomi che si trovano nello stato superiore. Ora, con qualche metodo non termico, possiamo fare in modo di avere un gas in cui il numero di atomi nello stato m sia molto maggiore del numero nello stato n. Questo è molto lontano dall’equilibrio, e quindi non è dato dalla formula e ~!/kT , che vale in equilibrio. Possiamo perfino fare in modo che il numero nello stato superiore sia molto grande, mentre quello dello stato inferiore è praticamente zero. In tal caso la luce che ha la frequenza corrispondente alla differenza d’energia Em En non verrà fortemente assorbita, perché non vi sono molti atomi nello stato n ad assorbirla. D’altro canto, quando quella luce sarà presente, essa indurrà l’emissione da questo stato superiore! Sicché, se avessimo un mucchio di atomi nello stato superiore si verificherebbe una specie di reazione a catena, in cui, nel momento in cui gli atomi cominciassero a emettere, altri verrebbero indotti a emettere, e l’intero complesso di essi scaricherebbe insieme. Questo è ciò che viene chiamato laser, o, nel caso del lontano infrarosso, maser (FIGURA 42.3). Si possono usare vari trucchi per avere gli atomi nello stato m. Vi possono essere livelli più alti che gli atomi riescono a raggiungere se li investiamo con un forte raggio di luce di alta frequenza. Da questi alti h livelli, essi possono scivolare giù, emettendo vari fotoni, finché si bloccano tutti nello stato m. Se tendono a restare nello stato m senza emettere, lo Blu m stato è detto metastabile. E allora vengono tutti rovesciati giù insieme con emissioni indotte. Rosso, luce laser Un altro punto tecnico – se ponessimo questo sistema in una comune n scatola, esso irradierebbe spontaneamente in tante, diverse direzioni, rispetto all’effetto indotto, che ci troveremmo ancora nei pasticci. Ma siamo FIGURA 42.3 Eccitando, diciamo con luce blu, in grado di intensificare l’effetto indotto, di aumentarne l’efficienza, metuno stato più elevato h, che può emettere tendo specchi quasi perfetti su ogni lato della scatola, cosicché la luce che un fotone che lascia gli atomi nello stato m, viene emessa ha un’altra possibilità, e un’altra, e un’altra ancora, di indurre il numero in questo stato m diventa abbastanza grande da iniziare l’azione laser. altre emissioni. Benché gli specchi riflettano quasi al cento per cento, vi è una leggera trasmissione dello specchio, e un po’ di luce esce. Naturalmente, alla fine, per la conservazione dell’energia, esce tutta la luce in modo ben uniforme e senza deviazioni, il che produce gli intensi fasci luminosi che sono oggi possibili con i laser.

43

La diffusione

43.1

Collisioni tra molecole

Finora abbiamo considerato soltanto i moti molecolari in un gas che si trova in equilibrio termico. Vogliamo ora trattare ciò che accade quando le cose sono vicine all’equilibrio, ma non precisamente in equilibrio. In una situazione lontana dall’equilibrio, le cose sono estremamente complesse, ma, in una situazione assai vicina all’equilibrio, possiamo facilmente ricavare ciò che succede. Per vedere cosa succede, dobbiamo, comunque, tornare alla teoria cinetica. La meccanica statistica e la termodinamica trattano della situazione all’equilibrio, ma se ci si allontana dall’equilibrio possiamo solo analizzare quello che succede, per così dire, atomo per atomo. Come semplice esempio di una situazione di non-equilibrio, considereremo la diffusione di ioni in un gas. Immaginiamo che, in un gas, vi sia una concentrazione relativamente piccola di ioni – molecole elettricamente cariche. Se al gas applichiamo un campo elettrico, ciascuno ione subirà l’azione di una forza diversa dalle forze agenti sulle molecole neutre del gas. Se non fossero presenti altre molecole, uno ione avrebbe un’accelerazione costante fino a raggiungere le parete del contenitore. Ma, a causa della presenza delle altre molecole, non può farlo; la sua velocità aumenta soltanto fino a che non viene a collisione con una molecola, perdendo la sua quantità di moto. Di nuovo esso comincia ad acquistare velocità, ma poi, di nuovo perde la sua quantità di moto. L’effetto netto è che uno ione si fa strada lungo un cammino irregolare, ma con un moto netto nella direzione della forza elettrica. Vedremo che uno ione ha un «trascinamento» medio a una velocità media proporzionale al campo elettrico – più forte è il campo, più veloce esso si muove. Mentre il campo è applicato, e mentre lo ione si sta muovendo nella sua direzione, esso, naturalmente, non si trova in equilibrio termico, cerca di raggiungere l’equilibrio, che consiste nel posarsi all’estremo del recipiente. Per mezzo della teoria cinetica possiamo calcolare la velocità di trascinamento. Risulta che con le nostre attuali conoscenze di matematica non siamo in grado realmente di calcolare con precisione ciò che accadrà, ma possiamo ottenere risultati approssimativi che mostrano tutte le caratteristiche essenziali. Possiamo scoprire come muteranno le cose con la pressione, con la temperatura e così via, ma non sarà possibile ottenere esattamente i fattori numerici corretti davanti a tutti i termini. Di conseguenza, nelle nostre derivazioni, non ci preoccuperemo del preciso valore dei fattori numerici. Essi si possono ottenere solo attraverso una trattazione matematica molto più raffinata. Prima di considerare che cosa succede in situazioni di non-equilibrio, dovremo osservare un po’ più da vicino ciò che succede in un gas in equilibrio termico. Avremo bisogno di sapere, per esempio, qual è il tempo medio tra collisioni consecutive di una molecola. Qualsiasi molecola è sottoposta a una serie di collisioni con altre molecole in modo casuale, naturalmente. Una particolare molecola subirà, in un lungo periodo di tempo T, un certo numero di urti N. Se raddoppiamo la durata del tempo, di urti ve ne saranno due volte tanti. Sicché, il numero delle collisioni è proporzionale al tempo T. Vorremmo scriverlo così: N=

T ⌧

(43.1)

Abbiamo scritto la costante di proporzionalità 1/⌧, dove ⌧ avrà le dimensioni di un tempo. La

452

Capitolo 43 • La diffusione

© 978-8808-22107-0

costante ⌧ è il tempo medio tra le collisioni. Supponiamo, per esempio, che in un’ora vi siano 60 collisioni; ⌧ è allora un minuto. Diremmo che ⌧ (un minuto) è il tempo medio tra le collisioni. Potremmo spesso desiderare di fare la seguente domanda: «Qual è la probabilità che una molecola subisca una collisione nel piccolo intervallo successivo di tempo dt?». La risposta, possiamo comprenderlo intuitivamente, è dt/⌧. Ma cerchiamo di produrre un’argomentazione più persuasiva. Immaginiamo che vi sia un numero N assai grande di molecole. Quante subiranno delle collisioni nell’intervallo di tempo successivo dt? Se vi è equilibrio, nulla varia, in media, col tempo. Così N molecole durante il tempo dt subiranno lo stesso numero di collisioni di una molecola durante il tempo N dt. Quel numero, sappiamo che è N dt/⌧. Così il numero di urti di N molecole è N dt/⌧ in un tempo dt, e l’occasione, o probabilità, di un urto per qualsiasi molecola è proprio 1/N volte tanto, ovvero 1 N dt dt = N ⌧ ⌧ come abbiamo supposto sopra. Vale a dire che la frazione delle molecole che subiranno una collisione nel tempo dt è dt/⌧. Per fare un esempio, se ⌧ è un minuto, allora in un secondo la frazione di particella che subirà delle collisioni è 1/60. Ciò significa, naturalmente, che 1/60 delle molecole sono per caso abbastanza vicine a ciò che stanno per colpire in modo che le loro collisioni abbiano luogo nel secondo successivo. Quando diciamo che ⌧, il tempo medio tra le collisioni, è un minuto, non intendiamo dire che tutte le collisioni si verificheranno in istanti separati esattamente da un minuto. Una particolare particella non subisce una collisione, aspetta un minuto e quindi subisce un’altra collisione. I tempi tra collisioni successive sono assolutamente variabili. Non ci occorrerà qui per il lavoro seguente, ma possiamo fare una piccola digressione per rispondere alla domanda: «Quali sono i tempi tra le collisioni?». Sappiamo che per il caso sopra considerato il tempo medio è di un minuto, ma potrebbe interessarci di sapere, per esempio: «Qual è la probabilità di non avere collisione alcuna per due minuti?». Troveremo la risposta al quesito generale: «Quale probabilità vi è che una molecola vada avanti per un tempo t senza avere una collisione?». A un qualche istante scelto ad arbitrio – che chiamiamo t = 0 – cominciamo a osservare una particolare molecola. Quale probabilità vi è che essa vada avanti fino a t senza urtare contro un’altra molecola? Per calcolare la probabilità, osserviamo ciò che accadeva a tutte le molecole N0 all’interno di un recipiente. Dopo aver atteso per un tempo t, alcune di esse avranno subito delle collisioni. Facciamo che N(t) sia il numero di quelle che non hanno avuto collisioni fino al tempo t. N(t), naturalmente, è meno di N0 . Possiamo trovare N(t) perché sappiamo come esso varia col tempo. Se sappiamo che N(t) molecole sono arrivate fino a t, N(t + dt), il numero di quelle che arrivano fino a t + dt, è inferiore a N(t) del numero di quelle che subiscono collisioni in dt. Abbiamo scritto sopra il numero di quelle che collidono nel tempo dt in funzione del tempo medio come dN =

N(t) dt ⌧

Abbiamo l’equazione

dt (43.2) ⌧ La quantità a primo membro può, secondo le definizioni del calcolo, venire scritta come N(t + dt) = N(t)

N(t)

N(t + dt) = N(t) +

dN dt dt

Facendo tale sostituzione, l’equazione (43.2) diventa d N(t) = dt

N(t) ⌧

(43.3)

Il numero di quelle che si perdono nell’intervallo dt è proporzionale al numero di quelle presenti, e inversamente proporzionale alla vita media ⌧. L’equazione (43.3) viene facilmente integrata se la riscriviamo così dN(t) dt = (43.4) N(t) ⌧

43.2 • Il cammino libero medio

© 978-8808-22107-0

Ciascun membro è un differenziale esatto, sicché l’integrale è ln N(t) =

t + (costante) ⌧

(43.5)

che è come dire N(t) = (costante)e

t/⌧

(43.6)

Sappiamo che la costante deve essere esattamente N0 , il numero complessivo delle molecole presenti, dal momento che tutte quante cominciano a t = 0 ad aspettare la loro «successiva» collisione. Possiamo scrivere il nostro risultato come N(t) = N0 e

t/⌧

(43.7)

Se desideriamo la probabilità di non avere collisioni, P(t), la possiamo ottenere dividendo N(t) per N0 , quindi P(t) = e t/⌧ (43.8) Il nostro risultato è il seguente: la probabilità che una particolare molecola duri più di un tempo t senza subire una collisione è e t/⌧ , dove ⌧ è il tempo medio tra le collisioni. La probabilità vale 1 ossia la certezza per t = 0, e diventa minore man mano che t diventa sempre maggiore. La probabilità che la molecola eviti una collisione per un tempo pari a ⌧ è e 1 ⇡ 0, 37... La probabilità che essa abbia un tempo maggiore di quello medio tra le collisioni è minore di un mezzo. Ciò va benissimo, perché vi sono molecole in numero sufficiente che vanno avanti senza subire collisioni per tempi molto più lunghi del tempo medio prima di urtare, di modo che il tempo medio può essere ancora ⌧. All’inizio abbiamo definito ⌧ come il tempo medio tra le collisioni. Il risultato ottenuto nell’equazione (43.7) dice anche che l’intervallo medio tra un istante di partenza arbitrario e la collisione successiva è pure ⌧. Possiamo dimostrare questo fatto un po’ sorprendente nella maniera che segue. Il numero delle molecole che subiscono la loro successiva collisione durante l’intervallo dt al tempo t dopo un istante di partenza scelto ad arbitrio è N(t) dt/⌧. Il loro «intervallo di tempo fino alla successiva collisione» è, naturalmente, proprio t. Il «tempo medio fino alla collisione successiva» si ottiene nella solita maniera: ⌅ 1 1 N(t) intervallo medio fino alla collisione successiva = t dt N0 0 ⌧ Facendo uso di N(t), ottenuto nella (43.7), e valutando l’integrale, troviamo proprio che rappresenta il tempo medio da un qualsiasi istante alla collisione successiva.

43.2

Il cammino libero medio

Un altro modo di descrivere le collisioni molecolari è di parlare, non del tempo tra le collisioni, ma del cammino percorso dalla particella tra una collisione e l’altra. Se diciamo che il tempo medio tra le collisioni è ⌧ e che le molecole hanno una velocità media v, possiamo aspettarci che il cammino medio tra le collisioni, che chiameremo l, sia il prodotto ⌧v. Questa distanza tra le collisioni è chiamata, di solito, cammino libero medio: l = ⌧v

(43.9)

In questo capitolo saremo un po’ imprecisi su quale genere di media intendiamo in ogni caso particolare. Le varie medie possibili – il valore medio, il valore quadratico, ecc. – sono quasi tutte uguali e differiscono per fattori prossimi a uno. Dal momento che per ottenere i fattori numerici corretti è necessaria comunque un’analisi dettagliata, non occorre che ci preoccupiamo della media necessaria in ogni punto particolare. Possiamo anche avvertire il lettore che i simboli algebrici di cui facciamo uso per alcune quantità fisiche (per esempio, l per quanto riguarda il

453

Capitolo 43 • La diffusione

454

Area di collisione σc Area unitaria

cammino libero medio) non seguono una convenzione comunemente accettata, soprattutto perché non esiste un accordo comune. Proprio come la probabilità che una molecola venga a collisione in un breve intervallo dt è pari a dt/⌧, così, la probabilità che essa venga a collisione nel percorrere una distanza dx è dx/l. Seguendo la medesima linea di argomentazione di cui sopra, il lettore può mostrare che la probabilità che una molecola percorra almeno la distanza x prima di subire l’urto successivo è e x/l . La distanza media che una molecola percorre prima di venire a collisione con un’altra molecola – il cammino libero medio l – dipenderà dal numero delle molecole che vi sono lì intorno e dalla «dimensione» delle molecole, cioè dalla grandezza del bersaglio che esse rappresentano. La «dimensione» effettiva di un bersaglio, in una collisione, di solito noi la descriviamo con una «sezione trasversale di collisione»,(1) lo stesso concetto che viene usato nella fisica nucleare, o nei problemi di diffusione della luce. Consideriamo una particella in moto che percorre una distanza dx attraverso un gas avente n0 diffusori (molecole) per volume unitario (FIGURA 43.1). Se osserviamo ogni unità di area perpendicolare alla direzione del moto della particella da noi scelta, vi troveremo n0 dx molecole. Se ciascuna presenta un’area di collisione effettiva, o, come la si designa di solito, «sezione trasversale di collisione», c , in tal caso l’area complessiva coperta dai diffusori è c n0 dx. Per «sezione trasversale di collisione» intendiamo l’area entro cui si deve collocare il centro della nostra particella, se essa deve urtare contro una particolare molecola. Se le molecole fossero delle piccole sfere (rappresentazione classica) ci aspetteremmo che c

L’area totale coperta è σcn0dx dx

© 978-8808-22107-0

= ⇡(r 1 + r 2 )2

dove r 1 e r 2 sono i raggi dei due oggetti che vengono a collisione. La probabilità che la nostra particella venga a collisione è il rapporto tra l’area coperta da molecole diffondenti e l’area complessiva, che abbiamo presa pari a uno. Così la probabilità di una collisione nel percorrere una distanza dx è esattamente c n0 dx: probabilità di una collisione in dx =

Il numero totale di molecole è n0dx

43.1 Sezione trasversale di collisione. FIGURA

c n0 dx

(43.10)

Abbiamo visto sopra che la probabilità di collisione in dx può anche essere scritta, in funzione del cammino libero medio l, come dx/l. Confrontando ciò con la (43.10), possiamo mettere in relazione il cammino libero medio con la sezione d’urto di collisione: 1 = l

c n0

(43.11)

che si ricorda più facilmente se la scriviamo come c n0 l

=1

(43.12)

Tale formula si può pensare come se dicesse che vi dovrebbe essere una collisione, in media, quando la particella percorre una distanza l tale che le molecole diffondenti possano appena coprire l’area complessiva. In un volume cilindrico di lunghezza l e base di area unitaria, vi sono n0 l diffusori; se ciascuno ha un’area c l’area complessiva coperta è n0 l c , che è proprio un’unità di area. L’intera area non è coperta, naturalmente, perché alcune molecole sono in parte nascoste dietro ad altre. Questo è il motivo per cui alcune molecole raggiungono una distanza maggiore di l prima di venire a collisione. È soltanto in media che le molecole subiscono una collisione durante il tempo in cui percorrono la distanza l. Da misure del cammino libero medio l, possiamo determinare la sezione d’urto di collisione c e confrontare il risultato con calcoli basati su una dettagliata teoria della struttura atomica. Ma questo è un altro argomento! Torniamo ora al problema degli stati di non-equilibrio. (1)

Il termine comunemente usato in italiano è «sezione d’urto». (N.d.T.)

43.3 • La velocità di trascinamento

© 978-8808-22107-0

43.3

La velocità di trascinamento

Vogliamo descrivere quel che succede a una molecola, o a parecchie molecole, che, in qualche modo, sono diverse dalla gran maggioranza delle molecole di un gas. Ci riferiremo alle molecole della «maggioranza» come a molecole di «fondo», e chiameremo le molecole differenti dalle molecole di fondo molecole «speciali» o, per farla breve, molecole S. Una molecola potrebbe essere speciale per un qualsiasi numero di ragioni: potrebbe essere più pesante delle molecole di fondo. Potrebbe essere un diverso composto chimico. Potrebbe avere una carica elettrica – cioè, essere uno ione in un fondo di molecole non cariche. A causa delle loro masse o cariche diverse le molecole S possono subire forze diverse da quelle delle molecole di fondo. Considerando ciò che succede a queste molecole S possiamo comprendere gli effetti fondamentali che entrano in gioco, in modo simile, in molti fenomeni distinti. Per elencarne alcuni: la diffusione dei gas, le correnti elettriche nelle batterie, la sedimentazione, la separazione centrifuga ecc. Cominciamo concentrandoci sul processo fondamentale: una molecola S in un gas di fondo è sollecitata da una qualche forza specifica F (che potrebbe essere, per esempio, gravitazionale o elettrica) e inoltre dalle forze non altrettanto specifiche dovute alle collisioni con le molecole di fondo. Vorremmo descrivere il comportamento generale della molecola S. Ciò che le accade, in dettaglio, è che essa si muove all’intorno qua e là mentre urta ripetutamente contro altre molecole. Ma se la osserviamo attentamente vediamo che essa in realtà fa qualche progresso ben netto nella direzione della forza F. Diciamo che vi è un trascinamento sovrapposto al suo moto casuale. Vorremmo sapere qual è la velocità del suo trascinamento – la sua velocità di trascinamento (vdrift ) – dovuta alla forza F. Se cominciamo a osservare una molecola S in un qualche istante, possiamo aspettarci che essa si trovi in un certo punto tra due collisioni. Oltre alla velocità che le è rimasta dopo l’ultima collisione, essa sta acquistando una componente di velocità dovuta alla forza F. In breve tempo (in media in un tempo ⌧) essa subirà un urto e inizierà un nuovo tratto della sua traiettoria. Avrà una nuova velocità iniziale, ma la medesima accelerazione dovuta a F. Per non complicare le cose per il momento, supporremo che dopo ogni collisione la nostra molecola S abbia una partenza assolutamente «nuova». Cioè, che essa non conservi il ricordo della passata accelerazione dovuta a F. Questa potrebbe essere un’ipotesi ragionevole se la nostra molecola S fosse molto più leggera delle molecole di fondo, ma certo non è valida in generale. Tratteremo più avanti un’ipotesi migliore. Per il momento, dunque, la nostra ipotesi è che la molecola S esca da ogni collisione con una velocità che può essere in qualsivoglia direzione con eguale probabilità. La velocità iniziale la porterà ugualmente in tutte le direzioni e non contribuirà ad alcun moto netto, sicché non ci preoccuperemo più della sua velocità iniziale dopo una collisione. Oltre al moto casuale, ciascuna molecola S avrà, in ogni momento, una velocità addizionale nella direzione della forza F, che ha acquistato dal momento dell’ultima collisione. Qual è il valore medio di questa parte della velocità? È esattamente l’accelerazione F/m (dove m è la massa della molecola S) moltiplicata per il tempo medio a partire dall’ultima collisione. Ora il tempo medio a partire dall’ultima collisione deve essere uguale al tempo medio per arrivare fino alla collisione successiva, che abbiamo chiamato, in precedenza, ⌧. La velocità media che ha origine da F è, naturalmente, proprio quella chiamata velocità di trascinamento, sicché abbiamo il rapporto vdrift =

F⌧ m

(43.13)

Questo rapporto fondamentale è il nocciolo del nostro argomento. Vi può essere qualche complicazione nel determinare che cosa sia, ma il processo fondamentale è definito dall’equazione (43.13). Noterete che la velocità di trascinamento è proporzionale alla forza. Sfortunatamente, non esiste alcun nome di uso generale per la costante di proporzionalità. Nomi diversi sono stati usati per ogni diverso tipo di forza. Se in un problema elettrico la forza è scritta come il prodotto della carica per il campo elettrico, F = qE, allora la costante di proporzionalità fra la velocità e il campo elettrico E è di solito denominata «mobilità». Malgrado la possibilità di un po’ di

455

456

Capitolo 43 • La diffusione

© 978-8808-22107-0

confusione, noi useremo il termine mobilità per il rapporto tra la velocità di trascinamento e la forza, per qualsiasi tipo di forza. Scriviamo vdrift = µF

(43.14)

in generale, e indicheremo con µ la mobilità. Dall’equazione (43.13) abbiamo che µ=

⌧ m

(43.15)

La mobilità è proporzionale al tempo medio tra le collisioni (vi sono meno collisioni a rallentarla) e inversamente proporzionale alla massa (maggiore inerzia significa minore velocità acquistata tra le collisioni). Ottenere il coefficiente numerico corretto nell’equazione (43.13), che è corretta così come data, richiede una certa attenzione. Senza voler confondere, dovremmo ancora sottolineare il fatto che le argomentazioni hanno una sottigliezza che può essere apprezzata solo con uno studio attento e particolareggiato. Per illustrare che vi sono delle difficoltà, a dispetto delle apparenze, ripeteremo nuovamente in modo ragionevole ma errato, l’argomento che ha condotto all’equazione (43.13) (e tale modo lo si troverà in molti libri di testo!). Avremmo potuto dire: il tempo medio tra le collisioni è ⌧. Dopo una collisione, la particella parte con velocità distribuita a caso, ma tra le collisioni acquista una velocità addizionale pari all’accelerazione moltiplicata per il tempo. Dal momento che, per giungere alla collisione seguente occorre il tempo ⌧, essa vi giunge con la velocità (F/m)⌧. All’inizio della collisione essa aveva velocità zero. Sicché, tra le due collisioni essa ha, in media, una velocità che è la metà di quella finale, quindi la velocità media di trascinamento è 1 F⌧ 2 m Sbagliato! Questo risultato è sbagliato ed è giusto il risultato dell’equazione (43.13), benché le argomentazioni possano apparire ugualmente soddisfacenti. La ragione per cui è sbagliato il secondo risultato è un tantino sottile, e ha a che fare con quanto segue; l’argomento viene presentato come se tutte le collisioni fossero separate dall’intervallo medio ⌧. Il fatto è che certi intervalli sono più brevi e altri più lunghi di quello medio. Gli intervalli brevi si verificano più spesso ma apportano un contributo minore alla velocità di trascinamento perché hanno minore probabilità «di cominciare ad andare veramente». Se si tiene conto propriamente della distribuzione dei tempi liberi tra le collisioni, si può mostrare che il fattore 1/2, che è stato ottenuto dalla seconda argomentazione, non vi dovrebbe essere. L’errore è stato fatto nel cercare di porre in relazione, per mezzo di un’argomentazione semplice, la velocità media finale con la velocità media stessa. Questa relazione non è semplice, quindi la cosa migliore è di concentrarsi su ciò che si cerca: la velocità media stessa. La prima argomentazione che abbiamo presentato determina direttamente – ed esattamente! – la velocità media. Ma probabilmente ora possiamo comprendere perché in generale non cercheremo di ricavare tutti i coefficienti numerici esatti nelle nostre derivazioni elementari! Ritorniamo ora alla nostra ipotesi semplificatrice, secondo la quale ciascuna collisione cancella ogni ricordo del moto passato, cioè dopo ciascuna collisione si effettua una nuova partenza. Supponiamo che la nostra molecola S sia un oggetto pesante in uno sfondo di molecole più leggere. Allora, la nostra molecola S non perderà in ciascuna collisione la sua quantità di moto «in avanti». Occorrerebbero parecchie collisioni prima che il suo moto venisse nuovamente «casualizzato». Dovremmo, invece, assumere che in ciascuna collisione – in media in ogni tempo – essa perda una certa frazione della sua quantità di moto. Non elaboreremo i particolari, ma affermeremo solo che il risultato è equivalente alla sostituzione di ⌧, l’intervallo medio di collisione, con un nuovo – e più lungo – ⌧, corrispondente all’intervallo medio di «perdita della memoria», cioè all’intervallo medio per dimenticare la sua quantità di moto in avanti. Con tale interpretazione di ⌧ possiamo usare la formula (43.15) per situazioni che non sono proprio tanto semplici come quelle che abbiamo assunte inizialmente.

43.4 • Conduttività ionica

© 978-8808-22107-0

43.4

457

Conduttività ionica

Applichiamo ora i nostri risultati a un caso particolare. Immaginiamo di b avere un gas in un recipiente in cui sono pure contenuti alcuni ioni – atomi o molecole con una carica elettrica netta. Mostriamo, schematicamente, la situazione nella FIGURA 43.2. E Se due pareti opposte del contenitore sono armature metalliche, possiaMetallo mo collegarle ai morsetti di una batteria e così produrre nel gas un campo di area A elettrico. Il campo elettrico darà luogo a una forza sugli ioni, sicché essi cominceranno a spostarsi verso l’una o l’altra delle armature. Verrà indotta + – una corrente elettrica e il gas, assieme ai suoi ioni, si comporterà come Isolante un resistore. Calcolando il flusso degli ioni dalla velocità di trascinamento, Gas con ni ioni possiamo calcolare la resistenza. Specificamente ci chiediamo: in che modo per unità di volume il flusso della corrente elettrica dipende dalla differenza di voltaggio V che applichiamo tra le due armature? Consideriamo il caso per cui il nostro recipiente sia una scatola rettanAlla batteria di tensione V golare di lunghezza b e area trasversale A (FIGURA 43.2). Se la differenza di potenziale, o tensione, da una armatura all’altra è V , il campo elettrico E tra le armature è V /b. (Il potenziale elettrico è il lavoro svolto nel tra- FIGURA 43.2 Corrente elettrica in un gas ionizzato. sportare una carica unitaria da un’armatura all’altra. La forza su una carica unitaria è E. Se il campo E è uguale dappertutto tra le armature, il che rappresenta per ora una approssimazione abbastanza buona, il lavoro fatto su una carica unitaria è proprio espresso da Eb, sicché V = Eb.) La forza speciale su uno ione del gas è qE, dove q è la carica dello ione. La velocità di trascinamento dello ione è, allora, µ moltiplicato per tale forza, ovvero vdrift = µF = µqE = µq

V b

(43.16)

Una corrente elettrica I è il flusso di carica in un tempo unitario. La corrente elettrica verso una delle armature è data dalla carica complessiva degli ioni che giungono all’armatura in una unità di tempo. Se gli ioni si spostano verso l’armatura con la velocità vdrift , quelli che si trovano entro una distanza vdriftT giungeranno all’armatura nel tempo T. Se vi sono ni ioni per unità di volume, il numero di quelli che raggiungono l’armatura nel tempo T è ni AvdriftT. Ogni ione porta la carica q, sicché abbiamo carica raccolta in T = qni AvdriftT (43.17) La corrente I è la carica raccolta in T divisa per T, quindi I = qni Avdrift

(43.18)

Sostituendo vdrift dato dalla (43.16), abbiamo I = µq2 ni

A V b

(43.19)

Troviamo che la corrente è proporzionale alla tensione, che è proprio la forma della legge di Ohm, e la resistenza R è l’inverso della costante di proporzionalità: 1 A = µq2 ni R b

(43.20)

Abbiamo una relazione tra la resistenza e le proprietà molecolari ni , q e µ, che dipende a sua volta da m e ⌧. Se conosciamo, da misurazioni atomiche, ni e q, si potrebbe usare una misura di R per determinare µ, e da µ anche ⌧.

458

Capitolo 43 • La diffusione

43.5

© 978-8808-22107-0

Diffusione molecolare

Ci volgiamo ora a un diverso tipo di problema, e a una diversa specie di analisi: la teoria della diffusione. Supponiamo di avere un recipiente di gas in equilibrio termico, e di introdurre in qualche posto del recipiente una piccola quantità di un gas di tipo diverso. Chiameremo gas «di fondo» il gas originario, e gas «speciale» quello nuovo. Il gas speciale comincerà a spargersi per tutto il recipiente, ma si spargerà lentamente a causa della presenza del gas di fondo. Questo lento processo di spargimento è detto diffusione. La diffusione è controllata principalmente dal fatto che le molecole del gas speciale vengono sballottate all’intorno dalle molecole del gas di fondo. Dopo un gran numero di collisioni, le molecole speciali finiscono per spargersi più o meno uniformemente per tutto il volume. Dobbiamo stare attenti a non confondere la diffusione di un gas col trasporto macroscopico che può verificarsi in seguito a correnti di convezione. In genere la mescolanza di due gas si verifica per una combinazione di convezione e diffusione. Ci interessiamo ora soltanto al caso che non vi siano correnti «di vento». Il gas si espande unicamente a causa dei moti molecolari, per diffusione. Desideriamo calcolare a che velocità avviene la diffusione. Calcoliamo ora il flusso netto delle molecole del gas «speciale» dovuto ai moti molecolari. Vi sarà un flusso netto solo quando vi è una qualche distribuzione non uniforme delle molecole, altrimenti tutti i moti molecolari si medierebbero non dando alcun flusso netto. Consideriamo per prima cosa il flusso nella direzione x. Per trovare il flusso, consideriamo una superficie piana immaginaria perpendicolare all’asse x e contiamo il numero di molecole speciali che attraversano questo piano. Per ottenere il flusso netto dobbiamo calcolare come positive quelle molecole che attraversano nella direzione di x positivo e sottrarre a questo numero il numero di quelle che attraversano nella direzione x negativa. Come abbiamo visto molte volte, il numero che attraversa l’area di una superficie in un tempo T è dato dal numero che inizia l’intervallo T in un volume che si estende per la distanza v T a partire dal piano. (Osservate che qui v è la vera velocità molecolare non la velocità di trascinamento.) Semplificheremo la nostra algebra dando alla nostra superficie un’area unitaria. Quindi il numero di molecole speciali che passano da sinistra a destra (prendendo la direzione +x verso la destra) è n v T, dove n è il numero delle molecole speciali per volume unitario verso sinistra (entro un fattore 2 o qualcosa di simile, ma noi ignoriamo tali fattori!). Il numero di quelle che attraversano da destra a sinistra è, in modo simile, n+ v T, dove n+ è la densità di molecole speciali sul lato destro del piano. Se chiamiamo J la corrente molecolare, con cui intendiamo il flusso netto di molecole per unità di area nell’unità di tempo, abbiamo J=

n v T

n+ v T T

(43.21)

ossia J = (n

n+ ) v

(43.22)

Che cosa useremo per n e n+ ? Quando diciamo «la densità a sinistra», che distanza verso sinistra intendiamo? Dovremmo scegliere la densità nel luogo da cui le molecole hanno iniziato il loro «volo», perché il numero di quelle che iniziano tali viaggi è determinato dal numero di quelle presenti in quel luogo. Così con n dovremmo intendere la densità a una certa distanza verso sinistra pari al cammino libero medio l, e, per n+ , la densità alla distanza l a destra della nostra superficie immaginaria. È conveniente considerare che la distribuzione delle nostre molecole speciali nello spazio sia descritta da una funzione continua di x, y e z che chiameremo na . Con na (x, y, z) intendiamo la densità numerica delle molecole speciali in un piccolo elemento di volume centrato in (x, y, z). In funzione di na possiamo esprimere la differenza n+ n come n+

n =

dna dx

x=

dna 2l dx

(43.23)

43.5 • Diffusione molecolare

© 978-8808-22107-0

Sostituendo questo risultato nell’equazione (43.22) e trascurando il fattore 2, otteniamo Jx = lv

dna dx

(43.24)

Abbiamo trovato che il flusso delle molecole speciali è proporzionale alla derivata della densità, ossia a ciò che talvolta viene chiamato il «gradiente» della densità. È chiaro che abbiamo fatto molte approssimazioni grossolane. Oltre a diversi fattori 2 che abbiamo tralasciato, abbiamo fatto uso di v laddove avremmo dovuto usare vx , e abbiamo assunto che n+ e n si riferiscano a luoghi alla distanza l perpendicolarmente alla nostra superficie, mentre per quelle molecole che non viaggiano perpendicolarmente all’elemento di superficie, l dovrebbe corrispondere alla distanza obliqua dalla superficie. Tutti questi perfezionamenti si possono fare; il risultato di un’analisi più accurata mostra che il secondo membro dell’equazione (43.24) dovrebbe essere moltiplicato per 1/3. Quindi una migliore risposta è lv dna 3 dx

Jx =

(43.25)

Equazioni simili si possono scrivere per le correnti nelle direzioni y e z. La corrente Jx e il gradiente di densità dna /dx possono venire misurati per mezzo di osservazioni macroscopiche. Il loro rapporto determinato sperimentalmente è detto «coefficiente di diffusione», D. Cioè dna Jx = D (43.26) dx Siamo stati in grado di dimostrare che per un gas ci aspettiamo D=

1 lv 3

(43.27)

Fin qui, in questo capitolo, abbiamo considerato due processi distinti: mobilità, il trascinamento delle molecole dovuto a forze «esterne»; e diffusione, lo sparpagliamento determinato soltanto dalle forze interne, le collisioni casuali. Comunque, vi è una relazione tra i due processi, dato che entrambi dipendono, fondamentalmente, dai moti termici, e il cammino libero medio l compare in entrambi i calcoli. Se, nell’equazione (43.25), sostituiamo l = v⌧ e ⌧ = µm, abbiamo Jx =

1 2 dna mv µ 3 dx

(43.28)

Ma mv 2 dipende unicamente dalla temperatura. Ricordiamo che 1 2 3 mv = kT 2 2

(43.29)

quindi

dna (43.30) dx Troviamo che D, il coefficiente di diffusione, è esattamente kT moltiplicato per µ, il coefficiente di mobilità: D = µkT (43.31) Jx = µkT

E risulta che il coefficiente numerico della (43.31) è proprio giusto – non debbono essere aggiunti fattori in più per ovviare alle nostre grossolane assunzioni. Possiamo mostrare in realtà, che la (43.31) deve essere sempre corretta – perfino in situazioni complesse (per esempio, il caso di una sospensione di un liquido) dove i particolari dei nostri semplici calcoli non si applicherebbero affatto. Per mostrare che la (43.31) deve essere corretta in generale, la ricaveremo in modo diverso, facendo uso unicamente dei princìpi fondamentali della meccanica statistica. Immaginiamo una situazione in cui vi sia un gradiente di molecole «speciali» e si abbia una corrente di diffusione

459

460

Capitolo 43 • La diffusione

© 978-8808-22107-0

proporzionale al gradiente della densità secondo l’equazione (43.26). Applichiamo ora un campo di forze nella direzione x, di modo che ogni molecola speciale senta la forza F. Secondo la definizione della mobilità µ vi sarà una velocità di trascinamento data da (43.32)

vdrift = µF

Per le nostre solite argomentazioni, la corrente di trascinamento (il numero netto di molecole che attraversano una unità di area nell’unità di tempo) sarà Jdrift = na vdrift

(43.33)

Jdrift = na µF

(43.34)

ovvero Ora regoliamo la forza F di modo che la corrente di trascinamento dovuta a F controbilanci esattamente la diffusione, cosicché non vi sia flusso netto delle nostre molecole speciali. Abbiamo Jx + Jdrift = 0 ovvero

dna = na µF (43.35) dx Nelle condizioni di «bilanciamento» troviamo un gradiente fisso (nel tempo) di densità dato da D

dna na µF = dx D

(43.36)

Ma osservate! Noi descriviamo una condizione d’equilibrio, quindi si applicano le leggi d’equilibrio della meccanica statistica. Secondo tali leggi la probabilità di trovare una molecola alla coordinata x è proporzionale a e U/kT , dove U è l’energia potenziale. In funzione della densità numerica na , ciò significa che na = n0 e U/kT (43.37) Se differenziamo la (43.37) rispetto a x, troviamo dna = n0 e dx

U/kT

1 dU kT dx

(43.38)

ovvero

dna na dU = (43.39) dx kT dx Nella nostra situazione, dato che la forza F è nella direzione x, l’energia potenziale U è proprio F x, e dU/dx = F. Allora l’equazione (43.39) diventa dna na F = dx kT

(43.40)

(Questa è proprio esattamente l’equazione (40.2), da cui in primo luogo abbiamo ricavato e U/kT , sicché ci ritroviamo al punto di partenza.) Confrontando la (43.40) con la (43.36), otteniamo esattamente l’equazione (43.31). Abbiamo mostrato che l’equazione (43.31), che dà la corrente di diffusione in funzione della mobilità, ha il coefficiente corretto ed è vera in generale. La mobilità e la diffusione sono intimamente collegate. Questa relazione fu ricavata per la prima volta da Einstein.

43.6

Conducibilità termica

I metodi della teoria cinetica di cui abbiamo fatto uso sopra possono anche venire usati per calcolare la conducibilità termica di un gas. Se il gas che si trova in cima in un recipiente è più

43.6 • Conducibilità termica

© 978-8808-22107-0

caldo di quello che si trova in fondo, il calore fluirà dalla cima verso il fondo. (Pensiamo che la cima sia più calda, perché, altrimenti, si stabilirebbero delle correnti di convezione e il problema non sarebbe più di conduzione del calore.) Il trasferimento del calore dal gas più caldo al gas più freddo avviene per la diffusione delle molecole «calde» – quelle dotate di maggiore energia – verso il basso e la diffusione delle molecole «fredde» verso l’alto. Per calcolare il flusso di energia termica possiamo informarci sull’energia trasportata in basso attraverso un elemento di area dalle molecole che muovono verso il basso, e sull’energia trasportata in alto attraverso la superficie dalle molecole che si muovono verso l’alto. La differenza ci darà il flusso netto di energia verso il basso. La conducibilità termica  è definita come rapporto tra la rapidità con cui l’energia termica è trasportata attraverso una superficie di area unitaria e il gradiente di temperatura: 1 dQ dT =  A dt dz

(43.41)

Dal momento che i particolari dei calcoli sono assolutamente simili a quelli svolti sopra nel considerare il flusso della corrente elettrica in un gas ionizzato, lasceremo per esercizio al lettore il compito di dimostrare che knlv (43.42) = 1 dove kT/( 1) è l’energia media di una molecola alla temperatura T. Se usiamo la relazione nl c = 1, la conducibilità di calore si può scrivere come =

1

kv 1

c

(43.43)

Abbiamo un risultato piuttosto sorprendente. Sappiamo che la velocità media delle molecole di gas dipende dalla temperatura ma non dalla densità. Ci aspettiamo che c dipenda solo dalla dimensione delle molecole. Quindi il nostro semplice risultato ci dice che la conducibilità termica  (e, di conseguenza, la rapidità di flusso del calore in qualsiasi circostanza particolare) è indipendente dalla densità del gas! La variazione nel numero dei «portatori» di energia con una variazione di densità è esattamente compensata dalla maggiore distanza che i «portatori» possono percorrere tra una collisione e l’altra. Ci si potrebbe chiedere: «Il flusso di calore è indipendente dalla densità del gas al limite in cui la densità va a zero? Quando non c’è gas affatto?». Certamente no! La formula (43.43) è stata ricavata, come lo sono state tutte le altre in questo capitolo, nell’ipotesi che il cammino libero medio fra le collisioni sia molto più piccolo di qualsiasi dimensione del contenitore. Tutte le volte in cui la densità del gas è così bassa che una molecola ha una buona probabilità di passare da una parete all’altra del contenitore senza avere una collisione, nessuno dei calcoli di questo capitolo va bene. In casi del genere dobbiamo ritornare alla teoria cinetica e ricalcolare i dettagli di ciò che accadrà.

461

44

Le leggi della termodinamica

44.1

Macchine termiche: la prima legge

Fin qui abbiamo trattato le proprietà della materia dal punto di vista atomico, tentando di comprendere approssimativamente che cosa accadrà se supponiamo le cose fatte di atomi che obbediscono a certe leggi. Tuttavia vi sono numerose relazioni fra le proprietà delle sostanze che si possono ricavare senza considerare la struttura dettagliata dei materiali. La determinazione delle relazioni fra le varie proprietà dei materiali, senza conoscerne la struttura interna, è l’argomento della termodinamica. Storicamente la termodinamica fu sviluppata prima che fosse raggiunta una comprensione della struttura interna della materia. Per esempio: sappiamo dalla teoria cinetica che la pressione di un gas è causata dal bombardamento molecolare, e sappiamo che se scaldiamo un gas, così che il bombardamento cresce, la pressione deve crescere. Inversamente, se in un contenitore del gas il pistone viene mosso verso l’interno contro la forza di bombardamento, crescerà l’energia delle molecole che bombardano il pistone, e di conseguenza crescerà la temperatura. Così, da una parte, se aumentiamo la temperatura a un volume fissato, aumentiamo la pressione. D’altra parte, se comprimiamo il gas, troveremo che la temperatura crescerà. Dalla teoria cinetica si può derivare una relazione quantitativa fra questi due effetti, ma istintivamente si potrebbe supporre che essi siano legati in qualche maniera necessaria, indipendente dai dettagli delle collisioni. Consideriamo un altro esempio. Molte persone hanno familiarità con questa interessante proprietà della gomma: se prendiamo un elastico e lo tiriamo, esso si scalda. Se lo si pone fra le labbra, per esempio, e lo si tira, si può avvertire un definito riscaldamento, e questo riscaldamento è reversibile nel senso che se si rilascia rapidamente l’elastico mentre si trova fra le labbra, esso si raffredda sensibilmente. Ciò significa che quando tendiamo un elastico esso si scalda, e quando rilasciamo la tensione dell’elastico esso si raffredda. Ora l’istinto potrebbe suggerirci che se scaldassimo un elastico, esso potrebbe tirarsi: il fatto che tendere un elastico lo riscalda potrebbe implicare che lo scaldare un elastico dovrebbe farlo contrarre. E, FIGURA 44.1 Il riscaldamento dell’elastico. in realtà, se avviciniamo una fiamma a gas a un elastico che sostiene un peso, vedremo che l’elastico si contrae bruscamente (FIGURA 44.1). Così è vero che quando scaldiamo un elastico esso si contrae, e questo fatto è legato in modo preciso al fatto che quando gli togliamo la tensione, esso si raffredda. Il meccanismo interno della gomma che produce questi effetti è molto complesso. Lo descriveremo in una certa misura da un punto di vista molecolare, sebbene in questo capitolo il nostro scopo principale sia comprendere la relazione fra questi effetti indipendentemente dal modello molecolare. Ciò nonostante, possiamo mostrare col modello molecolare che questi effetti sono intimamente legati. Un modo di comprendere il comportamento della gomma è di riconoscere che questa sostanza consiste di un enorme groviglio di lunghe catene di molecole, una specie di «spaghetti molecolari» con una complicazione in più: fra le catene vi sono legami trasversali – come uno spaghetto che talvolta si salda a un altro nel punto in cui lo incrocia – un enorme groviglio. Quando tiriamo tale groviglio, alcune delle catene tendono ad allinearsi nella direzione in cui si esercita la trazione. Nello stesso tempo, le catene sono in moto termico, così che si urtano

© 978-8808-22107-0

44.1 • Macchine termiche: la prima legge

continuamente l’una con l’altra. Segue che una tale catena, quando viene tirata, non rimarrebbe tirata di per se stessa, perché sarebbe colpita ai lati da altre catene e altre molecole, e tenderebbe ad attorcigliarsi di nuovo. Così la vera ragione per cui un elastico tende a contrarsi è questa: quando lo si tira, le catene sono allungate e l’agitazione termica delle molecole dai lati delle catene tende ad attorcigliarle e accorciarle. Si può allora capire che se le catene sono tenute tese e si aumenta la temperatura, in modo che aumenta anche il vigore del bombardamento ai lati delle catene, le catene tendono a tirare verso l’interno, e quando sono scaldate possono tirare un peso più forte. Se, dopo essere stato teso per un po’, si lascia ritirare l’elastico, ogni catena diventa molle e le molecole che la colpiscono perdono energia nel battere sulla catena che si sta ritirando. Così la temperatura diminuisce. Abbiamo visto come questi due processi, contrazione quando si riscalda e raffreddamento durante il rilassamento, possono essere messi in relazione dalla teoria cinetica, ma sarebbe una tremenda sfida determinare dalla teoria la precisa relazione fra i due. Dovremmo conoscere quante collisioni c’erano al secondo e l’aspetto delle catene, e dovremmo tener conto di altre complicazioni di tutti i tipi. Il meccanismo dettagliato è tanto complesso che non possiamo in realtà, con la teoria cinetica, determinare esattamente che cosa accade; nondimeno fra i due effetti che osserviamo si può ricavare una relazione definita senza conoscere nulla circa il meccanismo interno! L’intero argomento della termodinamica dipende essenzialmente dal tipo di considerazione seguente: siccome un elastico è «più forte» a temperature più elevate di quanto non lo sia a temperature più basse, dovrebbe essere possibile sollevare pesi, e muoverli all’intorno e così compiere lavoro col calore. Infatti, abbiamo già visto sperimentalmente che un elastico riscaldato può sollevare un peso. Lo studio del modo in cui si compie il lavoro col calore è l’inizio della scienza della termodinamica. Si può costruire una macchina che compia lavoro usando l’effetto del riscaldamento su un elastico? Si può costruire una macchina dall’aspetto stupido che fa proprio questo. Consiste di una ruota di bicicletta in cui tutti i raggi sono elastici (FIGURA 44.2). Se si scaldano gli elastici da una parte della ruota con un paio di lampade a raggi infrarossi, essi diventano «più forti» degli elastici dall’altra parte. Il centro di gravità della ruota sarà tirato da una parte, via dal supporto, così che la ruota gira. Ruotando, gli elastici freddi si spostano verso il calore, e gli elastici riscaldati si allontanano dal FIGURA 44.2 La macchina termica a elastici. calore e si raffreddano, in modo che la ruota gira lentamente finché le viene comunicato calore. L’efficienza di questa macchina è estremamente bassa. Quattrocento watt di potenza si riversano nelle due lampade, ma con tale macchina è appena possibile sollevare una mosca! Tuttavia una questione interessante è se possiamo ottenere che il calore compia il lavoro in modi più efficienti. Infatti, la scienza della termodinamica cominciò con un’analisi, da parte del grande ingegnere Sadi Carnot, del problema di come costruire la macchina migliore e più efficiente, e questo costituisce uno dei pochi famosi casi nei quali l’ingegneria ha contribuito in modo fondamentale alla teoria fisica. Un altro esempio che viene alla mente è la più recente analisi di Claude Shannon sulla teoria dell’informazione. Incidentalmente, queste due analisi risultano strettamente collegate. Ora il modo in cui funziona ordinariamente una macchina a vapore è che il calore proveniente da un fuoco fa bollire dell’acqua, e il vapore così formato si espande e spinge su un pistone che fa girare una ruota. Così il vapore spinge il pistone – e poi? Bisogna completare l’opera: un modo stupido di completare il ciclo sarebbe lasciare sfuggire il vapore nell’aria, perché allora bisogna continuare a fornire acqua. È più a buon mercato – più efficiente – lasciare andare il vapore in un’altra scatola dove viene condensato da acqua fredda, e poi pompare di nuovo l’acqua nella caldaia, così che circola continuamente. Il calore è così fornito alla macchina e convertito in lavoro. Ora, sarebbe meglio usare alcol? Che proprietà dovrebbe avere una sostanza per fare la migliore macchina possibile? Questa fu la questione alla quale si dedicò Carnot, e uno dei sottoprodotti fu la scoperta del tipo di relazione che abbiamo spiegato prima.

463

464

Capitolo 44 • Le leggi della termodinamica

© 978-8808-22107-0

I risultati della termodinamica sono tutti contenuti implicitamente in certe affermazioni apparentemente semplici dette leggi della termodinamica. Al tempo in cui visse Carnot la prima legge della termodinamica, la conservazione dell’energia, non era nota. Le argomentazioni di Carnot erano delineate con tanta cura, tuttavia, che sono valide anche se al suo tempo la prima legge non era nota! Qualche tempo dopo, Clausius fece una derivazione più semplice che poteva essere compresa più facilmente dei ragionamenti molto sottili di Carnot. Ma risultò che Clausius assumeva, non la conservazione dell’energia in generale, ma che il calore era conservato secondo la teoria del calorico, che più tardi si dimostrò essere falsa. Così è stato detto spesso che la logica di Carnot era sbagliata. Ma la sua logica era assolutamente corretta. Soltanto la versione semplificata di Clausius, che tutti leggevano, non era corretta. La cosiddetta seconda legge della termodinamica fu così scoperta da Carnot prima della prima legge! Sarebbe interessante riportare l’argomento di Carnot che non usava la prima legge, ma non faremo questo perché desideriamo imparare la fisica, non la storia. Useremo la prima legge fin dall’inizio, nonostante il fatto che una gran quantità di cose può essere fatta senza di essa. Cominciamo con l’enunciare la prima legge, la conservazione dell’energia: se si ha un sistema e gli si cede calore e si compie lavoro su di esso, allora la sua energia aumenta del calore che gli è stato comunicato e del lavoro fatto. Possiamo scrivere ciò nel modo seguente: il calore Q comunicato al sistema, più il lavoro W fatto sul sistema, è uguale all’aumento dell’energia U del sistema; quest’ultima energia è chiamata qualche volta energia interna: variazione di U = Q + W

(44.1)

La variazione di U si può rappresentare come la somma di una piccola quantità di calore Q e di un piccolo lavoro W : U = Q+ W (44.2) che è una forma differenziale della stessa legge. Conosciamo questo molto bene da un capitolo precedente.

44.2

La seconda legge

Ora, e la seconda legge della termodinamica? Sappiamo che se lavoriamo contro l’attrito, diciamo, il lavoro perduto è uguale al calore prodotto. Se compiamo lavoro in una stanza a temperatura T, e compiamo il lavoro abbastanza lentamente, la temperatura della stanza non cambia molto, e abbiamo convertito lavoro in calore a una data temperatura. E della possibilità inversa? È possibile riconvertire il calore in lavoro a una data temperatura? La seconda legge della termodinamica asserisce che non è possibile. Sarebbe molto conveniente essere capaci di convertire calore in lavoro semplicemente invertendo un processo come l’attrito. Se consideriamo soltanto la conservazione dell’energia, potremmo pensare che l’energia termica, come quella dei moti vibrazionali delle molecole, potrebbe costituire un bel rifornimento di energia utile. Ma Carnot assunse che è impossibile estrarre l’energia del calore a una singola temperatura. In altre parole, se il mondo intero fosse alla stessa temperatura, non si potrebbe convertire in lavoro alcuna parte della sua energia termica: mentre il processo di trasformazione di lavoro in calore può avvenire a una data temperatura, non lo si può invertire per riottenere di nuovo il lavoro. Specificamente, Carnot assunse che non si può prendere del calore a una certa temperatura e convertirlo in lavoro senza nessun altro cambiamento nel sistema o nei dintorni. Quell’ultima frase è molto importante. Supponiamo di avere un bidone di aria compressa a una certa temperatura, e lasciamo espandere l’aria. Essa può compiere lavoro; può fare andare dei martelli pneumatici, per esempio. Si raffredda un po’ nell’espansione, ma se avessimo un grande mare, come l’oceano, a una data temperatura – una riserva di calore – potremmo riscaldarla di nuovo. Così abbiamo preso calore dal mare e abbiamo compiuto lavoro con l’aria compressa. Ma Carnot non era in errore, perché non abbiamo lasciato tutto come era. Se ricomprimiamo l’aria che lasciamo espandere, troveremo che stiamo facendo del lavoro in più, e quando abbiamo finito scopriremo che non solo non abbiamo ottenuto alcun lavoro dal sistema a temperatura T, ma in

44.3 • Macchine reversibili

© 978-8808-22107-0

realtà ne abbiamo fatto su di esso. Dobbiamo parlare soltanto di situazioni nelle quali il risultato netto dell’intero processo è togliere calore e convertirlo in lavoro, proprio come il risultato netto del processo di compiere lavoro contro l’attrito è prendere lavoro e convertirlo in calore. Se ci muoviamo in un cerchio, possiamo riportare il sistema precisamente al punto di partenza, col risultato netto di aver fatto lavoro contro l’attrito e aver prodotto calore. Possiamo invertire il processo? Girare un interruttore, in modo che ogni cosa vada all’indietro, in modo che l’attrito faccia lavoro contro di noi, e raffreddi il mare? Secondo Carnot: no! Così supponiamo che ciò sia impossibile. Se fosse possibile significherebbe, tra le altre cose, che potremmo sottrarre calore da un corpo freddo e comunicarlo a un corpo caldo senza spender niente, per così dire. Ora noi sappiamo che è naturale che una cosa calda possa scaldarne una fredda; se mettiamo semplicemente insieme un corpo caldo e uno freddo e non cambiamo nient’altro, la nostra esperienza ci assicura che non accadrà che il corpo caldo diventi più caldo e quello freddo diventi più freddo! Ma se potessimo ottenere lavoro estraendo il calore dall’oceano, per esempio, o da qualunque altra cosa a una singola temperatura, allora quel lavoro potrebbe essere riconvertito in calore per attrito a qualche altra temperatura. Per esempio, l’altro braccio di una macchina che compie lavoro potrebbe strofinare qualche cosa che è già caldo. Il risultato netto sarebbe quello di sottrarre calore da un corpo «freddo», l’oceano, e comunicarlo a uno caldo. Ora, l’ipotesi di Carnot, la seconda legge della termodinamica, è qualche volta enunciata come segue: il calore non può, da se stesso, fluire da un oggetto freddo a uno caldo. Ma, come abbiamo appena visto, questi due enunciati sono equivalenti: primo, che non si può escogitare un processo il cui unico risultato sia quello di convertire calore in lavoro a una singola temperatura, e secondo, che non si può far fluire spontaneamente il calore da un posto freddo a uno caldo. Useremo prevalentemente la prima forma. L’analisi di Carnot sulle macchine termiche è molto simile all’argomento che abbiamo presentato a proposito delle macchine per sollevare pesi nella discussione della conservazione dell’energia nel capitolo 4. Infatti quell’argomento è stato modellato sull’argomento di Carnot circa le macchine termiche, e così la trattazione presente suonerà assai simile. Supponiamo di costruire una macchina termica, che abbia da qualche parte una «caldaia» a temperatura T1 . Un certo calore Q1 è sottratto alla caldaia, la macchina a vapore compie un certo lavoro W , e poi fornisce un certo calore Q2 a un «condensatore» a un’altra temperatura T2 (FIGURA 44.3). Carnot non disse quanto calore, perché non conosceva la prima legge, e non usò la legge per cui Q2 era uguale a Q1 perché non ci credeva. Sebbene tutti pensassero che, secondo la teoria del calorico, le quantità di calore Q1 e Q2 dovessero essere uguali, Carnot non disse che erano uguali – ciò fa parte dell’ingegnosità del suo argomento. Se facciamo uso della prima legge, troviamo che il calore ceduto, Q2 , è il calore Q1 introdotto, meno il lavoro fatto W : Q2 = Q1

W

(44.3)

(Se abbiamo un certo tipo di processo ciclico in cui l’acqua è pompata di nuovo nella caldaia dopo che si è condensata, diremo che abbiamo il calore Q1 assorbito e il lavoro W fatto, durante ogni ciclo, per una certa quantità di acqua che percorre il ciclo.) Ora costruiremo un’altra macchina e vedremo che non possiamo ottenere più lavoro dalla stessa quantità di calore ceduta alla temperatura T1 , con il condensatore ancora alla temperatura T2 . Useremo la stessa quantità di calore Q1 dalla caldaia, e tenteremo di ottenere più lavoro di quanto ne abbiamo ottenuto dalla macchina a vapore, magari usando un altro fluido, come l’alcol.

44.3

Macchine reversibili

Dobbiamo ora analizzare le nostre macchine. Una cosa è chiara: perderemo qualcosa se le macchine contengono dispositivi in cui c’è attrito. La macchina migliore sarà una macchina senza attrito. Adottiamo, allora, la stessa idealizzazione che adottammo quando abbiamo studiato la conservazione dell’energia; cioè, una macchina perfettamente priva di attrito.

465

W

T1

T2 Q1

FIGURA

termica.

44.3

Q2

Macchina

466

Capitolo 44 • Le leggi della termodinamica

© 978-8808-22107-0

Dobbiamo anche considerare l’analogo del moto senza attrito, il trasferimento di calore «senza attrito». Se poniamo un oggetto caldo a temperatura elevata contro un oggetto freddo, in modo che fluisca il calore, allora non è possibile far fluire il calore in direzione opposta con una variazioT + ∆T T T – ∆T T ne molto piccola della temperatura di un oggetto o dell’altro. Ma quando Flusso di Flusso di abbiamo una macchina praticamente priva di attrito, se la spingiamo da calore calore una parte con una piccola forza, essa va da quella parte, e se la spingiamo con una piccola forza dall’altra parte, va dall’altra parte. Dobbiamo trovare l’analogo di moto senza attrito: trasferimento di calore del quale possiamo cambiare la direzione con una piccola variazione soltanto. Se la differenza FIGURA 44.4 Trasferimento reversibile di calore. di temperatura è finita, ciò è impossibile, ma se ci si accerta che il calore fluisca sempre tra due cose sostanzialmente alla stessa temperatura, con appena una differenza infinitesima per farlo fluire nella direzione desiderata, si dice che il flusso è reversibile. In FIGURA 44.4 è schematizzato un trasferimento reversibile di calore: se scaldiamo un po’ l’oggetto a sinistra, il calore fluirà verso destra; se lo raffreddiamo un po’, il calore fluirà verso sinistra. Così troviamo che la macchina ideale è una macchina cosiddetta reversibile, nella quale ogni processo è reversibile nel senso che, con variazioni minime, variazioni infinitesime, possiamo far andare la macchina in direzione opposta. Ciò significa che in nessuna parte della macchina deve esistere alcun attrito apprezzabile; e in nessuna parte della macchina ci deve essere alcun posto dove il calore dei serbatoi, o la fiamma della caldaia, siano in contatto diretto con qualche cosa sensibilmente più fredda o più calda. Consideriamo ora una macchina ideale in cui tutti i processi sono reversibili. Per mostrare che una cosa del genere è possibile in linea di principio, daremo l’esempio del ciclo di una macchina che può essere o può non essere pratica, ma che è almeno reversibile, nel senso dell’idea di Carnot. Supponiamo di avere un gas in un cilindro dotato di un pistone senza attrito. Il gas non è necessariamente un gas perfetto. Il fluido non deve nemmeno essere un gas, ma per essere precisi diciamo che abbiamo un gas perfetto. Supponiamo anche di avere due sorgenti di calore T1 e T2 – cose grandi e grosse che hanno temperature definite T1 e T2 . Supporremo in questo caso che T1 sia maggiore di T2 . Scaldiamo per prima cosa il gas e allo stesso tempo espandiamolo, mentre è in contatto con la sorgente di calore a T1 (FIGURA 44.5). Mentre facciamo questo, tirando fuori il pistone molto lentamente mentre il calore fluisce nel gas, ci assicureremo che la temperatura del gas non si discosti mai molto da T1 . Se tiriamo il pistone troppo velocemente, la temperatura del gas cadrà troppo al di sotto di T1 e allora il processo non sarà completamente reversibile, ma se lo tiriamo

Q1 T1

T2

Fase (1) - Espansione isoterma alla temperatura T1 con assorbimento del calore Q1

T1

T1

T2

T2

Fase (2) - Espansione adiabatica: la temperatura scende da T1 a T2

Q2

T1

44.5 Fasi del ciclo di Carnot.

FIGURA

T2

Fase (3) - Compressione isoterma alla temperatura T2 con cessione del calore Q1

T2 T1

T1 T2

Fase (4) - Compressione adiabatica: la temperatura sale da T2 a T1

44.3 • Macchine reversibili

© 978-8808-22107-0

467 FIGURA

Il ciclo di

T1

(1)

Q1 T = T1 A

b

Q1 W

W' – W lavoro utile

B

d T = T2

(2) (3)

44.7 Macchina reversibile A fatta funzionare a rovescio dalla macchina B. FIGURA

Area = lavoro utile

(4)

Pressione

44.6

Carnot.

a

Q1 – W

c

Q1 – W' T2

Volume

abbastanza lentamente, la temperatura del gas non si allontanerà mai molto da T1 . D’altra parte, se spingiamo indietro il pistone lentamente, la temperatura sarebbe solo infinitesimamente più alta di T1 e il calore si riverserebbe indietro. Vediamo che una siffatta espansione isoterma (a temperatura costante), eseguita abbastanza lentamente e con delicatezza, è un processo reversibile. Per comprendere ciò che stiamo facendo, useremo un diagramma (FIGURA 44.6) della pressione del gas in funzione del suo volume. Quando il gas si espande, la pressione diminuisce. La curva contrassegnata con (1) ci dice come cambiano la pressione e il volume se si conserva la temperatura fissa al valore T1 . Per un gas ideale questa curva sarebbe PV = N kT1 Durante un’espansione isoterma la pressione diminuisce all’aumentare del volume finché non ci fermiamo nel punto b. Nello stesso tempo, un certo calore Q1 deve fluire nel gas dal serbatoio, perché se il gas fosse espanso senza trovarsi a contatto con il serbatoio si raffredderebbe, come già sappiamo. Avendo completato l’espansione isoterma, fermandoci al punto b, togliamo il cilindro dal serbatoio e continuiamo l’espansione. Questa volta non permettiamo che alcun calore entri nel cilindro. Eseguiamo di nuovo l’espansione lentamente, così non c’è ragione per cui non possiamo invertirla, e di nuovo assumiamo che non ci sia attrito. Il gas continua a espandersi e la temperatura diminuisce, poiché non vi è più calore che entra nel cilindro. Lasciamo espandere il gas, seguendo la curva indicata con (2) finché la temperatura decresce fino a T2 , nel punto indicato con c. Questo tipo di espansione, eseguito senza aggiungere calore, è chiamata espansione adiabatica. Per un gas ideale, già sappiamo che la curva (2) ha la forma PV = cost. dove è una costante maggiore di 1, così che la curva adiabatica ha una pendenza più negativa della curva isoterma. Il cilindro di gas ha ora raggiunto la temperatura T2 , così che se lo poniamo sulla sorgente a temperatura T2 non ci saranno variazioni irreversibili. Ora comprimiamo lentamente il gas mentre è in contatto con il serbatoio a temperatura T2 , seguendo la curva contrassegnata con (3) (FIGURA 44.5, fase 3). Siccome il cilindro è in contatto col serbatoio, la temperatura non aumenta, ma il calore Q2 fluisce dal cilindro al serbatoio alla temperatura T2 . Avendo compresso isotermicamente il gas lungo la curva (3) fino al punto d, togliamo il cilindro dalla sorgente di calore a temperatura T2 e lo comprimiamo ulteriormente, senza lasciare uscire del calore. La temperatura crescerà, e la pressione seguirà la curva contrassegnata con (4). Se eseguiamo propriamente ogni fase, possiamo ritornare al punto a alla temperatura T1 , da cui siamo partiti, e ripetere il ciclo. Vediamo che su questo diagramma abbiamo fatto percorrere al gas un ciclo completo, e durante un ciclo abbiamo immesso Q1 alla temperatura T1 e tolto Q2 alla temperatura T2 . Ora

468

Capitolo 44 • Le leggi della termodinamica

© 978-8808-22107-0

il punto è che questo ciclo è reversibile, così che potremmo rappresentare tutte le fasi nell’altro verso. Avremmo potuto andare indietro anziché avanti: avremmo potuto cominciare al punto a, a temperatura T1 , espandere lungo la curva (4), espandere ulteriormente a temperatura T2 , assorbendo il calore Q2 , e così via, percorrendo il ciclo all’indietro. Se percorriamo il ciclo in una direzione, dobbiamo compiere del lavoro sul gas; se lo percorriamo nell’altra direzione, il gas compie del lavoro su di noi. Incidentalmente, è facile trovare l’ammontare complessivo del⇤ lavoro, perché il lavoro durante ogni espansione è la pressione per la variazione di volume, P dV . In questo particolare diagramma abbiamo riportato P verticalmente e V ⇤orizzontalmente. Così se chiamiamo y la distanza verticale e x la distanza orizzontale, questo è y dx; in altre parole, l’area sotto la curva. Così l’area sotto ogni curva numerata è una misura del lavoro fatto dal gas o sul gas nella fase corrispondente. È facile vedere che il lavoro netto eseguito è l’area tratteggiata della figura. Ora che abbiamo dato un esempio di macchina reversibile, supporremo che siano possibili anche altre macchine del genere. Assumiamo di avere una macchina reversibile A che prende Q1 a T1 , fa il lavoro W , e cede del calore a T2 . Ora assumiamo di avere qualunque altra macchina B di creazione umana, già progettata o non ancora inventata, fatta di elastici, vapore, o qualunque cosa, reversibile o meno, che sia progettata in modo da prendere la stessa quantità di calore Q1 a T1 e cedere il calore alla temperatura inferiore T2 (FIGURA 44.7). Assumiamo che la macchina B faccia un certo lavoro W 0. Ora mostreremo che W 0 non è maggiore di W , cioè che nessuna macchina può fare più lavoro di una macchina reversibile. Perché? Supponiamo, infatti, che W 0 sia maggiore di W . Allora potremmo prendere il calore Q1 dal serbatoio a T1 , e con la macchina B potremmo compiere il lavoro W 0 e cedere del calore al serbatoio a T2 ; non importa quanto. Fatto ciò, potremmo serbare un po’ del lavoro W 0, che si suppone maggiore di W ; potremmo usarne una parte W , è conservare il rimanente W 0 W , come lavoro utile. Col lavoro W potremmo far funzionare la macchina A a rovescio, perché è una macchina reversibile. Essa assorbirà del calore dal serbatoio a T2 e ricederà Q1 al serbatoio a T1 . Dopo questo doppio ciclo, il risultato netto sarebbe che avremmo rimesso ogni cosa nel modo in cui si trovava in precedenza, e avremmo fatto del lavoro in più, cioè W 0 W , e tutto ciò che avremmo fatto sarebbe estrarre energia dal serbatoio a T2 ! Abbiamo avuto cura di restituire il calore Q1 al serbatoio T1 . Così tale serbatoio può essere piccolo e «dentro» alla nostra macchina complessa A + B, il cui effetto netto è di estrarre un calore netto W 0 W dal serbatoio a T2 e convertirlo in lavoro. Ma ottenere lavoro utile da un serbatoio a una singola temperatura senza alcuna altra variazione è impossibile secondo il postulato di Carnot; non si può fare. Pertanto nessuna macchina che assorbe una data quantità di calore da una temperatura più elevata T1 e la cede alla temperatura T2 può compiere più lavoro di una macchina reversibile nelle stesse condizioni di temperatura. Ora supponiamo che anche la macchina B sia reversibile. Allora, naturalmente, non solo W 0 non deve essere maggiore di W , ma ora possiamo rovesciare l’argomento e mostrare che W non può essere maggiore di W 0. Così se entrambe le macchine sono reversibili esse debbono compiere entrambe lo stesso lavoro, e così giungiamo alla brillante conclusione di Carnot: se una macchina è reversibile, non importa come sia progettata, perché il lavoro che si ottiene se la macchina assorbe una data quantità di calore, a temperatura T1 e cede calore a una certa altra temperatura T2 non dipende dalla struttura della macchina. È una proprietà universale, non una proprietà di una particolare macchina. Se potessimo scoprire qual è la legge che determina quanto lavoro otteniamo quando assorbiamo il calore Q1 a T1 e cediamo calore a T2 , questa quantità sarebbe qualcosa di universale, indipendente dalla sostanza. Naturalmente, se conoscessimo le proprietà di una particolare sostanza, lo potremmo ricavare e dire, poi, che tutte le altre sostanze in una macchina reversibile debbono dare la stessa quantità di lavoro. Questa è l’idea chiave, il suggerimento col quale possiamo trovare la relazione fra quanto, per esempio, un elastico si contrae quando lo riscaldiamo, e quanto si raffredda quando lo lasciamo contrarre. Immaginate di mettere quell’elastico in una macchina reversibile, e che gli facciamo percorrere un ciclo reversibile. Il risultato netto, la quantità totale di lavoro fatto, è quella funzione universale, quella fantastica funzione che è indipendente dalla sostanza. Così vediamo che le proprietà di una sostanza debbono essere limitate in un certo modo; non si può fare qualunque cosa si desidera, o si potrebbe inventare una sostanza

44.4 • Il rendimento di una macchina ideale

© 978-8808-22107-0

che si potrebbe usare per produrre di più del massimo lavoro permesso quando le si fa percorrere un ciclo reversibile. Questo principio, questa limitazione, è l’unica vera regola che deriva dalla termodinamica.

44.4

Il rendimento di una macchina ideale

Tenteremo ora di trovare la legge che determina il lavoro W in funzione di Q1 , T1 e T2 . È chiaro che W è proporzionale a Q1 perché se consideriamo due macchine reversibili in parallelo, che lavorino entrambe insieme ed entrambe a due sorgenti, anche la combinazione è una macchina reversibile. Se ciascuna assorbiva il calore Q1 , le due insieme assorbono 2Q1 e il lavoro fatto è 2W , e così via. Quindi non è irragionevole che W sia proporzionale a Q1 . Il prossimo passo importante è trovare questa legge universale. Possiamo, e vogliamo, farlo studiando una macchina reversibile con l’unica sostanza particolare di cui conosciamo le leggi, un gas perfetto. È anche possibile ottenere la regola con un argomento puramente logico, non usando affatto alcuna sostanza particolare. Questo è uno degli splendidi ragionamenti della fisica e siamo riluttanti a non mostrarvelo, quindi lo tratteremo tra un momento, per coloro che volessero conoscerlo. Ma prima useremo il metodo molto meno astratto e più semplice del calcolo diretto per un gas perfetto. Abbiamo bisogno soltanto di ottenere le formule per Q1 e Q2 (dato che W è proprio Q1 Q2 ), le quantità di calore scambiate con i serbatoi durante l’espansione o la contrazione isoterma. Per esempio, quanto calore Q1 è assorbito dal serbatoio alla temperatura T1 durante l’espansione isoterma (contrassegnata da (l) in FIGURA 44.6) dal punto a a pressione pa , volume Va e temperatura T1 , al punto b con pressione pb , volume Vb , e con la stessa temperatura T1 ? In un gas perfetto ciascuna molecola ha un’energia che dipende soltanto dalla temperatura, e siccome la temperatura e il numero di molecole sono uguali in a e in b, l’energia interna è la stessa. Non c’è variazione in U; tutto il lavoro fatto dal gas, ⌅ b W= p dV a

durante l’espansione è l’energia Q1 presa dal serbatoio. Durante l’espansione ossia

pV = N kT1 e quindi Q1 =



b a

p dV =



p= b

N kT1 a

N kT1 V dV V

(44.4)

ovvero

Vb Va è il calore preso dal serbatoio a T1 . Nello stesso modo, per la compressione a T2 (curva (3) di FIGURA 44.6) il calore ceduto al serbatoio a T2 è Q1 = N kT1 ln

Q2 = N kT2 ln

Vc Vd

(44.5)

Per finire l’analisi abbiamo bisogno soltanto di trovare una relazione fra Vc /Vd e Vb /Va . Facciamo questo notando che (2) è un’espansione adiabatica da b a c, durante la quale pV è costante. Siccome pV = N kT, possiamo scrivere (pV ) V 1 = cost., oppure, in termini di T e V , TV 1 = = cost., ossia 1 1 T1Vb = T2Vc (44.6) Similmente, siccome (4), l’espansione da d ad a, è anche adiabatica, troviamo T1Va

1

= T2Vd

1

(44.6a)

469

470

Capitolo 44 • Le leggi della termodinamica

© 978-8808-22107-0

Se dividiamo questa equazione per la precedente, troviamo che Vb /Va deve essere uguale a Vc /Vd , così i logaritmi in (44.4) e (44.5) sono uguali, e quindi Q1 Q2 = T1 T2

(44.7)

Questa è la relazione che cercavamo. Sebbene l’abbiamo dimostrata per una macchina a gas perfetto, sappiamo che deve essere valida assolutamente per qualunque macchina reversibile. Vedremo ora come si potrebbe anche ottenere questa legge universale con argomentazioni logiche, senza conoscere le proprietà di alcuna sostanza specifica, come segue. T1 Q1 Supponiamo di avere tre macchine e tre temperature, diciamo T1 , T2 e T3 . Una macchina assorba il calore Q1 dalla temperatura T1 , esegua una certa 3 Q1 W12 quantità di lavoro W13 , e ceda il calore Q3 alla temperatura T3 (FIGURA 44.8). Un’altra macchina funzioni a rovescio fra T2 e T3 . Supponiamo che la Q2 W13 T2 1 seconda macchina sia tale da assorbire lo stesso calore Q3 , e cedere il Q2 calore Q2 . Dovremo fornirle una certa quantità di lavoro, W32 – negativo perché la macchina va a rovescio. Quando la prima macchina percorre un 2 W23 Q3 ciclo, essa assorbe il calore Q1 e cede Q3 alla temperatura T3 ; poi la seconda Q3 macchina assorbe lo stesso calore Q3 dal serbatoio a temperatura T3 e lo T3 cede al serbatoio alla temperatura T2 . Pertanto il risultato netto delle due macchine in tandem è di prendere il calore Q1 dal serbatoio alla temperatura T1 , e cedere Q2 al serbatoio alla FIGURA 44.8 Le macchine 1 e 2 insieme sono equivalenti alla macchina 3. temperatura T2 . Le due macchine sono così equivalenti a una terza, che assorba Q1 a T1 , faccia il lavoro W12 e ceda il calore Q2 a T2 , dato che W12 = W13 W32 . In base alla prima legge questo si può mostrare immediatamente nel modo seguente: W13 W32 = (Q1 Q3 ) (Q2 Q3 ) = Q1 Q2 = W12 (44.8) Possiamo ora ottenere le leggi che legano i rendimenti delle macchine, perché chiaramente deve esistere qualche tipo di relazione fra i rendimenti delle macchine funzionanti fra le temperature T1 e T3 , fra T2 e T3 e fra T1 e T2 . Possiamo rendere chiaro l’argomento nel modo seguente: abbiamo appena visto che possiamo sempre mettere in relazione il calore assorbito a T1 e quello ceduto a T2 trovando il calore ceduto a qualche altra temperatura T3 . Quindi possiamo ottenere tutte le proprietà delle macchine introducendo una temperatura di riferimento e analizzando ogni cosa con questa temperatura di riferimento. In altre parole, se conoscessimo il rendimento di una macchina funzionante fra una certa temperatura T e una certa temperatura arbitraria di riferimento, allora potremmo ricavare il rendimento per qualunque altra differenza di temperatura. Siccome facciamo l’ipotesi di usare soltanto macchine reversibili, possiamo lavorare dalla temperatura iniziale fino giù alla temperatura di riferimento e a rovescio ritornando alla temperatura finale. Definiremo arbitrariamente la temperatura di riferimento come un grado. Adotteremo anche un simbolo speciale per il calore che è ceduto a questa temperatura di riferimento: lo chiameremo Q S . In altre parole, quando una macchina reversibile assorbe il calore Q alla temperatura T, essa cederà un calore Q S alla temperatura unitaria. Se una macchina che assorbe il calore Q1 a T1 , cede il calore Q S a un grado, e se anche una macchina che assorbe il calore Q2 alla temperatura T2 cederà lo stesso calore Q S a un grado, allora segue che una macchina che assorbe il calore Q1 alla temperatura T1 cederà il calore Q2 se lavora fra T1 e T2 , come abbiamo già dimostrato considerando macchine funzionanti fra tre temperature. Così in realtà tutto quello che dobbiamo fare è trovare quanto calore Q1 dobbiamo immettere alla temperatura T1 per cedere una certa quantità di calore Q S alla temperatura unitaria. Se scopriamo questo, abbiamo tutto. Il calore Q, naturalmente, è una funzione della temperatura T. È facile vedere che il calore deve crescere al crescere della temperatura, perché sappiamo che richiede lavoro il far funzionare una macchina a rovescio e cedere calore a una temperatura più elevata. È anche facile vedere che il calore Q1 deve essere proporzionale a Q S . Quindi la grande

44.5 • La temperatura termodinamica

© 978-8808-22107-0

471

legge è qualcosa come questo: per una data quantità di calore Q S ceduta a un grado da una macchina funzionante alla temperatura T gradi, il calore Q assorbito deve essere quella quantità Q S moltiplicata per una certa funzione crescente della temperatura: (44.9)

Q = Q S f (T)

44.5

La temperatura termodinamica

A questo punto non tenteremo di trovare la formula per la citata funzione crescente della temperatura in termini della nostra familiare scala di temperatura a mercurio, ma definiremo invece la temperatura con una nuova scala. A un certo momento «la temperatura» fu definita arbitrariamente dividendo la dilatazione dell’acqua in gradi uguali di una certa entità. Ma quando poi si misura la temperatura con un termometro a mercurio si trova che i gradi non sono più uguali. Ma ora possiamo dare una definizione di temperatura che è indipendente da qualunque sostanza particolare. Possiamo usare quella funzione f (T) che non dipende dal dispositivo usato, perché il rendimento di queste macchine reversibili è indipendente dalle sostanze usate. Dato che abbiamo trovato che la funzione aumenta con la temperatura, definiremo la funzione stessa come la temperatura, misurata in unità del grado di temperatura di riferimento, come segue: Q = ST

(44.10)

Q S = S · 1°

(44.11)

essendo

Ciò significa che possiamo dire quanto è caldo un oggetto trovando quanto calore è assorbito da una macchina reversibile funzionante fra la temperatura dell’oggetto e la temperatura unitaria (FIGURA 44.9). Se dalla caldaia viene preso fuori sette volte più calore di quanto ne sia ceduto a un condensatore a un grado, la temperatura della caldaia verrà detta sette gradi, e così via. Così determiniamo la temperatura misurando quanto calore viene assorbito a differenti temperature. La temperatura definita in questo modo è chiamata temperatura termodinamica assoluta, ed è indipendente dalla sostanza. D’ora in avanti useremo esclusivamente questa definizione.(1) Ora vediamo che quando abbiamo due macchine, una funzionante fra T1 e un grado, l’altra funzionante fra T2 e un grado, che cedono lo stesso calore alla temperatura unitaria, allora i calori assorbiti debbono essere legati da Q1 Q2 =S= T1 T2

T Q = ST

Macchina reversibile

W = Q – S · 1°

QS = S · 1° 1K

FIGURA

44.9

Temperatura termodinamica assoluta.

(44.12)

Ma ciò significa che se abbiamo un’unica macchina funzionante fra T1 e T2 , allora il risultato dell’intera analisi, il gran finale, è che Q1 sta a T1 come Q2 sta a T2 , se la macchina assorbe l’energia Q1 alla temperatura T1 e cede il calore Q2 alla temperatura T2 . Tutte le volte che la macchina è reversibile, deve esistere questa relazione fra le quantità di calore. Questo è tutto quello che c’è: questo è il centro dell’universo della termodinamica. Se questo è tutto quello che c’è nella termodinamica, come mai è considerata un argomento tanto difficile? Facendo un problema che concerne una data massa di qualche sostanza, la condizione della sostanza a ogni istante può essere descritta dicendo qual è la sua temperatura e qual è il suo volume. Se conosciamo la temperatura e il volume di una sostanza, e la pressione è una certa (1) Precedentemente abbiamo definito la scala della temperatura in un modo differente, cioè asserendo che l’energia cinetica media di una molecola in un gas perfetto è proporzionale alla temperatura, ossia che la legge dei gas perfetti dice che pV è proporzionale a T . Questa nuova definizione è equivalente? Sì perché il risultato finale (44.7) ricavato dalla legge dei gas è uguale a quello ricavato qui. Ridiscuteremo questo punto nel prossimo capitolo.

472

Capitolo 44 • Le leggi della termodinamica

© 978-8808-22107-0

funzione della temperatura e del volume, allora conosciamo l’energia interna. Qualcuno potrebbe dire: «Io non voglio fare in questo modo. Ditemi la temperatura e la pressione, e io vi dirò il volume. Posso pensare il volume come funzione della temperatura e della pressione, e l’energia interna come funzione della temperatura e della pressione, e così via». Questa è la ragione per cui la termodinamica è difficile, perché ognuno usa un’impostazione diversa. Se soltanto potessimo riunirci una volta per decidere sulle nostre variabili, e attenerci a esse, sarebbe abbastanza facile. Ora cominciamo a fare deduzioni. Proprio come F = ma è il centro dell’universo della meccanica, ed essa procede continuamente secondo quella legge, nello stesso modo il principio appena trovato è tutto ciò che c’è nella termodinamica. Ma si possono trarre delle conclusioni da esso? Cominciamo. Per ottenere la nostra prima conclusione, combineremo entrambe le leggi, la legge di conservazione dell’energia e questa legge che lega le quantità di calore Q2 e Q1 e possiamo facilmente ottenere il rendimento di una macchina reversibile. Dalla prima legge abbiamo W = Q1

Q2

Secondo il nostro nuovo principio Q2 = quindi il lavoro diventa W = Q1 1

T2 Q1 T1

! T2 T1 T2 = Q1 T1 T1

(44.13)

W T1 T2 = Q1 T1

(44.14)

che ci dice il rendimento della macchina – quanto lavoro otteniamo da tanto calore. Il rendimento di una macchina è proporzionale alla differenza delle temperature fra le quali la macchina lavora, divisa per la temperatura più elevata: Rendimento =

Il rendimento non può essere maggiore dell’unità e la temperatura assoluta non può essere minore di zero, lo zero assoluto. Così, siccome T2 deve essere positiva, il rendimento è sempre minore di uno. Questa è la nostra prima conclusione.

44.6

Entropia

L’equazione (44.7) o (44.12) può essere interpretata in un modo particolare. Lavorando sempre con macchine reversibili, una quantità di calore Q1 alla temperatura T1 è «equivalente» alla quantità di calore Q2 alla temperatura T2 se Q1 Q2 = T1 T2 nel senso che quando l’una è assorbita l’altra è ceduta. Questo suggerisce che se chiamiamo Q/T in qualche modo, possiamo dire: in un processo reversibile tanto Q/T è assorbito quanto ne è liberato; non c’è né guadagno né perdita di Q/T. Questo Q/T è chiamato entropia, e diciamo: «In un ciclo reversibile non c’è alcuna variazione netta di entropia». Se T = 1°, allora l’entropia è Q S /1° ovvero, come l’abbiamo indicato, Q S /1° = S. In realtà, S è la lettera generalmente usata per l’entropia, ed è numericamente uguale al calore (che abbiamo indicato con Q S ) ceduto a un serbatoio a 1° (l’entropia non è essa stessa un calore, è calore diviso per una temperatura, e quindi si misura in joule per grado). Ora è interessante che oltre la pressione, che è funzione della temperatura e del volume, e l’energia interna, che è funzione della temperatura e del volume, abbiamo trovato un’altra grandezza che è funzione dello stato, cioè l’entropia della sostanza. Tentiamo di spiegare come la calcoliamo e cosa intendiamo quando la chiamiamo «funzione di stato». Consideriamo il sistema

44.6 • Entropia

© 978-8808-22107-0

473

in due stati differenti, in modo assai simile a come accadeva nell’esperimento in cui facevamo le espansioni adiabatica e isoterma. (Incidentalmente, non è necessario che una macchina termica abbia soltanto due serbatoi, potrebbe avere tre o quattro temperature diverse alle quali assorbe e cede calore, e così via.) Possiamo muoverci su tutta la superficie di un diagramma pV e andare da uno stato a un altro. In altre parole, potremmo dire che il gas è in un certo stato a, e poi va in qualche altro stato, b, e richiediamo che questa transizione, fatta da a a b, sia reversibile. Ora supponiamo che lungo tutto il percorso da a a b ci siano piccoli serbatoi a differenti temperature, così che il calore dQ tolto dalla sostanza a ogni piccolo passo è ceduto a ogni serbatoio alla temperatura corrispondente a quel punto del percorso. Ora connettiamo tutti questi serbatoi, per mezzo di macchine termiche reversibili, a un singolo serbatoio alla temperatura unitaria. Quando abbiamo finito di portare la sostanza da a a b, riporteremo tutti i serbatoi alla loro condizione originale. Ogni quantità di calore dQ che è stata assorbita dalla sostanza alla temperatura T è stata ora trasformata da una macchina reversibile, ed è stata ceduta alla temperatura unitaria una certa quantità di entropia dS come segue: dQ dS = (44.15) T Calcoliamo la quantità totale di entropia che è stata ceduta. La differenza di entropia, ossia l’entropia necessaria per andare da a a b attraverso questa particolare trasformazione reversibile, è l’entropia totale, il totale dell’entropia presa dai piccoli serbatoi e ceduta alla temperatura unitaria: ⌅ b dQ Sb Sa = (44.16) a T Il problema è: la differenza di entropia dipende dal percorso? C’è più di una via per andare da a a b. Ricordate che nel ciclo di Carnot potevamo andare da a a c in FIGURA 44.6 prima espandendo isotermicamente e poi adiabaticamente; oppure potevamo prima espandere adiabaticamente e poi isotermicamente. Così la questione è se la variazione di entropia che si ha quando andiamo da a a b in FIGURA 44.10 per una strada è uguale a quella che si ha per un’altra strada. Deve essere la stessa, perché se percorressimo completamente il ciclo, andando avanti su un percorso e indietro su un altro, avremmo una macchina reversibile, e non ci sarebbe alcuna perdita di calore verso il serbatoio alla temperatura unitaria. In un ciclo totalmente reversibile, nessun calore deve essere tolto al serbatoio alla temperatura unitaria, così l’entropia necessaria per andare da a a b su un percorso è uguale a quella necessaria su un altro (FIGURA 44.11). È indipendente dal cammino e dipende soltanto dagli estremi. Pertanto possiamo dire che esiste una certa funzione, che chiamiamo entropia della sostanza, che dipende soltanto dallo stato, cioè soltanto dal volume e dalla temperatura. Possiamo trovare una funzione S(V, T) che ha la proprietà che, se calcoliamo la variazione di entropia, quando si fa percorrere alla sostanza un qualunque cammino reversibile, in termini del calore ceduto alla temperatura unitaria, allora ⌅ dQ S= (44.17) T Temperatura

Temperatura

b

∆S = Sa – Sb

a

dQ dW

Serbatoi

b

T Macchine

dS · 1°

44.10 Variazione di entropia durante una trasformazione reversibile. FIGURA

∆S = Sb – Sa a Variazione totale di entropia = 0

1° Volume

Volume

44.11 Variazione di entropia in un ciclo completamente reversibile. FIGURA

474

Capitolo 44 • Le leggi della termodinamica

© 978-8808-22107-0

dove dQ è il calore tolto alla sostanza alla temperatura T. Questa variazione totale di entropia è la differenza fra l’entropia calcolata nei punti iniziale e finale: S = S(Vb, Tb )

S(Va, Ta ) =



b a

dQ T

(44.18)

Questa espressione non definisce completamente l’entropia, ma piuttosto soltanto la differenza di entropia fra due stati differenti. Soltanto se possiamo valutare l’entropia per uno stato particolare possiamo realmente definire S in modo assoluto. Per un lungo periodo si ritenne che l’entropia assoluta non significasse nulla – che si potessero definire soltanto differenze – ma finalmente Nernst propose ciò che egli chiamò il teorema del calore, che è anche detto la terza legge della termodinamica. È molto semplice. Noi diremo che cos’è, ma non spiegheremo perché sia vero. Il postulato di Nernst asserisce semplicemente che l’entropia di qualsiasi oggetto allo zero assoluto è zero. Conosciamo un caso di T e V , cioè T = 0, dove S è zero; e così possiamo ottenere l’entropia in qualunque altro punto. Per illustrare questi concetti, calcoliamo l’entropia di un gas perfetto. In un’espansione isoterma (e quindi reversibile) si ha ⌅ dQ Q = T T poiché T è costante. Pertanto, tenendo conto della (44.4), la variazione entropica risulta S(Va, T)

S(Vb, T) = N k ln

Va Vb

e quindi S(V, T) = N k ln V più una certa funzione della sola T. Come dipende S da T? Sappiamo che in un’espansione abiabatica reversibile non si scambia calore. Così l’entropia non varia anche se V cambia, purché cambi anche T in modo che si abbia TV 1 = cost. Possiamo vedere che questo implica ! 1 S(V, T) = N k ln V + ln T + a 1 dove a è una costante indipendente sia da V sia da T? (a è chiamata costante chimica. Dipende dal gas in questione e si può determinare sperimentalmente col teorema di Nernst misurando il calore liberato nel raffreddare⇤e condensare il gas finché diventa un solido – oppure un liquido, per l’elio – a 0°, integrando dQ/T. Si può anche determinare teoricamente per mezzo della costante di Planck e della meccanica quantistica, ma non lo studieremo in questo corso.) Ora faremo notare alcune proprietà dell’entropia delle sostanze. Ricordiamo per prima cosa che se percorriamo un ciclo reversibile da a a b, allora l’entropia della sostanza cambierà di Sb Sa . E ricordiamo che man mano che percorriamo la curva, l’entropia – il calore ceduto alla temperatura unitaria – aumenta secondo la regola dS = dQ/T, dove dQ è il calore che togliamo dalla sostanza quando la sua temperatura è T. Sappiamo già che se abbiamo un ciclo reversibile, l’entropia totale di ogni cosa non è cambiata, perché il calore Q1 assorbito a T1 e il calore Q2 ceduto a T2 corrispondono a variazioni uguali e opposte di entropia, così che la variazione netta di entropia è zero. Quindi per un ciclo reversibile non c’è variazione di entropia di nulla, inclusi i serbatoi. Questa regola può sembrare come la conservazione dell’energia, ma non lo è; si applica soltanto a cicli reversibili. Se includiamo i cicli irreversibili non c’è legge di conservazione dell’entropia. Daremo due esempi. Primo, supponiamo di compiere lavoro irreversibile su un oggetto per mezzo dell’attrito, generando un calore Q su un certo oggetto a temperatura T. L’entropia viene aumentata di Q/T. Il calore Q è uguale al lavoro, e così quando facciamo un certo lavoro per mezzo dell’attrito su un oggetto la cui temperatura è T, l’entropia dell’universo aumenta di W /T. Un altro esempio di irreversibilità è questo: se mettiamo a contatto due oggetti che siano a differenti temperature, diciamo T1 e T2 , una certa quantità di calore fluirà spontaneamente dall’uno all’altro. Supponiamo, per esempio, di mettere una pietra calda nell’acqua fredda. Allora quando un certo calore Q è trasferito da T1 a T2 , di quanto cambia l’entropia della pietra calda?

© 978-8808-22107-0

44.6 • Entropia

Diminuisce di Q/T1 . Di quanto cambia l’entropia dell’acqua? Aumenta di Q/T2 . Naturalmente il calore fluirà soltanto dalla temperatura più elevata T1 alla temperatura più bassa T2 , così che Q è positivo se T1 è maggiore di T2 . Quindi la variazione di entropia dell’universo è positiva, ed è la differenza delle due frazioni: Q Q S= (44.19) T2 T1 Vale così la seguente proposizione: in ogni processo irreversibile l’entropia dell’universo aumenta. L’entropia rimane costante soltanto nei processi reversibili. Siccome nessun processo è assolutamente reversibile, c’è sempre almeno un piccolo aumento di entropia; un processo reversibile è un’idealizzazione in cui abbiamo reso minimo il guadagno di entropia. Sfortunatamente non entreremo molto in dettaglio nel campo della termodinamica. Il nostro proposito è soltanto illustrare le idee principali che vi sono implicate e le ragioni per le quali è possibile condurre tali argomentazioni, ma in questo corso non useremo molto la termodinamica. La termodinamica è usata molto spesso dagli ingegneri e, particolarmente, dai chimici. Così nella pratica dobbiamo imparare la termodinamica in chimica o in ingegneria. Siccome non vale la pena duplicare ogni cosa, tratteremo soltanto un po’ l’origine della teoria, piuttosto che entrare in dettagli per le applicazioni particolari. Le due leggi della termodinamica sono spesso enunciate in questo modo: Prima legge: l’energia dell’universo è sempre costante. Seconda legge: l’entropia dell’universo aumenta sempre. Questo non è un enunciato molto buono della seconda legge; non dice, per esempio, che in un ciclo reversibile l’entropia rimane la stessa, e non dice esattamente che cosa sia l’entropia. È soltanto un modo astuto di ricordare le due leggi, ma non ci dice in realtà che cosa vogliano dire. Di seguito abbiamo riassunto le leggi discusse in questo capitolo. Nel prossimo capitolo applicheremo queste leggi per scoprire la relazione fra il calore generato nell’allungamento di un elastico e la tensione in più quando lo si riscalda. Nella pagina seguente è riportato un riassunto delle leggi della termodinamica.

475

476

Capitolo 44 • Le leggi della termodinamica

© 978-8808-22107-0

Riassunto delle leggi della termodinamica Prima legge

Calore introdotto in un sistema + lavoro fatto sul sistema = aumento dell’energia interna del sistema: dQ + dW = dU Seconda legge

È impossibile un processo il cui unico risultato finale sia togliere calore da un serbatoio e convertirlo in calore. Nessuna macchina termica che prenda il calore Q1 da T1 e ceda il calore Q2 a T2 può fare più lavoro di una macchina reversibile, per la quale ! T1 T2 W = Q1 Q2 = Q1 T1 Entropia

L’entropia di un sistema è definita nel modo seguente: • Se il calore Q è aggiunto reversibilmente a un sistema a temperatura T, l’aumento dell’entropia del sistema è S = Q/T. • Alla temperatura T = 0 si ha S = 0 (terza legge della termodinamica). In una trasformazione reversibile l’entropia totale di tutte le parti del sistema (serbatoi inclusi) non cambia. In una trasformazione irreversibile l’entropia totale del sistema aumenta sempre.

Chiarimenti sulla termodinamica

45.1

Energia interna

La termodinamica è un argomento piuttosto difficile e complesso quando lo si deve applicare, ma non è compito nostro, in questo corso, approfondire tanto tali applicazioni. L’argomento riveste grande importanza naturalmente per ingegneri e chimici e coloro che sono interessati a esso possono studiarne le applicazioni in chimica fisica e in termodinamica applicata. Esistono anche ottimi libri come Heat and Thermodynamics di Zemansky, per approfondire ulteriormente l’argomento. Nell’Enciclopedia Britannica, quattordicesima edizione, si possono trovare eccellenti articoli di termodinamica e di termochimica e, nell’articolo di chimica, paragrafi su chimica fisica, su vaporizzazione, liquefazione dei gas e così via. L’argomento della termodinamica è complicato dal fatto che esistono tanti modi diversi di descrivere lo stesso fenomeno. Se vogliamo descrivere il comportamento di un gas, possiamo dire che la pressione dipende dalla temperatura e dal volume, oppure possiamo dire che il volume dipende dalla temperatura e dalla pressione. Se consideriamo l’energia interna U, possiamo dire che essa dipende da temperatura e volume, se queste sono le variabili che abbiamo scelto – ma possiamo anche dire che essa dipende dalla temperatura e dalla pressione o dalla pressione e dal volume e così via. Nel precedente capitolo abbiamo discusso un’altra funzione della temperatura e del volume chiamata entropia S, e possiamo naturalmente costruire tante altre funzioni di queste variabili, quante ne vogliamo: U T S è una funzione della temperatura e del volume. Così abbiamo un gran numero di differenti quantità che possono essere funzioni di differenti combinazioni di variabili. Per semplicità considereremo, in questo capitolo, temperatura e volume come variabili indipendenti. I chimici usano temperatura e pressione perché queste sono più facili da misurare e da controllare negli esperimenti di chimica. Noi invece useremo in questo capitolo sempre temperatura e volume, tranne là dove esamineremo in che modo eseguire la trasformazione nel sistema di variabili usato dai chimici. Considereremo dunque in primo luogo un unico sistema di variabili indipendenti: temperatura e volume. In secondo luogo discuteremo soltanto due funzioni dipendenti: l’energia interna e la pressione. Tutte le altre funzioni possono essere derivate da queste, così non è necessario discuterle in dettaglio. Con queste limitazioni la termodinamica rimane un argomento ugualmente difficile, ma non del tutto impossibile! Per prima cosa occorrerà riesaminare un po’ di matematica. Se una grandezza è una funzione di due variabili, il concetto di derivata della grandezza richiede un esame un po’ più accurato di quanto non avvenga nel caso di una sola variabile. Che cosa intendiamo per derivata della pressione rispetto alla temperatura? Il cambiamento di pressione che si accompagna al cambiamento di temperatura dipende in parte, naturalmente, da ciò che accade al volume mentre T cambia. È necessario specificare il cambiamento in V perché il concetto di derivata rispetto a T abbia un significato preciso. Possiamo chiederci, per esempio, la rapidità della variazione di P rispetto a T se V è tenuto costante. Questo rapporto è appunto la derivata ordinaria che noi scriviamo comunemente come dP/dT. Di solito usiamo lo speciale simbolo @P/@T, che ci ricorda come P dipenda dalla variabile V oltre che da T e che quest’altra variabile è tenuta costante. Non useremo soltanto il simbolo «@» per fissare l’attenzione sul fatto che l’altra variabile rimane costante,

45

478

Capitolo 45 • Chiarimenti sulla termodinamica

© 978-8808-22107-0

ma porremo come indice la variabile che è tenuta costante (@P/@T)V . Poiché abbiamo soltanto due variabili indipendenti tale notazione appare eccessiva, ma servirà a meglio orizzontarci nella giungla termodinamica delle derivate parziali. Supponiamo che la funzione f (x, y) dipenda dalle due variabili indipendenti x e y. Indichiamo con (@ f /@ x)y la derivata, ottenuta nel modo consueto, trattando y come una costante: ! @f f (x + x, y) f (x, y) = lim x!0 @x y x Allo stesso modo, definiamo @f @y

!

= lim x

x!0

f (x, y + x) y

f (x, y)

Per esempio, se f (x, y) = x 2 + yx, allora sarà (@ f /@ x)y = 2x + y e (@ f /@ y)x = x. Possiamo estendere questo concetto alle derivate di ordine superiore: @ 2 f /@ y 2 o @ 2 f /@ y@ x. L’ultimo simbolo indica che prima differenziamo f rispetto a x, trattando y come costante, quindi differenziamo il risultato rispetto a y trattando x come costante. Non è importante l’ordine di differenziazione, cioè @2 f @2 f = @x@y @y@x Capiterà di dover calcolare la variazione f di f (x, y) quando x diventa x + x e y diventa y + y; possiamo scrivere: f = f (x + x, y + y) = f (x + x, y + y)

f (x, y) = f (x, y + y) + f (x, y + y)

f (x, y)

Dato che x e y sono infinitamente piccoli: f (x + x, y + y) f (x, y + y)

f (x, y) = y

quindi f = x

@f @x

f (x, y + y) = x

@f @x

!

+ y y

@f @y

@f @y

!

!

!

y

x

(45.1) x

Quest’ultima equazione è la relazione fondamentale che esprime f in termini di x e di y. Come esempio dell’uso di questa relazione, calcoliamo la variazione dell’energia interna U(T, V ) quando la temperatura varia da T a T + T e il volume varia da V a V + V . Usando l’equazione (45.1), scriviamo ! ! @U @U U= T + V (45.2) @T V @V T Nel capitolo precedente abbiamo trovato un’altra espressione della variazione U dell’energia interna, quando una quantità di calore Q veniva fornita al gas: U= Q

P V

(45.3)

Confrontando le equazioni (45.2) e (45.3) si potrebbe essere indotti a credere, a prima vista, che sia P = (@U/@V )T , ma questa interpretazione non è corretta. Per ottenere la relazione corretta, supponiamo dapprima di fornire una quantità di calore Q al gas mantenendo il volume costante in modo che sia V = 0. Con V = 0, l’equazione (45.3) ci dice che U = Q e l’equazione (45.2) che U = (@U/@T)V T, cosicché ! @U Q = @T V T

45.1 • Energia interna

© 978-8808-22107-0

479

Il rapporto Q/ T, la quantità di calore che si deve somministrare a una sostanza per cambiare la sua temperatura di un grado, tenendo costante il volume, si chiama calore specifico a volume costante, e si indica col simbolo CV . Abbiamo quindi dimostrato che ! @U = CV (45.4) @T V Forniamo ora di nuovo al gas una quantità di calore Q, ma questa volta manteniamo T costante e lasciamo che il volume cambi di V . L’analisi, in questo caso, è più complessa ma possiamo calcolare U con l’argomento di Carnot, facendo uso del ciclo di Carnot che abbiamo introdotto nel capitolo precedente. Il diagramma pressione-volume per il ciclo di Carnot è illustrato nella FIGURA 45.1. Come abbiamo già visto, il lavoro totale svolto dal gas in un Pressione ciclo reversibile è Q( T/T), dove Q è la quantità di energia fornita al ∆V gas sotto forma di calore mentre questo si espande isotermicamente, alla temperatura T, dal volume V al volume V + V , e T T è la temperatura finale raggiunta dal gas durante l’espansione adiabatica nella seconda parte ∆P del ciclo. Dimostreremo ora che questo lavoro è dato anche dall’area T ⇤ tratteggiata nella FIGURA 45.1. In ogni caso il lavoro compiuto dal gas è P dV ed è positivo quando il gas si espande, negativo quando è compresso. Se costruiamo il diagramma di P in funzione di V , la variazione di P e V T – ∆T è rappresentata da una curva che dà il valore di P corrispondente a ogni Volume particolare valore di V . Quando il volume cambia da un valore all’altro, il ⇤ lavoro compiuto dal gas (l’integrale P dV ) è l’area limitata dalla curva che congiunge il valore iniziale e il valore finale di V . Quando riferiamo tale FIGURA 45.1 Diagramma pressione-volume per un conclusione al ciclo di Carnot, vediamo, ruotando lungo il ciclo e facendo ciclo di Carnot. Le curve indicate con T e con T �T attenzione al segno del lavoro prodotto dal gas, che il lavoro totale eseguito sono isoterme. Le curve più ripide sono adiabatiche. �V è la variazione di volume quando il calore �Q dal gas è proprio l’area tratteggiata della FIGURA 45.1. viene fornito al gas, mantenuto a temperatura Calcoleremo ora geometricamente il valore dell’area tratteggiata. Il ci- costante T. �P è la variazione di pressione a volume clo usato nella FIGURA 45.1 differisce da quello usato nel capitolo precedente costante, quando la temperatura varia da T a T �T. in quanto abbiamo supposto Q e T infinitamente piccoli. Stiamo usando adiabatiche e isoterme molto ravvicinate e la FIGURA 45.1 tenderà a un parallelogramma, al tendere a zero di T e Q. L’area di questo parallelogramma è V P, dove V è la variazione di volume che si ha quando l’energia Q è fornita al gas a temperatura costante e P è la variazione di pressione quando la temperatura varia di T a volume costante. Si può facilmente dimostrare che l’area tratteggiata in FIGURA 45.1 è V P, osservando che essa è equivalente all’area compresa fra le linee tratteggiate nella FIGURA 45.2, che a sua volta differisce dal rettangolo definito da P e V soltanto per sottrazione e addizione delle aree dei triangoli uguali della FIGURA 45.2. Riassumiamo i risultati fin qui ottenuti: Lavoro fatto dal gas = area tratteggiata = V P = Q

T T

ossia

ossia

!

T = (calore necessario per cambiare V di V )T = T = V · (variazione di P quando T varia di T)V 1 @P · (calore necessario per cambiare V di V )T = T V @T

!

V

9 > > > > > > > > > > > > > > > > > > > = > > > > > > > > > > > > > > > > > > > ;

P ∆V

(45.5)

L’equazione (45.5) esprime il risultato essenziale dell’argomento di Carnot. Tutta la termodinamica può essere dedotta dall’equazione (45.5) e dalla prima legge che è espressa dall’equazione (45.3). L’equazione (45.5) è essenzialmente la seconda legge, benché sia stata originariamente definita da Carnot in una forma leggermente diversa, perché egli non usava la nostra definizione di temperatura.

∆P

V

45.2 Area tratteggiata = area limitata dalle linee tratteggiate = area del rettangolo = �P �V. FIGURA

480

Capitolo 45 • Chiarimenti sulla termodinamica

© 978-8808-22107-0

Possiamo ora procedere al calcolo di (@U/@V )T . Quale sarebbe la variazione dell’energia interna U se il volume cambiasse di V ? Primo, U cambia per l’immissione di calore, secondo, perché viene compiuto un lavoro. Il calore immesso è ! @P Q=T V @T V in accordo con l’equazione (45.5), e il lavoro eseguito sulla sostanza è P V . Quindi la variazione dell’energia interna U è formata di due parti: ! @P U =T V P V (45.6) @T V Dividendo entrambi i termini dell’equazione per V , troviamo per la variazione di U con V a T costante ! ! @U @P =T P (45.7) @V T @T V

Nella nostra formulazione della termodinamica, in cui T e V sono le sole variabili e P e U sono le sole funzioni, le equazioni (45.3) e (45.7) rappresentano le equazioni base dalle quali possono essere dedotti tutti gli altri risultati.

45.2

Applicazioni

Discutiamo ora il significato dell’equazione (45.7) e vediamo perché essa risponda ai quesiti che ci siamo posti nel capitolo precedente. Ponemmo allora il seguente problema: nella teoria cinetica è ovvio che un incremento di temperatura porta a un incremento di pressione, per effetto del bombardamento degli atomi su un pistone. Per la stessa ragione fisica, quando lasciamo indietreggiare il pistone, del calore viene sottratto al gas e, per mantenere costante la temperatura occorrerà restituire al gas del calore. Il gas raffredda quando si espande e la pressione aumenta quando è riscaldato. Deve esserci una qualche connessione fra questi due fenomeni e tale connessione è espressa esplicitamente dall’equazione (45.7). Se teniamo fisso il volume e aumentiamo la temperatura, la pressione aumenta con la derivata (@P/@T)V . Connesso a questo è il fatto seguente: se aumentiamo il volume il gas raffredderà, a meno che non somministriamo calore per mantenere costante la temperatura e (@U/@V )T ci dice quanto calore occorre per conservare il valore della temperatura. L’equazione (45.7) esprime l’intima connessione fra questi due effetti. Ciò è quanto abbiamo promesso che avremmo trovato, quando iniziammo lo studio della termodinamica. Senza conoscere il meccanismo interno del gas e sapendo soltanto che non può esistere il moto perpetuo di seconda specie, possiamo dedurre la relazione fra la quantità di calore necessaria a mantenere costante la temperatura durante l’espansione del gas e il cambiamento di pressione quando il gas si riscalda! Ora che abbiamo il risultato che volevamo per quanto riguarda il gas, consideriamo un elastico. Quando tendiamo un elastico vediamo che la sua temperatura sale e quando lo riscaldiamo vediamo che si accorcia. Qual è l’equazione che esprime per un elastico la stessa relazione che è espressa per il gas dall’equazione (45.3)? Per un elastico la situazione sarà circa questa: quando gli si fornisce una quantità di calore Q, l’energia interna cambia di U e viene compiuto un lavoro. L’unica differenza sarà che il lavoro fatto dall’elastico si esprimerà con F L invece che con P V , dove F è la forza agente sull’elastico e L la lunghezza dell’elastico stesso. La forza F è una funzione della temperatura e della lunghezza dell’elastico. Sostituendo a P V nell’equazione (45.3) F L, otteniamo U = Q+F L (45.8) Confrontando le equazione (45.3) e (45.8) vediamo che l’equazione dell’elastico si ottiene con una semplice sostituzione di lettere. Inoltre, sostituendo L a V e F a P, tutta la nostra discussione del ciclo di Carnot si può applicare all’elastico. Per esempio possiamo dedurre immediatamente che

45.2 • Applicazioni

© 978-8808-22107-0

il calore Q necessario per cambiare la lunghezza di L è espresso in analogia con l’equazione (45.5) da: ! @F Q= T L @T L

Questa equazione ci dice che se manteniamo fissa la lunghezza dell’elastico e lo riscaldiamo, possiamo calcolare l’incremento della forza in funzione del calore necessario per mantenere costante la temperatura, quando l’elastico viene allentato un poco. Così vediamo che la stessa equazione si applica sia a un gas sia a un elastico. Infatti, se si può scrivere U = Q + A B, dove A e B rappresentano grandezze differenti, forza e lunghezza, pressione e volume ecc., si può far uso dei risultati ottenuti per un gas in virtù della sostituzione di A e B al posto di P e V . Per esempio, consideriamo la differenza di potenziale elettrico o «tensione» E in una batteria e la carica Z che attraversa la batteria. Sappiamo che il lavoro compiuto da un elemento elettrico reversibile, come una batteria di accumulatori, è E Z. (Poiché non includiamo nel lavoro il termine P V , richiediamo che la batteria mantenga costante il volume.) Vediamo cosa può insegnarci la termodinamica sul comportamento di una batteria. Se sostituiamo E a P e Z a V nell’equazione (45.6), otteniamo ! U @E =T E (45.9) Z @T Z L’equazione (45.9) dice che l’energia interna U cambia quando una carica Z attraversa l’elemento. Perché U/ Z non è semplicemente la tensione E della batteria? La risposta è che una batteria reale si riscalda quando è attraversata da una carica. L’energia interna della batteria cambia, in primo luogo, perché la batteria compie un lavoro sul circuito esterno e, in secondo luogo, perché si scalda. Il fatto notevole è che la seconda parte può ancora essere espressa in funzione del modo in cui la tensione della batteria cambia con la temperatura. Incidentalmente, quando la carica attraversa l’elemento, avvengono reazioni chimiche e l’equazione (45.9) suggerisce un modo elegante per misurare l’energia necessaria a produrre una reazione chimica. Tutto quello che dobbiamo fare è costruire un elemento che sfrutti tale reazione, nel misurare la tensione e nel misurare di quanto varia questa con la temperatura, quando non assorbiamo carica dalla batteria! Abbiamo supposto che il volume della batteria rimanga costante, avendo omesso il termine P V nello scrivere il lavoro fatto dalla batteria come E Z. Ci si accorge che è tecnicamente molto difficile mantenere costante il volume; risulta molto più facile mantenere l’elemento a pressione atmosferica costante. Per questa ragione i chimici non hanno simpatia per le equazioni che abbiamo scritto sopra ma preferiscono equazioni che descrivono il comportamento a pressione costante. Abbiamo scelto all’inizio di questo capitolo di usare V e T come variabili indipendenti. I chimici preferiscono P e T e ora vedremo in che modo i risultati ottenuti sopra possano essere trasformati nel sistema di variabili usato dai chimici. Ricordate che in tale procedimento è facile una certa confusione dovendo cambiare le variabili da T e V a T e P. Siamo partiti nell’equazione (45.3) con U = Q P V ; P V può essere sostituito da E Z o A B. Se potessimo in qualche modo sostituire l’ultimo termine P V con V P, allora avremmo intercambiato V e P e i chimici sarebbero soddisfatti. Bene, un uomo ingegnoso ha notato che il differenziale del prodotto PV è d(PV ) = P dV + V dP, e che addizionando questa equivalenza all’equazione (45.3), si ottiene (PV ) = P V + V P U= Q P V (U + PV ) =

Q+V P

Affinché il risultato appaia simile all’equazione (45.3) definiamo U + PV come qualche cosa di nuovo chiamato entalpia, H, e scriviamo H = Q+V P Siamo ora in grado di trasformare i nostri risultati nel linguaggio dei chimici con le seguenti regole: U ! H, P ! V e V ! P. Per esempio, la relazione fondamentale che i chimici userebbero al

481

482

Capitolo 45 • Chiarimenti sulla termodinamica

posto dell’equazione (45.7) è @H @P

© 978-8808-22107-0

!

@V @T

= T T

!

+V P

Dovrebbe essere chiaro ora come si ottenga la trasformazione delle variabili in quelle usate dai chimici, T e P. Ritorniamo ora alle nostre variabili originali: per il resto di questo capitolo T e V saranno le variabili indipendenti. Applicheremo ora i risultati ottenuti a un certo numero di situazioni fisiche. Consideriamo dapprima il gas ideale. Dalla teoria cinetica sappiamo che l’energia interna di un gas dipende soltanto dal moto delle molecole e dal numero delle molecole. L’energia interna dipende da T ma non da V . Se cambiamo V , ma teniamo T costante, U non cambia. Pertanto (@U/@V )T = 0, e l’equazione (45.7) ci insegna che per un gas ideale ! @P T P=0 (45.10) @T V L’equazione (45.10) è un’equazione differenziale che può insegnarci qualcosa su P. Consideriamo le derivate parziali nel seguente modo: poiché la derivata parziale è a V costante, sostituiamo la derivata parziale con una derivata ordinaria e scriviamo esplicitamente, per ricordarlo, «V costante». L’equazione (45.10) diventa allora T

P T

P=0

(V = cost.)

(45.11)

che possiamo integrare ottenendo ln P = ln T + cost.

(V = cost.)

ovvero P = cost. · T

(V = cost.)

(45.12)

Sappiamo che per un gas ideale la pressione è uguale a P=

RT V

(45.13)

in accordo con la (45.12) poiché V e R sono costanti. Per quale motivo ci siamo impegnati in questo calcolo se ne conoscevamo già il risultato? Perché stavamo usando due definizioni indipendenti di temperatura! A un certo punto abbiamo supposto che l’energia cinetica delle molecole fosse proporzionale alla temperatura: un’affermazione che stabilisce una scala di temperature che chiameremo la scala di temperature del gas ideale. La T nell’equazione (45.13) è basata su questa scala. Le temperature misurate mediante la scala a gas sono anche chiamate temperature cinetiche. In seguito abbiamo definito la temperatura in un secondo modo, del tutto indipendente da ogni sostanza. Mediante argomenti basati sulla seconda legge, abbiamo definito quella che si potrebbe chiamare «la grande temperatura termodinamica assoluta» T, il T che appare nell’equazione (45.12). Quello che abbiamo così dimostrato è che la pressione di un gas ideale (definito come quel gas la cui energia interna non dipende dal volume) è proporzionale alla temperatura termodinamica assoluta. Sappiamo anche che la pressione è proporzionale alla temperatura misurata secondo la scala del gas ideale. Quindi possiamo dedurre che la temperatura cinetica è proporzionale alla «temperatura termodinamica assoluta». In realtà se fossimo ragionevoli riusciremmo a fare andare d’accordo due scale. In questo esempio, almeno, le due scale sono state scelte in modo da coincidere. La costante di proporzionalità è stata scelta uguale a 1. Il più delle volte l’uomo si crea da solo le difficoltà, ma in questo caso le scale le ha fatte uguali!

45.3

L’equazione di Clausius-Clapeyron

La vaporizzazione di un liquido è un’altra delle applicazioni dei risultati che abbiamo ottenuto. Supponiamo di avere in un cilindro una certa quantità di liquido e di poterla comprimere spingendo

45.3 • L’equazione di Clausius-Clapeyron

© 978-8808-22107-0

483

45.3 Isoterme di un vapore condensabile compresso in un cilindro. A sinistra la sostanza è in fase liquida. A destra la sostanza è vaporizzata. Al centro vapore e liquido sono entrambi presenti nel cilindro. FIGURA

Pressione

Pressione

∆P T

T

45.4 Diagramma pressione-volume per un ciclo di Carnot con un vapore condensabile nel cilindro. A sinistra la sostanza è allo stato liquido.La quantità di calore L viene ceduta a temperatura T, per vaporizzare il liquido. Il vapore si espande adiabaticamente quando la temperatura varia da T a T �T. FIGURA

T – ∆T

T – ∆T

Liquido

Liquido e vapore

Vapore

VL Volume

VG Volume

un pistone e chiediamoci: «Se manteniamo costante la temperatura, come varierà la pressione col volume?». In altre parole vogliamo tracciare una isoterma nel piano P-V . La sostanza nel cilindro non è il gas ideale che abbiamo considerato in precedenza. Essa può trovarsi ora nelle fasi liquida o di vapore o in entrambe le fasi. Se applichiamo una pressione sufficiente, la sostanza condenserà e diventerà liquida. Se esercitiamo una pressione ancora più forte, il volume cambia molto poco e l’isoterma sale rapidamente al decrescere del volume come appare a sinistra nella FIGURA 45.3. Se aumentiamo il volume estraendo il pistone, la pressione diminuisce fino a raggiungere il punto in cui il liquido comincia a bollire e comincia a formarsi il vapore. Se estraiamo ulteriormente il pistone, l’unico risultato è che evapora una maggiore quantità di liquido. Quando nel cilindro vi è una parte di liquido e una parte di vapore, le due fasi sono in equilibrio – le quantità di liquido che evapora e di vapore che condensa sono uguali. Se creiamo più spazio per il vapore, sarà necessaria, per mantenere costante la pressione, una maggiore quantità di vapore. Così evaporerà un po’ più di liquido ma la pressione resterà costante. Nella parte piatta della curva nella FIGURA 45.3 la pressione non cambia e questo valore della pressione è chiamato tensione di vapore alla temperatura T. Continuando ad aumentare il volume arriviamo al momento in cui non c’è più liquido che possa evaporare. A questo punto, se continuiamo a espandere, la pressione diminuirà come per un comune gas, come si vede a destra del diagramma P-V . La curva in basso nella FIGURA 45.3 è l’isoterma a una temperatura lievemente minore, T T. La pressione nella fase liquida è lievemente ridotta perché il liquido si espande al crescere della temperatura (per la maggior parte delle sostanze, ma non per l’acqua vicino al punto di congelamento) e naturalmente la tensione di vapore è più bassa alla temperatura inferiore. Costruiremo ora un ciclo con le isoterme, congiungendole (per esempio con delle adiabatiche) alle estremità dei tratti piani come si vede nella FIGURA 45.4. La lieve irregolarità nell’angolo in basso a destra della figura farà poca differenza e la trascureremo. Useremo l’argomento di Carnot che ci insegna che il calore fornito alla sostanza per portarla dallo stato liquido a quello di vapore è legato al lavoro compiuto dalla sostanza durante il ciclo. Chiamiamo L il calore necessario per l’evaporazione della sostanza contenuta nel cilindro. Dalla discussione che ha preceduto l’equazione (45.5) sappiamo che L( T/T) = lavoro fatto dalla sostanza. Come allora, il lavoro compiuto dalla sostanza è l’area tratteggiata, che è approssimativamente P(VG VL ), dove P è la differenza delle tensioni di vapore alle due temperature T e T T, VG è il volume del gas e VL è il volume del liquido, entrambi misurati alla stessa tensione di vapore. Uguagliando questi due modi di esprimere la stessa area, otteniamo L

T = P (VG T

ossia L T(VG

VL )

=

VL )

@ Pvap @T

(45.14)

484

Capitolo 45 • Chiarimenti sulla termodinamica

© 978-8808-22107-0

L’equazione (45.14) dà la relazione fra la rapidità di variazione della tensione di vapore con la temperatura e la quantità di calore richiesta per l’evaporazione del liquido. Questa relazione fu dedotta da Carnot, ma è chiamata equazione di Clausius-Clapeyron. Confrontiamo ora l’equazione (45.14) con i risultati dedotti dalla teoria cinetica. Generalmente VG è molto più grande di VL cosicché VG

VL ⇡ VG =

RT per mole P

Se supponiamo inoltre che L sia una costante indipendente dalla temperatura – approssimazione non molto buona – avremo @P L = @T RT 2 /P La soluzione di questa equazione differenziale è P = (cost.) e

L/RT

(45.15)

Confrontiamo questo risultato con la variazione della pressione al variare della temperatura, che abbiamo dedotto in precedenza dalla teoria cinetica. La teoria cinetica ha indicato la possibilità che il numero di molecole di vapore sopra un liquido sia, almeno approssimativamente: n=

1 e Va

(UG UL )/RT

(45.16)

dove UG UL è l’energia interna per mole nel liquido, meno l’energia interna per mole nel gas, cioè l’energia necessaria per far evaporare una mole di liquido. L’equazione (45.15) per la termodinamica e l’equazione (45.16) per la teoria cinetica sono strettamente collegate, perché la pressione è nkT, ma non si identificano esattamente l’una con l’altra. Tuttavia esse diverranno esattamente la stessa cosa se supponiamo che sia UG UL = cost. anziché L = cost. Se supponiamo UG UL = cost. indipendente dalla temperatura, allora il ragionamento che ha portato all’equazione (45.15) produrrà l’equazione (45.16). Finché la pressione è costante, mentre il volume cambia, il cambiamento dell’energia interna UG UL è uguale al calore L meno il lavoro fatto P(VG VL ), quindi L = (UG + PVG ) (UL + PVL ) Questo confronto mostra i vantaggi e gli svantaggi della termodinamica rispetto alla teoria cinetica. Primo, l’equazione (45.14) ottenuta con la termodinamica è esatta, mentre l’equazione (45.16) può soltanto essere approssimata, per esempio, se U è quasi costante e se il modello è valido. Secondo, possiamo non conoscere esattamente il meccanismo della liquefazione; nonostante questo l’equazione (45.14) è esatta mentre la (45.16) è solo approssimata. Terzo, sebbene abbiamo trattato il problema di un gas che condensa in un liquido, il ragionamento è valido per ogni altro cambiamento di stato. Per esempio il passaggio dallo stato solido allo stato liquido è rappresentato da una curva simile a quella delle FIGURE 45.3 e 45.4. Utilizzando il calore latente di fusione M/mole, la formula analoga a quella dell’equazione (45.14) è allora ! @ Pfusione M = @T T Vliquido Vsolido V Sebbene non sia possibile comprendere la teoria cinetica del processo di fusione, tuttavia possiamo disporre di un’equazione esatta. Quando però possiamo comprendere la teoria cinetica abbiamo un altro vantaggio. L’equazione (45.14) è soltanto una relazione differenziale e non abbiamo modo di ottenere le costanti di integrazione. Nella teoria cinetica possiamo ottenere anche le costanti, se costruiamo un buon modello che descriva completamente il fenomeno. Questi sono i vantaggi e gli svantaggi dei due metodi. Quando la comprensione del fenomeno è scarsa e la situazione complessa, le relazioni termodinamiche sono le più efficienti: quando la situazione è molto semplice e l’analisi teorica possibile, conviene cercare di ottenere maggiori informazioni con l’analisi teorica.

45.3 • L’equazione di Clausius-Clapeyron

© 978-8808-22107-0

Un esempio ancora: la radiazione del corpo nero. Abbiamo discusso il problema di una scatola contenente radiazione e niente altro: abbiamo parlato dell’equilibrio fra oscillatore e radiazione. Abbiamo anche visto che i fotoni, urtando le pareti della scatola, esercitavano una pressione P e abbiamo trovato PV = U/3, dove U è l’energia totale di tutti i fotoni e V il volume della scatola. Se sostituiamo U = 3PV nell’equazione base (45.7), troviamo(1) ! ! @U @P = 3P = T P (45.17) @V T @T V Poiché il volume della nostra scatola è costante, possiamo sostituire (@P/@T)V con dP/ dT, per ottenere una comune equazione differenziale che possiamo integrare: ln P = 4 ln T + cost. ossia

P = cost. · T 4

La pressione di radiazione varia come la quarta potenza della temperatura e la densità di energia della radiazione, U/V = 3P, varia anch’essa come T 4 . Si scrive comunemente U 4 = T4 V c dove c è la velocità della luce e una costante detta costante di Stefan-Boltzmann. Non è possibile trovare con la sola termodinamica. Questo è un valido esempio delle sue possibilità e dei suoi limiti. Il sapere che U/V cambi come T 4 è un dato importante, ma conoscere quanto valga U/V a ogni temperatura richiede che si entri in certi particolari che solo una teoria completa può fornire. Per la radiazione del corpo nero abbiamo una teoria di questo genere e possiamo derivare un’espressione per la costante, nel modo seguente. Sia I(!) d! la funzione di distribuzione dell’intensità, cioè l’energia che attraversa 1 m2 in un secondo con frequenza compresa fra ! e ! + d!. La funzione di distribuzione della densità di energia = energia/volume = I(!) d!/c è U = densità totale di energia = V ⌅ 1 = densità di energia fra ! e ! + d! = !=0

=



0

1

I(!) d! c

Sappiamo dalle nostre precedenti considerazioni che I(!) =

~!3 ⇡ 2 c2 e~!/kT

1

Sostituendo questa espressione di I(!) nell’equazione relativa a U/V , otteniamo ⌅ 1 U 1 ~!3 = 2 3 d! ~!/kT V ⇡ c 0 e 1 Se sostituiamo x = ~!/kT, l’espressione diventa ⌅ 1 U (kT)4 x3 = 3 2 3 dx x V 1 ~ ⇡ c 0 e (1) In questo caso (@P/@V ) = 0 perché, allo scopo di mantenere l’oscillatore in equilibrio a una data temperatura, la T radiazione nelle vicinanze dell’oscillatore deve essere la stessa, indipendentemente dal volume della scatola. Il numero totale di fotoni nella scatola deve essere pertanto proporzionale al suo volume, così l’energia interna per unità di volume, e quindi la pressione, dipendono solo dalla temperatura.

485

486

Capitolo 45 • Chiarimenti sulla termodinamica

© 978-8808-22107-0

Questo integrale è soltanto un numero che possiamo ottenere approssimativamente, tracciando una curva e calcolando l’area contando i quadrati. Vale circa 6,5. Quelli fra noi che sono matematici possono dimostrare che l’integrale è esattamente ⇡ 4 /15.(2) Confrontando questa espressione con U/V = (4 /c) T 4 , troviamo =

k 4 ⇡2 = 5,67 · 10 60 ~3 c3

8

W/(m2 · K4 )

Se pratichiamo un piccolo foro nella nostra scatola, quanta energia attraverserà in un secondo il foro di area unitaria? Per passare dalla densità di energia al flusso di energia moltiplichiamo la densità di energia U/V per c. Moltiplichiamo anche per 1/4, come è dimostrato da quanto segue. Primo un fattore 1/2 perché può uscire solo l’energia che si propaga dall’interno verso la parete, secondo un altro fattore 1/2 perché dell’energia che si avvicina al1’apertura formando un certo angolo rispetto alla normale, la frazione che attraversa il foro è pari al coseno. Il valore medio del coseno è 1/2.(3) È chiaro ora perché scriviamo U/V = (4 /c) T 4 : così possiamo concludere che il flusso per area unitaria attraverso una piccola apertura è T 4 .

(2)

Poiché

1 1

ex l’integrale è

1 ⌅ X

1

n=1 0

Ma



1

0

che differenziato tre volte rispetto a n dà



0

1

x

=e

e

x3 e

cosicché l’integrale è

+e

2x

e

nx 3

nx

dx =

+ ...

x dx

nx

dx =

1 n 6 n4

! 1 1 + + ... 16 81 e una buona approssimazione può essere ottenuta sommando solo i primi tre o quattro termini. Nel capitolo 50 dimostreremo che la somma dei reciproci delle quarte potenze dei numeri interi è, in effetti, ⇡ 4 /90. (3) La media è effettuata sull’angolo solido. (N.d.T.) 6 1+

Ruota dentata e dente d’arresto

46.1

46

Come funziona una ruota dentata

In questo capitolo tratteremo la ruota dentata con dente d’arresto, dispositivo molto semplice che permette a un asse di girare soltanto in un senso. La possibilità di avere qualcosa che giri soltanto in un senso richiede una certa analisi dettagliata e attenta, e vi sono alcune conseguenze molto interessanti. Il progetto della trattazione è intervenuto nel tentativo di escogitare una spiegazione elementare, dal punto di vista molecolare o cinetico, del fatto che esiste una quantità massima di lavoro che si può estrarre da una macchina termica. Naturalmente abbiamo visto l’essenza dell’argomento di Carnot, ma sarebbe bello trovare una spiegazione che sia elementare nel senso che possiamo vedere fisicamente che cosa accade. Ora, esistono complicate dimostrazioni matematiche che seguono dalle leggi di Newton per dimostrare che possiamo ottenere soltanto una certa quantità di lavoro quando il calore fluisce da un posto a un altro, ma vi è grande difficoltà nel convertire questo in una dimostrazione elementare. In breve, non lo comprendiamo, sebbene siamo in grado di seguirne la matematica. Nell’argomento di Carnot, il fatto che non si possa estrarre più di una certa quantità di lavoro nell’andare da una temperatura a un’altra viene dedotto da un altro assioma, secondo il quale se ogni cosa si trova alla stessa temperatura, il calore non si può convertire in lavoro tramite un processo ciclico. Per prima cosa facciamo un passo indietro, e tentiamo di vedere, in almeno un esempio elementare, perché sia vera questa più semplice asserzione. Tentiamo di inventare un dispositivo che violi la seconda legge della termodinamica, cioè un congegno che generi lavoro da un serbatoio di calore con ogni cosa alla medesima temperatura. Diciamo di avere una scatola di gas a una certa temperatura, con all’interno un asse provvisto di pale (si veda la FIGURA 46.1 ma prendendo T1 = T2 = T, diciamo). A causa del bombardamento delle molecole di gas sulla pala, la pala oscilla e si muove a piccoli scatti. Tutto ciò che dobbiamo fare è agganciare all’altra estremità dell’asse una ruota che può ruotare soltanto in un senso – la ruota dentata con il dente d’arresto. Allora quando l’albero tenta di muoversi in un senso, non ruoterà, e quando si muove nell’altro, ruoterà. La ruota girerà lentamente, e forse potremmo perfino legare una pulce con un filo attaccato a un tamburo sull’albero, e sollevare la pulce! Chiediamoci ora se sia possibile. Secondo l’ipotesi di Carnot, ciò è impossibile. Ma se ci guardiamo appena, vediamo, prima facie, che sembra possibile. Quindi dobbiamo guardarci più attentaT2 mente. Infatti, se osserviamo la ruota dentata e il dente d’arresto, vediamo T1 un gran numero di complicazioni. Primo, la nostra ruota dentata ideale è la più semplice possibile, ma anche così c’è un dente d’arresto e ci deve essere una molla nel dente d’arresto. Il dente d’arresto deve tornare indietro dopo aver lasciato passare un dente della ruota, così la molla è necessaria. ? Un’altra caratteristica di questa ruota dentata e dente d’arresto, non mostrata nella figura, è del tutto essenziale. Supponiamo che il dispositivo fosse fatto di parti perfettamente elastiche. Dopo che il dente d’arresto è FIGURA 46.1 La macchina a ruota dentata sollevato dal dente della ruota ed è spinto indietro dalla molla, rimbalzerà con dente d’arresto.

488

Capitolo 46 • Ruota dentata e dente d’arresto

© 978-8808-22107-0

contro la ruota e continuerà a rimbalzare. Durante queste fluttuazioni, la ruota potrebbe girare in senso opposto, perché il dente della ruota potrebbe passare di sotto nel momento in cui il dente d’arresto fosse alzato! Quindi una parte essenziale dell’irreversibilità della nostra ruota è un meccanismo di smorzamento o ammortizzante che fa cessare i rimbalzi. Quando si verifica lo smorzamento, naturalmente, l’energia che era del dente d’arresto va nella ruota e si manifesta come calore. Così, nel girare, la ruota diventa sempre più calda. Per rendere più semplice la cosa, possiamo mettere un gas attorno alla ruota per togliere un po’ di calore. In ogni modo, diciamo che la temperatura del gas continua a crescere, insieme a quella della ruota. Continuerà per sempre? No! Anche il dente d’arresto e la ruota, entrambi a una certa temperatura T, hanno moto browniano. Questo moto è tale che, ogni tanto, accidentalmente, il dente d’arresto si solleva da solo e sopra un dente proprio nel momento in cui il moto browniano sulle pale tenta di girare l’asse all’indietro. E man mano che le cose si scaldano, ciò accade più spesso. Questa è la regione per cui questo dispositivo non lavora in moto perpetuo. Quando le pale vengono colpite, qualche volta il dente d’arresto si solleva e scavalca il dente della ruota. Ma qualche volta, quando tenta di girare nel verso opposto, il dente d’arresto si è già sollevato a causa delle fluttuazioni dei moti da parte della ruota, e la ruota gira nel verso opposto. Il risultato netto è nullo. Non è difficile dimostrare che quando la temperatura è uguale da ambo le parti, non ci sarà alcun moto medio netto della ruota. Naturalmente la ruota compirà una gran quantità di piccoli movimenti in un senso e nell’altro, ma non farà ciò che vorremmo, cioè girare soltanto in un senso. Guardiamo al motivo. Per sollevare il dente d’arresto fino alla cima di un dente della ruota è necessario compiere lavoro contro la molla. Chiamiamo ✏ questa energia e sia ✓ l’angolo fra i denti. La probabilità che il sistema possa accumulare l’energia sufficiente, ✏, per portare il dente d’arresto sulla cima del dente della ruota è e ✏ /kT . Ma anche la probabilità che il dente d’arresto sia sollevato accidentalmente è e ✏ /kT . Quindi il numero delle volte in cui il dente d’arresto è sollevato e la ruota può girare liberamente all’indietro è uguale al numero di volte in cui abbiamo abbastanza energia per ruotarlo in avanti quando il dente d’arresto è giù. Otteniamo un «equilibrio» e la ruota non girerà.

46.2

La ruota dentata come macchina

Andiamo avanti. Prendiamo l’esempio in cui la temperatura delle pale è T1 e la temperatura della ruota dentata è T2 , con T2 è minore di T1 . Siccome la ruota è fredda e le fluttuazioni del dente di arresto sono relativamente infrequenti, sarà molto difficile che il dente d’arresto raggiunga un’energia ✏. A causa dell’alta temperatura T1 , le pale raggiungeranno spesso l’energia ✏, così il nostro dispositivo andrà in una sola direzione, come ci proponevamo. Ora ci piacerebbe vedere se può sollevare pesi. Al tamburo nel mezzo leghiamo un filo e poniamo un peso, come la nostra pulce, attaccato al filo. Sia L il momento dovuto al peso. Se L non è troppo grande, la nostra macchina solleverà il peso perché le fluttuazioni browniane rendono più probabile il moto in una direzione che nell’altra. Desideriamo trovare che peso può sollevare, con che velocità gira, e così via. Prima consideriamo un moto in avanti, il verso solito in cui si progetta che vada una ruota dentata. Per fare un passo avanti, quanta energia deve essere presa a prestito dall’estremità con le pale? Per sollevare il dente d’arresto dobbiamo prendere a prestito un’energia ✏. La ruota gira di un angolo ✓ contro un momento L, così abbiamo bisogno anche dell’energia L✓. La quantità totale di energia che dobbiamo prendere a prestito è così ✏ + L✓. La probabilità di acquistare questa energia è proporzionale a e (✏ +L✓)/kT1 . In realtà non è soltanto questione di ottenere l’energia, ma vorremmo anche sapere il numero di volte per secondo che si ha questa energia. La probabilità per secondo è proporzionale a e (✏ +L✓)/kT1 e chiameremo 1/⌧ la costante di proporzionalità. Alla fine comunque si semplificherà. Quando avviene un passo avanti il lavoro fatto sul peso è L✓. L’energia presa dalla pala è ✏ + L✓. La molla si tende con energia ✏, poi rimbalza, rimbalza, si ferma, e questa energia si trasforma in calore. Tutta l’energia assorbita va a sollevare il peso e a spingere il dente d’arresto, il quale poi cade indietro e cede calore all’altra parte.

46.2 • La ruota dentata come macchina

© 978-8808-22107-0

489

Riassunto del funzionamento della ruota dentata con dente d’arresto Avanti

Indietro

Ha bisogno dell’energia

✏ + L✓

Prende dalla pala

L✓ + ✏

Compie lavoro

L✓

Cede alla ruota dentata



Ha bisogno dell’energia



Prende dalla ruota dentata



Cede lavoro

L✓

Dà alla pala

L✓ + ✏

dalla pala.

) Probabilità per secondo =

1 e ⌧

per il dente d’arresto.

) Probabilità per secondo =

1 e ⌧

9 > > > > > = uguale a sopra con segno invertito > > > > > ;

Se il sistema è reversibile le probabilità per secondo sono uguali, quindi calore alla ruota dentata ✏ = calore dalla pala L✓ + ✏

quindi

✏ + L✓ ✏ = T1 T2

Q2 T2 = Q1 T1

Ora consideriamo il caso opposto, che è il moto all’indietro. Cosa accade qui? Per far andare la ruota all’indietro tutto ciò che dobbiamo fare è fornire l’energia per sollevare abbastanza in alto il dente d’arresto così che la ruota dentata sfuggirà via. Questa è ancora l’energia ✏. La probabilità per secondo che il dente d’arresto si sollevi a questa altezza è ora (1/⌧) e ✏ /kT2 . La costante di proporzionalita è la stessa, ma questa volta compare kT2 a causa della diversa temperatura. Quando accade questo, il lavoro viene ceduto perché la ruota scivola all’indietro. Perde una tacca, così cede il lavoro L✓. L’energia presa dal sistema dentato è ✏, e l’energia ceduta al gas a T1 dalla parte della pala è L✓ + ✏. Il vedere la ragione di ciò richiede una piccola riflessione. Supponiamo che il dente d’arresto si sia sollevato accidentalmente per una fluttuazione. Allora quando ricade e la molla lo spinge giù contro il dente, c’è una forza che tenta di girare la ruota, perché il dente spinge su un piano inclinato. Questa forza compie lavoro, e così fa la forza dovuta ai pesi. Quindi entrambe insieme costituiscono la forza totale, e tutta l’energia che è lentamente ceduta appare come calore all’estremità della pala. (Naturalmente deve farlo, per la conservazione dell’energia, ma bisogna essere attenti a pensare la cosa da cima a fondo!) Notiamo che tutte queste energie sono esattamente uguali, ma opposte. Così, a seconda di quale di queste due probabilità per secondo è maggiore, il peso o è lentamente sollevato o lentamente abbassato. Naturalmente, si muoverà costantemente avanti e indietro, andando su per un po’ e giù per un po’, ma noi stiamo parlando del comportamento medio. Supponiamo che per un particolare peso capiti che le probabilità per secondo siano uguali. Aggiungiamo allora un peso infinitesimo al filo. Il peso scenderà lentamente, e sarà fatto lavoro sulla macchina. Sarà presa energia dalla ruota e ceduta alle pale. Se invece togliamo un poco del peso, allora lo sbilanciamento è nell’altro senso. Il peso viene sollevato, e viene tolto calore dalla pala e ceduto alla ruota. Abbiamo così le condizioni del ciclo reversibile di Carnot, purché il peso sia proprio tale che queste due probabilità siano eguali. La condizione è evidentemente che ✏ ✏ + L✓ = T1 T2 Diciamo che la macchina solleva lentamente il peso. L’energia Q1 è presa dalle pale e l’energia Q2 è ceduta alla ruota, e queste energie stanno nel rapporto (✏ + L✓)/✏. Anche se abbassiamo il peso, abbiamo Q1 ✏ + L✓ = Q2 ✏

(L✓+✏ )/kT1

✏ /kT2

Capitolo 46 • Ruota dentata e dente d’arresto

490

© 978-8808-22107-0

Così abbiamo (si veda il riassunto del funzionamento della ruota dentata) Q1 T1 = Q2 T2 Inoltre il lavoro che otteniamo sta all’energia presa dalla pala come L✓ sta a L✓ + ✏, quindi come (T1 T2 )/T1 . Vediamo che il nostro dispositivo, operando reversibilmente, non può estrarre più lavoro di questo. Questo è il risultato che ci aspettavamo dall’argomento di Carnot, e il risultato principale di questa lezione. Tuttavia, possiamo usare il nostro dispositivo per comprendere alcuni altri fenomeni, anche fuori dall’equilibrio, e quindi oltre la portata della termodinamica. Calcoliamo ora con che velocità girerebbe il nostro dispositivo unidirezionale se ogni cosa fosse alla medesima temperatura e se attaccassimo un peso al tamburo. Se tiriamo molto, molto forte, naturalmente, vi è ogni tipo di complicazione. Il dente d’arresto scivola sulla ruota dentata, o si rompe la molla, o qualche altra cosa. Ma supponiamo di tirare abbastanza dolcemente perché ogni cosa funzioni bene. In queste circostanze, è giusta l’analisi precedente della probabilità che la ruota vada avanti o indietro, se ricordiamo che le due temperature sono uguali. Si ottiene un angolo ✓ per ogni passo, così che la velocità angolare è ✓ volte la probabilità di uno di questi salti per secondo. Va avanti con probabilità (1/⌧) e (✏ +L✓)/kT e indietro con probabilità (1/⌧) e ✏ /kT così che per la velocità angolare abbiamo !=

✓ e ⌧

(✏ +L✓)/kT

e

✏ /kT

=

✓ e ⌧

✏ /kT



e

L✓/kT

1



(46.1)

Se riportiamo in grafico ! in funzione di L, otteniamo la curva mostrata in FIGURA 46.2. Vediamo che fa una gran differenza se L è positivo o negativo. Se L aumenta nella direzione positiva, il che accade quando tentiamo di guidare la ruota all’indietro, la velocità all’indietro tende ad avvicinarsi a una costante. Quando L diventa negativo, ! in realtà «decolla» in avanti, dato che e elevato a una potenza enorme è molto grande! La velocità angolare ottenuta da forze differenti è quindi molto asimmetrica. Andare in un verso è facile: acquistiamo un’enorme velocità angolare con una piccola forza. Andando nell’altro senso, possiamo impiegare una L forza enorme, ma la ruota gira a stento. Troviamo la stessa cosa in un raddrizzatore elettrico. Invece della forza, abbiamo il campo elettrico, e invece della velocità angolare, abbiamo la corrente elettrica. Nel caso di un raddrizzatore, la tensione non è proporzionale alla resistenza, e la situazione è asimmetrica. La medesima analisi FIGURA 46.2 Velocità angolare della ruota dentata in funzione del momento della forza. che abbiamo fatto per il raddrizzatore meccanico varrà anche per un raddrizzatore elettrico. Infatti, il tipo di formula che abbiamo ottenuto prima è tipico delle capacità dei raddrizzatori di portare corrente in funzione della loro tensione. Ora togliamo tutti i pesi e guardiamo la macchina originale. Se T2 fosse minore di T1 , la ruota dentata andrebbe in avanti, come tutti sono disposti a credere. Ma ciò che è difficile da credere, a prima vista, è il contrario. Se T2 è maggiore di T1 , la ruota dentata gira in senso contrario! Una ruota dentata dinamica con grandi quantità di calore gira all’indietro, perché il dente d’arresto della ruota rimbalza. Se il dente d’arresto, per un momento, è da qualche parte sul piano inclinato, esso spinge lateralmente il piano inclinato. Ma esso spinge sempre su un piano inclinato, perché se gli accade di sollevarsi abbastanza in alto da arrivare oltre la punta di un dente, allora il piano inclinato scivola ed esso arriva giù di nuovo su un piano inclinato. Così, se è calda, una ruota dentata con dente di arresto è fatta apposta per girare in direzione esattamente opposta a quella per cui è stata originariamente progettata! Nonostante tutta la nostra abilità in progetti male equilibrati, se le due temperature sono esattamente uguali non c’è più tendenza a girare da una parte piuttosto che dall’altra. Nel momento in cui la guardiamo, può darsi che stia girando da una parte o dall’altra, ma al passare del tempo, non si sposta. Il fatto che non si sposti è in realtà il profondo principio fondamentale sul quale è basata tutta la termodinamica. ω

46.3 • Reversibilità in meccanica

© 978-8808-22107-0

46.3

Reversibilità in meccanica

Quale principio meccanico più profondo ci dice che, col passare del tempo, se la temperatura viene mantenuta la stessa dappertutto, il nostro dispositivo non girerà né verso destra né verso sinistra? Abbiamo evidentemente una proposizione fondamentale secondo la quale non c’è modo di progettare una macchina che, lasciata a se stessa, abbia più probabilità di girare in un senso piuttosto che nell’altro dopo un tempo sufficientemente lungo. Dobbiamo cercare di vedere come ciò segua dalle leggi della meccanica. Le leggi della meccanica vanno circa così: la massa per l’accelerazione è la forza, e la forza su ciascuna particella è una qualche funzione complicata delle posizioni di tutte le altre particelle. Vi sono altre situazioni in cui le forze dipendono dalla velocità, come nel magnetismo, ma non consideriamole. Prendiamo un caso più semplice, come la gravità, in cui le forze dipendono soltanto dalla posizione. Supponiamo di aver risolto il nostro insieme di equazioni e di avere un certo moto x(t) per ogni particella. In un sistema sufficientemente complesso, le soluzioni sono molto complesse, e ciò che accade nel tempo risulta molto sorprendente. Se scriviamo qualsiasi disposizione ci piaccia per le particelle, vedremo che questa disposizione in realtà si verifica se attendiamo abbastanza a lungo! Se seguiamo la nostra soluzione per un tempo sufficientemente lungo, essa tenta, per così dire, tutto ciò che può fare. Questo non è assolutamente necessario nei dispositivi più semplici, ma accade quando i sistemi diventano sufficientemente complessi, con abbastanza atomi. Ora c’è qualcos’altro che la soluzione può fare. Se risolviamo le equazioni del moto, possiamo ottenere certe funzioni come t + t 2 + t 3 . Affermiamo che un’altra soluzione sarebbe t + t 2 t 3 . In altre parole, se sostituiamo dappertutto t al posto di t da un capo all’altro dell’intera soluzione, otterremo ancora una volta una soluzione della stessa equazione. Ciò segue dal fatto che se sostituiamo t al posto di t nell’equazione differenziale originale, non cambia nulla, dato che appaiono soltanto derivate seconde rispetto a t. Ciò significa che se abbiamo un certo moto, allora è possibile anche il moto esattamente opposto. Nella confusione completa che sopraggiunge se aspettiamo abbastanza a lungo, qualche volta il moto si trova ad andare in un verso, e qualche volta si ritrova a procedere in verso opposto. In uno dei moti non c’è niente di più bello che nell’altro. Così è impossibile progettare una macchina che, al passare del tempo, sia più probabile vada in un senso piuttosto che nell’altro, se la macchina è sufficientemente complessa. Si potrebbe pensare a un esempio per il quale ciò è ovviamente falso. Se prendiamo una ruota, per esempio, e la facciamo ruotare su se stessa nello spazio vuoto, essa andrà per sempre nello stesso verso. Così esistono alcune condizioni, come la conservazione del momento della quantità di moto, che violano l’argomento precedente. Ciò richiede soltanto che l’argomento sia condotto con un po’ più di cura. Forse le pareti raccolgono il momento della quantità di moto, o qualcosa del genere, così che non abbiamo leggi di conservazione speciali. Allora, se il sistema è abbastanza complicato, l’argomento è vero. È basato sul fatto che le leggi della meccanica sono reversibili. Per interesse storico, vorremmo fare un’osservazione su un dispositivo inventato da Maxwell, che per primo ricavò la teoria dinamica dei gas. Egli suppose la situazione seguente: abbiamo due scatole di gas alla stessa temperatura, con un piccolo foro fra di esse. Al foro si trova un diavoletto (che può essere una macchina naturalmente!). Sul foro c’è una porta, che può essere aperta o chiusa dal diavolo. Egli osserva le molecole provenienti da sinistra. Ogni volta che vede una molecola veloce, egli apre la porta. Quando ne vede una lenta, la lascia chiusa. Se vogliamo che sia un diavolo ultraspeciale, egli può avere occhi sul dietro della testa e fare la cosa opposta alle molecole provenienti dall’altra parte. Egli lascia passare le lente verso sinistra e le veloci verso destra. Ben presto la parte sinistra si raffredda e la destra si scalda. Allora, dato che potremmo avere un diavolo del genere, sono violate le idee della termodinamica? Risulta, se costruiamo un diavolo di dimensioni finite, che lo stesso diavolo si scalda tanto che dopo un po’ non può vedere molto bene. Il diavolo più semplice possibile, per esempio, sarebbe una botola spinta sul foro da una molla. Una molecola veloce passa perché è capace di sollevare la botola. La molecola lenta non può passare, e rimbalza indietro. Ma questa cosa non è altro che la nostra ruota dentata con dente di arresto in un’altra forma, e alla fine il meccanismo si scalderà. Se facciamo l’ipotesi che il calore specifico del diavolo non sia infinito, esso deve scaldarsi. Esso

491

492

Capitolo 46 • Ruota dentata e dente d’arresto

© 978-8808-22107-0

ha soltanto un numero finito di meccanismi e ruote, così non può liberarsi del calore in più che acquista osservando le molecole. Presto a causa del moto browniano scuote tanto che non può dire da che parte si sta muovendo, e molto meno se le molecole vengono o vanno, così non funziona.

46.4

Irreversibilità

Tutte le leggi della fisica sono reversibili? Evidentemente no! Provate soltanto a fare il processo inverso a quello di strapazzare un uovo! Fate andare un film all’indietro, e bastano alcuni minuti perché tutti comincino a ridere. La caratteristica più naturale di tutti i fenomeni è la loro ovvia irreversibilità. Da dove proviene l’irreversibilità? Non proviene dalle leggi di Newton. Se affermiamo che il comportamento di ogni cosa si deve alla fine comprendere in termini delle leggi della fisica e se risulta anche che tutte le equazioni hanno la fantastica proprietà che se poniamo t = t abbiamo un’altra soluzione, allora ogni fenomeno è reversibile. Allora come accade che in natura su larga scala le cose non sono reversibili? Ovviamente deve esistere qualche legge, qualche equazione oscura ma fondamentale, forse nell’elettricità, forse nella fisica del neutrino, nella quale ha importanza in che verso scorre il tempo. Discutiamo ora questa questione. Già conosciamo una di queste leggi che dice che l’entropia aumenta sempre. Se abbiamo un oggetto caldo e uno freddo, il calore va dal caldo al freddo. Così la legge dell’entropia è una di tali leggi. Ma ci aspettiamo di comprendere la legge dell’entropia dal punto di vista della meccanica. Infatti abbiamo appena avuto successo nell’ottenere tutte le conseguenze dell’argomento per il quale il calore non può fluire all’indietro spontaneamente soltanto con argomenti meccanici, e con ciò abbiamo ottenuto una spiegazione della seconda legge. Apparentemente otteniamo l’irreversibilità da equazioni reversibili. Ma era solo un argomento meccanico quello che abbiamo usato? Esaminiamolo più attentamente. Siccome la nostra questione ha a che fare con l’entropia, il nostro problema è trovare una descrizione microscopica dell’entropia. Se diciamo di avere una certa quantità di energia in qualche cosa, come un gas, allora possiamo farci una rappresentazione microscopica del gas e dire che ogni atomo ha una certa energia. Tutte queste energie sommate insieme ci danno l’energia totale. Similmente, può darsi che ogni atomo abbia una certa entropia. Sommando tutto insieme avremmo l’entropia totale. Non funziona così bene, ma vediamo che cosa accade. Come esempio calcoliamo la differenza di entropia fra un gas a una certa temperatura a un volume, e un gas alla stessa temperatura a un altro volume. Ricordiamo, dal capitolo 44, che avevamo, per la variazione di entropia, ⌅ dQ S= T Nel caso presente, l’energia del gas è la stessa prima e dopo l’espansione, dato che la temperatura non varia. Così dobbiamo aggiungere abbastanza calore da uguagliare il lavoro fatto dal gas o, per ogni piccola variazione di volume, dQ = P dV Introducendo questo al posto di dQ, otteniamo S=



V2

V1

P

dV = T



V2

V1

N kT dV V2 = N k ln V T V1

come abbiamo ottenuto nel capitolo 44. Per esempio, se espandiamo il volume di un fattore 2, la variazione di entropia è N k ln 2. Consideriamo ora un altro esempio interessante. Supponiamo di avere una scatola con una barriera nel mezzo. Da una parte c’è neon (molecole «nere») e dall’altra argon (molecole «bianche»). Ora togliamo la barriera, e lasciamo che si mescolino. Di quanto è cambiata l’entropia?

46.5 • Ordine ed entropia

© 978-8808-22107-0

È possibile immaginare che invece della barriera abbiamo un pistone, con buchi che lasciano passare le bianche ma non le nere, e un altro tipo di pistone con caratteristiche opposte. Se spostiamo ciascun pistone all’estremità, vediamo che per ciascun gas il problema è simile a quello che abbiamo appena risolto. Così otteniamo una variazione di entropia pari a N k ln 2, il che significa che l’entropia è cresciuta di k ln 2 per molecola. Il 2 ha a che fare con lo spazio in più che ha la molecola, il che è abbastanza strano. Non è una proprietà della molecola in se stessa, ma di quanto spazio ha la molecola per muoversi. Questa è una strana situazione, in cui l’entropia aumenta ma in cui tutto ha la stessa temperatura e la stessa energia! La sola cosa che è cambiata è che le molecole sono distribuite differentemente. Sappiamo bene che se togliamo semplicemente la barriera, dopo un tempo lungo, ogni cosa sarà mescolata completamente, a causa delle collisioni, del moto, degli urti violenti, e così via. Ogni tanto una molecola bianca va verso una nera, e una nera va verso una bianca, e può darsi che passino. Gradualmente le bianche si insinuano, accidentalmente, nello spazio delle nere, e le nere si insinuano, accidentalmente, nello spazio delle bianche. Se aspettiamo abbastanza a lungo otteniamo una mescolanza. Chiaramente, questo è un processo irreversibile nel mondo reale, e dovrebbe comportare un aumento di entropia. Qui abbiamo un semplice esempio di processo irreversibile che è composto completamente di eventi reversibili. Ogni volta che si verifica una collisione fra due qualsiasi molecole, esse si allontanano in certe direzioni. Se prendessimo un film di una collisione a rovescio, non ci sarebbe nulla di sbagliato nelle fotografie. Infatti, un tipo di collisione è proprio altrettanto probabile dell’altra. Così il mescolamento è completamente reversibile, nondimeno è irreversibile. Ognuno sa che se cominciassimo con molecole bianche e nere separate, otterremmo un mescolamento in pochi minuti. Se stessimo a guardarlo per parecchi altri minuti, non si separerebbe di nuovo ma resterebbe mescolato. Così abbiamo una irreversibilità che è basata su situazioni reversibili. Ma ora ne vediamo anche la ragione. Abbiamo cominciato con una disposizione che è, in qualche modo, ordinata. A causa del caos delle collisioni, diventa disordinata. È il cambiamento da una disposizione ordinata a una disposizione disordinata che è causa dell’irreversibilità. È vero che se prendessimo un film di questo, e lo mostrassimo a rovescio, lo vedremmo diventare gradualmente ordinato. Qualcuno direbbe: «Questo è contrario alle leggi della fisica!». Così riproietteremmo il film ed esamineremmo ogni collisione. Ognuna sarebbe perfetta, e ognuna obbedirebbe alle leggi della fisica. La ragione, naturalmente, è che le velocità di ogni molecola sono proprio giuste, così se si seguono i cammini all’indietro, esse ritornano alla loro condizione originale. Ma questa è una circostanza che è molto improbabile si verifichi. Se iniziamo col gas in una disposizione non particolare, soltanto molecole bianche e nere, non tornerà più indietro.

46.5

Ordine ed entropia

Dobbiamo ora parlare su ciò che intendiamo per disordine e ciò che intendiamo per ordine. Non è una questione di ordine piacevole o disordine spiacevole. Ciò che è diverso nei nostri casi di mescolanza e non mescolanza è ciò che segue. Supponiamo di dividere lo spazio in piccoli elementi di volume. Se abbiamo molecole bianche e nere, in quanti modi potremmo distribuirle negli elementi di volume in modo che le bianche siano da una parte e le nere dall’altra? D’altra parte, in quanti modi potremmo distribuirle senza alcuna restrizione su dove debbono andare? Chiaramente ci sono molti più modi di distribuirle nell’ultimo caso. Misuriamo il «disordine» col numero di modi in cui si possono disporre le cose internamente, in modo che dall’esterno il tutto si presenti nello stesso modo. Il logaritmo di questo numero di modi è l’entropia. Il numero dei modi nel caso dei gas separati è minore, così l’entropia è minore, ossia il «disordine» è minore. Così con la precedente definizione tecnica di disordine possiamo comprendere l’asserzione. Primo, l’entropia misura il disordine. Secondo, l’universo procede sempre dall’«ordine» al «disordine» così l’entropia cresce sempre. L’ordine non è ordine nel senso che ci piace la disposizione, ma nel senso che il numero di modi in cui la possiamo realizzare, conservando lo stesso aspetto dall’esterno, è relativamente ristretto. Nel caso in cui abbiamo fatto girare in senso contrario il nostro film del mescolamento dei gas, non c’era tanto disordine quanto pensavamo. Ogni singolo

493

494

Capitolo 46 • Ruota dentata e dente d’arresto

© 978-8808-22107-0

atomo aveva esattamente la velocità e la direzione giusta per venir bene! L’entropia non era alta dopo tutto, anche se appariva tale. E per la reversibilità delle altre leggi fisiche? Quando abbiamo parlato del campo elettrico generato da una carica accelerata, fu detto che dobbiamo prendere il campo ritardato. Al tempo t e alla distanza r della carica, prendiamo il campo dovuto all’accelerazione al tempo t r/c, non t + r/c. Così sembra a prima vista che la legge della elettricità non sia reversibile. Molto stranamente, tuttavia, le leggi che abbiamo usato vengono da un insieme di equazioni chiamate le equazioni di Maxwell, che in realtà sono reversibili. Inoltre, è possibile argomentare che se usassimo soltanto il campo anticipato, il campo dovuto allo stato delle cose a t + r/c, e lo facessimo in modo assolutamente consistente in uno spazio completamente delimitato, ogni cosa accadrebbe esattamente nello stesso modo come se usassimo i campi ritardati! Questa apparente irreversibilità in elettricità, almeno in uno spazio delimitato, non è quindi affatto un’irreversibilità. Già abbiamo qualche indicazione di questo, perché sappiamo che quando abbiamo una carica oscillante che genera campi che sono fatti rimbalzare sulle pareti di uno spazio delimitato, alla fine otteniamo un equilibrio non unilaterale. L’impostazione col campo ritardato è soltanto una convenienza nel metodo della soluzione. Per quanto ne sappiamo, tutte le leggi fondamentali della fisica, come le equazioni di Newton, sono reversibili. Allora da dove proviene l’irreversibilità? Proviene dall’ordine che si trasforma in disordine, ma non comprendiamo questo finché non conosciamo l’origine dell’ordine. Come accade che le situazioni nelle quali ci troviamo tutti i giorni sono sempre fuori dall’equilibrio? Una possibile spiegazione è la seguente. Consideriamo di nuovo la nostra scatola di molecole bianche e nere mescolate insieme. Ora è possibile, se aspettiamo abbastanza a lungo, per un puro caso, altamente improbabile, ma possibile, che la distribuzione delle molecole diventi prevalentemente bianca da una parte e prevalentemente nera dall’altra. Dopodiché, col passare del tempo e al continuare dei casi, esse di nuovo si mescolano di più. Così una possibile spiegazione dell’alto grado di ordine nel mondo di oggi è che è soltanto una questione di fortuna. Forse è accaduto che in passato il nostro universo abbia avuto una fluttuazione di un certo tipo, nella quale le cose si sono un po’ separate, e ora stanno ritornando insieme. Questo tipo di teoria non è asimmetrica, perché possiamo chiederci che aspetto ha il gas separato, o un po’ nel futuro o un po’ nel passato. In entrambi i casi vediamo una macchia grigia nell’interfaccia, perché le molecole si mescolano di nuovo. Indipendentemente dal senso in cui va il tempo, il gas si mescola. Così questa teoria direbbe che l’irreversibilità è soltanto uno dei casi della vita. Ci piacerebbe di argomentare che non è così. Supponiamo di non guardare simultaneamente l’intera scatola, ma soltanto un pezzo della scatola. Allora, a un certo momento, supponiamo di scoprire una certa quantità di ordine. In questo piccolo pezzo, bianco e nero sono separati. Che cosa dovremmo dedurre sulla condizione in luoghi dove non abbiamo ancora guardato? Se pensiamo in realtà che l’ordine sia nato dal completo disordine a causa di una fluttuazione, dobbiamo sicuramente prendere la fluttuazione più probabile che poteva produrlo, e la condizione più probabile non è che anche il resto si sia districato! Pertanto, dall’ipotesi che il mondo sia una fluttuazione, tutte le predizioni dicono che se esaminiamo una parte del mondo che non abbiamo mai visto prima, troveremo che è tutta mescolata, e non come il pezzo che abbiamo appena guardato. Se il nostro ordine fosse dovuto a una fluttuazione, non ci aspetteremmo ordine dappertutto ma soltanto dove l’abbiamo notato. Ora facciamo l’ipotesi che la separazione esista perché il passato dell’universo era in realtà ordinato. Non è dovuta a una fluttuazione, ma il tutto era in passato bianco e nero. Questa teoria ora predice che negli altri posti ci sarà ordine – l’ordine non è dovuto a una fluttuazione, ma a un ordine molto più elevato all’inizio del tempo. Ci aspetteremmo allora di trovare ordine dove non abbiamo ancora guardato. Gli astronomi, per esempio, hanno esaminato soltanto alcune stelle. Ogni giorno essi volgono i telescopi verso altre stelle, e le nuove stelle si comportano nello stesso modo delle vecchie. Concludiamo quindi che l’universo non è una fluttuazione, e che l’ordine è un ricordo delle condizioni dell’inizio delle cose. Questo non significa che ne comprendiamo la logica. Per qualche ragione, un tempo l’universo aveva un’entropia molto bassa per il suo contenuto di energia, e da allora l’entropia è aumentata. Così questa è la via verso il futuro. Questa è l’origine

© 978-8808-22107-0

46.5 • Ordine ed entropia

di tutta l’irreversibilità, questo è ciò che produce i processi di crescita e decadimento, che ci fa ricordare il passato e non il futuro, ricordare le cose che sono più vicine a quel momento della storia dell’universo in cui l’ordine era più elevato di ora, e la ragione per cui non siamo capaci di ricordare cose in cui il disordine è più elevato di ora, ciò che chiamiamo futuro. Così come abbiamo rilevato in un capitolo precedente, l’intero universo è in un bicchiere di vino, se lo osserviamo abbastanza attentamente. In questo caso il bicchiere di vino è complicato, perché c’è acqua e vetro e luce e ogni altra cosa. Un’altra soddisfazione del nostro argomento di fisica è che anche le cose semplici e idealizzate, come la ruota dentata con dente d’arresto, funzionano soltanto perché sono parti dell’universo. La ruota dentata con dente d’arresto funziona soltanto in una direzione perché ha qualche fondamentale contatto col resto dell’universo. Se la ruota dentata col dente d’arresto fosse in una scatola e isolata per un certo tempo sufficiente la ruota non avrebbe più probabilità di andare in un verso che nell’altro. Ma poiché solleviamo le tendine e lasciamo uscire la luce, poiché raffreddiamo a contatto con la terra e riceviamo calore dal sole, le ruote dentate con denti d’arresto che costruiamo possono girare in un solo verso. Questa unidirezionalità è in rapporto col fatto che la ruota dentata è parte dell’universo. È parte dell’universo non soltanto nel senso che obbedisce alle leggi fisiche dell’universo, ma il suo comportamento unidirezionale è legato al comportamento unidirezionale dell’intero universo. Non si può comprendere completamente finché il mistero degli inizi della storia dell’universo non sia ulteriormente ridotto dalla speculazione alla comprensione scientifica.

495

47

Il suono e l’equazione dell’onda

47.1

Le onde

In questo capitolo tratteremo il fenomeno delle onde. Questo è un fenomeno che appare in molti contesti in tutta la fisica e quindi la nostra attenzione si dovrebbe concentrare su di esso non soltanto a causa dell’esempio particolare qui considerato, che è il suono, ma anche per l’applicazione molto più ampia di queste idee in tutti i rami della fisica. Quando abbiamo studiato l’oscillatore armonico è stato messo in evidenza che non esistono soltanto esempi meccanici di sistemi oscillanti, ma anche elettrici. Le onde sono in relazione con i sistemi oscillanti, tranne che le oscillazioni ondose appaiono non soltanto come oscillazioni temporali in un punto, ma si propagano anche nello spazio. In realtà abbiamo già studiato le onde. Quando abbiamo studiato la luce, nell’imparare le proprietà delle onde relativamente a quell’argomento, prestammo particolare attenzione all’interferenza nello spazio di onde provenienti da diverse sorgenti poste in punti diversi e tutte alla stessa frequenza. Esistono due importanti fenomeni relativi alle onde che non abbiamo ancora discusso, che si hanno nella luce, cioè nelle onde elettromagnetiche, come pure in qualunque altra forma di onde. Il primo di questi è il fenomeno dell’interferenza nel tempo invece che interferenza nello spazio. Se abbiamo due sorgenti sonore che hanno frequenze lievemente diverse e se le ascoltiamo entrambe nello stesso momento, allora qualche volta le onde arrivano con le creste insieme e qualche volta con la cresta insieme alla gola (FIGURA 47.1). L’aumento e la diminuzione del suono che risulta è il fenomeno dei battimenti o, in altre parole, dell’interferenza nel tempo. Il secondo fenomeno concerne le forme d’onda che risultano quando le onde sono confinate entro un dato volume e si riflettono avanti e indietro sulle pareti. Questi effetti avrebbero potuto, naturalmente, essere discussi per il caso delle onde elettromagnetiche. La ragione per non averlo fatto è che usando un solo esempio non daremmo la sensazione di stare in realtà imparando molti argomenti differenti nello stesso tempo. Per sottolineare l’applicabilità generale delle onde al di là dell’elettrodinamica, consideriamo qui un esempio differente, in particolare le onde sonore. Altri esempi di onde sono le onde d’acqua consistenti nei lunghi rigonfiamenti d’acqua che arrivano fin sulla spiaggia, o le più piccole onde d’acqua consistenti nelle ondulazioni da tensione superficiale. Come altro esempio, nei solidi esistono due tipi di onde elastiche; un’onda di compressione (o longitudinale) in cui le particelle del solido oscillano avanti e indietro lungo la direzione di propagazione dell’onda (le onde sonore in un gas sono di questo tipo) e un’onda trasversale in cui le particelle del solido oscillano in una direzione perpendicolare alla direzione di propagazione. Le onde sismiche contengono onde elastiche di entrambi i tipi, generate da un movimento in qualche punto della crosta terrestre. Ancora un altro esempio di onde si trova nella fisica moderna. Queste FIGURA 47.1 Interferenza nel tempo di due sorgenti sono onde che danno l’ampiezza di probabilità di trovare una particella sonore con frequenze leggermente differenti, in un dato posto – le «onde materiali» che abbiamo già discusso. La loro che dà luogo ai battimenti.

47.1 • Le onde

© 978-8808-22107-0

497

frequenza è proporzionale all’energia e il numero d’onde è proporzionale alla quantità di moto. Sono le onde della meccanica quantistica. In questo capitolo considereremo soltanto onde per le quali la velocità è indipendente dalla lunghezza d’onda. Questo è, per esempio, il caso della luce nel vuoto. La velocità della luce è allora la medesima per le onde radio, la luce blu, la luce verde, o per qualsiasi altra lunghezza d’onda. A causa di questo comportamento, quando iniziammo a descrivere il fenomeno delle onde dapprima non notammo di avere propagazione di onde. Dicemmo invece che se in un punto si muove una carica, il campo elettrico a una distanza x era proporzionale all’accelerazione, non al tempo t, ma al tempo precedente t x/c. Quindi se dovessimo disegnare il campo elettrico nello spazio a un qualche istante temporale, come nella FIGURA 47.2, il campo elettrico a un tempo t successivo avrebbe percorso la distanza ct, come indicato nella figura. Matematicamente possiamo dire che nell’esempio unidimensionale di cui parliamo, il campo elettrico è funzione di x ct. Vediamo che a t = 0 esso è una certa funzione di x. Se consideriamo un tempo successivo, dobbiamo soltanto aumentare un po’ x per ottenere lo stesso valore del campo elettrico. Per esempio, se il campo massimo ct si aveva a x = 3 al tempo zero, allora per trovare la nuova posizione del campo massimo al tempo t abbiamo bisogno di x

ct = 3

ossia

x = 3 + ct

Vediamo che questo tipo di funzione rappresenta la propagazione di un’onda. Tale funzione, f (x ct), rappresenta allora un’onda. Possiamo riassumere questa descrizione di onda dicendo semplicemente che

x

47.2 La curva a tratto continuo mostra quale potrebbe essere l’aspetto del campo elettrico a un certo istante di tempo, mentre la curva tratteggiata mostra qual è il campo elettrico dopo il tempo t.

FIGURA

f (x

ct) = f (x + x

c(t + t))

quando x = c t. Esiste, naturalmente, un’altra possibilità, cioè che invece di una sorgente a sinistra, come indicato in FIGURA 47.2, abbiamo una sorgente a destra, così che l’onda si propaghi verso le x negative. Allora l’onda sarebbe descritta da g(x + ct). Esiste l’ulteriore possibilità che nello spazio esista più di un’onda nello stesso tempo, cosicché il campo elettrico è la somma dei due campi, ciascuno propagantesi indipendentemente. Questo comportamento dei campi elettrici si può descrivere dicendo che se f 1 (x ct) è un’onda, e se f 2 (x ct) è un’altra onda, la loro somma è ancora un’onda. Questo è chiamato principio di sovrapposizione. Lo stesso principio è valido per il suono. Abbiamo familiarità col fatto che se si produce un suono, udiamo con completa fedeltà la medesima sequenza di suoni che è stata generata. Se le alte frequenze viaggiassero più velocemente delle basse frequenze, un breve, netto rumore sarebbe udito come una successione di suoni musicali. Similmente, se la luce rossa viaggiasse più velocemente della luce blu, un lampo di luce bianca sarebbe visto prima come rosso, poi come bianco, e finalmente come blu. Abbiamo familiarità col fatto che questo non è il caso nostro. Sia il suono sia la luce viaggiano nell’aria con una velocità che è quasi del tutto indipendente dalla frequenza. Esempi di propagazione di onde per le quali non si verifica questa indipendenza saranno considerati nel capitolo 48. Nel caso della luce (onde elettromagnetiche) abbiamo dato una regola che determinava il campo elettrico in un punto come risultato dell’accelerazione di una carica. Ci si potrebbe aspettare che ciò che dovremmo fare è dare una regola con la quale si determina qualche attributo dell’aria, diciamo la pressione, a una data distanza dalla sorgente in funzione del moto della sorgente, ritardato del tempo di spostamento del suono. Nel caso della luce questo procedimento era accettabile perché tutto ciò che sapevamo era che una carica in un punto esercita una forza su un’altra carica in un altro punto. I particolari della propagazione da un punto all’altro non erano assolutamente essenziali. Nel caso del suono, tuttavia, sappiamo che si propaga attraverso l’aria fra la sorgente e chi ascolta ed è certamente naturale domandarsi quale sia, a ogni dato momento, la pressione dell’aria. Inoltre vorremmo conoscere esattamente come si muove l’aria. Nel caso dell’elettricità potevamo accettare una regola dato che potevamo dire di non conoscere ancora le leggi dell’elettricità, ma non possiamo fare la stessa osservazione riguardo al suono. Non saremmo

498

Capitolo 47 • Il suono e l’equazione dell’onda

© 978-8808-22107-0

soddisfatti di una regola che stabilisce come si muove attraverso l’aria la pressione del suono, perché il processo dovrebbe essere comprensibile come conseguenza delle leggi della meccanica. In breve, il suono è un ramo della meccanica, e così deve essere compreso attraverso le leggi di Newton. La propagazione del suono da un punto all’altro è semplicemente una conseguenza della meccanica e delle proprietà dei gas, se si propaga in un gas, o delle proprietà dei liquidi o dei solidi, se si propaga attraverso tali mezzi. Più avanti ricaveremo le proprietà della luce e della sua propagazione per onde in modo simile dalle leggi dell’elettrodinamica.

47.2

La propagazione del suono

Daremo una derivazione delle proprietà della propagazione del suono fra la sorgente e il ricevitore come conseguenza delle leggi di Newton, e non considereremo l’interazione con la sorgente e col ricevitore. Generalmente sottolineiamo un risultato piuttosto che una particolare derivazione di esso. In questo capitolo ci poniamo dal punto di vista opposto. La sostanza qui, in un certo senso, è la derivazione stessa. Questo problema di spiegare nuovi fenomeni in termini di vecchi, quando conosciamo le leggi dei vecchi, è forse la maggiore arte della fisica matematica. Il fisico matematico ha due problemi: uno è trovare le soluzioni, date le equazioni, e l’altro è trovare le equazioni che descrivono un nuovo fenomeno. Questa derivazione è un esempio del secondo tipo di problema. Considereremo qui l’esempio più semplice: la propagazione del suono in una dimensione. Per eseguire una derivazione del genere è necessario prima avere un certo tipo di comprensione di ciò che accade. Fondamentalmente ciò che interviene è che se si muove un oggetto in un punto nell’aria, osserviamo che c’è una perturbazione che si propaga attraverso l’aria. Se ci domandiamo che tipo di perturbazione, diremmo che ci aspetteremmo che il moto dell’oggetto produca una variazione di pressione. Naturalmente se l’oggetto viene mosso con delicatezza, l’aria fluisce semplicemente attorno a esso, ma ciò di cui ci occupiamo è un movimento rapido, così che non vi sia il tempo sufficiente per un tale fluire. Allora col movimento l’aria si comprime e si produce una variazione di pressione che spinge su altra aria. Questa aria viene compressa a sua volta, il che conduce di nuovo a una pressione addizionale, e si propaga un’onda. Vogliamo ora formulare un processo del genere. Dobbiamo decidere di quali variabili abbiamo bisogno. Nel nostro particolare problema avremmo bisogno di sapere di quanto si è mossa l’aria, così lo spostamento dell’aria nell’onda sonora è certamente una variabile rilevante. Inoltre vorremmo descrivere di quanto varia la densità dell’aria quando viene spostata. Anche la pressione dell’aria cambia, così questa è un’altra variabile di interesse. Poi, naturalmente, l’aria ha una velocità, così che dovremo descrivere la velocità delle particelle dell’aria. Le particelle dell’aria hanno anche accelerazioni – ma nell’elencare queste molte variabili ci rendiamo conto subito che la velocità e l’accelerazione sarebbero note se sapessimo come varia nel tempo lo spostamento dell’aria. Come abbiamo detto, considereremo l’onda in una sola dimensione. Possiamo far questo se siamo sufficientemente lontani dalla sorgente, così che ciò che chiamiamo fronti d’onda siano quasi esattamente dei piani. Così rendiamo più semplice il nostro argomento prendendo l’esempio meno complicato. Potremmo allora dire che lo spostamento, , dipende soltanto da x e t, e non da y e z. Pertanto la descrizione dell’aria è data da (x, t). È completa questa descrizione? Sembrerebbe lontana dall’essere completa perché non conosciamo alcun dettaglio su come si muovano le molecole d’aria. Esse si muovono in tutte le direzioni e questo stato di cose non è certamente descritto per mezzo della funzione (x, t). Dal punto di vista della teoria cinetica, se in un luogo abbiamo una densità di molecole più elevata e una densità più bassa nella regione adiacente, le molecole si sposterebbero dalla regione di densità più elevata verso quella di densità più bassa, in modo da annullare questa differenza. Apparentemente non avremmo oscillazione e non vi sarebbe suono. Ciò che è necessario per ottenere l’onda sonora è la situazione seguente: quando le molecole si precipitano fuori dalla regione di densità e pressione più elevata esse comunicano quantità di moto alle molecole nella regione adiacente a più bassa densità. Affinché si generi il suono, le regioni sulle quali variano la

47.3 • L’equazione dell’onda

© 978-8808-22107-0

densità e la pressione debbono essere molto maggiori della distanza che le molecole percorrono prima di urtare contro altre molecole. Questa distanza è il cammino libero medio, e la distanza fra le creste e le gole di pressione deve essere molto maggiore di essa. Altrimenti le molecole si muoverebbero liberamente dalla cresta alla gola e immediatamente cancellerebbero l’onda. È chiaro che stiamo per descrivere il comportamento del gas su una scala più grande rispetto al cammino libero medio, e così le proprietà del gas non saranno descritte mediante le singole molecole. Lo spostamento, per esempio, sarà lo spostamento del centro di massa di un piccolo elemento del gas, e la pressione o la densità saranno la pressione o la densità in questa regione. Chiameremo P la pressione e ⇢ la densità, ed esse saranno funzioni di x e t. Dobbiamo tenere a mente che questa descrizione è un’approssimazione valida soltanto quando queste proprietà del gas non variano troppo rapidamente con la distanza.

47.3

L’equazione dell’onda

La fisica del fenomeno delle onde sonore comprende così tre caratteristiche: 1 Il gas si muove e varia la densità. 2 La variazione di densità corrisponde a una variazione di pressione. 3 Le disuguaglianze di pressione generano il moto del gas. Per primo consideriamo il punto 2. Per un gas, un liquido, o un solido, la pressione è una certa funzione della densità. Prima che arrivi l’onda sonora, abbiamo equilibrio, con una pressione P0 e una corrispondente densità ⇢0 . Una pressione P nel mezzo è legata alla densità da una qualche relazione caratteristica P = f (⇢) e, in particolare, la pressione di equilibrio P0 è data da P0 = = f (⇢0 ). Nel suono le variazioni di pressione dal valore di equilibrio sono estremamente piccole. Una conveniente unità per misurare la pressione è il bar, ove 1 bar = 105 N/m2 . La pressione di 1 atmosfera standard è con approssimazione molto buona 1 bar : 1 atm = 1,0133 bar. Per il suono usiamo una scala logaritmica di intensità poiché la sensibilità dell’orecchio è approssimativamente logaritmica. Questa scala è la scala in decibel, in cui il livello di pressione acustica per l’ampiezza di pressione P è definito come I(livello di pressione acustica) = 20 log10

P Prif

in dB

(47.1)

dove la pressione di riferimento Prif = 2 · 10 10 bar. Un’ampiezza di pressione di P = 103 Prif = = 2 · 10 7 bar(1) corrisponde a un suono moderatamente intenso di 60 dB. Vediamo che le variazioni di pressione nel suono sono estremamente piccole rispetto alla pressione di equilibrio, o media, di 1 atm. In corrispondenza, gli spostamenti e le variazioni di densità sono estremamente piccoli. Nelle esplosioni non abbiamo piccole variazioni del genere; le pressioni in eccesso prodotte possono essere maggiori di 1 atm. Queste grandi variazioni di pressione conducono a nuovi effetti che considereremo più avanti. Nel suono non consideriamo spesso livelli di intensità acustica superiori a 100 dB; 120 dB è un livello doloroso per l’orecchio. Quindi, per il suono, se scriviamo P = P0 + Pe (47.2) ⇢ = ⇢0 + ⇢e avremo sempre la variazione di pressione Pe molto piccola rispetto a P0 e la variazione di densità ⇢e molto piccola rispetto a ⇢0 . Quindi P0 + Pe = f (⇢0 + ⇢e ) = f (⇢0 ) + ⇢e f 0(⇢0 )

(47.3)

ove P0 = f (⇢0 ) e f 0(⇢0 ) sta per la derivata di f (⇢) valutata a ⇢ = ⇢0 . Possiamo arrestarci al secondo passo in questa uguaglianza soltanto perché ⇢e è molto piccolo. Troviamo in questo modo (1) Con questa scelta di P , il P non è la pressione di picco nell’onda sonora ma la «pressione quadratica media», che è ref p 1/ 2 volte la pressione di picco.

499

500

Capitolo 47 • Il suono e l’equazione dell’onda

© 978-8808-22107-0

che la pressione in eccesso Pe è proporzionale alla densità in eccesso ⇢e e possiamo chiamare  il fattore di proporzionalità: Pe =  ⇢e (2) (47.4) dove

dP  = f (⇢0 ) = d⇢ 0

!

0

La relazione di cui avevamo bisogno per la 2 è questa, molto semplice. Consideriamo ora il punto 1. Supponiamo che la posizione di una porzione di aria non disturbata dall’onda sonora sia x e che lo spostamento al tempo t dovuto al suono sia (x, t), così che la sua nuova posizione sia x + (x, t), come in FIGURA 47.3. Ora la posizione indisturbata di una porzione vicina di aria è x + x, e la sua nuova posizione è x + x + (x + x, t). Possiamo ora trovare le variazioni di densità nel modo seguente. Siccome ci limitiamo a onde piane, possiamo prendere un’area unitaria perpendicolare alla direzione x, che è la direzione di propagazione dell’onda sonora. La quantità di aria, per unità di area, in x è allora ⇢0 x, dove ⇢0 è la densità dell’aria indisturbata, o in equilibrio. Quest’aria, quando è spostata dall’onda sonora, ora giace fra x + (x, t) e x + x + (x + x, t), così che in questo intervallo abbiamo la stessa materia che si trovava in x quando era indisturbata. Se ⇢ è la nuova densità, allora ⇥ ⇤ ⇢0 x = ⇢ x + x + (x + x, t) x (x, t) (47.5) Poiché x è piccolo, possiamo scrivere

(x + x, t)

(x, t) =

@ @x

x

Questa derivata è una derivata parziale perché dipende tanto dal tempo quanto dalla x. La nostra equazione è allora ! @ ⇢0 x = ⇢ x+ x (47.6) @x ossia @ ⇢0 = (⇢0 + ⇢e ) + ⇢0 + ⇢e (47.7) @x Ora nelle onde sonore tutte le variazioni sono piccole, quindi ⇢e è piccola, è piccolo e anche @ /@ x è piccolo. Pertanto nella relazione che abbiamo appena trovato ⇢e =

FIGURA 47.3 Lo spostamento dell’aria a x è χ(x, t) e a x + �x è χ(x + �x, t). Il volume originario dell’aria per una unità di area dell’onda piana è �x; il nuovo volume è �x + χ(x + �x, t) χ(x, t).

47.4 La forza netta nella direzione x positiva prodotta dalla pressione agente sopra un’area unitaria perpendicolare a x è (@P /@x) �x.

⇢0

@ @x

⇢e

@ @x

(47.8)

possiamo trascurare ⇢e (@ /@ x) rispetto a ⇢0 (@ /@ x). Così otteniamo la relazione di cui avevamo bisogno per 1: @ ⇢e = ⇢0 (1) (47.9) @x Questa equazione è ciò che ci aspetteremmo fisicamente. Se gli spostamenti variano con x, allora ci saranno variazioni di densità. Anche il segno è giusto: se lo spostamento aumenta con x, così che l’aria viene stesa, la densità deve diminuire. Ora abbiamo bisogno della terza equazione, che è l’equazione del moto prodotto dalla pressione. Se conosciamo l’equazione fra la forza e la pressione possiamo allora ottenere l’equazione χ(x, t) Vecchio volume

FIGURA

x

x +∆ x

Nuovo volume x + χ(x, t ) χ(x +∆ x, t )

(x +∆ x ) + + χ(x +∆ x, t)

P (x, t)

P (x +∆ x, t ) x ∆x

47.4 • Soluzioni dell’equazione dell’onda

© 978-8808-22107-0

del moto. Se prendiamo una sottile fetta di aria di lunghezza x e di area unitaria perpendicolare a x, allora la massa di aria in questa fetta è ⇢0 x e possiede l’accelerazione @ 2 /@t 2 , così la massa per l’accelerazione per questa fetta di materia è ⇢0 x(@ 2 /@t 2 ). (Per piccoli x non fa differenza se l’accelerazione @ 2 /@t 2 è valutata a un estremo della fetta o in qualche posizione intermedia.) Se ora troviamo la forza su questa materia per un’area unitaria perpendicolare a x, essa sarà allora uguale a ⇢0 x(@ 2 /@t 2 ). A x abbiamo la forza, ammontante a P(x, t) per unità di area, nella direzione x positiva, e a x + x abbiamo la forza ammontante a P(x + x, t) per unità di area, nella direzione opposta (FIGURA 47.4): P(x, t)

P(x + x, t) =

@P @x

x=

@ Pe @x

x

(47.10)

dato che x è piccolo e dato che la sola parte di P che varia è la pressione in eccesso Pe . Abbiamo ora 3: @2 @ Pe ⇢0 2 = (3) (47.11) @x @t e così abbiamo abbastanza equazioni per connettere le cose e ridurci a una sola variabile, diciamo a . Possiamo eliminare Pe da 3 usando 2, così che otteniamo ⇢0

@2 @ ⇢e =  @x @t 2

(47.12)

e allora possiamo usare 1 per eliminare ⇢e . In questo modo troviamo che ⇢0 si semplifica e restiamo con @2 @2 = (47.13) 2 @t @ x2 Ponendo cs2 = , possiamo scrivere @2 1 @2 = 2 2 @x cs @t 2

(47.14)

Questa è l’equazione dell’onda che descrive il comportamento del suono nella materia.

47.4

Soluzioni dell’equazione dell’onda

Possiamo ora vedere se questa equazione descrive in realtà le proprietà essenziali delle onde sonore nella materia. Vogliamo dedurre che un impulso sonoro, o perturbazione, si muoverà con velocità costante. Vogliamo verificare che due impulsi differenti possano muoversi l’uno attraverso l’altro – il principio di sovrapposizione. Vogliamo anche verificare che il suono può andare sia verso destra sia verso sinistra. Tutte queste proprietà dovrebbero essere contenute in quest’unica equazione. Abbiamo fatto notare che qualunque perturbazione di tipo onda piana che si muove con velocità costante v ha la forma f (x vt). Ora dobbiamo vedere se (x, t) = f (x

vt)

è soluzione dell’equazione dell’onda. Quando calcoliamo @ /@ x otteniamo la derivata della funzione: @ = f 0(x vt) @x Differenziando ancora una volta, troviamo @2 = f 00(x @ x2

vt)

(47.15)

501

502

Capitolo 47 • Il suono e l’equazione dell’onda

© 978-8808-22107-0

La differenziazione di questa stessa funzione rispetto a t dà v moltiplicato per la derivata della funzione, ossia @ = v f 0(x vt) @t e la derivata seconda rispetto al tempo è @2 = v 2 f 00(x @t 2

vt)

(47.16)

È evidente che f (x vt) soddisferà l’equazione dell’onda purché la velocità dell’onda sia uguale a cs . Dalle leggi della meccanica troviamo quindi che qualunque perturbazione sonora si propaga con la velocità cs e inoltre troviamo che s ! p @P cs =  = @⇢ 0 e così abbiamo collegato la velocità dell’onda a una proprietà del mezzo. Se consideriamo un’onda viaggiante nella direzione opposta, sicché (x, t) = g(x + vt) è facile vedere che anche una perturbazione del genere soddisfa l’equazione dell’onda. La sola differenza fra un’onda del genere e quella che viaggia da sinistra a destra è il segno di v, ma sia che abbiamo x + vt oppure x vt come variabile nella funzione, non si altera il segno di @ 2 /@t 2 , dato che quest’ultima implica soltanto v 2 . Segue che abbiamo un’equazione per onde che si propagano in entrambi i versi con velocità cs . Una questione estremamente interessante è quella della sovrapposizione. Supponiamo che sia stata trovata una soluzione dell’equazione dell’onda, diciamo 1 . Ciò significa che la derivata seconda di 1 rispetto a x è uguale a 1/cs2 moltiplicato per la derivata seconda di 1 rispetto a t. Qualsiasi altra soluzione 2 ha questa stessa proprietà. Se sovrapponiamo queste due soluzioni abbiamo (x, t) = 1 (x, t) + 2 (x, t) (47.17) e desideriamo verificare che anche (x, t) è un’onda, cioè che soddisfa l’equazione dell’onda. Possiamo facilmente dimostrare questo risultato dato che abbiamo

e inoltre

Segue che

@2 @2 1 @2 2 = + 2 @x @ x2 @ x2

(47.18)

@2 @2 1 @2 2 = + 2 @t @t 2 @t 2

(47.19)

@2 1 @2 = @ x2 cs2 @t 2

così che abbiamo verificato il principio di sovrapposizione. La dimostrazione del principio di sovrapposizione segue dal fatto che l’equazione dell’onda è lineare in . Ci possiamo ora aspettare che un’onda luminosa piana che si propaga nella direzione x, polarizzata in modo che il campo elettrico sia nella direzione y, soddisferà l’equazione d’onda @ 2 Ey 1 @ 2 Ey = @ x2 c2 @t 2

(47.20)

dove c è la velocità della luce. Questa equazione d’onda è una delle conseguenze delle equazioni di Maxwell. Le equazioni dell’elettrodinamica condurranno all’equazione dell’onda per la luce proprio come le equazioni della meccanica hanno condotto all’equazione dell’onda per il suono.

47.5 • La velocità del suono

© 978-8808-22107-0

47.5

La velocità del suono

La nostra deduzione dell’equazione dell’onda per il suono ci ha dato una formula che collega la velocità dell’onda con la rapidità di variazione della pressione al variare della densità alla pressione normale: ! dP cs2 = (47.21) d⇢ 0

Nel valutare questa rapidità di variazione è essenziale conoscere come varia la temperatura. In un’onda sonora, ci aspetteremmo che la temperatura si innalzasse nella regione di compressione e che si abbassasse nella regione di rarefazione. Newton fu il primo a calcolare la rapidità di variazione della pressione con la densità, e suppose che la temperatura restasse invariata. Egli argomentò che il trasporto di calore da una regione all’altra fosse così rapido che la temperatura non poteva aumentare o diminuire. Questo argomento dà la velocità isoterma del suono, ed è sbagliato. La deduzione corretta fu data successivamente da Laplace, che avanzò l’idea opposta – che in un’onda sonora la pressione e la temperatura variavano adiabaticamente. Il flusso di calore dalla regione compressa alla regione rarefatta è trascurabile finché la lunghezza d’onda è lunga rispetto al cammino libero medio. Sotto questa condizione il piccolo valore del flusso di calore in un’onda sonora non altera la velocità, sebbene dia un piccolo assorbimento dell’energia del suono. Possiamo aspettarci giustamente che questo assorbimento aumenti quando la lunghezza d’onda si avvicina al cammino libero medio, ma queste lunghezze d’onda sono più piccole di fattori pari circa a un milione delle lunghezze d’onda del suono udibile. L’effettiva variazione della pressione con la densità in un’onda sonora è quella che non permette flusso di calore. Questa corrisponde alla variazione adiabatica, che abbiamo trovato essere PV = cost., dove V era il volume. Siccome la densità ⇢ varia inversamente a V , il legame adiabatico fra P e ⇢ è P = (cost.) ⇢ (47.22) dalla quale otteniamo

dP = d⇢

P ⇢

Per la velocità del suono abbiamo allora la relazione cs2 = Possiamo anche scrivere

P ⇢

(47.23)

PV ⇢V

cs2 = e fare uso della relazione

PV = N kT Inoltre vediamo che ⇢V è la massa del gas, che si può anche esprimere come N m, o come µ per mole, dove m è la massa di una molecola e µ è il peso molecolare. In questo modo troviamo che cs2 =

kT = m

RT µ

(47.24)

da cui è evidente che la velocità del suono dipende soltanto dalla temperatura del gas e non dalla pressione o dalla densità. Abbiamo anche osservato che kT =

1 m hv 2 i 3

dove hv 2 i è la media dei quadrati delle velocità delle molecole. Segue che cs2 =

3

hv 2 i

(47.25)

503

504

Capitolo 47 • Il suono e l’equazione dell’onda

© 978-8808-22107-0

ossia cs =

r

3

vmedia

(47.26)

p Questa equazione stabilisce che la velocità del suono è un numero che è grossolanamente 1/ 3 moltiplicato per una certa velocità media, vmedia , delle molecole (la radice quadrata della media dei quadrati delle velocità). In altre parole la velocità del suono è dello stesso ordine di grandezza della velocità delle molecole, e in realtà è un po’ minore di questa velocità media. Naturalmente potremmo aspettarci un risultato del genere, perché una perturbazione come una variazione di pressione, dopo tutto, viene propagata dal moto delle molecole. Tuttavia un argomento del genere non ci dice la precisa velocità di propagazione; avrebbe potuto risultare che il suono era trasportato essenzialmente dalle molecole più veloci, oppure dalle molecole più lente. È ragionevole e soddisfacente che la velocità del suono sia approssimativamente 1/2 della velocità molecolare media vmedia .

Battimenti

48.1

Somma di due onde

Qualche tempo fa abbiamo discusso in considerevole dettaglio le proprietà delle onde luminose e la loro interferenza – cioè, gli effetti della sovrapposizione di due onde da sorgenti differenti. In tutte queste analisi abbiamo assunto che le frequenze delle sorgenti fossero le stesse. In questo capitolo discuteremo alcuni dei fenomeni che risultano dall’interferenza di due sorgenti che hanno frequenze differenti. È facile prevedere che cosa accadrà. Procedendo nello stesso modo seguito precedentemente, supponiamo di avere due sorgenti oscillanti uguali della stessa frequenza le cui fasi sono aggiustate in modo che, diciamo, i segnali arrivino in fase allo stesso punto P. In questo punto, se si tratta di luce, la luce è molto forte; se è suono, è molto rumoroso; o se sono elettroni, ne arrivano molti. D’altra parte, se i segnali in arrivo fossero sfasati di 180° in P non avremmo alcun segnale perché allora l’ampiezza netta lì è un minimo. Supponiamo ora che qualcuno giri la «manopola della fase» di una delle due sorgenti e cambi la fase in P avanti e indietro, diciamo, prima rendendola 0° e poi 180°, e così via. Naturalmente troveremmo delle variazioni nell’intensità netta del segnale. Ora vediamo anche che se la fase di una sorgente viene lentamente variata relativamente a quella dell’altra in modo graduale, uniforme, iniziando da zero, salendo fino a dieci, venti, trenta, quaranta gradi, e così via, allora ciò che misureremmo in P sarebbe una serie di «pulsazioni» forti e deboli, perché quando gli sfasamenti attraversano 360° l’ampiezza ritorna al massimo. Naturalmente, dire che una sorgente sposta la sua fase relativamente a un’altra con rapidità uniforme è la stessa cosa che dire che il numero di oscillazioni per secondo è lievemente diverso per le due. Così conosciamo la risposta: se abbiamo due sorgenti a frequenze lievemente diverse dovremmo trovare, come risultato netto, un’oscillazione con un’intensità pulsante lentamente. Questo è tutto ciò che in realtà si trova nell’argomento! È molto facile formulare anche matematicamente questo risultato. Supponiamo, per esempio, di avere due onde, e di non preoccuparci per il momento di tutte le relazioni spaziali, ma di analizzare semplicemente ciò che giunge in P. Da una sorgente, diciamo, avremmo cos(!1 t), e dall’altra sorgente, cos(!2 t), dove le due ! non sono esattamente uguali. Naturalmente anche le ampiezze possono non essere uguali, ma possiamo risolvere il problema generale più tardi; prendiamo prima il caso in cui le ampiezze sono uguali. Allora l’ampiezza totale in P è la somma di questi due coseni. Se riportiamo le ampiezze delle onde in funzione del tempo, come nella FIGURA 48.1, vediamo che dove le creste coincidono otteniamo un’onda grande, e dove coincidono una cresta e una gola otteniamo praticamente zero, e poi dove le creste coincidono di nuovo otteniamo di nuovo un’onda grande. Matematicamente dobbiamo soltanto sommare due coseni e risistemare in qualche modo il risultato. Esiste un gran numero di utili relazioni fra i coseni che non sono difficili da ricavare. Naturalmente sappiamo che ei(a+b) = eia eib (48.1) e che eia ha una parte reale, cos a, e una parte immaginaria, sen a. Se prendiamo la parte reale di

48

Capitolo 48 • Battimenti

506 FIGURA

© 978-8808-22107-0

48.1 cos(10 πt)

Sovrapposizione di due onde cosinusoidali con frequenze nel rapporto 8:10. La precisa ripetizione del disegno entro ogni «battimento» non è tipica del caso generale.

cos(8 πt)

ei(a+b) , otteniamo cos(a + b). Se moltiplichiamo eia per eib otteniamo: eia eib = (cos a + i sen a)(cos b + i sen b) = = cos a cos b sen a sen b + una parte immaginaria Ma ora abbiamo bisogno soltanto della parte reale, quindi abbiamo cos (a + b) = cos a cos b

sen a sen b

(48.2)

Se cambiamo il segno di b, siccome il coseno non cambia segno mentre cambia il seno, la stessa equazione, per b negativi, diventa cos (a

b) = cos a cos b + sen a sen b

(48.3)

Se sommiamo insieme queste due equazioni, perdiamo i seni e impariamo che il prodotto di due coseni è un mezzo del coseno della somma, più un mezzo del coseno della differenza: cos a cos b =

1 1 cos (a + b) + cos (a 2 2

b)

Possiamo anche rovesciare la formula e trovare una formula per cos ↵ + cos semplicemente ↵ = a + b e = a b. Ne segue che a=

↵+ 2

e

b=

(48.4) se poniamo

↵ 2

quindi risulta ↵+ ↵ cos 2 2 Possiamo ora analizzare il nostro problema. La somma di cos(!1 t) e cos(!2 t) è cos ↵ + cos

= 2 cos

cos(!1 t) + cos(!2 t) = 2 cos

(!1 + !2 ) t (!1 !2 ) t cos 2 2

(48.5)

(48.6)

Supponiamo ora che le due frequenze siano circa le stesse, così che (!1 + !2 )/2 è la frequenza media, ed è più o meno uguale a entrambe. Ma !1 !2 è molto minore di !1 o !2 perché, come supponiamo, !1 e !2 sono circa uguali. Questo significa che possiamo rappresentare la soluzione dicendo che c’è un’onda cosinusoidale di alta frequenza più o meno simile a quelle con le quali abbiamo iniziato, ma la sua «ampiezza» varia lentamente – la sua «ampiezza»

48.2 • Note di battimento e modulazione

© 978-8808-22107-0

pulsa con una frequenza che appare essere (!1 !2 )/2. Ma è questa la frequenza alla quale si odono i battimenti? Sebbene la (48.6) dica che l’ampiezza va come (!1 !2 )/2, ciò che ci dice realmente è che le oscillazioni di alta frequenza sono contenute fra due curve cosinusoidali opposte (mostrate tratteggiate in FIGURA 48.1). Su questa base si potrebbe dire che l’ampiezza varia alla frequenza (!1 !2 )/2, ma se parliamo dell’intensità dell’onda dobbiamo pensarla con una frequenza doppia di questa. Cioè la modulazione dell’ampiezza, nel senso della sua intensità, è alla frequenza !1 !2 , sebbene la formula ci dice che moltiplichiamo per un’onda cosinusoidale a frequenza metà. La base tecnica della differenza è che l’onda ad alta frequenza ha una relazione di fase un po’ diversa nel secondo mezzo ciclo. Ignorando questa piccola complicazione, possiamo concludere che se sommiamo due onde di frequenza !1 e !2 otterremo un’onda netta risultante di frequenza media (!1 + !2 )/2 che oscilla in intensità con una frequenza !1 !2 . Se le due ampiezze sono differenti, possiamo rifare tutto moltiplicando i coseni per le diverse ampiezze A1 e A2 e fare moltissima matematica, risistemando, e così via, usando equazioni come (48.2)-(48.5). Tuttavia esistono altri modi più semplici di fare la stessa analisi. Per esempio sappiamo che è molto più semplice lavorare con gli esponenziali che con i seni e i coseni e che possiamo rappresentare A1 cos(!1 t) come la parte reale di A1 ei!1 t . L’altra onda sarebbe similmente la parte reale di A2 ei!2 t . Se sommiamo le due frequenze, otteniamo A1 ei!1 t + A2 ei!2 t . Se poi mettiamo a fattore comune la frequenza media, abbiamo A1 ei!1 t + A2 ei!2 t =

f ei(!1 +!2 )t/2 A1 ei(!1

!2 )t/2

+ A2 e

i(!1 !2 )t/2

g

(48.7)

Di nuovo abbiamo l’onda ad alta frequenza con una modulazione alla frequenza più bassa.

48.2

Note di battimento e modulazione

Se ci si richiede ora l’intensità dell’onda dell’equazione (48.7), possiamo prendere il modulo quadrato del primo membro o del secondo membro. Prendiamo il primo membro. L’intensità allora è ⇥ ⇤ I = A21 + A22 + 2A1 A2 cos (!1 !2 ) t (48.8)

Vediamo che l’intensità cresce e diminuisce a una frequenza !1 !2 , variando fra i limiti (A1 + A2 )2 e (A1 A2 )2 . Se A1 , A2 , l’intensità minima non è zero. Un modo ulteriore di rappresentare quest’idea è per mezzo di un disegno, come la FIGURA 48.2. Disegniamo un vettore di lunghezza A1 rotante a una frequenza !1 , per rappresentare una delle onde nel piano complesso. Disegniamo un altro vettore di lunghezza A2 , rotante a una frequenza !2 , per rappresentare la seconda onda. Se le due frequenze sono esattamente uguali, il loro risultante ha una lunghezza fissata mentre continua a ruotare, e dai due otteniamo una definita intensità fissa. Ma se le frequenze sono lievemente diverse, i due vettori complessi ruotano a velocità differenti. La figura FIGURA 48.3 mostra come appare la situazione relativamente al vettore A1 ei!1 t . Vediamo che A2 ruota lentamente allontanandosi da A1 e così l’ampiezza che otteniamo sommando i due è dapprima grande e poi, aprendosi, quando esso giunge nella posizione relativa di 180°, il risultante diventa particolarmente piccolo, e così via. Man mano che i vettori girano, l’ampiezza del vettore somma aumenta e diminuisce, e così l’intensità pulsa. È un’idea relativamente semplice, e vi sono molti modi differenti di rappresentare la stessa cosa. L’effetto è molto facile da osservare sperimentalmente. Nel caso dell’acustica, possiamo sistemare due altoparlanti guidati da due oscillatori separati, uno per ciascun altoparlante, in modo che emettano una nota ciascuno. Riceviamo così una nota da una sorgente e una diversa nota dall’altra sorgente. Se rendiamo le frequenze esattamente uguali, l’effetto che risulta avrà un’intensità definita in una data posizione spaziale. Se poi li disaccordiamo un poco, udremo alcune variazioni nell’intensità. Più sono disaccordati, più rapide sono le variazioni di suono. L’orecchio ha una certa difficoltà a seguire variazioni più rapide di circa dieci al secondo.

507

508

Capitolo 48 • Battimenti

© 978-8808-22107-0

48.2 Risultante di due vettori complessi di uguale frequenza. FIGURA

48.3 Risultante di due vettori complessi di frequenza diversa, visto nel sistema di riferimento rotante di uno dei due vettori. Sono mostrate nove posizioni successive del vettore che ruota lentamente.

3 2

4 5

A

FIGURA

1

A1 ω1 = ω2 = ω 6

9

A2 7

8

Possiamo anche vedere l’effetto su un oscilloscopio che semplicemente mostra la somma delle correnti ai due altoparlanti. Se la frequenza di pulsazione è relativamente bassa, vediamo semplicemente un treno d’onda sinusoidale la cui ampiezza pulsa, ma quando rendiamo più rapide le pulsazioni vediamo il tipo d’onda mostrata nella FIGURA 48.1. Quando andiamo verso differenze di frequenza maggiori, le «protuberanze» si avvicinano. Inoltre se le ampiezze non sono uguali e rendiamo un segnale più forte dell’altro, allora otteniamo un’onda la cui ampiezza non diventa mai zero, proprio come ci aspettiamo. Ogni cosa funziona al modo in cui dovrebbe, sia acusticamente sia elettricamente. Si verifica anche il fenomeno opposto! Nella trasmissione radio che usa la cosiddetta modulazione di ampiezza (AM, amplitude modulation), il suono è trasmesso dalla stazione radio come segue: il trasmettitore radio ha un’oscillazione elettrica in corrente alternata che è a una frequenza molto elevata, per esempio 800 kc/s (kilocicli al secondo), nella banda di trasmissione. Se viene acceso questo segnale portante, la stazione radio emette un’onda di ampiezza uniforme a 800 000 oscillazioni al secondo. Il modo in cui è trasmessa «l’informazione», l’inutile tipo d’informazione su che tipo di automobile comprare, è che quando qualcuno parla in un microfono l’ampiezza del segnale portante viene cambiata al passo con le vibrazioni del suono che entra nel microfono. Se prendiamo come caso matematico più semplice la situazione in cui un soprano canta una nota perfetta, con perfette oscillazioni sinusoidali delle sue corde vocali, allora otteniamo un segnale la cui ampiezza è alternata come mostrato nella FIGURA 48.4. Il segnale alternato a frequenza audio si ritrova poi nel ricevitore; ci liberiamo del segnale portante e consideriamo soltanto l’inviluppo che rappresenta le oscillazioni delle corde vocali, o il suono della cantante. L’altoparlante produce poi vibrazioni corrispondenti alla stessa frequenza nell’aria e l’ascoltatore è allora essenzialmente incapace di distinguere la differenza, così dicono. A causa di un gran numero di distorsioni e di altri sottili effetti, è in realtà possibile dire se stiamo ascoltando una radio o un vero soprano; per il resto l’idea è come indicato sopra.

48.3

Bande laterali

Matematicamente l’onda modulata descritta in precedenza sarebbe espressa come ⇥ ⇤ S = 1 + b cos(!m t) cos(!c t)

(48.9)

dove !c rappresenta la frequenza del segnale portante (carrier signal) e !m è la frequenza della nota audio (modulating signal). Di nuovo usiamo tutti quei teoremi sui coseni, oppure possiamo usare ei✓ ; non fa nessuna differenza – è più facile con ei✓ , ma è la stessa cosa. Otteniamo allora S = cos(!c t) +

⇥ ⇤ b ⇥ b cos (!c + !m ) t + cos (!c 2 2

!m ) t



(48.10)

Così, da un altro punto di vista, possiamo dire che l’onda uscente dal sistema consiste in tre onde sovrapposte: prima un’onda regolare alla frequenza !c , cioè, alla frequenza portante, e poi due nuove onde a due nuove frequenze. Una è la frequenza portante più la frequenza di modulazione, e l’altra è la frequenza portante meno la frequenza di modulazione. Quindi se facciamo qualche tipo di diagramma dell’intensità prodotta dal generatore in funzione della frequenza, troveremmo

48.3 • Bande laterali

© 978-8808-22107-0

509

48.4 Onda portante modulata. In questo disegno schematico, ωc /ωm = 5. In un’onda radio reale ωc /ωm ⇠ 100. FIGURA

I

48.5 Spettro di frequenza di un’onda portante ωc modulata da un’unica onda cosinusoidale ωm . FIGURA

ωc – ωm

ωc

ωc + ωm

ω

una grande intensità alla frequenza del segnale portante, naturalmente, ma quando una cantante ha iniziato a cantare, troveremmo subito anche l’intensità proporzionale alla forza della cantante, b2 , alle frequenze !c + !m e !c !m , come mostrato in FIGURA 48.5. Queste sono dette bande laterali; quando c’è un segnale modulato dal trasmettitore, ci sono bande laterali. Se c’è più di una nota allo stesso tempo, diciamo !m e !m0 , vi sono due strumenti che suonano; o se c’è qualunque altra complicata onda cosinusoidale, allora, naturalmente, possiamo vedere dalla matematica che otteniamo alcune onde addizionali corrispondenti alle frequenze !c ± !m0 . Pertanto, quando c’è una modulazione complicata che può essere rappresentata come somma di molti coseni,(1) troviamo che il trasmettitore reale sta trasmettendo su un intervallo di frequenze, cioè la frequenza portante più o meno la massima frequenza che il segnale di modulazione contiene. Sebbene sulle prime potessimo ritenere che un trasmettitore radio trasmetta soltanto alla frequenza nominale del segnale portante, dato che vi sono dentro grossi, superstabili oscillatori a cristallo, e ogni cosa è aggiustata per essere precisamente a 800 kc/s (kilocicli al secondo), nel momento in cui qualcuno annuncia che si trovano a 800 kc/s, egli modula gli 800 kc/s, e così non si trovano più precisamente a 800 kc/s! Supponiamo che gli amplificatori siano costruiti in modo da poter trasmettere su un buon intervallo della sensibilità dell’orecchio (l’orecchio può udire fino a 20 000 c/s (cicli al secondo), ma di solito i trasmettitori radio e i ricevitori non lavorano oltre i 10 000 c/s, così non udiamo le parti più alte), allora, quando l’uomo parla la sua voce può contenere frequenze fino, diciamo, a 10 000 c/s, così il trasmettitore trasmette frequenze che possono andare da 790 kc/s a 810 kc/s. Ora se esistesse un’altra stazione a 795 kc/s ci sarebbe una gran confusione. Inoltre, se rendessimo il nostro ricevitore così sensibile da raccogliere soltanto gli 800 kc/s, e non raccogliesse i 10 kc/s da ambo i lati, non udiremmo ciò che diceva l’uomo, perché l’informazione sarebbe su queste altre frequenze! Quindi è assolutamente essenziale tenere le stazioni separate da una certa distanza, in modo che le loro bande laterali non si sovrappongano e, inoltre, il ricevitore non deve essere tanto selettivo da non permettere la ricezione delle bande laterali insieme alla frequenza nominale principale. Nel caso del suono questo problema non causa in realtà molto disturbo. Possiamo udire su un intervallo di ±20 kc/s e di solito nella banda di trasmissione abbiamo da 500 kc/s a 1500 kc/s, quindi c’è molto posto per una gran quantità di stazioni. Il problema della televisione è più difficile. Quando il fascio di elettroni attraversa lo schermo del tubo a raggi catodici, ci sono varie piccole macchie di luce e buio. Questo insieme di «luce» e «buio» è il segnale. Ora ordinariamente il fascio esplora su tutta l’immagine, 500 linee, approssimativamente, in un trentesimo di secondo. Consideriamo che la risoluzione dell’immagine verticalmente e orizzontalmente sia più o meno la medesima, così che vi sia lo stesso numero di macchie per pollice lungo una linea esplorata. Vogliamo essere in grado di distinguere buio da luce, buio da luce, buio da luce sopra, diciamo, 500 linee. Per essere in grado di far ciò con onde cosinusoidali, la più piccola lunghezza d’onda necessaria corrisponde così a una lunghezza (1) Una piccola osservazione marginale: in quali circostanze una curva può essere rappresentata come somma di un gran numero di coseni? Risposta: in tutte le circostanze ordinarie, a eccezione di alcuni casi che possono sognare i matematici. Naturalmente la curva deve avere soltanto un valore a un dato punto, e non deve essere una curva pazza che salta un numero infinito di volte in una distanza infinitesima, o qualche cosa del genere. Ma a parte restrizioni del genere, qualunque curva ragionevole (quella che una cantante è capace di produrre facendo vibrare le sue corde vocali) può essere sempre composta sommando insieme onde cosinusoidali.

510

Capitolo 48 • Battimenti

© 978-8808-22107-0

d’onda, da massimo a massimo, di un 250-esimo della dimensione dello schermo. Così abbiamo 250 ⇥ 500 ⇥ 30 informazioni per secondo. La frequenza più alta che trasporteremo, pertanto, è vicina a 4 Mc/s (megacicli al secondo). In realtà, per mantenere separate le stazioni televisive, dobbiamo usare un po’ più di questo valore, circa 6 Mc/s; parte di questo è usato per portare il segnale sonoro e altre informazioni. Così i canali televisivi sono larghi 6 Mc/s. Certamente non sarebbe possibile fare trasmissioni TV su un segnale portante di 800 kc/s, perché non possiamo modulare a una frequenza superiore a quella del segnale portante. A ogni modo, la banda televisiva inizia a 54 Mc/s. Il primo canale di trasmissione, che è il canale 2 (!), ha un intervallo di frequenza da 54 Mc/s a 60 Mc/s, che è largo 6 Mc/s. «Ma», si potrebbe dire, «abbiamo appena dimostrato che esistono bande laterali da ambo i lati, e pertanto dovrebbe essere largo il doppio». Risulta che gli ingegneri elettronici sono piuttosto abili. Se analizziamo il segnale di modulazione usando non soltanto termini coseno, ma termini coseno e seno, per tener conto delle differenze di fase, vediamo allora che esiste una relazione definita, invariante, fra la banda laterale dalla parte dell’alta frequenza e la banda laterale dalla parte della bassa frequenza. Ciò che intendiamo è che non esiste alcuna nuova informazione su quell’altra banda laterale. Così ciò che si fa è sopprimere una banda laterale, e il ricevitore è costruito in modo che l’informazione mancante è ricostruita considerando l’unica banda laterale e il segnale portante. La trasmissione a banda laterale unica è uno schema ingegnoso per diminuire le larghezze di banda necessarie per trasmettere le informazioni.

48.4

Treni d’onde localizzati

Il prossimo argomento che discuteremo è l’interferenza delle onde sia nello spazio sia nel tempo. Supponiamo di avere due onde che viaggiano nello spazio. Sappiamo, naturalmente, che possiamo rappresentare un’onda che viaggia nello spazio con ei(!t k x) . Questo potrebbe essere, per esempio, lo spostamento in un’onda sonora. Questa è una soluzione dell’equazione dell’onda a patto che !2 = k 2 c2 , ove c è la velocità di propagazione dell’onda. In questo caso possiamo scriverla come e ik(x ct) , che è della forma generale f (x ct). Quindi questa deve essere un’onda che viaggia a questa velocità, !/k, e quella è c e tutto va bene. Ora vogliamo sommare insieme due onde del genere. Supponiamo di avere un’onda che si propaga con una frequenza, e un’altra onda che si propaga con un’altra frequenza. Lasciamo al lettore la considerazione del caso in cui le ampiezze siano differenti; non comporta alcuna sostanziale differenza. Così vogliamo sommare ei(!1 t k1 x) + ei(!2 t k2 x) . Possiamo sommare queste con lo stesso tipo di matematica che abbiamo usato quando abbiamo sommato onde di segnale. Naturalmente, se c è lo stesso per entrambe, questo è facile, dato che è la stessa cosa che abbiamo fatto in precedenza: ei!1 (t

x/c)

+ ei!2 (t

x/c)

0

= ei!1 t + ei!2 t

0

(48.11)

eccetto che t 0 = t x/c è la variabile invece di t. Così otteniamo lo stesso tipo di modulazioni, naturalmente, ma vediamo, beninteso, che queste modulazioni si muovono con l’onda. In altre parole, se sommassimo due onde, ma queste onde non fossero soltanto oscillanti, ma anche in moto nello spazio, allora l’onda risultante si muoverebbe anch’essa, alla stessa velocità. Ora ci piacerebbe generalizzare questo al caso delle onde in cui la relazione fra la frequenza e il numero d’onde k non è così semplice. Esempio: materiale avente un indice di rifrazione. Abbiamo già studiato la teoria dell’indice di rifrazione nel capitolo 31, dove abbiamo trovato che potevamo scrivere k = n!/c, ove n è l’indice di rifrazione. Come esempio interessante, per i raggi X abbiamo trovato che l’indice n è n=1

N qe2 2✏ 0 m!2

(48.12)

In realtà nel capitolo 31 abbiamo ricavato una formula più complessa, ma questa è buona come qualsiasi altra, come esempio.

48.4 • Treni d’onde localizzati

© 978-8808-22107-0

Incidentalmente, sappiamo che anche quando ! e k non sono linearmente proporzionali, il rapporto !/k è certamente la velocità di propagazione per quella particolare frequenza e numero d’onde. Chiamiamo velocità di fase (phase velocity) questo rapporto: è la velocità alla quale si muoverebbe la fase, o i nodi, di una singola onda: ! k

vp =

(48.13)

Questa velocità di fase, nel caso dei raggi X nel vetro, è maggiore della velocità della luce nel vuoto (dato che n nella (48.12) è inferiore a 1) e ciò è un po’ seccante, perché non pensiamo di poter mandare segnali più veloci della velocità della luce! Ciò che discuteremo ora è l’interferenza di due onde in cui ! e k hanno una formula definita che li lega. La formula precedente per n dice che k è dato come determinata funzione di !. Per essere precisi, in questo particolare problema, la formula per k in termini di ! è k=

! c

dove a=

a !c

(48.14)

N qe2 2✏ 0 m

è una costante. A ogni modo, per ogni frequenza c’è un determinato numero d’onde, e vogliamo sommare insieme due onde del genere. Facciamolo proprio come abbiamo fatto nell’equazione (48.7):

= ei[(!1 +!2 )t

ei(!1 t k1 x) + ei(!2 t k2 x) = ( (k1 +k2 )x]/2 ei[(!1 !2 )t (k1 k2 )x]/2 + e

i[(!1 !2 )t (k1 k2 )x]/2

)

(48.15)

Così abbiamo di nuovo un’onda modulata, un’onda che viaggia con la frequenza media e il numero d’onde medio, ma la cui intensità varia con una forma dipendente dalla differenza delle frequenze e dalla differenza dei numeri d’onde. Prendiamo ora il caso in cui la differenza fra le due onde sia relativamente piccola. Supponiamo di sommare due onde le cui frequenze siano quasi uguali; allora (!1 + !2 )/2 è praticamente uguale a entrambi gli !, e similmente per (k1 + k2 )/2. Così la velocità dell’onda, la rapidità di oscillazione, dei nodi è ancora essenzialmente !/k. Ma attenzione, la velocità di propagazione della modulazione non è la stessa! Di quanto dobbiamo variare x per render conto di un certo ammontare di t? La velocità di questa modulazione d’onde è il rapporto vM =

!1 k1

!2 k2

(48.16)

La velocità di modulazione è chiamata qualche volta velocità di gruppo. Se prendiamo il caso in cui la differenza di frequenza è relativamente piccola, e anche la differenza dei numeri d’onde è relativamente piccola, allora questa espressione si avvicina, al limite, a vg =

d! dk

(48.17)

In altre parole, per le modulazioni più lente, i battimenti più lenti, c’è una velocità definita alla quale esse viaggiano, che non è uguale alla velocità di fase delle onde – che cosa misteriosa! La velocità di gruppo è la derivata di ! rispetto a k, e la velocità di fase è !/k. Vediamo se possiamo capire perché. Consideriamo due onde, di nuovo con lunghezze d’onda lievemente diverse, come nella FIGURA 48.1. Esse sono sfasate, in fase, sfasate e così via. Ora queste onde rappresentano, in realtà, le onde dello spazio che si propagano, anch’esse, con frequenze lievemente diverse. Poiché la velocità di fase, la velocità dei nodi di queste due onde, non è precisamente uguale, accade qualche cosa di nuovo.

511

512

Capitolo 48 • Battimenti

© 978-8808-22107-0

Supponiamo di procedere con una delle onde e di guardare l’altra; se entrambe andassero alla stessa velocità allora l’altra onda rimarrebbe esattamente dove si trovava relativamente a noi, mentre avanziamo su questa cresta. Avanziamo su questa cresta e proprio di fronte a noi vediamo una cresta; se le due velocità sono uguali, le creste stanno l’una sopra all’altra. Ma non è così: le due velocità in realtà non sono uguali. C’è soltanto una piccola differenza di frequenza e quindi soltanto una piccola differenza di velocità, ma a causa di questa differenza di velocità, mentre procediamo l’altra onda si sposta lentamente in avanti, diciamo, o indietro, rispetto alla nostra onda. Così al procedere del tempo che accade al nodo? Se spostiamo un treno d’onde appena un poco avanti, il nodo si sposta avanti (o indietro) di una distanza considerevole. Cioè, la somma di queste due onde ha un inviluppo, e al procedere delle onde, l’inviluppo avanza su di esse a diversa velocità. La velocità di gruppo è la velocità alla quale sarebbero trasmessi i segnali modulati. Se facessimo un segnale, cioè un certo tipo di variazione dell’onda che si potesse riconoscere all’ascoltarlo, un tipo di modulazione, allora quella modulazione viaggerebbe alla velocità di gruppo, a patto che le modulazioni fossero relativamente lente. (Quando sono veloci, è molto più difficile analizzarle.) Ora possiamo mostrare (finalmente) che la velocità di propagazione dei raggi X in un blocco di carbone non è maggiore della velocità della luce, sebbene la velocità di fase sia maggiore della velocità della luce. Per fare ciò, dobbiamo trovare d!/ dk, che otteniamo differenziando (48.14): dk 1 a = + 2 d! c ! c La velocità di gruppo, quindi, è il reciproco di questo, cioè, vg =

c 1+

a !2

(48.18)

che è inferiore a c! Così, sebbene le fasi possano viaggiare più rapidamente della velocità della luce, i segnali di modulazione viaggiano più lentamente, e questa è la soluzione dell’apparente paradosso! Naturalmente, se abbiamo il caso semplice in cui ! = kc, allora anche d!/ dk = c. Così quando tutte le fasi hanno la stessa velocità, naturalmente il gruppo ha la stessa velocità.

48.5

Ampiezze di probabilità per le particelle

Consideriamo ora un altro esempio relativo alla velocità di fase che è estremamente interessante. Ha a che fare con la meccanica quantistica. Sappiamo che l’ampiezza per trovare una particella in un punto può, in alcune circostanze, variare nello spazio e nel tempo, diciamo in una dimensione, in questo modo: = Aei(!t k x) (48.19) ove ! è la frequenza, che è collegata all’idea classica di energia mediante E = ~!, e k è il numero d’onde, che è collegato alla quantità di moto mediante p = ~k. Diremmo che la particella aveva una quantità di moto definita p se il numero d’onde fosse esattamente k, cioè un’onda perfetta che avanza con la medesima ampiezza dappertutto. L’equazione (48.19) dà l’ampiezza e, se ne prendiamo il modulo quadrato, otteniamo ψ(x ) la probabilità relativa di trovare la particella in funzione della posizione e del tempo. Questa è costante, il che significa che la probabilità di trovare la particella da qualsiasi parte è la stessa. Ora supponiamo, invece, di avere una situazione in cui sappiamo che è più probabile che la particella si trovi in x una posizione piuttosto che in un’altra. Rappresenteremmo una situazione del genere con un’onda che ha un massimo e muore da entrambe le parti (FIGURA 48.6). (Non è completamente uguale a un’onda come la (48.1) che ha una serie di massimi, ma è possibile, sommando insieme parecchie onde con circa gli stessi ! e k, liberarci di tutti i massimi tranne uno.) FIGURA 48.6 Treno d’onde localizzato.

48.5 • Ampiezze di probabilità per le particelle

© 978-8808-22107-0

In queste circostanze, siccome il quadrato della (48.19) rappresenta la probabilità di trovare una particella da qualche parte, sappiamo che a un dato istante è più probabile che la particella si trovi vicino al centro del «rialzo», dove è massima l’ampiezza dell’onda. Se ora aspettiamo alcuni momenti, le onde si muoveranno, e dopo un po’ di tempo il «rialzo» sarà da qualche altra parte. Se sapevamo che la particella originariamente era situata in una qualche posizione, classicamente, ci aspetteremmo che più tardi si trovasse da qualche altra parte, a dire il vero, perché essa, dopo tutto, ha una velocità e una quantità di moto. La teoria quantistica, allora, si trasformerà nella corretta teoria classica della relazione della quantità di moto, energia e velocità soltanto se la velocità di gruppo, la velocità della modulazione, è uguale alla velocità che otterremmo classicamente per una particella avente la stessa quantità di moto. È ora necessario dimostrare che questo è il nostro caso, oppure che non lo è. Secondo la teoria classica, l’energia è legata alla velocità mediante un’equazione come E=r Similmente, la quantità di moto è

mc2 v2 c2

1

(48.20)

mv

(48.21) v2 1 c2 Questa è la teoria classica, e come conseguenza della teoria classica, eliminando, possiamo mostrare che E 2 p2 c2 = m2 c4 p= r

Questo è il grande risultato quadridimensionale, del quale abbiamo parlato e riparlato, che pµ pµ = m2 ; questa è la relazione fra energia è quantità di moto nella teoria classica. Ora, dato che questi E e p diventeranno ! e k, tramite la sostituzione di E = ~! e p = ~k, ciò significa che per la meccanica quantistica è necessario che ~2 !2 c2

~2 k 2 = m 2 c 2

(48.22)

Questa, allora, è la relazione fra la frequenza e il numero d’onde di un’onda di ampiezza della meccanica quantistica che rappresenta una particella di massa m. Da questa equazione possiamo dedurre che ! è r m2 c2 ! = c k2 + 2 ~ Anche qui la velocità di fase !/k è maggiore della velocità della luce! Consideriamo ora la velocità di gruppo. La velocità di gruppo dovrebbe essere d!/ dk, la velocità alla quale si muovono le modulazioni. Dobbiamo differenziare una radice quadrata, il che non è molto difficile. La derivata è d! =r dk

kc k2 +

m2 c2 ~2

dove la radice quadrata, dopo tutto, è !, così potremmo scrivere questo come d! c2 k = dk ! Inoltre, k/! è p/E, quindi vg = Ma da (48.20) e (48.21) otteniamo

c2 p E

c2 p =v E

513

514

Capitolo 48 • Battimenti

© 978-8808-22107-0

cioè la velocità della particella secondo la meccanica classica. Così vediamo che, mentre le relazioni fondamentali della meccanica quantistica E = ~ e p = ~k, per l’identificazione di ! e k con E e p classici, producono soltanto l’equazione !2

k 2 c2 =

m2 c4 ~2

ora comprendiamo anche le relazioni (48.20) e (48.21) che legano E e p alla velocità. Naturalmente la velocità di gruppo deve essere la velocità della particella se l’interpretazione deve avere un senso. Se pensiamo che la particella sia qui a un istante e poi la pensiamo là dieci minuti più tardi, come la meccanica quantistica ha detto, la distanza attraversata dal «rialzo» divisa per l’intervallo di tempo deve essere, classicamente, la velocità della particella.

48.6

Onde in tre dimensioni

Porteremo ora a conclusione la discussione delle onde con alcune osservazioni generali sull’equazione dell’onda. Queste osservazioni sono intese a dare qualche prospettiva del futuro – non che si possa capire tutto esattamente proprio ora, ma piuttosto vedere come si presenteranno le cose quando studieremo un po’ meglio le onde. Prima di tutto, l’equazione dell’onda per il suono in una dimensione era @2 1 @2 = @ x2 c2 @t 2 ove c è la velocità di qualsiasi cosa l’onda rappresenti – nel caso del suono, è la velocità del suono; nel caso della luce, è la velocità della luce. Abbiamo mostrato che per un’onda sonora gli spostamenti si propagano a una certa velocità. Ma anche la pressione in eccesso si propaga a una certa velocità, e così fa la densità in eccesso. Quindi ci aspetteremmo che la pressione soddisfi la stessa equazione, come infatti fa. Lasceremo la dimostrazione di questo al lettore. Suggerimento: ⇢e è proporzionale alla rapidità di variazione di rispetto a x. Quindi se differenziamo l’equazione dell’onda rispetto a x, scopriremo immediatamente che @ /@ x soddisfa la stessa equazione. Cioè ⇢e soddisfa la stessa equazione. Ma Pe è proporzionale a ⇢e , e pertanto anche Pe la soddisfa. Così la pressione, gli spostamenti, ogni cosa, soddisfano la stessa equazione dell’onda. Di solito si vede l’equazione dell’onda per il suono scritta in termini di pressione invece che di spostamento, perché la pressione è scalare e non ha direzione. Ma lo spostamento è un vettore e ha direzione, e così risulta più facile analizzare la pressione. Il prossimo argomento che trattiamo ha a che fare con l’equazione d’onda in tre dimensioni. Sappiamo che la soluzione dell’onda sonora in una dimensione è ei(!t k x) , con ! = kcs , ma sappiamo anche che in tre dimensioni un’onda sarebbe rappresentata da ei(!t k x x ky y kz z) , dove, in questo caso, !2 = k 2 cs2 , che è, naturalmente, (k x2 + k y2 + k z2 ) cs2 . Ora ciò che desideriamo è fare una congettura su quale sia la corretta equazione dell’onda in tre dimensioni. Naturalmente, nel caso del suono questa può dedursi ripetendo in tre dimensioni lo stesso argomento dinamico che abbiamo sviluppato in una dimensione. Ma non faremo questo; scriveremo invece soltanto il risultato: l’equazione per la pressione (o lo spostamento, o qualsiasi cosa) è @ 2 Pe @ 2 Pe @ 2 Pe 1 @ 2 Pe + + = 2 2 2 2 @x @y @z cs @t 2

(48.23)

Che ciò sia vero si può verificare sostituendovi ei(!t k · r ) . Chiaramente, ogni volta che differenziamo rispetto a x, moltiplichiamo per ik x . Se differenziamo due volte, ciò è equivalente a moltiplicare per k x2 , così il primo termine diventerebbe k x2 Pe , per quell’onda. Similmente, il secondo termine diventa k y2 Pe , e il terzo termine diventa k z2 Pe . Al secondo membro otteniamo (!2 /cs2 )Pe . Quindi, se togliamo i Pe e cambiamo segno, vediamo che la relazione fra k e ! è quella che desideriamo.

48.7 • Modi di vibrazione normali

© 978-8808-22107-0

Procedendo di nuovo a rovescio, non possiamo fare a meno di scrivere la grande equazione che corrisponde all’equazione della dispersione (48.22) per le onde della meccanica quantistica. Se rappresenta l’ampiezza per trovare una particella nella posizione x, y, z al tempo t, allora la grande equazione della meccanica quantistica per particelle libere è questa: @2 @2 @2 + + @ x 2 @ y 2 @z 2

1 @2 m2 c2 = c2 @t 2 ~2

(48.24)

Prima di tutto il carattere relativistico di questa espressione è suggerito dalla presenza di x, y, z e t nella bella combinazione che al solito implica la relatività. Secondo, è un’equazione d’onda che, se proviamo con un’onda piana, produrrebbe come conseguenza k2 +

! 2 m2 c2 = 2 c2 ~

che è la giusta relazione per la meccanica quantistica. C’è ancora un’altra grande cosa contenuta nell’equazione d’onda: il fatto che qualsiasi sovrapposizione di onde è ancora una soluzione. Così questa equazione contiene tutta la meccanica quantistica e la relatività che abbiamo discusso finora, almeno finché tratta di una particella singola nello spazio vuoto senza potenziali esterni o forze!

48.7

Modi di vibrazione normali

Volgiamoci ora a un altro esempio sul fenomeno dei battimenti che è piuttosto curioso e un po’ diverso. Immaginiamo due pendoli uguali che abbiano una molla piuttosto debole che li collega fra loro. Le loro lunghezze sono rese uguali quanto più possibile. Se ne tiriamo uno e lo lasciamo andare, esso si muove avanti e indietro, e nel muoversi avanti e indietro tira la molla di collegamento, quindi è in realtà una macchina per generare una forza che ha la frequenza naturale dell’altro pendolo. Pertanto, in conseguenza della teoria della risonanza, che abbiamo studiato prima, quando esercitiamo una forza su qualche cosa esattamente alla giusta frequenza, essa la farà muovere. Così certamente un pendolo che si muova avanti e indietro fa muovere l’altro. Tuttavia in questa circostanza appare una cosa nuova, perché l’energia totale del sistema è finita, così quando un pendolo versa la sua energia nell’altro per farlo muovere, si trova gradualmente a perdere energia, finché, se il ritmo è proprio quello giusto in rapporto alla velocità, perde tutta la sua energia e si riduce a una condizione stazionaria! Allora, naturalmente, è la palla dell’altro pendolo che possiede tutta l’energia e il primo che non ne ha alcuna, e col passare del tempo vediamo che la cosa funziona anche nella direzione opposta, nel senso che l’energia ripassa alla prima palla; questo è un fenomeno molto interessante e divertente. Abbiamo detto, tuttavia, che è legato alla teoria dei battimenti, e dobbiamo ora spiegare come possiamo analizzare questo moto dal punto di vista della teoria dei battimenti. Notiamo che il moto di entrambe le palle è un’oscillazione la cui ampiezza cambia ciclicamente. Pertanto il moto di una delle palle è presumibilmente analizzabile in un modo diverso, in quanto è la somma di due oscillazioni, presenti allo stesso tempo ma con due frequenze leggermente differenti. Quindi dovrebbe essere possibile trovare altri due moti nel sistema, e affermare che ciò che abbiamo visto era una sovrapposizione delle due soluzioni, perché questo naturalmente è un sistema lineare. In realtà è facile trovare due modi in cui potremmo far iniziare il moto, ciascuno dei quali è un moto perfetto, a una singola frequenza – assolutamente periodico. Il moto col quale abbiamo iniziato prima non era strettamente periodico, dato che non è durato; in breve una palla passava energia all’altra e così cambiava la sua ampiezza; ma vi sono modi di iniziare il moto in modo che non cambi nulla e, naturalmente, appena lo vedremo ne comprenderemo il perché. Per esempio, se facessimo andare i due pendoli insieme, allora, dato che essi hanno la medesima lunghezza e la molla quindi non fa niente, essi continueranno naturalmente a oscillare nello stesso modo per sempre, assumendo che non vi sia attrito e che ogni cosa sia perfetta. D’altra parte, esiste un altro possibile moto che ha, esso pure, una frequenza definita: cioè, se muoviamo

515

516

Capitolo 48 • Battimenti

© 978-8808-22107-0

i pendoli in verso opposto, spostandoli esattamente di distanze uguali, allora si troverebbero di nuovo in moto assolutamente periodico. Possiamo renderci conto che la molla aggiunge soltanto un poco alla forza di richiamo che fornisce la gravità, questo è tutto, e il sistema continua proprio a oscillare a una frequenza lievemente più alta del primo caso. Perché più alta? Perché la molla tira, in aggiunta alla gravitazione, e rende il sistema un po’ «più rigido» così che la frequenza di questo moto è appena un po’ più alta di quella dell’altro. Così il sistema ha due modi in cui può oscillare mantenendo invariata l’ampiezza: può oscillare in modo che entrambi i pendoli vadano nello stesso verso e oscillino per tutto il tempo a una sola frequenza, oppure potrebbero andare in versi opposti a una frequenza lievemente più elevata. Ora il moto reale dell’oggetto, dato che il sistema è lineare, può essere rappresentato come sovrapposizione dei due. (L’argomento di questo capitolo, ricordate, è l’effetto della somma di due moti con frequenze differenti.) Così pensate che cosa accadrebbe se combinassimo queste due soluzioni. Se a t = 0 i due moti sono iniziati con uguale ampiezza e nella stessa fase, la somma dei due moti significa che una palla, essendo stata sollecitata in un senso dal primo moto e nell’altro senso dal secondo moto, resta a zero, mentre l’altra palla, essendo stata spostata nello stesso senso in entrambi i moti, ha una grande ampiezza. Con l’andare del tempo, tuttavia, i due moti fondamentali procedono indipendentemente, così la fase dell’uno rispetto all’altro varia lentamente. Ciò significa, allora, che dopo un tempo sufficientemente lungo, quando è trascorso abbastanza tempo perché un moto abbia fatto «900 e 1/2» oscillazioni, mentre l’altro soltanto «900», la fase relativa sarebbe giusto invertita rispetto a quella che era prima. Cioè il moto di grande ampiezza sarà caduto a zero, e nel frattempo, naturalmente, la palla inizialmente ferma avrà raggiunto l’ampiezza piena! Così vediamo che potremmo analizzare questo complicato moto o con l’idea che c’è una risonanza e che uno passa energia all’altro, oppure con la sovrapposizione di due moti di ampiezza costante a due diverse frequenze.

49

Modi di vibrazione

49.1

La riflessione delle onde

Questo capitolo considererà alcuni dei rimarchevoli fenomeni che risultano dal confinamento di onde in una regione finita. Saremo condotti prima a scoprire alcuni fatti particolari relativi alle corde vibranti, per esempio, e poi la generalizzazione di questi fatti ci darà un principio che è probabilmente il principio di più grande portata della fisica matematica. Il nostro primo esempio sul confinamento delle onde sarà il confinare un’onda con un solo limite. Prendiamo l’esempio semplice di un’onda unidimensionale su una corda. Si potrebbe considerare, ugualmente bene, il suono in una dimensione contro una parete, o altre situazioni di natura simile, ma l’esempio di una corda sarà sufficiente per i nostri scopi attuali. Supponiamo che la corda sia tenuta a un estremo, per esempio legandola a una parete «infinitamente solida». Ciò si può esprimere matematicamente dicendo che lo spostamento y della corda nella posizione x = 0 deve essere zero, perché l’estremo non si muove. Ora, se non fosse per la parete, sappiamo che la soluzione generale del moto è la somma di due funzioni, F(x ct) e G(x + ct), la prima rappresentante un’onda che viaggia in un senso nella corda, e la seconda un’onda che viaggia nell’altro senso nella corda: y = F(x

ct) + G(x + ct)

(49.1)

F(x + ct) Estremo fisso

è la soluzione generale per qualsiasi corda. Ma dobbiamo poi soddisfare la condizione che la corda non si muova a un estremo. Se poniamo x = 0 nell’equazione (49.1) ed esaminiamo y per ogni valore di t, otteniamo

–F(–x + ct)

y = F( ct) + G(+ct) Ora, se questo deve essere zero a ogni istante, significa che la funzione G(ct) deve essere F( ct). In altre parole, G di qualsivoglia argomento deve essere F dello stesso argomento con il segno cambiato. Se questo risultato viene inserito di nuovo nell’equazione (49.1) troviamo che la soluzione del problema è y = F(x

ct)

F( x

ct)

(49.2)

È facile vedere che otteniamo y = 0 se poniamo x = 0. La FIGURA 49.1 mostra un’onda che si propaga nel verso negativo della direzione x vicino a x = 0, e un’onda ipotetica che si propaga nell’altro verso col segno opposto e dall’altra parte dell’origine. Diciamo ipotetica perché, naturalmente, dall’altra parte dell’origine non c’è una corda che vibri. Il moto totale della corda deve essere considerato come la somma di queste due onde nella regione delle x positive. Quando

49.1 Riflessione di un’onda come sovrapposizione di due onde viaggianti. FIGURA

518

Capitolo 49 • Modi di vibrazione

© 978-8808-22107-0

esse raggiungono l’origine si elimineranno sempre in x = 0, e finalmente la seconda onda (riflessa) sarà la sola a esistere per x positivi e naturalmente si propagherà nella direzione opposta. Questi risultati sono equivalenti alla seguente affermazione: se un’onda raggiunge l’estremo fisso di una corda, sarà riflessa con un cambiamento di segno. Una riflessione del genere si può sempre comprendere immaginando che ciò che si avvicina all’estremo della corda viene fuori rovesciato da dietro la parete. In breve, se assumiamo che la corda sia infinita e che tutte le volte che abbiamo un’onda che va in un verso, ne abbiamo un’altra che va in verso opposto con la simmetria citata: lo spostamento in x = 0 sarà sempre zero e non farebbe nessuna differenza se fissassimo lì la corda. Il punto successivo da discutere è la riflessione di un’onda periodica. Supponiamo che l’onda rappresentata da F(x ct) sia un’onda sinusoidale e sia stata riflessa; allora anche l’onda riflessa F( x ct) è un’onda sinusoidale della stessa frequenza, ma viaggiante in direzione opposta. Questa situazione può essere descritta nel modo più semplice usando la notazione con le funzione complesse: F(x ct) = ei!(t x/c) e F( x ct) = ei!(t+x/c) Si può vedere che se queste sono sostituite nella (49.2) e se si pone x = 0, allora y = 0 per tutti i valori di t, così soddisfa la condizione necessaria. Per le proprietà degli esponenziali, questo si può scrivere in una forma più semplice: y = ei!t (e

i!x/c

ei!x/c ) = 2iei!t sen

!x c

(49.3)

Qui c’è qualcosa di nuovo e interessante, nel senso che questa soluzione ci dice che se osserviamo qualunque x fissato, la corda oscilla alla frequenza !. Dovunque si trovi questo punto, la frequenza è la stessa! Ma vi sono alcune posizioni, in particolare dovunque sen(!x/c) = 0, in cui non c’è spostamento alcuno. Inoltre, se a qualunque istante t facciamo un’istantanea della corda vibrante, la fotografia sarà un’onda sinusoidale. Tuttavia lo spostamento di quest’onda sinusoidale dipenderà dal tempo t. Dall’esame dell’equazione (49.3) possiamo vedere che la lunghezza di un ciclo dell’onda sinusoidale è uguale alla lunghezza d’onda di una qualunque delle onde sovrapposte: =

2⇡c !

(49.4)

I punti in cui non c’è moto soddisfano la condizione sen(!x/c) = 0, che equivale a scrivere !x/c = 0, ⇡, 2⇡, ... , n⇡... Questi punti sono detti nodi. Fra due nodi successivi qualunque, ogni punto si muove su e giù sinusoidalmente, ma il profilo del moto rimane fisso nello spazio. Questa è la caratteristica fondamentale di ciò che chiamiamo un modo di vibrazione. Se si può trovare un tipo di moto che abbia la proprietà che a ogni punto l’oggetto si muova in modo perfettamente sinusoidale, e che tutti i punti si muovano alla stessa frequenza (sebbene alcuni si muovano più di altri), allora abbiamo ciò che si chiama modo di vibrazione.

49.2

Onde limitate, con frequenze naturali

Il prossimo interessante problema è considerare che cosa accade se la corda è tenuta a entrambi gli estremi, diciamo in x = 0 e x = L. Possiamo cominciare con l’idea della riflessione delle onde, iniziando con qualche tipo di perturbazione che si muove in una direzione. Al passare del tempo, ci aspetteremmo che la perturbazione si avvicini a un estremo, e al passare di altro tempo diventi una sorta di piccola oscillazione, perché si combina con la perturbazione immagine, rovesciata, proveniente dall’altra parte. Finalmente la perturbazione iniziale scomparirà e la perturbazione immagine si muoverà in verso opposto per ripetere il processo all’altro estremo. Questo problema ha una facile soluzione, ma una questione interessante è se possiamo avere un moto sinusoidale (la soluzione appena descritta è periodica, ma naturalmente non è periodica sinusoidalmente). Proviamo a mettere un’onda periodica sinusoidalmente su una corda. Se la corda è legata a un estremo sappiamo che deve avere l’aspetto della nostra soluzione precedente (49.3). Se è legata

49.2 • Onde limitate, con frequenze naturali

© 978-8808-22107-0

519

y

ω1t = 0

0 L

x ω1t = π/4

y ω1t = π/2 0

x ω1t = 3π/4

ω1t = π

y

Primo modo

0

FIGURA

x

49.2

I primi tre modi di una corda vibrante.

Onda composta

Secondo modo

FIGURA

49.3

Due modi si combinano dando un’onda viaggiante.

all’altro estremo, deve avere lo stesso aspetto all’altro estremo. Così la sola possibilità di moto periodico sinusoidale è che l’onda sinusoidale si deve adattare perfettamente alla lunghezza della corda. Se non si adatta alla lunghezza della corda, allora non è una frequenza naturale alla quale la corda possa continuare a oscillare. In breve, se la corda viene eccitata con una forma d’onda sinusoidale che le si adatta perfettamente, allora continuerà a mantenere quella forma perfetta di onda sinusoidale e oscillerà armonicamente a una certa frequenza. Matematicamente, per la forma possiamo scrivere sen k x, dove k è uguale al fattore !/c delle equazioni (49.3) e (49.4), e questa funzione sarà zero a x = 0. Tuttavia deve essere zero anche all’altro estremo. Il significato di ciò è che k non è più arbitrario, come accadeva per la corda fissata a un solo estremo. Con la corda fissa a entrambi gli estremi, la sola possibilità è che sen(k L) = 0, perché questa è la sola condizione che manterrà fissi entrambi gli estremi. Ora perché un seno sia zero, l’angolo deve essere 0, ⇡, 2⇡, oppure qualche altro multiplo intero di ⇡. L’equazione k L = n⇡ (49.5) darà quindi tutti i k possibili, a seconda di quale intero si introduce nella formula. Per ogni k c’è una certa frequenza !, che, secondo la (49.3), è semplicemente ! = kc =

n⇡c L

(49.6)

Abbiamo quindi trovato quanto segue: una corda ha la proprietà di poter avere moti sinusoidali, ma soltanto a certe frequenze. Questa è la caratteristica più importante delle onde limitate. Comunque sia complicato il sistema, risulta sempre che vi sono alcuni tipi di moto che hanno una perfetta dipendenza sinusoidale dal tempo, ma con frequenze che sono una proprietà del particolare sistema e della natura dei suoi limiti. Nel caso della corda abbiamo molte possibili frequenze differenti, ciascuna, per definizione, corrispondente a un modo di vibrazione, perché un modo di vibrazione è un tipo di moto che si ripete sinusoidalmente. La figura FIGURA 49.2 mostra i primi tre modi di vibrazione di una corda. Per il primo modo la lunghezza d’onda è = 2L. Ciò si può vedere continuando l’onda fino a x = 2L per ottenere un ciclo completo dell’onda sinusoidale. La frequenza angolare ! è 2⇡c diviso per la lunghezza d’onda, in generale, e in questo caso, siccome è 2L, la frequenza è ⇡c/L, che è in accordo con la (49.6) con n = 1.

520

Capitolo 49 • Modi di vibrazione

© 978-8808-22107-0

Chiamiamo !1 la frequenza del primo modo di vibrazione. Ora il successivo modo di vibrazione mostra due occhielli con un nodo nel mezzo. Per questo modo di vibrazione la lunghezza d’onda, allora, è semplicemente L. Il corrispondente valore di k è due volte più grande e la frequenza è due volte più grande; è 2!1 . Per il terzo modo di vibrazione è 3!1 , e così via. Quindi tutte le diverse frequenze della corda sono multipli, 1, 2, 3, 4 e così via, della frequenza più bassa !1 . Ritornando ora al moto generale della corda, risulta che qualsiasi possibile moto può sempre essere analizzato asserendo che allo stesso tempo interviene più di un modo di vibrazione. In realtà per ottenere un generico moto, deve essere eccitato allo stesso tempo un numero infinito di modi di vibrazione. Per avere un’idea di ciò, illustriamo ciò che accade quando vi sono due modi di vibrazione oscillanti allo stesso tempo: supponiamo di avere il primo modo di vibrazione oscillante come mostrato dalla sequenza di disegni della FIGURA 49.3, che illustra la deflessione di una corda a uguali intervalli di tempo che si estendono per mezzo ciclo della frequenza più bassa. Ora, allo stesso tempo, supponiamo che vi sia anche un’oscillazione del secondo modo di vibrazione. La figura FIGURA 49.3 mostra anche una sequenza di disegni di questo modo di vibrazione, che inizialmente è sfasato di 90° rispetto al primo modo. Ciò significa che all’inizio non c’è spostamento, ma le due metà della corda hanno velocità dirette in senso opposto. Ricordiamo ora un principio generale che si riferisce ai sistemi lineari: se vi sono due soluzioni qualsiasi, allora anche la loro somma è una soluzione. Quindi un terzo possibile moto della corda sarebbe uno spostamento ottenuto sommando le due soluzioni mostrate nella figura FIGURA 49.3. Il risultato, anch’esso mostrato nella figura, comincia a suggerire l’idea di una perturbazione che corre avanti e indietro fra gli estremi della corda, sebbene non ne possiamo dare una rappresentazione molto buona con due soli modi; sono necessari più modi di vibrazione. Questo risultato è, in realtà, un caso particolare di un grande principio per i sistemi lineari: Qualsiasi moto può essere analizzato assumendo che sia la somma dei moti di tutti i differenti modi di vibrazione, combinati con ampiezze e fasi opportune. L’importanza del principio deriva dal fatto che ciascun modo di vibrazione è molto semplice: non è altro che un moto sinusoidale nel tempo. È vero che anche il moto generale di una corda in realtà non è molto complicato, ma vi sono altri sistemi, per esempio il vibrare di un’ala d’aereo, in cui il moto è molto più complicato. Nondimeno, anche per l’ala d’aereo, troviamo che esiste un certo particolare modo di torcersi che ha una frequenza e altri modi di torcersi che hanno altre frequenze. Se si possono trovare questi modi di vibrazione, allora il moto completo può sempre essere analizzato come sovrapposizione di oscillazioni armoniche (eccetto che quando il vibrare è di tale intensità che il sistema non si può più considerare lineare).

49.3

Modi di vibrazione in due dimensioni

Il prossimo esempio da considerare è l’interessante situazione dei modi di vibrazione in due dimensioni. Fino a questo punto abbiamo parlato soltanto di situazioni unidimensionali – una corda tesa oppure onde sonore in un tubo. Alla fine dovremo considerare tre dimensioni, ma un passo più facile sarà quello verso due dimensioni. Per la precisione consideriamo un diaframma da tamburo rettangolare di gomma limitato in modo da non avere alcuno spostamento in nessuna parte del bordo rettangolare, e siano a e b le dimensioni del rettangolo, come mostrato nella FIGURA 49.4. Ora la questione è: quali sono le caratteristiche del possibile moto? Possiamo iniziare con lo stesso procedimento usato per la corda. Se non avessimo alcuna limitazione, ci aspetteremmo onde che si propagano con qualche tipo di moto ondulatorio. Per esempio ei!t e

ik x x + ik y y

rappresenterebbe un’onda sinusoidale che si propaga in qualche direzione dipendente dai valori relativi di k x e k y . Ora come possiamo rendere un nodo l’asse x, cioè la linea y = 0? Facendo

49.3 • Modi di vibrazione in due dimensioni

© 978-8808-22107-0

uso delle idee sviluppate per la corda unidimensionale, possiamo immaginare un’altra onda rappresentata dalla funzione complessa e

i!t

e

ik x x

y

Bordi fissati

ik y y b

La sovrapposizione di queste onde darà spostamento zero a y = 0 indipendentemente dai valori di x e t. (Sebbene queste funzioni siano definite per y negativi, dove non c’è membrana che possa vibrare, ciò si può ignorare, dato che lo spostamento è veramente zero a y = 0.) In questo caso possiamo riguardare la seconda funzione come l’onda riflessa. Tuttavia vogliamo una linea nodale a y = b come a y = 0. Come otteniamo ciò? La soluzione è legata a qualche cosa che abbiamo fatto studiando la riflessione dai cristalli. Queste onde che si eliminano l’una con l’altra a y = 0 faranno la stessa cosa a y = b soltanto se 2b sen ✓ è un multiplo intero di , dove ✓ è l’angolo mostrato nella FIGURA 49.4: m = 2b sen ✓

m = 0, 1, 2, ...

Onda: eiωte–ikx x + iky y

0 0

FIGURA

a

49.4

Lamina rettangolare vibrante.

(49.7)

Ora nello stesso modo possiamo rendere l’asse y una linea nodale aggiungendo altre due funzioni, ei!t e+ik x x + iky y

e

+ ei!t e+ik x x

ik y y

ciascuna rappresentante una riflessione di una delle altre due onde dalla linea x = 0. La condizione per una linea nodale a x = a è simile a quella per y = b. È che anche 2a cos ✓ deve essere un multiplo intero di : n = 2a cos ✓ (49.8) Allora il risultato finale è che le onde che rimbalzano attorno nella scatola producono un tipo di onda stazionaria, cioè un modo di vibrazione definito. Quindi, se vogliamo avere un modo di vibrazione, dobbiamo soddisfare le due condizioni qui sopra indicate. Troviamo prima la lunghezza d’onda. Ciò si può ottenere eliminando l’angolo ✓ dalle (49.7) e (49.8) per ottenere la lunghezza d’onda in funzione di a, b, n e m. Il modo più semplice di farlo è dividere ambo i membri delle rispettive equazioni per 2b e 2a, elevarli al quadrato e sommare insieme le due equazioni. Il risultato è n sen ✓ + cos ✓ = 1 = 2a 2

521

2

!2

m + 2b

!2

da cui si può ricavare :

n2 m2 + (49.9) 2 4a2 4b2 In questo modo abbiamo determinato la lunghezza d’onda in funzione di due interi, e dalla lunghezza d’onda otteniamo immediatamente la frequenza !, perché, come sappiamo, la frequenza è uguale a 2⇡c diviso per la lunghezza d’onda. Questo risultato è interessante e importante quanto basta perché lo si debba dedurre con un’analisi puramente matematica invece che con un argomento relativo alle riflessioni. Rappresentiamo la vibrazione con una sovrapposizione di quattro onde scelte in modo che le quattro linee x = 0, x = a, y = 0 e y = b siano tutti nodi. In aggiunta richiederemo che tutte le onde abbiano la stessa frequenza, così che il moto risultante rappresenterà un modo di vibrazione. Dal nostro precedente trattamento della riflessione della luce sappiamo che ei!t e ik x x + iky y rappresenta un’onda che si propaga nella direzione indicata nella FIGURA 49.4. L’equazione (49.6), cioè k = !/c, vale ancora, purché sia 1

=

k 2 = k x2 + k y2 È chiaro dalla figura che k x = k cos ✓

e

k y = k sen ✓

(49.10)

x

Capitolo 49 • Modi di vibrazione

522

© 978-8808-22107-0

Ora la nostra equazione per lo spostamento, diciamo , della membrana rettangolare prende la grande forma f = ei!t e(

ik x x + ik y y)

e(+ik x x + iky y)

e(

ik x x

ik y y)

+ e(+ik x x

ik y y)

g

(49.11a)

Sebbene ciò sembri piuttosto un pasticcio, la somma di queste cose non è molto difficile. Gli esponenziali possono essere combinati per dare funzioni seno, così che lo spostamento risulta essere ⇥ ⇤ = 4 sen (k x x) sen (k y y) ei!t (49.11b) In altre parole, è un’oscillazione sinusoidale, va bene, con un profilo che è pure sinusoidale sia nella direzione x sia nella direzione y. Le nostre condizioni al contorno sono naturalmente soddisfatte a x = 0 e y = 0. Vogliamo anche che sia zero quando x = a e quando y = b. Quindi dobbiamo introdurre due altre condizioni: k x a deve essere un multiplo intero di ⇡, e k y b deve essere un altro multiplo intero di ⇡. Siccome abbiamo visto che k x = k cos ✓ e k y = k sen ✓, otteniamo immediatamente le equazioni (49.7) e (49.8) e da queste il risultato finale (49.9). Prendiamo ora come esempio un rettangolo la cui larghezza sia due volte l’altezza. Se a = 2b e usiamo le equazioni (49.4) e (49.9), possiamo calcolare le frequenze di tutti i modi di vibrazione: !2 = TABELLA

49.1

m

+

1

+

– –

+

– + – +

1 1 2

+ –

2

(49.12)

La TABELLA 49.1 elenca alcuni dei modi di vibrazione semplici e mostra anche la loro forma in modo qualitativo. n (ω/ω0)2 ω/ω0 Il punto più importante da sottolineare relativamente a questo caso particolare è che le frequenze non sono multiple l’una dell’altra, né sono multipli di alcun numero. L’idea che le frequenze naturali siano legate ar1 1,25 1,12 monicamente non è vera in generale. Non è vera per un sistema di più di una dimensione, né è vera per sistemi unidimensionali che siano più compli2 2,00 1,41 cati di una corda con densità e tensioni uniformi. Un semplice esempio di questi ultimi è una catena appesa in cui la tensione è più elevata in alto che 3 3,25 1,80 in basso. Se una catena del genere viene posta in oscillazione armonica, vi sono vari modi di vibrazione e frequenze, ma le frequenze non sono 1 4,25 2,06 multipli semplici di alcun numero, né sono sinusoidali le forme dei modi di vibrazione. 2 5,00 2,24 I modi di vibrazione di sistemi più complessi sono ancora più elaborati. Per esempio, nella bocca abbiamo una cavità sopra le corde vocali, e muovendo la lingua e le labbra, e così via, facciamo una canna aperta o una canna chiusa agli estremi, di diametro e forma diversi; è un risuonatore terribilmente complicato, ma nondimeno è un risuonatore. Quando si parla, le corde vocali sono fatte per produrre qualche tipo di tono. Il tono è piuttosto complicato e vi sono molti suoni che vengono fuori, ma la cavità della bocca modifica ulteriormente questo tono a causa delle varie frequenze risonanti nella cavità. Per esempio, un cantante può cantare varie vocali, «a», «o» oppure «u»(1) e così via, alla stessa altezza, ma esse suonano in modo diverso perché le varie armoniche sono in risonanza nella cavità in grado diverso. La grandissima importanza delle frequenze risonanti di una cavità nel modificare i suoni della voce si può dimostrare con un semplice esperimento. Siccome la velocità del suono va come il reciproco della radice quadrata della densità, la velocità del suono può essere variata usando gas diversi. Se si usa elio invece di aria, così che la densità risulta più bassa, la velocità del suono è molto più elevata, e tutte le frequenze di una cavità verranno elevate. Di conseguenza se uno prima di parlare si riempie i polmoni di elio, il carattere della sua voce verrà drasticamente alterato, anche se le corde vocali vibrano ancora alla stessa frequenza.

Modi di vibrazione: alcuni esempi.

Forma del modo

+

✓ ⇡c ◆ 2 4m2 + n2 b 4

(1)

Nell’originale questo suono viene indicato con «oo», che in inglese si pronuncia appunto «u». (N.d.T.)

49.4 • Pendoli accoppiati

© 978-8808-22107-0

49.4

523

Pendoli accoppiati

Infine dovremmo sottolineare che i modi di vibrazione non esistono soltanto per complessi sistemi continui, ma anche per sistemi meccanici molto semplici. Un buon esempio è il sistema di due pendoli accoppiati discusso nel capitolo precedente. In quel capitolo è stato mostrato che il moto poteva essere analizzato come sovrapposizione di due moti armonici con frequenze differenti. Così anche questo sistema può essere analizzato in termini di moti armonici o modi di vibrazione. La corda ha un numero infinito di modi di vibrazione e la superficie bidimensionale ha anch’essa un numero infinito di modi di vibrazione. In un certo senso è una doppia infinità, se sappiamo come contare gli infiniti. Ma un semplice oggetto meccanico che ha soltanto due gradi di libertà, e richiede soltanto due variabili per descriverlo, ha soltanto due modi di vibrazione. Facciamo un’analisi matematica di questi due modi di vibrazione nel caso in cui i pendoli sono di uguale lunghezza. Sia x lo spostamento di uno, e sia y lo spostamento dell’altro, come mostrato nella FIGURA 49.5. Senza una molla, la forza sulla prima massa è proporzionale allo spostamento di quella massa, a causa della gravità. Se non ci fosse la molla, ci sarebbe una certa frequenza naturale !0 per questo singolo pendolo. L’equazione del moto senza molla sarebbe y

d2 x m 2 = m!02 x dt

(49.13) FIGURA

L’altro pendolo oscillerebbe nello stesso modo se non ci fossero molle. In aggiunta alla forza di richiamo dovuta alla gravitazione, c’è una forza addizionale che tira la prima massa. Questa forza dipende dall’eccesso di distanza di x rispetto a y ed è proporzionale a questa differenza, così è pari a una certa costante dipendente dalla geometria, per (x y). Sulla seconda massa agisce la medesima forza in senso inverso. Le equazioni del moto da risolvere sono quindi d2 x = m!02 x dt 2

k(x

d2 y m 2 = m!02 y dt

k(y

m

y) (49.14) x)

Per trovare un moto in cui entrambe le masse si muovono alla stessa frequenza, dobbiamo determinare di quanto si muove ciascuna massa. In altre parole, il pendolo x e il pendolo y oscilleranno alla stessa frequenza, ma le loro ampiezze debbono avere certi valori, A e B, la cui relazione è fissa. Proviamo questa soluzione: x = Aei!t

(49.15)

y = Bei!t Se si sostituisce nelle equazioni (49.14) e si raccolgono i termini simili, i risultati sono: ! k k !2 !02 A= B, m m !2

!02

! k B= m

x

(49.16)

k A m

Alle equazioni così come sono scritte è stato tolto il fattore comune ei!t e sono state divise per m. Vediamo che abbiamo due equazioni apparentemente per due incognite. Ma in realtà non ci sono due incognite, perché l’ampiezza totale del moto è qualche cosa che non possiamo determinare da queste equazioni. Le equazioni precedenti possono determinare soltanto il rapporto fra A e B, ma debbono dare entrambe lo stesso rapporto. La necessità che entrambe queste equazioni siano compatibili richiede che la frequenza possieda un valore del tutto speciale.

49.5

accoppiati.

Due pendoli

524

Capitolo 49 • Modi di vibrazione

© 978-8808-22107-0

In questo caso particolare questa può essere ricavata piuttosto facilmente. Se si moltiplicano fra loro le due equazioni, il risultato è !2 !2 k k 2 2 ! !0 AB = AB (49.17) m m Il termine AB si può togliere da ambo i membri a meno che A e B non siano zero, il che significa che non c’è affatto moto. Se c’è moto, allora gli altri termini debbono essere uguali, dando, da risolvere, un’equazione di secondo grado. Il risultato è che esistono due possibili frequenze !12 = !02 !22 = !02 +

2k m

(49.18)

Inoltre se questi valori della frequenza vengono di nuovo sostituiti nell’equazione (49.16), troviamo che per la prima frequenza A = B, e per la seconda frequenza A = B. Queste sono le «forme dei modi di vibrazione» come si può facilmente verificare con l’esperimento. È chiaro che nel primo modo, dove A = B, la molla non è mai tesa, ed entrambe le masse oscillano alla frequenza !0 come se la molla fosse assente. Nell’altra soluzione, in cui A = B, la molla contribuisce con una forza di richiamo e accresce la frequenza. Un caso più interessante si presenta se i pendoli hanno lunghezze diverse. L’analisi è molto simile a quella fatta sopra, ed è lasciata come esercizio al lettore.

49.5

Sistemi lineari

Riassumiamo ora le idee discusse precedentemente, che sono tutte aspetti del più generale e meraviglioso principio della fisica matematica. Se abbiamo un sistema lineare il cui carattere è indipendente dal tempo, allora il moto non deve avere nessuna particolare semplicità, e in realtà può essere estremamente complesso, ma esistono moti assai particolari, di solito una serie di moti particolari, in cui l’andamento globale del moto varia esponenzialmente col tempo. Per i sistemi vibranti dei quali parliamo ora, l’esponenziale è immaginario, e invece di dire «esponenzialmente» potremmo preferire di dire «sinusoidalmente» nel tempo. Tuttavia, si può essere più generali e dire che i moti varieranno esponenzialmente col tempo in modi molto particolari, con forme molto particolari. Il moto più generale del sistema può essere sempre rappresentato come una sovrapposizione di moti implicanti ciascuno dei diversi esponenziali. Vale la pena di riaffermare per il caso del moto sinusoidale: non è necessario che un sistema lineare si muova di moto puramente sinusoidale, cioè, a una singola, determinata frequenza, ma, qualunque sia il modo in cui si muove, questo moto si può rappresentare come sovrapposizione di moti puramente sinusoidali. La frequenza di ciascuno di questi moti è una caratteristica del sistema, e il profilo o forma d’onda di ciascun moto è pure una caratteristica del sistema. Il moto generale di ogni sistema del genere si può caratterizzare dando l’ampiezza e la fase di ciascuno di questi moti, e sommandoli tutti insieme. Un altro modo di dire questo è che qualsiasi sistema vibrante lineare è equivalente a un insieme di oscillatori armonici indipendenti, con le frequenze naturali corrispondenti ai modi di vibrazione. Concludiamo questo capitolo facendo notare il legame dei modi di vibrazione con la meccanica quantistica. Nella meccanica quantistica l’oggetto che vibra, ovvero la cosa che varia nello spazio, è l’ampiezza di una funzione di probabilità che dà la probabilità di trovare un elettrone, o un sistema di elettroni, in una data configurazione. Questa funzione ampiezza può variare nello spazio e nel tempo, e soddisfa, in realtà, un’equazione lineare. Ma nella meccanica quantistica c’è una trasformazione, nella quale ciò che chiamiamo frequenza dell’ampiezza di probabilità è uguale, nell’idea classica, all’energia. Quindi possiamo trasferire a questo caso il principio enunciato in precedenza prendendo la parola frequenza e sostituendola con energia. Diventa qualche cosa di simile a questo: un sistema quanto-meccanico, per esempio un atomo, non occorre abbia un’energia determinata, proprio come un semplice sistema meccanico non occorre

© 978-8808-22107-0

49.5 • Sistemi lineari

abbia una frequenza determinata; ma qualunque sia il modo in cui si comporta il sistema, il suo comportamento può sempre essere rappresentato come sovrapposizione di stati di energia determinata. L’energia di ciascuno stato è caratteristica dell’atomo, e tale è il profilo dell’ampiezza che determina la probabilità di trovare le particelle nei diversi punti. Il moto generico può essere descritto dando l’ampiezza di ciascuno di questi diversi stati di energia. Questa è l’origine dei livelli energetici della meccanica quantistica. Poiché la meccanica quantistica è rappresentata da onde, nella situazione in cui l’elettrone non ha energia sufficiente per sfuggire alla fine dal protone, si tratta di onde limitate. Come per le onde limitate di una corda, vi sono frequenze definite per la soluzione dell’equazione d’onda per la meccanica quantistica. L’interpretazione quanto-meccanica è che queste sono energie definite. Pertanto un sistema quanto-meccanico, siccome è rappresentato da onde, può avere stati definiti di energia fissata; ne sono esempi i livelli energetici dei vari atomi.

525

50

Armoniche

50.1

Toni musicali

Si dice che Pitagora abbia scoperto il fatto che due corde simili sotto la medesima tensione e diverse soltanto in lunghezza, quando sono suonate insieme danno un effetto che è piacevole per l’orecchio se le lunghezze delle corde sono nel rapporto di due numeri interi piccoli. Se le lunghezze stanno come uno a due, esse corrispondono all’ottava musicale. Se le lunghezze stanno come due sta a tre, esse corrispondono all’intervallo fra do e sol, che è chiamato quinta. Questi intervalli sono generalmente accettati come accordi sonori «piacevoli». Pitagora fu così colpito da questa scoperta che la pose come base di una scuola – i cui seguaci erano chiamati Pitagorici – che aveva credenze mistiche nei grandi poteri dei numeri. Si credeva che qualcosa di simile sarebbe stato scoperto anche relativamente ai pianeti – o «sfere». Qualche volta si sente l’espressione: «la musica delle sfere». L’idea era che ci dovessero essere alcune relazioni numeriche fra le orbite dei pianeti o fra altre cose in natura. Generalmente si crede che ciò sia soltanto un tipo di superstizione avuto dai Greci. Ma è così diverso dal nostro interesse scientifico nelle relazioni quantitative? La scoperta di Pitagora fu il primo esempio, al di fuori della geometria, di una relazione numerica in natura. Deve essere stato molto sorprendente lo scoprire che esisteva un fatto di natura che implicava una semplice relazione numerica. Semplici misure di lunghezza davano una predizione circa qualcosa che non aveva connessione apparente con la geometria – la produzione di suoni piacevoli. Questa scoperta condusse all’estensione che l’aritmetica e l’analisi matematica sarebbero state forse un buono strumento per comprendere la natura. I risultati della scienza moderna giustificano quel punto di vista. Pitagora avrebbe potuto fare la sua scoperta soltanto facendo un’osservazione sperimentale. Eppure questo importante aspetto non sembra averlo colpito. Se lo avesse fatto, la fisica avrebbe potuto avere inizio molto prima. (È sempre facile riconsiderare ciò che ha fatto qualcun altro e decidere ciò che avrebbe dovuto fare!) Pressione (a) Potremmo commentare un terzo aspetto di questa interessantissima scoperta: la scoperta aveva a che fare con due note che suonano piacevoli all’orecchio. Possiamo chiederci se noi siamo in una situazione migliore di Pitagora nel comprendere perché soltanto certi suoni siano piacevoli per Tempo il nostro orecchio. La teoria generale dell’estetica probabilmente ora non è più avanzata che al tempo di Pitagora. In questa particolare scoperta dei Greci vi sono i tre aspetti: esperimento, relazioni matematiche ed estetica. La fisica ha progredito molto soltanto sulle prime due parti. Questo capitolo Pressione (b) tratterà della nostra conoscenza presente della scoperta di Pitagora. Fra i suoni che udiamo, ne esiste un tipo che chiamiamo rumore. Il rumore corrisponde a una sorta di vibrazione irregolare del timpano che è Tempo prodotta dalla vibrazione irregolare di qualche oggetto nelle vicinanze. Se facciamo un diagramma per indicare la pressione dell’aria sul timpano (e, T quindi, lo spostamento della membrana) in funzione del tempo, il grafico che corrisponde a un rumore potrebbe avere l’aspetto di quello mostrato in FIGURA 50.1a. (Un rumore del genere potrebbe corrispondere approssimaFIGURA 50.1 Pressione in funzione del tempo per (a) un rumore e (b) un tono musicale. tivamente al suono prodotto battendo un piede.) Il suono della musica ha

50.2 • La serie di Fourier

© 978-8808-22107-0

un carattere diverso. La musica è caratterizzata dalla presenza di toni più o meno prolungati – o «note» musicali. (Gli strumenti musicali possono fare anche rumori!) Il tono può durare per un tempo relativamente breve, come quando si preme un tasto di un pianoforte, oppure può essere prolungato quasi indefinitamente, come quando un suonatore di flauto tiene una nota lunga. Qual è il carattere particolare di una nota musicale dal punto di vista della pressione dell’aria? Una nota musicale differisce da un rumore per il fatto che nel suo grafico c’è una periodicità. C’è una qualche forma ineguale per la variazione della pressione dell’aria col tempo, e la forma si ripete continuamente. Un esempio di funzione pressione-tempo che corrisponderebbe a una nota musicale è mostrato nella FIGURA 50.1b. I musicisti parlano usualmente di un tono musicale in termini di tre caratteristiche: l’intensità, l’altezza e la «qualità». L’«intensità» si trova che corrisponde alla grandezza delle variazioni di pressione. L’«altezza» corrisponde al periodo di tempo per una ripetizione della funzione fondamentale della pressione. (Le note «basse» hanno periodi più lunghi delle note «alte».) La «qualità» di un tono ha a che fare con le differenze che possiamo ancora riuscire a udire fra due note della stessa intensità e altezza. Un oboe, un violino o un soprano sono ancora distinguibili anche quando emettono note della stessa altezza. La qualità ha a che fare con la struttura del disegno che si ripete. Consideriamo, per un momento, il suono prodotto da una corda vibrante. Se pizzichiamo la corda, tirandola da una parte e lasciandola andare, il moto susseguente sarà determinato dai moti delle onde che abbiamo prodotto. Sappiamo che queste onde si propagheranno in entrambi i sensi, e saranno riflesse agli estremi. Esse si agiteranno avanti e indietro per un lungo tempo. Per quanto l’onda sia complicata, tuttavia, essa si ripeterà. Il periodo di ripetizione è proprio il tempo T necessario all’onda per percorrere due lunghezze complete della corda. Perché questo è proprio il tempo necessario per qualsiasi onda, una volta partita, per riflettersi a entrambi gli estremi, ritornare alla posizione di partenza, e procedere nella direzione iniziale. II tempo è il medesimo per le onde che partono in entrambe le direzioni. Ogni punto della corda, allora, ritornerà alla sua posizione di partenza dopo un periodo, e di nuovo dopo un periodo ecc. Anche l’onda sonora prodotta deve avere la stessa ripetizione. Vediamo perché una corda pizzicata produce un tono musicale.

50.2

La serie di Fourier

Nel capitolo precedente abbiamo discusso un altro modo di considerare il moto di un sistema vibrante. Abbiamo visto che una corda ha vari modi di oscillazione naturali, e che qualsiasi particolare tipo di vibrazione che può essere stabilito dalle condizioni iniziali si può pensare come una combinazione – in proporzioni opportune – di alcuni dei modi naturali, oscillanti insieme. Per una corda abbiamo trovato che i modi normali di oscillazione avevano le frequenze !0 , 2!0 , 3!0 ,... Il moto più generale di una corda pizzicata, quindi, è composto dalla somma di un’oscillazione sinusoidale alla frequenza fondamentale !0 , un’altra alla frequenza della seconda armonica 2!0 , un’altra alla terza armonica 3!0 ecc. Ora il modo fondamentale si ripete a ogni periodo T1 = 2⇡/!0 . Il modo della seconda armonica si ripete ogni T2 = 2⇡/2!0 . Si ripete anche ogni T1 = 2T2 , dopo due dei suoi periodi. Similmente, il modo della terza armonica si ripete dopo un tempo T1 pari a tre dei suoi periodi. Di nuovo vediamo perché una corda pizzicata ripete l’intero disegno con una periodicità di T1 . Essa produce un tono musicale. Abbiamo parlato del moto della corda. Ma il suono, che è il moto dell’aria, è prodotto dal moto della corda, così anche le sue vibrazioni debbono essere composte delle stesse armoniche – sebbene non stiamo più pensando ai modi di vibrazione normale dell’aria. Inoltre la forza relativa delle armoniche nell’aria può essere diversa da quella nella corda, particolarmente se la corda è «accoppiata» all’aria per mezzo di una tavola armonica. L’efficienza dell’accoppiamento all’aria è diversa per le differenti armoniche. Se facciamo sì che f (t) rappresenti la pressione dell’aria in funzione del tempo per un tono musicale – come quello in FIGURA 50.1b –, allora ci aspettiamo che f (t) si possa scrivere come somma di un certo numero di semplici funzioni armoniche del tempo – come cos(!t) –

527

Capitolo 50 • Armoniche

528

© 978-8808-22107-0

per ciascuna delle varie frequenze armoniche. Se il periodo della vibrazione è T, la frequenza angolare fondamentale sarà ! = 2⇡/T, e le armoniche saranno 2!, 3! ecc. C’è una sola lieve complicazione. Per ogni frequenza ci possiamo aspettare che le fasi iniziali non saranno necessariamente le stesse per tutte le frequenze. Dovremmo, quindi, far uso di funzioni come cos(!t + ). Tuttavia è più semplice usare invece per ogni frequenza sia la funzione seno sia la funzione coseno. Ricordiamo che cos (!t + ) = cos cos (!t)

sen sen (!t)

(50.1)

e siccome è costante, qualsiasi oscillazione sinusoidale alla frequenza ! si può scrivere come somma di un termine con cos(!t) e un altro termine con sen(!t). Concludiamo, allora, che qualsiasi funzione f (t) che sia periodica con periodo T si può scrivere matematicamente come f(t)

T

f (t) = a0 + a1 cos ( !t) + b1 sen ( !t) + + a2 cos (2!t) + b2 sen (2!t) + + a3 cos (3!t) + b3 sen (3!t) + + ... + ...

t

(50.2)

dove ! = 2⇡/T e gli a e i b sono costanti numeriche che ci dicono quanto di ogni oscillazione componente è presente nell’oscillazione f (t). Abbiamo aggiunto il termine «a frequenza zero» a0 così che la nostra formula sarà a1 b1 + completamente generale, sebbene esso sia usualmente zero per un tono t + t musicale. Esso rappresenta uno spostamento del valore medio (cioè, il a2 b2 livello «zero») della pressione del suono. Con esso la nostra formula può + t + t servire a qualsiasi caso. L’uguaglianza dell’equazione (50.2) è rappresentata schematicamente + + ecc. ecc. in FIGURA 50.2. (Le ampiezze an e bn delle funzioni armoniche debbono essere scelte opportunamente. Esse sono mostrate schematicamente e senza alcuna particolare scala nella figura.) La serie (50.2) è chiamata serie di FIGURA 50.2 Qualsiasi funzione periodica f (t) è uguale alla somma di funzioni armoniche semplici. Fourier per f (t). Abbiamo detto che qualsiasi funzione periodica può essere costruita in questo modo. Dovremmo correggere ciò e dire che qualsiasi onda sonora, o qualsiasi funzione che incontriamo ordinariamente in fisica, può essere costruita con una somma del genere. I matematici possono inventare funzioni che non possono essere composte da semplici funzioni armoniche – per esempio, una funzione che ha una «contorsione a rovescio» così che ha due valori per alcuni valori di t! Qui non ci dobbiamo preoccupare di funzioni del genere. =

a0

T

t

50.3

Qualità e assonanza

Ora siamo in grado di descrivere che cos’è che determina la «qualità» di un tono musicale. È l’ammontare relativo delle varie armoniche – i valori degli a e dei b. Un tono con soltanto la prima armonica è un tono «puro». Un tono con molte armoniche forti è un tono «ricco». Un violino produce una proporzione di armoniche diversa da un oboe. Possiamo «fabbricare» vari toni musicali se colleghiamo parecchi «oscillatori» a un altoparlante. (Un oscillatore usualmente produce una semplice funzione armonica quasi pura.) Dovremmo scegliere le frequenze degli oscillatori in modo che siano !, 2!, 3! ecc. Allora, regolando il controllo del volume su ogni oscillatore, possiamo sommare qualsiasi ammontare desideriamo di ogni armonica – producendo perciò toni di qualità differente. Un organo elettrico funziona in maniera assai simile. Le «chiavi» selezionano la frequenza dell’oscillatore fondamentale e i «registri musicali» sono commutatori che controllano la proporzione relativa delle armoniche. Spostando questi commutatori, si può far sì che l’organo suoni come un flauto, un oboe oppure un violino.

50.3 • Qualità e assonanza

© 978-8808-22107-0

È interessante osservare che per produrre tali toni «artificiali» abbiamo bisogno soltanto di un oscillatore per ogni frequenza – non abbiamo bisogno di oscillatori separati per le componenti seno e coseno. L’orecchio non è molto sensibile alle fasi relative delle armoniche. Fa attenzione principalmente al totale delle parti seno e coseno di ogni frequenza. La nostra analisi è più accurata di quanto sia necessario per spiegare l’aspetto soggettivo della musica. La risposta di un microfono o di un altro strumento fisico dipende dalle fasi, tuttavia, e per trattare tali casi può essere necessaria la nostra analisi completa. La «qualità» di un suono parlato determina anche i suoni vocalici che riconosciamo nel discorso. La forma della bocca determina le frequenze dei modi naturali di vibrazione dell’aria nella bocca. Alcuni di questi modi sono posti in vibrazione dalle onde sonore delle corde vocali. In questo modo, le ampiezze di alcune delle armoniche del suono sono aumentate rispetto ad altre. Quando cambiamo la forma della bocca, vien data preferenza ad armoniche di frequenze differenti. Questi effetti rendono conto della differenza fra un suono «e-e-e» e un suono «a-a-a». Tutti noi sappiamo che un particolare suono vocalico – diciamo «e-e-e» – ha ancora un «suono simile» alla stessa vocale quando la diciamo (o cantiamo) a un’altezza elevata o bassa. Dal meccanismo che descriviamo, ci aspetteremmo che quando atteggiamo la bocca per un «e-ee», sia dato rilievo a particolari frequenze, e che esse non cambino quando variamo l’altezza della voce. Così la relazione delle armoniche importanti rispetto alla fondamentale, cioè la «qualità», cambia quando cambiamo altezza. Apparentemente il meccanismo col quale riconosciamo il discorso non è basato su relazioni armoniche specifiche. Che cosa dovremmo dire ora sulla scoperta di Pitagora? Comprendiamo che due corde simili con lunghezze nel rapporto di 2 a 3 avranno frequenze fondamentali nel rapporto 3 a 2. Ma perché dovrebbero avere un «suono piacevole» insieme? Forse dovremmo prendere il suggerimento dalle frequenze delle armoniche. La seconda armonica della corda più corta che ha suoni più bassi avrà la medesima frequenza della terza armonica della corda più lunga. (È facile mostrare – oppure credere – che una corda pizzicata produce più fortemente le diverse armoniche più basse.) Forse dovremmo costruire le regole seguenti. Le note suonano assonanti quando hanno armoniche con la stessa frequenza. Le note suonano dissonanti se le loro armoniche superiori hanno frequenze vicine le une alle altre ma abbastanza lontane perché vi siano rapidi battimenti fra le due. Perché i battimenti non abbiano un suono piacevole, o perché l’unisono delle armoniche superiori abbia un suono piacevole, è qualcosa che non sappiamo come definire o descrivere. Da questa conoscenza di ciò che ha un bel suono non possiamo dire, per esempio, che cosa dovrebbe avere un buon odore. In altre parole, la nostra comprensione di ciò non è per nulla più generale dell’affermazione che quando sono all’unisono hanno un bel suono. Non ci permette di dedurre nulla di più delle proprietà dell’armonia in musica. È facile controllare le relazioni armoniche che abbiamo descritto con alcuni semplici esperimenti con un pianoforte. Indichiamo con do, do0 e do00 i tre do successivi vicino alla metà della tastiera, e con sol, sol 0 e sol 00 i sol appena sopra. Allora le vibrazioni fondamentali avranno frequenze relative come segue: do –2 do0 –4 do00–8

sol – 3 sol0 – 6 sol00–12

Queste relazioni armoniche possono essere dimostrate nel modo seguente: supponiamo di premere lentamente il do0 – così che non suoni ma facciamo sì che lo smorzatore sia sollevato. Se poi suoniamo il do, esso produrrà la sua propria vibrazione fondamentale e un po’ di seconda armonica. La seconda armonica porrà in vibrazione le corde del do0. Se ora noi lasciamo andare il do (mantenendo premuto il do0 ) lo smorzatore farà cessare la vibrazione delle corde del do, e possiamo udire (pian piano) la nota do0 che si spegne. In modo simile, la terza armonica del do può produrre una vibrazione del sol 0. Oppure la sesta del do (che ora diventa molto più debole) può produrre una vibrazione nella fondamentale del sol 00. Un risultato un po’ diverso si ottiene se premiamo piano il sol e poi suoniamo il do0. La terza armonica di do0 corrisponderà alla quarta armonica del sol, così sarà eccitata soltanto la quarta

529

530

Capitolo 50 • Armoniche

© 978-8808-22107-0

armonica del sol. Possiamo udire (se ascoltiamo attentamente) il suono del sol 00, che è due ottave sopra il sol che abbiamo premuto! È facile pensare molte altre combinazioni di questo gioco! Possiamo notare incidentalmente che la scala maggiore può essere definita proprio dalla condizione che i tre accordi maggiori (mi-la-do), (do-fa-sol) e (sol-si-re) rappresentino ciascuno una sequenza di note col rapporto di frequenze (4:5:6). Questi rapporti – più il fatto che un’ottava (do-do0, si-si0 ecc.) ha il rapporto 1:2 – determinano l’intera scala per il caso «ideale», ovvero per ciò che è detta «giusta intonazione». Gli strumenti a tastiera come il pianoforte non sono generalmente accordati in questo modo, ma si fa una piccola «truffa» così che le frequenze sono approssimativamente corrette per tutte le possibili note di partenza. Per questa accordatura, che è detta «temperata», l’ottava (ancora 1:2) è divisa in 12 intervalli uguali per i quali il rapporto di frequenza è 21/12 . Una quinta non ha più il rapporto di frequenze 3/2, ma 27/12 = 1,499, che apparentemente è abbastanza vicino per la maggior parte delle orecchie. Abbiamo stabilito una regola per l’assonanza in termini della coincidenza di armoniche. Questa coincidenza è forse la ragione per cui due note sono assonanti? Uno che lavora in questo campo ha affermato che due toni puri – toni fabbricati con cura per essere privi di armoniche – non danno le sensazioni di assonanza o dissonanza quando le frequenze relative sono poste nei rapporti attesi o vicino a essi. (Tali esperimenti sono difficili perché è difficile fabbricare toni puri, per ragioni che vedremo in seguito.) Non possiamo ancora essere certi se l’orecchio uguaglia le armoniche o fa dell’aritmetica quando decidiamo che ci piace un suono.

50.4

I coefficienti di Fourier

Ritorniamo ora all’idea che qualunque nota – cioè, un suono periodico – può essere rappresentata da un’opportuna combinazione di armoniche. Vorremmo mostrare come possiamo trovare quanto di ciascuna armonica è necessario. Naturalmente è facile calcolare f (t), usando l’equazione (50.2), se ci sono dati tutti i coefficienti a e b. Il problema ora è: se ci è data f (t) come possiamo conoscere quali dovrebbero essere i coefficienti dei vari termini armonici? (È facile fare una torta da una ricetta; ma siamo in grado di scrivere la ricetta se ci danno una torta?) Fourier scoprì che non era in realtà molto difficile. Il termine a0 è certamente facile. Abbiamo già detto che è soltanto il valor medio di f (t) su un periodo (da t = 0 a t = T). Possiamo facilmente vedere che è proprio così. Il valore medio di una funzione seno o coseno su un periodo è zero. Su due, o tre, o qualsiasi numero intero di periodi, è ancora zero. Così il valore medio di tutti i termini al secondo membro dell’equazione (50.2) è zero, eccetto che per a0 . (Ricordate che dobbiamo scegliere ! = 2⇡/T.) Ora la media di una somma è la somma delle medie. Così la media di f (t) è proprio la media di a0 . Ma a0 è una costante, così la sua media è proprio uguale al suo valore. Ricordando la definizione di media, abbiamo ⌅ 1 T f (t) dt (50.3) a0 = T 0 Gli altri coefficienti sono soltanto un po’ più difficili da calcolare. Per trovarli possiamo far uso di un trucco scoperto da Fourier. Supponiamo di moltiplicare ambo i membri dell’equazione (50.2) per qualche funzione armonica – diciamo per cos(7!t). Abbiamo allora f (t) cos (7!t) = a0 cos (7!t) + a1 cos (!t) cos (7!t) + b1 sen (!t) cos (7!t) + a2 cos (2!t) cos (7!t) + b2 sen (2!t) cos (7!t) + ... + ... + a7 cos (7!t) cos (7!t) + b7 sen (7!t) cos (7!t) + ... + ...

(50.4)

Facciamo ora la media di ambo i membri. La media di a0 cos(7!t) sul tempo T è proporzionale alla media di un coseno su 7 interi periodi. Ma questa è proprio zero. La media di quasi tutti i

50.4 • I coefficienti di Fourier

© 978-8808-22107-0

restanti termini è pure zero. Consideriamo il termine a1 . Sappiamo, in generale, che cos A cos B = Il termine a1 diventa

1 1 cos (A + B) + cos (A 2 2

B)

(50.5)

⇤ 1 ⇥ a1 cos (8!t) + cos (6!t) 2

(50.6)

⇤ 1 ⇥ a7 cos (14!t) + cos 0 2

(50.7)

Così abbiamo due termini coseno, uno con 8 periodi interi di T e l’altro con 6. Il valor medio di entrambi è zero. La media del termine a1 è quindi zero. Per il termine a2 , troveremmo a2 cos(9!t) e a2 cos(5!t), ciascuno dei quali ha pure valor medio nullo. Per il termine a9 , troveremmo cos(16!t) e cos( 2!t). Ma cos( 2!t) è uguale a cos(2!t), così entrambi hanno valori medi nulli. È chiaro che tutti i termini ai avranno uno zero eccetto uno. E questo è il termine a7 . Per questo abbiamo

Il coseno di zero è uno, e il suo valor medio, naturalmente, è uno. Così abbiamo il risultato che la media di tutti i termini ai dell’equazione (50.4) è uguale ad a7 /2. I termini b sono anche più facili. Quando moltiplichiamo per qualunque termine coseno come cos(n!t), possiamo mostrare con lo stesso metodo che tutti i termini b hanno valor medio zero. Vediamo che il «trucco» di Fourier ha agito come un setaccio. Quando moltiplichiamo per cos(7!t) e mediamo, tutti i termini cadono eccetto a7 , e troviamo che ⇥ ⇤ a7 valore medio f (t) cos (7!t) = 2

ossia

2 a7 = T



(50.8)

T

f (t) cos(7!t) dt

(50.9)

0

Lasciamo da dimostrare al lettore che il coefficiente b7 può essere ottenuto moltiplicando l’equazione (50.2) per sen(7!t) e facendo la media di ambo i membri. Il risultato è b7 =

2 T



T

f (t) sen(7!t dt

(50.10)

0

Ora ciò che è vero per 7 ci aspettiamo sia vero per qualunque intero. Così possiamo riassumere la nostra dimostrazione e il risultato nella seguente forma matematica più elegante. Se m e n sono interi diversi da zero, e se ! = 2⇡/T, allora I.



T

0

II.



T

0

III.



0

IV.

T

sen (n!t) cos (m!t) dt = 0

(50.11)

9 > > > cos (n!t) cos (m!t) dt > > 8 > > > > se n , m. > >0 > ==> < > > > > > > > > T/2 se n = m. > > sen (n!t) sen (m!t) dt > > > : ;

f (t) = a0 +

1 X n=1

an cos (n!t) +

1 X n=1

bn sen (n!t)

(50.12)

(50.13)

531

Capitolo 50 • Armoniche

532

© 978-8808-22107-0

V.

1 T



2 an = T



2 T



a0 =

bn =

T

f (t) dt

(50.14)

f (t) cos (n!t) dt

(50.15)

f (t) sen (n!t) dt

(50.16)

0 T

0 T

0

In capitoli precedenti è stato conveniente usare la notazione esponenziale per rappresentare il moto armonico semplice. Invece di cos(!t) abbiamo usato Re(ei!t ), la parte reale della funzione esponenziale. In questo capitolo abbiamo usato le funzioni coseno e seno perché ha reso le derivazioni forse un po’ più chiare. Il nostro risultato finale dell’equazione (50.13) può, tuttavia, essere scritto nella forma compatta ! 1 X in!t f (t) = Re aˆ n e (50.17) n=0

dove aˆ n è il numero complesso an ibn (con b0 = 0). Se desideriamo usare la medesima notazione ovunque, possiamo scrivere anche ⌅ 2 T aˆ n = f (t)e in!t dt (n 1) (50.18) T 0

f(t) +1

T/2

Sappiamo ora come «analizzare» un’onda periodica nelle sue componenti armoniche. Il procedimento è chiamato analisi di Fourier, e i termini separati sono chiamati componenti di Fourier. Non abbiamo mostrato, tuttavia, che una volta che troviamo tutte le componenti di Fourier e le sommiamo insieme, riotteniamo proprio la nostra f (t). I matematici hanno mostrato, per un’ampia classe di funzioni, in realtà per tutte quelle che sono di interesse per i fisici, che se possiamo fare gli integrali riotteniamo f (t). C’è una sola eccezione di secondaria importanza. Se la funzione f (t) è discontinua, cioè se salta improvvisamente da un valore a un altro, la somma di Fourier nel punto di irregolarità darà un valore a metà strada fra i valori superiore e inferiore alla discontinuità. Così se abbiamo la strana funzione f (t) = 0 per 0  t < t 0 e f (t) = 1 per t 0  t  T, la somma di Fourier darà ovunque il valore giusto eccetto che in t 0 , dove avrà il valore 1/2 invece di 1. Tuttavia è piuttosto poco fisico insistere che una funzione dovrebbe essere zero fino a t 0 , ma 1 proprio a t 0 . Così forse dovremmo costruire la «regola» per i fisici che qualunque funzione discontinua (che può soltanto essere una semplificazione di una funzione fisica reale) dovrebbe essere definita nelle discontinuità con valori a mezza strada. Allora qualunque funzione del genere – con qualsiasi numero finito di tali salti – come pure tutte le altre funzioni fisicamente interessanti, è data correttamente dalla somma di Fourier. Come esercizio, suggeriamo che il lettore determini la serie di Fourier per la funzione mostrata in FIGURA 50.3. Siccome la funzione non può essere scritta in una forma algebrica esplicita, non potrete fare gli integrali da 0 a T nel modo usuale. Gli integrali sono facili, tuttavia, se li separiamo in due parti: l’integrale da 0 a T/2 (nel quale f (t) = 1) e l’integrale da T/2 a T (nel quale f (t) = 1). Il risultato deve essere ! 4 1 1 sen (!t) + sen (3!t) + sen (5!t) + ... (50.19) f (t) = ⇡ 3 5 τ

f(t) =

FIGURA

50.3



–1

+1 per 0 < t < T/2 –1 per T/2 < t < T

Funzione a onda quadra.

t

ove ! = 2⇡/T. Troviamo così che la nostra onda quadrata (con la particolare fase scelta) ha soltanto armoniche dispari, e le loro ampiezze sono in proporzione inverse alle loro frequenze. Verifichiamo che l’equazione (50.19) ridà in realtà f (t) per qualche valore di t. Scegliamo t = T/4, ossia !t = ⇡/2: ! 4 ⇡ 1 3⇡ 1 5⇡ f (t) = sen + sen + sen + ... (50.20) ⇡ 2 3 2 5 2

50.6 • Risposte non lineari

© 978-8808-22107-0

ossia

4 f (t) = 1 ⇡

1 1 + 3 5

1 ± ... 7

La serie(1) ha il valore ⇡/4, e troviamo che f (t) = 1.

50.5

!

(50.21)

Il teorema dell’energia

L’energia di un’onda è proporzionale al quadrato della sua ampiezza. Per un’onda di forma ⇤T complessa, l’energia in un periodo sarà proporzionale a 0 f 2 (t) dt. Possiamo anche mettere in relazione questa energia con i coefficienti di Fourier. Scriviamo #2 ⌅ T ⌅ T" 1 1 X X f 2 (t) dt = a0 + an cos (n!t) + bn sen (n!t) dt (50.22) 0

0

n=1

n=1

Quando sviluppiamo il quadrato del termine fra parentesi otteniamo tutti i possibili termini misti, come a5 cos(5!t) · b7 cos(7!t). Abbiamo mostrato, tuttavia, con le equazioni (50.11) e (50.12), che l’integrale di tutti i termini del genere su un periodo è zero. Rimaniamo soltanto con i termini quadratici come a52 cos2 (5!t). L’integrale di qualunque coseno al quadrato o seno al quadrato su un periodo è uguale a T/2, quindi otteniamo ⌅

T

0

f 2 (t) dt = T a02 +

1 ⌘ ⌘ T ⇣ 2 T X⇣ 2 a1 + a22 + ... + b21 + b22 + ... = T a02 + an + b2n 2 2 n=1

(50.23)

Questa equazione è detta «teorema dell’energia», e dice che l’energia totale di un’onda è proprio la somma delle energie di tutte le componenti di Fourier. Per esempio, applicando questo teorema alla serie (50.19), siccome f 2 (t) = 1 otteniamo !2 ! T 4 1 1 1 T= 1 + 2 + 2 + 2 + ... 2 ⇡ 3 5 7 così impariamo che la somma dei quadrati dei reciproci degli interi dispari è ⇡ 2 /8. In modo simile, ottenendo prima la serie di Fourier per la funzione e, facendo uso del teorema dell’energia, possiamo dimostrare che 1 + 1/24 + 1/34 + ... è ⇡ 4 /90, risultato di cui abbiamo avuto bisogno nel capitolo 45.

50.6

Risposte non lineari

Infine, nella teoria delle armoniche c’è un importante fenomeno che va sottolineato a causa della sua importanza pratica – quello degli effetti non lineari. In tutti i sistemi che abbiamo considerato (1)

La serie si può calcolare nel modo seguente. Primo, notiamo che ⌅ x 1 dx = arctg x 1 + x2 0

Secondo, sviluppiamo in serie l’integrando: 1 = 1 x2 + x4 1 + x2 Integriamo la serie termine a termine (da 0 a x) ottenendo

x 6 + ...

x3 x5 x7 + + ... 3 5 7 Ponendo x = 1 abbiamo il risultato enunciato, dato che arctg 1 = ⇡/4. arctg x = x

533

534

Capitolo 50 • Armoniche

© 978-8808-22107-0

50.4 Risposte lineari e non lineari. FIGURA

xout

xout

50.5 La risposta di un dispositivo non lineare alla funzione ingresso cos (ωt). Una risposta lineare è mostrata per confronto.

xout

FIGURA

Non lineare

xin

xin

t

(a) Lineare xout = K xin

(b) Non lineare xout = K (xin + εx 2in)

Lineare

finora, abbiamo supposto che tutto fosse lineare, che le risposte alle forze, diciamo gli spostamenti o le accelerazioni, fossero sempre proporzionali alle forze. Oppure che le correnti nei circuiti fossero proporzionali alle tensioni, e così via. Ora desideriamo considerare casi in cui non c’è una stretta proporzionalità. Pensiamo, al momento, a qualche dispositivo in cui la risposta, che chiameremo x out al tempo t, sia determinata dall’entrata x in al tempo t. Per esempio, x in potrebbe essere la forza e x out potrebbe essere lo spostamento. Oppure x in potrebbe essere la corrente e x out la tensione. Se il dispositivo è lineare, avremmo x out (t) = K x in (t)

(50.24)

dove K è una costante indipendente da t e x in . Supponiamo che il dispositivo sia quasi, ma non esattamente, lineare, così che possiamo scrivere f g x out (t) = K x in (t) + ✏ x 2in (t) (50.25)

dove ✏ è piccolo rispetto all’unità. Tali risposte lineari e non lineari sono mostrate nel grafico della FIGURA 50.4. Le risposte non lineari hanno parecchie importanti conseguenze pratiche. Ne discuteremo alcune ora. Per prima cosa consideriamo che accade se applichiamo all’ingresso un tono puro. Facciamo sì che x in = cos(!t). Se riportiamo in grafico x out in funzione del tempo otteniamo la curva a tratto continuo mostrata nella FIGURA 50.5. La curva tratteggiata dà, per confronto, la risposta di un sistema lineare. Vediamo che l’uscita non è più una funzione coseno. È più accentuata in cima e più piatta in basso. Diciamo che l’uscita è distorta. Sappiamo, tuttavia, che un’onda del genere non è più un tono puro, che avrà delle armoniche. Possiamo trovare quali sono le armoniche. Usando x in = cos(!t) con l’equazione (50.25), abbiamo f g x out (t) = K cos (!t) + ✏ cos2 (!t) (50.26)

Dall’uguaglianza cos2 ✓ = [1 + cos(2✓)]/2, abbiamo  ✏ ✏ x out (t) = K cos (!t) + + cos (2!t) (50.27) 2 2 L’uscita ha non soltanto una componente alla frequenza fondamentale, che era presente all’ingresso, ma ha anche un po’ della sua seconda armonica. All’uscita è apparso anche un termine costante K(✏/2), che corrisponde allo spostamento del valore medio, mostrato in FIGURA 50.5. Il processo di produrre uno spostamento del valore medio è chiamato rettificazione. Una risposta non lineare rettificherà e produrrà armoniche delle frequenze al suo ingresso. Sebbene la non linearità che abbiamo assunto abbia prodotto soltanto seconde armoniche, non linearità di ordine più elevato – quelle che hanno termini come x 3in e x 4in , per esempio – produrranno armoniche più elevate della seconda. Un altro effetto che risulta da una risposta non lineare è la modulazione. Se la nostra funzione d’ingresso contiene due (o più) toni puri, l’uscita avrà non soltanto le loro armoniche, ma anche altre componenti di frequenza. Sia x in = A cos (!1 t) + B cos (!2 t)

50.6 • Risposte non lineari

© 978-8808-22107-0

dove ora non si intende che !1 e !2 siano in una relazione armonica. In aggiunta al termine lineare (che è K moltiplicato per l’ingresso) avremo una componente all’uscita data da ⇥ ⇤2 x out = K✏ A cos (!1 t) + B cos (!2 t)

ovvero, sviluppando il quadrato, f g x out = K✏ A2 cos2 (!1 t) + B2 cos2 (!2 t) + 2AB cos (!1 t) cos (!2 t)

(50.28)

(50.29)

I primi due termini nella parentesi dell’equazione (50.29) sono proprio quelli che davano i termini costanti e i termini della seconda armonica che abbiamo trovato precedentemente. L’ultimo termine è nuovo. Possiamo considerare questo nuovo «termine misto» AB cos(!1 t) cos(!2 t) in due modi. Primo, se le due frequenze sono largamente differenti (per esempio se !1 è molto maggiore di !2 ) possiamo considerare che il termine misto rappresenti un’oscillazione cosinusoidale di ampiezza variabile. Cioè possiamo pensare i fattori in questo modo: AB cos (!1 t) cos (!2 t) = C(t) cos (!1 t)

(50.30)

C(t) = AB cos (!2 t)

(50.31)

con Diciamo che l’ampiezza di cos(!1 t) è modulata con la frequenza !2 . Alternativamente, possiamo scrivere il termine misto in un altro modo: ⇥ ⇤ ⇥ ⇤ AB ⇢ AB cos (!1 t) cos (!2 t) = cos (!1 + !2 ) t + cos (!1 !2 ) t 2

(50.32)

Ora diremmo che sono state prodotte due nuove componenti, una alla frequenza somma (!1 +!2 ), un’altra alla frequenza differenza (!1 !2 ). Abbiamo due modi diversi, ma equivalenti, di guardare allo stesso risultato. Nel caso particolare in cui !1 !2 , possiamo mettere in relazione questi due diversi punti di vista notando che siccome !1 + !2 e !1 !2 sono vicini l’uno all’altro ci aspetteremmo di osservare battimenti fra di essi. Ma questi battimenti hanno proprio l’effetto di modulare l’ampiezza della frequenza media !1 con metà della frequenza differenza 2!2 . Vediamo, allora, perché le due descrizioni sono equivalenti. Riassumendo, abbiamo trovato che una risposta non lineare produce parecchi effetti: rettificazione, generazione di armoniche e modulazione, ovvero generazione di componenti con frequenze somma e differenza. Dovremmo notare che tutti questi effetti – equazione (50.29) – sono proporzionali non soltanto al coefficiente di non linearità ✏, ma anche al prodotto di due ampiezze: A2 , B2 oppure AB. Ci aspettiamo che questi effetti siano molto più importanti per segnali forti che per segnali deboli. Gli effetti che abbiamo descritto hanno molte applicazioni pratiche. Primo, riguardo al suono, si crede che l’orecchio sia non lineare. Si crede che ciò renda conto del fatto che con suoni intensi abbiamo la sensazione di udire armoniche e anche frequenze somma e differenza, anche se le onde sonore contengono soltanto toni puri. I componenti che si usano nelle apparecchiature atte a riprodurre il suono – amplificatori, altoparlanti ecc. – hanno sempre qualche non linearità. Esse producono distorsioni nel suono – generano armoniche ecc. – che non erano presenti nel suono originario. Queste nuove componenti sono udite dall’orecchio e sono manifestamente sgradevoli. È per questa ragione che le apparecchiature «ad alta fedeltà» sono progettate in modo da essere quanto più lineari possibile. (Perché le non linearità dell’orecchio non siano «sgradevoli» nella stessa maniera, o addirittura come facciamo a sapere che la non linearità si trova nell’altoparlante invece che nell’orecchio, non è chiaro!) Le non linearità sono del tutto necessarie, e sono, in realtà, intenzionalmente aumentate in certe parti delle apparecchiature radio trasmittenti e riceventi. In un trasmettitore a modulazione di ampiezza (AM) il segnale «voce» (con frequenze di alcuni kilocicli al secondo) è combinato col

535

536

Capitolo 50 • Armoniche

© 978-8808-22107-0

segnale «portante» (con una frequenza di alcuni megacicli al secondo) in un circuito non lineare detto modulatore, per produrre l’oscillazione modulata che viene trasmessa. Nel ricevitore, le componenti del segnale ricevuto sono introdotte in un circuito non lineare che combina le frequenze somma e differenza del segnale portante modulato per generare di nuovo il segnale voce. Quando abbiamo discusso la trasmissione della luce, abbiamo assunto che le oscillazioni indotte delle cariche fossero proporzionali al campo elettrico della luce – che la risposta fosse lineare. Questa è veramente un’ottima approssimazione. È accaduto soltanto negli ultimi anni che siano state progettate delle sorgenti luminose (laser) che producono un’intensità di luce abbastanza forte perché possano essere osservati effetti non lineari. È ora possibile generare armoniche delle frequenze della luce. Quando una luce rossa intensa attraversa un pezzo di vetro, esce un poco di luce blu – la seconda armonica!

51

Le onde

51.1

Onde di prua

Pur avendo terminato le nostre analisi quantitative delle onde, questo ulteriore capitolo sull’argomento è inteso a dare, qualitativamente, qualche valutazione di vari fenomeni che sono associati con le onde, e che sono troppo complicati per analizzarli qui in dettaglio. Poiché abbiamo trattato le onde per parecchi capitoli, l’argomento potrebbe essere chiamato più propriamente «alcuni dei fenomeni più complicati associati alle onde». Il primo tema da discutere è relativo agli effetti prodotti da una sorgente di onde che si muove a velocità più alta di quella delle onde, o velocità di fase. Consideriamo prima onde che abbiano una velocità definita, come il suono e la luce. Se abbiamo una sorgente sonora che si muove a velocità più alta di quella del suono, allora accade qualcosa di questo tipo: supponiamo che a un dato istante sia generata un’onda sonora dalla sorgente nel punto r3 r2 r1 x 1 in FIGURA 51.1; allora, nell’istante successivo, mentre la sorgente arriva in x 2 , l’onda si espande da x 1 per un raggio r 1 inferiore alla distanza di cui x1 x2 si muove la sorgente; e, naturalmente, da x 2 parte un’altra onda. Quando la sorgente sonora si è spostata ancora più lontano, in x 3 , e là parte un’onda, l’onda da x 2 si è ora espansa fino a r 2 , e quella da x 1 si è espansa fino a r 3 . Naturalmente la cosa avviene con continuità, non a salti, e quindi abbiamo una serie di onde circolari con una retta tangente comune passante per il centro della sorgente. Vediamo che invece di una sorgente che genera onde sferiche, come farebbe se fosse ferma, essa genera un fronte d’onda che forma un cono in tre dimensioni, o una coppia di rette in due dimensioni. FIGURA 51.1 Il fronte d’onda d’urto giace L’angolo del cono è molto facile da ricavare. In una data quantità di tempo su un cono con vertice nella sorgente la sorgente percorre una distanza, diciamo x 3 x 1 , proporzionale a v, la e semiangolo ✓ = sen 1 (cw /v). velocità della sorgente. Nel frattempo il fronte d’onda ha percorso una distanza r 3 , proporzionale a cw , la velocità dell’onda (wave). Quindi è chiaro che l’angolo di semiapertura ha un seno uguale al rapporto della velocità delle onde diviso per la velocità della sorgente, e questo seno ha una soluzione soltanto se cw è inferiore a v, ossia se la velocità dell’oggetto è maggiore della velocità dell’onda: sen ✓ =

cw v

(51.1)

Incidentalmente, pur avendo ammesso implicitamente che sia necessario avere una sorgente sonora, risulta, in modo molto interessante, che una volta che l’oggetto si muova più rapidamente della velocità del suono, esso produrrà suono. Cioè, non è necessario che esso abbia un carattere vibrazionale con un certo tono. Qualsiasi oggetto che si muove attraverso un mezzo più rapidamente della velocità alla quale il mezzo trasporta le onde, genererà onde da entrambe le parti, automaticamente, proprio per il moto stesso. Ciò è semplice nel caso del suono, ma accade anche nel caso della luce. A prima vista si potrebbe pensare che nulla si possa muovere più rapidamente della luce. Tuttavia, la luce nel vetro ha una velocità di fase inferiore alla velocità della luce nel vuoto, ed è possibile sparare una particella carica con energia molto elevata attraverso un blocco

x3

v

538

Capitolo 51 • Le onde

© 978-8808-22107-0

di vetro in modo che la velocità della particella sia vicina alla velocità della luce nel vuoto, mentre la velocità della luce nel vetro può essere soltanto 2/3 della velocità della luce nel vuoto. Una particella che si muova più rapidamente della luce nel mezzo produrrà un’onda conica di luce con il vertice nella sorgente, come la scia d’onde lasciata da una barca (che deriva dallo stesso effetto, in realtà). Misurando l’angolo del cono, possiamo determinare la velocità della particella. Ciò si usa tecnicamente per determinare la velocità delle particelle, come uno dei metodi per determinare la loro energia, nelle ricerche di alta energia. Tutto ciò che bisogna misurare è la direzione della luce. Questa luce viene chiamata qualche volta radiazione Cerenkov, perché è stata osservata per la prima volta da Cerenkov. Quanto dovrebbe essere intensa questa luce è stato analizzato teoricamente da Frank e Tamm. Per questo lavoro è stato assegnato congiuntamente a tutti e tre il premio Nobel per la fisica del 1958. Le circostanze corrispondenti nel caso del suono sono illustrate in FIGURA 51.2, che è una fotografia di un oggetto in moto attraverso un gas a una velocità superiore alla velocità del suono. Le variazioni di pressione producono una variazione dell’indice di rifrazione, e con un sistema ottico adatto si possono rendere visibili i bordi delle onde. Vediamo che l’oggetto che si muove più rapidamente della velocità del suono produce, in realtà, un’onda conica. Ma un’osservazione più attenta rivela che la superficie è in realtà curva. È diritta asintoticamente, ma è curva vicino al vertice, e ora dobbiamo discutere come possa accadere, il che ci porta al secondo FIGURA 51.2 Onda d’urto indotta in un gas da un proiettile che si muove più velocemente del suono. argomento di questo capitolo.

51.2

Onde d’urto

La velocità delle onde spesso dipende dall’ampiezza, e nel caso del suono la velocità dipende dall’ampiezza nel modo seguente. Un oggetto in moto attraverso l’aria deve rimuovere l’aria dalla sua strada, così la perturbazione prodotta in questo caso è una specie di gradino di pressione, con la pressione dietro al fronte d’onda più elevata che nella regione indisturbata non ancora raggiunta dall’onda (che si muove alla velocità normale, diciamo). Ma l’aria che è lasciata indietro, dopo il passaggio del fronte d’onda, è stata compressa adiabaticamente e quindi la temperatura è aumentata. Ora, la velocità del suono cresce con la Pressione temperatura, così la velocità nella regione dietro al salcw c c c to è maggiore che nell’aria che sta davanti. Ciò signib b b fica che qualsiasi altra perturbazione si produca dietro a a a t1 t2 > t1 t3 > t2 questo gradino, diciamo dalla continua spinta del corDistanza po, o qualunque altra perturbazione, si muoverà più velocemente che davanti, dato che la velocità aumenta FIGURA 51.3 «Istantanee» del fronte d’onda in successivi istanti di tempo. con l’aumentare della pressione. La FIGURA 51.3 illustra la situazione, con alcune piccole gobbe di pressione aggiunte al contorno della pressione per una migliore visualizzazione. Vediamo che le regioni di maggior pressione posteriori superano le anteriori al passare del tempo, finché alla fine l’onda di compressione sviluppa un fronte netto. Se l’intensità è molto elevata, «alla fine» significa subito; se è piuttosto debole, occorre molto tempo; può accadere, infatti, che il suono si diffonda e muoia prima di avere il tempo di far questo. I suoni che emettiamo nel parlare sono estremamente deboli rispetto alla pressione atmosferica – soltanto una parte su un milione circa. Ma per variazioni di pressione dell’ordine di 1 atmosfera, la velocità dell’onda aumenta di circa il 20% e il fronte d’onda diventa netto con una rapidità corrispondentemente elevata. In natura non accade nulla in modo infinitamente rapido, e ciò che chiamiamo fronte «netto» ha, in realtà, uno spessore molto esile; non è infinitamente ripido. Le distanze sulle quali varia sono dell’ordine di un cammino libero medio, in cui la teoria

© 978-8808-22107-0

51.2 • Onde d’urto

dell’equazione dell’onda comincia a far difetto perché non abbiamo considerato la struttura del gas. Ora, riferendoci di nuovo alla FIGURA 51.2, vediamo che si può comprendere la curvatura se ci rendiamo conto che le pressioni vicino al vertice sono più elevate di quanto non lo siano più indietro, e così l’angolo ✓ è maggiore. Cioè, la curva è il risultato del fatto che la velocità dipende dall’intensità dell’onda. Pertanto l’onda dell’esplosione di una bomba atomica per un po’ viaggia molto più velocemente della velocità del suono, finché non giunge così lontano che è indebolita per la diffusione a tal punto che il picco di pressione è piccolo rispetto alla pressione atmosferica. La velocità della perturbazione allora si avvicina alla velocità del suono nel gas in cui si muove. (Incidentalmente, risulta sempre che la velocità dell’onda d’urto è più elevata della velocità del suono nel gas davanti, ma è inferiore alla velocità del suono nel gas dietro. Cioè, da dietro arriveranno impulsi sul fronte, ma il fronte avanza sul mezzo in cui si muove più velocemente della velocità normale dei segnali. Così non ci si può rendere conto, con l’udito, che giungerà l’urto se non quando è troppo tardi. La luce della bomba arriva prima, ma non si può dire che stia arrivando l’urto finché non arriva, perché non c’è alcun segnale acustico che arrivi prima di esso.) È un fenomeno molto interessante, questo accumularsi di onde, e il punto fondamentale dal quale dipende è che, dopo che è presente un’onda, la velocità dell’onda risultante dovrebbe essere più elevata. Un altro esempio dello stesso fenomeno è il seguente. Consideriamo dell’acqua che scorre in un lungo canale di larghezza finita e profondità finita. Se un pistone, o una parete attraverso il canale, viene mosso lungo il canale abbastanza velocemente, l’acqua si accumula come la neve davanti a uno spazzaneve. Ora supponiamo che la situazione sia come mostrato in FIGURA 51.4, con un gradino improvviso nell’altezza dell’acqua in qualche punto del canale. Si può dimostrare che le onde lunghe in un canale viaggiano più velocemente nell’acqua più profonda che nell’acqua bassa. Quindi qualunque perturbazione o irregolarità nell’energia fornita dal pistone corre avanti e si accumula sul fronte. Di nuovo ciò che abbiamo alla fine, teoricamente, è proprio acqua con un fronte netto. Tuttavia, come mostra la FIGURA 51.4, ci sono complicazioni. Quella fotografata è un’onda che percorre un canale; il pistone è all’estremità destra del canale. All’inizio avrebbe potuto apparire come un’onda «educata», come ci si poteva aspettare, ma più avanti lungo il canale, è diventata sempre più netta finché non si sono verificati gli eventi rappresentati. C’è un terribile ribollimento alla superficie, man mano che l’acqua cade giù, ma essenzialmente c’è un FIGURA 51.4 Onda («cavallone») in un canale innalzamento di livello molto netto senza alcuna perturbazione dell’acqua provocato dall’avanzare veloce di un pistone. nella zona in avanti. In realtà l’acqua è molto più complicata del suono. Tuttavia, soltanto v per illustrare un punto, tenteremo di analizzare la velocità di un, cosiddetto, u cavallone in un canale. Il punto qui non è che questo sia di qualche fondamentale importanza per i nostri scopi – non è una grande generalizzazione – h2 è solo per illustrare che le leggi della meccanica che già conosciamo sono in grado di spiegare il fenomeno. Immaginiamo, per un momento, che l’acqua h1 abbia l’aspetto della FIGURA 51.5a, che l’acqua all’altezza più elevata h2 si v∆t u∆t muova con una velocità v, e che il fronte si muova con velocità u nell’acqua indisturbata che è all’altezza h1 . Vorremmo determinare la velocità alla quale si muove il fronte. In un tempo t un piano verticale inizialmente in x 1 percorre una distanza v t fino a x 2 , mentre il fronte dell’onda si è mosso di u t. Applichiamo ora le equazioni della conservazione della materia e della quantità di moto. Anzitutto, la prima: per unità di larghezza x1 x2 x3 x4 del canale, vediamo che la quantità h2 v t di materia che si è spostata oltre x 1 (mostrata tratteggiata) è compensata dall’altra regione tratteggiata, che ammonta a (h2 h1 )u t. Così, dividendo per t, si ha vh2 = u(h2 h1 ). FIGURA 51.5 Due sezioni trasversali Ciò non ci dà ancora abbastanza, perché, sebbene abbiamo h2 e h1 , non di un «cavallone» in un canale conosciamo né u né v; tentiamo di ottenerli entrambi. con (b) successivo ad (a) di un intervallo �t.

539

(a)

(b)

540

Capitolo 51 • Le onde

© 978-8808-22107-0

Ora il prossimo passo è di far uso della conservazione della quantità di moto. Non abbiamo discusso il problema della pressione dell’acqua, né nulla di idrodinamica, ma è chiaro in ogni caso che la pressione dell’acqua a una data profondità è giusto sufficiente a sostenere la colonna d’acqua sovrastante. Quindi la pressione dell’acqua è uguale a ⇢, la densità dell’acqua, moltiplicata per g, per la profondità sotto la superficie. Poiché la pressione aumenta linearmente con la profondità, la pressione media sul piano x 1 , diciamo, è (1/2)⇢gh2 , che è anche la forza media, per unità di larghezza e per unità di altezza, che spinge il piano verso x 2 . Così moltiplichiamo per un altro h2 per ottenere la forza totale che agisce sull’acqua spingendo da sinistra: (1/2)⇢gh22 . D’altra parte nell’acqua c’è pressione anche sulla destra, ed essa esercita una forza opposta sulla regione in questione, che è, con lo stesso tipo di analisi, (1/2)⇢gh12 . Ora dobbiamo bilanciare le forze con la rapidità di variazione della quantità di moto. Quindi dobbiamo ricavare quanta quantità di moto in più c’è nella situazione di FIGURA 51.5b rispetto alla FIGURA 51.5a. Vediamo che l’ulteriore massa che ha acquistato la velocità v è proprio ⇢h2 u t ⇢h2 v t (per unità di larghezza), e moltiplicando questa massa per v si ha la quantità di moto addizionale da uguagliare all’impulso F t: ! ⇣ ⌘ 1 1 2 2 ⇢h2 u t ⇢h2 v t v = ⇢gh2 ⇢gh1 t 2 2 Se eliminiamo v da questa equazione sostituendo vh2 = u(h2 h1 ), già trovato, e semplifichiamo, otteniamo in definitiva h2 (h1 + h2 ) u2 = g 2h1

Se la differenza delle altezze p è molto piccola, così che h1 e h2 risultino quasi uguali, ciò dice che la velocità è uguale a gh. Come vedremo più tardi, ciò è vero soltanto purché la lunghezza d’onda dell’onda sia maggiore della profondità del canale. Potremmo procedere in modo analogo anche per le onde sonore – includendo la conservazione dell’energia interna, non la conservazione dell’entropia, perché l’onda d’urto è irreversibile. In realtà, se si verifica la conservazione dell’energia nel problema del cavallone, si trova che l’energia non si conserva. Se la differenza d’altezza è piccola, si conserva quasi perfettamente, ma appena la differenza d’altezza diventa molto apprezzabile, c’è una perdita netta d’energia. Ciò si manifesta nell’acqua che cade e nel ribollimento mostrati nella FIGURA 51.4. Nelle onde d’urto c’è una corrispondente perdita apparente di energia, dal punto di vista delle reazioni adiabatiche. L’energia dell’onda sonora, dietro l’onda d’urto, va a riscaldare il gas dopo che è passata l’onda d’urto, in corrispondenza al ribollire dell’acqua nel cavallone. Nel ricavarlo, per la soluzione risultano necessarie tre equazioni nel caso del suono, e la temperatura dietro l’onda d’urto non è uguale alla temperatura davanti, come abbiamo visto. Se tentiamo di produrre un cavallone che sia rovesciato (h2 < h1 ), allora troviamo che la perdita di energia al secondo è negativa. Poiché non vi è energia disponibile da nessuna parte, questo cavallone non può mantenersi; è instabile. Se dovessimo far partire un’onda di questo genere, essa si appiattirebbe, perché la dipendenza della velocità dall’altezza che aveva il risultato di rendere netto il fronte d’onda nel caso che abbiamo discusso, ora avrebbe l’effetto opposto.

51.3

Onde nei solidi

Il tipo successivo di onde da discutere sono le onde più complicate nei solidi. Abbiamo già discusso le onde sonore nel gas e nel liquido, e c’è una diretta analogia con l’onda sonora in un solido. Se si applica a un solido una spinta improvvisa, esso viene compresso. Esso resiste alla compressione e parte un’onda analoga al suono. Tuttavia esiste un altro tipo di onda che è possibile in un solido, e che non è possibile in un fluido. Se un solido viene distorto spingendolo lateralmente (deformazione di taglio), allora esso tenta di tornare a posto. Questo è per definizione ciò che distingue un solido da un liquido: se distorciamo un liquido (internamente), e lo teniamo un minuto così che si calmi, e poi lo lasciamo

© 978-8808-22107-0

51.3 • Onde nei solidi

andare, rimarrà in quel modo, ma se prendiamo un solido e lo spingiamo, come deformare un pezzo di «Jello»(1) , e lo lasciamo andare, esso fa un salto indietro e dà origine a un’onda di deformazione, che viaggia nello stesso modo in cui viaggiano le compressioni. In tutti i casi, la velocità dell’onda di deformazione è minore della velocità delle onde longitudinali. Le onde di deformazione sono alquanto più analoghe, per quanto riguarda la loro polarizzazione, alle onde luminose. Il suono non ha polarizzazione, è soltanto un’onda di pressione. La luce ha un’orientazione caratteristica perpendicolare alla sua direzione di propagazione. In un solido, le onde sono di entrambi i tipi. Primo, c’è un’onda di compressione, analoga al suono, che va a una velocità. Se il solido non è cristallino, allora un’onda di deformazione polarizzata in una qualsiasi direzione si propagherà a una velocità caratteristica. (Naturalmente tutti i solidi sono cristallini, ma se facciamo uso di un blocco costituito di microcristalli con tutte le orientazioni, allora le anisotropie dei cristalli vengono mediate e scompaiono.) Un’altra questione interessante relativa alle onde sonore è la seguente: che cosa accade se la lunghezza d’onda in un solido diventa più corta, e più corta, e più corta? Quanto può diventare corta? È interessante osservare che non può diventare più corta della distanza fra gli atomi, perché se si suppone di avere un’onda nella quale un punto va su e il seguente giù ecc., la lunghezza d’onda più corta possibile è chiaramente la distanza fra gli atomi. In termini dei modi di oscillazione, diciamo che ci sono modi longitudinali, e modi trasversali, modi con onde lunghe, modi con onde corte. Quando consideriamo lunghezze d’onda paragonabili alla distanza fra gli atomi, allora le velocità non sono più costanti; c’è un effetto di dispersione in cui la velocità non è indipendente dal numero d’onde. Ma, alla fine, il modo di oscillazione più elevato delle onde trasversali sarebbe quello in cui ogni atomo fa l’opposto degli atomi vicini. Ora, dal punto di vista degli atomi, la situazione è simile ai due pendoli di cui abbiamo parlato, per i quali ci sono due modi di oscillazione, uno in cui entrambi vanno insieme, e l’altro in cui si allontanano. È possibile analizzare in un altro modo le onde nei solidi, in termini di un sistema di oscillatori armonici accoppiati, come un enorme numero di pendoli col modo di oscillazione più elevato tale che oscillano in opposizione, e modi più bassi con differenti relazioni di fase. Le lunghezze d’onda più corte sono così corte che di solito non sono tecnicamente accessibili. Tuttavia sono di grande interesse perché, nella teoria della termodinamica di un solido, le proprietà termiche di un solido, per esempio i calori specifici, possono essere analizzate in funzione delle proprietà delle onde sonore corte. Andando all’estremo delle onde sonore di lunghezza d’onda sempre più corta, necessariamente si giunge ai movimenti individuali degli atomi; alla fine le due cose sono uguali. Un esempio molto interessante di onde sonore in un solido, sia longitudinali sia trasversali, sono le onde che si propagano nella terra solida. Non sappiamo chi provoca i rumori, ma all’interno della Terra, di tanto di tanto, ci sono terremoti – qualche roccia scivola oltre qualche altra roccia. Questo è come un piccolo rumore. Così da tale sorgente partono onde simili alle onde sonore con lunghezze d’onda molto più lunghe di quelle che si considerano di solito nelle onde sonore, ma sono ancora onde sonore, e si propagano intorno nella Terra. La Terra non è omogenea, tuttavia, e le proprietà di pressione, densità, compressibilità, e così via, variano con la profondità, e quindi la velocità varia con la profondità. Quindi le onde non si propagano in linee rette – c’è una sorta di indice di rifrazione ed esse si propagano in linee curve. Le onde longitudinali e le onde trasversali hanno velocità diverse, così ci sono soluzioni differenti per le differenti velocità. Pertanto se poniamo un sismografo da qualche parte e osserviamo il modo in cui l’oggetto si muove dopo che si è verificato un terremoto da qualche altra parte, non otteniamo soltanto un moto irregolare. Potremmo ottenere un movimento a piccoli scatti, e un acquietamento, e poi un altro movimento a piccoli scatti – ciò che accade dipende dalla localizzazione. Se è abbastanza vicina, prima riceviamo le onde longitudinali della vibrazione e poi, pochi momenti dopo, le onde trasversali, dato che viaggiano più lentamente. Misurando la differenza di tempo fra le due, possiamo dire quanto lontano è il terremoto, se conosciamo abbastanza le velocità e la composizione delle regioni interne coinvolte.

(1)

Tipo di gelatina di frutta, molto diffusa negli Stati Uniti. (N.d.T.)

541

Capitolo 51 • Le onde

542 FIGURA

© 978-8808-22107-0

51.6

Rappresentazione schematica della Terra, che mostra i percorsi delle onde sonore longitudinali e trasversali.

PP Sorgente

S

P

Stazione

PcP SKS PKP

PKKP

PKPPKP

Longitudinale (P,K)

Trasversale (S)

Un esempio del tipo di comportamento delle onde nella Terra è mostrato nella FIGURA 51.6. I due tipi di onde sono rappresentati da simboli differenti. Se ci fosse un terremoto nel posto indicato con «sorgente», le onde trasversali e longitudinali arriverebbero alla stazione a tempi diversi per le strade più dirette, e ci sarebbero anche riflessioni e discontinuità, che si risolverebbero in altri percorsi e tempi. Risulta che nella Terra c’è un nucleo che non trasporta onde trasversali. Se la stazione è opposta alla sorgente, le onde trasversali arriveranno, ma il tempo non è giusto. Ciò che accade è che l’onda trasversale giunge al nucleo, e tutte le volte che le onde trasversali arrivano a una superficie che è obliqua, fra due materiali, vengono generate due nuove onde, una trasversale e una longitudinale. Ma dentro al nucleo della Terra, un’onda trasversale non si propaga (o almeno non c’è evidenza per essa, ma soltanto per un’onda longitudinale); viene fuori di nuovo in entrambe le forme e giunge alla stazione. È dal comportamento di queste onde sismiche che è stato determinato che le onde trasversali non si possono propagare dentro il cerchio interno. Ciò significa che il centro della Terra è liquido, nel senso che non può propagare onde trasversali. L’unico modo in cui sappiamo che cosa c’è all’interno della Terra è studiando i terremoti. Così, facendo uso di un gran numero di osservazioni di molti terremoti in differenti stazioni, sono stati ricavati i dettagli – la velocità, le curve ecc. sono tutte note. Sappiamo quali sono le velocità dei vari tipi di onde a ogni profondità. Conoscendo questo, quindi, è possibile ricavare quali sono i modi di oscillazione normali della Terra, perché conosciamo la velocità di propagazione delle onde sonore – in altre parole le proprietà elastiche di entrambi i tipi di onde a ogni profondità. Supponiamo che la Terra venga deformata in un ellissoide e lasciata andare. La determinazione del periodo e della forma di un modo di oscillazione libero è soltanto questione di sovrapporre le onde che viaggiano intorno all’ellissoide. Abbiamo calcolato che se c’è una perturbazione, c’è una grande quantità di modi di oscillazione, dal più basso, che è ellissoidale, ai modi più elevati con più strutture. Il terremoto nel Cile del maggio 1960 fece un «rumore» forte a sufficienza perché i segnali andassero molte volte attorno alla Terra, e nuovi sismografi di grande sensibilità erano stati costruiti appena in tempo per determinare le frequenze dei modi di oscillazione fondamentali della Terra e per confrontarle con i valori che erano stati calcolati dalla teoria del suono con le velocità note, misurate da terremoti indipendenti. Il risultato di questo esperimento è illustrato nella FIGURA 51.7, che è un grafico dell’intensità del segnale in funzione della frequenza della sua oscillazione (un’analisi di Fourier). Notate che a certe particolari frequenze si riceve molto di più che ad altre frequenze; ci sono massimi molto definiti. Queste sono le frequenze naturali della

51.4 • Onde superficiali

© 978-8808-22107-0

51.7 Potenza in funzione della frequenza registrata dai sismografi a Naña, Perú, e a Isabella, California. La coerenza è una misura dell’accoppiamento fra le stazioni. [Da Benioff, Press e Smith, J. Geoph. Research 66, 605 (1961).] FIGURA

51.8 Analisi ad alta risoluzione di una registrazione dei sismografi, che mostra un doppietto spettrale. FIGURA

Terra, perché queste sono le frequenze principali alle quali la Terra può oscillare. In altre parole, se l’intero moto della Terra è costituito da molti differenti modi di oscillazione, ci aspetteremmo di ottenere, per ogni stazione, perturbazioni irregolari indicanti la sovrapposizione di molte frequenze. Se analizziamo ciò in funzione delle frequenze, dovremmo essere capaci di trovare le frequenze caratteristiche della Terra. Le linee scure verticali della figura sono le frequenze calcolate e troviamo un accordo notevole; accordo dovuto al fatto che la teoria del suono è valida per l’interno della Terra. Un punto molto curioso è rivelato nella FIGURA 51.8, che mostra una misura molto accurata, con migliore risoluzione del modo di vibrazione più basso, il modo ellissoidale della Terra. Notate che non è un singolo massimo, ma doppio, 54,7 minuti e 53,1 minuti – lievemente differenti. La ragione delle due frequenze non era nota al tempo in cui fu misurata, sebbene possa essere stata trovata nel frattempo. Esistono almeno due spiegazioni possibili: una sarebbe che ci può essere asimmetria nella distribuzione della Terra, il che darebbe luogo a due modi di oscillazione simili. Un’altra possibilità, che è ancora più interessante, è questa: immaginate che le onde dalla sorgente girino attorno alla Terra in due direzioni. Le velocità non saranno uguali a causa degli effetti della rotazione della Terra nelle equazioni del moto, dei quali non si è tenuto conto nel fare l’analisi. Il moto in un sistema rotante è modificato dalle forze di Coriolis, e queste possono essere la causa dello sdoppiamento osservato. Relativamente al metodo col quale sono stati analizzati questi terremoti, ciò che si ottiene sul sismografo non è una curva di ampiezza in funzione della frequenza, ma lo spostamento in funzione del tempo, sempre un tracciato molto irregolare. Per trovare l’ammontare di tutte le differenti onde sinusoidali per tutte le diverse frequenze, sappiamo che il trucco è di moltiplicare i dati per un’onda sinusoidale di una data frequenza e integrare, cioè, mediare, e nella media tutte le altre frequenze scompaiono. Le figure erano perciò grafici degli integrali trovati quando i dati venivano moltiplicati per onde sinusoidali, con diverse frequenze, e integrati.

51.4

543

Onde superficiali

Le prossime onde interessanti, che sono facilmente osservabili da chiunque e generalmente usate come esempio di onde nei corsi elementari, sono le onde d’acqua. Come vedremo subito, esse sono il peggiore esempio possibile, perché non sono sotto alcun aspetto simili al suono e alla luce; hanno tutte le complicazioni che le onde possono avere. Iniziamo con le onde lunghe d’acqua nell’acqua profonda. Se si considera l’oceano infinitamente profondo e si produce una perturbazione sulla superficie, si generano onde. Si verificano tutti i tipi di moti irregolari, ma il moto di tipo sinusoidale, con una perturbazione molto piccola, potrebbe assomigliare alle comuni onde lisce dell’oceano che si avvicinano alla spiaggia. Ora, con

544 FIGURA 51.9 Le onde nell’acqua profonda sono formate da particelle che si muovono in cerchi. Si notino gli sfasamenti sistematici da cerchio a cerchio. Come si muoverebbe un oggetto galleggiante?

Capitolo 51 • Le onde

© 978-8808-22107-0

Direzione dell’onda Onda d’acqua

Cresta dell’onda

Cavo dell’onda Le molecole d’acqua si muovono su orbite circolari quando passa l’onda

un’onda del genere, l’acqua, naturalmente, in media sta ferma, ma l’onda si muove. Qual è il moto, è trasversale o longitudinale? Né l’uno né l’altro; non è né trasversale né longitudinale. Sebbene l’acqua in un dato posto sia alternativamente cavo o cresta, non può muoversi semplicemente su e giù, per la conservazione dell’acqua. Cioè, se va giù, dove andrà l’acqua? L’acqua è essenzialmente incomprimibile. La velocità di compressione delle onde – cioè del suono nell’acqua – è molto, molto più elevata, e ora non la consideriamo. Poiché l’acqua non è comprimibile in questa scala, quando una cresta viene giù l’acqua deve allontanarsi dalla regione. Ciò che in realtà accade è che le particelle d’acqua vicino alla superficie si muovono approssimativamente in cerchi. Quando si avvicinano dei cavalloni lisci, una persona che sta a galla su un pneumatico può osservare un oggetto vicino e vederlo muoversi in un cerchio. Così è una mescolanza di longitudinale e trasversale, per aumentare la confusione. A maggiori profondità nell’acqua i movimenti sono cerchi più piccoli finché, ragionevolmente in basso, non vi è più alcun moto (FIGURA 51.9). Trovare la velocità di tali onde è un problema interessante: deve essere qualche combinazione della densità dell’acqua, dell’accelerazione di gravità, che è la forza di richiamo che genera le onde, e probabilmente della lunghezza d’onda e della profondità. Se consideriamo il caso in cui la profondità tenda all’infinito, allora non dipenderà più dalla profondità. Qualunque formula otterremo per la velocità delle fasi delle onde, essa deve combinare i vari fattori per realizzare le dimensioni appropriate, e se tentiamo ciò in vari modi, p troviamo soltanto una maniera di combinare la densità, g e per formare una velocità, cioè g , che non include affatto la densità. In realtà questa formula per la velocità di fase non è del tutto corretta, ma una completa analisi dellapdinamica, nella quale non entreremo, mostra che i fattori sono come li abbiamo, tranne che per 2⇡: r g vfase = (per onde gravitazionali) 2⇡ È interessante osservare che le onde lunghe vanno più velocemente delle onde corte. Così se una barca crea delle onde lontano, perché c’è qualche pilota di automobili da corsa che viaggia in motoscafo, allora dopo un poco le onde giungono sulla spiaggia dapprima con sciacquio lento e poi sempre più rapido, perché le prime onde che arrivano sono lunghe. Al passare del tempo le onde diventano sempre più corte, perché le velocità vanno come la radice quadrata della lunghezza d’onda. Si potrebbe obiettare: «Questo non è giusto, dobbiamo considerare la velocità di gruppo per calcolarlo!». Naturalmente ciò è vero. La formula della velocità di fase non ci dice che cosa arriverà per primo; ciò che ce lo dice è la velocità di gruppo. Così dobbiamo calcolare la velocità di gruppo, e si lascia come problema la dimostrazione che essa è metà della velocità di fase, assumendo che la velocità vada come la radice quadrata della lunghezza d’onda, il che è tutto ciò che è necessario. Anche la velocità di gruppo va come la radice quadrata della lunghezza d’onda. Come può la velocità di gruppo essere metà di quella di fase? Se si osserva il gruppo di onde che sono create da una barca in moto, seguendo una particolare cresta, si trova che essa si muove in avanti nel gruppo e gradualmente diventa più debole e muore nel fronte, e misticamente e misteriosamente, una debole onda dietro si fa strada in avanti e diventa più forte. In breve, le onde si muovono attraverso il gruppo mentre il gruppo si muove soltanto a metà della velocità alla quale si muovono le onde.

51.4 • Onde superficiali

© 978-8808-22107-0

545

Poiché le velocità di gruppo e di fase non sono uguali, allora le onde che sono prodotte da un oggetto in moto non sono più semplicemente un cono, ma un qualche cosa di molto più interessante. Possiamo vederlo in FIGURA 51.10, che mostra le onde prodotte da un oggetto in moto nell’acqua. Notate che ciò è completamente diverso da quello che avremmo per il suono, la cui velocità è indipendente dalla lunghezza d’onda, dove avremmo fronti d’onda soltanto lungo il cono, e propagantisi verso l’esterno. Invece di ciò, abbiamo onde dietro con fronti che si muovono parallelamente al moto della barca, e poi abbiamo piccole onde sui lati ad altri angoli. Questo intero disegno di onde può, con ingegnosità, essere analizzato conoscendo soltanto questo: che la velocità di fase è proporzionale alla radice quadrata della lunghezza d’onda. Il trucco è che il disegno delle onde è stazionario relativamente alla barca (a velocità costante); ogni altro disegno si distaccherebbe dalla barca. Le onde d’acqua che abbiamo considerato finora erano onde lunghe in FIGURA 51.10 La scia di onde di una barca. cui la forza di richiamo è dovuta alla gravità. Ma quando le onde nell’acqua diventano molto corte, la principale forza di richiamo è l’attrazione capillare, cioè, l’energia della superficie, la tensione superficiale. Per le onde di tensione superficiale, risulta che la velocità di fase è s 2⇡T vfase = (per le increspature) ⇢ dove T è la tensione superficiale e ⇢ la densità. È esattamente l’opposto: la velocità di fase tanto è più elevata quanto più corta è la lunghezza d’onda, quando la lunghezza d’onda diventa molto piccola. Quando abbiamo sia l’azione della gravità sia quella capillare, come abbiamo sempre, otteniamo la combinazione di queste due insieme: s Tk g vfase = + ⇢ k dove k=

2⇡

è il numero d’onde. Così la velocità delle onde d’acqua è in realtà molto complicata. La velocità di fase in funzione della lunghezza d’onda è mostrata nella FIGURA 51.11; per onde molto corte è elevata, per onde molto lunghe è elevata e c’è una velocità minima alla quale le onde possono propagarsi. La velocità di gruppo può essere calcolata dalla formula: va a 3/2 della velocità di fase per le increspature e a 1/2 della velocità di fase per le onde di gravità. A sinistra del minimo la velocità di gruppo è più elevata della velocità di fase; a destra, la velocità di gruppo è inferiore alla velocità vfase (cm/s) 100 di fase. Vi è un gran numero di fenomeni interessanti associati con questi fatti. In primo luogo, siccome la velocità di gruppo aumenta così rapidamente al diminuire della lunghezza d’onda, se produciamo una perturbazione ci sarà un estremo più lento della perturbazione che va alla velocità minima con 50 la lunghezza d’onda corrispondente, e poi sul fronte, in moto a velocità più elevata, ci saranno un’onda corta e un’onda molto lunga. È molto difficile vedere quelle lunghe, ma è facile vedere le corte in una vasca d’acqua. Così vediamo che le increspature spesso usate per illustrare onde semplici λ (cm) sono molto interessanti e complicate; non hanno affatto un fronte d’onda 5 10 netto, come accade per onde semplici come il suono e la luce. L’onda principale ha piccole increspature che le corrono avanti. Una perturbazione netta nell’acqua non produce un’onda netta a causa della dispersione. Prima FIGURA 51.11 Velocità di fase in funzione della arrivano le onde molto minute. lunghezza d’onda per l’acqua.

546

Capitolo 51 • Le onde

© 978-8808-22107-0

Incidentalmente, se un oggetto si muove nell’acqua a una certa velocità, risulta un disegno piuttosto complicato, perché tutte le diverse onde vanno a differenti velocità. Si può dimostrare ciò con una bacinella d’acqua e vedere che le più veloci sono le minute onde capillari. Vi sono onde più lente, di un certo tipo, che stanno indietro. Inclinando il fondo, si vede che dove la profondità è minore, è minore la velocità. Se un’onda arriva formando un angolo con la linea di massima pendenza, essa devia e tende a seguire quella linea. In questo modo si possono mostrare varie cose, e concludiamo che le onde sono più complicate nell’acqua che nell’aria. La velocità delle onde lunghe nell’acqua con moti circolari è più bassa quando la profondità è minore, più elevata nell’acqua profonda. Così quando l’acqua si avvicina a una spiaggia dove la profondità diminuisce, le onde FIGURA 51.12 Onda d’acqua. vanno più adagio. Ma dove l’acqua è più profonda, le onde sono più veloci, così otteniamo gli effetti delle onde d’urto. Questa volta, poiché l’onda non è così semplice, le onde d’urto sono molto più contorte, e l’onda si ripiega su se stessa, nel modo familiare mostrato nella FIGURA 51.12. Questo è ciò che accade quando le onde arrivano alla spiaggia e le reali complessità della natura sono ben rivelate in tale circostanza. Nessuno è ancora stato capace di calcolare che forma dovrebbe prendere l’onda quando si rompe. È abbastanza facile quando le onde sono piccole, ma quando diventano grandi e si rompono, allora è molto più complesso. Un’interessante caratteristica relativa alle onde di capillarità si può vedere nelle perturbazioni prodotte da un oggetto in moto attraverso l’acqua. Dal punto di vista proprio dell’oggetto, l’acqua lo oltrepassa, e le onde che alla fine gli si fermano attorno sono sempre le onde che hanno proprio la velocità giusta per stare ferme nell’acqua rispetto all’oggetto. Similmente, attorno a un oggetto in una corrente, con la corrente che fluisce accanto, il disegno delle onde è stazionario, e proprio alle lunghezze d’onda giuste per andare alla stessa velocità dell’acqua che scorre. Ma se la velocità di gruppo è minore della velocità di fase, allora le perturbazioni si propagano all’indietro nella corrente, perché la velocità di gruppo non è completamente sufficiente per tenere dietro alla corrente. Se la velocità di gruppo è maggiore della velocità di fase, il disegno delle onde apparirà davanti all’oggetto. Se si osservano attentamente oggetti in una corrente, si può vedere che ci sono piccole increspature davanti e lunghi «ribollimenti» dietro. Un’altra interessante caratteristica di questo tipo si può osservare nel versare i liquidi. Per esempio, se si versa abbastanza velocemente del latte da una bottiglia, si possono vedere un gran numero di linee che si incrociano da entrambe le parti nella corrente uscente. Sono onde che hanno origine dalla perturbazione ai bordi e che corrono fuori, molto simili alle onde attorno a un oggetto in una corrente. Vi sono effetti da entrambe le parti che producono il disegno incrociato. Abbiamo indagato alcune interessanti proprietà delle onde e le varie complicazioni della dipendenza della velocità di fase dalla lunghezza d’onda, della velocità delle onde dalla profondità, e così via, che producono i fenomeni della natura veramente complessi, e quindi interessanti.

La simmetria nelle leggi fisiche

52.1

52

Operazioni di simmetria

L’argomento di questo capitolo è ciò che possiamo chiamare simmetria nelle leggi fisiche. Abbiamo già discusso certe caratteristiche di simmetria nelle leggi fisiche in relazione all’analisi vettoriale (capitolo 11), alla teoria della relatività (capitolo 16) e alla rotazione (capitolo 20). Perché dovremmo interessarci della simmetria? In primo luogo, la simmetria è affascinante per la mente umana, e a tutti piacciono oggetti o disegni che sono in qualche modo simmetrici. È un fatto interessante che la natura spesso esibisce certi tipi di simmetria negli oggetti che troviamo nel mondo attorno a noi. Forse l’oggetto più simmetrico immaginabile è una sfera, e la natura è piena di sfere – stelle, pianeti, goccioline d’acqua nelle nuvole. I cristalli trovati nelle rocce presentano molti diversi tipi di simmetria, lo studio dei quali ci dice alcune cose importanti intorno alla struttura dei solidi. Anche i mondi animale e vegetale mostrano qualche grado di simmetria, sebbene la simmetria di un fiore o di un’ape non sia così perfetta o così fondamentale quanto è quella di un cristallo. Ma il nostro interesse principale qui non sta nel fatto che gli oggetti TABELLA 52.1 Operazioni di simmetria. della natura sono spesso simmetrici. Piuttosto, desideriamo esaminare alcune delle ancora più notevoli simmetrie dell’universo – le simmetrie che Traslazione nello spazio esistono nelle stesse leggi fondamentali che governano il funzionamento Traslazione nel tempo del mondo fisico. Rotazione di un angolo fisso Primo, cos’è la simmetria? Come può una legge fisica essere «simmetrica»? Il problema di definire la simmetria è un problema interessante e Velocità uniforme in linea retta abbiamo già notato che Weyl ha dato una buona definizione, la sostanza (trasformazione di Lorentz) della quale è che una cosa è simmetrica se c’è qualcosa che possiamo farle Inversione del tempo in modo che dopo che l’abbiamo fatto, essa abbia lo stesso aspetto di prima. Riflessione dello spazio Per esempio, un vaso simmetrico è di tipo tale che se lo riflettiamo o lo ruotiamo, avrà lo stesso aspetto di prima. La questione che desideriamo Scambio di atomi identici o di particelle identiche considerare qui è come possiamo agire sui fenomeni fisici, ovvero su una Fase della meccanica quantistica situazione fisica in un esperimento, lasciando cionondimeno il risultato invariato. Nella TABELLA 52.1 è mostrata una lista delle operazioni conosciute Materia-antimateria (coniugazione di carica) per le quali i diversi fenomeni fisici rimangono invariati.

52.2

Simmetria nello spazio e nel tempo

La prima cosa che potremmo tentare di fare, per esempio, è di traslare il fenomeno nello spazio. Se facciamo un esperimento in una certa regione, e poi costruiamo un altro dispositivo in un altro luogo dello spazio (oppure vi spostiamo l’originale) allora, qualunque cosa accadesse in un dispositivo, con un certo ordine nel tempo, accadrà nello stesso modo se abbiamo predisposto la medesima condizione, con tutta l’attenzione dovuta alle restrizioni che abbiamo citato prima: che tutte quelle caratteristiche dell’ambiente che fanno sì che non si comporti nello stesso modo

548

Capitolo 52 • La simmetria nelle leggi fisiche

© 978-8808-22107-0

siano pure state spostate – abbiamo parlato di come definire quanto dovremmo includere in queste circostanze, e non ritorneremo su questi dettagli. Nello stesso modo, oggi riteniamo pure che lo spostamento nel tempo non avrà alcun effetto sulle leggi fisiche. (Cioè, per quanto ne sappiamo oggi – tutte queste cose sono per quanto ne sappiamo oggi!) Ciò significa che se costruiamo un certo dispositivo e lo facciamo partire a un certo tempo, diciamo giovedì alle 10:00, e poi costruiamo il medesimo dispositivo e lo facciamo partire, diciamo, tre giorni dopo nella medesima condizione, i due dispositivi eseguiranno gli stessi moti esattamente nella stessa maniera in funzione del tempo a prescindere dal tempo di partenza, purché di nuovo, naturalmente, le caratteristiche rilevanti dell’ambiente siano pure modificate appropriatamente nel tempo. Questa simmetria significa, naturalmente, che se uno ha comperato azioni General Motors tre mesi fa, a esse accadrebbe la stessa cosa che se le avesse comperate ora! Dobbiamo stare in guardia anche per le differenze geografiche, perché vi sono naturalmente variazioni nelle caratteristiche della superficie della Terra. Così, per esempio, se misuriamo il campo magnetico in una certa regione e spostiamo il dispositivo in qualche altra regione, esso può non funzionare precisamente nello stesso modo perché il campo magnetico è diverso, ma diciamo che è perché il campo magnetico è associato alla Terra. Possiamo immaginare che se muoviamo l’intera Terra e il dispositivo, ciò non farebbe alcuna differenza nel funzionamento del dispositivo. Un’altra cosa che abbiamo discusso in considerevole dettaglio è la rotazione nello spazio: se ruotiamo un dispositivo di un certo angolo esso funziona altrettanto bene, purché ruotiamo insieme a esso ogni altra cosa pertinente. Infatti, abbiamo discusso il problema della simmetria per rotazione nello spazio con una certa cura nel capitolo 11, e abbiamo inventato un sistema matematico chiamato analisi vettoriale per trattarla il più concisamente possibile. A un livello più avanzato abbiamo avuto un’altra simmetria – la simmetria per velocità uniforme in una linea retta. Ciò è a dire – effetto piuttosto notevole – che se abbiamo un dispositivo funzionante in un certo modo e poi prendiamo il medesimo dispositivo e lo mettiamo in un’automobile, e muoviamo l’intera automobile, più le condizioni ambientali di rilievo, a velocità uniforme in linea retta, allora per quanto riguarda i fenomeni dentro l’automobile non c’è alcuna differenza: tutte le leggi della fisica appaiono le stesse. Sappiamo anche come esprimere ciò in modo più tecnico, e che questo è che le equazioni matematiche delle leggi fisiche debbono rimanere invariate per una trasformazione di Lorentz. In realtà, fu uno studio del problema della relatività che concentrò l’attenzione dei fisici più nettamente sulla simmetria nelle leggi fisiche. Le simmetrie citate sono state tutte di natura geometrica, tempo e spazio essendo più o meno uguali, ma vi sono altre simmetrie di tipo diverso. Per esempio, c’è una simmetria che descrive il fatto che possiamo sostituire un atomo con un altro dello stesso tipo; per dirlo in modo diverso, esistono atomi dello stesso tipo. È possibile trovare gruppi di atomi tali che se intercambiamo una coppia, ciò non provoca alcuna differenza – gli atomi sono identici. Qualunque cosa faccia un atomo di ossigeno di un certo tipo, un altro atomo di ossigeno di quel tipo la farà. Si può dire: «Ciò è ridicolo, è la definizione di tipi uguali!». Questa può essere semplicemente la definizione, ma poi non sappiamo ancora se esistono «atomi dello stesso tipo»; il fatto è che ci sono molti, molti atomi dello stesso tipo. Così significa qualche cosa dire che non provoca alcuna differenza sostituire un atomo con un altro dello stesso tipo. Le cosiddette particelle elementari di cui sono costituiti gli atomi sono pure particelle identiche nel senso precedentemente detto – tutti gli atomi sono uguali; tutti i protoni sono uguali; tutti i pioni positivi sono uguali; e così via. Dopo una lista così lunga di cose che si possono fare senza cambiare i fenomeni, si potrebbe pensare che potremmo fare praticamente qualunque cosa; così diamo alcuni esempi del contrario, proprio per vedere la differenza. Supponiamo di domandarci: «Le leggi fisiche sono simmetriche per un cambiamento di scala?». Supponiamo di costruire un certo dispositivo, e poi di costruire un altro dispositivo cinque volte più grande in ciascuna parte, funzionerà esattamente nello stesso modo? La risposta, in questo caso, è no! Per esempio la lunghezza d’onda della luce emessa dagli atomi dentro una scatola di atomi di sodio e la lunghezza d’onda della luce emessa da un gas di atomi di sodio di volume cinque volte maggiore non è cinque volte più lunga, ma in realtà è esattamente la stessa dell’altra. Così il rapporto fra la lunghezza d’onda e le dimensioni dell’emittente varierà.

© 978-8808-22107-0

52.2 • Simmetria nello spazio e nel tempo

Un altro esempio: ogni tanto nel giornale vediamo fotografie di una grande cattedrale fatta di piccoli fiammiferi – tremendo lavoro d’arte di qualche signore in pensione che continua a incollare insieme fiammiferi. È molto più elaborata e bella di qualunque vera cattedrale. Se immaginassimo che questa cattedrale di legno venisse in realtà costruita, nella scala di una vera cattedrale, vedremmo dov’è il guaio; non durerebbe – l’intera costruzione cadrebbe a causa del fatto che i fiammiferi aumentati di scala non sono abbastanza forti. «Sì», si potrebbe dire, «ma sappiamo anche che quando c’è un’influenza dall’esterno, anch’essa deve essere cambiata in proporzione!». Parliamo della capacità dell’oggetto di resistere alla gravità. Così ciò che dovremmo fare è prima prendere il modello reale di veri fiammiferi e la vera Terra, e allora sappiamo che è stabile. Poi dovremmo prendere la cattedrale più grande e una Terra più grande. Ma allora è anche peggio perché la gravità è aumentata ancora di più! Oggi, naturalmente, comprendiamo il fatto che i fenomeni dipendono dalla scala per il motivo che la materia è di natura atomica, e se costruissimo un dispositivo così piccolo da essere formato soltanto da cinque atomi, chiaramente sarebbe qualcosa di cui non potremmo cambiare la scala su e giù arbitrariamente. La scala di un atomo individuale non è per nulla arbitraria – è completamente definita. Il fatto che le leggi della fisica non restano invariate per un cambiamento di scala fu scoperto da Galileo. Egli si rese conto che le resistenze dei materiali non erano esattamente nella proporzione giusta rispetto alle loro dimensioni, e illustrò questa proprietà che stavamo appunto discutendo, circa la cattedrale di fiammiferi, disegnando due ossa, l’osso di un cane, nella giusta proporzione per sostenere il suo peso, e l’osso immaginario di un «super cane» che sarebbe, diciamo, dieci o cento volte più grosso – quell’osso era un oggetto grosso, solido con proporzioni completamente diverse. Non sappiamo se egli abbia mai portato l’argomento proprio alla conclusione che le leggi della natura debbono avere una scala definita, ma egli fu così colpito da questa scoperta che la considerò altrettanto importante della scoperta delle leggi del moto, perché le pubblicò entrambe nel medesimo volume, intitolato «Su due nuove scienze». Un altro esempio in cui le leggi non sono simmetriche, che conosciamo molto bene, è questo: un sistema in rotazione con una velocità angolare uniforme non dà le stesse leggi apparenti di uno che non sta ruotando. Se facciamo un esperimento e poi poniamo ogni cosa in una nave spaziale e la nave spaziale ruota su se stessa nello spazio vuoto, sola soletta a una velocità angolare costante, il dispositivo non funzionerà nello stesso modo perché, come sappiamo, gli oggetti dentro l’apparecchiatura saranno proiettati verso l’esterno e così via, dalle forze centrifuga o di Coriolis ecc. Infatti possiamo dire che la Terra sta ruotando facendo uso di un cosiddetto pendolo di Foucault, senza guardare all’esterno. Poi citiamo una simmetria molto interessante che è ovviamente falsa, cioè, la reversibilità nel tempo. Le leggi fisiche manifestamente non possono essere reversibili nel tempo, perché, come sappiamo, tutti i fenomeni evidentemente sono irreversibili su larga scala: «Il dito in moto scrive e, dopo avere scritto, passa oltre». Per quanto ne possiamo dire, questa irreversibilità è dovuta al grandissimo numero di particelle coinvolte, e se potessimo vedere le singole molecole, non saremmo capaci di discernere se il meccanismo stava funzionando all’avanti oppure all’indietro. Più precisamente: costruiamo un piccolo dispositivo in cui sappiamo che cosa fanno tutti gli atomi, in cui possiamo osservare il loro moto. Ora costruiamo un altro dispositivo come questo, ma che inizia il suo moto nella condizione finale dell’altro, con tutte le velocità esattamente invertite. Esso eseguirà allora gli stessi moti, ma esattamente a rovescio. In altri termini: se prendiamo un film con sufficiente dettaglio di tutto il meccanismo interno di un pezzo di materiale e lo proiettiamo su uno schermo facendolo andare a rovescio, nessun fisico potrà dire: «Questo è contro le leggi della fisica, sta facendo qualcosa di sbagliato!». Se non vediamo tutti i dettagli naturalmente la situazione sarà perfettamente chiara. Se vediamo l’uovo che schizza sul marciapiede e il guscio che si apre rompendosi, e così via, allora diremo sicuramente: «Questo è irreversibile, perché se facciamo andare il film all’indietro l’uovo si riunirà insieme e il guscio si ricostruirà, e ciò è ovviamente ridicolo!». Ma se guardiamo proprio i singoli atomi; le leggi appaiono completamente reversibili. Questa naturalmente è stata una scoperta molto più difficile da fare, ma apparentemente è vero che le leggi fondamentali della fisica, a un livello microscopico e fondamentale, sono completamente reversibili nel tempo!

549

550

Capitolo 52 • La simmetria nelle leggi fisiche

52.3

© 978-8808-22107-0

Simmetria e leggi di conservazione

Le simmetrie delle leggi fisiche sono molto interessanti a questo livello, ma risultano, alla fine, ancora più interessanti ed eccitanti quando arriviamo alla meccanica quantistica. Per una ragione che non possiamo chiarire al livello della discussione presente – un fatto che la maggior parte dei fisici trova ancora sconcertante, una cosa assai profonda e meravigliosa, è che, nella meccanica quantistica, per ciascuna delle regole di simmetria esiste una corrispondente legge di conservazione; c’è un legame definito fra le leggi di conservazione e le simmetrie delle leggi fisiche. Presentemente possiamo soltanto enunciare questo, senza alcun tentativo di spiegazione. Per esempio, il fatto che le leggi siano simmetriche per traslazione nello spazio, quando aggiungiamo i principi della meccanica quantistica, risulta significare che la quantità di moto si conserva. Che le leggi sono simmetriche per traslazione nel tempo significa, nella meccanica quantistica, che l’energia si conserva. L’invarianza per rotazione di un angolo fissato nello spazio corrisponde alla conservazione del momento della quantità di moto. Questi legami sono cose assai interessanti e meravigliose, fra le cose più belle e profonde della fisica. Incidentalmente, vi sono numerose simmetrie che appaiono nella meccanica quantistica che non hanno l’analogo classico, per le quali non esiste metodo di descrizione nella fisica classica. Una di queste è la seguente: se è l’ampiezza di un qualche processo, sappiamo che il modulo quadrato di è la probabilità che accada il processo. Ora, se qualcun altro dovesse fare i calcoli non con questa , ma con una 0 che differisce semplicemente per un cambiamento di fase (sia una qualche costante, e moltiplichiamo ei per la vecchia ), il modulo quadrato di 0, cioè la probabilità dell’evento, è uguale al modulo quadrato di : 0

= ei

|

02

| = | |2

(52.1)

Quindi le leggi fisiche rimangono invariate se la fase della funzione d’onda è variata di una costante arbitraria. Questa è un’altra simmetria. Le leggi fisiche debbono essere di natura tale che una variazione della fase quanto-meccanica non provochi alcuna differenza. Come abbiamo appena detto, nella meccanica quantistica esiste una legge di conservazione per ogni simmetria. La legge di conservazione che è collegata con la fase quanto-meccanica sembra essere la conservazione della carica elettrica. Nell’insieme questo è un affare molto interessante!

52.4

Riflessioni speculari

La prossima questione che ci interesserà per la maggior parte del resto di questo capitolo, è la questione della simmetria per riflessione nello spazio. Il problema è questo: le leggi fisiche sono simmetriche per riflessione? Possiamo metterla così: supponiamo di costruire un dispositivo, diciamo un orologio, con una gran quantità di ruote, lancette e numeri; esso fa tic-tac, funziona e ha internamente molle caricate. Guardiamo l’orologio nello specchio. La questione non è che aspetto abbia nello specchio. Ma costruiamo in realtà un altro orologio che è esattamente uguale a come il primo appare nello specchio – ogni volta che c’è una vite con una filettatura a destra in uno, usiamo una vite con una filettatura a sinistra nel posto corrispondente dell’altro; dove in uno è segnato «2» sul quadrante, segniamo un «2» sul quadrante dell’altro; ogni molla a spirale è arrotolata in un modo in un orologio e nell’altro modo nell’orologio immagine speculare. Quando abbiamo finito, abbiamo due orologi, entrambi fisici, che hanno l’uno rispetto all’altro la relazione di un oggetto con la sua immagine speculare, sebbene essi siano entrambi oggetti reali, materiali, sottolineiamo. Ora la questione è: se si fanno partire i due orologi nella stessa condizione, con le molle arrotolate a tensioni corrispondenti, i due orologi faranno tic-tac e procederanno, per sempre, come esatte immagini speculari? (Questa è una questione fisica, non una questione filosofica.) La nostra intuizione circa le leggi della fisica suggerirebbe che dovrebbero farlo.

© 978-8808-22107-0

52.4 • Riflessioni speculari

551

Avremmo l’impressione che, almeno nel caso di questi orologi, la riflessione nello spazio fosse una delle simmetrie delle leggi fisiche, che se cambiassimo ogni cosa da «destra» a «sinistra» e quanto al resto lasciassimo tutto come sta, non potremmo stabilire la differenza. Supponiamo, allora, per un momento che questo sia vero. Se è vero, allora sarebbe impossibile distinguere la «destra» e la «sinistra» per mezzo di qualsiasi fenomeno fisico, proprio come, per esempio, è impossibile determinare una particolare velocità assoluta per mezzo di un fenomeno fisico. Così sarebbe impossibile, tramite qualsivoglia fenomeno fisico, definire in modo assoluto ciò che intendiamo per «destra» come opposto di «sinistra», perché le leggi fisiche dovrebbero essere simmetriche. Naturalmente, il mondo non deve essere simmetrico. Per esempio, facendo uso di ciò che possiamo chiamare «geografia», certamente si può definire la «destra». Per esempio, stiamo a New Orleans, guardiamo Chicago, e la Florida è alla nostra destra (quando i nostri piedi stanno sul suolo!). Così con la geografia possiamo definire la «destra» e la «sinistra». Naturalmente, la situazione reale in qualsiasi sistema non deve avere la simmetria di cui stiamo parlando; la questione è se le leggi siano simmetriche – in altre parole, se sia contro le leggi fisiche avere una sfera come la Terra con «terreno sinistrorso» su di essa e una persona come noi che stando in piedi guarda una città come Chicago da un luogo come New Orleans, ma con tutto scambiato intorno, così che la Florida si trova dall’altra parte. Chiaramente non sembra impossibile, non sembra contro le leggi fisiche, che si abbia ogni cosa con la destra scambiata con la sinistra. Un altro punto è che la nostra definizione di «destra» non dovrebbe dipendere dalla storia. Un modo facile di distinguere la destra dalla sinistra è andare in un’officina meccanica e prendere una vite a caso. La previsione è che abbia una filettatura destrorsa – non necessariamente, ma è molto più probabile che la filettatura sia destrorsa che sinistrorsa. Questa è una questione di storia o convenzione, ovvero del modo in cui capita che siano le cose, e di nuovo non è una questione di leggi fondamentali. Come possiamo ben renderci conto, ciascuno avrebbe potuto cominciare fabbricando viti sinistrorse! Così dobbiamo tentare di trovare qualche fenomeno in cui il «verso destrorso» è coinvolto in modo fondamentale. La successiva possibilità che discutiamo è il fatto che la luce polarizzata ruota il suo piano di polarizzazione quando attraversa, diciamo, dell’acqua zuccherata. Come abbiamo visto nel capitolo 33, essa ruota, diciamo, verso destra in una certa soluzione di zucchero. Questo è un modo di definire la «destra», perché possiamo sciogliere dello zucchero nell’acqua e allora la polarizzazione va verso destra. Ma lo zucchero è venuto da cose viventi, e se tentiamo di fabbricare lo zucchero artificialmente, allora scopriamo che esso non ruota il piano di polarizzazione! Ma se poi prendiamo lo stesso zucchero che è fabbricato artificialmente e che non ruota il piano di polarizzazione, e vi mettiamo dei batteri (essi mangiano un po’ di zucchero) e poi filtriamo via i batteri, troviamo che abbiamo ancora zucchero (quasi la metà di quanto ne avevamo prima), e questa volta ruota il piano di polarizzazione, ma nell’altro senso! Sembra molto sconcertante, ma si spiega facilmente. Facciamo un altro esempio: una delle sostanze che è comune a tutte gli esseri viventi e che è fondamentale per la vita è la proteina. Le proteine consistono di catene di amminoacidi. La FIGURA 52.1 mostra il modello di un amminoacido che proviene da una proteina. Questo amminoacido è chiamato alanina, e la disposizione molecolare avrebbe l’aspetto di quella in FIGURA 52.1a se provenisse da una proteina di un reale essere vivente. D’altra parte, se tentiamo di fabbricare alanina da anidride carbonica, etano e ammoniaca (e la possiamo fabbricare, non è una molecola complicata), scopriamo di fabbricare quantità uguali di questa molecola e di quella mostrata in FIGURA 52.1b! La prima molecola, quella che proviene da esseri viventi, è chiamata Lalanina. L’altra, che è uguale chimicamente, in quanto ha gli stessi tipi di atomi e gli stessi collegamenti fra gli atomi, è una molecola «destrorsa», rispetto alla L-alanina «sinistrorsa», ed è detta D-alanina. La cosa interessante è che quando produciamo l’alanina in laboratorio da semplici gas, otteniamo una uguale mescolanza di entrambi i tipi. Tuttavia, l’unica forma che la vita usa è la L-alanina. (Questo non è esattamente vero. Qua e là negli esseri viventi c’è un uso speciale di D-alanina, ma è molto raro. Tutte FIGURA 52.1 (a) L-alanina (a sinistra) e (b) D-alanina le proteine fanno uso esclusivamente di L-alanina.) Ora, se produciamo (a destra).

552

Capitolo 52 • La simmetria nelle leggi fisiche

© 978-8808-22107-0

entrambi i tipi di alanina, e diamo la mescolanza a qualche animale al quale piace «mangiare» o consumare alanina, esso non può usare la D-alanina: usa soltanto la L-alanina; questo è ciò che accadeva al nostro zucchero – dopo che i batteri hanno mangiato lo zucchero che va bene per loro, rimane soltanto il tipo «sbagliato»! (Lo zucchero sinistrorso ha un sapore dolce, ma non uguale a quello dello zucchero destrorso.) Sembrerebbe quindi che i fenomeni della vita permettano una distinzione fra «destra» e «sinistra», o la chimica permetta una distinzione, perché le due molecole sono chimicamente diverse. Ma no, non è così! Fino al punto in cui si possono fare misure fisiche, come misure di energia, delle rapidità delle reazioni chimiche, e così via, i due tipi funzionano esattamente nello stesso modo se trasformiamo anche ogni altra cosa nella sua immagine speculare. Una molecola ruoterà la luce a destra, e l’altra la ruoterà a sinistra precisamente della stessa quantità, attraverso la stessa quantità di fluido. Così, per quanto concerne la fisica, questi due amminoacidi sono ugualmente soddisfacenti. Per quanto comprendiamo le cose oggi, i fondamenti dell’equazione di Schrödinger vogliono che le due molecole si comportino in modi esattamente corrispondenti, così che una è per la destra quello che l’altra è per la sinistra. Ciononostante, nella vita sono tutte di un solo tipo! Si presume che la ragione di ciò sia la seguente. Supponiamo, per esempio, che la vita in qualche modo a un certo momento si trovi in una condizione in cui tutte le proteine in alcuni esseri viventi hanno amminoacidi sinistrorsi, e tutti gli enzimi sono asimmetrici – ogni sostanza negli esseri viventi è asimmetrica, non è simmetrica. Così quando gli enzimi digestivi tentano di cambiare le sostanze chimiche nel cibo da un tipo all’altro, un tipo di sostanza chimica «si adatta» all’enzima, ma l’altro tipo no (come Cenerentola e la scarpetta, a parte il fatto che è un «piede sinistro» che stiamo provando). Per quanto ne sappiamo, in linea di principio, potremmo costruire, per esempio, una rana in cui ogni molecola è rovesciata, ogni cosa è simile all’immagine speculare «sinistra» di una rana autentica; abbiamo una rana sinistrorsa. Questa rana sinistrorsa procederebbe bene per un po’, ma non troverebbe niente da mangiare, perché se inghiotte una mosca, i suoi enzimi non sono fatti per digerirla. La mosca ha il «tipo» sbagliato di amminoacidi (a meno che non le diamo una mosca sinistrorsa). Così per quanto ne sappiamo, i processi chimici e biologici continuerebbero nella stessa maniera se tutto fosse rovesciato. Se la vita è interamente un fenomeno fisico e chimico, possiamo comprendere che le proteine sono tutte fatte come uno stesso cavatappi soltanto partendo dall’idea che proprio all’inizio si formarono, per caso, delle molecole viventi e alcune vinsero. In un qualche luogo, un tempo, una molecola organica fu asimmetrica in un certo modo, e accadde per caso che da questa cosa particolare si evolvesse la «destra» nella nostra particolare geografia; un particolare accidente storico fu unilaterale, e d’allora l’asimmetria si è propagata. Una volta arrivata allo stato in cui si trova ora, naturalmente, continuerà sempre – tutti gli enzimi digeriscono le cose giuste, fabbricano le cose giuste: quando l’anidride carbonica e il vapore d’acqua, e così via, vanno nelle foglie delle piante, gli enzimi che fanno gli zuccheri li fanno asimmetrici perché gli enzimi sono asimmetrici. Se dovesse avere origine più tardi un qualsiasi nuovo tipo di virus o di cosa vivente, esso sopravviverebbe soltanto se potesse «mangiare» il tipo di materia vivente già esistente. Così anch’esso deve essere dello stesso tipo. Non c’è conservazione del numero delle molecole destrorse. Una volta che abbiano avuto inizio, potremmo continuare ad aumentare il numero delle molecole destrorse. La supposizione è, quindi, che nel caso della vita i fenomeni non mostrino una mancanza di simmetria delle leggi fisiche, ma mostrino, al contrario, la natura universale e la comunanza dell’origine ultima di tutti gli esseri viventi della Terra, nel senso descritto sopra.

52.5

Vettori polari e assiali

Andiamo avanti. Osserviamo che in fisica vi sono un gran numero di altri posti in cui abbiamo regole della mano «destra» e della mano «sinistra». In realtà, quando abbiamo studiato l’analisi vettoriale abbiamo imparato le regole della mano destra che dobbiamo usare in modo da far venir fuori correttamente il momento della quantità di moto, il momento della forza, il campo

52.5 • Vettori polari e assiali

© 978-8808-22107-0

553

52.2 Uno spostamento nello spazio e la sua immagine speculare. FIGURA

r

r ω

ω

52.3 Una ruota in moto e la sua immagine speculare. Si noti che il verso del «vettore» velocità angolare non viene invertito. FIGURA

magnetico e così via. La forza su una carica in moto in un campo magnetico, per esempio, è F = qv ⇥ B. In una data situazione, in cui conosciamo F, v e B questa equazione non è sufficiente per definire la rotazione destrorsa? In realtà se andiamo indietro a guardare da dove vengono fuori i vettori, riconosciamo che la «regola della mano destra» era semplicemente una convenzione; era un trucco. Le quantità originarie, come i momenti della quantità di moto e le velocità angolari, e cose di questo tipo, in realtà non erano affatto vettori! Essi sono tutti associati in qualche modo con un certo piano, ed è proprio perché nello spazio ci sono tre dimensioni che possiamo associare la grandezza a una direzione perpendicolare a quel piano. Delle due possibili direzioni abbiamo scelto la direzione «destrorsa». Così se le leggi della fisica sono simmetriche, dovremmo trovare che se un demonio si introducesse in tutti i laboratori di fisica e sostituisse la parola «destra» con «sinistra» in ogni libro in cui sono date «regole della mano destra», e dovessimo invece usare tutte «regole della mano sinistra» uniformemente, ciò non produrrebbe assolutamente alcuna differenza nelle leggi fisiche. Diamo un esempio. Esistono due tipi di vettori. Vi sono vettori «onesti», per esempio un passo r nello spazio. Se nel nostro apparato c’è un pezzo qua e qualcos’altro là, allora in un apparato speculare ci sarà il pezzo immagine e l’immagine del qualcos’altro, e se tracciamo un vettore dal «pezzo» al «qualcos’altro» un vettore è l’immagine speculare dell’altro (FIGURA 52.2). La freccia del vettore cambia orientamento, proprio come l’intero spazio si rigira; un vettore del genere lo chiamiamo vettore polare. Ma l’altro tipo di vettore, che ha a che fare con le rotazioni è di natura differente. Per esempio supponiamo che qualche cosa ruoti in tre dimensioni come mostrato in FIGURA 52.3. Allora se l’osserviamo in uno specchio, ruoterà come indicato, cioè come l’immagine speculare della rotazione originaria. Ora abbiamo concordato di rappresentare la rotazione speculare con la stessa regola, è un «vettore» che, per riflessione, non si rovescia come fa il vettore polare, ma è invertito relativamente ai vettori polari e alla geometria dello spazio; un vettore del genere è chiamato vettore assiale. Se la legge della simmetria per riflessione è vera in fisica, allora deve essere vero che le equazioni debbono essere scritte in modo che se cambiamo il segno di ogni vettore assiale e di ogni prodotto vettoriale di vettori, il che sarebbe ciò che corrisponde alla riflessione, non accadrà nulla. Per esempio, quando scriviamo una formula che dice che il momento della quantità di moto è L = r ⇥ p, questa equazione va bene, perché se andiamo in un sistema di coordinate sinistrorso, cambiamo il senso di L, ma p e r non cambiano; il segno del prodotto vettoriale cambia, dato che dobbiamo cambiare da una regola della mano destra a una regola della mano sinistra. Come altro esempio, sappiamo che la forza su una carica in moto in un campo magnetico è F = qv ⇥ B, ma se cambiamo da un sistema destrorso a uno sinistrorso, siccome si sa che F e v sono vettori polari, il cambiamento di segno richiesto dal prodotto vettoriale deve essere cancellato da un cambiamento di segno in B, il che significa che B deve S N essere un vettore assiale. In altre parole, se facciamo una riflessione del genere, B deve diventare B. Così se cambiamo le coordinate da destrorse B a sinistrorse, dobbiamo anche cambiare i poli dei magneti da nord a sud. Vediamo in un esempio come funziona questo. Supponiamo di avere a a' B' due magneti, come in FIGURA 52.4. Uno è un magnete con le bobine che si avvolgono in un certo senso, e con la corrente in una data direzione. L’altro magnete ha l’aspetto della riflessione del primo magnete in uno specchio FIGURA 52.4 Un magnete e la sua immagine – la bobina si arrotolerà nell’altro senso, ogni cosa che accade dentro alla speculare.

554

Capitolo 52 • La simmetria nelle leggi fisiche

© 978-8808-22107-0

bobina è esattamente rovesciata, e la corrente va come mostrato. Ora, dalle leggi sulla produzione dei campi magnetici, che ancora non conosciamo ufficialmente, ma che molto probabilmente abbiamo imparato al liceo, risulta che il campo magnetico è come mostrato nella figura. In un caso il polo è un polo magnetico sud, mentre nell’altro magnete la corrente va nell’altro senso e il campo magnetico è rovesciato – è un polo magnetico nord. Così vediamo che quando andiamo da sinistra a destra dobbiamo in realtà cambiare da nord a sud! Non importa cambiare nord in sud; anche queste sono mere convenzioni. Parliamo dei fenomeni. Supponiamo ora di avere un elettrone in moto in un campo, diretto verso la pagina. Allora se usiamo la formula della forza, v ⇥ B (ricordate che la carica è negativa), troviamo che l’elettrone devierà nella direzione indicata conformemente alla legge fisica. Così il fenomeno è che abbiamo una bobina con una corrente che va in un senso specificato e un elettrone curva in un certo modo – questa è la fisica – non importa come contrassegniamo ogni cosa. Facciamo ora lo stesso esperimento con uno specchio: mandiamo un elettrone in una direzione corrispondente e ora la forza è rovesciata, se la calcoliamo dalla stessa regola, e questo va molto bene perché i moti corrispondenti sono allora immagini speculari!

52.6

Qual è la destra?

Così il fatto importante è che nello studiare qualsiasi fenomeno esistono sempre due regole della mano destra, o un numero pari di esse, e il risultato netto è che i fenomeni sembrano sempre simmetrici. In breve, quindi, non possiamo distinguere la destra dalla sinistra se non siamo anche capaci di distinguere nord da sud. Tuttavia può sembrare che possiamo distinguere il polo nord di un magnete. Il polo nord dell’ago di una bussola, per esempio, è uno che punta verso nord. Ma naturalmente questa è di nuovo una proprietà locale che ha a che fare con la geografia della Terra; questo è proprio come parlare della direzione in cui si trova Chicago, così non conta. Se abbiamo visto aghi di bussola, possiamo aver notato che il polo che cerca il nord ha una sorta di colore bluastro. Ma ciò è dovuto soltanto all’uomo che ha dipinto il magnete. Questi sono tutti criteri locali, convenzionali. Tuttavia, se un magnete dovesse avere la proprietà che, guardandoci abbastanza attentamente, potessimo vedere che crescono dei piccoli peli sul suo polo nord ma non sul polo sud, se questa fosse la regola generale, ovvero se ci fosse qualsiasi modo unico di distinguere il polo nord dal polo sud di un magnete, allora potremmo dire quale dei due casi avevamo in realtà, e questa sarebbe la fine delle leggi di simmetria per riflessione. Per illustrare ancor più chiaramente l’intero problema, immaginiamo di parlare con un marziano, o con qualcuno molto lontano, per telefono. Non abbiamo la possibilità di mandargli alcun campione reale da esaminare; per esempio, se potessimo inviare della luce, potremmo mandargli della luce polarizzata circolarmente destrorsa a dire: «Questa è luce destrorsa – basta che tu guardi il senso in cui va». Ma non possiamo dargli nulla, possiamo soltanto parlargli. Egli è molto lontano, in qualche strano posto, e non può vedere niente che noi possiamo vedere. Per esempio non possiamo dire: «Guarda l’Orsa maggiore; ora osserva come sono sistemate quelle stelle. Ciò che intendiamo per destra è... ». Possiamo soltanto telefonargli. Ora vogliamo dirgli di noi. Naturalmente prima cominciamo a definire i numeri, e diciamo: «Tic, tic, due, tic, tic, tic, tre... », così che gradualmente possa comprendere un paio di parole, e così via. Dopo un po’ prendiamo familiarità con questo individuo, ed egli chiede: «Che aspetto avete voi?» Cominciamo a descriverci, e diciamo: «Bene, siamo alti sei piedi». Egli dice: «Un momento, cos’è sei piedi?». È possibile dirgli che cosa significa sei piedi? Certamente! Diciamo: «Sai, il diametro degli atomi di idrogeno – noi siamo alti 17 000 000 000 di atomi d’idrogeno!». Ciò è possibile perché le leggi fisiche non sono invarianti per cambiamento di scala, e quindi possiamo definire una lunghezza assoluta. E così definiamo le dimensioni del corpo, e gli diciamo qual è l’aspetto generale – ha delle diramazioni con cinque sporgenze che escono dalle estremità, e così via, ed egli ci segue, e noi finiamo di descrivere che aspetto abbiamo all’esterno, presumibilmente senza incontrare particolari difficoltà. Egli fa perfino un modello di noi mentre procediamo. Egli esclama: «Acciderba, siete certamente individui molto belli; ora che c’è all’interno?».

52.7 • La parità non si conserva!

© 978-8808-22107-0

555

Così cominciamo a descrivere i diversi organi all’interno, e arriviamo al cuore, ne descriviamo accuratamente la forma, e diciamo: «Ora metti il cuore dalla parte sinistra». Egli esclama: «Oh – la parte sinistra?». Ora il nostro problema è di descrivergli da che parte va il cuore senza che egli veda mai nulla di ciò che vediamo, e senza mandargli mai nessun campione di ciò che intendiamo per «destra» – nessun oggetto campione destrorso. Possiamo farlo?

52.7

La parità non si conserva!

Risulta che le leggi della gravitazione, le leggi dell’elettricità e del magnetismo, e le forze nucleari soddisfano tutte il principio della simmetria per riflessione, così queste leggi, o qualunque cosa derivata da esse, non possono essere usate. Ma associato alle molte particelle che si trovano in natura c’è un fenomeno chiamato decadimento beta, o decadimento debole. Uno degli esempi di decadimento debole, in relazione a una particella scoperta circa nel 1954, pose uno strano rompicapo. C’era una certa particella carica che si disintegrava in tre mesoni ⇡, come mostrato schematicamente in FIGURA 52.5. Questa particella, per un po’, venne chiamata mesone ⌧. Nella FIGURA 52.5 vediamo anche un’altra particella che si disintegra in due mesoni; uno deve essere neutro, per la conservazione π– della carica. Questa particella era chiamata mesone ✓. Così da una parte τ+ π+ π+ abbiamo una particella detta ⌧, che si disintegra in tre mesoni ⇡, e una ✓, π0 che si disintegra in due mesoni ⇡. Presto si scoprì che ⌧ e ✓ hanno masse circa uguali; infatti, entro l’errore sperimentale, esse sono uguali. Poi si trovò che l’intervallo di tempo occorrente per disintegrarsi in tre ⇡ e in due FIGURA 52.5 Diagramma schematico della ⇡ è quasi esattamente lo stesso; essi vivono per il medesimo intervallo di disintegrazione di una particella τ+ tempo. Inoltre, ogni volta che si formavano, si formavano nelle medesime e di una particella ✓ + . proporzioni, diciamo, 14% di ⌧ contro 86% di ✓. Chiunque in possesso delle sue facoltà mentali si rende conto immediatamente che debbono essere la stessa particella, che produciamo semplicemente un oggetto che ha due diversi modi di disintegrarsi – non due particelle diverse. Questo oggetto che può disintegrarsi in due modi diversi ha, quindi, la stessa vita media e lo stesso rapporto di produzione (perché questo è semplicemente il rapporto delle probabilità con le quali si disintegra in questi due tipi). Tuttavia, fu possibile dimostrare (e qui non possiamo affatto spiegare come), dal principio della simmetria per riflessione nella meccanica quantistica, che era impossibile che queste provenissero entrambe dalla stessa particella – la stessa particella non poteva disintegrarsi in entrambi questi modi. La legge di conservazione relativa al principio della simmetria per riflessione è qualcosa che non ha l’analogo classico, e così questo tipo di conservazione quanto-meccanica fu chiamata conservazione della parità. Quindi era un risultato della conservazione della parità o, più precisamente, proveniente dalla simmetria per riflessione delle equazioni della meccanica quantistica dei decadimenti deboli, che la medesima particella non poteva disintegrarsi in entrambi i modi; ci doveva essere qualche genere di coincidenza di masse, vite medie e così via. Ma più ciò veniva studiato, più straordinaria diventava la coincidenza, e gradualmente nacque il sospetto che la profonda legge della simmetria per riflessione della natura potesse essere falsa. Come risultato di questo apparente fallimento, i fisici Lee e Yang suggerirono di fare altri esperimenti in decadimenti simili per tentare di verificare se la legge fosse giusta in altri casi. Il primo esperimento del genere fu eseguito dalla signorina Wu della Columbia University, e fu fatto come segue. Facendo uso di un magnete molto forte a una temperatura molto bassa, risulta che un certo isotopo del cobalto, che si disintegra emettendo un elettrone, è magnetico, e se la temperatura è sufficientemente bassa perché le oscillazioni termiche non facciano agitare troppo i magneti atomici, essi si allineano nel campo magnetico. Così gli atomi di cobalto si allineeranno in questo intenso campo. Essi poi si disintegrano, emettendo un elettrone, e si scoprì che quando gli atomi erano allineati in un campo il cui vettore B è diretto verso l’alto, la maggior parte degli elettroni erano emessi in una direzione verso il basso. Se uno non è realmente «informato» sul mondo, un’osservazione del genere non ha per lui alcunché di significativo, ma se si valutano giustamente i problemi e le cose interessanti del mondo,

π+

556

Capitolo 52 • La simmetria nelle leggi fisiche

© 978-8808-22107-0

allora si vede che questa è una scoperta estremamente drammatica: quando poniamo degli atomi di cobalto in un campo magnetico estremamente forte, gli elettroni di disintegrazione vanno giù in numero maggiore che su. Quindi se dovessimo trasferire ciò in un esperimento corrispondente in uno «specchio», in cui gli atomi di cobalto fossero allineati nella direzione opposta, essi sputerebbero i loro elettroni in su, non in giù; l’azione è asimmetrica. Sul magnete sono cresciuti i peli! Il polo sud di un magnete è di un tipo tale che gli elettroni in una disintegrazione tendono ad allontanarsi da esso; ciò distingue, in modo fisico, il polo nord dal polo sud. Dopo questo, furono fatti moltissimi altri esperimenti; la disintegrazione del ⇡ in µ e ⌫; il µ in un elettrone e due neutrini; in questi tempi, la ⇤ in protone e ⇡; la disintegrazione delle ⌃ e molte altre disintegrazioni. In realtà, in quasi tutti i casi in cui si poteva aspettarselo, si è trovato che tutti non obbediscono alla simmetria per riflessione! Fondamentalmente, a questo livello della fisica, la legge della simmetria per riflessione non è corretta. In breve possiamo dire a un marziano dove mettere il cuore; diciamo: «Ascolta, costruisciti un magnete, mettici le bobine, dà corrente, e poi prendi un po’ di cobalto e abbassa la temperatura. Sistema l’esperimento in modo che gli elettroni vadano dai piedi alla testa, allora la direzione in cui si muove la corrente nelle bobine è la direzione che entra in ciò che chiamiamo destra e viene fuori dalla sinistra». Così è ora possibile definire destra e sinistra facendo un esperimento di questo tipo. C’è una gran quantità di altri particolari che furono previsti. Per esempio, risulta che lo spin, il momento della quantità di moto, del nucleo di cobalto prima della disintegrazione è 5 unità di ~ e dopo la disintegrazione è 4 unità. L’elettrone trasporta un momento della quantità di moto di spin, e c’è anche coinvolto un neutrino. Da ciò è facile vedere che l’elettrone deve portare il suo momento della quantità di moto di spin allineato lungo la sua direzione di moto, e il neutrino altrettanto. Così pare che l’elettrone ruoti verso sinistra, e anche questo è stato verificato. In realtà è stato verificato proprio qui al Caltech da Boehm e Wapstra, che gli elettroni ruotano su se stessi soprattutto verso sinistra. (C’erano alcuni altri esperimenti che davano la risposta opposta, ma erano sbagliati!) Il problema successivo, naturalmente, era di trovare la legge della violazione della conservazione della parità. Qual è la regola che ci dice quanto sarà forte la violazione? La regola è questa: si verifica soltanto in queste reazioni molto lente, chiamate decadimenti deboli, e quando si verifica, la regola è che le particelle che portano spin, come l’elettrone, il neutrino, e così via, vengono fuori con uno spin che tende verso sinistra. Questa è una regola asimmetrica; associa un vettore polare velocità a un vettore assiale momento della quantità di moto, e dice che è più probabile che il momento della quantità di moto sia opposto alla velocità piuttosto che concorde con essa. Ora questa è la regola, ma oggi non ne comprendiamo in realtà i perché e i per come. Perché questa è la regola giusta, qual è la ragione fondamentale di essa, e come è collegata a qualsiasi altra cosa? Al momento siamo stati così colpiti dal fatto che questa cosa è asimmetrica che non siamo stati ancora in grado di riprenderci abbastanza per comprendere che cosa significhi rispetto a tutte le altre regole. Tuttavia, l’argomento è interessante, moderno, e ancora insoluto, così sembra appropriato che discutiamo alcune delle questioni associate a esso.

52.8

Antimateria

La prima cosa da fare quando si perde una delle simmetrie è di ritornare immediatamente alla lista delle simmetrie note o supposte e chiedersi se se n’è perduta qualcun’altra. Ora noi non abbiamo menzionato un’operazione della nostra lista, che deve necessariamente essere messa in dubbio, e che è la relazione fra materia e antimateria. Dirac predisse che in aggiunta agli elettroni dovesse esistere un’altra particella, chiamata positrone (scoperta al Caltech da Anderson), che è necessariamente collegata all’elettrone. Tutte le proprietà di queste due particelle obbediscono a certe regole di corrispondenza: le energie sono uguali; le masse sono uguali; le cariche sono opposte; ma, più importante di qualsiasi altra cosa, le due, quando si incontrano, possono annientarsi l’una con l’altra, e liberare la loro intera massa in forma di energia, diciamo raggi . Il positrone è detto

© 978-8808-22107-0

52.8 • Antimateria

antiparticella dell’elettrone, e queste sono le caratteristiche di una particella e della sua antiparticella. Dall’argomento di Dirac era chiaro che tutte le restanti particelle del mondo dovessero pure avere antiparticelle corrispondenti. Per esempio, per il protone ci doveva essere un antiprotone, che ora è simbolizzato da p. ¯ L’antiprotone avrebbe una carica elettrica negativa e la stessa massa del protone, e così via. La caratteristica più importante, tuttavia, è che un protone e un antiprotone che s’incontrino possono annientarsi l’un l’altro. La ragione per cui sottolineiamo questo è che le persone non capiscono quando diciamo che esiste un neutrone e anche un antineutrone, perché dicono: «Un neutrone è neutro, quindi come può avere la carica opposta?». La regola per l’«anti» non è soltanto che abbia la carica opposta, essa ha un certo insieme di proprietà, l’intero insieme delle quali è opposto. L’antineutrone si distingue dal neutrone in questo modo: se accostiamo due neutroni, essi rimangono sempre due neutroni, ma se accostiamo un neutrone e un antineutrone, essi si annichilano l’un l’altro con una grande esplosione di energia che viene liberata, con vari mesoni ⇡, raggi e chissaché. Ora, se abbiamo antineutroni, antiprotoni e antielettroni, in linea di principio possiamo formare degli antiatomi. Non sono ancora stati fatti, ma in linea di principio la cosa è possibile. Per esempio, un atomo d’idrogeno ha al centro un protone e un elettrone che gira intorno all’esterno. Immaginiamo ora di poter formare da qualche parte un antiprotone con un positrone che gira intorno a esso; girerebbe veramente? Ebbene, prima di tutto, l’antiprotone è elettricamente negativo e l’antielettrone è elettricamente positivo, quindi essi si attraggono l’un l’altro in modo corrispondente – le masse sono del tutto uguali; tutto è uguale. Come sembra dimostrino le equazioni, uno dei principi della simmetria della fisica è che se da un lato avessimo un orologio fatto di materia, e poi ne costruissimo un altro uguale di antimateria, andrebbe in questo modo. (Naturalmente, se accostassimo gli orologi, essi si annichilerebbero l’un l’altro, ma ciò è diverso.) Sorge allora una questione immediata. Dalla materia possiamo costruire due orologi, uno dei quali è «sinistrorso» mentre l’altro è «destrorso». Per esempio, potremmo costruire un orologio che non è costruito in maniera semplice, ma ha cobalto, magneti e rivelatori di elettroni che rivelano la presenza di elettroni di decadimento e li contano. Ogni volta che ne viene contato uno, la lancetta dei secondi avanza. Allora l’orologio immagine, ricevendo meno elettroni, non andrà con la stessa rapidità. Così evidentemente possiamo fare due orologi tali che l’orologio sinistrorso non si accorda con quello destrorso. Facciamo, di materia, un orologio che chiamiamo l’orologio campione o destrorso. Facciamo poi, sempre di materia, un orologio che chiamiamo orologio sinistrorso. Abbiamo appena scoperto che, in generale, questi due non andranno nello stesso modo; prima di quella famosa scoperta di fisica si pensava che l’avrebbero fatto. Si supponeva anche che materia e antimateria fossero equivalenti. Cioè che, se avessimo fatto un orologio di antimateria, destrorso, della stessa forma, sarebbe andato nello stesso modo dell’orologio destrorso di materia, e se avessimo fatto lo stesso orologio sinistrorso sarebbe andato nello stesso modo. In altre parole, all’inizio si credeva che tutti e quattro questi orologi fossero uguali; ora sappiamo naturalmente che la materia destrorsa e quella sinistrorsa non sono uguali. Presumibilmente quindi l’antimateria destrorsa e quella sinistrorsa non sono uguali. Così la questione ovvia è, quali vanno assieme, se pure ve ne sono? In altre parole, la materia destrorsa si comporta nello stesso modo dell’antimateria destrorsa? Oppure la materia destrorsa si comporta come l’antimateria sinistrorsa? Esperimenti con decadimenti , che fanno uso di decadimenti in positrone invece che in elettrone, indicano che l’interconnessione è questa: la materia «destrorsa» funziona nella stessa maniera dell’antimateria «sinistrorsa». Quindi, alla fine, è in realtà vero che la simmetria destra e sinistra è ancora conservata! Se facessimo un orologio sinistrorso, ma lo facessimo dell’altro tipo di materia, antimateria invece di materia, andrebbe nello stesso modo. Così ciò che è accaduto è che invece di avere due regole indipendenti, nella nostra lista di simmetrie, due di queste regole si uniscono a formare una nuova regola, la quale dice che la materia destrorsa è simmetrica rispetto all’antimateria sinistrorsa. Così se il nostro marziano è fatto di antimateria e gli diamo istruzioni di fare questo modello «destrorso» simile a noi, naturalmente risulterà nell’altro senso. Che cosa accadrebbe quando, dopo molti reciproci discorsi, ci fossimo insegnati a vicenda come costruire navi spaziali e ci incontrassimo a mezza strada nello spazio vuoto? Ci siamo istruiti l’un l’altro sulle nostre abitudini, e così via, ed entrambi ci precipitiamo fuori per stringerci la mano. Beh, se porge la mano sinistra, sta in guardia!

557

558

Capitolo 52 • La simmetria nelle leggi fisiche

52.9

© 978-8808-22107-0

Simmetrie rotte

La questione successiva è: che ne possiamo fare di leggi che sono quasi simmetriche? La cosa meravigliosa di tutto ciò è che per una così ampia gamma di importanti fenomeni forti – forze nucleari, fenomeni elettrici e persino forze deboli come la gravitazione – in un’enorme estensione della fisica, tutte le leggi che li riguardano sembrano essere simmetriche. D’altro canto, questa ulteriore piccola aggiunta dice: «No, le leggi non sono simmetriche!». Come mai la natura può essere quasi simmetrica, ma non perfettamente simmetrica? Come la mettiamo? Primo, abbiamo qualche altro esempio? La risposta è, abbiamo, in realtà, alcuni altri esempi. Per esempio, la parte nucleare della forza fra protone e protone, fra neutrone e neutrone, e fra neutrone e protone, è assolutamente la stessa – c’è una simmetria per le forze nucleari, una nuova simmetria, per cui possiamo scambiare neutrone e protone – ma non è evidentemente una simmetria generale, poiché la repulsione elettrica a distanza fra due protoni non esiste per i neutroni. Così non è vero in generale che possiamo sempre sostituire un protone con un neutrone, ma soltanto con buona approssimazione. Perché buona? Perché le forze nucleari sono molto più forti delle forze elettriche. Così anche questa è una «quasi» simmetria. Così veramente abbiamo degli esempi in altre cose. Nella nostra mente abbiamo la tendenza ad accettare la simmetria come un qualche genere di perfezione. In realtà è come l’antica idea dei Greci che i cerchi erano perfetti, ed era piuttosto mostruoso credere che le orbite planetarie non fossero cerchi, ma soltanto quasi cerchi. La differenza fra l’essere un cerchio e l’essere quasi un cerchio non è piccola, è un cambiamento fondamentale per quanto riguarda la mente. C’è un segno di perfezione e simmetria in un cerchio che non c’è più nel momento in cui il cerchio è leggermente cambiato – questa è la sua fine – non è più simmetrico. Allora la questione è perché esso sia soltanto quasi un cerchio – questa è una questione molto più difficile. Il moto reale dei pianeti, in generale, dovrebbe corrispondere a delle ellissi, ma nel tempo, a causa delle forze dipendenti dalle maree, e così via, esse sono state rese quasi simmetriche. Ora la questione è se abbiamo un problema simile qui. Il problema dal punto di vista dei cerchi è che, se essi fossero cerchi perfetti, non vi sarebbe nulla da spiegare, il che è chiaramente semplice. Ma dal momento che essi sono soltanto quasi cerchi, vi è un bel po’ da spiegare, e il risultato si è rivelato un grosso problema dinamico, e ora il nostro problema è quello di spiegare perché essi siano quasi simmetrici esaminando le forze dipendenti dalle maree e così via. Sicché il nostro problema è quello di spiegare da dove proviene la simmetria. Perché la natura è tanto vicina alla simmetria? Nessuno ha idea del perché. L’unica cosa che potremmo suggerire è un qualcosa del genere: vi è una porta in Giappone, a Neiko, che talvolta è chiamata dai giapponesi la porta più bella di tutto il Giappone; fu costruita in un’epoca in cui c’era molta influenza da parte dell’arte cinese. Tale porta è assai elaborata con una gran quantità di timpani e belle sculture e mucchi di colonne e teste di draghi e principi scolpiti nei pilastri, e così via. Ma quando si guarda attentamente si vede che nel disegno elaborato e complesso di uno dei pilastri uno dei piccoli elementi del disegno è scolpito a rovescio; altrimenti la cosa è completamente simmetrica. Se si chiede perché è così, raccontano che fu scolpito a rovescio affinché gli dèi non fossero gelosi della perfezione dell’uomo. Sicché di proposito fu introdotto un errore, in modo che gli dèi non fossero gelosi e non si adirassero con gli esseri umani. Ci potrebbe piacere di capovolgere l’idea e pensare che la vera spiegazione della quasi simmetria della natura sia questa: che Dio fece le leggi soltanto quasi simmetriche in modo che non fossimo gelosi della Sua perfezione!

Indice analitico

A aberrazione/i, 275 – cromatica, 275 – sferica, 275 – telescopio, 352 accelerazione, 81, 86 – angolare, 187 – come derivata della velocità, 82 – come derivata seconda della distanza, 82 – come vettore, 114 – componenti, 87 – di gravità, 88 – ritardata, 285 accordatura temperata, 530 acetilcolina, 24 acido desossiribonucleico, 26 acqua – fenomeni di superficie, 5 – ghiaccio, 4, 5 – osservazione di una goccia ingrandita, 2 – vapore, 3, 4, 5 actomiosina, 24 Adams, John, 67 additività dell’energia, 137 addizione (algebra), 219 adenina, 27 alanina, 551 – D-alanina, 551 – L-alanina, 551 algebra, 219-229 – addizione, 220 – astrazione e generalizzazione, 221 – divisione, 220 – elevazione a potenza, 220 – logaritmo, 220 – moltiplicazione, 220 – numeri complessi, 226 – – esponenti immaginari, 228 – numeri interi, 220 – – negativi, 221 – numeri irrazionali, 222 – numeri razionali, 222 – operazioni dirette, 219 – operazioni inverse, 220 – radice, 220 – regole, 220, 221 – sottrazione, 220

– vettoriale, 112 – – v. anche vettori ammasso/i – galattico, 68 – globulare/i, 47 – – di stelle, 68 amminoacidi, 26, 551 ampiezza/e – di probabilità, 394 – – per le particelle, 512 – di una oscillazione, 215 analisi – di Fourier, 252, 532, 542 – vettoriale, 111 – – v. anche vettori analogie in fisica, 255 Anderson, Carl, 556 angolo di Brewster, 335 angstrom, 3 anidride carbonica, 8, 44 animali, 24 anno, 44 antenna/e – direzionalità, 289 – lobi, 289 – parabolica, 301 – sistema di, 289 antimateria, 556 antineutrone, 557 antiparticella/e, 18, 20, 557 – dei mesoni, 19 antiprotone, 557 api, visione nelle, 373 Aristotele, 41 armoniche, 526-536 – risposte non lineari, 533 – serie di Fourier, 527 – – coefficienti di Fourier, 530 – teorema dell’energia di un’onda, 533 – toni musicali, 526 – – altezza, 527 – – intensità, 527 – – qualità, 527, 528 asse/i – maggiore (orbita ellittica), 63 – ottico, 332 – principali, 211 assonanza musicale, 528 – e qualità dei toni musicali, 528

assorbimento, 316 – indice di, 316 astronomia, 27 atmosfera – densità, 418 – distribuzione delle molecole, 417 – standard (unità di misura), 499 – terrestre come oscillatore, 238 atomo/i, 2 – diametro, 49 – dimensioni, 399 – e materia, 2 – forze fra, 123 – moto, 1-10 – posizione in un cristallo determinata con raggi X, 302 – processi atomici, 5 – prove dell’esistenza, 9 – raggio, 3 – – di Bohr, 400 – reazioni chimiche, 7 – risonanza negli, 239 attivazione, energia di, 447 attività ottica, 335 attrazione gravitazionale fra due elettroni, 71 attrito, 120, 147, 232, 254, 464 – coefficiente di, 121 – come resistenza dinamica in un fluido, 120, 121 – di scorrimento, 121 – e forze molecolari, 123 – forza di, 121 – radente, 121, 122 – statico, 122 – vincoli fissi senza, 143 Avogadro, Amedeo, 406 – numero di, 439 B bande laterali, 508 – trasmissioni radio, 509 – trasmissioni televisive, 509 bar, 499 barione-mesone-leptone, 19 barioni, 20, 39 – conservazione, 39 bastoncelli, 356, 372

560

Indice analitico

battimenti, 496, 505-516 – ampiezze di probabilità per le particelle, 512 – bande laterali, 508 – – trasmissioni radio, 509 – – trasmissioni televisive, 509 – modi di vibrazione normali, 515 – note di battimento e modulazione, 507 – onde in tre dimensioni, 514 – somma di due onde, 505 – treni d’onde localizzati, 510 Becquerel, Antoine Henri, 280 Bernoulli, Jakob – probabilità di, 55 biologia, 23 birifrangenza, 332 blocchi di Johansson, 123 Boehm, Felix, 556 Bohr, Niels, 448 – raggio di, 400 Boltzmann, Ludwig, 429 – costante di, 439 – legge di, 418 bomba atomica, 174 Born, Max, 381, 403 Brahe, Tycho, 62 Bremsstrahlung, 347 Brewster, David, 335 – angolo di, 335 Briggs, Henri, 225 C C-14, 44 calcolatore/i, 30 – analogico, 257 calcolo differenziale, 78 calore, 3, 8, 12, 13, 23 – specifico – – a volume costante, 479 – – dei gas, 424 calorico, teoria del, 464 cammino – casuale, 436 – libero medio, 453 campo/i, 125, 148 – di un corpo solido, equazione, 126 – di un piano di cariche oscillanti, 304 – dovuto al mezzo, 311 – e potenziali, 148 – elettrico, 14, 125, 126, 127 ,128, 150, 279 – – a grandi distanze, 341 – – principio di sovrapposizione, 251 – – prodotto da una carica in accelerazione, 281, 285 – – – carica che si muove con moto oscillatorio, 285 – elettromagnetico, 12, 15, 105 – gravitazionale, 125, 126, 127 – – di oggetti grandi, 138 – magnetico, 12, 279, 280, 341, 352 – – unità mks, 345 – principio di sovrapposizione, 127

© 978-8808-22107-0

– unificato, teoria, 71 capacità di un condensatore, 235, 256 carbonio, 7 – diossido di, 8 – ossido di, 8 carica/che, 13 – conservazione, 39 – dell’elettrone, 18, 125 – forza elettrica fra, 124 – in accelerazione, 285 – – campo elettrico, 285 – – carica che si muove con moto oscillatorio, 285 – – – campo elettrico, 285 – oscillanti, campo di un piano di, 304 Carnot, Sadi, 463, 465, 484, 487 – ciclo di, 466 – ipotesi di , 465 catalizzatori, 447 cavallone in un canale, 539 Cavendish, Henry, 70 – esperimento sulla gravitazione, 70 cavità risonanti, 341 cella – di Kerr, 334 – unitaria (cristalli), 398 cellophan, 333 – birifrangenza, 333 cellule, 24 – a cono, 356 centro – di gravità, 195 – di massa, 185, 186, 193-197 – – localizzazione, 196 – – proprietà, 193 – – teorema del, 185 Cerenkov, Pavel, 538 – radiazione, 538 chiasma ottico, 371 chimica, 22 – fisica, 23 – inorganica, 22 – organica, 23 – quantistica, 23 ciclo – di Carnot, 466 – di Krebs, 24 – respiratorio, 24 cielo, luce azzurra, 326, 328 cinetica chimica, 446 citosina, 27 Clausius, Rudolf, 464 Clausius, Rudolf - Clapeyron, Benoît – equazione di, 482 clessidra, 42 cloro, 6 clorofilla, 372 cloroplastide, 372 cloruro di sodio, 6 – oscillazioni del reticolo cristallino, 238 coefficiente/i, – binomiali, 54 – di attrito, 121

– di autoinduzione, 236 – di diffusione, 459 – di Fourier, 530 – G della legge di gravità, 70 colibrì, visione nel, 374 collisione/i – anelastica, 172 – sezione trasversale di, 454 – tempo medio tra le, 452 – tra molecole, 451 colore/i – diagramma cromatico, 361 – e intensità luminosa, 356 – misura della sensazione del, 358 – primari, 360 – puri apparenti, 368 – visione del, v. visione del colore componenti – di Fourier, 532 – di un vettore, 111 compressibilità della radiazione, 410 compressione adiabatica, 409 concetto onda-particella, 17 condensatore, 235 – ad armature parallele, 150 – capacità, 235 condizioni – iniziali di un moto oscillatorio, 214, 216 – per l’equilibrio, 189 conducibilità termica di un gas, 460 conduttività ionica, 457 coni, 356, 364, 368 conservazione – dei barioni, 39 – dei leptoni, 39 – del momento della quantità di moto, 39, 191, 207 – dell’energia, 23, 32-40, 131, 147, 464 – – che cos’è l’energia, 32 – – energia cinetica, 37 – – energia potenziale gravitazionale, 33 – – forme di energia, 37 – – in un oscillatore armonico, 217 – della carica elettrica, 39, 550 – della parità, 555 – – violazione della, 555 – della quantità di moto, 39, 96-105 – – formulazione matematica, 97 – – nella meccanica quantistica, 105 – – nella teoria della relatività, 104 – – verifiche sperimentali, 100 – leggi di, 39 – – e simmetria, 550 contrazione – delle lunghezze, 157 – di Lorentz, 159 Copernico, Niccolò, 62 Coriolis, Gaspard – forza di, 201 – – come prodotto vettoriale, 208 cornea, 355, 369 Cornu, Marie-Alfred – spirale di, 303

Indice analitico

© 978-8808-22107-0

corpo nero, radiazione, 433, 485 corpo rigido, 185, 187 – rotante, 200 – – energia cinetica, 200 – rotazione, 187, 192 corteccia visiva, 370, 371 coseno algebrico, 228 costante – chimica, 474 – di Boltzmann, 439 – di Planck, 184 – – ridotta, 50, 392 – di Stefan-Boltzmann, 485 – gravitazionale (G), v. coefficiente G della legge di gravità Coulomb, Charles-Augustin – legge di, 278, 279 cristalli, 302 – cella unitaria, 398 – diffrazione, 302, 398 – reticolo, 398 – struttura, 9 cristallino, 369 criterio di Rayleigh, 300 curva della luminosità, 362 D daltonismo dicromatico, 363 de Broglie, Louis – relazioni di, 353 decadimento – beta, 21, 555 – debole, 555 decibel, 499 Dedekind, Richard, 222 deformazione di taglio, 540 – onda di deformazione, 541 densità, 4 – dell’atmosfera, 418 – di probabilità, 58 – – normale o gaussiana, 59 dente d’arresto, v. ruota dentata e dente d’arresto derivata – di una funzione, 79 – parziale, 149 destra e sinistra, definizione di, 554 diagramma cromatico, 361 Dicke, Robert, 72 differenza – di potenziale, 256 – di tensione, 151 differenziali, 79 differenziazione di una funzione, 80 diffrazione, 294-307 – ampiezza risultante dovuta a n oscillatori uguali, 294 – antenna parabolica, 301 – campo di un piano di cariche oscillanti, 304 – cristalli, 302 – della luce da uno schermo, 318 – di schermi opachi, 303

– nei cristalli, 396 – pellicole colorate, 302 – reticolo di, 290, 297 – – potere risolutivo, 300 diffusione, 297, 451-461 – cammino libero medio, 453 – coefficiente di, 459 – collisioni fra molecole, 451 – conducibilità termica, 460 – conduttività ionica, 457 – della luce, 324-329 – – sorgenti di luce indipendenti, 324 – molecolare, 458 – velocità di trascinamento, 455 dinamica – leggi di Newton, 85-95 – – componenti di velocità, accelerazione e forza, 87 – – espressioni della, 88 – – moti planetari, 91 – nella notazione vettoriale, 114 – – prima legge, 85 – – quantità di moto e forza, 85 – – seconda legge, 85, 86, 118, 119 – – – in forma completa, 88 – – – moto di una massa appesa a una molla, 89 – – significato delle equazioni dinamiche, 89 – – soluzione numerica delle equazioni, 90 – – terza legge, 85, 96 – – velocità e velocità vettoriale, 86 – relativistica, 161 – sviluppo storico, 63 diossido di carbonio, 8 dipolo – elettrico, oscillatore a, 282 – forza dipolo-dipolo, 123 – momento di, 123 Dirac, Paul, 556 – equazione, 209 direzione ritardata, 280 dispersione, 313 – della luce da un prisma, 314 – equazione di, 314, 315 distanza/e, 46-50 – come integrale della velocità, 80, 82 – focale – – di una lente, 271 – – di una superficie sferica, 269 – grandi, 46 – misura, 46 – piccole, 48 – quadratica media, 56 – ritardata, 280 distribuzione – delle velocità molecolari, 421 – – in un gas, 59 – di probabilità, 57 divisione (algebra), 220 DNA, 26 Doppler, Christian – effetto relativistico, 348

561

E effetto – Doppler relativistico, 348 – Joule, 243 – Kerr, 334 – Purkinje, 357 Einstein, Albert, 16, 38, 60, 62, 152, 136, 165, 174, 428, 437 – leggi della radiazione, 448 – modifica alla legge di Newton, 77 – teoria gravitazionale, 127, 130 – teoria speciale della relatività, v. relatività, teoria speciale elementi – chimici, 14 – – proprietà, 14 – passivi di circuito, 235 elettricità, 14, 278, 279 elettrodinamica quantistica, 17, 280, 450 elettromagnetismo, 278 elettrone/i, 14, 20, 39 – attrazione gravitazionale fra due, 71 – carica elettrica, 18, 125 – comportamento quantistico, 382 – – elettroni come onde, 385 – – elettroni come pallottole, 382 – – interferenza delle onde di elettroni, 386 – – osservazione degli elettroni, 387 – liberi nell’atmosfera, 314 – massa, 18 – – a riposo, 181 – osservazione degli, 387 – raggio classico, 324 – rapporto fra repulsione elettrica e attrazione gravitazionale fra due elettroni, 71 elettronvolt, 181 elevazione a potenza (algebra), 220 elio, 5, 28 ellisse, 63 emissione – indotta, 449 – spontanea, 449 – stimolata, 449 – termoionica, 443 emoglobina, 26 energia – a riposo, 163 – additività, 137 – chimica, 38 – cinetica, 37, 131, 133, 144 – – conservazione, 37 – – di un corpo rigido rotante, 200 – – di un gas, 411 – – media di un gas, 413 – – secondo l’analisi vettoriale, 116 – conservazione, 23, 32-40, 131, 147 – – che cos’è l’energia, 32 – – energia cinetica, 37 – – energia potenziale gravitazionale, 33 – – forme di energia, 37 – della radiazione, 286

562

Indice analitico

– di attivazione, 24, 447 – di ionizzazione, 445 – – dell’idrogeno, 400 – di massa, 38 – di un corpo che cade, 131 – e quantità di moto, 103 – elastica, 37 – elettrica, 38 – equipartizione, 428 – equivalenza di massa ed energia, 163 – interna, 464, 477 – – di un gas, 409 – nucleare, 38 – potenziale, 35, 131, 134, 144 – – di gravità, 144 – – di una molla, 145 – – e lavoro, v. lavoro ed energia potenziale – – elettrica, 36, 145 – – gravitazionale, 33, 145 – – – conservazione, 33 – – per due atomi di ossigeno, 145 – – variazione di, 144 – – v. anche lavoro ed energia potenziale – radiante, 38 – rapidità di radiazione, 321 – relativistica, 173 – sorgenti, 39 – termica, 38, 105 – totale di una particella, 174 – totale irradiata da una carica accelerata, 321 – trasportata da un’onda elettrica, 317 entalpia, 481 entropia, 39, 472 – e ordine, 493 enzimi, 24, 25, 26 Eötvös, Roland von, 72 equazione/i – dell’onda, 499 – – soluzioni, 501 – di campo, 279 – di Clausius-Clapeyron, 482 – di Dirac, 209 – di dispersione, 314 – di ionizzazione di Saha, 445 – di Maxwell, 153, 251 – differenziali lineari, 212, 249 – – con coefficienti costanti, 212 – – sovrapposizione di soluzioni, 251 equilibrio termico della radiazione, 431 equipartizione – dell’energia, 428 – e oscillatore quantistico, 434 equivalenza di massa ed energia, 163 Erone di Alessandria, 261 errore – minimo – – sulla misura di tempo, 50 – – sulla posizione di un oggetto, 50 – quadratico medio, 59 espansione adiabatica, 467

© 978-8808-22107-0

esperimento, 1, 17 – di Michelson-Morley, 155 – ideale, 390 esponenti immaginari, 228 etere, 155 – velocità, 157 Euclide, 46 evaporazione, 440 – di un liquido, 419 evento, 177, 390 F farad, 256 fascio riflesso, 299 fase, 287 – di una oscillazione, 214, 215 fattore di merito, v. Q di un sistema oscillante fattoriale, 54 fenomeno periodico, 42 Fermat, Pierre de, 261 – principio del tempo minimo, v. principio del tempo minimo fermi (lunghezza), 49 Fermi, Enrico, 49 fisica – analogie in, 255 – classica, fallimento, 425 – fondamenti, 11-21 – nuclei e particelle, 18 – prima del 1920, 13 – quantistica, 16 – relazioni con le altre scienze, 22-31 – – astronomia, 27 – – biologia, 23 – – chimica, 22 – – geologia, 29 – – psicologia, 29 fisiologia dei sensi, 30 fluidi turbolenti, analisi, 31 flusso turbolento, 29 fluttuazioni, 53 formula/e – chimica, 8 – della lente, 274 – di riflessione di Fresnel, 338 forza/e, 13, 64, 85, 118-130 – apparenti, 128 – centrifuga, 129, 201 – che cos’è, 88 – complessa – – come somma di impulsi, 253 – – come somma di sinusoidi, 252 – componenti, 88 – concetto, 118 – conservative, 143 – – gravità, 143 – del vincolo, 143 – di attrito, 121 – di Coriolis, 201 – – come prodotto vettoriale, 208 – di gravità, 88

– dipolo-dipolo, 123 – e legge della gravitazione di Newton, 119 – e seconda legge di Newton, 118, 119 – elettrica, 13, 124, 127 – – analogia con la gravità, 71 – – e magnetica su una carica in movimento, 128 – espressioni della, 88 – esterna, 98 – fondamentali, 124 – magnetica, 127, 128 – molecolari, 123 – non conservative, 146 – nucleare/i, 18, 20, 130 – proprietà, 119 fotone/i, 16, 17, 19, 20, 184, 259, 267, 353, 381, 389, 410 Fourier, Jean-Baptiste – analisi di, 252, 532, 542 – coefficienti di, 530 – componenti di, 532 – serie di, 527 – trasformate di, 252 fovea, 356 Frank, Ilya, 538 frenamento, radiazione di, 347 frequenza/e, 15 – angolare, 287 – di oscillazione, 15 – infrarosse, 15 – naturale di un oscillatore armonico, 218 – ultraviolette, 15 Fresnel, Augustin-Jean – formule di riflessione di, 338 fronti d’onda, 498 funzione – di Green, 253 – di lavoro, 443 – di stato, 472 – scalare, 116 fusione, 5 futuro influenzabile, 180 G Gagarin, Jurij, 66 galassia/e, 47, 68 Galileo Galilei, 41, 42, 85, 63, 64, 549 – principio di inerzia, 64 gas, 4 – aumento di massa con l’aumento della temperatura, 162 – calori specifici, 424 – conducibilità termica, 460 – densità, 4 – energia – – cinetica, 411 – – – media, 411 – – interna, 409 – ideali, legge dei, 414 – indice di rifrazione, 314 – molecole – – distribuzione delle velocità, 59

Indice analitico

© 978-8808-22107-0

– – moto, 59 – pressione, 4, 406 – spinta media, 4 – temperatura, 4, 411 – teoria cinetica, 405-416 – – compressibilità della radiazione, 410 – – energia cinetica, 411 – – legge dei gas ideali, 414 – – pressione di un gas, 406 – – proprietà della materia, 405 – – temperatura, 411 gauss, 345 gaussiana, densità di probabilità, 59 GDP, 25 Gell-Mann, Murray, 19 genicolato laterale, 370 geologia, 29 geometria – dell’universo, 130 – dello spazio-tempo, 176 ghiaccio, 4, 5 giorno, 42, 45 Giove, 64 – orbita attorno al Sole, 67 – satelliti, 67 giroscopio, 208 gradi di libertà, 250 – di un sistema, 416 gradiente, 150 granchio a ferro di cavallo, 376 – occhio, 376 gravità, 20, 21, 70 – accelerazione di, 88 – analogia con la forza elettrica, 71 – come forza conservativa, 143 – cos’è, 70 – e relatività, 72 – energia potenziale, 144 – forza di, 88 – lavoro fatto dalla, 134, 144 – meccanismo della, 70 – moto dovuto alla, 88 gravitazione, 13, 14, 16, 62-73, 279 – analogia con l’elettricità, 71 – coefficiente G, 70 – energia potenziale, 145 – esperimento di Cavendish, 70 – legge di Newton, 64, 119 – meccanismo della gravità, 70 – modifica di Einstein alla legge di Newton, 77 – moti planetari, 62 – – leggi di Keplero, 63 – universale, 66 gravitone, 19, 20 Green, George – funzione di, 253 – metodo della funzione di, 253 GTP, 25 guanina, 27 guanosindifosfato, 25 guanosintrifosfato, 25 guide d’onda, 341

H Hamilton, William, 268 Heisenberg, Werner, 381, 389, 403 – principio di indeterminazione, 16, 60, 389, 392 Helmholtz, Hermann, 362 henry, 256 herapatite, 334 Hooke, Robert – legge di, 124 Huygens, Christiaan, 153, 260, 338 I idrogeno, 25, 28, 40 – configurazione dell’atomo, 61 – raggio dell’atomo, 61 immaginario puro, numero, 226 immagine – reale, 270 – virtuale, 270 impedenza/e, 257 – complessa, 237 – del vuoto, 321 – in serie e in parallelo, 257 increspature d’acqua, 545 indeterminazione, principio di, 16, 60, 389, 392 indice – di assorbimento, 316 – di rifrazione, 308-319 – – campo dovuto al mezzo, 311 – – equazione, 313 – – origine, 308 – – per i gas comuni, 314 – – per il vetro, 314 – – per le onde radio nell’atmosfera, 314 – – per varie sostanze, 314 – – variazione con la frequenza, 314 induttanza, 236, 255 induttore, 255 induzione magnetica, 128 inerzia, 13, 72, 85 – principio di, 64, 85 infrarosso, 259 ingrandimento, 273 integrazione di una funzione, 81 intensità di radiazione – due radiatori a dipolo, 288 – n oscillatori uguali, 295 interazione/i – del decadimento beta, 20 – elementari, 20 – elettriche, 20 – forte, 21 – mesone-barione, 21 interferenza, 283, 285-293 – costruttiva, 292 – distruttiva, 292 – effetto di, 292 – energia della radiazione, 286 – fra dipoli, 290 – – matematica, 290 – fra due radiatori a dipolo, 288

563

– nel tempo, 496 – non rilevabile, 325 – onde – – elettromagnetiche, 285 – – sinusoidali, 287 intervallo/i – di tipo spaziale, 179 – di tipo temporale, 179 – nello spazio-tempo, 178 invarianza, 110 – v. anche simmetria ione/i, 6, 444, 445 – diffusione in un gas, 451 ionizzazione – energia di, 445 – termica, 444 – termoionica, 444 ipocicloide, 344 ipotesi – atomica, 2 – di Carnot, 465 iride, 370 irreversibilità in meccanica, 492 isotopi, 26 – radioattivi, 44 J Jeans, James, 425, 434 Johansson, Carl Edvard – blocchi di, 123 Johnson, John Bernard – rumore di, 430, 436 joule, 133 Joule, James – effetto, 243 K kelvin, 414 Keplero, Giovanni, 62, 63, 66 – leggi di, 63 Kerr, John – cella di, 334 – effetto, 334 kilowattora, 133 Kirchhoff, Gustav – leggi di, 258 Krebs, Hans Adolf – ciclo di, 24 L lamina a quarto d’onda, 333 lancio di una moneta – fluttuazioni, 53 – lanci multipli, 54 – probabilità di un particolare risultato, 51, 52 Land, Edwin, 367 Laplace, Pierre-Simon de, 503 laser, 43, 325, 450, 536 lavori virtuali, principio dei, 37 lavoro, 133 – ed energia potenziale, 131-140, 141-151 – – additività dell’energia, 137

564

Indice analitico

– – campo gravitazionale di oggetti grandi, 138 – – concetto fisico e significato comune della parola, 141 – – energia di un corpo che cade, 131 – – forze conservative, 143 – – forze non conservative, 146 – – moto vincolato, 143 – – potenziali e campi, 148 – fatto dalla gravità, 134 – – su una curva chiusa, 134, 135 – principio dei lavori virtuali, 37 Le Verrier, Urbain, 67 legge/i, 1,2 – dei gas ideali, 414 – dell’elasticità, 124 – della dinamica di Newton, v. dinamica, leggi di Newton – della gravitazione di Newton, 64, 119 – della radiazione di Einstein, 448 – della termodinamica, 39 – di Boltzmann, 418 – di conservazione, 39 – – e simmetria, 550 – di Coulomb, 278, 279 – di gravità, coefficiente G, 70 – di Hooke, 124 – di Keplero, 63 – di Kirchhoff, 258 – di Newton, v. dinamica, leggi di Newton – di Ohm, 235, 255 – di Rayleigh, 434 – di Snell, 261, 310 – fisiche, simmetria rispetto alle rotazioni, 108 – quasi simmetriche, 558 Leibniz, Gottfried, 78 lente/i – composte, 274 – convergente, 264 – convessa, 272 – distanza focale, 271 – sottile, 273 – – formula della, 274 Leonardo da Vinci, 369 leptoni, 20, 39 – conservazione, 39 liquido/i, 5 – evaporazione, 419 livelli energetici, 401 lobi d’antenna, 289 logaritmo – a base naturale (e), 225 – algebra, 223 – calcolo, 224 – operazione inversa, 220 – tavole, 223 Lorentz, Hendrik, 154 – contrazione di, 159 – trasformazioni di, 154, 168, 176 luce, 15, 153, 259, 496 – al tramonto, 263

© 978-8808-22107-0

– azzurra del cielo, 326, 328 – comportamento, 259, 278 – diffrazione da uno schermo, 318 – diffusa, polarizzazione, 332 – diffusione, 324-329 – dispersione da un prisma, 314 – energia, 38 – non polarizzata, 331 – polarizzata, 329 – – momento della quantità di moto, 340 – – v. anche polarizzazione – pressione, 352 – propagazione, 341 – quantità di moto, 105, 352 – riflessione, 260 – – angolo di Brewster, 335 – – intensità, 336 – – polarizzazione, 335 – rifrazione, 260 – sorgenti indipendenti, 324 – teoria classica, 341 – velocità, 279 – – prima stima della, 67 – vettore elettrico, 330 luminosità, curva della, 362 Luna, 64 – attrazione sulla Terra, 66 – distanza dalla Terra, 46 – moto del sistema Terra-Luna, 66 – orbita attorno alla Terra, 65 lunghezza d’onda, 259, 287 lunghezze, contrazione delle, 157 M macchina/e – ideale (reversibile), rendimento, 469 – non reversibile, 34 – quasi reversibile, 34 – reversibile/i, 34, 465 – termiche, 462 macula, 356 magnetismo, 14, 278, 279 maree, 66 – atmosferiche, 238 martinetto a vite, 36 maser, 450 massa, 72, 85, 86 – appesa a una molla – – moto, 89 – – oscillazioni, 213 – dell’elettrone, 18 – distribuzioni, 138 – equivalenza di massa ed energia, 163 – relativistica, 162, 170 materia, 2 – e teoria atomica, 2 – proprietà della, 405 – vivente, 23 materie plastiche birifrangenti, 334 Maxwell, James Clerk, 278, 280, 425, 491 – equazioni di, 153, 251 Mayer, Julius R. von, 23

meccanica, 12 – quantistica, 16, 39, 195, 280 – – conservazione della quantità di moto, 105 – – della chimica, 12 – – introduzione, 381-393 – – – comportamento quantistico degli elettroni, 382 – – – primi princìpi della meccanica quantistica, 390 – – – principio di indeterminazione di Heisenberg, 16, 60, 389, 392 – – relazione fra i punti di vista ondulatorio e corpuscolare, 394-404 – – – ampiezza di probabilità, 394 – – – diffrazione nei cristalli, 398 – – – dimensioni dell’atomo, 399 – – – implicazioni filosofiche, 402 – – – livelli energetici, 401 – – – misura della posizione e della quantità di moto, 395 – – simmetria e leggi di conservazione, 550 – statistica, 22, 417-427 – – atmosfera, distribuzione delle molecole, 417 – – calori specifici dei gas, 424 – – distribuzione delle velocità molecolari, 421 – – evaporazione di un liquido, 419 – – fallimento della fisica classica, 425 – – legge di Boltzmann, 418 media dei quadrati delle distanze, 55 Mendeleev, Dmitrij – tavola periodica, 19, 20, 22 mente, 30 mesone/i, 20 – Ƨ, 555 – K, 20 – K , 240 – ƫ, 18, 19, 20, 39, 159 – �, 18, 130 – �0, misura della vita media, 43 – Ʋ, 555 meteorologia, 29 metodo – della funzione di Green, 253 – scientifico, 11 metro, 48, 49 MeV, 19 mezzogiorno, 42 Michelson, Albert - Morley, Edward – esperimento di, 155 micron, 48 microscopio elettronico, 48 millimetro, 48 miosina, 24 miraggio, 264 mobilità, 455 modi di vibrazione, 517-525 – e meccanica quantistica, 524 – in due dimensioni, 520 – – frequenze naturali, 522 – normali, 515

Indice analitico

© 978-8808-22107-0

– onde limitate, 518 – – frequenze naturali, 518 – pendoli accoppiati, 515, 523 – riflessione delle onde, 517 modulatore, 536 modulazione, 534 – di ampiezza (AM), 508 – – bande laterali, 508 – – – trasmissioni radio, 509 – – – trasmissioni televisive, 509 – – segnale portante, 508 – e note di battimento, 507 – velocità di, 511 mole, 414 molecola/e, 3, 7 – cammino libero medio, 453 – collisioni tra, 451 – di un gas, distribuzione delle velocità, 59 – – moto, 59 – diffusione, 458 – – coefficiente di, 459 – distribuzione delle velocità, 421 – distribuzione nell’atmosfera, 417 – forze fra, 123 – non polare, 123 – otticamente attive, v. attività ottica – polare, 123 – sezione trasversale di collisione, 454 – velocità di trascinamento, 455 molla – energia elastica, 38 – energia potenziale, 145 – massa appesa, 89 – – moto, 89 – – oscillazioni, 213 moltiplicazione (algebra), 219 momento/i, 188 – della quantità di moto, 189, 191 – – come prodotto vettoriale, 207 – – conservazione, 39, 191, 207 – – di un corpo solido, 211 – – di un pianeta attorno al Sole, 191 – – in tre dimensioni, 203 – di dipolo, 123 – di inerzia, 192, 197-200, 211 – – di una barra rotante attorno a un estremo, 197 – – di una barra rotante attorno al suo centro, 198 – – teorema dell’asse parallelo, 198 – in tre dimensioni, 203 – principali di inerzia, 211 – totale, 189 moto/i, 41, 74-84 – accelerazione, 81 – – come derivata della velocità, 82 – – come derivata seconda della distanza, 82 – armonico – – e moto circolare, 215 – – e numeri complessi, 230 – bidimensionale, 83

– browniano, 9, 55, 428-439 – – cammino casuale, 436 – – equilibrio termico della radiazione, 431 – – equipartizione dell’energia, 428 – – equipartizione e oscillatore quantico, 434 – casuale, 55 – circolare e moto armonico, 215 – delle molecole di un gas, 59 – descrizione, 74 – di un corpo in caduta libera, 89 – – che parte da fermo, 82 – – con velocità orizzontale costante, 83 – di un punto, 74 – di una massa appesa a una molla, 89 – distanza come integrale della velocità, 80 – molecolare, 428 – perpetuo, 33 – planetari, 62, 91 – – attorno al Sole, 63 – – – leggi di Keplero, 63 – tridimensionale, 83 – unidimensionale, 74, 83 – velocità, 76 – – come derivata della distanza, 79 – vincolato, 143 muone/i, 18, 19, 20, 159 muscolo – contrazione, 24 – liscio, 142 – striato, 142 N Nernst, Walter Hermann, 474 – postulato di, 474 nervo/i, 23 – ottico, 370 neutrino/i, 20, 39 neutrone/i, 14, 18, 399 Newton, Isaac, 16, 64, 66, 78, 85, 166, 492, 503 – legge della gravitazione, 64, 119 – leggi della dinamica, 280, 498 – – nella notazione vettoriale, 114 – – prima legge, 85 – – seconda legge, 85, 86, 118, 119 – – – in forma completa, 88 – – terza legge, 85, 96 – – v. anche dinamica Nishijima, Kazuhiko, 19 nodo/i, 518 – di un’onda, 314 notazione operatoriale, 249 note – di battimento e modulazione, 507 – musicali, 527 novae, 28 nucleo atomico, 14, 18 – oscillazioni nel, 240 numero/i – complessi, 226

565

– – coniugati, 226 – – e moto armonico, 230 – – esponenti immaginari, 228 – – potenze complesse, 226 – d’onde, 287 – di Avogadro, 439 – immaginario puro, 226 – interi, 220 – – negativi, 221 – irrazionali, 222 – – approssimazione, 222 – razionali, 222 – reali, 226 nutazione, 210 nuvole, 328 – visibilità, 328 O occhio – composto degli insetti, 373 – emmeralopo, 373 – forme diverse da quella umana, 375 – movimenti, 372 – umano, 355 – – visione del colore, v. visione del colore oftalmoscopio, 364 ohm, 255 Ohm, George Simon – legge di, 235, 255 ommatidi, 374 onda/e, 496 – corte, 259 – d’acqua, 383, 496, 543 – – corte, 545 – – – increspature, 545 – – – onde di tensione superficiale, 545 – – interferenza costruttiva, 384 – – interferenza distruttiva, 384 – – lunghe, 543 – – – velocità di fase, 544 – – – velocità di gruppo, 544 – d’urto, 538 – – cavallone in un canale, 539 – della meccanica quantistica, 496 – di deformazione (taglio), 541 – di prua, 537 – di tensione superficiale, 545 – elastiche, 496 – elettrica – – energia trasportata, 317 – elettromagnetiche, 15, 285 – equazione, 499 – – soluzioni, 501 – fenomeni associati, 537-546 – in tre dimensioni, 514 – in un canale, 539 – limitate, 518 – – frequenze naturali, 518 – modi di vibrazione, v. modi di vibrazione – nei solidi, 540 – – deformazione di taglio, 540

566

Indice analitico

– nodo di, 314 – onda-particella, concetto, 17 – principio di sovrapposizione, 497 – radio, 259 – riflessione delle, 517 – sinusoidali, 287 – sismiche, 29, 496 – somma di due, 505 – sonore, 496 – superficiali, 540 – – d’acqua, v. onde d’acqua – teorema dell’energia, 533 – treni d’onde localizzati, 510 – – velocità di fase, 511 – – velocità di gruppo, 511 – vettore, 351 operazioni – di simmetria, 547 – inverse (algebra), 220 ora, 42 ordine – del fascio, 297 – ed entropia, 493 orologio/i – a luce, 158 – a pendolo, 42, 108 – atomici, 45 – rallentamento degli, 158 – sincronizzazione degli, 160 oscillatore/i – a dipolo elettrico, 282 – armonico, 212-218 – – condizioni iniziali, 216 – – conservazione dell’energia, 217 – – equazioni differenziali lineari, 212 – – forzato, 218 – – frequenza naturale, 218 – – massa attaccata a una molla, 213 – – moto armonico e moto circolare, 215 – – oscillazioni forzate, 218 – diffrazione, 294 – – ampiezza risultante dovuta a n oscillatori uguali, 294 – elettronici, 42 – forzato, 231 – – con smorzamento, 232 – – energia, 242 – – risonanza, 231 – quantistico, ed equipartizione, 434 oscillazioni – forzate, 218 – – risposta stazionaria, 218 – – risposta transitoria, 218 – nei sistemi lineari, 253 – smorzate, 244 oscilloscopio a raggi catodici, 43 ossido di carbonio, 8 ossigeno, 7 ottava musicale, 526 ottica geometrica, 259, 268-277 – aberrazioni, 275 – distanza focale di una lente, 271

© 978-8808-22107-0

– distanza focale di una superficie sferica, 269 – ingrandimento, 273 – lenti composte, 274 – potere risolutivo, 276 P Pappo, teorema di, 196 parabola, 265 paradosso dei gemelli, 167 parameci, 3 particella/e, 13 – ampiezze di probabilità, 512 – elementari, 19 – lambda, 20 – omega, 20 – sigma, 20 – singola nello spazio, equazione d’onda, 515 – strane, 39 – xi, 20 Pascal, Blaise – triangolo di, 54 passato influente, 180 pellicole colorate, 302 – diffrazione, 302 pendoli accoppiati, 515, 523 pendolo, 37, 42 – equazione per piccole oscillazioni, 253 – orologio a, 108 perdita – per calore, 255 – per riscaldamento (resistenza), 243 periodo, 287 – di un’oscillazione completa, 214 – spaziale, 287 peso, 85 pianeti – moti attorno al Sole, 62 – – calcolo dei, 91 – – leggi di Keplero, 63 piano/i – inclinato, 36 – principali, 274 piante, 24 piombo, 45 pione/i, 18, 20 placca motrice, 24 Planck, Max, 434, 448 – costante di, 184 – – ridotta, 50, 392 Poincaré, Henri, 154, 157, 165 polarizzatori, 334 polarizzazione, 330-340 – attività ottica, 335 – birifrangenza, 332 – circolare, 331 – della luce diffusa, 332 – ellittica, 331 – intensità della luce riflessa, 336 – lineare, 331 – polarizzatori, 334 – rifrazione anomala, 338

– vettore elettrico della luce, 330 polaroid, 329, 333, 334 polpo, 376 – occhio, 376 porpora retinica, 364, 372 positrone, 18, 39, 556 posizione e quantità di moto, misura, 395 postulato di Nernst, 474 potassio, 19 potenza/e, 133 – complesse dei numeri complessi, 226 – nelle tre dimensioni, 207 – tavole delle, 223 potenziale/i, 148 – e campi, 148 – elettrico, 150 potere risolutivo, 276 – di un reticolo, 300 – di un telescopio, 301 precessione, 209, 210 presente (tempo), 180 pressione, 4 – della luce, 352 – di radiazione, 352 – di un gas, 406 principio – dei lavori virtuali, 37 – del tempo minimo, 259-267, 275 – – applicazioni, 263 – – enunciato più preciso, 266 – – luce, 259 – – riflessione della luce, 260 – – rifrazione della luce, 260 – di azione e reazione, 97 – di combinazione di Ritz, 401 – di indeterminazione di Heisenberg, 16, 60, 389, 392 – di inerzia, 64, 85 – di reciprocità, 301 – di relatività, 152 – – galileiana, 98 – di sovrapposizione, 497 – – dei campi, 127 – – per sistemi lineari, 251 probabilità, 51-61 – ampiezza di, 394 – binomiale, 55 – definizione, 51 – densità di, 58 – – normale o gaussiana, 59 – determinata sperimentalmente, 57 – di Bernoulli, 55 – di un evento, 394 – distribuzione di, 57 – e caso, 51 – fluttuazioni, 53 – lancio di una moneta, 51, 52 – moto casuale, 55 problema – dei tre corpi, 97 – lineare, 250 processi atomici, 5 prodotto scalare di vettori, 115

Indice analitico

profumo, 8 prolina, 26 propagazione del suono, 498 – in una dimensione, 498 propulsione a razzo, 104 proteina/e, 25, 26, 551 protone/i, 14, 18 pseudovettori, 206 psicanalisi, 29 psicologia, 29 pulsazione di una oscillazione, 215 punto, 74 – moto di un, 74 Purkinje, Jan – effetto, 357 Q Q di un sistema oscillante, 234, 243, 323 – oscillatore armonico, 324 quadrivettore/i, 161, 180 – algebra dei, 183 – quantità di moto, 182 – Ʒ, k, 350 quantità di moto, 85, 86 – conservazione, 39 – – v. conservazione della quantità di moto – e posizione, misura, 395 – ed energia, 103 – forme nascoste, 105 – momento della, conservazione, 39 – nella meccanica quantistica, 105 – relativistica, 104, 182 – totale, 98 quinta musicale, 526 R radar, 15 raddrizzatore elettrico, 490 radiatore a dipolo, 282 radiatori a dipolo (coppia di), 288 radiazione, 281 – Cerenkov, 538 – compressibilità, 410 – cosmica di sincrotrone, 346 – del corpo nero, 433, 485 – di frenamento, 347 – di sincrotrone, 344 – effetti relativistici, 341-354 – – aberrazione (telescopio), 352 – – effetto Doppler, 348 – – quadrivettore Ʒ, k, 350 – – quantità di moto della luce, 352 – – scoperta del mondo «apparente», 342 – – sorgenti in movimento, 341 – elettromagnetica, 259, 278-284 – – interferenza, 283 – – radiatore a dipolo, 282 – – radiazione, 281 – – teoria classica, 259 – energia, 286 – equilibrio termico, 431 – leggi di Einstein, 448

– pressione, 352 – rapidità di radiazione dell’energia, 321 – resistenza di, 320, 436 – smorzamento dovuto alla, 323 radice (algebra), 220 radio, trasmissioni, 15 radioattività, 44, 280 raggio/i – classico dell’elettrone, 324 – cosmici, 16, 19 – di Bohr, 400 – gamma (Ƣ), 15, 259 – ordinario, 339 – parassiali, 269 – straordinario, 339 – vettore, 63 – X, 15, 48, 259, 302 rallentamento degli orologi, 158 rana, 378 – occhio, 378 – tectum, 379 Rayleigh, John William – criterio di, 300 – legge di, 434 razzo, propulsione a, 104 reazioni – chimiche, 7 – nucleari nelle stelle, 28 regola della mano destra, 553 relatività – energia e quantità di moto, 165-175 – – energia relativistica, 173 – – massa relativistica, 170 – – paradosso dei gemelli, 167 – – relatività e filosofi, 165 – – trasformazione delle velocità, 168 – principio di, 152 – teoria speciale, 152-164 – – contrazione di Lorentz, 159 – – dinamica relativistica, 161 – – equivalenza di massa ed energia, 163 – – esperimento di Michelson-Morley, 155 – – principio di relatività, 152 – – quadrivettori, 161 – – simultaneità, 160 – – trasformazione di Lorentz, 154 – – trasformazioni di tempo, 157 relazioni di de Broglie, 353 rendimento – di una macchina – – ideale, 469 – – reversibile, 472 repulsione elettrica fra due elettroni, 71 resistenza, 235, 255 – aerodinamica su un aereo in volo, 120 – di radiazione, 320, 436 – perdita per riscaldamento, 243 resistore, 235 reticolo – cristallino, 5, 398 – di diffrazione, 290, 297 – – potere risolutivo, 300

567

retina, 355, 368, 369, 371 retinene, 372 rettificazione, 534 reversibilità – in meccanica, 491 – nel tempo, 549 ribosomi, 27 riflessione/i – della luce, 260 – – angolo di Brewster, 335 – – polarizzazione, 335 – delle onde, 517 – speculari, 550 rifrazione – anomala, 338 – della luce, 260 righe spettrali, larghezze, 324 risonanza, 19, 230-241 – elettrica, 235 – in natura, 237 – numeri complessi e moto armonico, 230 – oscillatore forzato, 231 – – con smorzamento, 232 – particella, 240 risposta – non lineare, 533 – stazionaria (oscillazioni forzate), 218 – transitoria (oscillazioni forzate), 218 Ritz, Walter – principio di combinazione di, 401 RNA, 27 rodopsina, 372 Rømer, Ole, 67 rotaia con sospensione ad aria, 100 rotazione/i, 108 – in due dimensioni, 185-192 – – centro di massa, 185 – – momento della quantità di moto, 189 – – – conservazione del, 191 – – rotazione di un corpo rigido, 187 – nello spazio, 203-211 – – equazioni della rotazione usando prodotti vettoriali, 207 – – giroscopio, 208 – – momenti in tre dimensioni, 203 – – momento della quantità di moto di un corpo solido, 208 – piana, 185 – simmetria delle leggi fisiche rispetto alle, 110 rumore, 526 – di Johnson, 430, 436 ruota dentata e dente d’arresto, 487-495 – funzionamento di una ruota dentata, 487 – irreversibilità in meccanica, 492 – ordine ed entropia, 493 – reversibilità in meccanica, 491 – ruota dentata come macchina, 488 Rushton, William, 364 rydberg (unità di misura), 400

568

Indice analitico

S Saha, Meghnad – equazione di ionizzazione, 445 satellite – che si allontana per sempre dalla Terra, 145 – in orbita attorno alla Terra, 145 Saturno, 67 scala di temperature del gas ideale, 482 scalare, 111 schermi opachi, 303 – diffrazione, 303 Schrödinger, Erwin, 360, 381, 403 scienze della terra, 29 secondo, 42, 43, 45 segnale portante, 508 seno algebrico, 228 seppia gigante, 376 – occhio, 376 serie di Fourier, 527 – coefficienti di Fourier, 530 sezione d’urto, 52 – di diffusione Thomson, 328 – nucleare, 49 – per diffusione, 327 sezione trasversale di collisione, 454 sfarfallio, 363 sfasamento di una oscillazione, 215 Shannon, Claude, 463 simmetria, 106 – delle leggi fisiche, 106 – – rispetto alle rotazioni, 108 – – rispetto alle traslazioni, 108 – nelle leggi fisiche, 547-558 – – antimateria, 556 – – definizione di destra e sinistra, 554 – – leggi quasi simmetriche, 558 – – operazioni di simmetria, 547 – – riflessioni speculari, 550 – – simmetria e leggi di conservazione, 550 – – simmetria nello spazio e nel tempo, 547 – – vettori polari e assiali, 552 – – violazione della conservazione della parità, 555 simultaneità, 160 – mancanza a distanza, 160 sincrotrone – radiazione cosmica di, 346 – radiazione di, 344 sintonizzazione di una stazione radio, 251 Sirio A, 68 Sistema solare, 46, 47, 67 sistemi lineari, 249-258, 524 – analogie in fisica, 255 – equazioni differenziali lineari, 249 – impedenze in serie e in parallelo, 257 – oscillazioni nei, 253 – sovrapposizione di soluzioni, 251 Smoluchowski, Marian, 437

© 978-8808-22107-0

smorzamento per radiazione, 320-324 – rapidità di radiazione dell’energia, 321 – resistenza di radiazione, 320 – smorzamento dovuto alla radiazione, 323 Snell, Willebrord, 261 – legge di, 261, 310 sodio, 6, 19 Sole, 28, 39, 40 – distanza dalla Terra, 46 – luce al tramonto, 263 – moto dei pianeti attorno al, 62, 91 – – leggi di Keplero, 63 solidi, 5 soluzione/i – indipendenti, 250 – transitoria, 250 sorgenti – di energia, 39 – di luce indipendenti, 324 – in movimento, effetti relativistici nella radiazione, 341 sostanze otticamente attive, v. attività ottica sottrazione (algebra), 220 spato d’Islanda, 338 spazio, 13, 75 spazio-tempo, 16, 176-184 – curvo, 16 – geometria dello, 176 – intervalli nello, 176 – passato, presente, futuro, 179 – quadrivettori, 180 – – algebra dei, 183 specchio – di telescopio, 301 – parabolico, 265 – sferico, 271 spettro visibile, 259 spinta media, 4 spirale di Cornu, 303 Sputnik, 46 stato metastabile, 450 Stefan, Josef - Boltzmann, Ludwig – costante di, 485 stella/e, 28, 67 – ammasso globulare di, 68 – colore e luminosità, 47 – – misura della distanza col metodo colore-luminosità, 47 – distanza dalla Terra, 47 – doppie, 67 – origine, 69 – – dell’energia, 28 – reazioni nucleari, 28 Stevino, Simon, 36 stranezza, 19, 20 suono, 13, 496-504 – della voce, 522 – equazione dell’onda, 499 – – soluzioni, 501 – onde, 496 – piacevole, 526

– propagazione, 498 – – in una dimensione, 498 – velocità, 503 supernovae, 28 T Tamm, Igor, 538 tavola/e – dei logaritmi, 223 – delle potenze, 223 – periodica di Mendeleev, 19, 20, 22 tecnezio, 28 telescopio – potere risolutivo, 301 – specchio di, 301 temperatura/e, 4 – cinetiche, 482 – di un gas, 411 – termodinamica assoluta, 471, 482 tempo, 13, 41-46, 75 – campioni, 45 – definizione, 41, 42 – di dimezzamento, 44 – lunghi intervalli, 44 – medio tra le collisioni, 452 – misura, 42 – piccoli intervalli, 42 – ritardato, 280 – trasformazioni di tempo (relatività speciale), 157 tensione superficiale, 545 teorema – del calore, 474 – del centro di massa, 185 – dell’asse parallelo, 198 – dell’energia di un’onda, 533 – di Pappo, 196 teoria – atomica, 2, 22 – cinetica – – applicazioni, 440-450 – – – cinetica chimica, 446 – – – emissione termoionica, 443 – – – evaporazione, 440 – – – ionizzazione termica, 444 – – – leggi della radiazione di Einstein, 448 – – dei gas, v. gas, teoria cinetica – classica della radiazione elettromagnetica, 259 – del calorico, 464 – del campo unificato, 71 – della gravitazione, v. gravitazione – della relatività, 38 – – conservazione della quantità di moto, 104 – gravitazionale di Einstein, 127, 130 – speciale della relatività, v. relatività, teoria speciale termodinamica, 23, 406, 462-476, 477-486 – energia interna, 477 – entalpia, 481 – entropia, 472

Indice analitico

© 978-8808-22107-0

– equazione di Clausius-Clapeyron, 482 – leggi della, 39 – macchine termiche, 462 – – reversibili, 465 – prima legge, 462 – rendimento di una macchina ideale (reversibile), 469 – seconda legge, 465 – temperatura termodinamica assoluta, 471 – terza legge, 474 Terra – età, 45 – forma, 67 – massa, 70 – moto del sistema Terra-Luna, 66 – pesata della, 70 – velocità assoluta, 155 terremoto/i, 29, 541 Thomson, Joseph John – sezione d’urto di diffusione, 328 timina, 27 timpano, 406 Tolomeo, Claudio, 260 toni musicali, 526 – altezza, 527 – intensità, 527 – qualità, 527, 528 tormalina, 334 traiettoria circolare, 64, 65, 86 transitori, 242-248 – elettrici, 246 – energia di un oscillatore, 242 – oscillazioni smorzate, 244 trascinamento, velocità di, 455 trasformate di Fourier, 252 trasformazione/i – delle velocità (relatività speciale), 168 – di Lorentz, 154, 168, 176 – di tempo (relatività speciale), 157 – lineare, 112 traslazioni, 107 – simmetria delle leggi fisiche rispetto alle, 108 trasmettitori radio direzionali, 289 trasmissioni radio, 15 treni d’onde localizzati, 510 – velocità di fase, 511

– velocità di gruppo, 511 triangolazione, 46 triangolo di Pascal, 54 trottola, moto in rapida rotazione, 209 tubo a raggi catodici, 127 U ultravioletto, 259 unità immaginaria, 226 universo, 278 – età, 45 – geometria, 130 – limite, 48 uranio, 40, 44, 45 Urano – orbita attorno al Sole, 67 urto/i fra corpi, 98, 100, 103 – anelastico, 101 – elastici, 103 – perfettamente elastici, 103 V valore atteso, 55 vapore acqueo, 3, 4, 5 velocità, 76, 85, 86 – angolare, 187 – – vettore, 207 – come derivata della distanza, 79 – come prodotto vettoriale in una rotazione nello spazio, 208 – come vettore, 113 – componenti, 87 – del suono, 503 – dell’etere, 157 – di fase, 511, 544 – di gruppo, 511, 512, 544 – di modulazione, 511 – di trascinamento, 455 – molecolari, distribuzione, 421 – vettoriale, 86 Venere, distanza dalla Terra, 46 vetro, indice di rifrazione, 314 vettore/i, 106-117 – addizione di, 112 – assiali, 206, 552 – componenti, 111 – d’onda, 351 – elettrico della luce, 330 – leggi di Newton nella notazione

569

vettoriale, 114 – polari, 206, 552 – prodotto scalare di, 115 – rappresentazione, 111 – sottrazione di, 113 – unitario, 117 vincolo/i – fissi senza attrito, 143 – forze del, 143 visione – binoculare, 371 – del colore, 355-366 – – colore e intensità luminosa, 356 – – diagramma cromatico, 361 – – fisiochimica della, 364 – – meccanismo della, 362 – – misura della sensazione del colore, 358 – – occhio umano, 355 – meccanismo della, 367-380 – – bastoncelli, 372 – – fisiologia dell’occhio umano, 369 – – forme dell’occhio diverse da quella umana, 375 – – neurologia della, 376 – – occhio composto degli insetti, 373 – – sensazione del colore, 367 vitamina A, 373 voce, 522 vulcani, 29 W Wapstra, Aaldert Hendrik, 556 watt, 133 Weyl, Hermann, 107, 547 Y Young, Thomas, 362 Yukawa, Hideki, 18 Yustova, Elizaveta, 364 Z Zenone, 76 – paradosso di Achille e la tartaruga, 76 zero assoluto, 5 zona d’onda, 288