Metodi Matematici Per La Fisica [1 ed.]


111 32 132MB

Italian Pages 599 Year 1998

Report DMCA / Copyright

DOWNLOAD PDF FILE

Recommend Papers

Metodi Matematici Per La Fisica [1 ed.]

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

I lettori che desiderano informazioni sui volumi pubblicati dalla casa editrice possono rivolgersi direttamente a: Carocci editore via Sardegna 50, 00187 Roma, telefono 06 42 or or 95,

fax 06 42 74 79 31 Ufficio Università via Sicilia r 54, 00187 Roma, telefono 06 42 or 13 64 - -42 or 13 65,

fax 06 42 74 05 34 Siamo su Internet: http://www.carocci.it

Carlo Bernardini

Orlando Ragnisco

Paolo Maria Santini

Metodi matematici della fisica

@ Carocci editore

ristampa, ottobre 1999 r• edizione, ottobre 1993 ' © copyright 1993 by La Nuova Italia Scientifica, Roma © copyright 1998 by Carocci editore S.p.A., Roma 2•

Finito di stampare nelrottobre 1999 dalle Arti Grafiche Editoriali Sri, Urbino ISBN 88-430-15 r7-6

Riproduzione vietata ai sensi di legge 171 della legge 22 aprile r94r, n. 633)

(art.

Senza regolare autorizzazione, è vietato riprodlirre quesro volume anche parzialmente e con qualsiasi mezzo, compresa la fotocopia, anche per uso interno o didattico.

Indice

Prefazione

13

1. Funzioni di una variabile complessa 1.1. Proprietà notevoli dci numeri efi.naplessi 1.1.1. Definizione e operazioni elementari 1.1.2. Interpretazione geometriea 1.1.3,. Ca:kolo vettrnriaie in 2 dimeD:sioni eoD: i n111,:r;lilerii compfessiì 1.2. I _numeri complessi in fisica l.2.1. Osservatori rotanti 1.2.2. Il metodo delle coordinate rnta:nti 1.2..3. Sistemi lineari causali 1.2.4. Cinematica in coordinate polru-i piane 1.3. Funzioni anaJiiti,che 1.3.l. U punto a1finfinito 1.3.2.. La nozione di dominio 1.3.3. Le funzioni di una variabilç complessa 1.3.4. Condizioni di Cauchy-Riemann 1.3.5. Funzioni analitiche e funzioni armoniche 1.3.6. Trasformazioni conformi 1.3. 7. Funzioni elementari di variabile complessa 1.4. Le trasformazioni (mapping) bilineari o di Moebius 1.4. l. Proprietà generali 1.4.2. Trasformazioni elementari 1.4.3. Rappresentazione matriciale del gruppo di Moebius 1.5. Le funzioni analitiche in fisica; l'equazione di Laplace 1.5.l. Campi conservativi 1.5.2. Campi vettoriali piani 1.5.3. La soluzione di problemi armonici mediante il mapping 1.6. Singolarità polari ed essenziali; funzioni monodrome 1.6.l. Zeri di una funzione analitica e loro proprietà

15, 15, t6, 22 25, 25, 26 27 29 30 30 31 32 35 39 40 42 49 49 50 52 54 54 56 58 67 67

7

]5,

METODI MATEMATICI DELLA FISICA

1.6.2. Poli e singolarità essenziali ' 1.6.3. Classificazione delle funzioni analitiche monodrome 1. 7. Polidromia 1. 7 .1. Rami di funzioni polidrome 1.7.2. Superfici di Riemann 1.7.3. Considerazioni topologiche sulle superfici di Riemann

69 71 72 72 74 77

2. Integrazione delle funzioni di una variabile complessa 2.1. Integrali di linea 2.2. Il teorema integrale di Cauchy 2.2.1. Il caso dei domini semplicemente connessi 2.2.2. Primitive di una funzione analitica 2.2.3. Il caso dei domini a connessione multipla 2.3. La formula integrale di Cauchy e i suoi corollari 2.3.1. La formula integrale di Cauchy 2.3.2. Il teorema del massimo modulo 2.3.3. Corollari 2.3.4. Valore principale di un integrale 2.3.5. Formule di Plemelij-Sokhotski 2.4. Integrali su archi infiniti e infinitesimi. Lemma di Jordan 2.5. La causalità e le relazioni di dispersione

81 81 84 84 89 91 95 95 97 99 101 104 108 114

3. Rappresentazioni integrali e per serie 3.1. Considerazioni introduttive 3.2. Domini di convergenza 3.2.1. Convergenza uniforme e criteri di convergenza 3.2.2. Famiglie di funzioni 3.3. Teoremi di Liouville e di Morera 3.3.1. Teoremi di Liouville 3.3.2. Teorema di Morera 3.4. Serie di Tl;l,ylor e di Laurent e prodotti infiniti 3.4.1. Serie di Taylor 3.4.2. Serie di Laurent 3.4.3. Sviluppo di Mittag-Leffier e prodotti infiniti 3.5. Integrali con i residui 3.5.1. Il teorema dei residui 3.5.2. Applicazioni del teorema dei residui 3.6. Il prolungamento analitico 3.6.1. Introduzione 3.6.2. Unicità del prolungamento analitico 3.6.3 . Prolungamento di soluzioni di equazioni

119 119 121 121 123 124 124 125 127 127 132 137 149 149 152 154 154 155 157

8

INDICE

3.6.4. Il prolungamento analitico; punti regolari e singolari 3.6.5. Esistenza del prolungamento analitico 3.6.6. Il principio di Schwarz e la funzione di Jacobi 3.6. 7. Il prolungamento analitico di rappresentazioni integrali 3.6.8. Calcolo di integrali con i residui 3. 7. Sviluppi asintotici 3.7.l. La nozione di sviluppo asintotico 3. 7.2. Operazioni su sviluppi asintotici 3.7.3. Rappresentazioni integrali e sviluppi asintotici 3.7.4. Metodo di Laplace · 3.7.5. Il metodo della fase stazionaria (o di Kelvin o di Stokes) 3. 7.6. Il metodo del punto di sella 3.7.7. Equazioni differenziali e sviluppi asintotici 4. Spazi lineari e operatori lineari 4.1. Linearità e non-linearità in fisica 4.2. Spazi vettoriali di dimensione finita 4.2.l. Spazi vettoriali e vettori colonna 4.2.2. Operatori lineari e matrici 4.2.3. Spazi duali e vettori riga 4.2.4. Basi; trasformazioni e proprietà invarianti 4.2.5. Proprietà spettrali di operatori lineari 4.2.6. Spazi euclidei 4.2.7. Matrici hermitiane, unitarie e normali 4.2.8. Le matrici di Pauli 4.2.9. Rappresentazione polare di una matrice 4.2.10 Funzioni di matrici 4.3. Spazi lineari astratti 4.3.l. Considerazioni introduttive 4.3.2 . Spazi lineari: ·definizione e proprietà 4.3.3. Spazi metrici 4.3.4. Spazi normati 4.3.5. Spazi con prodotto scalare (o euclidei) 4.4. Funzionali lineari e distribuzioni 4.4. l. Nozioni preliminari sugli operatori lineari 4.4.2. Funzionali lineari su spazi normati qualsiasi 4.4.3. Distribuzioni 4.5. Operatori lineari 4.5.l. Esempi di operatori lineari 4.5 .2. Algebra degli operatori lineari . 4.5.3 . Successioni di operatori e loro proprietà di convergenza

9

159 163 169 173 176 194 194 197 199 204 207 208 212 223 223 229 229 237 245 247 252 264 270 280 281 282 286 286 287 290 302 303 311 311 312 323 353 354 356 357

M:ETODI MATEMATICl DELLA FISICA

4.5.4. Operatori ,inverti.bili.. Inverso di. un operator,e 35·9 4.5.5. Operatori. aggi.unti. e autoagg,iunti. su spazi di Hi.ilbert 364 4.5.6. L'equazione 'J!. = A;f 366 4.:5.7. Opera.tiori compatti 369 4.6. Teori.a spettrale degli operatori. 377 4.6.l. Considerazioni preliminari 377 4.6.2. L'operatore risoiJvente 379 4.6.3. Proprietà spettrali degli operatori autoaggiunti. 382 4.6.4. Operatori unitari. e loro spettro 384 4.6.5. Proprietà spettrali degli operatori compatti. 385 4.6.6. Alcuni esempi 386 4.6. 7. Equazioni lineari alle diff.erenze seconde 391 4.6.8. Decomposizione spettrale 394 4. 7. Serie e integrale di Fourier: ulteriori proprietà e applicazioni 412 4.7.l. Proprietà della serie di Fourier 412 4. 7.2. Proprietà e applicazioni dell'integrale di Fourier 416 4. 7.3. Trasformazioni tra operatori. Trasformata di Cayley 427 5. Equazioni integrali e differenziali 5.1. Equazioni integrali 5.1.l. Operatori integrali 5.1.2. Tipologia delle equazioni integrali 5.1.3. Equazioni di Volterra 5.1.4. Equazioni di Fredholm di seconda specie (I) 5.1.5. Equazioni di Fredholm di seconda specie (II) 5.1.6. Equazioni differenziali ed equazioni di Volterra 5.2. Operatori differenziali e funzione di Green 5.2.l. Introduzione; operatori differenziali del I ordine 5.2.2. Operatori differenziali del II ordine 5.2.3. Problemi di Sturm-Liouville 5.3. Funzioni ortogonali in L 2 . Polinomi classici 5.3.l. I polinomi di Legendre; i polinomi di Chebichev 5.3.2. Relazioni di ricorrenza; equazioni alle differenze finite 5.3.3. Polinomi di Hermite e di Laguerre 5.4. Il metodo WKB 5.5. Piccole oscillazioni e modi normali 5.6. Cenno .all'uso dei gruppi di simmetria

431 431 431 437 439 443 447 455 464 464 471 487 504 504 512 514 521 526 540

6. Equazioni alle derivate parziali 6. l. Considerazioni elementari 6.2. Equazioni quasi-lineari del 1° ordine

549 549 554

10

INDICE

6.3. Equazioni quasi-lineari del 2° ordine 6.4. Una formula di Green 6.5. Equazioni a derivate parziali di interesse per la fisica 6.5.1. Introduzione 6.5.2. L'equazione di Poìsson 6.5.3. L'equazione di Helmholtz 6.5.4. L'equazione di Fourier 6.5.5. Problemi di diffrazione e scattering 6.5.6. L'equazione di Schroedinger e gli stati legati 6.6. Il problema del random-walk 6.6.1. Problemi al discreto 6.6.2. Equazioni generali dei processi stocastici stazionari

558 561 569 569 571 572 573 577 580 585 585 589

Bibliografia

593

Indice analitico

595

11

Prefazione

I corsi di laurea in fisica dell'Università italiana prevedono, al terzo anno, un insegnamento istituzionale dal titolo Metodi matematici della fisica. Sebbene in alcune sedi universitarie il materiale didattico necessario sia raccolto in dispense o testi a stampa in lingua italiana, predisposti (almeno per una parte degli insegnamenti impartiti) dal docente locale, ciò che generalmente avviene è che gli studenti siano indirizzati verso più volumi della vasta letteratura anglosassone. Questo può persino essere considerato come un fatto positivo, se si valuta l'importanza sia della conoscenza dell'inglese (o del francese, quando è il caso) sia delle concezioni didattiche di altri paesi. Ma ci è sembrato che un trattato sufficientemente esauriente dal punto di vista dei nostri corsi di laurea tipici avesse, in più, l'eventuale merito di fornire un testo di riferimento utile ai giovani fisici ben al di là delle più strette esigenze del corso e del relativo esame. Il materiale raccolto in questo volume è il risultato di un'esperienza di insegnamento da cui sono emerse, molte difficoltà degli studenti nell'apprendimento della matematica necessaria per capire la fisica. Gli esempi tratti dalla fisica sono perciò, quando è possibile, amalgamati con l'esposizione degli elementi più astratti e più fondamentali dal punto di vista della matematica. La "matematica dei fisici" è notoriamente più spregiudicata della "matematica dei matematici", non tanto perché debba considerarsi "applicata" quanto perché l'apparato dimostrativo dei risultati è assai più leggero quando quei risultati sono sufficientemente intuitivi. Quando possibile, perciò, si è fatta economia di rigore, a favore di argomentazioni ed esemplificazioni che producessero rappresentazioni mentali delle strutture formali impiegate adatte alla successiva interpretazione del significato fisico. Ma non sempre questo è stato possibile, come ben sa chi conosce queste discipline. Il testo è decisamente più ampio di un normale corso. Alcune parti

13

METODI MATEMATICI DELLA FISICA

si possono comunque saltare in prima lettura. Saremo molto grati a tutti coloro che ci segnaleranno erròri od omissioni importanti. Roma, settembre 1993 Carlo Bernardini Orlando Ragnisco Paolo Maria Santini

Nota bene: le notazioni e abbreviazioni usate in questo testo sono quelle comunemente in uso nei corsi d'analisi, così che non abbiamo ritenuto necessario un elenco dei simboli usati. Tuttavia, ricordiamo qui che l'abbreviazione CNES sta per "condizione necessaria e sufficiente"; che Tr (o Tr) sta per "traccia" e det (Det) sta per "determinante"; che, in genere (ma non sempre), gli operatori sono indicati con lettere maiuscole in grassetto (per esempio A); infine, che i simboli [. , .] e{. , .}, molto comuni nel testo, stanno per "commutatore" e "anticommutatore", rispettivamente, salvo il caso in cui è detto esplicitamente che {} è una "parentesi di Poisson". Questa nota sottintende, insomma, che la lettura del testo richiede una ragionevole conoscenza dei corsi di matematica e . di meccanica del biennio. La conoscenza della meccanica quantistica non è un prerequisito, ma molte delle cose qui illustrate hanno la meccanica quantistica come naturale campo di applicazione.

14

1 Funzioni di una variabile complessa

1.1 Proprietà notevoli dei numeri complessi

1.1.1. Definizione e operazioni elementari Ricordiamo che si definisce numero complesso ogni espressione della forma: [1.1]

Z =X+

iy

dove x, y E Re i rappresenta l'unità immaginaria (i 2 = -1); x e y sono detti rispettivamente parte reale e parte immaginaria del numero complesso z : x = Rez, y = Imz (se y = O, il numero sarà reale, se x = O, sarà immaginario puro). Due numeri complessi sono per definizione uguali se hanno uguali parte reale e immaginaria; si dice complesso coniugato di un numero complesso z, e si indica di solito con z (nella letteratura fisica viene usato·spesso il simbolo z*), il numero che ha la stessa parte reale e parte immaginaria opposta: [1.2]

Z

=

X -

iy

Sull'insieme dei numeri complessi sono definite le operazioni elementari di somma (commutativa e associativa) e di prodotto (commutativo, associativo, distributivo rispetto alla somma) nel modo seguente: Somma: [1.3] Prodotto:

15

METODI MATEMATICI DELLA FISICA

Osservazione. L'operazione di somma ammette un elemento neutro, il numero complesso O, caratterizzato dall'avere parte reale e parte immaginaria nulla.

L'opposto di un numero complesso z è indicato con -z e ha parte reale e parte immaginaria opposte a quelle del numero z. La differenza tra due numeri complessi z 1 e z2 è il numero complesso che si ottiene . sommando a z1 l'opposto di z2. Per quanto riguarda il prodotto, è opportuno ricordare che la formula [1.4] si ottiene moltiplicando tra loro - con le solite regole valide per i numeri reali - i numeri z 1 e z2, tenendo conto del fatto che i 2 = -1. Anche il prodotto ammette un elemento neutro, il numero complesso 1, che coincide con il numero reale 1 (vale a dire, ha parte reale uguale a 1 e parte immaginaria nulla). Corrispondentemente, per ogni numero complesso diverso da zero, è possibile definire un inverso: [1.5]

L'espressione non negativa zz = x 2 + y 2 (nulla se e solo se z = O) è chiamata modulo quadrato del numero complesso z, e vi ritorneremo tra poco. Il quoziente (o rapporto) di due numeri complessi z1 e z2 è il prodotto z1 _.(1/z2) ~ (zi/z2) di z1 per l'inverso di z2. Lasciamo al lettore la verifica banale delle proprietà di commutatività, associatività ecc., nonché quella, immediata, che per numeri complessi con parte immaginaria nulla le precedenti operazioni si riducono a quelle sui numeri reali. Osservazione. A differenza del caso dei numeri reali, nel campo complesso non sono definite le nozioni di maggiore e minore. Perché?

1.1.2. Interpretazione geometrica

È conveniente rappresentare il numero complesso z = x + iy come il punto del piano reale di coordinate cartesiane (x , y). In tal modo, i numeri reali sono rappresentati dall'asse x, asse delle ascisse, detto perciò asse reale, e i numeri immaginari dall'asse y, asse delle ordinate, detto asse immaginario. In particolare l'unità immaginaria i sarà rappresentata dal punto (0,1). La corrispondenza tra numeri complessi e i punti del piano è chiaramente biunivoca. È altresì chiaro che, anziché con i punti del piano, i numeri complessi possono essere rappresentati (pure in maniera biunivoca) con vettori applicati nell'origine delle coordinate, di cui il secondo estremo è il punto (x, y). La rappresentazione

16

1. FUNZIONI DI UNA VARIABILE COMPLESSA

dei numeri complessi con vettori del piano è assai utile per comprendere, come vedremo tra poco, il significato geometrico-delle operazioni sui numeri complessi. Una volta introdotta la rappresentazione sul piano, è naturale parlare dell'insieme dei numeri complessi come del piano complesso; nel seguito useremo anche la locuzione abbreviata "piano z", o "piano w" o simili per indicare l'insieme dei numeri complessi indicati genericamente con z, o w. FIGURA

1.1

z =x + i y

y.

X

Accanto alla rappresentazione cartesiana dei numeri complessi, che abbiamo testé descritto, possiamo naturalmente considerare la rappresentazione polare, in cui un numero complesso z è rappresentato dalla coppia di numeri reali (r, cp) dover è la lunghezza (o modulo) del raggio vettore Oz, o semplicemente z, e cp è l'angolo formato dal vettore con l'asse delle ascisse. Osserviamo subito che tale rappresentazione, a differenza di quella cartesiana, non è biunivoca: infatti l'angolo cp è definito a meno di multipli di 21r ( "modulo" 21r) e inoltre il numero complesso O, che corrisponde all'origine del sistema di coordinate, ha ovviamente l'angolo cp indefinito. L'insieme delle possibili determinazioni di cp viene indicato collettivamente con Arg z ( "Argomento di z"); si chiama determinazione principale di Arg z, e si indica talvolta con arg z, quella per cui vale la diseguaglianza:

[1.6]

- 7r


O

(I e IV quadrante)

X

[1.10]

arg z

=

arctg ~ +

1r

per x < O e y 2".: O (II quadrante)

1r

per x < O e y R}; per successione convergente al punto all"oo intenderemo, nello stesso spirito, una successione { Zk} tafo che lim.i.-+oo lzk I = +oo, vale a dire tale che in ogni intorno di oo cadano punti della successione. 1.3.2. La nozione di dominio Considereremo per lo più nel seguito funzioni di variabile complessa definite su insiemi che g,odoFlo di alcune particolari proprietà, e che clùame11emo domini. Per dominio del piano complesso intendiamo un insieme aperto e connesso: dato comunque un punto di D,, 3 un cer-

31

METODI MATEMATICI DELLA FISICA

chio di raggio sufficientemente piccolo centrato nel punto e interamente contenuto in D (insieme aperto); e dati comunque due punti di D, 3 una spezzata completamente contenuta in D che li congiunga (insieme connesso). Un punto di frontiera di D è un punto che~ D, ma in ogni intorno del quale si trovano punti di D. L'insieme di detti punti ~i dice frontiera di D (talora si indica con 8D), mentre l'unione dei punti di D e della sua frontiera si indica con jj e si denota chiusura di D. Come esempio di dominio (illimitato) si può considerare il piano complesso aperto: la sua frontiera è costituita da un unico punto, il punto all'oo, e la sua chiusura è ovviamente il piano chiuso (la sfera di Riemann) . L'insieme dei punti aventi ad esempio Im z > O (il semipiano "superiore") è un altro esempio di dominio illimitato, la cui frontiera è costituita dal punto all'infinito e dall'asse reale. Il più semplice esempio di dominio limitato è un cerchio: l'insieme dei punti {z : Iz - zo I < p}. Ci limiteremo a considerare domini la cui frontiera sia costituita da · un numero finito di curve chiuse, di tagli e di punti. Le curve chiuse e i tagli saranno assunti continui e derivabili con continuità a tratti (unione di un numero finito di archi differenziabili); il numero di elementi connessi che ne costituiscono la frontiera è detto ordine di connessione: se l'ordine di conn_essione è 1 il dominio sarà semplicemente connesso, altrimenti sarà multiplamente connesso. Un cerchio privato di un punto o una corona circolare sono domini limitati doppiamente connessi. L'insieme di punti {z : lzl > R} è un dominio limitato semplicemente connesso - se vi includiamo il punto all'infinito; altrimenti è un dominio doppiamente connesso ecc. Fisseremo su 8D un verso positivo di percorrenza, come quello secondo il quale i punti di D vengono a trovarsi a sinistra. Per domini semplicemente connessi, la cui frontiera sia costituita da un'unica curva chiusa, il verso positivo coincide con il verso antiorario; per una corona circolare, il verso positivo è antiorario sulla circonferenza più grande, e orario sulla più piccola ecc. · 1.3.3. Le funzioni di una variabile complessa Il lettore ha sicuramente già incontrato funzioni complesse di una variabile reale, e non ci soffermeremo oltre su questo punto. Una estensione naturale è costituita dalle funzioni complesse di due variabili reali, che stabiliscono una corrispondenza tra insiemi del piano reale e insiemi di numeri complessi. In virtù della rappresentazione geometrica dei numeri complessi, tali funzioni possono essere utilmente concepite come funzioni complesse di variabile complessa, cioè come leggi che

32

1. FUNZIONI DI UNA VARIABILE COMPLESSA

associano un certo insieme M del pi~no compl~sso z a un altro insieme N del piano complesso w. Scriveremo perciò: w

[1.65]

= f(z)

Ponendo w = u + iv, vediamo che la [1.65] definisce due funzioni reali delle due variabili reali x e y, u(x, y) e v(x, y), che indicheremo come parte reale e parte immaginaria della funzione J(z): w

[1.66]

= J(z) = u(x, y) + iv(x, y)

Quanto appena detto richiede alcuni chiarimenti, che renderanno più trasparenti le peculiarità delle funzioni analitiche, di cui parleremo tra poco. Facciamo perciò alcuni esempi elementari. 1. Consideriamo le funzioni di due variabili reali:

u(x,y) = x v(x,y) = -y La funzione u + iv vale x - iy = z: è la funzione che associa ad ogni . punto del piano complesso il suo complesso coniugato. 2. Prendiamo ora:

u(x,y)=y v(x,y)=x

a)

che scambia parte reale e parte immaginaria di z . Si ha: u

y +ix= i(x - iy) = iz ; u(x,y) = -y v(x,y) = x Si ha in questo caso u + iv = iz. b)

3. Consideriamo:

u(x, y) = x 2 + y 2 v(x, y) = 2xy

a) otteniamo la funzione: U

( 2i z - z) = + iv. = X 2 + y2 + 2ixy = Z Z + 2i ( -z +z) 2 1

= zz + -(z 2 2

33

-

z2 )

+ iv =

METODI MATEMATICI DELLA FISICA

b) (a. prima vista, una. piccola modmca!)

= x2 v(x,-y) = 2xy

u(x,y)

y2

Siha o.ra:: u +iv= z 2 • Gli esempi precedenti ci dicono che resistenza di "funzione di z", cioè di Ùna legge che associa ai punti di un insieme M del piano complesso z i punti di mi: insieme N del piano complesso w , non implica che questa legge sia analiticameHte esprimibile in termini di una funzione della sola variabile z , mentre 1dsl'lllterà generalmente espFimil>He i,a termmì deJl'e variaòil!i z e z. Come vedl-emo, le "funzioni analiiti:che'' sono ap,p unto que-Ue fonzioni1(derivabili con derivate parziali: pri~e continue rispetto a x e a y} che-si possono esprimere in termini di una sola delle due varia:bi:Ji z e z (genernlmente si sceglie z). Se ad ogni z E M corrisponde tl!Il solo w E N, la funzione f ( z) si dirà univoca o a un sol valore; in caso contrario f(z) si dirà a più valori. Se f stabilisce una corrispondem;a himiivoca tra gli insiemi M e N, anche l'applicazione inversa 1- 1 sarà una fanzione univoca, e potremo porre:

[I.67]

Z

=

f

-1 \W , )

Se, accanto a j che applica M in N, è data una nuova fonzione 9 che applica: N in un insieme P, saFà possibile considerare la funzione composta g o f, che associa ai punti z E M i punti ( E P secondo fa legg~:

( = g(w) = g(f(z))

[l.68]

Nel seguito, ci limiteremo a considerare il caso in cui gli insiemi in gioco siano dei domini e indichiamo con D l'insieme di. definizione di

f(z). Possiamo senza difficoltà definire la continuità di una funzione di variabile complessa. Osse-irviamo anzitutto che, se z 0 è un punto di aecumulazione per M:

[l.691

lim J( z ),

z ~ zo

=

W(J

=

uo

+ ivo

è ve:rn se e solo se:.

[l.70]

lim (x, y ) ->(xo,Yo)

u(x, y) = u 0

34

;

lim (x ,y}->( x o,Yo )

v(x, y } = vo,

1. FUNZIONI DI UNA VARlABILE COMPLESSA

Abbiamo infatti lf(z) - wol = J(u(x, y) - uo) 2 + (v(x, y) - v0 ) 2 . Diremo che J(z) è continua in zo E D, se esiste il limite di f(z) quando z tende a zo, e questo limite è uguale a f (zo): [1.71]

lim f (z) Z--+Zo

=

J(zo)

È evidente che la continuità di f in zo equivale alla continuità di u e v in (xo, Yo). La funzione f si dirà continua nel dominio D se è continua in tutti i punti di D. 1.3.4. Condizioni di Cauchy-lliemann Il concetto di continuità, nel caso di funzioni di variabile complessa, non aggiunge quindi nulla a quanto già si sapeva per le funzioni reali di più variabili. Ben diversa, come vedremo, è la situazione per quanto riguarda la derivabilità. Diremo che /(z) è derivabile in zo E D, se esiste, finito, il limite del rapporto incrementale (f(z) - f(zo))/(z - zo) quando z--+ zo: questo limite si indicherà con f'(zo), e si chiamerà derivata di fin zo: [1.72]

. f(z) (zo) llm - --f-

Z-+Zo

z - Zo

= J'( Zo )

La definizione è apparentemente "innocua": in realtà è molto più festrittiva di quanto appaia a prima vista: essa infatti richiede che il limite del rapporto incrementale esista -e sia lo stesso quale ohe sia il modo (la velocità, come grandezza vettoriale) con cui z tende a zo. Ciò impone condizioni severe sulle derivate parziali delle funzioni u(x, y) e v(x, y). Sussiste il seguente Teorema fondamentale: Condizione necessaria e sufficiente per la derivabilità di f(z) nel punto zo ED è che le funzioni u(x, y) e v(x, y) siano differenziabili in (xo, Yo) e le loro derivate parziali prime obbediscano alle "condizioni di CauchyRiemann":

au ay

[l.73J

l. Dimostriamo anzitutto la necessità.

35

avi

OX

xo,Yo

METODI MATEMATICI DELLA FISICA

Se f(z) è derivabile in zo, possiamo considerare il limite del rapporto incrementale quando z tende a zo secondo due direzioni arbitrarie, e dovremo ottenere lo stesso risultato. Scegliamo in particolare le rette parallele agli assi coordinati x e y passanti per (xo, Yo). Lungo la parallela all'asse x si ha:

f (z ) - f (zo) z - zo

[u(x, Yo) - u(xo, Yo)] + i[v(x, Yo) - v(xo, Yo)] X -Xo

e quindi: [l.74]

lim f (z ) - f (Zo) z-+zo

z - zo

= au I ax

+ i av I ax

x=xo y=vo

x=xo

Y=Yo

Lungo la parallela all'asse y risulta invece:

f(z) - f(zo) z - zo

[u(xo, y) - u(xo, Yo)] + i[v(xo, y) - v(xo, Yo)] i(y - Yo) v(xo, y) - v(xo, Yo) . u(xo, y) - u(xo, Yo) -i------y - Yo y-yo

da cui: [l.75]

lim f (z) - f (zo) = av I Z-+ Zo

Z - ZQ

ay

;:;g

-

i au I

aX

;:;g

Eguagliando le formule [l. 74] e [l. 75] si ottengono le condizioni di Cauchy-Riemann [l.73], che sono quindi implicate dalla derivabilità. 2. Dimostriamo la sufficienza della [l. 73], facendo altresì l'ipotesi (contenuta nell'enunciato del teorema, che u(x, y) e v(x, y) siano differenziabili nel punto (xo, Yo)· Sotto questa ipotesi possiamo scrivere:

aul u(x, y) - u(xo, Yo) = ~ (x - xo) + uX xo,Yo aul +~ [l.76]

uy

(y - yo)+a(x,y)lz-zol xo, Yo

avi v(x, y) - v(xo, Yo) = ~ (x - xo) + ux xo,Yo + avi ay Xo,Yo (y - Yo) + /J(x, y)lz -

36

zol

1. FUNZIONI DI UNA VARIABILE COMPLESSA

dove a e (3 sono infinitesimi con z - z 0 . Abbiamo perciò, tenendo conto delle [l. 73]: J(z) - J(zo) z - zo

= t[(x -

xo)

+ i(y - Yo)] + it[(x - xo) + i(y - Yo)] + (x - xo) + i(y - Yo)

+ _(a_+_i/3_)l_z_-_z_oI Z - Zo

Di conseguenza, passando al limite e usando le [l. 73]: [l.77]

lim 1(z)-1(zo) = 8u +i8vl = 8v _i8u Z - Zo 8x 8x xo,Yo 8y 8y

z--,zo

Vale a dire, esiste il limite del rapporto incrementale, cioè la funzione J(z) è derivabile in z 0 . Notiamo che la [l.77] si può scrivere nella forma: f'(zo) = 8f I = -i8f I 8x Xo,Yo 8y xo,Yo

In altre parole, le condizioni di Cauchy-Riemann equivalgono alla seguente relazione tra le derivate parziali di J(z): [l.78] Effettuiamo un cambiamento di variabile, passando da x e y alle variabili z e z; si ha immediatamente: 8 8 8 -=-+-· 8x 8z 8.z,

8 =·(8 8) i--8y

8z

8z

da cui: [l.79]

8 8 8 -+i-=28x 8y 8z

Le condizioni di Cauchy-Riemann equivalgono quindi alla richiesta che si annulli la derivata parziale di f rispetto a z: 8f /8.z = O. Supponiamo che la funzione J(z) sia derivabile non solo nel punto zo, ma in tutto un intorno di z 0 o, più in generale, in un dominio D contenente il punto z 0 . Diremo in questo caso che la funzione f(z) è analitica (o olomorfa) nel dominio D. Abbiamo quindi il Teorema:

37

METODI MATEMATICI DELLA FISICA

Condizione necessaria e sufficiente perché una funzione di variabile complessa sia analitica in un dominio D è che le sue parti reale e immaginaria, u(x, y) e v(x, y), siano differenziabili in ogni punto del dominio e vi soddisfino le condizioni di Cauchy-Riemann.

In modo equivalente, potremmo ricondurre l'analiticità alla validità della condizione: fJJ fJz

[1.80]

=o

cioè alla richiesta che una funzione in un certo dominio dipenda da x = x - iy. Funzioni del tipo:

e y solo attraverso la combinazione z

J(z) = zz = jzj 2

f(z) = Rez;

non saranno quindi analitiche in alcun dominio. Invece, ad esempio, la funzione f(z) = 1/z è analitica in ogni dominio del piano complesso che non contenga l'origine. Osservazione. Le condizioni di Cauchy-Riemann in coordinate polari. Abbiamo ricavato le condizioni di Cauchy-Riemann considerando il limite del rapporto incrementale (J(z) - f(zo))/(z - zo) lungo le parallele per zo agli assi coordinati x e y . È chiaro che potevamo considerare due arbitrarie direzioni indipendenti (in particolare, ortogonali). Potevamo ad esempio scegliere la direzione del raggio vettore Oz0 ( direzione radiale) e la direzione ad esso ortogonale (direzione trasversa) : avremmo ottenuto le condizioni di Cauchy-Riemann in coordinate polari. Ricaviamole ricordando che: x = rcoscp;

y = rsincp

Si ha:

a

Òr

a

a

. a

= cos cp òx + sm cp ay ;

a = coscpa-ax Òr

a

1 . - smcp- ·

r

a +- rcoscpa

-rsincp-

ocp

Òcp'

ax

a -

òy

ay

. a 1 a = smcp- + - coscpÒrr

òy

E quindi le [l.73] assumono le forme: [l.81]

òu

Iòv

8v

l òu

òr

r òcp'

òr

r Òcp

La condizione equivalente per f(z) si scrive, in coordinate polari:

.i_) f ( ~+i òr r éJcp 38

=o

1. FUNZIONI DI UNA VARIABILE COMPLESSA

1.3.5. Funzioni analitiche e funzioni armoniche

Dimostreremo più avanti che la derivata di una funzione analitica in un certo dominio, è anch'essa derivabile (cioè analitica). Per ora, assumiamo la validità di questo risultato e traiamone alcune semplici conseguenze sulle funzioni u(x, y) e v(x, y). Se deriviamo le condizioni di Cauchy-lliemann, otteniamo:

La, prurte xrea:le e la: parte iimma:ginrufa dii una: funzfome a:naliticai sono quindi! funzioni armoniche (soddisfano cioè f'equazione di Laplace in due' dimensioni),. ViceveEsa, data una funzione rea:fe di due vwiabili reaH, a:rmonfua in UI1l certo dominio del piano, possiamo-sempre intenpueta:da come lai pante, rea:le (o immaginaria) di ima funzione analitiea, che può essere ni'cCils_t1mitai a meno di, unai costante. Sup_pCilniamo infattt ehe sia: assegnata una funzi@ne armonica u(x, y) fmUD1certodbmini:o D. O). Consideriamo 1a fonzim1e v(x, y:).

Vo, -

Vo -arg z 7r

[I.153] Vo

(1

-

=

Y)

-l artg - . X

7r

dove V0. è una costante moltipficatirva:. Essa ris.olve il probfema a:r:monico in 2 dimensioni con condizioni al contorno

[l.154]

v(x,O:} w(x,O}

l'o per 0,

x

>

€).

peF X O (a tensione Ve}. Le rimanenti equipotenziali sono [l.155]

v(x,y)

= costante

dove, ovviamente, la costante cambia con continuità da Vfl. a O: si tratta di semirette uscenti dall'oiigirne che foFma:no un angolo arg z con l'asse x( > O); O ~ arg z ~ 1r.

58-

1. FUNZIONI DI UNA VARIABILE COMPLESSA

Queste equipotenziali sono intercettate ad angolo retto dai cerchi con centro in z = O, che rappresentano le linee di forza e corrispondono, per la proprietà geometrica delle trasformazioni conformi, a

u(x,y) = Relnz = Inizi = costante

[l.156]

o, che è lo stesso, lzl = costante = R (raggio del cerchio che rappresenta le linee di forza). Immaginiamo ora di avere una linea chi.u sa, sul piano = u + iv (da non confondersi con le precedenti funzioni u e v). Supponiamo che la linea sia suddivisa in due tratti , 1 e ,2 (, = , 1 + ,2). Vogliamo costruire una funzione armonica V ( u , v) tale che

w

[l.157]

V(u , v)

O

su,1

V(u,v)

Vo

su,2

Per risolvere questo problema si può impiegare il seguente lemma: Se V(u, v) è armonica nel piano w (fatta eccezione, al più, per alcuni punti isolati) e se z = J(w)

[l.158]

è una trasformazione conforme, allOra V è armonica anche nel piano z (fatta eccezione, al più, per alcuni punti isolati). La dimostrazione è immediata: 2 2 2 2 a v (8x) 8 V (aauy) + ' 8x 2 au + 8y 2

av a2 x

av a2 y

+ 8x 8u2 + ay

8u2

v2 (ay) -a8xv2 (ax) -av +aoy+ , av 2

8v 2

+

2

2

av a 2x ax 8v 2

+

2

av a 2y 8y 8v 2

ma siccome per ipotesi

a2 a2) (-au2 + u v2

[l.159]

!l ,

V

=

O

ed inoltre, per le condizioni di Cauchy-Riemann,

{l.160]

(!:f + (!:f = (!~f +

(ayf 8v

fP x 8u2

o

+

éJ2x ov 2

a2y 8u 2

+ 59

a2y 8v 2

D >

o

METODI MATEMATICI DELLA FISICA

segue che, quando D -=/- O [l.161]

2

8 v72 V = ( àx2

+

8

2)

V

ày2

=

O

come affermato dal lemma. Se ora la trasformazione conforme z f(w) trasforma Ì l nel semiasse x < O, ì 2 nel semiasse x > O e l'interno di ì nel semipiano y 2:: O, il problema armonico nel piano w diventa il problema armonico elementare che abbiamo esaminato all'inizio del -paragrafo. Pertanto, la funzione armonica V(u, v) è semplicemente [l.162]

V(u,v)

=

v0 [1-;arg

f(w)]

Naturalmente, il problema è spostato dalla soluzione dell'equazione [l.159] con le condizioni al contorno [l.157] a quello di determinare l'appropriata trasformazione f(w). Esempio Il contorno ì è costituito da due archi di cerchio di raggio R, ìI e ì2· La lunghezza di ì2 è R(1r + zo tale che limk .... 00 f (zk) = A. Se viceversa esiste almeno un intorno di z 0 in cui f(z) =I- A, la funzione g(z) = 1/(f(; ) - A) è analitica in questo intorno. D'altra parte, il punto zo non può essere né un polo né una singolarità eliminabile per g(z), altrimenti f(z) = A + 1/g(z) sarebbe analitica in zo: zo deve essere una singolarità essenziale anche per g(z) e quindi, in particolare, deve esistere una successione Zk -> zo tale che limk .... 00 lg(zk)I = oo (altrimenti g(z) sarebbe limitata nell'intorno considerato). Ne segue che, su tale successione, limk .... oo IJ(zk) - Al = limk .... oo 11/g(zk)I = O. Abbiamo fin qui parlato di singolarità isolate. È facile però costruire esempi di funzioni con punti di singolarità non isolati. Si prenda ad esempio la funzione f(z) = 1/ sin z . Essa ha poli (del I ordine) nei punti Zk = k1r. II punto all'infinito è perciò una singolarità . non isolata per f (z). Analogamente, l'origine è una singolarità non isolata per J(z) = f(l/z) = 1/sin(l/z).

1.6.3. Classificazione delle funzioni analitiche monodrome Dal tipo di singolarità al finito di una funzione analitica monodroma, discende la definizione di due classi importanti di funzioni analitiche, le funzioni intere e le funzioni meromorfe. 1. Funzioni intere. Si chiamano funzioni intere le funzioni (analitiche monodrome) che non hanno singolarità al finito. Esempi di tali funzioni sono le potenze intere positive, i polinomi, la funzione esponenziale ez, le funzioni trigonometriche e iperboliche sin z, cos z, sinh z, coshz. È chiaro che esse formano un'a1gebra (combinazioni lineari e prodotti di funzioni intere sono ancora funzioni intere). Vedremo più avanti (nel par. 2.3), che una funzione analitica in tutto il piano complesso chiuso (sfera di Riemann) è necessariamente una: costante. Quindi le funzioni intere diverse dalla costante devono avere una singolarità all'infinito. Ritorneremo su questo punto, ma è facile fin d'ora rendersi conto che le potenze intere e i polinomi hanno singolarità polari all'infinito, mentre le trascendenti intere quali l'esponenziale ez hanno una singolarità essenziale. Un possibile modo di vederlo è quello di effettuare una semplice "inversione" (cfr. [l.106])

( = ~ z

che trasforma il punto all'infinito nell'origine (e viceversa), e studiare poi la funzione f(() = f(l/() nell'intorno di ( = O.

71

METODI MATEMATICI DELLA FISICA

Anzi, si può addirittura usare questa inversione per definire il tipo di singolarità all'infinito. Diremo cioè che una funzione f (z), analitica e monodroma in un intorno del punt9 all'infinito, ha ivi una singolarità polare o essenziale, se la funzione /(() = /(1/() ha una singolarità polare o essenziale nell'origine. 2. Funzioni meromorfe. Si dice meromorfa una funzione analitica monodroma le cui uniche singolarità al finito sono poli. È chiaro che le funzioni intere sono esempi particolari (i più semplici) di funzioni meromorfe. Esempi semplici di funzioni meromorfe sono le funzioni razionali (rapporti di polinomi); funzioni meromorfe sono anche le funzioni trigonometriche e iperboliche come sec z, cosec z, tg z, cotg z, sech z, cosech z, tgh z, cotgh z. Si osservi che una funzione meromorfa, in ogni dominio limitato del piano complesso, può avere al più un numero finito di poli (se ve ne fossero infiniti, essi avrebbero un punto limite ... ); mentre, come abbiamo visto per la funzione 1/ sin z, i poli possono benissimo accumularsi all'infinito. Per le funzioni meromorfe, non solo possiamo fare combinazioni lineari e prodotti senza "uscire dalla classe", ma anche rapporti; anzi una generica funzione razionale di funzioni meromorfe è ancora meromorfa.

1.7 Polidromia 1.7.1. Rami di funzioni polidrome Nel par. 1.3.6 sono stati introdotti alcuni esempi notevoli di funzioni analitiche w = f (z), come w = zn, w = e2 ecc. Per tali funzioni la trasformazione del dominio di definizione D di f(z) nel dominio D' = f (D) = {w = f (z), z E D} non è biunivoca; la funzione inversa z = J- 1 (w) è quindi polidroma in D', nel senso che ad ogni valore w E D' corrispondono più valori di z E D. La teoria delle funzioni polidrome è riconducibile a quella delle funzioni ad un solo valore se si riesce ad individuare i cosiddetti rami monodromi di 1- 1 ( w). Questo è risultato possibile in tutti gli esempi presi in esame nel par. 1.3.6, attraverso un procedimento che consiste nell'individuare una famiglia (numerabile) di domini Dk e D disgiunti (i cosiddetti domini di monodromia) su ciascuno dei quali f( z ) è biunivoca, e tali che, se z E D, allora z E Dk per un certo k

72

1. FUNZIONI DI UNA VARIABILE COMPLESSA

oppure z è un punto di frontiera comune ad almeno due sottodomini (indicheremo con r l'insieme di tali punti di frontiera). D ammette quindi la decomposizione D = (ukDk) U r; inoltre la continuità di f(z) fa sì che gli insiemi D~ = f(Dk) siano anch'essi domini e che D' = J(D) = (ukDD u J(r). La funzione polidroma f- 1 (w) fa corrispondere ad ogni w E D' un 1 certo insieme di valori (w)} E D, ciascuno dei quali appartiene ad uno solo dei domini Dk; il ramo monodromo k-esimo (f- 1 (w))k di 1- 1 (w) è quindi quella legge che associa ad ogni w E D~ quell'unico valore di 1- 1 (w) che appartiene a Dk.

u-

FIGURA

1.15

0

Dk, k = r1(w)=w

1,2 ,3

1/3

a

b

Per la funzione "potenza n-esima" f (z) = zn e per la sua inversa 1- 1 (w) = w¼, i domini di monodromia Dk del piano complesso z sono ad esempio i settori Dk : (2k - 3)1r/n < arg z < (2k - l)1r/n, k = 1, ... , n; r è l'insieme dei raggi rk : arg z = (2k-3)1r /n, k = l, ... , n; le immagini D~ di Dk sono altrettante repliche Tk del piano complesso w, privato del semiasse reale negativo (cioè tagliato lungo tale 1 (w))k = viwfei(arg w+ 2 (k-l)1r)/nl, semiasse) e W E Tk, k = 1, !2, ... , n (fig. 1.15a). Per la funzione esponenziale f(z) = ez e per la sua inversa J- 1 (w) = Log w, i domini di monodromia sono ad esempio le strisce Dk: (2k - l)1r < Im z < (2k + l)1r, k E Z; r è l'insieme delle rette rk : Im z = (2k - l)1r, k E Z; Dk = f(Dk), k E Z sono altrettante repliche Tk del piano complesso w, tagliato lungo il semiasse

u-

73

METODI MATEMATICI DELLA FISICA

reale negativ() e

u-1(w})k

:;a;

ln /w/

+ i(afg

w + 2k1r), w E Tk, k E Z

(fig, 1.15b). 1. 7.2. Superfici di Riemann Le f1:1:nzioni w = z¼ e w = z + (z 2 - 1)½ studìate nel par. 1.3.6 sono esempi di funzioni alijebrkhe, cioè di funzioni w = f(z) che soddisfano 1'equa,zione funzionale m

Ì: aj(z)wm-j = O,

[l.179]

ao(z) # O

j=O

in cui aj(Z) sono polinomi in z assegnati. Le funzioni algebriche sono in generale polidrome in z e si è interessati a; l. individu!;!.re i loro punti di diramaiione; 2. costruirne i rami monodromi e studiare il modo in cui si trasformano l'~o, nell'altro circ0:itando, i punti di diramazione; 3,. studiare integrali del tipo z

F(z) =

[l.180]

j R(z, f(z))dz zo

definitl scegliendo un rarno di. f(z) nel punto zo, ed una traiettoria da Z o pre~ssato, lf( zk ) - f( zk+i)I < f.. Poiché per ipotesi Jpdzf(z) = O, abbiamo I f-r dzf(z)I = I f-r dz f( z ) - fp dzf( z )I Indicando con 'Yk il tratto di curva compreso tra Zk-l e Zk, e con Pk il corrispondente lato della poligonale (di lunghezza lzk - zk_ 1 1), abbiamo:

li :, ;: t11'Yk

dzf(z)I :S

t11k dzf(z) - 1k dzf(z)j =

dz[f(z) - f(zk_i)]

+

k= l

=

1'Yk

dzf(zk - 1)

-1Pk

dzf(z)I =

t11k dz[f( z ) - f(zk_i)] -1k dz[J(z) ~ J(zk_i)Jj < n

:SI: f.· [lunghezza di 'Yk + lunghezza di Pk] $ 2f. ·

f_

k~l

(f : lunghezza di 'Y)

Dall'arbitrarietà di

t:

segue

J, dzf (z) = Q.

b,) In conclusione, l'tlniea cosa che Festa da dimostrare è che l'integrale di una funzione analitica Sll un arbitrario cont x + iO, e 01 - 02 -> z-> x - iO; quindi F+(x) - F-(x) = l.

1r -

21r

=

-1r

per

Anche da questi due esempi si evince che la funzione F(z) può presentare problemi solo sul contorno ,; sorgono spontanee, in particolare, le seguenti domande. 1. Ha senso parlare di limite di F(z) quando z tende ad un generico punto ( del contorno ,? 2. Che relazione intercorre tra questo limite ed il valore di J(z) in (? Rispondiamo brevemente alla prima domanda osservando innanzitutto che, per essere ben definito, il limite di F(z) non deve dipendere dalla direzione con cui z tende al punto ( del contorno, escludendo soltanto la direzione tangente a , in (. Vale a questo proposito il seguente Teorema, che qui enunciamo senza dimostrazione. CNES affinché una funzione F(z), analitica nel dominio Di, interno alla curva chiusa ,, abbia ovunque (o quasi ovunque) un limite sul

100

2. INTEGRAZIONE DELLE FUNZIONI DI UNA VARIABILE COMPLESSA

contorno ,, è che esista una successione di contorni ìn contenuti in Di e tendenti a,, tali che

per un certo M che non dipende da n. Lo stesso risultato vale nel caso di una funzione analitica nel dominio De esterno a,. Gli esempi precedenti rientrano ovviamente nelle ipotesi di questo teorema. Per rispondere al secondo quesito è necessario introdurre la nozione di valore principale di un integrale. 2.3.4. Valore principale di un integrale

La nozione di valore principale generalizza quella ben nota di integrale improprio. Si definisce sull'arco , di estremi o: e /3 una funzione g(z) continua su , ad eccezione di un punto ( E , in cui g diverge. La circonferenza centrata in ( di raggio 1; sufficientemente piccolo intersechtlrà , nei punti (' e (" in fig. 2.5a, e gli integrali

1

1~

ç'

g(z')dz'

g(z')dz',

("

lungo le porzioni (o: (') e ( (" /3) del contorno , sono quindi ben definiti > O. Se, per f -+ O, i limiti dei due integrali esistono entrambi, la loro somma è l'integrale improprio di g(z) lungo ,. Se invece i due limiti divergono separatamente, ma esiste il limite della loro somma

t/1;

lim e--+O

(1

1 ~

('

g(z')dz' +

g(z')dz')

("

O

(questo è possibile quando le divergenze dei due integrali si cancellano esattamente) , questo limite prende il nome di "valor principale" di g(z) su , , ed è indicato convenzionalmente in uno dei seguenti modi:

PI, g(z')dz',

V PI, g(z')dz'

Se g(z) ha un numero finito n di singolarità ( 1, (2, ... , (n su , (fig. 2. 5b), si ha ovviamente che [2.35] P

1 ~

'

g(z')dz' = lim

e--+O

(L 1(./+1 g(z')dz'), ,-u n

.

J=O

'1

101

(o"

= o:, (~+ 1 = /3

METODI MATEMATICI DELLA FISICA

Se le singolarità di g(z) sono sommabili, la nozione di valor principale di un integrale coincide ovviamente con quella di integrale improprio. FIGURA

2.5

,,, I

i'

a

I

p

b

a

a

Esempio Un esempio classico è fornito dalla funzione g(z) E (a,b) , a,b E R. Si ha che

= (t- z)-n, n

E

N con z

l 1

x-, (t !tx)n

= { ~-~): ((x _ ~)n-l

b

-

En~l ),

1n E - ln(x - a),

a

1

1

se n f 1 se n = 1

1

dt - ) ' se n f 1 -,----,-= {1_ -n ( (b _ x)n-1 - -En-1

x+,(t-x)n

ln(b-x)-lnt:,

sen=l

e quindi l'integrale improprio di g(t) su (a,b) non è definito, mentre il valore principale è ben definito se e solo se n è dispari:

p1b a

1

dt (t-x)n

=

1

1

l-n((b-x)n-1 . { l nb-x --, x-a

+ (x-a)n-1),

D'ora in avanti ci occuperemo di integrandi del tipo

g(z') = f(z') z' - z 102

se n f 1, n ·dispari se n

=1

2. INTEGRAZIONE DELLE FUNZIONI DI UNA VARIABILE COMPLESSA

dove z è un punto generico del contorno 'Y, ad eccezione dei suoi estremi (tale limitazione è assente se 'Y è un contorno chiuso), chiedendoci sotto quali ipotesi su f (z') esista il valor principale F(z)

[2.36]

=

~pi 21ri

'Y

f(z') dz',

z' - z

z E 'Y

Andremo a dimostrare che lo spazio naturale per f (z) è lo spazio delle funzioni di Lipshitz (o di Holder) sul contorno 'Y, tali che 'v' z 1 , z2 E 'Y,

dove ;;, e µ sono costanti positive e µ viene detto esponente di Lipshitz (di Holder). Si noti che, per O < µ < l, la funzione f(z) è più regolare di una funzione continua su 'Y e meno regolare di una funzione derivabile su 'Y- Ad esempio, si mostri che la funzione f(x) = 1/ln lxi, continua in ( -1, 1), non è ivi lipshitziana. Teor; ma di Privalov-Muskelzshvili. Se f (z) è lipshitziana di esponente O < µ < l sulla curva 'Y, allora esiste il valor principale F(z) definito in [2.36] 'v'z E 'Y, ad eccezione dei suoi estremi; inoltre F(z) è essa stessa lipshitziana di esponente µ se µ µ = l.

< l, e di esponente l -

f

se

Dimostrazione. Ci limitiamo a dimostrare l'esistenza di F(z) e la sua continuità in ogni intervallo chiuso contenuto in 'Y· Conviene innanzitutto riscrivere l'integrale, privato dell'arco 'Y, = ('(", nella forma

~ 21ri

1

-y--y,

~(z') dz' z - z

=~ 21ri

1

-y--y,

f(z'~ - f(z) dz' z - z

+

f(z} 21ri

1

-y--y,

dz' z1 - z

Dalla condizione di Lipshitz segue che

1(z') - 1(z) I < ,.,, I

z' - z

-

1

lz' - zll-µ

quindi il primo integrale a secondo me'mbro è assolutamente convergente nel senso ordinario ed il suo limite, per E ---+ O, tende ( uniformemente in z) alla funzione continua _l 21ri

1

f(z') - f(z) dz'

'Y

z' - z 103

METODI MATEMATICI DELLA FISICA

Per il secondo integrale si ha che

1

~ = Ln(,8- z) -

,-,. z - z

Ln(a - z) - (Ln((" - z) - Ln((' - z))

dove i rami della primitiva Ln ( z' - z) sugli archi (a (') e ( (" ,8) si devono raccordare con continuità, ad esempio attraverso la semicirconferenza di fig. 2.6. Quindi, se z è un punto regolare di 1 , si ha che lim [Ln((" - z) - Ln((' - z)] = -i1r e-+0

.

ed il valor principale [2.35] esiste ed è dato dalla funzione [2.37a]

F(z)

= ! f(z) + f (z! 2

ln ,8 - z

a- z

2m

+~

1

2m ,

f(z') - f(z) dz' z' - z

continua su ogni sottoinsieme chiuso di 1 . Se I è chiuso, cioè se a si ha che

~p1

[2.37b]

FIGURA

21ri

f(z') dz' =

, z' - z

! f(z) + ~ 2

= ,8,

1

2m ,

f(z') - f(z) dz' z' - z

2.6 ì' i",- ... , , I I

I

2.3.5. Formule di Plemelij-Sokhotski Siamo finalmente in grado di rispondere al quesito 2 del par. 2.3.3.

Teorema. Sia F(z) la funzione analitica definita dall'integrale F(z) =

~

1

f(t) dt,

2m , t - z

104

z r/.,

2. INTEGRAZIONE DELLE FUNZIONI DI UNA VARIABILE COMPLESSA

con f (t) lipshitziana su ì; se z tende ad un punto regolare ( del contorno ì in ogni direzione non tangente a ì, F(z) tende verso i limiti

[2.38] dove i segni ( +) e ( - ) corrispondono. al caso in cui z -+ ( rispettivamente dall'interno e dall'esterno del contorno ì, percorso in senso antiorario.

Le formule [2.38], dette formule di Plemelij-Sokhotski, valgono anche quando ì è aperto; in questo caso i segni ( +) e (-) stanno ad indicare che z -+ ( da sinistra e da destra, rispetto al verso positivo di percorrenza di Ì· Se ì è l'asse reale (o una parte di esso), allora: p± x (

)

= lim -l P 21ri

c---+O+

J -Y

. f(t) dt = t - (x ± ù:;)

Dimostrazione. Per semplicità dimostreremo il teorema nel caso di contorno chiuso. Notiamo innanzitutto che, se d = mintE-y lz - ti e h = lz - (I, allora il rapporto h/d resta limitato al tendere di z a ( in ogni direzione non tangente a ì (cfr. fig. 2.7). FIGURA

2.7 y

Riscriviamo F(z) nella forma:

F(z) = iii(z)

+ !2((! 7ft

1-t

dt ;

'"Y

-

z

105

iI!(z) =

~ 21ri

J -Y

f(t) - J(() dt t- z

METODI MATEMATICI DELLA FISICA

quindi, usando il teorema di Cauchy, si ha che I

se z E Di se z E De

+ /(() F( z ) -- { \J!(z) \J!(z)

Mostreremo ora che, per z ----+ ( sia da dentro che da fuori lungo ogni direzione non tangente a , in (, \J! ( z) tende alla funzione

w(() =

~1 2?Ti

f(t) - !(() dt

t- (

-y

Questo risultato e l'equazione [2.37b] implicano immediatamente le formule [2.38]. Si costruisce la differenza

\J!(z) ~ \J!(() = z - ( . 2?Ti

1 -Y

f(t) - f(() dt (t - ()(t - z)

e, seguendo un procedimento logico assai utilizzato in questo testo, si decompone l'integrale a secondo membro nella somma di due integrali lungo l'arco , 1 , che contiene (, e lungo la parte restante ,2- Si mostrerà che è possibile scegliere , 1 sufficientemente piccolo da far sì che l'integrale su , 1 sia piccolo a piacere, ma sufficientemente grande, rispetto alla distanza di z da(, da far sì che anche l'integrale su sia piccolo a piacere. Se z ----+ ( lungo ogni direzione non tangente a , 1 in (, si ha che l(z - ()/(t- z)I ~h/d e, quindi,

,2

_1 1

2?Ti

1 -Yi

(z - ()(f(t) - /(()) dtj < ~ (t - z)(t - () . - 2?Td ~h soj+~s

= 2nd

so-~s

1 -y

lt -

l

(1 1 -µ

Jdtj =

ds l,(s) - ,(so)l 1 -µ

essendo , = ,( s) l'equazione parametrica della curva , 1 , con ,( s 0 ) = ( e con s parametro di lunghezza d'arco (ld,/dsl = 1). Poiché ( è un punto regolare, il rapporto tra la lunghezza della corda l,(s) - ,(so)I e la lunghezza dell'arco ls - sol è limitato; quindi l'ultimo integrale è convergente e, Vt > O, esisterà un 8, > O tale che detto integrale è minore di t/2 per 6.s < 8,. Una volta fissata la lunghezza 28, dell'arco si osserva che Vt E lt - (I e lt - zl restano maggiori di una quantità fissata (ma piccola); basta quindi scegliere z sufficientemente vicino a ( per rendere anche l'integrale su , 2 minore di t/2.

,1

,2,

106

2. INTEGRAZIONE DELLE FUNZIONI DI UNA VARIABILE COMPLESSA

In un linguaggio più fisico si direbbe che la di.stanza jz -(j deve essere un infinitesimo di ordine superi.ore rispetto alla dimension_e linea.re dell'arco ')'i, anch'essa infinitesima! Questa formulazione del ris.1dta:to ci riporta a tante dimostrazioni dei corsi di Elettromagnetismo, nelle qua.li d. si pone in un pun.to P in prossimità di uno .strato di carica (odi corrnnte) e si risente di due contributi, l'uno dovuto allo .straterello innnitesimo prospiciente a P e l'altro dovuto al resto deifo strato. Questa analogia è pmfonda; esiste infatti un i~game assai st!'etto tra l'integrale di Cauchy [2.32], ii potenziale

u{x , y}

=

1

f-n

.µ --dl :I r

generato da un doppio strato linea.re di. densità di momento µ ed i1 potenziale

v(x,y) =

-i

.Àln rdl

generato da uno strato lineare di densità di cari.ca FIGURA

À.

2.8

p (x,,y)

Dato l'integrale di Cauchy:

F(z) =

~

1

21ri · -Y

con cp(,t'~ E Re z

cp(t) dt t- z

= x + iy, la sua parte reale ed immagmaria valgono

f

Im F = - 1 , cpd(in r~ 27r "I . avendo introdotto coordinate poiari t - z = re•0 , per le .quali si ha che dt/(t- z) = d(ln r) +id0. Perla funzione analitica Jn:(t -z) = In r +i0

107

METODI MATEMATICI DELLA FISICA

valgono ovviamente le condizioni di Cauchy-Riemann

80

aln r

---

as

on

rispetto alle coordinate ortogonali (s, n) corrispondenti ai versori i e Ne segue che

n, tangente e normale allo strato nel punto generico t(s).

1

Re F = ]__ 2rr

l

= - 2rr

cp d0 ds = - ]__ ds 2rr

1

'Y

1

cp dr l dn ds = 2rr

'Y -:;:

cp d ln r ds = dn

1 n. 'Y

'Y

f

cp-r-ds

e quindi la parte reale dell'integrale di Cauchy descrive il potenziale di un doppio strato di densità di momento cp/2rr. Per quel che riguarda Im F, assumendo che, sia chiuso ed integrando per parti, si ottiene Im F

= _]__ 2rr

1 'Y

cp d(ln r) ds = ]__ ds 2rr

1 'Y

dcp ln rds ds

che è il potenziale di uno strato di densità lineare - 1/2rr dcp/ds. Queste ed altre applicazioni fisiche, già note alla fine del secolo scorso, hanno stimolato per diversi decenni lo studio delle proprietà matematiche degli integrali di Cauchy. 2.4

Integrali su archi infiniti e infinitesimi. Lemma di Jordan In molte applicazioni è necessario calcolare l'integrale

1

[2.39]

J(z)dz

"/p

su un arco di cerchio che sottende l'angolo a, nel limite in cui il raggio p di tale cerchio tende all'infinito o tende a zero. Diremo che una funzione g(z), continua nella regione D "spazzata" dall'arco Ìp in questo limite, tende a zero uniformemente, rispetto all'argomento di z, per p = lzl ----> oo (o per p ----> O), se esiste una costante µP (che dipende solo da p) tale che

µp---->O ,

p---->oo

108

(operp---->O)

2 . INTEGRAZIONE DELLE FUNZIONI DI UNA VARIABILE COMPLESSA

Si dice inoltre che g(z) tende ad A uniformemente, se g(z) - A tende a O uniformemente. Ad esempio, la funzione g1 ( z) = exp( iz 2) tende a O uniformemente, per p--+ oo, sull'arco Ìp definito da O< ao S arg z = cp S 1r/2 - a 0 < 1r /2, poiché

lgi(z)I = e-psin2cp S e-psin2o-0 ,

O< ao
:(i), .im l. R->oo

i

e ikzf{ . . z )dz= ,1'(j)

½Cn

Qun,1n.i;'fJ k < O, la [2.40a] vaZe 1anc0m se 1/2 CR è il semicerchio del semipi:ati:0 :inferiore. Se 'f i~t~g,ran:do ,delta [2.39] ·contierre invece H fattore etz, t •E R, come Sl!looede ,ne'll'antìtrasformata di Lap1'8:ce {-c'fr. par. 3.6.9), an'ovvia modifrca-zione de'l i'emnra dii Jordan d. '8,SSicura ·che:

swl .semicerchio l('2CR nel semipiano di sinistra (Re z < 'O) set > O, e in ,quetZo cdi ,destra {Re z > 0) set < ·(,), nell'ip0tesi in oui f(z) -+ O uniformemente su 1/2 Cn.

U(i)

2. INTEGRAZIONE !')ELLE Fl!J.NZIONI DI UNA VARJiARELE COM!PILESSA

Dimostraziome. Se k > O e 1/2 CR è il semicerchio. del semipiano, superiore, si ha che

~ R 1-rr e-/i:Rsin,pl.J(z)ldip ~ RµR 1-rr e-kRsin,pdcp Osserviamo ora che la funzione sin t.p è simmetrica rispetto al punto di mezzo = 1r/2 dell'intervallo (0,1r) di integrazione. Inoltre, per O~ t.p ~ 1r/2 vale la diseguaglianza di Jordan (graficamente evidente) t.p

.

2

smt.p 2: -t.p,

o< -

7r

t.p

7r

-< -2

così che:

IIRI

1o

~ 2RµR 11½ e-kRsin,pdcp ~ 2RµR

1½ e _llR,pd _ 1rµR(l " cp- -k- -e

-2kR)

---+

0,

,

R---+ oo

Se k < O l'argomento si può ripetere sostituendo il semicerchio nel semi- · piano superiore con quello, simmetrico rispetto all'asse reale, nel semipiano inferiore.

Illustriamo ora alcune semplici conseguenze di questi risultati. a) Si vuole calcolare l'integrale _1 21ri

i

"I

f!z') dz' z' - z

lungo un contorno chiuso 'Y, dove f (z) è una funzione analitica all'esterno di 'Y e tale che f(z) ---+ A uniformemente per lzl ---+ oo. Sia inoltre z un qualsiasi punto del piano complesso. Per calcolare tale integrale consideriamo il dominio doppiamente connesso V' in fig. 2.9, che ha come frontiera interna 'Y e come frontiera esterna il cerchio C R centrato nell'origine e di raggio R sufficientemente grande da contenere z, se questi è esterno a 'Y· Per il teorema di Cauchy e per la formula integrale di Cauchy abbiamo che _1

21ri

J

f(z') dz' = { O, - f(z),

Ja1Y z' - z

111

se z E Vi sezEV'

METODI MATEMATICI DELLA FISICA

dove Di è il dominio interno a ì· Nel limite R---> oa, facendo uso del lemma 2, otteniamo quindi la cosiddetta "formula integrale di Cauchy per domini illimitati": _1_ 21ri

J

f (z') dz' z

h z' -

= { A,

se z E Di se z E 'De

A - f ( z),

dove Di e 'De sono i domini interno ed esterno a FIGURA

Ì·

2.9

-R

R

b) Dato un contorno ì passante per il punto (, se ì+ (E) e ì- (E) sono i contorni "dentati" in fig. 2.10, ottenuti deformando ì intorno a ( con gli archetti (i denti) infinitesimi di raggio E, che girano intorno a ( in senso antiorario ed orario rispettivamente, allora [2.41]

lim _1 21ri

e---,0

1

')'±( O, :lbe tale che la - ao/ < be implica /f(z, a) - f (z, ao)/ < f. quale che sia z( E 1 o

ED). In questo caso si può "passare al llmite sotto il segno d'integrale"; vale cioè la formula:

[3.10]

lim

o-+oo

1 "f

dzf(z, a) =

1 "f

dzf (z, ao)

Abbiamo ovviamente supposto l'esistenza degli integrali; 1 è una qualunque curva su cui è verificata la convergenza uniforme. Consideriamo infine una funzione f (z, () definita per ogni z appartenente a un dominio D e per ogni ( appartenente a una curva 1 · Sia "In una successione di curve tali che: "In e "fn+l e . . . e 1- Diremo che l'integrale: - ·

[3.11]

F(z)

=

1

d(f(z,()

123

METODI MATEMATICI DELLA FISICA

converge uniformemente rispetto a z E D, se VE > O:lno (E) tale che n > no(E) implica: [3.12]

11'Y

d(f(z, ()

-1

d(f(z, ()I < E

"In

Una condizione sufficiente per l'uniforme convergenza dell'integrale [3.11] è che Vz E D, J(z, () sia maggiorata in valore assoluto da una funzione (positiva) g(() tale che J'Y ld(lg(() < oo. È ovvio che, sotto questa ipotesi, l'integrale è convergente; la convergenza è inoltre uniforme perché:

Osserviamo che questa condizione è verificata dalla funzione:

f (z, t) = et(z-1),

(t

= ()

di cui alla formula [3.5]. 3.3 Teoremi di Liouville e di Morera

3.3.1. Teoremi di Liouville

Sia f(z) una funzione analitica e limitata nell'intero piano complesso: allora f(z) è una costante (primo Teorema di Liouville). La dimostrazione segue immediatamente dalla [2.31]: prendendo come curva 'Y una circonferenza di centro z e raggio R, si ha:

lf'(z)I

~~

(lf(z)I

~M

Vz)

da cui, facendo tendere R all'infinito:

IJ'(z)I =O=> J'( z) =O=> J(z) = cost Il secondo Teorema di Liouville è una estensione del risultato precedente.

124

3. RAPPRESENTAZIONI INTEGRALI E PER SERIE

Supponiamo che f ( z) sia analitica in ogni dominio limitato del piano complesso e il suo modulo non cresca piu rapidàmente di MJzlm quando Jzl ---, oo: allora f(z) è un polinomio di grado non superiore a

m. La dimostrazione utilizza la [2.31] scritta per n = m + l. Sia z 0 un punto qualsiasi del piano complesso: nel cerchio di centro z 0 e raggio R si ha Iz I ~ Izo I + R (diseguaglianza triangolare!). Prendendo perciò come curva I una circonferenza di centro zo e raggio R, nelle ipotesi del teorema la [2.31] implica:

Cioè, j(m+l) (z) è nulla in ogni punto del piano complesso, e quindi J(z) è un polinomio di grado non superiore a m. 3.3.2. Teorema di Morera Una ulteriore conseguenza della [2.31] è il Teorema di Morera, noto anche - impropriamente - come inverso del teorema di Cauchy, il cui enunciato è il seguente: Se f(z) è continua in un dominio D semplicemente connesso, e se lungo una qualunque curva chiusa I contenuta in D si ha f-r dzf(z) = O, allora f(z) è analitica in D.

Invero, nelle ipotesi del teorema, l'integrale:

1:

F(z) =

d(f(()

z0 e z essendo due punti arbitrari di D, non dipende dalla curva (interna a D) che li congiunge, ma solo dai punti stessi: tenendo fisso z0 , è una funzione dell'estremo superiore z variabile nel dominio D; si tratta inoltre, poiché f(() è continua, di unafunzione derivabile, cioè 'analitica, di z, tale che: F'(z)

= f(z)

Ma allora, in quanto derivata di una funzione analitica, f(z) è a sua volta una funzione analitica. Notiamo subito un'applicazione importante del teorema di Morera alle rappresentazioni integrali di funzioni di variabile complessa.

125

METODI MATEMATICI DELLA FISICA

Sia f(z, () una funzione di due variabili complesse, definita per z appartenente a un dominio D semplicemente connesso e ( appartenente a una curva (rettificabile) , .i su})poniamo che f sia analitica in z per ogni ( fissato E, e continua in ( per ogni z fissato E D, e supponiamo ancora che l'integrale: [3.13)

F(z)

=

1

d(f(z, ()

sia uniformemente convergente nel dominio D (cfr. formula [3.11]). Mostriamo che la funzione F(z) è analitica in D. Nelle ipotesi fatte, F(z) è chiaramente continua nel dominio semplicemente connesso D. Consideriamo ora una qualunque curva chiusa contenuta in D, e integriamo la [3.13) su r: [3.14)

l

dzF(z)

=

l 1 dz

d(f(z, ()

In virtù della convergenza uniforme dell'integrale possiamo scambiare l'ordine d'integrazione nel 2° membro della [3.14): sfruttando l'analiticità in z di f(z,() concludiamo che il 1° membro della [3.14] è nullo. Allora: ·

l

dzF(z) = O

per una arbitraria curva r contenuta in D. Segue dal teorema di Morera che F(z) è analitica. Abbiamo perciò una condizione sufficiente per stabilire se una determinata rappresentazione integrale definisce una funzione analitica. Ricordando quanto detto nel par. 3.2.2, possiamo riassumere la situazione affermando che: Se una funzione f (z, () è analitica in z e continua ìn (, z E D (semplicemente connesso) e ( E , , e se essa è maggiorata in valore assoluto da una funzione (positiva!) g(() tale che J"I ld(lg(() < R2, altrimenti il suo dominio di convergenza è vuoto!) . In ogni corona chiusa contenuta nel dominio di convergenza, la convergenza sarà assoluta e uniforme. In· virtù dei teoremi di Abel e Weierstrass (par. 3.4.1) ogni serie bilatera è la serie di Laurent della sua somma. In effetti, sia +oo

[3.30]

S(z)

=

L

ck(z - zol

k=-oo

una tale serie, convergente in una certa corona circolare centrata in zo. Moltiplichiamo termine a termine per (z - z0 )-(n+l): la serie resta uniformemente convergente. Integriamo su una qualsiasi curva chiusa

134

3. RAPPRESENTAZIONI INTEGRALI E PER SERIE

1 contenuta nella corona:

J

L'Y (z -

S(z) _ zo)n+l dz -

J

L'Y (z -

dz ~ _ k zo)n+l ~ ck(z - zo) =

+oo

=

L

Ck

k=-oo

i

k=-oo

dz(z - zo)k-(n+l)

'Y

Ma:

I-rJ dz(z -

zo)k-(n+l}

= {O

.

2ni

k=f.n k=n

e quindi: [3.31]

i

'Y

S(z) (

) +1

Z-Zo n

. dz = Cn · 2nz

il che mostra che i coefficienti Cn sono proprio i coefficienti dello sviluppo di Laurent di S(z). Se ne deduce anche l'unicità dello sviluppo di Laurent di una funzione. Esiste una correlazione assai stretta tra if tipo di sviluppo di Laurent di una funzione nell'intorno di un punto z 0 , e il tipo di singolarità (parr. 1.6.2, 1.6.3) che la funzione presenta in z0 . Il caso più banale è quello in cui lo sviluppo non èontiene potenze negative: la funzione è allora analitica in z 0 . Supponiamo ora che lo sviluppo di Laurent di f(z) nell'intorno di zo contenga un numero finito di poterize negative: in questo caso la funzione ha un polo in z 0 , e l'ordine del polo uguaglia la massima potenza negativa (la condizione è necessaria e sufficiente). Se invece lo sviluppo di Laurent di f(z) contiene infinite potenze negative, allora f(z) ha una singolarità essenziale in z0 ; anche qui vale il viceversa. Dimostriamo la precedente affermazione nel caso del polo di ordine N , da noi definito come uno zero di ordine N della funzione reciproca g(z) = l/f(z) (cfr. par. 1.6.2). Se g(z) ha uno zero di ordine N in z0 , essa può essere rappresentata nella forma: [3.32]

g(z) = (z - zo)N cp(z)

dove cp(z) è analitica in un intorno di z0 e non nulla in z0 : quindi l/cp(z) è analitica nell'intorno in questione, incluso z0 , ed è perciò

135

METODI MATEMATICI DELLA FISICA

sviluppabile in serie di Taylor: 1

[3.33]

cp(z) = C_N

+ (z - zo)C-N+l + ...

Abbiamo allora: [3.34]

f(z)

1

1

1

= -( gz ) = (z-zo )N C_N + (z-zo )N-l C-N+l + ...

cioè lo sviluppo di Laurent di J(z) contiene solo potenze di grado 2 -N. Viceversa, se lo sviluppo di Laurent di f (z) contiene solo potenze di grado 2 - N, potremo scrivere: [3.35]

f(z) = (z - zo)-N (C-N = (z - zo)-N'l/;(z)

+ (z - zo)C-N+l + ... ) =

dove 'lj;(z) è analitica e non nulla in un intorno di z0 . Ma allora [3.36]

N 1 g(z) = (z - zo) v;(z)

è una funzione analitica in un intorno di zo, con uno zero di ordine N in z0 (1/v;(z) è certo non nulla in un intorno di zo!), e quindi /(z) ha un polo di ordine N in zo. Tra i coefficienti dello sviluppo di Laurent di una funzione, una particolare importanza riveste nelle applicazioni il coefficiente della potenza (z - z 0 )- 1 , che viene chiamato residuo della funzione nel punto z0 : moltiplicato per 2?ri, esso dà il valore dell'integrale della funzione lungo una curva chiusa qualunque, che sia contenuta nel dominio di analiticità della funzione e non contenga al suo interno altre singolarità oltre al punto Zo[3.37]

1 Res(f(z), zo) = - . 27!"2

I-rJ d(f(() = C-1

Un discorso approfondito sui residui e le loro applicazioni sarà fatto nel prossimo par. 3.5. A chiusura di questo paragrafo, dobbiamo notare esplicitamente che la connessione da noi stabilita (o enunciata) tra tipo di singolarità e forma dello sviluppo di Laurent di una funzione è valida nel caso di un punto z0 "al finito". Nel caso del punto all'infinito le cose vanno diversamente.

136

3. RAPPRESENTAZIONI INTEGRALI E PER SERIE

Per una funzione analitica e monodroma in un intorno del punto all'infinito, esso sarà - come qualsiasi altro punto - una singolarità eliminabile, un polo o una singolarità essenziale a seconda che la funzione J(z) ammetta un limite finito, infinito o che questo limite non esista. Per caratterizzare il suo sviluppo di Laurent, effettuiamo una inversione: 1

1

( =;; J(z) = J(() = rp(()

[3.38]

Il punto ( = O sarà per rp( () un punto regolare, un polo o una singolarità essenziale se (e soio se) z = oo è un punto regolare, un polo o una singolarità essenziale per f (z); corrispondentemente, la funzione rp( () avrà uno sviluppo in sole potenze positive (( = O regolare), o in potenze (positive e) negative (in numero finito se ( = O è un polo, infinito se (=O è una singolarità essenziale): ma f(z) avrà uno sviluppo in potenze inverse! ~ossiamo quindi concludere dicendo che, se il punto all'oo è regolare per f(z), il suo sviluppo di Laurent conterrà solo potenze negative di z; se è un polo di ordine N, lo sviluppo di Laurent conterrà potenze positive di grado non superiore a N; se è una singolarità essenziale, conterrà infinite potenze positive. In tutti i casi vale anche il viceversa. Una funzione intera, quale ad esempio exp(z), ha una singolarità essenziale all'oo, e il suo sviluppo in serie di potenze contiene solo termini positivi; un polinomio ha una singolarità polare all'infinito pari al grado del polinomio; la funzione 1/(1 - z), regolare all'infinito (limz--, 00 1/(1 - z) = O), ha uno sviluppo di Laurent per lzl > 1 dato da sole potenze negative: 1

1

1- z

= -; (l -

00

1 1 / z)

=-

1

~ zn+I

3.4.3. Sviluppo di Mittag-Leffier e prodotti infiniti Nel par. 1.6.3 abbiamo definito le funzioni intere come quelle funzioni che sono (monodrome e) analitiche in ogni dominio limitato del piano complesso: come tali, esse possono al più avere (e di fatto avranno, se non sono costanti) singolarità polari o essenziali all'infinito. Abbiamo pure definito le funzioni meromorfe come quelle funzioni analitiche (e monodrome) che hanno un numerò finito di singolarità polari in ogni

137

METODI MATEMATICI DELLA FISICA

dominio limitato del piano complesso. Una caratterizzazione equivalente consiste nel definire le funzioni meromorfe come quelle che in ogni dominio limitato - sono esprimibili come rapporto di funzioni intere:

f( z ) = g( z ) h(z )

[3.39]

Infatti, in un dominio limitato h( z ) può avere al più un numero finito di zeri, e di conseguenza f( z ) avrà al più singolarità polari, l'ordine del polo essendo ovviamente la differenza tra l'ordine dell'eventuale zero di g(z) e l'ordine dello zero di h( z ). Supponiamo che i poli di J( z ) non si accumulino all'infinito: tutti i poli al finito di f( z ) sono contenuti in un cerchio lzl :::; R. Siano Zj(j = 1, .. . , n) i poli al finito di f( z ) e /3j (j = 1, .. . , N) i relativi ordini. Sia:

CUI

[3.40]

f( z ) =

CUI

f3 j f3 (z-zj) 1

.

.

+ ... + ~ + c~11 + ci11 (z z- zj

zj ) + ...

lo sviluppo di Laurent di f(z) nell'intorno di Zj. La parte principale di questo sviluppo è una funzione razionale Fj( z ), che ha, in tutto il piano ·complesso chiuso, un polo di ordine (3j in Zj e si annulla nel punto all'infinito. La funzione:

non ha poli in Zj, mentre ha poli in z 1 , .. . , Zj -1 , Zj+1, . .. , Zn - La parte principale dello sviluppo di Laurent di Gj(z) nell'intorno di ognuno di questi poli coincide con quella dello sviluppo di f( z ) (poiché Fj (z ) è regolare Vz =/ Zj)Di conseguenza, se sottraiamo alla funzione f (z) la somma delle parti principali dei suoi sviluppi di Laurent nei punti Zj , otteniamo una funzione: n

lgl per R sufficientemente grande e finito. Il teorema di Rouché implica quindi che Pn(z) = f(z) + g(z) ha lo stesso numero di zeri di anzn, che è proprio n. 3.6

Il prolungamento analitico 3.6.1. Introduzione Assegnata una funzione analitica f(z) in un dominio D del piano complesso z, è naturale chiedersi se sia possibile estendere il suo dominio

154

3. RAPPRESENTAZIONI INTEGRALI E PER SERIE

di analiticità; se sia cioè possibile trovare un dominio D', che contiene D, su cui definire una funzione analitica F(z) che coincide con f(z) sul dominio iniziale D: F(z) = f( z ), z ED (fig. 3.1) . FIGURA

3.1 F(z)

Se questo è possibile, allora la funzione F(z) è detta prolungamento analitico della funzione f(z) dal dominio D al dominio D' e l'insieme {D,f(z)}, costituito dal dominio De dalla funzione f(z) in esso analitica, è detto elemento iniziale del prolungamento analitico. In questo paragrafo ci occuperemo dell'esistenza del prolungamento analitico di un elemento iniziale e delle tecniche per attuarlo; prima di fare ciò mostreremo che, se il prolungamento analitico esiste, esso è unico (si noti invece che, se una funzione di variabile reale è continua - o derivabile - in un intervallo dell'asse reale, essa è sempre prolungabile nel campo reale al di fuori di tale intervallo in una funzione continua - o derivabile - in infiniti modi diversi!). 3.6.2. Unicità del prolungamento analitico L'unicità del prolungamento analitico si basa sulle proprietà degli zeri (delle radici) di una funzione analitica. Se la funzione f (z), analitica in D , si annulla in z 0 E D, si possono presentare i due casi seguenti. i) Lo sviluppo di Taylor della funzione f (z), centrato in z0 , ammette almeno un termine non nullo; cioè esiste un m E N tale che am =/=- O e, quindi (cfr. parr. 1.6.1 e 3.4.1), 00

J( z ) =

L an(z - zo )n = am(z - zor(z) n=m 00

q>(z ) =

L am+j (z - zo)J j=O

am

155

METODI MATEMATICI DELLA FISICA

(si parla allora di radice di molteplicità m). In questo caso, per un punto z vicino a z 0 ma da esso diverso, il fattore (z - z 0 )m è diverso da zero e ( z) è prossimo a 1; pertanto le radici di molteplicità finita

di una funzione analitica sono punti isolati. ii) I coefficienti dello sviluppo di Taylor di f(z), centrato in zo, sono tutti nulli; in questo caso la funzione f (z) è identicamente nulla all'interno del cerchio di convergenza della serie. Se la funzione è nulla identicamente in un dominio del piano complesso, è ovvio che la funzione identicamente nulla su tutto il piano complesso ne costituisce il prolungamento analitico; tale prolungamento è unico, vale infatti il seguente Teorema di unicità del prolungamento analitico della funzione nulla (cfr. par. 1.6.1): Se la funzione f (z) è analitica in D e si annulla identicamente in un sottodominio B di D, allora f(z) si annulla identicamente su tutto D. Dimostrazione. Ammettiamo, per assurdo, che esista un punto z1 E D tale che f(zi) # O e tracciamo una qualunque curva -y, contenuta interamente in D, che congiunge z1 ad un punto z2 di B (fig. 3.2). In virtù dell'analiticità di f(z), dovrebbe allora esistere un intorno di z1 in cui f(z) # O e, quindi, un punto Z3 E -y tale che sui due tronconi -Y± di -y che da esso si dipartono f(z) = O identicamente su, diciamo, 'Y-, e f(z) # O su -Y+· Ma ciò non è possibile poiché, per continuità, f(z3) = O, quindi Z3 sarebbe una radice non isolata ed il suo sviluppo di Taylor sarebbe identicamente nullo in tutto un intorno di Z3, che invaderebbe il troncone -Y+. FIGURA 3.2

In realtà, per la validità di questo teorema, basta che f(z) si annulli identicamente su una curva di D (poiché ogni punto di tale curva sarà

156

3. RAPPRESENTAZIONI INTEGRALI E PER SERIE

una radice non isolata, e quindi centro di un disco su cui f (z) si annulla) o, ancor meno, è sufficiente che f(z) si annulli su una successione di punti di D che si accumulano in D (poiché, per continuità, il punto di accumulazione è una radice non isolata e, quindi, centro di un disco su cui f (z) si annulla).

Corollario. Unicità del prolungamento analitico. Se le funzioni fi (z) e h (z) sono analitiche in D e coincidono su una parte B di D ( un sottodominio di D, o una curva di D, o una successione di punti di D che si accumulano in D), allora esse coincidono su tutto D. Dimostrazione. La differenza fi(z) - h(z) è nulla, per ipotesi, in B, e quindi è nulla su tutto D. Ritornando alla definizione di prolungamento analitico data all'inizio del paragrafo, è ora chiaro che il prolungamento analitico F(z) della funzione f (z) al dominio D' è unico; se, infatti, ne esistesse un altro (.F(z)), allora le funzioni F(z) e F(z) coinciderebbero su De, quindi, su tutto D'. 3.6.3. Prolungamento di soluzioni di equazioni Consideriamo ora alcune conseguenze significative dell'unicità del prolungamento analitico. Data una funzione f (x) di variabile reale definita su un intervallo I, se esiste un dominio D che contiene I su cui definire una funzione analitica che coincide con f (x) per z E I, questa funzione è unica, per le considerazioni del paragrafo precedente, e costituisce il prolungamento analitico di f(x) al dominio D. Ad esempio, le funzioni sen z e zn sono i prolungamenti ~nalitici delle funzioni reali sen x e xn a tutto il piano complesso. Se, inoltre, la funzione reale f(x) è sviluppabile in serie di Taylor in I, allora essa ammette il prolungamento analitico ad un dominio D del piano complesso che contiene I (mostrarlo). Consideriamo ora le seguenti equazioni [3.92]

Jl(x) + J](x) - 1

[3.93]

g(x+l)-xg(x)=O

[3.94]

x 2 (x

d 2 w(x)

+ 1 ) -X 2d -

2 dw(x) x -d-

X

=O

1

+ -(3x + l)w(x) = O 4

La prima è un esempio molto semplice di relazione funzionale ed ha per soluzione fi (x) = senx , h(x) = cosx ; la seconda è un'equazione

157

METODI MATEMATICI DELLA FISICA

funzionale lineare che ha per soluzione g(!r:) = cI'(x), x > O, dove r è la funzione di Eulero; la terza è un'equazione differenziale lineare del secondo ordine che possiede le soluzioni indipendenti w 1 ( x) = fi, w2(x) = filnx + #. Ci poniamo il problema di studiare tali equazioni nel piano complesso, per stabilire la relazione tra il prolungamento analitico di ciascuna equazione e quello delle soluzioni corrispondenti. Questo può essere fatto in generale, a prescindere dalla struttura particolare delle equazioni e dalla conoscenza esplicita delle loro soluzioni. Consideriamo l'equazione [3.92]; se Ji(i) e h(x) ne sono soluzione in un intervallo I dell'asse reale e se esistono i prolungamenti analitici fi(z) e h(z) ad un dominio D del piano complesso che contiene I, allora la funzione 4>(z) = j'f(z) + fi(z) -1 è analitica in D ed è identicamente nulla su I . Ne segue che 4>(z) è identicamente nulla su tutto D e quindi il prolungamento analitico ad un dominio D della soluzione della relazione funzionale è soluzione del prolungamento analitico al dominio D della relazione funzionale. Nel nostro caso, quindi, la relazione funzionale sin 2 z + cos 2 z - l = O è soddisfatta in tutto il piano complesso. Considerazioni analoghe valgono per l'equazione [3.93]; se g(x) ne è soluzione in J e se esiste il suo prolungamento analitico g(z) ad un dominio D del piano complesso che contiene I e in cui anche g(z + 1) è analitica, allora la funzione q>( z) = g( z + l) - zg( z), analitica in D e identicamente nulla su I, è identicamente nulla su tutto D. Per la [3.94] basta notare che i coefficienti dell'equazione sono prolungabili ovunque nel piano complesso e che, se la soluzione w{x), definita in I, ha il prolungamento analitico w{z) ad un dominio D che contiene I, allora le derivate rispetto a x di. w(x) hanno per prolungamento analitico le derivate rispetto a z di w(z). Usando lo stesso argomento di prima possiamo quindi affermare che il prolungamento analitico di una soluzione dell'equazione [3.94] è soluzione del prolungamento analitico dell'equazione. Se, quindi, mediante un circuito semplice che parte dal punto xo E I, le soluzioni w 1 (x) e w2(x) si trasformano nelle funzioni W1 (z) e W2(z) (Wj(z) = wj(ze 2,,.i), j = l, 2), poiché i coefficienti dell'equazione sono funzioni intere e quindi riprendono il valore iniziale dopo un giro, le funzioni Wj(z) ' sono anch' esse soluzioni dell'equazione [3.94], e sono quindi esprimibili come combinazioni lineari delle wk: 2

WJ(z)

=

L ajkwk(z) k=l

158

3. RAPPRESENTAZIONI INTEGRALI E PER SERIE

La matrice {ajk} è detta matrice di monodromia dell'equazione differenziale e, nell'esempio in questione, ha la forma (mostrarlo):

3.6.4. Il prolungamento analitico; punti regolari e singolari

Prolungamento analitico attraverso un dominio. Se le funzioni f 1 ( z) e h(z) sono analitiche rispettivamente nei domini D 1 e D 2 che hanno una parte connessa comune D1 n D2 (fig. 3.3), e se fi(z) = h(z) per z E D 1 n D 2 , allora _la funzione

F(z)

= { fi(z),

h(z),

se z E D1 se z E D2

è analitica in D 1 UD2 (mostrarlo) e costituisce il prolungamento analitico della funzione fi (z) (o h (z)) dal dominio D1 (o D2) al dominio D 1 U D 2 . Se {D 1 , fi(z)} è, ad esempio, l'elemento iniziale, si dice anche che h (z) è il prolungamento analitico di fi (z) dal dominio D 1 al dominio D2 attraverso il dominio D 1 n D2. Nel seguito considereremo solo il caso concreto di domini circolari e, all'interno di essi, di funzioni analitiche definite da sviluppi di Taylor (il cosiddetto prolungamento analitico per cerchi). Prima di fare ciò, prendiamo brevemente in esame anche il caso, particolarmente utile nella costruzione della superficie di Riemann di una funzione polidroma (cfr. par. 1.7), in cui i domini D 1 e D 2 sono disgiunti ma hanno un tratto di frontiera comune (fig. 3.4). FIGURA

3.3

159

METODI MATEMATICI DELLA FISICA



FIGURA

3.4

Proposizione di Riemann. Prolungamento analitico attraverso una frontiera. Siano fi (z) e h (z) due funzioni analitiche rispettivamente nei domini D 1 e D2 che sono disgiunti ma hanno in comune un tratto 1 •di frontiera. Se, inoltre, fi (z) e h (z) sono continue rispettivamente in D1 U 'Y e D2 U 'Y e coincidono su 'Y, allora la funzione F(z) =

fi(z) fi(z) { h(z)

se z E D1 z E 'Y se z E D2

= h(z) se

è analitica su D1 U1UD2 e costituisce quindi il prolungamento analitico (unico) della funzione fi (z) (o h ( z)) dal dominio D1 (o D2) al dominio D1 U 'Y U D2. Se, ad esempio, { D1 , fi (z)} è l'elemento iniziale, si dice anche che h (z) è il prolungamento analitico di fi (z) dal dominio D1 al dominio D2 attraverso la frontiera 'YDimostrazione. Per dimostrare che F(z) è analitica in D1 U ì U D2 si usa il teorema di Morera. Notiamo innanzitutto che F(z) è, per costruzione, continua in D1 U ì U D2, e consideriamo una qualunque curva chiusa C interamente contenuta in D1 U ì U D2. Se C è interamente contenuta in D1 o in D2, allora fc F(z)dz = O per il teorema di Cauchy. Resta solo da considerare il caso in fig. 3.4, in cui la curva appartiene ad entrambi i domini. Allora, se C 1 e C2 sono le parti di C contenute in D1 e D2 rispettivamente, e se C± è il tratto di ì contenuto all'interno di C e percorso nei due sensi, allora fciuC+ Ji(z)dz = fc 2 uc_ h(z)dz = O, per il teorema di Cauchy (generalizzato nel senso indicato al par. 2.2.1) e fciuC+ fi(z)dz

+

fc 2 uc_ h(z)dz = fc F(z)dz, poiché fi(z) = h(z) su ì; ne segue quindi che fc F(z)dz

= O. 160

3. RAPPRESENTAZIONI INTEGRALI E PER SERIE

Prolungamento per cerchi. Sappiamo che la serie di Taylor 00

f( z ) =

[3.95]

L an(z - zo)n n=O

definisce, all'interno del suo cerchio di convergenza di raggio R, una funzione analitica f ( z) (la somma della serie). Ci poniamo ora il problema di prolungare analiticamente la funzione f (z) al di fuori del disco K : lz - zol < R. Sia ( un punto della frontiera del disco; se esiste un intorno Ur, di ( ed una funzione Jr,(z) analitica in Ur, tale che Jr,(z) = f(z) per z E Ur,nK, allora abbiamo realizzato il prolungamento analitico di f(z) attraverso l'intorno Ur, di (, ed il punto di frontiera (, che permette tale prolungamento, viene detto "regolare" per la funzione f(z), o meglio per l'elemento {K, f(z)} di f(z) (fig. 3.5) (alla fine del paragrafo mostreremo su un esempio che la regolarità di un punto ( dipende non solo da f(z), ma anche dal dominio K). Se, invece, non esistono un intorno Ur, e una funzione Jr,(z) ivi analitica con le proprietà sopra descritte, allora il punto ( è detto "singolare" per l'elemento {K, f(z)} di f(z). FIGURA

3.5

K

Ad esempio, la serie geometrica ha raggio di convergenza R = l e diverge ovunque sul cerchio unitario, ma poiché la sua somma f(z) = 1/( 1 - z) è analitica ovunque nel piano complesso ad eccezione del polo z = l, ogni punto ( -/- 1 del cerchio unitario è regolare. Infatti, se (-/- 1, su ogni intorno Ur, di raggio lz-(I < I1-(I possiamo definire la funzione analitica fr,( z) = 1/(1- z), che coincide ovviamente con f( z ) nel dominio E= Uc, n K. Infine il punto 1 è singolare; infatti, se fosse

161

METODI MATEMATICI DELLA FISICA

regolare, esisterebbe un intorno U di 1 ed una funzione ivi analitica fi(z) tale che fi(z) = 1/(1 - z) in E= Un K. Quindi fi(z)

1 l-z

= - - -. oo, z-.

l, z E E

contraddicendo l'ipotesi che fi(z) sia analitica in U. Quest'ultimo esempio mostra che, se f(z) -. oo per z -. ( dall'interno, allora ( è un punto singolare di {K, f(z)}; non è vero tuttavia che, se f(z) tende ad un valore finito per z-. oo, il punto ( è regolare (si vedano le serie

[3.97] e [3.104]). Raccogliamo ora alcuni risultati, peraltro piuttosto ovvi, sulla relazione tra il raggio di convergenza di una serie di Taylor e la regolarità o singolarità dei punti del cerchio di convergenza. l. Se la funzione f(z) è analitica nel disco K : lz - zol < p, e se tutti i punti di frontiera del disco sono regolari, allora sarà possibile prolungare la funzione f(z) ad un disco K' che contiene il precedente: K': lz - zol < p', p < p' (fig. 3.6). FIGURA

3.6

2. Se un punto della frontiera del disco K è singolare, allora lo sviluppo di Taylor di f (z)

L f(n)(n. z ) (z oo

[3.96]

f(z)

=

I

zot

n=O

ha raggio di convergenza R uguale al raggio del disco p. Infatti se, per assurdo, R fosse diverso da p (cioè se R > p), allora la serie [3.96]

162

3 . RAPPRESENTAZIONI INTEGRALI E PER SERIE

definirebbe una funzione analitica in un dominio che contiene i punti di frontiera di K, che sarebbero quindi regolari. 3. La serie di potenze [3.95] possiede almeno un punto singolare di J(z) sul suo cerchio di convergenza. Infatti se, per assurdo, non ci fossero punti singolari, allora il raggio di convergenza della serie sarebbe maggiore di R. Notiamo infine che la relazione che intercorre tra i punti di convergenza o divergenza della serie [3.95] ed i punti di regolarità o singolarità della sua somma è, apparentemente, alquanto bizzarra. Ad esempio la serie geometrica diverge in tutti i punti del cerchio unitario mentre tutti i punti di tale cerchio sono regolari, ad eccezione di z = l. Viceversa, la serie

J( z )

=

n

I: :2 oo

[3.97]

n=l

converge (assolutamente e uniformemente) per lzl ~ 1, mentre sappiamo, grazie al risultato 3, che almeno un punto del cerchio unitario deve essere singolare. Un approfondimento di queste considerazioni è rimandato al par. 3.6.6. 3.6.5. Esistenza del prolungamento analitico

È sempre possibile stabilire, in linea di principio, se un punto ( del cerchio di convergenza della serie è regolare (e quindi permette il prolungamento analitico di f ( z) attraverso un suo intorno) nel modo seguente. Consideriamo l'elemento iniziale • 00

[3.98]

fi(z)

=L

a~1l(z - z1)n

n=O

tracciamo il raggio z 1 ( che congiunge z 1 e(, prendiamo all'interno di esso un punto z2 e costruiamo lo sviluppo di Taylor di f (z) centrato in z2: 00

[3.99]

h(z) =

L a~2l(z -

z2)n

n=O

Tale sviluppo converge alla funzione analitica h(z) nel disco K 2 , cen-

163

METODI MATEMATICI DELLA FISICA

trato in z2 , di raggio R2 pari a

1 R2=------;:::===

[3.100]

Sappiamo che R 2 non può essere minore della distanza 1(- z2I = R1 jz2-z1I tra z2 e(. Se R2 > R1 -lz2-z1 I, allora il disco K2 esce dal disco K 1 e la funzione h(z), che coincide con fi(z) in K1 n K2, costituisce il prolungamento analitico cercato ( fig. 3.7); ( è quindi un punto regolare dell'elemento {K1,fi(z)}. Se, invece, R2 = R1 - lz2 - zii , allora il punto ( è singolare (fig. 3.8).

FIGURA 3.7

FIGURA

3.8

2

Può essere utile osservare che i coefficienti a~ ) = Ut\z2))/n! sono esprimibili in funzione dei coefficienti a~l) della serie [3.98] attraverso la formula a~2 )

=

f (:)ai

1

)(z2 - z1t-k k=n basta infatti riscrivere la serie [3.98] nella forma 00

L a~1l(z n=O

00

z1)n

=L

a~1)[(z - z2)

+ (z2 -

z1)J"'

n=O

sviluppare le potenze [( z- z2) + (z2 - z1) in usando la formula di Newton e raggruppare i termini secondo le potenze di (z - z2 ). Abbiamo quindi dimostrato il seguente risultato.

164

3. RAPPRESENTAZIONI INTEGRALI E PER SERIE

Proposizione. Data la serie di potenze [3.98] di raggio R 1 , dato un punto ( del cerchio di convergenza ed un punto z2 del raggio z 1 (, il punto ( è un punto regolare dell'elemento {Ki,fi(z)} se R 2 > R 1 lz2 - z1I; è un punto singolare invece se R2 = R1 - lz2 - z 11, dove R2 è definito dalla [3.100].

Dopo aver effettuato il prolungamento analitico dell'elemento {K1 , fi(z)} all'elemento {K2, h(z)}, possiamo iterare il procedimento scegliendo un punto ( del cerchio lz - z2I = R2 (attraverso il quale si desidera prolungare h), e confrontando il valore del raggio di convergenza R3 della serie di Taylor 00

fg(z)

=

L a~

3

)(z - z3t

n=O

centrata in un punto Z3 qualunque del segmento z2 ( con la distanza R2 - lz3 - z2I di 23 dal disco K2. In questo modo si costruisce ,una catena K 1 ,K2,K3, ... di domini e un insieme di prolungamenti fi, h, fg, .. .; l'insieme di tutti i possibili prolungamenti analitici dell'elemento iniziale dà luogo ad una funzione analitica F(z), la "funzione analitica totale", e l'unione D 1 U D 2 U D 3 ... di tutti i domini di definizione è il dominio di definizione di F(z) (fig. 3.9). Può ovviamente succedere che la catena si richiuda, che cioè l'mesimo disco Km abbia una parte in comune non solo con K,;,_ 1 , ma anche con un disco precedentemente costruito Kn, n < m - 1 (fig. 3.10); in questo caso non è detto che le funzioni fm(z) e fn(z) siano uguali in Kn n Km, Se f m(z) e fn(z) sono diverse, allora la funzione F(z) è polidroma e, come abbiamo già vjsto nel par. 1.7, si ammetterà che il dominio Kn n Km sia costituito da due fogli su cui sono definiti i due rami monodromi diversi fn(z) e fm(z) di F(z) . A scopo illustrativo applichiamo la tecnica di prolungamento per cerchi all'elemento iniziale 00

[3 ,101]

Naturalmente in questo caso non sarebbe necessario farlo, poiché la somma della serie geometrica è la funzione 1/(1- z), analitica in tutto il piano complesso (ad eccezione di z = 1), che ne costituisce quindi il prolungamento analitico . In generale, tuttavia, una rappresentazione alternativa semplice di una serie di potenze non sarà disponibile e saremo costretti ad applicare il metodo generale.

fi (z)

165

METODI MATEMATICI DELLA FISICA

FIGURA

3.9

FIGURA 3.10

Prendiamo un punto qualsiasi z2 interno al cerchio unitario centro della serie di Taylor 00

h(z)

=

(lz2 1
O rri _ 00 w -1 , 'vt sono gli archetti infinitesimi intorno a z 1 ,2. Poiché gli integrali a1,2 possono essere calcolati usando i lemmi 3, 4 del par. 2.4, il calcolo dell'integrale [3.153] è quindi ricondotto al calcolo dell'integrale di g(z) lungo il circuito chiuso C, che può risultare di facile attuazione usando il teorema dei residui, come nel caso in cui il ramo monodromo g(z) sia analitico all'esterno cl.i C, con l'eccezione di ·un numer0 finito di singolarità isolate z1 : [3.156]

:l

g(z)dz =

21ri(L Res (g(z), z1 ) + Res (g(z), oo)) J

Quindi:

186

3. RAPPRESENTAZIONI INTEGRALI E PER SERIE

a) Come prima applicazione di queste considerazioni generali, prendiamo in esame la classe di integrali I(a) =

[3.157]

fo

00

x 0 R(x)dx,

dove R( x) è una funzione razionale e, per ragioni di convergenza,

x 0 + 1 R(x)---->

[3.158]

o,

X----> oo, X---->

o+

In questo caso: z1 = O, z2 = oo e !'integrando è proporzionale alla discontinuità del ramo g(z) = z0 R(z), O :::; arg z < 21r, attraverso il semiasse positivo: ~g(x)

= (1 - e21ri 0 )x 0 R(x),

x

E R,+

Il contorno chiuso C in fig. 3.20 è scelto in modo da contenere tutte le singolarità di R(z) e consiste nella somma di 4 cammini: gli archi ìR e ÌE, di raggio Re t rispettivamente, ed i due segmenti (t, R), sopra e sotto il taglio. FIGURA

3.20

e

Poiché dalla [3.158] segue che z 0 +1 R(z)----> O, per lzl----> oo e per z----> O, i lemmi 1 e 3 del par. 2.4 ci assicurano che

1

z0 g(z)dz----> O,

'Y Il.

187

R----> oo

METODI MATEMATICI DELLA FISICA

1

z°'g(z)dz ....... O,

t .......

O

"/,

Quindi, per R ....... oo e per t ....... O, otteniamo che 27l'i

i

L Res(z°' R(z), z1) =

e

1

da cui:

I(a) = [3.159]

1

00

z°' R(z)dz ....... (1 -

27l'i . 1 _ e2 7rai

z:

e

27

mi)

Res (z°' R(z), z1 )

o

x°' R(x)dx

=

j

= - sm . ~a7!' ) Z:Res (z°'R(z),z1 ) . . J

dove la somma è estesa a tutte le singolarità di R(z). Nel calcolo dei residui di z°' R(z) non si dimentichi di scegliere O ~ arg z1 < 27!'. Ad esempio,

1

00

I fJ =

[3.160]

( )

Infatti, zl3 /(1 quindi:

+ z) .......

I(fJ)

o

x/3-I

--dx= 1+x

7l' sin(fJ7r) '

O 2 si procede in modo analogo. Si noti infine che, se R(x) E R, la [3.167] implica le formule [3.l69]

J,

00

R(x)dx

~ - 2~ Im ( ~ Res((Ln z) R(z), z,)) 2

190

3. RAPPRESENTAZIONI INTEGRALI E PER SERIE

[3.170]

r=

1

lo lnxR(x)dx = - 2Re(I:Res((Ln z)2R(z),zj)) J

alternative alle [3.166] e [3.168] rispettivamente. Anche nel calcolo dei residui di queste formule non si dimentichi che O ~ arg z < 2n. Ad esempio,

I(a)

= foo 3 dx 3 lo x +a

21r 3J3°a 2 '

Ln z z +a

1 3a

a>O

Infatti: 2

I(a)

·

2

·

4

·

3 ' 0 + 1 +e-an) = - ~Res(--,zk) = --lna(e3 3 2

~

k=O

L 'antitrasformata di Laplace

È possibile mostrare che l'inverso della trasformata di Laplace [3.116] è dato dall'integrale [3.171]

f(t)

1 27ft

=- .

f

1B

etz F(z)dz,

t >O

dove B è il cosiddetto "cammino di Bromwich", è cioè la retta verticale Re z = e, dove e è una costante positiva scelta in modo da avere tutte le singolarità di F(z) a sinistra di B. Se assumiamo che F(z) sia razionale'e tale che F(z) -----, O uniforme-mente per lzl ___, oo, allora è possibile mostrare che [3.172]

f(t)

= LRes(etzF(z),zj) j

dove la somma è estesa a tutti i poli di F(z). Scegliamo infatti il contorno chiuso I in fig. 3.22; l'integrale sul semicerchio 1/2 CR nel semipiano Re z < O tende a zero, per R-----, oo, per il lemma di Jordan modificato; anche gli integrali lungo i segmenti BC e DA tendono a zero, per R-----, oo:

191

METODI MATEMATICI DELLA FISICA

FIGURA

3.22

iR C+iR _---t-C_B.., B

o

-R

e D A

C-iR -iR

quindi:

Ad esempio: l - . 21Tt

1 B

etz

etz

- 2- - dz z +1

etz

= Res(-2--,i) + Res(-2--,-i) = sint z +l z +l

Se F(z) è analitica nel piano complesso, ma ha un punto di diramazione in z = O (e in z = oo); se, inoltre, F( z) -+ O uniformemente per [z[ -+ oo, e zF(z) -+ A uniformemente per z-+ O, allora:

f(t) = LRes(etzF(z),zj)+ [3.173]

j

+~ f 27ri

J0

00

e-tx[F(xe-i1r) - F(xei1r)]dx

+A

dove F(z) è il ramo principale (-7r < arg z ::::; 7r) della funzione polidroma, e la somma è estesa a tutte le singolarità di F(z).

192

3. RAPPRESENTAZIONI INTEGRALI E PER SERIE

Per ottenere questo risultato, si integri etz F(z) lungo il cammino chiuso I in fig. 3.23. Procedendo come sopra, questa volta si ottiene:

f(t)

= LRes(etzF(z),zj) + ~ f .

2ni}H

J

etzF(z)dz -

dove H _ è il contorno di Hankel, che parte da z = -oo sul bordo inferiore del taglio e arriva a z = -oo sul bordo superiore, girando intorno a z = O. I contributi da -Ra -1:. sopra e sotto il taglio danno luogo, nel limite R -+ oo e 1:. -+ O, all'integrale a secondo membro della [3.173]; la costante A nasce invece dal contributo dell'archetto infinitesimo intorno a z = O. FIGURA

3.23

_1_R-+--_~C +iR

H_

--4--JC-iR -iR

Ad esempio, se F(z) = z-", O< a< 1, allora:

f(t, a) = sin(an) ()O e-txx-"dx =

n lo

[3.174]

= sin(an\a-1r(1 - a), n

O< a< 1

L'integrale J(t, a) converge per O< a< 1, e quindi la [3.174] fornisce il prolungamento analitico di f(t, a) a tutto il piano complesso a; se, in particolare, a= m, m = 1, 2, . . . , allora

J(t) =

sin(mn) tm-l tm-l n r(l - m) = f(m) = (m - 1)!

193

METODI MATEMATICI DELLA FISICA

avendo usato l'identità r(a)r(l - a) = 7r/ sin(a7r). 3.7 Sviluppi asintotici

Data una funzione f(x), definita mediante un integrale, una serie, un'equazione differenziale ecc., può essere utile conoscerne il comportamento asintotico, ad esempio per grandi valori dix. L'approssimazione asintotica di f{ x) è data, in generale, da una serie del tipo I:n an l e coincide con la serie di Taylor della funzione 1/(1 + x 2 ) in quell'intervallo. Questo non ci stupisce, poiché le operazioni che hanno portato al risultato [3.176] sono legittime: la serie di Taylor del sin t converge per ogni t E R (uniformemente in ogni intervallo limitato dell'asse reale) ed è quindi lecito scambiare le operazioni di integrale e di somma infinita. La serie [3.177] è invece divergente per ogni x E R, e anche questo risultato non ci sorprende poiché, per ottenerlo, abbiamo utilizzato una serie che diverge per t ~ l. Nonostante questa divergenza, la serie [3.177] fornisce utili informazioni sulla funzione G(x) per grandi valori dix; in questo caso i primi termini della serie decrescono assai rapidamente e quindi ci si aspetta che la loro--somma parziale tenda a val.ori assai prossimi a quelli veri (ottenibili usando tecniche di integrazione numerica). Ad esempio, sex = 10, allora ì::!=o ((-l)"'n!/10(n+l)) = 0.0914 . .. , che differisce dal valore vero G(lO) = 0.0915 .. . solo nella terza cifra significativa. Questo risultato è di facile comprensione; dall'identità

segue infatti che

G(x) =

L (-llk! xk+l n

k=O

195

+

Rn(x)

METODI MATEMATICI DELLA FISICA

con

Rn(x)

=

1

00

(-l)n+l

tn+l e-xtdt

l+t

0

Per la funzione Rn (x), che prende il nome di resto della serie, o errore di troncamento, vale la seguente maggiorazione [3.178] quindi la somma parziale I:;=O ((-l)kk!)/(xk+l) approssima la funzione G(x) con un errore minore del primo termine escluso dalla somma parziale; un errore che tende a zero per x ------> oo per n fissato. Poiché la serie non è convergente, la bontà dell'approssimazione peggiora al crescere del numero n di termini della serie che vengono presi in considerazione. Si noti che il numero n di termini della somma parziale che meglio approssima G(x) dipende da x e, in generale, non è semplice valutarlo a priori. Nel nostro esempio è possibile stimarlo notando che Rn(x) è tanto più piccolo rispetto ai termini precedenti quanto più n è piccolo rispetto a x; per n dell'ordine di grandezza di x i termini della serie sono infatti confrontabili e l'aggiunta di ognuno di essi fa oscillare in modo considerevole il valore della somma parziale, rendendola completamente inattendibile. Le proprietà ora descritte sono tipiche di tanti esempi di serie divergenti, derivanti da rappresentazioni integrali o da equazioni algebriche e differenziali. Le proprietà matematiche significative di tali serie sono state precisate da Poincaré nel caso di serie di potenze come le [3.176], [3.177]. La definizione che segue generalizza quella di Poincaré al caso in cui le potenze dello sviluppo sono sostituite da funzioni di scala c/Jn (x) più generali. Definizione di sviluppo asintotico: Data la successione di funzioni { c/Jn (x)}, la serie formale I::=o an c/Jn (x) è detta sviluppo asintotico (o espansione asintotica o serie asintotica) a N termini della funzione f (x) al tendere di x a x 0 , se valgono le seguenti proprietà. i) I termini della serie sono decrescenti: [3.179] ii) Il resto RN(x)

c/Jn+1 (x) c/Jn(x)

= f(x) -

------>

O,

X------> Xo

I:{:' anc/Jn(x) 196

della serie è piccolo rispetto

3. RAPPRESENTAZIONI INTEGRALI E PER SERIE

all'ultimo termine della serie: [3.180]

X --+ Xo

Sono di uso frequente i simboli "ordine di grandezza":

f(x) = O(g(x)), x--+ Xo

f(x) = o(g(x)),

x--+ Xo

dove nel primo caso si intende che il rapporto lf(x)/g(x)I è limitato per lx - Xo I < p e si dice che le funzioni f e g sono dello stesso ordine di grandezza. Nel secondo caso si intende che f(x)/g(x)--+ O per x--+ x 0 , e si dice che f è piccolo rispetto a g. Ad esempio: N

Lanxn = o(xN+ 1 ),

x--+ oo;

X--+

00

o

ln(l

+ 5x) = O(x), ln(x

x--+ O;

cosh(3x)

+ a) = O(lnx),

= O(e 3 x),

X--+

00

x--+ oo

L'espansione asintotica di una funzione f(x) è indicata col simbolo~: N

[3.181]

f(x)

~L

an O, allora 00

[3.185]

[

I(x) = Jo

xt e- g(t)dt

f(ak + 1) ~~ ~ ak xdl , k=O

O

199

x-oo

METODI MATEMATICI DELLA FISICA

dove r è la funzione gamma di Eulero. In particolare, se ak = k, allora I(x) ~ I:;~0 akk!/xk+l, x---+ oa. Dimostrazione. L'integrazione termine a termine della serie [3.184] dà luogo alla serie [3.185]. Quindi resta solo da stimare l'errore commesso. Sia rn(t) il resto dello sviluppo asintotico di g(t): rn(t) = g(t) I;~=O akto:k, con rn(t) = O(to:n+i ); allora:

La stima rn(t) = O(to:n+i ), che equivale alla maggiorazione Jrn(t)J ~ ento:n+i, O < t < Pn, suggerisce di spezzare l'integrale che definisce il resto della serie in due parti:

con

Inoltre, per x > o-:

~ e-(x-CT)Pn

100 e-CTtlrn(t)Jdt = O(e-PnX) Pn

Abbiamo così dimostrato che R,,,,(x) = O(x-(o:n+ 1 +1 l). Si può dimostrare che la formula [3.185] non cambia se l'estremo superiore dell'integrale [3.183] è un numero b > O qualsiasi.

Prolungamento analitico e paradosso di Stokes Abbiamo già mostrato che gli integrali di Laplace [3.183], sotto ipotesi alquanto blande sulla funzione g(t), sono convergenti in domini del piano complesso z e sono ivi analitici. È naturale quindi chiedersi che cosa succeda allo sviluppo asintotico di I(z), per Jzl ---+ oo, in tali domini del piano complesso.

200

3. RAPPRESENTAZIONI INTEGRALI E PER SERIE

Mostriamo innanzitutto che il lemma di Watson si estende in modo "morbido" al caso complesso.

Lemma 2. Se la funzione ( complessa) g( t) ammette lo sviluppo asintotico g(t) ~ I:;~ 0 akt°'k, t---. o+, -1 < Re a 0 < Re a 1 < ... e se l'integrale I(z) = e-ztg(t)dt è assolutamente convergente per Re z > a > O, allora I(z) è analitica per Re z > a e, 'r:/8 > O,

Io"°

O()

I(z)

~L

an

n=O

r(an z~

+ 1)

+i

, /zl ---. oo,

I arg

1r

z/ ::::'. - - 8

2

La dimostrazione è una semplice generalizzazione di quella del lemma di Watson e fa uso della maggiorazione Rez :2: /zl sino, che vale nel settore I arg z/ ::::'. 1r/2 - 8. Poiché ora /rn(t)/ ::::'. /an/tRe(an+d per O < t < Pn, allora

< /an/f(Re(an+i) + 1) = o(/z/-Re(crn+d-l). -

(lz/sin o)Re(crn+l )+l

100 e-ztrn(t)dtl < Pn

e-Re (z- a > O. Allora: -27!" f( ' --,---g(to)ex to1 f"(to)x

[3.192]

e tale sviluppo è valido nel settore I arg xl
O (s < O). Il punto critico (detto anche punto stazionario) dà un contributo del tipo O(x-½), quindi dominante rispetto a quello degli estremi di integrazione, del tipo O(x- 1 ). Queste considerazioni qualitative sono rese rigorose nel seguente lemma, che enunciamo senza dimostrazione. Lemma 5. Se la funzione reale cp(t) è C 2 in [a, b] e ha in [a, b] il solo punto critico a, con cp"(a) =I- O, allora per x - oo [3.199] I(x)

=

1b

eixcp(t)g(t)dt

g(a)eixcp(a)+sgn(cp"(aHi

7f

rv

2lcp"(a)lx

Se il punto critico è b, vale ancora la formula [3.199] sostituendo a con b. 3.7.6. Il metodo del punto di sella Il metodo nasce da un'idea di Riemann, sviluppata da Debye. Si vuole determinare il comportamento asintotico, per >. - oo, della funzione I(>.) definita dall'integrale

I(>.)=

[3.200]

la

e>.f(t)g(t)dt

dove le funzioni J(t) e g(t) sono analitiche in un dominio D del piano complesso te C è un contorno contenuto in D di estremi t 1 e t 2 (che possono eventualmente trovarsi sulla frontiera di D). Nei casi particolari in cui C è un intervallo dell'asse reale e f è una funzione reale o immaginaria pura, possiamo applicare i metodi di Laplace e di Kelvin rispettivamente. Se esiste un contorno 'Y contenuto in D sul_quale Re/ (t) = u(x, y) (con t = x + iy) ha il suo massimo in un punto to = x 0 + iy0 E 'Y, mentre Imf(t) = v(x, y) resta costante per evitare rapide oscillazioni dell'integrando, siamo nella situazione in cui è applicabile il metodo di Laplace; infatti se, ad esempio, 'Y va dal punto to al punto t 2 e r = Re(J(to) - J(t)) > O, allora:

l"!(>.) =

1

e>.f(t)g(t)dt =

= e>.f(to)

ei,\Imf(to)

1

dt e-,\-r g(t(r))-dr o dr

1 b

208

e"Ref(t)g(t)dt =

3. RAPPRESENTAZIONI INTEGRALI E PER SERIE

dove t(b) = t2. Il metodo di Laplace fornisce quindi lo sviluppo asintotico dell'integrale 1--y(>.. ) ed inoltre permette di determinare il settore · del piano complesso À in cui tale sviluppo è uniformemente valido. Il metodo del punto di sella consiste nel deformare il cammino di integrazione C in modo che la funzione f(t) goda, sul nuovo cammino 1 , delle proprietà suddette. Si noti che, essendo f (t) analitica in D, non esistono punti interni di D in cui la funzione u(x, y) decresca in tutte le direzioni (punti di massimo); u(x, y) può avere solo punti di sella. Ammettiamo per semplicità che u(x, y) abbia un solo punto di sella (xo, Yo) in D, con to = xo + iyo; se I è la curva passante per (xo, Yo) tale che v(x, y) = cost = v(xo,Yo) (quindi I è perpendicolare al grad v), dalle condizioni di Cauchy-Riemann: grad u · grad v = O segue che I è tangente al vettore grad u, ed è quindi la curva di variazione più rapida di u(x, y). Nel punto di sella (xo, Yo) le derivate di u e v nella direzione l tangente a I sono zero: 8u/8l(xo,Yo) = 8v/8l(xo,Yo) = O, ed essendo f(t) analitica, ne segue che f'(to) = O. Nell'intorno di t 0 la funzione f(t) assume quindi la forma f (t) = f(to) + (t - to)mh(t), con h(t0 ) = j(m)(to)/m! i- O e m ~ 2. Si dice allora cheto è un punto di sella di ordine m - 1. Per un'analisi topografica più dettagliata dell'intorno del punto di sella conviene usare coordinate polari: t - t 0 = rei 8 e h( t) = pei-. g(to) ds (0)e l

.

-i

+ O(>-. , )],

).. -+ 00

Notiamo infine che, per s-+ O, t-t 0 ~ sei 0k, e quindi che dt/ds ls=O = ei8 k. Inoltre u"(s) = d 2/ds 2 J(t(s)) su 'Y, e quindi u(0) = f"(to)(dt/ds

(s

= 0)) 2 = -lf"(to)I-

Se ti e t 2 giacciono nello stesso settore negativo, allora si può facilmente mostrare che I(>-.) = O(e,\(J(to)-TJ)), ).. -+ oo. Se uno degli estremi di integrazione coincide con t 0 , allora J(>.) 1/2 del contributo [3.201]. Se la funzione Re f(t) ha più di un punto di sella in D, allora la scelta del cammino di integrazione varia da caso a caso. Infine, se il punto di sella è di ordine superiore a 1, il numero delle traiettorie possibili di discesa più rapida è maggiore di due, e anche in questo caso la scelta della curva "Y dipende dalla situazione. Ad esempio, per l'integrale ·

~

si ha che l'unico punto di sella t = O è di ordine 2, i 3 settori negativi che confluiscono in t = O sono O < arg t < 1r /6, 2/3 7r < arg t < 1r e 4/31r < arg t < 5/31r, e le direzioni di discesa pi-ù rapida, bisettrici dei settori negativi, sono 01 = 1r/6, fh = 5/61r e 03 = 3/21r. Poiché l'intervallo d 'integrazione [O, l] è sulla frontiera del 1° settore negativo e un estremo di esso ,c oincide con il punto di sella, la curva ì non può

211

METODI MATEMATICI DELLA FISICA

essere che il raggio arg t che

I - (y')/ \_-

ooe'i

1 o

= 1r/6. 3

ei>.t -_

Su di essa, ponendo it 3

ii

~

3

100 e o

-ÀT

= -r,

si ha

r(i)eii _ -~3 __ r -¾dr1 À3

Resta quindi da congiungere l'estremo 1 al punto ooéf nel modo più conveniente. A questo proposito notiamo che la curva di fase costante passante per t = x+iy = 1: Im(it 3 ) = x(x-v'3y)(x+v'3y) = cost = 1 è proprio la curva che, nel 1° settore negativo, congiunge i suddetti punti. Poiché su di essa it 3 = y(y 2 - 3x 2 ) + i e y(y 2 - 3x 2 ) va da O (per t = 1) a -oo (per t = exp(i 1r /6)) in modo monotono, introduciamo la parametrizzazione naturale it 3 = -T + i, O < r < oo. Allora, per À

--4

00

avendo usato l'espansione binomiale di (1 + ir)-¾ ed il lemma di Watson. Quindi À

--4

00

Si può verificare facilmente che tale sviluppo è valido nel settore Iarg >.i < 1r del piano complesso À. Si noti infine che il contributo dominante poteva essere ottenuto usando il metodo della fase stazionaria. 3.7.7. Equazioni differenziali e sviluppi asintotici In questo paragrafo ci poniamo il problema di determinare lo sviluppo asintotico di funzioni definite da equazioni differenziali ordinarie o alle derivate parziali e da rappresentazioni in serie; seguiremo la strategia (associata ai nomi di Poincaré, Laplace, Horn ecc.) di ottenere un'opportuna rappresentazione integrale di tali funzioni e quindi di usare i risultati dei paragrafi precedenti. Prenderemo in considerazione alcuni esempi significativi.

Esempio 1: L'equazione di Airy. Il primo esempio è costituito dall'equazione di Airy [3.202]

d2y dx2 -xy=O,

212

y=y(x)

3. RAPPRESENTAZIONI INTEGRALI E PER SERIE

Essa appartiene alla classe di equazioni del tipo

dny

N

:Z)an + x,Bn) dxn

[3.203]

=O

n=O

la cui soluzione generale ammette la seguente rappresentazione integrale (dovuta a Laplace): [3.204]

l

y(x) = [ extg(t)dt,

g(t) = D(t) exp

N

I

N

D(t) = L.Bntn, n=O

[3.205]

Jt N(t') D(t') dt

N(t) = Lantn n=O

e la curva C è tale che !'integrando assume gli stessi valori agli estremi di integrazione (verificarlo). La soluzione dell'equazione [3.202] è allora 3 r~ppresentata dall'integrale di Laplace y(x) = fc ext-t l 3 dt e la curva C viene presa in modo tale che !'integrando si annulli ai suoi estremi. Poiché !'integrando tende a O esponenzialmente nei settori I arg ti < 1r/6, 1r/2 < arg t < 5/61r e 7/61r < arg t < 3/21r, le curve C 1 , C2 e C3 in fig. 3.26 sono tutte accettabili e forniscono tre soluzioni diverse dell'equazione [3.202], due delle quali indipendenti. FIGURA

3 .26

213

METODI MATEMATICI DELLA FISICA

Integrando lungo C 1 otteniamo la cosiddetta funzione di Airy: Ai(x) = 1/(27ri) J01 exp(xt - t 3 /3)dt, che è una funzione intera nel piano complesso x e che ha il pregio non trascurabile di essere reale per x reale. Si noti infatti che possiamo deformare il contorno C 1 , in virtù del teorema di Cauchy, fino a farlo coincidere con l'asse immaginario, ottenendo Ai(x) = [3.206]

~ 1ioo ext-~dt = ]_ 100 ei(xs+4-)ds =

-ioo 2?T -oo = -1100 cos(xs + -)ds 2'1TZ

83

'1T o

3

I punti di fase stazionaria dell'integrando sono s = ±iy'x; per renderli indipendenti da x introduciamo la sostituzione s = y'xt, x > O ottenendo:

t = ±i sono i due punti di sella (di ordine 1) di Re J(t); le corrispondenti curve di discesa più rapida sono, rispettivamente, il ramo superiore 'Y dell'iperbole y 2 - x 2 /3 - 1 = O e la retta x = O. Poiché !'integrando è esponenzialmente piccolo per t -+ oo nei settori O < arg t < ?T/3 e 2?T/3 < arg t < ?T, deformiamo il cammino C d'integrazione (l'asse reale) fino a farlo coincidere con 'Y (cfr. fig. 3.27), ottenendo:

Su -y: T = f(i) - f(t) = (t - i) 2 [1 - i/3 (t - i)] > O, con ±./r ~ t - i, per t-+ i su 'Y±· Il teorema di Lagrange ci permette allora di esprimere t - i in serie di potenze di ./r nell'intorno di T = O:

t- i

~ ~ r(, -

l) (~)k- 1(±\H)k

~ r(~)k!

3

T-+ o+, t-+ i, t E 'Y± '

214

3. RAPPRESENTAZIONI INTEGRALI E PER SERIE

g± FIGURA

(T) "'~ (±1/f(~k - 1) (' }:_)k-lT½-1 f='o 2r(½)(k -1)! 3 '

T---+

o+

3.27

f ~~

~ -i

x---: i

Osservando che la funzione 21r À -½ Ai( À i) è analitica per I arg >.i < 7r /2 e applicando il lemma 2, otteniamo infine il risultato cercato:

A"( ). ~ e-¾x¾ l X

[3.207]

! 27rX4

x---+ ao,

~ f(3n + ½) (-g !)-n L.,, ( )I X , 2n .

n=O

7r

Iargxl < 3

Esempio 2. L'equazione di Bessel. Il secondo esempio è fornito dall;equazione di Bessel [3.208] Questa equazione non è del tipo [3.203] e quindi non è immediato rappresentarne la soluzione mediante un integrale. Procediamo allora cercando una soluzione in serie di potenze del tipo: 00

y(x, v) =

L akxk+s k=O

sostituendo in [3.208] si ottiene

(i -

v 2 )a0 x 8 + [(s + 1) 2 ~ ,i!Jn 1xs+l+

00

+

E{[(k + 2 + s) 2 - 112]ak+2 + ak}x 1HìH = O k=O

215

METODI MATEMATICI DELLA FISICA

e quindi s = ±li, a0 è arbitrario, a 1 = O e

ak+2

=

-ak/[(k + 2 + s - ll)(k + 2 + s + li)],

k

=

O, 1, ...

Per s = li abbiamo quindi la soluzione J ( )

[3.209]

= (= )" ~ (-1/(x/2) 2

vX

2 k

L...-k!f(k+ll+l) k=O

Usando i risultati del par. 3.2 è facile mostrare che la serie (x/2)- 11 J 11 (x) è uniformemente convergente in ogni compatto dei piani complessi x e li, ed è quindi una funzione intera sia in x che in li. Pertanto la funzione J 11 (x) è una soluzione dell'equazione [3.208], intera nella variabile li (per x ,f. O) e polidroma in x (se li non è intero). La rappresentazione in serie [3.209] non permette di ricavare informazioni asintotiche in modo diretto sulla funzione di Bessel J 11 ( x) per lxi ---. oo. Se però ricordiamo che

dove H _ è il contorno di Hankel di fig. 3.23, allora

Jv(x) =

L - l)k(x)2k+v ! 2nk! 1 etr(k+Hv)dt = oo

(

H

k=O

(x)"1

= -1 -

27ri 2

H_

x

-

(X)"1

~ -1( - - ) k = - l d tet-1 L...t"+ k=O k! 4t 27ri 2 2

2

et-"'•• t -11-l dt

H_

avendo scambiato somma e integrale grazie al fatto che la somma è la serie esponenziale. Il cambiamento di variabili t = xé /2, x > O, porta infine alla ben nota rappresentazione integrale delle funzioni di Bessel (dovuta a Schliifli) [3.210]

J,,(x) = -1. 27ft

100+1riexsinhr-vr dr oo-1ri

Questa rappresentazione, ottenuta per x > O, è anche valida nel semipiano Rex > O. Si noti che il trucco che ci ha permesso di passare dalla serie [3.209] all'integrale [3.210] è applicabile anche se il coefficiente kesimo della serie contiene il fattore 1/k!; in questo caso si userà la

216

3. RAPPRESENTAZIONI INTEGRALI E PER SERIE

formula 1/k! = 1/(21ri) fc etrk-ldt, dove C è un qualunque contorno chiuso che circonda l'origine. FIGURA 3.28

-in

Per ottenere il comportamento asintotico dell'integrale [3.210] per grandi valori di x, osserviamo che J(t) = sinht e quindi, nella striscia llm ti < 1r, si trovano i punti di sella t± = ±i1r/2 di ordine 1, con J(±i1r/2) = f"(±i1r/2) = ±i. Il teorema di Cauchy ci permette di deformare il contorno C nell'unione delle curve --y1 e --y2 di discesa più rapida definite dalle equazioni cosh x sin y = l, sinh x cos y < O che individuano, attraverso i punti di sella -i1r /2 e i1r /2, le direzioni 31r / 4 e 1r / 4 rispettivamente. Possiamo quindi applicare i risultati del teorema 1 (cfr. formula [3.201]) a ciascuna delle curve ')'1 e 1'2, ottenendo:

Jv(x) [3.211]

=

(1

_+

-00

1=+i1r) exsinht-vtdt ~

00-1,,r

-oo

~ [2 cos(x -

V~

x -. oo, valido per I arg xl

~v - ~) 2 4

< 7r /2.

Esempio 3. Polinomi di Legendre. Un altro trucco assai semplice, applicabile ad esempio a tutti i polinomi classici, consiste nell'uso combinato di una formula detta di Rodriguez (cfr. par. 5.3.1) e della formula di Cauchy per la derivata n-esima di una funzione analitica.

217

METODI MATEMATICI DELLA FISICA

Ad esempio, dalla formula di Rodriguez dei polinomi di Legendre segue che [3.212]

P, (x) - _1_ dn (x2 - l)n - _1_

n

- 2nn! dxn

1

(t2 - l)n dt

- 2n+l7ri e (t - x)n+l

dove C è una qualunque curva chiusa che contorna il punto x ( integrale di Schliifli) . Si può perciò dimostrare con l'integrale nella [3.212] che vale la formula [3.213]

Esempio 4. L'equazione di Schroedinger. Consideriamo ora l'equazione di Schroedinger non stazionaria in una dimensione spaziale per una particella libera e non relativistica (in opportune unità) 'ljJ

[3.214]

= 'ljJ(x, t)

In un contesto di meccanica quantistica 'ljJ(x, t) rappresenta la funzione d'onda di una particella libera e l'ljJ(x, t)l 2 dx la probabilità di trovare tale particella nel tratto (x,x + dx) al tempo t; in altri contesti (fluidodinamica, fisica dei plasmi ecc.) l'equazione [3.214] descrive l'evoluzione di un pacchetto d'onde dispersive di ampiezza complessa 'ljJ(x, t) e l'ljJ(x, t)l2dx è il contenuto di enèrgia ad esso associato nel tratto (x, x + dx). Se, al tempo iniziale t = O, la particella è confinata in un intervallo limitato dell'asse x, la funzione 1Po(x) = 'ljJ(x,0) ha supporto in quell'intervallo e f~00 l1Po(x)l2dx = 1 (la particella è certamente da qualche parte sull'asse reale) . Vogliamo determinare l'evoluzione della funzione d'onda secondo l'equazione [3.214], soggetta alla condizione inziale 1Po(x), vogliamo quindi risolvere ~l problema di Cauchy: ,8'ljJ f)2'ljJ + - X 2 = O, . x E R, t > O, 'ljJ(x, 0) = 1jJ0 (x) 0 Ot e siamo soprattutto interessati, per ovvie ragioni sperimentali, al comportamento della 'ljJ(x, t) a tempi lunghi. La soluzione del problema di Cauchy (cfr. par. 6.3) per l'equazione [3.214] e, più in generale, per equazioni del tipo i-

[3.215]

218

3. RAPPRESENTAZIONI INTEGRALI E PER SERIE

con condizione iniziale '1/Jo (x) localizzata, è convenientemente rappresentata dall'integrale detto di Fourier (cfr. par. 3.6.7)

'1/J(x, t)

=

1=

1:

-CX)

[3.216]

,,J;o(k)

=

d2k ei(kx-w(k)t),,j;o(k) 7r

e-ikx'l/Jo(x)dx

dove la funzione w(k) è legata a k dalla cosiddetta relazione di dispersione N

N

[3.217]

w(k)

= :~)-lto:nk 2n+1;

w(k) = I)-lt+1,Bnk 2 n

n=O

n=O

La rappresentazione [3.217] indica che '1/J(x, t) è la sovrapposizione di infiniti treni d'onde ,,j;0 (k)ei(kx-w(k)t) di vettore d'onda k, ampiezza ,,J;o(k), fase (T)(A') = (A)(T), (A')= (T)- 1 (A)(T) k=l

v) Gli operatori A e A hanno la stessa rappresentazione matriciale nelle basi {x{j)}f e fa(j}'}r rispettivamente, se e solo se [4.55]

-

-

AT=TA::::>A=T

-1

AT

I vettori colonna che, in seguito al cambiamento di base [4.46] , si trasformano secondo fa [4.48}, sono detti controvarianti, poiché la trasformazìone delle loro coordinate è l'inversa della tra:sposta della trasformazione della base. I vettori riga che, invece, si trasformano secondo la [4.52], sono detti covarianti, poiché si trasformano come la base. Due matrici (A) e (A') sono dette S'imili se esiste una matrice (T) invertibile che le lega tramite l'equazione [4.54]. La trasformazione [4.54] è detta di similitudine o. canonica. Allora due matrici sono simili se e solo se sono le rappresentazioni matriciali di uno stesso operatore. Ad ogni operatore su V è quindi associata una classe di matrici simili (mostrare che è una classe di equivalenza). Avendo ottenuto le leggi di trasformazione di vettori e matrici, ci occupiamo ora di invarianti. Notiamo innanzitutto che equazioni algebriche tra matrici sono invarianti per trasformazioni di similitudine; basta infatti osservare che, se A'= T- 1 AT e B' = T- 1 BT, allora [4.56]

cA' = T- 1 (cA)T A'+ B' = T - 1 (A + B)T, A'B' = T- 1 (AB)T 250

4 . SPAZI LINEARI E OPERATORI LtNEARI

È inoltre possibile mostrare che anche tr A e det A sono invarianti per trasformazioni di similitudine: tr A'= tr(T- 1AT) = tr(ATT- 1 ) = tr A detA' = det(T- 1AT) = det(T- 1) det(A)det(T) = = (detT)- 1 detAdetT = detA e quindi sono grandezze intrinseche dell'operatore rappresentato dalle matrici A e A'. Un'altra grandezza intrinseca associata all'operatore A è il suo "polinomio caratteristico" PA(>.): n

(4.57]

n

PA(>.) = det(A- >.I)= LCn-jÀ3 = II (>.k - >.), >. E C k=l

j=O

infatti:

PA'(>.) = det(A' - >.I)= det(T- 1(A - >.I)T) = PA(>.) Ne segue in particolare che i coefficienti c1 , j = 1, ... , n del polinomio caratteristico (e quindi i suoi zeri >. 1, . . . , Àn) sono invarianti per trasformazioni di similitudine e quindi sono grandezze intrinseche deH'operatore A; gli zeri di p(>.) sono detti autovalori di A (cfr. par. 4.2.5). Osserviamo che tr A e det A sono due fra i coefficienti del polinomio caratteristico: precisamente si ha che eo = (-lt, c 1 = (-1)n- 1trA e Cn = det A. Osserviamo inoltre che i coefficienti c1 del polinomio caratteristico e gli autovalori di A sono legati dalle relazioni:

)

n

C1 = (-l)n-l

L

Ài,

c2

i=l C3=(-l)n- 3

=

-i1 >-i 2 2

i1 < i2

n

L

À; 1Ài 2À; 3, ... ,Cn=IIÀi i1 .)vi+LaikVk=O,

i=l, ... ,n

k#i

che ammette una soluzione v1, ... , Vn non nulla se e solo se À è una delle radici del polinomio caratteristico PA(>.) = O. Essendo invariante per cambiamenti di base, il polinomio caratteristico è una quantità intrinseca dell'operatore A; così come lo sono le sue radici Àj, j = 1, ... , n, che quindi costituiscono l'insieme degli autovalori di A.

)

Operatori diagonalizzabili Se, in una certa base, un operatore acquista una forma matriciale semplice, ad esempio diagonale, triangolare, diagonale a blocchi, è possibile dedurre molte proprietà spettrali e di struttura dell'operatore col minimo sforzo. Dato un operatore su V nasce quindi il duplice problema di capire se esso può assumere una certa forma matriciale semplice e come ottenerla, cioè come individuare la base ad essa associata. Ci chiediamo, ad esempio, se un operatore è diagonalizzabile, se cioè esista una base rispetto alla quale esso è diagonale, e quale sia questa base; giungiamo allora al risultato seguente: un operatore lineare A sullo spazio vettoriale n-dimensionale V è diagonalizzabile se e solo se esso possiede n autovettori indipendenti. Infatti, se {.;ç_(J) H è la base associata alla forma diagonale Àij aJ8iJ di A, allora m

A;J;.(j) =

L

AkJ±(k)

=

O'.J;J;.(j),

j = 1, ... , n

k=l

e quindi A possiede gli n autovettori indipendenti 12.(J) = ;J;.(j), j = 1, ... , n in corrispondenza agli autovalori Àj = O.j- Viceversa, se 12.Ul, j = 1, ... , n sono autovettori indipendenti di A, allora, rispetto alla base di questi autovettori, l'operatore A viene rappresentato da una matrice diagonale i cui elementi sono proprio gli autovalori di A: Av = diag(>.1, . .. , Àn)- Infatti: n

Av - (j)

= '°'A •·v(i) = /\J_ ' ·v(j) ~ '1i= l

253

_,_ -,,-

A ij --

8 ij/\j '

Se (A) è la. rappresent,a:zione matrid:a1e d'eU'opemtore A di:agonalì:z,z ahile in una .kp(k) k=l

mediante gli operatori di proiezione le equazioni

p(k ),

k = l, ... , n che soddisfano n

[4.68)

p(i)p(j) -

Lp{i) = I

J:_ .p(i) UiJ '

i =l

e che quindi decompongono lo spazio V nella somma diretta di n sottospazi L1, ... , Ln indipendenti. Il sottospazio Li è la varietà lineare associata all'autovettore 'J!.U); è quindi unidimensionale ed invariante rispetto ad A, con A~= >..1~ se !!I. E Lj. ii) In una generica base faU)} il proiettore p(k) è rappresentato dalla matrice

[4.69} dove v;i) è la componente i-esima del j-esimo autovettore di A rispetto alla base faU)}. iii) La matrice AD= diag(.X1, . .. , ~n) rappresenta l'operatore A nella base dei suoi autove.ttori. La matrice (A) che lo rappresento. nella base faU)} è trasformata nella matrice diagonale An ( è cioè diagonaliz zata) attraverso la trasformazione di similit'l.tdine 0

[4.70} iv) Se gli autovalori di A sono degeneri, se cioè

[4.71) >tn,,,,_1+t

= · ·· = 2'55

Àn

=

µm

METODI MATEMATICI DELLA FISICA

allora vale la decomposizione spettrale m

A= Lµkp(k)

[4.72]

k=l

attraverso gli operatori di proiezione

L n1

[4.73]

p{l)

=

p(s),

s=l

che soddisfano le equazioni m

Lp{i) = I

[4.74]

i=l

e quindi decompongono lo spazio V nella somma diretta di m sottospazi

M 1 , ... , Mm indipendenti. Il sottospazio Mj è la varietà lineare associata agli nj autovettori che corrispondono all'autovalore µj; esso ha quindi dimensione nj ed è invariante rispetto ad A, con A,;r_ = µj,I. se ,;r_ E Mj. v) Un qualunque polinomio 1r(A) dell'operatore A ammette la decomposizione m

[4.75]

1r(A) = L 1r(µk)p(k) k=l

vi) Gli operatori di proiezione della decomposizione spettrale [4. 72] sono esprimibili come polinomi dell'operatore A nel seguente modo:

[4.76]

P, (k) --Pk(A), k-1, ... ,m

con

[4.77]

Dimostrazione. Restano da dimostrare le equazioni [4. 74], [4. 76] e [4. 77], tutte conseguenze dirette delle equazioni [4. 72]; la dimostrazione è lasciata al lettore. Usando la [4. 75] è anche immediato dimostrare che operatori che ammettono una decomposizione spettrale soddisfano l'identità di Cayley-Hamilton.

256

4 . SPAZI LINEARI E OPERATORI LINEARI

Il teorema 4.3 si basa sull'unica ipotesi che l'operatore A possegga n autovettori indipendenti. Questa proprietà non è sempre vera, ad esempio l'operatore di derivazione su Pn (lo spazio dei polinomi di grado < n) ha n autovalori coincidenti ed uguali a O ed il solo autovettore costante. Una condizio.n e sufficiente per l'esistenza di autovettori indipendenti è contenuta nella seguente proposizione.

Proposizione 4-6. Condizione sufficiente affinché un operatore A possegga almeno m ::; n autovettori indipendenti è che possegga m autovalori distinti. Dimostrazione. Per induzione. Mostriamo innanzitutto che, se >. 1 =/>.2, allora i corrispondenti autovettori Q(l), Q( 2) sono indipendenti. Assumiamo per assurdo che Q( 2 ) = a 1Q(l), a 1 =/- O ed applichiamo l'operatore A ad ambo i membri dell'uguaglianza ottenendo a 1 (>. 2 À1)1L(l) = O, che porta alla contraddizione >. 1 = >. 2. Mostriamo infine

che, se i primi l autovettori Q(k), k = l, ... , l sono indipendenti, lo sono anche i primi l + l. Se, per assurdo, Q(!+l) = I:~=l akQk), con ak =/- O per qualche k = i, applicando A otteniamo I:~=l ak(Àk - À1+1)1L(k) = O, che porta all'assurdo Ài = >-1+1Da questa proposizione segue che condizione sufficiente per l'esistenza di n autovettori indipendenti dell'operatore A e, quindi, per l'applicabilità del teorema 4.3, è che tutti gli autovalori di A siano distinti. Tale condizione non è necessaria (ad esempio l'operatore identità possiede n autovalori uguali ad 1 ed n autovettori arbitrari, che quindi possono essere scelti indipendenti); è chiaro però che eventuali ostacoli alla costruzione di n autovettori indipendenti potranno solo venire da situazioni di degenerazione degli autovalori. Se l'autovalore µk, k = I, ... , m, ha molteplicità nk, intesa come molteplicità della radice del polinomio caratteristico di A (la cosiddetta "molteplicità algebdca-::r,), eon I;;;'.. 1 n, ~ n , [4.78]

PA(À)

=

Il (µk -

>-t·

k=l

sarà quindi importante stabilire il numero mk di autovettori indipendenti ad esso associati (la cosiddetta "molteplicità geometrica" di µk), che coincide ovviamente con la dimensione del nucleo dell'operatore A - µkl: mk = dim N(A - µkl) . È facile rendersi conto che:

Proposizione 4. 7. La molteplicità geometrica di un autovalore non è maggiore della sua molteplicità algebrica.

257

METODI MATEMATICI DELLA FISICA

Dimostrazione. Il nucleo Nk dell'operatore A- µkI gode delle seguenti proprietà: i) è un sottospazio di V non nullo (contiene almeno un autovettore) ; ii) la sua dimensione è pari alla molteplicità geometrica mk di µk; iii) è invariante sotto l'azione di A e la restrizione AINk di A a Nk possiede il solo autovalore µk; quindi det(AINk - AI) = (µk - Ark. D'altra parte, essendo AINk la restrizione di A su Nk, il det(AINk -AI) è un fattore del det(A - AI) da cui segue mk ~ nk. Soltanto se mk = nk, k = 1, ... , m, il numero di autovettori di A indipendenti è pari a ne quindi l'operatore è diagonalizzabile. Possiamo anzi affermare, più precisamente, che l'operatore lineare A sullo spazio vettoriale V di dimensione n possiede n autovettori indipendenti ( ed è quindi diagonalizzabile) se e solo se la molteplicità algebrica nk di ogni autovalore µk, k = 1, ... , m è pari alla sua molteplicità geometrica mk (cioè se e solo se nk = dimN(A - µkI) = n - dimR(A - µkI)). Il controllo di questa proprietà è possibile, ad esempio, attraverso il calcolo del rango delle matrici (A) - µkI, k = 1, .. . , m che rappresentano gli operatori A - µkI in una certa base, ed usando le proprietà di invarianza del rango di una matrice. Un operatore con autovalorì degeneri e riducibile alla forma diagonale dovrà quindi avere proprietà assai speciali. Nel paragrafo seguente prenderemo in considerazione esempi di operatori di grande rilevanza in fisica, come gli operatori hermitiani e unitari, che godono di tali proprietà e che quindi sono sempre diagonalizzabili. Nel resto di questo paragrafo ci occuperemo di operatori che non hanno un sistema completo di autovettori e, quindi, non sono riducibili alla forma diagonale; mostreremo tuttavia che esiste sempre un'opportuna base nella quale essi assumono una forma relativamente semplice, la cosiddetta "forma canonica di Jordan'' . Per fare questo è richiesto un ulteriore approfondimento delle proprietà di un operatore lineare su V e, in particolare, delle possibili decomposizioni di V da esso indotte. Forma triangolare e quasi diagonale a blocchi di un generico operatore Se µk è un autovalore di A, la varietà R(A- µkl) è invariante rispetto ad A ed ha dimensione ~ n - 1. Sia Ln-1 un qualunque sottospazio di V di dimensione n - 1 che contiene R(A - µkl), allora Ln-I è una varietà invariante rispetto ad A; infatti,V;f E Ln-1 (anzi, V;f E V), si ha che (A - µkl);f E R(A- µ1':l) C Ln-1• Abbiamo quindi dimostrato che, per ogni operatore lineare A su V, esiste un sottospazio Ln- I e V,

258

4 . SPAZI LINEARI E OPERATORI LlNEARI

invariante rispetto ad A e di dimensione n - 1. Allora esisterà aneh_e un sottospazio Ln-2 C Ln-1 di dimensione n - 2 e invariante rispetto ad· AILn - l (e quindi rispetto ad A). Q.uest~o · ocedimento può essere. iterato fino alla costruzione del sottospazio L1 L2 e ... e Ln-I di dimensione 1 e invariante rispetto ad A. · ' quindi dimostrato che, per ogni operatore lineare A sullo spazio n•dimensìonale V, è possibile individuare n sottospazi L1, ... , Ln di V, invarianti rispetto ad A e tali che [4.79] j:;:::: 1, ... ,n

[4.80]

Questa decomposizione dello spazio permette di selezionare la seguente base di V rispetto alla quale la matrice che rappresenta A è triangolare: fa_(j)n=1, ;fui E Lj, ~ Lk(k < j). La forma triangolare di un operatore permette di identificare a vista i suoi autovalori, che coincidono con gli elementi della diagonale prin. eipale. Poiehé la decomposizione [4.79], [4.80] e la scelta deUa base non sono uniche, ogni operatore lineare ammette piu di una forma triangolare. Esiste un altro procedimento di riduzione, più strutturato di quello triangolare, che porta alla cosiddetta forma quasi diagonale a blocchi di un generico operatore e, se questo è diagonalizzabìle, alla sua forma diagonale. Sia 1/pA(À) = Z::;;'= 1 rk(>..)/(µk - >..)n~ l'espansione in fratti parziali dell'inverso del polinomio caratteristico (4.78] dell'operatore A (allora rk(>..) è un polinomio in À di grado s nk - 1, invariante e tale che rk(µk) # O). L'identità che ne deriva: m

m

k=l

s=l,s#k

L rk(À) IT

(µs - >..t•

=1

implica la seguente identità operatoriale su V: m

[4.81]

L y(k)(A)::;::; I k=l

m

[4.82]

F(k>(A) = rk(A)

IT

(µ 8 I - A)n,, k = 1, . .. , m

s=l,#k

259

METODI MATEMATICI DELLA FISICA

Dall'identità di Cayley-Hamilton [4.58] segue che gli operatori F(j) soddisfano anche le equazioni F(i)F(j) = c5ijF(i), i, j = 1, ... , m e quindi, grazie alla proposizione 4.4, essi decompongono lo spazio V nella somma diretta V = ffi1,: di m sottospazi L 1 , ... , Lm invarianti rispetto ad A, che coincidono col range di ciascun operatore di proiezione: Lk = {F(k),1;_;,1;_ E V}, k = 1, ... , m. Per calcolare la dimensione di Lk conviene notare che Lk non è solo il range del proiettore F(k), ma è anche il nucleo dell'operatore (A - µkltk:

Lk = N((A - µkl)nk) Infatti, se ,1;_ E V=} :3y E V tale che ,1;_ = FUl(A)y ⇒ (A - µkltk,1;_ = ri(A)pA(A)y = O, per l'identità di Cayley-Hamilton. Viceversa, se ,1;_ è tale che (A - µkltk,1;_ = O, allora dall'equazione [4.81] segue che ~ = E;;'=l F(k)(A)~ = FUl(Ah E Lj. Si ha che (AILk - µkl)nk,1;_ = O, V~ E Lj, e quindi (A - µkltk è l'operatore nullo su LJ e possiede, al pari dell'operatore (A - µkl), il solo autovalore Ocon molteplicità algebrica pari a dim Lk =} p Al L. ( À) = J (µk - >.)dim Lk. D'altra parte per una tale decomposizione di V è possibile scegliere un'opportuna base di V rispetto alla quale A è rappresentato da una matrice quasi diagonale a m blocchi: (A) = [A 1 , ... , Am] e che Ak è la matrice che rappresenta l'operatore A!L. su Lk. Quindi PA (>.) = PAI Lk (>.) = TI;;'=l (µk -À)dim Lk; dal confronto con [4. 78] si deduce infine che dimLk = dimN((A - µkl)n•) = nk. Raccogliamo questi risultati nel seguente teorema.

n;;:,1

Teorema 4.4. Sia A un operatore lineare sullo spazio V di dimensione n e sia m

[4.83]

PA(À)

=

II (µk - À)nk,

k=l

il suo polinomio caratteristico. Gli operatori di proiezione m

F(k)(A)

= rk(A)

II

(µ 8 1 - A)n•

s=l,#k

decompongono lo spazio V nella somma diretta degli m sottospazi

260

4. SPAZI LINEARI E OPERATORI LINEARI

invarianti rispetto ad A e di dimensione nk. Ciascun operatore A!Lk su Lk possiede il solo autovalore µk con molteplicità algebrica nk. Rispetto ad una base faUl} di V ripartita nel seguente modo: {,r_(J)}f 1 t A erap' e L 1, {±(J)}nn 21 +1 e L 2,···, {;!;.(J)}n"' n,.,._ 1 +1C L m, l'operaore presentato da una matrice quasi diagonale a m blocchi (A)= [A 1 ,A 2 , ... , Am] ed il blocco Ak è la matrice nk x nk che rappresenta l'operatore AILk rispetto alla base di Lk. Nel caso in cui N(A - µkl) = N((A - µklrk ), k = l , . . . 'm {in generale vale il simbolo di inclusione e) allora la base di Lk è éostituita da nk autovettori indipendenti di A, corrispondenti all'autovalore µk e quindi i blocchi Ak sono matrici diagonali Ak = µkl, k = l, ... , m e la matrice diagonale a blocchi si riduce alla matrice diagonale. Forma canonica di Jordan

È possibile semplificare ulteriormente la forma dell'operatore A attraverso un'opportuna decomposizione di ciascun sottospazio Lk di V. Tale decomposizione permette di individuare un'opportuna base di Lk rispetto alla quale l'operatore AILk viene a essere rappresentato esso stesso da una matrice quasi diagonale i cui sottoblocchi sono matrici triangolari inferiori di dimensione a del tipo

[4.85]

Ja(µ) =

µ

o

l

µ

o o o o

O 1 O O

1

µ

detti blocchi di Jordan. Poiché la situazione degli m sottospazi Lk è concettualmente la stessa, concentreremo la nostra attenzione su un solo sottospazio, liberandoci dell 'indice che lo caratterizza. Abbiamo a che fare quindi con uno spazio vettoriale L di dimensione d e, su di esso, con un operatore lineare B che possiede il solo autovalore µ di molteplicità algebrica d; il nostro scopo è di individuare una base di L in cui l'operatore B è quasi diagonale a blocchi di Jordan. Conviene lavorare con l'operatore C = B - µI, che possiede il solo autovalore O con molteplicità d; esso è quindi nilpotente: Cd = O. Sia v l'intero positivo tale che

[4.86]

cv = 0

ma

cv- l

261

-/= 0

METODI MATEMATICI DELLA FISICA

con 1 < v S d (se v = l, allora B = µI e non è necessaria alcuna riduzione) e si considerino i nuclei delle potenze di C: N(Ck), k = 1, .. . , v per i quali si ha, ovviamente, che [4.87]

N(C)

C

N(C 2 )

C ... C

N(c"- 1 )

C

N(C")

=L

Poiché C" = O e cv-I =/- O, allora esiste un sottospazio di N(C") = L non banale e non contenuto in N(C"- 1 ); lo ohiamiamo G,, e g,, è la sua dimensione (g,, 2: 1). Seguendo questa strategia è possibile individuare v sottospazi di L : G1, G2, ... , G,, talj che Gk è il sottospazio di N(Ck) non contenuto in N(ck-l ), con 9k := dim Gk, k = l, ... , v. Per costruzione si ha che Ci n Gj = {O}, i =/- j = 1, ... , v. Questi sottospazi godono delle seguenti proprietà: i) se !f. E Gk, allora C!!,_ E Gk-1; ii) un insieme di vettori indipendenti di Gk viene mappato, tramite C, in un insieme di vettori indipendenti di G k- 1; iii) 9k-l 2: 9k, l S k S v (questo, tra l'altro, implica che, essendo G,, non banale, saranno non banali anche tutti gli altri: Gk =/- {O}, k = 1, ... , ve, quindi, i segni di inclusione nella formula [4.87] vanno intesi in senso stretto); iv) L = EBGs::::} E:=19s = d.

Dimostrazione

i) Se !f. E Gk (!f. E N(Ck),;r_ (/_ N(ck- 1 )), allora ck-l(C!f.) = _Q::::} C!!,. E N(Ck-l ). Inoltre C!!,. (/. N(ck- 2), perché altrimenti ck- 2 (C;r_) = ck-l!f. = O, contraddicendo l'ipotesi. ii) Se ;r_ 1 , ... ,±s E Gk e sono indipendenti, si consideri l'equazione Ls 0: 8 (C!!,. 8 ) = O (con !f.8 E Gs e Cx 8 E Gk_i). Ne segue che C (Le 0: 8 {f 8 ) = O ::::} Ls O:s!f. 8 E N(C), e quindi Ls O:s±s appartiene sia a Gk che a N(C) = G1. Allora Ls O:s±s = .Q::::} O:s = OVs. iii) Segue direttamente da i e ii.

iv) Se ;r_ E N(C") = L, allora ;r_ = ;r_,, + 'J/.,,, con !f.,, É G,, e 'J!.,, E N(C"- 1 ). Quindi 'J!.,, = ;r_,,_ 1 + 'J!.,,_ 1 , con ;r_,,_ 1 E G,,_1 e 'JL,,_ 1 E N(C"- 2 ); e così via, fino a concludere che !f.= E:=l ±s> ±s E Gs, S = 1, ... , v =} L = E:=l G 8 • Per mostrare infine che gli insiemi Gs, s = 1, ... , v sono indipendenti, si parte dall'equazione E:=l X 8 = .Q, ±s E G 8 • Applicando ad essa l'operatore cv-i si giunge all'equazione cv-i ;r_,, = .Q, cioè ;r_,, E N(C"- 1 ), e quindi ;r_,, = _Q. Applicando poi cv- 2 si mostra in modo analogo che ;r_,,_ 1 = _Q e cosi a catena, sino alla conclusione che !f.8 = _Q, s = 1, ... , v. Questa decomposizione suggerisce la seguente scelta della base di vettori di L . Siano !f.(l), .. . , !f.(g.) g,, vettori indipendenti di G,,. Per

262

4. SPAZI LINEARI E OPERATORI LINEARI

ogni ;f(j), j dipendenti:

=

1, ... , 9v costruiamo il seguente insieme di vettori in-

BY)=

faUl,C;f(j), ... ,cv-l;f(j)}

Il suo inviluppo lineare ½(v) è un sottospazio di L, invariante rispetto a C ed indipendente dagli altri al variare di j. Rispetto a ciascuna base BY) l'operatore Cly è rappresentato dal blocco di Jordan J

Jv(O); abbiamo quindi ottenuto 9v blocchi di Jordan di dimensione v. Avendo esaurito lo spazio Gv, passiamo ora a Gu-l • Siano yU) ,j = 1, ... ,9v-l - 9,.,., (9v-l - 9v) vettori indipendenti di Gu-1, ed indipendenti dai vettori C;J;.U), j = 1, ... , 9v. Come sopra glì inviluppì lineari ½(v-l) degli insiemi di vettori indipendenti

BJI•(v-1) = {-y (j} ' e·-y (j;) ' ... ' cv-1 y (j)}; ~

sono sottospazi indipendenti di L e invarianti rispetto, a C. G:lii operatori Cly.I)

= det(A - >.I) = det(A - .Xl) =}

e; = ci

In particolare: tr A+ = tr A, det A+ = det A e gli autovalori di A+ sono i complessi coniugati degli autovalori di A.

È utile raccogliere le proprietà più rilevanti dell'operazione di coniugazione hermitiana nella seguente proposizione. Proposizione 4.11. Gli operatori lineari A1, ... ,Am sullo spazio euclideo V godono delle seguenti proprietà (che valgono anche per le rispettive rappresentazioni matriciali): i} (A1 + ... + Am)+ ii) (cA)+ = cA +;

= At + ... + At;

iii) (A+)+ = A;

iv) (A1A2 ... Am)+ = At ... At At; v) se esiste A- 1 =} (A- 1)+ = (A+)- 1, la cui dimostrazione è lasciata al lettore. Notiamo che esiste una forte analogia tra l'operazione di coniugazione hermitiana di operatori lineari su spazi euclidei e la nozione di coniugazione complessa di numeri complessi. Se, infatti, z E C e A è un

271

METODI MATEMATICI DELLA FISICA

operatore lineare su V, allora si hanno le seguenti corrispondenze: z --,

z

A--,A+

cA __, cA +

cz--, cz Z1

+ Z2

--, Z1

+ Z2

A1 + A2 __, (A+)+= A

z=z zz

= zz = lzl2

:::::

At + At

tr(A + A) = tr(AA +) ?:: O

o

m

L zizi = L Jzil

2

=O=} Zi = O

i=l

Allenati oramai alla ricerca di invarianti, notiamo che il sottoinsieme dei numeri complessi invarianti per coniugazione complessa, cioè tali che z = z, è l'importante insieme dei reali. Siamo quindi portati ad introdurre e studiare l'insieme degli operatori lineari A invarianti rispetto all'operazione di coniugazione hermitiana, cioè tali che [4.116] Un operatore che soddisfa questa proprietà è detto "autoaggiunto" o "hermitiano"; se lo spazio vettoriale è reale, è detto "simmetrico". Dalle equazioni [4.115] e [4.116] segue che la rappresentazione matriciale di un operatore hermitiano A è data da una matrice (A), detta hermitiana, tale che [4.117]

Aij=Aji,

i,j=l, ... ,n

una matrice, cioè, che è invariante rispetto alla combinazione delle operazioni di scambio di righe con colonne e di coniugazione complessa degli elementi; dalla [4.117] segue in particolare che gli elementi diagonali di una matrice hermitiana sono reali. Se V è uno spazio reale, allora [4.118] e la matrice è simmetrica rispetto allo scambio di righe e colonne. Le analogie tra operatori hermitiani e numeri reali sono assai forti. La proposizione 4.10 implica che gli invarianti di un operatore hermitiano associati al suo polinomio caratteristico sono reali; vale inoltre il seguente importante teorema di caratterizzazione.

Teorema 4.s. CNES affinché una trasformazione lineare sullo spazio euclideo V sia hermitia,na è che la forma quadratica (:l'., A,1'.) , detta in questo caso forma hermitiana, sia reale per ogni ,I'. E V.

272

4. SPAZI LINEARI E OPERATORI LINEARI

Dimostrazione:

j

=

LL j

j

XjAijXi

=

LL i

XiAijXj

= (;r, A;r)

j

L'analogo dei numeri immaginari, cioè tali che z = -z, è dato dagli operatori "anti-hermitiani", definiti dall'equazione

[4.119] e rappresentati da matrici anti-hermitiane tali che [4.120] Ogni operatore lineare A è esprimibile in modo univoco nella forma [4.121]

A=B+C

dove B è hermitiano e C è anti-hermitiano. Se V è uno spazio complesso, allora ogni operatore lineare su V è esprimibile in modo univoco nella forma [4.122]

A=B+iD

dove B e D sono operatori hermitiani. Infatti B = 1/2(A +A+) e C = 1/2(A - A+) sono gli operatoti nella [4.121] . Se V è complesso, allora D = -iC è hermitiano, da cui segue la [4.122]. La relazione [4.122] è l'analogo della decomposizione di un numero complesso: z = Re z + ilm z nella sua parte reale ed immaginaria. Le matrici B e D prendono quindi il nome di "parte reale" e "parte immaginaria" della matrice A (anche parte "hermitiana" e parte "antihermitiana") . L'analogia tra coniugazione complessa e coniugazione hermitiana si è già dimostrata fruttuosa, portando all'individuazione degli operatori hermitiani, analogo dei numeri reali. Se ci chiediamo quale sia l'analogo dei numeri positivi z ~ O, tali che z = f,2 per qualche ç E R o tali che z = (( per qualche ( E C , giungiamo alle seguenti possibili definizioni di "operatore positivo", che indicheremo col simbolo A ~ O: i) A = B 2 , per qualche B hermitiano; ii) A = c+c, per qualche C;

273

METODI MATEMATICI DELLA FISICA

iii) A è hermitiano e(:?;., A:?;.) ~ O V,?;. E V . Si può dimostrare che le tre caratterizzazioni sono equivalenti. Solitamente si usa la iii come definizione di operatore positivo; un operatore positivo (o definito positivo) è quindi un operatore hermitiano tale che (:?;., A:?;.) ~ O V:?;. E V ; interpreteremo le i e ii come due caratterizzazioni alternative. Completiamo il nostro parallelo tra numeri complessi ed operatori lineari su spazi euclidei prendendo in esame i numeri complessi di modulo 1, cioè tali che zz = ( Introdurremo quindi gli "operatori unitari" U, definiti dalla proprietà [4.123]

u+u=I

Se lo spazio V è reale, allora tali operatori sono d~tti "ortogonali". Un operatore unitario su uno spazio finito-dimensionale è invertibile e gode delle seguenti proprietà [4.124]

u+u = uu+ = 1,

u+ = u- 1

La nozione di trasformazione unitaria risolve il fondamentale problema (volutamente trascurato sinora) di individuare la trasformazione lineare più generale su uno spazio euclideo che preservi il prodotto scalare tra vettori e, quindi, lunghezze, distanze e angoli.

Proposizione

4- 12. CNES affinché un operatore U sia unitario è che

[4.125]

oppure che [4.126]

Dimostrazione. Se U è unitario, le formule [4.125] e [4.126] seguono direttamente dalle [4.124] e dalla definizione di coniugazione hermitiana. Se, viceversa, vale la [4.125], allora il vettore (U+u - I)y) è perpendicolare a:?;. V:?;. E V, e quindi (U+U - l)y = Q Vy, da cui segue la [4.123]. • La trasformazione unitaria, che preserva le proprietà metriche dello spazio euclideo, è anche detta "trasformazione isometrica" o "isometria" . Una conseguenza importante di questa proprietà è che operatori unitari trasformano sistemi ortonormali di vettori in altri sistemi ortonormali; infatti, se :?;.(l), . . . , ±(ml sono vettori ortonormali, allora i vettori

274

4 . SPAZI LINEARI E OPERATORI LINEARJ

i(j)

= U~(j), j == 1, ... , m, sono anch'essi ortonormali:

[4.127]

(i) ==

-

x(j)) = (x(i) (u+ux{i) ,_ - ,_x (y,A;!:.) =O= (A+Jl~;!:_) ==> A+Jl E M1-. Conseguenza immediata è che se M è invariante rispetto ad un operatore hermitiano A, allora anche M 1- è invariante rispetto a tale operatore. Siamo ora in grado di dimostrare il teorema spettrale per operatori hermitiani su spazi euclidei finito-dimensionali. Usando un punto di vista riduttivo (ma non troppo), si potrebbe affermare che tutto ciò che si è fatto sinora in questo capitolo è un esercizio preparatorio in funzione di tale teorema. Il lettore è invitato ad un confronto col teorema spettrale 4.3 (par. 4.2.5) valido per operatori lineari diagonalizzabili. Teorema 4-6. Teorema spettrale per operatori hermitiani. i) Un operatore auto-aggiunto o hermitiano A su uno spazio euclideo V di dimensione n possiede n autovalori )q, ... , Àn reali ( eventualmente

276

4. SPAZI LINEARI E OPERATORI LINEARI

degeneri). Autovettori corrispondenti ad autovalori diversi sono ortogonali. ii) L'operatore A possiede n autovettori ortonormali 12.( 1) , ... , 12.(n). iii) Esso ammette la seguente decomposizione spettrale [4.66], cioè

attraverso gli operatori di proiezione ortogonale soddisfano le equazioni [4.68], cioè

p(k),

k = l, ... , n che

n

p(i)pU)

= OiJp\i),

e decompongono lo spazio V nella somma diretta di n sottospazi L 1 , . • . , Ln mutuamente ortogonali ed invarianti rispetto ad A, con A;i;_ = Ài,'.!;., se ;i;_ E Li. iv) In una generica base ortonormale f:.(j) il proiettore ortogonale p(k) è rappresentato dalla matrice

[4.130] dove v?) è la componente i-esima dell'autovettore 12.(k) nella base foU) }. v) La matrice Av = diag(À 1 , ... , Àn) rappresenta l'operatore A nella base ortonormale dei suoi autovettori. La matrice hermitiana (A) che lo rappresenta nella base fo(j) }f è trasformata nella matrice diagonale Av ( è cioè diagonalizzata) attravers/J la trasformazione ( di similitudine) unitaria

[4.131] dove la matrice unitaria V ha per colonne gli autovettori ortonormali di A:

[4.132]

(U)iJ

=

v;

1)

vi) Se gli autovettori sono degeneri nel modo descritto dalla [4. 71], allora vale la decomposizione spettrale [4. 72], cioè m

A= Lµd:>(k) k=l

277

METODI MATEMATICI O-E LLA FISICA

attraverso i proiett-Ori ortogonali definiti dalle [4. 73] che soddisfano le [4.74] e quindi decompongono lo spazio V nella somma diretta di m sottospazi M1 , • •. Mm ,mutuamente ortogonali ed invarianti rispetto ad A, con A,;f = µill., l4) E Mi , e tali che dim Mk = nk, k = 1, ... , m, dove nk è la moltepl~cità algebrica dell'autovalore µk . vii) Un qualunque polinomio p(A) dell'operatore A ammette la seguente decomposizione spettrale ( cfr. [4. 75]) m

p(A)

= LP(µk)f>(k) k=l

viii) Gli operatori di proiezione ortogonali della decomposizione [4. 72] sono esprimibili come polinomi dell'operatore A nel seguente modo:

[4.133]

Dimostrazione. Per dimostrare il punto ii sì noti che l'insieme Nk = N(A - µkl), l'ìnviluppo lineare degli autovettori di A corrispondenti all'autovalore µk, è un sottospazio invariante rispetto ad A. Dalla proposizione 4.14 segue che anche Nf è invariante rispetto ad A ; quindi det(A- .XI) det(AINk - Àl) det(AIN_j_k -ÀI). D'altra parte: i) l'operatore AINk possiede il solo autovalore µk con molteplicità. algebrica ffik : det(Al11h -Àl) ::= (µk -Àrk; ii) l'operatore AIN_j_k non può avere l'autovalore µk ⇒ det(AIN_j_ - µkl) 'f- O e quindi det(AIN_j_ - Àl) k . . k non contiene nessun fattore µk - >.. Il confronto con l'espressione [4.78] porta a concludere che mk nk, cioè che, in corrispondenza ad ogni autovettore µk di molteplicità algebrica nk, l'operatore hermitiano A possiede nk autovettori indipendenti, che possono poi essere resi ortonormali. In virtù del risultato i gli insiemi Nj, j ;== 1, . .. 1 m sono mutuamente ortogonali, e quindi gli E;;-'= 1 nk == n autovettori in essi contenuti sono ortonormali. Per dimostrare il resto del teorema basterà utilizzare i risultati del teorema 4.3, adattandoli al caso di autovettori ortonormali. In particolare, la matrice di trasformazione [4.69] diventa unitaria e si riduce all'espressione [4.132], i proiettori [4.69] diventano ortogonali e si riducono alle espressioni [4.130]. Di particolare importanza in Meccanica analitica e, soprattutto, in Meccanica quantistica, è il seguente risultato: CNES affinché gli operatori hermitiani A e B posseggano n autovettori ortonormali comuni ( e quindi siano diagonalìzzabili attraverso la stessa trasformazione unitaria U), è che essi commutino.

=

=

278

4. SPAZI LINEARI E OPERATORI LINEARI

Dimostrazione. La dimostrazione della necessità è immediata: si assume che AQ(j) = ÀJ'!l.(j) e BQ(J) = µJ'!l.(j), j = 1, ... , n; inoltre ogni ;f. E V è espresso come ;f. = L;=l Ck'!l.(k). Quindi AB;l;. = L;=l ckµkÀk'!l.(v) = BA;l;_. Si noti che questo risultato vale per ogni coppia di opera:tori che hanno un sistema completo di autovettori in comune. Se, viceversa, assumiamo che [A, B] = O, allora A e B hanno almeno un autovettore v in comune. Sia L la varietà lineare ad esso associata e L1- il suo complemento ortogonale di dimensione n - l. Allora sia A che B sono invarianti rispetto ad L1-, e le loro restrizioni su L1- sono operatori hermitiani in L1- che commutano. Esse hanno quindi un vettore di L1- in comune, ortogonale al precedente; e così via, fino all'esaurimento dello spazio. Operatori hermitiani possiedono una base ortonormale di autovettori, la forma spettrale [4. 72] e sono diagonalizzabili con una ·trasformazione unitaria. Vedremo ora che queste importanti proprietà sono condivise da una classe più ampia di operatori, ed un semplice argomento che permette di individuarli è il seguente. Se si vuole che un operatore N sia decomponibile, secondo la (4.72], in proiettori ortogonali (e quindi hermitiani), allora N deve necessariamente commutare col suo aggiunto: [4.134] Un operatore N che gode della proprietà [4.134] è detto "normale"; si noti che operatori hermitiani ed unitari sono due esempi significativi di operatori normali. Vale il seguente annunciato teorema per operatori normali.

Teorema 4. 7. CNES affinché un operatore possegga n autovettori ortogonali è che sia normale. Dimostrazione. Sia N = B + iD, B = 1/2(N + N+) e D = 1/2i(N N+) la rappresentazione cartesiana dell'operatore N; essendo N normale, gli operatori hermitiani B e D commutano: [N, N+] = [B + iD, B - iD] = i[D, B] = O. Essi hanno quindi lo stesso sistema di autovettori ortonormali, che sono quindi anche gli autovettori di N. Se, viceversa, N possiede n autovettori ortonormali: NQ(J) = ÀJ'!l.(j), ('!l.(j) ,'!l.(k)) = 8Jk, j, k = 1, ... , n vogliamo dimostrare che N+ possiede gli stessi autovettori, e quindi commuta con N. Infatti, \/;f_ E V,;l;. = LZ.,, 1 ('!1.(kl,;l;.)1'.(k); quindi (N+'!l.0l,;l;.) = (1'.(j),N~) = >.J('!l.(j),;l;.) ~ ((N+ - ÀJ1)1'.(j),;l;.) = O v';l;. E V~ N+QU) = ÀJ1'.U>. Il teorema spettrale 4.6, precedentemente dimostrato per _operatori hermitiani, vale quindi, più in generale, per operatori normali, con 279

METODI MATEMATICI DELLA FISICA

l'ovvia avvertenza di eliminare la caratterizzazione di realtà degli autovalori (cioè il punto i del teorema). Se un'opportuna caratterizzazione degli autovalori è invece data, essa fissa in modo significativo il carattere del corrispondente operatore normale. Vale, a questo proposito, il seguente risultato. Un operatore normale su V è hermitiano, positivo, strettamente positivo, unitario, invertibile, idempotente se e solo se i suoi autovalori sono, rispettivamente, reali, positivi, strettamente positivi, di modulo 1, diversi da O, uguali a O e 1. 4.2.8. Le matrici di Pauli Tra le matrici 2 x 2, sono molto usate in fisica le cosiddette matrici di Pauli ai, (i= 1, 2, 3) che, nella base naturale, hanno la seguente forma esplicita: · -1

o Esse hanno traccia nulla e sono non-singolari (det a i = -1); sono inoltre hermitiane. È facile verificare con calcolo esplicito che godono delle proprietà riassunte dalla seguente formula: 3

[4.135]

CTjCTk

= 8-jkl + i

L

l

Ejk/CTl

1

dove I è la matrice identità e con Ejkl si è indicato il simbolo completamente antisimmetrico di Levi-Civita: Ejkl

=

-f.jlk

=

-Ekjl ,

f.123

=1

Essendo le ai hermitiane, la [4.135] mostra chiaramente che esse sono anche unitarie. Dalla [4.135] si ottiene poi facilmente che:· 3

[aj,ak]

=

2iL

1

EjklCTl

1 { CTj, ak}

= 2bikl

Gli autovalori delle matrici di Pauli sono evidentemente (per la traccia nulla e il determinante uguale a -1) ± 1. Ogni matrice A(2 x 2) si può scrivere nella forma di Pauli:

280

4. SPAZI LINEARI E OPERATORI LINEARI

dove a= (a1, a2, a3), ii= (0-1, 0-2, 0-3) . Si osservi che se A è hermitiana, allora a 0 , a sono reali. È facile verificare, con l'aiuto della [4.135], che

ao = ai

1

2tr(A)

1

= tr(ajA)

2

così che I, o- 1 , o-2 , 0-3 formano chiaramente una base ortogonale di matrici (cfr. [4.100]) in uno spazio matriciale che ha come prodotto scalare di A e B il numero (1/2)Tr(AB). Se allora B = bol + b · ii, si otterrà la seguente formula per il prodotto: AB

= (aobo +a. b)I + [aob +boa+ i(a I\ b)] . ii

dove /\ indica l'usuale prodotto vettoriale tra due vettori in 3 dimensioni. Poiché il commutatore di A e B è dato dall'unico termine non simmetrico della formula del prodotto, cioè

[A, B] = 2i(a Ab) . ii la condizione di commutatività di due matrici A e B si traduce in una condizione di parallelismo dei relativi vettori a, b : a = kb, Vk {e} [A,B]=O. 4.2.9. Rappresentazione polare di una matrice Si usa talvolta una decomposizione l:lelle matrici in due fattori che è l'analogo della fattorizzazione dei numeri complessi in "modulo" e "fattore di fase" (cfr. par. 1.1.1). Più precisamente:

A=HU dove H è una matrice hermitiana e U è una matrice unitaria. La rappresentazione non è necessariamente unica, se H e U non commutano; una forma equivalente è:

A=VH' dove, ancora, H' è hermitiana e V è unitaria. Poiché, per l'unitarietà di U e V e per la hermiticità di H e H':

VH'U+ = H = (VH'U+)+ = UH'V+

281

METODI MATEMATICI DELLA FISICA

= U. A questo punto

segue che possiamo scegliere V minare H e H':

è facile deter-

A+A = H' 2

AA+ =H 2 ,

e sceglieremo per H e H', nelle loro forme diagonali, le determinazioni positive delle radici degli autovalori di AA + e A+ A, rispettivamente. Risulta così evidente che, se A e A+ commutano ( A è, cioè, una matrice normale e soddisfa la [4.134), [A, A +j = O), allora H e H' coincidono. Determinate così H e H', se A è non-singolare è facile determinare U:

U = H- 1 A= AH'- 1 ,

detA =/- O

Se però il det A = O (e perciò det H = det H' = O), la determinazione di U resta in parte arbitraria, come era da aspettarsi in analogia all'indeterminazione dell'argomento nell'origine del piano complesso. 4.2.10. Funzioni di matrici La nozione di funzione di una matrice, che si generalizza facilmente a quella di funzione di un operatore lineare, è molto importante nelle applicazioni fisiche . Essa .è abbastanza semplice da usare. Intanto, supponiamo di partire da una funzione di variabile complessa, f (z), sviluppabile in serie di Taylor: 00

[4.136)

f (z)

=

L

n

anZn,

lzl < R

o

Poiché le potenze di una matrice A (nxn) sono ben definite dall'operazione elementare di prodotto di due matrici, la nuova matrice costruita come combinazione lineare di potenze di A: 00

f(A)

=L

n

anAn

o

richiede soltanto un'estensione della nozione di convergenza al caso delle serie di matrici (di potenze di una matrice, in particolare) . Supponiamo che

282

4. SPAZI LINEARI E OPERATORI LINEARI

IA±I

s kl±I,

k > o,

\:/;§_

Segue, allora, che se k < R si può parlare di convergenza di J(A) in tutto lo spazio di vettori ± perché 00

IJ(A)±I S

L

00

n

lanl

jAn±I S

o

L,.. lanlknl±I io

Se k > R, si può sempre trovare un sottospazio V tale che questa diseguaglianza sia soddisfatta \/;J;_ E V; in quel caso si dirà che la serie [4.136] converge in V, e si porrà un problema analogo a quello del prolungamento analitico al di fuori dello spazio originario di definizione (V, in questo caso). Se A è diagonalizzabile e ha n autovalori >.i, (i= 1, 2, ... , n), allora il problema è esattamente quello del prolungamento analitico di f(z), perché, se ~{i) è l'autovettore associato a >.i, richiederemo che esista il prolungamento J(>.i) tale che [4.137] Sappiamo anche (cfr. [4.58]) che esiste il polinomio identicamente nullo di grado n detto di Cayley-Hamilton che consente di ridurre ogni potenza > n - 1 di A a una combinazione lineare delle prime n - l. Pertanto, ci aspettiamo che ogni funzione di matrice n x n sia riducibile alla forma polinomiale n-1

J(A) =

Lo , .• f

m

Am

Come si determinano i coefficienti f m? Se lo spettro di A non è degenere, il problema è molto semplice, perché, richiedendo che n-1

[4.138]

f(>.i)

=L

.,. fm >.7',

i

= 1, 2, ... , n

o

si dispone esattamente di n equazioni lineari nelle n incognite fm, m = O, 1, ... , n - l. D'altra parte, il determinante dei coefficienti delle incognite f m - coefficienti che altro non sono che le potenze dei diversi autovalori, per ipotesi tutti distinti - è certamente diverso da zero (è il determinante detto di Van der Monde). Un esempio molto comune è quello dell'estensione matriciale della formula di Euler-De Moivre per i numeri complessi (cfr. par. 1.1.1) al caso della

283 .

METODI MATEMATICI DELLA FISICA

funzione esponenziale di matrici di Pauli. Sia ii un versore a tre componenti reali. La matrice ii • if soddisfa il polinomio di Cayley-Hamilton (ii· i/) 2 = I così che i suoi autovalori sono +1 e -1. Pertanto, se et è un parametro (non · necessariamente reale), si avrà eion -ù

= /ol +fin· if

e questa è la forma di Pauli della matrice a primo membro che, essendo di rango 2, si può sempre ridurre ad essa (dunque, la forma di Pauli segue anèhe dall 'esistenza del polinomio di Cayley-Hamilton). Dovendo essere, per la [4.138],

eio =/o+ /i e-io= /o -./1 risolvendo per / 0 , generalizzata):

fi

si otterrà la notevole formula (di Euler-De Moivre

io:n•iJ =cosa I+ i sin a ii · ii Appena più complicato è il caso in cui A sia degenere. Supponiamo che abbia due autovalori uguali, >. 1 = >. 2 . In quel caso, le prime due equazioni del sistema [4.138] che determina i coefficienti f m vengono a coincidere e il problema è sottodeterminato. Ma possiamo sempre richiedere che siano soddisfatte sia la prima equazione (quella per À1) che quella che si ottiene dalla prima per derivazione rispetto a À1:

d

n-1

d>. J(>.1) = 1

.

L , . mfm>-r-l 1

indipendente dalla precedente. Infatti, se immaginiamo che lo spettro non sia esattamente degenere e che >.2 = >.1 + t: , con t: piccolo a piacere, la differenza tra la seconda e la prima equazione del sistema darà:

Questa procedura è intuitivamente comprensibile: la [4.138) equivale all'approssimazione mediante un polinomio di grado n - 1 di una funzione J(>.) di cui si conoscano gli n valori f (>.i) in n punti distinti >.i . Se però due dei

284

4. SPAZI LINEARI E OPERATORI LINEARI

punti coincidono, si può assegnare il valore nel punto e la tangente in esso (cioè la derivata).

Il procedimento si può poi ripetere estendendolo a derivate di ordine più elevato (2, 3, ... ) quando la degenerazione è più grande (3, 4, ... autovalori uguali). Inoltre, osserviamo che una matrice unitaria U può sempre essere rappresentata nella forma di una funzione esponenziale di una matrice hermitiana:

U = exp(iH) dove H è appunto una matrice hermitiana, H = H+. La dimostrazione è molto semplice e viene lasciata al lettore (eventualmente, utilizzare la rappresentazione per serie della funzione esponenziale). Una formula notevole che riguarda in particolare il caso di matrici diagonalizzabili è la seguente:

Tf(A)T- 1 = f(TAT- 1 ) = f(AD) = diag(f(À1), . . . ,f(Àn)) La si ottiene facilmente dalla [4.136] osservando che:

Una conseguenza utile e immediata è la seguente: det(expA)

= det{Texp(A)T-.1} = det{exp(TAT- 1)} =

= exp{Tr(TAT- 1)} = exp(Tr A) perché il determinante della forma diagonale di exp(A) è il prodotto degli autovalori di exp(A). Infine, è necessario fare attenzione a non usare le ordinarie regole di composizione di funzioni di variabili numeriche se le matrici che si adoperano non commutano. Per esempio: exp(A) exp(B) -:/ ~xp(A + B) a meno che A e B commutino. Se A e B non commutano, vale una fon:n ula (di Baker, Campbell e Hausdorff) di cui riportiamo qui i primi termini senza dimostrazione:

285

exJ!}(A) exp{B )

K(A , B} =A+ B

= exp(K(A,B))

+ [A, B]/2 + [A, [A, B]]/12 + [B, [B, A]]/12 + ...

4.3

Spazi lineari astratti 4.3.1. Considerazionì ìntroduttive L'impostazione che seguiremo nell'esporre gli argomenti di questo paragrafo sarà in linea di massima quella di dotare l'oggetto della nostra indagine di strutture progressivamente più complesse, cercando di chiarire quali nozioni e proprietà possano essere corrispondentemente introdotte. Partiremo perciò ìntroducendo là nozione di spazio lineare astratto, mostrando come da essa discendano naturalmente i concetti di dipendenza e indipendenza lineare e di dimensione. Muniremo suecessivamente il nostro spazio lineare di una metrìca, definendo la "distanza" tra due elementi dello spazio: questo ci permetterà di parlare di insiemi aperti e chiusi, limitati e non, di definire "convergenza'' , "densità", "completezza" ecc. Specializzando ulteriormente la trattazione, ci chiederemo come si possa concretamente definire una metrica: mostreremo come uno dei modi possibili consiste nel definire in modo appropriato la lunghezza di un elemento dello spazio, introducendo cioè la nozione di "norma". Infine, noteremo come una "norma" e conseguentemente una "metrica" possano essere indotte dal "prodotto scalare" tra due elementi dello spazio, che generalizza la nozione di "angolo" tra due vettori: arriveremo così agli spazi euclidei astratti e in particolare agli spazi di Hilbert. Per quanto possibile, non distingueremo tra caso finito dimensionale (già trattato al par. 4.2) e infiniterdimensionale, per nendo di volta in volta l'accento sulle proprietà per le quali il carattere infinito delle dimensioni gioca un ruolo "critico". I successivi parr. 4.4 e 4.5 saranno dedicati allo studio delle trasformazioni tra spazi lineari, con particolare riguardo alle trasformazioni lineari. Cominceremo con i funzionali lineari, nel cui ambito tratteremo le distribuzioni, e passeremo poi al caso degli opei:atori lineari propriamente detti, e privilegeremo lo studio degli operatori lineari su spazi di Hilbert.

286

4. SPAZI LINEARI E OPERATORI LINEARI

4.3.2. Spazi lineari: definizione e proprietà

Come abbiamo ricordato al par. 4.2.1, sappiamo dalla geometria elementare che i vettori dello spazio tridimensionale possono essere fra loro sommati (con la regola del parallelogramma) e moltiplicati per un numero reale arbitrario. Sappia.mo pure, dall'algebra, che se un sistema di M equazioni algebriche lineari in N incognite ammette due . . d"1c1amo . / ) e J;.Il = ( x Il , x Il , ... , xN Il ) soluz1on1, ;r_/ = (x /1 , x 2/ , .. . , xN , una 1 2 loro arbitraria combinazione lineare y = (ax~ + f3xt, ... , ax'tv + f3x'f..) è ancora una soluzione. E abbiamo imparato dall'analisi che una proprietà analoga vale per le equazioni differenziali lineari omogenee. I vettori dello spazio tridimensionale, le soluzioni di un sistema lineare omogeneo o di una equazione differenziale lineare omogenea sono altrettante realizzazioni particolari di spazi lineari. Alla luce dei precedenti esempi e del par. 4.2, è naturale definire in generale uno spazio lineare, anche detto spazio vettoriale, come un insieme di oggetti (gli "elementi" o i "vettori" dello spazio) su cui sono "definite due ope. razioni, una interna, chiamata somma, e una esterna, il prodotto per un numero (reale o complesso) che godono delle seguenti proprietà: i) Somma: per ogni coppia di elementi Ji., y E V è definito univocamente un terzo elemento 1. E V, detto somma di ;r_ e y, che si indica con 1. = Ji. + y, l'operazione di somma essendo commutativa (;r_ + y = y + ;r_), e associativa fa. + (y + 1.) = (Ji. + y) + .I. = ;f + y +-1.). Esiste inoltre l'elemento neutro, detto Q (zero vettore nullo), tale che ;r_ + Q = ;r_ VJ;. E V ed esiste un elemento -;r_ (l"'opposto" di ;r_) tale che ;f + (-;r_) = ;f. - ;f. = Q. ii) Prodotto per un numero: per ognì' _;ç_ E V e per ogni a E R( o E C), è definito un elemento aJ;_ E V, detto prodotto di J;. per il numero a. L'operazione di prodotto è: associativa (a(f3;r_) = /J(a;r_) = af3;r_), distributiva rispetto alla somma dei numeri ( (a + /J)Ji. = aJ;. + /J;r_), distributiva rispetto alla somma dei vettori (a(J;. + y) = a;r_ + ay), e tale che 1 • Ji. = J;.. Uno spazio vettoriale V si dice reale o complesso a seconda che l'operazione di prodotto sia definita sul campo dei reali o dei complessi.

o

Esempi di spazi lineari Per gli esempi pm semplici (l'insieme dei numeri reali o complessi, l'insieme delle n-ple di numeri reali o complessi, l'insieme delle matrici

287

METODI MATEMATICI DELLA FISICA

nxn, l'insieme dei polinomi di grado :S; n - 1) rimandiamo al par. 4.2.1. Esempi più esotici, ma che saranno oggetto importante d'indagine, sono dati dalle successioni di numeri reali o complessi (la somma di due successioni essendo definita come la successione i cui elementi sono la somma degli elementi omologhi delle successioni di partenza), o dall'insieme delle funzioni (reali o complesse) continue di variabile reale, con le definizioni:

(f

+ g)(t) = f(t) + g(t) t

E

[a, b]

(af)(t) = af(t) Sempre nell'ambito delle funzioni, altri esempi sono forniti dalle funzioni di modulo (o di modulo quadrato) integrabile su una linea ecc.

Isomorfismo Due spazi lineari Vi e Vi si dicono isomorfi se tra loro esiste una corrispondenza biunivoca compatibile con le operazioni di somma e prodotto definite su di essi (cioè ;f x', y y' implica a;!;_ + f3y .....---4 a.;!;_1 + f3y'). Due spazi lineari tra ioro isomorfi si possono considerare come realizzazioni diverse dello stesso spazio. Un esempio classico (cfr. par. 4.2.1) di isomorfismo è quello tra Rn(o cn) e lo spazio dei polinomi in una indeterminata di grado :S; n - 1 a coefficienti reali (complessi) (ogni polinomio è in corrispondenza biunivoca con l'n-pla di numeri costituita dai suoi coefficienti).

Dimensione di uno spazio lineare D'ora in poi useremo sistematicamente il termine vettore per indicare un elemento di uno spazio lineare. Come abbiamo visto al par. 4.2.1, si dice che n vettori ;f(l), .;!;_( 2 ), ... , _;f(n) sono linearmente dipendenti se esistono numeri reali (o complessi) non tutti nulli a 1 , a 2 , . .. , an tali che (cfr. [4.13]): n

[4.139]

I::ai±(i)

=Q

i=l

Un'espressione del tipo I:7= 1 O'.i2'.(i) si dice combinazione lineare dei vettori ;f(l), ... , 2:_ N€

i=l Ciò implica evidentemente che le successioni numeriche x}m) (l ora denota una certa successione, m il termine corrispondente) sono di Cauchy V l. Sia quindi

xi = m---+oo lim x(m) i

(xi

E

R o a C)

Dobbiamo ora far vedere che la successione Ji. = {xi}~ 1 E b ed è il limite delle successioni Ji.(n). La condizione di Cauchy implica ovviamente: M

L lx}n) - x}m)

2 1


N€

i=l da cui, nel limite m

-+

oo:

M

L lx}n) - xil

2

:::; t

2

per n > N€

2

per n > N€

i=l e nel limite M

-+

oo: 00

L lx}n) - xtl

2


..y) = >.(±, y) \/).. E C ( 3. (±,Y = (i:y) + (x,z) 4. (±,JZ) ~ O; (±,i)= O {=e}± = O

+ ~)

Un'applicazione ("mapping") dal prodotto cartesiano V x V in C che goda delle proprietà 1-3 è detta applicazione sesquilineare ( "sesquilinear mapping"); uno spazio lineare munito di un "sesquilinear mapping" che non soddisfi la proprietà di positività 4 si dice anche pseudoeuclideo. L'esempio più familiare è quello dello spazio di Minkowski, lo spazio vettoriale delle 4-ple di numeri reali col prodotto pseudoscalare fa,J!.) = XoYo - I::f=l XiYi· In uno spazio euclideo la distanza tra due vettori è data da d(±, y) = Il± - YII (invariante per traslazioni), dove la norma o lunghezza 11±11 del vettore ± è definita come:

Dalle proprietà del prodotto scalare segue immediatamente 11±11 ~ O ( = O ± = .Q) e Ila±I I = lai 11±11- Per dimostrare, in tutta la generalità, la proprietà [4.160c] che garantisce la validità della diseguaglianza triangolare, premettiamo la dimostrazione della diseguaglianza di Cauchy-Schwarz (quella fornita nel par. 4.2.6 vale soltanto nel caso di spazi finito-dimensionali):

A tale scopo, consideriamo il numero reale non negativo ll:1,. + >.yll = (:1,. + >.y, :1,. + >.y) , ricordando che esso è nullo se e solo se :1,. = - >.y._Per-:1,., y fissati, esso è una funzione a valori reali del numero complesso >. :2

J(>., >.)

= (:1,. + >.y_'

± + >.y_)

= (:1,., :1,.)

+ >.(:1,_, y_) + >.(y_, :1,.) + >.>.(y_, y_)

Risulta:

Chiamiamo

Ào

il valore per cui

8f /8>. = O: Ào

=-

(11_,:1,.) (11_ , 11_)

304

.,

4. SPAZI LINEARI E OPERATORI LINEARI

Si ha: l(_:ç_, y)l 2 J(>.o,>.o)=(_:ç_,_:ç_)- ( ) ~O Y,Y

e quindi:

che è appunto quanto volevamo dimostrare. Si dimostra ora facilmente la diseguaglianza triangolare; infatti abbiamo:

II-±+ ILI 12 = (J;. + IL, .±+IL) = (J;., J;.) + 2Re(J;., IL) + (IL, IL) ~ ~ (J;., J;.) + (IL, IL) + 2r(J;., IL) I e quindi per Cauchy-Schwarz: 2

11-± + ILI I

~

1

1

(J;., J;.) + (IL, IL) + 2(J;., J;.)2 (IL, ILP =

= [(J;.,J;.)½ + (IL,IL)½J 2 = (II.J1.II + IIILll)2 Nel par. 4.2.6 sono state introdotte le nozioni di angolo tra vettori [4.94] e di ortogonalità, che sono ovviamente indipendenti dalla dimensione dello spazio. Nel caso di uno spazio euclideo oo-dimensionale, definiremo base (ortonormale) un sistema (ortonormale), necessariamente infinito, di vettori, che sia completo, secondo la definizione di completezza di un insieme di elementi di uno spazio metrico, data nel par. 4.3.3. Negli spazi euclidei separabili, ogni sistema ortonormale è finito o al più infinito numerabile. Sia infatti {§_(a)} un tale sistema (l"'indice" a potendo a priori variare con continuità); risulta:

Allora le sfere aperte Ba(f.(a), 1/2) di centro f.(a) e raggio 1/2 sono a due a due disgiunte. Sia {_J;_(i)} un insieme numerabile di vettori ovunque denso su E: in ognuna delle sfere B 0 deve allora cadere almeno uno degli .±(i): quindi l'insieme delle sfere, e di conseguenza il sistema degli f.(a), può essere al più infinito-numerabile.

Dato un sistema, finito o infinito-numerabile di vettori J;.(i) linearmente indipendenti, da esso si può sempre costruire un sistema ortonormale.

305

METODI MATEMATICI DELLA FISICA

È questo il contenuto del Teorema di ortogonalizzazione di GramSchmidt, che ha il pregio - non trascurabile - di fornire un procedimento concreto per questa costruzione, il cui risultato è stato già enunciato nel par. 4.2.6, formula [4.98]. Chiamiamo f(i) i vettori del sistema ortonormale da costruire, e assumiamo che essi siano collegati agli ;r(i) da una trasformazione triangolare, cioè tale che: i

[4.165]

f(i)

=

L

aikJ2(k)

(i= 1, 2, ... )

k=l

Per

f(l)

abbiamo allora semplicemente:

La condizione (t:_( 1),f(l)) = 1 fissa a 11 a meno di un numero complesso di modulo 1 (detti numeri sono anche chiamati fattori di fase):

In altri termini, abbiamo normalizzato ;r< 1 ). Veniamo ora a !{2): esso deve essere ortogonale a t:_< 1 ) e di norma 1. L'idea geometrica naturale è quella di sottrarre da ;r( 2 ) la componente proporzionale a e(l) (parallelo a ;r(l)) e poi normalizzare il vettore ottenuto (cioè "aggiustarne" la lunghezza). Abbiamo perciò: [4.166] A questo punto è chiaro come iterare il procedimento: determinati i vettori f(l), t:_< 2 ), • .. , f(k) ,il vettore f(k+l) sarà costruito sottraendo da ;r(k+l) le sue componenti secondo t:_..J('fLo)('fLo•'J!..o) = >..J('fLo) 318

4. SPAZI LINEARI E OPERATORI LINE ARI

È quindi dimostrato che f(;J2.) = (Q,;f.) V;f, E H, con Q indipendente da ;f. e univocamente determinato; se infatti fosse /fa) = (g', ;f.), si av11ebbe (g,_' - Q, ~) = O V~ e quindi g' = g,_. Le proprietà di trasformazione di vettori-colonna e vettori-riga per effetto di. un cambiamento di base e il teorema appena dimostrato sono il oondamento della famosa "notazione di Dirac": ad ogni vettorecolonna {xi, ... , Xn, ... )T {che rappresenta un vettore astratto di uno spazio di Hilbert in una determinata base) vi.ene associaito un "ket" jx >, ad ogni vettore-riga (a 1., . . • , an, .. . ) (che rappmsenta un funzionale lineare su H nella base duale} viene .associato un "bra" < aJ, in modo tale che il prodotto scalare tra due vettori, che può essere considernto an.che, oome abbiamo visto, il valore assunto sul vettore ~ dal. funzionale lineare individuato da Q, è contrassegnato dal "bracket"

< a lx>. Una volta introdotta la nozione di fon:zionale lineare e di spazi.o -d uale, è aaiturale distinguere, tanto in N quanto in N*, tra due diversi tipi. di. convergenza: la convergenza "forte" o in norma, e la convergenza "-d ebole" o per componenti. È questo un altro punto in c ui è ,essenziale distinguere tra il caso finito e il caso infioi.to-di.mensionale. Dwemo -clie una successione di elementi di N {~{n)}~=l converge fo.r temente o in no.r ma a un v:ettore ~ E N .se risulta:

lim JJ~-;f{n)JJ =0

{4.194]

n-+oo

D.irnm.o invece che essa converge debolmente a ;:ç_ se, Vf E N*, si. ha:

{i 4.195j

Hm U{.f) - f(;:ç_(n))I =; iim J/(;f - ;:ç_ ¼ _.!.a

'

t:

X

Abbiamo in definitiva la formula: eixt

[4.229]

lim - .

ltl-oo a

dxlcp(x)I

e sarà sempre possibile scegliere a "abbastanza piccolo" perché risulti maxlxl a dxlfn(x)I quanto maxlxl >a lfn(x) siano pure < t.

333

METODI MATEMATICI DELLA FISICA

Esempio I p(x)

[4 .237]

={

½,

lxi< 1

o, lxi> 1 ~,

fn(x) = np(nx) =

[4.238]

Si ha:

roo

}_

dxfn(x)¾

roo

= 6,

= lcp(O)l[7r - 2arctg(n8,)] + ( n 282 ) ll'Plli 71' 1 + n , Vediamo perciò che il contributo all'integrale proveniente dall' "intorno dell'infinito" va a zero per n--> oo. In definitiva, possiamo affermare che +00

1

}~~, -oo dxfn(x)[cp(x) - cp(O)Jj S 2E per ogni E prefissato, e quindi tale limite è nullo, purché cp sia continua in = O e assolutamente integrabile sulla retta.

x

Esempio III

p(x)

[4 .241]

= ...!._ sin x

; fn(x)

1l'X

= ...!._ sin nx 1l'X

Tale esempio differisce sostanzialmente dal precedente, e non rientra nelle considerazioni generali fatte sopra perché p(x) è sì integrabile (in senso improprio) sulla retta, ma non è assolutamente integrabile. Si ha comunque:

1:

00

_11

- -

1T

dxfn(x)[cp(x) - cp(O)]

·dx sm . nx [cp(x)cp(O)] -'---'-'--'--'--'-

lxl .. - I) è invertibile - con inverso limitato - per !IA/>-11 = (IIAll/l>-1) < 1, cioè l>-1 > IIAII- Quindi i valori dello spet-

e l'operatore

tro di A costituiscono un insieme chiuso e limitato (un compatto), contenuto per l'appunto nel disco di raggio !IAII Sempre nel caso di operatori limitati, valgono per il risolvente le seguenti proprietà: 1r1) · Nel dominio i>-1 > IIAII, il risolvente è una funzione analitica di >.., e la sua derivata vale:

R\ = (R,x) 2

[4.370]

R,x commuta con ogni operatore limitato che commuta con A, e in particolare risulta:

1r2)

[R,x,Rµ] = O

[4.371]

La proprietà [4.372]

1r 1

è una conseguenza immediata della formula:

R,x -Rµ

= (>..- µ)RµR>.

che si dimostra tenendo conto che I= Rµ(A - µI) = (A - >..I)R>., e scrivendo perciò:

R,x - Rµ = Rµ(A - µI)R>. - Rµ(A - >..I)R>. = = Rµ AR,x - Rµ AR,x + (>.. - µ)RµR>. La proprietà 1r2 si dimostra in modo analogo. Sia B un operatore limitato che commuta con A; esso co!Ilmuta ovviamente con A - >..I. Allora:

R,xB = R,xB(A - >..I)R>. = R,x(A - >..I)BR,x = BR,x Poiché Rµ è un particolare operatore limitato che commuta con A, segue in particolare [R>., Rµ] = O. Una classe importante di operatori limitati che commutano con un operatore limitato assegnato sono le potenze di questo operatore, e più in generale i polinomi in cui la variabile è per l'appunto l'operatore assegnato: [4.373]

Sappiamo già, nel caso delle matrici (cioè nel caso degli operatori lineari su spazi a dimensione finita), che se >.. è un autovalore di A,

381

METODI MATEMATICI DELLA FISICA

corrispondente a un certo autovettore .f.À, p( >.) è un autovalore di p( A), corrispondente allo stesso autovettore. È rilevante che questo risultato si estenda agli operatori limitati su spazi di Banach, non soltanto com'è ovvio - per lo spettro discreto, ma per lo spettro nel suo insieme. Più precisamente, si può dimostrare - e la dimostrazione utilizza i teoremi sul risolvente introdotti fino a questo punto - la proprietà seguente: a(p(A)) = p(a(A)) Lo spettro dell'operatore p(A) è l'insieme dei numeri complessiµ tali

cheµ= p(>.), per qualche >. E a(A) .

Quanto appena detto sui polinomi si estende senza problemi alle funzioni intere e, con le dovute cautele, alle funzioni analitiche in qualche dominio D del piano complesso. Chiudiamo queste considerazioni sulle proprietà spettrali degli operatori limitati ponendoci un quesito: è possibile che lo spettro di un operatore sia vuoto? Abbiamo visto che, nel caso finito-dimensionale, ciò non può mai accadere (l'equazione [4.368] ammette almeno una soluzione nel campo complesso) . È importante rilevare esplicitamente che questa proprietà continua a valere nel caso infinito-dimensionale, con le dovute limitazioni: lo spettro di un operatore limitato su uno spazio di Banach non è mai vuoto. 4.6.3. Proprietà spettrali degli operatori autoaggiunti Come applicazione di quanto esposto nel par. 4.6.2, ricaviamo alcuni risultati "classici". I. Sia A un operatore autoaggiunto limitato su uno spazio di Hilbert: allora i suoi autovalori, se esistono, sono reali, e gli autovettori corrispondenti ad autovalori diversi sono ortogonali. II. Sia A un operatore limitato su uno spazio di Hilbert H, e A+ il suo aggiunto. Allora p(A) = p(A +) (e di conseguenza a(A) = . un punto regolare di A: allora RÀ esiste ed è limitato

382

4. SPAZI LINEARI E OPERATORI LINEARI

su H. Inoltre, poiché (A-AI)+ = A+ - XI e, per un operatore limitato invertibile A, vale la: (A+)- 1 = (A- 1 )+, abbiamo: [4.374]

In altre parole, il risolvente di A+ esiste ed è limita:to per tutti i valori di A i cui complessi coniugati appartengono all'insieme risolvente di A, da cui il risultato. Anche per dimostrare la proprietà III, conviene utilizzare il risolvente. Consideriamo la quantità positiva:

Grazie alle osservazioni del punto II, e tenendo conto che A è autoaggiunto, abbiamo:

(R.x±, R.x±) = (±, Rx R.x±) = 1

1

=A-X(.~, (Rx - R.x)±) = A- X [(R.x±,:'f.) - (:'f.,R.x:'f.)] = = Im(R.x±,±) = llm(R.x±,±)1 < Im A IIm Al -

< 11±11 IIR.x±II

(per la diseguaglianza di Cauchy-Schwarz)

!Im Al

Semplificando:

x'I < II R L1 -

11±11 IImAI

e quindi: [4.375J

IIR .>. l·I =

sup flR.x;fll
. E .I: -

('!!_, (A - >.I);f) = Q V;f E H Poiché A

= A+ e >. = 5.,

si ha:

((A - >.l)'f!_, ;f)

=O

V;f E H

Allora, (A - >.I)'f!_ è il vettore nullo: A'f!_=À'f!_

e arriviamo alla conclusione che >. appartiene allo spettro discreto di A: quindi l'assunto ar(A) f- 0 conduce ad un assurdo. 4.6.4. Operatori unitari e loro spettro

Abbiamo già avuto occasione di parlare di operatori unitari su sp~ finito-dimensionali, e delle loro proprietà. Un operatore U su ~:;~ spazio di Hilbert H si definisce unitario se è una biiezione e u+ = u- 1 . Ricordiamo che una corrispondenza (o mapping) T fra due insiemi X e Y è una biiezione se è biunivoca (,!è1 =/ ,!è2 ⇒ T,!è 1 =/ T,!è2 ) e se R(T) = Y.

Gli operatori unitari godono di importanti proprietà: conservano la norma di un vettore, e più in generale il prodotto scalare tra due vettori: (4.379]

sono limitati e hanno norma 1: [4.380]

IIUII = sup (U;f, U;f) llxll=l 384

sup (;f, J2) 11~11=1

=1

4. SPAZI LINEARI E OPERATORI LINEARI

sono ovviamente normali: [4.381]

u+u = uu+ =

1

Cosa possiamo dire del loro spettro? Sicuramente, esso è contenuto nel disco chiuso JÀI ::S 1; gli autovalori, se esistono, sono numeri complessi di modulo 1:

Di più, possiamo mostrare che l'intero spettro di U si trova sulla circonferenza JÀI = 1, cioè sulla frontiera del suddetto disco. Ci soccorre ancora il risolvente, e l'osservazione che dall'unitarietà di U discende la relazione: R>.-1 (U)

-ÀR!(U)U+

da cui:

Supponiamo ora JÀI > 1, in modo che >. è sicuramente un punto regolare di U : Rx (U) esiste ed è limitato e lo stesso vale per il suo aggiunto. Di conseguenza, R,>.-1 (U) esiste ed è limitato: ma JÀ- 1 1< 1, e quindi tanto l'interno che l'esterno della circonferenza unitaria sono punti regolari di U: i punti dello spettro costituiscono perciò un sottoinsieme (chiuso) della circonferenza JÀI = 1. 4.6.5. Proprietà spettrali degli operatori compatti Abbiamo già avuto modo di osservare come gli operatori compatti, o completamente continui, siano "quanto di più vicino" ci sia, nel caso di spazi infinito-dimensionali, agli operatori finito-dimensionali, cioè alle matrici. Questa caratteristica è ulteriormente confermata dalle proprietà spettrali di questi operatori. Cominciamo dapprima con l'enunciare le proprietà spettrali degli operatori compatti su spazi di Banach; specializzeremo in seguito la nostra indagine agli operatori compatti autoaggiunti su spazi di Hilbert. Sia A un operatore compatto su uno spazio di Banach X . Valgono allora le seguenti proprietà: . i) l'insieme degli autovalori di A è al più numerabile (può essere finito o persino vuoto);

385

METODI MATEMATICI DELLA FISICA

ii) >..=O è l'unico punto di accumulazione possibile per questo insieme; iii) tutti i punti dello spettro, ad eccezione al più di >.. = O, sono autovalori; se X è infinito-dimensionale >.. = Oè un punto dello spettro; iv) gli autospazi con autovalori non nulli hanno dimensione finita; v) esiste un numero intero positivo r = r(>..), detto indice di Riesz, tale che

[4.382]

X= R[(A - >..IrJ EB N[(A - >..Ir]

Se A è un operatore compatto autoaggiunto, vale anche l'ulteriore proprietà ( Teorema di Hilbert-Schmidt); vi) gli autovettori associati agli autovalori di A costituiscono una base ortonormale per H. Ciò implica evidentemente che gli autovalori di A sono un'infinità numerabile, e, in quanto reali, possono essere ordinati:

con limn---+oo Àn = O. Indichiamo con Q(n) l'autovettore associato a dello spazio possiamo perciò scrivere:

Àni

per ogni vettore;!,.

00

[4.383]

;!;_ =

L

Cn!L(n)

+ ;!;_(O)

n=l

con

Cn 00

[4.384]

A;!;_=

L

Cn Àn!L(n)

n=l

Non daremo qui la dimostrazione di queste importanti proprietà spettrali degli operatori compatti, rimandando il lettore alla bibliografia. 4.6.6. Alcuni esempi Consideriamo alcuni semplici operatori, sperando che le loro proprietà illuminino i discorsi un po' astratti svolti in questo paragrafo. Esempio I. Lo spettro di C [4.335]. È immediato dimostrare che IICII = 1; abbiamo già visto nel par. 4.6 .2 che O è un punto dello spettro residuo di C . C non è ovviamente un operatore compatto. Che altro possiamo dire sullo spettro?

386

/

4. SPAZI LINEAiU E OPERATOR.i i.tNEA.lU

Considériamo l'equazione agli autovalori:

Scritta in componenti, essa dà: 0

[4.385]

=

Xn-1

ÀX1

= >.x.,,

n

= 2,3, . . .

Escludendo il caso À = O, già considerato, vediamo chiaramente ché l'unica soluzione dell'equazione agli autovalori è ìa soluzione nulla. Non esiste quindi spettro discreto: per À i= O l'operatore O - >.I è invertibìlé, Resta da vedere se (C - >.1)- 1 è limitato. Poiché IICll ""' l, ci èòhèentreremo sui valori dì >. appartenenti al disco, !Al :-S: 1. Osserviamo che la soluzione dell'equazione lineare

(C - Al),!

= '!!.

o, in componenti: (4.386]

Xn-1 -

n

Yn

ÀXn

=

1, 2, ... ,

-Xo

== O

è data da:

(4.387]

Xn

= -

1

).n+l

~ L

k

À

Yk

k=l

Questa espressiorre ci dice immediatamente che, per IAI < 1, RÀ(C) non è limitato. Scegliamo infatti come y il vettore di base ~(Il = (1, O, O, ... ). Abbiamo allora: -

RÀ(C)§.

(1) _

-

(

1 1 1 ) -~,:->. 2 ,->.3,--·

e quindi:

sei>.!

:-S: l

In conclusione, l'operatore di creazione C non ha spettro discreto. Il suo spettro continuo è costituito dai valori di À appartenenti al disco unitario, ad eccezione dell'origine che è un punto (l'unico!) dello spettro residuo. Esempio II. Lo spettro di D (4.334]. D è un operatore limitato ancora di norma 1, non compatto. Studiamo l'equazione agli autovalori: D;ç_

=

o, in componenti:

387

À;ç_

METODI MATEMATICI DELLA FISICA

Xn+l

=

n

ÀXn

= 1,2, .. .

La sua soluzione è evidentemente: Xn

=

n = 1,2, ...

Àn-l X1

X1

arbitrario

Di qui ricaviamo che >. = O è un autovalore e l'autovettore corrispondente è (proporzionale a) f(l). Per >. =I= O, dobbiamo vedere se ;ç_>. appartiene o no a lz. Si ha: 00

00

n=l

n=l

00

e la serie è convergente solo se l>-1 < 1. Possiamo perciò dire che l'interno del cerchio unitario, compresa l'origine, costituisce lo spettro discreto di D (pur-essendo un dominio!). Resta da considerare la frontiera, l>-1 = 1, che deve appartenere allo spettro (che è un insieme chiuso) . È facile verificare che D non ha spettro residuo: in caso contrario, il range di D - >.I non sarebbe denso su l2, e quindi esisterebbe un vettore ~ tale che

(~, (D - >.I);ç_)

= O

\/;ç_

È facile verificare che ciò implica Zn-1 -

ÀZn

=O

n = 1,2, ...

zo

=o

che (per >. =I= O) ha solo la soluzione nulla (4.385]. Quindi lo spettro continuo di D.

l>-1 = 1 costituisce

Esempio III. L'operatore C + D. L'operatore C + D, la cui azione in componenti si scrive:

(4.388]

Yn

=

Xn-1

+ Xn+l

n = .1,2, . ..

Xo

=

0

è di notevole importanza, perché può essere considerato una versione discreta di un operatore differenziale del II ordine (l'operatore differenza seconda che più spesso si introduce è in realtà C + D - 21). È un operatore autoaggiunto limitato (ma non compatto!). Proponiamoci di studiare il suo spettro. Di esso sappiamo già che è reale, e contenuto nel segmento (m, M] (cfr. (4.376],

(4.377]): m

=

inf (;ç_, (C + D)g;_),

M

11.i!:.ll=l

sup (;ç_, (C + D);ç_)

=

11.i!:.ll=l

Ora: 00

(;ç_, (C + D);ç_)

L

00

Xn(Xn-1

+ Xn+1)

L

+

n=2

n=l 00

L

00

XnXn-1

n=l 00

(xn Xn+l

+ e.e.)

n=l

2Re

L n=l

388

L

XnXn+l

X n Xn+l

=

4. SPAZI LINEARI E OPERATORI LINEARI

E quindi, applicando la diseguaglianza di Cauchy-Schwarz:

[4.389] Lo spettro è quindi sicuramente contenuto nel segmento [-2,2] dell'asse reale. Di più, vale la proposizione:

Lo spettro dell'operatore C + D è puramente continuo e coincide con il segmento [-2,2] dell'asse reale. Osserviamo anzitutto che, essendo un operatore autoaggiunto limitato, C + D non può avere spettro residuo. Diamo una dimostrazione "euristica" della precedente proposizione; nel paragrafo successivo forniamo una prova rigorosa, in cui tra l'altro discutiamo in generale il metodo di soluzione di equazioni lineari alle differenze seconde. Poiché ci interessa studiare che cosa succede per -2 ::; À :=; 2, poniamo ,\ = 2 cos 0( 0 E [O, 1r]) e riscriviamo quindi l'equazione agli autovalori nella forma:

[4.390]

Xn-1

+ Xn+I

2cos0

-

Xn

=

O

Ci rendiamo subito conto che x~+) = einO e x~-) = e-inO sono due sue soluzioni particolari. La soluzione generale sarà pertanto: (a(±) costanti arbitrarie)

[4.391]

=

Imponendo la condizione iniziale xo

O, otteniamo:

a = -a e di conseguenza:

[4.392]

Xn

= e sin(n0)

• (n

=

1, ... )

Per 0 = O, 0 = 1r la soluzione è evidentemente nulla. Per O < 0 soluzione non appartiene a 12: la serie


(~)O \/_;ç_.E H,

_;ç_

=/= O

Ovviamente, se, al contrario:

(_;ç_,A_;ç_) < O l'operatore si dirà definito negativo. Scriveremo quindi A ~ B se la differenza B - A è semidefinita positiva. È chiaro allora che si ha:

E>.~ Eµ >. < µ Infatti, la differenza Eµ - E>. è uguale a zero oppure a un somma di operatori di proiezione p(J) che sono operatori semidefiniti positivi. Gli operatori E>., o, come si dice, la famiglia a un parametro di operatori E>. è evidentemente una famiglia di operatori di proiezione:

L L

E>.Ev =

pU)p(k)

=

.Àj $;.À .Àk $;v

[4.420]

L

p(j)

= { E>. Ev

>. 1 $;min(>.,v)

Essa costituisce una famiglia spettrale in quanto gode delle seguenti proprietà: ·

[4.421]

1.

E>.Ev

2.

E>. ~ Ev

3. 4.

=

Emin(>.,v)

>.

~ 11

lim Eµ= E>.

µ-+>.+

lim E>. = O; lim E>. = I >.-++oo

.À-+-oo

396

4. SPAZI LINEARI E ÒPERATORI LINEARI

Nel caso, particolarmente semplice, che stiamo considerando, la famiglia E>. può essere convenientemente rappresentata utilizzando la funzione a gradino 0(t), con la prescrizione 0(0+) = 1: 00

E>.= L0(>,. - >.i)PU)

[4.422]

j=l

È allora evidente che la decomposizione spettrale [4.413] può scriversi nella forma: [4,423] con

I> ( 00

dEÀ

=

>. -

Àj )P(j) d>.

j=l

Nel caso in cui A sia un operatore autoaggiunto limitato, ma non compatto, non vale più la semplice formula [4.413]; tuttavia, si può mostrare che esiste ancora una famiglia spettrale, ed è ancora valida la decomposizione [4.423]. Ora, in generale, lo spettro discreto può avere vari punti di accumulazione (e n