136 69 186MB
Italian Pages 441 Year 1997
Indice 1
1 Lo spazio di Hilbert 1.1 Il prodotto scalare . . . . . . . . . . . . . . . 1.2 La forma quadratica associata Polarizzazione . 1.3 La disuguaglianza di Schwarz 1.4 Alcuni esempi . . . . . . . . . . . . . . . . . . 1.5 Spazi lineari topologici . . . . . . . . . . . . . . 1.6 Topologia degli spazi lineari finito-dimensionali . 1.7 Completezza. Spazi di Banach e Spazi di Hilbert. 1.8 Esempi di spazi di Banach . . . . 1.9 Esempi notevoli di spazi di funzioni 1.10 Gli spazi C00 (0), C~(O) . . . . . . 1.11 Lo spazio S(Rd) . . . . . . . . . . . 1.12 Varietà lineari dense in LP(X, A,µ) 1.13 Ortogonalità . . . . 1.14 Un esempio . . . . . . . 1.15 Ortocomplemento . . . . . 1.16 Il teorema della proiezione 1.1 7 Sistemi ortonormali (s.o.n.) 1.18 Sistemi ortonormali completi (s.o.n.c.) 1.19 Alcuni esempi notevoli di s.o.n.c. . . 1.20 La somma diretta di spazi di Hilbert 1.21 Isomorfismo di spazi di Hilbert. 1.22 Il duale di 'H. . . . . . . . . 1.23 Il teorema di Hahn-Banach . . . 1.24 Il biduale. Riflessività . . . . . 1.25 Prodotto tensoriale di spazi di Hilbert 1
3 3
8 10 14 16 19 20 24 26 30 32 34 39 41 43 46 49 53 57 61 63 65 73 74 76
INDICE
11
1.26 Esempi . . . . . . . . . . . . . . 1.27 Tensori di uno spazio di Hilbert 2
78 79
Operatori lineari negli spazi di Hilbert 85 2.1 Operatori lineari continui . . . . . . 85 2.2 Elementi regolari dell'algebra L(E) 89 ~-3 L'aggiunzione . . 94 2.4 Operatori unitari . . . . . 103 2.5 Esempi . . . . . . . . . . . 109 2.6 La trasformata di Fourier. 110 2. 7 Operatori di proiezione . . 127 2.8 Esempi . . . . . . . . . . . 136 2.9 Convergenza forte e convergenza debole . 139 2.10 Operatori di moltiplicazione (limitati) . . . . 143 2.11 Operatori integrali . . . . . . . . . . . . . 148 2.12 Operatori lineari. Operatori lineari continui 159 2.13 Operatori lineari chiudibili. Operatori lineari chiusi 165 2.14 Operatori lineari aggiuntabili . . . . . . . . . . . . 172 2.15 Operatori autoaggiunti, simmetrici, essenzialmente autoaggiuntil 78 2.16 Valori medi di un operatore . . . . . 184 2.17 Operatori di moltiplicazione . . . . . 187 2 2.18 Operatori di derivazione in L (a, b) . 192 2.19 Equivalenza unitaria di Q e P . . . . . 203 2 2.20 Operatori di derivazione in L (Rd) a coefficienti costanti .. 206 2.21 Gli operatori di creazione e di annichilazione . . . . . . . . 208
3 Introduzione alla teoria spettrale in uno spazio di Hilbert 221 3.1 Concetti generali della teoria spettrale . . . . . 222 3.2 Proprietà spettrali degli operatori chiusi . . . . .. 229 . . 232 3.3 Proprietà spettrali degli operatori simmetrici . . . 3.4 Proprietà spettrali degli operatori autoaggiunti .. 237 . . . . . 239 3.5 Proprietà spettrali generali degli operatori di L(1t) . 243 3.6 Proprietà spettrali degli operatori di proiezione 3.7 Proprietà spettrali degli operatori unitari . . . . 245 .. 247 3.8 Operatori compatti; operatori HS . . . . . . . . . . 257 3.9 Proprietà spettrali degli operatori compatti .. 3.10 Operatori a risolvente compatto . 266 3.11 Spettro di notevoli operatori . 269
INDICE
3.12 3.13 3.14 3.15 3.16 3.17 3.18 3.19 3.20 3.21 3.22
111
Teoria spettrale degli operatori compatti e autoaggiunti . Misure a valori di proiezione (m.v.p.) . . . . . . . . Risoluzione spettrale di operatori normali di L (1i) Calcolo operatoriale . . . . . . . . . . . . . . . . Integrale diretto di spazi hilbertiani . . . . . . . Diagonalizzazione di operatori normali di L (1i) Spazi di Hilbert attrezzati (triplette di Gelfand) Sviluppo spettrale nel caso di operatori normali La trasformata di Cayley . . . . . . . . . . . . Teoremi spettrali per A E O (1i) autoaggiunto Gruppi a un parametro di operatori unitari. .
A Cenni alla teoria della misura e della integrazione A.l Misure e spazi con misura A .2 Funzioni misurabili . . . . . . . . . . A.3 Integrazione . . . . . . . . . . . . . . A.4 Operazione di limite nell'integrazione A.5 Costruzione di misure . . . . . . . . . A.6 Misure Prodotto . . . . . . . . . . . A.7 Misure con segno e misure complesse A.8 Misure assolutamente continue e misure singolari . . . . . . . . . . A.9 Misure di Borel, Misure Regolari A.10 Supporto di una misura . . . . . . A .11 Misure correlate, misure invarianti . . B Le disuguaglianze di Holder e di Minkowski
C Completezza degli spazi LP(X,A,µ) C.l Il teorema di completezza di V(X, A,µ), 1 < p < oo C.2 Completezza di L 00 (X, A,µ) . . . . . C.3 Completezza degli spazi [P(C) e l00 (C) . . . . . . D Relazioni di inclusione tra gli spazi V(X, A,µ) D.l Il caso di LP(X, A,µ) con misura finita D.2 Il caso degli lP(C) . . . . . . . . . . . . . . . . .
. 280 . 285 . 291 . 297 . . 302 . 308 . 313 .. 326 . 330 .. 335 . 348
359 . 359 . 360 . 361 . 363 . . 364
. 366 . 368 . . . .
368 370 371 372
375 377 . 377 . . 378 . 379 381 . 381 . 382
lV
INDICE
E Le serie di Fourier per funzioni periodiche E.I Lo spazio L2 (T) . . . . . E.2 L'isomorfismo con L2 (Z) . . . . . . .
383 . 383 . .. 384
F Prodotto Tensoriale di Spazi Lineari F .1 Prodotto tensoriale di spazi lineari . . F .2 Tensori. Elementi di calcolo tensoriale F.3 Prodotto Tensore . . . . . . . . . . . . F .4 Tensori simmetrici e antisimmetrici . . F .5 Prodotto antisimmetrico. Prodotto simmetrico . F.6 Forme Multilineari . . . . . . . . F.7 Componenti di un tensore . . . . F.8 Definizione alternativa dei tensori
389 .. 389 . 396 . 397 . 399 . . 401 . 402 . 404 . 408
G Isomorfismo di Gelfand
415
H Algebre di von Neumann
421
I
Misure basiche
425
J
Operatori nucleari
427
Prefazione
Secondo una consuetudine molto diffusa, nella prefazione di un libro viene esposta in termini più o meno espliciti, da parte dell'autore (o degli autori), spesso con dovizia di espressioni e argomentazioni, la "filosofia" che ha improntato la stesura dell'opera, facendola poi seguire da una rapida e concisa rassegna dei contenuti. Gli autori del presente volume, quanto ai contenuti, invitano il lettore a una scorsa dei titoli dei paragrafi che compongono i tre capitoli. Quanto alla "filosofia", rispettosamente si permettono di usare le seguenti, incisive, espressioni di P. A. M. Dirac, che riportano integralmente. "One should keep the need for a sound mathematical basis dominating one's search for a new theory. Any physical or philosophical ideas that one has must be adjusted to fit the mathematics. Not the way around. Too many physicists are inclined to start from some preconceived physical ideas and then to try to develop them and find a mathematical scheme that incorporates them. Such a line of attack is unlikely to lead to success. One runs into difficulties and finds no resonable way to them. One ought then to realize that one's whole line of approach is wrong and to seek a new starting point with a sound mathematical basis" 1 .
Milano, Ottobre 1996
1 Thatto
da A. R. Marlow, Mathematical Foundations of Quantum Theory, Academic Press, 1978.
1
2
Prefazione
Capitolo 1 Lo spazio di Hilbert 1.1
Il prodotto scalare
Nei corsi di Geometria e di Algebra si sviluppa lo studio dell'algebra lineare (e multilineare) sulla base della struttura fondamentale di Spazio Lineare. Le strutture algebriche sono sicuramente importanti per la fisica, ma certamente non sufficienti: occorrono anche strutture topologiche e differenziali (" Natura non facit saltus"). Occorre quindi affrontare il problema di munire uno spazio lineare di una topologia opportuna. Per avere suggerimenti sulla strada da seguire possiamo fare riferimento all'esempio-laboratorio dello spazio E dei vettori (liberi) ordinari.
Esempio-Laboratorio: lo spazio E
È lo spazio lineare, che indicheremo con E, dei VETTORI (LIBERI) ORDINARI, cioè delle classi di equivalenza dei segmenti orientati della geometria euclidea elem,entare relativamente alla relazione di equivalenza: AB
rv
l(AB) = l(CD) (uguale lunghezza) CD:= dir(AB) = dir(CD) (uguale direzione) { ver(AB) = ver(CD) (uguale verso)
ovvero, geometricamente, AB rv CD :=il punto m,edio del seg·m ento congiungente il 1° estremo dell'uno con il 2° estrem,o dell'altro coincide con il punto med·io del segmento 3
Capitolo 1. Lo spazio di Hilbert
4
congiungente il 2° estremo dell',uno con il 1° estremo dell'altro (R. W. Hamilton, 1844)-
D
A
Le operazioni di somma u +ve di moltiplicazione scalare ku, k E R, che conferiscono a E la struttura di spazio lineare, sono ben note dal calcolo vettoriale ordinario (il vettore "zero" è la classe di equivalenza dei segmenti di lunghezza nulla). Lo spazio lineare E è uno spaz'io lineare reale (cioè su R) e finitod1imensionale; esattam,ente dim E = 3.
Ricordiamo anche che per ogni vettore u E E si chiama modulo di u (spesso indicato con jul) la lunghezza comune di tutti i segmenti appartenenti alla classe di equivalenza u; sempre rifacendosi ai segmenti della classe di equivalenza si dà significato a d'irezione e verso di u. Come è noto, per ogni coppia di vettori di E si definisce il prodotto scalare u · 'V ponendo:
u, v
(1.1) U·'V= lullvlcos0. In termini del prodotto scalare l'ortogonalità fra due vettori, ben nota dalla geometria elementare, può essere "ridefinita" dicendo che 'i vettori u e v d'i E sono ortogonali se il loro prodotto scalare è zero. Parimenti il modulo lul di un vettore u può essere "ridefinito" ponendo:
lul =
ff.a.
Se l'ortogonalità è importante soprattutto in un contesto geometrico, il mod,ulo è importante nel contesto topologico che è quello che più ci interessa. Infatti, usando il modulo si può definire una distanza fra due vettori ù e v ponendo d(u, :rf) := lu - vi
5
1.1. Il prodotto scalare
e poi, con un procedimento canonico ben noto, costruire, dalla distanza, una topologia metrica per E. La topologia cos·ì ottenuta su E è esattamente la ben nota topologia di E chiamata topologia euclidea. Il prodotto scalare ( 1.1) appare così come un elemento centrale della struttura di E ed è perciò naturale chiedersi, in vista di una generalizzazione assiomatica, quali siano le sue caratteristiche fondamentali. È facile constatare che il prodotto scalare ( 1.1) è una Jorma bilineare su E, . : E x E -+ R, := lui lvi cos 0,
-a . v
(ricordiamo che E è uno spazio reale) che gode delle proprietà di essere: (a) simmetrica, cioè 'U . V = 'V . u,
va, V E E,
(b) strettamente positiva, cioè i)
u · 'u > O, \fu E E,
"') u. . . u. . = o => u. . = o.
'l'l
Basta un'analisi neppure troppo approfondita per rendersi conto che queste proprietà sono quelle fondamentali. La bilinearità è importante soprattutto nel contesto algebrico mentre le proprietà di simmetria e stretta positività sono importanti nel contesto geometrico e topologico poiché in primis garantiscono la consistenza delle "ridefinizioni" di ortogonalità e di modulo di cui parlavamo sopra. Sulla base di queste considerazioni sembra proponibile la definizione seguente. Definizione 1.1.1 Dato uno spazio lineare reale E si chiama prodotto scalare su E una forma su E bilineare simmetrica e strettamente positiva. No ti amo che una siffatta definizione è perfet tam ente formulabile senza alcuna ipotesi sulla dimensione; adottiamo, quindi, per il seguito la seguente CONVENZIONE: la dimensione di E
è lasciata impregiudicata, a meno che
non sia oggetto di prec'isazione esplicita.
6
Capitolo 1. Lo spazio di Hilbert
Il problema ora è di vedere quanto la definizione proposta sia significativa. C'è un problema, però, che conviene affrontare prima di inoltrarsi in questa analisi: lo spazio E dei vettori ordinari è uno spazio reale (e infatti nella definizione proposta ci si riferisce esplicitamente a uno spazio lineare reale); proporre la stessa definizione anche per spazi lineari complessi non è possibile, perché su uno spazio lineare complesso non esiste alcuna forma bilineare e strettamente positiva; infatti, se e/> E Bil( E), si ha:
c/>(iu, iu) = i 2 cf>(u, u) = -cf>('u, u), Vu
E
E.
Ricordiamo allora che se E ed F sono spazi lineari su K possiamo definire, usando in generale un automorfismo r del campo K, la r-linearità: una mappa T: E~ F si dice r-lineare se
1) T( u + u') = Tu+ Tu' { 2) T(ku) = r(k)Tu. Ora, il campo R ha un solo automorfismo, l'identità idn, e l'idR-linearità è l'usuale linearità. Nel caso K = R quindi possiamo parlare soltanto di mappe lineari, bilineari, etc ... Il campo C possiede invece infiniti automorfismi. Ma se si richiedono condizioni di regolarità (per esempio la continuità o anche soltanto la misurabilità) si riducono a due soltanto: l'identità e la coniugazione complessa. Nel caso K = C possiamo considerare perciò mappe lineari (r = idK ):
T(u + u') = Tu + Tu' { T(ku) = kTu oppure mappe antilineari (r=coniugazione complessa):
T(u + u') =Tu+ Tu' { T( ku) = k*Tu; mappe bilineari (lineari in ciascuna variabile separatamente), mappe antibilineari (antilineari in ciascuna delle variabili separatamente), mappe sesquilineari (lineari in una delle due variabili, antilineari nell'altra). È evidente che le forme antibilineari presentano la stessa difficoltà, a proposito della stretta positività, delle forme bilineari, cosicché ci restano le forme sesquilineari.
1.1. Il prodotto scalare
7
Seguendo l'uso comune nella letteratura fisica, converremo, per definitezza, che sesquilineare significhi lineare nella seconda variabile e antilineare nella prima. ' ' SESQUILINEARITA E STRETTA POSITIVITA POSSONO COESISTERE.
Basta considerare su Cd la forma d
:cdx cd~
c, ((h1, h2, ... , hd), (k1, k2, ... , kd)
:=
L h;ki; i=l
essa è sesquilineare e strettamente positiva. Osservazione. È piuttosto ovvio, comunque è bene formulare esplicitamente la stretta positività per forme a valori complessi:
strettamente positiva
:=
('U, 'U) E R, V'U E E, ( u, u) > O, Vu E E, { ( u, u) = o => u = o
Nasce però un altro problema: LA SESQUILINEARITÀ NON È CONCILIABILE CON LA PROPRIETÀ DI SIMMETRIA.
Infatti, se è sia sesquilineare sia simmetrica si ha:
k*(u, v) = k(u, v), per ogni k E C e per ogni u, V E E. Anche in questa circostanza, però, possiamo ricorrere alla coniugazione com,plessa e chiedere una forma più "debole" di simmetria che è espressa dalla condizione:
(a')
( u, u') = ( 'U1 , u)*, Vu, u' E E.
La proprietà espressa da (a') è chiamata hermiticità e una forma sesquilineare che soddisfi (a') è detta hermitiana.
Capitolo 1. Lo spazio di Hilbert
8
Si noti che la forma sesquilineare su Cd poco sopra considerata, d
:cdx cd--+ c, ((h1, h2, ... , hd), (k1, k2, ... , kd)) ==
L h;k;, i=l
è hermitiana (oltre che strettamente positiva), e ciò basta per mostrare che sesquilinearità e hermiticità possono coesistere. Dalla discussione precedente emerge la proponibilità della definizione seguente (riprendendo anche il caso reale). Definizione 1.1.2 Sia E uno spazio lineare su K. Se K = R, prodotto scalare su E è una forma bilineare su E, simmetrica e strettamente positiva; se K = C, prodotto scalare su E è una forma sesquilineare su E, hermitiana e strettamente positiva.
1.2
La forma quadratica associata Polarizza• z1one
Ad ogni forma sesquilineare (bilineare) si associa una funzione a valori in C (R) che è chiamata forma quadratica associata. Consideriamo dapprima il caso di uno spazio lineare E complesso. La form~ quadratica associata a una forma sesquilineare su E, che indicheremo con , è definita nel modo seguente:
J: E--+ C,
J('u) := (j)(u, u).
Come si vede J è, in definì ti va, la restizione della alla diagonale di E x E. La forma sesquilineare (/) può essere completamente espressa tramite la quadratica associata J. Si ha infatti il seguente teorema di polarizzazione.
Teorema 1.2.1 ( "di polarizz~ione") Sia E uno spazio lineare complesso,
ur,;a forrna sesqu'ilineare e (/) la sua quadratica associata. Allora 4
(/)(u, u') =
1 LJ(u + Wru'), 4 r=l
dove Wr
= 1, -1, i, -i
Vu, u' E E,
Wr
{le quattro radici dell 'un'ità).
(1.2)
1.2. La forma quadratica associata Polarizzazione Prova: semplice computazione.
9
■
La relazione (1.2) è chiamata formula di polarizzazione. Dal teorema di polarizzazione segue subito un risultato interessante: Teorema 1.2.2 Una forma sesquilineare è hermitiana se e soltanto se la sua forma quadratica J è reale, cioè J(u) E R, v'u E E. Prova. Sia hermitiana;
(u', v.t
= (u, u')
'vu, u' E E,
= (u, u)+,
\fu E E.
quindi, in particolare,
(u, u)
Sia ~(u) E R, \fu E E. Osserviamo preliminarmente che, per ogni sesquilineare, si ha
~(u' + Wru)
= ~('11. + w;u'),
r
= 1, 2, 3, 4.
Allora, usando la formula di polarizzazione e tenendo conto che ~(u) E R, abbiamo subito:
' (u, ut
4
= t"'"'lA, L.- 4w• (u r=l r
4
' + Wru) = t"'"'lA L.- 4w• (u + w;u) r
r=l
4
t"'"' 1 = L.- 4w (v. + WrU) = (u, u ). ■ A
r=l
/
/
r
Da questo risultato è chiaro che se una forma sesquilineare O, 'vu E E.
Nel caso di uno spazio lineare E reale la forma quadratica associata a una forma bilineare è definita in modo analogo al caso complesso e vale un teorema di polarizzazione, e quindi una formula di polarizzazione, ma limitatamente alle forme bilineari simmetriche:
Capitolo 1. Lo spazio di Hilbert
10
"
sia E uno spazio lineare reale, q; una forma bilineare su E simmetrica e q; la sua forma quadratica associata, J : E --+ R, J( u) = ( u, u). Allora 2
q;(u, u') =
1 LJ(u + wru'), 4 r=l
dove
1. 3
Wr
'r:/u, u' E E,
Wr
= l, -1.
La disuguaglianza di Schwarz
È una disuguaglianza di importanza fondamentale. Essa costituisce la generalizzazione a un prodotto scalare inteso nel senso della proposta di definizione del §1.1 della disuguaglianza immediatamente ottenibile per il prodotto scalare dei vettori ordinari del nostro spazio laboratorio-modello E:
li1-u'I < lullu'I,
'r:/u,u' E E
Con la "ridefinizione" del modulo di un vettore di cui parlavamo in §1. 1, questa disuguaglianza può essere scritta:
li1 · u'I
O, \/u,u.' Supposti u. e u' tali che l(u., u')I
~
E E, k E C.
O, prendiamo ( u, u')*
k
= tl(u,u')I'
t E R,
e allora abbiamo
~(u)
+ 2tl(u, u')I + t 2 J(u') > O,
\/t E R,
e questa disuguaglianza è vera anche per u e u' tali che l(u., u')I
= O , cosicché abbiamo
J(u) + 2tl(u, u.')I + t 2 J(u') > O, \/t E R, u, u' E E, cioè, esprimendo la condizione attraverso il discriminante del polinomio di secondo grado in t, l(u., u.')1 2 - ~(u)J(u.') < O, \/u, u.' E E, e quindi il risultato voluto.
■
Il teorema seguente è una prima conseguenza della disuguaglianza di Schwarz e costituisce il passo fondamentale nella prova che da un prodotto scalare su E si genera canonicamente una topologia metrica compatibile (nel significato che vedremo) con la struttura lineare di E.
Teorema 1.3.2 Sia E uno spazio lineare su K e (/> una forma su E sesquilineare hermitiana positiva, se K = C, bilineare simmetrica positiva, se K = R. Se (/> è strettamente positiva la mappa:
Il Il : E ~ R, llull è una norma su E.
:=
{iM,
Capitolo 1. Lo spazio di Hilbert
12 Prova. Occorre mostrare che la mappa Il norma, cioè: 1) llu + u'II < llull
2) 3)
llkull llull
Il
soddisfa le tre condizioni definitorie di una
+ llu'II, Vu,u' E E, Vu E E,k E K, = lklllull, => u = o. =o
1)
~(v.+ u') = ~(v.) + ~(u') + 2 Re cp(u, u') < < ~(u) + ~(v.') + 2lcf>(u, v.')I < ~(u) + ~(u') + 2 / i ( : ) ~
- ([i;)+ ,/iMf quindi
✓ ~(u + v.') < [i;}+ ~ 2) ~(kv.) = lkl 2~(u); quindi
✓~(kv.) = lkl/i(:). 3)
~( u)
= O => u = O;
quindi
[i;) = o => u = o.
■
Un prodotto scalare nel senso della definizione proposta alla fine del §1.1 genera dunque in modo naturale una norma su E. Poiché, data una norma su E, si costruisce in modo canonico, come è ben noto, una distanza su E ponendo d(u, 'u') := llu - u'II, possiamo concludere che un prodotto scalare nel senso proposto genera in modo canonico una topologia metrica su E. Ricordiamo che una distanza d su un insieme X è una mappa d:
xx x~R,
1.3. La disuguaglianza di Schwarz
13
che soddisfa le condizioni
1)
2) 3)
d(x, x') < d(x, x") + d(x", x'), d(x, x') = d(x', x), d(x, x') =O~ x = x'
Possiamo dunque sciogliere ogni "riserva" e adottare senz'altro la definizione di prodotto scalare su E proposta alla fine di §1.1. Un prodotto scalare su E merita un simbolo speciale e noi adotteremo d'ora innanzi un simbolo ormai molto diffuso; indicheremo un prodotto scalare con ( I ) e quindi scriveremo (ulu') per indicare il prodotto scalare di u con u'. Uno spazio lineare E munito di un determinato prodotto scalare ( I ) sarà indicato con (E, ( I )). Non si tratta di uno spazio lineare semplicemente, poiché, come abbiamo visto, è anche, canonicamente, uno spazio metrico. A questo proposito è opportuno, dato uno spazio con prodotto scalare (E, ( I )), formulare esplicitamente le seguenti CONVENZIONI:
come norma su E è da intendere ( a meno di esplicita dichiarazione diversa) la norma naturale
(a) come distanza
S'U
ll'ull
:=
Kuiu);
E è da intendere la distanza canonica
(b)
d(u, u')
:=
llu -
u'II;
come topologia su E è da intendere la topologia metrica canonica generata dalla distanza testé definita.
Si noti che, con i simboli e le convenzioni appena illustrati, la disuguaglianza di Schwarz si serive
l(ulu')I
Es. 2. Piu in generale, in Rd o in Cd c'è un prodotto scalare naturale: d
(hlk)
:=
L hiki i=l
o
d
(hlk)
:=
L h;ki, i=l
rispettivamente (qui indichiamo con h, k, ... gli elementi di R d o di Cd cioè h (h1, h2, ... , hd), k (k1, k2, ... , kd), .. .). La norma determinata da questo prodotto scalare è la norma detta, in ambedue i casi, euclidea:
=
=
Il hll =
✓h; + h~ + ... + h~,
h E R d'
11h11 = ✓ lh1l 2 + lh2l 2 + ... + lhdl 2, h E Cd. Es. 3. Gli spazi Rd e Cd dell'Es. 2) si generalizzano con gli spazi l2 (R) ed l2 (C). L'insieme delle successioni {kn} (n E N) di numeri reali, oppure complessi, sommabili in modulo quadrato, cioè tali che C>
15
1.4. Alcuni esempi diventa uno spazio lineare reale, oppure complesso, definendo
+ {kn}
{hn}
:=
{hn
+ kn},
k{hn} := {khn}, k E R CYppUre k E C. Per mostrare che se {hn} e {kn} sono sommabili in modulo quadrato anche {hn +kn} lo è si usa la disuguaglianza di Minkowski per le serie (cfr. appendice B):
(L lhn + knl )½ < { L lhnl )½ + { L lknl )½ · 2
2
neN
2
neN
{1.3)
neN
Questo spazio lineare si indica con l2 (R) oppure con l2 (C), a seconda che si tratti di successioni reali oppure complesse. In l2 (R) c'è un prodotto scalare naturale:
({hn}l{kn}) :=
L hnkn; neN
analogamente in l2 (C) c'è un prodotto scalare naturale:
( {hn}l{kn})
:=
L h~kn. neN
Per mostrare che il prodotto scalare il l2 (C) e in l 2 (R) è ben definito si usa la disuguaglianza di Holder per le serie (cfr. appendice B):
L neN
anbn
1 coniugati, cioè tali che } + ¼= 1.
A differenza degli spazi Rd, Cd dell'Es. 2, che hanno dimensione finita (ed uguale a d), gli spazi l 2 (R), l 2 ( C) non hanno dimensione finita. Infatti, si vede immediatamente che la famiglia infinito-num,erabile:
(1, o, o, o, ............ ) (O, 1, O, O, ............ ) (O, O, 1, O, ............ ) (O, O, O, O, ... , 1, O, ... )
16
Capitolo 1. Lo spazio di Hilbert
è una famiglia libera cioè costituita da elementi linearmente indipendenti, sia nello spazio l2 (R) che nello spazio l2 (C).
1.5
Spazi lineari topologici
Come abbiamo visto, munire uno spazio lineare E di un prodotto scalare ha un primo importante effetto: dal prodotto scalare si genera una topologia su E. Sappiamo che si tratta di una topologia metrica, ma non è questo il punto fondamentale; il punto fondamentale è che rispetto a tale topologia, non sol tanto il prodotto scalare è una funzione continua (ciò appare invero piuttosto scontato), ma anche la somma u+u' e la moltiplicazione scalare k-u sono funzioni continue. Questo fatto fondamentale è formulato con precisione nel teorema seguente. Teorema 1.5.1 Sia (E, ( I )) uno spazio con prodotto scalare. Munito E della topologia generata dal prodotto scalare, K della topologia euclidea usuale, E x E e K x E delle topolog·ie prodotto, ·il prodotto scalare E x E -+ K, (u, u') 1--+ ( ulu'),
la sornma E xE
-+
E, (u, u')
1--+
u + u',
la moltiplicaz·ione scalare K x E-+ E, (k, u)
1--+
ku,
sono m,appe continue. Prova. Sia (v.0 , u~) un fissato generico punto di Ex E. Abbiamo:
l('U,lu') - (uolu~)I
= l(v. -
= l(u -
v.o
+ uolu' -
+ (u v.~)I + l(u -
uolu' - u~)
< l(v. - uolu' -
u~
+ u~) -
(uolu~)I
+ (uolu' - u~)I uolu~)I + l(uolu' - u~)I uolu~)
e quindi, usando la disuguaglianza di Schwarz,
l(v.!v.') - (uolu~)I < !lv, - v,oll !lv.' - u~II
+ ll·u.~11
llu - uoll
+ lluoll
llu' - u~II
1.5. Spazi lineari topologici
17
dalla quale la continuità del prodotto scalare nel punto (u 0 , u 0) è evidente. Sia, di nuovo, (uo, uo) un fissato generico punto di E X E . Abbiamo
ll(u + u') -
(uo
+ u~)II = ll(u -
uo)
+ (u' - u~)II
e quindi, usando la prima delle proprietà definitorie delle norme (chiamata "disuguaglianza triangolare"), ll(u. + u') - (uo + ·u~)II < llu. - uoll + llu' - u~II dalla quale la continuità della somma nel punto (u 0 , u 0) è evidente. Sia infine (ko, uo) un fissato generico punto di K x E . Abbiamo
llku. - kou,oll = ll(k -
ko)(u -
v.o) + (k -
ko)uo + ko(v. -
uo)II
e quindi, usando la prima e la seconda delle proprietà definitorie delle norme, llku. - kouoll ~
lk - kol llu - u,oll + lk - kol lluoll + lkol llu - u,oll
dalla quale la continuità della moltiplicazione scalare nel punto (k 0 , u 0 ) è evidente.
■
Corollario 1.5.1 La norma su E
Il Il : E~ R, llull := vTuf0 è una mappa continua. Questo risultato può essere ottenuto anche direttamente dalle prime due proprietà definitorie delle norme; da queste si ha infatti
I llull - llu'II I < llu - u'II,
\:fu, u' E E
dalla quale, se u' è un fissato generico punto di E, la continuità della norma nel punto u' è evidente. Uno spazio con prodotto scalare (E, ( I )) risulta dunque, a questo punto, un oggetto munito di due strutture, una struttura lineare e una struttura topologica, e le due strutture sono compatibili, intendendo con ciò il fatto fondamentale che le operazioni della prima-somma e moltiplicazione scalare-sono continue rispetto alla seconda. Ora, un insieme munito di una struttura lineare e di una topologia che siano compatibili (con il significato testé detto) si chiama, per definizione, SPAZIO LINEARE TOPOLOGICO.
18
Capitolo 1. Lo spazio di Hilbert
Gli spazi con prodotto scalare costituiscono il tipo più semplice fra gli spazi lineari topologici e rientrano nella categoria più vasta degli SPAZI NORMATI (vedremo fra poco con più precisione i "rapporti" fra spazi con prodotto scalare e spazi normati). Uno spazio normato (E, Il Il) è, per definizione, uno spazio lineare E munito di una mappa, chiamata norma e indicata con Il Il,
Il Il : E~ R,
u~
llull,
che soddisfa le tre condizioni seguenti:
1) 2) 3)
llu + 'u'II < llull + llu'II, llkull = lkl llull, k E K, !Iuli = o => u = o.
Questa definizione è ben nota, così come è ben noto che anche per uno spazio normato vale un teorema di continuità della norma e delle operazioni lineari analogo a quello sopra dimostrato per gli spazi con prodotto scalare; anzi la dimostrazione della continuità delle operazioni lineari è esattamente la stessa, mentre per dimostrare la continuità della norma basta usare (come già osservato dopo il Corollario 1.5.1) la disuguaglianza
I llull - llu'II I < llu - u'II che segue direttamente dalle prime due condizioni definitorie delle norme. Anche uno spazio normato è dunque uno spazio lineare topologico e fra gli spazi lineari topologici costituisce il tipo più prossimo, in semplicità, agli spazi con prodotto scalare. Osserviamo, anzi, che per le questioni squisitamente topologiche non c'è sostanzialmente differenza fra uno spazio con prodotto scalare e uno spazio normato; per tali questioni, infatti, anche negli spazi con prodotto scalare è la norma che interviene direttamente. Ciò che realmente distingue gli spazi con prodotto scalare nell'ambito degli spazi normati è che il prodotto scalare dà luogo a una geometria più ricca, come vedremo, che non la norma.
1. 6. Topologia degli spazi lineari finito-dimensionali
1.6
19
Topologia degli spazi lineari finito-dimensionali
L'introduzione in uno spazio lineare E di un prodotto scalare oppure di una norma costituisce il modo più semplice per introdurre in E una topologia compatibile con la struttura lineare. Ora, in uno stesso spazio E è in generale possibile introdurre prodotti scalari o norme diverse. E due prodotti scalari diversi, oppure due norme diverse, possono generare una stessa topologia, e allora si dicono equivalenti, ma possono anche generare topologia diverse. Definizione 1.6.1 Dato uno spazio lineare E, due prodotti scalari si dicono equivalenti se generano la stessa topologia. Analogamente, due norrne su E si dicono equivalenti se generano la stessa topologia.
Di più, ci possono essere-e di fatto ci sono-anche altri modi di introdurre in uno spazio lineare topologie compatibili con la struttura lineare che non si rifanno all'introduzione di un prodotto scalare oppure di una norma. In generale, quindi, c'è da aspettarsi la possibilità di introdurre in uno stesso spazio lineare E topologie diverse, tutte compatibili con la struttura lineare di E. A questo proposito la finitezza della dimensione di E costituisce una dirimente molto importante e degna di nota. È noto che se la dimensione di E è finita e uguale a d, E è isomorfo a Kd, l'isomorfismo essendo dato, per ogni fissato riferimento e = {ei} (i = 1, 2, ... , d) di E da: ye : E-+ Kd, Teu := (k1, k2, ... , kd),
dove
ki :=
O esiste N, E N tale che n > N, => c2 ) VE > O esiste
K(,)
E N tale che m, n
>
llkn -
K(,)
k 0 11
11km -
E;
knll < €.
1. 7. Completezza. Spazi di Banach e Spazi di Hilbert
21
Le affermazioni c1 ) e c2 ) sono formulabili, evidentemente, in un qualsiasi spazio norrnato (anzi, usando la distanza, sono formulabili anche in un qualsiasi spazio metrico, ma a noi basta restare nell'ambito degli spazi normati). Una successione {un} (n E N) di uno spazio normato (E, Il Il) per cui è vera la c 1 ) è chiamata successione convergente e l'elemento u 0 è chiamato limite della successione; il fatto che uno spazio normato sia metrico garantisce, come ab biamo visto sopra, la proprietà di separazione di Hausdorff e quindi l'unicità del limite per le successioni convergenti. Le successioni per cui è verificata c2 ) sono chiamate successioni di Cauchy e la affermazione c2 ) è solitamente chiamata condizione di Cauchy. Negli spazi Kd, dunque, le successioni convergenti sono esattamente tutte e sole le successioni di Cauchy. Questo risultato può essere esteso a tutti gli spazi lineari topologici di Hausdorff finito-dimensionali sostanzialmente sulla base del teorema di Tychonov sopra citato. Tutti gli spazi lineari topologici di H ausdor.ff finito-dimensionali sono metrizzabili e COMPLETI. Metrizzabile, per una topologia, significa ovviamente che è generabile da una distanza.
L'aggettivo COMPLETO è l'attributo ufficiale per significare che uno spazio metrico (o metrizzabile) gode della proprietà che le successioni di Cauchy si identificano con le successioni convergenti. Le cose vanno diversamente per gli spazi lineari metrici (o metrizzabili) non finito-dimensionali; nè il fatto che la topologia sia generata da un prodotto scalare o da una norma modifica in alcun modo la situazione a questo proposito. Una circostanza certamente non irrilevante è da segnalare: come è noto ogni spazio metrico non completo può essere completato, e in modo sostanzialmente unico. Rimandiamo a testi specializzati per una formulazione precisa (e relativa dimostrazione) di questa affermazione (cfr. ad esempio [22)).
Orbene, ogni spazio normato può essere completato conservando, anche nello spazio completato, la struttura di spazio normato; altrettanto vale per ogni spazio con prodotto scalare non completo.
Capitolo 1. Lo spazio di Hilbert
22
Nel seguito non ci saranno normalmente necessari particolari tecnici più precisi sull'argomento e quindi chiudiamo il paragrafo con una osservazione (quasi ovvia), un teorema (tecnicamente piuttosto importante) e una definizione. Osservazione. Il difetto di completezza per un dato spazio normato (E, 1111) non è un difetto ... grave dato che esiste un completamento normato sostanzialmente unico (altrettanto dicasi per un dato spazio con prodotto scalare
(E, ( I )). Occorre però conoscere, sempre parlando di un determinato spazio, se esso è completo oppure no per non esporsi a un uso improprio della "condizione di Cauchy": questa è comunque necessaria per la convergenza di una successione, ma, se lo spazio non è completo, non è sufficiente. E proprio a questo proposito abbiamo il teorema seguente che fornisce un utilisssimo criterio di completezza . Teorema 1. 7.1 Uno spazio normato (E, Il Il) è completo se e soltanto se ogni serie assolutamente convergente è convergente.
Una s~rie LneN Un si dice assolutamente convergente se è convergente la serie delle norme LneN llunllProva. Supponiamo (E, Il Il) completo. Sia LneN v.n una serie assolutamente convergente; allora per ogni e> O esiste K(r.) E N tale che n
m,n >
K(r.)
=>
I L lluill -
L lluill I
O, esiste K(f.) E N+ tale che
D'altra parte la successione {vn} è di Cauchy e quindi per ogni e > O esiste Nk E N tale che
Prendendo allora k sufficientemente grande che k
> K(,.) e
Nk
> N(,.), abbiamo
poiché
Quindi la successione di Cauchy {Vn} converge a v 0 . ■
Definizione 1.7.1 Uno spazio normato (E, Il Il) completo è chiam,ato SPAZIO DI BANACH ( o anche, brevemente, E-spazio). Uno spazio con prodotto scalare (E, ( I )) completo è chiam.ato SPAZIO DI HILBERT ( o anche, brevemente, H-spazio).
Si noti che in questa definizione prescindiamo completamente dalla finitezza o meno della dimensione.
Capitolo 1. Lo spazio di Hilbert
24
1.8
Esempi di spazi di Banach
t> Es. 1.
Gli spazi Rd e Cd normati con d
llkllp := (E lkilp)lfp, i=l dove p è un numero reale > 1, sono spazi di Banach. La completezza ci è già nota nel caso p = 2 (in questo caso abbiamo infatti la norma che già conosciamo dall'esempio 2 del §1.4, quella determinata dal prodotto scalare naturale di Rd e Cd), per il resto è garantita dalla finitezza della dimensione. Per mostrare che Il IIP è una norma si fa uso della "disuguaglianza di Minkowski per le somme" (cfr. appendice B): d
d
d
(L~ lhi + kilp)l/p < (I: lhilp)l/p + (I: lkilp)lfp, i=l
1 < p < oo.
(1.5)
i=l
i=l
Anche
llklloo :=
sup l:5i:5d
lkil
è una norma per Rd e Cd. Rd e Cd sono quindi B-spazi anche in questo senso. Ovviamente tutte le norme Il IIP e la norma Il 11 00 su Rd e Cd sono equivalenti. Gli spazi LP(X, A,µ), 1 < p < oo, dove (X, A,µ) è uno spazio con misura a-finita e completa. Queste condizioni sullo spazio con misura (X, A,µ) possono essere omesse ai fini della costruzione di questi spazi di Banach e tuttavia verranno utili in seguito; esse comunque non sono troppo restrittive: Rd munito della a-algebra di Lebesgue e della misura di Lebesgue o i sottoinsiemi misurabili di R d ( di misura non nulla, ovviamente) forniscono esempi significativi di tali spazi con misura.
t>
Es. 2.
Nel caso 1 < p < oo questi spazi sono costituiti da classi di equivalenza di funzioni misurabili f : X -+ K (la relazione di equivalenza essendo l'uguaglianza quasi dappertutto in X, cfr. §A. 2) e tali che
i
IJIPdµ < 00.
1.8. Esempi di spazi di Banach
25
Le operazioni di somma e di moltiplicazione scalare così come la norma sono definite usando un elemento rappresentativo per ogni classe; indicando con [f] la classe di equivalenza cui appartiene f si pongono, cioè, le definizioni seguenti:
[f]
+ [g]
k[f]
:=
11[/] llv :=
:=
[f + g],
[kf], k E K,
(L
lf1Pdµ)' 1v,
Per mostrare che se f e g misurabili sono tali che se Jx lflPdµ < oo e Jx lglPdµ < oo, allora f + g (definita, come è d'uso, puntualmente: (f + g)(x) := f(x) + g(x), \lx E X) è anch'essa tale che Jx lf + glPdµ < oo, si fa uso della disuguaglianza di Minkowski per gli integrali (cfr. appendice B):
( { I!+ glPdµ) 11 P ~ ( {
lx
lx
IJIPdµ) 11 P+ ( { lglPdµ) 11 P, 1 < P < oo
lx
(1.6)
Su L2 (X, A,µ) è definito il prodotto scalare:
. (flg) che genera la norma
11
:=
L
f*gdµ
II2.
Per dimostrare che il prodotto scalare è ben definito si usa la disuguaglianza di Holder (cfr. appendice B): Siano f e g due funzioni misurabili su X e p, q > Oe coniugati, cioè tali che ¼+ ¼= 1; vale allora: lfgldµ < IJIPdµ) 1111 l9lqdµ) 11q. (1.7)
L
(L
(L
Per la dimostrazione della completezza di questi spazi (che si può vedere nella appendice C) è molto utile il criterio di completezza formulato nel teorema 1.7.1. Anche lo spazio L 00 (X, A,µ) è completo. Questo spazio è costituito dalle classi di equivalenza di funzioni f : X --+ K "essenzialmente limitate",
Capitolo 1. Lo spazio di Hilbert
26
cioè funzioni misurabili per cui esiste M > O tale che If (x) I < M quasi dappertutto in X, ed è normato con: ll[/]11 00 := estremo inferiore di tutti gli M > O per cui IJ(x)I < M quasi dappertutto. L'estremo inferiore dell'insieme di tutti gli M > O per cui IJ(x)I < M quasi dappertutto è sovente chiamato "estremo superiore essenz·iale" di J. La dimostrazione della completezza dello spazio L 00 (X, A,µ) è molto più semplice di quella degli spazi V(X,A,µ), 1 < p < oo (cfr. appendice C). Gli spazi LP(X, A,µ), 1 < p < oo sono spazi di Banach molto importanti nell' Analisi Funzionale; L 2 (X, A,µ) è uno spazio di Hilbert e, come vedremo fra poco, è l'unico fra essi a essere tale. Non ci sono, in generale, relazioni di inclusione di uno spazio LP(X, A,µ) in un altro al variare di p, anche se si può averne per particolari spazi con misura (cfr. appendice D). Con un abuso di linguaggio molto diffuso nei testi di analisi funzionale indicheremo d'ora in poi con f sia una classe di equ·ivalenzacioè un elemento in V(X, A, µ)-sia un suo rappresentativo lasciando alla sensibilità del lettore di interpretare di quale dei due oggetti si stia parlando. CONVENZIONE:
Nel caso in cui X = Rd oppure X = n dove n è un sottoinsieme misurabile di Rd e si usino la a-algebra e la misura di Lebesgue relative, useremo i più sintetici e molto diffusi simboli LP(Rd) oppure V(f2), L 00 (Rd) oppure L00 (f2).
CONVENZIONE:
1.9
Esempi notevoli di spazi di funzioni
Nostro interesse di gran lunga preminente è lo studio degli spazi di Hilbert. Prima di addentrarci in tale studio è però opportuno (prendendo anche l'occasione del concetto fondamentale di spazio lineare topologico che abbiamo introdotto poco sopra) accennare brevemente ad alcuni spazi (lineari
27
1.9. Esempi notevoli di spazi di funzioni
topologici) di funzioni che hanno nell'Analisi Funzionale un ruolo troppo importante, anche dal punto di vista istituzionale, per essere qui completamente ignorati. Dedicheremo rapidi cenni a questi spazi i prossimi paragrafi (dal §1. 9 al §1.12) tornando poi, con il §1.13, agli spazi di Hilbert.
Es. 1. Lo spazio di Banach (B (X), Il lloo)Con B (X) intendiamo lo spazio lineare delle funzioni f : X -► C misurabili limitate su uno spazio misurabile (X, A) (cfr. §A. 1) su cui si pone la norma llflloo := SUPxex lf(x)I.
1>
Questo spazio è di Banach. Sia {fn} (n E N) una successione di Cauchy. Allora per ogni x E X vale:
lfn(x) - fm(x)I < llfn - fmlloo < e, n, m > n, . Quindi la successione {fn(x)} (n E N) è di Cauchy per ogni x ed essendo C uno spazio completo queste successioni saranno convergenti. Sia f la funzione su X definita ponendo J(x) = limn fn(x) per ogni x E X. La funzione f è limite uniforme delle fn:
lf(x) - fm(x)I
= lim lfn(x) n
fm(x)I < lim llfn - fmlloo n
(1.8)
e limn llfn - !mli ~ e per m ~ ni.La J è limitata: la successione {fn} essendo di Cauchy è limitata (sia K > O tale che llfnll < K) e si ha allora, per ·m > n(., sup IJ(x)I xEX
< sup IJ(x) - fm(x)I + sup lfm(x)I
Si consideri ad esempio la successione {fn}neN e Cc (R) definita da: f n ( x)
=
{
sinx
lxl < 2n1r
O,:z: '
x
=O
e
X
i= O
lx I > 2n7r
Tale successione converge in CB (R) alla funzione f così definita
J(x) ma f
~
={
E R, X -=f O
si~x,
X
O
x= O
Cc (R). Quindi Cc (R) non è chiuso in CB (R) e pertanto non è completo.
Cc (X) non è neppure una varietà lineare densa in CB(X), in generale. Infatti, per X non compatto, la funzione 1 : X~ C, l(x) = 1 appartiene a CB(X) e si ha III - flloo > 1, \/f E Cc (X). 1>
Es. 4. Lo spazio C00 (X).
29
1.9. Esempi notevoli di spazi di funzioni
Così si indica lo spazio delle funzioni f : X ~ C continue che "vanno a zero all'infinito"; questa locuzione significa che esse godono della proprietà: per ogni E > O esiste un compatto KE tale che lf (x)I < E per x E cK (complemento di K in X). Si tratta di uno spazio di Banach: è infatti una varietà lineare chiusa in CB (X). Sia {fn} (n E N) una successione di C00 (X) convergente al E CB (X). Fissato e > O sia Il! - fnll < e/2 e sia Kf. un compatto tale che lfn (x)I < e/2 per x E cKf.. Per gli stessi x sarà allora: Il (x)I < Il (x) - fn (x)I + lln (x)I < e, quindi f E C00 (X).
Si può anche dimostrare che C00 (X) risulta la chiusura in C8 (X) di Cc (X.) Es. 5. Lo spazio C (X) con X compatto. Dato uno spazio topologico X, con C (X) si intende lo spazio lineare delle funzioni f : X ~ K continue. Nel caso notevole che X sia compatto, manifestamente si ha CB(X) = Cc (X)= C (X) pertanto, se X è compatto, C (X) è uno spazio di Banach (e un'algebra con unità con le operazioni sopra definite). t>
Es. 6. Uno spazio con prodotto scalare non completo: (C(X), ( I)µ)Sia µ una misura di Borel su X compatto (cfr. §A. 9). Sia inoltre il supporto diµ l'intero X (si pensi ad esempio ad un intervallo finito in R con la misura di Lebesgue ristretta ai boreliani). Si definisca su C (X) il seguente prodotto scalare: t>
(
1
)µ : C(X) x C(X) __,
e,
(flg)µ
=
fx f* gdµ.
Si vede immediatamente che tale applicazione è ben definita: infatti f*g è una funzione misurabile e integrabile come è mostrato dalla seguente disuguaglianza.
LIJ*gldµ
O ed f non può essere q.o. nulla.
Lo spazio (C(X), ( I )µ) non è in generale completo. Si consideri ad esempio il caso di X = [-1, I] e µ = m la misura di Lebesgue ristretta ai boreliani. La successione {fn} con fn, n = I, 2, ... , definita come in figura
fn
(O, 1)
(-1, O)
(1, O)
è una successione di Cauchy. Infatti
llfn - fmll 2
1 l' applicazione:
JP : Cc(n)
~
LP(n), JP(f) = [f].
Tale applicazione è ben definita, lineare e iniettiva. Infatti da [J] = O segue f (x) = O q.d .. Ma se per un x 0 E n valesse f (x 0 ) -:f O allora, per la sua continuità, la f sarebbe diversa da zero in tutti i punti di un intorno aperto U:r. 0
36
Capitolo 1. Lo spazio di Hilbert
di x 0 • Tale intorno avrebbe misura strettamente positiva contro l'assunzione che J(x) q.d ..
=O
Si può identificare Cc (n) con la sua immagine, via l'applicazione JP, in LP(n) e noi faremo senz'altro questa identificazione parlando di Cc (n) come di un sottoinsieme di LP(n). Lemma 1.12.1 Per ogni 1 < p < oo la varietà lineare generata dalle funzioni caratteristiche degli insiemi com.patti è densa in LP(n). Prova. Sia A misurabile e m(A) < oo. Per la regolarità della (restrizione ai boreliani della) misura di Lebesgue sarà ·m(A) = sup{'m(K), K e A, K compatto}. Per ogni e > O esisterà quindi un compatto K(. tale che ·m (A - K,) < e da cui IIXA - XK. Il < e1/P. Quindi ogni elemento di :E è approssimato con elementi della varietà lineare generata dalle caratteristiche dei compatti. L'asserto segue quindi dal teorema 1.12.1. ■
Teorema 1.12.3 Per ogrl/i 1 < p < oo, Cc (n) è una var·ietà lineare densa in LP(n). Prova. In base al Lemma precedente basterà mostrare che le funzioni caratteristiche degli insiemi compatti possono essere approssimate da elementi di Cc (n). Sia K compatto. Per la regolarità della misura m(K) = inf {'m(V), V aperto, K e V}. Pertanto per ogni e> Oesiste un aperto½ per cui m(½-K) < e. Per il Lemma di Urysohn esiste f E Cc(n) tale che XK ~ f ~xv.· Allora lii - XKllp < llxv. - XKIIP < e11 P. ■
Osservazione. Il risultato del teorema 1.12.3 si può generalizzare al caso delle funzioni continue a supporto compatto su uno spazio topologico X localmente compatto di Hausdorff secondo numerabile con una misura di Borel; se in più la misura ha supporto uguale ad X l'applicazione JP è ancora inietti va.
3) Densità di c~ (n) in V(n) e di s
(Rd)
in LP(Rd) con 1 < p
E.
Sia ora f E Cc (Rd) e per ogni
Jj * f(x) =
E
> O si consideri
JRd J/(x -
y)f(y)dm(y).
Inoltre per un insieme K compatto in Rd poniamo, per ogrn x E Rd, dist(x, K) := infyeK lx - YIPossiamo enunciare il lemma.
Lemma 1.12.2 Per ogni E> O si ha:
i} Jf * f appartiene a C~ (Rd) e supp
J1 * f
e {x E Rd, dist(x, supp f) < E};
ii} Jf * f converge uniformemente ad f per E -4 O.
Capitolo 1. Lo spazio di Hilbert
38
Prova. i) Poiché f E Cc (Rd) è facile provare usando il teorema della convergenza dominata che Jf * f è derivabile indefinitamente, quindi Jf * f E C~ (Rd). Sia poi K = supp f e K(. = {x E Rd, dist(x, K) < t}. Sex O esiste per lx - YI < f. Per tale f sarà allora
IJf * J(x) -
J(x)I
= IlRd r Jf(x -
< sup lf(x) - J(y)I lx-yl O tale che IJ(x) - J(y)I < 17
y)(J(y) - J(x))dm(y)I
J1(x - y)dm(y) < T/·
■
Ne segue il corollario. Corollario 1.12.2 Sia per E-► O. Prova. Siano
IIJf * f
-
f,
f
E Cc
(Rd);
Jf * f
converge a
f
in V
(Rd)
17, K, K"- come nella dimostrazione del teorema precedente.
fil~=
J,
KuK•
IJf * J(x) -
J(x)IPdm(x) < 7Jm(K U K'-) < 7Jm(K U K
Per l'arbitrarietà di 7J si ha allora l'asserto.
Teorema 1.12.4 Per ogni 1 in LP(f2). Prova. Il caso corollario 1.12.2.
allora
n=
1
)
■
< p < oo, C~ (n) è una varietà lineare densa
Rd si mostra utilizzando il teorema 1.12.3, il lemma 1.12.2 e il
Cc (O); f si può estendere a una funzione di Cc (Rd) ponendo J(x) = O per x (j. n. Per il Corollario 1.12.2 Jf * f converge ad f in LP(Rd) per f -+ O. Ma per f sufficientemente piccolo Jf * f avrà supporto contenuto in n, quindi si può considerare un elemento di C~ (O). Inoltre, per tali f, IIJf * J - JIILP(Rd) = IIJ! * J - JIILP(O)· ■ Sia
f
E
Osservando che C~
(Rd) e S (Rd) si ottiene anche il teorema:
Teorema 1.12.5 Per ogni 1 < p < oo, S in V(Rd).
(Rd) è una
varietà lineare densa
39
1.13. Ortogonalità
1.13
Ortogonalità
Torniamo ora agli spazi normati o con prodotto scalare. Non abbiamo bisogno al momento di insistere ulteriormente sulle proprietà topologiche di questi spazi; le proprietà topologiche che dovessero intervenire in questioni specifiche verranno a mano a mano introdotte quando se ne ravviserà la necessità. Passiamo quindi agli aspetti geometrici. Ragioneremo senz'altro con uno spazio di Hilbert, anche se la completezza non sempre avrà un ruolo in quello che diremo. Seguendo un uso piuttosto diffuso indicheremo il nostro spazio con 1-l. Le proprietà geometriche di 'H. si incentrano nel concetto di ortogonalità. Definizione 1.13.1 Dato uno spazio di Hilbert 1-l due vettori x, x' di 1-l si dicono ORTOGONALI se il loro prodotto scalare è zero:
x, x' ortogonali:= (xix') = O.
Con questa definizione abbiamo subito un esempio di un concetto che, pur formulato in uno spazio di Hilbert, è perfettamente formulabile anche in uno spazio con prodotto scalare non completo.
Notiamo che il vettore OE 1-l, non soltanto è. ortogonale a tutti i vettori di 'H., ma è l'unico vettore ortogonale a tutti i vettori di 1-l; ciò è espressione della non degenerazione del prodotto scalare, proprietà che è garantita dalla stretta positività. Il vettore O è anche l'unico vettore di 1-l ortogonale a se stesso; ciò è espressione della stretta positività del prodotto scalare. La proprietà più famosa a proposito di una coppia x, x' di vettori ortogonali è espressa dal cosiddetto "teorema di Pitagora". Teorema 1.13.1 ("di Pitagora") Sia 1-l uno spazio di Hilbert. Per ogni coppia x, x' di vettori di 1-l ortogonali si ha:
Prova. Immediata.
■
Capitolo 1. Lo spazio di Hilbert
40
Più in generale, per ogni coppia x, x' di vettori di 1-l vale la relazione espressa dal cosiddetto "teorema del parallelogramma" . Teorema 1.13.2 ("del parallelogramma") Sia 1-l uno spazio di Hilbert. Allora vale:
Prova. Immediata.
■
Il teorema del parallelogramma merita un approfondimento. Esso si esprime con una relazione che non coinvolge direttamente il prodotto scalare, bensì soltanto la norma, sicché è spontaneo chiedersi se la sua validità non possa andare oltre gli spazi di Hilbert e investire anche gli spazi di Banach. La risposta è contenuta in un teorema che enunciamo dopo aver formulato (più che altro per comodità di linguaggio) una semplice definizione. Definizione 1.13.2 Sia (E, Il Il) uno spazio normato. La norma è detta hilbertiana se eS'iste un prodotto scalare ( I ) su E tale che
llxll = v'Txix),
Vx E E.
Teorema 1.13.3 Sia (E, Il Il) uno spazio normato. La norma Il Il è hilbertiana se e soltanto se soddisfa la relazione del parallelogramma, cioè
Prova. Se la norma è hilbertiana si ottiene immediatamente, come già detto, la regola del parallelogramma. Per il viceversa ci accontentiamo di una traccia di dimostrazione. Supposto E complesso, definiamo una mappa : E x E ~ C ponendo
(x, x')
:=
¼rnx + x'll 2
Si constata subito che
= (x, x'), (x, ix') = ùf>(x, x') , (x, x) = llxll 2 •
1) (x', x)•
2) 3)
-
llx -
x'll 2 ) + ~ (llx + ix'll 2 -
llx -
ix'll 2 ).
1.14. Un esempio
41
Dalla relazione del parallelogramma si ottiene la relazione
Usando questa si ottiene facilmente:
!lx - x' Il
= h.
Sia ora A un sottoinsieme di rl denso e numerabile e x, x' una coppia di elementi di M. Abbiamo che, per ogni€> O, esiste Ux E A tale che llux - xli < f così come esiste ux' E A tale che llu•x' - x'II < f. Allora
llx - x'II = llx < llx -
Ux
Il + llx' -
11,x'
Ux
+ Ux
1
Il + !lux -
-
x' + Ux Ux 1
Il
Il < 2€ + llu:c -
e quindi, se x -:f x', !lux - Ux 1
Ux 1
I > V2- 2€,
Ux 1
Il
51
1.17. Sistemi ortonormali (s.o.n.)
4
4)
cosicché basta prendere e tale che J2 - 2e > O (per esempio e = dà J2 - 2e = perché sia llv,x - Ux Il > O cioè Ux # Ux Ciò mostra che si può stabilire una corrispondenza biunivoca fra Me un sottoinsieme di A e pertanto Jvl è al più numerabile. 1
1 •
Questa proprietà dei s.o.n. degli spazi di Hilbert separabili è tecnicamente piuttosto vantaggiosa; d'altra parte gli spazi di Hilbert separabili sono quelli che di gran lunga più frequentemente (per non dire esclusivamente) si incontrano nelle applicazioni. Nel seguito per spazio di H ilbert sarà inteso (salvo esplicita dichiarazione diversa) uno spazio di H ilbert separabile.
CONVENZIONE:
1
1
Ciò convenuto un s.o.n. di 'H. sarà tipicamente indicato con {un} (n E N); quando si volesse esplicitamente segnalare che si tratta di un s.o.n. di cardinalità finita N scriveremo {un} (n = 1, ... , N). Seguono ora altre importanti proprietà dei s.o.n .. Teorema 1.17.1 ("disuguaglianza di Bessel") Dato un s.o.n. ( n E N) di 1-l si ha
llxll 2 >
:E l(Unlx)l
2
{Un}
'ix E 1-l.
,
neN Prova. Prendiamo un sottoinsieme finito F di Ne consideriamo LneF(unlx)un; abbiamo llx -
L (unlx)v.nll
2
> O,
neF cioè
llxll
2
+L
l(v.11.lx)l
neF
2
-
2
L
2
l(unlx)l > O
neF
e quindi 2
llxll >
L l(unlx)l
2
-
neF Poiché questo vale per qualsiasi sottoinsieme finito di N ne segue il risultato voluto.
■
Gli scalari ('Unix) che compaiono nella disuguaglianza di Bessel sono chiamati coefficienti di Fourier di x relativi al s.o.n. {un} (n E N) considerato.
52
Capitolo 1. Lo spazio di Hilbert
Teorema 1.17.2 ("di Fischer-Riesz") Dato uno spazio di Hilbert, 1-i, sia {un} (n E N) un s.o.n. di 1-i e {kn} (n E N) una successione di scalari. Allora:
1} la serie LneN kn Un converge se e soltanto se converge la serie
2} in caso di convergenza, posto x
= LneN kn'Un,
L lknl
2
= llxll
si ha
2 -
neN Prova. Se il s.o.n. considerato ha cardinalità finita (ciò che sempre avviene se 7t è finito-dimensionale) l'affermazione 1) è superflua e l'affermazione 2) è subito provata. Supponiamo allora il s.o.n. in considerazione infinito-numerabile. 1) Per il "resto di Cauchy" della successione {Sn} (n E N) delle somme parziali della serie EneN kn 'U.n abbiamo, supponendo n > m, n
2
llsn - smll = Il
L i=m+l
n.
ki'U.ill
2
=
L
lkil 2 ;
i=m+l
la successione {sn} (n E N) è dunque di Cauchy se e soltanto se tale è la successione {crn} (n E N) delle somme parziali della serie LneN lknl 2 • Poiché 7t e K sono completi, ciò equivale al risultato voluto. 2) Segue subito dalla continuità del prodotto scalare. ■
L'ultima proprietà dei s.o.n. che stabiliamo è piuttosto importante tecnicamente ed è ben nota nel caso finito-dimensionale (e ne conserviamo il nome); Teorema 1.17.3 ("ortonormalizzazione di Gram-Schmidt") Dato uno spazio di Hilbert 1-i sia { Xn} una famiglia libera di cardinalità non superiore alla potenza del num,erabile. Esiste in 1-i un s. o. n. { Un.} con la stessa cardinalità tale V' {'Un} = V' { Xn }-
53
1.18. Sistemi ortonormali completi (s.o.n.c.)
Ricordiamo che con V' {Xn} indichiamo la varietà lineare di 1i generata dal sottoinsieme {Xn}. Prova. Tutti gli
(si noti che
Xn
sono diversi da O poiché la famiglia {Xn} è supposta libera. Poniamo X l1 --
X 1,
x; =
X2 -
x; è ortogonale a
11. 1
(u1lx2)u1,
e che
x; # Opoiché x e x sono linearmente indipendenti), 1
2
Se la cardinalità di {Xn} è finita ed uguale a N il procedimento termina allo stadio n = N, altrimenti continua indefinitamente. Il sistema {Un} (n E N) così costruito è il s.o.n. voluto: le proprietà richieste sono infatti evidenti dalla costruzione. ■
1.18
Sistemi ortonormali completi ( s.o.n.c.)
Dato un H-spazio 1i sia {un} (n E N) un s.o.n. di H. Preso un x E 1i costruiamo i suoi coefficienti di Fourier (unix) e consideriamo LneN l(Unlx)l 2 Dalla disuguaglianza di Bessel abbiamo che la serie LneN l(unlx)l 2 converge e quindi dal teorema di Fischer-Riesz abbiamo che anche la serie LneN(unlx)Un converge, individua cioè un elemento di H. Se chiamiamo y questo elemento, se, cioè, poniamo
ancora dal teorema di Fischer-Riesz abbiamo
cioè ossia y - x E ( { Un} ).i
= (V { Un} ).1.
54
Capitolo 1. Lo spazio di Hilbert
Ora, se (V{v,n})J_ = {O} allora x - y = O, cioè x = LneN(unlx)un, 'ix Eri. Ma se (V { un} )J_ -/= {O} non è più vero che x - y = O, 'ix E ?t, perché basta prendere x ~ V { un} per avere x - y f= O. Dunque x = I:neN( Unlx) 'un, 'ix E ?t, se e soltanto se (V { Un} )J_ = {O}, cioè se e soltanto se (V { Un} )J_J_ = 1t, cioè se e soltanto se (si ricordi che per un sottospazio M di 1t si ha M J_J_ = M) V {un} = 1t. I s.o.n. che godono di questa proprietà sono chiamati completi.
È preferibile per varie ragioni introdurre i sistemi ortonormali completi (s.o.n.c.) con una definizione che sottolinea una loro proprietà di massimalità. Definizione 1.18.1 Dato uno spazio di Hilbert 1t, un s.o.n. di 1t si dice completo se non è sottoinsieme proprio di alcun altro s.o.n. di 1t.
Le virtù dei s.o.n.c. sono elencate nel teorema seguente. Teorema 1.18.1 Dato uno spazio di Hilbert 1t, sia {Un} (n E N) un s.o.n. di 1t. Le affermazioni seguenti sono equivalenti: a) {Un} (n E N) è completo ( cioè non è ·sottoinsieme proprio di alcun altro s. o. n. di 1t);
b) (Unix)= O, Vn E N
~
x = O;
c) V{Un} = 1t; d} X= LnEN(UnlX)'Un, 'ix E ?t;
e) (xix') = LnEN(xlun)(unlx'), 'ix, x' E 1i; f) llxll 2 = LneN l(Unlx)l 2 , 'ix E 1i. Prova. a) =} b). Se b) non fosse vera esisterebbe xo E 1-i, x 0 =;fO, tale che (unlxo) = O, Vn E N. Aggiungendo il vettore u0 = 11 ; 011 x 0 al s.o.n. in oggetto si otterrebbe un s.o.n. di 1i che contiene propriamente il s.o.n. {un} (n E N) che non sarebbe quindi completo. b) =} c). La b) significa che ({un}).L = {O} e quindi che (V{Un}).L = {O}; da questa si ha (V { un} ).i.i = H, ossia, poiché V { un}.L.L = V { Un}, V { Un} = H.
55
1.18. Sistemi ortonormali completi (s.o.n.c.)
c) => d) (questa implicazione è già stata provata nelle considerazioni che precedono la definizione di s.o.n.c.). Sia x E rl; la serie LneN(Unlx)un converge (vedi teorema di Fischer-Rlesz e disuguaglianza di Bessel) e sia allora y = LneN(unlx)u·n· Ancora dal teorema di Fischer-Rlesz segue (unlY) = (unix), \:In E N, e quindi y - x E (V { un} ).L, e da qui si ha y = x poiché V{un} = 1i e rl.L= {O}. d) => e). Infatti, (xix')= (LneN(unlx)unl Ln'eN(un lx')un = Ln,n'eN(unlx)*(Un lx')(unlun = Ln,n'(unlx)•(un lx')8nn' = LneN(unlx)*(unlx') = LneN(xlun)(unlx). e) => f). Basta porre x = x'. f) => a). Se a) non è vera esiste u 0 E 1i tale che llu0 II = 1 e (unlu 0 ) = O, \:In E N; per tale u. 0 si ha allora LneN l(u.nlu0 )1 2 = O e llu0 11 2 = l; quindi f) non è vera. ■1 1
1
1
)
1
)
1
Le questioni che spontaneamente ci si pongono sui s.o.n.c. sono quelle della loro esistenza e della loro cardinalità. Le risposte sono fornite dal teorema seguente. Ricordiamo, a scanso di equivoci, che, come convenuto a suo tempo, spazio di Hilbert è da intendere con il significato di spazio di Hilbert separabile. A questo proposito vale la pena di osservare che tutti gli spazi di Hilbert finito-dimensionali sono separabili; infatti un sottoinsieme numerabile e denso è subito fornito dall'insieme delle combinazioni lineari con coefficienti razionali di una base di 1i (nel caso complesso coefficienti razionali è da intendersi come coefficienti con parte reale e parte immaginaria razionali).
Teorema 1.18.2 Sia 1-l uno spazio d-i Hilbert. 1) Esiste -in 1-l un s. o. n. c.; la sua cardinalità è finita se e solt:anto se la dim,ensione di 1-l è finita. 2) Se dim 1-l è finita, ogni s. o. n. c. di 1-l ha cardinalità uguale a dim 1-l; se dim 1-l non è finita, ogni s. o. n. c. di 1-l ha cardinalità uguale alla potenza del numerabile. Prova. 1) Sia A = {xn}(n E N) un sottoinsieme numerabile e denso di rl. Da A possiamo ottenere un sottoinsieme O (di cardinalità, quindi, al più numerabile) formato da elementi ortonormali, esaminando in successione gli elementi xo, x 1 , ... , Xn, ... di A e selezionando a ogni stadio quelli che sono linearmente indipendenti da quelli selezionati negli stadi precedenti e ortonormalizzando (cfr. teorema 1.17.3, "ortonormalizzazione di G ram-Schmid t"). Chiaramente V'O = V' A e quindi anche V A = VO, e perciò VO = 1i dato che evidentemente V A = rl.
56
Capitolo 1. Lo spazio di Hilbert
Dal teorema 1.18.1 abbiamo che il s.o.n. O è completo. Se dim 1t è finita, anche la cardinalità di O è finita poiché gli elementi di un s.o.n.c. (così come per un s.o.n.) sono linearmente indipendenti; se la cardinalità di O è finita, i suoi elementi, come è chiaro dal punto d) del teorema 1.18.1, costituiscono un sistema di generatori di 1t e quindi il s.o.n. O è anche un base di 1t e perciò dim 1t è finita. 2) Sia dim 1t = d. La cardinalità di un qualsiasi s.o.n.c. di 1t non può superare d, vista la proprietà di indipendenza lineare dei suoi elementi; ma ogni s.o.n.c. di cardinalità finita è anche una base di 1t ; quindi la cardinalità del s.o.n.c. è esattamente d. Sia dim 1t non finita. La cardinalità di un qualsiasi s.o.n.c. di 1t non può superare la potenza del numerabile, come sappiamo da 1.17 b); non può essere inferiore alla potenza del numerabile poiché allora sarebbe finita e quindi dim 1t sarebbe finita. ■
Osserviamo che la relazione fra la cardinalità (comune) dei s.o.n.c. di uno spazio 1i e la dimensione di 1i è molto stretta negli spazi finito-dimensionali: sono uguali! Invece nel caso di spazi non finito-dimensionali la relazione appare piuttosto vaga; in realtà si potrebbe dimostrare qualcosa di meno vago:
se la cardinalità (comune) de·i s. o. n. c. di uno spazio di Hilbert 1i è uguale alla potenza del numerab·ile, allora la dimensione di 1i non può essere inferi ore alla potenza del cont'ir1,uo (non ci attardiamo qui sulla dimostrazione; cfr. per esempio [3] appendice A.IV.l). Sembrerebbe allora opportuno introdurre, accanto alla dimensione ordinaria di un H-spazio 1i (che, come è noto, può essere definita come cardinalità comune di tutte le baS'i di H), una dimensione ortogonale di 1i definita, similmente, come cardinalità comune di tutti i s.o.n.c. di ri. Le due dimensioni coincidono nel caso finito, mentre sono diverse nel caso non finito. In realtà i s.o.n.c. sono strumenti, come mostrano le loro virtù elencate nel teorema 1.18.1, molto efficienti anche nel caso non finito, mentre altrettanto non può dirsi delle basi visto che dovrebbero avere (nel caso non finitodimensionale) cardinalità almeno pari alla potenza del continuo. Ciò del resto è atteso, dato che i s.o.n.c. riflettono in modo più completo la struttura dello spazio di Hilbert: essi sono connaturali allo spazio di Hilbert, mentre il concetto di base è un concetto puramente lineare. Queste considerazioni giustificano il disinteresse per la dimensione ordinaria nel contesto degli spazi di Hilbert e quindi il fatto che comunemente si usi semplicemente il termine dimensione per intendere dimensione ortogonale.
1.19. Alcuni esempi notevoli di s.o.n.c.
57
Quindi:
d'ora in poi per dimensione di uno spazio di Hilbert è da intendere la dimensione ortogonale, cioè la cardinalità comune dei s. o. n. c. dello spazio.
CONVENZIONE:
1
Per quanto riguarda s.o.n.c. e basi ci disinteresseremo delle basi nel caso non finito-dimensionale, ma in alcune questioni, proprio ambientate in spazi finito-dimensionali, ci servirà la distinzione fra s.o.n.c. e base e in tali circostanze conserveremo i termini con il significato che hanno avuto finora (molti autori privilegiano, in definitiva giustamente, i s.o.n.c. e danno a questi il nome di basi).
1.19
Alcuni esempi notevoli di s.o.n.c.
Es. 1. Rispetto al prodotto scalare naturale (cfr. §1.4 Es. 2), la base canonica {ei} (i = 1, 2, ... , d) degli spazi Kd (Rd oppure Cd) è un s.o.n. e quindi un s.o.n.c .. t>
Es. 2. Nello spazio l2 (K) munito del prodotto scalare naturale (cfr. §1.4 Es. 3), la famiglia {1,0,0, ...... } {O, 1, O, ...... } t>
è un s.o.n.c.. L'ortogonalità è evidente; la completezza si stabilisce subito usando, per esempio, b) del teorema 1. 18.1. Segnaliamo ora alcuni s.o.n.c.-particolarmente degni di nota-in spazi del tipo L2 (I, M, m) = L2 (I), dove I è un intervallo di R (eventualmente anche I = R), M è la a-algebra di Lebesgue e m la misura di Lebesgue. Questi s.o.n.c. hanno come tratto comune il fatto di essere costituiti da funzioni (ovviamente intese come elementi rappresentativi delle classi di equivalenza cui appartengono) piuttosto note e comode da maneggiare nelle applicazioni. Non ci soffermeremo sulla dimostrazione della completezza che rimandiamo ad altra sede; per esempio si veda [22].
Capitolo 1. Lo spazio di Hilbert
58
Es. 3. Il s.o.n.c. di Fourier. Nello spazio L2 ([0, 21r], M, m) (complesso) il sistema 1 . {uk} (k E Z), uk(t) := J27r exp( ikt), 21r
1>
è un s.o.n.c. chiamato "sistema di Fourier". La sua completezza ci garantisce che, per ogni f E L2 ([0, 21r], M, m),
f =
L (uklf)uk; keZ
la serie Lkez(uklf)uk si chiama "serie di Fourier" per f. Osservazioni.
a) Si noti che l'insieme degli indici del sistema di Fourier è Z, cioè l'indice prende tutti i valori interi relativi, k = O, ±I, ±2, ... b) Seguendo l'uso comune trattiamo (nel linguaggio e nei simboli) gli elementi di L2 (X, A,µ) come funzioni anziché come classi di equivalenza di funzioni quali in realtà sono (si ricordi la convenzione stabilita nel §1.8). L'uguaglianza f = Lkez(uklf)uk è da intendersi uguaglianza fra elementi di L2 ([0, 21r], M, m), non come uguaglianza puntuale; in altre parole la convergenza di quella che abbiamo chiamato serie di Fourier per f è da intendere come convergenza nella topologia di L2 ([0, 21r]) (molti anni orsono si usava dire "convergenza in media").
Anziché considerare l'intervallo I = [O, 21r] si può considerare l'intervallo I= [a, b], a< b. Il sistema di Fourier relativo all'intervallo [a, b] è
{uk} (k E Z), uk(t)
:=
1
t-a
--== exp(21rik b ✓b- a
- a
).
Si veda anche nell'appendice E il s.o.n.c. di Fourier nello spazio di Hilbert L (T) e le sue notevoli proprietà. 2
Es. 4. Il s.o.n.c. di Legendre. Nello spazio L2 ([-1, 1]) il sottoinsieme {vn} (n E N), dove vn(t) = tn, è una famiglia libera. Applicando
1>
1.19. Alcuni esempi notevoli cli s.o.n.c.
59
l'ortonormalizzazione di Gram-Schmidt si costruisce un s.o.n. {un} (n E N), dove un(t) è un polinomio di grado n cui si può dare la forma Un ( t)
=
1 cJn y~ ~ nn! dtn (t 2
2
n
- 1) , n = O, 1, 2, ...
Il s.o.n. {un} (n E N) è completo in L2 ([-1, 1]). I polinomi
sono noti come "polinomi di Legendre" . È utile notare che i polinomi di Legendre (e quindi gli Un) di indice (e quindi di grado) pari sono funzioni pari, mentre quelli di indice dispari sono funzioni dispari. È utile anche notare la formula di ricorrenza P~+l (t) - tP~(t)
= (n + l)Pn(t),
n
= O, 1, 2, ...
dove l'apice sta ad indicare la derivazione rispetto a t. Es. 5. Il s.o.n.c. di Hermite. Nello spazio L2 (R) il sottoinsieme {vn} (n E N), dove vn(t) = tnexp(-½t 2 ), è una famiglia libera. Con l'ortonormalizzazione di Gram-Schmidt si ottiene un s.o.n., che risulta completo, {un} (n E N) dove
1>
1
1
2
Un(t) = --;::::== exp(- t )Hn, n = O, 1, 2, ... 2 ✓2nn!\/7r con Hn ( t) polinomio di grado n cui si può dare la forma
Le funzioni Un e i polinomi Hn sono noti come "funzioni di Hermite" e "polinomi di Hermite". I polinomi di Hermite di indice pari sono funzioni pari e quelli di indice dispari sono funzioni dispari. Formule di ricorrenza notevoli sono
H~(t) = 2nHn(t), n = O, 1, 2, ...
Capitolo 1. Lo spazio di Hilbert
60
Hn+l (t) - 2tHn(t) + 2nHn-l (t)
= O,
n = l, 2, ...
Es. 6. Il s.o.n.c. di Laguerre. Nello spazio L 2 ([0, oo)) applicando l'ortonormalizzazione di Gram-Schmidt alla famiglia libera {vn} (n E N), dove vn( t) = tn exp(-½t) si ottiene un s.o.n., che risulta completo, {Un} (n E N) dove 1 1 Un(t) = - 1 exp(- t)Ln(t), n. 2 con Ln (t) polinomio di grado n cui si può dare la forma
t>
Le funzioni Un e i polinomi Ln sono noti come "funzioni di Laguerre" e "polinomi di Laguerre" . Formule di ricorrenza notevoli sono:
Ln+l - (2n - t + I)Ln(t) + n 2 Ln-i(t) L~(t) - nL~_ 1 (t)
+ nLn-I (t) =
= O,
n
= l, 2, ...
O, n = 1, 2, ...
Es. 7. Il s.o.n.c. di Haar. È un esempio di s.o.n.c. costituito da funzioni non infinitamente differenziabili e non è legato ad equazioni differenziali come i s.o.n.c. precedenti. Viene utilizzato soprattutto nei problemi di approssimazione di funzioni. Qui presentiamo il s.o.n.c. di Haar in L 2 (R). Il sistema è generato dalla funzione
t>
I < a, > - < a, x' > I < a, Vx' E 1-l
sono equivalenti. Per quanto semplice questa equivalenza, da essa si ottiene subito un risultato molto importante: la continuità di a nel punto O equivale alla CONTINUITÀ, anzi alla CONTINUITÀ UNIFORME di a.
La continuità di a nel punto O(e quindi la continuità o, equivalentemente, la continuità uniforme) può essere vista anche in un altro modo: dato un funzionale a : 1-l
---+ K,
le due affermazioni
1.22. Il duale di 1-l
67
1) a è continua nel punto O, 2) 3 m > O tale che
I< a,x >I< mllxll,
'vx E 1-l,
sono equivalenti. Prova. Se è vera 2), a è evidentemente continuo nel punto O. Se è vera 1), esiste I < 1, cioè
I< a,x >I< e questa vale anche se x
= O.
2 81
In definitiva dunque
I < a, x > I < mllxll, con ·m
= b2
1
•
llxll, Vx E 7t
■
L'affermazione 2), cioè (la ripetiamo per comodità) a) 3 ·m
> O tale che I< a,x >I< mllxll, \/x E 1-l,
esprime una proprietà di limitatezza per a; introdotta cioè la definizione: un funzionale lineare a : 1-l ~ K si dice limitato se trasforma sottoins·iemi l-im.itat·i d'i 1-l in sottoinsiemi limitati di K,
è piuttosto semplice mostrare che a limitato equivale all'afjermaz·ione a). Possiamo adottare, per un sottoinsieme A di 7t, la definizione seguente di limitatezza: A limitato := 3 b > O tale che
llxll < b,
'vx E A.
Da un lato è allora evidente che l'affermazione a) implica la limitatezza di o. Dall'altro, se o è limitato, sia S := {x E 7t, = 1}; S è chiaramente un sottoinsieme limitato di 7t e pertanto esiste a > O tale che
llxll
I < a, x > I < a,
'vx E S;
68
Capitolo 1. Lo spazio di Hilbert
ora abbiamo, per un qualsivoglia x E 1t,
I< a,x >I= o,
11;,II x E S e quindi I < o, irxn-x > I
I < allxll,
'ix E
rt.
Da questa rapida analisi abbiamo dunque il fatto importante che per un funzionale lineare su 1-l la continuità, la continuità uniforme e la limitatezza sono proprietà equivalenti e che la continuità (ovverossia la continuità uniforme o la limitatezza) può essere controllata o guardando la continuità nel punto O oppure usando la proprietà a). Usando a) possiamo affermare che per ogni funzionale lineare a continuo l'insieme Mo:= {m E R, I< a,x > I < mllxll, Vx E 1-l} non è vuoto; M 0 è anche chiaramente limitato inferiormente. Pertanto a ogni a continuo possiamo associare l'estremo inferiore di M0 : si tratta di un numero reale maggiore o uguale a zero che è chiamato NORMA di a e indicato con il simbolo di norma, lladl := inf M 0 • o
Effettivamente vedremo tra poco che il nome di norma e il simbolo non sono abusivi. Due circostanze, tecnicamente piuttosto rilevanti, sono da notare a proposito di questa norma llall; ambedue sono conseguenza piuttosto diretta della definizione stessa di Il a 111)
llall
E Mo, cosicché si può scrivere
I < a, x > I < llall llxll,
(1.9)
Vx E 1-l
(questa relazione sarà frequentemente usata nel seguito); 2) vale
llall
=
sup( x;60
I< a,x > I Il Il ) = X
sup
11:cll::;I
(I< a,x >I)=
sup
11:cll=l
(I< a,x > I); (1.10)
(queste relazioni forniscono utili formule per valutare
llall).
69
1.22. Il duale di 1i
Osservazione. Chiaramente l'analisi fin qui eseguita e i suoi risultati sono perfettamente validi anche in uno spazio di Banach. Teorema 1.22.1 Sia E uno spazio di Banach. L'insieme dei funzionali lineari su E continui, munito delle operazioni, definite puntualmente,
:=< a,x >
+ < {3,x >,
< ka, x >: = k* < a, x > è uno spazio lineare che, normato con
llall
:=
inf Ma, a
è completo. Prova. Siano a e /3 funzionali lineari su E continui; abbiamo, per ogni x E E,
I< a+ /3, x >I= I< a, x > + < /3, x > I < I < a, x > I + I < /3, x > I < (llall + 11/311) llxll e ciò mostra: 1) a + /3 è continuo,
2)
Ila+ /311 < llall + 11/311.
Sia a un funzionale su E continuo e k E K; abbiamo, per ogni x E E,
I < ka, x > I = lkl I < a, x > I < lkl llall llxll e ciò mostra: 1) ka è continuo,
2)
llkall < lkl llall;
però abbiamo anche
llkall = !~~(
I < ka, x > I I < a, x > I llxll ) = lkl !~~( llxll ) = lkl llall
e quindi
2')
llkall = lkl llall.
Abbiamo così dimostrato che l'insieme dei funzionali lineari su E continui, munito delle operazioni dette, è uno spazio lineare e abbiamo stabilito per llall := infQ MQ due delle proprietà definitorie delle norme. La terza proprietà definitoria è evidente; infatti
llall = O I < a, x > I = O,
'vx E E< a, x
>= O,
'vx E E.
70
Capitolo 1. Lo spazio di Hilbert
Resta dunque da provare la completezza. Sia allora {O:n} (n E N) una successione di Cauchy di funzionali lineari su E continui. Per ogni fissato x E E è di Cauchy anche la successione numerica { < O'.n, x >} (n E N), poiché
I < O'.n, X>
-
< O'.m, X> I < llo:n - O:mll llxll;
ma K è completo e quindi {< O'.n, x >} (n E N) è convergente. Pertanto è ben definita la mappa o:: E--+ K, x 1-+ a(x) := lim < O'.n, x >, n-+oo
ed è un funzionale lineare su /3, come è immediato constatare. La successione {O'.n} (n E N), essendo di Cauchy, è limitata, quindi esiste k > O tale che
I < O'.n, x > I < kllxll,
rin E N, Vx E E
e perciò
I< a, X> I= I n-+oo lim < O'.n, x > I= lim I< O:n, X> I< kllxll, n-+oo e ciò mostra che il funzionale a è continuo. Ora, per ogni f > Oesiste Ne,) E N tale che
n, m >
N(f.)
=> llan - O'.mll
O, se n > abbiamo
N(f.)
I< O'.n,X > - < a,x >I= m-+oo lim I< O'.n,X > - < O'.m,X >I< tllxll, ossia
11am -all < f e ciò mostra che o: è il limite della successione di Cauchy {O'.n} (n E N).
■
Lo spazio di Banach dei funzionali lineari su E continui che emerge dal teorema testé dimostrato si pone come candidato naturale al ruolo di spazio duale dello spazio di Banach E; effettivamente assumeremo, per definizione, come duale dello spazio di B anach E tale spazio e lo indicheremo con E*. Urgono, a questo punto, due osservazioni. Osservazioni.
1) La completezza dello spazio E non ha in realtà alcun ruolo nel teorema 1.22.1; ciò che importa, infatti, nella prova della completezza del duale E* è la completezza di K. Quindi, quand'anche lo spazio E fosse uno spazio normato non completo, il duale E* sarebbe comunque uno spazio di Banach.
1. 22. Il duale di 1-l
71
2) Si sarà notato che la moltiplicazione di un funzionale lineare a per uno scalare k è definita nel teorema 1.22.1 in modo diverso dal solito:
< ka., x >:= k* < a., x > anziché < ka., x >:= k < a., x >; adottando la definizione solita nulla cambia nelle affermazioni del teorema 1.22.1: l'insieme dei funzionali lineari su E continui risulta ugualmente munito di una struttura di spazio di Banach che nella letteratura è usualmente indicato con E'. Come spazi di Banach E* e E' sono sostanzialmente equivalenti (per la precisione essi sono isometricamente antiisomorfi). La scelta di E* (anziché E') è motivata dal fatto che, per molti aspetti, è più conveniente quando E è uno spazio cli Hilbert. Possiamo ora enunciare un secondo teorema fondamentale della struttura di H-spazio. Teorema 1.22.2 ( "di Riesz") Dato uno spazio di Hilbert 1-i, sia 1-i* il suo duale. La 'm,appa
T: 1-i
~
1-i*, xi---+ Tx, dove < Tx,x' >:=
(xix'),
\lx' E 1-t.,
è un isomorfismo lineare isometrico ( cioè un isomorfismo l'i.neare tale che IITxll = llxll, \lx E 1-i). Prova. Prima di tutto osserviamo che la mappa Tè ben definita, cioè effettivamente Tx è un funzionale lineare su E continuo: la linearità è evidente, mentre la continuità segue dalla disuguaglianza di Schwarz:
I < Tx, x'
>
I= l(xlx')I < llxll llx'II,
"ix' E 1-i.
Questa stessa relazione mostra anche che
IITxll
I < IITxll llxll donde
llxll < IITxll, abbiamo
IITxll
= llxll.
Capitolo 1. Lo spazio di Hilbert
72
Questa relazione vale qualunque sia x E 7-t; dato che la linearità di T è evidente essa mostra che T è isometrica e quindi anche iniettiva. Ciò che resta dunque da dimostrare è la suriettività di T. Sia allora a: E rt•. Si noti che il nucleo Ker o: di o: è allora un sottospazio. Se questo sottospazio coincide con ?t, cioè Ker a: = ?t, a: è il funzionale nullo, < a:, x' >= O, \/x' E ?t, e quindi basta prendere x = O per avere Tx = a; se invece Kera: =f ?t, allora (Kera:)J_ =f {O} e possiamo perciò prendere un u E (Ker a:) J_, u =f O e scrivere I
X
=X
I I < a, X > < a, X > ---v.+---u,
I
-
< a:, ·u. >
< a:, v. >
\J
vX
I
E
'LJ /1,.
Notiamo che x' - ~:1,: ~ u appartiene a Ker a:; infatti
< a:, X
I
-
I < 0:, X > I I - - - - v. >=< a, X > - < a, X >= < a:, 'IJ, >
o.
Allora
(ulx')
= (1J.I < a: , x' > u) = < a:, x' > llull 2, < a:, u >
< a, u >
sicché ,
< a:,x >= dunque prendendo x
= =/. < a, x' > . Premettiamo alla dimostrazione di questa affermazione l'enunciato di una versione ridotta del celebre teorema di Hahn-Banach che è però sufficiente per i nostri scopi attuali (nel Cap. 3 avremo bisogno della versione generale di questo fondamentale teorema dell'Analisi Funzionale). Teorema 1.23.1 (di Hahn-Banach) Dato uno spaz'io normato (E, Il Il), sia M una varietà lineare di E e a un funzionale lineare su M c.ontinuo. Esiste un a E E* tale che:
1} < a,x >=< a,x >, ( cioè
a
\/x E M è un'estensione di a a tutto E),
2J llall = llall. Usando questo teorema di Hahn-Banach (il lettore che fosse interessato alla sua dimostrazione può vedere [25]) possiamo dimostrare il teorema seguente che prova quanto sopra affermato, cioè che il duale E* è separante per E.
Capitolo 1. Lo spazio di Hilbert
74
Teorema 1.23.2 Sia (E, diverso da O. Es'iste a(x) E E* tale che
1}
Il Il)
uno spazio normato e x un elemento di E
lla(x) Il = 1
2} < O(x), X>=
llxll-
Prova. Consideriamo il sottospazio V { x} &enerato da x; per ogni x' E V { x} esiste un kx' E K, e uno soltanto, tale che x' = kx,x. E allora ben definita la mappa
Òx: V{x}
~ K,
Òx(x') :=
kx,llxll,
ed è chiaramente un funzionale lineare su V { x} continuo con llòx Il = 1. Applicando ad Òx il teorema di Hahn-Banach si ha il risultato voluto.
1.24
■
Il biduale. Riflessività
Per terminare la breve discussione sul duale che ci ha occupato negli ultimi paragrafi dobbiamo accennare al biduale. Come è noto, se E è uno spazio lineare finito-dimensionale esiste un isomorfismo naturale di E con il suo biduale E**; questo isomorfismo è
x
x, con
E~ E**,
x
E*~K
a---+
=< a,x+x' >*=< a,x >* + < a,x' >*= - < x,a > + < x',a >=< x+x',a >, \:/a E E*, A
A
sicché
x -
+ x' = x + x'; A
analogamente,
< k"'x,a >=< a,kx >*= k* < a,x >*= k* < x,a >=< kx,a >, \:/a sicché
E E*, \:/k E K,
kx = kx.
La mappa . . è isometrica; infatti da un lato, come notato sopra,
dall'altro, sex# O, dal teorema 1.23.2 sappiamo che esiste un O'.(x) E E• tale che lla(:r.) Il e < O(:r.), x >= llxll e quindi abbiamo
llxll =< O(x), X>= I< O(x), X>* I= I< x, O(x) >I~ llxll, cioè
llxll < llxll. Infine, la mappa . . è iniettiva; infatti è isometrica.
■
=1
Capitolo 1. Lo spazio di Hilbert
76
Come si vede, il teorema, nella sua generalità, non può affermare per la mappa " più della iniettività isornetrica cosicché uno spazio normato non è, in generale, identificabile con il suo biduale ma soltanto con una varietà lineare di quest'ultimo (se E è completo è identificabile con una varietà lineare chiusa, cioè un sottospazio di E**; si tenga conto che E** è sempre uno spazio di Banach, indipendentemente dal fatto che E sia completo o no). Gli spazi normati per cui la mappa " è un isomorfismo lineare isometrico costituiscono una sottocategoria particolarmente significativa: essi sono chiamati RIFLESSIVI. Evidentemente si tratta di spazi normati completi (di nuovo si tenga conto che E** è comunque completo), cioè di spazi di Banach. Questi spazi sono identificabili con il loro biduale. Riflessivi sono ovviamente tutti gli spazi finito-dimensionali, tutti gli spazi di Hilbert (componendo l'isomorfismo di Riesz T di 1-l con 1-l* con *
l'analogo isomorfismo T di 1-l*- inteso come spazio di Hilbert nel modo visto nel §1.22 -con 1-l** si ottiene, come si può verificare facilmente, l'isomorfismo ") e tutti gli spazi LP(X, A,µ) con 1 < p < oo. Riflessivi invece non sono, per esempio, gli spazi L 1 (X, A,µ) ed L00 (X, A,µ) (cfr. (23]) Come mostrano questi due ultimi esempi, la completezza-necessaria per la riflessibilità come già osservato- può non essere sufficiente; va anzi osservato che è possibile che uno spazio di Banach possegga un isomorfismo isometrico con il suo biduale SENZA ESSERE RIFLESSIVO (infatti, per definizione, riflessivi sono gli spazi di Banach per cui la mappa " è un isomorfismo -isom,etrico).
1.25
Prodotto tensoriale di spazi di Hilbert
Come già osservato alla fine del §1.22 l'identificazione di uno spazio di Hilbert 1-l con il suo duale 1-l* ha importanti conseguenze. Qui esaminiamo le conseguenze sulle grandezze tensoriaZ.i di 1-l. Prima, però, conviene cogliere l'occasione per illustrare una costruzione per vari motivi piuttosto importante: il prodotto tensoriale di spazi d-i Hilbert. È più che ragionevole aspettarsi che il prodotto tensoriale di spazi di Hilbert "sia anch'esso uno spazio di Hilbert", possa, cioè, essere munito in modo piuttosto naturale di una struttura hilbertiana. Effettivamente per il
77
1.25. Prodotto tensoriale di spazi di Hilbert
prodotto tensoriale di r spazi di Hilbert dati, 1-1, 1 , 1-l2 , ... , 1-lr, non si intende semplicemente il prodotto tensoriale 1i 1 ®1i 2® ... ®1-lr algebrico (quello, cioè introdotto con la definizione F .1.1), bensì lo spazio di Hilbert che risulta dalla costruzione seguente. • Si costruisce il prodotto tensoriale algebrico
• Usando i prodotti scalari ( I )i, i = 1, 2, ... , r degli spazi 1-li si introduce il prodotto scalare naturale in 1i 1 ® 1i2 ® ... ® 1-lr definendo per gli elementi decomponibili
(x1 ® X2 ® ... ® Xrlx; ® x; ® ... ® x~)
:=
(x1 lx;)i (x2lx;)2 ... (xrlx~)r
e poi estendendo per sesquilinearità (o bilinearità, nel caso di spazi di Hilbert reali) a tutti gli elementi di 1-l 1 ® 1i2 ® ... ® 1-lr· Con alcune modifiche inessenziali al procedimento con cui si costruisce il prodotto tensoriale di forme bilineari nel §F.1, qui ci si garantisce che esiste una forma sesquilineare-o bilineare, nel caso reale-su rl. 1 © rl2 © ... © rlr, e una soltanto, tale che
(x1 © X2 © ... © Xrlx~ © x; © ... © x~)
:=
(x1 lx~ )i (x2 lx;)2 ... (xrlx~)r;
hermiticità-o simmetria, nel caso reale-e stretta positività di questa forma sono poi facilmente constatabili.
• Poiché, in generale, 1-l 1 ®1i2 ® ... ®1-lr munito di tale prodotto scalare, non è completo, si procede al completamento.
Lo spazio di Hilbert così ottenuto si chiama prodotto tensoriale degli spazi di Hilbert 1-l 1 , 1-l2 , ... , 1-lr e si indica ancora con 1-l 1 ® 1i2 ® ... ® 1-l. È allora quasi evidente (e ne lasciamo la dimostrazione al lettore) che se
sono s.o.n.c. di 1-l 1 , 1i2 , ••• , 1-lr, rispettivamente, allora { U!i 1 ® U2i2 ® • • • ® Ur4} (i1 E 11, i2 E 12, • • • ir E
Ir)
è un s.o.n.c. di 1-l 1 ® 1i2 ® ... ® 1-lr (gli insiemi di indici 11,12, ... , Ir hanno cardinalità finita o uguale alla potenza del numerabile; tipicamente Ii = {1, 2, ... , e4} se dim 1-li = di, oppure Ii= N se dim 1-li è non finita).
78
1.26
Capitolo 1. Lo spazio di Hilbert
Esempi
Es. 1. Consideriamo gli spazi di Hilbert L 2 (M), L 2 (N) ed L 2 (Q), dove M ed N sono sottoinsiemi misurabili di R e Q è il "rettangolo" M x N.
t>
Ricordiamo che, secondo la convenzione adottata nel paragrafo 1.8, M, N e Q sono da intendere muniti della struttura di spazio con misura di Lebesgue. Ricordiamo anche che, pur riferendoci comunemente agli elementi di L 2 (M), L 2 (N) ed L 2 ( Q) con simboli e linguaggio propri delle funzioni, gli elementi di siffatti spazi sono in realtà classi di equivalenza di funzioni.
La coppia ( Z, ®), dove Z è la varietà lineare di L2 ( Q) generata dalle funzioni f : Q -► K "separabili", cioè del tipo f(s, t) = h(s)k(t) con h E L2 (M) e k E L2 (N), e ®: L2 (M) x L 2 (N) -► L 2 (Q), (h ® k)(s, t) := h(s)k(t), soddisfa le condizioni b) del teorema F .1.2 e quindi è il prodotto tensoriale algebrico di L2 (M) ed L2 (N). Ora, il fatto importante che si dimostra è che la varietà lineare Z è densa in L 2 (Q) (cfr. ad esempio (35] pag. 409). Da ciò, tenendo anche conto del fatto ovvio che, per ogni coppia f 1, f 2 di funzioni separabili,
si ha
h1:hdµQ
=
(l
h~h2dµM)(L k;k2dµN),
si trae che il prodotto tensoriale degli spazi di Hilbert L 2 (M) ed L 2 (N) è lo spazio di Hilbert L2 ( Q) :
Osservazione. L'esempio testé illustrato mostra che effettivamente il prodotto tensoriale algebrico di due spazi di Hilbert munito del prodotto scalare nel modo detto nel procedimento del paragrafo precedente può non essere completo e che il completamento è, in generale, un punto (finale) essenziale del procedimento se si vuole che il prodotto tensoriale di due spazi di Hilbert sia uno spazio di Hilbert.
1.27. Tensori di uno spazio di Hilbert
79
Osservazione. L'Es. 1 si può generalizzare: se (X,Ax,µx) e (}",Ay,µy) sono spazi con misura o--finita e completa allora L 2 (X,Ax,) ® L 2 (Y,Ay,µy) = L2 (Xx Y,Ax x Ày,µx x py) dove (X x Y, Ax x Ày, µx x µy) è lo spazio con misura prodotto (cfr. appendice A). Per la dimostrazione si ricorra ancora a [35].
Es. 2. Si consideri lo spazio di Hilbert L2 (M; Cd) costituito dalle (classi di equivalenza delle) funzioni
C>
f:M~cd, x-+(Ji(x), ... ,fd(x)) misurabili e tali che JM IIJ(x)ll~ddm(x) = nito del prodotto scalare
(flg)
:=
JM I:1= 1 lfi (x) l2 dm (x) < oo mu-
L
(f (x)lg(x))c•dm(x),
dove abbiamo indicato con ( I )cd il prodotto scalare naturale di Cd e con Il llcd la norma in Cd corrispondente. Si vede facilmente che L2 (M; Cd) è il prodotto tensoriale L2 (M) ® Cd definendo @: L2 (M) X cd~ L2 (M; Cd), (f, a)-+ f@ a dove (f ® a)(x) := f(x)a, Vx E M. In questo caso si ha V' Im ® = L2 (M; Cd). Infatti usando la base canonica {ei} (i= 1, 2, ... , d) di Cd per ogni f si può scrivere f = 1 fi®ei. Quindi in questo caso non si deve procedere al completamento del prodotto tensoriale algebrico in quanto esso è già uno spazio completo.
I:f=
◊
Esercizio 1. Mostrare che il prodotto tensoriale algebrico di due spazi di Hilbert con il prodotto scalare sopra definito è uno spazio completo se e solo se uno dei due spazi è fini te-dimensionale.
1.27
Tensori di uno spazio di Hilbert
Per parlare delle grandezze tensoriali in uno spazio di Hilbert supponiamoin accordo con la convenzione dell'appendice F-che lo spazio abbia dimensione finita; inoltre, per evitare di attardarci su alcune modificazioni che
80
Capitolo 1. Lo spazio di Hilbert
occorrerebbe introdurre nel caso complesso (si ricordi che il duale 1-{,* introdotto nel §1.22 è, per la precisione, isometricamente antiisomorfo al duale di 1-{, introdotto nel modo solito), ci limiteremo a spazi di Hilbert reali. Dunque, nel paragrafo presente, spazio di Hilbert significa spazio di Hilbert reale e finito-dimensionale. Sia dunque H uno spazio di Hilbert reale e finito-dimensionale. Due fatti sono da sottolineare subito. 1) Il duale di H (nel senso della definizione del §1.22) coincide, come spazio lineare, con il duale algebrico. Ciò è dovuto alla finitezza della dimensione poiché tutt·i i funzionali lineari su uno spazio lineare topologico di Hausdorfj finito-dimensionale sono continui. Per provare questa affermazione basta considerare i funzionali lineari su Kd (ricordarsi il teorema di Tychonov del §1.6). Sia allora k = (k 1 , k2 , ••• , kd) un elemento di Kd e o un funzionale lineare su Kd; abbiamo d
d
d
i=l
i=l
i=l
I < o, k > I = I < o, L kiei > I = IL lkil I < o, ei > I !-
Usando la disuguaglianza di Holder per le somme con p d
d
= 2 otteniamo
d
L lkil < (Ì: lkil )½ (Ì: 1)½ = Vd(Ì: lkil )½ = v'dllkll 2
i=l
i=l
2
i
i=l
e quindi
I< o,k >I< v'dM!lkll,
'v'k E K
e ciò mostra che o è continuo.
2) Lo spazio di Hilbert ®PH , potenza tensoriale p-esima (p intero > 2) di H (nel senso della costruzione del §1.24) coincide, come spazio lineare, con la potenza tensoriale p-esima "algebrica" di 1-{, (cfr. §F.2). Anche questo è dovuto alla finitezza della dimensione poiché tutti gli spazi lineari topologici metrici finito-dimensionali sono completi (cfr. §1.7).
1.27. Tensori di uno spazio di Hilbert
81
L'identificazione di 1-i con il suo duale 1-i* fornita dall'isomorfismo (naturale) di Riesz (cfr. §1.22) induce l'identificazione di &)Prf, con &)Prf,* per ogni intero p > 2. Ciò significa (tenuto conto anche dei fatti 1) e 2) sopra segnalati) che grandezze tensoriali di 1-i controvarianti e grandezze tensoriali di 1-i covarianti si identificano;
non c'è, cioè, motivo per distinguere su 1-i un tensore (o una densità tensoriale) di grado p covariante da un tensore (o una densità tensoriale) di pari grado controvariante. È questo il fatto fondamentale, per ciò che concerne le grandezze tensoriali, che si verifica in uno spazio di Hilbert. Si noti, però, che nell'isomorfismo di Riesz T : 1-i ~ 1-i* un riferimento {ei} (i = 1, 2, ... , d) (indichiamo con d la dimensione di 1-i) non si identifica, in generale, con il riferimento duale; infatti:
e quindi
< Tei, ej >= (eileJ) e, in generale, (eilej) i= 8ij poiché il riferimento {ei} (i= 1, 2, ... , d) non è, in generale, un s.o.n .. I numeri < Tei, ej >= (eileJ) (i,j = 1, 2, ... , d) formano una matrice quadrata comunemente indicata con g e chiamata MATRICE METRICA,
E' evidente che la matrice metrica g è non singolare e simmetrica. Come abbiamo già detto, l'isomorfismo T (naturale) di Riesz induce un isomorfismo (naturale) T ® T ® ... ® T (p-volte) di &)Prf, con &)Prf,*. Ovviamente, anche in questo isomorfismo il riferimento indotto {ei 1i2... iri} (i 1 , i 2 , ..• , ip = 1, 2, ... , d) di (g)Prf, non si identifica, in generale, con il riferimento duale indotto {ci1i2...iri} (i1, i2, ... , ip = 1, 2, ... , d) di ®Prl*; si ha
< (T ® T ® • • • ® T)ei1i2---irileJ1h---Jri >= (ei1i2 ... irileJ1h---Jri) = -
(ei1 leJi)( ei2 le12 ) ... (eiri leJri) = gid1 gi2J2 ... giriJri.
82
Capitolo 1. Lo spazio di Hilbert
Identificato 1-t con il duale 1-t*, cade ogni motivo per distinguere fra grandezze tensoriali controvarianti e grandezze tensoriali covarianti; i termini covariante e controvariante non perdono, però completamente significato poiché servono ancora a qualificare descrizioni diverse per un tensore di 1-t rese possibili proprio dalla identificazione di 1-t con 1-t*. Un tensore t di grado p (p > 1) può essere inteso come elemento di ®Prl, come elemento di ®Prl* o come elemento di (®rrl) ® ( ®5 1-t)*, r + s = p. Scelto uno riferimento {ei} (i = 1, 2, ... , d) di 1-t, il tensore t può allora essere descritto dalle componenti ti1i2 ... ip
=
relative al riferimento {ei 1 i 2 ••• ip} (i1,i2,-•·,iv = 1,2, ... ,d) di ®Prl, dalle componenti
=< t , e·i1 i2· ... ip· > ( i 1 , i 2 , •.. , iv = 1, 2, ... , d) di ®Prl* oppure
t·t) i2· ... ip·
relative al riferimento {éi 1i 2 ••• ip} dalle componenti
1 2 t1i1i2 ! ...··•!s =< e·i1i2· ...tr· 7.r
relative al riferimento
{ei1i2 ... ir
®
@e·JlJ2··•Jsl · ·
CjiJ2 .. ,js}
t>
(i1, ... 'ir,J1, ...
,Js =
1, 2, ... 'd) .
Queste componenti sono chiamate, per ragioni che dovrebbero essere chiare, componenti CONTROVARIANTI, componenti COVARIANTI e componenti MISTE DI TIPO (r, s), rispettivamente, di t rispetto al riferimento {ei} (i = 1, 2, . . . , d) di 1-t. Il passaggio dall'una all'altra descrizione di t, cioè dall'uno all'altro insieme di componenti è governato dalla matrice metrica g. Si ha infatti, come mostrano facili calcoli,
ti1i2 ... ip =
d ~ ~
g iiJ1 g i212
...
g ipjp ti1i2 ... ip '
(1.11)
jij2 ... jp=l
(1.12)
tf 112··•/s i1 i2 ... ir
(1.13)
1.27. Tensori di uno spazio di Hilbert
83
Seguendo la tradizione abbiamo indicato con gij gli elementi della matrice inversa della matrice metrica,
Come si vede il passaggio dall'uno all'altro tipo di componenti può essere pittorescamente descritto dicendo che comporta la presenza di tante volte la matrice metrica quanti sono gli indici che vengono abbassati e tante volte la matrice inversa della matrice metrica quanti sono gli indici che vengono innalzati. Se anziché considerare riferimenti generali di 7-l ci si limita a considerare soltanto RIFERIMENTI ORTONORMALI ( cioè sistemi ortonormali completi e ordinati) allora ognuno di questi riferimenti si identifica con il suo duale; infatti, se {'Ui} (i= 1, 2, ... , d) è un riferimento ortonormale, si ha
< Tui, Uj >= (uilui) = 8ij· La matrice metrica diventa allora la matrice unità
e scompare anche la distinzione fra componenti controvarianti, covarianti e miste di ogni tensore relative a siffatti riferimenti ortonormali. Osservazione 1. Volendo restare strettamente fedeli a un atteggiamento categoriale sarebbe coerente considerare, in uno spazio di Hilbert rl, soltanto riferimenti ORTONORMALI. Se abbiamo considerato riferimenti generali una delle ragioni è quella di rendere in modo più chiaro il ruolo della ·m,atrice
metrica. Osservazione 2. Anche per altri spazi lineari che non siano di Hilbert è possibile una identificazione canonica con il proprio duale e di conseguenza dei propri tensori covarianti e controvarianti. Un esempio significativo tra questi è lo spazio di Minkowski (R4 , g) costituito appunto dallo spazio R 4 accompagnato dalla forma bilineare non degenere g che è definita (nel riferimento canonico di R 4 ) dalla matrice
1 O O O
O 1 O O
O O 1 O
O O O -1
84
Capitolo 1. Lo spazio di Hilbert
Mediante g si realizza un isomorfismo di R 4 con il suo duale
Tg: R 4 ~ R 4"', k ~ Tg(k)
:=
g(k, ·)
del tutto simile all'isomorfismo di Riesz. Anche in questo caso, fissato un riferimento {eµ} (i = 1, 2, ... , 4) in R4, si definiscono la matrice 9µv = g( eµlev) e la sua inversa gµv che permettono di passare dalle componenti controvarianti a quelle covarianti di un ten~ore e viceversa con formule del tipo (1.11), (1.12) e (1.13). A differenza degli spazi di Hilbert, però, in questo caso non esistono basi in cui la matrice metrica si riduce alla matrice unità; la forma più semplice che essa può assumere è quella data qui sopra. Quindi nello spazio di Minkowski le componenti covarianti e controvarianti di un tensore sono sempre distinte.
Capitolo 2 Operatori lineari negli spazi di Hilbert 2.1
Operatori lineari continui
In ordine di "naturalità" dopo i funzionali lineari continui su uno spazio di Banach E, che abbiamo visto costituire il duale dello spazio E, vengono gli operatori lineari continui fra spazi di Banach. Dati due spazi normati E e F, indicheremo con L(E, F) l'insieme degli operatori lineari su E a valori in F continui, cioè delle mappe A:E-+F lineari continue con dominio esattamente E e codominio (che indicheremo con Im A) in F. Se lo spazio F coincide con E parleremo, brevemente, di operatori su E continui e useremo il simbolo L( E). La rapida analisi del §1.21 può essere ripetuta in modo perfettamente simile e porta a una conclusione perfettamente simile:
dati due spazi normati E ed F, per un operatore lineare A:E-+F
la continuità, la continuità uniforme e la limitatezza sono proprietà equivalenti e la continuità (ovverossia la continuità uniforme e la limitatezza) può essere controllata o guar85
86
Capitolo 2. Operatori lineari negli spazi di Hilbert dando la continuità nel punto O oppure usando la proprietà (a)
3 m > O tale che
IIAxll < mllxll,
't/x
E E.
Come d'uso, indichiamo con lo stesso simbolo Il Il sia la norma di E che quella di F; ciò non dà luogo, comunemente, a inconvenienti. Soltanto in alcune circostanze particolari potrà essere conveniente usare simboli in qualche modo contraddistinti; per esempio: Il Il E per la norma di E e Il Il F per la norma di F.
Come nel caso dei funzionali lineari continui, usando (a), possiamo introdurre per ogni operatore lineare continuo A E L(E, F) la cosiddetta NORMA
IIAII: (b)
IIAII
:=
inf MA,
dove
MA e osservare che
:=
{m ERI IIAxll < mllxll,
IIAII E MA
't/x
E E},
cosicché si può scrivere
IIAxll < IIAllllxll,
'ix E E
(relazione che sarà usata nel seguito) e che 11
IIAII = sup( :~II) = sup (l!Axll) = sup (IIAxll) x:;60
X
llxll$1
llxll=l
(relazioni che forniscono utili formule per valutare IIAII). Anche il teorema 1.21.1 ha il suo perfetto analogo. Teorema 2.1.1 Siano E e F due spazi normati. a) L'insieme L (E, F) degli operatori lineari su E a valori in F continui, munito delle operazioni, definite puntualmente:
(A + B) (x) := Ax + Bx, (kA) (x) := k (Ax), è uno spazio lineare;
87
2.1. Operatori lineari continui b} la funzione
Il Il : L (E, F)
~ R, A~
IIAII := inf MA
è una norma su L (E, F); c) se lo spazio normato F è di Banach, cioè è completo, lo spazio L (E, F), munito della norma di cui in b), è uno spazio di Banach.
La dimostrazione di questo teorema ricalca quella del teorema 1.21.1 e quindi ad essa rimandiamo. Nel caso F = E l'insieme L( E) degli operatori lineari su E continui strutturato come nel teorema 2.1.1 testè enunciato è uno spazio normato che è di Banach, ovviamente, se E è di Banach. Questo supporremo sia il caso, usualmente, nel seguito. La struttura di L(E) può essere ulteriormente arricchita. Oltre alla somma A+ B, alla moltiplicazione scalare kA e alla norma IIAII, si può introdurre in L(E) anche un prodotto AB definito dalla compos1z1one, (AB)(x) := (A o B)x = A(Bx), non appena si sia controllato che AB così definito è continuo se A e B lo sono. E ciò è vero poiché
ll(AB)xll = IIA(Bx)II < IIAIIIIBxll < IIAIIIIBllllxll donde si ha appunto che AB è continuo e che
(c)
IIABII < IIAIIIIBII-
Lasciato al lettore il facile compito di verificare che il prodotto AB conferisce, insieme con la somma A+B e la moltiplicazione scalare kA, la struttura di algebra associativa (non commutativa non appena dim E > 1), guardiamo alla disuguaglianza (c). Questa disuguaglianza è molto importante: da essa segue che il prodotto testè introdotto in L( E) è una funzione continua (ovviamente il prodotto in L( E) è inteso come funzione da L( E) x L( E) in L( E) e per la sua continuità ci si riferisce alla topologia prodotto per L( E) x L( E)). Infatti, fissato un generico punto (Ao, Bo) di L(E) x L(E), abbiamo
IIAB - AoBoll
-
ll(A - Ao)(B - Bo)+ (A - Ao)Bo + Ao(B - Bo)II
µIIA- 1yll,
\/y E ImA;
dunque
conµ=
r!i.
■
Si noti che per il teorema 2.2.1 non è richiesta la continuità dell'operatore lineare A; di fatto la continuità di A non aggiunge nulla al teorema. Osservazione. Vale la pena notare che, se E e F sono spazi di Banach, un operatore lineare A : E---+ F continuo che soddisfi a) o, equivalentemente, b) del teorema 2.2.1 ha range chiuso.
Veniamo ora al secondo dei due teoremi. Teorema 2.2.2 {dell'inverso limitato} Siano E e F spazi di Banach, ed A : E ---+ F un operatore lineare continuo e invertibile. Se A è suriettivo allora anche l'inverso è continuo.
Questo teorema appartiene a una famiglia di teoremi molto importanti, ma anche molto tecnici, detti "teoremi della mappa aperta", nell'esame dei quali non possiamo qui addentrarci; si veda per esempio [35]. Nella categoria degli spazi di Banach (a proposito: è importante tener presente che in questo contesto la completezza degli spazi è essenziale) il teorema della mappa aperta suona: siano E ed F spazi di Banach; ogni operatore lineare A : E ---+ F continuo e suriettivo è aperto ( cioè trasforma sottoinsiemi aperti di E in sottoinsiemi aperti di
F).
2.2. Elementi regolari dell'algebra L(E)
91
Ammesso questo teorema, il teorema 2.2.2 dell'inverso limitato segue immediatamente. Infatti, dalla continuità e dalla suriettività di A segue che A è aperto, dal fatto che A è aperto e invertibile segue poi subito che A- 1 è continuo. Tornando agli elementi regolari dell'algebra L( E) cominciamo con un teore1na tanto semplice quanto utile e comodo nella pratica. Teorema 2.2.3 Dato uno spazio di Banach E sia GL(E) l'insieme degli elementi regolari dell'algebra di Banach L(E). Per A E L(E) sono equ·ivalenti le affermazioni:
a) A E GL(E); b} esiste un operatore lineare B su E tale che BA= 1 e AB= 1. Se es'iste un siffatto B, esso è unico e si ha A- 1
= B.
= A- 1 ). (poiché da BA = I segue che Ker A = {O})
Prova. Se a) è vera, b} è ovviamente vera (basta prendere B
Se b) è vera, A è invertibile e suriettivo (poiché da AB = I segue Im A = E); dal teorema dell'inverso limitato si ha allora che A E GL(E). Infine, siano Be B' operatori lineari su E tali che BA= I, AB= I e B' A== I, AB'= I; allora si ha A- 1 = A- 1 AB e A- 1 = A- 1 AB' e quindi A- 1 =Be A- 1 = B'. ■
Evidentemente se A è un elemento regolare di L(E) anche A- 1 è regolare. Inoltre, se A e B sono regolari, allora anche AB (così come BA) è regolare e (AB)- 1 = B- 1A- 1 (infatti: ABB- 1A- 1 = 1 e B- 1 A- 1 AB = l); in altre parole G L( E) è stabile rispetto all'operazione prodotto. Si ha allora immediatamente che GL(E), con l'operazione prodotto, è un gruppo, il cosiddetto gruppo generale lineare dello spazio di Banach E (l'elemento unità è l'operatore identità 1). Topologicamente parlando, GL(E) è un sottoinsieme aperto di L(E). Per dimostrare questa importante proprietà di GL(E) usiamo un teorema che è bene mettere in evidenza dato che trova applicazione anche in molte altre occasioni, e ciò è intuibile poiché fornisce una condizione sufficiente per la regolarità di 1-A, A E L(E), insieme con una formula notevole per l'inverso (l-A)- 1 e a una stima molto utile per ll(l-A)- 1 Il.
Capitolo 2. Operatori lineari negli spazi di Hilbert
92
Teorema 2.2.4 Dato uno spazio di Banach E, sia A E L(E). Se allora:
a) la serie
I::=o An
1
è assolutamente convergente e quindi convergente;
b} (1- A) E GL(E) e (l-A)- 1
e) Il (1- A)- 1Il
reale
(dove J è la forma quadratica associata a insieme le due equivalenze:
e/:>)
e si ottiene subito mettendo
A autoaggiunto (xlAx) E R, 'efxE1i. Alle formule che già conosciamo (cfr. §2.1) per valutare la norma di un A E L(1i) se ne aggiunge, per gli operatori autoaggiunti, una particolarmente significativa (a questo proposito è indifferente che 1i sia reale o complesso). Teorema 2.3.2 Sia A E L(1i) autoaggiunto. Allora
IIAII =
sup llxll=l
{l(xlAx)I}.
(2.1)
Prova. Poniamo, per comodità, SA
= sup {l(xlAx)I}. 11:r.ll=l
Poiché
l(xlAx)I
11Prova. b) => a) è evidente. a) => b). Ad ogni x E 1-l facciamo corrispondere il funzionale lineare su rl limitato O'.x, y _. O'.x (y) := (x, y). Definito allora l'operatore A nel seguente modo:
A : 1-l-+ rl, Ax := T- 1 ax,
dove T è l'isomorfismo di Riesz, si verifica immediatamente che si tratta di un operatore ben definito lineare e limitato; infatti per definizione di A vale (2.2) = (Axly), Vx , y E 1-l e, prendendo y = Ax si ottiene IIAxll 2 = (x, Ax) < mllxllllAxll da cui IIAxll < mllxll per ogni x E 1-l. Si ha quindi A E L (rl) e anche IIAII < 11II- La disuguaglianza opposta, 11II < IIAII segue prendendo i moduli nella (2.2) e applicando la disuguaglianza di Schwarz. (x, y)
Abbiamo quindi
IIAII = 11IISia ora B un altro operatore lineare che verifica la (2.2); si ha allora (Axly) = (Bxly) per ogni x, y E 1-l. Dalla non degenerazione del prodotto scalare segua allora che Ax = Bx per ogni x e quindi A= B. ■
Per un A E L (?-l) si ottiene così, fra l'altro, una formula per la valutazione della norma che generalizza la (2.1) data per un operatore autoaggiunto:
IIAII =
sup llxll=llvll=l
l(Axly)l -
103
Operatori unitari
2.4.
Osservazione. Il teorema 2.3.3 fornisce un modo alternativo per introdurre, per ogni A E L('H.), l'aggiunto At (vedi la relazione (g)).
2.4
Operatori unitari
L'algebra L(ri) contiene molte classi di operatori a vario titolo importanti. Qui ci limitiamo a descrivere due classi la cui importanza è dovuta a ragioni di fondamento: la classe degli operatori unitari e quella degli operatori di proiezione (brevemente proiettori); i primi si identificano con gli automorfism,i di 1-i, i secondi rispecchiano il teorema della proiezione che è il teorema fondamentale della geometria dello spazio di Hilbert. In questo paragrafo trattiamo degli operatori unitari rimandando a un prossimo paragrafo gli operatori di proiezione. Definizione 2.4.1 Dato uno spazio di Hilbert 1-i un operatore unitario di 1-i è un operatore lineare su 1-i,
u : 1-f, ---+ 1-i' che soddisfa le condizioni: 1) U è suriettivo, cioè Im U
= 1-i,
2} (UxlUx') = (xix'), Vx, x' E 1-i. Si noti che la condizione 2) è equivalente alla condizione
2')
IIUxll = llxll,
Vx E 1-i
(che 2') segua da 2) è evidente, mentre 2) si ottiene subito da 2') applicando la formula di polarizzazione, cfr. §1.2, alla forma sesquilineare hermitiana-o bilineare simmetrica, nel caso di uno spazio di Hilbert reale-u(x, x') := (UxlUx')).
Un operatore unitario è dunque anche isometrico e quindi iniettivo. Secondo un noto teorema dell'algebra lineare, nel caso di uno spazio di Hilbert 1-i di dimensione finita l'iniettività implica la suriettività (e viceversa); ciò
Capitolo 2. Operatori lineari negli spazi di Hilbert
104
non è più vero se la dimensione di 1-l non è finita, un semplice esempio è il seguente. Fissato un s.o.n.c. {'un} (n E N) in uno spazio di Hilbert 1-l di dimensione infinito-numerabile, definiamo
T : 1-l
-+
1-l,
X ---+
Tx
:=
L (Unix )un+l; nEN
chiaramente T è un operatore lineare (comunemente chiamato "shift operator") che soddisfa la condizione 2), ma non è suriettivo: si ha infatti
Im T = {uo}.1. La condizione 1) di suriettività della definizione di operatore unitario è dunque sovrabbondante nel caso di uno spazio 1-l finito-dimensionale ma
soltanto in questo caso. 1
Dalla condizione 2 ) è evidente la continuità (si ricordi l'equivalenza della proprietà (a), §2.1, alla continuità) di un operatore unitario e quindi l'appartenenza alla C* -algebra L(H); dalla stessa condizione è evidente anche la continuità dell'inverso u- 1 (si ricordi il teorema 2.2.1) e quindi l'appartenenza degli operatori unitari al gruppo generale lineare GL(H). Ancora dalla 2') è evidente che la norma di un operatore unitario è uguale a
1,
11u11 =
1.
Il teorema seguente fornisce delle caratterizzazioni algebriche, quindi molto utili, degli operatori unitari.
Teorema 2.4.1 Sia A E L(H). Sono equivalenti le affermazioni:
a) A è un'itario, b) A è regolare e A- 1 = At, e) A t A
= AAt = I,
d) A t è unitario. Prova. a)=> b) Già sappiamo che un operatore unitario è regolare; inoltre, dalla condizione 2} della definizione di operatore unitario abbiamo ((AtA)xlx') donde
= (xix'),
Vx,x' E 1-t,
2.4.
105
Operatori unitari
da qui abbiamo donde At b) => e). Da A- 1
= At
= A-1.
'
abbiamo subi_to
A- 1 A=AtA e quindi ancora da A- 1
= At
abbiamo
e quindi
l=AA\ e)::::} d). Da AA t
= I abbiamo (xlAA t x')
= (xix'), Vx, x'
E 7t
e quindi
(AtxlAtx')
= (xix'),
Vx,x' E 7t;
da A t A = I abbiamo che A t è suriettivo; d) => a) se A t è unitario, usando le implicazioni precedenti abbiamo che A tt è unitario; · ma Att = A (cfr. 4) del teorema 2.3.1). ■
Applicando il teorema testè dimostrato si stabilisce rapidamente che l'insieme degli operatori unitari di 1i, che è comodo indicare con U(1i), è un sottoinsieme dell'algebra L(1i) stabile rispetto al prodotto (cioè, se A E U(1i) e BE U(1i) anche AB E U(1i)) e rispetto all'inversione (cioè, se A E U(1i) anche A- 1 E U(1i)). Se ne concl ude che
U(1i) è un gruppo ( "gruppo unitario di 1i"). Ciò era d'altra parte scontato poiché manifestamente gli operatori unitari di 1i si identificano con gli automorfismi di 1i. Il teorema seguente ci introduce a una importante proprietà, di carattere geometrico, questa volta, del gruppo unitario U(1i). Per un ambientamento conveniente del teorema va ricordato che un riferimento ortogonale differisce da un sistema orto-normale completo per il
106
Capitolo 2. Operatori lineari negli spazi di Hilbert
fatto che include un ordinamento: un riferimento ortogonale è un s.o.n.c. ORDINATO (l'insieme degli interi naturali N---o dei primi N interi naturali nel caso di un s.o.n.c. di cardinalità finita N-che abbiamo finora usato, tipicamente, come insieme di indici per un s.o.n.c., fornisce in modo naturale un ordinamento per un s.o.n.c.). Indicheremo con 'flOH l'insieme del riferimenti ortogonali dello spazio di Hilbert H. Teorema 2.4.2 Dato uno spazio di Hilbert H, sia {un} (n E N) un riferimento ortogonale di 1-{ e A E L(H). Sono equivalenti le affermazioni: a) A E U(H), b) {u~} (n E N), dove u~ := A Un, è un riferimento ortogonale di 1-{. Prova. a)=!;> b) {u~J (n E N) è evidentemente un s.o.n. in virtù della 2) della definizione di operatore unitario; dalla suriettività di A si ha poi V{u~} = 1t; b)==!;> a) A è suriettivo; infatti, preso un qualsiasi x E 1t, possiamo scrivere
=
x
L (u~lx)u~ nEN
e allora x'
=
L (u~lx)un nEN
è tale che Ax' = x; A soddisfa la 2) della definizione di operatore unitario; infatti possiamo scrivere, per ogni x E 1t, Ax = (u~IAx)u~
L
nEN
e
nEN
Ax
-
L(Unlx)u~; nEN
abbiamo allora (AunlAx)
= (unix),
Vn E N, Vx E 1t,
e quindi (Ax'IAx)
= (x'lx),
Vx, x' E 1t. ■
2.4.
Operatori unitari
107
Sulla base del teorema 2.4.2 possiamo introdurre nell'insieme 'R01-l dei riferimenti ortogonali di 1-l un'azione T del gruppo unitario U(rl) definendo (indichiamo brevemente con u il riferimento ortogonale {un} (n E N)) r : U(1-l) x R01-l
(U, u)
-+
1?,()1-{
~
r(U, u) := Uu
= {Uun}
(n E N) .
Nota.Un'azione r di un gruppo G sull'insieme X è, per definizione, una mappa
r:GxX (g,x)
-+
X
~
r(g,x)
= gx
che soddisfa le condizioni (si noti la notazione abbreviata, ma significativa, gx in luogo di r(g, x); è una notazione largamente usata): 1) ex= x, \/x E X (e è l'elemento unità di G),
2) (g'g)x
= g'(gx).
L'azione r si dice transitiva se per ogni coppia x, x' di elementi di X c'è almeno un g E G tale che x' = gx; si dice libera se g i- e implica gx i- x, Vx E X. Un'azione a un tempo transitiva e libera è caratterizzata dal fatto che per ogni coppia x, x' di elementi di X c'è un g E G, e uno solo, tale che x' = gx. È opportuno segnalare che la definizione di azione che abbiamo introdotto è, più propriamente, quella di azione a sinistra di G su X; nella definizione di azione destra, fermo restando tutto il resto, la 2) è sostituita da 2') (g' g)x = g(g'x). È d'uso comune adottare, per un'azione a destra, una notazione "simmetrica" a quella usata per un'azione a sinistra scrivendo
r:XxG (x, g)
-+
X
"-"'+
r(x, g)
= xg
con
i') xe = x, \/x E X, 2') x(g' g) = (xg')g.
Si constata facilmente che l'azione di U(1-l) su R01-l è transiti·va e l-ibera, cioè per ogni coppia u={un} (n E N), u'={u~} (n E N) di riferimenti ortogonali di 1-l esiste un operatore unitario U, e uno soltanto, tale che u~ = Uun, Vn E N; dati u' e u l'operatore U è U:1-l x
-+
~
1-l Ux := LneN(unlx)u~.
Capitolo 2. Operatori lineari negli spazi di Hilbert
108
Appunto in considerazione del fatto che U(H) agisce in modo transitivo e libero su ROH si dice che il gruppo U(H) è il gruppo strutturale di ROH.
Osservazione. In Meccanica Quantistica si considerano, sostanzialmente in relazione a trasformazioni connesse con l'inversione temporale, anche operatori antiunitari. Un operatore antiunitario su uno spazio 11. complesso può essere definito come una mappa
che soddisfa: 1) V è antilineare (cfr. §1.1), 2) V è suriettivo,
3) (V x IV x') = (x Ix')*,
Vx x' E 11.·
'
'
o, equivalentemente, 1) V è antilineare, 2) V è suriettivo
3')
Il V xli = llxll,
Vx E 11.;
per stabilire l'equivalenza delle due definizioni occorre tener presente che la forma
v(x, x')
:= (V xl V x')
è antisesquilineare (anziché sesquilineare) e la sua polarizzazione è 4
v(x, x')
=
L ~ Jv(x + Wrx'), r=l
dove le Wr, r = 1, ... , 4 sono le radici quarte dell'unità.
2.5. Esempi
2.5 1>
109
Esempi
Es. 1. Consideriamo lo spazio di Hilbert L2 (R3 ).
Ricordiamo che R 3 è inteso munito della struttura di spazio con misuro di Lebesgue e che, pur riferendoci agli elementi di L 2 (R3 ) con simboli e linguaggio propri delle funzioni, gli elementi di L 2 (R3 ) sono in realtà classi di equivalenza di funzioni.
Fissato un a =(a 1, a2, a3 ) E R 3 definiamo -4 -v-+
L2(R3), Tal:= la, dove la(x) :=l(x + a), Vx
= (x1, X2, X3).
L'invarianza traslazionale della misura di Lebesgue su R 3 garantisce che Ta, evidentemente lineare, è ben definito e soddisfa
inoltre Ta è suriettivo, poiché qualunque sia g E L2 (R3 ), basta prendere l = 9-a, dove 9-a(x) := g(x - a), per avere Tal = g. L'operatore Ta, per ogni fissato a E R 3 , è dunque un operatore unitario di L 2 (R3 ); esso è chiamato a-traslazione di L 2 (R3 ). An~logamente, fissata una matrice reale R E 0(3) (0(3) è il gruppo delle matrici 3 x 3 reali ortogonali), si definisce l'operatore unitario di L 2 (R3 ) -4 -v-+
L2(R3), TRl := l R, dove lR(x)
:= l(Rx)
che è chiamata R-rotazione di L2 (R3 ). In particolare, prendendo la matrice I E 0(3), -1
I= [ ~ si ha l'operatore T1,
T1l := li, con l1(x)
:=
l(-x),
chiamato inversione, o anche operatore di parità di L2 (R3 ).
Capitolo 2. Operatori lineari negli spazi di Hilbert
110
Es. 2. Consideriamo lo spazio di Hilbert complesso L2 (R) e in esso il s.o.n.c. di Hermite (cfr. §1.19) {'Un} (n E N) con t>
1
Un ( t ) =
---;:==::::::;e
_!t2
J2nn!-fi
2
Hn(t),
n = O, l, 2, ...
dove Hn(t) = (-l)nexp(t2 ) ~ exp(-t2 ). Definiamo F: L 2 (R)
--+
L 2 (R),
f
~
Ff
:=
LneN(-i)n(unlf)un;
si constata rapidamente che la definizione è ben posta e che ne risulta un operatore unitario di L2 (R). L'operatore F introdotto con questa definizione è molto importante: vedremo a suo tempo che coincide con la trasformata di Fourier su L2 (R) (detta anche trasformazione di Fourier-Plancherel).
Es. 3. definiamo t>
Consideriamo ancora lo spazio di Hilbert complesso L2 (R) e T: L2 (R)
L2 (R) T f, con T f(t)
:=
dove f* è la funzione coniugata complessa della
f:
f
f*:
--+ ~
f*(-t),
R--+ C, t ~ f*(t) := (f(t))*;
si constata rapidamente che T è antiunitario.
2.6
La trasformata di Fourier
La trasformata di Fourier è il più importante esempio di operatore unitario di L 2 (Rd). Qui viene presentato dapprima come operatore su S(Rd), lo spazio delle funzioni a decrescenza rapida (vedere la definizione al §1.11) e poi viene esteso ad un operatore unitario sull'intero spazio di Hilbert L 2 (Rd) utilizzando il teorema di estensione limitata degli operatori lineari limitati (cfr. teorema 2.12.1). L'uso di un teorema che viene esposto nel seguito è un procedimento inconsueto (anche se corretto una volta che ci sia assicurati che il teorema viene dedotto indipendentemente dai risultati che se ne ottengono
2. 6. La trasformata di Fourier
111
qui) e non sarebbe neppure necessario. Si potrebbe definire direttamente la trasformata di Fourier in L2 (Rd) utilizzano la definizione data nel §2.5 Es. 2. Tuttavia non vogliamo rinunciare a presentare le ben note formule integrali della trasformata e della antitrasformata su S(Rd) e le loro proprietà che tanta importanza hanno nelle applicazioni e nella estensione della trasformata di Fourier alle distribuzioni temperate.
La trasformata di Fourier in S(Rd) Definiamo le due applicazioni: " S(Rd) F:
--►
f
"'-"'+
S(Rd) " f dove
f (k) = (
2
1r~a72
JRd exp[-i(klx)]f(x)dm(x) (2.3)
P:
S(Rd)
--►
f
"'-"'+
S(Rd) J dove
f (x) = (2
1r~d/2
JRd exp[i(klx)]f(k)dm(k);
I:1=
(2.4)
qui (klx) è il prodotto scalare naturale di Rd, (klx) = 1 kixi. La prima è chiamata trasformata di Fourier su S(Rd), la seconda antitrasformata di Fourier su S(Rd). Osserviamo che F (e analogamente F) è ben definita: l'integrale che definisce J esiste per ogni k in quanto f E S(Rd) e L 1 (Rd). È inoltre immediato vedere che J E C00 (Rd) usando ripetutamente la derivazione sotto il segno di integrale. Rimane da mostrare che J sta in S(Rd); basterà a questo proposito mostrare che per ogni coppia di multiindici n, r E Nd la funzione Jn,r è limitata {si veda l'Osservazione al §1.11). Ricordiamo qui che per / E S(Rd) la funzione Jn,r è definita da
I:1=
dove lrl = 1 Ti è la lunghezza del multiindice r. È immediato vedere che J è limitata; vale infatti ~ 1 { 1/(k)I < (2,r)d/ 2 }Rd 1/(x)ldm(x)
Usando ripetutamente l'integrazione per parti e la derivazione sotto il segno di integrale si può dimostrare Jn,r è la trasformata di Fourier di una funzione hn,k E S(R-lg(À)
e quindi lg(À) IIÀlk
= (Z,r;, 12 1-bb exp(-i>-x)f(x)dm(x)
< (2;)b112 IIJ(k) lloo exp(I Im Àlb) cioè verifica la (2.10).
Viceversa se g è una funzione olomorfa intera su C che verifica la (2.10) allora la sua restrizione che indicheremo ancora con g all'asse reale sta in L 1 (R). Sia f = F1g; applicando ripetutamente il teorema di derivazione sotto il segno di integrale si verifica che
f
E cxi(R).
Mostriamo ora che è a supporto compatto. Poiché g è intera si applica il metodo dei residui per mostrare che, per ogni t > O si ha
f(x)
-
(
-
~ 112
27r
(Z,r~l/ 2
J.
exp(iÀx)g(À)dm(À)
R
L
= ( ;, 12 27r
J.
exp(iÀx)g(À)dm(À)
R+itsignumx
=
exp[i(µ + itsignumx)x]g(µ + itsignumx)dm(µ),
da cui, applicando la proprietà (2.10) 2lf(x)I
1 /. Co+ C2 [i < (2 n)l/ 2 R exp(-tlxl + at) 1 + µ 2 dm(µ) = y 2 (eo + c2) exp(-t(lxl + a)).
Quindi per lxl > a, mandando t-+
+oo si ottiene f(x) = O.
■
Lo spazio lineare delle funzioni intere su C che verificano la condizione (2.10) prende il nome di classe di Paley- Wiener. La trasformata di Fourier e il s.o.n.c. di Hermite Si consideri il s.o.n.c. di Hermite in L2 (R) { un} (n E N), dove
Poiché le
Un
sono funzioni a decrescenza rapida la loro trasformata è data da
FUn(k) =
=
~ f
2tr JR 1 (-l)n -----;::::=== ~ J2nn!y'7r
exp(-ikx)Un(x)dm(x)
1 (
exp - i.k x
R
2
1 2 )d:1'exp(-x + -x - - - - -)dm (x ) 2 dxn
2. 6. La trasformata di Fourier
119
2 1 2 = ~ (-lt exp(l/2k f exp (x - ik) d" e;(-x ) dm(x) 21r J2nn!y'?r JR 2 xn 2)
=
1 1 2 ~----;::::==exp(l/2k ) 21r J2nn!y'?r
=
in 2 ~---;::=~ exp(l/2k ) 21r J2nn!y'?r I
1 1 R
R
~
1
~ exp l(x - ik) 2 ~ exp(-x )dm(x) xn 2
~ exp l ( x - ik ) 2 2 ~k exp(-x )dm(x)
1
n
1 2 1 2 . exp(--k - x - ikx)dm(x) 2 n R 2 2 1 in . n 2 ~ exp -k - ~ -----;:::::== exp( 1/2k ) dk = (-i) Un ( x),
in 21r J2nn!y'?r
= ~----;::::== exp(l/2k2 )dk J2nn!ft
n
dove abbiamo utilizzato l'integrazione per parti e la 8) della tabella l. In definitiva si ha
FUn = (-i)nun,
Vn E N.
Poiché F è un operatore continuo su L 2 (R) abbiamo allora 00
Ff = :E(-i)n(unlf)un,
Vf E L2 (R).
n=O
È così dimostrato che la trasformata di Fourier in L2 (R) coincide con l'operatore unitario introdotto nell'Es. 2 del §2.5. È poi immediato mostrare una analoga formula per la trasformata di Fourier in L2 (Rd) con d > l. Si consideri infatti il s.o.n.c. costituito dalle funzioni Un 1 ••. n,, (X1, X2, ... , xd) = Un 1 ( X1 )un2 ( x2) ... 'Und ( Xd). Si ha
Altre proprietà della trasformata di Fourier
Utilizzando il teorema di estensione degli operatori limitati si possono immediatamente riformulare per la trasformata di Fourier F su L 2 (Rd) alcune delle proprietà enunciate per F nella tabella 1. Sia Ta l'operatore di traslazione su L2(Rd) (cfr. Es. 1 §2.5):
(Taf) (x) = J(x + a)
Capitolo 2. Operatori lineari negli spazi di Hilbert
120
e Ua l'operatore definito da
(Uaf)(x)
= exp[i(alx)]f(x);
vale allora FTa = UaF. Per mostrarlo si ricorre alla proprietà 2) della tabella 1 e alla definizione di F data nella formula (2.7). Analogamente si può facilmente mostrare che
dove T1 è l'operatore di parità (cfr. Es. 1 §2.5) e di conseguenza
p4 = 1. Più complicato è il rapporto con la convoluzione. Ricordiamo che la convoluzione di due funzioni su Rd è data dalla formula
(f * g)(x)
:=
(27r;d/2
L.
f(x - y)g(y)dm(y).
(2.12)
Abbiamo già detto nel §1.11 che la convoluzione è una operazione interna su S(Rd) e la formula 3) della tabella 1 dice sostanzialmente che la trasformata di Fourier trasforma il prodotto di convoluzione nel prodotto puntuale
F(f*g)=f[J. Si può definire il prodotto di convoluzione anche per funzioni meno regolari di quelle di S(Rd) e ci si può aspettare un analogo legame delle loro trasformate. Con una facile dimostrazione si prova che se f, g E L 1 (Rd) il loro prodotto di convoluzione f * g è in L1 (Rd) e si ha
Il!* gll 1 < IIJll 1 llgll 1, cioè L1 (Rd) è un'algebra di Banach con il prodotto di convoluzione, e
2.6. La trasformata di Fourier
121
In generale per p, q, r > 1 tali che¼+¼-¼ = I ed f E V(Rd), g E Lq(Rd), il prodotto di convoluzione J * g sta in Lr(Rd) e (2.13) (per la dimostrazione si veda ad esempio (35]). Se J, g E L 2 (Rd) la loro convoluzione f * g risulta in generale un elemento di L 00 (Rd). Infatti l'integrale nella (2.12) esiste per ogni x grazie alla disuguaglianza di Holder e vale 1
l(J * g)(x)I < (21r)d/2 IIJll ll9II; quindi si ha (2.14) Potrebbe però risultare che f * g appartenga anche ad L2 (Rd). Il seguente teorema illustra il legame tra convoluzione e trasformata di Fourier su L2 (Rd). Teorema 2.6.6
a) Per ogni
J, g E L2 (Rd) si ha
f * g = F1 ((F- 1J)(F- 1g))
=
È\ ((F J)(Fg)).
b) Se f,g E L 2 (Rd) allora f *9 E L 2 (Rd) se e solo se (FJ)(Fg) E L 2 (Rd) oppure (F- 1J)(F- 1g) E L2 (Rd) e in tal caso si ha
f * g = p- 1((FJ)(Fg)) = F((F- 1 J)(F- 1g)).
F(J * g) = (F1f)(Fg). Prova. a) Dalla disuguaglianza di Holder segue che il prodotto (puntuale) di due elementi f,9 di L 2 (Rd) sta in L 1 (Rd) e 1119111 < 11/1111911• Quindi tale prodotto è continuo. Sia ora {fn} (n E N) una successione di S(Rd) convergente a f e {gn} (n E N) una successione di S(Rd) convergente a g. Applicando la continuità di p- 1 , del prodotto puntuale, di F 1 e del prodotto di convoluzione (cfr. 2.14) si ha allora
F1 (F- 1f p- 1g)
= lim F1 (F- 1f np-l 9n) = lim F(F'f nF'9n) = lim F F'(fn * 9n) = f * g. n n n
Analoga dimostrazione per l'altra uguaglianza.
122
Capitolo 2. Operatori lineari negli spazi di Hilbert
b) Sia F f Fg E L 2 (Rd); si applichi l'ultima uguaglianza del punto a) in cui .F1 si può sostituire con p- 1 quindi f * g E L 2 (Rd). Sia viceversa f * g E L 2 (Rd). Da f * g = F1(FJFg) si ottiene p- 1F(J * g) = F1(Ff Fg). Mostriamo che F(f * g) = Ff Fg. Sia infatti h E S(R); si ha allora
(F(f * g)lh)
= (F1(Ff Fg)IF- 1h)
'vh E S(R)
da cui, esplicitando gli integrali e utilizzando il fatto che
ovvero
f.
(F(f * g) - Ff Fgthdm
Rd
=O
FPh = h,
\/h E ½(Rd).
Applicando ora il Lemma di Dubois-Reymond (cfr. Lemma 2.6.1) si ottiene
F(f * g)(k)
= F f(k)Fg(k)
q.d.,
quindi Ff Fg E L 2 (Rd). Analoga dimostrazione per l'altra uguaglianza. e) Dalla formula (2.13) abbiamo che f * g sta in L 2 (Rd) e inoltre che per ogni fissato f la convoluzione per f è un operatore lineare continuo su L 2 (Rd). Pertanto varrà
F(f *9)
= limF(f *9n) = limF1JF19n = limF1fFgn, n n n
dove i limiti sono sempre presi in L 2 (Rd). Tenendo conto che F1 f è una funzione limitata si ha
Le relazioni della trasformata di Fourier e gli operatori di derivazione e di moltiplicazione sono importantissime e verranno enunciate più avanti (cfr. §2.19). subsubsectionUna applicazione della trasformata: ricostruzione di segnali Nella maggior parte dei testi che trattano applicazioni della trasformata di Fourier alla teoria dei segnali si fa spesso un uso formale della trasformata di Fourier, senza definire la classe di funzioni su cui si sta operando. Qui ci limitiamo a dare, ovviamente nel linguaggio dell'analisi funzionale usato in questo testo, il seguente teorema di ricostruzione dei segnali. Utilizzando il teorema 2.6.1 si ha per una f E S(R) la formula 1 J(t) = ( 1r)l/ 2 2
1 R
"
exp(iwt)f(w)dm(w);
2.6. La trasformata di Fourier
123
il membro a destra, nella teoria dei segnali, viene interpretato come la sovrapposizione di onde piane di pulsazione w e di ampiezza (21r~ 112 ](w), la variabile t viene pensata come il tempo e la funzione f(t) è quindi il segnale prodotto al tempo t da tale sovrapposizione. La rilevazione del segnale a certi intervalli di tempo permette di ricostruire il segnale purché l'intervallo di tempo sia sufficientemente piccolo. Questa affermazione è in realtà corretta per i segnali a frequenza limitata (o a banda limitata) cioè rappresentati da elementi f E L 2 ( R) tali che la loro trasfarmata di Fourier F f si annulli al di fuori di un intervallo. Vale infatti il seguente teorema
Teorema 2.6.7 Sia f E L2 (R) e s-ia Ff(w) = O quasi dappertutto al di fuori dell'intervallo [-n, n]. Allora f è una funzione infinitamente derivabile che va a zero all'infinito ( C'ioè di C 00 (R)) ed è il limite uniforme della. serie n1r . ~ f( f2) s1nc(n(t ~
-
n1r
f2 ))
nEZ
dove sinc( t)
= si~ t.
Prova. Poniamo g := Ff; poiché g E L1 {R) l'antitrasformata e quindi
f(t)
l
{
.
= {21r)l/ 2 }R exp(iwt)g(w)d·m(w)
; 1r
n L2 (R)
112
f
1(-n,nJ
vale la formula integrale per
exp(iwt)g(w)dm(w);
{2.15)
usando il teorema 2.6.4 nella sua versione per l'antitrasformata abbiamo subito che f EC 00 (R); derivando sotto il segno di integrale si mostra subito chef è infinitamente differenziabile. Poiché g si identifica con un elemento di L 2 (-n, nJ si può sviluppare g in serie di Fourier con il s.o.n.c. {v.n} (n E Z), v.n(w) = ¼nexpin~w, w E (-n,n) e, tenendo conto che L2 (-n, n] e L 2 (R), si ha g
=
L
CrL V,nX[-n,nJ
(2.16)
nEZ
v'fil
dove CrL = fi-n,nJ exp(-in~w)g(w)dm(w) e la serie converge in L 2 {R). Inoltre per la continuità della antitrasformata di Fourier si ha
f
= L CrLF- 1 ( 'll.nX[-n,nJ) nEZ
dove
Capitolo 2. Operatori lineari negli spazi di Hilbert
124
F
_1 (UnX[-n,n1)(t)
1
1
/
.
1r
{ir .
n1r
= (21r)l/2 /fil 1(-n,n} exp(iw(t + nn))dm(w) =y n smc(n(t + n )).
Utilizzano la formula (2.15) si ottiene una relazione tra i valori di f e i coefficienti di Fourier di g:
quindi sostituendo e cambiando -n in n si ha
f
= L f(n~) sinc nn nEZ
.\t.
dove sinenn(t) = sinc(O(t + ìf ). In realtà la serie non converge solo in L 2 (R) ma uniformemente in C00 (R). Infatti la serie (2.16) converge anche in L1 (R) e quindi per la continuità di F1 (cfr. teorema 2.6.4) la serie f = '2:nEZ f(nfi) sinenn converge nella norma 11 lloo Coo(R). ■
Questo teorema dice che si può ricostruire f a partire dalla conoscenza dei valori {f(n~)} (n E Z). Nella pratica la ricostruzione sarà approssimata, cioè non si sommerà la serie ma ci si limiterà ad una somma parziale di essa. La campionatura, come suggerisce il teorema, va fatta ad intervalli di tempo con b..t = ~ per un qualsiasi n che sia nelle ipotesi del teorema. Se n0 è la pulsazione massima del segnale, si usa una n che sia maggiore di dieci volte n0 . La grandezza 2 0 è chiamata frequenza di Nyquist (al quale è dovuto il teorema precedente), essa è un parametro discriminante per una buona ricostruzione di f.
b
Osservazione. La campionatura dei valori di f serve anche ad approssimare la sua trasformata g. Infatti g = limN L,:=-N Jftf(-nfi)un dove la serie converge in L 2 (-f2,f2]. Se g è regolare, per esempio g EC~(R), allora la convergenza è uniforme.
La trasformata di Fourier discreta Si consideri per N E N lo spazio delle successioni periodiche di numeri complessi di periodo N cioè del tipo {fn} (n E Z) dove f n+N = f n, Vn. Più intrinsecamente queste successioni si identificano con funzioni a valori complessi sul gruppo abeliano e finito ZN degli interi modulo N. Lo spazio lineare
2.6. La trasformata di Fourier
125
di queste funzioni è strutturato a spazio di Hilbert con il prodotto scalare: n+N-1
(flg)
L
:=
f*(k)g(k),
k=n
dove f, g : Z ~ C sono appunto periodiche e data la periodicità la somma nel membro a destra non dipende da n E Z. Indicheremo questo spazio di Hilbert con L2 (ZN ). Da quanto abbiamo detto sarà chiaro che L2 (ZN) = L2 (ZN, P(ZN ), µe) dove P(ZN) è la a-algebra delle parti e µe è la misura di conteggio su ZN. La seguente applicazione prende il nome di trasformata di Fourier discreta. 2
FN: L (ZN)
~
2
L (ZN), f
~
N-I
FNf
=f
dove f(k) :=
~L
f(l)W;}
vN L=o
dove W N è il numero complesso exp( -i21r / N); nulla cambia nella definizione se l'indice della somma viene traslato per un intero n, cioè L~~ 1 f (l) wtL = 1 f(l)W;} per un qualsiasi n E Z. Si verifica facilmente che FN è un operatore uni tari o e che la sua inversa, detta antitrasformata di Fourier discreta è la applicazione
L~::-
dove
N-I
](l)
:= _l_
ffe
L f(l)(WNI/k k=O
mentre WN 1 = exp(i21r/N) e [(WN 1 )lk] costituisce la matrice inversa della [W;}]; anche qui nulla cambia nella definizione se l'indice della sommatoria viene traslato di un intero. La trasformata di Fourier discreta ha proprietà simili a quelle della trasformata di Fourier F su L 2 (R) e a quelle della mappa/\ definita sullo spazio di Hilbert L2 (T) (cfr. Appendice E). Anche su L 2 (ZN) è definito un prodotto di convol uzione ponendo
l
(f * g)(l)
:=
N-1
L f(l - k)g(k) vN k=o rr::r
126
Capitolo 2. Operatori lineari negli spazi di Hilbert
e si ha allora
g(l) = f (l + n) g(l) = exp(i21rn/N)f(l) g
= f *h
=> g(k) = exp(i21rn/N)}(k) => g(k) = }(k - n) => g(k) = }(k)h(k).
Abbiamo quindi tre operatori unitari
L 2 (R) L 2 (T) L 2(zN)
L A
L2(R) L2(z)
&
L2 (ZN)
con proprietà simili rispetto alle convoluzioni alla traslazioni e alle moltiplicazioni per (opportuni) esponenziali. Analoghe proprietà hanno gli omologhi operatori su L 2 (Rd), L2 (Td) e L2 (Zt) rispettivamente. In effetti ci potrebbe dare una nozione generale di trasformata di Fourier sui gruppi abeliani (cfr. ad esempio (32] o anche (21]) in cui rientrano tutte e tre questi operatori. Nei libri di applicazioni alla teoria dei segnali tutte e tre le trasformazioni prendono il nome di trasformata di Fourier. Osservazione. Abbiamo visto nel paragrafo precedente come la serie di Fourier si connetta con la trasformata di Fourier nella ricostruzione di segnali. C'è anche una connessione tra trasformata di Fourier discreta e serie di Fourier. Se f E L2 (T) allora f = I:kEz(uklf)uk dove {uk} (k E Z) è il s.o.n.c. degli esponenziali e l'elemento fn = I:~=-n(uklf)uk è la migliore approssimazione di f nel sottospazio finito-dimensionale V{ uk} (-n < k < n). Tuttavia i coefficienti di Fourier (uklf) sono calcolabili solo se si conosce l'intera funzione f. Si può però procedere in un altro modo e in ognuno di questi sottospazi costruire una funzione 9n = "L;=-n aiui tale che 9n(xk) = f(xk) dove xk = 2~k con O< k < N - le N = 2n+ 1 (questo metodo ha senso solo se f è regolare cioè appartiene a wr (T) per qualche r; si pensi infatti che, essendo gli elementi di L2 (T) classi di equivalenza di funzioni uguali a meno di insiemi di misura nulla, il valore di f in un punto perde di significato a meno che nella classe di equivalenza non ci sia una funzione continua). La successione {gn} (n E Z) così costruita per f regolare converge anch'essa ad f (per affermazioni più precise su questo tipo di approssimazione si veda ad esempio [9]).
2. 7. Operatori di proiezione Per il calcolo dei coefficienti
127 aj
si deve risolvere allora il sistema
n
Lai~ exp(i21r/Njk) = f(xk), 27r
k = O, 1, ... , N - 1, N = 2n + 1,
. J=-n
che con ridefinizione degli indici scriveremo N-1
L lz exp(i21r/Njk) = f(xk),
k
= O, 1, ... , N -
1, N
= 2n + 1.
l=O
quindi, tenendo conto della periodicità della f, si ha una equazione in termini della trasformata di Fourier discreta
dove f N è la successione periodica di periodo N ottenuta prendendo i valori della f a Xk = 2; k, k E Z e perciò
Nota. La trattazione della trasformata di Fourier in L2 (Rd) è un capitolo di tutti i libri sugli operatori negli spazi di Hilbert e quindi rimandiamo alla bibliografia generale. Numerosissimi sono i testi che trattano applicazioni della trasformata di Fourier, della serie e della trasformata di Fourier discreta. Si veda per esempio (38], (9], (27]. La trasformata di Fourier in S(Rd) viene estesa per dualità allo spazio S' (Rd) delle distribuzioni temperate ed è quindi un capitolo di tutti i libri sulle distribuzioni. Tra i trattati più specifici sulla trasformata di Fourier sulle distribuzioni citiamo (24] e (41]. Ricordiamo anche il lavoro di Wiener (40]. Per un approfondimento della generalizzazione della trasformata ai gruppi abeliani abbiamo già citato (32).
2. 7
Operatori di proiezione
Abbiamo già introdotto la definizione degli operatori di proiezione, brevemente proiettori, nel §1.16 facendola seguire dalle proprietà algebriche che qui, per comodità, richiamiamo:
Capitolo 2. Operatori lineari negli spazi di Hilbert
128
a) Im PR
= R = {x EH I Pnx = x},
b) Ker Pn = RJ_, c) Pn
+ Pn.i. = l
(operatore identità su H),
d) Pi = Pn ( "idem potenza"). Qui, come nel §1.16, R è un fissato sottospazio di H e Pn è il corrispondente proiettore ortogonale. Come per gli operatori unitari, in questo paragrafo ci interessa stabilire le proprietà algebriche dei proiettori. Osserviamo prima di tutto che i proiettori sono operatori limitati; ciò è praticamente evidente dalla definizione: riprendendo la notazione del §1.16 si ha infatti
IIPnxll = llx'II < (llx'll 2 + llx" 11 2 ) 112 = llxll, .' c1oe
IIPnxll < llxll, \/x E 'H.. Questa relazione mostra poi anche che IIPnll < 1. Ma a questo proposito si può essere più precisi:
Il p Il = { R
O se ~ è il ~ottospazio banale, R = {O}, 1 altrimenti.
Lasciamo al lettore la facile dimostrazione. E veniamo al teorema che dà la caratterizzazione algebrica dei proiettori (premettiamo che dicendo "l'operatore A è un proiettore" intendiamo, ovviamente, che A coincide con Pn per un certo sottospazio R di H).
Teorema 2.7.1 Sia A E L(H). Sono equivalenti le affermazioni seguenti: a) A è un proiettore,
b) AtA=A,
c) AtA=At, d) At = A,
A 2 = A (cioè: A è autoaggiunto e idempotente).
129
2. 7. Operatori di proiezione
Prova. a) ⇒ b) Se R è il sottospazio cui è associato il proiettore A e x = x' + x" (come nel §1.16) la decomposizione ortogonale di x relativa a R, abbiamo, qualunque siano x e y in 'H., (xlAt Ay)
-
(AxjAy)
(xlAy)
-
(x'
= (x'ly'),
+ x" ly') = (x'ly');
dunque (xlAtAy)
= (xlAy),
Vx,y E 'H.
e perciò
b) ⇒ e) (AtA)t =Ate quindi
e) ⇒ d} (At A)t
= Att e quindi
e allora, ancora tenendo conto di e), At=AeA 2 =A.
d) ⇒ a) Indicato con R l'immagine di A, mostriamo che R è chiuso; se {xn} (n E N) è una qualsiasi successione in R che sia convergente a x 0 E 'H., da Xn -1- x 0 abbiamo Ayn
-1-
x0 ,
Yn E 'H.,
donde, essendo A continuo, e quindi, poiché A 2
= A, Ayn
-1-
Ax0 ;
grazie all'unicità del limite concludiamo che x0
= Ax
0
e ciò mostra che x 0 E R. L'immagine R di A è dunque un sottospazio di 'H.; la decomposizione ortogonale di un qualsiasi x E 'H. relativa a questo sottospazio è presto trovata; scriviamo x
= Ax + (x -
Ax)
ovviamente Ax E R, mentre (Ayjx -Ax)
-
= (ylA(x -Ax)) = x) = O, Vy E 'H.,
(ylA\x -Ax)) (ylAx - A
2
Capitolo 2. Operatori lineari negli spazi di Hilbert
130
e ciò mostra che x - Ax E Rl.. Abbiamo allora Pnx
= Ax,
Vx E ?t,
cioè
A= Pn.
■
Passiamo ora a considerare le operazioni algebriche sui proiettori. Non ci vuole molto a constatare che l'insieme dei proiettori di 1i, che per comodità indicheremo con P(1i), non è stabile rispetto a nessuna delle tre operazioni algebriche di L(1i); questo controllo suggerisce però delle condizioni sotto cui il risultato di operazioni algebriche eseguite su proiettori è ancora un proiettore. Queste condizioni sono formulate ed esaminate nei tre teoremi seguenti; in essi, come si vedrà, ha un ruolo determinante il commutatore
[PR, Ps]
:=
PRPs - PsPR·
Teorema 2.7.2 Siano PR, Ps i proiettori associati ai sottospazi R, S, nspettivamente. 1) Sono equivalenti le affermazioni: a) PR + Ps è un proiettore; b} PRPs = O; c) PsPR = O;
d} PR(S) = {O}; e) Ps(R) = {O}; J) R ed S sono ortogonali fra loro; 2) Se PR + Ps è un proiettore, esso è associato al sottospazio R
+ S,
cioè
Pn + Ps = PR+S· Prova. a)=> b}, a)=> e). Se Pn (cfr. teorema 2.7.1); ora (Pn
+ Ps)t(Pn + Ps)
-
+ Ps
E 'P(?t)
si ha (Pn
(Pk + PJ)(Pn + Ps)
+ Ps)t(Pn + Ps) = Pn + Ps
= (Pn + Ps)(Pn + Ps) = Pn + PnPs + PsPn + Ps,
quindi deve essere PnPs
+ PsPn = O;
da questa abbiamo (moltiplicando a sinistra per Ps) PsPnPs
+ PsPn = O
2. 7. Operatori di proiezione
131
e (moltiplicando a destra per Ps) PnPs
+ PsPnPs = O
dalla quale segue PnPs - PsPn
= O;
dunque PnPs = PsPn = O; b} => d} evidente; e)=> e) evidente; d} => f) se Pn(S) = {O} allora Se Ker Pn; ma Ker Pn = RJ_ (cfr. §1.16), quindi S ed R sono ortogonali; e)=> f) se Ps(R) = {O} allora Re Ker Ps = SJ_, quindi Re S sono ortogonali; f) => a) poiché R ed S sono sottospazi ortogonali fra loro, R + S è un sottospazio {la dimostrazione del fatto che R + S è chiuso è analoga a quella con cui all'inizio della prova del teorema della proiezione, cfr. §1.16, abbiamo mostrato che R + Rl. è chiuso); per un qualsiasi x E 1t sia x
= x' + x" ,
x' E R + S,
x" E ( R + S) l.,
la decomposizione ortogonale relativa al sottospazio R + S; poiché x' è esprimibile, e in modo unico, come x' = x'n + Xs (con significato ovvio dei simboli), abbiamo X
= X~ + X3 + X"
dalla quale, introducendo il proiettore associato al sottospazio R + S, è evidente che Pn+sx
=X~+ Xs = Pnx + Psx = (Pn + Ps)x.
Questa relazione vale per ogni x E 1t e quindi mostra chef)=> a) e, nello stesso tempo, prova l'affermazione 2) del teorema. ■
Teorema 2.7.3 Siano Pn, Ps i proiettori associati ai sottospazi R, S, rispet-
t-ivamente. 1} Sono equivalenti le afferrnazioni: a) PnPs è un proiettore; b} PsPR è un proiettore; c) [Pn, Ps] := PnPs - PsPR = O; d) R = (R n S) + (R n s1.); e) S = (S n R) + (S n R1.);
2) se PnPs è un proiettore, esso è associato al sottospazio RnS, cioè PnPs = PRnS-
Capitolo 2. Operatori lineari negli spazi cli Hilbert
132
Prova. a) e) Abbiamo, tenendo conto che Pn e Ps sono proiettori,
da un lato allora, se PnPs E P(ri),
= PnPs
PsPRPs
e poi, prendendo l'aggiunto di ambedue i membri di questa, anche
PsPRPs
= PsPR
PsPRPs
= PRPs
cosicché dall'altro, se PsPR
= PRPs,
allora
cioè
e quindi PRPs è un proiettore; b) e) ragionamento perfettamente analogo a quello precedente previo scambio fra Red S; e)=> d) preso un x E 1i qualsiasi possiamo scrivere
PRx
= PsPRx + (1-Ps)PRx
con PsPRx e (1 - Ps)PRx ortogonali fra loro; chiaramente PsPRx E Im Ps - S, ma, poiché PsPRx = PRPsx, PsPnx appartiene anche a Im PR = R, cosicché
PRPsx
E
RnS;
analogamente: (1- Ps)PRx E Im(l - Ps) = s1., ma anche (1- Ps)PRx E ImPR = R poiché (I - Ps)PRx = Pn(l - Ps)x, cosicché
(I - Ps)PRx
E
Rn s1.;
dunque Im Pn =Re (Rn S)
+ (Rn S1.);
d'altra parte, evidentemente, R:) (Rn S)
+ (Rn s1.),
in conclusione otteniamo R = (Rn S) + (Rn s1.);
2. 7. Operatori di proiezione
133
e)=> e) ragionamento perfettamente analogo; e)=> a) preso un qualsiasi x E 7t sia x
= x' + x",
x' E 3,
x" E 31. ,
la decomposizione ortogonale relativa al sottospazio 3; da e) abbiamo poi la decomposizione ortogonale di x' relativa al sottospazio R: x'
= x~ + x; ,
x~ E 3 n R,
x; E 3 n R1.;
e allora x
= x~ + (x; + x")
fornisce la decomposizione ortogonale dix relativa al sottospazio Rn3: infatti (x; +x") E ( R n 3) 1. poiché
x"
E
x;
31. e (R n 3)1.,
E
Rl.c(Rn3)1. .
Abbiamo perciò, introducendo il proiettore associato al sottospazio R n 3,
Questa relazione, valida per ogni x E 7t, mostra che e) => a) e, nello stesso tempo, prova l'affermazione 2} del teorema; d) => b} ragionamento perfettamente analogo. ■
Teorema 2.7.4 Siano PR, Ps i proiettori associati ai sottospazi R ed S, rispettivamente. 1) Sono equivalenti le affermazioni: a) PR - Ps è un proiettore;
b} PRPs = PsPR = Ps; c) Se R. 2) Se PR - Ps è un proiettore, esso è associato al sottospazio R PR - Ps = PRnsJ. • Prova. a)=> b) Da (Pn - Ps)t (Pn - Ps) Pn
cioè
+ Ps -
(PnPs
= Pn -
Ps abbiamo
+ PsPn) = Pn -
Ps,
n SJ_,
cioè
Capitolo 2. Operatori lineari negli spazi di Hilbert
134
da questo abbiamo (moltiplicando a sinistra per Ps)
e (moltiplicando a destra per Ps)
allora e quindi
b} => e) preso un qualsiasi x E 8, abbiamo x = Psx; ma Ps = PnPs e quindi x = PRPsx e ciò mostra che x E R; e) => a) per un qualsiasi x E 7t abbiamo la decomposizione ortogonale relativa al sottospazio 8, x = x' + x" , x' E R, x" E RJ.; tenuto conto di e) abbiamo, per la decomposizione dix' relativa al sottospazio 8, x'2 E Rn 3J..'
allora x
= x~ + (x; + x" )
x
= x; + (x~ + x" )
e
forniscono la decomposizione ortogonale di x relativa al sottospazio 8 e al sottospazio R n 3J., rispettivamente: infatti x; + x" E 31. poiché
ex~
+ x"
E (R
n 31. )1.
x'2
E
x"
E
Rn 31. e 31., RJ. e 3J.
poiché X1
'
E
x"
E
8c(Rn8J.)J., RJ. e (Rn 3J.)J..
Abbiamo perciò, introducendo il proiettore associato al sottospazio R n 31.,
135
2. 7. Operatori di proiezione
Questa relazione, valendo per ogni x E 1-f., mostra che e)=> a) e, nello stesso tempo, prova l'affermazione 2) del teorema. ■
Si sarà notato che la condizione
PnPs = PsPn, cioè la com,mutatività dei due proiettori, è necessaria per il "successo" delle tre operazioni Pn + Ps, PnPs, P~ - Ps; nel caso del prodotto essa è anche sufficiente. ◊
Esercizio 1. Mostrare che se PR e Ps sono due proiettori commutanti tra loro (associati ai sottospazi R ed S rispettivamente) anche PR+Ps-PRPs è un proiettore ed esattamente
PR + Ps - PRPs
= PRvs,
dove R VS è il sottospazio generato da R U S.
Essendo l'algebra L(ri) munita di una topologia (è una C*-algebra, come abbiamo già osservato) potrebbe avere interesse esaminare anche "manipolazioni" topologiche di proiettori (per esempio, successioni o serie di proiettori); effettivamente avremo l'occasione, in seguito, di incontrare siffatti oggetti, ma preferiamo rimandare la loro considerazione al momento in cui interverranno nel discorso. Al momento chiudiamo il paragTafo con una utile caratterizzazione di tipo piuttosto geometrico dei proiettori. Teorema 2.7.5 Sia A E L(ri), A f O.
1) Sono equivalenti le affermaz-ioni: a) A è un proiettore; b) esiste un s. o. n. {un} (n E N) in 1-i tale che Ax =
L (unlx)un,
'vx E 1-i.
nEN
2) Se b) è vera, A è il proiettore associato al sottospazio generato dal s. o. n. {un} (nEN), cioèA=Pvn{un}· Prova. Ricordiamo, preliminarmente, che anche se scriviamo {Un} (n E N), il s.o.n. in considerazione può essere finito; ricordiamo anche che, se il s.o.n. {un} (n E N) è infinitonumerabile, la serie LneN(unlx)un è sicuramente convergente qualunque sia x E 1-f..
Capitolo 2. Operatori lineari negli spazi di Hilbert
136
1) a)==} b) Im A è un sottospazio di 1-f., tale che Y
=
L (unlY)Un,
Vy E lmA.
nEN
Abbiamo allora
Ax
=
L (unlAx)v.n,
Vx E 1-f.;
nEN
ma A è autoaggiunto e, inoltre, Aun
Ax
= un,
Vn E N, quindi
= L (Au.nlx)u.n = L (unlx)un, nEN
Vx E 1-f..
nEN
b} ==} a) Abbiamo, per x, x' qualsiasi in 1-f.,
(xlAtAx')
-
(Ax!Ax')
=
L (xlun)(unlx'), nEN
(xlAx')
-
L (xlun)(unlx') nEN
quindi
2) Da b) si ha subito che Im A e Vn {un}; d'altra parte, essendo A un proiettore, si ha KerA = (ImA).L e quindi (KerA).L = ImA; ma da b} si ha anche KerA e (Vn{Un}).l e quindi (Ker A ).L :::> V n{Un}, ossia Im A :::> V n{Un}; in definitiva lmA
= Vn{Un}-
■
Osservazione. È chiaro che la "realizzazione" di un proiettore A mediante un s.o.n. {un} (n E N) affermata dal teorema 2.7.5 non privilegia un particolare s.o.n.: un qualsiasi s.o.n. che generi il sottospazio Im A realizza, nel senso del teorema 2.7.5, il proiettore A. È chiaro anche che se il s.o.n. è completo, e soltanto in questo caso, il proiettore A è il proiettore 1 ( associato al sottospazio improprio 1i).
2.8
Esempi
Es. 1. Consideriamo lo spazio di Hilbert L 2 (R3 ) (si ricordi, a proposito della notazione succinta e della effettiva natura degli elementi di L 2 (R3 ), ciò
1>
2.8. Esempi
137
che abbiamo ripetutamente detto; cfr., per esempio, le convenzioni al §1.8); sia M un sottoinsieme misurabile di R 3 e XM la sua funzione caratteristica, 1 se XM (x) := { O se
x EM x fJ. M ·
Definiamo ~
L2(R3) p(M)f := XMf,
(XM f)(x) := XM(x)f (x)
Chiaramente P(M) è un operatore lineare limitato; ed è autoaggiunto e idempotente. Quindi P(M) è un proiettore. L'immagine di P(M) è costituita dalle f E L 2 (R3 ) tali che ossia X(M)f = f;
cioè, Im P(M) coincide con il sottospazio di L 2 (R3 ) R(M) :=
{f
2
E L (R
3
);
f(x)
=
O q.d. in cM},
dove cM significa l'insieme complementare di M in R 3 e q.d. sta per "quasi dappertutto". Manifestamente R[M)
=
R(cM)
sicché la decomposizione ortogonale di f E L 2 (R3 ) relativa al sottospazio R(M) è f = XMf + XcMf-
Es. 2. Ancora nello spazio L2 (R3 ) consideriamo l'operatore di parità T1 (cfr. §2.5), Es. 1 e definiamo
t>
Tenuto conto che T1 è unitario e che Tj
= I, abbiamo
Capitolo 2. Operatori lineari negli spazi di Hilbert
138
e, analogamente,
= P_;
P!P_
quindi sia P+ che P_ sono proiettori. I due sottospazi di L 2 (R3 ), diciamo R+ ed R_, rispettivamente, cui sono associati i due proiettori P+ e P_ sono uno il complemento ortogonale dell'altro, infatti P+ + p_ = I. Il sottospazio R+ è costituito dalle
f
E L 2 (R3 ) tali che
P+f
= f,
T1f
= f,
ossia mentre R_ è costituito dalle f E L 2 (R3 ) tali che
R+ è dunque il sottospazio delle f E L2 (R3 ) pari, mentre R_ è il sottospazio delle f E L2 (R3 ) dispari e la decomposizione ortogonale di f E L2 (R3 )
f=f++fdove
f+(x) J_(x) -
1 [f(x) + J(-x)], 2 1 [f(x) - J(-x)], 2
è la ben nota decomposizione in "parte pari" e "parte dispari" di
f.
Es. 3. Nello spazio di Hilbert 1-l, supposto di dimensione non finita, fissiamo un riferimento ortogonale {Un.} (n E N) e, per ogni n E N, definiamo An: 1-l ~ 1-l x ~ Anx := I:;=o(Urlx)ur.
1>
In virtù del teorema 2. 7.5, An è un proiettore, ed esattamente il proiettore relativo al sottospazio, diciamo Rn, generato da uo, u 1 , ... , Un.Istintivamente si sarebbe portati a dire che la successione { An} (n E N) di proiettori converge a I.
139
2.9. Convergenza forte e convergenza debole Ora, poiché
Rn e Rn,,, se n < n', dal teorema 2.7.4 abbiamo che An' -An è il proiettore relativo al sottospazio generato da Un+l, Un+2, ... , Un', sicché
(si ricordi che la norma di un proiettore è 1 salvo che per il proiettore banale O) e quindi la successione {An} (n E N) non è una successione di Cauchy. Convergente, però, e per ogni x E 1-l, è la successione {Anx} (n E N) (e converge a x), sicché si può dire, almeno in questo senso, che la successione {An} (n E N) di proiettori converge a l.
2.9
Convergenza forte e convergenza debole
L'Es. 3 del §2.8 ci ha permesso di rilevare l'opportunità di considerare, per successioni in L('J-l), un tipo di convergenza diverso dalla convergenza propria della topologia generata in L('J-l) dalla norma operatoriale. Ciò apre il discorso su questioni di notevole importanza che non possiamo, però, affrontare qui. Molto riduttivamente, ci limitiamo in questo paragrafo ad accennare-a livello di convergenza-a due altre topologie che piuttosto naturalmente si è portati a introdurre in L(1-l) oltre alla topologia generata dalla norma. Per la verità già a livello di spazi di Banach (per non dire, più in generale, a livello di spazi lineari topologici di tipo piuttosto generale) si è portati a considerare almeno un'altra topologia, oltre alla topologia "istituzionale", detta topologia debole. Conviene quindi partire con i nostri cenni riduttivi da uno spazio di Banach E. Della topologia debole ci limitiamo a dire che si tratta di una topologia non metrizzabile, in generale, ma di Hausdorff e a dare la nozione di convergenza debole di una successione in E. Sia E* il duale di E (cioè lo spazio dei funzionali lineari continui su E); si dice che una successione {xn} (n E N) converge debolmente a X: e si scrive w Xn ---+ x dove "w" sta per "weak" , se
< alxn >---+< alx >,
'va E E*;
x = w - lim Xn si dice limite debole della successione.
Capitolo 2. Operatori lineari negli spazi di Hilbert
140
In questo contesto l'usuale convergenza in norma viene detta convergenza forte e indicata con Xn ~ x dove "s" sta per "strong". Da I < aly > I < llall llYII, Vy E E, Va E E* segue immediatamente che se una successione converge nella norma di E allora converge anche debolmente e allo stesso limite: s w Xn ~X=} Xn ~
x;
questo fatto spiega l'aggettivo "debole" usato per questo tipo di convergenza: esso è infatti indizio che la topologia debole è più debole (cioè consiste di meno aperti) della topologia della norma. E in effetti in generale le cose stanno così. Si vede però immediatamente che nel caso di E finito-dimensionale la convergenza in norma e la convergenza debole (e anche le due topologie sottostanti) coincidono. Nel caso particolare di uno spazio di Hilbert 1-i, tenendo conto della identificazione di 1-i con 1-i* via l'isomorfismo di Riesz vale: Xn
~ x se (ylxn) ~ (ylx)
Vy E 1-i.
Un classico esempio di successione in uno spazio di Hilbert infinitodimensionale che converge debolmente ma non converge fortemente è una successione {un} (n E N) costituita da elementi ortonormali. Essa non converge in norma; infatti ll'un -umll = v'2 per n #-me quindi {un} (n E N) non è una successione di Cauchy. La successione converge invece debolmente a zero. Infatti per ogni y E 1-i la serie LnEN I ( Un IY) 12 < oo e quindi l(Yl'un)I ~ O, ovvero (Yl'un) ~ O. Nell'algebra L(ri) degli operatori continui su 1-i si possono dare tre notevoli topologie: la topologia della norma, già introdotta, quella forte e quella debole; di queste ultime ci limitiamo a dire che non sono metrizzabili ma sono di Hausdorff e a dare la nozione di convergenza di una successione. Abbiamo quindi tre nozioni di convergenza in L (1-i) che ora esplicitiamo. La prima, detta anche convergenza uniforme, è la convergenza definita dalla norma di L(ri) già introdotta nel §2.1 ed è indicata sovrapponendo alla freccia la lettera "u" :
la seconda è detta convergenza forte ed è indicata sovrapponendo alla freccia la lettera s ("strong"): An ~ A se Anx ~ Ax,
Vx E 1-i;
2.9. Convergenza forte e convergenza debole
141
in tal caso si scrive A = s - lim An e A viene detto limite forte della successione {An} (n E N). Da ultimo abbiamo la convergenza debole (o convergenza "weak") An ~ A se Anx ~ Ax, Vx E 1-l e cioè (ylAnx)
---+
(ylAx), Vx, y E 1-l;
in tal caso si seri ve A = w - lim An e A viene detto limite debole di { An} (n E N). È immediato constatare che valgono le implicazioni
e che nel caso di 1-l finito dimensionale i tre tipi di convergenza coincidono ma questo non è più vero nel caso infinito-dimensionale. Sia infatti {un} (n E N) un s.o.n.; la successione di operatori {An} (n E N) definita da Anx := (Unlx)uo converge fortemente a zero (IIAnxll = l(unlx)I --+ O per ogni x E 1-l) ma non converge uniformemente (IIAnll = 1 per ogni n). La successione di operatori {At} (n E N), che è definita da Atx := (uolx)un, converge debolmente a zero ((ylAlx) = (v. 0 jx)(yjv.n) --+ O per ogni x, y E 1-l) ma non converge nè uniformemente nè fortemente.
Per lo studio delle proprietà di questi tipi di convergenza è importante un celebre teorema dell'analisi funzionale che qui citiamo.
Teorema 2.9.1 (Banach-Steinhaus) Siano E ed F due spazi di Banach ed S un sottoinsieme di L( E, F) che verifichi: per ogni x in E esista Ccx) > O tale che IIAxll < Ccx) per tutti gli A in S. Allora esiste C > O tale che
IIAII < c,
VA E
s.
Per la dimostrazione si veda ad esempio [35]. Un fatto rilevante, che si deduce subito dal teorema di Banach-Steinhaus, per le successioni debolmente convergenti di vettori di uno spazio di Hilbert e per quelle di operatori fortemente o debolmente convergenti è che esse sono limitate.
142
Capitolo 2. Operatori lineari negli spazi di Hilbert
a) Sia {xn} (n E N) una successione debolmente convergente di uno spazio di Hilbert 1-i; identifichiamola con il sottoinsieme {Txn} (n E N) di ?-i* via l'isomorfismo T di Riesz; poiché per ogni y E ?-i la successione < Txn, y >= (xnlY) è convergente quindi limitata, si può applicare il teorema con E= 1-i, F =Ce S = {Txn}(n E N). Poiché Tè una isometria ne segue che anche {Xn} (n E N) è limitata. b) Sia S = {An} (n E N) una successione di L(ri) fortemente convergente, allora per ogni x E ?-i la successione { Anx} (n E N) è convergente quindi limitata; S è nelle ipotesi del teorema, quindi limitato. c) Sia S = {An} (n E N) una successione di L(ri) debolmente convergente; per ogni x in 1i la successione { Anx} (n E N) è debolmente convergente quindi limitata per quanto abbiamo detto in a). S è nelle ipotesi del teorema, quindi limitato. Si è mostrato nel §2.3 che le operazioni algebriche e l'aggiunzione definite su L(ri) sono continue nella norma. Ci si può chiedere se esse sono continue anche nella topologia forte e in quella debole: • la struttura di spazio lineare è compatibile in entrambe le topologie; • il prodotto non è continuo nè nella forte nè nella debole (anche se nella forte è sequenzialmente continuo, si veda la s2 ) dell'esercizio che segue) ma è separatamente continuo in entrambe; • l'aggiunzione non è continua nella forte, lo è nella debole.
Per dimostrazioni e approfondimenti si veda (28]. ◊
Esercizio 1.
È evidente che se {An} (n E N) e {Bn} (n E N) sono successioni di L(rl) e An ~ A, Bn ~ B allora per qualsiasi k1, k2 E C si ha k1An + k2Bm ~ k1A + k2B per n, m--+ oo e analoga proprietà ha la convergenza debole. Non è però così per le altre operazioni algebriche. Vale infatti: S1) An ~ A -::I!;,, At ~ A t j s2) An ~ A, Bn ~ B => AnBn ~ AB; W1) At ~ A t An ~ A; w2) An ~ A, Bn ~ B -::1!;,, AnBn ~ AB ma => AnB ~ AB e ABn ~ AB
2.10. Operatori di moltiplicazione (limitati)
143
Prova. s 1 ) sia {un} (n E N) un s.o.n. e si consideri la successione di operatori definiti da Anx := (unlx)uo che converge fortemente a zero i cui aggiunti della forma Alx = (uolx) Un non formano una successione convergente fortemente; s 2 ) segue immediatamente dalla disuguaglianza IIABx - AnBnxll
< <
l dei sottoinsiemi misurabili En di X con le proprietà: O < µ(En) < +oo e p - l/n < lh(x)I < p per ogni X E En. (È facile convincersi dell'esistenza di tali En: i sottoinsiemi misurabili &n = {x E Xl p - l/n < lh(x)I < p} non possono avere misura nulla perché questo contraddirebbe il fatto che llhll 00 = p; potrebbero avere misura infinita. Si intersechino allora gli &n con gli elementi della famiglia {Ak} (k E N); almeno una delle intersezioni avrà misura strettamente positiva, altrimenti sarebbe µ(&n) = I:k µ(Ak n &n) = O.) Posto ora fn = µ(E:.) 112 XE" si ha che fn E L 2 (X,A,µ) e llfnll = 1 per ogni n. La relazione IIMhll = sup IINlhfll > IIMhfnll > p- l/n n = 1, 2, ... 11/11=1 implica In conclusione
IIMhll = llhlloo•
Per ogni f e g in L 2 (X, A,µ) vale infatti
(!IM1,g)
= J,/'hgdµ =
l
(h'f)'gdµ
= (Mh·Jlg).
Possiamo introdurre ora l'applicazione
e rienunciare le proprietà sopra elencate dicendo che, per ogni k1 , k2 E C e h, h E L 00 (X, A,µ) si ha:
Capitolo 2. Operatori lineari negli spazi di Hilbert
146
l. cp(k1h + k2h)
= k1 cp(h) + k2cp(h),
2. cp(hh)
= cp(h)cp(h),
3. cp(h*)
= cp(h)t,
4.
llcp(h)II = llhlloo•
La applicazione cp è quindi un omomorfismo algebrico, una isometria e preserva l'involuzione; diremo quindi che cp è uno *-omomorfismo isometrico dalla C*-algebra commutativa L00 (X, A,µ) nella C*-algebra (in generale non commutativa) L(L2 (X, A,µ)). Conseguenze importanti sono l. Mh
= O se e solo se h = O.
2. Gli operatori di moltiplicazione commutano tra loro, cioè
3. Mh è autoaggiunto se e solo se h(x) E R, q.d .. 4. Mh è unitario se e solo se in h c'è un rappresentativo del tipo h(x) = exp[io:(x)] con o: : X-+ R, o: misurabile.
5. Mh è un proiettore se e solo se h misurabile di X.
= XE
dove E è un sottoinsieme
Si noti che le affermazioni sopra enunciate dipendono unicamente dal fatto che cp è uno *-omomorfismo isometrico. Veniamo alla questione dell'invertibilità degli operatori di moltiplicazione. Sia Nh = {x E Xl h(x) = O}; il nucleo di Mh è costituito dal sottospazio {/ E L2 (X, A, µ)I f(x) = Oper x E cNh}- Pertanto tale nucleo è banale se e solo se µ(Nh) = O. In tale caso esiste l'operatore inverso
ed è facilmente caratterizzabile attraverso h. Introdotta la funzione
!_ . X-+ e !_( ) ·= { h·
' h x ·
h(~)
O
se h(x) se h(x)
i= o =O
2.10. Operatori di moltiplicazione (limitati)
147
si ha che ImMh = {g E L 2 (X,A,µ)I ¼g E L 2 (X,A,µ)} e M-,; 1g = ¼9Si noti che l'operatore inverso potrebbe essere un operatore di moltiplicazione per una funzione, la ½, non essenzialmente limitata (e l'inverso può non essere definito su tutto L 2 (X, A,µ)). Questo apre il discorso più ampio di operatori di moltiplicazione per funzioni non essenzialmente limitate che verrà affrontato in seguito (cfr. §2.17). Ci si può chiedere però quando un operatore di moltiplicazione Mh è un elemento regolare della C*-algebra L(L2 (X, A,µ)) cioè quando Mh è invertibile con inverso in L(L 2 (X, A,µ)). Da quanto detto sopra segue che questo è il caso quando anche ½E L 00 (X, A,µ). Si ha quindi:
• Mh è un elemento regolare di L(L 2 (X, A,µ)) se h è un elemento regolare dell'algebra L 00 (X, A,µ). Si vedrà in seguito che questa condizione è anche necessaria (cfr. §2.17). Osserviamo che si possono definire in modo analogo a quanto fatto sopra operatori di moltiplicazione per h E L 00 (X , A,µ) su tutti gli spazi LP(X, A,µ), per 1 < p < oo e questi operatori risultano ancora lineari e continui, realizzando così un omomorfismo isometrico da L 00 (X, A,µ) nell'algebra degli operatori L(V(X, A.µ)). Solo nel caso di p = 2 questo è uno *omomorfismo. Es. 1. L'operatore Q su un intervallo. Il caso più semplice di operatore di moltiplicazione è il seguente. Sia [a, b] un intervallo in R e T : [a, b] ~ C, r(x) = x; si definisca t>
Poichè T E L 00 [a, b] ed è a valori reali, l'operatore Q è limitato, con IIQII = sup{ lal, lbl }, e autoaggiunto; è inoltre invertibile. ImQ = {g E L2 (a,b]I ¼9 E L2 [a,b]} ed è densa in L2 [a,b]. Infatti se J E Im QJ_ allora
(flQJ) = (Qflf) = O,
'r/f E L2 [a, b]
148
Capitolo 2. Operatori lineari negli spazi di Hilbert
-
-
da cui Qf = O e quindi per l'invertibilità di Q, f = O. Se O~ [a, b], allora Im Q = L2 [a, b] e Q- 1 : L2 [a, b] --► L2 [a, b], Q- 19 = ¾9 è un operatore limitato su L 2 [a, b]. Se invece O E [a, b], Im Q non coincide con L2 [a, b] e l'operatore Q- 1 risulta non limitato (cfr. §2.17).
2.11
Operatori integrali
Con il termine si intendono genericamente operatori su spazi funzionali a valori in spazi funzionali della forma f ~ K f dove I< f (x) = J k( x, y) f (y )dµ(y) per una opportuna funzione di due variabili k chiamata "nucleo" dell'operatore. Le proprietà di continuità dell'operatore dipendono, in generale, dalla regolarità sia del nucleo sia delle funzioni f. Qui tratteremo operatori integrali della classe di Hilbert-Schmidt su spazi di Hilbert di tipo L 2 (X, A,µ), dove (X, A,µ) è uno spazio con misura a-finita e completa. Ricordiamo che per tali spazi con misura si costruisce la spazio prodotto (Xx X, A x A,µ x µ) e si può applicare il teorema di Fubini (cfr. §A.6). In modo del tutto simile si può definire la classe di Hilbert-Schmidt su uno spazio L2 (X, Ax, µ,x) a valori in L 2 (Y, Ày, µy) con (X, Ax, µx) e (Y, Ày, µy) spazi con misura a-finita e completa. Nel caso in cui (X, Ax, µx) = (Y, Ày, µy) la classe di Hilbert-Schmidt risulta, come vedremo una sottoalgebra stabile per aggiunzione di L (1i) con 1i =L 2 (X, A,µ). Nel caso particolare di L2 (X, A,µ) = L2 (R) tratteremo anche operatori di convoluzione. Operatori integrali con nucleo di Hilbert-Schmidt
In questo paragrafo indicheremo L2 (X, A,µ) brevemente con L 2 (X) e L2 (X x X,A x A,µ x µ) con L2 (X x X). Ad ogni k E L 2 (X x X) si associa l'operatore integrale K : L2 (X) f
--► ~
L2 (X) K f dove
Tale operatore è continuo e
K f(x) := f x k(x, y)f(y)dµ(y) q.d ..
IIKII < llkll-
2.11.
Operatori integrali
149
Mostriamo innanzitutto che K è ben definito: poiché k E L 2 (X x X), per il teorema di Fubini la funzione y --. 'l/Jx(Y) = k(x, y) è misurabile a appartiene ad L 2 (X) per quasi tutti gli x e quindi l'integrale che definisce K f(x) esiste finito quasi dappertutto (è inteso che K J(x) = O per quegli x per cui l'integrale in questione non dovesse esistere). Inoltre utilizzando la disuguaglianza di Holder:
IKJ(x)I
b) è stato mostrato nella osservazione precedente. b} => e) È banale. e) => a) Sia A E L(L 2 (X)) e E:=o IIAunll 2 < +oo. Allora si ha E:,m lem,nl 2 < +oo dove Cm,n = (v,mlAun)i sia k = E:,m Cm,nUm ® u~ e K l'operatore HS associato. Mostriamo che tale operatore coincide con A. Si ha infatti facilmente che
(umlK11.n) =
L
dµ(x)u;,(x)
L
dµ(y)k(x,y)un(Y)
= Cm,n = (umlA11.n),
Vm,n E N;
da cui
Kun
= Aun,
Vn E N
e, per la continuità dei due operatori 00
Af
00
= L(unlf)Aun = ~(unlf)Kun = Kf, n=O
Vf E L 2 (X). ■
n=O
La classe degli operatori HS è contenuta nella C*-algebra L(L 2 (X)) degli operatori continui su L 2 (X); sarà indicata con LHs(L 2 (X)).
Teorema 2.11.2 Se K 1 e K 2 sono operatori HS con nuclei k 1 , k 2 rispetti-
vamente si ha: a)
a 1K 1 a1,
+ a2K 2 è un
a2 E C;
operatore HS e ha per nucleo
a1k1
+ a2k2
per ogni
2.11.
Operatori integrali
151
b} K! è un operatore HS e ha per nucleo ki, kl (x, y)
:=
k~(y, x);
e) K 1 K 2 è un operatore HS e ha per nv.cleo k, k(x,y)
:=
L
k1(x,z)k2 (z,y)dµ(z).
La classe LHs(L2 (X)) degli operatori HS è un ideale bilatero di L(L2 (X)) stabile rispetto all'aggiunzione. Prova. a) È evidente. b} Per ogni f, g E L 2 (X) si ha infatti
(glK1f)
-
i
-
(Kt glf),
dµ.(x)g•(x)
i
dµ(y)k(x,y)f(y)
=
i
dµ(y)(l dµ(x)k.(x,y)g(x)r J(y)
con
Ktg(x) e) Si ha, per ogni f (K1K2)f(x)
=
i
E
= {
lx
k*(y, x)g(y)dµ(y),
Vg E L 2 (X).
L 2 (X),
dµ(z)k1 (x, z)
i
dµ(y)k2(z, y)f(y)
=
i
k(x, y)f(y)dµ(y).
Questo mostra, utilizzando il teorema di Fubini, la buona definizione di k e la sua misurabilità. Mostriamo che k E L 2 (X x X). Infatti, dalla diseguaglianza di Holder, si ha:
da cui
Mostriamo ora che LHs(L 2 (X)) è un ideale bilatero. Sia A E L(L 2 (X, .A,µ)) e K un operatore HS. Preso un qualsiasi s.o.n.c. {v.n} (n E N) in L 2 (X, A,µ) si ha 00
~ n=O
00
IIAKv.nll ~ IIAll ~ 11Kunll 2 < +oo, 2
2
n=O
da cui, per il teorema 2.11.1, AK è un operatore HS.
152
Capitolo 2. Operatori lineari negli spazi di Hilbert
Si consideri ora K A; passando a ( K A) t = A t Kt, tenendo conto che Kt è un operatore HS, si ha per quanto appena detto che (KA)t è un operatore HS e quindi, prendendone l'aggiunto, anche K A è un operatore HS. ■
Osservazione. La corrispondenza L 2 (X x X) 3 k .....+ K E L (L 2 (X)) che associa ad un nucleo di L 2 (X) l'operatore HS corrispondente è una applicazione lineare e iniettiva: infatti K = O implica
(JIKg)
=
r
lxxx
k(x,y)J·(x)g(y)dµ
X
µ(x,y)
= o q.
d.
per ogni f, g E L 2 (X), da cui k = O. Questa corrispondenza quindi realizza un isomorfismo lineare tra L 2 (X x X) ed LHs(L 2 (X)). Mediante tale isomorfismo si può conferire anche a LHs(L 2 (X)) una struttura di spazio di Hilbert semplicemente ponendo (K1 IK2 ) := (k 1 lk2 ) per ogni coppia Ki, K2 E LHs(L 2 (X)). La norma hilbertiana è però diversa (e in generale non equivalente) alla norma che LHs(L 2 (X)) eredita da L(L 2 (X)). Vale infatti tra le due norme la relazione (2.19).
Gli operatori degeneri
I::
Si tratta di operatori HS con nucleo del tipo k = 1 Pi ® Qi, con Pi, Qi E 2 L (X). Si noti che k può essere rappresentato da più famiglie di funzioni e che l'operatore HS associato ad un tale nucleo ha immagine di dimensione finita. Abbiamo il seguente teorema.
Teorema 2.11.3 S'ia A
E
L(L 2 (X)). Sono equ'ivalenti le affermaz'ioni:
a) A è degenere. b} lm A ha dimensione finita.
I:.:
e) A è un operatore HS e il S'UO nucleo è k = 1 Pi ® Qi con {Pi} (i = 1, ... , N) e {Qi} ( i = 1, ... , N) in L 2 ( X) linearm,ente indipendenti. Prova. a)=> b) e e)=> a) sono banali. b} => e) Sia {pi} (i = 1, 2, ... N) una base in Im A e sia {1ri}(i = 1, 2, ... N) la sua base duale. Per ogni i il funzionale lineare Oi : L 2 (X) -+ C, oi(f) :=< 1ri , Af > è continuo perché composizione di applicazioni continue (si ricordi che in uno spazio lineare finito-dimensionale tutti i funzionali lineari sono continui). Per il teorema di isomorfismo
2.11. Operatori integrali
153
di Riesz si ha O'.i (!) = (ql IJ) con Tq; = O'.i, essendo T l'isomorfismo di Riesz. Si noti che i funzionali O'.i sono linearmente indipendenti: infatti vale evidentemente N
=L
Af
Oi (f)Pi,
\/ f E L 2 (X);
i=l
allora se fosse, per esempio,
0'.1
= Lr=2 CkOk si avrebbe Af = L~2 Oi(f)(ciPl + pi) \/f E
L (X), e questo contraddirebbe il fatto che dim(Im A) = N. Poichè T preserva manifestamente l'indipendenza lineare ne segue che i e, quindi, i Qi sono linearmente indipendenti. Si ha quindi 2
q;
N
Af
= L(q:lf)Pi,
\/f E L 2 (X)
i=l
ovvero
Af(x)
=
l
Pi(x)qi(Y)f(y)dµ(y)
con {Pi} e {Qi} famiglie linearmente indipendenti. ■
Non sarà dunque restrittivo rappresentare un operatore degenere K con un nucleo k = L~iPi®Qi con {pi} (i= 1, ... ,N) e {qi} (i= l, ... ,N) in L 2 (X) linearmente indipendenti con il vantaggio di leggere immediatamente la dimensione della sua immagine e noi lo fa remo d'ora in poi.
Il teorema giustifica anche il fatto che gli operatori degeneri vengano anche detti operatori a rango finito. Poiché si ha N
Kf = L(q:lt)Pi, i=l
si vede immediatamente che
e
Ker K
= {q;, ... , q~} J_.
Anche la classe degli operatori degeneri, che indicheremo con Ln(L 2 (X)), è un ideale bilatero di L(L2 (X)).
154
Capitolo 2. Operatori lineari negli spazi di Hilbert
La verifica che Lo (L 2 (X)) sia uno spazio lineare e che sia stabile rispetto all'aggiunzione è banale. Per mostrare che, per ogni A E L(L 2 (X)) e ogni K degenere, il prodotto KA è degenere, basta osservare che K A ha immagine finito-dimensionale e utilizzare il teorema 2.11.3. Utilizzando poi, come nella dimostrazione del teorema 2.11.2 il fatto che Lo(L 2 (X)) è stabile rispetto all'aggiunzione si ha che anche AK è degenere.
Osservazione. Gli operatori HS possono essere approssimati da operatori degeneri. Dato k E L2 (X x X) e un s.o.n.c. {'Un} (n E N) di L 2 (X) si ha k = I:n,meN kn,m Un ® Um dove kn,m sono i coefficienti di Fourier di k e la serie converge in L 2 (X x X); indicato con Kn,m l'operatore HS che ha per nucleo la funzione decomponibile Un® Um, si ha (2.20) n,m
dove la serie converge ovviamente nella norma hilbertiana di LHs(L2 (X)) ma per la 2.19 converge anche in norma in L(L2 (X)). La chiusura in L(L 2 (X)) della classe degli operatori degeneri non è però la classe LHs(L 2 (X) ). Si consideri ad esempio l'operatore A = I::= 1 n 1172 Kn,n· Esso è limite in norma di operatori degeneri ma non è un operatore HS. Infatti IIAUnll 2 = ¼La (2.20) dà una generalizzazione della rappresentazione degli operatori · lineari in matrici tipica degli spazi finito-dimensionali. Per ogni f E L2 (X),
n,m
n,m
dove Cm = (u:nlf). Denotando (UnlK f) con dn, si ha
dn = ~ kn,mCrn,
Vn E N .
m
e questa formula generalizza il prodotto di una matrice per una n-upla. Equazioni di Fredholm con operatori degeneri
Con K degenere è facile risolvere l'equazione
J(x) =
L
k(x, y)f(y)dµ(y) + rp(x)
(2.21)
2.11.
155
Operatori integrali
detta equazione di Fredholm degenere; si intende qui che, assegnata t.p E L 2 (X) si cercano le f E L2 (X) che soddisfano
(l-K)f = t.p,
(2.22)
dove K f = I:~ 1 (qllf)Pi· Questa equazione si riconduce ad una semplice equazione algebrica. Teorema 2.11.4 Le soluzioni di {2.22) sono gli elementi f E L 2 (X) della forma f(x) = I:~ 1 çiPi(x)+t.p(x) dove gli çi soddisfano l'equazione algebrica: N
çi -
L aijçj = bi,
i
= 1, ... , N
(2.23)
j=l
in cui aij = (qllPi) e bj = (q;jt.p).
I:f=
Prova. Sia f una soluzione di (2.22); allora f = 1 (q;IJ)Pi + cp; posto ~i = (q;IJ) e prendendo il prodotto scalare per in entrambi i membri dell'equazione 2.22 si ottiene che gli {i soddisfano la (2.23).
qt
Per il viceversa basta prendere / = Z:f=l {iPi + cp, dove gli {i soddisfano la (2.23) e verificare direttamente che una tale f soddisfa la (2.22). ■
L'aggiunto Kt di un K degenere è dato da N
Kt f = L(Pilf)q; i=l
e valgono la relazioni Im K = (Ker Kt)..L e Im Kt = (Ker K)..L. All'equazione di Fredholm degenere per Kt
(1-Kt)J = 'lf;, è associata l'equazione algebrica N
çi -
"taijçi = bi,~
i
= 1, ... , N
(2.24)
j=l
dove bi = (Pil'l/J) e [a!j] è la matrice aggiunta (detta anche coniugata hermitiana) di (aij]: infatti si ha a!i
= (q;IPj) =
L
q;pjdµ
=
(L
PiQ;dµ)*
= aj;,
i,j
=
1, ... , N.
Capitolo 2. Operatori lineari negli spazi di Hilbert
156
Introdotta la matrice T (2.23)
= [8ij-aij] e riscritta compattamente l'equazione Tç=b,
(a)
Tç=O,
(b)
e la om,ogenea associata si ha, dall'algebra lineare, ImT
= (KerTt)-1,
dim(Ker T)
= dim(Ker Tt)
e la seguente alternativa: - o l'equazione ( a) ammette per ogni b una e una sola soluzione - o l'equazione {b) ammette soluzioni non banali e in tal caso la ( a) ha soluzione se e soltanto se y E (Ker Tt).L. Per le equazioni
(I- K)f = e
y = O.
(a)
+ Y,
Ovviamente queste due proprietà di G A traducono le condizioni 1) e 2) della definizione di operatore lineare. È importante osservare che, viceversa, un sottoinsieme di X+ Y che goda delle proprietà 1) e 2) è il grafico di un operatore lineare da X in Y. Infatti, detto G siffatto sottoinsieme, l'applicazione
A:
X:) 7rx(G) x
--+ --+
Y Ax := 7ry(x, y),
dove (x, y) E G,
(7rx e 7ry sono le proiezioni naturali di X+ Y su X e Y rispettivamente) è, in virtù delle proprietà 1) e 2) godute da G, ben definita e soddisfa le condizioni della definizione di operatore lineare; ed è evidente dalla sua definizione che GA=G. È comodo disporre di un simbolo per indicare l'insieme degli operatori lineari da X in Y; noi useremo il simbolo O(X, Y) e O (X) nel caso di X= Y. L'insieme O(X, Y) contiene l'insieme degli operatori lineari su X a valori in Y che, come è noto, ha una ovvia struttura di spazio lineare. Nell'insieme O(X, Y), causa il fatto che ogni operatore ha il proprio dominio, relazioni e operazioni hanno proprietà strutturali molto più deboli e vale la pena di essere un poco più precisi al loro riguardo. subsubsection*Uguaglianza di due operatori lineari Due operatori lineari A e B da X in Y si dicono uguali se hanno dominio uguale e su questo dominio operano alla stessa maniera, cioè A= B ·= { l) DA= DB , ciò che equivale a CA= GB. 2)Ax=Bx,'ixEDA=DB
Estensione di un operatore lineare
Dato un operatore lineare A E O(X, Y), un operatore BE O(X, Y) si chiama estensione di A, in simboli B:) A o anche A C B, se il dominio di B include
162
Capitolo 2. Operatori lineari negli spazi di Hilbert
il dominio di A e, sul dominio di A, B agisce alla stessa maniera di A, cioè
B ::>A·= { l) DB => DA, , ciò che equivale a GB => GA. . 2) Bx = Ax, Vx E DA Restrizione di un operatore lineare Dato un operatore lineare A E O(X, Y) e una varietà lineare M in X contenuta in DA, si chiama restrizione di A a M, in simboli AtM, l'operatore lineare che ha come dominio Me che su tale dominio agisce come A, cioè AtM:
X:) DA:) M
-+
~
X
y AtMX
:=
Ax.
Ovviamente A è estensione di una qualsiasi sua restrizione: A=> AtA-t· Somma di due operatori lineari Dati A E O(X, Y) e B E O(X, Y), nell'ordine, la loro somma è l'operatore lineare, in simboli A + B, che ha come dominio DA n D 8 e che su questa intersezione è definito "puntualmente", cioè
A+B:
DAnDB x
Y (A+ B)x
-+
~
:=
Ax + Bx.
Moltiplicazione di un operatore lineare per uno scalare Dato A E O(X, Y) e k E K, il prodotto di A per k è l'operatore lineare, in simboli kA, che ha come dominio lo stesso dominio di A e che su questo dominio è definito "puntualmente" , cioè
kA : X :) DA x
-+
~
y (kA)x
:=
k(Ax).
Si noti che le operazioni di somma e di moltiplicazione per gli scalare non conferiscono a O(X, Y) la struttura di spazio lineare su K; è chiaro infatti che le due operazioni hanno tutte le ben note proprietà (commutatività, associatività, ecc., l'elemento neutro per la somma è l'operatore nullo, detto anche operatore zero, O : X-+ Y,
x ~ Ox := O),
ma non quella dell'esistenza, per ogni A E O(X, Y), di un "opposto", e ciò a causa di "questioni di dominio" .
2.12.
Operatori lineari. Operatori lineari continui
163
Prodotto ( di composizione) di due operatori lineari
Data una coppia ordinata (A, A') di operatori lineari, con A E O(X, Y) e A' E O(Y, Z), il prodotto di A' con A è l'operatore lineare, in simboli A' A, che ha come dominio il sottoinsieme DA' A di X dato da
e che su questo dominio è definito per composizione, cioè
A' A : X :) DA' A x
~
z
-v-+
(A' A)x := A'(Ax).
È ben noto che al sottoinsieme di O ( X) costituito dagli operatori lineari su X le operazioni di somma, moltiplicazione per gli scalari e prodotto conferiscono una struttura di algebra associativa con unità (l'elemento unità per il prodotto è l'operatore identità, detto anche operatore unità, l :X ~ X, x -v-+ lx := idxx := x) non commutativa (non appena la dimensione di X superi 1). All'intero O(X), invece, non viene conferita la struttura di algebra (già abbiamo notato che non viene conferita neppure quella di spazio lineare); il lettore può facilmente constatare la validità, in O(X), delle relazioni C(BA) -
(C + B)A -
(CB)A, CA+BA,
C(A + B) :) CA+CB, (kB)A - k(BA) = B(kA), Al - IA, AO:) OA.
La situazione che a noi principalmente interessa è quella in ·cui gli spazi lineari in gioco sono spazi di Banach o di Hilbert E, F, H, .... Per ogni A E O( E, F), con la restrizione della norma di E alla varietà lineare DA si conferisce al dominio DA la struttura di spazio normato (e la topologia che ne risulta per DA ovviamente coincide con la topologia relativa che DA eredita da E). Facendo riferimento, allora, allo spazio normato DA si possono ripetere le considerazioni e le conclusioni contenute nella parte iniziale del §2.1: • dati due spazi di Banach E, F (in realtà la completezza non è importante in questo contesto), per un operatore A E O(E, F) la continuità,
Capitolo 2. Operatori lineari negli spazi di Hilbert
164
la continuità uniforme e la limitatezza sono proprietà equivalenti e queste proprietà possono essere controllate o guardando la continuità in un punto del dominio DA (tipicamente nel punto O) o usando la proprietà
3m > O tale che IIAxll < mllxll,
'ix E DA;
• ad ogni A E O(E, F) continuo si può associare il numero reale non negativo
IIAll
:=
inf MA,
MA:=
{m ERI IIAxll < mllxll,
'ix
EDA}
che si continua a chiamare norma di A anche se il termine non può più essere ambientato in una struttura di spazio lineare. Osservazione. Anche il teorema 2.2.1 resta perfettamente valido, manifestamente, per un operatore A E O( E, F); sono cioè equivalenti, per un A E O(E, F), le affermazioni:
a) A è invertibile e A- 1 è continuo; b} 3 µ>O tale che IIAxll > µ!lxii, 'ix ED A· La proprietà "nuova" di maggior rilievo, forse, degli operatori A E O(E, F) continui con DA =f E è espressa dal seguente teorema di estensione (nel caso DA= E non c'è, come subito si potrà vedere, "luogo a procedere"). Teorema 2.12.1 (di estensione) . Siano E ed F spazi di Banach e A E O( E, F), con DA =f E, continuo. Esiste in O( E, F) un operatore lineare A, e uno soltanto, con le proprietà:
J)D,4.=DA, 2) A::> A, 3) A è continuo. Per tale A risulta, inoltre,
IIAII = IIAII-
La prova di questo importante teorema è tutto sommato, piuttosto semplice; ci limitiamo a mostrare come si ottiene l'operatore A lasciando tutto il resto al lettore (comprese le doverose considerazioni tese a controllare che la definizione è ben posta):
A:
E::>DA X
~ ~
F
Ax := limn-oo (Axn),
dove {Xn} (n E N) è una qualsiaS'i successione di elementi appartenenti a DA che converga a x.
2.13. Operatori lineari chiudibili. Operatori lineari chiusi
2.13
Operatori lineari chiudibili. lineari chi usi
165
Operatori
Riprendiamo il teorema di estensione 2.12.1 di un operatore A E O(E, F) continuo e chiediamoci quali proprietà abbia il grafico G A dell'estensione A e quali relazioni abbia con il grafico G A di A. Trattandosi di operatori continui fra spazi di Banach non è pensabile che alla questione possano essere estranee considerazioni topologiche. Alla somma diretta E+F degli spazi di Banach E ed F si conferisce una struttura di spazio di Banach con la definizione della norma piuttosto naturale
ll(x, y)II
:=
(llxll 2 + IIYll 2 ) 112
e quella di spazio di Hilbert, nel caso in cui E ed F fossero spazi di Hilbert, con la definizione (cfr. §1. 20)
((x, y)l(x', y'))
:=(xix')+ (yjy')
(la norma generata da questo prodotto scalare è esattamente quella definita appena sopra e questo è il motivo della scelta fatta, rispetto ad altre scelte altrettanto naturali, dato che siamo primieramente interessati al caso degli spazi di Hilbert; naturalmente parlando di altre possibili scelte, per esempio
ll(x,y)II := llxll + IIYII, intendiamo sempre scelte fra norme equivalenti). Conferita allo spazio lineare E+ F anche la struttura di spazio di Banach possiamo passare all'esame delle proprietà del grafico G A di A. Riesaminando la definizione di A vediamo immediatamente che
G,4 = CA. Ciò significa che la chiusura G A del grafico di A soddisfa le condizioni ( a) del §2.12 e che l'operatore lineare corrispondente è A. Che la chiusura G A soddisfi le condizioni per essere il grafico di un operatore lineare non è un fatto banale. Intanto, mentre è pacifico che G A soddisfa la condizione 1) di ( a) (poiché, come sappiamo, la chiusura di una varietà lineare è una varietà lineare grazie alla continuità della somma e della moltiplicazione per gli scalari del campo), non ci sarebbe motivo, in generale, perché G A soddisfi la condizione 2) di ( a). Ma, il fatto importante è che un'analisi approfondita mostra che molti importanti risultati si conseguono grazie non tanto alla continuità dell'operatore quanto alla circostanza che
166
Capitolo 2. Operatori lineari negli spazi di Hilbert
l'operatore ha grafico chiuso o che comunque a questa situazione C'i si può ricondurre in modo univoco mediante estensione. Una proprietà di questo tipo è attribuita dal teorema di estensione 2.12.1 a tutti gli operatori continui, ma è formulabile anche per operatori non continui e seleziona una classe di operatori verosimilmente di importanza fondamentale nelle applicazioni; la riserva è d'obbligo e potrà essere sciolta soltanto dopo aver constatato la significatività dell'allargamento conseguito con l'introduzione della nuova classe di operatori rispetto alla classe degli operatori continui. Passiamo quindi alle definizioni formali. Definizione 2.13.1 Dati gli spazi di Banach E ed F, sia A E O(E, F). L 'operatore A si dice chiudibile se G A, chiusura del grafico di A, soddisfa le condizioni (a) del §2.12. Se A è chiudibile, l'operatore avente come grafico G A è chiam.ato chiusura di A e indicato con A.L'operatore A si dice chiuso se il suo grafico è chiuso, cioè se G A = G A· Per un A E O(E, F) chiudibile la chiusura A è evidentemente la "più piccola" estensione chiusa di A (il significato del termine "più piccola" è ovvio); un modo equivalente per dire che A E O(E, F) è chiudibile è quindi il seguente: A E O(E, F) è chiudibile se esiste un'estensione chiusa di A, cioè se esiste B E O(E, F) chiuso tale che B :> A; se esiste siffatto B si ha infatti
Ovviamente la chiusura A di un A E O(E, F) chiudibile è un operatore chiuso (G A = G ,4!). Ovviamente un A E O(E, F) chiuso è chiudibile (GA = GA!) e A= A. Osserviamo che, essendo la topologia di E + F metrica, il fatto che A E O(E, F) sia chiuso o chiudibile può essere espresso con l'uso delle successioni: - A è chiuso se e soltanto se, per ogni successione {Xn}
elementi appartenenti a D(A), da {
Xn
Axn
--+ --+
X
y
segue
x E D(A) . {
y=Ax
'
(n
E N) di
2.13. Operatori lineari chiudibili. Operatori lineari chiusi
167
- A è chiudibile se e soltanto se, per ogni successione { Xn}(n E N) di elementi appartenenti a D (A), da { Xn Axn
--+ --+
O
y
segue
y
= O.
La prima affermazione esprime il fatto che G A è chiuso se e soltanto se è sequenzialmente chiuso; la seconda affermazione traduce la seconda delle affermazioni delle condizioni ( a) del §2.12, cioè la condizione
(o, y)
E
a A => y = o.
Anche la definizione di A, chiusura di un A E O(E, F) chiudibile, può essere espressa con l'uso delle successioni: A:
E:>IJ-x x
--+
~
F Ax := limn (Axn),
dove esiste una successione { Xn} (n E N) CD A tale che } . e {A Xn } (n E N) e' convergente
Dx = { X E E I Xn --+ x
Tutti gli operatori continui sono chiudibili, come abbiamo già osservato, e la loro chiusura è l'estensione continua cui si riferisce il teorema di estensione del §2.12, ma non tutti sono chiusi. Il seguente teorema precisa la relazione fra la classe degli operatori continui e quella degli operatori chiusi. Teorema 2.13.1 Sia A E O(E, F) (E ed F spazi di Banach} e si conside',ino le tre affermazioni: a) DA è chiuso; b) A è continuo; c) A è chiuso. Se per A sono vere due delle tre afferrnazioni allora è vera la rest:ante. Prova. a)+b) => e) Essendo continuo, A è chiudibile (teorema di estensione 2.12.1) e
Dx= DA; ma DA= DA, sicché A= A e quindi A è chiuso. b}+c) => a) A= A e quindi per la continuità di A, ~=DA = DA; DA è dunque chiuso. a)+c) => b) GA e DA, in quanto sottospazi di spazi di Banach (E+ F ed E, rispettivamente), sono spazi di Banach e l'operatore lineare 1r:
GA ~ DA,
(x, Ax)
~
1r(x, Ax) := x,
Capitolo 2. Operatori lineari negli spazi di Hilbert
168
chiaramente iniettivo e suriettivo, è continuo, poiché
ll1r(x,Ax)II =
llxll < (llxll 2 + IIAxll 2 ) 112 =
ll(x,Ax)II,
v'(x,Ax) E GA;
in virtù del "teorema dell'inverso limitato" (2.2.1) anche l'inverso 1r- 1 è continuo; l'operatore lineare p: GA ---4 F, (x, Ax) ......+ p(x, Ax) := Ax è continuo poiché
llp(x,Ax)II
= IIAxll < (llxll 2 + IIAxll 2 )1 12 = ll(x,Ax)II,
allora l'operatore lineare prodotto p1r- 1 : DA A; quindi A è continuo. ■
---4
v'(x,Ax) E GA;
F è continuo; ma, evidentemente, p1r- 1
=
L'affermazione a)+c) ⇒ b} è un teorema, storicamente molto famoso, dovuto a Banach e noto con il nome "teorema del grafico chiuso". Con il prossimo teorema stabiliamo due notevoli proprietà degli operatori chiusi; a proposito di queste due proprietà suggeriamo al lettore di confrontare gli operatori chiusi con gli operatori continui. a) Sia A E CJ(E, F) chiuso:
Teorema 2.13.2
1} KerA
:=
{x
E
Elx E DA, Ax = O} è chiuso (in E};
2) se Ker A= {O}, C'ioè se A è invert·ibile, l'inverso A- 1 è chiuso. b} Sia A E O(E, F) chiudibile: se Ker A= {O}, cioè se A è invertibile, A- 1 è chiudibile se e solo se A è invertibile e si ha A- 1 = (A)- 1 . Prova. a) 1) Sia {xn} (n E N) una successione di elementi di Ker A convergente a, diciamo, x 0 ; allora {x11 } (n E N) è una successione di DA tale che Xn ---4 x 0 e Axn ---4 O (poiché Ax11 = O, v'n E N) e quindi, essendo A chiuso, x 0 E DA e Ax0 = O; dunque x 0 E KerA. a) 2) Se A è invertibile, ovviamente A- 1 E O(E, F); l'isomorfismo isometrico
T: trasforma G A in G A - 1 :
E+F (x,y)
---4
......+
F+E T(x,y) := (y,x)
2.13. Operatori lineari chiudibili. Operatori lineari chiusi
169
quindi se G A è chiuso anche G A-1 è chiuso. b} Sia A- 1 chiudibile; tenendo conto che Tè un operatore lineare isometrico e suriettivo quindi un omeomorfismo si ha (2.28)
Si noti ora che un qualsiasi B E O(E, F) è invertibile se e solo se T( G B) è un grafico lineare (e in tal caso, ovviamente G 8 -1 = T (G B)): la condizione è evidentemente necessaria (e l'abbiamo usato nella dimostrazione di 2)). La condizione è anche sufficiente: infatti per T(G 8 ) varrà la 2) di (a) del §2.12, cioè
(0,x) E T(Ge) => x
= O;
quindi sex E KerB allora (O,x) E T(Ge) e quindi x = O. In base a questa osservazione da (2.28) si ha che A è invertibile e G A-i (A)-1 = A-1.
= T(G A) cioè
Sia ora, viceversa, A invertibile; sempre dalla relazione (2.28) si ha che A- 1 è chiudibile e che A- 1 = (A)- 1 . ■
Un risultato notevole che coinvolge gli operatori chiusi e che più avanti ci sarà molto utile è espresso dal teorema seguente. Teorema 2.13.3 Siano A EL (E, F) e BE O(E, F): 1) se B è chiuso anche A + B è chiuso; 2) se B è chiudibile anche A + B è chiudibile. Prova. 1) Sia {xn} (n E N) una successione di elementi appartenenti a DA+B tale che Xn {
per provare che A
+B
~
X
(A+B)xn ~ Y '
è chiuso dobbiamo mostrare che
~X (A+ B)xn ~ y
Xn {
{
=>
X
y
E D A+B
= (A+ B)x
Poiché A è continuo e DA= E, da Xn ~ x segue Axn ~ Ax e allora da (A+B)xn ~ y abbiamo che la successione {Bxn} (n E N) è una successione convergente e il suo limite è y - Ax; dunque {xn} (n E N) è una successione di elementi appartenenti a De (poiché DA+B = DA) tale che Xn ~x { Bxn ~ y-Ax ·
Capitolo 2. Operatori lineari negli spazi di Hilbert
170
Ma per ipotesi B è chiuso e quindi
~x Bxn ~ y-Ax
Xn {
=>
X {
E DB
y-Ax
otteniamo perciò, come volevamo, che x E D A+B e y 2) Dimostrazione analoga, anzi più semplice. ■
= Bx
. '
= (A+ B)x.
Per terminare degnamente il paragrafo dobbiamo mostrare che la classe degli operatori chiudibili è effettivamente una classe che estende in modo significativo la classe degli operatori continui; ciò è abbondantemente provato dal prossimo teorema. Come premessa ricordiamo che, essendo n un sottoinsieme aperto (non vuoto) di Rd (eventualmente n = Rd), per ogni multiindice k di ordine d, k =(k1, k2, ... , kd), con k1, k2, ... , kd interi non negativi, si indica con Dk f la derivata parziale di ordine
di
f: n---+ C rispetto a X1, X2, ... , Xd, rispettivamente,
k1, k2, ... , kd
volte:
(come d'uso, si conviene D 0 f := f). Ricordiamo anche che con C~ (n) si indica lo spazio delle funzioni f : n ---+ C di classe C00 a supporto compatto in n, che a noi qui conviene considerare come varietà lineare nello spazio L 2 (fl). Fissato un intero non negativo j, consideriamo l'operatore appartenente a O(L2 (r2)) ---+
L2 (n)
'V'? ·
T;J,
(T;J)(x)
:= I:lkl9 Ck(x)Dk f(x)
dove i coefficienti ck sono funzioni di classe C00 inne abbiamo indicato come sempre con x la d-upla (x 1 , X2, ... , xd). Teorema 2.13.4 Per ogni fissato intero non negativo j l'operatore Ti testè
de.finito è chiudibile.
2.13. Operatori lineari chiudibili. Operatori lineari chiusi
171
Prova. Osserviamo prima di tutto che con il procedimento di integrazione per parti possiamo stabilire che (m è la misura di Lebsgue)
In
(T;f)'hdm
In
f'(T;h)dm,
=
L (-1)lklnk(Ckh)(x).
=
dove (T}f)(x)
\/h,f E C';'(f!),
lkl5:i
Sia ora {fn} (n E N) una successione di funzioni appartenenti al dominio di Tj, cioè a C~(n), tale che
dall'uguaglianza stabilita sopra con il procedimento di integrazione per parti abbiamo lim f (TJfn)*hdm = lim f f~(T}h)dm, n-ooln n-ooln
Vh E C~(n),
e quindi
cioè (glh)
= o,
Vh E c~(n);
poiché la varietà lineare C~(n) è densa in L 2 (n) (cfr. S 1.12) otteniamo g volevamo. ■ ◊
= O,
come
Esercizio 1.
Considerare un s.o.n.c. {'U,n} (n = 1, 2, ... ) in uno spazio di Hilbert rl e sia D= V' { '11.n, n = 1, 2, ... } la varietà lineare generata. Mostrare che l'operatore A:
D x
-➔
rl
~
Ax :=
(ì:{:1(v.ilx))u1
non è un operatore chiudibile. Sugg. Si consideri la successione ◊
Xn
=
*ì:;=
1
se x =
ì:f~ 1 (uklx)v.k
'
kuk.
Esercizio 2. Sia A E O (rl) un operatore chiuso; mostrare che munendo D (A) del prodotto scalare (xly)A := (xly) + (AxlAy) si ottiene uno spazio di Hilbert.
Capitolo 2. Operatori lineari negli spazi di Hilbert
172
2.14
Operatori lineari aggiuntabili
Nel §2.3 abbiamo introdotto nella C*-algebra L(rf.) l'aggiunzione sottolineando l'importanza fondamentale di questa operazione che associa a ogni operatore A E L(rf.) un altro operatore appartenente a L(rf.), indicato con A t e chiamato l'aggiunto di A, che è caratterizzato dalla relazione (a)
(x' IAx) = (A t x' Ix),
Vx, x' E 1-f..
Attesa la sua importanza, è spontaneo chiedersi se siffatta operazione possa essere considerata-fosse anche con proprietà un po' indebolite-per gli operatori appartenenti a 0(1-f.). Per esaminare la questione conviene riprendere il caso di un operatore A E L(rf.) e vedere quale relazione ci sia fra il grafico GAt dell'aggiunto Ate il grafico G A di A. Sia G A che G At sono ambientati nello spazio di Hilbert 1-f. + 1-f., somma diretta di 1-f. con se stesso. Nota. Ricordiamo che il prodotto scalare dello spazio 1-(. + 1-(. è
((x, y) I (x', y')) :=(xix')+ (yly'), dove (
I ) nel membro a destra è il prodotto scalare di 1-(.
(cfr. §1.20).
Dato A E L(rf.) consideriamo il sottoinsieme di 1-f. + 1-f.
(b)
G = (V(GA)).L
dove V è l'operatore unitario di 1-f. + 1-f. V : 1-f. + 1-f. (x,y)
(e)
~ --+
1-f. + 1-f. V(x, y) := (-y, x)
e il complemento ortogonale è preso, ovviamente, in 1-f. + 1-f.. Ci chiediamo se il sottoinsieme G soddisfa le due condizioni
(d)
1) { 2)
è una varietà lineare (O, y) E G ⇒ y = O.
La condizione 1} sicuramente è soddisfatta da G; anzi, essendo un complemento ortogonale, G è una varietà lineare chiusa (cfr. §1.15).
2.14. Operatori lineari aggi un tabili
173
Per ciò che riguarda la condizione 2) abbiamo
(O, y) E G
~
((O, y)l(-Ax, x))
= O,
\/x EH,
cioè
(O,y) E G
~
(ylx)
= O,
Vx EH,
e quindi
(O, y) E G
==? y
= O.
Il sottoinsieme G = (V( G A) )1. soddisfa dunque ambedue le condizioni (d) ed è a questo punto piuttosto semplice, tenendo presente la caratterizzazione (a), constatare che l'operatore lineare ad esso associato è l'aggiunto A t. In definitiva abbiamo GAt = (V(GA))l.. Questa semplice analisi suggerisce la definizione seguente. Definizione 2.14.1 L'operatore A E O(H) si dice aggiuntabile se G (V( G A) )1. soddisfa le due condizioni (d)
=
Se A è aggiuntabile, si chiama aggiunto di A, e si indica con A t, l'operatore di O(H) definito da (V(GA))1.. Introdotti con questa definizione l'aggiuntabilità e l'aggiunto, occorre affrontare tre questioni importanti. 1) Esaminare "che cosa costa" l'aggiuntabilità di un A E O(H) e formulare su A direttamente le condizioni di aggiuntabilità. 2) Stabilire, per un A E O(H) aggiuntabile, le proprietà di fondo dell'aggiunto A t; in particolare sarà opportuno esplicitare la forma concreta di A t in termini di dominio e corrispondenza. 3) Esaminare le proprietà dell'aggiunzione in relazione a altre "operazioni" fra gli operatori di O(H) che abbiamo già discusso. La prima questione si risolve rapidamente. La prima delle condizioni (d) non com porta alcunché per l'operatore A E O (H) giacché (V (G A)) 1. è comunque una varietà lineare (chiusa), mentre per ciò che concerne la seconda condizione abbiamo
(O, y) E (V(G A))l. ~ ((O, y)l(-Ax, x)) = O,
\/x ED A,
Capitolo 2. Operatori lineari negli spazi di Hilbert
174
cioè
(0,y) E (V(GA))J_ (yjx) = O,
'ix E DA,
ossia (ovviamente il complemento ortogonale di DA è inteso rispetto a H, mentre quello di (V(GA)) è rispetto a H + H); la condizione
equivale dunque all'altra y
ED{=> y = O,
cioè a
D{ = {O} o anche
DA=H (si ricordi che D}J_ = DA poiché DA è una varietà lineare). Abbiamo così dimostrato il teorema seguente che chiude la prima questione. Teorema 2.14.1 A E O(H) è aggiuntabile se e solo se DA è denso in H (ossia se e solo se A è, come si dice, densamente definito).
Passando alla seconda questione dimostriamo il seguente teorema. Teorema 2.14.2 Sia A E O(H) aggiuntabile: 1} At è chiuso; 2) At è aggiuntabile se e solo se A è chiudibile e, se questo è il caso,
Att =A; 3) se A è chiudibile anche A è aggiuntabile e si ha ( A Jt
= A t;
4) se A è invertibile, A t è invertibile se e soltanto se A- 1 è aggiuntabile e, se questo è il caso, (At)- 1 = (A- 1) \
2.14.
Operatori lineari aggiuntabili
5) D At
= {y
1il 3 y' E 1i tale che (ylAx) = (y'lx), Vx E DA} =
E =
175
{y E
1il ay : 1i:) V A~ K, x ~ ay := (yjAx)
è continuo},
e
At:
~ ~
1i:)DAt y
1i Aty
:=
y',
dove y' è tale che (ylAx) = (y'lx) Vx E DA· 6) Ker At
= (ImA).1.
Prova. 1} Direttamente dalla definizione di At abbiamo GAt = (V(GA)).L e quindi il grafico di A t è chiuso; 2) tenendo conto che V è unitario e che V2 = -1 (qui l indica l'operatore identità di 1-l + 1-l), abbiamo
perciò (V(GAt )).L soddisfa la seconda delle condizioni (d) se e soltanto se la soddisfa GA e, se questo è il caso, Att = A; 3) se A è chiudibile abbiamo A :::> A donde è chiaro che A è densament.e definito e quindi aggiuntabile; tenendo poi conto dell'unitarietà di V abbiamo
4) Introdotto, accanto a V, l'operatore
u:
7-l + 1-l (x, y)
--+
~
1-l + 1-l U(x, y) := (y, x),
tenendo conto che U e V sono unitari, che UV
5) poiché, come sappiamo, GAt DAt
-
= -VU e che GA-1 = U(GA)
= (V(GA)).L,
abbiamo
{y E 7-tl 3y' E 7-t tale che (y,y') E (V(GA)).L} {y E rii 3y' E 7-t tale che (ylAx) = (y'lx), \lx E DA}
e, dato y E DA t ,
Aty = y', y' essendo tale che (ylAx)
= (y'lx),
'r/x E DA
abbiamo
Capitolo 2. Operatori lineari negli spazi di Hilbert
176
(si noti che, dato y E DAt, siffatto y' è unico poiché (V(GA)).L soddisfa la seconda delle condizioni (d)); inoltre, da un lato, se y E DA t , chiaramente il funzionale lineare
Oy : 7t :>DA
-I-
e, Oy(x)
:=
(ylAx)
è continuo poiché, per ogni x E DA,
loy(x)I = l(ylAx)I = (y'!x)I < IIY'll llxll, dall'altro, se y E 7t è tale che il funzionale lineare (densamente definito) oy(x) := (y!Ax), x E DA, è continuo, applicando a questo funzionale il teorema di estensione (cfr. 2.12.1) otteniamo un funzionale lineare oy appartenente al duale 7tt e quindi dal teorema di Riesz (crf. teorema 1.21.2) abbiamo che esiste y' E 7t tale che oy(x) = (y'lx), Vx E 7t, donde (oy è un'estensione di oy!) (y!Ax) = (y'lx), Vx ED A, e ciò significa che y ED At. 6} prendiamo y E Ker A; ciò significa che y E DA t e A t y
= O;
ma questo equivale (vedi punto 5) testè dimostrato) a
(ylAx)
= O,
'r/x
E
DA,
cioè a y E (ImA).1. ■
Osservazioni.
1) Si noti che dai punti 2) e 3) del teorema 2.14.2 si ha subito, per un A E 0(1-l) che sia aggiuntabile e chiudibile,
quando esistono, quindi, gli aggiunti di un A E 0(1-l) sono due: l'aggiunto At e il "biaggiunto" Att; ogni aggiunto successivo coincide con uno di questi, precisamente: gli "aggiunti di grado dispari" coincidono con A t, quelli di "grado pari" con A tt.
2) Come è chiaro dal punto 5) del teorema 2.14.2, la relazione (a) è sostituita, per un A
(a')
E
0(1-l) che sia aggiuntabile, dalla relazione più debole
(x'IA)
= (A t x'lx),
Vx E DA, Vx' E D At •
2.14.
Operatori lineari aggiuntabili
177
3) Se l'operatore A E 0(1-l) aggiuntabile è continuo allora l'aggiunto A t appartiene a L(rl); infatti D At = 1-l, poiché, se A è continuo, il funzionale lineare ay(x) := (ylAx), x E DA, è continuo qualunque sia y in 1i e allora, tenendo conto che A t è chi uso (punto 1) del teorema 2.14.2), dal teorema del grafico chiuso (cfr. teorema 2.13.1) si ha il risultato voluto.
E veniamo alla terza questione. Ad essa provvede il prossimo teorema, cui, però è necessaria una premessa. Per alleggerire e sveltire la formulazione delle affermazioni del teorema e lo svolgimento delle relative dimostrazioni riteniamo sia opportuno attenersi alla seguente tutti gli operatori coinvolti nelle affermazioni del teorema sono supposti, direttamente, aggiuntabili; (in realtà, in una formulazione più precisa e circostanziata delle affermazioni si potrebbe tener conto del fatto che l'aggiuntabilità di alcuni operatori è conseguenza dell'aggiuntabilità di altri; lasciamo al lettore, come utile esercizio, il compito di questa riformulazione più precisa e circostanziata delle affermazioni del teorema e della conseguente modificazione delle dimostrazioni). CONVENZIONE:
Teorema 2.14.3 Siano tutti gli operatori considerati nelle affermazioni seguenti aggiuntabili. 1) B ::) A => Bt e A t;
2} (A+ B)t::) At + Bt,se, in particolare, almeno uno dei due operatori A e B appartiene a L(rl) allora
(A+B)t=At+Bt; 3} se k f O, (kA)t = k*At, se k = O, O =(kA)t ::) k* At; 4) (AB)t::) Bt At; se in particolare A EL (1-l) allora (AB)t = BtAt. Prova. 1) GB ::> GA, quindi V(GB) ::> V(GA) e poi V(GB).1 2) y E DcAt+Bt) = D At n DBt => (ylAx) + (ylBx) = (Afylx) + (Bfylx), Vx E DA => (yl(A + B)x) = ((Af + Bf)ylx), \:/x E D(A+B)
e V(GA).1,
n DB
cioè
st e Af;
Capitolo 2. Operatori lineari negli spazi di Hilbert
178 => y
E D(A+B)t
e (At
+ Bt)y =(A+ B)ty,
quindi
(A+ B)t :::, At
+ B\
supposto B E L(7-{) abbiamo anche y E D(A+B)t => (yl(A + B)x) =((A+ B)tylx), Vx E D(A+B) = DA => (ylAx) = ((A+B)tylx)-(Btylx),\lx E DA => y ED At e Aty =(A+ B)ty - Bty => y E D(At+Bt) e (A+ B)ty = (At quindi
3} sia k # O; abbiamo allora y E D(k·At) # y E DAt # 3y' E 'H. tale che (ylAx) = (y'lx), Vx E # 3y' E 'H. tale che (ylkAx) = (k•y'lx), \lx E D(kA), # y E D(kA)t e (kA)t y = (k• A t)y, e ciò mostra che
sia k
= O;
+ Bt)y,
DA,
abbiamo allora
(yl(kA)x) donde (kA)t = O; 4) y E D(BtAt) => y E
DAt
= (Olx),
e Aty E
\lx E
D(kA),
Vy E 7-{,
=> y
E DAt
e (AtylBx)
DBt
= (Bt(Aty)lx),
Vx E
DB
Vx E D(AB) => y E D(AB)t e (AB)ty = (BtAt)y, e ciò mostra che (AB)t:::, BtAt; supposto A EL (7-{) abbiamo anche y E D(AB)t => (ylABx) = ((AB)t ylx), Vx E D(AB) = DB => (AtylBx) -
=> (yl(AB)x)
= ((BtAt)y)lx),
((AB)t ylx), Vx E (AB)t y
2.15
DB
=> Aty
E
D8t
= BtAty, quindi BtAt:::, (AB)t.
e (AB)t y
=
ntAty => y E
D 8 tAt
e
■
Operatori autoaggiunti, simmetrici, essenzialmente autoaggiunti
Nel §2.3 abbiamo sottolineato il ruolo estremamente importante degli operatori appartenenti alla C* -algebra L(rl) autoaggiunti; come ovvia conse-
2.15. Operatori autoaggiunti, simmetrici, essenzialmente autoaggiunti 179 guenza della uguaglianza (a) del §2.14 che caratterizza l'aggiunto di un operatore appartenente a L(1i.), un operatore autoaggiunto A E L(1i.) è caratterizzato dalla relazione
(Ax'lx) = (x'IAx),
Vx, x' E 1i.,
come avevamo già osservato nel §2.3. Si potrebbe pensare che questa stessa relazione possa caratterizzare l'autoaggiuntezza anche di un operatore A E 0(1i.), previe le necessarie modificazioni, ovvie a questo punto, volute dalla situazione più generale: cioè un A E 0(1i.) autoaggiunto potrebbe essere caratterizzato dalle condizioni
(a')
DA= 1i. { (Ax'lx) = (x'IAx),
Vx, x' ED A
'
(la prima serve a garantire l'aggiuntabilità, anzitutto, di A, come sappiamo). Ora, le condizioni (a') sono equivalenti a
(b)
DA =rl { A e At
(infatti, si ha da (a'), oltre all'aggiuntabilità di A che ritroviamo in (b), x'
E
=>
DA=> (Ax'lx) = (x'IAx), Vx E DA x' E DAt e At x' = Ax' (cfr. teorema 2.14.2 punto 5)) 1
quindi A e At; viceversa, si ha da (b} l'aggiuntabilità di A e quindi la relazione (cfr. (a') dell'osservazione 2 al §2.14) (Atx'lx)
= (x'IAx),
dalla quale poi, essendo A e At, (Ax'lx)
Vx E DA,
= (x'IAx),
Vx' E DAt Vx,x' E DA)
mentre l'autoaggiuntezza dovrebbe significare l'uguaglianza dell'operatore con il suo aggiunto. Si individua così una classe piuttosto interessante di operatori (soprattutto se si guarda alle condizioni (a')) che sono chiamati operatori simmetrici (e la seconda delle (a') ben giustifica il nome) e che può essere considerata come una classe "preliminare" a quella degli operatori autoaggiunti. E veniamo alle definizioni farmali.
180
Capitolo 2. Operatori lineari negli spazi di Hilbert
Definizione 2.15.1 Sia A E 0(1i.); A si dice simmetrico se soddisfa le condizioni (b) { DA= 1-{
A e At
;
A si dice autoaggiunto se soddisfa le condizioni
(e)
DA=
1-{
{ A= At
.
Chiaramente gli operatori autoaggiunti sono anche simmetrici e quindi soddisfano le condizioni (a') le quali però non sono sufficienti a garantire, viceversa, l'autoaggiuntezza, come abbiamo già discusso. Se ribadiamo qui questo punto il motivo è che usualmente stabilire se un operatore è simmetrico è piuttosto facile proprio facendo uso delle condizioni (a') e nella pratica comune è attraverso questa proprietà di simmetria che passa il procedimento per arrivare, eventualmente, a stabilire l'autoaggiuntezza. Direttamente dalla definizione è chiaro che ogni A E 0(1i.) simmetrico gode della proprietà di essere chiudibile, sicché abbiamo
A e Atte At (ricordiamo che per un operatore A aggiuntabile e chiudibile si ha A= Att) donde è chiaro che la ch-iuS'ura di un operatore simm,etrico è un operatore sim:m,etr·ico poiché A e At = (A)t (cfr. 2.14.2, punto 3)). Il caso
è quello degli operator-i autoagg'iunti che sono evidentemente operatori chiusi. Il caso A= Atte At è quello degli operatori simmetrici chiusi, mentre il caso
A e Att = At caratterizza una sottoclasse decisamente interessante di operatori simmetrici, praticamente interessante tanto quanto quella degli operatori autoaggiunti; sono chiamati operatori essenzialm,ente autoaggiunti. Come si vede, si tratta di operatori sim,metriC'i la cui chiusura è un operatore autoaggiunto.
2.15.
Operatori autoaggiunti, simmetrici, essenzialmente autoaggiunti 181
Osservazione. La definizione di operatore essenzialmente autoaggiunto può essere introdotta anche in modo "autonomo" da quella di operatore simmetrico:
un operatore A E O(H) si dice essenzialmente autoaggiunto se è chiudibile e la sua chiusura è un operatore autoaggiunto.
Le due definizioni sono equivalenti. Infatti, se A E O('H.) è simmetrico e tale che Att = At, si ha subito che A è chiudibile, A è aggiuntabile e A = (A)t (cfr. teorema
2.14.2); viceversa, se A E O('H.) è chiudibile e tale che la sua chiusura è autoaggiunta, si ha (tenendo presente che, per un A chiudibile, DA e DA) che A è aggiuntabile e poi (di nuovo usando il teorema 2.14.2 insieme al fatto che (A)t = A) che A e Ate Att = At. ■
Abbiamo già osservato che il procedimento usuale per stabilire se un operatore è autoaggiunto ha come primo stadio stabilire che l'operatore è simmetrico; lo stesso discorso vale per gli operatori essenzialmente autoaggiunti. È quindi molto utile il teorema seguente che fornisce delle caratterizzazioni degli operatori autoaggiunti e di quelli essenzialmente autoaggiunti nell'ambito degli operatori simmetrici in spazi di Hilbert complessi. Teorema 2.15.1 Sia A E O(H), 1i spazio di Hilbert complesso, un operatore simmetrico. 1) Sono equivalenti le affermazioni: a) A è autoaggiunto;
b}DAtCDA; c) A è chiuso e Ker(At ± il) ={O}; d} lm(A ±il)= 1i. 2) Sono equivalenti le affermazioni: a) A è essenzialmente autoaggiunto; b} DAt e IJ:;r; c) Ker(At ± il) ={O}; d} lm(A ± il) è denso in H. Prova. 1) a)~ b} Evidente. a) => e) Poichè A t = A, A è evidentemente chiuso; sia, poi,
x+ E Ker( At + il), x_ E Ker(At - il);
Capitolo 2. Operatori lineari negli spazi di Hilbert
182 abbiamo
Atx± = +ix±
donde (x±IAtx±) -
(x±I +ix±)= +illx±ll
(Atx±lx±) -
2
(+ix±IX±) = ±illx±ll
2
,
e quindi cosicché llx± 11
= O,
cioè X±
= O.
e)=;- d) Dimostriamo anzitutto che, essendo A chiuso, Im(A ± il) è chiusa. Consideriamo un Y+ E Im(A + il); sia {x+,n} (n E N) una successione di elementi x+,n appartenenti a DA+il tale che (A+ il)x+,n ~ Y+; parimenti, considerando un Y- E Im(A - il), sia {x-,n} (n E N) una successione di elementi X-,n appartenenti a DA-il tale che (A-il)x-,n ~ Y-· La successione {x±,n} (n E N) è di Cauchy: abbiamo infatti, qualunque sia z E DA= DA±il, llzll
< ll(A ± il)zll
(poiché ll(A ± il)zll 2 = ((A± il)zl(A ± il)z) A è simmetrico), cosicché
= 11Azll 2 + llzll 2 in conseguenza del fatto che
llx±,n - X±,mll < ll(A ± il)(x±,n - X±,m)II
= ll(A ±
il)x±,n - (A± il)x±,mll,
ciò che, appunto, mostra che la successione {x±,n} (n E N) è di Cauchy, tale essendo la successione {(A± il)x±,n} (n E N). Sia allora X±=
lim
n-oo
X± ,n,·
la successione {x±,n} (n E N) è dunque una successione di elementi appartenenti a DA±il che converge a X± e tale che la successione {(A±il)x±,n} (n E N) converge a Y±· Essendo A chiuso, chiuso è anche A± il (cfr. teorema 2.13.3) e allora (vedi §2.13) X±n ~ X± da { (A± il)x±,n ~ Y± I
X± E DA±il se ue { . g Y± = (A± il)x±
Dunque Y± E Im(A ± il) e possiamo quindi concludere che Im(A
± il) = Im(A ± il).
Proseguendo, da Ker(At ±il)= {O}, grazie alla relazione (cfr. la 6) del teorema 2.14.2) Ker(At ±il)= (Im(A+il))J_,
2.15. Operatori autoaggiunti, simmetrici, essenzialmente autoaggiunti 183 abbiamo (Im(A =F il)).L
= {O}
e quindi (Im(A =F il)).L.L
= 1i.
ossia, poiché, come abbiamo mostrato sopra, Im(A =Fil) è (una varietà lineare) chiusa, Im(A =Fil)
= 7-(, esiste in D A±il un X± tale che
d) => b} Sia y ED At • Poichè Im(A ± il)
(A± il)x± ora, D A±il
= 1i..
= (A t ± il)y;
= DA e su DA, poiché A e A t, gli operatori A e A t
coincidono, cosicché
(At ± il)(y - X±)= O; ma y- X±= 0,
ossia
y=
X±
e questo mostra che y E DA.
2) a) b} Evidente. a) => e) Osservato che At è autoaggiunto, la dimostrazione procede come nel caso analogo del punto 1). e)=> d) Da Ker(At ±il)= {O} abbiamo (Im(A =F il)).L e quindi lm(A ± il)
= {O}
= (Im(A =F il)).LL = 7-(,.
d) => b) Sia y ED At • Poichè Im(A ±il)= 7-(,, esiste in D(A±il) una successione {x±,n} (n E N) tale che (A± il)x±,n -, (At ± il)y; la successione {x±,n} (n E N) è di Cauchy (vedi punto 1) e)=> d)), quindi convergente. Sia allora X±=
lim
n-oo
X± ,n,.
la successione {x±,n} (n E N) è dunque una successione di elementi appartenenti a DA±il che converge a X± e tale che (A± il)x±,n -, (A t ± il)y. Essendo A chiudibile anche A± il è chiudibile e A± il= A± il; dalla definizione di operatore chiudibile abbiamo allora X± E -°A±il e (A± il)x± = (A t
± il)y.
184
Capitolo 2. Operatori lineari negli spazi di Hilbert
Ora, A
= A t e quindi (At ± il)(x± - y)
= O;
ma
Ker(At ±il)= (Im(A=Fil))j_
= (Im(A=t=il)).L = {O},
sicché otteniamo y=X±
e questo mostra che y E
2.16
D:if.
■
Valori medi di un operatore
Il concetto di valore medio di un operatore, e particolarmente di un operatore autoagg'iunto, è estremamente importante nel contesto della Meccanica Quantistica; anzi il termine stesso di valore medio risale sostanzialmente all'interpretazione generale che la Meccanica Quantistica dà degli oggetti maternatici introdotti per la sua costruzione teorica. In considerazione di questo conveniamo che, in questo paragrafo, lo spazio di Hilbert 1i sia uno spazio di Hilbert complesso. Definizione 2.16.1 S'ia A un operatore appartenente a 0(1i). Per ogni x E DA, il valore medio d·i A relativo a x è il numero complesso, che 'indichiamo con < A >x, dato da
< A >x== { 11 ; 11 2(xlAx),
.
o
'
X=
E DA - {O}
X
O·
'
l'insiem,e 0(A) dei valori m,edi significativi di A,
0(A) := {x,
x E DA - {O}},
è chiam,ato range numerico di A. Osservazione. La considerazione del valore medio di A anche per x ragioni cli comodità formale.
= Oè
dovuta a
2.16. Valori medi di un operatore
185
Come abbiamo già fatto nel §2.3 nel caso di un A E L(H), possiamo associare anche a un A E O(H) una forma sesquilineare yr,
1
= L 4 < A >Zr; r=l Or
quindi, poiché< A >yrE R,
(xlAx')
= (Axlx'),
Vx, x'
E
DA. ■
Il teorema seguente mostra come, per un A E 0(1-i) simmetrico, la proprietà di limitatezza sia strettamente condizionata dalla limitatezza dell'insieme dei valori medi di A, cioè del range numerico 8(A) e, per un certo verso, può essere considerato come la generalizzazione del teorema 2.3.2. Teorema 2.16.2 Sia A E O(H) simmetrico: 1) A è limitato se e soltanto se
sup {I < A
>x
I}=
xED A
2) se questo è il caso, IIAII =
sup
xED A ,llxll=I
{I < A
SUPxeDA,llxll=I {I
>x
x
I}-
Capitolo 2. Operatori lineari negli spazi di Hilbert
186
Prova. Si procede con ovvie varianti come nella dimostrazione del teorema 2.3.2.
■
È da sottolineare l'espressione particolarmente semplice e significativa che questo teorema fornisce per la norma di un A E 0(1-l) simmetrico quando questo sia limitato (così come il teorema 2.3.2 la fornisce per un operatore autoaggiunto):
IIAII =
sup
xEDA,llxll=I
{I < A
>xl}-
Introducendo, sempre in relazione all'insieme dei valori medi di un A E 0(1-l) simmetrico,
m(A)
:=
inf 8(A),
M(A)
:=
sup 8(A),
dal teorema 2.16.2 abbiamo anche, immediatamente,
IIAII = max{lm(A)I, IM(A)I}, ovviamente se A è limitato. Definizione 2.16.2 Dato un A E 0(1-l) simmetrico, sia x E DA2; la dispersione di A relativa a x è il numero reale non negativo, che indicheremo con .6.xA, dato da
.6.xA :=
J x 1) 2 >x-
Si noti che DcA-:i:1)2 = D A2, che x E D A2 implica x E DA = D e che, essendo < A >x reale, (A- < A >x 1) è simmetrico; quindi la definizione di .6.xA è ben posta e si può scrivere anche
.6.xA =
1
llxll ll(A- < A >x l)xll,
'ix ED A2
-
{O}.
Teorema 2.16.3 Dati A E 0(1-l) e B E 0(1-l) simmetrici, sia x E D A2 D 8 2 n D[A,B], dove [A, B] := AB - BA:
(.6.xA)(.6.xB) >
1 1 < [A, B] >x I2
n
2.17. Operatori di moltiplicazione Prova. Il caso x
= O è banale, supponiamo quindi x =I= O. Abbiamo
-
(LlxA) (LlxB) 1 llxll 2 ll(A- < A >x l)xll ll(B- < B >x l)xll
>
1 llxll 2 l((A- < A >x l)xl(B- < B >x l)x)II
>
1 llxll 2 I Im((A- < A >x l)xl(B- < B >x l)x)I
-
-
187
2
1 llxll 2 l((A- < A >x l)xl(B- < B >x l)x) - ((B- < B >x l)xl(A- < A >x l)x)I
2
1 llxll 2 l(xl(A- < A >x l)(B- < B >x l)x) - (xj(B- < B >x l)(A- < A >x l)x)j
1 llxll 2 l(xl(AB - BA)x)j. ■ 2
La relazione stabilita con il teorema 2.16.3 è la generalizzazione delle ben note relazioni di indeterminazione di Heisenberg che costituiscono uno degli aspetti più fondamentali della Meccanica Quantistica.
2.17
Operatori di moltiplicazione
Avendo incluso nelle nostre considerazioni anche gli operatori non limitati, possiamo estendere la nozione di operatore di moltiplicazione che abbiamo introdotto nel §2.10. Con (X, A,µ) si intenderà ancora uno spazio con misura a-finita, cioè X= UieNXi con Xi E A (disgiunti) e µ(Xi) < oo per ogni i. Data la funzione h : X C misurabile consideriamo --i,
Il sottoinsieme Dh è una varietà lineare di L 2 (X, A,µ) (dalla disuguaglianza di Minkowski segue immediatamente che se f, g E Dh allora f + g E Dh; inoltre è banale vedere che da f E Dh segue kf E Dh per
188
Capitolo 2. Operatori lineari negli spazi di Hilbert
ogni k E K) e possiamo quindi definire l'operatore lineare ( operatore di moltiplicazione per h) Mh := Dh ~ L 2 (X, A,µ),
f
"-"+
Mhf := hf
dove hf è il prodotto di funzioni (hf)(x) := h(x)f(x).
È chiaro che passando da h ad una funzione h' quasi dappertutto uguale ad h nulla cambia nella definizione dell'operatore. Esso quindi dipende in realtà dalla classe di equivalenza di h rispetto alla usuale relazione di equivalenza data dalla uguaglianza quasi dappertutto. Come già più volte convenuto non faremo distinzione grafiche tra la classe di equivalenza e i suoi rappresentativi. Teorema 2 .1 7 .1 Sia Mh l'operatore di moltiplicazione per una funzione misurabile h; esso gode delle seguenti proprietà: a) è densa·mente definito; b) è aggiuntab-ile e il sv,o aggiunto è M h. ; e) è chiuso; d) è continuo se e solo se h E L 00 (X, A,µ) e in tal caso appartiene all'algebra L(L 2 (X, A,µ)) degli operatori continui su L2 (X, A,µ). Prova. a) Sia En := {x E X I lh(x)I < n} con n E N. Allora En ç En+l . .. e X = UneNEn. Sia ora f E L 2 (X, A,µ) e si consideri per ogni n gli elementi fn := XEnf che appartengono, come è immediato verificare, a Dh. La successione {fn} (n E N) converge ad /: si applichi infatti il teorema della convergenza dominata (cfr. teorema A.4.3) alla 2 successione I! - f nl 2 dominata, per esempio, da lf 1 • b) L'aggiuntabilità segue da a). Mostriamo che lvll :> !vfh• : per ogni g E Dh· si ha
Per l'inclusione opposta Mh- :> Nil basterà mostrare che D Mt e Dh·. Sia g E D Mt; h
h
esiste allora g = !vllg E L 2 (X, A , µ) tale che valga (2.29) cioè (2.30)
2.17. Operatori di moltiplicazione
189
Sia ora L 2 (En) il sottospazio di L 2 (X, A,µ) dato da
L 2 (En) := {f E L 2 (X, A,µ) I f(x) = O q.d. perx E En}Dalla 2.30 si ha a maggior ragione
poiché la restrizione (h*g - g)tE" di h*g - g ad En è certamente un elemento di L 2(En), si può interpretare la relazione precedente in termini di prodotto scalare in L 2 (En) :
da cui
(h*g - g) tEn
= O,
(O qui è lo zero dello spazio di Hilbert L 2 (En)). Abbiamo quindi (h*g - g)(x)
=O
q.d. in En.
Data l'arbitrarietà di n avremo allora
(h•g - g)(x)
=O
q.d. in X
e questo implica che h•g stia in L 2 (X,A,µ) (essendo q.d. uguale ad un elemento g di L 2 (X,A,µ)) e quindi g E D1i-. e) Da b) si ha che Mh = (Mh- )t e quindi Mh è chiuso perché ogni aggiunto è un operatore chiuso. d) Se h E L 00 (X, A,µ) il dominio Dh è in tal caso l'intero L 2 (X, A,µ) e l'operatore rientra nel caso trattato nel §2.10 dove si è mostrato che è un operatore di L(L 2 (X, A,µ)). La condizione è dunque sufficiente. Per mostrare la necessità si consideri ora una h : X --+ C misurabile ma non essenzialmente limitata e si considerino per ogni n E N i sottoinsiemi Mn := {x E X In< lh(x)I < n+ l}. Tali insiemi sono misurabili e, passando eventualmente a una sottosuccessione, a misura non nulla (altrimenti h apparterrebbe a L 00 (X, A,µ)). Intersecandoli eventualmente con gli Xi possiamo sempre trovare una successione di sottoinsiemi misurabili Nn con le due proprietà:
µ(Nn) < oo, { n < lh(x)I < n + l, q.d. per x E Nn. Gli elementi fn := µ(Jf..)112 stanno allora in Dh e llfnll = 1 per ogni n. La successione dei trasformati non è però limitata: infatti IIMhfnll > n, per ogni n. L'operatore Mh non può quindi essere continuo. ■
Capitolo 2. Operatori lineari negli spazi di Hilbert
190
Si noti che segue immediatamente dal teorema che Mh è autoaggiunto se e solo se h assume valori reali. Si osservi inoltre che il dominio Dh coincide con il dominio Dh· dell'operatore aggiunto, che Ker Mh = Ker Mh· e che Im Mh = Im Mh•. Veniamo ora all'invertibilità di Mh. Introduciamo la funzione misurabile
.!_ : X~ C h '
_!._(x) = { ,ix> se h(x) f= O h O altrimenti.
Teorema 2.17.2 Per un operatore di moltiplicazione Mh sono equivalenti le
seguenti proprietà: a) Mh è invertibile; b) µ( { X E X I h( X) = o}) = O; c) Im M1i è denso in L 2 (X, A,µ). Se Mh è invertibile il suo inverso è l'operatore di moltiplicazione M¾. Prova. a) b} Poiché
Ker Mh
= {f E Dh Ih(x)f(x) = O
q.d.},
se vale b) segue allora per la legge di annullamento del prodotto che Ker Mh = {f E Dh I f(x) = O q.d.} = {O}, da cui a). Se vale a) e µ( {x E X I h(x) = O}) > O si può sempre considerare un sottoinsieme misurabile E di misura finita e strettamente positiva E e {x E X I h(x) = O} (anche in questo caso intersecando eventualmente {x E X I h(x) = O} con un opportuno Xi); la funzione XE definisce un elemento di L 2 (X,A, µ) non nullo che sta nel nucleo di Mh : infatti IIXEII = µ(E) 1! 2 > O e h(x)xE(x) = O q.d .. a) e) Dalla 6) del teorema 2.14.2 e dalla b} del teorema 2.17.1 si ha
Im(Mh).l
= Ker(Mh· );
poiché vale evidentemente si ha (2.31) da cui l'equivalenza di a} e e). Se Mh è invertibile ImMh = {g E L 2 (X,A,µ) I ì9 E L 2 (X,A,µ)} immediato vedere che (Mh)- 1 = M-k. ■
=
Dt.. È poi
Corollario 2.17.1 Mh è un elemento regolare della C*-algebra L(L2 (X,A,µ))
se e soltanto se h è un elemento regolare della C*-algebra L (X, A,µ). 00
Prova. Segue dal teorema 2.17.2 e dal punto e) del teorema 2.17.1.
■
2.17. Operatori di moltiplicazione
191
L'operatore di posizione Q
Come esempio particolarmente significativo di operatore di moltiplicazione consideriamo il seguente che ha una importanza fondamentale nella Meccanica Quantistica dove rappresenta l'osservabile di posizione di una particella non relativistica in uno spazio monodimensionale. Sia DQ = {f E L2 (R) I JR lxf(x)l 2 dm(x) < oo} e Q :
DQ f
--► -v--►
L2 (R) Qf dove Qf(x)
:=
xf(x).
Q è l'operatore di moltiplicazione per la funzione T : R --► R, r(x) := x. Risulta pertanto autoaggiunto non limitato invertibile e con inverso non l'im,itato. Im Q è denso in L 2 (R) ma non chiuso (altrimenti l'inverso sarebbe
limitato). Più realisticamente si definiscono nello spazio ordinario gli operatori di posizione Qi, i = 1, 2, 3. Sia Di= {f E L2 (R3 ) I JR3 lxif(x)l 2dm(x) < oo }, i= 1, 2, 3; definiamo --►
-v--►
L2(Ra) Q.if dove Qif(x)
:=
Xif(x).
Q.i è quindi l'operatore di moltiplicazione per la funzione r1: R 3 --► R, ri(x) := Xi- Questi operatori hanno le stesse caratteristiche di Q. L'operatore Q può essere introdotto come la chiusura di uno dei seguenti operatori Qv: C~(R) --► L2 (R) f rf --► oppure Qs: S(R) --► L2 (R) f rf. ~
Entrambi questi operatori sono essenzialmente autoaggiunti e la loro chiusura è Q. Proviamo queste affermazioni per Q 5 ; la dimostrazione è analoga per l'altro. Qs è simmetrico: è densamente definito e i suoi valori di aspettazione sono reali. Infatti: 1 (IIQsl) = lllll 1 /.R xll(x)I 2 dm(x) E R, lllll2 2
Vf E S(R), I -f O.
192
Capitolo 2. Operatori lineari negli spazi di Hilbert
Q1 = Q: è immediato mostrare che Q1 :) Q;mostriamo che DQ :) DQ1 · Sia g esiste allora g = Qig in L 2 (R) tale che (Qsflg)
E
DQ1;
= (flg), \:/f E S(R)
e questo implica
L
J•(x)(xg(x) - g(x))dm(x)
= O,
\:/f E C~(R).
La funzione x~xg(x) - g(x) è nelle ipotesi del lemma di DuBois-Reymond (cfr. lemma 2.6.1). Infatti ristretta ad un qualsiasi insieme limitato E e R è un elemento di L 2 (E) e poiché E ha misura finita risulta anche di L 1 (E). Dal lemma abbiamo quindi
xg(x) - g(x)
=O
q.d. in R;
poiché [J E L 2 (R) anche la funzione x~xg(x) è in L 2 (R) e così g E DQ . Passando ora agli aggiunti nella uguaglianza Q1 = Q si ottiene
dove si è tenuto conto della 2) del teorema 2.14.2 e della autoaggiuntezza di Q.
Analoghi risultati si hanno per i Qi.
2.18
Operatori di derivazione in L 2 (a, b)
Sia (a, b) un generico intervallo aperto (eventualmente illimitato, cioè può essere eventualmente a= -oo, b = +oo ). Con An (a,, b), n E N, intenderemo lo spazio lineare delle funzioni f : (a, b) -4 C tali che esistano e siano assolutamente continue le derivate J O esiste C > O tale che
i.
(a,b)
IJ(j) l2 dm < e
i.
IJ(n) l2 dm + e
(a,b)
i.
IJl 2 dm, j = o, 1, ... 'n -
1,
(a,b)
dove l'uguaglianza va inteso anche quando gli integrali sono infiniti. Per la dimostrazione si veda ad esempio [39).
Teorema 2.18.1 Sia f E Wn(a, b); per ogni j
se a = -oo tale limite è nullo. Analoghe proprietà nell'estremo b.
= O, 1, ... , n -
1 esiste finito
Capitolo 2. Operatori lineari negli spazi di Hilbert
194
Prova. Sia e E (a , b) e a > -oo. Per ogni x E (a, b) sarà
da cui
;,~ j ,B si ha g(x) = i f(y)dm(y) + i f(y)dm(y) dove il primo addendo è nullo poiché f E I 1 e il secondo è nullo visto che [o:, ,B] :::, supp f. Le g è dunque a supporto compatto ed essendo evidentemente di classe C00 si ha g E TJ(a, b). È immediato vedere che Pvg = f. Supponiamo ora che In-i = Im p;- 1 e sia J E In; a maggior ragione J E In-I e per l'ipotesi di induzione esiste g E TJ(a,b) tale chef= (-i)n-lg(n-l)_ D'altra parte g E I 1: infatti O=
f la
b
b
xn f(x)dm(x) = (-i)n-lf
xng(n-l)d·m(x) = (-t(-it- 1 f xg(x)dm(x).
la
(a,b)
Allora g = (-i)h' per qualche h E TJ(a,b) e f
= (-ith 1 l'operatore
Po
è simmetrico e
(Pint = pn_ Prova. La simmetria segue dalla densità del dominio e dalla proprietà (JIPijg)
=
{
J*(-itg(n)dm
l(u.,b) n-1
_
L(-l(J•(n-k-l)(b)g(k)(b) -J•(n-k-l)(a)g(k)(a)) k=O
+
(-t(-i)n {
(J*)(n)gdm
J(a,b)
-
f
(it(J(n))*gdm
= (Pfjflg),
VJ,g
E
V(a,b),
J(a,b)
dove si è usata l'integrazione per parti e il fatto chef e g sono a supporto compatto (quindi i termini di bordo dell'integrazione per parti sono nulli). È banale veder che pn e (P.f,)t. Infatti vale la relazione
(JIPng)
= (Pfjflg),
Vf
E
V(a, b),
Vg
E
Wn(a, b)
(anche qui la dimostrazione si fa integrando per parti e osservano che i termini di bordo sono nulli grazie al fatto che f ha supporto compatto). Sia g E D(P.g)t; esiste quindi g E L 2 (a, b) tale che
(Pf,flg)
= (Jlg), Vf
E
V(a, b).
Sia e E ( a, b) e sia h la funzione su (a, b) definita da
(2.32)
2.18. Operatori di derivazione in L 2 (a, b)
197
Per costruzione h E An(a, b) e (-i)nh(n) = g. Facendo uso dell'integrazione per parti nel membro a destra della formula (2.32) si ha
{
lca,b)
(J 1 pn è un operatore autoagg'iunto, P;j è essenzialmente autoaggiunto e la sua chiusura è pn_ Prova. Poiché P,B e pn, da (2.18.2) otteniamo (Pn)t e (P,B)t provare che pn è simmetrico per ottenere che è autoaggiunto. D'altra parte si ha
=
pn_ Basterà quindi
Infatti (Pn flg) = fa(i)n(J•)(n)gdm e integrando per parti e tenendo conto che i termini di bordo sono nulli (cfr. teorema 2.18.1) si ha fa(i)n(J•)gdm = fa(-i)nj•gdm = (JIPng). L'essenziale autoaggiuntezza di Pfj segue da (P,B)t = pn prendendo l'aggiunto. Si ha infatti P,B = (P,B)tt = pn_ ■
Osservazione. Per (a, b) = R e n > 1 si possono introdurre anche gli operatori P5 definì ti come le restrizioni degli operatori pn alla varietà lineare S(R) delle funzioni a decrescenza rapida. Anche P5 è essenzialmente autoaggiunto e la sua chiusura è pn_ Da Pv e Pg si ha pn = .Pv e P5 e da questo pn = P5 (visto che ovviamente da P5 C pn segue Ps C pn).
Anche quando (a, b) =I= R la chiusura di Pv è una restrizione dell'operatore di derivazione pn_ Abbiamo il seguente teorema. Teorema 2.18.4 Sia (a, b) =/= R; per ogni n > 1 la chiusura di Pv è l 'operatore dove
W~(a,b):=
{f E Wn(a,b) I jCi>(a) = O, j = O, 1, ... ,n -1} se a > -oo e b = +oo, {f E Wn(a,b) I j(i)(b) = O, j = O, 1, ... ,n-1} se b < +oo e a = -oo, {f E Wn(a, b) I jCi>(a) = jCi>(b) = O,j =O, ... , n -1} se a>-oo e b< +oo.
In questo caso P0 =/= pn e nessuno di questi due operatori è autoaggiunto; P0 è simmetrico chiuso e si ha:
2.18. Operatori di derivazione in L 2 (a, b)
199
Prova. Poichè Pfs è simmetrico Pfs = (P,B)tt = (pn)t. Mostriamo che P[} mostra facilmente che P'[f e (Pn)t : integrando per parti si ha
(Pò Jlg)
= (JIPng),
= (pn)t. Si
\/f E W~(a, b), \/g E Wn(a, b)
(i termini di bordo che provengono dall'integrazione per parti di (Pò Jlg)
= f
lca,b)
(ir(J•)(n)gdm
sono nulli grazie alla definizione di W~ (a, b)). Mostriamo ora che Dcpn)t e W~(a, b). Da P,B e pn si ha (Pn)t e (P,B)t = pn e quindi sappiamo che (Pn)t è una restrizione dell'operatore di derivazione pn_ Sia g E D(P")ti allora g E Wn(a,b) e (Pn)tg = (-i)ng(n)_ Vale allora (2.35) Integrando per parti il primo membro si ha n-1
(Pn flg)
=
I)-l(J•(n-k-l)(b)g(k)(b) _ J•(n-k-l)(a)g(b)g(k)(b)-J•(n-k-l)(a)g(a))
= O,
\/f E Wn(a,b),
k=O
da cui, vista l'arbitrarietà di f si conclude che deve essere g(k) (b) = O, per k = O, I, ... , n-1 se b < +oo e g(k)(a) = O, per k = O, 1, ... , n-1 se a> -oo; se a= -oo è da f E Wn(-oo, b) si ha (cfr. teorema 2.18.1 j(k)(-oo) = O per k = 0,1, ... ,n-1, quindi in tale caso non c'è nessuna condizione da porre su questo estremo; stessa cosa se b = +oo. In conclusione g E W~(a, b). Da Pò = (Pn)t segue prendendo l'aggiunto (P'[f )t = (Pn)tt = pn (dove si è tenuto conto che pn è chiuso e il doppio aggiunto è la chiusura). ■
Alcuni esempi di operatori di derivazione
Sono importanti nelle applicazioni operatori di derivazione in un intervallo (a, b) con dominio intermedio tra V(a, b) e Wn(a, b), cioè definiti su funzioni
200
Capitolo 2. Operatori lineari negli spazi di Hilbert
con particolari condizioni agli estremi. Si noterà che la variazione del dominio ha conseguenze non banali sulle proprietà dell'operatore a riprova che nella definizione di un operatore è essenziale, oltre alla corrispondenza, la precisazione del dominio. !>
Es. 1. P0 , P, P P0 e P0 P in un intervallo finito (a, b).
Con Po intendiamo l'operatore definito nel teorema 2.18.4 nel caso n = 1. Poiché qui (a, b) è un intervallo finito il suo dominio è
Dp0
=
{f ass. cont. su [a, b], J' E L2 (a, b), f(a) = f(b)
= O}
e ovviamente P0 f = -if', mentre P ha dominio
Dp = {f ass. cont. su [a, b], J' E L2 (a, b)} e ovviamente si ha ancora P f := -i f'. Abbiamo mostrato in 2.18.4 che P0 è un operatore simmetrico chiuso; il suo aggiunto è l'operatore P che non è neppure simmetrico: pt = P0 e P. Veniamo ora a P Po e PoP :
Dpp0
=
{J,f' ass. cont su [a, b], f(a)
=
f(b) = O, J" E L2 (a, b)}
e ovviamente P Pof := - f";
Dp0 p = {J,J' ass. cont su [a,b], J'(a) = J'(b) = O, J" E L2 (a,b)} e ovviamente ancora PoP f := - f". P Po e P0 P sono operatori autoaggiunti. La loro autoaggiuntezza si può provare direttamente oppure utilizzando il fatto che si tratta di prodotti di due operatori che sono l'uno l'aggiunto dell'altro. Per un operatore A E L(rf.) è un facile esercizio provare che l'operatore A t A è un operatore autoaggiunto. Il seguente teorema, che estende il risultato al caso di operatori che siano contemporaneamente chiusi e aggiuntabili, è dovuto a von Neumann. Lo riportiamo qui anche per il suo interesse generale.
Teorema 2.18.5 ( di von Neumann) Sia A E O (1t) un operatore chiuso ·e densamente de.finito; allora l'operatore A t A è autoaggiunto.
2.18. Operatori di derivazione in L2 (a, b)
201
Prova. L'aggiuntabilità di A ci permette di introdurre la seguente decomposizione ortogonale di 'H.+ 'H. (vedi dimostrazione del punto 2) del teorema 2.14.2):
'H.+ 1t =CA+ (V (GAt )).l.L, che, essendo A anche chiuso e V (G A t) un sottospazio, diventa
(2.36)
Per ogni x E 'H., decomponendo (x, O) secondo la (2.36) abbiamo che esistono y E DA e z E DA t tali che (x, O)= (y, Ay) + (-At z, z), cioè
x=y-Afz { Ay = -z;
quindi per ogni x E 'H. esiste y E DA tale che Ay E DA t e che x che Im(l + At A)= 'H..
= y + A t Ay; ciò mostra (2.37)
Mostriamo ora che (I+ A t A) è un operatore invertibile con inverso limitato. Infatti si ha
Il (I+ A t A)yll 2
= IIYll 2 +
2 Re(ylA t Ay) + IIA t Ayll 2 ;
tenendo conto che y E DAtA e DA sarà anche (ylAt Ay)
11(1 + Af A)yll 2
= IIYll 2 +
= (AylAy) = IIAYll 2 e quindi
2
2IIAYll + IIAt Ayll 2 > IIYll 2 ,
Vy E DAtA,
quindi (I+At A) è invertibile con inverso limitato (cfr. osservazione §2.12). Tenendo conto della (2.37) si ha che (I+At A)- 1 E L('H.) . Si vede facilmente che (I+At A)- 1 è un operatore autoaggiunto: indicata con ~(I+AtA)-1 la forma quadratica associata a (I+ At A)- 1 (cfr. §2.3) si ha ~(l+At A)-1 (w)
= (wl(l + At A)- 1w) = ((I+ At A)yly) = (yly) +
Vw E 'H.,
(AylAy) E R,
dove si è usato il fatto che da (2.37) e dall'invertibilità di (I + A t A) per ogni w E 'H. esiste un unico y E DA t A tale che w = (I + A t A) y. La forma quadratica dell'operatore (l+A t A)- 1 risulta hermitiana e quindi l'operatore autoaggiunto (cfr. §2.3). Per il teorema 2.14.1 segue allora che anche l'operatore (I+ A t A) è autoaggiunto e per il punto 2) del teorema 2.14.3 anche A t A è autoaggiunto. ■
t>
Es. 2. L'operatore
b
:=
{f
E
P di derivazione in
(a, b) finito con dominio
L2 (a, b), ass. cont. in (a, b), J'
E
L 2 (a, b), f(a)
=
f(b)}
Capitolo 2. Operatori lineari negli spazi di Hilbert
202 e
pf
:=
-if',
si dice anche operatore di derivazione con condizioni di periodicità al contorno; estende Po ed è autoaggiunto. Anch~ in questo caso mostrare la simmetria è banale; si osservi poi che da Pv e P e dal teorema 2.18.2 si ha (P)t e (Pv)t = P. Quindi se g E D(P)t allora g E W1 (a,b) e (P)fg = (-i)g'. Si procede ora in modo simile a quanto fatto nella dimostrazione del teorema 2.18.4. Da (Fflg) = (Jl(-i)g'), VJ E b si ottiene, integrando per parti il membro a destra A
f*(b)g(b) - f*(a)g(a) = O,
Vf E D
e, tenendo conto della periodicità di f
f*(b)(g(b) - g(a)) e, per l'arbitrarietà di
J,
= O, Vf
ED
si deve avere
g(b) = g(a); A
questo mostra che g E D. Anche gli operatori f>n per ogni intero n giunti.
> 1 sono ovviamente autoag-
Osservazione. L'operatore P si può anche pensare come un operatore di derivazione nello spazio di Hilbert L 2 (T) delle funzioni periodiche di periodo [a, b]; nell'appendice E si è trattato il caso di [a.b] = [O, 21r); in tale caso il dominio b coincide con W(T) ={/E L 2 (T) I Lnez In (uni!) 12 < oo} dove {un} (n E Z) è il s.o.n.c. degli esponenziali e l'operatore P è definito dalla formula
F'f
= L n(unlf) UnnEZ
Es. 3. Po in L 2 (0, +oo). È un esempio di operatore simmetrico non estendibile ad autoaggiunto. Ricordiamo che (cfr. teorema 2.18.4) si tratta di un operatore simmetrico chiuso il cui aggiunto è P. Mostriamo preliminarmente che Im(Po - il) = L2 (0, +oo ): infatti l'equazione
1>
Pof-if
=g
203
2.19. Equivalenza unitaria di Q e P
per un generico termine noto g E L2 (0, +oo) ha una soluzione f E D(Po) data da f (x) = fox ig (y) exp(-(x - y))dm (y) (f è assolutamente continua, f (O) = O e vale f' + f = ig; inoltre f e f' stanno in L2 (0, +oo): infatti f (x) =
L
ig (y) X(o,+oo) (y) 0 (x - y) exp(-(x - y))dm (y),
x>O
dove {) (t) = O per t < O e {) (t) = 1 per t > O; poiché la funzione t -+ 0 (t) exp (-t) sta evidentemente in L 1 (R) et -+ g (t) X[o,+oo) (t) sta in L2 (R) il loro prodotto di convoluzione sta in L 2 (R) (cfr. la (2.13)) e quindi f E L 2 (O, +oo) essendo la restizione di una funzione di L 2 (R); analogamente si mostra che f' E L 2 (0, +oo)). Sia ora A :::> Po una estensione autoaggiunta; sarà allora Im (A - il) = Im (Po - il) = L 2 (0, +oo ). Sia ora f E D (A); esisterà h E D (Pcl) tale che (A - il) f = (Po - il) h; poiché A :::> P0 si ha equivalentemente (A - -il) (f h) = O. Dalla c) del teorema 2.15.1 si ha f = h.
2.19
Equivalenza unitaria di Q e P
Definizione 2.19.1 Due operatori A e B in 0(1i) si dicono unitariamente equivalenti se esiste un operatore unitario U tale che A= U Bu- 1 •
L'equivalenza unitaria fa sì che i due operatori abbiano le stesse caratteristiche topologiche (cioè di continuità, di chiusura, ecc.), di invertibilità, di aggiuntabilità, o di autoaggiuntezza, di simmetria (nel seguito vedremo che anche le proprietà spettrali sono preservate dall'equivalenza unitaria, cfr. teorema 3.1.4). Per quanto riguarda la proprietà di essere continui o chiusi o chiudibili si può mostrare più in generale che due operatori A e B in O(ri) tali che A = F BF- 1 per un F E GL(H) hanno le stesse caratteristiche. Che la continuità di A implichi quella di B e viceversa è immediato. Veniamo alle proprietà di chiusura. Premettiamo un lemma che illustra la relazione tra i grafici di A e B. Se F E GL(ri) allora è immediato vedere che F+F:
1-l+rl (x,y)
--+
1-l + 1-l
-+
(Fx, Fy)
204
Capitolo 2. Operatori lineari negli spazi di Hilbert
sta in G L('Jt + 'Jt). Lemma 2.19.1 Sia G un sottoinsieme di 1t
+ 1t e H
:=
(F
+ F)G, con
FEGL('Jt): 1) G è un grafico lineare se e soltanto se H è un grafico lineare; 2) se G è un grafico lineare, detto A l'operatore corrispondente e B l'operatore corrispondente a H, si ha B = F AF- 1 • Prova. Poichè F+F è lineare e invertibile, H è varietà lineare se e solo se lo è G. Passiamo alla condizione 2) della definizione di grafico lineare (cfr. §2.12): sia H un grafico lineare: se (O, y) E G allora (O, Fy) E H e per la proprietà 2) della definizione di grafico lineare sarà Fy = O, da cui, essendo F invertibile, y = O; quindi anche G è un grafico lineare. Il viceversa si ottiene scambiando i ruoli di G e H. Sia ora G = GA; in tal caso H = {(Fx,FAx),x E DA}= {(Fx,FAF- 1 Fx),x E DA}= {(z,FAF- 1 z),z E DFAF-1} = GFAF-1. Poiché la corrispondenza tra grafici lineari e operatori lineari è biunivoca B = F AF- 1 • ■
Teorema 2.19.1 S ia F E GL(rl) e A, BE 0(7-l), B = F AF- 1 : 1) B è chiuso se e solo se A è chi'uso; 2) B è chiudibile se e solo se A è chiudibile e vale B = F AF- 1 • 1
Prova. Poichè F + F E GL('lt +1t) è un isomorfismo bicontinuo, Ga chiuso se e solo se GA è chiuso e altrimenti Ga = (F + F)GA, ■
= (F + F)GA
è
In particolare nel caso di due operatori A, B E 0(1-f.) unitariamente equivalenti cioè B = F AF- 1 con F unitario, B è chiuso se e solo se A è chiuso, B è chiudibile se e solo se A è chiudibile e vale B = F AF- 1 . Ciò premesso veniamo all'equivalenza unitaria di Q e P, rispettivamente operatore di posizione e operatore di derivazione in L2 (R) che viene chiamato operatore di momento. Ricordiamo la definizione: -► ~
JR
L 2 (R) Qf dove QJ(x)
2
:=
xf(x).
dove DQ := {f E L2 (R)I lxf(x)l dm < oo }; l'operatore Q è un operatore di moltiplicazione per una funzione a valori reali pertanto è autoaggiunto; nel §2.17 abbiamo già visto che la sua restrizione Qs alle funzioni a decrescenza rapida, è essenzialmente autoaggiunto e ha per chiusura Q.
2.19. Equivalenza unitaria di Q e P
P:
Dp f
205
---+
L 2 (R)
-+
Pf:=-if',
dove Dp = W 1(R) = {f E L 2 (R)nA1(R)I f' E L 2 (R)}. Nel teorema 2.18.3 si è visto che P è un operatore autoaggiunto e abbiamo già osservato che Ps, la restrizione di P alle funzioni a decrescenza rapida, è essenzialmente autoaggiunto e ha per chiusura P. Mostriamo ora che Q = ppp-1, dove F è la trasformata di Fourier in L 2 (R). Per ogni f E S(R) sia ha, integrando per parti,
FPJ(k) = ( 1r)1 1/ 2 2
1 R
exp[-ikx](-if'(x))dm(x) = kf(k) = QFJ(k), k E R, A
cioè
Qs = FPsF- 1 • Applicando ora il teorema 2.19.l si ha
Q = ppp-1_ Il commutatore [Q, P] L'operatore [Q, P] := QP - PQ ha come dominio D[Q,PJ = DQP n DPQ· Questo dominio è denso in L2 (R) (contiene infatti certamente la varietà lineare S(R) che è densa in L 2 (R)) ma non coincide con l'intero L2 (R). Per f E D[Q,P] si ha ([Q, P]J)(x) = -ixf(x) +id~ (xf(x)) = if(x),
q.d.,
quindi
[Q, P] = ilrv1Q,PJ • L'operatore di posizione e quello di momento quindi non commutano. Questo fatto che nel formalismo degli spazi di Hilbert è una deduzione matematica costituisce l'espressione formale del principio di indeterminazione tra l'osservabile di posizione e l'osservabile di momento in Meccanica Quantistica. Infatti (cfr. teorema 2.16.3) per il prodotto delle dispersioni si ha 1 (~1Q)(~1P) > 2·
206
Capitolo 2. Operatori lineari negli spazi di Hilbert
2.20
Operatori di derivazione in L 2 (Rd) a coefficienti costanti
L'equivalenza unitaria degli operatori Q e P (cfr. §2.19) si estende ai polinomi in Q e P rispettivamente. Sia p un polinomio di grado n in una variabile:
p(t) = ao
+ a1t + ... + antn;
ad esso possiamo associare l'operatore di moltiplicazione
Mp : Dp ~ L2 (R) e Dp
f--+ pf, dove (pf)(t) = p(t)J(t)
= {J E L2 (R) I pf E L2 (R)}
che altro non è che l'operatore
p(Q) = ao + a1Q + ... + anQn, dove Q è l'operatore di posizione, e l'operatore di derivazione a coefficienti costanti p(P) = ao + a1P + ... + anPn, dove P è l'operatore di momento. Dalla equivalenza unitaria di Q e Psi ha
p(Q)
= Fp(P)F- 1.
Infatti l'equivalenza unitaria di Q con P si estende alle potenze n-esime di questi operatori: Qn = ppnp-1
(Qn
= QQ ... Q = FQF- 1 FQF- 1 ••• FQF- 1 = ppnp- 1 ) e alle somme. "-v--' n volte
n volte
Ovviamente l'operatore p(P) è chiuso, aggiuntabile e il suo aggiunto è p*(P). Osservazione. Si ricordi che le uguaglianze Qn = ppnp- 1 e pn = p-lQnF significano anche uguaglianza dei domini; questo permette di caratterizzare il dominio di p( P) in termini delle trasformate di Fourier dei suoi elementi: Dp(P)
-
{J E L2 (R) IFf
= {f E L2 (R)l
l
E Dp(Q)}
jp(k)Ff(k)j 2 dm(k) < oo}.
2.20. Operatori di derivazione in L2 (Rd) a coefficienti costanti
207
Ad esempio la trasformata di Fourier di una funzione g E L2 (R) tale che JR lxng(x)j 2 dm(x) < oo è allora una funzione di classe Wn(R) e viceversa; analogamente la trasformata di Fourier di una funzione g E L2 (R) che si annulla al di fuori di un intervallo finito di R è una funzione di C°') (R). Quanto finora detto per gli operatori differenziali suggerisce un modo rapido di definizione degli operatori di derivazione lineari a coefficienti costanti in L 2 (Rd), d intero d > l. Sia p un polinomio in d variabili di grado n :
L c xf
p(x) =p(x1, ... , xd) :=
1
0
•••
x~d, con a= (a1, ... , ad) E Nd.
lol~n
dove lai = a1 + ... + ad è la lunghezza del multiindice a e c0 sono dei coefficienti numerici (in C) e come d'uso x = (x 1 , . . . , xd)A psi associa l'operatore di moltiplicazione Mp il cui dominio è
Dp
:=
{f
E
L2 (Rd)lpf
E
L2 (Rd)}
e l'operatore VP := p-I MpF che è definito quindi su
{f
E
L2 (Rd)IFJ E Dp(Q)} = {f E L2 (Rd)I
r jp(k)Ff(k)l dm(k) < oo} }Rd 2
Le proprietà di VP si "leggono" sull'operatore di moltiplicazione ad esso associato Mp. Quindi VP è un operatore chiuso, è autoaggiunto se e solo se p assume valori reali è invertibile se e solo se Im VP è denso ecc. (cfr. §2.17). A buona ragione Vp è considerato un operatore di derivazione lineare a coefficienti costanti. Sia infatti M-p.5 la restrizione di Mp alla varietà lineare S(Rd); M-p.5 è chiudibile e la sua chiusura è Mp. Sia Vps = p- 1 M-p.5F. Applicando le proprietà della trasformata di Fourier su S(Rd) si ha - ~ . lol (V-p.5f)(x1, .. · ,xd) - .L...t (i) Caa lol~n
alol 01
Xi
.•.
a odf(x1, .. · ,xd),
d
f E S(R ).
Xd
(2.38) L'operatore Vp è allora la chiusura di V-p.5 e viene scritto come nella formula (2.38). Ad esempio il Laplaciano viene indicato con 6.2f=-
a2
a2
8 X1
8 Xd
2f- ... -
2f
208
Capitolo 2. Operatori lineari negli spazi di Hilbert
e si intende l'operatore autoaggiunto
dove stavolta p è il polinomio p(k1, ... , kdJ :=kf + ... + k~ e D.6.2 = {f E L2 (Rd)I JR(kr +,., + k~)l(FJ)(k1,,, ·, kd)I dm(k1, .. ,, kd) < +oo} .
Osservazione. Si potrebbero anche introdurre gli operatori di derivazione parziale 88Xi. e caratterizzarne il dominio in termini di funzioni derivabili e assolutamente continue rispetto alla variabile Xi, in analogia a quanto fatto per il dominio dell' operatore P in L2 (R), e poi introdurre gli operatori VP come composizione dei 8 in molte circostanze tuttavia non occorre sapere di più di quanto abbiamo detto sulla effettiva derivabilità delle funzioni del dominio di VP.
:i;
2.21
Gli operatori di creazione e di annichilazione
Nella fisica delle particelle elementari si deve costruire uno spazio di Hilbert che permetta di descrivere la creazione e la distruzione di particelle. Qui diamo l'esempio più semplice di un tale spazio, lo spazio di Fock, che è costruito a partire da uno spazio di Hilbert 'li-spazio di particella-singola facendo la somma diretta dei prodotti tensoriali simmetrici e antisimmetrici di 1i. Si ottengono così lo spazio di Fock simmetrico (per particelle identiche bosoniche) e lo spazio di Fock antisimmetrico (per particelle identiche fermioniche). In questi due spazi costruiremo gli operatori di annichilazione e di creazione. Per ulteriori approfondimenti sull'argomento rimandiamo ad un buon testo di teoria dei campi; per l'aspetto più propriamente matematico citamo [7].
Prodotti tensoriali (simmetrici e antisimmetrici) di uno spazio di Hilbert. Dato uno spazio di Hilbert 1i (anche di dimensione non finita) consideriamo lo spazio di Hilbert ®PJi, potenza tensoriale p-esima di 1i (cfr. §1.24). In
209
2.21. Gli operatori di creazione e di annichilazione
rg;P'H, si individuano i due sottospazi (cioè varietà lineari chiuse) dei tensori
simmetrici e dei tensori antisimmetrici di grado p che denotiamo con ®~ 1i, e ®~ ri. Questi sono la chiusura, nello spazio di Hilbert (g)P'H,, delle due varietà lineari generate da quegli elementi u 1 ® ... ®up decomponibili che soddisfano le relazioni U1 @ ... @ Up = Uc;(l} @ ... @ Uu(p) Va E S[p] e Ut
® ...
®Up= éuUu(l}
® ... ®
Uu(p)
Va E S[p],
rispettivamente (co-, ricordiamo, è la segnatura della permutazione a). In ®Pri l'operatore Uu definito sui decomponibili come Uo-(u 1 ® ... ® up) = Uu(I} ® ... ® Uu(p) per ogni permutazione a di S[p] si estende ad un isomorfismo di 1i, in se stesso e gli operatori lineari Sp = ;, I::ueS[p] Uu e Ap = ;, I::ueS(p] éuUo- q si estendono a proiettori ortogonali. Il sottospazio ®~ri è costituito dagli elementi t di ®Pri tali che
il sottospazio ®~ 1i, è costituito dagli elementi t di (g)P'H, tali che
e Sp e AP sono i corrispondenti proiettori ortogonali. Se {ui} (i E N) è un s.o.n.c. di 1i, la collezione formata da
è un s.o.n.c. in ®~ 1i, ( che è uno spazio di Hilbert con il prodotto scalare ereditato da (g)P'H,). Analogamente è un s.o.n.c. in ®~ 1-i la collezione
u;-:; dove
nk
2 ••. ip
=
✓:-k nk. Sp('Ui, ® U;_, ... ® U;p), 1
i1
< i2 < ... < ip
è il numero di volte in cui l'elemento 'Uik viene ripetuto nell'elemento
Ui 1 (g) 'Ui2 · · · @ Uip ·
Per questi due s.o.n.c. si usa anche una indicizzazione via i cosiddetti numeri di occupazione. Se uk è un elemento del s.o.n.c. { ui} (i E N) di 1-i
210
Capitolo 2. Operatori lineari negli spazi di Hilbert
si dice numero di occupazione di Uk il numero nk di volte in cui l'elemento Uk compare nell'elemento decomponibile Ui 1 ® Ui2 ••• ® 'Ui.p. I due s.o.n.c. si possono esprimere, nel caso simmetrico, anche come
nk
volte
dove i numeri di occupazione possono variare da zero a p e Lk nk = p, e, nel caso antisimmetrico, come
n1
volte
nk
volte
dove i numeri di occupazione nk sono soltanto o zero o uno e ancora Lk nk = p. Si noti anche che se 1i non ha dimensione finita gli spazi ®~ 1i non sono banali, e sono anzi infinito dimensionali, per qualsiasi p > O. Questi spazi hanno una notevole importanza in Meccanica Quantistica. Se 1i è lo spazio di Hilbert in cui si descrive una particella singola allora lo spazio ®~1i è lo spazio in cui si descrive un sistema di p particelle identiche se queste ubbidiscono alla statistica di Base-Einstein (sono dette perciò bosoni) mentre®~ 1i è lo spazio di Hilbert in cui si descrive un sistema di p particelle identiche se queste ubbidiscono alla statistica di Fermi-Dirac (e sono dette fermioni). L'elemento u~ 1n 2 ...nk··· rappresenta-nello spazio degli stati a p particelle-uno stato formato da n 1 particelle nello stato u 1 , n 2 particelle nello stato 'U2 e così via; analoga interpretazione ha u~1n 2 ...nk···. Diamo ora concretamente lo spazio dei tensori simmetrici e antisimmetrici per 1i = L2 (Rd) anche se questo esempio è solo didatticamente significativo (gli spazi di Hilbert usati nella Meccanica Quantistica sono più complessi). Indichiamo con L1(Rd·p) il sottospazio di L 2 (Rd) delle (classi di equivalenza di) funzioni completamente simmetriche, cioè tali che f (x 1 , x 2 , ••• , xp)
= J(~(I), ~(:i), ... , ~(p)),
dove indichiamo con x la d-upla (x 1 , x 2, ... , xd) di R d.
Va E S[p],
211
2.21. Gli operatori di creazione e di annichilazione
Indichiamo con L~ (Rd·p) il sottospazio di L2 (Rd) delle (classi cli equivalenza di) funzioni completamente antisimmetriche, cioè tali che f(x 1, X2, ... , xp) =
éuf(~(I), ~( 2 ), ...
,~(p)),
Va E S(p).
Abbiamo il seguente teorema. Teorema 2.21.1 Sia 1-i
= L2 (Rd), d e p interi strettamente posit-ivi.
i} Lo spazio L2 (Rd·p) è il prodotto tensoriale (g)P :
L 2 (Rd)
X
L2 (Rd)
X ...
(g)P'}-{,
e la applicazione
L 2 (Rd) ~ L 2 (Rd·p)
p volte
è definita ponendo ®P(f1, f2, . .. , fp) = !1 ® !2 ® ... ® fp dove
(!1 ® !2 ® ... ® fp)(x1, x2, ... 23..P) = !1 (x1)J2(x2) • .. fp(xp) per ogni x 1 , x 2 , •.. , xP E Rd. ii} Lo spazio L~ (Rd·p) è lo spazio ®~ 1-i dei tensori simmetrici di grado p. ii'i} Lo spazio L~(Rd·p) è lo spazio ®~1-i dei tensori antisimmetrici di grado p. Prova. i) Vedi Es. 1 §1.2.
ii) Mostriamo che®~ 1t CL~ (Rd·P). Se f = li ® h © ... ® fv è immediato verificare che Avf E L~ (Rd·P). Poiché L~ (Rd·p) è un sottospazio sarà Im Ap = ©~ 1t CL~ (Rd·v). Sia ora f E L~ (Rd·P) e f ortogonale a©~ ?-t. Questo implica
r
f*(x1,~2,···,xp)(~
}R"·P
L
éufu(1)(x1)fu(2)(X2) ... fu(p)(xp))dm(x1,X2,···,xp)
=0
p. uES[p]
per ogni li, ... , Jp E L 2 (Rd). Utilizzando l'antisimmetria di f la relazione precedente diventa
r
}Ra•p
1· (x1' X2, •.• 'xp)!i (xi )h(x2) ... Jp(xp)dm(x1' X2, ... 'xp) = o,
'vfi, ... , fv
E
L2 (Rd)
cioè che f è ortogonale a tutti gli elementi separabili e dal punto i) segue chef= O. La dimostrazione di iii) è analoga a quella di ii). ■
Osservazione. Usando la definizione di misura prodotto e la versione generale del teorema di Fubini-Tonelli per le misure a-finite e complete (cfr. A.6)
212
Capitolo 2. Operatori lineari negli spazi di Hilbert
si può affermare, in generale, che, se 1t = L 2 (X,A,µ), dove (X,A,µ) è uno spazio con misura o--finita e completa, allora
fil1t = L 2 (X
X
X
X ... X
X,
À X À X ... X
p-volte
A,f Xµ
X ...
Xµ)
'v
p volte
p volte
e che gli spazi dei tensori simmetrici e antisimmetrici di 1t di grado p sono i sottospazi L~(X x Xx ... x X, A x A x ... x A,p x µ x ... x µ) ed V
p~~
p-~~
p~~
L~ (X x X x ... x X , A x A x ... x A, f x µ x ... x µ) delle funzioni comv
p-volte
p volte
p volte
pletamente simmetriche e di quelle completamente antisimmetriche, rispettivamente. Gli spazi di Fock Gli spazi di Fock sono esempi non banali di somma diretta hilbertiana di spazi di Hilbert. Rimandiamo per la definizione di quest'ultima al §1.20 di cui adotteremo le notazioni. Sia 1t uno spazio di Hilbert e si ponga H(p) = ®P1f. per ogni p E N. Allora F = L~o ®P1f. è lo spaz'io dei tensori di 1t. Se {uk} (k E N) è un s.o.n.c. in 1t allora il sistema {Ui 1 ® Ui2 ® ... ® ui 1,, i1,i2, ... ,'ip E N, p E N} U {1} è un s.o.n.c. in F (si noti che 1 E C è un s.o.n.c. in @ 0 1t =C). É evidente che si tratta di un s.o.n.; per la completezza si consideri E F che sia ortogonale a tutti gli elementi del sistema; ne segue che per ogni p p E {u.i 1 ® U.i 2
da cui p
= Op,
•••
® ui,,, i1, i2, ... , ip E N}l.
tip (qui Ov denota lo zero di ®P1t).
Lo spazio di Fock simmetrico S Sia 1t uno spazio di Hilbert e si ponga H (p) = ®~1t per ogni p E N. Ricordiamo che ®~1t indica lo spazio dei tensori simmetrici su 1t. Lo spazio S = I:':o ®~1t è detto spazio di Fock simmetrico (o bosonico). Se {'uk} (k E N) èuns.o.n.c. in 1t allora {u~ 1,n2 , ... nk,···' n1,n2,••·nk,··· E N} U {1}, dove nk è il numero di occupazione di uk, è un s.o.n.c. in S. Il vettore 1 viene anche detto "vuoto" dello spazio S. La terminologia è legata al fatto che in questo spazio di Hilbert si possono ambientare gli stati rappresentanti infinite particelle identiche bosoniche.
213
2.21. Gli operatori di creazione e di annichilazione Lo spazio di Fock antisimmetrico
Sia 1i uno spazio di Hilbert e si ponga H(p) = 0~1i per ogni p E N. Ricordiamo che 0~ 1i indica lo spazio dei tensori antisimmetrici su ri. Lo spazio A = I::o 0~1i è detto spazio di Fock antisimmetrico (o fermionico). Se {uk} (k E N) è un s.o.n.c. in 1i allora {-u~ 1,n2, ...nk,· .. ' n1, n2, ... nk, ... E N} U { 1}, dove nk è il numero di occupazione di 'Uk, è un s.o.n.c. in A. Il vettore 1 viene anche detto "vuoto" dello spazio A. La terminologia è legata al fatto che in questo spazio di Hilbert si possono ambientare gli stati rappresentanti infinite particelle identiche fermioniche. Operatori di creazione e distruzione nello spazio di Fock simmetrico
Ad ogni f E 1i associamo per ogni intero p > Ol'operatore b;(f) così definito:
ba(f) : 0°H =e---+ e,
k--+ bo(f)k
=
o, P = o
b;(f) : 0P1-f.---+ 0P- 11-f., b;(f)(f1 0 !2 0 ... 0 Jp) := (Jlf1)!2 0 ... 0 fp, P < 1. In modo analogo si definisce per ogni intero p > O l'operatore b;(f)
Queste due famiglie di operatori definiscono due operatori limitati su F
Verifichiamo che si tratta di operatori che sono uno l'aggiunto dell'altro: per ogni pl'l/Jp+l) p=O
00
L (c/>plb;+l (f)'l/Jp+i) p=O
Vogliamo ora per mezzo di b;(f) e di b;(f) costruire gli operatori di creazione e di annichilazione negli spazi di Fock simmetrico e antisimmetrico. Inizieremo con il caso simmetrico.
Capitolo 2. Operatori lineari negli spazi di Hilbert
214
Per ogni p intero e positivo sia SP il simmetrizzatore su ®Prl cioè il proiettore
su D :=
{4> E FI L~oPll4>Pll 2 < oo} stt:
Im
D-+ F,
q>
-v-+
introduciamo l'operatore
stt4> dove (Stt)p
:= p112 Spp-
stt e Se l'operatore stt è autoaggiunto .
La verifica dell'aggiuntezza è immediata: si tratta evidentemente di un operatore simmetrico; mostriamo che Dcs=)t e D. Sia 'I/; E Dcs=)ti allora (S~l'I/J)
= (I~),
V ED,
dove ~ = ( su) t 'I/;. In particolare prendendo E ®P?-f. ( cioè p' maggior ragione (plf2Sppl'I/Jp) = (pl~p), V E ®P?-f. da _~ui per l'autoaggiuntezza di Sp si ha ~P
= O per p'
=j; p) si ha a
= p112Sp'l/;p, Data l'arbitrarietà di p segue~=
snv;. Diciamo operatore di annichilazione (per J) l'operatore
dove n- = DnS. Diciamo operazione di creazione (per J) l'operatore
a+(j) : n+ e S-+ S,
a+(J)
:=
SQb+(J),
dove n+ ={v E L2 (Rpd) completamente simmetriche; i due operatori prendono la seguente forma sui settori ®~1i
dove
xi significa che la variabile viene omessa.
Le regole di commutazione Sia {uk} (k E N) un s.o.n.c. in 1i e sia {u~1,n2,...nk, ... , n1, n2, ... , nk, ... E N} U { 1} il s.o.n.c. nello spazio di Fock simmetrico S ad esso associato. Denotando per brevità at := a+(uk) e a-;; := a-(uk) si ha per ogni k a;l a;u~1,n2,, .. nk, .. ,
-
atu~1,n2, ...nk, ... -
(2.39)
O (nk) (nk
112
U~1,n2, ... nk-l, ...
+ l) 112 u~1,n2, ...nk+1, ...
Queste relazioni valgono purché ovviamente gli indici nk rimangono positivi. Allargando la famiglia {u~ 1 ,n2 , ... ,nk ,... , n 1, n2, ... , nk, ... E N} agli indici negativi adottando la convenzione che u~ 1 ,n2, ...nk,··· = O se qualche indice nk è negativo (non si ha più ovviamente un s.o.n.) le formule qui sopra continuano ad avere senso. Si noti che l'applicazione ripetuta degli operatori di creazione al vettore 1 (lo stato di vuoto) permette di ricostruire tutti gli elementi del sistema ( a meno di coefficienti). È allora quasi evidente perché questi operatori hanno il nome di "operatori di creazione" e i loro aggiunti di "operatori di annichilazione". Denotiamo con [A, la chiusura del commutatore di due operatori A e
B.
Br
Teorema 2.21.3 Per k, k' E N i commutatori [a;;, a;,], [at, at,] e [a;, at,] sono densamente defin'iti e chiud'ib'il'i e valgono le relazion'i
216
Capitolo 2. Operatori lineari negli spazi di Hilbert
a) [aj;, a;,r
= [at, at,]- = O; b) [a;;, atr = 8k,k' 1.
Prova. b) Poichè [a;;, at,] è la somma di due operatori autoaggiunti è certamente simme-
trico quindi chiudibile. Si noti inoltre che [a;;, at,]u~ 1,n 2.... nk,••· = u~ 1,n2 .... nk,· .. per ogni n1, ... , nk, ... E N da cui l'asserto. a) [a;;, a;,] è densamente definito; basta pensare che il suo dominio contiene il s.o.n.c. {u.~1 ,n 2 , ... n1c,, .. , n1,n2, ... ,nk, ... E N} U {1}. È un operatore chiudibile: sia n ~ O una successione nel suo dominio sia [a;, a;;, ]n ~ '1/J. Per definizione del prodotto scalare e della norma nella somma diretta si ha a maggior ragione ([a;, ]n )p ~ '1/Jp per ogni intero positivo p. Ristretti ai settori ®~1t gli operatori a;; e a;, sono limitati e definiti su ®~1t quindi chiusi; ne segue che '1/Jp = O. Per l'arbitrarietà di p segue che 'I/; = O. Mostrata la chiudibilità si ha l'asserto controllando che [a;;, a;;, ]u.~ 1 ,n 2.... nk, .. . = O per ogni n1, ... , nk, ... E N. La dimostrazione di [at, = O segue in modo analogo. ■
a;;,
at, ]-
Siano, per ogni k E N,
Pk
dove la barra indica la chiusura dell'operatore. Vale il seguente teorema. Teorema 2.21.4 Gi'i operatori Qk e Pk sono autoaggiunti e [qk,Pk'], [qk, qk,], [pk, Pk'] sono densamente definiti e chiudibili e vale (2.40) Prova. Gli operatori ½(at +a;;) e ½(at- a;;) sono densamente definiti e simmetrici dato che at e a;; sono uno l'aggiunto dell'altro. lviostreremo ora che i loro indici di difetto sono nulli quindi essi sono essenzialmente autoaggiunti. Facciamo, senza sostanziale perdita di generalità, la dimostrazione per k = 1. Indichiamo per brevità con N± := Im(i(at - a 1) =F il).L e mostriamo che N± = {O}. Sia 'I/; E N + e 'I/; =/- O. Allora (2.41)
2.21. Gli operatori di creazione e di annichilazione Posto 'I/Jn 1,...,nk,···
217
= ('lf;ju.~1,... nk ...) , dalla (2.41) si ottiene la formula di ricorrenza
Poiché ci sarà un coefficiente del tipo 'I/Jo,n 1 , ••• ,nk,··· -# O possiamo supporlo uguale a 1 e, utilizzando la (2.42) ottenere che 'I/Jn 1,... ,nk,··· > 1, per ogni n 1 E N. Questo contraddice il fatto che 1/; E S. Per mostrare che N _ = {O} si utilizza sostanziamente la stessa dimostrazione sostituendovi il s.o.n.
{(-t
1
u~i, .. ,,nk, ••·} ·
Per l'essenziale autoaggiuntezza dell'altro operatore, ½(at modo analogo che Im ((at
+ a;;) =l= i).i= {O} 1
+ a;;),
si può mostrare in
ricorrendo stavolta ai s.o.n. 1
{ (if u~ 1 , ... ,n,.,, ... } e { (-it u~ 1 , •• • ,nk,••·} •
Quel che resta da mostrare è banale.
■
Le regole di commutazione (2.40) soddisfatte dagli operatori gono dette regole di commutazione canoniche ( CCR).
Qk
e Pk ven-
Siano orafe g due generici vettori in 1t. Diamo ora le regole di commutazione per a± (f) e a± (g). Vale il teorema seguente. Teorema 2.21.5 Siano k 1 , k2 E C, f, g E 1t; valgono:
1} a+ (k1f + k2g) = k1a+ (f) + k2a+ (g); 2} a- (k1f + k2g) = kta- (f) + k2(g). I commutatori tra a± (f) e a± (g) sono densamente definiti e chiudibili e valgono le relazioni _ _ 3} [a- (f), a- (g)]_ = [a+ (f), a+ (g)] = O; 4) [a-(f),a+(g)] = (flg)I. -------Gli operatori q (f) := ~ ( a+ (f) + a- (f)) e p (!) := "72 (a+ (!) - a- (f)) sono autoaggiunti, i loro commutatori sono densamente definiti e chiudibili e soddisfano: 6) [q (!), q (g)f = fp (!) ,P (g)f = ½((flg) - (g Ili)) l; 7) [q (f) ,P (g)f = ½((flg) + (glf)) ·
218
Capitolo 2. Operatori lineari negli spazi di Hilbert
Prova. La dimostrazione . di 1) e 2) segue immediatamente dalla definizione. Se f e g sono multipli uno dell'altro le rimanenti proprietà dei commutatori sono banali. In caso contrario si consideri un s.o.n.c {u 1 , u 2 } nel sottospazio bidimensionale generato da f e g. Scritti ora f = k 1 v.1 + k2u2 e g = k1 u1 + k2u2, per stabilire le proprietà 3)- 7) ci si rifa a quelle di e Qi, Pi, i = 1, 2, stabilite nei teoremi 2.21.3 e 2.21.4. ■
a;
Gli operatori di creazione e di annichilazione nello spazio di Fock antisimmetrico
Nelle spazio di Fock antisimmetrico A si possono definire operatori di creazione e di annichilazione con un procedimento analogo sostituendo, nelle definizioni di a± (f) i proiettori Av sul sottospazio dei tensori antisimmetrici al posto dei proiettori Sv. Si ottengono operatori densamente definiti e che sono uno l'aggiunto dell'altro. Al s.o.n.c. {uk} (k E N) di 1i si può anche in questo caso associare la famiglia degli operatori at := a± (uk) e definire, in modo analogo a quanto fatto nel caso bosonico, la famiglia degli operatori Qk e Pk· Questi soddisfano stavolta alle relazioni (2.43)
[qk,Qk 1 ]+ [qk, Pk]~
-
Vk k'
'
dove il segno [A, B]+ := AB + BA è detto anticommutatore; le relazioni di anticommutazione (2.43) vengono dette regole di anticommutazione canoniche (CAR). L'operatore numero
Siano at e a,; gli operatori di creazione e di annichilazione relativi ad uk che abbiamo introdotto nello spazio di Fock simmetrico oppure gli analoghi che si possono introdurre nello spazio di Fock antisimmetrico. All'operatore Nk := at a,; viene dato il nome di operatore numero relativo allo stato uk. Il nome è giustificato dalla seguente proprietà (che si deduce immediatamente dalle formule (2.39)):
per ogni u~1•... ,uk,··· ( il simbolo nel caso antisimmetrico).
6,.
sta per la V nel caso simmetrico e per la /\
2.21. Gli operatori di creazione e di annichilazione
219
Nk è un operatore autoaggiunto: per quanto visto nel teorema 2.21.2 si tratta del prodotto di un operatore chiuso e aggiuntabile con il proprio aggiunto e pertanto si tratta di un operatore autoaggiunto (cfr. il teorema di von Neumann §2.18). È facile vedere che si ha [Nk, Nk,] = O per ogni k, k' E N; questo suggerisce di poter fare la somma N = Lk Nk ottenendo ancora un operatore autoaggiunto; si procede nel seguente modo. Sulla varietà lineare V := v' {u~1 •••• ,ui., ... } generata dal s.o.n.c. {u~1 •••• ,ui., .. . } si definisce l'operatore ,.,
N:
V
~
S (o A)
x
-+
Nx = L
(u~1, ... ,uk,···lx)
(Lk nk) u~1,••·,uk,···
Si mostra facilmente che N è un operatore simmetrico essenzialmente autoaggiunto: la simmetria è immediatamente dimostrata visto che (Nxlx) =
Lk nkl (u~
1
••••
,uk, ...lx)
2
1
x E V; l'essenziale autoaggiuntezza Im (N ± il) da cui segue Im (N ± il) = S
E R, per ogni
_segue dal fatto che {u~1 , ••• ,uk,·•.} C (o A). La sua chiusura, indicata con N = Lk Nk, è un operatore autoaggiunto che viene a buona ragione chiamato operatore n'umero. In effetti il suo valore medio sugli elementi del s.o.n.c. { u~1 , ••• ,uk,··.} è la somma dei numeri di occupazione.
220
Capitolo 2. Operatori lineari negli spazi di Hilbert
Capitolo 3 Introduzione alla teoria spettrale in uno spazio di Hilbert Non è tanto paradossale quanto può sembrare affermare che, per un operatore A E O (rl) , le questioni riguardanti l'inverso A- 1 sono più importanti dell'operatore A stesso. In effetti, come è vero che un operatore lineare A caratterizza, insieme con i dati, un'equazione lineare ambientata in 1-{, è vero anche che esistenza e unicità, così come altre proprietà specifiche delle soluzioni, sono caratterizzate dalla invertibilità di A e dalle proprietà dell'inverso A-1. Tipicamente le equazioni lineari che più di frequente si incontrano nelle applicazioni sono della forma
(,,\ -A) x = x 0
,
(3.1)
dove x 0 è il dato e,,\ è un parametro numerico, sicché invertibilità e proprietà dell'inverso riguardano l'operatore ,,\ - A (qui e nel seguito, in espressioni analoghe, ,,\ - A sta per ,,\l - A). L'operatore ,,\ - A è evidentemente stretto parente dell'operatore A ed effettivamente, anche al di là della discussione dell'equazione 3.1, lo studio della struttura di A dipende in modo determinante dal comportamento di ,,\-A al variare di,,\. È proprio il comportamento di ,,\ - A al variare di ,,\ l'oggetto della teoria spettrale.
È ovvio, da un lato, che una teoria spettrale in uno spazio 1-{ banale, cioè in uno spazio 1-{ = {O}, è completamente priva di significato; è facilmente 221
222
Capitolo 3. Teoria spettrale
intuibile, dall'altro, che il difetto di completezza algebrica del campo K può ostacolare determinati sviluppi della teoria. Prima di dare inizio alla trattazione formuliamo, quindi, la convenzione seguente cui ci atterremo in tutto il capitolo.
CONVENZIONE. 1i è uno spazio di Hilbert complesso non banale; cioè: K = C ( e quindi il parametro numerico À è un parametro complesso) e 1 < dim 1i < N0 (ricordiamo che già nel Cap. I abbiamo convenuto di includere nella definizione di spazio di Hilbert la proprietà di separabilità).
3.1
Concetti generali della teoria spettrale
Dedichiamo questo paragrafo alle definizioni generali della teoria spettrale e ai teoremi fondamentali riguardanti gli oggetti introdotti con queste definizioni. Definizione 3.1.1 Dato un operatore lineare A E 0(1-i), si associano ad A i due sottoinsiemi di C : p (A) := { À E C
I :3 (À -
a(A)
(complemento di p(A) in C};
:=
cp(A)
A)-
1
ed è continuo, Im (À - A) =
1i}
p (A) e a (A) sono chiamati, rispettivamente, insieme risolvente e spettro di A.
Dalle brevi considerazioni premesse al paragrafo è evidente che conviene introdurre opportune classificazioni dei punti dell'insieme risolvente p (A) e dello spettro a (A). Per i punti di p (A) la classificazione è praticamente ovvia: p (A)
= p' (A) Up" (A),
con p' (A) .- { À E p (A) I Im ( À - A) = 1-f.} , p" (A) .- { À E p (A) IIm ( À - A) # 1-i} .
3.1. Concetti generali della teoria spettrale
223
Ovviamente p' (A) n p" (A)= 0. Per i punti di O, esiste in DA un x -/= O tale che
li (.X -
A)
xli
.' E C tale che I>. - >.'I< 1 /Il(>. - A)- 1 Il appartiene a p (A); infatti: • sia x E DA, allora (>.' - A) x = (>. - A) x - (>. - >.') x , cosicché
Il(>.' - A) xli > Il (>. - A) xli - I>.' - >.i llxll
3.1. Concetti generali della teoria spettrale
225
e quindi
donde
ciò mostra, poiché
Il( >,.' - A) xli > 1 - I>..' - >..I Il(>.. -1 A)-1 11 llxll· Il(>.. - A)- Il ' I>..' - >..I< 1 /Il(>.. - A)- 1 Il, che (>..' - A)- 1 esiste ed è continuo;
• Im (>..' - A) è un sottospazio di 1-t; supposto Im (>..' - A) # rt, esiste in 1t un ·u. con norma llull = 1 e ortogonale a Im (>..' - A) (cfr. teorema 1.16.1); presa una successione {un} di elementi di Im (>.. - A) tale che v.n -. u (Im (>.. - A) è denso in 1-t!), poniamo Xn = (>.. - A)- 1 u.n; allora
Il(>..' -
ora,
(ul (>..' -
A) Xn) 1
A) Xn - (>.. - A) Xn Il
- I>..' - >..I llxnll - I>..' - >..I Il(>.. - A)-l Unii < I>..' - >..I Il (>.. - A)- 1 11 llun Il;
= O e quindi < llu-(>..'-A)xnll < llu - (>.. - A) Xnll +Il(>.. - A) Xn - (>..' - A) Xnll < llu - unii+ I>..' - >..I Il(>.. - A)- 1 11 llunll;
passando al limi te per n -. oo otteniamo
~ 1 / Il(>.. - A)- Il; si è quindi dimostrato che X tale che I>..' - >..I < 1 / 1 Il(>.. - A)- Il implica Im (>..' - A)= rt. Abbiamo così dimostrato che per ogni >.. E p (A) esiste un intorno contenuto in p (A) e quindi che p (A) è aperto. 2) Evidente, vista la definizione di a (A) e l'affermazione 1). 3) Nella prima parte della dimostrazione dell'affermazione 1) di fatto si dimostra che il complemento di Apa (A) è aperto in C. ■ cioè I>..' -
>..I
1
Si sarà notato che, per ogni À E p' (A), (À - A)- 1 esiste e appartiene alla C* -algebra L (1t). Possiamo allora introdurre uno dei protagonisti della teoria spettrale: il risolvente dell'operatore A. Definizione 3.1.2 Dato A E CJ (1t), si chiama risolvente di A la funzione
226
Capitolo 3. Teoria spettrale
Teorema 3.1.2 Dato A E O (ri), siano À e À1 due punti qualsiasi di p' (A): 1} RA (À) - RA()/) = (À1 - À) RA (À) RA (À 1 ) ; 2) RA (À) RA (À') = RA()/) RA (À); 3) se, di più, IÀ - À'I IIRA (À') Il < 1,
RA(>.) =RA(>.') [ 1+
~ (>. -
>.'f (-It RA
(,V)] ,
dove la convergenza è secondo la norma di L (ri). Prova. Se >..' 1) si ha:
= >.. le tre affermazioni sono banali; supponiamo, quindi, >..' =/= >...
RA (>..)
RA (>..) (>..' - A) RA (>..') = RA (>..) (>..' (>..' - À) RA (>..)RA(>..')+ RA (>..')
-
À
+À-
A) RA (>..')
e quindi
2) scambiando
À
e >..' nella 1) abbiamo
e quindi, confrontando,
3) con le condizioni poste a>.. e>..' la serie I::= 1 (>..- >..'t (-lt RA(>..') è assolutamente convergente e quindi convergente (nella topologia della norma); usando la 1) e la 2) si ha facilmente per induzione che, per ogni N intero positivo, N
RA(>..)
=L
(>..' - >..t RÀ+1 (>..')
+ (>..' -
>..)N+1 R1+1 (>..')RA(>..)
n=O
e allora N
IIRA (>..) -
L (>..' - >..t RA+l (>..') Il < I>.. - >..'1N+ 1IIRA (>..') 11N+l IIRA (>..) Il; n=o
ma, poiché I>.. - >..'I IIRA (>..')
Il < 1,
(I>.. - >..'I IIRA (>..') ll)N+l IIRA (>..)
Il
-+
N-oo
o
3.1. Concetti generali della teoria spettrale
227
e quindi 00
L (.,\' - .,\f R~+l (.,\') = RA (À).
■
n=o
La 1) è nota come prima equazione del risolvente; la serie 3) è nota come serie di Neumann per il risolvente. Si noti che la 2) dice che il sottoinsieme di L(H) formato dagli elementi appartenenti al range Im RA è commutativo. Ha interesse chiedersi se, dati A, B E O (1i) tali che p' (A) n p' (B) -/= 0, esista una relazione fra RA ed R 8 . Il teorema seguente risponde a questa questione. Teorema 3.1.3 Siano A, B E O (1i) tali che p' (A)
ogni>. E p' (A)
n p' (B) f= 0; allora, per
n p' (B),
a) RA(.-\) - Ra(.-\) = RA(>.) (A - B) RB (.-\), b) RB (.-\) - RA(.-\) = RB (.-\) (B - A) RA(.-\),
se DA:::> DB; se DB :::> DA·
Prova a) Supponiamo DA :J DB; sex' E DB possiamo scrivere (À - A) [RA(.,\) - RB (.,\)] (.,\ - B) x'
= (A -
B) x';
ora, RB (À) x ED B per ogni x E rf. , quindi abbiamo, per ogni x E rf., (À - A) [RA (À) - RB (.,\)] (À - B) RB (À) x
donde RA (À) - RB (.,\)
= RA (.,\) (A -
b) si dimostra in modo perfettamente analogo.
= (A -
B) RB (.,\) x,
B) RB (À);
■
La a) (oppure, se è il caso, la b)) è nota come seconda equazione del risolvente. Se DA = DB si possono scrivere contemporaneamente sia la a) che la b) che risultano allora due forme equivalenti della seconda equazione del risolvente. La seconda equazione del risolvente può essere particolarmente utile per determinare, per esempio, RA una volta noto R8 . Osservazione. È interessante studiare che cosa avviene dell'insieme risolvente e dello spettro di un operatore A E 0(1i) quando si considera una eventuale estensione A di A. Sia A :::> A: ovviamente À - A :::> .,\ - A e Im(À - A ) :::> Im (>. - A), se À - A è invertibile anche.,\ - A è invertibile e
--
--
--
-
-
Capitolo 3. Teoria spettrale
228
(À-A)- 1 :) (À - A)- 1, mentre se
À-A è invertibile non è detto che
À-A
lo sia. Tenendo presente questo e le definizioni di insieme risolvente e dei vari tipi di spettro si stabilisce facilmente che:
P(X) ap (X) ac (X) u ap (X) an (X)
u Ra (A) ,
e
p
:)
ap (A)'
:)
ac(A),
e
an (A).
(A)
In altre parole: in un'estensione di A l'insieme risolvente può guadagnare da Ra (A) soltanto e perdere a favore dello spettro puntuale e dello spettro continuo, nessun autovalore di A scompare bensì nuovi autovalori possono comparire provenendo da p (A) o dal resto di a (A), lo spettro continuo può perdere a favore dello spettro puntuale, ma può guadagnare dallo spettro residuo o dall'insieme risolvente, lo spettro residuo non guadagna mai. Non meno interessanti, anche se nelle aspettative, le affermazioni del teorema seguente dalle quali risulta che operatori unitariamente equivalenti (cfr. §2.9) condividono lo spettro e le caratteristiche spettrali dei punti dello spettro.
Teorema 3.1.4 Siano A e B 'in O (H.) unitariam,ente equivalenti: B U Au- 1 con U unitario; allora si ha: 1} a (A) = a (B), ap (A) = ap (B), an (A) = an (B), Apa (A) Apa (B) e Ra (A) = Ra (B); 1 per ogni À E p (A)= p(B). 2) Rs (.-\) = U RA (À)
u-
Prova. Osserviamo che per ogni À E C si ha B - .Xl =U (A - .Xl) u- 1 , e quindi B - Àl è invertibile se e solo se lo è (A - Àl) e si ha (B - Àl)- 1 = U (A - Àl)- 1 u- 1 , e che se due operatori sono unitariamente equivalenti l'uno è limitato se e solo se lo è l'altro, l'uno è densamente definito se e solo se lo è l'altro. ■
3.2. Proprietà spettrali degli operatori chiusi
3.2
229
Proprietà spettrali degli operatori chiusi
In questo e nei prossimi paragrafi studiamo le proprietà spettrali generali di operatori appartenenti a classi significative per la loro importanza strutturale. Alcune di queste classi sono state introdotte nel capitolo precedente, altre verranno introdotte nel seguito. Cominciamo dagli operatori chiusi. Nelle nostre considerazioni useremo "liberamente" affermazioni e teoremi del capitolo precedente senza farne citazione esplicita; dopo tutto può essere un utile esercizio per il lettore andarsi a reperire e rivedere le affermazioni e i teoremi qui usati. AVVERTENZA.
Sia A E O (1i) chiuso. Qualunque sia À E C, chiuso è allora anche À - A e quindi anche (À - A)- 1 se À è tale che À - A è inve1tibile. Il fatto fondamentale che si si impone all'attenzione con un operatore A chiuso è che il risolvente RA è una funzione olomorfa: infatti, se A è chiuso si ha p' (A) = p (A) e quindi il dominio della funzione RA è aperto e la 3) del teorema 3.1.2 mostra che RA è sviluppabile in serie di potenze nell'intorno di ogni punto del suo dominio. Per tutto ciò che può interessarci qui l'affermazione che il risolvente RA : p(A) ~ L(rl) è una funzione olomorfa può essere intesa nel senso che è olomorfa1 per ogni x ex' in rl, la funzione p(A) 3 ,,\ ~ (xlRA(À)x') E C.
Evidentemente i punti isolati di o-(A) coincidono con le singolarità isolate del risolvente RA- Se Ào è un tale punto, nell'intorno di esso possiamo scrivere lo sviluppo di Laurent 00
RA(À) =
L Cn(À n=O
00
Ào)n +
L Dn(À -
Ào)-n;
n=l
i coefficienti Cn e Dn sono operatori appartenenti a L(1i) dati, secondo formule usuali, da 1 Cn = - -
21ri
d>., J,J (À RA(~) - Ào n+l
n = O, 1, ...
Capitolo 3. Teoria spettrale
230
Dn
=
1
. j (>.. - Ào)n-t RA(>..)d>.., 27r'l ~
n = l, 2, ...
in cui, senza alcun rischio di riduttività, il cammino chiuso , in p (A) può essere inteso come una circonferenza, percorsa una volta in senso antiorario, di centro Ào e raggio f, sufficientemente piccolo perché il cerchio IÀ - Ào I < f, non contenga altri punti di a(A) oltre a >-. 0 • Questi operatori commutano tutti tra loro e con A e soddisfano le relazioni
a) b)
n>O,m>l, n > O, n > 1, m > 1; n > O, ( A - Ào)Cn+l = Cn, (A - Ào)Co = D1 - 1, (A - Ào)Dn = Dn+l, n > l.
Sostituendo lo sviluppo di Laurent di RA nell'intorno di Ào nella prima equazione del risolvente si ottiene subito la prima delle a). Indicate con R~+) ed R~-) la parte con potenze positive e la parte con potenze negative, rispettivamente, dello sviluppo di Laurent di RA, sostituendo RA(À) = R~+\À) + R~-)(À) nella prima equazione del risolvente, si vede, tenendo conto della prima delle a), che R~+) ed R~-) soddisfano separatamente la prima equazione del risolvente; usando allora questa equazione per R~+) (..\) = E:i=o Cn (À-Ào)n si ottiene la seconda delle a), mentre usandola per R~-)(..\) = E:i=l Dn(À - Ào)-n si ottiene la terza delle a). Infine
(A - Ào)Cn+l
=
ottenendo così la prima delle b}; le altre si ottengono in modo analogo.
Il caso in cui una singolarità isolata Ào di RA è un polo di RA merita un'attenzione particolare: se Ào è un polo di RA allora Ào è un autovalore di A. Infatti, se Ào è un polo di ordine, per esempio, m di RA, si ha Dm =I= O, Dm+l = O e l' affermazione segue subito dalla relazione (la terza delle b}} (A - Ào)Dn = Dn+l ·
3.2. Proprietà spettrali degli operatori chiusi
231
L' autovarietà di A relativa all'autovalore Ào è, come sappiamo, Ker(Ào A) e quindi è chiusa, sicché a buona ragione si parla di autospazio di A relativo all'autovalore .X 0 . Se la singolarità isolata Ào non è un polo di RA, nulla si può dire, in generale, del suo carattere spettrale: essa può appartenere a o-p(A) oppure a o-c(A) oppure anche a o-R(A). Alle considerazioni sulle proprietà spettrali generali degli operatori chiusi è opportuno aggiungerne alcune relative agli operatori chiudibili. Se A E 0(1i) è chiudibile le proprietà spettrali della sua chiusura A sono ovviamente quelle degli operatori chiusi; ciò che è però interessante è il confronto fra insieme risolvente e spettro di A e insieme risolvente e spettro di A. E il confronto (sulla base dei teoremi ... adeguati del capitolo precedente e delle definizioni spettrali introdotte all'inizio del capitolo presente) dà i risultati seguenti:
p(A) o-(A) o-p(A) o-c(A) O"R(A)
-
p(A), - o-(A), :) o-p(A), ·e o-c(A), e O"R(A).
L'insieme risolvente e lo spettro restano quindi, globalmente, inalterati nel passare da A alla sua chiusura A; all'interno dello spettro si possono avere spostamenti dallo spettro continuo e residuo di A allo spettro puntuale di A (naturalmente, poiché A è chiuso, il sottoinsieme p"(A) dell'insieme risolvente di A si svuota a tutto vantaggio di p'(A)). Se alla condizione di chiudibilità per A aggiungiamo anche quella di aggiuntabilità diventa interessante il confronto fra insieme risolvente e spettro di A e insieme risolvente e spettro di A t. Sia dunque A E 0(1i) chiudibile e aggiuntabile; allora p(At) e o-(At) sono l'immagine speculare rispetto all'asse reale di p(A) e o-(A), rispettivamente; inoltre fra il risolvente RAt e il risolvente RA si ha la relazione
Capitolo 3. Teoria spettrale
232
3.3
Proprietà spettrali degli operatori simmetrici
Preliminarmente introduciamo la nozione di numero di difetto. Dato un A E O(H) aggiuntabile, sia Apa(A) il suo spettro puntuale approssimativo. Per ogni À E cApa(A) (complemento di Apa(A) in C), (À - A) è invertibile e l'inverso (À - A)- 1 è limitato. Il complemento ortogonale Im(À - A).l di Im(À - A) è un sottospazio di H la cui dimensione ovviamente dipende da À; questa dipendenza è specificata da un teorema di cui rimandiamo la dimostrazione alla fine del paragrafo: la dimensione del sottospazio Im( À - A ).L è costante su ogni sottoinsieme connesso ~ di cApa( A).
Il valore costante assunto da dim Im(À-A).L in tutti i punti À appartenenti a uno stesso sottoinsieme connesso ~ di cApa(A) è chiamato numero di difetto dell'operatore A relativo a ~. Ciò premesso sia A E O(H) simmetrico. Per ogni À E C e ogni x E DA abbiamo dove
ÀR
è la parte reale di
À
e
À1
la parte immaginaria; quindi
Perciò, se À1 f. O, cioè se À è fuori dall'asse reale, ( À ['-inverso ( À - A )- 1 è lim-itato. In altre parole, abbiamo il teorema seguente.
-
A) è invertibile e
Teorema 3.3.1 Lo spettro puntuale approssimativo Apa(A) di un operatore simmetrico A è tutto contenuto nell'asse reale.
I casi ora sono due: o Apa(A) = R o Apa(A) f. R. Nel primo caso cApa(A) consta di due componenti connesse: il semipiano superiore e+ := { À E C I À1 > O} e il semipiano inferiore e- := { À E C I À1 < O}; nel secondo caso cApa(A) consta di un'unica componente connessa formata dall'unione di e+, e- e del complemento di Apa(A) in R. In ogni caso conviene associare all'operatore simmetrico A la coppia di interi non
3.3. Proprietà spettrali degli operatori simmetrici
233
negativi (eventualmente uguali) (mA, nA), dove mA è il numero di difetto di A relativo a e+ ed nA quello relativo a e-. I due numeri mA ed nA si chiamano, brevemente, indici di difetto di
A. Due punti di e+ e e-, rispettivamente, particolarmente convenienti per determinare mA ed nA sono À = i e À = -i. Usando allora la relazione
per
À =
i e À = -i abbiamo:
• mA =I- O se e soltanto se À
=
-i è autovalore di At ed esattamente mA uguaglia la degenerazione dell'autovalore -i di A\
• nA =I- O se e soltanto se À
= i è autovalore di At ed esattamente
nA
uguaglia la degenerazione dell'autovalore i di A t. Vediamo ora come, usando la coppia (nA, mA) di indici di difetto di A, si classificano spettralmente i punti del piano complesso. Un punto À del piano complesso non appartenente ad Apa(A) appartiene a p(A) o a Ra(A) a seconda che Im(À - A) = 1t oppure Im(À - A) =I- 1t. Ora, mA = O significa che Im(À - A).i = {O} per ogni À E e+, ossia che Im(À - A).1.1 = 1t e quindi che Im(À - A) = 1t per ogni À E e+, mentre mA =I- O significa che Im(À - A).i =I- {O} per ogni À E e+, ossia che Im(À A).1.1 =I- 1t e quindi che Im(À - A) =I- 1t per ogni À E e+. Considerazioni perfettamente analoghe per nA, ovviamente in relazione ai punti di e-. Se si aggiunge a queste considerazioni il fatto che mA =I- nA è compatibile soltanto con Apa(A) = R, mentre mA = nA è compatibile sia con Apa(A) = R che con Apa(A) =I- R si può arrivare facilmente a una casistica completa che lasciamo al lettore per passare a un altro teorema importante sullo spettro di A riguardante lo spettro puntuale. Teorema 3.3.2 Sia A E 0(1t) simmetrico e ap(A) il suo spettro di autovalori: 1} À E ap(A) implica Im(À - A) =/-1t; 2} À, À1 E ap(A) e À =I- À1 implica Ker(À - A) 1- Ker(.\' - A). Prova. 1) Poiché A e At si ha Ker(.X-At):) Ker(.X-A), donde Ker(.X-At)J. e Ker(.XA)J.; ma Ker(.X - At)J. = Im(.X• - A), ossia, essendo À reale, Ker(.X - At)J. = Im(.X - A); quindi Im(.X - A) e Ker(.X - A)l., e Ker(.X - A)l. ;/= 1i poiché À è autovalore;
234
Capitolo 3. Teoria spettrale
2) sia x un elemento qualsiasi di Ker(.X -A) ex' un elemento qualsiasi di Ker(.X' -A): si ha (x'l(.X -A)x) = ((.X' - A)x'lx), donde (.X - N)(x'lx) = O; poiché À =f. N, deve essere (xix')= O. ■
La 2) del teorema testé dimostrato dice che, per un operatore simmetrico A, autovettori relativi ad autovalori distinti (ammesso ovviamente che ne esistano) sono ortogonali. Ne segue, grazie alla separabilità di 1i, che lo spettro di autovalori di A, up(A), conta al più di una infinità numerabile di punti. Giunti alla fine del paragrafo dimostriamo, come anticipato all'inizio, il teorema seguente.
Teorema 3.3.3 Sia A E 0(1i) aggiuntabile e cApu(A) il complemento in C del suo spettro puntuale approssimativo: la dimensione (ortogonale!) del sottospazio lm(À-A)l. è costante su ogni sottoinsieme connesso~ di cApu(A). Preliminarmente dimostriamo un lemma che ha anche interesse in sé e per sé. Lemma 3.3.1 Siano R ed R' due sottospazi di 1i, P e P' i proiettori corrispondenti: Il P - P' Il < 1 implica dim R = dim R'. Prova. Supponiamo dim R =f dim R', per esempio dim R > dim R'; la proiezione P R' di R' su R è un sottospazio di R la cui dimensione è al più uguale a quella di R' e quindi minore di quella di R cosicché P R' è un sottospazio proprio di R. Esiste allora un elemento r di R con llrll = 1 ortogonale a P R'; questo r è evidentemente ortogonale all'intero R' e allora non è vero IIP - P'II < 1 poiché ll(P - P')rll = llrll = 1.
Prova del teorema. Siano .X, N due punti distinti qualsiasi di D.. e P>,., P>,., i proiettori relativi a Im(.X-A)J. e Im(N -A)J.. In virtù del lemma testé visto basterà dimostrare che Il P>. - P>,. Il < 1. Poiché D.. è connesso, per ogni coppia À, .X' di punti di D.. esiste un cammino , in D.. avente À e N come punti terminali; sarà allora sufficiente dimostrare che per ogni µ E D.. esiste un 8(µ) > O tale che IIPµ' - Pµ Il < 1 per ogni µ' per cui Iµ' - µI < 8(µ). Ora, per ogniµ E D.., (µ - A)- 1 esiste ed è limitato, quindi esiste un C(µ) > O tale che 1
11(µ-A)xll > C(µ)llxll,
\lx E DA.
235
3.3. Proprietà spettrali degli operatori simmetrici D'altra parte Il(µ - A)xll
= Il(µ - µ' + µ' -A)xll < Il(µ' -A)xll + Iµ' - µI llxll
e quindi C(µ)llxll < Il(µ' -A)xll Prendendo
8(µ)
= ½e(µ)
+ Iµ' - µI llxl.
abbiamo, per Iµ' - µ.I
11(1- Pµ' )xli
Il
sup
xElm(µ-A).l. ,x#O
X
Il
= a1;
in modo analogo si ottiene
IIPµ - Pµ'
Il >
sup Il (l - Pµ)xll xElm(µ'-A).L,x#O llxll
= a 2.
Abbiamo quindi
D'altra parte, per ogni x E 7-f. abbiamo IIPµ,(1- Pµ)xll 2 -
=
IIAII e per tali À si ha
2) lo spettro a(A) non è vuoto: esso è un sottoinsieme compatto di C. Prova. 1) Sia À E C tale che IÀI > IIAII; possiamo allora scrivere À - A= ll½AII < 1 e quindi dal teorema 2.2.4 abbiamo che À - A è regolare e
À(l -
½A) con
2) se o-{A) = 0, RA è una funzione olomorfa intera, cioè olomorfa nell'intero piano complesso C, che, come mostra lo sviluppo nel punto 1), tende a O per IÀI -;, oo e quindi è limitata; secondo un noto teorema della teoria delle funzioni olomorfe ( ''teorema di Liouville") è, allora, RA (À) =0 VÀ E C; ciò non è possibile poiché RA non può avere zeri dato che RA(>.)(>. - A)= 1, V>. E p(A). Dal punto 1) segue poi che o-(A) è confinato nel disco D{O; IIAII) := {>. E C I l>-1 ~ IIAII} e quindi è un sottoinsieme limitato di C; o-{A) è dunque un sottoinsieme chiuso e limitato di C e quindi è compatto. ■
Se la dimensione di 1i è finita, poniamo uguale a d, sullo spettro di un A E L(1i) possiamo fare affermazioni più circostanziate. È un fatto ben noto che, se dim 1i < oo, un operatore appartenente a L(1i) o non è invertibile o, se è invertibile, anche il suo inverso appartiene ad L(1i); se dim 1i < oo, lo spettro di A, quindi, consta del solo spettro puntuale. E questo contiene, da un lato, almeno un autovalore, visto il teorema
240
Capitolo 3. Teoria spettrale
3.5.1, dall'altro al più d autovalori distinti poiché, come si può facilmente constatare, autovettori relativ·i ad autovalori distinti sono linearmente ·indipendenti. Sfruttando l'isomorfismo di 7t con Cd la discussione dell'equazione agli autovalori
Ax
= .Àx
e quindi la ricerca degli autovalori e degli autovettori può ricondursi alla discussione di un sistema lineare omogeneo di d equazioni in d incognite: infatti fissato un riferimento ortogonale {v.n}(n = 1, 2, . .. , d) in 7t, l'equazione agli autovalori si traduce nel sistema lineare omogeneo d
L (Amn - .ÀDmn)TJn = O, n=l
dove TJn = (v.nlx) sono i coefficienti di Fourier di x e Amn = (umlAun) gli elementi di matrice di A relativamente al riferimento ortogonale {v.n} (n = 1, 2, ... , d) fissato. Questo sistema ammette soluzioni diverse dalla soluzione banale TJi = TJ2 = ... = TJd = O se e soltanto se det[Amn - ÀDmn] = O. Gli autovalori di A sono quindi le radici di questa equazione algebrica di grado d in .À chiamata comunemente equazione secolare. Ovviamente gli autovalori di A sono una proprietà intrinseca di A, la loro determinazione mediante la risoluzione di una equazione secolare non deve perciò dipendere dalla scelta del riferimento ortogonale {un}(n = 1, 2, ... , d). Ed effettivamente non ne dipende perché se A è la matrice di A relativamente al riferimento ortogonale {v.n}(n = 1, 2, ... , d) e A quella relativa al riferimento ortogonale {iJ.n}(n = 1, 2, ... , d), si ha
A= ùAù\ dove Ù è la matrice unitaria (relativamente al riferimento ortogonale {iì.n} (n = 1, 2, ... , d)) dell'operatore unitario U che trasforma il riferimento {iJ.n} nel riferimento {un}: Uun = Un, ossia è la matrice di elementi 011m = (umlU'iì.n), e ut la sua coniugata hermitiana; quindi det.A = det A.
Tornando dal caso finito-dimensionale al caso generale, osserviamo che la serie I::=o >.!+ 1 An, che abbiamo visto essere sicuramente convergente per 1,,\1 > IIAII e rappresentare ivi RA(,,\), può convergere anche per valori di ,,\ con 1,,\1 < IIAII; e anche per ogni siffatto À, se converge, rappresenta RA(,,\), infatti:
L 00
(,,\ - A)
n=O
1 ,,\n+l
An
3.5. Proprietà spettrali generali degli operatori di L(ri)
241
La serie in questione è una serie di potenze negative (può essere intesa come sviluppo di Laurent di RA con centro in À = O) e quindi esiste un numero reale r > O tale che la serie è convergente per I).I > r mentre non è convergente per I).I < r. Questo numero reale r > O "discriminante", che, matematicamente parlando, sulla base del teorema di Cauchy-Hadamard, è dato dal cosidetto massimo limite limn-oollAnll 1/n, coincide con il cosidetto raggio spettrale di A, spr(A), definito da spr(A) := sup IÀI. ÀEo-(A)
Infatti la serie I::=o >.}+ 1 An non può convergere per alcun I).I < spr(A) poiché se convergesse per un siffatto À, diciamo ~' dovrebbe convergere per ogni À con I).I > l~I e quindi per almeno un À E a(A), mentre converge per ogni À tale che IÀ I > spr( A) grazie al fatto che ogni tale À appartiene a p( A) e all'unicità dello sviluppo di Laurent di RA(À) con centro in À = O. Il raggio spettrale di A appare quindi come il raggio del più piccolo disco (con centro nell'origine) entro cui è confinato lo spettro di A. Possiamo anche aggiungere (ma ce ne risparmieremo la dimostrazione; cfr. [10) Tome II Ch. XV, 15.2. 7) che • la successione {IIAnlll/n} è convergente e quindi spr(A) = lim IIAnllI/n; n-oo
• se A E L(rl) è normale, cioè se A è tale che AtA = AAt, spr(A) = IIAIICompare qui per la prima volta la definizione di operatore (limitato) normale: AE L (1-i)è detto normale se AtA = AAt. Una proprietà equivalente è espressa nella affermazione: AE L (1-i)è detto normale se IIAxll = IIAtxll, 'ix E 1-i. At A= AAt implica IIAxll
IIAxll 2
= IIAtxll,
\/x E rl banalmente:
= (AxlAx) = (xlAt Ax) = (xlAAtx) = (AtxlAtx) = IIAtxll 2 ;
Capitolo 3. Teoria. spettrale
242
IIAxll = IIAtxll, \lx E 1t implica AtA = 4
(AxlAy)
1
AAt tramite la formula di polarizzazione: 4
1
= L-IIA (x + WrY) 11 2 = L-IIAt (x + WrY) 11 2 = (AtxlAty), r=l
donde (xlAtAy)
4wr
r=l
4wr
= (xlAAty), \/x,y E ?t.
Come vedremo gli operatori normali saranno i protagonisti dei teoremi spettrali. Al momento, dopo aver osservato che operatori normali sono sia gli operatori di L (H.) autoaggiunti, sia gli operatori unitari, sia gli operatori di moltiplicazione limitati (cfr. §2.10), ci limitiamo a segnalare una importante proprietà spettrale di questi operatori (l'abbiamo vista poco sopra per gli operatori autoaggiunti, anche non limitati). Teorema 3.5.2 Sia A E L (H.) normale: lo spettro residuo
O tale che
I.X- < A >x I 2:: 8,
À
reale,
Vx E 'H..
Quindi
IÀ(xlx) - (xlAx)I 2:: 8llxll 2 ,
Vx E 'H.,
cioè l(xl(À - A)x)I > 8llxll 2 ,
Vx
E
'H.,
e anche, poiché l(xj(À - A)x)I < llxll ll(À - A)xll,
Il (.X -
A)xll > 8llxll,
Vx E 'H.;
ciò mostra che il valore À considerato appartiene a p( A). -:--:--,Dunque cr(A) e 0(A). Infine, poiché, ovviamente, 0(A) e [-m(A), M(A)] abbiamo la 1). 2) Poniamo Ào = m(A) e consideriamo la forma sesquilineare (x, x') := (xl(A-À0 )x'); si vede immediatamente che questa forma sesquilineare è hermitiana non negativa, quindi dalla disuguaglianza di Schwarz si ha
l(x, x')l 2 < (x, x)(x', x'), Scritta per x
= (A -
Vx, x' E 'H..
~ 0 )x', questa dà
ll(A-À 0 )x'll 4 ~ ( (A-À 0 )x'l(A-À 0 ) 2 x') (x'l(A-À 0 )x') < IIA-À 0 11 3 llx'll 2 (x'l(A-À0 )x'); ora, o IIA - Àoll = O o IIA- Àoll #O: nel primo caso si ha (A -À 0 )x = O, Vx E 1t e quindi Ào appartiene a crp(A), nel secondo caso si ha, comunque, inf11x11=dll(A - À 0 )xll} = O e quindi Ào - A non è invertibile in L(1t), ossia Ào non appartiene a p(A). Per lvi (A) la dimostrazione è analoga. ■
3.6
Proprietà spettrali degli operatori di proie• z1one
Stabilite le proprietà generali dello spettro degli operatori appartenenti a L(ri) passiamo a considerare operatori appartenenti a L(H) particolarmente
Capitolo 3. Teoria spettrale
244
importanti. In questo paragrafo ci occupiamo degli operatori di proiezione. Teorema 3.6.1 Sia P E L(H) un pro'iettore: 1} se P = O, a(P) = ap(P) = {O}; cioè: lo spettro di P consta del solo À = O e questo è autovalore di P; 2} se P = I, a(P) = ap(P) = {1}; cioè: lo spettro di P consta del solo À = 1 e questo è un autovalore di P; 3) se P f. O e P f. I, a(P) = ap(P) = {O, 1}; cioè: lo spettro di P consta dei soli À = O e À = 1 e quest'i sono autovalori di P. Prova. 1) Se P = O, IIPII = O e quindi ogni À tale che appartiene all'insieme risolvente; lo sviluppo di Laurent 00
1
Rp(À)
1
= À L Àn pn,
À
IÀI >
O, ossia ogni
À
=/: O,
=/: O,
n=O
è quindi lo sviluppo di Laurent nell'intorno della singolarità isolata Rp(À) À
1
= À1,
À
= O;
ma
À =/: O,
= O è allora un polo, del 1°ordine, di Rp e quindi un autovalore di P; 2) se P = l, IIPII = 1 e quindi ogni À tale che IÀI > 1 appartiene all'insieme risolvente;
sommando lo sviluppo di Laurent
abbiamo Rp(À)
1
= À _ 1 1,
À # 1;
°
À = 1 è dunque l'unico punto singolare di Rp, è un polo, del 1 ordine, di Rp e quindi un
autovalore di P; 3) se P # O e P # l, IIPII = 1 e quindi ogni À tale che IÀI > 1 appartiene all'insieme risolvente; tenendo conto che P 2 = P, scriviamo lo sviluppo di Laurent
e sommando otteniamo Rp(À)
= O, À = 1 sono gli
=
1 À
l+ À(À
1 _
I) P
=
1 À
(l-P) +
À
1 _IP,
À =/: O, À =/: 1;
°
unici punti singolari di Rp, sono due poli, ambedue del 1 ordine, di Rp e quindi sono autovalori di P. ■ À
3. 7. Proprietà spettrali degli operatori unitari
245
Osservazione. Si potrebbe obiettare che per discutere lo spettro degli operatori di proiezione si poteva anche seguire una via più semplice rispetto a quella seguita sopra. La via seguita sopra ha però il pregio di permetterci di riscontrare, in un caso particolarmente semplice, alcune considerazioni che abbiamo fatto nei paragrafi precedenti, in sede generale, soprattutto per gli operatori autoaggiunti. In particolare si può vedere concretamente che ogni singolarità isolata del risolvente Rp è un polo del 1 ordine di Rp e che il residuo nel polo è il proiettore relativo all'autospazio corrispondente.
°
3. 7
Proprietà spettrali degli operatori unitari
Procediamo in modo molto simile a quello seguito per gli operatori simmetrici (cfr. §3. 3) . Sia A E L(1t) isometrico. Per ogni À E Ce ogni x E 1t abbiamo ll(À - A)xll
2
+ 1) llxll 2 - 2 Re[À(xlAx)] > (IÀl 2 + 1) llxll 2 - 2IÀI l(xlAx)I > (IÀl 2 + 1 - 2IÀI) llxll 2 = (IÀI - l) 2 llxll 2 ;
-
(IÀl
2
quindi ll(À - A)xll > I IÀI - 1 I llxll,
Vx E 1-t.
Perciò, se IÀ I =I= 1, cioè se À non sta sulla circonferenza 8 1 di raggio 1 (con centro nell'origine), À -A è invertibile e l'inverso (À-A)- 1 è limitato. In altre parole, abbiamo il teorema seguente.
Teorema 3. 7.1 Lo spettro puntuale approssimativo Apa(A) di un operatore A E L(1t) isometrico appartiene interamente alla circonferenza 8 1 . La circonferenza 8 1 ha dunque qui lo stesso ruolo che ha l'asse reale R nel caso degli operatori simmetrici. Conviene pertanto associare all'operatore A isometrico la coppia di indici di difetto (µA, v A), dove µ A è il numero di difetto di A relativo a e> := {À E CI IÀI > 1} e VA quello relativo a e appartiene all'insieme risolvente di A e quindi deve essere µA = O. Per esaminare v A possiamo prendere il
Capitolo 3. Teoria spettrale
246
punto À = O e allora, poiché la suriettività è esattamente la proprietà che contraddistingue gli operatori unitari entro la classe degli operatori isometrici, otteniamo subito che VA è zero se e solo se A è unitario. Ciò significa che se A è unitario, e soltanto se è tale, anche e< appartiene all'insieme risolvente di A, mentre se A è isometrico ma non unitario e< appartiene allo spettro residuo puro Ra(A). Ma a proposito dello spettro residuo di un A E L(H) unitario possiamo dire di più (come già nel caso degli operatori autoaggiunti, cfr. §3.4): non soltanto lo spettro residuo puro Ra(A), bensì l'intero spettro residuo aR(A) di un operatore A unitario è oooto. Infatti, supposto an(A) # 0, sia Ào un punto di an(A); allora (..\0 - A) è invertibile e Im(.Xo - A)# 1t; ma se Im(.Xo - A)# 1t esiste in 1t un uo # O ortogonale a Im(.-\ 0 -A), ossia tale che (uol(.Xo -A)x) = O, \lx E 1t, e quindi tale che ((..\ 0-At)u 0 1x) = O, \lx E 1t,e quindi, ancora, tale che
,. uo, A t u,o -- "'o
donde, applicando .XoA ad ambedue i membri e tenendo conto che I.Xol
Auo
= 1,
= Àouo;
dunque ..\0 E ap(A) e ciò contraddice l'ipotesi ..\0 E an(A).
Un'altra proprietà da sottolineare dello spettro degli operatori unitari, condivisa anche dagli operatori isometrici, riguarda lo spettro puntuale (e a questo proposito è da sottolineare l'analogia con il caso degli operatori simmetrici): autovettori relativi ad autovalori distinti (ammesso che ne esistano) sono ortogonali. Siano, infatti .X e N due autovalori distinti dell'operatore A unitario; per un qualsiasi u E Ker(.X - A) e un qualsiasi u' E Ker(N - A) abbiamo (ulu')
= (AulAu') = .X*.X'(ulu'),
cioè (1 - À• .X')( ulu') ora, 1 - À• N
#
O poiché À # .X' e INI
= O;
= I.Xl = 1; quindi
( ulu')
= O.
In definitiva, con le considerazioni precedenti abbiamo stabilito il teorema seguente nel quale riassumiamo le proprietà spettrali degli operatori uni tari.
247
3.8. Operatori compatti; operatori HS
Teorema 3. 7.2 Sia A E L(ri) unitario: 1) a(A) e S 1 ' dove 1 = {.X E I I.Xl
s
e
= 1};
2} an(A) = 0; 3) .X e .X' E ap(A) e .X -f .X' implica Ker(.X - A)
J_
Ker(.X' - A).
Come nel caso degli operatori autoaggiunti, grazie alla separabilità di H, lo spettro puntuale di un operatore unitario, se non è vuoto, consta al più di una infinità numerabile di punti. Inoltre, anche nel caso degli operatori uni tari si può parlare di sistema ortonormale generato da A e di operatori unitari con spettro puramente puntuale. o Esercizio. Studiare le caratteristiche spettrali degli operatori isometrici non unitari.
3.8
Operatori compatti; operatori HS
Gli operatori compatti sono fra i protagonisti della teoria classica delle equazioni integrali. Le loro proprietà spettrali, anche nel caso di uno spazio 1i non finito-dimensionale (che è poi il caso che più ci interessa) restano molto simili a quelle del caso finito-dimensionale, anzi, tenuto nel dovuto conto il passaggio dalla dimensione finita alla dimensione non finita, possiamo dire che sono sostanzialmente le stesse. Per introdurci alla formulazione della definizione di operatore compatto ricordiamo che la compattezza di un sottoinsieme K di uno spazio di Banach E può essere espressa in vari modi che risultano equivalenti grazie al fatto che E è uno spazio (lineare topologico) metrico. Noi adottiamo come definizione la proprietà d'i Heine-Borel-Lebesgue:
un sottoinsiem,e K di E si dice compatto se da ogni copertura aperta d'i K si può estrarre una sottocopertura di K finita. Osservazione. Per "copertura aperta" di K intendiamo una collezione {n0 } ( a: E J) di sottoinsiemi aperti di E tale che U0 e1fl 0 :J K (I è un qualsiasi insieme di indici). "Sottocopertura di K" significa, poi, una sottocollezione della collezione {!'20 }(a: E J) che ancora costituisce una copertura di K.
248
Capitolo 3. Teoria spettrale
Una delle proprietà, cui alludevamo sopra, equivalenti in uno spazio metrico alla proprietà di Heine-Borel-Lebesgue e che ci sarà utile nel seguito è la proprietà sequenziale:
da ogni successione di punti di K si può estrarre una sottosuccessione convergente in K (cioè a un limi te appartenente a K). Una circostanza da sottolineare circa la compattezza di un sottoinsieme K di uno spazio di Banach E è la seguente:
ogn'i sottoinsieme K compatto di E è chiuso e lim.itato, mentre:
ogni sottoinsieme chiuso e l'imitato è compatto se e soltanto se la dim,ensione di E è finita. Quest'ultima affermazione è un celebre teorema di Riesz (cfr. [35] teor. 9.2). Della definizione di compattezza e della circostanza testé sottolineata esiste anche una versione, per così dire, debole che ci sarà utile fra poco:
un sottoinsieme K di E si dice relativamente compatto se la sua chiusura K è compatta; equivalentemente:
da ogni success'ione di punt'i di K si può estrarre una sottosuccessione convergente in E (cioè a un limite appartenente ad E). Ogni sottoinsieme relat'ivamente compatto è lim,itato, mentre:
ogni sottoinsieme K di E limitato è relativamente compatto se e solo se la dim.ensione di E è finita.
3.8. Operatori compatti; operatori HS
249
Per le questioni sulla compattezza in uno spazio di Banach E e le dimostrazioni delle affermazioni relative rimandiamo a un qualsiasi trattato di Analisi Funzionale. Possiamo ora formulare la definizione di operatore compatto (ci riferiamo direttamente a uno spazio di Hilbert 1i). Definizione 3.8.1 Un operatore A su 1i si dice compatto se trasforma sottoinsiemi limitati di 1i in sottoinsiemi relativamente compatti.
Osserviamo subito: • ogni operatore lineare compatto è limitato e quindi appartiene alla C* algebra L(1i); • l'operatore I (elemento unità dell'algebra L(1i)) è compatto se e soltanto se 1i ha dimensione finita; • se 1i ha dimensione finita, e soltanto in questo caso, tutti gli operatori su 1i sono compatti. Osservazione. Per evitare equivoci, dato che nel discorso entreranno successioni debolmente convergenti (cfr. §2.9), sarà opportuno nel seguito di questo paragrafo usare esplicitamente l'espressione "fortemente convergenti" per le successioni convergenti secondo la topologia "istituzionale" di 1i (cioè la topologia generata dal prodotto scalare) che finora abbiamo chiamato, semplicemente, successioni convergenti. Teorema 3.8.1 Sia A un operatore lineare su 1i. Sono equivalenti le affermazzonz: a) per ogni su,ccessione { Xn} (n E N)) in 1i limitata, dalla successione {Axn}(n E N) dei trasformati si può estrarre una sottosuccessione fortemente convergente in 1i; b) A è compatto; c) per ogni successione {xn}(n E N) in 1i debolmente convergente (xn ~ !f;), la successione {Axn}(n E N) dei trasformati converge fortem,ente {Axn ~ A !f;). Prova. a) => b) Sia K un sottoinsieme di 1i limitato, A(K) il sottoinsieme trasformato e {x~}(n E N) una successione in A(K); per ogni n E N esiste un Xn E K tale che
Capitolo 3. Teoria spettrale
250
x~ = Axn e abbiamo così una successione {xn}(n E N) in K, quindi limitata; allora dalla successione {Axn} (n E N) si può estrarre una sottosuccessione fortemente convergente in 1t; dunque il sottoinsieme A(K) è relativamente compatto. b) => e) Sia Xn ~ allora (cfr. §2.9 esercizio 3) Axn ~ A Se {Axn}(n E N) non o converge fortemente ad A x, esistono un t: 0 > Oe una sottosuccessione {Axnk }(k E N) tali che IIAxnk - A Il > co; ma {Xnk }(k E N) è un sottoinsieme limitato (la successione {Xn} è limitata in quanto debolmente convergente, cfr. §2.9) quindi il sottoinsieme trasformato {Axnk}(k E N) è relativamente compatto e allora dalla successione {Axnk}(k E N) si può estrarre una sottosuccessione {Axnk., }(s E N) fortemente convergente in 1t; poiché Axn ~ A il limite forte della sottosuccessione {Axnk .. } (s E N) non può che essere A e ciò implica che esiste un N(eo) E N tale che nk,, ~ N(eo) => IIAxnk. - A ; Il < e:0 in o evidente contraddizione con IIAxnk - A x Il > e:o. e) => a) Ci basiamo sul fatto (che qui sarebbe fuori luogo dimostrare, cfr. Prop. 34.1 (35]) che da ogni successione limitata si può estrarre una sottosuccessione debolmente convergente; allora, se {Xn} (n E N) è una qualsiasi successione in 1t limitata se ne può estrarre una sottosuccessione {xn,J(k E N) debolmente convergente e quindi la successione {Axnk}(k E N) è fortemente convergente; dunque per ogni successione {xn}(n E N) in 1t limitata dalla successione {Axn}(n E N) dei trasformati si può estrarre una sottosuccessione convergente. ■
x,
x.
x
x
x
Come abbiamo già osservato gli operatori compatti costituiscono un sottoinsieme della C*-algebra L(H) che coincide con L(H) se e soltanto se dim 1-l < oo. Indicheremo questo sottoinsieme di L(H) con Lc(H); spendere un simbolo apposito non è ingiustificato dato che non si tratta di un sottoinsieme generico come mostra il seguente teorema. Teorema 3.8.2 Dato uno spazio di Hilbert 1-l, sia Lc(1-l) la classe degli operatori lineari compatti su 1-l: Lc(1-l) è un ideale {bilatero) chiuso e stabile per aggiunzione della C*-algebra L(H). Prova. Per dimostrare che Le (1t) è un ideale (bilatero) di L(1t) si deve dimostrare che, se A E Le(1t), A' E Le(1t), B E L(1t) e k E C, allora A+ A' E Le(1t), ABELe(1t) è BA E Le(1t); lasciamo le facili dimostrazioni al lettore come utili esercizi. Passiamo quindi alla dimostrazione che Le(1t) è chiuso in L(1t). Sia {An}(n E N) una successione in Le (1t) tale che An ~ A (convergenza uniforme, cioè secondo la topologia "istituzionale" di L(1t) generata dalla norma operatoriale, cfr. §2.9); se {xn}(n E N) è una qualsiasi successione in 1t limitata, dalla successione {A 1 xn}(n E N) possiamo estrarre una 1 sottosuccessione {A 1 x~1) }( E N) fortemente convergente, dalla successione {A 2 x~ ) }( E N) 2 possiamo estrarre una sottosuccessione {A 2 x~ ) }( E N) fortemente convergente e così via;
251
3.8. Operatori compatti; operatori HS
consideriamo allora la successione {yk}(k E N), dove Yk = xt>, che, per costruzione, è tale che, per ogni n E N, la successione dei trasformati {AnYk}(k E N) è fortemente convergente. Abbiamo IIAYk - Ayhll
< IIAYk - AnYkll + IIAnYk - AnYhll + IIAnYh - Ayhll < IIA - Anll(IIYkll + IIYhll) + IIAnYk - ~1Yhll
< µIIA-Anll + IIAnYk -AnYhll, dove abbiamo posto µ = 2 supk IIYk Il; poiché An ~ A, per ogni e > O esiste un che n > K(e) => IIA - An Il < e, e prendendo allora un no > K(e) abbiamo
ma {AnoYk} è (fortemente) convergente e perciò esiste un IIAnoYk - AnoYhll < e; in definitiva rie> O3N(e) E N tale che k, h >
N(e)
N(e) E
N tale che
k, h
K(e)
>
tale
N(e)
=>
=> IIAYk - Ayhll < (µ + l)e.
La successione {Ayk}(k E N) è dunque una successione di Cauchy e quindi (7-t è completo!) convergente. Arriviamo così alla conclusione che, per ogni successione limitata {xn}(n E N), dalla successione {Axn}(n E N) si può estrarre una sottosuccessione fortemente convergente e quindi A è compatto. Resta da dimostrare che l'ideale Lc(?t) di L(rt) è stabile per aggiunzione, cioè che se A è compatto anche A t è compatto. Orbene, se A è compatto anche AAt è compatto, quindi, per ogni successione {xn}(n E N) in 7t limitata, dalla successione {AAt xn}(n E N) si può estrarre una sottosuccessione { AA t Xnk }( k E N) fortemente convergente. Ora IIAtxnk -Atxnhll 2
-
(Af(xnk -Xnh)IAf(xn,. -Xnh))
-
((xn,. - Xnh)IAAt (xn,. - Xnh))
< llxnk - Xnh 11 IIAA t (xnk - Xnh) Il
< µIIAAt Xn,.
-
AAt Xnhll,
doveµ= 2supn llxnlli ciò mostra che {At Xn,.}(k E N) è di Cauchy e quindi convergente. Dunque per ogni successione {xn}(n E N) in ?t limitata dalla successione {A'txn}(n E N) si può estrarre una sottosuccessione {A t Xn,.,} (k E N) fortemente convergente. ■
L'ideale Lc(rl) contiene vari tipi interessanti di operatori; qui ci limitiamo ad accennare brevemente agli operatori di Hilbert-Schrnidt e agli operatori degeneri. Abbiamo già introdotto gli operatori di Hilbert-Schmidt nel contesto degli operatori integrali su spazi di Hilbert di tipo L 2 (X, A,µ) (vedi §2.11). La
Capitolo 3. Teoria spettrale
252
definizione di operatore di Hilbert-Schmidt, brevemente operatore HS, nel contesto di uno spazio di Hilbert 1t generico può essere introdotta usando una proprietà che già nel §2.11 (cfr. teor. 2.11.1) è stato mostrata essere caratteristica di tali operatori. Osserviamo che, essendo {un}(n E N) e {vn}(n E N) due qualsiasi riferimenti ortogonali di 1-i e A un qualsiasi operatore di L(ri), si ha
nEN
nEN
nEN
nEN
cioè: se converge una di queste serie convergono anche le altre e allo stesso limite, mentre se diverge una divergono anche le altre (consideriamo esplicitamente il caso di uno spazio 1-i infinito-dimensionale perchè nel caso finitodimensionale si tratta di somme finite e non ci sono problemi di convergenza). Basta dimostrare che EneN IIAvnll 2 = EneN IIAtunll 2 ; usando l'identità di Parseval e tenendo presente che si tratta di serie a termini positivi, abbiamo
nEN
mENnEN
nENmEN
mENnEN
nEN
Osserviamo poi che
nEN
nEN
se teniamo conto che A t A è un operatore (autoaggiunto) positivo (nel senso che il valor medio < A t A >x > O per ogni x E 1t) possiamo dire che la sommatoria Ì::neN (V,n IA t A Un) è la traccia dell'operatore A t A e indicarla con Tr(At A), cosicché abbiamo Tr(At A)=
L IIAunll
2
-
(3.3)
nEN
Osservazione. Nel caso di uno spazio 7t di dimensione d finita si può parlare di traccia per ogni B E L(rt) definendo d
Tr(B) :=
ì:::)unlBun), n=l
3.8. Operatori compatti; operatori HS
253
dove {un} (n = l, 2, ... , d) è un qualsiasi riferimento ortogonale di 'H,; nel caso di uno spazio 'H, di dimensione non finita la sommatoria diventa una serie e si può parlare sensatamente di traccia, in tutta generalità, soltanto per operatori di L(rl) positivi, poiché in tal caso la somma della serie è comunque definita (ed è un numero positivo o eventualmente +oo).
La definizione di operatore HS nel contesto di uno spazio di Hilbert 1i generico è ora piuttosto ovvia. Definizione 3.8.2 L'operatore A E L(1i) si dice di Hilbert-Schmidt se Tr(AtA) Oe, per ogni n E N, un Xn, llxnll = 1, tali che ll(PnA-A)xnll > éo; poichè A è compatto possiamo anche supporre che Axn ~ y E 7t (esisterebbe comunque una sottosuccessione {Xn,.} della successione {Xn} tale che Axn1c ~ y) e allora
< 11(1- Pn)Axnll < 11(1-Pn)(Axn - Y)II + 11(1- Pn)YII < IIAxn - YII + Il (1 - Pn)YII -+ O
éo
arrivando così a una contraddizione (abbiamo tenuto conto anche dell'esempio 3 del §2.8). Abbiamo dunque mostrato che Lc(1t) e Lv(1t). Quindi Lv(1t) = Lc(1t). 2) Sia A E LHs(1t); come nella prova del punto 1) fissiamo un riferimento ortogonale {v.n}(n E N) in 7t, per ogni n E N consideriamo il proiettore Pn relativo al sottospazio Vr~n{v.r} e poi l'operatore degenere An = APn. Riferendoci al Lemma 3.8.1, di cui postponiamo la prova, abbiamo 2
r (A -An)
=L
00
IIA(l- Pn)'11,ill
2
L
=
iEN
IIAuill 2
n:;oo O,
i=n+l
cioè r(A -An)
O
-+ n-oo
e quindi anche
IIA-Anll
-+ n-oo
O.
Quest'ultima mostra che A E Lv(1t), ossia che A E Lc(1t). Dunque LHs(1t) e Lc(1t) cosicché Lv(1t)
donde anche, poichè Lv(1t)
e
= Lc(1t),
LHs(1t)
LHs(1t)
e
Lc(1t)
= Lc(1t). ■
Resta da provare il Lemma 3.8.1 cui abbiamo fatto riferimento sopra. Lemma 3.8.1 Dato A E LHs(ri), pon-iamo
r(A)
:=
JTr(AtA) :
1) IIAII < r(A), 2) r : Lns(ri) ~ R, A~r(A) è una norma su Lns(ri).
Capitolo 3. Teoria spettrale
256
Prova. 1) Fissato un riferimento ortogonale {un}(n E N) abbiamo x Ax = LneN(v.nlx)Aun; ora N
N
~(unlx)Au,,
A= O: basta tener presente il punto 1). ■
Osservazione. Come si vede dal punto 1) del Lemma 3.8.l la topologia su LHs(ri) generata dalla norma T è più forte di quella generata dalla norma operatoriale ereditata da L(rl). Osservazione. La norma r è hilbertiana; essa soddisfa infatti la legge del parallelogramma come è facile verificare partendo dalla relazione
(A+ B)t(A + B)
+ (A- B/(A- B) = 2AtA + 2stn.
Il corrispondente prodotto scalare (AIB) è
nEN
nEN
come si intuisce dalla relazione At B
,t
1
r=l
4Wr
= :E-(B + WrA)t(B + WrA),
Wr
= 1, -1, i, -i.
Naturalmente occorre garantirsi che effettivamente (AIE) così definito ha tutte le proprietà richieste (in primis che è ben definito: c'è di mezzo una serie di cui occorre dimostrare la convergenza). Si ha così la possibilità di introdurre su LHs(rf.) la struttura di spazio di Hilbert (anche la questione della completezza ha una risposta positiva) che è molto utile in vari contesti, ma è piuttosto lontana dai nostri attuali interessi, sicché non vi insistiamo oltre. Ricordiamo che già nel §2.11 si era accennato alla possibilità di introdurre una struttura di spazio di Hilbert su LHs(L 2 (X)).
3.9. Proprietà spettrali degli operatori compatti
3.9
257
Proprietà spettrali degli operatori compatti
Veniamo ora alla discussione delle proprietà spettrali degli operatori compatti. Iniziamo con un teorema molto importante per la discussione che ci interessa. Teorema 3.9.1 Sia A E Lc(1i): 1} per ogni À E C-{O}, Ker(À - A) ha dimensione finita; 2) per ogni .X E C-{O}, lm(À - A) è chiuso. Prova. 1) Basta mostrare che la sfera chiusa di raggio 1 dello spazio Ker(À - A) (cioè il sottoinsieme {x E Ker(À - A) I llxll < 1} di Ker(À - A)) è compatta (si ricordino le considerazioni sulla compattezza all'inizio del paragrafo); sia allora {xn}(n E N) con llxnll = 1 e (À - A)xn = O cosicché Xn = ½Axn: essendo A compatto, dalla successione {Axn}, e quindi dalla successione {xn}, si può estrarre una sottosuccessione (fortemente) convergente; la sfera di raggio 1 di Ker(À - A)) è quindi compatta. 2) Supponiamo che Im(À - A) non sia chiuso; esiste allora almeno una successione {(À - A)xn} (fortemente) convergente il cui limite non appartiene a Im(À -A). Sicuramente, allora, =I- O e quindi Xn ~ Ker(À - A) per n sufficientemente grande; possiamo supporre senz'altro che nessun Xn appartenga a Ker(À - A) cosicché, essendo Ker(À - A) un sottospazio, la distanza 8n di Xn da Ker(À - A) è, per ogni Xn, strettamente positiva. Per ogni Xn prendiamo un Un in Ker(À - A) tale che llxn - Un Il < 28n e poniamo kn = llxn - unii; la successione {kn} tende a +oo: postponendo la prova di questo, introduciamo Vn = /" (xn - u.n) e osserviamo che allora
x
x
(À - A)vn
= kn1 (À -
s
A)xn --► O.
Da questa e dalla compattezza di A abbiamo che dalla successione {Vn} si può estrarre una sottosuccessione (fortemente) convergente a un limite E Ker(À - A), poiché, banalmente, llvnll = 1 e Vn = ½((À - A)vn + Avn)Ora, se poniamo Wn = u.n + kn e osserviamo che Wn E Ker(À - A), abbiamo 8n < llxn -wnll; ma Xn -Wn = Xn -Un-kn = kn(Vnsicché llxn-Wnll < llvn- Il; poiché kn = llxn - Un Il < 28n, otteniamo
v
v
cioè
o
llvn- v
v
Il> 1/2,
v),
Vn E N,
v
258
Capitolo 3. Teoria spettrale
in contraddizione con il fatto che da {vn} si può estrarre una sottosuccessione convergente a
o V.
Per completare la dimostrazione dobbiamo provare che kn ~ oo; supposto che questo non sia vero, cioè che la successione {Xn - v-n} sia limitata, dalla successione {A(xn - Un)} si può estrarre una sottosuccessione (fortemente) convergente; ma
x;
con, ricordiamo, (À - A)xn -!+ dalla successione {Xn - Un} si può quindi estrarre anche una sottosuccessione (fortemente) convergente a un limite,che chiameremo x, e quindi la sottosuccessione corrispondente di {(À - A)(xn - un)} sarà fortemente convergente a o o (À - A)x; ma allora dalla (3.4) sarà x = (À - A)x donde x E Im(À - A), in contraddizione con il fatto che = s-lim(À - A)xn non appartiene a Im(À - A). ■
x
Si osservi che il punto 2) del teorema lascia disponibile per un eventuale spettro continuo di un operatore compatto il solo punto À = O. Si osservi anche che, grazie al punto 1), eventuali autovalori diversi da O di un operatore compatto hanno tutti degenerazione finita. Teorema 3.9.2 Sia A E L(rl) compatto e À E C-{O}: se À non è autovalore di A allora À appartiene all'insieme risolvente di A. Prova. Sia À (j. ap(A) e À (j. p(A); ciò implica in definitiva, grazie al punto 2) del teorema 3.9.1, che Im(À - A) # 1t, cioè che (À - A)(1t) è un sottospazio proprio 1t1 di 1t; analogamente,tenendo conto che À - A realizza una corrispondenza biunivoca·tra 1i. e 1-f.1, 1t2 := (À-A)(1t 1 ) è un sottospazio proprio di 1t1, ... ,1tn+1 := (À-A)(1tn) è un sottospazio proprio di 1tn, e così via; allora, per ogni n = O, 1, ... esiste in 1tn (1to = 1t) un Xn, llxnll = 1, per il quale la distanza da 1tn+l è maggiore di 8 > O e ciò ci permette di costruire una successione limitata {Xn} (n E N). Ora, se n > m, abbiamo
con Xm,n
= Xn -
1
À ((À
- A)xm -
che chiaramente appartiene a 1tm+l; quindi
in contraddizione con il fatto che A è compatto.
■
(À -
A)xn)
3.9. Proprietà spettrali degli operatori compatti
259
E così anche per un eventuale spettro residuo di un operatore compatto è disponibile il solo punto ,\=O. Spontanea, allora, a questo punto, è la domanda: qual'è la consistenza dello spettro puntuale ap(A)? Teorema 3.9.3 Sia A E L(1-l) com.patto: la cardinalità ap(A) dello spettro di autovalori di A non supera N0 ; se ap(A) = No gli autovalori di A formano una successione { Àp} che converge a O: Àp ~ O. Prova. Se dim 1t = d < oo, poiché autovettori relativi ad autovalori distinti sono linearmente indipendenti, up(A) < d e non c'è altro da dimostrare. Se dim 1t = N0,
per dimostrare il teorema basta mostrare che, per ogni intorno (aperto) .Teo) di O in C, cl(o) n u p(A) (dove eleo) è il complemento di l(o) in C) contiene al più un numero finito di punti. Supponiamo che ciò non sia vero; allora esistono un é > O e una successione {Àn}(n E N) di autovalori distinti di A appartenenti alla corona circolare c(o; é, IIAII) := {À E e I é < I).I < IIAII}. Per ogni Àn consideriamo l'autospazio Ker(Àn -A) e costruiamo la sequenza di autospazi 'Ho= Ker(Ào -A), rl1 = Ker(Ào -A) V Ker(À1 - A), ... , 'Hr+l = Vi=0,1, ... ,r Ker(Ài A), ... di rl; poichè autovettori relativi ad autovalori distinti sono linearmente indipendenti, rlr è un sottospazio proprio di 1-lr+l e quindi esiste in 1-lr+l un Xr+l con norma llxr+ill = 1 e distanza fJ >Oda 7-lr; considerando la successione (limitata) {x,.}(r = 1, ... ) si ha, se s > r,
con Yr,s
= (Às -
A)xs
+ Axr
che appartiene ad 1ts-l poichè s-1
(Às - A)xs
= (Às -
A)
s-1
L kiYi = L ki(Às i=O
Ài)Yi,
i=O
dove x 8 E 1ts è qui espresso come combinazione lineare di Yi E Ker (Ài 1; ma allora
-
A), i= O, ... , s-
ciò che è in contraddizione con il fatto che, essendo A compatto, dalla successione { Axr}
si può estrarre una sottosuccessione convergente.
■
Dai teoremi precedenti è chiara la struttura dello spettro di un A E L(1-l) compatto:
Capitolo 3. Teoria spettrale
260
prescindendo dal punto À = O, lo spettro di A si riduce al solo spettro d'i autovalori, tutti con degenerazione finita, e questo consiste o di un numero finito di punti o, al più, di una successione { Àp} di punti distinti che converge a O; il punto À = O, se dim 1-i < N0 , può appartenere a ap(A) o a p(A), mentre, se dim 1-i = N0 , può appartenere a a p (A) ( con degenerazione anche non finita) o a ac(A) o a an(A) (sicuramente non può appartenere a p( A) poichè l non è com,patto).
Osservazione. L'aggiunto At di un A E L(ri) compatto è compatto (cfr. teor. 3.8.2) e quindi ha la stessa struttura spettrale di A; di più, poiché p(At) e a(At) sono immagini speculari di p(A) e a(A) rispetto all'asse reale, gli autovalori diversi da O di A t sono esattamente i coniugati complessi degli autovalori di A; e si può affermare che le degenerazioni dei corrispondenti autovalori sono uguali, ma ne omettiamo qui la dimostrazione (cfr. (20]). Osservazione. I risultati sulla struttura spettrale degli operatori compatti che abbiamo stabilito con i teoremi precedenti costituiscono la sostanza della famosa teoria di Riesz e Schauder; in essi è contenuta la cosiddetta alternativa di Fredholm ben nota nella teoria delle equazioni integrali (lineari). Nel nostro attuale contesto l'alternativa di Fredholm può essere così formulata: cons-ider·iamo l 'equaz'ione nello spazio 1-i (À-A)x=y
(a)
con A E L(ri) co·m,patto, y term·ine noto e À E C-{O}:
o l'equazione (a) am,m,ette una e una sola soluz·ione per ogni y E 1-i, o l 'equaz·ione om,ogenea (À-A)x=O amm,ette soluz·ioni non banali. Se l'equazione (b) am,m,ette soluzioni non banali, di linearmente ind·ipendenti ne ammette un numero finito e l'equazione ( a) ha soluzione se e soltanto se y E (Ker()/ - At))1..
(b)
3.9. Proprietà spettrali degli operatori compatti
261
Può essere un utile esercizio per il lettore riscontrare l'alternativa di Fredholm testé formulata nei risultati stabiliti nei teoremi precedenti. o Esercizio 1. Mostrare che lo spettro dell'operatore di Volterra del §2.11.4 si riduce al solo punto O che risulta un punto dello spettro continuo. o Esercizio 2. Studiare al variare di À E C l'equazione di Fredholm per f in L2 (a, b) :
f(x) -
À { e.p = Ker(Àp-A) o relativo all'autovalore Àp Eap (A) (c'è una qualche convenienza a indicare con un simbolo apposito, (A) appunto, l'insieme degli autovalori di A diversi da O; dp = dim Hp è la degenerazione-finita!-di Àp) e, eventualmente, un s.o.n.c. {uo,no} nell'autospazio Ho= Ker A relativo all'autovalore O (qui non indichiamo il campo per l'indice n 0 dato che la degenerazione dell'eventuale autovalore O può essere finita o non finita). Il punto è dimostrare che un siffatto sistema ortonormale è completo.
;P
Teorema 3.9.4 Sia A E L(H) compatto, autoaggiunto, non banale: allora
H=
L
EB ÀpEup(A)
1i>.P '
cioè il sottospazio generato dalla collezione {1i.xP}(Àp E ap(A)) è H. (Abbiamo preferito indicare con I::tvEup(A) 1i.xP, anzichè con V>.vEuv(A)1i>-v, il sottospazio generato dall'unione U>.vEup(A)1i.xv; il simbolo che usiamo è più significativo della struttura del sottospazio generato da una collezione di sottospazi mutuamente ortogonali; anche il nome usato per siffatto sottospazio è significativo: esso è la somma hilbertiana della collezione {H.xp} (cfr. §1.20).) Prova. Sia R il sottospazio generato dalla collezione {1t.xp}(Àp E o-p(A)), ovvero R = :Eteup(A) 1t>.p· Supposto R # 1t, sia Rl. il complemento ortogonale di R; per ogni Àp E a p(A), il sottospazio 1t>.p è manifestamente A-invariante (cioè: Xp E 7t.xp => Axp E 7t.xp), e quindi A-invariante è anche il sottospazio R; l'aggiuntezza di A garantisce poi che anche il complemento ortogonale Rl. è A-invariante. La restrizione À di A ad Rl. è allora un operatore appartenente a L(Rl.) compatto, autoaggiunto e non banale e quindi ha almeno un autovalore >.#O; ora, l'autovalore >. di À e un qualsiasi corrispondente autovettore ii. sono tali anche per A, e quindi ii. E R n Rl.; ma R n Rl. = {O}, perciò ii. = O arrivando così a una contraddizione. ■
La struttura spettrale degli operatori compatti, autoaggiunti non banali che culmina con il teorema 3.9.4 testé dimostrato dovremo "rimeditarla" in un prossimo paragrafo perché indica la via da seguire in quella che possiamo chiamare la seconda parte della teoria spettrale degli operatori, dedicata principalmente agli operatori autoaggiunti, che è di grande importanza nelle applicazioni.
263
3.9. Proprietà spettrali degli operatori compatti
Per il momento chiudiamo il paragrafo con alcuni semplici, ma interessanti, sviluppi del teorema 3.9.4. Per ogni autovalore Àp Eclp (A) di A compatto e autoaggiunto (ovviamente non banale) introduciamo l'operatore dr,
x ~ P>.vX
:=
L(up,klx)up,k, k=l
dove il significato dei simboli è quello introdotto nella premessa al teorema 3.9.4; chiaramente P>.p è il proiettore relativo all'autospazio 1-{,>.r; introducendo anche il proiettore P0 relativo al sottospazio Ker A (P0 = O se À = O non è autovalore di A) possiamo scrivere, per ogni x E 1-{, : d.,,
x
=
L
L(up,klx)up,k + Pox
ÀpEa°?{A) k=l
L
=
(P>.px)
+ Pox
ÀpEa°p(A)
ossia
x=
L
(P>.px);
ÀpEap(A)
da qui otteniamo
Ax =
L
Àp(P>.rx) 'ix E rt,,
>.7,Eap(A)
e quindi
A=
L
ÀpPÀp·
(3.5)
ÀpEap(A)
Questo risultato (per come l'abbiamo ottenuto, qualora il secondo membro fosse una serie, è da intendere che la convergenza è nel senso della convergenza forte in L(rt,)) è estremamente importante: esso fornisce la cosiddetta risoluzione spettrale dell'operatore A, esprimendo l'operatore A in termini dei suoi elementi spettrali (autovalori e autoproiettori); dalla risoluzione spettrale la struttura di A emerge in modo completo e trasparente. Osservazione. Di fatto la serie al secondo membro della (3.5) converge nella norma di L (1-i). Se l'operatore ha solo un numero finito di autovalori, l'affermazione è banalmente
264
Capitolo 3. Teoria spettrale
vera, se invece essi sono una infinità numerabile, costituiscono una successione convergente a zero. Riscritta per comodità la serie nella (3.5) sull'insieme indice dei naturali,
Il E: ÀkPkxll 2 = E: l>..kl 2 11PkXll 2 < SUPn5k$m {I.Xkl 2 } Il L; Pkxll 2 < SUPn$k$m {l>..kl 2 } llxll 2 per ogni X E 2 1 2 1t, segue II E: ÀkPkll ~ (supn.kPkx, dove i Àk sono gli autovalori e Pk è il proiettore sull' autospazio finito-dimensionale relativo a Àk- Usare l'Esercizio 4 per dimostrare che la serie Lk >.kPk converge uniformemente e quindi converge ad A. ◊
Esercizio 6. Sia A E 0(1-l) autoaggiunto e valgano: a) A ha spettro puramente puntuale, b) gli autovalori di A diversi da zero hanno degenerazione finita, c) o-p(A) è limitato e l'unico eventuale punto di accumulazione per o-p(A) è lo zero; Allora A è compatto.
Sugg. Si mostri, ricordando che A è chiuso e ha spettro puramente puntuale, che D(A) = {x E ?ti Ek 1Ak('uklx)l 2 < oo} e Ax = Ek Àk(uklx)uk, dove i Àk sono gli autovalori (eventualmente ripetuti) e {Uk }(k E N) è un s.o.n.c. di autovettori; nel caso in questione si ha D(A) = 1t e quindi A E L(H). Si usi poi l'esercizio 5.
3.10
Operatori a risolvente compatto
'fra gli operatori che hanno una teoria spettrale vicina a quella degli operatori negli spazi finito-dimensionali, oltre agli operatori compatti trattati nei paragrafi precedenti, si segnalano gli operatori a risolvente compatto. Definizione 3.10.1 Un operatore A E 0(1-l) si dice a risolvente compatto se è chiuso ed esiste ). 0 E p(A) tale che RA(). 0 ) sia un operatore compatto.
Come vedremo lo spettro di un tale operatore è legato allo spettro dell 'operatore RA(Ào) via la mappa z--+ >..o~z· Tale mappa è ben definita sul piano complesso compattificato, cioè lo spazio topologico C che si ottiene aggiungendo a C il punto all'infinito, e come applicazione da C in C è biiettiva e manda z = ).0 in z = oa e viceversa. Conviene a questo proposito introdurre anche in C la suddivisione tra spettro a( A) e risolvente p( A) di un operatore A dove a(A) e ,o(A) sono formati da o-(A) e p(A) con l'aggiunta al più del
3.10. Operatori a risolvente compatto
267
punto all'infinito, dicendo che z = oo sta in 8-(A) se a(A) ha oo come punto di accumulazione (e ovviamente altrimenti oo E p(A)). Il seguente teorema sarà utile allo studio dello spettro di A. Teorema 3.10.1 Sia A E 0(1i) chiuso e Ào E p(A). Lo spettro 8-(RA(Ào)) di RA (Ào) è ottenuto da 8-(A) di A mediante la trasformazione z -v-+ >.o1_z. Prova. Mostreremo preliminarmente che se A E O('H.) è un operatore chiuso e invertibile, lo spettro a(A) di A viene trasformato nello spettro a(A- 1 ) di A- 1 dalla mappa di inversione z----+ ½, anzi equivalentemente che ,o(A) viene trasformato in ,o(A- 1 ) dall'inversione. Sia .X#- O,>. E p(A); da (.X - A)(.X - A)- 1 = I si ha ponendo S(.X) = -A(>. - A)- 1
S(>.) = 1- >.(>. - A)- 1 =I+ >.A- 1 S(>.),
da cui
>.(: - A- 1 )S(>.) = I, quindi Im( ½-A- 1 ) = 'H.. Inoltre l'operatore ½-A- 1 è invertibile: infatti ( ½-- A- 1 )v = O equivale a v = >.A- 1v cioè Av = Àv e poiché À E p(A) si ha v = O. Dalla relazione precedente risulta (½- A- 1 )- 1 = >.S(>.) che è un operatore di L('H.); in conclusione E p(A- 1 ). Se >. = O·e >. E p(A), allora A- 1 E L('H.), pertanto >. = oo sta in ,o(A- 1 ): infatti tutti gli operatori A di L('H.) hanno lo spettro confinato in un cerchio di raggio pari alla loro norma e certamente >. = oo sta in ,o( A). Poiché per Ào E C, a(>.o - A) si ottiene da a(A) via la trasformazione z ----+ Ào - z si ha immediatamente il teorema. ■
ì
Le proprietà spettrali di un operatore a risolvente compatto sono formulate nel seguente teorema. Teorema 3.10.2 Sia A E 0(1i) un operatore a risolvente compatto: 1) a(A) = ap(A) e consiste al più di una infinità numerabile di autovalori che non ha punti di accumulazione ( al finito); 2) la degenerazione di ogni autovalore è finita; 3) RA(À) E Lc(1i) per ogni À E p(A). Prova. Se 'H. è finito-dimensionale non c'è nulla da dimostrare. Sia 7t infinito-dimensionale e sia Ào E p(A) tale che RA (.X 0 ) sia compatto, allora il suo spettro è descritto dal teorema 3.9.3. Vista la sua invertibilità, RA (>. 0 ) avrà al più una infinità numerabile di autovalori {µk} (k E N) diversi da zero e di degenerazione finita.
Capitolo 3. Teoria spettrale
268
Applicando ora il teorema 3.10.1 si ottiene immediatamente che u(A) dove i Àk sono legati agli autovalori µk di RA (Ào) dalla relazione µk
1
='
AQ -
' '
= {À 1 , ... , Àk, .. .}
k EN.
Ak
Mostriamo ora che i Àk sono autovalori di A con autospazio R>..1c u. E Rµ.1c, si ha RA(Ào)-u. = µku
= Rµ.,..
Infatti per
da cui, applicando ad entrambi i membri dell'equazione l'operatore (Ào - A): u.
1
= ,,\O -
À k
(Ào - A)u
e quindi
(Ào - A)u
= (Ào -
Àk)u
cioè u E D (A) e
quindi Rµ1c e R>,.k. Il viceversa è immediato. Abbiamo così mostrato 1) e 2). 3) Applicando la prima equazione del risolvente (cfr. la 1) del teor. 3.1.2) e tenendo conto che, essendo A chiuso, p(A) = p'(A), si ha -
quindi, dato che Lc(?t) è un ideale bilatero dell'algebra L(?t), si ha RA(À) E Lc(?t).
■
Se in più l'operatore A a risolvente compatto è autoagg·iunto e lo spazio 1i. ha dimensione non finita, allora 1) A ha spettro puramente puntuale, 2) a(A) = ap(A) consiste di una infinità numerabile di autovalori che tendono all' infinito, ciascuno con degenerazione finita.
Osservazione. Se A è un operatore autoaggiunto e ha le caratteristiche spettrali sopra elencate allora esso è un operatore a risolvente compatto. Infatti se A è autoaggiunto con spettro puramente puntuale si ha che D(A) = {x E 1t I Lk 1Àk(-u.klx)l 2 < oo} e Ax = Lk Àk(v.klx)v.k, dove {uk}(k E N) è un s.o.n.c. generato
269
3.11. Spettro di notevoli operatori
dall'operatore e i Àk sono gli autovalori eventualmente ripetuti in caso di degenerazione (cfr. esercizio 6 del §3.9). Per ogni À E p(A) il risolvente in À è definito allora dalla relazione: RA (>i.)x
1
=L
À _
Àk (Uk lx )uk,
'vx E 'H,
k
come si può verificare immediatamente risolvendo l'equazione
(>i. - A)y
= x.
Si può riscrivere la formula del risolvente senza la ripetizione degli autovalori e usando i proiettori (degeneri) sugli autospazi relativi; indicheremo con P>,.p il proiettore relativo all'auotvalore Àp. Sarà allora RA(À)x = Lp >-.!>,,,P>-. 11 x, per ogni x E 'H,. Si consideri ora un À E p(A) e si applichi il risultato dell'esercizio 4 §3.9 alla serie
Lp )..!)..PPp.
3.11
Spettro di notevoli operatori
Lo spettro della trasformata di Fourier
Si è già osservato (cfr. §3. 7) che anche per operatori unitari può darsi il caso di spettro puramente puntuale. In tal caso lo spettro di U è particolarmente semplice: esso consiste solo della chiusura {Àp} dell'insieme degli autovalori (che formano al più un insieme numerabile). I punti di accumulazione dello spettro puntuale che non sono autovalori sono ovviamente punti dello spettro continuo. La dimostrazione è praticamente quella già fatta nel §3.4 per operatori autoaggiunti con spettro puramente puntuale. Un celebre caso di operatore unitario con spettro puramente puntuale è la trasformata di Fourier. Consideriamo dapprima la trasformata di Fourier in L 2 (R). Abbiamo già mostrato in §2.6 che, indicato con {un} (n E N) il s.o.n.c. di Hermite, vale Fun = (-i)n Un, 'rfn E N. Questo mostra che F è un operatore unitario con spettro puramente puntuale e che il suo spettro è: a
(F)
= ap
(F)
=
{1, -1, i, -i}.
Capitolo 3. Teoria spettrale
270
Ogni autovalore ha evidentemente degenerazione infinita. Per la trasformata di Fourier in L2 (Rd) si ha lo stesso spettro: infatti 2 { Un 1 ® ... ® 'Und} (n1, ... , nd E N) è un s.o.n.c. in L (Rd) e si ha
Lo spettro degli operatori di moltiplicazione Rimandiamo a §2.10 e §2.17 per la definizione degli operatori di moltiplicazione. Per lo studio dello spettro degli operatori di moltiplicazione alcune osservazioni preliminari si impongono: per una qualsiasi h : X -+ C misurabile a) Mh è un operatore chiuso (cfr. 2.17.1). b) Mh è invertibile se e solo se Im(Mh) è denso (cfr. teor. 2.17.2) c) l'operatore À - Mh è ancora di moltiplicazione e precisamente è M>.-h· Pertanto dai teoremi 2.17.2 e 2.17.1 segue immediatamente: • ÀE
ap(Mh) se e solo se µ({x E
Xl h(x) = À}) > O;
• p(Mh) = p'(Mh) e À E p(Mh) se e solo seµ( {x E la funzione >.~h è essenzialmente limitata; • ÀE
Xl h(x) = --\}) = O e
ac(Mh) negli altri casi.
Lo spettro di un operatore di moltiplicazione consiste solo di spettro puntuale e spettro continuo, quindi, lo spettro residuo è vuoto. Il risolvente di Mh è: -+ -v-+
L(L2 (X, A,µ)) M 1 • >.-h
3.11. Spettro di notevoli operatori
271
Osservazione. La condizione che ,\ E a(Mh) si può allora esprimere nel seguente modo:
a(Mh) ={..\E
CI Ve> Oµ({x
EX
I lh(x) - ..\I< e}> O}.
(3.6)
In particolare poi se h: n ~ C è continua e n è un aperto o un chiuso di uno spazio Rd allora si può mostrare facilmente in base alla 3.6 che a(Mh) = Imh. Mostriamo la (3.6). Se À appartiene all'insieme del secondo membro dell'uguaglianza, per ogni e > O si può costruire le E D (Mh), le -:f O, tale che
si prenda, ad esempio, le = X&e dove Ee = {x E X I lh(x)-..XI O µ({x E X I lh(x) - ..Xl< é} > O} esiste 8 > O µ( { x E X I lh(x) - ..Xl < 8} = O e allora >..:h è essenzialmente limitata (con Il >.~h lloo < ¼); tale À appartiene quindi all'insieme risolvente p (Mh).
Lo spettro di Q e di P
L'operatore di posizione (cfr. §2.17.1) Q in L2 (R) ha uno spettro molto semplice. Poiché si tratta dell'operatore di moltiplicazione per la funzione continuar: R ~ R, r(t) = t il suo spettro è
a(Q) = ac(Q) = R. È infatti banale vedere che non ha autovalori e che Im r = R. L'operatore di posizione su L 2 [a, b] per un intervallo finito [a, b] è l'operatore di moltiplicazione per la funzione continua r : [a, b]~ R, r(t) = t, pertanto si ha in tal caso
a(Q) = ac(Q) = [a, b].
272
Capitolo 3. Teoria spettrale
Lo spettro dell'operatore P in L2 (R) si studia sfruttando l'equivalenza unitaria tra Q e P. Abbiamo infatti dimostrato in §2.19 che Q = F P p- 1 , dove F è la trasformata di Fourier. Abbiamo visto nel teorema 3.1.4 che operatori unitariamente equivalenti hanno lo stesso spettro e vengono preservate anche le caratteristiche spettrali dei punti di C. Quindi si ha
a(P)
=
ac(P)
= R.
Poiché evidentemente, per ogni n intero , n
>
1, si ha:
R se n è dispari a(Qn) = ac(Qn) = { R+ se ne, pari per equivalenza unitaria di Qn e pn si avrà:
a(Pn) = ac(Pn)
={
R
R+
se se
n è dispari ne, pari.
L'equivalenza unitaria tra operatori garantisce anche l'equivalenza unitaria dei risolventi, quindi:
e ricordando che(>. - Qn)- 1 è l'operatore di moltiplicazione M ogni >. E p (Pn) e per ogni f E L2 (R):
Rpn(>.)J = (>. - pn)- 1 f ponendo >.~r
11
= Fh>.
=
F- 1 ()., l
-Tn
1 À-Tfl
,
si ha per
F f);
e applicando la proprietà b) del teorema 2.6.6 si ha
Questo formula dice che il risolvente di pn è un operatore integrale e dà un metodo per trovare il nucleo di tale operatore integrale usando la trasformata di Fourier; tale nucleo è ovviamente definito dalla funzione, detta anche funzione di Green per l'operatore >. - pn, G (x, y, >.) = h>. (x - y).
3.11. Spettro di notevoli operatori
273
Anche lo studio dello spettro degli operatori differenziali in L 2(Rd) introdotti in §2.20 si riconduce a quello degli operatori di moltiplicazione a cui essi sono equivalenti via la trasformata di Fourier in L 2 (Rd). L'operatore Laplaciano, introdotto sempre nel §2.20 ha lo stesso spettro dell'operatore di moltiplicazione per il polinomio p (k 1 , .•. , kd) := kr+ ... +k~ a cui è unitariamente equivalente; quindi
o Esercizio. Mostrare che il risolvente di P è definito dalla relazione
Rp(À)f(x) =
x ie-i>.(y-x) f J-oo. .
{ J; ie-i>.(y-x) f
(y) dm (y) (y) dm (y)
e+ se À E e-. se
'
À E
Sugg. Calcolare con il metodo dei residui l'antitrasformata di Fourier della funzione h>,. (k) = )..~k per À E e±.
Lo spettro di alcuni operatori di derivazione Si consideri l'operatore di derivazione P in L2 ([a, b]), (a, b) intervallo finito dell'asse reale; ricordiamo che D(P) = {f E AC[a,b] I f' E L2 [a,b]} e P f := -if'. Il suo spettro è costituito da tutto il piano complesso ed è formato solo da spettro puntuale. Per ogni À E C l'equazione 1.
Àf + if'
=o
(3.7)
ha soluzione f (x) = e exp (iÀx) con e E C; poichè f così definita è un elemento di D ( P) questo mostra che À è autovalore di P con degenerazione 1. 2. Si consideri l'operatore di derivazione P0 in L 2 (a, +oo), a> -oo (cfr. Es. 3, §2.18.1) che ha come dominio D 0 := {f E W (a, +oo) I f (a)= O} definito da Pof := -if'. Si tratta di un operatore simmetrico chiuso con indici di difetto m = O ed n = 1. Il suo aggiunto è P. Dalla teoria generale dello spettro degli operatori
Capitolo 3. Teoria spettrale
274
simmetrici si ha pertanto e- = an (Po) e Apa (Po) = R. Si tratta di studiare quindi le eventuali suddivisioni dello spettro puntuale approssimativo. Si tratta di solo spettro continuo: l'operatore non ha autovalori e lo spettro residuo puro è vuoto. Infatti Ker (.-\ - P) = {O} per tutti i À E R come si vede immediatamente cercando le soluzioni dell'equazione 3. 7 che stiano nel dominio di P. Si applica quindi il teorema 3.3.2 per escudere autovalori e la definizione stessa di spettro residuo per escludere lo spettro residuo puro. Numerosi notevoli operatori differenziali sono operatori a risolvente compatto. 3. Denotiamo con A 1 l'operatore in L 2 (a, b) con (a, b) intervallo finito:
dove D1 = {J E W 1 (a, b)I J(a) = O}. A 1 è invertibile e il suo inverso è l'operatore di Volterra definito da
Kg(x) := [ ' g(y)dm(y),
Vx E (a, b),
pertanto si tratta di un operatore a risolvente compatto (sull'operatore K si veda §2.11 ed Es. 1, §3.9) Poiché lo spettro di K è costituito dal solo À = O, lo spettro di A1 è vuoto; il risolvente di A 1 è l'operatore RA 1 (.-\) di HS definito per ogni À complesso da
RA, (>.)g(x)
= - [' exp(>.(x - y))g(y)dm(y), g E L 2 (a, b).
Il nucleo del risolvente è una funzione, detta funzione di Green, che è denotata con G(x, y, .-\) :
(RA, (>.)g)(x)
=
l
G(x, y, >.)g(y)dm(y);
con G(x, y, .-\) = -'l?(x - y) exp(.-\(x - y)) dove 'l9 (t) = O se t < O e 'l9 (t) = 1 set > 1. 4. L'operatore
P (cfr.
2.18.1 Es. 2) è autoaggiunto e a risolvente compatto.
3.11. Spettro di notevoli operatori
275
Infatti l'equazione
-if' = Àf ha soluzioni del tipo J(x) = cexp iÀx, dove e E C è una costante arbitraria. Imponendo che tale soluzione stia nel dominio di f>, cioè che f soddisfi alle condizioni di periodicità f(a) = f(b) si ottengono soluzioni non banali solo per Àk = ~~:, k E Z. Questi sono dunque autovalori di f> e si controlla facilmente che la loro degenerazione è sempre 1 e l'autospazio relativo all'autovalore Àk è costituito dai multipli dell'elemento uk, uk(x) = ~ exp(i~~:x). Si riconosce quindi come sistema di autovettori generato da f> il ben noto s.o.n.c. di Fourier. Si tratta quindi di un operatore autoaggiunto a spettro puramente puntuale (cfr. §3.4) i cui autovalori tendono all'infinito: a(P) = ap(P) = {~~:} · (k E Z). Il risolvente di f> è dato dalla formula
RA À x = exp(iÀx) 9 p( ) ( ) 1 - exp(iÀ(b - a)) •( [ exp(-iÀy)g(y)dm(y) + exp(iÀ(b - a))
l
exp(·iÀy)g(y)dm(y))
dove si vede che gli autovalori sono poli del primo ordine. 5 Gli operatori PP0 , P0 P e P2 in L2 (a,b), con (a,b) intervallo finito, (cfr. Es. 1 e 2 del §2.18) sono tutti operatori autoaggiunti a risolvente compatto. Per semplicità ci poniamo sull'intervallo (0,1r) e consideriamo il primo dei due. L'equazione
-!" -Àf = o ha soluzioni f(x) = aexp( v'Xx) + bexp( v'Xx) a, b E C. Imponendo le condizioni di appartenenza al dominio di PP0 , cioè f(O) = f(1r) =Osi ottengono soluzioni non banali per Àn = n 2 , che risultano autovalori di P P0 e un s.o.n.c.
,[f
di autovettori un(x) = sin(nx), n = 1, 2, ... , il sistema di soli seni. Ogni autovalore ha degenerazione 1. Viste le caratteristiche spettrali, l'operatore ha risolvente compatto. Lasciamo come esercizio al lettore trovare lo spettro e un s.o.n.c. di autovettori per gli altri due operatori. 6. Hamiltoniana dell'oscillatore armonico
276
Capitolo 3. Teoria spettrale
È un altro esempio di operatore autoaggiunto a risolvente compatto. Si consideri l'operatore
Hs:
S(R)
~
f
~
L 2 (R) (PJ + Q1)f
(qui Ps e Qs sono le già usate restrizioni ad S(R) degli operatori P e Q). Questo operatore è ben definito e simmetrico come si può facilmente vedere con dimostrazione diretta e ha un s.o.n.c. di autovettori costituito dal sistema di Hermite. Vale infatti (ed è un conto un po' laborioso che si trova su tutti i testi classici sulle funzioni ortogonali)
Hs'Un =
2n+ 1 Un, 2
\In E N.
n;-
L'operatore è essenziamente autoaggiunto: infatti (Hs ± il)un = ( 2 1 ± i)Un e quindi si ha un E Im(Hs ± il), per ogni n, da cui V' {'Un}(n E N) C Im(Hs ±il) e questo implica Im(Hs ± il) = L2 (R); perciò entrambi gli indici di difetto sono nulli. La chiusura H di Hs è l'operatore autoaggiunto che chiamiamo Hamiltoniana dell'oscillatore armonico. Ovviamente 2n+ 1 VnEN Hun = Un, 2
e quindi si tratta di un operatore autoaggiunto con spettro puramente puntuale i cui autovalori tendono all'infinito. Non esistono quindi altri punti dello spettro oltre agli autovalori, sicché
a(H)
=
ap(H)
=
{
2n + 1} (n E N). 2
Il risolvente di H assume la forma tipica del risolvente degli operatori a spettro puramente puntuale: RH:
p(H)
~
À
~
L(L 2 (R)) RH(À),
dove Àn = 2ni l . Si tratta per ogni À di un operatore di Hilbert-Schmidt; infatti si ha Ln IIRH(À)'Unll 2 = Ln I .x_Jm 12 < 00. 2
3.11. Spettro di notevoli operatori
277
La formula del risolvente ci dà una indicazione per la funzione di Green: certamente essa è la somma in L 2 (R2 ) della serie I:n >.-.kuun(X)Un(y). 2
L'operatore numero È stato introdotto nel §2.21 sia nello spazio di Fock simmetrico che in quello antisimmetrico: si tratta in entrambi i casi di un operatore autoaggiunto a spettro puramente puntuale: indicati, come abbiamo fatto nel §2.21, con u~1 ,... ,nk,···, gli elementi del s.o.n.c. introdotti in quello stesso paragrafo nei due spazi di Fock simmetrico e antisimmetrico (.6. sta per V nel caso simmetrico e per A nel caso antisimmetrico), in base alla definizione stessa dell'operatore numero si ha N,uA
n1 , ... ,nk,···
= nuAn1 , ... ,nk,···
con n = ~knk, essendo nk i numeri di occupazione di u~1,... ,nk,···· Gli operatori di Sturm Liouville ( caso regolare) Per una migliore comprensione di quel che segue, ricordiamo qui alcuni risultati sulle soluzioni classiche delle equazioni differenziali lineari del secondo ordine (rimandiamo ad un buon testo per l'argomento, ad es. [37]). Diciamo soluzione classica dell'equazione
Poi"+ P1f' + P2I
=9
in cui i coefficienti Pi siano funzioni continue sull'intervallo (a, b) e g è localmente integrabile, una funzione h assolutamente continua su (a, b) assieme alla sua derivata tale che (p 0 h" + p1h' + p2h)(x) = g(x) per ogni x E (a, b). È noto dalla teoria delle equazioni differenziali del secondo ordine che se u 1 e u 2 sono soluzioni (ovviamente di classe C2 (a, b)) linearmente indipendenti dell'equazione omogenea Poi"+ p 1 f' + P2I = O, una soluzione h della equazione non omogenea ha la forma
h(x)
= c1u1(x) +c2u2(x) +
l
x
Xo
(
Po Y
I
)(W ( U 1, U2
))( ) (u1(x)u2(y)-u2(x)u1(y))g(y)dm(y), Y
dove xo E (a, b) e c 1 , c2 E C, avendo indicato con W(u1, u2) il Wronskiano relativo ad u 1 e u2, (W (u 1, u. 2)) (y) := u 1 (y) u; (y) - u2 (y) u~ (y). Si dimostra che, essendo le soluzioni u1 e u2 linearmente indipendenti, W(u1, u2)(y) =I O per ogni y. In particolare per equazioni differenziali della forma:
!(-(pJ')' + ql) = g r
(3.8)
278
Capitolo 3. Teoria spettrale
dove p, q, r sono funzioni continue a valori reali su un intervallo [a, b] finito dell'asse reale p è derivabile con derivata p' continua e p(x) > O e r(x) > O per ogni x in [a, b] il prodotto Po (y) W (u1, u2) (y) è costante su (a, b). È noto anche che non esiste una formula generale delle soluzioni di una equazione differenziale omogenea del secondo ordine e quindi il problema di trovare u 1 e u 2 non è sempre banale.
Veniamo ora agli operatori di Sturm-Liouville. Noi qui trattiamo soltanto un tipo di tali operatori che vengono ambientati nello spazio di Hilbert, denotato con L 2 ([a, b], r), delle (classi di equivalenza di) funzioni f: [a, b] -+ C misurabili e tali che ~a,b] IJl 2 rdm < oo. Indicata brevemente con I:,f l'espressione ¼{-(pf')' + qf} in (3.8) con p, q, r funzioni continue a valori reali su [a, b] con p derivabile e p' continua e p (x) > O, r (x) > O per ogni x E [a, b] come per la (3.8) e con D la varietà lineare {f E L 2 ([a, b], r) I f, f' ass. cont. in [a, b], I:,f E L 2 ([a, b], r)} si consideri, per O < a, /3 < 1r, la varietà lineare Do:,/3 e L 2 ([a, b], r) costituita dalle f E D che soddisfano le condizioni al contorno R 1f R2f -
f (a) cos a
J' (a) sin a = O f(b) cos/3 - J'(b) sin/3 = O, -
Consideriamo ora l'operatore
Lo:,/3 : Do:,/3
f
-+
~
L 2 ([a, b], r) I:,f.
Nota. Con le condizioni che abbiamo assunto su p, q, r gli operatori di Sturm-Liouville si dicono regolari; vengono studiati anche operatori di Sturm-Liouville, detti singolari, in cui p ed r possono assumere valore zero in uno o in entrambi gli estremi dell'intervallo (si veda ad es. [17)) . Nel caso regolare si possono dare anche differenti condizioni al contorno ottenendo ancora risultati analoghi a quello che qui enunceremo.
Teorema 3.11.1 Per O
< a, /3
.) = {
se
p(y) W(u 1,.x ,u2,.x )(y)
p(y)W(u1,.x,u2,.x)(y)
se
< y,
X
dove u 1 ,>. e u 2,>. sono due soluzioni (classiche} dell'equazione (.C -- >..)J = O che soddisfino le condizioni date ad un solo estremo ( ad es. R 1u 1,>. = O e R2u2,>. = O) e W(u 1 ,>., u2,>.) è il Wronskiano di u 1 ,>.e u2,>.Gli autospazi di Lo:,/3 hanno tutti dimensione1. Prova. (traccia; per una più completa dimostrazione cfr. (39]). Poniamo per semplicità di notazione u 1 := u. 1,>. e v.2 := u 2 ,.x. Le due funzioni u 1 e v. 2 sono soluzioni classiche linearmente indipendenti dell'equazione omogenea (.C - >..J) = O. Infatti se fossero linearmente dipendenti una delle due, per esempio la u 1 , soddisferebbe entrambe le condizioni al contorno R 1 ed R 2 e quindi >.. sarebbe un autovalore. Pertanto il Wronskiano è diverso da zero. Si può verificare per calcolo diretto che la (3.9) non è altro che la soluzione classica che soddisfa alla condizione di appartenere al dominio D 0 ,13. L'operatore integrale definito in (3.9) ha per nucleo integrale una funzione continua a pezzi e limitata su (a, b] x [a, b] e risulta pertanto un operatore di Hilbert-Schmidt su L 2 ([a,b],r) (Si noti che L 2 ([a,b],r) si può interpretare come lo spazio di Hilbert L2 ([a,b],µr) dove µr è la misura finita su [a,b] definita ponendo ~(E):= ferd·m per ogni insieme misurabile E).
Abbiamo ora da mostrare l'autoaggiuntezza di L 0 ,13; questa dimostrazione è un po' laboriosa: si procede introducendo preliminarmente un operatore minimale Lv (come abbiamo fatto per gli operatori pn) definito dall'espressione (3.8) sulla varietà lineare delle funzioni V( a, b) = C~ (a, b) e un operatore massimale L che ha invece come dominio D e si mostra che Lh = L. Dalla relazione
J.b Lf'grdm - J.b f' Lgrdm = {f,g}b- {f,g}a,
f,g ED,
dove {f, g}:r. := p(x)(f'(x)*g(x) - J(x)*g'(x)), utilizzando le condizioni al contorno segue immediatamente
J.b Lf'grdm - J.b f' Lgrdm = O,
f ,g E
Da ,/J
e quindi la simmetria di Lo,/3· Sapendo che l'aggiunto di Lo,/3 è sicuramente una restrizione di L si ha per g E D(L~ ,/3)
{J,g}b- {J,g}a
= O, f
E Do,/3
280
Capitolo 3. Teoria spettrale
e questo implica g E Do:,/3• Essendo L 0 ,13 autoaggiunto il suo risolvente non è vuoto e quindi si tratta effettivamente di un operatore a risolvente compatto. Gli autospazi sono monodimensionali: questo si può vedere direttamente dal fatto che le soluzioni classiche dell'equazione (.C - >..)J = O sono tutte combinazioni lineari di u 1 e 11. 2 e imponendo le condizioni al contorno. ■
3.12
Teoria spettrale degli operatori compatti e autoaggiunti
A partire da questo paragrafo passiamo alla seconda parte della teoria spettrale. Dopo aver esaminato in generale le proprietà spettrali di varie classi di operatori, è importante studiare la possibilità di rendere operative queste proprietà, soprattutto in vista delle applicazioni in vari campi. Per rendere operative le proprietà spettrali nelle applicazioni si devono affrontare, fondamentalmente, tre tipi di problemi: problemi di risoluzione spettrale (o, come anche si dice in modo forse più significativo, di rappresentazione spettrale), problemi di diagonalizzazione spettrale, problemi di sviluppo spettrale. Risoluz'ione spettrale ( o rappresentazione spettrale) significa esprimere l'operatore in termini dei suoi "elementi spettrali": punti dello spettro e operatori di proiezione (stiamo parlando di operatori in uno spazio di Hilbert, e i proiettori ortogonali sono gli operatori più "genuini" dello spazio di Hilbert) in qualche modo associati allo spettro. Diagonalizzazione spettrale dell'operatore significa "trasportare isomorficamente" l'operatore dallo spazio 1i a uno spazio in cui risulti naturale la definizione di operatore diagonale con cui identificarlo. Sviluppo spettrale significa esprimere un generico elemento dello spazio 1i in cui è definito l'operatore come "sovrapposizione" di elementi dello spazio 1i caratterizzati da determinate proprietà spettrali dell'operatore. I tre problemi sono fortemente correlati fra loro; i primi due, poi, sono così strettamente correlati da essere considerati, assai spesso, come due aspetti di uno stesso problema.
3.12. Teoria spettrale degli operatori compatti e autoaggiunti
281
Gli operatori autoaggiunti e gli operatori unitari, come si è visto nei paragrafi precedenti, hanno proprietà spettrali, tutto sommato, piuttosto semplici; fondamentalmente ciò è dovuto al fatto che commutano con l'aggiunto (i primi addirittura coincidono con l'aggiunto): sono, cioè, operatori normali, proprietà che condividono-si noti-con gli operatori di moltiplicazione. Nota. Abbiamo definito gli operatori normali limitatamente agli operatori di L (rl) (cfr. §3.5); nel caso di operatori non limitati, premessa ovviamente la condizione di aggiuntabilità, la sostanza della definizione non cambia: un A E O (rl) si dice normale se è chiuso, agfj'iuntabile e A t A = AA t.
Non sorprende, quindi, che ai problemi in questione si trovi una soluzione più che soddisfacente per gli operatori normali (soprattutto se limitati) e che la soluzione coinvolga operatori di moltiplicazione come vedremo nei prossimi paragrafi. Per prepararci ad affrontare questi problemi ci conviene riesaminare il caso degli operatori compatti e autoaggiunti; questi operatori hanno uno spettro puramente puntuale, costituito sostanzialmente soltanto da autovalori, e ciò permette di risolvere con poche, semplici considerazioni i tre problemi (come, del resto, abbiamo fatto alla fine del §3.9). La risoluzione spettrale è fornita dalla uguaglianza A=
L
ÀpPÀp;
ÀpEup(A)
gli "elementi spettrali" per la rappresentazione spettrale di A sono qui, molto semplicemente, gli autovalori di A e i corrispondenti autoproiettori. La diagonalizzazione si ottiene immediatamente usando un qualsiasi s.o.n.c. di 1-l generato da A per costruire un isomorfismo con lo spazio l 2 ( C) e anche lo sviluppo spettrale è immediato usando un s.o.n.c. generato da A. Un riesame di questi problemi per A compatto e autoaggiunto apparirà certamente come un modo formalmente più complicato di dire le stesse cose, ma ha il vantaggio di suggerire procedimenti adatti ad affrontare il caso generale degli operatori normali. Riprendiamo allora un operatore compatto e autoaggiunto; nel seguito ne indicheremo lo spettro con A: A= o- (A).
Capitolo 3. Teoria spettrale
282
La risoluzione spettrale, come già detto, è data da A= L
ÀP>.
>.eA
= L idA (>..) P>.,
(3.10)
>.eA
dove idA è la funzione identità di A: idA (>..) :=
À.
Per la diagonalizzazione spettrale consideriamo una collezione {1-t (À)} ( À E A) di spazi di Hilbert indicizzati da A con l'intesa che dim 1-t(À) = d(>..) sia uguale alla degenerazione dell'autovalore À (ricordiamo che d(>-.) < N0 per ogni autovalore ).. =I= O, mentre se ).. = O è autovalore, può anche essere d(>..) = N0 ; che se poi À = O non è autovalore, allora 1-t(0) = {O}). Introdotta la collezione {1-t(>-.) }(À E A), che, molto opportunamente, chiameremo "!ascio hilbertiano su A", consideriamo le sezioni hilbertiane del fascio {1-t(>..) }(À E A), cioè le mappe X: A--+ U>.eA1-t(>-.),
tali che:
).
--+
x(>-.)
x(>..) E 1-t(>..), 'tf). E A, L>.eA lii(>-.) 11 2 < oo,
1) 2)
dove, ovviamente, llx(>..)11 è la norma hilbertiana dello spazio 1-t(>..): llx(>..)11 =
J(x(À)lx(>..)). L'insieme delle sezioni hilbertiane del fascio {1-t(>..) }(>-. E A) munito delle operazioni definite puntualmente
(x + y)(>..) .- x(>-.) + y(>-.), (kx)(À) := kx (>..)
-
è uno spazio lineare (complesso) che diventa uno spazio di Hilbert 1-t se vi
introduciamo il prodotto scalare
(xly)
:=
L(x (>..) >.eA
IY (>..)).
-
Lo spazio di Hilbert 1-t così costruito a partire dal fascio hilbertiano {1-t(>..) }(>.. E A) si indica con L!eA 1-t (>..),
- LEB>.eA 1-f. (>..)'
1-t=
(3.11)
3.12. Teoria spettrale degli operatori compatti e autoaggiunti
283
ed è la somma diretta hilbertiana degli 1-f. (>..) (cfr. §1.20) . Una collezione {Un} di sezioni del fascio {11.(>..)} (>.. E A) si chiama sistema completo di sezioni ortonorrnali se, per ogni À E A- {O}, {Un(>..) }(n = 1, 2, ... , d (>..)) è un s.o.n.c. di 1-f. (>..) e Un(>..) = O per n > d (>..) e, eventualmente, per À = O, {un(O)} è un s.o.n.c. di 1-f. (O). Se {un} è una siffatta collezione, evidentemente si ha
(xlfi) = e, per ogni
x E 11.,
L L (x (>..) lun (>..))(Un(>..) lfi (>..)) n
ÀEJ\
X=
L L (un(>..) lx) Un(>..). n
ÀEJ\
Rifacendoci ora al §3.9 e, in particolare, al teorema 3.9.4 possiamo introdurre la mappa F: 1-f. -►ii.,
x ~ Fx
= x := :E :E(un (>..) lx)vn (>..), ÀEJ\
(3.12)
n
dove {Un(>..) }(n;). E A) è un s.o.n.c. di 1-f. generato dall'operatore compatto e autoaggiunto A indicato nel §3.9 con Un,>.. e {vn} è un sistema completo di sezioni ortonormali fissato di 1-f. . Chiaramente F è lineare, e altrettanto chiaramente è un isomorfismo. Il fatto interessante è che questo isomorfismo "diagonalizza" l'operatore A; infatti:
(F AF- 1 x) (>..) -
(
Ix) (>..) = :E (Un(>..) IAx)
Vn
(>..)
(3.13)
n
n
n
-
>..x (>..).
A questo punto anche il problema dello sviluppo spettrale è facilmente risolto: usando l'inverso p- 1 dell'isomorfismo F abbiamo: (3.14) ÀEJ\
n
- L L (un(>..) lx) Un(>..). ÀEJ\
n
284
Capitolo 3. Teoria spettrale
Osservazione. Ancora una volta ricordiamo che la cardinalità dello spettro A di A può essere o finita o, al più, N0 ; ovviamente in questo secondo caso, nelle considerazioni precedenti, occorre avere avvertenza per le questioni di convergenza e di completezza. '
Il successo nell'affrontare i problemi della spettralizzazione di un operatore compatto autoaggiunto è chiaramente dovuto al fatto che lo spettro di A consta, sostanzialmente, di soli autovalori (lo spettro continuo è ridotto al più al solo À = O ed è ininfluente) sicchè A è in grado di "generare" sistemi ortonormali completi di 'H.; se lo spettro dell'operatore autoaggiunto A dovesse contenere in parte "sostanziale" uno spettro continuo (o addirittura essere formato completamente da spettro continuo) l'intero problema della spettralizzazione dovrebbe essere affrontato sulla base di adeguate generalizzazioni. Dalla (3.10), che dà la risoluzione spettrale, si intuisce che la presenza di uno spettro continuo "sostanziale" comporterà l'uso di un integrale "a valori operatoriali" e quindi di una adeguata "m.isura a valori, di proiezione" sullo spettro dell'operatore. Anche l'espressione (3.11) dello spazio di Hilbert 7i in cui canonicamente è formulabile il concetto di operatore diagonale, insieme con la (3.13) che fornisce la diagonalizzazione in 'H. dell'operatore A, suggerisce l'introduzione di un "integrale diretto d·i spaz'i frilbertiani" come candidato naturale per realizzare la diagonalizzazione di A; anche per introdurre questo "integrale" si dovrà disporre di una adeguata misura sullo spettro, ovviamente strettamente correlata alla "misura" a valori di proiezione di cui sopra. A proposito di operatori diagonali si dirà che non abbiamo in realtà accennato sopra a operatori diagonali di 'H.; non l'abbiamo fatto di proposito, per non appesantire il discorso con troppe definizioni che dovremo poi formulare in un contesto più generale in uno dei prossimi paragrafi; possiamo però riparare qui rapi-
-
damente, per ciò che riguarda lo spazio 'H.=
I:tEA 7i (,X), all'omissione:
presa una funzione
f : A --+ C limitata, consideriamo il fascio di operatori (su A) {f(,X)l(,X)}(À E A), dove l(,X) è l'operatore unità di 7i ( À); questo fascio di operatori definisce un operatore
285
3.13. Misure a valori di proiezione (m. v. p.)
del quale, appunto, si dice che è un operatore diagonale di 1-i. Chiaramente l'operatore diagonale di ii.= L~eA 1-i (>..) che compare implicitamente nella diagonalizzazione (3.13) è quello associato alla funzione idANota. Per la verità, in ogni spazio di Hilbert, si possono definire canonicamente operatori diagonali: A = kl, con k E C , ma , come si vede, sono operatori banalmente diagonali (hanno un solo autovalore >. = k e un solo autoproiettore P = I).
Infine dalla (3.14), che dà lo sviluppo spettrale di un generico x E 1-i, emerge, in caso di presenza sostanziale di spettro continuo, la necessità di andare alla ricerca di "autovettori generalizzati" da usare, insieme agli eventuali autovettori ordinari dell'operatore, per costruire una base completa per lo sviluppo degli elementi dello spazio. Dal prossimo paragrafo affronteremo i tre problemi spettrali sopra ricordati provvedendo per ognuno di essi a una rapida introduzione degli strumenti necessari per la sua trattazione.
3.13
Misure a valori di proiezione (m.v.p.)
Indicheremo nel seguito con (Z, B) uno spazio localmente compatto di Hausdor.ff secondo numerabile (cfr. §A.9) munito della a-algebra B di Borel (anche se inizialmente potrebbe bastare la richiesta che Z sia un insieme non vuoto e B una generica a-algebra). Definizione 3.13.1 Dati (Z, B) e uno spazio di Hilbert 1-i, una misura a valori di proiezione-brevemente m.v.p.-su Z è una applicazione
E: B -+L(ri),
M
~
E(M),
Capitolo 3. Teoria spettrale
286
che soddisfi le condizioni 1) E (Z) = 1, E (0) = O, 2} E(M) = E(M)t, VM E B, 3}E(MnN)=E(M)E(N), VM,NEB, 4) E (UnMn) = I:n E ( Mn) , per ogni collezione { Mn}, con cardinalità < N0 , di sottoinsiemi appartenenti a B a due a due disgiunti, dove, se è il caso, la convergenza del secondo membro è quella forte. Si verifica facilmente che si ha, per ogni M, N di B,
(a) E (M) E (N) = E (N) E (M), (b) Me N ⇒ E(NncM) = E(N)-E(M)' (c) E(M UN) = E (M) + E (N) - E (M) E (N). Prendendo M = N nella 3) della definizione 3.13.1 segue che E (M) 2 = E (M) qualunque sia M E B, ciò che, insieme alla 2), mostra che E (M) è effettivamente un proiettore. Osservazione. L'applicazione E della definizione 3.13.1 ha le proprietà essenziali per meritare il nome di misura: la additività, o meglio la a-additività (si veda la condizione 4)), la proprietà di attribuire O al vuoto (si veda la condizione 1)), e la monotonicità M eN
~
E (M) < E (N) ,
quest'ultima proprietà essendo chiara da (b) se si ricorda che un proiettore è un operatore positivo.
Data una m.v.p. E su Z, per ogni x E 1-l si ottiene una misura (ordinaria} positiva (cioè a valori reali positivi) su Z ponendo µ~ (M) := (xl E (M) x),
ME B.
Di più, per ogni coppia x, y di elementi di 1-l si ha una m'isura complessa ponendo
o anche, direttamente,
287
3.13. !Vlisure a valori di proiezione (m. v.p.)
Si osservi che, qualunque sia x E 1-f., la misura positiva µf è finita, infatti
µ: (Z)
=
(xl E (Z) x)
=
llxll 2 .
Proprietà evidenti di µfv per quanto riguarda la dipendenza da x e y sono: E _- µEx,y + µEx,y', y, y' E 1i, µ x,y+y' E -kµE µ x,k11 x,y, kEC , E )* U·:) ( µ:c,y
E -_ µy,x
((µ.fv)• è definita ponendo
(µfy)•
(M)
= µfv (M)*,
per ogni ME B),
iii) µ,!Bv = µ~tx,y' BEL (1i.) tale che BE (M) = E (M) B, \:/ME B.
Sia ora f : Z ~ C una funzione misurabile limitata. Per ogni x, y E 1-f., l'integrale fz f dµ: 11 esiste; infatti:
~fvl
Nota. La misura è una misura positiva nota come "modulo" della misura complessa µx Y ( qualche autore preferisce il nome di "variazione" di E ' µx,y)· Nei trattati di teoria della misura e della integrazione si definisce il modulo lµI di una misuraµ su Z (a valori in R o mathbfC) ponendo lµI (M) := sup(~ Iµ (Mn)I)' n
dove l'estremo superiore è preso rispetto a tutte le collezioni numerabili {Mn} di elementi di Ba due a due disgiunti tali che UnMn = M, e si mostra che è una misura positiva su Z; nel caso che qui ci interessa lµ:.YI è una misura finita, poiché, come facilmente si può constatare,
(il qualche autore di cui sopra chiama "variazione totale" di
µfv
la quantità
lµfyl
(Z) .)
Capitolo 3. Teoria spettrale
288
Tornando all'integrale fz f dµ:v possiamo allora affermare, tenuto conto anche delle relazioni i) e ii), che
è una forma sesquil'ineare limitata. Dal teorema 2.3.3 si ottiene allora che esiste un operatore A I E L (1-t.) e uno solo tale che
La formalizzazione della corrispondenza f --+ A f testè individuata è fatta nel teorema seguente. Preliminarmente osserviamo che l'insieme B(Z) delle funzioni f : Z ----+ C misurabili limitate munito dei .. . soliti elementi strutturali:
(f +g)(z)
-
(kf) (z) (fg) (z) f* (z)
-
-
f(z)+g(z) k f (z), k E C, J(z)g(z) f (z)*
llflloo
-
suP ( IJ (z) I) ,
-
zEZ
è una C* -algebra con unità (l'unità è la funzione costante 1 : Z----+ C, 1 (z) := 1).
z--+
Teorema 3.13.1 Sia E una m'isura a valori di proiezione su (Z, B) e B (Z) la C -algebra delle funz'ioni m,isurabili limitate; l'applicazione
B (Z)-> L ('H), è 'un *-o·m,omorfismo, c'ioè: a) A 1+9 = A 1 + A 9 b) Akf = kA J, k E C, e) Aia= A1A9 d) Ar = A};
J ._,.., A1, dove (xlA1Y) =
fz Jdµ!v
289
3.13. Misure a valori di proiezione (m. v.p.) inoltre:
e)
IIA1II < llflloo,
J) BA 1 = A 1 B, per ogni B E L (1i) tale che BE (M) = E (M) B,
VMEB. Prova. Il fatto che l'applicazione in considerazione sia ben definita è chiaro dalle considerazioni che precedono il teorema. Veniamo quindi alle proprietà elencate: a) e b) sono evidenti; c) per provare la proprietà moltiplicativa, dato che le funzioni semplici costituiscono un sottoinsieme denso di B(Z) (vedi sostanzialmente il teorema A.3.1), basterà limitarsi a tali funzioni; siano allora J = Ln knXMn, g = Ln hnXMn; con semplici passaggi abbiamo
- L knhn (xlE (Mn) E (Mn') y) 1
n,n'
d) (xlA1-Y)
= fz J•dµ:Y = fz J•dµff,; = (ylA1x)+ = (A1xly) = (xlA}y);
e) l(xlA1y)I
= lfz fdµful < llflloo llxll llYII, quindi _ (l(xlA1Y)I) IIA1II - ;~~ llxll llYII
.;e)); >.-J(>.') la funzione g è chiaramente di Borel, inoltre 11911 00 < 1/e; quindi g E B(A); abbiamo allora, indicando con A' il complemento di 1- 1 (D (>.; e)) in A, (À -
A J) A 9 = { ( À - I) gdE A = { ( >. - I) gdEA = 1,
}A
}A'
donde la conclusione che À ~ u (Ai). 2) Sia EA ({>.})#O; allora esiste x E
7-(,, x
# O tale che EA ({>.})x = x; d'altra parte
quindi cioè
Ax
= >.x·
'
ciò significa che À è autovalore e Im E A ( { À}) e Ker (>. - A). Quest'ultima relazione, detto P>. il proiettore relativo all'autospazio Ker (>. - A), equivale a (cfr. teor. 2.7.4)
EA
({
À}) P>. = P>. E A ({À}) = E A ({À}) .
3.14. Risoluzione spettrale di operatori normali di L (1i)
295
Viceversa, sia À un autovalore e P>. il proiettore su Ker (À - A); abbiamo allora, per ogni X E 1t, A (P>.x) = ÀP>.x, e quindi
Il (À -
O -
A) P>.xll 2
= ((À -
A) P>.xl (À - A) P>.x)
(P>.xl (À - A)t (À - A) P>.x)
-
=
i
2
lfl dµi:x,
dove
f:
i
allora è anche
per ogni elemento fn
fn
f (,\')
A~ C,
:= À - À
1 ;
2
= O, Vx E ?t, della successione {fn} (n = I, 2, ... ) , lfnl dµi:x
,
: A
~ e, f n (À)
{
se IÀ - ,\'I ~ 1 se IÀ - Xl ::; 1;
1
IÀ - ,\'11/n
:=
osservato che fn ~ X (A - {À}) (puntualmente), n-oo
otteniamo
ossia donde P>.
= P>.EA ( {,\}) P>.;
À}) :f O. Dalla prima parte della dimostrazione di questo stesso punto 2) abbiamo, se E A
è evidente da questa uguaglianza che E A
({
({
À})
=f o, E A ( { À}) P>. = P>.EA
e allora dall'uguaglianza P>.
({
À}) = E A ( { À}) ,
= P>.EA ( {À}) P>. anche EA ( {,\}) P>. = P>.EA ( {À}) = P>.,
e questa equivale a Ker ( À - A) e Im E A Dunque Ker (À - A)
({
À}) .
= Im EA ({,\}),ossia P>.
= E A ( { À}) . ■
Dal teorema testé dimostrato, in particolare dal punto 1), seguono subito i due corollari seguenti.
Capitolo 3. Teoria spettrale
296
Corollario 3.14.1 (spectral mapping theorem) Sia A EL (1t) normale: per ogn'i f E B (A) continua si ha a (Ai) = f (A). Corollario 3.14.2 Sia A E L (ri) normale: supp EA della m,isura spettrale EA coincide con lo spettro di A.
= A,
cioè il supporto
Osservazione. Il teorema 3.14.2 suggerisce altre classificazioni dello spettro che, per gli operatori autoaggiunti, sono abbastanza usate nelle applicazioni alla Meccanica Quantistica. Una di queste classificazioni esprime lo spettro dell'operatore A E L (ri) autoaggiunto (ricordiamo che lo spettro residuo è vuoto) come unione di due sottoinsiemi disgiunti: O"
(A)
= A = O"ess (A) U O"disc (A),
con
(A) := {À E A I dim Im EA (D (À; e)) = No, 've> O} O"disc (A) .- {À E A I 3c >O: dimlm EA (D (À; e))< No}. O"ess
Nota. Dovremmo considerare D (>i; e)
n A,
ma l'imprecisione è ininfluente.
Il primo, O"ess (A), è chiamato spettro essenziale di A ed è chiaramente chiuso; il secondo è chiamato spettro discreto di A e non è necessariamente chiuso. Si vede facilmente che À E O"disc (A) se e soltanto se è un punto isolato dello spettro, quindi un autovalore di A (cfr. teorema 3.15.1), ed è un autovalore con degenerazione finita. Una seconda classificazione dello spettro di un operatore A autoaggiunto si introduce nel modo seguente. Si considera lo spettro ap (A) di autovalori di A (sappiamo che consta, al più, di una infinità numerabile di punti) e quindi il sottospazio 1tp di 1t che risulta dalla somma hilbertiana degli autospazi relativi a tutti gli autovalori di A; indicato con rie il complemento ortogonale di ri.p, si ha (3.15) rl = rl,p +Hc. I due sottospazi sono chiaramente invarianti per A; Ap = Apip ha spettro puramente puntuale, Ac = A P-ic ha spettro puramente continuo che indichiamo con O"cnt (A). Si scrive pertanto, coerentemente con la decomposizione
297
3.15. Calcolo operatoriale (3.15) a (A)
= ap (A) U O"cnt (A).
Si deve osservare che questa decomposizione di a (A) non è necessariamente in due sottoinsiemi disgiunti e che O"cnt (A) non coincide necessariamente con lo spettro continuo ac (A) di A; sfortunatamente anche a O"cnt (A) si dà il nome di spettro continuo di A. Noi continueremo ad attenerci alla classificazione "storica" introdotta nel §3.1 e quindi non ci sarà alcun rischio di ambiguità nell'uso del termine spettro continuo di A. o Esercizio. Si consideri su 1-l = L2 ([-1, 1]) + C l'operatore definito da A (f, k) := (Qf, O) (Q è l'operatore di moltiplicazione per la funzione r, r (t) = t, Vt E [-1, 1]) e si mostri che ac (A) non coincide con O"cnt (A).
3.15
Calcolo operatoriale
Data la misura spettrale dell'operatore normale A E L (1-l), secondo il teorema 3.13.1, si può costruire lo *-omomorfismo
B (A)
~
L (1-l) ,
(3.16)
poiché qui la m.v.p. in questione è quella spettrale di A, per questo *omomorfismo si ha ovviamente che Au1A = JA idAdEA = A e per ogni polinomio p in ,\, AT> = JA p (,\) dEA = p (A). A buona ragione si indicherà l'operatore A1 con f (A):
f (A)
:=
1
f dEA,
f
E B
(A).
Si ha dunque un calcolo operatoriale per A che ha tutte le caratteristiche del calcolo di funzioni; tutti gli operatori f (A) commutano tra loro e sono normali e (f
+ g) (A)
(k f) (A) (fg) (A) (f*) (A) -
f (A) + g (A) k f (A) , k E C
f (A) g (B) f (A)t;
Capitolo 3. Teoria spettrale
298
si ha inoltre
BEA (M)
= . EA
(M) B, VM E B (A) Bf (A)= f (A) B, Vf E B (A)
dove BE L (1-f.). Osservazione. L'operatore f (A) associato ad una f E C (A) appartiene a C* (A) e quindi, per definizione di C* (A), è limite nella topologia della norma di L (1-f.) dell'algebra di polinomi in 1, A e At; nel caso generale di una f E B (A), f (A) è un elemento di L (1-f.) che è limite forte di elementi di C* (A): infatti, per ogni x E 1-f. la misura µfA è una misura di Bore! finita su A, pertanto se f E B (A) allora f E L2 (A, B, µfA); poiché le funzioni continue sono dense in L2 (A, B, µfA) (cfr. teorema 1.12.3 e Osservazione), esisterà {gn} (n E N) e C (A) tale che JJ\ lf - 9nl 2dµfA ~ O; applicando n-oo
le proprietà del calcolo operatoriale si ha Il(! (A) - 9n (A))xll 2 = 9nl 2dµfA; si ha quindi 9n (A) ~ f (A).
JJ\ lf -
'Ira i notevoli operatori che si rappresentano via questo calcolo operatoriale abbiamo il risolvente: si ha infatti (3.17) Notiamo che, per À E p (A) , la funzione A 3 .X' ~ >-.-id1"(>-.') E C appartiene a C (A) e quindi il membro a destra nella (3.17) è un operatore appartenente alla e• -algebra e• (A) (cfr. la prova del teor. 3.14.1); indicato brevemente con R (.X) questo operatore, si hanno le relazioni R(.X) (.X -A)= (.X- A)R(.X) quindi R (.X)
=
(l
À
.:idA dEA)
(l (.X -idA)dEA) = I
= RA (.X), \:/.X E p (A).
La (3.17) permette di stabilire rapidamente la seguente proprietà. Teorema 3.15.1 Sia A E L (1-f.) un operatore autoaggiunto: se Ào è un punto isolato dell spettro allora è un polo del primo ordine di RA e il residuo in Ào è il proiettore sull 'autospazio relativo.
299
3.15. Calcolo operatoriale
Prova. Dalla formula (3.17) si vede che se Ào è un punto isolato di A esso è un polo del primo ordine, quindi un autovalore per A, come si è stabilito nel §3.2. Per il teorema
3.14.2 EA ( {Ào}) # O ed EA ({Ào}) è il proiettore sull'autospazio relativo a Ào; ma la decomposizione RA (À) = À-\ 0 EA ( {Ào}) + JA-{Ào} À-!dA dEA mostra che il residuo in Ào è E A ( { Ào}). ■
Un altro risultato importante che si può ottenere facilmente con il calcolo operatoriale è quello conosciuto come teorema di Fuglede, generalizzazione agli operatori in spazi di Hilbert infinito-dimensionali di un risultato ben noto per gli operatori negli spazi Cd: dato un A E L (1-l) normale, ogni B E L (1-l) che commuti con A commuta anche con A t. Premettiamo un paio di considerazioni utili in generale. La prima: dato A E L (1-l), possiamo definire, per ogni fissato µ E C, considerando L (1-l) come C*-algebra, l'elemento di L (7-l): exp (µA):=
:E~n. (µA)n;
(3.18)
nEN
e si verifica immediatamente che exp (-µA)= (exp µA)- 1 ; se A è norrnale possiamo definire exp (µA) anche con il calcolo operatoriale exp (µA):=
f
eµ>.dEA, A= a (A),
ed è superfluo dire che le due definizioni coincidono (se il lettore volesse verificarlo sarebbe un utile esercizio!); aggiungendo la condizione che A sia autoaggiunto, usando la (3.18) oppure usando il calcolo operatoriale (ma il secondo è più comodo) si ottiene che, perµ= i, exp (iA) è unitario. La seconda: se B E L (1-l) commuta con A E L (1-l), cioè se BA = AB, allora BAn = An B, \:In E N, e quindi B exp (µA) = exp (µA) B, Vµ, E C (e per mostrarlo si sfruttano le proprietà di C* -algebra di L (1-l)). Ciò premesso formuliamo il teorema. Teorema 3.15.2 (Fuglede} Sia A E L (1-l) normale e B E L (1-l): se BA= AB allora BAt = AtB.
Capitolo 3. Teoria spettrale
300 Prova. Per ogni fissatoµ
E
C introduciamo
exp (µ.A):=
L nEN
~ (µAf = n.
parimenti introduciamo exp (µAt) :=
r eµ>.dEA;
}A"
L ~n. (µAt)n;
nEN
osserviamo che exp (µ.At) appartiene alla C•-algebra generata da A; quindi deve esistere una Jµ E C (A) tale che exp (µA t) = JA Jµ (..X) dEA e questa funzione, come si può facilmente vedere è exp (µ..X•). Dunque
di nuovo usando il calcolo operatoriale otteniamo
Per prosequire notiamo che -i (µAt - µ• A) è autoaggiunto cosicché µAt - µ•A= iT con TE L (1t) autoaggiunto, e quindi exp(µAt - µ•A)= exp(iT) è un operatore unitario che indichiamo con U (µ); l'aggiunto U (µ) t è U (-µ). Consideriamo ora l'operatore S (µ) := exp (-µAt) Bexp (µAt); poiché B commuta (per ipotesi) con A e quindi con exp (µ• A), abbiamo S (µ)
-
exp ( - µA t) B exp (µ•A) exp ( - µ•A) exp (µA t)
-
exp (-µAt) exp (µ• A) Bexp (-µ• A) exp (µAt)
-
exp (-µ.At +µ.•A) Bexp (µAt - µ•A),
cioè S (µ)
= U ( - µ) B U (µ) ,
donde
11s (µ) Il < IIBII,
\/µ E C.
Ora, per ogni x, x' E 1t, la funzione Sx,:r.':
C--1-C,
s:r.,:r.'
(µ)
:=
(xlS (µ) x')
è chiaramente olomorfa (in definitiva, S (µ) è definito con gli esponenziali exp(-µAt) e exp(µAt)), è limitata (infatti lsx,x' (µ.)I< IIBll llxll llx'II) e quindi è una costante (teorema di Liouville); valutandola per µ = O otteniamo Sx,x' (µ.) = (xlBx'), \/µ. Dunque exp(-µAt)Bexp(µAt)
= B,
3.15. Calcolo operatoriale
301
cioè
Quindi B commuta con tutte le potenze (At)n, n con At. ■
= O, 1, ... ; in
particolare B commuta
Si noti la seguente conseguenza del teorema di Fuglede: ogni B E L (ri) che commuti con un A E L (ri) normale com,muta con tutti gli operatori appartenenti a C* (A) e con tutti gli operatori f (A) con f E B (A). Si noti infatti che da Tn -!+ T, Tn, T E L (H), e BTn = TnB, Vn E N si ha BT = T B e si faccia uso dell'Osservazione.
Il calcolo operatoriale si mostra proficuo anche nella definizione della radice quadrata di un operatore positivo. Ricordiamo che A E L ('Jt) si dice positivo se (xlAx) > O per ogni x E 1-t. Un A EL (H) positivo è evidentemente autoaggiunto (cfr. §2.3).
Teorema 3.15.3 Sia A E L (ri) un operatore positivo. Esiste uno e un solo
operatore di L (1-l) positivo, che indicheremo con
v'A,
tale che A= (
v'A)
2 •
v'A := JA .Jf..dEA, dal calcolo operatoriale si ha subito A = ( \l"A) • Sia B E L(H) positivo e sia B 2 = A; B commuta con A (infatti AB= B 2 B = BB 2 = BA) e quindi commuta con \l"A. Si ha allora Prova. Dalle ipotesi si ha che A e R+ (cfr. §3.5); preso 2
(B
+ \IA)(B - \/A)= O;
(3.19)
per ogni x E 1-(. si ponga y = (B - JA)x; dalla (3.19) si ha (ylBy) + (yl\/"A y) = O e quindi, per la positività dei due operatori (ylBy) = (ylJA y) = O; per ogni k E Ce z E 1-(. abbiamo anche (y + kzlB (y + kz)) > O e quindi k. (zlBy)
+ k (ylBz) + lkl 2 (zlBz) > o,
Vk E C
da cui (yjBz) = (Bylz) = O per ogni z E 1-(., da cui By = O; analogamente \l"A y = O. Risulta allora IIYll 2 = (yl(B - JA)x) = ((B - JA)ylx) = O quindi (B - JA)x = O, per ogni x E 1-(., cioè B = JA. ■
302
3.16
Capitolo 3. Teoria spettrale
Integrale diretto di spazi hilbertiani
Riprendiamo uno spazio misurabile (Z, B) come in §3.13 e corrediamolo di una misuraµ di Borel positiva. Consideriamo una coppia, che chiameremo fascio hilbertiano su Z misurabile,
({1-i (ç)} (ç
E Z),
{xn} (n
E
N)),
dove {1i (ç)} (ç E Z) è un fascio hilbertiano su Z (cioè una collezione di spazi di Hilbert indicizzata da Z) e {xn} (n E N) una collezione fondamentale di sezioni del fascio {1i (ç)} (ç E Z), cioè una collezione, indicizzata da N, di mappe ç-+ Xn (ç) Xn : Z --+ 1i (ç) ,
u
,EZ
tali che
l)xn(ç)Eri(ç), VçEZ, 2) V nEN { Xn ( ç)} = 1i (ç) , Vç E Z, 3) le funzioni Z 3 ç--+ (xn (ç) lxm (ç)) ogni n,m E N.
E
C sono funzioni misurabili per
Osservazioni 1. Una sezione del fascio {1-i (z)} (z E Z) è, per definizione, una mappa x : Z--+ Uzezri (z) tale che, per ogni z E Z, si abbia x (z) E 1i (z). 2. Coerentemente con la convenzione, stabilita all'inizio del capitolo, di escludere dalle nostre considerazioni (parlando di spazi di Hilbert) lo spazio banale, sarà sempre inteso, nel seguito, che 1i (ç) -I {O} Vç E Z. Dato un fascio hil bertiano su Z misurabile ({1i (ç)} (ç E Z) , (n E N)), diciamo che una sezione x è misurabile se la funzione Z 3 ç--+ (xn (ç)
{ Xn}
lx (ç)) E C
è misurabile per ogni Xn della collezione fondamentale, e che due sezioni x, y sono equivalenti se sono uguali quasi dappertutto su Z. Le sezioni su Z che a noi interessano sono le sezioni che chiameremo hilbertiane) e che denoteremo con x, y, ... ): sono le sezioni x : Z --+
3.16. Integrale diretto di spazi hilbertiani UçeZ 1i (ç) ,
ç --►
303
x (ç), misurabili e tali che
Nell'insieme di queste sezioni, quozientato con la relazione di equivalenza dell'uguaglianza quasi dappertutto su Z, si introduce in modo naturale una struttura di spazio con prodotto scalare definendo
(x + y) (ç) := x (ç) + y (ç) , \:/ç E Z, (kx)(ç) .- kx(ç), kEC, \:/çEZ,
(Xjy) .-
fz (X (ç) Jij (ç)) dµ.
Come notazione stiamo trattando gli elementi di questo spazio come sezioni, anziché come classi di equivalenza di sezioni; ciò continueremo a fare, anche come terminologia, nel seguito, salvo i casi in cui fosse troppo forte il rischio di confusioni.
Lo spazio con prodotto scalare testé introdotto risulta completo (dimostrazione esclusivamente tecnica che omettiamo; cfr. [11] Part II Ch. 1 §5) e quindi è uno spazio di Hilbert. Possiamo dunque formulare la definizione seguente. Definizione 3.16.1 Dato un fascio hilbertiano su Z misurabile ({1i (ç)} (ç E Z) , {Xn} (n E N)), si chiama integrale diretto su Z del fascio, e si indica con 1i (ç) dµ, lo spazio di Hilbert delle classi di equivalenza delle sezioni hilbertiane ottenuto con la costruzione sopra considerata.
Il
Il
È coerente con la notazione 1i (ç) dµ per l'integrale diretto del fascio {1i (ç)} (ç E Z) indicare l'elemento x di 1i (ç) dµ definito dalla sezione hilbertiana ç-----+ x (ç) con il simbolo x (ç) dµ.
Il
Il
Osservazione. Nelle nostre ipotesi sullo spazio topologico Z e sulla misura µ (Z è localmente compatto di Hausdorff e secondo numerabile eµ è di Borel) lo spazio di Hilbert integrale diretto 1i (ç) dµ risulta separabile (cfr. (11] Part II Ch. 1 §6).
Il
Capitolo 3. Teoria spettrale
304
Jl
Alcuni semplici esempi mostrano che l'integrale diretto 1i (ç) dµ è la generalizzazione quasi ovvia di costruzioni che ci sono già familiari. Esempio 1. Sia Z un insieme finito; munito della topologia discreta Z è compatto di Hausdorff secondo numerabile; tutte le funzioni f : Z ~ C sono misurabili e, per ogni fascio hilbertiano {7t (i) (i= 1, 2, ... , N)} (N è la cardinalità di Z), tutte le sezioni sono quindi misurabili. Presa come misura µ su Z la misura di conteggio l'integrale diretto 1t (ç) dµ ha come elementi tutte le sezioni del fascio {7t (i) (i= 1, 2, . . . , N)} e si identifica con la somma diretta degli spazi 7t (i):
1>
Jt
1
N
EB
1t (ç) dµ
= L1t (i).
z
i=l
Esempio 2. Z insieme di cardinalità ~o- Munito Z, come nell'esempio precedente, della topologia discreta e della misura di conteggio (Z risulta ora localmente compatto anziché compatto, la misura di conteggio è ora a-finita anziché finita), sulla base delle stesse considerazioni dell'esempio precedente si ha che l'integrale diretto ha come elementi tutte le sezioni {x (i)} (i E Z) tali che LieZ llx (i) 11 2 < oo e si identifica con la somma hilbertiana degli 7t (i) (cfr. §1.20): 1>
l,i z
1-t (e) dµ
=
f
1-t (i).
i=l
Esempio 3. (Z, B) con Z localmente compatto di Hausdorff secondo numerabile. Considerato C come spazio di Hilbert, prendiamo il fascio hilbertiano su Z costante: {7t (ç)} (ç E Z) con 1t (ç) = C, Vç E Z, e la sezione costante canonica ç ~ x 1 (ç) := 1. Vista la ovvia misurabilità di ç ~ (x 1 (ç) lx 1 (ç)), otteniamo un fascio su Z misurabile le cui sezioni misurabili si identificano con le funzioni da Z in C misurabili. Corredato (Z, B) anche di una misura µ, le sezioni hilbertiane si identificano con le funzioni f : Z ~ C misurabili e tali che J lfl 2 dµ < oo; l'integrale diretto JJ 1t (ç) dµ si identifica con lo spazio 1>
L 2 (Z, B,µ):
fz/fJ 1-t (cl dµ = L 2 (Z, s, µ). Esempio 4. Più in generale, essendo ancora (Z, B) con Z localmente compatto di Hausdorff secondo numerabile e corredato di una misura µ, fissiamo uno spazio di Hilbert 1t 0 e in 1t0 un qualsiasi sistema numerabile di generatori cioè una qualsiasi collezione numerabile { x~} (n E N) di elementi di 1t 0 tale che Vn { x~} = 1t 0 . Poiché tutte le funzioni da Z in 1t0 costanti sono misurabili, il fascio hilbertiano su Z costante {1t (ç)} (ç E Z), dove 7t (ç) = 7-f. 0 , 'r/ç E Z , insieme con la collezione fondamentale di sezioni costanti {xn} (n E N), Xn (ç) = x~ti Vç E Z, costituisce un fascio hilbertiano su Z misurabile le cui sezioni misurabili si identificano con le funzioni f : Z ~ 7-f. 0 misurabili e quelle hilbertiane con le funzioni f: Z ~ 1t 0 misurabili e tali che fz Il! (ç) l 2 dµ < oo. L'integrale diretto 7-f. (ç) dµ si identifica, in questo caso, con lo spazio Li0 (Z, B, µ): 1>
Jt
3.16. Integrale diretto di spazi hilbertiani
l~
1t (ç) dµ
305
= Li, (Z, B, µ).
Nota. Lo spazio L~ 0 (Z, B, µ) è lo spazio di Hilbert che si ottiene munendo lo spazio lineare delle (classi di equivalenza di) funzioni f : Z -+ 'H 0 , ( "funzioni a valori vettoriali") misurabili e tali che fz Il! (ç) l 2 dµ < oo del prodotto scalare (flg) := fz (J (ç) 19 (ç)) dµ.
Riprendiamo il discorso sull'integrale diretto_ di spazi di Hilbert, che, per comodità di notazione, indicheremo anche con H,
Senza spingere la discussione oltre i limiti di nostro interesse, tre punti dobbiamo ancora illustrare. Il primo riguarda i sistemi completi di sezioni ortonormali. Un sistema completo di sezioni ortonormali è una collezione {Un} (n E N) di sezioni misurabili del fascio ({1i (ç)} (ç E Z) , { Xn} (n E N)) tali che: • se dim 1-i (ç) = N0 , {un (ç)} (n E N) è un s.o.n.c. di 1i (ç), • se dim1i(ç) < N0 , {un(ç)}(n= 1,2, ... ,dimrl(ç)) è un s.o.n.c. per 1i (ç), mentre Un ( ç) = O, per n > dim 1i (ç). Si dimostra l'esistenza di sistemi completi di sezioni ortonormali che evidentemente hanno un ruolo simile a quello c!_ei s.o.n.c. degli spazi di Hilbert. Per esempio si può scrivere per ogni x, y E H, X
-
lffi L)u,. z
(xly) =
(ç)
IX (ç))u,. (ç) dµ
nEN
r L(x (ç) lun (ç))(un (ç) IY (ç))dµ.
lznEN
Il secondo punto riguarda la definizione di operatore diagonale. Dato un fascio hilbertiano su Z misurabile ({H (ç)} (ç E Z), {xn} (n E N)), un fascio di operatori Z 3 ç --+ A (ç) E L (1i (ç)) si dice misurabile se per ogni sezione misurabile x del fascio hilbertiano la sezione Z 3 ç --+ A (ç) x ( ç) E 1i (ç)
306
Capitolo 3. Teoria spettrale
è misurabile (o equivalentemente, se le funzioni Z 3 ç-+ (xn (ç) IA (ç) Xm (ç)) E C sono misurabili per ogni n, m); un fascio di operatori Z 3 ç -+ A (ç) E L (1-l (ç)) misurabile si dice poi essenzialmente limitato se essenzialmente limitata è la funzione (misurabile) Z 3 ç-+ IIA (ç) Il E R. Se Z 3 ç -+ A (ç) E L (1-l (ç)) è un fascio di operatori misurabile ed essenzialmente limitato, per ogni sezione hilbertiana x la sezione ii, con ii (ç) := A (ç) x (ç) , è hilbertiana e quindi il fascio di operatori misurabile ed essenzialmente limitato Z 3 ç-+ A (ç) EL (1-l (ç)) definisce un operatore lineare A E L(H) che si usa indicare con A (ç) dµ.
ll
ll
Definizione 3.16.2 Dato l'integrale diretto H = 1-l (ç) dµ, si chiama operatore decomponibile di H l'operatore A E L(H) definito dal fascio misurabile ed essenzialmente limitato ç -+ A (ç):
A= LJ) A (ç) dµ; si chiama operatore diagonale di H l'operatore A1 E L(H) definito dal fascio {misurabile ed essenzialmente limitato) Z 3 ç-+ A1 (ç) := f (ç) I (ç) E L (1-l (ç)), dove f E L 00 (Z, B, µ); si chiama operatore continuamente diagonale di H l'operatore A1 E L(H) analogamente definito dal fascio Z 3 ç-+ A1 (ç) := f (ç) 1(ç) EL (1-l (ç)) dove f E Coo (Z).
Nota. C00 (Z) è la C* -algebra delle funzioni f : Z ~ C continue che si "annullano all'infinito" (cfr. §1.9).
Chiaramente l'insieme degli operatori diagonali costituisce una *-algebra commutativa Z di L(H); parimenti, l'insieme degli operatori continuamente diagonali costituisce una sotto*-algebra commutativa
Y di L (
H).
Come sappiamo, anche L 00 (Z, B, µ) così come C00 (Z), con la struttura usuale, sono *-algebre commutative: è facile vedere che la corrispondenza f -+ A1 definisce uno *-isomorfismo di L00 (Z, B, µ) con Z (si ricordi che 1-l (ç) i= {O}, Vç E Z), così come definisce uno *-isomorfismo di C00 (Z) con
Y.
3.16. Integrale diretto di spazi hilbertiani
307
Osservazione 1. Si potrebbe dimostrare che sia Z che Y sono *-sottoalgebre chiuse (nel senso della topologia della norma operatoriale) della C*-algebra L( esse sono quindi C* -algebre commutative di L(H). La prima, Z, è, però, una C* -algebra speciale: essa è anche debolmente chiusa (chiusa, cioè, anche nella topologia debole di L(H)) e costituisce, anzi, la chiusura debole di Y; inoltre essa sicuramente contiene l'unità di L(H), mentre Y contiene l'unità se e soltanto se Z è compatto. In termini ufficiali: Z appartiene a quella sottoclasse delle C* -algebre di operatori che sono chiamate algebre di von Neumann (Z è "un'algebra di von Neumann commuta-
H):
tiva").
Non possiamo qui "allargarci" sulle algebre di von Neumann anche se è vero che esse hanno un ruolo molto importante in molte applicazioni concrete delle teorie spettrali. Nell'appendice H il lettore può trovare definizioni e alcuni elementi introduttivi sulle algebre di von Neumann insieme a segnalazioni bibliografiche adeguate. Osservazione 2. Gli operatori diagonf:li di H sono chiaramente operatori di moltiplicazione limitati per lo spazio H; essi sono la generalizzazione degli operatori di moltiplicazione limitati degli spazi L 2 (X, A,µ) (cfr. §2.10). Si possono introdurre anche operatori diagonali non limitati di H, generalizzazione degli operatori di moltiplicazione non limitati degli spazi L2 (X, A,µ) (cfr. §2.17). Essi sono definiti da fasci Z 3 ç -v-+ f (()I (() con f : Z --+ C misurabile e hanno dominio
esattamente come nel §2.17 si vede facilmente che D I è una varietà lineare densa in H. Il terzo e ultimo punto riguarda un fatto che istintivamente si può dare per scontato, ma la logica vuole che non sia passato sotto silenzio. Se in luogo della misura positivaµ su Z si considera una misura positivaµ' equivalente a µ ci si aspetta, ragionevolmente, che lo spazio di Hilbert Il rl (ç) dµ' sia isomorfo allo spazio di Hilbert Il 1-l (ç) dµ. Effettivamente, indicata con p la derivata di Radon-Nikodym di µ' rispetto a µ, l'applicazione che a i = Ilx(ç)dµ fa corrispondere i'= Ilx'(ç)dµ,' con x'(ç) = p(c;)- 112 x(c;), è
308
Capitolo 3. Teoria spettrale
un isomorfismo canonico di
(X'l:iì') =
fz (X' (
ç)
J: 1t (ç)
lf/ (ç) )dµ'
=
- fz (X (ç) IY (ç))p (ç)3.17
1
dµ con
fz (p (
J: 1t (ç)
ç)-1/2 X (ç)
p (ç) dµ =
dµ'; infatti:
IP (ç)-1/2 y (ç) )p (ç) dµ
fz (X (ç) IY (ç))dµ
=
(XIY).
Diagonalizzazione di operatori normali di L (1-l)
L'integrale diretto di spazi di Hilbert ci permette di affrontare il secondo teorema fondamentale della spettralizzazione degli operatori normali di L (1t). Nell'integrale diretto di spazi di Hilbert, infatti, si possono definire canonicamente, come abbiamo visto, gli operatori diagonali. Gli operatori diagonali di un integrale diretto H di spazi di Hilbert introdotti con la definizione 3.16.2 costituiscono, come si è visto, una *-algebra commutativa Z *-isomorfa alla *-algebra commutativa L 00 (Z, B, µ) delle (classi di equivalenza di) funzioni f : Z ~ C essenzialmente limitate. Per evitare di limitarsi, poco opportunamente, a una formulazione inutilmente riduttiva, conviene formulare il teorema di diagonalizzazione per l'algebra di von Neumann W* (A) generata dall'operatore normale A anziché sempliceniente per l'operatore A. Abbiamo già introdotto la C*-algebra C* (A) generata da A come la più piccola C*-algebra (con unità) in L (1t) contenente A (cfr. §3.14); analogamente, W* (A) è la più piccola algebra di von N eumann di L (1t) contenente A. Il lettore è di nuovo invitato a fare riferimento all'appendice H per gli elementi essenziali, per i nostri scopi, sulle algebre di von Neumann (dette anche W*-algebre); potrà così anche apprendere che, concretamente, W* (A) è la ch-iuS'ura debole di C* (A) (W* (A) si ottiene cioè aggiungendo a C* (A) i punti l-imite di C* (A) nel senso della topologia debole degli operatori) ciò che equivale a dire (cfr. teorema H.1.5) che è formata dagli operatori di L (1t) che commutano con tutti gli operatori che commutano con A.
309
3.17. Diagonalizzazione di operatori normali di L (1i)
Per la costruzione dell'integrale diretto di spazi di Hilbert adeguato, faremo uso del concetto di misura basica e quindi dobbiamo premetterne la definizione insieme con alcuni rilievi essenziali per il seguito; anche per le misure basiche rimandiamo all'appendice I per maggiori particolari. Riprendiamo lo spazio misurabile (Z, B). Definizione 3.17.1 Data una m.v.p. E su Z, si chiama misura E-basica su Z una misura positiva v su Z tale che, per ogni M E B,
M è v-nullo se e soltanto se M è E-nullo. Nota. M è v-nullo significa v (M)
= O,
M è E-nullo significa E (M)
= O.
Se v è una misura E-basica su Z, tre circostanze importanti e immediate sono da rilevare (sottointendendo E parleremo brevemente di misura bas'ica su Z): i) se v' è anch'essa una misura basica su Z, allora v' è equivalente a v: una misura basica su Z, quindi, se esiste, è unica a meno di equivalenze;
µty
µtY
ii) tutte le misure su Z, dove (M) := (xl E (M) y) (cfr. §3.13) sono assolutamente continue rispetto alla misura basica v; iii) supp v = supp E.
L'esistenza di una misura basica per una data m.v.p. E su Z è discussa nell'appendice I; qui ci interessa prendere atto del risultato che se EA è la misura spettrale di un A E L (1i) (cfr. teorema 3.14.1), esiste una misura BA-basica finita VA su A, A essendo lo spettro di A. Poiché supp EA = A (corollario 3.14.2), abbiamo da iii) suppvA = A. Questa proprietà di una misura basica v A è essenziale per immergere iniettivamente la C* -algebra C (A) nella C* -algebra L00 (A, B, v A) e procedere poi all'estensione dell'isomorfismo di Gelfand W : C (Al --+ C* (A) pervenendo così all'isomorfismo isometrico, che indichiamo con w :
Capitolo 3. Teoria spettrale
310
dove Px,y è la derivata di Radon-Nikodym di µ~t rispetto a VA (si veda per maggiori particolari (11) Part. I Ch. 7, §1). L'isomorfismo isometrico '11, estensione dell'isomorfismo di Gelfand \li, ha un ruolo molto importante nel teorema di diagonalizzazione spettrale.
Teorema 3.17.1 {diagonalizzazione spettrale) Sia A E L (ri) normale, A lo spettro di A, VA una misura su A EA-basica e \li : L 00 (A, B, v A) -+ W* (A) l'estensione dell'isomorfismo di Gelfand: esiste uno spazio di Hilbert integrale diretto HA
= j'JJ 'H.(>..) dvA,
e un isomorfismo isometrico
che trasforma l'algebra di von Neumann W* (A) generata_ in L (ri) da A nell'algebra di von Neumann ZA degli operatori diagonali di HA; esattamente, per ogni BE W* (A), si ha
(F BF- 1X) (>..)
= f (>..)X(>..), \/X=
l/J
X(>..) dvA,
con f E L 00 (A, B, vA) tale che B
= '11 (f).
In particolare
Prova. (traccia) Anche per questo teorema ci limiteremo a indicare una traccia di dimostrazione. Il lettore interessato ai particolari può vedere (11) Part II Ch. 6. Si comincia con l'osservare che, essendo EA la misura spettrale di A e VA una misura basica su A (spettro di A; l'esistenza di VA, già sottolineata nelle considerazioni premessse al teorema, è stabilita nell'appendice I), tutte le misureµ~~'
µ:,~ (M)
:= (xlEA
(M) y),
!vf E B'
X'
y E '}-{,'
sono assolutamente continue rispetto a v A; si introduce allora per ognuna di esse la derivata di Radon-Nikodym Px,y: A~ e rispetto a VA:
3.17. Diagonalizzazione di operatori normali di L (1-f.)
311
È chiaro dalle proprietà delle µf; (nella loro dipendenza da x e y) elencate in i) e ii) del §3.13 che, per ogni fissato À E A, la mappa p (À)
:
1t X 1t (x,y)
~
e
~
p (À) (x, y) := Px,y (À)
(3.20)
è sesquilineare positiva, quindi hermitiana. Passando al quoziente 1-t/Np(>.), dove Np(>.) := {x E 7t
I Px,x (À) =O},
e introducendo il prodotto scalare:
([x] (À) I (y] (À))
:= Px,y
(À)
([x] (À) sta a indicare la classe di equivalenza, cioè l'elemento di 7t / Np(>.) cui appartiene x), si ottiene uno spazio con prodotto scalare (naturalmente occorre controllare che il prodotto scalare è correttamente definito); procedendo infine al completamento si ottiene uno spazio di Hilbert 7t (À). Si è così costruito un fascio hilbertiano su A {7-t (À)} (À E A). Occorre ora affiancarlo con una collezione fondamentale di sezioni (cfr. §3.16). Prima di procedere, però, è doveroso segnalare che nella costruzione precedente abbiamo sovrasemplificato--tecnicamente-il problema evitando delicate questioni di misurabilità e di misura: come è noto, la derivata di Radon-Nikodym di una misura µ finita assolutamente continua rispetto a una misura li è una funzione misurabile (anzi liintegrabile) che è univocamente determinata a meno di v-equivalenza (cioè, a meno di una uguaglianza v-quasi dappertutto); la p (À) definita in (3.20), nella sua dipendenza da À ha, quindi, le proprietà di sesquilinearità e positività a meno di sottoinsiemi di A v-nulli ma dipendenti, in generale, da x e y. La costruzione dello spazio di Hilbert 7t (À) illustrato sopra non ha quindi successo, in realtà, per tutti i À E A. Indicato con N il sottoinsieme di A nei punti del quale la costruzione non ha successo, si può però dimostrare che N è misurabile e ha misura v A-nulla; inoltre (si ricordi che nella definizione di fascio hilbertiano abbiamo esplicitamente escluso il caso 7t ={O}), indicato con N 0 il sottoinsieme di A- N nei punti del quale la costruzione approdasse a un 7t (À) = {O}, anche per N 0 si può dimostrare che è misurabile e ha misura v A nulla. In definitiva, quindi, i punti À E N U No risultano ininfluenti sulla costruzione dell'integrale diretto di spazi hilbertiani su A; per definitezza si può associare a tali punti uno spazio di Hilbert arbitrario. Riprendiamo la traccia delle dimostrazione ignorando i punti À E N U No ininfluenti. Si introduce, per ogni À E A, la mappa canonica
x ~ F (À) x := [x] (À); preso un riferimento ortogonale {un} (n E N) di 7-t, la collezione { v.:} (n E l\T), dove À
~ v.: (À) := F (À) Un
= [v-n] (À),
312
Capitolo 3. Teoria spettrale
è evidentemente una collezione fondamentale di sezioni del fascio {1t (À)} (À E A) (si ri-
cordi che le derivate di Radon-Nikodym Px,y sono funzioni misurabili). Costruito il fascio hilbertiano su A misurabile
( {1t (À)} (À
E
A) , {u:}
(n
E
N))
si ha, secondo la definizione 3.16.1, lo spazio di Hilbert integrale diretto
La mappa
F: 1t -+HA,
x
"-"'+
Fx ,
con À "-"'+ (Fx) (À) := F (À) x,
chiaramente lineare e suriettiva, è isometrica; infatti
La mappa F è quindi un isomorfismo dello spazio di Hilbert 1t con lo spazio di Hilbert HA.
Infine, per ogni BE w• (A) , essendo B conto anche di questa proprietà di F ,
(FxjF (By))
-
(xjBy)
-i -i -i -
= \l! (!) , con f
E L 00 (A, B, vA), si ha, tenendo
= (xl\l! (/) y)
fdµf~
=
i
f Px ,ydVA
f (À) ([x] (À) I [y] (À) )dvA ([x] (À)
I/ (À) I (À) [y] (À))dvA
(FxlB1Fy) ,
donde
Osservazione. Il teorema 3.17 .1 afferma l'esistenza di un preciso procedimento di diagonalizzazione per un A E L (1t) normale. Il procedimento è strettamente correlato a quello di risol·uzione spettrale (teorema 3.14.1) , radice comune ne è l'isomorfismo di Gelfand w : C (A) ~ C* (A). Gli elementi
3.18. Spazi di Hilbert attrezzati (triplette di Gelfand)
313
fondamentali del procedimento sono: una misura basica v A sullo spettro A di A, l'isom,orfismo \Jl: L (A, B, vA)---+ W* (A) estensione dell'isomorfismo di Gelfand, da un lato, e dall~altro un fascio {1-l (À)} su A di spazi hilbertiani e quindi l'integrale diretto HA, Ja W*-algebra ZA degli operatori diagonali di HA e l'isomorfismo F: 1-l ---+HA. È ragionevole porsi la questione dell'unicità di questa "struttura diagonalizzante" per A. Si dimostra (cfr. [11] Part II, Ch. 6) che essa è sostanzialmente unica; precisamente: se V1A, \Jl 1 : L 00 (A, B, V1A) ---+ W* (A), {1-l1 (À) }, H1A, Z 1A ed F1 : 1-l ---+H1A sono analoghi di VA, \Jl, {1-l (À)}, HA, ZA ed F (cioè: v 1A misura di Borel positiva su A con suppv1A = A, \Jl 1 : L 00 (A,B,v 1A)---+ W* (A) isomorfismo estensione dell'isomorfismo W : C (A) ---+ C* (A), ecc.), si ha che v1A è basica (quindi equivalente a v A) e che esiste un fascio {U (À)} (À E A) di is~morfismi U (À) : 1-l (À) ---+ 1i1 (À) che definisce un isomorfismo Udi HA con H1A tale che U F = F1. Possiamo dunque affermare che il teorema 3.17.1 garantisce l'esistenza di una "struttura diagonalizzante" per A la cui sostanziale unicità lascia la possibilità di realizzazioni diverse ma equivalenti. Nel seguito di una tripla (vA, HA, F) costituente una realizzazione della struttura diagonalizzante per A diremo, brevemente, che è una diagonalizzazione spettrale di A.
3.18
Spazi di Hilbert attrezzati ( triplette di Gelfand)
Nel §1.5 abbiamo introdotto la definizione generale di spazio lineare topologico osservando che gli spazi con prodotto scalare e gli spazi normati costituiscono il tipo più semplice fra gli spazi lineari topologici. Questo tipo di spazi, o meglio la loro versione con proprietà di completezza, cioè gli spazi di Hilbert e di Banach, è stato abbondantemente sufficiente per i nostri scopi; anzi lo spazio di Hilbert è stato finora-dichiaratamente-la base praticamente esclusiva di tutte le nostre considerazioni e discussioni. Nel terzo dei problemi della teoria spettrale per l'operatore autoaggiunto A cui si accennava nel §3.12, quello dello "sviluppo spettrale", l'eventuale
Capitolo 3. Teoria spettrale
314
deficit di un numero sufficiente di autovalori, e quindi di autovettori, causato dalla presenza di una parte sostanziale di spettro continuo, incide in maniera diretta e particolarmente critica. È intuibile, quindi, che si vada alla ricerca di autovalori e relativi autovettori generalizzati di A per supplire al deficit testé ricordato. E' abbastanza chiaro che questa ricerca costringe a uscire dallo spazio di Hilbert 1-l, restando però strettamente correlati ad esso. Negli spazi di Hilbert e negli spazi di Banach la topologia è generata da un prodotto scalare e da una norma, rispettivamente. Un modo che ci può apparire più generale di introdurre in uno spazio lineare E una topologia compatibile con la struttura lineare potrebbe essere quello di munire E di una seminorma. Una seminorma su uno spazio lineare E sul campo K è una mappa p:E_.R,
x_.p(x)
che soddisfa le condizioni: 1) p (x + x') < p (x) + p (x'), 2) p ( kx) = Ik Ip ( x) , k E K. Da queste condizioni seguono le proprietà a) p (O)= O, b) IP (x) - p (x') I < p (x + x') . Come si vede, a una seminorma, confrontata con una norma, manca la stretta positività, ossia p- 1 (O) =/:- {O}; è immediato vedere che p- 1 (O) è una varietà lineare in E.
Anche una seminorma p su E genera una topologia compatibile con la struttura lineare: le condizioni 1) e 2) (che sono garanti della continuità delle operazioni lineari) coincidono con quelle richieste a una norma; la base di intorni dello O costituita in uno spazio normato dalle "sfere aperte" di raggio r, S (O; r) = rV, dove V:= {x E E I llxll < 1}, è sostituita dai sottoinsiemi, che continuiamo a chiamare "sfere aperte" di raggio r e a indicare con gli stessi simboli: S(O;r) = rV dover> O e V:= {x E Ejp(x) < 1}.
Una differenza fondamentale è che la topologia generata da una seminorma p non è di Hausdorff (a meno che p non sia una norma!), mentre
3.18. Spazi di Hilbert attrezzati (triplette di Gelfand)
315
resta vero che, come succede per una norma, la seminorma stessa p è continua, come si vede dalla relazione b) ricordata sopra. Nota. Base di intorni di O di uno spazio lineare E significa una collezione Bo di sottoinsiemi (non vuoti) di E che soddisfi le condizioni: 1) ogni U E Bo contiene O, 2) per ogni U e U' appartenenti a Bo esiste in Bo un W tale che W e U n U', 3) per ogni UE Bo esiste in Bo un U' tale che U' + U' e U, 4) ogni UE Bo gode della proprietà: per ogni k E K con lkl < 1, kx EU sex EU, 5) ogni U E Bo gode della proprietà: per ogni x E E esiste un kx > O tale che x E hU se lhl 2:: kx. Non è certo difficile constatare che la collezione delle sfere aperte, sia di una norma che di una seminorma, soddisfa le cinque condizioni elencate. La topologia di E determinata dalla collezione Bo si ottiene prendendo come famiglia di intorni Io di O la totalità dei sottoinsiemi di E che contengano almeno un membro della collezione Bo e poi traslando Io secondo x per ogni x E E.
Ora, che si voglia considerare o no come uno svantaggio non disporre della proprietà di Hausdorff, sta di fatto che c'è un modo canonico per ottenere, partendo da uno spazio seminormato (E, p), uno spazio normato (anche da noi ripetutamente usato in precedenza senza particolari sottolineature). Si osserva che NP = p- 1 (O) è una varietà lineare ch-iusa di .E e che la relazione fra elementi di E X
rv
X I := X -
XI
Np
E
è una relazione di equivalenza; sull'insieme quoziente E/ NP le operazioni (indichiamo con [x] la classe di equivalenza cui appartiene x)
[X]
+ [y] .- [X + y] , k [x]
:=
sono ben definite e conferiscono a mappa
[kx] ,
E/ NP
k E K,
la struttura di spazio lineare; la
Il [x] Il:= p(x)' è ben definita ed è una norma.
Capitolo 3. Teoria spettrale
316
Possiamo concludere che non è munire E di una seminorma il passo da compiere per "uscire" dalla classe degli spazi di Banach in modo adeguato alle nostre necessità. Possiamo pensare di munire E non di una singola seminorma, bensì di una collez·ione {p,} (, E f) di seminorme. Lasciando, al momento, indeterminata la cardinalità dell'insieme degli indici r, vediamo come generare una topologia di E dalla collezione {p,} (, E r). Introdotta, per ogni seminorma P,, la sfera aperta di raggio 1,
V, := {x E
El P, (x)
< 1}
e quindi le sfere aperte di raggio r > O r V, := { x E
El P, (x)
< r} ,
prendiamo la collezione Bo di tutte le intersezioni finite
effettivamente questa collezione soddisfa le condizioni elencate poco sopra nella Nota; costituisce perciò una base di intorni di O di E, e quindi se ne ottiene per E una topologia (compatibile con la struttura lineare) che si dice generata dalla collezione {p,} (, E f) di seminorme. Una collezione {P,} (, E r) di seminorme su E può essere compatibile con la proprietà di Hausdorff: cond'iz·ione necessaria e sufficiente perché la topolog'ia generata dalla collezione {P,} (, E f) di seminorme su E sia di H ausdorff è che
n
p~l
(0) = {O},
,er
cioè che O sia l'unico elemento cui tutte le seminorme della collezione assegnano il valore O; evidentemente una condizione sufficiente è che almeno una delle seminorme della collezione sia una norma. E ora una breve discussione della cardinalità della collezione. Se la collezione consta di una sola seminorma già sappiamo che non ci frutta una generalizzazione significativa rispetto alla classe degli spazi normati. Anche nel caso di una collezione di cardinalità finita, {p1 ,p2 , ... ,PN}, non otteniamo, topologicamente, niente di più generale di quanto otteniamo con
3.18. Spazi di Hilbert attrezzati (triplette di Gelfand)
317
una sola seminorma: infatti N
P (x) := LPn (x),
VxE E,
n=I
è una seminorma che genera su E la stessa topologia generata dalla collezione {P1,P2, ... ,PN}. È questo un caso particolarmente semplice di due collezioni di seminorme su E che si dicono equivalenti, in accordo con la definizione
generale: due collezioni {P,} (, E r) e {pc;} (8 E ~) di seminorme su E si dicono equivalenti se generano la stessa topologia per E.
Il caso di collezioni {Pn} (n E N) infinito-numerabili copre, invece, situazioni estremamente numerose e significative. Da sottolineare che con una collezione di seminorme numerabile e garante della proprietà di Hausdorff la topologia generata su E è anche metrizzabile (e lo è soltanto se la collezione di seminorme ha le proprietà dette), come è dimostrato nei trattati sugli spazi lineari topologici (cfr., ad esempio, [35]), e con una distanza invariante per traslazioni, per esempio d (X x') ·= ~ _.!._ Pn ( X - x') ' . ~ 2n 1 + Pn (x - x') Gli spazi lineari topologici la cui topologia è generata da una collezione (anche non numerabile) di seminorme costituiscono una classe di importanza fondamentale nell'Analisi Funzionale: la classe degli spazi localmente convessi; questo nome è dovuto al fatto che la base di intorni dello O costruita nel modo detto sopra a partire dalla collezione di seminorme è formata da sottoinsiemi convessi. La definizione formale è: uno spazio lineare topologico 4> si chiama spazio localmente convesso se esiste in 4> una base di intorni di O costituita da sottoinsiemi convessi. Si dimostra nei trattati sugli spazi lineari topologici che per uno spazio lineare topologico 4> sono equivalenti le affermazioni: a) 4> è uno spazio localmente convesso;
Capitolo 3. Teoria spettrale
318
b) la topologia di è generata da una collezione di seminorme di . In uno spazio localmente convesso è comodo fare riferimento ad una determinata collezione di seminorme che generi la topologia, quindi considereremo coppie (, {P,} ('Y E I')), indicando la scelta fatta della collezione di seminorme. Nella classe degli spazi localmente convessi quelli la cui topologia è di Hausdorff e generata da una collezione numerabile di seminorme (quindi metrizzabile) e completa sono chiamati spazi di Fréchet. Spazi di Fréchet particolarmente semplici sono dunque gli spazi di Banach e di Hilbert cui finora abbiamo rivolto il nostro esclusivo interesse. Purtroppo, pur coprendo, come abbiamo già detto, numerose situazioni di grande interesse, la classe degli spazi di Fréchet non è sufficiente per i nostri scopi e quindi dobbiamo ricorrere alla classe, più ampia, degli spazi localmente convessi di Hausdorff; ciò ci costa la rinuncia alla "metrizzabilità garantita", ma nei casi di nostro interesse la mancanza della metrizzabilità sarà, almeno parzialmente, compensata dalla presenza di un'altra struttura cui accenneremo fra poco. Possiamo ora formulare la prima definizione importante di questo paragrafo. Deve essere chiaro che, parlando di uno spazio localmente convesso (, {P,} ('Y E I')) è inteso che la collezione di seminorme {P-r} ('Y E I') è garante della proprietà di Hausdorff per la topologia generata su . Sia dunque (, {P,} ('Y E I')) uno spazio localmente convesso. Per ogni seminorma P-r consideriamo il sottospazio di p~ I
(o) := {X E IP-y (X) = o}
e quindi lo spazio quoziente /p--:; 1 (O) ziente .., della norma
Il [x] Il
= ,;
:= P--,
muniamo questo spazio quo-
(x); A
infine completiamo lo spazio normato , ottenendo lo spazio di Banach ..,. Se p1 < p1 , allora p~,1 (O) e p-:; 1 (O); quindi ..,, e ..,, 4>..,, e 4>-r e l'inclusione canonica i--,,,-y : ,, -+ , è un operatore lineare continuo; come tale può essere univocamente esteso alla inclusione canonica (cfr. teor. 2.12.1) i--,,,-y : 4>..,, -+ 4>,.
3.18. Spazi di Hilbert attrezzati (triplette di Gelfand)
319
Nota. P-r < P-r' significa, ovviamente, P-y (cp) < P-r' (cp), Vcp E
U =conv
u
Uk
(3.21)
kEN
dove gli Uk sono sfere in Ck e con conv indichiamo la chiusura convessa. Per il punto iv) lfin (C) è uno spazio nucleare; inoltre non è metrizzabile. Ogni applicazione lineare definita su l fin (C) risulta continua (la composizione di una qualsiasi applicazione lineare con le inclusioni ik : Ck fin (C) risulta continua in modo ovvio, dato che tutte le applicazioni lineari definite sugli spazi finito-dimensionali sono continue).
~z
Gli spazi nucleari sono molto numerosi e frequenti soprattutto nella teoria delle distribuzioni e le sue applicazioni. Noi ci limiteremo qui a ricordarne uno anche per il suo ruolo nella spettralizzazione di importanti operatori. Si tratta dello spazio S(Rd) brevemente detto "spazio delle funzioni a decrescenza rapida (con tutte le derivate di qualsiasi ordine)" che in passato abbiamo incontrato ripetutamente come varietà lineare densa di L 2 (Rd); all'atto della sua introduzione (cfr. §1.11) abbiamo accennato a una sua topologia, molto più forte di quella ereditata da L2 (Rd), limitandoci a segnalare che cosa significhi la convergenza di una successione { f n} (n E N). Ora
322
Capitolo 3. Teoria spettrale
possiamo precisare che si tratta di una topologia generata dalla collezione numerabile di seminorme (di fatto norme) {Pn} (n E N) dove
(si veda il §1.10 per il significato di Dkcp e di lkl; ovviamente x = (x 1 , x 2 , ... , xd) E Rd e llxll 2 =XI+ ... + x~)Le norme della collezione (a) sono chiaramente hilbertiane: infatti Pn (cp) = J(cplcp)n con
(cpl1P)n =
1J1+ llxli2) R
2
n (
L
(Dkcp (x))* Dk?j,(x)
)dm (x).
0$lkl~n
La collezione (a) di seminorme è una delle molte collezioni di seminorme, tutte equivalenti tra loro, per S(Rd) e l'abbiamo scelta proprio perché è una "collezione hilbertiana". Non è difficile stabilire il punto 2) della definizione 3.18.l concludendo così che S(Rd) è uno spazio nucleare. Per questo rimandiamo però ai testi' specializzati (si dimostra anche che S(Rd) è uno spazio completo e quindi è uno spazio di Fréchet nucleare). Veniamo ora alla seconda definizione fondamentale di questo paragrafo.
Definizione 3.18.2 Si chiama spazio di Hilbert attrezzato (brevemente R.H.S.) una coppia (, 1-f.), con spazio nucleare e 1-f. spazio di Hilbert, che soddisfi le condiz'ioni seguenti; 1) è contenuto in 1-f. come varietà lineare densa, 2) la topologia nucleare di è più forte di quella generata su dal prodotto scalare ereditato da 1-f.. Nota. Nella letteratura in lingua inglese si usa comunemente il termine rigged Hilbert space e questo è anche il motivo per la sigla R.H.S. che abbiamo introdotto con la definizione 3.18.2 e che useremo correntemente nel seguito.
Conseguenza immediate della definizione è che l'inclusione canonica i : -+ 1-f. è continua e con immagine densa. Da un corollario del teorema di Hahn-Banach si ha allora che il trasposto ti : 1-f.* -+ * è iniettivo ( qui il teorema di Hahn-Banach è inteso nella sua versione generale per gli spazi
3.18. Spazi di Hilbert attrezzati (triplette di Gelfand)
323
lineari topologici di Hausdorff e non nella versione ridotta citata nel §1.23; cfr. (35] Cap. 18 Coroll. 5). Va sottolineato che il duale * di uno spazio localmente convesso è lo spazio lineare (con le operazioni definite come nel §1.21) dei funzionali lineari 'lj;* : -► K continui e allora giova ricordare che la continuità di un funzionale lineare equivale (come in tutti gli spazi lineari topologici) alla continuità nel punto O e che la metrizzabilità, se disponibile, è sufficiente a garantire l'equivalenza fra continuità nel punto O e continuità sequenziale (quindi un funzionale lineare 'lj;* su uno spazio nucleare metrizzabile appartiene al duale * se e soltanto se per ogni successione { cpn} (n E N) , cpn E , che converge a O, la successione { < 'lj;*, cpn >} (n E N) converge a O). Il duale 1-f.* di 1-f. può essere identificato con una varietà lineare del duale * di ; e poiché 1-f.* è identificabile, come sappiamo, con 1-f. tramite l'isomorfismo isometrico di Riesz, otteniamo in modo naturale le inclusioni e 1-f. e *.
Ciò giustifica pienamente il simbolo e 1-f. e * spessissimo usato per indicare il R.H.S. ( , 1-f.) e il nome alternativo di "tripletta di Gelfand" ( rendendo così anche il doveroso omaggio al grande matematico russo ideatore della struttura matematica R.H.S.). Nella tripletta di Gelfand e 1-f. e *, per come la conosciamo finora, c'è una evidente dissimmetria: ed 1-f. hanno una determinata topologia, mentre nulla si è detto, al proposito, per il duale *. Nel duale di uno spazio lineare topologico localmente convesso si possono introdurre diverse topologie, tutte in modo piuttosto naturale, e la loro scelta è spesso dettata dal contesto applicativo in cui il duale viene usato; nelle applicazioni alla Meccanica Quantistica delle triplette di Gelfand la topologia conveniente per * è ancora oggetto di di battito (cfr. [30]). Nel nostro contesto istituzionale una buona topologia per * è la cosiddetta topologia debole; di essa ci limitiamo a indicare il significato di convergenza d·i s·uccession i:
di una successione {'l/J~} (n E N), 'lj;~ E *, si dice che converge ( debolm,ente) a 'lj;* E * se, per ogni cp E , la successione numerica { < 'lj;~, cp >} (n E N) converge a < 'lj;*, cp > e a sottolineare due proprietà (che non sono, peraltro, esclusive della topologia debole):
Capitolo 3. Teoria spettrale
324
1) è una topologia di Hausdorff, 2) per ogni operatore lineare A : ---+ continuo, il trasposto t A : * ---+ * è continuo. Altre proprietà della topologia debole per * che dovessero interessarci verranno introdotte nel momento in cui se ne manifestasse la necessità. Per quanto riguarda la tripletta di Gelfand e 1i e * la convenienza della topologia debole per * è mostrata dal fatto che, essendo la mappa canonica (cfr. §1.23)
< := < o., 'P >,
o. E *,
biiettiva (cfr. Prop. 35.1 in [35]) e quindi ** identificabile con , si hanno su e 11. e * notevoli conseguenze:
i) 11. è denso in *; ii) la topologia indotta da * su 11. è meno forte di quella hilbertiana; iii) è denso in * ; iv) la topologia indotta da * su è meno forte di quella nucleare. Ma l'aspetto più vicino ai nostri scopi garantito dalla topologia debole per * è espresso nel teorema seguente. Teorema 3.18.1 Sia e 11. e * un R.H.S. con * munito della topologia debole: per ogni operatore A E L (11.) tale che a) A() e ( è invariante per A), b) A r : ---+ (restriz·ione di A a ) è continuo nella topologia nucleare d·i si ha' che il trasposto t(Ar) : * ---+ * è continuo ed è un'estensione di At, . cioe \
La prova di questo teorema è praticamente ovvia.
325
3.18. Spazi di Hilbert attrezzati (triplette di Gelfand)
Per un A E L (ri) che si trovi nelle condizioni del teorema 3.18.1 diremo che è definito sul R. H. S. e 1i e * e indicheremo t (Arei>) semplicemente con t A. Come si vede, un operatore A E L (ri) definito sul R.H.S. e 1i e * significa la quaterna di operatori Arei,, A, At, t A, con Ar e A,
Ate tA
e A r continuo su , A e A t continui su ri, t A continuo su *. Si noti che se A E L (ri) è autoaggiunto la quaterna diventa una tripletta e le inclusioni diventano Ar
e
A
e
t A.
Per gli operatori autoaggiunti il teorema 3.18.l può essere esteso anche al caso di operatori non limitati. Teorema 3.18.2 Sia e 1i e * un R.H.S. con * munito della topologia debole: per ogni operatore A E O (ri) autoaggiunto tale che a) DA :J , b) A () e , c) Arei, : --? è continuo nella topologia nucleare di , si ha che il trasposto t ( A t) : * --? * è continuo ed è una estensione di A, cioè t(Ar) rDA = A.
Pertanto, A E O (ri) autoaggiunto definito sul R.H.S. significa la tripletta di operatori Ar
e
A
e
e 1i e
*
tA
con A t et A continui, rispettivamente, su e su * e A chiuso in ri. Terza (e conclusiva) definizione di questo paragrafo. Definizione 3.18.3 Dato un A E L (ri) , oppure un A E O (ri) autoaggiunto, definito su un R.H.S. e 1i e *, si chiama autovettore generalizzato di A relativo all'autovalore generalizzato À E C un funzionale 'l/J* E * non banale tale che
< 'lj)*, Acp >=
À
< 'lj)*, cp >,
'icp E ,
326
Capitolo 3. Teoria spettrale
cioè tale che
Autovettori e autovalori in senso ordinario di A (A E L (H), oppure A E O (H) autoaggiunto, definito su un R.H.S. e H e *) sono anche autovettori e autovalori in senso generalizzato, come si può facilmente constatare; non è vero, in generale, il contrario, anzi può darsi anche il caso che un autovalore generalizzato non appartenga neppure allo spettro di A (è ben inteso che la parola "spettro" ha qui il significato introdotto in §3.l)(cfr. [2) e la bibliografia ivi inclusa). Nel seguito, quando intenderemo riferirci esclusivamente ad autovalori e autovettori in senso ordinario useremo i termini tradizionali, autovalore e autovettore, mentre useremo esplicitamente i termini autovalore generalizzato e autovettore generalizzato per riferirci ad autovalori e autovettori in senso generalizzato.
3.19
Sviluppo spettrale nel caso di operatori normali
La struttura R.H.S. con la conseguente definizione di autovettori e di autovalori generalizzati ci permette di affrontare il terzo problema fondamentale della teoria spettrale degli operatori di L (H) normali: quello dello sviluppo degli elementi di 1-l in "autovettori" di un dato operatore A E L (H) normale. Premettiamo al teorema fondamentale in proposito il teorema seguente che mostra l'adeguatezza della struttura R.H.S. alla risoluzione del problema (rimandiamo il lettore all'Osservazione del §3.17 per il significato del termine "una diagonalizzazione spettrale di A"). Teorema 3.19.1 Dato un A EL (H) normale con spettro A, sia
una diagonalizzazione spett_Tale di A e {Un} (n E N) un sistema completo di sezioni ortonormali di HA (cfr. §3.16). Se A è definito su un R.H.S.
327
3.19. Sviluppo spettrale nel caso di operatori normali
u; (.X) dv
A
}AnEN
si può scrivere soltanto per i r.p E 4> e non per ogni x E 1i, ma si deve tener conto che 4> è denso in H.
Esempio. Per illustrare i tre teoremi spettrali scegliamo il semplice esempio dell'operatore di moltiplicazione Q su un intervallo [a, b] finito di R: Q: L 2 ([a,b])----+ L 2 ([a,b]), definito da (QJ)(>..) = >..J(>..). L'operatore è autoaggiunto, il suo spettro è solo spettro continuo ed è A= [a, b]. Osserviamo che, se indichiamo con mB la restrizione della misura di Lebesque su [a, b] ai boreliani, si ottiene che L2 ([a, b], B ([a, b]), m 8 ) coincide con L2 ([a, b]), quindi a tutti gli effetti possiamo qui usare la misura m 8 . Per quanto riguarda la risoluzione spettrale lasciamo al lettore provare che la misura spettrale di Q è, per ogni boreliano M in [a, b], data da EQ (M) = Mx(M), l'operatore di moltiplicazione per la funzione caratteristica di M. Per quanto riguarda la diagonalizzazione, nulla si deve fare poiché l'operatore è già un operatore diagonale (L 2 ([a, b]) è un integrale diretto di spazi hilbertiani, si veda l'esempio 3 del §3.15), u~a misura basica essendo la misura mB. Veniamo ora alla scelta di una tripletta di Gelfand per Q. Si consideri lo spazio P dei polinomi nella variabile >.. e si ponga su P la topologia che lo rende limite induttivo degli spazi finito-dimensionali pk formati dai polinomi di grado al più k: P è uno spazio nucleare essendo limite induttivo di spazi nucleari; una successione {'-Pn} di polinomi converge in questa topologia se è tutta contenuta in pk per un qualche k e se converge uniformemente. Essendo P limite induttivo di spazi finito-dimensionali tutte le applicazioni lineari su P a valori in uno spazio localmente convesso sono continue (si ragiona come nell'esempio del §3.18); in particolare l'inclusione canonica i : P ~ L 2 ([a, b]) risulta continua (ponendo su P la topologia induttiva e non quella t>
330
Capitolo 3. Teoria spettrale
ereditata da L 2 ([a, b])); questo mostra che la topologia su P è più fine di quella ereditata da L 2 ([a, b]). Inoltre QP e P, e QtP è continuo perché lineare. Abbiamo quindi che P cL2 ([a, b]) e P* è una tripletta di Gelfand e che Q è definito su P cL2 ([a, b]) e P*. Di fatto 'P è lo spazio che si otterrebbe utilizzando la costruzione nella dimostrazione del teorema 3.19.2 a partire dalla funzione costante 1 E L2 ([a, b]), 1 (À) = 1.
Nello spazio L2 ([a, b]), inteso come integrale diretto, la 1, intesa come sezione À ~ u (.X) = 1, costituisce un sistema completo di sezioni ortonormali. Per ogni fissato À, la applicazione u* (;\) : P -4C definita da< u* (;\),
=
BtAt
e
AtBt,
cioè: se B commuta con A, Bt commuta con At (si tenga conto, per la prova, del teorema 2.14.3). Indicato con {A}' l'insieme degli operatori di L (H) che commutano con A, possiamo poi vedere facilmente che, se A, oltre che aggiuntabile, è anche chiuso, il sottoinsieme {A}' n {At}' di L (H) è una *-algebra con unità fortemente chiusa, ossia è (cfr. teorema H.1.1) una W* -algebra. Per un A E O (H) autoaggiunto {A}' n {At}' = {A}', ovviamente; poniamo W* (A) := {A}" e chiamiamo W* (A) algebra di von Neumann "generata" da A. Il simbolo e la denominazione non sono completamente abusivi: W* (A) è un'algebra di von Neumann commutat·iva e, se A è autoaggiunto limitato è esattamente la W*-algebra generata da A (cfr. appendice H). o Esercizio. Dimostrare che se A E O (H) è chiuso e aggiuntabile, {A}' n {At}' è una *-algebra con unità fortemente chiusa.
Teorema 3.21.3 Dato A E O (H) autoaggiunto, sia x (A) la sua trasformata di Cayley, W* (A) la W*-algebra "generata" da A e W* (x(A)) la W* -algebra generata da x (A): W* (A)= W* (x(A)).
Capitolo 3. Teoria spettrale
342
Prova. Se B E L (rt) commuta con A, B commuta anche sia con A+ i che con A - i, cioè BA e AB implica B (A± i) e (A± i) B; A+ i e A- i sono inettivi e gli inversi (A+ i)- 1 1 e (A - i)- appartengono a L (rt) e quindi B (A± i) e (A± i) B implica B (A± i)- 1 = 1 (A±i)- Be quindi Bx(A) = x(A)B; dunque {A}' e {x(A)}' e perciò {x(A)}" e {A}", ossia w• (x (A)) e w• (A). Viceversa: se B commuta con x(A), poiché 1-x(A) è iniettivo e Im (I - x(A)) = DA, abbiamo, tenendo conto che A= i (I+ x (A)) (I - x (A))- 1 ,
BA(l-x(A))
donde BA
-
iB(I+x(A))
-
i(l+x(A))(l-x(A))- 1 (1-x(A))B AB(l-x(A)),
e AB, ossia BE {A}'; dunque {x (A)}' e {A}' e perciò w• (A) e w• (x (A)).
■
Osservazione. Sottolineiamo che un A autoaggiunto non limitato non appartiene alla W* -algebra da esso "generata"; A è, come si dice, affiliato alla W*-algebra W* (A). In generale si dice che A è affiliato a una W*-algebra A se x (A) E A; in questo senso W* (A) (che, come afferma il teorema 3.21.3, coincide con W* (x(A))) è la più piccola W*-algebra cui sia affiliato A.
Le considerazioni precedenti ci indicano come ottenere una misura E A_ basica v A, EA essendo la misura spettrale di A del teorema 3.21.2. La W*-algebra W* (A) = W* (x (A)) ci garantisce che esiste, e ci fornisce una misura Ex(A)-basica Vx(A) sullo spettro a (x(A)) (vedi i teoremi I.1.8 e I.1.7 e la costruzione di un vettore ciclico x E 7i per il commutante A' di una W*-algebra A nell'appendice H). Esattamente come dalla misura spettrale Ex(A) di x (A) abbiamo ottenuto la misura spettrale EA di A (cfr. la prova del teorema 3.21.2), dalla misura Ex{A)-basica Vx(A) otteniamo la misura EAbasica v A. Poniamo VA
(M)
:= Vx(A)
(x(M)),
'iMEB(A);
e possiamo controllare rapidamente che effettivamente
VA
è EA-basica.
Possiamo ora formulare il teorema di diagonalizzazione per A E O (1-l) autoaggiunto.
3.21. Teoremi spettrali per A E O (1t) autoaggiunto
343
Teorema 3.21.4 ( diagonalizzazione spettrale} Per ogni A E O (1-l) autoaggiunto esiste uno spazio di Hilbert integrale diretto
dove A trico
= a (A)
e v A è una misura su A E A -basica, e un isomorfism,o isome-
F: 1-l---+ HA che trasforma l'algebra di von Neumann W"' (A) "g~nerata" da A nell'algebra di von Neumann ZA degli operatori diagonali di HA; esattamente, per ogni B E W"' (A) si ha
(F BF- 1x)
(.\) = f (.\) x (.\),
con f E L 00 (A, B (A), vA) tale che B metrico definito da
= \li(!), dove \li è l'isomorfism.o iso-
(Px,y è la derivata di Radon-Nikodym di Inoltre, posto
f (A)
:=
1
µf~
f dEA, .
f
rispetto a 1.1A).
E M
(A) ,
si ha
( F f (A) p-l i) ( À) = f (À) i ( À) , dove
i> I
:= {
Vi E D J
x E HA I JA IJ (.\) l2 llx (.\) ll 2dvA < oo};
in particolare
Prova. Per la prima parte del teorema la (traccia di ) dimostrazione coincide con quella dell'analogo teorema 3.17.1. Per la seconda parte, indicato con Ai l'operatore diagonale (non limitato) (A 1i) (A) := J (A) x (A),
Capitolo 3. Teoria spettrale
344 occorre dimostrare che: 1) F Di= DI e 2) F l (A) x Orbene: 1) se x E D f la catena di uguaglianze
i 1/1
2
dµ:A
-
i Il (..\)1
-i -i
= A1Fx,
2 Px,x (..\)
Vx
E
D1 .
dv A
2
I! (-X)l lii (.X) i1 2 dvA
-
Il (..\)1 2 ll(Fx) (..\) ll 2 dv A
-
mostra che i = Fx E D /; se, viceversa, i E DI la stessa catena di uguaglianze, percorsa a rovescio, mostra che x = p- 1 i E D 1 ; 2) qualunque sia y E D 1 e i ED 1 , abbiamo poi
(xlFJ(A)y)
-
(FxlFJ(A)y)
-i e quindi, poiché
D/
= (xll(A)y) =
f (..\) Px,ydVA
=
i (x
i fdµ!;
(..\)I/(..\) 1(..\) y (..\) )dvA
(xlA 1 y) = (xlA 1 Fy)
è denso in
HA
(cfr. Osservazione 2 §3.16),
FJ (A) y
= A1FY,
Vy
E D1. ■
Osservazione. Per quanto riguarda la sostanziale unicità di una "struttura diagonalizzante" per A si possono ripetere le considerazioni dell'Osservazione al §3.17 con appropriate varianti (non possiamo parlare della C*-algebra C* (A) generata da A, bensì della C* -algebra C* (x( A)) generata da x (A)). Anche nel caso di A E O (1-f.) autoaggiunto una tripla (vA, HA, F) costituente una struttura diagonalizzante per A sarà detta diagonalizzazione spettrale di A.
Teorema di sviluppo spettrale Per estendere il teorema di sviluppo spettrale per operatori di L (1-f.) norm,ali al caso di operatori autoaggiunti non limitati non ci occorrono ulteriori strumenti rispetto a quelli di cui già disponiamo. Nel §3.18 abbiamo già detto che cosa significa che un A E O (1-f.) autoaggiunto è definito sul R.H.S. e 1-f. c*; poiché il fatto di essere definito su un R.H.S. è l'unica condizione che interviene nel teorema 3.19.1, il teorema
3.21. Teoremi spettrali per A E O (H) autoaggiunto
345
3.19.l resta perfettamente valido per un A E O (H) autoaggiunto in luogo di un A E L (H) normale. E veniamo quindi all'estensione del teorema 3.19.2. Teorema 3.21.5 Sia AE O (H) autoaggiunto: A è definito su un R.H.S., cioè esiste uno spazio nucleare tale che e 1i, c* è un R.H.S. e a) DA:.) , b} A () e , c) A rc1> : --+ è continuo nella topologia nucleare. Prova. (traccia). Si procede in modo molto simile a quello seguito nella prova del teorema 3.19.2. Si prenda D = D 00 (A):= nneNDAn; come sappiamo D è un core di ogni potenza Ak, k = 1, 2, ... , di A ed è denso in 1t. Preso un x 1 E D, x 1 # O, si considera, per n = O, 1, 2, ... , 4>1,n
:=
{x E 1t I terArx1}; X=
r=O
4>1,n, n
= O, 1, 2, ... , è uno spazio lineare finito-dimensionale e perciò nucleare;
evi-
dentemente 4>1,n
e D,
'i>1,0
C
n
= O, 1, 2, ... ,
'i>1,1 C · · · C 'i>1,n C 'i>1,n+l C · · ·
e la topologia di 4> 1,n coincide con quella ereditata da 4> 1,n+l. Il limite induttivo (stretto) 4>1 = lim n'i>1,n, in quanto limite induttivo di spazi nucleari, è nucleare. Se 4> 1 e D risulta denso in 1t, 4> 1 è lo spazio nucleare voluto. Se 4> 1 non è denso, si considera un x2 E D, x2 #Oche non appartiene a 1t1 = 4> 1 (ne esistono: se fosse De 4> 1 si avrebbe 1t1 = 1t); in modo analogo si costruisce 4>2 e si prende la somma '111 = 4>1 + 4>2; se 1t2 = 4>1 + 4>2 # 1t si considera x3 E D e X3 ~ 4> 1 + 4>2 e così via. Poiché 1tn+l contiene propriamente 1tn il procedimento termina con al più una infinità numerabile di passi: si arriva cioè ad uno spazio 4> = Un Wn che è nucleare essendo limite induttivo di spazi nucleari. ■
-
Esempio. Consideriamo l'operatore Q in L 2 (R). Anche in questo caso (cfr. l'esempio al §3.19) identificheremo L2 (R) con L2 (R, B, m 8 ) dove B è la a-algebra dei boreliani e mB la restrizione della misura di Lebesgue a Be non faremo distinzioni di notazione tra le misure. Si tratta di un operatore autoaggiunto non limitato con spettro esclusivamente continuo e coincidente con l'intero R (cfr. §3.11): t>
o- (Q) = o-e (Q) = R.
Capitolo 3. Teoria spettrale
346
Q è un operatore diagonale di L 2 (R) inteso come integrale diretto di spazi di Hilbert (cfr. esempio 3 §3.15); la sua misura spettrale è quindi formata dagli operatori di moltiplicazione per le caratteristiche dei boreliani: EQ (M) := Mx(M) per ME B. Anche l'operatore P è facilmente diagonalizzabile: si ha infatti F P p- 1 = Q, con F la trasformata di Fourier in L 2 (R); quindi F è l'isomorfismo di diagonalizzazione per P. La misura spettrale di P è allora unitariamente equivalente a EQ: si ha infatti Ep (M) = p- 1 EQ (M) F, t/M E B. Veniamo ora alla scelta di una tripletta di Gelfand per Q e per P. La scelta più banale potrebbe essere di procedere nella costruzione dello spazio nucleare come nella dimostrazione del teorema 3.21.5 a partire da una f 1 in D 00 ( Q), per esempio la funzione gaussiana, che sta certamente nel dominio di Qn per ogni n. La scelta della gaussiana è felice perché in tal caso lo spazio 1 ( cfr. la prova del teor. 3.21.5) coincide con la varietà lineare generata dalle funzioni di Hermite e quindi 1 = L 2 (R). Questo spazio risulta il limite induttivo di spazi finito-dimensionali e non è metrizzabile. Lo stesso spazio nucleare provvede a una tripletta di Gelfand anche per P. Per i due operatori Q e P è disponibile un'altra, ben nota, tripletta di Gelfand: S (R) e L 2 (R) e S* (R). Lo spazio S (R) è uno spazio di Fréchet nucleare e nel §3.18 è stata data una collezione numerabile {Pn} di norme che definisce la sua topologia. È quindi uno spazio metrizzabile cioè la sua topologia è generabile mediante una distanza, per esempio t/cp1, 1.()2 E S (R) .
Che una successione {'Pn} (n E N) converge a
:= (u (.X) lcp(.X))rt(,\) = cp (.X) è un autovettore generalizzato per Q; si tratta evidentemente dei funzionali di valutazione in À, cioè delle delta di Dirac 8 (.X); è d'uso scrivere (identificando Q con la sua estensione a S* (R)):
J:
J:
Qo (.X) = .x8 (.X),
V.X E R.
Sempre dal teorema 3.19.1 sappiamo che, per ogni À, il funzionale up (.X) E S* (R), definito ponendo < up (.X), cp >:= (u (.X) IFcp(.X))rt(,\) = cp (.X) = JR exp (-i.Xt) cp (t) dm (t) è un autovettore generalizzato per P (qui F è la
348
Capitolo 3. Teoria spettrale
trasformata di Fourier di L2 (R)-che diagonalizza P-e con b): segue da IIUtx - Ut 0 xll = ll(Ut-to - l)xll, per ogni x E 'H. b1) => b): segue dalla relazione ll(Ut - Us)xll 2 = 2(llxll 2 - Re (Ut-sxlx)) Vt, s E R per ogni
X
E 'H.
b~) => b'): segue dalla relazione Il (Ut -l)xll 2 = 2 (llxll 2 -Re(Utxlx)), 'vt E R, per ogni x E 'H. b 2 ) => b~): si consideri per ogni a> O la forma sesquilineare 'Pa : 'H, x 'H, -+C definita da 'Pa (x, y) := { (Utxly) dm (t). J[o,a]
IIYII
Poiché si tratta evidentemente di una forma sesquilineare limitata (l'Pa (x, y)I < allxll · per ogni x, y E 'H) esiste (cfr. teor. 2.3.3) un unico operatore Ba E L('H) tale che
(Baxly)
= 'Pa (x, y),
Vx, y E 'H.
(3.25)
Capitolo 3. Teoria spettrale
350
Mostriamo che v{Bax;x E ?t,a >O}= 7t: sia y E (ImBa).l per ogni a> O e sia {11.n} (n E N) un s.o.n.c. in 7t; allora per ogni n E N si ha
f n (a)
:=
r
(UtunlY) dm (t) =
J(o,a)
o,
Va>
o
ed essendo f n assolutamente continua la funzione integranda 9n (t) = (UtunlY) sarà q.d. nulla in (O, oo); data l'arbitrarietà di n in queste considerazioni, esisterà allora un t 0 > O tale che (Ut 0 Un IY) = O per ogni n. Poichè Ut 0 Un è un s.o.n.c. (essendo Ut 0 unitario) si ha y =O. Questo mostra che {Bax Ix E 7t, a> O} .l = {O} e quindi {Bax Ix E 7t, a> O}.l.L = ?t. Mostriamo ora che per ogni x, y E 7t e a > O
Infatti:
(UtBaxly)
-
(BaxlU-ty)
- r
=
r
(UsxlU-ty) d-m (t)
J(o,aJ
(Ut+sxly) dm (s)
J(o,a)
=
r
(Usxly) dm (s).
}[L,a+t)
Sarà allora (Utwly)-+ (wly) per t-+ O per ogni y E 7t e ogni w E V' {Bax; x E 7t, a> O} . Siano ora z, y E 7t; dalle disuguaglianze
I (Utzly) - (zly) I < I (Utzly) - (Utwly) I+ I (Utwly) - (wly) I+ l(wly) _- (zly)I < 2ll(z - w)II IIYII + I (Utwly) - (wly) I, per ogni w E V' {Bax; x E 7t, a> O}, segue la continuità di R 3 t ogni z, y E 7t. ■
-+
(Utzly)
E
C, per
I gruppi a un parametro fortemente continui di operatori unitari (nel seguito diremo anche brevemente "gruppo unitario a un parametro") sono molto importanti nelle applicazioni fisiche, basta ricordare il loro ruolo nella Meccanica Quantistica e, più in generale, nella teoria dei sistemi dinamici, dove descrivono, per esempio, l'evoluzione dinamica. t>
Esempio 1. L'applicazione U: R ~ U (L 2 (R)),
dove T,, è l'operatore di t-traslazione di L 2 (R) (cfr. Es. 1, §2.5),
T,, : L 2 (R) ~ L 2 (R),
(Ttf) (x) = f (x-t),
3.22. Gruppi a un parametro di operatori unitari.
351
è un gruppo unitario a un parametro. C>
Esempio 2. Anche l'applicazione
V: R ~ U (L 2 (R)),
t
--t
½,
(½/) (x)
:= e-itx f
(x)
è un gruppo unitario a un parametro. I due gruppi unitari a un parametro U e V sono unitariamente equivalenti via la trasfarmata di Fourier F nel senso che
Vt E R. Introdotto il concetto di gruppo unitario a un parametro possiamo illustrare la correlazione fra operatori autoggiunti e operatori unitari basata sulla esponenziazione, cioè sulla mappa z ~ exp(iz). Supponiamo dapprima che A sia un operatore autoaggiunto limitato; sia, cioè, A E L (ri) autoaggiunto. Si definisce un gruppo a un parametro di operatori unitari ponendo, per ogni t E R, Ut = exp(-itA) dove (cfr. §3.15)
exp(-itA)
=
L
nEN~
n.
(-itA)n =
rexp (-itA) dEA,
}A
con A lo spettro ed EA la misura spettrale di A. Si noti che la serie in oggetto è convergente in L (ri) secondo la topologia della norma (è assolutamente convergente!), che
Ut+s = exp (-i (t
+ s) A) = exp (-itA) exp (-isA) =
UtUs
(basta fare il prodotto delle due serie o usare il calcolo operatoriale) e che
ul = exp (-itA)t = L ~ (itA)n = U_t; n. nE N
exp (-itA) è quindi effettivamente un operatore unitario per ogni t E R. La applicazione R 3 t--t exp ( -itA) E U (ri) è continua nella topologia della norma di L (ri), quindi a maggior ragione fortemente continua, ed è anche derivabile e si ha idd exp (-itA) = A exp (-itA)
,t
352
Capitolo 3. Teoria spettrale
in particolare:
i!
exp (-itA)lt=O = A.
Supponiamo ora A E O (H) autoaggiunto; il teorema seguente mostra che i risultati precedenti possono essere estesi, via la teoria spettrale, a siffatto A. Teorema 3.22.1 Sia A E O (H) autoaggiunto, A il suo spettro ed EA la sua misura spettrale: 1} l'applicazione R 3 t~Ut = exp (-itA) dove
exp (-itA)
=
1
exp (-it>.) dEA,
definisce un gruppo a un param,etro fortemente continuo di operatori unitari; 2} sex E D (A) esiste la derivata 1t (Utx)1t=O e si ha
e inversamente, se x E H è tale che esiste la derivata ~ ( Utx) lt=O allora x E D (A) e vale l'uguagl-ianza ( *). 1) via una diagonalizzazione di A, con una misura basica v A, si vede che gli operatori Ut sono l'immagine, via lo *-isomorfismo '11 : L 00 (i\, B,vA) -+ w• (A) (cfr. teorema 3.21.4), delle funzioni Ut, Ut (.X) := exp(-it>.), che verificano: i) '11,t'IJ,t = v.tut = 1, Vt E R, ii) '11-t+s = '11,tUs, Vt, S E R; quindi essi stessi verificano UtUi = Uf Ut = I, cioè sono operatori unitari, e verificano la proprietà a) della definizione 3.22.1: Ut+s = UtUs, Vt, s E R; mostriamo la b): per ogni x, y E 'H si ha (xlUty) = JA exp (-it>.) dµf~ (>.) e Prova.
I (xlUty)
- (xly)
I ::;
iI
exp (-it>.) -
li dlµ:,YI
(>.)
(3.26)
dove la famiglia delle funzioni integrande converge puntualmente a zero per t -+ O ed è limitata; poiché è una misura finita si può applicare il teorema della convergenza dominata (cfr. A.4.3) nel prendere il limite per t-+ O nella 3.26 e si ha quindi b~)2) Per x E D (A) si consideri
lµ~,vl
3.22. Gruppi a un parametro di operatori unitari.
353
Per ltl minore di un opportuno 8 > O, la funzione integranda è maggiorata da 4IÀl 2 ; infatti: li½ (exp (-itÀ) - 1) - ÀI < IÀI + IÀI exp(~~>.)-l < 2 IÀI-
I
I
Poiché la funzione À ~ IÀl 2 è integrabile nella misura µfA (si è preso infatti x E D (A)!), utilizzando nuovamente il teorema della convergenza dominata si ottiene che
Sia ora D la varietà lineare in 1t degli x E 1t tali che esista la derivata ft (Utx)1t=O e T l'operatore lineare in O (1t) definito su D ponendo Tx := i ft (Utx )1t=O· T estende A ed è un operatore simmetrico: infatti, per ogni x ED, si ha (UtxlUtx) = 1 e prendendo la derivata per t = O si ottiene (3.27)
e quindi
(xlTx)
= (Txlx)
E R,
Vx ED
Essendo T una estensione simmetrica di A e A autoaggiunto ne segue T
=A. ■
Il gruppo unitario a un parametro del teorema 3.22.1 si dice generato dall'operatore autoaggiunto A il quale, a sua volta, è detto generatore del gruppo.
È opportuno sottolineare che un gruppo unitario a un parametro R 3 t -+ Ut E U (H) fornisce, per ogni x E H, una curva passante per x, cioè un'applicazione continua: ìx: R---+ H,
t-+ ìx
(t)
:= UtX,
con la proprietà ìx (O) = x. Alcune circostanze meritano di essere notate: 1) per ogni x E 1-f, si tratta di una curva completa: questo è un termine ufficiale con cui si esprime il fatto che il parametro t varia sull'intero R; 2) per le coppie x, x' E 1-l, l'appartenenza a una stessa curva è una relazione di equivalenza: quindi la curva passante per x e la curva passante per x' o coincidono o sono completamente distinte (non hanno, cioè, alcuna intersezione; 3) se x E DA, e soltanto in questo caso (ci riferiamo ora esplicitamente al gruppo unitario a un parametro del teorema 3.22.1), la curva passante
354
Capitolo 3. Teoria spettrale
per x è non solo continua, ma derivabile, e giace completamente in DA, cioè x (t) ED A, Vt E R; tenendo conto anche del fatto che Ut E W* (A) e quindi commuta con A, si ha
ossia i ft X ( t) = Ax (t) {
X
(3.28)
(0) = x.
La (3.28) è un problema di Cauchy in DA e 1i che giustifica pienamente il nome di generatore del gruppo unitario a un parametro t ~ Ut = exp (-itA) non appena si richiami che la soluzione di (3.28) è unica (sex (t) è un'altra soluzione, allora ftllx(t)-x(t)ll 2 = 2Re (x(t)-x(t) I -iA(x(t)- ftx(t))) = O, quindi x (t) = x (t), Vt E R, poiché x (O) = x (O)). Nel caso della Meccanica Quantistica ordinaria ponendo per A l'operatore hamiltoniano del sistema, il problema di Cauchy (3.28) è la ben nota equazione di Schrodinger che descrive l'evoluzione del sistema. Ogni operatore A E O (ri) autoaggiunto genera dunque un gruppo unitario a un parametro. Il seguente celebre teorema mostra che tutti i gruppi unitari a un parametro sono generati da operatori autoaggiunti. Teorema 3.22.2 (Stone) Sia R :3 t ~ Ut E U (ri) un gruppo a un parametro fortemente continuo di operatori unitari: esiste un operatore autoaggiunto A E O (ri) e uno solo tale che Ut = exp ( -itA) per ogni t E R. Prova. Sia D la varietà lineare degli x E 1t tali che esista limt-o A: D ~ 1t l'operatore lineare definito ponendo
if (Ut -
l)x e sia
1 Ax := lim i-(Ut - l)x.
t-o t
Sfruttando la proprietà a) della definizione 3.22.1 di gruppo unitario a un parametro, si mostra facilmente che se x E D, allora Utx E D, 'vt E R, e vale: (3.29)
355
3.22. Gruppi a un parametro di operatori unitari.
Mostriamo ora che A è un operatore autoaggiunto cominciando dall'aggiuntabilità. Consideriamo l'insieme {B0 x; x E 7-l, a> O}, già introdotto nella dimostrazione della implicazione b2) => bi) all'inizio del paragrafo e mostriamo ora che esso è contenuto in D. Per x, y E 7-l si ha
((Ut - I)Baxly)
r (Usxly)d·m (s) - r (Usxly) d·m (s) - - J[o,tJ r (Usxly) dm (s) + J[o,a+tJ r (Usxly) dm (s);
-
J[t,a+t)
quindi, dividendo per -it e prendendo il limite per t
J[o,a)
~
O,
lim (i!(ut - I)Bax y) = i ((Ua - l)xly)' t-o t
\/x, y E 7-l.
Così Bax ED per ogni x E 1t (e AB0 x = i(Ua -l)x). Poiché V' {B 0 x; x E 1t, a> O} C D ed è denso in 1-l si ha D = 1-l. A è simmetrico: la dimostrazione è stata già sostanzialmente fatta nel teorema 3.22.1 (si veda la formula 3.27). Mostriamo ora l'essenziale autoaggiuntezza. Sia y E Ker (At ± il); allora, per ogni x ED, si ha ((A=Fil)xjy) =O.Si consideri ora la funzione f(t) := (Utxly), t E R. Essa soddisfa l'equazione f' (t) ± f (t) = O (si tenga conto della 3.29 e del fatto che, sempre dalla 3.29, Ut commuta con A e quindi con A+ il). Sarà allora / (t) = cexp (=i=t) con e E C. Essendo gli Ut operatori unitari, la funzione f è limitata e questo implica e= O. Da (Utxly) = (xlU-ty) = O per ogni x E D e dalla densità di D segue U-tY = O e quindi y=O.
Per l'autoaggiuntezza di A manca solo mostrare che A è chiuso. Sia A la sua chiusura e t ~ Vi il gruppo unitario a un parametro generato da A (cfr. il teorema 3.22.1). Si consideri per x E D e D (A) e y E 1t la funzione / (t) = (V-tUtxly), t E R. Per derivazione si ottiene
J' (t)
-
- (V-tiAUtxly) + (V-tiAUtxly) - (V-tiAUtxly) + (V-tiAUtxly) = O.
Quindi (V-tUtxly) = (xly) per ogni x E D e ogni y E 7-l; ne segue V_tUtx = x per ogni x E D cioè ½x = Utx per ogni x E D. Poiché si tratta di due operatori di L (H) sarà allora Utx = ½x per ogni x E 1t e quindi Ut = Vi- Dal punto 2) del teorema 3.22.1 segue allora che A = A. L'unicità del generatore segue sempre dal punto 2) del teorema 3.22.1. ■
356
Capitolo 3. Teoria spettrale
Osservazione. Nei gruppi ad un parametro di operatori unitari, la dirimente tra quelli con generatore A autoaggiunto e limitato, cioè A E L (1t), e quelli con generatore A E O (1t) autoaggiunto non limitato, si può ridurre solo a proprietà topologiche. Teorema 3.22.3 Un gruppo ad un parametro di operatori unitari R 3 t ~ Ut E U (1t) è continuo nella topologia della norma di L (1t) se e solo se il suo generatore è un operatore A autoaggiunto di L (1t) e in tal caso Ut = :E nEN ~! ( -itA per ogni t E R.
t
Prova. Per A EL (?-f.) la serie exp (-itA) = :E nEN ~! (-itAt converge secondo la norma di L (H). Sia ora t ~ Ut continua nella norma di L (?-f.); in tal caso, per a ~ O, l'operatore (¼Ba -1) tende a zero: per ogni x, y E ?-f. si ha:
.!_ {
a J[o,a]
< .!_ {
a J[o,a]
O per cui ¼Ba E GL (?-f.), e in tal caso Im ¼Ba = Im Ba = ?-f.. Poiché il dominio D (A) del generatore A contiene 1m Ba, come si è visto nel corso della dimostrazione del teorema 3.22.2, sarà allora D (A) = 1t e, essendo A autoaggiunto quindi chiuso, A risulta limitato con dominio ?-f. cioè A EL (?-f.). ■
Il generatore del gruppo Ut delle traslazioni dell'Esempio 1 è l'operatore di derivazione P = -id: in L 2 (R) introdotto nel §2.18, mentre il generatore del gruppo ½ è l'operatore Q unitariamente equivalente a P via trasformata di Fourier. Nello spazio L 2 (R3 ) si introducono i gruppi ad un parametro di operatori unitari delle traslazioni lungo l'asse x oppure lungo l'asse y o l'asse z (la definizione è analoga a quella di Ut); in tal caso i tre generatori corrispondenti sono i tre operatori di derivazione Px = -i Py = -i %v, Pz = -i iz.
lx,
Quest'ultima osservazione ci suggerisce una generalizzazione del teorema di Stone che sarebbe quasi ovvia se non coinvolgesse una questione che ovvia certamente non è: quella della commutatività di operatori non limitati. Nel §3.21 abbiamo definito la commutatività di B E L (H) con A E O (H);
357
3.22. Gruppi a un parametro di operatori unitari.
che l'estensione del concetto al caso di due operatori non limitati non sia ovvia è messo in luce da un celebre esempio (cfr. [26]). Ci limitiamo qui a illustrare brevemente la definizione di commutatività fra due operatori A e B di O (1i) autoaggiunti che sembra la più adatta alle necessità della Meccanica Quantistica:
due operatori A e B autoaggiunti (anche non limitati} com,mutano se commutano le loro m'isure spettrali EA e E 8 ; cioè se [EA (M), E 8 (N)] = O, per ogni boreliano M di a (A) e per ogni boreliano N di a (B). Lemma 3.22.1 Sia A E O (1i) autoaggiunto, EA la sua misura spettrale su A spettro di A, R 3 t -+ Ut = exp (-itA) il gruppo a un parametro fortemente continuo di operatori unitari da esso generato, B E L (1i); sono
equivalenti: a) [B, Ut] = O, Vt E R; b} BE {A}', cioè: BA e AB; c) [B, EA (M)] = O, VM boreliano di A. Prova. a) => b): per x E DA si consideri la curva R 3 t derivabile in t = O:
. 11m . y(t)-y(O) --t-+0 t
i
~
y (t)
= UtBX
E
1t; la curva è
. UtBx-Bx B(·i· x(t)-x(O)) BA 11m = i. t-+0 --- = i 1m - - - = x; t t-+0 t
questo mostra (cfr. teor. 3.22.1) che Bx E DA e che ABx = BAx; b) => c) poiché B appartiene al commutante {A}' di A (cfr. §3.20) B commuta con gli elementi di w• (A) e in particolare con i proiettori EA (M), per ogni boreliano !vl di
A;
c) => a) banale.
■
Teorema 3.22.4 Siano A, B E O (1i) autoaggiunti, EA, EB le loro misure spettrali, R 3 t -+ Ut = exp (-itA) e R 3s -+ ½ = exp (-isB) i gruppi a
un parametro fortemente continui di operatori unitari da essi generati: sono equivalenti: a) Ut E {B}', Vt E R; b} [Ut, ½] = O, Vt, s E R; c) [EA (M), E 8 (N)] = O, VM boreliano di a (A) e VN boreliano di a (B); d} '\1s E {A}' , Vs E R. Se è verificata una delle condizioni allora AB - BA C O.
358
Capitolo 3. Teoria spettrale
Prova. L'equivalenza di a), b), c), d) è banale conseguenza del lemma 3.22.1; sia x E 2 DAB-BA e si consideri la applicazione R 3 (t,s)....,... x(t,s) = UtVsx E 'H.; poiché vale la b) si ha
Possiamo ora terminare con la generalizzazione del teorema di Stone al caso di gruppi unitari a più parametri fortemente continui, cioè al caso di omomorfismi Rd 3 x-+ Ux EU (ri) fortemente continui. Teorema 3.22.5 Sia Rd 3 x-+ Ux EU (ri) un gruppo ad parametr·i x = (x 1 , x 2 , ... , xd) fortem.ente continuo di operatori unitari: esistono d operatori A1 , A2 , ... , Ad E O (ri) autoaggiunti tra loro commutanti tali che, per ogni X
E Rd,
Appendice A Cenni alla teoria della misura e della integrazione A.1
Misure e spazi con misura
In queste note facciamo una breve trattazione della teoria astratta della misura e della integrazione. La conoscenza preliminare della misura di Lebesgue negli spazi euclidei è auspicabile e tuttavia l'approccio astratto ci sembra concettualmente importante e conveniente: si pensi che misure diverse da quella di Lebesgue, quali la delta di Dirac o la misura di Wiener, vengono largamente usate nella Fisica; inoltre una generalizzazione della nozione di misura, la misura a valori di proiezione, svolge un ruolo fondamentale nella teoria spettrale.
Definizione A.1.1 Dato un insieme X non vuoto, una collezione A di suoi sottoinsiemi si dice u-algebro se valgono le seguenti proprietà: a.1) 0, X E A; a2) A è stabile per intersezioni numerabili: se {An} (n E N) e A allora nnAn E A; a3) A è stabile per complementazione: se A E A allora cA E A.
Esempi banali di u-algebre sono A = {0, X} e A = P(X), la collezione di tutti i sottoinsiemi di X. Se A 1 e A 2 sono u-algebre in X, diremo che A 1 è minore di A2 se A2 contiene tutti gli elementi di A1 e tale relazione si indica con A1 e A2. Con il simbolo A1 n A2 si indica la u-algebra dei sottoinsiemi di X che appartengono ad entrambe le u-algebre. Analogamente l'intersezione di una collezione di cardinalità qualsiasi di u-algebre risulta una u-algebra. Data una collezione S di sottoinsiemi di X, esiste sempre la minima o--algebra che contiene S ed è l'intersezione di tutte le u-algebre che contengono S. Tale u-algebra si dice generata da S. 359
360
Appendice A. Cenni alla teoria della misura e della integrazione
Se X è uno spazio topologico è naturale considerare la a- algebra generata dalla collezione T degli aperti. Tale a- algebra prende il nome di a-algebra di Borel e viene indicata con B(X); i suoi elementi si dicono boreliani. Una coppia (X, A) si dice spazio misurabile e gli elementi di A si dicono sottoinsiemi misurabili di X. Dati due spazi misurabili, (X, Ax) e (Y, Ay ), una applicazione :X~ Y si dice misurabile se la controimmagine di ogni sottoinsieme misurabile di Y è un sottoinsieme misurabile di X. È immediato vedere che la composizione di applicazioni misurabili è misurabile e che, se X e Y sono spazi topologici e si considerano su di essi le rispettive a-algebre di Borel, allora tutte la funzioni continue sono misurabili.
Definizione A.1.2 Una misura su (X, A) è una applicazioneµ: A ~[o, +oo] tale che: 1) µ(0) = O; 2) (a-additività) Se {An} (n E N) è una famiglia numerabile di elementi di A a due a d·ue disgiunti allora µ(UnAn) = I::=o µ.(An). La terna (X, A,µ) si dice spazio con misura. Se µ(X) < +oo la misura si dice finita; se esiste una famiglia numerabile {An} di sottoinsiemi misurabili di misura finita tali che X = UneN An la misura si dice a-finita. Uno spazio con misura si dice completo se ogni sottoinsieme di un insieme di misura nulla è anch'esso misurabile (e ovviamente di misura nulla); tale misura si dice allora completa.
A.2
Funzioni misurabili
Sia (X, A,µ) uno spazio con misura; una funzione f: X~ R si dice misurabile se essa è una applicazione misurabile nel senso definito nel paragrafo precedente quando si consideri su R la a-algebra di Borel generata dalla topologia euclidea. Si dimostra facilmente che tale a-algebra è generata da ciascuna delle seguenti famiglie
di sottoinsiemi: le semirette [a, +oo), a E R; le semirette (a, +oo), a E R; le semirette (-oo, a), a E R; le semirette (-oo, a], a E R. Quindi f è misurabile se e solo se vale una qualsiasi delle seguenti condizioni: l'insieme {x E X , a < f(x)} è misurabile per ogni a E R; l'insieme {x E X,a < f(x)} è misurabile per ogni a E R; l'insieme {x E X, f (x) :::; a} è misurabile per ogni a E R; l'insieme {x E X, J(x) < a} è misurabile per ogni a E R.
A.3. Integrazione
361
Una funzione a valori complessi è misurabile se lo sono la sua parte reale e la sua parte immaginaria. Inoltre è immediato vedere che combinazioni lineari e prodotti puntuali di funzioni misurabili sono misurabili perché composizioni di applicazioni misurabili con applicazioni continue quali la somma e il prodotto in R. Anche il limite puntuale di funzioni misurabili è misurabile. Infatti sia /(x) = limn /n(x), x E X, dove supponiamo che le In siano misurabili e a valori reali; consideriamo per ogni a in R l'insieme Ea = {x E X, J(x) < a}; esso risulta misurabile in quanto unione di insiemi misurabili; infatti si mostra che Ea = Uk Un Um>n{x E Xl/m(x) < a-½} con n, m, k E N. Il caso di funzioni a valori complessi è una conseguenza immediata del caso di funzioni a valori reali.
Con analoghe dimostrazioni si può mostrare che l'estremo inferiore e l'estremo superiore di famiglie numerabili di funzioni misurabili a valori reali è misurabile. Siano f e g due funzioni a valori reali o complessi; si dice che esse sono uguali quasi dappertutto, e si indica f = g q.d., se esiste un insieme misurabile E tale che il suo complementare abbia misura nulla e si abbia J(x) = g(x) per ogni x E E. Si dice che f è limite puntuale quasi dappertutto delle funzioni fn se esiste un insieme misurabile E come sopra tale che f(x) = limn fn(x) per ogni x E E. Possiamo quindi riassumere dicendo che l'insieme delle funzioni misurabili è un'algebra stabile rispetto alla convergenza puntuale; se in più la misura è completa, è un'algebra stabile rispetto alla convergenza puntuale quasi dappertutto.
A.3
Integrazione
Una funzione misurabile su (X, A) si dice semplice se assume solo un numero finito di valori; pertanto sarà del tipo s = L~=l aiXA; dove gli insiemi Ai sono misurabili tra loro disgiunti e Uf= 1 Ai = X e con XA intendiamo la funzione caratteristica dell'insieme A. Vale il seguente teorema. Teorema A.3.1 Se J : X -+ R è una funzione misurabile e non negativa esiste una successione di funzioni semplici {Sn} tale che a) O< so < s 1 < ... < J(x) per ogni x E X, b) limn sn(x) = J(x) per ogni x E X. Prova. Per ogni n ~ 1 si considerino gli insiemi En,i = {x E X I i:;n1 =5 J(x) =5 2~} ed Fn Xl J(x) > n}; allora la funzione Sn = i:;.l XEn,i + nxFn è una funzione semplice.
= {x
E
La successione sn soddisfa ovviamente la condizione a); inoltre per n abbastanza grande vale sn(x) J(x) - 21.. per ogni x e questo implica il punto b). ■
~
Er~;
Appendice A. Cenni alla teoria della misura e della integrazione
362
Se s è una funzione semplice a valori non negativi indichiamo con Jx sdµ la sommatoria I::~=l aiµ(Ai) se tutte le misure che compaiono nella sommatoria sono finite , altrimenti poniamo Jx sdµ = +oo. Se f è una funzione misurabile non negativa poniamo
{ fdµ
lx
= sup/,
x
s
sdµ
dove l'estremo superiore è preso su tutte le funzioni semplici s tali che O < s
~
f.
È chiaro che Jx f dµ può assumere anche valore infinito. Il termine funzione integrabile riguarda invece funzioni che hanno integrale finito nel senso chiarito dalla seguente definizione. Definizione A.3.1 Una funzione f su X a valori in R misurabile si dice integrabile se esistono finiti gli integrali della parte positiva f + e della parte negativa f- di f e si pone
l
fdµ
=l
f +dµ - l
J_dµ.
Una funzione su X a valori complessi misurabile si dice integrabile se lo sono la sua parte reale e la sua parte immaginaria e si pone
lfdµ= fxRefdµ+ifximfdµ.
Ricordiamo che f + è definita ponendo
f +Cx)= { t(x)
J(x) f(x)
::
~
O,
O.
Diamo qui solo le più importanti proprietà dell'integrazione. 1) ("Linearità") Se f e g sono funzioni integrabili allora per ogni è integrabile e vale:
l
(>.J + kg)dµ
=Àl
fdµ
+k l
À
e k in C anche
Àj
+ kg
gdµ.
2) ("Positività") Se f e g sono funzioni integrabili a valori reali e f < g allora Jx f dµ < fxgdµ.
A.4. Operazione di limite nell'integrazione
363
3) Condizione necessaria e sufficiente perché
l
f dµ
f sia integrabile è che lo sia lii e vale:
O allora
La dimostrazione di 1), 2), 4) segue immediatamente dalla definizione di integrale. Diamo una breve dimostrazione di 3). Consideriamo dapprima una funzione f integrabile a valori reali. Poiché f+ ed !sono integrabili per definizione, allora Ili = f+ + f- è pure integrabile. Viceversa, se III è integrabile allora anche/+ ed f- lo sono essendo/-, f+ :5 IliSe f è a valori complessi e integrabile allora I Re Il e I Im Il sono integrabili e quindi III :5 I Re Il + j lm /I è pure integrabile. Viceversa se Ili è integrabile allora, da I Re /I :5 III e I Im /I :5 III, otteniamo l'integrabilità di Refe Im / e quindi quella di IMostriamo ora la disuguaglianza I Ix JdµI :5 Ix lfldµ. Sia z = Ix fdµ; poiché per ogni numero complesso z c'è a E Cdi modulo 1 tale che az lzl, sarà:
=
f
lx
Idµ
in cui necessariamente fx lm(af)dµ
A.4
h
= a lx{ Idµ= lx{ af dµ = lx{ Re(af)dµ + i x lm(af)dµ, = O e Re(a/) :5 1/1-
Quindi segue l'asserto. ■
Operazione di limite nell'integrazione
Citiamo qui solo i più noti teoremi sul passaggio al limite nella integrazione. Per la dimostrazione di questi teoremi si veda per esempio [4] oppure (31]. Teorema A.4.1 {di E.Levi o della convergenza monotona) Sia {fn} (n E N) una successione monotona non decrescente di funzioni integrabili. Se la successione degli integrali Jx fndµ è limitata, cioè esiste una costante K tale che Jx fndµ < K 'J)er ogni n, allora limn f n (x) è q. d. finito e la funzione limite f, definita ponendo f (x) = limn f n ( x) se questo è finito, e f (x) = O altrimenti, è una funzione integrabile e vale:
f fndµ. lxf f dµ = lim n lx Teorema A.4.2 (Lemma di Fatou) Sia {fn} (n E N) una successione di funzioni integrabili non negative e limn Jx f ndµ < oo; allora la funzione f : X -+ R definita ponendo f (x) = limnf(x) se questo è finito, f (x) = O altrimenti, è integrabile e vale
l
f dµ < limn
l
f ndµ
364
Appendice A. Cenni alla teoria della misura e della integrazione
(indichiamo con limnan il minimo limite cioè l'estremo inferiore dei punti di accumulazione di una successione {an} (n E N) di numeri reali).
Teorema A.4.3 (di Lebesgue o della convergenza dominata) Sia {In} (n E N) una succesione di funzioni misurabili e sia lini < per ogni n, dove è una funzione non negativa e integrabile; sia {fn(x)} (n E N) convergente per ogni x e sia f la funzione limite. Allora le f n e la f sono integrabili e vale: lim { fndµ n lx
= { fdµ. lx
Aggiungiamo qui un teorema in cm s1 fa uso della nozione di norma nello spazio L (X,A,µ) (cfr. §1.8): 11/111 = Ix lfldµ. 1
Teorema A.4.4 Siano fn, f E L 1 (X,A,µ,) e
Il! - fnl11
Ix fdµ. Prova. Si usa la disuguaglianza
I Ix (I - fn)dµI :5 Ix II - fnldµ.
--+ n-oo
O: alloro
Ix fndµ
--+
■
Osserviamo che da questo teorema segue che l'integrazione è una funzione continua su L (X,A,µ). 1
A.5
Costruzione di misure
Diamo qui la linea del procedimento per cui da una misura su un semianello si perviene alla costruzione di una misura secondo la definizione data nel primo paragrafo; l'esempio più importante di misura costruita con tale procedimento è la ben nota misura di Lebesgue sulla retta o in generale su Rd. Tuttavia con questo stesso procedimento si costruiscono anche misure complicate quali ad esempio la misura di Wiener (si veda ad esempio (21)) che è una misura su uno spazio infinito dimensionale. Definizione A.5.1 Sia X un insieme non 1rnoto. Si dice semianello una collezione S non vuota di sottoinsiemi di X tale che: s1) 0 ES; s 2 ) se A e B O, Vx E X, allora o: (f) è un numero reale positivo). Per contro, vale il seguente teorema fondamentale, detto teorema di rappresentazione di Riesz. Teorema A.9.1 Sia o: un funzionale lineare positivo su Cc(X); allora esiste una misuro di Borel µ su X tale che
o:(f)
= { f dµ,
lx
Vf E Cc(X).
Tale mis·ura è unica se si richiede anche che µ sia regolare.
Per la dimostrazione del teorema e in generale come riferimento sulle misure di Borel si veda [16]. Osservazione. Uno spazio topologico localmente compatto di Hausdorff secondo numerabile (cioè tale che esista una collezione numerabile di aperti con la proprietà che ogni aperto si possa esprimere come unione di elementi della collezione) risulta separabile, a-compatto e omeomorfo ad uno spazio metrico completo. Si ha la notevole proprietà: tutte le misure di Borel su X localmente compatto di Hausdorff secondo numerabile sono regolari.
Per mostrarlo si può usare il teorema 2.18 in [31].
A.10
Supporto di una misura
Sia X uno spazio topologico, A una a-algebra contenente gli aperti e µ una misura su (X,A).
Si consideri l'unione Vµ di tutti gli aperti V tali che µ(V) = O. Il complementare di Vµ è ovviamente un chiuso e prende il nome di supporto diµ e si indica con suw µ.
Appendice A. Cenni alla teoria della misura e della integrazione
372
Sia X uno spazio topologico localmente compatto di Hausdorff e siaµ una misura di Borel regolare su X. Per ogni compatto K e yµ esiste una copertura finita di aperti tali che K e u~~ 1 ½ e µ(½) = O per ogni i. Quindi µ(K) = O e per la regolarità di µ sarà: µ(Vµ)= SUP{KCV,., K compatto} µ(K) = O. Quindi seµ è regolare µ(Vµ) = O eµ è concentrata sul suo supporto. Per esempio la misura di Dirac ha supporto su {O} ed è ivi concentrata (così come è concentrata su ogni insieme misurabile contenente lo zero).
A.11
Misure correlate, misure invarianti
Sia (Y, Ay, µ) uno spazio con misura e : X ~ Y una applicazione in Y. Considerata su X la a-algebra Ax := { - 1 (A); A E Ay }, si definisce la misura correlata
Se f : Y ~ C è una funzione misurabile e µ-integrabile, allora f o • µ-integrabile e si ha
f f (y)dµ(y) = f
}A
è misurabile e
f ((x))d(• µ)(x),
J O, K maggiorante essenziale di f}. Anche per L 00 (X, A,µ) adotteremo la convenzione di indicare con f sia una classe di equivalenza che un suo rappresentativo.
Teorema C.2.1 Lo spazio L 00 (X,A,µ) è uno spazio di Banach. Prova. Sia {In} (n E N) una successione di Cauchy di L 00 (X,A,µ); sia Ak = {x E X, lfk(x)I > llfklloo} e Bn,m = {x E X, lfn(x) - /m(x)I > llfn - /mlloo}- L'insieme E= UkeN Un,mEN Ak U Bn,m ha misura nulla e nel suo complementare la successione delle fn converge uniformemente ad una funzione f che risulta limitata. Estendendo f ad una funzione definita su tutto X, ponendo tale funzione uguale a zero per tutti i punti di E si ottiene un elemento g di L 00 (X,A,µ) tale che 119 - /nlloo - O per n - oo. ■
Si può mostrare con facili esempi che la convergenza puntuale di funzioni non implica la convergenza negli spazi LP(X, A,µ) e neppure vale il viceversa. Quanto si può dire in generale per la convergenza puntuale di una successione convergente in LP(X, A,µ) è detto nel seguente corollario.
Corollario C.2.1 Sia {fn} (n E N) e LP(X, A,µ), 1 < p < oo una successione convergente ed f il suo limite; esiste una sottosuccessione {fnk} (k E N) tale che limk-oo f nk (x) = f(x) quasi dappertutto. Prova. Sia 1 ::S p < oo e sia {fnk} (k E N) una sottosuccessione tale che 11/nk+l - fnk Il < ~' 'vk E N e sia Sk = fnk+ 1 - fnk. La serie fno + EkeN Sk è assolutamente convergente, quindi esiste la somma s di tale serie e nel corso della dimostrazione del teorema C.1.1 si è mostrato che s(x) = EkeN Sk(x) quasi dappertutto. Il corollario segue osservando che !no+ Er:~ Sk = lnr• Per la dimostrazione nel caso p = oo si rilegga la dimostrazione del teorema C.2.1. ■
C.3. Completezza degli spazi lP(C) e l 00 (C)
C.3
379
Completezza degli spazi lP(C) e l00 (C)
Gli spazi lP(C) ed l 00 (C) si ottengono come casi particolari degli spazi LP(X, A,µ) ed L 00 (X, A, µ) con la seguente scelta dello spazio con misura: X = N, A = P (N) e ponendo su N la misura di conteggio µe: (E) µe
·= { ·
cardinalità di E +oo
se la cardinalità è finita se la cardinalità è infinita
La completezza di lP(C) e di l 00 (C) è allora un corollario del teorema C.1.1 e del teorema C.2.1. Il corollario C.2.1 ha in questo caso una versione più forte. Negli spazi lP(C) e l 00 (C) la convergenza (in norma) implica la convergenza componente per componente. Sia infatti {xk} (k E N) una successione convergente a x in l'P(C). Si osservi allora che
Quindi per ogni n si ha
Xn
= limk Xk;n·
Analoghi teoremi di completezza valgono per gli spazi L~ (X, A, µ) e funzioni a valori reali.
LR (X, A, µ)
di
380
Appendice C. Completezza degli spazi LP(X, A,µ)
Appendice D Relazioni di inclusione tra gli spazi LP(X, A,µ) In generale non esistono relazioni di inclusione tra gli spazi LP(X, A,µ) con (X, A,µ) un generico spazio con misura. Valgono però i seguenti teoremi.
Il caso di V(X, A,µ) con misura finita
D.1
Allora per 1 < s < r
Teorema D.1.1 Sia (X, A,µ) uno spazio con misura finita. valgono le inclusioni: L 00 (X, A,µ)
e ... e
Lr(X,A,µ)
e
L 8 (X,A,µ)
e
L 1 (X,A,µ)
e
Il! lls < llflls
µ(X) r,::" llfllr,
< µ(X)~ llflloo,
Prova. Sia J E Lr(X,A,µ); vale allora che allora:
f lll 8 dµ :5
lx
r-• l
1/1
8
(Jx IJl
8
f
E Lr(x, A,µ),
f E L 00 (X, A,µ).
E Lrfs(X,A,µ). Dalla disuguaglianza di Holder abbiamo (r/s)dµ) s/r
(Jx
ldµ)
Vale inoltre llflls :5 µ(X)-,. " llfllrPer r oo l'inclusione è ancora più immediata:
=
e vale quindi:
llflls :5 µ(X) 118 ll/lloe>• ■ 381
r;• < 00
Appendice D. Relazioni di inclusione tra gli spazi LP(X, A,µ)
382
Osservazione. Nel teorema l'ipotesi che la misura sia finita non si può omettere. Si mostra facilmente, ad esempio, che L 1 (R) non è contenuto in L 2 (R) e non vale neppure l'inclusione opposta.
D.2
Il caso degli lP(C)
Per gli spazi l 11 (C) vale invece il seguente teorema. Teorema D.2.1 Sia 1
~
p
l 1 (C)
< q; valgono le seguenti inclusioni:
e ... e
LP(C)
e lq(C) e ... e
l 00 (C)
e
Prova. Sia
{xn}(n
E N) E [V(C) con p ~ 1. Per definizione LneN
lxnlv
1 segue per induzione. ■
Osservazione. Si noti che nel caso di elementi f E wr(T) la serie di Fourier converge uniformemente, convergenza più forte di quella nella norma di L 2 (T). Ci sono numerosi teoremi che, a certe condizioni sulle funzioni, garantiscono la convergenza puntuale o "forme deboli" di convergenza puntuale della serie di Fourier (si veda a questo proposito il Cap. Vlll in [22)).
Su L 2 (T) è definito il prodotto di convoluzione ponendo (f * g)(x)
= ~ { v21r
lr
f (x - y)g(y)dy.
Si noti che
1.
lf(x - y)g(y)Jdy
:Z~F e questo in modo universale, cioè qualunque sia lo spazio lineare F e qualunque sia E Tril (E1, E2, E3; F)? La risposta a questa domanda è completamente positiva. Nell'algebra multilineare, infatti, si dimostra il teorema seguente. Teorema F.1.1 Siano E 1 , E 2 , E3 spazi lineari, dati: 1) esiste una coppia (Z , x), con •
Z spazio lineare,
• X : E1 x E2 x E3
~
Z trilineare,
che ha la seguente "proprietà di universalità": PER OGNI E Tril (E1, E2, E3; F), QUALUNQUE
SIA LO SPAZIO LINEARE
F,
SI HA
= T : Z ~ F LINEARE UNIVOCAMENTE DETERMINATA DA ; 2) se (Z', x') è un'altra coppia analoga con la stessa propri.età di universalità, esiste un isomorfismo U: Z' ~ Z tale che
CON
X= U o
x'.
Come abbiamo detto la dimostrazione di questo teorema si trova in un qualsiasi trattato di algebra multilineare; possiamo comunque permetterci qui almeno la traccia della dimostrazione che ha il vantaggio di basarsi su una costruzione esplicita caratterizzata da una completa naturalità. Prova (traccia) 1) Dati gli spazi lineari E1, E2, E3, si considera lo spazio lineare 'Iril{E1,E2 1 E3)-, duale dello spazio lineare 'Iril (E1, E2, E3) delle forme trilineari su E1 X E2 x E3 {cioè a valori nel campo K ) e in 'Iril (E1, E2, E3)* la varietà lineare V' Im x generata dal range della mappa trilineare X : E1
dove
X
E2
X
E3 - 'Iril (E1, E2, E3; Ft,
{u1 ,u2,u3) .._ x{u1, u2, u3) :=
ev(u 1 ,u 2 ,u 3 ),
F.1. Prodotto tensoriale di spazi lineari
ev(u 1 ,u 2 ,u 3 )('P) :=
391
ip(u1,u2,u3) 1
o x = o@ con T4>:E 1 © E 2 © E 3 --+ F operatore lineare univocamente determinato da-
Con l'affermazione 1) il teorema F.1.1 garantisce l'esistenza di una coppia. (E 1 © E 2 © E 3 , ®) con le proprietà volute e con l'affermazione 2) ne garantisce la sostanziale unicità lasciando la possibilità di realizzazioni diverse ma tutte isomorfe fra loro. Si noti che per il prodotto tensoriale di E 1 , E 2 , E 3 abbiamo introdotto la notazione tradizionale (E 1 © E 2 © E 3 , ®); anzi, adeguandoci completamente alla tradizione, indicheremo solitamente il prodotto tensoriale (E1 © E2 ® E3, ®) brevemente con E 1 ® E2 © E3. Sempre in omaggio alla tradizione indicheremo l'elemento immagine in E 1 ~) E 2 © E 3 di (u1, u2, u3) E E1 x E2 x E3 via la mappa trilineare © con u1 ® u2 ® u3 anziché con ®(v. 1 , u 2 , ·u. 3 ). Gli elementi di questo tipo, cioè, in definitiva, gli elementi appartenenti a Im ®, sono detti decomponibili; essi non esauriscono, in generale, lo spazio E 1 © E 2 ® E 3 , ma, come abbiamo già osservato alla fine della dimostrazione del teorema F.1.1, ne costituiscono un sistema di generatori. Il prossimo teorema fornisce un criterio molto utile per individuare delle realizzazioni del prodotto tensoriale di E 1 , E 2 , E 3 ; da esso si ricavano anche informazioni molto utili sulle
Appendice F. Prodotto Tensoriale di Spazi Lineari
392
proprietà del prodotto tensoriale che non traspaiono immediatamente dalla definizione F.1.1 (le elenchiamo per comodità in un corollario; per la dimostrazione del teorema e delle affermazioni del corollario rimandiamo ai trattati di algebra multilineare). Teorema F.1.2 Dati gli spazi lineari E 1, E 2, E 3, sia (Z, x) una coppia costituita da uno spazio lineare Z e da una mappa x: E 1 x E2 x E3 _. Z trilineare. Sono equivalenti le affermazioni: a) (Z, x) è il prodotto tensoriale di E1, E2, E3; b) Imx genero Z e per ogni collezione {uli} (i= 1,2, ... ,m), {u2J} (j = 1,2, ... ,n), { 11.3 k} ( k = 1, 2, ... , p) di elementi linearmente indipendenti di E 1 , E 2, E 3 , rispettivamente, gli elementi della collezione
{x(u1i,U2j,11.3k)}
(i= 1,2, ... ,m; j = 1,2, ... ,n; k = 1,2, ... ,p)
sono elementi linearmente indipendenti di Z.
2) Ogni t -=/: O di E 1 0 E 2 0 E 3 ha una rappresentazione {non unica, in genemle) della forma r
t
= L(U1i ® 'U2i@ UJi) i=l
con gli u 1i, gl-i u2i, gli u.3i linearmente indipendenti in E 1 , E2, E3, rispettivamente; l'intero r è detto rango di t {in effetti, non dipende da questa o quella rappresentazione di t, purché sempre del tipo detto). 3) Gli spazi lineari E 1 , E 2 , E3 abbiano dimensione finita. Se
{eli}
(i=l,2, ... ,d1)
{e2J }
(j
= 1, 2, ... , d2)
{e3k}
(k
= l,2, ... ,d3)
{dove d 1 = dim E 1, d2 = dim E2, d3 = dim E3J sono basi di E1, E2, E3, rispettivamente, allora {e1i®e2j®e3k} (i= 1,2, ... , ·m ;j= 1,2, ... ,n; k=l,2, ... ,p)
è una base di E 1 ® E2 ® E3. Da ciò segue che anche E 1 ® E 2 ® E 3 ha dimensione finita ed esattamente
F. l. Prodotto tensoriale di spazi lineari
393
È conveniente a questo punto portare alcuni semplici (ma notevoli) esempi in cui il teorema F.1.1 trova facile applicazione C> Esempio 1. Dato uno spazio lineare E su K e considerato K come spazio lineare su K (ogni campo può essere considerato, in modo ovvio, come spazio lineare su se stesso, anzi, più in generale, su un suo qualsiasi sottocampo) possiamo parlare del prodotto tensoriale K ® E. Orbene, con una (banale) applicazione del teorema F.1.1 abbiamo subito che la coppia (E,®) con
®: K x E-E,
k®u:=ku,
è il prodotto tensoriale di K con E. Possiamo dunque dire che per ogni spazio lineare E su K il prodotto tensoriale K ® E è E stesso. C>
Esempio 2. Km ® Kn
= Kmn, con
KmxKn-Kmn, (h1,h2, ... ,hm)®(k1,k2, ... ,kn):= = (h1 k1, h1k2, • • •, h1kn, h2k1, • • • h2kn, • • •, hmk1, • • •, hmkn) C> Esempio 3. Dato un insieme ( non vuoto) X e uno spazio lineare F su K finiterdimensionale, sia M(X, F) lo spazio lineare delle applicazioni da X in F ed M(X, K) lo spazio lineare delle applicazioni ®
da X in K:
M(X,K) ®F =M(X,F), con
®: K: M(X, K) x F - M(X, F),
(/®v)(x) := f(x)v.
Tornando alle considerazioni generali sul prodotto tensoriale, un problema si impone all'attenzione. Dati due spazi lineari E 1 ed E 2 possiamo considerare sia il prodotto tensoriale E 1 ® E 2 che il prodotto tensoriale E 2 ® E 1; parimenti, dati E 1, E2, E3 possiamo considerare (con chiaro significato delle parentesi) E 1 ® E2 ® E3, (E 1 ® E 2) ® E3 ed E 1 ® (E2 ® E3), per tacere delle altre possibilità: quali relazioni fra E 1 ® E2 e E2 ® E 1 e fra E1 ® E2 ® E3 e (E1 ® E2) ® E3 e E1 ® (E2 ® E3)?
Esiste un isomorfismo U di E1 ® E2 con E2 ® E1 tale che U(u1 ® u2) = u2 ® ui, Vu,1 E E1, \/u2 E E2; esiste un isomorfismo U(i2)3 di E1 ® E2 ® E3 con (E1 ® E2) ® E3 tale che U(12)3(u1 ® u. 2 ® u3) = (u 1 ® u2) ® u.3, Vu 1 E E1, Vu2 E E2, Vu3 E E3 e un isomorfismo U1(2J) di E1 ® E2 ® E3 con E1 ® (E2 ® E3) tale che U1(23) (u1 ® u.2 ® u3) = u1 ® (u2 ® u3), Vu,1 E E1, Vu2 E E2, Vu.3 E E3. Ciò si ottiene usando esclusivamente la proprietà di universalità e il fatto (conseguenza immediata, come abbiamo visto, della proprietà di universalità) che gli elementi decomponibili sono un sistema di generatori dello spazio prodotto tensoriale. Gli isomorfismi U, U(i 2)3, U1(23 ) sono dunque isomorfismi naturali. Pertanto E1 ® E2 è identificabile con E 1 ® E 2 ; supposta senz'altro l'identificazione scriveremo
parimenti
Appendice F. Prodotto Tensoriale di Spazi Lineari
394
Passiamo ora al prodotto tensoriale di applicazioni; ci interessano il prodotto tensoriale di operatori lineari e quello di forme bilineari. Siano E1, E2, E3 ed F1, F2, F3 spazi lineari, T1 : E1 ~ F1 , T2: E2 ~ F2 , T3: E3 ~ F operatori lineari: esiste un operatore lineare
T : E1 ® E2 ® E3 e uno soltanto, tale che T(u 1 ® u2 ® 11.3)
~
F 1 ® F2® F3
= (T1u1) ® (T2 ·u2) ® (T3u3) .
Questo operatore è chiamato prodotto tensoriale degli operatori T1 , T2 , T3 e indicato con T1 ® T2 ® T3. L'esistenza e l'unicità dell'operatore T = T1 ® T2 ® T3 è evidente dalla proprietà di universalità non appena si sia osservato che : E1 x E2 x E3
~
F1 ® F2 ® F3,
(ui , u2, u3)
:=
(T1u1) ® (T2u2) ® (T3u3)
è trilineare. Concretamente l'azione di T sugli elementi non decomponibili di E 1 ® E 2 ® E 3 si ottiene subito sfruttando il fatto che gli elementi decomponibili generano E 1 ® E 2 ® E 3.
Si noti, in particolare, che un operatore lineare T 1 : E 1 ~ E 1 può essere "promosso" a un operatore lineare T: E 1 ® E 2 ® E 3 ~ E 1 ® E 2 ® E 3 semplicemente ponendo T = T1 ® IE2 ® IEa• Siano ora E 1, E 2, E 3 ed F 1 , F2, F3 spazi lineari, 1 : E 1 x F 1 ~ K, 2 : E2 x F2 K , 2, mentre per p
= 2 si ha
400
Appendice F. Prodotto Tensoriale di Spazi Lineari
In modo analogo si introducono i tensori covarianti di E simmetrici e quelli antisimmetrici; come nel caso dei tensori controvarianti, i primi sono insensibili a ogni permutazione, mentre i secondi sono sensibili, attraverso la segnatura, alla classe (pari o dispari) della permutazione. Il simmetrizzatore e l'antisimmetrizzatore si identificano con il trasposto t Sp e il trasposto t Ap del simmetrizzatore Sp e dell' antisimmetrizzatore Ap (rispettivamente) dei tensori controvarianti e si hanno le decomposizioni dirette @PE*
= Im tsp + Ker tsp,
®PE*
= Im tAp + Ker tAp.
La restrizione della dualità canonica di ®PE• con ®PE sia a Im t Sp x Im S.p sia a Im t Ap x Im Ap risulta quindi ancora non degenere e Im t Sp può essere identificato con il duale di Im Sp così come Imt Ap può essere identificato con il duale di lm Ap:
Per gli spazi dei tensori simmetrici e antisimmetrici (contro- e ca-varianti) lm t Sp, Im t Ap ecc. useremo d'ora in poi i simboli, usuali nella letteratura fisico-matematica, oppure oppure oppure oppure
©~E ®~E• ®~E ®~E•
VPE VPE•
/'tE /{E*
per per per per
ImSp, Imt Sp, ImAp, Imt Av-
Coerentemente abbiamo
(®~Er = ®~E• (®~E)*= ®~E•
o anche o anche
vv
(Vp E)* = E* (// E)* = /\P E*.
Anche soltanto per ragioni puramente formali, è conveniente introdurre i simmetrizzatori e gli antisimmetrizzatori nei casi p = 1 e p = O. Ricordato che, per definizione, @PE
-
®PE* = K,
@PE
-
E,
®PE*
se p = O,
= E*,
se p
= 1,
è naturale porre tsp
= Ap =t Ap = idK,
A p = 1.'d E
,
'·Sp = t A p = 1.'d E· ,
se p = O, se p = 1.
Corrispondentemente si ha, ovviamente,
I\ PE
-
j\PE
-
= VPE = VPE* = ®PE = @PE* = K, VPE = ®PE = E, j\PE* = VPE* = @PE* = E*, j\PE*
se p= O se p
= 1.
F.5. Prodotto antisimmetrico. Prodotto simmetrico
F.5
401
Prodotto antisimmetrico. Prodotto simmetrico
La struttura algebrica di spazio lineare dei tensori antisimmetrici e dei tensori simmetrici viene significativamente arricchita con l'introduzione di un prodotto antisimmetrico (chiamato anche prodotto wedge) per i primi e di un prodotto simmetrico per i secondi. Questi due prodotti vengono introdotti con una definizione naturale antisimmetrizzando e simmetrizzando il prodotto tensore (cfr. §F.3). Definizione F.5.1 fl prodotto antisimmetrico (o prodotto wedge) di Sp con tp' (tensori antisimmetrici di grado p e p', rispettivamente) è il tensore antisimmetrico di grado p + p'
indicato con Sp I\ tp', dato da
fl prodotto simmetrico di Sp con tp' (tensori simmetrici di grado p e p', rispettivamente)
è il tensore simmetrico di grado p + p', indicato con Sp V tp', dato da
Le proprietà fondamentali del prodotto wedge e del prodotto simmetrico, oltre a quelle
di linearità rispetto ai due fattori, sono: (rp /\ Sp') /\ tp" {
{
Sp f\ tp'
= rp /\(sp' I\ tp" ),
= (-l)PP' (tp' f\ Sp),
(rp V Sp') V tp"
= rp V(sp' V tp")
Queste proprietà sono conseguenza delle relazioni Ap+p' ( (Apsp) © ~') {
= ~+•' (Sp © (Ap' tp'.)) = Ap+p' (sp © tp')
Ap+p' (sp ® tp,) - (-1) Sp+p' ((Spsp) ® tµ')
{ Sp+p' (sp ® tp')
Ap+p' (tp' ® sµ),
= Sp+p' (sp ® (Sp,tp' )) = Sp+p' (sp ® tµ')
= Sp+p' (tp' ® sp)-
Chiaramente in tutte le affermazioni fatte sopra a proposito dei prodotti antisimmetrico e simmetrico i tensori coinvolti possono essere intesi sia come controvarianti che come covarianti (naturalmente nel caso di tensori covarianti dovranno comparire i competenti antisimmetrizzatori e simmetrizzatori t Ap+p', t Sp+p' ecc.). Così come abbiamo costruito le algebre tensoriali controvariante e covariante di E munendo le somme dirette ® E= LpEN ®PE e ® E• = LpEN ®PE• del prodotto tensore,
402
Appendice F. Prodotto Tensoriale di Spazi Lineari
possiamo costruire le algebre tensoriali antisimmetriche e simmetriche di E e di E• munendo le somme dirette
f\E="Lf\PE
e
(\E•="Lf\PE•
pEN
pEN
del prodotto antisimmetrico e le somme dirette
VE= L VPE
e
VE•= L VPE•
pEN
pEN
del prodotto simmetrico. Si noti che nelle somme dirette /\ E e /\ E• tutti i termini con p > d sono banali:
sicché concretamente le somme dirette LpeN /\P E e LpEN /\P E• sono somme dirette finite. Le algebre/\ E e/\ E• sono comunemente chiamate algebra esterna (o anche algebra di Grassman) su E e su E•, rispettivamente. Si noti infine che sia le algebre esterne di E e di E• sia le algebre simmetriche di E e di E• sono algebre associative con unità; le seconde sono anche commutative, mentre le prime non lo sono.
F.6
Forme Multilineari
La grande importanza delle algebre delle forme multilineari e il loro stretto legame con il calcolo tensoriale non permettono di tacerne qui completamente. Ci limiteremo a rapidi cenni in modo da non deviare troppo dagli scopi che ci siamo proposti. Indichiamo con Mu)P(E), p intero ~ 1, lo spazio lineare delle forme p-lineari su E, cioè delle mappe da E x E x ... X E (p volte) a valori nel campo K lineari separatamente in ciascuna delle p variabili (naturalmente Mul 1 (E)= Lin (E, K)=E•, e conviene includere anche il caso p = O ponendo, per definizione, Mul 0 (E) :=K). Per ogni p E MuJP(E) e ogni 1/Jp, E MuJP' (E) si introduce in modo naturale un prodotto p • 1/Jp': il prodotto p • 1/Jp' è la forma (p + p')-lineare data da
(p • ·t/Jp' )(u1,u2, ... ,up,up+l, ••• ,up+p') :=
d.
'vu E S[p] e
sono chiamate forme p-lineari su E simmetriche. Volendo includere (e può avere i suoi vantaggi formali farlo) anche i casi p S1
=
= idE•
So= idK
(p (p
= 1 e p =Osi pone
= 1)
= O).
Corrispondentemente si ha, ovviamente, S 1 (E)= E*
A 1 (E) A 0 (E)
s0 (E)= K.
A questo punto è piuttosto ovvia la definizione del prodotto antisimmetrico (o prodotto wedge) per le forme antisimmetriche e del prodotto simmetrico per quelle simmetriche; il primo è dato da p (\ VJp' := Ap+p' {p . ·r/Jv• ),
il secondo da p
VVJp' := Sp+p' (p. 1Pp' ),
Esplicitamente: (p
={
I\ 'IPp') ('U
l ' ... , 'Up'
'Up+ l
I
2 covarianti l'insieme delle dP componenti si trasforma con una matrice che è la potenza p-esima di Kronecker della matrice a, mentre per quelli controvarianti si trasforma con la potenza p-esima di Kronecker della matrice t a - 1 . Date due matrici quadrate M ed N di ordine m ed n, il loro prodotto di Kronecker, spesso indicato con M x N, è una matrice quadrata K di ordine mn con elementi Kij;kl ottenuti moltiplicando ciascun elemento di M con ciascun elemento di N nel modo seguente: Kij;kl
=
MikNjl
(i, k = 1, 2, ... , m; j, l = 1, 2, ... , n);
la coppia ij di indici agisce come indice di riga, mentre la coppia kl agisce come indice di colonna. Il prodotto di Kronecker di due matrici è chiamato anche prodotto tensoriale delle due matrici e indicato allora con M ® N.
F.8
Definizione alternativa dei tensori
Sulla base delle ultime osservazioni possiamo formulare una definizione che, per la precisione, più che una definizione alternativa di tensore è una definizione generale fisicamente più significativa e più ricca che permette di introdurre, oltre ai tensori che già conosciamo, anche altre grandezze, per esempio le densità tensoriali; essa caratterizza, infatti, le grandezze con il loro modo di comportarsi rispetto alle trasformazioni di riferimento. Per formulare questa definizione ci occorrono i seguenti ingredienti: 1) l'insieme R(E) dei riferimenti di E, 2) il gruppo GL(d) e la sua azione a destra su R(E) R(E)xGL(d) ~ R(E),
(e, a)~ e'= ea
3) una rappresentazione di GL(d) in uno spazio numerico Km, cioè uno spazio numerico Km e un omomorfismo p di GL(d) in Aut Km. I primi due ingredienti ci sono già noti; dalle considerazioni precedenti possiamo anche intuire il loro ruolo: essi fissano il tipo di trasformazioni cui siamo interessati. Anche il ruolo del terzo ingrediente si può intuire dalle stesse considerazioni: è sulle componenti del tensore che ha effetto la trasformazione di riferimento attraverso una matrice adeguatamente associata alla matrice a della trasformazione; ora, le componenti di un tensore relative a un riferimento di E sono m-uple ordinate di numeri (con ·m che dipende dall'ordine p del tensore), cioè elementi dello spazio (lineare) numerico Km, e le azioni
F.8. Defìnizione alternativa dei tensori
409
naturali di un gruppo G sullo spazio Km sono date dalle rappresentazioni di G sullo spazio Km. Lo spazio Km ha un riferimento canonico e ciò permette di identificare l'algebra degli endomorfismi di Km con l'algebra L(m) delle matrici quadrate di ordine m; conseguentemente il gruppo Aut Km si identifica con il gruppo GL(m). È opportuno allora sottolineare che, se k (k1, k2, ... , km) è un generico elemento di Km ed runa matrice appartenente a L(m) con elementi rii (i,j = 1,2, ... ,m), con rk intendiamo l'elemento di Km dato da ((rk)i,(rk)2, ... ,(rk)m) dove
=
m
(rk)i
= L rijkj. j=l
Possiamo ora formulare la definizione che ci interessa. Preliminarmente, però, presa una rappresentazione p di G L( d) in Km, introduciamo lo spazio lineare
costituito dalle mappe cp : R(E)
-+
Km p-equivarianti, cioè tali che
cp(ea) =p(a- 1 )cp(e),
Ve E R(E), Va EGL(d).
La struttura lineare di Eqv p(R(E),Km) è quella naturale:
(
M;. Esaminando i "commutanti iterati" M" = (M')', M"' = ((M')')', ... , dalla 4) e dalla (anch'essa evidente) 5) Me M", si ha 6) M' = M"', cosicché con l'iterazione dei commutanti non si va oltre M". Passando alle proprietà topologiche, è chiaro dalla continuità del prodotto in L (?t) (nella topologia della norma operatoriale) che M' è chiuso e quindi, nel caso di un M stabile per aggiunzione, che M' è una C"'-algebra di operatori. Nella topologia debole e nella topologia forte di L (?t) il prodotto non è continuo (congiuntamente nelle due variabili), ma lo è in ciascuna delle due variabili separatamente (cfr. §2.9 Esercizio 1) e ciò basta, in realtà anche nel caso della topologia della norma operatoriale, per concludere che M'è chiuso; M', quindi, è chiuso non soltanto nel senso della norma operatoriale ma anche in senso debole e in senso forte.
421
422
Appendice H. Algebre di von Neumann
Il commutante M' di un sottoinsieme M stabile per aggiunzione di L ('H.) è quindi una c•-algebra di operatori di tipo "speciale": M'è una c•-algebra con unità debolmente (e quindi anche fortemente) chiusa. Si deve a von Neumann il teorema seguente, pietra angolare dell'edificio delle algebre di operatori di uno spazio di Hilbert. Teorema H.1.1 Sia A una *-sottoalgebra di L ('H.). Sono equivalenti le affermazioni: a) A= A"; b) A è debolmente chiusa e 1 E A; c) A è fortemente chiusa e 1 E A.
Le implicazioni a)=> b), b) => e) sono evidenti; la parte non semplice della dimostrazione è l'implicazione e) => a) (cfr. (28)). Si chiama algebra di von N eumann, brevemente w• -algebra, di 'H. una *-sottoalgebra di L ('H.) che goda delle proprietà equivalenti del teorema H.1.1. Il commutante M' di un sottoinsieme M stabile per aggiunzione di cui ragionavamo sopra è dunque un w•-algebra. Ogni sottoinsieme M di L ('H.) è contenuto in una w•-algebra di 'H., se non altrimenti in L ('H.) stessa; ma il fatto importante è che ha perfettamente senso parlare della più piccola w•-algebra contenente M; essa è detta la w•-algebra generata da M e noi qui la indicheremo con w• (M); se M è stabile per aggiunzione si ha
w• (M) = M"; se M è generico, si ha
w• (M) = (M u Mt)", dove il significato di M t è ovvio. A noi interessa particolarmente il caso della w• -algebra generata da un singolo A E L ('H.), w• (A). Chiaramente, se A è normale, e soltanto se è tale, la w•-algebra generata w• (A) è commutativa; dal teorema H.1.1 segue che w• (A) coincide con la chiusura debole di e• (A) , la c•-algebra con con unità generata da A (cfr. §3.14).
Le w• -algebre commutative hanno un ruolo molto importante e quindi conviene dedicarvi alcune osservazioni. Chiaramente la condizione AcA' caratterizza come commutativa (o abeliana) una *-sottoalgebra di L ('H.); la condizione più forte A=A' esprime una specie di estremalità ed effettivamente caratterizza la *-sottoalgebra A di L ('H.) come *-sottoalgebra commutativa massimale, cioè non contenuta propriamente in alcun altra *-sottoalgebra commutativa di L ('H.) . Le *-sottoalgebre di L ('H.) commutative massimali descrivono situazioni spettrali interessanti. Con il teorema seguente le formuliamo per il caso che a noi interessa della w•-algebra generata da un A EL ('H.) normale.
423
Teorema H.1.2 Dato A E L (rt) normale, sia w• (A) la w• -algebra, commutativa, generata da A. Sono equivalenti le affermazioni: a) w• (A) è massimale, cioè w• (A) = w• (A)'; b} w• (A) ha un vettore ciclico; c) lo spazio di Hilbert integrale diretto di cui al teorema 3.17.1 è L 2 (A,B, vA). Dobbiamo dire che cosa significa il termine ''vettore ciclico": data una *-algebra A di operatori di 7t, un x E 7t è chiamato vettore ciclico per A se VBEA {Bx} = 7t, dove V BEA {Bx} ha il solito significato: è il sottospazio generato dal sottoinsieme dei trasformati Bx mediante tutti i B E A. Un ruolo parallelo a quello dei vettori ciclici hanno i vettori separanti: un x E 7t è chiamato vettore separante per A se BE A, Bx = O implica B = O. A proposito di vettori separanti sarà importante per noi nell'appendice I il seguente risultato: per ogni
w• -algebra A
di 1t commutativa esiste un x E 7t separante.
Un x E 1-f. separante per .A può essere costruito esplicitamente nel modo seguente. Sia {un} (n E N) un riferimento ortogonale di 1-f. (cioè un s.o.n.c. ordinato di 'H.). Posto 1-f.1 := VAEA {Av1 }, dove v1 = u1, sia Uni il primo degli Un non appartenente a 1-f.1; nel sottospazio 1-f.1 V Uni generato da 1-f.1 e da un 1 prendiamo un v2 con norma 1 e che sia ortogonale a 'H.1 e costruiamo 'H.2 := VAeA {Av2}; ovviamente 'H.1 e 'H.2 sono ortogonali. Proseguendo, sia un 2 , n2 > n1, il primo degli Un successivi a Uni non appartenente a 1-f.1 + 1-f.2; nel sottospazio (1-f.1 + 1-f.2) V un 2 , generato da 'H.1 + 'H.2 e un 2 , prendiamo un v3 con norma 1 ortogonale a 'H.1 + 'H.2 e costruiamo 'H.3 := VAEA {Av3}; ovviamente 'H.1, 1-f.2 e 'H.3 sono ortogonali. Con iterazioni successive del procedimento si ottiene infine una collezione (al più infinito-numerabile) {'H.k} (k = 1, 2, ... ) di sottospazi ortogonali la cui somma hilbertiana Ek 'H.k è 'H.: se non fosse Ek 1-f.k = 1-f. esisterebbe un vo con llvoll = 1 ortogonale a tutti gli Un e ciò contraddirebbe la completezza del s.o.n. {un} (n E N). Indicato con Pk il proiettore relativo al sottospazio 'Hk, due proprietà della collezione {Pk} (k 1, ... ) sono evidenti: Ek Pk = 1 (la convergenza della serie è intesa in senso forte) e, qualunque sia A E .A, APk = PkA, Vk = 1, 2, ... (per ogni k sia 1-f.k che il complemento ortogonale 1-f.t sono .A-invarianti). Posto v = Ek i-,.vk, sia A E .A tale che Av = O; allora APk = O, Vk = 1, 2, ... (infatti si ha, per ogni x E 1-f., APkx E A (vi{Bivk}) = vi {ABiPkv} = vi {BiPkAv} ={O}) e poiché Ek Pk = 1 ne segue A= O. Dunque v è separante per .A.
=
Con semplici considerazioni si può facilmente vedere che, data una w• -algebra A, x E 7t è separante per A se e soltanto se è ciclico per A'; parimenti: x E 7t è ciclico per A se e soltanto se è separante per A'. Per una w•-algebra commutativa massimale, quindi, un x E 7t è ciclico se e soltanto se è anche separante. Un operatore A E L (1t) normale per cui la w• -algebra generata ha un vettore ciclico è detto semplice (o anche senza degenerazione; qualche autore parla di operatore con spettro semplice o anche di operatore con spettro senza degenerazione}; effettivamente la proprietà chiesta a w• (A) di avere un vettore ciclico è la generalizzazione della proprietà definitoria di operatore semplice ben nota nel caso finito-dimensionale: A è detto semplice
424
Appendice H. Algebre di von Neumann
se tutti i suoi autovalori (che sono gli unici punti dello spettro) hanno moltiplicità uguale a 1.
Appendice I Misure basiche Avvertenza. In questa appendice Z è uno spazio localmente compatto di Hausdorff secondo numerabile e B la o--algebra di Borel di Z (cfr. §A.9). Definizione 1.1.1 Data una m.v.p. {misura a valori. di proiezione) E su Z, si chiama misura E-basica su Z una misura positiva v su (Z, B) tale che, per ogni ME B, v(M) =O E(M) = O.
Tre proprietà praticamente evidenti dalla definizione: i) tutte le misure E-basiche su Z sono equivalenti; ii) la misura (complessa) su (Z, B)
µ;,y,
dove
µ:,Y (M) := (xlE (M) y),
M E B,
è assolutamente continua rispetto alla misura E-basica v su (Z, B) per ogni x, y E 1t;
iii) la m.v.p. E e la misura E-basica v hanno lo stesso supporto.
Si è visto nell'appendice G (teor. G.1.3 e G.1.4) che per ogni c•-algebra di operatori commutativa A esiste una m.v.p. E sullo spettro n per cui
i (f) =
fn JdE,
J E B (n) ,
essendo \li il prolungamento dell'isomorfismo di Gelfand w. Nel contesto delle m.v.p. associate in questo modo alle c•-algebre di operatori commutative il teorema fondamentale sull'esistenza di misure basiche è il seguente. 425
Appendice I. Misure basiche
426
Teorema 1.1.1 Data una C•-algebra A di operatori commutativa, condizione necessaria e sufficiente perché esista una misura E-basica su (O, B) finita è che esista un x E 1t ciclico per il commutante A'; se questo è il caso, la µf,
µ1f (M)
:= (xlE (M) x),
M E B,
è basica.
Per la dimostrazione si veda (11] Part I Ch. 7 Proposition 2. Teorema 1.1.2 Per ogni C•-algebra A di operatori commutativa esiste una misura Ebasica sullo spettro di A, finita. Prova. Sappiamo (cfr. appendice H) che per ogni w•-a1gebra A commutativa esiste un x E 'H. separante (per A) e quindi ciclico per A'; x è ciclico anche per A 0, se .Ao è una qualsiasi *-sottoa1gebra di A chiusa nella topologia della norma operatoriale (ossia una c•-algebra contenuta in A) poiché da Ao e A segue
A 0:) A'.
Dal teorema 1.1.1 abbiamo così che, se A è una W'"-algebra di 'H. commutativa, per ogni c•-algebra
Ao contenuta in A esiste una misura E-basica finita sullo spettro di Ao . Arriviamo così al risultato che ci interessa: infatti, A" è la w•-algebra generata da A (quindi A" :) A) ed è commutativa.
■
Per un approfondimento sulle misure basiche rimandiamo al già citato [11].
Appendice J Operatori nucleari È già stato osservato nel §3.8 che le classi degli operatori compatti, HS e degeneri si possono definire anche in L (1t 1, 1t2), anche se nel §3.8 sono stati trattati in particolare per 1t1 = 1t2. Per queste classi di operatori useremo, nel caso generale, i simboli Le (1t1, 1t2), LHs (1t1, 1t2) e Lv (1t1, 1t2), rispettivamente. Valgono ancora molte proprietà che abbiamo mostrato nel caso di 1t 1 = 1t 2: si tratta di varietà lineari e si hanno le inclusioni:
e si tratta di inclusioni dense in Le (7t1, 7t2): Le (7t1, 7t2) = Lv (7t1, 7t2) Inoltre si ha(~ sta per Do HS o C): 1) A E Lò (rf.1, 1t2) e BEL (1t2, 1t3) => AB E Lò (1t1, rf.3), 2) A E L (1t1, 7t2) e B E LI::!. (7t2, 7t3) => AB E LI::!. (7t1, 7t3); 3) A E LI::!. (1t1, 1t2) => A t E Lò. (1t2, 1ti)
= Lfls (7t1, 7t2)-
L'aggiunto At di un A E L ('H.1, 'H.2) è, per definizione, l'operatore T1 1 tAT2 (t A è il trasposto e T 1 : 'H.1 - 'H.i e T2 : 'H.2 - 'H.2 sono gli isomorfismi di Riesz).
Se A E L (1t1, 7t2) l'operatore A t A sta in L (1t 1) ed è positivo; è quindi ben posta la definizione dell'operatore modulo di A IAI := JAtA
(cfr. §3.15 per la definzione di radice quadrata di un operatore positivo). Se A E Le (1t1, 1t2), l'operatore IAI è un operatore di Le (7t1). L'operatore At A E Le ('H.1) ha quindi ha spettro puramente puntuale e la sua risoluzione spettrale è AtA
=
L >.. 11 Et1 p
427
ÀpP>..p
Appendice J. Operatori nucleari
428
dove la convergenza è secondo la norma di L (rli). Si ha allora
IAI =
L
>.~12 P>.p
>.pEap
dove la convergenza è anche qui secondo la norma. Uoperatore norma di operatori degeneri.
IAI
è quindi compatto essendo limite in
Nel seguito indicheremo conµ.,, gli autovalori di IAI. Preso un s.o.n.c. {un} (n E N) di autovettori di IAI tale che gli autovalori corrispondenti siano una successione decrescente µ 0 > µ 1 ~ .•. > µn > ... si ha (J.1) n
dove gli autovalori sono eventualmente ripetuti; la successione {µn} (n E N) è fatta da numeri positivi convergenti a zero. Si ha anche una notevole rappresentazione per A e per A t:
(a)
Ax
L µn (unix) Wn, :/:O L µn (wnlY)
-
't/x E 'H.1
µn
(b)
Aty
-
Un,
't/y E 'H.2
µn:/:0
dove i Wn
:=
-±-Au.n sono ortonormali (infatti (wnlwm) -
( unl-±,*AtAurn)
( frnAUnl*Aum) -
= Dn,m)-
In effetti si tratta di serie convergenti nella norma di L ('H. 1, 'H. 2); introducendo, per u E 'H. 1 e w E 'H.2, l'operatore degenere Au0w : 'H.1 -1- 'H.2, x ....-+ Au0 wx := (ulx) w, abbiamo
L L
A
Aµnun®'Wn
µn:/:0
µ"
Infatti
Il (A -
00
L
Aµnwn®Un •
:/:O
Aµ.n Un0Wn
)xli :5 µkllxll,
Vx E
rl1
JJ.n;,!:O,n=k
e questo mostra che IIA - E:'n;,!:O,n=k Aµ.nun0Wn 11
-
O; analogamente per l'altra serie.
Veniamo ora agli operatori nucleari. Definizione J.1.1 Un operatore A EL ('H. 1, 'H.2) si dice nucleare se esistono due successioni limitate {Xn} (n E N) e {Yn} (n E N) contenute rispettivamente in 1i. 1 e in 'H. 2 tali che En llxnll llYnll < oo e per ogni x E 'H.1 si a.bbia Ax = En (xnlx) Yn•
429
Teorema J.1.1 Sia A EL (1-f. 1, 1-f.2); sono equivalenti: 1) A è nucleare, 2) esistono due successioni limitate {xn} (n E N) e {Yn} (n E N) contenute rispettivamente in 1-f.1 e in 1-f.2 tali che I: 1L llxn 11 IIYn 11 < oo e A sia il limite in norma della serie I:n Axn ®Yn'
{µn}
3) A E Le (1-f. 1, 1-f.2) e la s·uccessione
degli autovalori di
IAI
sta in l 1 (C);
4) A E Le (1-f.1, 1-f.2) e IAI è nucleare; 5) A
= BC,
con B e C operatori HS;
=
Prova. 1}=?2) IIAx - E~:i Axn0Ynx11 Il L~k (xnlx) Ynll $ llxll L~=k llxnll llYnll "ix E 'H.1 e ciò mostra che IIA - E~:i Axn0Yn Il$ L~=k llxnll llYnll con L~=k llxnll llYnll - O per k - oo; 2)=?3) l'operatore A è compatto essendo limite in norma di operatori degeneri (il teor. 3.8.3 vale infatt.i anche per Le ('H.1, 'H.2)); preso un s.o.n.c. {un} (n E N) di autovalori di IAI sia Ax = E,.Ln~O µn (unix) Wn, \ix E 'H.1 la rappresentazione di A data nella (a):
L n
lµnl
=L
l(wnlAun)I $ L LI (xklun) (wnlYk) I$ L llxkll llYkll < oo,
n
k
n
(J.2)
k
dove si è usata la disuguaglianza di Holder per le successioni e la disuguaglianza di Besse}; 3)=?4) evidente; 4)=?1) se A è compatto per A e IAI valgono le rappresentazioni date nelle formule (a) e (J.l); essendo IAI nucleare, da 1}=?3) si ·ha I:11 µn < oo, da cui segue che anche A è nucleare; 1}5) Sia A = BC con B E LHs ('H.1, 'H.3) e C E LHs ('H.3, 'H.2) e {un} (n E N) un s.o.n.c. in 'H.3; si ha Ax = B Ln (u.nlCx) Un = Ln (et unix) Bun con Ln 11ctunll llBunll $