247 27 3MB
German Pages 292 [303] Year 2023
Robert Denk
Mathematische Grundlagen der Quantenmechanik
Mathematische Grundlagen der Quantenmechanik
Robert Denk
Mathematische Grundlagen der Quantenmechanik
Robert Denk FB Mathematik und Statistik Universität Konstanz Konstanz, Deutschland
ISBN 978-3-662-65553-5 ISBN 978-3-662-65554-2 (eBook) https://doi.org/10.1007/978-3-662-65554-2 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2022 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von allgemein beschreibenden Bezeichnungen, Marken, Unternehmensnamen etc. in diesem Werk bedeutet nicht, dass diese frei durch jedermann benutzt werden dürfen. Die Berechtigung zur Benutzung unterliegt, auch ohne gesonderten Hinweis hierzu, den Regeln des Markenrechts. Die Rechte des jeweiligen Zeicheninhabers sind zu beachten. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag, noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral. Planung/Lektorat: Iris Ruhmann Springer Spektrum ist ein Imprint der eingetragenen Gesellschaft Springer-Verlag GmbH, DE und ist ein Teil von Springer Nature. Die Anschrift der Gesellschaft ist: Heidelberger Platz 3, 14197 Berlin, Germany
Gewidmet meinen Studentinnen und Studenten, die sich mit großem Fleiß und viel Energie auf die spannende Reise eines Mathematik- oder PhysikStudiums begeben.
Vorwort
Die Quantenmechanik ist eine elegante und faszinierende Theorie, die bei ihrer Entdeckung eine Revolution in der Physik ausgelöst hat. Sie verabschiedet sich unter anderem von der klassischen Vorstellung, den Ort und die Geschwindigkeit eines Teilchens präzise bestimmen zu können. Zugleich ist die Quantenmechanik in ihrer Formulierung eine sehr mathematische Theorie. Die ersten Grundprinzipien können mit nur wenigen Axiomen formuliert werden – aber in diesen Axiomen wimmelt es von mathematischen Begriffen, die über eine klassische Analysisvorlesung in einer oder mehreren Variablen weit hinausgehen. Dies führt in vielen Fällen dazu, dass im Rahmen einer Physikvorlesung über Quantenmechanik einige Begriffe nicht exakt formuliert werden können und das eine oder andere Konzept etwas unklar bleibt. Auf der anderen Seite lernt man im Verlauf eines Bachelor-Studiums der Mathematik häufig einen großen Teil der in der Quantenmechanik auftretenden Konzepte kennen, beispielsweise den Raum der quadratintegrierbaren Funktionen oder vielleicht sogar Grundzüge der Operatortheorie. Aber es fehlt dann die Querverbindung zur Quantenmechanik. Angesichts der fundamentalen Bedeutung der Quantenmechanik empfinde ich das wie einen Elfmeter, auf dessen Ausführung man dann verzichtet. Dies gilt unabhängig vom gewählten Nebenfach – die Axiome der Quantenmechanik in ihrer mathematischen Formulierung sollte jede Studentin und jeder Student der Mathematik einmal gesehen haben. Die Idee dieses Buches ist es, die Grundzüge der Quantenmechanik in einer mathematisch exakten Formulierung für alle Studentinnen und Studenten von Physik und Mathematik anzubieten. Wer die Quantenmechanik bereits aus der Physik kennt, wird hier die gehörten Begriffe präzisiert und vertieft finden, und wer einige der verwendeten Konzepte bereits aus dem Mathematik-Studium kennt, wird hier die Interpretation und zugehörige Axiomatik der Quantenmechanik kennenlernen. Das vorliegende Büchlein ist entstanden aus Vorlesungen mit dem gleichnamigen Titel, die ich an der Universität Konstanz im Rahmen des Bachelor-Studiums Mathematik und Physik angeboten habe. Es ist gedacht für Studierende in der zweiten Hälfte des Bachelorstudiums oder zu Beginn des Masterstudiums. Vorausgesetzt werden lediglich die Begriffe aus der Analysis VII
VIII
Vorwort
einer und mehrerer Veränderlicher, wie sie typischerweise im Rahmen einer Analysis I/ II-Vorlesung gehört werden. Im Hinblick auf das unterschiedliche Vorwissen über die Analysis hinaus werden in diesem Buch Begriffe aus späteren Vorlesungen wiederholt bzw. eingeführt – so finden sich hier Zutaten aus der Maß- und Integrationstheorie, der Funktionalanalysis und der Operator- und Spektraltheorie. Um den Umfang dieses Buches eher gering zu halten (es soll eine kleine Ergänzung und nicht die eigenständige Darstellung einer kompletten Theorie sein), wurden einige Kompromisse eingegangen: Aus Sicht der Physik handelt es sich nur um die ersten Axiome der Quantenmechanik, wie sie etwa im Rahmen der Kopenhagener Deutung formuliert wurden. Es fehlen große Abschnitte wie etwa Symmetrien, Quantenfeldtheorien und relativistische Quantenmechanik. Auch werden nur exemplarisch die ersten Beispiele quantenmechanischer Systeme genauer untersucht, insbesondere das Wasserstoffatom. Auch aus Sicht der Mathematik wurden Abstriche gemacht. So lege ich den Schwerpunkt auf die Konzepte und wichtigsten Sätze, verzichte aber an der einen oder anderen Stelle auf den Beweis und verweise dafür auf die entsprechende MathematikLiteratur. Die Quantenmechanik kann in der Schreibweise der Physik oder der Mathematik formuliert werden. So wird man in der Physik zum Beispiel auf keinen Fall auf die BraKet-Notation verzichten, die in der Mathematik eher unüblich ist. Auch die Frage, ob das Skalarprodukt im ersten oder im zweiten Argument linear ist, spaltet hier die Welten. Ohne eine Wertung damit zu implizieren, verwende ich im vorliegenden Buch durchgehend die mathematische Schreibweise – was auch damit zu tun haben könnte, dass ich selbst Mathematiker bin. Ein Hinweis zu einigen in der Physik üblichen Schreibweisen findet sich am Ende von Kap. 1. Es geht in diesem Buch auch nicht um die physikalische Interpretation der Axiome und Resultate (dafür wird auf die reichhaltige Physik-Literatur über Quantenmechanik verwiesen), sondern um die mathematischen Grundlagen und Konzepte dieser schönen Theorie. Um die Leserinnen und Leser zu motivieren, beginnt dieses Buch mit der Formulierung einiger zentraler Axiome der Quantenmechanik und einem kurzen Vergleich mit der klassischen Mechanik. Dabei tauchen mathematische Begriffe auf, die vielleicht unbekannt sind oder deren genaue Definition in der Hektik des Alltags gerade vergessen wurde. Statt in Panik zu verfallen, sollte man dann die nachfolgenden Kap. 2–7 lesen, in denen gerade diese Begriffe erklärt werden. In Kap. 8 werden die Axiome – mit dem jetzt neu erworbenen Wissen – wiederholt und vertieft, bevor in Kap. 9 und 10 erste quantenmechanische Systeme analysiert werden. Die verwendeten mathematischen Schreibweisen werden im Symbolverzeichnis erläutert, eine Bemerkung zu den physikalischen Einheiten findet sich am Anfang von Abschn. 1.2. Die Idee, die Quantenmechanik aus mathematischer Sicht zu formulieren und die mathematischen Grundlagen dafür zusammenzustellen, ist keineswegs neu. Es gibt eine ganze Reihe von deutsch- und (noch häufiger) englischsprachigen Büchern zu diesem Thema, und der hier präsentierte Stoff ist über die verschiedenen Quellen verteilt bereits
Vorwort
IX
zu finden. Viele dieser Bücher sind im Niveau höher angesetzt und eignen sich nicht als Grundlage etwa einer Vorlesung im Bachelor-Studium (was das vorliegende Buch hoffentlich erfüllt). Auf vergleichbare Bücher sowie auf verwendete und weiterführende Bücher wird zu Beginn des Literaturverzeichnisses eingegangen. Es ist mir eine Freude, mich bei allen zu bedanken, die bei der Erstellung dieses Buches mitgeholfen haben. Zunächst möchte ich hier meinen Studierenden aus Mathematik und Physik danken, die mir bei der gleichnamigen Vorlesung (und meinen weiteren Vorlesungen im Bereich der Analysis) stets hilfreiche und konstruktive Rückmeldungen geben. Ebenfalls bedanken möchte ich mich bei meinen Kollegen Markus Kunze und Peter Nielaba sowie bei den Promovierenden Karsten Herth, David Ploß, Sophia Rau und Tim Seitz für das sorgfältige Korrekturlesen und viele hilfreiche Anregungen und wertvolle Verbesserungsvorschläge. Bei meinem Doktoranden David Ploß und meiner Doktorandin Sophia Rau ergänze ich noch einen besonderen Dank für ihre stets exzellente Unterstützung im Bereich der Übungsorganisation meiner Vorlesungen. Nicht zuletzt geht mein Dank an Frau Carola Lerch und Frau Iris Ruhmann vom Springer-Verlag für die Anregung zu diesem Buchprojekt und die stets gute Zusammenarbeit und Unterstützung. Konstanz im Oktober 2022
Robert Denk
Inhaltsverzeichnis
1
Motivation: Klassische Mechanik und Quantenmechanik. . . . . . . . . . . . . . 1 1.1 Ein kurzer Ausflug in die klassische Mechanik. . . . . . . . . . . . . . . . . . . . 1 1.2 Die Postulate der Quantenmechanik. . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2 Hilberträume. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 2.1 Skalarprodukte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 2.2 Grundbegriffe der Topologie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 2.3 Der Approximationssatz und der Satz von Riesz für Hilberträume. . . . . 32 2.4 Orthonormalbasen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 3
Elemente der Maß- und Integrationstheorie. . . . . . . . . . . . . . . . . . . . . . . . . 49 3.1 Der Maßbegriff und das Lebesgue-Maß . . . . . . . . . . . . . . . . . . . . . . . . . 50 3.2 Messbare Funktionen und das Integral . . . . . . . . . . . . . . . . . . . . . . . . . . 58 3.3 Der Hilbertraum aller quadratintegrierbaren Funktionen . . . . . . . . . . . . 73
4
Distributionen und die Fourier-Transformation. . . . . . . . . . . . . . . . . . . . . . 81 4.1 Distributionen und Sobolevräume. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 4.2 Die Fouriertransformation in Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5
Lineare Operatoren in Hilberträumen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 5.1 Abgeschlossene lineare Operatoren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110 5.2 Spektrum und Resolvente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 5.3 Der adjungierte Operator. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 5.4 Selbstadjungierte Operatoren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
6
Der Spektralsatz für selbstadjungierte Operatoren . . . . . . . . . . . . . . . . . . . 145 6.1 Spektralmaße. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 6.2 Spektralsatz und Funktionalkalkül. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163 6.3 Der Spektralsatz für kommutierende Operatoren . . . . . . . . . . . . . . . . . . 172 6.4 Unitäre Gruppen und der Satz von Stone. . . . . . . . . . . . . . . . . . . . . . . . . 182
XI
XII
Inhaltsverzeichnis
7
Kompakte Operatoren und Spurklasseoperatoren. . . . . . . . . . . . . . . . . . . . 191 7.1 Eigenschaften kompakter Operatoren. . . . . . . . . . . . . . . . . . . . . . . . . . . 192 7.2 Spurklasseoperatoren und Hilbert–Schmidt-Operatoren. . . . . . . . . . . . . 199
8
Fazit: Die Postulate der Quantenmechanik. . . . . . . . . . . . . . . . . . . . . . . . . . 209 8.1 Axiomatik und direkte Folgerungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 8.2 Zeitliche Entwicklung und stationäre Zustände. . . . . . . . . . . . . . . . . . . . 216
9
Erste Beispiele quantenmechanischer Systeme. . . . . . . . . . . . . . . . . . . . . . . 227 9.1 Das freie Teilchen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227 9.2 Der harmonische Oszillator. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 234
10 Quantenmechanische Beschreibung des Wasserstoffatoms . . . . . . . . . . . . . 241 10.1 Das Wasserstoffatom ohne Spin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242 10.2 Das Punktspektrum des Wasserstoffatoms. . . . . . . . . . . . . . . . . . . . . . . . 249 10.3 Das Wasserstoffatom mit Spin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 263 10.4 Relativistische Quantenmechanik und Dirac-Operatoren. . . . . . . . . . . . 272 Anmerkungen zum Literaturverzeichnis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 281 Stichwortverzeichnis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285
Symbolverzeichnis
(xj )nj=1 (x1 , . . . , xn )⊤ , Schreibweise für Vektoren n (aij )i,j=1 Schreibweise für Matrizen (. . .)⊤ Transponierte eines Vektors oder einer Matrix (xn )n∈ N ⊆ X Schreibweise für Folgen mit Folgengliedern xn ∈ X Schreibweise für nicht notwendigerweise abzählbare Familien {xi }i∈I |x| ( nj=1 |xj |2 )1/2 , euklidische Norm des Vektors x ∈ Rn typische Schreibweise für Norm � · � � · �∞ Supremums-Norm Graphennorm zum Operator T � · �T typische Schreibweise für Skalarprodukt �·, ·� Skalarprodukt in Physik-Schreibweise �·|·� ∅ leere Menge A(x) (x ∈ X) die Aussage A(x) gilt für alle x ∈ X, äquivalent zu ∀ x ∈ X : A(x) A × B kartesisches Produkt der Mengen A und B A\B {x ∈ A | x �∈ B}, Mengendifferenz . A. ∪ B A ∪ B, Vereinigung von disjunkten Mengen A n n∈N An, Vereinigung von disjunkten Mengen n∈N Ac X \ A, Komplement der Menge A A⊥ orthogonales Komplement der Menge A Vereinigung der Mengen Ai i∈I Ai A Abschluss der Menge A a Vernichtungsoperator a* Erzeugungsoperator [a, b] {x ∈ Rn | aj ≤ xj ≤ bj (j = 1, . . . , n)}, Intervall im Rn |α| α1 + . . . + αn , Multiindex-Schreibweise αk Dirac-Matrizen, k = 1, . . . , 4 A typische Schreibweise für σ-Algebren A1 ⊗ A2 Produkt-σ-Algebra B(X) Borel-σ-Algebra des topologischen Raums X B(X) Raum der beschränkten Funktionen f : X → K XIII
XIV
Symbolverzeichnis
B(X, A ; R) Raum der beschränkten A-messbaren Funktionen BUC(G) Raum der beschränkten gleichmäßig stetigen Funktionen auf G BUCk(G) Raum aller Funktionen, deren Ableitungen bis zur Ordnung k beschränkt und gleichmäßig stetig sind c Lichtgeschwindigkeit C Coulomb (Einheit) Menge der komplexen Zahlen C Menge aller stetigen Funktionen von X nach K C(X) Ck(X) Menge aller k-fach stetig differenzierbaren Funktionen von X nach K, wobei k ∈ N ∪ {∞} ∞ Menge aller glatten Funktionen auf G mit kompaktem Träger Cc (G) Df totale Ableitung der Funktion f Laplace-Operator radialer Laplace-Operator r Laplace-Beltrami-Operator auf S2 S2 ∂xj partielle Ableitung nach xj partielle Ableitung nach xj ∂j ∂ partielle Ableitung nach xj ∂xj ∂ α Multiindex-Schreibweise für partielle Ableitungen D(G) Menge der Testfunktionen auf G D′ (G) Menge der Distributionen auf G D(T) Definitionsbereich des Operators T δ δ0, Dirac-Distribution oder Dirac-Maß Dirac-Distribution oder Dirac-Maß zum Punkt x δx δ(x) Delta-Funktion (Physik-Schreibweise) δij Kronecker-Symbol Standardabweichung des Operators T im Zustand ψ (�T )ψ deg P Grad des Polynoms P dist (x, M) inf {�x − y� | y ∈ M}, Abstand des Punktes x zur Menge M e Elementarladung Elementarladung im SI eSI E typische Schreibweise für Spektralmaß Produkt der Spektralmaße E1 und E2 E1 ⊗ E2 Ex (A) = �E(A)x�2 , skalares Spektralmaß Ex itT e zum Operator T gehörige unitäre Gruppe elektrische Feldkonstante ε0 εijk Levi-Civita-Symbol charakteristische Funktion der Menge A ess im (f) essentieller Wertebereich der Funktion f f(V) {f (x) | x ∈ V } Bild der Menge V unter der Funktion f Urbild der Menge V unter der Funktion f f −1 (V )
Symbolverzeichnis
XV
Komposition der Funktionen f und g f ◦ g Faltung der Funktionen f und g f ∗ g Faltung der Distribution u und der Funktion f u ∗ f Jacobi-Matrix von f an der Stelle x f ′ (x) f+ max{f, 0}, Positivteil der Funktion f f− −min{f, 0}, Negativteil der Funktion f [f] die zu f gehörige reguläre Distribution Funktion eines Operators T, Funktionalkalkül f (T ) Funktion mehrerer Operatoren, Funktionalkalkül f (T1 , T2 ) Ff , Fouriertransformierte der Funktion f f F Fouriertransformation im Rn F(G, H) Menge der Operatoren endlichen Ranges von G nach H F(H) Menge der Operatoren endlichen Ranges von H nach H typische Schreibweise für Spektralschar F D (G)
ϕk −→ ϕ S (Rn )
Konvergenz in D(G)
ϕk −→ ϕ Konvergenz in S(Rn ) G(T) Graph des Operators T h Plancksches Wirkungsquantum reduziertes Plancksches Wirkungsquantum Hermite-Polynom der Ordnung n hn H typische Bezeichnung für einen Hilbertraum direkte Hilbertraumsumme H1 ⊕ H2 H direkte Hilbertraumsumme n n∈N H s (G) Sobolevraum der Ordnung s ∈ N auf einem Gebiet G Abschluss der Testfunktionen in H s (G) H0s (G) s n H (R ) Sobolevraum der Ordnung s ∈ R auf Rn i imaginäre Einheit n-dimensionale Einheitsmatrix In Identität als Funktion idX : X → X, x � → x idX Im z Imaginärteil der komplexen Zahl z im(T) Wertebereich des Operators T ind T Index des Fredholm-Operators T ´ Integral von f bezüglich des Maßes µ ´ f dµ f (x)dS(x) Oberflächenintegral von f ´ f dE Integral von f bezüglich des Spektralmaßes E K K ∈ {R, C}, einheitliche Bezeichnung für R oder C K(G, H) Menge der kompakten linearen Operatoren von G nach H K(H) Menge der kompakten linearen Operatoren von H nach H ker T Kern des Operators T L typische Schreibweise für Drehimpulsoperator L+, L− Leiteroperatoren
XVI
Symbolverzeichnis
Lkα Laguerre-Funktion L(X, Y ) Raum aller stetigen linearen Operatoren von X nach Y L(X) Raum aller stetigen linearen Operatoren von X nach X L1 (µ) Menge aller µ-integrierbaren Funktionen Lp (µ) Raum der p-fach integrierbaren Funktionen L 2 (µ) Hilbertraum der quadratintegrierbaren Funktionen modulo Nullmengen 2 n 2 L (R ; C ) vektorwertiger L2-Raum L p (µ) Banachraum der p-fach integrierbaren Funktionen modulo Nullmengen 1 (G) Lloc Menge aller lokal integrierbaren Funktionen auf G ℓ2 Folgenraum n-dimensionales Lebesgue-Maß n µ typische Bezeichnung für ein Maß µ1 ⊗ µ2 Produkt-Maß µ0 magnetische Feldkonstante µB Bohrsches Magneton N {1, 2, 3, . . . }, Menge der natürlichen Zahlen N ∪ {0} = {0, 1, 2, . . .} N0 N Teilchenzahloperator Gradient von f an der Stelle x ∇f (x) o(h) Landau-Symbol P Impulsobservable P typische Schreibweise für Wahrscheinlichkeitsmaß P(X) Potenzmenge der Menge X (assoziiertes) Legendre-Polynom Pℓm typische Schreibweise für reine Zustände ψ ψ↑ (ψ, 0)⊤, reiner Zustand mit positivem Spin ψ↓ (0, ψ)⊤ , reiner Zustand mit negativem Spin Q Ortsobservable Menge der rationalen Zahlen Q d q˙ q(t), Ableitung nach der Zeit dt2 d q¨ q(t), zweite Ableitung nach der Zeit dt 2 R Menge der reellen Zahlen R R ∪ {+∞, −∞} R Rydberg-Konstante Bohrscher Atomradius r0 rank T Rang des Operators T Re z Realteil der komplexen Zahl z R (T ) (T − )−1 , Resolvente des Operators T ρ(T ) Resolventenmenge des Operators T ρ typische Schreibweise für Dichtematrix
Symbolverzeichnis
zum reinen Zustand ψ gehörige Dichtematrix ρψ Sn n-dimensionale Einheitssphäre Sj Spin-Operator, j = 1,2,3 S Spinvektoroperator σj Pauli-Matrizen, j = 1,2,3 S(Rn ) Schwartz-Raum S ′ (Rn ) Raum der temperierten Distributionen S1 (G, H) Menge der Spurklasseoperatoren von G nach H S1 (H) Menge der Spurklasseoperatoren von H nach H S2 (H) Menge der Hilbert−Schmidt-Operatoren von H nach H σ (E ) von E erzeugte σ-Algebra σ (T ) Spektrum des Operators T Punktspektrum des Operators T σp (T ) σc (T ) kontinuierliches Spektrum des Operators T σr (T ) Restspektrum des Operators T σapp (T ) approximatives Punktspektrum des Operators T σess (T ) essentielles Spektrum des Operators T span M lineare Hülle von M statC Einheit für elektrische Ladung im Gauß-System supp ϕ Träger der Funktion ϕ T typische Schreibweise für Operatoren T Abschluss des Operators T ∗ T adjungierter Operator T † adjungierter Operator (Physik-Schreibweise) nichtnegativer Operator T ≥ 0 T > 0 positiver Operator der Operator T1 ist eine Einschränkung von T2 T1 ⊆ T2 T1T2−T2T1, Kommutator von T1 und T2 [T1 , T2 ] T ψ ψ, T ψ, Erwartungswert von T im Zustand ψ s Konvergenz in der starken Operatortopologie Tn → T Konvergenz in der starken Operatortopologie T = s-lim Tn n→∞ tr T Spur des Operators T Varianz des Operators T im Zustand ψ varψ T W (T ) numerischer Wertebereich des Operators T X typische Bezeichnung für allgemeine Vektorräume oder normierte Räume X ′ topologischer Dualraum von X n n x · y j=1 xj yj , Standard-Skalarprodukt im R Tensorprodukt als linearer Operator x ⊗ y x α x1α1 · . . . · xnαn , Multiindex-Schreibweise
XVII
XVIII
x ist orthogonal zu y x ⊥ y Yℓm Kugelflächenfunktion z¯ komplex konjugierte Zahl z* komplex konjugierte Zahl (Physik-Schreibweise) ζ Zählmaß
Symbolverzeichnis
1
Motivation: Klassische Mechanik und Quantenmechanik
Worum geht’s? Die Begriffe der klassischen Mechanik sind typischerweise mit
dem Wissen einer Analysis-Vorlesung nachvollziehbar. So ist der Ort eines eindimensionalen Teilchens ein Punkt in R, die zeitliche Entwicklung wird mit Hilfe von Ableitungen beschrieben. Das ändert sich grundlegend, wenn man zur quantenmechanischen Beschreibung übergeht! Hier ist der Ort eines Teilchens durch die Ortsobservable beschrieben – dies ist die Abbildung, welche eine Funktion ψ : R → C auf die Funktion x → xψ(x) abbildet. Die zeitliche Entwicklung ergibt sich durch Anwendung einer unitären Gruppe. Das ist ein großer Sprung im Vergleich zur klassischen Mechanik, und die Axiome der Quantenmechanik sind voll von Begriffen, welche nicht in einer Analysis-Vorlesung zu finden sind – hier muss man schon eher in die Funktionalanalysis und Operatortheorie schauen. Auch die Stochastik taucht hierbei auf: Die Quantenmechanik verlässt den vertrauten Boden der Kausalität und gibt Wahrscheinlichkeiten dafür an, dass eine Messung einen bestimmten Wert ergibt. In diesem Kapitel beschreiben wir zunächst kurz den Zugang zur klassischen Mechanik über Variationsprinzipien nach Lagrange und Hamilton und gehen dann zu den Axiomen der Quantenmechanik über. Wichtige auftretende Begriffe sind etwa Observable und Hamilton-Operatoren, welche sich typischerweise mit Hilfe der Quantisierungsregel aus der klassischen Mechanik ergeben. Die in diesem Kapitel genannten Begriffe werden in den nachfolgenden Abschnitten genauer diskutiert.
1.1
Ein kurzer Ausflug in die klassische Mechanik
Wir starten mit einer kurzen Beschreibung der klassischen Mechanik in der Form eines Variationsprinzips nach Lagrange und Hamilton. Dabei wird ein klassisches mechanisches System beschrieben durch generalisierte Koordinaten und die Lagrangefunktion. Genera© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2022 R. Denk, Mathematische Grundlagen der Quantenmechanik, https://doi.org/10.1007/978-3-662-65554-2_1
1
2
1 Motivation: Klassische Mechanik und Quantenmechanik
lisierte Koordinaten sind von der Form q(t) = (q1 (t), . . . , q N (t)) ∈ R N , welche von der Zeit t ∈ R abhängen; ein Beispiel für generalisierte Koordinaten ist der Ort eines Teilchens q(t) ∈ R3 . Ein mechanisches System wird beschrieben durch eine Lagrangefunktion L : R × R N × R N → R, welche als Funktion L(t, q(t), q(t)) ˙ typischerweise die Differenz d zwischen kinetischer und potentieller Energie beschreibt. Dabei bezeichnet q(t) ˙ := dt q(t) die Ableitung nach der Zeit. Das Hamilton-Prinzip, ein fundamentales Prinzip der Mechanik, besagt: Ein mechanisches System, welches durch die Lagrange-Funktion L beschrieben wird, bewegt sich so, dass q eine Extremalstelle (üblicherweise Minimalstelle) des Wirkungsfunktionals t2 S(q) := L(t, q(t), q(t)) ˙ dt t1
ist. Dabei wird das Extremum unter allen stetig differenzierbaren Wegen q : [t1 , t2 ] → R N mit fest vorgegebenen Randwerten q(t1 ) = q01 , q(t2 ) = q02 gesucht. Wir beginnen mit einem Beispiel. Beispiel 1.1 (Harmonischer Oszillator)
Der harmonische Oszillator beschreibt einen punktförmigen Körper der Masse m > 0 an einer Feder, welche dem Hookeschen Gesetz F = −kx(t) mit der Federkonstanten k > 0 genügt (siehe Abb. 1.1). Dabei ist x(t) ∈ R die (in der Abbildung vertikale) Auslenkung zum Zeitpunkt t bezüglich der Ruhelage des Pendels. Befindet sich demnach die Masse in der Ruhelage, so ist die Auslenkung 0. Hier wählt man N := 1, und q : R → R, t → q(t) = x(t) beschreibt die Auslenkung des Körpers. Die kinetische Energie zur Zeit t ist gegeben durch T (t) = 21 m q(t) ˙ 2 , die 1 2 potentielle Energie durch U (t) = 2 kq(t) . Die Lagrangefunktion für dieses mechanische System lautet L(t, q(t), q(t)) ˙ = T (t) − U (t) =
Abb. 1.1 Der harmonische Oszillator
1 1 m q(t) ˙ 2 − kq(t)2 . 2 2
1.1
Ein kurzer Ausflug in die klassische Mechanik
3
Damit ist das Wirkungsfunktional gegeben durch t2 1 1 2 2 m q(t) ˙ − kq(t) dt. S(q) := 2 2 t1
(1.1)
Sei L : R × R N × R N → R, (t, x, y) → L(t, x, y) mit x = (x1 , . . . , x N ) und y = (y1 , . . . , y N ) die Lagrange-Funktion eines mechanischen Systems. Dabei bezeichnet (. . .) den transponierten Vektor. Wir setzen im Folgenden voraus, dass die Funktion L differenzierbar ist. Da man für das Hamilton-Prinzip den Ausdruck L(t, q(t), q(t)) ˙ betrachtet, definiert man die Schreibweisen ∂q L(t, x, y) := (∂x1 L(t, x, y), . . . , ∂x N L(t, x, y)) , ∂q˙ L(t, x, y) := (∂ y1 L(t, x, y), . . . , ∂ y N L(t, x, y)) . Hierbei ist ∂x j := ∂∂x j die partielle Ableitung nach x j . Um Extremalstellen des Wirkungsfunktionals zu bestimmen, kann man – ähnlich wie im endlich-dimensionalen Fall – die Ableitung der Abbildung q → S(q) berechnen. Dabei ist die Ableitung DS(q) definiert als lineare Approximation, d. h. als lineare Abbildung h → DS(q)h so, dass S(q + h) = S(q) + DS(q)h + r (q, h)
f¨ur h → 0,
wobei r (q, h) = o(h) (h → 0) bezüglich einer geeignet gewählten Norm · gelte, d. h. es gelte r (q, h) lim =0 h→0 h (Landau-Symbol). In diesem Fall konvergiert r (q, h) für h → 0 schneller als h gegen Null. Dabei ist zu beachten, dass q und h differenzierbare Wege, d. h. Abbildungen q, h : [t1 , t2 ] → R N sind. Wir erklären die Vorgehensweise wieder am Beispiel des harmonischen Oszillators. Beispiel 1.2
Wir setzen Beispiel 1.1 fort. Die Lagrange-Funktion ist hier gegeben durch L : R × R × R → R, (t, x, y) → L(t, x, y) = 21 my 2 − 21 kx 2 . Die oben definierten Ableitungen sind gegeben durch ∂q L(t, x, y) = ∂x L(t, x, y) = −kx, ∂q˙ L(t, x, y) = ∂ y L(t, x, y) = my. Wir nehmen an, dass der Weg q : [t1 , t2 ] → R so gewählt sei, dass S(q) (siehe (1.1)) minimal wird. Für einen leicht geänderten Weg q1 (t) := q(t) + h(t) mit einem (ebenfalls differenzierbaren) Weg h : [t1 , t2 ] → R gilt dann
4
1 Motivation: Klassische Mechanik und Quantenmechanik
1 1 2 ˙ m(q(t) ˙ + h(t)) − k(q(t) + h(t))2 2 2 ˙ − kq(t)h(t) + o(h), = L(t, q(t), q(t)) ˙ + m q(t) ˙ h(t)
L(t, q1 (t), q˙1 (t)) =
wobei · eine geeignet gewählte Norm sei, in diesem Fall z. B. h := sup
t∈[t1 ,t2 ]
|h(t)| + |h (t)| .
Dabei gelte h(t1 ) = h(t2 ) = 0, d. h. Anfangs- und Endpunkt der Kurve q bleiben unverändert. Falls q hinreichend glatt ist (z. B. zweimal stetig differenzierbar), erhält man mit partieller Integration t2 ˙ − kq(t)h(t) dt + o(h) m q(t) ˙ h(t) S(q + h) − S(q) = t1 t2
=
t1
t2 − m q(t) ¨ − kq(t) h(t) dt + m q(t)h(t) ˙
t=t1
+ o(h).
Dabei verschwinden die Randterme wegen h(t1 ) = h(t2 ) = 0. Wir erhalten somit S(q + h) = S(q) + DS(q)h + o(h),
(1.2)
wobei die Ableitung von S an der Stelle q gegeben ist durch die lineare Abbildung t2 h → DS(q)h := − m q(t) ¨ − kq(t) h(t) dt. (1.3) t1
Da q das Wirkungsfunktional S minimiert, gilt S(q + h) − S(q) ≤ 0 für alle h. Wegen (1.2) ist dies nur möglich, falls DS(q) = 0 gilt, d. h. falls das Integral in (1.3) für alle glatten Wege h den Wert 0 ergibt. Dies wiederum ist nur möglich, falls m q(t) ¨ + kq(t) = 0 (t ∈ [t1 , t2 ]).
(1.4)
Diese Gleichung kann nun verwendet werden, um q explizit zu berechnen. Man erhält
q(t) = c1 sin(ωt) + c2 cos(ωt) mit Konstanten c1 , c2 ∈ R, wobei ω := mk . Die Gl. (1.4) ist die Euler–Lagrange-Gleichung für den harmonischen Oszillator, die man auch im allgemeinen Fall betrachten kann. Bemerkung 1.3. Sei L : R×R N ×R N → R, (t, x, y) → L(t, x, y) die Lagrange-Funktion eines mechanischen Systems, und der hinreichend glatte Weg q : [t1 , t2 ] → R N sei eine Extremalstelle des Wirkungsfunktionals S. Dann erhält man (formal) durch Ableiten unter dem Integral für kleine Wege h : [t1 , t2 ] → R N mit h(t1 ) = h(t2 ) = 0 analog zu Beispiel 1.2
1.1
Ein kurzer Ausflug in die klassische Mechanik
t2
t1 t2
t1 t2
S(q + h) − S(q) = = =
5
˙ L(t, q(t) + h(t), q(t) ˙ + h(t)) − L(t, q(t), q(t)) ˙ dt ˙ + o(h) dt ˙ · h(t) + ∂q˙ L(t, q(t), q(t)) ˙ · h(t) ∂q L(t, q(t), q(t))
∂q L(t, q(t), q(t)) ˙ · h(t) −
t1
t 2 + ∂q˙ L(t, q(t), q(t)) ˙ · h(t)
t=t1
d ∂q˙ L(t, q(t), q(t)) ˙ · h(t) dt
+ o(h).
dt (1.5)
Dabei wurde in der letzten Gleichheit partielle Integration bezüglich t verwendet. Wegen (q + h)(t j ) = q0 j = q(t j ) für j = 1, 2 gilt h(t1 ) = h(t2 ) = 0, und die Randterme verschwinden. In (1.5) wurde für zwei Vektoren x = (x j ) Nj=1 und y = (y j ) Nj=1 in R N die Schreibweise N x · y := x j yj j=1
verwendet. Wir erhalten somit für die Ableitung des Wirkungsfunktionals S an der Stelle q t2 d ∂q L(t, q(t), q(t)) ˙ − ∂q˙ L(t, q(t), q(t)) ˙ · h(t) dt. DS(q)h = dt t1 Da q eine Extremalstelle von S ist, muss DS(q)h = 0 für alle h gelten. Dies ist nur möglich, falls die Klammer in obigem Integral verschwindet, d. h. falls der Weg q die Euler–LagrangeGleichung im Sinn folgender Definition erfüllt. Definition 1.4. Sei L : R × R N × R N → R die Lagrange-Funktion eines mechanischen Systems. Dann heißt die Gleichung ∂q L(t, q(t), q(t)) ˙ −
d ∂q˙ L(t, q(t), q(t)) ˙ = 0 (t ∈ R) dt
(1.6)
die Euler–Lagrange-Gleichung zu L. Die obige Herleitung der Euler–Lagrange-Gleichung ist nicht formal korrekt (da wir keinen Raum für q definiert haben), lässt sich aber mathematisch präzisieren. Man beachte, dass die Euler–Lagrange-Gleichung durch die Bedingung der verschwindenden Ableitung des Wirkungsfunktionals gegeben ist, nicht mehr durch die Extremalbedingung. Daher spricht man beim Hamilton-Prinzip manchmal auch vom Prinzip der stationären Wirkung. Statt mit der Euler–Lagrange-Gleichung (1.6) arbeitet man oft mit den Hamiltonschen Bewegungsgleichungen. Eine Grundlage dafür ist die Legendre-Transformation für (strikt) konvexe Funktionen, welche wir allgemein definieren wollen. Dabei heißt eine Funktion f : R N → R konvex, falls
6
1 Motivation: Klassische Mechanik und Quantenmechanik
f (αx + (1 − α)y) ≤ α f (x) + (1 − α) f (y) für alle x, y ∈ R N und alle α ∈ (0, 1) gilt. Die Funktion f heißt strikt konvex, falls für alle x = y die obige Abschätzung sogar mit „ 0, welches im Gauß-System die Form er hat, im SI jedoch die e2
Form 4πSIε0 r . Dabei ist e ≈ 4,80321 · 10−10 statC die Elementarladung im Gauß-System und eSI ≈ 1,60218 · 10−19 C die Elementarladung im SI. Dieses Potential (im Gauß-System) wird uns beim Hamilton-Operator für das Wasserstoffatom später noch begegnen. Der Messvorgang ist in der Quantenmechanik wichtig. Anders als in der klassischen Mechanik, wird nicht ein fester Wert gemessen, sondern man bestimmt die Wahrscheinlichkeit dafür, bestimmte Werte (oder Werte in einem bestimmten Bereich) zu messen. Dies zeigt die folgende Definition, die auch als stochastische Interpretation eines quantenmechanischen Systems bezeichnet wird. Definition 1.16. Sei T eine Observable im quantenmechanischen System H , und sei ψ ∈ D(T ) ein reiner Zustand. Sei E das zur Observablen T gehörige Spektralmaß auf B (σ (T )). Dann ist für jede Menge A ∈ B (σ (T )) durch E(A)ψ, ψ = E(A)ψ2 = E ψ (A) ∈ [0, 1] die Wahrscheinlichkeit dafür gegeben, dass bei einer Messung der Observablen T , falls sich das System im Zustand ψ befindet, der gemessene Wert in A liegt. In Definition 1.11 wurden reine Zustände betrachtet. Als Verallgemeinerung hiervon gibt es in der Quantenmechanik auch den Begriff des gemischten Zustands und die entsprechende stochastische Interpretation. Definition 1.17. Ein gemischter Zustand ist ein selbstadjungierter, nichtnegativer Spurklasseoperator ρ ∈ L(H ) mit tr ρ = 1. Falls T eine Observable im quantenmechanischen System H ist und sich das System im gemischten Zustand ρ befindet, so ist für jede Menge A ∈ B (σ (T )) die Wahrscheinlichkeit dafür, dass der durch die Observable gemessene Wert in A liegt, gegeben durch
12
1 Motivation: Klassische Mechanik und Quantenmechanik
tr(ρ E(A)). Dabei ist wieder E das zu T gehörige Spektralmaß auf B (σ (T )). Der gemischte Zustand ρ heißt auch Dichtematrix. Man beachte, dass es sich bei ρ im Allgemeinen trotz des Namens nicht um eine Matrix handelt. Bisher haben wir nur die Messung zu einem festen Zeitpunkt betrachtet. Genauso wie in der klassischen Mechanik ändert sich der Zustand des Systems mit der Zeit. Während die zeitliche Entwicklung des Systems in der klassischen Mechanik durch die Hamilton-Funktion und die Hamiltonschen Bewegungsgleichungen (1.9) beschrieben wird, wird die zeitliche Dynamik in der Quantenmechanik durch den Hamilton-Operator und die SchrödingerGleichung festgelegt. Definition 1.18. Zu jedem quantenmechanischen System gehört ein eindeutig bestimmter selbstadjungierter Operator H : H ⊇ D(H ) → H , der Hamiltonoperator des Systems. Befindet sich das System zum Zeitpunkt t = 0 im Zustand ψ0 ∈ H , ψ0 = 1, so ist es zum Zeitpunkt t > 0 im Zustand ψ(t) := e−it/ h¯ H ψ0 . Falls ψ0 ∈ D(H ), so ist ψ eine Lösung der (abstrakten) Schrödingergleichung i h¯ ψ (t) = H ψ(t) (t > 0), ψ(0) = ψ0 .
(1.10)
Dabei bezeichnet ψ die Ableitung von ψ nach der Zeit t. Bemerkung 1.19. Der Hamilton-Operator wird zur Beschreibung des quantenmechanischen Systems benötigt und ist Teil der Modellierung des Systems, nicht der Mathematik. Die folgende Regel liefert jedoch einen „Übersetzungsmechanismus“, der es erlaubt, klassische Hamilton-Funktionen in quantenmechanische Hamilton-Operatoren zu übersetzen: Quantisierungsregel: Gegeben sei ein System von Teilchen, das im Rahmen der klassischen Mechanik und Elektrodynamik durch die generalisierten Koordinaten q = q(t) ∈ R N und die generalisierten Impulse p = p(t) ∈ R N sowie durch die Hamilton-Funktion H : R × R N × R N → R beschrieben wird. Dann wird der quantenmechanische HamiltonOperator dieses Systems gebildet durch die Ersetzung von q j durch Q j : L 2 (R N ) ⊇ D(Q j ) → L 2 (R N ) und durch die Ersetzung von p j durch P j : L 2 (R N ) ⊇ D(P j ) → L 2 (R N ). Hierbei wirken der Orts- bzw. Impulsoperator Q j bzw. P j jeweils auf die j-te Koordinate, d. h. Q j ψ(x) := x j ψ(x) und P j ψ(x) := −i h¯ ∂x j ψ(x). Den somit erhaltenen Differentialausdruck H (t, P, Q) verwendet man zur Konstruktion des quantenmechanischen Hamilton-Operators des Systems. Diese Regel ist allerdings nicht als formale Definition verwendbar, da zum einen nichts über den Definitionsbereich des Hamilton-Operators ausgesagt wird, andererseits die Ope-
1.2
Die Postulate der Quantenmechanik
13
ratoren Pi und Q i nicht kommutieren, so dass der gebildete formale Operator nicht immer eindeutig definiert ist. Beispiel 1.20
Die klassische Hamilton-Funktion des (eindimensionalen) harmonischen Oszillators war gegeben durch p2 k H (t, q, p) = + q 2, 2m 2 siehe Beispiel 1.9. Mit der Quantisierungsregel ergibt sich der Hamilton-Operator H=
1 2 k 2 P + Q , 2m 2
d. h. für hinreichend glatte Funktionen ψ ist H ψ gegeben durch den formalen Differentialausdruck k 1 2 h¯ ψ (x) + x 2 ψ(x). (H ψ)(x) = − 2m 2 Jetzt muss noch der Definitionsbereich so spezifiziert werden, dass H ein selbstadjungierter Operator ist. Mit der zeitlichen Entwicklung ist eine (erste) Axiomatik der Quantenmechanik abgeschlossen, die wir noch einmal zusammenfassen. Axiome der Quantenmechanik: [A1] Die Gesamtheit der reinen Zustände eines quantenmechanischen Systems ist gegeben durch die Menge der eindimensionalen Unterräume eines separablen C-Hilbertraums H (oder durch normierte Vektoren von H ). [A2] Jede beobachtbare Größe (Observable) eines quantenmechanischen Systems ist beschrieben durch einen selbstadjungierten Operator in H . [A3] Sei ψ ∈ H , ψ = 1, ein reiner Zustand und T : H ⊇ D(T ) → H eine Observable. Dann ist die Wahrscheinlichkeit dafür, dass der Messwert der beobachtbaren Größe T in der Menge A ∈ B (σ (T )) liegt, gegeben durch E(A)ψ2 , wobei E : B (σ (T )) → L(H ) das Spektralmaß des Operators T ist. [A4] Die zeitliche Entwicklung eines quantenmechanischen Systems ist gegeben durch einen selbstadjungierten Operator H , den Hamilton-Operator des Systems. Befindet sich das System zur Zeit t = 0 im Zustand ψ0 ∈ H , ψ0 = 1, so ist es zum Zeitpunkt t > 0 im Zustand ψ(t) := e−it/ h¯ H ψ0 . Die Axiome [A1]–[A4] bilden das Grundgerüst der Quantenmechanik und werden je nach Anwendung durch weitere Axiome ergänzt. Wir geben hier noch das entsprechende Axiom für gemischte Zustände an, andere typische Axiome betrachten etwa Symmetrien und ent-
14
1 Motivation: Klassische Mechanik und Quantenmechanik
sprechende zugehörige unitäre Darstellungen. Symmetrien sollen in diesem Buch jedoch nicht diskutiert werden.
[A5] Ein gemischter Zustand eines quantenmechanischen Systems ist gegeben durch eine Dichtematrix ρ, d. h. einen selbstadjungierten, nichtnegativen Spurklasseoperator mit Spur 1. Falls T : H ⊇ D(T ) → H eine Observable ist und das System sich im gemischten Zustand ρ befindet, so ist die Wahrscheinlichkeit dafür, dass der Messwert der beobachtbaren Größe T in der Menge A ∈ B (σ (T )) liegt, gegeben durch tr(ρ E(A)). In den letzten Seiten tauchen viele Begriffe auf, die über den Stoff z. B. einer üblichen Analysis-Vorlesung weit hinausgehen. Doch: Keine Panik! Es ja gerade das Ziel dieses Buchs, die entsprechenden Konzepte vorzustellen, wichtige Eigenschaften zu beweisen und anhand einiger Beispiele die entstehenden quantenmechanischen Systeme zu untersuchen. In Kap. 2–7 werden wir auf die Definitionen und wichtige Eigenschaften der mathematischen Objekte eingehen, bevor wir in Kap. 8 nochmal auf die Axiomatik zurückkommen und diese eingehender studieren. Danach folgen in Kap. 9 und 10 einige Beispiele quantenmechanischer Systeme. Wir geben in Tab. 1.1 die wichtigsten der oben erwähnten Begriffe noch einmal an. Bemerkung 1.21 (Physik-Notation). Schon beim ersten Blick in die Literatur über Quantenmechanik fällt auf, dass zwei verschiedene Schreibweisen verwendet werden, je nachdem, ob die Darstellung eher physikalisch oder eher mathematisch orientiert ist. Im vorliegenden Buch verwenden wir die mathematische Schreibweise (was natürlich in keiner Weise eine Wertung darstellen soll), daher werden hier zumindest einige in der Physik übliche Notationen erwähnt. a) Ein zentraler Unterschied ist die Verwendung der Bra-Ket-Notation oder Dirac-Notation in der physikalischen Schreibweise. In dieser Notation werden Vektoren (z. B. reine Zustände) als Ket, d. h. in der Form |ψ geschrieben, während lineare Funktionale als Bra, also in der Form f | dargestellt werden. Die Anwendung eines linearen Funktionals f | auf einen Vektor |ψ ergibt dann f |ψ, was bei Hilberträumen in Schreibweise und Interpretation mit dem Skalarprodukt übereinstimmt. Das Tensorprodukt f ⊗ φ wird in der Bra-Ket-Notation zu |φ f |, und angewendet auf Vektoren |ψ erhält man f |ψ|φ. Die Anwendung eines Operators T auf einen Vektor |ψ schreibt man wie gewohnt als T |ψ, und man setzt
1.2
Die Postulate der Quantenmechanik
15
Tab. 1.1 Übersicht über einige wichtige Begriffe der Quantenmechanik Begriff
Auftauchen
Kapitel
Separabler Hilbertraum
Zustandsraum
Kap. 2
Der Raum L 2 (R) der quadratintegrierbaren Funktionen
Zustandsraum für die Orts- und Impulsvariable, Axiom [A1]
Kap. 3
Sobolevraum H 1 (R)
Definitionsbereich für die Impulsvariable, Beispiel 1.14
Kap. 4
Distributionelle Ableitung
Wirkung der Impulsvariablen, Beispiel 1.14
Kap. 4
Selbstadjungierter Operator
Definition Observable, Axiom [A2]
Kap. 5
Spektralsatz und Spektralmaß
Stochastische Interpretation, Axiom [A3]
Kap. 6
Wahrscheinlichkeitsmaß
Stochastische Interpretation, Axiom [A3]
Kap. 3
Unitäre Gruppe
Zeitliche Entwicklung des Systems, Axiom [A4]
Kap. 6
Spurklasseoperator
Gemischter Zustand, Axiom [A5]
Kap. 7
φ|T |ψ := φ|ψ1 mit |ψ1 := T |ψ. b) Im Zusammenhang mit der Bra-Ket-Notation schreibt man auch in einem Hilbertraum H das Skalarprodukt in der Form φ|ψ statt φ, ψ. Die komplex konjugierte Zahl wird in der Physik-Notation üblicherweise als z ∗ geschrieben, der adjungierte Operator zu T wird oft als hermitesch konjugierter Operator bezeichnet und erhält das Symbol T † . Selbstadjungierte Operatoren werden in der Physik häufig hermitesche Operatoren genannt. Schließlich wird das Skalarprodukt in der Physik meist als linear im zweiten Argument und konjugiert linear im ersten Argument definiert, während es in der Mathematik gerade umgekehrt ist. c) Einige Standardbezeichnungen werden in Physik und Mathematik unterschiedlich verwendet, so sind Vektoren in der Physik oft fett gedruckt, teilweise findet man r ∈ R3 dort, wo in der Mathematik eher x ∈ R3 stehen würde, und die Variable der FourierTransformierten heißt in der Physik eher k statt ξ . Das L 2 -Skalarprodukt wird etwa in [42, Abschn. 3.2.2], in der Form φ|ψ = d3r φ ∗ (r)ψ(r) geschrieben, während es im vorliegenden Buch die Form φ(x)ψ(x) dx φ, ψ = R3
16
1 Motivation: Klassische Mechanik und Quantenmechanik
hat. Schließlich geht man in der Physik etwas entspannter mit der Dirac-Distribution um und schreibt diese als Funktion (oft als Delta-Funktion bezeichnet). So wird man etwa die Zeile f (r)δ(r − r) dr = f (r ) eher in einem Physik-Buch finden als in einem Mathematik-Buch.
Was haben wir gelernt? • In der klassischen Mechanik führt das Hamilton-Prinzip zu den Euler–LagrangeGleichungen, über die Legendre-Transformation kommt man zu den Hamiltonschen Bewegungsgleichungen. • In der Quantenmechanik werden zu messende Größen durch Observable beschrieben, der Zustand eines Systems wird durch normierte Elemente eines Hilbertraums dargestellt. • In der Quantenmechanik wird die zeitliche Entwicklung durch einen HamiltonOperator beschrieben. • Die Definition der Observablen und des Hamilton-Operators können (in vielen Fällen) durch Quantisierung der entsprechenden Größen aus der klassischen Mechanik konstruiert werden.
2
Hilberträume
Worum geht’s? Im Axiom [A1] wird ein reiner Zustand als ein normiertes Element
in einem separablen C-Hilbertraum definiert – deshalb behandelt dieses Kapitel den Begriff eines Hilbertraums. Ein einfaches Beispiel für einen Hilbertraum ist der Vektorraum Rn , der viele gute Eigenschaften besitzt: Man kann ihn mit einer Norm versehen, z. B. der euklidischen Norm |x| :=
n
|x j |2
1/2
,
j=1
so dass man einen vollständigen normierten Raum erhält. Dabei heißt vollständig, dass jede Cauchyfolge gegen einen Grenzwert konvergiert. Zusätzlich kann man definieren, wann zwei Vektoren x, y ∈ Rn senkrecht aufeinander stehen: Dies ist der Fall, falls x, y = 0, wobei ·, · das durch x, y := x · y :=
n
x j yj
j=1
gegebene Skalarprodukt ist. Man sieht, dass die Norm durch das Skalarprodukt erzeugt wird, d. h. es gilt |x|2 = x, x für alle x ∈ Rn . Hilberträume besitzen ebenfalls all diese Eigenschaften, sind aber – gerade in den für die Quantenmechanik interessanten Fällen – häufig unendlich-dimensional. Wir werden insbesondere sehen, dass auch der Begriff einer Basis (die im Rn endlich ist, genauer aus n Elementen besteht) auf den unendlich-dimensionalen Fall übertragen werden kann. Der dazu passende Begriff ist allerdings nicht die Vektorraumbasis, sondern die Hilbertraumbasis oder Orthonormalbasis.
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2022 R. Denk, Mathematische Grundlagen der Quantenmechanik, https://doi.org/10.1007/978-3-662-65554-2_2
17
18
2 Hilberträume
Neben einfachen Folgerungen wie der Cauchy–Schwarz-Ungleichung und dem Satz von Pythagoras werden in diesem Kapitel der Approximations- und der Projektionssatz sowie der Satz von Riesz behandelt; letzterer beschreibt den topologischen Dualraum eines Hilbertraums. Wir ordnen Hilberträume in die größere Klasse normierter und topologischer Räume ein und diskutieren dabei kurz den wichtigen Begriff der kompakten Mengen. Abschließend werden die Existenz von Orthonormalbasen in Hilberträumen und die Darstellung von Elementen bezüglich der Basis untersucht.
2.1
Skalarprodukte
Im Folgenden sei K ∈ {R, C}. Prähilberträume über dem Körper K sind K-Vektorräume, auf denen ein Skalarprodukt definiert ist. Dies ermöglicht es, Begriffe wie Orthogonalität und Norm einzuführen, und diese sind die Grundlage für geometrische Begriffe. Man beachte, dass Prähilberträume sehr wohl unendlich-dimensional sein können – dies ist auch der für die Quantenmechanik interessante Fall. Definition 2.1. a) Sei H ein K-Vektorraum. Dann heißt eine Abbildung ·, · : H × H → K ein Skalarprodukt auf H , falls gilt: (i) Für alle y ∈ H ist die Abbildung x → x, y linear. (ii) Für alle x, y ∈ H gilt x, y = y, x (Symmetrie). (iii) Für alle x ∈ H gilt x, x ≥ 0. Es gilt x, x = 0 genau dann, wenn x = 0 (positive Definitheit). In diesem Fall heißt H ein Vektorraum mit Skalarprodukt oder ein Prähilbertraum. b) Zwei Vektoren x, y ∈ H heißen orthogonal oder senkrecht zueinander (in Zeichen x ⊥ y), falls x, y = 0 gilt. Eine Familie {xi }i∈I von Vektoren heißt orthonormal oder ein Orthonormalsystem, falls gilt: 1, falls i = j, xi , x j = δi j := 0, sonst. Das Symbol δi j wird als Kronecker-Symbol bezeichnet. c) In einem Prähilbertraum (H , ·, ·) wird durch x := x, x1/2 die kanonische Norm definiert.
2.1
Skalarprodukte
19
Beispiel 2.2
n n a) Mit dem Skalarprodukt x, y := x · y := j=1 x j y j wird R zu einem R
n Hilbertraum. Für x = (x1 , . . . , xn ) ∈ R ist die zugehörige Norm durch |x| := ( nj=1 x 2j )1/2 gegeben, d. h. es handelt sich um die euklidische Norm. Analog wird Cn mit dem Skalarprodukt x, y := nj=1 x j y j zu einem C-Hilbertraum mit der zugehörigen euklidischen Norm |x| := ( nj=1 |x j |2 )1/2 . b) Seien a, b ∈ R mit a < b. Dann wird der Raum C([a, b]) aller stetigen C-wertigen Funktionen mit dem Skalarprodukt
b
f , g :=
f (x)g(x) dx ( f , g ∈ C([a, b]))
(2.1)
a
zu einem Prähilbertraum. Dabei sind die Eigenschaften (i) und (ii) aus Definition 2.1
b offensichtlich. Um (iii) zu zeigen, sei f ∈ C([a, b]) mit f 2 = a | f (x)|2 dx = 0. Falls ein x0 ∈ [a, b] existiert mit f (x 0 ) = 0, so existieren wegen der Stetigkeit ε > 0 und δ ∈ (0, b − a) so, dass | f (x)| ≥ ε für alle x ∈ [a, b] mit |x − x 0 | ≤ δ gilt. Damit
b folgt a | f (x)|2 dx ≥ δε 2 im Widerspruch zu f = 0. Sei K ⊆ Rn abgeschlossen und beschränkt (dies ist äquivalent zu kompakt, wie wir später in Bemerkung 2.27 sehen werden). Dann sieht man in gleicher Weise, dass der Raum C(K ) := { f : K → C | f stetig} mit dem Skalarprodukt f , g :=
K f (x)g(x) dx ein Prähilbertraum ist. c) Wir werden in Kap. 3 sehen, dass der typische (Prä-)Hilbertraum gegeben ist durch den Raum L 2 (μ) aller quadratintegrierbaren Funktionen über einem Maßraum (X , A , μ). Speziell ist der Raum L 2 (Rn ) aller quadratintegrierbaren Funktionen f : Rn → C einer der wichtigsten Hilberträume der Quantenmechanik.
Satz 2.3. Sei ein H Prähilbertraum.
a) Für alle x, y ∈ H mit x ⊥ y gilt x + y 2 = x 2 + y 2 . Dies ist auch als Satz von Pythagoras bekannt. b) Für alle x, y ∈ H gilt die Parallelogrammgleichung x + y 2 + x − y 2 = 2 x 2 + 2 y 2 .
20
2 Hilberträume
c) Für alle x, y ∈ H gilt die Polarisationsformel 1 ( x + y 2 − x − y 2 ), falls K = R, x, y = 41 2 2 2 2 x x x ( x + y − − y + i + i y − i − i y ), falls K = C. 4
Beweis. a) Für alle x, y ∈ H erhält man durch Ausmultiplizieren x + y 2 = x + y, x + y = x, x + x, y + y, x + y, y = x 2 + x, y + x, y + y 2 = x 2 + 2Re(x, y) + y 2 .
(2.2)
Falls x ⊥ y, fällt der mittlere Term weg. b) und c) folgen durch direktes Ausmultiplizieren.
In einem Prähilbertraum ist die Norm direkt durch das Skalarprodukt definiert. Die Polarisationsformel liefert hier eine Art Umkehrung, da das Skalarprodukt mit Hilfe der Norm berechnet werden kann. Insbesondere zeigt dies, dass zwei Skalarprodukte schon gleich sind, falls die zugehörigen Normen gleich sind. Satz 2.4. Sei H ein Prähilbertraum.
a) Dann gilt die Cauchy–Schwarz-Ungleichung |x, y| ≤ x · y (x, y ∈ H ). N orthonormal. Dann gilt für alle x ∈ H b) Sei {xn }n=1
x 2 =
N
N 2 x, xn xn . | x, xn |2 + x −
n=1
n=1
Insbesondere gilt die Besselsche Ungleichung N n=1
| x, xn |2 ≤ x 2 (x ∈ H ).
(2.3)
2.2
Grundbegriffe der Topologie
21
Beweis. a) Falls y = 0, so ist nichts zu zeigen. Für y = 0 definiere α :=
x,y . y 2
Dann folgt mit (2.2)
0 ≤ x − α y 2 = x 2 − 2 Re(x, α y) + |α|2 y 2
|x, y|2 x, yx, y |x, y|2 2 2 = x − 2 Re = x − . + y 2 y 2 y 2 Multiplikation mit y 2 liefert a). b) Wir schreiben
N N αn x n + x − αn x n x= n=1
(2.4)
n=1
N ein Orthonormalsystem ist, sind die Vektoren {α x } N mit αn := x, xn . Da {xn }n=1 n n n=1 orthogonal, und mit dem Satz von Pythagoras folgt N N 2 αn x n = |αn |2 . n=1
n=1
Andererseits gilt auch für alle m = 1, . . . , N
x−
N
N αn xn , xm = x, xm − αn δnm = x, xm − αm = 0.
n=1
n=1
Damit sind die beiden Summanden in (2.4) ebenfalls orthogonal, und eine erneute Anwendung des Satzes von Pythagoras liefert (2.3). Die Besselsche Ungleichung folgt sofort aus (2.3).
2.2
Grundbegriffe der Topologie
In einem Prähilbertraum definiert die zugehörige kanonische Norm einen Längenbegriff. Damit kann man Abstände zwischen zwei Vektoren messen sowie Kugeln um einen Punkt definieren. Dies ist die Grundlage für topologische Begriffe wie Stetigkeit oder Kompaktheit. Wir beginnen mit der Definition einer Norm.
22
2 Hilberträume
Definition 2.5. Sei X ein K-Vektorraum. Eine Abbildung · : X → [0, ∞) heißt eine Norm auf X , falls gilt: (i) Es ist x = 0 genau dann, wenn x = 0. (ii) Für alle α ∈ K und x ∈ X gilt αx = |α| x . (iii) Für alle x, y ∈ X gilt die Dreiecksungleichung x + y ≤ x + y . In diesem Fall heißt (X , · ) ein normierter Raum. Zu x ∈ X und r > 0 definiert man die offene Kugel B(x, r ) als B(x, r ) := {y ∈ X | y − x < r }. Das folgende Resultat zeigt, dass die Bezeichnung Norm in Definition 2.1 c) gerechtfertigt war.
Lemma 2.6. Sei H ein Prähilbertraum mit Skalarprodukt ·, ·. Dann wird durch
x := x, x1/2 eine Norm auf H definiert.
Beweis. Die Eigenschaft (i) aus Definition 2.5 folgt sofort aus Definition 2.1 (iii), die Eigenschaft (ii) erhält man aus der Gleichheit αx 2 = αx, αx = ααx, x = |α|2 x 2 unter Verwendung von Definition 2.1 (i) und (ii). Für die Dreiecksungleichung schreiben wir mit (2.2) x + y 2 = x 2 + 2 Re(x, y) + y 2 ≤ x 2 + 2x, y + y 2 ≤ x 2 + 2 x y + y 2 = ( x + y )2 , wobei die Cauchy–Schwarz-Ungleichung verwendet wurde.
Für den zentralen Begriff eines Hilbertraums fehlt noch die Eigenschaft der Vollständigkeit. Dabei verwenden wir für Folgen (xn )n∈N mit Laufindex n ∈ N := {1, 2, . . . } und Elementen xn ∈ X die Schreibweise (xn )n∈N ⊆ X . Definition 2.7. a) Sei (X , · ) ein normierter Raum. Eine Folge (xn )n∈N ⊆ X heißt eine Cauchyfolge, falls für alle ε > 0 ein n 0 ∈ N so existiert, dass für alle n, m ≥ n 0 gilt: xn − xm < ε.
2.2
Grundbegriffe der Topologie
23
b) Ein normierter Raum X heißt vollständig, falls jede Cauchyfolge einen Grenzwert in X besitzt, d. h. zu jeder Cauchyfolge (xn )n∈N ⊆ X existiert ein x ∈ X mit xn → x (n → ∞). c) Ein normierter vollständiger Raum heißt Banachraum. Ein Prähilbertraum, der (bezüglich der durch das Skalarprodukt induzierten Norm) vollständig ist, heißt Hilbertraum. Beispiel 2.8
a) Die Räume Rn und Cn sind mit dem Standard-Skalarprodukt x, y := nj=1 x j y j vollständig und damit ein Hilbertraum. b) Die wohl wichtigste Klasse von Hilberträumen sind die Räume quadratintegrierbarer Funktionen L 2 (μ) für ein Maß μ. Dieser Begriff wird in Abschn. 3.3 diskutiert. c) Der Raum C([a, b]) mit dem Skalarprodukt (2.1) aus Beispiel 2.2 b) ist ein Prähilbertraum, aber nicht vollständig und daher kein Hilbertraum. Wir betrachten z. B. [a, b] = [0, 1] und die Folge ( f n )n∈N ⊆ C([0, 1]), gegeben durch (2x)n , falls x ∈ [0, 21 ], f n (x) := 1, falls x ∈ ( 21 , 1]. Für n, m ∈ N folgt unter Verwendung der elementaren Ungleichung (a + b)2 ≤ 2(a 2 + b2 ) für a, b ≥ 0 1 1/2 f n − f m 2 = | f n (x) − f m (x)|2 dx = |(2x)n − (2x)m |2 dx 0
0
1/2 dx ≤ 2 (2x)2n + (2x)2 m dx 0 0 (2x)2 m+1 1/2 1 1 (2x)2n+1 + + = = x=0 2n + 1 2m +1 2n + 1 2 m + 1
≤
1/2
(2x)n + (2x)
m 2
→ 0 (n, m → ∞). Somit ist ( f n )n∈N eine Cauchyfolge in C([0, 1]). Angenommen, es gibt eine Funktion f ∈ C([0, 1]) mit f n − f → 0 (n → ∞). Falls f (x) ≤ 21 , so existiert wegen der Stetigkeit von f ein ε > 0 mit f (x) ≤ 43 für alle x ∈ [ 21 , 21 + ε]. Damit gilt f n − f 2 = 0
1
| f n (x) − f (x)|2 dx ≥
1/2+ε
|1 − f (x)|2 dx ≥
1/2
ε 16
für alle n ∈ N im Widerspruch zu f n − f → 0 (n → ∞). Falls f (x) > existiert ein ε ∈ (0, 21 ) mit f (x) > 21 für alle x ∈ [ 21 − ε, 21 ]. Wegen max
x∈[ 12 −ε, 21 − 2ε ]
f n (x) = f n ( 21 − 2ε ) = (1 − ε)n → 0 (n → ∞)
1 2,
so
24
2 Hilberträume
existiert ein n 0 ∈ N so, dass f n (x) ≤ Damit erhält man
1
f n − f 2 =
1 4
für alle n ≥ n 0 und x ∈ [ 21 − ε, 21 − 2ε ] gilt.
| f n (x) − f (x)|2 dx ≥
0
1 2 −ε 1 ε 2−2
| f n (x) − f (x)|2 dx ≥
ε , 32
was wieder einen Widerspruch zu f n − f → 0 (n → ∞) liefert. Also besitzt die Folge ( f n )n∈N keinen Grenzwert, und C([0, 1]) ist mit der durch das Skalarprodukt (2.1) gegebenen Norm nicht vollständig und daher kein Hilbertraum. Tatsächlich kann man zeigen, dass alle Cauchyfolgen Grenzwerte im größeren Raum L 2 ([0, 1]) besitzen und L 2 ([0, 1]) die Vervollständigung von C([a, b]) ist. Wenn man nur den Raum C([0, 1]) betrachten will, ist die durch das Skalarprodukt (2.1) gegebene Norm nicht günstig, besser geeignet ist die Supremumsnorm f ∞ := sup | f (x)| ( f ∈ C([0, 1])). x∈[0,1]
Bemerkung 2.9. a) Seien (H , ·, ·) ein Hilbertraum und M ⊆ H ein abgeschlossener Untervektorraum von H . Schränkt man das Skalarprodukt auf M × M ein, so erhält man ein Skalarprodukt auf M. Sei nun (xn )n∈N ⊆ M eine Cauchyfolge. Dann existiert x = limn→∞ xn ∈ H , da H vollständig ist, und wegen der Abgeschlossenheit von M folgt x ∈ M. Somit ist auch M selbst wieder ein Hilbertraum. b) Seien (H1 , ·, ·1 ) und (H2 , ·, ·2 ) Hilberträume. Man definiert auf dem kartesischen Produkt H1 × H2 das Skalarprodukt (x1 , x2 ), (y1 , y2 ) := x1 , y1 1 + x2 , y2 2 ((x1 , x2 ), (y1 , y2 ) ∈ H1 × H2 ). Dann ist auch (H1 × H2 , ·, ·) wieder ein Hilbertraum. Denn die Eigenschaften eines (n) (n) Skalarprodukts sind klar, und falls ((x1 , x2 ))n∈N ⊆ H1 × H2 eine Cauchyfolge (n) bezüglich der durch ·, · induzierten Norm ist, dann sind auch (x1 )n∈N ⊆ H1 und (n) (x2 )n∈N ⊆ H2 Cauchyfolgen. Wegen der Vollständigkeit von H1 und H2 existieren (n) (n) x1 ∈ H1 und x2 ∈ H2 mit x1 → x1 und x2 → x2 für n → ∞. Somit gilt (n) (n) (x1 , x2 ) → (x1 , x2 ) ∈ H1 × H2 für n → ∞, und H1 × H2 ist vollständig. Versieht man H1 × H2 mit dem obigen Skalarprodukt, nennt man den entstehenden Hilbertraum die direkte Hilbertraumsumme von H1 und H2 , in Zeichen H1 ⊕ H2 . Prähilberträume und Hilberträume sind Beispiele von normierten Räumen. Man kann zeigen, dass in einem normierten Raum die Norm genau dann von einem Skalarprodukt induziert wird, wenn die Parallelogrammgleichung (Satz 2.3 b)) gilt. Normierte Räume wiederum sind Spezialfälle von metrischen Räumen, die wir hier nicht behandeln wollen, und diese
2.2
Grundbegriffe der Topologie
25
sind Spezialfälle von topologischen Räumen. Da typische Begriffe wie Abgeschlossenheit, Kompaktheit und Stetigkeit topologische Konzepte sind, wollen wir diese im Rahmen topologischer Räume diskutieren. Wir starten mit dem Begriff einer offenen Menge, welche im Fall eines normierten Raums folgendermaßen definiert wird. Definition 2.10. Sei (X , · ) ein normierter Raum, und sei U ⊆ X . Dann heißt U offen, falls zu jedem x ∈ U ein r > 0 so existiert, dass B(x, r ) ⊆ U gilt.
Satz 2.11. Sei (X , · ) ein normierter Raum, und sei
T := U ⊆ X | U offen . Dann gilt: (i) Die leere Menge ∅ und die ganze Menge X sind Elemente von T . (ii) Falls U , V ∈ T , so ist auch U ∩ V ∈ T . (iii) Sei I eine Menge, und es gelte Ui ∈ T für alle i ∈ I . Dann gilt auch i∈I Ui ∈ T .
Beweis. Offensichtlich gilt ∅ ∈ T und X ∈ T . Seien U , V ∈ T , wobei ohne Einschränkung U ∩ V = ∅ gelte, und sei x ∈ U ∩ V . Dann existieren rU > 0 und r V > 0 so, dass B(x, rU ) ⊆ U und B(x, r V ) ⊆ V gilt, und für r := min{rU , r V } erhält man B(x, r ) ⊆ U ∩ V . Seien Ui ∈ T für i ∈ I , und sei x ∈ i∈I Ui . Dann existiert ein i 0 ∈ I mit x ∈ Ui0 . Wegen Ui0 ∈ T existiert ein r > 0 mit B(x, r ) ⊆ Ui0 ⊆ i∈I Ui . Dies zeigt, dass beliebige Vereinigungen von Mengen aus T wieder in T liegen. Der obige Satz bildet die Grundlage für den Begriff einer Topologie. Definition 2.12. Sei X eine nichtleere Menge, und sei
P (X ) := {A | A ⊆ X } die Potenzmenge von X . Dann heißt eine Familie T ⊆ P (X ) eine Topologie auf X , falls die Eigenschaften (i)–(iii) aus Satz 2.11 erfällt sind. In diesem Fall heißt (X , T ) ein topologischer Raum, und eine Teilmenge U ⊆ X heißt offen, falls U ∈ T gilt. Eine Menge A ⊆ X heißt abgeschlossen, falls das Komplement Ac := X \ A := {x ∈ X | x ∈ / A} offen ist.
26
2 Hilberträume
Man beachte in obiger Definition den Unterschied zwischen Durchschnitt und Vereinigung: Der Durchschnitt von zwei (und damit endlich vielen) offenen Mengen ist offen, hingegen ist die Vereinigung von beliebig vielen offenen Mengen wieder offen. Man beachte auch, dass abgeschlossen nicht das Gegenteil von offen ist: Es gibt im Allgemeinen sehr wohl Mengen, die weder offen noch abgeschlossen sind (z. B. in der Standardtopologie von R das Intervall (0, 1], siehe unten), und es gibt Mengen, die sowohl offen als auch abgeschlossen sind (immer die leere Menge und der ganze Raum). Durch Komplementbildung ergibt sich: Endliche Vereinigungen und beliebige Durchschnitte von abgeschlossenen Mengen sind wieder abgeschlossen. Zu einer nichtleeren Menge X ist {∅, X } eine Topologie auf X , die kleinste oder gröbste Topologie auf X . Ebenso ist die Potenzmenge P (X ) eine Topologie auf X , die größte oder feinste Topologie. In beiden Topologien ist jede offene Menge zugleich abgeschlossen. Bemerkung 2.13. In einem normierten Raum X wird man in den meisten Fällen die Topologie aus Definition 2.10 wählen. In diesem Fall sieht man mit Hilfe der Dreiecksungleichung sofort, dass die Kugeln B(x, r ) für alle x ∈ X und r > 0 offen sind. Dies rechtfertigt auch den Begriff „offene Kugel“, der in Definition 2.5 verwendet wurde. Jede offene Menge U ⊆ X ist die Vereinigung von offenen Kugeln, denn zu jedem x ∈ U existiert ein r x > 0 mit B(x, r x ) ⊆ U , und damit gilt U = x∈U B(x, r x ). Beispiel 2.14
Versieht man R mit der euklidischen Norm, so ist das Intervall (0, 1) offen, nicht aber das Intervall [0, 1). Denn zu x = 0 existiert kein r > 0 so, dass B(x, r ) = {y ∈ R | |x − y| < r } = (x − r , x + r ) ⊆ [0, 1) gilt. Auch das Komplement [0, 1)c = (−∞, 0) ∪ [1, ∞) ist nicht offen, so dass [0, 1) weder offen noch abgeschlossen ist. Definition 2.15. Sei (X , T ) ein topologischer Raum, und sei M ⊆ X . Dann wird der Abschluss M von M ⊆ X definiert durch M := A | A ⊇ M, A abgeschlossen . Somit ist M die kleinste abgeschlossene Obermenge von M. Bemerkung 2.16. Falls (X , · ) ein normierter Raum ist und M ⊆ X , so liegt ein Punkt x0 ∈ X genau dann in M, wenn eine Folge (xn )n∈N ⊆ M existiert mit xn → x0 (n → ∞). Dabei ist diese Konvergenz in X zu verstehen, d. h. es gilt xn − x0 → 0 (n → ∞). Für Funktionen f : R → C oder f : Rn → C (oder auch für Funktionen auf normierten Räumen) formuliert man den Stetigkeitsbegriff meistens mit einem ε-δ-Kriterium. Wenn man die Topologie, d. h. das System aller offenen Mengen, als Grundlage für die Defini-
2.2
Grundbegriffe der Topologie
27
tion nimmt, ergibt sich eine sehr einfache Formulierung, die zugleich eine weitreichende Verallgemeinerung des ε-δ-Definition darstellt. Definition 2.17. Seien (X , T X ) und (Y , TY ) zwei topologische Räume, und sei f : X → Y eine Funktion. Dann heißt f stetig, falls Urbilder offener Mengen wieder offen sind, d. h. falls für jedes V ∈ TY gilt: f −1 (V ) ∈ T X . Dabei ist f −1 (V ) := {x ∈ X | f (x) ∈ V } das Urbild von V unter f . Da abgeschlossene Mengen als Komplemente offener Mengen definiert sind und das Urbild mit der Komplementbildung kompatibel ist, ist eine Funktion auch genau dann stetig, wenn Urbilder abgeschlossener Mengen wieder abgeschlossen sind. Bemerkung 2.18. Die obige Definition ist mit Hilfe der Urbilder, nicht unter Verwendung der Bilder einer Funktion formuliert. Tatsächlich sind die Bilder offener Mengen unter stetigen Funktionen nicht immer offen: So ist etwa die Funktion f : R → R, x → x 2 stetig, aber das Bild der offenen Menge R (d. h. der Wertebereich von f ) ist das Intervall [0, ∞), welches nicht offen ist. Eine Funktion f : X → Y , für welche alle Bilder offener Mengen offen sind (d. h. es gilt f (U ) ∈ TY für alle U ∈ T X ), heißt offen. Das folgende Ergebnis zeigt, dass für normierte Räume die oben definierte Stetigkeit mit der ε-δ-Definition übereinstimmt. Lemma 2.19. Seien (X , · X ) und (Y , · Y ) normierte Räume, und sei f : X → Y
eine Funktion. Dann ist f genau dann stetig (im Sinne von Definition 2.17), falls für alle x0 ∈ X und alle ε > 0 ein δ > 0 so existiert, dass für alle x ∈ X mit x − x0 X < δ gilt: f (x) − f (x0 ) Y < ε.
Beweis. Sei zunächst f stetig im Sinne von Definition 2.17, und seien x0 ∈ X und ε > 0 gegeben. Da die Kugel B( f (x0 ), ε) ⊆ Y offen ist, ist auch das Urbild U := f −1 (B( f (x0 ), ε)) ⊆ X eine offene Menge, welche x0 enthält. Somit existiert ein δ > 0 mit B(x0 , δ) ⊆ U , und dieses δ erfällt die Bedingung des Satzes. Nun erfülle f die ε-δ-Bedingung des Satzes. Sei V ⊆ Y offen und U := f −1 (V ) ⊆ X . Wir müssen zeigen, dass U offen ist. Sei dazu x0 ∈ U und y0 := f (x0 ). Da V offen ist, existiert ein ε > 0 mit B(y0 , ε) ⊆ V . Wir wählen zu x0 und ε ein δ > 0 wie im Satz angegeben. Dann gilt B(x0 , δ) ⊆ U , was die Offenheit von U zeigt. Die Betrachtung topologischer Räume ist recht abstrakt, bietet aber in manchen Situationen Vorteile. In der Quantenmechanik ist der zugrunde liegende Raum typischerweise ein Hilbertraum und somit normiert. Damit hat man mehr Struktur zur Verfügung (unter anderem die Vektorraumstruktur), was man häufig für den Nachweis der Stetigkeit ausnutzen
28
2 Hilberträume
kann. Ein Beispiel dazu liefert der folgende Satz, in welchem wir die typische Notation T x := T (x) für lineare Abbildungen verwenden. Dabei heißt eine Abbildung T : X → Y zwischen zwei K-Vektorräumen X und Y linear, falls für alle x 1 , x2 ∈ X und α1 , α2 ∈ K T (α1 x1 + α2 x2 ) = α1 T x1 + α2 T x2 gilt. Satz 2.20. Seien (X , · X ) und (Y , · Y ) normierte Räume, und sei T : X → Y eine lineare Abbildung. Dann sind äquivalent:
(i) T ist stetig. (ii) T ist stetig an der Stelle 0. (iii) T ist beschränkt, d. h. es existiert eine Konstante C ≥ 0 mit T x Y ≤ C x X (x ∈ X ).
Beweis. (i)⇒(ii) ist trivial. (ii)⇒(iii). Falls T nicht beschränkt ist, so existiert eine Folge (xn )n∈N ⊆ X mit T xn Y > n xn X (n ∈ N). Wegen T 0 = 0 folgt daraus insbesondere xn = 0, und wir können z n := n xxnn X definieren. Es folgt T z n Y =
T xn Y >1 n xn X
sowie z n X = n1 . Wegen z n → 0 (n → ∞) existiert etwa zu ε := 21 kein δ > 0 mit T x − T 0 Y = T x Y < ε für alle x − 0 X = x X < δ. Also ist T nicht stetig an der Stelle 0. ε (iii)⇒(i). Seien x0 ∈ X und ε > 0. Wir wählen δ := C+1 mit der Konstanten C aus (iii) und erhalten für alle z ∈ X mit z − x 0 X < δ die Abschätzung T z − T x0 Y = T (z − x0 ) Y ≤ C z − x0 X < (C + 1)δ = ε. Also ist T stetig.
Beispiel 2.21
Das folgende Beispiel zeigt, dass in unendlich-dimensionalen Räumen der Begriff der Stetigkeit mit Vorsicht verwendet werden muss. Wenn man etwa zwei verschiedene Normen auf einem Vektorraum X definiert, kann die Stetigkeit einer Funktion von der Wahl
2.2
Grundbegriffe der Topologie
29
der Norm abhängen. Dies gilt selbst für lineare Abbildungen. Als Beispiel betrachten wir den Raum X := C([0, 1]). Wie in Beispiel 2.2 b) diskutiert, ist dies ein Prähilbertraum mit induzierter Norm 1 1/2 | f (x)|2 dx . f L 2 ((0,1)) := 0
Andererseits ist es auch leicht zu sehen, dass durch 1 f L 1 ((0,1)) := | f (x)| dx 0
eine weitere Norm auf X definiert wird. Als Abbildung wählen wir die Identität T := id X : X → X , f → f . Dann ist die Abbildung T : (X , · L 1 ((0,1)) ) → (X , · L 1 ((0,1)) ) trivialerweise stetig, denn es gilt T f L 1 ((0,1)) = f L 1 ((0,1)) , und Bedingung (iii) aus Satz 2.20 ist erfüllt mit C = 1. Andererseits ist T : (X , · L 1 ((0,1)) ) → (X , · L 2 ((0,1)) ) nicht stetig: Zu n ∈ N, n ≥ 2, sei die stückweise lineare Funktion f n : [0, 1] → R definiert durch ⎧ ⎪ falls x ∈ [0, n1 ], ⎪ ⎨n, f n (x) := 2n − n 2 x, falls x ∈ [ n1 , n2 ], ⎪ ⎪ ⎩0, falls x ∈ [ 2 , 1] n
(siehe Abb. 2.1). Dann gilt f n L 1 ((0,1)) =
1
0
f n L 2 ((0,1)) =
f n (x) dx ≤
2/n
n dx = 2,
0
1
1/2 | f n (x)|2 dx
0
Abb. 2.1 Die Funktion f n in Beispiel 2.21
1/n
≥ 0
1/2 n 2 dx
=
√
n.
30
2 Hilberträume
Also gibt es keine Konstante C > 0 mit T f n L 2 ((0,1)) ≤ C f n L 1 ((0,1)) für alle n ∈ N, und T ist nicht beschränkt und damit nicht stetig. Definition 2.22. Seien X und Y normierte Räume. Dann definiert man L(X , Y ) := {T : X → Y | T linear und stetig }. Eine Abbildung T ∈ L(X , Y ) heißt ein stetiger linearer Operator oder ein beschränkter linearer Operator. Man setzt L(X ) := L(X , X ). Für Y = K heißt X := L(X , K) der topologische Dualraum von X . Eine Abbildung T ∈ X heißt ein stetiges lineares Funktional. Auf dem Raum L(X , Y ) definiert man die Operatornorm T x Y = sup T x Y , x X =1 x∈X \{0} x X
T L(X ,Y ) := sup
wobei hier der triviale Fall X = {0} ausgenommen sei. Bemerkung 2.23. a) Man kann zeigen, dass · L(X ,Y ) tatsächlich eine Norm auf L(X , Y ) definiert. Falls Y vollständig (also ein Banachraum) ist, so ist auch L(X , Y ) ein Banachraum (siehe [70, Satz II.1.4]). Insbesondere ist der topologische Dualraum X , versehen mit der Operatornorm T X = sup x X =1 |T x|, stets ein Banachraum. b) Falls X endlich-dimensional ist, so ist jede lineare Abbildung T : X → Y stetig und damit in L(X , Y ), siehe etwa [70, Beispiel II.1 b)]. Definition 2.24. Seien X ein normierter Raum und x ∈ X . Eine Folge (xn )n∈N ⊆ X konvergiert schwach gegen x, falls T xn → T x (n → ∞) für alle stetigen linearen Funktionale T ∈ X gilt. In diesem Fall schreibt man xn x (n → ∞). Als letzten abstrakten topologischen Begriff diskutieren wir noch die Kompaktheit von Mengen. Im Rn ist die Kompaktheit einer Menge äquivalent zu ihrer Abgeschlossenheit und Beschränktheit. Ähnlich wie bei der Stetigkeit gibt es für die Kompaktheit eine Definition, welche nur einen topologischen Raum voraussetzt. Definition 2.25. Sei (X , T ) ein topologischer Raum, und sei K ⊆ X . a) Dann heißt eine Familie von Mengen {Ui | i ∈ I } eine offene Überdeckung von K , falls Ui ∈ T (i ∈ I ) und K ⊆ i∈I Ui gilt.
2.2
Grundbegriffe der Topologie
31
b) Eine offene Überdeckung {Ui | i ∈ I } von K besitzt eine endliche Teilüberdeckung, N falls ein N ∈ N und Indizes i 1 , . . . , i N ∈ I existieren mit K ⊆ n=1 Uin . c) Die Menge K heißt kompakt, falls jede offene Überdeckung von K eine endliche Teilüberdeckung besitzt. Bei dieser Definition muss man die Quantoren beachten. So sind z. B. (0, 1] ⊆
1 n,n
und (0, 1] ⊆
n∈N
n − 23 , n
n∈N
beides offene Überdeckungen von (0, 1]. Dabei besitzt die zweite eine endliche Teilüberdeckung, nämlich (0, 1] ⊆ (− 21 , 1)∪( 21 , 2), während die erste keine endliche Teilüberdeckung besitzt. Damit ist die Menge (0, 1] nicht kompakt. Als Beispiel für den Umgang mit den obigen abstrakten Begriffen zeigen wir folgende Implikation. Dabei heißt eine Teilmenge K eines normierten Raums beschränkt, falls ein C > 0 existiert mit x ≤ C (x ∈ K ).
Satz 2.26. Sei (X , · ) ein normierter Raum, und sei K ⊆ X kompakt. Dann ist K
abgeschlossen und beschränkt.
Beweis. Da K kompakt ist, besitzt die offene Überdeckung K ⊆ n∈N B(0, n) = X eine endliche Teilüberdeckung. Daher existieren N ∈ N und n 1 , . . . , n N ∈ N mit K ⊆
N
B(0, n j ) = B(0, M)
j=1
mit M := max{n 1 , . . . , n N }. Für jedes x ∈ K gilt somit x ≤ M, d. h. K ist beschränkt. Um zu zeigen, dass K abgeschlossen ist, betrachten wir das Komplement U := K c = X \ K . Für x0 ∈ U gilt K ⊆ X \ {x0 } = x ∈ X | x − x0 > n1 . n∈N
Man sieht leicht, dass die Menge Un := {x ∈ X | x − x0 > Kompaktheit von K existiert eine endliche Teilüberdeckung K ⊆
N j=1
Un j .
1 n}
offen ist. Wegen der
32
2 Hilberträume
Für M := max{n 1 , . . . , n N } folgt K ⊆ U M und damit B(x0 , offen.
1 M)
⊆ U . Somit ist U
Bemerkung 2.27. Falls X ein endlich-dimensionaler Vektorraum ist (z. B. X = Rn ), so ist eine Menge K ⊆ X genau dann kompakt, wenn sie abgeschlossen und beschränkt ist. In allgemeinen normierten Räumen gilt jedoch die Rückrichtung von Satz 2.26 nicht, d. h. aus abgeschlossen und beschränkt folgt nicht kompakt.
Satz 2.28. Seien (X , T X ) und (Y , TY ) topologische Räume, und sei f : X → Y stetig. Falls K ⊆ X kompakt ist, so ist auch das Bild f (K ) := { f (x) | x ∈ K } kompakt.
Beweis. Sei f (K ) ⊆ i∈I Vi eine offene Überdeckung. Da f stetig ist, istUi := −1 f (Vi ) ⊆ X ebenfalls offen, und wir erhalten eine offene Überdeckung K ⊆ i∈I Ui . N Wegen der Kompaktheit von K existiert eine endliche Teilüberdeckung K ⊆ n=1 Uin . N Damit ist aber f (K ) ⊆ n=1 Vin eine endliche Teilüberdeckung von f (K ), und wir erhalten die Kompaktheit von f (K ). Falls in der Situation dieses Satzes Y ein normierter Raum ist, so ist der Wertebereich f (K ) als kompakte Menge nach Satz 2.26 insbesondere beschränkt, und wir erhalten, dass stetige Funktionen auf kompakten Mengen beschränkt sind. Bemerkung 2.29. In allgemeinen topologischen Räumen ist die Kompaktheit, definiert als Überdeckungskompaktheit wie in Definition 2.25, ein recht abstrakter Begriff. In normierten Räumen hingegen gilt eine einfachere äquivalente Beschreibung: Eine Teilmenge K ⊆ X eines normierten Raums X heißt folgenkompakt, falls jede Folge (x n )n∈N ⊆ K eine Teilfolge besitzt, welche gegen ein Element x ∈ K konvergiert. Man kann zeigen, dass in normierten Räumen X eine Teilmenge K ⊆ X genau dann kompakt ist, wenn sie folgenkompakt ist. Es gibt jedoch sowohl Beispiele für folgenkompakte, aber nicht kompakte topologische Räume als auch für kompakte, aber nicht folgenkompakte topologische Räume.
2.3
Der Approximationssatz und der Satz von Riesz für Hilberträume
Nachdem wir im letzten Abschnitt (Prä-)Hilberträume als spezielle Klassen von normierten und topologischen Räumen kennengelernt haben, wollen wir nun Eigenschaften diskutieren, welche in allgemeinen topologischen Räumen nicht sinnvoll formuliert werden können. Dies
2.3
Der Approximationssatz und der Satz von Riesz für Hilberträume
33
liegt insbesondere an der Orthogonalität, welche nur für einen Raum mit Skalarprodukt sinnvoll ist. Im Folgenden sei (H , ·, ·) ein K-Hilbertraum mit K ∈ {R, C}. Definition 2.30. a) Eine Teilmenge M ⊆ H heißt konvex, falls für alle x, y ∈ M und für alle α ∈ [0, 1] gilt: αx + (1 − α)y ∈ M. b) Sei M ⊆ H . Dann heißt M ⊥ := {x ∈ H | ∀ y ∈ M : x, y = 0} das orthogonale Komplement von M in H . Bei konvexen Mengen liegt also mit je zwei Punkten auch die Verbindungsstrecke zwischen diesen Punkten in der Menge. Dies ist z. B. der Fall, falls M ein Untervektorraum von H ist, denn dann liegen mit x, y ∈ M sogar alle Linearkombinationen αx + β y mit α, β ∈ K wieder in M.
Lemma 2.31. Sei M ⊆ H . Dann ist M ⊥ ein abgeschlossener Untervektorraum
von H .
Beweis. Falls M = ∅, so ist M ⊥ = H , und es ist nichts zu zeigen. Sei also M nichtleer, und seien x1 , x2 ∈ M ⊥ und α1 , α2 ∈ K. Dann gilt α1 x1 +α2 x2 , y = α1 x1 , y+α2 x2 , y = 0 für alle y ∈ M und damit α1 x1 + α2 x2 ∈ M ⊥ . Somit ist M ⊥ ein Untervektorraum von H . Nach Definition gilt M⊥ = {x ∈ H | x, y = 0}. (2.5) y∈M
Für festes y ∈ M betrachten wir die lineare Abbildung Ty : H → K, x → x, y. Die Cauchy–Schwarz-Ungleichung ergibt |Ty x| = |x, y| ≤ x y (x ∈ H ), also ist Ty eine beschränkte lineare Abbildung mit Schranke y . Nach Satz 2.20 ist Ty stetig, und als Urbild der abgeschlossenen Menge {0} ist ker Ty = Ty−1 ({0}) = {x ∈ M | x, y = 0} abgeschlossen. Also ist jede der Mengen auf der rechten Seite von (2.5) abgeschlossen, und als Durchschnitt abgeschlossener Mengen ist auch M ⊥ abgeschlossen.
34
2 Hilberträume
Bemerkung 2.32. a) Sei M eine nichtleere Teilmenge von H . Wir bezeichnen mit M den Abschluss von M in H (siehe Definition 2.15), und mit span M die lineare Hülle von M, d. h. den von M erzeugten Untervektorraum von H (dieser besteht aus der Menge aller endlichen Linearkombinationen von Elementen aus M). Dann gilt M ⊥ = (M)⊥ = (span M)⊥ = (span M)⊥ .
(2.6)
Um die erste Gleichheit zu sehen, sei y0 ∈ M. Dann existiert eine Folge (yn )n∈N ⊆ M mit yn → y0 (n → ∞). Nach der Cauchy–Schwarz-Ungleichung ist die Abbildung y → x, y für jedes feste x ∈ H stetig (vergleiche den Beweis von Lemma 2.31), und somit gilt für jedes x ∈ M ⊥ x, y0 = x, lim yn = lim x, yn = 0. n→∞
n→∞
Somit ist M ⊥ = (M)⊥ . Für die zweite Gleichheit in (2.6) sei y ∈ span M. Dann existieren N ∈ N, y1 , . . . , y N ∈ N M und α1 , . . . , α N ∈ K mit y = n=1 αn yn . Für jedes x ∈ M ⊥ folgt N N x, y = x, αn yn = αn x, yn = 0, n=1
n=1
was M ⊥ = (span M)⊥ zeigt. b) Sei M eine nichtleere Teilmenge von H . Dann gilt M ∩ M ⊥ ⊆ {0}. Denn falls x ∈ M ∩ M ⊥ , so ist x, x = 0, d. h. x = 0. Insbesondere gilt M ∩ M ⊥ = {0}, falls 0 ∈ M (z. B. falls M ein Untervektorraum von H ist). Der folgende Satz ist eine zentrale Aussage über Hilberträume. Der Beweis verwendet die Parallelogrammgleichung (Satz 2.3 b)) sowie die Vollständigkeit des Raums.
Satz 2.33 (Approximationssatz). Sei M eine nichtleere, konvexe und abgeschlossene
Teilmenge von H , und sei z 0 ∈ H . Dann existiert genau ein x ∈ M mit x − z 0 = dist(z 0 , M) := inf{ y − z 0 | y ∈ M}.
Beweis. Sei zunächst z 0 = 0. Wir definieren d := inf{ y | y ∈ M} = dist(0, M) und wählen eine Folge (yn )n∈N ⊆ M mit yn → d. Nach der Parallelogrammgleichung gilt m 2 yn − ym 2 = 2 yn 2 + 2 ym 2 − 4 yn +y 2 .
Da M konvex ist, gilt
yn +ym 2
m ∈ M und damit yn +y 2 ≥ d. Eingesetzt erhält man
2.3
Der Approximationssatz und der Satz von Riesz für Hilberträume
35
0 ≤ yn − ym 2 ≤ 2 yn 2 + 2 ym 2 − 4d 2 . Wegen yn → d (n → ∞) konvergiert die rechte Seite für n, m → ∞ gegen 0, und somit ist (yn )n∈N eine Cauchyfolge in H . Da H vollständig ist, existiert x := limn→∞ yn ∈ H , und da M abgeschlossen ist, gilt x ∈ M. Es gilt x = limn→∞ yn = d = dist(0, M). Um die Eindeutigkeit zu zeigen, betrachten wir x1 , x2 ∈ M mit x1 = x2 = d. Dann gilt x1 ≤ y und x2 ≤ y für jedes y ∈ M, und wir erhalten wieder mit der Parallelogrammgleichung x1 − x2 2 = 2 x1 2 + 2 x2 2 − x1 + x2 2 x1 +x2 2 2 2 2 = 2 x1 2 − x1 +x 2 + 2 x 2 − 2 . 2 Wegen x1 +x ∈ M sind beide Klammern kleiner oder gleich 0, und wir erhalten x1 −x2 2 = 2 0, d. h. x1 = x2 . Sei nun z 0 = 0. Dann definiert man die verschobene Menge M˜ := M − z 0 := {m − z 0 | m ∈ M}. Diese ist wieder konvex und abgeschlossen, daher existiert ein eindeutiges ˜ Dann ist x := x˜ + z 0 ∈ M das eindeutige Element mit x˜ ∈ M˜ mit x ˜ = dist(0, M). x − z 0 = dist(z 0 , M).
Für die Aussage des letzten Satzes sind sowohl die Abgeschlossenheit als auch die Konvexität wesentlich. So besitzt zum Beispiel das offene (konvexe) Intervall (1, 2) kein Element mit minimalem Abstand zum Punkt 0. Andererseits besitzt die abgeschlossene Menge (−∞, −1] ∪ [1, ∞) zwei verschiedene Elemente (nämlich 1 und −1) mit minimalem Abstand zum Punkt 0. Als Anwendung des Approximationssatzes erhalten wir für einen abgeschlossenen Untervektorraum M eines Hilbertraums H eine direkte Zerlegung der Form H = M ⊕ M ⊥ , wie der folgende Satz zeigt. Diese Zerlegung ist im Sinne einer direkten Summe von Vektorräumen zu verstehen, d. h. für jedes Element x ∈ H existiert eine eindeutige Darstellung der Form x = m + m mit m ∈ M und m ∈ M ⊥ . Satz 2.34 (Projektionssatz). Sei M ⊆ H ein abgeschlossener Untervektorraum von
H . Dann existiert für alle x ∈ H eine eindeutige Darstellung der Form x = m + m mit m ∈ M, m ∈ M ⊥ . Somit erhält man die Zerlegung H = M ⊕ M ⊥. Dabei gilt x − m = min y∈M x − y .
36
2 Hilberträume
Beweis. Nach dem Approximationssatz existiert genau ein m ∈ M mit m − x = inf{ y − x | y ∈ M}. Setze m := x − m. Wir zeigen m ∈ M ⊥ . Für alle y ∈ M und α ∈ K gilt m = m − x ≤ m − α y − x = m + α y . Wegen
m + α y 2 = m 2 + 2 Re m , α y + |α|2 y 2
gilt somit für alle α ∈ R Wir wählen α :=
1 k
|α|2 y 2 + 2αRe m , y ≥ 0.
(2.7)
mit k ∈ N und erhalten 1 y 2 + Rem , y ≥ 0 (k ∈ N). 2k
Für k → ∞ folgt Rem , y ≥ 0. Analog zeigt man Rem , y ≤ 0, und wir erhalten Re m , y = 0. Falls K = C, ersetzt man α durch iα und erhält |α|2 y 2 + 2αIm m , y ≥ 0 für alle α ∈ R. Wie oben folgt Im m , y = 0, und damit gilt m , y = 0 für alle y ∈ M, d. h. m ∈ M ⊥ . Um die Eindeutigkeit zu zeigen, sei x = m + m = z + z mit m, z ∈ M, m , z ∈ M ⊥ . Dann ist m − z = z − m ∈ M ∩ M ⊥ = {0}, d. h. m = z und m = z . Bemerkung 2.35. Im Projektionssatz wurde die Schreibweise M ⊕ M ⊥ für die direkte Zerlegung verwendet, welche auch schon bei der Definition der Hilbertraumsumme (Bemerkung 2.9) auftrat. Dies ist jedoch in gewisser Weise konsistent, da bei der direkten Zerlegung x = m + m die Elemente m und m eindeutig sind, d. h. man kann x mit dem Tupel (m, m ) ∈ M × M ⊥ , also mit dem entsprechenden Element der Hilbertraumsumme identifizieren. Das Element m ∈ M, welches den Abstand zum Punkt x minimiert, wird auch das Proximum zum Punkt x in der Menge M genannt. Nach dem Projektionssatz ist das Proximum dadurch charakterisiert, dass der Vektor x − m senkrecht zu allen Vektoren in M steht. Dieses Orthogonalitätsprinzip kann auch bei Optimierungsproblemen ausgenutzt werden. Korollar 2.36. Sei M ⊆ H ein Untervektorraum. Dann gilt M = M ⊥⊥ .
2.3
Der Approximationssatz und der Satz von Riesz für Hilberträume
37
Beweis. Setze V := M ⊥⊥ := (M ⊥ )⊥ . Für m ∈ M gilt m, m = 0 (m ∈ M ⊥ ), was M ⊆ V zeigt. Da V nach Lemma 2.31 abgeschlossen ist, folgt M ⊆ V . Der Raum V ist als abgeschlossener Untervektorraum von H selbst wieder ein Hilbertraum, daher können wir den Projektionssatz anwenden und erhalten die direkte Zerlegung V = M ⊕ (M)⊥ V , wobei ⊥ ⊥ (M)⊥ V = M V = {x ∈ V | ∀ m ∈ M : x, m = 0} = V ∩ M .
Für x ∈ MV⊥ gilt einerseits x ∈ M ⊥ , andererseits x ∈ V = M ⊥⊥ , und damit folgt insbesondere x, x = 0 und somit x = 0. Also ist MV⊥ = {0} und V = M. Die in Satz 2.34 angegebene Zerlegung erlaubt es, den topologischen Dualraum eines Hilbertraums zu beschreiben. Satz 2.37 (von Riesz). Seien H ein Hilbertraum und T ∈ H . Dann existiert genau
ein x T ∈ H mit
T x = x, x T (x ∈ H ).
Die Abbildung IR : H → H , T → x T ist bijektiv, isometrisch (d. h. es gilt T H = x T H ) und konjugiert linear (d. h. es gilt IR (α1 T1 +α2 T2 ) = α 1 IR (T1 )+ α 2 IR (T2 )).
Beweis. (i) Konstruktion von x T : Der Raum M := ker T := T −1 ({0}) ist abgeschlossen als Urbild einer abgeschlossenen Menge unter der stetigen Abbildung T . Damit ist H = M ⊕M ⊥ nach Satz 2.34. Falls M = H , so folgt T = 0, und wir wählen x T = IR (T ) := 0. Sei jetzt M = H . Wähle y ∈ M ⊥ \ {0}. Wegen M ∩ M ⊥ = {0} ist dann T y = 0. Ty |T y| Setze x T = IR (T ) := y 2 y. Dann gilt x T = y und T xT =
Ty T y = x T 2 . y 2
Sei x ∈ H . Dann gilt Tx Tx xT z + x T =: m + m . x= x− T xT T xT Da m ein Vielfaches von y ist, gilt m ∈ M ⊥ . Wegen Tx Tx xT = T x − T xT = 0 Tm = T x − T xT T xT
(2.8)
38
2 Hilberträume
ist m ∈ M = ker T . Wir erhalten wegen x T ∈ M ⊥ und (2.8) x, x T = m + m , x T = m , x T =
Tx x T 2 = T x. T xT
Somit erfüllt x T die gewünschte Bedingung. (ii) Wir zeigen, dass die Wahl von x T eindeutig ist. Sei x˜ T ∈ H mit T x = x, x T = x, x˜ T für alle x ∈ H . Dann gilt x, x T − x˜ T = 0 für alle x ∈ H . Setzt man x := x T − x˜ T , so erhält man x T = x˜ T . Dies zeigt auch, dass die Definition von x T in Schritt (i) nicht von der Wahl von y abhängt, und die Abbildung IR : H → H , x → x T ist wohldefiniert. (iii) IR ist eine Isometrie: Nach der Cauchy–Schwarz-Ungleichung gilt T H = sup | x, x T | ≤ x T . x ≤1
Andererseits haben wir T H ≥ |T ( xxTT )| = x T nach (2.8), falls x T = 0. (iv) IR ist konjugiert linear: Sei T = α1 T1 + α2 T2 mit T1 , T2 ∈ H und α1 , α2 ∈ K. Dann ist einerseits T x = x, x T , und andererseits T x = α1 T1 x + α2 T2 x = α1 x, x T1 + α2 x, x T2 = x, α 1 x T1 + x, α 2 x T2 = x, α 1 x T1 + α 2 x T2 , also IR (T ) = x T = α 1 x T1 + α 2 x T2 = α 1 IR (T1 ) + α 2 IR (T2 ). (v) IR ist surjektiv: Zu y ∈ H sei Ty x := x, y. Dann ist |Ty x| ≤ y · x , d. h. Ty stetig und damit Ty ∈ H und IR (Ty ) = y. (vi) IR ist injektiv: Aus der Isometrie T H = x T H folgt sofort ker IR = 0.
2.4
Orthonormalbasen
Jeder Hilbertraum ist zugleich ein Vektorraum und besitzt daher eine Vektorraumbasis. Somit lässt sich jedes Element des Hilbertraums als endliche Linearkombination von Basisvektoren schreiben. Es zeigt sich jedoch, dass der Begriff einer Hilbertraumbasis oder Orthormalbasis für Hilberträume der besser geeignete Begriff ist. Falls ein Hilbertraum eine abzählbare Orthnormalbasis besitzt (dies ist bei den in der Quantenmechanik betrachteten Räumen der Fall), lässt sich jedes Element als unendliche Linearkombination von Basisvektoren, also als konvergente Reihe, darstellen. Wir beginnen mit der Definition einer Orthonormalbasis. Definition 2.38. Sei H ein Hilbertraum. Eine Teilmenge S ⊆ H heißt Orthonormalbasis oder vollständiges orthonormales System oder Hilbertraumbasis, falls S eine maximale orthonormale Teilmenge von H ist (maximal bezüglich Mengeninklusion), d. h. S ist ortho-
2.4
Orthonormalbasen
39
normal (siehe Definition 2.1), und für jede orthonormale Teilmenge S˜ von H mit S˜ ⊇ S gilt schon S˜ = S. Man beachte, dass in dieser Definition die Orthogonalität wesentlich mit eingeht, d. h. dieser Begriff einer Basis kann für lediglich normierte Räume nicht übernommen werden. Tatsächlich ist ein entsprechender Basisbegriff für Banachräume deutlich komplizierter. Wie bei Vektorräumen stellt sich sofort die Frage, ob jeder Hilbertraum eine Basis besitzt. Da diese nach Definition eine maximale Menge ist, kann die Existenz mit Hilfe des Lemmas von Zorn gezeigt werden. Dieses liefert eine Aussage über abstrakte geordnete Mengen. Wir wiederholen die entsprechenden Begriffe. Definition 2.39. Sei M eine Menge. Eine Relation ≺ auf M heißt Ordnung auf M , falls für A, B, C ∈ M gilt: A ≺ A, A ≺ B, B ≺ A ⇒ A = B, A ≺ B, B ≺ C ⇒ A ≺ C. In diesem Fall heißt M eine geordnete Menge. Man beachte, dass A ≺ B oder B ≺ A nicht für alle A, B ∈ M gelten muss. Eine Menge K ⊆ M heißt total geordnet oder vollständig geordnet oder eine Kette, falls für alle A, B ∈ K gilt: A ≺ B oder B ≺ A. Ein Element S ∈ M heißt obere Schranke für eine Teilmenge M ⊆ M , falls A ≺ S für alle A ∈ M gilt. Ein Element M ∈ M heißt maximal, falls für jedes Element M˜ ∈ M mit M ≺ M˜ bereits M˜ = M folgt. Beispiel 2.40
a) Ein einfaches Beispiel für eine Ordnung ist die übliche Ordnung „ ≤ “ auf den reellen Zahlen. Da für je zwei reelle Zahlen x, y ∈ R stets x ≤ y oder y ≤ x gilt, ist dies eine totale Ordnung. Für die Menge M := (0, 1) wären sowohl 1 als auch 2 obere Schranken. Die Menge K := (0, ∞) ist ein Beispiel für eine Kette ohne obere Schranke und ohne maximales Element. b) Ein weiteres typisches Beispiel, das in der Anwendung des Zornschen Lemmas oft verwendet wird, ist die Teilmengenbeziehung als Ordnung auf der Potenzmenge M := P (X ) einer Menge X = ∅. Für Teilmengen A, B ⊆ X definiert man A ≺ B :⇔ A ⊆ B. Falls X mindestens zwei Elemente x1 = x2 besitzt, so ist dies keine totale Ordnung auf M , denn die Mengen {x1 } und {x2 } lassen sich nicht im Sinne der Ordnung vergleichen. Die gesamte Menge X ist obere Schranke für jede Teilmenge M ⊆ M . Falls K eine Kette ist, so ist S := A∈K A eine obere Schranke für K . Diese Ordnung wird häufig auf Mengensysteme M ⊆ P (X ) ein-
40
2 Hilberträume
geschränkt, wobei dann die Existenz oberer Schranken nicht automatisch gegeben ist.
Satz 2.41 (Lemma von Zorn). Sei M eine nichtleere geordnete Menge. Falls jede Kette
eine obere Schranke in M besitzt, dann besitzt M mindestens ein maximales Element.
Das Lemma von Zorn ist eigentlich ein Axiom und äquivalent zum Wohlordnungssatz, welcher wiederum äquivalent zum Auswahlaxiom ist. Die Formulierung dieser Axiome und der Beweis der Äquivalenzen werden hier aber weggelassen (siehe etwa [29, Sections 15–17]). Satz 2.42. Sei H = {0} ein Hilbertraum. Dann besitzt H eine Orthonormalbasis.
Beweis. Sei M ⊆ P (H ) die Menge aller orthonormalen Teilmengen von H , d. h.
M := {A ⊆ H | A orthonormal}. x Dann ist M nichtleer, da für jedes x ∈ H \ {0} die einelementige Menge { x } orthonormal x ist, d. h. { x } ∈ M . Wir verwenden auf M die Ordnung aus Beispiel 2.40 b). Sei K eine Kette in M . Man definiert S := A∈K A. Dann ist A ⊆ S für alle A ∈ K . Wir müssen noch zeigen, dass S ∈ M gilt. Seien dazu x, y ∈ S. Dann existieren A, B ∈ K mit x ∈ A und y ∈ B. Da K eine Kette ist, gilt A ⊆ B oder B ⊆ A. Im ersten Fall folgt x, y ∈ B und, da B eine orthonormale Menge ist, erhalten wir x = y = 1 sowie (falls x = y) x, y = 0. Dies folgt genauso im zweiten Fall B ⊆ A. Somit ist die Menge S orthonormal, d. h. S ∈ M , und S ist eine obere Schranke von K . Wir haben gesehen, dass jede Kette eine obere Schranke in M besitzt, und nach dem Lemma von Zorn existiert mindestens ein maximales Element in M . Nach Definition ist dies eine Orthonormalbasis von H .
In der mathematischen Physik tauchen fast ausschließlich Hilberträume auf, die eine abzählbare unendliche Orthonormalbasis {en | n ∈ N} besitzen. In diesem Fall kann man Reihenentwicklungen für die Elemente des Raums finden. Für die Konvergenz beginnen wir mit einer Abschätzung.
2.4
Orthonormalbasen
41
Lemma 2.43. Seien H ein Prähilbertraum und {en | n ∈ N} ein Orthonormalsystem.
Dann gilt
∞
| x, en y, en | < ∞ (x, y ∈ H ).
n=1
Beweis. Für alle N ∈ N gilt nach der Cauchy–Schwarz-Ungleichung in R N und der Besselschen Ungleichung (Satz 2.4 b)) N
| x, en y, en | ≤
N
n=1
1/2 | x, en |
2
n=1
·
N
1/2 | y, en |
2
≤ x · y .
n=1
Mit N → ∞ erhält man die Behauptung.
Seien H ein Hilbertraum und S = {en | n ∈ N} ein abzählbares Orthonormalsystem.
Satz 2.44.
a) Für alle x ∈ H konvergiert die Reihe n∈N x, en en in H . b) Sei cn ∈ K (n ∈ N) mit n∈N |cn |2 < ∞. Dann konvergiert die Reihe n∈N cn en in H . c) Für alle x ∈ H gilt x − n∈N x, en en ∈ S ⊥ .
Beweis. a) Nach der Besselschen Ungleichung gilt für alle N ∈ N N
| x, en |2 ≤ x 2 .
n=1
Also ist
2 n∈N | x, en |
< ∞. Nach dem Satz von Pythagoras (Satz 2.3 a)) gilt
2 M M x, en en = | x, en |2 → 0 (N , M → ∞). n=N
n=N
in H . Da H Also bilden die Partialsummen n=1 x, en en N ∈N eine Cauchyfolge ∞ nach Voraussetzung vollständig ist, existiert der Grenzwert y := n=1 x, en en ∈ H . N
42
2 Hilberträume
b) wurde im Beweis von a) mitbewiesen, wenn man dort x, en durch cn ersetzt. c) Für m ∈ N gilt x, en en , em = x, em − x− x, en en , em = 0 n∈N
n∈N
wegen en , em = δnm . Man beachte hier, dass nach a) und wegen der Stetigkeit der Abbildung H → K, y → y, em das Skalarprodukt in die Summe gezogen werden darf. Satz 2.45. Seien H ein Hilbertraum und S = {en | n ∈ N} ⊆ H ein abzählbares
Orthonormalsystem. Dann sind äquivalent: (i) S ist eine Orthonormalbasis von H . (ii) Es gilt S ⊥ = {0}. (iii) Für alle x ∈ H gilt x, en en . x= n∈N
(iv) Für alle x, y ∈ H gilt x, y =
x, en y, en ,
n∈N
wobei die Reihe absolut konvergiert. (v) Es gilt die Parsevalsche Gleichung (manchmal auch Besselsche Gleichung) x 2 = | x, en |2 (x ∈ H ). n∈N
Beweis. x } ein Orthonormalsystem im (i) ⇒ (ii). Falls ein x ∈ S ⊥ \ {0} existiert, so ist S ∪ { x Widerspruch zur Maximalität von S. (ii) ⇒ (iii). Das folgt direkt aus Satz 2.44 c). N (iii) ⇒ (iv). Sei y ∈ H . Nach (iii) gilt x = lim N →∞ n=1 x, en en für alle x ∈ H . Da die Abbildung x → x, y, H → K stetig ist, erhält man x, y = lim
N →∞
N N x, en y, en , x, en en , y = lim x, en y, en = n=1
N →∞
n=1
n∈N
was auch die Konvergenz der Reihe auf der rechten Seite zeigt. Die absolute Konvergenz dieser Reihe folgt aus Lemma 2.43.
2.4
Orthonormalbasen
43
(iv) ⇒ (v). Setze x = y. (v) ⇒ (i). Falls S nicht maximal ist, wählen wir ein x ∈ S ⊥ mit x = 1. Es ergibt sich 2 n∈N | x, en | = 0, Widerspruch zu (v). Der letzte Satz ist zentral für Hilberträume mit abzählbaren Orthonormalbasen. Insbesondere zeigt sich in (iii), dass jeder Vektor in H als unendliche Linearkombination von Basiselementen geschrieben werden kann, wobei die Reihe in der Norm von H konvergiert. Andererseits wird durch die Parsevalsche Gleichung (v) die Norm eines Vektors in H durch die Norm der Koeffizienten in der Reihendarstellung dargestellt. Die rechte Seite der Gleichheit in (v) kann als die Verallgemeinerung der euklidischen Norm auf den unendlichdimensionalen Fall betrachtet werden, formal erhält man die Norm im Folgenraum 2 . Definition 2.46. Der Hilbertraum 2 (gesprochen „klein ell 2“) wird definiert als die Menge aller Folgen x = (xn )n∈N ⊆ K mit x 2 :=
1/2 |xn |
< ∞.
2
n∈N
Das zugehörige Skalarprodukt ist gegeben durch x, y2 = xn yn (x, y ∈ 2 ). n∈N
Bemerkung 2.47. a) Man kann direkt nachrechnen, dass der Raum 2 tatsächlich ein Hilbertraum ist. Da dies aber als Spezialfall der in Kap. 3 betrachteten Räume folgen wird (Korollar 3.60), wird hier darauf verzichtet. b) Falls H ein Hilbertraum mit abzählbarer Orthonormalbasis {en | n ∈ N} ist, so ist die Abbildung T : H → 2 , x → T x := x, en )n∈N nach Satz 2.45 wohldefiniert und nach der Parsevalschen Gleichung (Satz 2.45 (v)) sogar eine Isometrie, d. h. es gilt T x 2 = x H für alle x ∈ H . Als Isometrie ist T injektiv. Um die Surjektivität zu zeigen, definiert man zu beliebigem c = (cn )n∈N ∈ 2 die Reihe y := k∈N ck ek , welche nach Satz 2.44 b) in H konvergiert. Dann gilt y, en = ck ek , e n = ck ek , en = cn k∈N
k∈N
für alle n ∈ N und damit T y = c. Also ist T auch surjektiv. Damit ist T ein isometrischer Isomorphismus von Hilberträumen (d. h. linear, bijektiv und isometrisch). Da das Skalarprodukt durch die Polarisationsformel (Satz 2.3 c)) mit Hilfe der Norm berechnet
44
2 Hilberträume
werden kann, erhält man auch für die Skalarprodukte die Gleichheit T x, T y2 = x, yH
(x, y ∈ H ).
In diesem Sinn ist 2 „der“ Hilbertraum. Es gibt auch Hilberträume mit einer überabzählbaren Orthonormalbasis. Um die für uns interessanten Hilberträume mit abzählbarer Basis zu charakterisieren, kann folgender topologischer Begriff verwendet werden. Dabei heißt eine Menge abzählbar, wenn sie endlich ist oder wenn sie die Mächtigkeit der natürlichen Zahlen besitzt. Definition 2.48. Ein normierter Raum (X , · ) heißt separabel, wenn eine abzählbare dichte Teilmenge A ⊆ X existiert. Dabei heißt eine Menge A ⊆ X dicht in X , falls für den Abschluss A (siehe Definition 2.15) von A schon A = X gilt, d. h. falls für jedes x ∈ X eine Folge (xn )n∈N mit xn ∈ A und xn → x (n → ∞) existiert.
Lemma 2.49.
a) Ein normierter Raum X ist genau dann separabel, wenn es eine abzählbare Teilmenge S von X gibt mit span S = X . b) Ein Hilbertraum H ist genau dann separabel, wenn es eine abzählbare Orthonormalbasis von H gibt. In diesem Fall sind alle Orthonormalbasen abzählbar.
Beweis. a) Falls X separabel ist, existiert eine abzählbare Teilmenge A ⊆ X mit A = X . Damit gilt auch span A = X , und wir können S := A wählen. Sei nun S abzählbar mit span S = X . Falls K = R, definieren wir A :=
N
αn yn N ∈ N, αn ∈ Q, yn ∈ S (n = 1, . . . , N ) .
n=1
Dann ist auch A abzählbar. Wir zeigen, dass A dicht in X ist. Seien dazu x ∈ X und ε > 0 gegeben. Wegen span S = X existiert ein y ∈ span S mit x − y < 2ε . Da y ∈ span S, N α˜ n yn . existieren N ∈ N, y1 , . . . , y N ∈ S und α˜ 1 , . . . , α˜ N ∈ R mit y = n=1 Da Q dicht in R ist, können wir α1 , . . . , α N ∈ Q mit |αn − α˜ n | < wählen. Für z :=
N
n=1 αn yn
2
N
ε
j=1 y j
(n = 1, . . . , N )
gilt dann z ∈ A sowie
2.4
Orthonormalbasen
x − z ≤ x − y + y − z
0 und e ∈ S existiert ein a ∈ A mit e − a < ε. Da S orthonormal ist, besitzen zwei√verschiedene Vektoren √ in S (nach Pythagoras) den Abstand 2. Wählt man nun ε < 22 , so kann es zu jedem a ∈ A höchstens ein e ∈ S geben, für welches diese Bedingung erfüllt ist. Damit ist die Mächtigkeit der Menge S nicht größer als die der Menge A, d. h. S ist abzählbar. Insbesondere sind in separablen Hilberträumen alle Orthonormalbasen abzählbar. Bemerkung 2.50. Aus Lemma 2.49 folgt insbesondere: Wenn eine Orthonormalbasis abzählbar ist, dann gilt dies für alle Orthormalbasen, d. h. für separable Hilberträume haben alle Basen die gleiche Mächtigkeit. Tatsächlich gilt dies für alle Hilberträume, was die Grundlage für den Begriff der Hilbertraumdimension ist. Ein separabler Hilbertraum H ist somit entweder endlich-dimensional (und damit isomorph zu R N für ein N ∈ N), oder H besitzt eine abzählbar unendliche Orthormalbasis und ist damit isomorph zum Folgenraum 2 (siehe Bemerkung 2.47). In der Definition des Raums 2 waren die Elemente Folgen von (reellen oder komplexen) Zahlen. Man kann in der Konstruktion von 2 auch annehmen, dass die Komponente xn in einem Hilbertraum Hn liegt, und erhält damit direkte Hilbertraumsummen, eine Verallgemeinerung der direkten Summe von zwei Hilberträumen (siehe Bemerkung 2.9 b)). Definition 2.51. Für n ∈ N sei (Hn , ·, ·n ) ein K-Hilbertraum mit zugehöriger Norm ! · n . Dann definiert man die direkte Hilbertraumsumme H = n∈N Hn durch " # H := x = (xn )n∈N xn ∈ Hn (n ∈ N), x 2H := xn 2n < ∞ . n∈N
Man definiert eine K-Vektorraumstruktur auf H durch x + y := (xn + yn )n∈N und αx := (αxn )n∈N für x = (xn )n∈N , y = (yn )n∈N ∈ H und α ∈ K, sowie x, yH := xn , yn n . (2.9) n∈N
46
2 Hilberträume
Lemma 2.52.
a) In der Situation von Definition 2.51 gilt für x, y ∈ H xn , yn n < ∞, n∈N
d. h. die Summe in (2.9) konvergiert absolut. ! b) Mit dem Skalarprodukt (2.9) wird H = n∈N Hn ein K-Hilbertraum.
Beweis. a) Unter der Verwendung der Cauchy–Schwarz-Ungleichung sowohl in Hn für n ∈ N als auch im Folgenraum 2 erhält man für x, y ∈ H
|xn , yn n | ≤
n∈N
xn n yn n ≤
n∈N
1/2 xn 2n
n∈N
1/2 yn 2n
n∈N
= x H y H < ∞. b) Die Eigenschaften eines Skalarprodukts sind offensichtlich, so gilt für x, y ∈ H und α ∈ K etwa αx, yH = αxn , yn n = αxn , yn n = αx, yH . n∈N
n∈N
Zu zeigen ist noch die Vollständigkeit. Sei dazu (x (k) )k∈N ⊆ H eine Cauchyfolge bezüglich · H , wobei x (k) = (xn(k) )n∈N . Wegen x (k) − x (m) 2H = xn(k) − xn(m) 2n n∈N (k)
ist dann auch (xn )k∈N ⊆ Hn eine Cauchyfolge in Hn und, da Hn ein Hilbertraum ist, (k) konvergent. Somit existiert ein xn ∈ Hn mit xn → xn (k → ∞) für jedes n ∈ N. Wir setzen x := (xn )n∈N . Zu ε > 0 existiert ein k0 ∈ N mit x (k) − x (m) 2H < ε (k, m ≥ k0 ). Somit gilt für alle N ∈ N und k ≥ k0 die Abschätzung N
xn(k) − xn 2n = lim
n=1
N
m→∞
≤ sup
n=1
m≥k0 n∈N
Mit N → ∞ folgt
xn(k) − xn(m) 2n ≤ sup
N
m≥k0 n=1
xn(k) − xn(m) 2n ≤ ε.
xn(k) − xn(m) 2n
2.4
Orthonormalbasen
47
x (k) − x 2H =
xn(k) − xn 2n ≤ ε
n∈N
für k ≥ k0 . Damit erhalten wir insbesondere x (k) − x ∈ H für k ≥ k0 , und da H ein Vektorraum ist, gilt auch x = (x − x (k) ) + x (k) ∈ H . Die obige Abschätzung zeigt x (k) − x H → 0 (k → ∞). Also ist jede Cauchyfolge in H konvergent, d. h. H ist vollständig.
Was haben wir gelernt? • In unendlich-dimensionalen normierten Räumen hängt die Stetigkeit von Abbildungen an der Wahl der Normen, selbst die Identität kann unstetig sein. • In Hilberträumen gelten die Cauchy–Schwarz-Ungleichung, der Satz von Pythagoras sowie die Besselsche Ungleichung. Falls das Orthonormalsystem vollständig ist, wird diese zur Parsevalschen Gleichung. • Approximations- und Projektionssatz enthalten Aussagen über geometrische Eigenschaften in einem Hilbertraum wie die Existenz von Elementen mit kleinstem Abstand und orthogonale Zerlegung des Raums. • Jeder Hilbertraum besitzt eine Orthonormalbasis, wie man mit dem Lemma von Zorn zeigen kann. • Separable unendlich-dimensionale Hilberträume H sind durch die Existenz einer abzählbar unendlichen Orthonormalbasis {en | n ∈ N} charakterisiert. In diesem Fall kann man jedes Element x ∈ H in der Form x= x, en en n∈N
schreiben, wobei die Reihe in der Norm von H konvergiert. • Jeder unendlich-dimensionale separable Hilbertraum ist isometrisch isomorph zum Folgenraum 2 .
3
Elemente der Maß- und Integrationstheorie
Worum geht’s? In der Quantenmechanik sind Begriffe aus der Maß- und Integrations-
theorie unter anderem beim Begriff der Wahrscheinlichkeit (Axiome [A3] und [A5]) sowie bei der Definition des Hilbertraums L 2 (R) zu finden. Dieser ist der Zustandsraum für die eindimensionale Orts- und Impulsobservable (Beispiele 1.13 und 1.14). Die Motivation für den Raum L 2 (R) als Zustandsraum liegt darin, dass man einen Funktionenraum sucht, welcher sowohl vollständig ist als auch ein Skalarprodukt besitzt. Die Vollständigkeit wäre auch etwa beim Raum C(X ) aller stetigen Funktionen auf einer kompakten Menge X gegeben, allerdings wird die zugehörige Supremumsnorm nicht von einem Skalarprodukt induziert (vergleiche auch Beispiel 2.8). Der Preis, den man für die guten Eigenschaften von L 2 (R) zu zahlen hat, ist jedoch die etwas kompliziertere Definition: Es handelt sich um Äquivalenzklassen von Funktionen, und das Skalarprodukt basiert auf einem allgemeinen Integralbegriff, welcher wiederum das Konzept eines Maßes voraussetzt. Der maßtheoretische Zugang hat aber auch einen großen Vorteil: Man kann gleichzeitig den Begriff eines Wahrscheinlichkeitsmaßes behandeln. Auch die zugehörigen Integrale sind sowohl in der Analysis (etwa für die Definition der Norm) als auch in der Stochastik (für den Erwartungswert) von Bedeutung. Ein Maß ist eine Abbildung, welche Teilmengen des Grundraums eine nichtnegative reelle Zahl oder den Wert Unendlich zuordnet, anschaulich kann man sich hierbei etwa das Volumen eines dreidimensionalen Körpers vorstellen. Allerdings kann ein Maß nicht immer auf allen Teilmengen definiert werden, so dass Maße als Definitionsbereich häufig nicht die ganze Potenzmenge besitzen. Das führt auf den Begriff der σ -Algebra und der messbaren Mengen. In diesem Kapitel werden zunächst die Begriffe σ -Algebra, messbare Menge und Maß definiert, bevor man über messbare Funktionen zum Integral kommt. Es folgt die Diskussion der wichtigsten Sätze aus der Theorie des allgemeinen LebesgueIntegrals, wie das Lemma von Fatou, die Sätze von Lebesgue über monotone und © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2022 R. Denk, Mathematische Grundlagen der Quantenmechanik, https://doi.org/10.1007/978-3-662-65554-2_3
49
50
3 Elemente der Maß- und Integrationstheorie
majorisierte Konvergenz sowie der Satz von Fubini über die Vertauschbarkeit von Integralen und der Transformationssatz für das Lebesgue-Integral im Rn . Schließlich wird der Hilbertraum L 2 (μ) für ein beliebiges Maß μ betrachtet.
3.1
Der Maßbegriff und das Lebesgue-Maß
Wir hatten in Beispiel 2.2 b) und 2.8 c) gesehen, dass der Raum C([0, 1]), versehen mit dem Skalarprodukt 1 f (x)g(x) dx, f , g = 0
ein Prähilbertraum, aber nicht vollständig und damit kein Hilbertraum ist. Die Vervollständigung dieses Prähilbertraums ist der Hilbertraum L 2 ((0, 1)) aller bezüglich des LebesgueMaßes quadratintegrierbarer Funktionen auf dem Intervall (0, 1). Dabei ist ein Maß axiomatisch definiert. Um diese Axiome zu motivieren, betrachten wir das Volumen eines dreidimensionalen Körpers. Man würde gerne möglichst vielen Teilmengen des R3 eine Zahl (das Volumen dieser Teilmenge) zuordnen, wobei folgende Bedingungen natürlich erscheinen: (i) Das Volumen sollte nichtnegativ sein, die leere Menge hat Volumen 0. (ii) Das Volumen einer disjunkten Vereinigung von zwei Mengen sollte die Summe der beiden Volumina sein. Stellt man sich einen Würfel vor, der in immer kleinere Scheiben geschnitten wird, so erscheint auch folgende Bedingung sinnvoll: (iii) Das Volumen einer abzählbaren disjunkten Vereinigung von Mengen ist die Summe der einzelnen Volumina. Da R3 sicher unendliches Volumen besitzt, müssen Maße auch den Wert +∞ annehmen können. Im Wesentlichen sind (i)–(iii) bereits die Axiome eines Maßes. Für das dreidimensionale Volumen wäre also im besten Fall eine Abbildung λ : P (R3 ) → [0, ∞] gesucht, welche jeder Teilmenge A ⊆ R3 sein Volumen λ(A) zuordnet und die Bedingungen (i)–(iii) erfüllt. Weiterhin sollte sich das Volumen einer Menge nicht ändern, wenn der Menge bewegt (also verschoben oder gedreht) wird. Es stellt sich heraus, dass eine solche Abbildung nicht existieren kann. Dies zeigt das Banach–Tarski-Paradoxon, welches besagt, dass eine Zerlegung der Einheitskugel im R3 in endlich viele Mengen so existiert, dass sich aus den Teilen nur durch Verschiebung und Drehung zwei volle Einheitskugeln (ohne Löcher und Lücken) zusammensetzen lassen. Für
3.1
Der Maßbegriff und das Lebesgue-Maß
51
eine genauere Diskussion dieses Paradoxons und Hinweise auf weiterführende Literatur erwähnen wir hier [17, Kap. 1, § 1]. Die Antwort auf dieses Paradoxon liegt darin, dass man zwar die obigen Axiome (inklusive der Invarianz unter Bewegung) so belässt, dass man aber darauf verzichtet, jeder Teilmenge ein Volumen zuzuordnen. Statt einer Abbildung λ : P (R3 ) → [0, ∞] kann man eine Abbildung λ : A → [0, ∞] mit A ⊆ P (R3 ) definieren, welche alle Axiome erfüllt. Motiviert durch das Volumen, betrachtet man allgemein Maße als Abbildungen μ : A → [0, ∞], wobei A ⊆ P (X ) gilt. Dabei verlangt man für A die folgenden Bedingungen. Definition 3.1. Sei X eine Menge, P (X ) die Potenzmenge von X und A ⊆ P (X ). Dann heißt A eine σ -Algebra über X , falls folgende Bedingungen erfüllt sind. (i) Es gilt ∅ ∈ A . (ii) Für jedes A ∈ A ist auch das Komplement Ac := {x ∈ X | x ∈ / A} wieder in A . (iii) Falls An ∈ A (n ∈ N), so gilt n∈N An ∈ A . In diesem Fall heißt (X , A ) Messraum, und die Mengen A ∈ A heißen messbar, genauer A -messbar. Bemerkung 3.2. a) Eine σ -Algebra ist eine Menge von Mengen, also eine Teilmenge der Potenzmenge, genauso wie eine Topologie (Definition 2.12). Man beachte jedoch die Unterschiede bei den Bedingungen an die jeweiligen Mengensysteme. b) Die (bezüglich Mengeninklusion) größte σ -Algebra ist P (X ), die kleinste ist {∅, X }. Falls Ai eine σ -Algebra ist für i ∈ I , wobei I eine nichtleere Indexmenge ist, dann ist i∈I Ai wieder eine σ -Algebra, wie man direkt aus der Definition sieht. Definition 3.3. Sei E ⊆ P (X ) beliebig. Dann heißt σ (E ) := {A ⊇ E | A ist σ -Algebra u¨ ber X } die von E erzeugte σ -Algebra (d. h. die kleinste σ -Algebra, die E enthält). In diesem Fall heißt E ein Erzeugendensystem der σ -Algebra σ (E ). Wie oben erwähnt, sind Maße auf σ -Algebren definiert. Die folgende Definition formalisiert die Axiome vom Beginn dieses Abschnitts. Dabei verwenden wir die Schreibweise ˙ n∈N An := n∈N An , falls die Mengen {An | n ∈ N} paarweise disjunkt sind, d. h. falls An ∩ Am = ∅ für alle m = n gilt. Analog schreibt man A ∪˙ B := A ∪ B, falls A ∩ B = ∅.
52
3 Elemente der Maß- und Integrationstheorie
Definition 3.4. Sei (X , A ) ein Messraum. a) Eine Abbildung μ : A → [0, ∞] heißt ein Maß auf A , falls gilt: (i) μ(∅) = 0, (ii) σ -Additivität: Sei (An )n∈N ⊆ A eine Folge von paarweise disjunkten Mengen, d. h. es gilt An ∩ Am = ∅ (n = m). Dann gilt ˙ μ An = μ(An ) . (3.1) n∈N
n∈N
In diesem Fall heißt (X , A , μ) ein Maßraum. b) Ein Maß μ auf einer σ -Algebra A heißt (i) σ -endlich (oder σ -finit), falls es eine Folge (An )n∈N ⊆ A gibt mit und μ(An ) < ∞ für alle n ∈ N, (ii) endlich, falls μ(X ) < ∞ (und damit μ(A) < ∞ für alle A ∈ A ), (iii) ein Wahrscheinlichkeitsmaß, falls μ(X ) = 1.
n∈N
An = X
c) Sei μ ein Maß auf A . Dann heißt eine Menge A ⊆ X eine μ-Nullmenge, falls A ∈ A und μ(A) = 0 gilt. Falls für eine Aussage M(x) die Menge {x ∈ X | M(x) gilt nicht} eine μ-Nullmenge ist, so sagt man, die Aussage M(x) gilt μ-fast überall. Bemerkung 3.5. In obiger Definition und auch im Folgenden tritt der Wert ∞ auf. Dabei sind folgende Rechenregeln zu beachten: (i) (ii) (iii) (iv)
∞ · 0 = 0 · ∞ = 0, ∞ · a = a · ∞ = ∞ (0 < a ≤ ∞), ∞ + a = a + ∞ = ∞ (−∞ < a ≤ ∞). Der Ausdruck ∞ − ∞ ist nicht definiert.
Beispiel 3.6
a) Sei X eine beliebige nichtleere Menge, und sei x ∈ X . Wir definieren δx : P (X ) → [0, 1] durch
1, x ∈ A, δx (A) := 1 A (x) := 0, x ∈ / A. Dann ist δx ein Wahrscheinlichkeitsmaß auf P (X ) und damit auf jeder σ -Algebra A (durch Einschränkung). Das Maß δx wird als Dirac-Maß oder auch Punktmaß bezeichnet. Speziell im Fall X = Rn schreibt man auch δ := δ0 .
3.1
Der Maßbegriff und das Lebesgue-Maß
53
b) Sei wieder X eine beliebige nichtleere Menge. Für alle A ⊆ X definiert man ζ (A) :=
|A| , falls A endlich, ∞ , falls A unendlich.
Dabei bezeichnet |A| die Anzahl der Elemente (Mächtigkeit) der Menge A. Dann ist ζ ein Maß auf P (X ), welches genau dann σ -endlich ist, falls X abzählbar ist. Dieses Maß heißt Zählmaß über X . c) Eine Motivation für die obigen Begriffe ist die mathematische Präzisierung des ndimensionalen Volumens (n = 1: Länge, n = 2: Fläche, n = 3: Volumen). Wie schon in Definition 3.4 b) angedeutet, wird dieselbe Axiomatik auch für Wahrscheinlichkeiten verwendet. Würfelt man z. B. mit einem Würfel, so erhält man als mögliche Ergebnisse X = {1, . . . , 6}. Falls es sich um einen fairen Würfel handelt, so hat jede Zahl die Wahrscheinlichkeit 16 . Das zugehörige Wahrscheinlichkeitsmaß P ist definiert für jede Teilmenge von X , d. h. A = P (X ), und es gilt P(A) =
|A| (A ⊆ X ). 6
Man beachte, dass das Wahrscheinlichkeitsmaß nicht für die einzelnen Ergebnisse, sondern für Teilmengen definiert ist. So gilt z. B. P({1}) = 16 und P({2, 4, 6}) = 21 , d. h. die Wahrscheinlichkeit, eine gerade Zahl zu würfeln, beträgt 21 . Das Dirac-Maß aus Teil a) ist ebenfalls ein Wahrscheinlichkeitsmaß, welches der einelementigen Menge {x} die Wahrscheinlichkeit 1 zuweist. Bemerkung 3.7. Wie das letzte Beispiel zeigt, ist der Maßbegriff auch in der Stochastik ein zentraler Begriff. Die Notationen sind dabei üblicherweise etwas anders als in der Analysis. So wird bei einem Wahrscheinlichkeitsmaß häufig die Bezeichnung P verwendet, und der zugehörige Maßraum (der dann auch Wahrscheinlichkeitsraum heißt) wird als (, F , P) geschrieben. Statt P-fast überall sagt man dann auch P-fast sicher. Bemerkung 3.8. Sei (X , A , μ) ein Maßraum, und sei Y ∈ A . Dann ist
A ∩ Y := {A ∩ Y | A ∈ A } eine σ -Algebra über Y , genannt die Spur-σ -Algebra auf Y , und μ|Y := μ|A ∩Y ist ein Maß auf dem Messraum (Y , A ∩ Y ). Das Maß μ|Y heißt das Spurmaß von μ auf Y . Für Rechnungen mit Maßen ist der folgende Satz oft nützlich.
54
3 Elemente der Maß- und Integrationstheorie
Satz 3.9. Sei (X , A , μ) ein Maßraum.
a) Sei (An )n∈N ⊆ A eine aufsteigende Folge messbarer Mengen, d. h. es gilt A1 ⊆ A2 ⊆ . . . . Dann ist A := n∈N An wieder messbar (also A ∈ A ), und es gilt lim μ(An ) = μ(A),
n→∞
wobei der Wert ∞ zugelassen ist. Man sagt, μ ist stetig von unten. b) Sei (An )n∈N ⊆ A eine Folge mit μ(A1 ) < ∞ und A1 ⊇ A2 ⊇ . . . . Dann ist A := n∈N An messbar, und es gilt lim μ(An ) = μ(A),
n→∞
d. h. μ ist stetig von oben.
Beweis. a) Nach Definition 3.1 (iii) gilt A ∈ A . Wir definieren A˜ 1 := A1 und A˜ n := An \ An−1 n für n ≥ 2. Dann gilt A = ˙ n∈N A˜ n sowie An = ˙ k=1 A˜ k . Somit folgt μ(A) =
μ( A˜ n ) = lim
n∈N
= lim
n→∞
n→∞
μ(A1 ) +
n k=1
n k=2
μ( A˜ k )
μ(Ak ) − μ(Ak−1 ) = lim μ(An ). n→∞
b) Wegen μ(A1 ) < ∞ gilt μ(An ) < ∞ (n ∈ N) sowie μ(A1 \ An ) = μ(A1 ) − μ(An ). Wir setzen Bn := A1 \ An (n ∈ N) sowie B := A1 \ A und erhalten mit a) μ(A1 ) − μ(A) = μ(A1 \ A) = μ(B) = lim μ(Bn ) = lim μ(A1 \ An ) n→∞ n→∞
= lim μ(A1 ) − μ(An ) . n→∞
Also gilt μ(A) = limn→∞ μ(An ).
Beispiel 3.10
In Teil b) des obigen Satzes kann die Bedingung μ(A1 ) < ∞ nicht weggelassen werden, wie das folgende Beispiel zeigt: Sei ζ : P (N) → [0, ∞] das Zählmaß (siehe Beispiel 3.6 b)), und sei An := {n, n + 1, . . . } für n ∈ N. Dann gilt ζ (An ) = ∞ für alle n ∈ N, aber
3.1
Der Maßbegriff und das Lebesgue-Maß
ζ
55
An = ζ (∅) = 0.
n∈N
Wir wollen das Lebesgue-Maß zumindest für n-dimensionale Quader definieren. Dazu definieren wir für a, b ∈ Rn , a = (a1 , . . . , an ) , b = (b1 , . . . , bn ) mit a j ≤ b j ( j = 1, . . . , n) den n-dimensionalen Quader oder das n-dimensionale abgeschlossene Intervall durch [a, b] :=
n
[a j , b j ].
j=1
Falls für mindestens ein j gilt a j > b j , so definiert man [a, b] := ∅. Analog definiert man offene Intervalle (a, b) = nj=1 (a j , b j ) und halboffene Intervalle. Da Maße stets auf einer σ -Algebra definiert sind, betrachten wir die von den Intervallen erzeugte σ -Algebra. Definition 3.11. Die von allen halboffenen Intervallen erzeugte σ -Algebra
B (Rn ) := σ {(a, b] | a, b ∈ Rn } heißt die Borel-σ -Algebra im Rn . Die Mengen in B (Rn ) heißen Borel-messbar. Bemerkung 3.12. a) Für a, b ∈ Rn mit a j < b j ( j = 1, . . . , n) gilt (a, b) =
n
a j , b j − k1 . k∈N j=1
Da jedes Intervall auf der rechten Seite in B (Rn ) ist, gilt dies auch für die Vereinigung. Somit sind alle offenen Intervalle ebenfalls Borel-messbar. Analog sieht man aus (a, b] =
n
a j , b j + k1 ,
(3.2)
k∈N j=1
dass die Borel-σ -Algebra auch von allen offenen Intervallen erzeugt wird, oder von allen abgeschlossenen Intervallen. b) Im Fall n = 1 gilt für a, b ∈ R mit a < b die Gleichheit (a, b] = (−∞, b] \ (−∞, a]. Damit sieht man, dass sogar das System der halbunendlichen Intervalle {(−∞, a] | a ∈ R} bereits die Borel-σ -Algebra B (R) erzeugt. Statt Intervalle der Form (−∞, a] kann man dabei auch (−∞, a) oder (a, ∞) oder [a, ∞) nehmen.
56
3 Elemente der Maß- und Integrationstheorie
Wie das folgende Lemma zeigt, ist die Borel-σ -Algebra recht groß, so ist jede offene Menge Borel-messbar. Lemma 3.13. Sei T ⊆ P (Rn ) das Mengensystem aller offenen Teilmengen des Rn .
Dann gilt B (Rn ) = σ (T ). Insbesondere ist jede offene Teilmenge und damit jede abgeschlossene Teilmenge Borel-messbar.
Beweis. Um für E1 , E2 ⊆ P (X ) die Gleichheit σ (E1 ) = σ (E2 ) zu zeigen, reicht es offensichtlich, die Inklusionen E1 ⊆ σ (E2 ) und E2 ⊆ σ (E1 ) zu beweisen. (i) Seien a, b ∈ Rn mit a j < b j ( j = 1, . . . , n). Dann zeigen die Darstellung (3.2) und die Offenheit von nj=1 (a j , b j + k1 ), dass (a, b] in der von T erzeugten σ -Algebra liegt. Also gilt B (Rn ) ⊆ σ (T ). (ii) Sei U ⊆ Rn offen. Dann existiert zu jedem Punkt x ∈ U ein r x > 0 mit B(x, r x ) ⊆ U . Wir definieren die Vektoren a(x) und b(x) durch a j (x) := x j − √r xn und b j (x) := xj +
rx √ n
für j = 1, . . . , n. Dann folgt (a(x), b(x)) ⊆ U . Da Q dicht in R liegt, existieren a˜ j (x) ∈ Q ∩ (a j (x), x j ) und b˜ j (x) ∈ Q ∩ (x j , b j (x)), und wir erhalten ˜ x ∈ (a(x), ˜ b(x)] ⊆ U . Somit gilt U=
˜ (a(x), ˜ b(x)].
x∈U
˜ Da alle Koordinaten von a(x) ˜ und b(x) rational sind, existieren nur abzählbar viele ˜ verschiedene Intervalle (a(x), ˜ b(x)], d. h. U ist eine abzählbare Vereinigung von Inter˜ vallen der Form (a(x), ˜ b(x)] ∈ B (Rn ), und damit folgt U ∈ B (Rn ). Also ist T ⊆ B (Rn ). Die offenen Teilmengen bilden gerade die Topologie, vergleiche Definition 2.12. Damit lässt sich der Begriff der Borel-σ -Algebra auf allgemeinen topologischen Räumen definieren. Nach Lemma 3.13 ist diese Definition auf Rn mit der ursprünglichen Definition kompatibel. Definition 3.14. Sei (X , T ) ein topologischer Raum. Dann heißt die von den offenen Mengen erzeugte σ -Algebra B (X ) := σ (T ) die Borel-σ -Algebra über X . Das n-dimensionale Lebesgue-Maß wird auf der Borel-σ -Algebra des Rn definiert. Dabei soll das Maß eines n-dimensionalen Intervalls das Produkt der Seitenlängen sein. Wie der folgende Satz aus der Maßtheorie zeigt, ist dadurch das Lebesgue-Maß bereits eindeutig bestimmt. Ein Beweis findet sich etwa in [4, Satz 6.2].
3.1
Der Maßbegriff und das Lebesgue-Maß
57
Satz 3.15. Es existiert genau ein Maß λ = λn : B (Rn ) → [0, ∞] mit der Eigenschaft n
λ
n [a j , b j ] = (b j − a j )
j=1
j=1
für alle a, b ∈ Rn mit a j < b j ( j = 1, . . . , n). Das Maß λn heißt das n-dimensionale Lebesgue-Maß.
Bemerkung 3.16. a) Die Menge {x} ist für jeden Punkt x = (x1 , . . . , xn ) ∈ Rn eine λ-Nullmenge, denn es gilt n x j , x j + k1 , {x} = k∈N j=1
und nach Satz 3.9 b) folgt λ({x}) = limk→∞ ( k1 )n = 0. b) Ähnlich sieht man, dass für a, b ∈ Rn mit a j ≤ b j ( j = 1, . . . , n) gilt: λ((a, b)) = λ([a, b)) = λ((a, b]) = λ([a, b]) =
n
(b j − a j )
j=1
(vergleiche dazu auch Bemerkung 3.12). Insbesondere folgt λ([a, b]) = 0, falls der n-dimensionale Quader ausgeartet ist, d. h. falls a j = b j für ein j gilt. Auch für Untervektorräume der Form V = {x ∈ Rn | x1 = · · · = xk = 0} folgt λ(V ) = 0. Denn für jedes N ∈ N ist V ∩ [−N , N ]n ein entarteter Quader mit Maß 0, und wegen V = N ∈N (V ∩ [−N , N ]n ) gilt λ(V ) = 0 nach Satz 3.9 a). c) Die Menge der rationalen Zahlen Q ist abzählbar und damit abzählbare Vereinigung von Punkten. Da alle Punkte Maß 0 haben und Maße σ -additiv sind, folgt λ(Q) = 0. d) Wegen Rn = N ∈N [−N , N ]n und λ([−N , N ])n = (2N )n < ∞ ist das Lebesgue-Maß σ -endlich. Falls man zwei Maßräume (X 1 , A1 , μ1 ) und (X 2 , A2 , μ2 ) gegeben hat, kann man die Produkt-σ -Algebra und das Produktmaß definieren. Definition 3.17. a) Seien (X 1 , A1 ) und (X 2 , A2 ) zwei Messräume. Dann definiert man die Produkt-σ Algebra A1 ⊗ A2 über X 1 × X 2 durch
A1 ⊗ A2 := σ A1 × A2 A1 ∈ A1 , A2 ∈ A2 .
58
3 Elemente der Maß- und Integrationstheorie
b) Seien (X 1 , A1 , μ1 ) und (X 2 , A2 , μ2 ) zwei Maßräume. Dann heißt ein Maß μ : A1 ⊗ A2 → [0, ∞] das Produktmaß von μ1 und μ2 , falls μ(A1 × A2 ) = μ1 (A1 )μ2 (A2 ) (A1 ∈ A1 , A2 ∈ A2 ).
(3.3)
In diesem Fall schreibt man μ = μ1 ⊗ μ2 . Bemerkung 3.18. a) Falls die Maße μ1 und μ2 in Definition 3.17 b) beide σ -endlich sind, so kann man zeigen (siehe [4, Satz 23.3]), dass das Produktmaß μ1 ⊗ μ2 existiert und durch die Bedingung (3.3) bereits eindeutig festgelegt ist. b) Analog definiert man das Produkt von endlich vielen Maßen. Für das Lebesgue-Maß gilt λn = λ1 ⊗ . . . ⊗ λ1 . Bemerkung 3.19. Statt Maße mit Werten in [0, ∞] zu betrachten, kann man auch komplexwertige Maße definieren. Dabei heißt eine Abbildung μ : A → C ein komplexwertiges Maß, falls die Bedingungen (i) und (ii) aus Definition 3.4 gelten, d. h. falls μ(∅) = 0 und ˙ An = μ(An ) μ n∈N
n∈N
für alle paarweise disjunkten Mengen (An )n∈N ⊂ A gilt. Dabei impliziert die letzte Gleichheit insbesondere die Konvergenz der Reihe in C, der Wert ∞ ist ausgeschlossen. Wir wollen im Folgenden jedoch unter einem Maß stets ein [0, ∞]-wertiges Maß verstehen.
3.2
Messbare Funktionen und das Integral
Nun soll zu einem Maßraum (X , A , μ) das zugehörige Integral definiert werden. Dabei soll das Integral so konstruiert werden, dass die Abbildung f → f (x) dμ(x) linear ist, und falls f eine charakteristische Funktion ist, d. h. f (x) = 1 für alle x ∈ A und f (x) = 0 sonst, so wird man f (x) dμ(x) = μ(A) fordern. Dies entspricht (für Funktionen f : R → R) der Idee, dass das Integral die Fläche zwischen x-Achse und dem Graphen der Funktion angibt. Damit μ(A) definiert ist, muss A ∈ A gelten, wir brauchen also eine Bedingung an die Funktion f , welche in der folgenden Definition formalisiert wird. Wir betrachten dabei für spätere Zwecke nicht nur Funktionen f : X → R, sondern Abbildungen f : X → Y . Definition 3.20. Seien (X , A ) und (Y , B ) Messräume. Für eine Abbildung f : X → Y betrachte das Urbild f −1 (B) := {x ∈ X | f (x) ∈ B} für B ∈ P (Y ). Dann heißt f messbar (genauer A -B -messbar), falls für alle B ∈ B gilt: f −1 (B) ∈ A . Falls (Y , B ) = (Rn , B (Rn )), so heißt eine A -B -messbare Funktion f auch A -messbar. Falls auch (X , A ) = (Rm , B (Rm )), so heißt f Borel-messbar oder auch nur messbar.
3.2
Messbare Funktionen und das Integral
59
Bemerkung 3.21. a) Sei f : X → Y eine konstante Funktion, d. h. es gibt ein y0 ∈ Y mit f (x) = y0 (x ∈ X ). Dann gilt für jede Menge B ⊆ Y X , falls y0 ∈ B, −1 f (B) = ∅, sonst. Da jede σ -Algebra die ganze Menge und die leere Menge enthält, ist f unabhängig von der Wahl der σ -Algebren messbar. b) Seien A ⊆ X eine Menge und f : X → R mit f (x) = 1 (x ∈ A) und f (x) = 0 sonst. Dann gilt für jede Borel-messbare Menge B ∈ B (R) f −1 (B) ∈ {∅, A, Ac , X }, und f ist genau dann messbar, wenn A ∈ A . c) Direkt anhand der Definition sieht man, dass Kompositionen messbarer Funktionen wieder messbar sind. Seien (X , A ), (Y , B ) und (Z , C ) Messräume, und seien f : X → Y und g : Y → Z messbare Funktionen. Dann ist auch g ◦ f wieder messbar, denn für jede Menge C ∈ C gilt B := g −1 (C) ∈ B und damit (g ◦ f )−1 (C) = f −1 (g −1 (C)) = f −1 (B) ∈ A . Das folgende Kriterium ist nützlich, um die Messbarkeit einer Funktion nachzuweisen. Lemma 3.22. Seien (X , A ) und (Y , B ) Messräume, und sei E ein Erzeugenden-
system von B , d. h. es gelte σ (E ) = B (siehe Definition 3.3). Dann ist eine Funktion f : X → Y genau dann messbar, wenn für jede Menge E ∈ E gilt: f −1 (E) ∈ A .
Beweis. Falls f messbar ist, gilt f −1 (B) ∈ A für jede Menge B ∈ B und damit insbesondere für jede Menge E ∈ E . Es gelte nun f −1 (E) ∈ A für jedes E ∈ E . Men rechnet direkt nach, dass das Mengensystem B := {B ⊆ Y | f −1 (B) ∈ A } eine σ -Algebra über Y ist. Nach Voraussetzung gilt E ⊆ B . Da σ (E ) die kleinste σ -Algebra ist, welche E enthält, folgt B = σ (E ) ⊆ B . Dies ist aber gerade die Messbarkeit von f . Korollar 3.23. Seien (X , A ) ein Messraum und f : X → R eine Funktion. Falls
{x ∈ X | f (x) ≤ y} ∈ A
(y ∈ R),
(3.4)
dann ist f messbar (genauer A -B (R)-messbar). Dieselbe Aussage gilt, wenn man „≤“ durch „“ ersetzt.
60
3 Elemente der Maß- und Integrationstheorie
Beweis. Falls f messbar ist, so ist {x ∈ X | f (x) ≤ y} = f −1 ((−∞, y]) ∈ A wegen (−∞, y] ∈ B (R). Falls andererseits (3.4) gilt, so gilt f −1 ((−∞, y]) ∈ A für alle y ∈ R. Da das System {(−∞, y] | y ∈ R} nach Bemerkung 3.12 b) ein Erzeugendensystem von B (R) ist, folgt die Messbarkeit von f aus Lemma 3.22. Analog folgt die Behauptung für offene bzw. nach rechts unendliche Intervalle.
Korollar 3.24. Seien (X , A ) ein Messraum, und seien f 1 , f 2 : X → R messbar.
Dann ist auch f : X → R , x → 2
f 1 (x) f 2 (x)
messbar.
Beweis. Nach Lemma 3.22 und der Definition von B (R2 ) müssen wir nur zeigen, dass f −1 ([a, b]) ∈ A für alle a, b ∈ R2 mit a1 < b1 und a2 < b2 gilt. Dies folgt aber sofort aus f −1 ([a, b]) = x ∈ X | f 1 (x) ∈ [a1 , b1 ], f 2 (x) ∈ [a2 , b2 ] = f 1−1 ([a1 , b1 ]) ∩ f 2−1 ([a2 , b2 ]) und der Messbarkeit von f 1 und f 2 .
Lemma 3.25. Sei (X , T ) ein topologischer Raum, und sei B (X ) = σ (T ) die Borel-
σ -Algebra über X . Dann ist jede stetige Funktion f : X → R Borel-messbar, d. h. B (X )-B (R)-messbar.
Beweis. Für eine stetige Funktion f : X → R ist f −1 ((a, b)) offen und damit in B (X ) für alle a, b ∈ R mit a < b. Da die Intervalle {(a, b) | a, b ∈ R, a < b} ein Erzeugendensystem von B (R) bilden, folgt die Behauptung aus Lemma 3.22. Bemerkung 3.26. Im Folgenden treten auch die Werte ±∞ als Funktionswerte auf. Dazu setzt man R := R ∪ {−∞, +∞} und definiert die Borel-σ -Algebra auf R durch B (R) :=
σ {(a, ∞] | a ∈ R} . Die obigen Aussagen gelten analog auch für Funktionen f : X → R. Der folgende Satz zeigt, dass sich die Messbarkeit von Funktionen gutmütig gegenüber Grenzwertbildung verhält.
3.2
Messbare Funktionen und das Integral
61
Satz 3.27. Sei (X , A ) ein Messraum.
a) Sei ( f k )k∈N eine Folge messbarer Funktionen f k : X → R. Dann sind auch die Funktionen inf k∈N f k , supk∈N f k , lim inf k→∞ f k und lim supk→∞ f k als Funktionen von X nach R messbar. b) Sei ( f k )k∈N eine Folge messbarer Funktionen f k : X → R, und für alle x ∈ X existiere f (x) = limk→∞ f k (x) ∈ R. Dann ist auch f : X → R messbar. c) Seien f 1 , f 2 : X → R messbar und F : R2 → R messbar, so ist auch f 1 (x) g : X → R, g(x) := F f 2 (x) messbar. Insbesondere sind max{ f 1 , f 2 }, min{ f 1 , f 2 }, f 1 ± f 2 und f 1 · f 2 sowie (falls f 2 (x) = 0 für alle x ∈ X ) ff21 messbar.
Beweis. a) Sei ( f k )k∈N wie im Satz angegeben, und sei f (x) := supk∈N f k (x) ∈ R (x ∈ X ). Dann gilt für alle y ∈ R f −1 ([−∞, y]) = f k−1 ([−∞, y]) ∈ A , k∈N
und nach Korollar 3.23 ist f messbar. Da mit f k auch − f k messbar ist, folgen die anderen Behauptungen aus inf k∈N f k = − supk∈N (− f k ), lim inf k→∞ = supk∈N inf m≥k f m und lim supk→∞ f k = inf k∈N supm≥k f m . b) Falls die Folge ( f k )k∈N punktweise konvergent ist, so gilt limk→∞ f k (x) = lim supk→∞ f k (x) für alle x ∈ X , und damit folgt die Behauptung aus a). c) Nach Korollar 3.24 ist auch die Funktion f : X → R2 , x → ( f 1 (x), f 2 (x)) messbar, und damit ist g = F ◦ f messbar (Bemerkung 3.21 c)). Die restlichen Aussagen folgen aus der Stetigkeit und damit (nach Lemma 3.25) Borel-Messbarkeit der Abbildungen (x, y) → max{x, y}, (x, y) → min{x, y}, (x, y) → x ± y, (x, y) → x · y, sowie (x, y) → xy (y = 0). Im Folgenden sei (X , A , μ) ein Maßraum. Für die Definition des Integrals werden zunächst messbare Funktionen besonders einfacher Gestalt betrachtet. Definition 3.28. Eine Stufenfunktion (oder Treppenfunktion oder einfache Funktion) ist eine Funktion f : X → R der Form f = kj=1 c j 1 A j mit c j ∈ R und A j ∈ A . Dabei ist 1 A (x) :=
1, x ∈ A, 0, x ∈ / A
62
3 Elemente der Maß- und Integrationstheorie
die charakteristische Funktion der Menge A ⊆ X . Der Raum aller beschränkten A messbaren Funktionen f : X → R wird mit B(X , A ; R) bezeichnet. Dies ist ein Untervektorraum des Raums B(X ; R) aller beschränkten Funktionen von X nach R. Wir versehen beide Räume mit der Supremumsnorm f ∞ := sup | f (x)| ( f ∈ B(X ; R)). x∈X
Bemerkung 3.29. In der Darstellung einer Stufenfunktion kann man (durch Verfeinerung der Mengen A j ) stets annehmen, dass die Mengen A j ( j = 1, . . . , k) paarweise disjunkt sind. Die Idee der Stufenfunktionen liegt darin, konstante Funktionswerte c j auf der Menge A j vorzugeben, wobei für die Menge A j nur die Messbarkeit verlangt wird. Damit können auch komplizierte Mengen A j auftreten. Es ist ein Prinzip der Lebesgue-Theorie, sich auf die Urbilder A j = f −1 ({c j }) zu konzentrieren, anders als z. B. beim Riemann-Integral, bei welchem die Werte auf Intervallen betrachtet werden. So ist z. B. (für X = R) die Funktion f = 1Q eine Stufenfunktion, der Wert von f ist aber auf keinem Intervall konstant. Satz 3.30.
a) Zu jeder messbaren Funktion f : X → R existiert eine Folge (sk )k∈N von Stufenfunktionen mit sk (x) → f (x) (x ∈ X ). Falls zusätzlich f ≥ 0 gilt, so kann man die Folge (sk )k∈N monoton wachsend wählen, d. h. es gilt sk (x) ≤ sk+1 (x) (k ∈ N, x ∈ X ). b) Falls f : X → R beschränkt und messbar ist, so existiert eine Folge von Stufenfunktionen, welche gleichmäßig gegen f konvergiert. Der Raum der Stufenfunktionen liegt somit dicht in B(X , A ; R) bzgl. · ∞ -Norm.
Beweis. a) Sei zunächst f : X → R messbar mit f ≥ 0. Für k, j ∈ N mit 1 ≤ j ≤ k · 2k definiere j −1 j −1 j j −1 = f Ak j := x ∈ X ≤ f (x) < , 2k 2k 2k 2k und Ak := f −1 ([k, ∞]). Da f messbar ist, sind Ak j und Ak messbar. Definiere nun k
k·2 j −1 1 Ak j + k · 1 Ak . sk := 2k j=1
Dann konvergiert die Folge (sk )k∈N monoton wachsend punktweise gegen f . Im allgemeinen Fall zerlege man f = f + − f − mit f + := max{ f , 0} und f − := − min{ f , 0} und wende obige Konstruktion auf f + und f − an.
3.2
Messbare Funktionen und das Integral
63
b) Die Konstruktion in a) zeigt, dass die Folge (sk )k∈N bei beschränktem messbaren f sogar gleichmäßig konvergiert. Das letzte Resultat zeigt, dass es genügt, das Integral für Stufenfunktionen zu definieren. Durch die Bedingung 1 A (x) dμ(x) = μ(A) und die Linearität ist das Integral auf den Stufenfunktionen bereits vorgegeben. Die folgende Definition ist zentral für die Integrationstheorie. Definition 3.31. a) Sei s = kj=1 c j 1 A j mit c j ∈ R und A j ∈ A eine Stufenfunktion mit s ≥ 0. Definiere das Integral von s bzgl. μ durch
s dμ :=
s(x) dμ(x) :=
k
c j μ(A j ) ∈ [0, ∞].
j=1
b) Sei nun f : X → [0, ∞] messbar. Definiere f dμ := f (x) dμ(x) := sup s dμ s Stufenfunktion, 0 ≤ s ≤ f ∈ [0, ∞]. c) Falls f : X → R messbar ist, definiert man f dμ := f (x) dμ(x) := f + dμ − f − dμ,
(3.5)
falls nicht beide Integrale den Wert +∞ haben. Dabei verwenden wir wieder f + (x) := max{ f (x), 0} und f − (x) = − min{ f (x), 0}. d) Eine Funktion f : X → R heißt integrierbar, falls f messbar ist und beide Integrale in (3.5) endlich sind. Die Menge aller integrierbaren Funktionen wird mit L 1 (μ) = L 1 (X , A , μ) = L 1 (X ) bezeichnet. Der Index „1“ wird manchmal unten geschrieben: L1 (μ). Das Integral f dμ heißt auch das (allgemeine) Lebesgue-Integral. Falls μ = λ das Lebesgue-Maß im Rn ist, so schreibt man f (x) dx und spricht auch vom LebesgueIntegral im eigentlichen Sinne. e) Für A ∈ A definiert man f dμ :=
1 A f dμ.
A
Für G ∈ B (Rn ) schreiben wir L 1 (G) := L 1 (λ|G ), wobei λ das n-dimensionale Lebesgue-Maß und λ|G das Spurmaß von λ auf G bezeichne (siehe Bemerkung 3.8). Der folgende Satz zeigt elementare Eigenschaften des Lebesgue-Integrals, die sich relativ schnell aus der Definition ergeben.
64
3 Elemente der Maß- und Integrationstheorie
Satz 3.32. Seien f : X → R messbar und A ∈ A .
a) Sei zusätzlich f beschränkt (d. h. f ∈ B(X , A ; R)) und μ(X ) < ∞. Dann ist f ∈ L 1 (μ). b) Monotonie: Sind f , g ∈ L 1 (μ) mit f ≤ g, so ist f dμ ≤ g dμ. Speziell gilt: Ist a ≤ f (x) ≤ b (x ∈ A) und μ(A) < ∞, so gilt aμ(A) ≤ f dμ ≤ bμ(A). A
c) Ist A eine μ-Nullmenge, so gilt A f dμ = 0. d) Sind A, B ∈ A disjunkt und f ∈ L 1 (μ), so gilt A ∪˙ B f dμ = A f dμ + B f dμ. e) Ist f ∈ L 1 (μ), so ist f ∈ L 1 (A, μ| A ). f) Falls f ∈ L 1 (μ), so gilt μ({x ∈ X | f (x) = ±∞}) = 0, d. h. f ist μ-fast überall endlich. g) Seien f ∈ L 1 (μ) und g : X → R eine messbare Funktion mit f = g μ-fast überall. Dann ist g ∈ L 1 (μ) und f dμ = g dμ.
Beweis. a) Sei f ∈ B(X , A ; R). Dann existiert eine Konstante C > 0 mit | f | ≤ C und damit 0 ≤ f ± ≤ C. Für jede Stufenfunktion s mit 0 ≤ s ≤ f + erhält man s dμ ≤ Cμ(X ). Also gilt f + dμ ≤ Cμ(X ) < ∞. Analog sieht man f − dμ < ∞. b) Ist f ≤ g, so folgt f + ≤ g+ und f − ≥ g− . Für jede Stufenfunktion s mit 0 ≤ s ≤ f + gilt daher auch s ≤ g+ . Damit folgt f + dμ ≤ g+ dμ. Genauso sieht man f − dμ ≥ g− dμ und damit die erste Behauptung. Die zweite Behauptung sieht man nun mit a1 A ≤ f 1 A ≤ b1 A . c) Für jede Stufenfunktion s = kj=1 c j 1 A j mit 0 ≤ s ≤ f + gilt s dμ = A
k
c j μ(A ∩ A j ) = 0
j=1
wegen μ(A ∩ A j ) ≤ μ(A) = 0. Damit ist A f + dμ = 0. Analog folgt A f − dμ = 0. d) Die Gleichheit gilt nach Definition des Integrals für Stufenfunktionen. Für integrierbare Funktionen f ≥ 0 und Stufenfunktionen 0 ≤ s ≤ f gilt 0 ≤ s1 A ≤ f 1 A und 0 ≤ s1 B ≤ f 1 B , andererseits ist für zwei Stufenfunktionen s1 , s2 mit 0 ≤ s1 ≤ f 1 A und 0 ≤ s2 ≤ f 1 B auch s := s1 + s2 eine Stufenfunktion mit 0 ≤ s ≤ f . Geht
3.2
Messbare Funktionen und das Integral
65
man zum Supremum über, folgt die Behauptung für integrierbares f ≥ 0 und damit für f ∈ L 1 (μ). e) Für jede Stufenfunktion s = kj=1 c j 1 A j mit 0 ≤ s ≤ f + gilt s dμ = A
k
c j μ(A ∩ A j ) ≤
j=1
k
c j μ(A j ) =
s dμ.
j=1
Damit folgt A f + dμ ≤ f + dμ < ∞, analog für f − . f) Angenommen, für A := f −1 ({∞}) ∈ A gilt μ(A) > 0. Zu N ∈ N sei s N := N 1 A . Dann ist s N eine Stufenfunktion mit 0 ≤ s N ≤ f + und f + dμ ≥ s N dμ = N μ(A). Für N → ∞ erhält man f + dμ = ∞ im Widerspruch zu f ∈ L 1 (μ). Genauso sieht man μ({x ∈ X | f (x) = −∞}) = 0. g) Sei s eine Stufenfunktion mit 0 ≤ s ≤ g+ . Wir definieren N := {x ∈ X | f (x) = g(x)} und erhalten s dμ = s dμ + s dμ ≤ f + dμ ≤ f + dμ, X \N
X \N
N
wobei μ(N ) = 0 und Teil c) verwendet wurden. Somit gilt g+ dμ ≤ f + dμ < ∞. Analog zeigt man g− dμ ≤ f − dμ < ∞, und es folgt g ∈ L 1 (μ). Wieder mit c) sieht man f dμ = f dμ = g dμ = g dμ. X \N X \N Beispiel 3.33
a) Da Q eine λ-Nullmenge ist, folgt 1Q (x) dx = λ(Q) = 0. Dies ist ein Beispiel für eine Funktion, die integrierbar im Sinn von Lebesgue ist (sogar eine Stufenfunktion), aber nicht integrierbar im Sinne des Riemann-Integrals (wir werden dies in Bemerkung 3.41 diskutieren). b) Sei f : R → R, x → x. Dann ist f stetig und damit (Borel-)messbar. Um [0,a] f (x) dx für a > 0 zu berechnen, betrachten wir die Stufenfunktion s N : R → R, x →
N a(n − 1) n=1
N
1 a(n−1) N
, an N
(x).
Dann gilt s N (x) ≤ x an jeder Stelle x ∈ [0, a] und damit s N ≤ f 1[0,a] . Für das Integral erhalten wir
N N −1 N a2 a2 a2 N − 1 a a(n − 1) s N (x) dx = = 2 . (n − 1) = 2 k= N N N N 2 N n=1
Andererseits gilt für die Stufenfunktion
n=1
k=1
66
3 Elemente der Maß- und Integrationstheorie
s˜ N : R → R, x →
N an n=1
N
1( a(n−1) , an ] (x) N
N
die Abschätzung s˜ N (x) ≥ x = f (x) für alle x ∈ [0, a]. Genauso wie oben berechnet 2 man s˜N (x) dx = a2 NN+1 . Mit der Monotonie des Integrals (Satz 3.32 b)) folgt a 2 (N − 1) = 2 N
s N (x) dx ≤
[0,a]
f (x) dx ≤
s˜ N (x) dx =
a2 N + 1 . 2 N
2
Für N → ∞ erhält man [0,a] f (x) dx = a2 . Wie auch dieses Beispiel zeigt, ist die Definition des Lebesgue-Integrals für eine direkte Berechnung des Integralwertes weniger geeignet, dafür ist diese Definition sehr gut, um Beweise durchzuführen. Im Wesentlichen müssen die Eigenschaften nur für Stufenfunktionen gezeigt werden, wenn geeignete Grenzwertaussagen zur Verfügung stehen. c) Das folgende Beispiel zeigt, dass auch Summen als Spezialfall von allgemeinen Lebesgue-Integralen auftreten können. Wir betrachten den Maßraum (X , A , P) aus Beispiel 3.6 c), der das Würfeln mit einem fairen Würfel beschreibt. Es gelte also X = {1, . . . , 6}, A = P (X ) und P(A) = |A| 6 für A ∈ A . Da als σ -Algebra die Potenzmenge gewählt wird, ist jede Abbildung f : X → R messbar, und da X endlich ist, sogar eine Stufenfunktion. Für f (x) = x erhält man wegen f = 6k=1 k1{k} für das Integral 6 6 7 1 f (x) dP(x) = f (k)P({k}) = k = . 6 2 k=1
k=1
Aus stochastischer Sicht entspricht dies gerade dem Erwartungswert für das Ergebnis beim einmaligen Würfeln, d. h. als Mittelwert des Ergebnisses bei vielen Wiederholungen wird man den Wert 27 erwarten. Teil c) des folgenden Satzes ist auch als Majorantenkriterium bekannt. Satz 3.34. Sei f : X → R messbar.
a) Ist f ≥ 0 mit f dμ = 0, so ist f = 0 μ-fast überall. b) Es gilt f ∈ L 1 (μ) genau dann, wenn | f | ∈ L 1 (μ) gilt. In diesem Fall ist f dμ ≤ | f | dμ. (3.6) c) Sei g ∈ L 1 (μ) mit | f | ≤ g μ-fast überall. Dann ist f ∈ L 1 (μ).
3.2
Messbare Funktionen und das Integral
67
Beweis. a) Wir schreiben ˙ ∞
{x ∈ X | f (x) = 0} =
x∈X
j=1
1 1 ˙ {x ∈ X | f (x) ≥ 1}. ≤ f (x) < ∪ j +1 j
Falls μ({x ∈ X | f (x) = 0}) > 0, so hat wegen der σ -Additivität von μ eine der Mengen auf der rechten Seite positives Maß, und damit folgt nach Satz 3.32 b) f dμ > 0. b) Die Mengen A := {x ∈ X | f (x) ≥ 0} und B := {x ∈ X | f (x) < 0} sind messbar, ebenso die Funktion | f |. Nach Satz 3.32 d) gilt | f | dμ + | f | dμ = f + dμ + f − dμ < ∞. | f | dμ = A
B
Die Abschätzung (3.6) folgt aus −| f | ≤ f ≤ | f | und der Monotonie des Integrals (Satz 3.32 b)). c) Nach Änderung auf einer Nullmenge, welche nach Satz 3.32 g) die Integrale nicht ändert, können wir ohne Einschränkung | f | ≤ g annehmen. Dann ist f − ≤ g und f + ≤ g und somit f ± dμ < ∞. Der Vorteil des soeben definierten Lebesgue-Integrals liegt zum einen an der großen Allgemeinheit (so werden etwa beliebige Maße zugelassen), zum anderen an starken Konvergenzaussagen. Die folgenden Aussagen, bei denen wir auf einen Beweis verzichten (siehe dazu etwa [11, Abschn. 2.2]), bilden den Kern der Lebesgueschen Integrationstheorie. Satz 3.35 (Linearität des Integrals). Seien f 1 , f 2 ∈ L 1 (μ), α1 , α2 ∈ R. Dann ist
α1 f 1 + α2 f 2 ∈ L 1 (μ) und (α1 f 1 + α2 f 2 ) dμ = α1 f 1 dμ + α2 f 2 dμ.
Satz 3.36 (Satz von Lebesgue über monotone Konvergenz). Sei ( f k )k∈N eine Folge
messbarer Funktionen f k : X → [0, ∞] mit 0 ≤ f 1 ≤ f 2 ≤ . . . , und sei f : X → [0, ∞] definiert durch f (x) := limk→∞ f k (x) (x ∈ X ). Dann gilt f k dμ = lim f dμ = lim f k dμ. k→∞
k→∞
68
3 Elemente der Maß- und Integrationstheorie
Satz 3.37. Sei ( f k )k∈N eine Folge messbarer Funktionen f k : X → [0, ∞], und sei
f : X → [0, ∞] definiert durch f :=
∞
k=1 f k .
f dμ =
∞
Dann gilt
f k dμ.
k=1
Falls f k ∈ L 1 (μ) (k ∈ N) und die Summe auf der rechten Seite konvergiert, so gilt ∞ f ∈ L 1 (μ), und die Reihe k=1 f k (x) konvergiert für μ-fast alle x ∈ X .
Satz 3.38 (Lemma von Fatou). Sei ( f k )k∈N eine Folge
messbarer Funktionen f k : X → [0, ∞], und sei f : X → [0, ∞] definiert durch f := lim inf k→∞ f k . Dann gilt f k dμ. f dμ ≤ lim inf k→∞
Der folgende Satz ist einer der wichtigsten Sätze der Integrationstheorie und heißt auch Satz von Lebesgue über dominierte Konvergenz. Satz 3.39 (Satz von Lebesgue über majorisierte Konvergenz). Sei ( f k )k∈N eine Folge
messbarer Funktionen f k : X → R, und der Grenzwert f (x) := limk→∞ f k (x) ∈ R existiere μ-fast überall . Weiter existiere eine Funktion g ∈ L 1 (μ) mit | f k (x)| ≤ g(x) für μ-fast alle x ∈ X und alle k ∈ N. Dann ist f ∈ L 1 (μ) und f k dμ = lim lim f k dμ. k→∞
k→∞
Mit Hilfe des letzten Satzes kann man folgende Aussage über parameterabhängige Integrale zeigen. Satz 3.40 (Satz über parameterabhängige Integrale). Seien U ⊂ Rn offen und f : X ×
U → R, (x, u) → f (x, u), eine Funktion. Für alle u ∈ U sei die Abbildung X → R, x → f (x, u) μ-integrierbar. Definiere
3.2
Messbare Funktionen und das Integral
69
g : U → R, g(u) :=
f (x, u) dμ(x).
a) Für alle x ∈ X sei die Funktion U → R, u → f (x, u) stetig an der Stelle u 0 ∈ U , und es existiere eine μ-integrierbare Funktion h : X → [0, ∞] mit | f (x, u)| ≤ h(x) ((x, u) ∈ X × U ). Dann ist auch g stetig an der Stelle u 0 . b) Für alle x ∈ X sei die Funktion U → R, u → f (x, u) stetig differenzierbar in U , und es existiere eine μ-integrierbare Funktion h : X → [0, ∞] mit ∂f ≤ h(x) ((x, u) ∈ X × U , j = 1, . . . , n). (x, u) ∂u j Dann ist auch g stetig differenzierbar in U , und es gilt für alle u ∈ U ∂g ∂f (u) = (x, u) dμ(x) ( j = 1, . . . , n). ∂u j ∂u j
Beweis. a) Für jede Folge (u k )k∈N ⊆ U mit u k → u 0 gilt f (·, u k ) → f (·, u 0 ) punktweise (bzgl. x ∈ X ). Nach Voraussetzung ist h eine integrierbare Majorante von ( f (·, u k ))k∈N , und die Aussage folgt mit dem Satz über majorisierte Konvergenz, Satz 3.39. b) Seien j ∈ {1, . . . , n} und (tk )k∈N ⊆ R eine Folge mit tk → 0, tk = 0. Dann konvergiert f (·, u + tk e j ) − f (·, u) ∂f → (·, u) (k → ∞) tk ∂u j punktweise bzgl. x ∈ X , wobei e j den j-ten Einheitsvektor in Rn bezeichne. Nach dem Mittelwertsatz der Differentialrechnung ist die Funktionenfolge auf der linken Seite majorisiert durch h. Damit folgen die Differenzierbarkeit von g mit dem Satz über ∂g majorisierte Konvergenz und die Stetigkeit von ∂u mit Teil a). j Die Sätze über monotone Konvergenz und majorisierte Konvergenz sind in vielen Anwendungen nützlich. Wir erwähnen hier zwei weitere Folgerungen. Bemerkung 3.41. a) Sei f : X → [0, ∞] messbar. Dann existiert nach Satz 3.30 a) eine monoton steigende Folge (sk )k∈N von Stufenfunktionen mit sk (x) → f (x) (x ∈ X ). Nach dem Satz über monotone Konvergenz folgt
70
3 Elemente der Maß- und Integrationstheorie
f (x) dμ(x) = lim
k→∞
sk (x) dμ(x) ∈ [0, ∞].
Somit hätte man etwa in Beispiel 3.33 b) auf die Betrachtung der oberen Schranke s˜ N verzichten können, wenn man für die untere Schranke die monoton wachsende Teilfolge (s2 N ) N ∈N wählt. b) Sei X = N, versehen mit der σ -Algebra A := P (N) und dem Zählmaß ζ : P (N) → [0, ∞], gegeben durch ζ (A) := |A| (siehe Beispiel 3.6 b)). Dann ist jede Funktion f : N → R eine Folge (an )n∈N , wobei an := f (n). Da A die Potenzmenge ist, ist jede solche Funktion messbar. Nach Satz 3.34 b) ist f genau dann integrier bar, falls | f | integrierbar ist, d. h. falls | f | dζ < ∞ gilt. Für die Stufenfunktionen N s N := n=1 | f (n)|1{n} gilt s N (x) | f (x)| (N → ∞) für alle x ∈ N. Mit dem Satz über monotone Konvergenz folgt
| f (x)| dζ (x) = lim
N →∞
=
∞ n=1
s N (x) dζ (x) = lim
| f (n)| =
N →∞
∞
N
| f (n)|ζ ({n})
n=1
|an |
n=1
(vergleiche auch Beispiel 3.33 c)). Damit ist f genau dann integrierbar bzgl. ζ , wenn die Folge (an )n∈N ⊆ R mit an := f (n) absolut konvergiert, und in diesem Fall ist f (x) dζ (x) =
∞
an .
n=1
Man beachte, dass die Konvergenz der Reihe nicht für die Integrierbarkeit ausreicht. So n ist etwa die Funktion f : N → R, n → (−1) nicht integrierbar bzgl. ζ , obwohl die n ∞ (−1)n Reihe n=1 n konvergiert. Bemerkung 3.42 (Riemann-Integral). Die Konstruktion des Lebesgue-Integrals verwendet Stufenfunktionen der Form s = kj=1 c j 1 A j mit A j ∈ A . Da die Mengen A j kompliziert sein können, erhält man eine große Zahl von Stufenfunktionen – so ist z. B. 1Q eine Stufenfunktion bezüglich der Borel-σ -Algebra B (R) – und damit einen recht allgemeinen Integralbegriff. Im Gegensatz dazu betrachtet man beim (eindimensionalen) Riemann-Integral Zerlegungen des Integrationsbereichs in Intervalle und kann dadurch auf das Konzept der σ -Algebra verzichten, erhält aber einen weniger allgemeinen Integralbegriff. Wir wollen diesen Zugang kurz erläutern, wobei wir nicht die ursprüngliche Definition nach Riemann verwenden, sondern einen äquivalenten Zugang über das Darboux-Integral wählen. Seien a, b ∈ R mit a < b, und sei f : [a, b] → R eine beschränkte Funktion. Wir betrachten eine Partition π = (t0 , t1 , . . . , tk ) von [a, b], d. h. es gelte k ∈ N und a = t0 < t1 < . . . < tk = b.
3.2
Messbare Funktionen und das Integral
71
Zu f und π definiert man die obere und untere Darboux-Summe durch O f ,π :=
k (t j − t j−1 ) j=1
U f ,π :=
k (t j − t j−1 ) j=1
sup
f (x),
inf
f (x).
x∈[t j−1 ,t j ]
x∈[t j−1 ,t j ]
Man beachte, dass O f ,π und U f ,π als Integrale von Stufenfunktionen im Sinne von Definition 3.31 aufgefasst werden können. So gilt etwa O f ,π = [a,b] s dλ mit s = k j=1 c j 1(t j−1 ,t j ) , wobei c j := supx∈[t j−1 ,t j ] f (x). Das Ober- und Unterintegral von f sind definiert als O f := inf O f ,π | π ist eine Partition von [a, b] , U f := sup U f ,π | π ist eine Partition von [a, b] . Die Funktion f heißt Riemann-integrierbar (äquivalent: Darboux-integrierbar), falls O f = U f gilt, und in diesem Fall heißt
b
f (x) dx := O f = U f
a
das Riemann-Integral von f . Man sieht leicht, dass alle stetige Funktionen f : [a, b] → R Riemann-integrierbar sind. Man kann zeigen (siehe etwa [17, Abschn. IV.6]), dass jede Riemann-integrierbare Funktion f : [a, b] → R nach eventueller Änderung auf einer Lebesgue-Nullmenge auch Lebesgueintegrierbar ist und die beiden Integrale übereinstimmen. Dabei kann die Änderung auf einer Nullmenge für die Borel-Messbarkeit notwendig sein, siehe [17, Beispiel IV.6.2 c)]. Die Funktion f : [a, b] → R, x → 1Q (x) ist ein Beispiel für eine Lebesgue-integrierbare Funktion, welche nicht Riemann-integrierbar ist (denn es gilt O f = b − a und U f = 0). Analog kann man das Riemann-Integral für Funktionen f : Rn → R definieren, wobei Partitionen von mehrdimensionalen Intervallen betrachtet werden. Zum Abschluss dieses Abschnitts wollen wir noch zwei nützliche Sätze aus der Integrationstheorie ohne Beweis zitieren. Der erste davon, der Satz von Fubini, behandelt iterierte Integrale. Obwohl dieser Satz auch wesentlich allgemeiner gilt, beschränken wir uns hier auf das Lebesgue-Maß. Im folgenden Satz seien λn : B (Rn ) → [0, ∞] das n-dimensionale Lebesgue-Maß und L 1 (Rn ) die bezüglich λn integrierbaren Funktionen.
72
3 Elemente der Maß- und Integrationstheorie
Satz 3.43 (Satz von Fubini). Seien n, m ∈ N und f ∈ L 1 (Rn+m ). Dann ist für fast
alle y ∈ Rm die Funktion Rn → R, x → f (x, y) integrierbar bezüglich λn , und die Funktion f (x, y) dλn (x) Rm → R, y → Rn
ist λm -integrierbar. Weiter gilt f (x, y) dλn+m (x, y) = Rn+m
Rm
Rn
f (x, y) dλn (x)
dλm (y).
Ein Beweis (der allgemeinen Version) ist etwa in [4, §23], zu finden. Der zweite Satz ist das mehrdimensionale Analagon der Integration durch Substitution, der Transformationssatz für das Lebesgue-Integral. Man beachte, dass eine Abbildung Φ : U → V zwischen zwei offenen Mengen U , V ⊆ Rn ein C 1 -Diffeomorphismus heißt, falls Φ bijektiv und stetig differenzierbar ist und die Umkehrabbildung Φ −1 : V → U ebenfalls stetig differenzierbar ist. Ein Beweis der folgenden Aussage steht z. B. in [11, Satz 3.17]. Satz 3.44 (Transformationssatz). Seien U , V ⊆ Rn offen und Φ : U → V ein
C 1 -Diffeomorphismus. Eine messbare Funktion f : V → R ist über V = Φ(U ) genau dann λ-integrierbar, wenn ( f ◦ Φ) | det Φ | : U → R λ-integrierbar über U ist. In diesem Fall gilt
f (y) dy = f Φ(x) | det Φ (x)| dx. Φ(U )
U
Bemerkung 3.45. In symbolischer Schreibweise schreibt man diesen Satz oft in der Form y = Φ(x) und dy = | det Φ (x)| dx. Man kann im obigen Integral den (symbolischen) Ausdruck dy auf der linken Seite durch | det Φ (x)| dx ersetzen und den Integrationsbereich entsprechend anpassen und erhält dann die rechte Seite. Falls n = 1, erhält man die bekannte Substitutionsregel Φ(b) b f (y) dy = f (Φ(x))Φ (x) dx, Φ(a)
a
in diesem Fall taucht der Betrag bei Φ (x) nicht auf, da das Vorzeichen durch die Reihenfolge der Integralgrenzen berücksichtigt wird.
3.3
Der Hilbertraum aller quadratintegrierbaren Funktionen
73
Beispiel 3.46
Ein typisches Beispiel für den Transformationssatz ist die Verwendung von Polarkoordinaten in R2 . Hier betrachtet man die geschlitzte Ebene V := R2 \ {(x1 , 0) | x1 ≥ 0} und den C 1 -Diffeomorphismus r r cos ϕ Φ : (0, ∞) × (0, 2π ) → V , → . ϕ r sin ϕ Es gilt det Φ (r , ϕ) = det
cos ϕ −r sin ϕ sin ϕ r cos ϕ
= r.
Da die Menge N := {(x1 , 0)| x1 ≥ 0} eine Lebesgue-Nullmenge ist, erhalten wir für integrierbare Funktionen f ∈ L 1 (R2 ) mit dem Transformationssatz R2
∞ 2π
f (x) dx = 0
f (r cos ϕ, r sin ϕ) r dϕ dr .
0
Als Beispiel betrachten wir f (x) := e−α|x| (x ∈ R2 ) mit α > 0 und erhalten ! ∞ 2π 2 ∞ e−αr π −α|x|2 −αr 2 e dx = e r dϕ dr = 2π − = . 2α α 0 0 R2 2
r =0
Wegen
R2
liefert dies
e−α|x| dx = 2
2
R R
2
e−αz dz = 2
R
3.3
e−αx1 e−αx2 dx1 dx2 = "
R
e−αz dz 2
2
π . α
Der Hilbertraum aller quadratintegrierbaren Funktionen
Mit Hilfe des Lebesgue-Integrals kann nun der Hilbertraum L 2 (μ) aller bezüglich des Maßes μ quadratintegrierbaren Funktionen definiert werden. Insbesondere der Raum L 2 (Rn ) spielt in der Quantenmechanik eine zentrale Rolle. Da die auftretenden Funktionen typischerweise komplexwertig sind, beginnen wir mit der entsprechenden Definition des Integrals. Im Folgenden sei wieder (X , A , μ) ein Maßraum. Bemerkung 3.47. Die Messbarkeit einer Funktion f : X → C ist wie üblich als BorelMessbarkeit definiert (also A -B (C)-Messbarkeit). Dabei ist die Norm auf C = R2 die euklidische Norm auf R2 , und es gilt B (C) = B (R2 ). Eine Funktion f : X → C ist genau dann messbar, wenn Re f , Im f : X → R beide messbar sind. Denn falls f messbar ist,
74
3 Elemente der Maß- und Integrationstheorie
so sind auch Re f und Im f messbar, da die Abbildungen z → Re z und z → Im z stetig und damit Borel-messbar sind. Falls umgekehrt Re f und Im f messbar sind, so folgt die Messbarkeit von f aus Korollar 3.24. Definition 3.48. Eine Funktion f : X → C heißt integrierbar, falls Re f ∈ L 1 (μ) und Im f ∈ L 1 (μ) gilt. Wir schreiben f ∈ L 1 (μ; C) oder f ∈ L 1 (X ; C). Für f ∈ L 1 (μ; C) wird f dμ definiert durch f dμ := Re f dμ + i Im f dμ. Bemerkung 3.49. Nach dieser Definition und Satz 3.34 b) ist f : X → C genau dann inte grierbar, falls Re f und Im f beide messbar sind und |Re f | dμ < ∞ sowie |Im f | dμ < ∞ gelten. Dies ist äquivalent dazu, dass f : X → C messbar ist (siehe Bemerkung 3.47) und | f | dμ < ∞ gilt. Das folgt sofort aus dem Majorantenkriterium (Satz 3.34 c)) und den Ungleichungen |Re f | ≤ | f |, |Im f | ≤ | f | und | f | ≤ |Re f | + |Im f |. c) Die obigen Sätze der Integrationstheorie gelten genauso für komplexwertige Funktionen, wobei die Aussagen, welche die Ordnung verwenden (wie etwa das Lemma von Fatou oder der Satz über monotone Konvergenz) nicht übertragbar sind, da der Körper C keine vollständige Ordnung besitzt. Definition 3.50 (L p -Räume). a) Für p ∈ [1, ∞) definiert man L p (μ; C) als die Menge aller messbaren Funktionen f : X → C mit 1/ p p | f | dμ < ∞. f L p (μ) := Für Funktionen f : X → R (oder auch für R-wertige Funktionen) werden die entsprechenden Funktionenräume mit L p (μ; R) bezeichnet. Im Folgenden schreiben wir kurz L p (μ) für L p (μ; K), wobei K ∈ {R, C}. Falls G ⊆ Rn eine messbare Menge ist, so setzt man wieder L p (G) := L p (λ|G ), wobei λ|G die Einschränkung des ndimensionalen Lebesgue-Maßes auf die Menge G ist. b) Der Raum L ∞ (μ) ist definiert als die Menge aller messbaren Funktionen f : X → C, für welche ein c > 0 existiert mit μ({x ∈ X | | f (x)| > c}) = 0. In diesem Fall definiert man
f L ∞ (μ) := inf c > 0 μ x ∈ X | f (x)| > c = 0 . Neben den integrierbaren Funktionen L 1 (μ) ist insbesondere der Raum L 2 (μ) von Bedeutung. Lemma 3.51. Der Raum L 2 (μ) ist ein K-Vektorraum.
3.3
Der Hilbertraum aller quadratintegrierbaren Funktionen
75
Beweis. Seien f , g ∈ L 2 (μ). Dann ist offensichtlich für alle α ∈ K auch wieder α f ∈ L 2 (μ), und die Funktion f + g ist wieder messbar. Mit Hilfe der elementaren Ungleichung (a + b)2 ≤ 2a 2 + 2b2 für a, b ≥ 0 sieht man 2 2 f + g L 2 (μ) = | f (x) + g(x)| dμ(x) ≤ 2 (| f (x)|2 + |g(x)|2 ) dμ(x) = 2 f 2L 2 (μ) + 2g2L 2 (μ) < ∞, und damit gilt auch f + g ∈ L 2 (μ).
Bemerkung 3.52. a) Die Abbildung f → f L 2 (μ) ist im Allgemeinen keine Norm. Denn falls ∅ = A ∈ A eine μ-Nullmenge ist, so ist f := 1 A eine Funktion mit f = 0 und f L 2 (μ) = 0 (vergleiche Satz 3.32 c)). b) Auch für p = 2 kann man zeigen, dass L p (μ) ein Vektorraum ist. Wie für p = 2 ist auch · L p (μ) keine Norm, da f L p (μ) = 0 für alle Funktionen gilt, welche μ-fast überall gleich Null sind. Wie die letzte Bemerkung zeigt, sollten Funktionen, welche sich nur um eine Nullmenge unterscheiden, im Sinne von · L p (μ) identifiziert werden. Daher geht man zu Äquivalenzklassen über. Definition 3.53. a) Sei p ∈ [1, ∞]. Definiere auf L p (μ) die Äquivalenzrelation ∼ durch f ∼g
:⇐⇒
μ {x ∈ X | f (x) = g(x)} = 0
(d. h. durch Gleichheit μ-fast überall). Die Menge der Äquivalenzklassen {[ f ] | f ∈ L p (μ)} wird mit L p (μ) bezeichnet. Der Raum L 2 (μ) heißt auch Raum aller bezüglich μ quadratintegrierbaren Funktionen. Auf L p (μ) wird repräsentantenweise eine Vektorraumstruktur definiert durch α[ f ] := [α f ] und [ f ] + [g] := [ f + g] für α ∈ K und f , g ∈ L p (μ). Man beachte in dieser Definition, dass die Skalarmultiplikation und die Addition wohldefiniert sind, d. h. nicht von der Wahl des Repräsentanten abhängen: Seien f 1 , f 2 ∈ L p (μ) mit [ f 1 ] = [ f 2 ], d. h. f 1 ∼ f 2 . Für α ∈ K \ {0} gilt dann
μ {x ∈ X | α f 1 (x) = α f 2 (x)} = μ {x ∈ X | f 1 (x) = f 2 (x)} = 0 und damit [α f 1 ] = [α f 2 ]. Analog folgt die Wohldefiniertheit der Addition.
76
3 Elemente der Maß- und Integrationstheorie
Bemerkung 3.54. a) Man definiert das Integral für eine Äquivalenzklasse [ f ] ∈ L 1 (μ) durch [ f ] dμ := f dμ. Da sich zwei Repräsentanten von [ f ] nur auf einer μ-Nullmenge unterscheiden, zeigt Satz 3.32 g), dass das Integral auf der rechten Seite nicht von der Wahl des Repräsentanten abhängt. b) Im Folgenden wird in der Schreibweise nicht mehr zwischen [ f ] und f unterschieden. Wichtig ist bei dieser Betrachtung, dass es für „Funktionen“ f ∈ L p (μ) im Allgemeinen keinen Sinn macht, vom Wert f (x) an einer Stelle x ∈ X zu sprechen. Denn falls μ({x}) = 0, so kann man den Repräsentanten f an der Stelle x ändern, ohne die Äquivalenzklasse zu ändern. Für a, b ∈ R mit a < b unterscheiden sich die Mengen (a, b) und [a, b] nur auf einer Lebesgue-Nullmenge, daher gilt für f ∈ L 1 ((a, b)) die Gleichheit [a,b]
f (x) dx =
(a,b)
f (x) dx =:
b
f (x) dx.
a
Satz 3.55. Die Abbildung ·, · L 2 (μ) : L 2 (μ) × L 2 (μ) → K, definiert durch
f , g L 2 (μ) :=
f (x)g(x) dμ(x) ( f , g ∈ L 2 (μ))
(3.7)
ist wohldefiniert und ein Skalarprodukt auf L 2 (μ). Damit wird L 2 (μ) zu einem Hilbertraum.
Beweis. (i) Wir zeigen zunächst, dass ·, · L 2 (μ) ein Skalarprodukt ist. Seien f , g ∈ L 2 (μ), und seien f 0 , g0 ∈ L 2 (μ) zugehörige Repräsentanten, d. h. es gilt f = [ f 0 ] und g = [g0 ]. Dann ist die Abbildung x → f 0 (x)g0 (x) nach Satz 3.27 c) wieder messbar, und die elementare Abschätzung ab ≤ a 2 + b2 für a, b ≥ 0 zeigt | f 0 (x)g0 (x)| dμ(x) ≤ (| f 0 (x)|2 +|g0 (x)|2 ) dμ(x) = f 0 2L 2 (μ) +g0 2L 2 (μ) < ∞. Damit ist das Integral in (3.7) mit Wert in K definiert. Man sieht auch sofort, dass der Integrand in (3.7) sich bei Übergang zu anderen Repräsentanten nur auf einer Nullmenge ändert und daher das Skalarprodukt als Abbildung auf L 2 (μ) × L 2 (μ) wohldefiniert ist.
3.3
Der Hilbertraum aller quadratintegrierbaren Funktionen
77
Offensichtlich ist die Abbildung L 2 (μ) → K, f → f , g L 2 (μ) linear, und es gilt f , g L 2 (μ) = g, f L 2 (μ) für alle f , g ∈ L 2 (μ). Sei f ∈ L 2 (μ) mit f , f = 0, und sei f 0 ∈ L 2 (μ) mit f = [ f 0 ]. Dann gilt f 0 , f 0 = | f 0 |2 dμ = 0. Nach Satz 3.34 folgt | f 0 |2 = 0 μ-fast überall und somit f 0 = 0 μ-fast überall. Somit ist f = [ f 0 ] = 0, und wir haben alle Eigenschaften eines Skalarprodukts nachgewiesen. Insbesondere wird nach Lemma 2.6 durch 1/2 2 f L 2 (μ) := | f (x)| dμ(x) ( f ∈ L 2 (μ)) eine Norm definiert. (ii) Wir zeigen, dass L 2 (μ) vollständig ist. Sei ( f k )k∈N ⊆ L 2 (μ) eine Cauchyfolge. Wähle eine Teilfolge ( f k j ) j∈N mit f k j+1 − f k j L 2 (μ) ≤ 2− j ( j ∈ N) und definiere für ∈ N und x ∈ X die Funktionen g , g : X → [0, ∞] durch g (x) :=
| f k j+1 (x) − f k j (x)|, g(x) :=
j=1
∞
| f k j+1 (x) − f k j (x)|.
j=1
Man beachte hier, dass die Funktionen g und g von der Wahl der Repräsentanten von f k j abhängen und damit nur bis auf Nullmengen eindeutig definiert sind. Aus der Dreiecksungleichung für die Norm · L 2 (μ) folgt g L 2 (μ) ≤
f k j+1 − f k j L 2 (μ) ≤
j=1
2− j ≤ 1,
j=1
und nach dem Satz von der monotonen Konvergenz gilt 2 2 2 |g (x)|2 dμ ≤ 1. g L 2 (μ) = |g(x)| dμ(x) = lim |g (x)| dμ(x) = lim →∞
→∞
Nach Satz 3.32 f) ist g μ-fast überall endlich, und damit ist die Reihe f (x) := f k1 (x) +
∞ ( f k j+1 (x) − f k j (x)) j=1
für μ-fast alle x ∈ X absolut konvergent. Somit gilt f = lim j→∞ f k j μ-fast überall. Man definiert noch f (x) := 0, falls die obige Reihe nicht konvergiert. Die Funktion f ist als punktweiser Grenzwert messbarer Funktionen messbar. Wir zeigen f − f k L 2 (μ) → 0 (k → ∞). Sei ε > 0. Dann existiert ein N ∈ N mit f k − f L 2 (μ) < ε für alle k, ≥ N . Nach dem Lemma von Fatou ist für k ≥ N
78
3 Elemente der Maß- und Integrationstheorie
| f (x) − f k (x)| dμ(x) = 2
lim | f k j (x) − f k (x)|2 dμ(x) ≤ lim inf | f k j (x) − f k (x)|2 dμ(x) ≤ ε2 . j→∞
j→∞
Insbesondere ist f − f k ∈ L 2 (μ) und damit f = f k + ( f − f k ) ∈ L 2 (μ), und es gilt f k → f in L 2 (μ). Daher ist L 2 (μ) vollständig und somit ein Hilbertraum.
Korollar 3.56. Sei ( f k )k∈N ⊆ L 2 (μ) eine Folge mit f k → f ∈ L 2 (μ) (k → ∞).
Dann besitzt ( f k )k∈N eine Teilfolge, welche μ-fast überall gegen f konvergiert.
Beweis. Das wurde im Beweis von Satz 3.55 mit gezeigt.
Bemerkung 3.57. a) Der Trick im obigen Beweis besteht darin, aus der gegebenen Cauchyfolge ( f k )k∈N eine Teilfolge ( f k j ) j∈N so auszuwählen, dass f k j+1 − f k j bezüglich · L 2 (μ) schneller gegen Null konvergiert („Turbo-Teilfolge“). Wir haben den Beweis der Vollständigkeit nur für den Fall p = 2 durchgeführt, er funktioniert aber ganz ähnlich für alle p ∈ [1, ∞). Allerdings muss man dafür zunächst die Dreiecksungleichung in L p (μ) zeigen, welche im Hilbertraum-Fall p = 2 aus den Eigenschaften des Skalarprodukts folgt. Im Fall p = ∞ beweist man die Vollständigkeit unter Verwendung der gleichmäßigen Konvergenz mit Beachtung der Nullmengen. Somit erhält man für alle p ∈ [1, ∞] den Banachraum L p (μ). Lemma 3.58. Die Menge aller Stufenfunktionen s : X → K, d. h. aller Funktionen der Form s = kj=1 c j 1 A j mit c j ∈ K und A j ∈ A , liegt dicht in L 2 (μ). Genauer existiert zu jedem f = [ f 0 ] ∈ L 2 (μ) eine Folge (sn )n∈N von Stufenfunktionen mit sn (x) → f 0 (x) (n → ∞) für alle x ∈ X und sn − f 0 L 2 (μ) → 0 (n → ∞). Dabei kann man die Folge so wählen, dass |sn (x)| | f 0 (x)| (n → ∞) für alle x ∈ X gilt.
Beweis. Wir approximieren (Re f 0 )+ und (Re f 0 )− wie im Beweis von Satz 3.30 punktweise durch eine monoton wachsende Folge (sn+ )n∈N bzw. (sn− )n∈N von Stufenfunktionen. Für sn := sn+ − sn− gilt dann sn → Re f 0 (n → ∞) punktweise und |sn (x)| |Re f 0 (x)| (n → ∞) für alle x ∈ X . Falls K = C, verwendet man dieselbe Konstruktion für den Imaginärteil und erhält eine Folge (sn )n∈N von Stufenfunktionen mit sn → Im f 0 (n → ∞) punktweise
3.3
Der Hilbertraum aller quadratintegrierbaren Funktionen
79
und |sn | |Im f 0 | (n → ∞). Damit gilt für sn := sn + isn die punktweise Konvergenz sn → f 0 und |sn (x)| | f 0 (x)| (n → ∞) für alle x ∈ X . Also erhalten wir |sn (x) − f 0 (x)| → 0 (n → ∞) sowie |sn − f 0 | ≤ 2| f 0 |. Mit majorisierter Konvergenz folgt sn − f 0 2L 2 (μ) = |sn (x) − f 0 (x)|2 dμ(x) → 0 (n → ∞), wobei 4| f 0 |2 eine integrierbare Majorante ist.
Beispiel 3.59
a) Seien X = {1, . . . , n}, A := P (X ) und ζ : P (X ) → [0, ∞) das Zählmaß, d. h. ζ (A) := |A|. Dann sind alle Funktionen f : X → K messbar, und jede Funktion f ist gegeben durch das Tupel ( f ( j)) j=1,...,n ∈ Kn . Für zwei Funktionen f , g : X → K erhält man das Skalarprodukt f , g L 2 (ζ ) =
f (x)g(x) dζ (x) =
n
f ( j)g( j) .
j=1
Damit ist L 2 (ζ ) = Kn mit dem kanonischen Skalarprodukt und der zugehörigen euklidischen Norm. b) Häufig auftretende Hilberträume sind L 2 (Rn ) sowie L 2 (G) für eine messbare Teilmenge G ⊆ Rn , wobei hier jeweils das Lebesgue-Maß zugrunde gelegt wird. Als letztes Beispiel können wir den Beweis von Bemerkung 2.47 nachtragen. Korollar 3.60. Der Folgenraum 2 ist ein Hilbertraum.
Beweis. Wir wählen X := N, A := P (X ) und als Maß das Zählmaß ζ über N. Dann gilt (vergleiche Bemerkung 3.41 b)) L 2 (ζ ) =
∞ f : N → K | f ( j)|2 < ∞ , j=1
und das Skalarprodukt für zwei Funktionen f , g ∈ L 2 (ζ ) ist gegeben durch f , g L 2 (ζ ) =
∞ j=1
f ( j)g( j) ( f , g ∈ L 2 (ζ )).
80
3 Elemente der Maß- und Integrationstheorie
Da die Funktionen f : N → K gerade die Folgen ( f ( j)) j∈N ⊆ K sind, gilt somit L 2 (ζ ) = 2 als Mengen, und die Skalarprodukte auf L 2 (ζ ) und 2 sind identisch (und damit auch die Normen). Nach Satz 3.55 ist 2 = L 2 (ζ ) ein Hilbertraum.
Was haben wir gelernt? • Maße sind auf σ -Algebren definiert, der Maßbegriff beinhaltet sowohl Wahrscheinlichkeitsmaße als auch das Lebesgue-Maß und ist deshalb nützlich in Analysis und Stochastik. Für das Lebesgue-Maß betrachtet man die Borel-σ -Algebra. • Das allgemeine Lebesgue-Integral ist definiert als Grenzwert von Integralen über Stufenfunktionen und besitzt gute Konvergenzeigenschaften. Wichtige Sätze der Integrationstheorie sind der Satz über monotone Konvergenz, der Satz über majorisierte Konvergenz und der Satz von Fubini. • Für jedes Maß μ kann man den Hilbertraum L 2 (μ) definieren. Wählt man für μ das n-dimensionale Lebesgue-Maß auf B (Rn ), so erhält man den Raum L 2 (Rn ), der in der Quantenmechanik eine wichtige Rolle spielt.
4
Distributionen und die Fourier-Transformation
Worum geht’s? In Beispiel 1.14 wird die eindimensionale Impulsobservable P definiert
durch Pψ := −iψ für ψ ∈ H 1 (R). Der Ableitungsbegriff ist hier aber mit Vorsicht zu verwenden: Der Grundraum L 2 (R) besteht aus Äquivalenzklassen von Funktionen, und ein Zustand ψ ∈ L 2 (R) ändert sich nicht, wenn ψ(x) an einer Stelle x ∈ R beliebig abgeändert wird. Daher sind die klassischen Begriffe wie Stetigkeit oder Differenzierbarkeit für L 2 (R)-Funktionen nicht verwendbar. Selbst bei entsprechender Wahl eines Vertreters ist eine Funktion in H 1 (R) zwar stetig, aber im Allgemeinen nicht im klassischen Sinn differenzierbar. Die Antwort auf diese Schwierigkeit besteht in einer Verallgemeinerung des Ableitungsbegriffs, welche auf der Idee der Distributionen beruht. Tatsächlich handelt es sich hierbei in erster Linie um eine neue Interpretation von Funktionen: Statt unter einer Funktion f : R → R wie üblich die Abbildung x → f (x) zu verstehen, wird die Wirkung von f auf sehr gute (unter anderem unendlich oft differenzierbare) Funktio nen ϕ getestet: Man berechnet den Wert von R f (x)ϕ(x) dx für eine geeignete Klasse von Testfunktionen ϕ. In diesem Sinn wird aus einer Funktion eine Distribution, auch verallgemeinerte Funktion genannt. Diese Grundidee erlaubt es, Operationen wie etwa die Ableitung auf die Testfunktion zu werfen und damit jede Distribution (somit auch jede L 2 -Funktion) differenzierbar zu machen. Wenn man mit distributionellen Ableitungen für L 2 -Funktionen arbeitet, ist oft die Fouriertransformation nicht mehr weit weg, denn diese verwandelt Ableitungen in punktweise Multiplikationen und dient somit zu einer einfachen Beschreibung von Observablen, welche als Ableitungsoperatoren definiert sind. Daher wird in diesem Kapitel auch die Fouriertransformation diskutiert, wobei das Konzept der Testfunktionen auch hier helfen wird, die Fouriertransformation für eine große Klasse von Distributionen zu definieren.
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2022 R. Denk, Mathematische Grundlagen der Quantenmechanik, https://doi.org/10.1007/978-3-662-65554-2_4
81
82
4 Distributionen und die Fourier-Transformation
Wir diskutieren zunächst die Begriffe Testfunktionen, Distributionen und distributionelle Ableitung, welche es schließlich erlauben, Sobolevräume wie den Raum H 1 (R) zu betrachten. Danach wird die Fouriertransformation zunächst für glatte Funktionen (Schwartz-Funktionen) definiert und in einem zweiten Schritt – dem Grundgedanken der Distributionen folgend – über Dualität auf temperierte Distributionen erweitert. Insbesondere erhält man die Fouriertransformation auf dem Raum L 2 (Rn ), und der Satz von Plancherel besagt, dass diese ein isometrischer Isomorphismus ist.
4.1
Distributionen und Sobolevräume
Die Idee der Distributionen erlaubt es unter anderem, beliebige Ableitungen einer großen Klasse von Funktionen u : G → K zu definieren, wobei G ⊆ Rn offen sei. In diesem Zusammenhang ist folgende Multiindex-Schreibweise nützlich: Zu einem Tupel α = (α1 , . . . , αn ) ∈ Nn0 von nichtnegativen ganzen Zahlen definiert man |α| := α1 + . . . + αn sowie für |α|-fach differenzierbare Funktionen ϕ : G → K ∂ α ϕ(x) := ( ∂∂x1 )α1 . . . ( ∂ ∂xn )αn ϕ(x) (x ∈ G). Für x, ξ ∈ Rn setzen wir weiter x · ξ := x α := Wie bisher sei |x| = (
n
2 1/2 j=1 |x j | )
n
xjξj, j=1 x1α1 · . . . · xnαn .
die euklidische Norm des Vektors x ∈ Rn .
Definition 4.1. Ein Gebiet in Rn ist eine offene Teilmenge G ⊆ Rn mit folgender Eigenschaft: Seien x1 , x2 ∈ G. Dann existiert eine stetige Abbildung γ : [0, 1] → G mit γ (0) = x1 und γ (1) = x2 . Die Abbildung γ in dieser Definition heißt ein (stetiger) Weg zwischen x1 und x2 , d. h. in einem Gebiet G können zwei beliebige Punkte durch einen stetigen Weg verbunden werden, der das Gebiet nicht verlässt. Diese Eigenschaft heißt wegzusammenhängend. Die übliche Definition eines Gebietes verwendet eine ähnliche Eigenschaft (zusammenhängend), welche etwas komplizierter zu formulieren, aber für offene Teilmengen äquivalent zu wegzusammenhängend ist. Im Folgenden sei G ein Gebiet in Rn . Für k ∈ N0 ∪ {∞} sei C k (G) die Menge aller Funktionen f : G → K, für welche die Ableitungen ∂ α f für alle |α| ≤ k in G existieren
4.1
Distributionen und Sobolevräume
83
und stetig sind. Für die Definition von Distributionen beginnen wir mit dem Begriff der Testfunktionen. Definition 4.2. a) Die Menge
D (G) := Cc∞ (G) := {ϕ ∈ C ∞ (G) | supp ϕ ⊆ G, supp ϕ kompakt} heißt die Menge der Testfunktionen auf G. Dabei ist supp ϕ := {x ∈ G | ϕ(x) = 0} der Träger von ϕ, wobei {. . .} den Abschluss in Rn bezeichnet. In der Literatur findet man auch die Bezeichnung C0∞ (Rn ) := Cc∞ (Rn ). b) Eine Folge (ϕk )k∈N ⊆ D (G) konvergiert gegen eine Funktion ϕ ∈ D (G), falls folgende Bedingungen erfüllt sind: (i) Es gibt eine kompakte Teilmenge K ⊆ G mit supp ϕk ⊆ K für alle k ∈ N. (ii) Für alle Multiindizes α ∈ Nn0 gilt sup |∂ α ϕk (x) − ∂ α ϕ(x)| → 0 (k → ∞). x∈K
D (G)
In diesem Fall schreibt man ϕk −→ ϕ (k → ∞). Bemerkung 4.3. a) Die Konvergenz in (ii) ist sehr stark: Die Funktionen ϕk und alle Ableitungen konvergieren gleichmäßig. Es ist möglich, auf D (G) eine Topologie zu definieren, so dass die in b) angegebene Konvergenz einer Folge gerade der Konvergenz bezüglich dieser Topologie entspricht. Da es sich jedoch nicht um einen normierten Raum handelt (es liegt vielmehr eine sogenannte lokalkonvexe Topologie vor), wird an dieser Stelle darauf verzichtet, und wir geben nur die Konvergenz an. Eine ausführliche Diskussion der Topologie auf dem Raum der Testfunktionen ist etwa in [25], Abschn. 2.1 oder in [70], Abschn. VIII.5 zu finden. b) Das folgende Beispiel zeigt, dass es nichttriviale Testfunktionen gibt: Definiere ϕ1 : R → R durch ⎧ 1 ⎨exp , falls |x| < 1, 2 x −1 ϕ1 (x) := ⎩0, sonst. Man kann leicht nachrechnen, dass ϕ ∈ C ∞ (R) gilt (insbesondere sind alle Ableitungen von ϕ an den Stellen ±1 gleich Null), und nach Definition gilt supp ϕ1 = [−1, 1]. Definiert man ϕn : Rn → R durch ϕn (x) := ϕ1 (|x|) (x ∈ Rn ), erhält man eine Testfunktion ϕn ∈ D (Rn ).
84
4 Distributionen und die Fourier-Transformation
Definition 4.4. Die Menge D (G) aller Distributionen auf G wird definiert als die Menge aller Abbildungen u : D (G) → K mit folgenden Eigenschaften: (i) u : D (G) → K ist linear.
D (G)
(ii) Für alle Folgen (ϕk )k∈N ⊆ D (G) mit ϕk −→ 0 (k → ∞) gilt u(ϕk ) → 0. Bemerkung 4.5. a) Die Bezeichnung D (G) ist kein Zufall: Wählt man die in Bemerkung 4.3 a) erwähnte Topologie auf D (G), so ist D (G) gerade die Menge aller stetigen linearen Funktionale auf D (G), d. h. es handelt sich um den topologischen Dualraum, der für normierte Räume in Definition 2.22 eingeführt wurde. b) Auch auf dem Raum der Distributionen kann eine (lokalkonvexe) Topologie eingeführt werden. In dieser konvergiert eine Folge (u k )k∈N ⊆ D (G) von Distributionen genau dann gegen ein u ∈ D (G), falls u k (ϕ) → u(ϕ) (k → ∞) f¨ur alle ϕ ∈ D (G). Beispiel 4.6
Eine Funktion f : G → K heißt lokal integrierbar, falls f | K ∈ L 1 (K ) für jede kompakte Teilmenge K ⊆ G gilt. Man schreibt L 1loc (G) für die Menge aller lokalintegrierbaren Funktionen (wieder werden Äquivalenzklassen bezüglich Gleichheit fast überall betrachtet). Für eine Funktion f ∈ L 1loc (G) definiert man
[ f ] : D (G) → K, ϕ → [ f ](ϕ) := f (x)ϕ(x) dx. G
Dabei existiert das Integral, da x → M f (x)1supp ϕ (x) mit M := max y∈supp ϕ |ϕ(y)| eine integrierbare Majorante ist. Somit ist die Abbildung [ f ] : D (G) → K wohldefiniert, und offensichtlich ist [ f ] eine lineare Abbildung. Sei nun (ϕk )k∈N ⊆ D (G) eine Folge D (G)
mit ϕk −→ 0 (k → ∞). Dann existiert nach Definition der Konvergenz eine kompakte Menge K ⊆ G mit supp ϕk ⊆ K für alle k ∈ N, und wir erhalten
[ f ](ϕk ) ≤ | f (x)ϕk (x)| dx ≤ f L 1 (K ) max |ϕk (x)| → 0 (k → ∞). G
x∈K
Also ist [ f ] eine Distribution. Dieses Beispiel zeigt, dass eine große Klasse von Funktionen als Distribution aufgefasst werden kann, und war die Motivation für das Konzept von Distributionen: Statt die Werte einer Funktion f an einer Stelle x ∈ G zu betrachten, betrachtet man die Wirkung, die f auf Testfunktionen mit Hilfe der Abbildung ϕ → G f (x)ϕ(x) dx ausübt.
4.1
Distributionen und Sobolevräume
85
Definition 4.7. Eine Distribution u ∈ D (G) heißt eine reguläre Distribution, falls ein f ∈ L 1loc (G) existiert mit u = [ f ], wobei [ f ] wie in Beispiel 4.6 definiert ist. In diesem Fall heißt u die von f erzeugte reguläre Distribution. Falls u = [ f ] mit f ∈ L p (G) für ein p ∈ [1, ∞) gilt, schreibt man auch kurz (und formal inkorrekt) u ∈ L p (G). Bemerkung 4.8. Man beachte in obiger Definition, dass L p (G) ⊆ L 1loc (G) für alle p ∈ [1, ∞) gilt. Denn für alle kompakten Teilmengen K ⊆ G erhalten wir
| f (x)| dx = | f (x)| dx + | f (x)| dx K {x∈K | | f (x)|≤1} {x∈K | | f (x)|>1}
1 dx + | f (x)| p dx ≤ ≤
{x∈K | | f (x)|≤1} p λ(K ) + f L p (G)
{x∈K | | f (x)|>1}
< ∞,
d. h. es gilt f | K ∈ L 1 (K ) für alle kompakten Teilmengen K ⊆ G. Beispiel 4.9 (Dirac-Distribution)
a) Sei x0 ∈ G. Dann definiert man die Abbildung δx0 durch δx0 : D (G) → K, ϕ → ϕ(x0 ). Offensichtlich ist δx0 : D (G) → K linear. Sei (ϕk )k∈N ⊆ D (G) eine Folge mit D (G)
ϕk −→ 0, und sei K ⊆ G kompakt mit supp ϕk ⊆ K für alle k ∈ N. Dann gilt |δx0 (ϕk )| = |ϕk (x0 )| ≤ sup |ϕk (x)| → 0 (k → ∞). x∈K
Also ist δx0 eine Distribution, welche Dirac-Distribution genannt wird. Häufig setzt man δ := δ0 . In der physikalischen Literatur findet man für die Dirac-Distribution oft die Schreibweise
f (y)δ(x − y) dy = f (x). Rn
Dies ist nicht so zu verstehen, dass δ : Rn → [0, ∞] eine Funktion ist. Wäre etwa δ(x) = ∞ für x = 0 und δ(x) = 0 für alle x = 0, so wäre f (y)δ(x − y) dy = 0 für jede Funktion f : Rn → K, da die Menge {x} eine Lebesgue-Nullmenge ist. Die mathematische Präzisierung der Dirac-„Funktion“ ist somit die Dirac-Distribution. Die Dirac-Distribution kann allerdings durch reguläre Distributionen approximiert werden (im Sinne von Bemerkung 4.5 b)). Sei ψ ∈ D (Rn ) mit supp ψ ⊆ B(0, 1), ψ ≥ 0 und Rn ψ(x) dx = 1. Wir betrachten die skalierte Funktion ψε : Rn → R, x → ε−n ψ( xε ). Dann gilt ψε ∈ D (Rn ) mit supp ψε ⊆ B(0, ε), und nach dem Transformationssatz (Satz 3.44) folgt Rn ψε (x) dx = 1. Für jede Testfunktion
86
4 Distributionen und die Fourier-Transformation
ϕ ∈ D (Rn ) erhalten wir mit majorisierter Konvergenz für ε 0
x [ψε ](ϕ) = ϕ(x) dx = ε−n ψ ψ(y)ϕ(εy) dy ε Rn Rn
ψ(y) dy = ϕ(0) = δ(ϕ). → ϕ(0) Rn
Somit gilt [ψε ](ϕ) → δ(ϕ) (ε 0) für alle ϕ ∈ D (Rn ). b) Offensichtlich besteht ein enger Zusammenhang zwischen der Dirac-Distribution und dem Dirac-Maß (Beispiel 3.6 a)). Sei allgemein μ : B (G) → [0, ∞] ein Maß, welches kompakten Mengen endliche Werte zuordnet. Dann kann man zu μ die Abbildung
u μ : D (G) → C, ϕ → ϕ(x) dμ(x) G
betrachten. Offenbar ist u μ linear, und wegen |u μ (ϕ)| ≤ sup |ϕ(x)| μ(supp ϕ) x∈G
ist diese Abbildung auch stetig, d. h. u μ ist eine Distribution. Wählt man hierbei das Maß μ als Dirac-Maß μ = δx0 mit x0 ∈ G, so erhält man die Dirac-Distribution.
Lemma 4.10. Die Dirac-Distribution δx0 , x 0 ∈ G, ist keine reguläre Distribution.
Beweis. Angenommen, es existiert ein f ∈ L 1loc (G) mit δx0 = [ f ], d. h.
δx0 (ϕ) = ϕ(x0 ) = f (x)ϕ(x) dx (ϕ ∈ D (G)). G
Da G offen ist, existiert ein r > 0 so, dass K := B(x0 , r ) ⊆ G. Da K als abgeschlossene und beschränkte Teilmenge von Rn kompakt ist, gilt f | K ∈ L 1 (K ). Setzt man f k := f 1 B(x0 ,1/k) , so gilt f k → f 1{x0 } (k → ∞), und mit majorisierter Konvergenz erhalten wir
| f (x)| dx = | f k (x)| dx → | f (x)| dx = 0 (k → ∞), B(x0 ,1/k)
{x0 }
da {x0 } eine Lebesgue-Nullmenge ist. Also existiert ein k0 ∈ N mit
| f (x)| dx ≤ 21 . B(x0 ,1/k0 )
4.1
Distributionen und Sobolevräume
87
Wir wählen eine Testfunktion ϕ ∈ D (G) mit supp ϕ ⊆ B(x0 , 1/k0 ) sowie ϕ ≥ 0 und ϕ(x0 ) = maxx∈G ϕ(x) > 0. (Eine Testfunktion mit diesen Eigenschaften lässt sich durch Verschiebung und Skalierung aus der Funktion ϕn von Bemerkung 4.3 b) konstruieren.) Dann gilt
ϕ(x0 ) = δx0 (ϕ) = f (x)ϕ(x) dx ≤ ϕ(x0 ) | f (x)| dx ≤ 21 ϕ(x0 ), B(x0 ,1/k0 )
G
im Widerspruch zu ϕ(x0 ) > 0.
Das folgende Resultat, das auch als Fundamentallemma, Variationslemma oder Lemma von Du Bois-Reymond bekannt ist, zeigt, dass die Abbildung L 1loc (G) → D (G), f → [ f ] injektiv ist. Wir verzichten hier auf einen Beweis (siehe [2], Abschn. 2.22, oder [35], Theorem 1.2.5). Lemma 4.11. Sei f ∈ L 1loc (G). Falls [ f ](ϕ) = 0 für alle ϕ ∈ D (G) gilt, so folgt
f = 0 fast überall.
Wie zu Anfang dieses Kapitels bereits erwähnt wurde, haben wir das Ziel, den klassischen Ableitungsbegriff zu verallgemeinern. Das bedeutet aber, dass sich dieser Ableitungsbegriff bei klassisch differenzierbaren Funktionen nicht von dem üblichen Begriff unterscheiden sollte. Es seien f ∈ C k (Rn ) und [ f ] die von f erzeugte reguläre Distribution. Mit Hilfe partieller Integration (Satz von Gauß) erhält man für alle ϕ ∈ D (Rn ) und alle α ∈ Nn0 mit |α| ≤ k
α α |α| (∂ f )(x)ϕ(x) dx = (−1) f (x)(∂ α ϕ)(x) dx [∂ f ](ϕ) = Rn
|α|
α
Rn
= (−1) [ f ](∂ ϕ). Man beachte dabei, dass die Randterme wegen der Kompaktheit von supp ϕ verschwinden. Die obige Gleichheit motiviert die folgende Definition. Definition 4.12. Für u ∈ D (G) und α ∈ Nn0 definiert man die Ableitung ∂ α u der Distribution u durch ∂ α u : D (G) → K, ϕ → (−1)|α| u(∂ α ϕ). Bemerkung 4.13.
Offensichtlich ist für u ∈ D (G) und α ∈ Nn0 auch die Ableitung D (G)
∂ α u : D (G) → K linear. Falls (ϕk )k∈N ⊆ D (G) eine Folge mit ϕk −→ 0 (k → ∞) D (G)
ist, so gilt nach Definition der Konvergenz in D (G) auch ∂ α ϕk −→ 0 (k → ∞). Damit
88
4 Distributionen und die Fourier-Transformation
folgt
(∂ α u)(ϕk ) = (−1)|α| u(∂ α ϕk ) → 0 (k → ∞).
Also ist ∂ α u ∈ D (G). Insbesondere ist jede Distribution (und damit als Spezialfall jede L 2 -Funktion) im distributionellen Sinne unendlich oft differenzierbar. Wir erhalten die Abbildung ∂ α : D (G) → D (G), u → ∂ α u. Diese Abbildung besitzt folgende Stetigkeitseigenschaft: Seien (u k )k∈N ⊆ D (G) und u ∈ D (G) mit u k → u (k → ∞) im Sinne von Bemerkung 4.5 b), d. h. es gelte u k (ϕ) → u(ϕ) (ϕ ∈ D (G)). Dann gilt auch ∂ α u k → ∂ α u (k → ∞). Beispiel 4.14
a) Die Heaviside-Funktion h : R → R ist definiert als h := 1[0,∞) , d. h. h(x) :=
1,
falls x ≥ 0,
0,
falls x < 0.
Dann ist h ∈ L 1loc (R), und für ϕ ∈ D (R), supp ϕ ⊆ [a, b] mit a ≤ 0 ≤ b, gilt [h] (ϕ) = −
b
h(x)ϕ (x) dx = −
a
b
ϕ (x) dx = ϕ(0) = δ0 (ϕ).
0
Also erhalten wir [h] = δ0 in D (R). b) Seien x0 ∈ Rn und α ∈ Nn0 . Dann ist die Ableitung der Dirac-Distribution δx0 ∈ D (Rn ) gegeben durch (∂ α δx0 )(ϕ) = (−1)|α| δx0 (∂ α ϕ) = (−1)|α| (∂ α ϕ)(x0 ) (ϕ ∈ D (Rn )). So erhalten wir z. B. für die Heaviside-Funktion [h] (ϕ) = −ϕ (0) (ϕ ∈ D (R)). Für Anwendungen in der mathematischen Physik sind besonders Funktionen interessant, deren distributionelle Ableitungen wieder reguläre Distributionen sind. Dies ist das Konzept des Sobolevraums. Wie bisher sei G ⊆ Rn ein Gebiet. Definition 4.15. Für s ∈ N0 definiert man den Sobolevraum H s (G) durch
H s (G) := u ∈ D (G) | f¨ur alle α ∈ Nn0 mit |α| ≤ s gilt ∂ α u ∈ L 2 (G) . Der Raum H s (G) wird mit dem Skalarprodukt u, v H s (G) := ∂ α u, ∂ α v L 2 (G) (u, v ∈ H s (G)) |α|≤s
4.1
Distributionen und Sobolevräume
89
versehen. Der Raum H0s (G) ⊆ H s (G) wird definiert als Abschluss von D (G) = Cc∞ (G) im Raum H s (G) bezüglich der durch das Skalarprodukt induzierten Norm · H s (G) . Bemerkung 4.16. a) Man beachte in dieser Definition, dass die Bedingung ∂ α u ∈ L 2 (G) bedeutet, dass die Distribution ∂ α u eine reguläre Distribution ist, d. h. es gilt ∂ α u = [ f α ] mit einem f α ∈ L 1loc (G), und dass zusätzlich f α ∈ L 2 (G) gilt. Da man für α = 0 die Bedingung u ∈ L 2 (G) erhält, kann der Sobolevraum auch in der Form
H s (G) = u ∈ L 2 (G) | ∂ α u ∈ L 2 (G) (|α| ≤ s)
(4.1)
geschrieben werden. Obwohl hier D (G) formal nicht auftritt, sind die Ableitungen distributionell zu verstehen. b) Statt mit distributionellen Ableitungen zu arbeiten, kann man auch schwache Ableitungen betrachten. Zu u ∈ L 2 (G) und α ∈ Nn0 heißt eine Funktion f α ∈ L 2 (G) die schwache α-fache Ableitung von u, falls
α |α| u(x)(∂ ϕ)(x) dx = (−1) f α (x)ϕ(x) dx (ϕ ∈ D (G)) G
G
gilt. Man beachte, dass wegen u, ϕ, ∂ α ϕ, f α ∈ L 2 (G) alle Integrale existieren. Direkt anhand der Definitionen sieht man, dass die schwache α-fache Ableitung f α mit der distributionellen Ableitung ∂ α u übereinstimmt, und dass der Raum H s (G) genau aus allen u ∈ L 2 (G) besteht, für welche alle schwachen α-fachen Ableitungen mit |α| ≤ s existieren. Das Konzept der schwachen Ableitung hat den Vorteil, ohne den Begriff der Distributionen auszukommen, ist aber weniger allgemein, da z. B. die HeavisideFunktion keine schwache Ableitung besitzt. Lemma 4.17. Für alle s ∈ N0 ist der Sobolevraum H s (G) ein Hilbertraum.
Beweis. Wir verwenden die Darstellung (4.1). Sei u ∈ H s (G) mit u, u H s (G) = 0. Dann folgt insbesondere u 2L 2 (G) = 0 und damit u = 0 in L 2 (G). Die anderen Eigenschaften eines Skalarprodukts sind offensichtlich, d. h. H s (G) ist ein Prähilbertraum. Um die Vollständigkeit zu zeigen, sei (u k )k∈N ⊆ H s (G) eine Cauchyfolge. Nach Definition der Norm auf H s (G) ist dann auch für jedes |α| ≤ s die Folge (∂ α u k )k∈N ⊆ L 2 (G) eine Cauchyfolge, und wegen der Vollständigkeit von L 2 (G) existiert der Grenzwert f α := limk→∞ ∂ α u k . Wir setzen u := f (0,...,0) ∈ L 2 (G). Für α ∈ Nn0 mit |α| ≤ s und ϕ ∈ D (G) erhält man unter Verwendung der Cauchy– Schwarz-Ungleichung in L 2 (G)
90
4 Distributionen und die Fourier-Transformation
α [∂ u k ](ϕ) − [ f α ](ϕ) = (∂ α u k − f α )(x)ϕ(x) dx = ∂ α u k − f α , ϕ ¯ L 2 (G) G
≤ ∂ α u k − f α L 2 (G) ϕ L 2 (G) → 0 (k → ∞). Damit folgt (∂ α [u])(ϕ) = (−1)|α| [u](∂ α ϕ) = (−1)|α| lim [u k ](∂ α ϕ) k→∞
α
= lim [∂ u k ](ϕ) = [ f α ](ϕ) k→∞
für alle ϕ ∈ D (G). Somit ist ∂ α u = f α ∈ L 2 (G), d. h. u ∈ H s (G). Weiter gilt u k − u 2H s (G) = ∂ α u k − ∂ α u 2L 2 (G) = ∂ α u k − f α 2L 2 (G) → 0 (k → ∞), |α|≤s
|α|≤s
also haben wir u k → u in H s (G), und H s (G) ist vollständig und damit ein Hilbertraum. Der Raum H s (G) wurde nicht als Raum klassisch differenzierbarer Funktionen konstruiert. Dennoch besitzen die Funktionen in H s (G) eine gewisse Glattheit und sind sogar differenzierbar im klassischen Sinn, allerdings nicht bis zur Ordnung s. Dies ist der Inhalt des folgenden Satzes aus der Theorie der Sobolevräume, der hier nicht bewiesen werden soll. Er setzt für das Gebiet G eine gewisse Glattheit voraus, in der hier angegebenen Version verlangen wir, dass G ein gleichmäßiges C 1 -Gebiet ist. Dabei heißt G ein C 1 -Gebiet, falls der Rand von G lokal als Nullstellenmenge einer C 1 -Funktion geschrieben werden kann, und ein gleichmäßiges C 1 -Gebiet, falls die C 1 -Normen der den Rand darstellenden lokalen Funktionen und die C 1 -Normen ihrer Umkehrfunktionen durch globale Konstanten beschränkt sind. Wir verzichten hier auf eine formale Definition, in vielen Fällen reicht es zu wissen, dass beschränkte C 1 -Gebiete oder auch der ganze Raum G = Rn die Bedingung erfüllen. Satz 4.18 (Sobolevscher Einbettungssatz). Sei G ⊆ Rn ein gleichmäßiges C 1 -
Gebiet, und seien s, k ∈ N0 mit s > n2 + k. Dann besitzt jedes u ∈ H s (G) einen Repräsentanten, welcher k-mal klassisch differenzierbar ist mit beschränkten und gleichmäßig stetigen Ableitungen bis zur Ordnung k, und es gilt max sup |∂ α u(x)| ≤ C u H s (G) (u ∈ H s (G))
|α|≤k x∈G
mit einer Konstante C, die nicht von u abhängt. In diesem Sinn gilt die stetige Einbettung H s (G) ⊆ BUCk (G).
4.1
Distributionen und Sobolevräume
91
Eine recht allgemeine Version dieses Satzes inklusive Beweis ist in [1], Theorem 4.12, zu finden. In obiger Aussage wurde die Bezeichnung BUCk (G) verwendet, die folgendermaßen definiert ist: Definition 4.19. Seien G ⊆ Rn ein Gebiet und k ∈ N0 . Dann definiert man BUCk (G) als die Menge aller Funktionen u : G → C, für welche alle Ableitungen ∂ α u der Ordnung |α| ≤ k im klassischen Sinn existieren und beschränkt und gleichmäßig stetig sind. Der Raum BUCk (G) wird versehen mit der Norm u BUCk (G) := max sup |∂ α u(x)| (u ∈ BUCk (G)). |α|≤k x∈G
Wir setzen BUC(G) := BUC0 (G). Ein weiterer in vielen Anwendungen wichtiger Satz ist der Satz von Rellich–Kondrachov, der eine Kompaktheitsaussage trifft. Für einen Beweis verweisen wir auf [1], Theorem 6.3. Satz 4.20 (Rellich–Kondrachov). Sei G ⊆ Rn ein beschränktes C 1 -Gebiet, und seien
s ∈ N0 und k ∈ N. Dann besitzt jede beschränkte Folge (u j ) j∈N ⊆ H s+k (G) (d.h. es gilt sup j∈N u j H s+k (G) < ∞) eine Teilfolge (u j )∈N , welche in H s (G) konvergiert, d. h. es existiert ein u ∈ H s (G) so, dass u j −u H s (G) → 0 ( → ∞).
Die Aussage des Satzes von Rellich–Kondrachov kann kurz formuliert werden durch: Die Einbettung H s+k (G) ⊆ H s (G) ist kompakt. Dabei wird der Begriff eines kompakten Operators verwendet, welcher später in Abschn. 7.1 behandelt wird. Der Raum der Testfunktionen und der Distributionen als dessen Dualraum sind für die Fouriertransformation nicht gut geeignet. Deshalb betrachtet man einen weiteren Raum glatter Funktionen, welche nicht notwendig einen kompakten Träger besitzen. Die entsprechenden Distributionen heißen temperierte Distributionen. Es werden jetzt mehr Funktionen als Testfunktionen zugelassen, was über Dualität dazu führt, dass die Klasse der Distributionen kleiner wird. Definition 4.21. a) Der Vektorraum S (Rn ) besteht aus allen Funktionen ϕ ∈ C ∞ (Rn ), für welche gilt: p N (ϕ) := max sup (1 + |x| N )|∂ α ϕ(x)| < ∞ (N ∈ N0 ). |α|≤N x∈Rn
Der Raum S (Rn ) heißt Schwartz-Raum oder der Raum der schnell fallenden Funktionen.
92
4 Distributionen und die Fourier-Transformation
b) Eine Folge (ϕk )k∈N ⊆ S (Rn ) von Schwartz-Funktionen konvergiert gegen eine Funktion ϕ ∈ S (Rn ), falls p N (ϕk − ϕ) → 0 (k → ∞) für alle N ∈ N0 gilt. In diesem S (Rn )
Fall schreibt man ϕk −→ ϕ (k → ∞). Eine Abbildung T : S (Rn ) → S (Rn ) heißt S (Rn )
stetig, falls für alle Folgen (ϕk )k∈N ⊆ S (Rn ) mit ϕk −→ ϕ ∈ S (Rn ) (k → ∞) S (Rn )
folgt: T (ϕk ) −→ T (ϕ) (k → ∞). Bemerkung 4.22. a) Im Gegensatz zu Testfunktionen sind die Schwartzfunktionen nur auf dem ganzen Raum G = Rn definiert. Es gilt D (Rn ) ⊆ S (Rn ), denn für jede Testfunktion ϕ ∈ D (Rn ) ist die Funktion x → (1 + |x| N )|∂ α ϕ(x)| für alle N ∈ N0 und α ∈ Nn0 als stetige Funktion auf der kompakten Menge supp ϕ beschränkt. Die Funktion x → exp(−|x|2 ), Rn → R ist ein Beispiel für eine Funktion in S (Rn ), welche nicht in D (Rn ) liegt. b) Anstelle der Bedingung p N (ϕ) < ∞ (N ∈ N0 ) kann man die Definition auch mit jeder der beiden folgenden Bedingungen formulieren, ohne die Menge S (Rn ) zu ändern: pα,N (ϕ) := sup (1 + |x| N )|∂ α ϕ(x)| < ∞ (α ∈ Nn0 , N ∈ N0 ), x∈Rn
pα,β (ϕ) := sup |x β ∂ α ϕ(x)| < ∞ (α, β ∈ Nn0 ). x∈Rn
Dies gilt entsprechend auch für die Konvergenz.
Lemma 4.23.
a) Es gilt S (Rn ) ⊆ L p (Rn ) für alle p ∈ [1, ∞]. b) Seien α ∈ Nn0 , f ∈ S (Rn ) und P ein Polynom in n Variablen. Dann ist jede der drei Abbildungen ϕ → ∂ α ϕ, ϕ → f · ϕ und ϕ → P · ϕ eine stetige lineare Abbildung von S (Rn ) nach S (Rn ).
Beweis. a) Seien p ∈ [1, ∞) und ϕ ∈ S (Rn ). Dann gilt für alle N ∈ N mit N >
Rn
|ϕ(x)| p dx ≤ ( p N (ϕ)) p
Rn
n p
1 dx < ∞, (1 + |x| N ) p
und somit ist ϕ ∈ L p (Rn ). Wegen |ϕ(x)| ≤ p0 (ϕ) gilt auch S (Rn ) ⊆ L ∞ (Rn ). b) Seien α, f und P wie im Satz. Dann gilt für alle N ∈ N und ϕ ∈ S (Rn ) p N (∂ α ϕ) ≤ p N +|α| (ϕ),
(4.2)
wie man direkt aus der Definition von p N sieht. Damit folgt p N (∂ α ϕ) < ∞ für alle S (Rn )
N ∈ N, d. h. ∂ α ϕ ∈ S (Rn ). Falls (ϕk )k∈N ⊆ S (Rn ) eine Folge mit ϕk −→ ϕ ist, so
4.1
Distributionen und Sobolevräume
93
folgt ebenfalls aus (4.2) p N (∂ α ϕk − ∂ α ϕ) → 0 (k → ∞) für alle N ∈ N. Also gilt S (Rn )
∂ α ϕk −→ ∂ α ϕ (k → ∞), was die Stetigkeit der Abbildung ∂ α : S (Rn ) → S (Rn ) zeigt. Für die Abbildungen ϕ → P · ϕ und ϕ → f · ϕ verwendet man die Leibniz-Formel α (∂ α−β f )(∂ β ϕ). ∂ α ( f · ϕ) = β β≤α
Dabei wird β ≤ α definiert durch β j ≤ α j ( j = 1, . . . , n). Damit sieht man p N (P · ϕ) ≤ c N max sup
|β|≤N x∈Rn
|∂ β P(x)| p N +deg P (ϕ), 1 + |x|deg P
p N ( f · ϕ) ≤ c N max sup |∂ β f (x)| p N (ϕ), |β|≤N x∈Rn
wobei c N von ϕ und P bzw. f unabhängige Konstanten sind. Wie oben folgen daraus die Wohldefiniertheit und Stetigkeit der entsprechenden Abbildungen. Die Aussage a) des letzten Lemmas kann verschärft werden, tatsächlich liegt S (Rn ) dicht in H s (Rn ). Dies gilt sogar schon für den Raum aller Testfunktionen D (Rn ). Wir verzichten an dieser Stelle auf einen Beweis (siehe [2], Satz 2.24 und U8.8). Satz 4.24. Sei s ∈ N0 . Dann liegt D (Rn ) dicht in H s (Rn ), d. h. es gilt D (Rn ) =
H s (Rn ), wobei D (Rn ) den Abschluss von D (Rn ) bezüglich · H s (Rn ) bezeichnet. Insbesondere liegt auch S (Rn ) dicht in H s (Rn ).
In Analogie zur Definition der Distributionen (Definition 4.4) bilden die temperierten Distributionen den Dualraum des Schwartz-Raums. Definition 4.25. Die Menge S (Rn ) aller temperierten Distributionen wird definiert als die Menge aller Abbildungen u : S (Rn ) → K mit folgenden Eigenschaften: (i) u : S (Rn ) → K ist linear.
S (Rn )
(ii) Für alle Folgen (ϕk )k∈N ⊆ S (Rn ) mit ϕk −→ 0 (k → ∞) gilt u(ϕk ) → 0. Bemerkung 4.26.
Sei u ∈ S (Rn ) eine temperierte Distribution. Dann ist u|D (Rn ) ∈ D (Rn )
D (Rn ). Denn sei (ϕk )k∈N ⊆ D (Rn ) eine Folge mit ϕk −→ 0 (k → ∞). Dann gilt auch
94
4 Distributionen und die Fourier-Transformation
p N (ϕk ) → 0 (k → ∞) für alle N ∈ N, und die Bedingung (ii) in Definition 4.25 ergibt u(ϕk ) → 0 (k → ∞). Man kann zeigen, dass die Abbildung
S (Rn ) → D (Rn ), u → u|D (Rn ) stetig und injektiv ist, daher kann S (Rn ) als Teilmenge von D (Rn ) aufgefasst werden. Beispiel 4.27
a) Sei x0 ∈ Rn . Für die Dirac-Distribution δx0 : S (Rn ) → K, ϕ → ϕ(x0 ), gilt δx0 ∈ S (Rn ). Denn aus der Abschätzung |δx0 (ϕ)| ≤ p0 (ϕ) (ϕ ∈ S (Rn )) folgt Eigenschaft (ii) in Definition 4.25. b) Sei f ∈ L 1loc (Rn ) polynomial beschränkt, d. h. es existieren C ≥ 0 und M ∈ N mit | f (x)| ≤ C(1 + |x| M ) für fast alle x ∈ Rn . Dann ist die zugehörige reguläre Distribution
[ f ] : S (Rn ) → K, ϕ → f (x)ϕ(x) dx (ϕ ∈ S (Rn )) Rn
wohldefiniert, und es gilt [ f ] ∈ S (Rn ). Dies folgt aus der Abschätzung |[ f ](ϕ)| ≤ C p M+n+1 (ϕ) (ϕ ∈ S (Rn )). c) Sei f ∈ L 2 (Rn ). Für ϕ ∈ S (Rn ) gilt mit der Cauchy–Schwarz-Ungleichung |[ f ](ϕ)| = f , ϕ ¯ L 2 (Rn ) ≤ f L 2 (Rn ) ϕ L 2 (Rn ) ≤ C N f L 2 (Rn ) p N (ϕ) für N > n2 , wobei die letzte Ungleichung im Beweis von Lemma 4.23 a) gezeigt wurde. Damit ist [ f ] ∈ S (Rn ), d.h. es gilt L 2 (Rn ) ⊆ S (Rn ). d) Seien B (Rn ) die Borelmengen des Rn , und sei μ : B (Rn ) → [0, ∞) ein endliches Maß. Dann wird durch
u μ (ϕ) := ϕ(x) dμ(x) (ϕ ∈ S (Rn )) Rn
eine temperierte Distribution definiert, denn es gilt |u μ (ϕ)| ≤ μ(Rn ) p0 (ϕ) (ϕ ∈ S (Rn )) (vergleiche auch Beispiel 4.9 b)). Wählt man hierbei μ als das Dirac-Maß, erhält man wieder die Aussage von a).
Die Fouriertransformation in Rn
4.2
95
Lemma 4.28. Seien f ∈ S (Rn ) und u ∈ S (Rn ). Dann wird durch
f · u : S (Rn ) → K, ϕ → ( f · u)(ϕ) := u( f · ϕ) eine temperierte Distribution f · u ∈ S (Rn ) definiert. Die analoge Aussage gilt für P · u für ein Polynom P : Rn → K.
Beweis. Nach Lemma 4.23 b) ist die Abbildung S (Rn ) → S (Rn ), ϕ → f · ϕ wohldefiniert, linear und stetig. Damit ist u( f · ϕ) für alle ϕ ∈ S (Rn ) definiert, und die S (Rn )
Abbildung ϕ → u( f · ϕ) ist offensichtlich linear. Falls ϕk −→ 0 (k → ∞), so folgt S (Rn )
f · ϕk −→ 0 (k → ∞) nach Lemma 4.23 b) und damit u( f · ϕk ) → 0 (k → ∞). Dies zeigt f · u ∈ S (Rn ). Der Aussage für Polynome P wird analog bewiesen.
4.2
Die Fouriertransformation in Rn
Die Fouriertransformation ist eines der zentralen Werkzeuge der Analysis. Wir beginnen mit der Definition auf dem Raum L 1 (Rn ) aller Äquivalenzklassen Lebesgue-integrierbarer Funktionen. Da die Fouriertransformation am einfachsten mit Hilfe der komplexen Exponentialfunktion definiert wird, ist in diesem Abschnitt stets K = C. Definition 4.29. Für f ∈ L 1 (Rn ) wird die Fouriertransformierte F f von f definiert durch
−n/2 ˆ f (x)e−i x·ξ dx (ξ ∈ Rn ). (F f )(ξ ) := f (ξ ) := (2π ) Rn
Die Normierung (2π )−n/2 in dieser Definition ist in der Literatur nicht einheitlich. Manchmal findet man auch statt des Exponenten −i x · ξ den Exponenten i x · ξ . Man beachte auch, dass das obige Integral wegen |e−i x·ξ | = 1 und f ∈ L 1 (Rn ) existiert. Die folgenden Eigenschaften lassen sich sofort nachrechnen. Satz 4.30. Seien f , g ∈ L 1 (Rn ) und α, β ∈ C.
a) Es gilt F (α f + βg) = α F f + β F g. b) Ist f¯(x) := f (x) (x ∈ Rn ), so folgt (F f¯)(ξ ) = (F f )(−ξ ) (ξ ∈ Rn ). c) Sei y ∈ Rn . Dann gilt
96
4 Distributionen und die Fourier-Transformation
F (x → f (x − y)) (ξ ) = e−i y·ξ (F f )(ξ ) (ξ ∈ Rn ), F (x → e−i y·x f (x)) (ξ ) = (F f )(ξ + y) (ξ ∈ Rn ). d) Sei zu λ ∈ R\{0} die skalierte Funktion f λ definiert durch f λ (x) := f (λx) (x ∈ Rn ). Dann gilt ξ (F f λ )(ξ ) = |λ|−n (F f ) (ξ ∈ Rn ). λ
Lemma 4.31. Sei f ∈ L 1 (Rn ). Dann ist F f gleichmäßig stetig und beschränkt.
Genauer gilt |(F f )(ξ )| ≤ (2π )−n/2 f L 1 (Rn ) für alle ξ ∈ Rn .
Beweis. Für f ∈ L 1 (Rn ) und ξ, h ∈ Rn erhalten wir
| f (x)| |e−i(x·(ξ +h)) − e−i x·ξ | dx |(F f )(ξ + h) − (F f )(ξ )| ≤ Rn
| f (x)| |e−i x·h − 1| dx. = Rn
Die Funktion x → | f (x)| |e−i x·h −1| konvergiert punktweise gegen 0 für h → 0 und besitzt die integrierbare Majorante 2| f (·)|. Mit dem Satz über majorisierte Konvergenz (Satz 3.39) folgt, dass das Integral auf der rechten Seite für h → 0 gegen 0 konvergiert. Daraus erhalten wir die Stetigkeit und, da die rechte Seite nicht von ξ abhängt, sogar die gleichmäßige Stetigkeit von F f . Die Beschränktheit von F f ergibt sich sofort aus
−i x·ξ −n/2 (F f )(ξ ) = (2π )−n/2 f (x)e dx ≤ (2π ) | f (x)| dx −n/2
= (2π )
Rn
Rn
f L 1 (Rn ) .
Für die Analysis zentral ist die Eigenschaft der Fouriertransformation, Ableitungen in Multiplikationen mit den Koordinatenvariablen zu verwandeln. Dies ist der Inhalt des folgenden Satzes, in welchem wir wieder die Multiindex-Schreibweisen ∂ξα = ( ∂ξ∂ 1 )α1 . . . ( ∂ξ∂ n )αn sowie x α = x1α1 · . . . · xnαn und analog ∂xα , ξ α verwenden.
4.2
Die Fouriertransformation in Rn
97
Satz 4.32.
a) Seien ϕ ∈ S (Rn ) und α ∈ Nn0 . Dann ist F ϕ ∈ C ∞ (Rn ), und es gilt ∂ξα (F ϕ)(ξ ) = (−i)|α| F (x → x α ϕ(x))(ξ ) (ξ ∈ Rn ). b) Für ϕ ∈ S (Rn ) und α ∈ Nn0 gilt F (∂xα ϕ) (ξ ) = i |α| ξ α (F ϕ)(ξ ) (ξ ∈ Rn ). c) Für ϕ ∈ S (Rn ) ist F ϕ ∈ S (Rn ), und die Fouriertransformation F : S (Rn ) → S (Rn ) ist eine stetige lineare Abbildung.
Beweis. a) Nach Lemma 4.23 b) ist x → x α ϕ(x) ∈ S (Rn ), und nach Lemma 4.23 a) gilt S (Rn ) ⊆ L 1 (Rn ). Insbesondere ist die Fourier-Transformierte dieser Funktion definiert, und mit dem Satz über parameterabhängige Integrale (Satz 3.40) erhält man
α α −i x·ξ |α| ∂ξ (F ϕ)(ξ ) = ϕ(x)∂ξ e dx = (−i) ϕ(x)x α e−i x·ξ dx Rn Rn = (−i)|α| F (x → x α ϕ(x)) (ξ ). Insbesondere gilt F ϕ ∈ C ∞ (Rn ). b) Mit partieller Integration erhalten wir
α α −i x·ξ |α| F (∂x ϕ)(ξ ) = (∂x ϕ)(x)e dx = (−1) =i
Rn |α| α
Rn
ϕ(x)∂xα e−i x·ξ dx
ξ (F ϕ)(ξ ) (ξ ∈ Rn ).
Dabei verschwinden die Randterme wegen |ϕ(x)e−i x·ξ | = |ϕ(x)| → 0 (|x| → ∞). c) Wir verwenden die Familie pα,N (ϕ) := supx∈Rn (1 + |x| N )|∂ α ϕ(x)| zur Definition von S (Rn ) (vergleiche Bemerkung 4.22 b)). Für ϕ ∈ S (Rn ) gilt
|(F ϕ)(ξ )| ≤ (1 + |x|n+1 )−1 dx p0,n+1 (ϕ) = Cn p0,n+1 (ϕ) < ∞ (ξ ∈ Rn ). Rn
Für gerades N ist Q(ξ ) := (1 + |ξ | N ) ein Polynom in ξ vom Grad N , und mit a), b) und der obigen Abschätzung folgt pα,N (F ϕ) = sup Q(ξ )∂ξα (F ϕ)(ξ ) = sup [F (x → Q(∂x )x α ϕ(x))](ξ ) ξ ∈Rn
ξ ∈Rn
≤ Cn p0,n+1 (x → Q(∂x )x α ϕ) ≤ Cn Cα,N
|β|≤N
pβ,|α|+n+1 (ϕ).
(4.3)
98
4 Distributionen und die Fourier-Transformation
Somit gilt pα,N (F ϕ) < ∞ für alle α ∈ Nn0 und N ∈ N0 , d. h. F ϕ ∈ S (Rn ). Falls S (Rn )
(ϕk )k∈N ⊆ S (Rn ) mit ϕk −→ ϕ (k → ∞) ist, so folgt ebenfalls aus (4.3) pα,N (F ϕk − F ϕ) → 0 (k → ∞) für alle α ∈ Nn0 und N ∈ N0 , was die Stetigkeit der linearen Abbildung F : S (Rn ) → S (Rn ) zeigt. Teil c) des obigen Satzes erlaubt es, die Grundidee der Distributionen auch auf die FourierTransformation anzuwenden. Wie bei der Definition der Ableitung von Distributionen (Definition 4.12), wird dabei die Fourier-Transformation auf die Testfunktion angewendet. Definition und Satz 4.33. Für u ∈ S (Rn ) definiert man die Fouriertransformierte
durch (F u)(ϕ) := u(F ϕ) (ϕ ∈ S (Rn )). Dann ist F u ∈ S (Rn ). Für α ∈ Nn0 und u ∈ S (Rn ) gilt F (∂ α u) = qα · (F u) als Gleichheit in S (Rn ), wobei qα : Rn → C, ξ → i |α| ξ α sei.
Beweis. Der Beweis von F u ∈ S (Rn ) folgt wie im Beweis von Lemma 4.28, die Gleichheit F (∂ α u) = qα · (F u) folgt direkt aus Satz 4.32 a) und den entsprechenden Definitionen für Distributionen. Im Folgenden werden wir zeigen, dass die Fouriertransformation als Abbildung F : S (Rn ) → S (Rn ) sogar bijektiv ist und eine Darstellung der inversen Abbildung herleiten. Wir beginnen mit einem Fixpunkt von F . Lemma 4.34. Definiere die Funktion γ : Rn → C durch
|x|2 (x ∈ Rn ). γ (x) := exp − 2 Dann gilt γ ∈ S (Rn ) und F γ = γ .
Beweis. (i) Sei n = 1. Offensichtlich ist γ ∈ S (Rn ), und durch Ableiten sieht man, dass γ das Anfangswertproblem y (x) + x y(x) = 0,
y(0) = 1
(4.4)
4.2
Die Fouriertransformation in Rn
99
löst. Für F γ erhält man nach Satz 4.32 0 = F (x → γ (x) + xγ (x))(ξ ) = iξ(F γ )(ξ ) + i(F γ ) (ξ ). Wegen 1 (F γ )(0) = √ 2π
∞
−∞
e−
x2 2
dx = 1
(siehe Beispiel 3.46) löst F γ ebenfalls das Anfangswertproblem (4.4). Da nach dem Satz von Picard–Lindelöf die Lösung des Anfangswertproblems eindeutig ist, folgt γ = F γ . (ii) Für n > 1 verwenden wir (F γ )(ξ ) = (2π )−n/2 =
n j=1
n
Rn
1 √ 2π
R
j=1
e−x j /2 2
n
e−i x j ξ j dx
j=1
n 2 2 e−x j /2 e−i x j ξ j dx j = e−ξ j /2 = γ (ξ ). j=1
Im folgenden Lemma schreiben wir F 2 ϕ := F (F ϕ). Lemma 4.35. Für ϕ ∈ S (Rn ) gilt (F 2 ϕ)(x) = ϕ(−x) (x ∈ Rn ).
Beweis. Für festes ξ0 ∈ Rn und ε > 0 definieren wir γε (x) := γ (εx) (x ∈ Rn ) mit der Funktion γ aus Lemma 4.34 und gε (x) := (2π )−n/2 e−i x·ξ0 γε (x) (x ∈ Rn ). Dann gilt gε ∈ S (Rn ), und nach Satz 4.30 c), d) und Lemma 4.34 erhalten wir (F gε )(ξ ) = (2π )−n/2 (F γε )(ξ + ξ0 ) = (2π )−n/2 ε−n γ
ξ + ξ 0 (ξ ∈ Rn ). ε
Die Funktion (x, ξ ) → ϕ(ξ )gε (x)e−i x·ξ liegt in S (R2n ) und damit nach Lemma 4.23 a) in L 1 (R2n ), also können wir den Satz von Fubini (Satz 3.43) anwenden. Wir erhalten
(F ϕ)(x)gε (x) dx = (2π )−n/2 ϕ(y)e−i x·y dy gε (x) dx Rn Rn Rn
gε (x)ϕ(y)e−i x·y d(x, y) = (2π )−n/2 R2n
gε (x)e−i x·y dx ϕ(y) dy = (2π )−n/2 Rn
Rn
100
4 Distributionen und die Fourier-Transformation
(F gε )(y)ϕ(y) dy
y +ξ 0 ϕ(y) dy ε−n γ = (2π )−n/2 ε Rn
γ (z)ϕ(εz − ξ0 ) dz. = (2π )−n/2 =
Rn
(4.5)
Rn
0 verwendet. Wir nehmen Bei der letzten Gleichheit haben wir die Substitution z = y+ξ ε auf beiden Seiten von (4.5) den Grenzwert ε 0. Es gilt dann γ (εx) → 1 punktweise und gε (x) → (2π )−n/2 e−i x·ξ0 punktweise. Wegen F ϕ ∈ L 1 (Rn ) können wir majorisierte Konvergenz anwenden und erhalten für die linke Seite von (4.5)
−n/2 (F ϕ)(x)gε (x) dx → (2π ) e−i x·ξ0 (F ϕ)(x) dx = (F 2 ϕ)(ξ0 ).
Rn
Rn
Um den Grenzwert für die rechte Seite von (4.5) zu berechnen, verwenden wir ϕ(εz −ξ0 ) → ϕ(−ξ0 ) punktweise. Da z → p0 (ϕ)γ (z) mit p0 aus Definition 4.21 eine integrierbare Majorante ist, erhalten wir
(2π )−n/2 γ (z)ϕ(εz − ξ0 ) dz → ϕ(−ξ0 ) (2π )−n/2 γ (z) dz = ϕ(−ξ0 ) Rn
Rn
für ε 0. Also gilt (F 2 ϕ)(ξ0 ) = ϕ(−ξ0 ).
Satz 4.36. Die Fouriertransformation F : S (Rn ) → S (Rn ) ist ein Isomorphismus,
d. h. sie ist linear, stetig und bijektiv mit stetiger Inverse. Für ϕ ∈ S (Rn ) ist die inverse Abbildung gegeben durch
−1 −n/2 (F ϕ)(x) = (2π ) ϕ(ξ )ei x·ξ dξ (x ∈ Rn ). Rn
Beweis. Nach Lemma 4.35 gilt (F 2 ϕ)(x) = ϕ(−x) (x ∈ Rn ) für alle ϕ ∈ S (Rn ), d. h. F 4 = idS (Rn ) . Damit ist F : S (Rn ) → S (Rn ) bijektiv mit Inverse F −1 = F 3 . Somit gilt für ϕ ∈ S (Rn ) (F −1 ϕ)(x) = (F 3 ϕ)(x) = F 2 (F ϕ) (x) = (F ϕ)(−x)
−n/2 ϕ(ξ )ei x·ξ dξ (x ∈ Rn ). = (2π ) Rn
Die Stetigkeit von F wurde bereits in Satz 4.32 c) gezeigt, und wegen F −1 = F 3 ist auch die inverse Abbildung stetig.
4.2
Die Fouriertransformation in Rn
101
Korollar 4.37. Die Fouriertransformation ist als Abbildung F : S (Rn ) → S (Rn )
linear und bijektiv, und die inverse Abbildung ist gegeben durch F −1 u = F 3 u (u ∈ S (Rn )).
Beweis. Die Abbildung F : S (Rn ) → S (Rn ) ist offensichtlich linear und nach Satz 4.33 wohldefiniert. Für alle u ∈ S (Rn ) und ϕ ∈ S (Rn ) gilt (F 4 u)(ϕ) = u(F 4 ϕ) = u(ϕ). Also ist F 4 = idS (Rn ) , und F ist auf S (Rn ) bijektiv mit inverser Abbildung F −1 = F 3 . Beispiel 4.38
Sei x0 ∈ Rn . Betrachte die Dirac-Distribution δx0 ∈ S (Rn ). Es gilt
(F δx0 )(ϕ) = δx0 (F ϕ) = (F ϕ)(x0 ) = (2π )−n/2 e−i x0 ·x ϕ(x) dx = (2π )−n/2 [ex0 ](ϕ), wobei die Funktion ex0 : Rn → C durch ex0 (x) := e−i x0 ·x (x ∈ Rn ) definiert wird. Damit gilt F δx0 = (2π )−n/2 [ex0 ]. Insbesondere gilt F δ0 = (2π )−n/2 [1Rn ], wobei 1Rn die konstante Funktion 1 bezeichne. Damit und mit Lemma 4.35 folgt für jedes ϕ ∈ S (Rn ) F [1Rn ] (ϕ) = (2π )n/2 (F 2 δ0 )(ϕ) = (2π )n/2 δ0 (F 2 ϕ) = (2π )n/2 δ0 (x → ϕ(−x)) = (2π )n/2 ϕ(0) = (2π )n/2 δ0 (ϕ). Wir erhalten F [1Rn ] = (2π )n/2 δ0 , in diesem Sinn ist die Fouriertransformation der konstanten Funktion 1 gerade ein Vielfaches der Dirac-Distribution. In Satz 4.36 und Korollar 4.37 haben wir gesehen, dass die Fouriertransformation in den beiden Fällen
F : S (Rn ) → S (Rn ), F : S (Rn ) → S (Rn ) jeweils linear und bijektiv ist. Der Raum S (Rn ) aller Schwartz-Funktionen ist dabei recht klein, während der Raum S (Rn ) sehr groß ist und etwa auch L 2 (Rn ) enthält (siehe Beispiel 4.27 c)). Der folgende Satz ist eines der wesentlichen Resultate über die Fouriertransformation und besagt, dass auch F : L 2 (Rn ) → L 2 (Rn ) ein Isomorphismus ist. Man beachte dabei, dass die Fouriertransformation auf L 2 (Rn ) als Einschränkung von F : S (Rn ) → S (Rn ) definiert ist, d. h. für f ∈ L 2 (Rn ) setzt man F f := F [ f ], wobei [ f ] ∈ S (Rn ) die zu f gehörige temperierte Distribution ist.
102
4 Distributionen und die Fourier-Transformation
Satz 4.39 (Satz von Plancherel). Für alle f , g ∈ L 2 (Rn ) gilt F f , F g ∈ L 2 (Rn )
und f , g L 2 (Rn ) = F f , F g L 2 (Rn ) . Insbesondere gilt F f L 2 (Rn ) = f L 2 (Rn ) für alle f ∈ L 2 (Rn ), d. h. die Fouriertransformation ist eine Isometrie auf L 2 (Rn ). Die Abbildung
F : L 2 (Rn ) → L 2 (Rn ) ist ein isometrischer Isomorphismus, d. h. linear, bijektiv, stetig mit stetiger Inverse und isometrisch.
Beweis. Seien f , h ∈ S (Rn ). Wie im Beweis von Lemma 4.35 folgt mit dem Satz von Fubini
(F f )(x)h(x) dx = (2π )−n/2 f (y)h(x)e−i x·y d(x, y) Rn R2n
f (y)(F h)(y) dy. (4.6) = Rn
Somit gilt F f , h L 2 (Rn ) = f , F h L 2 (Rn ) . Man definiert g ∈ S (Rn ) durch g(y) := (F h)(y) (y ∈ Rn ). Da F eine Bijektion auf S (Rn ) ist, können wir F −1 anwenden und erhalten
h(x) = (F −1 g)(x) = (2π )−n/2 g(y)ei x·y dy = (F g)(x) (x ∈ Rn ). Rn
Eingesetzt in (4.6) erhält man für alle f , g ∈ S (Rn ) F f , F g L 2 (Rn ) = f , g L 2 (Rn ) .
(4.7)
F f L 2 (Rn ) = f L 2 (Rn ) ( f ∈ S (Rn )).
(4.8)
Setzt man f = g, folgt
Wir wollen zeigen, dass (4.8) sogar für alle f ∈ L 2 (Rn ) gilt, wobei wir die Dichtheit von S (Rn ) in L 2 (Rn ) (Satz 4.24) verwenden. Zu f ∈ L 2 (Rn ) existiert somit eine Folge ( f k )k∈N ⊆ S (Rn ) mit f − f k L 2 (Rn ) → 0 (k → ∞). Als konvergente Folge ist ( f k )k∈N ⊆ L 2 (Rn ) eine Cauchyfolge, und wegen (4.8) ist auch (F f k )k∈N ⊆ L 2 (Rn ) eine Cauchyfolge und, da L 2 (Rn ) vollständig ist, konvergent. Wir setzen g := limk→∞ F f k ∈ L 2 (Rn ). Für alle ϕ ∈ S (Rn ) gilt mit (4.6)
4.2
Die Fouriertransformation in Rn
103
(F [ f ])(ϕ) = [ f ](F ϕ) = f (x)(F ϕ)(x) dx = lim f k (x)(F ϕ)(x) dx k→∞ Rn Rn
(F f k )(x)ϕ(x) dx = g(x)ϕ(x) dx = [g](ϕ). = lim k→∞ Rn
Rn
Dabei wurde zweimal die Stetigkeit des L 2 -Skalarprodukts ausgenutzt: Für f k → f in L 2 (Rn ) folgt f k , F ϕ L 2 (Rn ) → f , F ϕ L 2 (Rn ) . Wir erhalten F [ f ] = g ∈ L 2 (Rn ) und F [ f ] L 2 (Rn ) = g L 2 (Rn ) = lim F f k L 2 (Rn ) = lim f k L 2 (Rn ) = f L 2 (Rn ) . k→∞
k→∞
Also gilt (4.8) für alle f ∈ L 2 (Rn ), und aus (4.8) erhält man mit Hilfe der Polarisationsformel (Satz 2.3 c)) die Gleichheit (4.7) für alle f , g ∈ L 2 (Rn ). Sei nun F0 : L 2 (Rn ) → S (Rn ) die Einschränkung von F : S (Rn ) → S (Rn ) auf L 2 (Rn ). Dann ist F0 als Einschränkung einer bijektiven Abbildung selbst bijektiv auf seinen Wertebereich im(F0 ), und nach (4.8) gilt im(F0 ) ⊆ L 2 (Rn ). Andererseits ist zu g ∈ L 2 (Rn ) die Funktion f := F −1 g nach (4.8) wieder in L 2 (Rn ), d. h. F0 : L 2 (Rn ) → L 2 (Rn ) ist eine Bijektion. Die Isometrie liefert nach Satz 2.20 die Stetigkeit von F0 und von F0−1 . Der Satz von Plancherel erlaubt eine einfache Beschreibung der Sobolevräume (Definition 4.15) in Rn . Satz 4.40. Sei s ∈ N0 . Dann gilt
H s (Rn ) = u ∈ L 2 (Rn ) ξ → (1 + |ξ |2 )s/2 F u(ξ ) ∈ L 2 (Rn ) , und die Normen u H s (Rn ) und (1 + | · |2 )s/2 F u( · ) L 2 (Rn ) sind äquivalent, d. h. es existieren Konstanten C1 , C2 > 0 so, dass für alle u ∈ H s (Rn ) C1 u H s (Rn ) ≤ (1 + | · |2 )s/2 F u( · ) L 2 (Rn ) ≤ C2 u H s (Rn ) gilt.
Beweis. Nach dem Satz von Plancherel und nach Satz 4.33 gilt u H s (Rn ) =
|α|≤s
ξ → ξ α F u(ξ ) 2L 2 (Rn )
1/2
.
Damit genügt es für den Beweis des Satzes, die Äquivalenz der beiden Ausdrücke (1+|ξ |2 )s und |α|≤s |ξ α |2 zu zeigen. α Für alle ξ ∈ Rn folgt unter Verwendung von |ξ j j |2 ≤ (1 + |ξ |2 )α j die Abschätzung
104
4 Distributionen und die Fourier-Transformation
|α|≤s
|ξ α |2 ≤
(1 + |ξ |2 )|α| ≤ (1 + |ξ |2 )s
|α|≤s
1 = Cs,n (1 + |ξ |2 )s .
|α|≤s
Für die umgekehrte Abschätzung multiplizieren wir den Ausdruck (1 + |ξ |2 )s = (1 + ξ12 + · · · + ξn2 )s aus und erhalten (n + 1)s Summanden der Form ξ 2j1 · . . . · ξ 2jk mit k ≤ s. Da sich jedes solche Produkt in der Form |ξ α |2 mit einem Multiindex α mit |α| ≤ s schreiben lässt, erhalten wir (1 + |ξ |2 )s ≤ (n + 1)s |ξ α |2 (ξ ∈ Rn ) |α|≤s
und somit die gewünschte Äquivalenz.
Bemerkung 4.41. Im Gegensatz zur ursprünglichen Definition der Sobolevräume ist die Norm ξ → (1 + |ξ |2 )s/2 F u(ξ ) L 2 (Rn ) auch für nicht ganzzahlige Werte von s definiert. Man verwendet diese Norm für die Definition des Sobolevraums H s (Rn ) für alle s ∈ R. Genauer definiert man H s (Rn ) für s ∈ R als die Menge aller temperierten Distributionen u ∈ S (Rn ), für welche F u eine reguläre Distribution ist und die obige Norm endlich ist. Wie der obige Satz zeigt, erhält man für s ∈ N0 eine zur ursprünglichen Definition äquivalente Norm. Aus der Darstellung der Sobolevraum-Norm in Satz 4.40 lässt sich eine nützliche Ungleichung beweisen, die wir nur im einfachsten Fall formulieren. Lemma 4.42 (Interpolationsungleichung). Zu jedem ε > 0 existiert ein C ε > 0 so,
dass für alle u ∈ H 2 (Rn ) gilt:
u H 1 (Rn ) ≤ ε u H 2 (Rn ) + Cε u L 2 (Rn ) .
Beweis. Wir wählen für die Sobolevräume die Normen aus Satz 4.40 und zeigen eine punktweise Abschätzung für alle ξ ∈ Rn . Dazu verwenden wir die elementare Ungleichung ab ≤ a 2 + b2 für a, b ≥ 0. Angewendet auf a = ε|ξ |2 und b = ε −1 , erhält man |ξ |2 = ε|ξ |2 ε−1 ≤ ε2 |ξ |4 + ε−2 ≤ ε2 (1 + |ξ |2 )2 + ε−2 . Somit folgt
4.2
Die Fouriertransformation in Rn
(1 + | · | )
2 1/2
F u L 2 (Rn ) =
105
Rn
(1 + |ξ |2 )|(F u)(ξ )|2 dξ
1/2
1/2 ε 2 (1 + |ξ |2 )2 + (1 + ε−2 ) |(F u)(ξ )|2 dξ Rn 1/2 = ε(1 + | · |2 )F u 2L 2 (Rn ) + 1 + ε−2 F u 2L 2 (Rn ) ≤ ε (1 + | · |2 )F u L 2 (Rn ) + 1 + ε−2 F u L 2 (Rn ) . ≤
Dabei wurde im letzten Schritt die Ungleichung (a 2 + b2 )1/2 ≤ a + b für a, b ≥ 0 verwendet. Wie die Sätze 4.32 und 4.33 zeigen, verwandelt die Fouriertransformation die Ableitung in eine punktweise Multiplikation mit den entsprechenden Koordinatenfunktionen. Dies ist einer der Gründe, warum die Fouriertransformation in der Analysis partieller Differentialgleichungen ein wichtiges Werkzeug darstellt. Andererseits verwandelt die Fouriertransformation die Faltung zweier Funktionen in punktweise Multiplikation der entsprechenden Transformierten, was etwa in der Signaltheorie von Bedeutung ist. Wir beginnen mit der Definition der Faltung für Schwartz-Funktionen. Definition 4.43. Für f , g ∈ S (Rn ) wird die Faltung f ∗ g : Rn → C definiert durch
( f ∗ g)(x) := f (y)g(x − y) dy (x ∈ Rn ). (4.9) Rn
Satz 4.44. Seien f , g ∈ S (Rn ). Dann gilt f ∗ g ∈ S (Rn ), und für jedes α ∈ Nn0
gilt
∂ α ( f ∗ g) = (∂ α f ) ∗ g = f ∗ (∂ α g).
(4.10)
Die Abbildung S (Rn ) × S (Rn ) → S (Rn ), ( f , g) → f ∗ g, ist kommutativ (d. h. es gilt f ∗ g = g ∗ f ) und stetig in jeder Variablen. Für die Fouriertransformierten gilt
F ( f ∗ g) = (2π )n/2 F f · F g, F ( f · g) = (2π )−n/2 F f ∗ F g.
Beweis. Seien f , g ∈ S (Rn ). Im Folgenden schreiben wir g(x − ·) für die Funktion y → g(x − y). Wegen f (·), g(x − ·) ∈ S (Rn ) ⊆ L 2 (Rn ) ist die Faltung ( f ∗ g)(x) an jeder Stelle x ∈ Rn definiert, und die Substitution z = x − y zeigt die Kommutativität. Differentiation unter dem Integral (Satz 3.40) in (4.9) ergibt für α ∈ Nn0
106
4 Distributionen und die Fourier-Transformation α
(∂ ( f ∗ g))(x) =
f (y)(∂ α g)(x − y) dy = ( f ∗ (∂ α g))(x) (x ∈ Rn ).
Rn
Dabei ist y → p|α| (g) f (y) eine integrierbare Majorante, vergleiche Definition 4.21. Wegen f ∗ g = g ∗ f folgt daraus (4.10). Für die Fouriertransformierten erhält man
(F ( f ∗ g))(ξ ) = (2π )−n/2 e−i x·ξ ( f ∗ g)(x) dx Rn
e−i x·ξ f (y)g(x − y) dy dx = (2π )−n/2 n Rn
R
e−i y·ξ f (y) e−i(x−y)·ξ g(x − y) dx dy = (2π )−n/2 n Rn
R
e−i y·ξ f (y) e−i z·ξ g(z) dz dy = (2π )−n/2 n Rn
R e−i y·ξ f (y)(2π )n/2 (F g)(ξ ) dy = (2π )−n/2 Rn
= (2π )
n/2
(F f )(ξ )(F g)(ξ ) (ξ ∈ Rn ).
Dies zeigt F ( f ∗g) = (2π )n/2 F f · F g. Wir wenden dies auf F f und F g an und erhalten wegen F 2 f (x) = f (−x)
F ((F f ) ∗ (F g))(x) = (2π )n/2 (F 2 f )(x)(F 2 g)(x) = (2π )n/2 f (−x)g(−x) = (2π )n/2 ( f g)(−x) = (2π )n/2 F 2 ( f · g)(x) für alle x ∈ Rn . Nimmt man auf beiden Seiten F −1 , folgt F ( f · g) = (2π )−n/2 F f ∗ F g. Die Stetigkeit der Abbildung S (Rn ) → S (Rn ), f → f ∗ g bei festem g ∈ S (Rn ) folgt nun aus der Darstellung f ∗ g = (2π )n/2 F −1 (F f · F g) und der Stetigkeit der Multiplikation (Lemma 4.23 b)) und der Fouriertransformation (Satz 4.32 c)) in S (Rn ). In Definition 4.43 wurde die Faltung für Schwartz-Funktionen definiert. Man sieht leicht, dass man diese Definition auch für f , g ∈ L 1 (Rn ) verwenden kann. Andererseits kann man die Faltung auch distributionell lesen: Für f , g ∈ S (Rn ) gilt
(g ∗ f )(x) = g(y) f (x − y) dy = [g]( f (x − ·)) (x ∈ Rn ). Rn
Auf der rechten Seite kann man jetzt [g] durch eine beliebige temperierte Distribution u ∈ S (Rn ) ersetzen. Definition 4.45. Für u ∈ S (Rn ) und f ∈ S (Rn ) ist die Faltung u ∗ f definiert durch u ∗ f : Rn → C, x → u( f (x − ·)).
4.2
Die Fouriertransformation in Rn
107
Man beachte, dass hier nicht die Faltung zweier Distributionen betrachtet wird, und dass u ∗ f als Funktion und nicht als Distribution definiert wird. Für reguläre Distributionen u = [g] ∈ S (Rn ) folgt direkt aus den Definitionen [g] ∗ f = g ∗ f . Der folgende Satz, der hier nicht bewiesen werden soll, zeigt, dass sich viele Eigenschaften auch auf die Faltung von Distribution und Funktion übertragen. Satz 4.46. Seien u ∈ S (Rn ) und f ∈ S (Rn ).
a) Es ist u ∗ f ∈ C ∞ (Rn ), und für alle α ∈ Nn0 gilt ∂ α (u ∗ f ) = (∂ α u) ∗ f = u ∗ (∂ α f ). Die Funktion u ∗ f ist polynomial beschränkt (vergleiche Beispiel 4.27 b)) und damit [u ∗ f ] ∈ S (Rn ). b) Es gilt
F ([u ∗ f ]) = (2π )n/2 (F f ) · (F u), F ( f · u) = (2π )−n/2 [(F u) ∗ (F f )]. als Gleichheit in S (Rn ). Dabei sind (F f )·(F u) und f · u wie in Lemma 4.28 definiert.
Beispiel 4.47
Für die Dirac-Distribution δ = δ0 erhält man (δ ∗ f )(x) = δ( f (x − ·)) = f (x − 0) = f (x) (x ∈ Rn ) für alle f ∈ S (Rn ). Somit gilt δ ∗ f = f , d. h. die Dirac-Distribution ist bezüglich der Faltung ein neutrales Element.
Was haben wir gelernt?
• Distributionen sind stetige lineare Funktionale auf dem Raum der Testfunktionen, Beispiele sind lokal integrierbare Funktionen, aber auch die Dirac-Distribution. • Ableitung und Fouriertransformation werden für Distributionen über Dualität definiert, d. h. indem die entsprechende Operation auf die Testfunktion angewendet wird.
108
4 Distributionen und die Fourier-Transformation
• Für s ∈ N0 ist der Sobolevraum H s (Rn ) ein Hilbertraum und besteht aus allen Funktionen in L 2 (Rn ), bei welchem die distributionellen (schwachen) Ableitungen bis zur Ordnung s ebenfalls in L 2 (Rn ) liegen. • Die Fouriertransformation wird zunächst für Schwartz-Funktionen definiert, dann auf temperierte Distributionen fortgesetzt und bildet einen Isomorphismus in den folgenden Räumen: F : S (Rn ) → S (Rn ), F : S (Rn ) → S (Rn ), F : L 2 (Rn ) → L 2 (Rn ). Nach dem Satz von Plancherel ist die letzte Abbildung sogar eine Isometrie.
5
Lineare Operatoren in Hilberträumen
Worum geht’s? Der Begriff des selbstadjungierten Operators taucht in mehreren Axio-
men der Quantenmechanik auf, so werden laut [A2] Observable als selbstadjungierte Operatoren definiert, und die zeitliche Entwicklung wird in [A4] mit Hilfe des Hamilton-Operators beschrieben, welcher ebenfalls ein selbstadjungierter Operator ist. Daher beschäftigt sich dieses Kapitel mit dem Studium dieser mathematischen Objekte. Lineare Abbildungen zwischen unendlich-dimensionalen Räumen können sich im Vergleich zum endlich-dimensionalen Fall sehr überraschend verhalten: So ist typischerweise der Definitionsbereich nicht der ganze Raum, und ein injektiver Operator T : H → H ist nicht notwendigerweise surjektiv. Im endlich-dimensionalen Fall H = Rn , in welchem jede lineare Abbildung mit Hilfe einer quadratischen Matrix dargestellt werden kann, ist hingegen jeder injektive Operator auch surjektiv und umgekehrt, wie uns die lineare Algebra sagt. So muss man im unendlich-dimensionalen Fall genauer hinsehen: Ob ein Operator abgeschlossen, symmetrisch oder selbstadjungiert ist, hängt stark von der Wahl des Definitionsbereichs ab. Auch besteht die Menge aller komplexen Zahlen λ, für welche T − λ nicht bijektiv ist, nicht nur aus Eigenwerten – man erhält verschiedene Anteile des Spektrums von T . Da die nachfolgenden Kapitel (und die Axiome der Quantenmechanik) selbstadjungierte Operatoren voraussetzen, sind Kriterien für die Selbstadjungiertheit besonders wichtig. In diesem Kapitel werden zunächst lineare Operatoren und zugehörige Konzepte wie abgeschlossen und abschließbar, Spektrum, Resolvente sowie der adjungierte Operator diskutiert. Damit lassen sich Symmetrie und Selbstadjungiertheit eines Operators definieren, als Beispiel werden Multiplikationsoperatoren betrachtet. Die Friedrichs-Erweiterung liefert eine Methode zur Konstruktion selbstadjungierter Operatoren, und das Kriterium von Kato ist ein Beispiel für einen Störungssatz zur Selbstadjungiertheit. © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2022 R. Denk, Mathematische Grundlagen der Quantenmechanik, https://doi.org/10.1007/978-3-662-65554-2_5
109
110
5.1
5 Lineare Operatoren in Hilberträumen
Abgeschlossene lineare Operatoren
Im Folgenden sei stets H ein C-Hilbertraum mit Skalarprodukt ·, · und zugehöriger Norm · . Da wir auch Abbildungen zwischen zwei verschiedenen Hilberträumen betrachten wollen, seien im Folgenden H1 , H2 zwei C-Hilberträume mit Skalarprodukt ·, ·H j und zugehöriger Norm · H j für j = 1, 2. Falls H ein endlich-dimensionaler Hilbertraum und damit isomorph zu Cn für ein n ∈ N ist, so kann jede lineare Abbildung T : H → H als (n × n)-Matrix beschrieben werden. Wie aus der linearen Algebra bekannt ist, sind in diesem Fall die Eigenschaften injektiv, surjektiv und bijektiv alle äquivalent. Im unendlich-dimensionalen Fall ist dies nicht der Fall, wie das folgende Beispiel zeigt. Beispiel 5.1 (Shift-Operatoren)
Im Hilbertraum 2 (Definition 2.46) definiert man den Rechtsshift S R : D(S R ) = 2 → 2 durch S R (x1 , x2 , . . .) := (0, x1 , x2 , . . .) (x = (xn )n∈N ∈ 2 ). Dann gilt S R x2 = x2 für alle x ∈ 2 , d. h. S R ist eine Isometrie und daher stetig mit Norm 1 (siehe Satz 2.20) sowie injektiv. Andererseits ist der Vektor e1 := (1, 0, 0, . . .) nicht im Wertebereich, und S R ist nicht surjektiv. Analog ist der Linksshift, definiert durch SL (x1 , x2 , . . .) := (x2 , x3 , . . .) (x = (xn )n∈N ∈ 2 ) stetig mit Norm 1 und surjektiv, aber nicht injektiv, denn es gilt SL e1 = 0. Betrachtet man statt 2 den Raum 1/2 |xn |2 0 mit T u L 2 (R) ≤ u L 2 (R) für alle u ∈ H 1 (R), d. h. der Operator T ist unbeschränkt und daher nicht stetig. Dies zeigt den Unterschied zum endlich-dimensionalen Fall, in welchem alle linearen Abbildungen nach Bemerkung 2.23 b) stetig sind. In der folgenden Definition ist H1 ⊕ H2 die direkte Hilbertraumsumme von H1 und H2 (siehe Bemerkung 2.9 b)). Definition 5.3. a) Ein (linearer) Operator T von H1 nach H2 ist eine lineare Abbildung T : H1 ⊇ D(T ) → H2 vom Definitionsbereich D(T ) ⊆ H1 nach H2 , wobei D(T ) ein Untervektorraum von H1 ist. Da hier keine nichtlinearen Operatoren betrachtet werden, verstehen wir im Folgenden unter einem Operator immer einen linearen Operator. Wir schreiben ker T := {x ∈ D(T ) | T x = 0} für den Kern von T und im(T ) := {T x | x ∈ D(T )} für den Wertebereich von T . Die Menge G(T ) := {(x, T x) | x ∈ D(T )} ⊆ H1 ⊕ H2 heißt der Graph von T . b) Der Operator T heißt abgeschlossen, wenn G(T ) eine abgeschlossene Teilmenge von H1 ⊕ H2 ist. c) Der Operator T heißt abschließbar, wenn es einen abgeschlossenen linearen Operator T gibt mit G(T ) = G(T ). Der Operator T heißt die Abschließung oder der Abschluss von T. Bemerkung 5.4. Man beachte, dass die Stetigkeit bei der Definition eines linearen Operators nicht verlangt wird. Nach Definition ist ein Operator T eine lineare Abbildung T : D(T ) → H2 . Für die Frage der Stetigkeit wird D(T ) mit Norm · H1 versehen – da D(T ) ein Untervektorraum von H1 ist, erhält man den normierten Raum (D(T ), ·H1 ). Ein Operator T : (D(T ), · H1 ) → (H2 , · H2 ) ist nach Satz 2.20 genau dann stetig, wenn T stetig an der Stelle 0 ist, d. h. wenn für alle Folgen (xn )n∈N ⊆ D(T ) mit xn H1 → 0 gilt: T xn H2 → 0. Dies ist äquivalent zur Beschränktheit, also zur Bedingung ∃ C > 0 ∀ x ∈ D(T ) : T xH2 ≤ CxH1 .
112
5 Lineare Operatoren in Hilberträumen
Wie bisher bezeichne L(H1 , H2 ) die Menge aller stetigen linearen Operatoren T : H1 → H2 , siehe Definition 2.22. Insbesondere ist für T ∈ L(H1 , H2 ) stets D(T ) = H1 . Die Summe und das Produkt (Komposition) von Operatoren wird auf kanonische Weise definiert. In der folgenden Definition sei H3 ein weiterer C-Hilbertraum. Definition 5.5. Seien S : H1 ⊇ D(S) → H2 , T : H1 ⊇ D(T ) → H2 und R : H2 ⊇ D(R) → H3 lineare Operatoren. a) Dann definiert man die Summe S + T durch D(S + T ) := D(S) ∩ D(T ), (S + T )x := Sx + T x (x ∈ D(S + T )) und das Produkt RT durch D(RT ) := {x ∈ D(T ) | T x ∈ D(R)}, (RT )x := R(T x) (x ∈ D(RT )). b) Man schreibt S ⊆ T , falls D(S) ⊆ D(T ) und T | D(S) = S gilt, und man schreibt S = T , falls S ⊆ T und T ⊆ S gilt. Damit impliziert S = T bereits die Gleichheit der Definitionsbereiche (und der Werte). Nach Teil b) dieser Definition erhält man D(S+T ) = D(T ), falls D(S) = H1 (insbesondere falls S ∈ L(H1 , H2 )). Genauso gilt D(RT ) = D(T ), falls R ∈ L(H2 , H3 ). Lemma 5.6. Sei T : H1 ⊇ D(T ) → H2 ein linearer Operator. Dann sind äquivalent:
(i) T ist abgeschlossen. (ii) Für alle Folgen (xn )n∈N ⊆ D(T ) mit xn → x ∈ H1 und T xn → y ∈ H2 gilt x ∈ D(T ) und T x = y. (iii) (D(T ), · T ) ist vollständig. Dabei ist die Graphennorm · T auf D(T ) definiert durch 1/2 xT := x2H1 + T x2H2 (x ∈ D(T )).
Beweis. Eigenschaft (ii) ist gerade die Abgeschlossenheit des Graphen G(T ) im Produktraum H1 ⊕ H2 , was die Äquivalenz von (i) und (ii) zeigt. (ii)⇒(iii): Sei (xn )n∈N ⊆ D(T ) eine Cauchyfolge bezüglich · T . Dann sind nach Definition der Graphennorm auch (xn )n∈N ⊆ H1 und (T xn )n∈N ⊆ H2 Cauchyfolgen. Da H1 und H2 vollständig sind, existieren x := limn→∞ xn und y := limn→∞ T xn . Nach (ii) folgt x ∈ D(T ) und T x = y. Damit erhalten wir
5.1
Abgeschlossene lineare Operatoren
113
xn − x2T = xn − x2H1 + T xn − T x2H2 = xn − x2H1 + T xn − y2H2 → 0 (n → ∞), also ist (D(T ), · T ) vollständig. (iii)⇒(ii): Seien (xn )n∈N ⊆ D(T ) sowie x und y wie in (ii). Dann sind (xn )n∈N ⊆ H1 und (T xn )n∈N ⊆ H2 Cauchyfolgen, und nach Definition der Graphennorm ist (xn )n∈N ⊆ D(T ) auch eine Cauchyfolge bezüglich · T . Wegen (iii) existiert ein
x ∈ D(T ) mit xn −
x T → 0 (n → ∞). Somit gilt
x = limn→∞ xn = x und T
x = limn→∞ T xn = y, was x ∈ D(T ) und T x = y zeigt. Man beachte, dass nach Definition der Graphennorm T ∈ L((D(T ), · T ), H2 ) für jeden abgeschlossenen Operator T gilt. Lemma 5.7. Sei T ∈ L(H1 , H2 ). Dann ist T abgeschlossen.
Beweis. Wir verwenden Bedingung 5.6 (ii). Sei (xn )n∈N ⊆ D(T ) mit xn → x in H1 und T xn → y in H2 für n → ∞. Dann gilt trivialerweise x ∈ D(T ) = H1 , und da T stetig ist, folgt T xn → T x (n → ∞), d. h. T x = y. Wir werden später sehen (Satz vom abgeschlossenen Graphen, Satz 5.14), dass in gewisser Weise eine Rückrichtung des obigen Lemmas gilt: Falls T abgeschlossen ist mit D(T ) = H1 , so ist T bereits stetig und damit T ∈ L(H1 , H2 ). Lemma 5.8. Sei T : H1 ⊇ D(T ) → H2 ein linearer Operator. Dann sind äquivalent:
(i) T ist abschließbar. (ii) Für jede Folge (xn )n∈N ⊆ D(T ) mit xn → 0 (n → ∞) in H1 und T xn → y (n → ∞) in H2 gilt y = 0.
Beweis. (i)⇒(ii): Sei T abschließbar, und sei (xn )n∈N ⊆ D(T ) wie angegeben. Dann liegt (0, y) im Abschluss von G(T ). Wegen G(T ) = G(T ) folgt y = T (0) = 0. (ii)⇒(i): Wir müssen zeigen, dass G(T ) der Graph eines Operators ist, d. h. für alle (x, y), (x,
y) ∈ G(T ) muss gelten y =
y. Wähle dazu Folgen (xn )n∈N ⊆ D(T ) und (
xn )n∈N ⊆ D(T ) mit (xn , T xn ) → (x, y) und (
xn , T
xn ) → (x,
y) in H1 ⊕ H2 . Dann ist (xn −
xn )n∈N ⊆ D(T ) eine Folge mit xn −
xn → 0, und es gilt T (xn −
xn ) → y −
y in H2 . Wir können also (ii) auf die Folge (xn −
xn )n∈N anwenden und erhalten y =
y.
114
5 Lineare Operatoren in Hilberträumen
Beispiel 5.9
Wir betrachten wieder den Ableitungsoperator (Beispiel 5.2), aber mit einem kleineren Definitionsbereich. Seien H := L 2 (R) und T : H ⊇ D(T ) → H mit D(T ) := D (R) und T u := u für u ∈ D(T ). Dann ist T nicht abgeschlossen, denn zu u ∈ H 1 (R)\ D (R) existiert nach Satz 4.24 eine Folge (u n )n∈N ⊆ D (R) mit u − u n H 1 (R) → 0 (n → ∞). Wegen 1/2 u − u n H 1 (R) = u − u n 2L 2 (R) + u − u n 2L 2 (R) = u − u n T folgt (u, u ) ∈ G(T ), aber (u, u ) ∈ / G(T ). Wir zeigen mit Lemma 5.8, dass T abschließbar ist. Sei (u n )n∈N ⊆ D (R) mit u n → 0 in L 2 (R) und u n → v in L 2 (R). Dann erhält man für alle ϕ ∈ D (R) mit partieller Integration v, ϕ L 2 (R) = lim u n , ϕ L 2 (R) = lim u n (x)ϕ(x) dx = − lim u n (x)ϕ (x) dx n→∞
n→∞ R
n→∞ R
= − lim u n , ϕ L 2 (R) = − lim u n , ϕ L 2 (R) = 0. n→∞
n→∞
Also gilt v ∈ (D (R))⊥ = (D (R))⊥ = L 2 (R)⊥ = {0}, und nach Lemma 5.8 ist T abschließbar. Hier wurde wieder die Dichtheit von D (R) in L 2 (R) (Satz 4.24) verwendet. Häufig ist es wichtig zu wissen, ob ein Operator abgeschlossen oder abschließbar ist. In diesem Zusammenhang sind einige abstrakte Sätze aus der Funktionalanalysis nützlich. Wir beginnen mit einem zentralen Prinzip, welches hier nicht bewiesen werden soll. Der Beweis (siehe etwa [70], Theorem VI.3.3) verwendet den Kategoriensatz von Baire. Seien X , Y Banachräume und T ∈ L(X , Y ) surjektiv. Dann ist T eine offene Abbildung, d. h. falls U ⊆ X eine offene Teilmenge ist, so ist T (U ) = {T x | x ∈ U } ⊆ Y ebenfalls offen. Satz 5.10 (Satz von der offenen Abbildung).
Korollar 5.11. Sei T : H1 ⊇ D(T ) → H2 ein abgeschlossener linearer Operator.
Falls im(T ) abgeschlossen ist, dann ist T : D(T ) → im(T ) eine offene Abbildung. Dabei werden D(T ) mit der Norm · H1 und im(T ) mit der Norm · H2 versehen.
5.1
Abgeschlossene lineare Operatoren
115
Beweis. Da T abgeschlossen ist, ist (D(T ), · T ) nach Lemma 5.6 ein Banachraum, und die Abbildung
: (D(T ), · T ) → (im(T ), · H ), x → T x T 2 ist surjektiv und nach Definition der Graphennorm stetig. Da im(T ) nach Voraussetzung abgeschlossen ist, ist (im(T ), · H2 ) ebenfalls ein Banachraum. Also sind alle Vorausset ist eine offene Abbildung. zungen von Satz 5.10 erfüllt, und T Sei U eine offene Teilmenge von (D(T ), · H1 ), und sei x ∈ U . Dann existiert ein ε > 0 so, dass {u ∈ D(T ) | u − xH1 < ε} ⊆ U (Definition 2.10). Wegen u − xH1 ≤ u − xT folgt {u ∈ D(T ) | u − xT < ε} ⊆ U , d. h. die Menge U ist auch eine offene
offen ist, ist T (U ) = T
(U ) ⊆ im(T ) offen, also ist Teilmenge von (D(T ), · T ). Da T auch T : (D(T ), · H1 ) → (im(T ), · H2 ) eine offene Abbildung. Satz 5.12 (Satz vom stetigen Inversen). Sei T : H1 ⊇ D(T ) → H2 ein injektiver abgeschlossener linearer Operator. Falls im(T ) abgeschlossen ist, so ist der inverse Operator T −1 : (im(T ), · H2 ) → (H1 , · H1 ) stetig.
Beweis. Weil T injektiv ist, existiert die inverse Abbildung T −1 : im(T ) → D(T ). Die Stetigkeit von T −1 ist nach Definition äquivalent zur Offenheit von T (vergleiche Definition 2.17), welche aus Korollar 5.11 folgt. Beispiel 5.13
Sei H := L 2 ((0, 1)), und sei der lineare Operator T definiert durch D(T ) := H und x (T u)(x) := u(s) ds (x ∈ (0, 1), u ∈ H ). 0
Der Operator T ist ein einfaches Beispiel eines Volterra-Operators. Aus der Cauchy– Schwarz-Ungleichung erhalten wir |(T u)(x)| ≤ 0
1
1 · |u(s)| ds ≤ u L 2 ((0,1)) (x ∈ (0, 1), u ∈ H )
und damit T uH ≤ uH . Somit ist T ∈ L(H ), und T ist abgeschlossen nach Lemma 5.7. Wir zeigen, dass T injektiv ist. Sei dazu u ∈ H mit v := T u = 0. Dann gilt v = 0, und für alle ϕ ∈ D ((0, 1)) erhalten wir mit dem Satz von Fubini (Satz 3.43)
116
5 Lineare Operatoren in Hilberträumen
0 = [v ](ϕ) = −[v](ϕ ) = − =−
1
u(s) 0
1
v(x)ϕ (x) dx = −
0
1
ϕ (x) dx ds =
0
s
1 x
1
u(s) ds ϕ (x) dx
0
u(s)ϕ(s) ds = [u](ϕ).
0
Nach dem Fundamentallemma 4.11 folgt u = 0 fast überall. Für n ∈ N definiere u n (x) := x n (x ∈ (0, 1)). Dann ist u n ∈ H und (T u n )(x) = x n+1 n+1 (x ∈ (0, 1)). Wegen u n L 2 ((0,1)) =
1
x 2n dx
1/2
0
1 =√ 2n + 1
1 √ 1 und T u n L 2 ((0,1)) = n+1 gilt u n H ≥ (n + 1)T u n H . Daher ist T −1 nicht 2n+3 stetig, und nach Satz 5.12 ist im(T ) nicht abgeschlossen. Dies ist also ein Beispiel für einen beschränkten linearen Operator mit nicht abgeschlossenem Wertebereich.
Satz 5.14 (Satz vom abgeschlossenen Graphen). Sei T : H1 ⊇ D(T ) → H2 ein abgeschlossener linearer Operator. Falls D(T ) abgeschlossen ist, so ist T stetig.
Beweis. Da T abgeschlossen ist, ist G(T ) mit Norm (x, T x)G := (x2H1 + T x2H2 )1/2 als abgeschlossener Unterraum von H1 ⊕ H2 selbst ein Hilbertraum. Die Projektion π1 : G(T ) → H1 , (x, T x) → x, ist injektiv und hat Operatornorm ≤ 1, ist also stetig und damit ein abgeschlossener linearer Operator (Lemma 5.7). Der Wertebereich im(π1 ) = D(T ) ist nach Voraussetzung abgeschlossen in H1 . Nach Satz 5.12 ist π1−1 stetig als Abbildung von (D(T ), ·H1 ) nach (G(T ), ·G ). Ebenso ist π2 : G(T ) → H2 , (x, T x) → T x, stetig als Abbildung von (G(T ), ·G ) nach (im(T ), ·H2 ). Damit ist T = π2 ◦ π1−1 stetig.
Korollar 5.15 (Satz von Hellinger–Toeplitz). Sei T : H → H ein linearer Operator
mit D(T ) = H und
T x, yH = x, T yH Dann ist T stetig.
(x, y ∈ H ).
5.2
Spektrum und Resolvente
117
Beweis. Wir zeigen, dass T abgeschlossen ist. Sei dazu (xn )n∈N ⊆ H mit xn → x (n → ∞) und T x n → y (n → ∞). Für alle z ∈ H gilt dann y, zH = lim T xn , z = lim xn , T zH = x, T zH = T x, zH . n→∞
n→∞
Also gilt y − T x, zH = 0 für alle z ∈ H und damit y = T x, was die Abgeschlossenheit von T zeigt. Nach Satz 5.14 ist T ∈ L(H ). Lemma 5.16. Sei T : H1 ⊇ D(T ) → H2 ein abgeschlossener linearer Operator.
Dann sind äquivalent: (i) Es existiert ein C > 0 mit T xH2 ≥ CxH1 (x ∈ D(T )). (ii) T ist injektiv und im(T ) ist abgeschlossen.
Beweis. (i)⇒(ii): Der Operator T : (D(T ), ·T ) → (im(T ), · H2 ) ist stetig, surjektiv und wegen (i) auch injektiv. Ebenfalls aus (i) folgt, dass T −1 stetig ist. Sei (yn )n∈N ⊆ im(T ) eine Folge mit yn → y ∈ H2 (n → ∞). Wegen der Stetigkeit von T −1 ist dann die Folge (xn )n∈N mit xn := T −1 yn eine Cauchyfolge in H1 . Damit ist (xn , T xn )n∈N eine Cauchyfolge in H1 ⊕ H2 , d. h. (xn )n∈N ist auch eine Cauchyfolge in (D(T ), · T ). Da T abgeschlossen ist, existiert x ∈ D(T ) mit xn − xT → 0 (n → ∞). Damit folgt y = limn→∞ yn = limn→∞ T xn = T x ∈ im(T ), was die Abgeschlossenheit von im(T ) zeigt. (ii)⇒(i): Dies folgt direkt aus dem Satz vom stetigen Inversen (Satz 5.12).
5.2
Spektrum und Resolvente
Wieder sei im Folgenden H ein C-Hilbertraum mit Skalarprodukt ·, · und zugehöriger Norm · , wobei wir zusätzlich H = {0} annehmen. Falls H endlich-dimensional ist und T ∈ L(H ), dann ist T − λ idH genau dann bijektiv, wenn T − λ idH injektiv ist. Somit besteht das Spektrum von T in diesem Fall aus den Eigenwerten von T . Im unendlichdimensionalen Fall ist die Situation komplizierter, und man betrachtet verschiedene Anteile des Spektrums. Wir schreiben kurz T − λ statt T − λ idH . Definition 5.17. Sei T : H ⊇ D(T ) → H ein abgeschlossener linearer Operator. a) Die Resolventenmenge ρ(T ) ⊆ C von T ist definiert durch ρ(T ) := {λ ∈ C T − λ : D(T ) → H bijektiv}.
118
5 Lineare Operatoren in Hilberträumen
b) Das Spektrum σ (T ) von T wird definiert als σ (T ) := C \ ρ(T ). Das Punktspektrum von T ist definiert als σ p (T ) := {λ ∈ C T − λ : D(T ) → H nicht injektiv}. Die Zahlen λ ∈ σ p (T ) heißen die Eigenwerte von T . Die Menge σc (T ) := {λ ∈ C T − λ : D(T ) → H injektiv, nicht surjektiv, im(T − λ) = H } heißt das kontinuierliche Spektrum von T . Das Restspektrum oder residuelle Spektrum von T ist definiert durch σr (T ) := {λ ∈ C T − λ : D(T ) → H injektiv, im(T − λ) = H }. Für λ ∈ σ p (T ) heißt ker(T − λ) der geometrische Eigenraum von T zu λ und {x ∈ H | ∃ n ∈ N : x ∈ D(T n ) und (T − λ)n x = 0} der algebraische Eigenraum oder Hauptraum von T zu λ. Die von Null verschiedenen Elemente des geometrischen Eigenraums heißen die Eigenvektoren von T . Falls H ein Raum von Funktionen ist, spricht man auch von Eigenfunktionen. Bemerkung 5.18. a) Nach Definition gilt ˙ σc (T ) ∪ ˙ σr (T ), C = ρ(T ) ∪˙ σ (T ) = ρ(T ) ∪˙ σ p (T ) ∪ ˙ wieder die disjunkte Vereinigung bezeichnet. wobei ∪ b) Wir haben das Spektrum nur für abgeschlossene Operatoren definiert, da man in der Quantenmechanik stets abgeschlossene Operatoren betrachtet, welche meistens als Abschluss eines geeignet definierten abschließbaren Operators konstruiert werden. Für nicht abgeschlossene Operatoren ist die Definition der spektralen Anteile in der Literatur nicht ganz einheitlich. c) Falls T abgeschlossen ist, ist auch T − λ abgeschlossen. Mit dem Satz vom stetigen Inversen (Satz 5.12) folgt, dass für alle λ ∈ ρ(T ) der Operator (T − λ)−1 : H → H stetig ist, d. h. es gilt (T − λ)−1 ∈ L(H ). Für nicht abgeschlossene Operatoren wird diese Stetigkeit meistens mit in die Definition der Resolventenmenge aufgenommen. d) Falls H endlich-dimensional ist, ist jeder dicht definierte Operator stetig und damit auf ganz H definierbar. Für T ∈ L(H ) folgt in diesem Fall σc (T ) = σr (T ) = ∅.
5.2
Spektrum und Resolvente
119
Beispiel 5.19
Sei H = 2 und S R ∈ L(H ) der Rechtsshift aus Beispiel 5.1, d. h. S R (x1 , x2 , . . . ) := (0, x1 , x2 , . . . ) (x ∈ 2 ). Dann ist D(S R ) = 2 , ker S R = {0}, und für e1 := (1, 0, 0, . . . ) gilt e1 ∈ (im(S R ))⊥ . Daher ist im(S R ) = H und 0 ∈ σr (S R ). Definition 5.20. Sei T : H ⊇ D(T ) → H ein abgeschlossener linearer Operator. Für λ ∈ ρ(T ) heißt Rλ (T ) := (T − λ)−1 die Resolvente von T an der Stelle λ. Die Abbildung ρ(T ) → L(H ), λ → (T − λ)−1 heißt Resolventenabbildung. Man beachte in obiger Definition, dass (T − λ)−1 ∈ L(H ) nach Bemerkung 5.18 c) gilt. Lemma 5.21 (Neumannsche Reihe). Sei T ∈ L(H ) mit T < 1, wobei T die Operatornorm von T bezeichne (siehe Definition 2.22). Dann existiert (1 − T )−1 ∈ L(H ), und es gilt ∞ (1 − T )−1 = Tn n=0
(Konvergenz der Reihe bezüglich der Operatornorm) und (1 − T )−1 ≤
Beweis. Es gilt
N N ∞ n n T ≤ T ≤ T n = n=0
n=0
n=0
1 1−T .
1 , 1 − T
d. h. die Reihe konvergiert absolut. Da L(H ), versehen mit der Operatornorm, vollständig
1 n ist (siehe Bemerkung 2.23 a)), existiert S := ∞ n=0 T ∈ L(H ), und es gilt S ≤ 1−T . Weiter folgt ∞ N ST = T S = lim T n+1 = T n = S − 1, N →∞
n=0
n=1
d. h. S(1 − T ) = (1 − T )S = 1. Also ist 1 − T invertierbar mit (1 − T )−1 = S.
Satz 5.22. Sei T : H ⊇ D(T ) → H ein abgeschlossener linearer Operator. Dann ist ρ(T ) offen und somit σ (T ) abgeschlossen.
120
5 Lineare Operatoren in Hilberträumen
Beweis. Falls ρ(T ) = ∅, so ist nichts zu zeigen. Sei also λ0 ∈ ρ(T ). Es gilt T − λ = T − λ0 − (λ − λ0 ) = (T − λ0 ) 1 − (λ − λ0 )(T − λ0 )−1 . Nach Bemerkung 5.18 c) ist (T − λ0 )−1 stetig. Für λ ∈ C mit |λ − λ0 | · (T − λ0 )−1 < 1 existiert −1 ∈ L(H ) 1 − (λ − λ0 )(T − λ0 )−1 nach Lemma 5.21. Damit existiert auch −1 (T − λ)−1 = 1 − (λ − λ0 )(T − λ0 )−1 (T − λ0 )−1 ∈ L(H ). Somit gilt
−1 λ ∈ C |λ − λ0 | < (T − λ0 )−1 ⊆ ρ(T ),
also ist ρ(T ) offen.
Korollar 5.23. Sei T : H ⊇ D(T ) → H ein abgeschlossener linearer Operator. a) Für λ0 ∈ ρ(T ) gilt 1 (T − λ0 )−1 ≥ . dist(λ0 , σ (T ))
b) Für λ0 ∈ ρ(T ) und λ ∈ C mit |λ − λ0 | < (T − λ0 )−1 −1 gilt (T − λ)−1 =
∞
(λ − λ0 )n [(T − λ0 )−1 ]n+1 .
n=0
Beweis. a) folgt aus der letzten Formel im Beweis von Satz 5.22, b) aus der Darstellung von (T − λ)−1 im Beweis von Satz 5.22 und der Neumann-Reihe.
Satz 5.24. Sei T ∈ L(H ). Dann ist das Spektrum σ (T ) ⊆ C kompakt und nichtleer.
Beweis. (i) Kompaktheit von σ (T ): Für λ ∈ C mit |λ| > T ist T − λ = (−λ)(1 − λ−1 T ) nach Lemma 5.21 invertierbar, d. h. λ ∈ ρ(T ). Also ist σ (T ) eine nach Satz 5.22 abgeschlossene Teilmenge der beschränkten Menge {λ ∈ C | |λ| ≤ T } und damit kompakt. (ii) Wir nehmen an, dass σ (T ) = ∅ und damit ρ(T ) = C gilt. Sei λ0 ∈ C. Dann gilt mit Korollar 5.23 b) für alle x, y ∈ H und alle λ in einer Umgebung von λ0 die Reihenentwicklung
5.2
Spektrum und Resolvente
f x,y (λ) := (T − λ)
121 −1
∞ x, y = (T − λ0 )−(n+1) x, y(λ − λ0 )n .
(5.1)
n=0
Damit ist die Funktion f x,y : C → C an jeder Stelle λ0 ∈ C komplex differenzierbar und damit holomorph. Für |λ| ≥ 2T erhält man mit der Neumannschen Reihe (T − λ)−1 = −
T −1 1 1− =− λ−n−1 T n λ λ ∞
n=0
und somit unter Verwendung der Cauchy–Schwarz-Ungleichung | f x,y (λ)| ≤
∞ ∞ x y 1 n x y T n . x y ≤ ≤ |λ|n+1 |λ| 2 T n=0
n=0
Da f x,y als stetige Funktion auf der kompakten Menge {λ ∈ C | |λ| ≤ 2T } beschränkt ist (Satz 2.28), ist f x,y : C → C eine holomorphe beschränkte Funktion. Nach dem Satz von Liouville aus der Funktionentheorie (siehe etwa [11], Satz 8.2) folgt, dass f x,y eine konstante Funktion ist. Damit sind alle Koeffizienten in der Potenzreihendarstellung (5.1) gleich Null bis auf den konstanten Term n = 0. Insbesondere gilt für den linearen Term n = 1 (T − λ0 )−2 x, y = 0 (x, y ∈ H ) und daher (T − λ0 )−2 = 0 im Widerspruch zur Bijektivität von T − λ0 und damit von (T − λ0 )2 . Wir erhalten ρ(T ) = C, d. h. σ (T ) = ∅. Beispiel 5.25
Die folgenden Beispiele zeigen, dass für unbeschränkte Operatoren sehr wohl die Fälle σ (T ) = C und σ (T ) = ∅ auftreten können. Wir betrachten wieder den Ableitungsoperator, diesmal allerdings auf dem endlichen Intervall (0, 1). a) Seien H = L 2 ((0, 1)) und T : H ⊇ D(T ) → H definiert durch D(T ) := H 1 ((0, 1)) und T u := u (u ∈ D(T )) (vergleiche Beispiele 5.2 und 5.9). Wie in Beispiel 5.9 sieht man, dass T abgeschlossen ist. Zu λ ∈ C betrachte die Funktion u λ : (0, 1) → C, x → eλx . Dann ist u λ ∈ H 1 ((0, 1)), und es gilt T u λ − λu λ = u λ − λu λ = 0. Somit ist u λ ∈ ker(T − λ) \ {0}, was σ p (T ) = C und damit ρ(T ) = ∅ zeigt. b) Wir betrachten denselben Operator wie in a), allerdings jetzt auf dem Definitionsbereich D(T ) := {u ∈ H 1 ((0, 1)) | u(0) = 0}. Dazu beachte man, dass nach dem Sobolevschen Einbettungssatz (Satz 4.18), angewendet auf das eindimensionale glatte Gebiet G = (0, 1) ⊆ R, die Einbettung H 1 ((0, 1)) ⊆ BUC((0, 1)) gilt. Da jede beschränkte und gleichmäßig stetige Funktion auf (0, 1) eindeutig auf [0, 1] fort-
122
5 Lineare Operatoren in Hilberträumen
gesetzt werden kann, ist insbesondere der Funktionswert u(0) für u ∈ H 1 ((0, 1)) definiert, und nach Satz 4.18 gilt |u(0)| ≤ Cu H 1 ((0,1)) (u ∈ H 1 ((0, 1))). Damit ist die Abbildung H 1 ((0, 1)) → C, u → u(0) stetig und D(T ) ist als Kern dieser stetigen Abbildung abgeschlossen in H 1 ((0, 1)). Als Einschränkung des Operators aus a) auf den abgeschlossenen Unterraum D(T ) ist T selbst wieder abgeschlossen. Sei f ∈ H = L 2 ((0, 1)). Dann ist die eindeutige Lösung der gewöhnlichen Differentialgleichung u − λu = f mit Anfangswert u(0) = 0 gegeben durch x u(x) = eλ(x−y) f (y) dy (x ∈ (0, 1)). 0
Dabei ist die rechte Seite für alle f ∈ L 2 ((0, 1)) definiert. Wegen |u(x)| ≤ max |eλz | z∈[0,1]
0
1
1 · | f (y)| dy ≤ max |eλz | f L 2 ((0,1)) z∈[0,1]
gilt u ∈ L 2 ((0, 1)), und mit u = f + λu ∈ L 2 ((0, 1)) folgt u ∈ H 1 ((0, 1)). Somit hat die Gleichung (T − λ)u = f für jedes f ∈ H eine eindeutige Lösung u ∈ D(T ), und wir erhalten ρ(T ) = C und damit σ (T ) = ∅. Der Vergleich von a) und b) zeigt, dass eine kleine Änderung des Definitionsbereichs das Spektrum eines unbeschränkten Operators erheblich beeinflussen kann.
5.3
Der adjungierte Operator
In der linearen Algebra haben die symmetrischen (falls K = R) bzw. die hermiteschen (falls K = C) Matrizen besonders gute Eigenschaften. So sind etwa alle Eigenwerte reell, und die Matrizen können orthogonal bzw. unitär auf Diagonalform transformiert werden. Für lineare Operatoren in unendlich-dimensionalen Hilberträumen haben die selbstadjungierten Operatoren vergleichbare Eigenschaften. Dazu definieren wir zunächst den Begriff des adjungierten Operators. Für spätere Anwendungen betrachten wir hierbei wieder Operatoren zwischen zwei C-Hilberträumen H1 , H2 , auch wenn in den meisten Fällen H1 = H2 = H gilt. Definition 5.26. Sei T : H1 ⊇ D(T ) → H2 ein linearer Operator, welcher dicht definiert ist (d. h. es gilt D(T ) = H1 ). Dann definiert man den adjungierten Operator T ∗ : H2 ⊇ D(T ∗ ) → H1 durch
5.3
Der adjungierte Operator
123
D(T ∗ ) := y ∈ H2 ∃ z ∈ H1 ∀ x ∈ D(T ) : T x, yH2 = x, zH1 und T ∗ y := z (y ∈ D(T ∗ )). Bemerkung 5.27. a) Man beachte die Bedingung D(T ) = H1 . Seien y ∈ D(T ∗ ) und z 1 , z 2 ∈ H1 mit T x, yH2 = x, z 1 H1 = x, z 2 H1 (x ∈ D(T )). Dann gilt z 1 − z 2 ∈ (D(T ))⊥ = (D(T ))⊥ = H1⊥ = {0} und somit z 1 = z 2 . Dies zeigt, dass T ∗ y wohldefiniert ist. Falls D(T ) nicht dicht in H1 ist, so ist die Eindeutigkeit von z nicht gesichert, und der adjungierte Operator kann nicht definiert werden. b) Sei (y, z) ∈ H2 × H1 . Dann gilt nach Definition genau dann (y, z) ∈ G(T ∗ ), falls T x, yH2 = x, zH1 (x ∈ D(T )). c) Sei T wie in der Definition, und sei S : H1 ⊇ D(S) → H2 ein weiterer dicht definierter Operator mit S ⊆ T . Dann folgt aus b) sofort G(T ∗ ) ⊆ G(S ∗ ) und damit T ∗ ⊆ S ∗ . d) Sei T wie in der Definition, und sei y ∈ H2 . Falls die Abbildung L y : (D(T ), · H1 ) → C, x → T x, yH2
(5.2)
stetig ist, so kann sie aufgrund der Dichtheit von D(T ) eindeutig zu einem stetigen linearen Funktional
L y ∈ H1 fortgesetzt werden. Nach dem Satz von Riesz (Satz 2.37) existiert in diesem Fall genau ein z ∈ H1 mit
L y x = x, zH1 (x ∈ H1 ), und damit gilt y ∈ D(T ∗ ). Umgekehrt folgt aus y ∈ D(T ∗ ) sofort die Stetigkeit der Abbildung L y . Damit erhalten wir D(T ∗ ) = y ∈ H2 | die Abbildung L y in (5.2) ist stetig . Dies ist die Grundlage für die Definition des adjungierten Operators für lineare Operatoren zwischen Banachräumen. Man beachte in der folgenden Aussage, dass die Schreibweise S ⊆ T für Operatoren als D(S) ⊆ D(T ) und T | D(S) = S definiert wurde (Definition 5.5), also durch die Bedingung G(S) ⊆ G(T ).
124
5 Lineare Operatoren in Hilberträumen
Satz 5.28. Sei T : H1 ⊇ D(T ) → H2 ein dicht definierter linearer Operator.
a) Der adjungierte Operator T ∗ : H2 ⊇ D(T ∗ ) → H1 ist abgeschlossen. b) T ∗ ist genau dann dicht definiert, wenn T abschließbar ist, und in diesem Fall gilt T ⊆ T = T ∗∗ .
Beweis. a) Sei (yn )n∈N ⊆ D(T ∗ ) eine Folge mit yn → y und T ∗ yn → z für n → ∞. Dann gilt T x, yH2 = lim T x, yn H2 = lim x, T ∗ yn H1 = x, zH1 (x ∈ D(T )), n→∞
n→∞
und nach Bemerkung 5.27 b) folgt y ∈ D(T ∗ ) sowie T ∗ y = z, was die Abgeschlossenheit von T ∗ zeigt. b) Sei zunächst T ∗ dicht definiert. In einem ersten Schritt zeigen wir T ⊆ T ∗∗ . Für x ∈ D(T ) und y ∈ D(T ∗ ) gilt T x, yH2 = x, T ∗ yH1 . Daher ist die Abbildung D(T ∗ ) → C, y → T ∗ y, xH1 stetig, was x ∈ D(T ∗∗ ) zeigt (siehe Bemerkung 5.27 d)). Weiter gilt y, T ∗∗ xH2 = T ∗ y, xH1 = y, T xH2 (y ∈ D(T ∗ )), und da D(T ∗ ) ⊆ H2 dicht ist, folgt T x = T ∗∗ x (x ∈ D(T )) und damit T ⊆ T ∗∗ . Nach a) ist T ∗∗ abgeschlossen, insbesondere ist T abschließbar, und es gilt G(T ) ⊆ G(T ∗∗ ). Um die andere Inklusion zu zeigen, genügt es nach Korollar 2.36, die Inklusion G(T )⊥ ⊆ G(T ∗∗ )⊥ zu zeigen, wobei sich „⊥“ auf das Skalarprodukt in H1 ⊕ H2 (siehe Bemerkung 2.9 b)) bezieht. Sei also (u, v) ∈ G(T )⊥ . Dann gilt für alle x ∈ D(T ) x, uH1 + T x, vH2 = 0. Nach Definition von T ∗ folgt v ∈ D(T ∗ ) und T ∗ v = −u. Für alle (y, T ∗∗ y) ∈ G(T ∗∗ ) erhalten wir y, uH1 + T ∗∗ y, vH2 = y, uH1 + y, T ∗ vH1 = y, u + T ∗ vH1 = 0. Also gilt (u, v) ∈ G(T ∗∗ )⊥ , und mit Korollar 2.36 folgt G(T ∗∗ ) ⊆ G(T ) und somit T = T ∗∗ . Wir haben bisher gezeigt, dass aus D(T ∗ ) = H2 die Abschließbarkeit von T sowie T = T ∗∗ folgen. Um den Beweis zu schließen, müssen wir noch zeigen, dass für abschließbare Operatoren T der adjungierte Operator dicht definiert ist. Sei also T abschließbar, und sei z ∈ D(T ∗ )⊥ . Für alle (u, v) ∈ G(T )⊥ gilt 0 = (x, T x), (u, v)H1 ⊕H2 = x, uH1 + T x, vH2 (x ∈ D(T )),
5.3
Der adjungierte Operator
125
und nach Bemerkung 5.27 b) folgt (v, −u) ∈ G(T ∗ ). Somit erhalten wir (0, z), (u, v)H1 ⊕H2 = z, vH2 = 0 ((u, v) ∈ G(T )⊥ ), wobei die letzte Gleichheit aus v ∈ D(T ∗ ) und z ∈ D(T ∗ )⊥ folgt. Somit ist (0, z) ∈ G(T )⊥⊥ = G(T ) = G(T ), was z = T (0) = 0 impliziert. Also gilt D(T ∗ )⊥ = {0} und folglich D(T ∗ ) = H2 .
Satz 5.29. Sei T : H1 ⊇ D(T ) → H2 ein dicht definierter Operator. Dann gilt ⊥
im(T )⊥ = im(T ) = ker T ∗ und im(T ) = (ker T ∗ )⊥ . Falls T abschließbar ist, gilt außerdem im(T ∗ )⊥ = ker T und im(T ∗ ) = (ker T )⊥ .
Beweis. Es gilt y ∈ im(T )⊥ genau dann, wenn T x, y = 0 für alle x ∈ D(T ) gilt. Dies ist äquivalent zu y ∈ D(T ∗ ) und T ∗ y = 0, also zu y ∈ ker T ∗ . Somit erhalten wir im(T )⊥ = ker T ∗ , und wegen im(T ) = (im(T ))⊥⊥ folgt daraus im(T ) = (ker T ∗ )⊥ . Falls T abschließbar ist, ist T ∗ nach Satz 5.28 dicht definiert, und es gilt T = T ∗∗ . Wir können also die bisher bewiesenen Aussagen auf T ∗ anwenden. Für beschränkte Operatoren ist der Begriff des adjungierten Operators besonders einfach, wie das folgende Resultat zeigt. Lemma 5.30. Sei T ∈ L(H1 , H2 ). Dann ist T ∗ ∈ L(H2 , H1 ) mit T ∗ L(H2 ,H1 ) =
T L(H1 ,H2 ) , und T ∗ ist durch die Bedingung
T x, yH2 = x, T ∗ yH1 (x ∈ H1 , y ∈ H2 )
(5.3)
eindeutig festgelegt.
Beweis. Aus T ∈ L(H1 , H2 ) folgt mit der Cauchy–Schwarz-Ungleichung (Satz 2.4 a)) und der Definition der Operatornorm |T x, yH2 | ≤ T L(H1 ,H2 ) xH1 yH2
126
5 Lineare Operatoren in Hilberträumen
für alle x ∈ H1 und y ∈ H2 . Also ist die Abbildung L y : H1 → C, x → T x, yH2 für alle y ∈ H2 ein stetiges lineares Funktional auf H1 , und mit Bemerkung 5.27 d) erhalten wir D(T ∗ ) = H2 . Für den Operator T ∗ gilt nach Definition des adjungierten Operators die Identität (5.3). Andererseits wird durch (5.3) bereits der Wert von x, T ∗ yH1 für alle x ∈ H1 und y ∈ H2 und damit der Wert von T ∗ y für alle y ∈ H2 festgelegt. Zur Bestimmung von T ∗ L(H2 ,H1 ) verwenden wir, dass nach dem Satz von Riesz (Satz 2.37) T ∗ yH1 = L y H1 gilt. Es folgt T ∗ yH1 = ≤
sup
|L y x| =
sup
T L(H1 ,H2 ) xH1 yH2 = T L(H1 ,H2 ) yH2
xH 1 ≤1 xH 1 ≤1
sup
xH 1 ≤1
|T x, yH2 |
für alle y ∈ H2 und damit T ∗ L(H2 ,H1 ) ≤ T L(H1 ,H2 ) . Als stetiger Operator ist T abgeschlossen (Lemma 5.7), und nach Satz 5.28 b) gilt T = ∗∗ T . Also erhalten wir T L(H1 ,H2 ) = T ∗∗ L(H1 ,H2 ) ≤ T ∗ L(H2 ,H1 ) und somit T ∗ L(H2 ,H1 ) = T L(H1 ,H2 ) .
Korollar 5.31. Seien T ∈ L(H1 , H2 ) und S ∈ L(H2 , H3 ). Dann gilt (ST )∗ = T ∗ S ∗ .
Falls T ∈ L(H1 , H2 ) invertierbar ist, so ist auch T ∗ ∈ L(H2 , H1 ) invertierbar, und es gilt (T ∗ )−1 = (T −1 )∗ .
Beweis. Die erste Aussage folgt sofort aus ST x, yH3 = T x, S ∗ yH2 = x, T ∗ S ∗ yH1 (x ∈ H1 , y ∈ H3 ) und Lemma 5.30. Falls T invertierbar ist, gilt T T −1 = idH2 und T −1 T = idH1 , und wegen idH j = id∗H , j = 1, 2, erhalten wir (T −1 )∗ T ∗ = idH2 und T ∗ (T −1 )∗ = idH1 und damit j
(T ∗ )−1 = (T −1 )∗ .
Definition 5.32. Ein Operator T ∈ L(H1 , H2 ) heißt unitär, falls T ∗ T = idH1 und T T ∗ = idH2 gilt.
5.4
Selbstadjungierte Operatoren
127
Bemerkung 5.33. Sei T ∈ L(H1 , H2 ) ein unitärer Operator. Dann gilt nach Lemma 5.30 T x2H2 = T x, T xH2 = x, T ∗ T xH1 = x, xH1 = x2H1 (x ∈ H1 ), d. h. T ist eine Isometrie.
5.4
Selbstadjungierte Operatoren
Wie bisher sei H ein C-Hilbertraum mit Skalarprodukt ·, · und Norm · . Die obigen Sätze wurden für den Fall zweier Hilberträume H1 und H2 formuliert. Die folgenden Definitionen, welche zentral für die Quantenmechanik sind, sind jedoch nur für H1 = H2 sinnvoll. Definition 5.34. Sei T : H ⊇ D(T ) → H ein dicht definierter linearer Operator. Dann heißt T (i) (ii) (iii) (iv)
selbstadjungiert, falls T = T ∗ , wesentlich selbstadjungiert, falls T abschließbar ist und T selbstadjungiert ist, symmetrisch, falls T ⊆ T ∗ gilt, normal, falls D(T ) = D(T ∗ ) und T x = T ∗ x (x ∈ D(T )) gilt.
Bei dieser Definition ist wieder zu beachten, dass die Gleichheit zweier Operatoren insbesondere die Gleichheit der Definitionsbereiche voraussetzt (Definition 5.5). Beim Nachweis der Selbstadjungiertheit ist die Bestimmung des Definitionsbereichs von T ∗ oft der schwierigste Schritt, während die Symmetrie häufig einfacher folgt. Für einen selbstadjungierten Operator wird dabei immer vorausgesetzt, dass er dicht definiert ist (sonst ist der adjungierte Operator gar nicht definiert). Bemerkung 5.35. a) Ein dicht definierter Operator ist nach Definition genau dann symmetrisch, wenn T x, y = x, T y (x, y ∈ D(T )). Dies kann auch als Definition für symmetrische, nicht dicht definierte Operatoren verwendet werden. b) Ein beschränkter Operator T ∈ L(H ) ist genau dann symmetrisch, wenn er selbstadjungiert ist. Denn aus T ⊆ T ∗ und D(T ) = D(T ∗ ) = H (siehe Lemma 5.30) folgt T = T ∗. c) Normale Operatoren sind abgeschlossen. Denn sei T : H ⊇ D(T ) → H ein normaler Operator. Dann ist D(T ), versehen mit der Graphennorm · T , ein Banachraum wegen
128
5 Lineare Operatoren in Hilberträumen
D(T ) = D(T ∗ ), der Gleichheit von ·T und ·T ∗ auf D(T ) und der Abgeschlossenheit von T ∗ . d) Falls T ∈ L(H ), so ist T genau dann normal, falls T T ∗ = T ∗ T gilt. Denn für T ∈ L(H ) ist D(T ) = D(T ∗ ) = H nach Lemma 5.30, und aus T x2 = T ∗ x2 (x ∈ H ) folgt mit der Polarisationsformel (Satz 2.3) auch T x, T y = T ∗ x, T ∗ y (x, y ∈ H ). Damit gilt T ∗ T x, y = T x, T y = T ∗ x, T ∗ y = T T ∗ x, y (x, y ∈ H ), d. h. T ∗ T = T T ∗ . Andererseits folgt aus T T ∗ = T ∗ T sofort T x2 = T x, T x = T ∗ T x, x = T T ∗ x, x = T ∗ x, T ∗ x = T ∗ x2 (x ∈ H ).
Lemma 5.36. Sei T : H ⊇ D(T ) → H ein dicht definierter Operator. Dann ist T
genau dann symmetrisch, falls T x, x ∈ R (x ∈ D(T )).
(5.4)
Beweis. Falls T symmetrisch ist, gilt T x, x = x, T x = T x, x für alle x ∈ D(T ), also gilt (5.4). Sei nun T ein dicht definierter Operator, und es gelte (5.4). Seien x, y ∈ D(T ). Dann gilt nach Voraussetzung T (x + α y), x + α y = T (x + α y), x + α y für alle α ∈ C. Durch Ausmultiplizieren erhält man α T y, x + α T x, y = α y, T x + α x, T y (α ∈ C). Setzt man nun α = 1 bzw. α = i, folgt daraus T y, x + T x, y = y, T x + x, T y , T y, x − T x, y = y, T x − x, T y . Wir erhalten also T y, x = y, T x für alle x, y ∈ D(T ), d. h. T ist symmetrisch.
5.4
Selbstadjungierte Operatoren
129
Satz 5.37 Sei T : H ⊇ D(T ) → H ein dicht definierter, symmetrischer Operator.
a) T ist abschließbar mit T = T ∗∗ , und der Operator T ist ebenfalls symmetrisch. Es gilt (T )∗ = T ∗ . b) Es gilt T x, x ∈ R für alle x ∈ D(T ). c) Für alle λ ∈ C \ R gilt (T − λ)x ≥ |Im λ| x (x ∈ D(T )). Insbesondere ist T − λ injektiv für alle λ ∈ C \ R. d) T ist genau dann abgeschlossen, wenn im(T − λ) für ein λ ∈ C \ R abgeschlossen ist. In diesem Fall gilt dies für alle λ ∈ C \ R.
Beweis. a) Wegen T ⊆ T ∗ und der Abgeschlossenheit von T ∗ ist T abschließbar. Außerdem ist T ∗ dicht definiert sowie T = T ∗∗ nach Satz 5.28. Nach Bemerkung 5.27 c) gilt T ∗∗ ⊆ T ∗ , und wegen T ⊆ T = T ∗∗ ⊆ T ∗ = T ∗ = T ∗∗∗ = (T )∗ ist auch T symmetrisch. b) Dies folgt aus Lemma 5.36. c) Für x = 0 ist dies trivial. Für alle x ∈ D(T ) \ {0} erhält man wegen b) |Im λ| x2 = Im(T − λ)x, x ≤ (T − λ)x, x ≤ (T − λ)x x. Die Behauptung folgt nun durch Division mit x. d) Falls T abgeschlossen ist, so ist auch T − λ abgeschlossen, und aus c) und Lemma 5.16 folgt die Abgeschlossenheit von im(T − λ) für jedes λ ∈ C \ R. Sei nun im(T − λ) für ein λ ∈ C \ R abgeschlossen, und sei (xn )n∈N ⊆ D(T ) mit xn → x ∈ H und yn := (T − λ)xn → y ∈ H für n → ∞. Wegen der Abgeschlossenheit von im(T − λ) folgt y ∈ im(T − λ), d. h. es existiert ein
x ∈ D(T ) mit (T − λ)
x = y. Nach c) gilt 1 yn − y → 0 (n → ∞), x ≤ xn −
|Im λ| also folgt x =
x wegen der Eindeutigkeit des Grenzwerts. Dies zeigt x ∈ D(T − λ) und (T − λ)x = y. Also ist T − λ und damit auch T abgeschlossen.
130
5 Lineare Operatoren in Hilberträumen
Beispiel 5.38
Wir setzen Beispiel 5.25 fort und betrachten den Ableitungsoperator auf H := L 2 ((0, 1)) mit Skalarprodukt ·, · := ·, · L 2 ((0,1)) . Wir multiplizieren den Ableitungsoperator mit i, um symmetrische Operatoren zu erhalten. Für u ∈ H 1 ((0, 1)) definieren wir die drei Operatoren T1 , T2 , T3 durch D(T1 ) := H 1 ((0, 1)), D(T2 ) := {u ∈ H 1 ((0, 1)) | u(0) = u(1)}, D(T3 ) := {u ∈ H 1 ((0, 1)) | u(0) = u(1) = 0} und T j u := iu (u ∈ D(T j )) für j = 1, 2, 3. Offensichtlich gilt D ((0, 1)) ⊆ D(T j ) für alle j = 1, 2, 3, und da D ((0, 1)) dicht in L 2 ((0, 1)) liegt (Satz 4.24), sind alle drei Operatoren dicht definiert. Wegen T3 ⊆ T2 ⊆ T1 erhalten wir mit Bemerkung 5.27 c) T1∗ ⊆ T2∗ ⊆ T3∗ . Analog zu Beispiel 5.25 definieren wir zu f ∈ L 2 ((0, 1)) die Funktion R f durch x (R f )(x) := −i f (y) dy (x ∈ [0, 1]). 0
Dann gelten (R f ) = −i f als Gleichheit in L 2 ((0, 1)) sowie R f ∈ H 1 ((0, 1)) = D(T1 ). Also erhalten wir T1 (R f ) = i(R f ) = f , und T1 ist surjektiv. (i) Alle drei Operatoren sind abgeschlossen. Sind nämlich j ∈ {1, 2, 3} und (u n )n∈N ⊆ D(T j ) eine Folge mit u n → u 0 und T j u n = iu n → v0 in H für n → ∞, so ist (u n )n∈N eine Cauchyfolge in H 1 ((0, 1)). Wegen der Vollständigkeit von H 1 ((0, 1)) existiert ein
u 0 ∈ H 1 ((0, 1)) mit u n −
u 0 H 1 ((0,1)) → 0 (n → ∞). Also gilt 2 un →
u 0 in L ((0, 1)), was u 0 =
u 0 zeigt, sowie iu n → i(
u 0 ) , was T u 0 = v0 zeigt. 1 Somit ist T1 abgeschlossen. Da die Abbildung H ((0, 1)) → C, u → u(0), stetig ist (vergleiche Beispiel 5.25), gilt u n (0) → u 0 (0), und analog folgt u n (1) → u 0 (1). Somit erhalten wir für j ∈ {2, 3} und (u n )n∈N ⊆ D(T j ), dass u 0 ∈ D(T j ), was die Abgeschlossenheit von T2 und T3 zeigt. (ii) Wir zeigen, dass T2 und T3 symmetrisch sind. Für alle u, v ∈ H 1 ((0, 1)) erhalten wir mit partieller Integration
1 u (x)v(x) dx = iu(x)v(x)0 − i 0 = i u(1)v(1) − u(0)v(0) + u, T v.
T u, v = i
1
0
1
u(x)v (x) dx
(5.5)
Damit gilt T2 u, v = u, T2 v für alle u, v ∈ D(T2 ), d. h. T2 ist symmetrisch, und als Einschränkung eines symmetrischen Operators ist auch T3 symmetrisch (vergleiche
5.4
Selbstadjungierte Operatoren
131
Bemerkung 5.35). Weiter gilt T1 u, v = u, T3 v für alle u ∈ D(T1 ) und v ∈ D(T3 ), und es folgt T3 ⊆ T1∗ . (iii) Es gilt T3∗ = T1 und T1∗ = T3 . Um dies zu sehen, sei v ∈ D(T1∗ ). Für w := R(T1∗ v) gilt w ∈ D(T1 ), w(0) = 0 und T1 w = T1∗ v. Damit ergibt sich für alle u ∈ D(T1 ) unter Verwendung von (5.5) T1 u, v = u, T1∗ v = u, T1 w = −iu(1)w(1) + T1 u, w. Wir wählen speziell u als konstante Funktion mit Wert 1, d. h. u := 1[0,1] ∈ D(T1 ), und erhalten w(1) = 0. Somit gilt T1 u, v = T1 u, w (u ∈ D(T1 )). Da T1 surjektiv ist, folgt v = w und damit v(0) = v(1) = 0. Folglich ist v ∈ D(T3 ), und wir erhalten D(T1∗ ) ⊆ D(T3 ). Wegen T3 ⊆ T1∗ (siehe (ii)) impliziert dies T1∗ = T3 . Mit der Abgeschlossenheit von T1 folgt T3∗ = T1∗∗ = T1 = T1 . (iv) Wir zeigen, dass T2 selbstadjungiert ist. Sei dazu v ∈ D(T2∗ ), und sei w := R(T2∗ v). Wie in (iii) erhält man w(0) = w(1) = 0 und T2 u, v = T2 u, w (u ∈ D(T2 )), man beachte dabei, dass 1[0,1] ∈ D(T2 ) gilt. Da D ((0, 1)) ⊆ D(T2 ), folgt für alle ϕ ∈ D ((0, 1))
[v − w] (ϕ) = −[v − w](ϕ ) = − =i
1
(v(x) − w(x))ϕ (x) dx
0 1
(v(x) − w(x))iϕ (x) dx = −iv − w, T2 ϕ = 0,
0
wobei [v − w] ∈ D ((0, 1)) die zu v − w gehörige reguläre Distribution bezeichne. Wegen v, w ∈ H 1 ((0, 1)) ist auch [v − w] = [v − w ] eine reguläre Distribution, und nach dem Fundamentallemma (Lemma 4.11) folgt v = w fast überall. Damit erhalten wir (bei Wahl stetiger Repräsentanten) v(x) = w(x) + c (x ∈ [0, 1]) für eine Konstante c ∈ C. Wegen w(0) = w(1) = 0 folgt insbesondere v(0) = v(1) und damit v ∈ D(T2 ). Wir haben D(T2∗ ) ⊆ D(T2 ) gezeigt, und wegen der Symmetrie von T2 folgt, dass T2 selbstadjungiert ist. Insgesamt erhalten wir also T3 = T1∗ ⊆ T2 = T2∗ ⊆ T1 = T3∗ . Der folgende Satz zeigt, dass für das Spektrum selbstadjungierter Operatoren viele gute Eigenschaften gelten. Man beachte dabei, dass ein selbstadjungierter Operator nach Definition stets dicht definiert ist.
132
5 Lineare Operatoren in Hilberträumen
Satz 5.39. Sei T : H ⊇ D(T ) → H ein selbstadjungierter Operator.
a) b) c) d) e)
Es gilt σ (T ) ⊆ R. Für alle λ ∈ C \ R gilt (T − λ)−1 ≤ |Imλ|−1 . Für λ ∈ σ p (T ) sind geometrischer und algebraischer Eigenraum identisch. Eigenvektoren zu verschiedenen Eigenwerten sind orthogonal. Es gilt σr (T ) = ∅.
Beweis. a) Seien λ ∈ C \ R und x ∈ D(T ). Nach Satz 5.37 c) gilt (T − λ)x ≥ |Im λ| x,
(5.6)
T − λ ist injektiv und im(T − λ) abgeschlossen (Satz 5.37 d)). Weiterhin ist auch T − λ injektiv wegen λ ∈ C \ R. Nach Satz 5.29 gilt im(T − λ) = im(T − λ) = (ker(T − λ)∗ )⊥ = (ker(T − λ))⊥ = {0}⊥ = H . Also ist T − λ auch surjektiv und damit bijektiv für alle λ ∈ C \ R, was σ (T ) ⊆ R zeigt. b) Seien λ ∈ C \ R und y ∈ H . Dann gilt mit (5.6) (T − λ)−1 y = x ≤
1 (T − λ)x = y |Im λ| |Im λ|
für x := (T − λ)−1 y, was b) zeigt. c) Sei λ ∈ σ p (T ). Wir nehmen an, dass der algebraische und geometrische Eigenraum zu λ verschieden sind. Dann existiert ein n ∈ N, n ≥ 2, und ein x ∈ ker(T − λ)n \ ker(T − λ). Wegen T = T ∗ und λ ∈ R folgt (T − λ)n−1 x2 = (T − λ)n−1 x, (T − λ)n−1 x = (T − λ)n x, (T − λ)n−2 x = 0, also (T − λ)n−1 x = 0. Iterativ erhalten wir 0 = (T − λ)n−2 x = (T − λ)n−3 x = . . . und schließlich (T − λ)x = 0, Widerspruch zu x ∈ / ker(T − λ). d) Das folgt wie in der linearen Algebra. Seien x1 , x2 Eigenvektoren zu λ1 = λ2 mit λ1 , λ2 ∈ σ p (T ). Dann gilt (man beachte λ2 ∈ R nach a)) λ1 x1 , x2 = λ1 x1 , x2 = T x1 , x2 = x1 , T x2 = x1 , λ2 x2 = λ2 x1 , x2 . Wegen λ1 = λ2 folgt x1 , x2 = 0. e) Sei λ ∈ σ (T ) \ σ p (T ). Dann ist λ ∈ R, und wir erhalten mit Satz 5.29
5.4
Selbstadjungierte Operatoren
133
im(T − λ) = (ker(T − λ)∗ )⊥ = (ker(T − λ))⊥ = {0}⊥ = H . Damit folgt λ ∈ σc (T ), und somit ist σr (T ) = ∅.
˙ σc (T ). Diese beiden Für einen selbstadjungierten Operator T gilt also σ (T ) = σ p (T ) ∪ Anteile des Spektrums können mit dem Begriff des approximativen Punktspektrums simultan behandelt werden. Definition 5.40. Sei T : H ⊇ D(T ) → H ein abgeschlossener linearer Operator. Dann ist die Menge der approximativen Eigenwerte oder das approximative Punktspektrum σapp (T ) definiert als σapp (T ) := λ ∈ C ∃ (xn )n∈N ⊆ D(T ), xn = 1 : (T − λ)xn → 0 (n → ∞) . In diesem Fall heißt die Folge (xn )n∈N eine Folge approximativer Eigenvektoren oder (falls H ein Raum von Funktionen ist) approximativer Eigenfunktionen. Offensichtlich sind alle Eigenwerte von T in σapp (T ), denn für einen Eigenwert λ kann man die konstante Folge xn := x wählen, wobei x ein Eigenvektor von T zum Eigenwert λ mit x = 1 ist. Lemma 5.41. Sei T : H ⊇ D(T ) → H ein abgeschlossener linearer Operator.
Dann gilt ˙ σc (T ) ⊆ σapp (T ) ⊆ σ (T ). σ p (T ) ∪ Insbesondere gilt für selbstadjungierte Operatoren T ˙ σc (T ) = σapp (T ). σ (T ) = σ p (T ) ∪
Beweis. (i) Sei λ ∈ σapp (T ). Falls λ ∈ ρ(T ), so ist (T − λ)−1 stetig, d. h. für alle xn ∈ D(T ) \ {0} ist xn ≤ (T − λ)−1 < ∞. (T − λ)xn Dies ist aber ein Widerspruch zur Definition der approximativen Eigenwerte. (ii) Wie oben bemerkt, gilt σ p (T ) ⊆ σapp (T ). Sei nun λ ∈ σc (T ). Dann ist T − λ injektiv und im(T −λ) nicht abgeschlossen. Nach Lemma 5.16 existiert keine Konstante C > 0 mit (T − λ)x ≥ C x für alle x ∈ D(T ). Somit existiert eine Folge (xn )n∈N ⊆ D(T ) mit xn = 1 und (T − λ)xn → 0.
134
5 Lineare Operatoren in Hilberträumen
Für die nächste Aussage erinnern wir an die schwache Konvergenz (Definition 2.24). Mit dem Satz von Riesz (Satz 2.37) sieht man, dass eine Folge (xn )n→∞ ⊆ H genau dann schwach gegen ein x ∈ H konvergiert, falls xn , y → x, y (n → ∞) für alle y ∈ H gilt. In diesem Fall schreiben wir wieder xn x (n → ∞). Lemma 5.42. Sei T : H ⊇ D(T ) → H ein selbstadjungierter Operator, und sei λ ∈ σc (T ). Falls (xn )n∈N ⊆ D(T ), xn = 1, eine Folge approximativer Eigenvektoren zu λ ist, so besitzt (xn )n∈N keine konvergente Teilfolge (bezüglich Normkonvergenz), und es gilt xn 0 für n → ∞.
Beweis. Sei (xn )n∈N eine Folge approximativer Eigenvektoren zu λ ∈ σc (T ). Angenommen, es existiert eine konvergente Teilfolge (xn j ) j∈N . Für x := lim j→∞ xn j ∈ H gilt dann x = 1 und T xn j = (T − λ)xn j + λxn j → λx ( j → ∞). Da T abgeschlossen ist, folgt x ∈ D(T ) und T x = lim j→∞ T xn j = λx. Also ist x ein Eigenvektor im Widerspruch zu λ ∈ / σ p (T ). Sei y ∈ im(T − λ). Dann existiert ein z ∈ D(T ) mit y = (T − λ)z, und wir erhalten xn , y = xn , (T − λ)z = (T − λ)xn , z → 0 (n → ∞).
(5.7)
Seien nun y0 ∈ H und ε > 0. Wegen λ ∈ σc (T ) ist im(T − λ) dicht in H , also existiert ein y ∈ im(T − λ) mit y0 − y ≤ 2ε . Wegen (5.7) existiert ein n 0 ∈ N mit |xn , y| ≤ 2ε für alle n ≥ n 0 , und man erhält wegen xn = 1 |xn , y0 | ≤ |xn , y| + |xn , y0 − y| ≤
ε ε ε + xn y0 − y ≤ + = ε 2 2 2
für alle n ≥ n 0 . Also gilt xn , y → 0 für alle y ∈ H und damit xn 0 (n → ∞).
Definition 5.43. Seien T : H ⊇ D(T ) → H ein abgeschlossener linearer Operator und λ ∈ C. Eine Folge (xn )n∈N ⊆ D(T ) mit xn = 1 und (T − λ)xn → 0, welche keine konvergente Teilfolge besitzt, heißt auch eine Weylsche Folge für λ. Die Menge σess (T ) := {λ ∈ R | es existiert eine Weylsche Folge f¨ur λ} heißt das essentielle Spektrum von T . Die Menge σ (T ) \ σess (T ) heißt auch diskretes Spektrum von T . Nach Definition gilt σess (T ) ⊆ σapp (T ), und nach Lemma 5.42 folgt für selbstadjungierte Operatoren σc (T ) ⊆ σess (T ). Ein Eigenwert λ ∈ σ p (T ) mit unendlicher geometrischer
5.4
Selbstadjungierte Operatoren
135
Vielfachheit (d. h. es gilt dim ker(T − λ) = ∞) liegt ebenfalls im essentiellen Spektrum von T , da man als Weylsche Folge eine Orthonormalbasis von ker(T − λ) wählen kann. Für die Lokalisierung des Spektrums kann der numerische Wertebereich nützlich sein. Er ist folgendermaßen definiert: Definition 5.44. Sei T : H ⊇ D(T ) → H ein linearer Operator. Dann ist der numerische Wertebereich W (T ) definiert durch W (T ) := {T x, x | x ∈ D(T ), x = 1}.
Lemma 5.45. Sei T : H ⊇ D(T ) → H ein abgeschlossener linearer Operator.
Dann gilt σ p (T ) ∪ σc (T ) ⊆ W (T ), wobei W (T ) den Abschluss von W (T ) in C bezeichne. Falls T ∈ L(H ), so gilt sogar σ (T ) ⊆ W (T ).
Beweis. Sei λ ∈ / W (T ). Für x ∈ D(T ) mit x = 1 folgt 0 < d := dist(λ, W (T )) ≤ |λ − T x, x | = | (λ − T )x, x | ≤ (T − λ)x · x = (T − λ)x . Damit haben wir (T − λ)x ≥ d x (x ∈ D(T )). Also ist nach Lemma 5.16 der Operator T − λ injektiv und im(T − λ) abgeschlossen, d. h. es gilt λ ∈ / σ p (T ) ∪ σc (T ). Seien nun T ∈ L(H ) und λ ∈ / W (T ). Falls T − λ nicht surjektiv ist, dann existiert ein x0 ∈ im(T − λ)⊥ mit x0 = 1, und es ist 0 = (T − λ)x0 , x0 = T x0 , x0 − λ, was im Widerspruch steht zu λ ∈ / W (T ). Also ist T − λ bijektiv, d. h. λ ∈ ρ(T ).
Man beachte, dass aus obigem Lemma für selbstadjungierte Operatoren T wegen σr (T ) = ∅ die Inklusion σ (T ) ⊆ W (T ) folgt. Lemma 5.46. Sei T ∈ L(H ) selbstadjungiert. Für s∗ := inf x=1 T x, x und
s ∗ := supx=1 T x, x gilt σ (T ) ⊆ [s∗ , s ∗ ] sowie s∗ ∈ σ (T ) und s ∗ ∈ σ (T ).
136
5 Lineare Operatoren in Hilberträumen
Beweis. Die Inklusion σ (T ) ⊆ W (T ) ⊆ [s∗ , s ∗ ] gilt nach Lemma 5.45. Sei (xn )n∈N ⊆ H eine Folge mit xn = 1 und T xn , xn → s∗ (n → ∞) (eine solche Folge existiert nach Definition des Infimums). Für festes ε ∈ (0, 1) betrachten wir die Abbildung [ · , · ] : H × H → C, (x, y) → (T − s∗ + ε)x, y. Dann ist [ · , · ] linear im ersten Argument, und mit T = T ∗ erhalten wir [y, x] = [x, y] für alle x, y ∈ H . Wegen (T − s ∗ )x, x ≥ 0 folgt [x, x] ≥ εx2 , und [ · , · ] ist ein Skalarprodukt auf H × H . Wir wenden die Cauchy–Schwarz-Ungleichung auf [ · , · ] an und erhalten (T − s∗ + ε)xn 2 = (T − s∗ + ε)xn , (T − s∗ + ε)xn = [xn , (T − s∗ + ε)xn ] ≤ [xn , xn ]1/2 [(T − s∗ + ε)xn , (T − s∗ + ε)xn ]1/2 1/2 = (T − s∗ + ε)xn , xn 1/2 · (T − s∗ + ε)2 xn , (T − s∗ + ε)xn 1/2 ≤ T xn , xn − s∗ xn 2 + εxn 2 T − s∗ + ε3/2 xn 1/2 3/2 , ≤ T xn , xn − s∗ + ε T − s∗ + 1 wobei im letzten Schritt xn = 1 und ε < 1 verwendet wurden. Wir nehmen auf beiden Seiten den Grenzwert für ε 0 und erhalten 3/2 1/2 (T − s∗ )xn 2 ≤ T xn , xn − s∗ → 0 (n → ∞). T − s∗ + 1 Also ist s∗ ∈ σapp (T ) = σ (T ). Analog zeigt man s ∗ ∈ σ (T ).
Beispiel 5.47
Wir diskutieren ein konkretes Beispiel eines Operators und bestimmen dessen Spektrum. Es handelt sich dabei um einen Multiplikationsoperator, diese Operatoren werden später noch allgemein behandelt. Sei H = L 2 ((0, 3)), und für f ∈ H sei T f definiert durch (T f )(x) := m(x) f (x) (x ∈ (0, 3)). Dabei sei die Funktion m definiert durch ⎧ ⎪ falls x ∈ (0, 1], ⎪ ⎨x, m(x) := 1, falls x ∈ [1, 2], ⎪ ⎪ ⎩x − 1, falls x ∈ [2, 3). (i) Offensichtlich ist T linear, und wegen T f = 2
3
|m(x) f (x)| dx ≤
0
ist T ∈ L(H ) mit T ≤ 2.
2
m2∞
0
3
| f (x)|2 d x = 4 f 2
5.4
Selbstadjungierte Operatoren
137
(ii) Es gilt für alle f ∈ H
3
T f , f =
m(x)| f (x)|2 dx ∈ R.
0
Nach Lemma 5.36 ist T symmetrisch und damit als symmetrischer beschränkter Operator selbstadjungiert (Bemerkung 5.35 b)). (iii) Wegen 0 ≤ m(x) ≤ 2 (x ∈ (0, 3)) gilt für alle f ∈ H mit f = 1
3
T f , f =
m(x)| f (x)|2 dx ∈ [0, 2].
0
Also gilt für den numerischen Wertbereich W (T ) ⊆ [0, 2] und damit σ (T ) ⊆ [0, 2]. (iv) Sei λ ∈ (0, 2) \ {1}. Dann ist die Menge m −1 ({λ}) einelementig und damit eine Nullmenge. Somit gilt: Falls f ∈ H mit T f = λ f , so gilt (m(x) − λ) f (x) = 0 fast überall und daher f (x) = 0 fast überall, d. h. f = 0 in H . Also ist λ kein Eigenwert. Sei andererseits λ = 1. Dann ist z. B. f (x) := 1(1,2) (x) ein Eigenvektor von T . Somit ist 1 ∈ σ p (T ). (Man sieht sofort, dass die geometrische Vielfachheit ∞ ist.) (v) Sei λ ∈ (0, 2), und sei x0 ∈ (0, 3) mit m(x0 ) = λ. Da m Lipschitz-stetig mit Konstante 1 ist, gilt |m(x) − m(x0 )| ≤ n1 falls |x − x0 | ≤ n1 . Zu n ∈ N sei In ⊆ (0, 3) ein offenes √ Intervall der Länge n1 mit x0 ∈ In . Für f n := n1 In gilt dann f n ∈ H mit f n = 1 sowie 1 1 |m(x) − m(x0 )|2 n dx ≤ n dx = 2 → 0 (n → ∞). (T − λ) f n 2 = 2 n In In n Also gilt λ ∈ σapp (T ) = σ (T ), und mit Lemma 5.45 erhält man W (T ) = [0, 2]. (vi) Da σ (T ) abgeschlossen ist, folgt 0 ∈ σ (T ) und 2 ∈ σ (T ). Wie in (iv) folgt, dass weder 0 noch 2 ein Eigenwert von T ist. Insgesamt haben wir also σ p (T ) = {1}, σc (T ) = [0, 2] \ {1} und (wie auch schon aus der Selbstadjungiertheit folgt) σr (T ) = ∅. Multiplikationsoperatoren, wie im letzten Beispiel betrachtet, können in allgemeinen L 2 Räumen (siehe Definition 3.53) betrachtet werden. Definition 5.48. Sei (X , A , μ) ein Maßraum, und sei m : X → C eine messbare Funktion. Dann definiert man den Multiplikationsoperator Mm zu m im Hilbertraum H := L 2 (μ) durch D(Mm ) := u ∈ L 2 (μ) | mu ∈ L 2 (μ) , Mm u := mu.
138
5 Lineare Operatoren in Hilberträumen
Satz 5.49. Sei (X , A , μ) ein Maßraum, und m : X → R eine reellwertige messbare Funktion. Dann ist der Operator Mm : H ⊇ D(Mm ) → H ein selbstadjungierter Operator in H := L 2 (μ).
Beweis. Wir zeigen zunächst, dass Mm dicht definiert ist. Wir definieren dazu An := {x ∈ X | |m(x)| ≤ n}. Dann ist An messbar, und für alle u ∈ L 2 (μ) ist u1 An ∈ D(Mm ) wegen mu1 An ≤ nu. Mit majorisierter Konvergenz folgt u1 An → u in L 2 (μ) (n → ∞) für jedes u ∈ H , also ist D(Mm ) dicht. Seien u, v ∈ D(Mm ). Dann gilt Mm u, v = m(x)u(x)v(x) dμ(x) = u(x)m(x)v(x) dμ(x) = u, Mm v, also ist Mm symmetrisch, d. h. Mm ⊆ Mm∗ . Sei nun u ∈ D(Mm∗ ). Dann gilt für alle v ∈ D(Mm ) ∗ ∗ (Mm u)(x)v(x) dμ(x) = Mm u, v = u, Mm v = u(x)m(x)v(x) dμ(x), und damit erhalten wir ∗ Mm u(x) − m(x)u(x) v(x) dμ(x) = 0 (v ∈ D(Mm )). Also ist Mm∗ u − mu ∈ D(Mm )⊥ = {0}, wobei wir die Dichtheit von D(Mm ) ausgenutzt haben. Es folgt Mm∗ u = mu, und insbesondere ist mu ∈ L 2 (μ), d. h. u ∈ D(Mm ). Somit haben wir D(Mm∗ ) ⊆ D(Mm ) gezeigt, was wegen der Symmetrie die Selbstadjungiertheit von Mm beweist. Definition 5.50. Seien (X , A , μ) ein Maßraum und m : X → R eine messbare Funktion. Dann definiert man den essentiellen Wertebereich von m als ess im(m) := z ∈ R ∀ ε > 0 : μ {x ∈ X |m(x) − z| < ε > 0 .
Lemma 5.51. Seien (X , A , μ) ein Maßraum und m : X → R eine messbare Funktion.
Für den Multiplikationsoperator Mm zu m gilt σ (Mm ) = ess im(m).
5.4
Selbstadjungierte Operatoren
139
Beweis. Sei zunächst λ ∈ / ess im(m). Dann existiert ein ε > 0 mit μ({x ∈ X | |m(x)−λ| < ε}) = 0, d. h. es gilt |m(x) − λ| ≥ ε für μ-fast alle x ∈ X . Zu f ∈ H = L 2 (μ) ist also die f (x) Funktion u(x) := m(x)−λ fast überall definiert, und es gilt u2 =
|u(x)|2 dμ(x) =
| f (x)|2 dμ(x) ≤ ε−2 f 2 < ∞. |m(x) − λ|2
Folglich ist u ∈ L 2 (μ), und wegen mu = f +λu ∈ L 2 (μ) gilt u ∈ D(Mm ). Nach Definition ist u die eindeutige Lösung der Gleichung (Mm − λ)u = f , und wir erhalten λ ∈ ρ(Mm ). Sei nun λ ∈ ess im(m), und für n ∈ N sei An := {x ∈ X | |m(x) − λ| < 4−n }. Dann ist
−1/2 cn := μ(An ) > 0, und die Funktion f := n∈N cn 2−n 1 An ist messbar mit f ≤
−1/2 −n
cn
n∈N
2
1 An =
−1/2 −n
cn
2
μ(An )1/2 =
n∈N
2−n = 1.
n∈N
Falls u ∈ L 2 (μ) mit (Mm − λ)u = f existiert, so gilt (m − λ)u = f μ-fast überall, und wir erhalten für alle n ∈ N cn−1 4−n cn−1 4−n | f (x)|2 u2 = dμ(x) ≥ dμ(x) ≥ dμ(x) = 4n 2 2 −2n |m(x) − λ| An |m(x) − λ| An 4 im Widerspruch zu u ∈ L 2 (μ). Die Gleichung (Mm − λ)u = f besitzt also keine Lösung in L 2 (μ), und der Operator Mm − λ ist nicht surjektiv, was λ ∈ σ (Mm ) zeigt. Wie die obigen Beispiele zeigen, ist es in vielen Fällen einfach, die Symmetrie eines Operators zu zeigen, während der Nachweis der Selbstadjungiertheit deutlich komplizierter ist. Dazu ist folgendes Kriterium nützlich. Satz 5.52. Sei T : H ⊇ D(T ) → H ein linearer Operator, und es gelte
T x, y = x, T y (x, y ∈ D(T )). Dann sind äquivalent: (i) T ist dicht definiert und selbstadjungiert. (ii) T ist dicht definiert und abgeschlossen, und es gilt ker(T ∗ ± i) = {0}. (iii) im(T ± i) = H . Dabei kann i durch jede Zahl λ0 ∈ C \ R ersetzt werden.
(5.8)
140
5 Lineare Operatoren in Hilberträumen
Beweis. (i)⇒(ii): Selbstadjungierte Operatoren sind abgeschlossen, und es gilt ker(T ∗ ± i) = ker(T ± i) = {0} wegen ±i ∈ ρ(T ) nach Satz 5.39 a). (ii)⇒(iii): Mit Satz 5.29 folgt aus (ii) im(T ±i)⊥ = ker(T ∗ ∓i) = {0}, d. h. im(T ±i) ist dicht in H . Nach Satz 5.37 d) ist im(T ±i) abgeschlossen, und wir erhalten im(T ±i) = H . (iii)⇒(i): Angenommen, es gilt D(T ) = H . Dann wählen wir ein y ∈ (D(T ))⊥ \ {0}. Wegen (iii) existiert dazu ein x ∈ D(T )\{0} mit (T +i)x = y. Wie im Beweis von Satz 5.37 c) folgt aus (5.8) die Abschätzung Im(T + i)x, x ≥ x2 > 0. Andererseits gilt wegen y ∈ (D(T ))⊥ auch (T + i)x, x = y, x = 0, Widerspruch. Also ist T dicht definiert. Sei nun x ∈ D(T ∗ ). Nach (iii) existiert ein
x ∈ D(T ) mit (T ± i)
x = (T ∗ ± i)x. Wegen (5.8) gilt T ⊆ T ∗ , und es folgt (T ∗ ± i)
x = (T ∗ ± i)x. Wieder mit Satz 5.29 erhalten wir ker(T ∗ ± i) = im(T ∓ i)⊥ = {0}, also ist T ∗ ± i injektiv, was
x = x und damit x ∈ D(T ) impliziert. Wir haben D(T ∗ ) ⊆ D(T ) und damit die Selbstadjungiertheit von T gezeigt. Wie man im Beweis sieht, kann die Zahl i durch jede Zahl λ0 ∈ C \ R ersetzt werden. Beispiel 5.53
Als Anwendung geben wir einen alternativen Beweis für die Selbstadjungiertheit des Multiplikationsoperators Mm im Raum H := L 2 (μ) aus Satz 5.49 an. Man sieht direkt, dass für alle u, v ∈ D(Mm ) die Bedingung Mm u, v = u, Mm v erfüllt ist. Wegen |m(x) ± i| ≥ |Im(m(x) ± i)| = 1 ist für alle f ∈ L 2 (μ) die Funktion u ± : X → f (x) C, x → m(x)±i als Element in L 2 (μ) definiert, und wegen mu ± = f ∓ iu ± ∈ L 2 (μ) gilt u ± ∈ D(Mm ). Damit erhalten wir (Mm ± i)u ± = f , und der Operator Mm ± i ist surjektiv. Die Anwendung von Satz 5.52 liefert nun einen weiteren Beweis für die Selbstadjungiertheit von Mm . Aus Satz 5.52 erhält man sofort ein Kriterium für wesentliche Selbstadjungiertheit. Lemma 5.54. Sei T : H ⊇ D(T ) → H ein dicht definierter und symmetrischer
linearer Operator. Dann sind äquivalent: (i) T ist wesentlich selbstadjungiert. (ii) Es gilt ker(T ∗ ± i) = {0}. (iii) im(T ± i) ist dicht in H . Dabei kann i durch jede Zahl λ0 ∈ C \ R ersetzt werden.
5.4
Selbstadjungierte Operatoren
141
Beweis. Da T symmetrisch und dicht definiert ist, ist auch T symmetrisch, und es gilt T ∗∗ = T sowie T ∗ = (T )∗ (Satz 5.37 a)). Wir können also Satz 5.52 auf T anwenden und erhalten die behauptete Äquivalenz. Viele Operatoren der mathematischen Physik sind erstmal nur auf einem kleinen Definitionsbereich gegeben, z. B. auf der Menge der Testfunktionen. Um die Theorie selbstadjungierter Operatoren, etwa den Spektralsatz, anwenden zu können, müssen diese typischerweise symmetrischen Operatoren zu selbstadjungierten Operatoren fortgesetzt werden. Falls man zeigen kann, dass der Operator wesentlich selbstadjungiert ist, so geht man zum Abschluss über. Eine weitere kanonische Art, selbstadjungierte Fortsetzungen zu erhalten, funktioniert bei halbbeschränkten Operatoren. Wir starten mit der Definition. Definition 5.55. Sei T : H ⊇ D(T ) → H ein symmetrischer Operator. Dann heißt T von unten halbbeschränkt, falls ein C ∈ R existiert mit T x, x ≥ Cx2 (x ∈ D(T )), d. h. es gilt W (T ) ⊆ [C, ∞). Falls diese Abschätzung mit C = 0 gilt, heißt T nichtnegativ, und man schreibt in diesem Fall T ≥ 0. Falls diese Abschätzung sogar mit C > 0 gilt, heißt T positiv oder koerziv, und man schreibt T > 0.
Lemma 5.56. Seien H , K zwei Hilberträume und J ∈ L(K , H ) injektiv mit
im(J ) = H . Dann ist J J ∗ ∈ L(H ) injektiv, im(J J ∗ ) = H , und S := (J J ∗ )−1 : H ⊇ im(J J ∗ ) → H ist selbstadjungiert.
Beweis. Wegen ker J ∗ = (im(J ))⊥ = {0} ist auch J ∗ injektiv. Damit ist der beschränkte und selbstadjungierte Operator J J ∗ ebenfalls injektiv. Wegen im(J J ∗ )⊥ = ker(J J ∗ ) = {0} ist S dicht definiert. Offensichtlich ist S symmetrisch. Sei y ∈ H . Dann gilt (S ± i)x = y genau dann, wenn (1 ± i J J ∗ )x = J J ∗ y. Wegen ±i ∈ ρ(J J ∗ ) besitzt diese Gleichung eine eindeutige Lösung x, und x = J J ∗ (y ∓ i x) zeigt x ∈ im(J J ∗ ) = D(S). Also ist S ± i surjektiv und damit ist S selbstadjungiert.
Satz 5.57 (Friedrichs-Erweiterung). Sei T : H ⊇ D(T ) → H symmetrisch und halb-
beschränkt. Dann existiert eine selbstadjungierte Fortsetzung von T , die FriedrichsErweiterung. Diese ist wieder halbbeschränkt mit der gleichen Konstanten C.
142
5 Lineare Operatoren in Hilberträumen
Beweis. Wegen (T + λ)x, x = T x, x + λx2 ≥ (C + λ)x2 (x ∈ D(T )) für λ ∈ R sei ohne Einschränkung C = 1. Setze [x, y] := T x, y (x, y ∈ D(T )). Dann ist K0 := (D(T ), [·, ·]) ein Prähilbertraum (dabei folgt die positive Definitheit des Skalarprodukts aus [x, x] ≥ x2 ). Die zugehörige Norm ist definiert durch |||x||| := [x, x]1/2 . Sei K die Vervollständigung von K0 bzgl. ||| · |||. Wegen [x, x] ≥ x2 ist die Identität id ∈ L(K0 , H ) eine Kontraktion. Damit existiert eine stetige lineare Fortsetzung J ∈ L(K , H ). Nach Definition von J gilt [x, y] = T x, y = T x, J y (x, y ∈ D(T )) und damit auch für x ∈ D(T ), y ∈ K . Der Operator J ist injektiv: Sei y ∈ K mit J y = 0. Dann ist [x, y] = 0 (x ∈ D(T )) und damit [x, y] = 0 (x ∈ K ), d. h. y = 0. Wegen im(J ) ⊇ D(T ) ist im(J ) = H , und nach Lemma 5.56 ist der Operator S := (J J ∗ )−1 : H ⊇ im(J J ∗ ) → H selbstadjungiert. Sei x ∈ D(T ). Dann gilt [x, y] = T x, J y = [J ∗ T x, y] (y ∈ K ) (nach Definition des adjungierten Operators J ∗ ). Es folgt x = J ∗ T x und wegen J | D(T ) = id D(T ) auch x = J x = J J ∗ T x, d. h. x ∈ im(J J ∗ ) = D(S). Da nach Definition von S aber auch x = J J ∗ Sx gilt und J J ∗ injektiv ist, folgt T x = Sx. Insgesamt erhalten wir T ⊆ S, d. h. S ist eine selbstadjungierte Fortsetzung von T . Nach Satz 5.37 ist jeder symmetrische Operator T abschließbar. Da die FriedrichsErweiterung als selbstadjungierter Operator selbst abgeschlossen ist, ist sie eine (im Allgemeinen echt größere) Fortsetzung von T . Während die Friedrichs-Erweiterung ein sehr nützliches Hilfsmittel ist, um selbstadjungierte Operatoren aus symmetrischen zu konstruieren, liefert der nächste Satz ein Beispiel, bei welchem die Selbstadjungiertheit bei Addition eines weiteren Operators erhalten bleibt. Es handelt sich um ein typisches Beispiel eines Störungssatzes. Satz 5.58 (Kriterium von Kato). Seien T : H ⊇ D(T ) → H selbstadjungiert und
S : H ⊇ D(S) → H symmetrisch mit D(S) ⊇ D(T ). Falls δ ∈ [0, 1) und c ≥ 0 existieren mit Sx ≤ δT x + cx (x ∈ D(T )), (5.9) so ist T + S mit D(T + S) = D(T ) selbstadjungiert.
5.4
Selbstadjungierte Operatoren
143
Beweis. Offensichtlich ist T + S symmetrisch. Für λ ∈ R \ {0} ist iλ ∈ ρ(T ), und es gilt (T − iλ)x2 = T x2 + |λ|2 x2 (x ∈ D(T )) (Ausmultiplizieren des Skalarprodukts). Für z ∈ H und x := (T − iλ)−1 z folgt z ≥ |λ| x = |λ| (T − iλ)−1 z, z ≥ T x = T (T − iλ)−1 z. Wir zeigen im(T + S − iλ) = H für großes |λ|. Dazu betrachten wir die Gleichung z + S(T − iλ)−1 z = y
(5.10)
mit y ∈ H beliebig. Nach Voraussetzung gilt c z. S(T − iλ)−1 z ≤ δT (T − iλ)−1 z + c(T − iλ)−1 z ≤ δ + |λ| Für |λ| ≥ λ0 mit hinreichend großem λ0 > 0 ist also S(T − iλ)−1 < 1 und damit (5.10) eindeutig lösbar mit Lösung z. Setze x := (T − iλ)−1 z und erhalte (T + S − iλ)x = (T − iλ)x + Sx = z + S(T − iλ)−1 z = y. Also ist im(T + S − iλ) = H für λ ∈ R mit |λ| hinreichend groß, und nach Satz 5.52 ist T + S selbstadjungiert.
Was haben wir gelernt?
• Bei unbeschränkten Operatoren ist die Wahl des Definitionsbereichs entscheidend für viele Eigenschaften, z. B. Abgeschlossenheit und Selbstadjungiertheit. • Das Spektrum eines Operators besteht nicht nur aus Eigenwerten (wie das bei Matrizen der Fall ist), sondern kann auch kontinuierliches Spektrum und Restspektrum enthalten. Falls der Operator T beschränkt ist (d. h. es gilt T ∈ L(H )), so ist das Spektrum σ (T ) kompakt und nichtleer. • Die Idee des adjungierten Operators ist die Identität T x, yH = x, T ∗ yH
(x, y ∈ H ).
In dieser Form stimmt das nur, falls T ∈ L(H ) gilt. Im Allgemeinen muss man auf die Definitionsbereiche achten. Insbesondere gibt es einen Unterschied zwischen symmetrischen und selbstadjungierten Operatoren.
144
5 Lineare Operatoren in Hilberträumen
• Bei selbstadjungierten Operatoren ist das Spektrum reell, und Eigenvektoren zu verschiedenen Eigenwerten sind orthogonal, das Restspektrum ist leer. • Es gibt verschiedene Kriterien für (wesentliche) Selbstadjungiertheit. • Die Friedrichs-Erweiterung liefert selbstadjungierte Fortsetzungen für halbbeschränkte Operatoren.
Der Spektralsatz für selbstadjungierte Operatoren
Worum geht’s? In Axiom [A3] wird die Wahrscheinlichkeit dafür, dass der Messwert
einer beobachtbaren Größe T in der Menge A ∈ B (σ (T )) liegt, als E(A)ψ2 definiert. Dabei ist E : B (σ (T )) → L(H ) das Spektralmaß des Operators T – dieses und der zugehörige Spektralsatz sollen in diesem Kapitel untersucht werden. Zusätzlich liefert der Spektralsatz die Möglichkeit, Funktionen von Operatoren zu beschreiben, wie sie etwa in Axiom [A4] auftauchen: Dort ist der Zustand ψ(t) des Systems zur Zeit t ≥ 0 gegeben durch ψ(t) := e−it/H ψ(0). Sei A ∈ Cn×n eine hermitesche Matrix, d. h. für die Koeffizienten ai j gelte a ji = ai j (i, j = 1, . . . , n). Dann besagt einer der zentralen Sätze der linearen Algebra, dass die Matrix A unitär diagonalisierbar ist, d. h. es existiert eine orthonormale Basis, bezüglich derer die Matrix Diagonalgestalt hat. Der Spektralsatz für selbstadjungierte Operatoren ist eine weitreichende Verallgemeinerung dieses Resultats. Hier wird ein selbstadjungierter Operator T als Integral T = λ dE(λ) R
dargestellt. Daher werden in diesem Kapitel zunächst die zugehörigen Spektralmaße E und Integrale über Spektralmaße diskutiert, bevor der Spektralsatz in verschiedenen Varianten formuliert wird. Mit Hilfe des Spektralmaßes ist es möglich, Funktionen selbstadjungierter Operatoren in Form von f (T ) = R f (λ) dE(λ) zu definieren. Dabei wird für die Funktion f nur die Messbarkeit vorausgesetzt, und man kann den Definitionsbereich von f (T ) über eine Integrierbarkeitsbedingung beschreiben. Wir behandeln zunächst Spektralmaße und Integrale bezüglich Spektralmaßen sowie den Spektralsatz und den Funktionalkalkül, welcher es unter anderem erlaubt, zu selbstadjungierten Operatoren T zugehörige unitäre Gruppen der Form (eit T )t∈R zu konstruieren. Der Satz von Stone besagt, dass jede unitäre Gruppe auf diese Weise © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2022 R. Denk, Mathematische Grundlagen der Quantenmechanik, https://doi.org/10.1007/978-3-662-65554-2_6
145
6
146
6 Der Spektralsatz für selbstadjungierte Operatoren
beschrieben werden kann. Für Familien von Operatoren gilt der Spektralsatz, falls diese Operatoren kompatibel sind, d. h. paarweise kommutieren. Der Spektralsatz wird dabei sowohl für einen als auch für mehrere (kompatible) Operatoren in zwei Varianten formuliert: mit Hilfe des Spektralmaßes und in der Multiplikationsoperator-Form.
6.1
Spektralmaße
Im Folgenden sei H ein C-Hilbertraum.Wir kommen noch einmal auf die Zerlegung von H in der Form H = M ⊕ M ⊥ für einen abgeschlossenen Untervektorraum M ⊆ H zurück, die im Projektionssatz (Satz 2.34) betrachtet wurde. Definition 6.1. Sei M ⊆ H ein abgeschlossener Unterraum. Dann heißt die Abbildung P : H → H , x → x1 mit x = x1 + x2 , x1 ∈ M, x2 ∈ M ⊥ , die orthogonale Projektion von H auf M. Man beachte, dass nach dem Projektionssatz die Zerlegung x = x1 + x2 eindeutig und damit die Abbildung P wohldefiniert ist. Lemma 6.2.
a) Seien M ⊆ H ein abgeschlossener Unterraum und P die orthogonale Projektion von H auf M. Dann ist P ∈ L(H ) mit 1, falls M = {0}, P = 0, falls M = {0}. Es gilt ker P = M ⊥ und im(P) = M. b) Ein Operator P ∈ L(H ) ist genau dann eine orthogonale Projektion, wenn P 2 = P = P ∗ gilt. In diesem Fall ist im(P) abgeschlossen, und P ist die orthogonale Projektion auf im(P).
Beweis. a) Offensichtlich ist P linear. Nach dem Satz von Pythagoras (Satz 2.3 a)) gilt P x2 ≤ P x2 + x − P x2 = x2 (man beachte P x ⊥ x − P x) für alle x ∈ H und damit P ∈ L(H ) mit P ≤ 1. Falls M = {0}, so ist P = 0. Ansonsten gilt für x ∈ M \{0} die Gleichheit P x = x und damit P = 1. Direkt nach Definition von P folgt im(P) = M und ker P = M ⊥ .
6.1
Spektralmaße
147
b) (i) Sei P die orthogonale Projektion auf M. Die Gleichheit P 2 = P ist klar nach Definition von P. Seien x, y ∈ H mit x = x1 + x2 , y = y1 + y2 , wobei x1 , y1 ∈ M und x2 , y2 ∈ M ⊥ gelte. Dann folgt
P x, y = x 1 , y1 + y2 = x1 , y1 + x1 , y2 = x1 , y1 = x, y1 = x, P y , wobei x1 , y2 = x2 , y1 = 0 benutzt wurde. Somit folgt P = P ∗ . (ii) Sei nun P = P ∗ = P 2 ∈ L(H ), und sei (z n )n∈N ⊆ M eine Folge in M := im(P) mit z n → z (n → ∞). Zu n ∈ N existiert ein wn ∈ H mit z n = Pwn , und es ist P z n = P 2 wn = Pwn = z n ,
(6.1)
und damit z n − P z = P(z n − z) ≤ P · z n − z → 0 (n → ∞), d. h. z = P z ∈ im(P) = M wegen der Eindeutigkeit des Grenzwertes. Somit ist M abgeschlossen, und die orthogonale Projektion P˜ auf M ist definiert. Nach Schritt (i) gilt P˜ = P˜ 2 = P˜ ∗ . Wir zerlegen zwei beliebige Elemente x, y ∈ H wieder in der Form x = x1 + x2 und y = y1 + y2 mit x1 , y1 ∈ M und x2 , y2 ∈ M ⊥ . Dann folgt mit P˜ = P˜ ∗ , P = P ∗ und (6.1)
P˜ x, y = x, P˜ y = x, y1 = x, P y1 = P x, y1 = P x, y1 + y2 = P x, y. Dabei wurde in der vorletzten Gleichheit y2 ∈ im(P)⊥ verwendet. Also gilt P˜ = P, und P ist eine orthogonale Projektion. Beispiel 6.3
Sei e ∈ H mit e = 1. Dann ist P : H → H , x → x, ee die orthogonale Projektion auf span{e} = {αe | α ∈ C}. Denn es gilt im(P) = span{e} und P 2 = P = P ∗ wegen P 2 x = x, ee, e e = x, e e2 e = x, ee = P x,
P x, y = x, ee, y = x, e e, y = x, e, ye = x, y, ee = x, P y. Sei nun {e1 , . . . , en } ⊆ H ein Orthonormalsystem, und sei P j := ·, e j e j die orthogonale Projektion auf span{e j } für j = 1, . . . , n. Für j = k gilt P j Pk x = x, ek ek , e j e j = x, ek ek , e j e j = 0, und für P := nj=1 P j folgt P 2 = (P1 +. . .+ Pn )2 = P12 +. . .+ Pn2 = P1 +. . .+ Pn = P sowie P ∗ = P. Also ist P die Orthogonalprojektion auf im(P) = span{e1 , . . . , en }.
148
6 Der Spektralsatz für selbstadjungierte Operatoren
Die Menge der orthogonalen Projektionen besitzen eine partielle Ordnung, welche durch folgendes Lemma charakterisiert wird. Lemma 6.4. Seien P1 und P2 orthogonale Projektionen auf M1 := im(P1 ) bzw.
M2 := im(P2 ). a) P1 P2 ist genau dann eine orthogonale Projektion, falls P1 P2 = P2 P1 gilt. In diesem Fall ist P1 P2 die orthogonale Projektion auf den Unterraum M1 ∩ M2 . b) Es sind äquivalent: (i) M1 ⊆ M2 . (ii) Es gilt P1 x ≤ P2 x (x ∈ H ). (iii) Es gilt P1 ≤ P2 im Sinne von P2 − P1 ≥ 0 (siehe Definition 5.55), d. h. es gilt
P1 x, x ≤ P2 x, x (x ∈ H ). (iv) Es gilt P1 P2 = P2 P1 = P1 .
Beweis. a) Falls P1 P2 = P2 P1 , erhalten wir (P1 P2 )2 = P1 P2 P1 P2 = P12 P22 = P1 P2 und (P1 P2 )∗ = (P2 P1 )∗ = P1∗ P2∗ = P1 P2 . Also ist P1 P2 eine orthogonale Projektion. Falls andererseits P1 P2 eine orthogonale Projektion ist, so gilt P1 P2 = (P1 P2 )∗ = P2∗ P1∗ = P2 P1 . In diesem Fall gilt im(P2 P1 ) ⊆ im(P2 ) = M2 und im(P2 P1 ) = im(P1 P2 ) ⊆ M1 . Für x ∈ M1 ∩ M2 ist x = P1 x = P2 x, d. h. P2 P1 x = x. Insgesamt erhalten wir im(P2 P1 ) = M1 ∩ M2 . b) (i)⇒(ii): Sei x ∈ X , und sei M1 ⊆ M2 . Dann gilt (1 − P2 )x ∈ M2⊥ ⊆ M1⊥ und damit P1 (1 − P2 )x = 0, d.h. P1 P2 x = P1 x. Wir erhalten P1 x = P1 P2 x ≤ P2 x. (ii)⇒(iii): Für alle x ∈ H gilt
P1 x, x = P12 x, x = P1 x, P1 x = P1 x2 ≤ P2 x2 = P2 x, x. (iii)⇒(iv): Sei x ∈ H . Dann folgt mit (iii) und P2 (1 − P2 ) = 0 P1 (1 − P2 )x2 = P1 (1 − P2 )x, (1 − P2 )x ≤ P2 (1 − P2 )x, (1 − P2 )x = 0 und damit P1 x = P1 P2 x. Folglich gilt P1 P2 = P1 und damit auch P2 P1 = P2∗ P1∗ = (P1 P2 )∗ = P1∗ = P1 . (iv)⇒(i): Nach a) ist P1 P2 die orthogonale Projektion auf M1 ∩ M2 , und aus P1 P2 = P1 folgt M1 ∩ M2 = M1 , d. h. M1 ⊆ M2 .
6.1
Spektralmaße
149
In der Situation von Teil b) des obigen Lemmas ist wegen (P1 − P2 )2 = P12 + P22 − P1 P2 − P2 P1 = P2 − P1 und (P2 − P1 )∗ = P2 − P1 auch die Differenz P2 − P1 eine orthogonale Projektion. Falls man eine Folge (Pn )n∈N mit Pn ≤ Pn+1 (n ∈ N) hat, ist für alle m > n auch Pm − Pn eine orthogonale Projektion und hat Operatornorm 1 (falls Pm = Pn ). Die Folge (Pn )n∈N kann also nur dann in der Operatornorm konvergieren, falls sie schließlich konstant ist. Daher sind im Zusammenhang mit orthogonalen Projektionen andere Konvergenzbegriffe nützlicher. Definition 6.5. Seien (Tn )n∈N ⊆ L(H ) und T ∈ L(H ). Dann konvergiert Tn stark (oder in der starken Operatortopologie) gegen T , falls Tn x → T x (n → ∞) s
für alle x ∈ H gilt. In diesem Fall schreibt man Tn → T (n → ∞) oder T = s-limn→∞ Tn . Die Folge konvergiert in der schwachen Operatortopologie gegen T , falls
Tn x, y → T x, y (n → ∞) für alle x, y ∈ H gilt. Lemma 6.6. Sei (Pn )n∈N ⊆ L(H ) eine Folge orthogonaler Projektionen mit Pm ≤
Pn für m ≤ n. Dann konvergiert Pn stark gegen eine orthogonale Projektion P ∈ L(H ).
Beweis. Für x ∈ H ist die Folge (Pn x)n∈N ⊆ R beschränkt durch x und nach Lemma 6.4 b) monoton steigend, also konvergent. Sei m ≤ n. Wir verwenden
Pn x, Pm x = Pm Pn x, x = Pm x, x = Pm x2 und erhalten Pn x − Pm x2 = Pn x, Pn x − Pn x, Pm x − Pm x, Pn x + Pm x, Pm x = Pn x2 − Pm x2 − Pm x2 + Pm x2 = Pn x2 − Pm x2 → 0 (n ≥ m, m → ∞). Also ist (Pn x)n∈N ⊆ H eine Cauchyfolge, und wegen der Vollständigkeit von H existiert der Grenzwert P x := limn→∞ Pn x ∈ H . Als Grenzwert linearer Abbildungen ist x → P x selbst linear, und es gilt P x = limn→∞ Pn x ≤ x. Also ist P ∈ L(H ). Wegen
P x, y = limn→∞ Pn x, y = limn→∞ x, Pn y = x, P y und
P 2 x, y = P x, P y = lim Pn x, Pn y = lim Pn2 x, y = lim Pn x, y = P x, y n→∞
n→∞
n→∞
150
6 Der Spektralsatz für selbstadjungierte Operatoren s
folgt P 2 = P = P ∗ , also ist P eine orthogonale Projektion mit Pn → P (n → ∞).
Bemerkung 6.7. Der später formulierte Spektralsatz liefert eine besonders gute Darstellung selbstadjungierter Operatoren und verwendet ein Integral über Spektralmaße. Diese verallgemeinern den aus Kap. 3 bekannten Maßbegriff und besitzen als Werte orthogonale Projektionen. Zur Motivation für die Definition eines Spektralmaßes betrachten wir die endlich-dimensionale Situation. Sei T = T ∗ ∈ L(Cn ) = Cn×n eine hermitesche Matrix. Dann existiert eine Orthonormalbasis e1 , . . . , en von Eigenvektoren von T zu Eigenwerten λ j . Sei P j = ·, e j e j die orthogonale Projektion auf span{e j }, siehe Beispiel 6.3. Für alle x ∈ Cn gelten wegen der Basiseigenschaft und wegen T e j = λ j e j die Darstellungen x= Tx =
n j=1 n
x, e j e j =
n
P j x,
j=1
λ j x, e j e j =
j=1
n
λ j P j x.
i=1
Man kann diese Darstellung noch nach gleichen Eigenwerten zusammenfassen: Seien d ∈ {1, . . . , n} und λ ∈ σ (T ) ein d-facher Eigenwert von T , etwa λ = λ j1 = · · · = λ jd . Dann ist E({λ}) := P j1 + · · · + P jd nach Beispiel 6.3 die Orthogonalprojektion auf span{e j1 , . . . , e jd } = ker(T − λ), d. h. auf den Eigenraum zum Eigenwert λ. Insgesamt erhält man für alle x ∈ H x= E({λ})x, λ∈σ (T )
Tx =
λE({λ})x.
λ∈σ (T )
Die obigen Darstellungen von T x erlauben es, Funktionen von T zu definieren bzw. einfach zu berechnen. Für jede Funktion f : σ (T ) → C definiert man die Matrix f (T ) durch f (T )x := f (λ)E({λ})x (x ∈ Cn ). (6.2) λ∈σ (T )
Falls f (λ) = λ N , so ist diese Definition mit dem Matrizenprodukt kompatibel, d. h. es gilt TNx = λ N E({λ})x λ∈σ (T )
für alle x ∈ Cn . Auch die Definition von exp(T )x nach (6.2) ist mit der klassischen Definition über die Exponentialreihe kompatibel. Die obigen Darstellungen und die Definition für f (T )x sollen nun auf beliebige selbstadjungierte Operatoren T : H ⊇ D(T ) → H übertragen werden. Anders als im Matrizen-
6.1
Spektralmaße
151
Fall, ist das Spektrum jetzt im Allgemeinen keine endliche Menge mehr und kann sogar überabzählbar sein, wie das in Beispiel 5.47 der Fall war. Daher muss die Summe durch ein Integral ersetzt werden, wobei es sich um Integrale bezüglich eines Spektralmaßes handelt, welches wir zunächst definieren. Im Folgenden sei stets (X , A ) ein Messraum, d. h. A sei eine σ -Algebra über X (siehe Definition 3.1). Definition 6.8. Eine Abbildung E : A → L(H ) heißt ein Spektralmaß oder ein projektorwertiges Maß, falls gilt: (i) Für alle A ∈ A ist E(A) ∈ L(H ) eine orthogonale Projektion. (ii) Sei (An )n∈N ⊆ A eine Familie paarweise disjunkter Mengen. Dann gilt ˙ E An x = E(An )x (x ∈ H ), n∈N
n∈N
wobei die Reihe auf der rechten Seite in H konvergiert. (iii) Es gilt E(X ) = idH . Eine Menge A ∈ A heißt eine E-Nullmenge, falls E(A) = 0 (dabei ist die 0 auf der rechten Seite der Nulloperator in H ). Falls X ein topologischer Raum ist und A = B (X ) die Borel-σ -Algebra, so besitzt ein Spektralmaß E : B (X ) → L(H ) kompakten Träger, falls eine kompakte Menge K ∈ B (X ) existiert mit E(K ) = idH . Lemma 6.9. Sei E : A → L(H ) ein Spektralmaß.
a) Es gilt E(∅) = 0, und für alle A, B ∈ A mit A ⊆ B ist E(B \ A) = E(B)− E(A). Für alle A, B ∈ A gilt E(A ∪ B) + E(A ∩ B) = E(A) + E(B). b) Sei (An )n∈N ⊆ A eine Folge messbarer Mengen mit An ⊆ An+1 (n ∈ N). Dann ist E( n∈N An ) = s-limn→∞ E(An ). Analog gilt für jede Folge (An )n∈N ⊆ A mit An ⊇ An+1 (n ∈ N) die Gleichheit E( n∈N An ) = s-limn→∞ E(An ). c) Für alle A, B ∈ A gilt E(A ∩ B) = E(A)E(B) = E(B)E(A). Falls A ∩ B = ∅, so ist im(E(A)) ⊥ im(E(B)).
152
6 Der Spektralsatz für selbstadjungierte Operatoren
Beweis. a) Setzt man An := ∅ für alle n ∈ N, so folgt aus der Konvergenz der Reihe in (ii) bereits E(∅)x = 0. Insbesondere ist E auch endlich additiv. Damit folgt für A, B ∈ A mit A⊆B ˙ (B \ A)) = E(A) + E(B \ A). E(B) = E(A ∪ Für alle A, B ∈ A erhalten wir ˙ (A ∩ B) = E(A) + E(B \ A) + E(A ∩ B) E(A) + E(B) = E(A) + E (B \ A) ∪ ˙ (B \ A) + E(A ∩ B) = E(A ∪ B) + E(A ∩ B). = E A∪ b) Sei (An )n∈N ⊆ A mit An ⊆ An+1 (n ∈ N). Wir definieren A := n∈N An , A0 := ∅ und An := An \ An−1 für n ≥ 1. Dann sind An paarweise disjunkt und es gilt A = ˙ n∈N An . Wir erhalten für alle x ∈ H unter Verwendung von a) E(A)x = E
˙
N N An x = lim E(An )x = lim E(An \ An−1 )x N →∞
n∈N
= lim
N →∞
N
N →∞
n=1
n=1
E(An )x − E(An−1 )x = lim E(A N )x. N →∞
n=1
Sei nun (An )n∈N ⊆ A eine Folge messbarer Mengen mit An ⊇ An+1 (n ∈ N). Wir definieren A˜ n := A1 \ An (n ∈ N). Dann gilt A˜ n ⊆ A˜ n+1 , und wir erhalten E( n∈N A˜ n ) = s-limn→∞ A˜ n . Wegen n∈N
A˜ n =
(A1 \ An ) = A1 \
n∈N
An
n∈N
und A˜ n = A1 \ An impliziert dies
E(A1 ) − E An = E A1 \ An = s-lim E(A1 \ An ) = E(A1 ) − s-lim E(An ) n∈N
n∈N
n→∞
n→∞
und damit E( n∈N An ) = s-limn→∞ E(An ). ˙ B), also ist E(A) + c) Seien A, B ∈ A mit A ∩ B = ∅. Dann gilt E(A) + E(B) = E(A ∪ E(B) wieder eine orthogonale Projektion, und aus (E(A) + E(B))2 = E(A) + E(B) folgt E(A)E(B) = −E(B)E(A). Für x ∈ im(E(A)) erhalten wir E(A)E(B)x = E(A)2 E(B)x = −E(A)E(B)E(A)x = −E(A)E(B)x, d. h. E(A)E(B)x = 0. Folglich gilt x ∈ ker(E(B)) wegen E(B)x = E(B)E(A)x = −E(A)E(B)x = 0.
6.1
Spektralmaße
153
Nach Lemma 6.2 a) gilt ker E(B) = (im(E(B)))⊥ , was im(E(A)) ⊥ im(E(B)) sowie E(A)E(B) = E(B)E(A) = 0 zeigt. Falls A, B ∈ A beliebig sind, so berechnet man ˙ (A \ B) E (A ∩ B) ∪˙ (B \ A) E(A)E(B) = E (A ∩ B) ∪ = E(A ∩ B) + E(A \ B) E(A ∩ B) + E(B \ A) = E(A ∩ B)E(A ∩ B) + E(A \ B)E(A ∩ B) +E(A ∩ B)E(B \ A) + E(A \ B)E(B \ A). Der erste dieser vier Summanden ist E(A ∩ B), während bei den drei anderen Summanden die beiden Mengen jeweils disjunkt sind und das Produkt somit jeweils den Wert 0 ergibt. Also folgt E(A)E(B) = E(A ∩ B) = E(B ∩ A) = E(B)E(A). Sei E : A → L(H ) ein Spektralmaß. Dann definiert
Bemerkung 6.10.
E x : A → [0, ∞),
A → E(A)x, x = E(A)x2
ein endliches reellwertiges Maß (siehe Definition 3.4), denn es gilt E x (∅) = 0, x = 0 nach Lemma 6.9 a), und die σ -Additivität folgt aus
˙ Ex An = E(An )x, x =
E(An )x, x = E x (An ) n∈N
n∈N
n∈N
n∈N
für jede disjunkte Folge (An )n∈N ⊆ A . Es gilt E x (X ) = id X x, x = x2 . Falls x = 1, so ist E x also ein Wahrscheinlichkeitsmaß. Wir schreiben Integrale bezüglich E x auch in der Form 2 f (λ) dE(λ)x := f (λ) d E(λ)x, x := f (λ) dE x (λ). Wir wollen im Folgenden für messbare Funktionen f : X → C das Integral f (λ) dE(λ) definieren. Man beachte, dass dies kein Integral im Sinn von Abschn. 3.2 ist, da das Maß Werte in L(H ) und nicht in [0, ∞] annimmt. Dennoch folgt man dem Aufbau der Integrationstheorie aus diesem Abschnitt: Man definiert zunächst das Integral für Stufenfunktionen und geht dann in geeigneter Weise zum Grenzwert über (der in diesem Fall in der starken Operatortopologie genommen wird, vergleiche Definiton 6.5). Definition 6.11. Sei E : A → L(H ) ein Spektralmaß, und sei f : X → C eine Stu fenfunktion, d. h. es existiert eine Darstellung der Form f = kj=1 c j 1 A j mit c j ∈ C und A j ∈ A disjunkt. Dann heißt
154
6 Der Spektralsatz für selbstadjungierte Operatoren
f (λ) dE(λ) :=
f dE :=
k
c j E(A j ) ∈ L(H )
j=1
das Integral von f bezüglich E. Lemma 6.12. Sei E : A → L(H ) ein Spektralmaß.
a) Die Abbildung f → f dE (vom Vektorraum der Stufenfunktionen nach L(H )) ist linear, und für jede Stufenfunktion f gilt ( f dE)∗ = f dE. b) Sei f : X → C eine Stufenfunktion. Dann gilt für alle x ∈ H 2 2 2 2 f (λ) dE(λ) x = | f (λ)| d E(λ)x, x ≤ sup | f (λ)| x . λ∈X
c) Für alle Stufenfunktionen f , g : X → C gilt (
f dE)( g dE) = f g dE.
Beweis. a) Dies folgt direkt aus der Definition des Integrals. b) Unter Verwendung des Satzes von Pythagoras erhalten wir 2 n n 2 2 = f dE x c E(A )x = |c j |2 E(A j )x j j
j=1
| f |2 dE x ≤ sup | f (λ)|2 E x (X ) = sup | f (λ)|2 x2 .
=
λ∈X
λ∈X
m
n
j=1 c j 1 A j und g = k=1 dk 1 Bk Stufenfunktionen. Dann ist auch f g = c d 1 wieder eine Stufenfunktion, und mit Lemma 6.9 c) folgt k=1 j k A j ∩Bk
c) Seien f = n m j=1
j=1
f dE
g dE
=
n
i=1
=
j,k
m
c j E(A j )
dk E(Bk )
j=1
c j dk E(A j )E(Bk ) =
j,k
c j dk E(A j ∩ Bk ) =
f g dE.
Die Aussagen des letzten Lemmas erlauben es, das Integral auf eine größere Klasse von Funktionen auszuweiten. Im folgenden Satz betrachten wir wieder das (skalare) Maß E x : A → [0, ∞), A → E(A)x2 (siehe Bemerkung 6.10).
6.1
Spektralmaße
155
Satz 6.13. Seien E : A → L(H ) ein Spektralmaß, x ∈ H und f : X → C eine Abbildung. Dann sind äquivalent:
(i) Es gilt f ∈ L 2 (E x ), d. h. f ist messbar mit | f (λ)|2 dE x (λ) < ∞. (ii) Es gibt eine Folge ( f n )n∈N von Stufenfunktionen mit f n → f punktweise und | f n (λ) − f (λ)|2 dE x (λ) → 0 (n → ∞). Dabei kann die Folge in (ii) unabhängig von x ∈ H gewählt werden. Sind ( f n )n∈N und (gn )n∈N Folgen wie in (ii), so sind die Folgen f n (λ) dE(λ) x ⊆ H und gn (λ) dE(λ) x ⊆H n∈N
n∈N
konvergent mit gleichem Grenzwert.
Beweis. (ii)⇒(i): Als punktweiser Limes messbarer Funktionen ist f messbar. Da E x ein endliches Maß ist, ist jede Stufenfunktion integrierbar. Nach (ii) existiert ein n 0 ∈ N mit | f n 0 (λ) − f (λ)|2 dE x (λ) ≤ 1. Damit gilt | f (λ)|2 dE x (λ) ≤ 2 | f n 0 (λ)|2 dE x (λ) + 2 < ∞. Also gilt f ∈ L 2 (E x ). (i)⇒(ii): Das ist die Aussage von Lemma 3.58. Dabei wählt man wie dort die Folge von Stufenfunktionen so, dass | f n (λ)| ≤ | f (λ)| für alle n ∈ N und λ ∈ X gilt. Für jedes x˜ ∈ H mit f ∈ L 2 (E x˜ ) folgt dann mit majorisierter Konvergenz | f n (λ) − f (λ)|2 dE x˜ (λ) → 0 (n → ∞), d.h. man kann die approximierende Folge unabhängig von x wählen. Sei nun f ∈ L 2 (E x ), und seien ( f n )n∈N und (gn )n∈N Folgen wie in (ii). Dann gilt nach Lemma 6.12 b) 2 2 = f ( f (λ) dE(λ) − f (λ) dE(λ) x (λ) − f (λ)) dE(λ) x n m n m = | f n (λ) − f m (λ)|2 dE x (λ) → 0 (n → ∞),
da ( f n )n∈N ⊆ L 2 (E x ) nach (ii) konvergent ist. Genauso sieht man 2 f (λ) dE(λ) − g (λ) dE(λ) x n n → 0 (n → ∞).
(6.3)
Also sind ( f n (λ) dE(λ)x)n∈N und ( gn (λ) dE(λ)x)n∈N beides Cauchyfolgen in H und damit konvergent. Wegen (6.3) besitzen beide Folgen denselben Grenzwert.
156
6 Der Spektralsatz für selbstadjungierte Operatoren
Die Bedingung aus Satz 6.13 erlaubt es, für f ∈ L 2 (E x ) das Integral f dE als Grenzwert der Integrale über eine approximierende Folge von Stufenfunktionen zu definieren. Dabei wird die Bedingung f ∈ L 2 (E x ) zur Bedingung an den Definitionsbereich dieses Integrals. Definition 6.14. Seien f : X → C messbar und E : A → L(H ) ein Spektralmaß. Dann definiert man den Operator f dE : H ⊇ D( f dE) → H durch | f |2 dE x < ∞ , D f dE := x ∈ H f n dE x f¨ur x ∈ D f dE x := lim f dE . n→∞
Dabei ist ( f n )n∈N eine Folge wie in Satz 6.13. Wir setzen
f (λ) dE(λ) :=
f dE.
Ein großer Vorteil des obigen Integralbegriffs liegt darin, dass man das Integral über jede messbare Funktion bilden kann, wobei der Definitionsbereich des Integrals f dE von f abhängt. Die Wohldefiniertheit des Integrals ist wegen Lemma 6.12 gegeben. Wir wollen im Folgenden die Eigenschaften des Integrals genauer untersuchen. Lemma 6.15. Sei E : A → L(H ) ein Spektralmaß, und sei f : X → C messbar.
a) Zu N ≥ 0 sei A N := λ ∈ X | f (λ)| ≤ N . Dann gilt im(E(A N )) ⊆ D( f dE). b) D( f dE) ist ein dichter Untervektorraum von H , und es gilt 2 2 f (λ) dE(λ) x = | f (λ)| dE x x ∈ D( f dE) .
(6.4)
Beweis.
a) Wegen D( f dE) = D( | f | dE) können wir ohne Einschränkung f ≥ 0 annehmen. Nach Satz 3.30 existiert eine Folge ( f n )n∈N von Stufenfunktionen mit f n f (n → ∞). Dann gilt mit monotoner Konvergenz für jedes x ∈ H f n (λ)2 1 A N (λ) dE x (λ) → f (λ)2 1 A N (λ) dE x (λ) ≤ N 2 x2 (n → ∞). Sei x N ∈ im(E(A N )). Dann gilt x N = E(A N )x N , und wegen E(A N )x N und Lemma 6.12 b) und c) folgt
1 A N dE x N =
6.1
Spektralmaße
157
2 f f n (λ)2 dE x N (λ) = lim (λ) dE(λ) xN n n→∞ n→∞ 2 = lim 1 A N (λ) dE(λ) x N f n (λ) dE(λ)
f (λ)2 dE x N (λ) = lim
n→∞
2 = lim (λ)1 (λ) dE(λ) xN f n AN n→∞ f n (λ)2 1 A N (λ) dE x N (λ) ≤ N 2 x N 2 < ∞. = lim n→∞
Somit ist x N ∈ D( f dE). b) Offensichtlich gilt E αx = |α|2 E x für alle α ∈ C und x ∈ H . Ebenso gilt für alle A ∈ A und x, y ∈ H E x+y (A) = x + y, E(A)(x + y) ≤ E x (A) + E y (A) + 2| E(A)x, E(A)y| ≤ E x (A) + E y (A) + 2E(A)x E(A)y ≤ E x (A) + E y (A) + E(A)x2 + E(A)y2 ≤ 2E x (A) + 2E y (A). Damit ist D( f dE) ein linearer Unterraum. Sei x ∈ H . Wir definieren x N := E(A N )x für N ∈ N. Dann gilt x N ∈ D( f dE) nach a), und wegen x N = E(A N )x → E A N x = E(X )x = x (N → ∞) N ∈N
(vergleiche Definition 6.8) folgt x N → x (N → ∞). Somit ist D( f dE) dicht in H . Die Gleichheit (6.4) folgt aus der entsprechenden Eigenschaft für Stufenfunktionen (Lemma 6.12 b)) mit majorisierter Konvergenz. Bemerkung 6.16. Der Operator f dE ist für alle messbaren Funktionen f bereits durch die Familie (E x )x∈H der skalaren Maße E x : A → [0, ∞) eindeutig festgelegt. Um das zu sehen, verwenden wir die Polarisationsformel (Satz 2.3 c)), die wir im Komplexen kurz in der Form 1 zx + zy2 (x, y ∈ H )
x, y = 4 4 z =1
schreiben. Für Stufenfunktionen f =
n
j=1 c j 1 A j
erhält man
158
6 Der Spektralsatz für selbstadjungierte Operatoren
!
"
f dE x, y =
n
c j E(A j )x, y =
n
j=1
c j E(A j )x, E(A j )y
j=1
n 1 cj zE(A j )x + z E(A j )y2 = 4 4 j=1
z =1
n 1 1 = z c j E x+zy (A j ) = z f dE x+zy . 4 4 4 4 z =1
(6.5)
z =1
j=1
Damit ist der Operator f dE ∈ L(H ) für alle Stufenfunktionen f durch die Maße E x mit x ∈ H schon eindeutig bestimmt. Nach Definition 6.14 gilt dies auch für alle messbaren Funktionen f , insbesondere ist auch D( f dE) schon durch die skalaren Maße festgelegt. Satz 6.17. Sei E : A → L(H ) ein Spektralmaß, und sei f : X → C messbar. Dann
ist
f dE ein normaler Operator, und es gilt (
f dE)∗ =
f dE.
Beweis. Sei wieder A N := {λ ∈ X | | f (λ)| ≤ N }, und sei ( f n )n∈N eine Folge von Stu fenfunktionen wie in Satz 6.13. Nach Lemma 6.15 a) gilt E(A N )y ∈ D( f dE) für alle N ∈ N und alle y ∈ H . Sei nun x ∈ D(( f dE)∗ ) und x ∗ := ( f dE)∗ x. Dann erhalten wir für alle y ∈ H unter Verwendung von Lemma 6.12 ! " ∗ ∗ f dE E(A N )y
E(A N )x , y = x , E(A N )y = x, ! ! " " f n dE E(A N )y = lim x, E(A N ) = lim x, f n dE y n→∞ n→∞ ! " = lim f n dE E(A N )x, y . n→∞
Somit gilt ∗
E(A N )x =
f dE
E(A N )x =
f 1 A N dE x.
Es gilt E(A N )x ∗ → x ∗ (N → ∞), und mit monotoner Konvergenz erhält man 2 = | f |2 1 A dE x → | f |2 dE x (N → ∞). f 1 dE x A N N Nach (6.6) folgt
| f |2 dE x ≤ x ∗ < ∞ und damit x ∈ D(
f dE). Somit gilt
(6.6)
6.1
Spektralmaße
159 ∗
E(A N )x =
f 1 A N dE x = lim f n 1 A N dE x n→∞ = lim E(A N ) f n dE x = E(A N ) f dE x. n→∞
Für N → ∞ erhält man x ∗ = ( f dE)x, d. h. wir haben ( f dE)∗ ⊆ f dE gezeigt. Für die umgekehrte Inklusion seien x ∈ D( f dE) und y ∈ D( f dE). Dann gilt ! ! ! " " " f n dE y = lim x, f dE y = lim x, f n dE x, y n→∞ n→∞ ! " = f dE x, y , und nach Definition des adjungierten Operators ist x ∈ D(( f dE)∗ ). Insgesamt erhalten wir ( f dE)∗ = f dE. Wegen 2 2 = | f |2 dE x = f dE x x ∈ D f dE f dE x folgt D( f dE) = D(( f dE)∗ ) sowie ( f dE)x = ( f dE)∗ x (x ∈ D( f dE)). Also ist f dE ein normaler Operator. Wie der obige Satz zeigt, ist T := f dE immer ein normaler Operator. Eigenschaften dieses Operators können am Spektralmaß E in Verbindung mit der Funktion f direkt abgelesen werden, wie das folgende Resultat zeigt. Dabei sagt man in Analogie zu skalaren Maßen (siehe Definition 3.4 c)), dass eine Aussage M(λ) für E-fast alle λ ∈ X gilt (oder E-fast überall), falls E {λ ∈ X | M(λ) gilt nicht} = 0.
Satz 6.18. Sei E : A → L(H ) ein Spektralmaß, und seien f , g : X → C messbare Funktionen.
a) Es ist f dE = g dE (als Gleichheit linearer Operatoren) genau dann, wenn f = g E-fast überall gilt. b) Der Operator f dE st genau dann injektiv, wenn f (λ) = 0 für E-fast alle λ ∈ X gilt. c) Es gilt f dE ∈ L(H ) genau dann, wenn f E-fast überall beschränkt ist, d. h. wenn eine Konstante c > 0 existiert mit | f (λ)| ≤ c für E-fast alle λ ∈ X . In diesem Fall gilt
160
6 Der Spektralsatz für selbstadjungierte Operatoren
f dE = f L ∞ (E) := inf c > 0 | f | ≤ c E-fast überall . d) Der Operator f dE ist genau dann selbstadjungiert, falls f (λ) ∈ R für E-fast alle λ ∈ X gilt.
Beweis. a) (i) Seien
f dE =
g dE und A := {λ | f (λ) = g(λ)}. Wir setzen A N := A ∩ λ ∈ X | f (λ)| ≤ N , |g(λ)| ≤ N
für N ∈ N und zeigen E(A N ) = 0 (N ∈ N). Sei dazu x ∈ im(E(A N )). Nach Lemma 6.15 a) folgt x ∈ D( f dE) = D( g dE). Seien f n → f und gn → g Stufenfunktionen. Dann gilt 2 2 f f dE x − g dE x dE x − g dE x −→ n n = 0 (n → ∞).
Andererseits ist die linke Seite wegen E(A N )x = x gegeben durch 2 2 1 f dE x − g dE x = ( f − g ) dE x n n AN n n = 1 A N | f n − gn |2 dE x → 1 A N | f − g|2 dE x (n → ∞). Somit gilt
AN
| f − g|2 dE x = 0. Nach Satz 3.34 a) folgt E x {λ ∈ A N | f (λ) − g(λ)| > 0} = 0
und damit x2 = E(A N )x2 = E x (A N ) = 0. Somit gilt E(A N ) = 0. Für N → ∞ erhält man E(A) = lim N →∞ E(A N ) = 0. (ii) Sei nun E({ f = g}) = 0. Dann ist E x ({ f = g}) = 0 für alle x ∈ H und damit D( f dE) = D( g dE). Aus f dE x = g dE x (x ∈ D( f dE)) folgt mit der Polarisationsformel (6.5) aus Bemerkung 6.16 bereits f dE = g dE. b) Seien f dE injektiv und A := {λ ∈ X | f (λ) = 0}. Für x ∈ im(E(A)) erhalten wir (wieder mit Lemma 6.15) x ∈ D( f dE) sowie 2 f dE x | f |2 dE x = 0. = A
6.1
Spektralmaße
161
Da f dE injektiv ist, erhalten wir x = 0 und somit E(A) = 0. Sei nun f = 0 E-fast überall. Für x ∈ ker( f dE) gilt 2 2 f dE x 0= = | f | dE x . Daher ist E x ({| f | > 0}) = 0. Wegen E({ f = 0}) = 0 erhalten wir E x (X ) = 0 und somit x2 = E(X )x2 = 0, und f dE ist injektiv. c) Sei f ∈ L ∞ (E), und sei c > 0 mit E(Ac ) = 0 für Ac := {λ ∈ X | | f (λ)| > c}. Dann gilt für alle x ∈ H 2 | f (λ)| dE x (λ) = 1 X \Ac | f (λ)|2 dE x (λ) ≤ c2 E x (X \ Ac ) ≤ c2 x2 < ∞. Also ist D( f dE) = H , und aus ( f dE)x2 = | f |2 dE x und der obigen Rech nung folgt ( f dE)x ≤ cx (x ∈ H ). Damit ist f dE ein beschränkter Operator, und für seine Operatornorm gilt f dE ≤ inf{c > 0 | E(Ac ) = 0} = f L ∞ (E) . Falls f dE < f L ∞ (E) , so existiert ein c > f dE mit E(Ac ) = 0. Für x ∈ im(E(Ac )) \ {0} folgt dann 2 2 f dE x = | f | dE x = 1 Ac | f |2 dE x ≥ c2 x2 , im Widerspruch zu f dE < c. Also erhalten wir f dE = f L ∞ (E) . Dieselbe Rechnung zeigt, dass f E-fast überall beschränkt ist, falls f dE ∈ L(H ). d) Nach Satz 6.17 ist ( f dE)∗ = f dE. Mit Teil a) sieht man, dass dies genau dann gleich f dE ist, wenn f (λ) = f (λ) für E-fast alle λ ∈ X gilt, d. h. wenn f E-fast überall reellwertig ist. In Lemma 6.12 c) hatten wir gesehen, dass die Abbildung f → f dE für Stufenfunktionen nicht nur additiv, sondern sogar multiplikativ ist. Dieselben Eigenschaften gelten auch für allgemeine messbare Funktionen f , wobei man jetzt allerdings auf die Definitionsbereiche achten muss. Wie bisher bedeutet im folgenden Satz S ⊆ T für zwei lineare Operatoren, dass D(S) ⊆ D(T ) und T | D(S) = S gilt.
162
6 Der Spektralsatz für selbstadjungierte Operatoren
Satz 6.19. Sei E : A → L(H ) ein Spektralmaß, und seien A ∈ A sowie f , g : X → C messbar. Dann gilt (c f ) dE = c f dE für alle c ∈ C sowie E(A) f dE ⊆ f dE E(A), f dE + g dE ⊆ ( f + g) dE, f dE g dE ⊆ ( f · g) dE.
Beweis. Die Gleichheit (c f ) dE = c f dE folgt direkt aus den Definitionen. Zur Abkür zung setzen wir Th := h dE für jede messbare Funktion h : X → C. Wir approximieren f und g wieder durch Stufenfunktionen f n → f und gn → g wie in Lemma 3.58, wobei | f n (λ)| | f (λ)| und |gn (λ)| |g(λ)| für n → ∞ gilt. Um die erste Inklusion zu zeigen, sei x ∈ D(E(A)T f ) = D(T f ) und y := E(A)x. Dann erhält man mit monotoner Konvergenz und mit Lemma 6.12 c) | f n |2 dE y = lim T fn y2 = lim T fn E(A)x2 | f |2 dE y = lim n→∞ n→∞ n→∞ 2 2 1 A | f n |2 dE x = lim T fn T1 A x = lim T fn 1 A x = lim n→∞ n→∞ n→∞ = 1 A | f |2 dE x ≤ | f |2 dE x = T f x2 . Also gilt y ∈ D(T f ) und somit x ∈ D(T f E(A)). Nach Definition des Integrals gilt außerdem, wieder unter Verwendung von Lemma 6.12 c), T f y = lim T fn y = lim T fn E(A)x = lim E(A)T f n x = E(A)T f x. n→∞
n→∞
n→∞
Dies zeigt die erste Inklusion E(A)T f ⊆ T f E(A). Für die zweite Inklusion T f + Tg ⊆ T f +g beachte man, dass für x ∈ D(T f + Tg ) = D(T f ) ∩ D(Tg ) gilt f , g ∈ L 2 (E x ) und damit f + g ∈ L 2 (E x ), d.h. x ∈ D(T f +g ). Die Gleichheit der Operatoren für alle x ∈ D(T f + Tg ) folgt dann wieder durch Approximation durch Stufenfunktionen. Nach dem bisher Gezeigten gilt die dritte Inklusion bereits für f = 1 A und wegen der Linearität für alle Stufenfunktionen, insbesondere ist T fn Tg ⊆ T fn g . Sei nun x ∈ D(T f Tg ), d. h. es gilt x ∈ D(Tg ) und Tg x ∈ D(T f ). Dann folgt wieder mit monotoner Konvergenz | f n g|2 dE x = | f g|2 dE x . T f Tg x2 = lim T fn Tg x2 = lim T fn g x2 = lim n→∞
n→∞
n→∞
6.2
Spektralsatz und Funktionalkalkül
163
Also gilt x ∈ D(T f g ). Mit majorisierter Konvergenz und der zweiten Inklusion erhalten wir die Abschätzung 2 2 (T f g − T fn g )x = T f g− fn g x = | f − f n |2 |g|2 dE x → 0 (n → ∞). Folglich ist T f g x = limn→∞ T fn g x = limn→∞ T fn Tg x = T f Tg x, und wir erhalten die gewünschte Aussage T f Tg ⊆ T f g . Man beachte, dass in den obigen Aussagen „⊆ “ nicht durch „=“ ersetzt werden kann. Sei etwa f : X → C eine messbare Funktion, welche nicht E-fast überall beschränkt ist. Dann gilt D( f dE) = H nach Satz 6.18 c). Setzt man g := − f , so ist ( f + g) dE = 0 und D f dE + g dE = D f dE = H = D ( f + g) dE .
6.2
Spektralsatz und Funktionalkalkül
Im Folgenden sei wieder H ein C-Hilbertraum. Im vorigen Abschnitt wurde gezeigt, dass bei einem gegebenen Spektralmaß E : A → L(H ) jeder messbaren Funktion f : X → C ein normaler Operator f dE zugeordnet werden kann. Der Spektralsatz, einer der wichtigsten Sätze der Operatortheorie, besagt, dass umgekehrt zu jedem normalen Operator T ein Spektralmaß auf dem Spektrum σ (T ) ⊂ C von T existiert mit T = λ dE(λ). Im folgenden Satz ist wieder B (σ (T )) die Borel-σ -Algebra (siehe Definition 3.14) über σ (T ). Satz 6.20 (Spektralsatz). Sei T : H ⊇ D(T ) → H ein normaler Operator. Dann existiert genau ein Spektralmaß E : B (σ (T )) → L(H ) mit T = λ dE(λ) σ (T )
als Gleichheit unbeschränkter Operatoren. Insbesondere gilt # $ D(T ) = x ∈ H |λ|2 dE x (λ) < ∞ , σ (T )
wobei das Maß E x wieder durch E x : B (σ (T )) → [0, ∞), A → E(A)x2 gegeben sei. Für jede messbare Funktion f : σ (T ) → C wird durch
164
6 Der Spektralsatz für selbstadjungierte Operatoren
$ D( f (T )) := x ∈ H | f (λ)|2 dE x (λ) < ∞ , σ (T ) f (λ) dE(λ), f (T ) := #
σ (T )
ein normaler Operator f (T ) : H ⊇ D( f (T )) → H definiert. Bemerkung 6.21. Falls der Operator T selbstadjungiert ist, so gilt σ (T ) ⊆ R nach Satz 5.39. In diesem Fall kann man das Spektralmaß E : B (σ (T )) → L(H ) durch E(R \ σ (T )) := 0 auf die ganzen reellen Zahlen ausweiten und erhält dann ein Spektralmaß E : B (R) → L(H ). In diesem Fall schreibt man den Spektralsatz häufig in der Form ∞ T = λ dE(λ). −∞
Da R\σ (T ) eine E-Nullmenge ist, gilt für jede messbare Funktion f : R → C die Gleichheit ∞ f (λ) dE(λ) = f (λ) dE(λ). −∞
σ (T )
Im Falle eines normalen Operators kann man das Spektralmaß E : B (σ (T )) → L(H ) analog fortsetzen zu einem projektorwertigen Maß E : B (C) → L(H ), indem man E(C \ σ (T )) := 0 setzt. Der Beweis des Spektralsatzes ist relativ aufwändig und wird hier nicht ausgeführt, wir verweisen etwa auf [54, Theorem 13.33], oder [70, Theorem VII.3.2]. Ein Beweisansatz liegt in der Identität E(A) = 1 A dE = 1 A (T ) für A ∈ B (σ (T )). Um diese Identität als Definition des Spektralmaßes nutzen zu können, muss die Funktion 1 A (T ) definiert werden. Dies kann (z. B. für beschränkte selbstadjungierte Operatoren) mit Hilfe eines sogenannten Funktionalkalküls geschehen, der ausgehend von den in natürlicher Weise definierten Operatoren p(T ) für Polynome p den Operator f (T ) zunächst für stetige Funktionen f und dann für messbare Funktionen f betrachtet. Korollar 6.22. Sei T : H ⊇ D(T ) → H ein normaler Operator mit zugehörigem
Spektralmaß E : B (σ (T )) → L(H ). Dann gilt E(σ (T )) = idH , insbesondere ist σ (T ) = ∅, und für alle A ∈ B (σ (T )) ist E(A) = 1 A (T ). Für jede messbare Funktion f : σ (T ) → L(H ) gilt 2 f (T )x = | f (λ)|2 dE x (λ) (x ∈ D( f (T ))). σ (T )
6.2
Spektralsatz und Funktionalkalkül
165
Beweis. Dies folgt alles sofort aus den Eigenschaften eines Spektralmaßes und des Integrals über Spektralmaße. Die Aussagen des folgenden Korollars beschreiben die wesentlichen Eigenschaften der Abbildung f → f (T ), die auch als Funktionalkalkül für den Operator T bezeichnet wird. Korollar 6.23 (Funktionalkalkül). Sei T : H ⊇ D(T ) → H ein normaler Operator mit zugehörigem Spektralmaß E, und seien f , g : σ (T ) → C messbare Funktionen.
a) Es gilt (c f )(T ) = c f (T ) für alle c ∈ C sowie f (T ) + g(T ) ⊆ ( f + g)(T ) und f (T )g(T ) ⊆ ( f · g)(T ). b) Der Operator f (T ) ist normal, und es gilt ( f (T ))∗ = f (T ). c) Es gilt f (T ) ∈ L(H ) genau dann, wenn f E-fast überall beschränkt ist, und in diesem Fall ist f (T ) = f L ∞ (E) . d) Sei ( f n )n∈N eine Folge E-fast überall beschränkter messbarer Funktionen f n : σ (T ) → C. Es gelte f n → f (n → ∞) punktweise und f n L ∞ (E) ≤ C (n ∈ N) mit einer Konstanten C > 0. Dann folgt f n (T )x → f (T )x (n → ∞) für alle x ∈ H .
Beweis. Das ist nur eine Umformulierung von Satz 6.18 d) und 6.19, wobei d) mit majorisierter Konvergenz folgt. Der Funktionalkalkül ist auch kompatibel mit der Komposition von Funktionen, wie das folgende Ergebnis zeigt. Man beachte dabei, dass f (g(T )) als f (S) für den normalen Operator S := g(T ) im Sinne von Satz 6.20 definiert ist, während der Operator ( f ◦ g)(T ) als h(T ) mit der skalaren Funktion h := f ◦ g definiert ist. Lemma 6.24. Sei T : H ⊇ D(T ) → H ein normaler Operator, und seien die Funk-
tionen f : C → C und g : σ (T ) → C messbar. Für die Komposition f ◦g : σ (T ) → C gilt dann ( f ◦ g)(T ) = f (g(T )).
Beweis. Seien E : B (C) → L(H ) das Spektralmaß von T und g : σ (T ) → C eine messbare Funktion. Dann definiert man das Bildmaß E ◦ g −1 : B (C) → L(H ) von E bezüglich g durch F(A) := (E ◦ g −1 )(A) := E(g −1 (A)) (A ∈ B (C)). Man rechnet sofort nach, dass das Bildmaß wieder ein Spektralmaß ist. Sei A ∈ B (C). Dann gilt nach dem Funktionalkalkül wegen 1 A ◦ g = 1g−1 (A)
166
6 Der Spektralsatz für selbstadjungierte Operatoren
(1 A ◦ g)(T ) = =
C C
(1 A ◦ g)(λ) dE(λ) =
C
1g−1 (A) (λ) dE(λ) = (E ◦ g −1 )(A)
˜ dF(λ). ˜ 1 A (λ)
Aufgrund der Linearität des Integrals folgt für alle Stufenfunktionen f : C → C ˜ dF(λ). ˜ ( f ◦ g)(T ) = ( f ◦ g)(λ) dE(λ) = f (λ) C
C
Nach Definition des Integrals gilt dies sogar für alle messbare Funktionen f : C → C. Setzt man insbesondere f = idC , erhält man g(T ) = C λ˜ dF(λ˜ ), d.h. F ist das zum normalen Operator g(T ) gehörige Spektralmaß. Somit gilt ( f ◦ g)(T ) = f (λ˜ ) dF(λ˜ ) = f (g(T )) C
für alle messbaren Funktionen f : C → C.
Der folgende Satz zeigt, dass das Spektrum des Operators durch die Eigenschaften des Spektralmaßes bestimmt ist. Satz 6.25. Sei T : H ⊇ D(T ) → H ein selbstadjungierter Operator mit zugehöri-
gem Spektralmaß E : B (R) → L(H ), und sei λ0 ∈ R.
a) Es gilt λ0 ∈ ρ(T ) genau dann, falls ein ε > 0 existiert mit E((λ0 − ε, λ0 + ε)) = 0. b) Es gilt im(E({λ0 })) = ker(T − λ0 ). Damit ist λ0 ∈ σ p (T ) genau dann, wenn E({λ0 }) = 0. c) Es ist λ0 ∈ σc (T ) genau dann, wenn E({λ0 }) = 0 und E((λ0 − ε, λ0 + ε)) = 0 für alle ε > 0 gilt.
Beweis. a) Nach Konstruktion (siehe Bemerkung 6.21) gilt E(ρ(T ) ∩ R) = 0. Falls λ0 ∈ ρ(T ), existiert wegen der Offenheit von ρ(T ) (Satz 5.22) ein ε > 0 mit Uε := (λ0 −ε, λ0 +ε) ⊆ ρ(T ), und es folgt E(Uε ) = 0.
6.2
Spektralsatz und Funktionalkalkül
167
Seien andererseits λ0 ∈ R und ε > 0 mit E(Uε ) = 0. Definiere die messbaren 1 Funktionen f , g : R → R durch f (λ) := λ−λ · 1R\Uε und g(λ) := λ − λ0 . Da f 0 beschränkt ist, folgt f (T ) ∈ L(H ). Mit dem Funktionalkalkül (Korollar 6.23) erhalten wir g(T ) = T − λ0 , wobei man D(g(T )) = D(T ) = D(T − λ0 ) beachte, sowie f (T )(T − λ0 ) = f (T )g(T ) ⊆ ( f · g)(T ) = 1R\Uε (T ) = E(R \ Uε ) = E(R) = idH . Angenommen, es gilt λ0 ∈ σ (T ). Nach Lemma 5.41 gilt σ (T ) = σapp (T ), also existiert eine Folge (xn )n∈N ⊆ D(T ) mit xn = 1 und (T − λ0 )xn → 0 (n → ∞). Wegen f (T ) ∈ L(H ) gilt xn ∈ D( f (T )(T −λ0 )) = D(T ), und wir erhalten f (T )(T −λ0 )xn = xn im Widerspruch zu 1 = f (T )(T − λ0 )xn ≤ f (T ) (T − λ0 )xn → 0 (n → ∞). Somit folgt λ0 ∈ ρ(T ). b) Falls λ0 ∈ ρ(T ), so sind beide Seiten in b) gleich {0}, also können wir λ0 ∈ σ (T ) annehmen. Sei x ∈ im(E({λ0 })). Dann gilt x = E({λ0 })x = 1{λ0 } (T )x, und wir erhalten T x = T 1{λ0 } (T )x = λ1{λ0 } (λ) dE(λ)x = λ dE(λ)x σ (T )
{λ0 }
= λ0 E({λ0 })x = λ0 x. Also ist x ∈ ker(T − λ0 ). Sei andererseits x ∈ ker(T − λ0 ). Dann gilt 2 0 = (T − λ0 )x =
∞ −∞
|λ − λ0 |2 dE x (λ),
und nach Satz 3.34 a) ist E x (R \ {λ0 }) = 0. Wir schreiben x = E(R)x = E({λ0 })x + E(R \ {λ0 })x.
(6.7)
Wegen E(R \ {λ0 })x2 = E x ({R \ {λ0 }) = 0 erhalten wir x = E({λ0 })x ∈ im(E({λ0 })). ˙ σ p (T ) ∪ ˙ σc (T ). c) folgt aus a) und b) wegen R = (R ∩ ρ(T )) ∪
168
6 Der Spektralsatz für selbstadjungierte Operatoren
Korollar 6.26. Sei T : H ⊇ D(T ) → H selbstadjungiert mit Spektralmaß E, und
seien λ0 ∈ R und x ∈ H . Dann sind äquivalent:
(i) x ist ein Eigenvektor von T zum Eigenwert λ0 . (ii) x ∈ im(E({λ0 })). (iii) E x ({λ0 }) = x2 . In diesem Fall ist x ein Eigenvektor von f (T ) für alle messbaren Funktionen f : R → C, und es gilt f (T )x = f (λ0 )x.
Beweis. Die Äquivalenz von (i) und (ii) wurde im Beweis von Satz 6.25 b) gezeigt. Für die Äquivalenz von (ii) und (iii) betrachtet man wieder die Zerlegung (6.7). Da diese nach Lemma 6.9 c) orthogonal ist, gilt x2 = E(R)x2 = E({λ0 })x2 + E(R \ {λ0 })x2 = E x ({λ0 }) + E x (R \ {λ0 }), und der zweite Summand verschwindet genau dann, wenn x ∈ im(E({λ0 })) gilt. Falls x ein Eigenvektor von T zum Eigenwert λ0 ist, so folgt für jede messbare Funktion f : R → C 2 | f (λ)| dE x (λ) = | f (λ)|2 dE x (λ) = | f (λ0 )|2 E x ({λ0 }) = | f (λ0 )|2 x2 . R
{λ0 }
Also ist x ∈ D( f (T )), und wegen x = E({λ0 })x = 1{λ0 } (T )x erhält man mit dem Funktionalkalkül f (T )x = f (T )1{λ0 } (T )x = ( f · 1{λ0 } )(T )x = ( f · 1{λ0 } )(λ) dE(λ)x R f (λ) dE(λ)x = f (λ0 )E({λ0 })x = f (λ0 )x. = {λ0 }
Korollar 6.27. Sei H ein separabler Hilbertraum, und sei T : H ⊇ D(T ) → H
ein selbstadjungierter Operator. Dann ist σ p (T ) abzählbar, d. h. T besitzt abzählbar viele verschiedene Eigenwerte.
Beweis. Angenommen, σ p (T ) = {λi | i ∈ I } ist überabzählbar. Da im(E({λi })) = ker(T − λi ) = {0} nach Satz 6.25 und Korollar 6.26 gilt, können wir xi ∈ ker(T − λi ) mit xi = 1 wählen. Nach Lemma 6.9 c) gilt im(E({λi })) ⊥ im(E({λ j })) für i = j. Daher ist {xi | i ∈ I } ein überabzählbares Orthonormalsystem im Widerspruch zur Separabilität von H .
6.2
Spektralsatz und Funktionalkalkül
169
Nach Korollar 6.26 sind Eigenvektoren von T zum Eigenwert λ zugleich auch Eigenvektoren von f (T ) zum Eigenwert f (λ). Der folgende Satz zeigt, dass sich – zumindest wenn f ein Polynom ist – das gesamte Spektrum von f (T ) in dieser Form berechnen lässt. Für beliebige messbare Funktionen f gilt diese Aussage im Allgemeinen nicht (siehe [18, Sect. IV.3]). Lemma 6.28 (Spektralabbildungssatz). Seien T : H ⊇ D(T ) → H ein selbstadjun-
gierter Operator und f ein komplexes Polynom, d. h. es gelte f (λ) = ak ∈ C. Dann folgt
n
k k=0 ak λ
mit
σ ( f (T )) = f (σ (T )) := { f (μ) | μ ∈ σ (T )}. Die analoge Aussage gilt, falls man σ durch σ p ersetzt.
Beweis. O. E. sei f normiert, d. h. es gelte an = 1. Der Operator f (T ) ist normal nach Satz 6.20 und damit abgeschlossen nach Bemerkung 5.35 c), und es gilt D( f (T )) = D(T n ). Somit gilt σ ( f (T )) = {λ ∈ C | f (T ) − λ nicht bijektiv}. % Sei λ ∈ C. Wir faktorisieren das Polynom f (·)−λ in der Form f (z)−λ = nj=1 (z −μ j ) mit μ j ∈ C. Dann gilt f (μ j ) = λ ( j = 1, . . . , n) und f (T ) − λ = (T − μ1 ) · . . . · (T − μn ).
(6.8)
Falls λ ∈ ρ( f (T )), ist f (T ) − λ : D(T n ) → H bijektiv, und nach (6.8) ist T − μ1 surjektiv und T − μn injektiv. Da alle Faktoren vertauschen, sind alle T − μ j bijektiv, d. h. μ j ∈ ρ(T ) ( j = 1, . . . , n). Falls andererseits μ j ∈ ρ(T ) für alle j = 1, . . . , n gilt, so ist T − μ j : D(T ) → H bijektiv, und somit ist auch der Operator T − μ j : D(T j ) → D(T j−1 ) bijektiv für alle j = 1, . . . , n (denn dieser Operator ist injektiv als Einschränkung eines injektiven Operators und surjektiv, da zu y ∈ D(T j−1 ) das Element x := (T − μ j )−1 y in D(T j ) liegt und (T − μ j )x = y erfüllt). Nach (6.8) ist auch f (T ) − λ bijektiv, d. h. es gilt λ ∈ ρ( f (T )). Insgesamt folgt, dass λ ∈ σ ( f (T )) genau dann gilt, wenn ein j ∈ {1, . . . , n} existiert mit μ j ∈ σ (T ), d. h. wenn λ ∈ { f (μ) | μ ∈ σ (T )} gilt. Falls μ j ∈ σ p (T ) für ein j ∈ {1, . . . , n} gilt, folgt λ = f (μ j ) ∈ σ p ( f (T )) nach Korollar 6.26. Falls andererseits alle T − μ j injektiv sind, ist die Komposition f (T ) − λ ebenfalls injektiv. Also gilt auch σ p ( f (T )) = f (σ p (T )). Eine einfache Formulierung des Spektralsatzes ist möglich, falls der Operator ein rein diskretes Spektrum besitzt. Wir geben zunächst die Definition an. Definition 6.29. Ein selbstadjungierter Operator T : H ⊇ D(T ) → H besitzt ein rein diskretes Spektrum, falls σ (T ) = σ p (T ) gilt, die Menge σ p (T ) aller Eigenwerte von T
170
6 Der Spektralsatz für selbstadjungierte Operatoren
keinen (endlichen) Häufungspunkt besitzt und jeder Eigenwert endliche Vielfachheit besitzt, d. h. es gilt dim(ker(T − λ)) < ∞ für alle λ ∈ σ p (T ). Bemerkung 6.30. a) Falls T : H ⊇ D(T ) → H ein selbstadjungierter Operator mit rein diskretem Spektrum ist, so existiert eine Orthonormalbasis {en | n ∈ N} von H aus Eigenfunktionen von T . Falls T en = λn en gilt, so folgt x=
∞
x, en en (x ∈ H ), n=1
Tx =
∞
(6.9) λn x, en en (x ∈ D(T )).
n=1
Dies folgt aus dem Spektralsatz, da das Integral in diesem Fall gegeben ist durch Tx = λ dE(λ)x = λ dE(λ)x = λE({λ})x. σ (T )
σ p (T )
λ∈σ p (T )
Nach Satz 6.25 b) ist E({λ}) die orthogonale Projektion auf ker(T − λ). Wählt man eine Orthonormalbasis {e(1) , . . . , e(N ) } von ker(T − λ), so lässt sich die orthogonale Projektion auf ker(T − λ) schreiben als E({λ})x =
N
x, e( j) e( j) .
j=1
Insgesamt erhält man eine abzählbare Menge {en | n ∈ N} von Eigenfunktionen zu (nicht notwendig verschiedenen) Eigenwerten λn , und die Gleichheiten (6.9) folgen aus x = E(σ (T ))x = σ (T ) 1 dE(λ)x für x ∈ H bzw. T x = σ (T ) λ dE(λ)x für x ∈ D(T ). Allgemein erhält man für jede Funktion f : σ (T ) → C die Gleichheit f (T )x =
∞
f (λn ) x, en en (x ∈ D( f (T ))).
n=1
Man beachte hier, dass jede Funktion f : σ (T ) → C messbar ist, da σ (T ) = σ p (T ) eine abzählbare Menge ohne Häufungspunkt ist. Die Integrale aus dem Spektralsatz werden also in diesem Fall zu unendlichen Reihen. b) Sei nun T : H ⊇ D(T ) → H ein selbstadjungierter Operator, und sei {en | n ∈ N} eine Orthonormalbasis, bestehend aus Eigenvektoren von T . Weiter seien λn die zugehörigen (nicht notwendig verschiedenen) Eigenwerte, d. h. T en = λn en . Aufgrund der Eigenschaften einer Orthonormalbasis (Satz 2.45) gilt
6.2
Spektralsatz und Funktionalkalkül
171
∞ E({λn | n ∈ N})x =
x, en en = x (x ∈ H ), n=1
und wegen x = E(R)x = E({λn | n ∈ N})x + E(U )x folgt E(U ) = 0 für die Menge U := R \ {λn | n ∈ N}. Falls die Eigenwerte λn keinen Häufungspunkt besitzen, ist U offen, und zu jedem λ ∈ U existiert ein ε > 0 mit (λ − ε, λ + ε) ⊆ U . Nach Satz 6.25 a) folgt λ ∈ ρ(T ). Wir erhalten σ (T ) = σ p (T ) = {λn | n ∈ N}. Insbesondere besitzt T ein rein diskretes Spektrum, falls zusätzlich alle Eigenwerte endliche Vielfachheit haben. Bemerkung 6.31. Der Spektralsatz wird häufig auch mit Hilfe von Spektralscharen formuliert. Dabei heißt eine Familie {Fλ }λ∈R ⊆ L(H ) eine Spektralschar, falls gilt: (i) (ii) (iii) (iv) (v)
Fλ ist eine orthogonale Projektion für alle λ ∈ R. Fμ Fλ = Fλ Fμ = Fμ für alle μ ≤ λ. Fμ x → Fλ x (μ λ) für alle x ∈ H (Rechtsstetigkeit). Fλ x → 0 (λ → −∞) für alle x ∈ H . Fλ x → x (λ → +∞) für alle x ∈ H .
Seien T : H ⊇ D(T ) → H selbstadjungiert und E das zugehörige Spektralmaß. Dann wird durch Fλ := E((−∞, λ]) (λ ∈ R) eine Spektralschar definiert. Definiert man das Integral über Spektralscharen geeignet (etwa im Sinne eines verallgemeinerten Riemann–Stieltjes-Integrals), so gilt ∞ T = λ dE(λ) = λ dFλ . R
−∞
Spektralscharen kann man in gewisser Weise als projektorwertiges Analogon der Verteilungsfunktion einer Zufallsvariablen in der Wahrscheinlichkeitstheorie verstehen. In Satz 6.20 wurde der Spektralsatz mit Hilfe von Spektralmaßen formuliert. Ein Grund dafür ist auch die direkte Interpretation der Spektralmaße im Rahmen der Quantenmechanik. Eine alternative Formulierung des Spektralsatzes verwendet Multiplikationsoperatoren. Genauer besagt der Spektralsatz in Multiplikationsoperator-Form, dass alle selbstadjungierten Operatoren unitär äquivalent zu gewissen Multiplikationsoperatoren sind. Dabei ist im Maßraum (X , A , μ) der zur messbaren Funktionen m : X → R gehörige Multiplikationsoperator Mm : L 2 (μ) ⊇ D(Mm ) → L 2 (μ) gegeben durch D(Mm ) := {u ∈ L 2 (μ) | mu ∈ L 2 (μ)},
Mm u := mu (u ∈ D(Mm ))
(siehe Definition 5.48). Nach Satz 5.49 sind alle derartigen Operatoren Mm selbstadjungiert. Wir formulieren den Satz wieder in der allgemeineren Version für normale Operatoren.
172
6 Der Spektralsatz für selbstadjungierte Operatoren
Satz 6.32 (Spektralsatz in Multiplikationsoperator-Form). Sei T : H ⊇ D(T ) → H
ein normaler Operator. Dann existieren ein Maßraum (X , A , μ), eine messbare Funktion m : X → C und eine unitäre Abbildung U : H → L 2 (μ) mit folgenden Eigenschaften: (i) Es gilt x ∈ D(T ) genau dann, wenn u := U x ∈ D(Mm ) gilt, wobei Mm der Multiplikationsoperator mit m im Raum L 2 (μ) sei. (ii) Es gilt U T U −1 u = mu (u ∈ D(M f ◦m )). Somit ist T unitär äquivalent zum Multiplikationsoperator Mm , d. h. es gilt U T U −1 = Mm . Falls H separabel ist, lässt sich das Maß μ σ -endlich wählen. Falls T selbstadjungiert ist, ist die Funktion m reellwertig. Für alle messbaren Funktionen f : C → C gilt D(M f ◦m ) = U (D( f (T ))) und U f (T )U −1 u = M f ◦m u = ( f ◦ m) · u (u ∈ D(M f ◦m )), wobei f (T ) in Satz 6.20 definiert ist. Man beachte, dass auch in dieser Formulierung des Spektralsatzes ein Messraum (X , A ) auftaucht, der aber keine Verbindung zu dem Messraum besitzt, auf welchem das Spektralmaß definiert ist. Auf den Beweis dieses Satzes wird hier verzichtet (siehe etwa [70, Satz VII.3.1]). Man verwendet üblicherweise sogenannte zyklische Vektoren und beweist den Satz zunächst für beschränkte Operatoren. Wie der obige Satz zeigt, liefert auch die Multiplikationsoperator-Form des Spektralsatzes den Funktionalkalkül für den Operator T . In der Situation von Satz 6.32 lässt sich das zu T gehörige Spektralmaß über E(A) = 1 A (T ) = U −1 M1 A ◦m U = U −1 M1m −1 (A) U (A ∈ B (C)) gewinnen. Dabei wurde wieder (wie im Beweis von Lemma 6.24) die elementare Identität 1 A ◦ m = 1m −1 (A) verwendet. Für die zugehörige Spektralschar (Fλ )λ∈R (siehe Bemerkung 6.31) erhält man damit Fλ = U −1 M1m −1 ((−∞,λ]) U (λ ∈ R).
6.3
Der Spektralsatz für kommutierende Operatoren
Bisher wurde der Spektralsatz für einen einzelnen Operator formuliert, was in der Quantenmechanik einer einzelnen Observablen entspricht. In diesem Abschnitt betrachten wir mehrere Operatoren gleichzeitig. Es stellt sich heraus, dass die entscheidende Bedingung das Kommutieren der Operatoren ist. Dabei ist das Vertauschen zweier Operatoren S und
6.3
Der Spektralsatz für kommutierende Operatoren
173
T üblicherweise nicht durch die Bedingung ST = T S definiert, da die hierbei implizite Bedingung der Gleichheit der Definitionsbereiche schwer kontrollierbar ist. Im Folgenden sei H ein separabler C-Hilbertraum. Definition 6.33. a) Zwei beschränkte Operatoren S, T ∈ L(H ) kommutieren, falls [S, T ] := ST −T S = 0 gilt. Dabei heißt [S, T ] der Kommutator von S und T . b) Seien S : H ⊇ D(S) → H und T : H ⊇ D(T ) → H zwei selbstadjungierte Operatoren mit den zugehörigen Spektralmaßen E S : B (σ (S)) → L(H ) und E T : B (σ (T )) → L(H ). Dann kommutieren S und T , falls für alle A ∈ B (σ (S)) und B ∈ B (σ (T )) gilt: [E S (A), E T (B)] = 0. Zwei kommutierende Operatoren S und T heißen auch kompatibel, gleichzeitig beobachtbar oder gleichzeitig messbar. Eine Menge von selbstadjungierten Operatoren heißt kompatibel, falls je zwei Operatoren aus dieser Menge kompatibel sind. Die obige Definition ist zu mehreren Bedingungen äquivalent. Um dies zu zeigen, beweisen wir zunächst eine Darstellung des Spektralmaßes, welche von unabhängigem Interesse ist. Dabei wird das Spektralmaß wieder auf B (R) fortgesetzt (siehe Bemerkung 6.21). Satz 6.34 (Formel von Stone). Sei T : H ⊇ D(T ) → H ein selbstadjungierter
Operator mit Spektralmaß E : B (R) → L(H ). Dann gilt für alle x, y ∈ H und alle a, b ∈ R mit a < b: b & ' 1 (T − λ − iε)−1 − (T − λ + iε)−1 x, y dλ lim ε0 2πi a ' & = E((a, b)) + 21 E({a}) + 21 E({b}) x, y .
Beweis. Für ε > 0 definiere 1 f ε (t) := 2πi
a
b
1 1 − t − λ − iε t − λ + iε
dλ (t ∈ R).
Dann ist supε>0 f ε L ∞ (R) < ∞, und für ε 0 erhält man die punktweise Konvergenz f ε (t) → f (t) := 1(a,b) (t) + 21 1{a} (t) + 21 1{b} (t) ⎧ ⎪ / [a, b], ⎪ ⎨0, falls t ∈ 1 = 2 , falls t = a oder t = b, ⎪ ⎪ ⎩1, falls t ∈ (a, b).
174
6 Der Spektralsatz für selbstadjungierte Operatoren
Dies sieht man durch folgende elementare Rechnung: Es gilt b−t 1 1 b−t 1 ε 1 − dλ = dλ 2 2πi a−t −λ − iε −λ + iε π a−t λ + ε2 1 1 λ b−t b−t a−t arctan − arctan = = arctan π ε λ=a−t π ε ε
f ε (t) =
und arctan
b−t ε
⎧ ⎪ ⎪ ⎨0, → π2 , ⎪ ⎪ ⎩− π ,
falls t = b, falls t < b, falls t > b
2
Sei gλ,ε (t) :=
1 t−λ−iε
−
1 t−λ+iε .
(ε 0).
Dann gilt nach dem Spektralsatz bzw. Funktionalkalkül
gλ,ε (T ) = (T − λ − iε)−1 − (T − λ + iε)−1 ∈ L(H ). Approximiert man das Integral durch Stufenfunktionen, so sieht man, dass 1
f ε (T )x, y = 2πi
a
b
gλ,ε (T )x, y dλ
für alle x, y ∈ H gilt. Mit dem Funktionalkalkül (Korollar 6.23 d)) erhält man daher für ε0 1 2πi
b
& ' (T − λ − iε)−1 − (T − λ + iε)−1 x, y dλ
a
1 = 2πi
b
gλ,ε (T )x, y dλ = f ε (T )x, y ' & → f (T )x, y = 1(a,b) (T ) + 21 1{a} (T ) + 21 1{b} (T ) x, y & ' = E((a, b)) + 21 E({a}) + 21 E({b}) x, y . a
Lemma 6.35. Seien T : H ⊇ D(T ) → H ein abgeschlossener Operator und V ∈
L(H ) mit [V , (T −λ0 )−1 ] = 0 für ein λ0 ∈ ρ(T ). Dann gilt schon [V , (T −λ)−1 ] = 0 für alle λ ∈ ρ(T ).
Beweis. Sei (T −λ0 )−1 V x = V (T −λ0 )−1 x (x ∈ H ). Dann folgt mit y := (T −λ0 )−1 x ∈ D(T ): V (T − λ0 )y = (T − λ0 )V y (y ∈ D(T ))
6.3
Der Spektralsatz für kommutierende Operatoren
175
und damit auch V (T − λ)y = (T − λ)V y (y ∈ D(T )) für beliebiges λ ∈ ρ(T ). Setzt man nun wieder x := (T − λ)y, so folgt V x = (T − λ)V (T − λ)−1 x und damit (T − λ)−1 V x = V (T − λ)−1 x für alle x ∈ im(T − λ) = H , d.h. [V , (T − λ)−1 ] = 0.
Satz 6.36 (Kriterien für Kompatibilität). Seien S : H ⊇ D(S) → H und T : H ⊇
D(T ) → H selbstadjungierte Operatoren. Dann sind äquivalent:
(i) (ii) (iii) (iv)
S und T kommutieren. Für alle λ0 ∈ ρ(S) und μ0 ∈ ρ(T ) gilt [(S − λ0 )−1 , (T − μ0 )−1 ] = 0. Es existiert ein λ0 ∈ ρ(S) und ein μ0 ∈ ρ(T ) mit [(S − λ0 )−1 , (T − μ0 )−1 ] = 0. Für alle s, t ∈ R gilt [eis S , eit T ] = 0.
Beweis. (i)⇒(ii), (iii), (iv). Seien E S : B (R) → L(H ) bzw. E T : B (R) → L(H ) die Spektralmaße von S bzw. T , jeweils fortgesetzt auf B (R), und seien f : σ (S) → C und g : σ (T ) → C beschränkte messbare Funktionen. Dann existieren nach Satz 3.30 b) Folgen f n : σ (S) → C und gk : σ (T ) → C von Stufenfunktionen mit f n → f (n → ∞) und gk → g (k → ∞) (gleichmäßige Konvergenz). Nach Definition des Integrals für Stufenfunktionen (Definition 6.11) folgt aus (i) gk dE T = gk dE T f n dE S = gk (T ) f n (S) f n dE S f n (S)gk (T ) = für alle n, k ∈ N. Wir nehmen n → ∞ und erhalten mit Korollar 6.23 d) f (S)gk (T )x = gk (T ) f (S)x für alle k ∈ N und x ∈ H . Nun folgt für k → ∞ wieder mit Korollar 6.23 d) die Gleichheit f (S)g(T )x = g(T ) f (S)x (x ∈ H ) und damit [ f (S), g(T )] = 0. Wir wenden dies an auf die Funktionen f (λ) := (λ − λ0 )−1 und g(μ) := (μ − μ0 )−1 und erhalten (ii) und (iii). Die Wahl f (λ) := eisλ und g(μ) := eitμ liefert (iv). (iii)⇒(ii). Wir wählen in Lemma 6.35 zunächst V := (T − μ0 )−1 und erhalten [(S − λ)−1 , (T − μ0 )−1 ] = 0 für alle λ ∈ ρ(S). Eine weitere Anwendung von Lemma 6.35 mit V := (S − λ)−1 liefert [(S − λ)−1 , (T − μ)−1 ] = 0 für alle λ ∈ ρ(S) und μ ∈ ρ(T ). (ii)⇒(i). Seien zunächst a, b ∈ R \ σ p (S) mit a < b. Wir definieren f ε wie im Beweis von Satz 6.34 und erhalten für alle x, y ∈ H und μ ∈ ρ(T ) unter Verwendung von (ii)
f ε (S)(T − μ)−1 x, y b & ' 1 = (S − λ − iε)−1 − (S − λ + iε)−1 (T − μ)−1 x, y dλ 2πi a
176
6 Der Spektralsatz für selbstadjungierte Operatoren
=
1 2πi
b
& ' (T − μ)−1 (S − λ − iε)−1 − (S − λ + iε)−1 x, y dλ
a
= (T − μ)−1 f ε (S)x, y. Wegen a, b ∈ / σ p (S) gilt E S ({a}) = E S ({b}) = 0, und für ε 0 erhält man mit der Formel von Stone (Satz 6.34) [E S ((a, b]), (T − μ)−1 ] = 0 (μ ∈ ρ(T )).
(6.10)
Falls a ∈ σ p (S), so wählen wir eine Folge (an )n∈N ⊂ R \ σ p (S) mit an a (n → ∞). Dies ist möglich, da σ p (S) nach Korollar 6.27 abzählbar ist. Aufgrund der σ -Additivität von E S erhalten wir [E S ((a, b]), (T − μ)−1 ]x = lim [E S ((an , b]), (T − μ)−1 ]x = 0 n→∞
für alle x ∈ H . Analog argumentiert man im Fall b ∈ σ p (S), so dass (6.10) für alle a, b ∈ R mit a < b gilt. Also sind die Abbildungen
B (R) → C,
A → E S (A)(T − μ)−1 x, y,
B (R) → C,
A → (T − μ)−1 E S (A)x, y
zwei komplexwertige Maße (siehe Bemerkung 3.19) auf B (R), welche auf allen Intervallen der Form (a, b] übereinstimmen. Mit Hilfe eines Eindeutigkeitssatzes (siehe z. B. [4], Satz 5.4) kann man zeigen, dass diese Maße dann bereits auf der erzeugten σ -Algebra B (R) übereinstimmen. Wir erhalten also [E S (A), (T − μ)−1 ] = 0 (A ∈ B (R), μ ∈ ρ(T )). Mit denselben Argumenten und der Anwendung der Formel von Stone auf den Operator T folgt daraus [E S (A), E T (B)] = 0 (A, B ∈ B (R)). (iv)⇒(i). Für f ∈ S (R) und ϕ, ψ ∈ H gilt mit dem Satz von Fubini (Satz 3.43) f (s) e−is S ϕ, ψ ds = f (s)e−isλ d E(λ)ϕ, ψ ds R R R −isλ = f (s)e ds d E(λ)ϕ, ψ R R √ √ fˆ(λ) d E(λ)ϕ, ψ = 2π fˆ(S)ϕ, ψ, = 2π R
wobei fˆ(λ) := (F f )(λ) die Fourier-Transformierte (Definition 4.29) bezeichne. Damit gilt für f , g ∈ S (R) (wieder mit Fubini)
6.3
Der Spektralsatz für kommutierende Operatoren
177
1 ˆ
f (S)g(T ˆ )ϕ, ψ = √ f (s) e−is S g(T ˆ )ϕ, ψ ds 2π R 1 f (s) g(T ˆ )ϕ, eis S ψ ds =√ 2π R 1 = f (s) g(t) e−it T ϕ, eis S ψ dt ds 2π R R 1 f (s)g(t) ϕ, eit T eis S ψ dt ds = 2π R R 1 = f (s)g(t) ϕ, eis S eit T ψ dt ds = g(T ˆ ) fˆ(S)ϕ, ψ. 2π R R Also folgt [ fˆ(S), g(T ˆ )] = 0 für alle f , g ∈ S (R). Da die Fourier-Transformation F : S (R) → S (R) nach Satz 4.36 bijektiv ist, kann man jede Funktion f ∈ S (R) in der Form f = fˆ1 mit f 1 ∈ S (R) schreiben, analog kann man g = gˆ 1 schreiben. Wendet man die obige Aussage auf f 1 , g1 an, erhält man [ f (S), g(T )] = 0 für alle f , g ∈ S (R). Zu jedem Intervall (a, b) ⊆ R existiert eine Folge ( f n )n∈N ⊆ S (R) mit f n → 1(a,b) punktweise und supn∈N f n ∞ < ∞. Analog wähle (gn )n∈N ⊆ S (R) mit gn → 1(c,d) . Damit gilt [E((a, b)), F((c, d))]ψ = lim [ f n (S), gn (T )]ψ = 0 (ψ ∈ H ). n→∞
Da die Intervalle die Borel-σ -Algebra erzeugen, folgt [E(A), F(B)] = 0 für alle A, B ∈ B (R), d.h. S und T sind kompatibel. Im Folgenden betrachten wir Familien kompatibler Operatoren, wobei wir uns auf endliche Familien {T1 , . . . , TN } beschränken. Nach Definition 6.33 heißt eine solche Familie kompatibel, falls je zwei Operatoren Ti und T j kompatibel sind. Auch für solche Familien gibt es einen Spektralsatz und ein zugehöriges Spektralmaß. Die folgenden Aussagen gelten analog auch für unendliche Familien. Definition und Satz 6.37 (Spektralsatz für mehrere Operatoren). Sei T = {T1 , . . . , TN }
eine Familie kompatibler selbstadjungierter Operatoren T j : H ⊇ D(T j ) → H , und seien E j : B (R) → L(H ) ( j = 1, . . . , N ) die zugehörigen Spektralmaße. a) Es existiert genau ein Spektralmaß E : B (R N ) → L(H ) mit der Eigenschaft E(A1 × . . . × A N ) = E 1 (A1 ) . . . E N (A N ) ∈ L(H )
(6.11)
für A = A1 × . . . A N mit A j ∈ B (R). Dieses Maß heißt das Produktmaß der Spektralmaße E 1 , . . . , E N , man schreibt E 1 ⊗ . . . ⊗ E N := E.
178
6 Der Spektralsatz für selbstadjungierte Operatoren
b) Es gilt
Tj =
RN
λ j dE(λ1 , . . . , λ N ) ( j = 1, . . . , N ).
Der Beweis dieses Satzes wird hier nicht ausgeführt (siehe dazu [56, Theorem 5.23]), es ist aber leicht zu zeigen, dass durch (6.11) bereits ein Spektralmaß auf B (R N ) eindeutig fest% gelegt wird. Man beachte, dass die Reihenfolge im Produkt Nj=1 E j (A j ) beliebig gewählt werden kann, da die Operatoren kompatibel sind. Eine der wichtigen Folgerungen aus dem Spektralsatz für einzelne Operatoren war die Existenz eines Funktionalkalküls (Satz 6.23), der es erlaubt, Funktionen von normalen Operatoren zu definieren. Auch hier existiert wieder ein Funktionalkalkül, wobei jetzt Funktionen von mehreren Variablen betrachtet werden. Dies geschieht in folgender Definition: Definition 6.38. Sei T = {T1 , . . . , TN } eine Familie kompatibler selbstadjungierter Operatoren T j : H ⊇ D(T j ) → H , sei E : B (R N ) → L(H ) das zur Familie T gehörige Spektralmaß nach Satz 6.37. Zu x ∈ H definiert man das skalare Maß E x : B (R N ) → [0, ∞) durch E x (A) := E(A)x2 (A ∈ B (R N )). Sei f : R N → C messbar. Dann definiert man den Operator f (T1 , . . . , TN ) durch | f (λ1 , . . . , λ N )|2 dE x (λ1 , . . . , λ N ) < ∞ D( f (T1 , . . . , TN )) := x ∈ H RN
und f (T1 , . . . , TN )x :=
RN
f (λ1 , . . . , λ N ) dE(λ1 , . . . , λ N ) x
für x ∈ D( f (T1 , . . . , TN )). Wie im Fall eines einzelnen Operators sieht man, dass f (T1 , . . . , TN ) ein normaler Operator ist. Aus dem Funktionalkalkül erhält man das zur Familie gehörige Spektralmaß durch E(A) = 1 A (T1 , . . . , TN ) (A ∈ B (R N )), und insbesondere sind die Spektralmaße der einzelnen Operatoren gegeben durch E j (A j ) = E(R × . . . × A j × . . . × R) = 1R×...×A j ×...×R (T1 , . . . , TN ).
(6.12)
Das Produktmaß erlaubt eine einfache Darstellung der Operatoren T1 , . . . , TN als Funktionen eines einzelnen Operators T , wie der folgende Satz zeigt.
6.3
Der Spektralsatz für kommutierende Operatoren
179
Satz 6.39. Sei T = {T1 , . . . , TN } eine Familie kompatibler selbstadjungierter Operatoren T j : H ⊇ D(T j ) → H . Dann existieren ein beschränkter selbstadjungierter Operator T ∈ L(H ) und messbare Funktionen f j : σ (T ) → R mit T j = f j (T ) ( j = 1, . . . , N ).
Beweis. (i) Seien zunächst alle T j beschränkt, d. h. T j = T j∗ ∈ L(H ). Für M := max j=1,...,N T j L(H ) gilt σ (T j ) ⊆ [−M, M]. Wir verwenden nun, dass es eine messbare bijektive Abbildung h : [−M, M] N → [0, 1] gibt, für welche auch die Umkehrabbildung h −1 messbar ist. Dies folgt aus dem Satz von Kuratowski, einem abstrakten Ergebnis über messbare Bijektionen, siehe z. B. [57, Theorem 3.3.13]. Definiert man T := h(T1 , . . . , TN ) (siehe Definition 6.38), so ist T selbstadjungiert und beschränkt mit T L(H ) ≤ h∞ = 1 und σ (T ) ⊆ [0, 1]. Für f j := π j ◦ h −1 , wobei π j : (λ1 , . . . , λ N ) → λ j die Projektion auf die j-te Komponente sei, folgt f j (T ) = f j (h(T1 , . . . , TN )) = (π j ◦ h −1 ◦ h)(T1 , . . . , TN ) = π j (T1 , . . . , TN ) = T j . (ii) Seien nun T j ∈ L(H ) normale Operatoren, d. h. es gelte T j T j∗ = T j∗ T j (siehe Bemer(2) 1 ∗ kung 5.35 d)). Dann definiert man S (1) j := 2 (T j + T j ) und S j :=
1 2i (T j
− T j∗ ) für
(2) j = 1, . . . , N . Man sieht sofort, dass die Operatoren S (1) j , S j selbstadjungiert sind (1)
(2)
(1)
(2)
und die Familie {S1 , S1 , . . . , S N , S N } kompatibel ist. Nach Teil (i) des Beweises existieren ein selbstadjungierter Operator T ∈ L(H ) und messbare Funktionen (k) f j(k) : σ (T ) → R mit S (k) = f j (T ) für j = 1, . . . , N und k = 1, 2. Setzt man j f j := f j(1) + i f j(2) , so erhält man
(2) f j (T ) = f j(1) (T ) + i f j(2) (T ) = S (1) j + i S j = T j ( j = 1, . . . , N ).
(iii) Seien nun T1 , . . . , TN wie im Satz angegeben. Wir wählen λ0 ∈ C \ R und betrachten die Resolventen R j := (T j − λ0 )−1 ( j = 1, . . . , N ). Dann ist R j ∈ L(H ) ein normaler Operator, und die Familie {R1 , . . . , R N } ist kompatibel nach Satz 6.36. Wir können also (ii) anwenden und erhalten einen selbstadjungierten Operator T ∈ L(H ) sowie messbare Funktionen f˜j : σ (T ) → C mit R j = f˜j (T ) ( j = 1, . . . , N ). Für 1 g : R → C, λ → λ−λ gilt R j = (T j − λ0 )−1 = g(T j ). Also folgt für f : C \ {0} → 0 C, z → 1z + λ0 f (R j ) = f (g(T j )) = ( f ◦ g)(T j ) = idR (T j ) = T j .
180
6 Der Spektralsatz für selbstadjungierte Operatoren
Wir setzen nun f j := f ◦ f˜j für j = 1, . . . , N und erhalten f j (T ) = f ( f˜j (T )) = f (R j ) = T j ( j = 1, . . . , N ), was zu zeigen war.
Der Spektralsatz in Multiplikationsoperator-Form (Satz 6.32) verallgemeinert sich direkt auf kompatible Operatorfamilien. Dabei kann der Maßraum für alle Operatoren identisch gewählt werden, wie der folgende Satz zeigt. Satz 6.40. Sei T = {T1 , . . . , TN } eine Familie kompatibler selbstadjungierter Opera-
toren T j : H ⊇ D(T j ) → H . Dann existieren ein Maßraum (X , A , μ), messbare Funktionen m j : X → R, j = 1, . . . , N , und eine unitäre Abbildung U : H → L 2 (μ) mit U T j U −1 u = m j u (u ∈ D(Mm j )).
Beweis. Nach Satz 6.39 existieren ein Operator T = T ∗ ∈ L(H ) und messbare Funktionen f j : σ (T ) → R mit T j = f j (T ) für j = 1, . . . , N . Nach dem Spektralsatz in Multiplikationsoperator-Form für einen Operator (Satz 6.32) existiert ein Maßraum (X , A , μ), eine messbare Funktion m : X → R und eine unitäre Abbildung U : H → L 2 (μ) mit U T U −1 = Mm . Wir setzen nun m j := f j ◦ m ( j = 1, . . . , N ) und erhalten U T j U −1 = U f j (T )U −1 = M f j ◦m = Mm j nach Satz 6.32. Kompatible Familien von Operatoren mit rein diskretem Spektrum (siehe Definition 6.29) haben eine besonders schöne Eigenschaft, wie das folgende Resultat zeigt. Satz 6.41. Sei T = {T1 , . . . , TN } eine Familie selbstadjungierter Operatoren T j :
H ⊇ D(T j ) → H , wobei alle Operatoren T j rein diskretes Spektrum besitzen. Dann ist die Familie T genau dann kompatibel, wenn es eine Orthonormalbasis {en | n ∈ N} von H gibt, die aus gemeinsamen Eigenvektoren besteht (d. h. es gilt j j T j en = λn en für alle j = 1, . . . , N und n ∈ N mit λn ∈ R).
Beweis. (i) Sei zunächst die Familie T kompatibel. Da T j ein rein diskretes Spektrum besitzt, j j gilt σ (T j ) = σ p (T j ) = {λ1 , λ2 , . . . } für j = 1, . . . , N . Sei E j : B (R) → L(H ) das Spektralmaß zu T j , und sei E : B (R N ) → L(H ) das zugehörige Produktmaß nach j Satz 6.37. Für j ∈ {1, . . . , N } und n ∈ N ist E j ({λn }) die Orthogonalprojektion auf j N ker(T j − λn ). Zu := ( 1 , . . . , N ) ∈ N definieren wir λ := (λ1 1 , . . . , λ NN ) ∈ R N .
6.3
Der Spektralsatz für kommutierende Operatoren
181
Es folgt E({λ }) = E ({λ1 1 } × R × . . . × R) ∩ (R × {λ2 2 } × R × . . . × R) ∩ . . . ∩ . . . ∩ (R × . . . × R × {λ NN }) = E 1 ({λ1 1 }) . . . E N ({λ NN }), wobei (6.12) und Lemma 6.9 c) verwendet wurden. Nach Lemma 6.4 a) ist E 1 ({λ1 1 }) . . . E N ({λ NN }) die orthogonale Projektion auf den Unterraum im(E({λ })) = ker(T1 − λ1 1 ) ∩ . . . ∩ ker(TN − λ NN ). Nach Definition 6.29 ist r := dim(im(E({λ }))) ≤ dim(ker(T1 − λ1 1 )) < ∞, und alle Elemente in im(E({λ })) sind gemeinsame Eigenvektoren von T1 , . . . , TN . Es gilt
∈N N
E({λ }) = E
{λ }
∈N N
= E σ (T1 ) × . . . × σ (TN )
(6.13)
= E(σ (T1 )) . . . E(σ (TN )) = idH . Als abgeschlossener Unterraum von H ist im(E({λ })) wieder ein Hilbertraum. Für alle ∈ N N mit E({λ }) = 0 wählen wir eine Orthonormalbasis {e 1 , . . . , e r } von im(E({λ })). Da die Räume im(E({λ })) und im(E({λ })) für = nach Lemma 6.9 c) orthogonal zueinander sind, ist die Menge j
B := {e | ∈ N, j = 1, . . . , r } ein Orthonormalsystem in H . Dabei haben wir r := 0 gesetzt, falls E({λ }) = 0 gilt. Für jedes x ∈ H gilt nach (6.13) x= E({λ })x,
∈N N
und somit folgt aus x ⊥ B bereits x = 0. Nach Satz 2.45 ist B eine Orthonormalbasis von H , bestehend aus gemeinsamen Eigenvektoren von T1 , . . . , TN .
182
6 Der Spektralsatz für selbstadjungierte Operatoren j
(ii) Umgekehrt sei nun {en | n ∈ N} eine Orthonormalbasis von H mit T j en = λn en für alle j = 1, . . . , N und n ∈ N. Wir fixieren λ ∈ C \ R. Dann gilt nach Korollar 6.26 (T j − λ)−1 en = (λn − λ)−1 en =: μn en , j
j
d. h. auch die Resolventen R j := (T j − λ)−1 besitzen ein gemeinsames System von Eigenvektoren. Sei x ∈ H . Dann gilt x = n∈N cn en mit cn := x, en , n ∈ N, und Ri R j x =
cn R i R j en =
n∈N
n∈N
j
cn μin μn en =
cn R j R i en = R j R i x
n∈N
für alle i, j = 1, . . . , N . Also gilt [(Ti − λ)−1 , (T j − λ)−1 ] = 0, und nach Satz 6.36 ist {T1 , . . . , TN } eine kompatible Familie.
6.4
Unitäre Gruppen und der Satz von Stone
Im Folgenden sei wieder H ein separabler C-Hilbertraum. Wir wollen nun die zeitliche Entwicklung eines Systems betrachten. Genauer suchen wir die Lösung der abstrakten Differentialgleichung (auch abstraktes Cauchyproblem genannt) −i
d y(t) = T y(t) (t ∈ R), dt y(0) = x,
(6.14)
wobei T : H ⊇ D(T ) → H ein selbstadjungierter Operator ist und der Anfangswert x ∈ D(T ) gegeben ist. Wir suchen also eine Funktion y : R → H , t → y(t), welche differenzierbar ist und die Bedingung y(t) ∈ D(T ) für alle t ∈ R erfüllt, und für welche (6.14) gilt. Im skalaren Fall H = C, wobei dann T ∈ R eine skalare Zahl ist, erfüllt y(t) := U (t)x := eit T x diese Eigenschaften. Der Spektralsatz und der zugehörige Funktionalkalkül werden es uns erlauben, dies auch für den allgemeinen Fall zu definieren. Wir beginnen mit dem Begriff einer unitären Gruppe. Definition 6.42. Eine Abbildung U : R → L(H ) heißt eine stark stetige unitäre Gruppe, falls gilt: (i) U (t) ist unitär für alle t ∈ R, und es gilt U (t + t ) = U (t)U (t ) (t, t ∈ R) (Gruppeneigenschaft). (ii) Die Abbildung t → U (t)x, R → H , ist stetig für jedes x ∈ H , d. h. die Familie (U (t))t∈R ist stark stetig.
6.4
Unitäre Gruppen und der Satz von Stone
183
Satz 6.43. Sei T : H ⊇ D(T ) → H ein selbstadjungierter Operator. Definiere U (t) := eit T (t ∈ R) durch den Funktionalkalkül. Dann gilt:
a) (U (t))t∈R ist eine stark stetige unitäre Gruppe. b) Es gilt 1 D(T ) = x ∈ H U (0)x := lim (U (h)x − x) existiert in H , h→0 h
(6.15)
und für alle x ∈ D(T ) gilt U (0)x = i T x. c) Für alle x ∈ D(T ) und t ∈ R gilt 1 h→0 (U (t + h) − U (t))x −→ U (t)i T x = i T U (t)x. h Insbesondere ist U (t)x ∈ D(T ) für alle t ∈ R, und die Funktion y : R → H , t → U (t)x ist stetig differenzierbar und eine Lösung des Cauchyproblems (6.14).
Beweis. Sei E : B (σ (T )) → L(H ) das zu T gehörige Spektralmaß, und sei für x ∈ H das Maß E x : B(σ (T )) → [0, ∞) definiert durch E x (A) := E(A)x2 (siehe Satz 6.20). a) Nach dem Funktionalkalkül (Korollar 6.23) gilt U (t) = eit T ∈ L(H ) sowie U (t + s) = U (t)U (s) für alle s, t ∈ R. Wegen U (−t) = e−it T = (U (t))∗ und U (t)U (−t) = U (0) = idH ist U (t) unitär. Für alle x ∈ H gilt mit majorisierter Konvergenz (U (t) − idH )x2 = |eitλ − 1|2 dE x (λ) → 0 (t → 0). σ (T )
Damit folgt U (t + h)x − U (t)x ≤ U (t) · (U (h) − idH )x → 0 (h → 0), also ist t → U (t) stark stetig. b) Sei x ∈ D(T ). Dann ist 2 2 1 1 i hλ (U (h)x − x) − i T x = (e − 1) − iλ dE x (λ). h σ (T ) h
184
6 Der Spektralsatz für selbstadjungierte Operatoren
λ Es gilt | h1 (ei hλ − 1)| = |i 0 ei hs ds| ≤ |λ| für alle λ ∈ σ (T ) ⊆ R. Damit erhält man 2 1
i hλ e − 1 − iλ dE x (λ) ≤ 4λ2 dE x (λ) < ∞, σ (T ) h σ (T ) wobei die letzte Ungleichung nach Satz 6.20 aus x ∈ D(T ) folgt. Wegen h1 (ei hλ − 1) − iλ → 0 (h → 0) folgt mit majorisierter Konvergenz 2 2
1 i hλ 1 (U (h) − idH )x − i T x = h e − 1 − iλ dE x (λ) → 0 (h → 0). h σ (T ) Dies zeigt die Inklusion „⊆“ in (6.15) sowie U (0)x = i T x für alle x ∈ D(T ). Für die andere Inklusion definieren wir den Operator S durch U (h)x − x existiert , D(S) := x ∈ H U (0)x = lim h→0 h Sx := −iU (0)x (x ∈ D(S)). Dann ist S linear, und wegen D(S) ⊇ D(T ) ist D(S) dicht in H . Für x, y ∈ D(S) gilt ! " " ! U (h) − idH U (h) − idH x, y = lim −i x, y
Sx, y = −i lim h→0 h→0 h h ! " ! " U (−h) − idH U (h) − idH = x, i lim y = x, −i lim y = x, Sy. h→0 h→0 h h Also ist S symmetrisch, d. h. es gilt S ⊆ S ∗ . Andererseits ist S ⊇ T und damit S ∗ ⊆ T ∗ = T ⊆ S. Wir erhalten S = T , was die Gleichheit in (6.15) zeigt. c) Sei x ∈ D(A). Dann gilt 1 1 (U (t + h)x − U (t)x) = U (t) (U (h) − idH ) x → U (t)i T x (h → 0). h h Nach b) folgt U (t)x ∈ D(T ) sowie i T U (t)x = U (t)i T x. Insbesondere folgt für die Funktion y die Differenzierbarkeit sowie y (t) = i T y(t) und wegen y (t) = U (t)i T x auch die Stetigkeit der Ableitung. Wegen y(0) = U (0)x = x ist y eine Lösung von (6.14). Nach dem letzten Satz definiert eit T für jeden selbstadjungierten Operator eine stark stetige unitäre Gruppe. Der Satz von Stone besagt, dass sogar alle stark stetigen unitären Gruppen diese Form haben.
6.4
Unitäre Gruppen und der Satz von Stone
185
Satz 6.44 (von Stone). Sei U : R → L(H ) eine stark stetige unitäre Gruppe. Dann
existiert ein selbstadjungierter Operator T : H ⊇ D(T ) → H mit U (t) = eit T . Der Operator T heißt der infinitesimale Erzeuger von U . Es gilt 1 D(T ) = x ∈ H U (0)x = lim (U (t)x − x) ∈ H existiert t→0 t und
T x = −i U (0)x (x ∈ D(T )).
Beweis. (i) Seien f ∈ D (R) und x ∈ H . Dann ist für jedes y ∈ H die Funktion g y : R → C, t → f (t) U (t)x, y
(6.16)
stetig mit kompaktem Träger. Wegen g y (t) ≤ | f (t)| x y ist g y integrierbar bezüglich des Lebesgue-Maßes, und die Abbildung L x, f : H → C, y → g y (t) dt = f (t) U (t)x, y dt R
R
ist wohldefiniert. Die Abbildung L x, f ist konjugiert linear und wegen | f (t)| dt xy (y ∈ H ) |L x, f (y)| ≤ R
auch stetig. Nach dem Satz von Riesz (Satz 2.37) existiert genau ein vx, f ∈ H mit
vx, f , y = L x, f (y) (y ∈ H ). Sei D := span{vx, f | x ∈ H , f ∈ D (R)}. (ii) Es gilt D = H . Dazu wählen wir ϕ ∈ D (R) mit ϕ ≥ 0, supp ϕ ∈ [−1, 1] und ϕ(t) dt = 1. Für ε > 0 sei ϕε (t) := 1ε ϕ( εt ). Dann ist supp ϕε ⊆ [−ε, ε] und ϕε (t) dt = 1. Für alle x, y ∈ H gilt | vx,ϕε − x, y| ≤ ϕε (t) (U (t)x − x), y dt R ≤ sup U (t)x − x y ϕε (t) dt = sup U (t)x − x y |t|≤ε
und damit wieder nach dem Satz von Riesz
R
|t|≤ε
186
6 Der Spektralsatz für selbstadjungierte Operatoren
vx,ϕε − x = sup | vx,ϕε − x, y| ≤ sup U (t)x − x → 0 (ε → 0), y≤1
|t|≤ε
wobei die starke Stetigkeit von U verwendet wurde. Also ist D dicht in H . (iii) Definition des Operators S: Seien x ∈ H und f ∈ D (R). Wir zeigen zunächst, dass für alle s ∈ R und y ∈ H
U (s)vx, f , y = f (t) U (s)U (t)x, y dt (6.17) R
gilt. Da die Funktion g y (siehe (6.16)) stetig mit kompaktem Träger ist, kann sie gleichmäßig durch eine Folge von Stufenfunktionen (g (k) y )k∈N der Form g (k) y (t)
kN
=
1(t j−1 ,t j ] (t)g(t j ) (t ∈ R, k ∈ N)
j=−k N +1
approximiert werden. Dabei seien N > 0 so gewählt, dass supp g y ⊆ [−N , N ], k N (k) und t j := kj ( j = −k N , . . . , k N ). Wir definieren vx, f := j=−k N +1 (t j − t j−1 ) f (t j )U (t j )x und erhalten für alle y ∈ H , (k)
vx, f ,
-
kN
y =
(t j − t j−1 ) f (t j )U (t j )x, y
j=−k N +1 kN
=
(t j − t j−1 ) f (t j ) U (t j )x, y =
j=−k N +1
R
g (k) y (t) dt
(k) Mit majorisierter Konvergenz (Satz 3.39) sieht man R g y (t) dt → R g y (t) dt (k → (k) ∞) für alle y ∈ H , und damit erhalten wir vx, f → vx, f (k → ∞). Ebenfalls mit majorisierter Konvergenz folgt (k)
U (s)vx, f,
kN
y =
(t j − t j−1 ) f (t j ) U (s)U (t j )x, y
j=−k N +1
→
R
f (t) U (s)U (t)x, y dt (k → ∞).
(k)
Wegen U (s)vx, f → U (s)vx, f (k → ∞) impliziert dies (6.17). Aus (6.17) und U (s)U (t) = U (t + s) folgt
U (s)vx, f , y = f (t) U (t + s)x, y dt = f (t − s) U (t)x, y dt, R
R
6.4
Unitäre Gruppen und der Satz von Stone
187
wobei die Substitution t → t − s verwendet wurde. Somit ist
! " 1 f (t − s) − f (t) (t) U (t)x, y dt , y = U (s)v + f − v − v x, f x, f x,− f s s R f (t − s) − f (t) ≤ x y + f (t) dt. s R
Wieder mit dem Satz von Riesz folgt daraus 1 U (s)vx, f − vx, f − vx,− f ≤ x f (t − s) − f (t) + f (t) dt. s s R
(6.18)
Nach dem Mittelwertsatz gilt | 1s ( f (t − s) − f (t))| ≤ supτ ∈R | f (τ )|, und majorisierte Konvergenz zeigt, dass das Integral in (6.18) für s → 0 gegen 0 konvergiert. Wir erhalten lims→0 1s (U (s)vx, f − vx, f ) = vx,− f . Definiere nun den linearen Operator S durch D(S) := D und 1 1 U (s)vx, f − vx, f = vx,− f (vx, f ∈ D). s→0 is i
Svx, f := lim
(iv) Eigenschaften von S: Nach Konstruktion von S gilt D(S) = H , U (t)D(S) ⊆ D(S) (t ∈ R), S(D(S)) ⊆ D(S) und U (t)Sx = SU (t)x für t ∈ R, x ∈ D(S). S ist symmetrisch: Seien x, y ∈ D(S). Da U (s)∗ = U (−s), gilt ! ! " " 1 1
x, Sy = lim x, (U (s)y − y) = lim − (U (−s)x − x), y s→0 s→0 is is ! " 1 = lim (U (s)x − x), y = Sx, y. s→0 is S ist wesentlich selbstadjungiert: Sei y ∈ ker(S ∗ − i). Dann gilt für x ∈ D(S) d 1
U (t)x, y = lim U (t + s)x, y − U (t)x, y s→0 s dt ! " U (s) − idH = lim U (t)x, y = i SU (t)x, y s→0 s = iU (t)x, S ∗ y = iU (t)x, i y = U (t)x, y. Bei der vorletzten Gleichheit wurde verwendet, dass y ∈ ker(S ∗ − i). Damit erfüllt die Funktion f (t) := U (t)x, y die Differentialgleichung f = f , und es folgt f (t) = f (0)et . Wegen | f (t)| ≤ U (t)x · y = x · y ist f beschränkt und damit f = 0.
188
6 Der Spektralsatz für selbstadjungierte Operatoren
Also haben wir x, U (t)∗ y = U (t)x, y = 0 für alle x ∈ D(S). Da D(S) dicht ist und U (t) unitär ist, folgt y = U (t)∗ y = 0. Wir haben gezeigt, dass ker(S ∗ −i) = {0}. Genauso sieht man ker(S ∗ + i) = {0}, und nach Lemma 5.54 ist S wesentlich selbstadjungiert. (v) (Definition von T ) Sei T := S. Dann ist T nach (iv) selbstadjungiert. Setze V := eit T . Zu zeigen ist noch U (t) = V (t) (t ∈ R). Falls x ∈ D(S) ⊆ D(T ), so gilt V (t)x = i T V (t)x nach Satz 6.43 b) und U (t)x = i SU (t)x = i T U (t)x nach (iv). Für w(t) := U (t)x − V (t)x erhalten wir w (t) = i SU (t)x − i T V (t)x = i T w(t) und damit d w(t)2 = w (t), w(t) + w(t), w (t) = i [ T w(t), w(t) − w(t), T w(t)] = 0. dt Hierbei wurde verwendet, dass T = S nach Satz 5.37 a) wieder symmetrisch ist. Wegen w(0) = (U (0) − V (0))x = 0 folgt daraus w = 0, d.h. U (t)x = V (t)x für alle x ∈ D(S) und t ∈ R. Da D(S) dicht in H ist, folgt U (t) = V (t) für alle t ∈ R. Bemerkung 6.45. In Teil (i) des obigen Beweises wurde vx, f mit Hilfe der Integrale L x, f (y) und des Satzes von Riesz definiert. Man könnte auch direkt das H -wertige Integral vx, f := f (t)U (t)x dt R
betrachten. Es handelt sich dabei um ein Integral über die H -wertige Funktion t → f (t)U (t)x. Allgemeiner erlaubt es die Theorie der Bochner-Integrale, Integrale über banachraumwertige Funktionen zu definieren. Da wir hier auf eine ausführliche Diskussion des Bochner-Integrals verzichten wollen, wurde der Umweg über die skalarwertige Funktion t → f (t) U (t)x, y gewählt.
Was haben wir gelernt?
• Spektralmaße sind projektorwertige Maße, und das zugehörige Integral wird analog zur skalaren Integrationstheorie nach Lebesgue konstruiert. • Der Spektralsatz besagt, dass jeder normale und insbesondere jeder selbstadjungierte Operator als Integral bezüglich eines Spektralmaßes geschrieben werden kann.
6.4
Unitäre Gruppen und der Satz von Stone
189
• Mit dem Spektralsatz lässt sich ein Funktionalkalkül für selbstadjungierte Operatoren definieren, umgekehrt lässt sich das Spektralmaß E eines Operators T durch die Identität E(A) = 1 A (T ) rekonstruieren. In diesem Sinn sind Spektralsatz und Funktionalkalkül zwei Seiten einer Medaille. • Falls eine Familie von selbstadjungierten Operatoren kompatibel ist, d. h. in einem geeigneten Sinn kommutieren, so existiert ein gemeinsames Spektralmaß und eine entsprechende Version von Spektralsatz und Funktionalkalkül. Falls alle Operatoren rein diskretes Spektrum besitzen, so existiert eine Orthonormalbasis, welche aus gemeinsamen Eigenvektoren besteht. • Falls T selbstadjungiert ist, so wird durch t → eit T eine stark stetige unitäre Gruppe definiert, und der Satz von Stone besagt, dass jede solche Gruppe diese Form hat.
Kompakte Operatoren und Spurklasseoperatoren
Worum geht’s? Nach Axiom [A5] ist ein gemischter Zustand eines quantenmecha-
nischen Systems gegeben durch eine Dichtematrix ρ, d.h. einen selbstadjungierten, nichtnegativen Spurklasseoperator mit Spur 1. Daher wollen wir in diesem Kapitel kompakte Operatoren und speziell Spurklasse- und Hilbert–Schmidt-Operatoren studieren. Man kann sich einen gemischten Zustand vorstellen als eine abzählbare Familie von reinen Zuständen (ψk )k∈N , von denen jeder mit einer gewissen Wahrscheinlichkeit λk vorliegt, wobei λk ∈ [0, 1] und k∈N λk = 1 gelte. In der üblichen Formulierung wird ein solcher gemischter Zustand in Form eines selbstadjungierten nichtnegativen Spurklasseoperators beschrieben, wobei (λk )k∈N die Eigenwerte des Operators sind. Spurklasseoperatoren und die ähnlich definierte Klasse der Hilbert–SchmidtOperatoren sind Spezialfälle von kompakten Operatoren. Es zeigt sich, dass jeder kompakte Operator als Grenzwert einer Folgen von Operatoren endlichen Ranges geschrieben werden kann, was auch eine schöne kanonische Darstellung kompakter Operatoren erlaubt, die sogenannte Schmidt-Darstellung. Die Theorie von Riesz besagt, dass idH −K für jeden kompakten Operator K ein Fredholm-Operator mit Index 0 ist, was es uns erlaubt, Aussagen über das Spektrum kompakter Operatoren zu treffen. So besteht das Spektrum kompakter Operatoren bis auf die Null nur aus Eigenwerten endlicher Vielfachheit. Wir definieren zunächst kompakte Operatoren und zeigen, dass für einen kompakten Operator auch der adjungierte Operator kompakt ist (Satz von Schauder), diskutieren dann die Theorie von Riesz über kompakte Operatoren und den Zusammenhang zu Fredholm-Operatoren. Die Menge der kompakten Operatoren enthält als Unterraum die Menge der Spurklassenoperatoren und der Hilbert–Schmidt-Operatoren. Der zugehörige Begriff der Spur eines Operators T ∈ S1 (H ) verallgemeinert den
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2022 R. Denk, Mathematische Grundlagen der Quantenmechanik, https://doi.org/10.1007/978-3-662-65554-2_7
191
7
192
7 Kompakte Operatoren und Spurklasseoperatoren
Spurbegriff für Matrizen und kann einerseits als Summe aller Eigenwerte (im Sinne einer absolut konvergenten Reihe), andererseits in der Form k∈N T ek , ek für jede Orthonormalbasis {ek | k ∈ N} geschrieben werden.
7.1
Eigenschaften kompakter Operatoren
Kompakte Operatoren bilden einen wichtigen Unterraum des Raums aller beschränkten linearen Operatoren. Wir betrachten kompakte Operatoren in Hilberträumen. Im Folgenden seien G und H komplexe C-Hilberträume mit zugehörigem Skalarprodukt ·, ·G bzw. ·, ·H . Definition 7.1. Eine lineare Abbildung T : G → H heißt kompakt, falls der Abschluss des Bildes T ({x ∈ G | x ≤ 1}) der abgeschlossenen Einheitskugel kompakt ist. Wir schreiben K (G , H ) für die Menge aller linearen kompakten Abbildungen von G nach H sowie K (H ) := K (H , H ). Bemerkung 7.2. a) Da kompakte Mengen beschränkt sind, ist jeder lineare kompakte Operator insbesondere stetig, d.h. es gilt K (G , H ) ⊆ L(G , H ). Wegen der Linearität ist ein Operator T ∈ L(G , H ) genau dann kompakt, wenn der Abschluss des Bildes jeder beschränkten Menge kompakt ist. b) Ein Operator T ∈ L(G , H ) ist genau dann kompakt, wenn für jede beschränkte Folge (xn )n∈N ⊆ G die Folge (T xn )n∈N ⊆ H eine in H konvergente Teilfolge besitzt. Dies folgt aus der Äquivalenz von kompakt und folgenkompakt für Teilmengen von Hilberträumen, siehe Bemerkung 2.29.
Satz 7.3.
a) Der Raum K (G , H ) ist ein (bezüglich der Normtopologie) abgeschlossener Unterraum von L(G , H ). b) Seien G1 und H1 zwei weitere C-Hilberträume. Falls S1 ∈ L(G1 , G ), T ∈ K (G , H ) und S2 ∈ L(H , H1 ), so ist S2 T S1 ∈ K (G1 , H1 ).
Beweis. a) Sei (xn )n∈N ⊆ G eine Folge mit xn ≤ C, und seien T1 , T2 ∈ K (G , H ) und α1 , α2 ∈ C. Dann existiert eine Teilfolge (xk,1 )k∈N := (xn k )k∈N von (xn )n∈N so, dass die Folge
7.1
Eigenschaften kompakter Operatoren
193
(T1 xn k )k∈N ⊆ H in H konvergiert. Da auch T2 kompakt ist, existiert von der Folge (xk,1 )k∈N eine weitere Teilfolge (xk,2 )k∈N so, dass auch (T2 xk,2 )k∈N in H konvergiert. Für diese Teilfolge konvergiert damit auch ((α1 T1 + α2 T2 )xk,2 )k∈N ⊆ H , d.h. auch der Operator α1 T1 + α2 T2 ist kompakt. Somit ist K (G , H ) ein Untervektorraum von L(G , H ). Sei nun (T )∈N ⊆ K (G , H ) eine Folge kompakter Operatoren und T ∈ L(G , H ) mit T −T → 0 ( → ∞). Wie oben wählen wir iterativ Teilfolgen (xk, j )k∈N von (xn )n∈N so, dass (T xk, j )k∈N ⊆ H für alle = 1, . . . , j konvergiert. Die Diagonalfolge (x j ) j∈N mit x j := x j, j ist dann ebenfalls eine Teilfolge der ursprünglichen Folge (xn )n∈N , und die Folge (T x j ) j∈N konvergiert für alle ∈ N, da (x j ) j∈N bis auf endlich viele Glieder eine Teilfolge von (xk, )k∈N ist. ε Zu ε > 0 wählen wir δ := 2C+1 . Wegen T − T → 0 existiert ein ∈ N mit
T −T < δ. Da (T x j ) j∈N konvergiert, existiert ein n 0 ∈ N so, dass T x j −T xk < δ für alle j, k ≥ n 0 gilt. Damit folgt T x j − T xk ≤ T x j − T x j + T x j − T xk + T xk − T xk < 2Cδ + δ = ε für j, k ≥ n 0 , d.h. (T x j ) j∈N ist eine Cauchyfolge in H und damit konvergent. Somit ist auch der Operator T kompakt, was die Abgeschlossenheit von K (G , H ) zeigt. b) Sei (xn )n∈N ⊆ G1 eine beschränkte Folge. Da S1 stetig ist, ist auch (S1 xn )n∈N ⊆ G beschränkt. Wegen der Kompaktheit von T besitzt (T S1 xn )n∈N ⊆ H eine konvergente Teilfolge, welche durch S2 auf eine konvergente Teilfolge in H1 abgebildet wird. Also ist S2 T S1 kompakt. Die Aussage in Teil a) dieses Satzes gilt nicht mehr, wenn man die Konvergenz in der s Norm durch starke Konvergenz (Definition 6.5) ersetzt: Falls T → T ( → ∞) mit T ∈ K (G , H ), so ist nicht notwendig T ∈ K (G , H ). Teil b) von Satz 7.3 besagt, dass ein Produkt linearer stetiger Operatoren bereits dann kompakt ist, wenn ein Faktor kompakt ist. Man spricht hier auch von der Idealeigenschaft der Menge der kompakten Operatoren. Satz 7.4 (Satz von Schauder). Sei T ∈ L(G , H ). Dann ist T genau dann kompakt,
wenn der adjungierte Operator T ∗ ∈ L(H , G ) kompakt ist.
Beweis. a) Sei T ∈ K (G , H ), und sei (yn )n∈N ⊆ H eine Folge mit yn H ≤ C (n ∈ N). Nach Satz 7.3 b) gilt T T ∗ ∈ K (H ), also existiert eine Teilfolge (yn k )k∈N so, dass (T T ∗ yn k )k∈N ⊆ H konvergent ist. Wegen
194
7 Kompakte Operatoren und Spurklasseoperatoren
T ∗ (yn k − yn )2 = T ∗ (yn k − yn ), T ∗ (yn k − yn )G G
= T T ∗ (yn k − yn ), yn k − yn H ≤ 2CT T ∗ (yn k − yn )H
ist (T ∗ yn k )k∈N ⊆ G eine Cauchyfolge und damit konvergent. Also ist auch T ∗ kompakt. b) Falls T ∗ kompakt ist, folgt aus a) die Kompaktheit von T ∗∗ = T . Definition 7.5. Ein stetiger linearer Operator T ∈ L(G , H ) heißt ein Operator endlichen Ranges oder auch ein endlich-dimensionaler Operator (englisch „finite rank operator“), falls dim im(T ) < ∞. Man definiert in diesem Fall den Rang von T als rank T := dim im(T ). Die Menge aller Operatoren endlichen Ranges wird mit F(G , H ) bezeichnet. Wieder setzen wir F(H ) := F(H , H ).
Lemma 7.6.
a) Jeder Operator endlichen Ranges ist kompakt, d.h. es gilt F(G , H ) ⊆ K (G , H ). Falls dim G < ∞ oder dim H < ∞ , so ist F(G , H ) = K (G , H ) = L(G , H ). b) Die Identität idH : H → H ist genau dann kompakt, wenn dim H < ∞.
Beweis. a) Falls T ∈ F(G , H ), so ist der Abschluss von T (B(0, 1)) als beschränkte und abgeschlossene Teilmenge des endlich-dimensionalen Raums im(T ) kompakt. Also gilt F(G , H ) ⊆ K (G , H ). Falls dim G < ∞ oder dim H < ∞, gilt T ∈ F(G , H ) für jeden stetigen linearen Operator T . b) Falls dim H < ∞, so ist idH nach a) kompakt. Falls dim H = ∞, so existiert ein abzählbar unendliches Orthonormalsystem {en | n ∈ N} von H . Wegen en − em = √ 2 für alle n = m besitzt dieses keine konvergente Teilfolge, d.h. idH ist nicht kompakt.
Lemma 7.7. Sei T ∈ F(G , H ) mit rank T = n ∈ N. Dann existieren Elemente
x1 , . . . , xn ∈ G und y1 , . . . , yn ∈ H so, dass T =
n
x j ⊗ yj,
j=1
wobei für j = 1, . . . , n der lineare Operator (Tensorprodukt) x j ⊗ y j ∈ L(G , H ) definiert ist durch
7.1
Eigenschaften kompakter Operatoren
195
(x j ⊗ y j )(x) := x, x j G y j (x ∈ G ). Es gilt T ∗ ∈ F(H , G ) mit rank T ∗ = rank T sowie T∗ =
n
yj ⊗ x j.
j=1
Beweis. Wir wählen eine Orthonormalbasis {y1 , . . . , yn } von im(T ) und setzen x j := T ∗ y j , j = 1, . . . , n. Dann gilt für alle x ∈ G Tx =
n
T x, y j H y j =
j=1
n
x, T ∗ y j G y j =
j=1
n
(x j ⊗ y j )(x).
j=1
Für den adjungierten Operator erhalten wir für alle y ∈ H T x, yH =
n
n n x, x j G y j , yH = x, y j , y x j = x, y, y j H x j
j=1
j=1
H
G
j=1
G
und damit T ∗ y = nj=1 (y j ⊗ x j )(y). Man sieht rank T ∗ = dim span{x1 , . . . , xn } ≤ n = rank T . Wegen rank T = rank T ∗∗ ≤ rank T ∗ folgt sogar rank T ∗ = rank T .
Satz 7.8. Der Raum K (G , H ) aller kompakten linearen Operatoren ist der Abschluss
von F(G , H ) bezüglich der Operatornorm.
Beweis. Nach Lemma 7.6 und Satz 7.3 a) gilt F(G , H ) ⊆ K (G , H ) und damit F(G , H ) ⊆ K (G , H ). Sei nun T ∈ K (G , H ), und sei ε > 0. Dann ist die Menge A := T (B(0, 1)) ⊆ H kompakt, also besitzt die offene Überdeckung A ⊆ y∈A B(y, ε) eine endliche Teilüberden ckung A ⊆ j=1 B(y j , ε). Insbesondere gilt min j=1,...,n T x − y j H < ε für jedes x ∈ G mit xG ≤ 1. Sei H0 := span{y1 , . . . , yn } und P ∈ L(H ) die orthogonale Projektion auf den endlichdimensionalen und damit abgeschlossenen Unterraum H0 . Dann gilt P T ∈ F(G , H ) sowie nach dem Projektionssatz (Satz 2.34) T x − P T xH = min T x − yH ≤ min T x − y j H < ε y∈H0
j=1,...,n
196
7 Kompakte Operatoren und Spurklasseoperatoren
für alle x ∈ G mit xG ≤ 1. Also ist T − P T < ε. Da ε > 0 beliebig war, folgt T ∈ F(G , H ). Definition 7.9. Ein Operator T ∈ L(G , H ) heißt Fredholm-Operator, falls im(T ) abgeschlossen ist und dim ker(T ) < ∞ und dim im(T )⊥ < ∞ gelten. In diesem Fall heißt ind T := dim ker(T ) − dim im(T )⊥ der Index von T . Beispiel 7.10
a) Falls T ∈ L(G , H ) bijektiv ist, so ist T ein Fredholm-Operator mit Index 0. Insbesondere ist idH ∈ L(H ) ein Fredholm-Operator mit Index 0. b) Sei T ∈ L(H ) ein Fredholm-Operator, und sei S ∈ L(H ) bijektiv. Dann ist im(T S) = im(T ) abgeschlossen sowie ker(T S) = {S −1 x | x ∈ ker T }. Somit ist auch T S ein Fredholm-Operator und ind(T S) = dim ker(T S) − dim(im(T S))⊥ = dim ker T − dim im(T )⊥ = ind T . c) Sei H = Cn für ein n ∈ N und T ∈ L(Cn ). Dann ist T offensichtlich ein FredholmOperator. Wie aus der linearen Algebra bekannt ist, gilt n = dim ker T + rank T . Wegen dim im(T )⊥ = n − rank T folgt ind T = 0.
Satz 7.11 (Satz von Riesz über kompakte Operatoren). Sei T ∈ K (H ). Dann ist
idH −T ein Fredholm-Operator mit Index 0.
Beweis. a) Sei zunächst T ∈ F(H ). Nach Lemma 7.7 existieren n ∈ N und x1 , . . . , xn , y1 , . . . , yn ∈ H so, dass T = nj=1 x j ⊗ y j . Für H0 := span{x1 , . . . , xn , y1 , . . . , yn } gilt dann T (H0 ) ⊆ H0 und T = 0 auf H0⊥ . Für F := idH −T erhalten wir F(H0 ) ⊆ H0 und damit F|H ⊥ = idH ⊥ . 0 0 Wir definieren F0 := F|H0 ∈ L(H0 ). Da H0 endlich-dimensional ist, ist F0 nach Beispiel 7.10 c) ein Fredholm-Operator mit Index 0. Wegen ker F = ker F0 , im(F) = im(F0 ) ⊕ H0⊥ sowie im(F)⊥ = im(F0 )⊥ gilt dies auch für F. b) Sei nun T ∈ K (H ) beliebig. Nach Satz 7.8 existiert ein T0 ∈ F(H ) mit T − T0 ≤ 21 . Dann ist S := idH −(T − T0 ) invertierbar (Neumannsche Reihe, siehe Lemma 5.21), und idH −T = idH −T0 − (T − T0 ) = S − T0 = (idH −T0 S −1 )S. Wegen im(T0 S −1 ) = im(T0 ) ist T0 S −1 ∈ F(H ), und nach Teil a) ist idH −T0 S −1 ein Fredholm-Operator mit Index 0. Nach Beispiel 7.10 b) ist damit auch idH −T ein Fredholm-Operator mit Index 0.
7.1
Eigenschaften kompakter Operatoren
197
Der Satz von Riesz erlaubt es uns, Aussagen über das Spektrum kompakter Operatoren zu treffen. Für den Beweis des entsprechenden Satzes verwenden wir folgende Bemerkung. Bemerkung 7.12. Sei T ∈ L(H ), und seien λ1 , . . . , λn verschiedene Eigenwerte von T . Sei v j ein Eigenvektor von T zum Eigenwert λ j , j = 1, . . . , n. Dann ist {v1 , . . . , vn } linear unabhängig. Denn ansonsten existiert ein n 0 ≤ n − 1 so, dass die Vektoren {v1 , . . . , vn 0 } linear unabhängig sind, aber vn 0 +1 ∈ span{v1 , . . . , vn 0 } gilt. Somit existieren α1 , . . . , αn 0 ∈ C mit n0 vn 0 +1 = αk vk . k=1
Damit folgt 0 = (T − λn 0 +1 )vn 0 +1 =
n0
αk (λk − λn 0 +1 )vk .
k=1
Aus der linearen Unabhängigkeit von {v1 , . . . , vn 0 } und λk = λn 0 +1 (k = 1, . . . , n 0 ) folgt nun αk = 0 für alle k = 1, . . . , n 0 und damit vn 0 +1 = 0, Widerspruch.
Satz 7.13. Sei T ∈ K (H ) ein kompakter Operator.
a) Falls λ ∈ σ (T )\{0}, so ist λ ein Eigenwert von T , und es gilt dim ker(T −λ) < ∞. Falls dim H = ∞, so gilt 0 ∈ σ (T ). b) Für jedes ε > 0 ist die Menge {λ ∈ σ (T ) | |λ| ≥ ε} endlich. Somit ist σ (T ) abzählbar mit 0 als einzigem möglichen Häufungspunkt.
Beweis. a) Für jedes λ = 0 ist (T − λ) = λ( λ1 T − idH ) nach dem Satz von Riesz (Satz 7.11) ein Fredholm-Operator mit Index 0, insbesondere ist dim ker(T −λ) < ∞. Falls dim ker(T − λ) = 0, so ist dim(im(T −λ)⊥ ) = 0, und da im(T −λ) abgeschlossen ist, ist T −λ bereits bijektiv und somit λ ∈ ρ(T ). Falls andererseits dim ker(T − λ) > 0, gilt λ ∈ σ p (T ). Sei nun 0 ∈ ρ(T ). Dann ist idH = T T −1 ein kompakter Operator, und nach Lemma 7.6 b) folgt dim H < ∞. b) Sei ε > 0, und seien {λn | n ∈ N} Eigenwerte von T mit λn = λm (n = m) und |λn | ≥ ε. Sei xn ein Eigenvektor von T zum Eigenwert λn , und sei Hn := span{x1 , . . . , xn }. Nach Bemerkung 7.12 ist {x1 , . . . , xn } linear unabhängig, d.h. dim Hn = n. Wir wählen ⊥ mit y = 1. yn ∈ Hn ∩ Hn−1 n Wegen yn ∈ Hn existieren α1 , . . . , αn ∈ C mit yn = nk=1 αk xk . Es folgt (T − λn )yn =
n k=1
αk (λk − λn )xk ∈ Hn−1 .
198
7 Kompakte Operatoren und Spurklasseoperatoren
Nach dem Satz von Pythagoras erhalten wir für n > m wegen T (Hm ) ⊆ Hm ⊆ Hn−1 T yn − T ym 2 = λn yn + (T − λn )yn − T ym )2 = λn yn 2 + (T − λn )yn − T ym 2 ≥ |λn |2 ≥ ε2 .
Also besitzt die Folge (T yn )n∈N keine konvergente Teilfolge, im Widerspruch zur Kompaktheit von T . Für selbstadjungierte kompakte Operatoren in separablen Hilberträumen lässt sich der Spektralsatz sehr einfach formulieren. Satz 7.14. Seien H separabel und T ∈ K (H ) ein kompakter selbstadjungierter
Operator. Dann existieren ein N ∈ N ∪ {∞} und eine Orthonormalbasis {en | n < N } von H , bestehend aus Eigenvektoren en (wobei die zugehörigen Eigenwerte (λn )n