124 29 6MB
English Pages 545 [541] Year 2008
Springer-Lehrbuch
Dirk Werner
Funktionalanalysis Sechste, korrigierte Auflage Mit 14 Abbildungen
123
Prof. Dr. Dirk Werner Freie Universität Berlin Fachbereich Mathematik und Informatik Arnimallee 6 14195 Berlin E-mail: [email protected]
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
Mathematics Subject Classification (2000): 46-01, 47-01
ISBN 978-3-540-72533-6 6. Aufl. Springer Berlin Heidelberg New York ISBN 978-3-540-21381-9 5. Aufl. Springer Berlin Heidelberg New York Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Springer ist ein Unternehmen von Springer Science+Business Media springer.de © Springer-Verlag Berlin Heidelberg 1995, 1997, 2000, 2002, 2005, 2007 Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Text und Abbildungen wurden mit größter Sorgfalt erarbeitet. Verlag und Autor können jedoch für eventuell verbliebene fehlerhafte Angaben und deren Folgen weder eine juristische Verantwortung noch irgendeine Haftung übernehmen. Satz: Datenerstellung durch den Autor Herstellung: LE-TEX Jelonek, Schmidt & Vöckler GbR, Leipzig Umschlaggestaltung: WMXDesign GmbH, Heidelberg Gedruckt auf säurefreiem Papier
175/3180/YL - 5 4 3 2 1 0
F¨ ur Irina, Felix und Nina
Vorwort
Die Grundidee der Funktionalanalysis ist es, Folgen oder Funktionen als Punkte in einem geeigneten Vektorraum zu interpretieren und Probleme der Analysis durch Abbildungen auf einem solchen Raum zu studieren. Zu nichttrivialen Aussagen kommt man aber erst, wenn man Vektorr¨aume mit einer Norm versieht und analytische Eigenschaften wie Stetigkeit etc. der Abbildungen untersucht. Es ist dieses Zusammenspiel von analytischen und algebraischen Ph¨ anomenen, das die Funktionalanalysis auszeichnet und reizvoll macht. Der Ursprung der Funktionalanalysis liegt Anfang dieses Jahrhunderts in Arbeiten von Hilbert, Schmidt, Riesz und anderen; sp¨ater wurde sie durch Banach und von Neumann, die die heute gel¨aufigen Begriffe des normierten Raums und des Hilbertraums pr¨ agten, kanonisiert. Funktionalanalytische Kenntnisse sind mittlerweile in vielen Disziplinen der Mathematik wie Differentialgleichungen, Numerik, Wahrscheinlichkeitstheorie oder Approximationstheorie sowie in der theoretischen Physik unabdingbar. Dieses Buch bietet eine Einf¨ uhrung in Methoden und Ergebnisse der Funktionalanalysis. Seine ersten sieben Kapitel widmen sich den normierten R¨ aumen und den zwischen ihnen wirkenden linearen Abbildungen; die letzten beiden Kapitel studieren allgemeinere Situationen. Wie jede ausgereifte Theorie entwickelt auch die Funktionalanalysis eine F¨ ulle nichttrivialer Resultate aus ganz wenigen Grundbegriffen. Es ist ein Anliegen dieses Textes, diese Resultate ausf¨ uhrlich darzustellen und an vielen Beispielen zu veranschaulichen. Im einzelnen werden in den Kapiteln I und II Beispiele und elementare Eigenschaften normierter R¨ aume und stetiger sowie kompakter linearer Abbildungen vorgestellt, Kapitel III enth¨alt Existenzs¨atze f¨ ur stetige Funktionale, und Kapitel IV bringt die Haupts¨atze u ¨ ber Operatoren auf vollst¨ andigen normierten R¨ aumen. Kapitel V studiert den f¨ ur die Anwendungen besonders wichtigen Fall der R¨ aume mit Skalarprodukt (Hilbertr¨ aume), und die n¨ achsten beiden Kapitel widmen sich der Eigenwert-
viii
Vorwort
theorie. Schließlich kommt in Kapitel VIII mit den lokalkonvexen R¨aumen eine allgemeinere Raumklasse zur Sprache; die Notwendigkeit hierf¨ ur wird sowohl von der Theorie als auch von den Anwendungen diktiert. Das abschließende Kapitel IX behandelt Banachalgebren. Vieles, was hier dargestellt wird, ist klassischer Bestand aller Funktionalanalysisvorlesungen. Dar¨ uber hinaus wird noch manches speziellere Thema angesprochen, z.B. das Problem der Approximation kompakter Operatoren durch endlichdimensionale und der Interpolationssatz von Riesz und Thorin in Kapitel II, Existenz und Nichtexistenz stetiger Projektionen auf Banachr¨ aumen in Kapitel IV, die Einbettungss¨atze von Sobolev und Rellich in Kapitel V, eine Einf¨ uhrung in die Theorie der nuklearen und HilbertSchmidt-Operatoren in Kapitel VI, einen Abriß der Schwartzschen Distributionentheorie auf der Basis der lokalkonvexen R¨aume in Kapitel VIII oder die GNS-Konstruktion f¨ ur nichtkommutative C ∗ -Algebren in Kapitel IX. Zu jedem Kapitel gibt es Aufgaben (viele mit L¨osungshinweisen) und eine Rubrik namens Bemerkungen und Ausblicke“; dort findet man ” neben historischen Anmerkungen noch diverse weitere Ergebnisse, die mit dem dargestellten Material verwandt sind, jedoch nicht bewiesen werden. So bleibt dem Gesamtleser (hoffentlich) auch beim wiederholten Aufschla¨ gen noch etwas Neues und Interessantes zu entdecken. Ubrigens ist die Geschichte der Funktionalanalysis in viel gr¨oßerem Detail in den B¨ uchern von Dieudonn´e [1981] und Monna [1973] nachzulesen. Das vorliegende Buch ist aus Skripten zu zweisemestrigen Vorlesungen entstanden, die ich mehrfach an der Freien Universit¨at Berlin gehalten habe. Es wendet sich an Studierende der Mathematik und Physik, die die Vorlesungen u ¨ ber Analysis und lineare Algebra absolviert haben, womit im wesentlichen die erwarteten Vorkenntnisse definiert sind. Zum Verst¨andnis des Textes ist etwas Erfahrung mit dem Begriff des metrischen Raums hilfreich; metrische R¨ aume werden heute ja u ¨blicherweise schon in der Analysisvorlesung behandelt, und im Anhang B sind die notwendigen Informationen dazu noch einmal zusammengestellt. Den Begriff des topologischen Raums braucht man erst in Kapitel VIII; auch hierzu findet man eine Einf¨ uhrung im Anhang B. W¨ unschenswert sind Grundkenntnisse der Maß- und Integrationstheorie etwa im Umfang des Anhangs A. An ganz wenigen Stellen werden funktionentheoretische Kenntnisse herangezogen. Abschließend m¨ ochte ich mich bei allen bedanken, die mit Rat und Tat zu diesem Buch beigetragen haben, insbesondere bei J. Averdunk, E. Behrends, J. Brasche, A. Defant, U. Fuchs, P. Harmand, W. Hensgen, H. Jarchow, R. Pay´ a, L. Seifert sowie mehreren Jahrg¨angen von Studierenden, die an meinen Vorlesungen teilgenommen haben. Berlin, im April 1995
Dirk Werner
Vorwort zur sechsten Auflage
Die sechste Auflage wurde gegen¨ uber der vorherigen an ca. 50 Stellen ge¨ andert. Die meisten Verbesserungen sind eher kosmetischer Natur, es gibt jedoch zwei Ausnahmen. Im Anschluß an den Fixpunktsatz f¨ ur nichtexpansive Abbildungen in Hilbertr¨ aumen (Satz IV.7.4) habe ich, einen Vorschlag Folkmar Bornemanns aufgreifend, die Konvergenz eines Iterationsverfahrens zur konstruktiven Gewinnung eines solchen Fixpunkts gezeigt, und der Beweis von Satz VII.1.3 mußte umgestellt werden, um ein Wohldefiniertheitsproblem zu umgehen; darauf wurde ich von Markus Sigg hingewiesen. Wenn auch Sie auf etwaige Umgereimtheiten stoßen, informieren Sie mich bitte. Die schwerwiegenderen F¨ alle werde ich wie bisher auf meiner Homepage http://www.math.fu-berlin.de/∼werner bzw. http://page.mi.fu-berlin.de/∼werner dokumentieren. (Letzteres ist die offizielle“ Adressierung derselben Seite.) ” Weil dieses Buch zuerst 1995 und damit vor der Rechtschreibreform erschienen ist, ist es auch in dieser Neuauflage bei daß statt dass, meßbar statt messbar etc. (und bei Weierstraß sowieso) geblieben. Berlin, im Juni 2007
Dirk Werner
Inhaltsverzeichnis
I. Normierte R¨ aume . . . . . . . . . . . . . . . . . . . . I.1 Beispiele normierter R¨ aume . . . . . . . . . . . . . I.2 Eigenschaften normierter R¨ aume . . . . . . . . . . I.3 Quotienten und Summen von normierten R¨aumen I.4 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . I.5 Bemerkungen und Ausblicke . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
1 1 23 34 35 40
II. Funktionale und Operatoren . . . . . . . . . . . . . . . . II.1 Beispiele und Eigenschaften stetiger linearer Operatoren II.2 Dualr¨ aume und ihre Darstellungen . . . . . . . . . . . . II.3 Kompakte Operatoren . . . . . . . . . . . . . . . . . . . II.4 Interpolation von Operatoren auf Lp -R¨aumen . . . . . . II.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . II.6 Bemerkungen und Ausblicke . . . . . . . . . . . . . . . .
. . . . . . .
. . . . . . .
45 45 58 65 72 80 87
III. Der Satz von Hahn-Banach und seine Konsequenzen III.1 Fortsetzungen von Funktionalen . . . . . . . . . . . . . . III.2 Trennung konvexer Mengen . . . . . . . . . . . . . . . . III.3 Schwache Konvergenz und Reflexivit¨ at . . . . . . . . . . III.4 Adjungierte Operatoren . . . . . . . . . . . . . . . . . . III.5 Differentiation nichtlinearer Abbildungen . . . . . . . . III.6 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . III.7 Bemerkungen und Ausblicke . . . . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
93 93 100 104 109 112 126 131
IV. Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen IV.1 Vorbereitung: Der Bairesche Kategoriensatz . . . . . . IV.2 Das Prinzip der gleichm¨ aßigen Beschr¨anktheit . . . . . IV.3 Der Satz von der offenen Abbildung . . . . . . . . . .
. . . .
. . . .
137 137 140 151
. . . .
xii
Inhaltsverzeichnis
IV.4 IV.5 IV.6 IV.7 IV.8 IV.9
Der Satz vom abgeschlossenen Graphen Der Satz vom abgeschlossenen Bild . . . Projektionen auf Banachr¨ aumen . . . . Fixpunkts¨ atze . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . Bemerkungen und Ausblicke . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
154 158 161 164 185 192
V. Hilbertr¨ aume . . . . . . . . . . . . . . . . . . V.1 Definitionen und Beispiele . . . . . . . . . V.2 Fouriertransformation und Sobolevr¨aume V.3 Orthogonalit¨ at . . . . . . . . . . . . . . . V.4 Orthonormalbasen . . . . . . . . . . . . . V.5 Operatoren auf Hilbertr¨ aumen . . . . . . V.6 Aufgaben . . . . . . . . . . . . . . . . . . V.7 Bemerkungen und Ausblicke . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
201 201 210 222 230 236 241 249
VI. Spektraltheorie kompakter Operatoren . . . VI.1 Das Spektrum eines beschr¨ ankten Operators . VI.2 Die Theorie von Riesz . . . . . . . . . . . . . VI.3 Kompakte Operatoren auf Hilbertr¨ aumen . . VI.4 Anwendungen auf Integralgleichungen . . . . VI.5 Nukleare Operatoren . . . . . . . . . . . . . . VI.6 Hilbert-Schmidt-Operatoren . . . . . . . . . . VI.7 Aufgaben . . . . . . . . . . . . . . . . . . . . VI.8 Bemerkungen und Ausblicke . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
255 255 260 268 274 284 296 306 310
VII. Spektralzerlegung selbstadjungierter Operatoren VII.1 Der Spektralsatz f¨ ur beschr¨ ankte Operatoren . . . . VII.2 Unbeschr¨ ankte Operatoren . . . . . . . . . . . . . . ur unbeschr¨ ankte Operatoren . . VII.3 Der Spektralsatz f¨ VII.4 Operatorhalbgruppen . . . . . . . . . . . . . . . . . VII.5 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . VII.6 Bemerkungen und Ausblicke . . . . . . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
317 317 341 354 357 378 383
VIII. Lokalkonvexe R¨ aume . . . . . . . . . . . . . . . . . . VIII.1 Definition lokalkonvexer R¨ aume; Beispiele . . . . . . VIII.2 Stetige Funktionale und der Satz von Hahn-Banach VIII.3 Schwache Topologien . . . . . . . . . . . . . . . . . VIII.4 Extremalpunkte und der Satz von Krein-Milman . . VIII.5 Einf¨ uhrung in die Distributionentheorie . . . . . . . VIII.6 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . VIII.7 Bemerkungen und Ausblicke . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
393 393 400 407 418 427 436 444
xiii
Inhaltsverzeichnis
IX. Banachalgebren . . . . . . . . . . . . . IX.1 Grundbegriffe und Beispiele . . . . . IX.2 Die Gelfandsche Darstellungstheorie IX.3 C ∗ -Algebren . . . . . . . . . . . . . . IX.4 Aufgaben . . . . . . . . . . . . . . . IX.5 Bemerkungen und Ausblicke . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
455 455 459 465 476 479
Anhang A. Maß- und Integrationstheorie . . . . . . . . . . . . A.1 Das Lebesgueintegral f¨ ur Funktionen auf einem Intervall . . A.2 Das d-dimensionale Lebesguemaß und abstrakte Integration A.3 Konvergenzs¨ atze . . . . . . . . . . . . . . . . . . . . . . . . A.4 Signierte und komplexe Maße . . . . . . . . . . . . . . . . .
485 485 493 495 497
Anhang B. Metrische und topologische R¨ aume . . . . . . . . 499 B.1 Metrische R¨ aume . . . . . . . . . . . . . . . . . . . . . . . . 499 B.2 Topologische R¨ aume . . . . . . . . . . . . . . . . . . . . . . 505 Symbolverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . 513 Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . 517 Namen- und Sachverzeichnis . . . . . . . . . . . . . . . . . . . . 523
Kapitel I
Normierte R¨aume
I.1
Beispiele normierter R¨ aume
Im folgenden werden Vektorr¨ aume u ¨ ber den K¨orpern K = R oder K = C betrachtet. Außerdem wird stillschweigend gelegentlich der triviale Vektorraum {0} ausgeschlossen. Wir verwenden die Bezeichnung K-Vektorraum, um anzudeuten, daß sowohl ein reeller als auch ein komplexer Vektorraum gemeint sein kann. Definition I.1.1 Sei X ein K-Vektorraum. Eine Abbildung p: X → [0, ∞) heißt Halbnorm, falls (a) p(λx) = |λ|p(x) ∀λ ∈ K, x ∈ X, (b) p(x + y) ≤ p(x) + p(y) ∀x, y ∈ X gilt. ((b) heißt Dreiecksungleichung.) Gilt zus¨ atzlich (c) p(x) = 0 ⇒ x = 0, so heißt p eine Norm. Normen werden u ¨ blicherweise mit dem Symbol . (statt p) bezeichnet. Man nennt das Paar (X, p) einen halbnormierten bzw. gegebenenfalls einen normierten Raum. Ist es aus dem Zusammenhang klar oder selbstverst¨ andlich, welche (Halb-)Norm gemeint ist, spricht man von X selbst als (halb-)normiertem Raum. Beachte, daß aus (a) allein bereits p(0) = 0 folgt; dazu wende (a) mit λ = 0 und x = 0 an: p(0) = p(0 · 0) = 0 · p(0) = 0. Auf einem normierten Raum (X, . ) wird in nat¨ urlicher Weise eine Metrik induziert; setze n¨ amlich d(x, y) = x − y
∀x, y ∈ X.
In der Tat verifiziert man leicht die Axiome (x, y, z ∈ X beliebig)
2
I.
(a) (b) (c) (d)
Normierte R¨ aume
d(x, y) ≥ 0, d(x, y) = d(y, x), d(x, z) ≤ d(x, y) + d(y, z), d(x, y) = 0 ⇐⇒ x = y.
(Z.B. folgt (c) aus d(x, z) = x − z = (x − y) + (y − z) ≤ x − y + y − z = d(x, y) + d(y, z).) In einem halbnormierten Raum erh¨ alt man bloß eine Halbmetrik, d.h., in (d) gilt nur die Implikation ⇐. Damit sind in einem (halb-)normierten Raum topologische Begriffe wie konvergente Folge, Cauchyfolge, Stetigkeit, Kompaktheit etc. definiert, mit denen wir uns demn¨ achst n¨ aher besch¨ aftigen werden. (Die wichtigsten Tatsachen u aume sind im Anhang B zusammengestellt.) Einst¨ ber metrische R¨ weilen sei daran erinnert, daß eine Folge (xn ) von Elementen eines (halb-) normierten Raums X eine Cauchyfolge ist, falls ∀ε > 0 ∃N (ε) ∈ N ∀n, m ≥ N (ε) xn − xm < ε gilt. Ferner konvergiert (xn ) gegen x ∈ X (in Zeichen limn→∞ xn = x), falls ∀ε > 0 ∃N (ε) ∈ N ∀n ≥ N (ε) xn − x < ε gilt (wobei jeweils auch ≤ ε“ h¨ atte stehen d¨ urfen). ” F¨ ur Folgen des Kn mit seiner nat¨ urlichen Metrik gilt bekanntlich die ¨ Aquivalenz von Cauchy-Eigenschaft und Konvergenz; in allgemeinen normierten R¨ aumen ist das jedoch nicht mehr richtig (siehe S. 6). Nat¨ urlich sind konvergente Folgen stets Cauchyfolgen. Definition I.1.2 Ein metrischer Raum, in dem jede Cauchyfolge konvergiert, heißt vollst¨andig. Ein vollst¨ andiger normierter Raum heißt Banachraum. Ein nicht vollst¨ andiger normierter Raum X kann stets in einen Banachraum eingebettet“ werden. Dazu betrachte die Menge CF (X) aller ” ¨ Cauchyfolgen in X, erkl¨ are eine Aquivalenzrelation ∼ auf CF (X) durch (xn ) ∼ (yn ) ⇐⇒ xn − yn → 0, als Menge aller Aquivalenzklassen. ¨ und definiere X Man zeigt dann, daß X die Struktur eines Vektorraums tr¨ agt, auf dem [(xn )] = lim xn n→∞
I.1
3
Beispiele normierter R¨ aume
eine vollst¨ andige Norm induziert. Identifiziert man X mit den konstanten so wird X in nat¨ dicht eingebettet. X wird Folgen in X, urlicher Weise in X Vervollst¨ andigung von X genannt; man kann außerdem zeigen, daß eine solche Vervollst¨ andigung im wesentlichen (d.h. bis auf Isometrie“) eindeutig ” bestimmt ist. Dieses Verfahren erinnert an eine der Konstruktionen von R als Vervollst¨ andigung von Q. In Kapitel III wird eine elegantere Methode vorgestellt, die Vervollst¨ andigung eines normierten Raums zu definieren. Wir werden im weiteren Verlauf sehen, daß die Vollst¨andigkeit zum Beweis vieler nichttrivialer Aussagen wesentlich ist (vgl. Kapitel IV). Im Rest dieses Abschnitts diskutieren wir einige Beispiele normierter R¨ aume. Beispiele. (a) In der Analysis werden auf Kn die Normen (x = (x1 , . . . , xn )) x 1 = x 2 =
n
|xi |,
i=1 n
1/2 |xi |2
,
i=1
x ∞ =
max |xi |
i=1,...,n
betrachtet. Diese Normen sind insofern gleichwertig, als eine Folge genau dann bez¨ uglich einer dieser Normen konvergiert, wenn sie auch bez¨ uglich der u ¨brigen Normen konvergiert. (b) T sei eine Menge. ∞ (T ) sei der Vektorraum (!) aller beschr¨ankten Funktionen von T nach K. F¨ ur x ∈ ∞ (T ) setze x ∞ = sup |x(t)| (< ∞). t∈T
Man nennt . ∞ die Supremumsnorm. Es gilt: • (∞ (T ), . ∞ ) ist ein Banachraum. Um das einzusehen, u ¨ berzeugen wir uns zuerst, daß . ∞ in der Tat eine Norm ist. Nur die Dreiecksungleichung ist hier eventuell nicht ganz offensichtlich. Seien also x, y ∈ ∞ (T ), t0 ∈ T . Dann ist |x(t0 ) + y(t0 )| ≤ |x(t0 )| + |y(t0 )| ≤ sup |x(t)| + sup |y(t)| t∈T
= x ∞ + y ∞ . ¨ Nach Ubergang zum Supremum u ¨ ber alle t0 ∈ T folgt x + y ∞ ≤ x ∞ + y ∞ .
t∈T
4
I.
Normierte R¨ aume
Wir kommen jetzt zur behaupteten Vollst¨andigkeit. Sei (xn ) eine Cauchyfolge in ∞ (T ). Es ist die Existenz eines Elements x ∈ ∞ (T ) mit xn − x ∞ → 0 zu zeigen. Dazu beachte die Ungleichung |y(t)| ≤ y ∞ ∞ f¨ ur alle t ∈ T , y ∈ (T ). Sie impliziert, daß bei beliebigem t ∈ T die Zahlenfolge xn (t) eine Cauchyfolge ist, die auf Grund der Vollst¨andigkeit des Skalarenk¨ orpers einen Limes besitzt, den wir mit x(t) bezeichnen. Auf diese Weise wird eine Funktion x: T → K definiert. Wir zeigen jetzt, uglich der Supremumsnorm gegen x daß x beschr¨ ankt ist und daß (xn ) bez¨ konvergiert. Zun¨ achst w¨ ahle bei gegebenem ε > 0 eine nat¨ urliche Zahl N mit ∀n, m ≥ N. xn − xm ∞ ≤ ε Sei t ∈ T . Wegen xn (t) → x(t) existiert m0 = m0 (ε, t) mit |xm0 (t) − x(t)| ≤ ε. ur Ohne Einschr¨ ankung darf m0 ≥ N angenommen werden, es gilt also f¨ alle n ≥ N |xn (t) − x(t)| ≤ |xn (t) − xm0 (t)| + |xm0 (t) − x(t)| ≤ xn − xm0 ∞ + ε ≤ 2ε. F¨ ur beliebiges t ∈ T ergibt sich nun zum einen |x(t)| ≤ |xN (t)| + |x(t) − xN (t)| ≤ xN ∞ + 2ε, d.h., x ist beschr¨ ankt, zum anderen folgt xn − x ∞ ≤ 2ε
∀n ≥ N,
d.h., limn→∞ xn = x. Konvergenz bzgl. der Supremumsnorm ist gleichbedeutend mit gleichm¨ aßiger Konvergenz. Sp¨ ater werden auch noch weitere Konvergenzbegriffe behandelt, die mit anderen Normen zusammenh¨angen. oßte Raum von Funktionen auf T , auf dem die Supre∞ (T ) ist der gr¨ mumsnorm definiert ist. Es u ¨ berrascht daher nicht, daß ∞ (T ) vollst¨andig ist (denn was sollte fehlen?). Wir werden als n¨achstes einige Untervektorr¨ aume betrachten. Dabei wird sich das folgende Lemma als n¨ utzlich erweisen. Lemma I.1.3 (a) Ist X ein Banachraum und U ein abgeschlossener Untervektorraum von X, so ist U vollst¨andig.
I.1
5
Beispiele normierter R¨ aume
(b) Ist X ein normierter Raum und U ein vollst¨andiger Untervektorraum von X, so ist U abgeschlossen. Beweis. (a) Sei (xn ) eine Cauchyfolge in U . Da X vollst¨andig ist, existiert limn→∞ xn =: x ∈ X. Wegen der Abgeschlossenheit von U muß x sogar in U liegen. (b) Seien xn ∈ U und gelte limn→∞ xn = x ∈ X. Wir werden x ∈ U zeigen. Als konvergente Folge ist (xn ) insbesondere eine Cauchyfolge in U . U ist vollst¨ andig, weshalb (xn ) einen Grenzwert in U besitzt. Dieser ist jedoch eindeutig bestimmt, also ist x ∈ U , wie behauptet. 2 Das Lemma gestattet es, die Vollst¨ andigkeitsbeweise f¨ ur normierte R¨aume U , die als Unterr¨ aume von Banachr¨ aumen X erkannt sind, zu vereinur eine Cauchyfolge in U zu fachen: Statt die Existenz von limn→∞ xn f¨ beweisen, braucht nur die Abgeschlossenheit von U gezeigt zu werden, d.h., wenn limn→∞ xn in X existiert, so liegt der Grenzwert bereits in U . Wir illustrieren dieses Prinzip in den folgenden Beispielen (c)–(f). Beispiel. (c) R¨ aume stetiger Funktionen. Sei T ein metrischer (oder auch bloß topologischer) Raum. (Als einfachstes Beispiel denke man an Teilmengen von R.) C b (T ) bezeichne die Menge der stetigen beschr¨ ankten Funktionen von T nach K. Da Summen und Vielfache stetiger Funktionen wieder stetig sind, ist C b (T ) ein Untervektorraum von ∞ (T ). Wir zeigen nun: • C b (T ), versehen mit der Supremumsnorm, ist ein Banachraum. Nach Lemma I.1.3(a) ist nur zu zeigen, daß C b (T ) abgeschlossen in ∞ (T ) ist. Zu zeigen ist also: Konvergiert die Folge (xn ) stetiger beschr¨ankter Funktionen gleichm¨ aßig gegen die beschr¨ ankte Funktion x, so ist x ebenfalls stetig. Das ist jedoch ein bekannter Satz der Analysis! Der Vollst¨andigkeit halber folgt hier der Beweis, es handelt sich um ein sog. 3ε -Argument. Zu ε > 0 w¨ ahle N ∈ N mit xN − x ∞ ≤ 3ε . Sei t0 ∈ T . Wegen der Stetigkeit von xN existiert δ > 0 mit (d bezeichne die Metrik von T ) d(t, t0 ) < δ
⇒ |xN (t) − xN (t0 )| ≤
ε . 3
Dann gilt f¨ ur t mit d(t, t0 ) < δ |x(t) − x(t0 )| ≤ |x(t) − xN (t)| + |xN (t) − xN (t0 )| + |xN (t0 ) − x(t0 )| ≤ 2 x − xN ∞ + |xN (t) − xN (t0 )| ε ε = ε, ≤ 2 + 3 3 also ist x stetig bei t0 .
6
I.
Normierte R¨ aume
Ist T sogar ein kompakter metrischer (oder kompakter topologischer) Raum, so ist jede stetige Funktion von T nach K beschr¨ankt; man schreibt in diesem Fall C(T ) statt C b (T ). Das Symbol C leitet sich u ¨ brigens von dem franz¨ osischen Wort f¨ ur stetig, continu, her. Des weiteren ist der Raum C0 (T ) (speziell C0 (Rn )) von Interesse, der aus den im Unendlichen verschwindenden“ stetigen Funktionen f auf ei” nem lokalkompakten Raum T besteht. Damit ist gemeint, daß f¨ ur alle ε > 0 die Menge {t ∈ T : |f (t)| ≥ ε} kompakt ist. Es ist leicht zu sehen, daß C0 (T ) in C b (T ) abgeschlossen, also mit der Supremumsnorm versehen ein Banachraum ist. Beispiel. (d) R¨aume differenzierbarer Funktionen. C 1 [a, b] sei der Vektorraum der stetig differenzierbaren Funktionen auf dem kompakten Intervall [a, b]; C 1 [a, b] ist also ein Untervektorraum von C[a, b]. C 1 [a, b] ist aber nicht abgeschlossen in der Supremumsnorm, nach Lemma I.1.3(b) ist (C 1 [a, b], . ∞ ) kein Banachraum. (In der Tat definiert – etwa f¨ ur a = −1, b = 1 – die Vorschrift xn (t) = (t2 + n1 )1/2 eine Folge stetig differenzierbarer Funktionen, die gleichm¨ aßig gegen die nicht differenzierbare Funktion | . | konvergiert.) Betrachte nun jedoch f¨ ur x ∈ C 1 [a, b] die Normen x =
sup max{|x(t)|, |x (t)|} = max{ x ∞ , x ∞ }, t∈[a,b]
|||x||| = x ∞ + x ∞ . Es ist leicht zu sehen, daß . und ||| . ||| Normen sind; z.B. sieht man die Dreiecksungleichung f¨ ur ||| . ||| so: |||x + y||| = x + y ∞ + (x + y) ∞ = x + y ∞ + x + y ∞ ≤ x ∞ + y ∞ + x ∞ + y ∞ = |||x||| + |||y|||. Außerdem sieht man sofort die Ungleichung x ≤ |||x||| ≤ 2 x
∀x ∈ C 1 [a, b];
(I.1)
man sagt, . und ||| . ||| seien ¨ aquivalente“ Normen (mehr dazu in Ab” schnitt I.2). Die Ungleichung (I.1) zeigt, daß eine Folge genau dann eine Cauchyfolge bzgl. . ist (bzw. konvergiert), wenn sie bzgl. ||| . ||| eine Cauchyfolge ist (bzw. konvergiert). Deshalb ist die Vollst¨andigkeit von aquivalent zur Vollst¨ andigkeit von (C 1 [a, b], ||| . |||), und Kon(C 1 [a, b], . ) ¨ vergenz bzgl. . oder ||| . ||| ist jeweils ¨ aquivalent zur gleichm¨aßigen Konvergenz sowohl der Funktionenfolge (xn ) als auch der Folge der Ableitungen
I.1
7
Beispiele normierter R¨ aume
(xn ). Ist daher (xn ) eine . - (oder ||| . |||-)Cauchyfolge, so sind (xn ) und (xn ) . ∞ -Cauchyfolgen, die wegen der Vollst¨andigkeit von C[a, b] jeweils Limiten x bzw. y besitzen. Ein bekannter Satz der Analysis besagt nun, daß dann x differenzierbar ist mit x = y. Es folgt also in der Tat x ∈ C 1 [a, b] und xn − x → 0. Wir fassen zusammen: • C 1 [a, b] ist bzgl. der Normen . und ||| . ||| ein Banachraum, jedoch nicht bzgl. der Supremumsnorm. Analoges gilt f¨ ur C r [a, b] := {x ∈ C[a, b]: x ist r-mal stetig differenzierbar}. r • C r [a, b], versehen mit der Norm |||x||| = i=0 x(i) ∞ , ist ein Banachraum. Es sollen noch R¨ aume von Funktionen mehrerer Ver¨anderlicher besprochen werden. Dazu f¨ uhren wir die Multiindexschreibweise ein. Sei Ω ⊂ Rn r offen und ϕ ∈ C (Ω), d.h., ϕ: Ω → K ist r-mal stetig differenzierbar. F¨ ur α = (α1 , . . . , αn ) ∈ Nn0 mit |α| := α1 + · · · + αn ≤ r existiert dann die partielle Ableitung ∂ α1 · · · ∂ αn Dα ϕ = α1 ϕ n ∂t1 · · · ∂tα n der Ordnung |α| und ist stetig; dabei ist die Differentiationsreihenfolge unerheblich. Sei nun Ω ⊂ Rn offen und beschr¨ankt. Man setzt ⎧ ⎫ ϕ ist r-mal stetig differenzierbar, ⎨ ⎬ ur jeden Multiindex α mit |α| ≤ r C r (Ω) = ϕ: Ω → K: und f¨ . ⎩ ⎭ kann Dα ϕ stetig auf Ω fortgesetzt werden Insbesondere ist f¨ ur |α| ≤ r die Ableitung Dα ϕ beschr¨ankt und deshalb |||ϕ||| := Dα ϕ ∞ |α|≤r
endlich. Wie im Eindimensionalen zeigt man: • C r (Ω), versehen mit der Norm ||| . |||, ist ein Banachraum. Beispiel. (e) R¨ aume holomorpher (= analytischer) Funktionen. Sei D = {z ∈ C: |z| < 1} die offene Einheitskreisscheibe in C. Wir bezeichnen mit H ∞ den Vektorraum aller beschr¨ ankten holomorphen Funktionen von D nach C. Wir k¨ onnen H ∞ mit der Supremumsnorm versehen und H ∞
8
I.
Normierte R¨ aume
als Unterraum von ∞ (D) oder C b (D) ansehen. Ein Satz der Funktionentheorie besagt, daß gleichm¨ aßige Limiten holomorpher Funktionen wieder holomorph sind; daher ist H ∞ abgeschlossen. Ein verwandter Raum ist die sog. Disk-Algebra A(D) := {f ∈ C(D): f |D ist holomorph}. Auch hier sieht man, daß A(D) in C(D) . ∞ -abgeschlossen ist. Also erh¨ alt man • H ∞ und A(D) sind mit der Supremumsnorm Banachr¨aume. Dieses Resultat steht in schroffem Gegensatz zu Beispiel (d), wo wir gesehen haben, daß der Raum C 1 der reell-differenzierbaren Funktionen bzgl. . ∞ nicht vollst¨ andig ist. Beispiel. (f) Die Folgenr¨ aume d, c0 , c, ∞ . Wir betrachten die Vektorr¨ aume d = {(tn ): tn ∈ K, tn = 0 f¨ ur h¨ ochstens endlich viele n} c0 = {(tn ): tn ∈ K, limn→∞ tn = 0} c = {(tn ): tn ∈ K, (tn ) konvergiert} ∞ = ∞ (N) = {(tn ): tn ∈ K, (tn ) beschr¨ankt} und verwenden jeweils die Supremumsnorm (tn ) ∞ = sup |tn |. n∈N
(Der Raum d der abbrechenden Folgen kann als diskretes Analogon zu dem sp¨ ater zu diskutierenden Raum D der Testfunktionen“ angesehen werden.) ” F¨ ur diese Vektorr¨ aume gilt d ⊂ c0 ⊂ c ⊂ ∞ . Dabei sind c0 und c in ∞ abgeschlossen, nicht jedoch d. Um das zu beweisen, m¨ ussen wir Folgen von Folgen betrachten; die Verwendung von Doppelindizes ist also unvermeidlich. Sei nun (xn ) eine ur ein x ∈ ∞ . Wir haben x ∈ c zu Folge in c, und es gelte xn − x ∞ → 0 f¨ ε zeigen und verwenden dazu ein 3 -Argument wie auf S. 5. Wir schreiben (n) (n) xn = t(n) m m∈N , x = (tm )m∈N , t∞ = lim tm . m→∞
(n) Wegen |limm→∞ sm | ≤ (sm ) ∞ f¨ ur (sm ) ∈ c ist t∞ n∈N eine Cauchyfolge in K (denn (xn ) ist eine Cauchyfolge in c). Folglich existiert t∞ := (n) ugt es, limm→∞ tm = t∞ zu beweisen. limn→∞ t∞ . Um x ∈ c zu zeigen, gen¨ Zum Beweis hierf¨ ur w¨ ahle zu ε > 0 eine nat¨ urliche Zahl N mit ε ε ) xN − x ∞ ≤ , |t(N ∞ − t∞ | ≤ . 3 3
I.1
9
Beispiele normierter R¨ aume
Dann bestimme m0 ∈ N mit m ≥ m0
) (N ) ⇒ |t(N m − t∞ | ≤
ε . 3
Folglich ist f¨ ur m ≥ m0 ) (N ) (N ) (N ) |tm − t∞ | ≤ |tm − t(N m | + |tm − t∞ | + |t∞ − t∞ | ε ε ≤ ε. ≤ xN − x ∞ + + 3 3
Jetzt zur Abgeschlossenheit von c0 . Gelte wieder xn − x ∞ → 0 f¨ ur ein x ∈ ∞ . Nach dem bereits Bewiesenen ist x ∈ c, d.h., in den obigen Bezeichnungen existiert t∞ = limm→∞ tm , und es ist t∞ = 0 zu zeigen. Das (n) ist jedoch im obigen Beweis schon geschehen, denn t∞ = limn→∞ t∞ = 0, da xn ∈ c0 . Betrachten wir zum Schluß d. Daß d nicht abgeschlossen ist, kann man so sehen: Zu n ∈ N setze 1 xn = (1, 12 , . . . , n1 , 0, 0, . . .), x = (1, 12 , . . . , n1 , n+1 , . . .) = ( n1 )n∈N .
Dann gilt xn ∈ d, xn − x ∞ = Zusammengefaßt gilt:
1 n+1
→ 0, aber x ∈ / d.
• Die Folgenr¨aume c0 , c und ∞ sind bzgl. der Supremumsnorm Banachr¨aume, d ist kein Banachraum. ¨ Ubrigens ist c0 nichts anderes als der Raum C0 (N) aus Beispiel (c). Wir behandeln jetzt von der Supremumsnorm wesentlich verschiedene Normen. Beispiel. (g) Die Folgenr¨ aume p (1 ≤ p < ∞). Man setzt
p
=
(tn ): tn ∈ K,
∞
|tn | < ∞ p
n=1
sowie f¨ ur x = (tn ) ∈ p x p =
∞
1/p |tn |p
;
n=1
dabei sei 1 ≤ p < ∞ (diese Einschr¨ ankung ist wesentlich, um zu zeigen, daß . p tats¨ achlich eine Norm ist). Wir werden sehen, daß (p , . p ) ein Banachraum ist.
10
I.
Normierte R¨ aume
F¨ urs erste ist jedoch nicht einmal klar, daß p u ¨ berhaupt ein Vektorraum ist! Zum Beweis dieser Tatsache seien x = (sn ) und y = (tn ) zwei p -Folgen. Dann ist ∞
|sn + tn |p ≤
n=1
≤
∞ p |sn | + |tn | n=1 ∞
p 2 max{|sn |, |tn |}
n=1 ∞ p
max{|sn |p , |tn |p }
= 2
≤ 2p
n=1 ∞
|sn |p + |tn |p
n=1
= 2
p
∞
|sn | + p
n=1
∞
|tn |
p
,
n=1
also x + y ∈ p . Daß mit λ ∈ K und x ∈ p auch λx ∈ p ist, ist klar; mithin ist p ein Vektorraum. Als n¨ achstes weisen wir die Normeigenschaften f¨ ur . p nach. Hier macht (außer im Fall p = 1) die Dreiecksungleichung Schwierigkeiten. Wir beweisen zuerst eine wichtige Ungleichung. F¨ ur zwei Folgen x = (sn ) und y = (tn ) setzen wir dabei xy = (sn tn ). Satz I.1.4 (H¨ oldersche Ungleichung, Version f¨ ur Folgen) 1 ∞ 1 (a) F¨ ur x ∈ und y ∈ ist xy ∈ , und es gilt xy 1 ≤ x 1 y ∞ . p (also (b) Sei 1 < p < ∞ und q = p−1 q 1 y ∈ ist xy ∈ , und es gilt
1 p
+
1 q
= 1). F¨ ur x ∈ p und
xy 1 ≤ x p y q . Man kann beide Teile gleichzeitig formulieren, indem man f¨ ur p = 1 den konjugierten Exponenten“ q = ∞ definiert; auf diese Weise erscheint ” ur den Raum der beschr¨ankten Folgen nat¨ urlich. (Ein die Bezeichnung ∞ f¨ weiteres Indiz daf¨ ur: Es gilt limp→∞ x p = x ∞ , siehe Aufgabe I.4.11.) Beweis. (a) ist trivial. Um (b) zu beweisen, erinnern wir zun¨achst an die gewichtete Ungleichung vom geometrischen und arithmetischen Mittel“: ” σ r τ 1−r ≤ rσ + (1 − r)τ
∀σ, τ ≥ 0, 0 < r < 1
(I.2)
I.1
11
Beispiele normierter R¨ aume
[Beweis hierf¨ ur: Die Behauptung ist klar, falls σ = 0 oder τ = 0. F¨ ur σ, τ > 0 ist sie jedoch ¨ aquivalent zur Konkavit¨at der Logarithmusfunktion: log(σ r τ 1−r ) = r log σ + (1 − r) log τ ≤ log rσ + (1 − r)τ
log τ log(rσ+(1−r)τ ) r log σ+(1−r) log τ σ rσ+(1−r)τ
τ
log σ
Eine C 2 -Funktion f ist aber genau dann konkav, wenn f ≤ 0 gilt; und die zweite Ableitung von log ist t → −t−2 , also in der Tat negativ.] Zum Beweis der H¨ olderschen Ungleichung setzen wir zur Abk¨ urzung A = x pp , B = y qq . O.E. darf A, B > 0 angenommen werden (sonst ist nichts zu zeigen). Wir schreiben nun x = (sn ), y = (tn ) und setzen in (I.2) bei beliebigem n ∈ N r=
1 |sn |p |tn |q 1 , also 1 − r = , σ = , τ= p q A B
und erhalten
|sn |p A
1/p
|tn |q B
1/q ≤
1 |tn |q 1 |sn |p + . p A q B
Summieren u ¨ ber n liefert |sn tn | 1 |tn |q 1 1 1 |sn |p + = + = 1. ≤ p A q B p q A1/p B 1/q Folglich gilt xy 1 =
|sn tn | ≤ A1/p B 1/q = x p y q .
2
Als Korollar erhalten wir die Dreiecksungleichung f¨ ur . p , die einen eigenen Namen tr¨ agt.
12
I.
Normierte R¨ aume
Korollar I.1.5 (Minkowskische Ungleichung, Version f¨ ur Folgen) F¨ ur x, y ∈ p , 1 ≤ p < ∞, gilt x + y p ≤ x p + y p . Beweis. Der Fall p = 1 ist trivial, daher nehmen wir p > 1 an. Statt der Minkowskischen zeigen wir die dazu ¨ aquivalente Ungleichung x + y pp ≤ ( x p + y p ) x + y p−1 . p 1 p
Wir schreiben wieder x = (sn ), y = (tn ). Dann gilt mit H¨ olderschen Ungleichung x + y pp = ≤
∞ n=1 ∞
|sn | |sn + tn |p−1 +
∞
|sn |
p
n=1
+
1/p ∞
∞
= 1 nach der
=
|tn | |sn + tn |p−1
n=1
q |sn + tn |p−1
1/q
|sn + tn |p−1
|tn |
= ( x p + y p ) x + 1 q
∞
n=1 1/p ∞ p
n=1
denn (p − 1)q = p und
1 q
|sn + tn |p
n=1
≤
+
q
1/q
n=1 p−1 y p ,
2
p−1 p .
Da λx p = |λ| x p und x p = 0 ⇔ x = 0 offensichtlich gelten, ist (p , . p ) ein normierter Raum. Wir beweisen jetzt die Vollst¨andigkeit von ¨ p . Ahnlich wie im Fall ∞ versucht man, die Vollst¨andigkeit von K an entscheidender Stelle im Beweis heranzuziehen. (n) ur Sei (xn ) eine Cauchyfolge in p . Wir schreiben xn = tm m∈N . Da f¨ alle x = (tm ) ∈ p und alle m ∈ N die Ungleichung |tm | ≤ x p gilt, sind (n) (n) bei beliebigem m die tm n∈N skalare Cauchyfolgen. Sei tm = limn→∞ tm p und x = (tm )m∈N . Es ist nun noch x ∈ und xn − x p → 0 nachzuweisen. Zu ε > 0 w¨ ahle N = N (ε) mit xn − xn p ≤ ε
∀n, n ≥ N.
Insbesondere folgt f¨ ur alle M ∈ N M
(n) p ) tm − t(n m
m=1
1/p ≤ xn − xn p ≤ ε
∀n, n ≥ N.
I.1
13
Beispiele normierter R¨ aume
Mache nun den Grenz¨ ubergang n → ∞, um f¨ ur alle M ∈ N, n ≥ N M
(n) tm − tm p
1/p ≤ε
m=1
zu erhalten. Da M beliebig war, impliziert das ∞
(n) t − tm p
1/p
m
≤ε
∀n ≥ N,
m=1
und daraus folgt zun¨ achst x − xN ∈ p und deshalb x = (x − xN ) + xN ∈ p sowie xn − x p → 0. Zusammengefaßt gilt: • (p , . p ) ist f¨ ur 1 ≤ p < ∞ ein Banachraum. Man kann nat¨ urlich die p -Normen auch auf dem endlichdimensionalen n uhren; so normiert, wird Kn mit p (n) bezeichnet. Raum K einf¨ Beispiel. (h) Die Lp -R¨ aume (1 ≤ p < ∞). Bei dem Versuch, analog zu den p -Folgenr¨ aumen Banachr¨aume integrierbarer Funktionen zu definieren, st¨ oßt man auf große Schwierigkeiten. Wir werden sie jedoch alle in diesem Abschnitt u ¨ berwinden. b Betrachte zun¨ achst auf C[a, b] die Norm f 1 = a |f (t)| dt. In dieser Norm ist C[a, b] nicht vollst¨ andig. O.E. nehmen wir a = 0, b = 2 an und setzen fn (t) = tn f¨ ur 0 ≤ t ≤ 1, fn (t) = 1 f¨ ur 1 < t ≤ 2. Dann ist (fn ) eine ur n ≥ m ist Cauchyfolge in C[0, 2] bzgl. . 1 , denn f¨
1
fn − fm 1 =
(tm − tn ) dt ≤ 0
1 . m+1
Die Folge (fn ) scheint nun gegen f , definiert durch f (t) = 0 f¨ ur 0 ≤ t < 1, f (t) = 1 f¨ ur 1 ≤ t ≤ 2 zu konvergieren, und f ist nicht stetig. (In der 2 1 → 0.) Mit dem gleichen Recht k¨onnte Tat ist 0 |fn (t) − f (t)| dt = n+1 ˜ ˜ man f mit f (t) = 0 f¨ ur 0 ≤ t ≤ 1, f˜(t) = 1 f¨ ur 1 < t ≤ 2 als (freilich ebenfalls unstetigen) Limes von (fn ) ansehen. K¨onnte man vielleicht doch einen Limes in C[0, 2] finden, wenn man nur lange genug sucht? Wir werden uns u oglich ist. ¨ berlegen, daß das nicht m¨ Zun¨ achst k¨ onnte man . 1 auf R[0, 2], dem Raum der Riemann-integrierbaren Funktionen, betrachten. Dort definiert . 1 aber nur noch eine Halbnorm, so daß konvergente Folgen keinen eindeutig bestimmten Limes mehr besitzen. (Oben hatten wir f und f˜ als Limiten von (fn ) ausgemacht!)
14
I.
Normierte R¨ aume
Wir betrachten deshalb die lineare H¨ ulle von {f } und C[0, 2] und bezeichnen diesen Untervektorraum von R[0, 2] mit X. Auf X ist . 1 aber eine Norm: Seien n¨ amlich g ∈ C[0, 2] und λ ∈ K mit g + λf 1 = 0. Dann ist 1 2 |g(t)| dt = 0 = |g(t) + λ| dt. 0
1
Wegen der Stetigkeit von g folgt nun g(t) = 0 f¨ ur 0 ≤ t ≤ 1 und g(t) = −λ f¨ ur 1 ≤ t ≤ 2. Also ist λ = 0 und g = 0. Jetzt schließen wir, daß C[0, 2] kein bzgl. . 1 abgeschlossener Unterraum des normierten Raums X ist (in der Tat hat die Folge (fn ) den in X eindeutig bestimmten Grenzwert f∈ / C[0, 2]), und erhalten mit Lemma I.1.3(b): • C[0, 2] (und allgemeiner C[a, b]) ist bez¨ uglich . 1 kein Banachraum. Man k¨ onnte nun abstrakt die Vervollst¨ andigung definieren (vgl. S. 3), das liefert jedoch wenig Aufschluß u ¨ ber die konkrete Gestalt des so erhaltenen Banachraums. Z.B. ist nicht klar, ob dessen Elemente als Funktionen aufgefaßt werden k¨ onnen, und wenn ja, als welche. Eine andere Idee w¨ are es, . 1 auf R[a, b] zu definieren, evtl. auch uneigentlich Riemannintegrierbare Funktionen zuzulassen. Wie bereits festgestellt, erh¨alt man so nur einen halbnormierten Raum. Schlimmer noch: die gew¨ unschte Vollst¨ andigkeit stellt sich immer noch nicht ein. (Der erstgenannte Defekt l¨aßt sich in der Tat auch bei dem jetzt vorzustellenden Weg nicht vermeiden.) Man muß sich also etwas g¨ anzlich Neues einfallen lassen. Die wesentliche Neuerung besteht darin, die Lebesguesche Integrationstheorie zu verwenden, deren Grundz¨ uge im Anhang A dargestellt sind. Wir betrachten zun¨achst ein Intervall I ⊂ R, das offen, halboffen oder abgeschlossen, beschr¨ ankt oder unbeschr¨ ankt sein darf, die σ-Algebra Σ der Borelmengen und das Lebesguemaß λ. F¨ ur 1 ≤ p < ∞ setzt man (beachte: wenn f meßbar ist, ist |f |p meßbar) p p |f | dλ < ∞ , L (I) = f : I → K: f meßbar, f ∗p =
1/p |f |p dλ I
I
f¨ ur f ∈ L p (I).
(Wer m¨ ochte, kann das Symbol f dλ durch das traditionellere f (t) dt ersetzen; das wird im Laufe des Texts des ¨ ofteren geschehen.) Wir werden andiger halbnormierter Raum ist. Genau wie zeigen, daß L p (I) ein vollst¨ im Fall der p -R¨ aume wird zuerst begr¨ undet, daß L p (I) ein Vektorraum ist (das ist ja nicht offensichtlich), anschließend werden die H¨oldersche und die Minkowskische Ungleichung gezeigt und zum Schluß die Vollst¨andigkeit von L p (I) bewiesen.
I.1
15
Beispiele normierter R¨ aume
Seien also f, g ∈ L p (I). Dann ist f +g als Summe meßbarer Funktionen selbst meßbar. Außerdem gilt p p |f | + |g| dλ |f + g| dλ ≤ I I p 2 max{|f (t)|, |g(t)|} dt ≤ I p = 2 max |f (t)|p , |g(t)|p dt I p ≤ 2 |f (t)|p + |g(t)|p dt I p = 2 |f |p dλ + |g|p dλ < ∞ I
I
Damit ist f + g ∈ L (I). Schließlich ist trivialerweise αf ∈ L p (I) f¨ ur alle α ∈ K, und L p (I) ist ein Vektorraum. Als n¨ achstes zeigen wir die H¨ oldersche Ungleichung im Kontext der Funktionenr¨ aume; wie im Fall von p werden wir daraus die Dreiecksungleichung f¨ ur . ∗p ableiten. p
Satz I.1.6 (H¨ oldersche Ungleichung, Version f¨ ur L p (I)) p 1 1 ur f ∈ L p (I) und g ∈ L q (I) Sei 1 < p < ∞ und q = p−1 , also p + q = 1. F¨ ist f g ∈ L 1 (I), und es gilt f g ∗1 ≤ f ∗p g ∗q .
p Beweis. Wir verwenden wieder (I.2), vgl. S. 10. Setze A = f ∗p , B = q ankung A, B > 0 an. (Ist etwa A = 0, so g ∗q , und nimm ohne Einschr¨ ist f = 0 fast u ¨ berall und deshalb auch f g = 0 fast u ¨ berall.) Sei t ∈ I beliebig. Dann folgt aus (I.2) mit r = 1p
|f (t)|p A
1/p
|g(t)|q B
1/q ≤
1 |g(t)|q 1 |f (t)|p + , p A q B
und Integration liefert (wie die Summation im Beweis von Satz I.1.4) die Behauptung. 2 Korollar I.1.7 (Minkowskische Ungleichung, Version f¨ ur L p (I)) p F¨ ur 1 ≤ p < ∞ und f, g ∈ L (I) gilt f + g ∗p ≤ f ∗p + g ∗p . Beweis. Der Fall p = 1 ist trivial, und f¨ ur p > 1 gilt mit der H¨ olderschen Ungleichung ∗ p = |f (t) + g(t)|p dt f + g p I
1 p
+
1 q
= 1 wegen
16
I.
Normierte R¨ aume
|f (t)| |f (t) + g(t)|p−1 dt I + |g(t)| |f (t) + g(t)|p−1 dt I p−1 ∗ ∗ ∗ ≤ f p |f + g| q + g ∗p |f + g|p−1 q p−1 = f ∗p + g ∗p f + g ∗p , ≤
woraus die Behauptung folgt.
2
Im Gegensatz zu den p -R¨ aumen ist . ∗p auf L p (I) nur eine Halbnorm, ∗ denn f p = 0 ⇔ f = 0 fast u ¨ berall. (Dazu sp¨ater mehr.) Als n¨achstes wird die Vollst¨ andigkeit von L p (I) gezeigt; dabei verwenden wir die Begriffe vollst¨ andig“ und Cauchyfolge“ wie f¨ ur normierte R¨aume. ” ” urde man eine Cauchyfolge Wollte man analog zum p -Fall vorgehen, w¨ (fn ) in L p (I) und anschließend f¨ ur festes t ∈ I die skalare Folge fn (t) betrachten. Im allgemeinen braucht fn (t) jedoch nicht zu konvergieren, und man muß einen anderen Weg einschlagen. Das folgende Lemma wird von Nutzen sein. Lemma I.1.8 F¨ ur einen halbnormierten Raum (X, . ) sind ¨aquivalent: (i) X ist vollst¨andig. (ii) Jede absolut konvergente Reihe konvergiert. (Ausf¨ uhrlich: F¨ ur jede Folge in X mit ∞ xn < ∞ existiert ein Element x ∈ X mit n=1 N limN →∞ x − n=1 xn = 0.) N Beweis. (i) ⇒ (ii): Das ist klar, denn ( n=1 xn )N ∈N ist eine Cauchyfolge. (ii) ⇒ (i): Sei (xn ) eine Cauchyfolge. W¨ahle zu εk = 2−k ein Nk ∈ N mit ∀n, m ≥ Nk . xn − xm ≤ 2−k Daraus ergibt sich die Existenz einer Teilfolge (xnk )k∈N mit ∀k ∈ N. xnk+1 − xnk ≤ 2−k F¨ ur yk = xnk+1 − xnk ist also k yk < ∞. Nach (ii) existiert y ∈ X mit (Teleskopsumme!) K yk = y − (xnK+1 − xn1 ) → 0 f¨ ur K → ∞. y − k=1
Eine Teilfolge von (xn ) konvergiert daher. Da eine Cauchyfolge, die eine konvergente Teilfolge besitzt, selbst konvergiert (Beweis?), folgt die Konandig. 2 vergenz von (xn ), und der Beweis ist vollst¨ Beweis der Vollst¨ andigkeit von L p (I): ∞ Wir benutzen Lemma I.1.8. Seien f1 , f2 , . . . ∈ L p (I) mit a := n=1 fn ∗p
I.1
17
Beispiele normierter R¨ aume
< ∞. Betrachte die (evtl. ∞-wertige) nichtnegative Funktion t → g(t) = ∞ (t)|. Als Summe meßbarer Funktionen ist g meßbar. Ferner sei i=1 |fi n gn (t) = i=1 |fi (t)|. Es folgt dann gn ∈ L p (I), da L p (I) ein Vektorraum ist, sowie n gn ∗p ≤ fi ∗p ≤ a < ∞ i=1
wegen der Minkowskischen Ungleichung. Nach Konstruktion konvergiert ( gnp ) monoton gegen gp ; der Satz von Beppo Levi (Satz A.3.1) liefert daher p g dλ = lim gnp dλ ≤ ap . n→∞
I
I
Insbesondere ist g p (und daher auch g) fast u ¨ berall endlich; d.h., nach Ab¨ anderung von g auf einer Nullmenge N ∈ Σ erh¨alt man eine reellwertige meßbare Funktion g mit g(t) =
∞
|fi (t)| fast u ¨ berall
i=1
(n¨ amlich f¨ ur t ∈ I \ N ). Es folgt (jetzt geht die Vollst¨andigkeit von K ein!), daß ∞ f (t) := fi (t) f¨ ur t ∈ /N i=1
existiert. Setzt man noch f (t) = 0 f¨ ur t ∈ N , so hat man ∞ eine meßbare p (I) und Funktion f : I → K definiert. Es bleibt f ∈ L i=1 fi = f bzgl. p ∞ ∗ ur n → ∞, zu zeigen. . p , d.h. I i=n fi dλ → 0 f¨ Nach Konstruktion ist |f | ≤ g, also (s.o.) |f |p dλ ≤ g p dλ < ∞, I
I
∞
benutzen folglich f ∈ L (I). Um schließlich n=1 fn = f zu zeigen, ∞ p wir den Lebesgueschen Konvergenzsatz (Satz A.3.2): Sei hn = i=n fi ; dann gilt hn → 0 fast u ¨ berall und p ∞ 0 ≤ hn ≤ |fi | ≤ gp. p
i=n
Wegen I gp dλ ≤ ap ist g p integrierbar. Also impliziert der Lebesguesche Konvergenzsatz hn dλ → 0, I
was zu zeigen war.
18
I.
Normierte R¨ aume
L p (I) ist damit als vollst¨ andiger halbnormierter Raum ausgewiesen. Limiten sind in diesem Raum nicht mehr eindeutig bestimmt, sondern nur ∗ noch modulo Elementen des Kerns der Halbnorm . p , n¨amlich Np = {f : f = 0 fast u ¨ berall}. (Beachte, daß Np in Wirklichkeit gar nicht von p abh¨ angt!) Es liegt daher nahe, Funktionen zu identifizieren, die fast u ¨berall u ¨ bereinstimmen. Das angemessene mathematische Verfahren besteht darin, ¨ statt Funktionen f ihre Aquivalenzklassen [f ] in dem zugeh¨origen Quotientenvektorraum Lp (I) := L p (I)/Np zu betrachten. Dieses Verfahren schildert das folgende Lemma. ∗
Lemma I.1.9 (X, . ) sei ein halbnormierter Raum. (a) N := {x: x ∗ = 0} ist ein Untervektorraum von X. (b) [x] := x ∗ definiert eine Norm auf X/N . (c) Ist X vollst¨andig, so ist X/N ein Banachraum. Beweis. (a) ist trivial. (b) Zun¨ achst mache man sich klar, daß [x] = x ∗ wohldefiniert ist, ¨ d.h. nicht vom Repr¨ asentanten der Aquivalenzklasse [x] abh¨angt. Homogenit¨ at und Dreiecksungleichung folgen dann unmittelbar aus den entsprechenden Eigenschaften von . ∗ . Schließlich gilt [x] = 0 ⇔ x ∈ N ⇔ [x] = [0]. (c) Bemerke nur: Bildet die Folge der Klassen [xn ] eine Cauchy- bzw. konvergente Folge, so gilt dies auch f¨ ur die Folge (xn ) der Repr¨asentanten – und umgekehrt. 2 Die Quotientennorm auf Lp (I) bezeichnen wir mit . p (endlich kann das Sternchen verschwinden) oder mit . Lp . Insgesamt haben wir gezeigt: ur p ≥ 1. • Die R¨aume Lp (I), . p sind Banachr¨aume f¨ Obwohl die Lp -R¨ aume eigentlich keine R¨ aume von Funktionen, sondern ¨ von Aquivalenzklassen von Funktionen sind, behandelt man ihre Elemente, als w¨ aren es Funktionen. Man schreibt also f ∈ Lp statt [f ] ∈ Lp usw. In der auf. Beispielsweise ist f → Regel treten dadurch keine Komplikationen 1 f dλ eine wohldefinierte Abbildung auf L (I), nicht jedoch f → f (t0 ). I p Ferner brauchen die Repr¨ asentanten der f ∈ L nur fast u ¨ berall definiert √ zu sein; in diesem Sinn ist etwa t → 1/ t in L1 [0, 1]. aume u ur das LebesgueWir haben oben die Lp -R¨ ¨ber reellen Intervallen f¨ maß betrachtet; alles ließe sich genauso f¨ ur meßbare Teilmengen Ω ⊂ Rn (mit der entsprechenden Borel-σ-Algebra und dem n-dimensionalen Lebesguemaß) durchf¨ uhren. Noch allgemeiner k¨onnen beliebige Maßr¨aume (Ω, Σ, μ) behandelt werden. Die entstehenden Lp -R¨aume werden mit dem urzer mit Lp (μ) bezeichnet. Die Notation Lp geht Symbol Lp (Ω, Σ, μ) oder k¨ auf Riesz zur¨ uck (siehe Abschnitt I.5); L erinnert hier an Lebesgue und p an Potenz oder puissance. Jedesmal gilt:
I.1
19
Beispiele normierter R¨ aume
• Die R¨aume Lp (μ), . p sind Banachr¨aume f¨ ur p ≥ 1. Im Fall Ω = N, Σ = Potenzmenge von N, μ = z¨ahlendes Maß erh¨alt man u ¨ brigens Lp (Ω, Σ, μ) = p . Von besonderer Bedeutung sind die R¨ aume L2 (μ); sie sind sogenannte Hilbertr¨aume und werden in Kapitel V detailliert untersucht. Beispiel. (i) Die L∞ -R¨ aume. Der Anschaulichkeit halber f¨ uhren wir zun¨ achst L∞ (I) f¨ ur ein Intervall I, ∞ sp¨ ater L (μ) f¨ ur beliebige Maßr¨ aume ein. Vergleicht man die H¨ olderschen Ungleichungen in den S¨atzen I.1.4 und I.1.6, so f¨ allt auf, daß der Fall p = 1 in der Integralversion noch nicht behandelt wurde. Der Grund ist, daß der entsprechende Raum beschr¨ankter Funktionen auf I noch nicht eingef¨ uhrt wurde. (Der Raum ∞ (I) ist dazu nicht angemessen.) Man setzt f meßbar, L ∞ (I) = f : I → K: , ∃N ∈ Σ, λ(N ) = 0: f |I\N beschr¨ankt f ∗L∞ =
inf
sup |f (t)| =
N ∈Σ t∈I\N λ(N )=0
inf
N ∈Σ λ(N )=0
f |I\N ∞ .
Es ist klar, daß f ∗L∞ < ∞ f¨ ur f ∈ L ∞ (I) gilt. Es ist diesmal recht leicht ∗ ∞ zu sehen, daß L (I) ein Vektorraum und . L∞ eine Halbnorm ist. Zum Beweis bemerken wir zuerst, daß es zu f ∈ L ∞ (I) eine meßbare Nullmenge N = N (f ) mit f ∗L∞ = f |I\N ∞ gibt. Denn zu r ∈ N w¨ahle eine Nullmenge Nr mit f |I\Nr ∞ ≤ f ∗L∞ + 1r . N := r Nr ist dann eine meßbare Nullmenge, und es gilt f ∗L∞ ≤ f |I\N ∞ ≤ f |I\Nr ∞ ≤ f ∗L∞ +
1 r
f¨ ur alle r ∈ N, also leistet N das Geforderte. Sind nun f1 , f2 ∈ L ∞ (I) und dazu N1 und N2 nach der Vorbemerkung gew¨ ahlt, so folgt f1 + f2 ∗L∞ ≤ (f1 + f2 )|I\(N1 ∪N2 ) ∞ ≤ f1 |I\(N1 ∪N2 ) ∞ + f2 |I\(N1 ∪N2 ) ∞ ≤ f1 |I\N1 ∞ + f2 |I\N2 ∞ = f1 ∗L∞ + f2 ∗L∞ . Die u ¨ brigen behaupteten Eigenschaften sind klar. Als n¨ achstes wird die Vollst¨ andigkeit von L ∞ (I) gezeigt. Sei (fn ) eine ∞ Cauchyfolge in L (I). Nach der obigen Bemerkung k¨onnen wir meßbare Nullmengen Nn,m mit fn − fm ∗L∞ = (fn − fm )|I\Nn,m ∞
20
I.
Normierte R¨ aume
∞ w¨ ahlen. Sei N = n,m=1 Nn,m . Da N × N abz¨ahlbar ist, ist auch N eine meßbare Nullmenge, und es gilt fn − fm ∗L∞ = (fn − fm )|I\N ∞ . Deshalb ist fn |I\N eine . ∞ -Cauchyfolge im Banachraum ∞ (I \ N ), ergo konvergent, etwa gegen g. Setzt man noch f (t) = g(t) f¨ ur t ∈ / N, f (t) = 0 f¨ ur t ∈ N , so ist f meßbar und beschr¨ankt (als gleichm¨aßiger Limes der meßbaren und beschr¨ ankten Funktionen fn χI\N , wo χA (t) = 1 f¨ ur t ∈ A, χA (t) = 0 f¨ ur t ∈ / A), und es gilt fn − f ∗L∞ ≤ (fn − f )|I\N ∞ → 0. Wie bei den Lp -R¨ aumen geht man nun zum normierten Quotienten L∞ (I) := L ∞ (I)/N∞ ∗
nach dem Kern N∞ der Halbnorm . L∞ u ¨ber; wieder besteht dieser Kern aus den meßbaren Funktionen, die fast u ¨berall verschwinden. Die entsprechende Norm werde mit . L∞ bezeichnet, sie heißt wesentliche Supremumsnorm. Die Elemente von L∞ (I) werden wir im allgemeinen wieder ¨ als Funktionen (statt als Aquivalenzklassen von Funktionen, wie es eigentlich korrekt w¨ are) ansehen, die bzgl. fast u ¨ berall bestehender Gleichheit identifiziert werden. Zusammengefaßt ist gezeigt: • L∞ (I), versehen mit der wesentlichen Supremumsnorm, ist ein Banachraum. Statt des Lebesguemaßes auf I h¨ atte auch das n-dimensionale Lebesguemaß auf einem Gebiet Ω ⊂ Rn oder ein abstrakter Maßraum (Ω, Σ, μ) behandelt werden k¨ onnen; auch dann gilt: • L∞ (μ), versehen mit der wesentlichen Supremumsnorm, ist ein Banachraum. Wir bringen nun noch die abschließende Version der H¨olderschen Ungleichung; der Spezialfall p = q = 2 wird Cauchy-Schwarz-Ungleichung genannt. Satz I.1.10 (H¨ oldersche Ungleichung, allgemeine Version) 1 = 0). (Ω, Σ, μ) Sei 1 ≤ p ≤ ∞ und sei 1p + 1q = 1 (mit der Konvention ∞ p q sei ein Maßraum, und es seien f ∈ L (μ), g ∈ L (μ). Dann ist f g ∈ L1 (μ), und es gilt f g L1 ≤ f Lp g Lq .
I.1
21
Beispiele normierter R¨ aume
Beweis. Der Fall 1 < p < ∞ ist im wesentlichen (n¨amlich f¨ ur Ω = I) in Satz I.1.6 behandelt worden. Wir betrachten nun p = 1, q = ∞; der Fall p = ∞, q = 1 ist nat¨ urlich dazu symmetrisch. f und g k¨onnen als meßbare Funktionen angesehen werden, so daß f g jedenfalls meßbar ist. Es folgt f¨ ur alle Nullmengen N |f g| dμ = |f | |g| dμ Ω Ω\N |f | dμ sup |g(t)| ≤ t∈N / Ω\N = |f | dμ g |Ω\N ∞ . Ω
Nach Definition der L∞ -Norm heißt das aber f g L1 ≤ f L1 g L∞ .
2
Beispiel. (j) R¨ aume von Maßen. Ist T eine Menge und Σ eine σ-Algebra auf T , so heißt eine Abbildung μ: Σ → R (bzw. C) signiertes bzw. komplexes Maß, falls f¨ ur jede Folge paarweiser disjunkter Ai ∈ Σ ∞ ∞ μ Ai = μ(Ai ) i=1
(I.3)
i=1
gilt. Hier wird also nicht μ(A) ≥ 0 gefordert. Da μ nur endliche Werte annimmt (nicht aber +∞ oder −∞), folgt μ(∅) = 0, denn μ(∅) = μ(∅ ∪ ∅ ∪ . . .) = μ(∅) + μ(∅) + · · ·. In diesem Beispiel werden wir kurz Maß statt signiertes oder komplexes Maß sagen. (Vergleiche zu diesen Begriffen auch Anhang A.4.) Beispiele f¨ ur Maße sind die Punktmaße μ = λ1 δt1 +· · ·+λn δtn , wo ti ∈ T und λi ∈ K. (Zur Erinnerung: δt (A) = 1, falls t ∈ A, und δt (A) = 0 sonst.) Weitere Beispiele Maße auf R, das sind Maße der sind die absolutstetigen Form μ(A) = A f (t) dt f¨ ur ein f ∈ L1 (R). Da Summen und Vielfache von Maßen wieder Maße sind, tr¨ agt die Menge M (T, Σ) aller Maße auf Σ die Struktur eines Vektorraums. Ist T ein metrischer (oder topologischer Raum), wird in der Regel die von den offenen Mengen erzeugte σ-Algebra, die sog. Borel-σ-Algebra, betrachtet. Jedem Maß μ wird durch die Vorschrift |μ(E)|, |μ|(A) = sup Z E∈Z
22
I.
Normierte R¨ aume
wobei das Supremum u ¨ ber alle Zerlegungen von A in endlich viele paarweise disjunkte Mengen aus Σ zu bilden ist, ein positives Maß |μ| zugeordnet, die sog. Variation von μ. Man kann außerdem zeigen, daß |μ|(T ) < ∞ ist (siehe z.B. Rudin [1986], S. 117). Im Beispiel der Punktmaße ist |μ| = |λ1 |δt1 + · · · + |λn |δtn , wenn die δtj verschieden sind, und im Beispiel der absolutstetigen Maße ist |μ|(A) = A |f (t)| dt. Nun assoziieren wir zu einem Maß μ seine Variationsnorm μ = |μ|(T ) und behaupten: • M (T, Σ), versehen mit der Variationsnorm, ist ein Banachraum. Von den Normeigenschaften von . ist nur die Dreiecksungleichung nicht ganz offensichtlich. Seien μ1 , μ2 ∈ M (T, Σ), und sei Z eine Zerlegung von T , wie oben beschrieben. Dann ist (μ1 + μ2 )(E) ≤ μ1 (E) + μ2 (E) ≤ μ1 + μ2 . E∈Z
E∈Z
E∈Z
Wenn man jetzt das Supremum u ¨ ber alle Z nimmt, erh¨alt man μ1 +μ2 ≤ μ1 + μ2 . Nun zur Vollst¨ andigkeit. Sei (μn ) eine Cauchyfolge in M (T, Σ). F¨ ur A ∈ Σ und μ ∈ M (T, Σ) gilt stets |μ(A)| ≤ μ (betrachte die Zerlegung Z = {A, T \A}). Also existiert f¨ ur alle A ∈ Σ μ(A) := lim μn (A). n→∞
Es ist klar, daß μ additiv ist, d.h. μ(A ∪ B) = μ(A) + μ(B) f¨ ur paarweise disjunkte A und B ist, und deshalb eine zu (I.3) analoge Gleichung f¨ ur endliche Folgen gilt. Sei jetzt ε > 0 vorgegeben, und sei Z = {E1 , . . . , Er } eine Zerlegung von T in paarweise disjunkte Mengen aus Σ. W¨ahle N0 = N0 (ε) mit μn − μm ≤ ε ∀n, m ≥ N0 . Alsdann w¨ ahle m = m(ε, Z ) mit m ≥ N0 und r μm (Ei ) − μ(Ei ) ≤ ε. i=1
F¨ ur n ≥ N0 ist dann r r r μn (Ei ) − μ(Ei ) ≤ μn (Ei ) − μm (Ei ) + μm (Ei ) − μ(Ei ) i=1
i=1
≤ μn − μm + ε ≤ 2ε.
i=1
23
I.2 Eigenschaften normierter R¨ aume
Akzeptiert man f¨ ur den Moment das Symbol . auch f¨ ur bloß additive Mengenfunktionen (wir haben noch nicht gezeigt, daß μ ein Maß ist), so ergibt sich jedenfalls μ < ∞ und μn − μ → 0. Es bleibt, (I.3) f¨ ur μ zu zeigen. Seien A1 , A2 , . . . ∈ Σ paarweise disjunkt, und sei ε > 0. W¨ ahle k mit μk − μ ≤ ε. Dann folgt ∞ n Ai − μ(Ai ) = μ Ai μ i=1 i=1 i>n ≤ (μ − μk ) Ai + μk Ai i>n i>n ≤ μ − μk + μk (Ai ) i>n
≤ 2ε f¨ ur hinreichend großes n, da μk ein Maß ist.
I.2
Eigenschaften normierter R¨ aume
Wir beginnen mit einem einfachen Satz, der besagt, daß Addition, Skalarmultiplikation und . stetige Abbildungen auf normierten R¨aumen sind. Satz I.2.1 Sei X ein normierter Raum. (a) Aus xn → x und yn → y folgt xn + yn → x + y. (b) Aus λn → λ in K und xn → x folgt λn xn → λx. (c) Aus xn → x folgt xn → x . Beweis. W¨ ortlich wie im Endlichdimensionalen, also: (a) Klar wegen (xn + yn ) − (x + y) ≤ xn − x + yn − y → 0. (b) Klar wegen λn xn − λx ≤ λn xn − λn x + λn x − λx = |λn | xn − x + |λn − λ| x → 0. (c) Zuerst u ¨ berlegen wir, daß die umgekehrte Dreiecksungleichung gilt: x − y ≤ x − y ∀x, y ∈ X; diese folgt aus der Ungleichung x − y ≤ x − y + y − y = x − y und der dazu symmetrischen Ungleichung y − x ≤ y − x . Die umgekehrte Dreiecksungleichung impliziert sofort xn − x ≤ xn − x → 0. 2 ist eine konvergente Folge (xn ) beschr¨ankt, d.h., die Folge Insbesondere xn der Normen ist beschr¨ ankt.
24
I.
Normierte R¨ aume
Korollar I.2.2 Ist U ein Untervektorraum des normierten Raums X, so ist sein Abschluß U ebenfalls ein Untervektorraum. Beweis. Seien x, y ∈ U. Dann existieren xn , yn ∈ U mit xn → x und yn → y. Es folgt U xn + yn → x + y, ur λ ∈ K konvergiert (λxn ) gegen (λx), also liegt so daß x + y ∈ U gilt. F¨ auch λx in U . 2 1 In Beispiel (d) von Abschnitt I.1 hatten wir auf C [a, b] die beiden Normen x = max x ∞ , x ∞ und |||x||| = x ∞ + x ∞ eingef¨ uhrt und als ¨ aquivalent“ erkannt. Diesen Begriff werden wir nun eingehender ” studieren.
Definition I.2.3 Zwei Normen . und ||| . ||| auf einem Vektorraum X heißen ¨aquivalent, falls es Zahlen 0 < m ≤ M mit m x ≤ |||x||| ≤ M x
∀x ∈ X
(I.4)
gibt. Satz I.2.4 Seien . und ||| . ||| zwei Normen auf X. Dann sind folgende Aussagen ¨aquivalent: (i) . und ||| . ||| sind ¨aquivalent. (ii) Eine Folge ist bzgl. . konvergent genau dann, wenn sie es bzgl. ||| . ||| ist; außerdem stimmen die Limiten ¨ uberein. (iii) Eine Folge ist . -Nullfolge genau dann, wenn sie eine ||| . |||-Nullfolge ist. Beweis. Die Implikationen (i) ⇒ (ii) ⇒ (iii) sind klar. (iii) ⇒ (i): Nehmen wir etwa an, daß f¨ ur kein M > 0 die Ungleichung |||x||| ≤ M x f¨ ur alle x ∈ X gilt. F¨ ur jedes n ∈ N gibt es dann xn ∈ X mit |||xn ||| > n xn . Setze yn = xn /(n xn ); dann ist yn = n1 → 0, also (yn ) eine . -Nullfolge, aber |||yn ||| > 1 f¨ ur alle n, folglich (yn ) keine ||| . |||-Nullfolge, was (iii) widerspricht. Die Existenz von m zeigt man entsprechend. 2 ¨ Aquivalente Normen erzeugen also vom topologischen Standpunkt denselben metrischen Raum. Es folgt außerdem aus der Definition, daß dann (X, . ) und (X, ||| . |||) dieselben Cauchyfolgen besitzen. Daher sind die R¨ aume (X, . ) und (X, ||| . |||) entweder beide vollst¨andig oder beide unvollst¨ andig. Versieht man jedoch eine Menge T mit zwei Metriken derart, daß (T, d1 ) dieselben konvergenten Folgen wie (T, d2 ) besitzt, so brauchen diese Metriken nicht dieselben Cauchyfolgen zu besitzen. Ein Beispiel ist R mit den
I.2
25
Eigenschaften normierter R¨ aume
Metriken d1 (s, t) = |s − t|, d2 (s, t) = |arctan s − arctan t|; hier ist die Folge (n) der nat¨ urlichen Zahlen eine d2 -Cauchyfolge, und (R, d2 ) ist nicht vollst¨ andig. Dieses Gegenbeispiel wird dadurch erm¨oglicht, daß die identische Abbildung von (T, d2 ) nach (T, d1 ) zwar stetig ist, aber nicht gleichm¨aßig stetig. Hingegen impliziert (I.4), daß ||| . ||| auf (X, . ) sogar gleichm¨aßig stetig ist. Geometrisch bedeutet Definition I.2.3, daß die ||| . |||-Einheitskugel {x: 1 enth¨alt und in einer solchen vom |||x||| ≤ 1} eine . -Kugel vom Radius M 1 Radius m enthalten ist: {x: x ≤
{x: x ≤ 1/m}
1 M}
⊂ {x: |||x||| ≤ 1} ⊂ {x: x ≤
{x: |||x||| ≤ 1}
1 m }.
{x: x ≤ 1/M }
Beispiele. (a) In Beispiel I.1(d) wurde gezeigt, daß . und . ∞ auf C 1 [a, b] nicht ¨ aquivalent sind. (b) Ebensowenig sind . ∞ und . 1 auf C[0, 1] ¨aquivalent. Zwar gilt ur alle x (d.h., gleichm¨aßig konvergente die Ungleichung x 1 ≤ x ∞ f¨ Folgen konvergieren im Mittel), aber xn (t) = tn definiert eine . 1 -Nullfolge, die nicht gleichm¨ aßig konvergiert. Man k¨onnte auch argumentieren, daß C[0, 1] in der Supremumsnorm vollst¨ andig ist, bzgl. . 1 jedoch nicht. (c) Betrachte nun f¨ ur α > 0 die Norm |||x|||α = sup x(t)e−αt 0≤t≤1
aquivalent, denn es gilt auf C[0, 1]. Dann sind . ∞ und ||| . |||α ¨ |||x|||α ≤ x ∞ ≤ eα |||x|||α . ¨ Der Ubergang zu einer ¨ aquivalenten Norm gestattet es h¨aufig, Eigenschaften der gegebenen Norm zu verbessern, etwa Abbildungen zu Kontraktionen zu machen, die es urspr¨ unglich nicht waren, und so den Banachschen
26
I.
Normierte R¨ aume
Fixpunktsatz anzuwenden. Zu diesem Zweck werden die Normen des Beispiels (c) in der Theorie der gew¨ ohnlichen Differentialgleichungen verwandt. Bekanntlich sind die euklidische, die Maximums- und die Summennorm aquivalent. Tats¨ achlich gilt: auf Kn ¨ Satz I.2.5 Auf einem endlichdimensionalen Raum sind je zwei Normen ¨aquivalent. Beweis. Gelte etwa dim X = n. Sei {e1 , . . . , en } eine Basis von X und . eine Norm auf X. Wir werden zeigen, daß . zur euklidischen Norm n n 2 1/2 aquivalent ist. i=1 αi ei 2 = ¨ i=1 |αi | Setze K = max{ e1 , . . . , en } > 0. Dann folgt aus der Dreiecksungleichung f¨ ur . und der H¨ olderschen Ungleichung n 1/2 1/2 n n n 2 2 αi ei ≤ |αi | ei ≤ |αi | ei , i=1
so daß
i=1
i=1
√ x ≤ K n x 2
i=1
∀x ∈ X.
Damit ist . bzgl. . 2 stetig, da aus xk − x 2 → 0 √ xk − x ≤ xk − x ≤ K n xk − x 2 → 0 folgt. Ferner ist S := {x: x 2 = 1} in (X, . 2 ) abgeschlossen, denn {1} der abgeschlossenen Menge {1} S ist abgeschlossenes Urbild . −1 2 unter der stetigen Abbildung . 2 (vgl. Lemma I.2.1(c)), und S ist beschr¨ ankt bzgl. . 2 , also kompakt nach dem Satz von Heine-Borel. (Beachte, daß . 2 die u ¨ bliche Topologie auf dem endlichdimensionalen Raum X erzeugt.) Die stetige Funktion . nimmt daher auf S ihr Minimum m ≥ 0 an, und da . eine Norm und nicht nur eine Halbnorm ist, muß m > 0 gelten. Also folgt m x 2 ≤ x
∀x ∈ X,
denn x/ x 2 ∈ S f¨ ur x = 0. aquivalent, und das zeigt die Behauptung Damit ist jede Norm zu . 2 ¨ des Satzes. 2 Wir werden uns in Korollar II.2.7 noch mit der Frage besch¨aftigen, wie ” aquivalent“ zwei Normen auf Kn sind. ¨ Speziell erh¨alt man aus Satz I.2.5, daß in jedem endlichdimensionalen normierten Raum abgeschlossene und beschr¨ankte Mengen kompakt sind, daß alle endlichdimensionalen R¨ aume vollst¨ andig sind und deshalb (Lemma I.1.3) endlichdimensionale Unterr¨ aume von normierten R¨aumen abgeschlossen sind. Als n¨ achstes zeigen wir, daß die erstgenannte Eigenschaft endlichdimensionale R¨ aume charakterisiert. Dazu benutzen wir das folgende Lemma, das von unabh¨ angigem Interesse ist.
I.2
27
Eigenschaften normierter R¨ aume
Lemma I.2.6 (Rieszsches Lemma) Sei U ein abgeschlossener Unterraum des normierten Raums X, und sei U = X. Ferner sei 0 < δ < 1. Dann existiert xδ ∈ X mit xδ = 1 und xδ − u ≥ 1 − δ
∀u ∈ U.
Beweis. Sei x ∈ X \ U . Da U abgeschlossen ist, gilt d := inf{ x − u : u ∈ U } > 0, denn andernfalls g¨ abe es eine Folge (un ) in U mit un −x → 0, d und x l¨ age in U = U . Deshalb ist d < 1−δ , und es existiert uδ ∈ U mit d x − uδ < 1−δ . Setze x − uδ , xδ := x − uδ so daß xδ = 1. Sei nun u ∈ U beliebig. Dann ist x uδ − − u xδ − u = x − uδ x − uδ 1 x − (uδ + x − uδ u) = x − uδ d ≥ (denn uδ + x − uδ u ∈ U ) x − uδ > 1−δ nach Wahl von uδ .
2
Satz I.2.7 F¨ ur einen normierten Raum X sind ¨ aquivalent: (i) dim X < ∞. (ii) BX := {x ∈ X: x ≤ 1} ist kompakt. (iii) Jede beschr¨ankte Folge in X besitzt eine konvergente Teilfolge. Beweis. (i) ⇒ (ii): Das haben wir bereits im Anschluß an Satz I.2.5 bemerkt. (ii) ⇒ (iii): In einem kompakten metrischen Raum besitzt jede Folge eine konvergente Teilfolge, vgl. Satz B.1.7. (iii) ⇒ (i): Wir nehmen dim X = ∞ an. Sei x1 ∈ X mit x1 = 1 beliebig. Setze U1 = lin{x1 }; dann ist U1 endlichdimensional, folglich abgeschlossen und von X verschieden. Nach dem Rieszschen Lemma (Lemma I.2.6), angewandt mit δ = 12 , existiert x2 ∈ X mit x2 = 1 und x2 − x1 ≥ 12 . Nun betrachte U2 = lin{x1 , x2 } und wende das Rieszsche Lemma erneut an, um x3 mit x3 = 1, x3 − x1 ≥ 12 , x3 − x2 ≥ 12 zu erhalten. Dann betrachte U3 = lin{x1 , x2 , x3 }, etc. Auf diese Weise wird induktiv ur alle m, n ∈ N, m = n eine Folge (xn ) mit xn = 1 und xn − xm ≥ 12 f¨ definiert. Die Folge (xn ) ist beschr¨ ankt, hat aber keine Cauchy-, erst recht keine konvergente Teilfolge. 2 Es gibt noch einen h¨ ubschen direkten Beweis f¨ ur die Implikation (ii) ⇒ (i) in Satz I.2.7: Zu x ∈ BX betrachte die offene Kugel Ux um x mit dem
28
I.
Normierte R¨ aume
Radius12 . Wenn BX kompakt ist, existieren endlich viele x1 , . . . , xn mit BX ⊂ ni=1 Uxi . Dann muß X = lin{x1 , . . . , xn }, also endlichdimensional, sein. W¨ are n¨ amlich U := lin{x1 , . . . , xn } von X verschieden, so existierte nach dem Rieszschen Lemma x ∈ BX mit x − xi > 12 f¨ ur i = 1, . . . , n im Widerspruch zur Wahl der xi . Gilt das Rieszsche Lemma auch f¨ ur δ = 0? Das folgende Gegenbeispiel zeigt, daß das nicht zutrifft. Setze X = {x ∈ C[0, 1]: x(1) = 0} und U = 1 {x ∈ X: 0 x(t) dt = 0}. Versieht man X mit der Supremumsnorm, so ist U ein echter abgeschlossener Unterraum. G¨ abe es ein Element x ∈ X mit x − u ∞ ≥ x ∞ = 1 f¨ ur alle u ∈ U , so erhielte man folgendermaßen einen Widerspruch. Setze xn (t) = 1 − tn . Dann ist xn ∈ X, xn ∞ = 1, und 1 1 x (t) dt = 1 − n+1 . Mit 0 n 1 λn =
x(t) dt , 1 1 − n+1 0
un = x − λn xn ∈ U
1 gilt dann nach Annahme x − un ∞ ≥ 1, d.h. |λn | ≥ 1. Es folgt 0 x(t) dt ≥ 1. Da jedoch x stetig und x(1) = 0 ist, ergibt sich aus x ∞ = 1 der 1 Widerspruch 0 x(t) dt < 1. Zu der hier aufgeworfenen Frage siehe auch Aufgabe I.4.21 und Aufgabe II.5.19. Als n¨ achstes diskutieren wir die Separabilit¨at normierter R¨aume. Die Definition lautet: Definition I.2.8 Ein metrischer (oder topologischer) Raum heißt separabel, wenn er eine abz¨ ahlbare dichte Teilmenge besitzt. Dabei heißt D dicht in T , wenn D = T gilt; also ist eine Menge D genau dann dicht, wenn jede nichtleere offene Menge einen Punkt von D enth¨ alt. Eine ¨ aquivalente Formulierung im Fall metrischer R¨aume ist: Jeder Punkt von T ist Limes einer Folge aus D. Die Separabilit¨at eines Raums erleichtert dessen Analyse oft erheblich. Es ist nicht schwer zu zeigen, daß jede Teilmenge eines separablen metrischen Raums selbst separabel ist, siehe Aufgabe I.4.26. Da Rn separabel ist (Qn liegt dicht), sind alle T ⊂ Rn separable R¨aume. Zur Entscheidung der Separabilit¨at normierter R¨ aume ist das folgende Kriterium n¨ utzlich. Lemma I.2.9 F¨ ur einen normierten Raum X sind ¨aquivalent: (i) X ist separabel. (ii) Es gibt eine abz¨ahlbare Menge A mit X = lin A := lin A. Beweis. (i) ⇒ (ii) ist klar, denn X = A impliziert X = lin A. (ii) ⇒ (i): Wir betrachten zuerst den Fall K = R. Setze n B= λi xi : n ∈ N, λi ∈ Q, xi ∈ A . i=1
I.2
29
Eigenschaften normierter R¨ aume
Dann ist B abz¨ ahlbar, und wir werden B = X, genauer • ∀x ∈ X ∀ε > 0 ∃y ∈ B
x − y < ε n zeigen. Zun¨ achst w¨ ahle y0 ∈ lin A, also y0 = i=1 λi xi mit λi ∈ R, xi ∈ A, n so daß x − y0 ≤ ε/2. ahle dann λi ∈ Q mit |λi − λi | ≤ ε/ 2 i=1 xi . n W¨ Dann gilt f¨ ur y = i=1 λi xi ∈ B x − y ≤ x − y0 + y0 − y ≤ ε/2 + max |λi − λi | i
n
xi ≤ ε.
i=1
Im Fall K = C verwende Q + iQ statt Q.
2
Beispiele. (a) p ist separabel f¨ ur 1 ≤ p < ∞. Sei n¨amlich en der n-te Einheitsvektor en = (0, . . . , 0, 1, 0, . . .)
(1 an der n-ten Stelle)
urlich und A = {en : n ∈ N}. Dann ist p = lin A = d, wo der Abschluß nat¨ bzgl. . p zu bilden ist. F¨ ur x = (tn )n ∈ p gilt n¨amlich 1/p n ∞ p ti e i = |ti | → 0. x − i=1
p
i=n+1
(b) Genauso zeigt man die Separabilit¨ at von c0 . (c) Hingegen ist ∞ nicht separabel. (Man mache sich klar, daß die Methode aus (a) f¨ ur p = ∞ nicht funktioniert!) F¨ ur M ⊂ N betrachte ur n ∈ M und χM (n) = 0 sonst. n¨ amlich die Folge χM ∈ ∞ , wo χM (n) = 1 f¨ ahlbar, und es gilt χM − χM ∞ = Dann ist Δ := {χM : M ⊂ N} u ¨ berabz¨ 1 f¨ ur M = M . Ist nun A irgendeine abz¨ ahlbare Teilmenge von ∞ , so ∞ kann f¨ ur jedes x ∈ A die Menge {y ∈ : x − y ∞ ≤ 14 } wegen der Dreiecksungleichung h¨ ochstens ein y ∈ Δ enthalten, so daß A nicht dicht liegen kann. Ein ¨ ahnliches Argument zeigt die Inseparabilit¨at von L∞ [0, 1]. Zum Nachweis der Separabilit¨ at der R¨ aume C[a, b] und Lp [a, b], 1 ≤ p < ∞, ben¨ otigen wir einen wichtigen Satz der Analysis. Satz I.2.10 (Weierstraßscher Approximationssatz) Der Unterraum P [a, b] der Polynomfunktionen auf [a, b], a, b ∈ R, liegt dicht in (C[a, b], . ∞ ). Beweis. O.E. sei a = 0, b = 1; ferner reicht es, sich mit reellwertigen Funktionen zu besch¨ aftigen.
30
I.
Normierte R¨ aume
Sei x ∈ C[0, 1] beliebig. Wir betrachten das n-te Bernsteinpolynom pn (s) := Bn (s; x) :=
n n i s (1 − s)n−i x(i/n). i i=0
Wir werden pn − x ∞ → 0 zeigen. Da x gleichm¨ aßig stetig ist, existiert zu ε > 0 ein δ > 0 mit √ |s − t| ≤ δ ⇒ |x(s) − x(t)| ≤ ε.
(I.5)
Daraus ergibt sich mit α = 2 x ∞ /δ die Ungleichung |x(s) − x(t)| ≤ ε + α(t − s)2 ∀s, t ∈ [0, 1]; √ denn falls |t − s| ≤ δ, folgt das aus (I.5), und sonst ist
(I.6)
ε + α(t − s)2 > ε + 2 x ∞ > |x(s)| + |x(t)| ≥ |x(s) − x(t)|. Setze yt (s) = (t − s)2 . Dann kann (I.6) in der Form −ε − αyt ≤ x − x(t) ≤ ε + αyt
∀t ∈ [0, 1]
(I.7)
geschrieben werden. Um die diesen Funktionen assoziierten Bernsteinpolynome zu bestimmen, berechnen wir zuerst Bn ( . ; xj ) f¨ ur xj (s) = sj , j = 0, 1, 2, mit Hilfe des binomischen Satzes: n n i Bn (s; x0 ) = s (1 − s)n−i i i=0 n = s + (1 − s)
= 1; Bn (s; x1 ) = =
= =
n n i i s (1 − s)n−i i n i=0 n n−1 i s (1 − s)n−i i − 1 i=1 n−1 n i = da i−1 i n n−1 n−1 si+1 (1 − s)n−(i+1) i i=0 n−1 s + (1 − s) s
= s;
I.2
31
Eigenschaften normierter R¨ aume n i 2 n i s (1 − s)n−i i n i=0 n−1 n−1 i+1 = si+1 (1 − s)n−(i+1) n i i=0 n−1 s n−1 i i = + s (1 − s)(n−1)−i s i n i=0 n
Bn (s; x2 ) =
(wie oben) s n−1 2 = + s n n s(1 − s) + s2 . = n Bilden wir nun zu den in (I.7) auftauchenden Funktionen die Bernsteinpolynome, so ergibt sich −Bn ( . ; ε + αyt ) = Bn ( . ; −ε − αyt ) ≤ Bn ( . ; x − x(t)) ≤ Bn ( . ; ε + αyt ). Daher folgt f¨ ur alle s, t ∈ [0, 1] |pn (s) − x(t)| ≤ Bn (s; ε + αyt )
≤ ε + αt − 2αts + α 2
s(1 − s) 2 +s , n
und setzt man s = t, so erh¨ alt man |pn (t) − x(t)| ≤ ε + α
α t(1 − t) ≤ε+ n n
∀t ∈ [0, 1],
woraus die gleichm¨ aßige Konvergenz von (pn ) gegen x folgt.
2
Dieselbe Methode wird zum Beweis von Satz IV.2.6 herangezogen werden. In Kapitel VIII werden wir eine weitreichende Verallgemeinerung des Weierstraßschen Approximationssatzes kennenlernen, den Satz von StoneWeierstraß (Satz VIII.4.7). Korollar I.2.11 C[a, b] ist separabel. Beweis. Nach Satz I.2.10 ist C[a, b] = lin{xn : n ∈ N0 }, wo xn (t) = tn . Nun zu den Lp -R¨ aumen. Satz I.2.12 F¨ ur 1 ≤ p < ∞ ist C[a, b] dicht in Lp [a, b]. Zum Beweis ben¨ otigen wir:
2
32
I.
Normierte R¨ aume
Definition I.2.13 Sei T ein metrischer (oder auch topologischer) Raum, Σ die σ-Algebra der Borelmengen (also die von den offenen Mengen erzeugte σ-Algebra). Ein Maß μ auf Σ heißt Borelmaß. Ein positives Borelmaß μ heißt regul¨ar, falls (a) μ(C) < ∞ f¨ ur alle kompakten C, (b) f¨ ur alle A ∈ Σ gilt μ(A) = sup{μ(C): C ⊂ A, C kompakt}, = inf{μ(O): A ⊂ O, O offen}. Ein signiertes oder komplexes Borelmaß heißt regul¨ar, wenn seine Variation (vgl. Beispiel I.1(j)) regul¨ ar ist. M (T ) bezeichnet die Gesamtheit der signierten oder komplexen regul¨ aren Borelmaße. F¨ ur nicht endliche Maße ist der Regularit¨ atsbegriff in der Literatur nicht einheitlich. Die obige Definition werden wir jedoch im wesentlichen nur f¨ ur endliche Maße ben¨ otigen. Einige wichtige Tatsachen u ¨ ber regul¨are Maße werden im folgenden Satz zitiert. Satz I.2.14 (a) Ist T ein kompakter metrischer Raum oder allgemeiner ein vollst¨andiger separabler metrischer Raum oder eine offene Teilmenge des Rn , so ist jedes endliche Borelmaß auf T regul¨ar. Auch das Lebesguemaß auf Rn ist regul¨ar. (b) Ist T ein kompakter topologischer Raum, so ist M (T ) ein (im allgemeinen echter) abgeschlossener Untervektorraum von M (T, Σ). Zum Beweis von (a) sei etwa auf Rudin [1986], S. 50, oder Behrends [1987], S. 200, verwiesen. Die in (a) genannten R¨aume sind allesamt sog. polnische R¨aume. F¨ ur ein Beispiel eines nicht regul¨aren Maßes auf einem kompakten Raum siehe Cohn [1980], S. 215. Der Beweis von (b) sei zur ¨ Ubung u ¨ berlassen. Wir k¨ onnen nun den Beweis von Satz I.2.12 f¨ uhren. Sei Σ die Borel-σAlgebra von [a, b]. In der Maßtheorie wird gezeigt, daß lin{χA : A ∈ Σ}, der Raum der Treppenfunktionen, dicht in Lp liegt. Aus der Regularit¨at des Lebesguemaßes folgt, daß lin{χO : O offen} bereits dicht liegt; denn es ist ja χA − χO p = λ(O\A)1/p < ε f¨ ur geeignetes offenes O ⊃ A. Eine offene Menge O ist abz¨ahlbare Vereinigung von paarweise disjunkten offenen Intervallen Ij ; wegen λ(O) = ∞ λ(I ur j ) gilt χO ∈ lin{χI : I ein offenes Intervall}. Daher reicht es f¨ j=1 den Beweis des Satzes I.2.12 zu zeigen, daß es f¨ ur alle offenen Intervalle I ⊂ [a, b] und alle ε > 0 eine stetige Funktion f mit f − χI p < ε gibt. Und das sieht man nat¨ urlich so:
I.2
33
Eigenschaften normierter R¨ aume
f
a
I
Damit ist die Dichtheit von C[a, b] in Lp [a, b] bewiesen.
b 2
Wegen Satz I.2.12 kann man Lp [a, b] als Vervollst¨andigung des Raums (C[a, b], . p ) ansehen. F¨ ur Erweiterungen und Beweisalternativen dieses Satzes siehe Aufgabe II.5.6 und Lemma V.1.10. ur 1 ≤ p < ∞. Korollar I.2.15 Lp [a, b] ist separabel f¨ Beweis. Es reicht zu zeigen, daß die Polynomfunktionen dicht in Lp [a, b] sind. Sei dazu f ∈ Lp [a, b]. Zun¨ achst existiert nach Satz I.2.12 eine Folge stetiger Funktionen (fn ) mit fn − f p → 0. Nach Satz I.2.10 gibt es Polyur nomfunktionen gn mit fn − gn ∞ ≤ n1 . Wegen g p ≤ (b − a)1/p g ∞ f¨ alle g ∈ C[a, b] folgt fn − gn p → 0 und daher gn − f p → 0. Damit ist die Behauptung gezeigt. 2 Hier noch eine kleine Sammlung weiterer Aussagen u ¨ ber R¨aume vom Typ C oder Lp : • F¨ ur einen kompakten metrischen Raum T ist (C(T ), . ∞ ) separabel. • Definiert man C(T ) auch f¨ ur kompakte topologische (Hausdorff-) R¨ aume T , so ist C(T ) genau dann separabel, wenn T metrisierbar ist. • Ist μ ein endliches regul¨ ares Borelmaß auf dem kompakten metrischen (oder auch nur topologischen) Raum T , so liegt C(T ) dicht ur 1 ≤ p < ∞. in Lp (μ) f¨ • Ist T ein kompakter metrischer Raum oder eine offene Teilmenge ares Borelmaß auf T , so ist Lp (μ) separades Rn sowie μ ein regul¨ bel f¨ ur 1 ≤ p < ∞. (Diese Aussage gilt nicht mehr f¨ ur kompakte topologische R¨ aume.) Speziell ist Lp (Rn ) separabel f¨ ur diese p. Die Beweise sind zum Teil erheblich aufwendiger als im Fall eines kompakten Intervalls; der Fall des Raums Lp (Rn ) wird in Lemma V.1.10 (siehe auch Aufgabe II.5.6) behandelt.
34
I.
I.3
Normierte R¨ aume
Quotienten und Summen von normierten R¨ aumen
In diesem Abschnitt beschreiben wir die Konstruktion neuer normierter R¨ aume aus bereits gegebenen. Wir wenden uns zuerst den normierten Quotienten zu. Definition I.3.1 Sei X ein normierter Raum und A ⊂ X. Der Abstand von x ∈ X zu A ist d(x, A) := inf{ x − y : y ∈ A}. Es folgt stets d(x, A) = 0 ⇐⇒ x ∈ A. Satz I.3.2 Sei X ein normierter Raum und U ⊂ X ein Unterraum. F¨ ur ¨ x ∈ X bezeichne mit [x] = x + U ∈ X/U die entsprechende Aquivalenzklasse. (a) [x] := d(x, U ) definiert eine Halbnorm auf X/U . (b) Ist U abgeschlossen, so ist . eine Norm. (c) Ist X vollst¨andig und U abgeschlossen, so ist X/U ein Banachraum. Beweis. (a) Zun¨ achst ist . wohldefiniert, denn [x1 ] = [x2 ] impliziert ur ein u ∈ U , und deshalb gilt d(x1 , U ) = d(x2 , U ). Die x1 = x2 + u f¨ Gleichung λ[x] = |λ| [x] folgt f¨ ur λ = 0 sofort daraus, daß mit u auch λu den Unterraum U durchl¨ auft, und f¨ ur λ = 0 ist sie trivial. Um schließlich die Dreiecksungleichung zu beweisen, betrachten wir x1 , x2 ∈ X. W¨ahle zu ε > 0 Elemente u1 , u2 ∈ U mit xi − ui ≤ [xi ] + ε (i = 1, 2). Es folgt [x1 ] + [x2 ] = [x1 + x2 ] ≤ (x1 + x2 ) − (u1 + u2 ) ≤ x1 − u1 + x2 − u2 ≤ [x1 ] + [x2 ] + 2ε, denn u1 + u2 ∈ U . Da ε > 0 beliebig war, folgt die Dreiecksungleichung. (b) [x] = 0 ⇐⇒ d(x, U ) = 0 ⇐⇒ x ∈ U = U ⇐⇒ [x] = [0]. ∞ (c) Wir verwenden Lemma I.1.8. Seien xk ∈ X mit k=1 [xk ] < ∞. Nach Definition der Quotientennorm darf man ohne Beschr¨ankung der Allgemeinheit xk ≤ [xk ] + 2−k f¨ ur alle k ∈ N annehmen. Dann ist ∞ ∞ x < ∞, und nach Voraussetzung existiert x := x . Es folgt k k k=1 k=1 n n n [xk ] = x − xk ≤ x − xk → 0, [x] − k=1
k=1
k=1
35
I.4 Aufgaben
denn stets gilt [z] ≤ z . Also existiert war.
∞
k=1 [xk ]
in X/U , was zu zeigen 2
Beispiel. Sei D ⊂ [0, 1] abgeschlossen, und betrachte den Quotientenraum C[0, 1]/U , wo U = {x ∈ C[0, 1]: x|D = 0}. Die Quotientenbildung bedeutet, daß Funktionen, die auf D u ¨bereinstimmen, identifiziert werden. Es liegt daher nahe, die Elemente von C[0, 1]/U als Funktionen auf D anzusehen. Im n¨ achsten Kapitel wird ausgef¨ uhrt werden, daß C[0, 1]/U und C(D) in der Tat isometrisch isomorph“ sind (Satz II.1.10). ” Beachte, daß Lemma I.1.9 als Spezialfall von Satz I.3.2 aufgefaßt werden kann, wenn man diesen auch f¨ ur halbnormierte R¨aume formuliert. Die Summenbildung normierter R¨ aume gestaltet sich wesentlich einfacher. Im folgenden werden wir sowohl die Norm des Raums X als auch die Norm des Raums Y mit demselben Symbol . bezeichnen. Satz I.3.3 Seien X und Y normierte R¨aume. (a) Sei 1 ≤ p ≤ ∞. Dann definiert 1/p x p + y p (x, y) = p max x , y
f¨ ur p < ∞ f¨ ur p = ∞
eine Norm auf der direkten Summe X ⊕Y . Die so normierte direkte Summe wird mit X ⊕p Y bezeichnet. (b) All diese Normen sind ¨aquivalent und erzeugen die Produkttopologie auf X × Y , d.h., (xn , yn ) → (x, y) bzgl. . p genau dann, wenn xn → x und yn → y. (c) Mit X und Y ist auch X ⊕p Y vollst¨andig. ¨ Der einfache Beweis sei allen Leserinnen und Lesern zur Ubung u ¨ berlassen.
I.4
Aufgaben
Aufgabe I.4.1 (a) In einem metrischen Raum (M, d) sind die Mengen (x ∈ M, ε > 0) U (x, ε) := {y ∈ M : d(x, y) < ε}
offen,
B(x, ε) := {y ∈ M : d(x, y) ≤ ε}
abgeschlossen,
S(x, ε) := {y ∈ M : d(x, y) = ε}
abgeschlossen.
(b) In einem normierten Raum (X, . ) gilt (x ∈ X, ε > 0) {y ∈ X: x − y < ε} = {y ∈ X: x − y ≤ ε}. ur geeigGib ein Beispiel eines metrischen Raums mit U (x, ε) = B(x, ε) f¨ nete x ∈ X, ε > 0.
36
I.
Normierte R¨ aume
Aufgabe I.4.2 Ein kompakter metrischer Raum ist vollst¨ andig. Aufgabe I.4.3 Kugeln in einem Banachraum mit (a) Sei (Bn ) eine Folge abgeschlossener ∞ B1 ⊃ B2 ⊃ . . . . Folgt dann n=1 Bn = ∅? (Hinweis: Falls B(x, r) ⊂ B(y, s), was kann man dann u ¨ ber x−y sagen?) (b) Beantworte die gleiche Frage f¨ ur eine absteigende Folge abgeschlossener Kugeln in einem vollst¨ andigen metrischen Raum. n a e und (Hinweis: Versuche M = {x1 , x2 , . . .} ⊂ c0 mit xn = j=1 j j passenden aj .) Aufgabe I.4.4 Sei X ein Vektorraum u ¨ ber R oder C und p: X → [0, ∞) eine Abbildung mit (a) p(x) = 0 ⇐⇒ x = 0, (b) ∀λ ∈ K ∀x ∈ X p(λx) = |λ|p(x). Dann ist p eine Norm genau dann, wenn {x ∈ X: p(x) ≤ 1}, die p-Einheitskugel“, ” konvex ist. Aufgabe I.4.5 Konvergiert die Reihe
∞ n=1
(−t)n /n in der Norm von C[0, 1]?
Aufgabe I.4.6 Sei X der Vektorraum (!) aller Lipschitz-stetigen Funktionen von [0, 1] nach R. F¨ ur x ∈ X setze
x(s) − x(t) . s−t s=t
xLip = |x(0)| + sup
(a) . Lip ist eine Norm, und es gilt x∞ ≤ xLip f¨ ur x ∈ X. (b) (X, . Lip ) ist ein Banachraum. Aufgabe I.4.7 F¨ ur x = (sn ) ∈ 1 setze
n sj . x = sup n j=1
Zeige, daß (1 , . ) ein normierter Raum ist. Ist es ein Banachraum? Aufgabe I.4.8 F¨ ur x = (sn ) ∈ c0 setze xJ :=
sup n1 0 .
R
¨ ob Zeige, daß HM (R) ein abgeschlossener Unterraum von LM (R) ist. Uberlege, allen M (t) = tp , 1 ≤ p < ∞, bzw. M (t) = HM (R) = LM (R) gilt in den F¨ exp(t2 ) − 1. Aufgabe I.4.21 Setze d(x, A) = inf a∈A x−a f¨ ur eine abgeschlossene Teilmenge A eines normierten Raums X (Definition I.3.1). (a) x → d(x, A) ist stetig auf X, und A = {x ∈ X: d(x, A) = 0}. (b) Ist dim X < ∞, so darf im Rieszschen Lemma δ = 0 zugelassen werden. Aufgabe I.4.22 In einem unendlichdimensionalen normierten Raum sei O eine offene beschr¨ ankte Menge mit kompaktem Rand. Was kann man u ¨ ber O aussagen? Aufgabe I.4.23 Betrachte die Unterr¨ aume U := {(sn ) ∈ 1 : s2n = 0 ∀n ∈ N}, 1 V := {(sn ) ∈ : s2n−1 = ns2n ∀n ∈ N}. Zeige, daß U und V abgeschlossen sind, aber daß die direkte Summe U ⊕ V nicht abgeschlossen ist. (Tip: Zeige zuerst, daß d ⊂ U ⊕ V gilt.) Aufgabe I.4.24 Ist X ein unendlichdimensionaler separabler normierter Raum, so enth¨ alt X eine linear unabh¨ angige abz¨ ahlbare dichte Teilmenge. Hinweise: (a) Kein echter Unterraum von X enth¨ alt eine offene Kugel. ur alle n, so gilt auch (b) Falls {xn : n ∈ N} = X und xn − yn ≤ 1/n f¨ {yn : n ∈ N} = X. (c) Konstruiere die gew¨ unschte Menge induktiv.
40
I.
Normierte R¨ aume
Aufgabe I.4.25 Sei X ein normierter Raum und Y ⊂ X ein abgeschlossener Unterraum. Zeige, daß X genau dann separabel ist, wenn es Y und X/Y sind. Aufgabe I.4.26 (a) M sei ein separabler metrischer Raum, und es sei A ⊂ M . Dann ist auch A separabel. (Achtung: Diese Aussage gilt nicht mehr, wenn M ein separabler topologischer Raum ist.) (b) F¨ ur einen normierten Raum X sind ¨ aquivalent: (i) X ist separabel. (ii) BX (= {x: x ≤ 1}) ist separabel. (iii) SX (= {x: x = 1}) ist separabel. Aufgabe I.4.27 Gib eine beschr¨ ankte Folge ohne eine konvergente Teilfolge in den Banachr¨ aumen C[0, 1] und Lp [0, 1] an! Aufgabe I.4.28 Sei xn (t) = tn , n ≥ 1. Geh¨ oren die konstanten Funktionen zur abgeschlossenen linearen H¨ ulle von x1 , x2 , . . . in Lp [0, 1]? ¨ Aufgabe I.4.29 F¨ ur x = (sn ) ∈ ∞ sei [x] die zugeh¨ orige Aquivalenzklasse in agt. ∞ /c0 . Zeige [x] = lim sup |sn |, wenn ∞ die Supremumsnorm tr¨
I.5
Bemerkungen und Ausblicke
Der letzte Abschnitt eines jeden Kapitels versucht unter anderem, die historische Entwicklung der Funktionalanalysis nachzuvollziehen. Die an diesem Aspekt interessierten Leserinnen und Leser seien hierzu auf die B¨ ucher von Dieudonn´e [1981] und Monna [1973] sowie die umfassende Darstellung von Pietsch [2007] hingewiesen. Der Begriff des Banachraums hat sich Anfang der zwanziger Jahre herausgesch¨ alt; hier sind Arbeiten von Helly (Monatshefte f. Math. u. Physik 31 (1921) 60–91), Hahn (Monatshefte f. Math. u. Physik 32 (1922) 3–88), Wiener (Fund. Math. 4 (1923) 136–143) sowie Banachs Dissertation (Fund. utzen sich u.a. auf ArMath. 3 (1922) 133–181) zu nennen.1 Diese Autoren st¨ beiten von Hilbert und Schmidt, u ¨ber die in Kapitel V und VI zu sprechen sein wird, und F. Riesz. W¨ ahrend Hilbert und Schmidt sich den R¨aumen 2 und L2 widmen, ist es Riesz, der 1910 (Math. Ann. 69 (1910) 449– ur 497) die Funktionenr¨ aume Lp [a, b] und wenig sp¨ater die Folgenr¨aume p f¨ p = 2 studiert. Er zeigt die S¨ atze I.1.6 und I.1.7, deren endlichdimensionale Varianten auf H¨ older und Minkowski zur¨ uckgehen, und insbesondere die 1 Die Arbeiten der bedeutenden Mathematiker aus der ersten H¨ alfte dieses Jahrhunderts sind manchmal im Original schwer erh¨ altlich; sie sind jedoch h¨ aufig in Gesammelten Werken dieser Autoren erneut publiziert worden. So gibt es Gesammelte Werke von Banach, von Neumann, Riesz, Wiener und vielen anderen Mathematikern, die uns noch begegnen werden.
I.5
Bemerkungen und Ausblicke
41
Vollst¨ andigkeit von Lp . Das war nat¨ urlich erst m¨oglich, nachdem Lebesgue Anfang des Jahrhunderts seine Integrationstheorie entwickelt hatte. Riesz benutzt zun¨ achst noch nicht das heute u ¨bliche Normsymbol . , das man zuerst bei Schmidt findet (Rend. Circ. Mat. Palermo 25 (1908) 53–77) und es nahelegt, x − y als Abstand zwischen den Punkten x und y zu interpretieren. (Fr´echet hatte 1906 metrische R¨ aume eingef¨ uhrt.) Eine solche Interpretation gestattet es, zur L¨ osung analytischer Probleme geometrische Intuition einzusetzen, was typisch f¨ ur die Methoden der Funktionalanalysis ist. Diese Sichtweise war damals jedoch noch nicht weit verbreitet; in der Tat war der Begriff des Vektorraums, mit dessen Hilfe ja Funktionen oder Folgen als Punkte eines abstrakten Ensembles angesehen werden k¨onnen, praktisch unbekannt. Der Vektorraumbegriff setzte sich erst in den zwanziger Jahren durch. In einer 1918 erschienenen Arbeit von Riesz (Acta Math. 41 (1918) 71– 98; wir kommen darauf in Kapitel VI zur¨ uck) treten die Banachraumaxiome schon klar zu Tage, auch wenn Riesz sich weigert, diese abstrakt zu formulieren, und stets im Rahmen der Supremumsnorm auf C[a, b] argumentiert, f¨ ur die jetzt systematisch das Symbol . verwandt wird. Er schreibt n¨amlich: Die in der Arbeit gemachte Einschr¨ ankung auf stetige Funktionen ist nicht von Belang. Der in den neueren Untersuchungen u ¨ ber diverse Funktionalr¨ aume bewanderte Leser wird die allgemeinere Verwendbarkeit der Methode sofort erkennen [. . .].
(Ebd. S. 71.) Diese Arbeit enth¨ alt auch das Rieszsche Lemma“ I.2.6. ” W¨ ahrend sich Hellys bereits genannte Arbeit Folgenr¨aumen widmet, geben Banach, Hahn und Wiener die heute u ¨bliche Definition eines Banachraums als vollst¨ andigen normierten Vektorraum, wobei sie sich allerdings der M¨ uhe unterziehen m¨ ussen, diesen letzteren Begriff zu erkl¨aren. Bemerkenswert ist, daß Wiener gleich komplexe Banachr¨aume zul¨aßt, w¨ahrend sie bei Banach nur reell sein d¨ urfen. Das ist mehr als eine Marginalie, da f¨ ur bestimmte Aussagen der Funktionalanalysis, insbesondere in der Spektraltheorie (siehe Kapitel VI und IX), komplexe Skalare notwendig sind; außerdem sind funktionalanalytische Techniken in der Funktionentheorie bedeutsam geworden. In seiner Autobiographie findet Wiener u ¨ brigens wenig schmeichelhafte Worte f¨ ur die Banachsche Schule: It is thus in an aesthetic rather than in any strictly logical sense that, in those years after Strasbourg, Banach space did not seem to have the physical and mathematical texture I wanted for a theory on which I was to stake a large part of my future reputation. Nowadays it seems to me that some aspects of the theory of Banach space are taking on a sufficiently rich texture and have been endowed with a sufficiently unobvious body of theorems to come closer to satisfying me in these respects.
42
I.
Normierte R¨ aume
At that time, however, the theory seemed to me to contain for the immediate future nothing but some decades of rather formal and thin work. By this I do not mean to reproach the work of Banach himself but rather that of the many inferior writers, hungry for easy doctors’ theses, who were drawn to it. As I foresaw, it was this class of writers that was first attracted to the theory of Banach spaces.
(Wiener [1956], S. 63f.) Stefan Banach (1892–1945) ist sicherlich eine der schillerndsten Gestalten der Mathematik des 20. Jahrhunderts. Er wurde in Krakau geboren, verbrachte jedoch sein wissenschaftliches Leben in Lemberg (poln. Lw´ow, frz. L´eopol, ukrain. Lwiw), das jetzt in der Ukraine liegt. Mathematisch war er im wesentlichen Autodidakt, aber heute sind Dutzende Begriffe und S¨ atze mit seinem Namen verkn¨ upft. Ein von H. Steinhaus, Banachs Entdecker, verfaßter biographischer Abriß ist in Banachs Gesammelten Werken (Band 1, S. 13–22) zu finden (siehe auch Heuser [1992], S. 661ff.), und k¨ urzlich ist eine Biographie Stefan Banachs erschienen (Kalu˙za [1996]). Auch Ulam, einer von Banachs Sch¨ ulern, hat u ¨ ber ihn geschrieben und ihn so geschildert (Mauldin [1981], S. 5.): Banach, by the way, was a very eccentric person in his habits and his personal life. He would not take any examinations at all, disliking them intensely. But he wrote so many original papers and proposed so many new ideas that he was granted a doctor’s degree several years later without passing any of the regular exams.
Die Umst¨ ande, wie Banach seinen Doktortitel erlangte, sind kurios. Schon am Anfang seiner Karriere zeigte er wenig Neigung, seine neuen Resultate auch aufzuschreiben. Als die Lemberger Professoren den Eindruck hatten, er habe gen¨ ugend Material f¨ ur eine Dissertation beisammen, schickten sie einen Assistenten aus, um Banach diskret nach dem Stand seiner Forschungen auszuhorchen. Dieser Assistent mußte dann die S¨atze und Beweise, die Banach ihm erkl¨ art hatte, zu Papier bringen, und nach geraumer Zeit blieb f¨ ur letzteren nur noch die Aufgabe, den gesammelten Text zu redigieren; im Juni 1920 wurde die Dissertation eingereicht, und zwei Jahre sp¨ ater erschien die eingangs zitierte franz¨ osische Fassung in Fundamenta Mathematicae. Aber es gab noch eine m¨ undliche Pr¨ ufung, und wieder mußten die Professoren zu einem Trick greifen. Eines Tages bat einer von ihnen Banach in einen Seminarraum unter dem Vorwand, es seien gerade ein paar ausw¨ artige Mathematiker da, die bei einem bestimmten Problem nicht weiterk¨ amen; ob er mit ihnen vielleicht ein paar Fragen diskutieren wolle? Das tat Banach nur zu gerne, und als nach einiger Zeit alle Fragen zur Zufriedenheit der G¨ aste – man ahnt es bereits, es handelte sich um die Pr¨ ufungskommission – beantwortet waren, stand der Promotion nichts mehr im Wege. 1922 folgte die Habilitation; die pr¨ ufungstechnischen Details sind leider nicht u ¨ berliefert.
I.5
Bemerkungen und Ausblicke
43
Teil der Banachschen Exzentrizit¨ at war gewiß seine Vorliebe, im Caf´e zu arbeiten statt in der Universit¨ at, und zwar zuerst im Caf´e Roma ( He ” used to spend hours, even days there, especially towards the end of the month before the university salary was paid.“ (Mauldin [1981], S. 7)) und dann, als die Kreditsituation im Roma prek¨ ar wurde, im Schottischen Caf´e direkt gegen¨ uber. Dort haben endlose mathematische Diskussionen stattgefunden, haupts¨ achlich zwischen Banach, Mazur und Ulam ( It was hard ” to outlast or outdrink Banach during these sessions“, schreibt letzterer), deren wesentliche Punkte in einer vom Kellner des Schottischen Caf´es verwahrten Kladde festgehalten wurden; bevor sie angeschafft wurde, schrieb ¨ man – sehr zum Arger des Personals – direkt auf die Marmortische. Diese Kladde ist heute allgemein als das Schottische Buch“ bekannt; es ist, mit ” einleitenden Artikeln und Kommentaren versehen, von Mauldin als Buch herausgegeben worden (Mauldin [1981]). Im Schottischen Buch werden Probleme der Funktionalanalysis, der Theorie der reellen Funktionen und der Maßtheorie diskutiert; manche sind bis heute ungel¨ost geblieben. F¨ ur einige Probleme wurden Preise ausgesetzt, die von einem kleinen Glas Bier u ¨ ber eine Flasche Wein (siehe S. 252) bis zu einem kompletten Abendessen und einer lebenden Gans (siehe S. 88) reichten. Zu den Sch¨ ulern von Banach z¨ ahlen außer Mazur und Ulam u.a. Auerbach, Eidelheit, Orlicz und Schauder, die uns im Laufe des Buches noch begegnen werden. Das Ende der Lemberger Schule kam 1941 mit dem Einmarsch der deutschen Truppen. Viele ihrer Mitglieder wurden von SS oder Gestapo ermordet; eine Liste get¨ oteter polnischer Mathematiker findet man in Fund. Math. 33 (1945). Banach starb kurz nach Kriegsende an Lungenkrebs. 1932 erschien Banachs Monographie Th´eorie des Op´erations Lin´eaires (Banach [1932]), die die Erkenntnisse der Lemberger und anderer Mathematiker zusammenfaßt. Banach spricht dort u ¨ brigens von R¨aumen vom ” Typ (B)“ statt von Banachr¨ aumen; dieser Terminus wurde zuerst 1928 von Fr´echet gebraucht. Nun noch eine Erg¨ anzung im Zusammenhang mit dem Beweis des Satzes I.2.7. Dort wurde im Prinzip gezeigt, daß es in der Einheitskugel eines unendlichdimensionalen Banachraums zu jedem δ > 0 eine Folge mit ur n = m gibt. (Wer den Beweis genau analysiert xn − xm ≥ 1 − δ f¨ und Aufgabe I.4.21 beachtet, stellt fest, daß solch eine Folge selbst f¨ ur δ = 0 existiert.) Elton und Odell (Coll. Math. 44 (1981) 105–109) haben mit modernen kombinatorischen Methoden bewiesen, daß es sogar zu jedem unendlichdimensionalen Banachraum eine Konstante η > 1 und eine Folge ur n = m gibt. Der Beweis (xn ) in der Einheitskugel mit xn − xm ≥ η f¨ dieser Aussage ist hochgradig nichttrivial. Der Weierstraßsche Approximationssatz legt folgendes Problem nahe. Setzt man xn (t) = tn , so gilt ja C[0, 1] = lin{xn : n ≥ 0}. Kann man auf einige dieser Monome verzichten, ohne diese Eigenschaften zu verlieren? (Sicherlich braucht man x0 , da ja xn (0) = 0 f¨ ur n ≥ 1 ist.) Mit anderen
44
I.
Normierte R¨ aume
Worten: Wie muß eine Teilfolge (nk ) der nat¨ urlichen Zahlen beschaffen sein, damit die lineare H¨ ulle der xnk in C[0, 1] dicht liegt? Diese Frage wird auf h¨ ochst einfache Weise im Satz von M¨ untz-Sz´ asz beantwortet: • Ist 0 = n0 < n1 < n2 < . . . eine Teilfolge ∞ von N0 , so gilt C[0, 1] = lin{xnk : k ≥ 0} genau dann, wenn k=1 1/nk = ∞ ist. Rudin [1986], S. 313, gibt einen funktionalanalytischen Beweis, der auf dem in Kapitel III zu diskutierenden Satz von Hahn-Banach sowie auf Aussagen u ankter analytischer Funktionen beruht. ¨ ber die Nullstellenlage beschr¨ Direktere Argumente findet man bei Cheney [1982], S. 198, oder bei von Golitschek, J. Approximation Theory 39 (1983) 394–395, der einen sehr ein fachen Beweis der Hinl¨ anglichkeit der Bedingung 1/nk = ∞ vorschl¨agt. ¨ Ubrigens kann man auch nicht ganze Exponenten und die Frage der Approximation in Lp betrachten. In diesem Kontext wurden entsprechende M¨ untz-Sz´ asz-Theoreme von Borwein und Erd´elyi (J. London Math. Soc. 54 (1996) 102–110), Operstein (J. Approximation Theory 85 (1996) 233–235), Erd´elyi und Johnson (J. d’Analyse Math. 84 (2001) 145–172) und Erd´elyi (Studia Math. 155 (2003) 145–152 und Constr. Appr. 21 (2005) 319–335) bewiesen. Ein anderes Problem ist die quantitative Untersuchung der G¨ ute der Approximation einer stetigen Funktion durch Polynome bestimmten Grades, d.h., man m¨ ochte die Gr¨ oßenordnung des Fehlers En (f ) = inf{ f − p ∞ : p ein Polynom vom Grad < n} f¨ ur f ∈ C[a, b] absch¨ atzen. (Das ist nichts anderes als die Quotientennorm ¨ der Aquivalenzklasse von f , wenn nach dem n-dimensionalen Unterraum der Polynome vom Grad < n gefasert wird.) Es gilt hier der Satz von Jackson, wonach f¨ ur eine k-mal stetig differenzierbare Funktion En (f ) ≤
C(k) (k) f ∞ nk
∀n ∈ N
mit einer nur von k abh¨ angigen Konstanten C(k) ist. ¨ Abschließend sei auf einen Uberblicksartikel zum Weierstraßschen Approximationssatz von Lubinsky hingewiesen (Quaest. Math. 18 (1995) 91– 130).
Kapitel II
Funktionale und Operatoren
II.1
Beispiele und Eigenschaften stetiger linearer Operatoren
In diesem Kapitel beginnen wir die Untersuchung linearer Abbildungen zwischen normierten R¨ aumen. Die folgende Sprechweise ist u ¨ blich. Definition II.1.1 Eine stetige lineare Abbildung zwischen normierten R¨ aumen heißt stetiger Operator. Ist der Bildraum der Skalarenk¨orper, sagt man Funktional statt Operator. Ein stetiger Operator T : X → Y erf¨ ullt also eine der a¨quivalenten Bedingungen: (i) Falls limn→∞ xn = x, so gilt limn→∞ T xn = T x. (ii) F¨ ur alle x0 ∈ X und alle ε > 0 existiert δ > 0 mit x − x0 ≤ δ
⇒ T x − T x0 ≤ ε.
(iii) F¨ ur alle offenen O ⊂ Y ist T −1 (O) = {x ∈ X: T x ∈ O} offen in X. Wir haben hier, einer verbreiteten Konvention folgend, T x statt T (x) geschrieben. Die folgende Charakterisierung stetiger Operatoren ist zwar elementar zu beweisen, aber von gr¨ oßter Bedeutung. Zur Erinnerung: Wir haben es in diesem Buch (fast) stets mit linearen Abbildungen zu tun. Satz II.1.2 Seien X und Y normierte R¨aume, und sei T : X → Y linear. Dann sind folgende Aussagen ¨aquivalent: (i) T ist stetig. (ii) T ist stetig bei 0. (iii) Es existiert M ≥ 0 mit T x ≤ M x
∀x ∈ X.
46
II.
Funktionale und Operatoren
(iv) T ist gleichm¨aßig stetig. Beweis. (iii) ⇒ (iv) ⇒ (i) ⇒ (ii) ist trivial; in der Tat folgt aus (iii) die Lipschitzstetigkeit von T , denn T x − T x0 = T (x − x0 ) ≤ M x − x0 . (ii) ⇒ (iii) (vgl. den Beweis von Satz I.2.4): W¨are (iii) falsch, so existierte zu jedem n ∈ N ein xn ∈ X mit T xn > n xn . Setze yn = xn /(n xn ) (warum ist xn = 0?), dann ist yn = n1 , aber T yn =
T xn > 1. n xn
Mit anderen Worten: (yn ) ist eine Nullfolge, ohne daß (T yn ) gegen T (0) = 0 konvergiert, was (ii) widerspricht. 2 Definition II.1.3 Die kleinste in (iii) von Satz II.1.2 auftauchende Konstante wird mit T bezeichnet, d.h. T := inf{M ≥ 0: T x ≤ M x ∀x ∈ X}. Zur Rechtfertigung dieser Bezeichnung siehe den folgenden Satz. Es gilt offensichtlich: T = sup x =0
T x = sup T x = sup T x x
x =1
x ≤1
sowie die fundamentale Ungleichung T x ≤ T x
∀x ∈ X.
(II.1) x
supx =0 T
x ,
Um etwa die erste Gleichung einzusehen, setze M0 = so daß sofort T x ≤ M0 x f¨ ur alle x ∈ X folgt; daher gilt T ≤ M0 . W¨ahlt man andererseits zu ε > 0 ein xε = 0 mit T xε ≥ M0 (1 − ε) xε , so ergibt sich T ≥ M0 (1 − ε). Zusammen folgt T = M0 und daraus (II.1). Da stetige Operatoren nach Satz II.1.2 die Einheitskugel {x ∈ X: x ≤ 1} auf eine beschr¨ ankte Menge abbilden, spricht man auch von beschr¨ankten Operatoren. Wir betrachten nun L(X, Y ) := {T : X → Y : T ist linear und stetig}. Da Summen und skalare Vielfache von Nullfolgen wieder Nullfolgen sind, ist L(X, Y ) bez¨ uglich der algebraischen Operationen (S + T )(x) = Sx + T x (λT )(x) = λ T x ein Vektorraum. (Stets liegt der Nulloperator x → 0 in L(X, Y ), also ist L(X, Y ) = ∅.) Wir setzen noch L(X) = L(X, X).
II.1
Beispiele und Eigenschaften stetiger linearer Operatoren
47
Satz II.1.4 (a) T = sup x ≤1 T x definiert eine Norm auf L(X, Y ), die sog. Operatornorm. (b) Falls Y vollst¨andig ist, ist – unabh¨angig von der Vollst¨andigkeit von X – der Operatorraum L(X, Y ) vollst¨andig. Beweis. (a) Scharfes Hinsehen liefert λT = |λ| T und T = 0 ⇒ T = 0. Nun zur Dreiecksungleichung. Sei x ≤ 1. Dann gilt (S + T )x = Sx + T x ≤ Sx + T x ≤ S + T . ¨ Der Ubergang zum Supremum zeigt S + T ≤ S + T . (b) Sei (Tn ) eine Cauchyfolge in L(X, Y ). F¨ ur alle x ∈ X ist dann (Tn x) eine Cauchyfolge im Banachraum Y . Wir bezeichnen ihren Limes mit T x. Die so definierte Abbildung T : X → Y ist linear, denn T (λx1 + μx2 ) = lim Tn (λx1 + μx2 ) = lim (λTn x1 + μTn x2 ) n→∞
n→∞
= λ lim Tn x1 + μ lim Tn x2 = λT x1 + μT x2 . n→∞
n→∞
Wir zeigen jetzt T ∈ L(X, Y ) (also T < ∞) und Tn − T → 0. Zu ε > 0 w¨ ahle n0 ∈ N mit Tn − Tm ≤ ε
∀n, m ≥ n0 .
Sei x ∈ X, x ≤ 1. W¨ ahle m0 = m0 (ε, x) ≥ n0 mit Tm0 x − T x ≤ ε. Es folgt f¨ ur alle n ≥ n0 , daß Tn − T ≤ 2ε, denn Tn x − T x ≤ Tn x − Tm0 x + Tm0 x − T x ≤ Tn − Tm0 + ε ≤ 2ε. Daher gilt T < ∞ (sogar T ≤ lim inf Tn ) und Tn − T → 0.
2
Es ist an der Zeit, eine Bezeichnung einzuf¨ uhren. F¨ ur einen normierten Raum X setze BX = {x ∈ X: x ≤ 1}, SX = {x ∈ X: x = 1}. BX wird Einheitskugel, SX Einheitssph¨are genannt. Die Konvergenz Tn → T bzgl. der Operatornorm ist dann ¨ aquivalent zur gleichm¨aßigen Konverurlich st¨ arker als die punktweise Kongenz Tn x → T x auf BX ; das ist nat¨ vergenz. (Ist etwa Tn das Funktional (tm )m → tn auf c0 , so gilt Tn x → 0 f¨ ur alle x ∈ c0 , aber Tn = 1.) Das n¨ achste Ergebnis zeigt, daß stetige Operatoren von dichten Teilr¨ aumen auf den Abschluß fortgesetzt werden k¨onnen.
48
II.
Funktionale und Operatoren
Satz II.1.5 Ist D ein dichter Unterraum des normierten Raums X, Y ein Banachraum und T ∈ L(D, Y ), so existiert genau eine stetige Fortsetzung T ∈ L(X, Y ), d.h. ein stetiger Operator mit T|D = T . Zus¨atzlich gilt T = T . Beweis. Sei x ∈ X. W¨ ahle eine Folge (xn ) in D mit xn → x. (xn ) ist dann eine Cauchyfolge, und da T nach Satz II.1.2 gleichm¨aßig stetig ist, ist auch (T xn ) eine Cauchyfolge. Bezeichnet man deren Limes mit Tx, so ist es leicht zu beweisen, daß T die geforderten Eigenschaften hat. Umgekehrt ist klar, daß jede stetige Fortsetzung S die Eigenschaft Sx = lim Sxn = lim T xn = Tx hat, so daß die behauptete Eindeutigkeit folgt. 2 Bevor einige Beispiele besprochen werden, bemerken wir noch ein einfaches Lemma. Lemma II.1.6 F¨ ur S ∈ L(X, Y ) und T ∈ L(Y, Z) gilt T S ∈ L(X, Z) mit T S ≤ T S . Beweis. Die Linearit¨ at von T S ist klar, und die Stetigkeit folgt sofort aus Satz II.1.2: T (Sx) ≤ T Sx ≤ T S x also T S ≤ T S .
∀x ∈ X, 2
Einfache Beispiele zeigen, daß im allgemeinen T S < T S gilt (etwa S: (s, t) → (s, 0) und T : (s, t) → (0, t) auf R2 ). Beispiele. Es ist in allen folgenden Beispielen trivial oder elementar, die Linearit¨ at der untersuchten Abbildung zu zeigen; Linearit¨at wird daher stillschweigend als erwiesen angenommen. (a) Ist X = Y und T = Id, der identische Operator, so gilt T = 1. (b) Ist X endlichdimensional und Y ein beliebiger normierter Raum, so ist jede lineare Abbildung T : X → Y stetig. Zum Beweis mache zun¨achst die wichtige Bemerkung, daß die Stetigkeit von T erhalten bleibt, wenn man zu einer ¨ aquivalenten Norm auf X oder Y u ¨ bergeht; die Gr¨oße der Zahl T h¨ angt hingegen sehr wohl von der konkreten Wahl der Normen ab. n Nach Satz I.2.5 d¨ urfen wir annehmen, daß X mit der Norm i=1 αi ei = n i=1 |αi | versehen ist, wo {e1 , . . . , en } irgendeine Basis von X ist. Es folgt n n αi ei = αi T ei T i=1
i=1
≤
n i=1
|αi | T ei
II.1
Beispiele und Eigenschaften stetiger linearer Operatoren
49
n ≤ max T ei αi ei . i=1,...,n i=1
(c) Sind . und ||| . ||| zwei Normen auf dem Vektorraum X, so sind . und ||| . ||| genau dann ¨ aquivalent, wenn Id: X, . → X, ||| . ||| und
Id: X, ||| . ||| → X, .
stetig sind (vgl. Satz I.2.4). Gilt nur die obere Stetigkeit, also |||x||| ≤ M x , so nennt man . feiner und ||| . ||| gr¨ober. (d) Setze T : C[0, 1] → K, T x = x(0). Dann ist T stetig mit T = 1. (Dabei wird auf C[0, 1] die Supremumsnorm betrachtet.) Um das einzusehen, u achst, daß ¨ berlege zun¨ |T x| = |x(0)| ≤ sup |x(t)| = x ∞
∀x ∈ C[0, 1]
t∈[0,1]
und daher T ≤ 1 gilt. Andererseits betrachte die konstante Funktion 1, f¨ ur die 1 ∞ = 1 = T 1 ist; es folgt T = 1. (e) Setze T : C 1 [0, 1] → K, x → x(0) + x (1). Dann ist T stetig (bzgl. x C 1 = x ∞ + x ∞ ) mit T = 1. Denn es gilt |T x| = |x(0) + x (1)| ≤ |x(0)| + |x (1)| ≤ x ∞ + x ∞ = x C 1 , daher T ≤ 1. Andererseits gilt 1 C 1 = 1 sowie |T 1| = 1, also T ≥ 1. Betrachtet man jetzt auf dem Raum C 1 [0, 1] die ¨aquivalente Norm |||x||| = max{ x ∞ , x ∞ }, so ist T = 2: Zum einen zeigt n¨amlich |T x| ≤ x ∞ + x ∞ ≤ 2|||x|||, daß T ≤ 2. Andererseits sieht man f¨ ur x(t) = (t − 12 )2 + 34 sofort |T x| = 2 und x ∞ = x ∞ = 1, d.h. |||x||| = 1; also ist T ≥ 2. 1 (f) Es ist einfach zu sehen, daß T : C[0, 1] → K, T x = 0 x(t) dt, stetig ist mit T = 1. Wir betrachten nun X := {x ∈ C[0, 1]: x(1) = 0}, ebenfalls mit . ∞ versehen, und S := T |X . Dann gilt S = 1: Die Ungleichung S ≤ T ist offensichtlich, da S eine Restriktion von T ist. Sei anderer1 , seits xn (t) = 1 − tn , also xn ∈ X mit xn ∞ = 1. Es ist |Sxn | = 1 − n+1 d.h. S ≥ 1. Dieses Beispiel zeigt, daß in der Formel S = sup{ Sx : x ≤ 1} das Supremum nicht angenommen zu werden braucht, denn kein ullt |Sx| = 1. (Siehe dazu auch Aufgabe II.5.19.) x ∈ BX erf¨ (g) Allgemeiner als in (f) betrachte zu g ∈ C[0, 1] das Funktional Tg : C[0, 1] → K mit 1 x(t)g(t) dt. Tg (x) = 0
50
II.
Dann gilt Tg = |Tg (x)| =
0
Funktionale und Operatoren
1
|g(t)| dt. In der Tat ergibt sich ≤“ aus ” 1 1 1 x(t)g(t) dt ≤ |x(t)| |g(t)| dt ≤ |g(t)| dt x ∞ . 0
0
0
Umgekehrt setze zu ε > 0 g(t) . |g(t)| + ε
xε (t) =
Dann gilt xε ∈ C[0, 1], xε ∞ ≤ 1 sowie
1
|g(t)|2 dt |g(t)| + ε
1
|g(t)|2 − ε2 dt |g(t)| + ε
|Tg (xε )| = 0
≥
0
1
|g(t)| dt − ε,
= 0
daher erhalten wir Tg =
1
sup |Tg (x)| ≥ sup |Tg (xε )| ≥
x ∞ ≤1
ε>0
|g(t)| dt. 0
ur x = (tn ). Man sieht (h) Betrachte T : c → K, T x = limn→∞ tn f¨ leicht, daß T = 1. Da c0 = T −1 {0} gilt, liefert die Stetigkeit von T einen eleganten Beweis f¨ ur die Abgeschlossenheit von c0 in c, denn die einpunktige Menge {0} ist abgeschlossen. ∞(i) Auf d (vgl. Beispiel I.1(f)) betrachte die lineare Abbildung T x = ur x = (tn ). Da die Folge (tn ) abbricht, ist die Summe eine endn=1 ntn f¨ liche Summe, und T ist wohldefiniert. Betrachtet man die Supremumsnorm auf d, so ist T unstetig: Setzt man n¨ amlich en = (0, . . . , 0, 1, 0, . . .), wo die 1 an der n-ten Stelle steht, so ist en ∞ = 1, aber T en = n, so daß T auf Bd unbeschr¨ ankt ist. Dasselbe Argument zeigt, daß T auf (d, . p ) unstetig ist. Es ist nicht ganz einfach zu zeigen, daß es auf einem vollst¨andigen normierten Raum unstetige Funktionale gibt (siehe Aufgabe II.5.2); bemerke, andig ist. daß d in keiner der Normen . p vollst¨ (j) Die H¨ oldersche Ungleichung I.1.10 zeigt, daß f¨ ur g ∈ Lq (μ) durch T : Lp (μ) → K, Tg (f ) = f g dμ, ein stetiges Funktional mit Tg ≤ g Lq definiert wird; hier ist 1 ≤ p ≤ ∞ 1 und p1 + 1q = 1 mit der Konvention ∞ = 0. Es gilt sogar Tg = g Lq ,
II.1
Beispiele und Eigenschaften stetiger linearer Operatoren
denn f¨ ur f=
g |g|
|g| g Lq
51
q/p
gilt f Lp = 1 und f g dμ = g Lq ; dieses Argument ist f¨ ur p = 1 und p = ∞ entsprechend zu modifizieren. In Satz II.2.4 wird gezeigt, daß f¨ ur p < ∞ jedes stetige lineare Funktional auf Lp auf diese Weise entsteht, wenn μ ein σ-endliches Maß ist. (k) Eine bedeutende Klasse linearer Abbildungen der Analysis besteht aus den Differentialoperatoren und den Integraloperatoren. Zun¨achst zu den Differentialoperatoren. Wir betrachten den Ableitungsoperator D: C 1 [0, 1] → C[0, 1], der wohldefiniert und linear ist. Wir betrachten die Supremumsnorm auf C[0, 1] und ur xn (t) = tn gilt xn ∞ = 1, aber C 1 [0, 1]. Dann ist D nicht stetig; denn f¨ n−1 Dxn ∞ = supt nt = n. Versehen wir C 1 [0, 1] jedoch mit der Norm x C 1 = x ∞ + x ∞ , so ist D wegen Dx ∞ ≤ x C 1 stetig. Allgemeiner ist auf C r (Ω), Ω ⊂ Rn offen und beschr¨ankt, versehen mit der in Beispiel I.1(d) diskutierten Norm . C r , jeder partielle Differentialoperator |α|≤r aα Dα mit aα ∈ C(Ω) ein stetiger Operator von C r (Ω) nach C(Ω). (l) Es sei k: [0, 1] × [0, 1] → K stetig und x ∈ C[0, 1]. Betrachte die durch
1
(Tk x)(s) :=
k(s, t)x(t) dt 0
definierte Funktion. Aus der gleichm¨ aßigen Stetigkeit von k folgt die Stetigkeit von Tk x. W¨ ahle n¨ amlich zu ε > 0 eine positive Zahl δ = δ(ε) mit (s, t) − (s , t ) ≤ δ
⇒ |k(s, t) − k(s , t )| ≤ ε,
wo . die euklidische Norm auf R2 ist. Dann gilt f¨ ur |s − s | ≤ δ
1
|(Tk x)(s) − (Tk x)(s )| ≤
|k(s, t) − k(s , t)| |x(t)| dt
0
1
|x(t)| dt ≤ ε x ∞ .
≤ ε
(II.2)
0
Tk definiert also eine lineare Abbildung von C[0, 1] in sich. Diese Abbildung ist bzgl. der Supremumsnorm stetig, denn Tk = =
sup Tk x ∞
x ∞ ≤1
sup
sup |(Tk x)(s)|
x ∞ ≤1 s∈[0,1]
52
II.
=
sup
sup
s∈[0,1] x ∞ ≤1
=
1
0
Funktionale und Operatoren
k(s, t)x(t) dt
1
|k(s, t)| dt
sup s∈[0,1]
0
nach Beispiel (g) mit g(t) = k(s, t), s fest. Wir erhalten daher eine explizite Formel f¨ ur die Norm von Tk : 1 |k(s, t)| dt ≤ k ∞ (II.3) Tk = sup s∈[0,1]
0
Der Operator Tk heißt Fredholmscher Integraloperator und k sein Kern. (m) Integraloperatoren k¨ onnen auf diversen Funktionenr¨aumen definiert werden; z.B. zeigt das Argument unter (l), daß ein Fredholmscher Integraloperator mit stetigem Kern auch von L1 [0, 1] nach C[0, 1] und von Lp [0, 1] in sich wohldefiniert und stetig ist. Besonders wichtig ist die L2 -Theorie. Seien k ∈ L2 ([0, 1]2 ) und f ∈ L2 ([0, 1]). (Genau genommen sind in den folgenden Bemerkungen f und k beliebige Repr¨asentanten der entsprechen¨ den Aquivalenzklassen.) Aus dem Satz von Fubini (Satz A.2.4) folgt, daß ur fast k(s, . ) ∈ L2 ([0, 1]) f¨ alle s, und nach der H¨olderschen Ungleichung existieren die Integrale k(s, t)f (t) dt f¨ ur fast alle s. Man erh¨alt so eine meßbare Funktion 1
(Tk f )(s) :=
k(s, t)f (t) dt, 0
die zun¨ achst nur fast u ¨ berall definiert ist und auf der fehlenden Nullmenge = 0 gesetzt wird. Wir werden zeigen, daß Tk ein stetiger Operator von amlich nach der H¨olderschen Ungleichung L2 ([0, 1]) in sich ist. Es gilt n¨ (mit p = q = 2) und dem Satz von Fubini 1 2 ds k(s, t)f (t) dt 0 0 2 1 1 |k(s, t)| |f (t)| dt ds ≤
1
Tk f 2L2 =
0
0
1
≤
1
1
|k(s, t)|2 dt 0
1
0
|f (t)|2 dt ds
0
1
|k(s, t)|2 ds dt f 2L2 ,
= 0
0
also Tk ≤ k L2([0,1]2 ) . (Im allgemeinen gilt keine Gleichheit in dieser Absch¨atzung.)
II.1
Beispiele und Eigenschaften stetiger linearer Operatoren
53
Analog definiert ein Kern k ∈ L2 (μ ⊗ ν) einen stetigen Integraloperator Tk : L2 (ν) → L2 (μ). (n) Manche unstetige Kerne geben trotzdem Anlaß zu stetigen Operatoren auf R¨ aumen stetiger Funktionen. Als Beispiel betrachten wir den Kern ur s = t |s − t|−α f¨ k(s, t) = 0 sonst auf [0, 1] × [0, 1]. Wir werden zeigen, daß k f¨ ur 0 < α < 1 zu einem stetigen Integraloperator Tk : C[0, 1] → C[0, 1] f¨ uhrt. Operatoren mit Kernen des obigen Typs werden schwach singul¨ar genannt. Sei x ∈ C[0, 1]. Wegen α < 1 ist die Funktion t → k(s, t)x(t) f¨ ur alle s integrierbar, also ist 1 x(t) dt (Tk x)(s) = |s − t|α 0 stets wohldefiniert. Ferner ist Tk x beschr¨ ankt, denn 1 dt |(Tk x)(s)| ≤ x ∞ sup |s − t|α s 0 1 dt ≤ 2 x ∞ α 0 t 2 x ∞ . ≤ 1−α 2 Daher ist Tk : C[0, 1] → ∞ [0, 1] stetig mit Tk ≤ 1−α . Es bleibt zu zeigen, daß mit x auch Tk x stetig ist. Wir werden beweisen, daß es zu jedem ε > 0 ein δ = δ(ε) > 0 mit der Eigenschaft
|(Tk x)(s) − (Tk x)(s )| ≤ x ∞ ε
∀x ∈ C[0, 1], |s − s | ≤ δ
(II.4)
gibt. Zun¨ achst ist |(Tk x)(s) − (Tk x)(s )| ≤ x ∞
1
|k(s, t) − k(s , t)| dt,
0 4 und es reicht, das letzte Integral abzusch¨ atzen. Sei η > 0 mit 1−α (3η)1−α ≤ ε/2; wir zerlegen alsdann das Integral in |k(s, t) − k(s , t)| dt + |k(s, t) − k(s , t)| dt. (II.5) {t: |t−s|≥2η}
{t: |t−s| y } und setze are μ(E) > 0, folgte f = χE |g|/g ∈ L∞ (μ). W¨ μ(E) y < |g| dμ = f g dμ = y (f ) ≤ y f L1 E
Ω
62
II.
Funktionale und Operatoren
im Widerspruch zu μ(E) = f L1 . Also gilt |g| ≤ y fast u ¨berall, d.h. g ∈ L∞ (μ). Da beide Funktionale y und T g auf Indikatorfunktionen und daher auf deren linearer H¨ ulle, den Treppenfunktionen, u ¨ bereinstimmen und die 2 Treppenfunktionen in Lp (μ) dicht liegen, gilt schließlich y = T g. Man kann zeigen, daß im Fall p > 1 die Voraussetzung der σ-Endlichkeit unerheblich ist; siehe z.B. Behrends [1987], S. 175. H¨ angen p und q gem¨ aß p1 + 1q = 1 zusammen, nennt man q u ¨ brigens den zu p konjugierten Exponenten. Wie im Fall der Folgenr¨ aume sind (L∞ ) und L1 nicht isomorph (es sei denn, sie sind endlichdimensional). Nun beschreiben wir den Dualraum eines Raums stetiger Funktionen. Der Raum M (K) der regul¨ aren Borelmaße mit der Variationsnorm wurde in Beispiel I.1(j) und Definition I.2.13 eingef¨ uhrt. Theorem II.2.5 (Rieszscher Darstellungssatz) Sei K ein kompakter metrischer (oder topologischer) Raum. Dann ist C(K) ∼ = M (K) unter der Abbildung T : M (K) → C(K) , (T μ)(x) = x dμ. K
Beweis. Da stetige Funktionen Borel-meßbar sind, ist wegen der Ungleichung x dμ ≤ |x| d|μ| ≤ x ∞ μ K
K
T wohldefiniert. Nach einfachen S¨ atzen der Integrationstheorie ist T linear, und die obige Ungleichung zeigt T ≤ 1. Die Beweise f¨ ur die Isometrie und die Surjektivit¨at von T sind im Kern maßtheoretisch; wir skizzieren sie im Fall K = R. F¨ ur eine vollst¨andige Darstellung sei z.B. auf Rudin [1986], S. 40ff. und S. 129ff. verwiesen. Zun¨achst zur Isometrie. Sei μ ∈ M (K). Wir betrachten die Hahn-Jordan-Zerlegung von μ, schreiben also μ = μ+ − μ− mit positiven Maßen μ+ , μ− und K = E+ ∪ E− mit disjunkten Borelmengen E+ , E− , f¨ ur die μ± (F ) = 0 f¨ ur alle Borelmengen F ⊂ E∓ gilt; siehe Satz A.4.4. Da μ und daher μ+ und μ− regul¨ ar sind, existieren zu ε > 0 kompakte Mengen C+ ⊂ E+ , C− ⊂ E− mit μ(E+ ) − ε ≤ μ(C+ ) ≤ μ(E+ ), μ(E− ) + ε ≥ μ(C− ) ≥ μ(E− ). Da C+ und C− disjunkt sind (E+ und E− sind es n¨amlich), ist die Funktion 1 falls t ∈ C+ y(t) = −1 falls t ∈ C−
II.2
63
Dualr¨ aume und ihre Darstellungen
stetig auf C+ ∪ C− . Nach dem Satz von Tietze-Urysohn (Satz B.1.5 bzw. Theorem B.2.4) existiert eine Fortsetzung x ∈ C(K) mit x ∞ = 1. F¨ ur dieses x gilt x dμ = dμ + (−1) dμ + x dμ C+ K C− K\(C+ ∪C− ) ≥ μ(C+ ) − μ(C− ) − x dμ K\(C+ ∪C− ) ≥ μ(E+ ) − ε − μ(E− ) − ε − |μ| K \ (C+ ∪ C− ) = |μ|(K) − 2ε − |μ|(K) − |μ|(C+ ) − |μ|(C− ) = μ(C+ ) − μ(C− ) − 2ε ≥ μ(E+ ) − ε − μ(E− ) − ε − 2ε = |μ|(K) − 4ε. Daher gilt T μ ≥ μ − 4ε f¨ ur alle ε > 0 und folglich T μ ≥ μ . Da T μ ≤ μ bereits gezeigt ist, ist der Beweis f¨ ur die Isometrie von T vollst¨ andig. Um die Surjektivit¨ at von T zu zeigen, betrachten wir ein Funktional achst zus¨ atzlich voraus, daß x positiv in dem x ∈ C(K) und setzen zun¨ ur alle t gilt. Sinn ist, daß x (x) ≥ 0 gilt, falls x ≥ 0, d.h., falls x(t) ≥ 0 f¨ Wir skizzieren, wie ein regul¨ ares Borelmaß mit T μ = x konstruiert werden kann. Man strebt nat¨ urlich die Definition μ(E) = x (χE ) an; aber da χE im allgemeinen nicht stetig ist, kann man nicht so vorgehen. Statt dessen setzt man f¨ ur eine offene Menge O μ∗ (O) = sup x (x): 0 ≤ x ≤ 1, {t: x(t) = 0} ⊂ O sowie anschließend f¨ ur beliebiges E ⊂ K μ∗ (E) = inf{μ∗ (O): E ⊂ O, O offen}. Als n¨ achstes beweist man, daß μ∗ ein ¨außeres Maß ist, d.h., μ∗ (E) ≥ 0 f¨ ur alle E ⊂ K, μ∗ (∅) = 0, μ∗ (E) ≤ μ∗ (F ) f¨ ur E ⊂ F und schließlich ∞ ∗ ∗ ur offene Mengen V best¨atigt man μ ( ∞ n=1 En ) ≤ n=1 μ (En ). F¨ μ∗ (V ∩ F ) + μ∗ (V ∩ F ) ≤ μ∗ (F )
∀F ⊂ K.
(II.7)
Setze nun Σμ = {V ⊂ K: V erf¨ ullt (II.7)}. Nach dem Fortsetzungssatz von Carath´eodory (siehe z.B. Behrends [1987], S. 19, oder Cohn [1980], S. 18) ist Σμ eine σ-Algebra und μ∗ |Σμ ein Maß. Da nach (II.7) offene Mengen in Σμ liegen, ist Σ ⊂ Σμ und μ := μ∗ |Σ ein positives Borelmaß; nach Konstruktion ist μ regul¨ ar. Abschließend kann x (x) = x dμ f¨ ur alle x ∈ C(K) gezeigt werden.
64
II.
Funktionale und Operatoren
Der allgemeine Fall eines beliebigen x ∈ C(K) kann auf den eines positiven Funktionals zur¨ uckgef¨ uhrt werden. Dazu definiere zu x ∈ C(K) die Funktionen x+ (t) = max{0, x(t)}, x− (t) = max{0, −x(t)}. Ferner setze f¨ ur x ≥ 0 x+ (x) = sup{x (y): 0 ≤ y ≤ x} sowie f¨ ur beliebiges x ∈ C(K) x+ (x) = x+ (x+ ) − x+ (x− ). Dann ist x+ linear und stetig, und es gilt x+ ≥ 0 sowie x− := x+ − x ≥ 0. Wendet man das soeben Bewiesene auf die positiven Funktionale x+ und x− an, so erh¨ alt man positive regul¨ are Borelmaße μ+ , μ− mit x dμ+ − x dμ− ∀x ∈ C(K). x (x) = x+ (x) − x− (x) = K
K
F¨ ur μ = μ+ − μ− gilt daher T μ = x .
2
Im Fall eines kompakten Intervalls K = [a, b] existiert eine ¨aquivalente Formulierung von Theorem II.2.5, die stetige Funktionale auf C[a, b] mit b Stieltjes-Integralen a x(t) dg(t) identifiziert; das ist die Originalfassung des Rieszschen Satzes. (Siehe dazu Aufgabe III.6.8.) Abschließend soll ein quantitativer Aspekt der Theorie endlichdimensionaler R¨ aume und ihrer Dualr¨ aume behandelt werden. F¨ ur einen n-dimensionalen normierten Raum (X, . ) haben wir in Satz I.2.5 gezeigt, daß es f¨ ur jede Basis {e1 , . . . , en } mit ei = 1 eine Konstante m mit n n n m |αi | ≤ αi ei ≤ |αi | ∀(α1 , . . . , αn ) ∈ Kn i=1
i=1
i=1
gibt. Wir werden jetzt zeigen, daß man durch geschickte Wahl der Basis m = n1 erreichen kann. Dazu ben¨ otigen wir das folgende Resultat, das von eigenem Interesse ist. Mit δij wird wie u ¨blich das Kroneckersymbol bezeichnet: ur i = j, δij = 0 f¨ ur i = j. δij = 1 f¨ Satz II.2.6 Ist X ein n-dimensionaler normierter Raum, so existieren Basen {b1 , . . . , bn } von X und {b1 , . . . , bn } von X mit bj (bi ) = δij , bi = bj = 1 f¨ ur alle i, j = 1, . . . , n. Beweis. Nach Wahl irgendeiner Basis k¨ onnen wir X mit Kn identifizieren. n Sei V : X → K die Abbildung, die der Matrix mit den Spaltenvektoren x1 , . . . , xn ihre Determinante zuordnet. Die Abbildung |V | ist nach Konstruktion stetig, denn sie setzt sich aus Summen von Produkten von Linearformen zusammen (beachte noch Beispiel II.1(b)), und nimmt daher auf
65
II.3 Kompakte Operatoren
der kompakten Menge {(x1 , . . . , xn ): xi = 1 ∀i} ihr Supremum an, etwa bei (b1 , . . . , bn ). Die Vektoren b1 , . . . , bn sind dann linear unabh¨angig und bilden deshalb eine Basis. Definiere nun bj (x) =
V (b1 , . . . , bj−1 , x, bj+1 , . . . , bn ) . V (b1 , . . . , bn )
Es ist klar, daß die b1 , . . . , bn die gew¨ unschten Eigenschaften haben.
2
Eine Basis wie in Satz II.2.6 wird nach ihrem Entdecker Auerbachbasis genannt. Korollar II.2.7 Ist {b1 , . . . , bn } eine Auerbachbasis des n-dimensionalen Raums X, so gilt n n n 1 |αi | ≤ αi bi ≤ |αi | ∀(α1 , . . . , αn ) ∈ Kn . (II.8) n i=1
i=1
i=1
Beweis. Die rechte Ungleichung ist eine triviale Konsequenz der Dreiecksungleichung. Zum Beweis der linken schreibe mit bj wie in Satz II.2.6 n n n |αj | |αi | = b αi bi αj j i=1 j=1 i=1 n n |αj | ≤ b α b i i j j=1 αj i=1 n ≤ n αi bi , i=1
2
was zu zeigen war.
Eine andere ucken, ist, daß der Operator T : 1 (n) → Art, (II.8) auszudr¨ X, (αi ) → i αi bi ein Isomorphismus mit T ≤ 1,
T −1 ≤ n
(II.9)
ist; mehr dazu in Abschnitt II.6.
II.3
Kompakte Operatoren
In Satz I.2.7 wurde gezeigt, daß nur in endlichdimensionalen R¨aumen die Aussage Jede beschr¨ ankte Folge besitzt eine konvergente Teilfolge“ gilt. ” Dieser Mangel an kompakten Mengen kann in gewissen F¨allen dadurch kompensiert werden, daß die betrachteten Operatoren st¨arkere Eigenschaften als die bloße Stetigkeit besitzen. Das erkl¨ art die Bedeutung der folgenden Definition.
66
II.
Funktionale und Operatoren
Definition II.3.1 Eine lineare Abbildung T zwischen normierten R¨aumen X und Y heißt kompakt, wenn T (BX ) relativkompakt ist (d.h., wenn T (BX ) kompakt ist). Die Gesamtheit der kompakten Operatoren wird mit K(X, Y ) bezeichnet; ferner setzen wir K(X) = K(X, X). Offenbar ist eine lineare Abbildung T : X → Y genau dann kompakt, wenn T beschr¨ankte Mengen auf relativkompakte Mengen abbildet, bzw. wenn f¨ ur jede beschr¨ ankte Folge (xn ) in X die Folge (T xn ) ⊂ Y eine konvergente Teilfolge enth¨ alt; vgl. Satz B.1.7. Da kompakte Mengen beschr¨ ankt sind (Beweis?), sind kompakte Operatoren stetig; es gilt also stets K(X, Y ) ⊂ L(X, Y ). ¨ Ublicherweise werden kompakte Operatoren zwischen Banachr¨aumen betrachtet. Der Grund ist, daß dann der Abschluß von T (BX ) im richtigen“ ” Raum gebildet wird. Die Vollst¨ andigkeit von Y ist in Teil (a) des n¨achsten Satzes wesentlich; f¨ ur X und Teil (b) w¨ urde es reichen, normierte R¨aume vorauszusetzen. Satz II.3.2 (a) Seien X und Y Banachr¨aume. Dann ist K(X, Y ) ein abgeschlossener Teilraum von L(X, Y ). Speziell ist K(X, Y ) selbst ein Banachraum. (b) Sei Z ein weiterer Banachraum. Sind T ∈ L(X, Y ) und S ∈ L(Y, Z) und ist T oder S kompakt, so ist ST kompakt. Beweis. (a) Es ist klar, daß mit T auch λT kompakt ist (λ ∈ K). Seien nun ankte Folge in X. W¨ahle eine TeilS, T ∈ K(X, Y ), und sei (xn ) eine beschr¨ folge (xnk ), so daß (Sxnk )k∈N konvergiert, und w¨ahle dann eine Teilteilfolge (xnkl )l∈N , die wir kurz als (xn )n∈M notieren, so daß (T xn )n∈M konvergiert. Dann konvergiert auch (Sxn + T xn )n∈M , und S + T ist kompakt. K(X, Y ) ist also ein Untervektorraum von L(X, Y ). Zum Beweis der Abgeschlossenheit verwenden wir ein Diagonalfolgenargument. Seien Tn ∈ K(X, Y ) und T ∈ L(X, Y ) mit Tn − T → 0. Sei (xn ) eine beschr¨ ankte Folge in X. Da T1 kompakt ist, existiert eine konvergente Teilfolge (T1 xn1 , T1 xn2 , T1 xn3 , . . .). (1)
Schreibe xi
Beachte, daß
= xni . Da T2 kompakt ist, gibt es eine konvergente Teilfolge (1) (1) T2 x(1) m1 , T2 xm2 , T2 xm3 , . . . . (1) (1) T1 x(1) m1 , T1 xm2 , T1 xm3 , . . . (2)
(1)
unnach wie vor konvergiert. Nun schreibe xi = xmi . Nochmalige Ausd¨ nung liefert eine konvergente Teilfolge (2) (2) T3 x(2) p1 , T3 xp2 , T3 xp3 , . . . ;
II.3
67
Kompakte Operatoren
(2) (2) und auch T1 xpi i und T2 xpi i konvergieren. So fortfahrend, erh¨alt man N ⊃ N1 ⊃ N2 ⊃ . . ., so daß (Tk xi )i∈Nr f¨ ur k ≤ r konvergiert. Betrachte nun die Diagonalfolge, also in der obigen Bezeichnung (2) ξ1 = xn1 , ξ2 = x(1) m2 , ξ3 = xp3 , etc.
Da die Folge der ξi vom k-ten Glied an Teilfolge der k-ten Ausd¨ unnung ist, haben wir erreicht: (Tn ξi )i∈N konvergiert f¨ ur alle n ∈ N. Wir werden jetzt die Konvergenz von (T ξi )i∈N und dazu die Cauchyeigenschaft f¨ ur diese Folge nachweisen. ur alle n und folglich ξi ≤ 1 Sei ε > 0. O.E. nehmen wir xn ≤ 1 f¨ f¨ ur alle i an. W¨ ahle n ∈ N mit Tn − T ≤ ε. W¨ahle nun i0 mit Tn ξi − Tn ξj ≤ ε
∀i, j ≥ i0 .
F¨ ur diese i und j gilt dann T ξi − T ξj ≤ T ξi − Tn ξi + Tn ξi − Tn ξj + Tn ξj − T ξj ≤ T − Tn + ε + T − Tn ≤ 3ε. (b) Ist (xn ) eine beschr¨ ankte Folge und ist S kompakt, so ist auch (T xn ) beschr¨ ankt, und (ST xn ) besitzt eine konvergente Teilfolge. Ist S stetig, T kompakt und (T xnk ) konvergent, so ist auch (ST xnk ) konvergent. 2 Beispiele. (a) Ist X endlichdimensional, so ist jede lineare Abbildung T : X → Y kompakt. T ist n¨ amlich stetig (Beispiel II.1(b)) und bildet deshalb die kompakte Menge BX auf eine kompakte Menge ab. (b) Ist T ∈ L(X, Y ) und der Bildraum ran(T ) endlichdimensional, so ankt, und beschr¨ankte Teilmengen ist T kompakt, denn T (BX ) ist beschr¨ endlichdimensionaler R¨ aume sind relativkompakt. Diese Bemerkung f¨ uhrt zusammen mit Satz II.3.2(a) zu folgendem Korollar. Korollar II.3.3 Seien X und Y Banachr¨aume, und sei T ∈ L(X, Y ). Falls eine Folge (Tn ) stetiger linearer Operatoren mit endlichdimensionalem Bild und Tn − T → 0 existiert, ist T kompakt. Es war lange Zeit ein offenes Problem der Funktionalanalysis, ob die Umkehrung von Korollar II.3.3 gilt, bis 1973 ein Gegenbeispiel gefunden wurde. Wir kommen in II.3.5 und II.3.6 noch einmal auf diese Frage zur¨ uck. Beispiel. (c) Betrachte den Fredholmschen Integraloperator 2 2 k(s, t)f (t) dt Tk : L (R) → L (R), (Tk f )(s) = R
68
II.
Funktionale und Operatoren
mit k ∈ L2 (R2 ); vgl. Beispiel II.1(m). Dort wurde bereits Tk ≤ k L2 gezeigt. In der Maßtheorie wird bewiesen, daß man k durch Treppenfunktionen, deren Stufen meßbare Rechtecke“ sind, approximieren kann. Genauer ” heißt das, daß meßbare Funktionen der Gestalt kn (s, t) =
(n) N
(n)
αij χE (n) (s)χF (n) (t) i
i,j=1
j
mit kn − k L2 → 0 existieren. Es folgt Tkn − Tk = Tk−kn ≤ k − kn L2 → 0. Aber Tkn hat die Gestalt (den Index halber weg) (Tkn f )(s) =
N N i=1
j=1
(n)
¨ lassen wir der Ubersichtlichkeit
αij
f (t) dt χEi (s),
Fj
also gilt Tkn f ∈ lin{χE1 , . . . , χEN }
∀f ∈ L2 (R).
Daher haben alle Tkn endlichdimensionales Bild, und nach Korollar II.3.3 ist Tk kompakt. Mit ¨ ahnlichen Methoden kann man die Kompaktheit eines Fredholmschen Integraloperators mit stetigem Kern auf C[a, b] beweisen. Wir werden dieses Resultat jedoch als Konsequenz des folgenden n¨ utzlichen Kompaktheitskriteriums erhalten. Satz II.3.4 (Satz von Arzel` a-Ascoli) Sei (S, d) ein kompakter metrischer Raum, und sei M ⊂ C(S), wobei C(S) wie u ¨blich mit der Supremumsnorm versehen wird. Die Teilmenge M habe die Eigenschaften (a) M ist beschr¨ankt, (b) M ist abgeschlossen, (c) M ist gleichgradig stetig, d.h. ∀ε > 0 ∃δ > 0 ∀x ∈ M Dann ist M kompakt.
d(s, t) ≤ δ
⇒
|x(s) − x(t)| ≤ ε.
II.3
69
Kompakte Operatoren
Beweis. Zuerst wird gezeigt, daß S separabel ist.Da S kompakt ist, be¨ sitzt – bei gegebenem ε > 0 – die Uberdeckung s∈S {t ∈ S: d(s, t) < ε} eine endliche Teil¨ uberdeckung. Es existieren also zu n ∈ N endlich viele mn (n) (n) (n) s1 , . . . , smn ∈ S mit S = k=1 {t ∈ S: d(sk , t) < n1 }. Es folgt, daß die (n) abz¨ ahlbare Menge {sk : 1 ≤ k ≤ mn , n ∈ N} dicht liegt. Nun zum eigentlichen Beweis, der wie der Beweis von Satz II.3.2 ein Diagonalfolgenargument benutzt. Wir betrachten eine dichte abz¨ahlbare Menge {s1 , s2 , . . .} ⊂ S und eine Folge (xn ) in M . Wir zeigen, daß es eine gleichm¨ aßig konvergente Teilfolge gibt. Da M beschr¨ ankt ist, ist die Folge xn (s1 ) in K beschr¨ankt und besitzt daher eine konvergente Teilfolge xn1 (s1 ), xn2 (s1 ), xn3 (s1 ), . . . . Auch die Folge xni (s2 ) ist beschr¨ ankt, und eine geeignete Teilfolge dieser Folge, etwa xm1 (s2 ), xm2 (s2 ), xm3 (s2 ), . . . konvergiert. Nochmalige Ausd¨ unnung beschert uns eine konvergente Teilfolge xp1 (s3 ), xp2 (s3 ), xp3 (s3 ), . . . , etc. Die Diagonalfolge y1 = xn1 , y2 = xm2 , y3 = xp3 , . . . hat daher die Eigenschaft yi (sn ) i∈N konvergiert f¨ ur alle n ∈ N. Wir werden nun die gleichgradige Stetigkeit benutzen, um die gleichm¨ aßige Konvergenz von (yi )i∈N zu zeigen. Dazu beweisen wir, daß (yi ) bzgl. der Supremumsnorm eine Cauchyfolge bildet. Sei ε > 0, und w¨ ahle δ > 0 gem¨ aß (c). Dann existieren endlich viele offene Kugeln vom Radius δ/2, etwa U1 , . . . , Up , die S u ¨berdecken (siehe oben). Jede Kugel enth¨ alt dann eines der sn , sagen wir snk ∈ Uk . Nun w¨ ahle i0 = i0 (ε) mit |yi (snk ) − yj (snk )| ≤ ε
∀i, j ≥ i0 , k = 1, . . . , p.
(II.10)
Jetzt betrachte ein beliebiges s ∈ S; s liegt dann in einer der u ¨ berdeckenden Kugeln, etwa s ∈ Uκ . Es folgt d(s, snκ ) < δ und daher nach (c) |yi (s) − yi (snκ )| ≤ ε
∀i ∈ N.
(II.11)
Also implizieren (II.10) und (II.11) f¨ ur i, j ≥ i0 |yi (s)−yj (s)| ≤ |yi (s)−yi (snκ )|+|yi (snκ )−yj (snκ )|+|yj (snκ )−yj (s)| ≤ 3ε. ur i, j ≥ i0 , und (yi ) ist eine Cauchyfolge. Da Das zeigt yi − yj ∞ ≤ 3ε f¨ M abgeschlossen ist, liegt ihr Limes in M , und die Kompaktheit von M ist bewiesen. 2
70
II.
Funktionale und Operatoren
Derselbe Beweis liefert: • (a) & (c) ⇒ M relativkompakt. Der Satz von Arzel` a-Ascoli gilt auch f¨ ur allgemeine kompakte topologische R¨ aume, siehe Dunford/Schwartz [1958], S. 266; gleichgradige Stetigkeit wird dann punktweise erkl¨ art. Beispiele. (d) Betrachte den Integraloperator Tk : C[0, 1] → C[0, 1],
1
(Tk x)(s) =
k(s, t)x(t) dt 0
mit k ∈ C [0, 1]2 . Dann ist Tk kompakt. In der Tat ist M := Tk (BC[0,1] ) beschr¨ ankt (Beispiel II.1(l)), und (II.2) auf S. 51 zeigt die gleichgradige Stetigkeit von M . Nach dem Satz von Arzel`a-Ascoli (bzw. der ihm folgenden Bemerkung) ist M relativkompakt. Genauso sieht man, daß ein Integraloperator Tk : C(S) → C(S), (Tk x)(s) = k(s, t)x(t) dμ(t) S
mit k ∈ C(S × S) kompakt ist, wenn S ein mit einem endlichen Borelmaß μ versehener kompakter metrischer Raum ist. (e) Auch der schwach singul¨ are Integraloperator aus Beispiel II.1(n) ist kompakt; dieses Mal k¨ onnen wir den Satz von Arzel`a-Ascoli wegen (II.4) anwenden. Zum Schluß dieses Abschnitts soll die Umkehrung von Korollar II.3.3 untersucht werden. Bezeichnet man mit F (X, Y ) den Raum der stetigen linearen Operatoren von X nach Y mit endlichdimensionalem Bild (F steht ur alle f¨ ur finite rank“), so besagt Korollar II.3.3 F (X, Y ) ⊂ K(X, Y ) f¨ ” Banachr¨ aume X und Y . Wir zeigen jetzt, daß f¨ ur die bis jetzt diskutierten separablen Banachr¨ aume Y sogar stets Gleichheit gilt. Zun¨achst ein allgemeiner Satz. Satz II.3.5 Sei X ein beliebiger Banachraum und Y ein (separabler) Banachraum mit der Eigenschaft: Es existiert eine beschr¨ankte Folge (Sn ) in F (Y ) mit lim Sn y = y
n→∞
∀y ∈ Y.
Dann gilt F (X, Y ) = K(X, Y ). Beweis. Sei T ∈ K(X, Y ). Dann ist Sn T ∈ F (X, Y ), und es reicht, Sn T − T → 0
(II.12)
II.3
71
Kompakte Operatoren
zu zeigen. Zum Beweis hierf¨ ur sei ε > 0 gegeben. Setze K = sup Sn < ∞. Wegen der Kompaktheit von T existieren endlich viele y1 , . . . , yr mit T (BX ) ⊂
r
{y ∈ Y : y − yi < ε}.
i=1
Auf Grund von (II.12) gibt es N ∈ N mit Sn yi − yi ≤ ε
∀n ≥ N, i = 1, . . . , r.
Wir zeigen jetzt Sn T x − T x ≤ (K + 2)ε f¨ ur alle x ∈ BX , n ≥ N . F¨ ur ahle n¨ amlich j ∈ {1, . . . , r} mit T x − yj < ε. Dann gilt f¨ ur x ∈ BX w¨ n≥N Sn T x − T x ≤ Sn (T x − yj ) + Sn yj − yj + yj − T x ≤ Kε + ε + ε = (K + 2)ε, 2
was den Beweis abschließt.
Hier noch einige Bemerkungen: (1) Es ist nicht schwer zu sehen, daß ein Raum Y mit der in (II.12) genannten Eigenschaft separabel sein muß. (2) (II.12) ist nat¨ urlich schw¨ acher als Sn − Id → 0; nach Satz I.2.7 und Korollar II.3.3 w¨ urde daraus dim Y < ∞ folgen. (3) Wir werden in Kapitel IV sehen, daß (II.12) automatisch die Beschr¨ anktheit der Folge (Sn ) impliziert (Satz von Banach-Steinhaus, Theorem IV.2.1). Korollar II.3.6 Sei X ein beliebiger Banachraum und Y einer der separablen Banachr¨aume c0 , p , C[0, 1], Lp [0, 1] (1 ≤ p < ∞). Dann gilt F (X, Y ) = K(X, Y ). Beweis. Es ist nur (II.12) zu verifizieren. F¨ ur Y = c0 oder p betrachte Sn (t1 , t2 , . . .) = (t1 , . . . , tn , 0, 0, . . .), und f¨ ur Y = C[0, 1] setze (Sn y)(t) =
n n i t (1 − t)n−i y(i/n). i i=0
Sn ordnet y also das n-te Bernsteinpolynom zu, vgl. den Beweis des Weierstraßschen Approximationssatzes I.2.10. Dort wurde auch Sn y → y gezeigt. Im Fall Y = Lp [0, 1] sei Sn ein bedingter Erwartungsoperator der Form Sn y =
n 2 −1
i=0
1 2−n
(i+1)2−n
i2−n
y(t) dt χ[i2−n ,(i+1)2−n ] .
72
II.
Funktionale und Operatoren
Es ist allen Leserinnen und Lesern u ufen, daß die Sn jeweils ¨ berlassen zu pr¨ (II.12) erf¨ ullen. 2 Die Aussage von Korollar II.3.6 gilt auch f¨ ur die nichtseparablen Banachr¨ aume ∞ und L∞ . Es ist hingegen ein offenes Problem, ob sie f¨ ur H ∞ (Beispiel I.1(e)) gilt.
II.4
Interpolation von Operatoren auf Lp -R¨ aumen
Es sei p0 < p1 und T : Lp0 [0, 1] → Lq0 [0, 1] eine stetige lineare Abbildung. Da ur f ∈ Lp1 [0, 1] Lp1 [0, 1] ⊂ Lp0 [0, 1] (Aufgabe I.4.14), ist T f insbesondere f¨ definiert. Wir wollen annehmen, daß dann T f ∈ Lq1 [0, 1] gilt und so ein stetiger Operator von Lp1 [0, 1] nach Lq1 [0, 1] erkl¨art ist. Die Aufgabenstellung der Interpolationstheorie ist es, den Operator T auf den Lp -R¨aumen zwischen Lp0 und Lp1 zu studieren. Insbesondere sollen Normabsch¨atzungen f¨ ur T auf Lp aus den Normen T : Lp0 → Lq0 und T : Lp1 → Lq1 hergeleitet werden. In diesem Abschnitt werden wir einen allgemeinen Interpolationssatz aume beweisen, den Satz von Riesz-Thorin (Theof¨ ur die Skala der Lp -R¨ rem II.4.2). Dabei werden wir auch unendliche Maßr¨aume zulassen. Da jedoch dann die Lp -R¨ aume nicht mehr der Inklusion nach angeordnet sind (vgl. Aufgabe I.4.14), darf die Vorstellung, Lp (μ) liege zwischen Lp0 (μ) und Lp1 (μ), falls p zwischen p0 und p1 liegt, sicher nicht w¨ortlich genommen werden. Trotzdem spricht einiges f¨ ur diese Idee, z.B. die Lyapunovsche Ungleichung aus Aufgabe I.4.16. Diese Ungleichung soll hier – etwas allgemeiner formuliert – noch einmal wiederholt werden, da wir sie in der folgenden Diskussion ben¨otigen. Lemma II.4.1 (Lyapunovsche Ungleichung) Sei 1 ≤ p0 , p1 ≤ ∞ und 0 ≤ θ ≤ 1. Definiere p durch gilt Lp0 (μ) ∩ Lp1 (μ) ⊂ Lp (μ); genauer ist θ f Lp ≤ f 1−θ Lp0 f Lp1
1 p
=
1−θ p0
+
θ p1 .
Dann
∀f ∈ Lp0 (μ) ∩ Lp1 (μ).
Ferner liegt Lp0 (μ) ∩ Lp1 (μ) dicht in Lp (μ), falls p < ∞. Beweis. Die Ungleichung folgt aus der H¨ olderschen Ungleichung. F¨ ur die Dichtheitsaussage beachte, daß Lp0 (μ) ∩ Lp1 (μ) die integrierbaren Treppenfunktionen enth¨alt. 2 Daß eine lineare Abbildung als stetiger Operator von Lp0 (μ) nach Lq0 (ν) und von Lp1 (μ) nach Lq1 (ν) wirkt, kann man allgemein so formulieren. Die Abbildung figuriert einerseits als T0 ∈ L Lp0 (μ), Lq0 (ν) , andererseits als
II.4
Interpolation von Operatoren auf Lp -R¨ aumen
73
T1 ∈ L Lp1 (μ), Lq1 (ν) , und daß es sich um dieselbe“ Abbildung handelt, ” uckt. wird durch die Forderung T0 |Lp0 (μ)∩Lp1 (μ) = T1 |Lp0 (μ)∩Lp1 (μ) ausgedr¨ Die soeben beschriebene Situation werden wir schlichter damit umschreiben, daß wir sagen, ein Operator T sei stetig als Operator T : Lp0 (μ) → Lq0 (ν) und als Operator T : Lp1 (μ) → Lq1 (ν). Nun k¨onnen wir das Hauptergebnis dieses Abschnitts formulieren. Theorem II.4.2 (Interpolationssatz Seien 1 ≤ p0 , p1 , q0 , q1 ≤ ∞. Ferner definiert durch θ 1−θ 1 + , = p p0 p1
von Riesz-Thorin) sei 0 < θ < 1, und es seien p und q 1 θ 1−θ + . = q q0 q1
(II.13)
Es seien μ und ν σ-endliche Maße. Ist dann T eine lineare Abbildung mit T : Lp0 (μ) → Lq0 (ν) stetig mit Norm M0 , T : Lp1 (μ) → Lq1 (ν) stetig mit Norm M1 , so gilt T f Lq ≤ M01−θ M1θ f Lp
∀f ∈ Lp0 (μ) ∩ Lp1 (μ)
(II.14)
∀f ∈ Lp0 (μ) ∩ Lp1 (μ)
(II.15)
f¨ ur K = C und T f Lq ≤ 2M01−θ M1θ f Lp
f¨ ur K = R. Der Operator l¨aßt sich also zu einer stetigen linearen Abbildung T : Lp (μ) → Lq (ν)
mit Norm ≤ cM01−θ M1θ
(c = 1 f¨ ur K = C und c = 2 f¨ ur K = R) ausdehnen. Beachte, daß auch p ein Lp (μ)-Raum ist (mit μ = z¨ahlendes Maß auf N), so daß der obige Interpolationssatz ebenfalls auf Folgenr¨aume anwendbar ist. aume als Funktion“ von p1 statt von p, so Denkt man sich die Lp -R¨ ” sagt der Satz von Riesz-Thorin, daß C := {(α, β): T : L1/α → L1/β stetig} eine konvexe Menge ist, denn mit zwei Punkten liegt auch die Verbindungsstrecke darin. Ferner besagt (II.14), daß die Funktion (α, β) → log T : L1/α → L1/β eine konvexe Funktion auf C ist.
74
II.
Funktionale und Operatoren
β C
1/q1 1/q0
α 1/p0
1/p1
Wir beweisen Theorem II.4.2 zuerst f¨ ur den komplexen Fall; anschließend wird der reelle daraus durch Komplexifizierung gewonnen. Der Beweis beruht auf folgendem funktionentheoretischen Resultat. Wir bezeichnen mit S den Streifen S = {z ∈ C: 0 ≤ Re z ≤ 1}. (II.16) Satz II.4.3 (Drei-Geraden-Satz) Es sei F : S → C eine beschr¨ankte stetige Funktion, die auf int S analytisch ist. F¨ ur 0 ≤ θ ≤ 1 setze Mθ = sup |F (θ + iy)|. y∈R
Dann gilt Mθ ≤ M01−θ M1θ . Dieser Satz vergleicht also das Supremum von |F | auf den drei Geraden Re z = 0, Re z = θ, Re z = 1. Beachte, daß die Beschr¨anktheit von F gefordert wurde; sie folgt nicht allein aus M0 < ∞, M1 < ∞. (In der Tat ist z → exp exp((z − 12 )πi) eine unbeschr¨ankte Funktion auf S mit M0 = M1 = 1.) Beweis. Wir nehmen zuerst M0 , M1 ≤ 1 an und zeigen in diesem Fall Mθ ≤ 1. Sei z0 = x0 + iy0 ∈ int S beliebig. Zu ε > 0 betrachte die Hilfsfunktion Fε (z) =
F (z) . 1 + εz
ankt und stetig auf S sowie analytisch Die Funktion Fε ist ebenfalls beschr¨ auf int S. Ferner gilt lim|y|→∞ |Fε (x + iy)| = 0 gleichm¨aßig f¨ ur 0 ≤ x ≤ 1,
II.4
Interpolation von Operatoren auf Lp -R¨ aumen
75
da |Fε (x + iy)| ≤ |F (x + iy)|/(ε|y|) und da F beschr¨ankt ist. W¨ahle nun ur 0 ≤ x ≤ 1 und |y| = r. Bezeichnet R r > |y0 |, so daß |Fε (x + iy)| ≤ 1 f¨ das kompakte Rechteck [0, 1] × i[−r, r], so gilt |Fε (z)| ≤ 1 auf ∂R. Das Maximumprinzip f¨ ur analytische Funktionen (siehe etwa Rudin [1986], S. 253) ur alle z ∈ R; insbesondere |Fε (z0 )| ≤ 1 und folglich liefert |Fε (z)| ≤ 1 f¨ |F (z0 )| = lim |Fε (z0 )| ≤ 1, ε→0
was zu zeigen war. Im Fall beliebiger M0 und M1 betrachte G(z) = F (z)/(α1−z β z ), wo α > M0 und β > M1 beliebig sind. Dann ist G stetig und beschr¨ankt auf S sowie analytisch auf int S, und es gilt |G(z)| ≤ 1 auf ∂S. Nach dem gerade Bewiesenen gilt |G(z)| ≤ 1 auch auf S. Das heißt Mθ ≤ α1−θ β θ und folglich Mθ ≤ M01−θ M1θ . (α und β wurden nur eingef¨ uhrt, um Schwierigkeiten im Fall M0 = 0 oder M1 = 0 aus dem Wege zu gehen. A posteriori zeigt sich, daß dann F = 0 gewesen sein muß.) 2 Kommen wir nun zum Beweis des Satzes von Riesz-Thorin im komur plexen Fall. Zun¨ achst gilt nach Voraussetzung T f ∈ Lq0 (ν) ∩ Lq1 (ν) f¨ p0 p1 ur solche f . f ∈ L (μ) ∩ L (μ), also ist nach Lemma II.4.1 T f ∈ Lq (ν) f¨ Wir nehmen zuerst p < ∞ und q > 1 an; dann reicht es, (II.14) f¨ ur integrierbare Treppenfunktionen nachzuweisen, denn diese liegen dicht. Dazu werden wir (T f )g dν ≤ M 1−θ M1θ (II.17) 0 f¨ ur alle integrierbaren Treppenfunktionen f , g mit f Lp = 1 = g Lq beweisen, wo q der zu q konjugierte Exponent, also 1q + q1 = 1 ist. Das reicht aus, da (II.17) f¨ ur das Funktional (g) = (T f )g dν auf Lq (ν) die Absch¨ atzung ≤ M01−θ M1θ impliziert (wegen q < ∞ liegen die in (II.17) auftauchenden g dicht); und nach Satz II.2.4 ist = T f Lq . Wir k¨ onnen nun die Treppenfunktionen f und g als f=
J
a j χA j ,
g=
j=1
K
bk χBk
(II.18)
k=1
mit f pLp =
J
|aj |p μ(Aj ) = 1,
g qLq =
j=1
K
|bk |q ν(Bk ) = 1,
k=1
und paarweise disjunkten Aj bzw. Bk darstellen. F¨ ur eine komplexe Zahl z definiere p(z) und q (z) durch 1 1−z z = + , p(z) p0 p1
1−z 1 z = + ; q (z) q0 q1
(II.19)
76
II.
Funktionale und Operatoren
also ist p(0) = p0 , p(θ) = p und p(1) = p1 sowie q (0) = q0 , q (θ) = q , q (1) = q1 . Mit der Konvention 00 = 0 setze nun fz = |f |p/p(z)
f , |f |
gz = |g|q /q (z)
g ; |g|
fz und gz sind integrierbare Treppenfunktionen, insbesondere ist T fz erkl¨ art. Schließlich definieren wir F : C → C, F (z) = (T fz )gz dν. Nach (II.18) gilt die Darstellung F (z) =
J K
|aj |
p/p(z)
j=1 k=1
aj bk |bk |q /q (z) |aj | |bk |
T χAj dν. Bk
Sie zeigt, daß F eine Linearkombination von Termen der Form γ z mit γ > 0 ist; F ist also analytisch. F erf¨ ullt die Voraussetzungen des Drei-GeradenSatzes II.4.3, denn jede Funktion γ z ist im Streifen S beschr¨ankt: |γ x+iy | = γ x ≤ max{1, γ}
∀x + iy ∈ S.
Als n¨ achstes werden wir |F (iy)| und |F (1 + iy)| absch¨atzen. Es gilt nach der H¨ olderschen Ungleichung und nach Voraussetzung u ¨ ber T |F (iy)| ≤ T fiy Lq0 giy Lq0 ≤ M0 fiy Lp0 giy Lq0 , und (II.19) liefert (beachte |γ z | = γ Re z f¨ ur γ > 0) fiy p0p0 = L
J J (p/p(iy))p0 |aj |p μ(Aj ) = 1, |aj | μ(Aj ) = j=1
j=1
und analog ist giy
q0 L
q 0
= 1.
Daher erh¨ alt man sup |F (iy)| ≤ M0 y∈R
und entsprechend sup |F (1 + iy)| ≤ M1 . y∈R
Nun liefert Satz II.4.3 (T f )g dν = |F (θ)| ≤ sup |F (θ + iy)| ≤ M 1−θ M1θ . 0 y∈R Damit ist (II.17) und folglich (II.14) im Fall p < ∞, q > 1 bewiesen.
Interpolation von Operatoren auf Lp -R¨ aumen
II.4
77
Nehmen wir nun den Fall p = ∞ an. Dann muß auch p0 = p1 = ∞ sein. Im Fall q = q0 = q1 = 1 ist nichts zu zeigen. Im Fall q > 1 argumentiere wie oben (f braucht nun nicht mehr integrierbar zu sein), setze aber fz = f f¨ ur alle z. Analog wird der Fall q = 1, p < ∞ behandelt. Nun zum reellen Fall. Dieser ergibt sich aus (II.14) und der folgenden ¨ Uberlegung. Sei U : LrR → LsR ein stetiger Operator zwischen reellen Funktionenr¨ aumen. U hat verm¨ oge UC (f + ig) = U f + i U g eine kanonische Fortsetzung zu einer C-linearen Abbildung UC : LrC → LsC , f¨ ur die UC ≤ 2 U gilt (Aufgabe II.5.4). Die behauptete Ausdehnbarkeit auf Lp (μ) ist wegen Satz II.1.5 trivial. Damit ist der Satz von Riesz-Thorin vollst¨ andig bewiesen. 2 Das folgende Beispiel zeigt, daß im reellen Fall (II.14) nicht zu gelten braucht. Wir betrachten auf R2 die lineare Abbildung T (s, t) = (s+t, s−t). Man best¨ atigt schnell, daß T : ∞ (2) → 1 (2) = 2 und T : 2 (2) → 2 (2) = 21/2 ist. (II.14) w¨ urde dann f¨ ur p0 = ∞, q0 = 1, p1 = q1 = 2, θ = 12 (also p = 4, q = 43 ) (s + t, s − t) 4/3 ≤ 23/4 (s, t) 4 lauten, was aber nicht stimmt (setze etwa s = 2, t = 1). Nun beschreiben wir eine Anwendung des Satzes von Riesz-Thorin; eine weitere wird in Satz V.2.10 gegeben. Es sei T = {z ∈ C: |z| = 1} = {eit : dt 0 ≤ t ≤ 2π}; wir betrachten auf T das normalisierte Lebesguemaß 2π . F¨ ur 1 zwei komplexwertige Funktionen f, g ∈ L (T) setze
2π
(f ∗ g)(e ) = is
f (eit )g(ei(s−t) ) 0
dt . 2π
Die Funktion f ∗ g heißt Faltung (engl. convolution) von f und g. Sie ist meßbar, und die Absch¨ atzung
2π
|(f ∗ g)(eis )| 0
ds ≤ 2π
2π 2π
|f (eit )| |g(ei(s−t) )| 0
0
2π
|f (e )| 0
0 2π
|f (eit )|
≤ 0
= f L1 g L1 zeigt f ∗ g ∈ L1 (T).
2π
|g(ei(s−t) )|
it
=
dt ds 2π 2π
dt g L1 2π
ds dt 2π 2π
(Fubini)
78
II.
Funktionale und Operatoren
Satz II.4.4 (Youngsche Ungleichung) Seien 1 ≤ p, q ≤ ∞ und 1r := p1 + 1q −1 ≥ 0. Falls f ∈ Lp (T) und g ∈ Lq (T), so ist f ∗ g ∈ Lr (T), und es gilt f ∗ g Lr ≤ f Lp g Lq . Beweis. Bemerke zuerst, daß f ∗g wegen Lp (T), Lq (T) ⊂ L1 (T) wohldefiniert ist. Sei nun f ∈ L1 (T) fest. Dann gilt (siehe oben) f ∗ g L1 ≤ f L1 g L1 , mit anderen Worten, der Operator T g = f ∗ g gen¨ ugt der Ungleichung T : L1 → L1 ≤ f L1 . Es ist klar, daß außerdem T : L∞ → L∞ ≤ f L1 gilt. Also impliziert (II.14) f¨ ur θ = nenten bezeichnet, daß
1 q ,
wo q den zu q konjugierten Expo-
T : Lq → Lq ≤ f L1 . Das bedeutet f ∗ g Lq ≤ f L1 g Lq
∀f ∈ L1 (T), g ∈ Lq (T).
(II.20)
Nun halten wir g ∈ Lq (T) fest und variieren f . Die H¨oldersche Unglei chung liefert f¨ ur f ∈ Lq (T) und eis ∈ T 2π dt |(f ∗ g)(eis )| ≤ |f (eit )| |g(ei(s−t) )| 2π 0 2π 1/q 2π 1/q dt it q dt ≤ |f (e )| |g(eit )|q 2π 2π 0 0 q = f Lq g L . F¨ ur den Operator Sf = f ∗ g gilt daher nach (II.20) und der obigen Absch¨ atzung S: L1 → Lq ≤ g Lq ,
S: Lq → L∞ ≤ g Lq . θ osen liefert θ = W¨ ahle θ so, daß sich p1 = 1−θ 1 + q ergibt; Aufl¨ 1 1 0 ≤ θ ≤ 1, da p + q ≥ 1. Mit dieser Wahl von θ ist dann
1−θ θ 1 1 1 + = − = . q ∞ q p r
q p .
Es ist
II.4
Interpolation von Operatoren auf Lp -R¨ aumen
79
Daher liefert der Satz von Riesz-Thorin S: Lp → Lr ≤ g Lq , das heißt f ∗ g Lr ≤ f Lp g Lq
∀f ∈ Lp (T), g ∈ Lq (T).
2
Abschließend wird die Frage er¨ ortert, ob durch Interpolation kompakter Operatoren wieder kompakte Operatoren entstehen. Es zeigt sich, daß es in der Tat ausreicht, daß einer der Operatoren, zwischen denen interpoliert wird, kompakt ist. Satz II.4.5 Es seien die Voraussetzungen und Bezeichnungen des Satzes von Riesz-Thorin angenommen. Zus¨atzlich sei T : Lp0 (μ) → Lq0 (ν) kompakt. Dann ist T : Lp (μ) → Lq (ν) kompakt. Beweis. Wir geben den Beweis nur f¨ ur den Spezialfall, daß ν das Lebesgueur den allgemaß auf [0, 1] oder R ist, und wir nehmen noch q0 < ∞ an. F¨ meinen Fall sei z.B. auf Bennett/Sharpley [1988] oder Persson (Arkiv Mat. 5 (1964) 215–219) verwiesen, wo die Idee ¨ ahnlich wie in unserem Spezialfall, technisch aber etwas verwickelter ist. Unter den gemachten Zusatzvoraussetzungen wissen wir n¨amlich, daß es eine Folge (Sn ) linearer Abbildungen mit endlichdimensionalem Bild gibt, die simultan auf allen Lr -R¨ aumen definiert sind und sup Sn : Lq1 → Lq1 < ∞,
(II.21)
n∈N
Sn T − T : Lp0 → Lq0 → 0 erf¨ ullen (siehe Korollar II.3.6 und Aufgabe II.5.29). Interpolieren wir nun die Operatoren Sn T − T , so erh¨ alt man aus (II.14) bzw. (II.15) Sn T − T : Lp → Lq ≤ 2 Sn T − T : Lp0 → Lq0 1−θ Sn T − T : Lp1 → Lq1 θ ≤ 2 Sn T − T : Lp0 → Lq0 1−θ T : Lp1 → Lq1 θ × Sn − Id: Lq1 → Lq1 θ → 0, da der letzte Faktor wegen (II.21) beschr¨ ankt bleibt. Weil Sn T ein Operator mit endlichdimensionalem Bild ist, ist T ∈ F (Lp , Lq ); nach Korollar II.3.3 ist T deshalb kompakt. 2
80
II.
II.5
Funktionale und Operatoren
Aufgaben
Aufgabe II.5.1 Sei P der Vektorraum aller Polynome auf R. F¨ ur reellwertigen n n ein Polynom p(t) = k=0 ak tk setze p = k=0 |ak |. (a) (P, . ) ist ein normierter Raum. Ist er vollst¨ andig? (b) Untersuche, ob folgende lineare Abbildungen : P → R stetig sind, und bestimme gegebenenfalls :
1
p(t) dt,
(p) =
(p) = p (0),
(p) = p (1).
0
(c) Untersuche, ob folgende lineare Abbildungen T : P → P stetig sind, und bestimme gegebenenfalls T :
(T p)(t) = p(t + 1),
t
(T p)(t) =
p(s) ds. 0
Aufgabe II.5.2 Auf jedem unendlichdimensionalen normierten Raum existiert eine unstetige lineare Abbildung nach K. (Hinweis: Man muß mit einer Basis des Vektorraums (im Sinn der linearen Algebra) arbeiten.) Aufgabe II.5.3 Sei X ein normierter Raum, und seien S, T : X → X lineare Abbildungen mit ST − T S = Id. Dann ist S oder T unstetig. onnen (Hinweis: Zeige zuerst ST n+1 −T n+1 S = (n+1)T n . Fortgeschrittene Leser k¨ die Aussage auch aus Lemma IX.1.5 herleiten.) Ist X der Raum der C ∞ -Funktionen auf einem Intervall (mit irgendeiner Norm) ullt; f¨ ur diese und (Sf )(t) = f (t), (T f )(t) = t f (t), so ist die Voraussetzung erf¨ Wahl von S und T ist ST − T S = Id eine Umformulierung der Heisenbergschen Unsch¨ arferelation. Die typischen Operatoren der Quantenmechanik sind daher unbeschr¨ ankt. Aufgabe II.5.4 Sei U : LpR (μ) → LqR (μ) ein stetiger linearer Operator zwischen den R¨ aumen reellwertiger Funktionen LpR und LqR . Definiere UC : LpC (μ) → LqC (μ) durch UC (f + ig) = U f + i U g. Zeige UC ≤ 2U . Gib ein Beispiel, wo UC > U . Aufgabe II.5.5 (a) Sei
K (R) = f : R → K: f stetig, supp(f ) := {t: f (t) = 0} kompakt
der Vektorraum aller stetigen Funktionen mit kompaktem Tr¨ ager. (Die abgeschlossene Menge supp(f ) heißt der Tr¨ ager von f .) Dann ist K (R) ur 1 ≤ p < ∞. dicht in Lp (R) f¨ (b) F¨ ur f ∈ Lp (R) (1 ≤ p ≤ ∞) und s ∈ R setze (Ts f )(t) = f (t − s).
II.5
81
Aufgaben
Es ist leicht zu glauben (und auch nicht schwer, mit den Ergebnissen des Anhangs zu zeigen), daß stets Ts f Lp = f Lp f¨ ur f ∈ Lp (R) gilt. Offensichtlich sind die Ts lineare Operatoren auf ur p < ∞ ist Lp (R). Zeige: F¨ lim Ts f − f Lp = 0
s→0
∀f ∈ Lp (R),
(II.22)
aber es gilt nicht lim Ts − Id = 0.
s→0
(Hier ist . nat¨ urlich die Operatornorm.) F¨ ur p = ∞ gilt nicht einmal lim Ts f − f L∞ = 0
s→0
∀f ∈ L∞ (R).
Wegen der Bedingung Ts+t = Ts ◦ Tt , T0 = Id bilden die Ts eine Gruppe von linearen Operatoren. Bedingung (II.22) wird starke Stetigkeit genannt. Solche Operatorgruppen bzw. -halbgruppen sind von großer Bedeutung in der Theorie der Evolutionsgleichungen; siehe Abschnitt VII.4. (Hinweis: Zum Beweis von (II.22) verwende (a)!) Aufgabe II.5.6 (Friedrichsscher Gl¨ attungsoperator) In dieser Aufgabe sei 1 ≤ p < ∞. Setze D (R) = {ϕ ∈ C ∞ (R): supp(ϕ) kompakt}.
(Hier ist C ∞ (R) = n C n (R); supp(ϕ) wurde in Aufgabe II.5.5 definiert.) Definiere Funktionen ψ, ϕ, ϕε zu ε > 0 durch
ψ(t) = wobei a =
e−1/t falls t > 0, 0 falls t ≤ 0,
R
ψ(1 − s2 ) ds
−1
ϕ(t) = a ψ(1 − t2 ),
.
ϕ1/4
ϕ1/2
ϕ1
ϕε (t) =
1 ϕ(t/ε), ε
82
II.
Funktionale und Operatoren
(a) ψ ∈ C ∞ (R), folglich ϕε ∈ D (R) mit R ϕε (s) ds = 1 und supp(ϕε ) ⊂ [−ε, ε]. ur t > 0, wo P2n ein (Hinweis: Zeige induktiv ψ (n) (t) = P2n (1/t)e−1/t f¨ Polynom vom Grade ≤ 2n ist.) (b) F¨ ur f ∈ Lp (R) setze
f (s)ϕε (t − s) ds.
(Tε f )(t) = R
(Man nennt Tε f die Faltung von f und ϕε .) Die Maßtheorie lehrt, daß Tε f wohldefiniert und meßbar ist und daß ebenfalls die Darstellung
f (t − s)ϕε (s) ds
(Tε f )(t) = R
gilt. Zeige durch Anwendung der H¨ olderschen Ungleichung (beachte ϕε = 1/p 1/q ϕε ϕε ) Tε f Lp ≤ f Lp ∀f ∈ Lp (R). (c) lim Tε f − f ∞ = 0 f¨ ur alle f ∈ K (R) und lim Tε f − f Lp = 0 f¨ ur alle ε→0
ε→0
f ∈ Lp (R). (Hinweis: Aufgabe II.5.5(a).) atzlich (d) F¨ ur f ∈ Lp (R) ist Tε f ∈ C ∞ (R), und gilt zus¨ ∃N > 0
f (t) = 0 f¨ ur fast alle t mit |t| ≥ N
(z.B. f ∈ K (R)), so ist sogar Tε f ∈ D (R). (e) D (R) liegt dicht in Lp (R), falls 1 ≤ p < ∞. Aufgabe II.5.7 Betrachte eine 2 × 2-Matrix (aij ) als lineare Abbildung auf K2 . agt, gilt Wenn K2 die euklidische Norm tr¨
√ 1 √ τ + 2δ + τ − 2δ , 2
(aij ) =
wo τ := |a11 |2 + |a12 |2 + |a21 |2 + |a22 |2 , δ := |a11 a22 − a12 a21 |. Aufgabe II.5.8 Eine lineare Abbildung A: Km → Kn werde als (n × m)-Matrix (aij ) dargestellt. (a) Tragen Km und Kn die Summennorm (ti )1 = |ti |, so ist A = max
n
j≤m
|aij |
(Spaltensummennorm).
i=1
(b) Tragen Km und Kn die Maximumsnorm (ti )∞ = max |ti |, so ist A = max
m
i≤n
j=1
|aij |
(Zeilensummennorm).
II.5
83
Aufgaben
Aufgabe II.5.9 Sei A ∈ Rn×n eine symmetrische Matrix, und es sei r(A) = max{|λ|: λ Eigenwert von A}. Betrachte A als eine lineare Abbildung auf Rn . (a) Sei . eine Norm auf Rn , und sei A die zugeh¨ orige Operatornorm. ur die euklidische Norm . 2 . Zeige, daß A ≥ r(A) und A2 = r(A) f¨ (b) An → 0 (bzgl. irgendeiner Norm) genau dann, wenn r(A) < 1. Aufgabe II.5.10 Betrachte den identischen Operator Idp,q : p (n) → q (n) und 1−1 zeige Idp,q = n q p , falls q ≤ p. Aufgabe II.5.11 (a) Zu z ∈ ∞ betrachte Tz : p → p , (Tz x)(n) = z(n)x(n). Berechne Tz . (b) Seien 0 ≤ t1 < . . . < tn ≤ 1 und α1 , . . . , αn ∈ K. Betrachte : C[0, 1] → K, n (x) = i=1 αi x(ti ). Berechne . Aufgabe II.5.12 Zeige p ∼ = p /U , wo U = {(sn ) ∈ p : s2k−1 = 0 ∀k ∈ N}. Aufgabe II.5.13 (a) Seien X und Y normierte R¨ aume, E ⊂ X ein dichter Unterraum und T ∈ L(X, Y ). Falls T |E eine Isometrie ist, ist T ebenfalls eine Isometrie. (b) Betrachte insbesondere X = L1 [0, 1], Y = (C[0, 1]) sowie (T f )(x) = 1 x(t)f (t) dt. Berechne T f . 0 (Hinweis: Beispiel II.1(g).) angige standardnormalverteilte ZufallsAufgabe II.5.14 Seien g1 , g2 , . . . unabh¨ variablen auf einem Wahrscheinlichkeitsraum (Ω, Σ, P). daß f¨ ur 1 ≤ p < ∞ Zeige, ∞ und eine geeignete Konstante cp der durch (an ) → cp n=1 an gn definierte Operator J: 2 → Lp (P) wohldefiniert und isometrisch ist. [Hinweis: Diese Aufgabe setzt Grundkenntnisse der Wahrscheinlichkeitstheorie voraus; nutze aus, daß die Verteilung des Zufallsvektors (g1 , . . . , gn ) rotationsin¨ variant ist. Ubrigens sind Lp (P), Lp [0, 1] und Lp (Rd ) isometrisch isomorph (siehe aume einen zu 2 etwa Guerre-Delabri`ere [1992], S. 134), so daß jeder dieser Lp -R¨ isometrischen abgeschlossenen Unterraum enth¨ alt.] Aufgabe II.5.15 . 1 und . 2 seien Normen auf dem Vektorraum X. (a) Sind . 1 und . 2 ¨ aquivalent, so sind (X, . 1 ) und (X, . 2 ) isomorph. (b) Die Umkehrung gilt nicht. Betrachte dazu den Vektorraum d der abbrechenden Folgen und die Normen (sn )1 = sup{|s1 |, 2|s2 |, |s3 |, 4|s4 |, |s5 |, . . .}, (sn )2 = sup{|s1 |, |s2 |, 3|s3 |, |s4 |, 5|s5 |, . . .}. Aufgabe II.5.16 (Satz von Mazur-Ulam) Sei X ein reeller normierter Raum und Φ: X → X eine surjektive Funktion mit Φ(0) = 0 und Φ(x) − Φ(y) = x − y f¨ ur alle x, y ∈ X. Dann ist Φ linear. Beweise diese Aussage unter der Zusatzvoraussetzung, daß X strikt konvex ist (vgl. Aufgabe I.4.13); dazu zeige zuerst, daß in diesem Fall z = 12 (x + y) der einzige Punkt mit z − x = z − y = 12 x − y ist. [Der Beweis des Satzes von Mazur-Ulam im allgemeinen Fall ist schwieriger und bei Banach [1932], S. 166, oder V¨ ais¨ al¨ a (Amer. Math. Monthly 110 (2003) 633–635) zu finden.]
84
II.
Funktionale und Operatoren
Aufgabe II.5.17 L¨ ose die Integralgleichung
1
x(s) −
2st x(t) dt = sin πs,
s ∈ [0, 1],
0
(a) mit der Methode der Neumannschen Reihe (begr¨ unde insbesondere, warum diese konvergiert, obwohl hier Tk = 1 ist), (b) durch scharfes Hinsehen“. ” Aufgabe II.5.18 Seien X und Y normierte R¨ aume, und sei T ∈ L(X, Y ).
(a) Es existiert ein wohldefinierter linearer Operator T, so daß das folgende Diagramm kommutiert (d.h. T = T ◦ ω): T -Y X
@ ω@ @ R @
T
X/ ker(T )
Hier ist ω die kanonische Abbildung x → [x] von X auf X/ ker(T ).
(b) T = T, und T ist injektiv.
(c) T ist genau dann kompakt, wenn T kompakt ist.
(d) Falls T eine Quotientenabbildung ist, ist T eine Isometrie. Also gilt in diesem Fall Y ∼ = X/ ker(T ). Aufgabe II.5.19 (a) Sei ∈ X mit = 1. Dann ist eine Quotientenabbildung. (b) Schließe mit Hilfe von Aufgabe II.5.18 die Formel von Ascoli : |(x)| = d(x, ker())
∀ ∈ X , = 1.
(c) Teil (b) gestattet es, leicht Beispiele zu konstruieren, um zu zeigen, daß im Rieszschen Lemma I.2.6 im allgemeinen δ = 0 nicht zul¨ assig ist. Sei n¨ amlich wie oben, und setze U = ker(). Dann ist δ = 0 genau dann zul¨ assig, wenn es ein x0 ∈ BX mit = |(x0 )| gibt. (In diesem Fall sagt man, daß seine Norm annimmt.) (d) Folgende Funktionale nehmen ihre Norm nicht an:
• X = c0 , (sn ) =
∞
• X = C[0, 1], (x) =
n=1
1/2 0
2−n sn
x(t) dt −
1 1/2
x(t) dt
Aufgabe II.5.20 Zeige Satz II.2.3(a) f¨ ur p = 1 und Satz II.2.3(b). Aufgabe II.5.21 Sei 1 < p < ∞ und k ∈ C([0, 1]2 ). Zeige, daß der Integraloperator 1
Tk f (s) =
k(s, t)f (t) dt 0
II.5
85
Aufgaben
ein stetiger Operator von Lp [0, 1] in sich ist, f¨ ur dessen Norm
Tk ≤ sup s
1/q
1
|k(s, t)| dt
|k(s, t)| ds
sup t
0
1/p
1
0
p p gilt, wo 1/p + 1/q = 1. Ferner ist Tk : L [0, q1] → L [0, 1] kompakt. ur g ∈ L [0, 1], oder benutze (II.2).) (Tip: Betrachte (Tk f )(s)g(s) ds f¨
Aufgabe II.5.22 Sei M ⊂ C[a, b] relativkompakt. Dann ist M gleichgradig stetig. aquivalent: Aufgabe II.5.23 Sei 1 ≤ p < ∞ und A ⊂ p . Dann sind ¨ (i) A ist relativkompakt. (ii) A ist beschr¨ ankt und lim sup
∞
n→∞ x∈A
1/p |x(i)|p
= 0.
i=n
(Hinweise: (i) ⇒ (ii): Versuche einen Widerspruchsbeweis. (ii) ⇒ (i): Benutze die Beschr¨ anktheit, um aus einer Folge in A eine punktweise konvergente Teilfolge auszusondern (Diagonalfolgentrick!); zeige mit Hilfe der Limesbedingung, daß die Teilfolge auch in p konvergiert.) Aufgabe II.5.24 (a) Sei z ∈ ∞ und Tz : p → p , Tz (x) = z · x (vgl. Aufgabe II.5.11). Tz ist kompakt dann und nur dann, wenn z ∈ c0 ist. (b) C 1 [0, 1] trage (wie u ¨blich) die Norm f = f ∞ + f ∞ . Dann ist die Inklusionsabbildung (C 1 [0, 1], . ) → (C[0, 1], . ∞ ) kompakt. (Tip: Arzel` a-Ascoli!) ur s = t bzw. Aufgabe II.5.25 Betrachte die Kernfunktion k(s, t) = |s − t|−α f¨ k(s, s) = 0 auf [0, 1]2 . (a) Sei 0 < α < 1/2. Dann ist der zugeh¨ orige Integraloperator Tk ein kompakter Operator von L2 [0, 1] nach L2 [0, 1]. (b) Was passiert im Fall 1/2 ≤ α < 1? (Tip: H¨ oldersche Ungleichung.) Aufgabe II.5.26 Sei k ∈ C([0, 1]2 ). Der Integraloperator Tk : C[0, 1] → C[0, 1],
s
(Tk x)(s) =
k(s, t)x(t) dt, 0
heißt dann Volterrascher Integraloperator. Zeige, daß Tk wohldefiniert und kompakt ist. Aufgabe II.5.27 Betrachte die normierte Summe Z = X ⊕p Y zweier normierter R¨ aume X und Y , wo 1 ≤ p ≤ ∞. Beschreibe den Dualraum von Z mit Hilfe der Dualr¨ aume von X und Y .
86
II.
Funktionale und Operatoren
Aufgabe II.5.28 Sei E1 , E2 , . . . eine Folge von Banachr¨ aumen, und sei 1 ≤ p ≤ ∞. Man setzt
p
En =
(xn ): xn ∈ En , (xn )p =
∞
1/p
xn
p
0 eine Konstante Cε mit T x ≤ εx + Cε JT x
∀x ∈ X.
(Hinweis: Versuche einen Widerspruchsbeweis!) Aufgabe II.5.32 Sei X ein Banachraum und T ∈ K(X).
87
II.6 Bemerkungen und Ausblicke
(a) Dann ist der Kern von Id − T endlichdimensional. (b) Ist Id − T bijektiv, so ist (Id − T )−1 stetig. (Bemerkung: Das gilt auch f¨ ur bloß stetige T , ist aber wesentlich schwieriger zu beweisen; siehe Korollar IV.3.4.) (c) Falls X unendlichdimensional ist, ist d(Id, K(X)) = 1. (Tip: K = Id − (Id − K); beachte die Neumannsche Reihe.) Aufgabe II.5.33 Sei (amn )m,n∈N eine unendliche Matrix u ¨ ber C mit α := sup |amn | < ∞, m,n ∞
amn apn = δmp =
1 0
n=1
Sei 1 ≤ p ≤ 2 und
1 p
+
1 p p
m = p. m = p.
= 1. Dann definiert A: (sn )n → (
stetigen Operator von nach
p
n
amn sn )m einen
mit
A: p → p ≤ α1/p−1/p . (Tip: Betrachte zuerst A: 1 → ∞ , A: 2 → 2 und interpoliere.) Aufgabe II.5.34 Sei Y ein Banachraum und T eine lineare Abbildung, die stetig als Operator T : L1 (μ) → Y mit Norm M0 und als Operator T : L∞ (μ) → Y mit 1/p 1−1/p . Norm M1 wirkt. Dann ist T : Lp (μ) → Y stetig mit Norm ≤ M0 M1 Anleitung: Betrachte eine Treppenfunktion f mit f Lp = 1. Sei λ > 0 ein noch = f − g ∈ L1 (μ). Schließe freier Parameter. Setze g = f χ{|f |≤λ} ∈ L∞ (μ) und h1−p |f |p dμ ≤ λ1−p . Durch T f ≤ M1 λ + M0 hL1 und hL1 = {|f |>λ} |f | 1/p
geschickte Wahl von λ erziele T f ≤ M0
II.6
1−1/p
M1
.
Bemerkungen und Ausblicke
Die Untersuchung von Integraloperatoren stand von Anfang an im Zentrum der Funktionalanalysis. Hilbert und Schmidt befaßten sich – im Prinzip – in ihren im Kapitel VI genauer vorgestellten Arbeiten mit Operatoren auf L2 [a, b]. F. Riesz studierte 1918 (Acta Math. 41 (1918) 71–98) kompakte Operatoren – pars pro toto – auf C[a, b]; aber er erkannte bereits, daß die in der Arbeit gemachte Einschr¨ ankung [. . .] auf stetige Funktionen oh” ne Belang“ ist, wie bereits in Abschnitt I.5 zitiert wurde. Die Arbeit von Riesz kann also als Ausgangspunkt der Theorie kompakter Operatoren auf Banachr¨ aumen angesehen werden. Die ¨ altere Nomenklatur f¨ ur kompakte Operatoren lautet u ¨ brigens vollstetige Operatoren; mehr dazu in den Bemerkungen zum n¨ achsten Kapitel. Das Problem, ob kompakte Operatoren stets durch endlichdimensionale approximiert werden k¨ onnen, mit anderen Worten, ob Korollar II.3.6 f¨ ur jeden Banachraum Y gilt, wurde erst 1973 von Enflo (Acta Math. 130 (1973)
88
II.
Funktionale und Operatoren
309–317) durch ein Gegenbeispiel gel¨ ost. Es ist dazu ¨aquivalent, ob f¨ ur k ∈ C([0, 1]2 ) stets
1
k(s, t)k(t, u) dt = 0 ∀s, u ∈ [0, 1] ⇒ 0
1
k(s, s) ds = 0
(II.23)
0
gilt. (Ist k ein Gegenbeispiel hierzu, so ist Y = lin{k(s, . ): s ∈ [0, 1]} ⊂ C[0, 1] ein Gegenbeispiel zum Approximationsproblem, siehe Lindenstrauss/ Tzafriri [1977], S. 35.) Die Frage nach (II.23) wurde schon im Schottischen Buch aufgeworfen (Problem 153, datiert von 6. November 1936; Mauldin [1981], S. 231); als Preis f¨ ur die Antwort war eine lebende Gans“ ausgesetzt ” worden. In der Tat wurde Enflo sein Preis 1972 in Warschau u ¨berreicht, das Ereignis ist auf einem Foto in Kalu˙za [1996] abgebildet. Gilt Korollar II.3.6 f¨ ur einen Banachraum Y , so sagt man nach Grothendieck1 (Mem. Amer. Math. Soc. 16 (1955)), Y habe die Approximationseigenschaft. Alle klas” sischen“ Funktionen- und Folgenr¨ aume besitzen diese Eigenschaft, wie in Korollar II.3.6 festgestellt wurde, und es ist auch heute nicht einfach, Gegenbeispiele zu produzieren; man vergleiche dazu etwa Lindenstrauss/Tzafriri [1977], S. 87–90. Es ist ein außerordentlich bemerkenswertes Resultat von Szankowski (Acta Math. 147 (1981) 89–108), daß der nicht separable Raum Y = L(2 ) nicht die Approximationseigenschaft besitzt; Pisiers Darstellung des sehr schwierigen Beweises im S´eminaire Bourbaki (Lecture Notes in Math. 770, S. 312–327) ist die einzige mir bekannte mathematische Arbeit, die mit dem Ausruf Uff!“ endet. ” Die Neumannsche Reihe ist nach C. Neumann (nicht J. von Neumann) benannt, der eine solche Reihe im Jahre 1877 in der Potentialtheorie verwandte (Dieudonn´e [1981], S. 43). Die im Text skizzierte Anwendung auf Integralgleichungen verdankt man E. Schmidt (Math. Ann. 64 (1907) 161– 174). Eine allgemeinere Variante der Neumannschen Reihe zeigt, daß Id− T nicht nur f¨ ur einen Banachraumoperator T mit T < 1 ein Isomorphismus ist, sondern auch, wenn bloß ein λ < 1 mit T x ≤ λ( x + x − T x ) f¨ ur alle x existiert (Hilding, Ann. Math. 49 (1948) 953–955; dazu siehe auch Casazza/Kalton, Proc. Amer. Math. Soc. 127 (1999) 519–527). Riesz war es auch, der bemerkte, daß man es in der Lp -Theorie, die er in Math. Ann. 69 (1910) 449–497 initiierte, f¨ ur p = 2 nicht nur mit einem Funktionenraum zu tun hat, sondern der Raum Lq mit dem konjugierten p Exponenten q = p−1 auf vollkommen nat¨ urliche Weise ebenfalls ins Spiel kommt; im Fall p = 2 wird diese Tatsache dadurch verschleiert, daß L2 zu p q ∼ sich selbst dual ist. Insbesondere bewies er L [a, b] = L [a, b], wodurch 1 Eine Biographie uber diesen wahrlich bemerkenswerten Mathematiker von W. Schar¨ lau ist in Vorbereitung; siehe www.math.uni-muenster.de/math/u/scharlau/scharlau oder www.grothendieckcircle.org. Ein sehr informativer biographischer Artikel von A. Jackson ist inzwischen im Oktober- bzw. Novemberheft des Jahrgangs 2004 der Notices of the American Mathematical Society erschienen.
II.6
Bemerkungen und Ausblicke
89
die Grundlage der Dualit¨ atstheorie gelegt wurde, die allerdings erst in dem Moment wirklich befriedigend wird, wo der Dualraum eines allgemeinen normierten Raums als hinreichend umfassend erkannt wird. Das werden wir in Kapitel III mit dem Satz von Hahn-Banach erreichen. Wieder stellt Riesz fest, daß der von ihm diskutierte partikul¨are Fall der Lp -R¨aume u ¨ ber kompakten Intervallen im Kern den allgemeinen enth¨alt: Unsere Resultate gelten f¨ ur alle entsprechenden Klassen von Funktionen, die f¨ ur eine meßbare Menge beliebiger Dimension von nicht verschwindendem Inhaltsmaße erkl¨ art werden; es ist nat¨ urlich auch der Begriff des Inhaltsmaßes entsprechend zu deuten.
(Ebd., S. 496.) Daß L∞ [a, b] zu L1 [a, b] dual ist, ist ein Resultat von Steinhaus (Math. Zeitschrift 5 (1919) 186–221). Um allgemein L1 (μ) als L∞ (μ) darstellen zu k¨ onnen, muß man wirklich eine Endlichkeitsvoraussetzung an den Maßraum stellen; wie im Text bereits bemerkt, ist das f¨ ur p > 1 u ussig. ¨ berfl¨ Hier ein Beispiel: Sei Ω = [0, 1], Σ die σ-Algebra aller Teilmengen von [0, 1], die selbst oder deren Komplemente h¨ ochstens abz¨ahlbar sind, und μ 1 das z¨ ahlende Maß. Dann ist (f ) = 0 f (t)t dμ(t) ein wohldefiniertes stetiges lineares Funktional auf L1 (μ). Es kann aber nicht durch ein g ∈ L∞ (μ) dargestellt werden; dazu k¨ ame n¨ amlich als einziges die Funktion g(t) = t in Frage, aber die ist nicht meßbar. (Gleichwohl definieren die Produkte f (t)t ur h¨ochstens f¨ ur f ∈ L1 (μ) meßbare Funktionen, denn dann istf (t) = 0 f¨ abz¨ ahlbar viele t.) Eine genaue Untersuchung von L1 (μ) findet man bei Behrends [1987], S. 184ff. Man kann auch f¨ ur die Dualr¨ aume von ∞ und L∞ konkrete Darstellungen angeben, n¨ amlich durch R¨ aume additiver (aber nicht σ-additiver) Mengenfunktionen; siehe Dunford/Schwartz [1958], S. 296. Diese Darstellungen sind aber bei weitem nicht so n¨ utzlich wie die in Abschnitt II.2 vorgestellten. Der Rieszsche Darstellungssatz II.2.5 wurde von ihm zun¨achst f¨ ur K = [0, 1] bewiesen (C. R. Acad. Sc. Paris 149 (1909) 1303–1305), wobei er die Funktionale durch Stieltjes-Integrale darstellte; die endg¨ ultige Fassung stammt von Kakutani (Ann. of Math. 42 (1941) 994–1024). Der Satz gilt genauso, wenn K bloß lokalkompakt ist und statt C(K) der Raum der im ” Unendlichen verschwindenden“ stetigen Funktionen C0 (K) = f : K → K: f stetig; {t: |f (t)| ≥ ε} kompakt ∀ε > 0 mit der Supremumsnorm betrachtet wird. Eine andere Variante des Rieszschen Darstellungssatzes stellt die positiven linearen Funktionale auf K (K) = {f : K → K: f stetig, supp(f ) kompakt}, K lokalkompakt, durch positive regul¨ are Borelmaße, die aber nicht endlich zu sein brauchen, dar; Beweise findet man bei Rudin [1986], S. 40ff., oder
90
II.
Funktionale und Operatoren
Behrends [1987], S. 217ff. Dies ist umgekehrt der Ausgangspunkt f¨ ur die Integrationstheorie a` la Bourbaki. F¨ ur Bourbaki ist ein Maß ein Funktional auf K (K) und keine σ-additive Mengenfunktion; eine konzise Darstellung gibt Pedersen [1989]. Korollar II.2.7 motiviert folgendes quantitative Konzept zur Untersuchung der Isomorphie von Banachr¨ aumen. Der Banach-Mazur-Abstand zwischen zwei isomorphen Banachr¨ aumen X und Y ist erkl¨art als d(X, Y ) = inf{ T T −1 : T : X → Y Isomorphismus}. Die Funktion d erf¨ ullt die multiplikative Dreiecksungleichung d(X, Z) ≤ d(X, Y )d(Y, Z); eigentlich sollte also log d Abstand“ genannt werden. Das ” Argument von Satz II.1.10(a) zeigt in dieser Sprechweise, daß d(c, c0 ) ≤ 4 gilt; der pr¨ azise Wert ist d(c, c0 ) = 3 (Cambern, Studia Math. 30 (1968) 73–77). Insbesondere ist es wichtig, den Banach-Mazur-Abstand zwischen endlichdimensionalen aumen als Funktion ihrer Dimension abzusch¨atzen. R¨ ur alle n-dimensionalen R¨aume, also d(X, Y ) ≤ (II.9) zeigt d X, 1 (n) ≤ n f¨ n2 , falls dim X = dim Y = n. Ein wesentlich sch¨arferes Resultat stellt der Satz von F. John aus dem Jahre 1948 dar, der z.B. in Bollob´ as [1990] bewiesen wird. Er lautet: √ • F¨ ur alle n-dimensionalen R¨aume gilt d X, 2 (n) ≤ n; also folgt d(X, Y ) ≤ n, falls dim X = dim Y = n. Erst Anfang der 80er Jahre zeigte Gluskin (Funct. Anal. Appl. 15 (1981) 72– 73) mit wahrscheinlichkeitstheoretischen Methoden, daß der Satz optimal ist, indem er die Existenz einer Skala von n-dimensionalen R¨aumen mit 1 ∞ inf d(Xn , Yn )/n > 0 nachwies; √ bemerkenswerterweise ist d (n), (n) nur von der Gr¨oßenordnung n und nicht n. In den Beispielen II.1(n) und II.3(e) wurde ein schwach singul¨arer Integraloperator diskutiert. Allgemeiner sei Ω ⊂ Rn offen (oder eine n-dimensionale Mannigfaltigkeit). Eine Kernfunktion auf Ω × Ω der Gestalt ⎧ ⎨ r(s, t) falls s = t, k(s, t) = |s − t|α ⎩ 0 falls s = t mit einer auf (Ω × Ω) \ {(t, t): t ∈ Ω} stetigen und beschr¨ankten Funktion r gibt Anlaß zu einem schwach singul¨aren Integraloperator, falls α < n ist. Solche Operatoren sind auf den meisten Funktionenr¨aumen kompakt, wenn Ω beschr¨ ankt ist. Im Fall α = n spricht man von singul¨aren Integraloperatoren; sie sind in der Regel nicht kompakt, schlimmer noch, sie brauchen nicht einmal stetig oder auch nur wohldefiniert zu sein. Paradebeispiel ist die Hilberttransformation ∞ f (t) dt, f ∈ L2 (R). (Hf )(s) = s −∞ − t
II.6
91
Bemerkungen und Ausblicke
Dieses Integral konvergiert im allgemeinen nicht, da t → t−1 in einer Umgebung von 0 nicht integrierbar ist. Es existiert jedoch im Sinn des Cauchyschen Hauptwerts ∞ f (t) f (t) dt = lim dt; CHε→0 {|s−t|≥ε} s − t −∞ s − t und in diesem Sinn ist H ein beschr¨ ankter, aber nicht kompakter Operator auf L2 (R) (siehe etwa Bennett/Sharpley [1988], S. 139). Theorem II.4.2 wurde von M. Riesz, F. Riesz’ Bruder, im Fall pk ≤ qk bewiesen (Acta Math. 49 (1926) 465–497). Er verwendete dazu nichts als die H¨ oldersche Ungleichung, und es stellt sich heraus, daß in diesem Fall (II.14) auch f¨ ur reelle Skalare gilt. Geometrisch im Sinn der Skizze von S. 74 bedeutet die Einschr¨ ankung pk ≤ qk , daß man nur im unteren Teildreieck {(α, β): 0 ≤ β ≤ α ≤ 1} statt im gesamten Quadrat [0, 1]2 interpolieren darf. Der Rieszsche Satz wurde von Thorin (Kungl. Fys. Saell. i Lund For. 8 (1939) #14) in voller Allgemeinheit gezeigt; sein Beweis f¨ uhrt den Interpolationssatz auf den Drei-Geraden-Satz II.4.3, der von Hadamard stammt, zur¨ uck. Dieser Beweisansatz wurde laut Bennett/Sharpley [1988], S. 195, von Littlewood bewundernd die frechste Idee in der Analysis“ genannt. ” Eine andere Interpolationsmethode wurde von Marcinkiewicz ersonnen, um ein qualitativ allgemeineres Resultat zu erzielen. Um es zu formulieren, f¨ uhren wir ein paar Vokabeln ein. Eine lineare Abbildung zwischen R¨aumen meßbarer Funktionen heißt vom starken Typ (p, q), falls f¨ ur eine geeignete Konstante cpq T f Lq ≤ cpq f Lp ∀f ∈ Lp (II.24) gilt, mit anderen Worten, falls T : Lp → Lq < ∞ ist. Der Satz von RieszThorin impliziert also mit den dortigen Bezeichnungen, daß ein Operator vom starken Typ (p0 , q0 ) und vom starken Typ (p1 , q1 ) auch vom starken Typ (p, q) ist. Nun gilt trivialerweise f¨ ur g ∈ Lq (ν) g qLq = |g|q dν ≥ |g|q dν ≥ ν{|g| ≥ λ} λq {|g|≥λ}
f¨ ur alle λ ≥ 0 (das ist die Chebyshev-Ungleichung), daher impliziert (II.24) sup λ ν{|T f | ≥ λ}1/q ≤ cpq f Lp
∀f ∈ Lp .
(II.25)
λ≥0
Nun erf¨ ullen diverse Operatoren der Analysis f¨ ur geeignete Exponenten zwar (II.25), aber nicht (II.24). Erf¨ ullt T die Ungleichung (II.25), so wird T vom schwachen Typ (p, q) genannt; schwacher Typ (p, ∞) werde als starker Typ (p, ∞) verstanden. Ein einfaches Beispiel ist der Operator 1 s f (t) dt (II.26) (T f )(s) = s 0
92
II.
Funktionale und Operatoren
auf L1 [0, 1], der vom schwachen Typ (1, 1), aber nicht vom starken Typ (1, 1) ist, wie man leicht u uft. Es gilt nun der folgende Satz. ¨ berpr¨ • (Interpolationssatz von Marcinkiewicz) Seien 1 ≤ p0 ≤ q0 ≤ ∞, 1 ≤ p1 ≤ q1 ≤ ∞ und q0 = q1 . Sei T ein Operator vom schwachen Typ (p0 , q0 ) und vom schwachen Typ (p1 , q1 ). Ist 0 < θ < 1 und sind p und q wie in (II.13), so ist T vom starken Typ (p, q). Beachte die einschr¨ ankende Voraussetzung pk ≤ qk , die hier wirklich wesentlich ist. Da der in (II.26) definierte Operator trivialerweise vom starken Typ (∞, ∞) ist, schließt man aus dem Interpolationssatz von Marcinkiewicz, daß T f¨ ur alle 1 < p < ∞ ein stetiger Operator von Lp [0, 1] in sich ist. Dies folgt nicht aus dem Satz von Riesz-Thorin, und die Aussage direkt zu beweisen ist nicht offensichtlich. Ein weiterer Vorzug des Marcinkiewiczschen Interpolationssatzes gegen¨ uber dem Riesz-Thorinschen ist, daß er auch auf quasilineare Operatoren anwendbar ist, d.h. solche Abbildungen, die bloß |T (f + g)| ≤ c(|T f | + |T g|),
|T (λf )| = |λ| |T f |
erf¨ ullen. Sein Nachteil ist, daß er schwieriger zu beweisen ist, siehe Zygmund [1959], vol. II, S. 112ff., oder f¨ ur eine etwas allgemeinere Version Bennett/Sharpley [1988], S. 225ff. Sowohl die Methode von Thorin als auch die von Marcinkiewicz haben zu abstrakten Interpolationsverfahren zwischen Paaren von Banachr¨aumen Anlaß gegeben, n¨ amlich zur komplexen bzw. reellen Interpolationsmethode. So kann man etwa zwischen C[0, 1] und C 1 [0, 1] interpolieren und auf diese Weise R¨ aume h¨olderstetiger Funktionen gewinnen, Interpolation zwischen Sobolevr¨ aumen (siehe Abschnitt V.2) liefert die sog. Besovr¨aume, Interpolation zwischen K(H) und N (H) (siehe Abschnitt VI.5) liefert die Schattenklassen etc. Die Interpolationstheorie wird umfassend in Bennett/Sharpley [1988], Bergh/L¨ofstr¨ om [1976] und Triebel [1978] dargestellt.
Kapitel III
Der Satz von Hahn-Banach und seine Konsequenzen
III.1
Fortsetzungen von Funktionalen
Im letzten Kapitel wurde die Darstellung von stetigen linearen Funktionalen f¨ ur eine Reihe normierter R¨ aume angegeben. Es ist jedoch bis jetzt nicht klar, ob es u ¨ berhaupt auf jedem normierten Raum ein stetiges lineares Funktional = 0 gibt (versuche z.B. den Quotientenraum ∞ /c0 ). Die Existenz von Funktionalen mit vorgeschriebenen Eigenschaften zu beweisen ist das Thema dieses Kapitels. Der grundlegende Existenzsatz III.1.2 geh¨ort von der Aussage her in die lineare Algebra. Wir formulieren ihn zun¨ achst f¨ ur reelle Vektorr¨aume. Die folgende Definition bezieht sich jedoch auf reelle oder komplexe Vektorr¨ aume. Definition III.1.1 Sei X ein Vektorraum. Eine Abbildung p: X → R heißt sublinear, falls (a) p(λx) = λp(x) f¨ ur alle λ ≥ 0, x ∈ X, (b) p(x + y) ≤ p(x) + p(y) f¨ ur alle x, y ∈ X. Beachte, daß diese Definition rein algebraisch ist (es ist nicht von einem normierten Raum die Rede) und daß sublineare Abbildungen negative Werte annehmen d¨ urfen. Hingegen sind sie auch f¨ ur komplexe Vektorr¨aume reellwertig. Beispiele. (a) Jede Halbnorm ist sublinear. (b) Jede lineare Abbildung auf einem reellen Vektorraum ist sublinear. (c) (tn ) → lim sup tn ist sublinear auf dem reellen Raum ∞ ; (tn ) → lim sup Re tn ist sublinear auf dem komplexen Raum ∞ . Weitere Beispiele (Minkowskifunktionale) werden im n¨achsten Abschnitt vorgestellt.
94
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Satz III.1.2 (Satz von Hahn-Banach; Version der linearen Algebra) Sei X ein reeller Vektorraum, und sei U ein Untervektorraum von X. Ferner seien p: X → R sublinear und : U → R linear mit (x) ≤ p(x)
∀x ∈ U.
Dann existiert eine lineare Fortsetzung L: X → R, L|U = , mit L(x) ≤ p(x)
∀x ∈ X.
Beweis. Der Beweis besteht aus zwei Teilen. Zuerst wird gezeigt, wie man so ein L findet, wenn X eine Dimension mehr als U hat, wenn also dim X/U = 1 ist. Dann folgt ein Induktionsschritt. Von U ausgehend nimm eine Dimension zu U hinzu und l¨ ose das Fortsetzungsproblem nach Schritt 1, nimm eine weitere Dimension hinzu und l¨ ose das Fortsetzungsproblem usw. Die mathematische Pr¨ azisierung des usw.“-Schritts besteht in der Verwendung ” des Zornschen Lemmas. Im ersten Schritt zeigen wir also, daß das Fortsetzungsproblem l¨osbar ist, wenn dim X/U = 1 ist. Sei x0 ∈ X \ U beliebig. Jedes x ∈ X l¨aßt sich dann eindeutig als x = u + λx0
(u ∈ U, λ ∈ R)
schreiben. Sei r ∈ R ein noch freier Parameter. Der Ansatz Lr (x) = (u) + λr definiert dann eine lineare Abbildung, die fortsetzt. Durch passende Wahl von r werden wir Lr ≤ p sicherstellen. In der Tat gilt Lr ≤ p genau dann, wenn (u) + λr ≤ p(u + λx0 )
∀u ∈ U, λ ∈ R
(III.1)
gilt. Nach Voraussetzung gilt (III.1) f¨ ur λ = 0 und alle u ∈ U . Sei λ > 0. Dann gilt (III.1) genau dann, wenn
⇔ ⇔
λr ≤ p(u + λx0 ) − (u) ∀u ∈ U u u + x0 − ∀u ∈ U r ≤ p λ λ r ≤ inf p(v + x0 ) − (v) . v∈U
Analog ist im Fall λ < 0 die Bedingung (III.1) ¨aquivalent zu
⇔ ⇔
λr ≤ p(u + λx0 ) − (u) ∀u ∈ U u u −r ≤ p − x0 − ∀u ∈ U −λ −λ r ≥ sup (w) − p(w − x0 ) . w∈U
III.1
95
Fortsetzungen von Funktionalen
Daher existiert r ∈ R mit Lr ≤ p genau dann, wenn (w) − p(w − x0 ) ≤ p(v + x0 ) − (v)
∀v, w ∈ U
gilt, also dann und nur dann, wenn (v) + (w) ≤ p(v + x0 ) + p(w − x0 )
∀v, w ∈ U
(III.2)
gilt. Da die Absch¨ atzung (v) + (w) = (v + w) ≤ p(v + w) ≤ p(v + x0 ) + p(w − x0 ) (III.2) beweist, ist der erste Schritt gezeigt. Im zweiten Schritt wenden wir das Zornsche Lemma an. Es lautet: Sei (A, ≤) eine teilweise geordnete nichtleere Menge, in der jede Kette (das ist eine total geordnete Teilmenge, also eine Teilmenge, f¨ ur deren Elemente stets a ≤ b oder b ≤ a gilt) eine obere Schranke besitzt. Dann liegt jedes Element von A unter einem maximalen Element von A, also einem Element m mit m ≤ a ⇒ a = m. Wir verwenden V Unterraum von X mit U ⊂ V ; A := (V, LV ): LV : V → R linear mit LV ≤ p|V , LV |U = mit der Ordnung (V1 , LV1 ) ≤ (V2 , LV2 ) ⇔ V1 ⊂ V2 , LV2 |V1 = LV1 . Es ist A = ∅, da (U, ) ∈ A. Ist (Vi , LVi )i∈I total geordnet, so ist in der Tat (V, LV ) mit V = Vi , LV (x) = LVi (x) f¨ ur x ∈ Vi i∈I
eine obere Schranke; LV ist wohldefiniert, da (Vi , LVi )i∈I total geordnet ist. Sei nun m = (X0 , LX0 ) ein maximales Element. W¨are X0 = X, so g¨abe es nach dem ersten Schritt eine echte Majorante von m, und m k¨onnte nicht maximal sein. Es folgt X0 = X, und L := LX0 l¨ost das Fortsetzungsproblem. Damit ist Satz III.1.2 bewiesen. 2 Beachte, daß der Parameter r im ersten Beweisschritt im allgemeinen nicht eindeutig bestimmt ist. Daher ist auch L im allgemeinen nicht eindeutig bestimmt.
96
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Als n¨ achstes formulieren wir Satz III.1.2 f¨ ur komplexe Vektorr¨aume. F¨ ur C-wertige Abbildungen ergibt (x) ≤ p(x)“ jedoch keinen Sinn. Ein ” C-Vektorraum X ist aber nat¨ urlich auch ein R-Vektorraum; beachte, daß f¨ ur x = 0 dann x und ix linear unabh¨ angig u ¨ber R sind. Satz III.1.2 kann daher auf X sowie R-lineare Funktionale angewandt werden. Es gibt nun einen engen Zusammenhang zwischen R-linearen und C-linearen Funktionalen, den wir zuerst beschreiben. Lemma III.1.3 Sei X ein C-Vektorraum. (a) Ist : X → R ein R-lineares Funktional, d.h. ∀λi ∈ R, xi ∈ X,
(λ1 x1 + λ2 x2 ) = λ1 (x1 ) + λ2 (x2 ) und setzt man ˜ := (x) − i (ix), (x)
˜ X → C ein C-lineares Funktional und = Re . ˜ so ist : (b) Ist h: X → C ein C-lineares Funktional, = Re h und ˜ wie unter (a), so ist R-linear und ˜ = h. (c) Ist p: X → R eine Halbnorm und : X → C C-linear, so gilt die ¨ Aquivalenz |(x)| ≤ p(x)
∀x ∈ X
⇔
|Re (x)| ≤ p(x)
∀x ∈ X.
(d) Ist X ein normierter Raum und : X → C C-linear und stetig, so ist = Re . Mit anderen Worten ist → Re eine bijektive R-lineare Abbildung zwischen dem Raum der C-linearen und dem der R-wertigen R-linearen Funktionale. Im normierten Fall ist sie isometrisch. Beweis. (a) Als Kompositum R-linearer Abbildungen (auch x → ix ist Rlinear) ist ˜ R-linear, und Re ˜ = gilt nach Konstruktion. Es ist nur noch ˜ ˜ (ix) = i (x) zu zeigen: ˜ (ix) = (ix) − i (i ix) = (ix) − i (−x) ˜ = i (x) − i (ix) = i (x). (b) Nat¨ urlich ist = Re h R-linear. Beachte nun Im z = −Re iz f¨ ur alle z ∈ C. Daher ist f¨ ur x ∈ X h(x) = Re h(x) + i Im h(x) = Re h(x) − i Re ih(x) = Re h(x) − i Re h(ix) ˜ = (x) − i (ix) = (x).
(h ist C-linear)
III.1
97
Fortsetzungen von Funktionalen
(c) Wegen |Re z| ≤ |z| f¨ ur alle z ∈ C gilt ⇒“. F¨ ur die andere Implika” tion schreibe (x) = λ|(x)| f¨ ur ein λ = λx mit |λ| = 1. Dann gilt f¨ ur alle x ∈ X: |(x)| = λ−1 (x) = (λ−1 x) = |Re (λ−1 x)| ≤ p(λ−1 x) = p(x). (d) ist eine unmittelbare Konsequenz von (c).
2
Satz III.1.4 (Satz von Hahn-Banach; Version der linearen Algebra; komplexe Fassung) Sei X ein komplexer Vektorraum, und sei U ein Untervektorraum von X. Ferner seien p: X → R sublinear und : U → C linear mit Re (x) ≤ p(x)
∀x ∈ U.
Dann existiert eine lineare Fortsetzung L: X → C, L|U = , mit Re L(x) ≤ p(x)
∀x ∈ X.
Beweis. Wende Satz III.1.2 auf Re an, um ein R-lineares Funktional F : ur alle x ∈ X zu erhalten. Nach X → R mit F |U = Re und F (x) ≤ p(x) f¨ Lemma III.1.3(a) ist F = Re L f¨ ur ein gewisses C-lineares Funktional L: X → C. Daß von L fortgesetzt wird, folgt aus Lemma III.1.3(b). 2 Wir wenden nun die algebraischen Hahn-Banach-S¨atze auf normierte R¨ aume an. Theorem III.1.5 (Satz von Hahn-Banach; Fortsetzungsversion) Sei X ein normierter Raum und U ein Untervektorraum. Zu jedem stetigen linearen Funktional u : U → K existiert dann ein stetiges lineares Funktional x : X → K mit x |U = u ,
x = u .
Jedes stetige Funktional kann also normgleich fortgesetzt werden. Beweis. Wir unterscheiden, ob X ein reeller oder komplexer Raum ist. Im ur x ∈ X. Dann folgt aus Satz III.1.2 die reellen Fall setze p(x) = u x f¨ Existenz einer linearen Abbildung x : X → R mit x |U = u und x (x) ≤ p(x)
∀x ∈ X.
Da auch x (−x) ≤ p(−x) = p(x) ist, folgt |x (x)| ≤ u x
∀x ∈ X,
d.h. x ≤ u . Umgekehrt gilt trivialerweise u = sup |u (u)| = sup |x (u)| ≤ sup |x (x)| = x . u∈BU
u∈BU
x∈BX
98
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Im komplexen Fall kombiniere den ersten Beweisschritt mit Satz III.1.4, um ein lineares Funktional x : X → C mit x |U = u und Re x = u zu erhalten. Nach Lemma III.1.3(d) gilt Re x = x . 2 Es sollte wieder bemerkt werden, daß eine solche Fortsetzung x im allgemeinen nicht eindeutig bestimmt ist und daß das Analogon von Theorem III.1.5 f¨ ur Operatoren im allgemeinen falsch ist. So werden wir im Anschluß an Satz IV.6.5 bemerken, daß es keinen stetigen Operator T : at Id: c0 → c0 fortsetzt. F¨ ur ein positives ∞ → c0 gibt, der die Identit¨ Resultat in dieser Richtung siehe Aufgabe III.6.22(a); vgl. auch Satz II.1.5 f¨ ur den Fall, daß U dicht liegt. Die folgenden Korollare besagen, daß der Dualraum eines normierten Raums X umfassend genug ist, um Eigenschaften von X und seinen Elementen kodieren zu k¨ onnen. Dadurch werden Probleme u ¨ ber Vektoren letztendlich auf Probleme u uckgespielt; die x (x), wo x den Dual¨ ber Zahlen zur¨ raum von X durchl¨ auft, k¨ onnen somit als Koordinaten“ von x angesehen ” werden. Korollar III.1.6 In jedem normierten Raum X existiert zu jedem x ∈ X, x = 0, ein Funktional x ∈ X mit x = 1
und
x (x) = x .
Speziell trennt X die Punkte von X; d.h., zu x1 , x2 ∈ X, x1 = x2 , existiert x ∈ X mit x (x1 ) = x (x2 ). Beweis. Setze das Funktional u : lin{x} → K, u (λx) = λ x , normgleich 2 auf X fort. Zum Beweis des Zusatzes betrachte einfach x = x1 − x2 . Korollar III.1.7 In jedem normierten Raum gilt x = sup |x (x)| x ∈BX
∀x ∈ X.
(III.3)
Beweis. ≥“ gilt nach Definition von x , und ≤“ nach Korollar III.1.6 ” ” (der Fall x = 0 ist trivial). 2 Bemerke die Symmetrie der Formel (III.3) zur Definition x = sup |x (x)|
∀x ∈ X .
x∈BX
Im Gegensatz hierzu wird das Supremum in (III.3) sogar stets angenommen. Korollar III.1.8 Seien X ein normierter Raum, U ein abgeschlossener Unterraum und x ∈ X, x ∈ / U . Dann existiert x ∈ X mit x |U = 0
und
x (x) = 0.
III.1
99
Fortsetzungen von Funktionalen
Beweis. Sei ω: X → X/U die kanonische Quotientenabbildung. Dann ist ω(u) = 0 f¨ ur alle u ∈ U und ω(x) = 0. W¨ ahle nach Korollar III.1.6 ∈ (X/U ) mit ω(x) = 0. Das Funktional x := ◦ ω leistet dann das Gew¨ unschte. 2 Unmittelbar aus Korollar III.1.8 und Satz II.1.5 folgt: Korollar III.1.9 Ist X ein normierter Raum und U ein Untervektorraum, so sind ¨aquivalent: (i) U ist dicht in X. (ii) Falls x ∈ X und x |U = 0, so gilt x = 0. Es folgen noch einige weitere Anwendungen. Zun¨achst eine Bezeichnung. Ist X ein normierter Raum und sind Teilmengen U ⊂ X und V ⊂ X gegeben, so setzen wir U ⊥ := {x ∈ X : x (x) = 0 ∀x ∈ U }, V⊥ := {x ∈ X: x (x) = 0 ∀x ∈ V }.
(III.4) (III.5)
U ⊥ und V⊥ sind stets abgeschlossene Unterr¨ aume von X bzw. X. U ⊥ heißt der Annihilator von U in X und V⊥ der Annihilator von V in X. Satz III.1.10 Sei X ein normierter Raum und U ein abgeschlossener Unterraum. Es existieren kanonische isometrische Isomorphismen (X/U ) ∼ = U ⊥, U ∼ = X /U ⊥ .
(III.6) (III.7)
Beweis. Wir begn¨ ugen uns damit, die fraglichen Isomorphismen anzugeben, ¨ und u F¨ ur (III.6) ordne ∈ ¨ berlassen die Verifikation der Details zur Ubung. (X/U ) das Funktional x = ◦ ω, ω: X → X/U die Quotientenabbildung, 2 zu; und f¨ ur (III.7) betrachte x + U ⊥ → x |U . ∞ 1 ∞ ur Satz III.1.11 Die Abbildung T : → ( ) , (T x)(y) = n=1 sn tn f¨ x = (sn ), y = (tn ), ist isometrisch, aber nicht surjektiv. Beweis. Der Beweis der Isometrie ist einfach und wird den Lesern u ¨berlassen. Um zu zeigen, daß T nicht surjektiv ist, betrachte das Funktional lim: c → K und setze es mit dem Satz von Hahn-Banach zu einem ∞stetigen atte x eine Darstellung x (y) = n=1 sn tn , Funktional x : ∞ → K fort. H¨ so w¨ are (ek = k-ter Einkeitsvektor) sk = x (ek ) = lim ek = 0 also x = 0. Widerspruch!
∀k ∈ N, 2
Daß es u ¨berhaupt keinen Isomorphismus zwischen 1 und (∞ ) geben kann, zeigt der folgende Satz. (Zur Erinnerung: 1 ist separabel, ∞ aber nicht; Beispiel I.2(a) und (c).)
100
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Satz III.1.12 Ein normierter Raum X mit separablem Dualraum ist selbst separabel. Beweis. Mit X ist SX = {x ∈ X : x = 1} separabel (Aufgabe I.4.26). Sei also die Menge {x1 , x2 , . . .} dicht in SX . W¨ahle xi ∈ SX mit |xi (xi )| ≥ 1 2 . Wir setzen U := lin{x1 , x2 , . . .} und werden zeigen, daß U dicht in X liegt. are x = 0, k¨onnte ohne Einschr¨ankung Sei x ∈ X mit x |U = 0. W¨ x = 1 angenommen werden. Dann existiert xi0 mit x − xi0 ≤ 14 . Es folgt 1 1 ≤ |xi0 (xi0 )| = |xi0 (xi0 ) − x (xi0 )| ≤ xi0 − x xi0 ≤ . 2 4 Also muß x = 0 sein, und wegen Korollar III.1.9 liegt U dicht. Nach Lemma I.2.9 ist X separabel. 2 Satz III.1.13 Sei X ein normierter Raum und I eine Indexmenge. Seien xi ∈ X und ci ∈ K f¨ ur i ∈ I. Dann sind folgende Bedingungen ¨ aquivalent: (i) Es existiert x ∈ X mit x (xi ) = ci f¨ ur alle i ∈ I. (ii) Es existiert M ≥ 0 derart, daß f¨ ur alle endlichen Teilmengen F ⊂ I die Ungleichung (III.8) λi ci ≤ M λi xi i∈F
i∈F
erf¨ ullt ist. Beweis. (i) ⇒ (ii) ist klar; w¨ ahle M = x . (ii) ⇒ (i): (III.8) impliziert, daß
i∈F
λi xi
=
λi ci
i∈F
ein wohldefiniertes stetiges lineares Funktional auf lin{xi : i ∈ I} definiert. 2 W¨ ahle nun eine Hahn-Banach-Fortsetzung x von .
III.2
Trennung konvexer Mengen
In diesem Abschnitt wird die geometrische Version des Satzes von HahnBanach vorgestellt. Ziel ist die Trennung konvexer Mengen eines normierten Raums durch stetige lineare Funktionale.
III.2
101
Trennung konvexer Mengen
V ⊂ {x: Re x (x) > α}
U ⊂ {x: Re x (x) < α}
{x: Re x (x) = α}
Das Trennungsproblem ist also folgendes: Existiert zu konvexen U und V ⊂ X ein Funktional x ∈ X , x = 0, mit sup x (x) ≤ inf x (x) x∈U
bzw.
x∈V
sup Re x (x) ≤ inf Re x (x)
x∈U
x∈V
(K = R)
(K = C)?
Zur Erinnerung: U heißt konvex, wenn λx + (1 − λ)y ∈ U f¨ ur alle x, y ∈ U , 0 ≤ λ ≤ 1. Die folgende Definition ist rein algebraisch, wie der Konvexit¨atsbegriff auch. Definition III.2.1 Sei X ein Vektorraum und A ⊂ X eine Teilmenge. Das Minkowskifunktional pA : X → [0, ∞] wird durch # " x pA (x) := inf λ > 0: ∈ A λ definiert. A heißt absorbierend, falls pA (x) < ∞ f¨ ur alle x ∈ X. Ist z.B. A die offene Einheitskugel eines normierten Raums, so ist pA (x) = x . Lemma III.2.2 Sei X ein normierter Raum und U ⊂ X eine konvexe Teilmenge mit 0 ∈ int U . Dann gilt: (a) U ist absorbierend, genauer: Falls {x: x < ε} ⊂ U , so gilt pU (x) ≤ 1ε x . (b) pU ist sublinear.
102
III.
Der Satz von Hahn-Banach und seine Konsequenzen
(c) Ist U offen, so gilt U = p−1 U [0, 1) . Beweis. (a) ist klar. ur λ ≥ 0 ist auch klar. Zum Beweis der Unglei(b) pU (λx) = λpU (x) f¨ chung pU (x + y) ≤ pU (x) + pU (y) sei ε > 0 gegeben. W¨ahle λ, μ > 0 mit λ ≤ pU (x) + ε, μ ≤ pU (y) + ε, so daß λx ∈ U , μy ∈ U . Da U konvex ist, folgt λ x μ y x+y + = ∈ U, λ+μλ λ+μμ λ+μ folglich pU (x + y) ≤ λ + μ ≤ pU (x) + pU (y) + 2ε. Da ε > 0 beliebig war, folgt die Behauptung. (c) Falls pU (x) < 1 ist, existiert λ < 1 mit xλ ∈ U . Wegen 0 ∈ U folgt x = λ λx + (1 − λ)0 ∈ U . (Diese Richtung benutzt nicht die Offenheit von / U f¨ ur alle λ < 1. Da U abgeschlossen ist, U .) Ist pU (x) ≥ 1, so ist λx ∈ folgt nun x ∈ U. 2 x = lim λ→1 λ λ 0 ist y (ty0 ) = pU (ty0 ). W¨ ahle nun mit Satz III.1.2 eine lineare Fortsetzung x von y mit x ≤ pU . Lemma III.2.2(a) impliziert, daß x stetig ist, denn mit den dortigen Bezeichnungen gilt f¨ ur x ∈ X |x (x)| = max{x (x), x (−x)} ≤ max{pU (x), pU (−x)} ≤
1 x . ε
Insbesondere ist x (y0 ) = pU (y0 ) ≥ 1, und f¨ ur x ∈ V , das ja als x = u − y0 mit u ∈ U dargestellt werden kann, folgt x (x) = x (u) − x (y0 ) ≤ pU (u) − 1 < 0, letzteres nach Lemma III.2.2(c). Daher leistet x das Gew¨ unschte. Der Fall K = C folgt aus dem ersten Teil und Lemma III.1.3.
2
Auf die Offenheit von V kann in Lemma III.2.3 im allgemeinen nicht verzichtet werden. Als Beispiel betrachte den normierten Raum (d, . ∞ ) u ¨ ber R. Setze V = (sn ) ∈ d\{0}: sN > 0 f¨ ur N := max{i: si = 0} . Es ist leicht zu sehen, daß V konvex ist, und es gilt 0 ∈ / V . Trotzdem existiert kein x ∈ d mit x |V < 0. Identifiziert man n¨amlich x mit einer Folge (tn ) ∈ 1 (Satz II.1.5 und Satz II.2.3), so k¨onnen zwei F¨alle eintreten. ur ein k, so gilt ek ∈ V , aber x (ek ) = tk ≥ 0. Sind hingegen alle Ist tk ≥ 0 f¨ tn < 0, so betrachte x = − tt21 e1 +e2 ∈ V ; es gilt dann x (x) = − tt21 t1 +t2 = 0. Theorem III.2.4 (Satz von Hahn-Banach; Trennungsversion I) Sei X ein normierter Raum, V1 , V2 ⊂ X seien konvex und V1 offen. Es gelte V1 ∩ V2 = ∅. Dann existiert x ∈ X mit Re x (v1 ) < Re x (v2 )
∀v1 ∈ V1 , v2 ∈ V2 .
Beweis. Wir f¨ uhren Theorem III.2.4 auf Lemma III.2.3 zur¨ uck. Sei V = V1 − V2 . Als Differenzmenge konvexer Mengen ist V konvex, und aus der Darstellung V = x∈V2 V1 − {x} erkennt man die Offenheit von V . Wegen V1 ∩ V2 = ∅ ist 0 ∈ / V . Nach Lemma III.2.3 existiert ein Funktional x ∈ X mit Re x (v1 − v2 ) < 0 f¨ ur alle vi ∈ Vi , also Re x (v1 ) < Re x (v2 ). 2
104
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Theorem III.2.5 (Satz von Hahn-Banach; Trennungsversion II) Sei X ein normierter Raum, V ⊂ X sei abgeschlossen und konvex, und sei x∈ / V . Dann existiert x ∈ X mit Re x (x) < inf{Re x (v): v ∈ V }. Es existiert also ein ε > 0 mit Re x (x) < Re x (x) + ε ≤ Re x (v)
∀v ∈ V ;
man sagt, x k¨onne von V strikt getrennt werden. Beweis. Da V abgeschlossen ist, existiert eine offene Nullumgebung U mit ({x} + U ) ∩ V = ∅; U kann und soll als Kugel mit dem Radius r gew¨ahlt werden. Nach Theorem III.2.4 existiert x ∈ X mit Re x (x + u) < Re x (v)
∀u ∈ U, v ∈ V.
Es ergibt sich nacheinander Re x (x) + Re x (u) < Re x (v)
∀u ∈ U, v ∈ V,
Re x (x) + Re x r ≤ Re x (v) ∀v ∈ V, Re x (x) + r x ≤ inf{Re x (v): v ∈ V }, was zu zeigen war.
2
¨ Nach Ubergang von x zu −x kann in den Trennungss¨atzen jeweils >“ ” erzielt werden (mit sup statt inf in Theorem III.2.5). Die Korollare III.1.6–III.1.9 k¨ onnen auch aus den Trennungss¨atzen hergeleitet werden (versuche es!). Eine weitere Anwendung folgt im n¨achsten Abschnitt in Satz III.3.8.
III.3
Schwache Konvergenz und Reflexivit¨ at
Sei X ein normierter Raum, X sein Dualraum und X := (X ) dessen Dualraum. Man nennt X den Bidualraum von X. Ist x ∈ X, so kann auf kanonische Weise eine Abbildung i(x): X → K, i(x) (x ) = x (x) definiert werden; man betrachtet also im Ausdruck x (x) diesmal x als variabel und h¨alt x fest. Es ist klar, daß i(x) linear ist. Auch die Stetigkeit von i(x) ist klar, sie folgt aus |x (x)| ≤ x x . Insbesondere ist i(x) ≤ x . Der Satz von Hahn-Banach liefert die weitaus sch¨arfere Aussage i(x) = x , siehe Korollar III.1.7. Da die so definierte Abbildung i: X → X offensichtlich linear ist, haben wir gezeigt:
III.3
Schwache Konvergenz und Reflexivit¨ at
105
Satz III.3.1 Die Abbildung i: X → X , i(x) (x ) = x (x), ist eine (im allgemeinen nicht surjektive) lineare Isometrie. Wir nennen i die kanonische Abbildung eines normierten Raums X in seinen Bidualraum; um die Abh¨ angigkeit von X zu betonen, schreibt man bisweilen auch iX . Auf diese Weise wird X mit einem Unterraum von X identifiziert. Mit X ist auch i(X) vollst¨ andig; also wird ein Banachraum X mit einem abgeschlossenen Unterraum von X identifiziert. Auf jeden Fall ist f¨ ur einen normierten Raum X der Unterraum i(X) im Banachraum andig. Daher gilt folgendes Korollar, das X abgeschlossen und ergo vollst¨ eine elegante Konstruktion der Vervollst¨ andigung eines normierten Raums liefert. Korollar III.3.2 Jeder normierte Raum ist isometrisch isomorph zu einem dichten Unterraum eines Banachraums. Beispiele. (a) Sei X = c0 . Nach Satz II.2.3 ist“ X = 1 , X = ∞ . Unter ” dieser Identifizierung gilt ic0 (x) = x, denn identifiziert man y = (tn) ∈ 1 mit dem Funktional x = (sn ) → ic0 (x) (y) = n sn tn , so sieht man y(x) = n sn tn = z(y), wo z ∈ ∞ das Funktional (tn ) → n sn tn darstellt, also z = x = ic0 (x). Insbesondere ist ic0 nicht surjektiv. (b) Nach Satz III.1.11 ist auch i 1 nicht surjektiv. (c) Wie unter (a) sieht man, daß f¨ ur 1 < p < ∞ die kanonische Einbettung i p mit dem identischen Operator Id: p → p u ¨ bereinstimmt und ¨ deswegen surjektiv ist. Die gleichen Uberlegungen gelten f¨ ur Lp (μ). Definition III.3.3 Ein Banachraum X heißt reflexiv, wenn iX surjektiv ist. (Nat¨ urlich hat ein unvollst¨ andiger Raum keine Chance, reflexiv zu sein.) F¨ ur reflexive R¨ aume gilt nach Definition X ∼ = X , aber diese Bedingung ist nicht hinreichend: Der in Aufgabe I.4.8 beschriebene Banachraum J hat die Eigenschaft J ∼ = J , aber iJ ist nicht surjektiv. Dieses Ph¨anomen wurde 1950 von James entdeckt, zum Beweis siehe z.B. Lindenstrauss/Tzafriri [1977], S. 25. Aus den obigen Beispielen folgt: ur 1 < p < ∞ reflexiv. • p und Lp (μ) sind f¨ • c0 und 1 sind nicht reflexiv. • Ferner sind endlichdimensionale R¨aume X trivialerweise reflexiv, da nach Beispiel II.1(b) dim X = dim X = dim X . Satz III.3.4 (a) Abgeschlossene Unterr¨aume reflexiver R¨aume sind reflexiv. (b) Ein Banachraum X ist genau dann reflexiv, wenn X reflexiv ist.
106
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Beweis. (a) Sei X reflexiv und U ⊂ X ein abgeschlossener Unterraum. Sei nun u ∈ U . Dann liegt die Abbildung x → u (x |U ) in X , denn |u (x |U )| ≤ u x |U ≤ u x . Da X reflexiv ist, existiert x ∈ X mit x (x) = u (x |U )
∀x ∈ X .
(III.9)
W¨ are x ∈ / U , so g¨ abe es nach Korollar III.1.8 ein Funktional x ∈ X mit urde u (x |U ) = 0 x (x) = 1 und x |U = 0. Im Widerspruch zu (III.9) w¨ folgen. Es muß also x ∈ U sein, und aus notationstechnischen Gr¨ unden werden wir u statt x schreiben. Es ist noch u (u ) = u (u)
∀u ∈ U
zu zeigen. In der Tat: Sei u ∈ U gegeben, und sei x ∈ X irgendeine Hahn-Banach-Fortsetzung gem¨ aß Theorem III.1.5. Dann gilt (III.9)
u (u ) = u (x |U ) = x (u) = u (u). Daher ist u = iU (u), und U ist reflexiv. (Wo ging die Abgeschlossenheit von U in diesem Beweis ein?) (b) Sei X reflexiv. Wir m¨ ussen zeigen, daß iX : X → X surjektiv ist. Sei also x ∈ X . Dann ist x : X → K, x → x iX (x) , linear und stetig, also x ∈ X . Wir beweisen jetzt, daß x = iX (x ) gilt. Da X reflexiv ist, hat jedes x ∈ X die Gestalt x = iX (x). Also gilt x (x ) = x iX (x) = x (x) = iX (x) (x ) = x (x ), was zu zeigen war. Sei X reflexiv. Nach dem gerade Gezeigten ist X reflexiv, nach Teil (a) auch der abgeschlossene Unterraum iX (X) und deshalb X. 2 Aus Satz III.3.4 folgt, daß auch ∞ , L1 [0, 1], L∞ [0, 1] und C[0, 1] nicht reflexiv sind (Aufgabe III.6.15). Wir notieren noch eine unmittelbare Konsequenz von Satz III.1.12. Korollar III.3.5 Ein reflexiver Raum ist genau dann separabel, wenn es sein Dualraum ist. Als n¨ achstes wird der Begriff der schwachen Konvergenz einer Folge eingef¨ uhrt und anschließend insbesondere in reflexiven R¨aumen studiert. Definition III.3.6 Eine Folge (xn ) in einem normierten Raum X heißt schwach konvergent gegen x, wenn lim x (xn ) = x (x)
n→∞
gilt.
∀x ∈ X
III.3
107
Schwache Konvergenz und Reflexivit¨ at
Da X die Punkte von X trennt (Korollar III.1.6), ist der schwache Limes, falls u ¨ berhaupt existent, eindeutig bestimmt. Schreibweise: σ
xn → x
oder
σ- lim xn = x. n→∞
Selbstverst¨ andlich sind konvergente Folgen schwach konvergent. Die Umkehrung gilt nicht: Betrachte etwa die Folge (en ) der Einheitsvektoren in ur 1 < p < ∞ oder in c0 . Dann gilt σ- limn→∞ en = 0, aber en = 1. p f¨ In Korollar IV.2.3 werden wir die nicht offensichtliche Tatsache beweisen, daß schwach konvergente Folgen notwendig beschr¨ankt sind. Beispiel. F¨ ur beschr¨ ankte Folgen (xn ) in C[0, 1] sind folgende Aussagen aquivalent: ¨ (i) (xn ) konvergiert schwach gegen 0. (ii) (xn ) konvergiert punktweise gegen 0, d.h. limn→∞ xn (t) = 0 f¨ ur alle t ∈ [0, 1]. Beweis. (i) ⇒ (ii): Nach Voraussetzung gilt xn dμ → 0 f¨ ur alle μ ∈ M [0, 1]; vgl. Theorem II.2.5. Ist μ = δt ein Diracmaß, so zeigt das die punktweise Konvergenz. (ii) ⇒ (i): Das folgt unmittelbar aus dem Rieszschen Darstellungssatz II.2.5 und dem Lebesgueschen Konvergenzsatz A.3.2. 2 Im n¨ achsten Satz wird eine Form der schwachen Kompaktheit“ be” wiesen. (Zur Erinnerung: Genau in endlichdimensionalen R¨aumen ist die abgeschlossene Einheitskugel kompakt; Satz I.2.7.) Theorem III.3.7 In einem reflexiven Raum X besitzt jede beschr¨ankte Folge eine schwach konvergente Teilfolge. Beweis. Wir nehmen zun¨ achst zus¨ atzlich an, daß X separabel ist; nach Korollar III.3.5 ist dann auch X separabel, etwa X = {x1 , x2 , . . .}. Sei nun (xn ) eine beschr¨ ankte Folge in X. Mit Hilfe des Diagonalfolgentricks (siehe den Beweis des Satzes von Arzel` a-Ascoli II.3.4) findet man eine Teilfolge, ur alle i konvergiert. Als n¨achstes wird genannt (yn ), so daß xi (yn ) n∈N f¨ ur alle x ∈ X konvergiert. gezeigt, daß x (yn ) n∈N f¨ ahle i ∈ N mit xi − x ≤ ε. Es folgt (mit Sei ε > 0 und x ∈ X . W¨ M := supn xn ) |x (yn ) − x (ym )| ≤ 2M xi − x + |xi (yn ) − xi (ym )| ≤ (2M + 1)ε f¨ ur hinreichend große m und n. Daher ist x (yn ) n∈N eine Cauchyfolge und ergo konvergent. Es ist noch nicht gezeigt, daß (yn ) schwach konvergiert; es muß noch der Grenzwert angegeben werden. Betrachte dazu die Abbildung : x → lim x (yn ) n→∞
108
III.
Der Satz von Hahn-Banach und seine Konsequenzen
auf X , die nach dem ersten Beweisschritt wohldefiniert und linear ist. Wegen (M wie oben) |(x )| = lim x (yn ) = lim |x (yn )| ≤ x M n→∞
n→∞
liegt in X . Da X reflexiv ist, existiert x ∈ X mit = i(x), also tats¨achlich x (x) = lim x (yn ) n→∞
∀x ∈ X ,
und (yn ) konvergiert schwach gegen x. Im Fall eines beliebigen reflexiven Raumes betrachte wieder eine beschr¨ ankte Folge (xn ) und Y := lin{x1 , x2 , . . .}. Dann ist Y separabel (Lemma I.2.9) und reflexiv (Satz III.3.4). Nach dem soeben Bewiesenen existieren ur alle y ∈ Y . eine Teilfolge (yn ) und y ∈ Y mit limn→∞ y (yn ) = y (y) f¨ Sei x ∈ X . Dann ist x |Y ∈ Y und deshalb auch limn→∞ x (yn ) = x (y). Das zeigt, daß (yn ) schwach gegen y konvergiert. 2 σ
Wir haben bereits bemerkt, daß f¨ ur die Einheitsvektoren in 2 en → 0 gilt. Die en liegen in der abgeschlossenen Einheitssph¨are S 2 , der schwache Limes jedoch nicht! Abgeschlossene Mengen brauchen also nicht schwach ” abgeschlossen“ zu sein. F¨ ur konvexe Mengen gilt jedoch der folgende Satz. Satz III.3.8 Sei X ein normierter Raum und V ⊂ X eine abgeschlossene konvexe Teilmenge. Ist dann (xn ) eine schwach konvergente Folge in V mit σ xn → x, so gilt x ∈ V . Beweis. W¨ are x ∈ / V , so k¨ onnte x nach dem Satz von Hahn-Banach (Theorem III.2.5) strikt von V getrennt werden. Es existierten also x ∈ X und ε > 0 mit Re x (x) < Re x (x) + ε ≤ inf Re x (v). v∈V
Speziell w¨ are Re x (xn − x) ≥ ε f¨ ur alle n, im Widerspruch zu x (x) = 2 limn→∞ x (xn ). σ
Korollar III.3.9 Gilt xn → x, so existiert eine Folge von Konvexkombinationen (n) N (n) (n) (n) yn = λi ≥ 0, λi xi =1 i λi i=1
mit yn − x → 0. Beweis. Wende Satz III.3.8 auf V = co{x1 , x2 , . . .} an.
2
Die Untersuchung der schwachen Konvergenz (sowie allgemeiner der schwachen Topologien) wird in Kapitel VIII fortgesetzt.
109
III.4 Adjungierte Operatoren
III.4
Adjungierte Operatoren
¨ Ahnlich wie einem normierten Raum mit dem Dualraum kanonisch ein zweiter normierter Raum zugeordnet wird, soll nun zu einem stetigen linearen Operator ein weiterer Operator assoziiert werden. Definition III.4.1 Seien X und Y normierte R¨aume und T ∈ L(X, Y ). Der adjungierte Operator T : Y → X ist durch (T y )(x) = y (T x) definiert. Man best¨ atigt unmittelbar, daß wirklich T y ∈ X gilt und daß T ∈ L(Y , X ) ist. Beispiele. (a) Sei 1 ≤ p < ∞ und X = Y = p . Betrachte den Shiftoperator (genauer Linksshift) T : (s1 , s2 , . . .) → (s2 , s3 , . . .). Was ist T ? Wir identifizieren X und Y mit q gem¨aß Satz II.2.3, so daß q q T ein Operator auf ist. Mit der Identifizierung y = (tn ) ∈ , n¨amlich onnen wir nun schreiben: y (sn ) = n sn tn , k¨ y (T x) =
∞ n=1
sn+1 tn =
∞
sn t˜n
n=2
mit t˜n = tn−1 f¨ ur n ≥ 2. Daher ist T der Rechtsshift T : (t1 , t2 , . . .) → (0, t1 , t2 , . . .). Beachte im Fall p = 2, daß T T = Id, aber T T = Id. (b) Sei 1 ≤ p < ∞ und X = Y = Lp [0, 1]. Zu h ∈ L∞ [0, 1] betrachten wir den Multiplikationsoperator f → hf auf Lp [0, 1] und bezeichnen ihn, um die Abh¨ angigkeit von p zu betonen, mit T(p) . Wieder identifizieren wir X mit dem Funktionenraum Lq [0, 1], 1p + 1q = 1, (Satz II.2.4). Dann gilt T(p) = T(q) ; in der Tat ist (T(p) g)(f ) =
1
(T(p) f )(t) g(t) dt = 0
1
f (t)g(t)h(t) dt 0
1
f (t)(T(q) g)(t) dt = (T(q) g)(f )
= 0
f¨ ur f ∈ Lp [0, 1], g ∈ Lq [0, 1]. (c) Betrachte den Integraloperator T mit L2 -Kern k auf L2 [0, 1]: 1 (T f )(s) = k(s, t)f (t) dt (fast u ¨berall). 0
110
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Wie unter (b) sieht man, daß T ein Integraloperator mit dem Kern k (s, t) = k(t, s) ist. (d) Zu einem normierten Raum X betrachte die kanonische Einbettung i: X → X . Was ist i ? Nach Definition gilt i : X → X , i (x ) (x) = x i(x) , ankungsabbildung x → x |i(X) . d.h., i ist die Einschr¨ In der amerikanischen Literatur ist die Bezeichnung T ∗ statt T vorherrschend; wir werden jedoch mit T ∗ den in Kapitel V zu diskutierenden Hilbertraum-Adjungierten bezeichnen. Satz III.4.2 (a) Die Abbildung T → T von L(X, Y ) nach L(Y , X ) ist linear und isometrisch, d.h. T = T . Sie ist im allgemeinen nicht surjektiv. (b) (ST ) = T S f¨ ur T ∈ L(X, Y ), S ∈ L(Y, Z). Beweis. (a) Die Linearit¨ at ist klar, und aus der Definition ergibt sich sofort T y = y ◦ T ≤ y T , also T ≤ T . Die Gleichheit ergibt sich aus dem Satz von Hahn-Banach: T =
sup T x =
x ≤1
=
sup
sup |y (T x)|
(Korollar III.1.7)
x ≤1 y ≤1
sup
sup |y (T x)|
y ≤1 x ≤1
=
sup T y = T .
y ≤1
Ein Gegenbeispiel zur Surjektivit¨ at folgt im Anschluß an Lemma III.4.3. (b) Nachrechnen! 2 Lemma III.4.3 F¨ ur T ∈ L(X, Y ) gilt T ◦ iX = iY ◦ T. Beweis. Einfaches Nachrechnen: % $ % $ T iX (x) (y ) = iX (x) (T y ) = (T y )(x) = y (T x) = iY (T x) (y ).
2
Faßt man also X (bzw. Y ) als Unterraum von X (bzw. Y ) auf, so ist T eine Fortsetzung von T ∈ L(X, Y ), allerdings mit Werten in dem gr¨ oßeren Raum Y .
III.4
111
Adjungierte Operatoren
X
T Y
iX ? X
iY T
? - Y
Des weiteren ergibt sich (unter Beibehaltung der Identifizierung X ⊂ X , Y ⊂ Y ): • S ∈ L(Y , X ) ist genau dann ein adjungierter Operator, wenn S (X) ⊂ Y gilt. Mit dieser Beobachtung l¨ aßt sich leicht ein Gegenbeispiel zur Surjektivit¨at in Satz III.4.2(a) finden. Sei X = Y = c0 , also (Satz II.2.3) ∞ X = Y = 1 ∞ 1 , X = Y = , und sei S ∈ L( ) durch (tn ) → ( n=1 tn , 0, 0, . . .) definiert. Man best¨ atigt f¨ ur (un ) ∈ ∞ , daß S (un ) = (u1 , u1 , u1 , . . .). Also gilt S (c0 ) ⊂ c0 , und S kann kein adjungierter Operator sein. Satz III.4.4 (Satz von Schauder) Seien X und Y Banachr¨aume und T : X → Y ein stetiger linearer Operator. Dann ist T genau dann kompakt, wenn T kompakt ist. Beweis. Sei T kompakt und (yn ) eine beschr¨ankte Folge in Y . Dann ist K := T (BX ) ⊂ Y ein kompakter metrischer Raum. Die Folge (fn ), fn := yn |K ∈ C(K), ist beschr¨ ankt und gleichgradig stetig; letzteres folgt aus |fn (y1 ) − fn (y2 )| ≤ sup yk y1 − y2 . k
Nach dem Satz von Arzel` a-Ascoli (Satz II.3.4) existiert eine gleichm¨aßig konvergente Teilfolge (fnk ). Es folgt T yn k − T yn l = sup |yn k (T x) − yn l (T x)| = fnk − fnl ∞ ; x∈BX
die letzte Gleichheit gilt, weil T (BX ) dicht in K liegt. Also konvergiert (T yn k )k∈N im Banachraum X , und T ist kompakt. Ist T kompakt, so ist nach dem ersten Beweisteil auch T kompakt, also auch T iX . Aber nach Lemma III.4.3 gilt T iX = iY T , daher ist der Operator iY T : X → Y kompakt. Da Y in Y abgeschlossen ist, ist auch T kompakt. 2 Wir verwenden nun adjungierte Operatoren, um die L¨osbarkeit von Operatorgleichungen zu diskutieren. F¨ ur einen Operator T : X → Y bezeichnen wir mit ker T := {x ∈ X: T x = 0} seinen Kern und mit ran T :=
112
III.
Der Satz von Hahn-Banach und seine Konsequenzen
{T x: x ∈ X} sein Bild. Die Annihilatoren U ⊥ und V⊥ sind in (III.4) und (III.5) eingef¨ uhrt worden. F¨ ur lineares T sind ker T und ran T stets Untervektorr¨aume; f¨ ur stetiges T ist ker T = T −1 ({0}) stets abgeschlossen. Hingegen braucht ran T nicht abgeschlossen zu sein; betrachte zum Beispiel die identische Abbildung von C[0, 1] nach L1 [0, 1]. Es gilt jedoch folgender Satz. Satz III.4.5
ran T = (ker T )⊥ .
Beweis. ⊂“: Sei y = T x ∈ ran T . Ist y ∈ ker T , so folgt ” y (y) = y (T x) = (T y )(x) = 0 wegen T y = 0. Daher ist ran T ⊂ (ker T )⊥ . Da (ker T )⊥ abgeschlossen ist, gilt ⊂“. ” ⊃“: Setze U := ran T ; dies ist ein abgeschlossener Unterraum von Y . ” Sei y ∈ / U ; wir werden dann y ∈ / (ker T )⊥ zeigen. Nach dem Satz von Hahn-Banach (genauer Korollar III.1.8) existiert y ∈ Y mit y |U = 0 und ur alle x ∈ X, d.h. y ∈ ker T . y (y) = 0. Insbesondere ist y (T x) = 0 f¨ Daher ist y ∈ / (ker T )⊥ , da ja sonst y (y) = 0 gelten m¨ ußte. 2 Korollar III.4.6 Sei T : X → Y ein stetiger Operator mit abgeschlossenem Bild. Dann ist die Operatorgleichung T x = y genau dann l¨osbar, wenn die Implikation T y = 0
⇒
y (y) = 0
gilt. In Kapitel VI wird gezeigt, daß Operatoren der Gestalt T = Id − S mit S ∈ K(X) ein abgeschlossenes Bild haben (Satz VI.2.1). Der Vorzug des Korollars III.4.6 besteht darin, daß die Existenz einer L¨ osung durch eine Bedingung an den Kern von T garantiert wird; und der Kern eines Operators ist h¨ aufig relativ leicht zu bestimmen. Insbesondere ist die obige Implikation stets erf¨ ullt, wenn T injektiv ist.
III.5
Differentiation nichtlinearer Abbildungen
In diesem Abschnitt soll ein kurzer Abstecher in die nichtlineare Funktionalanalysis unternommen werden. Zuerst besch¨aftigen wir uns mit dem Begriff der Ableitung. Wir werden im folgenden nur reelle Vektorr¨aume betrachten, und h steht f¨ ur eine (hinreichend kleine) reelle Zahl. Definition III.5.1 Seien X und Y normierte R¨aume, U ⊂ X offen und f : U → Y eine Abbildung.
III.5
113
Differentiation nichtlinearer Abbildungen
(a) f heißt Gˆ ateaux-differenzierbar bei x0 ∈ U , falls ein stetiger linearer Operator T ∈ L(X, Y ) mit lim
h→0
f (x0 + hv) − f (x0 ) = Tv h
∀v ∈ X
(III.10)
existiert. (Es ist klar, daß f (x0 + hv) f¨ ur betragsm¨aßig hinreichend kleine h ∈ R erkl¨ art ist, n¨ amlich f¨ ur |h| ≤ α/ v , falls {x: x−x0 ≤ α} ⊂ U .) (b) f heißt Fr´echet-differenzierbar bei x0 ∈ U , falls die Konvergenz in (III.10) gleichm¨ aßig bez¨ uglich v ∈ BX ist. (c) f heißt Gˆ ateaux- bzw. Fr´echet-differenzierbar auf U , falls f an jeder Stelle x0 ∈ U Gˆ ateaux- bzw. Fr´echet-differenzierbar ist. Der Grenzwert in (III.10) h¨ angt dann von x0 ab; wir schreiben Df (x0 ) statt T . Df heißt die Gˆ ateaux- bzw. Fr´echet-Ableitung von f . Beachte: Die Ableitung von f an einer Stelle ist ein linearer Operator, die Ableitung von f als Funktion ist eine operatorwertige Abbildung Df : U → L(X, Y ). Die Fr´echet-Ableitung reflektiert die Idee der linearen Approximation, wie das n¨ achste Lemma zeigt. Lemma III.5.2 Mit den Bezeichnungen von Definition III.5.1 ist eine Abbildung f : U → Y genau dann Fr´echet-differenzierbar bei x0 ∈ U , falls ein stetiger linearer Operator T ∈ L(X, Y ) mit f (x0 + u) = f (x0 ) + T u + r(u), wo
lim
u →0
r(u) = 0, u
(III.11)
existiert. In diesem Fall ist Df (x0 ) = T . Ausf¨ uhrlich lautet die Grenzwertbeziehung in (III.11) ∀ε > 0 ∃δ > 0 u ≤ δ ⇒ r(u) ≤ ε u . Beweis. Gelte gleichm¨ aßige Konvergenz in (III.10). Setze dann r(u) = f (x0 + u) − f (x0 ) − T u; mit v = u/ u und u → 0 folgt u f (x + u v) − f (x ) r(u) f (x0 + u) − f (x0 ) 0 0 = −T = − T v → 0. u u u u Gelte umgekehrt (III.11). F¨ ur v ∈ BX und h → 0 hat man dann f (x0 + hv) − f (x0 ) = v f (x0 + hv) − f (x0 ) − T (hv) − T v h h v = v und zwar gleichm¨ aßig in v ∈ BX .
r(hv) → 0, hv 2
114
III.
Der Satz von Hahn-Banach und seine Konsequenzen
In Worten ist die Aussage von (III.11), daß man f (x0 +u) durch f (x0 )+ Df (x0 )(u) mit einem Fehler ≤ ε u approximieren kann, wenn nur u ≤ δ ist. Sind X und Y endlichdimensional, ist die Fr´echet-Differenzierbarkeit also nichts anderes als die totale Differenzierbarkeit, w¨ahrend die Gˆ ateauxDifferenzierbarkeit mit der Existenz der Richtungsableitungen verwandt ist. (Manche Autoren verlangen nicht die Linearit¨at der Gˆ ateaux-Ableitung.) Wie im Endlichdimensionalen impliziert die Fr´echet-Differenzierbarkeit die Stetigkeit, die Gˆ ateaux-Differenzierbarkeit jedoch nicht (Beispiel?). Beispiele. (a) Ist f konstant, so ist klar, daß f Fr´echet-differenzierbar mit ur alle x0 ist. Ableitung Df (x0 ) = 0 f¨ (b) Ist f : X → Y eine lineare Abbildung, so ist f genau dann Gˆ ateauxdifferenzierbar, wenn f stetig ist, da ja f¨ ur lineares f f (x0 + hv) − f (x0 ) = f (v). h ur alle In diesem Fall ist f auch Fr´echet-differenzierbar mit Df (x0 ) = f f¨ x0 ; Df ist also eine konstante operatorwertige Abbildung. (c) Sei f : C[0, 1] → C[0, 1] durch f (x) = x2 definiert. Dann ist f (x0 + hv) − f (x0 ) x2 + 2hx0 v + h2 v 2 − x20 = 0 = 2x0 v + hv 2 . h h Es folgt, daß der Grenzwert f¨ ur h → 0 gleichm¨aßig in v ∈ BC[0,1] existiert, und zwar ist lim
h→0
f (x0 + hv) − f (x0 ) = 2x0 v =: M2x0 v. h
f ist daher Fr´echet-differenzierbar mit Ableitung Df (x0 ) = M2x0 = Multiplikationsoperator mit 2x0 . (d) Die gleiche Rechnung funktioniert f¨ ur den Quadratoperator f : L2 → 1 2 L , f (x) = x ; f ist wohldefiniert nach der H¨olderschen Ungleichung. Auch hier ist Df (x0 ) = M2x0 , aber der Multiplikationsoperator wird diesmal als Operator von L2 nach L1 aufgefaßt. (e) Sei f : Lp (μ) → R durch f (x) = Ω |x(t)|p dμ(t) definiert. Wir untersuchen die Differenzierbarkeit dieses nichtlinearen Funktionals im Fall 1 < p < ∞ und setzen wie u ¨blich 1/p + 1/q = 1. Sei x0 ∈ Lp (μ) fest. Zu p v ∈ L (μ) assoziiere die Hilfsfunktion ϕ(h) = f (x0 + hv); wir zeigen, daß ϕ differenzierbar ist. Differenziert man formal unter dem Integral, erh¨alt man d |x0 (t) + hv(t)|p dμ(t) ϕ (h) = dh Ω ∂ (∗) |x0 (t) + hv(t)|p dμ(t) = Ω ∂h = p|x0 (t) + hv(t)|p−1 sgn(x0 (t) + hv(t))v(t) dμ(t); Ω
III.5
Differentiation nichtlinearer Abbildungen
115
beachte, daß f¨ ur p > 1 die reelle Funktion s → |s|p differenzierbar ist mit der Ableitung s → p|s|p−1 sgn(s). Wenn man (∗) legitimieren kann, folgt die Gˆ ateaux-Differenzierbarkeit von f mit Df (x0 )(v) = ϕ (0) = p |x0 (t)|p−1 sgn(x0 (t))v(t) dμ(t); Ω
Df (x0 ) ist also das durch p|x0 |p−1 sgn(x0 ) ∈ Lq (μ) ∼ = (Lp (μ)) dargestellte lineare Funktional. Zur Begr¨ undung von (∗) verwenden wir Korollar A.3.3; f¨ ur |h| ≤ 1 hat man n¨ amlich die Absch¨ atzung ∂ |x0 (t) + hv(t)|p = p|x0 (t) + hv(t)|p−1 |v(t)| ≤ p(|x0 (t)| + |v(t)|)p−1 |v(t)|; ∂h und das ist nach der H¨ olderschen Ungleichung eine L1 -Funktion, denn w := p |x0 | + |v| ∈ L (μ) impliziert wegen (p − 1)q = p, daß wp−1 ∈ Lq (μ). f ist sogar Fr´echet-differenzierbar. Dazu sei (vn ) eine Folge in der Einheitskugel von Lp (μ) und hn → 0, dann ist |x0 (t) + hn vn (t)|p − |x0 (t)|p p−1 − p|x0 (t)| sgn(x0 (t))vn (t) dμ(t) → 0 hn Ω zu zeigen. Stellt man den Bruch an jeder Stelle t mit Hilfe des Mittelwertsatzes dar, lautet die Aufgabe, x0 (t) + ϑn (t)hn vn (t)p−1 sgn x0 (t) + ϑn (t)hn vn (t) − p Ω |x0 (t)|p−1 sgn(x0 (t)) vn (t) dμ(t) → 0 olderschen Ungleichung kann zu beweisen, wo 0 < ϑn (t) < 1. Nach der H¨ dieser Ausdruck nach oben durch p |x0 + hn ϑn vn |p−1 sgn(x0 + hn ϑn vn ) − |x0 |p−1 sgn(x0 ) q vn p abgesch¨ atzt werden; beachte, daß ϑ aufgrund seiner Konstruktion meßbar ist. Schreibe nun xn = x0 +hn ϑn vn und Φ(x) = |x|p−1 sgn(x) f¨ ur x ∈ Lp (μ). p Es gilt dann xn → x0 in der Norm von L (μ), und es muß Φ(xn ) → Φ(x0 ) in der Norm von Lq (μ) geschlossen werden. Eine Teilfolge (xnk ) konvergiert fast u ¨ berall gegen x0 (vgl. z.B. Rudin [1986], Theorem 3.12); es folgt Φ(xnk ) → Φ(x0 ) fast u ¨berall sowie Φ(xnk ) q = xnk p → x0 p = Φ(x0 ) q , und die Integrationstheorie lehrt, daß dann Φ(xnk )−Φ(x0 ) q → 0 (siehe Rudin [1986], S. 73). Daraus ergibt sich die gew¨ unschte Konvergenz, und die Fr´echet-Differenzierbarkeit von f ist gezeigt. (f) Wir untersuchen die kanonische Norm des Folgenraums 1 auf Diffe∞ renzierbarkeit, betrachten also f (x0 ) = x0 1 = n=1 |sn | f¨ ur x0 = (sn ) ∈
116
III.
Der Satz von Hahn-Banach und seine Konsequenzen
1 . Sei ek der k-te Einheitsvektor in 1 . Die Frage, ob der Grenzwert in auft dann darauf hinaus, (III.10) f¨ ur v = ek existiert, l¨ lim
h→0
f (x0 + hek ) − f (x0 ) |sk + h| − |sk | = lim h→0 h h
zu bestimmen; und man erkennt, daß der Grenzwert genau dann existiert, agt er sgn sk . Daraus folgt als notwenwenn sk = 0 ist, und dann betr¨ dige Bedingung f¨ ur die Differenzierbarkeit der Norm bei x0 = (sn ), daß ur die Gˆ ateauxalle sn = 0 sind. Diese Bedingung ist auch hinreichend f¨ Differenzierbarkeit; als Kandidat f¨ ur die Ableitung kommt nach unseren Vor¨ uberlegungen n¨ amlich nur das durch (sgn sn ) ∈ ∞ ∼ = (1 ) dargestellte lineare Funktional in Frage, und in der Tat gilt f¨ ur jedes v = (tn ) ∈ 1 ∞ ∞ |sn + htn | − |sn | = (v) = (sgn sn )tn . h→0 h n=1 n=1
lim
Zun¨ achst hat man n¨ amlich f¨ ur jedes n die Absch¨atzung |sn + htn | − |sn | − h(sgn sn )tn |1 + htn /sn | − 1 − htn /sn = ≤ 2|tn |, h h/|sn | da |1 + x| − (1 + x) = 0 f¨ ur x ≥ −1 und = −2 − 2x f¨ ur x < −1. W¨ahlt man nun zu ε > 0 eine nat¨ urliche Zahl N so, daß n>N |tn | ≤ ε ausf¨allt, erh¨alt man ∞ N ∞ |sn + htn | − |sn | − h(sgn sn )tn ≤ | . . . | + | . . . |, h n=1
n=1
n=N +1
und die erste, endliche Summe strebt mit h → 0 gegen 0, da alle sn = 0 sind, wohingegen die zweite Summe unabh¨ angig von h durch 2ε majorisiert wird. Andererseits ist die 1 -Norm nach Lemma III.5.2 an keiner Stelle Fr´echet-differenzierbar, da f¨ ur x0 = (sn ) und vk = −2sk ek x0 + vk 1 − x0 1 − (vk ) = 1. vk 1
Es ist h¨ aufig wichtig zu wissen, ob die Norm eines normierten Raums differenzierbar ist. Dies kann folgendermaßen geometrisch charakterisiert werden.
III.5
117
Differentiation nichtlinearer Abbildungen
Satz III.5.3 Die Normfunktion f : x → x auf einem normierten Raum X ist bei x0 mit x0 = 1 genau dann Gˆ ateaux-differenzierbar, wenn es genau ein stetiges lineares Funktional x0 ∈ X mit x0 = x0 (x0 ) = 1 gibt; in diesem Fall ist Df (x0 ) = x0 . Die Normfunktion ist bei x0 genau dann Fr´echet-differenzierbar, wenn das obige x0 zus¨atzlich die Eigenschaft xn ∈ X , xn ≤ 1, xn (x0 ) → 1
⇒
xn − x0 → 0
(III.12)
besitzt. Beweis. Sei zun¨ achst f bei x0 Gˆ ateaux-differenzierbar mit Ableitung x0 ∈ X . Aus (III.10) ergibt sich dann sofort x0 (x0 ) = 1 und x0 ≤ 1 wegen der umgekehrten Dreiecksungleichung, also sogar x0 = 1. Sei x1 ein weiteres Funktional mit diesen Eigenschaften. F¨ ur v ∈ X und h > 0 gilt dann x0 (x0 + hv) + x1 (x0 − hv) − 2 h x0 + hv − 1 x0 − hv − 1 + , ≤ h h
x0 (v) − x1 (v) =
was mit h → 0 gegen x0 (v) + x0 (−v) = 0 konvergiert. Daher ist x0 (v) − ur alle v ∈ X und deshalb (ersetze v durch −v) x0 = x1 . x1 (v) ≤ 0 f¨ Ist f bei x0 Fr´echet-differenzierbar und ist (xn ) eine Folge wie in (III.12), gilt nach Lemma III.5.2 x0 (v) − xn (v) = x0 (x0 + v) + xn (x0 − v) − 1 − xn (x0 ) ≤ x0 + v − x0 + x0 − v − x0 + 1 − xn (x0 ) = x0 (v) + r(v) + x0 (−v) + r(−v) + 1 − xn (x0 ) = r(v) + r(−v) + 1 − xn (x0 ). Mit r(v) / v → 0 erh¨ alt man zu ε > 0 ein δ > 0, so daß r(v) ≤ ε v
∀ v ≤ δ.
W¨ ahlt man n0 so, daß 1 − xn (x0 ) ≤ δε
∀n ≥ n0 ,
so folgt f¨ ur diese n und alle v = δ x0 (v) − xn (v) ≤ 3δε und deshalb xn − x0 =
1 sup x0 (δv) − xn (δv) ≤ 3ε δ v =1
∀n ≥ n0 .
118
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Wir beweisen jetzt die Umkehrungen. Sei x0 = 1. Als erstes beobachten wir, daß f¨ ur jedes v ∈ X die einseitigen Grenzwerte x0 + hv − 1 h x + hv − 1 0 p− (v) = lim h h→0− p+ (v) =
lim
h→0+
existieren. Die auf R \ {0} erkl¨ arte Funktion ϕ: h → ( x0 + hv − 1)/h ist n¨ amlich monoton wachsend: F¨ ur 0 < h1 < h2 zeigt eine Anwendung der Dreiecksungleichung, daß h1 h1 x (x + h v) + 1 − x0 + h1 v − 1 = 2 0 − 1 h2 0 h2 h1 h1 ≤ −1 x0 + h2 v + 1 − h2 h2 x0 + h2 v − 1 = h1 , h2 weswegen ϕ auf (0, ∞) monoton w¨ achst. Analog sieht man die Monotonie auf (−∞, 0), und schließlich gilt ϕ(−h) ≤ ϕ(h) f¨ ur positive h, denn diese Ungleichung ist zu 2 ≤ x0 + hv + x0 − hv ¨aquivalent, was nach der Dreiecksungleichung richtig ist. Damit ist die Existenz der obigen Grenzwerte gezeigt, und außerdem sieht man, daß p− (v) ≤ p+ (v)
∀v ∈ X.
Ferner ergibt sich – wieder aus der Dreiecksungleichung –, daß p+ sublinear ist; beachte noch p+ (v) = −p− (−v) nach Definition dieser Gr¨oßen. Um die Gˆateaux-Differenzierbarkeit der Norm bei x0 zu beweisen, muß man nur p− = p+ zeigen. Sei dazu v0 ∈ X fest gew¨ahlt. F¨ ur p− (v0 ) ≤ α ≤ + p (v0 ) definiert λv0 → λα ein lineares Funktional auf lin{v0 }, das dort von p+ majorisiert wird; beachte (−v0 ) = −α ≤ −p− (v0 ) = p+ (−v0 ). Mit dem Satz von Hahn-Banach (Satz III.1.2) existiert ein lineares Funktional x ≤ p+ , das fortsetzt. Dieses ist stetig mit Norm ≤ 1, da nach der umgekehrten Dreiecksungleichung x (v) ≤ p+ (v) ≤ |p+ (v)| ≤ v Schließlich ist
∀v ∈ X.
−x (x0 ) = x (−x0 ) ≤ p+ (−x0 ) = −1,
so daß sich aus x ≤ 1 auch x (x0 ) = 1 ergibt. Wenn es nur ein Funktional mit diesen Eigenschaften gibt, muß notwendig p− (v0 ) = α = p+ (v0 )
III.5
119
Differentiation nichtlinearer Abbildungen
gewesen sein; da v0 beliebig war, ist p− = p+ und damit die Gˆ ateaux-Differenzierbarkeit bei x0 gezeigt. Wir kommen zum Schluß zur Fr´echet-Differenzierbarkeit unter der Bedingung (III.12). Sei (vn ) eine Nullfolge; es ist nach Lemma III.5.2 x0 + vn − 1 − x0 (vn ) →0 vn zu zeigen. Da x0 (x0 ) = 1 = x0 , ist der Ausdruck ≥ 0. W¨ahle gem¨aß Korollar III.1.6 Funktionale xn ∈ BX mit xn (x0 + vn ) = x0 + vn . Da dann wegen vn → 0 xn (x0 ) = xn (x0 + vn ) − xn (vn ) = x0 + vn − xn (vn ) → 1, folgt nach Voraussetzung (III.12) xn − x0 → 0 und deshalb x0 + vn − 1 − x0 (vn ) vn (xn − x0 )(vn ) + xn (x0 ) − 1 = vn (xn − x0 )(vn ) ≤ ≤ xn − x0 → 0, vn
0 ≤
2
was zu beweisen war. '
A $ A A A A A A A
&
%
A @A @ A A@ A @ A A A
Hier sind die Einheitskugeln zweier Normen sowie einige St¨ utzhyper” ebenen“ {x: x0 (x) = 1 = x0 } skizziert; die linke Norm ist an jeder Stelle = 0 Gˆ ateaux-differenzierbar (eine solche Norm nennt man glatt ), die rechte nicht, wie man aus Satz III.5.3 schließt; man kann regelrecht f¨ uhlen, daß sie nicht glatt ist. Zur Dualit¨ at von Konvexit¨ ats- und Glattheitseigenschaften vgl. Aufgabe III.6.31. Beispiel. (g) Die kanonische Norm von L2 (μ) ist an jeder Stelle x0 = 0 Fr´echet-differenzierbar. Wegen der positiven Homogenit¨at der Norm reicht es,
120
III.
Der Satz von Hahn-Banach und seine Konsequenzen
den Fall x0 2 = 1 zu betrachten. Nach Satz II.2.4 kann jedes Funktional aß y0 (x) = xy0 dμ dargestellt werden. durch ein normgleiches y0 gem¨ Das durch x0 dargestellte Funktional hat dann die Eigenschaft x0 (x0 ) = 1 = x0 , und aus Aufgabe I.4.13 folgt, daß es bzgl. dieser Eigenschaften eindeutig bestimmt ist. Seien nun xn ∈ L2 (μ) mit xn 2 ≤ 1, xn (x0 ) → 1. Dann folgt xn − x0 22 = (x2n − 2xn x0 + x20 ) dμ ≤ 1 − 2xn (x0 ) + 1 → 0. Ω
Nach Satz III.5.3 ist die L2 -Norm an der Stelle x0 Fr´echet-differenzierbar mit Ableitung x0 . Wer sich mit dem abstrakten Begriff des Hilbertraums aus Kapitel V bereits vertraut gemacht hat, sollte mit allgemeinen Hilbertraummethoden beweisen, daß jede Hilbertraumnorm außer bei 0 Fr´echet-differenzierbar ist; vgl. Aufgabe V.6.29. Auch die Norm von Lp (μ) ist im Fall 1 < p < ∞ an jeder von 0 verschiedenen Stelle Fr´echet-differenzierbar, siehe Aufgabe III.6.32. Als n¨ achstes werden einige S¨ atze u ¨ ber differenzierbare Abbildungen zusammengestellt. Satz III.5.4 Seien X, Y, Z normierte R¨aume und U ⊂ X sowie V ⊂ Y offene Teilmengen. (a) Sind f, g: U → Y Gˆ ateaux- bzw. Fr´echet-differenzierbar bei x0 ∈ U , so sind es auch f + g sowie λf (λ ∈ R) mit Ableitungen D(f + g)(x0 ) = Df (x0 ) + Dg(x0 ),
D(λf )(x0 ) = λ Df (x0 ).
(b) (Mittelwertsatz) Sei f : U → Y Gˆ ateaux-differenzierbar; das Intervall“ I = {x0 + ” λu: 0 ≤ λ ≤ 1} liege in der offenen Menge U . Dann gilt f (x0 + u) − f (x0 ) ≤ sup Df (ξ) u . ξ∈I
(c) Ist f : U → Y Gˆ ateaux-differenzierbar und ist Df : U → L(X, Y ) stetig, so ist f sogar Fr´echet-differenzierbar; man sagt, f sei stetig differenzierbar, und schreibt f ∈ C 1 (U, Y ). (d) (Kettenregel) Seien f : U → Y und g: V → Z, wo f (U ) ⊂ V , Fr´echet-differenzierbar bei x0 ∈ U bzw. f (x0 ) ∈ V ; dann ist g◦f Fr´echet-differenzierbar bei x0 mit Ableitung D(g ◦ f )(x0 ) = Dg(f (x0 )) ◦ Df (x0 ).
III.5
Differentiation nichtlinearer Abbildungen
121
(e) (Satz u ¨ ber implizite Funktionen) Es seien X, Y und Z vollst¨andig und F : X ⊕Y ⊃ U ×V → Z stetig differenzierbar mit F (x0 , y0 ) = 0. Die Ableitung der Funktion y → F (x0 , y) bei y0 sei ein Isomorphismus von Y auf Z. Dann existieren ur jedes x ∈ U0 die Umgebungen U0 von x0 und V0 von y0 , so daß f¨ Gleichung F (x, y) = 0 genau eine L¨osung y =: f (x) ∈ V0 besitzt, und die so definierte Funktion f : U0 → Y ist stetig differenzierbar. Beweis. (a), (d) und (e) beweist man genauso wie im Endlichdimensionalen; im Satz u ¨ber implizite Funktionen wird die Vollst¨andigkeit ben¨otigt, da man im Beweis den Banachschen Fixpunktsatz anwendet. ahle mit Korollar III.1.6 ein lineares Funktional y ∈ BY mit (b) W¨ y f (x0 + u) − f (x0 ) = f (x0 + u) − f (x0 ) , und wende den klassischen f (x0 + λu) − Mittelwertsatz auf die Hilfsfunktion ϕ: [0, 1] → R, ϕ(λ) = y f (x0 ) mit der Ableitung ϕ (λ) = y Df (x0 + λu)(u) an. Das liefert sofort die gew¨ unschte Absch¨ atzung. (c) Seien x0 ∈ U und ε > 0. Dann existiert ein δ > 0 mit Df (x0 + y) − Df (x0 ) ≤ ε f¨ ur y ≤ δ. Seien nun u ≤ δ und y ∈ BY so, daß y f (x0 + u) − f (x0 ) − Df (x0 )(u) = f (x0 + u) − f (x0 ) − Df (x0 )(u) . Wendet man den Mittelwertsatz auf die gleiche Hilfsfunktion wie unter (b) an, folgt f¨ ur ein ϑ ∈ (0, 1) f (x0 + u) − f (x0 ) − Df (x0 )(u) = y f (x0 + u) − f (x0 ) − Df (x0 )(u) ≤ y Df (x0 + ϑu)(u) − Df (x0 )(u) ≤ ε u . Lemma III.5.2 zeigt die Fr´echet-Differenzierbarkeit bei x0 .
2
Mit der Kettenregel l¨ aßt sich die Fr´echet-Differenzierbarkeit der Norm von L2 (μ) erneut begr¨ unden: Setze f : L2 (μ) → L1 (μ), x → x2 , y→ √y dμ, g: L1 (μ) → R, h: (0, ∞) → R, z → z. Ist 0 = x0 ∈ L2 (μ), so ist . 2 = h ◦ g ◦ f bei x0 Fr´echet-differenzierbar mit Ableitung $ % x → Dh g(f (x0 )) ◦ Dg(f (x0 )) ◦ Df (x0 ) (x) x0 x dμ 1 & = · g ◦ M2x0 (x) = 1/2 ; 2 g(f (x0 )) x20 dμ benutze Beispiel (b) und (d) und die dortigen Bezeichnungen.
122
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Man kann auch h¨ ohere Ableitungen einf¨ uhren. Ist f : X ⊃ U → Y Fr´echet-differenzierbar, so ist Df eine Funktion von U nach L(X, Y ). Falls diese Fr´echet-differenzierbar ist, nennt man f zweimal Fr´echet-differenzierbar; die zweite Ableitung ist eine Abbildung D2 f : U → L(X, L(X, Y )). Dieser monstr¨ ose normierte Raum l¨ aßt sich als ein Raum bilinearer Abbildungen darstellen. Ist n¨ amlich T ∈ L(X, L(X, Y )), kann man eine Abbildung φT : X × X → Y, φT (x1 , x2 ) = (T x1 )(x2 ) assoziieren. Diese ist bilinear (also linear in x1 , wenn man x2 festh¨alt, und umgekehrt) und beschr¨ ankt in dem Sinn, daß φT :=
sup
x1 ,x2 ∈BX
φT (x1 , x2 ) < ∞
ist. Auf diese Weise wird der Raum L(2) (X, Y ) der beschr¨ankten bilinearen Abbildungen von X × X nach Y zu einem normierten Raum, der zu L(X, L(X, Y )) isometrisch isomorph ist; denn offensichtlich ist φT = T , und eine gegebene beschr¨ ankte bilineare Abbildung φ kann durch den gem¨ aß (T x1 )(x2 ) = φ(x1 , x2 ) wohldefinierten Operator T ∈ L(X, L(X, Y )) als φ = φT dargestellt werden. Mit dieser Identifikation operiert die zweite Ableitung als D2 f : U → L(2) (X, Y ). Induktiv k¨ onnen jetzt h¨ ohere Ableitungen als Abbildungen Dn f : U → L(n) (X, Y ) ∼ = L(X, L(n−1) (X, Y )) definiert werden; Dn f (x0 ) ist also eine n-fach multilineare Abbildung. Damit kann man den Satz von Taylor formulieren, der wie im Endlichdimensionalen auf den reellen Fall zur¨ uckgef¨ uhrt werden kann; nur die Notation ist etwas komplizierter. Satz III.5.5 (Satz von Taylor) Sei f : X ⊃ U → R (n + 1)-mal Fr´echet-differenzierbar; es liege {x0 + λv: 0 ≤ λ ≤ 1} in der offenen Menge U . Dann existiert ein ϑ ∈ (0, 1) mit D2 f (x0 ) (v, v) + · · · 2 Dn f (x0 ) Dn+1 f (x0 + ϑv) + (v, . . . , v) + (v, . . . , v, v). n! (n + 1)!
f (x0 + v) = f (x0 ) + Df (x0 )(v) +
III.5
Differentiation nichtlinearer Abbildungen
123
Das klassische Anwendungsfeld der Differentialrechnung ist das L¨osen von Extremwertaufgaben. Das ist im unendlichdimensionalen Fall nicht anders; das Teilgebiet der Mathematik, das sich dem Studium von Extremalproblemen auf unendlichdimensionalen R¨ aumen widmet, wird traditionell Variationsrechnung genannt. Ein fundamentales Problem, das sich im Endlichdimensionalen nicht stellt, ist das der fehlenden Kompaktheit abgeschlossener beschr¨ ankter Mengen; daher ist die Existenz einer L¨osung eines unendlichdimensionalen Extremalproblems eine wesentlich heiklere Sache. Als Beispiel betrachte das Problem, das Minimum des Funktionals
1 2 (tx(t)) ˙ dt
f (x) = −1
auf der Menge A = {x ∈ C 1 [−1, 1]: x(−1) = −1, x(1) = 1} zu bestimmen; x˙ bezeichnet die Ableitung dx/dt. Es ist klar, daß f durch 0 nach unten beschr¨ ankt ist, und mit Hilfe der Funktionen xε (t) = arctan(t/ε)/ arctan(1/ε) erkennt man inf x∈A f (x) = 0. Da f (x) = 0 nur f¨ ur konstante Funktionen gilt und diese in A nicht zugelassen sind, hat das Minimumproblem keine L¨ osung. Es ist jedoch leicht, eine notwendige Bedingung f¨ ur das Vorliegen eines Extremums aufzustellen. Satz III.5.6 Ist U ⊂ X offen, f : U → R Gˆ ateaux-differenzierbar und besitzt f bei x0 ∈ U ein lokales Extremum, so gilt notwendig Df (x0 ) = 0. Beweis. Sei v ∈ X. Auf einem hinreichend kleinen Intervall (−α, α) ist die Hilfsfunktion ϕ(h) = f (x0 + hv) definiert und differenzierbar. Sie besitzt nach Voraussetzung bei h = 0 ein lokales Extremum, also folgt ϕ (0) = 0, was Df (x0 )(v) = 0 impliziert. Da v beliebig war, folgt die Behauptung. 2 In der klassischen Variationsrechnung studiert man die notwendige Bedingung Df (x0 ) = 0, die in vielen Anwendungen in eine Differentialgleichung transformiert werden kann, die Euler-Gleichung oder Euler-LagrangeGleichung des Problems genannt wird. Dazu ein einfaches Beispiel. Was ist die k¨ urzeste Verbindung zwischen den Punkten mit den Koordinaten (0, 0) und (1, 0) in der Ebene? Die Antwort lautet nat¨ urlich: die Gerade. Um dieses Problem mit Hilfe von Satz III.5.6 anzugehen, definieren wir das Funktional 1& 1 + x(t) ˙ 2 dt f (x) = 0
= {x ∈ C 1 [0, 1]: x(0) = x(1) = 0}; dieses auf dem Banachraum Integral gibt bekanntlich die Bogenl¨ ange der Kurve {(t, x(t)): 0 ≤ t ≤ 1} an. Notwendig f¨ ur eine Minimalstelle ist Df (x0 ) = 0, das heißt hier (verwende C01 [0, 1]
124
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Beispiel (c) und die Kettenregel) 1 x˙ 0 (t)v(t) ˙ dt = 0 Df (x0 )(v) = 2 )1/2 (1 + x ˙ (t) 0 0
∀v ∈ C01 [0, 1].
Falls x0 sogar zweimal stetig differenzierbar ist, kann man partiell integrieren und erh¨ alt, da die Randterme verschwinden, 1 x ¨0 (t) v(t) dt = 0 ∀v ∈ C01 [0, 1]. ˙ 0 (t)2 )3/2 0 (1 + x Nun gilt f¨ ur stetige Funktionen w 1 w(t)v(t) dt = 0 ∀v ∈ C01 [0, 1]
⇒
w=0
0
(Beweis?); diese obwohl einfache, doch a utzliche Aussage wird Fun¨ußerst n¨ damentallemma der Variationsrechnung genannt. Hier ergibt sich als EulerGleichung des Variationsproblems deshalb x ¨0 = 0. Mit anderen Worten: Die einzigen zweimal stetig differenzierbaren Kandidaten f¨ ur unser Minimalproblem sind die Geraden. In diesem speziellen Beispiel ist die notwendige ¨ Bedingung auch hinreichend. Uber allgemeine hinreichende Bedingungen f¨ ur Extrema kann man z.B. in den Monographien von Troutman [1996], Buttazzo/Giaquinta/Hildebrandt [1998] und Jost/Li-Jost [1999] nachlesen; vgl. jedoch Aufgabe III.6.35. F¨ ur Extremalprobleme, die mit mehrdimensionalen Integralen zusammenh¨ angen, f¨ uhrt der Weg u ¨ber die Euler-Gleichung auf partielle Differentialgleichungen. Insbesondere hier ist ein anderer Zugang, die sog. direkte Methode der Variationsrechnung, n¨ utzlich. Die Idee, eine Minimalstelle f¨ ur ein Funktional f zu finden, ist einfach: W¨ahle eine Folge (xn ) mit f (xn ) → inf f . Unter geeigneten Voraussetzungen existiert eine Teilfolge (xnk ), die in einem ad¨ aquaten Sinn gegen einen Punkt x0 konvergiert. Wenn auch (f (xn )) gegen f (x0 ) konvergiert, hat man die Existenz einer Minimalstelle bewiesen. Um die Funktionale, f¨ ur die dieses Programm funktioniert, zu beschreiben, f¨ uhren wir einige Begriffe ein. Definition III.5.7 Sei f : X → R ein Funktional auf einem normierten Raum X. (a) f heißt [schwach] halbstetig von unten, falls stets xn → x [schwach], f (xn ) ≤ c
⇒
f (x) ≤ c.
(b) f heißt koerzitiv, falls xn → ∞
⇒
f (xn ) → ∞.
III.5
125
Differentiation nichtlinearer Abbildungen
(c) f heißt konvex, falls f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y)
∀x, y ∈ X, 0 ≤ λ ≤ 1.
Die so definierte Halbstetigkeit m¨ ußte eigentlich Folgenhalbstetigkeit“ ” genannt werden; im Fall der Normkonvergenz ist sie zur topologischen Definition aus Lemma B.2.5 ¨ aquivalent. Manchmal ist es sinnvoll, diese Definitionen auf Funktionale mit Werten in R∪{∞} auszudehnen; die folgenden Resultate gelten dann entsprechend. Satz III.5.8 Sei X ein reflexiver Banachraum, und sei f : X → R schwach halbstetig von unten und koerzitiv. Dann existiert eine Stelle x0 mit f (x0 ) = inf x∈X f (x). Beweis. Sei m = inf x∈X f (x), der Fall m = −∞ ist an dieser Stelle (noch) nicht ausgeschlossen. W¨ ahle eine Folge (xn ) in X mit f (xn ) → m. Da ankt, und da X reflexiv ist, besitzt (xn ) f koerzitiv ist, ist (xn ) beschr¨ nach Theorem III.3.7 eine schwach konvergente Teilfolge, etwa xnk → x0 schwach. Wir zeigen jetzt f (x0 ) = m (> −∞). Sei c > m. Dann existiert ein k0 ∈ N mit f (xnk ) ≤ c f¨ ur k ≥ k0 . Da f schwach halbstetig von unten ist, folgt auch f (x0 ) ≤ c. Weil c > m beliebig war, muß m ≤ f (x0 ) ≤ m sein. 2 Das n¨ achste Lemma liefert ein hinreichendes Kriterium f¨ ur die schwache Halbstetigkeit von unten. Lemma III.5.9 Ist X ein normierter Raum und f : X → R konvex und stetig oder bloß halbstetig von unten, so ist f schwach halbstetig von unten. Beweis. Die Voraussetzung impliziert, daß f¨ ur jedes c die Menge {x: f (x) ≤ c} konvex und abgeschlossen ist. Die Behauptung folgt dann sofort aus Satz III.3.8. 2 Beispiel. Sei F : R2 → R stetig. Es m¨ ogen a ∈ L1 (R), b ∈ R und p > 1 mit p F (t, u) ≥ a(t) + b|u| existieren. Dann definiert f (x) = F (t, x(t)) dt R
ein Funktional auf L (R) mit Werten in R ∪ {∞}, da f (x) ≥ a(t) dt + b x pp ; p
R
diese Absch¨ atzung zeigt auch die Koerzitivit¨ at von f . F¨ ur alle t sei u → F (t, u) eine konvexe Funktion; dann ist auch f ein konvexes Funktional,
126
III.
Der Satz von Hahn-Banach und seine Konsequenzen
wie man durch Einsetzen unmittelbar erkennt. Zeigen wir noch die Halbstetigkeit von f : Sei (xn ) eine Folge in Lp (R) mit xn → x in Lp (R) und ¨ f (xn ) ≤ c. Nach Ubergang zu einer Teilfolge d¨ urfen wir annehmen, daß (xn ) auch fast u ¨berall gegen x konvergiert1. Wegen der Stetigkeit von F folgt F (t, xn (t)) → F (t, x(t)) fast u ¨berall und weiter nach dem Lemma von Fatou2 f (x) ≤ lim inf f (xn ) ≤ c. Nach Lemma III.5.9 und Satz III.5.8 besitzt f eine Minimalstelle in Lp (R).
III.6
Aufgaben
Aufgabe III.6.1 Gib die Details des Beweises von Satz III.1.10. Aufgabe III.6.2 Sei X ein normierter Raum und U ein abgeschlossener Unterraum. Sei x ∈ X \ U . Dann existiert ein Funktional x ∈ U ⊥ mit x ≤ 1 und x (x) = d(x, U ). (Hinweis: Benutze Satz III.1.10!) Aufgabe III.6.3 Sei X ein normierter Raum und K ⊂ X konvex. (a) Die Mengen K und int K sind ebenfalls konvex. (b) Ist int K = ∅, so gilt K = int K. Aufgabe III.6.4 Seien K und L konvexe absorbierende Teilmengen des normierorigen Minkowski-Funktionale. ten Raums X, und seien pK und pL die zugeh¨ (a) Zeige pK ≥ pL , falls K ⊂ L. (b) pK ist genau dann stetig, wenn 0 ∈ int K gilt. −1 (c) Wenn pK stetig ist, gelten K = p−1 K ([0, 1]) und int K = pK ([0, 1)). (d) Gilt zus¨ atzlich λK ⊂ K, falls |λ| ≤ 1 (d.h. ist K kreisf¨ ormig“), so ist ” pK eine Halbnorm, und pK ist eine Norm dann und nur dann, wenn K keinen nichttrivialen Unterraum von X enth¨ alt. (e) Gilt f¨ ur eine konvexe Menge K K absorbierend ⇒ 0 ∈ int K“? ” Aufgabe III.6.5 (Banachlimiten) Wir betrachten K = R. Eine lineare Abbildung : ∞ → R heißt Banachlimes, falls ∞ ist, der x = • (T x) = (x) f¨ ur alle x ∈ , wo T der Shiftoperator x(1), x(2), x(3), . . . ∈ ∞ auf x(2), x(3), x(4), . . . abbildet.
• Falls x(n) ≥ 0 f¨ ur alle n ∈ N, so gilt (x) ≥ 0. • (1) = 1, wo 1 = (1, 1, 1, . . .). (a) Sei ein Banachlimes. Dann gelten: • ∈ (∞ ) und = 1,
• lim inf x(n) ≤ (x) ≤ lim sup x(n) f¨ ur x = x(n) ∈ ∞ , speziell ur x ∈ c, (x) = limn→∞ x(n) f¨ 1 Siehe 2 Siehe
z.B. Theorem 3.12 in Rudin [1986]. z.B. Lemma 1.28 in Rudin [1986].
III.6
127
Aufgaben
• ist nicht multiplikativ, d.h., es gilt nicht (x · y) = (x) (y) f¨ ur alle x, y ∈ ∞ . (b) Es existiert ein Banachlimes . (Hinweis: Variante I: Betrachte p(x) = supn x(n), zeige dann 0 ≤ p|U , wo U = {T x − x: x ∈ ∞ }, und nsetze mit Hahn-Banach fort. Variante II: x(j). Zeige die Sublinearit¨ at von p und Betrachte p(x) = lim sup n1 j=1 beachte (Analysis I!) p|c = lim. Setze mit Hahn-Banach fort.) zweier FunktioAufgabe III.6.6 Sei ∈ (∞ ) . Zeige, daß eindeutig als Summe ∞ nale 1 und 2 geschrieben werden kann, wo 1 (sn ) = n=1 sn tn und 2 |c0 = 0 ist. Zeige ferner, daß = 1 + 2 gilt. Schließe, daß jedes Funktional auf c0 eindeutig zu einem normgleichen Funktional auf ∞ fortgesetzt werden kann. ahle x, y ∈ ∞ mit x∞ = y∞ = 1, so (Hinweise: (1) Betrachte (en ). (2) W¨ ur n ≤ N daß 1 (x) ≈ 1 und 2 (y) ≈ 2 . Sei z die Folge mit z(n) = x(n) f¨ und z(n) = y(n) f¨ ur n > N . F¨ ur passendes N versuche (z) ≈ 1 + 2 zu zeigen.) Aufgabe III.6.7 Sei X strikt konvex (Aufgabe I.4.13). Dann gilt Eindeutigkeit im Fortsetzungssatz von Hahn-Banach. Aufgabe III.6.8 (Rieszscher Darstellungssatz f¨ ur (C[0, 1]) ) Sei ∈ (C[0, 1]) und L eine Hahn-Banach-Fortsetzung zu einem Funktional L ∈ (∞ [0, 1]) . Setze yt = χ[0,t] ∈ ∞ [0, 1]. Zeige C[0, 1] ⊂ lin{yt : t ∈ [0, 1]}. Setze ankter Variation ist. Beweise schließlich g(t) = L(yt ) und zeige, daß g von beschr¨ die Darstellung des Funktionals als Stieltjes-Integral
1
∀x ∈ C[0, 1].
x(t) dg(t)
(x) = 0
(Zum Begriff des Stieltjes-Integrals siehe z.B. Rudin [1976], S. 122.) Dieser Beweis stammt von Banach. Aufgabe III.6.9 Seien V1 und V2 konvexe Teilmengen des normierten Raums X, und es gelte int V1 = ∅, int V1 ∩ V2 = ∅. Dann existiert x ∈ X , x = 0, mit Re x (v1 ) ≤ Re x (v2 )
∀v1 ∈ V1 , v2 ∈ V2 .
Aufgabe III.6.10 Seien K und L disjunkte abgeschlossene konvexe Teilmengen eines normierten Raums X, zus¨ atzlich sei eine von beiden kompakt. Zeige, daß ur das gilt ein stetiges Funktional x ∈ X existiert, f¨ sup Re x (x) < inf Re x (x). x∈K
x∈L
(Es gibt Beispiele, die zeigen, daß diese Aussage ohne die vorausgesetzte Kompaktheit falsch ist, selbst, wenn man nur ≤ fordert.) Aufgabe III.6.11 Seien U und V disjunkte abgeschlossene beschr¨ ankte konvexe Teilmengen eines reflexiven Banachraums X. Dann k¨ onnen U und V strikt getrennt werden. (Tip: Zeige zuerst inf{u − v: u ∈ U, v ∈ V } > 0; dazu beachte Theorem III.3.7 und Satz III.3.8.)
128
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Aufgabe III.6.12 Sei K eine konvexe Menge. Eine Funktion f : K → R heißt konvex (bzw. affin bzw. konkav ), wenn f (λx + (1 − λ)y) ≤ λf (x) + (1 − λ)f (y) f¨ ur alle x, y ∈ K, 0 ≤ λ ≤ 1 (bzw. = bzw. ≥). Sei nun f : Rn → R eine konkave stetige Funktion sowie g: Rn → R eine konvexe stetige Funktion mit f ≤ g. Dann existiert eine affine stetige Funktion h: Rn → R mit f ≤ h ≤ g. (Hinweis: Betrachte die Teilmengen {(x, r): x ∈ Rn , r < f (x)} und {(x, r): x ∈ Rn , r > g(x)} von Rn+1 .) Aufgabe III.6.13 Sei P[0, 1] (bzw. Pn [0, 1]) der Vektorraum aller Polynomfunktionen (h¨ ochstens n-ten Grades) auf [0,1]. Existiert ein Borelmaß μ auf [0,1] mit 1 ur alle p ∈ P[0, 1]? (a) p (0) = 0 p dμ f¨ (b) p (0) =
1 0
p dμ f¨ ur alle p ∈ Pn [0, 1]?
Aufgabe III.6.14 Ist X ein Banachraum und A ⊂ X kompakt, so auch co A. (Hinweis: Satz B.1.7.) Aufgabe III.6.15 Keiner der R¨ aume ∞ , C[0, 1], L1 [0, 1], L∞ [0, 1] ist reflexiv. Aufgabe III.6.16 Seien X und Y Banachr¨ aume. σ σ (a) xn → x, T ∈ L(X, Y ) ⇒ T xn → T x. σ (b) xn → x, T ∈ K(X, Y ) ⇒ T xn → T x. (Hinweis: Benutze hier im Vorgriff die in Kapitel IV bewiesene Tatsache, ankt ist.) daß (xn ) beschr¨ (c) X sei reflexiv, und T ∈ L(X, Y ) erf¨ ulle σ
xn → x
⇒
T xn → T x.
Dann ist T kompakt. Aufgabe III.6.17 Zeige, daß eine beschr¨ ankte Folge (xn ) in einem normierten Raum X genau dann gegen x ∈ X schwach konvergiert, wenn es eine Teilmenge ur alle x ∈ D gibt. D ⊂ X mit lin D = X und limn→∞ x (xn ) = x (x) f¨ Aufgabe III.6.18 Sei X ein separabler normierter Raum und (xn ) eine beschr¨ ankte Folge in X . Dann existieren eine Teilfolge (xnk ) und ein Funktional ur alle x ∈ X. Kann man auf die Separabix ∈ X mit limk→∞ xnk (x) = x (x) f¨ lit¨ at verzichten? (Tip: Imitiere den Beweis von Theorem III.3.7.) Aufgabe III.6.19 Sei X ein reflexiver Banachraum, und sei K ⊂ X abgeschlossen, konvex und nicht leer. Dann gibt es zu jedem x ∈ X eine beste Approxima” tion“ in K, d.h. ein y ∈ K mit x − y = d(x, K) := inf x − z. z∈K
Aufgabe III.6.20 Sei 1 < p < ∞ und en der n-te Einheitsvektor in p . σ (a) Es gilt en → 0.
III.6
129
Aufgaben
(b) Aus Korollar III.3.9 folgt die Existenz einer Folge (yn ) von Konvexkombinationen der en mit yn → 0. Gib solche Konvexkombinationen explizit an! Aufgabe III.6.21 (a) Ist T : X → Y ein [isometrischer] Isomorphismus zwischen normierten R¨ aumen, so ist T : Y → X ebenfalls ein [isometrischer] Isomorphismus. Sind X und Y Banachr¨ aume, so gilt auch die Umkehrung. (b) Ist ein normierter Raum Y isomorph zu einem reflexiven Banachraum X, so ist Y ebenfalls ein reflexiver Banachraum. Aufgabe III.6.22 Seien X und Y Banachr¨ aume, und sei U ⊂ X ein abgeschlossener Unterraum. Sei S ∈ L(U, Y ). (a) Im Fall Y = ∞ gestattet S eine normerhaltende Fortsetzung zu einem Operator auf X, d.h., es existiert T ∈ L(X, Y ) mit T |U = S und S = T . (Hinweis: Wende den Satz von Hahn-Banach auf die Funktionale n : u → (Su)(n) an!) (b) Falls U = Y = c0 , X = c und S = Idc0 , so hat jede Fortsetzung T von S auf X eine Norm ≥ 2. Um das zu beweisen, zeige zuerst f¨ ur M = {x ∈ c0 : |x(n) − 1| ≤ 1 ∀n ∈ N}, daß der Radius jeder abgeschlossenen Kugel in alt, mindestens 2 ist. c0 , die M enth¨ (c) Falls U = Y = {(x, y, z) ∈ R3 : x + y + z = 0}, X = ∞ (3) und S = IdU , dann hat jede Fortsetzung T von S auf X eine Norm ≥ 4/3. (Hinweis: Die Matrix von T muß die Gestalt
'
a a−1 a−1 b b+1 b −a − b −a − b −a − b + 1
(
haben. Nun benutze Aufgabe II.5.8.) Aufgabe III.6.23 Sei X ein separabler Banachraum. Dann existiert ein isometrischer linearer Operator von X nach ∞ . Jeder separable Banachraum ist also isometrisch isomorph zu einem abgeschlossenen Teilraum von ∞ . (Tip: Sei {xn : n ∈ N} dicht in X. Definiere den gesuchten Operator durch ¨ ur passend zu w¨ ahlende Funktionale xn ∈ X . Ubrigens ist jex → xn (x) f¨ der separable Banachraum sogar zu einem abgeschlossenen Teilraum von C[0, 1] isometrisch isomorph. Dieser Satz von Banach und Mazur ist aber weit schwieriger zu zeigen.) Aufgabe III.6.24 Gib die Details des Beispiels III.4(c). Aufgabe III.6.25 (Momentenoperator) Zu f ∈ L1 [0, 1] betrachte die Folge der Momente (fn# )n≥0 , wo
1
f (t)tn dt.
fn# = 0
Zeige, daß die Abbildung T : f → (fn# ) ein stetiger linearer Operator von L1 [0, 1] nach c0 ist. Gib die Darstellung des adjungierten Operators T : 1 → L∞ [0, 1].
130
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Aufgabe III.6.26 Untersuche die Abbildung F : L2 [0, 1] → L2 [0, 1], (F (x))(t) = sin x(t), auf Gˆ ateaux- bzw. Fr´echet-Differenzierbarkeit an der Stelle x = 0. Aufgabe III.6.27 Sei U = {x ∈ C[0, 1]: x(t) = 0 ∀t}. Untersuche die Abbildung f : U → C[0, 1], f (x) = 1/x, auf Differenzierbarkeit. Aufgabe III.6.28 An welchen Stellen ist die Supremumsnorm auf C[0, 1] bzw. ateaux- oder Fr´echet-differenzierbar? c0 Gˆ Aufgabe III.6.29 Seien f, g: U → Y Gˆ ateaux-differenzierbar und φ: Y ×Y → Z bilinear und beschr¨ ankt. Bestimme die Ableitung von x → φ(f (x), g(x)). Aufgabe III.6.30 Finde Beispiele f¨ ur (a) eine Abbildung f : X → Y , die an einer Stelle Gˆ ateaux-differenzierbar, aber nicht stetig ist; ateaux-differenzierbar (b) eine Abbildung f : X → Y , die an einer Stelle x0 Gˆ ateaux-differenzierbar ist, und eine Abbildung g: Y → Z, die bei f (x0 ) Gˆ ateaux-differenzierbar ist; ist, so daß g ◦ f : X → Z bei x0 nicht Gˆ ur die an einer Stelle s¨ amtliche Richtungs(c) eine Funktion f : R2 → R, f¨ ableitungen existieren, die dort aber nicht Gˆ ateaux-differenzierbar ist. Aufgabe III.6.31 Eine Norm heißt lokal gleichm¨ aßig konvex, wenn es zu jedem x mit x = 1 und jedem ε > 0 ein δ = δ(x, ε) > 0 gibt, so daß
x + y > 1−δ
y ≤ 1,
2
⇒
x − y < ε.
aßig konvex, so ist die Norm von X an (a) Ist die Norm von X lokal gleichm¨ jeder Stelle x0 = 0 Fr´echet-differenzierbar. (b) Ist die Norm von X strikt konvex (siehe Aufgabe I.4.13), so ist die Norm ateaux-differenzierbar. von X an jeder Stelle x0 = 0 Gˆ ateaux-differenzierbar, (c) Ist die Norm von X an jeder Stelle x0 = 0 Gˆ so ist die Norm von X strikt konvex. [Bemerkung: Die entsprechende Umkehrung von (a) gilt nicht.] Aufgabe III.6.32 Zeige, daß die kanonische Norm von Lp (μ) an jeder Stelle x0 = 0 Fr´echet-differenzierbar ist, (a) mit Hilfe von Beispiel III.5(e), (b) im Fall p ≥ 2 mittels der Aufgaben III.6.31 und I.4.18. Aufgabe III.6.33 Wenn die Norm eines normierten Raums X auf X \ {0} Fr´echet-differenzierbar ist, ist die Ableitung dort stetig. Aufgabe III.6.34 Sei f : X → R ein Funktional auf einem normierten Raum. Der Epigraph von f ist die Teilmenge epi(f ) := {(x, t): f (x) ≤ t} von X ⊕ R. (a) f ist genau dann konvex, wenn epi(f ) konvex ist. (b) f ist genau dann halbstetig von unten, wenn epi(f ) abgeschlossen ist. Aufgabe III.6.35 Sei f : X → R ein Gˆ ateaux-differenzierbares konvexes Funktional und x0 ∈ X mit Df (x0 ) = 0. Dann besitzt f bei x0 ein globales Minimum. Aufgabe III.6.36 Bestimme das Minimum des Funktionals f (x) = et x(t) dt auf C[0, 1].
1 0
x(t)4 +
III.7 Bemerkungen und Ausblicke
III.7
131
Bemerkungen und Ausblicke
Der Satz von Hahn-Banach ist eines der fundamentalen Prinzipien der Funktionalanalysis; wie Pedersen ([1979], S. 25) in ¨ahnlichem Zusammenhang sagt, it can be used every day, and twice on Sundays“. Theorem III.1.5 ” wurde unabh¨ angig voneinander von Hahn (J. f. reine u. angew. Math. 157 (1927) 214–229) und Banach (Studia Math. 1 (1929) 211–216) f¨ ur reelle R¨ aume bewiesen, und kurze Zeit darauf bemerkte Banach (Studia Math. 1 (1929) 223–239) die allgemeinere Version des Satzes III.1.2. Es dauerte jedoch vier weitere Jahre, bis Mazur (Studia Math. 4 (1933) 70–84) diese geschmeidigere Variante erfolgreich anwendete, um damit die Trennungss¨atze zu beweisen. Die komplexen Hahn-Banach-S¨ atze wurden unabh¨angig voneinander von Soukhomlinov (Mat. Sbornik 3 (1938) 353–358) und jenseits des Atlantiks von Murray (Trans. Amer. Math. Soc. 39 (1936) 83–100; f¨ ur Lp ) und Bohnenblust/Sobczyk (Bull. Amer. Math. Soc. 44 (1938) 91–93) gefunden. Satz III.1.13, den wir auf simple Weise aus dem Hahn-Banachschen Fortsetzungssatz abgeleitet haben, ist historisch als Katalysator bei der Entwicklung des Satzes von Hahn-Banach anzusehen. Er beinhaltet die L¨ osung des allgemeinen Momentenproblems. Diese Bezeichnung stammt aus der Wahrscheinlichkeitstheorie, wo man die Zahlen tn dμ(t) die Momente der Verteilung μ nennt; die Wahrscheinlichkeitstheorie hat sie ihrerseits aus der Mechanik entlehnt. F¨ ur X = C[a, b] und xn (t) = tn gibt also (III.8) eine notwendige und hinreichende Bedingung f¨ ur die Existenz eines signierten (oder komplexen) Maßes mit vorgeschriebenen Momenten. ´ In dieser Form stammt Satz III.1.13 von F. Riesz (Ann. Sci. Ecole Norm. Sup. 28 (1911) 33–62); ein anderer Beweis stammt von Helly (Sitzungsber. math. nat. Kl. Akad. Wiss. Wien 121 (1912) 265–297). Ein weiterer Vorg¨ anger von Satz III.1.13 ist der Fischer-Rieszsche Satz V.4.14, der besagt, ur X = L2 und orthonormale“ Elemente xi die Bedingung 2daß f¨ ” |ci | < ∞ notwendig und hinreichend f¨ ur (III.8) ist. Riesz bewies III.1.13 auch f¨ ur Lp [0, 1] und p (Math. Ann. 69 (1910) 449–497; Les syst`emes ” d’´equations lin´eaires `a une infinit´e d’inconnues“, Paris 1913); er argumentierte, ohne eine Verbindung zu einem Fortsetzungsproblem zu ziehen, mit Hilfe des Theorems III.3.7, das er f¨ ur diese R¨ aume aufstellte. Diese Verbindung zieht Helly in seiner bereits in Kapitel I genannten Arbeit (Monatshefte f. Math. u. Physik 31 (1921) 60–91), und er geht einen entscheidenden Schritt weiter, indem er Satz III.1.13 f¨ ur abstrakte Folgenr¨aume herleitet, bevor Hahn darauf aufbauend 1927 die endg¨ ultige Version findet und den Fortsetzungssatz III.1.5 beweist. Hahn f¨ uhrt in seiner Arbeit explizit den Begriff des Dualraums (unter der Bezeichnung polarer Raum“) und des ” reflexiven Raums ( regul¨ arer Raum“) ein; zur Erinnerung sei noch einmal ” erw¨ ahnt, daß sich erst 1922 der abstrakte Begriff des normierten Raums heraussch¨ alte, siehe Abschnitt I.5. Banach formuliert Satz III.1.13 in seiner Arbeit ebenfalls explizit.
132
III.
Der Satz von Hahn-Banach und seine Konsequenzen
Auch in der Lemberger Schule gab es Vorarbeiten zum Hahn-Banachschen Satz. Banach selbst bewies 1923 einen speziellen Fortsetzungssatz, um ein maßtheoretisches Problem (siehe Fußnote auf S. 489) zu l¨osen, und Mazur 1927 einen weiteren, um die Existenz von Banachlimiten (Aufgabe III.6.5) zu zeigen, die also eigentlich Mazurlimiten heißen sollten. Sowohl Hahn als auch Banach benutzten in ihren Beweisen f¨ ur den Fortsetzungssatz die Methode der transfiniten Induktion; diese Technik ist heute in der Analysis etwas aus der Mode gekommen und wird durch das Zornsche Lemma ersetzt. Ironischerweise verwendet man mit dem Zornschen Lemma dasselbe Beweismittel, um im Satz von Hahn-Banach allgemein die Existenz stetiger Funktionale auf normierten R¨aumen zu zeigen, das man – via Existenz einer Vektorraumbasis – heranziehen muß, um die Existenz unstetiger Funktionale zu begr¨ unden, siehe Aufgabe II.5.2. Im Lauf der Zeit sind verschiedene alternative Beweise f¨ ur den Satz von Hahn-Banach gefunden worden; z.B. f¨ uhrt ihn Kakutani auf einen von ihm gezeigten Fixpunktsatz zur¨ uck (Proc. Acad. Japan 14 (1938) 242–245). Eine Reihe weiterer Anwendungen, u.a. auf Differentialgleichungen, in der Approximationstheorie und der Maßtheorie, wird bei Heuser [1992], S. 272ff., ¨ und Mukherjea/Pothoven [1986], S. 24, genannt. Ein Ubersichtsartikel von Buskes zum Satz von Hahn-Banach ist in Dissertationes Math. 327 (1993) erschienen. Es sei außerdem auf die Arbeiten von K¨onig und seinen Sch¨ ulern hingewiesen; als erste Orientierung diene sein Artikel On some basic theo” rems in convex analysis“ in B. Korte (Hg.), Modern Applied Mathematics – Optimization and Operations Research, North-Holland 1982, S. 107–144. Wie bereits erw¨ ahnt, stammen die Hahn-Banach-Trennungss¨atze von Mazur; einige der S¨ atze in Abschnitt III.2 sind auf Eidelheit (Studia Math. 6 (1936) 104–111) zur¨ uckgehende Varianten, die eine im Schottischen Buch gestellte Frage beantworten (Problem 64, Mauldin [1981], S. 136). Wichtiger noch als f¨ ur normierte R¨ aume sind die Trennungss¨atze f¨ ur die in Kapitel VIII studierten lokalkonvexen R¨ aume. Dieudonn´e hat Beispiele f¨ ur disjunkte abgeschlossene konvexe beschr¨ ankte Teilmengen von 1 , die nicht durch ein stetiges Funktional getrennt werden k¨onnen, konstruiert, was nat¨ urlich viel st¨arker als das auf S. 103 gegebene Beispiel ist; selbstverst¨andlich kann keine der beiden Mengen einen inneren Punkt haben. Tats¨achlich gibt es solche Gegenbeispiele in allen nichtreflexiven Banachr¨aumen (siehe K¨ othe [1966], S. 325), w¨ ahrend in reflexiven R¨aumen die Trennung disjunkter abgeschlossener konvexer beschr¨ ankter Teilmengen immer m¨oglich ist (Aufgabe III.6.11). Der Begriff der schwachen Konvergenz geh¨orte von Anfang an zu den Eckpfeilern der Funktionalanalysis, ist sie doch ein Hilfsmittel, die fehlende Kompaktheit der Kugeln im Unendlichdimensionalen zu kompensieren. Hilbert (f¨ ur 2 ) (Nachr. Kgl. Gesellsch. Wiss. G¨ottingen, Math.-phys. Kl. (1906) 157–227) und Riesz (f¨ ur p und Lp ; a.a.O.) haben die Aussage von Theorem III.3.7 als erste bewiesen und auf Integralgleichungen angewandt;
III.7
Bemerkungen und Ausblicke
133
die allgemeine Fassung stammt von Banach. In der Tat werden reflexive R¨ aume durch die in Theorem III.3.7 ausgesprochenen Eigenschaft charakterisiert ; dies ist ein Satz von Eberlein, siehe Abschnitt VIII.7. Satz III.3.8 wurde von Mazur bewiesen. urdiges Ph¨anomen, was die schwache Der Folgenraum 1 zeigt ein merkw¨ Konvergenz angeht, n¨ amlich: • (Lemma von Schur) In 1 ist jede schwach konvergente Folge konvergent. Der Beweis kann mit der Methode des gleitenden Buckels gef¨ uhrt werden (Banach [1932], S. 137). In Kapitel VIII werden wir noch einmal von einem allgemeineren Standpunkt, n¨ amlich dem der schwachen Topologie, auf die schwache Konvergenz zur¨ uckkommen. Hilbert nannte solche Operatoren auf 2 vollstetig, die schwach konvergente Folgen auf konvergente Folgen abbilden. Aufgabe III.6.16 zeigt, daß diese Operatoren auf reflexiven Banachr¨ aumen genau die kompakten sind, und Riesz (Acta Math. 41 (1918) 71–98) nennt in der Folge unsere kompakten Operatoren vollstetig. Das Lemma von Schur impliziert aber, daß jeder stetige Operator auf 1 vollstetig im Hilbertschen Sinn ist. Achtung: Manche Autoren benutzen auch heute noch die Begriffe vollstetig“ und ” kompakt“ synonym, ohne die obige Differenzierung zu treffen. ” p Adjungierte Operatoren wurden auf L zuerst von Riesz (wem sonst?) betrachtet, die allgemeine Definition konnte sinnvoll erst mit der Erkenntnis getroffen werden, daß der Dualraum eines normierten Raums hinreichend reichhaltig ist, also nachdem der Satz von Hahn-Banach bewiesen wurde. Diese allgemeine Definition stammt von Banach (Studia Math. 1 (1929) 223–239). Schauder (Studia Math. 2 (1930) 185–196) bewies Satz III.4.4 und wandte ihn in der Potentialtheorie an; wir kommen in Kapitel VI darauf zur¨ uck. Im Zusammenhang mit Aufgabe III.6.21 ist bemerkenswert, daß es sehr wohl nicht isomorphe Banachr¨ aume gibt, deren Dualr¨aume isomorph sind; der Isomorphismus der Dualr¨ aume kann dann nat¨ urlich kein adjungierter Operator sein. Prominentestes Beispiel ist das Paar 1 , L1 [0, 1]. Daß diese R¨ aume nicht isomorph sind, l¨ aßt sich aus dem Lemma von Schur oder folgendem auch f¨ ur sich interessanten Ergebnis ableiten (siehe K¨othe [1979], S. 208, oder Fabian/Zizler, Proc. Amer. Math. Soc. 131 (2003) 3693–3694): • (Satz von Pitt) F¨ ur 1 ≤ q < p < ∞ ist jeder stetige Operator von p nach q kompakt; ferner ist jeder stetige Operator von c0 nach q kompakt. Speziell ist jeder stetige Operator von 2 nach 1 kompakt, aber (T x)(t) = ∞ n=1 x(n) sin 2πnt definiert einen nicht kompakten stetigen Operator von 2 nach L1 [0, 1]. Andererseits hat Pelczy´ nski das u ¨berraschende Resultat bewiesen, daß ∞ und L∞ [0, 1] isomorph sind (Lindenstrauss/Tzafriri [1977],
134
III.
Der Satz von Hahn-Banach und seine Konsequenzen
S. 111). Auf der isometrischen Seite sei das wesentlich einfachere Gegen¨ c0 , erw¨ ahnt. Ubrigens impliziert der Satz beispiel c ∼ = (c0 ) , obwohl c ∼ = p q von Pitt die Reflexivit¨ at von L( , ) f¨ ur 1 < q < p < ∞; Kaltons Arbeit Math. Ann. 208 (1974) 267–278 enth¨ alt dieses Resultat als Spezialfall. In Aufgabe III.6.22(a) war die Operatorversion des Satzes von Hahnur Y = L∞ (μ), Banach f¨ ur Y = ∞ zu zeigen. Solch ein Satz gilt ebenfalls f¨ μ σ-endlich, und kann f¨ ur K = R nach Nachbin (Trans. Amer. Math. Soc. 68 (1950) 28–46) so gezeigt werden. Wie im skalaren Fall besteht der Kern des Beweises darin, um eine einzige Dimension fortzusetzen. Sei also X = U ⊕ R{x0 }. Wir m¨ ussen y0 ∈ Y finden, so daß der Operator T (u + λx0 ) = Su + λy0 dieselbe Norm wie S besitzt, die o.E. = 1 sei. Der Vektor y0 muß also Su + λy0 ≤ u + λx0 f¨ ur alle u ∈ U , λ ∈ R erf¨ ullen, was man unschwer als ¨ aquivalent zu Su − y0 ≤ u − x0
∀u ∈ U
(III.13)
erkennt. (III.13) verlangt daher, daß y0 in allen abgeschlossenen Kugeln Ku mit Mittelpunkt Su und Radius u − x0 liegt; solch ein y0 kann genau dann gefunden werden, wenn u∈U Ku = ∅ ist. Um den Beweis abzuschließen, gen¨ ugt es nun zu bemerken, daß (1) je zwei der Ku sich schneiden, da S = 1, und (2) dem Raum L∞ die Eigenschaft zukommt, daß jedes System abgeschlossener Kugeln, die sich paarweise schneiden, einen gemeinsamen Punkt besitzt. Zum Nachweis von (2) benutzt Nachbin den in Kapitel VIII bewiesenen Satz von Alaoglu. F¨ ur komplexe Skalare ist das Argument nicht so einfach; Weiteres zu diesem Themenkreis findet man ¨ bei Lacey [1974], §11, und in einem Ubersichtsartikel von Fuchssteiner und ¨ Horv´ ath (Jahrbuch Uberblicke Mathematik 1979, S. 107–122). Der in Abschnitt III.5 pr¨ asentierte Zugang zur Differentiation in normierten R¨ aumen ist vom heutigen Standpunkt aus sehr nat¨ urlich; vor ca. 100 Jahren war diese Sichtweise freilich revolution¨ar. Volterra schlug 1887 zum ersten Mal die Idee vor, z.B. die Bogenl¨ange als Funktion der Kurve aufzufassen, er sprach in diesem Zusammenhang von Funktionen, die ” von anderen Funktionen abh¨ angen“; der Begriff des Funktionals taucht erst 1903 bei Hadamard auf. Die abstrakte Differentialrechnung wurde um 1910 von Fr´echet vorgestellt und in zwei postum ver¨offentlichten fundamentalen Arbeiten (1919, 1922) von Gˆateaux, der im I. Weltkrieg get¨otet wurde, weiterentwickelt. Daß die elementaren“ Resultate u ¨ ber differenzierbare Funk” tionen nichts weiter als ein Abziehbild der Beweise aus der Analysisvorlesung sind, liegt nat¨ urlich daran, daß wir heute den richtigen“ Begriff der ” Differenzierbarkeit f¨ ur Funktionen von Rn nach Rm besitzen. Aber die Idee der linearen Approximation als Definition der Differenzierbarkeit, selbst f¨ ur Funktionen von R2 nach R, verdankt man ebenfalls erst Fr´echet (1911) sowie unabh¨ angig von ihm Young (1909), und von dort zur Differentialrechnung in normierten R¨ aumen ist es nur ein vergleichsweise kleiner Schritt.
III.7
Bemerkungen und Ausblicke
135
Zum Satz u ¨ber implizite Funktionen ist noch anzumerken, daß der Version im Text harte“ S¨ atze u uberstehen, die auf ¨ ber implizite Funktionen gegen¨ ” raffinierteren Absch¨ atzungen beruhen und viel schw¨achere Voraussetzungen haben; siehe etwa Schwartz [1969]. Detaillierte historische Kommentare fin¨ den sich in Nasheds Ubersichtsartikel Differentiability and related proper” ties of nonlinear operators“, in L. B. Rall, Nonlinear Functional Analysis and Applications (Academic Press 1971), S. 103–309. Die geometrische Charakterisierung der Fr´echet-Differenzierbarkeit der Norm in Satz III.5.3 stammt von Shmulyan (1940), der außerdem unter Zusatzvoraussetzungen bewies, daß ein Banachraum, dessen Dualraumnorm Fr´echet-differenzierbar ist3 , notwendig reflexiv sein muß. Tats¨achlich gilt diese Aussage ohne weitere Zusatzvoraussetzungen, wie in den f¨ unfziger Jahren gezeigt werden konnte. Umgekehrt zeigte Troyanski (Studia Math. 37 (1971) 173–180), daß jeder reflexive Banachraum eine ¨aquivalente Fr´echet-differenzierbare Norm besitzt, und M. Kadets (Uspekhi Mat. Nauk 20.3 (1965) 183–187) und Klee (Fund. Math. 49 (1960) 25–34) erhielten unabh¨ angig voneinander das Resultat, daß ein separabler Banachraum genau dann eine a ¨quivalente Fr´echet-differenzierbare Norm besitzt, wenn sein Dualraum separabel ist. Da jeder separable Banachraum eine a¨quivalente Gˆ ateaux-differenzierbare Norm besitzt (Day 1955), ist die Existenz einer Fr´echet-differenzierbaren Norm eine erhebliche Einschr¨ankung, die jedoch weitreichende Konsequenzen hat. So gilt etwa: • Besitzt ein Banachraum X eine ¨ aquivalente Fr´echet-differenzierbare Norm, so ist jedes stetige konvexe Funktional auf X auf einer dichten Teilmenge Fr´echet-differenzierbar. Dieses Resultat geht im wesentlichen auf Asplunds bahnbrechende Arbeit in Acta Math. 121 (1968) 31–47 zur¨ uck. Banachr¨aume, in denen die Aussage dieses Satzes gilt, werden heute Asplundr¨aume genannt; sie k¨onnen auf vielf¨ altige Art charakterisiert werden. Z.B. ist X genau dann ein Asplundraum, wenn jeder separable Unterraum einen separablen Dualraum hat. Ersetzt man im Satz von Asplund Fr´echet“ durch Gˆ ateaux“, erh¨alt man ” ” ebenfalls eine wahre Aussage – dies ist ein tiefliegender Satz von Preiss (Israel J. Math. 72 (1990) 257–279), der eine jahrzehntealte Frage beantwortet. (Daß auf separablen Banachr¨ aumen stetige konvexe Funktionale auf einer dichten Teilmenge Gˆateaux-differenzierbar sind, wurde schon 1933 von Mazur gezeigt.) Ein weiteres gefeiertes Resultat von Preiss bezieht sich auf Lipschitzstetige Funktionen. Nach einem Satz von Rademacher ist jede Lipschitzstetige Funktion f : Rn → R fast u ¨ berall bzgl. des Lebesguemaßes und insbesondere auf einer dichten Teilmenge differenzierbar. Es war lange Zeit ein offenes Problem, ob eine analoge Aussage auf unendlichdimensionalen 3 Hier
wie im folgenden ist an jeder Stelle = 0 Fr´ echet-differenzierbar“ gemeint. ”
136
III.
Der Satz von Hahn-Banach und seine Konsequenzen
R¨ aumen Bestand hat. In der Literatur waren verschiedene Beispiele von Lipschitz-stetigen Funktionalen f : 2 → R angegeben worden, die angeblich nirgends Fr´echet-differenzierbar waren; leider waren all diese Beispiele inkorrekt. So blieb das Problem offen, bis Preiss zeigen konnte (J. Funct. Anal. 91 (1990) 312–345): • Ist X ein Asplundraum (z.B. reflexiv), so ist jedes Lipschitz-stetige Funktional f : X → R auf einer dichten Teilmenge Fr´echet-differenzierbar. Detaillierte Informationen zu diesem Themenkreis findet man bei Deville/Godefroy/Zizler [1993], Habala/H´ ajek/Zizler [1996] und Phelps [1993]. Das vor Satz III.5.6 beschriebene Beispiel eines Minimumproblems ohne L¨ osung wurde 1870 von Weierstraß zur Kritik des Dirichletschen Prinzips konstruiert. Das ist die von Riemann benutzte Methode, das Dirichletproanktes Gebiet) blem (Ω ⊂ Rn ein beschr¨ −Δu = h in Ω,
u = 0 auf ∂Ω
(III.14)
zul¨ osen, indem man ankte) Dirichletintegral J(u) = das (nach unten beschr¨ 1 2 grad u dx− u(x)h(x) dx unter allen C 2 -Funktionen, die die Rand2 Ω Ω bedingung erf¨ ullen, minimiert. Riemann war ohne weitere Begr¨ undung von der Existenz des Minimums ausgegangen; seine Schlußweise war nun durch Weierstraß’ Beispiel ins Wanken geraten. Das Dirichletsche Prinzip wurde erst nach 1900 von Hilbert in zwei Arbeiten (Math. Ann. 59 (1904) 161– 186, J. Reine Angew. Math. 129 (1905) 63–67) rehabilitiert, in denen er die direkte Methode der Variationsrechnung entwickelt; er schreibt (a.a.O., S. 65): Eine jede regul¨ are Aufgabe der Variationsrechnung besitzt eine L¨ osung, sobald hinsichtlich der Natur der gegebenen Grenzbedingungen geeignete einschr¨ ankende Annahmen erf¨ ullt sind und n¨ otigenfalls der Begriff der L¨ osung eine sinngem¨ aße Erweiterung erf¨ ahrt.
Die moderne Fassung des Dirichletschen Prinzips fußt auf der Theorie der Hilbert- und insbesondere der Sobolevr¨ aume; siehe Kapitel V und speziell Aufgabe V.6.20. Damit werden in (III.14) die einschr¨ankenden Annahmen ” hinsichtlich der Grenzbedingungen“ durch die Zugeh¨origkeit von u zu einem Sobolevraum formuliert, und der erweiterte L¨osungsbegriff“ ist der der ” schwachen L¨ osung, vgl. S. 228f. Zum Umfeld des Dirichletschen Prinzips ist Monna [1975] lesenswert.
Kapitel IV
Die Haupts¨atze fu ¨r Operatoren auf Banachr¨aumen
IV.1
Vorbereitung: Der Bairesche Kategoriensatz
Die Resultate u aumen, die in diesem Kapitel ¨ ber Operatoren auf Banachr¨ vorgestellt werden, beruhen auf einem Prinzip u ¨ ber vollst¨andige metrische R¨ aume, das 1899 von R. Baire (im Fall des Rn ) entdeckt wurde. Dieses Bairesche Kategorienprinzip wird nun als erstes vorgestellt. Es ist leicht zu sehen, daß in jedem metrischen Raum der Schnitt zweier offener und dichter Mengen dicht ist. Baire zeigte, daß f¨ ur Rn mehr gilt. Satz IV.1.1 (Satz von Baire) Sei (T, d) ein vollst¨andiger metrischer Raum und (On )n∈N eine Folge offener und dichter Teilmengen. Dann ist n∈N On dicht. Beweis. Setze D = n∈N On . Es ist zu zeigen, daß jede offene ε-Kugel in T ein Element von D enth¨ alt. Sei Uε (x0 ) = {x ∈ T : d(x, x0 ) < ε} eine solche Kugel. Da O1 offen und dicht ist, ist O1 ∩ Uε (x0 ) offen und nicht leer. Es existieren also x1 ∈ O1 , ε1 > 0 (o.E. ε1 < 12 ε) mit Uε1 (x1 ) ⊂ O1 ∩ Uε (x0 ). Nach eventueller weiterer Verkleinerung von ε1 erh¨alt man sogar Uε1 (x1 ) ⊂ O1 ∩ Uε (x0 ). Betrachte nun O2 . Auch O2 ist offen und dicht, daher ist O2 ∩ Uε1 (x1 ) offen und nicht leer. Wie oben existieren x2 ∈ O2 , ε2 < 12 ε1 mit Uε2 (x2 ) ⊂ O2 ∩ Uε1 (x1 ) ⊂ O1 ∩ O2 ∩ Uε (x0 ).
138
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Auf diese Weise werden induktiv Folgen (εn ) und (xn ) mit folgenden Eigenschaften definiert: (a) εn < 12 εn−1 , folglich εn < 2−n ε. (b) Uεn (xn ) ⊂ On ∩ Uεn−1 (xn−1 ) ⊂ · · · ⊂ O1 ∩ . . . ∩ On ∩ Uε (x0 ). Es folgt insbesondere xn ∈ UεN (xN ) ⊂ U2−N ε (xN )
∀n > N,
(IV.1)
andig ist, existiert der Grenzwert d.h., (xn ) ist eine Cauchyfolge. Da T vollst¨ x := limn→∞ xn . Eine unmittelbare Konsequenz von (IV.1) ist dann x ∈ UεN (xN )
∀N ∈ N.
Mit Hilfe von (b) ergibt sich daraus x ∈ D ∩ Uε (x0 ).
2
Daß die vorausgesetzte Vollst¨ andigkeit wesentlich f¨ ur die G¨ ultigkeit von Satz IV.1.1 ist, sieht man an folgendem Beispiel. Betrachte eine Aufz¨ahlung .} von Q und die in Q offenen und dichten Mengen On = Q\{xn }. {x1 , x2 , . . Dann ist n∈N On = ∅. Bemerke, daß nicht die Offenheit von n∈N On in Satz IV.1.1 behauptet wurde, die i.a. auch gar nicht gilt. (Beispiel?) Nennt man einen abz¨ahlbaren Schnitt von offenen Mengen eine Gδ -Menge (wobei G an Gebiet“ und δ ” an Durchschnitt“ erinnern soll), so l¨ aßt sich Satz IV.1.1 so formulieren: ” • In einem vollst¨andigen metrischen Raum ist der abz¨ahlbare Schnitt von dichten Gδ -Mengen eine dichte Gδ -Menge. H¨ aufig ist eine weitere Umformulierung von Nutzen. Dazu wird folgende Terminologie ben¨ otigt; sie stammt von Baire und ist leider etwas unanschaulich, hat sich aber in der Literatur fest eingeb¨ urgert. Definition IV.1.2 (a) Eine Teilmenge M eines metrischen Raums heißt nirgends dicht, wenn M keinen inneren Punkt besitzt. (b) M heißt von 1. Kategorie, wenn es eine Folge (Mn ) nirgends dichter Mengen mit M = n∈N Mn gibt. (c) M heißt von 2. Kategorie, wenn M nicht von 1. Kategorie ist. Nirgends dichte Mengen liegen in der Tat in keiner offenen Menge ( nir” gends“) dicht. Einfaches Beispiel: Q ist von1. Kategorie in R. Durch Komplementbildung, n¨ amlich ( n Mn ) = n Mn ⊃ n Mn , erh¨ alt man aus Satz IV.1.1: Korollar IV.1.3 (Bairescher Kategoriensatz) In einem vollst¨andigen metrischen Raum liegt das Komplement einer Menge 1. Kategorie dicht.
IV.1
139
Vorbereitung: Der Bairesche Kategoriensatz
H¨ aufig wird nur folgende schw¨ achere Form ben¨otigt. Korollar IV.1.4 Ein nicht leerer vollst¨andiger metrischer Raum ist von 2. Kategorie in sich. Der Bairesche Kategoriensatz gestattet h¨aufig relativ einfache (aber nichtkonstruktive) Beweise f¨ ur Existenzaussagen. Das geschieht nach folgendem Muster: Gesucht ist ein Objekt mit einer gewissen Eigenschaft (E). Zeige dann, daß die Gesamtheit der zu untersuchenden Objekte einen vollst¨ andigen metrischen Raum bildet, worin die Objekte ohne Eigenschaft (E) eine Teilmenge 1. Kategorie formen. Folglich gibt es Objekte mit Eigenschaft (E), und diese liegen sogar dicht! Der Beweis des n¨ achsten Satzes veranschaulicht diese Methode. Satz IV.1.5 Es gibt stetige Funktionen auf [0, 1], die an keiner Stelle differenzierbar sind. Beweis. Zu n ∈ N setze On =
x(t + h) − x(t) >n x ∈ C[0, 1]: sup h 0 0 mit x(t + h) − x(t) > n + δt . sup h 0 n + δt . ht Da x stetig ist, gilt noch f¨ ur s ∈ Ut , einer hinreichend kleinen Umgebung von t, x(s + ht ) − x(s) > n + δt . ht ¨ Uberdecke nun das kompakte Intervall [0, 1] durch endlich viele Ut1 , . . . , Utr ; setze noch δ = min{δt1 , . . . , δtr }, h = min{|ht1 |, . . . , |htr |}. Es folgt f¨ ur s ∈ Uti x(s + hti ) − x(s) > n + δ. ht i
140
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Seien nun 0 < ε < 12 hδ und y − x ∞ < ε. Wir werden y ∈ On zeigen. Sei dazu t ∈ [0, 1], etwa t ∈ Uti . Dann ist y(t + hti ) − y(t) ≥ x(t + hti ) − x(t) − 2 x − y ∞ hti hti |hti | ε > n+δ−2 h > n. Daher ist On offen. Es bleibt zu zeigen, daß On dicht ist. Sei dazu O = ∅ eine offene Menge. Nach dem Weierstraßschen Approximationssatz (Satz I.2.10) existieren ein Polynom p und ε > 0 mit x − p ∞ ≤ ε
⇒
x ∈ O.
Sei ym eine S¨ agezahnfunktion, die [0, 1] auf [0, ε] abbildet und deren auf(bzw. ab-)steigende Zacken die Steigung +m bzw. −m aufweisen.
ε
1 ur m > n + p ∞ erh¨alt man jedoch Dann ist stets xm := p + ym ∈ O. F¨ f¨ ur alle t ∈ [0, 1], 0 < |h| ≤ 1/n xm (t + h) − xm (t) ym (t + h) − ym (t) p(t + h) − p(t) ≥ − , h h h wo der letzte Term wegen des Mittelwertsatzes ≤ p ∞ ausf¨allt. Daher gilt xm (t + h) − xm (t) ≥ m − p ∞ > n, sup h 0 0 mit x − y ≤ ε
⇒
x ∈ EN .
Da EN symmetrisch ist (d.h., z ∈ EN ⇔ −z ∈ EN ), hat −y dieselbe Eigenschaft; es folgt nun aus der Konvexit¨ at von EN die Implikation u ≤ ε
⇒
u=
1 1 (u + y) + (u − y) ∈ (EN + EN ) ⊂ EN . 2 2
ur alle i ∈ I; also folgt Das heißt: Wenn u ≤ ε ist, dann gilt Ti u ≤ N f¨ sup Ti ≤ i∈I
N < ∞. ε
2
Beachte, daß der Beweis keinen Aufschluß u ¨ber die Gr¨oße von supi Ti gibt, nur die Endlichkeit dieser Zahl wird bewiesen. Daß die Vollst¨ andigkeit von X wesentlich f¨ ur die G¨ ultigkeit von Theorem IV.2.1 ist, sieht man an folgendem Beispiel. Betrachte den normierten Raum (d, . ∞ ) und Tn : d → K, (sm )m∈N → nsn . Da nur endlich viele ullt (Tn ) die Voraussetzungen des Satzes von sm von 0 verschieden sind, erf¨ Banach-Steinhaus; aber es ist Tn = n. Korollar IV.2.2 F¨ ur eine Teilmenge M eines normierten Raums X sind ¨aquivalent: (i) M ist beschr¨ankt. (ii) F¨ ur alle x ∈ X ist x (M ) ⊂ K beschr¨ankt.
142
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Beweis. (i) ⇒ (ii): Klar! ur x ∈ M , die auf dem (ii) ⇒ (i): Betrachte die Funktionale iX (x) f¨ Banachraum X definiert sind. Nach Voraussetzung gilt sup |x (x)| = sup |iX (x)(x )| < ∞ x∈M
∀x ∈ X .
x∈M
Theorem IV.2.1 liefert nun sup x = sup iX (x) < ∞. x∈M
2
x∈M
Insbesondere gilt: Korollar IV.2.3 Schwach konvergente Folgen sind beschr¨ankt.
Beweis. Konvergiert (xn ) schwach, so ist f¨ ur x ∈ X die Folge x (xn ) beschr¨ ankt, da konvergent. 2 F¨ ur die duale Version von Korollar IV.2.2 muß die Vollst¨andigkeit gefordert werden. Korollar IV.2.4 Sei X ein Banachraum und M ⊂ X . Dann sind folgende Aussagen ¨aquivalent: (i) M ist beschr¨ankt. (ii) F¨ ur alle x ∈ X ist {x (x): x ∈ M } beschr¨ankt. Beweis. (i) ⇒ (ii) ist klar, und die Umkehrung ein Spezialfall von Theorem IV.2.1. 2 Wir behandeln nun die punktweise Konvergenz von Operatorfolgen. Bekanntlich reicht die punktweise Konvergenz einer Folge stetiger Funktionen nicht aus, um die Stetigkeit der Grenzfunktion zu garantieren. Deshalb ist das folgende Resultat bemerkenswert. Korollar IV.2.5 Sei X ein Banachraum und Y ein normierter Raum, ferur n ∈ N. F¨ ur x ∈ X existiere T x := limn→∞ Tn x. ner seien Tn ∈ L(X, Y ) f¨ Dann ist T ∈ L(X, Y ). Beweis. Die Linearit¨ at von T ist klar, siehe den Beweis von Satz II.1.4(b). ur alle x ∈ X konvergiert, ist stets Nun zur Stetigkeit von T . Da (Tn x) f¨ supn Tn x < ∞. Der Satz von Banach-Steinhaus liefert supn Tn =: M < ∞. Es folgt 2 T x = lim Tn x ≤ M x . n→∞
In bestimmten F¨ allen folgt die punktweise Konvergenz einer Operatorfolge aus relativ schwachen Voraussetzungen. Der n¨achste Satz behandelt Operatoren auf dem reellen Banachraum C[0, 1], die positive Funktionen auf positive Funktionen abbilden, und zeigt die punktweise Konvergenz Tn → Id, falls sie nur an drei Stellen vorliegt.
IV.2
143
Das Prinzip der gleichm¨ aßigen Beschr¨ anktheit
Satz IV.2.6 (Erster Korovkinscher Satz) Sei Tn ∈ L(C[0, 1]), und Tn sei positiv (d.h., Tn x ≥ 0 f¨ ur x ≥ 0). Setze xi (t) = ti , i = 0, 1, 2. Gilt dann Tn xi → xi f¨ ur i = 0, 1, 2, so gilt Tn x → x f¨ ur alle x ∈ C[0, 1]. Beweis. Sei x ∈ C[0, 1] beliebig. Da x gleichm¨aßig stetig ist, existiert zu ε > 0 ein δ > 0 mit √ |s − t| ≤ δ ⇒ |x(s) − x(t)| ≤ ε. (IV.2) Daraus ergibt sich mit α = 2 x ∞ /δ die Ungleichung |x(s) − x(t)| ≤ ε + α(t − s)2 ∀s, t ∈ [0, 1]; √ denn falls |t − s| ≤ δ, folgt das aus (IV.2), und sonst ist
(IV.3)
ε + α(t − s)2 > ε + 2 x ∞ > |x(s)| + |x(t)| ≥ |x(s) − x(t)|. Setze yt (s) = (t − s)2 . Dann kann (IV.3) in der Form −ε − αyt ≤ x − x(t) ≤ ε + αyt
∀t ∈ [0, 1]
geschrieben werden; die Positivit¨ at von Tn liefert dann −εTn x0 − αTn yt ≤ Tn x − x(t)Tn x0 ≤ εTn x0 + αTn yt
∀t ∈ [0, 1],
d.h., f¨ ur alle t ∈ [0, 1] gilt |Tn x − x(t)Tn x0 | ≤ εTn x0 + αTn yt ; insbesondere |(Tn x)(t) − x(t)(Tn x0 )(t)| ≤ ε(Tn x0 )(t) + α(Tn yt )(t)
∀t ∈ [0, 1].
Wegen yt ∈ lin{x0 , x1 , x2 } konvergiert die rechte Seite gegen εx0 (t) + αyt (t) = ε, und zwar gleichm¨ aßig in t, denn Tn yt − yt = (Tn x2 − x2 ) − 2t(Tn x1 − x1 ) + t2 (Tn x0 − x0 ). Eine weitere Anwendung der Voraussetzung Tn x0 → x0 liefert daher, daß Tn x − x ≤ 2ε f¨ ur hinreichend große n, und es folgt Tn x → x. 2 Der Approximationssatz von Weierstraß folgt offenbar aus dem Satz von Korovkin, wenn man Tn x = n-tes Bernsteinpolynom von x setzt (vgl. die Rechnung auf S. 30). Andererseits ist der Beweis des Weierstraßschen Satzes im Text nichts anderes als eine Kopie des obigen Beweises. Wir ben¨ otigen noch die trigonometrische Version des Satzes von Korovkin. Betrachte den reellen Banachraum (unter . ∞ ) der 2π-periodischen stetigen Funktionen auf R. Dieser kann mit C2π = {x ∈ C[−π, π]: x(−π) = x(π)} identifiziert werden.
144
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Satz IV.2.7 (Zweiter Korovkinscher Satz) F¨ ur n ∈ N sei Tn ∈ L(C2π ), und Tn sei positiv. Setze x0 (t) = 1, x1 (t) = cos t, x2 (t) = sin t. Gilt Tn xi → xi f¨ ur i = 0, 1, 2, so folgt Tn x → x f¨ ur alle x ∈ C2π . Beweis. Der Beweis verl¨ auft analog zum vorherigen, wenn man von der Hilfsfunktion yt (s) = sin2 t−s 2 ausgeht und zu x ∈ C2π und ε > 0 ein δ > 0 mit ⇒ |x(s) − x(t)| ≤ ε yt (s) ≤ δ w¨ ahlt; bemerke, daß wegen yt (s) =
1 (1 − cos s cos t − sin s sin t) 2
wieder yt ∈ lin{x0 , x1 , x2 } gilt.
2
Wir werden den zweiten Satz von Korovkin zum Beweis von Satz IV.2.11 benutzen. Zum Schluß dieses Abschnitts folgen noch einige Anwendungen. Zu1 ur eine n¨ achst geht es um Quadraturformeln. Um das Integral 0 x(t) dt f¨ stetige Funktion x angen¨ ahert zu berechnen, bedient man sich h¨aufig N¨aherungsformeln der Gestalt Qn (x) =
n
(n)
(n)
αi x(ti )
i=0
1 und fragt nach der Konvergenz Qn (x) → 0 x(t) dt f¨ ur x ∈ C[0, 1]. In der Regel kann man f¨ ur gen¨ ugend oft differenzierbare x diese Konvergenz beweisen (z.B. Sehnentrapezregel f¨ ur x ∈ C 2 , Simpsonregel f¨ ur x ∈ C 4 ). Allgemein gilt der folgende Satz, dessen funktionalanalytisch interessantester Aspekt die Notwendigkeit von (ii) ist. Satz IV.2.8 (Satz von Szeg˝ o) Sei Qn wie oben. Dann sind ¨aquivalent: 1 (i) Qn (x) → 0 x(t) dt f¨ ur alle x ∈ C[0, 1]. n 1 (n) ur alle Polynome und sup |αi | < ∞. (ii) Qn (x) → 0 x(t) dt f¨ n i=0
Beweis. Der Schl¨ ussel zum Verst¨ andnis des Satzes von Szeg˝ o liegt in der Gleichheit n (n) Qn = |αi |, i=0
wo wir Qn ∈ (C[0, 1]) aufgefaßt haben. (i) ⇒ (ii) folgt dann aus dem Satz von Banach-Steinhaus und die umgekehrte Implikation aus dem Satz
IV.2
Das Prinzip der gleichm¨ aßigen Beschr¨ anktheit
145
von Weierstraß mit Hilfe eines einfachen Approximationsarguments (vgl. Aufgabe III.6.17 f¨ ur einen ¨ ahnlichen Schluß). 2 F¨ ur die Trapezregel gilt beispielsweise 1 x(t0 ) + x(tn ) + x(t1 ) + . . . + x(tn−1 ) Qn (x) = n 2 1 mit ti = ni , also Qn = 1. Da Qn (x) → 0 x(t) dt f¨ ur x ∈ C 2 gilt, also insbesondere f¨ ur Polynome, gilt nach (der einfachen H¨alfte von) Satz IV.2.8 die Konvergenz f¨ ur alle stetigen Funktionen auf [0, 1]. Satz IV.2.8 gibt allerdings keinen Aufschluß u ¨ ber eine Fehlerabsch¨atzung. Abschließend diskutieren wir die Konvergenz von Fourierentwicklungen. Sei x: R → R eine 2π-periodische und u ¨ ber [−π, π] integrierbare Funktion. Die Fourierreihe von x ist dann die (formale) Reihe ∞
a0 + (ak cos kt + bk sin kt) 2
(IV.4)
k=1
mit 1 π x(t) cos kt dt π −π 1 π = x(t) sin kt dt π −π
ak =
(k = 0, 1, 2, . . .),
bk
(k = 1, 2, . . .).
Die ak und bk heißen die Fourierkoeffizienten von x. Die Fourierreihe (IV.4) ist insofern zun¨ achst eine formale Reihe, als noch nichts u ¨ ber ihre Konvergenz ausgesagt ist, geschweige denn, daß sie gegen x(t) konvergiert. (Vergleiche mit dem Vorgehen bei Taylorreihen!) Wenn aber eine Reihe der Form (IV.4) gleichm¨aßig gegen x konvergiert, folgt durch Multiplikation mit cos k0 t bzw. sin k0 t und gliedweise Integration, daß die Koeffizienten ak und bk notwendig die angegebene Form haben. Das Konvergenzproblem von Fourierreihen werden wir mit Hilfe der S¨ atze von Banach-Steinhaus und Korovkin n¨aher analysieren. Als erstes bringen wir eine hinreichende Bedingung f¨ ur die gleichm¨aßige Konvergenz. Dazu ben¨ otigen wir eine Integraldarstellung der n-ten Partialsumme a0 + (ak cos kt + bk sin kt) 2 n
sn (x, t) =
k=1
mit ak und bk wie oben. Funktionalanalytische Methoden kommen dann durch die Untersuchung der Funktionale x → sn (x, t) (t fest) ins Spiel.
146
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Durch Einsetzen der Integrale f¨ ur ak und bk erh¨alt man n 1 π 1 sn (x, t) = + x(s) (cos ks cos kt + sin ks sin kt) ds π −π 2 k=1 n 1 π 1 = + x(s) cos k(s − t) ds π −π 2 k=1 n 1 π 1 = x(s + t) cos ks ds + π −π 2 k=1 sin(n + 12 )s 1 π = x(s + t) ds, π −π 2 sin 2s wo nacheinander die Definition der ak und bk , die Additionstheoreme der trigonometrischen Funktionen sowie die 2π-Periodizit¨at von x ausgenutzt wurden. Die letzte Gleichheit sieht man, indem man ins Komplexe geht und die Formeln eit = cos t + i sin t, eit − e−it = 2i sin t sowie die Summenformel f¨ ur die (endliche) geometrische Reihe verwendet: n n 1 1 + cos ks = cos ks 2 2 k=1
=
1 2
k=−n n
eiks
k=−n
1 −ins e(2n+1)is − 1 e 2 eis − 1 1 1 1 e(n+ 2 )is − e−(n+ 2 )is = 1 1 2 e 2 is − e− 2 is 1 sin(n + 12 )s = . 2 sin 2s =
Man nennt die hier auftauchende Funktion Dn (s) :=
1 sin(n + 12 )s , 2 sin 2s
die man durch Dn (0) = n + 12 an der Stelle s = 0 stetig erg¨anzt, den n-ten Dirichletkern. Die obige Darstellung f¨ ur sn l¨aßt sich also kurz als 1 π sn (x, t) = x(s + t)Dn (s) ds π −π schreiben.
IV.2
147
Das Prinzip der gleichm¨ aßigen Beschr¨ anktheit
Satz IV.2.9 Ist x: R → R 2π-periodisch und stetig differenzierbar, so konvergiert die Fourierreihe von x gleichm¨aßig gegen x. Beweis. Da f¨ ur x = 1 alle Partialsummen = 1 sind, folgt aus der obigen Darstellung 1 π 1= Dn (s) ds. π −π Damit ist f¨ ur alle x und alle 0 ≤ h ≤ π π 1 |sn (x, t) − x(t)| = x(s + t) − x(t) Dn (s) ds π −π h π 1 −h ≤ (. . .) + (. . .) + (. . .) . π −π −h h Sei ε > 0 gegeben. W¨ ahle h < π mit 0 < h ≤ ε/(π x ∞ ). Dann ist nach dem Mittelwertsatz h h |x(s + t) − x(t)| (. . .) ≤ |sin(n + 12 )s| ds −h 2 sin |s| −h 2 h x ∞ |s| ds ≤ |s| −h 2 sin 2 π ≤ 2h x ∞ , 2 denn sin u ≥
2 πu
f¨ ur alle 0 ≤ u ≤ π2 . Folglich gilt h ∀t. (. . .) ≤ ε −h
Betrachten wir nun
π h
(. . .). Wir setzen
ft (s) =
x(s + t) − x(t) , 2 sin 2s
m=n+
1 2
und bemerken, daß ft ∈ C 1 [h, π] mit supt∈R ft ∞ < ∞, supt∈R ft ∞ < ∞. Durch partielle Integration folgt s=π π π −1 −1 c cos ms cos ms ds ≤ , ft (s) sin ms ds = ft (s) − ft (s) m m m h h s=h wo die Konstante c von t unabh¨ angig ist. Also existiert n0 (ε) mit π c (. . .) ≤ 0 ∃ε > 0 (iii)
∃ε > 0
Vε ⊂ T (Ur ).
Vε ⊂ T (U1 ).
Beweis. (i) ⇒ (ii) folgt aus 0 ∈ T (Ur ) und der vorausgesetzten Offenheit dieser Menge. (ii) ⇒ (i): Sei O ⊂ X offen und x ∈ O, also T x ∈ T (O). Da O offen ist, existiert r > 0 mit x + Ur ⊂ O, folglich T x + T (Ur ) ⊂ T (O). Mit (ii) folgt T x + Vε ⊂ T (O). Da x beliebig war, muß T (O) offen sein. (ii) ⇔ (iii): Das ist klar. 2 Beispiele. (a) Jede Quotientenabbildung (Definition II.1.7) ist offen. (b) Die Abbildung T : ∞ → c0 , (tn ) → ( n1 tn ), ist nicht offen, denn T (U1 ) = {(tn ) ∈ c0 : |tn | < n1 ∀n ∈ N}, und diese Menge ist keine Nullumgebung. Offensichtlich ist eine offene lineare Abbildung surjektiv. Der folgende Satz von Banach, der bei vollst¨ andigen R¨ aumen die Umkehrung garantiert, ist einer der wichtigsten S¨ atze der Funktionalanalysis, wie aus seinen zahlreichen Korollaren deutlich werden wird.
152
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Theorem IV.3.3 (Satz von der offenen Abbildung) Seien X und Y Banachr¨aume und T ∈ L(X, Y ) surjektiv. Dann ist T offen. Beweis. Wir zeigen (iii) aus Lemma IV.3.2. Der Beweis hierf¨ ur zerf¨allt in zwei Teile. 1. Teil. Zun¨achst wird mit Hilfe der Vollst¨andigkeit von Y gezeigt: ∃ε0 > 0
Vε0 ⊂ T (U1 )
(IV.7)
(Die Bezeichnungen sind wie in Lemma IV.3.2.) Zum Beweis schreiben wir Y = n∈N T (Un ); dies ist m¨ oglich, da T surjektiv ist. Nach dem Baireschen Kategoriensatz (Satz IV.1.3 bzw. IV.1.4) existiert N ∈ N mit int T (UN ) = ∅. Es existieren also y0 ∈ T (UN ) und ε > 0 mit z − y0 < ε
⇒ z ∈ T (UN ).
Nun ist T (UN ) symmetrisch, d.h., diese Menge enth¨alt mit z auch −z, denn T (UN ) ist symmetrisch und daher auch der Abschluß. Deshalb hat −y0 dieselbe Eigenschaft. Sei nun y < ε. Dann gilt (y0 + y) − y0 < ε, also y0 + y ∈ T (UN ). Analog zeigt man −y0 + y ∈ T (UN ). Daraus folgt y=
1 1 (y0 + y) + (−y0 + y) ∈ T (UN ), 2 2
denn T (UN ) ist als Abschluß einer konvexen Menge konvex. Es ist damit Vε ⊂ T (UN ) gezeigt, woraus Vε/N ⊂ T (U1 ) folgt. 2. Teil. Sei ε0 wie in (IV.7). Mit Hilfe der Vollst¨andigkeit von X werden wir nun sogar (IV.8) Vε0 ⊂ T (U1 ) schließen, woraus wegen Lemma IV.3.2 die Offenheit von T folgt. Zum Beweis sei y < ε0 . W¨ ahle ε > 0 mit y < ε < ε0 und betrachte y := εε0 y. Dann ist y < ε0 , und nach (IV.7) gilt y ∈ T (U1 ). Es existiert also y0 = T x0 ∈ T (U1 ) mit y − y0 < αε0 , wobei wir 0 < α < 1 so klein gew¨ ahlt haben, daß ε 1 0, t = 0 oder t < 0. Dann konvergiert (xn ) gleichm¨ aßig gegen x, also erst recht in L2 [−1, 1], und (T xn ) konvergiert aßig), jedoch x ∈ / D. gegen y in L2 [−1, 1] (aber nicht gleichm¨ (c) Daß T in Beispiel (b) nicht abgeschlossen ist, liegt weniger an dem Operator als an seinem Definitionsbereich. Betrachten wir statt D = C 1 den Definitionsbereich D0 := {x ∈ L2 [−1, 1]: x ist absolutstetig und x˙ ∈ L2 [−1, 1]}. Zur Definition der Absolutstetigkeit sei auf Definition A.1.9 verwiesen. Nach dem Hauptsatz der Differential- und Integralrechnung in der Lebesgueversion, Satz A.1.10, existiert f¨ ur absolutstetige Funktionen x die Ableitung x˙ fast u ¨ berall und kann als Element von L1 [−1, 1] aufgefaßt werden. Wir werden zeigen, daß T : X ⊃ D0 → Y abgeschlossen ist. Seien dazu xn ∈ D0 , x, y ∈ L2 [−1, 1] mit xn → x und x˙ n → y in L2 [−1, 1]. F¨ ur alle t ∈ [−1, 1] gilt (vgl. Satz A.1.10) t x˙ n (s) ds. xn (t) = xn (−1) + −1
Daraus werden wir schließen, daß (xn ) gleichm¨aßig konvergiert. F¨ ur t ∈ [−1, 1] ist n¨ amlich (der dritte Schritt benutzt die H¨oldersche Ungleichung) t t t ≤ x ˙ (s) ds − y(s) ds |x˙ n (s) − y(s)| ds n −1
−1
−1 1
≤
−1
≤
|x˙ n (s) − y(s)| ds 1
|x˙ n (s) − y(s)| ds
12
−1
12
1
2
2
1 ds −1
156
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
√ = 2 T xn − y L2 → 0. Also gilt
t
−1
x˙ n (s) ds →
t
y(s) ds −1
gleichm¨ aßig in t. Außerdem ist xn (−1) − xm (−1) = xn (t) − xm (t) +
t
−1
x˙ m (s) − x˙ n (s) ds,
also (einsetzen und Dreiecksungleichung f¨ ur . L2 ) 1 |xn (−1) − xm (−1)| = √ 2 1 ≤ √ 2
1
|xn (−1) − xm (−1)| dt 2
−1
1
|xn (t) − xm (t)| dt 2
−1
1
+ −1
t
−1
12
12
12 2 , x˙ n (s) − x˙ m (s) ds dt
t so daß xn (−1) eine Cauchyfolge ist; denn die Folge −1 x˙ n (s) ds ist nach dem ersten Teil eine Cauchyfolge, und zwar gleichm¨ t aßig in t. Setze α = limn→∞ xn (−1) sowie z(t) = α + −1 y(s) ds. Die Funktion z ist absolutstetig als Integralfunktion einer L1 -Funktion, und es gilt z(t) ˙ = y(t) fast u ¨ berall, vgl. Satz A.1.10. Also gilt z ∈ D0 sowie T z = y. Da jedoch aßig und xn → x in L2 [−1, 1], ist x(t) = z(t) fast u xn → z gleichm¨ ¨berall, ¨ also x = z als Aquivalenzklassen in L2 [−1, 1]. Deshalb ist T abgeschlossen. Den Zusammenhang zwischen stetigen und abgeschlossenen Operatoren stellt das folgende Lemma her. Die dort auftauchende Norm wird auch Graphennorm genannt. Lemma IV.4.3 Seien X und Y Banachr¨aume, D ⊂ X ein Untervektorraum und T : X ⊃ D → Y abgeschlossen. Dann gilt: (a) D, versehen mit der Norm |||x||| = x + T x , ist ein Banachraum. (b) T ist als Abbildung von (D, ||| . |||) nach Y stetig. Beweis. (a) Ist (xn ) ⊂ D eine ||| . |||-Cauchyfolge, so sind (xn ) und (T xn ) jeweils . -Cauchyfolgen, und die Limiten x = lim xn und y = lim T xn existieren. Da T abgeschlossen ist, gilt x ∈ D und y = T x. Daraus folgt |||xn − x||| → 0. Also ist (D, ||| . |||) vollst¨ andig.
IV.4
Der Satz vom abgeschlossenen Graphen
(b) Das ist klar, da T x ≤ x + T x = |||x||| f¨ ur alle x ∈ D.
157 2
Der folgende Satz ist das Analogon zum Satz von der offenen Abbildung f¨ ur abgeschlossene Operatoren. Er zeigt insbesondere die Stetigkeit des inversen Operators eines abgeschlossenen Operators zwischen Banachr¨ aumen. Satz IV.4.4 Seien X und Y Banachr¨aume, D ⊂ X ein Untervektorraum und T : X ⊃ D → Y abgeschlossen und surjektiv. Dann ist T offen. Ist T zus¨atzlich injektiv, so ist T −1 stetig. Beweis. Nach Lemma IV.4.3 und Theorem IV.3.3 ist T : (D, ||| . |||) → Y offen. Wegen x ≤ |||x||| f¨ ur alle x ∈ D ist jede . -offene Teilmenge von D auch ||| . |||-offen. Also ist T offen bez¨ uglich der Originalnormen, und T −1 ist stetig bez¨ uglich der Originalnormen. 2 Nun beweisen wir den Hauptsatz dieses Abschnitts. Theorem IV.4.5 (Satz vom abgeschlossenen Graphen) Es seien X und Y Banachr¨aume, und T : X → Y sei linear und abgeschlossen. Dann ist T stetig. Beweis. Nach Lemma IV.4.3 ist T stetig bez¨ uglich der Graphennorm ||| . ||| auf X. Nach Korollar IV.3.5 sind . und ||| . ||| ¨aquivalent, denn . ≤ ||| . |||, und beide erzeugen Banachr¨ aume (nach Voraussetzung bzw. Lemma IV.4.3). Also ist T stetig bez¨ uglich der Originalnorm. 2 Kurz formuliert besagt der Satz vom abgeschlossenen Graphen, daß ein auf einem ganzen Banachraum definierter abgeschlossener Operator automatisch stetig ist. Dieser Satz und Korollar IV.2.5 illustrieren, warum es praktisch unm¨ oglich ist, einen unstetigen linearen Operator auf einem Banachraum explizit anzugeben. Als Anwendung soll nun ein Satz von Toeplitz u ¨ ber Summierbarkeitsmethoden gezeigt werden. Gegeben sei eine unendliche Matrix (aij )i∈N,j∈N . Einer Folge (si )i∈N kann dann eine Folge (σi )i∈N gem¨aß σi =
∞
aij sj
(IV.9)
j=1
zugeordnet werden, vorausgesetzt, die Reihen in (IV.9) konvergieren. Das bekannteste Beispiel ist die Ces`aro-Methode, wo aij = 1i f¨ ur j ≤ i und aij = 0 f¨ ur j > i. (Diese Summierbarkeitsmethode ist uns im Satz IV.2.11 bereits begegnet.) Toeplitz zeigte 1911 folgenden Satz, f¨ ur den Banach sp¨ater einen funktionalanalytischen Beweis gab.
158
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Satz IV.4.6 Daf¨ ur, daß mittels (aij ) konvergente Folgen (si ) auf zum selben Limes konvergente Folgen (σi ) abgebildet werden, sind folgende Bedingungen notwendig und hinreichend: ur alle j, (a) limi→∞ ∞aij = 0 f¨ (b) supi j=1 |aij | < ∞, ∞ (c) limi→∞ j=1 aij = 1. Beweis. Wir schreiben Ax = (σi ) f¨ ur eine Folge x = (si ). Zuerst wird gezeigt, daß (a), (b) und (c) zusammen hinreichend sind. Aus (b) folgt n¨amlich unmittelbar, daß A eine stetige lineare Abbildung von ∞ in sich definiert. Ferner zeigen (a) und (b), daß A Nullfolgen auf ¨ Nullfolgen abbildet (f¨ ur die Ces`aro-Methode ist das eine klassische Ubungsaufgabe der Analysis), und (c) liefert die Konvergenz von A1 gegen 1, wo 1 = (1, 1, 1, . . .). Daraus ergibt sich die Hinl¨ anglichkeit. Als n¨ achstes wird die Notwendigkeit von (a) und (c) bewiesen. Das ist ur alle j ∈ N ist (ej = jklar, da (a) a ¨quivalent dazu ist, daß Aej ∈ c0 f¨ ter Einheitsvektor), und da (c) a quivalent zu A1 ∈ c mit lim A1 = 1 ist. ¨ Kommen wir nun zur Notwendigkeit von (b), die der interessanteste Aspekt dieses Satzes ist. Nach Voraussetzung kann A als lineare Abbildung von c0 nach c0 aufgefaßt werden. Wegen der Isometrie c0 ∼ = 1 ist (b) zur Stetigkeit von A ¨ aquivalent; diese ist also zu zeigen. Nach Theorem IV.4.5 gen¨ ugt es, die Abgeschlossenheit von A zu zeigen, die ihrerseits folgt, sobald die Implikation ⇒ y=0 xn → 0, Axn → y bewiesen ist. Zum Beweis ur sei i fixiert. F¨ ur alle Nullfolgen x = (sj ) ∞ hierf¨ konvergiert die Reihe j=1 aij sj =: (x) nach Voraussetzung. Das lineare → K ist punktweiser Limes der stetigen linearen FunkFunktional : c0 n tionale n (x) := j=1 aij sj , also selbst stetig (Korollar IV.2.5). Es folgt ∞ (aij )j∈N ∈ 1 , d.h. ur festes i ∈ N und j=1 |aij | < ∞. Deshalb gilt f¨ (n)
xn = (sj )j∈N → 0 (n)
σi
=
∞
(n)
aij sj
→ 0.
j=1
Daher konvergiert (Axn ) komponentenweise gegen 0. Falls also (Axn ) bez¨ uglich . konvergiert, muß der Limes = 0 sein, was nur zu zeigen war. 2
IV.5
Der Satz vom abgeschlossenen Bild
In Korollar III.4.6 wurde ein Kriterium f¨ ur die L¨osbarkeit der Operatorgleichung T x = y f¨ ur stetige lineare Operatoren mit abgeschlossenem Bild angegeben. Das folgende Kriterium ist n¨ utzlich, um diese Voraussetzung zu u ufen. ¨ berpr¨
IV.5
159
Der Satz vom abgeschlossenen Bild
Theorem IV.5.1 (Satz vom abgeschlossenen Bild) X und Y seien Banachr¨aume, und es sei T ∈ L(X, Y ). Dann sind folgende Aussagen ¨aquivalent. (i) ran(T ) ist abgeschlossen. (ii) ran(T ) = ker(T )⊥ (iii) ran(T ) ist abgeschlossen. (iv) ran(T ) = ker(T )⊥ Die Bezeichnungen U ⊥ und V⊥ wurden in (III.4) und (III.5) eingef¨ uhrt. Zum Beweis werden zwei Lemmata ben¨ otigt, die von eigenem Interesse sind. Lemma IV.5.2 X und Y seien Banachr¨aume, und T ∈ L(X, Y ) habe abgeschlossenes Bild. Dann existiert K ≥ 0 mit: ∀y ∈ ran(T ) ∃x ∈ X: T x = y und x ≤ K y Beweis. Betrachte die kanonische Faktorisierung X
T
- ran(T )
@ @ T @ R @ X/ ker(T ) Hier ist T bijektiv und stetig zwischen den Banachr¨aumen (!) X/ ker(T ) und ran(T ). Nach Korollar IV.3.4 ist T−1 stetig; nach Definition der Quo2 tientennorm gilt daher die Aussage f¨ ur alle K mit K > T−1 . Lemma IV.5.3 X und Y seien Banachr¨aume, und es sei T ∈ L(X, Y ). Es existiere c > 0 mit c y ≤ T y
∀y ∈ Y .
Dann ist T offen und insbesondere surjektiv. Beweis. Setze wie in Abschnitt IV.3 Uε = {x ∈ X: x < ε}, Vε = {y ∈ Y : y < ε}. Es reicht nach Lemma IV.3.2, Vc ⊂ T (U1 ) zu zeigen. Dazu gen¨ ugt es, Vc ⊂ T (U1 ) =: D zu zeigen, wie der zweite Teil des Beweises von Theorem IV.3.3 klarmacht. are y0 ∈ / D, so existierten nach dem Sei also y0 ∈ Vc , d.h. y0 < c. W¨ Trennungssatz von Hahn-Banach (Satz III.2.5) y ∈ Y und α ∈ R mit Re y (y) ≤ α < Re y (y0 ) ≤ |y (y0 )|
∀y ∈ D.
160
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Wegen 0 ∈ D ist α ≥ 0, und man darf α > 0 annehmen; indem man schließlich y durch y /α ersetzt, sieht man, daß ohne Einschr¨ankung sogar α = 1 ist. Da D mit y auch λy f¨ ur |λ| ≤ 1 enth¨alt, erh¨alt man, daß dann sogar ∀y ∈ D. |y (y)| ≤ 1 < |y (y0 )| Es folgt f¨ ur alle x mit x < 1 (so daß T x ∈ D) |(T y )(x)| = |y (T x)| ≤ 1, also T y ≤ 1. Ferner gilt |y (y0 )| ≤ y y0 < c y , also c y > 1 im Widerspruch zur vorausgesetzten Ungleichung. Also muß y0 ∈ D sein, womit das Lemma bewiesen ist. 2 Beachte, wie Lemma IV.5.3 die Aussage von Satz III.4.5 T hat dichtes Bild ⇐⇒ T ist injektiv versch¨ arft. Beweis von Theorem IV.5.1: (i) ⇔ (ii): Das ist Satz III.4.5 (⇒) bzw. trivial (⇐). (i) ⇒ (iv): Zun¨ achst gilt (auch ohne Voraussetzung (i)) ran(T ) ⊂ ker(T )⊥ , denn T y (x) = y (T x) = 0 f¨ ur x ∈ ker(T ). Sei nun x ∈ ker(T )⊥ . Betrachte die wohldefinierte lineare Abbildung z : ran(T ) → K, y → x (x) falls T x = y. amlich K wie in Lemma IV.5.2. Dann ist f¨ ur y ∈ ran(T ) z ist stetig: Sei n¨ und geeignetes x mit T x = y |z (y)| = |x (x)| ≤ x x ≤ x K y . Sei y ∈ Y eine Hahn-Banach-Fortsetzung von z ; dann ist x = T y , da x (x) = z (T x) = y (T x) = (T y )(x)
∀x ∈ X.
Das zeigt ker(T )⊥ ⊂ ran(T ). (iv) ⇒ (iii): Klar, da Annihilatoren abgeschlossen sind. (iii) ⇒ (i): Betrachte den abgeschlossenen Unterraum Z = ran(T ) von Y und S ∈ L(X, Z), definiert durch Sx = T x. F¨ ur y ∈ Y und x ∈ X ist dann $ % (T y )(x) = y (T x) = y |Z (Sx) = S (y |Z ) (x),
161
IV.6 Projektionen auf Banachr¨ aumen
d.h. T (y ) = S (y |Z ); folglich gilt ran(T ) ⊂ ran(S ). Ist umgekehrt S (z ) ∈ ur jede Hahnran(S ), so gilt nach dem obigen Argument S z = T y f¨ Banach-Fortsetzung y ∈ Y von z ∈ Z , zusammen also ran(T ) = ran(S ). Insbesondere ist nach Voraussetzung ran(S ) abgeschlossen. Da S dichtes Bild hat, ist nach Satz III.4.5 S injektiv; S ist daher eine stetige Bijektion zwischen den Banachr¨ aumen Z und ran(S ). Zwischen diesen R¨aumen ur ein c > 0 wirkt S als Isomorphismus (Korollar IV.3.4), insbesondere gilt f¨ c z ≤ S z
∀z ∈ Z .
Nach Lemma IV.5.3 ist ran(S) = Z, also ran(T ) = Z, und T hat abgeschlossenes Bild. 2 In Abschnitt VIII.7 wird der Satz vom abgeschlossenen Bild erneut von einem allgemeineren Standpunkt aus analysiert; außerdem sei auf Aufgabe VII.5.19 verwiesen.
IV.6
Projektionen auf Banachr¨ aumen
Eine Projektion auf einem Vektorraum ist eine Abbildung mit P 2 = P . In der linearen Algebra wird gezeigt, daß es zu jedem Untervektorraum U eines Vektorraums X einen Komplement¨ arraum V derart gibt, daß X algebraisch isomorph zur direkten Summe U ⊕ V ist. Die zugeh¨orige Projektion von X auf U ist dann linear. (All das folgt aus dem Basiserg¨anzungssatz.) Ist X zus¨ atzlich normiert, ist man an der Existenz stetiger linearer Projektionen interessiert. Außerdem m¨ ochte man wissen, ob der normierte Raum X nicht nur algebraisch, sondern auch topologisch isomorph zu U ⊕ V , wie u ¨ blich versehen mit einer der Normen aus Satz I.3.3, ist, mit anderen Worten, ob (un + vn ) genau dann konvergiert, wenn es (un ) und (vn ) tun. Man spricht dann von einer topologisch direkten Zerlegung. Zun¨ achst eine einfache Beobachtung. Lemma IV.6.1 Sei P eine stetige lineare Projektion auf dem normierten Raum X. (a) Entweder ist P = 0 oder P ≥ 1. (b) Der Kern ker(P ) und das Bild ran(P ) sind abgeschlossen. (c) Es gilt X ker(P ) ⊕ ran(P ). Beweis. (a) Aus P = P 2 ≤ P 2 folgt sofort P = 0 oder P ≥ 1. (b) Der Kern ker(P ) = P −1 {0} ist abgeschlossen, da P stetig ist. Auch Id − P ist eine stetige Projektion, und ran(P ) = ker(Id − P ) ist ebenfalls abgeschlossen. (c) Es ist klar, daß X algebraisch mit der direkten Summe ker(P ) ⊕ ran(P ) identifiziert werden kann, denn jedes Element x l¨aßt sich als x =
162
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
(Id − P )(x) + P (x) schreiben. Daß die Summe topologisch direkt ist, folgt aus der Stetigkeit von P . 2 Beispiele. (a) Auf Lp (R), 1 ≤ p ≤ ∞, definiert f → χ[0,1] f eine stetige lineare Projektion mit P = 1. Das Bild von P ist zu Lp [0, 1] isometrisch isomorph. (b) Die im Beweis von Korollar II.3.6 definierten Operatoren auf Lp [0, 1] sind ebenfalls kontraktive lineare Projektionen. (c) In Satz IV.6.5 wird gezeigt, daß es keine stetige lineare Projektion von ∞ auf c0 gibt. Satz IV.6.2 Ist U ein endlichdimensionaler Unterraum des normierten Raums X, so existiert eine stetige lineare Projektion P von X auf U mit P ≤ dim U . Beweis. Sei {b1 , . . . , bn } eine Auerbachbasis von U , d.h., eine Basis wie in Satz II.2.6. Setze die Funktionale bi aus diesem normerhaltend zu Satz n Funktionalen xi ∈ X fort; die Abbildung P (x) = i=1 xi (x)bi leistet dann das Geforderte. 2 Im n¨ achsten Satz zeigen wir eine Umkehrung von Lemma IV.6.1 im Fall eines Banachraums X. Satz IV.6.3 Sei X ein Banachraum und U ein abgeschlossener Unterraum. Es existiere ein abgeschlossener Komplement¨arraum V zu U ; X ist also algebraisch isomorph zur direkten Summe U ⊕ V . Dann gelten: (a) X ist topologisch (d.h., als Banachraum) isomorph zu U ⊕1 V . (b) Es existiert eine stetige lineare Projektion von X auf U . (c) Es gilt V X/U . Beweis. (a) Da U und V abgeschlossen im Banachraum X sind, sind es selbst Banachr¨aume, und deshalb ist die normierte Summe U ⊕1 V ein Banachraum. Ferner ist die Abbildung U ⊕1 V → X, (u, v) → u + v linear, bijektiv nach Voraussetzung und stetig wegen der Dreiecksungleichung. Nach Korollar IV.3.4 folgt die Behauptung. (b) Nach Teil (a) existiert M ≥ 0 mit u + v ≤ M u + v f¨ ur alle u ∈ U , v ∈ V . Die wohldefinierte lineare Projektion u + v → u ist also stetig. (c) Die Abbildung V → X/U , v → [v], ist linear, bijektiv und stetig. Da X/U ein Banachraum ist (Satz I.3.2), folgt die Behauptung wieder aus Korollar IV.3.4. 2 In Kapitel V wird gezeigt, daß abgeschlossene Unterr¨aume von L2 oder stets abgeschlossene Komplement¨ arr¨ aume besitzen. Abschließend zeigen 2
IV.6
163
Projektionen auf Banachr¨ aumen
wir nun, daß das im Fall eines beliebigen Banachraums nicht zu gelten braucht. Zur Formulierung des Gegenbeispiels f¨ uhren wir eine neue Sprechweise ein. Definition IV.6.4 Ein abgeschlossener Teilraum U eines Banachraums X heißt komplementiert, falls es eine stetige lineare Projektion von X auf U gibt. Satz IV.6.5 Der Unterraum c0 von ∞ ist nicht komplementiert. Zum Beweis ben¨ otigen wir ein kombinatorisches Lemma. Lemma IV.6.6 Es gibt ¨ uberabz¨ahlbar viele unendliche Teilmengen Ni von N, so daß Ni ∩ Nj f¨ ur i = j endlich ist. Beweis. Sei {q1 , q2 , . . .} eine Aufz¨ ahlung von Q und I = R \ Q. Zu i ∈ I w¨ ahle eine Folge rationaler Zahlen, die gegen i konvergiert. Setze dann unschten Ni = {n ∈ N: qn ist in dieser Folge}. Das System der Ni hat die gew¨ Eigenschaften. 2 Kommen wir nun zum Beweis von Satz IV.6.5. W¨are c0 komplementiert, g¨ abe es einen abgeschlossenen Komplement¨arraum V zu c0 , und nach are ∞ /c0 isomorph zu einem Satz IV.6.3 w¨ are V ∞ /c0 . Insbesondere w¨ ∞ abgeschlossenen Unterraum von . Wir werden zeigen, daß diese Annahme zu einem Widerspruch f¨ uhrt. ahlbare Menge von FunktionaAuf ∞ gibt es eine punktetrennende abz¨ len, etwa die Auswertungen δn : x → x(n), also l¨aßt auch V so eine Menge zu und der nach Annahme dazu isomorphe Banachraum X := ∞ /c0 ebenfalls. Es existiert also eine Folge von Funktionalen xn ∈ X mit xn (x) = 0 ∀n ∈ N
⇒ x = 0.
(IV.10)
Wir w¨ ahlen nun Teilmengen Ni ⊂ N, wo i eine u ¨ berabz¨ahlbare Indexmenge ¨ I durchl¨ auft, gem¨ aß Lemma IV.6.6 und betrachten die Aquivalenzklassen ur n ∈ N xi := [χNi ] ∈ X. Hier bezeichnet χN die Folge mit χN (n) = 1 f¨ und χN (n) = 0 sonst. Es sind dann alle xi = 0. Als erstes zeigen wir jetzt: • F¨ ur alle x ∈ X ist {i ∈ I: x (xi ) = 0} abz¨ahlbar.
(IV.11)
Sei x ∈ X . Zum Beweis von (IV.11) ist nur zu zeigen, daß I0 := {i ∈ I: |x (xi )| ≥ ε} f¨ ur jedes ε > 0 endlich ist. In der Tat: Seien i1 , . . . , ir ∈ I0 . mit |αk | = 1 und x (αk xik ) = |x (xik )|. Nach Konstruktion der W¨ ahle α k r xi ist k=1 αk xik ≤ 1, da die Ni fast“ disjunkt sind. Also gilt ” r r εr ≤ |x (xik )| = x αk xik ≤ x , k=1
k=1
daher enth¨ alt I0 h¨ ochstens x /ε Elemente. Nach (IV.11) gilt nun f¨ ur die oben gew¨ ahlte Folge (xn ):
164
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
• {i ∈ I: xn (xi ) = 0 f¨ ur ein n ∈ N} ist abz¨ahlbar. ur alle n ∈ N im Widerspruch Folglich existiert xi0 (= 0!) mit xn (xi0 ) = 0 f¨ zu (IV.10). 2 Die Aussage von Satz IV.6.5 kann auch so interpretiert werden, daß es keine stetige Fortsetzung des identischen Operators Id: c0 → c0 zu einem stetigen Operator P : ∞ → c0 gibt; in der Tat w¨are eine solche Fortsetzung eine stetige Projektion von ∞ auf c0 . Daher ist im allgemeinen kein Fortsetzungssatz vom Hahn-Banach-Typ f¨ ur Operatoren statt Funktionale zu erwarten.
IV.7
Fixpunkts¨ atze
Unter einem Fixpunktsatz versteht man eine Aussage, die f¨ ur gewisse Klassen von Selbstabbildungen F : M → M auf gewissen (nicht leeren!) Mengen die Existenz von Fixpunkten garantiert, also von Punkten ξ ∈ M mit F (ξ) = ξ. Viele Gleichungen der reinen und angewandten Mathematik k¨ onnen in ein ¨ aquivalentes Fixpunktproblem u uhrt werden (siehe ¨ berf¨ z.B. Korollar IV.7.19); daher sind Fixpunktmethoden zu einem universellen Mittel zum Beweis der L¨ osbarkeit solcher Gleichungen geworden. In den Analysisvorlesungen begegnet man dem Banachschen Fixpunktsatz und dem Brouwerschen Fixpunktsatz. In diesem Abschnitt wollen wir funktionalanalytische Verallgemeinerungen dieser S¨atze kennenlernen; wir werden hier in der Regel auf konvexen Teilmengen von Banachr¨aumen definierte nichtlineare Abbildungen studieren. Beginnen wir mit Ausdehnungen des Banachschen Fixpunktsatzes; doch zuerst soll an diesen Satz selbst erinnert werden. • (Banachscher Fixpunktsatz) Sei (M, d) ein nicht leerer vollst¨andiger metrischer Raum, und sei F : M → M eine strikte1 Kontraktion; d.h., es existiert eine Zahl q < 1 mit d(F (x), F (y)) ≤ q d(x, y)
∀x, y ∈ M.
(IV.12)
Dann besitzt F genau einen Fixpunkt. Genauer gilt: Ist x0 ∈ M beliebig, so konvergiert die durch xn+1 = F (xn ), n ≥ 0,
(IV.13)
1 In der Literatur spricht man h¨ aufig bloß von einer Kontraktion, was jedoch mit der Nomenklatur der linearen Funktionalanalysis nicht immer kompatibel ist, wo man lineare Operatoren mit Norm ≤ 1 kontraktiv nennt.
IV.7
165
Fixpunkts¨ atze
definierte Iterationsfolge gegen den eindeutig bestimmten Fixpunkt ξ, und zwar ist qn d(x1 , x0 ). d(xn , ξ) ≤ 1−q Die Grundidee des Beweises, der in praktisch allen Analysisb¨ uchern zu finden ist, soll kurz in Erinnerung gerufen werden. Durch einen Te k−1 d(x , x ) ≤ leskopsummentrick sch¨ atzt man d(xn+k , xn ) ≤ n+j+1 n+j j=0 k−1 n+j d(x1 , x0 ) ab. Das zeigt, daß (xn ) eine Cauchyfolge ist; der Grenzj=0 q wert ξ muß dann ein Fixpunkt sein. Durch Grenz¨ ubergang k → ∞ folgt die behauptete a-priori-Absch¨ atzung f¨ ur d(xn , ξ), und die Eindeutigkeit des Fixpunkts ist eine unmittelbare Konsequenz von (IV.12). Als n¨ achstes soll es darum gehen, Abbildungen, die (IV.12) mit q = 1 erf¨ ullen, auf Fixpunkte zu untersuchen. Solche Abbildungen tragen einen speziellen Namen. Definition IV.7.1 Eine Abbildung F : M → M auf einem metrischen Raum (M, d) heißt nichtexpansiv, wenn d(F (x), F (y)) ≤ d(x, y)
∀x, y ∈ M.
Mit anderen Worten ist eine solche Abbildung eine Lipschitzabbildung mit Lipschitzkonstante ≤ 1; insbesondere ist sie stetig. Sehr einfache Beispiele zeigen, daß der Banachsche Fixpunktsatz nicht f¨ ur nichtexpansive Abbildungen zu gelten braucht: Weder die Existenz bleibt gew¨ ahrleistet (z.B. F (x) = 1 − x auf M = {0, 1}), noch die Eindeutigkeit (z.B. F (x) = x auf M = {0, 1}), noch die Konvergenz der Iterationsfolge (z.B. F (x) = 1 − x auf M = [0, 1]; hier konvergiert die Iterationsfolge aus (IV.13) genau dann, wenn der Startpunkt der Fixpunkt 1/2 ist). Der Vergleich des ersten Beispiels mit dem dritten legt die Vermutung nahe, daß die mangelnde Konvexit¨ at von {0, 1} etwas mit der Nichtexistenz von Fixpunkten zu tun hat. In der Tat werden wir positive Resultate f¨ ur nichtexpansive Abbildungen, die auf konvexen Teilmengen gewisser ur 1 < p < ∞ definiert sind, erzielen. Daß die KonBanachr¨ aume wie Lp f¨ vexit¨ at allein nicht weiterhilft, zeigt jedoch das folgende Beispiel. Seien C = {f ∈ C[0, 1]: 0 ≤ f ≤ 1, f (1) = 1} und F : C → C, (F f )(t) = t f (t). Versieht man C[0, 1] mit der Supremumsnorm, so ist C abgeschlossen, beschr¨ ankt und konvex, und F ist nichtexpansiv. Der einzige Kandidat f¨ ur einen Fixpunkt ist aber die Nullfunktion, und die geh¨ort nicht zu C. Also ist F fixpunktfrei. Wir werden im n¨ achsten Satz sehen, daß solche fixpunktfreien Abbildungen im Raum L2 = L2 (Ω, Σ, μ) nicht auftreten k¨onnen. Zuerst formulieren wir ein Lemma, das stets die Existenz von approximativen Fixpunkten“ ” garantiert.
166
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Lemma IV.7.2 Sei C eine nicht leere, abgeschlossene, konvexe Teilmenge eines Banachraums, und es sei F : C → C nichtexpansiv sowie F (C) beschr¨ankt. Dann existiert eine Folge (xn ) in C mit F (xn ) − xn → 0. Beweis. Sei p ∈ C beliebig, und betrachte zu 0 < λ ≤ 1 die Abbildung Fλ : C → C,
Fλ (x) = λp + (1 − λ)F (x);
da C konvex ist, bildet Fλ die Menge C wirklich in sich ab. Offensichtlich ist Fλ strikt kontraktiv mit der Konstanten q = 1 − λ; nach dem Banachschen Fixpunktsatz besitzt Fλ genau einen Fixpunkt ξλ . Macht man diese ¨ Uberlegung f¨ ur λ = 1/n und setzt man xn = ξ1/n , so erh¨alt man F (xn ) − xn = F (xn ) − F1/n (xn ) =
1 p − F (xn ) → 0, n
da F (xn ) in der beschr¨ ankten Menge F (C) liegt.
2
Hieraus ergibt sich ein sehr einfacher Fixpunktsatz. Lemma IV.7.3 Sei C eine nicht leere, abgeschlossene, konvexe Teilmenge eines Banachraums, und sei F : C → C stetig. Existiert eine Folge mit F (xn ) − xn → 0 und ist F (C) relativkompakt, so besitzt F einen Fixpunkt. Insbesondere besitzt eine nichtexpansive Abbildung F : C → C mit relativkompaktem Bild einen Fixpunkt. Beweis. W¨ ahle eine Teilfolge von (xn ), f¨ ur die (F (xnk )) konvergiert, etwa gegen ξ. Dann konvergiert auch (xnk ) gegen ξ, und da C abgeschlossen ist, folgt ξ ∈ C. Die Stetigkeit von F liefert F (xnk ) → F (ξ), und das zeigt F (ξ) = ξ, da der Grenzwert eindeutig ist. Der Zusatz folgt aus Lemma IV.7.2. 2 Eine tiefliegende Verallgemeinerung werden wir im Schauderschen Fixpunktsatz (Theorem IV.7.18) kennenlernen. Nun zu dem bereits angek¨ undigten Satz u ¨ ber nichtexpansive Abbildungen in L2 = L2 (Ω, Σ, μ). Im folgenden Beweis schreiben wir f, g = f g dμ; Ω
wer mit dem Begriff des Hilbertraums aus Kapitel V bereits vertraut ist, wird erkennen, daß sich der n¨ achste Satz samt Beweis w¨ortlich auf den Fall eines beliebigen Hilbertraums statt L2 u ¨ bertragen l¨aßt. Satz IV.7.4 Sei ∅ = C ⊂ L2 abgeschlossen, konvex und beschr¨ankt, und sei F : C → C nichtexpansiv. Dann besitzt F einen Fixpunkt.
IV.7
167
Fixpunkts¨ atze
Beweis. W¨ ahle mit Lemma IV.7.2 eine Folge (xn ) in C mit F (xn )−xn 2 → ankt ist, existiert nach Theorem III.3.7 0. Da L2 reflexiv und (xn ) beschr¨ eine schwach konvergente Teilfolge; ohne Einschr¨ankung nehmen wir an, daß (xn ) selbst schwach konvergiert, etwa gegen ξ. Nach Satz III.3.8 gilt ξ ∈ C; wir werden ξ als Fixpunkt von F erkennen. Zun¨ achst hat man xn − F (ξ) 22 = (xn − ξ) + (ξ − F (ξ)) 22 = xn − ξ 22 + 2 Rexn − ξ, ξ − F (ξ) + ξ − F (ξ) 22 . Da (xn − ξ) eine schwache Nullfolge ist, strebt der mittlere Term gegen 0; also folgt (IV.14) xn − F (ξ) 22 − xn − ξ 22 → ξ − F (ξ) 22 . Andererseits gilt xn − F (ξ) 2 ≤ xn − F (xn ) 2 + F (xn ) − F (ξ) 2 ≤ xn − F (xn ) 2 + xn − ξ 2 , da F nichtexpansiv ist. Weil der vorletzte Summand gegen 0 strebt, folgt lim sup( xn − F (ξ) 2 − xn − ξ 2 ) ≤ 0 und deshalb auch lim sup( xn − F (ξ) 22 − xn − ξ 22 ) ≤ 0.
(IV.15)
Vergleicht man (IV.14) mit (IV.15), erkennt man F (ξ) = ξ, wie behauptet. 2 Im Hinblick auf eine weitere Anwendung formulieren wir den Kern des vorstehenden Beweises separat als Lemma. Lemma IV.7.5 Sei ∅ = C ⊂ L2 abgeschlossen, konvex und beschr¨ankt, und sei F : C → C nichtexpansiv. Ist (xn ) eine schwach konvergente Folge in C mit F (xn ) − xn → 0, so ist ihr schwacher Grenzwert ein Fixpunkt von F . Da man diese Aussage auch durch die Implikation xn → ξ schwach, (Id − F )(xn ) → 0
⇒
ξ ∈ C, (Id − F )(ξ) = 0
ausdr¨ ucken kann, wird deutlich, daß es sich hier um eine Variante der Abgeschlossenheit eines Operators handelt; vergleiche mit Definition IV.4.1. Man nennt diese Eigenschaft die Demiabgeschlossenheit des nichtlinearen Operators Id − F .
168
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Wir haben bereits oben bemerkt, daß die Iterationsfolge xn+1 = F (xn ) f¨ ur nichtexpansives F nicht zu konvergieren braucht. Die Situation verbessert sich, wenn man statt F die ebenfalls nichtexpansive Abbildung G = 12 (Id + F ) betrachtet, die ja dieselben Fixpunkte wie F besitzt. (Ist F : C → C auf einer konvexen Menge definiert, so bildet auch G die Menge C in sich ab.) Wir wollen nun die durch xn+1 = G(xn ) =
xn + F (xn ) 2
(IV.16)
definierte Iteration auf L2 studieren. Satz IV.7.6 Sei ∅ = C ⊂ L2 abgeschlossen, konvex und beschr¨ankt, und sei F : C → C nichtexpansiv sowie x0 ∈ C beliebig. Dann konvergiert die durch (IV.16) definierte Folge (xn ) schwach gegen einen Fixpunkt von F . Wieder kann ein erfahrener Leser statt L2 einen beliebigen Hilbertraum einsetzen. Dem Beweis schicken wir ein Lemma voraus. Lemma IV.7.7 Unter den obigen Voraussetzungen gilt F (xn ) − xn 2 → 0. Beweis. Wir benutzen die unmittelbar zu verifizierende Parallelogramm” gleichung“ (vgl. Satz V.1.7) u + v 22 + u − v 22 = 2 u 22 + 2 v 22 f¨ ur u, v ∈ L2 . Sei nun ξ ein beliebiger Fixpunkt von F , dessen Existenz nach Satz IV.7.4 gesichert ist. Wir setzen u = F (xn ) − F (ξ),
v = xn − ξ,
so daß u + v = 2(xn+1 − ξ),
u − v = F (xn ) − xn .
Die Parallelogrammgleichung liefert 4 xn+1 − ξ 22 + F (xn ) − xn 22 = 2 F (xn ) − F (ξ) 22 + 2 xn − ξ 22 ≤ 4 xn − ξ 22 . Es folgt F (xn ) − xn 22 ≤ 4( xn − ξ 22 − xn+1 − ξ 22 ). Durch Aufsummieren erh¨ alt man dann (Teleskopsumme) N n=0
F (xn ) − xn 22 ≤ 4( x0 − ξ 22 − xN +1 − ξ 22 ) ≤ 4 x0 − ξ 22 .
IV.7
169
Fixpunkts¨ atze
Daher konvergiert die Summe ist gezeigt.
∞ n=0
F (xn ) − xn 22 , und die Behauptung 2
Wegen F (xn ) − xn = 2(xn+1 − xn ) = 2(Gn+1 (x0 ) − Gn (x0 )) gilt also stets Gn+1 (x0 ) − Gn (x0 ) → 0; diese Eigenschaft von G wird asymptotische Regularit¨at genannt. Beweis von Satz IV.7.6. Es sei Φ ⊂ C die Menge aller Fixpunkte von F . Dann ist Φ = ∅ nach Satz IV.7.4, Φ ist abgeschlossen, da F stetig ist, und ur alle Φ ist gem¨ aß Aufgabe IV.8.31 konvex, denn L2 ist strikt konvex. F¨ y ∈ Φ ist xn+1 − y 2 = G(xn ) − G(y) 2 ≤ xn − y 2 , denn mit F ist auch G nichtexpansiv. Daher kann man eine Funktion ϕ: Φ → R durch ϕ(y) = lim xn − y 2 = inf xn − y 2 n→∞
n
definieren. Die umgekehrte Dreiecksungleichung zeigt, daß ϕ stetig ist, und die Dreiecksungleichung impliziert, daß ϕ eine konvexe Funktion in dem Sinn ist, daß die Mengen Φr = {y ∈ Φ: ϕ(y) ≤ r} konvex (und wegen der Stetigkeit abgeschlossen) sind. Wir wollen begr¨ unden, daß ϕ sein Infimum ρ auf Φ annimmt. Das folgt im Prinzip aus Satz III.5.8 und Lemma III.5.9; wir wollen das Argument noch einmal ausf¨ uhren: W¨ ahle eine Folge (yn ) in Φ mit ϕ(yn ) → ρ. Da L2 reflexiv und Φ als Teilmenge von C beschr¨ ankt ist, existiert eine schwach konvergente Teilfolge (ynk ), etwa mit schwachem Grenzwert ξ. Da die Φr f¨ ur jedes r > ρ abgeschlossen und konvex sind und (ynk ) f¨ ur große k in Φr liegt, folgt mit Satz III.3.8 ξ ∈ Φr und deshalb ξ ∈ r>ρ Φr = Φρ . Daher gilt ϕ(ξ) = ρ. Sei nun (xnk ) eine schwach konvergente Teilfolge von (xn ) mit Grenzwert z. Da nach Lemma IV.7.7 F (xn )− xn 2 → 0 gilt, zeigt Lemma IV.7.5 z ∈ Φ. Wir beweisen nun z = ξ. Es ist ja xnk − ξ 22 = xnk − z 22 + 2 Rexnk − z, z − ξ + z − ξ 22 , wo der mittlere Term gegen 0 strebt. Deshalb ist ϕ(ξ)2 = ϕ(z)2 + z − ξ 22 ≥ ϕ(ξ)2 + z − ξ 22 und in der Tat z = ξ. Das letzte Argument impliziert, daß jede Teilfolge von (xn ) eine weitere Teilfolge hat, die schwach gegen ξ konvergiert; daraus erh¨alt man aber (wie?) die schwache Konvergenz von (xn ) gegen ξ. 2 Korollar IV.7.8 Hat zus¨atzlich zu den Voraussetzungen des letzten Satzes F relativkompaktes Bild, so ist (xn ) sogar normkonvergent.
170
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Beweis. Man muß im obigen Beweis nur schwach konvergente Teilfolgen durch normkonvergente Teilfolgen ersetzen; beachte, daß Φ als abgeschlos2 sene Teilmenge von F (C) kompakt ist. Argumentativ ist bei den letzten beiden Resultaten zu bemerken, daß hier ein konstruktives Verfahren zur Bestimmung eines Fixpunkts angegeben wird, der Konvergenzbeweis jedoch auf der zuvor bewiesenen Existenz von Fixpunkten basiert. Die Kenntnis der bloßen Existenz der L¨osung eines Problems kann also bisweilen hilfreich sein, um die Konvergenz eines L¨ osungsverfahrens zu zeigen. Das n¨ achste Ziel dieses Abschnitts wird es sein, einen Satz IV.7.4 entsprechenden Fixpunktsatz f¨ ur eine gr¨ oßere Klasse von Banachr¨aumen zu aume f¨ ur 1 < p < ∞ geh¨oren, beweisen, zu der auch die Lp - und p -R¨ n¨ amlich f¨ ur die gleichm¨ aßig konvexen R¨ aume, die wie folgt definiert sind. Definition IV.7.9 Ein Banachraum (X, . ) heißt gleichm¨aßig konvex, wenn es zu jedem ε > 0 ein δ > 0 mit der Eigenschaft x + y x , y ≤ 1, x − y ≥ ε ⇒ ≤1−δ 2 gibt. Man nennt x + y " # δX : ε → inf 1 − : x , y ≤ 1, x − y ≥ ε 2 den Konvexit¨atsmodul von X. Beachte, daß diese Eigenschaft isometrischer Natur ist und sich auf die gegebene Norm von X bezieht; die gleichm¨aßige Konvexit¨at bleibt beim ¨ Ubergang zu einer ¨ aquivalenten Norm in der Regel nicht erhalten. Offensichtlich ist X genau dann gleichm¨ aßig konvex, wenn f¨ ur alle ε > 0 auch δX (ε) > 0 ist, und offensichtlich ist ein gleichm¨aßig konvexer Raum strikt konvex (vgl. Aufgabe I.4.13), d.h. x + y (IV.17) x , y ≤ 1, x = y ⇒ < 1; 2 die Umkehrung gilt jedoch nicht (Aufgabe IV.8.34). Die strikte Konvexit¨at eines Raums bedeutet, daß keine Strecken im Rand der Einheitskugel liegen (sie ist also rund“); die gleichm¨ aßige Konvexit¨at bietet zudem eine ” quantitative Version dieser Idee: In der N¨ ahe des Randes k¨onnen nur kurze Strecken liegen. Ein Beispiel eines gleichm¨ aßig konvexen Raums ist der Raum L2 (oder allgemeiner ein Hilbertraum, siehe Kapitel V), denn dort gilt nach der bereits erw¨ ahnten Parallelogrammgleichung x + y 22 + x − y 22 = 2 x 22 + 2 y 22
(IV.18)
IV.7
171
Fixpunkts¨ atze
und deshalb x 2 , y 2 ≤ 1, x − y 2 ≥ ε
⇒ )
sowie δL2 (ε) = 1 −
1−
) x + y ε 2 ≤ 1− 2 2 2 ε 2
> 0. 2 Wir werden nun zeigen, daß die R¨ aume reell- oder komplexwertiger Funktionen Lp = Lp (Ω, Σ, μ) f¨ ur 1 < p < ∞ gleichm¨aßig konvex sind. F¨ ur 2 ≤ p < ∞ findet man ein Argument in Aufgabe I.4.18; der Fall 1 < p < 2 ist aber nicht so einfach. Im folgenden wird eine Beweismethode dargestellt, die f¨ ur alle p ∈ (1, ∞) einheitlich funktioniert. Wir ben¨otigen ein Lemma. Lemma IV.7.10 Es sei 1 < p < ∞. F¨ ur jedes ε > 0 existiert dann eine Zahl τp (ε) > 0 mit w + z p |w|p + |z|p (IV.19) ≤ (1 − τp (ε)) 2 2 f¨ ur alle w, z ∈ C mit |w|, |z| ≤ 1 und |w − z| ≥ ε. Beweis. Es reicht, ein solches τp (ε) zu finden, so daß (IV.19) f¨ ur z = 1 und alle w ∈ C mit |w| ≤ 1 und |w − 1| ≥ ε erf¨ ullt ist. F¨ ur alle w ∈ C gilt w + 1 p |w| + 1 p |w|p + 1 ; ≤ ≤ 2 2 2 hier ist die zweite Ungleichung eine Folge der (strikten) Konvexit¨at der Funktion t → tp f¨ ur 1 < p < ∞. Es gilt Gleichheit in der ersten Ungleichung genau dann, wenn w eine positive reelle Zahl ist, und wegen der strikten Konvexit¨ at gilt Gleichheit in der zweiten Ungleichung genau dann, wenn |w| = 1 ist. Daher ist f¨ ur |w| ≤ 1 und w = 1 w + 1 p * |w|p + 1 < 1, 2 2 und da die linke Seite stetig von w abh¨ angt, folgt auf der kompakten Menge {w ∈ C: |w| ≤ 1, |w − 1| ≥ ε} eine Absch¨ atzung * w + 1 p |w|p + 1 ≤ 1 − τp (ε) < 1, 2 2 was zu zeigen war.
2
Satz IV.7.11 Sei (Ω, Σ, μ) ein beliebiger Maßraum und 1 < p < ∞. Dann ublichen Lp -Norm, gleichm¨aßig konist Lp = Lp (Ω, Σ, μ), versehen mit der ¨ vex.
172
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Beweis. Seien f, g ∈ Lp mit f p , g p ≤ 1 und f − g p ≥ ε. Leider ergibt sich daraus keine punktweise Absch¨ atzung f¨ ur |f (ω) − g(ω)|; daher setze " # p ε Ω0 = ω ∈ Ω: |f (ω) − g(ω)|p ≥ (|f (ω)|p + |g(ω)|p ) 4 ¨ von Funktiound Ω1 = Ω \ Ω0 . Da f und g eigentlich Aquivalenzklassen nen sind, ist Ω0 nur bis auf eine Menge vom Maß 0 eindeutig bestimmt, was aber f¨ ur das folgende Argument (wie u ¨ blich) unerheblich ist. Weil f (ω)/(|f (ω)|p + |g(ω)|p )1/p und g(ω)/(|f (ω)|p + |g(ω)|p )1/p Zahlen vom Betrag ≤ 1 sind (mit der Konvention 0/0 = 0), liefert Lemma IV.7.10 f¨ ur alle ω ∈ Ω0 f (ω) + g(ω) p |f (ω)|p + |g(ω)|p . (IV.20) ≤ 1 − τp (ε/41/p ) 2 2 Weiter gilt
εp (|f |p + |g|p ) dμ Ω1 4 p ε (|f |p + |g|p ) dμ ≤ Ω 4 εp εp f pp + g pp ) ≤ . = 4 2
|f − g|p dμ ≤ Ω1
Wegen f − g p ≥ ε folgt
|f − g|p dμ ≥ Ω0
εp . 2
Diese Ungleichung kann auch als χΩ0 f − χΩ0 g p ≥ ε2−1/p geschrieben werden, und eine Anwendung der Dreiecksungleichng zeigt 2 max{ χΩ0 f p , χΩ0 g p } ≥ χΩ0 f p + χΩ0 g p ≥ ε2−1/p ,
so daß
|f | dμ, p
max Ω0
|g| dμ ≥ p
Ω0
εp . 2 · 2p
Diese Absch¨ atzung sowie (IV.20) implizieren dann p f + g p |f | + |g|p f + g p − 1− ≥ dμ 2 2 2 p Ω p |f | + |g|p f + g p − ≥ dμ 2 2 Ω 0 |f |p + |g|p dμ ≥ τp (ε/41/p ) 2 Ω0
IV.7
173
Fixpunkts¨ atze
1 ≥ τp (ε/4 ) · max 2 εp ≥ τp (ε/41/p ) p+2 , 2
woraus
|f | dμ,
1/p
p
Ω0
|g| dμ p
Ω0
f + g ≤ 1 − δ(ε) 2 p 2
f¨ ur ein geeignetes δ(ε) > 0 folgt.
aume ein; w¨ahle n¨amlich μ als z¨ahlenDieser Satz schließt die p -Folgenr¨ des Maß auf der Potenzmenge von N. urlichen Normen nicht gleichDaß L1 (μ), L∞ (μ) und C(K) in ihren nat¨ m¨ aßig konvex (nicht einmal strikt konvex) sind, wurde f¨ ur das Lebesguemaß und das Einheitsintervall in Aufgabe I.4.13 beobachtet. Der n¨achste Satz impliziert, daß diese R¨ aume auch keine ¨ aquivalenten gleichm¨aßig konvexen Normen besitzen, wenn sie unendlichdimensional sind. Satz IV.7.12 Jeder gleichm¨aßig konvexe Raum ist reflexiv. Der Beweis dieses Satzes wird am einfachsten mit den Methoden aus Kapitel VIII gef¨ uhrt und wird auf Seite 418 dargestellt. Einen Beweis, der auf den bislang entwickelten Hilfsmitteln beruht, findet man bei Yosida [1980], Seite 127. Jetzt k¨ onnen wir den bereits angek¨ undigten Fixpunktsatz formulieren und beweisen; der Beweis benutzt u ¨ brigens nicht Satz IV.7.12. Theorem IV.7.13 (Fixpunktsatz von Browder-G¨ohde-Kirk) Seien X ein gleichm¨aßig konvexer Banachraum, ∅ = C ⊂ X abgeschlossen, beschr¨ankt und konvex sowie F : C → C nichtexpansiv. Dann besitzt F einen Fixpunkt. Beweis. Im ersten Schritt des Beweises zeigen wir die Existenz einer Funktion ϕ mit ϕ(ε) → 0 f¨ ur ε → 0, so daß f¨ ur x, y ∈ C x + y x + y −F ≤ ϕ(ε) 2 2 (IV.21) gilt. Beachte, daß z := (x + y)/2 ∈ C, da C konvex ist. (IV.21) besagt, daß sich F zwischen Beinahe-Fixpunkten“ fast wie ein linearer Operator ” verh¨ alt. Zum Beweis beobachten wir als erstes, daß x − F (x) ≤ ε, y − F (y) ≤ ε
⇒
F (z) − x ≤ F (z) − F (x) + F (x) − x ≤ z − x + ε
174
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
nach Voraussetzung u ¨ ber x, und weil F nichtexpansiv ist. Setzt man ρ := ρ(x, y, ε) :=
1 x − y + ε = z − x + ε, 2
so gilt also F (z) − x ≤ ρ, F (z) − y ≤ ρ, letzteres aus Symmetriegr¨ unden. Setze x1 =
F (z) − x F (z) − y , y1 = ; ρ ρ
dann sind x1 ≤ 1, y1 ≤ 1, x1 − y1 =
1 x − y ρ
und deshalb x − y F (z) − z x1 + y1 = . ≤ 1 − δX ρ 2 ρ Nach Definition ist x − y = 2ρ − 2ε, und es folgt ε F (z) − z ≤ ρ 1 − δX 2 − 2 . ρ √ √ Ist ρ√≤ ε, so ist auch die rechte Seite in dieser Absch¨atzung ≤ ε; ist ρ > ε, so ist die rechte Seite wegen der Monotonie von δX durch √ √ ρ 1 − δX (2 − 2 ε) ≤ 12 diam(C) + ε 1 − δX (2 − 2 ε) abzusch¨ atzen. Hier bezeichnet diam(C) = sup u − v u,v∈C
den Durchmesser von C. Damit ist gezeigt, daß (IV.21) mit √ √ ϕ(ε) = ε + 12 diam(C) + ε 1 − δX (2 − 2 ε) gilt, und es bleibt zu begr¨ unden, daß limε→0 ϕ(ε) = 0. Dazu reicht es, lim δX (α) = sup δX (α) = 1
α→2
α 0 mit ¨ bereinstimmen. W¨
IV.7
175
Fixpunkts¨ atze
δX (α) < 1 − β f¨ ur alle α < 2, und dann existierten zu jedem n ∈ N Punkte xn , yn ∈ BX mit x + y 1 n n 1− xn − yn ≥ 2 − , ≤ 1 − β. n 2 Setzt man yn∗ = −yn , erh¨ alt man daraus x + y∗ 1 n n , xn − yn∗ ≥ 2β. 1− ≤ 2 2n Die zweite Ungleichung impliziert 1 − (xn + yn∗ )/2 ≥ δX (2β) > 0, und dann liefert die erste Ungleichung f¨ ur große n einen Widerspruch. Damit ist der Beweis des ersten Schrittes abgeschlossen; kommen wir zum eigentlichen Beweis der Existenz eines Fixpunkts. Wir setzen η(r) = inf{ F (x) − x : x ∈ C, x ≤ r}, s0 = inf{r ≥ 0: η(r) = 0}. Weil C beschr¨ ankt ist, ist f¨ ur hinreichend großes r nach Lemma IV.7.2 η(r) = 0; also ist s0 < ∞. W¨ ahle eine Folge (xn ) in C mit xn → s0 und F (xn ) − xn → 0; wir werden zeigen, daß (xn ) konvergiert. Dann folgt sofort, daß ξ := limn xn ein Fixpunkt von F ist, denn 0 = limn (F (xn ) − xn ) = F (ξ) − ξ. W¨ are (xn ) nicht konvergent, w¨ are notwendig s0 > 0, und es g¨abe eine ur die mit einem geeigneten τ > 0 stets yn+1 − Teilfolge (yn ) von (xn ), f¨ yn ≥ τ gilt. W¨ ahle nun s0 < s1 < 2s0 mit s2 := s1 (1 − δX (τ /(2s0 ))) < s0 . F¨ ur hinreichend große n gilt yn ≤ s1 und daher y y y yn τ n n+1 n+1 − ≥ . ≤ 1, ≤ 1, s1 s1 s1 s1 s1 Eine Anwendung der gleichm¨ aßigen Konvexit¨ at liefert dann die Absch¨atzung y + y n n+1 ≤ s1 (1 − δX (τ /s1 )) ≤ s2 < s0 2 f¨ ur große n. Aber F (yn ) − yn → 0 und (IV.21) implizieren y + y y +y n n+1 n n+1 − F → 0, 2 2 so daß η(s2 ) = 0 im Widerspruch zur Minimalit¨at von s0 folgt. Damit ist Theorem IV.7.13 vollst¨ andig bewiesen.
2
In den Bemerkungen und Ausblicken“ dieses Kapitels werden wir kurz ” auf die Frage eingehen, ob und wann Fixpunkte nichtexpansiver Abbildungen durch Iterationsverfahren gewonnen werden k¨onnen. Der zweite allgemeine Fixpunktsatz, der h¨aufig in den Anf¨angervorlesungen behandelt wird, ist der Brouwersche Fixpunktsatz. Er lautet:
176
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
• (Brouwerscher Fixpunktsatz) ur die Sei Bd = {x ∈ Rd : x ≤ 1} die Einheitskugel im Rd f¨ euklidische Norm, und sei F : Bd → Bd stetig. Dann besitzt F einen Fixpunkt. Der Beweis dieses Satzes liegt ungleich tiefer als der des Banachschen Fixpunktsatzes und kann aus Platzgr¨ unden hier nicht gef¨ uhrt werden. In den Bemerkungen und Ausblicken“ sind jedoch ein paar Literaturhinweise ” gesammelt. Es ist nicht schwierig, den Brouwerschen Fixpunktsatz auf Funktionen, die auf konvexen Teilmengen des Rd definiert sind, auszudehnen. Der erste Schritt dazu ist das folgende Lemma, das im n¨achsten Kapitel noch einmal in allgemeinerer Form behandelt wird (Satz V.3.2 und Aufgabe V.6.15). Lemma IV.7.14 Sei C ⊂ Rd eine kompakte konvexe Menge. Dann gibt es eine stetige Retraktion von Rd auf C, d.h. eine stetige Abbildung R: Rd → C mit R(x) = x f¨ ur alle x ∈ C. Beweis. Sei x0 ∈ Rd ; dann existiert ein eindeutig bestimmtes Element y0 ∈ C mit x0 − y0 = d(x0 , C) = inf x0 − y . y∈C
W¨ ahle n¨ amlich eine Folge (yn ) in C mit x0 − yn → d(x0 , C). Da C kompakt ist, existiert eine konvergente Teilfolge mit Grenzwert (sagen wir) abe es ein von y0 verschiedenes y0∗ y0 ∈ C; also gilt x0 − y0 = d(x0 , C). G¨ mit derselben Eigenschaft, so erhielte man, da 12 (y0 + y0∗ ) ebenfalls in der konvexen Menge C liegt, den Widerspruch (x − y ) + (x − y ∗ ) y0 + y0∗ 0 0 0 0 d(x0 , C) ≤ x0 − = 2 2 1 x0 − y0 + x0 − y0∗ = d(x0 , C); < 2 hier gilt die 0 w¨ ahle endlich viele Punkte x1 , . . . , xn in C, so daß C von den offenen ε-Kugeln Uε (xj ) um xj u ¨ berdeckt wird, was die Kompaktheit von C erm¨ oglicht: n Uε (xj ). (IV.22) C⊂ j=1
Definiere stetige Funktionen ϕj : C → R durch ε − x − xj falls x − xj < ε ϕj (x) = 0 falls x − xj ≥ ε und setze ϕ(x) =
n
ϕj (x).
j=1 2 Offensichtlich
spielt es keine Rolle, daß die Kugel B den Radius r statt 1 hat.
178
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Wegen (IV.22) ist ϕ(x) > 0 auf C, und deshalb sind λj := ϕj /ϕ, j = 1, .n. . , n, wohldefinierte stetige Funktionen auf C mit 0 ≤ λj (x) ≤ 1 und ur alle x ∈ C. j=1 λj (x) = 1 f¨ Es sei E = lin{x1 , . . . , xn } und C = C ∩ E. Als endlichdimensionaler Unterraum ist E abgeschlossen und deshalb C eine nicht leere, kompakte, konvexe Teilmenge von E. F¨ ur jedes x ∈ C liegt die Konvexkombination Φ(x) =
n
λj (x)xj
j=1
in C , deshalb ist Φ ◦ F |C : C → C eine stetige Selbstabbildung, die nach Satz IV.7.15 einen Fixpunkt ξε besitzt. Da stets n n n Φ(x) − x = λj (x)xj − λj (x)x λj (x) xj − x < ε ≤ j=1
j=1
j=1
gilt (in der letzten Summe ist ja λj (x) = 0, wenn xj − x ≥ ε), folgt F (ξε ) − ξε < ε, wenn man insbesondere x = F (ξε ) einsetzt. Eine Anwendung von Lemma IV.7.3 zeigt, daß F einen Fixpunkt besitzt. 2 Wie das folgende Beispiel zeigt, braucht der Schaudersche Fixpunktsatz nicht f¨ ur bloß abgeschlossene und beschr¨ ankte statt kompakte Mengen C zu gelten. Dazu sei C die abgeschlossene Einheitskugel von 2 , und F : C → C sei durch + F : x = (sn ) → 1 − x 22 , s1 , s2 , . . . definiert; beachte, daß stets F (x) 22 = 1 − x 22 + |s1 |2 + |s2 |2 + · · · = 1 ist und F daher tats¨ achlich C in sich abbildet und daß F stetig ist. Bes¨aße F einen Fixpunkt ξ = (tn ), so m¨ ußte notwendig t1 = t2 = . . . sein; die einzige konstante Folge in 2 ist aber 0, und F (0) = 0. Also ist F eine fixpunktfreie Abbildung. Man kann ohne große M¨ uhe eine flexiblere Version des Schauderschen Fixpunktsatzes beweisen. Dazu ben¨ otigt man den folgenden Begriff. Definition IV.7.17 Seien X und Y normierte R¨aume, M ⊂ X sowie F : M → Y eine Abbildung. Dann heißt F eine kompakte Abbildung, wenn F stetig ist und beschr¨ ankte Teilmengen von M auf relativkompakte Teilmengen von Y abbildet. Wie im linearen Fall betrachtet man in der Regel kompakte Abbildungen zwischen (Teilmengen von) Banachr¨ aumen. Beispiele. (a) Sei k: [0, 1] × [0, 1] × R eine stetige Funktion. Zu ϕ ∈ C[0, 1] setze 1
(F ϕ)(s) =
k(s, t, ϕ(t)) dt. 0
IV.7
179
Fixpunkts¨ atze
Wir zeigen, daß so eine kompakte Abbildung von C[0, 1] in sich definiert ist. Zun¨ achst beobachten wir, daß F ϕ stetig ist: Da k auf der kompakten Menge [0, 1] × [0, 1] × [−R, R] gleichm¨ aßig stetig ist, kann man zu ε > 0 ein δ = δ(ε, R) > 0 so w¨ ahlen, daß max{|s1 − s2 |, |t1 − t2 |, |u1 − u2 |} ≤ δ, |u1 |, |u2 | ≤ R
⇒
|k(s1 , t1 , u1 ) − k(s2 , t2 , u2 )| ≤ ε gilt. Ist nun ϕ ∞ ≤ R und |s1 − s2 | ≤ δ, so folgt sofort
1
|(F ϕ)(s1 ) − (F ϕ)(s2 )| ≤
|k(s1 , t, ϕ(t)) − k(s2 , t, ϕ(t))| dt ≤ ε. 0
In der Tat zeigt dieses Argument, daß F beschr¨ankte Teilmengen von C[0, 1] auf gleichgradig stetige Teilmengen abbildet. Da k auf [0, 1] × [0, 1] × [−R, R] beschr¨ ankt ist, folgt auch sofort, daß F beschr¨ankte Mengen auf beschr¨ ankte Mengen abbildet. Daher impliziert der Satz von Arzel` a-Ascoli (Satz II.3.4), daß F beschr¨ ankte Mengen auf relativkompakte Mengen abbildet. Zum Beweis der Kompaktheit von F bleibt, die Stetigkeit dieser Abbildung nachzuweisen. Dazu seien ϕ ∈ C[0, 1] und ε > 0 vorgelegt. Wir w¨ahlen R ≥ 0 so groß, daß ϕ ∞ ≤ R − 1 ist. Ist dann δ = δ(ε, R) wie oben und ur jedes s ∈ [0, 1] δ = min{δ, 1} sowie ϕ − ψ ∞ ≤ δ , so ergibt sich f¨
1
|(F ϕ)(s) − (F ψ)(s)| ≤
|k(s, t, ϕ(t)) − k(s, t, ψ(t))| dt ≤ ε, 0
da die dritten Argumente um weniger als δ differieren und ≤ R sind. Weil s beliebig war, folgt F ϕ − F ψ ∞ ≤ ε, was die Stetigkeit von F zeigt. (b) Eine Abbildung der Gestalt
1
(F ϕ)(s) =
k(s, t)f (t, ϕ(t)) dt 0
wird Hammerstein-Operator genannt. Sind k: [0, 1] × [0, 1] → R und f : [0, 1] × R → R stetig, handelt es sich um einen Spezialfall von Beispiel (a). In diesem Fall kann man jedoch auch folgendermaßen unter R¨ uckgriff auf die lineare Theorie argumentieren, daß F kompakt ist. Es ist nicht schwer zu sehen, daß der durch (Φϕ)(t) = f (t, ϕ(t)) definierte Superpositionsoperator (auch Nemytski˘ı-Operator genannt) stetig von C[0, 1] in sich operiert und beschr¨ ankte Mengen auf beschr¨ankte
180
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Mengen abbildet (Aufgabe IV.8.39). Da F die Komposition L ◦ Φ von Φ mit dem kompakten linearen Operator (vgl. Beispiel II.3(d)) 1 k(s, t)ϕ(t) dt L: C[0, 1] → C[0, 1], (Lϕ)(s) = 0
ist, erkennt man die Kompaktheit der Abbildung F . Jetzt k¨ onnen wir eine weitere Version des Schauderschen Fixpunktsatzes formulieren. Theorem IV.7.18 (Schauderscher Fixpunktsatz; 2. Version) Sei C = ∅ eine abgeschlossene, konvexe und beschr¨ankte Teilmenge eines Banachraums, und sei F : C → C eine kompakte Abbildung. Dann besitzt F einen Fixpunkt. Beweis. Nach Aufgabe III.6.14 (siehe auch Lemma IV.7.21 unten) ist C := co F (C) eine kompakte konvexe Menge, und es ist C ⊂ C, da C konvex und abgeschlossen sowie F (C) ⊂ C ist. Ferner ist F (C ) ⊂ F (C) ⊂ C ; nach Theorem IV.7.16 besitzt F |C einen Fixpunkt und folglich auch F . 2 Wir wollen den Schauderschen Fixpunktsatz auf ein Differentialgleichungsproblem anwenden. Es seien f : R2 → R eine stetige Funktion und y0 ∈ R. Gesucht ist eine auf einem Intervall [−T, T ] definierte differenzierbare Funktion y, die dort das Anfangswertproblem y (t) = f (t, y(t)),
y(0) = y0
(IV.23)
erf¨ ullt. Man kann dieses Problem l¨ osen, indem man es in ein ¨aquivalentes Fixpunktproblem u uhrt. Dazu bemerken wir, daß jede L¨osung von ¨ berf¨ (IV.23) automatisch stetig differenzierbar ist, da die rechte Seite stetig von t abh¨ angt, und Integration liefert dann t f (τ, y(τ )) dτ (IV.24) y(t) = y0 + 0
f¨ ur alle t ∈ [−T, T ]. Umgekehrt impliziert der Hauptsatz der Differentialund Integralrechnung f¨ ur ein y ∈ C[−T, T ], das (IV.24) erf¨ ullt, die Differenzierbarkeit und (IV.23). Die Gleichung (IV.24) ist nun ein Fixpunktproblem im Banachraum C[−T, T ]. Bezeichnet man die rechte Seite von (IV.24) mit (F y)(t), so kann man wie in Beispiel (b) zeigen, daß F : C[−T, T ] → C[−T, T ] eine kompakte Abbildung ist (vgl. Aufgabe II.5.26). Um den Schauderschen Fixpunktsatz anwenden zu k¨onnen, m¨ ussen wir eine abgeschlossene, beschr¨ankte, konvexe, F -invariante Teilmenge C produzieren. Das gelingt aber nur, wenn man T klein genug w¨ ahlt. Macht man n¨ amlich den Ansatz ur alle |t| ≤ T } C = {y ∈ C[−T, T ]: |y(t) − y0 | ≤ 1 f¨
IV.7
Fixpunkts¨ atze
181
und T ≤ 1, so gilt |(F y)(t) − y0 | ≤ T · M f¨ ur y ∈ C, wenn f auf [−1, 1] × ankt ist und |t| ≤ T ≤ 1 ist. Daher gilt in [y0 − 1, y0 + 1] durch M beschr¨ der Tat F (y) ∈ C, wenn T klein genug ist. Man sieht schnell, daß sich dieses Argument modifizieren l¨aßt, wenn f nur in einer Umgebung von (0, y0 ) definiert und stetig ist. Damit haben wir bewiesen: Korollar IV.7.19 (Existenzsatz von Peano) Unter den obigen Voraussetzungen besitzt das Anfangswertproblem (IV.23) auf einem hinreichend kleinen Intervall [−T, T ] eine L¨osung. Das Beispiel y (t) = y(t)2 , y(0) = 1 zeigt, daß man im allgemeinen keine globale L¨ osbarkeit erwarten kann. Wie in jeder Vorlesung u ohnliche Differentialgleichungen bewie¨ ber gew¨ sen wird, kann man mit denselben Ideen wie oben f¨ ur hinreichend kleines T den Banachschen Fixpunktsatz anwenden, falls f zus¨atzlich eine lokale Lipschitzbedingung bzgl. des zweiten Arguments erf¨ ullt; in diesem Fall ist (IV.23) sogar lokal eindeutig l¨ osbar (Satz von Picard-Lindel¨of ). Ferner u atze unmittelbar auf endlichdimensionale Systeme, ¨ bertragen sich diese S¨ d.h. f und y nehmen Werte im Rn an. Ersetzt man jedoch Rn durch einen unendlichdimensionalen Banachraum X, so wird der Satz von Peano f¨ ur jedes solche X falsch (Godunov, Funct. Anal. Appl. 9 (1975) 53–55). Im letzten Teil dieses Abschnitts studieren wir Fixpunkts¨atze f¨ ur nicht kompakte Abbildungen. Wir werden Abbildungen untersuchen, f¨ ur die das ” Bild kompakter als das Urbild“ ist. Um diese Idee zu pr¨azisieren, m¨ ussen wir die Nichtkompaktheit einer Menge quantifizieren. Das geschieht in der n¨ achsten Definition. Definition IV.7.20 Das Kuratowskische Nichtkompaktheitsmaß α(A) einer Teilmenge A eines normierten Raumes ist erkl¨art als das Infimum der Zahlen ε > 0, so daß A mit endlich vielen Mengen vom Durchmesser ≤ ε u ¨ berdeckt werden kann. Gibt es kein solches ε, setzt man α(A) = ∞. Da jede Menge denselben Durchmesser wie ihr Abschluß hat, darf man bei Bedarf in dieser Definition annehmen, daß die u ¨berdeckenden Mengen abgeschlossen sind. Offensichtlich ur eine kompakte Menge α(A) = 0, denn die offene ist f¨ ¨ U uberdeckung. Hinter Uberdeckung x∈A ε/2 (x) besitzt eine endliche Teil¨ Definition IV.7.20 steckt die Idee, daß eine Menge A um so weniger kompakt ist, je gr¨ oßer α(A) ist. Beispielsweise ist f¨ ur die abgeschlossene Einheitskugel BX eines unendlichdimensionalen Banachraums α(BX ) = 2: Da stets α(A) ≤ diam(A) gilt (jede Menge u ¨berdeckt sich selbst), gilt trivialerweise α(BX ) ≤ 2. Zum Beweis der Gleichheit ben¨ otigt man ein Resultat aus der algebraischen Topologie, den Satz von Lyusternik-Shnirelman-Borsuk. Wenn man n¨amlich
182
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
annimmt, daß α(BX ) < 2 ist, gibt es endlich viele abgeschlossene Mengen M1 , . . . , Mn vom Durchmesser < 2, so daß BX ⊂ M1 ∪ . . . ∪ Mn . Betrachte nun einen beliebigen n-dimensionalen Unterraum E des unendlichdimensionalen Raums X und setze Mj = Mj ∩ SE . Dann sind M1 , . . . , Mn abgeschlossene Teilmengen der Sph¨ are SE von E, die SE u ¨ berdecken. Der angesprochene Satz von Lyusternik-Shnirelman-Borsuk3 liefert jetzt aber, daß eine dieser Mengen, etwa Mj0 , einen Punkt x0 samt seiner Antipode“ ” −x0 enth¨ alt, und das liefert den Widerspruch 2 = x0 − (−x0 ) ≤ diam(Mj0 ) ≤ diam(Mj0 ) < 2. Es folgen einige Eigenschaften des Nichtkompaktheitsmaßes. Lemma IV.7.21 F¨ ur Teilmengen eines Banachraums X gilt: (a) α(A) ≤ α(B) f¨ ur A ⊂ B; (b) α(A) = α(A); (c) α(A ∪ B) = max{α(A), α(B)}; (d) α(A + B) ≤ α(A) + α(B), wobei A + B = {a + b: a ∈ A, b ∈ B}; (e) α(cA) = |c|α(A) f¨ ur c ∈ K, wobei cA = {ca: a ∈ A}; (f) α(A) = 0 genau dann, wenn A relativkompakt ist; (g) α(A) = α(co A) = α(co A); (h) f¨ ur eine absteigende Folgeabgeschlossener Mengen A1 ⊃ A2 ⊃ ∞ . . . = ∅ mit α(An ) → 0 ist n=1 An kompakt und nicht leer. Beweis. Die Teile (a) bis (e) ergeben sich direkt aus der Definition; f¨ ur (b) beachte die auf Definition IV.7.20 folgende Bemerkung. Weiter folgt (f) aus Satz B.1.7. Wegen (a) und (b) ist f¨ ur den Beweis von (g) nur α(co A) ≤ α(A) ¨ zu zeigen. Sei dazu ε > α(A); dann gibt es eine endliche Uberdeckung 0 n A ⊂ j=1 Mj durch Mengen vom Durchmesser diam(Mj ) ≤ ε0 . Weil die konvexe H¨ ulle einer Menge M wie M hat, denn f¨ ur denselben Durchmesser Konvexkombinationen x = pi=1 λi xi und y = rk=1 μk yk gilt p p r x − y = λ (x − y) λ μ (x − y ) = i i i k i k i=1
≤
p i=1
λi
i=1
r k=1
μk xi − yk ≤
k=1 p i=1
λi
r
μk diam(M ) = diam(M ),
k=1
3 Beweise dieses Satzes findet man z.B. in Granas/Dugundji [2003], S. 91, oder Zeidler [1986], S. 708.
IV.7
183
Fixpunkts¨ atze
darf man M1 , . . . , Mn auch als konvex annehmen. Nun beachte n n co A ⊂ co M1 ∪ Mj ⊂ co M1 ∪ co Mj j=2
j=2
n ⊂ co M1 ∪ co M2 ∪ co Mj ⊂ etc. j=3
ulle C = Wenn f¨ ur konvexe Mengen C1 und C2 sowie deren konvexe H¨ co(C1 ∪ C2 ) α(C) ≤ max{α(C1 ), α(C2 )} (IV.25) gezeigt ist, folgt aus der obigen Darstellung (von unten nach oben gelesen) α(co A) ≤ ε0 und deshalb α(co A) ≤ α(A). Zum Beweis von (IV.25) d¨ urfen wir C1 und C2 als beschr¨ankt voraussetzen, etwa x ≤ R f¨ ur x ∈ C1 ∪ C2 . Jedes x ∈ C kann als x = λx1 + (1 − λ)x2 mit geeigneten x1 ∈ C1 , x2 ∈ C2 und 0 ≤ λ ≤ 1 dargestellt werden (Beweis?). Sei nun N ∈ N beliebig und λk = k/N ; w¨ahle zu λ ein λk mit |λk − λ| ≤ 1/N . Dann kann x als x = λk x1 + (1 − λk )x2 + z mit einem Element z mit z ≤ 2R/N geschrieben werden. Das bedeutet, daß N 2R BX , λk C1 + (1 − λk )C2 + C⊂ N k=0
und eine Anwendung der Teile (a), (d), (c), (e) zusammen mit α(BX ) ≤ 2 liefert 4R α(C) ≤ max λk α(C1 ) + (1 − λk )α(C2 ) + 0≤k≤n N 4R ≤ max{α(C1 ), α(C2 )} + . N Da N ∈ N beliebig war, ist (IV.25) unddamit auch (g) gezeigt. (h) Nach (a) und (f) ist klar, daß n An kompakt ist. Um zu zeigen, daß diese Menge nicht leer ist, w¨ ahle zu n ∈ N Punkte xn ∈ An . Wegen {xn : n ≥ m} ⊂ Am gilt α({xn : n ≥ 1}) = α({xn : n ≥ m}) ≤ α(Am ) → 0, und deshalb ist {xn : n≥ 1} relativkompakt. Aber jeder H¨aufungspunkt der Folge (xn ) liegt in n An ; daher ist diese Menge nicht leer. 2 Die bereits angesprochene Klasse von Abbildungen kann nun wie folgt definiert werden.
184
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Definition IV.7.22 Seien X und Y Banachr¨aume, M ⊂ X und F : M → Y eine stetige Abbildung. Dann heißt F kondensierend (oder verdichtend ), wenn α(F (A)) < α(A) f¨ ur alle beschr¨ ankten A ⊂ M mit α(A) = 0. Beispiel. (c) Offenbar sind jede kompakte Abbildung F1 und jede strikt kontrahierende Abbildung F2 kondensierend; im ersten Fall ist ja α(F1 (A)) = 0 f¨ ur alle beschr¨ ankten Mengen A, und im zweiten gilt α(F2 (A)) ≤ q α(A), wenn q die Kontraktionskonstante bezeichnet (Beweis?). Aber auch F = F1 + F2 ist kondensierend, denn α(F (A)) ≤ α(F1 (A)) + α(F2 (A)) ≤ q α(A) nach Lemma IV.7.21(d). Solche Linearkombinationen z¨ahlen zu den wichtigsten Beispielen kondensierender Abbildungen. F¨ ur kondensierende Abbildungen gilt der folgende Fixpunktsatz. Satz IV.7.23 (Fixpunktsatz von Darbo-Sadovski˘ı) Sei X ein Banachraum, und sei C ⊂ X nicht leer, abgeschlossen, beschr¨ankt und konvex sowie F : C → C kondensierend. Dann besitzt F einen Fixpunkt. Beweis. Die Idee des Beweises ist es, eine kompakte konvexe Teilmenge C von C zu finden, auf die der Schaudersche Fixpunktsatz angewandt werden kann. Zu diesem Zweck fixieren wir einen Punkt p ∈ C und betrachten das System K aller abgeschlossenen konvexen Teilmengen K von C, die p enthalten und F -invariant sind (d.h. F (K) ⊂ K); z.B. ist C ∈ K . Es sei C der Durchschnitt aller K ∈ K . Als Schnitt abgeschlossener und konvexer Mengen ist C nat¨ urlich auch abgeschlossen und konvex, und C ist nicht leer, denn p ∈ C . Da f¨ ur alle K ∈ K aus C ⊂ K auch F (C ) ⊂ F (K) ⊂ K folgt, schließen wir F (C ) ⊂ C ; mithin ist C das kleinste Element von K . Um den Schauderschen Fixpunktsatz auf die Einschr¨ankung F |C anwenden zu k¨ onnen, m¨ ussen wir jetzt noch die Kompaktheit von C zeigen. Dazu beobachten wir, daß C := co(F (C ) ∪ {p}) = C ist; hier folgt C ⊂ C aus den obigen Eigenschaften von C , und andererseits ist C ∈ K (die F -Invarianz von C ergibt sich wegen C ⊂ C aus F (C ) ⊂ F (C ) ⊂ C ) und deshalb C ⊂ C . Aus Lemma IV.7.21 erh¨alt man jetzt α(C ) = α(C ) = α(F (C ) ∪ {p}) = α(F (C )), und da F kondensierend ist, muß α(C ) = 0 und deswegen C kompakt sein.
IV.8 Aufgaben
185
Der Schaudersche Fixpunktsatz liefert daher einen Fixpunkt f¨ ur F |C und deshalb erst recht einen Fixpunkt f¨ ur F . 2 Formal schließt der Darbo-Sadovski˘ısche Fixpunktsatz sowohl den Banachschen als auch den Schauderschen als Spezialf¨alle ein (ersteren modulo der Voraussetzung u ¨ ber den Definitionsbereich), aber letzterer ging ja im Beweis ein. Das n¨ achste Korollar kann man unter demselben Vorbehalt als Kombination dieser beiden S¨ atze verstehen. Korollar IV.7.24 (Fixpunktsatz von Krasnoselski˘ı) Seien X ein Banachraum und C ⊂ X abgeschlossen, konvex, beschr¨ankt und nicht leer. Ferner seien F1 : C → X kompakt und F2 : C → X eine strikte Kontraktion, und F := F1 + F2 bilde C in C ab. Dann besitzt F einen Fixpunkt. Beweis. In Beispiel (c) wurde gezeigt, daß F kondensierend ist.
IV.8
2
Aufgaben
Aufgabe IV.8.1 (Das Banach-Mazur- oder Choquet-Spiel) ¨ Sei T ein topologischer Raum, der, um unliebsame Uberraschungen zu vermeiden, hier wie im folgenden stillschweigend als nicht leer angenommen wird. Zwei Spieler, A und B, spielen folgendes Spiel: Abwechselnd wird eine nichtleere offene Menge gew¨ ahlt, die in der soeben vom Kontrahenten gew¨ ahlten Menge liegen muß; den ersten Zug macht A und hat dabei die freie Wahl. Bei einem Spieldurchgang entsteht so eine absteigende Folge offener nichtleerer Teilmengen von Vn = ∅, gewinnt B, andernfalls A. Wir sagen, T : V1 ⊃ V2 ⊃ V3 ⊃ . . . . Falls daß B eine Gewinnstrategie hat, wenn eine Abbildung Φ: τ → τ auf der Familie τ aller nichtleeren offenen Mengen existiert, so daß stets Φ(V ) ⊂ V gilt und f¨ ur , V , V , . . . ∈ τ mit V ⊃ V = Φ(V ) ⊃ V ⊃ V = Φ(V ) ⊃ . . . der jede Folge V 1 3 5 1 2 1 3 4 3 ∞ Schnitt n=1 Vn nicht leer ist. (a) Ist T ein vollst¨ andiger metrischer Raum, so hat B eine Gewinnstrategie. (b) Auch in lokalkompakten Hausdorffr¨ aumen hat B eine Gewinnstrategie. (c) Ist T ein topologischer Raum, in dem B eine Gewinnstrategie hat, so gilt in T der Satz von Baire. Aufgabe IV.8.2 Sei P der Vektorraum aller Polynome auf R und . eine Norm auf P. Dann ist (P, . ) kein Banachraum. (Tip: Bairescher Kategoriensatz!) Aufgabe IV.8.3 Es sei f : [0, ∞) → R eine stetige Funktion, so daß f¨ ur alle t ≥ 0 die Bedingung limn→∞ f (nt) = 0 gilt. Dann gilt auch limt→∞ f (t) = 0. Aufgabe IV.8.4 Eine Teilmenge M eines metrischen (oder auch topologischen) ahlbarer Schnitt offener Raums heißt Gδ -Menge (bzw. Fσ -Menge), wenn M als abz¨ Mengen (bzw. als abz¨ ahlbare Vereinigung abgeschlossener Mengen) geschrieben werden kann.
186
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
(a) Q ist keine Gδ -Menge in R. (Tip: Benutze den Satz von Baire!) (b) Sei f : R → R eine Funktion. Dann ist {t ∈ R: f ist stetig bei t}, die Menge der Stetigkeitspunkte, eine Gδ -Menge. (c) Es gibt keine Funktion f : R → R, die bei allen rationalen Zahlen stetig, aber bei allen irrationalen Zahlen unstetig ist. Wohl aber gibt es eine Funktion f : R → R, die bei allen irrationalen Zahlen stetig, jedoch bei allen rationalen Zahlen unstetig ist. Aufgabe IV.8.5 (Funktionen der 1. Baireschen Klasse) Sei (fn ) eine Folge von stetigen Funktionen von R nach R, so daß limn→∞ fn (t) =: f (t) f¨ ur alle t ∈ R existiert. (Man sagt, eine Funktion geh¨ ore zur 1. Baireschen Klasse, wenn sie punktweiser Limes einer Folge stetiger Funktionen ist.) Zeige, daß f mindestens einen Stetigkeitspunkt besitzt. Anleitung: (a) Seien ω(t, δ) = sup{|f (s1 ) − f (s2 )|: |si − t| ≤ δ}, ω(t) = inf δ>0 ω(t, δ) und ur alle ε > 0 ist dann Aε offen. Aε = {t ∈ R: ω(t) < ε}. F¨ (b) Aε ist auch stets dicht. Um das zu zeigen, nimm an, daß Bε := R\Aε ein abgeschlossenes Intervall J positiver L¨ ange enth¨ alt. Betrachte dann En =
,
{t ∈ J: |fi (t) − fj (t)| ≤ ε/5.}
i,j≥n
Schließe, daß f¨ ur ein n0 die Menge En0 ein nichttriviales Intervall I ur alle t ∈ I gilt, und enth¨ alt. Nun folgere, daß |fn0 (t) − f (t)| ≤ ε/5 f¨ leite den Widerspruch I ∩ Aε = ∅ ab. (c) Zum Schluß wende den Satz von Baire an. Gib mit der Aussage dieser Aufgabe einen neuen Beweis von Korollar IV.2.5. Aufgabe IV.8.6 p in q . (a) F¨ ur 1 ≤ pp < q ≤ ∞ ist von 1. Kategorie q ist eine echte Teilmenge von . (b) 1≤p 1 mit F (x) = λx. (b) Falls F (SX ) ⊂ BX , hat F einen Fixpunkt.
192
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
Aufgabe IV.8.36 Finde eine stetige Abbildung F : 2 → R, die auf der Einheitskugel unbeschr¨ ankt ist. (Hinweis: en − em ≥ 1.) Aufgabe IV.8.37 Sei X ein Banachraum, K ⊂ X kompakt sowie F : BX → X eine kompakte Abbildung. Dann ist auch (Id − F )−1 (K) kompakt. Aufgabe IV.8.38 Seien X und Y Banachr¨ aume und F : BX → Y eine kompakte Abbildung. Dann gibt es eine Folge (Fn ) von kompakten Abbildungen mit ur alle n), die auf BX endlichdimensionalem Bild (d.h. dim lin Fn (BX ) < ∞ f¨ gleichm¨ aßig gegen F konvergiert. Aufgabe IV.8.39 Sei f : [0, 1] × R → R stetig und Φ: C[0, 1] → C[0, 1] der durch (Φϕ)(t) = f (t, ϕ(t)) definierte Superpositionsoperator. Zeige, daß Φ stetig ist und beschr¨ ankte Mengen auf beschr¨ ankte Mengen abbildet. Unter welchen Bedingungen an f ist Φ kompakt? Aufgabe IV.8.40 (Leray-Schauder-Prinzip) Sei F : X → X eine kompakte Abbildung auf einem Banachraum. Es existiere ur eine Zahl r > 0 mit folgender Eigenschaft: Falls 0 < t < 1 und x0 = t F (x0 ) f¨ ein x0 ∈ X, dann ist notwendig x0 ≤ r. (Beachte, daß nicht vorausgesetzt ist, daß x = t F (x) wirklich eine L¨ osung besitzt.) Dann hat F einen Fixpunkt. (Anleitung: Betrachte die durch G(x) = F (x) f¨ ur F (x) ≤ 2r und G(x) = 2r F (x)/F (x) sonst definierte Abbildung.) Aufgabe IV.8.41 Sei X ein Banachraum, und sei F : BX → X eine kompakte Abbildung. (a) Dann hat F einen Fixpunkt, oder es existieren ein x ∈ SX und ein λ > 1 mit F (x) = λx. (b) Falls F (SX ) ⊂ BX , hat F einen Fixpunkt. Aufgabe IV.8.42 Sei C eine nicht leere, abgeschlossene, konvexe, beschr¨ ankte Teilmenge eines Banachraums, und sei ϕ: [0, ∞) → [0, ∞) eine stetige Funktion mit ϕ(r) < r f¨ ur alle r > 0. Es sei F : C → C eine Abbildung, die F (x) − F (y) ≤ ϕ(x − y)
∀x, y ∈ C
erf¨ ullt. Zeige, daß F einen Fixpunkt besitzt.
IV.9
Bemerkungen und Ausblicke
Die Resultate dieses Kapitels geh¨ oren zu den wichtigsten und n¨ utzlichsten S¨ atzen der Funktionalanalysis; ebenso z¨ ahlt die Beweismethode des Kategorienarguments zu den elegantesten Hilfsmitteln der abstrakten Analysis. ¨ (Ubrigens bilden die kompakten topologischen Hausdorffr¨aume eine weitere Raumklasse, f¨ ur die der Bairesche Kategoriensatz gilt.) In gewisser Weise
IV.9
Bemerkungen und Ausblicke
193
¨ k¨ onnen Mengen 1. Kategorie als das topologische Aquivalent zu Mengen ¨ vom Maß Null angesehen werden. Uber Gemeinsamkeiten und Unterschiede dieser Konzepte gibt Oxtoby [1980] Auskunft. Die Existenz stetiger, aber nirgends differenzierbarer Funktionen kann auch wahrscheinlichkeitstheoretisch begr¨ undet werden, weil ein Pfad der Brownschen Bewegung mit Wahrscheinlichkeit 1 diese Eigenschaften besitzt (siehe Bauer [1991], S. 424). Nat¨ urlich kann man solche Funktionen auch konkret hinschreiben; das einfachste Beispiel einer ∞stetigen nirgends differenzierbaren Funktion auf R scheint durch f (t) = n=0 2−n ϕ(2n t) gegeben zu sein, wo ϕ zun¨ achst auf [−1, 1] durch durch t → |t| definiert ist und dann periodisch mit der Periode 2 auf R fortgesetzt wird. Die abstrakten Existenzbeweise liefern jedoch, daß so gut wie jede“ stetige Funktion an ” keiner Stelle differenzierbar ist – eine sicherlich u ¨berraschende Konsequenz! Theorem IV.2.1 – in diesem und vielen anderen Texten Satz von BanachSteinhaus genannt – wurde zuerst von Hahn (Monatshefte f. Math. u. Physik 32 (1922) 3–88) f¨ ur Funktionale und von Banach (Fund. Math. 3 (1922) 133–181) f¨ ur Operatoren bewiesen, und zwar mit der Methode des gleitenden Buckels. 1927 zeigten Banach und Steinhaus (Fund. Math. 9 (1927) 50– 61) eine Versch¨ arfung, das Prinzip der Verdichtung der Singularit¨aten, siehe Aufgabe IV.8.20. Offenbar hat Saks vorgeschlagen, den Beweis statt mit der Buckelmethode mit einem Kategorienargument zu f¨ uhren (vgl. Dieudonn´e [1981], S. 141), und so hielt die Bairesche Technik in die Funktionalanalysis Einzug. Korollar IV.2.5 findet sich mit dem heutigen Beweis ebenfalls in dieser Arbeit. Auch der Satz von der offenen Abbildung wurde von Banach zun¨achst ohne einen Kategorienschluß gezeigt (Studia Math. 1 (1929) 223–239) – in der Tat beweist er das dazu ¨ aquivalente Korollar IV.3.4 –, indem er den Satz von Hahn-Banach und Korollar IV.2.3 benutzt und en passant den Satz vom abgeschlossenen Bild zeigt. Der heute u ¨ bliche Kategorienbeweis wurde von Schauder (Studia Math. 2 (1930) 1–6) entdeckt. Der Satz vom abgeschlossenen Graphen stammt ebenfalls von Banach und findet sich erstmals in seinen Op´erations Lin´eaires, S. 41. Der Begriff des abgeschlossenen Operators geht hingegen auf von Neumann (Math. Ann. 102 (1929) 49–131) zur¨ uck. Es ist schon im Text bemerkt worden, daß die Haupts¨atze dieses Kapitels deutlich machen, warum es so schwierig ist, auf Banachr¨aumen definierte, aber unstetige Funktionale und Operatoren zu konstruieren. In den Aufgaben II.5.2 und IV.8.21(b) etwa wurde eine Basis des zugrundeliegenden Vektorraums benutzt und damit implizit das Zornsche Lemma verwendet. Es stellt sich die Frage, ob dieses Hilfsmittel wirklich notwendig ist. J. D. M. Wright diskutiert in seinem Artikel Functional analysis for the ” practical man“ (in: K. D. Bierstedt, B. Fuchssteiner (Hg.), Functional Analysis, North Holland 1977, S. 283–290) Modelle der Mengenlehre, in denen das Zornsche Lemma nicht mehr gilt, aber die (in unserem Standardmo-
194
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
dell der Mengenlehre falsche) Aussage Jede lineare Abbildung zwischen ” Banachr¨ aumen ist stetig“ ein beweisbarer Satz wird. Auch die Anwendungen auf die Theorie der Fourierreihen waren Banach und seiner Schule bereits bekannt. Fej´er bewies seinen Satz (Satz IV.2.11) im Jahre 1900, freilich ohne die Korovkinschen S¨atze zu benutzen, die erst 1953 bewiesen wurden. Der Beweis daf¨ ur im Text folgt H. Bauer, Amer. Math. Monthly 85 (1978) 632–647; siehe auch Uchiyamas Note in Amer. Math. Monthly 110 (2003) 334–336. Die elementare Theorie der Fourierreihen ist gl¨ anzend bei K¨ orner [1988] beschrieben; der Klassiker der Theorie der trigonometrischen Reihen ist Zygmunds gleichnamige Monographie (Zygmund [1959]). Der im Text erw¨ ahnte Satz von Carleson erschien in Acta Math. 116 (1966) 135–157. Kurze Zeit darauf u ¨ bertrug Hunt den Beur p > 1 und zeigte, daß auch f¨ ur solche Funktioweis auf Lp -Funktionen f¨ nen die Fourierreihe fast u ¨ berall konvergiert; siehe dazu Jørsboe/Mejlbro [1982] oder Arias de Reyna [2002]. F¨ ur p = 1 gilt diese Aussage jedoch nicht, denn Kolmogorov hat 1926 das bemerkenswerte Gegenbeispiel einer integrierbaren Funktion konstruiert, deren Fourierreihe an keinem einzigen Punkt konvergiert (Zygmund [1959], vol. I, S. 310). In Satz IV.6.2 wurde festgestellt, daß endlichdimensionale Unterr¨aume komplementiert sind. Hier ist es von Interesse, Projektionen von minimaler Norm zu finden. Z.B. existiert eine Projektion Pn mit Pn ≤ c log n von C2π auf den Unterraum aller trigonometrischen Polynome vom Grad ≤ n, wo c eine Konstante ist (Wojtaszczyk [1991], S. 124). Sch¨arfer als Satz IV.6.2 ist die Aussage des Satzes von Kadets/Snobar aus dem Jahr 1971, wonach f¨ ur einen beliebigen n-dimensionalen Unterraum stets eine √ Projektion P mit P ≤ n existiert; zum Beweis siehe wieder Wojtasz√ czyk atzung kann noch weiter zu P ≤ n − √ [1991], S. 116. Diese Absch¨ c/ n, c eine universelle Konstante, verbessert werden (K¨onig/TomczakJaegermann, Trans. Amer. Math. Soc. 320 (1990) 799–823). Satz IV.6.5 stammt von Phillips (Trans. Amer. Math. Soc. 48 (1940) 516–541), der dargestellte Beweis jedoch von Whitley (Amer. Math. Monthly 73 (1966) 285–286). Lemma IV.6.6 geht auf Sierpi´ nski zur¨ uck (Monatshefte f. Math. u. Physik 35 (1928) 239–242). In Aufgabe IV.8.25 war zu zeigen, daß ein zu ∞ isomorpher Unterraum stets komplementiert ist. Im separablen Fall gilt folgendes Analogon (siehe Lindenstrauss/Tzafriri [1977], ¨ S. 106, oder den Ubersichtsartikel von Cabello S´ anchez, Castillo und Yost in Extracta Math. 15 (2000) 391–420): • (Satz von Sobczyk) Ein zu c0 isomorpher Unterraum eines separablen Banachraums ist komplementiert. Beispiele unkomplementierter Teilr¨ aume in p und Lp [0, 1], 1 < p < ∞, p = 2, werden in K¨ othe [1966], S. 431ff., vorgestellt. Dar¨ uber hinaus
IV.9
Bemerkungen und Ausblicke
195
weiß man heute, daß jeder unendlichdimensionale komplementierte Teilraum von p zu p isomorph ist. Dies hat Pelczy´ nski 1960 f¨ ur p < ∞ gezeigt, und Lindenstrauss hat 1967 den Fall p = ∞ hinzugef¨ ugt, siehe Lindenstrauss/Tzafriri [1977], S. 53–57. Im allgemeinen braucht ein Banachraum keine nichttrivialen komplementierten Unterr¨aume zu besitzen, denn Gowers und Maurey haben k¨ urzlich (J. Amer. Math. Soc. 6 (1993) 851–874) ein spektakul¨ ares Beispiel eines Banachraums X produziert, bei dem bei jeder Zerlegung X = U ⊕ V in abgeschlossene Unterr¨aume entweder U oder V endlichdimensional ist. In der anderen Richtung ist der auf S. 252 zitierte Satz von Lindenstrauss und Tzafriri zu beachten, auf den ¨ bereits an dieser Stelle hingewiesen sei. Uber komplementierte Unterr¨aume ¨ sind Ubersichtsartikel von Mascioni in Expositiones Math. 7 (1989) 3–47 und von Plichko und Yost in Extracta Math. 15 (2000) 335–371 erschienen. Es gibt wohl nur wenige mathematische S¨ atze mit einem derart g¨ unstigen Preis-Leistungs-Verh¨ altnis wie den Banachschen Fixpunktsatz; bei fast trivialem Beweis ist er praktisch universell anwendbar, vom Newtonverfahren bis zu den Fraktalen. Urspr¨ unglich stammt der Satz aus Banachs Dissertation (Fund. Math. 3 (1922) 133–181), wo er unter der Annahme formuliert ist, daß M eine abgeschlossene Teilmenge eines Banachraums ist. Mit diesem Satz hat Banach der im 19. Jahrhundert von Cauchy, Liouville, Picard und anderen entwickelten Methode der sukzessiven Approximationen einen systematischen Rahmen gegeben. Etwas sp¨ater hat Cacciopoli beobachtet, daß der Banachsche Satz bei gleichem Beweis auch auf abstrakten vollst¨ andigen metrischen R¨ aumen funktioniert (Atti Accad. Naz. Lincei Rend., Ser. 6, 11 (1930) 794–799), weswegen manche Autoren vom Satz von Banach-Cacciopoli sprechen. [Tats¨ achlich ist diese Version gar nicht allgemeiner: Ist (M, d) ein vollst¨ andiger metrischer Raum und C b (M ) der Banachraum der stetigen beschr¨ ankten Funktionen auf M mit der Supremumsnorm sowie fx die Funktion y → d(x, y) auf M , so ist bei festem x0 ∈ M die Abbildung x → fx − fx0 eine Isometrie von M auf eine abgeschlossene Teilmenge von C b (M ).] Es ist kein Wunder, daß es zu einem solchen Satz Hunderte von Variationen gibt, wovon aber nur wenige tats¨ achlich von Bedeutung sind. Dazu z¨ahlt sicher der Fixpunktsatz von Weissinger, der unter der Voraussetzung, daß atzungen der Form d(F n (x), F n (y)) ≤ αn d(x, y) mit die Iterierten F n Absch¨ ugen, dieselbe Aussage wie der Banachsche Fixpunktsatz n αn < ∞ gen¨ macht; er wird auch genauso bewiesen. Eine weitere, auf den ersten Blick wenig naheliegende Variante setzt die Existenz einer positiven Funktion ϕ mit d(x, F (x)) ≤ ϕ(x) − ϕ(F (x)) ∀x ∈ M (IV.26) voraus. (F¨ ur eine strikte Kontraktion kann man ϕ(x) = d(x, F (x))/(1 − q) w¨ ahlen.) Der Fixpunktsatz von Caristi besagt dann, daß eine beliebige Selbstabbildung F eines vollst¨ andigen metrischen Raums, ob stetig oder
196
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
nicht, die (IV.26) mit einer positiven stetigen Funktion ϕ erf¨ ullt, einen Fixpunkt besitzt. Dieser Satz hat einige u ¨ berraschende Anwendungen gefunden. Der Fixpunktsatz von Browder, G¨ ohde und Kirk wurde von diesen Autoren unabh¨ angig voneinander im Jahre 1965 gefunden; Browder hat mit diesem Satz die Existenz periodischer L¨ osungen gewisser Differentialgleichungen bewiesen. Kirks Version ist sogar noch etwas allgemeiner als die im Text. Er behandelt abgeschlossene beschr¨ankte konvexe Mengen C mit normaler Struktur. Das bedeutet folgendes: In jeder konvexen Teilmenge C von C, die mindestens zwei Elemente besitzt, gibt es einen Punkt x0 mit supy∈C x0 − y < diam(C ). In einem gleichm¨aßig konvexen Raum haben alle solche Mengen C normale Struktur, aber in c0 hat {(sn ) ∈ c0 : ur alle n} keine normale Struktur. Der Satz von Kirk besagt, 0 ≤ sn ≤ 1 f¨ daß jede nichtexpansive Abbildung F : C → C einen Fixpunkt hat, wenn die abgeschlossene beschr¨ ankte konvexe Menge C normale Struktur hat und jede Folge in C eine schwach konvergente Teilfolge besitzt ( C ist schwach ” kompakt“). Unser Beweis von Theorem IV.7.13 folgt Ideen von Goebel (Michigan Math. J. 16 (1969) 381–383). Eines der gr¨ oßten offenen Probleme in der Theorie der nichtexpansiven Abbildungen ist, ob der Satz von BrowderG¨ ohde-Kirk tats¨ achlich in jedem reflexiven Banachraum gilt und ob umgekehrt ein Raum, in dem er gilt, notwendig reflexiv ist. Maurey bzw. Dowling und Lennard haben gezeigt, daß f¨ ur Unterr¨ aume von L1 beide Fragen positiv zu beantworten sind. Die Idee, statt der nichtexpansiven Abbildung F die Abbildung G = 1 (Id + F ) zu iterieren, stammt von Krasnoselski˘ı (Uspekhi Mat. Nauk 10(1) 2 (1955) 123–127), der gezeigt hat, daß auf einem gleichm¨aßig konvexen Raum X f¨ ur eine kompakte nichtexpansive Abbildung F bei beliebigem Startwert die durch xn+1 = G(xn ) definierte Folge gegen einen Fixpunkt von F konvergiert; unser Korollar IV.7.8 ist der Spezialfall, daß X ein Hilbertraum ist. Sp¨ ater hat Ishikawa (Proc. Amer. Math. Soc. 59 (1976) 65–71) diese Aussage f¨ ur einen beliebigen Banachraum bewiesen; aber auf die Kompaktheit von F kann man nicht verzichten, selbst nicht in 2 , wie Genel und Lindenstrauss mittels eines raffinierten Gegenbeispiels gezeigt haben (Israel J. Math. 22 (1975) 81–86). Satz IV.7.6 u ¨ ber die schwache Konvergenz dieser Folge stammt von Opial (Bull. Amer. Math. Soc. 73 (1967) 591–597); er bleibt auch in gewissen gleichm¨aßig konvexen R¨aumen wie ultig. Der Beweis im Text l¨aßt sich von Reinermanns Lp (μ), 1 < p < ∞, g¨ Argumenten leiten (Arch. Math. 20 (1969) 59–64), der auch allgemeinere Iterationsverfahren betrachtet. Ein anderes konstruktives Verfahren besteht in der Berechnung der Mit telwerte zn = n1 nk=1 F k (x); hier kann man die schwache Konvergenz der Folge (zn ) gegen einen Fixpunkt der nichtexpansiven Abbildung F z.B. auf Lp -R¨ aumen, 1 < p < ∞, zeigen.
IV.9
197
Bemerkungen und Ausblicke
Der Begriff der gleichm¨ aßigen Konvexit¨ at wurde von Clarkson eingef¨ uhrt (Trans. Amer. Math. Soc. 40 (1936) 396–414), der auch die gleichm¨aßige Konvexit¨ at der Lp -R¨ aume gezeigt hat. Sein Argument fußt auf den Clarksonschen Ungleichungen (1/p + 1/q = 1) f f
q + g + f 2 p p + g + f 2 p
q f pp + g pp q/p − g ≤ 2 p 2 p p f p + g pp − g ≤ 2 p 2
f¨ ur 1 < p ≤ 2, f¨ ur 2 ≤ p < ∞,
die f¨ ur p = q = 2 in die Parallelogrammgleichung“ (IV.18) u ¨bergehen. ” Ein einfacher Beweis der gleichm¨ aßigen Konvexit¨at von Lp , der auch die korrekte Gr¨ oßenordnung von δLp wiedergibt, n¨amlich p−1 2 ε + o(ε2 ) 8 1 p δLp (ε) = ε + o(εp ) p2p
δLp (ε) =
f¨ ur 1 < p ≤ 2, f¨ ur 2 ≤ p < ∞,
stammt von Meir (Illinois J. Math. 28 (1984) 420–424); der Beweis im Text geht auf McShane zur¨ uck. Ein weiterer Beweis der gleichm¨aßigen Konveaume wurde k¨ urzlich von Hanche-Olsen ver¨offentlicht (Proc. xit¨ at der Lp -R¨ Amer. Math. Soc. 134 (2006) 2359–2362). Die Reflexivit¨at gleichm¨aßig konvexer R¨ aume wurde 1938 unabh¨ angig voneinander von Milman und Pettis gefunden, unser Beweis in Kapitel VIII ist der von Ringrose (J. London Math. Soc. 34 (1959) 92). offentlichte seinen Fixpunktsatz im Jahre 1912; jedoch hatBrouwer4 ver¨ ten Poincar´e (1886) und der lettische Mathematiker Bohl (1904) bereits vorher Resultate bewiesen, die sich a posteriori als ¨aquivalent zum Brouwerschen Fixpunktsatz erwiesen haben. Der Beweis des Brouwerschen Satzes ist alles andere als offensichtlich, und es gibt verschiedene Zug¨ange. Analytische Beweise findet man z.B. in Dunford/Schwartz [1958], S. 467–470, Ruˇziˇcka [2004], S. 11–17, und Heusers Lehrbuch der Analysis, Teil 2 (Teubonigsberger bringt in der 4. Auflage seiner Analysis 2 ner 1981), § 2285 . K¨ (Springer 2002) in Abschnitt 13.9 den Beweis, der auf dem Differentialformenkalk¨ ul basiert, und Bollob´ as [1990] in Kapitel 15 den kombinatorischen Beweis, dessen Grundlage das Spernersche Lemma ist. Schließlich findet man in B¨ uchern u ¨ ber algebraische Topologie wie z.B. Rotmans An Introduction To Algebraic Topology (Springer 1988) eine Herleitung, die die Maschinerie der Homologietheorie verwendet; in der Tat ist in diesem Buch 4 Die
Mathematiker L.E.J. Brouwer und F. Browder sind zu unterscheiden! Beweis erscheint auch in der 1. Auflage von Heuser [1992] aus dem Jahre 1975 sowie in Noten von Milnor (Amer. Math. Monthly 85 (1978) 521–524), Rogers (Amer. Math. Monthly 87 (1980) 525–527) und Gr¨ oger (Math. Nachr. 102 (1981) 293–295). 5 Dieser
198
IV.
Die Haupts¨ atze f¨ ur Operatoren auf Banachr¨ aumen
der Brouwersche Fixpunktsatz eine wesentliche Motivation, die Homologietheorie zu entwickeln. All diesen Beweisen ist gemein, daß sie nicht konstruktiv sind. Der erste konstruktive Beweis stammt von Scarf (SIAM J. Appl. Math. 15 (1967) 1328–1343), der mit einem kombinatorischen Algorithmus zu jedem ε > 0 Punkte xε mit F (xε ) − xε ≤ ε, also approximative Fixpunkte, findet. Dieser Algorithmus wurde von Eaves mittels Homotopiemethoden verbessert (Math. Programming 3 (1972) 1–22); ein anderer Algorithmus, der auf analytischen Methoden beruht, wurde von Kellogg, Li und Yorke (SIAM J. Num. Anal. 13 (1976) 473–483) vorgeschlagen. Der Schaudersche Fixpunktsatz stammt aus seiner Arbeit in Studia Math. 2 (1930) 171–180. Fast gleichzeitig hatte Cacciopoli (loc. cit.) einen Spezialfall entdeckt und damit den Existenzsatz von Peano neu bewiesen. Wenige Jahre sp¨ ater dehnte Tikhonov den Schauderschen Satz (in der Version von Theorem IV.7.16) auf lokalkonvexe Hausdorffr¨aume (siehe Kapitel VIII) aus; aber erst vor kurzem konnte Cauty (Fund. Math. 170 (2001) 231–246) zeigen, daß der Satz sogar in allen hausdorffschen topologischen Vektorr¨ aumen gilt, was bereits von Schauder vermutet worden war, aber bis dato allen Beweisversuchen getrotzt hatte. Im Unterschied zum Banachschen Fixpunktsatz folgt beim Schauderschen nat¨ urlich nicht die Eindeutigkeit des Fixpunkts. Browder hat jedoch 1970 die Eindeutigkeit unter der Voraussetzung bewiesen, daß C der Abschluß einer offenen konvexen beschr¨ ankten Menge in einem komplexen Banachraum und die kompakte Abbildung F : C → C analytisch ist und keinen Fixpunkt auf ∂C besitzt. Wie in der Funktionentheorie kann man analytisch hier als im komplexen Sinn Fr´echet-differenzierbar (Definition III.5.1) erkl¨ aren. Man kann die Brouwerschen und Schauderschen S¨atze auch als Nebenprodukt der Theorie des Abbildungsgrads erhalten, die von Brouwer im ´ endlichdimensionalen und von Leray und Schauder (Ann. Sci. Ecole Norm. Sup. 51 (1934) 45–78) im unendlichdimensionalen Fall entwickelt worden ist. Es sei X ein Banachraum, O ⊂ X offen und beschr¨ankt sowie y ∈ X; ferner sei F : O → X eine kompakte Abbildung und G := Id−F (im endlichdimensionalen Fall ist G also einfach eine stetige Abbildung auf O). Leray und Schauder haben gezeigt, daß man jedem solchen Tripel mit y ∈ / G(∂O) auf genau eine Weise eine ganze Zahl d(G, O, y), den Abbildungsgrad, zuordnen kann, so daß gelten: (1) d(Id, O, y) = 1 f¨ ur y ∈ O. (2) d(G, O, y) = d(G, O1 , y) + d(G, O2 , y), falls O1 und O2 disjunkte offene Teilmengen von O sind und y ∈ / G(O \ (O1 ∪ O2 )) ist. (3) Ist h: [0, 1] × O → X kompakt und Gt (x) = x − h(t, x), so gilt d(G0 , O, y) = d(G1 , O, y), falls y ∈ / t Gt (∂O). Dann folgt, daß die Gleichung G(x) = y in O l¨osbar ist, wenn d(G, O, y) = 0
IV.9
Bemerkungen und Ausblicke
199
ist; im Fall y = 0 geht es also um die Fixpunkte von F . Die Abbildungsgradtheorie ist, insbesondere dank der Homotopieinvarianz (3), ein m¨achtiges Werkzeug zur L¨ osung nichtlinearer Gleichungen. Theorem IV.7.23 wurde 1955 von Darbo f¨ ur Abbildungen mit α(F (A)) ≤ q α(A) f¨ ur ein q < 1 bewiesen; der allgemeine Fall kondensierender Abbildungen stammt aus Sadovski˘ıs Arbeit in Russian Math. Surveys 27(1) (1972) 85–155, die viele Beispiele und Anwendungen enth¨alt. Der Beweis im ¨ Text folgt V¨ aths Uberblicksartikel in Jahresber. DMV 106 (2004) 129–147. Sadovski˘ı hat in seiner Arbeit auch eine Abbildungsgradtheorie f¨ ur kondensierende Abbildungen entworfen. Viele singul¨ are Integraloperatoren f¨ uhren u ¨ brigens auf kondensierende Operatoren, die weder kompakt noch strikt kontraktiv sind. Dann ist weder der Schaudersche noch der Banachsche Fixpunktsatz anwendbar, und der Satz von Darbo-Sadovski˘ı ist das einzige Mittel, das weiterhilft. Konkrete Beispiele solcher Operatoren werden von Appell, de Pascale und Zabre˘ıko (Z. Anal. Anwend. 6 (1987) 193–208) diskutiert. Außer dem Kuratowskischen Nichtkompaktheitsmaß ist das Hausdorffsche Nichtkompaktheitsmaß β von Bedeutung; man definiert β(A), indem man in Definition IV.7.20 Mengen vom Durchmesser ≤ ε“ durch Kugeln ” ” vom Radius ≤ ε“ ersetzt. Es ist also stets β(A) ≤ α(A) ≤ 2β(A). In diesem Kontext gilt der Satz von Darbo-Sadovski˘ı entsprechend. Die Monographien von Aksoy/Khamsi [1990], Goebel/Kirk [1990], Granas/Dugundji [2003] und Zeidler [1986] informieren umfassend aus sehr unterschiedlichen Blickwinkeln u ¨ ber fast alle Aspekte der Fixpunkttheorie.
Kapitel V
Hilbertr¨aume
V.1
Definitionen und Beispiele
Hilbertr¨ aume sind Banachr¨ aume, die – wie der Kn – als zus¨atzliche Struktur ein Skalarprodukt zulassen. Sie geh¨ oren zu den wichtigsten R¨aumen der Analysis. Definition V.1.1 Sei X ein K-Vektorraum. Eine Abbildung . , . : X ×X → K heißt Skalarprodukt (oder inneres Produkt ), falls (a) x1 + x2 , y = x1 , y + x2 , y ∀x1 , x2 , y ∈ X, (b) λx, y = λx, y ∀x, y ∈ X, λ ∈ K, (c) x, y = y, x ∀x, y ∈ X, (d) x, x ≥ 0 ∀x ∈ X, (e) x, x = 0 ⇔ x = 0. Eine unmittelbare Konsequenz von (a), (b) und (c) ist (a ) x, y1 + y2 = x, y1 + x, y2 ∀x, y1 , y2 ∈ X, (b ) x, λy = λx, y ∀x, y ∈ X, λ ∈ K. F¨ ur K = R ist . , . also bilinear, f¨ ur K = C m¨ ussen Skalare aus dem zweiten Faktor konjugiert komplex herausgezogen werden; man nennt . , . sesquilinear (sesqui = 1 12 ). Die Eigenschaften (d) und (e) zusammen nennt man positive Definitheit des Skalarproduktes, nach (c) ist stets x, x ∈ R. Wie in der linearen Algebra (oder Analysis) zeigt man die folgende wichtige Ungleichung. Satz V.1.2 (Cauchy-Schwarzsche Ungleichung) Ist X ein Vektorraum mit Skalarprodukt . , . , so gilt |x, y|2 ≤ x, x · y, y
∀x, y ∈ X.
Gleichheit gilt genau dann, wenn x und y linear abh¨angig sind.
202
V.
Hilbertr¨ aume
Beweis. Sei λ ∈ K beliebig. Dann gilt 0 ≤ x + λy, x + λy
(V.1)
= x, x + λy, x + x, λy + λy, λy = x, x + λx, y + λx, y + |λ|2 y, y. Setze nun λ = − x,y alt y,y , falls y = 0 ist. Man erh¨ 0≤
. x, y |x, y|2 |x, y|2 |x, y|2 x, y y, x − y = x, x − − + x− y, y y, y y, y y, y y, y
und daraus die Cauchy-Schwarzsche Ungleichung, die im u ur y = 0 ¨ brigen f¨ trivial ist. Gleichheit gilt genau dann, wenn Gleichheit in (V.1) gilt, was den Zusatz zeigt. 2 Setzt man zur Abk¨ urzung x = x, x1/2 , so lautet Satz V.1.2 |x, y| ≤ x · y . Daß die Bezeichnung x gerechtfertigt ist, zeigt das n¨achste Lemma. Lemma V.1.3 x → x := x, x1/2 definiert eine Norm. Beweis. λx = |λ| x folgt aus (b) und (b ), und x = 0 ⇔ x = 0 folgt aus (d) und (e). Die Dreiecksungleichung ergibt sich so: x + y 2 = x + y, x + y = x, x + x, y + y, x + y, y = x 2 + 2 Rex, y + y 2 (∗)
≤ x 2 + 2 x y + y 2 = ( x + y )2 ;
bei (∗) gehen die Cauchy-Schwarz-Ungleichung und die elementare Ungleichung Re z ≤ |z| ein. 2 Definition V.1.4 Ein normierter Raum (X, . ) heißt Pr¨ahilbertraum, wenn es ein Skalarprodukt . , . auf X × X mit x, x1/2 = x f¨ ur alle x ∈ X gibt. Ein vollst¨ andiger Pr¨ ahilbertraum heißt Hilbertraum. Wir werden das Skalarprodukt, das die Norm des Pr¨ahilbertraums X erzeugt, stets mit . , . bezeichnen. . wird stets die in Lemma V.1.3
V.1
203
Definitionen und Beispiele
beschriebene Norm sein. (Ist (X, . ) ein Pr¨ahilbertraum und ||| . ||| eine aquivalente Norm auf X, so braucht (X, ||| . |||) kein Pr¨ahilbertraum zu sein!) ¨ Die Cauchy-Schwarz-Ungleichung impliziert, daß auf einem Pr¨ahilbertraum die Abbildungen x → x, y und y → x, y stetig sind. Als weitere Konsequenz halten wir ein Lemma fest, das sp¨ater (Korollar V.3.5) noch verallgemeinert wird. Lemma V.1.5 Ist X ein Pr¨ahilbertraum, U ⊂ X ein dichter Unterraum und x ∈ X mit x, u = 0 f¨ ur alle u ∈ U , so ist x = 0. Beweis. Die Menge Y = {y ∈ X: x, y = 0} ist wegen der Stetigkeit von y → x, y abgeschlossen und enth¨ alt den dichten Unterraum U , also muß Y = X sein. Speziell ist x ∈ Y , und das liefert x 2 = x, x = 0 sowie x = 0. 2 In einem Pr¨ ahilbertraum kann nicht nur die Norm durch das Skalarprodukt ausgedr¨ uckt werden, sondern auch das Skalarprodukt durch die Norm; eine einfache Rechnung zeigt n¨ amlich f¨ ur K = R x, y =
1 ( x + y 2 − x − y 2 ) 4
(V.2)
und f¨ ur K = C x, y =
1 ( x + y 2 − x − y 2 + i x + iy 2 − i x − iy 2 ). 4
(V.3)
Lemma V.1.6 Das Skalarprodukt eines Pr¨ahilbertraums X ist eine stetige Abbildung von X × X nach K. Beweis. Die Behauptung folgt aus |x1 , y1 − x2 , y2 | = |x1 − x2 , y1 + x2 , y1 − y2 | ≤ x1 − x2 · y1 + x2 · y1 − y2 .
2
Satz V.1.7 (Parallelogrammgleichung) Ein normierter Raum X ist genau dann ein Pr¨ahilbertraum, wenn x + y 2 + x − y 2 = 2 x 2 + 2 y 2
∀x, y ∈ X
(V.4)
gilt. Beweis. In einem Pr¨ ahilbertraum gilt (V.4), wie man sofort sieht. (Der Name Parallelogrammgleichung erkl¨ art sich aus dem Spezialfall X = R2 , versehen mit der euklidischen Norm.) Gelte nun (V.4). Wir behandeln K = R. Setze wie in (V.2) x, y =
1 ( x + y 2 − x − y 2 ). 4
204
V.
Hilbertr¨ aume
Auf jeden Fall ist x = x, x1/2 . Wir werden (V.4) benutzen, um die Skalarprodukteigenschaften von . , . zu zeigen: aß (V.4) (a) F¨ ur x1 , x2 , y ∈ X gilt gem¨ x1 + x2 + y 2 = 2 x1 + y 2 + 2 x2 2 − x1 − x2 + y 2 =: α, x1 + x2 + y 2 = 2 x2 + y 2 + 2 x1 2 − −x1 + x2 + y 2 =: β. Folglich ist α+β 2 = x1 + y 2 + x1 2 + x2 + y 2 + x2 2 1 − x1 − x2 + y 2 + −x1 + x2 + y 2 . 2
x1 + x2 + y 2 =
Analog erh¨ alt man x1 + x2 − y 2 = x1 − y 2 + x1 2 + x2 − y 2 + x2 2 1 − x1 − x2 − y 2 + −x1 + x2 − y 2 . 2 Es folgt 1 x1 + x2 + y 2 − x1 + x2 − y 2 4 1 x1 + y 2 + x2 + y 2 − x1 − y 2 − x2 − y 2 = 4 = x1 , y + x2 , y.
x1 + x2 , y =
(b) Nach (a) gilt (b) f¨ ur λ ∈ N; und nach Konstruktion gilt (b) f¨ ur λ = 0 und λ = −1, also auch f¨ ur λ ∈ Z. Deshalb gilt (b) auch f¨ ur λ = m n ∈ Q: / x 0 nλx, y = n m , y = mx, y = nλx, y n Die (wegen der Stetigkeit von . ) stetigen Funktionen (von R nach R) λ → λx, y,
λ → λx, y
stimmen auf Q daher u ¨ berein und sind deshalb gleich. Das zeigt (b). (c) ist klar. (d) und (e) folgen aus x, x = x 2 . F¨ ur K = C argumentiere ¨ ahnlich mit Hilfe der in (V.3) definierten Abbildung! 2
V.1
205
Definitionen und Beispiele
Satz V.1.8 (a) Ein normierter Raum ist genau dann ein Pr¨ahilbertraum, wenn alle zweidimensionalen Unterr¨aume Pr¨ahilbertr¨aume (d.h. ∼ = 2 (2)) sind. (b) Unterr¨aume von Pr¨ahilbertr¨aumen sind Pr¨ahilbertr¨aume. (c) Die Vervollst¨andigung eines Pr¨ahilbertraums ist ein Hilbertraum. Beweis. (a) ist eine Konsequenz aus Satz V.1.7. (b) ist trivial (schr¨ anke das Skalarprodukt ein!). (c) X sei die Vervollst¨ andigung des Pr¨ ahilbertraums X (siehe Korollar III.3.2). Die Parallelogrammgleichung gilt in X und u ¨bertr¨agt sich aus Nach Satz V.1.7 ist X ein Stetigkeitsgr¨ unden auf den Abschluß, d.h. auf X. Hilbertraum. 2 Beispiele. (a) Aus der linearen Algebra sind die Hilbertr¨aume Cn mit dem Skalarprodukt n 2 1 s i ti (si ), (ti ) = i=1
bekannt. (b) 2 ist ein Hilbertraum, dessen Norm vom Skalarprodukt 1
∞ 2 s i ti (si ), (ti ) = i=1
induziert wird. (Die Konvergenz der Reihe folgt aus der H¨olderschen Ungleichung.) (c) Ist Ω ⊂ R ein Intervall oder Ω ⊂ Rn offen (oder allgemeiner meßbar), so ist L2 (Ω) ein Hilbertraum, wobei das Skalarprodukt durch f g dλ f, g = Ω
definiert ist; hier bezeichnet λ das Lebesguemaß. (Daß f g integrierbar ist, folgt wieder aus der H¨ olderschen Ungleichung.) Allgemeiner sind alle R¨aume aume. L2 (μ) Hilbertr¨ (d) In der numerischen Mathematik treten h¨aufig Maße der Form μ = w · λ auf. Hier ist w ≥ 0 eine meßbare Funktion auf einem Intervall I und λ wie oben das Lebesguemaß. f, g = f gw dλ I
definiert das Skalarprodukt auf L2 (μ).
206
V.
Hilbertr¨ aume
(e) Einen weiteren Spezialfall erh¨ alt man f¨ ur das z¨ahlende Maß auf einer beliebigen Indexmenge I. Den entsprechenden L2 -Raum bezeichnet man mit 2 (I). (F¨ ur I = N erh¨ alt man 2 .) Eine ¨aquivalente Beschreibung lautet f (s) = 0 f¨ ur h¨ ochstens abz¨ahlbar viele s 2 (I) = f : I → K: und s∈I |f (s)|2 < ∞ . . .“ im folgenden Sinn zu verstehen. Sei etwa Dabei ist die Summe ” s∈I ahlung von {s: f (s) = 0}. Man setzt {s1 , s2 , . . .} eine Aufz¨
|f (s)|2 =
∞
|f (si )|2 ;
i=1
s∈I
beachte, daß wegen der absoluten Konvergenz die Summationsreihenfolge keine Rolle spielt. F¨ ur f, g ∈ 2 (I) ist f (s)g(s) f, g = s∈I
ein wohldefiniertes Skalarprodukt, die induzierte Norm f =
1/2 |f (s)|2
s∈I
macht 2 (I) zu einem vollst¨ andigen Raum. (Diese Aussagen k¨onnen auf dieselbe Weise gezeigt werden wie f¨ ur 2 .) (f) Zu λ ∈ R betrachte die Funktion fλ : R → C, fλ (s) = eiλs . Setze X = lin{fλ : λ ∈ R}. Durch den Ansatz 1 T →∞ 2T
f, g = lim
T
f (s)g(s) ds
(V.5)
−T
wird ein Skalarprodukt auf X definiert (Aufgabe V.6.4). Die Vervollst¨andigung von X unter der Norm x = x, x1/2 ist ein Hilbertraum, den wir mit AP2 (R) bezeichnen. Da (Aufgabe V.6.4) √ fλ − fλ = 2 ∀λ = λ gilt, ist AP2 (R) nicht separabel (vgl. den Beweis der Inseparabilit¨at von ∞ , S. 29); darin liegt die Bedeutung dieses Beispiels. Aus den Resultaten des Abschnitts V.4 wird AP2 (R) ∼ ur almost periodic, = 2 (R) folgen. (AP steht f¨ siehe die Bemerkungen und Ausblicke.) (g) Sehr wichtige Beispiele von Hilbertr¨ aumen sind die Sobolevr¨aume, die jetzt definiert werden sollen.
V.1
207
Definitionen und Beispiele
Definition V.1.9 Sei Ω ⊂ Rn offen. Dann sei D(Ω) = {ϕ ∈ C ∞ (Ω): supp(ϕ) := {x: ϕ(x) = 0} ⊂ Ω ist kompakt}. (Hier ist C ∞ (Ω) = m∈N C m (Ω).) supp(ϕ) heißt der Tr¨ager von ϕ; Elemente von D(Ω) heißen C ∞ -Funktionen mit kompaktem Tr¨ager oder Testfunktionen. Warum Testfunktionen so genannt werden, wird auf S. 430 erkl¨ art. Beispiel. | . | sei die euklidische Norm auf Rn und c · exp((|x|2 − 1)−1 ) f¨ ur |x| < 1 ϕ(x) = 0 f¨ ur |x| ≥ 1. Dann ist ϕ ∈ D(Rn ) (vgl. Aufgabe II.5.6). ur 1 ≤ p < ∞. Lemma V.1.10 D(Ω) liegt dicht in Lp (Ω) f¨ Beweis. Der Beweis dieser Aussage ist im Fall n = 1, Ω = R in Aufgabe II.5.6 skizziert worden, und f¨ ur Ω = Rn argumentiert man genauso; man 1 muß jetzt ϕε (x) = εn ϕ(x/ε) setzen. Wir betrachten nun den Fall einer beliebigen offenen Menge Ω ⊂ Rn . Sei f ∈ Lp (Ω) und Km = {x ∈ Ω: |x| ≤ m, 2 }. Dann sind die K kompakt, es gilt d(x, ∂Ω) ≥ m m Km = Ω und m p p |f (x)| dx → |f (x)| dx nach dem Satz von Beppo Levi (Satz A.3.1). Km Ω Setzt man fm (x) = f (y)ϕ1/m (x − y) dy, (V.6) Km
so ist (vgl. Aufgabe II.5.6) fm ∈ D(Ω), und es gilt f − fm Lp → 0. Beachte, daß diese Konstruktion eine simultane Approximation in allen aumen liefert: Ist f ∈ Lp (Ω) ∩ Lq (Ω), so gilt f − fm Lp → 0 und Lp -R¨ f − fm Lq → 0. 2 Als n¨ achstes soll das Konzept der schwachen Ableitungen behandelt werden. Sei zun¨ achst Ω ⊂ R ein offenes Intervall. F¨ ur f ∈ C 1 (Ω) und ϕ ∈ D(Ω) gilt dann f (x)ϕ(x) dx = − f (x)ϕ (x) dx Ω
Ω
nach der Regel der partiellen Integration. (Die Randterme verschwinden, weil der Tr¨ ager von ϕ eine kompakte Teilmenge von Ω ist.) Diese Gleichung schreiben wir mit Hilfe des L2 (Ω)-Sklalarproduktes als f , ϕ = −f, ϕ .
208
V.
Hilbertr¨ aume
Nun sei Ω = (−1, 1), f (x) = |x| und g(x) = x/|x| f¨ ur x = 0 sowie g(0) = 0. ahnliche Gleichung, n¨amlich Obwohl f ∈ / C 1 (Ω) ist, gilt eine ¨ g, ϕ = −f, ϕ
∀ϕ ∈ D(Ω).
Wir fassen g als schwache“ oder verallgemeinerte“ Ableitung von f auf. ” ” Analog gilt f¨ ur offenes Ω ⊂ Rn und f ∈ C 1 (Ω), ϕ ∈ D(Ω) . . ∂ ∂ f, ϕ = − f, ϕ ∂xi ∂xi als Folgedes Gaußschen Integralsatzes (siehe auch Aufgabe V.6.6); hier ist f, ϕ = Ω f ϕ. Entsprechend erh¨ alt man f¨ ur m-mal stetig differenzierbares f und Multiindizes α, |α| ≤ m Dα f, ϕ = (−1)|α| f, Dα ϕ
∀ϕ ∈ D(Ω).
(Die Multiindexschreibweise wurde in Beispiel I.1(d) eingef¨ uhrt.) Definition V.1.11 Sei Ω ⊂ Rn offen, α ein Multiindex und f ∈ L2 (Ω). g ∈ L2 (Ω) heißt schwache oder verallgemeinerte α-te Ableitung von f , falls g, ϕ = (−1)|α| f, Dα ϕ
∀ϕ ∈ D(Ω)
gilt. Ein solches g ist eindeutig bestimmt: Ist n¨amlich h ebenfalls schwache Ableitung von f , so ist g − h, ϕ = 0 f¨ ur alle ϕ ∈ D(Ω), und mit Lemma V.1.5 sowie Lemma V.1.10 folgt g = h. Wir bezeichnen die in Definition V.1.11 eindeutig erkl¨arte Funktion g mit D(α) f . Es gilt also D(α) f, ϕ = (−1)|α| f, Dα ϕ
∀ϕ ∈ D(Ω).
Definition V.1.12 Sei Ω ⊂ Rn offen. (a) W m (Ω) = {f ∈ L2 (Ω): D(α) f ∈ L2 (Ω) existiert ∀|α| ≤ m} (b) f, gW m = |α|≤m D(α) f, D(α) gL2 (c) H m (Ω) = C m (Ω) ∩ W m (Ω), der Abschluß bezieht sich auf die von . , . W m induzierte Norm. (d) H0m (Ω) = D(Ω) Diese R¨ aume werden Sobolevr¨aume genannt. Es ist klar, daß es sich dabei um Vektorr¨aume handelt, und es ist klar, daß . , . W m ein Skalarprodukt ist. F¨ ur beschr¨ ankte Gebiete mit gen¨ ugend glattem Rand ist u ¨ brigens W m (Ω) = H m (Ω) (Adams [1975], S. 54). Hingegen liegt C m (Ω) ∩ W m (Ω) f¨ ur alle Ω dicht in W m (Ω) (Adams [1975], S. 52).
V.1
209
Definitionen und Beispiele
Satz V.1.13 W m (Ω), H m (Ω) und H0m (Ω) sind Hilbertr¨aume. Beweis. Es ist nur die Vollst¨ andigkeit von W m (Ω) zu zeigen. Sei fn eine . W m -Cauchyfolge. Wegen f 2W m =
D(α) f 2L2
∀f ∈ W m
|α|≤m
sind alle (D(α) fn ) . L2 -Cauchyfolgen. Es existieren also fα ∈ L2 (Ω) mit D(α) fn − fα L2 → 0. Wir bezeichnen jetzt f(0,...,0) einfach mit f0 und zeigen D(α) f0 = fα ; dann folgt f0 ∈ W m und fn → f0 bzgl. . W m nach Definition dieser Norm. In der Tat ist f¨ ur ϕ ∈ D(Ω) fα , ϕL2 =
/
0 lim D(α) fn , ϕ
(lim bzgl. . L2 )
L2
n→∞
= lim D(α) fn , ϕL2 n→∞
(Stetigkeit von . , ϕ)
= lim (−1)|α| fn , Dα ϕL2 n→∞ / 0 = (−1)|α| lim fn , Dα ϕ
L2
n→∞
(Definition von D(α) ) (Stetigkeit von . , Dα ϕ)
= (−1)|α| f0 , Dα ϕL2 . Daher folgt 2
fα = D(α) f0 .
Es ist klar, daß W m (Ω) ⊂ W m−1 (Ω) gilt und der identische Operator W (Ω) → W m−1 (Ω) stetig ist. Mit Hilfe der Sobolevtheorie k¨ onnen Existenzprobleme f¨ ur L¨osungen (insbesondere elliptischer) partieller Differentialgleichungen behandelt werden. Folgende Resultate sind h¨ aufig von Nutzen: m
• Lemma von Sobolev: F¨ ur f ∈ W m (Ω) und m > k + k uberall. g ∈ C (Ω) mit f = g fast ¨
n 2
existiert
• Satz von Rellich: F¨ ur eine beschr¨ankte offene Menge Ω ⊂ Rn ist m die Einbettung H0 (Ω) → H0m−1 (Ω) kompakt. Diese S¨ atze werden im n¨ achsten Abschnitt bewiesen.
210
V.2
V.
Hilbertr¨ aume
Fouriertransformation und Sobolevr¨ aume
Das Ziel dieses Abschnitts ist es, in einem Exkurs die soeben genannten S¨ atze von Sobolev und Rellich zu beweisen. Als technisches Hilfsmittel werden wir dazu die Fouriertransformation ben¨otigen, die auch im folgenden noch eine wesentliche Rolle spielen wird. Wir werden folgende Bezeichnungen verwenden. Sind x, ξ ∈ Rn , so setzen wir 1/2 n n n xj ξj , x2 = x2j , |x| = x2j . xξ = j=1
j=1
j=1
In diesem Abschnitt werden wir stets komplexwertige Funktionen betrachten. Definition V.2.1 F¨ ur f ∈ L1 (Rn ) setze 1 (F f )(ξ) = f (x)e−ixξ dx (2π)n/2 Rn
∀ξ ∈ Rn .
(V.7)
Die Funktion F f heißt Fouriertransformierte von f und die Abbildung F Fouriertransformation. Offensichtlich ist F f wohldefiniert und meßbar, und die Abbildung F ist linear. Wir halten nun einfache Eigenschaften von F fest; der gleich auftauchende Raum C0 (Rn ), . ∞ wurde in Beispiel I.1(c) definiert. Satz V.2.2 F¨ ur f ∈ L1 (Rn ) ist F f ∈ C0 (Rn ). Ferner ist F : L1 (Rn ) → n C0 (R ) ein stetiger linearer Operator mit F ≤ (2π)−n/2 . Beweis. Da die Absch¨ atzung F f ∞ ≤ (2π)−n/2 f L1 klar ist und F f meßbar ist, ist F ein stetiger Operator von L1 (Rn ) nach L∞ (Rn ) mit der gew¨ unschten Norm. Es bleibt zu zeigen, daß die F f stetig sind und im Unendlichen verschwinden. Sei also (ξ (k) ) eine Folge in Rn mit ξ (k) → ξ. Dann gilt f¨ ur jedes x |e−ixξ
(k)
− e−ixξ | → 0
und deshalb nach dem Lebesgueschen Konvergenzsatz A.3.2 (k) 1 |(F f )(ξ (k) ) − (F f )(ξ)| ≤ |f (x)| |e−ixξ − e−ixξ | dx → 0, n/2 (2π) Rn da die Integranden durch die L1 -Funktion 2|f | majorisiert werden. Also ist F f stetig.
V.2
211
Fouriertransformation und Sobolevr¨ aume
Um nun ran F ⊂ C0 (Rn ) zu zeigen, reicht es wegen der Dichtheit von D(Rn ) in L1 (Rn ) (Lemma V.1.10), lim |(F f )(ξ)| = 0
|ξ|→∞
∀f ∈ D(Rn )
n ), R > 0 und |ξ| ≥ R. Dann existiert zu beweisen. Seien also f ∈ D(R√ eine Koordinate ξj mit |ξj | ≥ R/ n. Es folgt durch partielle Integration (beachte, daß die Randterme verschwinden) −1 ∂ 1 −ixξ f (x) e dx |(F f )(ξ)| = −iξj (2π)n/2 Rn ∂xj √ ∂ 1 n ≤ → 0 mit R → ∞, f (2π)n/2 ∂xj L1 R
2
was zu zeigen war.
Aus funktionalanalytischer Sicht ist es g¨ unstig, F auf einen geeigneten Teilraum von L1 (Rn ), der aus glatten Funktionen besteht, einzuschr¨anken. Optimal ist dabei die Wahl des als n¨ achstes definierten Schwartzraums S (Rn ). Definition V.2.3 Eine Funktion f : Rn → C heißt schnell fallend, falls lim xα f (x) = 0
|x|→∞
∀α ∈ Nn0 ;
(V.8)
αn 1 hier ist xα durch xα art. Der Raum 1 · · · xn erkl¨
S (Rn ) = {f ∈ C ∞ (Rn ): Dβ f schnell fallend ∀β ∈ Nn0 } heißt Schwartzraum, seine Elemente Schwartzfunktionen. 2
Ein Beispiel einer Schwartzfunktion ist γ(x) = e−x . Statt (V.8) kann man auch ¨ aquivalenterweise lim P (x)f (x) = 0
|x|→∞
∀Polynome P : Rn → C
(V.9)
oder lim |x|m f (x) = 0
|x|→∞
∀m ∈ N0
(V.10)
fordern. (Offensichtlich impliziert (V.8) die Bedingung (V.9), und (V.9) liefert (V.10), da man sich auf gerade m beschr¨anken kann und dann das Polynom P (x) = (x21 +· · ·+x2n )m/2 betrachtet. Schließlich zeigt |xα | ≤ |x||α| die noch fehlende Implikation.) Nach Definition verschwinden Schwartzfunktionen und ihre s¨amtlichen Ableitungen im Unendlichen schneller als das Reziproke jeden Polynoms.
212
V.
Hilbertr¨ aume
Daher ist S (Rn ) ⊂ Lp (Rn ) f¨ ur alle p ≥ 1, da f¨ ur mp − (n − 1) > 1 und f ∈ S (Rn ) p c p |f (x)| dx ≤ dx 1 + |x|m Rn Rn p ∞ 1 p rn−1 dr < ∞, = c ωn−1 1 + rm 0 ache der Sph¨ are {x ∈ Rn : |x| = 1} und c eine geeignete wo ωn−1 die Oberfl¨ Konstante bezeichnet. Offensichtlich ist S (Rn ) ein Vektorraum, der D(Rn ) umfaßt; also liegt S (Rn ) dicht in Lp (Rn ) f¨ ur 1 ≤ p < ∞. Eine C ∞ -Funktion f ist genau dann eine Schwartzfunktion, wenn sup (1 + |x|m )|Dβ f (x)| < ∞
x∈Rn
∀m ∈ N0 , β ∈ Nn0 .
(V.11)
Zum Beweis beachte, daß (V.11) |x|m |Dβ f (x)| ≤
c (|x|m + |x|m+1 )|Dβ f (x)| ≤ →0 1 + |x| 1 + |x|
impliziert. Man verwendet hier 1 + |x|m statt des Vorfaktors |x|m , da man dann stets durch diesen Faktor dividieren kann, was sich h¨aufig als n¨ utzlich herausstellt. Die Bedeutung des Schwartzraums liegt darin, daß die Fouriertransformation F eine Bijektion von S (Rn ) auf S (Rn ) vermittelt (Satz V.2.8), was f¨ ur L1 (Rn ) nicht der Fall ist. Um diesen Satz zu beweisen, sind einige Vorbereitungen notwendig. Im folgenden wird die Funktion x → xα ebenfalls mit dem Symbol xα bezeichnet; das ist zwar nicht ganz pr¨azise, gestattet aber, einige Aussagen leichter zu formulieren. Ist f ∈ S (Rn ), so ergibt sich unmittelbar aus der Definition xα f ∈ S (Rn ), Dα f ∈ S (Rn )
∀α ∈ Nn0 .
Im n¨ achsten Lemma studieren wir die Wirkung von Differentiation und Fouriertransformation. Lemma V.2.4 Sei f ∈ S (Rn ) und α ein Multiindex. Dann gelten: (a) F f ∈ C ∞ (Rn ) und Dα (F f ) = (−i)|α| F (xα f ). (b) F (Dα f ) = i|α| ξ α F f . Beweis. (a) Die formale Rechnung lautet: ∂α 1 α f (x)e−ixξ dx D (F f )(ξ) = ∂ξ α (2π)n/2 Rn
V.2
213
Fouriertransformation und Sobolevr¨ aume
∂α f (x) α e−ixξ dx ∂ξ Rn 1 f (x)xα e−ixξ dx = (−i)|α| (2π)n/2 Rn
1 = (2π)n/2
(∗)
= (−i)|α| F (xα f )(ξ). Es ist noch zu begr¨ unden, warum in (∗) die Differentiation unter dem Integral erlaubt ist. Da xα f ∈ S (Rn ) ⊂ L1 (Rn ) ist, folgt das aus dem Konvergenzsatz von Lebesgue; siehe Korollar A.3.3. (b) Durch partielle Integration erh¨ alt man (beachte, daß wegen xβ f ∈ n S (R ) alle Randterme verschwinden) 1 α F (D f )(ξ) = (Dα f )(x)e−ixξ dx (2π)n/2 Rn (−1)|α| ∂ α −ixξ = f (x) e dx ∂xα (2π)n/2 Rn = (−1)|α| (−i)|α| ξ α (F f )(ξ), 2
was zu zeigen war.
Lemma V.2.4 dr¨ uckt die wichtige Eigenschaft der Fouriertransformation aus, Ableitungen in Multiplikationen zu verwandeln, also analytische Operationen zu algebraischen zu machen. Lemma V.2.5 Wenn f ∈ S (Rn ) ist, ist auch F f ∈ S (Rn ). Beweis. In Lemma V.2.4(a) wurde F f ∈ C ∞ (Rn ) festgestellt. Es ist zu zeigen, daß ξ α Dβ (F f )(ξ) → 0 f¨ ur |ξ| → ∞ strebt. Nach Lemma V.2.4 ist ξ α Dβ (F f )(ξ) = (−i)|β| (−i)|α| F (Dα xβ f )(ξ), und da Dα (xβ f ) ∈ S (Rn ), also integrierbar, ist, folgt die Behauptung aus Satz V.2.2. 2 Wir berechnen nun die Fouriertransformierte der Funktion γ(x) = e−x
2
/2
∀x ∈ Rn .
Dies ist (bis auf einen Faktor) die Dichte der Standardnormalverteilung ur a > 0. der Wahrscheinlichkeitstheorie. Wir setzen noch γa (x) = γ(ax) f¨ Bekanntlich gilt 1 γ(x) dx = 1. (2π)n/2 Rn
214
V.
Hilbertr¨ aume
Lemma V.2.6 Es gilt (F γ)(ξ) = e−ξ
2
/2
,
(F γa )(ξ) =
ξ 1 . (F γ) an a
Beweis. Die zweite Behauptung ist klar. Wir berechnen jetzt F γ f¨ ur den Fall n = 1. Dann erf¨ ullt γ die gew¨ ohnliche Differentialgleichung y + xy = 0
(V.12)
mit dem Anfangswert y(0) = 1. Nun gilt nach Lemma V.2.4 1 Fγ , 0 = F (γ + xγ) = iξF γ + −i d.h. F γ erf¨ ullt ebenfalls (V.12) mit demselben Anfangswert ∞ 2 1 (F γ)(0) = √ e−x /2 dx = 1. 2π −∞ Da Anfangswertprobleme f¨ ur lineare gew¨ ohnliche Differentialgleichungen eindeutig l¨ osbar sind, folgt γ = F γ. Der Fall n > 1 wird auf n = 1 zur¨ uckgef¨ uhrt, n¨amlich ∞3 ∞ 3 1 −x2k /2 · · · e e−ixk ξk dx1 . . . dxn (F γ)(ξ) = (2π)n/2 −∞ −∞ 2
2
= e−ξ1 /2 · · · e−ξn /2 = e−ξ
2
/2
2
.
Lemma V.2.7 F¨ ur f ∈ S (Rn ) gilt (F F f )(x) = f (−x)
∀x ∈ Rn .
Beweis. Es gilt F f ∈ S (Rn ) (Lemma V.2.5), so daß die linke Seite wohldefiniert ist. Versucht man, das Doppelintegral (F F f )(x) mittels des Satzes von Fubini direkt auszuwerten, st¨ oßt man auf Schwierigkeiten, da ein nicht konvergentes Integral entsteht. Daher arbeitet man mit den konvergenz” erzeugenden“ Funktionen γa . Wir beobachten zun¨ achst als unmittelbare Konsequenz des Satzes von Fubini (F f )(x)g(x) dx = f (x)(F g)(x) dx ∀f, g ∈ S (Rn ); (V.13) Rn
Rn
hier ist die Integralvertauschung wirklich erlaubt, da (x, ξ) → f (ξ)g(x)e−ixξ integrierbar ist. Das impliziert f¨ ur g(x) = e−ixξ0 γ(ax), wo ξ0 ∈ Rn und a > 0 fest sind, wegen 1 e−ixξ0 γ(ax)e−ixξ dx = (F γa )(ξ + ξ0 ) (F g)(ξ) = (2π)n/2 Rn
V.2
215
Fouriertransformation und Sobolevr¨ aume
0 und Lemma V.2.6 mit der Variablensubstitution u = x+ξ a 1 (F f )(x)e−ixξ0 γ(ax) dx (2π)n/2 Rn x + ξ 1 1 0 dx f (x) (F γ) = n a a (2π)n/2 Rn 1 = f (au − ξ0 )γ(u) du. (2π)n/2 Rn
L¨ aßt man a → 0 streben, so zeigt der Lebesguesche Konvergenzsatz, daß der erste Term gegen (F F f )(ξ0 ) und der letzte gegen f (−ξ0 ) konvergiert. (Im ersten Term ist |F f | und im letzten f ∞ γ eine integrierbare Majorante.) Damit ist das Lemma bewiesen. 2 Satz V.2.8 Die Fouriertransformation ist eine Bijektion von S (Rn ) auf S (Rn ); der inverse Operator ist durch 1 −1 f (ξ)eixξ dξ ∀x ∈ Rn (V.14) (F f )(x) = (2π)n/2 Rn gegeben. Ferner gilt F f, F gL2 = f, gL2
∀f, g ∈ S (Rn ).
Beweis. Nach Lemma V.2.7 gilt F 4 = IdS (Rn ) . Daraus folgt, daß F bijektiv und F −1 = F 3 ist, und das liefert sofort (F −1 f )(x) = F 2 (F f ) (x) = (F f )(−x), was (V.14) zeigt. Ferner gilt nach (V.13) (F f )(ξ)(F g)(ξ) dξ = f (x) F (F g) (x) dx. Rn
Rn
Setzt man abk¨ urzend h = F g, so erh¨ alt man 1 (F h)(x) = h(ξ)e−ixξ dξ (2π)n/2 Rn 1 = h(ξ)eixξ dξ (2π)n/2 Rn = (F −1 h)(x) = g(x)
und daraus F f, F gL2 =
Rn
f (x)g(x) dx = f, gL2 .
2
216
V.
Hilbertr¨ aume
Insbesondere gilt F f L2 = f L2
∀f ∈ S (Rn ).
Der Operator F ist also auf dem Teilraum S (Rn ) von L2 (Rn ) wohldefiniert, bijektiv und bzgl. . L2 isometrisch. Da S (Rn ) nach Lemma V.1.10 dicht in L2 (Rn ) liegt, kann F zu einem isometrischen Operator auf L2 (Rn ) fortgesetzt werden; diese Fortsetzung, genannt Fourier-Plancherel-Transformation, soll einstweilen mit F2 bezeichnet werden. Wegen Satz V.2.8 ist F2 : L2 (Rn ) → L2 (Rn ) ein isometrischer Isomorphismus, und es gilt die Plancherel-Gleichung F2 f, F2 gL2 = f, gL2
∀f, g ∈ L2 (Rn ).
(V.15)
Es ist wichtig zu bemerken, daß F2 f f¨ ur f ∈ L2 (Rn ) nicht durch (V.7) 2 n gegeben ist; ist f ∈ L (R ), so braucht das Integral in (V.7) nicht zu ¨ von existieren. Ferner ist F2 f nach Konstruktion eine Aquivalenzklasse Funktionen, w¨ ahrend (V.7) wirklich eine Funktion definiert. Hier ist der Zusammenhang zwischen F und F2 . Wir setzen BR = {x ∈ Rn : |x| ≤ R} und f¨ ur f ∈ L2 (Rn ) 1 gR (ξ) = f (x)e−ixξ dx. (2π)n/2 BR Satz V.2.9 (a) F¨ ur f ∈ L1 (Rn ) ∩ L2 (Rn ) gilt 1 (F2 f )(ξ) = f (x)e−ixξ dx (2π)n/2 Rn
fast u ¨berall.
(b) F¨ ur f ∈ L2 (Rn ) gilt F2 f = lim gR , R→∞
wo die Konvergenz im Sinn von . L2 vorliegt. Beweis. (a) Der Beweis von Lemma V.1.10 zeigt, daß es eine Folge (fk ) in D(Rn ) mit fk − f L1 → 0 und fk − f L2 → 0 gibt. Satz V.2.2 impliziert die gleichm¨ aßige Konvergenz von (F fk ) gegen F f , und diese liefert |F fk (ξ) − F f (ξ)|2 dξ → 0 ∀R > 0. BR
Andererseits gilt nach der Plancherel-Gleichung (V.15) F fk − F2 f L2 = F2 (fk − f ) L2 = fk − f L2 → 0,
V.2
217
Fouriertransformation und Sobolevr¨ aume
also
|F fk (ξ) − F2 f (ξ)|2 dξ → 0
∀R > 0.
BR
Daraus folgt F2 f (ξ) = F f (ξ) fast u ¨ berall. (b) Nach Definition und (a) ist gR = F (χBR f ) = F2 (χBR f ) fast u ¨berall (beachte, daß χBR f wegen L2 (BR ) ⊂ L1 (BR ) integrierbar ist). Weil (χBR f ) nach dem Konvergenzsatz von Lebesgue in L2 (Rn ) gegen f konvergiert, 2 liefert die Stetigkeit von F2 , daß gR → F2 f in L2 (Rn ) gilt. Die Aussage von (b) dr¨ uckt man auch durch die Formel 1 (F2 f )(ξ) = l.i.m. f (x)e−ixξ dx R→∞ (2π)n/2 B R aus; hierbei ist nicht die punktweise Konvergenz, sondern die Konvergenz im quadratischen Mittel gemeint. l.i.m. steht f¨ ur Limes im Mittel“. ” Wie in Theorem II.4.2 werden wir ab jetzt F und F2 als dieselben“ ” Operatoren ansehen; das ist durch Satz V.2.9(a) gerechtfertigt. Wir schreiben daher F statt F2 , und die Plancherel-Gleichung lautet nun F f, F gL2 = f, gL2
∀f, g ∈ L2 (Rn ).
(V.16)
Nun untersuchen wir die Fouriertransformation auf Lp (Rn ) f¨ ur 1 ≤ p ≤ 2. Satz V.2.10 (Hausdorff-Young-Ungleichung) ur f ∈ S (Rn ) ist F f ∈ Lq (Rn ), und es Seien 1 ≤ p ≤ 2 und p1 + 1q = 1. F¨ gilt 1 F f Lq ≤ f Lp . (V.17) n/p−n/2 (2π) Die Fouriertransformation F hat eine Ausdehnung zu einem stetigen Operator F : Lp (Rn ) → Lq (Rn ), der durch 1 f (x)e−ixξ dx (F f )(ξ) = l.i.m. R→∞ (2π)n/2 B R beschrieben wird; l.i.m. steht hier f¨ ur die Konvergenz in Lq (Rn ). Beweis. Die Aussage ist richtig f¨ ur p = 1, q = ∞ (Satz V.2.2) und f¨ ur p = 2, q = 2 (V.16): F : L1 → L∞ ≤ (2π)−n/2 , F : L2 → L2 ≤ 1. F¨ ur 1 < p < 2 folgt sie aus dem Satz von Riesz-Thorin (Theorem II.4.2). θ 2 1 W¨ ahlt man dort n¨ amlich θ mit p1 = 1−θ 1 + 2 , d.h. θ = 2 − p , so ist q = 1−θ θ ∞ + 2 , und (II.14) liefert (V.17).
218
V.
Hilbertr¨ aume
Daß die Ausdehnung die beschriebene Gestalt hat, beweist man wie Satz V.2.9(b). 2 F¨ ur f ∈ Lp (Rn ) mit p > 2 kann F f nicht mehr als Funktion dargestellt werden, sondern nur noch als Distribution; siehe dazu Abschnitt VIII.5. Als n¨ achstes beweisen wir das Analogon zu Lemma V.2.4 f¨ ur schwache Ableitungen (Definition V.1.11). Lemma V.2.11 Sei f ∈ W m (Rn ). Dann gilt f¨ ur |α| ≤ m F (D(α) f ) = i|α| ξ α F f. Beweis. Sei ϕ ∈ S (Rn ). Dann gilt nach der Plancherel-Gleichung (V.16) und Lemma V.2.4 F (D(α) f ), F ϕ = D(α) f, ϕ = (−1)|α| f, Dα ϕ = (−1)|α| F f, F Dα ϕ = (−1)|α| F f, i|α| ξ α F ϕ |α| = i ξ α (F f )(ξ)(F ϕ)(ξ) dξ; Rn
im zweiten Schritt muß man sich klarmachen, daß die partielle Integration auch mit Schwartzfunktionen klappt (Aufgabe V.6.7). Da die Fouriertransformation den Schwartzraum auf sich abbildet, gilt f¨ ur die Funktion h = F (D(α) f ) − i|α| ξ α · F f daher insbesondere h(ξ)ψ(ξ) dξ = 0 ∀ψ ∈ D(Rn ). (V.18) Rn
Die Crux ist nun, daß nicht a priori klar ist, daß h in L2 (Rn ) liegt. Gewiß ist aber die Einschr¨ ankung von h auf jede Kugel ΩR = {x: |x| < R} quadratisch integrierbar, und (V.18) liefert h, ψL2 (ΩR ) = 0
∀ψ ∈ D(ΩR ).
Da D(ΩR ) dicht in L (ΩR ) liegt, folgt nach Lemma V.1.5 h = 0 fast u ¨berall 2 auf ΩR und deshalb h = 0 fast u ¨berall. Das war zu zeigen. 2
Jetzt stehen alle Hilfsmittel bereit, um die S¨atze von Sobolev und Rellich zu beweisen. Wir erinnern daran, daß C k (Ω) den Vektorraum aller k-mal stetig differenzierbaren Funktionen von Ω nach C bezeichnet. Satz V.2.12 (Lemma von Sobolev) Sei Ω ⊂ Rn offen, und seien m, k ∈ N0 mit m > k + n2 . Ist f ∈ W m (Ω), so existiert eine k-mal stetig differenzierbare Funktion auf Ω, die mit f ¨ fast ¨ uberall ¨ ubereinstimmt. Mit anderen Worten, die Aquivalenzklasse f ∈ W m (Ω) hat einen Repr¨asentanten in C k (Ω).
V.2
219
Fouriertransformation und Sobolevr¨ aume
Beweis. Wir betrachten zuerst den Fall Ω = Rn . Im Beweis von Lemma V.2.4(a) wurde folgende Aussage mitbewiesen: ur |α| ≤ k, so ist F g k-mal • Falls g ∈ L1 (Rn ) und xα g ∈ L1 (Rn ) f¨ stetig differenzierbar. Die Idee ist hier, dieses Kriterium f¨ ur g = F f zu benutzen. Wir werden also zeigen: • Falls f ∈ W m (Rn ), m > k + n2 und |α| ≤ k, so ist ξ α F f ∈ L1 (Rn ). Dazu beobachten wir zun¨ achst, daß Lemma V.2.11 ξ α F f ∈ L2 (Rn ) f¨ ur |α| ≤ m impliziert. Insbesondere gelten ξj2m |F f (ξ)|2 dξ < ∞ ∀j = 1, . . . , n Rn
und
Rn
|F f (ξ)|2 dξ < ∞.
Wegen 1 + ξ 2 = (1, ξ12 , . . . , ξn2 ) 1 (n+1) ≤ (1, . . . , 1) p (n+1) (1, ξ12 , . . . , ξn2 ) m (n+1) = (n + 1)1/p (1 + ξ12m + · · · + ξn2m )1/m , wo
1 p
+
1 m
= 1 (H¨ oldersche Ungleichung I.1.4), folgt (1 + ξ 2 )m |F f (ξ)|2 dξ < ∞. Rn
Ferner gilt trivialerweise |ξ α | ≤ |ξ||α| . Diese Absch¨atzungen und die CauchySchwarz-Ungleichung implizieren nun f¨ ur |α| ≤ k |ξ α F f (ξ)| dξ ≤ (1 + ξ 2 )|α|/2 |F f (ξ)| dξ Rn Rn ≤ (1 + ξ 2 )m/2 |F f (ξ)|(1 + ξ 2 )−(m−k)/2 dξ Rn
≤ < ∞,
1/2 (1 + ξ ) |F f (ξ)| dξ 2 m
Rn
2
Rn
1 dξ (1 + ξ 2 )m−k
1/2
denn mit ωn−1 = Oberfl¨ ache der Einheitssph¨ are in Rn gilt ∞ 1 1 dξ = ωn−1 rn−1 dr < ∞ 2 m−k 2 )m−k (1 + ξ ) (1 + r 0 Rn f¨ ur 2(m − k) − (n − 1) > 1, d.h. m > k + n2 .
220
V.
Hilbertr¨ aume
Daher ist ξ α F f ∈ L1 (Rn ) und deshalb F F f ∈ C k (Rn ). Andererseits gilt mit (σg)(x) = g(−x) die Gleichung σg = F F g f¨ ur g ∈ S (Rn ) n (Lemma V.2.7); da σ und F stetig sind und S (R ) dicht liegt, gilt diese Gleichung auch f¨ ur g ∈ L2 (Rn ). Es folgt, daß f mit der C k -Funktion σ(F F f ) fast u ¨ berall u ¨ bereinstimmt. Das zeigt die Behauptung des Satzes im Fall Ω = Rn . Sei nun Ω ⊂ Rn eine beliebige offene Teilmenge und f ∈ W m (Ω). Seien y ∈ Ω, r > 0 und B(y, r) = {x ∈ Rn : |x − y| < r}. Es sei r so klein, daß K := B(y, r) ⊂ Ω gilt. W¨ ahle jetzt ϕ ∈ D(Ω) mit ϕ|K = 1. (Setzt man ϕε wie im Beweis von Lemma V.1.10, so ist f¨ ur hinreichend kleines ε ϕε (x − z) dz ϕ(x) = B(y,r+ε)
solch eine Funktion.) Nach Aufgabe V.6.8 ist ϕf ∈ W m (Ω), und da diese Funktion in einer Umgebung von ∂Ω verschwindet, k¨onnen wir sie durch 0 zu einer Funktion in W m (Rn ) fortsetzen. Der erste Teil des Beweises zeigt die Existenz einer k-mal stetig differenzierbaren Funktion gy,r mit gy,r = ϕf fast u ¨ berall, insbesondere ist gy,r (x) = f (x)
f¨ ur fast alle x ∈ B(y, r).
Ist f¨ ur zwei solche Parameterpaare (y, r) bzw. (z, s) die Menge B := B(y, r) ∩B(z, s) = ∅, so folgt insbesondere gy,r = gz,s fast u ¨ berall auf B. Da es sich um stetige Funktionen handelt, ist {x ∈ B: gy,r (x) = gz,s (x)} eine offene Nullmenge, also leer. Das zeigt gy,r = gz,s u ¨berall auf B. Daher ist durch g(x) = gy,r (x)
falls x ∈ B(y, r)
art, die fast u eine wohldefinierte C k -Funktion auf Ω erkl¨ ¨ berall mit f u ¨bereinstimmt. 2 Grob gesagt impliziert das Sobolevlemma, daß m-mal schwach differenzierbare Funktionen pro halber Raumdimension eine Differenzierbarkeitsordnung gegen¨ uber klassisch differenzierbaren Funktionen verlieren. Das Sobolevlemma gilt nicht mehr f¨ ur den Grenzexponenten m = k + n2 ; siehe Aufgabe V.6.9. Satz V.2.13 (Rellichscher Einbettungssatz) Ist Ω ⊂ Rn beschr¨ankt und offen, so ist der identische Operator von H0m (Ω) nach H0m−1 (Ω) kompakt. Beweis. Es reicht, sich auf den Fall m = 1 zu beschr¨anken. Ist dieser Fall ankte Folge in H0m (Ω), so sind alle n¨ amlich bewiesen und (fj ) eine beschr¨ (α) (D fj ), 0 ≤ |α| ≤ m − 1, beschr¨ ankt in H01 (Ω) und besitzen daher . L2 Cauchyteilfolgen. Durch sukzessive Anwendung dieses Schlusses auf alle
V.2
221
Fouriertransformation und Sobolevr¨ aume
solche Multiindizes erh¨ alt man eine in H0m−1 (Ω) konvergente Teilfolge von m−1 andig ist. (fj ), da H0 (Ω) vollst¨ Daher gen¨ ugt es zu zeigen, daß die identische Einbettung von H01 (Ω) nach L2 (Ω) kompakt ist. Dazu ist zu beweisen, daß eine beschr¨ankte Folge (fj ) in H01 (Ω) eine . L2 -konvergente Teilfolge hat. Weil D(Ω) nach Definition dicht in H01 (Ω) liegt, darf man fj ∈ D(Ω) annehmen; diese Funktionen d¨ urfen wir dann auch als Elemente von D(Rn ) ansehen. Wegen Theorem III.3.7 (beachte, daß die Folge (fj ) trivialerweise auch in L2 (Ω) beschr¨ ankt ist) besitzt (fj ) eine in L2 (Ω) schwach konvergente Teilfolge. Ohne Einschr¨ ankung nehmen wir an, daß (fj ) selbst schwach konvergiert, und zeigen nun, daß (fj ) eine . L2 -Cauchyfolge ist. Nach der Plancherel-Gleichung gilt 2 2 fk − fj L2 = F fk − F fj L2 = |F fk (ξ) − F fj (ξ)|2 dξ. Rn
Dieses Integral zerlegen wir in 2 |F fk (ξ) − F fj (ξ)| dξ + {|ξ|≤R}
{|ξ|>R}
|F fk (ξ) − F fj (ξ)|2 dξ.
Nun ist nach Lemma V.2.11 f¨ ur l = 1, . . . , n und f ∈ W 1 (Rn ) ∂ ∂ ξl F f L2 (Rn ) = F f = f ≤ f W 1 (Rn ) ∂xl L2 (Rn ) ∂xl L2 (Rn ) (die Ableitungen sind Sinn zu verstehen), also ist hier im verallgemeinerten ankt in L2 (Rn ). Zu gegebenem ε > 0 w¨ahle jetzt die Folge |ξ|F fj beschr¨ R > 0 mit 1 2 |F fk (ξ) − F fj (ξ)| dξ ≤ 2 |ξ|2 |F fk (ξ) − F fj (ξ)|2 dξ R {|ξ|>R} {|ξ|>R} ∀j, k ∈ N.
< ε
(V.19)
Mit eξ (x) = eixξ ist, da Ω beschr¨ ankt ist, eξ ∈ L2 (Ω). Folglich definiert f (x)e−ixξ dx f → f, eξ = Ω
eine nach der Cauchy-Schwarz-Ungleichung stetige auf L2 (Ω). Linearform 2 ur alle ξ ∈ Rn Weil (fj ) in L (Ω) schwach konvergiert, ist daher (F fj )(ξ) f¨ konvergent. Wir m¨ ochten daraus |F fk (ξ) − F fj (ξ)|2 dξ → 0 f¨ ur j, k → ∞ (V.20) {|ξ|≤R}
schließen.
222
V.
Hilbertr¨ aume
Nun ist (fj ) beschr¨ ankt in L2 (Ω), daher auch in L1 (Ω), da Ω beschr¨ankt ist. Satz V.2.2 zeigt, daß (F fj ) in der Supremumsnorm beschr¨ankt ist; deshalb folgt (V.20) aus dem Lebesgueschen Konvergenzsatz. Mit (V.19) und (V.20) ist der Beweis des Satzes vollst¨andig. 2 Der Einbettungssatz von Rellich braucht f¨ ur die R¨aume W m (Ω) nicht zu gelten; ein Gegenbeispiel findet man bei Courant/Hilbert [1968], Band 2, S. 522. Wenn es jedoch einen stetigen linearen Fortsetzungsoperator von W m (Ω) nach W m (Rn ) gibt, folgt aus Satz V.2.13 leicht, daß auch W m (Ω) kompakt in W m−1 (Ω) eingebettet ist. Ein solcher Fortsetzungsoperator existiert, wenn Ω glatt berandet ist oder allgemeiner die gleichm¨aßige Kegel” bedingung“ erf¨ ullt (Adams [1975], S. 91). Zum Schluß dieses Abschnitts sollen die Sobolevr¨aume W m (Rn ) mittels der Fouriertransformation beschrieben werden. Satz V.2.14 Es gilt W m (Rn ) = {f ∈ L2 (Rn ): (1 + |ξ|2 )m/2 F f ∈ L2 (Rn )}.
(V.21)
Beweis. Die Inklusion ⊂“ folgt unmittelbar aus Lemma V.2.11, und ⊃“ ” ” praktisch auch: Der Beweis des Lemmas zeigt n¨amlich f¨ ur f ∈ L2 (Rn ), n ϕ ∈ D(R ) und |α| ≤ m (−1)|α| f, Dα ϕ = i|α| ξ α F f, F ϕ = g, ϕ, wo g := i|α| (F −1 ξ α F )f ∈ L2 (Rn ), falls (1 + |ξ|2 )m/2 F f ∈ L2 (Rn ).
2
ur Satz V.2.14 er¨ offnet die M¨ oglichkeit, die Sobolevr¨aume W m (Rn ) f¨ beliebige Exponenten m > 0 zu erkl¨ aren; (V.21) dient dann als Definition.1 Traditionell bezeichnet man reelle Exponenten mit s statt mit m.
V.3
Orthogonalit¨ at
Wir kehren nun zur Untersuchung allgemeiner Hilbertr¨aume zur¨ uck. Mit Hilfe des Begriffs des Skalarprodukts kann das elementargeometrische Konzept der Orthogonalit¨ at abstrakt gefaßt werden. Definition V.3.1 Sei X ein Pr¨ ahilbertraum. Zwei Vektoren x, y ∈ X heißen orthogonal, in Zeichen x ⊥ y, falls x, y = 0 gilt. Zwei Teilmengen A, B ⊂ X heißen orthogonal, in Zeichen A ⊥ B, falls x ⊥ y f¨ ur alle x ∈ A, y ∈ B gilt. Die Menge A⊥ := {y ∈ X: x ⊥ y ∀x ∈ A} heißt orthogonales Komplement von A. 1 Auch im Fall negativer Exponenten kann man W m (Rn ) mittels (V.21) definieren, wenn man als Grundmenge der betrachteten f statt des Raums L2 den Raum der temperierten Distributionen (Abschnitt VIII.5) nimmt.
V.3
223
Orthogonalit¨ at
Die folgenden Eigenschaften ergeben sich direkt aus den Definitionen: • (Satz des Pythagoras) x ⊥ y ⇒ x 2 + y 2 = x + y 2 .
(V.22)
• A⊥ ist stets ein abgeschlossener Unterraum von X. • A ⊂ (A⊥ )⊥ • A⊥ = (lin A)⊥ Es wird aus Theorem V.3.6 folgen, daß die Bezeichnung A⊥ aus Definition V.3.1 mit der aus (III.4) konsistent ist. Der n¨ achste Satz ist zentral f¨ ur die Hilbertraumtheorie; dabei ist die Vollst¨ andigkeit wesentlich. Satz V.3.2 (Projektionssatz) Sei H ein Hilbertraum, K ⊂ H sei abgeschlossen und konvex, und es sei x0 ∈ H. Dann existiert genau ein x ∈ K mit x − x0 = inf y − x0 . y∈K
Beweis. Die Aussage ist trivial, falls x0 ∈ K; dann w¨ahle einfach x = x0 . / K annehmen, und es ist keine Einschr¨ankung, x0 = 0 Also d¨ urfen wir x0 ∈ anzunehmen (sonst verschiebe alles um −x0 ). Zur Existenz: Setze d = inf y∈K y . Dann existiert eine Folge (yn ) in K mit yn → d. Wir zeigen, daß (yn ) eine Cauchyfolge ist. In der Tat folgt aus der Parallelogrammgleichung (Satz V.1.7) yn + ym 2 yn − ym 2 + = 1 yn 2 + ym 2 → d2 f¨ ur n, m → ∞, 2 2 2 und wegen 12 (yn + ym ) ∈ K ist 12 (yn + ym ) 2 ≥ d2 . Daraus ergibt sich die Cauchy-Eigenschaft von (yn ). Da H vollst¨ andig ist, existiert x := lim yn , und da K abgeschlossen ist, ist x ∈ K. Wegen yn → d folgt x = d. Zur Eindeutigkeit: Erf¨ ullen x und x˜ x = ˜ x = inf y = d y∈K
und gilt x = x ˜, so folgt aus der Parallelogrammgleichung 2 2 x + x˜ 2 x + x ˜ 1 mit |xn2 , y1 | ≤ 1; achstes w¨ ahle n3 > n2 mit setze y2 = xn2 . Als n¨ |xn3 , y1 | ≤
1 2
und
|xn3 , y2 | ≤
1 ; 2
setze dann y3 = xn3 . Auf diese Weise wird induktiv eine Teilfolge (yn ) mit |yk+1 , yi | ≤
1 k
∀i = 1, . . . , k, k ∈ N
definiert. Daraus folgt k
|yk+1 , yi | ≤ 1
∀k ∈ N
i=1
sowie
n k−1 k=2 i=1
|yk , yi | ≤ n − 1
∀n ∈ N.
228
V.
Hilbertr¨ aume
Folglich n n n 1 2 1 yk ≤ 2 |yk , yi | n n k=1 k=1 i=1 n n k−1 1 2 = 2 yk + 2 |yk , yi | n i=1 k=1
k=2
n · M 2 + 2n − 2 ≤ → 0, n2 2
wie gew¨ unscht.
Als Anwendung wird jetzt gezeigt, wie Hilbertraummethoden bei der L¨ osung partieller Differentialgleichungen verwandt werden k¨onnen; dabei treten die Sobolevr¨ aume aus Definition V.1.12 auf. Sei Ω ⊂ Rn ein beschr¨ anktes Gebiet und f : Ω → R stetig. Betrachte folgendes Randwertproblem: • Finde u ∈ C 2 (Ω) ∩ C(Ω) mit −Δu = f u = 0
in Ω in ∂Ω
(V.25)
Durch partielle Integration folgt f¨ ur eine L¨ osung u der Differentialgleichung aus n Di2 u, ϕL2 = f, ϕL2 ∀ϕ ∈ D(Ω) − i=1
die Gleichung
n
Di u, Di ϕL2 = f, ϕL2
∀ϕ ∈ D(Ω).
i=1
Zur Abk¨ urzung f¨ uhren wir nun auf H01 (Ω) die Sesquilinearform [u, v] :=
n
Di u, Di vL2
i=1
(mit Di = schwache Ableitung) ein, und statt des urspr¨ unglichen Randwertproblems betrachte folgende Abschw¨ achung: • Finde u ∈ H01 (Ω) mit [u, ϕ] = f, ϕL2
∀ϕ ∈ D(Ω).
(V.26)
V.3
229
Orthogonalit¨ at
Die Randbedingung u|∂Ω = 0“ wird hierbei durch die Forderung u ∈ ” H01 (Ω) (= D(Ω) bzgl. . W 1 ) ausgedr¨ uckt. Das Problem (V.26) hat eine L¨ osung nach dem Satz von Fr´echet-Riesz. Um das zu zeigen, beachte zun¨ achst, daß f¨ ur f ∈ L2 (Ω) wegen |f, ϕL2 | ≤ f L2 ϕ L2 ≤ f L2 ϕ W 1 das lineare Funktional ϕ → ϕ, f stetig auf (D(Ω), . W 1 ) ist und daher eine Fortsetzung auf den Abschluß H01 (Ω) zul¨ aßt. Um den Zusammenhang von [ . , . ] mit dem Sobolev-Skalarprodukt . , . W 1 zu kl¨aren, ben¨otigen wir die wichtige Ungleichung von Poincar´e-Friedrichs: • Ist Ω ⊂ Rn beschr¨ankt, etwa Ω ⊂ (−s, s)n , so gilt u L2 ≤ 2s[u, u]1/2
∀u ∈ H01 (Ω).
Beweis hierf¨ ur. Da die rechte und die linke Seite der Ungleichung stetig bzgl. der . W 1 -Norm von u abh¨ angen, reicht es, diese f¨ ur u ∈ D(Ω) zu zeigen. Indem man solch ein u außerhalb von Ω durch 0 fortsetzt, erh¨alt ur man eine ebenfalls u genannte Funktion in D (−s, s)n , und es gilt f¨ x = (x1 , . . . , xn ) ∈ (−s, s)n x1 s ∂u ∂u u(x) = (t, x2 , . . . , xn ) dt = 1(−s,x1 ] (t) (t, x2 , . . . , xn ) dt. ∂x1 −s −s ∂x1 Die Cauchy-Schwarz-Ungleichung liefert s s 2 1(−s,x1 ] (t) dt |u(x)|2 ≤ −s
−s
2 ∂u ∂x1 (t, x2 , . . . , xn ) dt,
und da das erste Integral durch 2s abgesch¨ atzt werden kann, folgt s s |u(x)|2 dx = dx1 . . . dxn |u(x)|2 Ω
−s
−s
2 ∂u (t, x , . . . , x ) 2 n dt ∂x1 −s −s −s 2 s s s ∂u 2 = (2s) dx2 . . . dxn dt (t, x2 , . . . , xn ) ∂x1 −s −s −s 2 ∂u (x) dx ≤ 4s2 [u, u]. = 4s2 Ω ∂x1
≤ 2s
s
dx1 . . .
s
s
dxn
Eine Konsequenz dieser Ungleichung ist, daß auf H01 (Ω) die Sesquilinearform [ . , . ] ein Skalarprodukt ist, dessen abgeleitete Norm |||u||| = [u, u]1/2 zur W 1 -Norm ¨ aquivalent ist, denn |||u||| ≤ u W 1 ≤ (4s2 + 1)1/2 |||u|||
∀u ∈ H01 (Ω).
230
V.
Hilbertr¨ aume
Nach dem Satz von Fr´echet-Riesz l¨ aßt sich das stetige Funktional ϕ → f, ϕL2 auf dem Hilbertraum (H01 (Ω), [ . , . ]) gem¨aß (V.26) durch ein eindeutig bestimmtes u ∈ H01 (Ω) darstellen. Zusammengefaßt ergibt sich: • F¨ ur alle f ∈ L2 (Ω) existiert genau eine schwache L¨osung“ u ∈ H01 ” des Randwertproblems (V.25), d.h. des Problems (V.26). Man kann zeigen, daß f¨ ur f ∈ C ∞ (Ω) auch u ∈ C ∞ (Ω) ist (Weylsches Lemma); dazu kann man das Lemma von Sobolev (Satz V.2.12) verwenden.
V.4
Orthonormalbasen
In diesem Abschnitt ist H stets ein Hilbertraum. (Einige der folgenden Aussagen – in der Regel die weniger wichtigen – gelten auch f¨ ur Pr¨ahilbertr¨ aume.) Definition V.4.1 Eine Teilmenge S ⊂ H heißt Orthonormalsystem, falls e = 1 und e, f = 0 f¨ ur e, f ∈ S, e = f , gelten. Ein Orthonormalsystem S heißt Orthonormalbasis, falls S ⊂ T, T Orthonormalsystem
⇒
T =S
gilt. Eine Orthonormalbasis wird auch vollst¨andiges Orthonormalsystem genannt. Warum eine Orthonormalbasis Basis heißt, erkl¨art Satz V.4.9. (Es sei bereits jetzt betont, daß eine Orthonormalbasis keine Vektorraumbasis ist.) Beispiele. (a) In H = 2 ist die Menge S = {en : n ∈ N} der Einheitsvektoren ein Orthonormalsystem. (b) Sei H = L2 [0, 2π] und 1 1 1 S = √ 1 ∪ √ cos n · : n ∈ N ∪ √ sin n · : n ∈ N . π π 2π Dann ist S ein Orthonormalsystem, wie unschwer durch partielle Integration gezeigt werden kann. (c) In H = L2C [0, 2π] ist 1 in· S= √ e :n∈Z 2π ein Orthonormalsystem. (d) In H = AP2 (R) (Beispiel V.1(f)) ist S = {fλ : λ ∈ R} ein Orthonormalsystem. All diese Orthonormalsysteme sind sogar Orthonormalbasen, wie gleich gezeigt werden wird.
V.4
231
Orthonormalbasen
Satz V.4.2 (Gram-Schmidt-Verfahren) Sei {xn : n ∈ N} eine linear unabh¨angige Teilmenge von H. Dann existiert ein Orthonormalsystem S mit lin S = lin{xn : n ∈ N}. Beweis. Setze e1 = xx11 . Betrachte f2 = x2 − x2 , e1 e1 und e2 = ff22 . (Es ist f2 = 0, da {x1 , x2 } linear unabh¨ angig ist.) Dann ist e1 ⊥ e2 . Durch die Vorschrift k fk+1 = xk+1 − xk+1 , ei ei i=1
und ek+1 =
fk+1 fk+1
(beachte fk+1 = 0) wird so eine Folge (ek ) definiert. Nach Konstruktion ist S := {e1 , e2 , . . .} ein Orthonormalsystem mit xn ∈ lin S,
en ∈ lin{xr : r ∈ N}
∀n ∈ N.
(Letzteres folgt durch Induktion.) Daher ist auch lin S = lin{xn : n ∈ N}.
2
Beispiel. (e) Wendet man das Gram-Schmidt-Verfahren auf H = L2 [−1, 1] und xn mit xn (t) = tn , n ≥ 0, an, erh¨ alt man (vgl. Aufgabe V.6.2) + en (t) = n + 12 Pn (t), wo
n d 1 (t2 − 1)n . Pn (t) = n 2 n! dt
Die Pn heißen Legendrepolynome. Auch dieses Orthonormalsystem ist eine Orthonormalbasis. Satz V.4.3 (Besselsche Ungleichung) Ist {en : n ∈ N} ein Orthonormalsystem und x ∈ H, so ist ∞
|x, en |2 ≤ x 2 .
n=1
N Beweis. Sei N ∈ N beliebig. Setze xN = x− n=1 x, en en , so daß xN ⊥ ek f¨ ur k = 1, . . . , N gilt. Es folgt aus dem Satz von Pythagoras (V.22) x
2
2 N = xN + x, en en 2
n=1
232
V.
= xN 2 +
N
Hilbertr¨ aume
|x, en |2
n=1
≥
N
|x, en |2 .
n=1
Da N beliebig war, folgt die Behauptung.
2
Wir werden die folgenden unmittelbaren Konsequenzen ben¨otigen. Lemma V.4.4 Sei {en : n ∈ N} ein Orthonormalsystem, und seien x, y ∈ H. Dann gilt ∞ |x, en en , y| < ∞. n=1
Beweis. Das folgt aus der H¨ olderschen Ungleichung (p = q = 2 in Satz I.1.4) und Satz V.4.3. 2 Lemma V.4.5 Sei S ⊂ H ein Orthonormalsystem, und sei x ∈ H. Dann ist Sx := {e ∈ S: x, e = 0} h¨ochstens abz¨ahlbar. Beweis. Nach der Besselschen Ungleichung ist jede der Mengen " 1# Sx,n := e ∈ S: |x, e| ≥ n ahlbar (oder endlich). endlich und daher Sx = n∈N Sx,n abz¨
2
Um auch nichtseparable Hilbertr¨ aume behandeln zu k¨onnen, ist es notwendig, das Konzept der unbedingten Konvergenz einer Familie von Vektoren einzuf¨ uhren. Definition V.4.6 Sei X ein normierter Raum und I eine Indexmenge. Seien xi ∈ X f¨ ur i ∈ I. Man sagt, die Reihe i∈I xi konvergiere unbedingt gegen x ∈ X, falls (a) I0 = {i: xi = 0} h¨ ochstens abz¨ ahlbar ist, (b) f¨ ur jede Aufz¨ ahlung I0 = {i1 , i2 , . . .} die Gleichung ∞ n=1 xin = x gilt. ∞ Der Wert der Reihe n=1 xin h¨ angt also nicht von der Reihenfolge der xin ab. Schreibweise: xi = x i∈I
(vgl. Beispiel V.1(e)).
V.4
233
Orthonormalbasen
∞ Selbst f¨ ur I = N sind die Symbole n∈N und n=1 in diesem Abschnitt zu unterscheiden. ¨ von absoluter und F¨ ur X = K (bzw. Kn ) gilt bekanntlich die Aquivalenz unbedingter Konvergenz. Im Unendlichdimensionalen fallen diese Begriffe hingegen auseinander, denn der Satz von Dvoretzky-Rogers besagt: • In jedem unendlichdimensionalen Banachraum existiert eine unbedingt konvergente Reihe, die nicht absolut konvergiert. Aus Lemma V.4.5 und Satz V.4.3 folgt nun: Korollar V.4.7 (allgemeine Besselsche Ungleichung f¨ ur Orthonormalsysteme) Ist S ⊂ H ein Orthonormalsystem und x ∈ H, so ist |x, e|2 ≤ x 2 . e∈S
Satz V.4.8 Sei S ⊂ H ein Orthonormalsystem. (a) F¨ ur alle x ∈ H konvergiert e∈S x, ee unbedingt. (b) P : x → e∈S x, ee ist die Orthogonalprojektion auf lin S. ahlung von {e ∈ S: x, e = 0}. Wir Beweis. (a) Sei {e 1 , e2 , . . .} eine Aufz¨ ∞ zeigen zuerst, daß n=1 x, en en eine Cauchyreihe ist. Es gilt n¨amlich nach dem Satz von Pythagoras und nach Satz V.4.3 2 M M x, en en = |x, en |2 → 0 n=N n=N f¨ ur N, M → ∞. Damit existiert y := ∞ ur n=1 x, en en in H und analog f¨ eine Permutation π: N → N die umgeordnete Reihe yπ :=
∞
x, eπ(n) eπ(n) .
n=1
Es ist y = yπ zu zeigen. Sei dazu z ∈ H beliebig. Wegen y, z =
∞
x, en en , z =
n=1
∞
x, eπ(n) eπ(n) , z = yπ , z
n=1
gilt y − yπ ∈ H ⊥ = {0}; f¨ ur den mittleren Schritt haben wir die absolute und ergo unbedingte Konvergenz dieser Reihe (Lemma V.4.4) ausgenutzt. (b) Nach Theorem V.3.4 (insbesondere (V.24)) ist x − P x ∈ (lin S)⊥ = ⊥ S zu zeigen, d.h., daß . ∞ x− x, en en , e = 0 ∀e ∈ S n=1
gilt. Das ist jedoch klar f¨ ur x, e = 0, d.h. e, en = 0 f¨ ur alle n, sowie f¨ ur e = en0 . 2
234
V.
Hilbertr¨ aume
Wir behandeln jetzt Orthonormalbasen. Satz V.4.9 Sei S ⊂ H ein Orthonormalsystem. (a) Es existiert eine Orthonormalbasis S mit S ⊂ S . (b) Die folgenden Aussagen sind ¨aquivalent: (i) S ist eine Orthonormalbasis. (ii) Ist x ∈ H und x ⊥ S, so ist x = 0. (iii) Es gilt H = lin S. (iv) x = x, ee ∀x ∈ H. e∈S (v) x, y = x, ee, y ∀x, y ∈ H. e∈S
(vi) (Parsevalsche Gleichung) x 2 =
|x, e|2
∀x ∈ H.
e∈S
Beweis. (a) ist eine unmittelbare Konsequenz des Zornschen Lemmas. (Ist H separabel, kann eine Orthonormalbasis konstruktiv aus dem GramSchmidt-Verfahren gewonnen werden.) (b) (i) ⇒ (ii): W¨ are x = 0, so w¨ are S ∪ {x/ x } ein Orthonormalsystem. (ii) ⇒ (iii): Korollar V.3.5. (iii) ⇒ (iv): Satz V.4.8. (iv) ⇒ (v): Einsetzen, beachte Korollar V.4.7 und Lemma V.4.4. (v) ⇒ (vi): Setze x = y. (vi) ⇒ (i): Sonst existierte x mit x = 1, so daß S ∪ {x} ein Orthonormalsystem ist; folglich erg¨ abe sich der Widerspruch e∈S |x, e|2 = 0. 2 Die Bedingung (iv) legt die Bezeichnung Basis“ nahe. Es kann sich ” nat¨ urlich nicht um eine Vektorraumbasis handeln (es sei denn dim H < ∞), da bei einer solchen alle Summen endlich viele Summanden haben m¨ ussen. Wir kommen nun zu den obigen Beispielen zur¨ uck. Beispiele. (a) Hier ist nach Definition 2 = lin S, also ist S eine Orthonormalbasis. Allgemeiner ist {ei : i ∈ I} eine Orthonormalbasis von 2 (I), wo ei (j) = δij ist (δij = Kronecker-Symbol). (b) Wir zeigen auch hier lin S = L2 [0, 2π]. Ohne Einschr¨ankung (warum?) sei K = R. lin S ist die Menge der trigonometrischen Polynome, und die liegt nach Korollar IV.2.12 dicht in V = {f ∈ C[0, 2π]: f (0) = f (2π)} bzgl. . ∞ , also erst recht bzgl. . L2 , und V liegt dicht in L2 [0, 2π], denn C[0, 2π] tut es (Satz I.2.12). Deshalb liegt lin S dicht in L2 [0, 2π]. (Daß V L2 -dicht in L2 [0, 2π] liegt, folgt auch aus Lemma V.1.10.)
V.4
235
Orthonormalbasen
(c) Da cos nt = 12 eint + e−int , sin nt = cos nt + i sin nt gilt, ist
1 2i
int e − e−int und eint =
lin S = {f : f ist C-wertiges trigonometrisches Polynom}. Nach (b) liegt lin S dicht, und S ist eine Orthonormalbasis. (d) Nach Definition ist lin S = AP2 (R). (e) Es ist L2 [−1, 1] = lin{xn : n ≥ 0} = lin S nach den S¨atzen I.2.10, I.2.12 und V.4.2. Wir kommen noch einmal auf (b) zur¨ uck. Ist S wie dort und x ∈ L2 [0, 2π], so sind die x, e genau die in (IV.4) vorkommenden Fourierkoeffizienten von x, e∈S x, ee ist die Fourierreihe von x, und Bedingung (iv) in Satz V.4.9(b) besagt, daß f¨ ur x ∈ L2 [0, 2π] die Fourierreihe im quadratischen Mittel gegen x konvergiert. In der Fourieranalysis ist es h¨aufig bequemer, mit der Entwicklung in die Orthonormalbasis aus Beispiel (c) zu arbeiten; so soll im folgenden unter der Fourierreihe einer integrierbaren Funktion f die Reihe ∞ cn eint n=−∞
mit cn =
1 2π
2π
f (t)e−int dt
0
verstanden werden. Manche Autoren verwenden die Bezeichnung Fourierreihe bei beliebigen Orthonormalbasen in allgemeinen Hilbertr¨ aumen. Korollar V.4.10 F¨ ur einen unendlichdimensionalen Hilbertraum H sind folgende Bedingungen ¨aquivalent: (i) H ist separabel. (ii) Alle Orthonormalbasen sind abz¨ahlbar. (iii) Es gibt eine abz¨ahlbare Orthonormalbasis. √ Beweis. (i) ⇒ (ii): Sei S eine Orthonormalbasis von H. Da e − f = 2 f¨ ur alle e, f ∈ S, e = f , gilt, kann S nicht u ¨ berabz¨ahlbar sein (vgl. den Beweis der Inseparabilit¨ at von ∞ , S. 29). (ii) ⇒ (iii): Das ist klar (beachte noch Satz V.4.9(a)). (iii) ⇒ (i) folgt aus Satz V.4.9(b)(iii) und Lemma I.2.9. 2 Allgemeiner gilt, wenn |S| die Kardinalzahl von S bezeichnet: Lemma V.4.11 Sind S und T Orthonormalbasen von H, so ist |S| = |T |.
236
V.
Hilbertr¨ aume
Beweis. F¨ ur endliche S ist das aus der linearen Algebra klar. Sei also |S| ≥ |N|. Zu x ∈ S setze Tx = {y ∈ T : x, y =0}. Dann ist (Lemma V.4.5) |Tx | ≤ |N|. Nach Satz V.4.9(b)(ii) gilt T ⊂ x∈S Tx , daher |T | ≤ |S| |N| = |S|. Aus Symmetriegr¨ unden gilt auch |S| ≤ |T |, daher ist nach dem Satz von Schr¨ oder-Bernstein aus der Mengenlehre |S| = |T |. 2 Man nennt die Kardinalzahl |S| einer Orthonormalbasis die Hilbertraumdimension von H; sie ist nach Lemma V.4.11 wohldefiniert. Satz V.4.12 Ist S eine Orthonormalbasis von H, so ist H ∼ = 2 (S). Beweis. Zu x ∈ H definiere T x ∈ 2 (S) durch (T x)(e) = x, e. (Aus der Besselschen Ungleichung folgt T x ∈ 2 (S).) T : H → 2 (S) ist linear und nach der Parsevalschen Gleichung isometrisch. Ist (fe )e∈S ∈ 2 (S), so defi niert x = e∈S fe e ein Element von H (der Beweis von Satz V.4.8(a) zeigt das), und es gilt T x = (fe )e∈S . Daher ist T ein isometrischer Isomorphismus. 2 Beachte, daß T sogar T x, T y = x, y erf¨ ullt (Satz V.4.9(b)(v)), d.h. T ist unit¨ ar“ (siehe Abschnitt V.5). ” Korollar V.4.13 Ist H separabel und unendlichdimensional, so ist H ∼ = 2 . Korollar V.4.14 (Satz von Fischer-Riesz) L2 [0, 1] ∼ = 2 .
V.5
Operatoren auf Hilbertr¨ aumen
Auch in diesem Abschnitt bezeichnet H (oder Hi ) immer einen Hilbertraum. Definition V.5.1 Sei T ∈ L(H1 , H2 ), und sei Φi : Hi → Hi der kanonische konjugiert lineare isometrische Isomorphismus aus Theorem V.3.6. Der zu T (im Hilbertraumsinn) adjungierte Operator T ∗ ist T ∗ = Φ−1 1 T Φ2 . Mit anderen Worten gilt T x, yH2 = x, T ∗ yH1
∀x ∈ H1 , y ∈ H2 .
Satz V.5.2 Seien S, T ∈ L(H1 , H2 ), R ∈ L(H2 , H3 ), λ ∈ K. (a) (S + T )∗ = S ∗ + T ∗ . (b) (λS)∗ = λS ∗ . (c) (RS)∗ = S ∗ R∗ . (d) S ∗ ∈ L(H2 , H1 ) und S = S ∗ . (e) S ∗∗ = S.
V.5
237
Operatoren auf Hilbertr¨ aumen
(f) SS ∗ = S ∗ S = S 2 . (g) ker S = (ran S ∗ )⊥ , ker S ∗ = (ran S)⊥ ; insbesondere ist S genau dann injektiv, wenn ran S ∗ dicht liegt. Die Abbildung S → S ∗ ist also eine konjugiert lineare surjektive Iso¨ metrie zwischen L(H1 , H2 ) und L(H2 , H1 ). Beachte die Ahnlichkeit dieser Abbildung mit λ → λ auf C. Beweis. (a)–(d) folgen sofort aus den entsprechenden Eigenschaften von S → S , und (e) ist klar. (f) Es gilt Sx 2 = Sx, Sx = x, S ∗ Sx ≤ x S ∗ Sx , also S 2 = sup Sx 2 ≤ sup x S ∗ Sx ≤ S ∗ S ≤ S ∗ S = S 2 ,
x ≤1
x ≤1
(letzteres nach (d)). Daher ist S 2 = S ∗ S und folglich S 2 = S ∗ 2 = S ∗∗ S ∗ = SS ∗ . (g) Es gilt ker S = (ran S ∗ )⊥ , denn Sx = 0
⇔
Sx, y = 0 ∀y ∈ H2
⇔ ⇔
x, S ∗ y = 0 ∀y ∈ H2 x ∈ (ran S ∗ )⊥ ,
und daher auch ker S ∗ = (ran S ∗∗ )⊥ = (ran S)⊥ .
2
Wir definieren jetzt wichtige Klassen von Hilbertraumoperatoren. Definition V.5.3 Sei T ∈ L(H1 , H2 ). (a) T heißt unit¨ar, falls T invertierbar ist mit T T ∗ = IdH2 , T ∗ T = IdH1 . (b) Sei H1 = H2 . T heißt selbstadjungiert (oder hermitesch), falls T = T ∗. (c) Sei H1 = H2 . T heißt normal, falls T T ∗ = T ∗ T . Unit¨ are Operatoren sind also durch • T ist surjektiv und T x, T y = x, y selbstadjungierte durch • T x, y = x, T y ∀x, y ∈ H1 ,
∀x, y ∈ H1 ,
238
V.
Hilbertr¨ aume
normale durch • T x, T y = T ∗ x, T ∗ y ∀x, y ∈ H1 gekennzeichnet. Offensichtlich sind selbstadjungierte und (im Fall H1 = H2 ) unit¨ are Operatoren normal. Beispiele. (a) Sei H = Kn . Wird T ∈ L(H) durch die Matrix (aij )i,j dargestellt, so wird T ∗ durch (aji )i,j dargestellt. Definition V.5.3 verallgemeinert also bekannte Begriffe der linearen Algebra. (b) Sei H = L2 [0, 1] und Tk ∈ L(H) der Integraloperator 1 (Tk x)(s) = k(s, t) x(t) dt 0
Tk∗
(Beispiel II.1(m)). Dann ist = Tk∗ mit k ∗ (s, t) = k(t, s). (Vgl. Beispiel III.4(c), beachte das Komplexkonjugieren!) Dies kann als kontinuierliches Analogon von Beispiel (a) aufgefaßt werden. Tk ist genau dann selbstadjungiert, wenn k(s, t) = k(t, s) fast u ¨berall gilt; man nennt k dann einen symmetrischen Kern. 2 2 (c) Sei T : → der Shiftoperator (s1 , s2 , . . .) → (s2 , s3 , . . .). Dann ist ∗ T (t1 , t2 , . . .) = (0, t1 , t2 , . . .) (vgl. Beispiel III.4(a)). T ist nicht normal, denn T T ∗ = Id, T ∗ T = PU mit U = {(si ): s1 = 0}. (d) T ∗ T und T T ∗ sind stets selbstadjungiert. (e) Die in Abschnitt V.2 studierte Fouriertransformation F : L2 (Rn ) → 2 L (Rn ) ist nach der Plancherel-Gleichung (V.16) ein unit¨arer Operator, denn F ist surjektiv. Lemma V.5.4 F¨ ur T ∈ L(H1 , H2 ) sind ¨aquivalent: (i) T ist eine Isometrie. (ii) T x, T y = x, y ∀x, y ∈ H1 . Beweis. (ii) ⇒ (i): Setze x = y. (i) ⇒ (ii): Das folgt sofort aus (V.2) bzw. (V.3).
2
Das Lemma besagt geometrisch, daß ein l¨angenerhaltender Operator winkelerhaltend ist. Im weiteren werden selbstadjungierte Operatoren etwas n¨aher untersucht, nichttriviale Resultate folgen (mit Ausnahme von Satz V.5.5) erst in Kapitel VI. Satz V.5.5 (Satz von Hellinger-Toeplitz) Erf¨ ullt eine lineare Abbildung T : H → H die Symmetriebedingung T x, y = x, T y
∀x, y ∈ H,
so ist T stetig und folglich selbstadjungiert.
V.5
239
Operatoren auf Hilbertr¨ aumen
Beweis. Nach dem Satz von abgeschlossenen Graphen (Theorem IV.4.5) ist zu zeigen: xn → 0, T xn → z ⇒ z = 0. In der Tat ist z, z = lim T xn , z = limT xn , z = limxn , T z = 0.
2
Satz V.5.6 Sei K = C. Dann sind f¨ ur T ∈ L(H) ¨aquivalent: (i) T ist selbstadjungiert. (ii) T x, x ∈ R ∀x ∈ H. Beweis. (i) ⇒ (ii) gilt wegen T x, x = x, T ∗ x = x, T x = T x, x. (ii) ⇒ (i): F¨ ur λ ∈ C betrachte die reelle Zahl T (x + λy), x + λy = T x, x + λT x, y + λT y, x + |λ|2 T y, y. Durch Bilden des konjugiert Komplexen erh¨ alt man T (x + λy), x + λy = T x, x + λy, T x + λx, T y + |λ|2 T y, y. Indem man λ = 1 und λ = −i einsetzt, folgt T x, y + T y, x = y, T x + x, T y T x, y − T y, x = −y, T x + x, T y und daraus T x, y = x, T y, wie gew¨ unscht.
2
Die im Beweis angewandte Technik, x + λy zu betrachten, nennt man Polarisierung. Satz V.5.7 F¨ ur selbstadjungiertes T ∈ L(H) ist T = sup |T x, x|.
x ≤1
Beweis. ≥“ ist klar. Umgekehrt setze M := sup x ≤1 |T x, x|. Aus T = T ∗ ” folgt durch simples Ausrechnen T (x + y), x + y − T (x − y), x − y = 2T x, y + 2T y, x = 2T x, y + 2x, T y = 4 ReT x, y. Daher gilt wegen der Parallelogrammgleichung 4 ReT x, y ≤ M ( x + y 2 + x − y 2 ) = 2M ( x 2 + y 2 )
240
V.
Hilbertr¨ aume
und folglich ReT x, y ≤ M
∀ x , y ≤ 1.
Nach Multiplikation mit einem geeigneten λ, |λ| = 1, erh¨alt man |T x, y| ≤ M
∀ x , y ≤ 1
und deshalb T ≤ M .
2
Korollar V.5.8 Ist T ∈ L(H) selbstadjungiert und gilt T x, x = 0 f¨ ur alle x ∈ H, so ist T = 0. F¨ ur K = C folgt die Selbstadjungiertheit automatisch aus der zweiten Voraussetzung und Satz V.5.6. Im Fall K = R kann man auf T = T ∗ im allgemeinen nicht verzichten: F¨ ur H = R2 und 0 1 T = −1 0 (= Drehung um 90◦ ) ist stets T x, x = 0. Abschließend sollen die selbstadjungierten Projektionen charakterisiert werden. Satz V.5.9 Sei P ∈ L(H) eine Projektion mit P = 0. Dann sind folgende Bedingungen ¨aquivalent: (i) P ist eine Orthogonalprojektion (d.h. ran(P ) ⊥ ker(P )). (ii) P = 1. (iii) P ist selbstadjungiert. (iv) P ist normal. (v) P x, x ≥ 0 ∀x ∈ H. Beweis. (i) ⇒ (ii): Theorem V.3.4. (ii) ⇒ (i): Seien x ∈ ker(P ), y ∈ ran(P ), λ ∈ K; dann gilt P (x + λy) = λy. Folglich ist λy 2 = P (x + λy) 2 ≤ x + λy 2 = x 2 + 2 Re λx, y + λy 2 und deshalb −λ Rex, y ≤ x 2
∀λ ∈ R.
Also erh¨ alt man Rex, y = 0 und genauso, indem man λ ∈ iR betrachtet, Imx, y = 0. Daher folgt (i). (i) ⇒ (iii): Es ist P x, y = P x, P y + (y − P y) = P x, P y, denn y − P y ∈ ker P , und x, P y = P x + (x − P x), P y = P x, P y.
241
V.6 Aufgaben
(iii) ⇒ (iv): Das ist klar. (iv) ⇒ (i): Es ist 0 = (P ∗ P − P P ∗ )x, x = P x 2 − P ∗ x 2
∀x ∈ H,
also ker(P ) = ker(P ∗ ) = ran(P )⊥ (Satz V.5.2(g)). (iii) ⇒ (v): P x, x = P 2 x, x = P x, P x = P x 2 ≥ 0. (v) ⇒ (i): F¨ ur x ∈ ker(P ), y ∈ ran(P ), λ ∈ R gilt 0 ≤ P (x + λy), x + λy = λy, x + λy = λ2 y 2 + λy, x, daher y, x ≥ −λ y 2
∀λ > 0,
y, x ≤ −λ y 2
∀λ < 0,
woraus x, y = 0 folgt.
2
Im Beweis von (iv) ⇒ (i) haben wir folgende Aussage mitbewiesen, die in Kapitel VI von Nutzen sein wird. Lemma V.5.10 Ist T ∈ L(H) ein normaler Operator, so gilt T x = T ∗ x
∀x ∈ H.
Speziell ist ker T = ker T ∗ .
V.6
Aufgaben
Aufgabe V.6.1 Sei w ∈ CR [0, 1]. Betrachte auf C[0, 1] × C[0, 1] die Abbildung
1
. , . w : (x, y) →
x(t)y(t)w(t) dt. 0
Gib notwendige und hinreichende Bedingungen daf¨ ur an, daß . , . w ein Skaaquivalent zur vom larprodukt ist. Wann ist die von . , . w abgeleitete Norm ¨ 1 u ¨ blichen Skalarprodukt (x, y) → 0 x(t)y(t) dt abgeleiteten Norm? Aufgabe V.6.2 Gib die Details des Beispiels V.4(e) u ¨ ber Legendrepolynome (S. 231) nach folgender Anleitung. Zeige nacheinander die folgenden Aussagen f¨ ur t ∈ [−1, 1] und n = 0, 1, 2, . . . : (a) Pn (1) = 1. 1 dn+1 2 (b) Pn+1 (t) = n t(t − 1)n . n+1 2 n! dt (t) = (2n + 1)Pn (t) + Pn−1 (t). (c) Pn+1 (d) Pn+1 (t) = tPn (t) + (n + 1)Pn (t). (t). (e) nPn (t) = tPn (t) − Pn−1
242
V.
Hilbertr¨ aume
(f) (1 − t2 )Pn (t) = nPn−1 (t) − ntPn (t). mit Hilfe von (e).) (Verwende (d) mit n − 1 statt n und eliminiere Pn−1 d 2 (g) Qn (t) := (1 − t )Pn (t) + n(n + 1)Pn (t) = 0. dt (Differenziere (f) und benutze (e).) (h) F¨ ur n = m sind Pn und Pm orthogonal in L2 [−1, 1]. (Betrachte Qn Pm − Qm Pn und integriere partiell.) (i) Rn (t) := (n + 1)Pn+1 (t) − (2n + 1)tPn (t) + nPn−1 (t) = 0. (Verwende (c), (e) und (a).) 1 1 2n − 1 Pn (t)2 dt = Pn−1 (t)2 dt f¨ ur n = 2, 3, . . . . (j) 2n + 1 −1 −1 (Betrachte (2n + 1)Rn−1 Pn − (2n − 1)Rn Pn−1 , integriere partiell und beachte (h).) & n + 12 Pn ist eine Orthonormalbasis von L2 [−1, 1], die durch Orthonor(k) malisierung der Funktionen xn , xn (t) = tn , entsteht. 2
Aufgabe V.6.3 Die lineare H¨ ulle der durch fn (x) = xn e−x /2 , n ≥ 0, definierten Funktionen liegt dicht in L2 (R). (Hinweis: Zeige dazu, daß die Fouriertrans2 formierte von x → f (x)e−x /2 verschwindet, wenn f zu allen fn orthogonal ist.) Durch Orthonormalisierung erh¨ alt man also eine Orthonormalbasis von L2 (R), 2 die aus Funktionen der Gestalt Hn (x) = Pn (x)e−x /2 besteht, wo Pn ein Polynom vom Grad n ist. Die Pn heißen Hermitepolynome, die Hn Hermitefunktionen. Berechne die ersten Hermitefunktionen. Aufgabe V.6.4 Zeige, daß in Beispiel V.1(f) ein Skalarprodukt auf √ durch (V.5) ur λ = λ . X definiert wird, und zeige fλ − fλ = 2 f¨ ¨ Aufgabe V.6.5 In einem Hilbertraum gilt die Aquivalenz
xn → x ⇐⇒
σ
xn → x xn → x
Aufgabe V.6.6 (Partielle Integration) ager. Dann gilt (a) Sei f : Rn → C stetig differenzierbar mit kompaktem Tr¨
Rn
∂f (x) dx = 0 ∂xj
∀j = 1, . . . , n.
(Tip: Satz von Fubini.) (b) Seien f, g: Rn → C stetig differenzierbar, und eine der Funktionen besitze einen kompakten Tr¨ ager. Dann gilt
Rn
∂f (x)g(x) dx = − ∂xj
f (x) Rn
∂g (x) dx ∂xj
∀j = 1, . . . , n.
(c) Sei Ω ⊂ Rn offen, seien f, g: Ω → C stetig differenzierbar, und eine der Funktionen besitze einen kompakten Tr¨ ager (in Ω!). Dann gilt
Ω
∂f (x)g(x) dx = − ∂xj
f (x) Ω
∂g (x) dx ∂xj
(Tip: Setze die Funktion f g kanonisch auf Rn fort.)
∀j = 1, . . . , n.
V.6
243
Aufgaben
Aufgabe V.6.7 Sei f ∈ W m (Rn ). Dann gilt f¨ ur |α| ≤ m D(α) f, ϕ = (−1)|α| f, Dα ϕ f¨ ur alle Schwartzfunktionen ϕ. Aufgabe V.6.8 Seien Ω ⊂ Rn offen, f ∈ W m (Ω) und ϕ ∈ D (Ω). Dann ist ϕf ∈ W m (Ω), und es gilt die Leibnizformel D
(α)
(ϕf ) =
α
β≤α
β
Dβ ϕD(α−β) f ;
hier bedeutet β ≤ α, daß alle βj ≤ αj sind, und
α β
=
α1 β1
···
αn βn
.
α Aufgabe V.6.9 Sei Ω = {x ∈ R2 : |x| < 12 }, f (x) = log |x| . F¨ ur welche α ∈ R
ist f ∈ L2 (Ω) bzw. f ∈ L∞ (Ω) bzw. f ∈ W 1 (Ω)? Im letzten Fall bestimme ∂ f und ∂x∂ 2 f . Durch passende Wahl von α gib ein die schwachen Ableitungen ∂x 1 Gegenbeispiel f¨ ur das Sobolevlemma im Fall des Grenzexponenten m = k + n2 an. Aufgabe V.6.10 Zeige die Stetigkeit des verallgemeinerten Differentiationsoperators D(α) : W m+|α| (Ω) → W m (Ω).
Aufgabe V.6.11 Sei Ω ⊂ Rn offen, H = H0m (Ω). Dann ist f¨ ur jedes f ∈ L2 (Ω) die Abbildung g → g, f L2 (Ω) ein stetiges lineares Funktional auf H. Definiere andigung von f −m als Norm dieses Funktionals und zeige, daß die Vervollst¨ (L2 (Ω), . −m ) isometrisch isomorph zu H ist. Aufgabe V.6.12 W m (Rn ) = H0m (Rn ) [Zeige zuerst wie in Lemma V.1.10, daß W m (Rn ) ∩ C ∞ (Rn ) dicht liegt.] ankt [diese Voraussetzung wird nur der Aufgabe V.6.13 Sei Ω ⊂ Rn beschr¨ Einfachheit halber gemacht] und f eine reellwertige Funktion in H01 (Ω). ankter Ableitung, h(0) = 0 (a) Ist h: R → R eine C ∞ -Funktion mit beschr¨ und sup |h(t)/t| < ∞, so ist h ◦ f ∈ H01 (Ω) mit schwachen Ableitungen Dj (h ◦ f ) = (h ◦ f ) · Dj f . (Hinweis: Es ist hilfreich zu wissen, daß jede L2 -konvergente Folge eine fast u aßt.) ¨ berall konvergente Teilfolge zul¨ (b) Es ist |f | ∈ H01 (Ω) mit schwachen Ableitungen Dj (|f |) = (1{f >0} − 1{f 0 ∀x ∈ H so ist T invertierbar mit T −1 ≤
B(x, x) ≥ m x2 , 1 . m
Aufgabe V.6.19 Sei H ein Hilbertraum, der aus auf einer Menge S definierten Funktionen besteht. Ein reproduzierender Kern f¨ ur H ist eine Funktion k: S×S → K mit folgenden Eigenschaften, wobei kt (s) = k(s, t): kt ∈ H, f (t) = f, kt
∀t ∈ S, f ∈ H.
(a) Wenn ein reproduzierender Kern existiert, ist er eindeutig bestimmt. (b) Genau dann existiert ein reproduzierender Kern, wenn alle Funktionale f → f (t) (t ∈ S) stetig auf H sind. (c) Wenn k ein reproduzierender Kern ist, liegt die lineare H¨ ulle der kt , t ∈ S, dicht in H. (d) Bestimme den reproduzierenden Kern f¨ ur den zweidimensionalen Unterraum H von L2 [0, 1], der aus allen Funktionen der Form f (t) = a + bt besteht.
V.6
245
Aufgaben
Aufgabe V.6.20 Es sei H ein reeller Hilbertraum, ∈ H und B: H × H → R eine symmetrische, beschr¨ ankte und koerzitive Bilinearform; es gelte also f¨ ur geeignete Konstanten M, m > 0 und alle x, y ∈ H |B(x, y)| ≤ M x y,
B(x, x) ≥ mx2 .
Setze J: H → R, J(x) = B(x, x) − 2(x). (a) J ist stetig und nach unten beschr¨ ankt. ¨ (b) F¨ ur ein u ∈ H gilt die Aquivalenz J(u) ≤ J(x) ∀x ∈ H ⇔ B(u, x) = (x) ∀x ∈ H. (c) J nimmt sein Minimum an genau einer Stelle an. [Dies ist die abstrakte Fassung des Dirichletschen Prinzips, mit dessen Hilfe elliptische partielle Differentialgleichungen gel¨ ost werden k¨ onnen; siehe etwa Jost [1998].] Aufgabe V.6.21 (a) Die Rademacherfunktionen rn (t) = sign sin(2n πt), n = 0, 1, 2, . . . , bilden ein Orthonormalsystem, aber keine Orthonormalbasis von L2 [0, 1]. n−1 r (t) = 0 f¨ ur fast alle t ∈ [0, 1]. (b) limn→∞ n1 k=0 k (Hinweis: Betrachte Beppo Levi.)
1 $ 1 n−1 0
n
k=0
%4
rk (t) dt und verwende den Satz von
Aufgabe V.6.22 Zu ψ = χ[0,1/2) − χ(1/2,1] setze ψj,k (t) = 2k/2 ψ(2k t − j), j, k ∈ ur n = Z. Die Haarschen Funktionen hn : [0, 1] → R sind wie folgt definiert: F¨ 2k + j ≥ 1 (k = 0, 1, 2, . . . , j = 1, . . . , 2k − 1) setze hn (t) = ψj,k (t) auf [0, 1) und erg¨ anze diese Funktionen stetig bei t = 1; ferner sei h0 (t) = 1 auf [0, 1]. (Skizze!) (a) {hn : n ≥ 0} ist ein Orthonormalsystem in L2 [0, 1], und {ψj,k : j, k ∈ Z} ist ein Orthonormalsystem in L2 (R). 2m −1 (b) f → f, hn hn ist die Orthogonalprojektion auf den Unterraum n=0 der auf den Intervallen [r2−m , (r + 1)2−m ) konstanten Funktionen in L2 [0, 1]. ∞ f, hn hn gleichm¨ aßig ge(c) F¨ ur f ∈ C[0, 1] konvergiert die Reihe n=0 gen f . (d) Die hn bilden eine Orthonormalbasis von L2 [0, 1]. (e) Die ψj,k bilden eine Orthonormalbasis von L2 (R). Aufgabe V.6.23 In einem normierten Raum X sind a ¨quivalent: x konvergiert unbedingt gegen x (Definition V.4.6). (i) i∈I i (ii) F¨ ur alle ε > 0 existiert eine endliche Teilmenge F ⊂ I derart, daß f¨ ur alle F ⊂ G ⊂ I, G endlich, gilt:
xi − x ≤ ε. i∈G
Aufgabe V.6.24 Gib Beispiele f¨ ur unbedingt, aber nicht absolut konvergente ur 1 < p ≤ ∞. Reihen in den Banachr¨ aumen p f¨
246
V.
Hilbertr¨ aume
Aufgabe V.6.25 Betrachte die Funktion f : [0, 1] → R, f (t) = log(1 + t). (a) Die Taylorreihe von f um t0 = 0 konvergiert gegen f in der Norm von C[0, 1]. (b) Jede in C[0, 1] konvergente Umordnung der Taylorreihe konvergiert ebenfalls gegen f . (c) Die Taylorreihe ist in C[0, 1] nicht unbedingt konvergent. (d) Gelten die Aussagen (a)–(c) auch in L2 [0, 1]? Aufgabe V.6.26 Sei fj,k die Indikatorfunktion des Intervalls (j2−k , (j + 1)2−k ), k = 0, 1, 2, . . . , j = 0, . . . , 2k − 1, und sei gj,k = −fj,k . (a) Die Reihe ∞
xk = f0,0 + g0,0 + f0,1 + g0,1 + f1,1 + g1,1 + f0,2 + · · ·
k=1
konvergiert in L2 [0, 1] gegen 0. (b) Die Umordnung f0,0 + f0,1 + f1,1 + g0,0 + f0,2 + f1,2 + g0,1 + f2,2 + f3,2 + g1,1 + · · · konvergiert gegen die konstante Funktion 1. ∞ (c) Die Menge {x ∈ L2 [0, 1]: es gibt eine Umordnung mit x = x } k=1 π(k) ist nicht konvex. (Tip: Alle xn sind Z-wertig.) Aufgabe V.6.27 Sei (xn )n∈N eine Folge paarweise orthogonaler Elemente eines Hilbertraums H. Dann sind die folgenden Behauptungen ¨ aquivalent: ∞ (i) n=1 xn ist konvergent. ∞ (ii) n=1 xn 2 ist konvergent. ∞ x ist schwach konvergent (d.h., die Folge der Partialsummen ist (iii) n=1 n schwach konvergent). . , xn } ein Orthonormalsystem Aufgabe V.6.28 Seien H ein Hilbertraum, {x1 , . . n und x ∈ H. Finde Zahlen α1 , . . . , αn , so daß x − k=1 αk xk minimal ist. Aufgabe V.6.29 Die Norm eines Hilbertraums ist an jeder Stelle x0 = 0 Fr´echet-differenzierbar. (Tip: Verwende Satz III.5.3.) Aufgabe V.6.30 (Hardyraum) Sei D = {z ∈ C: |z| < 1} (D wie disk“), und sei ”
2
H (D) =
2π
f : D → C: f analytisch, sup 0≤r0 a∈R
∃τ
a 1 sehr einfach. F¨ ur p = 1 liegt ihre Konstruktion in p zu finden ist f¨ aber nicht auf der Hand; wer einen Hinweis sucht, lese Macphails Arbeit im Bull. Amer. Math. Soc. 121–123. gilt f¨ ur unbedingt Andererseits 53 (1947) p 2 in L noch f < ∞ f¨ u r 1 ≤ p ≤ 2 und konvergente Reihen f n n fn p < ∞ f¨ ur 2 < p < ∞. Dieser Satz wurde 1930 von Orlicz gefunden, ein moderner Beweis reduziert die Aussage auf die sog. Kotypeigenschaft aume (Wojtaszczyk [1991], S. 97). der Lp -R¨ Konvergiert eine (konvergente) Reihe xn reeller Zahlen nicht unbedingt, so kann man bekanntlich zu jeder reellen Zahl x eine Umordnung x finden. Anders ausgedr¨ u ckt k¨ o nnen bei konvergenten remit xπ(n) = ellen Reihen xn f¨ ur die Menge Σ = {x: ∃π xπ(n) = x} nur die F¨alle Σ = {x0 } oder Σ = R auftreten. F¨ ur konvergente Reihen komplexer Zahlen gibt es drei M¨ oglichkeiten: Σ = {x0 }, Σ = C, oder Σ ist eine Gerade in der komplexen Ebene. Allgemeiner besagt der Satz von Steinitz f¨ ur Reihen im Rn , daß Σ stets ein affiner Unterraum ist; ein Beweis dieses Satzes
252
V.
Hilbertr¨ aume
wird von P. Rosenthal in Amer. Math. Monthly 94 (1987) 342–351 dargestellt. Im Unendlichdimensionalen liegen die Dinge viel komplizierter. Im Problem 106 des Schottischen Buches (Mauldin [1981], S. 188) fragte Banach, ob Σ stets konvex sei; als Preis setzte er eine Flasche Wein aus. Wie aus Aufgabe V.6.26 hervorgeht, ist das im allgemeinen falsch; das Gegenbeispiel dieser Aufgabe (von Marcinkiewicz) ist ebenfalls im Schottischen Buch verzeichnet. Ein weit drastischeres Gegenbeispiel stammt von Kadets und Wo´zniakowski (Bull. Pol. Acad. Sci. 37 (1989) 15–21): In jedem unendlichdimensionalen Banachraum existiert eine nur bedingt konvergente Reihe, so daß Σ aus genau zwei Punkten besteht; siehe auch [J. O.] Wojtaszczyk, Studia Math. 171 (2005) 261–281. Mehr zu diesem Problemkreis kann man bei Kadets/Kadets [1997] nachlesen. Mit der Parallelogrammgleichung liegt ein einfaches notwendiges und hinreichendes Kriterium (es stammt von Jordan und von Neumann, Ann. Math. 36 (1935) 719–723) vor, um zu u ufen, ob die Norm eines Ba¨ berpr¨ nachraums von einem Skalarprodukt abgeleitet werden kann, mit anderen Worten, ob ein gegebener Banachraum zu einem Hilbertraum isometrisch isomorph ist. Ca. 350 weitere findet man bei Amir [1986]. Wesentlich heikler ist die Frage, ob ein gegebener Banachraum zu einem Hilbertraum isomorph ist, d.h., ob es eine ¨aquivalente Norm gibt, die von einem Skalarprodukt abstammt. Ein tiefliegendes Ergebnis in dieser Richtung ist das Theorem u ¨ ber komplementierte Unterr¨ aume (vgl. Definition IV.6.4 wegen dieses Begriffs) von Lindenstrauss und Tzafriri (Israel J. Math. 9 (1971) 263–269). • Wenn jeder abgeschlossene Unterraum eines Banachraums X komplementiert ist, ist X zu einem Hilbertraum isomorph. (Die Umkehrung folgt nat¨ urlich aus Theorem V.3.4.) Eine weitere Charakterisierung wird in den Bemerkungen zu Kapitel VI genannt. Pr¨ ahilbertr¨ aume glatter Funktionen (etwa C 2 (Ω) mit der Sobolevnorm . W 2 ) wurden schon in den dreißiger Jahren in G¨ottingen betrachtet (siehe Courant/Hilbert [1968], Band 1, Kapitel V, und Band 2, Kapitel VII), und in diesem Zusammenhang bewies Rellich 1930 seinen Einbettungssatz. ¨ Sobolev (Mat. Sbornik 46 (1938) 471–496, engl. Ubersetzung Amer. Math. Soc. Transl. 34 (1963) 39–68) f¨ uhrte den verallgemeinerten Ableitungsbegriff ein und gelangte so zu Hilbertr¨ aumen (schwach) differenzierbarer Funktionen. (Einen noch schw¨ acheren Ableitungsbegriff vermittelt die Distributionentheorie; siehe Abschnitt VIII.5.) Er bewies dort auch das Sobolevlemma. Sobolevr¨ aume werden auch u ¨ber den R¨aumen Lp (Ω) gebildet; man verlangt dann, daß alle schwachen Ableitungen der Ordnung ≤ m zu Lp (Ω) geh¨ oren, und bezeichnet die Gesamtheit dieser Funktionen mit W m,p (Ω). Dann gilt der Einbettungssatz W m,p (Ω) ⊂ C k (Ω), falls m > k + np und Ω ⊂ Rn . Bezeichnet man mit H0m,p den Abschluß von D in W m,p , kann man folgenden auf Kondrachev (1945) zur¨ uckgehenden Kompaktheitssatz f¨ ur beschr¨ anktes Ω ⊂ Rn zeigen.
V.7
253
Bemerkungen und Ausblicke
• Falls mp < n und q < np/(n − mp) sind, ist H0m,p (Ω) kompakt in Lq (Ω) eingebettet. • Falls mp > n + k ist, ist H0m,p (Ω) kompakt in C k (Ω) eingebettet. Unter geeigneten geometrischen Voraussetzungen an Ω (z.B., wenn Ω einen Lipschitzrand hat), darf man H0m,p durch W m,p ersetzen. Die Standardreferenz zu Sobolevr¨ aumen ist Adams [1975]; siehe auch Marti [1986] und Wloka [1982] f¨ ur Anwendungen auf die Theorie partieller Differentialgleichungen. Die klassische Fourieranalyse wurde in Fouriers Th´eorie analytique de ” la chaleur“ von 1822 entwickelt; moderne Darstellungen sind K¨orner [1988] und nat¨ urlich Zygmund [1959]. Plancherel bewies seine Gleichung urspr¨ unglich im Jahre 1910. Der Aufbau der Theorie u ¨ ber den Raum S (Rn ) wurde von L. Schwartz vorgeschlagen (Annales Univ. Grenoble 23 (1947–48) 7–24); dieses Vorgehen ist fundamental f¨ ur die Fouriertransformation von Distributionen (Abschnitt VIII.5). Den gemeinsamen Hintergrund der Fourierreihen und der Fouriertransformation kann man mit Hilfe der abstrakten harmonischen Analyse formulieren, was im folgenden skizziert werden soll. Dazu sei (G, +) eine abelsche Gruppe. Gleichzeitig sei G mit einer Topologie versehen, so daß die Gruppenoperation und die Inversenbildung stetig sind, und G sei lokalkompakt; man nennt G dann kurz eine lokalkompakte abelsche Gruppe. Man kann beweisen, daß es – bis auf eine multiplikative Konstante – genau ein regul¨ ares translationsinvariantes Borelmaß m auf G gibt, also ein Maß mit m(a + E) = m(E) f¨ ur alle Borelmengen E. So ein Maß heißt Haarmaß. Ist G = Rn , so ist m ein Vielfaches des Lebesguemaßes. Sei T = {z ∈ C: |z| = 1}; T ist in nat¨ urlicher Weise eine kompakte abelsche Gruppe mit dem (eindimensionalen) Lebesguemaß als Haarmaß. Als n¨ achstes definiert man den Begriff des Charakters. Ein Charakter auf G ist ein stetiger Gruppenhomomorphismus von G nach T; die Menge aller Charaktere bildet ihrerseits eine abelsche Gruppe Γ, die, versehen mit der Topologie der gleichm¨ aßigen Konvergenz auf kompakten Teilmengen von G, zu einer lokalkompakten abelschen Gruppe wird und daher ein Haarmaß m zul¨ aßt. Γ heißt die zu G duale Gruppe. Ist G = Rn , so hat jeder Charakter ur ein ξ ∈ Rn ; ergo ist Γ isomorph zu Rn . Ist G = T, die Form γ(x) = eixξ f¨ so lauten die Charaktere γ(z) = z n f¨ ur ein n ∈ Z, und Γ ist isomorph zu Z. Sei nun f ∈ L1 (G, dm). Die Fouriertransformierte von f ist die Funktion f (x)γ(x) dm(x). f : Γ → C, f (γ) = G
Es ist stets f ∈ C0 (Γ), und gilt auch f ∈ L1 (Γ, dm), so hat man die Fourierinversionsformel (c bezeichnet eine Konstante) fast u f (x) = c f(γ)γ(x) dm(γ) ¨ berall. Γ
254
V.
Hilbertr¨ aume
Wenn man G = Rn = Γ betrachtet, erh¨ alt man so die Formeln f¨ ur die Fouriertransformation und die inverse Fouriertransformation. F¨ u r G = T und Γ = Z wird Γ einfach n∈Z , und man erh¨alt eine Fourierreihe. Warum man es in den klassischen F¨ allen einmal mit einem Integral und einmal mit einer Reihe zu tun hat, l¨ aßt sich vor diesem abstrakten Hintergrund so beantworten. Ist G kompakt (wie T), so ist Γ eine diskrete Gruppe, und das Haarmaß auf Γ ist das z¨ ahlende Maß. Auch das Beispiel V.4(c) ist der Spezialfall eines allgemeinen Sachverhalts: • (Satz von Peter-Weyl) Wenn G kompakt ist, ist Γ eine Orthonormalbasis von L2 (G, dm). Zu all diesen Dingen siehe z.B. Rudin [1962] und Loomis [1953]. Eine moderne Weiterentwicklung der Fourieranalyse auf R (und in mancher Hinsicht ein Gegenst¨ uck dazu) ist die Theorie der Wavelets. Ein orthogonales Wavelet (frz. ondelette) ist eine Funktion ψ: R → C, f¨ ur die die Funktionen j, k ∈ Z ψj,k (t) = 2k/2 ψ(2k t − j), eine Orthonormalbasis von L2 (R) bilden. (Eigentlich sind die ψj,k die Wavelets, und ψ wird auch Mutterwavelet genannt.) Ein einfaches Beispiel ist die Haarbasis, wo man von ψ = χ[0,1/2) − χ[1/2,1) ausgeht, vgl. Aufgabe V.6.22. Meyer hat 1985 Wavelets ψ ∈ S (R) konstruiert, und Daubechies hat 1988 f¨ ur jedes m ∈ N orthogonale Wavelets der Klasse C m mit kompaktem Tr¨ ager gefunden, die gleichzeitig Schauderbasen (Aufgabe IV.8.18) die die wichtige Eigenschaft beder R¨ aume Lp (R), 1 < p < ∞, bilden, p sitzen, daß f¨ u r f, ψ ψ ∈ L (R) auch bei jeder Vorzeichenwahl j,k j,k j,k p ±f, ψ ψ ∈ L (R) gilt. Diese Eigenschaft ist zur unbedingten j,k j,k j,k Konvergenz der Reihe ¨ aquivalent, und man spricht dann von einer unbedingten Schauderbasis; das trigonometrische System ist zwar eine Schauur 1 < p < ∞, aber keine unbedingte Basis, wenn derbasis von Lp [0, 2π] f¨ p = 2 ist. Zu Wavelets und ihren Anwendungen siehe Daubechies [1992], Meyer [1992] und Wojtaszczyk [1997].
Kapitel VI
Spektraltheorie kompakter Operatoren
VI.1
Das Spektrum eines beschr¨ ankten Operators
Die Spektraltheorie verallgemeinert die Eigenwerttheorie f¨ ur Matrizen auf Operatoren auf unendlichdimensionalen Banachr¨aumen. F¨ ur Operatoren (= Matrizen) auf endlichdimensionalen R¨ aumen ist ein Eigenwert bekanntlich durch die Forderung definiert, daß λ Id − T nicht injektiv ist, was dazu a ¨quivalent ist, daß λ Id − T nicht surjektiv ist. Auf unendlichdimensionalen ¨ R¨ aumen braucht diese Aquivalenz nicht mehr zu gelten. Man muß daher ein allgemeineres Konzept als das des Eigenwerts zulassen. Im folgenden bezeichnet X stets einen Banachraum und T ∈ L(X) einen stetigen linearen Operator. Statt λ Id − T schreiben wir λ − T . Definition VI.1.1 Sei T ∈ L(X). (a) Die Resolventenmenge von T ist ρ(T ) = {λ ∈ K: (λ − T )−1 existiert in L(X)}. (b) Die Abbildung R: ρ(T ) → L(X),
Rλ := Rλ (T ) := (λ − T )−1
heißt Resolventenabbildung. (c) Das Spektrum von T ist σ(T ) = K \ ρ(T ). Man definiert noch folgende Teilmengen des Spektrums: σp (T ) = {λ: λ − T nicht injektiv}, σc (T ) = {λ: λ − T injektiv, nicht surjektiv, mit dichtem Bild}, σr (T ) = {λ: λ − T injektiv, ohne dichtes Bild}.
256
VI.
Spektraltheorie kompakter Operatoren
Man nennt σp (T ) das Punktspektrum, σc (T ) das stetige Spektrum und σr (T ) das Restspektrum. Aus dem Satz von der offenen Abbildung (genauer Korollar IV.3.4) folgt σ(T ) = σp (T ) ∪ σc (T ) ∪ σr (T ), denn (λ − T )−1 ist automatisch stetig, falls λ − T bijektiv ist. (Zur Erinnerung: der Raum X ist in diesem Kapitel stets ein Banachraum.) Die Elemente von σp (T ) heißen Eigenwerte; ein x = 0 mit T x = λx heißt Eigenvektor (oder Eigenfunktion, wenn X ein Funktionenraum ist). Typischerweise (freilich nicht immer, vgl. die folgenden Beispiele) besteht σp (T ) aus isolierten Punkten, σc (T ) aus einer Vereinigung von Intervallen, und σr (T ) kommt nicht vor. Dies erkl¨art die Nomenklatur. Als erstes machen wir eine einfache Beobachtung. Satz VI.1.2 Es gilt σ(T ) = σ(T ). Ist X ein Hilbertraum, so ist σ(T ∗ ) = {λ: λ ∈ σ(T )}. Beweis. Im Banachraumfall folgt die Aussage aus der Tatsache, daß ein Operator genau dann ein Isomorphismus ist, wenn es sein Adjungierter ist (Aufgabe III.6.21). F¨ ur den Hilbertraumfall beachte (λ − T )−1 ∗ = (λ − T )∗ −1 = (λ − T ∗ )−1 . 2 Beispiele. (a) F¨ ur dim X < ∞ stimmt σ(T ) mit der Menge der Eigenwerte u ¨ berein und kann im Fall K = R durchaus leer sein. (b) Ist X ein Hilbertraum und T ein selbstadjungierter Operator, so gilt σ(T ) ⊂ R. Das wird in Korollar VII.1.2 gezeigt. Daher muß nach Satz V.5.2(g) σr (T ) = ∅ sein. s (c) Sei X = C[0, 1] und (T x)(s) = 0 x(t) dt. Dann ist σ(T ) = σr (T ) = {0}. Um das einzusehen, betrachte zuerst λ = 0. Nach dem Hauptsatz der Differential- und Integralrechnung ist T injektiv, und T hat kein dichtes Bild, da stets (T x)(0) = 0 gilt. Also ist 0 ∈ σr (T ). Sei nun λ = 0. Es ist zu zeigen, daß f¨ ur alle y ∈ C[0, 1] die Gleichung λx − T x = y
(VI.1)
eindeutig nach x aufl¨ osbar ist; denn dann ist λ − T bijektiv, und die Stetigkeit des inversen Operators ergibt sich automatisch aus dem Satz von der offenen Abbildung. Sei zun¨ achst y ∈ C 1 [0, 1] mit Ableitung y˙ = z. (Wir verwenden hier die Physikernotation y˙ statt y , um nicht mit der Bezeichnung f¨ ur Funktionale zu kollidieren.) Dann ist (VI.1) dem Anfangswertproblem x(t) ˙ −
1 1 x(t) = z(t), λ λ
x(0) = α :=
y(0) λ
(VI.2)
aquivalent. F¨ ur y = 0 hat (VI.2) nur die triviale L¨osung, also ist λ − T ¨ injektiv. Die eindeutig bestimmte L¨ osung von (VI.2) kann mit der Methode
VI.1
257
Das Spektrum eines beschr¨ ankten Operators
der Variation der Konstanten ermittelt werden (siehe z.B. Walter [1993], S. 25); sie lautet t 1 e−s/λ z(s) ds + α x(t) = et/λ λ 0 t 1 1 = 2 e(t−s)/λ y(s) ds + y(t) λ 0 λ (partielle Integration). Man kann nun durch kurze Rechnung best¨atigen, daß diese Formel die L¨ osung von (VI.1) auch bei beliebigem y ∈ C[0, 1] ¨ bestimmt. Daher ist λ − T bijektiv. Ubrigens kann man die Stetigkeit von −1 (λ − T ) direkt aus der obigen Formel ablesen. (d) Betrachtet man den Operator T aus Beispiel (c) auf X = {x ∈ C[0, 1]: x(0) = 0}, so gilt σ(T ) = σc (T ) = {0}. In der Tat gilt wie oben λ ∈ ρ(T ) f¨ ur λ = 0, und wieder ist T injektiv. Wegen ran T = {y ∈ C 1 [0, 1]: y(0) = 0, y(0) ˙ = 0} gilt ran T = ran T = X, also ist diesmal 0 ∈ σc (T ). (e) Das folgende etwas k¨ unstliche Beispiel zeigt, daß alle Typen von Spektralpunkten vorkommen k¨ onnen. Sei X = {x ∈ ∞ [0, 1] : x stetig bei 0 und 1, x(0) = 0} und T : X → X, (T x)(t) = tx(t). X wird mit der Supremumsnorm versehen und ist dann ein abgeschlossener Unterraum von ∞ [0, 1] . Es gilt σ(T ) = [0, 1]; genauer σp (T ) = (0, 1),
σc (T ) = {0},
σr (T ) = {1}.
Zum Beweis sei zuerst λ ∈ / [0, 1]. Dann definiert (λ − T )−1 x (t) =
1 x(t) λ−t
den Umkehroperator, also gilt λ ∈ ρ(T ). Ist λ ∈ (0, 1), so betrachte xλ = χ{λ} ∈ X. Wegen T xλ = λxλ liegt λ im Punktspektrum. Schließlich betrachten wir λ = 1 und λ = 0. Id − T ist injektiv, denn T x = x impliziert tx(t) = x(t) f¨ ur alle t ∈ [0, 1], also x(t) = 0 f¨ ur alle t ∈ [0, 1). Da x bei 1 stetig ist, folgt x = 0. Ferner hat Id − T kein dichtes Bild, da ran(Id − T ) ⊂ {x ∈ X: x(1) = 0}. Zu λ = 0 bemerke, daß T injektiv ist (Beweis wie oben), aber nicht surjektiv (die Wurzelfunktion geh¨ort nicht zu ran T ). T hat jedoch dichtes Bild. Sei n¨ amlich y ∈ X. Zu ε > 0 w¨ahle δ > 0 ur t ≤ δ und xε (t) = y(t)/t mit |y(t)| ≤ ε f¨ ur alle t ≤ δ. Setze xε (t) = 0 f¨ sonst. Dann ist xε ∈ X und T xε − y ∞ ≤ ε. Der folgende Satz ist grundlegend; besonders wichtig ist Teil (d). Satz VI.1.3 (a) ρ(T ) ist offen. (b) Die Resolventenabbildung ist analytisch, d.h., sie wird lokal durch eine Potenzreihe mit Koeffizienten in L(X) beschrieben.
258
VI.
Spektraltheorie kompakter Operatoren
(c) σ(T ) ist kompakt, genauer gilt |λ| ≤ T f¨ ur alle λ ∈ σ(T ). (d) Ist K = C, so ist σ(T ) = ∅. Beweis. (a) Sei λ0 ∈ ρ(T ) und |λ − λ0 | < (λ0 − T )−1 −1 . Dann ist $ % λ − T = (λ0 − T ) + (λ − λ0 ) = (λ0 − T ) Id − (λ0 − λ)(λ0 − T )−1 . Nach Wahl von λ konvergiert die Neumannsche Reihe ∞ (λ0 − λ)(λ0 − T )−1 n , n=0
$ % und nach Satz II.1.11 ist Id − (λ0 − λ)(λ0 − T )−1 invertierbar. Daher ist auch λ − T invertierbar. (b) Mit Satz II.1.11 kann jetzt (λ − T )−1 als Reihe geschrieben werden: %−1 Id − (λ0 − λ)(λ0 − T )−1 (λ0 − T )−1 ∞ n+1 = (λ0 − λ)n (λ0 − T )−1 $
Rλ = (λ − T )−1 =
n=0
Das ist die gew¨ unschte Potenzreihenentwicklung f¨ ur Rλ mit den Koeffizi enten (λ0 − T )−1 n+1 . (c) Nach (a) ist σ(T ) abgeschlossen, und f¨ ur |λ| > T ist wieder −1 ∞ T (λ − T )−1 = λ−1 Id − = λ−1 λ−n T n λ n=0
(VI.3)
konvergent. Es folgt σ(T ) ⊂ {λ ∈ K: |λ| ≤ T }, und σ(T ) ist beschr¨ ankt, folglich kompakt. (d) Wir nehmen σ(T ) = ∅ an. Dann ist die Resolventenabbildung auf ganz C definiert und lokal analytisch. Sei nun ∈ L(X) beliebig. Die Funktion λ → (Rλ ) hat dann lokal die Gestalt (siehe oben) ∞
(Rλ ) =
(−1)n (Rλn+1 )(λ − λ0 )n . 0
(VI.4)
n=0
Diese Funktion ist daher selbst analytisch. Sie ist aber auch beschr¨ankt. F¨ ur |λ| > 2 T gilt n¨ amlich nach (VI.3) −1
|(Rλ )| ≤ |λ
∞ n T ≤ 1 2 = , | λ 2 T T n=0
VI.1
259
Das Spektrum eines beschr¨ ankten Operators
und auf der kompakten Menge {λ: |λ| ≤ 2 T } ist sie aus Stetigkeitsgr¨ unden beschr¨ ankt. Der Satz von Liouville der Funktionentheorie besagt, daß eine auf ganz C definierte beschr¨ ankte analytische Funktion konstant ist (siehe z.B. Rudin [1986], S. 212). Betrachten wir nun (VI.4) f¨ ur λ0 = 0, so sieht man, daß alle Koeffizienten der Potenzreihe (bis auf den nullten) ur verschwinden m¨ ussen. Insbesondere ist (T −2 ) = (R02 ) = 0, und zwar f¨ jedes ∈ L(X) . Der Satz von Hahn-Banach impliziert T −2 = 0, was absurd ist, da der Operator 0 nicht zu T 2 invers ist. Also war die urspr¨ ungliche Annahme falsch, und σ(T ) ist nicht leer. 2 Die Absch¨ atzung in Teil (c) des Satzes VI.1.3 kann versch¨arft werden. Als Vorbereitung auf den dabei auftretenden Begriff des Spektralradius (Definition VI.1.5) ben¨ otigen wir ein Lemma aus der Analysis. ulle 0 ≤ an+m ≤ an am f¨ ur Lemma VI.1.4 Die reelle Zahlenfolge √ (an ) erf¨ √ alle n, m ∈ N. Dann konvergiert n an gegen a := inf n an . √ Beweis. Sei ε > 0. W¨ ahle N mit N aN < a + ε. Setze b = b(ε) = max{a1 , . . . , aN }, und schreibe eine nat¨ urliche Zahl n in der Form n = kN + r mit 1 ≤ r ≤ N . Dann folgt √ 1/n n an = akN +r ≤ (akN ar )1/n ≤ (a + ε)kN/n b1/n = (a + ε)(a + ε)−r/n b1/n ≤ a + 2ε, 2
falls n groß genug ist. Das zeigt die Behauptung. Definition VI.1.5 r(T ) := inf T tralradius von T ∈ L(X) genannt.
n 1/n
= limn→∞ T
n 1/n
wird der Spek-
Daß der Limes existiert und gleich dem Infimum ist, zeigt Lemma VI.1.4 mit an = T n . Satz VI.1.6 (a) |λ| ≤ r(T ) f¨ ur λ ∈ σ(T ). (b) Falls K = C ist, existiert λ ∈ σ(T ) mit |λ| = r(T ). Teil (b) sagt also r(T ) = max{|λ|: λ ∈ σ(T )}, was den Namen Spektralradius erkl¨ art. ∞ ur |λ| > Beweis. (a) Es ist nur zu zeigen, daß die Reihe λ−1 n=0 (T /λ)n f¨ r(T ) konvergiert; vgl. den Beweis zu Satz VI.1.3(c). Daf¨ ur ist offenbar lim sup (T /λ)n 1/n < 1 hinreichend, und in der Tat ist 1/n T n r(T ) T n 1/n lim sup = < 1. = lim λ |λ| |λ|
260
VI.
Spektraltheorie kompakter Operatoren
(b) Sei r0 = sup{|λ|: λ ∈ σ(T )}. Teil (a) zeigt r0 ≤ r(T ). Sei nun |μ| > r0 ; wir werden dann |μ| ≥ r(T ) zeigen, woraus r0 = r(T ) und wegen der Kompaktheit des Spektrums Teil (b) folgt. Zu ∈ L(X) betrachte die in {λ: |λ| > r0 } analytische (da lokal analytische) Funktion f (λ) = (λ − T )−1 . Sie kann nach (a) f¨ ur |λ| > r(T ) durch die konvergente Reihe f (λ) =
∞
(T n )λ−(n+1)
n=0
dargestellt werden. Da diese Reihe nach einem Satz der Funktionentheorie im gr¨ oßten offenen Kreisring konvergiert, in dem f analytisch ist, konvergiert sie insbesondere bei μ; speziell ist limn→∞ (T n /μn+1 ) = 0. Weil ein beliebiges stetiges lineares Funktional war, ist daher (T n /μn+1 ) eine schwache Nullfolge und folglich (Korollar IV.2.3) beschr¨ankt. F¨ ur ein geeignetes K > 0 ist also T n 1/n ≤ K 1/n |μ|(n+1)/n → |μ|. Das zeigt r(T ) ≤ |μ|.
2
Im allgemeinen ist r(T ) < T , siehe etwa Beispiel VI.1(c), wo r(T ) = 0 ist. F¨ ur normale Operatoren auf Hilbertr¨ aumen gilt jedoch stets die Gleichheit. Satz VI.1.7 Ist H ein Hilbertraum und T ∈ L(H) normal, so ist r(T ) = T . Beweis. F¨ ur normales T ist T 2 = T 2 , denn nach Satz V.5.2(f) ist 2 (∗) T 2 2 = (T 2 )(T 2 )∗ = (T T ∗)2 = T T ∗ 2 = T 2 ; bei (∗) wurde ausgenutzt, daß T normal ist. Da alle T n ebenfalls normal k k sind, gilt f¨ ur alle k ∈ N die Gleichung T 2 = T 2 , daher k
k
r(T ) = lim T n 1/n = lim T 2 1/2 = T . n→∞
VI.2
k→∞
2
Die Theorie von Riesz
In diesem Abschnitt wird das Spektrum eines kompakten Operators qualitativ vollst¨ andig beschrieben. Im großen und ganzen zeigen die Resultate ¨ große Ahnlichkeit mit den entsprechenden Ergebnissen der linearen Algebra.
VI.2
261
Die Theorie von Riesz
Mit X wird nach wie vor ein Banachraum bezeichnet. Im folgenden Satz werden Operatoren der Form Id − T , T kompakt, analysiert. Der entstehende Operator hat dann, wie sich zeigt, qualitativ ¨ahnliche Eigenschaften wie der identische Operator. Also kann man Id − T f¨ ur kompaktes T als qualitativ kleine“ St¨ orung der Identit¨ at ansehen. ” Wir erinnern an den Satz von Schauder (Satz III.4.4), wonach ein Operator auf einem Banachraum genau dann kompakt ist, wenn sein Adjungierter kompakt ist. Satz VI.2.1 (Satz von Riesz-Schauder) Sei T ∈ K(X) und S := Id − T . (a) Der Kern von S ist endlichdimensional. (b) Der Operator S hat abgeschlossenes Bild, und X/ran S ist endlichdimensional. (c) dim(X/ran S) = dim(ker S) = dim(X /ran S ) = dim(ker S ). Ein Operator mit den Eigenschaften aus (a) und (b) wird Fredholmoperator und die Zahl ind(S) = dim(ker S) − dim(X/ran S) sein Index genannt. Satz VI.2.1 besagt also, daß ein Operator der Form S = Id−T , T kompakt, ein Fredholmoperator mit Index 0 ist; das impliziert insbesondere, daß solch ein Operator S genau dann surjektiv ist, wenn er injektiv ist. Mit anderen Worten besitzt die Operatorgleichung Sx = y f¨ ur jede rechte Seite y eine L¨ osung, falls die homogene Gleichung Sx = 0 nur die triviale L¨ osung x = 0 besitzt, was sehr viel einfacher zu u ufen ist als ¨ berpr¨ die L¨ osbarkeit der urspr¨ unglichen Gleichung. Ferner besitzt Sx = y dann genau eine L¨ osung. (Genaueres zu diesem Ideenkreis siehe Satz VI.2.4.) ankte Folge in ker S. Da T kompakt ist, Beweis. (a) Sei (xn ) eine beschr¨ konvergiert eine geeignete Teilfolge (T xnk ). Wegen 0 = Sxnk = xnk − T xnk konvergiert (xnk ) in X, und da ker S abgeschlossen ist, auch in ker S. Nach Satz I.2.7 ist ker S endlichdimensional. (b) Zuerst zeigen wir, daß ran S abgeschlossen ist. Betrachte den induzierten Operator S X
S @ @ @ R @ X/ker S
- ran S S
262
VI.
Spektraltheorie kompakter Operatoren
der bijektiv und stetig ist. Wir beweisen, daß S−1 stetig ist; dann ist n¨amlich S ein Isomorphismus zwischen X/ker S und ran S. Da X/ker S vollst¨ andig ist, muß dann auch ran S vollst¨ andig und folglich (Lemma I.1.3) abgeschlossen sein. W¨ are S−1 nicht stetig, so existierten xn ∈ X mit [xn ] X/ker S = 1,
Sxn → 0.
ur Nach Definition der Quotientennorm darf ohne Einschr¨ankung xn ≤ 2 f¨ ¨ alle n angenommen werden. Nach Ubergang zu einer Teilfolge ist (T xnk ) konvergent, deshalb ist auch (xnk ) = (T xnk +Sxnk ) konvergent, etwa gegen x. Es folgt Sx = 0, also [x] X/ker S = 0; andererseits gilt [x] X/ker S = lim [xnk ] X/ker S = 1. k→∞
Dieser Widerspruch beweist die behauptete Stetigkeit von S−1 . Des weiteren gilt nach Satz III.1.10 (X/U ) ∼ ur abgeschlossene = U ⊥ f¨ Unterr¨ aume U ⊂ X. Wendet man das auf U = ran S an und beachtet man noch (ran S)⊥ = ker S , was direkt zu verifizieren ist, so ergibt sich (X/ran S) ∼ = ker S , also dim(X/ran S) = dim(X/ran S) = dim(ker S ) < ∞,
(VI.5)
denn (a) ist auf S anwendbar, weil T ebenfalls kompakt ist. (c) Aus der Isometrie U ∼ ur U = = X /U ⊥ (Satz III.1.10) ergibt sich f¨ ⊥ ker S mit Hilfe von (ker S) = ran S (Theorem IV.5.1) dim(X /ran S ) = dim(ker S) = dim(ker S), so daß dank (VI.5) nur noch dim(X/ran S) = dim(ker S)
(VI.6)
zu zeigen ist. Dazu bedarf es einiger Vorbereitungen, die im folgenden Lemma getroffen werden. Zu m ∈ N setze Nm = ker S m , N0 = {0}, Rm = ran S m , R0 = X. Dann gilt N0 ⊂ N1 ⊂ N2 ⊂ . . . , Da S
m
von der Form S
m
= (Id − T )
m
R0 ⊃ R1 ⊃ R2 ⊃ . . . .
m m = Id − (−1)k+1 T k = Id − T˜ k k=1
mit kompaktem T˜ ist, sind alle Nm endlichdimensional, sind alle Rm abgeschlossen, und es gilt stets dim X/Rm < ∞ nach dem bereits Bewiesenen. Nun formulieren wir das entscheidende Lemma.
VI.2
Die Theorie von Riesz
263
Lemma VI.2.2 (a) Es existiert eine kleinste Zahl p ∈ N0 mit Np = Np+1 . (b) Es gilt Np+r = Np f¨ ur alle r > 0. (c) Np ∩ Rp = {0}. (d) Es existiert eine kleinste Zahl q ∈ N0 mit Rq = Rq+1 . (e) Es gilt Rq+r = Rq f¨ ur alle r > 0. (f) Nq + Rq = X. (g) p = q. Bevor wir Lemma VI.2.2 beweisen, sollen einige Konsequenzen gezogen und der Beweis von Satz VI.2.1 abgeschlossen werden. Korollar VI.2.3 Ist T ∈ K(X) und S = Id − T , so existieren abgeschlos und R mit sene Unterr¨aume N (a) dim N < ∞, ⊕R ist eine topologisch direkte Zerlegung (im Sinn von (b) X = N Abschnitt IV.6), ) ⊂ N , S(R) ⊂ R, (c) S(N (d) S | : R → R ist ein Isomorphismus. R = Np , Beweis. W¨ ahle p und q (= p) wie in Lemma VI.2.2, und setze N = Rp . Nach Konstruktion ist N endlichdimensional und R abgeschlosR sen. Die Zerlegung X = N ⊕ R gilt nach Lemma VI.2.2(c) und (f); sie ist topologisch nach Satz IV.6.3. Ferner ist , ) = S(Np ) ⊂ Np−1 ⊂ Np = N S(N = S(Rp ) = Rp+1 = Rp = R. S(R) ˜ R → R, x → Sx, surjektiv. Ist schließlich Sy = 0 f¨ Speziell ist S: ur ein so folgt, wenn man y = S p x schreibt, S p+1 x = 0, d.h. x ∈ Np+1 = y ∈ R, . Daher gilt auch y = S p x = 0. Folglich ist S˜ bijektiv, also nach Np = N dem Satz von der offenen Abbildung ein Isomorphismus. 2 Nun schließen wir den Beweis von Satz VI.2.1(c) ab, indem wir (VI.6) ⊕R aus Korollar VI.2.3 und setze zeigen. Betrachte die Zerlegung X = N S = S | . (VI.6) folgt nun aus folgenden drei Tatsachen. N (1) Es existiert ein kanonischer Vektorraumisomorphismus zwischen /ran S, X/ran S und N /ran S) = dim(ker S), (2) dim(N (3) ker S = ker S.
264
VI.
Spektraltheorie kompakter Operatoren
/ran S → X/ran S durch x + ran S → x + ran S. Zu (1). Definiere Φ: N Wegen ran S ⊂ ran S ist Φ wohldefiniert und linear. Φ ist auch injektiv. mit Φ([x]) = [0], d.h. x ∈ ran S; zu zeigen ist dann Sei n¨ amlich x ∈ N ⊕ R. Es folgt Schreibe x = Sy f¨ x ∈ ran S. ur ein y ∈ X und y = y1 + y2 ∈ N , und da Sy2 ∈ R, ergibt sich Sy2 = 0 und Sy2 = Sy − Sy1 = x − Sy1 ∈ N y2 = 0. Daher ist x = Sy1 ∈ S(N ) = ran S. Schließlich weiter, da y2 ∈ R, Dann gilt ist Φ surjektiv. Denn sei x = x1 + x2 ∈ X = N ⊕ R = N ⊕ S(R). x + ran S = x1 + ran S, also Φ(x1 + ran S) = x + ran S. endlichdimensional ist, ist (2) eine wohlbekannte Aussage Zu (2). Weil N der linearen Algebra. ¨ Zu (3). Dies folgt aus der nachstehenden Aquivalenz. ⊕R und Sx = 0 x ∈ ker S ⇔ x = x1 + x2 ∈ N ∩R ⇔ Sx2 = −Sx1 ∈ N ⇔ Sx2 = Sx1 = 0 ⇔ x2 = Sx1 = 0 und Sx = 0 ⇔ x∈N ⇔ x ∈ ker S Damit ist Satz VI.2.1 vollst¨ andig bewiesen.
2
Satz VI.2.1 gestattet sofort eine wichtige Folgerung. Dazu sei an die Bezeichnung V⊥ aus (III.5) erinnert. Satz VI.2.4 (Fredholmsche Alternative) Sei T ∈ K(X) und sei λ ∈ K, λ = 0. Dann hat entweder die homogene Gleichung λx − T x = 0 nur die triviale L¨osung, und in diesem Fall ist die inhomogene Gleichung λx − T x = y f¨ ur jedes y ∈ X eindeutig l¨osbar, oder es existieren n = dim ker(λ − T ) (< ∞) linear unabh¨angige L¨osungen der homogenen Gleichung, und auch die adjungierte Gleichung λx − T x = 0 hat genau n linear unabh¨angige L¨osungen; in diesem Fall ist die inhomogene Gleichung genau dann l¨osbar, wenn y ∈ (ker(λ − T ))⊥ ist.
VI.2
265
Die Theorie von Riesz
Beweis. Das folgt aus Satz VI.2.1 und Satz III.4.5; beachte nur λ − T = λ(Id − T /λ). 2 Dieser Satz l¨ aßt sich in der Theorie der Integralgleichungen anwenden, wo T ein kompakter Integraloperator ist (Beispiele II.3(c) und (d)). Als einfaches Beispiel betrachten wir einen Operator vom Volterra-Typ s k(s, t)x(t) dt T : C[0, 1] → C[0, 1], T x(s) = 0
mit k ∈ C [0, 1]2 . (Beispiel VI.1(c) diskutiert ein einfaches Exemplar eines Volterraschen Integraloperators.) In Aufgabe II.5.26 war die Kompaktheit eines solchen Operators nachzuweisen. Wir betrachten nun eine Operatorgleichung λx − T x = 0, wo λ = 0, eine Integralgleichung zweiter Art. (Integralgleichungen erster Art haben die Form T x = 0 bzw. T x = y und sind wesentlich komplizierter zu analysieren.) F¨ ur λ = 0 ist nun λ − T injektiv. Ohne Einschr¨ankung sei n¨ amlich λ = 1 angenommen; sonst betrachte T /λ. Falls T x = x gilt, erh¨alt man die Absch¨ atzung s |k(s, t)| |x(t)| dt ≤ s k ∞ x ∞ . |x(s)| = |T x(s)| ≤ 0
Daraus ergibt sich |x(s)| = |T x(s)| ≤
s
|k(s, t)| t k ∞ x ∞ dt ≤ 0
s2 k 2∞ x ∞ . 2
Durch wiederholtes Einsetzen erh¨ alt man |x(s)| ≤
sn k n∞ x ∞ → 0 mit n → ∞; n!
folglich ist x = 0 und λ − T injektiv. Aus der Eindeutigkeit der L¨ osung der homogenen Gleichung folgt nach Satz VI.2.4 die Existenz der L¨ osung der inhomogenen Gleichung λx − T x = y f¨ ur alle y ∈ C[0, 1]. In Abschnitt VI.4 diskutieren wir eine tieferliegende Anwendung, n¨amlich wie man mittels der Fredholm-Alternative die L¨osbarkeit des Dirichletproblems beweist. Kommen wir nun zum Beweis von Lemma VI.2.2.
266
VI.
Spektraltheorie kompakter Operatoren
(a) G¨ abe es so ein p nicht, w¨ are N0 N1 N2 . . . . Da alle Nn abgeschlossen sind, existiert nach dem Rieszschen Lemma I.2.6 zu n ∈ N ein xn ∈ Nn mit d(xn , Nn−1 ) > 12 und xn = 1. F¨ ur n > m ≥ 1 ist aber 1 T xn − T xm = xn − (Sxn + xm − Sxm ) > , 2 denn Sxn + xm − Sxm ∈ Nn−1 , weil S(Nn ) ⊂ Nn−1 ist. Also besitzt (T xn ) keine konvergente Teilfolge im Widerspruch zu T ∈ K(X). (b) Nur ⊂“ ist zu zeigen. Ist r > 0 und x ∈ Np+r , so ist S r−1 (x) ∈ ” Np+1 = Np , daher ist x ∈ Np+r−1 . Dieses Argument wende wiederholt an, um zuletzt x ∈ Np zu erhalten. (c) Ist x ∈ Np ∩Rp , so gelten S p x = 0 und x = S p y f¨ ur ein y ∈ X. Daher ist S 2p y = 0, also y ∈ N2p . Aber N2p = Np nach (b), also folgt S p y = 0 und x = 0. (d) Wie in (a) nimm R0 R1 R2 . . . an, und w¨ ahle xn ∈ Rn mit d(xn , Rn+1 ) > 12 und xn = 1; dies ist nach dem Rieszschen Lemma m¨ oglich, weil die Rn abgeschlossen sind. F¨ ur m > n ≥ 1 ist aber T xn − T xm = xn − (Sxn + xm − Sxm ) >
1 , 2
denn Sxn + xm − Sxm ∈ Rn+1 , weil S(Rn ) = Rn+1 ist, und wie oben folgt ein Widerspruch zur Kompaktheit von T . (e) Nur ⊃“ ist zu zeigen, was sukzessive aus Rq+r+1 ⊃ Rq+r folgt. Sei ” also x ∈ Rq+r , d.h. x = S q+r y. Wegen S q y ∈ Rq = Rq+1 ergibt sich, wie behauptet, x = S r (S q y) ∈ Rq+r+1 . (f) Sei x ∈ X. Dann gilt nach (e) S q x ∈ Rq = R2q , d.h. S q x = S 2q y f¨ ur ein y ∈ X. Also kann x als x = (x − S q y) + S q y ∈ Nq + Rq zerlegt werden. (g) W¨ are p > q, so w¨ are nach (e) Rp = Rq , und es g¨abe andererseits ein x ∈ Np \ Nq . Schreibe gem¨ aß (f) x = y + z ∈ Nq + Rq . Dann folgt z = x − y ∈ Np + Nq = Np , da p > q, und z ∈ Rq = Rp . (c) zeigt nun z = 0, und folglich liegt x doch in Nq . Es muß also p ≤ q gelten. W¨ are p < q, so w¨ are nach (b) Np = Nq , und es g¨abe ein x ∈ Rp \ Rq . Wieder schreiben wir gem¨ aß (f) x = y + z ∈ Nq + Rq . Es folgt y = x − z ∈ Rp + Rq = Rp , da p < q, und y ∈ Nq = Np . (c) zeigt nun y = 0, und folglich liegt x doch in Rq . Damit ist der Beweis von Lemma VI.2.2 komplett. 2 Jetzt k¨ onnen wir das Hauptergebnis der Spektraltheorie kompakter Operatoren auf Banachr¨ aumen beweisen.
VI.2
267
Die Theorie von Riesz
Theorem VI.2.5 Sei T ∈ K(X). (a) Ist X unendlichdimensional, so ist 0 ∈ σ(T ). (b) Die (eventuell leere) Menge σ(T )\{0} ist h¨ochstens abz¨ahlbar. (c) Jedes λ ∈ σ(T )\{0} ist ein Eigenwert von T , und der zugeh¨orige Eigenraum ker(λ − T ) ist endlichdimensional. Ferner existiert eine topologisch direkte Zerlegung X = N (λ) ⊕ R(λ) mit T N (λ) ⊂ N (λ), T R(λ) ⊂ R(λ), wobei N (λ) endlichdimensional ist und ker(λ − T ) umfaßt sowie (λ − T )|R(λ) ein Isomorphismus von R(λ) auf R(λ) ist. (d) σ(T ) besitzt keinen von 0 verschiedenen H¨aufungspunkt. Beweis. (a) Ist 0 ∈ ρ(T ), so ist T stetig invertierbar, und nach Satz II.3.2(b) ist Id = T T −1 kompakt. Aus Satz I.2.7 folgt dim X < ∞. (c) Das folgt wegen λ−T = λ(Id−T /λ) aus Satz VI.2.1, Korollar VI.2.3 und Satz VI.2.4; beachte noch (λ − T )(U ) ⊂ U ⇔ T (U ) ⊂ U f¨ ur einen Unterraum U . (b) & (d) Es reicht, die folgende Behauptung zu zeigen. • F¨ ur alle ε > 0 ist {λ ∈ σ(T ): |λ| ≥ ε} endlich. Nimm das Gegenteil an. Dann existieren ε > 0, eine Folge (λn ) in K und eine Folge (xn ) in X mit (nach (c)) |λn | ≥ ε,
xn = 0,
λn = λm f¨ ur n = m.
T xn = λn xn ,
Die Menge {xn : n ∈ N} ist dann linear unabh¨ angig. W¨are das n¨amlich nicht so, g¨ abe es N ∈ N, linear unabh¨ angige x1 , . . . , xN und Skalare α1 , . . . , αN mit xN +1 = N i=1 αi xi , wo nicht alle αi verschwinden. Es folgt T xN +1 =
N
αi T xi =
i=1
N
λi αi xi
i=1
sowie andererseits T xN +1 = λN +1 xN +1 =
N
λN +1 αi xi .
i=1
ur ein i im Widerspruch zur Wahl der λn . Es folgt λi = λN +1 f¨ Setzt man En = lin{x1 , . . . , xn }, so folgt nun E1 E2 E3 . . . . Beachte, daß stets T (En ) ⊂ En gilt. Das Rieszsche Lemma I.2.6 gestattet n (n) es, yn = i=1 αi xi ∈ En mit yn = 1,
d(yn , En−1 ) >
1 2
268
VI.
Spektraltheorie kompakter Operatoren
zu finden. Dann folgt f¨ ur n > m T yn − T ym = λn yn − (T ym + λn yn − T yn ) . Hier ist T ym ∈ Em ⊂ En−1 sowie λn yn − T yn = En−1 ; daher existiert zn−1 ∈ En−1 mit
n
i=1 (λn
(n)
− λi )αi xi ∈
1 T yn − T ym = |λn | yn − zn−1 ≥ ε · , 2 was der Kompaktheit von T widerspricht. Damit ist der Beweis von Theorem VI.2.5 abgeschlossen.
2
Das Spektrum eines kompakten Operators T besteht also bis auf λ = 0 aus einer Nullfolge (oder endlichen Menge) von Eigenwerten λ, und der Operator λ − T kann laut Teil (c) in zwei einfachere Bestandteile zerlegt werden, n¨ amlich in einen endlichdimensionalen Anteil (der durch eine Matrix beschrieben werden kann) und einen Isomorphismus. Leider kann es vorkommen, daß es u ¨ berhaupt keine Spektralwerte = 0 gibt, siehe etwa Beispiel VI.1(c) oder (d); in diesem Fall gibt Theorem VI.2.5 keinerlei Aufschluß u ¨ber den Operator. (Diese Beispiele zeigen auch, daß λ = 0 kein Eigenwert zu sein braucht.) Im n¨ achsten Abschnitt zeigen wir, daß kompakte selbstadjungierte Operatoren auf Hilbertr¨ aumen stets durch ihr Spektrum analysiert werden k¨ onnen.
VI.3
Kompakte Operatoren auf Hilbertr¨ aumen
Im Hilbertraumfall kann die Darstellung in Theorem VI.2.5 noch wesentlich verbessert werden. Die weitreichendsten Resultate lassen sich f¨ ur selbstadjungierte Operatoren erzielen. In diesem Abschnitt bezeichnet H einen Hilbertraum; beachte, daß T ∈ L(H) genau dann kompakt ist, wenn T ∗ kompakt ist. Das folgt aus dem Satz von Schauder III.4.4 und der Definition von T ∗ . Lemma VI.3.1 Sei T ∈ L(H). (a) λ ∈ σ(T ) genau dann, wenn λ ∈ σ(T ∗ ). (b) Ist T selbstadjungiert und kompakt, so ist σ(T ) ⊂ R.1 (c) Ist T normal und x Eigenvektor von T zum Eigenwert λ, so ist x auch Eigenvektor von T ∗ zum Eigenwert λ. (d) Ist T normal, so haben verschiedene Eigenwerte orthogonale Eigenvektoren. 1 Diese Aussage gilt f¨ ur alle selbstadjungierten stetigen Operatoren, ist jedoch in dieser allgemeineren Situation etwas schwieriger zu beweisen; siehe Korollar VII.1.2.
VI.3
269
Kompakte Operatoren auf Hilbertr¨ aumen
(e) Ist K = C und T normal, so existiert λ ∈ σ(T ) mit |λ| = T . (f) Ist K = R und T selbstadjungiert und kompakt, so ist T oder − T Eigenwert von T . Beweis. (a) ist bereits in Lemma VI.1.2 gezeigt. (b) Sei λ ∈ σ(T )\{0}. Dann ist λ nach Theorem VI.2.5(c) ein Eigenwert von T . Es gilt also f¨ ur ein x = 0 λx, x = T x, x = x, T x = T x, x = λx, x. Daher ist λ reell. (c) Aus der Normalit¨ at von T folgt die von λ− T und deshalb ker(λ− T ) = ker(λ − T )∗ = ker(λ − T ∗ ) (Lemma V.5.10). (d) Gelte T x = λx und T y = μy mit λ = μ. Dann folgt wegen (c) λx, y = λx, y = T x, y = x, T ∗ y = x, μy = μx, y, also x, y = 0. (e) ist eine unmittelbare Konsequenz von Satz VI.1.7 und Satz VI.1.6(b). (f) Nach Satz V.5.7 existiert eine Folge (xn ) in BH mit |T xn , xn | → ¨ T . Nach evtl. Ubergang zu einer Teilfolge darf die Existenz der Limiten λ := lim T xn , xn , n→∞
y := lim T xn n→∞
angenommen werden, weil T kompakt ist. Nun gilt T xn − λxn 2 = T xn − λxn , T xn − λxn = T xn 2 − 2λT xn , xn + λ2 xn 2 ≤ 2λ2 − 2λT xn , xn → 0. Daher ist y = limn→∞ λxn und T y = λ limn T xn = λy. Wegen |λ| = T ist damit die Behauptung gezeigt, wenn y = 0 ist. W¨are aber y = 0, so w¨are (T xn ) eine Nullfolge, und es folgte T = limT xn , xn = 0. In diesem Fall ist die Behauptung von (f) trivial. 2 Theorem VI.3.2 (Spektralsatz f¨ ur kompakte normale Operatoren) Sei T ∈ K(H) normal (falls K = C) bzw. selbstadjungiert (falls K = R). Dann existieren ein (evtl. endliches) Orthonormalsystem e1 , e2 , . . . sowie eine (evtl. abbrechende) Nullfolge (λ1 , λ2 , . . .) in K \ {0}, so daß H = ker T ⊕2 lin{e1 , e2 , . . .} sowie Tx =
λk x, ek ek
∀x ∈ H;
k
und zwar sind die λk die von 0 verschiedenen Eigenwerte, und ek ist ein Eigenvektor zu λk . Ferner gilt T = supk |λk |.
270
VI.
Spektraltheorie kompakter Operatoren
Erg¨ anzt man das Orthonormalsystem {e1 , e2 , . . .} zu einer Orthonormalbasis B von H, so muß man eine Orthonormalbasis von ker T , also Eigenvektoren zum Eigenwert 0 hinzunehmen. ker T kann im Gegensatz zu den Eigenr¨ aumen ker(λ − T ) f¨ ur λ = 0 unendlichdimensional, ja sogar nichtseparabel sein. Entwickelt man in eine solche Orthonormalbasis, so nimmt der Operator T eine Diagonalgestalt“ an; es gilt n¨amlich ” x, ee ⇒ T x = λe x, ee. x= e∈B
e∈B
Daher ist der Spektralsatz das Analogon zur Hauptachsentransformation der linearen Algebra. Beweis. Es sei μ1 , μ2 , . . . die Folge der paarweise verschiedenen Eigenwerte von T , die nicht verschwinden; vgl. Theorem VI.2.5. Die zugeh¨origen Eigenr¨ aume ker(μi − T ) sind dann endlichdimensional, ihre Dimension, die sog. geometrische Vielfachheit von μi , sei mit di bezeichnet. Die Folge der λk entsteht durch Wiederholung der μi : (λk ) = (μ1 , . . . , μ1 , μ2 , . . . , μ2 , μ3 , . . . , μ3 , . . .), und zwar tauche jedes μi genau di -mal auf. Wegen μi → 0 (Theorem VI.2.5) ahle in jedem Eigenraum ker(μi − T ) eine gilt dann auch λk → 0. Ferner w¨ Orthonormalbasis {ei1 , . . . , eidi } und definiere die ek durch (ek ) = (e11 , . . . , e1d1 , e21 , . . . , e2d2 , e31 , . . . , e3d3 , . . .). Nach Lemma VI.3.1(d) bilden die ek ein Orthonormalsystem, und es gilt T ek = λk ek
∀k ∈ N.
Ferner ist nach dem gleichen Argument ker T ⊥ ek f¨ ur alle k, daher H1 := ker T ⊕2 lin{e1 , e2 , . . .} ein abgeschlossener Unterraum von H. Es ist nun H = H1 zu zeigen. Betrachte dazu H2 = H1⊥ . Es gilt T (H2 ) ⊂ H2 , da f¨ ur y ⊥ ek T y, ek = y, T ∗ ek = y, λk ek = λk y, ek = 0 folgt und ¨ ahnlich T y ⊥ ker T , falls y ⊥ ker T , gezeigt werden kann. Wir k¨ onnen daher T2 = T |H2 als kompakten Operator von H2 in sich auffassen. W¨ are T2 = 0, so existierten nach Lemma VI.3.1(e) und (f) sowie nach Theorem VI.2.5(c) λ = 0 und x ∈ H2 , x = 0, mit T2 x = λx. Es w¨are dann λ ∈ σ(T ) und x ∈ lin{e1 , e2 , . . .} ⊂ H2⊥ , folglich x ∈ H2 ∩ H2⊥ = {0}: Widerspruch! Also ist T2 = 0, daher H2 ⊂ ker T ⊂ H2⊥ und ergo H2 = {0}. Das zeigt die behauptete Darstellung von H.
VI.3
271
Kompakte Operatoren auf Hilbertr¨ aumen
Jedes x ∈ H kann deshalb in der Form x=y+ x, ek ek k
mit y ∈ ker T geschrieben werden; vgl. Satz V.4.9. Die Stetigkeit von T ergibt nun x, ek T ek = λk x, ek ek . Tx = Ty + k
k
Schließlich ist nach Konstruktion T = max |μk | = max |λk |; vgl. Lemma VI.3.1(e) und (f). Damit ist der Spektralsatz bewiesen.
2
Wir werden noch eine Umformung des Spektralsatzes angeben und dabei die Bezeichnungen des obigen Beweises benutzen. Sei Ek die Orthoorenden Eigenraum ker(μk − T ); es ist gonalprojektion auf den zu μk geh¨ also dk x, eki eki . Ek x = i=1
Der Spektralsatz zeigt dann Tx =
∞
μk Ek x
∀x ∈ H.
k=1
Diese Reihe konvergiert aber nicht nur punktweise, sondern auch in der Operatornorm. Korollar VI.3.3 (Spektralsatz; Projektionsversion) Unter den Voraussetzungen von Theorem VI.3.2 und mit den obigen Bezeichnungen konvergiert ∞ T = μk Ek k=1
in der Operatornorm. Beweis. Es gilt N μk Ek = μk Ek = sup |μk | → 0, T − k>N k=1
k>N
272
VI.
Spektraltheorie kompakter Operatoren
da die Norm eines normalen kompakten Operators gleich dem betragsgr¨oßten Eigenwert ist. 2 Korollar VI.3.3 kann so interpretiert werden, daß ein kompakter normaler bzw. selbstadjungierter Operator aus den einfachsten Operatoren dieses Typs, n¨ amlich (Satz V.5.9) den endlichdimensionalen Orthogonalprojektionen, zusammengesetzt werden kann. Als n¨ achstes soll der Spektralsatz benutzt werden, um Quadratwurzeln aus Operatoren zu ziehen. Wir nennen einen Operator T ∈ L(H) positiv (in Zeichen T ≥ 0), wenn T x, x ≥ 0
∀x ∈ H
(VI.7)
gilt. Im Fall komplexer Skalare folgt daraus automatisch die Selbstadjungiertheit (Satz V.5.6). Satz VI.3.4 Sei T ∈ K(H) selbstadjungiert und positiv. Dann existiert genau ein positiver selbstadjungierter Operator S ∈ K(H) mit S 2 = T . Man schreibt S = T 1/2 . Beweis. Um die Existenz zu beweisen, schreibe T x = k λk x, ek ek gem¨aß Theorem VI.3.2. Da T positiv ist, sind alle λk ≥ 0. Setze & Sx = λk x, ek ek . k
Direktes Nachrechnen zeigt, daß S selbstadjungiert und positiv ist. Die Kompaktheit folgt aus N & & λk . , ek ek ≤ sup λk → 0 S − k>N k=1
und Korollar II.3.3. Zur Eindeutigkeit: Gelte R ≥ 0, R2 = T und R = R∗ ∈ K(H). Schreibt ∞ ∞ man R = k=1 νk Fk wie in Korollar VI.3.3, so folgt T = k=1 νk2 Fk und 2 νk ≥ 0, da R ≥ 0. Ferner schließt man, daß die Folge (νk ) die Folge der Eigenwerte von T und Fk die Orthogonalprojektion auf den entsprechenden Eigenraum ist (siehe Aufgabe VI.7.9). Es muß daher S = R sein, da die entsprechenden Reihen punktweise unbedingt konvergieren. 2 Man kann außerdem zeigen, daß die Gleichung S 2 = T auch in L(H) nur eine positive selbstadjungierte L¨ osung besitzt (Korollar VII.1.16). Das folgt nicht automatisch aus Satz VI.3.4, da das Quadrat eines nichtkompakten Operators durchaus kompakt sein kann.
VI.3
Kompakte Operatoren auf Hilbertr¨ aumen
273
Ist nun T : H1 → H2 ein beliebiger kompakter Operator zwischen zwei Hilbertr¨ aumen, so ist T ∗ T : H1 → H1 positiv, selbstadjungiert und kompakt. Die eindeutig bestimmte positive Wurzel wird mit |T | = (T ∗ T )1/2 bezeichnet. Satz VI.3.5 (Polarzerlegung) Zu T ∈ K(H1 , H2 ) existiert ein Operator U ∈ L(H1 , H2 ) mit T = U |T |, so daß U |(ker U)⊥ isometrisch ist und daher ein unit¨arer Operator zwischen (ker U )⊥ und ran U ist. U ist durch die Forderung ker U = ker T eindeutig bestimmt. Beweis. Da |T | selbstadjungiert ist, gilt zun¨ achst |T |x2 = x, |T |2 x = x, T ∗ T x = T x 2 . (VI.8) Daher definiert U |T |x = T x einen isometrischen Operator von ran |T | nach ran T , der zu einer ebenfalls mit U bezeichneten Isometrie U : ran |T | → ran T fortgesetzt werden kann. Setze noch U = 0 auf (ran |T |)⊥ = ker |T | (Satz V.5.2(g)). Das zeigt die Existenz von U . Die Eindeutigkeit folgt aus ker |T | = ker T , siehe (VI.8). 2 Ein Operator U mit den Eigenschaften aus Satz VI.3.5 wird partielle Isometrie genannt. Obwohl die Gleichung T = U |T | an die Polarzerlegung λ = eit |λ| komplexer Zahlen erinnert, gibt es entscheidende Unterschiede; so ist z.B. |S + T | ≤ |S| + |T | im allgemeinen falsch. Zum Abschluß dieses Abschnitts geben wir die allgemeine Form eines kompakten, nicht notwendig normalen Operators an. Satz VI.3.6 Zu T ∈ K(H1 , H2 ) existieren Orthonormalsysteme {e1 , e2 , . . .} von H1 und {f1 , f2 , . . .} von H2 sowie Zahlen s1 ≥ s2 ≥ . . . ≥ 0 mit sk → 0, so daß ∞ sk x, ek fk ∀x ∈ H1 . Tx = k=1
Die Zahlen s2k sind die in ihrer Vielfachheit gez¨ahlten Eigenwerte von T ∗ T , die sk selbst heißen die singul¨ aren Zahlen von T . Beweis. Schreibe T = U |T | wie in Satz VI.3.5 und zerlege |T | wie in Theorem VI.3.2: |T |x = sk x, ek ek ; k
274
VI.
Spektraltheorie kompakter Operatoren
dann haben die sk die behaupteten Eigenschaften. Setze fk = U (ek ). Da U nach (VI.8) auf ran |T | isometrisch und folglich (Lemma V.5.4) skalarpro2 dukterhaltend ist, bilden die fk ein Orthonormalsystem. Entwickelt man |T | = T = μk U Ek und daher:
μk Ek wie in Korollar VI.3.3, so erh¨alt man
Korollar VI.3.7 Die Operatoren mit endlichdimensionalem Bild liegen dicht in K(H1 , H2 ). Vergleiche hierzu noch einmal Satz II.3.5 und Korollar II.3.6.
VI.4
Anwendungen auf Integralgleichungen
Eine Gleichung der Form 1 λx(s) − k(s, t)x(t) dt = y(s),
s ∈ [0, 1]
0
mit λ = 0 heißt Fredholmsche Integralgleichung zweiter Art. (Gleichungen erster Art entstehen, wenn λ = 0 ist.) Ist der Kern k quadratisch integrierbar, lassen sich solche Gleichungen mit Hilfe des Spektralsatzes studieren. Im folgenden betrachten wir eine Fredholmsche Integralgleichung zweiter Art mit quadratisch integrierbarem symmetrischen Kern. Es sei also H = L2 [0, 1] und 1 k(s, t)x(t) dt T x(s) = 0
f¨ ur fast alle s; dabei gelte k ∈ L [0, 1]2 und k(s, t) = k(t, s) fast u ¨berall. Dann ist der Operator T kompakt (Beispiel II.3(c)) und selbstadjungiert (Beispiel V.5(b)). Gesucht ist die (!) L¨ osung von 2
λx − T x = y mit λ ∈ ρ(T ), y ∈ L2 [0, 1]. W¨ ahle dazu λk und ek wie in Theorem VI.3.2 sowie eine Orthonormalbasis S von ker T . Dann gilt λx − T x = y genau dann, wenn λ x, ek ek + λ x, ee − λk x, ek ek = y, ek ek + y, ee k
e∈S
k
k
gilt, was wiederum zu 1 y, e ∀e ∈ S λ 1 y, ek ∀k ∈ N x, ek = λ − λk x, e =
e∈S
VI.4
275
Anwendungen auf Integralgleichungen
aquivalent ist, und man kann die L¨ osung in der Form ¨ 1 1 x= y, ek ek + y, ee λ − λk λ k
e∈S
angeben. Mit Hilfe des Orthonormalsystems {e1 , e2 , . . .} l¨aßt sich jedoch auch der Kern entwickeln, was interessante Konsequenzen hat. Es ist n¨amlich fast u (T ek )(s) = λk ek (s) ¨berall sowie
(T ek )(s) =
1
k(s, t)ek (t) dt = 0
1
ek (t)k(t, s) dt 0
= ek , k( . , s)
fast u ¨ berall.
F¨ ur fast alle s gilt daher k( . , s) = k( . , s), en en + k( . , s), ee = λn en (s)en ; n
n
e∈S
beachte dazu λn ∈ R (Lemma VI.3.1(b)) und k( . , s), e = 0 f¨ ur e ∈ S (Beweis wie oben). Nach der Parsevalschen Gleichung (Satz V.4.9(b)) folgt f¨ ur fast alle s 1 |k(t, s)|2 dt = λ2n |en (s)|2 , 0
n
und der Satz von Beppo Levi (Satz A.3.1) zeigt 1 1 1 |k(t, s)|2 dt ds = λ2n |en (s)|2 ds 0
0
0
=
n
n
1
|en (s)|2 ds =
λ2n 0
λ2n .
n
Daraus ergibt sich die Orthogonalentwicklung k= λn en ⊗ en
(VI.9)
n
(wo (g ⊗ h)(t, s) = g(t)h(s)), die in L2 [0, 1]2 konvergiert, nebst 1/2 λ2n = (λn ) 2 < ∞. k L2 =
(VI.10)
n
Sind der Kern und die rechte Seite der Integralgleichung stetige Funktionen, ist man nat¨ urlich an der Existenz von stetigen L¨osungen interessiert. Hierzu ist es n¨ utzlich, eine Version des Spektralsatzes in Pr¨ahilbertr¨aumen zur Verf¨ ugung zu haben.
276
VI.
Spektraltheorie kompakter Operatoren
Satz VI.4.1 Es sei H0 ein Pr¨ahilbertraum, und T0 ∈ K(H0 ) erf¨ ulle die ur alle x, y ∈ H0 . Dann existieren Symmetriebedingung T0 x, y = x, T0 y f¨ ein Orthonormalsystem {en : n ∈ N} in H0 und eine Nullfolge (λn ) mit T0 x =
∞
λn x, en en
∀x ∈ H0 .
n=1
Beweis. Es sei H die Vervollst¨ andigung von H0 , die ja (Satz V.1.8) ein Hilbertraum ist, und es sei T die eindeutig bestimmte Fortsetzung von T0 zu einem Operator von H nach H (Satz II.1.5). Wir werden sehen, daß T ebenfalls kompakt ist und ran T ⊂ H0 gilt. Um zu zeigen, daß T kompakt ist, sei mit (xn ) eine beschr¨ankte Folge in H gegeben. W¨ ahle yn ∈ H0 mit xn − yn ≤ n1 und anschließend eine Teilfolge, so daß limk T ynk = limk T0 ynk =: z existiert. Aus der Stetigkeit von T folgt dann auch limk T xnk = z, und T ist kompakt. Ein ¨ahnliches ahle eine Folge (yn ) in H0 mit Argument zeigt ran T ⊂ H0 : Zu x ∈ H w¨ limn yn = x, f¨ ur die o.B.d.A. (T0 yn ) konvergiert, etwa gegen z ∈ H0 (sic!). Wieder liefert die Stetigkeit T x = z ∈ H0 . Nun ist T selbstadjungiert, und f¨ ur x ∈ H0 gilt nach Theorem VI.3.2 T0 x = T x =
∞
λn x, en en ,
n=1
und der Eigenvektor en liegt wegen λn = 0 und T en = λn en in ran T0 ⊂ H0 . 2 Wir wollen Satz VI.4.1 auf einen Integraloperator mit stetigem symmetrischen Kern k anwenden. Setze H0 = C[0, 1] mit dem Skalarprodukt 1 x, y = 0 x(t)y(t) dt. Dann ist der zu k assoziierte Integraloperator Tk : H0 → (C[0, 1], . ∞ ) wohldefiniert und kompakt (verwende den Satz von Arzel`a-Ascoli und in Absch¨ atzung (II.2) auf S. 51 die Cauchy-SchwarzUngleichung). Damit ist Tk auch als Operator von H0 nach H0 kompakt, denn die Identit¨ at (C[0, 1], . ∞ ) → H0 ist stetig. Die in Satz VI.4.1 beschriebenen Eigenfunktionen sind daher stetig. Auch f¨ ur die Orthogonalentwicklung (VI.9) l¨ a ßt sich mehr sagen; sind n¨ a mlich alle λn > 0, so kon vergiert n λn en ⊗ en nicht nur im quadratischen Mittel, sondern sogar absolut und gleichm¨ aßig. Diese Versch¨ arfung von (VI.9) ist der Inhalt des Satzes von Mercer, den wir als n¨ achstes beweisen werden. Es sei an die Definition eines positiven Hilbertraumoperators in (VI.7) erinnert. Satz VI.4.2 (Satz von Mercer) Sei k ∈ C([0, 1]2 ) und Tk : L2 [0, 1] → L2 [0, 1] der zugeh¨orige Integraloperator. Es gelte k(s, t) = k(t, s) f¨ ur alle s, t ∈ [0, 1], so daß Tk selbstadjungiert
VI.4
277
Anwendungen auf Integralgleichungen
ist. Es seien λ1 , λ2 , . . . die gem¨aß ihrer geometrischen Vielfachheit gez¨ahlten Eigenwerte von Tk mit zugeh¨origen Eigenfunktionen e1 , e2 , . . . . Falls Tk positiv ist, gilt k(s, t) =
∞
λj ej (s)ej (t)
∀s, t ∈ [0, 1],
j=1
wobei die Konvergenz absolut und gleichm¨aßig ist. Der Beweis bedarf einiger Vorbereitungen. Zun¨achst ist zu beachten, daß wegen der Stetigkeit von k auch die ej stetig sind, wie soeben beobachtet wurde. Ferner ben¨ otigen wir folgende Verbesserung des Spektralsatzes. Satz VI.4.3 Es m¨ogen die Voraussetzungen des Satzes von Mercer gelten, jedoch braucht diesmal Tk nicht positiv zu sein. Ferner sei x ∈ C[0, 1]. Dann gilt ∞ (Tk x)(s) = λj x, ej ej (s) ∀s ∈ [0, 1], j=1
wobei die Konvergenz absolut und gleichm¨aßig ist. Beweis. Wir fassen hier Tk als kompakten Operator auf dem Pr¨ahilbertraum C[0, 1] auf, vgl. die obige Diskussion. Da die behauptete Gleichheit stets im Sinn der L2 -Konvergenz ∞gilt (Theorem VI.3.2), ist nur die gleichm¨ aßige Konvergenz der Reihe j=1 |λj x, ej ej (s)| f¨ ur alle s zu zeigen. Zun¨ achst gilt f¨ ur alle s ∞
|λj ej (s)|2 =
j=1
∞
|(Tk ej )(s)|2
j=1
=
∞
|k(s, . ), ej |2
j=1
≤ k(s, . ) 2L2 (Besselsche Ungleichung) 1 |k(s, t)|2 dt = 0
≤ k 2∞ . W¨ ahlt man zu ε > 0 ein N ∈ N, so daß ∞ j=N
|x, ej |2 ≤ ε2
278
VI.
Spektraltheorie kompakter Operatoren
ist, folgt aus der Cauchy-Schwarz-Ungleichung f¨ ur alle s ∞ j=N
|λj x, ej ej (s)| ≤
∞
|λj ej (s)|2
1/2 ∞
j=N
1/2 |x, ej |2
j=N
≤ k ∞ ε, was die behauptete gleichm¨ aßige Konvergenz zeigt.
2
Lemma VI.4.4 F¨ ur einen selbstadjungierten Operator T ∈ K(H) sind ¨aquivalent: (i) Alle Eigenwerte von T sind ≥ 0. (ii) T ist positiv. Beweis. (i) ⇒ (ii) folgt aus dem Spektralsatz, und (ii) ⇒ (i) ist klar, denn T x, x = λ x 2 f¨ ur einen Eigenvektor. 2 Lemma VI.4.5 Unter den Voraussetzungen des Satzes von Mercer gilt k(t, t) ≥ 0
∀t ∈ [0, 1].
Beweis. Sei 0 < t0 < 1. Setze xn (s) = n2 χ[t0 −1/n,t0 +1/n] . Bezeichnet ferner Qn das Quadrat mit dem Mittelpunkt (t0 , t0 ) und der Seitenl¨ange n2 (beur große n) und F (Qn ) dessen Fl¨acheninhalt, so achte, daß Qn ⊂ [0, 1]2 f¨ gilt 0 ≤ Tk xn , xn t0 +1/n t0 +1/n dt ds k(s, t) = t0 −1/n 2/n t0 −1/n 2/n 1 = k(s, t) ds dt, F (Qn ) Qn und der letzte Term ist nach dem Mittelwertsatz der Integralrechnung = ur geeignete (sn , tn ) ∈ Qn . Mit n → ∞ gilt sn → t0 , tn → t0 und k(sn , tn ) f¨ 2 daher k(t0 , t0 ) ≥ 0, da k stetig ist. Daraus folgt die Behauptung. Jetzt fehlt noch ein wichtiges Ingrediens zum Beweis des Satzes von Mercer, der Satz von Dini. Beachte, daß die Stetigkeit der Grenzfunktion eine Voraussetzung im folgenden Satz ist. Satz VI.4.6 (Satz von Dini) Sei T ein kompakter metrischer (oder topologischer) Raum, f, f1 , f2 , . . . : T → R seien stetig. Es gelte f1 ≤ f2 ≤ . . . und f = sup fn punktweise. Dann konvergiert (fn ) gleichm¨aßig gegen f .
VI.4
279
Anwendungen auf Integralgleichungen
Beweis. Zu t ∈ T und ε > 0 w¨ ahle Nt mit f (t) − ε < fNt (t). Da f und fNt stetig sind, gilt auch in einer Umgebung Ut von t f (s) − ε < fNt (s)
∀s ∈ Ut .
¨ Uberdecke T durch endlich viele solcher Umgebungen, und sei N das gr¨oßte oglich, da T kompakt ist. Dann gilt der dabei vorkommenden Nt ; das ist m¨ f¨ ur alle n ≥ N und alle t ∈ T f (t) − ε < fN (t) ≤ fn (t) ≤ f (t), 2
was zu zeigen war. Nun k¨ onnen wir Satz VI.4.2 beweisen. Sei kn der stetige Kern n
kn (s, t) =
λj ej (s)ej (t).
j=1
Dann gilt nach dem Spektralsatz Tk−kn x, x = Tk x, x − Tkn x, x = λj x, ej ej , x j>n
=
λj |x, ej |2
j>n
≥ 0, da alle λj ≥ 0 sind. Lemma VI.4.5 liefert daher k(t, t) − kn (t, t) ≥ 0 d.h.
n
∀t ∈ [0, 1],
λj |ej (t)|2 ≤ k(t, t) ≤ k ∞
∀n ∈ N.
(VI.11)
j=1
2 Es folgt, daß die Reihe ∞ ur jedes t konvergiert. j=1 λj |ej (t)| f¨ Die Cauchy-Schwarz-Ungleichung liefert ∞
|λj ej (s)ej (t)| =
j=1
∞ & & λj ej (s) λj ej (t) j=1
≤
∞
λj |ej (s)|
j=1
≤ k ∞ ;
2
1/2 ∞ j=1
1/2 λj |ej (t)|
2
280
VI.
Spektraltheorie kompakter Operatoren
f¨ ur den letzten Schritt verwende (VI.11). Deshalb konvergiert die Reihe ∞
λj ej (s)ej (t)
j=1
¨ f¨ ur alle s, t ∈ [0, 1] absolut. Die folgende Uberlegung zeigt, daß bei festem s gleichm¨ aßige Konvergenz in t vorliegt. W¨ahle N = N (s) ∈ N, so daß ∞ 2 2 ur alle t wegen (VI.11) j=N λj |ej (s)| ≤ ε ist; dann gilt f¨ ∞
|λj ej (s)ej (t)| ≤
j=N
∞
λj |ej (s)|
2
1/2 ∞
j=N
1/2 λj |ej (t)|
2
≤ ε k 1/2 ∞ .
j=N
(VI.12) Betrachte nun den Kern ˜ t) = k(s,
∞
λj ej (s)ej (t).
j=1
Dann ist k˜ ∈ L2 ([0, 1]2 ), da die ej ⊗ ej ein Orthonormalsystem in L2 ([0, 1]2 ) bilden und da (λj ) ∈ 2 , vgl. (VI.10). Wir werden als n¨achstes k = k˜ zeigen. Sei dazu s ∈ [0, 1] fest. Betrachte ˜ t). h(t) = k(s, t) − k(s, Wegen der in (VI.12) bewiesenen gleichm¨ aßigen Konvergenz in t ist h stetig. F¨ ur jedes x ∈ C[0, 1] gilt nun 1 1 1 ˜ t)x(t) dt h(t)x(t) dt = k(s, t)x(t) dt − k(s, 0
0
= (Tk x)(s) −
∞
0
=
x(t)ej (t) dt 0
j=1 ∞
1
λj ej (s)
(gleichm¨aßige Konvergenz) ∞ λj x, ej ej (s) − λj ej (s)x, ej
j=1
j=1
(Satz VI.4.3) = 0. Speziell ist
1 0
h(t)h(t) dt = 0, also h = 0. Daher ist f¨ ur jedes s ˜ t) k(s, t) = k(s,
insbesondere ˜ s) = k(s, s) = k(s,
∀t ∈ [0, 1], ∞ j=1
λj |ej (s)|2 .
(VI.13)
VI.4
281
Anwendungen auf Integralgleichungen
Wegen des Satzes von Dini ist die Konvergenz dieser Reihe gleichm¨aßig, und es folgt, daß in (VI.12) angig von s gew¨ahlt werden kann. ∞ N unabh¨ (VI.12) zeigt dann, daß aßig in s j=1 λj ej (s)ej (t) absolut und gleichm¨ und t konvergiert, und zwar wegen (VI.13) gegen k(s, t). Damit ist der Satz von Mercer komplett bewiesen. 2 Es ist nicht ganz einfach, einer gegebenen (symmetrischen) Kernfunktion k anzusehen, ob sie den Voraussetzungen des Satzes von Mercer gen¨ ugt; vgl. jedoch Aufgabe VI.7.16. Insbesondere ist die Positivit¨at von k nicht hinreichend f¨ ur die Positivit¨ at von Tk . Das zeigt das Gegenbeispiel k(s, t) = |s − t|. W¨ are der Operator Tk positiv, so w¨ are wegen der nach dem Satz von Mercer dann vorliegenden gleichm¨ aßigen Konvergenz 1 1 ∞ ∞ |k(s, s)| ds = λj ej (s)ej (s) ds = λj ; 0
0
j=1
j=1
∞ es ist jedoch k(s, s) = 0 f¨ ur alle s, und deshalb w¨are j=1 λj = 0. Die Annahme Tk ≥ 0 impliziert aber λj ≥ 0 f¨ ur alle j (Lemma VI.4.4), so daß dann alle Eigenwerte verschwinden. Da Tk selbstadjungiert ist, folgt nach dem Spektralsatz der Widerspruch Tk = 0. Hingegen ist Satz VI.4.2 auf den Kern k(s, t) = min{s, t} anwendbar. ur alle x ∈ L2 ([0, 1]): Dazu zeigen wir Tk x, x ≥ 0 f¨ 1 1 Tk x, x = dt ds min{s, t}x(s)x(t) 0
0
1
= 0
1
ds 0
1
0
=
0
du 0
1
0
1
=
0
≥ 0.
1
du x(s)x(t) 0 1
t
du 0
ds x(s)x(t) t
1
ds x(s) u
t
ds x(s)x(t) u
du
=
t
ds
dt 0
1
dt
ds x(s)x(t) + u 1
t
1
0 1
t
du
dt
t
0
1
du x(s)x(t) +
0
dt
=
du x(s)x(t) 0 s
t
dt 0
min{s,t}
ds 0
=
1
dt
dt x(t) u 2
1 du ds x(s) u
¨ Die vorstehenden Uberlegungen bleiben g¨ ultig, wenn man statt des Einheitsintervalls einen mit einem endlichen Borelmaß versehenen kompakten metrischen Raum betrachtet.
282
VI.
Spektraltheorie kompakter Operatoren
Zum Abschluß dieses Abschnitts diskutieren wir, wie man die FredholmAlternative zur L¨ osung des Dirichletproblems heranziehen kann. Dies geschieht, indem man es auf eine Integralgleichung mit nicht symmetrischer Kernfunktion zur¨ uckf¨ uhrt. Sei Ω ⊂ Rd ein beschr¨ anktes Gebiet, und sei ϕ ∈ C(∂Ω). (Ein Gebiet ist eine offene und zusammenh¨ angende Teilmenge.) Das Dirichletproblem besteht darin, eine Funktion u ∈ C(Ω) zu finden, die in Ω zweimal stetig differenzierbar ist und Δu = 0 in Ω (VI.14) u|∂Ω = ϕ erf¨ ullt. (Δ ist nat¨ urlich der Laplaceoperator.) Wir betrachten im folgenden der Einfachheit halber d = 3, und wir setzen voraus, daß Ω einen C 2 -Rand hat und der Außenraum Ωa := R3 \ Ω ebenfalls zusammenh¨angend ist. Es sei γ(x) = 1/(4π|x|) das Newtonpotential, und es bezeichne ny den ¨außeren Normalenvektor an Ω im Punkt y ∈ ∂Ω. Setze k(x, y) =
∂ x − y, ny γ(x − y) = −(grad γ)(x − y), ny = ∂ny 4π|x − y|3
f¨ ur x ∈ / ∂Ω, y ∈ ∂Ω. Wendet man den Laplaceoperator auf die Funktion k( . , y) bei festem y an, stellt man Δx k(x, y) = 0
∀x ∈ Ω ∪ Ωa , y ∈ ∂Ω
fest. Zur L¨ osung von (VI.14) sollen nun die Funktionen k( . , y) u ¨ berlagert“ ” werden. F¨ ur eine Funktion g ∈ C(∂Ω) definieren wir das Doppelschichtpotential (diese Bezeichnung ist physikalisch motiviert) g(y)k(x, y) dσ(y) ∀x ∈ Ω ∪ Ωa . (VI.15) ug (x) = ∂Ω
(Hier ist σ das Oberfl¨ achenmaß.) Diese Funktion erf¨ ullt stets Δug (x) = 0 außerhalb von ∂Ω, und es bleibt, g so zu w¨ ahlen, daß die Randbedingung lim ug (x) = ϕ(z)
x→z x∈Ω
∀z ∈ ∂Ω
(VI.16)
erf¨ ullt ist. Wir werden zeigen, daß das unter den eingangs gemachten Voraussetzungen stets m¨ oglich ist. Dazu ben¨ otigen wir einige Eigenschaften von Doppelschichtpotentialen, die ohne Beweis angegeben werden sollen (Beweise findet man in vielen Lehrb¨ uchern der Potentialtheorie, etwa Sobolev [1964], S. 202ff.). Da Ω einen C 2 -Rand hat, ist x − y, ny von der Gr¨oßenordnung const.|x−y|2 f¨ ur x → y, also |k(x, y)| von der Gr¨oßenordnung const.|x−y|−1
VI.4
283
Anwendungen auf Integralgleichungen
f¨ ur x → y. Insbesondere ist der Kern k nicht stetig, aber man u uft, daß ¨berpr¨ trotzdem (VI.15) selbst f¨ ur x ∈ ∂Ω noch sinnvoll ist. Tats¨achlich definiert g(y)k(x, y) dσ(y),
(T g)(x) =
x ∈ ∂Ω
∂Ω
einen stetigen Operator T : C(∂Ω) → C(∂Ω), und mehr noch, da der Kern im Sinn von S. 90 schwach singul¨ ar ist (der Grad der Singularit¨at (= 1) ist kleiner als die Dimension der Mannigfaltigkeit, u ¨ber die integriert wird (= 2)), ist T kompakt; der Beweis ist analog zu Beispiel II.1(n) und II.3(e) zu f¨ uhren. Es ist aus der Potentialtheorie bekannt, daß ein Doppelschichtpotential beim Durchgang durch ∂Ω einen Sprung macht, genauer gilt 1 lim ug (x) + g(z) = (T g)(z) 2
∀z ∈ ∂Ω,
(VI.17)
1 lim ug (x) − g(z) = (T g)(z) 2
∀z ∈ ∂Ω.
(VI.18)
x→z x∈Ω x→z x∈Ωa
Daher ist (VI.16) ¨ aquivalent zur Fredholmschen Integralgleichung zweiter Art 1 (VI.19) T g − g = ϕ. 2 Nach der Fredholm-Alternative existiert entweder f¨ ur alle ϕ ∈ C(∂Ω) eine eindeutig bestimmte L¨ osung dieser Gleichung und deshalb eine L¨osung des Dirichletproblems, oder 12 ist ein Eigenwert von T . Nehmen wir also an, es sei g0 ∈ C(∂Ω) mit 1 T g0 − g0 = 0. 2 achst folgt aus der obigen Diskussion, Unser Ziel ist es, g0 = 0 zu zeigen. Zun¨ daß ug0 , definiert durch (VI.15) mit g0 statt g, das Dirichletproblem mit Randdatum 0 statt ϕ l¨ ost. Das impliziert aber bekanntermaßen ug0 = 0 auf Ω. Weiter lehrt die Potentialtheorie, daß die Normalableitung eines ∂ ug0 (y) = 0 f¨ ur alle y ∈ ∂Ω. Doppelschichtpotentials stetig ist; daher folgt ∂n Nun benutzen wir die Greensche Formel ∂ ug0 dσ = 0 grad ug0 , grad ug0 dx = ug0 − ∂n Ωa ∂Ω und schließen, da Ωa zusammenh¨ angend ist, daß ug0 auf Ωa konstant ist. Wegen ug0 (x) → 0 f¨ ur |x| → ∞ ergibt sich auch ug0 = 0 auf Ωa . Schließlich liefern (VI.17) und (VI.18) g0 = 0, wie behauptet. Zusammenfassend haben wir folgendes Resultat bewiesen.
284
VI.
Spektraltheorie kompakter Operatoren
Satz VI.4.7 Sei Ω ⊂ R3 ein beschr¨anktes Gebiet mit C 2 -Rand, f¨ ur das ur jedes ϕ ∈ C(∂Ω) existiert dann Ωa := R3 \ Ω zusammenh¨angend ist. F¨ genau eine L¨osung des Dirichletproblems Δu = 0 u|∂Ω = ϕ.
in Ω
Der Satz gilt auch, wenn Ωa nicht zusammenh¨angend ist (siehe J¨orgens [1970], S. 136). Hingegen sind nicht glatt berandete beschr¨ankte Gebiete bekannt, f¨ ur die das Dirichletproblem nicht immer l¨osbar ist, das erste solche Beispiel stammt von Lebesgue. Abschließend sei bemerkt, daß man Satz VI.4.7 f¨ ur beliebige Dimensionen aussprechen kann.
VI.5
Nukleare Operatoren
In diesem Abschnitt bezeichnen X und Y (etc.) stets Banachr¨aume und H, Hi (etc.) Hilbertr¨ aume. Der Skalarenk¨ orper kann zun¨achst R oder C sein. Es soll nun eine neue Klasse von linearen Operatoren betrachtet werden. Definition VI.5.1 Ein Operator T ∈ L(X, Y ) heißt nuklear, falls es Fol∞ gen (xn ) in X und (yn ) in Y mit n=1 xn yn < ∞ gibt, so daß Tx =
∞
xn (x)yn
∀x ∈ X
(VI.20)
n=1
gilt. Zun¨ achst einige Bemerkungen zu dieser Definition. Wir bezeichnen den Operator x → x (x)y, wo x ∈ X , y ∈ Y , mit
x ⊗ y.
Offensichtlich ist das die allgemeine Darstellung einer stetigen linearen Abbildung mit (h¨ochstens) eindimensionalem Bild. Genauso offensichtlich ist die Gleichung x ⊗ y = x y , so daß T genau dann nuklear ist, wenn T als im Sinn der Operatornorm absolut konvergente Reihe T =
∞ n=1
xn ⊗ yn
VI.5
285
Nukleare Operatoren
geschrieben werden kann. Eine solche Darstellung ist selbstverst¨andlich nicht eindeutig; z.B. ist x1 ⊗ y1 − x2 ⊗ y2 = x1 ⊗ (y1 − y2 ) + (x1 − x2 ) ⊗ y2 .
(VI.21)
Hat T ∈ L(X, Y ) endlichdimensionales Bild, so kann T als endliche Reihe T =
N
xn ⊗ yn
n=1
dargestellt werden und ist trivialerweise nuklear. Nach Definition ist ein nuklearer Operator Limes (in der Operatornorm) von Operatoren mit endlichdimensionalem Bild, n¨ amlich N (VI.22) xn ⊗ yn = 0, lim T − N →∞ n=1
∞
wo T gem¨ aß (VI.20) mit n=1 xn yn < ∞ dargestellt ist. Es folgt, daß nukleare Operatoren kompakt sind (Korollar II.3.3); wir werden bald sehen (Beispiel VI.5(a)), daß die Umkehrung nicht gilt. Manchmal ist folgende Charakterisierung nuklearer Operatoren praktisch. • Ein Operator T ∈ L(X, Y ) ist genau dann nuklear, wenn es Folgen ur alle (xn ) in X , (yn ) in Y und (an ) ∈ 1 mit xn = yn = 1 f¨ n ∈ N sowie Tx =
∞
an xn (x)yn
∀x ∈ X
n=1
gibt. ¨ Die Aquivalenz dieser Umschreibung zu Definition VI.5.1 ist offensichtlich; in der Tat kann man offenbar zus¨ atzlich auch an ≥ 0 verlangen. Nun zur n¨ achsten Definition, die es uns gestattet zu messen, wie nu” klear“ ein nuklearer Operator ist. Definition VI.5.2 Es sei N (X, Y ) die Menge aller nuklearer Operatoren von X nach Y ; N (X) := N (X, X). F¨ ur T ∈ N (X, Y ) setze T nuk = inf
∞
xn yn ,
n=1
∞ wo sich u ¨ber alle Darstellungen von T als T = n=1 xn ⊗ yn ∞das Infimum mit n=1 xn yn < ∞ erstreckt. (Eine solche Darstellung heiße nukleare Darstellung.) T nuk heißt die nukleare Norm von T .
286
VI.
Spektraltheorie kompakter Operatoren
Es wird in Satz VI.5.3 nachgewiesen werden, daß N (X, Y ) stets ein Vektorraum und . nuk eine Norm ist. Die nukleare Norm eines Operators ist im allgemeinen nur schwer exakt zu berechnen, h¨aufig muß man sich mit Absch¨atzungen zufriedengeben. Ein einfaches Beispiel: Ist T = x1 ⊗ y1 − x2 ⊗ y2 mit xi = yi = 1, so zeigt diese Darstellung nur T nuk ≤ 2, die Darstellung aus (VI.21) liefert jedoch die im allgemeinen bessere Absch¨ atzung T nuk ≤ y1 − y2 + x1 − x2 . Beachte noch folgende Subtilit¨ at bei der Berechnung von T nuk f¨ ur einen Operator T endlichen Rangs: Obwohl T eine nukleare Darstellung als endliche Reihe besitzt, gehen in die Berechnung von T nuk auch die nicht abbrechenden ∞ Darstellungen n=1 xn ⊗ yn ein! (Besitzt X oder Y die Approximationseigenschaft, vgl. S. 88, kann man sich aber wirklich auf die abbrechenden nuklearen Darstellungen beschr¨ anken.) Satz VI.5.3 (a) N (X, Y ) ist ein linearer Raum. (b) . nuk ist eine Norm auf N (X, Y ), und es gilt T ≤ T nuk f¨ ur alle T ∈ N (X, Y ). Ferner ist x ⊗ y nuk = x ⊗ y = x y . (c) N (X, Y ), . nuk ist vollst¨andig. (d) Die Operatoren endlichen Ranges liegen dicht in N (X, Y ) bzgl. . nuk . Hier wie im folgenden bezeichnet T die Operatornorm von T , sie ist von der nuklearen Norm T nuk zu unterscheiden. Beachte, daß (d) st¨arker ist als (VI.22). Beweis. (a) ist klar. ur alle nuklearen Operatoren T . (b) Wir zeigen zuerst T ≤ T nuk f¨ ∞ Ist n¨ amlich T dargestellt als T = n=1 xn ⊗ yn , so zeigt die Dreiecksungleichung f¨ ur die Operatornorm T ≤
∞ n=1
xn ⊗ yn =
∞
xn yn .
n=1
Da die Darstellung von T beliebig war, heißt das T ≤ T nuk nach Definition der nuklearen Norm. Daraus folgt sofort T nuk = 0
⇒ T = 0
⇒ T = 0.
Scharfes Hinsehen zeigt die Bedingung λT nuk = |λ| T nuk, so daß nur noch die Dreiecksungleichung zu zeigen ist, um zu beweisen, daß . nuk
VI.5
287
Nukleare Operatoren
wirklich eine Norm ist. Seien also T1 , T2 ∈ N (X, Y ). W¨ahle zu ε > 0 nukleare Darstellungen Ti =
∞
∞
xi,n ⊗ yi,n ,
n=1
xi,n yi,n ≤ Ti nuk + ε.
n=1
Dann ist T1 + T2 = x1,1 ⊗ y1,1 + x2,1 ⊗ y2,1 + x1,2 ⊗ y1,2 + x2,2 ⊗ y2,2 + · · · , also nach Definition der nuklearen Norm T1 + T2 nuk ≤ x1,1 y1,1 + x2,1 y2,1 + x1,2 y1,2 + x2,2 y2,2 + · · · ≤ T1 nuk + T2 nuk + 2ε. Da ε > 0 beliebig war, folgt die Dreiecksungleichung. Es bleibt, x ⊗ y nuk = x ⊗ y zu begr¨ unden. Oben wurde bereits ≥“ ” gezeigt. Andererseits ist x ⊗ y eine nukleare Darstellung von x ⊗ y, die freilich nur aus einem einzigen Summanden besteht; also gilt nach Definition x ⊗ y nuk ≤ x y = x ⊗ y . (c) Wir verwenden das Kriterium aus Lemma I.1.8. Seien also Tm ∈ ahle nukleare Darstellungen mit N (X, Y ) mit ∞ m=1 Tm nuk < ∞. W¨ Tm =
∞
∞
xm,n ⊗ ym,n ,
n=1
xm,n ym,n ≤ Tm nuk + 2−m .
n=1
Es folgt ∞
xm,n ym,n ≤
m,n=1
∞
( Tm nuk + 2−m ) < ∞,
(VI.23)
m=1
so daß die (Doppel-) Reihe ∞ m,n=1 xm,n ⊗ym,n im Banachraum (Satz II.1.4) L(X, Y ) konvergiert. Daher existiert T ∈ L(X, Y ) mit T =
∞
xm,n ⊗ ym,n
m,n=1
(absolute Konvergenz im Sinn der Operatornorm). (VI.23) zeigt, daß T nuklear ist, und es ist wirklich T = ∞ m=1 Tm im Sinn der nuklearen Norm, denn M ∞ Tm ≤ xm,n ym,n T − m=1 m>M n=1 nuk ≤ ( Tm nuk + 2−m ) → 0. m>M
288
VI.
Spektraltheorie kompakter Operatoren
∞ (d) Sei n=1 xn ⊗ yn eine beliebige nukleare Darstellung von T ∈ N (X, Y ). Dann ist N xn ⊗ yn ≤ xn yn → 0. 2 T − n=1
nuk
n>N
∞ F¨ ur (d) haben wir gezeigt, daß die Reihe T = n=1 xn ⊗ yn nicht nur bzgl. der Operatornorm, sondern auch bzgl. der nuklearen Norm konvergiert. Die im folgenden Satz ausgedr¨ uckte Eigenschaft nennt man die Idealeigenschaft des Raums der nuklearen Operatoren, obwohl L(X, Y ) f¨ ur X = Y kein Ring ist. Satz VI.5.4 Seien R ∈ L(W, X), S ∈ N (X, Y ), T ∈ L(Y, Z). Dann ist T SR ∈ N (W, Z) mit T SR nuk ≤ T S nuk R . Beweis. Sei S = ∞ n=1 xn ⊗ yn . Man verifiziert leicht, daß T SR =
∞
R xn ⊗ T yn ,
n=1
also T SR nuk ≤
∞
R xn T yn ≤ R T
n=1
∞
xn yn
n=1
gilt. Indem man zum Infimum u ¨ber alle nuklearen Darstellungen von S u bergeht und R = R beachtet, erh¨ alt man die Behauptung. 2 ¨ Beispiele. (a) Sei 1 ≤ p < ∞ und X = Y = p . Ta seider Multiplikationsoperator mit einer Folge a = (an ) ∈ 1 , also Ta (sn ) = (an sn ). Der Operator Ta : p → p ist stetig mit Ta = maxn |an | (Aufgabe II.5.11). Bezeichnet nun en (bzw. en ) den n-ten Einheitsvektor in p (bzw. in q ∼ = (p ) , 1 1 p + q = 1), so gilt offenbar Ta =
∞
an en ⊗ en .
(VI.24)
n=1
Daher ist Ta nuklear mit Ta nuk ≤ ∞ n=1 |an |. Wir werden im Fall p = 2 sogar die Gleichheit zeigen (Satz VI.5.5), so daß man f¨ ur (an ) = ( n1 ) ∈ / 1 2 einen kompakten, aber nicht nuklearen Operator auf erh¨alt. ∞ 1 1 ∞ 1 (b) Seien X = , Y = , (an ) ∈ , und sei Ta : → wie oben durch Ta (sn ) = (an sn ) definiert. Es ist leicht zu sehen, daß Ta stetig ist ∞ mit Ta = n=1 |an | = a 1 . Wie unter (a) erkennt man die Darstellung
VI.5
289
Nukleare Operatoren
(VI.24), wobei diesmal en ∈ 1 ⊂ (∞ ) aufgefaßt wird. Dies zeigt Ta ∈ ∞ ∞ 1 nuk ≤ N ( , ) und T n=1 |an | = Ta . Satz VI.5.3(b) liefert nun a∞ sogar Ta nuk = n=1 |an |. (c) Sei X = Y = L∞ [0, 1], und sei k ∈ C [0, 1]2 . Wir betrachten den Integraloperator 1 k(s, t)x(t) dt. (Tk x)(s) = 0 ∞
∞
Der Operator Tk : L [0, 1] → L [0, 1] ist kompakt; das Argument ist dasselbe wie bei Beispiel II.3(d), wo wir Tk auf C[0, 1] aufgefaßt haben, denn (II.2) zeigt Tk x ∈ C[0, 1] f¨ ur x ∈ L∞ [0, 1]. Wir werden Tk ∈ N (L∞ [0, 1]) mit 1
Tk nuk ≤
sup |k(s, t)| dt
(VI.25)
s
0
zeigen. Wir beginnen mit einer Vor¨ uberlegung. Sei n ∈ N beliebig. Zerlege [0, 1] in die 2n Teilintervalle Ij = [(j − 1)2−n , j2−n ], j = 1, . . . , 2n , die (bis auf (n) die Randpunkte) disjunkt sind. Seien aij ∈ K, i, j = 1, . . . , 2n , und sei kn die beschr¨ ankte meßbare (aber unstetige) Funktion 2 n
kn (s, t) =
(n)
aij χIi (s)χIj (t)
i,j=1
und Tkn der zugeh¨ orige Integraloperator auf L∞ [0, 1]. Wegen 2 2 n
Tkn x =
n
(n)
x(t) dt χIi ∈ lin{χIi : i = 1, . . . , 2n }
aij
i=1 j=1
Ij
ist Tkn ein Operator endlichen Ranges. Seine nukleare Norm kann folgendermaßen abgesch¨ atzt werden. Setze x(t) dt. xj (x) = Ij
Dann gilt
xj (L∞ )
= χIj L1 = 2 2
−n
n
Tkn =
xj
⊗
j=1
also wegen
i
. Man erh¨alt 2n
(n) aij χIi
,
i=1
(n)
(n)
aij χIi L∞ = maxi |aij | 2 n
Tkn nuk ≤
j=1
2−n max |aij |. (n)
i
Das ist die diskretisierte Version von (VI.25).
290
VI.
Spektraltheorie kompakter Operatoren
Nun zum eigentlichen Beweis. Sei ε > 0 gegeben. Da k gleichm¨aßig stetig ist, existiert m0 mit max{|s1 − s2 |, |t1 − t2 |} ≤ 2−m0
⇒ |k(s1 , t1 ) − k(s2 , t2 )| ≤ ε. (VI.26)
Sei n ≥ m ≥ m0 , und sei aij = k(i2−n , j2−n ). Betrachte den Operator aß der Vor¨ uberlegung gew¨ahlt ist. Auch dieser l¨aßt Tkn − Tkm , wo Tkn gem¨ sich in die Form (n)
2 2 n
(Tkn − Tkm )x =
n
(n)
bij
x(t) dt χIi Ij
i=1 j=1 (n)
mit geeigneten bij bringen. Der springende Punkt dieser Darstellung ist, daß nach Definition von (n) Tkn und nach (VI.26) stets |bij | ≤ ε ist. Die Vor¨ uberlegung liefert deshalb 2 n
Tkn − Tkm nuk ≤
2−n max |bij | ≤ ε. (n)
i
j=1
Daher ist (Tkn ) eine Cauchyfolge bzgl. . nuk . Sei S ∈ N (L∞ [0, 1]) ihr Limes (Satz VI.5.3(c)). Da (Riemannsche Summe!) 2
n
αn :=
j=1
2
−n
sup |k(s, j2
−n
s
)| →
1
sup |k(s, t)| dt 0
s
f¨ ur n → ∞
und nach der Vor¨ uberlegung Tkn nuk ≤ αn gilt, folgt
1
S nuk ≤
sup |k(s, t)| dt. 0
s
Um das Beispiel abzuschließen, ist noch S = Tk zu zeigen. Da k stetig ist, gilt kn − k ∞ → 0 nach Definition von kn . Nach (II.2) folgt Tkn − Tk = Tkn −k → 0. Andererseits ist nach Satz VI.5.3(b) Tkn − S ≤ Tkn − S nuk → 0, woraus in der Tat S = Tk folgt. ¨ Ahnlich kann man (VI.25) f¨ ur Integraloperatoren mit stetigem Kern auf C[0, 1] beweisen; man muß dann die unstetigen Funktionen χIi in der Definition von kn durch eine stetige Zerlegung der Eins ersetzen. Vergleiche die Symmetrie zwischen (II.2) und (VI.25)!
VI.5
291
Nukleare Operatoren
Der obige Beweis zeigt noch das analoge Ergebnis 1 Tk ∈ N (L1 [0, 1]), T nuk ≤ sup |k(s, t)| ds, 0
t
falls k ein stetiger Kern ist. Die Stetigkeit von k reicht aber nicht, um Tk ∈ N (L2 [0, 1]) zu erzwingen (siehe S. 315); vgl. jedoch Beispiel VI.5(d) unten. Im Rest des Abschnitts werden wir Hilbertraumoperatoren detaillierter untersuchen und erst in den Bemerkungen und Ausblicken die Banachraumsituation kommentieren. Sei also H ein reeller oder komplexer Hilbertraum, den wir der Einfachheit halber als separabel voraussetzen wollen. (Die Resultate bleiben auch im nichtseparablen Fall richtig, nur die Beweise werden ein wenig technischer.) In Satz VI.3.6 wurde gezeigt, daß jedes T ∈ K(H) in der Form T =
∞
sn . , en fn
(VI.27)
n=1
f¨ ur geeignete Orthonormalsysteme (en ) und (fn ) dargestellt werden kann. Die Zahlen sn = sn (T ) ≥ 0 sind die in ihrer Vielfachheit gez¨ahlten Eigenwerte des positiven selbstadjungierten Operators |T | = (T ∗ T )1/2 ; sie heißen, wie bereits in Satz VI.3.6 bemerkt, die singul¨aren Zahlen von T . Im Vergleich mit dem folgenden Satz beachte sn (T ) ∈ c0 und T = maxn sn (T ) = (sn (T )) c0 . Wir nennen (VI.27) die kanonische Darstellung von T . Satz VI.5.5 Ein Operator T ∈ K(H) ist genau dann nuklear, wenn f¨ ur die Folge der singul¨aren Zahlen sn (T ) ∈ 1 gilt. In diesem Fall ist T nuk =
∞
sn (T ) = (sn (T )) 1 .
n=1
Beweis. Gelte zun¨ achst sn (T ) ∈ 1 . Dann ist die kanonische Darstellung eine nukleare Darstellung, und es gilt daher T nuk ≤ n sn (T ). Sei umgekehrt T nuklear, und sei T =
∞ n=1
an . , xn yn
eine nukleare Darstellung mit xn = yn = 1 f¨ ur alle n und n |an | < ∞; wir haben hier den Satz von Fr´ e chet-Riesz V.3.6 benutzt. Es ist n sn (T ) ≤ 1 ¨ |a | zu zeigen, das zeigt n¨ a mlich s (T ) ∈ und nach Ubergang zum n n n Infimum u ¨ ber alle nuklearen Darstellungen n sn (T ) ≤ T nuk.
292
VI.
Spektraltheorie kompakter Operatoren
∞ Sei also T = n=1 sn . , en fn die kanonische Darstellung von T . F¨ ur jedes m ∈ N ist dann einerseits T e m = sm f m , andererseits T em =
∞
an em , xn yn
n=1
sowie nach der Cauchy-Schwarz-Ungleichung und der Besselschen Ungleichung ∞
sm ≤
m=1
=
∞ ∞
|an | |em , xn | |yn , fm |
m=1 n=1 ∞
|an |1/2 |em , xn | |an |1/2 |yn , fm |
m,n=1
≤
∞
|an | |em , xn |2
1/2 ∞
m,n=1
=
∞
|an |
n=1
≤ ≤
∞
n=1 ∞
=
m,n=1
∞
|em , xn |2
m=1
|an | xn 2
1/2 ∞
1/2 ∞
|an |
n=1
|an | yn n=1 1/2
∞
1/2 |yn , fm |2
m=1
1/2 2
1/2 ∞ |an | |an |
n=1 ∞
1/2 |an | |yn , fm |2
n=1
|an |.
n=1
Damit ist die gew¨ unschte Absch¨ atzung bewiesen.
2
Als n¨ achstes soll das Konzept der Spur einer Matrix verallgemeinert werden. Die Spur einer (n × n)-Matrix (aij ) ist bekanntlich ni=1 aii ; sie ist invariant gegen¨ uber orthogonalen (bzw. unit¨aren) Transformationen, d.h. gegen¨ uber einem Wechsel der Orthonormalbasis. Stellt (aij ) eine lineare Abbildung T dar, so gilt f¨ ur jede Orthonormalbasis n i=1
aii =
n
T ei , ei .
i=1
Das legt es nahe, auch f¨ u r Operatoren auf unendlichdimensionalen Hilbert∞ r¨ aumen die Spur durch i=1 T ei , ei f¨ ur irgendeine Orthonormalbasis (ei )
VI.5
293
Nukleare Operatoren
von H definieren zu wollen. Es stellt sich hier jedoch die Frage nach der Konvergenz der Reihe und der Wohldefiniertheit, d.h., der Unabh¨angigkeit von der Wahl der Orthonormalbasis. Lemma VI.5.6 Sei T ∈ N (H), (en ) eine Orthonormalbasis von H, und sei ∞ an . , xn yn T = n=1
irgendeine nukleare Darstellung von T mit xn = yn = 1 und (an ) ∈ 1 . Dann gilt ∞ ∞ an yn , xn = T en , en . n=1
n=1
Dabei ist die Konvergenz der Reihen absolut. Beweis. Wegen (an ) ∈ 1 und |yn , xn | ≤ 1 konvergiert die Reihe linker Hand absolut. Es folgt aus der Parsevalschen Gleichung (Satz V.4.9) ∞
an yn , xn =
n=1
= =
∞
an
∞
yn , ek ek , xn
n=1 k=1 ∞ ∞
an yn , ek ek , xn
k=1 n=1 ∞
T ek , ek .
k=1
Daher konvergiert auch die Reihe rechter Hand zum selben Limes, und zwar unbedingt, wie unser Argument zeigt. Also konvergiert auch diese Reihe absolut. 2 Das Lemma zeigt, daß folgende Definition sinnvoll ist. Definition VI.5.7 Sei T ∈ N (H). Die Spur von T ist definiert als tr(T ) =
∞
T en , en ,
(VI.28)
n=1
wo (en ) irgendeine Orthonormalbasis von H ist. Es gilt tr(T ) =
∞ n=1
an yn , xn ,
(VI.29)
294
VI.
wo T =
∞ n=1
Spektraltheorie kompakter Operatoren
an . , xn yn nuklear dargestellt ist. Insbesondere ist tr(T ) =
∞
sn (T )fn , en ,
(VI.30)
n=1
wenn man die kanonische Darstellung (VI.27) einsetzt. Die nuklearen Operatoren bilden also die Klasse von Hilbertraumoperatoren, f¨ ur die eine Spur erkl¨ art ist; daher heißen sie auch manchmal Operatoren der Spurklasse. Die Bezeichnung tr erinnert u ¨ brigens an trace. Satz VI.5.8 (a) tr ist ein stetiges lineares Funktional auf N (H) mit tr = 1. (b) Ein Operator T ist genau dann nuklear, wenn T ∗ nuklear ist. Ferner ist in diesem Fall tr(T ) = tr(T ∗ ). (c) Ist T ∈ N (H) und S ∈ L(H), so gilt tr(ST ) = tr(T S). Beweis. (a) Die Linearit¨ at folgt aus (VI.28), die Stetigkeit aus (VI.30): |tr(T )| ≤
∞
sn (T )|fn , en | ≤
n=1
∞
sn (T ) = T nuk,
n=1
letzteres wegen Satz VI.5.5. Der Operator T = . , ee zeigt sogar tr = 1. (b) folgt direkt aus den Definitionen. ∞ (c) Ist T = n=1 an . , xn yn , so ist ST =
∞
an . , xn Syn ,
TS =
n=1
∞
an . , S ∗ xn yn ,
n=1
folglich tr(ST ) =
∞
an Syn , xn =
n=1
∞
an yn , S ∗ xn = tr(T S).
2
n=1
Korollar VI.5.9 Sei T ∈ K(H) selbstadjungiert. (λn ) bezeichne die in ihrer Vielfachheit gez¨ahlten Eigenwerte von T , d.h., jeder Eigenwert μ kommt dim ker(μ − T )-mal vor. Dann ist T genau dann nuklear, wenn ∞ |λ n | < ∞ ist. In diesem Fall ist n=1 T nuk =
∞ n=1
|λn |
und
tr(T ) =
∞ n=1
λn .
VI.5
295
Nukleare Operatoren
Beweis. Nach dem Spektralsatz bilden die |λn | genau die Folge der singul¨ aren Zahlen, und es existiert eine Orthonormalbasis aus Eigenvektoren von T . Korollar VI.5.9 folgt dann aus Satz VI.5.5 und (VI.28). 2 Beispiel. (d) Sei k eine stetige Funktion auf [0, 1]2 , und es gelte k(s, t) = k(t, s) f¨ ur alle s, t ∈ [0, 1]. Dann ist der zugeh¨orige Integraloperator auf L2 [0, 1] 1 k(s, t)x(t) dt fast u (T x)(s) = ¨ berall 0
selbstadjungiert und kompakt (Beispiel II.3(c) und V.5(b)). Es wurde in Abschnitt VI.4 die Darstellung k=
∞
λn en ⊗ en
(VI.31)
n=1
entwickelt (Bezeichnungen siehe dort, insbesondere (VI.9)). Wir setzen nun zus¨ atzlich voraus, daß T positiv ist, also T x, x ≥ 0 f¨ ur alle x ∈ L2 gilt. In diesem Fall sind alle λn ≥ 0, und nach dem Satz von Mercer (Satz VI.4.2) ist die Konvergenz in (VI.31) absolut und gleichm¨aßig. Es folgt (λn ) ∈ 1 und die Nuklearit¨ at von T , denn es ist k(s, s) =
∞
λn en (s)en (s)
∀s ∈ [0, 1],
n=1
daher wegen der gleichm¨ aßigen Konvergenz ∞>
1
k(s, s) ds = 0
∞
λn
1
en (s)en (s) ds = 0
n=1
∞
λn .
n=1
Unter diesen Voraussetzungen ergibt sich in vollst¨andiger Analogie zum endlichdimensionalen Fall nach Korollar VI.5.9 tr(T ) =
1
k(s, s) ds. 0
Leider ist es nicht einfach, die Voraussetzung Tk ≥ 0 am Kern k abzulesen; insbesondere ist die Bedingung k ≥ 0 daf¨ ur nicht hinreichend, siehe S. 281. Ferner sei nochmals darauf hingewiesen, daß die Stetigkeit von k allein nicht die Nuklearit¨ at von Tk auf L2 impliziert (vgl. S. 315). Die obige Spurformel wird f¨ ur eine gr¨ oßere Klasse von Kernen in Brislawns Arbeit in Proc. Amer. Math. Soc. 104 (1988) 1181–1190 bewiesen.
296
VI.
VI.6
Spektraltheorie kompakter Operatoren
Hilbert-Schmidt-Operatoren
Kommen wir nun zu einer gr¨ oßeren Klasse von Operatoren auf einem (separablen) Hilbertraum H, als es die nuklearen Operatoren sind. Definition VI.6.1 Ein Operator T ∈ K(H) heißt Hilbert-Schmidt-Operator, falls sn (T ) ∈ 2 gilt. HS(H) bezeichne die Menge der HilbertSchmidt-Operatoren. F¨ ur einen Hilbert-Schmidt-Operator T setze 1/2 ∞ T HS = (sn (T )) 2 = sn (T )2 . n=1
. HS heißt Hilbert-Schmidt-Norm. Es ist auf Grund der Definition nicht klar, daß . HS tats¨achlich eine Norm ist. Es gilt jedoch der folgende Satz. Satz VI.6.2 (a) F¨ ur T ∈ K(H) sind ¨aquivalent: (i) T ist ein Hilbert-Schmidt-Operator. ∞ 2 (ii) Es gibt eine Orthonormalbasis (gn ) mit ∞ n=1 T g2n < ∞. (iii) F¨ ur alle Orthonormalbasen (gn ) gilt n=1 T gn < ∞. In diesem Fall ist f¨ ur alle Orthonormalbasen (gn ) 1/2 ∞ T HS = T gn 2 . n=1
(b) Ein Operator T ist ein Hilbert-Schmidt-Operator genau dann, wenn es T ∗ ist. In diesem Fall ist T HS = T ∗ HS . (c) HS(H) ist ein linearer Raum, und . HS ist eine Norm auf HS(H). Außerdem ist HS(H) ein (nicht abgeschlossenes) Ideal in L(H). Ferner gilt T ≤ T HS. (d) Es ist N (H) ⊂ HS(H) mit T HS ≤ T nuk. (e) Das Produkt von zwei Hilbert-Schmidt-Operatoren T1 und T2 ist nuklear, und es ist T1 T2 nuk ≤ T1 HS T2 HS . (f) F¨ ur S, T ∈ HS(H) setze S, T HS = tr(T ∗ S). . , . HS ist ein Skalarprodukt, das die Hilbert-Schmidt-Norm in ur alle duziert. HS(H), . HS ist ein Hilbertraum. Ferner gilt f¨ Orthonormalbasen (gn ) S, T HS =
∞
Sgn , T gn .
n=1
VI.6
297
Hilbert-Schmidt-Operatoren
(g) Die Operatoren endlichen Ranges liegen dicht in HS(H) bzgl. der Hilbert-Schmidt-Norm . HS . ∞ Beweis. (a) Sei T = n=1 sn . , en fn die kanonische Darstellung von T ∈ K(H). Dann gilt f¨ ur jede Orthonormalbasis (gn ) nach der Parsevalschen Gleichung ∞ 2 ∞ ∞ 2 T gm = sn gm , en fn m=1
= = =
m=1 n=1 ∞ ∞
s2n |gm , en |2
m=1 n=1 ∞ ∞
s2n |gm , en |2
n=1 m=1 ∞
∞
n=1
n=1
sn en 2 =
s2n .
(Das Umsummieren ist erlaubt, da alle Terme positiv sind.) Das zeigt (a). ∞ (b) Zun¨ achst beobachten wir, daß T ∗ = n=1 sn . , fn en gilt. Es sei (gn ) eine Orthonormalbasis, die das Orthonormalsystem (fn ) umfaßt. Es folgt T ∗ gn = 0 f¨ ur die gn , die nicht zu den fn geh¨oren. Folglich ist ∞
T ∗gn 2 =
n=1
∞
T ∗ fn 2 =
n=1
∞
sn en 2 =
n=1
∞
s2n ,
n=1
und (b) folgt aus (a). (c) Daß HS(H) ein linearer Raum ist sowie die Dreiecksungleichung f¨ ur ur die 2 -Norm. . HS folgen aus (iii) in (a) und der Dreiecksungleichung f¨ Auch die Idealeigenschaft ergibt sich leicht aus (a) und (b). Ferner ist T = sup sn (T ) ≤
∞
n
1/2 2
sn (T )
= T HS,
n=1
insbesondere T HS = 0 ⇒ T = 0
⇒ T = 0.
Auch λT HS = |λ| T HS ist eine direkte Konsequenz aus (a). (d) Nach Satz VI.5.5 ist f¨ ur T ∈ N (H) T HS =
∞
1/2 sn (T )2
≤
n=1
da . 2 ≤ . 1 gilt (Aufgabe I.4.10).
∞ n=1
sn (T ) = T nuk,
298
VI.
Spektraltheorie kompakter Operatoren
(e) Sei (gn ) eine Orthonormalbasis von H. Dann ist T2 x =
∞
T2 x, gn gn
∀x ∈ H,
n=1
folglich T1 T2 x =
∞
T2 x, gn T1 gn
∀x ∈ H,
n=1
d.h. T1 T2 =
∞
. , T2∗ gn T1 gn ,
n=1
daher T1 T2 nuk ≤ ≤
∞
T2∗ gn T1gn
n=1 ∞
T2∗ gn 2
1/2 ∞
n=1
1/2 T1 gn
2
n=1
(a)
= T2∗ HS T1 HS
(b)
= T2 HS T1 HS .
(f) Es ist leicht zusehen, daß . , . HS ein Skalarprodukt ist; die Wohldefiniertheit folgt aus (e) und (b). (VI.28) impliziert f¨ ur eine Orthonormalbasis (gn ) ∞ ∞ T ∗ Sgn , gn = Sgn , T gn , tr(T ∗ S) = n=1
insbesondere T, T HS =
n=1 ∞
T gn 2 = T 2HS.
n=1
Nun zur Vollst¨ andigkeit von HS(H). Sei (Tn ) eine . HS -Cauchyfolge. Wegen . ≤ . HS ist (Tn ) auch eine . -Cauchyfolge; wegen der Vollst¨ andigkeit von L(H) existiert der Limes T dieser Folge bzgl. der Operatornorm. Da alle Tn kompakt sind, ist auch T kompakt (Satz II.3.2(a)). Wir zeigen jetzt, daß T ein Hilbert-Schmidt-Operator ist. Sei dazu (gn ) eine Orthonormalbasis, und sei N ∈ N beliebig. W¨ahle m mit 1 Tm − T ≤ √ . N Da (Tn ) eine . HS -Cauchyfolge ist, ist α := sup Tn HS < ∞. n
VI.6
299
Hilbert-Schmidt-Operatoren
Es folgt mit Hilfe der Dreiecksungleichung f¨ ur die 2 -Norm und nach (a) N
1/2 T gn
2
≤
n=1
N
1/2 (T − Tm )gn
n=1
≤
N
1 N n=1
2
+
N
1/2 Tm gn
2
n=1
1/2 + Tm HS
≤ 1 + α, folglich
∞
1/2 T gn
≤ 1 + α < ∞,
2
n=1
und T ist nach (a) ein Hilbert-Schmidt-Operator. Es ist nun noch Tn − T HS → 0 zu zeigen. W¨ ahle zu ε > 0 ein m0 ∈ N mit Tm − Tl HS ≤ ε f¨ ur alle m, l ≥ m0 . Sei wieder N ∈ N beliebig und w¨ ahle l = l(N ) ≥ m0 mit ε T − Tl ≤ √ . N Es sei (gn ) eine Orthonormalbasis von H. Es folgt f¨ ur m ≥ m0 ¨ahnlich wie oben N
1/2 (T − Tm )gn 2
≤
N
n=1
1/2 (T − Tl )gn 2
n=1
+ ≤
N
N
ε2 N n=1
1/2 (Tl − Tm )gn
2
n=1
1/2 + Tl − Tm HS
≤ 2ε und daher auch T − Tm HS =
∞
1/2 (T − Tm )gn
n=1
2
1/2 N 2 = sup (T − Tm )gn ≤ 2ε N
f¨ ur m ≥ m0 .
n=1
300
VI.
Spektraltheorie kompakter Operatoren
(g) Wie in (b) sieht man f¨ ur die Operatoren T = TN = N s . , e f n n n n=1 T − TN HS =
∞
n=1 sn . , en fn
und
1/2 →0
s2n
f¨ ur N → ∞.
2
n>N
Eine wichtige Beispielklasse stellt der n¨ achste Satz vor. 2 Satz VI.6.3 F¨ ur T ∈ L L [0, 1] sind ¨aquivalent: (i) Es gibt eine Funktion k ∈ L2 ([0, 1]2 ) mit 1 k(s, t)x(t) dt fast ¨ uberall. (T x)(s) = (Tk x)(s) := 0
(ii) T ∈ HS L2 [0, 1] . In diesem Fall ist 1 T HS = 0
1/2
1
|k(s, t)|2 ds dt
= k L2 .
0
Beweis. (i) ⇒ (ii): Sei (en ) (also auch (en )) eine Orthonormalbasis von L2 [0, 1]. Dann gilt: ∞
Tk en 2 =
n=1
∞
1
n=1 0 ∞ 1
ds
0
=
1
2 k(s, t)en (t) dt
|k(s, . ), en |2 ds
0 n=1 1
k(s, . ) 2 ds
=
(Parsevalsche Gleichung)
0
1
1
|k(s, t)|2 ds dt.
= 0
0
Das zeigt, daß Tk ein Hilbert-Schmidt-Operator mit Tk HS = k L2 ist. (ii) ⇒ (i): Wir haben gerade gesehen, daß die Abbildung L2 ([0, 1]2 ) → HS(L2 [0, 1]),
k → Tk
eine da jeder Operator endlichen Rangs N Isometrie ist. Sie hat dichtes Bild, 2 . , x y Kernoperator zum L -Kern n n n=1 (s, t) →
N n=1
yn (s)xn (t)
VI.6
301
Hilbert-Schmidt-Operatoren
ist (verwende Satz VI.6.2(g)). Eine isometrische Abbildung mit dichtem Bild zwischen vollst¨ andigen R¨ aumen muß surjektiv sein, da ihr Bild ebenfalls vollst¨ andig, ergo abgeschlossen ist. Daher gilt (ii) ⇒ (i). 2 Ein analoges Resultat gilt f¨ ur beliebige Maßr¨aume (Ω, Σ, μ) statt des Einheitsintervalls. Die bisherigen Resultate zeigen einen engen Zusammenhang zwischen c0 und K(H), 1 und N (H) sowie 2 und HS(H); außerdem entspricht das Summenfunktional (sn ) → n sn der Spur T → tr T . In den Bemerkungen zu diesem Kapitel wird darauf detaillierter eingegangen. Im n¨achsten Satz ¨ wird diese Analogie untermauert; beachte die frappante Ahnlichkeit seiner ∞ ∼ 1 ) , ) aus (c ( Aussage mit den isometrischen Isomorphismen 1 ∼ = 0 = Satz II.2.3. Satz VI.6.4 (a) Die Abbildung Φ: N (H) → K(H) , S → ΦS mit ΦS (T ) = tr(ST ) ist ein isometrischer Isomorphismus; es gilt also K(H) ∼ = N (H). (b) Die Abbildung Ψ: L(H) → N (H) , S → ΨS mit ΨS (T ) = tr(ST ) ist ein isometrischer Isomorphismus; es gilt also N (H) ∼ = L(H). Beweis. Der Beweis folgt der Strategie des Beweises von Satz II.2.3. (a) Zun¨ achst ist Φ wohldefiniert und linear; die Absch¨atzung |ΦS (T )| = |tr(ST )| ≤ ST nuk ≤ S nuk T (hier gingen die S¨ atze VI.5.8 und VI.5.4 ein) zeigt ΦS ≤ S nuk. Zum Beweis, daß Φ injektiv ist, gelte tr(ST ) = 0 f¨ ur alle T ∈ K(H). Speziell folgt mit T = . , xy =: x ⊗ y 0 = tr(ST ) = tr(x ⊗ Sy) = Sy, x
∀x, y ∈ H.
Also ist S = 0, und Φ ist injektiv. Um den Beweis von (a) abzuschließen, ist nun noch folgendes zu zeigen: • Zu f ∈ K(H) existiert S ∈ N (H) mit ΦS = f und S nuk ≤ f . Dazu betrachte die Abbildung (x, y) → f (y ⊗ x). Man sieht sofort, daß es sich um eine stetige Sesquilinearform handelt. Nach dem Satz von LaxMilgram (Aufgabe V.6.18) existiert S ∈ L(H) mit Sx, y = f (y ⊗ x)
∀x, y ∈ H.
Die eigentliche Schwierigkeit besteht nun darin, die Kompaktheit von S zu zeigen. Nach dem folgenden Lemma VI.6.5 reicht es zu beweisen, daß (Sgn , hn ) f¨ ur alle Orthonormalsysteme (gn ), (hn ) eine Nullfolge ist. Um ∞ das einzusehen, sei (an ) ∈ c0 beliebig. Der Operator T = n=1 an hn ⊗ gn
302
VI.
Spektraltheorie kompakter Operatoren
ist dann kompakt mit T = supn |an |. Da die Reihe f¨ ur T normkonvergent ist, folgt ∞ ∞ an f (hn ⊗ gn ) = an Sgn , hn |f (T )| = n=1
n=1
≤ f T = f (an ) ∞ . ∞ Daher ist (an ) → n=1 an Sgn , hn ein stetiges Funktional auf c0 mit Norm ≤ f . Gem¨ aß Satz II.2.3 wird es von einer 1 -Folge dargestellt; nach Konstruktion ist (Sgn , hn ) diese Folge. Daher gilt ∞
|Sgn , hn | ≤ f
n=1
und insbesondere Sgn , hn → 0, und S ist kompakt. ∞ Betrachten wir nun die kanonische Darstellung S = n=1 sn en ⊗ fn , so zeigt das obige Argument (sn ) = (Sen , fn ) ∈ , 1
∞
sn ≤ f .
n=1
Nach Satz VI.5.5 ist S nuklear mit S nuk ≤ f . Schließlich beobachten wir, daß f und ΦS auf allen Operatoren der Form y ⊗ x u ulle und wegen ¨ bereinstimmen, daher auf deren linearer H¨ der Stetigkeit von f und ΦS auf deren Abschluß, der nach Korollar VI.3.7 K(H) ist. Es folgt ΦS = f , wie gew¨ unscht. Damit ist der Beweis von Teil (a) vollst¨ andig. (b) Der Beweis hier ist ¨ ahnlich wie (aber einfacher als) in Teil (a). 2 Es bleibt noch ein Lemma nachzutragen. Lemma VI.6.5 Sei S ∈ L(H). F¨ ur je zwei Orthonormalsysteme (gn ) und (hn ) gelte Sgn , hn → 0. Dann ist S kompakt. Beweis. Falls S nicht kompakt w¨ are, existierte ε > 0 mit S − T > ε
∀T ∈ K(H).
(VI.32)
Wir werden induktiv Orthonormalsysteme (gn ) und (hn ) mit |Sgn , hn | > ε
∀n ∈ N
konstruieren. Ist n = 1, so setze T = 0 in (VI.32) und finde g1 und h1 mit g1 = h1 = 1 und |Sg1 , h1 | > ε. Seien nun g1 , . . . , gn und h1 , . . . , hn (jeweils
VI.6
303
Hilbert-Schmidt-Operatoren
orthonormal) wie gew¨ unscht bereits konstruiert. Sei E (bzw. F ) die Orthogonalprojektion auf lin{g1 , . . . , gn } (bzw. lin{h1 , . . . , hn }). Wende (VI.32) auf den kompakten Operator T = SE + F S − F SE an und erhalte x, y ∈ H mit |(Id − F )S(Id − E)x, y| = |(S − T )x, y| > ε x y . Insbesondere ist Ex = x, F y = y. Setze nun gn+1 =
x − Ex , x − Ex
hn+1 =
y − Fy . y − F y
Es folgt gn+1 ⊥ gi und hn+1 ⊥ hi f¨ ur i ≤ n sowie |Sgn+1 , hn+1 | > ε.
2
Kehren wir abschließend zur Spektraltheorie zur¨ uck. Im folgenden sei H ein komplexer Hilbertraum. Wir wollen das Eigenwertspektrum von nuklearen und Hilbert-Schmidt-Operatoren qualitativ untersuchen. Der selbstadjungierte Fall – hier stimmen die Betr¨age der Eigenwerte des Operators in ihrer Vielfachheit mit den singul¨aren Zahlen u ¨berein – folgt aus Korollar VI.5.9 bzw. der Definition eines Hilbert-Schmidt-Operators: • Wenn T selbstadjungiert und nuklear ist, konvergiert die Reihe der Eigenwerte absolut. • Wenn T ein selbstadjungierter Hilbert-Schmidt-Operator ist, sind die Eigenwerte quadratisch summierbar. Diese Ergebnisse sollen im folgenden f¨ ur nicht notwendig selbstadjungierte (oder normale) Operatoren ebenfalls bewiesen werden. Sei T ∈ K(H). Das Spektrum besteht dann außer der 0 nur aus einer Nullfolge von Eigenwerten (evtl. ist die Menge der Eigenwerte endlich oder sogar leer), die man sich u ¨ blicherweise der Betragsgr¨oße nach angeordnet denkt: |μ1 | ≥ |μ2 | ≥ . . . > 0. Aus Theorem VI.2.5(c) folgt, daß f¨ ur jeden Eigenwert μ = 0 eine (nicht zwingend orthogonale) Zerlegung H = N (μ) ⊕ R(μ) existiert, wo N (μ) und R(μ) unter T wieder in sich selbst abgebildet werden; nach Konstruktion ist dabei (siehe Abschnitt VI.2) N (μ) = {x: ∃n ≥ 1 (μ − T )n x = 0}, und es ist dμ := dim N (μ) < ∞. N (μ) heißt der verallgemeinerte Eigenraum oder Hauptraum zum Eigenwert μ und dμ dessen algebraische Vielfachheit. Ist T selbstadjungiert, so ist (wie in der linearen Algebra) N (μ) = ker(μ − T ) und dμ gleich der bislang betrachteten geometrischen Vielfachheit dim ker(μ − T ). Es gilt n¨ amlich (μ − T )2 x = 0 ⇒ (μ − T )x = 0
304
VI.
Spektraltheorie kompakter Operatoren
f¨ ur selbstadjungiertes T und reelles μ, denn (μ − T )x 2 = (μ − T )x, (μ − T )x = (μ − T )∗ (μ − T )x, x = (μ − T )2 x, x.
Die Eigenwertfolge λn (T ) entsteht durch jeweils dμk -faches Wiederholen des Eigenwerts μk ; u ¨blicherweise geschieht die Anordnung dieser Folge ebenfalls der Betragsgr¨ oße nach: |λ1 (T )| ≥ |λ2 (T )| ≥ . . . > 0. Diese Folge ist das Analogon zur Folge (λk ) aus dem Spektralsatz f¨ ur selbstadjungierte Operatoren, Theorem VI.3.2. Im folgenden Lemma wird eine schwache Version der Jordanschen Normalform eines kompakten Operators produziert. Lemma VI.6.6 Ist T ∈ K(H), so existiert ein Orthonormalsystem (en ) mit T en , en = λn (T ). Beweis. Betrachte die Einschr¨ ankung von T auf N (μk ). Diese Einschr¨ankung Tk = T |N (μk ) kann als Operator von N (μk ) in sich aufgefaßt werden (siehe oben). W¨ ahle eine Basis (fk,l )l=1,...,dμk von N (μk ), so daß Tk bzgl. dieser Basis Jordangestalt hat, d.h. T fk,l = μk fk,l + βk,l fk,l−1
mit βk,l ∈ {0, 1}.
Wir indizieren die fk,l nun um: (f1 , f2 , . . .) := (f1,1 , . . . , f1,dμ1 , f2,1 , . . . , f2,dμ2 , f3,1 , . . .). Dann sind die fn linear unabh¨ angig (Aufgabe VI.7.20), und es gilt nach Konstruktion T fn = λn (T )fn + βn fn−1
mit βn ∈ {0, 1}.
Wendet man auf die fn das Gram-Schmidt-Orthonormalisierungsverfahren (Satz V.4.2) an, erh¨ alt man ein Orthonormalsystem (en ) mit en = αn fn + gn , wo αn = 0, gn ∈ lin{e1 , . . . , en−1 } = lin{f1 , . . . , fn−1 }, so daß auch T gn ∈ lin{e1 , . . . , en−1 }. Es folgt f¨ ur alle n ∈ N T en , en = αn T fn + T gn , en = αn (λn (T )fn + βn fn−1 ), en = λn (T )αn fn , en = λn (T )αn fn + gn , en = λn (T ).
2
VI.6
305
Hilbert-Schmidt-Operatoren
Wir formulieren jetzt den Hauptsatz u ¨ ber das Eigenwertverhalten nicht selbstadjungierter kompakter Operatoren. Satz VI.6.7 (Weylsche Ungleichung) Sei T ∈ K(H), λn (T ) sei die Folge der in ihrer algebraischen Vielfachheit gez¨ahlten Eigenwerte von T , und sn (T ) sei die Folge der singul¨aren Zahlen von T . F¨ ur 1 ≤ p < ∞ gilt dann ∞
|λn (T )|p ≤
n=1
∞
sn (T )p .
n=1
Beweis. Sei T =
∞
sn (T ) . , fn gn
n=1
die kanonische Darstellung von T , und es sei (en ) ein Orthonormalsystem wie in Lemma VI.6.6. Es folgt f¨ ur alle m ∈ N ∞
λm (T ) = T em , em =
sn (T )em , fn gn , em .
(VI.33)
n=1
Schreibe abk¨ urzend amn = em , fn gn , em . Dann gelten ∞
|amn | ≤ 1
∞
und
m=1
|amn | ≤ 1.
(VI.34)
n=1
Um das einzusehen, beachte nur ∞
|em , fn gn , em | ≤
m=1
∞
|em , fn |2
m=1
1/2 ∞
1/2 |em , gn |2
m=1
≤ fn gn = 1, wo wir die Cauchy-Schwarzsche und die Besselsche Ungleichung verwendet haben. Die zweite Behauptung wird genauso bewiesen. Sei nun p1 + 1q = 1, und sei M ∈ N beliebig. Dann gilt (im Fall p > 1, der Fall p = 1 ist entsprechend zu modifizieren) die Absch¨atzung M
|λm (T )|
p
(VI.33)
≤
m=1
M ∞ p−1 sn (T )|amn | |λm (T )| m=1
=
m,n
n=1
|amn |
1/p
sn (T )|amn |1/q |λm (T )|p−1
306
VI.
≤ (VI.34)
≤
1/p
|amn |sn (T )p
m,n
∞
Spektraltheorie kompakter Operatoren
sn (T )p
1/p M
n=1
1/q |amn | |λm (T )|(p−1)q
m,n
1/q
|λm (T )|p
;
m=1
im vorletzten Schritt verwende die H¨ oldersche Ungleichung, und f¨ ur den letzten Schritt bemerke (p − 1)q = p. Daraus folgt die Behauptung. 2 Wir formulieren noch zwei Spezialf¨ alle. Korollar VI.6.8 (a) F¨ ur einen nuklearen Operator T gilt ∞
|λn (T )| ≤ T nuk.
n=1
(b) F¨ ur einen Hilbert-Schmidt-Operator T gilt ∞
1/2 |λn (T )|
2
≤ T HS.
n=1
VI.7
Aufgaben
Aufgabe VI.7.1 Bestimme das Spektrum des Shiftoperators T : 1 → 1 ,
(s1 , s2 , . . .) → (s2 , s3 , . . .)
sowie des adjungierten Operators T : ∞ → ∞ . Welche Spektralwerte sind jeweils Eigenwerte? Wie ¨ andern sich die Verh¨ altnisse, wenn wir T als Operator von 2 in sich auffassen? Aufgabe VI.7.2 (Resolventengleichung) Sei X ein Banachraum, und seien S, T ∈ L(X). Zeige: ∀λ, μ ∈ ρ(T ). (a) Rλ (T ) − Rμ (T ) = (μ − λ)Rλ (T )Rμ (T ) (b) Rλ (S) − Rλ (T ) = Rλ (S)(S − T )Rλ (T ) ∀λ ∈ ρ(S) ∩ ρ(T ). Aufgabe VI.7.3 (a) Sei M ein kompakter metrischer Raum und sei h ∈ C(M ). Berechne das Spektrum des Multiplikationsoperators Th : f → f h auf C(M ). Gib notwendige und hinreichende Bedingungen daf¨ ur an, daß ein Element des Spektrums ein Eigenwert ist. (b) Gib notwendige und hinreichende Bedingungen daf¨ ur an, daß Th kompakt ist. Insbesondere beschreibe alle kompakten Multiplikationsoperatoren auf C[0, 1].
VI.7
307
Aufgaben
Aufgabe VI.7.4 Sei K eine kompakte nichtleere Teilmenge von K. Zeige, daß es einen Operator T ∈ L(2 ) mit σ(T ) = K gibt. (Tip: Versuche (sn ) → (an sn ).) Aufgabe VI.7.5 Sei X ein Banachraum. Dann ist die Menge Ω aller stetig invertierbarer Operatoren auf X eine offene Teilmenge von L(X), und die Abbildung T → T −1 ist stetig auf Ω. (Hinweis: Neumannsche Reihe!) Aufgabe VI.7.6 Es sei T ∈ L(X) ein Operator mit T ∈ σ(T ). Dann gilt Id + T = 1 + T . Aufgabe VI.7.7 (Courantsches Minimaxprinzip) Sei H ein Hilbertraum, T ∈ K(H) sei selbstadjungiert. Ordne die positiven Ei+ genwerte (inklusive Vielfachheiten) monoton fallend: λ+ 1 ≥ λ2 ≥ . . . > 0. (a) Sei α > 0, n ∈ N. Dann sind folgende Aussagen ¨ aquivalent: (i) Inklusive Vielfachheiten hat T mindestens n Eigenwerte ≥ α. (ii) Es gibt einen n-dimensionalen Teilraum U von H mit T x, x ≥ αx, x (b) Es gilt λ+ n = sup U
min x∈U \{0}
∀x ∈ U.
T x, x , x, x
wobei U alle n-dimensionalen Unterr¨ aume durchl¨ auft, f¨ ur die T x, x > 0 f¨ ur alle x ∈ U , x = 0 gilt. Wann wird das Supremum angenommen? Warum wird das Minimum in der obigen Formel angenommen? (c) Ferner gilt T x, x max λ+ , n = min V x∈V ⊥ \{0} x, x wenn die rechte Seite positiv ist. Das Minimum wird jetzt u ¨ ber alle (n−1)dimensionalen Unterr¨ aume gebildet. F¨ ur welches V wird es angenommen? Aufgabe VI.7.8 Sei h: R → C 2π-periodisch und h|[0,2π] ∈ L2 [0, 2π]. Betrachte den Faltungsoperator
2π
Th : L2 [0, 2π] → L2 [0, 2π], Th f (s) =
f (t)h(s − t) 0
dt . 2π
(a) Th ist wohldefiniert, normal und kompakt. (b) Durch Entwicklung von h in eine Fourierreihe bestimme die Eigenfunktionen und Eigenwerte von Th . (c) Bestimme die Spektralzerlegung von Th . Aufgabe VI.7.9 Seien H ein Hilbertraum, (en )n∈N ein Orthonormalsystem und ankte Zahlenfolge. Setze (λn ) eine beschr¨ Tx =
n∈N
λn x, en en .
308
VI.
Spektraltheorie kompakter Operatoren
(a) T ∈ L(H), und T ist normal. (b) T ist kompakt genau dann, wenn limn→∞ λn = 0. (c) Bestimme die Eigenwerte und Eigenvektoren von T . Aufgabe VI.7.10 Sei H ein Hilbertraum und T ∈ K(H). Dann stimmen die in Aufgabe II.5.30 definierten Approximationszahlen an (T ) mit den singul¨ aren Zahlen sn (T ) u ¨ berein. s x, en fn Anleitung: Ausgehend von der kanonischen Darstellung T x = n n definiere Operatoren U : H → 2 , V : H → 2 und D: 2 → 2 durch
x → x, en ,
x → x, fn ,
(ξn ) → (sn ξn ).
Finde den Zusammenhang zwischen D und T und zeige mit Hilfe von Aufgabe II.5.30(d) an (T ) ≤ an (D) ≤ sn (T ) ≤ an (T ). Aufgabe VI.7.11 (Dunfords Theorem u at) ¨ ber schwache und starke Analytizit¨ Sei X ein komplexer Banachraum, G ⊂ C offen und f : G → X eine Funktion, so ur jedes x ∈ X analytisch ist. Dann ist f analytisch, d.h. daß x ◦ f f¨ lim λ→λ0
f (λ) − f (λ0 ) =: f (λ0 ) λ − λ0
existiert f¨ ur alle λ0 ∈ G. (λ0 ) eine Cauchyfolge definiert, Beweisidee: Wir m¨ ussen zeigen, daß xn := f (λλnn)−f −λ0 falls λn → λ0 . Um das einzusehen, stelle x (xn − xm ) mit Hilfe der Cauchyformel atzen. Dazu ziehe den Satz dar, dann versuche supx ≤1 |x (xn − xm )| abzusch¨ von Banach-Steinhaus heran. Aufgabe VI.7.12 Seien X und Y Banachr¨ aume und H ein Hilbertraum. (a) Wenn T : X → Y nuklear ist, ist auch T : Y → X nuklear. (b) T nuk ≤ T nuk . (c) Ist Y reflexiv, gelten auch die Umkehrung von (a) und ≥“ in (b). ” (d) Ist T ∈ N (H), so gilt tr(T ∗ ) = tr(T ). Aufgabe VI.7.13 Sei H ein Hilbertraum. Dann sind ¨ aquivalent: (i) T ∈ N (H), (ii) T = T1 T2 mit geeigneten Hilbert-Schmidt-Operatoren T1 und T2 . Aufgabe VI.7.14 t (a) Der Integrationsoperator (T x)(t) = 0 x(s) ds ist ein Hilbert-SchmidtOperator auf L2 [0, 1]. (b) Bestimme die singul¨ aren Zahlen von T und entscheide, ob T nuklear ist. Aufgabe VI.7.15 Sei k ∈ C 1 ([0, 1]2 ) und Tk der zugeh¨ orige Integraloperator auf L2 [0, 1], also
(Tk x)(s) =
1
k(s, t)x(t) dt. 0
Dann ist Tk nuklear. (Hinweis: Partielle Integration und Aufgabe VI.7.13.)
VI.7
309
Aufgaben
Aufgabe VI.7.16 Sei k ∈ C([0, 1]2 ) symmetrisch und Tk : L2 [0, 1] → L2 [0, 1] der zugeh¨ orige Integraloperator. Der Kern k heißt positiv semidefinit, wenn f¨ur alle n ∈ N und alle s1 , . . . , sn ∈ [0, 1] die Matrix k(si , sj ) i,j=1,...,n positiv semidefinit ist. (a) Tk ist genau dann positiv, wenn k positiv semidefinit ist. (b) Ist k positiv semidefinit, so gilt |k(s, t)|2 ≤ k(s, s)k(t, t)
∀s, t ∈ [0, 1].
(c) F¨ ur k(s, t) = |s − t|α , α > 0, ist Tk nicht positiv. Aufgabe VI.7.17 Sei T ∈ HS(H) (H ein Hilbertraum) mit Spektralradius r(T ) < 1. Dann ist Id − T bijektiv und (Id − T )−1 = Id + R mit R ∈ HS(H). Aufgabe VI.7.18 Sei T : 2 → 2 der Multiplikationsoperator (sn ) → (sn /n) und sei S: 2 → 2 der Rechtsshiftoperator (s1 , s2 , . . .) → (0, s1 , s2 , . . .). Dann ist R := ST kompakt. Gib |R| sowie die singul¨ aren Zahlen von R an. Wie sieht die Situation f¨ ur den Linksshiftoperator (s1 , s2 , . . .) → (s2 , s3 , . . .) aus? Aufgabe VI.7.19 (a) Sei λ ∈ 1 und Dλ : ∞ → 1 der Diagonaloperator“ (sn ) → (λn sn ). ” Zeige, daß Dλ nuklear ist, und bestimme die nukleare Norm. (b) Ein Operator T ∈ L(X, Y ) ist genau dann nuklear, wenn es Operatoren A ∈ L(X, ∞ ), B ∈ L(1 , Y ) und Dλ ∈ L(∞ , 1 ) mit λ ∈ 1 gibt, so daß das Diagramm T -Y X
6 A
B
?
∞
Dλ
- 1
kommutiert. In diesem Fall gilt T nuk = inf A B λ 1 , wobei sich das Infimum u ¨ ber alle solche Faktorisierungen erstreckt. (c) Faktorisiere Dλ
∞
@
D1@
@ R @
- 1
D2
2 mit Hilfe geeigneter Diagonaloperatoren D1 und D2 und zeige, daß es zu ur T ∈ N (X) Operatoren S1 : X → 2 , S2 : 2 → X mit T = S2 S1 gibt, f¨ die S1 S2 ein Hilbert-Schmidt-Operator auf 2 ist.
310
VI.
Spektraltheorie kompakter Operatoren
Aufgabe VI.7.20 Sei X ein komplexer Banachraum, T ∈ L(X), und es seien ur j = 1, . . . , n seien xj μ1 , . . . , μn paarweise verschiedene Eigenwerte von T . F¨ von 0 verschiedene Elemente des Hauptraums N (μj ). Dann sind x1 , . . . , xn linear unabh¨ angig. n α x = 0. W¨ ahle k ∈ N mit (μj − T )k xj = 0 f¨ ur alle j. Anleitung: Gelte j=1 j j W¨ ahle Polynome P und Q mit P (μ)(μ1 − μ)k + Q(μ)
3
(μj − μ)k = 1
∀μ ∈ C.
j=1
Setze in diese Gleichung T statt μ ein und werte bei α1 x1 aus.
VI.8
Bemerkungen und Ausblicke
Nach sechs Kapiteln sind wir nun da angekommen, wo die Funktionalanalysis ihren Ausgangspunkt nahm: bei der L¨ osungstheorie linearer Integralgleichungen. Um die Jahrhundertwende war bekannt, daß diverse partielle Differentialgleichungen beherrscht werden k¨onnen, indem man assoziierte Integralgleichungen l¨ ost. Allerdings gab es keine allgemeine Theorie der Integralgleichungen, sondern nur verschiedene Einzelbeitr¨age, und die Entwicklung einer solchen allgemeinen Theorie schien mit un¨ uberwindbaren ” Schwierigkeiten“ verbunden (Dieudonn´e [1981], S. 97). Aber hier trog der Schein. Dieudonn´e schreibt weiter (a.a.O., S. 98): It therefore came as a complete surprise when, in a short note published in 1900, Fredholm showed that the general theory of all integral equations [. . .] considered before him was in fact extremely simple [. . .].
¨ Fredholm (Ofversigt af Kongl. Svenska Vetenskaps-Akademiens F¨orhandlingar 57 (1900) 39–46) gelangte zu seinen Resultaten, indem er eine Integralgleichung mit stetigem Kern
1
k(s, t)x(t) dt = y(s)
x(s) + λ
(VI.35)
0
diskretisiert, die Determinante des entstehenden linearen Gleichungssystems studiert, wieder zum Limes u ¨bergeht und so die Reihe Δ(λ) =
1 ∞ λm 1 s , . . . , sm ds1 . . . dsm ··· K 1 s1 , . . . , sm m! 0 0 m=0
erh¨ alt; hier wird K
s ,...,s 1 m = det k(si , tj ) i,j=1,...,m t1 , . . . , tm
VI.8
Bemerkungen und Ausblicke
311
gesetzt. Dann beweist er, daß (VI.35) eine stetige L¨osung besitzt, wenn Δ(λ) = 0 ist, und daß die (h¨ ochstens) eindeutige L¨osbarkeit umgekehrt Δ(λ) = 0 impliziert. In seiner nachfolgenden Arbeit (Acta Math. 27 (1903) 365–390) baut er diesen Ideenkreis zur vollen Fredholm-Alternative f¨ ur die Gleichung (VI.35) aus, und er entwickelt aus seiner Determinantentheorie explizite L¨ osungsformeln f¨ ur (VI.35). In seiner 1. Mitteilung von 1904 (siehe die Bemerkungen und Ausblicke zu Kapitel V) gelang es Hilbert, Fredholms Resultate f¨ ur symmetrische stetige Kerne zu verfeinern. Er f¨ uhrt die Begriffe Eigenwert und Eigenfunktion f¨ ur die nichttrivialen L¨ osungen der homogenen Gleichung (VI.35) ein; seine Eigenwerte sind also die Reziproken der heutigen Eigenwerte. Insbesondere wird der Entwicklungssatz VI.4.3 bewiesen, allerdings unter der einschr¨ ankenden Voraussetzung, daß – in den heutigen Begriffen – der Operator Tk : C[0, 1] → C[0, 1] dichtes Bild bzgl. der L2 -Norm hat. Ferner ben¨ otigt Hilbert zun¨ achst die Annahme, daß alle Eigenwerte einfach sind, wovon er sich danach durch ein etwas umst¨ andliches St¨orungsargument befreit. Kurz darauf bewies Schmidt (Math. Ann. 63 (1907) 433–476) durch einen einfachen direkten determinantenfreien Zugang Hilberts S¨atze ohne weitere Einschr¨ ankungen an den (stetigen) Kern; er betrachtet auch unstetige, aber quadratisch integrierbare Kerne und so die ersten Hilbert-SchmidtOperatoren. Die Zerlegung nicht selbstadjungierter kompakter Operatoren auf einem Hilbertraum, Satz VI.3.6, stammt im wesentlichen ebenfalls von Schmidt. Auch die in Abschnitt VI.4 diskutierte Orthogonalentwicklung des Kerns wurde von Hilbert und Schmidt angegeben; Mercer bewies seinen Satz in Phil. Trans. Roy. Soc. London (A) 209 (1909) 415–446. In seiner 4. Mitteilung von 1906 zeigte Hilbert den Spektralsatz VI.3.2 mit seiner Theorie der quadratischen Formen. Hier ist sein Zugang abstrakt und nicht auf Operatoren mit stetigem Kern beschr¨ankt. Er behandelt sogar beschr¨ ankte, nicht kompakte Operatoren auf 2 , denen wir uns in Kapitel VII widmen werden; und das macht es n¨otig, mit dem allgemeinen Begriff des Spektrums statt der Eigenwerte zu operieren. Aber f¨ ur den kompakten Fall gibt er ein unabh¨ angiges Argument (S. 201ff. der 4. Mitteilung), dessen Kern der Beweis der Existenz des ersten Eigenwerts ist (vgl. Lemma VI.3.1(f)). Wie schon in den Bemerkungen zu Kapitel V erw¨ahnt, betrachteten Hilbert und Schmidt statt Operatoren Bilinearformen, und sie arbeiteten nicht auf dem Hilbertraum L2 [0, 1], sondern dem Pr¨ahilbertraum C[0, 1]. Eine detaillierte Analyse der Beweise des Spektralsatzes nach Hilbert und Schmidt gibt Siegmund-Schultze (Arch. Hist. Exact Sci. 36 (1986) 359– 381); ein Nachdruck ihrer wichtigsten Arbeiten ist vor kurzem erschienen (Hilbert/Schmidt [1989]). F¨ ur eine moderne Darstellung unendlichdimensionaler Determinanten siehe Kapitel 4 in Pietsch [1987]. Die Motivation zur spektralen Zerlegung eines Operators entsprang zum Teil der Theorie der Sturm-Liouville-Probleme. Wir skizzieren dazu einen
312
VI.
Spektraltheorie kompakter Operatoren
sehr einfachen Fall. Sei p: [a, b] → R stetig differenzierbar, q: [a, b] → R stetig, und es gelte p(t) > 0 f¨ ur alle t ∈ [a, b]. Wir betrachten eine gew¨ohnliche Differentialgleichung in sog. selbstadjungierter Form Ly := (py ) + qy = g, wo g ∈ C[a, b] gegeben und y ∈ C 2 [a, b] gesucht ist. Unter einem regul¨aren Sturm-Liouville-Problem versteht man das Randwertproblem Ly = g,
y(a) = y(b) = 0.
(VI.36)
(Tats¨ achlich kann man noch allgemeinere Randvorgaben zulassen.) Wir setzen voraus, daß (VI.36) eindeutig l¨ osbar ist, was unter qualitativen Gesichtspunkten keine Einschr¨ ankung ist, da man ansonsten statt q die Funktion ur ein geeignetes λ0 ∈ R betrachtet. In der Theorie der gew¨ohnlichen q +λ0 f¨ Differentialgleichungen zeigt man, daß dann die L¨osung von (VI.36) in der Form b
y(s) =
k(s, t)g(t) dt
∀s ∈ [a, b]
(VI.37)
a
angegeben werden kann. Die Funktion k heißt die Greensche Funktion des Sturm-Liouville-Problems (VI.36). Sie ist symmetrisch und stetig auf [a, b] × [a, b], so daß durch (VI.37) ein selbstadjungierter kompakter Operator T auf dem Pr¨ ahilbertraum (C[a, b], . L2 ) definiert wird, der invers zu L mit dem Definitionsbereich {y ∈ C 2 [a, b]: y(a) = y(b) = 0} ist. Der Spektralsatz garantiert nun, daß es eine Orthonormalbasis von L2 [a, b] aus (stetigen) Eigenfunktionen von T (d.h. aus Eigenfunktionen von L) gibt; im Fall p = q = 1 ist das das trigonometrische System. Singul¨are SturmLiouville-Probleme sind solche, wo statt eines kompakten Intervalls auch unbeschr¨ ankte Intervalle zugelassen sind oder wo p am Rand von [a, b] verschwinden darf. Der Greensche Operator hierzu ist i.a. nicht kompakt, und zur funktionalanalytischen Analyse bedarf es der Spektralzerlegung beschr¨ ankter oder sogar unbeschr¨ ankter Operatoren, die im n¨achsten Kapitel durchgef¨ uhrt wird. Riesz’ bereits in Kapitel I und II genannte Arbeit aus Acta Math. 41 (1918) 71–98 enth¨ alt die Spektraltheorie kompakter Operatoren, wie sie in Abschnitt VI.2 dargelegt ist. Obwohl er eigentlich nur kompakte Integraloperatoren auf C[0, 1] betrachtet, sind seine Argumente vollkommen allgemein (siehe das auf S. 41 wiedergegebene Zitat); sie sind so elegant, daß sie bis heute nicht vereinfacht wurden. Seine Resultate wurden durch Schauder (Studia Math. 2 (1930) 183–196) komplementiert, der gleichzeitig den adjungierten Operator betrachtete. Riesz’ Idee, Kern und Bild von (Id − T )n zu analysieren, ist sicherlich durch die Konstruktion der Jordanschen Normalform einer Matrix nach dieser Methode inspiriert (siehe E. Weyr, Monatshefte f. Math. u. Physik 1 (1890) 163–236; in B¨ uchern u ¨ ber lineare
VI.8
Bemerkungen und Ausblicke
313
Algebra wird Lemma VI.2.2 im endlichdimensionalen Fall h¨aufig Fitting zugeschrieben, der aber erst 10 Jahre alt war, als Riesz seine Arbeit schrieb). Die Klasse der Operatoren, auf die sich die Rieszsche Theorie erstreckt, umfaßt außer den kompakten Operatoren noch solche, f¨ ur die irgendeine Potenz T m kompakt ist; siehe z.B. Pietsch [1987], S. 147. Da sich das Spektrum eines kompakten Operators auf {0} reduzieren kann, kann es vorkommen, daß aus Theorem VI.2.5 keine Aussagen u ¨ ber die Zerlegbarkeit eines kompakten Operators gewonnen werden k¨onnen. Es stellt sich dann die Frage nach der Existenz von invarianten Unterr¨aumen eines Operators T ∈ L(X), d.h., ob es einen abgeschlossenen Unterraum {0} = U = X mit T (U ) ⊂ U gibt. Hier gilt der gefeierte Satz von Lomonosov aus dem Jahre 1973: • Sei S = 0 ein kompakter Operator auf einem Banachraum X. Dann besitzt S einen invarianten Unterraum, der f¨ ur jedes T ∈ L(X), das mit S kommutiert, ebenfalls invariant ist. Insbesondere besitzt jeder Operator, f¨ ur den irgendeine Potenz kompakt ist, einen invarianten Unterraum. Lomonosovs Beweis, der auf einem Fixpunktargument beruht, ist bei Bollob´ as [1990] und Heuser [1992] dargestellt; dort findet man auch eine spektraltheoretische Beweisvariante nach Hilden und Michaels. In der anderen Richtung war bis vor wenigen Jahren kein einziges Beispiel eines stetigen linearen Operators auf einem Banachraum bekannt, der keinen invarianten Unterraum besitzt, und bis heute kennt man keine solchen Operatoren auf reflexiven Banachr¨ aumen. Das erste Gegenbeispiel stammt von Enflo; seine 1981 eingereichte Arbeit erschien erst 1987 in Acta Math. 158 (1987) 213–313. Offenbar auf Grund ihrer immensen Komplexit¨at ben¨otigten die Herausgeber mehrere Jahre, sie auf ihre Korrektheit zu u ufen. Mit ¨ berpr¨ einer anderen Methode hat Read (Bull. London Math. Soc. 16 (1984) 337– 401, J. London Math. Soc. 33 (1986) 335–348) Gegenbeispiele konstruiert; er hat auch gezeigt, daß auf jedem Banachraum, der einen zu 1 isomorphen komplementierten Teilraum enth¨ alt (z.B. L1 ), ein Operator ohne invariante Unterr¨ aume existiert. Zu diesem Themenkomplex siehe Beauzamy [1988]. Nukleare Operatoren auf Hilbertr¨ aumen wurden zuerst von Schatten und von Neumann (Ann. of Math. 47 (1946) 608–630) studiert, auf Banachr¨ aumen kommen sie zuerst bei Ruston (Proc. London Math. Soc. 53 (1951) 109–124) und Grothendieck (C. R. Acad. Sc. Paris 233 (1951) 1556– 1558) vor. Der Name nuklear“ leitet sich daher ab, daß diese Operatoren ” im Zusammenhang mit L. Schwartz’ Satz vom Kern aus der Distributionentheorie (Abschnitt VIII.7) eine Rolle spielen. Schatten und von Neumann betrachten auch die Klasse cp derjenigen Operatoren auf Hilbertr¨aumen, deren singul¨ are Zahlen eine Folge in p bilden. Dies ist ein linearer Raum, p 1/p auf dem T → eine Norm ist, die cp zu einem Banachraum n sn (T ) ) macht. Diese Schattenklassen werden bisweilen als nichtkommutative p -
314
VI.
Spektraltheorie kompakter Operatoren
(oder Lp -) R¨ aume bezeichnet, mit denen sie viele Eigenschaften teilen. Z.B. ist analog zu Satz II.2.3 (cp ) zu cq isometrisch isomorph, falls p1 + 1q = 1; hier spielt das Spurfunktional tr dieselbe Rolle wie das Summenfunktional f¨ ur Folgenr¨ aume und das Integral f¨ ur Funktionenr¨aume. Das nichtkommutative Analogon zur Aussage von Aufgabe III.6.6 gilt ebenfalls: Jedes Funktional ∈ L(H) kann als = 1 + 2 mit 1 (T ) = tr(ST ) f¨ ur ein S ∈ N (H) und 2 |K(H) = 0 geschrieben werden, und, was der springende Punkt ist, es gilt = 1 + 2 . Dies ist ein Resultat von Dixmier (Ann. of Math. 51 (1950) 387–408). In Analogie zur Spur von nuklearen Operatoren auf Hilbertr¨aumen liegt es auch bei nuklearen Operatoren auf Banachr¨aumen nahe, eine Spur durch tr T =
∞
xn (xn ) f¨ ur
n=1
T =
∞
xn ⊗ xn
n=1
definieren zu wollen; hier gibt es jedoch das Problem der Wohldefiniertheit, denn es ist nicht klar (und in der Tat im allgemeinen falsch), daß n xn (xn ) nur von T und nicht von seiner Darstellung abh¨angt. Die Wohldefiniertheit gilt genau dann, wenn der Banachraum X die Approximationseigenschaft (siehe S. 88) besitzt (Lindenstrauss/Tzafriri [1977], S. 32). Der Satz von Hahn-Banach garantiert, daß es auf jedem Banachraum viele“ stetige Funktionale gibt; aber er sagt nichts u ¨ ber die Reichhaltigkeit ” an Operatoren. Aus Funktionalen kann man die eindimensionalen Operatoren x ⊗ x basteln und aus diesen absolut konvergente Reihen zusammensetzen. Daher garantiert der Satz von Hahn-Banach zumindest, daß es auf jedem Banachraum viele“ nukleare Operatoren gibt, aber m¨oglicherweise ” keine weiteren stetigen Operatoren (außer dem identischen Operator). Man vermutet, daß ein Banachraum X existiert, so daß jedes T ∈ L(X) in der Form λ Id + S mit einem nuklearen Operator S geschrieben werden kann; aber solch einen Raum zu konstruieren ist bis heute noch niemandem gelungen. In dieser Richtung ist ein Ergebnis von K. John bemerkenswert, der f¨ ur die von Pisier (Acta Math. 151 (1983) 181–208) studierten Banachr¨ aume P zeigt, daß jeder kompakte Operator von P nach P ∗ nuklear ist (Math. Ann. 287 (1990) 509–514). Weyl bewies seine Ungleichung in Proc. Nat. Acad. Sci. USA 35 (1949) 408–411. Er zeigte sogar eine pr¨ azisere Form seiner Ungleichung, n¨amlich •
N n=1
|λn (T )|p ≤
N
|sn (T )|p
∀N ∈ N;
n=1
hierf¨ ur m¨ ussen die Folgen der Eigenwerte und der singul¨aren Zahlen betragsm¨ aßig fallend angeordnet sein. Der Beweis im Text, der Reed/Simon [1978], S. 318, folgt, impliziert die Vergleichbarkeit der endlichen Abschnitte nicht. Varianten der Weylschen Ungleichung f¨ ur Operatoren auf Banachr¨aumen wurden von H. K¨ onig gezeigt und auf Fragen der Eigenwertverteilung
VI.8
Bemerkungen und Ausblicke
315
von Integraloperatoren angewendet; dar¨ uber geben die Monographien von K¨ onig [1986] und Pietsch [1987] Auskunft. F¨ ur nukleare Operatoren aumen gilt i.a. auf Banachr¨ nicht mehr die Eigenwertabsch¨ atzung λn (T ) ∈ 1 , sondern nur noch λn (T ) ∈ 2 . Das folgt aus Aufgabe VI.7.19(c) und dem Prinzip der verwandten Operatoren, welches f¨ ur Operatoren S1 : X → Y und S2 : Y → X besagt, daß T = S2 S1 ∈ L(X) dieselben in ihrer algebraischen Vielfachheit gez¨ahlten Eigenwerte besitzt wie S = S1 S2 ∈ L(Y ), falls T kompakt ist (vgl. Pietsch [1987], S. 150); T und S heißen verwandt. Johnson, K¨ onig, Maurey und Retherford (J. Funct. Anal. 32 (1979) 353–380) haben bewiesen, daß nur in Hilbertr¨ aumen alle nukleare Operatoren summierbare Eigenwerte haben: • Ist X ein Banachraum, so daß f¨ ur jeden nuklearen Operator auf X die Eigenwertfolge in 1 liegt, so ist X zu einem Hilbertraum isomorph. ur nukleare Operatoren auf BanachDie Schlußfolgerung λn (T ) ∈ 2 f¨ r¨ aumen kann – zumindest f¨ ur X = L1 oder X = L∞ nicht verbessert werden. Das sieht man mit Hilfe von Aufgabe VI.7.8 so. Sei f eine stetige 2π-periodische Funktion. Deren Fourierkoeffizienten sind dann genau die Eigenwerte des assoziierten Faltungsoperators, und nach Beispiel VI.5(c) ist das ein nuklearer Operator auf L∞ [0, 2π] oder L1 [0, 2π]. Es bleibt, f so zu w¨ ahlen, daß die Folge der Fourierkoeffizienten in keinem p f¨ ur p < 2 liegt. (Nach der Besselschen Ungleichung liegt sie auf jeden Fall in 2 .) Das erste Beispiel einer solchen stetigen Funktion stammt von Carleman, der 1923 bewies, daß die Reihe ∞
ein log n eint 1/2 (log n)2 n n=2 gleichm¨ aßig konvergiert (Zygmund [1959], vol. I, S. 199). Dasselbe Beispiel zeigt nach Korollar VI.6.8(a), daß solch ein Operator nicht nuklear auf L2 [0, 2π] sein kann, obwohl es sich um einen Integraloperator mit stetigem Kern handelt. In Zusammenhang mit dem Beispiel von Carleman ist noch ein Resultat von Paley und Zygmund von 1932 erw¨ ahnenswert: β 2 • Ist (cn ) ∈ 2 (Z) und gilt ∞ < ∞ f¨ ur ein β > 1, n=1 |cn | log |n| so konvergiert n∈Z ±cn eint f¨ ur fast alle Wahlen von Vorzeichen gleichm¨aßig. (Zygmund [1959], vol. I, S. 219.) Damit ist folgendes gemeint. Seien Xn , n ∈ Z, unabh¨ angige Zufallsvariable auf einem Wahrscheinlichkeitsraum Ω, die mit jeweils der Wahrscheinlichkeit 12 den Wert +1 bzw. −1 annehint men. Es sei A ⊂ Ω die Menge derjenigen ω, f¨ ur die n∈Z Xn (ω)cn e
316
VI.
Spektraltheorie kompakter Operatoren
gleichm¨ aßig konvergiert. Dann besitzt A die Wahrscheinlichkeit 1. Auch auf diese Weise erh¨ alt man also die Existenz von stetigen Funktionen, deur p < 2 liegen; aber man kann die ren Fourierkoeffizienten in keinem p f¨ passende Wahl der Vorzeichen nicht konkret angeben. Einen weiteren Existenzbeweis gibt Wojtaszczyk [1991], S. 100, der mit dem Baireschen Kategoriensatz und dem Satz vom abgeschlossenen Graphen argumentiert. Zu zuf¨ alligen trigonometrischen Reihen siehe Kahane [1985]. Dort findet man auch einen Beweis des nachstehenden Satzes von de Leeuw, Kahane und Katznelson (a.a.O., S. 63), der jede Hoffnung auf eine sch¨arfere notwendige Bedingung an die Betr¨ age der Fourierkoeffizienten einer stetigen Funktion als (cn ) ∈ 2 (Z) zunichte macht. eine Folge (cn ) ∈ 2 (Z) mit |cn | ≥ • Ist (an ) ∈ 2 (Z), so existiert |an | f¨ ur alle n, so daß n∈Z cn eint die Fourierreihe einer stetigen Funktion ist. F¨ ur Operatoren auf Hilbertr¨ aumen ist noch der Satz von Lidski˘ı aus dem Jahre 1959 wichtig; er besagt • tr(T ) =
∞
λn (T )
∀T ∈ N (H).
n=1
F¨ ur selbstadjungiertes T folgt diese Formel unmittelbar aus der Definition der Spur und dem Spektralsatz; der Beweis des allgemeinen Falls ist sehr viel schwieriger. Man findet verschiedene Beweise z.B. in Reed/Simon [1978], S. 328, oder Pietsch [1987], S. 218. In Abschnitt VI.6 haben wir der Einfachheit halber nur Hilbert-SchmidtOperatoren von einem Hilbertraum in sich selbst betrachtet; man k¨onnte ebenso Operatoren zwischen verschiedenen Hilbertr¨aumen heranziehen. Im Zusammenhang mit dem Rellichschen Einbettungssatz V.2.13 ist dann die Tatsache erw¨ ahnenswert, daß f¨ ur k > n/2 die identische Einbettung von H0m+k (Ω) nach H0m (Ω), Ω ⊂ Rn offen und beschr¨ankt, ein Hilbert-SchmidtOperator ist (Adams [1975], S. 174). Als Analogon der Hilbert-SchmidtOperatoren im Banachraumkontext sind die von Pietsch eingef¨ uhrten absolut 2-summierenden Operatoren anzusehen, die durch die Forderung ⇒ T xn ∈ 2 x (xn ) ∈ 2 ∀x ∈ X definiert sind. Diese Operatoren brauchen nicht mehr kompakt zu sein, aber ihr Quadrat ist es; in der Tat ist das Produkt zweier absolut 2-summierender Operatoren – wie bei Hilbert-Schmidt-Operatoren – stets nuklear. F¨ ur diese Operatorklasse sei ebenfalls auf K¨ onig [1986], Pietsch [1987] sowie Wojtaszczyk [1991] verwiesen.
Kapitel VII
Spektralzerlegung selbstadjungierter Operatoren
VII.1
Der Spektralsatz fu ankte Operatoren ¨r beschr¨
In diesem Kapitel bezeichnet H stets einen komplexen Hilbertraum. Ist T ein normaler Operator auf Cn , so kann – wie aus der linearen Algebra bekannt – T diagonalisiert werden, d.h., T ist unit¨ar ¨aquivalent zu einer Diagonalmatrix D: U T U −1 = D Eine andere Formulierung ist T =
μj Ej ,
(VII.1)
wobei die μj die paarweise verschiedenen Eigenwerte von T und die Ej die Orthogonalprojektionen auf die zugeh¨ origen Eigenr¨aume sind. Hier ist eine weitere Formulierung: Ist T diagonalisierbar, so sind die Diagonalelemente der Matrix D genau die in ihrer Vielfachheit gez¨ahlten Eigenwerte von T , ur x ∈ Cn die i-te Komponente von U T U −1 x etwa λ1 , . . . , λn . Damit ist f¨ nichts anderes als das λi -fache der i-ten Komponente von x: (U T U −1 x)i = λi xi , und D kann so als Multiplikationsoperator aufgefaßt werden. Auf diese Weise kann man f¨ ur stetige Funktionen f die Matrix f (T ) definieren, n¨amlich durch (U f (T )U −1 x)i = f (λi )xi , vorausgesetzt, die Eigenwerte von T √liegen im Definitionsbereich von f . (Denke z.B. an f (t) = et oder f (t) = t!) Ist nun T ein kompakter normaler Operator auf einem Hilbertraum H, so gilt eine (VII.1) entsprechende
318
VII.
Spektralzerlegung selbstadjungierter Operatoren
Darstellung, wo die endliche Summe allerdings durch eine unbedingt konvergente unendliche Reihe ersetzt ist (siehe Korollar VI.3.3). Auch dieses Resultat kann so gedeutet werden, daß T unit¨ar ¨aquivalent zum Multiplikationsoperator mit der Folge der in ihrer Vielfachheit gez¨ahlten Eigenwerte auf 2 ist. Des weiteren haben wir diese Spektralzerlegung von T zum Anlaß genommen, um T 1/2 zu definieren, falls σ(T ) ⊂ [0, ∞) vgl. Satz VI.3.4. Ziel dieses Abschnitts ist es, analoge Resultate f¨ ur selbstadjungierte beschr¨ ankte (d.h. stetige) Operatoren zu beweisen. (Die Beschr¨ankung auf selbstadjungierte Operatoren erfolgt aus technischen Gr¨ unden, die Modifikation f¨ ur normale Operatoren soll am Schluß kurz angesprochen werden.) Zuerst werden wir die Existenz eines Funktionalkalk¨ uls f¨ ur selbstadjungierte Operatoren nachweisen, d.h. die M¨ oglichkeit, f (T ) f¨ ur geeignete Funktionen f zu definieren. Das wird es m¨ oglich machen, T zu einem Multiplikationsoperator auf einem geeigneten L2 (μ)-Raum zu assoziieren und die zu (VII.1) analoge Darstellung zu erhalten (dann ist allerdings die Summe durch ein Integral bzgl. eines sog. Spektralmaßes zu ersetzen). Wir beginnen mit einem einfachen Lemma. F¨ ur T ∈ L(H) definiere den numerischen Wertebereich W (T ) durch W (T ) = {T x, x: x = 1}. ¨ kann man zeigen, daß W (T ) ist beschr¨ ankt, also W (T ) kompakt. (Ubrigens W (T ) stets konvex ist.) Lemma VII.1.1 F¨ ur T ∈ L(H) gilt σ(T ) ⊂ W (T ). Beweis. Sei λ ∈ W (T ), also d := inf{|λ − μ|: μ ∈ W (T )} > 0. Es folgt f¨ ur x = 1 d ≤ |λ − T x, x| = |(λ − T )x, x| ≤ (λ − T )x x = (λ − T )x . Das zeigt, daß λ − T injektiv ist und daß (λ − T )−1 : ran(λ − T ) → H stetig ist (mit Norm ≤ d1 ). Damit ist λ − T ein Isomorphismus zwischen H und ran(λ − T ), so daß λ − T abgeschlossenes Bild besitzt. W¨are ran(λ − T ) nicht dicht, g¨ abe es ein Element x0 ∈ ran(λ − T )⊥ mit x0 = 1. Es folgte dann 0 = (λ − T )x0 , x0 = λ − T x0 , x0 und daher λ ∈ W (T ) im Gegensatz zur Wahl dieser Gr¨oße. Daher ist ran(λ − T ) = H und λ ∈ ρ(T ).
2
F¨ ur selbstadjungiertes T ist W (T ) ⊂ R, so daß wir folgendes Korollar erhalten. Korollar VII.1.2 Ist T ∈ L(H) selbstadjungiert, so ist σ(T ) ⊂ R. Genauer gilt σ(T ) ⊂ [m(T ), M (T )], wo m(T ) = inf{T x, x: x = 1}, ur positives M (T ) = sup{T x, x: x = 1}. Speziell ist σ(T ) ⊂ [0, ∞) f¨ T.
VII.1
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
319
(Zur Erinnerung: T heißt positiv, falls stets T x, x ≥ 0 gilt; nach Satz V.5.6 sind positive Operatoren auf komplexen Hilbertr¨aumen selbstadjungiert.) Als n¨ achstes versuchen wir, f (T ) f¨ ur f ∈ C(σ(T )) zu definieren. Sei n zun¨ achst f ein Polynom (mit Koeffizienten in C), etwa f (t) = a tk . k k=0 n k 0 Es ist klar, daß mit f (T ) dann nur der Operator k=0 ak T (mit T = Id) gemeint sein kann. (Das w¨ urde man bei irgendeinem Operator auf irgendeinem Banachraum nicht anders machen.) Bei einem selbstadjungierten Operator hat man jedoch zwei Zusatzinformationen. Zum einen wird sich f¨ ur ein Polynom f (mit dieser Definition f¨ ur f (T )) f (T ) = f |σ(T ) ∞ erweisen (siehe unten). Zum anderen liegen die Polynomfunktionen auf σ(T ) dicht in C(σ(T )). Dazu verwende den Weierstraßschen Approximationssatz, der allerdings bis jetzt nur f¨ ur Funktionen auf einem Intervall bewiesen wurde (Satz I.2.10). Da jedoch jede stetige Funktion auf σ(T ) zu einer stetigen Funktion auf dem σ(T ) umfassenden Intervall [m(T ), M (T )] fortgesetzt werden kann (Satz B.1.5), folgt die behauptete Dichtheit. Das sind die wesentlichen Ingredienzien im Beweis des folgenden Satzes. Wir bezeichnen mit t die identische Funktion t → t und mit 1 die konstante Funktion t → 1. Satz VII.1.3 (Stetiger Funktionalkalk¨ ul) Sei T ∈ L(H) selbstadjungiert. Dann existiert genau eine Abbildung Φ: C(σ(T )) → L(H) mit (a) Φ(t) = T , Φ(1) = Id, (b) Φ ist ein involutiver Algebrenhomomorphismus, d.h. • Φ ist linear, • Φ ist multiplikativ (Φ(f · g) = Φ(f ) ◦ Φ(g)), • Φ ist involutiv (Φ(f ) = Φ(f )∗ ), (c) Φ ist stetig. Φ heißt der stetige Funktionalkalk¨ ul von T . Wir schreiben f (T ) := Φ(f ) f¨ ur f ∈ C(σ(T )). Beweis. Eindeutigkeit: Nach (c) ist Φ durch seine Werte auf dem dichten Unterraum der Polynomfunktionen eindeutig bestimmt. Wegen der Linearit¨ at bestimmen die Φ(tn ), n ≥ 0, Φ eindeutig, wegen der Multiplikativit¨at reicht es schließlich, Φ(t) und Φ(1) zu kennen, und die sind in (a) vorgeschrieben. Existenz: Wir versuchen, das obige Argument r¨ uckw¨ narts zuk lesen, und definieren daher zun¨ achst f¨ ur ein Polynom f : t → k=0 ak t den Operator Φ0 (f ) = nk=0 ak T k . Wir fassen dabei f als Polynom im Sinn der Algebra bzw. als Polynomfunktion auf R, nicht aber als Polynomfunktion auf σ(T ) auf, denn hier k¨ onnte ein Wohldefiniertheitsproblem entstehen:
320
VII.
Spektralzerlegung selbstadjungierter Operatoren
Ist z.B. σ(T ) = {0, 1}, so erzeugen die Polynome t und t2 dieselbe Polynomfunktion auf σ(T ), aber es ist nicht a priori klar, daß auch T = T 2 gilt. Daß dieses Problem in Wahrheit nicht entsteht, ergibt sich sofort aus Φ0 (f ) = sup |f (λ)| = f |σ(T ) ∞ .
(VII.2)
λ∈σ(T )
Zum Beweis dieser Behauptung ben¨ otigen wir die Aussage σ(Φ0 (f )) = {f (λ): λ ∈ σ(T )},
(VII.3)
die einstweilen akzeptiert sei. Mit Hilfe von (VII.3) schließt man n¨amlich, ullt: da Φ0 nach Definition (a) und (b) erf¨ Φ0 (f ) 2 = Φ0 (f )∗ Φ0 (f ) = Φ0 (f f ) (∗)
= sup{|λ|: λ ∈ σ(Φ0 (f f ))}
(∗∗)
= sup{|(f f )(λ)|: λ ∈ σ(T )} = sup{|f (λ)|2 : λ ∈ σ(T )}.
Bei (∗) haben wir uns der S¨ atze VI.1.6 und VI.1.7 bedient und bei (∗∗) die Gleichung (VII.3) auf f f angewandt; beachte, daß Φ0 (f f ) selbstadjungiert ist. Kommen wir nun zum Beweis von (VII.3), das f¨ ur konstante Polynome offensichtlich gilt. Ohne Einschr¨ ankung hat f also echt positiven Grad. Sei λ ∈ σ(T ). Da λ Nullstelle von f − f (λ) ist, gilt f (t) − f (λ) = (t − λ)g(t) f¨ ur ein Polynom g. Daher ist Φ0 (f ) − f (λ) = (T − λ)Φ0 (g) und, falls f (λ) ∈ ρ(Φ0 (f )) w¨ are, folgte −1 −1 Id = (T − λ)Φ0 (g) Φ0 (f ) − f (λ) = Φ0 (f ) − f (λ) Φ0 (g)(T − λ) (bemerke, daß die Operatoren in ran(Φ0 ) kommutieren). Es w¨are dann λ ∈ ρ(T ). Daher muß f (λ) ∈ σ(Φ0 (f )) sein. Sei umgekehrt μ ∈ σ(Φ0 (f )). Faktorisiere das Polynom f − μ (= 0): f (t) − μ = a(t − λ1 ) · · · (t − λn ). Dann ist Φ0 (f ) − μ = a(T − λ1 ) · · · (T − λn ). are auch μ ∈ ρ(Φ0 (f )); also muß λi ∈ σ(T ) f¨ ur ein W¨ aren alle λi ∈ ρ(T ), w¨ i sein. Wegen f (λi ) = μ ist μ ∈ {f (λ): λ ∈ σ(T )}. In (VII.2) haben wir nicht nur gezeigt, daß Φ0 als Abbildung vom Raum V0 der Polynomfunktionen auf σ(T ) nach L(H) wohldefiniert ist, sondern
VII.1
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
321
auch die Stetigkeit (sogar die Isometrie) von Φ0 : (V0 , . ∞ ) → L(H) nachgewiesen. Daher ist Φ0 eindeutig auf C(σ(T )) fortsetzbar, so daß die Fortsetzung (die Φ heiße) stetig ist. Ein einfaches Limesargument zeigt, daß Φ auch (b) erf¨ ullt. Um etwa die Involutivit¨ at von Φ zu sehen, approximiere f ∈ C(σ(T )) durch eine Folge von Polynomen (fn ). Dann ist Φ(f ) = Φ lim fn n→∞ (da g → g stetig ist) = Φ lim fn n→∞
= lim Φ(fn ) n→∞
(da Φ stetig ist)
= lim Φ0 (fn ) n→∞
= lim Φ0 (fn )∗ n→∞ ∗ = lim Φ0 (fn ) n→∞ ∗ = Φ lim fn
(da S → S ∗ stetig ist)
= Φ(f )∗ . Damit ist Satz VII.1.3 bewiesen.
2
In Korollar IX.3.8 werden wir einen anderen Beweis der Existenz des stetigen Funktionalkalk¨ uls f¨ ur selbstadjungierte (sogar normale) Operatoren mit Hilfe der Theorie der Banachalgebren geben. Als n¨ achstes stellen wir einige Eigenschaften des stetigen Funktionalkalk¨ uls zusammen. Einen abgeschlossenen Unterraum von L(H), der mit zwei Operatoren S und T auch ST enth¨ alt, nennen wir eine Algebra von Operatoren. Satz VII.1.4 Sei T ∈ L(H) selbstadjungiert, f → f (T ) der stetige Funktionalkalk¨ ul auf C(σ(T )). Dann gelten: (a) f (T ) = f ∞ (= supλ∈σ(T ) |f (λ)|). (b) Ist f ≥ 0, so ist f (T ) ≥ 0 (d.h. f (T ) ist positiv ). (c) Aus T x = λx folgt f (T )x = f (λ)x. (d) Spektralabbildungssatz: σ f (T ) = f σ(T ) ) = {f (λ): λ ∈ σ(T )} . (e) {f (T ): f ∈ C(σ(T ))} ist eine kommutative Algebra von Operatoren. ur reellwertige f selbstadAlle f (T ) sind normal, f (T ) ist genau f¨ jungiert. Beweis. (a) ist bereits mit (VII.2) gezeigt, denn die Polynome liegen dicht. (b) Sei f ≥ 0. Schreibe f = g 2 mit g ∈ C(σ(T )), g ≥ 0. Dann ist f¨ ur alle x ∈ H f (T )x, x = g(T )x, g(T )∗ x = g(T )x, g(T )x = g(T )x, g(T )x = g(T )x 2 ≥ 0.
322
VII.
Spektralzerlegung selbstadjungierter Operatoren
(c) ist klar, wenn f ein Polynom ist, und folgt ansonsten durch das u ¨ bliche Limesargument. (d) Ist f ein Polynom, so erh¨ alt man gerade (VII.3). Sei μ ∈ / f (σ(T )). Dann ist g := (f − μ)−1 ∈ C(σ(T )), und es ist g(f − μ) = (f − μ)g = 1. Folglich g(T )(f (T ) − μ) = (f (T ) − μ)g(T ) = Id, also μ ∈ ρ(f (T )). Das zeigt die Inklusion ⊂“. Umgekehrt sei μ = f (λ) ” f¨ ur ein λ ∈ σ(T ). W¨ ahle ein Polynom gn mit f − gn ∞ ≤ n1 , so daß 1 auch |f (λ) − gn (λ)| ≤ n und f (T ) − gn (T ) ≤ n1 sind. Nach (VII.3) ist gn (λ) ∈ σ(gn (T )), also existiert xn ∈ H mit xn = 1 und (gn (T ) − gn (λ))(xn ) ≤ n1 (Aufgabe VII.5.9). Dann ist (f (T ) − μ)xn ≤
2 3 + (gn (T ) − gn (λ))xn ≤ , n n
also kann f (T ) − μ nicht stetig invertierbar sein (wenn u ¨ berhaupt!). Daher folgt μ ∈ σ(f (T )). Alternativ kann man auch so schließen: μ−f (T ) ist Limes der Folge gn (λ) − gn (T ) , die aus nicht stetig invertierbaren Operatoren besteht. Nach Aufgabe VI.7.5 ist auch μ − f (T ) nicht stetig invertierbar. (e) ist jetzt klar. 2 Sei nun T kompakt und selbstadjungiert, und sei T =
∞
μk Ek
k=0
seine Spektralzerlegung gem¨ aß Korollar VI.3.3. Hier setzen wir μ0 = 0 ∈ σ(T ) und E0 = die Orthogonalprojektion auf ker(T ). (μk )k≥1 bezeichnet die Folge der Eigenwerte = 0. ∞Aus den Ergebnissen von Abschnitt VI.3 folgt, daß die Abbildung f → k=0 f (μk )Ek die Eigenschaften (a), (b) und (c) aus Satz VII.1.3 besitzt und daher den stetigen Funktionalkalk¨ ul von T beschreibt (hier ist nat¨ urlich f ∈ C(σ(T ))). Mit Hilfe des Funktionalkalk¨ uls kann man die Projektionen uckgewinnen: Da σ(T ) bis auf 0 nur isolierte Punkte hat, ist die Ek zur¨ Funktion (j ≥ 1) fj : σ(T ) = {0} ∪ {μ1 , μ2 , . . .} → R, stetig, und es gilt fj (T ) =
∞ k=1
fj (μj ) = 1, fj (t) = 0 sonst
fj (μk )Ek = Ej .
VII.1
323
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
Um auch f¨ ur beschr¨ ankte selbstadjungierte Operatoren die (wie auch immer) in ihnen steckenden Orthogonalprojektionen zu erhalten, kann man versuchen, f¨ ur {0, 1}-wertige Funktionen f auf σ(T ) einen Operator f (T ) zu definieren. Leider werden i.a. solche Funktionen auf σ(T ) nicht stetig sein, so daß der stetige Funktionalkalk¨ ul noch nicht ausreicht. Im weiteren werden wir f (T ) f¨ ur beschr¨ ankte meßbare Funktionen auf σ(T ) definieren. Dazu sei an die im Anhang A zusammengestellten Begriffe und Resultate aus der Integrationstheorie erinnnert. Sei M ⊂ C kompakt. Mit B(M ) bezeichne den Vektorraum der beschr¨ ankten meßbaren Funktionen auf M . Wir werden folgendes Ergebnis ben¨ otigen. Lemma VII.1.5 (a) B(M ), versehen mit . ∞ , ist ein Banachraum. (b) U ⊂ B(M ) habe die Eigenschaft: Falls fn ∈ U , supn fn ∞ < ∞ und f (t) := lim fn (t) f¨ ur alle t ∈ M existiert, dann ist f ∈ U .
n→∞
(∗)
Dann folgt U = B(M ), wenn nur C(M ) ⊂ U . Beweis. (a) ist klar (vgl. Satz A.1.5(c)). (b) Sei V der Schnitt u ¨ ber alle Mengen S, C(M ) ⊂ S ⊂ B(M ), die die Eigenschaft (∗) besitzen. Das System dieser S ist nicht leer, da B(M ) dazugeh¨ ort; es folgt C(M ) ⊂ V . Als erstes wird gezeigt, daß V ein Vektorraum ist. Zu f0 ∈ V setze Vf0 = {g ∈ B(M ): f0 + g ∈ V }. Sei nun f0 ∈ C(M ); dann ist C(M ) ⊂ Vf0 , und Vf0 hat (∗). Daher gilt V ⊂ Vf0 ; d.h. f0 ∈ C(M ), g ∈ V ⇒ f0 + g ∈ V. Sei nun g0 ∈ V . Nach dem gerade Bewiesenen ist C(M ) ⊂ Vg0 . Daher gilt V ⊂ Vg0 , da Vg0 (∗) hat. Es folgt g0 ∈ V, g ∈ V ⇒ g ∈ Vg0 ⇒ g + g0 ∈ V. Genauso zeigt man: α ∈ C, g ∈ V ⇒ αg ∈ V . Nun werden wir beweisen, daß alle Treppenfunktionen in V liegen. Daraus folgt dann V = B(M ), wie behauptet, da die Menge der Treppenfunktionen sogar . ∞ -dicht in B(M ) liegt (Satz A.1.5(e)). Es bezeichne Σ die σ-Algebra der Borelmengen von M . Es ist nur χE ∈ V f¨ ur alle E ∈ Σ zu zeigen, da V ein Vektorraum ist. Wir betrachten Δ = {E ∈ Σ: χE ∈ V }. Δ umfaßt alle (relativ) offenen Mengen, da f¨ ur offenes E stetige fn mit 0 ≤ fn ≤ 1 und limn→∞ fn (t) = χE (t) f¨ ur alle t existieren. Also umfaßt Δ einen durchschnittsstabilen Erzeuger von Σ. Nach einem Resultat der Maßtheorie gen¨ ugt es, folgende Bedingungen an Δ zu verifizieren, um Δ = Σ zu zeigen:1 1 Vgl. Bauer [1990], S. 8, oder Behrends [1987], S. 26. Ein Mengensystem mit (1) und (2) heißt Dynkinsystem.
324
VII.
Spektralzerlegung selbstadjungierter Operatoren
(1) E, F ∈ Δ, E ⊂ F ⇒ F \ E ∈ Δ. (2) E1 , E2 , . . . ∈ Δ paarweise disjunkt ⇒ E := ∞ n=1 En ∈ Δ. Die Bedingung (1) folgt wegen χF \E = χF − χE aus der Vektorraumeigenschaft von V , und (2) gilt wegen χE = χEn (punktweise Konvergenz). Daher gilt Δ = Σ, was zu zeigen war. 2 Teil (b) besagt, daß B(M ) der kleinste Funktionenraum ist, der abgeschlossen gegen¨ uber punktweisen Limiten von gleichm¨aßig beschr¨ankten Folgen ist und alle stetigen Funktionen enth¨alt. Nun zur Erweiterung des Funktionalkalk¨ uls. Seien x, y ∈ H sowie f ∈ C(σ(T )), wo T ∈ L(H) selbstadjungiert ist. Betrachte x,y (f ) = f (T )x, y. Dann ist x,y : C(σ(T )) → C linear (da f → f (T ) linear) und wegen |x,y (f )| ≤ f (T ) x y = f ∞ x y stetig. Es existiert also nach dem Rieszschen Darstellungssatz II.2.5 ein komplexes Maß μx,y mit f (T )x, y =
f dμx,y
∀f ∈ C(σ(T )).
(VII.4)
σ(T )
Beachte, daß die Abbildung H × H → M (σ(T )),
(x, y) → μx,y
sesquilinear ist (also bis auf μx,λy = λμx,y bilinear); des weiteren ist sie wegen μx,y = x,y ≤ x y (siehe oben) stetig. ( μ ist die Variationsnorm des Maßes μ, siehe Beispiel I.1(j).) Die rechte Seite der Gleichung (VII.4) ist jedoch auch f¨ ur f ∈ B(σ(T )) sinnvoll, und das gibt Anlaß, auch f¨ ur solche f einen Operator f (T ) zu definieren. Satz VII.1.6 (Meßbarer Funktionalkalk¨ ul) Sei T ∈ L(H) selbstadjungiert. Dann gibt es genau eine Abbildung Φ: B(σ(T )) → L(H) mit: (a) Φ(t) = T , Φ(1) = Id, ist ein involutiver Algebrenhomomorphismus, (b) Φ ist stetig, (c) Φ ur alle t ∈ σ(T ) (d) fn ∈ B(σ(T )), supn fn ∞ < ∞ und fn (t) → f (t) f¨ ur alle x, y ∈ H. implizieren Φ(fn )x, y → Φ(f )x, y f¨
VII.1
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
325
) Beweis. Eindeutigkeit: Nach Satz VII.1.3 bestimmen (a), (b) und (c) Φ(f f¨ ur f ∈ C(σ(T )) eindeutig; (d) und Lemma VII.1.5 zeigen dann die Eindeutigkeit f¨ ur f ∈ B(σ(T )). Existenz: Seien f ∈ B(σ(T )), x, y ∈ H. Konstruiere die Maße μx,y wie oben und betrachte die Abbildung f dμx,y . (x, y) → σ(T )
Das ist eine stetige Sesquilinearform, denn f dμx,y ≤ f ∞ μx,y ≤ f ∞ x y . σ(T ) Nach dem Satz von Lax-Milgram (Aufgabe V.6.18) existiert ein eindeutig ) bezeichnet werde, mit Φ(f ) ≤ bestimmter stetiger Operator, der mit Φ(f f ∞ und f dμx,y ∀x, y ∈ H. Φ(f )x, y = σ(T )
Es sind noch (a), (b), (c) und (d) zu verifizieren; beachte, daß nach Kon ) = Φ(f ) = f (T ) f¨ struktion Φ(f ur stetige f ist. Daraus folgt bereits (a), und (c) ist auch schon gezeigt. Zu (d): Nach dem Lebesgueschen Konvergenzsatz folgt sofort )x, y n )x, y → Φ(f Φ(f f¨ ur x, y ∈ H unter den Voraussetzungen von (d). linear, und es gilt Φ(f ·g) = Φ(f )◦ Φ(g) Zu (b): Nach Konstruktion ist Φ f¨ ur stetige f und g. g) = Φ(f ) ◦ Φ(g)}. Sei nun g stetig. Setze U = {f ∈ B(σ(T )): Φ(f Nach der Vorbemerkung gilt C(σ(T )) ⊂ U . Um U = B(σ(T )) zu schließen, verwende Lemma VII.1.5(b): Seien fn ∈ U , supn fn ∞ < ∞, und gelte ur alle t ∈ σ(T ). Nach (d) ist einerseits fn (t) → f (t) f¨ n )(Φ(g)x), )(Φ(g)x), lim Φ(f y = Φ(f y
n→∞
und andererseits n )(Φ(g)x), n g)x, y = Φ(f g)x, y, lim Φ(f y = lim Φ(f
n→∞
n→∞
da fn ∈ U . Da x und y beliebig waren, folgt f ∈ U . Mit Lemma VII.1.5(b) schließen wir U = B(σ(T )). Als n¨ achstes sei f meßbar und beschr¨ ankt. Setze V = {g ∈ B(σ(T )): g) = Φ(f )Φ(g)}. Φ(f Nach dem ersten Beweisschritt ist C(σ(T )) ⊂ V , und
326
VII.
Spektralzerlegung selbstadjungierter Operatoren
wie oben sieht man mit Hilfe von Lemma VII.1.5 V = B(σ(T )). Das heißt multiplikativ ist. aber, daß Φ )∗ f¨ ) = Φ(f ur f ∈ B(σ(T )). Mit einer ¨ ahnlichen Technik zeigt man Φ(f 2 ) verwenden. BeWiederum werden wir die Schreibweise f (T ) statt Φ(f achte, daß die f (T ) paarweise kommutieren, denn f (T )g(T ) = (f g)(T ) = (gf )(T ) = g(T )f (T ), und normal sind. f (T ) ist selbstadjungiert f¨ ur reellwertiges f . Teil (d) aus Satz VII.1.6 kann noch verbessert werden, es gilt n¨amlich sogar: ur alle t ∈ σ(T ) (d ) fn ∈ B(σ(T )), supn fn ∞ < ∞ und fn (t) → f (t) f¨ ur alle x ∈ H. implizieren fn (T )x → f (T )x f¨ Beweis. Zun¨ achst zeige fn (T )x → f (T )x : fn (T )x 2 = fn (T )x, fn (T )x = fn (T )∗ fn (T )x, x = (fn fn )(T )x, x → (f f )(T )x, x = f (T )x 2 ; hier haben wir (d) auf fn fn angewandt. Da in einem Hilbertraum nach Aufgabe V.6.5 zn → z schwach, zn → z ⇒ zn → z gilt, folgt nun (d ) aus (d).
2
ur Borelmengen A Wir werden insbesondere an den Operatoren χA (T ) f¨ interessiert sein und formulieren dazu zwei Lemmata. Lemma VII.1.7 F¨ ur Borelmengen A ⊂ σ(T ) ist EA := χA (T ) eine Orthogonalprojektion. 2 ∗ Beweis. Wegen χ2A = χA gilt EA = EA und wegen χA = χA gilt EA = EA (beachte noch Satz V.5.9). 2
Lemma VII.1.8 Sei T ∈ L(H) selbstadjungiert. Dann gilt: (a) χ∅ (T ) = 0, χσ(T ) (T ) = Id. (b) F¨ ur paarweise disjunkte Borelmengen A1 , A2 , . . . ⊂ σ(T ) und x ∈ H ist ∞ χA (T )x = χ∞ (T )x. i
i=1
i=1
Ai
ur Borelmengen A, B ⊂ σ(T ). (c) χA (T )χB (T ) = χA∩B (T ) f¨
VII.1
327
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
Beweis. (a) aus Satz VII.1.6(a), (b) aus Satz VII.1.6(d ) (siehe S. 326) folgt n mit fn = i=1 χAi und (c) aus χA · χB = χA∩B und Satz VII.1.6(b). 2 Im allgemeinen ist
χAi (T ) = χ Ai (T ) falsch, da ja fast nie χAi (T )
→ 0 gilt (wann n¨ amlich nur?). Die Lemmata VII.1.7 und VII.1.8 sagen, daß die Abbildung E: A → χA∩σ(T ) (T ) (VII.5) im Sinne der folgenden Definition ein Spektralmaß ist. Definition VII.1.9 Sei Σ die Borel-σ-Algebra auf R. Eine Abbildung E: Σ → L(H), A → EA heißt Spektralmaß, falls alle EA Orthogonalprojektionen sind und (a) E∅ = 0, ER = Id, (b) f¨ ur paarweise disjunkte A1 , A2 , . . . ∈ Σ ∞ EAi (x) = E Ai (x) ∀x ∈ H i=1
gelten. Ein Spektralmaß E hat kompakten Tr¨ager, falls eine kompakte Menge K mit EK = Id existiert. Man zeigt leicht, daß automatisch EA EB = EB EA = EA∩B gilt (Aufgabe VII.5.7). Als n¨ achstes soll erkl¨ art werden, wie eine beschr¨ankte meßbare Funktion f bez¨ uglich eines Spektralmaßes integriert wird. Dazu geht man wie bei der skalaren Integration in mehreren Schritten vor. Im 1. Schritt sei urlich f = χA , A ∈ Σ, eine Indikatorfunktion. Dann soll nat¨ f dE = EA sein. 2. Schritt: Sei f =
n i=1
αi χAi eine Treppenfunktion. Dann setze
f dE =
n
αi EAi .
i=1
Es ist nun zu u u fen, daß diese Definition wirklich nur von f und nicht ¨ berpr¨ von der Darstellung αi χAi abh¨ angt. (Das ist sehr einfach.) 3. Schritt: Sei f beschr¨ ankt und meßbar. Dann existiert eine Folge (fn ) von Treppenfunktionen, die gleichm¨ aßig gegen f konvergiert (Satz A.1.5(e)). Man ist nun versucht, f dE = lim
n→∞
fn dE
(VII.6)
zu setzen. Das ist gerechtfertigt durch das folgende Lemma. Lemma VII.1.10 F¨ ur eine Treppenfunktion f gilt f dE ≤ f ∞ .
328
VII.
Spektralzerlegung selbstadjungierter Operatoren
n Beweis. Sei x ≤ 1 und f = i=1 αi χAi , wobei die Ai ohne Einschr¨ankung paarweise disjunkt seien. Dann ist 2 2 = f dE (x) α E (x) αi EAi (x) 2 = i A i = |αi |2 EAi (x) 2 ≤ sup |αi |2 EAi (x) 2 i
2 2 EAi x = f 2∞ E Ai (x) = f 2∞ ≤ f 2∞ x 2 , wobei zweimal der Satz von Pythagoras benutzt wurde.
2
Im Hinblick auf (VII.6) impliziert Lemma VII.1.10, daß ( fn dE) eiist) und ne Cauchyfolge in L(H) ist (da ja (fn ) eine . ∞ -Cauchyfolge folglich einen Limes besitzt. Gleichzeitig folgt, daß f dE durch (VII.6) wohldefiniert, d.h. unabh¨ angig von der approximierenden Folge (fn ) ist. F¨ ur das so definierte Integral benutzen wir die Bezeichnungen f dE, f (λ) dEλ , f dE etc. R
Hat E kompakten Tr¨ ager, etwa EK = Id, und ist f : K → C einebeschr¨ankte meßbare Funktion, so definieren wir f dE := K f dE durch R χK f dE; beachte, daß diese Definition von der Wahl von K unabh¨ angig ist, denn f¨ ur EK = Id und K ∩ A = ∅ gilt EA = 0 und deshalb χA f dE = 0. Der folgende Satz faßt zusammen, was wir u uglich ¨ ber die Integration bez¨ eines Spektralmaßes entwickelt haben. Satz VII.1.11 F¨ ur ein Spektralmaß E und eine beschr¨ ankte meßbare Funktion f existiert f dE ∈ L(H). Die Abbildung f → f dE ist linear und stetig, genauer gilt f dE ≤ f ∞. Ist f reellwertig, so ist f dE selbstadjungiert. Ist K ⊂ R eine kompakte Menge mit EK = Id, so gen¨ ugt es, daß f auf K definiert und beschr¨ankt ist. Sei jetzt E ein Spektralmaß mit kompaktem Tr¨ager. Da alle Polynome auf kompakten Mengen beschr¨ ankt sind, ist f dE f¨ ur Polynome f erkl¨art. Speziell existiert T := λ dEλ ∈ L(H), und T ist selbstadjungiert. Wir haben also in (VII.5) einem beschr¨ ankten selbstadjungierten Operator ein Spektralmaß mit kompaktem Tr¨ ager zugeordnet, und soeben haben wir zu einem Spektralmaß mit kompaktem Tr¨ ager einen beschr¨ankten selbstadjungierten Operator assoziiert. Wir werden beweisen, daß das zueinander inverse Operationen sind.
VII.1
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
329
Zun¨ achst sei E ein Spektralmaß mit kompaktem Tr¨ager, und sei T = λ dEλ . Es ist zu zeigen, daß das Spektralmaß von T , d.h. A → χA∩σ(T ) (T ), mit E u ¨ bereinstimmt. Sei f : σ(T ) → C beschr¨ankt und meßbar. Setze f auf R \ σ(T ) durch 0 fort und bezeichne die so auf R fortgesetzte Funktion mit f. Nach Satz VII.1.11 existiert der Operator Ψ(f ) := fdE,
und Ψ: B(σ(T )) → L(H) ist linear und stetig. Ψ ist auch multiplikativ (f¨ ur Treppenfunktionen ist das klar wegen EA EB = EA∩B , allgemein folgt es durch Approximation) und involutiv (¨ ahnliches Argument). Um zu zeigen, daß auch (d) aus Satz VII.1.6 gilt, bemerke, daß f¨ ur x, y ∈ H die Abbildung νx,y : A → EA x, y ein komplexes Maß ist und daß (VII.7) Ψ(f )x, y = f dνx,y gilt (klar f¨ ur Treppenfunktionen und einfach sonst); man braucht dann nur noch den Lebesgueschen Konvergenzsatz anzuwenden. Es bleibt zu u ¨berlegen, daß auch Id = Ψ(1) und T = Ψ(t) gelten. Die erste aquivalent zu Eσ(T ) = Id, und daraus folgt Behauptung ist ¨ dann Ψ(t) = σ(T ) λ dEλ = T nach Satz VII.1.11. ahle ein (aus technischen Gr¨ unden) halboffeUm Eσ(T ) = Id zu zeigen, w¨ nes Intervall (a, b] mit E(a,b] = Id. Sei μ ∈ ρ(T ). Wir werden zuerst EU = 0 f¨ ur eine geeignete Umgebung U von μ zeigen. Da μ − T invertierbar ist, existiert nach Aufgabe VI.7.5 ein δ > 0 mit S − (μ − T ) ≤ δ ⇒ S invertierbar und S −1 ≤ C := (μ − T )−1 + 1. Wir d¨ urfen δ = b−a und δ < C1 annehmen, setzen ak = a + kδ f¨ ur N N k = 0, . . . , N und betrachten die Treppenfunktion f = k=1 ak χ(ak−1 ,ak ] . Satz VII.1.11 impliziert N T − f dE = T − ak Ek ≤ δ, k=1
N wo Ek = E(ak−1 ,ak ] . Also gilt wegen k=1 Ek = Id N (μ − ak )Ek ≤ δ. (μ − T ) − k=1
N Nach Wahl von δ bedeutet das, daß k=1 (μ − ak )Ek invertierbar und die Norm des inversen Operators ≤ C ist. Diese Norm ist jedoch andererseits
330
VII.
Spektralzerlegung selbstadjungierter Operatoren
sup{|μ − ak |−1 : Ek = 0}. Daher gilt Ek = 0, falls |μ − ak | < C1 ; also ist in ur eine Umgebung von μ. der Tat EU = 0 f¨ Sei jetzt K ⊂ ρ(T ) kompakt. Nach dem gerade Bewiesenen existieren zu μ ∈ K Umgebungen Uμmit EUμ = 0. Da K kompakt ist, gibt es endlich n viele μ1 , . . . , μn mit K ⊂ i=1 Uμi ; es folgt EK = 0. Da die positiven Maße A → EA x, x regul¨ ar sind (Satz I.2.14), ist Eρ(T ) x, x = 0 f¨ ur alle x; mit Korollar V.5.8 folgt Eρ(T ) = 0, d.h. Eσ(T ) = Id. Damit haben wir die Bedingungen (a)–(d) aus Satz VII.1.6 verifiziert und erhalten den folgenden Satz. Satz VII.1.12 Ist E ein Spektralmaß auf R mit kompaktem Tr¨ager und T der selbstadjungierte Operator T = λ dEλ , so ist Ψ: B(σ(T )) → L(H), f → f dE σ(T )
der (gem¨aß Satz VII.1.6 eindeutig bestimmte) meßbare Funktionalkalk¨ ul. Insbesondere ist Eσ(T ) = Id. Speziell ergibt sich f¨ ur meßbare A ⊂ σ(T ) χA (T ) = Ψ(χA ) = χA dE = EA , d.h. das gem¨ aß (VII.5) zu T assoziierte Spektralmaß stimmt mit dem T definierenden Spektralmaß u ¨ berein. Ist umgekehrt ein selbstadjungierter Operator T gegeben, E sein assoziiertes Spektralmaß (gem¨ aß (VII.5)) und schließlich S definiert durch λ dEλ , so ist S = T : Zun¨ achst hat E kompakten Tr¨ager wegen χσ(T ) (T ) = Eσ(T ) = Id. W¨ahle eine Treppenfunktion f auf σ(T ) mit f − t ∞ ≤ ε. Dann ist T − S ≤ T − f (T ) + f (T ) − Ψ(f ) + Ψ(f ) − S ≤ 2ε (hier bezeichnet f (T ) den Funktionalkalk¨ ul von T (Satz VII.1.6), Ψ(f ) den von S (Satz VII.1.12)), da nach Satz VII.1.6 T − f (T ) ≤ t − f ∞ ≤ ε sowie nach Satz VII.1.11
(t − f ) dE ≤ t − f ∞ ≤ ε S − Ψ(f ) = σ(T )
gelten; außerdem ist f (T ) − Ψ(f ) = f¨ ur f =
αi χAi (T ) −
αi EAi = 0
αi χAi nach Definition, denn EAi = χAi (T ).
VII.1
331
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
Die bisherige Diskussion faßt der zentrale Satz dieses Abschnitts zusammen. Theorem VII.1.13 (Spektralsatz f¨ ur selbstadjungierte beschr¨ankte Operatoren) Sei T ∈ L(H) selbstadjungiert. Dann existiert ein eindeutig bestimmtes Spektralmaß mit kompaktem Tr¨ager E auf R mit λ dEλ . (VII.8) T = σ(T )
Die Abbildung f → f (T ) = f (λ) dEλ definiert den meßbaren Funktionalkalk¨ ul. f (T ) ist bestimmt durch (vgl. (VII.7)) f (λ) dEλ x, y. f (T )x, y = σ(T )
∞
(VII.8) ist die T = i=1 λi Eλi verallgemeinernde Formel! Sie zeigt, daß T aus den Orthogonalprojektionen EA , A ⊂ σ(T ), zusammengesetzt ist, jedoch i.a. auf kontinuierliche“ Weise, n¨ amlich als Integral und nicht ” als Summe. Noch etwas zur Bezeichnung: Das Symbol dEλ x, y bezeichnet die Integration bzgl. des Borelmaßes A → EA x, y, es ist dasselbe Maß, das in (VII.4) mit μx,y bezeichnet wurde. Sei nun S ∈ L(H) ein weiterer beliebiger Operator. Die Mengenfunktion A → SEA x, y = EA x, S ∗ y ist dann ebenfalls ein Maß. Korollar VII.1.14 Sei T ∈ L(H) selbstadjungiert und E sein Spektralmaß. Ein Operator S ∈ L(H) vertauscht genau dann mit T (d.h. ST −T S = 0), wenn S mit allen EA vertauscht. Beweis. S vertauscht mit T genau dann, wenn S mit allen T n , n ≥ 0, vertauscht, und das heißt ST n x, y = T n Sx, y
∀x, y ∈ H, n ≥ 0.
Dies wiederum ist a ¨quivalent zu λn dSEλ x, y = λn dEλ Sx, y
∀x, y ∈ H, n ≥ 0,
denn es gilt ST n x, y = T n x, S ∗ y =
λn dEλ x, S ∗ y =
λn dSEλ x, y
und analog T n Sx, y = λn dEλ Sx, y. Damit stimmen die beiden Maße dSEλ x, y und dEλ Sx, y, aufgefaßt als Funktionale auf C(σ(T )), auf den
332
VII.
Spektralzerlegung selbstadjungierter Operatoren
Polynomen u ¨ berein und damit auch auf deren Abschluß. Mit Hilfe des Weierstraßschen Approximationssatzes und des Rieszschen Darstellungssatzes schließt man daraus, daß S genau dann mit T vertauscht, wenn SEA x, y = EA Sx, y
∀x, y ∈ H, A ∈ Σ
ur alle Borelmengen A. gilt, d.h. EA S = SEA f¨
2
Beispiele. (a) H sei endlichdimensional, also H = Cn . Besitzt der selbstadjungierte Operator T die m paarweise verschiedenen Eigenwerte μ1 , . . . , μm , so gilt bekanntlich m μi E{μi } , (VII.9) T = i=1
wo E{μi } die Orthogonalprojektion auf den Eigenraum ker(μi − T ) von μi ist. Das Spektralmaß von T ist dann (A ∈ Σ) EA = E{μi } , {i: μi ∈A}
und Theorem VII.1.13 reduziert sich auf die Formel (VII.9). (b) H sei beliebig und T selbstadjungiert und kompakt. Nach dem Spektralsatz f¨ ur kompakte Operatoren ist (Korollar VI.3.3) T =
∞
μi E{μi }
(VII.10)
i=1
(μi in der Bedeutung wie oben); auch das Spektralmaß schreibt sich wie oben als EA = μi ∈A E{μi } , wobei diese Reihe nur punktweise konvergiert, nicht in der Operatornorm. ((VII.10) konvergiert in der Normtopologie.) (c) Sei H = L2 [0, 1], (T x)(t) = t·x(t). T ist selbstadjungiert mit σ(T ) = [0, 1]. T besitzt keine Eigenwerte, d.h. σ(T ) = σc (T ) (vgl. Aufgabe VII.5.8). Die Spektralzerlegung von T sieht so aus: Zu A ∈ Σ setze EA x = χA∩[0,1] x. Es ist leicht zu sehen, daß E ein Spektralmaß mit kompaktem Tr¨ager ist. E stellt T dar: λ dEλ x, y = λx(λ)y(λ) dλ = T x, y, 1 da EA x, y = A∩[0,1] x(λ)y(λ) dλ = 0 χA (λ)x(λ)y(λ) dλ; dEλ x, y hat also bzgl. des Lebesguemaßes die Dichte xy ∈ L1 . Das zeigt T = λ dEλ . (d) T ∈ L(H) sei positiv, dann ist die Wurzelfunktion auf σ(T ) definiert und stetig (vgl. Korollar VII.1.2). Man kann also T 1/2 gem¨aß Satz VII.1.3 (oder VII.1.13, was auf dasselbe hinausl¨ auft) definieren. Nach Satz VII.1.4 ist T 1/2 positiv, und (das war ja der Sinn der Sache) (T 1/2 )2 = T . Sei S ein weiterer positiver Operator mit S 2 = T . Wir werden S = T 1/2 zeigen. Dazu ben¨ otigen wir den folgenden Satz.
VII.1
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
333
Satz VII.1.15 S ∈ L(H) sei selbstadjungiert, g: σ(S) → R und f : R → R seien meßbar und beschr¨ankt. Dann ist (f ◦ g)(S) = f g(S) . Beweis. Zun¨ achst ist f ◦ g meßbar, also (f ◦ g)(S) gem¨aß Theorem VII.1.13 wohldefiniert. Da g reellwertig ist, ist g(S) selbstadjungiert und besitzt ein eindeutig bestimmtes Spektralmaß E. Das Spektralmaß von S sei F . Es reicht nun, die Behauptung f¨ ur Indikatorfunktionen f = χA (A ∈ Σ) zu beweisen, da mit der schon mehrfach verwandten Technik so auf Treppenfunktionen und anschließend auf meßbare f zu schließen ist. Wegen ur A ∈ Σ): χA ◦ g = χg−1 (A) ist zu zeigen (bemerke g −1 (A) ∈ Σ f¨ Fg−1 (A) = EA
∀A ∈ Σ.
¨ Nach der Definition heißt das, daß die Ubereinstimmung der Maße μx,y (A) = EA x, y νx,y (A) = Fg−1 (A) x, y gezeigt werden muß. F¨ ur n ≥ 0 gilt nun λn dνx,y = g(λ)n dFλ x, y, denn νx,y ist das sog. Bildmaß von dFλ x, y unter g; die obige Gleichung ist dann als Transformationssatz f¨ ur Bildmaße in der Maßtheorie bekannt; siehe z.B. Bauer [1990], S. 125, oder Behrends [1987], S. 131. Also gilt λn dνx,y = (g(S))n x, y = λn dEλ x, y = λn dμx,y . Wie im Beweis von Korollar VII.1.14 liefern die S¨atze von Riesz und Weierstraß die Behauptung. 2 2 Um Beispiel 1/2 (d) abzuschließen, verwenden wir g(t) = t und f (t) = tχσ(T ) (t) . Da σ(S) ⊂ [0, ∞) gefordert war, ist f ◦ g = t. Satz VII.1.15 liefert dann S = (f ◦ g)(S) = f g(S) = f (T ) = T 1/2 .
Genauso sieht man: Korollar VII.1.16 Zu positivem T ∈ L(H) und n ∈ N existiert genau ein positives S ∈ L(H) mit S n = T . Wie im kompakten Fall setzt man |T | = (T ∗ T )1/2 , und wie im kompakten Fall erh¨ alt man die Polarzerlegung eines beschr¨ankten Operators:
334
VII.
Spektralzerlegung selbstadjungierter Operatoren
Korollar VII.1.17 Zu T ∈ L(H) existiert eine partielle Isometrie U mit T = U |T |. Beweis. W¨ ortlich wie bei Satz VI.3.5.
2
Als n¨ achstes sollen Spektrum und Resolventenmenge eines selbstadjungierten Operators durch sein Spektralmaß beschrieben werden. Satz VII.1.18 Sei T ∈ L(H) selbstadjungiert und E sein Spektralmaß. (a) Es ist λ ∈ ρ(T ) genau dann, wenn eine offene Umgebung U von λ mit EU = 0 existiert. (b) λ ist ein Eigenwert von T genau dann, wenn E{λ} = 0. In diesem Fall projiziert E{λ} auf den Eigenraum von λ. (c) Isolierte Punkte2 λ von σ(T ) sind Eigenwerte. Beweis. (a) Nach Konstruktion von E ist Eρ(T ) = 0. Zum Beweis der Um1 f¨ ur kehrung sei U eine Umgebung von λ mit EU = 0. Setze f (t) = λ−t t∈ / U , f (t) = 0 sonst. Dann ist f meßbar und auf σ(T ) beschr¨ankt. Dasselbe gilt f¨ ur g(t) = λ − t. Es folgt f (T )(λ − T ) = f (T )g(T ) = (f g)(T ) = χU (T ) = EU = Id, da EU = 0. Genauso zeigt man (λ − T )f (T ) = Id, daher ist λ ∈ ρ(T ). (b) Alles folgt aus ran(E{λ} ) = ker(λ − T ). Zum Beweis hierf¨ ur sei x ∈ ran(E{λ} ), d.h. E{λ} x = x. Dann gilt (λ − T )x, y = (λ − T )E{λ} x, y = (λ − t)χ{λ} (t) dEt x, y = 0 f¨ ur alle y ∈ H, da (λ − t)χ{λ} (t) = 0. Es folgt x ∈ ker(λ − T ). Ist umgekehrt T x = λx, so ist f¨ ur stetige f nach Satz VII.1.4(c) f (T )x = f (λ)x. Mit Lemma VII.1.5(b) folgt, daß diese Gleichung auch f¨ ur beschr¨ankte meßbare alt man E{λ} x = x. f gilt. Setzt man speziell f = χ{λ} , so erh¨ (c) W¨ ahle eine offene Menge U mit U ∩ σ(T ) = {λ}. Da U \ {λ} ⊂ ρ(T ) are auch E{λ} = 0, so folgte EU = 0 und gilt, muß EU\{λ} = 0 sein. W¨ deshalb nach (a) λ ∈ ρ(T ). 2 Korollar VII.1.19 Ist T ∈ L(H) selbstadjungiert und E sein Spektralmaß, so ist σ(T ) die kleinste kompakte Menge mit Eσ(T ) = Id. Beweis. Ist K kompakt, λ ∈ / K und EK = Id, also ER\K = 0, so impliziert Satz VII.1.18(a) λ ∈ ρ(T ). Also gilt σ(T ) ⊂ K. 2 Als n¨ achstes soll eine Form des Spektralsatzes besprochen werden, die zeigt, daß Beispiel (c) den typischen selbstadjungierten Operator beschreibt. 2 D.h.: Es existiert eine offene Umgebung U von λ mit U ∩σ(T ) = {λ}. (Anders gesagt: {λ} ist offen bzgl. der Relativtopologie von σ(T ).)
VII.1
335
Der Spektralsatz f¨ ur beschr¨ ankte Operatoren
Sei zun¨ achst T selbstadjungiert und x ∈ H ein zyklischer Vektor von T , d.h. H = lin{x, T x, T 2 x, . . .}. Sei μ das endliche positive Maß dEλ x, x auf R (oder σ(T )); dabei ist E nat¨ urlich das Spektralmaß von T . Dann gilt folgender Satz. Satz VII.1.20 Sei x ∈ H ein zyklischer Vektor des selbstadjungierten Operators T ∈ L(H). Dann existiert ein unit¨arer Operator U : H → L2 (μ) (μ wie oben) mit (U T U −1 ϕ)(t) = t · ϕ(t) Beweis. Sei ϕ ∈ C(σ(T )). Dann gilt |ϕ(t)|2 dμ(t) = σ(T )
μ-fast ¨ uberall.
ϕ(t)ϕ(t) dEt x, x
σ(T )
= ϕ(T )∗ ϕ(T )x, x = ϕ(T )x 2 . Die lineare Abbildung V˜ : C(σ(T )) → H, ϕ → ϕ(T )x, ist also isometrisch bzgl. der Norm von L2 (μ). Sie gestattet daher (denn C liegt dicht in L2 ; vgl. Satz I.2.12) eine Fortsetzung V : L2 (μ) → H; diese ist linear und isometrisch, und sie hat dichtes Bild, denn V (L2 (μ)) umfaßt die T n x, n ≥ 0. V ist also surjektiv und deshalb unit¨ ar. Wegen T (V (ϕ)) = T (ϕ(T )x) = (T ◦ ϕ(T ))x = V (t · ϕ) ist
(V −1 T V )(ϕ) = t · ϕ
∀ϕ ∈ C(σ(T ))
∀ϕ ∈ C(σ(T ));
Aus Dichtheitsgr¨ unden u agt sich diese Aussage auf alle ϕ ∈ L2 (μ). Die ¨ bertr¨ Behauptung folgt nun mit U = V −1 = V ∗ . 2 Leider besitzt nicht jeder selbstadjungierte Operator zyklische Vektoren (betrachte z.B. T = Id), allgemein gilt jedoch: Satz VII.1.21 (Multiplikationsoperatorversion des Spektralsatzes) Jeder selbstadjungierte Operator ist unit¨ar ¨aquivalent zu einem Multiplikationsoperator. Genauer gilt: Es existieren ein (im Fall separabler Hilbertr¨aume σ-endlicher) Maßraum (Ω, Σ, μ), eine beschr¨ankte meßbare Funktion f : Ω → R und ein unit¨arer Operator U : H → L2 (μ) mit (U T U −1 )ϕ = f · ϕ
μ-fast ¨ uberall.
Zum Beweis nehmen wir zus¨ atzlich an, daß H separabel ist, um einige notationstechnische Komplikationen zu vermeiden. Die ! Bezeichnung H = H bedeutet, daß jedes x ∈ H eindeutig als x = 2 i i 1 beliebig war, ergibt sich unsere Behauptung. Insbesondere ist h ∈ L∞ (μ), und λ liegt nicht im wesentlichen Wertebereich. Satz VII.2.16 F¨ ur selbstadjungiertes T ist σ(T ) ⊂ R.
354
VII.
Spektralzerlegung selbstadjungierter Operatoren
Beweis. Sei z = λ + iμ ∈ C \ R, also μ = 0. Sei S = Tμ − μλ auf dom(S) = dom(T ); dann ist S selbstadjungiert. Wegen (VII.12) gilt (z − T )x 2 = μ2 Sx − ix 2 ≥ μ2 x 2 , also existiert (z − T )−1 : ran(z − T ) = ran(i − S) → dom(T ) und ist stetig. Nach Satz VII.2.8 schließlich ist ran(z − T ) = H. 2 Zur Umkehrung dieses Satzes siehe Aufgabe VII.5.20.
VII.3
Der Spektralsatz fu ankte Operatoren ¨r unbeschr¨
Wir beginnen mit dem Analogon zu Satz VII.1.21. Satz VII.3.1 (Spektralsatz, Multiplikationsoperatorversion) Sei T : H ⊃ dom(T ) → H selbstadjungiert. Dann existieren ein (im separablen Fall σ-endlicher) Maßraum (Ω, Σ, μ), eine meßbare Funktion f : Ω → R sowie ein unit¨arer Operator U : H → L2 (μ) mit (a) x ∈ dom(T ) ⇔ f · U x ∈ L2 (μ). (b) U T U ∗ ϕ = f · ϕ =: Mf (ϕ) f¨ ur ϕ ∈ dom(Mf ) = {ϕ ∈ L2 : f ϕ ∈ L2 }. Wir wissen bereits aus Beispiel VII.2(b), daß der Operator Mf selbstadjungiert ist; umgekehrt besagt Satz VII.3.1, daß Mf im wesentlichen das einzige Beispiel f¨ ur einen selbstadjungierten Operator ist. Beweis. Da T selbstadjungiert ist, ist σ(T ) ⊂ R (Satz VII.2.16), also existiert R := (T + i)−1 ∈ L(H). Wir zeigen zuerst, daß R normal ist. Seien z1 , z2 ∈ H. Nach Satz VII.2.8 existieren x, y ∈ dom(T ) mit z1 = (T + i)x, z2 = (T − i)y. Dann ist Rz1 , z2 = x, (T − i)y = (T + i)x, y = z1 , (T − i)−1 z2 , also R∗ = [(T + i)−1 ]∗ = (T − i)−1 , und Satz VII.2.15(b) impliziert RR∗ = R∗ R. Nach Satz VII.1.25 ist URU ∗ = Mg f¨ ur eine beschr¨ ankte meßbare Funktion g: Ω → C und einen unit¨aren Operator U : H → L2 (μ). ¨ Um daraus eine Darstellung f¨ ur T zu gewinnen, werden wir die Uberlegung 1 =γ τ +i
⇔ τ=
zu u ¨ bertragen versuchen.
1 −i γ
∀τ, γ ∈ C, τ = −i, γ = 0
VII.3
Der Spektralsatz f¨ ur unbeschr¨ ankte Operatoren
355
1 Wir betrachten f (ω) = g(ω) − i. Da R injektiv ist, ist Mg injektiv, daher {ω: g(ω) = 0} eine Nullmenge, und f ist fast u ¨berall definiert. Als n¨ achstes zeigen wir Teil (a). Sei x ∈ dom(T ). Da R den Hilbertraum H auf dom(T ) abbildet, kann man x = Ry f¨ ur ein y ∈ H schreiben, also
U x = U Ry = g · U y und f · U x = f · g · U y ∈ L2 (μ), da f · g beschr¨ ankt ist. Ist umgekehrt f · U x ∈ L2 (μ), so existiert y ∈ H mit U y = (f + i)U x, also gilt g · U y = U x und x = (U ∗ Mg U )y = (T + i)−1 y ∈ dom(T ). Um (b) zu zeigen, bemerke dom(Mf ) = U (dom(T )) sowie (x = Ry wie oben, daher T x = y − ix) 1 − i U x = f · U x; U T x = U y − iU x = g das zeigt Teil (b). Mit T muß dann auch Mf symmetrisch sein, was schließlich beweist, daß f fast u 2 ¨ berall reellwertig ist. d auf dem Schwartzraum dom(T ) = S (R) Beispiel. Betrachte T = −i dt d auf (Definition V.2.3). T ist wesentlich selbstadjungiert, und T ∗ = −i dt ∗ 2 dom(T ) = {x ∈ L (R): x|I ∈ AC(I) f¨ ur alle kompakten Teilintervalle I ⊂ R und dx/dt ∈ L2 (R)} (vgl. Aufgabe VII.5.22). Die Fouriertransformation F erf¨ ullt
(F T F −1 ϕ)(t) = tϕ(t)
(VII.15)
f¨ ur ϕ ∈ S (R) nach Lemma V.2.4. Via F ist T also unit¨ar ¨aquivalent zu dem Multiplikationsoperator Mt auf S (R) ⊂ L2 (R), denn F (dom(T )) = S (R). Man kann zeigen, daß (VII.15) auch f¨ ur den selbstadjungierten Operator T ∗ und ϕ ∈ L2 (R) mit t · ϕ ∈ L2 (R) gilt. Abschließend soll die Spektraldarstellung eines unbeschr¨ankten selbstadjungierten Operators skizziert werden. Wir beginnen mit dem selbstadjungierten Operator Mf , dom(Mf ) = {ϕ ∈ L2 (μ): f ϕ ∈ L2 (μ)}. Ist h: R → C beschr¨ ankt und meßbar, so ist h(Mf ) := Mh◦f ∈ L(L2 (μ)) normal. Die Abbildung h → h(Mf ) ist stetig und multiplikativ. Ist A ⊂ R eine Borelmenge, so existiert insbesondere FA = χA (Mf ) = MχA ◦f = Mχf −1 (A) . A → FA ist ein Spektralmaß, hat aber i.a. keinen kompakten Tr¨ager. Fer ner gilt h(Mf ) = R h(λ) dFλ . Des weiteren ist F durch die letzte Gleichung eindeutig festgelegt. Sei T : H ⊃ dom(T ) → H selbstadjungiert und
356
VII.
Spektralzerlegung selbstadjungierter Operatoren
U T U ∗ = Mf gem¨ aß Satz VII.3.1 dargestellt. Setze EA = U ∗ FA U , dann ist E ein Spektralmaß auf R (i.a. ohne kompakten Tr¨ager), und f¨ ur beschr¨ankte meßbare h gilt h(λ) dEλ = U ∗ h(Mf )U. (VII.16) h(T ) := R
Die Abbildung h → h(T ) hat die u ¨ blichen Eigenschaften eines Funktionalkalk¨ uls. All das l¨ aßt sich genauso zeigen wie im beschr¨ankten Fall. Sei nun h: R → R meßbar, aber nicht notwendig beschr¨ankt. Setze Dh = {x ∈ H: |h(λ)|2 dEλ x, x < ∞}. (dEλ x, x ist ein positives Maß!) Dann ist Dh ein dichter Unterraum von H. Um diese und die folgenden Aussagen zu beweisen, ist es notwendig, sie vom abstrakten“ Hilbertraum ” H mittels des unit¨ aren Operators U in den konkreten“ Hilbertraum L2 (μ) ” zu u ¨ bersetzen. Betrachten wir dazu noch einmal den Zusammenhang der Spektralmaße E und F . Schreibt man U x = ϕ und U y = ψ, so ist EA x, y = FA ϕ, ψ = ϕψ dμ. f −1 (A)
Setzt man ν(B) = B ϕψ dμ, so gilt also EA x, y = ν f −1 (A) ; die auf S. 333 zitierte Transformationsformel f¨ ur Bildmaße liefert daher f¨ ur integrierbare Funktionen g: R → R g(λ) dEλ x, y = g ◦ f dν = (g ◦ f )ϕψ dμ. (VII.17) R
Ω
Ω
Nun zur¨ uck zu Dh . Offenbar ist wegen (VII.17) x ∈ Dh genau dann, wenn ϕ = U x |h ◦ f |2 |ϕ|2 dμ < ∞ Ω
erf¨ ullt, und in Beispiel VII.2(b) wurde gezeigt, daß solche ϕ einen dichten Unterraum von L2 (μ) bilden. Also ist auch Dh ein dichter Unterraum von H. Des weiteren existiert f¨ ur x ∈ Dh , y ∈ H das Integral h(λ) dEλ x, y, R
genauer gilt 1/2 2 h(λ) dEλ x, y ≤ |h(λ)| dEλ x, x y . R
R
In der Tat impliziert (VII.17), genauer ein Analogon f¨ ur die Variation, |h(λ)| d|Eλ x, y| = |(h ◦ f )ϕψ| dμ R
Ω
VII.4
357
Operatorhalbgruppen
≤ Ω
=
R
1/2 |h ◦ f |2 |ϕ|2 dμ ψ 1/2 |h(λ)|2 dEλ x, x y < ∞;
es gilt ja x ∈ Dh ⇔ (h ◦ f )ϕ ∈ L2 (μ). Daher existiert ein Element, das wir h(T )x ∈ H nennen wollen, mit h(T )x, y = h(λ) dEλ x, y ∀x ∈ Dh , y ∈ H. (VII.18) R
Der so definierte Operator h(T ): Dh → H wird mit h(T ) = h(λ) dEλ bezeichnet. Im Gegensatz zum Fall beschr¨ ankter h existiert dieses Integral nicht im Sinn der Operatornormkonvergenz wie in Satz VII.1.11, sondern nur im Sinn von (VII.18). Setzt man speziell h = t, so ergibt sich λ dEλ x, y = f ϕψ dμ = Mf ϕ, ψ = U ∗ Mf U x, y = T x, y R
Ω
f¨ ur x ∈ dom(T ), d.h. (Satz VII.3.1) f · U x ∈ L2 (μ), d.h. x ∈ Dt nach (VII.17). Es ist also Dt = dom(T ) und T = λ dEλ . Genauso zeigt man U ∗ Mh◦f U x, y = h(T )x, y
∀x ∈ Dh , y ∈ H.
Wir fassen zusammen. Theorem VII.3.2 (Spektralzerlegung selbstadjungierter Operatoren) Sei T : H ⊃ dom(T ) → H selbstadjungiert. Dann existiert ein eindeutig bestimmtes Spektralmaß E mit T x, y = λ dEλ x, y ∀x ∈ dom(T ), y ∈ H. R
Ist h: R → R meßbar und Dh = {x ∈ H: |h(λ)|2 dEλ x, x < ∞}, so definiert h(λ) dEλ x, y h(T )x, y = R
einen selbstadjungierten Operator h(T ): H ⊃ Dh → H.
VII.4
Operatorhalbgruppen
F¨ ur eine (n × n)-Matrix A wird die L¨ osung des Anfangswertproblems f¨ ur eine gew¨ ohnliche Differentialgleichung u = Au,
u(0) = x0
(VII.19)
358
VII.
Spektralzerlegung selbstadjungierter Operatoren
bekanntlich durch die Cn -wertige Funktion u(t) = etA x0 gegeben. Auch partielle Differentialgleichungen k¨ onnen h¨ aufig in der Form (VII.19) geschrieben werden; dann ist A jedoch ein (unbeschr¨ankter) Operator in einem Banach- oder Hilbertraum. In diesem Abschnitt soll die Frage untersucht werden, f¨ ur welche Operatoren A das Exponential etA definiert werden kann. F¨ ur selbstadjungierte Operatoren A: H ⊃ dom(A) → H mit nach oben beschr¨ anktem Spektrum und t ≥ 0 ist das nach dem Spektralsatz VII.3.2 der Fall, da dann a → eta eine stetige beschr¨ankte Funktion auf dem Spektrum σ(A) ist. Die etA , t ≥ 0, sind beschr¨ankte Operatoren mit esA etA = e(s+t)A , s, t ≥ 0; sie bilden also eine Halbgruppe von Operatoren. Daß man im unendlichdimensionalen Fall nur positive t betrachtet, liegt in der Natur der Sache; z.B. ist das Anfangswertproblem der W¨ armeleitungsgleichung u = Δu f¨ ur negative Zeiten i.a. nicht l¨ osbar. Halbgruppen von Operatoren auf Banachr¨aumen bilden den Gegenstand dieses Abschnitts, in dem X stets einen komplexen Banachraum bezeichnet. Definition VII.4.1 Eine stark stetige Operatorhalbgruppe (oder C0 -Halbgruppe) ist eine Familie Tt : X → X, t ≥ 0, von stetigen linearen Operatoren auf einem Banachraum X mit folgenden Eigenschaften: (1) T0 = Id, ur alle s, t ≥ 0, (2) Ts+t = Ts Tt f¨ ur alle x ∈ X. (3) lim Tt x = x f¨ t→0
Gilt statt (3) die st¨ arkere Forderung (3 ) lim Tt − Id = 0, t→0
so spricht man von einer normstetigen Halbgruppe. In Abschnitt VIII.1 werden wir die starke Operatortopologie auf L(X) einf¨ uhren; die Bedingung (3) bedeutet dann die Stetigkeit von t → Tt in dieser Topologie bei t = 0. Analog besagt (3 ) die Stetigkeit von t → Tt bei t = 0 in der Operatornormtopologie. Beachte noch, daß wegen (2) die Operatoren einer Halbgruppe notwendig kommutieren. Beispiele. (a) Sei A ∈ L(X) und Tt = etA :=
∞ n n t A . n! n=0
Die Reihe konvergiert absolut in L(X); daher definiert sie einen stetigen linearen Operator. (Tt )t≥0 ist eine normstetige Halbgruppe: (1) ist trivial,
VII.4
359
Operatorhalbgruppen
(2) zeigt man wie in der Analysisvorlesung die Funktionalgleichung ex+y = ur (3 ) beachte nur ex ey der Exponentialfunktion, und f¨ ∞ ∞ tn An A n n ≤ t = et A − 1 → 0 Tt − Id = n! n! n=1 n=1 mit t → 0. In diesem Beispiel erhalten wir sogar eine Gruppe, wenn wir t ∈ R zulassen. (b) Wir betrachten die Translationshalbgruppe (Tt f )(x) = f (x + t) auf Lp (R), Lp [0, ∞), C0 (R) oder C0 [0, ∞). Es ist klar, daß jeweils (1) und (2) erf¨ ullt sind. (3) sieht man auf C0 (R) so: Ist f ∈ C0 (R), so ist f gleichm¨ aßig stetig (Beweis?). Zu ε > 0 existiert dann ein δ > 0 mit |x − y| ≤ δ
⇒
|f (x) − f (y)| ≤ ε.
Daher gilt f¨ ur 0 < t ≤ δ Tt f − f ∞ = sup |f (x + t) − f (x)| ≤ ε. x∈R
ur 1 ≤ p < ∞ zeigt man zuerst Tt f → f auf dem dichten Im L -Fall f¨ Unterraum aller stetigen Funktionen mit kompaktem Tr¨ager und schließt daraus mittels supt Tt < ∞, daß (3) gilt; vgl. Aufgabe II.5.5. F¨ ur p = ∞ gilt (3) nicht, wie man am Beispiel f = 1[0,1] sieht. Ist die Grundmenge [0, ∞), sind die Beweise identisch; im Fall von R erh¨ alt man aber sogar eine Gruppe von Operatoren, wenn man auch negative t zul¨ aßt. (c) Die W¨armeleitungshalbgruppe ist durch T0 = Id bzw. |x − y|2 1 (Tt f )(x) = f (y) dy (VII.20) exp − 4t (4πt)d/2 Rd p
auf diversen Funktionenr¨ aumen auf Rd erkl¨ art. Wir behandeln den Fall p d L (R ), 1 ≤ p < ∞. Setzt man γt (x) =
|x|2 1 , exp − d/2 4t (4πt)
x ∈ Rd , t > 0,
so kann (VII.20) mittels der Faltung als Tt f = γt ∗ f geschrieben werden. Die Youngsche Ungleichung (Satz II.4.4, sie gilt f¨ ur Rd wie f¨ ur T) zeigt Tt f p ≤ γt 1 f p = f p ;
360
VII.
Spektralzerlegung selbstadjungierter Operatoren
daher sind alle Tt stetige lineare Operatoren mit Norm ≤ 1 auf Lp (Rd ). Die Eigenschaft (1) einer C0 -Halbgruppe gilt definitionsgem¨aß, und Eigenschaft (3) zeigt man mit einer ¨ ahnlichen Technik wie in Aufgabe II.5.6. Es bleibt, (2) nachzurechnen, das wegen der Assoziativit¨at der Faltung auf γs+t = γs ∗ γt
∀s, t > 0
hinausl¨ auft. Diese Gleichung kann elementar verifiziert werden, wenn man nur π d/2 b2 exp(−a2 y 2 + 2by − c2 ) dy = d exp −c2 + 2 , a, c ∈ R, b ∈ Rd , a a Rd ber¨ ucksichtigt; alternativ kann man mittels Fouriertransformation und Aufgabe VII.5.10 argumentieren. (VII.20) definiert auch auf dem Raum C0 (Rd ) eine C0 -Halbgruppe (Aufgabe VII.5.26). Sie wird wegen des Zusammenhangs zur Brownschen Bewegung auch Brownsche Halbgruppe genannt. Der Name W¨armeleitungshalbgruppe reflektiert den engen Zusammenhang dieses Beispiels zur W¨armeleitungsgleichung, vgl. Satz VII.4.7. (d) Auch in der Theorie der Delay-Gleichungen (Differentialgleichungen mit nacheilendem Argument) treten Operatorhalbgruppen auf. Bei einer gew¨ ohnlichen Differentialgleichung erster Ordnung h¨angt u (t) nur von u(t) ab, bei einer Delay-Gleichung jedoch von den u(s) in einem Intervall t−σ ≤ s ≤ t. Diese u(s) bilden die Vorgeschichte von u(t). Wir betrachten ein lineares autonomes Delay-Anfangswertproblem der Form u (t) = (u(t) ),
u(0) = ϕ ∈ C[−σ, 0];
(VII.21)
dabei bezeichnet u(t) (s) = u(s + t), −σ ≤ s ≤ 0, und ein stetiges lineares Funktional auf dem Banachraum C[−σ, 0]. Ein einfaches Beispiel erh¨alt man mit = δ−σ , dann lautet die Gleichung u (t) = u(t − σ). Aus der Theorie der Delay-Gleichungen ist bekannt, daß (VII.21) genau eine L¨ osung besitzt3 ; diese wollen wir in der Form u(t) = Tt ϕ mit einem L¨ osungsoperator Tt schreiben. Die Tt sind dann lineare Abbildungen auf C[−σ, 0], und aus der Eindeutigkeit der L¨ osung f¨ ur jeden Anfangswert folgt die Halbgruppeneigenschaft Ts+t = Ts Tt . Nach Konstruktion gilt T0 = Id sowie f¨ ur t > 0 und −σ ≤ s ≤ 0 ϕ(s + t) falls s + t ≤ 0, s+t (Tt ϕ)(s) = (VII.22) ϕ(0) + 0 (Tϑ ϕ) dϑ falls s + t > 0. Daraus folgt die Absch¨ atzung
Tt ϕ ∞ ≤ ϕ ∞ +
t
Tϑ ϕ ∞ dϑ 0
3 Vgl. J. Hale, S. M. Verduyn Lunel, Introduction to Functional Differential Equations, Springer-Verlag 1993, Theorem 6.1.1.
VII.4
361
Operatorhalbgruppen
(beachte s + t ≤ t) und weiter nach der Gronwallschen Ungleichung (siehe z.B. Walter [1993], S. 257) Tt ϕ ∞ ≤ e
t ϕ ∞
∀ϕ ∈ C[−σ, 0].
Das liefert die Stetigkeit der Tt auf C[−σ, 0] und mit (VII.22) auch noch limt→0 Tt ϕ − ϕ ∞ = 0. Damit ist gezeigt, daß die Tt , t ≥ 0, eine stark stetige Operatorhalbgruppe auf C[−σ, 0] bilden. Wir wollen nun zwei einfache Eigenschaften einer C0 -Halbgruppe kennenlernen. Lemma VII.4.2 Ist (Tt )t≥0 eine C0 -Halbgruppe auf einem Banachraum X, so existieren M ≥ 1, ω ∈ R mit Tt ≤ M eωt
∀t ≥ 0.
(VII.23)
Beweis. Wir zeigen zuerst, daß ein τ > 0 mit K := sup Tt < ∞
(VII.24)
0≤t≤τ
existiert. W¨ are das falsch, g¨ abe es eine Nullfolge (tn ) mit Ttn → ∞. Nach dem Satz von Banach-Steinhaus existierte dann ein x ∈ X mit Ttn x → ∞ im Widerspruch zur Eigenschaft (3) einer C0 -Halbgruppe. Seien nun K und τ wie in (VII.24). Schreibe eine Zahl t ≥ 0 als t = nτ +ϑ mit n ∈ N0 und 0 ≤ ϑ < τ ; dann gilt Tt = Tτn Tϑ ≤ Tτ n Tϑ ≤ K n+1 ≤ K(K 1/τ )t , letzteres wegen n ≤ t/τ , K ≥ T0 = 1. Also ist (VII.23) mit M = K und ω = (log K)/τ erf¨ ullt. 2 Das Infimum u assigen ω, genauer ¨ ber die in (VII.23) zul¨ ω0 := inf{ω: ∃M = M (ω) mit (VII.23)},
(VII.25)
heißt der Typ oder die (exponentielle) Wachstumsschranke der Halbgruppe. Das Infimum braucht u ¨ brigens nicht angenommen zu werden und kann −∞ sein (Aufgaben VII.5.28 und VII.5.29). Wenn man in (VII.23) M = 1 und ω = 0 w¨ahlen kann, mit anderen ur alle t ≥ 0 gilt, heißt die C0 -Halbgruppe (Tt ) eine Worten wenn Tt ≤ 1 f¨ Kontraktionshalbgruppe. Lemma VII.4.3 Ist (Tt ) eine C0 -Halbgruppe auf einem Banachraum X, so ist die Abbildung [0, ∞) × X → X,
(t, x) → Tt x
362
VII.
Spektralzerlegung selbstadjungierter Operatoren
stetig, und zwar gleichm¨aßig in t auf kompakten Teilmengen von [0, ∞). Insbesondere ist f¨ ur jedes x ∈ X die vektorwertige Funktion u: t → Tt x stetig; in Zeichen u ∈ C([0, ∞), X). Beweis. Seien x ∈ X und t0 > 0. Zu δ > 0 w¨ahle h0 > 0 mit Th x − x ≤ δ
∀0 ≤ h ≤ h0 .
F¨ ur den Beweis des Satzes reicht es, f¨ ur eine gewisse Konstante C die Absch¨ atzung x − y ≤ δ, 0 ≤ s ≤ t ≤ t0 , t − s ≤ h0
⇒
Tt x − Ts y ≤ Cδ
zu beweisen. Seien dazu M und ω wie in (VII.23); es folgt Tt x − Ts y ≤ Tt x − Ts x + Ts x − Ts y ≤ Ts Tt−s x − x + Ts x − y ≤ M eωs δ + M eωs δ. Man setze also C = 2M , falls ω ≤ 0, und C = 2M eωt0 , falls ω > 0.
2
Wir wollen einer C0 -Halbgruppe einen (in der Regel unbeschr¨ankten) Operator, ihren Erzeuger, zuordnen. Eine Hauptaufgabe der Halbgruppentheorie ist, den Zusammenhang dieser beiden Objekte zu studieren. F¨ ur eine Halbgruppe (etA )t≥0 wie in Beispiel (a) w¨ urde man A als Er” zeuger“ der Halbgruppe ansehen. Um nun A aus der Exponentialfunktion uckzuerhalten, muß man diese differenzieren. Diese Idee steht bei etA zur¨ der folgenden Definition Pate. Definition VII.4.4 Sei (Tt )t≥0 eine C0 -Halbgruppe auf einem Banachraum X. Der infinitesimale Erzeuger (kurz Erzeuger ) von (Tt ) ist der Operator Th x − x Ax = lim h→0 h auf dem Definitionsbereich Th x − x existiert . dom(A) = x ∈ X: lim h→0 h Mit Hilfe der vektorwertigen Funktionen u(x) : t → Tt x l¨aßt sich dom(A) als {x: u(x) (0) existiert} und Ax als (rechtsseitige) Ableitung u(x) (0) deuten. Wir berechnen die Erzeuger der Halbgruppen aus den obigen Beispielen. Dabei stellt sich heraus, daß A wirklich in der Regel ein unbeschr¨ankter Operator ist; siehe dazu auch Satz VII.4.9.
VII.4
Operatorhalbgruppen
363
Beispiele. (a) Der Erzeuger der Halbgruppe (etA ) ist A selbst; es gilt ja hA ∞ n−1 n ∞ e − Id h A hn−1 A n = ≤ − A ≤ h A 2 eh A → 0. h n! n! n=2 n=2 Ferner ist hier der Definitionsbereich des Erzeugers ganz X. (b) Bei der Translationshalbgruppe gilt punktweise lim
h→0+
Th f (x) − f (x) f (x + h) − f (x) d+ f = lim = (x); h h dx h→0+
d+ /dx bezeichnet die rechtsseitige Ableitung. Daher ist zu vermuten, daß der Erzeuger A der Ableitungsoperator f → f ist. Wir best¨atigen das in dem Fall, daß die Tt auf C0 (R) (oder C0 [0, ∞)) erkl¨art sind: dom(A) = {f ∈ C0 (R): f existiert und f ∈ C0 (R)}, Af = f . Sei als erstes f ∈ C0 (R) differenzierbar mit f ∈ C0 (R). Dann ist f gleichm¨ aßig stetig, woraus mit h → 0+ x+h 1 f (x + h) − f (x) − f (x) = f (y) dy − f (x) h h x 1 x+h ≤ |f (y) − f (x)| dy → 0 h x gleichm¨ aßig in x folgt. Das heißt f ∈ dom(A) und Af = f . Ist umgekehrt f ∈ dom(A), so zeigt das punktweise Argument, daß f rechtsseitig differenzierbar ist; und da Af definitionsgem¨aß in C0 (R) liegt, ist die rechtsseitige Ableitung stetig. Daraus folgt aber die Differenzierbarkeit von f schlechthin4 . In der Lp -Theorie ist der Definitionsbereich des Erzeugers schwieriger zu beschreiben. Es sei an den Begriff der absolutstetigen Funktion erinnert (Definition A.1.9) und daran, daß eine solche Funktion fast u ¨ berall differenzierbar ist (Satz A.1.10). Dann kann man f¨ ur den Erzeuger der Translationshalbgruppe auf Lp (R), 1 ≤ p < ∞, zeigen: dom(A) = {f ∈ Lp (R): f ist absolutstetig und f ∈ Lp (R)}, Af = f . (c) Der Erzeuger der W¨ armeleitungshalbgruppe ist der Laplaceoperator. Wir betrachten im Detail den Fall p = 2; hier sieht man das am schnellsten mittels der Fouriertransformation ein. Zun¨ achst ist festzustellen, daß alle 4 Siehe
W. Walter, Analysis I, Springer-Verlag 1985, Satz 12.25.
364
VII.
Spektralzerlegung selbstadjungierter Operatoren
γt ∈ S (Rd ) sind. Da die Faltung zweier Schwartzfunktionen wieder eine ur alle Schwartzfunktion ist (Aufgabe VII.5.10), gilt Tt S (Rd ) ⊂ S (Rd ) f¨ t > 0. Als erstes wird nun lim
h→0
γh ∗ f − f = Δf h
∀f ∈ S (Rd )
(VII.26)
(mit Konvergenz in L2 (Rd )) behauptet. Da die Fouriertransformation ein Isomorphismus auf L2 (Rd ) ist, der den Schwartzraum invariant l¨aßt (Satz V.2.8), ist (VII.26) wegen Aufgabe VII.5.10 ¨aquivalent zu √ d 2π F γh · F f − F f = F (Δf ) lim h→0 h
∀f ∈ S (Rd ).
Weiter gelten nach Lemma V.2.6 und Lemma V.2.4 F γt (ξ) =
2 1 e−tξ , d/2 (2π)
F (Δf )(ξ) = −ξ 2 F f (ξ),
und da die Fouriertransformation ein Isomorphismus auf S (Rd ) ist, ist (VII.26) schließlich zu ehq g − g = qg h→0 h lim
∀g ∈ S (Rd )
(VII.27)
aquivalent, wo q(ξ) = −ξ 2 gesetzt und wieder die Konvergenz in L2 (Rd ) ¨ gemeint ist. Um (VII.27) einzusehen, betrachte die Hilfsfunktion Φ(z) =
∞ z n−1 ez − 1 −1= ; z n! n=2
damit gilt hq 2 e g − g 2 − qg = (Φ ◦ (hq)) · qg 2 = |Φ(−hξ 2 )||ξ 2 g(ξ)|2 dξ → 0 h Rd 2 mit h → 0 nach dem Lebesgueschen Konvergenzsatz, denn der Integrand strebt punktweise gegen 0 und wird von der integrierbaren Funktion |qg|2 majorisiert (beachte −1 ≤ Φ(z) ≤ 0 f¨ ur z ≤ 0). Mehr noch: das Argument ur die q · F f in L2 liegt, und das zeigt, daß (VII.26) f¨ ur alle f ∈ L2 gilt, f¨ ist genau f¨ ur die f aus dem Sobolevraum W 2 (Rd ) der Fall (Satz V.2.14); hier ist der Laplaceoperator nat¨ urlich im Sinn der schwachen Ableitungen zu verstehen. Damit ist f¨ ur p = 2 dom(A) = W 2 (Rd ),
Af = Δf
gezeigt. Im Fall p = 2 kann man den Definitionsbereich von Δ als {f ∈ Lp : Δf ∈ Lp } beschreiben; hier werden Ableitungen im Distributionensinn
VII.4
365
Operatorhalbgruppen
aufgefaßt, siehe Abschnitt VIII.5. F¨ ur 1 < p < ∞ stimmt dom(Δ) mit dem auf Seite 252 angesprochenen Sobolevraum W 2,p (Rd ) u ¨ berein, aber nicht f¨ ur p = 1. (d) In diesem Beispiel ist der Erzeuger der Ableitungsoperator Aϕ = ϕ auf dem Definitionsbereich dom(A) = {ϕ ∈ C 1 [−σ, 0): ϕ (0) = (ϕ)}. Ist n¨ amlich zun¨ achst ϕ ∈ dom(A), so folgt aus (VII.22) ⎧ + d ϕ Th ϕ(s) − ϕ(s) ⎨ (s) −σ ≤ s < 0, (Aϕ)(s) = lim = dt ⎩ h→0 h (ϕ) s = 0.
(VII.28)
Da Aϕ stetig ist, muß ϕ (beidseitig) stetig differenzierbar sein (vgl. das Argument in Beispiel (b)); also ist ϕ ∈ C 1 [−σ, 0), ϕ(0) = (ϕ) und Aϕ = ϕ . Daß umgekehrt ein solches ϕ zu dom(A) geh¨ort, ergibt sich aus der gleichm¨ aßigen Konvergenz bzgl. s in (VII.22). Als n¨ achstes werden einige Eigenschaften des infinitesimalen Erzeugers A einer C0 -Halbgruppe studiert. Aus der Definition von dom(A) ergibt sich nicht unmittelbar, daß dom(A) mehr als die 0 enth¨alt. Unser erstes Ziel ist zu zeigen, daß A stets dicht definiert und abgeschlossen ist. Dazu wird das Riemannintegral f¨ ur banachraumwertige stetige Funktionen ben¨otigt. Dieses kann wie im skalaren Fall als Grenzwert von Riemannschen Summen erkl¨ art werden; es gelten dann s¨ amtliche vertrauten Rechenregeln (Lineab c c rit¨ at, a + b = a etc.) inklusive des Hauptsatzes 1 t+h lim u(s) ds = u(t) (VII.29) h→0 h t f¨ ur stetige Funktionen mit Werten in einem Banachraum. Die Beweise dieser Aussagen erfolgen wie im skalaren Fall. Ferner gilt f¨ ur stetige lineare Operatoren T b b u(s) ds = T (u(s)) ds. (VII.30) T a
a
Zuerst nun ein wichtiges Lemma. Lemma VII.4.5 Sei A der Erzeuger der C0 -Halbgruppe (Tt ) auf dem Banachraum X, und sei t > 0. t t Ts x ds ∈ dom(A) f¨ ur alle x ∈ X, und A Ts x ds = Tt x − x. (a) 0
(b) Tt (dom(A)) ⊂ dom(A). ur alle x ∈ dom(A). (c) Tt Ax = ATt x f¨ t (d) Tt x − x = Ts Ax ds f¨ ur alle x ∈ dom(A). 0
0
366
VII.
Spektralzerlegung selbstadjungierter Operatoren
Beweis. Beachte, daß die Funktionen t → Tt x nach Lemma VII.4.3 stetig sind. (a) Es gilt nach (VII.30) und (VII.29) t t t t 1 1 Ts x ds − Ts x ds = Ts+h x ds − Ts x ds Th h h 0 0 0 0 t+h h 1 = Ts x ds − Ts x ds h t 0 → Tt x − T0 x = Tt x − x mit h → 0; daraus folgt (a). (b), (c) Sei x ∈ dom(A). Dann konvergiert mit h → 0 T x − x Th (Tt x) − Tt x h = Tt → Tt Ax, h h denn Tt ist stetig. Also ist Tt x ∈ dom(A) und ATt x = Tt Ax. (d) Sei x ∈ dom(A). Unter (a) wurde bewiesen t t t 1 Tt x − x = A Ts x ds = lim Ts x ds − Ts x ds Th h→0 h 0 0 0 t Th x − x = lim ds. Ts h→0 0 h Wegen x ∈ dom(A) konvergiert Ts
T x − x h → Ts Ax h
f¨ ur h → 0, und zwar wegen sups≤t Ts < ∞ (Lemma VII.4.2) gleichm¨aßig auf [0, t]. Daraus folgt lim
h→0
und (d) ist bewiesen.
0
t
t T x − x h Ts Ts Ax ds, ds = h 0 2
Es ist zu bemerken, daß in Beispiel (c) sogar Tt x ∈ dom(A) f¨ ur alle x ∈ X gilt, nicht jedoch in Beispiel (b). Aussage (a) aus Lemma VII.4.5 kann so interpretiert werden, daß im Mittel“ Tt x stets in dom(A) liegt; ” im Kontext von Beispiel (b) sieht man erneut die gl¨attende Wirkung der Integration. Satz VII.4.6 Der Erzeuger einer C0 -Halbgruppe ist dicht definiert und abgeschlossen.
VII.4
Operatorhalbgruppen
367
Beweis. Sei A der Erzeuger von (Tt ). Zu x ∈ X und t > 0 betrachte t xt := 1t 0 Ts x ds. Dann ist nach Lemma VII.4.5(a) xt ∈ dom(A), und es gilt nach (VII.29) limt→0 xt = x. Deshalb ist A dicht definiert. Zum Beweis der Abgeschlossenheit von A betrachte eine Folge (xn ) in dom(A) mit xn → x, Axn → y ∈ X. Es ist x ∈ dom(A) und Ax = y zu zeigen. Das folgt aus Th x − x = h
Th xn − xn h h 1 = lim Ts Axn ds (Lemma VII.4.5(d)) n→∞ h 0 1 h Ts y ds = h 0 (da Ts Axn → Ts y gleichm¨aßig in s ∈ [0, t]) → y lim
n→∞
mit h → 0.
2
Lemma VII.4.5 liefert Informationen u ¨ber die L¨osungen eines abstrakten Cauchyproblems (VII.31) u = Au, u(0) = x0 . Satz VII.4.7 Es sei A der Erzeuger der C0 -Halbgruppe (Tt ) auf einem Banachraum X, und es sei x0 ∈ dom(A). Dann ist die Funktion u: [0, ∞) → X, u(t) = Tt x0 , stetig differenzierbar, dom(A)-wertig und eine L¨osung von (VII.31). Ferner ist u die einzige L¨osung von (VII.31) mit diesen Eigenschaften, und u(t) h¨angt stetig vom Anfangswert x0 ab. ur alle t > 0, also ist Beweis. Nach Lemma VII.4.5(b) ist Tt x0 ∈ dom(A) f¨ A(u(t)) wohldefiniert. F¨ ur die rechtsseitige Ableitung von u gilt T x − x u(t + h) − u(t) Tt+h x0 − Tt x0 h 0 0 = lim = lim Tt lim h h h h→0+ h→0+ h→0+ = Tt Ax0 = ATt x0 = A(u(t)) und f¨ ur die linksseitige ebenfalls lim
h→0+
u(t − h) − u(t) Th x0 − x0 = lim+ Tt−h = Tt Ax0 = A(u(t)). −h h h→0
Im vorletzten Schritt geht ein, daß wegen sups≤t Ts < ∞ die Tt−h gleichgradig stetig sind; mit der Abk¨ urzung Ah = h1 (Th − Id) lautet die Absch¨atzung explizit Tt−h Ah x0 − Tt Ax0 ≤ Tt−h Ah x0 − Tt−h Ax0 + Tt−h Ax0 − Tt Ax0 ≤ Tt−h Ah x0 − Ax0 + Tt−h Ax0 − Tt Ax0 → 0
368
VII.
Spektralzerlegung selbstadjungierter Operatoren
nach Definition von A sowie Lemma VII.4.3. Außerdem zeigt dieses Lemma wegen u (t) = ATt x0 = Tt Ax0 , daß u stetig ist. Sei nun v eine weitere L¨ osung von (VII.31). Dann liefert die Produkt” regel“ der Differentiation (Beweis wie in der Analysis) f¨ ur 0 ≤ t ≤ s d d Ts−t v(t) = (−1)ATs−t v(t) + Ts−t v (t) Tτ x = ATτ x denn dt dτ = −Ts−t Av(t) + Ts−t Av(t) = 0. Daraus folgt die Konstanz der Funktion Φ: [0, s] → X, Φ(t) = Ts−t v(t); denn f¨ ur alle Funktionale ∈ X ist dΦ d ( ◦ Φ) = ◦ = 0, dt dt so daß (Φ(0)) = (Φ(t)) f¨ ur alle t ∈ [0, s], insbesondere f¨ ur t = s. Der Satz von Hahn-Banach impliziert Φ(0) = Φ(s), d.h. Ts x0 = v(s). Da s beliebig war, ist die Eindeutigkeit der L¨ osung gezeigt. Die stetige Abh¨ angigkeit von u(t) von x0 ist nichts anderes als die Ste2 tigkeit der Operatoren Tt . Korollar VII.4.8 Zwei C0 -Halbgruppen mit demselben Erzeuger stimmen uberein. ¨ Beweis. Haben (St ) und (Tt ) denselben Erzeuger A, so l¨osen sowohl t → St x als auch t → Tt x das Anfangswertproblem u (t) = Au(t),
u(0) = x ∈ dom(A).
Die eindeutige L¨ osbarkeit impliziert St |dom(A) = Tt |dom(A) f¨ ur alle t ≥ 0 und, da die St und Tt stetig sind und dom(A) dicht liegt (Satz VII.4.6), St = T t . 2 Will man Satz VII.4.7 auf ein konkretes Cauchyproblem mit einem gegebenen Differentialoperator A anwenden, ben¨ otigt man Kriterien, mit deren Hilfe man einem abgeschlossenen Operator ansehen kann, ob er eine C0 Halbgruppe erzeugt. Solche Kriterien werden im folgenden hergeleitet. Wir behandeln zuerst den Fall normstetiger Halbgruppen. Bei einer normstetigen Halbgruppe (Tt ) ist die Abbildung t → Tt bzgl. der Operatornorm stetig, wie aus der f¨ ur 0 ≤ s ≤ t ≤ t0 g¨ ultigen Absch¨atzung Tt − Ts = Ts (Tt−s − Id) ≤ Ts Tt−s − Id ≤ C Tt−s − Id t folgt. Daher konvergiert das Riemannintegral 0 Ts ds in der Operatornorm, und wir k¨ onnen die Operatoren 1 t Ts ds (t > 0) (VII.32) Mt = t 0
VII.4
369
Operatorhalbgruppen
definieren. Da T → T x ein stetiger linearer Operator von L(X) nach X ist, gilt 1 t Ts x ds ∀x ∈ X. Mt x = t 0 Satz VII.4.9 F¨ ur eine C0 -Halbgruppe (Tt ) mit Erzeuger A sind folgende Aussagen ¨aquivalent: (i) (Tt ) ist normstetig. (ii) A ist stetig. (iii) dom(A) = X. Sind diese Bedingungen erf¨ ullt, gilt Tt = etA f¨ ur alle t ≥ 0. Beweis. (i) ⇒ (iii): Wir verwenden die obige Notation. Ist (Tt ) normstetig, folgt aus (VII.29) Mt − Id → 0, denn t → Tt ist stetig. F¨ ur hinreichend kleines τ ist deshalb Mτ invertierbar und insbesondere surjektiv (Neumannsche Reihe, Satz II.1.11). Nun ist nach Lemma VII.4.5(a) ran(Mτ ) ⊂ dom(A); folglich ist dom(A) = X. (iii) ⇒ (ii): Da A nach Satz VII.4.6 abgeschlossen ist, folgt diese Implikation aus dem Satz vom abgeschlossenen Graphen. (ii) ⇒ (i): Betrachte die Halbgruppe St = etA ; nach Beispiel (a) ist (St ) normstetig und hat A als Erzeuger. Wegen Korollar VII.4.8 ist Tt = etA , und damit ist auch der Zusatz gezeigt. 2 ¨ Beachte, daß die Aquivalenz von (ii) und (iii) f¨ ur jeden dicht definierten abgeschlossenen Operator in einem Banachraum g¨ ultig ist. Um den fundamentalen Satz von Hille-Yosida u ¨ber die Erzeugung von otigen wir Grundbegriffe der SpektralC0 -Halbgruppen zu formulieren, ben¨ theorie unbeschr¨ ankter Operatoren in einem Banachraum. Diese sind vollkommen analog zu denen aus Definition VII.2.14 f¨ ur Hilbertraum-Operatoren; auch Satz VII.2.15 gilt entsprechend. Wir wenden uns als erstes den Kontraktionshalbgruppen zu, also den ur alle t ≥ 0. C0 -Halbgruppen mit Tt ≤ 1 f¨ Satz VII.4.10 Sei A der Erzeuger der Kontraktionshalbgruppe (Tt ). (a) {λ: Re λ > 0} ⊂ ρ(A). ∞
(b) (λ − A)−1 x =
0 −1
(c) (Re λ)(λ − A)
e−λs Ts x ds f¨ ur alle λ mit Re λ > 0.
≤ 1 f¨ ur alle λ mit Re λ > 0.
Beweis. Sei Re λ > 0; dann ist limt→∞ e−λt Tt = 0, da Tt ≤ 1. Wendet man Lemma VII.4.5 auf die Halbgruppe (e−λt Tt ) an, die den Erzeuger A−λ mit Definitionsbereich dom(A) hat, folgt ⎧ t ⎪ ⎪ e−λs Ts x ds ∀x ∈ X, ⎨ (A − λ) −λt 0 e Tt x − x = t ⎪ ⎪ ⎩ e−λs Ts (A − λ)x ds ∀x ∈ dom(A). 0
370
VII.
Spektralzerlegung selbstadjungierter Operatoren
Der Grenz¨ ubergang t → ∞ liefert ∞ ⎧ ⎪ e−λs Ts x ds ⎨ (λ − A) 0 x= ∞ ⎪ ⎩ e−λs Ts (λ − A)x ds
∀x ∈ X, ∀x ∈ dom(A).
0
Daher ist λ − A: dom(A) → X bijektiv und λ ∈ ρ(A), und der inverse Operator hat die in (b) angegebene Gestalt. Schließlich folgt (c) aus ∞ ∞ x . 2 e− Re λs Ts x ds ≤ e− Re λs ds · x = (λ − A)−1 x ≤ Re λ 0 0 Teil (b) kann man so deuten, daß die Resolvente von A die Laplacetransformation der Halbgruppe ist. Wir kommen zum ersten Hauptergebnis, wonach die Umkehrung von Satz VII.4.10 ebenfalls richtig ist. Theorem VII.4.11 (Satz von Hille-Yosida f¨ ur Kontraktionshalbgruppen) Ein Operator A ist genau dann Erzeuger einer Kontraktionshalbgruppe, wenn A dicht definiert und abgeschlossen ist, (0, ∞) ⊂ ρ(A) gilt und λ(λ − A)−1 ≤ 1
∀λ > 0.
(VII.33)
Beweis. Die Notwendigkeit der Bedingungen wurde in Satz VII.4.6 und Satz VII.4.10 bewiesen. Der Beweis der Umkehrung nach Yosida beruht auf folgender Idee: Definiere f¨ ur λ > 0 beschr¨ankte Operatoren Aλ und die zugeh¨ origen Halbgruppen (etAλ ); dann zeige, daß Tt x = limλ→∞ etAλ x existiert und eine Kontraktionshalbgruppe mit Erzeuger A definiert. F¨ ur λ > 0 definieren wir also die Yosida-Approximation Aλ := λA(λ − A)−1 = λ2 (λ − A)−1 − λ ∈ L(X) und die zugeh¨ orige normstetige Halbgruppe (etAλ ); beachte Aλ x = λ(λ − A)−1 Ax
∀x ∈ dom(A).
Die Operatoren etAλ sind kontraktiv wegen 2
etAλ ≤ e−λt eλ
(λ−A)−1 t
2
≤ e−λt e λ
(λ−A)−1 t
≤ e−λt eλt = 1;
im zweiten Schritt wurde die f¨ ur einen beschr¨ankten Operator S g¨ ultige Absch¨ atzung ∞ n ∞ S S n S = e S
e = ≤ n! n! n=0 n=0 und im vorletzten die Voraussetzung (VII.33) benutzt.
VII.4
371
Operatorhalbgruppen
Wir m¨ ochten nun das Verhalten von Aλ x und etAλ x f¨ ur λ → ∞ untersuchen. Dazu wird zuerst lim Aλ x = Ax
λ→∞
∀x ∈ dom(A)
(VII.34)
gezeigt. Ist n¨ amlich y ∈ dom(A), so erh¨ alt man lim λ(λ − A)−1 y = lim (y + A(λ − A)−1 y) = y,
λ→∞
λ→∞
(VII.35)
denn
Ay →0 λ mit λ → ∞ wegen (VII.33). Nun ist nach Voraussetzung die Familie der Operatoren λ(λ − A)−1 beschr¨ ankt, so daß (VII.35) sogar f¨ ur alle y ∈ X gilt. Setzt man speziell y = Ax ein, erh¨ alt man (VII.34). Seien jetzt x ∈ X und t ≥ 0. Wir zeigen, daß limλ→∞ etAλ x existiert, und beweisen dazu die Cauchy-Eigenschaft. Wir gehen aus von A(λ − A)−1 y = (λ − A)−1 Ay ≤
d s(Aλ −Aμ ) e x = es(Aλ −Aμ ) (Aλ − Aμ )x, ds integrieren von 0 bis t und wenden dann etAμ an; das liefert t tAλ tAμ e x−e x= esAλ e(t−s)Aμ (Aλ − Aμ )x ds. 0
Hier ist zu beachten, daß f¨ ur kommutierende beschr¨ankte Operatoren S und T auch eS , eT , S und T kommutieren und daß eS+T = eS eT gilt (Aufgabe VII.5.30). Man erh¨ alt jetzt f¨ ur x ∈ dom(A) t etAλ x − etAμ x ≤ esAλ e(t−s)Aμ Aλ x − Aμ x ds 0
≤ t Aλ x − Aμ x → 0 mit λ, μ → ∞ wegen (VII.34). Aber da stets etAλ ≤ 1 gilt, schließen wir, daß limλ→∞ etAλ x sogar f¨ ur alle x ∈ X und nicht bloß auf dom(A) existiert; beachte außerdem, daß die Konvergenz gleichm¨aßig auf beschr¨ankten tIntervallen ist. F¨ ur jedes t ≥ 0 und jedes x ∈ X kann man daher Tt x := lim etAλ x λ→∞
(VII.36)
definieren. Dann sind die Tt stetige Operatoren mit Norm ≤ 1, da die etAλ es sind. Der n¨ achste Schritt ist zu zeigen, daß (Tt )t≥0 eine Kontraktionshalbgruppe ist. Hier sind die Forderungen (1) und (2) aus Definition VII.4.1 klar, und die starke Stetigkeit ergibt sich aus der gleichm¨aßigen Konvergenz in (VII.36) auf beschr¨ ankten Intervallen.
372
VII.
Spektralzerlegung selbstadjungierter Operatoren
Schließlich ist A als der Erzeuger von (Tt ) zu identifizieren, der einstweilen mit B bezeichnet sei. Wir behaupten zuerst dom(A) ⊂ dom(B),
Bx = Ax f¨ ur x ∈ dom(A).
(VII.37)
F¨ ur x ∈ dom(A) zeigt Lemma VII.4.5 n¨ amlich t t esAλ Aλ x ds = Ts Ax ds, Tt x − x = lim etAλ x − x = lim λ→∞
λ→∞
0
0
denn t t t sAλ ≤ e A x ds − T Ax ds esAλ Aλ x − Ax ds λ s 0 0 0 t esAλ Ax − Ts Ax ds, + 0
und das erste Integral strebt nach (VII.34) mit λ → ∞ gegen 0 und das zweite wegen der gleichm¨ aßigen Konvergenz der Integranden. Andererseits ist 1 ∈ ρ(A) nach Voraussetzung und 1 ∈ ρ(B) nach ur alle x ∈ X, Satz VII.4.10. Wegen (VII.37) ist x = (Id − B)(Id − A)−1 x f¨ ur alle x gilt, und das zeigt so daß auch (Id − B)−1 x = (Id − A)−1 x f¨ dom(B) = dom(A). Damit ist der Satz von Hille-Yosida bewiesen. 2 Das n¨ achste Ziel wird sein, den Satz von Hille-Yosida auf beliebige C0 -Halbgruppen auszudehnen. Dazu wird eine Umnormierungstechnik verwandt; beachte, daß die starke Stetigkeit einer Halbgruppe, also Forde¨ rung (3) aus Definition VII.4.1, bei Ubergang zu einer ¨aquivalenten Norm erhalten bleibt, und auch der Erzeuger ¨ andert sich dabei nicht. Hier ist als erstes die notwendige Spektralbedingung an den Erzeuger einer C0 -Halbgruppe, die sich in Theorem VII.4.13 auch als hinreichend erweisen wird. Satz VII.4.12 Sei (Tt ) eine C0 -Halbgruppe mit Tt ≤ M eωt f¨ ur alle t ≥ 0 und A ihr Erzeuger. Dann gelten (a) {λ: Re λ > ω}⊂ ρ(A), ∞
(b) (λ − A)−1 x =
e−λs Ts x ds f¨ ur alle λ mit Re λ > ω,
0
ur alle λ mit Re λ > ω, n ∈ N. (c) (Re λ − ω)n (λ − A)−n ≤ M f¨ Beweis. Wir betrachten zuerst den Spezialfall ω = 0, so daß stets Tt ≤ M vorausgesetzt ist. Der Ausdruck |||x||| = sup Tt x t≥0
VII.4
373
Operatorhalbgruppen
definiert eine Norm, die wegen x ≤ |||x||| ≤ M x zur urspr¨ unglichen Norm a orige Operatornorm bezeichnen wir ebenfalls ¨quivalent ist. Die zugeh¨ mit diesem Symbol, also |||S||| = sup|||x|||≤1 |||Sx|||. In der neuen Norm ist (Tt ) eine Kontraktionshalbgruppe, denn |||Tt x||| = sup Tτ +tx ≤ |||x|||. τ ≥0
Satz VII.4.10 impliziert daher {λ: Re λ > 0} ⊂ ρ(A) und |||(Re λ)n (λ − A)−n ||| ≤ |||(Re λ)(λ − A)−1 |||n ≤ 1 f¨ ur alle Re λ > 0, n ∈ N, und Satz VII.4.12 ist in diesem Spezialfall gezeigt, denn S ≤ M |||S||| f¨ ur alle S ∈ L(X). Im allgemeinen Fall gehen wir zur Halbgruppe St = e−ωt Tt mit dem Erzeuger A − ω u ur die St ≤ M f¨ ur alle t ≥ 0 gilt. Nach dem ¨ ber, f¨ bereits Bewiesenen ist {μ: Re μ > 0} ⊂ ρ(A − ω) = {λ − ω: λ ∈ ρ(A)} und ur alle Re μ > 0 und n ∈ N. Schreibt man (Re μ)n (μ − (A − ω))−n ≤ M f¨ μ = λ − ω, so liefert das sofort die Behauptung. Der Beweis der Formel f¨ ur die Resolvente ist wie in Satz VII.4.10. 2 Wir kommen zur Umkehrung. Theorem VII.4.13 (Satz von Hille-Yosida im allgemeinen Fall) Ein Operator A ist genau dann Erzeuger einer C0 -Halbgruppe, wenn er dicht definiert und abgeschlossen ist und Konstanten ω ∈ R, M ≥ 1 existieren, so daß (ω, ∞) ⊂ ρ(A) und (λ − ω)n (λ − A)−n ≤ M
∀λ > ω, n ∈ N.
(VII.38)
In diesem Fall erf¨ ullt die erzeugte Halbgruppe die Absch¨atzung Tt ≤ M eωt f¨ ur alle t ≥ 0. Beweis. Die Notwendigkeit der Bedingungen wurde gerade in Satz VII.4.12 bewiesen. Die Hinl¨ anglichkeit wird wieder zuerst im Spezialfall ω = 0 untersucht. Die Idee f¨ ur den Beweis ist, durch eine geschickte Umnormierung (VII.38) in (VII.33) zu u uhren und dann Theorem VII.4.11 anzuwen¨berf¨ den. Wir f¨ uhren zuerst zu jedem μ > 0 die durch x μ = sup μn (μ − A)−n x n≥0
definierte Norm . μ auf X ein. Dies ist eine ¨aquivalente Norm, denn (VII.38) liefert (VII.39) x ≤ x μ ≤ M x ;
374
VII.
Spektralzerlegung selbstadjungierter Operatoren
außerdem gilt nach Konstruktion μ(μ − A)−1 μ ≤ 1.
(VII.40)
Wir werden zeigen, daß x μ mit μ monoton w¨achst. Dazu wird als erstes ∀0 < λ ≤ μ (VII.41) λ(λ − A)−1 μ ≤ 1 behauptet; das ergibt sich folgendermaßen aus der Resolventengleichung (vgl. Satz VII.2.15(b)): (λ − A)−1 μ = (μ − A)−1 + (μ − λ)(μ − A)−1 (λ − A)−1 μ μ−λ 1 + (λ − A)−1 μ ≤ (nach (VII.40)) μ μ 1 1 − λ(λ − A)−1 μ . = (λ − A)−1 μ + μ Weiter hat man f¨ ur 0 < λ ≤ μ und n ∈ N wg. (VII.39) und (VII.41) λn (λ − A)−n x ≤ λn (λ − A)−n x μ ≤ λ(λ − A)−1 nμ x μ ≤ x μ und daher x λ ≤ x μ
∀0 < λ ≤ μ.
Wir k¨ onnen deshalb die ¨ aquivalente Norm |||x||| = lim x μ μ→∞
einf¨ uhren, die ebenfalls x ≤ |||x||| ≤ M x
(VII.42)
erf¨ ullt. (VII.41) liefert |||λ(λ − A)−1 ||| ≤ 1, also die Hille-Yosida-Bedingung (VII.33); man lasse n¨ amlich in λ(λ − A)−1 x μ ≤ x μ μ → ∞ streben. Theorem VII.4.11 garantiert jetzt, daß A der Erzeuger einer C0 -Halbgruppe mit |||Tt ||| ≤ 1 ist; (VII.42) liefert Tt x ≤ |||Tt x||| ≤ |||x||| ≤ M x , also Tt ≤ M , und Theorem VII.4.13 ist im Fall ω = 0 gezeigt. Im Fall eines beliebigen ω betrachten wir B = A − ω. Nach dem gerade Bewiesenen erzeugt B eine C0 -Halbgruppe mit St ≤ M . Der Operator A erzeugt dann die Halbgruppe Tt = eωt St , und die erf¨ ullt Tt ≤ M eωt . Damit ist das Theorem vollst¨ andig bewiesen. 2 Die Bedingungen im Satz von Hille-Yosida k¨onnen so verstanden werden, daß die in einem geeigneten Sinn nach oben beschr¨ankten“ Opera” toren C0 -Halbgruppen erzeugen und negative“ Operatoren Kontraktions” halbgruppen.
VII.4
375
Operatorhalbgruppen
Obwohl die Theoreme VII.4.11 und VII.4.13 in theoretischer Hinsicht sehr befriedigend sind, sind sie in der Praxis h¨aufig schwierig anzuwenden, da man eine explizite Kenntnis der Resolvente ben¨otigt. Deshalb soll jetzt ein praktikableres Kriterium aufgestellt werden. Die dabei auftauchenden dissipativen Operatoren k¨ onnen als Analoga der negativen selbstadjungierten Operatoren im Kontext eines Banachraums verstanden werden. Definition VII.4.14 (a) Die Dualit¨atsabbildung auf einem Banachraum X ist die mengenwertige Abbildung J: X → P(X ) mit J(x) = {x : x = x und x (x) = x 2 }. (b) Ein linearer Operator A in X heißt dissipativ, falls ∀x ∈ dom(A) ∃x ∈ J(x)
Re x (Ax) ≤ 0.
(VII.43)
(c) Ein linearer Operator A in X heißt akkretiv, falls −A dissipativ ist. Nach dem Satz von Hahn-Banach ist stets J(x) = ∅. Im Fall eines Hilbertraums H, wo H wie u ¨ blich mit H identifiziert wird, ist J(x) = {x}, und ein Operator ist genau dann dissipativ, wenn ReAx, x ≤ 0 auf dom(A) gilt. Insbesondere trifft das auf selbstadjungierte Operatoren mit negativem Spektrum zu (vgl. Aufgabe VII.5.24). Auch f¨ ur X = Lp mit 1 < p < ∞ ist J(f ) ⊂ Lq ∼ = (Lp ) stets einelemen2−p tig, n¨ amlich J(f ) = {g} mit g(ω) = f p f (ω)|f (ω)|p−2 bzw. g(ω) = 0 f¨ ur f (ω) = 0. F¨ ur p = 1 oder p = ∞ sowie X = C[0, 1] ist J i.a. tats¨achlich mengenwertig; f¨ ur X = C[0, 1] ist z.B. J(1) die Menge aller Wahrscheinlichkeitsmaße auf [0, 1]. Beispiel. Sei X = C0 (Rd ), und betrachte den Laplaceoperator mit dem Definitionsbereich dom(Δ) = S (Rd ). Dann ist Δ dissipativ: Zu ϕ ∈ S (Rd ) existiert eine Stelle x0 , so daß ϕ ∞ = |ϕ(x0 )|. Setze α = ϕ(x0 ) und betrachte das Funktional = αδx0 . Dann ist ∈ J(ϕ) klar, und weiter gilt Re (Δϕ) = Re α(Δϕ)(x0 ) ≤ 0, denn die reellwertige Funktion ψ = Re αϕ nimmt bei x0 ihr Maximum an, und dann m¨ ussen bei x0 alle ∂ 2 ψ/∂x2j ≤ 0 sein. Satz VII.4.15 Ein linearer Operator A ist genau dann dissipativ, wenn (λ − A)x ≥ λ x
∀λ > 0, x ∈ dom(A).
(VII.44)
376
VII.
Spektralzerlegung selbstadjungierter Operatoren
Beweis. Sei A dissipativ. Zu x ∈ dom(A) w¨ ahle x ∈ J(x) mit Re x (Ax) ≤ 0; f¨ ur alle λ > 0 folgt dann (λ − A)x x ≥ |x (λ − A)x | ≥ Re x (λ − A)x ≥ λ Re x (x) = λ x 2 , was wegen x = x (VII.44) ergibt. Umgekehrt sei (VII.44) vorausgesetzt. Zu x ∈ dom(A) und λ > 0 sei ahlt. F¨ ur yλ = xλ / xλ gilt dann nach ein beliebiges xλ ∈ J(λx − Ax) gew¨ (VII.44) bzw. nach Wahl von xλ λ x ≤ λx − Ax = yλ (λx − Ax) = λ Re yλ (x) − Re yλ (Ax). Daraus folgen die beiden Ungleichungen x ≤ Re yλ (x) +
Ax , λ
Re yλ (Ax) ≤ 0.
Sei E = lin{x, Ax} ⊂ X und zn = yn |E . Dann besitzt die beschr¨ankte Folge (zn ) des endlichdimensionalen Raums E einen H¨aufungspunkt z ; sei y ∈ X eine Hahn-Banach-Fortsetzung von z . (Leserinnen und Leser, die mit dem Satz von Alaoglu aus dem n¨ achsten Kapitel (Korollar VIII.3.12) bereits vertraut sind, k¨ onnen an dieser Stelle einfach einen Schwach∗ -H¨aufungsahlen.) Auf jeden Fall folgt damit y ≤ 1, x ≤ punkt y der yn , n ∈ N, w¨ Re y (x), Re y (Ax) ≤ 0, so daß x := x y ∈ J(x) und Re x (Ax) ≤ 0. 2 Jetzt k¨ onnen wir eine weitere Charakterisierung der Erzeuger von Kontraktionshalbgruppen beweisen. Theorem VII.4.16 (Satz von Lumer-Phillips) Sei A ein dicht definierter linearer Operator in einem Banachraum X. Genau dann erzeugt A eine Kontraktionshalbgruppe, wenn A dissipativ ist und ur ein λ0 > 0 surjektiv ist. λ0 − A f¨ Beweis. Erzeugt A eine Kontraktionshalbgruppe, so gilt (0, ∞) ⊂ ρ(A), und die Hille-Yosida-Bedingung (VII.33) impliziert sofort (VII.44), so daß A dissipativ ist. Umgekehrt sei A dissipativ und λ0 −A surjektiv. Aus (VII.44) folgt, daß λ0 − A auch injektiv mit stetiger Inverser ist. Insbesondere ist (λ0 − A)−1 abgeschlossen und deshalb auch λ0 − A sowie A, vgl. Aufgabe IV.8.15. Wenn gezeigt werden kann, daß alle λ − A f¨ ur λ > 0 surjektiv sind, ¨ so zeigt die obige Uberlegung (0, ∞) ⊂ ρ(A), und da (VII.44) f¨ ur den dissipativen Operator A (VII.33) impliziert, ist der abgeschlossene Operator A nach dem Satz von Hille-Yosida Erzeuger einer kontraktiven Halbgruppe. Wir betrachten daher Λ = {λ ∈ (0, ∞): λ − A ist surjektiv} = (0, ∞) ∩ ρ(A).
VII.4
377
Operatorhalbgruppen
Offensichtlich ist Λ eine offene Teilmenge von (0, ∞) und = ∅, denn λ0 ∈ Λ. Wir werden zeigen, daß Λ in der Relativtopologie von (0, ∞) auch abgeschlossen ist, was, wie gew¨ unscht, Λ = (0, ∞) liefert. Sei also (λn ) eine Folge in Λ mit λn → λ ∈ (0, ∞). Wegen (VII.44) folgt mit Aufgabe VII.5.1, deren Aussage auch f¨ ur unbeschr¨ankte Operatoren gilt, daß 1 ≥ λn dist λn , σ(A) ≥ (λn − A)−1 und daher auch
dist λ, σ(A) ≥ λ > 0,
d.h. λ ∈ ρ(A).
2
Als Beispiel behandeln wir ein einfaches Anfangsrandwertproblem: ⎫ vt = vxx f¨ ur t ≥ 0, 0 ≤ x ≤ 1, ⎬ v(0, x) = f0 (x) f¨ ur 0 ≤ x ≤ 1, ⎭ v(t, 0) = v(t, 1) = 0 f¨ ur t ≥ 0.
(VII.45)
Dieses Problem u ¨ bersetzen wir in ein abstraktes Cauchyproblem wie folgt: Setze X = {f ∈ C[0, 1]: f (0) = f (1) = 0} mit der Supremumsnorm, Af = f mit dom(A) = {f ∈ C 2 [0, 1]∩X: f ∈ X} und u(t) (x) = v(t, x). Statt eine skalarwertige L¨ osung v von (VII.45) zu bestimmen, versucht man, eine vektorwertige L¨ osung u: [0, ∞) → X von u = Au,
u(0) = f0
(VII.46)
zu finden. Eine solche L¨ osung existiert nach Satz VII.4.7, wenn A eine C0 Halbgruppe auf X erzeugt und f0 ∈ dom(A). Ersteres folgt aus dem Satz von Lumer-Phillips: Zun¨ achst ist es nicht schwierig zu zeigen, daß A abgeschlossen und dicht definiert ist; die Technik aus Lemma V.1.10 zeigt n¨ amlich, daß D(0, 1) dicht in X liegt. Die Dissipativit¨at von A folgt wie im obigen Beispiel des Laplaceoperators. Schließlich ist Id − A surjektiv; diese Aussage ist dazu ¨ aquivalent, daß f¨ ur jedes g ∈ X das Randwertproblem osbar ist. Das ist jedoch ein f − f = g, f (0) = f (1) = 0, eindeutig l¨ bekannter Satz aus der Theorie gew¨ ohnlicher Differentialgleichungen (siehe z.B. Walter [1993], S. 219). Dies ist nat¨ urlich nur die Spitze des Eisbergs; auch wesentlich allgemeinere Anfangsrandwertprobleme f¨ ur gleichm¨aßig stark elliptische Diffeonnen mit Halbgruppenmethoden gel¨ost werden, rentialoperatoren in Lp k¨ siehe etwa Pazy [1983].
378
VII.5
VII.
Spektralzerlegung selbstadjungierter Operatoren
Aufgaben
Es bezeichne H stets einen komplexen Hilbertraum und X einen komplexen Banachraum. Aufgabe VII.5.1 Sei T ∈ L(X). F¨ ur λ ∈ ρ(T ) gilt (λ − T )−1 ≥
1 . dist(λ, σ(T ))
Ist T ∈ L(H) selbstadjungiert, gilt sogar Gleichheit. Aufgabe VII.5.2 Zeige mittels eines Beispiels, daß der numerische Wertebereich eines Operators nicht abgeschlossen zu sein braucht. Aufgabe VII.5.3 Sei T ∈ L(H) selbstadjungiert. aus Satz VII.1.6 involutiv ist. (a) Zeige, daß die Abbildung Φ (b) F¨ ur f ∈ B(σ(T )) ist f (T )(x) = f (λ)x, falls T x = λx. (c) Gilt f (σ(T )) = σ(f (T )) f¨ ur f ∈ B(σ(T ))? Aufgabe VII.5.4 (Analytischer Funktionalkalk¨ ul) Es sei T ∈ L(X) ein Operator auf einem Banachraum, und es definiere f (z) = ∞ n a z eine Potenzreihe mit Konvergenzradius > r(T ). n n=0 ∞ (a) Dann konvergiert die Reihe f (T ) := n=0 an T n in L(X). ∞ (b) Ist g(z) = b z n eine weitere Potenzreihe mit Konvergenzradius n=0 n > r(T ), so gilt (f g)(T ) = f (T )g(T ). (c) Es gilt der Spektralabbildungssatz σ f (T ) = f σ(T ) . (d) Ist T ein selbstadjungierter Operator auf einem Hilbertraum, so stimmt der soeben definierte Operator f (T ) mit dem aus Satz VII.1.3 u ¨ berein. Aufgabe VII.5.5 Ist T ∈ L(H) selbstadjungiert und gilt σ(T ) = {0, 1}, so ist T eine Orthogonalprojektion. aquivalent: Aufgabe VII.5.6 F¨ ur zwei Orthogonalprojektionen E1 und E2 sind ¨ (i) ran(E1 ) ⊂ ran(E2 ), (ii) ker(E2 ) ⊂ ker(E1 ), (iii) E1 E2 = E2 E1 = E1 , (iv) E2 − E1 ≥ 0. Aufgabe VII.5.7 A → EA sei ein Spektralmaß. Zeige EA EB = EB EA = EA∩B f¨ ur A, B ∈ Σ sowie EA ≤ EB (d.h. EB − EA ≥ 0), falls zus¨ atzlich A ⊂ B. (Verwende Aufgabe VII.5.6.) Aufgabe VII.5.8 (a) Sei h ∈ C0 (R) und Mh der Multiplikationsoperator ϕ → hϕ auf L2 (R). Bestimme das Spektrum von Mh . Gib notwendige und hinreichende Bedingungen daf¨ ur an, daß ein Spektralwert ein Eigenwert ist. (b) Behandle dasselbe Problem f¨ ur h ∈ L∞ (R).
VII.5
379
Aufgaben
Aufgabe VII.5.9 Sei T ∈ L(H) ein normaler Operator und λ ∈ σ(T ). Dann existiert eine Folge (xn ) in H mit xn = 1, so daß T xn − λxn → 0. (Man sagt, λ sei ein approximativer Eigenwert von T .) Aufgabe VII.5.10 (a) Seien f, g ∈ S (Rd ). Dann ist die Faltung f ∗ g ∈ S (Rd ), und es gilt F(f ∗ g) = (2π)d/2 Ff Fg. (b) Beweise diese Formel f¨ ur f ∈ L1 (Rd ) ∩ L2 (Rd ), g ∈ L2 (Rd ). Aufgabe VII.5.11 Sei T : H ⊃ dom(T ) → H dicht definiert. Zeige, daß T symmetrisch ist, wenn T x, x ∈ R f¨ ur alle x ∈ dom(T ) ist. (Hinweis: Betrachte T (x + y), x + y.) Aufgabe VII.5.12 (a) Sei T1 = d/dt auf dem Definitionsbereich
"
dom(T1 ) =
f ∈ L2 [0, 1]:
#
df existiert f.¨ u. und geh¨ ort zu L2 [0, 1] . dt
Dann ist dom(T1∗ ) = {0}. (Tip: Approximiere durch st¨ uckweise konstante Funktionen.) (b) Sei T2 = d/dt auf dem Definitionsbereich dom(T2 ) = dom(T1 ) ∩ C[0, 1]. Auch dann ist dom(T2∗ ) = {0}. (Hinweis: Es ist hilfreich zu wissen, daß nicht konstante stetige monotone u. existieren, siehe Rudin [1986], S. 144.) Funktionen f mit f = 0 f.¨ Aufgabe VII.5.13 Sei T : H ⊃ dom(T ) → H dicht definiert. (a) Aus T ⊂ S folgt S ∗ ⊂ T ∗ . (b) Wenn T wesentlich selbstadjungiert ist, besitzt T genau eine selbstadjungierte Erweiterung. (c) Wenn T selbstadjungiert ist, besitzt T keine echte symmetrische Erweiterung. Aufgabe VII.5.14 Sei T : H ⊃ dom(T ) → H dicht definiert und symmetrisch. Dann ist T ∗ genau dann wesentlich selbstadjungiert, wenn T ∗ symmetrisch ist. Aufgabe VII.5.15 Seien T : H ⊃ dom(T ) → H und S: H ⊃ dom(S) → H dicht definiert. Setze dom(ST ) = {x ∈ dom(T ): T x ∈ dom(S)}, und nimm an, daß auch ST : H ⊃ dom(ST ) → H, x → S(T x), dicht definiert ist. Dann gilt art ist. Ist S ∈ L(H), so gilt sogar T ∗ S ∗ ⊂ (ST )∗ , wo dom(T ∗ S ∗ ) analog erkl¨ T ∗ S ∗ = (ST )∗ . Aufgabe VII.5.16 Sei T : H ⊃ dom(T ) → H dicht definiert und abgeschlossen, und sei V : H × H → H × H durch (x, y) → (−y, x) definiert. (a) V ist unit¨ ar bzgl. des kanonischen Skalarprodukts von H × H. (b) (c) (d) (e)
$
%⊥
gr(T ) = V (gr(T ∗ )) . Ist z ∈ dom(T ∗ )⊥ , so gilt (z, 0) ∈ gr(T ∗ )⊥ sowie (0, z) ∈ gr(T ). T ∗ ist dicht definiert. T = T ∗∗ .
380
VII.
Spektralzerlegung selbstadjungierter Operatoren
Aufgabe VII.5.17 Bestimme die Objekte [., .], J, K, J ∗ und S aus dem Beweis von Satz VII.2.11 explizit, falls T der Operator Id − Δ auf D (Rn ) ist. (Hinweis: Satz V.2.14.) Aufgabe VII.5.18 Zeige, daß die im Beweis von Satz VII.2.11 konstruierte Friedrichs-Erweiterung S dom(S) = dom(T ∗ ) ∩ J(K), S = T ∗ |dom(T ∗ )∩J (K) erf¨ ullt. Aufgabe VII.5.19 (Satz vom abgeschlossenen Bild) In dieser Aufgabe soll der Satz vom abgeschlossenen Bild (Theorem IV.5.1) f¨ ur unbeschr¨ ankte Operatoren diskutiert werden. Sei T : H ⊃ dom(T ) → H dicht definiert und abgeschlossen. Dann sind folgende Bedingungen ¨ aquivalent: (i) ran(T ) ist abgeschlossen. (ii) ran(T ) = ker(T ∗ )⊥ . (iii) ran(T ∗ ) ist abgeschlossen. (iv) ran(T ∗ ) = ker(T )⊥ . Anleitung: (ii) ⇒ (i) und (iv) ⇒ (iii) sind trivial. F¨ ur die Umkehrung dieser Implikationen zeige zuerst, daß f¨ ur einen abgeschlossenen dicht definierten Operator stets ran(T ) dicht in ker(T ∗ )⊥ und ran(T ∗ ) dicht in ker(T )⊥ ist; beachte ¨ daf¨ ur die Aufgaben IV.8.13 und VII.5.16. Die Aquivalenz (i) ⇔ (iii) wird auf die ¨ entsprechende Aquivalenz in Theorem IV.5.1 zur¨ uckgef¨ uhrt. Dazu betrachte den Hilbertraum H × H und dessen abgeschlossenen Unterraum G = gr(T ). Definiere S: G → H durch S: (x, T x) → T x. Offensichtlich ist ran(T ) = ran(S), und S ist stetig. Daher reicht es zu zeigen, daß ran(T ∗ ) genau dann abgeschlossen ist, wenn ¨ ran(S ∗ ) (⊂ H × H) es ist. Das erzielt man durch folgende Uberlegungen. (a) S(x, T x), yH = (x, T x), (0, y)H×H ∀x ∈ dom(T ), y ∈ H. (b) S ∗ y − (0, y) ∈ G⊥ ∀y ∈ H. (c) (ξ, η) ∈ G⊥ ⇔ η ∈ dom(T ∗ ), ξ = −T ∗ η. (d) ∀y ∈ H ∃η ∈ dom(T ∗ ) S ∗ (y) = (−T ∗ η, y + η). (e) ran(S ∗ ) = ran(T ∗ ) × H. Aufgabe VII.5.20 Sei T : H ⊃ dom(T ) → H abgeschlossen, dicht definiert und symmetrisch. Dann ist T genau dann selbstadjungiert, wenn σ(T ) ⊂ R gilt. Aufgabe VII.5.21 Sei T : H ⊃ dom(T ) → H selbstadjungiert. Es existiere λ ∈ ρ(T ), so daß (λ−T )−1 kompakt ist. (Man sagt, T habe eine kompakte Resolvente.) (a) Dann ist f¨ ur alle λ ∈ ρ(T ) die Resolvente (λ − T )−1 kompakt. (b) σ(T ) besteht nur aus Eigenwerten endlicher Vielfachheit, die keinen H¨ aufungspunkt besitzen. d ist auf S (R) wesentlich selbstadjungiert, Aufgabe VII.5.22 Der Operator i dt d ur alle kompakten und seine Abschließung ist i dt auf {x ∈ L2 (R): x|I ∈ AC(I) f¨ Teilintervalle I ⊂ R und dx/dt ∈ L2 (R)}.
VII.5
381
Aufgaben
Aufgabe VII.5.23 Sei f ∈ L2 (R), und gelte f (t) = f (−t) fast u ¨ berall. Dann ist der Faltungsoperator T : ϕ → f ∗ ϕ auf dom(T ) = {ϕ ∈ L2 (R): f ∗ ϕ ∈ L2 (R)} selbstadjungiert. Diskutiere die Spektralzerlegung von T . Aufgabe VII.5.24 Sei T : H ⊃ dom(T ) → H dicht definiert. Der numerische Wertebereich von T ist W (T ) = {T x, x: x ∈ dom(T ), x = 1}. (a) Ist λ ∈ / W (T ), so gilt 0 < dist(λ, W (T )) ≤ (λ − T )x
∀x ∈ dom(T ), x = 1.
(b) Ist λ ∈ / W (T ) und λ ∈ ρ(T ), so gilt (λ − T )−1 ≤
1 . dist(λ, W (T ))
(c) Ist T selbstadjungiert, so gilt σ(T ) ⊂ W (T ) sowie inf σ(T ) = inf W (T ), sup σ(T ) = sup W (T ). ur λ < 0; setze dann (Tip: Ist inf σ(T ) = 0, zeige (λ − T )−1 y, y ≤ 0 f¨ y = (λ − T )x und lasse λ → 0 streben.) Aufgabe VII.5.25 Sei (Tt ) eine Familie stetiger linearer Operatoren auf einem Banachraum, die (2) bzw. (2) und (3) aus Definition VII.4.1 erf¨ ullt. Gilt dann auch (1)? Aufgabe VII.5.26 Zeige, daß die W¨ armeleitungshalbgruppe (siehe (VII.20)) eine C0 -Halbgruppe auf C0 (Rd ) ist. ankte stetige Funktion. Aufgabe VII.5.27 Sei q: Rd → R eine nach oben beschr¨ Betrachte die Operatoren (Tt f )(x) = etq(x) f (x) auf C0 (Rd ) oder Lp (Rd ), 1 ≤ p < alt ∞. Zeige, daß (Tt ) eine C0 -Halbgruppe ist. Was ist ihr Erzeuger? Wann erh¨ man auch f¨ ur p = ∞ eine C0 -Halbgruppe? Aufgabe VII.5.28 Sei X = {f ∈ C[0, 1]: f (1) = 0}, und die Operatoren Tt : ur 0 ≤ x + t ≤ 1 und (Tt f )(x) = 0 sonst X → X seien durch (Tt f )(x) = f (x + t) f¨ erkl¨ art. Zeige, daß (Tt )t≥0 eine C0 -Halbgruppe auf X ist, und bestimme ihren Erzeuger sowie ihre Wachstumsschranke. Aufgabe VII.5.29 Sei X = R2 mit der Summennorm, A(x1 , x2 ) = (x2 , 0) und Tt = etA . Bestimme die Wachstumsschranke von (Tt ). Wird das Infimum in (VII.25) angenommen? Aufgabe VII.5.30 Seien S, T ∈ L(X) kommutierende Operatoren. Dann gilt eS+T = eS eT . Aufgabe VII.5.31 Betrachte die Operatoren Af = f und Bf = f − f jeweils mit dem Definitionsbereich W 3 (R) ⊂ L2 (R). Dann erzeugt A eine C0 Halbgruppe, B jedoch nicht. (Tip: Fouriertransformation!)
382
VII.
Spektralzerlegung selbstadjungierter Operatoren
Aufgabe VII.5.32 Sei A: X ⊃ dom(A) → X ein dicht definierter Operator mit ρ(A) = ∅. Dann ist A abgeschlossen. Aufgabe VII.5.33 Sei A: X ⊃ dom(A) → X ein dicht definierter dissipativer Operator mit (0, ∞) ∩ ρ(A) = ∅. Dann gilt ∀x ∈ dom(A) ∀x ∈ J(x)
Re x (Ax) ≤ 0.
Aufgabe VII.5.34 Ein Operator A: X ⊃ dom(A) → X heißt abschließbar, falls A eine abgeschlossene Erweiterung besitzt. (a) A ist genau dann abschließbar, wenn aus xn → 0, (Axn ) Cauchyfolge auch Axn → 0 folgt. (b) Ist A abschließbar, so ist der Abschluß des Graphen gr(A) ⊂ X ⊕ X der Graph eines abgeschlossenen Operators A. A heißt die Abschließung von A und ist offenbar die kleinste abgeschlossene Erweiterung von A. (c) Gib ein Beispiel eines nicht abschließbaren Operators. Aufgabe VII.5.35 Ein determinierender oder wesentlicher Bereich (engl. core) eines dicht definierten abgeschlossenen Operators A: X ⊃ dom(A) → X ist ein Untervektorraum D ⊂ dom(A), der bzgl. der Graphennorm xA = x + Ax dicht in dom(A) liegt. Zeige, daß D genau dann ein determinierender Bereich f¨ ur A ist, wenn A die Abschließung von A|D ist. Ist λ ∈ ρ(A), trifft das genau dann zu, wenn (λ − A)(D) dicht in X liegt. Aufgabe VII.5.36 Sei A: X ⊃ dom(A) → X ein dicht definierter dissipativer Operator. (a) Dann ist A abschließbar, und A ist ebenfalls dissipativ. (b) Hat f¨ ur ein λ0 > 0 der Operator λ0 − A dichtes Bild, so ist λ0 − A surjektiv, und A ist der Erzeuger einer Kontraktionshalbgruppe. Aufgabe VII.5.37 Hat ein Banachraum einen strikt konvexen Dualraum (siehe Aufgabe I.4.13), so ist die Dualit¨ atsabbildung stets einelementig. Aufgabe VII.5.38 Sei X = C[0, 1] und Af = f mit dem Definitionsbereich dom(A) = {f ∈ C 2 [0, 1]: f (0) = f (1) = 0}. Dann erzeugt A eine Kontraktionshalbgruppe auf X. Aufgabe VII.5.39 (Operatorgruppen) aß (VII.16) (a) Sei A: H ⊃ dom(A) → H selbstadjungiert. Sei Tt := eitA gem¨ aren Operatoren, d.h. es definiert. Dann ist (Tt )t∈R eine Gruppe von unit¨ ur s, t ∈ R, f¨ ur die ist Ts+t = Ts Tt f¨ lim Tt x = x
t→0
∀x ∈ H
gilt. (Wegen dieser Eigenschaft nennt man (Tt ) wieder stark stetig.) Ferner ist Tt x − x = iAx ∀x ∈ dom(A). lim t→0 t (Tip: Analysiere zuerst den Fall A = Mf .)
VII.6
383
Bemerkungen und Ausblicke
(b) Ist A ein stetiger selbstadjungierter Operator, so gilt sogar lim Tt − Id = 0.
t→0
d auf S (R) (siehe Aufga(c) Sei A die selbstadjungierte Erweiterung von i dt be VII.5.22). Was sind in diesem Fall die Tt ? (d) (Satz von Stone) Jede stark stetige Gruppe unit¨ arer Operatoren kann als {eitA : t ∈ R} mit einem selbstadjungierten Operator A geschrieben werden; man nennt h¨ aufig A – statt iA – den Erzeuger der Operatorgruppe. Zeige diesen Satz mit Hilfe des Satzes von Lumer-Phillips.
VII.6
Bemerkungen und Ausblicke
Das Kernst¨ uck der in den vorangegangenen Kapiteln bereits erw¨ahnten 4. Mitteilung von Hilbert aus dem Jahre 1906 ist sein Beweis des Spektralsatzes f¨ ur beschr¨ ankte selbstadjungierte Operatoren (bzw. in seiner Sprache f¨ ur beschr¨ ankte symmetrische Bilinearformen). Die Tatsache, daß im Fall beschr¨ ankter Operatoren außer einer Reihendarstellung noch ein Integral auftaucht, war ein vollkommen unvorhergesehenes Ph¨anomen. Hilberts Darstellung sieht freilich von der heutigen verschieden aus; statt eines Spektralmaßes erscheint bei ihm ein Stieltjes-Integral, wobei man sich in Erinnerung rufen muß, daß Stieltjes sein Integral erst 1894 im Rahmen seiner Untersuchung von Kettenbr¨ uchen einf¨ uhrte. In der Zeit nach Hilbert wurden Beweise des Spektralsatzes f¨ ur beschr¨ ankte und unbeschr¨ankte Operatoren von Riesz (Acta. Sci. Math. Szeged 5 (1930–1932) 23–54), Lengyel und Stone (Ann. Math. 37 (1936) 853–864) und anderen gegeben; eine ersch¨opfende Liste von Literaturverweisen findet man in Dunford/Schwartz [1963], S. 927. Dar¨ uber hinaus erw¨ ahnen wir den Beweis von Leinfelder (Math. Ann. 242 (1979) 85–96) im unbeschr¨ ankten Fall. Der im Text gegebene Beweis des Spektralsatzes orientiert sich stark an Reed/Simon [1980]. Ein wesentlicher Teil dieses Beweises war der Entwicklung des Funktionalkalk¨ uls gewidmet. Die Essenz des Satzes VII.1.3 ist, daß die Algebra C(σ(T )) in allen Strukturen zur von Id und dem selbstadjungierten Operator T ∈ L(H) erzeugten abgeschlossenen Unteralgebra von L(H) isomorph ist. Eine sehr elegante Methode, dieses Resultat sogar gleich f¨ ur normale Operatoren zu zeigen, stellt die Theorie der Banachalgebren bereit; siehe Korollar IX.3.8. Die Theorie der unbeschr¨ ankten Operatoren ist das Werk J. von Neumanns (Math. Ann. 102 (1929) 49–131) sowie, kurz darauf und weitgehend unabh¨ angig von diesem, M. H. Stones (Stone [1932]). (Es sei daran erinnert, daß erst in diesen Arbeiten Hilbertr¨ aume abstrakt definiert wurden.) Als Vorarbeiten hierzu sind Weyls Untersuchungen u ¨ ber Eigenfunktionen von Randwertproblemen (1910) und Carlemans Studien singul¨arer Integraloperatoren (1923) zu nennen. Von Neumann ist es, der als erster die Notwen-
384
VII.
Spektralzerlegung selbstadjungierter Operatoren
digkeit erkennt, zwischen symmetrischen und selbstadjungierten Operatoren zu unterscheiden, da sich nur letztere spektral zerlegen lassen. In seiner Nomenklatur heißen die symmetrischen Operatoren hermitesch, und von Neumann stellt zun¨ achst fest, daß infolge einer willk¨ urlichen Einengung ” des Definitionsbereiches“ (a.a.O., S. 57) die Forderung der Symmetrie zu schwach ist. Es ist wichtig, daß der Operator maximal hermitesch ist, d.h. keine symmetrische Erweiterung zul¨ aßt. Aber auch das ist noch nicht hinreichend. Um den Spektralsatz zu beweisen, braucht man die Selbstadjungiertheit des Operators, die von von Neumann auf Anregung Schmidts (a.a.O., S. 62) unter dem Namen Hypermaximalit¨at definiert wird. (Gl¨ ucklicherweise hat sich der von Stone gepr¨ agte Begriff selbstadjungiert gegen¨ uber der eher an die Werbebranche erinnernden Bezeichnung hypermaximal“ ” durchgesetzt.) Mit Hilfe der Cayley-Transformation f¨ uhrt von Neumann den Spektralsatz f¨ ur unbeschr¨ ankte selbstadjungierte Operatoren auf den Spektralsatz f¨ ur beschr¨ ankte unit¨ are Operatoren zur¨ uck. Die Cayley-Transformation gestattet es von Neumann ebenfalls, die nicht selbstadjungierten maximal hermiteschen Operatoren zu untersuchen. Der Zusammenhang zwischen einem symmetrischen Operator T und seiner Cayley-Transformierten UT = (T + i)(T − i)−1 ist der: Zun¨ achst ist T dann und nur dann abgeschlossen, es ist, und in diesem Fall sind sowohl dom(U wenn U T T ) = ran(T − i) = ker(T ∗ + i) ⊥ als auch ran(UT ) = ran(T + i) = ker(T ∗ − i) ⊥ abgeschlossene Teilr¨aume. UT ist stets isometrisch und genau dann unit¨ar, wenn T selbstadjungiert ist. Umgekehrt existiert zu jedem auf einem Teilraum von H definierten isometrischen Operator V , f¨ ur den V − Id dichtes Bild hat, genau ein dicht definierter symmetrischer Operator T mit V = UT . Da T ⊂S¨ aquivalent zu UT ⊂ US ist, ist Satz VII.2.10 vor diesem Hintergrund evident, und die maximal hermiteschen nicht selbstadjungierten Operatoren sind dadurch gekennzeichnet, daß genau ein Defektindex = 0 ist. Ferner kann gezeigt werden, daß der Operator, dessen Cayley-Transformierte unit¨ ar ¨ aquivalent zum Shift (s1 , s2 , . . .) → (0, s1 , s2 , . . .) auf 2 ist, der Archetyp solcher Operatoren ist. (In Beispiel VII.2(c) haben wir einen Differentialoperator mit den Defektindizes 0 und 1 kennengelernt.) Satz VII.2.11 wurde von Friedrichs (1934) und Stone (1932) gezeigt, der Beweis im Text folgt der Methode von Friedrichs (Math. Ann. 109 (1934) 465–487). Vorher hatte von Neumann eine etwas schw¨achere Form dieses Satzes bewiesen, n¨ amlich: Ist T halbbeschr¨ankt mit T x, x ≥ C x 2 , so existiert f¨ ur jedes c < C eine selbstadjungierte Erweiterung Sc mit Sc x, x ≥ c x 2 . Sein Beweis ist in der 1. Auflage dieses Buchs zu finden. In zwei weiteren Arbeiten (Math. Ann. 102 (1929) 370–427, Ann. Math. 33 (1932) 294–310) erweitert von Neumann seine Resultate auf unbeschr¨ankte normale Operatoren. (Den Fall beschr¨ ankter normaler Operatoren hatte er im Anhang seiner Arbeit von 1929 erledigt.) Auch im unbeschr¨ankten
VII.6
385
Bemerkungen und Ausblicke
Fall heißt ein Operator normal, wenn T ∗ T = T T ∗ gilt, nur muß man jetzt auf die Definitionsbereiche achtgeben; der Definitionsbereich f¨ ur eine Komposition ST ist dabei als {x ∈ dom(T ): T x ∈ dom(S)} erkl¨art. Außerdem zeigt er, daß f¨ ur einen dicht definierten abgeschlossenen Operator T die Komposition T ∗ T stets selbstadjungiert ist (Korollar VII.2.13). Nach Aufgabe VII.5.13(a) besteht das Problem, eine selbstadjungierte Erweiterung eines symmetrischen Operators T zu finden, darin, dom(T ∗ ) passend einzuschr¨ anken. Falls T ein Differentialoperator ist, f¨ uhrt das dazu, T ∗ passenden Randbedingungen zu unterwerfen. F¨ ur den Fall gew¨ohnlicher Differentialoperatoren wird dieser Problemkreis vollst¨andig von der WeylKodaira-Theorie behandelt, siehe Dunford/Schwartz [1963], Kapitel XIII. Insbesondere liefert diese Theorie die Entwicklung nach Eigenfunktionen eines Differentialoperators in gr¨ oßter Allgemeinheit (a.a.O., S. 1330–1333). Wir wollen noch auf den Zusammenhang zwischen Spektralmaßen und der a ¨lteren Variante, Spektralintegrale als Stieltjes-Integrale nach Spek” tralscharen“ aufzufassen, eingehen. Eine Funktion λ → E(λ) von R nach L(H) heißt eine Spektralschar, wenn sie folgende Eigenschaften besitzt: (a) E(λ) ist stets eine Orthogonalprojektion. (b) E(·) ist monoton wachsend, d.h. λ ≤ μ ⇒ E(λ) ≤ E(μ). (c) lim E(λ)x = x, lim E(λ)x = 0 ∀x ∈ H. λ→∞
λ→−∞
(d) E(·) ist rechtsseitig stetig in der Topologie der punktweisen Konvergenz, d.h. lim E(λ + ε)x = E(λ)x
ε→0+
∀x ∈ H.
(e) E(·) hat kompakten Tr¨ ager, wenn m und M existieren mit E(λ) = 0 f¨ ur λ < m, E(λ) = Id f¨ ur λ ≥ M. Ist E(·) eine Spektralschar und f : R → C eine stetige Funktion, so kann man f (λ) dE(λ)x, x als (Riemann-)Stieltjes-Integral definieren, d.h. als Limes von Riemannsummen ni=1 f (ξi ) E(ti+1 )x, x − E(ti )x, x . Der Spektralsatz behauptet dann eine eineindeutige Zuordnung zwischen selbstadjungierten [beschr¨ ankten] Operatoren und Spektralscharen [mit kompaktem Tr¨ ager]. Ist E ein Spektralmaß, so definiert λ → E(−∞,λ] eine Spektralschar, und die entsprechenden Integrale stimmen u ¨ berein. Umgekehrt lehrt die Maßtheorie, daß jede Spektralschar ein Spektralmaß induziert, so daß beide Formen des Spektralsatzes ¨ aquivalent sind. Die Spektralmaßversion des Spektralsatzes wurde offenbar zuerst von Halmos [1951] dargestellt. Eine Spektralschar braucht nicht linksseitig stetig zu sein; sie ist bei λ genau dann linksseitig stetig (und daher stetig), wenn (in unserer Darstellung) E{λ} = 0 ist. Damit lautet Satz VII.1.18 λ ∈ ρ(T ) ⇐⇒ E(·) in einer Umgebung von λ konstant,
386
VII.
Spektralzerlegung selbstadjungierter Operatoren
λ ∈ σp (T ) ⇐⇒ E(·) bei λ unstetig, λ ∈ σc (T ) ⇐⇒ E(·) bei λ stetig, aber nicht konstant. An einem Punkt des stetigen Spektrums w¨ achst die Spektralschar also stetig! F¨ ur manche Anwendungen in der mathematischen Physik ist eine andere Aufspaltung des Spektrums als in Definition VI.1.1 n¨ utzlich. Sei T ein (eventuell unbeschr¨ ankter) selbstadjungierter Operator in einem Hilbertraum H und E sein Spektralmaß. Wir betrachten zu x ∈ H die positiven Borelmaße A → μx (A) := EA x, x. Es folgt aus Satz VII.1.18, daß μx eine Summe von Diracmaßen ist, wenn x eine Linearkombination von Eigenvektoren von T ist. Steht x senkrecht auf der linearen H¨ ulle aller Eigenvektoren, ur alle t ∈ R, so daß also t → μx ((−∞, t]) eine stetige so ist μx ({t}) = 0 f¨ Funktion ist; in diesem Fall wollen wir μx selbst stetig nennen. Ist μx stetig, so lehrt die Maßtheorie, daß μx = μx,ac + μx,sing mit einem Maß μx,ac , das bzgl. des Lebesguemaßes λ absolutstetig ist, und einem stetigen Maß ar ist, geschrieben werden kann. μx,sing , das bzgl. des Lebesguemaßes singul¨ (Ein positives Maß μ heißt absolutstetig, wenn λ(N ) = 0 ⇒ μ(N ) = 0 f¨ ur alle Borelmengen gilt, und es heißt singul¨ ar, wenn eine Borelmenge N mit λ(N ) = 0, μ(N ) = 0 existiert.) Es sei Hac = {x ∈ H: μx ist absolutstetig} und Hsing = {x ∈ H: μx ist singul¨ ar, aber stetig}. Dies sind abgeschlossene Unterr¨ aume von H, und es gilt T (Hac ) ⊂ Hac sowie T (Hsing ) ⊂ Hsing . Man nennt das Spektrum der Restriktion T : Hac → Hac das absolutstetige Spektrum σac (T ) und das Spektrum der Restriktion T : Hsing → Hsing das singul¨ar-stetige Spektrum σsing (T ). Es gilt σ(T ) = σp (T )∪σac (T )∪σsing (T ); jedoch braucht diese Zerlegung nicht disjunkt zu sein, da es vorkommen kann, daß σac (T ) ∪ σsing (T ) Eigenwerte von T enth¨alt. Das singul¨ar-stetige Spektrum ist der Anteil, der die meisten Komplikationen in sich birgt, und in vielen konkreten F¨ allen gilt in der Tat σsing (T ) = ∅. Um so u ¨berraschender ist ein k¨ urzlich erschienenes Resultat von Simon, daß die mei” sten“ (im Baireschen Kategoriensinn) selbstadjungierten Operatoren rein singul¨ ar-stetiges Spektrum haben, d.h. H = Hsing (Ann. Math. 141 (1995) 131–145). Von Neumanns Studien waren zum großen Teil motiviert von der mathematischen Physik, n¨ amlich der sich in den zwanziger Jahren rasant entwickelnden Quantenmechanik eine ad¨ aquate mathematische Formulierung zu geben. Dies kann in der Tat mit Hilfe der Theorie der selbstadjungierten Operatoren in Hilbertr¨ aumen erreicht werden, was jetzt kurz skizziert werden soll. (Dazu siehe etwa Triebel [1972], Kapitel VII, und nat¨ urlich von Neumanns klassische Monographie Die mathematischen Grundlagen der Quantenmechanik aus dem Jahre 19325 .) Ein Zustand eines quantenmechanischen Systems wird durch einen normierten Vektor eines Hilbertraums 5 Ein
Nachdruck erschien 1996 im Springer-Verlag.
VII.6
387
Bemerkungen und Ausblicke
beschrieben; dabei sollen die Zust¨ ande ϕ und λϕ (wo |λ| = 1) identisch sein. Physikalische Gr¨ oßen werden durch selbstadjungierte Operatoren (Observable) ausgedr¨ uckt. Beim Wasserstoffatom (ohne Spin, nichtrelativistisch) betrachtet manH = L2 (R3 ), die x-Koordinate des Orts wird durch den Operator ϕ → (x, y, z) → xϕ(x, y, z) beschrieben, die x-Koordinate des Impulses durch ϕ → i ∂ϕ ∂x etc. Auf diese Funktionsvorschriften kommt man ¨ durch physikalische Uberlegungen; daß die entstehenden Operatoren (auf dem richtigen Definitionsbereich!) selbstadjungiert sein sollen, hat mathematische Gr¨ unde. Die Messung einer physikalischen Gr¨ oße in einem Zustand ϕ ist dann mathematisch folgendes: Sei T = λ dE λ die Spektralzerlegung der Obser vablen T . Die Zahl A dEλ ϕ, ϕ wird dann als Wahrscheinlichkeit daf¨ ur interpretiert, daß der Meßwert von T im Zustand ϕ in der Menge A liegt. In Analogie zu Satz VII.1.18 ist diese Wahrscheinlichkeit im Fall A = {λ0 } genau dann positiv, wenn λ0 Eigenwert von T ist. Daher sind genau die Eigenwerte von T einer scharfen Messung zug¨ anglich. Da der Ortsoperator keinen Eigenwert, sondern nur das stetige Spektrum σ(T ) = σc (T ) = R hat (vgl. Beispiel VII.2(h)), kann der Ort eines Teilchens nicht scharf gemessen werden. Die Energie und damit die zeitliche Entwicklung des Systems werden durch den Hamiltonoperator H ausgedr¨ uckt. Im Fall des Wasserstoffatoms ist das (bis auf physikalische Konstanten) der Operator 1 H ϕ = −Δϕ − ϕ r
(wo r = (x2 + y 2 + z 2 )1/2 )
auf dom(H ) = W 2 (R3 ) ⊂ L2 (R3 ), dem Sobolevraum der Ordnung 2. (Ableitungen sind hier im schwachen Sinn, Definition V.1.11, zu verstehen.) H besitzt die Eigenwerte (−R/n2 )n∈N (R > 0 eine Konstante) sowie das stetige Spektrum [0, ∞). Die zeitliche Entwicklung eines quantenmechanischen Systems wird mit Hilfe der Schr¨odingergleichung i
d ϕ(t) = H ϕ(t) , dt
ϕ(0) = ϕ0 ∈ dom(H )
beschrieben. Die L¨ osung dieser Gleichung kann in der Form ϕ(t) = e−itH ϕ0 angegeben werden. Station¨are Zust¨ande, d.h. solche, die sich zeitlich nicht andern, sind die Eigenfunktionen von H . Das Wasserstoffatom besitzt sta¨ tion¨ are Zust¨ ande zu den Energieniveaus En = −R/n2 , n ∈ N, wie eben ¨ berichtet wurde. Das Bohrsche Postulat fordert, daß beim Ubergang vom Energieniveau En zum Energieniveau Em , m > n, elektromagnetische Wellen der Frequenz νn,m = h1 (En − Em ) (h = Plancksches Wirkungsquantum)
388
VII.
Spektralzerlegung selbstadjungierter Operatoren
ausgesandt werden. Das liefert (zumindest im Fall n = 2) sichtbare Spektrallinien. Hier kann man das Spektrum eines Operators wirklich sehen! Als Hilbert 1906 den Begriff des Spektrums pr¨ agte, konnte er nicht ahnen, wie eng sein Spektrum mit dem physikalischen Spektrum verwandt ist. Wir haben oben die Selbstadjungiertheit des Hamiltonoperators H = −Δ − MV , wo V der Multiplikationsoperator mit dem Coulombpotential 1r ist, auf W 2 (R3 ) erw¨ ahnt. Da nach Beispiel VII.2(d) −Δ auf W 2 (R3 ) selbstadjungiert ist, k¨ onnen wir die Selbstadjungiertheit von H so ausdr¨ ucken, daß die St¨ orung von −Δ durch MV an dessen Selbstadjungiertheit nichts andert, also in gewisser Weise klein“ ist. Solche Ph¨anomene werden syste¨ ” matisch in der St¨ orungstheorie linearer Operatoren untersucht. Das erste Resultat in dieser Richtung geht auf Rellich (1939) zur¨ uck; es wurde von Kato verallgemeinert. Der St¨orungssatz von Rellich besagt folgendes. • Sei T : H ⊃ dom(T ) → H selbstadjungiert und S ein symmetrischer Operator mit dom(S) ⊃ dom(T ). Es sollen 0 < a < 1, b ∈ R mit Sx ≤ a T x + b x
∀x ∈ dom(T )
existieren. Dann ist T + S auf dom(T ) selbstadjungiert. Ist T nur wesentlich selbstadjungiert, so ist auch T + S wesentlich selbstadjungiert. Hier ist die Voraussetzung a < 1 wesentlich; die Existenz irgendeines a ∈ R wird vom Satz vom abgeschlossenen Graphen impliziert. Man kann zeigen, daß die obige Situation im Fall T = −Δ, dom(T ) = W 2 (R3 ) und S = MV vorliegt, wenn V ein Potential ist, das sich als V = V2 +V∞ mit V2 ∈ L2 (R3 ), aßt. (Offenbar ist das Coulombpotential von dieser V∞ ∈ L∞ (R3 ) schreiben l¨ Gestalt, denn mit B = Einheitskugel von R3 gilt 1r = χB r1 + (1 − χB ) 1r ∈ L2 + L∞ .) Zu diesem Themenkomplex vgl. Reed/Simon [1975], Kapitel X, oder Triebel [1972], Kapitel VII; die Selbstadjungiertheit komplizierterer quantenmechanischer Operatoren wurde erstmals von Kato (Trans. Amer. Math. Soc. 70 (1951) 195–211) bewiesen. Abschließend soll kurz der Fall von Operatoren auf Banachr¨aumen zur Sprache kommen. Auch hier gibt es Klassen von Operatoren, die wie selbstadjungierte Operatoren auf Hilbertr¨ aumen spektral zerlegt werden k¨onnen; Dunford/Schwartz [1971] besch¨ aftigen sich intensiv mit dieser Problematik. F¨ ur einen beliebigen Operator auf einem komplexen Banachraum kann man mit Mitteln der Funktionentheorie einen Funktionalkalk¨ ul f¨ ur analytische Funktionen aufbauen. Der einfachste Fall eines solchen symbolischen Kalk¨ uls ist in Aufgabe VII.5.4 beschrieben; wesentlich weitgehendere Resultate erh¨ alt man jedoch, wenn man den Cauchyschen Integralsatz benutzt. Diese Idee geht auf F. Riesz (1913) zur¨ uck und wurde von N. Dunford (1943) in gr¨ oßerer Allgemeinheit ausgef¨ uhrt. Sei T ∈ L(X). Man bezeichne mit O(T ) die Menge der in einer offenen Umgebung von σ(T ) definierten analytischen komplexwertigen Funktionen. Der Definitionsbereich Uf
VII.6
Bemerkungen und Ausblicke
389
von f ∈ O(T ) variiert mit f und braucht nicht zusammenh¨angend zu sein – das Spektrum kann schließlich eine beliebige kompakte Teilmenge von C bilden –, und der Definitionsbereich von f + g bzw. f g ist nat¨ urlich Uf ∩ Ug . Ist Uf nicht zusammenh¨ angend, so wird der Analytizit¨atsbegriff u ¨ brigens lokal verstanden: Jeder Punkt besitzt eine Umgebung, auf der f im elementaren Sinn analytisch ist. F¨ ur eine Funktion f ∈ O(T ) l¨aßt sich nun mit Hilfe eines Umlaufintegrals ein Operator f (T ) definieren. Dazu sei Γ ⊂ Uf \ σ(T ) eine endliche Vereinigung geschlossener Kurven (ein Zy” kel“), so daß die Umlaufzahl von Γ um jeden Punkt von σ(T ) gleich +1 ist ( Γ umrundet σ(T ) genau einmal im positiven Sinn“). Solche Zykeln ” existieren stets, k¨ onnen jedoch beliebig kompliziert aussehen, insbesondere, wenn σ(T ) unzusammenh¨ angend ist. Man setze nun 5 1 f (λ)Rλ (T ) dλ. f (T ) := 2πi Γ So ein operatorwertiges Integral definiert man genau wie in der Funktionentheorie, und offensichtlich stand die Cauchysche Integralformel Pate bei der Definition von f (T ). Man kann zeigen, daß f (T ) nicht von der speziellen Wahl von Γ abh¨ angt und daß die u ¨blichen Eigenschaften eines Funktionalkalk¨ uls gelten: • • • • •
ur f (z) = z n , f (T ) = Id f¨ ur f = 1, f (T ) = T n f¨ (f + g)(T ) = f (T ) + g(T ) ∀f, g ∈ O(T ), (fg)(T ) = f (T )g(T) ∀f, g ∈ O(T ), σ f (T ) = f σ(T ) ∀f ∈ O(T ), (f ◦ g)(T ) = f g(T ) ∀g ∈ O(T ), f ∈ O g(T ) .
Insbesondere sind Wurzeln oder der Logarithmus eines Operators erkl¨art, wenn σ(T ) etwa in der geschlitzten Ebene C \ {z: Im z = 0, Re z ≤ 0} liegt. F¨ ur einen selbstadjungierten Operator kann man zu jeder abgeschlossenen Teilmenge A des Spektrums eine Projektion assoziieren; das gelingt im allgemeinen Fall nicht mehr, wohl aber, wenn σ(T ) \ A ebenfalls abgeschlossen ist. (Außer ∅ und σ(T ) gibt es solche A nur, wenn σ(T ) nicht zusammenh¨ angend ist.) In diesem Fall betrachte eine Funktion f , die auf einer Umgebung von A den Wert 1 und auf einer Umgebung von σ(T ) \ A den Wert 0 annimmt. Da dann f 2 = f ist, ist auch f (T )2 = f (T ); also ist f (T ) eine Projektion, die im u ¨brigen mit T kommutiert. Besonders wichtig ist der Fall eines isolierten Punkts λ0 des Spektrums. Die zugeh¨orige Spektralprojektion kann nun durch 5 1 P = Rλ (T ) dλ 2πi γ definiert werden, wo γ ein hinreichend kleiner positiv orientierter Kreis um λ0 ist. Die Resolventenabbildung besitzt jetzt bei λ0 eine isolierte Singularit¨ at, die wie in der Funktionentheorie durch die Laurentreihe als Pol
390
VII.
Spektralzerlegung selbstadjungierter Operatoren
oder als wesentliche Singularit¨ at klassifiziert werden kann. Falls es sich um einen Pol der Ordnung p handelt, ist λ0 ein Eigenwert, und ran(P ) ist der Hauptraum ker(λ0 − T )p zum Eigenwert λ0 , im Fall eines einfachen Pols also der Eigenraum. Diese Resultate kann man z.B. bei Conway [1985], Dunford/Schwartz [1958] oder Heuser [1992] nachlesen. Im Unterschied zu Satz VII.1.24 ist die Idealstruktur von L(X) im Fall separabler Banachr¨ aume i.a. recht kompliziert. Nur f¨ ur X = p , 1 ≤ p < ∞, oder X = c0 weiß man, daß K(X) das einzige nichttriviale zweiseitige abgeschlossene Ideal in L(X) ist (siehe Pietsch [1980], Abschnitt 5); die abgeschlossenen zweiseitigen Ideale von L(H) im nichtseparablen Fall wurden von Gramsch (J. Reine Angew. Math. 225 (1967) 97–115) und Luft (Czechoslovak. Math. J. 18 (1967) 595–605) vollst¨andig beschrieben. ¨ Zum Spektralsatz sind die Ubersichtsartikel von Halmos (Amer. Math. Monthly 70 (1963) 241–247) und Steen (Amer. Math. Monthly 80 (1973) 359–381) erw¨ ahnenswert, zu von Neumann siehe Halmos’ Artikel in Amer. Math. Monthly 80 (1973) 382–394. Das fundamentale Theorem VII.4.11 u ¨ber die Charakterisierung der Erzeuger von Kontraktionshalbgruppen wurde 1948 unabh¨angig und fast gleichzeitig von Yosida (J. Math. Soc. Japan 1 (1948) 15–21) und Hille (in der von ihm allein verfaßten 1. Auflage von Hille/Phillips [1957]) bewiesen. Der Beweis im Text beschreibt den Zugang von Yosida, w¨ahrend Hilles Beweis von der Formel eta = 1/e−ta = limn→∞ (1 − ta/n)−n ausgeht. Diesen Term kann man n¨ amlich auch f¨ ur einen unbeschr¨ankten Operator A als Potenz der Resolvente [(Id − nt A)−1 ]n interpretieren und auf Konvergenz untersuchen; hingegen ergeben die naheliegenden Kandidaten ur unbeschr¨ankte Operatoren i.a. keilimn (Id + nt A)n und n tn An /n! f¨ nen Sinn. Kurze Zeit darauf erhielten 1952 – wiederum unabh¨angig und fast gleichzeitig – Feller, Miyadera und Phillips die allgemeine Version des Theorems VII.4.13, das in der Literatur gelegentlich Satz von Hille-YosidaPhillips genannt wird. Lumer und Phillips bewiesen Theorem VII.4.16 in Pac. J. Math. 11 (1961) 679–698; der Satz von Stone u ¨ber unit¨are Operatorgruppen (Aufgabe VII.5.39) wurde erstmals in Stone [1932] gezeigt. Operatorhalbgruppen finden u.a. in der Wahrscheinlichkeitstheorie Anwendung (dazu siehe z.B. Lamperti [1977]), in der mathematischen Physik (Reed/Simon [1975]) und bei den partiellen Differentialgleichungen (Pazy [1983]). Detaillierte Darstellungen der Halbgruppentheorie findet man bei Davies [1980], Engel/Nagel [1999], Goldstein [1985], Pazy [1983] und nat¨ urlich in der klassischen Quelle Hille/Phillips [1957]. Viele in den Anwendungen vorkommende Halbgruppen (Tt ) besitzen die Zusatzeigenschaft, zu einer in einem Sektor Σ0α = Σα ∪ {0} = {z ∈ C: |arg(z)| < α} ∪ {0} der komplexen Ebene definierten Halbgruppe (Tz ) ausgedehnt werden zu k¨ onnen, so daß z → Tz x eine banachraumwertige analytische Funktion im offenen Sektor Σα ist. Dabei nimmt die starke Stetigkeit
VII.6
391
Bemerkungen und Ausblicke
bei z = 0 die Form limz→0 Tz x = x an, wo die z in einem Teilsektor Σ0β , ussen. Solche Halbgruppen werden analytische β < α, von Σ0α bleiben m¨ Halbgruppen genannt und ihre Erzeuger sektorielle Operatoren. In diesem Kontext gilt folgender Satz vom Hille-Yosida-Typ: • Ein dicht definierter abgeschlossener Operator A erzeugt genau dann eine analytische Halbgruppe (Tz )z∈Σ0α , die in allen Teilsekur toren Σ0β , β < α, beschr¨ankt bleibt, wenn Σα+π/2 ⊂ ρ(A) und f¨ alle β < α eine Konstante Cβ existiert mit λ(λ − A)−1 ≤ Cβ
∀λ ∈ Σβ+π/2 .
Zum Beispiel erzeugt der Laplaceoperator eine analytische Halbgruppe auf Lp (Rd ) mit dem Winkel α = π/2. Eine interessante Eigenschaft analytischer Halbgruppen ist, daß Tt x ∈ dom(A) f¨ ur alle x ∈ X und nicht nur f¨ ur x ∈ dom(A); entsprechend ist das Cauchyproblem (VII.31) sogar f¨ ur alle osbar mit L¨ osung u(t) = Tt x0 in C([0, ∞), X) ∩ C ∞ ((0, ∞), X). x0 ∈ X l¨ Bei der Diskussion eines Cauchyproblems ist man nat¨ urlich nicht nur an der L¨ osbarkeit schlechthin interessiert, sondern auch an den Eigenschaften der L¨ osung, z.B. an deren asymptotischem Verhalten. Im Endlichdimensionalen gilt f¨ ur jede L¨ osung von u = Au bekanntlich u(t) → 0 mit t → ∞, wenn s0 := sup{Re λ: λ ∈ σ(A)}, die Spektralschranke von A, negativ ist; genauer ist hier die Wachstumsschranke ω0 gleich der Spektralschranke. ur jede analytische HalbIm unendlichdimensionalen Fall gilt ω0 = s0 z.B. f¨ gruppe und f¨ ur positive Halbgruppen auf Lp (Weis, Proc. Amer. Math. Soc. 123 (1995) 3089–3094 oder Proc. Amer. Math. Soc. 126 (1998) 3253–3256), aber nicht immer. (Ein Operator T auf einem Funktionenraum heißt positiv im Sinn von positivit¨ atserhaltend“, wenn f ≥ 0 ⇒ T f ≥ 0.) Damit eng ” verwandt ist der spektrale Abbildungssatz f¨ ur Halbgruppen. ur die t → Tt auf • Ist (Tt ) eine C0 -Halbgruppe mit Erzeuger A, f¨ einem Intervall [t0 , ∞) normstetig ist (z.B. eine analytische Halbgruppe), so gilt etσ(A) := {etλ : λ ∈ σ(A)} = σ(Tt ) \ {0}. In diesem Fall folgt ω0 = s0 . Eine andere hinreichende Voraussetzung f¨ ur die G¨ ultigkeit des spektralen Abbildungssatzes ist, daß f¨ ur t ≥ t0 alle Tt kompakt sind. Ohne weitere Voraussetzungen gelten aber nur etσ(A) ⊂ σ(Tt ) \ {0} und ω0 ≥ s0 , selbst wenn die Tt positive Operatoren auf einem Funktionenraum sind. Arendt (Diff. Int. Eq. 7 (1994) 1153–1168) gibt daf¨ ur folgendes einfache Beispiel: Sei X = Lp (1, ∞) ∩ Lr (1, ∞), wo 1 ≤ p < r < ∞, mit der Norm f = max{ f p, f r } und Tt f (x) = f (xet ). Dann ist (Af )(x) = xf (x) und s0 = −1/p < −1/r = ω0 . Im u ¨ brigen liefert der Satz von Datko-Pazy ein wichtiges Kriterium f¨ ur die Stabilit¨ at der L¨ osung (Pazy [1983], S. 116):
392
VII.
Spektralzerlegung selbstadjungierter Operatoren
• Es gilt ω0 < 0 genau dann, wenn f¨ ur ein p ≥ 1 ∞ Tt x p dt < ∞ ∀x ∈ X. 0
Eine wichtige Frage u ¨ber Erzeuger von Operatorhalbgruppen lautet: Wenn A eine C0 -Halbgruppe erzeugt und B ein weiterer Operator ist, ist dann auch A + B ein Erzeuger? Wenn B beschr¨ankt ist, trifft das zu. F¨ ur Kontraktionshalbgruppen gilt das folgende Kriterium: • Sei A der Erzeuger einer Kontraktionshalbgruppe. Ferner sei B ein dissipativer Operator mit dom(B) ⊃ dom(A), f¨ ur den Konstanten 0 ≤ a < 1 und b ≥ 0 mit Bx ≤ a Ax + b x
∀x ∈ dom(A)
existieren. Dann erzeugt auch A + B: X ⊃ dom(A) → X eine Kontraktionshalbgruppe. ¨ Die Ahnlichkeit dieses Resultats zum St¨ orungssatz von Rellich (siehe oben) ist frappant; in der Tat kann man den Rellichschen Satz aus diesem herleiten, wenn man A = ±iT und B = ±iS setzt. Manchmal kann man die von A + B erzeugte Halbgruppe explizit beschreiben, z.B. in der folgenden Trotter-Formel, die ein unendlichdimenur Matrizen sionales Analogon zu der auf Lie zur¨ uckgehenden Formel f¨ eA+B = limn→∞ (eA/n eB/n )n darstellt. • Es seien A, B und die Abschließung von A + B Erzeuger der Kontraktionshalbgruppen (St ), (Tt ) und (Ut ). (Der Definitionsbereich von A + B ist dom(A) ∩ dom(B).) Dann gilt lim (St/n Tt/n )n x = Ut x
n→∞
∀x ∈ X, t ≥ 0.
Ein u ¨ berraschender Aspekt der Halbgruppentheorie auf L∞ ist der Satz von Lotz (Math. Z. 190 (1985) 207–220), wonach jede C0 -Halbgruppe auf L∞ automatisch normstetig ist; mit anderen Worten ist jeder Erzeuger eiankt. Es ist u ner C0 -Halbgruppe hier automatisch beschr¨ ¨brigens nicht ganz einfach, u berhaupt einen dicht definierten abgeschlossenen unbeschr¨ankten ¨ Operator in L∞ zu definieren. Ein Beispiel erh¨alt man so: Nach Aufgabe II.5.14 existiert ein isometrischer Operator J: 2 → L1 (R). Der adjungierte Operator J : L∞ (R) → 2 ist dann eine Quotientenabbildung und insbesondere surjektiv. Setze dom(A) = {f ∈ L∞ (R): J f ∈ 1 } und A: unschten L∞ (R) ⊃ dom(A) → 1 , Af = J f ; dieser Operator hat die gew¨ Eigenschaften. Der Satz von Lotz gilt auch f¨ ur ∞ und den Banachraum ankten analytischen Funktionen im Einheitskreis. H ∞ aller beschr¨
Kapitel VIII
Lokalkonvexe R¨aume
VIII.1
Definition lokalkonvexer R¨ aume; Beispiele
Wir haben bislang Vektorr¨ aume betrachtet, worin auf sinnvolle Weise die Konvergenz einer Folge von Elementen durch eine (Halb-) Norm definiert war, z.B. die gleichm¨ aßige Konvergenz in C[0, 1] durch die Supremumsnorm. Das Konzept der punktweisen Konvergenz ordnet sich diesem System nicht unter. Man kann jedoch folgenden Standpunkt einnehmen: Setzt man f¨ ur t ∈ [0, 1] und eine Funktion x: [0, 1] → C pt (x) = |x(t)|, so bedeutet (xn ) konvergiert punktweise gegen 0“ nichts anderes als ” pt (xn ) → 0
∀t.
Die wesentliche Beobachtung ist nun, daß die pt Halbnormen sind und die punktweise Konvergenz nicht durch das Bestehen allein einer Halbnormkonvergenz, sondern das simultane Bestehen mehrerer Halbnormkonvergenzen ausgedr¨ uckt wird. Wir werden es daher im folgenden mit Vektorr¨aumen X und Familien von Halbnormen auf X (anstatt einer einzigen Norm) zu tun haben. Aus diesen Ingredienzien wird die Theorie der lokalkonvexen R¨aume aufgebaut, deren elementarer Teil in mancher Hinsicht parallel zur Theorie normierter R¨ aume verlaufen wird. Die Theorie lokalkonvexer R¨aume verlangt allerdings eine rudiment¨ are Kenntnis der Prinzipien (oder zumindest des Vokabulars) topologischer R¨ aume, die im Anhang B.2 dargestellt sind. Kommen wir nun zur Definition eines lokalkonvexen Vektorraums. X sei ein Vektorraum und P eine Menge von Halbnormen auf X, die einem
394
VIII.
Lokalkonvexe R¨ aume
ungeschriebenen Gesetz zufolge mit p bzw. pi bezeichnet werden. Sei nun F eine endliche Teilmenge von P und ε > 0. Setze UF,ε = {x ∈ X: p(x) ≤ ε ∀p ∈ F } sowie U = {UF,ε : F ⊂ P endlich, ε > 0}. Das System U ist das Substitut der Menge aller Kugeln {x: x ≤ ε} im normierten Fall. Es hat folgende Eigenschaften: (1) 0 ∈ U f¨ ur alle U ∈ U. (2) Zu U1 , U2 ∈ U existiert U ∈ U mit U ⊂ U1 ∩ U2 ( U ist abw¨arts ” filtrierend“), denn UF1 ∪F2 ,min(ε1 ,ε2 ) ⊂ UF1 ,ε1 ∩ UF2 ,ε2 . (3) Zu U ∈ U existiert V ∈ U mit1 V + V ⊂ U ; es gilt n¨amlich UF,ε/2 + UF,ε/2 ⊂ UF,ε . (4) Alle U ∈ U sind absorbierend (Definition III.2.1), denn x0 ∈ λUF,ε , falls λ > 1ε · maxp∈F p(x0 ). (5) Zu U ∈ U und λ > 0 existiert V ∈ U mit λV ⊂ U . Es gilt n¨amlich λUF,ε/λ ⊂ UF,ε , ja sogar =“. ” Wir ben¨ otigen folgende Definition. Definition VIII.1.1 (a) Eine Teilmenge A eines Vektorraums heißt kreisf¨ormig, falls {λ: |λ| ≤ 1} · A ⊂ A. (b) A heißt absolutkonvex, falls A konvex und kreisf¨ormig ist. Man zeigt leicht, daß A genau dann absolutkonvex ist, wenn x, y ∈ A, |λ| + |μ| ≤ 1 ⇒ λx + μy ∈ A ist. Speziell gilt f¨ ur unser System U: (6) Jedes U ∈ U ist kreisf¨ ormig. Sogar: (7) Jedes U ∈ U ist absolutkonvex. 1 Hier
wie im folgenden benutzen wir die suggestive Symbolik A + B = {a + b: a ∈ A, b ∈ B}, ΛA = {λa: λ ∈ Λ, a ∈ A}.
Achtung: i.a. ist A + A = 2A! (Beispiel?)
VIII.1
Definition lokalkonvexer R¨ aume; Beispiele
395
Wir werden sehen, daß man mit Hilfe der Eigenschaften (1)–(6) auf X eine Vektorraumtopologie definieren kann, bez¨ uglich derer die algebraischen Operationen Addition und Skalarmultiplikation stetig sind. Den entscheidenden Schritt, n¨ amlich den Satz von Hahn-Banach in verallgemeinerter Form zu zeigen, wird allerdings erst Eigenschaft (7) zulassen (dazu siehe Abschnitt VIII.2). Zun¨ achst sei nun U irgendein nichtleeres Mengensystem mit den Eigenschaften (1)–(6) (diese Eigenschaften sind teilweise redundant, z.B. folgt (1) aus (4)). Wir definieren dann folgendermaßen eine Topologie auf X: O ⊂ X offen ⇐⇒ ∀x ∈ O ∃U ∈ U x + U ⊂ O. Es ist noch zu verifizieren, daß in der Tat eine Topologie definiert wird: • ∅ und X sind offen (klar!). • Seien O1 und O2 offen und x ∈ O1 ∩O2 . Dann existieren U1 , U2 ∈ U ahle nach (2) U ∈ U mit U ⊂ U1 ∩ U2 , dann ist mit x + Ui ⊂ Oi . W¨ x + U ⊂ O1 ∩ O2 , und O1 ∩ O2 ist offen. • Seien Oi , i ∈ I, offen und x ∈ i∈I Oi , etwa x ∈ Oi0 . Dann existiert U ∈ U mit x + U ⊂ Oi0 ⊂ i∈I Oi , und i∈I Oi ist offen. Nach Konstruktion ist U eine Nullumgebungsbasis (d.h. jede Umgebung der Null umfaßt ein U ∈ U, und alle U ∈ U sind Nullumgebungen). Ferner sind konstruktionsgem¨ aß bei festem x ∈ X die Abbildungen y → x + y stetig, es sind sogar Hom¨oomorphismen, was definitionsgem¨aß bedeutet, daß auch die Umkehrabbildung (y → −x + y) stetig ist. Dar¨ uber hinaus gilt: Lemma VIII.1.2 In der oben beschriebenen Topologie sind (a) Addition: X × X → X, (x, y) → x + y, (b) Skalarmultiplikation: K × X → X, (λ, x) → λx, stetige Abbildungen. Dabei tragen X × X und K × X jeweils die Produkttopologie. Beweis. Sei O ⊂ X offen. Es ist zu zeigen: ˜ := {(x, y): x + y ∈ O} ist offen, (a) O := {(λ, x): λx ∈ O} ist offen. (b) O ˜ W¨ Zum Beweis von (a) sei (x, y) ∈ O. ahle U ∈ U mit x + y + U ⊂ O ˜ und deshalb und V gem¨ aß Eigenschaft (3). Dann ist (x + V ) × (y + V ) ⊂ O ˜ ˜ (x, y) ein innerer Punkt von O. Das zeigt die Offenheit von O. Zum Beweis von (b) sei (λ, x) ∈ O. W¨ ahle U ∈ U mit λx + U ⊂ O. Wir werden ε > 0 und W ∈ U mit {μ: |λ − μ| < ε} · (x + W ) − {λx} ⊂ U , angeben. W¨ahle zun¨achst V ∈ U d.h. {μ: |λ − μ| < ε} × (x + W ) ⊂ O,
396
VIII.
Lokalkonvexe R¨ aume
mit V + V ⊂ U (Eigenschaft (3)), und bestimme dann ε > 0 mit εx ∈ V (Eigenschaft (4)). Da V kreisf¨ ormig ist, gilt (μ − λ)x ∈ V, falls |λ − μ| < ε. Nun w¨ ahle W ∈ U mit μW ⊂ V, falls |μ| ≤ |λ| + ε (Eigenschaften (5) und (6)). Dann folgt f¨ ur |λ − μ| < ε und w ∈ W μ(x + w) − λx = (μ − λ)x + μw ∈ V + V ⊂ U.
2
Definition VIII.1.3 X sei ein Vektorraum und τ eine Topologie auf X. (a) Sind Addition und Skalarmultiplikation stetig bzgl. τ , so heißt (X, τ ) topologischer Vektorraum. (b) Sei P eine Menge von Halbnormen auf X und τ die oben beschriebene Topologie, f¨ ur die eine Nullumgebungsbasis aus den UF,ε = {x: p(x) ≤ ε ∀p ∈ F }, ε > 0, F ⊂ P endlich, besteht. (X, τ ) heißt dann lokalkonvexer topologischer Vektorraum (oder k¨ urzer lokalkonvexer Raum). Nach Lemma VIII.1.2 ist ein lokalkonvexer Raum wirklich ein topologischer Vektorraum! Ferner sollte ausdr¨ ucklich bemerkt werden, daß ein Vektorraum, der eine Topologie tr¨ agt, nicht automatisch ein topologischer Vektorraum ist: Versieht man n¨ amlich irgendeinen Vektorraum X mit der diskreten Topologie (in der jede Menge offen ist), so ist die Skalarmultiplikation nicht stetig. (Sonst w¨ are f¨ ur jedes x = 0 bereits limn→∞ n1 x = 0, aber in einem diskreten Raum konvergieren nur Folgen, die schließlich konstant werden.) Es gibt zwar Beispiele nicht lokalkonvexer topologischer Vektorr¨ aume, aber fast alle Topologien auf Vektorr¨aumen, die f¨ ur Anwendungen wichtig sind, sind lokalkonvex. Beispiele. (a) Sei T eine Menge und X ein Vektorraum von Funktionen auf T (z.B. T = Rn , X = C b (Rn )). Betrachte die Halbnormen pt (x) = |x(t)| (t ∈ T ). Die von der Familie P = {pt : t ∈ T } erzeugte lokalkonvexe Topologie heißt Topologie der punktweisen Konvergenz. (b) Sei T ein topologischer Raum und X ein Vektorraum von stetigen Funktionen auf T . Betrachte die Halbnormen pK (x) = sup |x(t)|,
K ⊂ T kompakt.
t∈K
Die von P = {pK : K ⊂ T kompakt} erzeugte lokalkonvexe Topologie heißt Topologie der gleichm¨aßigen Konvergenz auf Kompakta.
VIII.1
Definition lokalkonvexer R¨ aume; Beispiele
397
(c) Sei X = C ∞ (R) und pK,m (x) = sup |x(m) (t)| t∈K
f¨ ur m ≥ 0, K ⊂ R kompakt. P = {pK,m : K ⊂ R kompakt, m ∈ N0 } erzeugt eine lokalkonvexe Topologie auf X. Wird C ∞ (R) mit dieser Topologie versehen, schreibt man h¨ aufig E (R). Analog definiert man die Topologie von E (Rn ) und von E (Ω) f¨ ur offenes Ω ⊂ Rn . (d) Der Schwartzraum S (Rn ) (Definition V.2.3) wird durch die Halbnormen pα,m (ϕ) = sup (1 + |x|m )|(Dα ϕ)(x)| x∈Rn
topologisiert. (Hier ist α ein Multiindex und m ∈ N0 .) (e) Sei Ω ⊂ Rn offen und K ⊂ Ω kompakt. Es sei DK (Ω) := {ϕ: Ω → C: ϕ ∈ C ∞ (Ω), supp(ϕ) ⊂ K}. (Zur Existenz solcher Funktionen siehe Lemma V.1.10.) DK (Ω) wird durch die Halbnormen pα (ϕ) = sup |(Dα ϕ)(x)|, x∈Ω
α ein Multiindex, topologisiert. (f) Die soeben beschriebene Topologie k¨ onnte man auch auf D(Ω) betrachten; aus verschiedenen Gr¨ unden ist das jedoch nicht angemessen. Unter anderem m¨ ochte man n¨ a mlich auf D(Ω) eine Topologie betrachten, die die Tatsache, daß D(Ω) = K DK (Ω) ist (hier wird u ¨ ber alle kompakten Teilmengen von Ω vereinigt), reflektiert. Eine solche lokalkonvexe Topologie kann so definiert werden. Sei τK die Topologie von DK (Ω). Es sei P die Menge aller Halbnormen p auf D(Ω), f¨ ur die alle Restriktionen p|DK bez¨ uglich τK stetig sind. Auf D(Ω) betrachtet man dann die von P erzeugte lokalkonvexe Topologie. Die Beispiele (c)–(f) sind fundamental f¨ ur die Distributionentheorie (Abschnitt VIII.5). (g) X sei ein Vektorraum und p eine Norm auf X. Die von P = {p} erzeugte lokalkonvexe Topologie ist die Normtopologie auf X. (h) X sei ein normierter Raum. Betrachte die Halbnormen px (x) = |x (x)|
(x ∈ X ).
Diese Halbnormen erzeugen die schwache Topologie σ(X, X ) auf X. Die schwache Topologie ist fast immer von der Normtopologie verschieden. (N¨ aheres dazu in Abschnitt VIII.3.) (i) Auf dem Dualraum X eines normierten Raums definieren die Halbnormen px (x ) = |x (x)| (x ∈ X)
398
VIII.
Lokalkonvexe R¨ aume
die schwach∗ -Topologie σ(X , X), die sowohl von der Normtopologie als auch von der schwachen Topologie σ(X , X ) zu unterscheiden ist (auch hierzu siehe Abschnitt VIII.3). (j) Auf dem Raum L(X, Y ) (X und Y normierte R¨aume) sind außer der Normtopologie zwei weitere Topologien von Interesse: die starke Operatortopologie, die von den Halbnormen px (T ) = T x
(x ∈ X)
erzeugt wird, sowie die schwache Operatortopologie, die durch die Halbnormen (x ∈ X, y ∈ Y ) px,y (T ) = |y (T x)| definiert wird. (Diese Topologie kam implizit im Kapitel VII bei der Diskussion von Spektralmaßen vor; vgl. Satz VII.1.6(d).) (k) In der Wahrscheinlichkeitstheorie ist auf dem Raum M (R) aller endlichen signierten Maße diejenige lokalkonvexe Topologie von Bedeutung, die von den Halbnormen (f ∈ C b (R)) pf (μ) = f dμ R
erzeugt wird. Sie wird in der Wahrscheinlichkeitstheorie ebenfalls schwache Topologie genannt, ist aber von der funktionalanalytischen schwachen Topologie aus Beispiel (h) verschieden. (l) P = {0} erzeugt auf jedem Vektorraum X die chaotische Topologie, in der nur ∅ und X offen sind. Das letzte Beispiel zeigt auf dramatische Weise, daß ein lokalkonvexer Raum nicht die Hausdorffsche Trennungseigenschaft (d.h. verschiedene Punkte besitzen disjunkte Umgebungen) zu haben braucht. Diese Eigenschaft ist f¨ ur lokalkonvexe R¨ aume leicht zu charakterisieren. Lemma VIII.1.4 Die Halbnormfamilie P erzeuge auf X die lokalkonvexe Topologie τ . Dann sind ¨aquivalent: (i) (X, τ ) ist Hausdorffraum. (ii) Zu x = 0 existiert p ∈ P mit p(x) = 0. (iii) Es gibt eine Nullumgebungsbasis U mit U∈U U = {0}. Beweis. (i) ⇒ (ii): Sei x = 0. W¨ ahle Nullumgebungen U und V mit (x + U ) ∩ V = ∅. Nach Definition der Topologie τ darf man annehmen, daß V von ur alle p ∈ F } mit einer endlichen der Form V = UF,ε = {u: p(u) ≤ ε f¨ Teilmenge F ⊂ P ist. Wegen x∈ V ist dann p(x) = 0 f¨ ur ein p ∈ F . ur alle p ∈ P . (ii) ⇒ (iii) gilt wegen x ∈ F,ε UF,ε ⇔ p(x) = 0 f¨
VIII.1
399
Definition lokalkonvexer R¨ aume; Beispiele
(iii) ⇒ (i): Sei x = y. W¨ ahle U ∈ U mit x − y ∈ U . Da die Differenzbildung stetig ist, existieren Nullumgebungen V und W mit W − V ⊂ U . Es folgt (x + V ) ∩ (y + W ) = ∅. 2 Das Lemma zeigt, daß alle obigen Beispiele (bis auf (l)) Hausdorffr¨aume sind; bei (h) (und (j)) folgt das aus dem Satz von Hahn-Banach, bei (k) aus der Regularit¨ at von μ. Auf Beispiel (f) werden wir noch detaillierter eingehen. Der n¨ achste Satz erkl¨ art, warum lokalkonvexe R¨aume lokalkonvex“ hei” ßen. Satz VIII.1.5 (X, τ ) sei ein topologischer Vektorraum. X ist genau dann lokalkonvex, wenn es eine Nullumgebungsbasis aus absolutkonvexen absorbierenden Mengen gibt. Beweis. Nach Konstruktion besitzt ein lokalkonvexer Raum eine solche Nullumgebungsbasis. Sei nun U eine Nullumgebungsbasis, so daß alle U ∈ U absolutkonvex und absorbierend sind. Wir betrachten die Minkowskifunktionale pU (x) := inf{λ > 0: x ∈ λU } (Definition III.2.1). Da U absorbierend ist, ist stets pU (x) < ∞ (das ist gerade die Definition der Absorbanz); da U konvex ist, ist pU sublinear (Lemma III.2.2(b); dort war zwar vorausgesetzt, daß X normiert und 0 innerer Punkt von U ist, der Beweis macht davon allerdings keinen Gebrauch). Schließlich folgt aus der Kreisf¨ ormigkeit pU (λx) = |λ|pU (x)
∀λ ∈ K,
(VIII.1)
so daß insgesamt pU eine Halbnorm ist. [Beweis von (VIII.1): Da (VIII.1) f¨ ur λ ≥ 0 richtig ist (pU ist sublinear), darf o.E. |λ| = 1 vorausgesetzt werden. Die Kreisf¨ ormigkeit von U liefert dann λU = U , also pU (λx) = pλU (λx) = pU (x).] Betrachte nun die von der Halbnormfamilie P = {pU : U ∈ U} erzeugte ˜ = lokalkonvexe Topologie τ˜ mit der kanonischen Nullumgebungsbasis U {UF,ε : F ⊂ P endlich, ε > 0}. Es ist dann nicht schwer zu verifizieren, daß τ = τ˜ gilt; die Details seien den Leserinnen und Lesern u 2 ¨ berlassen. Satz VIII.1.5 sagt aus, daß lokalkonvexe R¨ aume geometrisch (durch Angabe einer Nullumgebungsbasis) oder analytisch (durch Angabe einer Halbnormfamilie) beschrieben werden k¨ onnen. Wir werden hier weitgehend dem analytischen Zugang folgen.
400
VIII.
VIII.2
Lokalkonvexe R¨ aume
Stetige Funktionale und der Satz von Hahn-Banach
In noch st¨ arkerem Maße als f¨ ur normierte R¨aume ist die Kenntnis von stetigen Funktionalen f¨ ur lokalkonvexe R¨ aume von Bedeutung. In der Tat ist es gerade die Existenz konvexer Nullumgebungen, die die Existenz von stetigen Funktionalen im Satz von Hahn-Banach garantieren wird. Das folgende Lemma ist der Dreh- und Angelpunkt unserer Untersuchungen. Lemma VIII.2.1 Die Halbnormfamilie P erzeuge die lokalkonvexe Topologie τ auf X. (a) F¨ ur eine Halbnorm q: X → [0, ∞) sind ¨aquivalent: (i) q ist stetig. (ii) q ist stetig bei 0. (iii) {x: q(x) ≤ 1} ist eine Nullumgebung. (b) Alle p ∈ P sind stetig. (c) Eine Halbnorm q ist genau dann stetig, wenn M ≥ 0 und eine endliche Teilmenge F ⊂ P mit q(x) ≤ M max p(x) p∈F
∀x ∈ X
existieren. Beweis. (a) Die Implikationen (i) ⇒ (ii) ⇒ (iii) sind trivial. Gelte (iii), und seien x ∈ X und ε > 0. Wir zeigen f¨ ur U = ε · {y: q(y) ≤ 1} = {y: q(y) ≤ ε} q(x + U ) ⊂ {a ∈ R: |a − q(x)| ≤ ε}, was die Stetigkeit von q bei x zeigt. In der Tat gilt f¨ ur y ∈ U |q(x + y) − q(x)| ≤ q (x + y) − x = q(y) ≤ ε, wobei wir die umgekehrte Dreiecksungleichung benutzt haben, die f¨ ur Halbnormen genauso wie f¨ ur Normen gilt. (b) Nach Definition von τ sind die {x: p(x) ≤ 1} Nullumgebungen. (c) Nach (iii) in (a) ist q genau dann stetig, wenn es ε > 0 und endliches F ⊂ P mit UF,ε ⊂ {x: q(x) ≤ 1} gibt. Das heißt aber q(x) ≤
1 max p(x) ε p∈F
∀x ∈ X.
2
Korollar VIII.2.2 Die Halbnormfamilie P erzeuge die lokalkonvexe Topologie τ auf X, und es sei P ⊂ Q ⊂ {q: q ist τ -stetige Halbnorm}. Dann erzeugt Q ebenfalls die Topologie τ .
VIII.2
Stetige Funktionale und der Satz von Hahn-Banach
401 2
Beweis. Das folgt sofort aus Lemma VIII.2.1.
Wir behandeln nun lineare Abbildungen. Die von einer Halbnormfamilie P erzeugte lokalkonvexe Topologie werden wir mit τP bezeichnen. Satz VIII.2.3 Seien (X, τP ) und (Y, τQ ) zwei lokalkonvexe R¨aume und T : X → Y linear. Dann sind ¨aquivalent: (i) T ist stetig. (ii) T ist stetig bei 0. (iii) Ist q eine stetige Halbnorm auf Y , so ist q◦T eine stetige Halbnorm auf X. (iv) F¨ ur alle q ∈ Q existieren endliches F ⊂ P und M ≥ 0 mit q(T x) ≤ M max p(x) p∈F
∀x ∈ X.
Beweis. (i) ⇔ (ii): ⇒“ ist klar. F¨ ur ⇐“ bemerke, daß T genau dann stetig ” ” bei x ist, wenn f¨ ur alle Nullumgebungen V ⊂ Y eine Nullumgebung U ⊂ X mit T (x + U ) (= T x + T (U )) ⊂ T x + V existiert. (ii) ⇒ (iii) gilt wegen Lemma VIII.2.1(a) und der Tatsache, daß die Komposition stetiger Abbildungen stetig ist. (iii) ⇒ (iv) gilt wegen Lemma VIII.2.1(b) und (c). (iv) ⇒ (ii): Es ist zu zeigen: Zu einer Nullumgebung V ⊂ Y existiert eine Nullumgebung U ⊂ X mit T (U ) ⊂ V . O.E. ist V von der Form V = {y: qi (y) ≤ ε, i = 1, . . . , n}, wo nq1 , . . . , qn ∈ Q sind. W¨ahle Fi und Mi zu qi gem¨ aß (iv) und setze F = i=1 Fi , M = maxi=1,...,n Mi . Dann gilt max qi (T x) ≤ M max p(x)
i=1,...,n
p∈F
∀x ∈ X,
d.h. T (UF,ε/M ) ⊂ V .
2
Beachte die Analogie von (iv) zur Formel T x ≤ M x . Wir notieren noch explizit einen Spezialfall von Satz VIII.2.3. Korollar VIII.2.4 Sei (X, τP ) ein lokalkonvexer Raum. Eine lineare Abbildung : X → K ist genau dann stetig, wenn es endlich viele p1 , . . . , pn ∈ P und M ≥ 0 mit |(x)| ≤ M max pi (x) i=1,...,n
∀x ∈ X
gibt. Wie bei normierten R¨ aumen f¨ uhrt man nun den Dualraum ein.
402
VIII.
Lokalkonvexe R¨ aume
Definition VIII.2.5 Die Menge der stetigen linearen Funktionale auf einem lokalkonvexen Raum (X, τ ) heißt Dualraum von X und wird mit X oder, um die Abh¨ angigkeit von der Topologie τ zu betonen, (Xτ ) bezeichnet. L(X, Y ) (bzw. L(Xτ1 , Yτ2 )) bezeichnet die Menge der stetigen linearen Abbildungen zwischen den lokalkonvexen R¨ aumen (X, τ1 ) und (Y, τ2 ). Aus Satz VIII.2.3 folgt sofort, daß L(X, Y ) und X ihrerseits Vektorr¨ aume sind. Auf die M¨ oglichkeit, auf X eine geeignete lokalkonvexe Topologie zu erkl¨ aren, werden wir in Abschnitt VIII.3 eingehen. Es ist noch ein Spezialfall von Satz VIII.2.3 von Interesse, n¨amlich der Fall X = Y und T = Id, wenn zwei lokalkonvexe Topologien auf X definiert sind. (Man denke z.B. an einen normierten Raum X, der außer mit der Normtopologie mit der zugeh¨ origen schwachen Topologie σ(X, X ) (vgl. Beispiel VIII.1(h)) versehen werden kann.) Es ist h¨aufig wichtig, diese Topologien zu vergleichen. Sind τ1 und τ2 lokalkonvexe Topologien auf X, so heißt τ1 feiner als τ2 (und τ2 gr¨ober als τ1 ), falls jede τ2 -offene Menge auch offen bzgl. τ1 ist, ¨ dazu ist wenn also τ2 ⊂ τ1 gilt. Aquivalent Id ∈ L(Xτ1 , Xτ2 ), und Satz VIII.2.3 gibt leicht zu verifizierende Kriterien daf¨ ur. Nat¨ urlich stimmen die zwei Topologien auf X u ¨berein, wenn Id ∈ L(Xτ1 , Xτ2 ) und Id ∈ L(Xτ2 , Xτ1 ) gelten. Ist τ1 feiner als τ2 , so hat τ1 • mehr offene Mengen, • mehr abgeschlossene Mengen, aber • weniger kompakte Mengen, • mehr stetige Abbildungen nach K (oder in irgendeinen anderen topologischen Raum), • weniger konvergente Folgen. (Diese Aufz¨ ahlung betrifft nat¨ urlich nicht nur lokalkonvexe Vektorr¨aume, sondern allgemein topologische R¨ aume.) Beispiel. Sei X = C(Rn ) und τ1 = Topologie der punktweisen Konvergenz, τ2 = Topologie der gleichm¨ aßigen Konvergenz auf Kompakta (Beispiele VIII.1(a) und (b)). Dann ist τ2 feiner als τ1 , da man sofort das Kriterium in Satz VIII.2.3(iv) f¨ ur Id: Xτ2 → Xτ1 nachpr¨ uft: pt (x) ≤ 1 · p{t} (x). (Bezeichnungen wie in den Beispielen VIII.1(a) und (b); nat¨ urlich gilt sogar =“.) ”
VIII.2
Stetige Funktionale und der Satz von Hahn-Banach
403
Ein weiteres Beispiel: Die Normtopologie eines normierten Raums ist stets feiner als die schwache Topologie σ(X, X ), da (Beispiel VIII.1(h)) px (x) = |x (x)| ≤ x x
∀x ∈ X, x ∈ X ,
also Id ∈ L(X . , Xσ(X,X ) ). Als n¨ achstes soll kurz u ¨ ber Konvergenz in lokalkonvexen R¨aumen gesprochen werden; zur Definition der Konvergenz in topologischen R¨aumen siehe Anhang B.2. Dort wird bemerkt, daß sich topologische Begriffe im allgemeinen nur unzureichend durch Folgen beschreiben lassen. Wir geben dazu jetzt ein Beispiel im Kontext der lokalkonvexen R¨aume, das auf von Neumann zur¨ uckgeht. Beispiel. Betrachte X = 2 mit der schwachen Topologie σ(X, X ) und A = {em + men : 1 ≤ m < n}, wo nat¨ urlich en der n-te Einheitsvektor ist. Dann ist 0 ∈ A, aber keine Folge in A konvergiert gegen 0 (alles bzgl. σ(X, X ) und nicht bzgl. der Normtopologie). Zum Beweis hierf¨ ur sei U eine Nullumgebung; wir haben dann U ∩A = ∅ zu zeigen. Ohne Einschr¨ ankung sei U = {x ∈ 2 : |x, yi | ≤ ε (i = 1, . . . , r)} f¨ ur y1 , . . . , yr ∈ 2 . W¨ ahle m so groß, daß |yi (m)| ≤ 2ε f¨ ur i = 1, . . . , r ist, ε und anschließend n > m mit |yi (n)| ≤ 2m f¨ ur i = 1, . . . , r. Dann ist |em + men , yi | ≤ |yi (m)| + m|yi (n)| ≤ ε, also em + men ∈ U . Daher gilt 0 ∈ A. Sei nun (emk + mk enk )k∈N eine Folge in A. W¨are es eine Nullfolge, so w¨ are, da x → |x, y| f¨ ur alle y ∈ 2 eine stetige Halbnorm ist (Lemma VIII.2.1(b)), f¨ ur alle y ∈ 2 lim |y(mk ) + mk y(nk )| = 0.
k→∞
(VIII.2)
Ist die Folge (mk )k∈N beschr¨ ankt, liefert ein geeignetes y = el einen Widerspruch zu (VIII.2). Ist (mk )k∈N unbeschr¨ ankt, so d¨ urfen (nk )k∈N und (mk )k∈N als streng monoton wachsend angenommen werden, und dann lieur j = nk und y(j) = 0 sonst einen Widerspruch. fert y ∈ 2 mit y(j) := k1 f¨ F¨ ur die lokalkonvexe Theorie ist das folgende Resultat wichtig; es zeigt, daß die Bezeichnungen der Beispiele VIII.1(a) und (b) zu Recht bestehen. Satz VIII.2.6 (X, τP ) sei ein lokalkonvexer Raum. Ein Netz (xi )i∈I konur alle p ∈ P gilt. vergiert genau dann gegen x, wenn lim p(xi − x) = 0 f¨ Beweis. Das Netz (xi ) konvergiert genau dann gegen x, wenn (xi − x) gegen 0 konvergiert; also d¨ urfen wir ohne Einschr¨ ankung x = 0 annehmen. Aus
404
VIII.
Lokalkonvexe R¨ aume
lim xi = 0 folgt dann wegen Lemma VIII.2.1(b) und Satz B.2.3 bereits ur p ∈ P . Gelte umgekehrt diese Bedingung, und sei U (o.E. lim p(xi ) = 0 f¨ = UF,ε ) eine Nullumgebung. Zu p ∈ P existiert dann ein ip ∈ I mit p(xi ) ≤ ε
∀i ≥ ip .
Die Gerichtetheit von I liefert ein j mit j ≥ ip f¨ ur alle p ∈ F , denn F ist endlich. F¨ ur i ≥ j und p ∈ F folgt p(xi ) ≤ ε, d.h. xi ∈ UF,ε f¨ ur i ≥ j. Das 2 zeigt lim xi = 0. Hier ist eine Illustration der Netztechnik. Satz VIII.2.7 In einem lokalkonvexen Raum ist der Abschluß einer konvexen Menge konvex. (Desgleichen f¨ ur absolutkonvexe Mengen.) Beweis. Sei C konvex, seien x, y ∈ C, 0 ≤ λ ≤ 1. Nach Satz B.2.1 existieren Netze (xi )i∈I und (yi )i∈I in C mit lim xi = x, lim yi = y. (Als Indexmenge kann jeweils I = U, eine Nullumgebungsbasis, gew¨ahlt werden.) Da Addition und Skalarmultiplikation stetig sind, folgt lim(λxi + (1 − λ)yi ) = λx + (1 − λ)y ∈ C.
2
Man h¨ atte Satz VIII.2.7 nat¨ urlich auch ohne Netze, also direkt nach Definition VIII.1.3, beweisen k¨ onnen (Aufgabe VIII.6.1 bittet darum, das zu tun), aber so geht es vermutlich schneller. Nun folgen noch einige Beispiele f¨ ur stetige Funktionale. Beispiele. (a) Betrachte den Raum S (Rn ) (Beispiel VIII.1(d)). Elemente des Dualraums, der mit S (Rn ) bezeichnet wird, heißen temperierte Distributionen und werden in Abschnitt VIII.5 detaillierter studiert. Wir zeigen ur 1 ≤ p ≤ ∞, genauer, f¨ ur f ∈ Lp (Rn ) definiert Lp (Rn ) ⊂ S (Rn ) f¨ Tf (ϕ) = f (x)ϕ(x) dx ∀ϕ ∈ S (Rn ) Rn
ein Funktional Tf ∈ S (Rn ). Nach der H¨ olderschen Ungleichung gilt f¨ ur p > 1 und 1p + 1q = 1 mit den Bezeichnungen aus Beispiel VIII.1(d) |Tf (ϕ)| ≤ f Lp ϕ Lq p ≤ f L
dx n+1 )q (1 + |x| n R = M p0,n+1 (ϕ);
1/q sup (1 + |x|n+1 )|ϕ(x)|
x∈Rn
der Fall p = 1 ist analog zu behandeln. (b) Als n¨ achstes berechnen wir den Dualraum eines normierten Raums X bez¨ uglich seiner schwachen Topologie σ(X, X ).
VIII.2
Stetige Funktionale und der Satz von Hahn-Banach
405
Behauptung: (X . ) = (Xσ(X,X ) ) , mit anderen Worten, ein lineares Funktional ist genau dann normstetig, wenn es schwach stetig ist. Zun¨ achst gilt ⊃“, da die Normtopologie feiner als die schwache Topo” logie ist (siehe S. 403). Umgekehrt gilt ⊂“, da jedes x ∈ (X . ) nach ” Korollar VIII.2.4 schwach stetig ist, denn |x (x)| ≤ px (x)
∀x ∈ X
(sogar =, Bezeichnung nach Beispiel VIII.1(h)). In Korollar VIII.3.4 wird gezeigt, daß der Dualraum von (X , σ(X , X)) (Beispiel VIII.1(i)) genau aus den Auswertungsfunktionalen x → x (x) besteht, also (Xσ(X ,X) ) = X ist, wo X als Unterraum von X (= (X . ) ) aufgefaßt ist. (c) X und Y seien normierte R¨ aume. Wir versehen L(X, Y ) mit der starken Operatortopologie (Beispiel VIII.1(j)) und bezeichnen den so topologisierten Operatorraum mit Lst (X, Y ). Behauptung: Φ ∈ (Lst (X, Y )) genau dann, wenn Φ von der Form ur geeignete n ∈ N, xi ∈ X, yi ∈ Y ist. Φ(T ) = ni=1 yi (T xi ) f¨ ⇐“ ist klar wegen Korollar VIII.2.4. Zu ⇒“: Nach Korollar VIII.2.4 ” ” existieren x1 , . . . , xn ∈ X und M ≥ 0 mit |Φ(T )| ≤ M max T xi . i
(VIII.3)
∞ n (Y ) bezeichne den normierten Raum Y ⊕∞ · · · ⊕∞ Y aller n-Tupel in Y mit der Maximumsnorm (yi ) = maxi yi . Setze Ψ: L(X, Y ) → ∞ n (Y ), Ψ(T ) = (T xi ). (VIII.3) impliziert dann, daß durch (T xi ) = Φ(T ) ein wohldefiniertes stetiges lineares Funktional auf ran(Ψ) erkl¨art wird. Nach dem Satz von Hahn-Banach (f¨ ur normierte R¨aume) kann zu ei nem stetigen linearen Funktional L ∈ (∞ n (Y )) fortgesetzt werden. Wie im Fall Y = K zeigt man, daß L eine Darstellung n L (yi ) = yi (yi ) i=1
mit
y1 , . . . , yn
∈ Y besitzt. Es folgt n yi (T xi ). Φ(T ) = (T xi ) = L (T xi ) = i=1
Wir kommen nun zum Satz von Hahn-Banach f¨ ur lokalkonvexe R¨aume. Ausgehend vom algebraischen Hahn-Banach-Satz III.1.2 bzw. III.1.4 lassen sich die Beweise vom normierten auf den lokalkonvexen Fall (fast) w¨ortlich u ¨bertragen, wenn man Norm“ durch stetige Halbnorm“ und Kugel“ ” ” ” durch absolutkonvexe Nullumgebung“ ersetzt. ”
406
VIII.
Lokalkonvexe R¨ aume
Satz VIII.2.8 (Fortsetzungssatz von Hahn-Banach) Sei X ein lokalkonvexer Raum und U ⊂ X ein Untervektorraum sowie ∈ U . Dann existiert eine Fortsetzung L von mit L ∈ X . Beweis. Zun¨ achst bemerke, daß die Topologie von U von {p|U : p ∈ P } erzeugt wird, wenn P die von X erzeugt. Zuerst sei K = R. Nach Korollar VIII.2.4 existiert dann eine stetige Halbnorm p auf X (n¨amlich p = M maxi≤n pi ) mit (x) ≤ |(x)| ≤ p(x)
∀x ∈ U.
Nach Satz III.1.2 existiert eine lineare Fortsetzung L: X → R von mit L(x) ≤ p(x)
∀x ∈ X.
Also ist L ∈ X , denn es gilt auch L(−x) ≤ p(x) und deshalb |L(x)| ≤ p(x). F¨ ur K = C erhalten wir aus Re (x) ≤ p(x) (x ∈ U ) ein lineares L: X → C mit Re L(x) ≤ p(x) (x ∈ X), also mit Lemma III.1.3(c) |L(x)| ≤ p(x) und wieder L ∈ X .
2
Die jetzt folgenden Hahn-Banach-Trennungss¨atze bilden das Kernst¨ uck der lokalkonvexen Theorie. Wir notieren zun¨achst ein Lemma. Lemma VIII.2.9 W sei eine offene absorbierende absolutkonvexe Nullumgebung des lokalkonvexen Raumes X. Dann ist das Minkowskifunktional pW eine stetige Halbnorm. Beweis. Daß pW eine Halbnorm ist, wurde im Beweis von Satz VIII.1.5 bemerkt. Die Stetigkeit folgt aus Lemma VIII.2.1(a). 2 Lemma VIII.2.10 Sei X ein lokalkonvexer Raum, V ⊂ X konvex und offen und 0 ∈ V . Dann existiert x ∈ X mit Re x (x) < 0
∀x ∈ V.
Beweis. (Vgl. Lemma III.2.3.) Sei x0 ∈ V , y0 = −x0 und U = y0 + V . Dann ist U offen und konvex, y0 ∈ U und 0 ∈ U . Betrachte das Minkowskifunktional pU zu U . Da U offen ist, existiert eine absolutkonvexe absorbierende Nullumgebung W ⊂ U . Nach Lemma III.2.2 (das f¨ ur lokalkonvexe R¨aume wie f¨ ur normierte gilt) ist pU sublinear und pU (y0 ) ≥ 1. Setze Y = lin{y0 } und y : Y → K, y (ty0 ) = tpU (y0 ). Wie bei Lemma III.2.3 folgt Re y (y) ≤ pU (y). Nach dem algebraischen Satz von HahnBanach III.1.4 existiert eine lineare Fortsetzung x : X → K mit Re x (x) ≤ pU (x) ≤ pW (x)
∀x ∈ X,
VIII.3
407
Schwache Topologien
also auch
|x (x)| ≤ pW (x)
∀x ∈ X.
Nach Lemma VIII.2.9 und Satz VIII.2.3 (mit einem Seitenblick auf Korollar VIII.2.2) ist x ∈ X . Wie bei Lemma III.2.3 zeigt man, daß x das Gew¨ unschte leistet. 2 Theorem VIII.2.11 (Trennungssatz von Hahn-Banach; Version I) Seien X ein lokalkonvexer Raum, Vi ⊂ X konvex (i = 1, 2) und V1 offen. Gelte V1 ∩ V2 = ∅. Dann existiert x ∈ X mit Re x (x1 ) < Re x (x2 )
∀x1 ∈ V1 , x2 ∈ V2 . 2
Beweis. W¨ ortlich wie bei Theorem III.2.4!
Theorem VIII.2.12 (Trennungssatz von Hahn-Banach; Version II) Sei X ein lokalkonvexer Raum, V ⊂ X sei abgeschlossen und konvex, und es sei x ∈ V . Dann existieren x ∈ X und ε > 0 mit Re x (x) < Re x (x) + ε ≤ Re x (v)
∀v ∈ V.
Ist V zus¨atzlich absolutkonvex, so existieren x ∈ X und ε > 0 mit |x (v)| + ε ≤ Re x (x)
∀v ∈ V.
(VIII.4)
Beweis. W¨ ahle absolutkonvexes offenes U mit (x + U ) ∩ V = ∅. Nach Theorem VIII.2.11 existiert x ∈ X mit Re x (x) + Re x (u) < Re x (v)
∀u ∈ U, v ∈ V.
Setze ε = sup{Re x (u): u ∈ U }. Da U absorbierend ist, ist ε > 0, und die Behauptung folgt. (Warum ist ε < ∞?) Der Zusatz ist klar, da man durch ¨ Ubergang zu −x auch >“ und −ε in der obigen Ungleichung erhalten ” kann. 2 Korollar VIII.2.13 Wenn X ein lokalkonvexer Hausdorffraum ist, trennt X die Punkte von X, d.h., zu x = y existiert x ∈ X mit x (x) = x (y). Beweis. Wende Theorem VIII.2.12 auf V = {y} an, was konvex und abgeschlossen ist. 2
VIII.3
Schwache Topologien
In den Beispielen VIII.1(h) und (i) wurden die schwache Topologie eines uhrt. normierten Raums und die schwach∗ -Topologie eines Dualraums eingef¨ Diese Topologien werden jetzt detaillierter studiert; dabei werden wir einen etwas allgemeineren Standpunkt einnehmen.
408
VIII.
Lokalkonvexe R¨ aume
Seien nun X und Y Vektorr¨ aume (ohne eine Topologie!) und (x, y) → x, y ∈ K eine bilineare Abbildung auf X × Y . (Nicht zuf¨allig erscheint hier dasselbe Symbol wie f¨ ur ein Skalarprodukt. Aber Achtung: X und Y k¨ onnen jetzt nat¨ urlich verschieden sein, und auch im Fall K = C wird Biund nicht Sesquilinearit¨ at verlangt.) Die Elemente von Y induzieren dann lineare Abbildungen auf X vermittels der Formel y (x) = x, y. Genauso wirken die Elemente von X als lineare Abbildungen auf Y . Definition VIII.3.1 (X, Y ) (genauer (X, Y, . , . )) heißt ein duales Paar, falls ∀x ∈ X\{0} ∃y ∈ Y x, y = 0, ∀y ∈ Y \{0} ∃x ∈ X
x, y = 0.
Sind X und Y vorgelegt, so ist es meistens klar, welche bilineare Abbildung auf X ×Y zu betrachten ist. Sie wird daher i.a. nicht weiter spezifiziert werden. Des weiteren k¨ onnen wir bei einem dualen Paar (X, Y ) den Raum Y (bzw. X) stets mit einem punktetrennenden Unterraum des algebraischen Dualraums von X (bzw. Y ) identifizieren, denn x → x, . und y → . , y sind injektiv, und das werden wir auch tun. Beispiele. (a) Sei X ein lokalkonvexer Hausdorffraum und X (wie u ¨ blich) sein Dualraum. Nach dem Satz von Hahn-Banach ist (X, X ) mit der bilinearen Abbildung (x, x ) → x (x) ein duales Paar. (b) Genauso ist in dieser Situation (X , X) mit (x , x) → x (x) ein duales Paar. (c) Sei X = C b (R) und Y = M (R), der Raum aller (regul¨aren) endlichen signierten (bzw. komplexen) Borelmaße, sowie f dμ. f, μ = R
Die Regularit¨ at der Maße zeigt, daß (X, Y ) ein duales Paar ist. (d) Zu einer Funktion f : R → R, also f ∈ RR , betrachte das Auswertungsfunktional δt : f → f (t). (RR , lin{δt : t ∈ R}) ist dann ein duales Paar, wobei nat¨ urlich - . n n λi δti = λi f (ti ). f, i=1
i=1
(e) Seien X und Y normierte R¨ aume. Schreibe abk¨ urzend n x (xi )yi , n ∈ N, xi ∈ X, yi ∈ Y ; X ⊗ Y = u: X → Y : u(x ) = i=1
VIII.3
409
Schwache Topologien
man kann u ¨brigens X ⊗ Y wirklich als Tensorprodukt von X und Y auffassen. (L(X, Y ), X ⊗ Y ) ist dann ein duales Paar unter der bilinearen Abbildung n T, u = yi (T xi ). i=1
Das zeigt der Satz von Hahn-Banach. (f) Wie bei (a) und (b) kann man auch im allgemeinen die Rollen von X und Y vertauschen. Sei (X, Y ) ein duales Paar. Zu y ∈ Y betrachte die Halbnorm py (x) = |x, y|, und setze P = {py : y ∈ Y }. Definition VIII.3.2 Die von P auf X erzeugte lokalkonvexe Topologie heißt σ(X, Y )-Topologie. Analog wird die σ(Y, X)-Topologie erkl¨art. Aus Lemma VIII.1.4 folgt, daß f¨ ur ein duales Paar die σ(X, Y )-Topologie stets Hausdorffsch ist. Nach Satz VIII.2.6 konvergiert eine Folge (bzw. ein Netz) (xi ) genau dann gegen 0 bzgl. σ(X, Y ), wenn xi , y → 0 f¨ ur alle y ∈ Y gilt. Die schwache Konvergenz aus Definition III.3.6 entsteht so als Spezialfall. Faßt man also die xi als Funktionale auf Y auf, so handelt es sich genau um die punktweise Konvergenz. Betrachten wir noch einmal die obigen Beispiele. (a) Die hier entstehende Topologie nennen wir die schwache Topologie des lokalkonvexen Raums X; sie ist, wie im normierten Fall, gr¨ober als die Ausgangstopologie und von ihr i.a. zu unterscheiden. (b) σ(X , X) ist die Topologie der punktweisen Konvergenz auf X, wie im normierten Fall wollen wir sie schwach∗ -Topologie nennen. (c) Die σ(M (R), C b (R))-Topologie ist die schwache Topologie der Wahrscheinlichkeitstheorie aus Beispiel VIII.1(k). (d) Hier erhalten wir die Topologie der punktweisen Konvergenz aus Beispiel VIII.1(a). (e) σ(L(X, Y ), X ⊗ Y ) ist die schwache Operatortopologie aus Beispiel VIII.1(j). Als n¨ achstes soll der Dualraum von Xσ(X,Y ) bestimmt werden. Dazu ben¨ otigen wir das folgende Lemma. Lemma VIII.3.3 Sei X ein Vektorraum, und seien , 1 , . . . , n : X → K linear. Setze N = {x: i (x) = 0 ∀i = 1, . . . , n}. Dann sind ¨aquivalent: (i) ∈ lin{1 , . . . , n }. (ii) Es gibt M ≥ 0 mit |(x)| ≤ M max |i (x)| i≤n
(iii) (x) = 0 f¨ ur x ∈ N , d.h.
i≤n
∀x ∈ X.
ker(i ) ⊂ ker().
410
VIII.
Lokalkonvexe R¨ aume
Beweis. Die Implikationen (i) ⇒ (ii) ⇒ (iii) sind klar. (iii) ⇒ (i): Sei V := i (x) i≤n : x ∈ X ⊂ Kn . Nach (iii) ist die Abbildung φ: i (x) i → (x) wohldefiniert und linear auf V . Daher (lineare Kn → K, die folglich von der Algebra!) existiert eine lineare Fortsetzung φ: n n Form ur x ∈ X bzw. φn (ξi ) = i=1 αi ξi ist. Es folgt (x) = i=1 αi i (x) f¨ = i=1 αi i . 2 Dieses Lemma ist das Kernlemma der schwachen Topologien, impliziert es doch sofort das n¨ achste Korollar. Korollar VIII.3.4 Ein Funktional auf X ist genau dann σ(X, Y )-stetig, wenn es von der Form x → x, y ist. Es gilt also (Xσ(X,Y ) ) = Y. 2
Beweis. Benutze Korollar VIII.2.4 und Lemma VIII.3.3.
Zwei Spezialf¨ alle sind besonders erw¨ ahnenswert (der erste wurde, zumindest im normierten Fall, schon in Beispiel VIII.2(b) behandelt): (X, τ ) sei ein lokalkonvexer Raum, z.B. ein normierter Raum. • Ein lineares Funktional auf X ist genau dann schwach stetig, wenn es τ -stetig ist. • Ein lineares Funktional auf X ist genau dann schwach∗ stetig, wenn es ein Auswertungsfunktional x → x (x) ist. Satz VIII.3.5 Seien τ1 und τ2 zwei lokalkonvexe Topologien auf X, und es sei (Xτ1 ) = (Xτ2 ) . Dann ist eine konvexe Menge C genau dann τ1 abgeschlossen, wenn sie τ2 -abgeschlossen ist. Beweis. Sei C etwa τ2 -abgeschlossen und x0 ∈ C. Wir werden (x0 + U ) ∩ C = ∅ τ1
f¨ urτ eine geeignete τ1 -Nullumgebung U und damit x0 ∈ C zeigen, so daß 1 C ⊂ C gilt und daher C auch τ1 -abgeschlossen ist. W¨ahle mit HahnBanach (Theorem VIII.2.12) ein τ2 -stetiges x und ε > 0 mit Re x (x0 ) + ε ≤ Re x (y)
∀y ∈ C.
Da x nach Voraussetzung auch τ1 -stetig ist, ist U = {x: Re x (x) < ε} die gew¨ unschte Umgebung. 2 Ohne die vorausgesetzte Konvexit¨ at von C wird der Satz nat¨ urlich falsch! Wichtige Spezialf¨ alle sind:
VIII.3
411
Schwache Topologien
• (X, τ ) lokalkonvex, τ1 = τ und τ2 = σ(X, X ) (Korollar VIII.3.4); im normierten Fall vgl. Satz VIII.3.5 mit Satz III.3.8! • L(X, Y ) mit der schwachen und der starken Operatortopologie (Beispiel (e), Korollar VIII.3.4 und Beispiel VIII.2(c)). Wir erw¨ ahnen noch eine wichtige Eigenschaft der schwachen Topologien. Satz VIII.3.6 Die schwache Topologie σ(X, Y ) ist initial bez¨ uglich Y , d.h., ist T ein topologischer Raum und f : T → Xσ(X,Y ) eine Funktion, so ist f genau dann stetig, wenn alle Kompositionen f
y
y ◦ f: T → X → K
(y ∈ Y ),
d.h. alle Abbildungen t → f (t), y, stetig sind. Insbesondere ist σ(X, Y ) die gr¨obste Topologie auf X, f¨ ur die alle y ∈ Y stetig sind. Beweis. Die Bedingung ist notwendig nach Korollar VIII.3.4. Seien nun alle y ◦ f stetig, und sei t ∈ T . Ist U eine σ(X, Y )-Nullumgebung, so ist f (W ) ⊂ f (t) + U f¨ ur eine geeignete Umgebung W von t zu zeigen. O.E. ist U = {x: |x, yi | ≤ ε, i = 1, . . . , n}. Da yi ◦ f nach Voraussetzung stetige Funktionen sind, existieren Umgebungen Wi von t mit |f (t) − f (s), yi | ≤ ε Daher ist W =
n i=1
∀s ∈ Wi .
Wi die gew¨ unschte Umgebung.
2
Wir kommen zu einem neuen Begriff. Definition VIII.3.7 Es seien (X, Y ) ein duales Paar, A ⊂ X, B ⊂ Y . Die Polare von A ist Ao = {y ∈ Y : Rex, y ≤ 1 ∀x ∈ A}, die Polare von B ist B o = {x ∈ X: Rex, y ≤ 1 ∀y ∈ B}. Die Polaren sind stets bez¨ uglich eines fest vorgegebenen dualen Paars definiert! Insbesondere ist damit Aoo ⊂ X definiert. Achtung: Viele Autoren definieren Ao als die absolute Polare {y ∈ Y : |x, y| ≤ 1 ∀x ∈ A}.
412
VIII.
Lokalkonvexe R¨ aume
Ist z.B. X ein normierter Raum und Y = X , so ist (BX )o = BX und ur einen Unterraum U ⊂ X stimmt U o mit dem in (BX )o = BX ; und f¨ (III.4) definierten Annihilator U ⊥ u ¨ berein (Aufgabe VIII.6.20). Wir kommen nun zu einigen elementaren Eigenschaften. co B bezeichnet dabei die konvexe H¨ ulle von B (das ist der Schnitt aller konvexen Mengen, die B enthalten) und co B ihren Abschluß. Nach Satz VIII.2.7 ist co B die kleinste abgeschlossene konvexe Menge, die B umfaßt. Lemma VIII.3.8 Sei (X, Y ) ein duales Paar und seien A, Ai ⊂ X, wo i eine Indexmenge I durchl¨auft. (a) Ao ist konvex und σ(Y, X)-abgeschlossen, Ao = (co A)o . (b) Es gilt stets 0 ∈ Ao , A ⊂ Aoo und A1 ⊂ A2 ⇒ Ao2 ⊂ Ao1 . (c) Ist A kreisf¨ormig, so ist Ao = {y ∈ Y : |x, y| ≤ 1 ∀x ∈ A}. ur λ > 0. (d) (λA)o = λ1 Ao f¨ o o (e) A = i∈I Ai . i∈I i o (f) ⊃ co i∈I Aoi (Abschluß in der σ(Y, X)-Topologie!). i∈I Ai Beweis. (a) Ao = x∈A {y: Rex, y ≤ 1} ist als Schnitt bzgl. σ(Y, X) abgeschlossener und konvexer Mengen abgeschlossen und konvex. Genauso folgt Ao = (co A)o , und (b)–(e) sind klar. ur alle i ∈I folgt aus (b) Aoi ⊂ Ao (f) Setze A = i Ai . Wegen A ⊂ Ai f¨ f¨ ur alle i ∈ I, also i Aoi ⊂ Ao . (a) liefert dann co i Aoi ⊂ Ao . 2 Satz VIII.3.9 (Bipolarensatz) F¨ ur ein duales Paar (X, Y ) und A ⊂ X gilt Aoo = co(A ∪ {0}), wo der Abschluß bzgl. σ(X, Y ) zu nehmen ist. Beweis. Nach Lemma VIII.3.8(a) und (b) folgt sofort co(A ∪ {0}) ⊂ Aoo . Nimm nun an, daß diese Inklusion echt ist. Dann existiert x0 ∈ Aoo , x0 ∈ co(A ∪ {0}) =: V . Nach Konstruktion ist V konvex und abgeschlossen; x0 und V k¨ onnen daher durch ein σ(X, Y )-stetiges Funktional getrennt werden (Satz von Hahn-Banach, Theorem VIII.2.12). Mit Korollar VIII.3.4 heißt das: Es existiert y ∈ Y mit Rex0 , y > 1 ≥ Rex, y
∀x ∈ A.
Die zweite Ungleichung besagt y ∈ Ao und daher die erste x0 ∈ Aoo , das ist ein Widerspruch. 2 Korollar VIII.3.10 Sei (X, Y ) ein duales Paar und C ⊂ X konvex mit 0 ∈ C. Genau dann ist C σ(X, Y )-abgeschlossen, wenn es B ⊂ Y mit C = B o gibt.
VIII.3
413
Schwache Topologien
2
Beweis. Setze B = C o .
Als n¨ achstes beweisen wir eine fundamentale Aussage der Funktionalanalysis. Wir betrachten einen lokalkonvexen Raum X und das duale Paar (X, X ). Theorem VIII.3.11 (Satz von Alaoglu-Bourbaki) F¨ ur eine Nullumgebung U ist U o σ(X , X)-kompakt. Beweis. Wir haben bereits bemerkt, daß die σ(X , X)-Topologie auf X genau die Topologie der punktweisen Konvergenz auf X ist (siehe S. 409). Die nat¨ urliche Einbettung von X in KX , die Menge aller Funktionen von X nach K, ist daher eine hom¨ oomorphe Einbettung, wenn KX die Topologie der punktweisen Konvergenz τp tr¨ agt. So weit, so gut. In (KX , τp ) liefert der Satz von Tikhonov (Theorem B.2.10) ein leicht zu handhabendes Kompaktheitskriterium – das ist der springende Punkt. Bevor wir zu den Einzelheiten kommen, sei bemerkt, daß o.E. U absolutkonvex ist; in der Tat enth¨ alt jede Nullumgebung U eine absolutkonvexe Nullumgebung V , und wegen U o ⊂ V o folgt mit Lemma VIII.3.8(a) die Kompaktheit von U o aus der von V o . Nun betrachten wir die Abbildung Φ: (X , σ(X , X)) → (KX , τp ),
Φ(x )(x) = x , x.
Es ist klar, daß Φ injektiv ist. Ferner ist die Umkehrabbildung Φ−1 : (Φ(X ), τp ) → (X , σ(X , X)) nach Definition dieser Topologien stetig. Daher reicht es, die τp -Kompaktheit von Φ(U o ) zu zeigen. Sei dazu x ∈ X. Da U absorbierend ist, existiert λx > 0 mit x ∈ λx U ; ahlen. Da U absolutkonvex ist, ist x ∈ U , k¨ onnen und werden wir λx ≤ 1 w¨ folgt |x , x| ≤ λx ∀x ∈ U o . Betrachte Kx = {λ ∈ K: |λ| ≤ λx }. Kx ist kompakt. Nach dem Satz von Tikhonov ist K := {f ∈ KX : f (x) ∈ Kx ∀x ∈ X} τp -kompakt, und wir haben oben Φ(U o ) ⊂ K gezeigt. Es steht nun noch aus, die τp -Abgeschlossenheit von Φ(U o ) in K zu zeigen. Sei f ∈ K im τp -Abschluß von Φ(U o ). Weil der punktweise Limes eines Netzes linearer Abbildungen linear ist (Stetigkeit der Addition und Skalarmultiplikation), ist f eine lineare Abbildung auf X. Da wir λx ≤ 1
414
VIII.
Lokalkonvexe R¨ aume
f¨ ur x ∈ U gew¨ ahlt haben, folgt f (U ) ⊂ {λ: |λ| ≤ 1}. Daher ist f sogar eine stetige lineare Abbildung, also f ∈ Φ(X ). Weil Φ(U o ) in Φ(X ) abgeschlossen ist (denn U o ist es in X ), ist in der Tat f ∈ Φ(U o ). Also ist Φ(U o ) eine abgeschlossene Teilmenge des Kompaktums K und daher selbst kompakt. 2 Als Korollar erhalten wir den urspr¨ unglichen Satz von Alaoglu. Korollar VIII.3.12 Ist X ein normierter Raum, so ist BX σ(X , X)kompakt. Beweis. Wende Theorem VIII.3.11 mit U = BX an. Diejenigen Leser, die nur an diesem Korollar interessiert sind, sollten den obigen Beweis mit U = BX , U o = BX und λx = x lesen. 2 Der Satz von Alaoglu impliziert nicht, daß eine beschr¨ankte Folge von Funktionalen eine σ(X , X)-konvergente Teilfolge besitzt; als Gegenbeispiel betrachte auf ∞ die Folge der Funktionale xn : x → x(n). (Hierzu siehe auch Aufgabe VIII.6.17(f).) Es sei daran erinnert, daß Kompaktheit in topologischen R¨ aumen dadurch charakterisiert ist, daß jedes Netz ein konvergentes Teilnetz hat (Satz B.2.9); auch die obige Folge hat nur ein schwach∗-konvergentes Teilnetz. Korollar VIII.3.13 Jeder Banachraum X ist isometrisch isomorph zu einem abgeschlossenen Unterraum eines Raums C(K) stetiger Funktionen auf einem Kompaktum K. Beweis. Setze K = BX mit der σ(X , X)-Topologie. Nach dem Satz von Hahn-Banach (Korollar III.1.7) ist die Abbildung X → C(K), x → fx , wo fx (x ) = x , x, isometrisch und hat daher . ∞ -abgeschlossenes Bild. 2 Korollar VIII.3.14 Ist X ein normierter Raum und ϕ: BX → R eine schwach∗ -stetige Funktion, so nimmt ϕ sein Infimum und sein Supremum an. Wir kommen jetzt zu einem nichttrivialen Kriterium f¨ ur die σ(X , X)Abgeschlossenheit. Sei X ein normierter Raum. Ist C ⊂ X schwach∗¨ abgeschlossen, so ist C ∩ tBX f¨ ur alle t > 0 schwach∗-abgeschlossen. Uberraschenderweise gilt f¨ ur konvexe Mengen C und Banachr¨aume X auch die Umkehrung dieses Sachverhalts. (Konvexit¨at und Vollst¨andigkeit sind hierf¨ ur wesentlich.) Das ist nicht selbstverst¨andlich, denn BX ist keine σ(X , X)-Nullumgebung. Theorem VIII.3.15 (Satz von Krein-Shmulyan) Ist X ein Banachraum und C ⊂ X konvex, so ist C genau dann schwach∗ abgeschlossen, wenn C ∩ tBX f¨ ur alle t > 0 schwach∗ -abgeschlossen ist.
VIII.3
415
Schwache Topologien
Beweis. Eine Richtung ist klar. Umgekehrt nehmen wir an, daß alle C∩tBX schwach∗-abgeschlossen sind. Wir setzen nun zun¨achst zus¨atzlich 0 ∈ C voraus. In diesem Fall werden wir C als C = K o f¨ ur geeignetes K ⊂ X darstellen, was nach Lemma VIII.3.8 den Satz beweist. Wir werden das Argument hierf¨ ur in einige Zwischenschritte aufteilen. Setze Cn = C ∩ 2n+1 BX ,
Kn = Cno ⊂ X
∀n ∈ N.
Nach Voraussetzung u ¨ber C ist dann Kno = Cnoo = Cn (Satz VIII.3.9). (1) Es ist Kn ⊂ Kn+1 + 2−n int BX f¨ ur alle n ∈ N. Sonst existiert x ∈ Kn mit Kn+1 ∩ {y ∈ X: y − x < 2−n } = ∅. Kn+1 ist (als Polare) konvex und σ(X, X )-abgeschlossen, also erst recht . -abgeschlossen, {y: x − y < 2−n } ist . -offen und konvex, also liefert der Satz von Hahn-Banach (Theorem III.2.4 oder VIII.2.11) ein . stetiges Funktional x und a ∈ R mit Re x (z) ≤ a < Re x (y)
∀z ∈ Kn+1 , x − y < 2−n .
(VIII.5)
Wegen 0 ∈ Kn+1 ist a ≥ 0. Betrachtet man statt x ein positives Vielfaches davon, darf man a = 1 oder a = 0 annehmen, und im letzteren Fall kann man Re x (x) > 1 erzwingen, was im ersteren Fall automatisch gilt (setze o y = x). Aus der ersten Ungleichung in (VIII.5) folgt dann x ∈ Kn+1 = / Cn+1 ⊂ C, aber es ist wegen Re x (x) > 1 und x ∈ Kn andererseits x ∈ Kno = Cn und deshalb x > 2n+1 . Wir k¨ onnen daher u ∈ X mit u < 2−n und Re x (u) > 2 finden. F¨ ur y0 = x − u ergibt sich jetzt aus (VIII.5) Re x (x) = Re x (u) + Re x (y0 ) > Re x (u) > 2.
(VIII.6)
/ Kno = Das liefert nun den erw¨ unschten Widerspruch: (VIII.6) zeigt 12 x ∈ 1 alt 0 und x , daher 2 x ∈ C und Cn ; andererseits ist C konvex und enth¨ folglich 12 x ∈ Cn , denn x ≤ 2n+2 . ur alle n ∈ N. (2) Mit K = n∈N Kn gilt Kn ⊂ K + 2−n+1 BX f¨ Sei n ∈ N. Schreibe xn ∈ Kn nach Behauptung (1) als xn = xn+1 + zn ,
wo xn+1 ∈ Kn+1 , zn ≤ 2−n
sowie xn+1 = xn+2 + zn+1 ,
wo xn+2 ∈ Kn+2 , zn+1 ≤ 2−(n+1)
416
VIII.
Lokalkonvexe R¨ aume
etc. Das liefert f¨ ur k > n die Darstellung xn = xk + (zn + · · · + zk−1 ). ∞ Nach Wahl der zn existiert u = k=n zk im Banachraum X, und es ist −n+1 u (Lemma I.1.8). Daher existiert x := limk→∞ xk , und x ∈ ≤ 2 K = K, denn Kn ⊃ Kn+1 ⊃ . . . , und alle Km sind abgeschlossen. m m∈N Nach Konstruktion ist xn = x + u. (3) F¨ ur A, B ⊂ X und ε > 0 gilt A + B ⊂ (1 + ε) co A ∪ 1ε B . ε . Es ist n¨ amlich a + b = (1 + ε) (1 − λ)a + λ bε mit λ = 1+ε (4) Es ist K o ⊃ C ⊃
1 o 1+ε K
f¨ ur alle ε > 0.
Behauptung (2) und (3) liefern K ⊂ Kn ⊂ K + 2−n+1 BX ⊂ (1 + ε) co(K ∪ 2−n+1 ε−1 BX ), also folgt mit Lemma VIII.3.8 K o ⊃ Kno = Cn ⊃
1 (K o ∩ 2n−1 εBX ) 1+ε
f¨ ur alle n ∈ N. Vereinigung u ¨ ber n zeigt Behauptung (4). (5) Es gilt C = K o . Das erh¨ alt man aus Behauptung (4), denn C ist . -abgeschlossen, wenn alle C ∩ tBX schwach∗-abgeschlossen (folglich . -abgeschlossen) sind. Zum Schluß l¨ osen wir uns von der Zusatzvoraussetzung 0 ∈ C. Dazu zeigen wir: (6) C ∩ tBX ist genau dann f¨ ur alle t > 0 schwach∗ -abgeschlossen, wenn C ∩(x +tBX ) f¨ ur alle t > 0, x ∈ X schwach∗ -abgeschlossen ist. Da die Richtung ⇐“ trivial ist, brauchen wir nur ⇒“ zu zeigen. Seien ” ” also t > 0 und x ∈ X . W¨ ahle r > 0 mit x + tBX ⊂ rBX . Dann ist nach Voraussetzung C ∩ rBX schwach∗-abgeschlossen und daher auch C ∩ (x + tBX ) = (C ∩ rBX ) ∩ (x + tBX ). Um den Satz von Krein-Shmulyan f¨ ur beliebiges konvexes C zu zeigen, w¨ ahle irgendein x0 ∈ C und betrachte C˜ := −x0 + C. Nach (6) trifft die Voraussetzung des Satzes von Krein-Shmulyan auch auf C˜ zu, und wegen 0 ∈ C˜ ist C˜ nach (5) schwach∗-abgeschlossen. Da x → x +x0 ein σ(X , X)Hom¨ oomorphismus ist, ist auch C schwach∗ -abgeschlossen. 2 Das folgende Korollar ist als Satz von Banach-Dieudonn´e bekannt.
VIII.3
Schwache Topologien
417
Korollar VIII.3.16 Sei X ein Banachraum. Ein Untervektorraum U von X ist genau dann schwach∗ -abgeschlossen, wenn seine abgeschlossene Einheitskugel es ist. Beweis. Es ist BU = U ∩BX , und x → tx ist f¨ ur alle t > 0 ein Hom¨oomorphismus bzgl. σ(X , X). 2 Nach dem Studium der schwach∗-Topologie wollen wir abschließend kurz auf die schwache Topologie σ(X, X ) eines Banachraums eingehen. Die Beobachtung ist die folgende: Identifiziert man X durch entscheidende i(x) (x ) = x (x) mit einem Unterraum von X (vgl. Abschnitt III.3), so ist i ein Hom¨ oomorphismus zwischen (X, σ(X, X )) und (i(X), σ(X , X )). Zun¨ achst beweisen wir den Satz von Goldstine. Satz VIII.3.17 F¨ ur einen normierten Raum X ist i(BX ) σ(X , X )-dicht in BX und folglich i(X) σ(X , X )-dicht in X (aber jeweils . -abgeschlossen). Beweis. Das folgt sofort aus dem Bipolarensatz VIII.3.9, angewandt auf 2 i(BX ) und das duale Paar (X , X ). Als Konsequenz erh¨ alt man folgendes Reflexivit¨atskriterium. (Reflexive Banachr¨ aume wurden in Definition III.3.3 eingef¨ uhrt.) Satz VIII.3.18 F¨ ur einen Banachraum X sind ¨aquivalent: (i) X ist reflexiv. (ii) BX ist σ(X, X )-kompakt. Beweis. (i) ⇒ (ii): Nach dem Satz von Alaoglu ist BX stets σ(X , X )kompakt (Korollar VIII.3.12). Die Bemerkung vor Satz VIII.3.17 zeigt die behauptete Implikation. (ii) ⇒ (i): Wieder nach obiger Vorbemerkung ist i(BX ) σ(X , X )-kompakt, also erst recht abgeschlossen. Andererseits ist nach Satz VIII.3.17 i(BX ) σ(X , X )-dicht in BX . Daher ist i(BX ) = BX , und X ist reflexiv. 2 Zum Vergleich von Satz VIII.3.18 mit Theorem III.3.7 siehe S. 450. Beachte: • F¨ ur jeden normierten Raum X ist BX σ(X , X)-kompakt (Satz von Alaoglu, Korollar VIII.3.12). • Genau f¨ ur reflexive X ist BX σ(X, X )-kompakt (Satz VIII.3.18). • Genau f¨ ur endlichdimensionale X ist BX . -kompakt (Satz I.2.7).
418
VIII.
Lokalkonvexe R¨ aume
Am Schluß dieses Abschnitts wollen wir ein in Abschnitt IV.7 gemachtes Versprechen einl¨ osen und die Reflexivit¨ at gleichm¨aßig konvexer R¨aume zeigen (Satz IV.7.12). Sei also X ein gleichm¨ aßig konvexer Banachraum. Wir fassen X als abgeschlossenen Unterraum von X auf und unterscheiden nicht zwischen X und i(X). Sei x0 ∈ SX ; wir werden zeigen, daß jede ε-Kugel um x0 ein Element von X enth¨ alt. Da X normabgeschlossen in X ist, folgt x0 ∈ X, und X ist reflexiv. Zu ε > 0 w¨ahle δ > 0 gem¨ aß der Definition der gleichm¨aßigen Konvexit¨ at von X. Anschließend w¨ ahle ein Funktional x0 ∈ SX mit x0 (x0 ) > 1 − δ. Setze C = {x ∈ X : x (x0 ) > 1 − δ}, C = {x ∈ X: x0 (x) > 1 − δ}. Dann ist C σ(X , X )-offen in X , und es ist C ∩ BX = ∅. Wir zeigen, daß C ∩ BX vom Durchmesser ≤ ε ist: Sind n¨amlich x, y ∈ C ∩ BX , so gilt x0 ((x+y)/2) > 1−δ und deshalb (x+y)/2 > 1−δ. Aus der gleichm¨aßigen Konvexit¨ at folgt x − y ≤ ε nach Wahl von δ. Sei x0 ∈ C ∩ BX fest und B die σ(X , X )-abgeschlossene Kugel B = {x ∈ X : x − x0 ≤ ε}. Wir haben soeben C ∩ BX = C ∩ BX ⊂ B bewiesen; da BX nach dem Satz von Goldstine (Satz VIII.3.17) in BX σ(X , X )-dicht liegt, folgt auch C ∩ BX ⊂ B. (In jedem topologischen Raum gilt f¨ ur Teilmengen M, N, O, wovon O offen ist, die Implikation O ∩ N ⊂ M ⇒ O ∩ N ⊂ M .) Nun ist x0 ∈ C ∩ BX , und deshalb gilt x0 − x0 ≤ ε, wie gew¨ unscht.
VIII.4
Extremalpunkte und der Satz von Krein-Milman
In diesem Abschnitt studieren wir (in der Regel kompakte) konvexe Teilmengen eines lokalkonvexen Raums durch ausgezeichnete Punkte, die Extremalpunkte. Definition VIII.4.1 Sei X ein Vektorraum und K ⊂ X konvex. (a) F ⊂ K heißt Seite von K, falls F konvex ist und x1 , x2 ∈ K, 0 < λ < 1, λx1 + (1 − λ)x2 ∈ F ⇒ x1 , x2 ∈ F gilt. (b) x ∈ K heißt Extremalpunkt von K, falls {x} eine Seite von K ist, mit anderen Worten, falls x1 , x2 ∈ K, 0 < λ < 1, λx1 + (1 − λ)x2 = x ⇒ x1 = x2 = x gilt. ex K bezeichnet die Menge der Extremalpunkte von K.
VIII.4
Extremalpunkte und der Satz von Krein-Milman
' r
r C C
C
C
419
C Cr
r r & r = einige Extremalpunkte Es ist leicht zu sehen, daß man sich in der obigen Definition auf λ = 12 beschr¨ anken kann, denn K ist konvex. Mit anderen Worten sind die Extremalpunkte von K dadurch charakterisiert, daß sie nicht als Mittelpunkt einer (nicht ausgearteten) Strecke in K auftreten. Also ist x ∈ K genau dann ein Extremalpunkt, wenn x=
1 (x1 + x2 ), x1 , x2 ∈ K ⇒ x1 = x2 = x 2
bzw. x ± y ∈ K ⇒ y = 0. Der Beweis des folgenden Lemmas ist klar; es wurde nur des einfacheren Zitierens wegen separat formuliert. Lemma VIII.4.2 Ist K konvex, F ⊂ K eine Seite in K und G ⊂ F eine Seite in F , so ist G eine Seite in K. Speziell gilt ex F = (ex K) ∩ F . Beispiele. (a) Hier zun¨ achst ein triviales Beispiel: In X = R gilt ex[a, b] = {a, b} sowie ex(a, b) = ∅. (b) Ist X = C und K = {λ: |λ| ≤ 1}, so gilt ex K = {λ: |λ| = 1}. (c) Sei X = C[0, 1] und K = {x: 0 ≤ x(t) ≤ 1 ∀t}. Dann besteht ex K nur aus den konstanten Funktionen 0 und 1 (beachte die formale Analogie zu Beispiel (a)!): ex K = {0, 1}. Hier ist ⊃“ klar. Zum Beweis von ⊂“ ” ” sei x ∈ {0, 1}. Wir zeigen, daß x Mittelpunkt einer Strecke in K ist. Die Voraussetzung u ¨ ber x impliziert, daß {t: x(t) ∈ {0, 1}} eine nichtleere offene Menge ist. Betrachte ein t0 mit 0 < x(t0 ) < 1 und eine offene Umgebung U ur t ∈ U , wobei ε hinreichend klein ist, etwa von t0 mit ε ≤ x(t) ≤ 1 − ε f¨ ε = 12 min{x(t0 ), 1 − x(t0 )}. Schließlich w¨ ahle y ∈ C[0, 1] mit y ∞ = ε, y(t0 ) = ε und y |U = 0. Dann ist x ± y ∈ K, also x ∈ ex K. (Siehe Skizze auf der n¨ achsten Seite.) Als Beispiel einer Seite in K erw¨ ahnen wir F := {x ∈ K: x|[0, 1 ] = 1}. 2 (d) Mit derselben Technik zeigt man f¨ ur einen Maßraum (Ω, Σ, μ), X = u.} L∞ (μ) und K = {x ∈ L∞ (μ): 0 ≤ x(t) ≤ 1 f.¨ ex(K) = {χE : E ∈ Σ}.
420
VIII.
Lokalkonvexe R¨ aume
x
y t0 (e) Ist X ein normierter Raum, so ist es h¨aufig wichtig, die Extremalpunkte der abgeschlossenen Einheitskugel BX von X zu kennen. Zun¨achst x gilt stets ex BX ⊂ SX = {x: x = 1}, denn x = λ x
+ (1 − λ)0, falls λ = x . Wir betrachten einige Spezialf¨ alle: • X = C[0, 1]: Im Fall K = R ist dann ex BX = {−1, 1}, und im Fall K = C ist ex BX = {x: |x(t)| = 1 ∀t}. (Das ist im wesentlichen Beispiel (c)). • X = Hilbertraum: Hier ist ex BX = SX , denn aus x ∈ SX , x ± y ∈ BX folgt 1 ≥ x ± y 2 = 1 ± 2 Rex, y + y 2 , daher y 2 ≤ ∓2 Rex, y, so daß y 2 = 0 und folglich y = 0. • X = Lp oder p , 1 < p < ∞: In diesem Fall gilt ebenfalls ex BX = SX (Aufgabe I.4.13). Gilt ex BX = SX , so heißt X strikt konvex. • X = c0 : Hier ist ex BX = ∅; es gibt also in unendlichdimensionalen normierten R¨ aumen beschr¨ ankte abgeschlossene konvexe Mengen ohne Extremalpunkte. Sei n¨ amlich x ∈ Sc0 (andere x kommen ja als Extremalpunkte sowieso nicht in Frage). W¨ahle n mit |x(n)| =: ε ≤ 12 . Dann ist x ± εen ∈ Bc0 . 1 • Auch f¨ ur X = L1 [0, 1] ist ex BX = ∅. Gelte n¨amlich 0 |f (t)| dt = s 1. Da s → 0 |f (t)| dt stetig ist (Satz A.1.10), existiert s0 mit s0 |f (t)| dt = 12 . F¨ ur f1 = 2χ[0,s0 ] f , f2 = 2χ[s0 ,1] f gilt dann 0 fi = 1, f1 = f2 , aber f = 12 (f1 + f2 ). Allgemeiner kann man ex BL1 (μ) = ∅ f¨ ur alle atomfreien“ Maß” r¨ aume (siehe S. 425) zeigen (Aufgabe VIII.6.29). (f) Ein weiteres wichtiges Beispiel im Zusammenhang mit Beispiel (e) ist X = M (T ), wo T ein kompakter topologischer Raum ist und M (T ) den Raum der regul¨ aren Borelmaße auf T bezeichnet. Der Rieszsche Darstellungssatz II.2.5 besagt C(T ) ∼ = M (T ), wo μ ∈ M (T ) das Funktional x → x dμ zugeordnet wird. Im folgenden ist unter Maß stets regul¨ares ” Borelmaß“ zu verstehen.
VIII.4
Extremalpunkte und der Satz von Krein-Milman
421
• ex BM(T ) = {αδt : t ∈ T, |α| = 1}. (Hier ist δt wie u ur t ∈ A, δt (A) = 0 sonst; ¨ blich das Diracmaß δt (A) = 1 f¨ es stellt das Funktional x → x(t) dar.) ⊃“: O.E. ist α = 1. Wir setzen ” P (T ) = {μ ∈ M (T ): μ ≥ 0, μ(T ) = 1}, die (konvexe!) Menge der Wahrscheinlichkeitsmaße. Es ist nicht schwer zu sehen, daß P (T ) eine Seite in BM(T ) ist. Nach Lemma VIII.4.2 ist nur δt ∈ ex P (T ) zu zeigen. Gelte δt ± μ ∈ P (T ). Schreibe μ = rδt + ν, wo r = μ({t}) und ν(A) = μ(A\{t}). Dann ist (1 ± r)δt ± ν ∈ P (T ), und das liefert sofort r = 0 und ν = 0 (berechne den Wert der obigen Maße f¨ ur A = {t} und A ⊂ T \{t}). Also ist μ = 0. ⊂“: μ sei nicht von der Form αδt ; wir werden μ echt konvex kombi” nieren. Die Maßtheorie lehrt, daß in diesem Fall |μ|, die Variation von μ, nicht {0, 1}-wertig ist. [Beweis: Falls |μ| nur die Werte 0 und 1 annimmt, betrachte C = {C ⊂ T kompakt: |μ|(C) = 1}. Wir setzen C0 := C∈C C und behaupten C0 ∈ C . Sonst w¨ are n¨ amlich |μ|(C0 ) = 0, und wegen der Regularit¨ at von |μ| existierte eine offene Menge O ⊃ C0 mit |μ|(O) = 0. Das liefert O ∈ C , also C0 ⊂ O: Widerspruch, denn wegen der endlichen Durchschnittseigenschaft ist C0 = ∅. H¨ atte C0 mehr als einen Punkt, g¨abe es kompakte A, B = C0 mit A ∪ B = C0 . Da nicht beides Nullmengen sein k¨ onnen, ergibt sich ein Widerspruch zur Minimalit¨at von C0 . Also ist C0 = {t} f¨ ur ein t ∈ T , und es folgt |μ| = δt sowie μ = αδt .] W¨ ahle nun eine meßbare Menge A mit 0 < |μ|(A) =: λ < 1. Ferner 1 μ(A ∩ B). Dann sind μi ∈ BM(T ) , sei μ1 (B) = λ1 μ(A ∩ B), μ2 (B) = 1−λ μ1 = μ2 , aber μ = λμ1 + (1 − λ)μ2 . Wir haben mitbewiesen: • F¨ ur die Menge P (T ) der Wahrscheinlichkeitsmaße gilt ex P (T ) = {δt : t ∈ T }. Der folgende Satz von Krein-Milman gibt an, ob und wie K aus der Menge seiner Extremalpunkte zur¨ uckgewonnen werden kann. Beachte, daß ex K = ∅ vorkommen kann! Daher ist das Zur¨ uckgewinnen nur unter Zusatzvoraussetzungen zu erzielen. Wir werden sehen, daß eine topologische Voraussetzung (die Kompaktheit) in lokalkonvexen Hausdorffr¨aumen die rein geometrische Konsequenz ex K = ∅ nach sich zieht. Mehr noch: ex K wird sich sogar als hinreichend umfangreich erweisen. Vorher wird ein Lemma bewiesen, das von eigenem Interesse ist.
422
VIII.
Lokalkonvexe R¨ aume
Lemma VIII.4.3 Sei X ein lokalkonvexer Raum, und seien K1 , . . . , Kn ⊂ X konvex und kompakt. Dann ist K = co(K1 ∪ . . . ∪ Kn ) kompakt. Beweis. Sei Δn =
n (λ1 , . . . , λn ) ∈ Rn : 0 ≤ λi ≤ 1, λi = 1 i=1
sowie f : Δn × K1 × · · · × Kn → X,
f (λ1 , . . . , λn , x1 , . . . , xn ) =
n
λi xi .
i=1
Dann ist f stetig (warum?), und das Bild von f stimmt mit K u ¨ berein (hierzu ben¨ otigt man die Konvexit¨ at der Ki ). Da Δn × K1 × · · · × Kn kompakt ist, ist folglich K kompakt. 2 F¨ ur kompaktes, nicht konvexes S braucht co(S) nicht kompakt zu sein! (Beispiel?) Theorem VIII.4.4 (Satz von Krein-Milman) Sei X ein lokalkonvexer Hausdorffraum, und K ⊂ X sei kompakt, konvex und nicht leer. (a) ex K = ∅. (b) K = co ex K. (c) Gilt K = co B, so ist ex K ⊂ B. Beweis. Der Beweis fußt auf dem Zornschen Lemma und dem Satz von Hahn-Banach. (a) Es sei F die Menge aller abgeschlossenen, nicht leeren Seiten von K. Es ist F = ∅, da K ∈ F . Bez¨ uglich der Inklusion ist F induktiv (nach unten) geordnet, denn der Schnitt abgeschlossener Seiten ist eine abgeschlossene Seite und, da K kompakt ist, nicht leer (endliche Durchschnittseigenschaft!). Sei F0 ein minimales Element von F , das ja nach dem Zornschen Lemma existiert. Wir zeigen, daß F0 aus nur einem Punkt, der dann Extremalpunkt von K sein muß, weil F0 eine Seite ist, besteht. Wir nehmen an, das w¨ are nicht so. Nach dem Satz von Hahn-Banach (Korollar VIII.2.13; hier geht ein, daß X ein Hausdorffraum ist) existieren dann x0 , y0 ∈ F0 , x ∈ X mit Re x (x0 ) < Re x (y0 ). Betrachte nun
F1 =
x ∈ F0 : Re x (x) = sup Re x (y) . y∈F0
VIII.4
423
Extremalpunkte und der Satz von Krein-Milman
Dann ist F1 = ∅, da F0 kompakt und x stetig ist. Ferner ist F1 abgeschlossen sowie eine Seite in F0 (scharf hinsehen!). Nach Lemma VIII.4.2 ist F1 auch eine Seite in K, also F1 ∈ F ; aber wegen x0 ∈ F1 ist F1 F0 im Widerspruch zur Minimalit¨ at von F0 . (b) Setze K1 = co ex K. Dann ist K1 kompakt, konvex und nach (a) nicht leer. Ferner ist nat¨ urlich K1 ⊂ K. W¨ are K1 = K, so existierte x0 ∈ K \ K1 und deshalb nach dem Satz von Hahn-Banach x ∈ X , ε > 0 mit Re x (x) ≤ Re x (x0 ) − ε
∀x ∈ K1 .
(VIII.7)
Betrachte F = {x ∈ K: Re x (x) = supy∈K Re x (y)}. Wie oben sieht man, daß F eine abgeschlossene Seite in K und nicht leer ist. Nach (a) ist ex F = ∅, und nach Lemma VIII.4.2 gilt ex F ⊂ ex K. Andererseits ist nach (VIII.7) (ex K) ∩ F ⊂ K1 ∩ F = ∅, das liefert einen Widerspruch. (c) Sei x ∈ ex K und U eine (o.E. absolutkonvexe und abgeschlossene) Nullumgebung. Wir werden (x + U ) ∩ B = ∅ zeigen. Da B kompakt ist, existieren x1 , . . . , xn ∈ B mit B⊂
n
(xi + U ).
i=1
Setze Ki = co (xi + U ) ∩ B ⊂ co B = K; also sind die Ki kompakt und n konvex. Ferner ist B ⊂ i=1 Ki . Lemma VIII.4.3 impliziert nun K = co B = co B ⊂ co
n i=1
Ki = co
n
Ki ⊂ K,
i=1
n d.h. K = co i=1 Ki . Der gegebene Punkt x ∈ ex K muß daher in einem der Ki liegen. Da U absolutkonvex und abgeschlossen ist, erh¨ alt man Ki ⊂ xi + U und daher x ∈ xi + U f¨ ur ein i. Das liefert xi ∈ (x + U ) ∩ B und unsere Behauptung. Damit ist gezeigt, daß ex K im Abschluß von B liegt; also liegt ex K in B selbst. 2 Dieser Satz ist ein weiterer fundamentaler Satz der Funktionalanalysis; Teil (b) ist der eigentliche Satz von Krein-Milman, w¨ahrend Teil (c) auch die Milmansche Umkehrung des Satzes von Krein-Milman genannt wird. Eine Versch¨ arfung von Teil (a) wird in Aufgabe VIII.6.33 vorgestellt. Wir haben bereits darauf hingewiesen, daß (b) die Reichhaltigkeit von ex K garantiert. Andererseits ist in vielen Beispielen die Menge ex K vergleichsweise klein, so daß Probleme u ¨ber K effektiv auf ex K reduziert werden k¨onnen. (Siehe Aufgabe VIII.6.34 f¨ ur eine Illustration dieser Strategie.) Um den Satz von Krein-Milman anwenden zu k¨onnen, ben¨otigt man kompakte Mengen; der Satz von Alaoglu ist h¨aufig ein probates Mittel,
424
VIII.
Lokalkonvexe R¨ aume
Kompaktheit zu beweisen. Vor einem Fehler sei gewarnt: Der Abschluß in (b) (und (c)) bezieht sich auf dieselbe Topologie, in der K kompakt ist. Ist z.B. X ein normierter Raum und K ⊂ X σ(X , X)-kompakt, σ(X ,X) so sagt (b) nicht K = co ex K, sondern nur K = co ex K. (Es sei denn, K ist sogar . -kompakt.) Dies soll an folgendem Beispiel illustriert werden. Sei K die Menge aller Wahrscheinlichkeitsmaße auf [0, 1]; K ist dann σ(M [0, 1], C[0, 1])-kompakt und konvex. Nach Beispiel (f) besteht co ex K genau aus den Konvexkombinationen der Diracmaße. Also l¨ aßt sich das Lebesguemaß λ durch solche diskreten n Maße approximieren, jedoch nicht in der Normtopologie, da ja λ − i=1 ρi δti = 2 (ρi ≥ 0, n ∗ ρ = 1). Man kann nur in der schwach -Topologie das i i=1 approximieren, heißt, jede schwach∗-Umgebung von λ, sagen wir {μ: | fj dμ− fj dλ| ≤ ε, alt solch ein Maß. Insbesondere bedeutet j = 1, . . . , n} mit fj ∈ C[0, 1], enth¨ das, daß zu f ∈ C[0, 1] und ε > 0 Punkte ti ∈ [0, 1] und ρi ≥ 0, ρi = 1, mit n 1 f (t) dt − ρi f (ti ) ≤ ε 0 i=1
existieren; der Satz von Krein-Milman besagt also in diesem Kontext nichts 1 anderes als die Approximierbarkeit von 0 f (t) dt durch Riemannsche Summen. Wir formulieren einen wichtigen Spezialfall des Satzes von Krein-Milman. Korollar VIII.4.5 Ist X ein normierter Raum, so ist BX = co ex BX , wobei sich der Abschluß auf die schwach∗ -Topologie bezieht. Beweis. Nach dem Satz von Alaoglu ist BX σ(X , X)-kompakt.
2
Korollar VIII.4.6 Die R¨aume c0 und L1 [0, 1] sind nicht zu einem Dualraum eines normierten Raums isometrisch isomorph. Beweis. Sonst bes¨ aßen die abgeschlossenen Einheitskugeln Extremalpunkte, was nach Beispiel (e) nicht der Fall ist. 2 Wir kommen zu einigen Anwendungen. Zuerst geben wir einen funktionalanalytischen Beweis des Satzes von Stone-Weierstraß, der eine Verallgemeinerung der klassischen Weierstraßschen Approximationss¨atze (I.2.10 und IV.2.12) ist. Ist T ein kompakter topologischer Raum, so nennen wir einen Untervektorraum A von C(T ) eine Algebra (oder Unteralgebra), wenn f, g ∈ A ⇒ f · g ∈ A gilt. Es ist leicht zu sehen, daß der Abschluß (bzgl. . ∞ ) einer Algebra eine Algebra ist.
VIII.4
Extremalpunkte und der Satz von Krein-Milman
425
Satz VIII.4.7 (Satz von Stone-Weierstraß) Sei T ein kompakter Raum und A ⊂ C(T ) eine Algebra mit (1) A enth¨alt die konstanten Funktionen, (2) A ist punktetrennend, d.h., zu s, t ∈ T , s = t, existiert f ∈ A mit f (s) = f (t), sowie im Fall K = C (3) A ist selbstadjungiert, d.h. f ∈ A ⇒ f ∈ A. Dann ist A dicht in C(T ) bzgl. . ∞ . Ohne (3) gilt der Satz im Komplexen nicht; denke an die Disk-Algebra aus Beispiel I.1(e). Beweis. Zuerst zum Fall K = R. W¨ are A nicht dicht, so w¨are nach dem Satz von Hahn-Banach K := μ ∈ M (T ): μ ≤ 1, f dμ = 0 ∀f ∈ A = {0}. Aber K ist σ(M (T ), C(T ))-kompakt (Satz von Alaoglu und Rieszscher Darstellungssatz), denn K ist der Schnitt von BC(T ) und Ao ; da A ein Unuhrten Annihilator A⊥ terraum ist, stimmt Ao mit dem in (III.4) eingef¨ u ¨ berein. Daher existiert nach dem Satz von Krein-Milman ein Extremalpunkt μ von K; es ist dann μ = 1. Sei S = supp(μ) der Tr¨ager von μ, das ist die kleinste abgeschlossene Menge mit |μ|(S) = μ . Sei nun f ∈ A mit 0 < f (s) < 1 f¨ ur alle s ∈ S. Betrachte die Maße dμ1 = f dμ, dμ2 = (1−f ) dμ. Es folgt μ1 = 0, μ2 = 0 und, da A eine Algebra ist, μ ˜i := μμii ∈ K. Ferner ist nach Konstruktion μ1 μ ˜1 + μ2 μ ˜2 = μ sowie μ1 + μ2 = (f + 1 − f ) d|μ| = μ = 1. Wegen μ ∈ ex K folgt μ = μ ˜1 , d.h. μ1 dμ = f dμ, und aus der Stetigkeit von f ergibt sich f |S = const. Nach geeigneter Skalierung folgt daher stets (gehe von f u ¨ ber zu α+βf ) f ∈A
⇒
f |S = const.
Wegen (2) muß deshalb S = {t} f¨ ur ein t sein, d.h. μ = λδt f¨ urein |λ| = 1. Wegen 1 ∈ A folgt dann aber aus μ ∈ A⊥ der Widerspruch 1 = 1 dμ = 0. Im Fall K = C garantiert (3), daß die reellwertigen Funktionen in A 1 (f − f )), und der Beweis funktiopunktetrennend sind (f = 12 (f + f ) + i 2i niert wie oben. 2 F¨ ur eine zweite Anwendung ben¨ otigen wir den Begriff des atomfreien Maßes. Ein endliches Maß μ auf einer σ-Algebra Σ heißt atomfrei, falls es zu A ∈ Σ mit |μ|(A) > 0 stets B ∈ Σ, B ⊂ A mit 0 < |μ|(B) < |μ|(A) gibt. Das Lebesguemaß λ auf Rn und alle Maße der Form A → A f dλ mit f ∈ L1 (Rn ) sind atomfrei.
426
VIII.
Lokalkonvexe R¨ aume
Satz VIII.4.8 (Satz von Lyapunov) (a) Ist μ: Σ → [0, ∞) ein atomfreies endliches Maß auf einer σ-Algebra Σ und sind f1 , . . . , fn reellwertige integrierbare Funktionen, so ist R := f1 dμ, . . . , fn dμ : A ∈ Σ ⊂ Rn A
A
kompakt und konvex. (b) Sind μ1 , . . . , μn : Σ → R atomfreie signierte Maße, so ist {(μ1 (A), . . . , μn (A)) : A ∈ Σ} ⊂ Rn kompakt und konvex. Beweis. Mit Hilfe des Satzes von Radon-Nikod´ ym (Satz A.4.6) kann man (b) auf (a) zur¨ uckf¨ uhren (setze μ = |μ1 | + · · · + |μn | und schreibe dμi = fi dμ), daher braucht nur (a) gezeigt zu werden. Dazu betrachte den linearen Operator gfi dμ i=1,...,n . T : L∞ (μ) → Rn , T g = T ist nach Korollar VIII.3.4 stetig, wenn L∞ (μ) die schwach∗-Topologie tr¨ agt (zur Erinnerung: (L1 (μ)) = L∞ (μ), Satz II.2.4), denn die fi sind Elemente von L1 (μ). Setzt man K = {g ∈ L∞ (μ): 0 ≤ g ≤ 1}, so ist nach Beispiel (d) R = T (ex K). Nun ist K konvex und schwach∗-kompakt, denn , g: f g dμ ≥ 0 , K = BL∞ (μ) ∩ f ∈L1 (μ) f ≥0
und deshalb ist T (K) ⊂ Rn ebenfalls kompakt und konvex. Um den Satz von Lyapunov zu beweisen, reicht es daher, R = T (ex K) = T (K) zu zeigen. Zum Beweis hierf¨ ur sei p ∈ T (K). Setze Kp = {g ∈ K: T g = p}. Auch Kp = K ∩T −1 ({p}) ist schwach∗-kompakt und konvex, nach dem Satz von Krein-Milman gilt daher ex Kp = ∅. Die Behauptung ist also gezeigt, wenn ex Kp ⊂ ex K gezeigt ist. In der Tat: Ist g0 ∈ Kp kein Extremalpunkt von K, d.h. nach Beispiel (d) keine Indikatorfunktion, so existieren A ∈ Σ ur t ∈ A und μ(A) > 0. Da μ atomfrei ist, und ε > 0 mit ε ≤ g0 (t) ≤ 1 − ε f¨ gilt dim g ∈ L∞ (μ): g |A = 0} > n; folglich existiert g ∈ L∞ (μ) mit g = 0, g |A = 0 und mit T g = 0. O.E. darf
VIII.5
Einf¨ uhrung in die Distributionentheorie
427
man g L∞ ≤ ε annehmen, so daß dann g0 ± g ∈ Kp gilt. Also ist solch ein 2 g0 kein Extremalpunkt von Kp . Hier ist eine Anwendung des Satzes von Lyapunov. Nehmen wir an, k Personen wollen sich einen Kuchen teilen, der mit verschiedenen Obstsorten belegt ist, die sich auch u urfen. Gibt es (zumindest theore¨berlappen d¨ tisch) eine gerechte“ Aufteilung? Mathematisch gesehen k¨onnen die Bele” gungen als Wahrscheinlichkeitsmaße μ1 , . . . , μn auf einem meßbaren Raum (Ω, Σ) angesehen werden. Das Problem der gerechten Aufteilung besteht dann darin, Ω in paarweise disjunkte A1 , . . . , Ak ∈ Σ so zu zerlegen, daß stets μi (Aj ) = k1 ist. Da es offenkundige Schwierigkeiten gibt, Kirschkerne gerecht zu verteilen, wenn ihre Anzahl nicht durch k teilbar ist, neh men wir die μi als atomfrei an. Nun ist μ (Ω), . . . , μ (Ω) = (1, . . . , 1) 1 n 1 1 und μ1 (∅), . . . , μn (∅) = (0, . . . , 0), daher liegt ( k , . . . , k ) in der konvexen H¨ ulle dieser Vektoren. Nach dem Satz von Lyapunov existiert A1 ∈ Σ mit μ1 (A1 ) = · · · = μn (A1 ) = k1 . Indem man diese Prozedur mit Ω \ A1 statt Ω wiederholt, findet man sukzessive die gew¨ unschten A1 , . . . , Ak . Das Aufteilungsproblem ist also theoretisch l¨ osbar; jedoch haben wir mit dieser Methode nichts u ¨ ber die Geometrie der Aj sagen k¨onnen. Das Modell kann auch anders interpretiert werden: es seien n¨amlich atomfreie Wahrscheinlichkeitsmaße μ1 , . . . , μk vorgelegt, so daß μi (A) die Pr¨aferenz von Person i f¨ ur das Kuchenst¨ uck A mißt. Das Resultat ist dasselbe: es gibt eine Aufteilung, die alle subjektiv als gerecht empfinden.
VIII.5
Einfu ¨hrung in die Distributionentheorie
Die Grundidee der Distributionentheorie ist es, Funktionen f als Funktionale Tf mittels Tf (ϕ) = f (x)ϕ(x) dx (VIII.8) auf geeigneten Funktionenr¨ aumen aufzufassen (vgl. Beispiel VIII.2(a)) und so einen Rahmen zu schaffen, um auch allgemeinere Situationen zu behandeln. Z.B. wird in der theoretischen Physik bisweilen die Existenz einer Deltafunktion“ δ: R → [−∞, ∞] postuliert, die auf R\{0} verschwindet ” ∞ urlich gibt es keine solund die Eigenschaft −∞ δ(x) dx = 1 besitzt. (Nat¨ che Funktion.) Mit etwas Courage l¨ aßt sich dann die Formel ϕ(0) = δ(x)ϕ(x) dx (VIII.9) ableiten. Nun ist es so, daß man nirgends an einem Funktionswert δ(x) interessiert ist, einzig von Bedeutung sind die Integrale vom Typ (VIII.9).
428
VIII.
Lokalkonvexe R¨ aume
Heaviside, Dirac und andere haben einen symbolischen Kalk¨ ul f¨ ur Deltafunktionen entwickelt, um Integrale der Form (VIII.9) wie klassische Integrale der Form (VIII.8) zu behandeln; unter anderem wird durch formales partielles Integrieren die Ableitung δ (x) gewonnen. L. Schwartz ist es gelungen, einen solchen symbolischen Kalk¨ ul mathematisch zu rechtfertigen, indem er den Funktionsstandpunkt aufgab und (VIII.8) und (VIII.9) als lineare Funktionale ϕ → f (x)ϕ(x) dx bzw. ϕ → ϕ(0) interpretierte. Der Funktionenraum X, dem die ϕ entstammen, muß nun topologisiert werden, um Methoden der Funktionalanalysis anwenden zu k¨onnen. Damit m¨ oglichst viele Integrale des Typs (VIII.8) existieren und daher m¨oglichst viele Funktionen im neuen Kontext interpretiert werden k¨onnen, sollte X klein“ sein; da wir andererseits weniger an X als an X interessiert sind, ” sollte die Topologie von X m¨ oglichst fein sein, damit X groß“ ist. ” Es zeigt sich, daß der Raum D(Ω) mit der in Beispiel VIII.1(f) beschriebenen lokalkonvexen Topologie einen idealen Rahmen abgibt. (Hier ist Ω ⊂ Rn offen.) Im folgenden bezeichnen wir diese Topologie mit τ ; die Topologie von DK (Ω) (Beispiel VIII.1(e)) wird mit τK bezeichnet. Letztere kann ¨ aquivalent durch die Halbnormfamilie {p0 , p1 , p2 , . . .} mit pm (ϕ) = sup sup |(Dα ϕ)(x)| |α|≤m x∈Ω
ur K1 ⊂ K2 ; ferner ist DK1 (Ω) erzeugt werden. Beachte DK1 (Ω) ⊂ DK2 (Ω) f¨ τK2 -abgeschlossen in DK2 (Ω). Die Topologie τ wird definitionsgem¨aß von der Familie P derjenigen Halbnormen auf D(Ω) erzeugt, f¨ ur die p|DK (Ω) stets τK -stetig ist; explizit sind das die p, die ∀K ⊂ Ω kompakt ∃c, m ≥ 0 ∀ϕ ∈ DK (Ω)
p(ϕ) ≤ c pm (ϕ)
(VIII.10)
erf¨ ullen (Lemma VIII.2.1). Das folgende Lemma beschreibt einige Eigenschaften von τ ; wir verwenden im Beweis die oben eingef¨ uhrten Bezeichnungen P und pm . Lemma VIII.5.1 (a) Die Relativtopologie von τ auf DK (Ω) stimmt mit τK u ¨ berein. (b) DK (Ω) ist τ -abgeschlossen in D(Ω). (c) (D(Ω), τ ) ist ein Hausdorffraum. (d) Sei Y ein lokalkonvexer Raum und L: D(Ω) → Y eine lineare Abbildung. Dann ist L genau dann τ -stetig, wenn f¨ ur alle kompakten K ⊂ Ω die Restriktion L|DK (Ω) τK -stetig ist. Beweis. (a) Die Relativtopologie wird definitionsgem¨aß von Q = {p|DK (Ω) : p ∈ P } erzeugt. Nach Konstruktion gilt {p0 , p1 , . . .} ⊂ Q ⊂ {q: q ist τK stetige Halbnorm auf DK (Ω)}; es bleibt, Korollar VIII.2.2 anzuwenden.
VIII.5
Einf¨ uhrung in die Distributionentheorie
429
(b) Sei x ∈ Ω. Die Halbnorm πx : ϕ → |ϕ(x)| geh¨ort zu P und ist daher τ -stetig. Also ist DK (Ω) = x∈K / ker πx τ -abgeschlossen. (c) Ist ϕ = 0, etwa ϕ(x) = 0, so bildet die gerade beschriebene Halbnorm πx die Testfunktion ϕ nicht auf 0 ab. Nach Lemma VIII.1.4 ist D(Ω) ein Hausdorffraum. (d) Die Bedingung ist notwendig, wie aus (a) folgt. Daß sie hinreichend ist, ergibt sich aus Satz VIII.2.3: Sei n¨ amlich q eine stetige Halbnorm auf ur alle Kompakta K eine stetige Y . Dann ist q ◦ L|DK (Ω) nach Annahme f¨ Halbnorm auf DK (Ω), d.h. q ◦ L ∈ P . Insbesondere ist q ◦ L τ -stetig, und (iii) aus Satz VIII.2.3 ist erf¨ ullt. 2 Nun widmen wir uns der Konvergenz von Folgen in D(Ω). Im n¨achsten Satz ist es wesentlich, daß (ϕn ) eine Folge und kein Netz ist. Satz VIII.5.2 Sei (ϕn ) eine Folge in D(Ω). Dann sind ¨aquivalent: (i) ϕn → 0 bzgl. τ . ur alle n ∈ N (ii) Es existiert ein Kompaktum K ⊂ Ω mit ϕn ∈ DK (Ω) f¨ sowie ϕn → 0 bzgl. τK . ur alle (iii) Es existiert ein Kompaktum K ⊂ Ω mit supp(ϕn ) ⊂ K f¨ n ∈ N, und f¨ ur alle Multiindizes α konvergiert (Dα ϕn ) gleichm¨aßig gegen 0. Beweis. Da (iii) nur eine Umschreibung von (ii) und (ii) ⇒ (i) trivial ist, reicht es, (i) ⇒ (ii) zu beweisen. Ist dort die Existenz von K gezeigt, folgt der Rest aus Lemma VIII.5.1(a). Nehmen wir an, es g¨ abe kein K wie unter (ii). Dann existieren eine Folge K1 ⊂ K2 ⊂ . . . ⊂ Ω von Kompakta mit n int Kn = Ω und eine Teilfolge (ψn ) von (ϕn ) mit ψn ∈ DKn (Ω), ψn ∈ / DKn−1 (Ω). W¨ahle xn ∈ Kn \ Kn−1 mit αn := |ψn (xn )| > 0. Im letzten Beweis haben wir gesehen, daß die −1 Halbnormen ∞ πn : ϕ → αn |ϕ(xn )| τ -stetig sind. Betrachte nun die Halbnorm π = n=1 πn . Jede kompakte Teilmenge liegt bereits in einem der Kn , ur denn n int Kn = Ω, also gilt D(Ω) = n DKn (Ω). Weil πn |DK (Ω) = 0 f¨ m n > m ist, ist daher π(ϕ) f¨ ur jedes ϕ ∈ D(Ω) eine endliche Summe. Die ¨ Halbnorm π ist also wohldefiniert, und dieselbe Uberlegung zeigt π |D ˜ (Ω) = K
N n=1
˜ ⊂ KN . πn |D ˜ (Ω) , falls K K
Es ist daher π ∈ P ; insbesondere ist π τ -stetig. Einerseits ist nun π(ψn ) ≥ πn (ψn ) = 1; andererseits impliziert ϕn → 0 jedoch π(ψn ) → π(0) = 0. Das ist ein Widerspruch, und die Existenz von K ist gezeigt. 2 Sowohl Lemma VIII.5.1(d) als auch Satz VIII.5.2 lassen erkennen, daß D(Ω) nicht nur mengentheoretisch, sondern auch topologisch“ aus den ” DK (Ω) aufgebaut ist.
430
VIII.
Lokalkonvexe R¨ aume
Wir haben bereits bemerkt, daß unser eigentliches Interesse dem Dualraum von D(Ω) gilt, den wir nun einf¨ uhren. Definition VIII.5.3 Der Dualraum von (D(Ω), τ ) wird mit D (Ω) bezeichnet. Seine Elemente heißen Distributionen auf Ω. Da der Wert einer Distribution bei den ϕ ∈ D(Ω) getestet“ wird, tragen ” diese Funktionen den Namen Testfunktionen. Nach den bisherigen Resultaten dieses Abschnitts k¨onnen Distributionen wie folgt charakterisiert werden; Bedingung (iii) ist dabei die handlichste. Satz VIII.5.4 F¨ ur eine lineare Abbildung T : D(Ω) → C sind ¨aquivalent: (i) T ∈ D (Ω). (ii) F¨ ur alle kompakten K ⊂ Ω ist T |DK (Ω) ∈ (DK (Ω)) . (iii) F¨ ur alle kompakten K ⊂ Ω existieren m ∈ N0 und c ≥ 0 mit |T ϕ| ≤ c pm (ϕ) = c sup sup |(Dα ϕ)(x)| |α|≤m x∈Ω
∀ϕ ∈ DK (Ω).
(iv) Gilt ϕn → 0 in D(Ω), so folgt T ϕn → 0 in C. Beweis. (i) ⇔ (ii) ist ein Spezialfall von Lemma VIII.5.1(d). (ii) ⇔ (iii) folgt aus Korollar VIII.2.4. (i) ⇒ (iv) gilt nach Definition. (iv) ⇒ (ii): Bedingung (iv) impliziert, daß T |DK (Ω) stets folgenstetig ist. ahlbaren Halbnormfamilie erzeugt und ist daher Aber τK wird von einer abz¨ nach Aufgabe VIII.6.17 metrisierbar, so daß T |DK (Ω) sogar stetig ist. 2 Beachte, daß in (iii) m im allgemeinen von K abh¨angt; das ist z.B. in Beispiel (e) so. Sollte das nicht der Fall sein (wie in den Beispielen (a)–(d) unten), nennt man das kleinstm¨ ogliche m die Ordnung von T . Beispiele. (a) Ist f : Ω → Ceine meßbare Funktion, f¨ ur die f¨ ur alle kompakten K ⊂ Ω das Integral K |f (x)| dx endlich ist, nennt man f lokal in1 tegrierbar ; diese Funktionen bilden den Vektorraum Llok (Ω). Identifiziert man zwei fast u ¨ berall u ¨ bereinstimmende Funktionen, erh¨alt man den zu¨ geh¨ origen Raum von Aquivalenzklassen L1lok (Ω). (Wie u ¨blich werden wir 1 die f ∈ Llok (Ω) doch als Funktionen ansehen.) Insbesondere sind stetige Funktionen und Funktionen in Lp (Ω) lokal integrierbar. F¨ ur f ∈ L1lok (Ω) definiere nun Tf (ϕ) = f (x)ϕ(x) dx ∀ϕ ∈ D(Ω). Ω
VIII.5
Einf¨ uhrung in die Distributionentheorie
431
Da f lokal integrierbar ist, ist Tf wohldefiniert und linear. Um zu zeigen, daß Tf eine Distribution ist, sei K ⊂ Ω kompakt. Dann gilt |f (x)| dx sup |ϕ(x)| ∀ϕ ∈ DK (Ω); |Tf (ϕ)| ≤ x∈K
K
damit ist (iii) aus Satz VIII.5.4 erf¨ ullt. Tf heißt die zu f geh¨orige regul¨are Distribution. Wir beobachten noch, daß f → Tf injektiv ist, so daß wir eine Funktion f ∈ L1lok(Ω) mit der Distribution Tf ∈ D (Ω) identifizieren k¨onnen. Ist n¨ amlich Ω f (x)ϕ(x) dx = 0 f¨ ur alle Testfunktionen ϕ, so gilt f = 0 fast u berall. [Beweis hierf¨ u r: Ist K ⊂ Ω kompakt und m hinreichend groß, so ¨ definiert ϕ1/m (x − y) dy Φm (x) = Km
mit ϕ1/m wie im Beweis von Lemma V.1.10 und Km := {x ∈ Ω: d(x, K) ≤ 1 m } eine Folge von Testfunktionen mit Φm → χK punktweise. Der Konvergenzsatz von Lebesgue impliziert nun f (x) dx = lim f (x)Φm (x) dx = 0. K
m→∞
Ω
Da die kompakten Teilmengen einen durchschnittsstabilen Erzeuger der ur alle Borelmengen Borel-σ-Algebra von Ω bilden, folgt A f (x) dx = 0 f¨ A ⊂ Ω (Bauer [1990], S. 26, Behrends [1987], S. 23). Das liefert f = 0 fast u ¨ berall.] ahlt, und betrachte das Funktional δx0 : ϕ → (b) Sei x0 ∈ Ω fest gew¨ ϕ(x0 ). Wegen |ϕ(x0 )| ≤ p0 (ϕ) ist δx0 auf allen DK (Ω) stetig, also ist δx0 eine Distribution, die man Deltadistribution nennt. Ist x0 = 0, schreibt man are Distribution ist, kann man so einsehen. einfach δ. Daß δx0 keine regul¨ Sei Ω0 = Ω\{x0 }. Dann ist δx0 |D(Ω0 ) = 0. W¨are δx0 = Tf , so w¨are, da f → Tf injektiv ist, f |Ω0 = 0 fast u ¨berall, also f = 0 fast u ¨ berall; es w¨are also δx0 = 0, was nicht der Fall ist. (c) Allgemeinerlassen sich alle Borelmaße mit |μ|(K) < ∞ f¨ ur kompakte K durch Tμ (ϕ) = Ω ϕ dμ als Distributionen auffassen. Das Argument von (a) zeigt, daß auch μ → Tμ injektiv ist. (d) Bei der Behandlung des Dipols in der Elektrodynamik spielt die Distribution ϕ → ϕ (0) auf D(R) eine Rolle. In der Tat handelt es sich wegen |ϕ (0)| ≤ p1 (ϕ) um eine Distribution. ∞ (n) (n) ist auf D(R) wohldefiniert (e) Das Funktional T : ϕ → n=0 ϕ und linear. T ist eine Distribution, denn f¨ ur Testfunktionen mit supp(ϕ) ⊂ [−N, N ] gilt N −1 |T ϕ| ≤ |ϕ(n) (n)| ≤ N pN −1 (ϕ). n=0
432
VIII.
Lokalkonvexe R¨ aume
Der mathematische Gewinn der Distributionentheorie ist, daß sich viele f¨ ur Funktionen definierte Operationen auf Distributionen u ¨bertragen lassen und im Distributionensinn h¨ aufig leichter zu handhaben sind. Wir werden hier etwas genauer auf die Differentiation und die Fouriertransformation von Distributionen eingehen, aber vorher einen etwas allgemeineren Standpunkt einnehmen, indem wir wie im normierten Fall den Begriff des adjungierten Operators einf¨ uhren. Definition VIII.5.5 Es seien X und Y lokalkonvexe R¨aume und L ∈ L(X, Y ). Zu y ∈ Y betrachte L (y ) := y ◦ L ∈ X . Die so definierte lineare Abbildung L : Y → X heißt der zu L adjungierte Operator. Aus Satz VIII.3.6 und Korollar VIII.3.4 folgt sofort, daß L σ(Y , Y )σ(X , X)-stetig ist. Nun kommen wir zur Differentiation von Distributionen. In Definition V.1.11 haben wir bereits f¨ ur gewisse L2 -Funktionen eine verallgemeinerte Ableitung definiert. Dieselbe Idee f¨ uhrt nun dazu, allen Distributionen und damit allen (lokal integrierbaren) Funktionen eine Ableitung zuzuordnen; der Preis, den man f¨ ur diese Flexibilit¨ at zu zahlen hat, ist, daß diese Ableitungen i.a. keine Funktionen mehr sind, sondern nur noch Distributionen. Die Rechnung, die uns auf Definition V.1.11 gef¨ uhrt hat, liefert im Kontext der Distributionentheorie f¨ ur stetig differenzierbares f : R → C Tf (ϕ) = −Tf (ϕ )
∀ϕ ∈ D(R);
eine analoge Formel gilt f¨ ur h¨ ohere oder partielle Ableitungen. Das suggeriert folgende Definition. Definition VIII.5.6 F¨ ur T ∈ D (Ω) und einen Multiindex α setze (D(α) T )(ϕ) = (−1)|α| T (Dα ϕ). Lemma VIII.5.7 Die Abbildung D(α) : D (Ω) → D (Ω) ist wohldefiniert und σ(D , D)-stetig. Beweis. Nach Definition ist D(α) = (−1)|α| (Dα ) , also bis auf das Vorzeichen der zu Dα adjungierte Operator. Es ist also nur zu verifizieren, daß Dα : D(Ω) → D(Ω) stetig ist, d.h. nach Lemma VIII.5.1(a) und (d), daß Dα : DK (Ω) → DK (Ω) stetig ist, und das ist wegen pm (Dα ϕ) ≤ pm+|α| (ϕ) klar. 2 Beispiele. (f) Wir haben bereits bemerkt, daß dank des Faktors (−1)|α| f¨ ur stetig differenzierbare Funktionen D(α) Tf = TDα f gilt. Daher ist der Operator D(α) eine Fortsetzung des klassischen Differentialoperators Dα .
VIII.5
433
Einf¨ uhrung in die Distributionentheorie
(g) Die Heavisidefunktion H: R → C ist die Indikatorfunktion des Intervalls [0, ∞), also H(x) = 1 f¨ ur x ≥ 0 und H(x) = 0 f¨ ur x < 0. Ihre Ableitung im Distributionensinn ist (ϕ ∈ D(R)) ∞ (ϕ) = −TH (ϕ ) = − H(x)ϕ (x) dx TH −∞ ∞ 0 ϕ (x) dx = ϕ(x) = ϕ(0); = − ∞
0
= δ, was der heuristischen Interpretation der Deltafunktion“ entalso TH ” spricht. (h) Die Ableitung der Deltadistribution ist
δ (ϕ) = −δ(ϕ ) = −ϕ (0), also ist δ im wesentlichen die Dipoldistribution“ aus Beispiel (d). ” 1 (i) Betrachte die Funktion f , f (x) = − 4π |x|−1 auf R3 \{0} und f (0) = 0, 2 2 2 1/2 wo |x| = (x1 + x2 + x3 ) . Dann ist f ∈ L1lok (R3 ), und wir k¨onnen den Laplaceoperator Δ im Distributionensinn auf Tf anwenden. In Aufgabe VIII.6.38 ist ΔTf = δ zu zeigen; man nennt Tf eine Grundl¨osung f¨ ur den Laplaceoperator. In Abschnitt VIII.7 wird mehr u ¨ ber diesen Begriff und den Zusammenhang zur Theorie partieller Differentialgleichungen berichtet. In Abschnitt V.2 wurde die Fouriertransformierte F f einer Funktion f ∈ L1 (Rn ) bzw. f ∈ S (Rn ) bzw. f ∈ L2 (Rn ) erkl¨art. Hier liefert die Distributionentheorie die M¨ oglichkeit einer umfassenderen Betrachtungsweise. ur ϕ ∈ D(Rn ) Leider ist der Raum D (Rn ) nicht der geeignete Rahmen, da f¨ n nicht unbedingt F ϕ ∈ D(R ) ist (tats¨ achlich ist das bis auf ϕ = 0 nie der Fall). Hingegen wurde in Satz V.2.8 bewiesen, daß F eine Bijektion von S (Rn ) auf sich ist. Das legt es nahe, den adjungierten Operator auf dem Dualraum S (Rn ) zu betrachten. Wir werden als n¨ achstes u ¨ berlegen, daß das wirklich sinnvoll ist. Dazu beweisen wir zuerst ein Lemma. Es sei daran erinnert, daß gem¨aß Beispiel VIII.1(d) S (Rn ) mittels der Halbnormen pα,m (ϕ) = sup (1 + |x|m )|(Dα ϕ)(x)| x∈Rn
topologisiert wird. Ein ¨ aquivalentes Halbnormsystem, das technisch manchmal Vorz¨ uge bietet, wird von den Halbnormen qα,Q (ϕ) = sup |Q(x)(Dα ϕ)(x)| x∈Rn
gebildet, wo Q ein Polynom und α nach wie vor ein Multiindex ist (vgl. (V.9)–(V.11)).
434
VIII.
Lokalkonvexe R¨ aume
Lemma VIII.5.8 (a) F¨ ur jeden Multiindex α ist der Multiplikationsoperator ϕ → xα ϕ wohldefiniert und stetig auf S (Rn ). (b) F¨ ur jeden Multiindex β ist der Differentialoperator ϕ → Dβ ϕ wohldefiniert und stetig auf S (Rn ). (c) Es gibt eine Konstante c ≥ 0 mit |(F ϕ)(ξ)| ≤ c p0,n+1 (ϕ)
∀ϕ ∈ S (Rn ), ξ ∈ Rn .
Beweis. (a) folgt sofort aus der Leibnizformel, und (b) ist klar. F¨ ur (c) bemerke nur dx (2π)n/2 |(F ϕ)(ξ)| = e−ixξ ϕ(x) dx ≤ p (ϕ). 2 n+1 0,n+1 n n 1 + |x| R
R
Satz VIII.5.9 Die Fouriertransformation F und ihre Inverse F −1 sind stetig auf S (Rn ). Beweis. Wir haben nach Satz VIII.2.3 f¨ ur ein Polynom Q, Q(ξ) = aγ ξ γ , und einen Multiindex α qα,Q (F ϕ) = sup Q(ξ) Dα (F ϕ) (ξ) ξ∈Rn
abzusch¨ atzen. Definiert man den Differentialoperator Q(D) = aγ Dγ , so ist nach Lemma V.2.4 und Lemma VIII.5.8(c) Q(ξ) Dα (F ϕ) (ξ) = F Q(D)(xα ϕ) (ξ) ≤ c p0,n+1 Q(D)(xα ϕ) , und nach Lemma VIII.5.8(a) und (b) kann man diesen Term gegen eine geeignete Halbnorm c max pβj ,mj (ϕ) absch¨ atzen. Zusammen hat man qα,Q (F ϕ) ≤ c max pβj ,mj (ϕ)
∀ϕ ∈ S (Rn ),
was zu zeigen war. Wegen Lemma V.2.7 ist auch F −1 stetig.
2
Definition VIII.5.10 (a) Ein Funktional T ∈ S (Rn ) heißt temperierte Distribution. (b) F¨ ur T ∈ S (Rn ) ist die Fouriertransformierte F T durch (F T )(ϕ) = T (F ϕ)
∀ϕ ∈ S (Rn )
erkl¨ art. Da F : S (Rn ) → S (Rn ) stetig ist, ist F T = T ◦ F ein stetiges lineares Funktional; es ist also F T nichts anderes als der adjungierte Operator F angewandt auf T . Weil mit einem Operator auch dessen Adjungierter bijektiv ist, ist wegen Satz V.2.8 die Fouriertransformation eine Bijektion auf S (Rn ). Wir wollen nun den Zusammenhang zwischen D und S kl¨aren.
VIII.5
Einf¨ uhrung in die Distributionentheorie
435
Satz VIII.5.11 (a) Die identische Einbettung j: D(Rn ) → S (Rn ) ist stetig und hat dichtes Bild. (b) j : S (Rn ) → D (Rn ), T → T |D(Rn) , ist injektiv. Beweis. (a) Die Stetigkeit von j ist klar, denn wegen Lemma VIII.5.1(d) ist nur die Stetigkeit der Inklusion von DK (Rn ) in S (Rn ) zu beobachten. Sei ahle Φ ∈ D(Rn ) mit 0 ≤ Φ ≤1,Φ(x) = 1 f¨ ur |x| ≤ 1, nun ϕ ∈ S (Rn ). W¨ Φ(x) = 0 f¨ ur |x| ≥ 2. Setzt man ϕk (x) = ϕ(x)Φ xk , so ist ϕk ∈ D(Rn ), und es gilt ϕk → ϕ bzgl. der Topologie von S (Rn ), wie man unschwer nachweist. (b) ist eine Konsequenz von (a). 2 Das Bild von j besteht aus genau denjenigen Distributionen in D (Rn ), die noch bez¨ uglich einer gr¨ oberen Topologie als der von D(Rn ), n¨amlich n der von S (R ), stetig sind. Insofern kann die Ableitung D(α) T im Sinn von Definition VIII.5.6 verstanden werden. Nach Lemma VIII.5.8(b) ist D(α) T wieder eine temperierte Distribution, wenn T es ist. Genauso ist nach Lemma VIII.5.8(a) xα T : ϕ → T (xα ϕ) temperiert. Aus Lemma V.2.4 folgt nun eine Verallgemeinerung von Lemma V.2.11. Satz VIII.5.12 Ist T ∈ S (Rn ), so gilt F (D(α) T ) = i|α| xα F T . Abschließend sollen einige Beispiele diskutiert werden. Beispiele. (j) Sei 1 ≤ p ≤ ∞ und f ∈ Lp (Rn ). Dann definiert Tf (ϕ) = f (x)ϕ(x) dx Rn
nach Beispiel VIII.2(a) eine temperierte Distribution. F¨ ur p = 1 ist definitionsgem¨ aß (F Tf )(ϕ) = Tf (F ϕ) = f (x)(F ϕ)(x) dx = (F f )(x)ϕ(x) dx = TF f (ϕ); wir haben hier das Analogon zu Gleichung (V.13) benutzt. Also ist die Fouriertransformation temperierter Distributionen eine Ausdehnung der klassischen Fouriertransformation. Dieselbe Zeile zeigt im Fall p = 2, daß die Fouriertransformation auf S (Rn ) auch die Fourier-Plancherel-Transformation fortsetzt. Wegen Lp (Rn ) ⊂ S (Rn ) (Beispiel VIII.2(a)) ist jetzt die Fouriertransformation f¨ ur alle Lp -Funktionen erkl¨ art, aber im Unterschied zum Fall p ≤ 2 (Satz V.2.10) ist f¨ ur 2 < p ≤ ∞ die Fouriertransformierte i.a.
436
VIII.
Lokalkonvexe R¨ aume
keine Funktion mehr, sondern nur noch eine temperierte Distribution. (Beispiel (l) diskutiert einen speziellen Fall, wo dieser Effekt auftritt.) (k) F¨ ur a ∈ Rn ist δa ∈ S (Rn ), wie man leicht sieht. Es ist 1 (F δa )(ϕ) = δa (F ϕ) = (F ϕ)(a) = e−iax ϕ(x) dx. (2π)n/2 Rn Also ist F δa die zur L∞ -Funktion x → (2π)1n/2 e−iax geh¨orige temperierte Distribution, in etwas laxer Schreibweise (F δa )(x) =
1 e−iax . (2π)n/2
(l) Wir berechnen die Fouriertransformierte der konstanten Funktion 1 im Distributionensinn. Die naheliegende Argumentation, (F T1 )(ϕ) definitionsgem¨ aß zu berechnen, scheitert, weil sie auf ein nicht absolut konvergentes Integral f¨ uhrt und der Satz von Fubini nicht anwendbar ist. (Versuche es!) Wir verwenden daher einen Kunstgriff. Setzt man ϕ∗ (x) = ϕ(−x), so gilt n¨ amlich nach Lemma V.2.7 und Beispiel (k) (F T1 )(ϕ) = (2π)n/2 (F F δ)(ϕ) = (2π)n/2 δ(F F ϕ) = (2π)n/2 δ(ϕ∗ ) = (2π)n/2 ϕ(−0) = (2π)n/2 δ(ϕ), also lax F 1 = (2π)n/2 δ.
VIII.6
Aufgaben
Aufgabe VIII.6.1 Sei X ein topologischer Vektorraum. (a) Ist O ⊂ X offen, so auch die konvexe H¨ ulle von O. (b) Zeige ohne Benutzung von Netzen: Ist C ⊂ X konvex, so auch der Abschluß C. Aufgabe VIII.6.2 Sei X ein normierter Raum. Die Einheitssph¨ are SX liegt dann σ(X, X )-dicht in der Einheitskugel BX , falls X unendlichdimensional ist. Aufgabe VIII.6.3 Ein Beispiel f¨ ur einen nicht lokalkonvexen topologischen Vektorraum: Betrachte zu 0 < p < 1 den Vektorraum Lp [0, 1], der wie u ¨ blich definiert ist. Setze 1
|f (t) − g(t)|p dt.
d(f, g) := 0
(a) d definiert eine Metrik auf Lp [0, 1]. (b) Mit dieser Metrik versehen wird Lp [0, 1] zu einem topologischen Vektorraum.
VIII.6
437
Aufgaben
(c) Sei V ⊂ Lp [0, 1] eine offene konvexe Nullumgebung. Dann ist V = Lp [0, 1]. (Hinweis: W¨ ahle ε > 0 mit {f : d(f, 0) ≤ ε} ⊂ V . Sei f ∈ Lp [0, 1]. Betrachte nun f¨ ur großes n eine Zerlegung von [0, 1] in n Intervalle I1 , . . . , In und die Funktionen gj := nχIj f .) (d) Zeige, daß f → 0 das einzige stetige lineare Funktional auf Lp [0, 1] f¨ ur p < 1 ist. Aufgabe VIII.6.4 Sei X ein Vektorraum und P die Menge aller Halbnormen auf X. (X, τP ) ist dann ein lokalkonvexer Raum, und es gelten: (a) (X, τP ) ist ein Hausdorffraum. (b) Alle linearen Abbildungen in einen weiteren lokalkonvexen Raum Y sind stetig. (c) Jeder Unterraum ist abgeschlossen. Aufgabe VIII.6.5 (a) Auf Rn stimmt jede lokalkonvexe Hausdorfftopologie mit der Normtopologie u ¨ berein. (b) Ein endlichdimensionaler Unterraum eines lokalkonvexen Hausdorffraums ist abgeschlossen. Aufgabe VIII.6.6 Sei X ein lokalkonvexer Vektorraum. Eine Teilmenge B ⊂ X heißt beschr¨ ankt, wenn es zu jeder Nullumgebung U ein α > 0 gibt mit B ⊂ αU . (Was sind die in diesem Sinn beschr¨ ankten Teilmengen eines normierten Raums?) Folgende Bedingungen sind dann ¨ aquivalent: (i) B ist beschr¨ ankt. (ii) F¨ ur jede Folge (xn ) in B und jede Nullfolge (αn ) in K ist (αn xn ) eine Nullfolge in X. (Bemerkung: Kolmogorov hat gezeigt, daß die Topologie eines lokalkonvexen Hausdorffraums genau dann von einer einzigen Norm erzeugt werden kann, wenn es eine beschr¨ ankte Nullumgebung gibt (Kolmogorovsches Normierbarkeitskriterium).) Aufgabe VIII.6.7 Betrachte den Schwartzraum S (R). (a) Der Ableitungsoperator Dk : S (R) → S (R), ϕ → ϕ(k) ist stetig. (b) Sei g ∈ S (R). Dann ist der Faltungsoperator Cg : S (R) → S (R),
(Cg ϕ)(x) = (g ∗ ϕ)(x) =
ϕ(y)g(x − y) dy R
stetig. ¨ Aufgabe VIII.6.8 Uberpr¨ ufe die folgenden Funktionale und Operatoren des Schwartzraums S (R) auf Wohldefiniertheit und Stetigkeit: ∞ ur ψ ∈ L∞ (R). (a) T (ϕ) = −∞ ϕ(t)ψ(t) dt f¨ (b) T (ϕ) = ϕ(s) f¨ ur s ∈ R. (c) T (ϕ) = ϕ · ψ f¨ ur ψ ∈ S (R).
438
VIII.
Lokalkonvexe R¨ aume
Aufgabe VIII.6.9 Sei K ⊂ R kompakt, und betrachte auf D K (R) die drei Halbnormfamilien • P = {p0 , p1 , p2 , . . .} mit pn (ϕ) = supx∈K |ϕ(n) (x)|, • Q = {q0 , q1 , q2 , . . .} mit qn (ϕ) = • R = {r0 , r1 , r2 , . . .} mit rn (ϕ) =
K
|ϕ(n) (x)| dx,
K
|ϕ(n) (x)|2 dx
1/2
.
Zeige, daß alle drei Familien dieselbe Topologie erzeugen. Aufgabe VIII.6.10 X und Y seien normierte R¨ aume, T : X → Y sei linear. Dann sind ¨ aquivalent: (i) T ist . - . -stetig. (ii) T ist σ(X, X )-σ(Y, Y )-stetig. (Hinweis: Satz von Banach-Steinhaus!) Aufgabe VIII.6.11 X und Y seien normierte R¨ aume, und es sei T ∈ L(Y , X ). Genau dann ist T σ(Y , Y )-σ(X , X)-stetig, wenn S ∈ L(X, Y ) mit S = T existiert. (Tip: Satz VIII.3.6.) Aufgabe VIII.6.12 X und Y seien normierte R¨ aume, und es sei T ∈ L(X, Y ). Genau dann ist T σ(X, X )- . -stetig, wenn T einen endlichdimensionalen Bildraum hat. Warum widerspricht dieses Resultat nicht Aufgabe III.6.16(b)? (Hinweis: Beweis von Lemma VIII.3.3.) Aufgabe VIII.6.13 Seien X und Y Banachr¨ aume und T ∈ L(X, Y ). Dann sind aquivalent: ¨ (i) T ist kompakt. (ii) T |BY : BY → X ist σ(Y , Y )- . -stetig. Aufgabe VIII.6.14 (Schwach kompakte Operatoren) Ein Operator T zwischen Banachr¨ aumen X und Y heißt schwach kompakt, wenn der Abschluß von T (BX ) schwach kompakt ist. (a) Ist X oder Y reflexiv, ist jeder Operator T ∈ L(X, Y ) schwach kompakt. (b) Der Inklusionsoperator J: C[0, 1] → L1 [0, 1] ist schwach kompakt, aber nicht kompakt. (c) Folgende Aussagen u aumen sind ¨ ber einen Operator zwischen Banachr¨ aquivalent: ¨ (i) T ist schwach kompakt. (ii) ran(T ) ⊂ i(Y ). (iii) T ist σ(Y , Y )-σ(X , X )-stetig. (iv) T ist schwach kompakt. (d) Der Raum W (X, Y ) aller schwach kompakten Operatoren bildet einen abgeschlossenen Unterraum von L(X, Y ). Aufgabe VIII.6.15 Verschwinden L2 -Funktionen im Unendlichen? Auf L2 (R) betrachte zu t ∈ R die Operatoren Tt , definiert durch Tt ϕ(s) = ϕ(t+s) fast u ¨ berall. Untersuche, ob limt→∞ Tt existiert
VIII.6
439
Aufgaben
(a) in der Operatornormtopologie, (b) in der starken Operatortopologie, (c) in der schwachen Operatortopologie. √ Aufgabe VIII.6.16 Betrachte die durch xn = nen definierte Folge (xn ) in 2 . Zeige, daß 0 im schwachen Abschluß der Menge der xn liegt, aber daß keine Teilfolge von (xn ) schwach gegen 0 konvergiert. Aufgabe VIII.6.17 (Metrisierbarkeit lokalkonvexer Topologien) (a) Die Halbnormfamilie P = {p1 , p2 , . . .} erzeuge die Topologie des lokalkonvexen Hausdorffraums X. Zeige, daß durch d(x, y) =
∞ n=1
(b)
(c) (d)
(e)
(f)
2−n
pn (x − y) 1 + pn (x − y)
eine Metrik definiert wird, die dieselbe Topologie erzeugt. (Hinweis: Zeige zun¨ achst a/(1 + a) ≤ b/(1 + b) f¨ ur 0 ≤ a ≤ b.) Ist ein lokalkonvexer Raum metrisierbar, so kann seine Topologie von einer abz¨ ahlbaren Halbnormfamilie erzeugt werden. (Hinweis: Imitiere den Beweis von Satz VIII.1.5 f¨ ur eine abz¨ ahlbare Nullumgebungsbasis.) Eine schwache Topologie σ(X, Y ) ist genau dann metrisierbar, wenn Y eine h¨ ochstens abz¨ ahlbare Vektorraumbasis besitzt. Ist X ein unendlichdimensionaler Banachraum, so ist die schwach∗ -Topologie auf X nicht metrisierbar. (Hinweis: Aufgabe IV.8.2.) Ist X ein separabler normierter Raum, so ist die schwach∗ -Topologie auf BX metrisierbar. 2−n |(x − y )(xn )| f¨ ur geeignete xn .) (Hinweis: d(x , y ) = Mit Hilfe von (e) und dem Satz von Alaoglu l¨ ose erneut Aufgabe III.6.18.
Aufgabe VIII.6.18 Sei X ein separabler Banachraum, und sei A ⊂ X eine oomorph zu schwach∗ -kompakte Teilmenge. Dann ist (A, σ(X , X)) (linear-) hom¨ einer norm-kompakten Teilmenge eines Hilbertraums. Anleitung: Sei (xn ) ⊂ SX ∞ −n eine dichte Folge; setze T : 2 → X, (an ) → 2 a x . Zeige, daß T komn n n=1 pakt ist, und benutze Aufgabe VIII.6.13, um zu schließen, daß (A, σ(X , X)) und oomorph sind. (T (A), . 2 ) hom¨ Aufgabe VIII.6.19 (a) C[0, 1] ist σ(L∞ [0, 1], L1 [0, 1])-dicht in L∞ [0, 1]. (b) L1 [0, 1] ist σ(M [0, 1], C[0, 1])-dicht in M [0, 1]. (Hier ist f ∈ L1 [0, 1] mit f dλ ∈ M [0, 1] zu identifizieren.) Aufgabe VIII.6.20 (a) (X, Y ) sei ein duales Paar, und es sei A ⊂ X. Dann gilt Aooo = Ao . (b) X sei normiert; betrachte das duale Paar (X, X ). Dann gelten BXo = BX und BXo = BX . F¨ ur jeden Unterraum U von X gilt U o = U ⊥ = {x : x |U = 0}.
440
VIII.
Lokalkonvexe R¨ aume
Aufgabe VIII.6.21 Sei X ein reflexiver Banachraum. Dann ist BL(X) kompakt in der schwachen Operatortopologie. (Tip: Versuche den Beweis des Satzes von Alaoglu zu imitieren!) Aufgabe VIII.6.22 (Satz von Mackey-Arens) Sei (E, F ) ein duales Paar. Eine lokalkonvexe Topologie τ auf E heißt mit der Dualit¨ at dieses dualen Paares vertr¨ aglich, falls, nach kanonischer Identifizierung, (Eτ ) = F gilt. Die von den Halbnormen pK (x) = supy∈K |x, y|, wo K ⊂ F σ(F, E)-kompakt und konvex ist, induzierte lokalkonvexe Topologie auf E wird Mackey-Topologie genannt; Bezeichnung μ(E, F ). Ziel der Aufgabe ist der Satz von Mackey-Arens: • Eine lokalkonvexe Topologie τ auf E ist genau dann mit der Dualit¨ at von (E, F ) vertr¨ aglich, wenn σ(E, F ) ⊂ τ ⊂ μ(E, F ) gilt. (a) U := {B o : B ⊂ F konvex und σ(F, E)-kompakt} bildet eine μ(E, F )Nullumgebungsbasis. (b) Sei : E → K linear und μ(E, F )-stetig. Dann existiert eine absolutkonvexe und σ(F, E)-kompakte Menge K ⊂ F mit |(x)| ≤ sup |x, y|
∀x ∈ E.
y∈K
(c) Mit den Bezeichnungen von (b) gilt ∈ K bei kanonischer Inklusion F ⊂ E ∗ := {ϕ: E → K: ϕ linear}. (Hinweis: Arbeite mit dem dualen Paar (E, E ∗ ) und verwende den Satz von Hahn-Banach.) (d) Zeige (Eμ(E,F ) ) = F . (e) Gelte (Eτ ) = F , und sei U eine abgeschlossene konvexe τ -Nullumgebung. Dann ist U ∈ U (siehe Teil (a)). (Hinweis: Betrachte U o .) (f) Beweise den Satz von Mackey-Arens. (g) Sei E ein Banachraum, und betrachte das duale Paar (E, E ). Was ist die Mackey-Topologie μ(E, E )? Aufgabe VIII.6.23 (Lemma von Farkas) Sei X ein reeller lokalkonvexer Raum, und seien x , x1 , . . . , xn ∈ X . Es gelte x1 (x) ≥ 0, . . . , xn (x) ≥ 0 ⇒ x (x) ≥ 0
n
f¨ ur alle x ∈ X. Zeige, daß Skalare aj ≥ 0 mit x = j=1 aj xj existieren. (Tip: Betrachte die Menge C all dieser Konvexkombinationen und zeige mit dem Satz von Hahn-Banach, daß x ∈ C gilt; beachte noch Aufgabe VIII.6.5.) Aufgabe VIII.6.24 Es sei K eine kompakte konvexe nichtleere Teilmenge eines lokalkonvexen Hausdorffraums X. Mit A(K) bezeichne den Banachraum (!) aller affinen stetigen reellwertigen Funktionen auf K, versehen mit der Supremumsnorm. [Eine Funktion x: K → R heißt affin, falls x(λp1 + (1 − λ)p2 ) = ur alle p1 , p2 ∈ K, 0 ≤ λ ≤ 1 gilt.] Definiere δp (x) = x(p). λx(p1 ) + (1 − λ)x(p2 ) f¨ := {δp : p ∈ K} ist eine schwach∗ -kompakte konvexe Teilmenge von (a) K A(K) .
VIII.6
441
Aufgaben
= {x ∈ A(K) : x (1) = 1 = x }. (b) K (Hinweis: Satz von Hahn-Banach!) (c) Schließe, daß es f¨ ur jedes regul¨ are Borelwahrscheinlichkeitsmaß μ auf K einen eindeutig bestimmten Punkt p ∈ K mit
dμ
(p) =
∀ ∈ X
K
gibt. (p heißt der Schwerpunkt von μ. [Warum wohl?]) Aufgabe VIII.6.25 Sei d der Raum der abbrechenden Folgen, versehen mit der Supremumsnorm. d ist also dicht in c0 , und d = (c0 ) = 1 . Betrachte den 2−n sn = 0} von 1 . Dann ist BU σ(1 , d)-abgeschlosUnterraum U = {(sn ): sen, aber U ist es nicht. Man kann also auf die Vollst¨ andigkeit beim Satz von Krein-Shmulyan nicht verzichten. Aufgabe VIII.6.26 Es sei K eine konvexe Teilmenge eines Vektorraums und x ∈ K. (a) Sei F eine konvexe Teilmenge von K. Wenn F eine Seite ist, ist K \ F konvex. (b) Die Umkehrung gilt nicht. (c) x ∈ ex K genau dann, wenn K\{x} konvex ist. Aufgabe VIII.6.27 ur X = 1 und X = ∞ . Folgt (a) Zeige BX = co ex BX (Normabschluß) f¨ das aus dem Satz von Krein-Milman? ur X = ∞ = (1 ) schwach∗ -abgeschlossen, jedoch f¨ ur (b) Zeige, daß ex BX f¨ ∞ X = L [0, 1] = (L1 [0, 1]) schwach∗ -dicht in BX ist. Aufgabe VIII.6.28 Sei H ein Hilbertraum. (a) {T ∈ L(H): T oder T ∗ ist Isometrie} ⊂ ex BL(H) . (b) ex BK(H) = ∅. (Hinweis: Satz VI.3.6.) Aufgabe VIII.6.29 Es sei (Ω, Σ, μ) ein Maßraum. Eine Teilmenge A ∈ Σ heißt Atom, falls f¨ ur B ⊂ A, B ∈ Σ, entweder μ(B) = 0 oder μ(A \ B) = 0 ist. Zeige ex BL1 (μ) = {αχA : A Atom, 0 < μ(A) < ∞, |α| = 1/μ(A)}. Aufgabe VIII.6.30 Sei X ein reflexiver Banachraum, K ⊂ X konvex, be schr¨ ankt und abgeschlossen. Dann gilt K = co ex K. ankt, abgeschlossen und konvex. Dann Aufgabe VIII.6.31 Sei K ⊂ R2 beschr¨ ist ex K abgeschlossen. Gilt dies auch im R3 ? Aufgabe VIII.6.32 Sei X ein normierter Raum und Y ⊂ X ein Unterraum. Sei y ∈ ex BY . Dann existiert x ∈ ex BX mit x |Y = y . (Tip: Betrachte die Menge aller Hahn-Banach-Fortsetzungen!)
442
VIII.
Lokalkonvexe R¨ aume
Aufgabe VIII.6.33 Sei K eine kompakte konvexe Teilmenge eines lokalkonvexen Hausdorffraums X. Eine Teilmenge E ⊂ K heißt extremal, wenn sie die eine Seite definierende Bedingung erf¨ ullt; sie braucht nicht konvex zu sein. Zeige, daß jede abgeschlossene extremale Teilmenge von K einen Extremalpunkt von K enth¨ alt. (Hinweis: Imitiere den Beweis von Teil (a) des Satzes von Krein-Milman.) Aufgabe VIII.6.34 (Bauersches Maximumprinzip) Sei K eine kompakte konvexe Teilmenge eines lokalkonvexen Hausdorffraums X. Dann nimmt jede stetige konvexe Funktion f : K → R ihr Supremum an einem Extremalpunkt von K an. [Eine Funktion f : K → R heißt konvex, falls f (λx1 + ur alle x1 , x2 ∈ K, 0 ≤ λ ≤ 1 gilt.] (1 − λ)x2 ) ≤ λf (x1 ) + (1 − λ)f (x2 ) f¨ (Tip: Betrachte {x ∈ K: f (x) = sup f (K)} und verwende Aufgabe VIII.6.33.) Aufgabe VIII.6.35 Definieren folgende Abbildungsvorschriften Distributionen T ∈ D (Ω)? ∞ (a) Ω = (0, 1), T ϕ = n=2 ϕ(n) ( n1 ). ∞ (n) 1 (b) Ω = R, T ϕ = n=1 ϕ ( n ).
2π
(c) Ω = R2 , T ϕ = 0 ϕ(cos α, sin α) dα. (d) Gibt es eine Distribution S ∈ D (R), die T aus (a) fortsetzt (beachte D (0, 1) ⊂ D (R))? Widerspricht das dem Satz von Hahn-Banach? Aufgabe VIII.6.36 Zeige, daß durch den Cauchyschen Hauptwert
6
∞
ϕ(x) dx := lim ε→0 x
T ϕ = CH−∞
−ε
−∞
ϕ(x) dx + x
ε
∞
ϕ(x) dx x
7
eine Distribution T ∈ D (R) definiert wird. Ist T regul¨ ar? Aufgabe VIII.6.37 (Multiplikation von Funktionen und Distributionen) (a) Sei Ω ⊂ Rn offen. Ist f ∈ C ∞ (Ω) und T ∈ D (Ω), so setze (f T )(ϕ) = T (f ϕ) f¨ ur ϕ ∈ D (Ω). Zeige, daß f T eine Distribution ist. (b) Im Fall n = 1 gilt die Produktregel (f T ) = f T + f T . ullen f δ = 0, und welche erf¨ ullen f δ = 0? (c) Welche f ∈ C ∞ (R) erf¨ (Bemerkung: L. Schwartz hat gezeigt, daß das Produkt von zwei beliebigen Distributionen nicht auf sinnvolle Weise erkl¨ art werden kann; siehe C. R. Acad. Sc. Paris 239 (1954) 847–848.) 1 |x|−1 Aufgabe VIII.6.38 Definiere eine Funktion f : R3 → R durch f (x) = − 4π 1 3 f¨ ur x = 0 und f (0) = 0. Zeige f ∈ Llok (R ) und ΔTf = δ im Distributionensinn. (Hinweis: Tf (Δϕ) = limε→0 {|x|≥ε} f (x)Δϕ(x) dx und Greensche Formel (= partielle Integration).)
Aufgabe VIII.6.39 ur geeignete Konstanten (a) Sei f : Rn → C eine meßbare Funktion, die f¨ ur alle x ∈ Rn N ∈ N und c ≥ 0 einer Absch¨ atzung |f (x)| ≤ c(1 + |x|N ) f¨ gen¨ ugt. (Solch eine Funktion heißt langsam wachsend.) Dann ist Tf eine temperierte Distribution.
VIII.6
443
Aufgaben
(b) Zeige, daß die Funktion x → ex cos(ex ) (x ∈ R) eine temperierte Distribution definiert (wie?), x → ex aber nicht. Aufgabe VIII.6.40 F¨ ur eine Folge (Mn ) positiver reeller Zahlen und eine Folge (mn ) nichtnegativer ganzer Zahlen definiere eine Halbnorm auf D (R) durch q(Mn ),(mn ) (ϕ) =
∞
Mn
n=1
mn
sup |x|≥n−1
|ϕ(k) (x)| .
k=0
Dann erzeugt das System Q all dieser Halbnormen die Topologie von D (R). ober ist, ist einfach. Umgekehrt ist eine auf allen D K (R) Anleitung: Daß τQ gr¨ stetige Halbnorm p durch endlich viele q ∈ Q abzusch¨ ∞ atzen. Dazu arbeite mit ϕ = 1, 0 ≤ ϕn ≤ 1, so einer Zerlegung der Eins, das sind ϕn ∈ D (R) mit n=1 n daß supp(ϕn ) ⊂ {x: n − 1 ≤ |x| ≤ n + 1}. Aufgabe VIII.6.41 (Lokale Darstellbarkeit von Distributionen) (a) Sei T ∈ D (R). Zu jeder kompakten Menge K ⊂ R gibt es eine Funktion f ∈ C(R) und eine Zahl k ∈ N0 , so daß
Tϕ =
f (x) R
dk ϕ (x) dx dxk
∀ϕ ∈ D K (R).
(VIII.11)
Kurz: Jede Distribution kann lokal durch mehrfaches Ableiten einer stetigen Funktion gewonnen werden. d . W¨ ahle m so, daß |T ϕ| ≤ C max{|Dn ϕ(x)|: (Anleitung: Setze D := dx x ∈ R, n ≤ m} f¨ ur ϕ ∈ D K (R). Zeige dann |T ϕ| ≤ C K |Dm+1 ϕ|, und arte Funktional setze das auf Dm+1 (D K (R)) durch Dm+1 ϕ → T ϕ erkl¨ auf L1 (K) fort. Beachte noch (L1 (K)) ∼ = L∞ (K).) ∞ (n) (b) Betrachte T ∈ D (R), T ϕ = ϕ (n). Zeige, daß es nicht m¨ oglich n=0 ist, f¨ ur T eine Darstellung (VIII.11) anzugeben, die f¨ ur alle ϕ ∈ D (R) gilt. ur (c) Untersuche, ob es f¨ ur T ∈ S (R) eine Darstellung (VIII.11) gibt, die f¨ alle ϕ ∈ S (R) gilt. Aufgabe VIII.6.42 (Distributionen mit kompaktem Tr¨ ager) (a) Man sagt, eine Distribution T ∈ D (Ω) habe kompakten Tr¨ ager, falls es ein Kompaktum K ⊂ Ω gibt, so daß T ϕ = 0 gilt, falls supp(ϕ) ∩ K = ∅. ager Sei f ∈ C(Ω). Dann hat die regul¨ are Distribution Tf kompakten Tr¨ genau dann, wenn f kompakten Tr¨ ager hat. (b) D (Ω) liegt dicht in E (Ω). (E (Ω) wurde in Beispiel VIII.1(c) erkl¨ art.) (c) T ∈ D (Ω) hat genau dann kompakten Tr¨ ager, wenn T stetig bez¨ uglich der Topologie von E (Ω) ist. (d) Es gibt einen Isomorphismus zwischen E (Ω) und {T ∈ D (Ω): T hat kompakten Tr¨ ager}. urlicher Weise. (e) Es gilt E (Rn ) ⊂ S (Rn ) in nat¨
444
VIII.7
VIII.
Lokalkonvexe R¨ aume
Bemerkungen und Ausblicke
Die offizielle“ Definition eines lokalkonvexen Raums taucht zuerst bei von ” Neumann (Trans. Amer. Math. Soc. 37 (1935) 1–20) auf; er geht von einem System U mit den Eigenschaften (1)–(7) aus Abschnitt VIII.1 aus und zeigt die a ¨quivalente Beschreibung mittels Halbnormen. Bereits vorher (Math. Ann. 102 (1929) 370–427) hatte er die schwache Topologie eines Hilbertraums H studiert, mit Hilfe des Beispiels von S. 403 gezeigt, daß Folgen in diesem Kontext inad¨ aquat sind, und die starke und schwache Operatortopologie auf L(H) eingef¨ uhrt. Kurz darauf beobachtete Wehausen (Duke Math. J. 4 (1938) 157–169), daß auch f¨ ur lokalkonvexe R¨aume der Satz von Hahn-Banach zur Verf¨ ugung steht. Die eigentliche Theorie der lokalkonvexen R¨aume wurde zwischen 1935 und 1955 von J. Dieudonn´e, A. Grothendieck, G. K¨othe und L. Schwartz entwickelt. Sie setzten sich das Ziel, die f¨ ur die Analysis relevanten R¨aume zu untersuchen und ihre strukturell wesentlichen Eigenschaften herauszustellen. Eine auch heute noch lesenswerte Zusammenstellung der Resultate aus dieser Epoche findet sich in Dieudonn´es Artikel in Bull. Amer. Math. Soc. 59 (1953) 495–512. Hier wollen wir nur kurz auf einige die Distributionentheorie betreffende Ergebnisse eingehen. Sei (X, τP ) ein lokalkonvexer Raum. Er wird vollst¨andig genannt, wenn jedes Cauchynetz (das ist ein Netz (xi ), das ∀p ∈ P ∀ε > 0 ∃i0 ∈ I ∀i, j ≥ i0
p(xi − xj ) ≤ ε
erf¨ ullt) konvergiert. In diesem Sinn ist D(Ω) vollst¨andig, was einen Hinweis darauf gibt, daß die auf D(Ω) betrachtete Topologie die richtige“ ist. Ist ” P abz¨ ahlbar, so ist X gem¨ aß Aufgabe VIII.6.17 metrisierbar, und X ist genau dann vollst¨ andig, wenn X mit der dort betrachteten Metrik d als metrischer Raum vollst¨ andig ist, und das wiederum ist ¨aquivalent dazu, daß jede Metrik d, die die Topologie erzeugt und translationsinvariant ist (d.h. d(x, y) = d(x + z, y + z) f¨ ur alle x, y, z ∈ X), vollst¨andig ist. In diesem Fall nennt man X einen Fr´echetraum; Beispiele f¨ ur Fr´echetr¨aume sind die R¨ aume DK (Ω), S (Rn ) und E (Ω). Da in Fr´echetr¨aumen nach Satz IV.1.1 der Bairesche Kategoriensatz gilt, u ¨ berrascht es nicht, daß die S¨atze aus Kapitel IV, insbesondere der Satz von der offenen Abbildung und der Satz vom abgeschlossenen Graphen, auch f¨ ur diese R¨aume g¨ ultig sind. Korollar IV.2.5 kann man leicht auf eine noch gr¨ oßere Klasse von lokalkonvexen R¨ aumen ausdehnen, die wie folgt erkl¨ art ist. Nach Bourbaki wird eine abgeschlossene absorbierende absolutkonvexe Teilmenge eines lokalkonvexen Raums X eine Tonne genannt, und X heißt tonneliert, falls jede Tonne eine Nullumgebung ist. Der Bairesche Kategoriensatz liefert unmittelbar, daß jeder Fr´echetraum tonneliert ist, und es ist nicht schwer, folgenden Satz zu zeigen.
VIII.7
445
Bemerkungen und Ausblicke
• Ist X tonneliert und ist (n ) eine Folge von stetigen linearen Funktionalen auf X, die punktweise gegen das lineare Funktional konvergiert, so ist auch stetig. (Der Beweis ergibt sich daraus, daß V := n {x: |n (x)| ≤ ε} eine Tonne ist und |(x)| ≤ ε f¨ ur x ∈ V gilt.) Die N¨ utzlichkeit dieses Satzes liegt nun darin, daß z.B. D(Ω) tonneliert ist, ohne ein Fr´echetraum zu sein. Um ersteres einzusehen, beschreiben wir die Topologie von D(Ω) erneut von einem abstrakten Standpunkt aus. Die Topologie von D(Ω) war ja aus denen aller DK (Ω) zusammengesetzt“; man u ¨ berlegt sich nun, daß man ” dieselbe Topologie erh¨ alt, wenn man statt aller DK (Ω) irgendeine Folge von kompakten Teilmengen von Ω mit K1 ⊂ int K2 ⊂ K2 ⊂ . . . ⊂ Ω und ahlt. Abstrakt m Km = Ω betrachtet und nur die Xm := DKm (Ω) ausw¨ gesehen, liegt nun folgende Situation vor. Gegeben ist ein Vektorraum X (= D(Ω)) und eine aufsteigende Folge von Untervektorr¨aumen (Xm ) mit agt eine lokalkonvexe Topologie τm , so daß die m Xm = X. Jedes Xm tr¨ Relativtopologie von τm+1 auf Xm stets mit τm u ¨ bereinstimmt. Dann generiert die Menge P aller Halbnormen p auf X, f¨ ur die p|Xm stets τm -stetig ist, eine lokalkonvexe Topologie auf X, die die Topologie des strikten induktiven Limes genannt wird. F¨ ur diese Topologie gilt Lemma VIII.5.1 aume, so nennt man X einen strikentsprechend. Sind alle Xm Fr´echetr¨ ten (LF)-Raum. Diese Konstruktion stammt von Dieudonn´e und Schwartz (Ann. Inst. Fourier 1 (1950) 61–101), die zeigen, daß ein strikter (LF)Raum praktisch alle Eigenschaften eines Fr´echetraums besitzt, ohne selbst einer zu sein. Insbesondere ist ein strikter (LF)-Raum ebenfalls tonneliert, und deshalb gilt: • Der Limes einer punktweise konvergenten Folge von Distributionen ist eine Distribution. Diese Aussage kann man auch direkt beweisen; sie soll uns hier als Illustration der Prinzipien der allgemeinen lokalkonvexen Theorie dienen, die detailliert z.B. bei K¨ othe [1966, 1979], Tr`eves [1967] oder Meise/Vogt [1992] beschrieben ist. Die wohl profundeste Aussage der Distributionentheorie ist der Kernsatz von Schwartz, der folgendes besagt. • Sei B: D(Ω) × D(Ω) → C eine partiell stetige Bilinearform. Dann existiert eine Distribution K ∈ D (Ω × Ω) mit B(ϕ, ψ) = K(ϕ ⊗ ψ)
∀ϕ, ψ ∈ D(Ω).
Dabei ist (ϕ ⊗ ψ)(x, y) = ϕ(x)ψ(y). Ein analoger Satz gilt f¨ ur temperierte Distributionen.
446
VIII.
Lokalkonvexe R¨ aume
Bevor wir auf die Bedeutung dieses Satzes zu sprechen kommen, soll seine Stellung in der lokalkonvexen Theorie kommentiert werden. Grothendieck ( Produits tensoriels topologiques et espaces nucl´eaires“, Mem. Amer. ” Math. Soc. 16 (1955)) ist es n¨ amlich gelungen, eine Eigenschaft des Raums D(Ω), Nuklearit¨ at genannt, zu isolieren, die er als f¨ ur die G¨ ultigkeit des Kernsatzes entscheidend erkannt hat. Diese ist so definiert. Sei p eine stetige Halbnorm auf einem lokalkonvexen Raum X. Auf dem Quotientenvektorraum X/ ker(p) induziert p eine Norm, und wir betrachten die Vervollst¨ andigung Xp dieses normierten Raums. Ist q ≥ p eine weitere stetige Halbnorm, so kann ein kanonischer Operator Iq,p : Xq → Xp als stetige Fortsetzung der Abbildung x + ker(q) → x + ker(p) definiert werden. (X, τP ) wird nuklear genannt, wenn f¨ ur alle p ∈ P eine Halbnorm q ∈ P , q ≥ p, existiert, so daß Iq,p ein nuklearer Operator (Definition VI.5.1) zwischen den Banachr¨ aumen Xq und Xp ist. Beispiele nuklearer R¨aume sind D(Ω), S (Rn ), E (Ω) und ihre Dualr¨aume (mit der schwach∗-Topologie). Die Eigenschaften nuklearer R¨aume lassen diese den endlichdimensionalen R¨ aumen weit ¨ ahnlicher erscheinen, als es etwa die Hilbertr¨ aume sind; z.B. sind in vollst¨ andigen nuklearen R¨aumen beschr¨ankte (Aufgabe VIII.6.6) abgeschlossene Mengen kompakt. Einen Beweis des Kernsatzes von diesem abstrakten Standpunkt aus findet man etwa bei Tr`eves [1967], direktere Argumente geben Dieudonn´e [1982] und H¨ormander [1990]. Seien X und Y lokalkonvexe Funktionenr¨aume auf Ω, so daß die kanonischen Einbettungen von D(Ω) nach X und von Y nach D (Ω) (mit der schwach∗-Topologie) stetig sind. Ist u: X → Y ein stetiger Operator, so induziert u einen stetigen Operator v: D(Ω) → X → Y → D (Ω) und weiter eine partiell stetige Bilinearform B: (ϕ, ψ) → v(ϕ) (ψ). Nach dem Kernsatz kann B durch eine Kerndistribution K dargestellt werden. Ist z.B. X = Y = L2 (R) und u ein Hilbert-Schmidt-Operator mit L2 -Kern k (vgl. Satz VI.6.3), so ist K nichts anderes als die zu k geh¨orige regul¨are Distribution. Will man aber den identischen Operator auf L2 (R) als Integraloperator mit einem Kern darstellen, scheitert man; der Kern ist nun eine δ-Funktion auf der Diagonalen“, n¨ amlich die Distribution ” K(φ) = φ(x, x) dx ∀φ ∈ D(R2 ). R
Der Kernsatz gestattet es also, praktisch alle Operatoren zwischen Funktionenr¨ aumen als Kernoperatoren mit Distributionskernen darzustellen. Solche Kerne tauchen in den Anwendungen oft als Greensche Funktionen f¨ ur Differentialgleichungen auf. Mit dem Kernsatz hat man in der Regel als erstes einen Existenzsatz f¨ ur Greensche Distributionen“, durch weitere ” Analysen kann man dann versuchen zu zeigen, daß eine solche Distribution
VIII.7
Bemerkungen und Ausblicke
447
außerhalb der Diagonalen eine C ∞ -Funktion ist. Hier hat sich der Kalk¨ ul der Pseudodifferentialoperatoren als sehr hilfreich erwiesen. F¨ ur Einzelheiten sei auf die Spezialliteratur (etwa Dieudonn´e [1982, 1983]) verwiesen; ¨ einen Uberblick gibt Dieudonn´e [1981], S. 252ff. Die Greenschen Funktionen sind eng verwandt mit den Grundl¨osungen f¨ ur Differentialoperatoren. Ist L ein linearer Differentialoperator mit C ∞ -Koeffizienten auf D (Rn ), so bezeichnet man eine Distribution Ea mit ur L im Punkt a. Um die Bedeutung dieL(Ea ) = δa als Grundl¨osung f¨ ses Begriffs zu erkennen, betrachte man den adjungierten Operator L auf D(Rn ). Ist ϕ ∈ D(Rn ) eine L¨ osung von L (ϕ) = ψ, wo ψ ∈ D(Rn ) vorausgesetzt ist, so gilt notwendig Ea (ψ) = Ea (L (ϕ)) = (LEa )(ϕ) = δa (ϕ) = ϕ(a).
(VIII.12)
−1 Mit diesem Begriff werden die klassischen Grundl¨osungen −1 des La4π |x| −3/2 2 placeoperators bzw. (4πt) exp(−|x| /4t) des W¨armeleitungsoperators ∂ 3 ∂t − Δ auf R verallgemeinert (vgl. Aufgabe VIII.6.38). Hat L konstante Koeffizienten, kann man mit Hilfe der von Schwartz eingef¨ uhrten Faltung von Distributionen eine (VIII.12) entsprechende Formel zeigen, n¨amlich
L(E0 ∗ ψ) = ψ, die eine L¨ osung von L(T ) = ψ angibt, aber nur im Distributionensinn. Daher ist es wichtig zu wissen, ob ein Differentialoperator Grundl¨osungen besitzt. Der Satz von Ehrenpreis-Malgrange beantwortet diese Frage. • Ist L = 0 ein linearer Differentialoperator mit konstanten Koeffizienten, so besitzt L Grundl¨osungen Ea ∈ D . Dieser Satz wird z.B. in Rudin [1991] bewiesen; an entscheidender Stelle wird der Satz von Hahn-Banach benutzt. Tats¨ achlich gibt es sogar Grundl¨osungen in S , wie von H¨ ormander 1958 und L ojasiewicz 1959 gezeigt wurde. Verschiedene andere Beweismethoden werden von Ortner und Wagner in ihrer Note in S. Dierolf, S. Dineen, P. Doma´ nski (Hg.), Functional Analysis, de Gruyter 1996, S. 343–352, gegen¨ ubergestellt; insbesondere bringen sie eine Variante von K¨ onigs Beweis (Proc. Amer. Math. Soc. 120 (1994) 1315– 1318), der eine explizite Formel f¨ ur eine Grundl¨osung angibt. Gerade wurde bemerkt, daß f¨ u r einen linearen Differentialoperator L = (α) mit konstanten Koeffizienten die Gleichung L(T ) = ψ f¨ ur |α|≤m aα D ψ ∈ D(Rn ) eine L¨ osung in D (Rn ) besitzt. Es erhebt sich die Frage, wann jede solche Distributionenl¨ osung eine klassische L¨osung, d.h. ∈ E (Rn ) ist. Differentialoperatoren mit dieser Eigenschaft werden hypoelliptisch genannt, sie k¨ onnen mit Hilfe der Nullstellenmenge des assoziierten Polynoms P (x) = α ormander). Beispiele sol|α|≤m aα x charakterisiert werden (Satz von H¨ cher Operatoren sind die elliptischen Differentialoperatoren, die durch die α a x = 0 f¨ u r x = 0 definiert sind, insbesondere der Forderung α |α|=m
448
VIII.
Lokalkonvexe R¨ aume
Laplaceoperator. Auch parabolische Operatoren wie der W¨armeleitungsoperator ∂/∂t − Δ sind hypoelliptisch; hingegen sind der zeitabh¨angige Schr¨ odingeroperator ∂/∂t−iΔ oder hyperbolische Operatoren wie der Wellenoperator ∂ 2 /∂ 2 t − Δ nicht hypoelliptisch. Beim Beweis solcher Regularit¨ atss¨ atze spielt das Lemma von Sobolev, Satz V.2.12, eine entscheidende Rolle. Die dort verwendeten Sobolevr¨ aume lassen sich u ¨ brigens jetzt leichter handhaben, denn die W m (Ω) lassen sich als Hilbertr¨aume von (regul¨aren) Distributionen auffassen. Es sollte noch erw¨ ahnt werden, daß Sobolev der erste war, der Distributionen und ihre Ableitungen definiert hat; unser Satz VIII.5.4(iii) ist seine Definition (Mat. Sbornik 1 (1936) 39–72). Jedoch war es Schwartz, der einen allgemein anwendbaren geschmeidigen Kalk¨ ul entwickelt hat; insuhrt und so der Fourierbesondere hat er die R¨ aume S und S eingef¨ transformation einen vollkommen neuen Aspekt verliehen. Weitere Beitr¨ age von ihm sind die R¨ aume E und E , die Faltung und das Tensorprodukt von Distributionen, auf die dieser Text nicht eingeht. Geschichte und Vorgeschichte der Distributionentheorie (der Name Distribution“ stammt ” u utzen [1982] analysiert; er schreibt ¨ brigens von Schwartz) werden von L¨ (S. 64): Thus Sobolev invented distributions, but it was Schwartz who ” created the theory of distributions.“ Weitergehende Darstellungen findet man in Schwartz’ klassischer, erstmals 1950/51 erschienener Monographie (Schwartz [1966]) sowie bei Rudin [1991], Tr`eves [1967], H¨ormander [1990] oder in dem einf¨ uhrenden Text von Al-Gwaiz [1992]. Im Beispiel des Abschnitts VII.1 sind wir auf das Ph¨anomen der ver” allgemeinerten Eigenvektoren“ gestoßen. Die Distributionentheorie und die Theorie der nuklearen R¨ aume (siehe oben) gestatten es, die Diagonalisierung eines Operators mittels solcher Elemente pr¨azise zu formulieren. Es seien H ein Hilbertraum und T : H ⊃ dom(T ) → H ein dicht definierter symmetrischer Operator, der dom(T ) in sich u uhrt. T besitze eine ¨berf¨ selbstadjungierte Erweiterung S: H ⊃ dom(S) → H. Wir nehmen ferner an, daß X := dom(T ) eine lokalkonvexe Topologie τ tr¨agt, so daß T : (X, τ ) → (X, τ ) und die identische Einbettung i: (X, τ ) → (H, . ) stetig sind. Dann ist i : H → X injektiv und schwach∗-stetig, und wenn man H nach dem Satz von Fr´echet-Riesz mit H identifiziert, erh¨alt man Inklusionen X ⊂ H ⊂ X ; man beschreibt diese Situation als Gelfandschen Dreier. Als Beispiel denke man an S (R) ⊂ L2 (R) ⊂ S (R) oder ur einen Physiker ist D(R) ⊂ L2 (R) ⊂ D (R) und (T ϕ)(t) = tϕ(t). F¨ nun klar, daß dieser Operator δ-Funktionen als Eigenfunktionen besitzt: urlich ist diese Gleichung sinnlos, aber wenn man statt T δλ = λδλ . Nat¨ T den adjungierten Operator T auf S betrachtet, ist T δλ = λδλ eine sinnvolle (und wahre) Aussage u ¨ ber temperierte Distributionen. In der allgemeinen Situation wird man also versucht sein, nicht Eigenvektoren von T , sondern solche von T zu suchen. Ist (X, τ ) nuklear (wie z.B. D oder S ), kann man tats¨ achlich zeigen, daß es ein vollst¨andiges“ System solcher ” verallgemeinerter Eigenvektoren gibt.
VIII.7
449
Bemerkungen und Ausblicke
Um dieses Resultat zu beschreiben, nehmen wir der Einfachheit halber an, die selbstadjungierte Erweiterung S von T besitze einen zyklischen Vektor ξ ∈ X, d.h. lin{ξ, Sξ, S 2 ξ, . . .} = H. Es sei E das Spektralmaß von S und μ wie in Satz VII.1.20 das endliche positive Maß dEλ ξ, ξ; beachte, daß S diesmal unbeschr¨ ankt sein darf. Dann gilt folgender Satz von Gelfand und Kostyuchenko (siehe Gelfand/Vilenkin [1964], S. 103ff.): • Wenn X nuklear ist, existieren f¨ ur alle λ ∈ σ(S) verallgemeinerte Eigenvektoren xλ ∈ X , T xλ = λxλ , so daß x, y = xλ (x)xλ (y) dμ(λ) ∀x, y ∈ X, σ(S) λxλ (x)xλ (y) dμ(λ) ∀x, y ∈ X. T x, y = σ(S)
ur xλ (x), so sind diese Formeln vollkommen denen Schreibt man x, xλ f¨ der Entwicklung in eine Orthonormalbasis bzw. der Diagonalisierung eines kompakten selbstadjungierten Operators analog: x, y =
∞ k=1
x, ek ek , y,
T x, y =
∞
λk x, ek ek , y.
k=1
Es sei jedoch betont, daß die verallgemeinerten Entwicklungsformeln nicht mehr f¨ ur alle Elemente von H gelten, sondern nur noch auf dem kleineren Raum X. Ist T ein elliptischer Differentialoperator auf X = D(Ω), kann man sogar zeigen, daß die xλ C ∞ -Funktionen sind (Satz von Mautner, G˚ arding und Browder; siehe Dunford/Schwartz [1963], S. 1709, oder Dieudonn´e [1982], S. 250). Alaoglu bewies Korollar VIII.3.12 in Ann. Math. 41 (1940) 252–267, Krein und Shmulyan Theorem VIII.3.15 in Ann. Math. 41 (1940) 556–583 und Goldstine die S¨ atze VIII.3.17 und VIII.3.18 in Duke Math. J. 4 (1938) 125–131. Auch der enigmatische Bourbaki k¨ undigte 1938 in einer ComptesRendus-Note einen Beweis dieser Aussagen (mit Korollar VIII.3.16 statt des Satzes von Krein-Shmulyan) an; seine Beweise wurden 1942 von Dieudonn´e ´ (Ann. Sci. Ecole Norm. Sup. 59 (1942) 107–139) avec l’autorisation de ” l’auteur“ (a.a.O., S. 128) ver¨ offentlicht. Der Beweis des Satzes von KreinShmulyan im Text folgt einer Idee von Pryce (siehe Day [1973], S. 50). Jedoch hatte Banach in seinem Buch (Banach [1932]) bereits Versionen dieser S¨ atze gezeigt. Banach bedient sich aber nicht der schwachen oder schwach∗-Topologie, sondern bleibt ganz im Rahmen der schwach oder schwach∗ konvergenten Folgen, die ja ganz naiv definiert werden k¨onnen (siehe Definition III.3.6). Daher sind seine Versionen von Korollar VIII.3.12 und Satz VIII.3.18 nur f¨ ur separable R¨ aume formuliert; vgl. die Aufgaben III.6.18 und VIII.6.17(f) f¨ ur das erstere. Bemerkenswerterweise gelingt
450
VIII.
Lokalkonvexe R¨ aume
es ihm aber, einen zu Korollar VIII.3.16 ¨ aquivalenten Satz f¨ ur alle Banachr¨ aume, ob separabel oder nicht, zu beweisen (a.a.O., S. 118–122); dieser ist mit Hilfe eines Ad-hoc-Konzepts von transfiniten Folgen“ formuliert ” und lautet Jeder transfinit abgeschlossene Unterraum von X ist regul¨ar ” abgeschlossen.“ Banachs Version von Satz VIII.3.18 besagt, daß ein separabler Banachraum, in dem jede beschr¨ ankte Folge eine schwach konvergente Teilfolge besitzt, reflexiv ist (a.a.O., S. 189). (Die Umkehrung hatten wir in Theorem III.3.7 gezeigt.) Da jedoch Kompaktheit und Folgenkompaktheit verschiedene Dinge sind, ist nicht a priori klar, daß Satz VIII.3.18 dies als Spezialfall enth¨ alt. Das ergibt sich jedoch aus dem Satz von Eberlein-Shmulyan: • Eine schwach abgeschlossene beschr¨ankte Teilmenge A eines Banachraums ist genau dann schwach kompakt, wenn jede Folge in A eine schwach konvergente Teilfolge besitzt. Eine weitere, außerordentlich tiefliegende Charakterisierung schwach kompakter Mengen stammt von James (1964). • Eine schwach abgeschlossene beschr¨ankte Teilmenge A eines reellen Banachraums ist genau dann schwach kompakt, wenn jedes stetige lineare Funktional sein Supremum auf A annimmt. In diesem Zusammenhang ist noch der Satz von Bishop-Phelps (1961) erw¨ ahnenswert. • Sei X ein reeller Banachraum und C ⊂ X konvex, beschr¨ankt und abgeschlossen. Dann ist die Menge aller stetigen linearen Funktionale, die ihr Supremum auf C annehmen, . -dicht in X . Diese drei S¨ atze werden in Holmes [1975] bewiesen. Wir erw¨ ahnen noch eine interessante Charakterisierung schwach kompakter Mengen in L1 , die in der Wahrscheinlichkeitstheorie Anwendungen gefunden hat. • Ist μ ein endliches Maß und A ⊂ L1 (μ) schwach abgeschlossen, so ist A genau dann schwach kompakt, wenn A beschr¨ankt und gleichgradig integrierbar ist, d.h. ∀ε > 0 ∃δ > 0 ∀E ∈ Σ, μ(E) < δ ∀f ∈ A f dμ ≤ ε. E
¨ Ubrigens ist der Spezialfall des Satzes von Alaoglu f¨ ur X = C0 (R), also X = M (R), als Satz von Helly-Bray in der Wahrscheinlichkeitstheorie bekannt. Die Benutzung der schwachen Topologien er¨offnet einen neuen Blick auf den Satz vom abgeschlossenen Bild (Theorem IV.5.1). Man kann ihn jetzt so formulieren.
VIII.7
Bemerkungen und Ausblicke
451
• Seien X und Y Banachr¨aume und T ∈ L(X, Y ). Dann sind ¨aquivalent: (i) ran(T ) ist abgeschlossen. (ii) ran(T ) ist . -abgeschlossen. (iii) ran(T ) ist schwach∗ -abgeschlossen. Mit Methoden dieses Kapitels kann der Beweis so gef¨ uhrt werden. Wir f¨ ugen die Zwischenbehauptungen (iv) T : X → ran(T ) ist eine offene Abbildung bzgl. der Normtopologien. (v) T : X → ran(T ) ist eine offene Abbildung bzgl. der schwachen Topologien. ein. Dann zeigt der Satz von der offenen Abbildung (i) ⇔ (iv). Mit Hilfe der Aufgabe VIII.6.10 und der kanonischen Faktorisierung aus Lemma IV.5.2 kann man (iv) ⇔ (v) einsehen. Der Bipolarensatz liefert (v) ⇔ (iii) (Details in K¨ othe [1979], S. 5), und (iii) ⇒ (ii) ist trivial. Die Umkehrung folgt aus dem Satz von Krein-Shmulyan: Zun¨ achst impliziert der Satz von der offenen Abbildung die Existenz eines ε0 > 0 mit ε0 BX ∩ ran(T ) ⊂ T (BY ), falls U := ran(T ) . -abgeschlossen ist, und das heißt BU = BX ∩ ran(T ) = BX ∩ T (ε−1 0 BX ). Da T schwach∗-stetig ist, ist BU schwach∗-abgeschlossen, also nach Korollar VIII.3.16 U selbst schwach∗-abgeschlossen. Krein und Milman bewiesen ihren Satz in Studia Math. 9 (1940) 133– 138 f¨ ur schwach∗-kompakte konvexe Teilmengen des Duals eines Banachraums. Der Beweis im Text stammt von Kelley und ist der heute generell verwandte; ein alternatives Argument fand L´eger (C. R. Acad. Sc. Paris 267 (1968) 92–93). Es war lange ein offenes Problem, ob der Satz von KreinMilman auch in nicht lokalkonvexen topologischen Vektorr¨aumen gilt. Das erste, sehr komplizierte Gegenbeispiel wurde von Roberts (Studia Math. ur 60 (1977) 255–266) konstruiert; es gibt sogar Gegenbeispiele in Lp [0, 1] f¨ 0 < p < 1 (siehe Kalton/Peck/Roberts [1984], S. 211). Bessaga und Pelczy´ nski (Israel J. Math. 4 (1966) 262–264) fanden eine Versch¨ arfung des Satzes von Krein-Milman f¨ ur gewisse Banachr¨aume, in der die Kompaktheit keine Rolle mehr spielt. • Ist X ein Banachraum mit separablem Dualraum und K ⊂ X nicht leer, . -abgeschlossen und beschr¨ankt, so gilt K = co ex K.
452
VIII.
Lokalkonvexe R¨ aume
Der Satz von Bessaga und Pelczy´ nski ist z.B. auf die Dualr¨aume von X = c0 oder von X = K(2 ) anwendbar. Lindenstrauss hat diesen Satz 1975 auf eine gr¨ oßere Klasse von Banachr¨ aumen ausgedehnt, siehe Phelps’ Arbeit in J. Functional Anal. 16 (1974) 78–90. In einer anderen Richtung wurde der Satz von Krein-Milman durch Choquet verallgemeinert. Betrachten wir eine kompakte konvexe Teilmenge K eines lokalkonvexen Hausdorffraums X und T := ex K. Mit der Nomenklatur von Aufgabe VIII.6.24 ist die Restriktionsabbildung a → a|T von A(K) nach C(T ) isometrisch; dies folgt aus dem Satz von Krein-Milman, denn {x ∈ K: a(x) = sup a(K)} ist eine abgeschlossene Seite. Das Funktional aßt sich dann normgleich auf C(T ) fortsetzen a → a(x0 ), x0 ∈ K beliebig, l¨ und nach dem Rieszschen Darstellungssatz durch ein regul¨ares Borelmaß μ auf T darstellen. Da das Funktional positiv ist und die konstante Funktion 1 auf 1 abbildet, ist μ ein Wahrscheinlichkeitsmaß. Mit anderen Worten existiert zu jedem x0 ∈ K ein Wahrscheinlichkeitsmaß auf K mit μ(ex K) = 1, so daß a(x0 ) = a(x) dμ(x) ∀a ∈ A(K), ex K
wof¨ ur man symbolisch
x0 =
x dμ(x) ex K
schreibt. Der Satz von Choquet sagt aus, daß f¨ ur metrisierbare K sogar solch ein Maß mit μ(ex K) = 1 gefunden werden kann, symbolisch x0 = x dμ(x). ex K
Diese Formel beschreibt wesentlich pr¨ aziser als der Satz von Krein-Milman, wie jeder Punkt von K als Mischung“ von Extremalpunkten zu repr¨asen” tieren ist. Der Satz von Choquet hat bedeutende Anwendungen; wir ver¨ weisen auf die Ubersicht von Phelps in Bartle [1980], S. 115–157, sowie die Monographien von Phelps [1966] und Choquet [1969]. Der Beweis des Satzes von Stone-Weierstraß im Text stammt von de Branges (Proc. Amer. Math. Soc. 10 (1959) 822–824) und der des Satzes von Lyapunov von Lindenstrauss (J. Math. Mech. 15 (1966) 971–972). Brosowski und Deutsch geben ein sehr elementares Argument f¨ ur den Satz von Stone-Weierstraß in Proc. Amer. Math. Soc. 81 (1981) 89–92. Anwendungen des Satzes von Lyapunov auf das Bang-Bang-Prinzip der Kontrolltheorie diskutiert Holmes [1975], S. 109, und Anwendungen in der Wahrscheinlichkeitstheorie findet man bei Hill, Partitioning Inequalities in Probability ” and Statistics“, in M. Shaked, Y. L. Tong (Hg.) Stochastic Inequalities (1992), S. 116–132. F¨ ur die Aufteilung eines Kuchens siehe Dubins und Spanier, Amer. Math. Monthly 68 (1961) 1–17. Mit Hilfe eines Extremalpunktarguments kann man auch den folgenden Satz von Banach-Stone beweisen.
VIII.7
Bemerkungen und Ausblicke
453
• Sind S und T kompakte Hausdorffr¨aume, f¨ ur die die Banachr¨aume C(S) und C(T ) isometrisch isomorph sind, so sind S und T hom¨oomorph. Ist n¨ amlich I: C(S) → C(T ) ein isometrischer Isomorphismus, so ist I : C(T ) → C(S) ebenfalls einer; daher bildet I die Extremalpunkte der Einheitskugel von M (T ) = C(T ) auf Extremalpunkte der Einheitskugel von M (S) = C(S) ab. Diese wurden in Beispiel VIII.4(f) beschrieben; folglich ist I (δt ) von der Form h(t)δϕ(t) . So wird eine Funktion ϕ: T → S definiert, und man beweist, daß ϕ ein Hom¨ oomorphismus ist. (Dazu ist es hilfreich zu wissen, daß S und {δs : s ∈ S}, versehen mit der schwach∗-Topologie, hom¨ oomorph sind, was aus Satz VIII.3.6 und Lemma B.2.7 folgt.) Die Umkehrung des Satzes von Banach-Stone ist ebenfalls richtig (und sehr einfach). Der Satz von Goldstine impliziert lax gesprochen, daß es zu x ∈ BX (X ein normierter Raum) und zu einem endlichdimensionalen Teilraum angs F“ mit x fast u F ⊂ X ein Element x ∈ BX gibt, das l¨ ¨bereinstimmt. ” Eine Versch¨ arfung dieser Aussage macht das Prinzip der lokalen Reflexivit¨at von Lindenstrauss und Rosenthal (Israel J. Math. 7 (1969) 315–349): • Seien X ein normierter Raum, E ⊂ X und F ⊂ X endlichdimensionale Teilr¨aume, und sei ε > 0. Dann existiert ein linearer Operator T : E → X mit (a) T x = x ∀x ∈ E ∩ X. (b) x (T x ) = x (x ) ∀x ∈ E, x ∈ F . (c) (1 − ε) x ≤ T x ≤ (1 + ε) x ∀x ∈ E. (Hier wurde, wie u ¨blich, X als Unterraum von X aufgefaßt.) Alle Beweise dieses Satzes fußen auf dem Satz von Hahn-Banach; die einfachsten Argumente fanden Dean (Proc. Amer. Math. Soc. 40 (1973) 146–148), Stegall (Proc. Amer. Math. Soc. 78 (1980) 154–156), Behrends (Studia Math. 100 (1991) 109–128) und Mart´ınez-Abej´on (Proc. Amer. Math. Soc. 127 (1999) 1397–1398). Man spricht hier von lokaler Reflexivit¨at, da (c) zeigt, daß, obwohl X i.a. ein echter Oberraum von X ist, jeder endlichdimensionale Teilraum von X – bis auf ε – zu einem endlichdimensionalen Teilraum von X isometrisch ist. Das Attribut lokal“ bezieht sich in der Banach” raumtheorie auf die endlichdimensionale Struktur.
Kapitel IX
Banachalgebren
IX.1
Grundbegriffe und Beispiele
In diesem Kapitel untersuchen wir Banachr¨ aume, die neben den Vektorraumoperationen Addition und Skalarmultiplikation eine innere Multiplikation zulassen (wie es z.B. f¨ ur den Banachraum C(T ) der Fall ist). Definition IX.1.1 Es seien A ein komplexer Banachraum und (x, y) → x · y =: xy eine bilineare assoziative Abbildung von A × A nach A ( Multi” plikation“) mit x · y ≤ x · y ∀x, y ∈ A. (IX.1) Dann heißt A (genauer (A, · , . )) eine Banachalgebra. Gilt xy = yx f¨ ur alle x, y ∈ A, so heißt A kommutativ. Ein Element e ∈ A mit ex = xe = x f¨ ur alle x ∈ A und e = 1 (IX.2) heißt Einheit von A. Die algebraischen Forderungen an eine Multiplikation lauten explizit x(y + z) = xy + xz, x(yz) = (xy)z,
(x + y)z = xz + yz, λ(xy) = (λx)y = x(λy)
f¨ ur alle x, y, z ∈ A, λ ∈ C. Eine Banachalgebra hat h¨ochstens eine Einheit (denn sind e und e˜ Einheiten, so gilt e = e˜ e = e˜). Die Beschr¨ankung auf komplexe Skalare erfolgt, da nur f¨ ur komplexe Algebren die fundamentalen Darstellungss¨ atze (siehe Abschnitt IX.2 und Satz IX.1.3 sowie IX.1.4) gelten. Beispiele. (a) Ist X ein komplexer Banachraum, so sind L(X) und K(X) Banachalgebren. (Hier ist die Norm nat¨ urlich die Operatornorm und die
456
IX.
Banachalgebren
Multiplikation die Komposition.) F¨ ur dim(X) > 1 sind sie nicht kommutativ. L(X) enth¨ alt eine Einheit (n¨ amlich Id), K(X) im Fall dim X = ∞ nicht. [Beweis hierf¨ ur: Ist e Einheit von K(X), so muß e = Id sein (betrachte Operatoren mit eindimensionalem Bild!). Also gilt Id ∈ K(X) und folglich (Satz I.2.7) dim X < ∞.] (b) Die klassischen Funktionenalgebren C(T ) (T kompakter Hausdorffraum), L∞ (μ) und H ∞ und A(D) aus Beispiel I.1(e) sind kommutative Banachalgebren mit Einheit 1. (Die Multiplikation ist nat¨ urlich punktweise definiert, und als Norm betrachten wir die [im Fall L∞ wesentliche] Supremumsnorm.) C0 (R) ist eine kommutative Banachalgebra ohne Einheit. (c) Es sei W der Vektorraum der 2π-periodischen stetigen Funktionen von R nach C, deren Fourierreihe absolut konvergiert: f 2πZu 2π-periodischem 1 −int betrachte die Fourierkoeffizienten cn = cn (f ) = 2π f (t)e dt (n ∈ Z); 0 dann ist f ∈W ⇔ cn (f ) n∈Z ∈ 1 (Z). absolut summierbaren Fol(1 (Z) ist der Banachraum aller zweiseitigen“ ” gen (cn )n∈Z mit der Norm (cn ) 1 = n∈Z |cn |.) Insbesondere folgt f (s) =
cn (f )eins
(gleichm¨aßige Konvergenz!)
n∈Z
f¨ ur f ∈ W . Die Multiplikation in W wird punktweise erkl¨art. Wir versehen W mit der Norm f W = n∈Z |cn (f )|. Nachrechnen zeigt, daß . W wirklich eine Norm und (W, . W ) ein Banachraum ist. [Oder man argumentiert so: f → cn (f ) ist ein isometrischer Isomorphismus zwischen W und dem Banachraum 1 (Z).] (W, · , . W ) ist eine Banachalgebra, die sog. Wieneralgebra; W ist kommutativ und hat das Einselement 1. Es ist daf¨ ur zu verifizieren: Sind f, g ∈ W , so gilt f g ∈ W mit f g W ≤ f W g W . Dazu berechne 2π 1 cn (f g) = f (t)g(t)e−int dt 2π 0 2π 1 ikt ilt ck (f )e cl (g)e e−int dt = 2π 0 k∈Z l∈Z 2π 1 = ck (f )cl (g) ei(k+l−n)t dt 2π 0 k,l∈Z
(erlaubt wegen absoluter und gleichm¨aßiger Konvergenz!) = ck (f )cl (g) k+l=n
=
k∈Z
ck (f )cn−k (g).
IX.1
457
Grundbegriffe und Beispiele
Also gilt (die Vertauschung der Summationsreihenfolge ist wegen der absoluten Konvergenz erlaubt) |cn (f g)| ≤ |ck (f )| |cn−k (g)| n
= =
n
k
k
n
|ck (f )| |cn−k (g)|
|ck (f )|
k
|cn−k (g)|
n
k
=
|ck (f )|
|cn (g)|
n
= f W g W . uhren wir als Multiplikation die Faltung x ∗ y ein: (d) Auf 1 (Z) f¨ xk yn−k f¨ ur x = (xn )n , y = (yn )n . (x ∗ y)n = k∈Z
Dasselbe Argument wie unter (c) zeigt, daß (1 (Z), ∗ , . 1 ) eine kommutative Banachalgebra mit Einselement e0 = (. . . , 0, 1, 0, .. .) (1 steht beim Index 0) ist. In der Tat ist der Isomorphismus f → cn (f ) von W auf 1 (Z) nicht nur ein isometrischer Isomorphismus von Banachr¨aumen, sondern sogar von Banachalgebren (d.h. er ist multiplikativ), denn f · g → cn (f ) ∗ cn (g) . Die Wieneralgebra ist also nichts anderes als eine andere Darstellung der Faltungsalgebra 1 (Z). Solche Darstellungen von Banachalgebren zu finden ist das Thema von Abschnitt IX.2. (e) Analog zu (d) definieren wir f¨ ur f, g ∈ L1 (R) f (s)g(t − s) ds. (f ∗ g)(t) = R
Direktes Nachrechnen zeigt, daß (L1 (R), ∗ , . L1 ) eine kommutative Banachalgebra ist, die allerdings keine Einheit besitzt. Gemeinsamer Hintergrund der Beispiele (d) und (e) ist, daß sowohl Z als auch R lokalkompakte topologische Gruppen sind; solche Gruppen G studiert man in der harmonischen Analyse z.B. mit Hilfe der Algebra L1 (G, μ), wo μ ein translationsinvariantes“ (sog. Haarsches) Maß auf der Borel-σ” Algebra von G ist. Bedingung (IX.1) aus Definition IX.1.1 garantiert, daß die Multiplikation eine stetige Abbildung ist. Ist umgekehrt (A, . ) ein Banachraum mit einer Multiplikation (x, y) → x · y, die partiell stetig ist (d.h. alle Abbildungen x → x · y (y ∈ A) und x → y · x (y ∈ A) sind stetig), so existiert eine Konstante c mit xy ≤ c x y (siehe Aufgabe IV.8.12), so daß
458
IX.
Banachalgebren
die Multiplikation sogar stetig ist. Setzt man |||x||| = sup y ≤1 xy , so ist ||| . ||| eine ¨ aquivalente Norm, die (IX.1) erf¨ ullt. Besitzt A eine Einheit, so gilt auch (IX.2). Das zeigt, daß die Normbedingungen aus Definition IX.1.1 ¨ bei Vorliegen einer partiell stetigen Multiplikation durch Ubergang zu einer aquivalenten Norm erzwungen werden k¨ onnen. ¨ Wie im Spezialfall A = L(X) definieren wir nun das Spektrum eines Elements einer Banachalgebra. Definition IX.1.2 Sei A eine Banachalgebra mit Einheit e. (a) x ∈ A heißt invertierbar (in A), falls es y ∈ A gibt mit xy = yx = e. Schreibweise: y = x−1 (beachte, daß y eindeutig bestimmt ist). (b) ρ(x) = {λ ∈ C: λ − x := λe − x ist invertierbar in A} heißt Resolventenmenge von x. (Um die Algebra zu kennzeichnen, schreibt man auch ρA (x).) (c) σ(x) = C \ ρ(x) heißt Spektrum von x. (Pr¨aziser schreibt man σA (x).) (d) R: ρ(x) → A, λ → (λ − x)−1 heißt Resolventenabbildung. (e) r(x) = inf n∈N xn 1/n heißt Spektralradius von x. Als einfaches Beispiel betrachte die Banachalgebra C(T ); das Spektrum einer stetigen Funktion f ist dann σ(f ) = {f (t): t ∈ T } (Aufgabe IX.4.4). W¨ ortlich wie f¨ ur A = L(X) zeigt man (vgl. die S¨atze II.1.11, VI.1.3 und VI.1.6): Satz IX.1.3 Sei A eine Banachalgebra mit Einheit e, und sei x ∈ A. (a) Falls x − e < 1, ist x invertierbar; genauer gilt (mit y 0 = e) x−1 =
∞
(e − x)n
(Neumannsche Reihe).
n=0
(b) (c) (d) (e)
ρ(x) ist offen, und R ist analytisch. σ(x) ist kompakt, genauer gilt |λ| ≤ x f¨ ur λ ∈ σ(x). σ(x) = ∅. sup{|λ|: λ ∈ σ(x)} = limn→∞ xn 1/n = r(x).
Die Teile (d) und (e) verlangen komplexe Skalare; f¨ ur R-Algebren sind (d) und (e) i.a. falsch. Neu ist hingegen der folgende Satz. Satz IX.1.4 (Satz von Gelfand-Mazur) Eine Banachalgebra mit Einheit e, in der jedes von Null verschiedene Element invertierbar ist, ist eindimensional: A = C · e.
459
IX.2 Die Gelfandsche Darstellungstheorie
Beweis. Sei x ∈ A. W¨ ahle λ ∈ σ(x); das ist m¨oglich nach Satz IX.1.3(d). Dann ist definitionsgem¨ aß λ− x nicht invertierbar, also nach Voraussetzung λ − x = 0, d.h. x = λe. 2 Das folgende Lemma u ¨ ber das Spektrum eines Produkts wird in Abschnitt IX.3 ben¨ otigt. Lemma IX.1.5 Sei A eine Banachalgebra mit Einheit e. Dann gilt σ(xy)\{0} = σ(yx)\{0}
∀x, y ∈ A.
Beweis. Ist λ ∈ ρ(xy)\{0}, existiert z ∈ A mit z(λ − xy) = (λ − xy)z = e. Wegen (nachrechnen!) (e + yzx)(λ − yx) = (λ − yx)(e + yzx) = λe ist dann auch λ − yx invertierbar, d.h. λ ∈ ρ(yx)\{0}.
IX.2
2
Die Gelfandsche Darstellungstheorie
Wir wissen bereits aus Korollar VIII.3.13, daß jeder Banachraum A als abgeschlossener Unterraum eines Raums stetiger Funktionen dargestellt werden kann: Wir betrachten BA ; versehen mit der σ(A , A)-Topologie ist BA ein kompakter Hausdorffraum nach dem Satz von Alaoglu. Ferner betrachten wir die Abbildung A → C(BA ), x → x , wo x (x ) = x (x) ist. Ist A eine Banachalgebra, so ist { x: x ∈ A} ⊂ C(BA ) keine Unteralgebra der Banachalgebra C(BA ), da nicht jedes Funktional multiplikativ ist. Will man die Algebra A als eine Funktionenalgebra darstellen, wird man also auf die multiplikativen Funktionale gef¨ uhrt. Es stellt sich nat¨ urlich sofort die Frage nach der Existenz und der Vielfalt dieser Funktionale. Ein Ergebnis der Gelfandschen Theorie ist, daß man tats¨ achlich viele Banachalgebren durch die Menge ihrer multiplikativen Funktionale beschreiben kann (geradeso, wie man einen Banachraum X durch X beschreiben kann – das ist der Satz von Hahn-Banach). Wir werden diese Ideen systematisch entwickeln und beginnen mit einer Definition. Definition IX.2.1 A1 und A2 seien Banachalgebren. Eine Abbildung Φ: A1 → A2 heißt Algebrenhomomorphismus, falls Φ linear und multiplikativ urzer von [komplexen] Homomorphismen ist. Im Fall A2 = C spricht man k¨ (oder Charakteren). In Definition IX.2.1 ist die Stetigkeit von Φ nicht verlangt; u ¨ berraschenderweise ergibt sie sich h¨ aufig automatisch.
460
IX.
Banachalgebren
Lemma IX.2.2 Sei A eine Banachalgebra [mit Einheit ]. Dann ist jeder Homomorphismus ϕ: A → C stetig; genauer gilt ϕ ≤ 1 [bzw. ϕ = 1 oder ϕ = 0]. Beweis. are 1 < ϕ ≤ ∞, so g¨ abe es x ∈ A mit x < 1, ϕ(x) = 1. Setze ∞W¨ y = n=1 xn . Es folgt y = x + xy und damit der Widerspruch ϕ(y) = ϕ(x) + ϕ(x)ϕ(y) = 1 + ϕ(y). Besitzt A eine Einheit e und ist ϕ = 0, so existiert x ∈ A mit ϕ(x) = 1. Es folgt 1 = ϕ(x) = ϕ(ex) = ϕ(e)ϕ(x) = ϕ(e), also ϕ ≥ 1, da e = 1.
2
Beispiele. (a) Sei T ein kompakter Hausdorffraum und A = C(T ). Zu t ∈ T setze ϕt (x) = x(t). Dann ist ϕt ein Homomorphismus. Wir werden sehen, daß es (außer 0) keine weiteren Homomorphismen als die ϕt , t ∈ T , gibt. (b) Sei A die Faltungsalgebra 1 (Z) (Beispiel IX.1(d)). Zu z ∈ C mit n |z| = 1 setze ϕz (x) = n∈Z xn z . Dann ist ϕz ein komplexer Homomorphismus, denn ϕz (x ∗ y) = (x ∗ y)n z n = xk yn−k z n n
=
k
xk z
k
n
yn−k z
k
n−k
(absolute Konvergenz!)
n
= ϕz (x) · ϕz (y). Umgekehrt sei ϕ = 0 ein Homomorphismus. Nach Lemma IX.2.2 ist ϕ = 1. Nun gilt f¨ ur den k-ten Einheitsvektor ek , wo k ∈ Z, ek ∗ el = ek+l . Setze ur k ∈ Z. Insbesondere gilt z = ϕ(e1 ), dann folgt ϕ(ek ) = z k f¨ |z| = |ϕ(e1 )| ≤ e1 = 1,
|z −1 | = |ϕ(e−1 )| ≤ e−1 = 1,
so daß |z| = 1. Da auch ϕz (ek ) = z k und ergo die stetigen Abbildungen ϕ und ϕz auf der dichten ¨ bereinstimmen, gilt ϕ = ϕz . Menge lin{ek : k ∈ Z} u (c) Da f → cn (f ) ein Homomorphismus der Wieneralgebra W auf 1 (Z) ist, sind die von Null verschiedenen Homomorphismen von W genau die ϕ˜t : f → f (t), 0 ≤ t ≤ 2π. (Beachte f (t) = n cn (f )eint .) (d) Man kann zeigen, daß die Homomorphismen L1 (R) → C genau die ϕt (f ) = f (s)e−ist ds R
bzw. ϕ = 0 sind, also ϕt (f ) im wesentlichen die Fouriertransformation (F f )(t) ist.
IX.2
461
Die Gelfandsche Darstellungstheorie
Wir wollen als n¨ achstes zeigen, daß eine kommutative Banachalgebra (mit Einheit) viele Homomorphismen besitzt. Dazu ben¨otigen wir eine weitere Definition. Definition IX.2.3 (a) Ein Ideal J einer Banachalgebra A ist ein Untervektorraum mit x ∈ J, y ∈ A
⇒
xy ∈ J und yx ∈ J.
Im Falle J = A heißt J echtes Ideal. (b) Ein maximales Ideal J ist ein echtes Ideal mit ˜ J˜ Ideal J J,
⇒
J˜ = A.
Lemma IX.2.4 Es sei A eine Banachalgebra. (a) Der Abschluß eines Ideals ist ein Ideal. (b) Ist J ein abgeschlossenes Ideal der Banachalgebra A, so ist A/J, versehen mit der Quotientennorm, eine Banachalgebra. (Die Mul¨ tiplikation zweier Aquivalenzklassen ist nat¨ urlich [x][y] = [xy]; und das ist wohldefiniert.) Ist A kommutativ, so ist es auch A/J. Beweis. (a) folgt aus der Stetigkeit der Multiplikation. (b) Die algebraischen Forderungen best¨ atigt man durch Nachrechnen. Zu (IX.1) aus Definition IX.1.1: F¨ ur u, v ∈ J ist xy + uy + xv + uv ∈ [xy], also [xy] ≤ xy + uy + xv + uv = (x + u)(y + v) ≤ x + u y + v , daher [xy] ≤ [x] [y] .
2
Beispiele. (e) Der Kern eines Homomorphismus ϕ ist ein maximales Ideal, falls ϕ = 0, denn die Kodimension ist = 1. Wegen Lemma IX.2.2 ist es abgeschlossen. (f) F¨ ur einen separablen Hilbertraum H unendlicher Dimension sind nach Satz VII.1.24 {0} und K(H) die einzigen echten abgeschlossenen Ideale von L(H). Insbesondere ist 0 der einzige Homomorphismus von L(H) nach C. (g) Sei T ein kompakter Hausdorffraum. Dann ist J ⊂ C(T ) genau dann ein abgeschlossenes Ideal, wenn eine abgeschlossene Teilmenge D ⊂ T mit J = JD = {x ∈ C(T ): x|D = 0} existiert. Daß die JD Ideale sind, ist klar. Zum Beweis der Umkehrung setzen wir D = {t ∈ T : x(t) = 0 ∀x ∈ J}. Dann ist D abgeschlossen, und es
462
IX.
Banachalgebren
gilt J ⊂ JD nach Konstruktion. Sei umgekehrt x ∈ JD ; wir werden x ∈ J zeigen. Zun¨ achst gilt ∀t ∈ T ∃xt ∈ J
xt (t) = x(t).
/ D, so existiert x ˜t ∈ J mit Ist n¨ amlich t ∈ D, so w¨ ahle xt = 0. Ist t ∈ ahle ein geeignetes Vielfaches von x ˜t . x ˜t (t) = 0; w¨ Sei nun ε > 0. Setze Ut = {s: |x(s) − xt (s)| < ε}. Nach Wahl von xt ist Ut eine offene Umgebung von t. Wegen der Kompaktheit von T existiert eine endliche Teil¨ uberdeckung Ut1 , . . . , Utn . Sei {f1 , . . . , fn } ⊂ C(T ) eine dieser Teil¨ u berdeckung untergeordnete Zerlegung der Eins, d.h. 0 ≤ fi ≤ 1, n f = 1 und f (t) = 0 f¨ ur t ∈ / Uti .1 Wegen der Idealeigenschaft ist i i i=1 n y := i=1 fi xti ∈ J. Dann ist |y(s) − x(s)| ≤
n i=1
fi (s)|xti (s) − x(s)| ≤
n
fi (s)ε = ε,
i=1
denn der i-te Summand ist = 0 (falls s ∈ / Uti ) oder ≤ fi (s)ε (falls s ∈ Uti ); daher folgt y − x ≤ ε. Da ε > 0 beliebig war, ergibt sich x ∈ J = J. Wir werden jetzt den Zusammenhang zwischen Homomorphismen und maximalen Idealen in kommutativen Banachalgebren mit Einheit studieren. Dazu ben¨ otigen wir eine Versch¨ arfung von Lemma IX.2.4. Lemma IX.2.5 A sei eine kommutative Banachalgebra mit Einheit e. (a) Ein echtes Ideal von A liegt nicht dicht. (b) Maximale Ideale sind abgeschlossen. (c) Jedes echte Ideal ist in einem maximalen Ideal enthalten. (d) Ist J ein echtes abgeschlossenes Ideal, so hat A/J eine Einheit. (e) Ist J ein maximales Ideal, so ist A/J eindimensional. Beweis. (a) folgt aus Satz IX.1.3(a) und der Tatsache, daß echte Ideale keine invertierbaren Elemente enthalten. (b) folgt aus (a) und Lemma IX.2.4(a). (c) ergibt sich aus einer Standardanwendung des Zornschen Lemmas: Beachte nur, daß f¨ u r eine Kette (bzgl. der Inklusionsordnung) {J i : i ∈ I} von echten Idealen i∈I Ji ein echtes Ideal ist. (Sonst w¨are e ∈ i Ji , also e ∈ Ji0 f¨ ur ein i0 , und Ji0 w¨ are nicht echtes Ideal.) (d) [e] ist Einheit von A/J. Zu (IX.2) aus Definition IX.1.1: Es ist [e] = inf x∈J e − x = 1, denn ≤ 1 ist klar; aber < 1 kann wegen Satz IX.1.3(a) nicht gelten (sonst enthielte J ein invertierbares Element und folglich die Einheit von A). 1 Die Existenz solcher Funktionen weist man mit Hilfe des Satzes von Tietze-Urysohn (Theorem B.2.4) nach; im vorliegenden Fall argumentiert man am einfachsten durch Induktion nach n. F¨ ur eine Verallgemeinerung siehe z.B. Pedersen [1989], S. 40.
IX.2
Die Gelfandsche Darstellungstheorie
463
(e) Nach (b) und (d) ist A/J eine kommutative Banachalgebra mit Einheit. Nach dem Satz von Gelfand-Mazur (Satz IX.1.4) reicht es, ∀x ∈ A\J ∃y ∈ A xy ∈ e + J = [e] zu zeigen. Zu x ∈ A \ J setze Jx = {xa + b: a ∈ A, b ∈ J}. Dann ist Jx ein Ideal (nachrechnen!), und es gelten J ⊂ Jx (setze a = 0) sowie J = Jx (setze a = e, b = 0). Da J ein maximales Ideal ist, ist Jx = A, d.h. es existieren y ∈ A, b ∈ J mit xy + b = e, also xy ∈ e + J. 2 Man mache sich klar, f¨ ur welche Teile von Lemma IX.2.5 die Kommutativit¨ at wesentlich ist. Definition IX.2.6 A sei eine kommutative Banachalgebra mit Einheit. (a) Dann heißt ΓA := {ϕ: A → C: ϕ = 0, ϕ Homomorphismus} Gelfandraum (oder Spektrum [vgl. Satz IX.2.7(c)]) oder maximaler Ideal-Raum [vgl. Satz IX.2.7(b)] von A. (b) Zu x ∈ A und ϕ ∈ ΓA setze x (ϕ) = ϕ(x). Die Abbildung x → x heißt Gelfandtransformation. Nach Lemma IX.2.2 gilt ΓA ⊂ BA , sogar ΓA ⊂ SA . Wir k¨onnen daher ΓA mit der σ(A , A)-Topologie versehen. Satz IX.2.7 A sei eine kommutative Banachalgebra mit Einheit. (a) ΓA , versehen mit der schwach∗ -Topologie σ(A , A), ist ein kompakter Hausdorffraum, und es ist x ∈ C(ΓA ). (b) J ⊂ A ist genau dann ein maximales Ideal, wenn J der Kern eines ϕ ∈ ΓA ist. ur alle x ∈ A. (c) Es ist ΓA = ∅. Genauer gilt σ(x) = {ϕ(x): ϕ ∈ ΓA } f¨ Beweis. (a) Es gilt , ΓA = {ϕ ∈ A : ϕ(xy) − ϕ(x)ϕ(y) = 0} ∩ {ϕ: ϕ(e) = 1}. x,y∈A
Da die Abbildungen ϕ → ϕ(a), a ∈ A, σ(A , A)-stetig sind, ist ΓA eine schwach∗-abgeschlossene Teilmenge der schwach∗-kompakten Einheits eikugel, also selber schwach∗ -kompakt. Da die Gelfandtransformierte x ne Einschr¨ ankung der nach Korollar VIII.3.4 schwach∗-stetigen Abbildung x → x (x) ist, ist sie selbst eine stetige Funktion.
464
IX.
Banachalgebren
(b) Sei J ein maximales Ideal. Nach Lemma IX.2.5(e) ist A/J = C·[e] ∼ = C, und die Quotientenabbildung ist ein Homomorphismus, dessen Kern mit J u ur ϕ ∈ ΓA der Kern ker(ϕ) ein 1¨ bereinstimmt. Umgekehrt ist f¨ kodimensionales, also maximales Ideal. (c) Es ist ΓA = ∅ nach (b), da es laut Lemma IX.2.5(c) maximale Ideale gibt. Ist λ ∈ ρ(x), also λ − x invertierbar, so sind alle ϕ(λ − x) = λ − ϕ(x), ϕ ∈ ΓA , in C invertierbar (d.h. = 0), denn ϕ ist multiplikativ. Folglich gilt λ∈ / {ϕ(x): ϕ ∈ ΓA }. Ist λ ∈ σ(x), so ist J = {(λ − x)a: a ∈ A} ein echtes Ideal, das nach Lemma IX.2.5(c) in einem maximalen Ideal liegt. Nach (b) 2 existiert also ϕ ∈ ΓA mit λ − x ∈ J ⊂ ker(ϕ), d.h. λ = ϕ(x). Theorem IX.2.8 (Gelfandscher Darstellungssatz) A sei eine kommutative Banachalgebra mit Einheit e, ΓA , versehen mit der schwach∗ -Topologie, der zugeh¨orige Gelfandraum und x → x die Gelfandtransformation von A nach C(ΓA ). (a) Die Gelfandtransformation ist ein wohldefinierter stetiger Algebrenhomomorphismus mit e = 1. Es ist x ∞ = r(x) ≤ x .
(IX.3)
(b) Es gilt σ(x) = σ( x) f¨ ur x ∈ A. Beweis. (a) Es ist alles klar (siehe noch Satz IX.2.7(a)) bis auf (IX.3), worauf wir gleich zur¨ uckkommen. (b) folgt aus Satz IX.2.7(c) und daraus, daß f¨ ur C(T ) stets σ(f ) = {f (t): t ∈ T } gilt (Aufgabe IX.4.4). Insbesondere ist r(f ) = f ∞ . Zur¨ uck zu (IX.3): Mit (b) und Satz IX.1.3 schließt man jetzt x) = r(x) ≤ x . x ∞ = r(
2
Beispiele. (h) Wir betrachten zuerst A = C(T ). Nach Beispiel (a) ist ϕt ∈ ΓA f¨ ur t ∈ T . Ist umgekehrt ϕ ∈ ΓA , so ist der Kern ker(ϕ) ein maximales Ideal, also nach Beispiel (g) von der Form J{t} . Es folgt ϕ = ϕt . Wir k¨onnen also ΓC(T ) (als Menge) mit T identifizieren; aber andererseits ist t → ϕt ein Hom¨ oomorphismus (kombiniere Satz VIII.3.6 und Lemma B.2.7). Also sind oomorph. Die Gelfandtransformation ist x (ϕt ) = x(t); es T und ΓC(T ) hom¨ 8 folgt, daß C(T ) und C(T ) := { x: x ∈ C(T )} isometrisch algebrenisomorph sind. (i) Als zweites Beispiel betrachte A = 1 (Z). Wir wissen aus Beispiel (b), daß ΓA = {ϕz : z ∈ T}, wo T = {z ∈ C: |z| = 1}. Die Abbildung z → ϕz ist sogar ein Hom¨ oomorphismus, denn sie ist injektiv (klar) und stetig nach Satz VIII.3.6, denn z → ϕz (x) ist stetig f¨ ur alle x, und weil T kompakt ist, ist auch die Umkehrabbildung stetig (Lemma B.2.7). Die Gelfandtransfor mation ist x (ϕz ) = xn z n ; und das heißt 18 (Z) = W , wenn man Γ 1 (Z)
IX.3 C ∗ -Algebren
465
mit T und die Wieneralgebra mit der entsprechenden Algebra von Funktionen auf T identifiziert. Hier ist die Gelfandtransformation nicht isometrisch (Beispiel?), wohl aber injektiv, und nach dem Satz von Stone-Weierstraß liegt W dicht in C(T). (j) Die Diskussion unter (i) zeigt: Die identische Einbettung von W in C(T) ist“ die Gelfandtransformation. Diese Bemerkung liefert auf einen ” Schlag ein gefeiertes Resultat von Wiener. Korollar IX.2.9 (Satz von Wiener) Hat f ∈ C(T) eine absolut konvergente Fourierreihe und ist stets f (z) = 0, so besitzt auch 1/f eine absolut konvergente Fourierreihe. Beweis. Nach Voraussetzung ist f ∈ W mit 0 ∈ / σC(T) (f ). Die Behauptung ist 0 ∈ / σW (f ); und das stimmt nach Theorem IX.2.8(b) und den vorherge¨ henden Uberlegungen, denn σC(T) (f ) = σ(f). 2 Eine kommutative Banachalgebra wird halbeinfach genannt, wenn ihre Gelfandtransformation injektiv ist. A ist also genau dann halbeinfach, wenn , Rad(A) := ker(ϕ) = {0} ϕ∈ΓA
ist. Rad(A) heißt das Radikal von A. Wir erw¨ahnen noch: Lemma IX.2.10 Gilt x2 = x 2 f¨ ur alle x ∈ A, so ist die Gelfandtransformation isometrisch und insbesondere A halbeinfach. k
k
x ∞ = r(x) = Beweis. Durch Induktion folgt x2 = x 2 und daher k k 2 limk→∞ x2 1/2 = x .
IX.3
C ∗-Algebren
Die Algebra der beschr¨ ankten Operatoren auf einem Hilbertraum tr¨agt neben der Algebrenstruktur noch eine Involution T → T ∗ . Die Eigenschaften dieser Sternbildung geben zu folgenden Begriffen Anlaß. Definition IX.3.1 Sei A eine Banachalgebra. (a) Eine Abbildung x → x∗ , die (x + y)∗ = x∗ + y ∗ , (λx)∗ = λx∗ , x∗∗ = x, (xy)∗ = y ∗ x∗ f¨ ur alle x, y ∈ A, λ ∈ C erf¨ ullt, heißt Involution. (b) Besitzt A eine Involution mit x∗ x = x 2 so heißt A eine C ∗ -Algebra.
∀x ∈ A,
466
IX.
Banachalgebren
(c) Ein Algebrenhomomorphismus Φ zwischen C ∗ -Algebren A und B heißt ∗ -Homomorphismus (oder involutiv ), falls Φ(x∗ ) = (Φ(x))∗ f¨ ur alle x ∈ A gilt. Ein bijektiver ∗ -Homomorphismus heißt ∗ -Isomorphismus. Man kann zeigen, daß injektive ∗ -Homomorphismen stets isometrisch sind; den bei uns vorkommenden injektiven ∗ -Homomorphismen wird man die Isometrie immer direkt ansehen k¨ onnen. Im folgenden bezeichnet H einen komplexen Hilbertraum. Beispiele. (a) L(H) und K(H) sind C ∗ -Algebren; wegen der Normbedingung siehe Satz V.5.2(f). (b) Ist T ∈ L(H) normal, so ist alg(T, T ∗ ), die kleinste abgeschlossene Unteralgebra von L(H), die Id, T und T ∗ enth¨alt, eine kommutative C ∗ N n ∗ m Algebra. Es ist alg(T, T ∗ ) der Abschluß von n,m=0 an,m T (T ) : an,m ∈ C, N ∈ N0 . (c) C(T ) und L∞ (μ) mit der Involution f ∗ (t) = f (t) sind kommutative ∗ C -Algebren. (d) Da K(H) ein abgeschlossenes Ideal in L(H) ist, ist L(H)/K(H) nach Lemma IX.2.4(b) eine Banachalgebra, die sog. Calkin-Algebra. Die ¨ Norm [T ] einer Aquivalenzklasse in der Calkin-Algebra wird h¨aufig mit T e bezeichnet und wesentliche Norm von T genannt. Wir versehen den Quotienten L(H)/K(H) mit der (wohldefinierten!) Involution [T ]∗ = [T ∗ ] und zeigen, daß man so eine C ∗ -Algebra erh¨ alt. Wir f¨ uhren den Beweis nur f¨ ur separable H. Da die algebraischen Eigenschaften der Involution erf¨ ullt sind, reicht es, die Normbedingung T ∗T e = T 2e zu zeigen. ≤“ folgt aus T ∗ T e ≤ T ∗ e T e und T e = inf K∈K(H) T − K = ” inf K∈K(H) T ∗ − K ∗ = inf K∈K(H) T ∗ − K = T ∗ e . ≥“: Sei hierzu {e1 , e2 , . . .} eine Orthonormalbasis von H und Pn die ” ur alle Orthogonalprojektion Pn x = nk=1 x, ek ek . Dann gilt Pn x → x f¨ x ∈ H. Hieraus folgt (vgl. den Beweis von Satz II.3.5), daß (Pn ) auf jeder kompakten Teilmenge von H gleichm¨ aßig gegen Id konvergiert. Ist also K ∈ K(H) und C = K(BH ), so gilt Pn K − K = sup Pn Kx − Kx = sup Pn y − y → 0 x∈BH
y∈C
und ferner KPn − K = (KPn − K)∗ = Pn K ∗ − K ∗ → 0. Nun setze Qn = Id − Pn . Dann ist lim Qn S = S e
n→∞
∀S ∈ L(H);
IX.3
C ∗ -Algebren
467
denn ≥“ ist klar, da Pn stets kompakt ist, und ≤“ folgt aus (K ∈ K(H) ” ” beliebig) Qn K → 0 und Qn S ≤ Qn (S − K) + Qn K ≤ S − K + Qn K , so daß lim sup Qn S ≤ S e . Daraus schließt man T 2e = T ∗ 2e = lim Qn T ∗ 2 = lim
n→∞
n→∞ T Qn 2 (denn
(Qn T ∗ )∗ = T Qn )
= lim (T Qn)∗ (T Qn ) = lim Qn T ∗ T Qn n→∞
n→∞
≤ lim Qn T ∗ T = T ∗ T e . n→∞
Wir werden in Theorem IX.3.15 beweisen, daß es zu jeder C ∗ -Algebra A einen Hilbertraum H und einen isometrischen ∗ -Homomorphismus Φ: A → L(H) gibt. Jede C ∗ -Algebra ist“ also eine Algebra von Operatoren ” auf einem geeigneten Hilbertraum. (F¨ ur das Beispiel (d) ist das u ¨ berhaupt nicht offensichtlich.) Unser erstes Ziel ist es, kommutative C ∗ -Algebren mit Einheit zu charakterisieren. Dazu definieren wir: Definition IX.3.2 Sei A eine C ∗ -Algebra. (a) x ∈ A heißt selbstadjungiert, falls x∗ = x. (b) x ∈ A heißt normal, falls xx∗ = x∗ x. Lemma IX.3.3 Sei A eine C ∗ -Algebra (mit Einheit f¨ ur Teile (b) und (c)) und x ∈ A. (a) x = x∗ , xx∗ = x 2 . (b) Ist x normal, so gelten x 2 = x2 sowie r(x) = x . (c) Ist x selbstadjungiert, so ist σ(x) ⊂ R. Beweis. (a) Wegen x 2 = x∗ x ≤ x∗ x folgt x ≤ x∗ und x∗ ≤ x∗∗ = x . Ferner gilt xx∗ = x∗∗ x∗ = x∗ 2 = x 2 . (b) W¨ ortlich wie Satz VI.1.7; siehe auch Lemma IX.2.10. (c) Zun¨ achst ist e∗ = e (warum?). Sei α + iβ ∈ σ(x); wir werden β = 0 zeigen. F¨ ur alle λ ∈ R gilt α + i(β + λ) ∈ σ(x + iλ), so daß |α + i(β + λ)| ≤ x + iλ (Satz IX.1.3(c)). Es folgt α2 + (β + λ)2 = |α + i(β + λ)|2 ≤ x + iλ 2 = (x + iλ)∗ (x + iλ) = x2 + λ2 e ≤ x2 + λ2 , so daß α2 + β 2 + 2βλ ≤ x2 f¨ ur alle λ ∈ R. Daher gilt β = 0.
2
468
IX.
Banachalgebren
Theorem IX.3.4 (Satz von Gelfand-Naimark, kommutative Version) A sei eine kommutative C ∗ -Algebra mit Einheit. Dann ist die Gelfandtransformation ein isometrischer ∗ -Isomorphismus; es gilt 9∗ = x x
∀x ∈ A.
(IX.4)
Es ist also A in allen Strukturen isomorph zu C(ΓA ). Beweis. Da A kommutativ ist, k¨ onnen wir die Gelfandsche Darstellungs = { theorie anwenden und A x: x ∈ A} ⊂ C(ΓA ) betrachten. Nach Lem abgeschlossen in ma IX.3.3(b) und (IX.3) ist x → x isometrisch; daher ist A C(ΓA ). Wir benutzen nun den Satz von Stone-Weierstraß (Satz VIII.4.7), dicht liegt. Es ist klar, daß A eine Unteralgebra ist, um zu zeigen, daß A daß A die Punkte von ΓA trennt und daß 1 ∈ A ist. Wenn (IX.4) gezeigt ist, folgt mit dem Satz von Stone-Weierstraß die behauptete Dichtheit und = C(ΓA ). A Nun zu (IX.4). Sei zun¨ achst x selbstadjungiert. Dann ist (IX.4) ¨aquivalent dazu, daß x reellwertig ist; und das folgt aus Lemma IX.3.3(c) sowie ∗ x−x∗ Satz IX.2.7(c). Ein beliebiges x zerlege in x = y + iz = x+x 2 + i 2i . Dann sind y und z selbstadjungiert, und (IX.4) folgt aus der Vor¨ uberlegung. 2 Korollar IX.3.5 Es existieren kompakte Hausdorffr¨aume T und Tμ und isometrische ∗ -Isomorphismen ∞ ∼ = C(Tμ ). = C(T ), L∞ (μ) ∼ Nach dem in Abschnitt VIII.7 diskutierten Satz von Banach-Stone sind oomorphie eindeutig bestimmt. T und Tμ bis auf Hom¨ Nun kommen wir noch einmal auf die C ∗ -Algebra aus Beispiel (b) zur¨ uck. Allgemeiner sei A eine C ∗ -Algebra mit Einheit e, es sei x ∈ A ein normales Element und A0 die von e, x und x∗ erzeugte C ∗ -Unteralgebra von A. Nach dem Satz von Gelfand-Naimark kann A0 als C(ΓA0 ) dargestellt werden. Um diese Darstellung etwas transparenter zu machen, zeigen wir folgenden Satz. Satz IX.3.6 (a) ΓA0 ist hom¨oomorph zu σ(x). (b) Dieser Hom¨oomorphismus induziert isometrische ∗ -Isomorphismen C(σ(x)) ∼ = A0 , = C(ΓA0 ) ∼ so daß t (bzw. t bzw. 1) ∈ C(σ(x)) auf x (bzw. x∗ bzw. e) ∈ A abgebildet werden. Beweis. (a) Nach Theorem IX.2.8 ist σA0 (x) = σ( x) = {ϕ(x): ϕ ∈ ΓA0 }, so daß x eine stetige Funktion von ΓA0 auf σA0 (x) ist. Es bleibt σA0 (x) = σ(x) (= σA (x)) und die Injektivit¨ at von x zu zeigen, da dann aus Lemma B.2.7
IX.3
C ∗ -Algebren
469
(ΓA0 ist kompakt) Teil (a) folgt. Die Gleichheit der Spektren wird im folgenden Lemma bewiesen. Nun zur Injektivit¨ at von x . Gelte also ϕ(x) = ψ(x) f¨ ur ϕ, ψ ∈ ΓA0 . Dann ist auch 9∗ )(ϕ) = x ϕ(x∗ ) = (x (ϕ) = ϕ(x) = ψ(x) = ψ(x∗ ). Daher stimmen ϕ und ψ auf endlichen Summen der Form an,m xn (x∗ )m u unden. ¨ berein; also gilt ϕ = ψ aus Stetigkeitsgr¨ (b) folgt sofort aus (a). 2 Satz IX.3.6 er¨ offnet – wie in Kapitel VII – die M¨oglichkeit, Funktionen von normalen, insbesondere selbstadjungierten Elementen x einer C ∗ Algebra zu bilden; man nennt dieses Verfahren den Funktionalkalk¨ ul von x. Es ist noch ein Lemma nachzutragen; u ¨ brigens kann man auf die Normalit¨ at von x in Lemma IX.3.7 verzichten, aber wir ben¨otigen nur die folgende Fassung. Lemma IX.3.7 Sei A eine C ∗ -Algebra mit Einheit e, x ∈ A normal und B ⊂ A eine C ∗ -Unteralgebra von A mit e, x ∈ B. Dann ist σB (x) = σA (x). Beweis. ⊃“ ist klar, und es reicht, die umgekehrte Inklusion f¨ ur B = A0 zu ” zeigen. Es sei Φ: C(σA0 (x)) → A0 der ∗ -Isomorphismus aus Satz IX.3.6. (Die Existenz dieses ∗ -Isomorphismus ist wirklich bereits bewiesen.) Nehmen wir an, es g¨ abe λ ∈ σA0 (x) \ σA (x). Dann existiert y := (λ − x)−1 ∈ A. Seien m > y und f ∈ C(σA0 (x)) derart, daß f (λ) = m und |f (t)(λ − t)| ≤ 1 f¨ ur alle t ∈ σA0 (x). Es folgt mit g(t) = f (t)(λ − t) m ≤ f ∞ = Φ(f ) = Φ(f )(λ − x)y ≤ Φ(g) y = g ∞ y ≤ y im Widerspruch zur Wahl von m.
2
Spezialisiert man diese Betrachtungen auf die C ∗ -Algebra A = L(H) und einen normalen Operator T ∈ L(H), so erf¨ ullt der ∗ -Isomorphismus Φ: ∗ C(σ(T )) → A0 = alg(T, T ) ⊂ L(H) aus Satz IX.3.6 Φ(t) = T , Φ(t) = T ∗ , Φ(1) = Id. Hiermit haben wir das Analogon zu Satz VII.1.3 f¨ ur normale Operatoren gefunden. Ausgehend von Satz IX.3.6(b) kann man nun (wie in Kapitel VII) direkt die spektrale Zerlegung T = λ dEλ eines normalen Operators finden, statt wie in Satz VII.1.25 auf die Maßtheorie und den Spektralsatz f¨ ur selbstadjungierte Operatoren zur¨ uckzugreifen. Zusammenfassend erhalten wir: Korollar IX.3.8 (Spektralsatz f¨ ur normale beschr¨ankte Operatoren) Sei T ∈ L(H) normal. Dann existiert ein isometrischer ∗ -Homomorphismus Φ: C(σ(T )) → L(H) mit Φ(t) = T , Φ(t) = T ∗ , Φ(1) = Id.
470
IX.
Banachalgebren
Im letzten Teil dieses Kapitels wollen wir uns den nichtkommutativen C ∗ -Algebren widmen und zeigen, daß diese stets ∗ -isomorph zu Unteralgebren von L(H), H ein geeigneter Hilbertraum, sind. Der Beweis dieses Darstellungssatzes (Theorem IX.3.15) st¨ utzt sich – ¨ahnlich wie im kommutativen Fall – auf die Analyse gewisser Funktionale, die als n¨achstes definiert werden. Definition IX.3.9 Sei A eine C ∗ -Algebra mit Einheit e. Ein Funktional ω ∈ A heißt Zustand, falls ω(e) = ω = 1 gilt. Die Menge aller Zust¨ande wird mit S(A) bezeichnet2 . Es ist klar, daß S(A) stets eine konvexe schwach∗-kompakte Teilmenge von A ist, denn S(A) = BA ∩ {ω: ω(e) = 1}. Ist A = C(K), so sind genau die Wahrscheinlichkeitsmaße auf K Zust¨ ande auf A. Beispiele f¨ ur Zust¨ ande auf A = L(H) sind die Vektorzust¨ ande ω: T → T ξ, ξ f¨ ur ξ ∈ H, ξ = 1, bzw. allgemeiner ω: T → ∞ k=1 T ξk , ξk ∞ f¨ ur k=1 ξk 2 = 1. Wir ben¨ otigen einen weiteren Begriff. Definition IX.3.10 Sei A eine C ∗ -Algebra mit Einheit e. Ein selbstadjungiertes Element x ∈ A heißt positiv, falls σ(x) ⊂ [0, ∞) gilt. Nach Aufgabe IX.4.4 sind die in diesem Sinn positiven Elemente von A = C(K) tats¨achlich die positiven Funktionen. Ferner sind die positiven Elemente von A = L(H) genau die bislang positiv genannten Operatoren T , die T ξ, ξ ≥ 0 f¨ ur alle ξ ∈ H erf¨ ullen (Aufgabe IX.4.16). Lemma IX.3.11 Sei A eine C ∗ -Algebra mit Einheit e, und seien x, y ∈ A selbstadjungiert. (a) Es ist ω(x) ∈ R f¨ ur alle ω ∈ S(A), und f¨ ur alle λ ∈ σ(x) existiert ein Zustand ω mit ω(x) = λ. (b) x ist genau dann positiv, wenn ω(x) ≥ 0 f¨ ur alle Zust¨ande ω gilt. (c) Mit x und y ist auch x + y positiv. (d) Es existieren positive x+ , x− ∈ A mit x = x+ − x− und x+ x− = x− x+ = 0. (e) x ist genau dann positiv, wenn u ∈ A mit x = u∗ u existiert. Beweis. Wir beginnen mit einer Vorbemerkung. Wir werden die von x und e erzeugte C ∗ -Algebra A0 = alg(x) betrachten. Da nach Lemma IX.3.7 σA (x) = σA0 (x) gilt, ist x genau dann in A positiv, wenn x in A0 positiv ist. Nach Satz IX.3.6 ist A0 ∗ -isomorph zu C(σ(x)), so daß x der identischen Funktion t entspricht. Diese Aussagen werden im folgenden stillschweigend benutzt. 2S
wie state.
IX.3
C ∗ -Algebren
471
(a) Ist x selbstadjungiert und ω ∈ S(A), so ist x = t ∈ C(σ(x)) reellwertig (Lemma IX.3.3) und ω0 := ω |A0 ∈ S(A0 ), d.h. ω0 ist mit einem Wahr scheinlichkeitsmaß μ auf σ(x) zu identifizieren. Es folgt ω(x) = x dμ ∈ R. Sei umgekehrt λ ∈ σ(x) = σ( x); das Funktional ω0 : a → a(λ) ist dann ein Zustand auf A0 . Sei ω eine Hahn-Banach-Fortsetzung von ω0 auf A. Es gilt dann ω = ω0 = ω(e) = 1, also ω ∈ S(A), und es ist ω(x) = x (λ) = λ. (b) Wie unter (a) sieht man ω(x) ≥ 0 f¨ ur ω ∈ S(A) und positives x; die Umkehrung ist ein Spezialfall von (a). (c) ist klar nach (b). (d) Da es solch eine Zerlegung in A0 ∼ = C(σ(x)) gibt, ist (d) √ evident. = x . Die Um(e) Ist x positiv, so auch x ; w¨ ahle also u ∈ A0 mit u kehrung ist wesentlich schwieriger zu beweisen, weil u nicht als selbstadjungiert vorausgesetzt ist. Zun¨ achst ist x = u∗ u stets selbstadjungiert, und wir schreiben x = x+ − x− wie unter (d). Wegen x+ x− = x− x+ = 0 folgt (ux− )∗ (ux− ) = x− u∗ ux− = x− (x+ − x− )x− = −x3− , so daß −(ux− )∗ (ux− ) positiv ist. Nun kann jedes Element z einer C ∗ Algebra als z = a + ib mit selbstadjungierten a und b geschrieben werden 1 (z − z ∗ )). Wendet man diese Beobachtung (n¨ amlich a = 12 (z + z ∗ ), b = 2i f¨ ur z = ux− an, erh¨ alt man (ux− )∗ (ux− ) = (a + ib)∗ (a + ib) = a2 + b2 + i(ab − ba) (ux− )(ux− )∗ = (a + ib)(a + ib)∗ = a2 + b2 + i(ba − ab) = 2(a2 + b2 ) + −(ux− )∗ (ux− ) , und als Summe positiver Elemente ist dieser Ausdruck nach (c) positiv. Wir wissen nun σ (ux− )∗ (ux− ) ⊂ (−∞, 0], σ (ux− )(ux− )∗ ⊂ [0, ∞). Aber nach Lemma IX.1.5 h¨ angt das Spektrum (bis auf die 0) nicht von der Reihenfolge der Faktoren ab. Daher folgt σ(−x3− ) = σ (ux− )∗ (ux− ) = {0}, d.h. x− = 0, und x ist positiv, wie behauptet.
2
Dieses Lemma wird es gestatten, zu einem Zustand ω ein Skalarprodukt und damit einen Hilbertraum zu assoziieren. Wir setzen [x, y]ω = ω(y ∗ x)
∀x, y ∈ A.
Es ist klar, daß [ . , . ]ω sesquilinear ist, und es gilt [x, y]ω = ω(y ∗ x) = ω(a + ib) = ω(a) − iω(b) = ω(a − ib) = ω (a + ib)∗ = ω(x∗ y) = [y, x]ω ;
472
IX.
Banachalgebren
hier haben wir y ∗ x = a+ ib mit selbstadjungierten a, b ∈ A geschrieben und Lemma IX.3.11(a) benutzt. Lemma IX.3.11(b) und (e) zeigen [x, x]ω ≥ 0 f¨ ur alle x ∈ A, so daß die einzige Eigenschaft eines Skalarprodukts, die [.,.]ω noch fehlt, die Definitheit ist. In der Tat braucht [x, x]ω = 0 nicht bloß f¨ ur x = 0 zu gelten; daher definieren wir Iω = {x ∈ A: [x, x]ω = 0} und werden zum Quotientenraum A/Iω u ¨bergehen. Bevor das geschieht, formulieren wir ein weiteres Lemma, in dem die obigen Bezeichnungen beibehalten werden. Lemma IX.3.12 (a) (Cauchy-Schwarzsche Ungleichung) 1/2 [x, y]ω ≤ [x, x]1/2 ω [y, y]ω
∀x, y ∈ A
ur alle y ∈ A gilt. (b) Es gilt [x, x]ω = 0 genau dann, wenn [x, y]ω = 0 f¨ (c) Es gilt ∀a, x ∈ A. [ax, ax]ω ≤ a 2 [x, x]ω (d) Iω ist ein Untervektorraum mit a ∈ A, x ∈ Iω
⇒
ax ∈ Iω ;
mit anderen Worten ist Iω ein Linksideal in A. Beweis. (a) Im Fall [y, y]ω = 0 ist der Beweis genauso wie bei der CauchySchwarz-Ungleichung in Satz V.1.2. Falls [y, y]ω = 0, zeigt der dortige Beweis 0 ≤ [x, x]ω + λ[x, y]ω + λ[x, y]ω ∀λ ∈ C. Indem man λ = ±t, λ = ±it mit t → ∞ setzt, schließt man [x, y]ω = 0, was zu zeigen war. (b) folgt aus (a). (c) Es ist [ax, ax]ω = ω(x∗ a∗ ax), a 2 [x, x]ω = ω(x∗ a 2 x). Nun gilt ∗ a a = a 2 und deshalb σ(a∗ a) ⊂ [− a 2 , a 2 ], weswegen σ( a 2 − a∗ a) ⊂ [0, ∞) folgt. Nach Lemma IX.3.11(e) kann man a 2 − a∗ a = u∗ u f¨ ur ein u ∈ A schreiben. Damit schließt man a 2 [x, x]ω − [ax, ax]ω = ω(x∗ u∗ ux) = ω (ux)∗ (ux) ≥ 0; im letzten Schritt wurden Lemma IX.3.11(b) und (e) benutzt. (d) Teil (b) zeigt, daß Iω ein Untervektorraum ist, und (c) impliziert die linksseitige Idealeigenschaft. 2 Nun sind wir berechtigt, den Quotientenvektorraum A/Iω zu betrachten und x + Iω , y + Iω ω := [x, y]ω
IX.3
C ∗ -Algebren
473
zu definieren. Nach Konstruktion ist . , . ω ein Skalarprodukt auf A/Iω ; die Vervollst¨ andigung des Pr¨ ahilbertraums A/Iω bezeichnen wir mit Hω . Das auf Hω fortgesetzte Skalarprodukt wird weiterhin als . , . ω geschrieben. Damit ist es gelungen, einem Zustand ω kanonisch einen Hilbertraum Hω zuzuordnen. Wir werden u ¨ berlegen, daß die Elemente der C ∗ -Algebra A kanonisch als Operatoren auf Hω wirken. Dazu definieren wir die lineare Abbildung π ˜ω : A → L(A/Iω ),
π ˜ω (a)(x + Iω ) = ax + Iω .
Die π ˜ω (a) sind nach Lemma IX.3.12(d) wohldefiniert, und sie sind stetig nach Lemma IX.3.12(c); genauer zeigt dieses Lemma ˜ πω (a) ≤ a . In der 1/2 anderen Richtung ist ˜ πω (a) ≥ ae + Iω = [a, a]ω , denn e + Iω ≤ 1 (sogar = 1, denn e ∈ / Iω ; verwende die Neumannsche Reihe). Die π ˜ω (a) k¨ onnen also zu Operatoren von Hω in sich fortgesetzt werden, die mit πω (a) bezeichnet werden. Lemma IX.3.13 πω : A → L(Hω ) ist ein stetiger ∗ -Homomorphismus, und es gilt ∀a ∈ A. [a, a]1/2 ω ≤ πω (a) ≤ a Beweis. Es ist nur noch zu verifizieren, daß πω ein ∗ -Homomorphismus ist. Nach Konstruktion ist πω (ab)(x + Iω ) = abx + Iω = πω (a)(bx + Iω ) = πω (a) πω (b)(x + Iω ) , ur alle a, b ∈ A. Außerdem gilt also πω (ab) = πω (a)πω (b) f¨ x + Iω , πω (a∗ )(y + Iω )ω = x + Iω , a∗ y + Iω ω = ω(y ∗ ax) = ax + Iω , y + Iω ω = πω (a)(x + Iω ), y + Iω ω , ∗ was πω (a∗ ) = πω (a) zeigt. (Da A/Iω dicht in Hω liegt, durften wir uns anken.) 2 auf Elemente der Form x + Iω beschr¨ Das einzige Hindernis, das es jetzt noch zu u ¨berwinden gilt, besteht darin, daß πω nicht isometrisch zu sein braucht. Um einen isometrischen ∗ -Homomorphismus von A nach L(H) zu erhalten, bilden wir die Summe“ ” der πω . Genauer betrachten wir den Hilbertraum !2 ξω , ξω ω < ∞ H = ω∈S(A) Hω = (ξω )ω∈S(A) : ξω ∈ Hω , ω∈S(A)
474
IX.
Banachalgebren
mit dem Skalarprodukt 1
2 (ξω ), (ηω ) = ξω , ηω ω . ω∈S(A)
Die Summation ist hier im Sinn von Definition V.4.6 zu verstehen. Es ist elementar zu u ufen, daß H tats¨ achlich ein Hilbertraum ist; H ist die ¨ berpr¨ aren wir einen Operator Hilbertsche Summe der Hω . Nun erkl¨ π: A → L(H), π(a) (ξω )ω = πω (a)(ξω ) ω . Da alle πω ∗ -Homomorphismen sind, ist auch π ein ∗ -Homomorphismus. Ferner ist es einfach zu zeigen, daß π(a) = sup πω (a) ω∈S(A)
gilt; beachte, daß die π(a) als Diagonaloperatoren“ auf H = ” wirken. Aus Lemma IX.3.13 folgt daher sup [a, a]1/2 ω ≤ π(a) ≤ a
!2
ω∈S(A) Hω
∀a ∈ A.
ω∈S(A)
Das n¨ achste Lemma impliziert, daß π isometrisch ist. 1/2
Lemma IX.3.14 Zu jedem a ∈ A existiert ein Zustand ω mit [a, a]ω a .
=
Beweis. Wir suchen einen Zustand ω mit ω(a∗ a) = a 2 = a∗ a . Betrachte die von e und x := a∗ a erzeugte C ∗ -Algebra A0 , die zu C(σ(x)) ∗ -isomorph ist. Da x selbstadjungiert und positiv ist, liegt x = r(x) in σ(x). Lemma IX.3.11(a) liefert einen Zustand ω mit ω(x) = x , was zu zeigen war. 2 Damit ist insgesamt folgendes Theorem bewiesen. (Man kann nach Aufgabe IX.4.14 auf die Forderung einer Einheit von A verzichten.) Theorem IX.3.15 (Satz von Gelfand-Naimark, nichtkommutative Version) Ist A eine C ∗ -Algebra mit Einheit, so existieren ein Hilbertraum H und ein isometrischer ∗ -Homomorphismus π: A → L(H). uhrt, wird nach den Die Konstruktion, die zu den Hilbertr¨ aumen Hω f¨ Initialen von Gelfand, Naimark und Segal, der ebenfalls Beitr¨age zur Darstellungstheorie von C ∗ -Algebren lieferte, GNS-Konstruktion genannt. Eine Darstellung (H, π) einer C ∗ -Algebra A ist ein ∗ -Homomorphismus π: A → L(H), wo H ein Hilbertraum ist; ist π isometrisch, heißt sie treu. Die
IX.3
C ∗ -Algebren
475
in Theorem IX.3.15 konstruierte treue Darstellung wird universelle Darstellung genannt, da man zeigen kann, daß sie jede andere Darstellung enth¨alt. Der Preis dieser Universalit¨ at ist, daß der der universellen Darstellung zugrundeliegende Hilbertraum h¨ ochst inseparabel und deshalb h¨aufig nicht der nat¨ urlichste Darstellungsraum ist. Beispiel. Wir wollen nun ein Beispiel einer GNS-Konstruktion durchrechnen, um diesen Effekt zu studieren. Wir betrachten die endlichdimensionale C ∗ -Algebra A = L(Cn ); es sei {e1 , . . . , en } die kanonische Einheitsvektorbasis des Cn . Sei 1 1 T ek , ek = tr(T ); n n n
ω(T ) =
k=1
tr bezeichnet die Spur. Diesem Zustand ω wird die Sesquilinearform 1 Sek , T ek n n
[S, T ]ω = ω(T ∗ S) =
k=1
zugeordnet. Hier ist Iω = {T : ω(T ∗ T ) = 0} = {0}; also ist [ . , . ]ω in diesem Fall bereits ein Skalarprodukt, und man braucht nicht den Quotientenraum A/Iω heranzuziehen. Dieses Skalarprodukt ist wohlbekannt: Bis auf den Faktor n1 ist es nichts anderes als das Hilbert-Schmidt-Skalarprodukt aus √ Satz VI.6.2(f). Des weiteren ist Hω = A, aber mit dem 1/ n-fachen der Hilbert-Schmidt-Norm . HS versehen, und nicht mit der Operatornorm. Die C ∗ -Algebra A wirkt auf Hω (= sich selbst) mittels πω (T )(S) = T S, ur die Norm gilt T ∈ A, S ∈ Hω , und f¨ πω (T ) = sup S
T S HS = T S HS
∀T ∈ A,
wie man unschwer best¨ atigt. Daher ist πω selbst isometrisch und stellt L(Cn ) treu u ¨ ber dem n2 -dimensionalen Hilbertraum HS(Cn ) der HilbertSchmidt-Operatoren auf Cn dar. F¨ ur die universelle Darstellung erh¨alt man einen nicht separablen Hilbertraum, da es u ¨berabz¨ahlbar viele Zust¨ande gibt. Zum Schluß notieren wir ein Beispiel einer C ∗ -Algebra, die nur auf nicht separablen Hilbertr¨ aumen treu dargestellt werden kann. (F¨ ur ein positives Resultat vgl. Aufgabe IX.4.19.) Satz IX.3.16 Ist π: L(2 )/K(2 ) → L(H) ein isometrischer ∗ -Homomorphismus auf der Calkin-Algebra, so ist der Hilbertraum H nicht separabel.
476
IX.
Banachalgebren
Beweis. Die Calkin-Algebra L(2 )/K(2 ) wurde in Beispiel (d) eingef¨ uhrt. F¨ ur eine Teilmenge N ⊂ N bezeichne PN die Orthogonalprojektion von 2 auf lin{ek : k ∈ N }. Dann hat QN := PN + K(2 ) ∈ L(2 )/K(2 ) die Eigenschaften Q2N = QN , Q∗N = QN . π(QN ) besitzt nun dieselben Eigenschaften und ist daher eine Orthogonalprojektion in L(H). Bemerke, daß ur endliche N ⊂ N verschwindet. In Lemma IV.6.6 wurde eine QN genau f¨ u ahlbare Familie von unendlichen Teilmengen Ni ⊂ N konstruiert, ¨ berabz¨ so daß Ni ∩ Nj f¨ ur i = j endlich ist. Es ist also QNi QNj = QNj QNi = 0 f¨ ur i = j und QNi = 0 f¨ ur alle i. Folglich gibt es u ¨ berabz¨ahlbar viele Orthogonalprojektionen = 0 mit paarweise orthogonalen Bildern in L(H), und H kann nicht separabel sein. 2
IX.4
Aufgaben
Aufgabe IX.4.1 Betrachte auf C 1 [0, 1] die punktweise Multiplikation (f g)(t) = f (t)g(t) und die Normen f = max{f ∞ , f ∞ } sowie |||f ||| = f ∞ + f ∞ . Welche dieser Normen macht C 1 [0, 1] zu einer Banachalgebra? Aufgabe IX.4.2 Auf p , 1 ≤ p < ∞, definiere die Multiplikation (xy)(n) = x(n)y(n). Zeige, daß p mit der kanonischen Norm so zu einer Banachalgebra wird. Bestimme alle Homomorphismen ϕ: p → C. Aufgabe IX.4.3 Auf dem Raum M (R) aller komplexen Borelmaße auf R, versehen mit der Variationsnorm, erkl¨ are das Faltungsprodukt durch
(μ ∗ ν)(E) =
χE (s + t) dμ(s)dν(t), R
R
wo E ⊂ R eine Borelmenge ist. (a) Beweise, daß M (R) mit dem Faltungsprodukt eine kommutative Banachalgebra ist. Besitzt sie eine Einheit? (b) Der Operatorvon L1 (R) nach M (R), der f ∈ L1 (R) auf das absolutstetige Maß μ: E → E f (t) dt abbildet, ist ein isometrischer Algebrenhomomorphismus bzgl. der Faltungsprodukte. (c) Auf diese Weise kann L1 (R) mit einem abgeschlossenen Ideal von M (R) identifiziert werden. Aufgabe IX.4.4 Zeige σ(f ) = {f (t): t ∈ T } f¨ ur f ∈ C(T ), wo T ein kompakter Hausdorffraum ist und C(T ) mit der punktweisen Multiplikation und der Supremumsnorm versehen ist. Aufgabe IX.4.5 Zeige, daß in einer Banachalgebra im allgemeinen σ(xy) = σ(yx) gilt. Aufgabe IX.4.6 Sei A eine Banachalgebra mit Einheit und a ∈ A. Der Operator art. Zeige La = a und σ(La ) = σ(a). La : A → A sei durch La (x) = ax erkl¨
IX.4
Aufgaben
477
Aufgabe IX.4.7 Betrachte die Faltungsalgebra A = 1 (Z) und die Unteralgebra B = {(sn ) ∈ 1 (Z): sn = 0 ∀n < 0} = 1 (N0 ). Zeige σA (e1 ) = σB (e1 ). Aufgabe IX.4.8 Auf dem Raum A aller komplexen Folgen x = (xn )n≥0 mit ∞ n 2 x := |xn |e−n < ∞ betrachte die Faltung (x ∗ y)n = x y als n=0 k=0 k n−k Multiplikation. (a) (A, ∗ , . ) ist eine kommutative Banachalgebra mit Einheit. (b) J = {x: x0 = 0} ist ein maximales Ideal, und jedes x ∈ J hat den Spektralradius r(x) = 0. (c) F¨ ur x = (x0 , x1 , x2 , . . .) ist σ(x) = x0 . (d) Die Gelfandtransformation verschwindet auf J; insbesondere ist sie nicht injektiv. Aufgabe IX.4.9 Auf der Faltungsalgebra A = 1 (Z) definiere x∗ (n) = x(−n). Dann ist x → x∗ eine isometrische Involution. Macht sie 1 (Z) zu einer C ∗ Algebra? Aufgabe IX.4.10 In dieser Aufgabe diskutieren wir den Quaternionenschiefk¨ orper H. Das ist der Raum R4 , der mit folgender Multiplikation ausgestattet wird: Man schreibe (a, b, c, d) ∈ R4 als a + ib + jc + kd, definiere i2 = j 2 = k2 = −1, ij = −ji = k, jk = −kj = i, ki = −ik = j und setze linear fort. Versieht man H mit der euklidischen Norm des R4 , gilt xy ≤ x y f¨ ur alle x, y ∈ H. Man kann nun H auch als zweidimensionalen komplexen Raum auffassen, so daß wir eine zweidimensionale komplexe Banachalgebra erhalten, in der jedes Element invertierbar ist. Das widerspricht aber dem Satz von Gelfand-Mazur. Was stimmt hier nicht? ¨ (Uber Quaternionen kann man in H.-D. Ebbinghaus et al., Zahlen, Springer 1983, nachlesen.) Aufgabe IX.4.11 Betrachte die Disk-Algebra A(D) aus Beispiel I.1(e). (a) Zu f ∈ A(D) und 0 < r < 1 definiere fr (z) = f (rz). Dann ist fr ∈ A(D) und limr→1 fr = f . (b) Die Menge U aller Funktionen f ∈ A(D), die in einer (von f abh¨ angigen) offenen Umgebung von D analytisch sind, bilden einen dichten Unterraum von A(D). (c) F¨ ur |z| ≤ 1 ist ϕz : f → f (z) ein komplexer Homomorphismus auf A(D). (d) Jeder komplexe Homomorphismus ϕ = 0 auf A(D) ist von der Gestalt oomorph zu D. ϕz , |z| ≤ 1, und ΓA(D) ist hom¨ (Hinweis: Betrachte die identische Funktion ζ: z → z und setze z0 = ϕ(ζ). Zeige dann zuerst ϕ = ϕz0 auf U ; betrachte dazu die Potenzreihe der f ∈ U .) (e) Beschreibe die Gelfandtransformation auf A(D). Aufgabe IX.4.12 Beschreibe die Gelfandtransformation der Algebra B aus Aufgabe IX.4.7.
478
IX.
Banachalgebren
Aufgabe IX.4.13 Eine mit einer Involution x → x∗ versehene Banachalgebra A, die ∀x ∈ A x∗ x ≥ x2 erf¨ ullt, ist eine C ∗ -Algebra. Aufgabe IX.4.14 Sei A eine Banachalgebra ohne Einheit und A1 = A ⊕ C. (a) Definiert man auf A1 das Produkt (a, s)(b, t) = (ab + ta + sb, st) und die Norm (a, s) = a + |s|, so ist (A1 , . ) eine Banachalgebra mit Einheit, und a → (a, 0) ist ein isometrischer Algebrenhomomorphismus von A auf das Ideal A ⊕ {0} von A1 . (b) Ist A sogar eine C ∗ -Algebra, so definiert (a, s)∗ = (a∗ , s) eine isometrische Involution auf (A1 , . ), aber (A1 , . ) ist keine C ∗ -Algebra. (c) Man kann auf folgende Weise eine C ∗ -Algebrennorm auf A1 erhalten, so daß a → (a, 0) ist ein isometrischer ∗ -Homomorphismus ist. Wir fassen A als Unteralgebra von A1 auf. Betrachte zu a ∈ A1 den Operator La : ur alle a ∈ A. Setze A → A, La (x) = ax. Zeige als erstes La = a f¨ ur alle a ∈ A1 und beweise, daß es sich um eine C ∗ nun |||a||| = La f¨ Algebrennorm handelt; begr¨ unde insbesondere, warum ||| . ||| eine Norm ist. Kurz gesagt kann also jede C ∗ -Algebra ohne Einheit zu einer C ∗ -Algebra mit Einheit erweitert werden. Aufgabe IX.4.15 Zeige, daß ein kompakter Hausdorffraum K mit C b ((0, 1]) ∼ = C(K) existiert. Kann K = [0, 1] gew¨ ahlt werden? Aufgabe IX.4.16 Sei H ein Hilbertraum und T ∈ L(H) selbstadjungiert. Dann ist T ξ, ξ ≥ 0 f¨ ur alle ξ ∈ H genau dann, wenn ω(T ) ≥ 0 f¨ ur alle Zust¨ ande auf L(H) gilt. Schließe, daß T positiv im Sinn von Definition IX.3.10 genau dann ist, wenn T ξ, ξ ≥ 0 f¨ ur alle ξ ∈ H gilt. ur ξ = 1 und zeige S(L(H)) = co{ωξ : (Hinweis: Setze ωξ (S) = Sξ, ξ f¨ ξ = 1} (schwach∗ -Abschluß). Dazu verwende den Satz von Hahn-Banach und Lemma VII.1.1.) Aufgabe IX.4.17 (Die CAR-Algebra) n Sei n ∈ N0 und M ∈ L C2 , also eine (2n × 2n )-Matrix. Wir werden einen Operator TM auf 2 definieren, der als Inflation“ der Matrix M entsteht. Es sei ” {e1 , e2 , . . .} die Einheitsvektorbasis des 2 und Uk,n = lin{e(k−1)2n +1 , . . . , ek2n }; !2 n 2 ∼ U . Identifiziert man jedes Uk,n kanonisch mit C2 , wird dann ist = k∈N k,n durch TM : (uk,n )k → (M uk,n )k , uk,n ∈ Uk,n , ein Operator TM ∈ L(2 ) definiert. (Es ist sich TM als unendliche Matrix hilfreich, n . vorzustellen.) Setze An = TM : M ∈ L C2
n
(a) An ist eine C ∗ -Unteralgebra von L(2 ), die zu L C2 (b) Es gilt A0 ⊂ A1 ⊂ A2 ⊂ . . . , A∞ := A := A∞ ist eine C ∗ -Algebra.
∗
-isomorph ist.
A ist eine Algebra, und n n
479
IX.5 Bemerkungen und Ausblicke
(c) Es existiert ein Zustand ω ∈ A mit 1 T el , el m m
ω(T ) = lim m→∞
∀T ∈ A.
l=1
(Untersuche die rechte Seite zuerst f¨ ur T ∈ An .) (d) Dieser Zustand erf¨ ullt ω(ST ) = ω(T S) f¨ ur alle S, T ∈ A, weswegen er Spurzustand genannt wird. (Vgl. die entsprechenden Eigenschaften der Spur tr aus Satz VI.5.8(c); jedoch ist tr nicht auf der ganzen C ∗ -Algebra L(2 ) definiert, sondern nur auf N (2 ).) Die Algebra A wird CAR-Algebra (oder Fermionenalgebra) genannt, da in ihr die Fermionen auszeichnenden canonical anticommutator relations formuliert werden k¨ onnen. Sie hat einige bemerkenswerte Eigenschaften, von denen eine in Teil (d) vorkommt. Die CAR-Algebra wird detailliert in Bratteli/Robinson [1981] und Kadison/Ringrose [1986] studiert. Aufgabe IX.4.18 Betrachte den Vektorzustand ω: T → T ξ, ξ auf der C ∗ Algebra L(H). F¨ uhre die GNS-Konstruktion f¨ ur diesen Zustand durch. Aufgabe IX.4.19 Sei A eine separable C ∗ -Algebra mit Einheit. Dann existiert ein isometrischer ∗ -Homomorphismus π: A → L(2 ). !2 Hω f¨ ur eine (Hinweis: Verwende die GNS-Konstruktion und betrachte H = ω∈Ω geeignete abz¨ ahlbare Teilmenge Ω von Zust¨ anden.) Aufgabe IX.4.20 (Toeplitz-Operatoren) Sei H der von den Funktionen z → z n , n ≥ 0, aufgespannte abgeschlossene ur Unterraum von L2 (T) und P die Orthogonalprojektion von L2 (T) auf H. F¨ f ∈ C(T) heißt der Operator Tf : H → H, ϕ → P (f ϕ), Toeplitz-Operator. Zeige, daß π: C(T) → L(H)/K(H), π(f ) = Tf + K(H), ein stetiger ∗ -Homomorphismus der C ∗ -Algebra C(T) in die Calkin-Algebra ist. Ist auch f → Tf ein stetiger ∗ -Homomorphismus? (Hinweis: Untersuche zun¨ achst f (z) = z r , r ∈ Z.)
IX.5
Bemerkungen und Ausblicke
Die Theorie der Banachalgebren wurde 1941 von Gelfand entwickelt (Mat. Sbornik 9 (1941) 3–24); diese Arbeit enth¨ alt praktisch alle Resultate der Abschnitte IX.1 und IX.2. Wiener bewies Korollar IX.2.9 in Ann. Math. 33 (1932) 1–100, insbesondere S. 10–14, mit Methoden der harten“ Analysis; ” der elegante banachalgebraische Beweis stammt von Gelfand (Mat. Sbornik 9 (1941) 51–66). Der Satz von Gelfand-Mazur wurde auch von Mazur (C. R. Acad. Sc. Paris 207 (1938) 1025–1027) angek¨ undigt, jedoch ver¨offentlichte er keinen Beweis. Seine Arbeit inklusive vollst¨ andiger Beweise war n¨amlich zu umfangreich, um in den Comptes Rendus zu erscheinen; daher verlangten die Herausgeber eine Straffung des Texts. Diese Informationen findet man
480
IX.
Banachalgebren
˙ in Zelazko [1973], S. 18, der fortf¨ ahrt: The only sensible way of a shorten” ing was to leave out all the proofs, and the paper was finally so published.“ Erst 35 Jahre sp¨ ater wurde Mazurs Beweis tats¨achlich ver¨offentlicht, und ˙ zwar auf S. 19–22 in Zelazkos Buch. Mazurs Zugang funktioniert auch im reellen Fall und zeigt, daß die einzigen Banachalgebren u ¨ber dem K¨orper R, in denen jedes von 0 verschiedene Element ein Inverses besitzt, endlichdimensional und daher nach dem Satz von Frobenius R, C und die Quaternionenalgebra H sind. Die Darstellungstheorie f¨ ur kommutative Banachalgebren l¨aßt sich auch f¨ ur Algebren ohne Einheit durchf¨ uhren. Allerdings muß man sich jetzt auf gewisse Ideale beschr¨ anken, die man modular nennt, denn im allgemeinen ist nun nicht mehr jedes Ideal in einem maximalen Ideal enthalten. (Bourbaki gibt in Th´eories Spectrales, S. 95, Aufgabe 2, das Beispiel des Ideals d aller abbrechenden Folgen in c0 .) Es stellen sich jedoch die maximalen modularen Ideale als genau die Kerne der von 0 verschiedenen komplexen Homomorphismen heraus. Definiert man den Gelfandraum und die Gelfandtransformation wie im Fall der kommutativen Algebren mit Einheit, erh¨alt man einen lokalkompakten Raum ΓA und eine Abbildung ∧ : A → C0 (ΓA ). Im Fall A = L1 (R) ist, wie in Beispiel IX.2(d) erw¨ahnt, ΓA hom¨oomorph zu R verm¨ oge e−ist f (s) ds, ϕ ∈ ΓA ⇔ ϕ(f ) = ϕt (f ) = R
es ist also f(ϕt ) = e−ist f (s) ds. Die Fouriertransformation ist daher ein Spezialfall der Gelfandtransformation; die Aussage f ∈ C0 (R) ist das klassische Riemann-Lebesgue-Lemma (Satz V.2.2) und f¨allt hier als Nebenprodukt ab. Details hierzu kann man etwa bei Conway [1985] nachlesen. 1943 ver¨ offentlichten Gelfand und Naimark (Mat. Sbornik 12 (1943) 197–213) ihre Theorie der C ∗ -Algebren, wie in Abschnitt IX.3 dargelegt. Die Tatsache, daß u∗ u stets positiv ist, taucht bei ihnen noch als eines der Axiome f¨ ur C ∗ -Algebren auf, und 1953 konnte Kaplansky zeigen, daß diese Zusatzvoraussetzung automatisch erf¨ ullt ist (vgl. Lemma IX.3.11(e)). Vorher hatte Calkin (Ann. Math. 42 (1941) 839–873) mit Hilfe von Banachlimiten (Aufgabe III.6.5) bereits einen nichtseparablen Hilbertraum H und einen isometrischen ∗ -Homomorphismus der Calkin-Algebra L(2 )/K(2 ) nach L(H) konstruiert. Der kommutative“ Satz von Gelfand-Naimark, ” Theorem IX.3.4, ist eines der Lemmata aus ihrer Arbeit. Ist A eine kom∗ mutative C -Algebra ohne Einheit, so kann man zeigen, daß A isometrisch ∗ ¨ -isomorph zu C0 (ΓA ) ist. Ubrigens werden C ∗ -Algebren in der ¨alteren Li∗ teratur auch B -Algebren genannt. Segal (Bull. Amer. Math. Soc. 53 (1947) 73–88) perfektionierte die Darstellungstheorie f¨ ur C ∗ -Algebren mit Hilfe der GNS-Konstruktion. Als besonders wichtig erweisen sich die reinen Zust¨ande, d.h. die ω ∈ ex S(A), die
IX.5
481
Bemerkungen und Ausblicke
nach dem Satz von Krein-Milman (Theorem VIII.4.4) ja stets in ausreichender Zahl existieren. Genau f¨ ur solche ω haben n¨amlich die Darstellungen πω : A → L(Hω ) die Eigenschaft, daß K = {0} und K = Hω die einzigen abgeschlossenen Unterr¨ aume von Hω mit πω (a) (K) ⊂ K f¨ ur alle a ∈ A sind. Diese Eigenschaft nennt man Irreduzibilit¨at der Darstellung. ur Elemente einer C ∗ -Algebra Die Normeigenschaft x∗ x = x 2 f¨ A mag harmlos aussehen; tats¨ achlich impliziert sie jedoch eine sehr enge Kopplung der algebraischen und der metrischen Eigenschaften von A, wie aus Lemma IX.3.3(b) folgt. Dieses Lemma liefert n¨amlich 1/2 x = x∗ x 1/2 = r(x∗ x)
∀x ∈ A,
und hier ist die rechte Seite allein durch algebraische Gr¨oßen bestimmt, w¨ ahrend in die linke Seite nur die Norm eingeht. Es folgt, daß es h¨ochstens eine Norm auf einer involutiven Banachalgebra (mit Einheit) gibt, die diese zu einer C ∗ -Algebra macht, und daß jeder ∗ -Homomorphismus Φ zwischen C ∗ -Algebren (mit Einheit) stetig ist und sogar Φ ≤ 1 erf¨ ullt. In der allgemeinen Banachalgebrentheorie macht der sehr viel schwierigere Eindeutigkeitssatz von B. Johnson (1967) eine verwandte Aussage. • Ist A eine halbeinfache Banachalgebra mit Einheit, so sind je zwei Banachalgebrennormen auf A ¨aquivalent. Einen kurzen Beweis hierf¨ ur gibt Ransford, Bull. London Math. Soc. 21 (1989) 487–488. (Im nichtkommutativen Fall heißt eine Banachalgebra halbeinfach, wenn der Schnitt aller maximalen Linksideale nur die 0 umfaßt.) In Korollar IX.3.5 wurde als Folge des Satzes von Gelfand-Naimark beobachtet, daß die Algebra ∞ als C(T ) dargestellt werden kann. Schreibt man die Gelfandtransformation f¨ ur diesen Fall auf, sieht man folgende bizarre Eigenschaft des topologischen Raums T . Zun¨achst enth¨alt T die Homomorphismen δn : x → x(n), n ∈ N. Die Menge T0 dieser δn ist in oomorph zu N. Ferner folgt aus dem Satz von der schwach∗-Topologie hom¨ Tietze-Urysohn, daß T0 dicht in T liegt. Nach der Identifizierung von T0 mit N k¨ onnen wir T als kompakten Hausdorffraum ansehen, in dem N dicht ˇ liegt; man nennt T die Stone-Cech-Kompaktifizierung von N und schreibt T = βN. Vermittels der Gelfandtransformation erkennt man, daß jede beschr¨ ankte Folge (= jede stetige beschr¨ ankte Funktion auf N) zu einer stetigen beschr¨ ankten Funktion auf βN fortgesetzt werden kann; offenbar hat die einfachste Kompaktifizierung N ∪ {∞} diese Eigenschaft nicht. Genauso kann man f¨ ur einen normalen Hausdorffraum (oder allgemeiner einen sog. vollst¨ andig regul¨ aren topologischen Raum) T0 und die C ∗ -Algebra C b (T0 ) ˇ argumentieren und so die Stone-Cech-Kompaktifizierung βT0 erhalten, der dieselbe Fortsetzungseigenschaft zukommt. βT0 ist ein recht kompliziertes Gebilde. Es ist nie metrisierbar (es sei denn, T0 ist bereits kompakt (und metrisierbar)), und der Abschluß einer offenen Teilmenge von βN ist selbst
482
IX.
Banachalgebren
offen; diese letzte Eigenschaft stellt einige Anforderungen an die Vorstellungskraft. Bereits vor Gelfand hatte von Neumann gewisse (konkrete) C ∗ -Unteralgebren von L(H) untersucht, die man heute von-Neumann-Algebren nennt. Sein Ausgangspunkt war sein Bikommutantensatz (Math. Ann. 102 (1929) 370–427). Die Kommutante einer Teilmenge M ⊂ L(H) ist als M = {T ∈ L(H): T S = ST
∀S ∈ M }
definiert. (Dieses Objekt wird in der Literatur meistens mit M bezeichnet, was jedoch mit unserem Symbol f¨ ur einen Dualraum kollidiert.) Es ist klar, daß M stets eine Unteralgebra von L(H) ist, die in der schwachen Operatortopologie abgeschlossen ist und den identischen Operator enth¨alt. • (Bikommutantensatz) F¨ ur eine C ∗ -Unteralgebra A von L(H) mit Id ∈ A sind ¨aquivalent: (i) A ist in der starken Operatortopologie abgeschlossen. (ii) A ist in der schwachen Operatortopologie abgeschlossen. (iii) A = A . Ist eine dieser Bedingungen erf¨ ullt, heißt A eine von-Neumann-Algebra (oder W ∗ -Algebra). Sakai gelang es 1956, von-Neumann-Algebren abstrakt zu charakterisieren. • Genau dann besitzt eine C ∗ -Algebra A eine treue Darstellung als von-Neumann-Algebra, wenn A als Banachraum isometrisch isomorph zu einem Dualraum ist, d.h., wenn ein Banachraum X mit A∼ = X existiert. Ist π: A → L(H) die universelle Darstellung einer C ∗ -Algebra A, so ist ullende vonπ(A) eine von-Neumann-Algebra, die man die universell einh¨ Neumann-Algebra nennt. Sie ist – als Banachraum – isometrisch isomorph zum Bidualraum A von A. Im Gegensatz zu C ∗ -Algebren von Operatoren enthalten von-NeumannAlgebren stets Projektionen. Ist z.B. A ⊂ L(H) eine von-Neumann-Algebra, T ∈ A selbstadjungiert und T = λ dEλ die spektrale Zerlegung von T , so liegt f¨ ur alle Borelmengen B ⊂ σ(T ) die Orthogonalprojektion EB in A. In einer Reihe von Arbeiten analysierten Murray und von Neumann in den dreißiger Jahren von-Neumann-Algebren mit Hilfe des Verbands der in ihnen enthaltenen Orthogonalprojektionen. Sie widmeten sich insbesondere den maximal nichtkommutativen Algebren, den Faktoren, die durch die Forderung A ∩ A = C · Id definiert sind, und sie zeigten, daß diese in drei Klassen, die die technischen Bezeichnungen Typ I, II und III tragen, zerur einen geeigneten fallen. Ein Faktor vom Typ I ist ∗ -isomorph zu L(H0 ) f¨ Hilbertraum H0 , der eventuell endlichdimensional ist. Wesentlich interessanter sind die Faktoren vom Typ II, denn diese lassen Funktionale mit
IX.5
Bemerkungen und Ausblicke
483
ahnlichen Eigenschaften wie die Spur tr zu, die Anlaß zu einer nichtkom¨ ” mutativen Integrationstheorie“ geben. Die Feinstruktur der Faktoren vom ´ Typ III wurde von Connes studiert (Ann. Sci. Ecole Norm. Sup. 6 (1973) 133–252); diese sind f¨ ur die Quantenfeldtheorie besonders bedeutsam. Die Untersuchungen von Neumanns waren, zumindest zum Teil, durch die theoretische Physik motiviert. In den Bemerkungen und Ausblicken zu Kapitel VII wurde dargelegt, wie sich die Quantenmechanik selbstadjungierte Operatoren (= Observable) und normierte Vektoren im Hilbertraum (= Zust¨ ande) zunutze macht. In diesem Bild wirken die Observablen auf die Zust¨ ande; h¨ aufig ist auch die duale Formulierung, in der Zust¨ande auf Observablen wirken, wichtig, insbesondere in der Quantenfeldtheorie. In dem dualen Bild geht man von einer C ∗ -Algebra oder von-Neumann-Algebra A aus, die die Gesamtheit der f¨ ur das physikalische System relevanten Observablen umfaßt; ein Zustand (im physikalischen Sinn) ist dann ein Zustand im Sinn von Definition IX.3.9. Man beachte, wie ein Vektorzustand auf L(H) die auf S. 387 erhobene Forderung, daß ξ und λξ, |λ| = 1, denselben Zustand repr¨ asentieren sollen, erf¨ ullt, da ja ωξ (T ) = T ξ, ξ = T (λξ), λξ = ωλξ (T ). Die Dynamik des Systems wird nun durch eine Gruppe {σt : t ∈ R} von -Isomorphismen der Algebra A ausgedr¨ uckt. Die tiefliegende Tomita-Takesaki-Theorie gestattet es, zu Zust¨ anden auf von-Neumann-Algebren Automorphismengruppen zu assoziieren. An dieser Stelle mag man einwenden, daß die typischen Operatoren der Quantenmechanik unbeschr¨ ankt sind. Man hilft sich, indem man beschr¨ankte Funktionen solcher Operatoren bildet. Ist etwa T ein unbeschr¨ankter selbstadjungierter Operator und h ∈ C b (σ(T )), so ist nach Theorem VII.3.2 ein beschr¨ ankter Operator h(T ) erkl¨ art. Man betrachtet dann {h(T ): h ∈ ur mehrere nicht kommutieC b (σ(T ))}. (Die entsprechende Konstruktion f¨ rende Operatoren ist schwieriger.) Einen Einstieg in die C ∗ -Algebrentheorie bieten Murphy [1990] oder Kadison/Ringrose, Band 1 [1983]; weitergehende Darstellungen findet man ¨ in Pedersen [1979] und Kadison/Ringrose, Band 2 [1986]. Uberblicksartikel versammelt der von Doran herausgegebene Band C ∗ -Algebras: 1943–1993, ¨ Contemporary Math. 167 (1994); man beachte auch Bonsalls Ubersicht zu Banachalgebren schlechthin in Bull. London Math. Soc. 2 (1970) 257–274. ur die Physik sei F¨ ur die Bedeutung der C ∗ - und von-Neumann-Algebren f¨ auf Bratteli/Robinson [1979, 1981] verwiesen. Die Aufl¨ osungstheorie von Operatorgleichungen der Form T x = y bedient sich der Spektraltheorie in der Banachalgebra L(X), insbesondere wenn kompakte Operatoren beteiligt sind. F¨ ur gewisse singul¨are Integralgleichungen spielt auch die Calkin-Algebra eine große Rolle. Um diesen Zusammenhang zu erl¨ autern, ben¨ otigt man den Begriff des Fredholmoperators. Ein Operator T auf einem Banachraum X heißt Fredholmoperator, ∗
484
IX.
Banachalgebren
falls ran(T ) abgeschlossen ist und ker(T ) und X/ran(T ) endlichdimensional sind; u ¨ brigens folgt die erste dieser Eigenschaften nach einem Satz von Kato automatisch aus der letzten. Die ganze Zahl ind(T ) = dim ker(T ) − dim X/ran(T ) (= dim ker(T ) − dim ker(T )) heißt dann der Index von T . Ist z.B. Tf der Toeplitz-Operator aus Aufgabe IX.4.20 und verschwindet f nirgends, so ist Tf ein Fredholmoperator, dessen Index gleich dem Negativen der aus der Funktionentheorie bekannten Umlaufzahl der durch t → f (eit ), 0 ≤ t ≤ 2π, parametrisierten Kurve um 0 ist. Man kann zeigen, daß die Komposition von zwei Fredholmoperatoren U und T wieder ein Fredholmoperator mit dem Index ind(U T ) = ind(U ) + ind(T ) ist, und der adjungierte Operator T ist ein Fredholmoperator mit ind(T ) = − ind(T ). Ferner ist die Menge aller Fredholmoperatoren offen, und der Index ist eine stetige Z-wertige Funktion. Das bedeutet mit anderen Worten, daß es zu einem Fredholmoperator T ein ε > 0 gibt, so daß jeder Operator S mit S − T < ε ebenfalls ein Fredholmoperator mit demselben Index ist; der Index bleibt also unter kleinen“ St¨ orungen invariant. Ein anderes ” St¨ orungsresultat bezieht sich auf kompakte Operatoren: Ist K kompakt, so gilt ind(T + K) = ind(T ). Dieses Resultat schließt insbesondere den Satz von Riesz-Schauder (Satz VI.2.1) ein; man muß nur T = Id setzen. Eine wichtige Charakterisierung von Fredholmoperatoren liefert der Satz von Atkinson: • Ein Operator T ∈ L(X) ist genau dann ein Fredholmoperator, wenn ein Operator S ∈ L(X) existiert, so daß ST − Id und T S − Id kompakt sind. Ein solcher Operator S wird Fredholm-Inverse oder Parametrix genannt. Der Satz von Atkinson l¨ aßt sich besonders durchsichtig mittels der Quotienten-Banachalgebra L(X)/K(X) formulieren: • T ∈ L(X) ist genau dann ein Fredholmoperator, wenn die entspre¨ chende Aquivalenzklasse [T ] in der Banachalgebra L(X)/K(X) invertierbar ist. Die Untersuchung des Spektrums von [T ] gestattet weitere Aufschl¨ usse u ¨ ber das Spektrum eines Operators; man nennt σess (T ) := σ([T ]) das wesentliche Spektrum von T . (Dieser Begriff wird in der Literatur nicht einheitlich verwendet.) Zum Beispiel ist jedes Element von ∂σ(T ) \ σess (T ) ein isolierter Punkt des Spektrums und ein Eigenwert von T . Detaillierte Informationen zu Fredholmoperatoren findet man unter anderem in Heuser [1992], J¨ orgens [1970] oder Conway [1985].
Anhang A
Maß- und Integrationstheorie
A.1
Das Lebesgueintegral fu ¨r Funktionen auf einem Intervall
Dieser Anhang umreißt in groben Z¨ ugen diejenigen Teile der Maß- und Integrationstheorie, die f¨ ur das Verst¨ andnis dieses Buches wesentlich sind. Alle hier ausgesparten Einzelheiten k¨ onnen in diversen Lehrb¨ uchern nachgelesen werden; es seien etwa Bauer [1990], Behrends [1987], Cohn [1980] oder Rudin [1986] genannt. 1 ur eine beschr¨ankte Funktion Wenn man das Riemannintegral 0 f (t) dt f¨ f definieren will, geht man bekanntlich folgendermaßen vor. Der Urbildbereich [0, 1] wird in kleine Teilintervalle der L¨ ange < δ zerlegt und f durch eine Treppenfunktion ϕδ , die auf dem Inneren der Teilintervalle konstant
f
(etc.) ϕδ
ist, approximiert (siehe Abbildung). Anschließend definiert man auf kanoni1 ur eine große Klasse von Funktionen sche Weise 0 ϕδ (t) dt und zeigt, daß f¨ 1 (u.a. alle stetigen Funktionen auf [0, 1]) limδ→0 0 ϕδ (t) dt existiert und unabh¨ angig von der approximierenden Folge (ϕδ ) ist; diese Zahl wird dann
486
Anhang A.
Maß- und Integrationstheorie
1 mit 0 f (t) dt bezeichnet. (Die Einf¨ uhrung u ¨ber Ober- und Untersummen ist nur eine technische Modifikation dieses Konzepts.) Die St¨ arken des Riemannintegrals sind bekannt: die Einf¨ uhrung ist sehr anschaulich, und man kann mit recht geringem Aufwand wichtige Resultate, z.B. den Hauptsatz der Differential- und Integralrechnung, beweisen. In der h¨ oheren Analysis erweist sich das Riemannsche Integral jedoch als sehr schwerf¨allig. Zum einen ist die Definition des Riemannintegrals auf Bereichen Ω ⊂ Rd schon weitaus schwieriger zu verdauen, was als Konsequenz sehr technische Beweise f¨ ur Resultate wie etwa den Satz von Fubini (selbst im Fall stetiger Integranden) nach sich zieht. Zum anderen zeigt sich die Notwendigkeit, Limes- und Integralbildung zu vertauschen; man braucht also Kriterien, die 1 1 fn (t) dt = lim fn (t) dt lim n→∞
0 n→∞
0
sicherstellen. (Hinreichend ist nat¨ urlich die gleichm¨aßige Konvergenz.) Das entscheidende Manko des Riemannintegrals ist nun, daß selbst f¨ ur stetige fn die Grenzfunktion f (t) := limn→∞ fn (t) im Riemannschen Sinn nicht integrierbar zu sein braucht. H. Lebesgue hat in seiner 1902 erschienenen Dissertation gezeigt, wie ein Integralbegriff einzuf¨ uhren ist, der die Vorteile des Riemannintegrals u ¨ bernimmt, aber seine Nachteile vermeidet. Wir schildern sein Verfahren zun¨ achst f¨ ur Funktionen auf einem Intervall. Sei J ⊂ R ein Intervall, das auch unbeschr¨ankt sein darf, und f : J → [0, ∞] eine Funktion. (Aus technischen Gr¨ unden werden zun¨achst positive Funktionen, die auch den Wert ∞ annehmen d¨ urfen, betrachtet.) Lebesgues Idee ist es, den Bildbereich von f in kleine Teilintervalle zu zerlegen, f durch eine Treppenfunktion ϕ zu approximieren, in nat¨ urlicher Weise ein Integral ϕ zu definieren und dann f durch einen Grenzprozeß zu erkl¨aren. Es ist nun eine u ur so gut wie ¨ berraschende Tatsache, daß dieses Verfahren f¨ alle denkbaren Funktionen (die meßbaren“ Funktionen) durchf¨ uhrbar ist ” ¨ und nach Uberwindung der anf¨ anglich auftauchenden H¨ urden zu einem sehr geschmeidigen Integralbegriff f¨ uhrt, der das Riemannintegral verallgemeinert; insbesondere ergibt sich nirgendwo die Notwendigkeit, uneigentliche“ ” Integrale zu betrachten. Um die genannten Anfangsschwierigkeiten zu erkl¨aren, betrachten wir zu einer Funktion f (von der wir momentan 0 ≤ f ≤ 1 annehmen) die Mengen k+1 k Ek,n = t: ≤ f (t) < n n und Funktionen der Gestalt ϕn (t) =
k n
falls t ∈ Ek,n .
A.1
Das Lebesgueintegral f¨ ur Funktionen auf einem Intervall
487
(k+1)/n k/n
Ek,n
Sollten die E Intervalle sein, ist klar, wie ϕn zu definieren ist, k,n k n¨ amlich als λ(E ), wo λ(E ) die L¨ a nge des Intervalls Ek,n ist. k,n k,n k n F¨ ur den Fall, daß Ek,n eine disjunkte Vereinigung endlich vieler Intervalle urde man λ(Ek,n ) = ri=1 λ(Ii ) setzen. Da die Funktion f I1 , . . . , Ir ist, w¨ beliebig ist (einstweilen zumindest), k¨ onnen jedoch die Mengen Ek,n ebenfalls irgendwelche Teilmengen von J sein, und dann ist es absolut unklar, was unter λ(Ek,n ) sinnvollerweise zu verstehen ist; als relativ harmlosen Fall betrachte man etwa die Dirichletsche Sprungfunktion. Daher stellt sich zun¨ achst einmal das Problem, m¨ oglichst vielen Teilmengen von R auf eine solche Weise ein Maß“ zuzuordnen, daß die Maßbildung viele nat¨ urliche ” Eigenschaften wie Monotonie, Additivit¨ at, Translationsinvarianz etc. besitzt. Leider stellt sich heraus, daß man nicht alle Teilmengen von R auf nat¨ urliche Weise (was das heißt, wird gleich pr¨azisiert) messen“ kann ” und folglich nicht jede Funktion dem obigen Verfahren unterworfen werden kann. Der hier zu skizzierende Zugang zur Integrationstheorie st¨ utzt sich auf folgende Begriffe. Definition A.1.1 Sei T eine Menge, und sei Σ ein System von Teilmengen von T mit den Eigenschaften (a) ∅ ∈ Σ, (b) E ∈ Σ ⇒ T \ E ∈ Σ, (c) E1 , E2 ∈ Σ ⇒ E1 ∪ E2 ∈ Σ. Dann heißt Σ eine Algebra. Gilt statt (c) ∞ (c)∗ E1 , E2 , . . . ∈ Σ ⇒ Ei ∈ Σ, i=1
so heißt Σ eine σ-Algebra. Man beweist leicht, daß der Schnitt von σ-Algebren wieder eine σAlgebra ist. Daher existiert eine kleinste σ-Algebra von Teilmengen von R,
488
Anhang A.
Maß- und Integrationstheorie
die alle Teilintervalle I ⊂ R enth¨ alt. Diese σ-Algebra heißt die σ-Algebra der Borelmengen von R, und es stellt sich heraus, daß es die Borelmengen sind, die man messen“ kann. ” Satz A.1.2 Es sei Σ die σ-Algebra der Borelmengen von R. Dann gibt es genau eine Abbildung λ: Σ → [0, ∞] mit den Eigenschaften: (a) λ(∅) = 0. (b) λ [a, b] = λ (a, b) = b − a falls a < b. (c) λ ist σ-additiv, d.h., sind die Ei ∈ Σ paarweise disjunkt, so ist ∞ ∞ λ Ei = λ(Ei ). i=1
i=1
(d) λ ist translationsinvariant, d.h., es gilt λ(E) = λ {s + t: t ∈ E} ∀s ∈ R, E ∈ Σ. F¨ ur alle weiteren Untersuchungen ist es entscheidend, daß man die Beur endlich viele hat. dingung in (c) f¨ ur abz¨ ahlbar viele Ei und nicht bloß f¨ (Deswegen ist man auch an σ-Algebren und nicht an Algebren von Teilmengen interessiert.) Definition A.1.3 Die Abbildung λ aus Satz A.1.2 heißt Lebesguemaß, genauer Lebesgue-Borel-Maß. Wir beschreiben jetzt die Konstruktion des Lebesguemaßes. Zun¨achst sei daran erinnert, wie der Riemann-Jordansche Inhalt einer beschr¨ankten Menge A definiert ist; u ¨ blicherweise betrachtet man A ⊂ Rd , aber hier sind wir nur an A ⊂ R interessiert. Man u ¨berdeckt A mit endlich vielen ¨ Intervallen und nennt das Infimum der Gesamtl¨angen der an solchen Uberdeckungssystemen beteiligten Intervalle den ¨außeren Inhalt ma (A): ma (A) := inf
n i=1
|Ii |: A ⊂
n
Ii , n ∈ N .
i=1
¨ (|I| bezeichnet die L¨ ange des Intervalls I.) Ahnlich definiert man einen inneren Inhalt mi (A) und nennt A Jordan-meßbar, falls mi (A) = ma (A) ist. Leider ist das System der Jordan-meßbaren Mengen nur schwer zu handhaben; z.B. ist nicht jede abgeschlossene Menge Jordan-meßbar, ebensowenig ist es die Menge Q ∩ [0, 1], die doch offensichtlich“ den Inhalt 0 haben ” sollte. Lebesgues Ansatz, der auf Ideen von Borel aufbaut, sieht nun vor, statt endlich vieler u ¨ berdeckender Intervalle unendlich viele (genauer abz¨ahlbar
A.1
Das Lebesgueintegral f¨ ur Funktionen auf einem Intervall
489
viele) zu nehmen; und damit werden die Verh¨ altnisse grundlegend ge¨andert. F¨ ur jedes A ⊂ R wird also das ¨ außere Lebesguesche Maß λ∗ (A) durch λ∗ (A) := inf
∞ i=1
|Ii |: A ⊂
∞
Ii
i=1
definiert. Lebesgue definiert auch ein inneres Maß λ∗ (dessen Definition nicht analog zum Jordanschen Inhalt ist) und nennt Mengen A meßbar, falls λ∗ (A) = λ∗ (A) =: λ(A) gilt. Ferner zeigt er die nicht offensichtliche Tatsache, daß λ auf dem System der meßbaren Mengen σ-additiv ist. Sp¨ater hat Carath´eodory mit einer sehr allgemeinen Methode gezeigt, wie man die Existenz des Lebesguemaßes allein aus dem ¨außeren Maß ableitet. Seine Idee ist, das Mengensystem A := {A ⊂ R: λ∗ (B) = λ∗ (B ∩ A) + λ∗ (B \ A) ∀B ⊂ R} zu betrachten. A enth¨ alt also all die Mengen A, die jede Menge B so in zwei Teile B ∩ A und B \ A zerlegen, daß das Ganze (= λ∗ (B)) die Summe seiner Teile (= λ∗ (B ∩ A) + λ∗ (B \ A)) wird. Man zeigt dann, daß A eine die Intervalle enthaltende σ-Algebra ist, also Σ ⊂ A gilt, und λ∗ |A σ-additiv ist. (Analog kann man in vielen anderen Situationen vorgehen, insbesondere beim d-dimensionalen Lebesguemaß oder in noch allgemeineren F¨allen, siehe etwa den Beweis des Rieszschen Darstellungssatzes II.2.5.) Satz A.1.2 liefert also ein umfangreiches System von Mengen, die ge” messen“ werden k¨ onnen. In der Tat umfaßt dieses System fast alle Mengen, die von Interesse sind, z.B. alle abgeschlossenen Mengen, alle offenen Mengen, abz¨ ahlbare Vereinigungen und Schnitte davon etc. Es muß jedoch betont werden, daß Σ echt kleiner als die Potenzmenge von R ist, und mit dem Zornschen Lemma kann man zeigen, daß es keine Abbildung gibt, die auf der ganzen Potenzmenge von R definiert ist und die Eigenschaften (a)–(d) aus Satz A.1.2 besitzt.1 Kehren wir zur¨ uck zu unserem Versuch, ein Integral zu definieren. Falls f so beschaffen ist, daß die oben definierten k,n Borelmengen sind, Mengen E so ist λ(Ek,n ) definiert, und man kann ϕn durch k nk λ(Ek,n ) erkl¨aren. Die Klasse solcher f soll als n¨ achstes eingef¨ uhrt werden. Definition A.1.4 Eine Funktion f : J → R (bzw. f : J → [0, ∞]) heißt ur alle a, b ∈ R eine Borelmenge ist. Eine (Borel-) meßbar, falls f −1 [a, b) f¨ Funktion f : J → C heißt meßbar, falls Re f und Im f meßbar sind. 1 Jedoch hat Banach mit Hilfe des Satzes von Hahn-Banach (genauer gesagt einem Vorl¨ aufer davon) die Existenz einer Mengenfunktion auf der Potenzmenge von R bewiesen, die (a)–(d) bis auf die Tatsache erf¨ ullt, daß (c) nur f¨ ur endliche Summen gilt (siehe Mukherjea/Pothoven [1986], S. 24). Solch eine Mengenfunktion gibt es auch f¨ ur R2 , nicht jedoch f¨ ur h¨ ohere Dimensionen.
490
Anhang A.
Maß- und Integrationstheorie
Eine Funktion f ist genau dann meßbar, wenn f −1 (A) f¨ ur jede Borelmenge A ⊂ R (bzw. [0, ∞] bzw. C) eine Borelmenge ist, was daraus folgt, daß {A: f −1 (A) ist Borelmenge} eine σ-Algebra bildet. Eine Funktion der Gestalt 1 t∈E χE (t) = 0 t∈ /E heißt Indikatorfunktion der Menge E. Eine Funktion der Gestalt f=
n
αi χEi
i=1
mit Ei ∈ Σ wird Treppenfunktion genannt. Allgemeiner als in der Riemannschen Theorie brauchen die Stufen“ Ei keine Intervalle zu sein, sondern ” sind beliebige meßbare Mengen. Satz A.1.5 Seien f, fn , g: J → K Funktionen auf einem Intervall J. (a) Sind f und g meßbar, so sind f + g, f g, f /g (falls g(s) = 0 f¨ ur alle s), αf (wo α ∈ K), |f | sowie im Fall K = R auch max{f, g} und min{f, g} meßbar. (b) Stetige Funktionen sind meßbar. ur alle (c) Sind f1 , f2 , . . . meßbar und existiert f (t) = limn→∞ fn (t) f¨ t, so ist f meßbar. (d) Ist f meßbar, so existiert eine Folge von Treppenfunktionen (ϕn ) mit f (t) = lim ϕn (t) ∀t ∈ J n→∞
und, falls f ≥ 0 ist, ϕ1 (t) ≤ ϕ2 (t) ≤ . . . . (e) Ist f meßbar und beschr¨ankt, so existiert eine Folge von Treppenfunktionen (ϕn ), die gleichm¨aßig gegen f konvergiert. Die meßbaren Funktionen bilden also einen Vektorraum, der unter der Bildung von punktweisen Limiten abgeschlossen ist. Diese Eigenschaft ist ein entscheidender Gewinn im Lebesgueschen Ansatz. Wieder gilt die Bemerkung, daß fast alle Funktionen, auf die man in Anwendungen stoßen kann, meßbar sind. onnen wir f¨ ur [0, ∞]-wertige meßbare Funktionen f das Integral Jetzt k¨ f dλ definieren, das allerdings = ∞ sein kann. Zun¨achst definiert man f¨ ur n Treppenfunktionen f = i=1 αi χEi f dλ =
n i=1
αi λ(Ei ).
(A.1)
A.1
491
Das Lebesgueintegral f¨ ur Funktionen auf einem Intervall
Hier ist die rechte Seite erkl¨ art, da die E i Borelmengen sind, und man zeigt, m daß f¨ ur jede andere Darstellung f = i=1 βi χFi dieselbe Zahl in (A.1) herauskommt; f¨ ur Treppenfunktionen ist das Integral also wohldefiniert. Ist nun f meßbar und [0,∞]-wertig, so w¨ ahle (ϕn ) wie in Satz A.1.5(d). Dann ist die Zahlenfolge ( ϕn dλ) monoton wachsend und daher in [0, ∞] konvergent. Ist (ψn ) eine andere solche Folge, so kann man ϕn dλ = lim ψn dλ lim n→∞
n→∞
zeigen, was nicht ganz trivial ist. Auf jeden Fall ist dann f dλ := lim ϕn dλ n→∞
wohldefiniert. Definition A.1.6 (a) Eine meßbare Funktion f : J → [0, ∞] heißt integrierbar (genauer Lebesgue-integrierbar), wenn f dλ < ∞ ist. (b) Eine meßbare Funktion f : J → R heißt integrierbar, falls f + := max{f, 0} und f − := max{−f, 0} integrierbar sind. Man setzt + f dλ = f dλ − f − dλ. (c) Eine meßbare Funktion f : J → C heißt integrierbar, falls Re f und Im f integrierbar sind. Man setzt f dλ = Re f dλ + i Im f dλ. Andere Bezeichnungen f¨ ur das Integral sind
f (t) dλ(t), J
b
f (t) dλ(t), a
b
f (t) dt,
etc.
a
Daß die letzte Bezeichnung sinnvoll ist, zeigt der n¨achste Satz, der auch zeigt, daß der Wert des Lebesgueintegrals mit dem des Riemannintegrals u ¨ bereinstimmt. Satz A.1.7 (a) Die Summe integrierbarer Funktionen ist integrierbar mit (αf + βg) dλ = α f dλ + β g dλ.
492
Anhang A.
Maß- und Integrationstheorie
(b) Ist f : J → K stetig und |f | uneigentlich Riemann-integrierbar, so ist f integrierbar mit b f (t) dt. f dλ = Riemanna
Bevor wir als n¨ achstes den Hauptsatz der Differential- und Integralrechnung formulieren, m¨ ussen zwei Begriffe erkl¨ art werden. Definition A.1.8 Man spricht von fast ¨ uberall (f.¨ u.) (genauer λ-fast u ¨berall) bestehenden Eigenschaften einer Funktion, wenn es eine Borelmenge E mit λ(E) = 0 gibt, so daß f die fragliche Eigenschaft (z.B. differenzierbar, ≥ 0, . . .) an allen Stellen t ∈ / E besitzt. Solch eine Menge wird Borelsche Nullmenge genannt. F¨ ur die Integrationstheorie macht es praktisch keinen Unterschied, ob eine Eigenschaft u ¨ berall oder fast u ¨ berall vorliegt. Es sei jedoch ein technisches Detail erw¨ ahnt, das die Formulierung des Konvergenzsatzes von Lebesgue (Satz A.3.2) ber¨ uhrt. Sind die fn meßbar und gilt limn→∞ fn = f fast u ¨ berall, so braucht f nicht meßbar zu sein. Vergr¨oßert man jedoch die vorgelegte σ-Algebra um alle Teilmengen von Nullmengen, so gilt noch die Meßbarkeit bez¨ uglich dieser gr¨ oßeren σ-Algebra. Definition A.1.9 Eine Funktion f : J → K heißt absolutstetig, wenn zu jedem ε > 0 ein δ > 0 existiert, so daß f¨ ur alle a1 < b1 < a2 < b2 < . . . < an < bn , n ∈ N beliebig, die Implikation n
(bk − ak ) < δ
k=1
⇒
n
|f (bk ) − f (ak )| < ε
k=1
gilt. Es ist einfach zu zeigen, daß Lipschitz-stetige Funktionen absolutstetig sind. Satz A.1.10 (Hauptsatz der Differential- und Integralrechnung) (a) Ist f : J → K absolutstetig, so existiert die Ableitung f fast ¨ uberall, f ist ¨ uber kompakten Teilintervallen von J integrierbar, und es gilt t f (t) − f (s) = f dλ ∀s, t ∈ J. s
t
s
ur s > t.) (Dabei sei s = − t f¨ (b) Ist g: J → K ¨ uber kompakten Teilintervallen integrierbar, a ∈ J t beliebig und f (t) := a g dλ, so ist f absolutstetig, f existiert fast uberall, und es gilt f = g fast ¨ uberall. ¨
A.2 Das d-dimensionale Lebesguemaß und abstrakte Integration
A.2
493
Das d-dimensionale Lebesguemaß und abstrakte Integration
Nachdem das Maßproblem mit Satz A.1.2 einmal gel¨ost war, war es f¨ ur die Definition des Integrals f dλ vollkommen unerheblich, daß es sich um eine Funktion auf einem Intervall handelte; wichtig war nur die Existenz des Lebesguemaßes auf der σ-Algebra der Borelmengen. In der Tat kann das Integral als Linearisierung des Maßes aufgefaßt werden. Hier ist die Definition des abstrakten Maßbegriffs. Definition A.2.1 Sei Σ eine σ-Algebra auf einer Menge T . Eine Abbildung μ: Σ → [0, ∞] heißt Maß, wenn (a) μ(∅) = 0, (b) μ σ-additiv ist, d.h., wenn f¨ ur paarweise disjunkte E1 , E2 , . . . ∈ Σ ∞ ∞ Ei = μ(Ei ). μ i=1
i=1
Man nennt (T, Σ, μ) dann einen Maßraum. Ist μ(T ) < ∞, spricht man von einem endlichen Maß bzw. Maßraum und im Fall μ(T ) = 1 von einem Wahrscheinlichkeitsmaß bzw. einem Wahrscheinlichkeitsraum. Gibt es eine ∞ Folge (En ) ⊂ Σ mit μ(En ) < ∞ und n=1 En = T , so heißen das Maß bzw. der Maßraum σ-endlich. In der Analysis ist die folgende σ-Algebra die am h¨aufigsten benutzte. Definition A.2.2 Sei T ein metrischer (oder bloß topologischer) Raum. Die kleinste σ-Algebra, die die offenen Teilmengen von T enth¨alt, heißt die Borel-σ-Algebra; die E ∈ Σ heißen Borelmengen. Ist T ⊂ R ein Intervall, so ist die soeben definierte Borel-σ-Algebra mit der in Abschnitt A.1 betrachteten identisch. Satz A.2.3 Sei Σ die Borel-σ-Algebra des Rd . Dann existiert genau ein translationsinvariantes Maß λd auf Σ mit λd [a1 , b1 ] × · · · × [ad , bd ] = (b1 − a1 ) · · · · · (bd − ad ). λd heißt d-dimensionales Lebesguemaß. Insbesondere ist λd σ-endlich. Mit denselben Ideen wie im vorigen Abschnitt (meßbare Funktionen, Integral f¨ ur Treppenfunktionen, Integral f¨ ur positive meßbare Funktionen, schließlich integrierbare Funktionen und ihr Integral) f¨ uhrt man Ω f dλd f¨ ur Borelmengen Ω ⊂ Rd bzw. im allgemeinen Fall E f dμ f¨ ur E ∈ Σ ein. Die S¨ atze A.1.5 und A.1.7(a) gelten dann entsprechend.
494
Anhang A.
Maß- und Integrationstheorie
Beispiele. (a) Ist g: R → R+ meßbar, so definiert μ(E) = g dλ E
ein Maß auf den Borelmengen von R. (Das folgt aus dem Satz von Beppo Levi, Satz A.3.1.) Eine meßbare Funktion f ist genau dann μ-integrierbar, wenn f g λ-integrierbar ist. In diesem Fall ist f dμ = f g dλ. (b) Sei T eine Menge, Σ eine σ-Algebra auf T und t0 ∈ T . Das Diracmaß δt0 ist definiert durch 1 falls t0 ∈ E, δt0 (E) = 0 falls t0 ∈ / E, wo E ∈ Σ. F¨ ur meßbare Funktionen gilt f dδt0 = f (t0 ). (c) Analog gilt f¨ ur eine Summe von Diracmaßen μ = f dμ =
n
n i=1
αi δti
αi f (ti ).
i=1
Endliche Summen k¨ onnen also als Integrale f¨ ur sehr einfache Maße angesehen werden. (d) Auch unendliche Reihen ordnen sich dem abstrakten Integrationskonzept unter. Auf der Potenzmenge von N betrachte das z¨ahlende Maß μ, das jeder Teilmenge von N die Anzahl ihrer Elemente (∈ N ∪ {0} ∪ {∞}) zuordnet. Eine Funktion f : N → C, f (n) = an , ist genau dann integrierbar, wenn (an ) ∈ 1 ist, und dann gilt f dμ =
∞
an .
n=1
Zur Berechnung mehrdimensionaler Integrale benutzt man den Satz von Fubini, der in der Lebesgueschen Theorie besonders durchsichtig formuliert und gezeigt werden kann. Es folgt die Fassung f¨ ur d = 2. Satz A.2.4 (Satz von Fubini) Sei f : R2 → K eine meßbare Funktion.
495
A.3 Konvergenzs¨ atze
(a) F¨ ur alle s ∈ R ist t → f (s, t) meßbar, und f¨ ur alle t ∈ R ist s → f (s, t) meßbar. Ferner sind die [0, ∞]-wertigen Funktionen s → |f (s, t)| dλ(t) und t → |f (s, t)| dλ(s) meßbar. (b) Ist R
R
|f (s, t)| dλ(s) dλ(t) < ∞,
so ist f integrierbar. ur fast alle t integrierbar, (c) Ist f integrierbar, so ist ft : s → f (s, t) f¨ ft dλ falls ft integrierbar, h: t → 0 sonst ist meßbar und integrierbar, und es gilt 2 f dλ = h dλ. R2
R
In aller K¨ urze besagt der Satz von Fubini also f (s, t) ds dt = f (s, t) ds dt. R2
R
R
Im Satz von Fubini d¨ urfen die Rollen von s und t nat¨ urlich vertauscht werden. Daher darf man f¨ ur integrierbare Funktionen f die Integrationsreihenfolge bei den iterierten Integralen vertauschen: f (s, t) ds dt = f (s, t) dt ds. R
R
R
R
Das zweidimensionale Lebesguemaß ist in gewisser Hinsicht das Produkt des eindimensionalen Lebesguemaßes mit sich selbst. Seien allgemeiner (T1 , Σ1 , μ1 ) und (T2 , Σ2 , μ2 ) σ-endliche Maßr¨ aume. Sei Σ1 ⊗ Σ2 die von den Mengen E1 × E2 , E1 ∈ Σ1 , E2 ∈ Σ2 , erzeugte σ-Algebra auf T1 × T2 . Dann existiert genau ein Maß μ auf Σ1 ⊗ Σ2 mit μ(E1 × E2 ) = μ1 (E1 )μ2 (E2 ); ur μ heißt Produktmaß von μ1 und μ2 und wird mit μ1 ⊗ μ2 bezeichnet. F¨ μ1 ⊗ μ2 -integrierbares f : T1 × T2 → K gilt ein Satz A.2.4 entsprechender allgemeiner Satz von Fubini.
A.3
Konvergenzs¨ atze
Die Lebesguesche Integrationstheorie liefert tats¨achlich die Konvergenzs¨ atze, deren Fehlen einen Mangel des Riemannintegrals ausmacht. Es sei (T, Σ, μ) ein beliebiger Maßraum, z.B. T = R, Σ = Borel-σ-Algebra, μ = Lebesguemaß. Wir formulieren jetzt die beiden wichtigsten Konvergenzs¨atze.
496
Anhang A.
Maß- und Integrationstheorie
Satz A.3.1 (Satz von Beppo Levi) Seien f1 , f2 , . . . : T → R meßbare Funktionen mit 0 ≤ f1 ≤ f2 ≤ . . . . Es sei f (t) := limn→∞ fn (t) (∈ [0, ∞]). Dann ist f meßbar mit
lim
n→∞
fn dμ =
f dμ ∈ [0, ∞].
Satz A.3.2 (Konvergenzsatz von Lebesgue) Seien f1 , f2 , . . . : T → K integrierbar, und es existiere eine meßbare Funkuberall. Es existiere ferner eine intetion f mit f (t) = limn→∞ fn (t) fast ¨ grierbare Funktion g mit |fn | ≤ g
fast u ¨berall
f¨ ur alle n ∈ N. Dann ist f integrierbar, und es gilt lim fn dμ = f dμ. n→∞
Im Fall μ(T ) < ∞ ist die Voraussetzung insbesondere erf¨ ullt, wenn ∃M ≥ 0 ∀n ∈ N
|fn | ≤ M
fast u ¨ berall.
Wegen der vorausgesetzten Meßbarkeit von f siehe die auf Definition A.1.8 folgende Bemerkung. Der Satz von Beppo Levi heißt auch Satz von der monotonen Konvergenz und der Konvergenzsatz von Lebesgue Satz von der dominierten Konvergenz. Diese S¨ atze z¨ ahlen zu den wichtigsten Aussagen der Integrationstheorie; vergleiche insbesondere, mit welch einfachen Voraussetzungen sie im Vergleich zu (speziell uneigentlichen) Riemannintegralen auskommen. Mit dem Konvergenzsatz von Lebesgue lassen sich sehr handliche Kriterien f¨ ur die Differentiation unter dem Integral“ beweisen. Im folgenden ” Korollar notieren wir Punkte des Rd+1 als (t, x), t ∈ R, x ∈ Rd . Korollar A.3.3 Sei f : Rd+1 → C stetig differenzierbar, und x → f (t, x) sei f¨ ur alle t integrierbar. F¨ ur alle t0 ∈ R existiere eine Umgebung U und eine integrierbare Funktion g: Rd → R mit ∂f (t, x) ≤ g(x) ∀t ∈ U, x ∈ Rd . ∂t Dann gilt d dt
f (t, x) dx =
Rd
Rd
∂f (t, x) dx ∂t
∀t ∈ R.
497
A.4 Signierte und komplexe Maße
A.4
Signierte und komplexe Maße
In diesem Abschnitt widmen wir uns der Integration nach reell- oder komplexwertigen Maßen. Definition A.4.1 Ist Σ eine σ-Algebra, so heißt eine Abbildung μ: Σ → R (bzw. μ: Σ → C) signiertes (bzw. komplexes) Maß, falls μ σ-additiv ist (vgl. Definition A.2.1). Es ist dann automatisch μ(∅) = 0, denn μ(∅) = μ(∅ ∪ ∅) = μ(∅) + μ(∅). Definition A.4.2 Sei μ ein signiertes oder komplexes Maß auf Σ und E ∈ Σ. Setze n |μ(Ek )|, |μ|(E) = sup k=1
wo das Supremum u ¨ ber alle endlichen Zerlegungen E = E1 ∪ . . . ∪ En mit paarweise disjunkten Ek ∈ Σ zu bilden ist. |μ|(E) heißt Variation von μ auf E. Satz A.4.3 Ist μ ein signiertes oder komplexes Maß, so definiert E → |μ|(E) ein positives endliches Maß. Satz A.4.4 (Hahn-Jordan-Zerlegung) Sei Σ eine σ-Algebra u ¨ ber einer Menge T und μ: Σ → R ein signiertes Maß. (a) Es existiert ein bis auf eine |μ|-Nullmenge eindeutig bestimmtes E + ∈ Σ mit • 0 ≤ μ(E) ≤ μ(E + ) −
• 0 ≥ μ(E) ≥ μ(E )
∀E ∈ Σ, E ⊂ E + , ∀E ∈ Σ, E ⊂ E − := T \ E + .
(b) μ+ = χE + μ und μ− := −χE − μ sind positive endliche Maße mit μ = μ+ − μ− . (c) |μ|(E) = μ+ (E) + μ− (E) ∀E ∈ Σ. Die Zerlegung T = E + ∪ E − heißt Hahn-Zerlegung, und die Zerlegung μ = μ+ − μ− heißt Jordan-Zerlegung. Beispiel. Sei λ das Lebesguemaß auf R und g: R → R λ-integrierbar. μ(E) = g dλ definiert dann ein signiertes Maß. Es kann E E + = {t: g(t) ≥ 0}, gew¨ ahlt werden, und es ist + g + dλ, μ (E) = E
E − = {t: g(t) < 0}
−
μ (E) = E
g − dλ.
498
Anhang A.
Maß- und Integrationstheorie
Definition A.4.5 Sei μ ein signiertes Maß, μ = μ+ − μ− seine JordanZerlegung und f : T → R meßbar. Dann heißt f μ-integrierbar, falls f |μ|-integrierbar ist. Man setzt f dμ = f dμ+ − f dμ− . Komplexe Maße zerlegt man in Real- und Imagin¨arteil μ = μ1 + i μ2 und setzt f¨ ur |μ|-integrierbares f f dμ = f dμ1 + i f dμ2 .
Es gilt f¨ ur |μ|-integrierbare Funktionen f die wichtige Ungleichung f dμ ≤ |f | d|μ|. (A.2) Die nichttriviale Richtung im folgenden Satz ist (i) ⇒ (ii); um die Kraft dieses Satzes zu w¨ urdigen, mache man sich klar, wie schwach die Voraussetzung (i), wie stark hingegen die Behauptung (ii) ist. Satz A.4.6 (Satz von Radon-Nikod´ ym) Sei Σ eine σ-Algebra auf einer Menge T , μ ein σ-endliches positives Maß und ν ein signiertes (bzw. komplexes) Maß auf Σ. Dann sind folgende Bedingungen ¨aquivalent: (i) Ist E ∈ Σ mit μ(E) = 0, so ist auch ν(E) = 0. (ii) Es existiert eine μ-integrierbare Funktion g: T → R (bzw. C) mit ν(E) = g dμ ∀E ∈ Σ. E
Man sagt, daß ν absolutstetig bzgl. μ ist, und schreibt ν ! μ, wenn (i) erf¨ ullt ist. J. von Neumann hat einen Beweis dieses Satzes gefunden, der auf dem Darstellungssatz von Fr´echet-Riesz (Theorem V.3.6) beruht; siehe z.B. Rudin [1986], S. 122. Abschließend sei erw¨ ahnt, daß es noch den Aufbau der Integrationstheorie a` la Bourbaki gibt, der aber trotz seiner zugegebenermaßen gr¨oßeren mathematischen Eleganz f¨ ur die Lernenden schwerer zug¨anglich zu sein scheint. Diese Methode wird z.B. bei Choquet [1969], Dieudonn´e [1987], Floret [1981], Meise/Vogt [1992] und Pedersen [1989] dargestellt.
Anhang B
Metrische und topologische R¨aume
B.1
Metrische R¨ aume
In diesem Teil des Anhangs werden die wichtigsten Tatsachen u ¨ber metrische R¨ aume zusammengestellt; auf topologische R¨aume wird im n¨achsten Abschnitt eingegangen. Hier sollen nur die Stellen angemerkt werden, wo die Theorie topologischer R¨ aume signifikant von der Theorie metrischer R¨ aume abweicht. Die Aussagen dieses Anhangs sind mit eventueller Ausnahme der S¨ atze B.1.5 und B.1.7 in jedem Lehrbuch der Analysis zu finden; bis auf die genannten Ausnahmen sind sie so einfach, daß sie sich praktisch von allein“ beweisen. ” Eine Menge T , versehen mit einer Abbildung d: T × T → R mit den Eigenschaften (s, t, u ∈ T beliebig) (a) (b) (c) (d)
d(s, t) ≥ 0, d(s, t) = d(t, s), d(s, u) ≤ d(s, t) + d(t, u), d(s, t) = 0 ⇐⇒ s = t,
wird metrischer Raum und d eine Metrik genannt. Gilt in (d) nur ⇐“, so ” spricht man von einem halbmetrischen Raum. In einem metrischen (oder halbmetrischen) Raum betrachte die Kugeln Uε (t) = {s ∈ T : d(s, t) < ε}. Sei M ⊂ T . Ein Punkt t ∈ M heißt innerer Punkt von M , und M heißt Umgebung von t, falls ∃ε > 0 Uε (t) ⊂ M. Eine Teilmenge O ⊂ T , f¨ ur die jedes t ∈ O innerer Punkt ist, heißt offen.
500
Anhang B.
Metrische und topologische R¨ aume
Satz B.1.1 Sei (T, d) ein metrischer Raum und τ die Menge aller offenen Teilmengen von T . (a) ∅ ∈ τ , T ∈ τ . (b) Sind O1 ∈ τ und O2 ∈ τ , so gilt O1 ∩ O2 ∈ τ . (c) Ist I eine beliebige Indexmenge und sind Oi ∈ τ (i ∈ I), so ist i∈I Oi ∈ τ . Allgemeiner nennt man ein System von Teilmengen einer Menge T , welches die obigen Bedingungen (a)–(c) erf¨ ullt, eine Topologie auf T und spricht von T als topologischem Raum. Metrische R¨aume wurden zuerst von Fr´echet (1906) und topologische R¨ aume zuerst von Hausdorff (1914) betrachtet. Eine Teilmenge A eines metrischen Raums heißt abgeschlossen, wenn ihr Komplement T \ A offen ist. Analog zu Satz B.1.1 gelten also: (a) ∅ und T sind abgeschlossen. (b) Die Vereinigung zweier abgeschlossener Mengen ist abgeschlossen. (c) Der Schnitt beliebig vieler abgeschlossener Mengen ist abgeschlossen. Bedingung (c) impliziert, daß f¨ ur jede Teilmenge M ⊂ T eine kleinste abgeschlossene Menge existiert, die M umfaßt. Diese wird mit M bezeichnet und Abschluß von M genannt: , M := A A⊃M A abgeschlossen
Analog ist das Innere von M int M :=
O
O⊂M O offen
die gr¨ oßte offene Menge, die in M liegt. Offenbar besteht int M genau aus den inneren Punkten von M . Der Rand von M ist ∂M := {t ∈ T : Uε (t) ∩ M = ∅ und Uε (t) ∩ T \M = ∅ ∀ε > 0}. ∂M ist stets abgeschlossen, und es gilt M = M ∪∂M sowie ∂M = M \int M . Eine Folge (tn ) in einem metrischen Raum T heißt konvergent gegen t ∈ T , falls ∀ε > 0 ∃N ∈ N ∀n ≥ N d(tn , t) ≤ ε. t heißt Limes von (tn ). Es ist leicht zu sehen, daß der Limes einer konvergenten Folge eindeutig bestimmt ist. (Das gilt nicht mehr in halbmetrischen R¨ aumen.) Man schreibt tn → t oder limn→∞ tn = t. Besitzt t nur die Eigenschaft, daß jede Umgebung von t unendlich viele Folgenglieder enth¨alt, heißt t H¨aufungspunkt von (tn ).
B.1
Metrische R¨ aume
501
Satz B.1.2 Folgende Bedingungen sind in einem metrischen Raum ¨aquivalent: (i) t ∈ M . (ii) Es existiert eine Folge (tn ) in M mit tn → t. In topologischen R¨ aumen ist die Implikation (i) ⇒ (ii) im allgemeinen falsch. Seien (T1 , d1 ) und (T2 , d2 ) metrische R¨ aume. Dann definiert d (s1 , s2 ), (t1 , t2 ) = d1 (s1 , t1 ) + d2 (s2 , t2 ) eine Metrik auf dem Produktraum T1 × T2 . Eine Folge (xn , yn ) in T1 × T2 konvergiert genau dann gegen (x, y), wenn xn → x und yn → y gelten. Sei nun f : T1 → T2 eine Abbildung zwischen metrischen R¨aumen. Dann heißt f stetig an der Stelle t0 ∈ T1 , falls ∀ε > 0 ∃δ > 0 d1 (t, t0 ) < δ ⇒ d2 f (t), f (t0 ) < ε. Man erh¨ alt eine ¨ aquivalente Definition, wenn man ≤ “ statt < “ verwen” ” ur jede Umgebung V det. Offenbar ist f genau dann stetig bei t0 , wenn f¨ von f (t0 ) das Urbild f −1 (V ) eine Umgebung von t0 ist. Satz B.1.3 Sei f : T1 → T2 eine Abbildung zwischen metrischen R¨aumen. Dann sind folgende Bedingungen ¨aquivalent: (i) f ist stetig bei t0 . (ii) tn → t0 ⇒ f (tn ) → f (t0 ) f¨ ur alle Folgen (tn ). In topologischen R¨ aumen ist diesmal die Implikation (ii) ⇒ (i) im allgemeinen falsch. Eine Abbildung f : T1 → T2 heißt schlechthin stetig, falls sie an jeder Stelle t0 ∈ T1 stetig ist. Nach Definition ist die Stetigkeit also eine lokale Eigenschaft; denn es geht an jeder Stelle t0 nur das Verhalten von f in einer Umgebung von t0 ein. Satz B.1.4 F¨ ur eine Abbildung f zwischen metrischen R¨aumen T1 und T2 sind ¨aquivalent: (i) f ist stetig. (ii) F¨ ur alle offenen O ⊂ T2 ist f −1 (O) offen in T1 . (iii) F¨ ur alle abgeschlossenen A ⊂ T2 ist f −1 (A) abgeschlossen in T1 . Wir formulieren jetzt einen bedeutenden Existenzsatz f¨ ur reellwertige stetige Funktionen.
502
Anhang B.
Metrische und topologische R¨ aume
Satz B.1.5 (Satz von Tietze-Urysohn f¨ ur metrische R¨aume) Sei T ein metrischer Raum und A ⊂ T eine abgeschlossene Teilmenge. Zu jeder stetigen Funktion f : A → [a, b] existiert eine stetige Fortsetzung / A eine stetige Funktion ϕ: F : T → [a, b]. Insbesondere existiert zu t0 ∈ T → [0, 1] mit ϕ|A = 0 und ϕ(t0 ) = 1. Beweis. Offensichtlich reicht es, den Fall a = 1, b = 2 zu behandeln. In diesem Fall setzt man F (t) = f (t) f¨ ur t ∈ A und F (t) =
inf{f (s)d(s, t): s ∈ A} inf{d(s, t): s ∈ A}
f¨ ur t ∈ / A. Es ist nicht schwer zu verifizieren, daß F wirklich stetig ist. Zum Zusatz: Setze die auf A0 = A∪{t0 } stetige Funktion ϕ0 : A0 → [0, 1] mit ϕ0 |A = 0 und ϕ0 (t0 ) = 1 fort. 2 Dieser Satz gilt nicht f¨ ur alle topologischen R¨aume, sondern nur f¨ ur die sog. normalen R¨ aume. Insbesondere gilt er f¨ ur alle kompakten Hausdorffr¨ aume. F¨ ur Anwendungen in der Funktionalanalysis ist folgende Fassung n¨ utzlich. Korollar B.1.6 Sei T ein metrischer Raum und A ⊂ T eine abgeschlossene Teilmenge. Sei f : A → K eine beschr¨ankte stetige Funktion. Dann existiert eine beschr¨ankte stetige Fortsetzung F : T → K mit F ∞ = f ∞ . Beweis. Im Fall K = R handelt es sich hier nur um eine Umformulierung des Satzes von Tietze-Urysohn. Im komplexen Fall w¨ahle stetige Fortsetzungen g bzw. h von Re f bzw. Im f . Sei r: C → C durch r(z) = z f¨ ur |z| ≤ f ∞ und r(z) = f ∞ z/|z| sonst definiert. Dann ist r stetig, und F : T → C, F (t) = r g(t) + i h(t) 2
ist die gew¨ unschte Fortsetzung.
Eine Metrik induziert nicht nur eine topologische Struktur, sondern auch eine uniforme Struktur, die sich in den Begriffen Cauchyfolge, Vollst¨andigkeit und gleichm¨ aßige Stetigkeit manifestiert. Eine Cauchyfolge in einem metrischen Raum (T, d) ist durch die Forderung ∀ε > 0 ∃N ∈ N ∀n, m ≥ N
d(tn , tm ) ≤ ε
definiert. Ein metrischer Raum heißt vollst¨andig, wenn jede Cauchyfolge konvergiert. Mit T1 und T2 ist auch T1 × T2 vollst¨andig. Es ist zu beachten, daß verschiedene Metriken auf einer Menge zwar dieselbe Topologie, aber unterschiedliche uniforme Strukturen erzeugen k¨onnen. Wird z.B. R mit der Metrik d2 (s, t) = |arctan s − arctan t| versehen, so
B.1
503
Metrische R¨ aume
sind die d2 -offenen Mengen genau die u ¨ blichen offenen Mengen; jedoch ist die Folge (n) der nat¨ urlichen Zahlen eine nicht konvergente Cauchyfolge. andig. Daher ist (R, d2 ) nicht vollst¨ Eine Abbildung f : T1 → T2 heißt gleichm¨aßig stetig, wenn ∀ε > 0 ∃δ > 0 ∀s, t ∈ T1
d1 (s, t) < δ ⇒ d2 f (s), f (t) < ε.
Bei der Definition der Stetigkeit darf δ vom betrachteten Punkt t abh¨angen; bei der gleichm¨ aßigen Stetigkeit hat man δ unabh¨angig von t zu w¨ahlen. Im Gegensatz zur Stetigkeit handelt es sich hier also um eine globale Eigenschaft. Ein zentraler topologischer Begriff ist der der Kompaktheit. Ein metri¨ scher (oder topologischer) Raum T heißt kompakt, wenn jede offene Uberdeckung eine endliche Teil¨ uberdeckung besitzt. Mit anderen Worten, wenn mit T = (Oi ) eine Familie offener Mengen i∈I Oi ist, so existieren endlich n viele Oi1 , . . . , Oin mit T = k=1 Oik . Ist (T, d) ein metrischer Raum und S ⊂ T , so kann (S, d) als eigenst¨andiger metrischer Raum angesehen werden. Ist T kompakt und S ⊂ T abgeschlossen, so ist auch S kompakt. Ist T ein beliebiger metrischer Raum und S ⊂ T kompakt, so ist S abgeschlossen. Beachte, daß die Abgeschlossenheit nur mit Bezug auf einen gr¨ oßeren Raum formuliert werden kann (S ist abgeschlossen in T ); hingegen ist die Kompaktheit ein intrinsischer Begriff. Wenn f : T1 → T2 eine stetige Abbildung zwischen metrischen R¨aumen ist und T1 kompakt ist, so ist auch f (T1 ) kompakt. Ferner ist unter diesen Voraussetzungen f gleichm¨ aßig stetig. Im Fall metrischer R¨ aume kann die Kompaktheit ¨aquivalent als Folgenkompaktheit beschrieben werden. Im folgenden Satz bleibt im allgemeinen keine der Implikationen (i) ⇒ (ii) bzw. (ii) ⇒ (i) f¨ ur topologische R¨aume richtig; (iii) ist dort sinnlos. Satz B.1.7 F¨ ur einen metrischen Raum (T, d) sind ¨aquivalent: (i) T ist kompakt. (ii) Jede Folge in T hat eine konvergente Teilfolge ( T ist folgenkom” pakt“). (iii) T ist totalbeschr¨ankt, d.h. f¨ ur alle ε > 0 existieren endlich viele N t1 , . . . , tN ∈ T mit T = k=1 Uε (tk ), und T ist vollst¨andig. Beweis. (i) ⇒ (ii): Falls (tn ) eine Folge ohne konvergente Teilfolge ist, kann kein t ∈ T H¨ aufungspunkt von (tn ) sein. F¨ ur jedes t ∈ T existiert also εt > 0 derart, daß Uεt (t) nur endlich viele tn enth¨alt. Da T = t∈T Uεt (t) gilt, reichen nach (i) endlich viele der Uεt (t) aus, um T zu u ¨ berdecken. Also enthielte T nur endlich viele der tn : Widerspruch!
504
Anhang B.
Metrische und topologische R¨ aume
(ii) ⇒ (iii): W¨ are T nicht totalbeschr¨ ankt, g¨abe es ein ε > 0, so daß f¨ ur alle n ∈ N und alle t1 , . . . , tn ∈ T n
Uε (tk ) T
k=1
gilt. Wir werden nun induktiv eine Folge ohne konvergente Teilfolge konstruieren. Sei dazu t1 ∈ T beliebig. Wegen Uε (t1 ) = T existiert t2 ∈ T mit d(t2 , t1 ) ≥ ε. Nun ist auch Uε (t1 ) ∪ Uε (t2 ) = T , also existiert t3 ∈ T mit d(t3 , tk ) ≥ ε f¨ ur k = 1, 2. So fortfahrend, erh¨ alt man eine Folge (tn ) in T , f¨ ur die d(tn , tk ) ≥ ε f¨ ur alle k < n gilt. Es ist klar, daß keine Teilfolge von (tn ) eine Cauchyfolge sein kann; daher enth¨ alt (tn ) erst recht keine konvergente Teilfolge. Deshalb ist T totalbeschr¨ ankt. Da eine Cauchyfolge, die eine konvergente Teilfolge besitzt, selbst konvergiert, ist T auch vollst¨andig. ¨ (iii) ⇒ (i): Nehmen wir an, es g¨ abe eine offene Uberdeckung (Oi ), die (1) (1) keine endliche Teil¨ uberdeckung besitzt. Sei ε1 = 1, und w¨ahle t1 , . . . , tN1 (1)
gem¨ aß der Totalbeschr¨ anktheit von T . Mindestens eine der Kugeln Uε1 (tk ) (1) kann dann nicht endlich u ¨ berdeckbar sein, sagen wir Uε1 (t1 ). Nun sei (2) (2) aß der Totalbeschr¨anktheit von T zu ε2 = 12 , und es seien t1 , . . . , tN2 gem¨ ε2 gew¨ ahlt. Es folgt (1)
Uε1 (t1 ) =
N2 (1) (2) Uε1 (t1 ) ∩ Uε2 (tk ) , k=1 (1)
(2)
und eine dieser Mengen, sagen wir Uε1 (t1 ) ∩ Uε2 (t1 ), kann nicht endlich u ¨ berdeckbar sein. Nun wenden wir die Totalbeschr¨anktheit mit ε3 = 14 an, (3) und wir erhalten einen Punkt t1 , so daß (1)
(2)
(3)
Uε1 (t1 ) ∩ Uε2 (t1 ) ∩ Uε3 (t1 ) nicht endlich u Nach diesem Schema konstruieren wir mit ¨ berdeckbar ist. n ur kein n ∈ N endlich u εn = 21−n Punkte sn , so daß k=1 Uεk (sk ) f¨ ¨berdeckbar ist. Insbesondere ist stets Uεn (sn ) ∩ Uεn+1 (sn+1 ) = ∅. Betrachte die so entstandene Folge (sn ). Sie ist wegen d(sn+1 , sn ) ≤ εn + εn+1 ≤ 22−n eine Cauchyfolge, also nach Voraussetzung konvergent, etwa sn → s0 . W¨ ahle i0 mit s0 ∈ Oi0 . Da Oi0 offen ist, ist η := inf{d(s0 , s): s ∈ / Oi0 } > 0. W¨ ahle n so groß, daß d(sn , s0 ) < η/2 und 21−n < η/2 ausf¨allt. Dann ist Uε1 (s1 ) ∩ . . . ∩ Uεn (sn ) ⊂ Uεn (sn ) ⊂ Uη (s0 ) ⊂ Oi0 , also Uε1 (s1 ) ∩ . . . ∩ Uεn (sn ) endlich u ¨ berdeckbar (n¨amlich durch ein einziges Oi ) im Widerspruch zur Konstruktion der sn . Damit ist die Implikation (iii) ⇒ (i) bewiesen. 2
505
B.2 Topologische R¨ aume
B.2
Topologische R¨ aume
Jetzt beschreiben wir die Grundz¨ uge der Theorie der topologischen R¨aume in dem Umfang, wie es f¨ ur das Verst¨ andnis von Kapitel VIII notwendig ist. Wieder gilt, daß die hier nicht bewiesenen Aussagen mit Ausnahme von Lemma B.2.5 ohne gr¨ oßere M¨ uhen zu begr¨ unden sind. Was hier nur angedeutet wird, findet sich z.B. in den B¨ uchern von Dugundji [1966], Kelley [1955] oder Willard [1970]. Sehr lesenswert ist die Einf¨ uhrung in die mengentheoretische Topologie im ersten Kapitel von Pedersen [1989]. Eine Topologie τ auf einer Menge T ist ein System von Teilmengen von T mit den Eigenschaften: (a) ∅ ∈ τ , T ∈ τ . (b) Sind O1 ∈ τ und O2 ∈ τ , so gilt O1 ∩ O2 ∈ τ . (c) Ist I eine beliebige Indexmenge und sind Oi ∈ τ (i ∈ I), so ist i∈I Oi ∈ τ . Man nennt (T, τ ) (oder k¨ urzer T ) einen topologischen Raum und die in τ versammelten Mengen offen. In Satz B.1.1 wurde beobachtet, daß die offenen Mengen eines metrischen Raums eine Topologie bilden; eine Topologie, die auf diese Weise von einer Metrik abgeleitet werden kann, heißt metrisierbar. Der Begriff des topologischen Raums verallgemeinert also den des metrischen Raums. Es zeigt sich, daß sich wesentliche Konzepte wie Konvergenz, Stetigkeit oder Kompaktheit aus dem Kontext der metrischen R¨aume in den Rahmen der topologischen R¨ aume u ¨bertragen lassen. Bisweilen kann man Begriffe w¨ ortlich u ¨ bernehmen, manchmal ist es notwendig, sie zuerst in eine Sprache ohne ε und δ“ zu u ¨ bersetzen, und hier und da gibt es ” vollkommen neue Effekte. Absolut problemlos sind die Begriffe abgeschlossene Menge, Abschluß und Inneres, denn diese sind genauso wie im metrischen Fall erkl¨art. Also: Eine Teilmenge A eines topologischen Raums T heißt abgeschlossen, wenn ihr Komplement T \ A offen ist; nach wie vor gelten also: (a) ∅ und T sind abgeschlossen. (b) Die Vereinigung zweier abgeschlossener Mengen ist abgeschlossen. (c) Der Schnitt beliebig vieler abgeschlossener Mengen ist abgeschlossen. Der Abschluß einer Menge M ⊂ T ist , M := A A⊃M A abgeschlossen
und ihr Inneres int M :=
O⊂M O offen
O.
506
Anhang B.
Metrische und topologische R¨ aume
Eine Umgebung eines Punkts t eines topologischen Raums T ist eine Menge U , so daß eine offene Menge O mit t ∈ O ⊂ U existiert. (Eine Umgebung braucht selbst nicht offen zu sein.) Eine Umgebungsbasis von t ist ein System U von Umgebungen von t, so daß jede Umgebung V ein U ∈ U umfaßt. Im metrischen Fall bilden die Kugeln um t eine Umgebungsbasis; eine kleinere abz¨ ahlbare Umgebungsbasis besteht aus den Kugeln mit dem Radius n1 . Jetzt ist klar, was man unter dem Rand ∂M von M verstehen wird, n¨ amlich die Menge aller t ∈ T , so daß U ∩ M = ∅ und U ∩ M = ∅ f¨ ur alle Umgebungen U von t gilt; es reicht, das f¨ ur alle U , die eine Umgebungsbasis von t durchlaufen, zu fordern. Eine Folge (tn ) in einem topologischen Raum T heißt konvergent gegen ur die Menge aller Umgebungen eines t ∈ T , falls – mit der Bezeichnung Ut f¨ Punkts t – ∀U ∈ Ut ∃N ∈ N ∀n ≥ N tn ∈ U. Wir schreiben wieder tn → t. Nun kommen wir zur ersten Abweichung vom metrischen Fall. Zum einen braucht der Grenzwert t nicht mehr eindeutig bestimmt zu sein; ein drastisches Beispiel ist τ = {∅, T }, denn hier konvergiert jede Folge gegen jeden Punkt in T . Zum anderen – und das wiegt weitaus schwerer – l¨ aßt sich Satz B.1.2 nicht auf topologische R¨aume ausdehnen; f¨ ur ein konkretes Gegenbeispiel siehe S. 403. Zwar ist die Implikation (ii) ⇒ (i) nach wie vor g¨ ultig; jedoch benutzt das Argument f¨ ur (i) ⇒ (ii) im metrischen Fall die Existenz abz¨ahlbarer Umgebungsbasen, denn man w¨ ahlt ja tn ∈ U1/n (t) ∩ M . Man kann also sagen, daß die Folge (tn ) in Satz B.1.2(ii) eigentlich“ nicht mit N, sondern mit einer geeigneten ” Umgebungsbasis von t indiziert ist; und das suggeriert, in topologischen R¨ aumen mit komplizierterer Umgebungsstruktur einen allgemeineren Konvergenzbegriff zu studieren. Die mengentheoretische Topologie kennt hier die Filterkonvergenz und die Netzkonvergenz. Beide Konzepte sind ¨ aquivalent; da jedoch die Netzkonvergenz einfacher zu erkl¨ aren ist und den Bed¨ urfnissen der Analysis angepaßter erscheint, soll nur auf diese eingegangen werden. Eine gerichtete Menge ist eine mit einer Relation ≤ versehene Menge I, welche (a) i ≤ i
∀i ∈ I,
(b) i ≤ j, j ≤ k ⇒ i ≤ k, (c) ∀i1 , i2 ∈ I ∃j ∈ I
i1 ≤ j, i2 ≤ j
erf¨ ullt. Ein Netz in einer Menge T ist eine Abbildung von einer gerichteten Menge I nach T ; man schreibt (ti )i∈I oder k¨ urzer (ti ). Offensichtlich ist N mit der u ¨ blichen Ordnung gerichtet, so daß jede Folge ein Netz ist. Ein weiteres Beispiel einer gerichteten Menge ist eine Umgebungsbasis U eines Punkts in einem topologischen Raum mit der Richtung U ≥ V ⇔ U ⊂ V ; (c) ist erf¨ ullt, da der Schnitt zweier Umgebungen eine Umgebung ist.
B.2
507
Topologische R¨ aume
Ein Netz (ti ) in einem topologischen Raum T heißt konvergent gegen t, falls (Ut wie oben) ∀U ∈ Ut ∃j ∈ I ∀i ≥ j
ti ∈ U.
W¨ ahlt man im zuletzt genannten Beispiel zu V ∈ U ein beliebiges tV ∈ V , konvergiert (tV ) gegen t. Liegt t im Abschluß einer Menge M , kann man ahlen, und man erh¨ alt folgende Beschreibung des Abschlusses tV ∈ V ∩M w¨ in topologischen R¨ aumen. Satz B.2.1 Folgende Bedingungen sind in einem topologischen Raum ¨aquivalent: (i) t ∈ M . (ii) Es existiert ein Netz (ti ) in M mit ti → t. Kommen wir nun zur Stetigkeit von Abbildungen. Seien T1 und T2 (genauer (T1 , τ1 ) und (T2 , τ2 )) topologische R¨ aume und f : T1 → T2 eine Abbildung. Wir erheben nun die ε-δ-freie Charakterisierung der Stetigkeit im ur jede Umgebung metrischen Fall zur Definition: f heißt stetig bei t0 , falls f¨ ¨ V von f (t0 ) das Urbild f −1 (V ) eine Umgebung von t0 ist. Aquivalenterweise hat man nach Wahl von Umgebungsbasen U von t0 und V von f (t0 ) folgendes ε-δ-Kriterium“: f ist genau dann bei t0 stetig, wenn ” ∀V ∈ V ∃U ∈ U
t ∈ U ⇒ f (t) ∈ V.
Wie im metrischen Fall sagt man, f : T1 → T2 sei stetig, falls f an jeder Stelle stetig ist, und man erh¨ alt das folgende Analogon zu Satz B.1.4. Satz B.2.2 F¨ ur eine Abbildung f zwischen topologischen R¨aumen T1 und T2 sind ¨aquivalent: (i) f ist stetig. (ii) F¨ ur alle offenen O ⊂ T2 ist f −1 (O) offen in T1 . (iii) F¨ ur alle abgeschlossenen A ⊂ T2 ist f −1 (A) abgeschlossen in T1 . Anders als im metrischen Fall braucht die Stetigkeit nicht durch Folgenkonvergenz wie in Satz B.1.3(ii) charakterisiert zu sein; diese Eigenschaft ¨ wird Folgenstetigkeit genannt. Wieder erh¨ alt man eine Aquivalenz, wenn man mit Netzen statt Folgen operiert. Satz B.2.3 Sei f : T1 → T2 eine Abbildung zwischen topologischen R¨aumen. Dann sind folgende Bedingungen ¨aquivalent: (i) f ist stetig bei t0 . ur alle Netze (ti ). (ii) ti → t0 ⇒ f (ti ) → f (t0 ) f¨
508
Anhang B.
Metrische und topologische R¨ aume
Die S¨ atze B.2.1 und B.2.3 deuten darauf hin, daß man in topologischen R¨ aumen mit Netzen genauso hantieren kann wie mit Folgen im metrischen Fall. Dieser Eindruck ist weitgehend korrekt, und der Vorzug der Netze liegt darin, daß sich mit ihrer Hilfe Beweise oft mechanisieren lassen (siehe etwa Satz VIII.2.7). Es muß jedoch betont werden, daß es sehr wohl Konvergenzph¨ anomene gibt, die sich nur auf Folgen beziehen. So ist etwa der Konvergenzsatz von Lebesgue (Satz A.3.2) f¨ ur Netze statt Folgen im allgemeinen falsch, und auch Korollar IV.2.5 braucht nicht mehr f¨ ur Netze zu gelten. Beachte ferner in diesem Zusammenhang, daß selbst in R konvergente Netze nicht beschr¨ ankt zu sein brauchen, etwa (ti ) = ( 1i ) auf der mit ≤ gerichteten Menge (0, ∞). Ist (T, τ ) ein topologischer Raum und S ⊂ T , so kann S mit der Relativtopologie τS = {O∩S: O ∈ τ } zu einem eigenst¨andigen topologischen Raum gemacht werden. Ist R ein weiterer topologischer Raum und f : R → S eine Abbildung, so ist f : R → S genau dann τS -stetig, wenn f : R → T τ -stetig ist. Ist f : T1 → T2 eine bijektive stetige Abbildung, f¨ ur die auch f −1 stetig ist, nennt man f einen Hom¨oomorphismus und T1 und T2 hom¨oomorph; die R¨ aume T1 und T2 sind dann vom topologischen Standpunkt nicht zu unterscheiden. Wie das bereits erw¨ ahnte Beispiel der Topologie {∅, T } zeigt, garantiert die Definition eines topologischen Raums noch nicht, daß es auch viele offene Mengen gibt. Die mengentheoretische Topologie kennt eine ganze Hierarchie von Trennungsaxiome“ genannten Reichhaltigkeitsbedingungen, die ” von den meisten der f¨ ur die Analysis relevanten Topologien allesamt erf¨ ullt werden. Hier interessieren uns nur zwei dieser Bedingungen. Ein topologischer Raum T heißt Hausdorffraum, wenn je zwei verschiedene Punkte disjunkte Umgebungen besitzen, explizit, wenn es zu s = t disjunkte offene Mengen U und V mit s ∈ U , t ∈ V gibt. Das garantiert, daß jede endliche Menge abgeschlossen ist und jede konvergente Folge bzw. jedes konvergente Netz genau einen Grenzwert besitzt. Damit ist aber noch nicht gesagt, daß es nichttriviale reellwertige Funktionen auf einem solchen Raum gibt; in der Tat hat Urysohn (Math. Ann. 94 (1925) 262–295) einen Hausdorffraum T konstruiert, auf dem jede stetige Funktion f : T → R konstant ist; vgl. auch Pedersen [1989], S. 29, f¨ ur eine einfachere Konstruktion nach Bing. Man braucht dazu also eine sch¨arfere Bedingung. Ein topologischer Raum T heißt normal, wenn je zwei disjunkte abgeschlossene Mengen disjunkte Umgebungen besitzen, genauer, wenn es zu disjunkten abgeschlossenen Mengen A und B disjunkte offene Mengen U und V mit A ⊂ U und B ⊂ V gibt. (Beachte, daß definitionsgem¨aß ein normaler Raum nicht notwendig ein Hausdorffraum ist, da einpunktige Mengen nicht abgeschlossen zu sein brauchen.) Es ist leicht zu sehen, daß metrische R¨ aume und kompakte Hausdorffr¨ aume normal sind. Hier ist der relevante Satz u ¨ber normale R¨aume.
B.2
Topologische R¨ aume
509
Theorem B.2.4 (Satz von Tietze-Urysohn) F¨ ur einen topologischen Raum T sind ¨aquivalent: (i) T ist normal. (ii) Sind A und B disjunkte abgeschlossene Teilmengen von T , so existiert eine stetige Funktion f : T → [0, 1] mit f |A = 0 und f |B = 1. (iii) Zu jeder abgeschlossenen Teilmenge A von T und jeder bzgl. der Relativtopologie auf A stetigen Funktion f : A → [a, b] existiert eine stetige Fortsetzung F : T → [a, b]. Den u ¨ blichen“ Beweis dieses Theorems entnehme man der angegebenen ” Literatur (etwa Pedersen [1989], S. 24); man beachte auch die Beweisvarianten von Mandelkern in Arch. Math. 60 (1993) 364–366 und von Ossa in Arch. Math. 71 (1998) 331–332. Ein etwas anderer Beweis beruht auf folgendem Sandwichlemma“. ” Lemma B.2.5 (Lemma von Tong) Sei T ein normaler topologischer Raum, und seien ϕ1 , ϕ2 : T → [a, b] Funkur alle α ∈ R offen ist (ϕ1 ist halbstetig tionen, so daß {t: ϕ1 (t) < α} f¨ ” von oben“), {t: ϕ2 (t) > α} f¨ ur alle α ∈ R offen ist (ϕ2 ist halbstetig von ” unten“) und ϕ1 ≤ ϕ2 gilt. Dann existiert eine stetige Funktion ϕ: T → [a, b] mit ϕ1 ≤ ϕ ≤ ϕ2 . Beweise dieses Lemmas findet man in Tongs Originalarbeit (Duke Math. J. 19 (1952) 289–292) oder in Lacey [1974], S. 27f. Wenn man Lemma B.2.5 akzeptiert, folgt Theorem B.2.4 sofort: Die Implikationen (iii) ⇒ (ii) ⇒ (i) sind klar, und f¨ ur (i) ⇒ (iii) setze einfach f (t) t ∈ A, f (t) t ∈ A, ϕ2 (t) = ϕ1 (t) = a t∈ / A, b t∈ / A. Wie im metrischen Fall erh¨ alt man eine Aussage u ¨ ber normerhaltende Fortsetzungen. Korollar B.2.6 Sei T ein normaler topologischer Raum und A ⊂ T eine abgeschlossene Teilmenge. Sei f : A → K eine beschr¨ankte stetige Funktion. Dann existiert eine beschr¨ankte stetige Fortsetzung F : T → K mit F ∞ = f ∞ . Nun wollen wir uns den kompakten topologischen R¨aumen widmen. Wie im metrischen Fall nennen wir einen topologischen Raum kompakt, wenn ¨ jede offene Uberdeckung eine endliche Teil¨ uberdeckung besitzt1 . Ein topologischer Raum heißt lokalkompakt, wenn jeder Punkt eine Umgebungsbasis aus kompakten Mengen besitzt. 1 Manche Autoren nennen diese Eigenschaft quasikompakt und fordern zur Kompaktheit zus¨ atzlich die Hausdorffeigenschaft.
510
Anhang B.
Metrische und topologische R¨ aume
Ist T ein kompakter Raum und S ⊂ T abgeschlossen, so ist S in der Relativtopologie kompakt; ist T ein Hausdorffraum, gilt auch die Umkehrung. Die Kompaktheit eines Teilraums S eines topologischen Raums T kann man ¨ aquivalent so beschreiben: Ist (Oi ) eine Familie offener Teilmengen von T mit S ⊂ i∈I Oi , so existieren endlich viele Oi1 , . . . , Oin mit n ˜ i := Oi ∩ S bilden eine offene Uberdeckung ¨ S ⊂ k=1 Oik ; denn die O von S bzgl. der Relativtopologie im bisherigen Sinn. Ist f : T1 → T2 stetig und T1 kompakt, so ist f (T1 ) kompakt. Das folgende Lemma u aume ist zwar einfach, aber n¨ utzlich; ¨ber kompakte Hausdorffr¨ es folgt unmittelbar aus den obigen Bemerkungen und Satz B.2.2(iii). Lemma B.2.7 Sind T1 und T2 Hausdorffr¨aume, f : T1 → T2 stetig und bijektiv sowie T1 kompakt, so ist f −1 stetig. Mit anderen Worten, T1 und T2 sind hom¨oomorph. Es sollen verschiedene ¨ aquivalente Umformungen des Kompaktheitsbegriffs beschrieben werden. Wie bereits im Zusammenhang mit Satz B.1.7 bemerkt wurde, sind Kompaktheit und Folgenkompaktheit f¨ ur topologische R¨ aume v¨ ollig verschiedene Eigenschaften (siehe auch S. 414). Wieder muß man Netze ins Spiel bringen. Leider ist der ad¨aquate Begriff eines Teilnetzes etwas kompliziert. Sei (ti )i∈I ein Netz, J eine weitere gerichtete Menge und ϕ: J → I eine Abbildung mit ∀i ∈ I ∃j0 ∈ J ∀j ≥ j0
ϕ(j) ≥ i.
Dann heißt (tϕ(j) )j∈J ein Teilnetz von (ti )i∈I . Jedes Teilnetz eines konvergenten Netzes konvergiert gegen denselben Grenzwert. Ein Teilnetz eines alt manche der ti , diese jedoch eventuell sehr h¨aufig, was Netzes (ti ) enth¨ das Konzept des Teilnetzes von dem einer Teilfolge unterscheidet. In der Tat werden wir im Beweis von Lemma B.2.8 ein Teilnetz angeben, das jedes alt. der ti unendlich oft enth¨ F¨ ur den folgenden Satz ist noch ein Begriff wichtig. Ein Netz (ti ) liegt schließlich in einer Menge M ⊂ T , falls ein i0 ∈ I mit ti ∈ M f¨ ur alle i ≥ i0 existiert. Eine Netz heißt universell, wenn es f¨ ur alle M ⊂ T entweder schließlich in M oder schließlich in T \ M liegt. Universelle Netze sind schwer zu visualisieren, und tats¨ achlich ist es noch niemandem gelungen, ein solches (außer den schließlich konstanten Netzen) konkret anzugeben. Mit Hilfe des Zornschen Lemmas kann man aber ihre Existenz beweisen. Lemma B.2.8 Jedes Netz besitzt ein universelles Teilnetz. Beweis. Sei (ti ) ein Netz in T . Betrachte die Schw¨anze“ Si = {ti : i ≥ i} ” sowie S = {Si : i ∈ I}. Nennt man eine Familie F von Teilmengen von T eine Filterbasis, falls kein F ∈ F leer ist und zu F1 , F2 ∈ F ein F ∈ F mit F ⊂ F1 ∩ F2 existiert, so ist S eine Filterbasis. Sei X das System
B.2
Topologische R¨ aume
511
aller S umfassenden Filterbasen. Bez¨ uglich der Inklusion ist X induktiv geordnet, und das Zornsche Lemma liefert eine maximale Familie U ∈ X; die Maximalit¨ at von U impliziert insbesondere T ∈ U. Als n¨ achstes beobachten wir, daß U die bizarre Eigenschaft zukommt, f¨ ur jede Teilmenge von T entweder diese selbst oder ihr Komplement zu enthalten. Ist n¨ amlich M ⊂ T , so gilt M ∩ U = ∅ f¨ ur alle U ∈ U oder M ∩ U = ∅ f¨ ur alle U ∈ U, denn andernfalls existierten U, V ∈ U mit M ∩ U = ∅ und M ∩ V = ∅, so daß U und V disjunkt sind im Widerspruch zur Definition von X. Nehmen wir M ∩ U = ∅ f¨ ur alle U ∈ U an, so ist U ∪ {U ∩ M : U ∈ U} ∈ X, und wegen der Maximalit¨at von U gilt M = T ∩ M ∈ U. Im verbleibenden Fall erh¨ alt man analog M ∈ U. Nun versehen wir Φ = {(U, i) ∈ U × I: ti ∈ U } mit der Relation (U, i) ≥ (V, j), falls U ⊂ V und i ≥ j. Φ ist eine gerichtete Menge, denn zu (U1 , i1 ), (U2 , i2 ) ∈ Φ w¨ ahle V ∈ U mit V ⊂ U1 ∩ U2 und j ∈ I mit j ≥ i1 , j ≥ i2 . Da Sj ∈ U, ist Sj ∩ V = ∅; d.h. es existiert k ≥ j mit tk ∈ V . Also dominiert (V, k) ∈ Φ sowohl (U1 , i1 ) als auch (U2 , i2 ). Mittels ϕ: Φ → I, (U, i) → i, wird ein Teilnetz (tϕ(U,i) ) von (ti ) definiert, das nach Konstruktion schließlich in allen U ∈ U verl¨auft. Die im letzten Absatz gemachte Beobachtung liefert, daß es ein universelles Teilnetz ist. 2 Das im vorigen Beweis konstruierte“ Mengensystem U ist ein Beispiel ” eines Ultrafilters. Satz B.2.9 F¨ ur einen topologischen Raum T sind ¨aquivalent: (i) T ist kompakt. (ii) T hat die endliche Durchschnittseigenschaft, d.h., sind Ai (i ∈ I) abgeschlossene Teilmengen von T mit A n i∈I i = ∅, so existieren endliche viele Indizes i1 , . . . , in mit k=1 Aik = ∅. (iii) Jedes universelle Netz in T konvergiert. (iv) Jedes Netz in T hat ein konvergentes Teilnetz. Beweis. (i) ⇔ (ii) folgt sofort durch Komplementbildung. (i) ⇒ (iii): Wir nehmen an, es existiere ein nicht konvergentes universelur alle t ∈ T gibt es dann eine offene Umgebung Ut , so daß les Netz (ti ). F¨ (ti ) nicht schließlich in Ut liegt; weil das Netz universell ist, muß (ti ) schließlich in Ut liegen. W¨ ahlt man uberdeckung Ut1 ∪ . . . ∪ Utn eine endliche Teil¨ ¨ der offenen Uberdeckung U , erh¨ a lt man den Widerspruch, daß (ti ) t∈T t schließlich in Ut1 ∩ . . . ∩ Utn = ∅ liegt. (iii) ⇒ (iv) ist klar nach Lemma B.2.8. (iv) ⇒ (i): Nehmen wir an, (iv)gelte, aber T sei nicht kompakt. Dann ¨ uberdekexistiert eine offene Uberdeckung i∈I Ui , die keine endliche Teil¨ kung zul¨ aßt. Bezeichnet Φ die Menge der endlichen Teilmengen von I, so urlicher existiert also zu jedem F ∈ Φ ein tF ∈ T \ i∈F Ui . Da Φ in nat¨ Weise eine gerichtete Menge ist, haben wir so ein Netz definiert. W¨are
512
Anhang B.
Metrische und topologische R¨ aume
(tϕ(j) )j∈J ein konvergentes Teilnetz, so existierte ein Grenzwert t und weiter / Ui , falls ϕ(j) ≥ {i}, im Widerspruch ein Index i mit t ∈ Ui . Aber tϕ(j) ∈ zur angenommenen Konvergenz. 2 Die wohl wichtigste Stabilit¨ atsaussage u ¨ber kompakte R¨aume ist der Satz von Tikhonov. Um ihn zu formulieren, brauchen wir das Konzept der ur jedes α ∈ A ein Produkttopologie. Es sei A eine Indexmenge, und Tα sei f¨ topologischer Raum. Das mengentheoretische Produkt der Tα ist : Tα = {f : A → Tα : f (α) ∈ Tα ∀α ∈ A} . α∈A
Stimmen alle Tα u ¨berein, sagen wir Tα = T , schreibt man auch T A ; T A besteht also :aus allen Funktionen von A nach T . Das Auswahlaxiom impliziert, daß Tα nicht: leer ist. Nun beschreiben wir die Produkttopologie. Eine Teilmenge O ⊂ Tα heißt offen (in der Produkttopologie), wenn es f¨ ur alle t ∈ O endlich viele Indizes α1 , . . . , αk und in Tαj offene Mengen Oαj (j = 1, . . . , k) mit : t ∈ s ∈ Tα : s(αj ) ∈ Oαj ∀j = 1, . . . , k ⊂ O gibt. (Mit anderen Worten haben wir so eine Umgebungsbasis von t be: schrieben.) Bezeichnet πβ die: kanonische Abbildung Tα → Tβ , t → t(β), so ist eine Abbildung f : S → Tα (S ein topologischer Raum) genau dann stetig, wenn es:alle πβ ◦ f : S → Tβ sind, und ein Netz (ti )i∈I konvergiert genau dann in Tα gegen t, wenn alle πβ (ti ) i∈I in Tβ gegen πβ (t) konvergieren. Die Produkttopologie ist also die Topologie der punktweisen (oder koordinatenweisen) Konvergenz. Nun k¨ onnen wir den fundamentalen Satz von Tikhonov formulieren und beweisen. Theorem B.2.10 (Satz von Tikhonov) : Das Produkt Tα kompakter R¨aume ist kompakt. Beweis. Der Beweis kann schnell mit Hilfe uhrt wer: von Satz B.2.9 gef¨ den. Sei (t ) ein universelles Netz in T . F¨ u r jedes α ∈ A ist dann i i∈I α πα (ti ) i∈I ein universelles Netz in Tα , also nach Satz B.2.9 konvergent. Gem¨ aß der Vorbemerkung ist (ti )i∈I selbst konvergent. Eine nochmalige Anwendung von Satz B.2.9 liefert die Behauptung des Theorems. 2 F¨ ur eine Beweisvariante sei auf Chernoffs Note in Amer. Math. Monthly 99 (1992) 932–934 verwiesen.
Symbolverzeichnis
X, Y, Z, . . . Xτ H, K, . . . A, B, . . . X (Xτ ) X/U X ⊕ Y , X ⊕p Y !2 Hi i∈I XY X∼ =Y U ⊥ , V⊥
normierte, Banach- oder lokalkonvexe R¨ aume X, versehen mit der Topologie τ Hilbertr¨ aume Banachalgebren Dualraum von X Dualraum von X, versehen mit der Topologie τ Quotientenraum direkte Summe, p -direkte Summe (Satz I.3.3) Hilbertsche Summe der Hilbertr¨ aume Hi (Seite 473) X und Y sind isomorph X und Y sind isometrisch isomorph Annihilatoren ((III.4) und (III.5)); im Hilbertraumkontext: orthogonales Komplement
BX SX iX
abgeschlossene Einheitskugel: {x: x ≤ 1} Einheitssph¨ are: {x: x = 1} kanonische Isometrie von X nach X (Satz III.3.1)
K T D Re z Im z xξ xα
R oder C {z ∈ C: |z| = 1} {z ∈ C: |z| < 1} Realteil von z Imagin¨ n arteil von z n :nk=1 xαkkξk , wo x, ξ ∈n R x , wo x ∈ R , α ein Multiindex k=1 k
. , ||| . ||| . ∞ . p , . p , . Lp T , T nuk , T HS
generische Normen Supremumsnorm kanonische Norm auf p bzw. Lp Operatornorm, nukleare Norm, Hilbert-Schmidt-Norm von T Skalarprodukt
.,.
514
Symbolverzeichnis
τP σ(X, X ) σ(X , X) σ(X, Y )
von P erzeugte lokalkonvexe Topologie schwache Topologie auf X, X lokalkonvex schwach∗ -Topologie auf X , X lokalkonvex schwache Topologie des dualen Paars (X, Y ) auf X
∞ (T ) B(T ) C b (T ), C(T ), C0 (T ) C2π C k (Ω), C k (Ω) d, c0 , c, ∞ p , p (n) 2 (I) L p (R), L p (μ) Lp (R), Lp (μ) L1lok (Ω)
Raum aller beschr¨ ankten Funktionen auf T Raum der beschr¨ ankten meßbaren Funktionen auf T R¨ aume stetiger Funktionen (Beispiel I.1(c)) Raum der 2π-periodischen stetigen Funktionen R¨ aume differenzierbarer Funktionen (Beispiel I.1(d)) Folgenr¨ aume (Beispiel I.1(f)) p -Folgenraum, n-dimensionaler p -Raum (Beispiel I.1(g)) 2 -Raum u ¨ ber beliebiger Indexmenge (Beispiel V.1(e)) L p -Raum (Beispiele I.1(h) und (i)) ¨ zugeh¨ origer Raum von Aquivalenzklassen ¨ Raum der (Aquivalenzklassen von) lokal integrierbaren Funktionen {f : [a, b] → C: f absolutstetig, df /dt ∈ L2 [a, b]} R¨ aume von Maßen (Beispiel I.1(j) und Definition I.2.13) Raum der fastperiodischen Funktionen (Beispiel V.1(f)) Sobolevr¨ aume (Definition V.1.12) Raum aller stetigen Funktionen mit kompaktem Tr¨ ager (Aufgabe II.5.5) Raum der Testfunktionen auf Ω, d.h. der C ∞ -Funktionen mit kompaktem Tr¨ ager (Definition V.1.9) Raum der Testfunktionen auf Ω mit Tr¨ ager in K Raum der Distributionen auf Ω Raum der C ∞ -Funktionen auf Ω Raum der Distributionen auf Ω mit kompaktem Tr¨ ager (Aufgabe VIII.6.42) Schwartzraum (Definition V.2.3) Raum der temperierten Distributionen
AC[a, b] M (T, Σ), M (T ) AP2 (R) W m (Ω), H0m (Ω) K (Ω) D (Ω) D K (Ω) D (Ω) E (Ω) E (Ω) S (Rn ) S (Rn ) L(X, Y ) K(X, Y ) F (X, Y ) N (X, Y ) L(X), K(X), . . . HS(H)
Raum der linearen stetigen Operatoren von X nach Y Raum der kompakten Operatoren von X nach Y Raum der linearen stetigen Operatoren von X nach Y mit endlichdimensionalem Bild Raum der nuklearen Operatoren von X nach Y entsprechender Raum von Operatoren von X nach X Raum der Hilbert-Schmidt-Operatoren auf H
Id, IdX T T∗ λ−T ker(T ) ran(T ) dom(T )
identischer Operator auf X adjungierter Operator im Hilbertraumsinn adjungierter Operator λ Id − T Kern von T : {x: T x = 0} Bild von T : {T x: x ∈ X} Definitionsbereich von T
515
Symbolverzeichnis
Graph von T : {(x, T x): x ∈ dom(T )} T ist Erweiterung von S Spektrum eines Operators oder eines Elements einer Banachalgebra A σp (T ), σc (T ), σr (T ) Punkt-, stetiges und Restspektrum eines Operators ρ(T ), ρ(x) Resolventenmenge Resolventenabbildung Rλ (T ), Rλ (x) r(T ), r(x) Spektralradius n-ter Eigenwert von T , gem¨ aß der Vielfachheit gez¨ ahlt λn (T ) n-te singul¨ are Zahl von T sn (T ) tr(T ) Spur von T Operator x → x (x)y auf einem Banachraum x ⊗ y e⊗f Operator x → x, ef auf einem Hilbertraum F Fouriertransformation Fourier-Plancherel-Transformation (Satz V.2.9) F2 im Hilbertraumkontext: Orthogonalprojektion auf U PU f (T ) Funktion eines selbstadjungierten Operators (Theorem VII.1.13) Spektralmaß, ausgewertet bei der Borelmenge A EA Integration nach einem Spektralmaß dEλ x, x gr(T ) S⊂T σ(T ), σ(x), σA (x)
A int A lin A lin A co A co A A A+B ΛA Ao , Aoo ex A
Abschluß von A Inneres von A lineare H¨ ulle von A abgeschlossene lineare H¨ ulle von A konvexe H¨ ulle von A abgeschlossene konvexe H¨ ulle von A Komplement von A {a + b: a ∈ A, b ∈ B} {λa: λ ∈ Λ, a ∈ A} Polare, Bipolare von A Menge der Extremalpunkte von A
λ, λd δx μ⊗ν ν μ f dλ, f (t) dt, . . .
Lebesguemaß Diracmaß oder Deltadistribution Produktmaß von μ und ν ν ist absolutstetig bzgl. μ Lebesguesches Integral
ΓA x x → x∗ alg(x, x∗ ) S(A) (Hω , πω )
Gelfandraum einer Banachalgebra Gelfandtransformierte von x Involution kleinste abgeschlossene Unteralgebra A0 mit e, x, x∗ ∈ A0 Menge der Zust¨ ande auf einer C ∗ -Algebra A GNS-Darstellung bzgl. des Zustands ω
[x], x + U σ xn → x
¨ Aquivalenzklasse von x in X/U schwache Konvergenz
516 UF,ε x⊥y d(x, A) xi
Symbolverzeichnis
{x: p(x) ≤ ε ∀p ∈ F } (Kapitel VIII) Orthogonalit¨ at Abstand von x zu A (Definition I.3.1) unbedingt konvergente Reihe
i∈I
pA χA 1 t Dα f D(α) f D(α) T Tf δ, δx supp(f ) f ∗g XI
Minkowskifunktional Indikatorfunktion von A (S. 490) konstante Funktion oder Folge mit dem Wert 1 identische Funktion t → t partielle Ableitung der Ordnung α, α ein Multiindex schwache Ableitung der Ordnung α (Definition V.1.11) Distributionenableitung der Ordnung α von T zu f geh¨ orige regul¨ are Distribution Deltadistribution Tr¨ ager von f : {t: f (t) = 0} Faltung von f und g Menge aller Funktionen von I nach X
Literaturverzeichnis
Das Literaturverzeichnis enth¨ alt einf¨ uhrende B¨ ucher zur Funktionalanalysis, die mit dem Symbol gekennzeichnet sind, sowie speziellere Monographien zu Teilgebieten der Funktionalanalysis und Lehrb¨ ucher anderer Gebiete, die im Text genannt werden. R. A. Adams: Sobolev Spaces. Academic Press, 1975. A. G. Aksoy, M. A. Khamsi: Nonstandard Methods in Fixed Point Theory. Springer, 1990. F. Albiac, N. J. Kalton: Topics in Banach Space Theory. Springer, 2006. M. A. Al-Gwaiz: Theory of Distributions. Marcel Dekker, 1992.
H. W. Alt: Lineare Funktionalanalysis. Springer, 5. Auflage, 2006. D. Amir: Characterizations of Inner Product Spaces. Birkh¨ auser, 1986.
J. Appell, M. V¨ ath: Elemente der Funktionalanalysis. Vieweg, 2005. J. Arias de Reyna: Pointwise Convergence of Fourier Series. Springer, 2002.
J.-P. Aubin: Applied Functional Analysis. Wiley, 1979. A. V. Balakrishnan: Applied Functional Analysis. Springer, 1976. S. Banach: Th´eorie des Op´erations Lin´ eaires. Monografie Matematyczne, 1932. R. G. Bartle (Hg.): Studies in Functional Analysis. Mathematical Association of America, 1980. H. Bauer: Maß- und Integrationstheorie. De Gruyter, 1990. H. Bauer: Wahrscheinlichkeitstheorie. De Gruyter, 4. Auflage, 1991. B. Beauzamy: Introduction to Banach Spaces and their Geometry. NorthHolland, 2. Auflage, 1985. B. Beauzamy: Introduction to Operator Theory and Invariant Subspaces. NorthHolland, 1988. E. Behrends: Maß- und Integrationstheorie. Springer, 1987.
518
Literaturverzeichnis
C. Bennett, R. Sharpley: Interpolation of Operators. Academic Press, 1988. Y. Benyamini, J. Lindenstrauss: Geometric Nonlinear Functional Analysis. American Mathematical Society, 2000.
S. K. Berberian: Lectures in Functional Analysis and Operator Theory. Springer, 1974. J. Bergh, J. L¨ ofstr¨ om: Interpolation Spaces. Springer, 1976. A. Besicovitch: Almost Periodic Functions. Cambridge University Press, 1932. H. Bohr: Fastperiodische Funktionen. Springer, 1932. ´ s: Linear Analysis. Cambridge University Press, 1990. B. Bolloba O. Bratteli, D. W. Robinson: Operator Algebras and Quantum Statistical Mechanics (Vol. I and II). Springer, 1979, 1981.
H. Brezis: Analyse Fonctionnelle. Masson, 4. Auflage, 1993. G. Buttazzo, M. Giaquinta, S. Hildebrandt: One-Dimensional Variational Problems. Clarendon Press, 1998. N. Carothers: A Short Course on Banach Space Theory. Cambridge University Press, 2005. E. W. Cheney: Introduction to Approximation Theory. Chelsea, 2. Auflage, 1982. G. Choquet: Lectures on Analysis I–III. Benjamin, 1969. D. L. Cohn: Measure Theory. Birkh¨ auser, 1980.
J. B. Conway: A Course in Functional Analysis. Springer, 1985. R. Courant, D. Hilbert: Methoden der Mathematischen Physik (Band I und II). Springer, 3. Auflage, 1968. B. Dacorogna: Direct Methods in the Calculus of Variations. Springer, 1989. I. Daubechies: Ten Lectures on Wavelets. SIAM, 1992. E. B. Davies: One-Parameter Semigroups. Academic Press, 1980. M. M. Day: Normed Linear Spaces. Springer, 3. Auflage, 1973. K. Deimling: Nonlinear Functional Analysis. Springer, 1985. R. Deville, G. Godefroy, V. Zizler: Smoothness and Renormings in Banach Spaces. Longman, 1993. ´: Grundz¨ J. Dieudonne uge der modernen Analysis. Vieweg, 9 B¨ ande. Insbesondere: Band 1, 3. Auflage, 1985. Band 2, 2. Auflage, 1987. Band 7, 1982. Band 8, 1983. ´: History of Functional Analysis. North-Holland, 1981. J. Dieudonne
M. Dobrowolski: Angewandte Funktionalanalysis. Springer, 2006. J. Dugundji: Topology. Allyn and Bacon, 1966. N. Dunford, J. T. Schwartz: Linear Operators. Wiley, 3 B¨ ande. Part I: General Theory, 1958. Part II: Spectral Theory, 1963. Part III: Spectral Operators, 1971. D. E. Edmunds, W. D. Evans: Spectral Theory and Differential Operators. Clarendon Press, 1987.
Literaturverzeichnis
519
Yu. Eidelman, V. Milman, A. Tsolomitis: Functional Analysis. American Mathematical Society, 2004. K.-J. Engel, R. Nagel: One-Parameter Semigroups for Linear Evolution Equations. Springer, 2000. K. Floret: Maß- und Integrationstheorie. Teubner, 1981. G. B. Folland: Introduction to Partial Differential Equations. Princeton University Press, 2. Auflage, 1995. T. W. Gamelin: Uniform Algebras. Chelsea, 2. Auflage, 1984. I. M. Gelfand, N. Ya. Vilenkin: Generalized Functions, Vol. 4. Academic Press, 1964. K. Goebel, W. A. Kirk: Topics in Metric Fixed Point Theory. Cambridge University Press, 1990. J. A. Goldstein: Semigroups of Linear Operators and Applications. Oxford University Press, 1985. A. Granas, J. Dugundji: Fixed Point Theory. Springer, 2003. S. Guerre-Delabri` ere: Sequences in Classical Banach Spaces. Marcel Dekker, 1992. ´ jek, V. Zizler: Introduction to Banach Spaces. Matfyzpress, P. Habala, P. Ha 1996. P. Halmos: Introduction to Hilbert Space and the Theory of Spectral Multiplicity. Chelsea, 1951.
P. Halmos: A Hilbert Space Problem Book. Springer, 2. Auflage, 1982. H. Heuser: Funktionalanalysis. Teubner, 3. Auflage, 1992. D. Hilbert, E. Schmidt: Integralgleichungen und Gleichungen mit unendlich vielen Unbekannten. Teubner-Archiv zur Mathematik, 1989. E. Hille, R. S. Phillips: Functional Analysis and Semi-Groups. American Mathematical Society Colloquium Publications, Vol. 31, 2. Auflage, 1957.
F. Hirzebruch, W. Scharlau: Einf¨uhrung in die Funktionalanalysis. B. I., 1971. R. B. Holmes: Geometric Functional Analysis and its Applications. Springer, 1975. L. H¨ ormander: The Analysis of Linear Partial Differential Operators I. Springer, 2. Auflage, 1990.
G. J. O. Jameson: Topology and Normed Spaces. Chapman and Hall, 1974. K. J¨ orgens: Lineare Integraloperatoren. Teubner, 1970. O. G. Jørsboe, L. Mejlbro: The Carleson-Hunt Theorem on Fourier Series. Lecture Notes in Mathematics 911. Springer, 1982. J. Jost: Partielle Differentialgleichungen. Springer, 1998. J. Jost, X. Li-Jost: Calculus of Variations. Cambridge University Press, 1999. M. I. Kadets, V. M. Kadets: Series in Banach Spaces. Birkh¨ auser, 1997.
520
Literaturverzeichnis
R. V. Kadison, J. R. Ringrose: Fundamentals of the Theory of Operator Algebras (Vol. I and II). Academic Press, 1983, 1986. J.-P. Kahane: Some Random Series of Functions. Cambridge University Press, 2. Auflage, 1985. N. J. Kalton, N. T. Peck, J. W. Roberts: An F -Space Sampler. Cambridge University Press, 1984. R. Kaluz˙ a: The Life of Stefan Banach. Birkh¨ auser, 1996. J. L. Kelley: General Topology. Van Nostrand, 1955. H. K¨ onig: Eigenvalue Distribution of Compact Operators. Birkh¨ auser, 1986. T. W. K¨ orner: Fourier Analysis. Cambridge University Press, 1988. G. K¨ othe: Topologische lineare R¨ aume I. Springer, 2. Auflage, 1966. G. K¨ othe: Topological Vector Spaces II. Springer, 1979. H. E. Lacey: The Isometric Theory of Classical Banach Spaces. Springer, 1974. J. Lamperti: Stochastic Processes. Springer, 1977. J. Lindenstrauss, L. Tzafriri: Classical Banach Spaces (Vol. I and II). Springer, 1977, 1979. Nachdruck 1996. L. H. Loomis: An Introduction to Abstract Harmonic Analysis. Van Nostrand, 1953. J. L¨ utzen: The Prehistory of the Theory of Distributions. Springer, 1982. J. T. Marti: Introduction to Sobolev Spaces and Finite Element Solution of Elliptic Boundary Value Problems. Academic Press, 1986.
M. Mathieu: Funktionalanalysis. Spektrum-Verlag, 1998. R. D. Mauldin (Hg.): The Scottish Book. Mathematics from the Scottish Caf´ e. Birkh¨ auser, 1981. R. B. Megginson: An Introduction to Banach Space Theory. Springer, 1998.
R. Meise, D. Vogt: Einf¨uhrung in die Funktionalanalysis. Vieweg, 1992. Y. Meyer: Wavelets and Operators. Cambridge University Press, 1992. A. F. Monna: Dirichlet’s Principle. A Mathematical Comedy of Errors and its Influence on the Development of Analysis. Oosthoek Publishing Company, 1975. A. F. Monna: Functional Analysis in Historical Perspective. Oosthoek Publishing Company, 1973.
A. Mukherjea, K. Pothoven: Real and Functional Analysis (Vol. I and II). Plenum Press, 2. Auflage, 1984, 1986. G. J. Murphy: C ∗ -Algebras and Operator Theory. Academic Press, 1990. J. C. Oxtoby: Measure and Category. Springer, 2. Auflage, 1980. A. Pazy: Semigroups of Linear Operators and Applications to Partial Differential Equations. Springer, 1983. G. K. Pedersen: C ∗ -Algebras and their Automorphism Groups. Academic Press, 1979.
G. K. Pedersen: Analysis Now. Springer, 1989.
Literaturverzeichnis
521
R. Phelps: Convex Functions, Monotone Operators and Differentiability. Springer, 2. Auflage, 1993. R. R. Phelps: Lectures on Choquet’s Theorem. Van Nostrand, 1966. 2. Auflage Springer 2001. A. Pietsch: Operator Ideals. North-Holland und Deutscher Verlag der Wissenschaften, 1980. A. Pietsch: Eigenvalues and s-Numbers. Cambridge University Press und Geest & Portig, 1987. A. Pietsch: History of Banach Spaces and Linear Operators. Birkh¨ auser, 2007.
M. Reed, B. Simon: Methods of Modern Mathematical Physics. Academic Press. I: Functional Analysis. 2. Auflage, 1980. II: Fourier Analysis, Self-Adjointness. 1975. III: Scattering Theory. 1979. IV: Analysis of Operators. 1978.
F. Riesz, B. Sz.-Nagy: Vorlesungen ¨uber Funktionalanalysis. Deutscher Verlag der Wissenschaften, 2. Auflage, 1968. W. Rudin: Fourier Analysis on Groups. Wiley, 1962. W. Rudin: Principles of Mathematical Analysis. McGraw-Hill, 3. Auflage, 1976. W. Rudin: Real and Complex Analysis. McGraw-Hill, 3. Auflage, 1986.
W. Rudin: Functional Analysis. McGraw-Hill, 2. Auflage, 1991. ˇka: Nichtlineare Funktionalanalysis. Springer, 2004. M. Ruˇ zic
K. Saxe: Beginning Functional Analysis. Springer, 2002. M. Schechter: Principles of Functional Analysis. American Mathematical Society, 2. Auflage, 2002.
H. Schr¨ oder: Funktionalanalysis. Akademie-Verlag, 1997. J. T. Schwartz: Nonlinear Functional Analysis. Gordon and Breach, 1969. L. Schwartz: Th´eorie des distributions. Hermann, 2. Auflage, 1966. S. L. Sobolev: Partial Differential Equations of Mathematical Physics. Pergamon Press, 1964. M. H. Stone: Linear Transformations in Hilbert Space. American Mathematical Society Colloquium Publications, Vol. 15, 1932.
V. S. Sunder: Functional Analysis: Spectral Theory. Birkh¨auser, 1998. A. E. Taylor, D. C. Lay: Introduction to Functional Analysis. Wiley, 2. Auflage, 1980. F. Tr` eves: Topological Vector Spaces, Distributions and Kernels. Academic Press, 1967. H. Triebel: H¨ ohere Analysis. Deutscher Verlag der Wissenschaften, 1972. H. Triebel: Interpolation Theory, Function Spaces, Differential Operators. Deutscher Verlag der Wissenschaften, 1978. J. L. Troutman: Variational Calculus and Optimal Control. Springer, 2. Auflage, 1996.
522
Literaturverzeichnis
W. Walter: Gew¨ ohnliche Differentialgleichungen. Springer, 5. Auflage, 1993. J. Weidmann: Lineare Operatoren in Hilbertr¨ aumen. Teubner, 1976. N. Wiener: I Am a Mathematician. Doubleday & Co, 1956. S. Willard: Topology. Addison-Wesley, 1970. J. Wloka: Partielle Differentialgleichungen. Teubner, 1982. P. Wojtaszczyk: Banach Spaces for Analysts. Cambridge University Press, 1991. P. Wojtaszczyk: A Mathematical Introduction to Wavelets. Cambridge University Press, 1997.
K. Yosida: Functional Analysis. Springer, 6. Auflage, 1980. Nachdruck 1995. N. Young: An Introduction to Hilbert Space. Cambridge University Press, 1988. E. Zeidler: Applied Functional Analysis (2 Bde.). Springer, 1995. E. Zeidler: Nonlinear Functional Analysis and Its Applications. Vol. I: Fixed Point Theorems. Springer, 1986. ˙ W. Zelazko: Banach Algebras. Elsevier, 1973. R. J. Zimmer: Essential Results of Functional Analysis. The University of Chicago Press, 1990. A. Zygmund: Trigonometric Series (Vols. 1 and 2 combined). Cambridge University Press, 2. Auflage, 1959.
Namen- und Sachverzeichnis
Abbildung asymptotisch regul¨ are 169 demiabgeschlossene 167 kompakte 178 kondensierende 184 nichtexpansive 165 verdichtende 184 Abbildungsgrad 198 abgeschlossene Menge 500, 505 Abschließung eines Operators 343, 382 Abschluß einer Menge 500, 505 absolute Konvergenz 16, 233 absolutkonvex 394 absolutstetig 492, 498 absorbierend 101 affine Funktion 128, 440 Algebrenhomomorphismus 319, 459 Annihilator 99 Approximation, beste 128, 223 Approximationseigenschaft 88 Approximationszahlen 86, 308 approximativer Eigenwert 379 aquivalente Norm 24, 25, 83, 153 ¨ Asplundraum 135 Atom eines Maßraums 441 Auerbach, H. 43 Auerbachbasis 65 Auswertungsfunktional 410 B ∗ -Algebra 480 Bairescher Kategoriensatz 138
Banach, S. 40–43, 131–133, 193, 449 Banachalgebra 455 halbeinfache 465, 481 ohne Einheit 478, 480 Banachlimes 126 Banach-Mazur-Abstand 90 Banach-Mazur-Spiel 185 Banachraum 2 endlichdimensionaler 26, 27, 48, 64, 65, 82, 90, 162, 194 isomorphe Banachr¨ aume 55, 133 reflexiver 105, 173, 417 Banachverband 243 Basis siehe Auerbachbasis, Orthonormalbasis, Schauderbasis Bauersches Maximumprinzip 442 Bergmanraum 247 Bernsteinpolynome 30 beschr¨ ankte Menge 437 Besselsche Ungleichung 231, 233 Bidualraum 104 Bikommutantensatz 482 bilineare Abbildung 122, 187, 445 Bipolarensatz 412 Borelmaß 32 Borelmengen 488, 493 Bourbaki, N. 90, 444, 449, 498 C0 -Halbgruppe 358
524 C ∗ -Algebra 465 Calkin-Algebra 466, 475 CAR-Algebra 478 Cauchy-Schwarzsche Ungleichung 20, 201, 472 Cauchyfolge 2, 502 schwache 187 Cauchyproblem 357, 367, 377 Cayley-Transformation 248, 349, 384 Choquet-Spiel 185 Choquettheorie 452 Clarksonsche Ungleichung 38, 197 Courantsches Minimaxprinzip 307 Darstellung einer C ∗ -Algebra 474 irreduzible 481 Defektindizes 347 Delay-Gleichungen 360 Deltafunktion“ 427, 431 ” determinierender Bereich 382 dicht 28 Dieudonn´e, J. 132, 444, 445 Differentialoperator 51, 155, 345, 349 elliptischer 447, 449 hypoelliptischer 447 Diracmaß 494 Dirichletkern 146 Dirichletproblem 136, 228–230, 282–284 Dirichletsches Prinzip 136, 245 Disk-Algebra 8, 477 Distribution 430 Ableitung 432 mit kompaktem Tr¨ ager 443 Ordnung 430 regul¨ are 431 temperierte 404, 434 Doppelschichtpotential 282 Drei-Geraden-Satz 74 Dreiecksungleichung 1 umgekehrte 23 duales Paar 408 Dualit¨ atsabbildung 375 Dualraum 58, 402 separabler 100, 106, 451 von c0 59
Namen- und Sachverzeichnis
von von von von von von von von von
C(K) 62 K(H) 301 Lp 60, 89 p 59 ∞ 89, 99 N (H) 301 (X, σ(X, X )) 405, 410 (X, σ(X, Y )) 410 (X , σ(X , X)) 410
Eidelheit, M. 43, 132 Eigenfunktion 256 Eigenvektor 256 verallgemeinerter 338, 448–449 Eigenwert 256, 334 approximativer 379 Vielfachheit algebraische 303 geometrische 270 Einbettungssatz von Rellich 220, 253 von Sobolev 218, 252 Einheitskugel 47 Einheitssph¨ are 47 Einheitsvektor 29 endlichdimensional siehe Banachraum, endlichdimensionaler oder Operator, endlichdimensionaler endliche Durchschnittseigenschaft 511 Epigraph 130 Ergodensatz 248 Erweiterung eines Operators 341 Friedrichs-Erweiterung 350, 380 Erzeuger einer Kontraktionshalbgruppe 370, 376 normstetigen Halbgruppe 369 Operatorhalbgruppe 362, 373 unit¨ aren Operatorgruppe 383 Euler-Lagrange-Gleichung 123 Extremalpunkt 418 Faktor 482 Faltung 77, 82, 307, 337, 379, 457
525
Namen- und Sachverzeichnis
Faltungsalgebra 457 fast u ¨ berall 492 fastperiodische Funktion 251 Fej´erkern 150 Fixpunktsatz Banachscher 164 Brouwerscher 176 Schauderscher 177, 180 von Browder-G¨ ohde-Kirk 173 von Caristi 195 von Darbo-Sadovski˘ı 184 von Krasnoselski˘ı 185 von Tikhonov 198 von Weissinger 195 Folgenkompaktheit 503 Folgenstetigkeit 507 Formel von Ascoli 84 Fourierkoeffizienten 145, 315 Fourierreihen 145–150, 189, 190, 235, 254, 307, 465 zuf¨ allige 315 Fouriertransformation 210–218, 238, 253, 434–436, 460 Fourier-PlancherelTransformation 216 Fr´echet, M. 43, 134, 250, 500 Fr´echet-differenzierbar 113 n-mal 122 Fr´echetraum 444 Fredholm, I. 310 Fredholmoperator 261, 484 Fredholmsche Alternative 264 Fredholmsche Integralgleichung 274 Fredholmscher Integraloperator 52 Friedrichs-Ungleichung 229 Friedrichssche Erweiterung 350, 380 Friedrichsscher Gl¨ attungsoperator 81 Fundamentallemma der Variationsrechnung 124 Funktion absolutstetige 492 affine 128, 440 der 1. Baireklasse 186 fastperiodische 251 Fr´echet-differenzierbare 113 Gˆ ateaux-differenzierbare 113
gleichm¨ aßig stetige 503 halbstetige 124, 509 integrierbare 491, 498 konvexe 128, 442 langsam wachsende 442 lokal integrierbare 430 meßbare 489 nirgends differenzierbare 139 schnell fallende 211 Schwartzfunktion 211 stetige 501, 507 Testfunktion 207, 430 Funktional halbstetiges 124 koerzitives 124 komplex-lineares 96 konvexes 125 Minkowskifunktional 101 normannehmendes 84, 450 stetiges 45, 401 sublineares 93 unstetiges 80 Funktionalkalk¨ ul 319, 324, 378, 389, 469 Gans 88 Gˆ ateaux, R. 134 Gˆ ateaux-differenzierbar 113 Gδ -Menge 138 Gelfand, I. M. 449, 480 Gelfandraum 463 Gelfandscher Darstellungssatz 464 Gelfandscher Dreier 448 Gelfandtransformation 463 gerichtete Menge 506 glatt 119 gleichgradig integrierbar 450 gleichgradig stetig 68 gleichm¨ aßig konvex 38, 170 GNS-Konstruktion 471–474 Gram-Schmidt-Verfahren 231 Graph 154 Graphennorm 156 Greensche Funktion 312, 446 Grothendieck, A. 88, 313, 444, 446 Grundl¨ osung 433, 447 Haarfunktionen 245
526 Haarmaß 253, 457 Hahn, H. 40, 131 Hahn-Jordan-Zerlegung 497 halbeinfach 465, 481 Halbnorm 1, 400 halbnormierter Raum 1 Hamiltonoperator 387 Hammerstein-Operator 179 Hardyraum 246 harmonische Analyse 253–254, 457 H¨ aufungspunkt 500 Hauptraum 303 Hausdorff, F. 500 Hausdorffraum 508 Hausdorff-Young-Ungleichung 217, 248 Helly, E. 40, 131 Hermitepolynome 242 Hilbert, D. 40, 87, 132–133, 136, 249, 311, 383 Hilbertraum 202 Hilbertraumdimension 236 Hilbert-Schmidt-Operator 296 Hilberttransformation 90 H¨ oldersche Ungleichung 10, 15, 20 Homomorphismus 459 ∗ -Homomorphismus 466 Hom¨ oomorphismus 508 hypoelliptisch 447 Ideal 338, 339, 461 echtes 461 maximales 461 Index 261, 484 Indikatorfunktion 490 infinitesimaler Erzeuger siehe Erzeuger initiale Topologie 411 innerer Punkt 499 Inneres einer Menge 500, 505 inneres Produkt 201 Integral banachraumwertiger Funktionen 365 Integralgleichungen 57–58, 265, 274–284 Integraloperator 51–54, 67, 70, 109, 238, 289, 300 Fredholmscher 52
Namen- und Sachverzeichnis
schwach singul¨ arer 53, 85, 90, 283 singul¨ arer 90 Volterrascher 85, 265 Interpolationssatz von Marcinkiewicz 92 Riesz-Thorin 73 invarianter Unterraum 313 Involution 465 Isometrie 55 partielle 273 isometrisch 55 isomorph 55, 133 Isomorphismus 55, 129 ∗ -Isomorphismus 466 Jamesraum 36 Kategorie von erster 138 von zweiter 138 Kern eines Integraloperators 52 positiv semidefiniter 309 Kernlemma 409 Kernsatz 445 Kettenregel 120 koerzitive Bilinearform 245 koerzitives Funktional 124 Kolmogorovsches Normierbarkeitskriterium 437 kompakter Operator siehe Operator, kompakter kompakter Raum 503 kompakter Tr¨ ager 327, 443 komplementiert 163, 252 konjugiert linear 226 konjugierter Exponent 62 Kontraktion strikte 164 Kontraktionshalbgruppe 361 konvergente Folge 500, 506 konvergentes Netz 507 Konvergenz absolute 16, 233 schwache siehe schwache Konvergenz unbedingte 232, 233, 245, 251 Konvergenzsatz von Lebesgue 496
527
Namen- und Sachverzeichnis
konvexe Funktion 128, 442 H¨ ulle 412 abgeschlossene 412 Menge 101 konvexes Funktional 125 K¨ othe, G. 444 kreisf¨ ormig 394 Kuchen 427
Metrik 499 metrischer Raum 499 kompakter 503 vollst¨ andiger 502 metrisierbar 439, 505 Minkowskifunktional 101 Minkowskische Ungleichung 12, 15 Mittelwertsatz 120 Multiindex 7
Laplaceoperator 228, 349, 363, 433 Lebesgue, H. 486 Lebesgueintegral 491 Lebesguemaß 488 Legendrepolynome 241 Leibnizformel 243 Lemma von Ehrling 86 Farkas 440 Schur 133 Sobolev 218, 252 Tong 509 Zabre˘ıko 190 Leray-Schauder-Prinzip 192 (LF)-Raum 445 lokal gleichm¨ aßig konvex 130 lokalkompakter Raum 509 lokalkonvexer Raum 396 metrisierbarer 439 normierbarer 437 nuklearer 446, 449 tonnelierter 444 Lyapunovsche Ungleichung 38, 72
Nemytski˘ı-Operator 179 Netz 506 universelles 510 Neumannsche Reihe 56, 88, 458 Nichtkompaktheitsmaß 181, 199 nirgends dicht 138 nirgends differenzierbare Funktion 139 Norm 1 aquivalente 24, 25, 83, 153 ¨ feinere 49 Fr´echet-differenzierbare 117, 119, 130, 135, 246 Gˆ ateaux-differenzierbare 117, 130, 135 gleichm¨ aßig konvexe 38, 170 gr¨ obere 49 Hilbert-Schmidt-Norm 296 lokal gleichm¨ aßig konvexe 130 nukleare 285 strikt konvexe 37, 127, 130, 170, 420 wesentliche 466 normale Struktur 196 normaler Operator 237 normaler topologischer Raum 508 normales Element einer Banachalgebra 467 normierter Raum 1 normstetige Halbgruppe 358 nuklearer Operator 284 nuklearer Raum 446, 449 Nullumgebungsbasis 395 numerischer Wertebereich 318, 381
Mackey-Topologie 440 Maß 493 absolutstetiges 498 atomfreies 425 a ¨ußeres 63, 489 Borelmaß 32 endliches 493 komplexes 497 regul¨ ares 32 σ-endliches 493 signiertes 497 Maßraum 493 maximaler Ideal-Raum 463 Mazur, S. 43, 131–133, 135, 479
Observable 387, 483 offene Abbildung 151 offene Menge 499, 505
528 Operator siehe auch Abbildung, Differentialoperator, Integraloperator abgeschlossener 154, 343 abschließbarer 382 absolut 2-summierender 316 adjungierter 109, 236, 342, 432 akkretiver 375 beschr¨ ankter 46 dicht definierter 341 dissipativer 375 endlichdimensionaler 67 Erweiterung 341 Fredholmoperator 261, 484 halbbeschr¨ ankter 350 Hilbert-Schmidt-Operator 296 hypermaximaler 384 kompakter 66, 79, 111, 267, 269 endlichdimensionale Approximation 70, 87, 274 normaler 237 unbeschr¨ ankter 385 nuklearer 284 positiver 143, 247, 272, 278 schwach kompakter 438 sektorieller 391 selbstadjungierter 237, 342 stetige Fortsetzung 48, 129, 134, 164 stetiger 45, 401 strikt singul¨ arer 190 symmetrischer 342 Toeplitz-Operator 479, 484 unit¨ arer 237 vollstetiger 87, 133 wesentlich selbstadjungierter 344 Operatorgruppe 81, 382 Operatorhalbgruppe analytische 391 normstetige 358, 392 stark stetige 358 Operatornorm 47 Ordnung einer Distribution 430 Orlicz, W. 43 Orliczraum 39 orthogonal 222
Namen- und Sachverzeichnis
Orthogonalprojektion 224 Orthonormalbasis 230 Orthonormalsystem 230 Parallelogrammgleichung 203 Parametrix 484 Parsevalsche Gleichung 234 partiell stetig 187 partielle Integration 242 partielle Isometrie 273 Plancherelgleichung 216 Poincar´e-Ungleichung 229 Polare 411 Polarisierung 239 Polarzerlegung 273, 334 positiv definit 201 positives Element einer C ∗ -Algebra 470 Pr¨ ahilbertraum 202 Prinzip der gleichm¨ aßigen Beschr¨ anktheit 141 Prinzip der lokalen Reflexivit¨ at 453 Prinzip der Verdichtung der Singularit¨ aten 189 Produktmaß 495 Produkttopologie 512 Projektion 161, 224 Projektionssatz 223, 224 Punktspektrum 256 Quadraturformeln 144 Quantenmechanik 386–388, 483 Quaternionen 477 Quotientenabbildung 54–56, 190 Quotientennorm 34 Quotientenraum 34 Rademacherfunktionen 245 Radikal 465 Rand einer Menge 500, 506 reflexiv 105, 173, 417 lokale Reflexivit¨ at 453 regul¨ ares Maß 32 relativkompakt 66 Relativtopologie 508 reproduzierender Kern 244 Resolventenabbildung 255, 352, 369, 458 Resolventengleichung 306
Namen- und Sachverzeichnis
Resolventenmenge 255, 352, 369, 458 Restspektrum 256 Riesz, F. 40–41, 87–89, 131–133, 250, 312, 383, 388 Riesz, M. 91 Rieszscher Darstellungssatz 62, 89, 127 Rieszsches Lemma 27, 39 Saks, S. 193 Satz u ¨ ber implizite Funktionen 121 Satz vom abgeschlossenen Bild 159, 380, 451 Satz vom abgeschlossenen Graphen 157, 444 Satz vom Kern 445 Satz von der dominierten Konvergenz siehe Satz von Lebesgue Satz von der monotonen Konvergenz siehe Satz von Beppo Levi Satz von der offenen Abbildung 152, 157, 444 Satz von Alaoglu 414 Alaoglu-Bourbaki 413 Arzel` a-Ascoli 68 Atkinson 484 Baire 137, 138 Banach-Dieudonn´e 417 Banach-Mazur 129 Banach-Saks 227 Banach-Steinhaus 141 Banach-Stone 452 Beppo Levi 496 Bessaga-Pe lczy´ nski 451 Bishop-Phelps 450 Carleson 149 Choquet 452 Courant 307 Datko-Pazy 391 de Leeuw-Kahane-Katznelson 316 Dini 278 Dunford 308 Dvoretzky-Rogers 233 Eberlein-Shmulyan 450
529 Ehrenpreis-Malgrange 447 Fej´er 149 Fischer-Riesz 236 Fr´echet-Riesz 226 Friedrichs-Stone 350 Fubini 494 Gelfand 464 Gelfand-Kostyuchenko 449 Gelfand-Mazur 458 Gelfand-Naimark kommutativer 468 nichtkommutativer 474 Gluskin 90 Goldstine 417 Hahn-Banach 94, 97, 103, 104, 244, 406, 407 Hellinger-Toeplitz 238 Helly-Bray 450 Hille-Yosida 370, 373, 391 Jackson 44 James 450 John 90 Johnson 481 Johnson-K¨ onig-MaureyRetherford 315 Kadets-Snobar 194 Koml´ os 251 Kondrachev 253 Korovkin 143, 144 Krein-Milman 422 Krein-Shmulyan 414 Lax-Milgram 244 Lebesgue 496 Lidski˘ı 316 Lindenstrauss-Tzafriri 252 Lomonosov 313 Lumer-Phillips 376 Lyapunov 426 Mackey-Arens 440 Marcinkiewicz 92 Mazur-Ulam 83 Mercer 276 Milman 423 M¨ untz-Sz´ asz 44 Paley-Zygmund 315 Peano 181 Pe lczy´ nski 195
530 Satz von (Forts.) Peter-Weyl 254 Pitt 133 Pythagoras 223 Radon-Nikod´ ym 498 Rellich Einbettungssatz 220, 253 St¨ orungssatz 388 Riesz siehe Rieszscher Darstellungssatz, Rieszsches Lemma, Satz von Fischer-Riesz, Satz von Fr´echet-Riesz, Satz von Riesz-Schauder Riesz-Schauder 261 Riesz-Thorin 73 Schauder 111 Schur 133 Schwartz 445 Sobczyk 194 Sobolev 218, 252 Steinitz 251 Stone 383 Stone-Weierstraß 425 Szeg˝ o 144 Taylor 122 Tietze-Urysohn 502, 509 Tikhonov 512 Toeplitz 158 Weierstraß siehe Weierstraßscher Approximationssatz Wiener 465 Schattenklassen 313 Schauder, J. 43, 133, 193 Schauderbasis 188–189, 254 Schmidt, E. 40, 87, 249, 311, 384 schnell fallend 211 Schottisches Buch 43, 88, 132, 252 Schr¨ odingergleichung 387 schwach singul¨ ar siehe Integraloperator, schwach singul¨ arer schwache Ableitung 208, 432 schwache Kompaktheit 417, 450 schwach∗ -Kompaktheit 413–414 schwache Konvergenz 106, 133, 142, 186–187, 227, 242
Namen- und Sachverzeichnis
schwache L¨ osung 230 schwache Operatortopologie 398 schwache Topologie 397, 398, 409 schwach∗ -Topologie 398, 409 Schwartz, L. 253, 313, 444, 445, 448 Schwartzfunktion 211 Schwartzraum 211, 397 Schwerpunkt 441 Seite 418 selbstadjungiert 237, 342, 467 separabel 28 sesquilinear 201 Shiftoperator 109, 238 Shmulyan, V. L. 135, 449 σ-additiv 493 σ-Algebra 487, 488 σ-endlich 493 singul¨ are Zahlen 273 Skalarprodukt 201 Sobolev, S. L. 252, 448 Sobolevr¨ aume 92, 208, 222 Spaltensummennorm 82 Spektralabbildungssatz 321, 378, 389, 391 Spektralmaß 327 Spektralradius 259, 458 Spektralsatz f¨ ur beschr¨ ankte Operatoren 331, 335, 340, 469 f¨ ur kompakte Operatoren 269, 271, 276 f¨ ur unbeschr¨ ankte Operatoren 354, 357 Spektralschar 385 Spektralschranke 391 Spektrum einer kommutativen Banachalgebra 463 eines Elements einer Banachalgebra 458 eines Operators 255, 352, 369 absolutstetiges 386 singul¨ ar-stetiges 386 stetiges 256, 386 wesentliches 484 Spur 293 Spurklasse siehe nuklearer Operator
531
Namen- und Sachverzeichnis
stark stetige Halbgruppe 358 starke Operatortopologie 398 Steinhaus, H. 89, 193 Stone, M. H. 250, 383 ˇ Stone-Cech-Kompaktifizierung 481 St¨ orungssatz 388, 392 strikt konvex 37, 127, 170, 420 strikter induktiver Limes 445 Sturm-Liouville-Problem 312 sublinear 93 Summierbarkeitsmethoden 158 Supremumsnorm 3 wesentliche 20 Teilnetz 510 Testfunktion 207, 430 Thorin, G. O. 91 Toeplitz-Operator 479, 484 tonneliert 444 Topologie 500, 505 feinere 402 gr¨ obere 402 topologisch direkte Zerlegung 161 topologischer Raum 505 kompakter 503, 511 metrisierbarer 505 normaler 508 topologischer Vektorraum 396 totalbeschr¨ ankt 503 Tr¨ ager 80, 207, 327, 443 Trennungssatz 103, 104, 244, 407 Treppenfunktion 490 treue Darstellung 474 trigonometrisches Polynom 150 Trotter-Formel 392 Ulam, S. 42 Umgebung 499, 506 Umgebungsbasis 506 unbedingte Konvergenz 232, 233, 245, 251 unit¨ ar 237 universelle Darstellung 475 Unterraum 4, 24
invarianter 313 komplementierter 163, 252 Variation 22, 497 Variationsnorm 22 Variationsrechnung 123 direkte Methode der 124 Vektorzustand 470 verallgemeinerte Ableitung 208, 432 Verdichtung der Singularit¨ aten 189 Vervollst¨ andigung 3, 105 Vielfachheit algebraische 303 geometrische 270 Vollst¨ andigkeit 2, 444, 502 Volterrascher Integraloperator 85, 265 von Neumann, J. 193, 250, 252, 313, 383–386, 444, 482 von-Neumann-Algebra 482 Wachstumsschranke 361, 391 Wahrscheinlichkeitsmaß 493 W ∗ -Algebra 482 Wavelet 254 Weierstraßscher Approximationssatz 29, 43, 143 zweiter 150 wesentlich selbstadjungiert 344 wesentlicher Bereich 382 Weyl, H. 249, 314, 383 Weylsche Ungleichung 305, 314 Weylsches Lemma 230 Wiener, N. 40–42, 479 Wieneralgebra 456 Youngsche Ungleichung 78 Zeilensummennorm 82 Zornsches Lemma 95 zuf¨ allige Fourierreihen 315 Zustand 386, 470, 483 zyklischer Vektor 335
Ich habe bemerkt“, sagte Herr K., daß wir viele abschrecken von ” ” unserer Lehre dadurch, daß wir auf alles eine Antwort wissen. K¨ onnten wir nicht im Interesse der Propaganda eine Liste der Fragen aufstellen, die uns ganz ungel¨ ost erscheinen?“
B. Brecht, Geschichten vom Herrn Keuner1 1 Gesammelte
Werke, Band 12, S. 382. Suhrkamp-Verlag 1967.