323 94 5MB
German Pages 847 Year 2009, 2010
Springer-Lehrbuch
Karl-Heinz Goldhorn Hans-Peter Heinz Margarita Kraus
Moderne mathematische Methoden der Physik Band 1
123
Dr. Karl-Heinz Goldhorn Johannes Gutenberg-Universität Mainz FB 08, Institut für Mathematik Staudingerweg 9 55099 Mainz Deutschland Prof. Dr. Hans-Peter Heinz Universität Mainz FB 08, Institut für Mathematik Staudingerweg 9 55099 Mainz Deutschland [email protected] PD Dr. Margarita Kraus Universität Mainz FB 08, Institut für Mathematik Staudingerweg 9 55099 Mainz Deutschland
ISSN 0937-7433 ISBN 978-3-540-88543-6 e-ISBN 978-3-540-88544-3 DOI 10.1007/978-3-540-88544-3 Springer Dordrecht Heidelberg London New York Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. © Springer-Verlag Berlin Heidelberg 2009 Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Satz und Herstellung: le-tex publishing services GmbH, Leipzig Einbandentwurf: WMXDesign GmbH, Heidelberg Gedruckt auf säurefreiem Papier Springer ist Teil der Fachverlagsgruppe Springer Science+Business Media (www.springer.de)
Für Christel und Lin und Bernhard, ohne deren Geduld und Unterstützung dies nicht möglich gewesen wäre.
Vorwort
In der Literatur über das mathematische Handwerkszeug des theoretischen Physikers scheint eine Lücke zu klaffen: Einerseits gibt es eine Reihe von hervorragenden Lehrbüchern zum Thema „Mathematik für Physiker“ für das Grundstudium, andererseits gibt es eine Fülle von ausgezeichneten Monographien über die mathematischen Grundlagen diverser physikalischer Theorien, meist verfasst von bekannten Fachvertretern aus der mathematischen Physik. Wir denken hier an Werke wie etwa [2,7,12,18,26,31,34,38,53,63–66,73–76,94,95] oder auch Klassiker wie [61,98] oder [105]. Was uns aber zu fehlen scheint, ist ein Verbindungsstück zwischen diesen beiden Extremen, also ein Aufbaukurs, der es Studierenden im Hauptstudium oder graduierten Theoretikern erlaubt, mit begrenztem Aufwand einen fundierten Einstieg in die mathematischen Grundlagen der fortgeschrittenen Theorien zu gewinnen. Das zweibändige Werk, dessen erster Band hier vorliegt, versucht, diese Lücke zu schließen. Es beruht zum größten Teil auf Vorlesungen, die die Autoren in Mainz und Regensburg für Studierende der Physik im Hauptstudium gehalten haben. Als potentiellen Leserkreis haben wir aber nicht nur diese im Auge, sondern auch Studierende von Master-, Aufbau-, Graduierten- und Promotionsstudiengängen im Bereich der Physik, außerdem angehende mathematische Physiker, die von der Physik herkommen und möglichst zügig den Einstieg in die rigoros mathematische Behandlung der Probleme gewinnen möchten, und nicht zuletzt alle diejenigen unter den aktiven theoretischen Physikern, die das Bedürfnis verspüren, ein tieferes und klareres Verständnis ihrer mathematischen Werkzeuge zu gewinnen, dabei aber (verständlicherweise!) weder Zeit noch Muße finden, sich mit der mathematischen Fachliteratur und all ihren Beweisdetails ausführlich auseinanderzusetzen. Bei der großen und ständig wachsenden Vielfalt mathematischer Hilfsmittel, die in der modernen Physik Verwendung finden, war es natürlich nicht möglich, alle wichtigen Themen vollständig abzudecken, und, wie immer, bleibt die Stoffauswahl etwas subjektiv geprägt und ist von den Interessen und der wissenschaftlichen Ausrichtung der Autoren mitbestimmt. So wurden z. B. die statistische Physik und die nichtlineare Dynamik zugegebenermaßen stiefmütterlich behandelt. Im ersten Teil geben wir eine Einführung in die Differentialgeometrie – und damit auch in die moderne Formulierung der Tensorrechnung – als mathematische Grundlage für die klassische Mechanik, die klassische Feldtheorie und vor allem für die Relativitätstheorie. Die Präsentation ist hier insofern elementar gehalten, als dass affine Zusammenhänge nur in Gestalt ihrer kovarianten Ableitungsoperatoren auftreten und vii
viii
Vorwort
dass allgemeine Bündeltheorie und Prinzipalzusammenhänge gänzlich außen vor bleiben. Trotzdem reicht diese Einführung aus, um darauf aufbauend einen zwanglosen Einstieg in die moderne Gravitationsphysik oder die aktuellen Eichtheorien zu ermöglichen. Der zweite Teil befasst sich mit mathematischen Grundlagen der Quantenmechanik, die der Funktionalanalysis, der Integrationstheorie und der Distributionstheorie entstammen. Wiederum sind wir überzeugt, dass die Beschäftigung mit den hier vorgestellten Grundlagen einen leichten Zugang zu verschiedenen weiterführenden Themen ermöglicht, z. B. zur algebraischen Quantenfeldtheorie, zur Theorie der Pfadintegrale oder zur Verwendung von C -Algebren in der statistischen Physik. Allerdings mussten zwei der wichtigsten funktionalanalytischen Themen aus Platzgründen in den zweiten Band verlegt werden, nämlich die unbeschränkten Operatoren und die Spektralzerlegung von H ERMITEschen Operatoren. Den Abschluss des zweiten Bandes wird dann eine gründliche, doch recht elementare Diskussion von Gruppen und ihren Darstellungen im Hinblick auf ihre Rolle als mathematische Beschreibung von Symmetrien und Invarianzen in der Quantenphysik bilden. Den Schluss dieses ersten Bandes bildet ein Anhang, den Prof. V. Bach (Mainz) dankenswerterweise beigesteuert hat und in dem an einem konkreten Beispiel aufgezeigt wird, wie gewisse weiterführende Konzepte der allgemeinen Maß- und Integrationstheorie in der statistischen Physik Verwendung finden. Ferner behandeln wir im ersten Teil als Anwendung des dort entwickelten differentialgeometrischen Kalküls koordinatenfreie Formulierungen der klassischen Mechanik, der M AXWELLgleichungen und der E INSTEINschen Feldgleichungen. In den Teilen II bis IV verzichten wir jedoch weitgehend auf konkrete physikalische Beispiele und beschränken uns hier auf Andeutungen. Wir gehen vielmehr davon aus, dass die behandelten mathematischen Themen dem Leser schon in irgendeiner Form bei seiner Beschäftigung mit Physik untergekommen sind (oder noch unterkommen werden) und betrachten es als unsere Aufgabe, die uns Mathematikern antrainierte rigorose Denkweise dazu zu nutzen, von den entsprechenden Begriffen und Resultaten ein klares, unzweideutiges Bild zu geben. Der Bezug zur Physik spiegelt sich hier vorwiegend in der Stoffauswahl wieder – so stehen z. B. bei unserer Einführung in die Funktionalanalysis die H ILBERTräume deutlich im Vordergrund, da sie in der Physik eine ungleich größere Rolle spielen als andere topologische Vektorräume, und in Teil IV werden wir uns selbstverständlich auf diejenigen konkreten Gruppen konzentrieren, die für die Betrachtung von Symmetrien und Invarianzen in der Physik relevant sind. Die gerade angesprochene streng mathematische Denkweise darf natürlich nicht dazu verleiten, alles detailliert beweisen zu wollen, wie man das bei einem Lehrbuch für angehende Mathematiker tun würde. Vielmehr haben wir uns – ähnlich wie bei unserem Grundkurs [36], in dem das hier vorliegende Buch auch schon angekündigt wurde – von dem Gedanken leiten lassen, dass ein mathematischer Beweis nur dann angebracht ist, wenn er gleichzeitig eine Rechentechnik demonstriert und einüben hilft, die bei den physikalischen Anwendungen wirklich vorkommt. Häufig ist die Beweistechnik, die für ein tieferliegendes mathematisches Resultat benötigt wird, jedoch von ganz anderem Charakter als die Technik seiner Anwendung, und in sol-
Vorwort
ix
chen Fällen beschränken wir uns auf eine bloße Skizze der maßgeblichen Ideen oder sogar auf ein Literaturzitat, das als Quellennachweis zu verstehen ist und nicht unbedingt als eine Aufforderung, sich mit der betreffenden Literatur aktiv auseinanderzusetzen. Auch im Übrigen verfolgen wir ähnliche didaktische Prinzipien wie sie schon in [36] zugrunde gelegt wurden, versuchen also, uns auf das Wesentliche zu konzentrieren, Langatmigkeit zu vermeiden und in wenigen wohlgesetzten Worten ein klares Bild von den Dingen zu vermitteln. Unterstützt wird dieses Bemühen durch eine große Zahl von Übungsaufgaben. Sie dienen teilweise dem Einüben von Rechentechniken, der Gewöhnung an abstrakte Begriffe, indem man diese an konkreten Beispielen diskutiert, und hier und da auch der kurzgefassten Behandlung von zusätzlichem Stoff. Zahlreiche Hinweise unterstützen die Lösung der Übungsaufgaben, so dass die erfolgreiche Behandlung einer Aufgabe nicht daran scheitern sollte, dass einem ein bestimmter raffinierter Trick gerade nicht eingefallen ist. Trotz der vielen verschiedenen mathematischen Sachgebiete (und trotz dreier verschiedener Autoren) haben wir versucht, generell einheitliche Notationen durchzuhalten, und die meisten dieser Bezeichnungen sind in einem vorbereitenden Abschnitt zusammengefasst und mit kurzen Erläuterungen versehen. Dies hat uns auch Gelegenheit gegeben, einige der benötigten Vorkenntnisse anzusprechen. Grundsätzlich sollte das Buch für alle zugänglich sein, die einen dreisemestrigen mathematischen Grundkurs für Physiker absolviert haben, wie er in Deutschland weitgehend üblich ist. Man wird uns nachsehen, dass wir bei Verweisen auf solche Vorkenntnisse unser eigenes Lehrbuch [36] zitieren, und wir sind überzeugt, dass niemandem, der seine Vorkenntnisse aus anderer Quelle bezieht, hieraus ein Nachteil erwächst. Schließlich möchten wir Professor Volker Bach unseren gebührenden Dank aussprechen, nicht nur für den von ihm beigesteuerten Artikel über unendliche Produkte von Maßen und statistische Mechanik, sondern auch für viele hilfreiche, interessante und bereichernde Gespräche. Unser Dank gilt überdies Professor Florian Scheck, der die Entstehung auch dieses Werkes mit Unterstützung und Ermutigung begleitet hat. Martin Huber hat kompetent und zuverlässig die Zeichnungen angefertigt, und das Umsetzen der Manuskripte in LaTeX-Quelltext wurde in ebenso kompetenter und zuverlässiger Weise von Renate Emerenziani und Ulrike Jacobi besorgt. Ihnen allen gilt unser aufrichtiger Dank. Mainz, Mai 2009
Karl-Heinz Goldhorn Hans-Peter Heinz Margarita Kraus
Inhaltsverzeichnis
Vorkenntnisse und generell verwendete Bezeichnungen . . . . . . . . . . . . . . . . . xvii Teil I Tensoranalysis und Differentialformen 1
Mannigfaltigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 A Grundlagen aus der Topologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 B Mannigfaltigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 C Tangentialraum und Differential . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2
Multilineare Algebra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A Dualität bei endlich dimensionalen Vektorräumen . . . . . . . . . . . . . . . B Multilineare Abbildungen und Tensoren . . . . . . . . . . . . . . . . . . . . . . . C Alternierende und symmetrische Abbildungen und Tensoren . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33 33 37 42 51
3
Tensorfelder und Differentialformen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A Tensorfelder auf Mannigfaltigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . B Alternierende k-Formen und Orientierungen . . . . . . . . . . . . . . . . . . . . C R IEMANNsche und L ORENTZsche Metriken . . . . . . . . . . . . . . . . . . . . D Flüsse und L IE-Ableitungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
53 54 59 64 67 72
4
Integration und Differentiation von Differentialformen . . . . . . . . . . . . . 77 A Zerlegung der Einheit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 B Mannigfaltigkeiten mit Rand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 C Integration auf Mannigfaltigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 D Die C ARTANsche Ableitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 E C ARTAN-Kalkül auf R IEMANNschen Mannigfaltigkeiten und klassische Vektoranalysis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 F Die M AXWELLschen Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 G Der allgemeine Satz von S TOKES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 xi
xii
Inhaltsverzeichnis
H Das P OINCARÉ Lemma. Potentiale und Vektorpotentiale . . . . . . . . . 110 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 5
Geodätische und Krümmung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 A Krümmung von Kurven in Untermannigfaltigkeiten des Rn . . . . . . . 121 B Krümmung von Hyperflächen des Rn . . . . . . . . . . . . . . . . . . . . . . . . . . 126 C Die kovariante Ableitung auf Untermannigfaltigkeiten des Rn . . . . . 129 D Die kovariante Ableitung auf Mannigfaltigkeiten . . . . . . . . . . . . . . . . 135 E Die kovariante Ableitung auf pseudo-R IEMANNschen Mannigfaltigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140 F Geodätische auf pseudo-R IEMANNschen Mannigfaltigkeiten . . . . . . 144 G Krümmung von pseudo-R IEMANNschen Mannigfaltigkeiten . . . . . . 150 H Die E INSTEINschen Gleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 161
6
Koordinatenfreie Formulierungen der klassischen Mechanik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 A Tangential- und Kotangentialbündel . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 B E ULER-L AGRANGEgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 C Symplektische Mannigfaltigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 D Der H AMILTONformalismus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 E Der L AGRANGEformalismus und die L EGENDREtransformation . . . 188 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194
Teil II Funktionalanalysis und Integrationstheorie 7
BANACH- und H ILBERTräume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 A Definitionen und Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 B Endlich-dimensionale normierte lineare Räume . . . . . . . . . . . . . . . . . 210 C Orthogonales Komplement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 D Vervollständigung von normierten linearen Räumen . . . . . . . . . . . . . . 215 E Tensorprodukt von H ILBERTräumen . . . . . . . . . . . . . . . . . . . . . . . . . . . 216 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221
8
Beschränkte lineare Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 A Beschränkte lineare Operatoren und Funktionale . . . . . . . . . . . . . . . . 225 B Beschränkte lineare Funktionale auf normierten linearen Räumen . . 233 C Beschränkte Formen auf H ILBERTräumen und der adjungierte Operator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235 D H ERMITEsche und unitäre Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . 239 E Projektionsoperatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242 F Beispiel: F OURIERtransformation und F OURIER -P LANCHEREL-Operator . . . . . . . . . . . . . . . . . . . . . . . . 245 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
Inhaltsverzeichnis
9
xiii
Einführung in die Spektraltheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261 A Spektrum und Resolvente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 262 B Spektrum beschränkter selbstadjungierter und unitärer Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268 C Kompakte Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272 D Spektrum kompakter Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276 E F REDHOLMsche Integralgleichungen . . . . . . . . . . . . . . . . . . . . . . . . . . 283 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
10 Maß und Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299 A Abstrakte Maßräume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300 B Konstruktion von nichttrivialen Maßräumen . . . . . . . . . . . . . . . . . . . . 305 C Messbare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 313 D Das Integral für nichtnegative messbare Funktionen . . . . . . . . . . . . . . 316 E Summierbare Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323 F Die Rolle der stetigen Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333 G Produktmaße und iterierte Integrale . . . . . . . . . . . . . . . . . . . . . . . . . . . 338 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344 11 Distributionen und temperierte Distributionen . . . . . . . . . . . . . . . . . . . . 349 A Testfunktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350 B Distributionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 355 C Reguläre Distributionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359 D Lokalisierung und Träger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362 E Konvergente Folgen von Distributionen . . . . . . . . . . . . . . . . . . . . . . . . 365 F Substitution und Differentiation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 368 G F OURIERtransformation von Distributionen . . . . . . . . . . . . . . . . . . . . 372 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 377 12 Einige spezielle Distributionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385 A Distributionen nullter Ordnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 386 B Schichten und mehrfache Schichten . . . . . . . . . . . . . . . . . . . . . . . . . . . 389 C Regularisierung divergenter Integrale und H ADAMARDscher Hauptwert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401 D Der C AUCHYsche Hauptwert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407 E Regularisierung mittels analytischer Fortsetzung . . . . . . . . . . . . . . . . 410 F Berechnung einiger F OURIERtransformierter . . . . . . . . . . . . . . . . . . . 418 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 425 13 Tensorprodukt und Faltung von Distributionen . . . . . . . . . . . . . . . . . . . . 429 A Tensorprodukt von Distributionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429 B Faltung von Distributionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433 C F OURIERtransformation von Tensor- und Faltungsprodukt . . . . . . . . 437 D Anwendungen auf lineare Differentialgleichungen . . . . . . . . . . . . . . 439 Aufgaben . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 450
xiv
Inhaltsverzeichnis
Unendliche Produkte von Maßen und Statistische Mechanik von V. Bach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453 Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 463 Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 467
Inhaltsverzeichnis
Inhalt des zweiten Bandes Teil III: Unbeschränkte Operatoren und Spektralzerlegung 14 15 16
Unbeschränkte Operatoren Spektralmaße Der Spektralsatz für selbstadjungierte Operatoren und die quantenmechanische Dynamik
Teil IV: Gruppen und Darstellungen 17 18 19 20 21 22 23 24
SO.3/ und L ORENTZgruppe Universelle Überlagerung von SO.3/ und L L IE-Gruppen und ihre L IE-Algebren Grundbegriffe der Darstellungstheorie Irreduzible Darstellungen kompakter Gruppen Darstellungen von L IE-Algebren Die irreduziblen Darstellungen von SU.2/ Anwendungen auf die Quantenmechanik
xv
Vorkenntnisse und generell verwendete Bezeichnungen
Wir erinnern hier an einige Begriffe Bezeichnungen und einfache Tatsachen, die Ihnen aus Ihrer bisherigen Beschäftigung mit Mathematik vertraut sein sollten und die im gesamten Buch durchweg benutzt werden. Die verwendeten Bezeichnungen stimmen mit der in unserem Lehrbuch [36] verwendeten Notation überein, sind jedoch auch sonst in der mathematischen Analysis und mathematischen Physik allgemein verbreitet.
Logische Verknüpfungen Für logische Zusammenhänge werden wir hier und da die gängigen Zeichen H), (H und ” benutzen. Sind A, B Aussagen, so bedeutet also A H) B A (H B A ” B
Aus A folgt B , A folgt aus B , A genau dann, wenn B.
Logische Quantoren Die Ausdrücke „für alle“ und „es gibt“, mit denen mathematische Aussagen häufig qualifiziert werden, nennt man logische Quantoren. Zuweilen werden wir für sie die abkürzenden Schreibweisen 8 9
statt „für alle“, verwenden. statt „es gibt“
Zahlbereiche Es bezeichnet N N0
die Menge der natürlichen Zahlen (ohne die Null) die Menge der natürlichen Zahlen mit Null xvii
xviii
Vorkenntnisse und generell verwendete Bezeichnungen
Z Q R C
die Menge der ganzen Zahlen die Menge der rationalen Zahlen die Menge der reellen Zahlen die Menge der komplexen Zahlen
Der Skalarbereich K Da wir zumeist Situationen betrachten, in denen reelle und komplexe Skalare gleichberechtigt nebeneinander stehen, verwenden wir die übliche Bezeichnung K für den Skalarenkörper. Es ist also K D R oder D C, und ein K-Vektorraum ist ein reeller oder ein komplexer Vektorraum.
Mengentheoretische Operationen Für Mengen A; B benutzen wir die üblichen Zeichen: A[B A\B AnB AB AB AB
Vereinigung Schnittmenge A ohne B kartesisches Produkt A ist Teilmenge von B A umfasst B
Hat man mehrere (eventuell unendlich viele) Mengen, so kann man diese als Familie .Ai /i 2I schreiben, wobei der Index i eine geeignete (endliche oder unendliche) Indexmenge durchläuft. Besonders beliebt sind die Indexmengen I D f1; 2; : : :; ng und I D N. Dann schreibt man [ i 2I
Ai
bzw.
n [
Ai
bzw.
i D1
1 [
Ai
i D1
für die Vereinigung von allen Mengen aus der Familie. Analog für den Durchschnitt oder das kartesische Produkt.
Intervalle Wir geben Intervalle auf der (erweiterten) reellen Geraden grundsätzlich mittels eckiger Klammern an. Für 1 a b C1 ist also Œa; b D fx j a x bg ; Œa; bŒ D fx j a x < bg ; a; b D fx j a < x bg ; a; bŒ D fx j a < x < bg :
Vorkenntnisse und generell verwendete Bezeichnungen
xix
Abbildungen Abbildungen – und damit auch Funktionen, Funktionale, Transformationen, Substitutionen, Operatoren usw., die ja eigentlich alle Abbildungen sind – werden durch Gleichungen der Gestalt y D f .x/ wiedergegeben oder auch in der Form f W A ! B W x 7! y oder f W A ! B ; x 7! y : Die Einschränkung einer Abbildung f W A ! B auf eine Teilmenge C A wird mit f jC bezeichnet. Die Komposition (D Zusammensetzung D Hintereinanderausführung) zweier Abbildungen f; g schreiben wir manchmal als g ıf . Dies bedeutet, dass man zuerst f ausführt und dann g auf das Ergebnis anwendet. Die identische Abbildung, die zur Menge A gehört, wird mit id idA bezeichnet, also idA W A ! A W x 7! x :
Inklusionen Für A B bezeichnen wir mit i W A ,! B oder j W A ,! B die Abbildung A ! B, die jedes x 2 A unverändert lässt und es nur als Element von B auffasst. Solche Abbildungen nennt man Inklusionen. Obwohl sie trivial sind, sind solche Inklusionen oft ein guter bezeichnungstechnischer Trick.
Abzählbare Mengen Man bezeichnet eine beliebige Menge M als abzählbar, wenn sie als Folge M D fx1 ; x2 ; : : :g D fxn j n 2 Ng geschrieben werden kann. Die Menge Q der rationalen Zahlen ist abzählbar, die Menge R aller reellen Zahlen jedoch nicht ( [36], Ergänzungen zu Kap. 28).
Fast überall Bei Aussagen, in denen ein Punkt x 2 Rn vorkommt, sagt man, die Aussage gelte fast überall (abgekürzt „f. ü.“), wenn die Menge der Punkte, wo sie nicht gilt, eine n-dimensionale L EBESGUEsche Nullmenge ist (vgl. etwa [36], Kap. 28). Zum Beispiel ist eine Funktion fast überall stetig, wenn die Menge ihrer Unstetigkeitsstellen eine Nullmenge ist.
xx
Vorkenntnisse und generell verwendete Bezeichnungen
Komplexe Zahlen Ein Querstrich über einer komplexen Zahl bezeichnet die konjugiert komplexe Größe: a C ib D a ib für a; b 2 R. Real- und Imaginärteil werden mit Re z
bzw. Im z
bezeichnet.
Die Standardbasis Die Standardbasis ( = kanonische Basis) von Rn oder Cn wird mit .e 1 ; : : :; e n / bezeichnet. Der Vektor e k ist also das n-Tupel, das an der k-ten Stelle eine Eins und sonst Nullen hat.
Lineare Hülle Ist B eine Teilmenge eines K-Vektorraums V , so bezeichnen wir mit LH.B/ die lineare Hülle von B, d. h. die Menge aller (endlichen) Linearkombinationen von Elementen von B. Ein Vektor x 2 V gehört also genau dann zu LH.B/, wenn er in der Form N X j b j xD j D1
geschrieben werden kann, wobei N 2 N, 1 ; : : :; N 2 K sind und wobei b1 ; : : :; bN 2 B sein müssen. Die lineare Hülle ist ein linearer Teilraum (D Teilvektorraum) von V , und man nennt sie auch das lineare Erzeugnis von B oder den von B aufgespannten linearen Teilraum. Sind die Elemente von B aufgelistet, etwa in der Form B D fb1 ; : : :; bm g ; so schreibt man auch LH.b1 ; : : :; bm / für die lineare Hülle von B.
Matrizen Mit Kmn bezeichnen wir den K-Vektorraum der Matrizen mit m Zeilen und n Spalten, deren Einträge Skalare aus K sind. Mit E oder En bezeichnen wir die n-reihige Einheitsmatrix.
Vorkenntnisse und generell verwendete Bezeichnungen
xxi
Lineare Abbildungen Sind V; W zwei K-Vektorräume, so bezeichnen wir die Menge der linearen Abbildungen (= linearen Operatoren = K-Homomorphismen) T W V ! W mit HomK .V; W / oder mit LK .V; W /. Bekanntlich bilden diese ebenfalls einen KVektorraum. Im Fall V D W schreiben wir auch EndK .V / oder LK .V / für HomK .V; V / und bezeichnen die linearen Abbildungen V ! V auch als Endomorphismen von V . Dazu gehört insbesondere die identische Abbildung I D idV . Der Index K wird normalerweise bei all dem entfallen. Nur wenn der Skalarbereich spezifiziert werden muss, wird R oder C als Index eingesetzt.
Normen und Skalarprodukte Skalarprodukte schreiben wir als hxjyi oder x y, das letztere aber P nur, wenn es sich um das euklidische Skalarprodukt in Rn handelt, also x y D nkD1 xk yk . Im komplexen Fall ist das Skalarprodukt in der rechten Variablen linear, in der linken antilinear, wie in der Physik üblich. Für die euklidische Norm schreiben wir jxj D .xx/1=2 , während andere (oder nicht näher spezifizierte) Normen mit kk bezeichnet werden.
Kugeln Die abgeschlossene Kugel um den Punkt a mit dem Radius r bezeichnen wir mit Br .a/ („Ball“), die offene mit Ur .a/ oder Ur .a/ („Umgebung“). Wir verwenden diese Bezeichnungen in jedem metrischen Raum, insbesondere in jedem normierten Raum. Speziell für Rn oder Cn beziehen sie sich, sofern nichts anderes gesagt ist, auf die euklidische Metrik.
Differential und J ACOBI-Matrix Sei U Rn offen und F D .f1 ; : : :; fn / W U ! Rm eine differenzierbare Abbildung. Wir schreiben @fj JF .x/ JF .x/ WD .x/ @xk jk für die JACOBImatrix an der Stelle x 2 U . Die durch diese Matrix vermittelte lineare Abbildung Rn ! Rm ist bekanntlich die totale Ableitung oder das totale Differential von F an der Stelle x und wird ebenfalls mit JF .x/ oder JF .x/ bezeichnet. Weitere Schreibweisen hierfür sind DF .x/ dF .x/ dFx :
Kapitel 1
Mannigfaltigkeiten
Die Anfangsgründe der Differentialgeometrie, die unter Physikern und Ingenieuren meist mit dem Etikett „Tensorrechnung“ oder „Tensoranalysis“ versehen werden, bilden eines der wichtigsten mathematischen Werkzeuge für die klassische Mechanik, die Kontinuumsmechanik (Elastizitätstheorie, Strömungsmechanik) und die klassische Feldtheorie. In der Allgemeinen Relativitätstheorie und der modernen Gravitationsphysik wird die Tensoranalysis sogar zum fundamentalen mathematischen Ausdrucksmittel der ganzen Theorie. Schließlich führen gewisse Weiterentwicklungen der Tensoranalysis zu den Eichtheorien, die für die heutige Elementarteilchenphysik eine zentrale Rolle spielen. Bei unserer Einführung in diese Thematik legen wir Wert auf saubere Begriffsbildungen in einer modernen koordinatenfreien Sprache, die von Physikern und Mathematikern gleichermaßen verstanden werden kann. Die Regeln für das explizite Rechnen in Koordinaten ergeben sich dann als leichte Folgerungen und werden keineswegs vernachlässigt werden, doch gilt auch hier der Grundsatz, dass man sich eine sichere Rechentechnik eher durch praktisches Üben erwirbt als durch langatmige Erörterungen. Im Übrigen werden Sie sehen, dass man in vielen Fällen sehr gut direkt mit den geometrisch definierten mathematischen Objekten rechnen kann, ohne auf Koordinaten zurückgreifen zu müssen, und dass dieses direkte Rechnen meist viel schneller und bequemer verläuft als der Weg durch den Koordinatendschungel. Der wichtigste Grund aber, warum man sich auch als Physiker auf die – zugegebenermaßen etwas abstrakten – Begriffe der modernen Differentialgeometrie einlassen sollte, besteht darin, dass sie die korrekten geometrischen und kinematischen Interpretationen unmittelbar einfangen, die für die physikalischen Anwendungen entscheidend sind. Als ersten Grundpfeiler der Differentialgeometrie benötigt man die Diskussion des Begriffs der Mannigfaltigkeit und die Klärung der Frage, wann und wie Funktionen auf Mannigfaltigkeiten bzw. Abbildungen zwischen Mannigfaltigkeiten differenziert werden können. Diese geometrischen Grundlagen sollen jetzt zur Sprache kommen. Eine differenzierbare Mannigfaltigkeit ist, grob gesprochen, ein geometrisches Gebilde, auf dem sich Differentialrechnung betreiben lässt, weil in der Nähe jedes
K.-H. Goldhorn, H.-P. Heinz, M. Kraus, Moderne mathematische Methoden der Physik DOI 10.1007/978-3-540-88544-3, © Springer 2009
3
4
1 Mannigfaltigkeiten
beliebigen Punktes Koordinaten eingeführt werden können und weil die Ergebnisse von sinnvollen Rechnungen, die man mit diesen Koordinaten anstellt, beim Übergang zu einem anderen zugelassenen Koordinatensystem erhalten bleiben. Insbesondere muss auf einer Mannigfaltigkeit auch klar sein, wann eine Folge von Punkten konvergiert, welche Funktionen stetig sind, was der Rand einer Teilmenge ist usw. Die grundlegenden Begriffe und Resultate zu diesem Thema, die man für Mannigfaltigkeiten braucht, sind in Abschn. A zusammengefasst. Für den Mathematiker gehören sie in das Teilgebiet der Allgemeinen Topologie (D mengentheoretischen Topologie). In Abschn. B definieren wir dann die Mannigfaltigkeiten sowie die Differenzierbarkeit von Funktionen auf und Abbildungen zwischen ihnen, leiten einige ihrer Eigenschaften her und geben erste Beispiele. Im dritten und letzten Abschnitt schließlich wenden wir uns der Frage zu, wie man differenzierbare Funktionen und Abbildungen tatsächlich differenziert und wie ihre Ableitungen als eigenständige mathematische Objekte aufgefasst werden können, unabhängig von der Willkür, die durch die Wahl von lokalen Koordinatensystemen ins Spiel gebracht wird. Als Definitions- und Wertebereiche der Ableitungen werden hier die Tangentialräume eingeführt, die an die Punkte der Mannigfaltigkeit angehängt werden. Die Ableitung einer Abbildung F an einem Punkt p erscheint dann als linearer Operator, der den Tangentialraum an p in den Tangentialraum an F .p/ abbildet. Um den Zusammenhang dieser Konstruktion mit der vertrauten Differentialrechnung richtig zu verstehen, sollte man sich an den Begriff der totalen Ableitung einer Funktion F W U ! V erinnern, wo U Rn und V Rm offene Teilmengen der jeweiligen euklidischen Räume sind: Für p 2 U ist die (totale) Ableitung DF .p/ D dFp derjenige lineare Operator Rn ! Rm ; der die gegebene Funktion F in der Nähe von p gut approximiert in dem Sinne, dass F .p C h/ F .p/ D dFp h C o.jhj/
für h ! 0
ist. Die JACOBImatrix, die diese lineare Abbildung beschreibt, hängt vom gewählten Koordinatensystem ab, die lineare Abbildung selbst jedoch nicht. Das Problem besteht aber darin, dass sich die Vektoren h; auf die der Operator dFp wirkt, im Allgemeinen nicht innerhalb der Mannigfaltigkeit realisieren lassen, und um diesem Problem beizukommen, werden die Tangentialräume konstruiert, wie wir es in Abschn. C sehen werden.
A Grundlagen aus der Topologie Um über Konvergenz von Folgen in einer Menge X oder von Stetigkeit von Funktionen auf X sprechen zu können, ist es nach unseren bisherigen Kenntnissen erforderlich, dass definiert ist, was der „Abstand“ zwischen zwei Punkten in X ist. Mit anderen Worten: Auf X muss eine Metrik gegeben sein (vgl. [36], Kap. 13 und 14). Eine solche Metrik ist aber nicht immer in natürlicher Weise auf allen Räumen gegeben, die in der Physik von Interesse sind, beispielsweise auf Konfigurationsräu-
A Grundlagen aus der Topologie
5
men physikalischer Systeme, auch wenn es oft möglich ist eine Metrik zu wählen. Man stellt aber fest, dass es an vielen Stellen der Analysis bereits genügt, anstelle vom Abstand von einem Punkt von den Umgebungen eines Punktes zu sprechen. Um dies deutlich zu machen, erinnern wir zunächst an einige bekannte Definitionen und Sätze: Definitionen 1.1. Sei .X; d / ein metrischer Raum, x0 2 X und " > 0. a. Die Menge U" .x0 / WD fx 2 X j d.x; x0 / < "g heißt die "-Umgebung von x0 . b. Eine Teilmenge U X heißt Umgebung von x0 2 X; wenn es ein " > 0 gibt mit U" .x0 / U. c. Eine Teilmenge U X heißt offen, wenn U Umgebung von jedem x0 2 U ist. Mit Hilfe dieser Begriffe kann man nun vieles, was wir in metrischen Räumen kennen gelernt haben, auch ohne Metrik formulieren. Die folgenden Sätze geben zwei Beispiele. Satz 1.2. Sei .X; d / ein metrischer Raum und .xn /n2N eine Folge in X . Die Folge .xn /n2N konvergiert genau dann gegen a 2 X; wenn es zu jeder Umgebung U von a ein n0 2 N gibt mit xn 2 U für alle n n0 . Der Beweis ist eine leichte Übungsaufgabe. Ebenso leicht kann „Stetigkeit“ mit Hilfe der Begriffe in Definition 1.1 beschrieben werden: Satz 1.3. Eine Abbildung f W X ! Y zwischen metrischen Räumen X; Y ist genau dann stetig bei x0 2 X; wenn für jede Umgebung U von f .x0 / das Urbild f 1 .U/ eine Umgebung von x0 ist. Topologische Räume sind nun Räume, in denen zwar nicht vom Abstand zweier Punkte gesprochen werden kann, aber doch von Umgebungen eines Punktes. Definitionen 1.4. Sei X eine Menge und T eine Menge von Teilmengen von X . Dann heißt T eine Topologie auf X falls gilt: (i) (ii) (iii)
;; X 2 T . Ist U 2 T ; V 2 T ; so ist U \ V 2 T . S Ist .Ui /i 2I eine Familie von Teilmengen mit Ui 2 T ; so ist Ui 2 T . i 2I
Die Mengen U 2 T heißen dann die offenen Mengen in X; und .X; T / heißt topologischer Raum. Beispiele 1.5. a. Ist .X; d / ein metrischer Raum und Td P.X / definiert durch U 2 Td W , U ist offen bezüglich d; wie in 1.1 definiert, so ist durch Td eine Topologie auf .X; d / gegeben.
6
1 Mannigfaltigkeiten
b. Sei X eine Menge, TK D f;; X g. Dann ist TK eine Topologie. Wir werden sehen, dass diese Topologie nicht durch eine Metrik gegeben ist. TK heißt die Klumpentopologie auf X . c. Ist X eine Menge, T D P.X / die Menge aller Teilmengen von X; so heißt T die diskrete Topologie. d. Sind .X; TX / und .Y; TY / topologische Räume, so nennt man U X Y offen, falls für alle .x; y/ 2 U offene Umgebungen Ux von x in X und Uy von y in Y existieren mit Ux Uy U . In Aufgabe 1.2 wird gezeigt, dass auf diese Weise eine Topologie auf X Y gegeben ist, die Produkttopologie. Auch Teilmengen topologischer Räume sind topologische Räume: Definition 1.6. Ist .X; T / ein topologischer Raum, Y X eine Teilmenge, so heißt TY WD fV Y j 9U 2 T W V D U \ Y g die Teilraumtopologie auf Y . Die offenen Mengen im Sinne der Teilraumtopologie sind also einfach die Schnitte von Y mit den offenen Mengen des gegebenen topologischen Raums .X; T /. Dass durch die Teilraumtopologie eine Topologie auf Y gegeben ist, prüft man leicht nach. Weitere wichtige Beispiele sind durch Quotientenbildung gegeben (vgl. [49]). Wir gehen darauf nicht allgemein ein, sondern geben nur die beiden wichtigsten Beispiele an: Beispiele 1.7. a. Der reelle projektive Raum RPn ist die Menge aller Geraden in RnC1 durch den Ursprung. Jede dieser Geraden schneidet die n-dimensionale Sphäre ˚ Sn D .x0 ; : : :; xn / 2 RnC1 j x02 C C xn2 D 1 in zwei Punkten x und x. Man kann also den reellen projektiven Raum auch auffassen als RPn D ffx; xg j x 2 Sn g oder RPn D fRx j x 2 RnC1 n f0gg : Für x D .x0 ; : : :; xn / 2 RnC1 n f0g benutzt man auch die Notation Rx D Œx0 W : : : W xn D Œx 2 RPn : Die Abbildung W Sn ! RPn ;
x 7! Œx
A Grundlagen aus der Topologie
7
[x] [y]
x
y
−y
−x
Abb. 1.1 Projektiver Raum RP2 und zwei Punkte daraus
ist offenbar surjektiv, und es gilt 1 .Œx/ D
x x ; jxj jxj
für jedes Œx 2 RPn . Bisher ist RPn nur als Menge definiert. Jetzt wird diese Menge mit einer Topologie versehen: Eine Teilmenge U RPn heiße offen, wenn 1 .U / Sn offen ist. Man überprüft leicht, dass damit eine Topologie auf RPn wohldefiniert ist. b. Ebenso ist der komplexe projektive Raum CPn als Menge aller komplexen Geraden in CnC1 definiert. Ist also D .z0 ; : : :; zn / 2 CnC1 n f0g; so ist Œ D Œz0 W z1 W : : : W zn WD f j 2 Cg 2 CPn : Man erhält CPn aus S2nC1 D f.z0 ; : : :; zn / 2 CnC1 j jz0 j2 C C jzn j2 D 1g durch Identifizieren aller Punkte, die sich nur um einen Faktor ei 2 S1 unterscheiden. Die Abbildung W S2nC1 ! CPn ; ist surjektiv und
1
.Œz/ D
z 7! Œz
ˇ z ˇˇ e 2R : jzj ˇ i
8
1 Mannigfaltigkeiten
Eine Teilmenge U CPn heißt offen, wenn 1 .U / S2nC1 offen ist. Damit ist CPn ein topologischer Raum. Dieser Raum tritt in der Quantenmechanik auf. Zustandsvektoren in der Quantenmechanik werden als Elemente der Norm 1 des Zustandsraumes – eines H ILBERTraumes – betrachtet, von denen alle, die sich nur um eine Phase ei unterscheiden, identifiziert werden. Meist ist der Zustandsraum unendlichdimensional. Die Zustandsvektoren sind also Elemente eines unendlichdimensionalen projektiven Raums. Lässt das System aber nur endlich viele Messwerte zu, so sind die Zustandsvektoren Elemente eines endlichdimensionalen komplexen projektiven Raums. Viele Begriffe, die man von metrischen Räumen her kennt, können auf topologische Räume übertragen werden. Definitionen 1.8. Sei .X; T / ein topologischer Raum. a. A X heißt abgeschlossen ” X n A offen ist. b. Ein Element p 2 X heißt innerer Punkt von A X; wenn es eine offene Teilmenge U X gibt mit p 2 U A. ı
A bezeichnet die Menge der inneren Punkte von A.
ı
c. Ist p 2 X; so heißt U X Umgebung von p; falls p 2 U ist. d. Ist A X; so heißt x 2 X Berührpunkt von A ” für jede Umgebung U von x gilt: U \ A 6D ;. e. Ist A X; so heißt x 2 X Randpunkt von A ” für jede Umgebung U von x gilt: U \ A 6D ; und U \ .X n A/ 6D ;. Die Menge der Randpunkte bezeichnet man mit @A D fx 2 X j x Randpunkt von Ag. A WD A[@A heißt der Abschluss von A. f. Eine Folge .xn /n1 in einem topologischen Raum .X; T / konvergiert gegen a 2 X ” für jede Umgebung U von a gibt es ein N 2 N; so dass xn 2 U für alle n > N . Ist .X; d / ein metrischer Raum und .X; Td / der dadurch definierte topologische Raum, so stimmen diese Begriffe für den metrischen und topologischen Raum überein. Viele Sätze, die man über Konvergenz von Folgen kennt, übertragen sich leicht von metrischen auf topologische Räume. Es gibt aber eine wichtige Ausnahme: Eine Folge in einem topologischen Raum kann gegen mehrere Grenzwerte konvergieren. Ist beispielsweise .X; TK / ein Klumpenraum, so konvergiert jede Folge in X gegen jedes x 2 X; da die einzige Umgebung von x 2 X ganz X ist. Wollen wir solche Phänomene ausschließen, so müssen wir eine Zusatzforderung an den topologischen Raum X stellen: Definition 1.9. Ein topologischer Raum .X; T / heißt hausdorffsch oder H AUS DORFF -Raum, wenn es zu x; y 2 X mit x 6D y stets Umgebungen U.x/ und U.y/ von x bzw. y gibt mit U.x/ \ U.y/ D ;. Jeder metrische Raum .X; d / ist hausdorffsch, denn ist d.x; y/ D r > 0; so folgt Ur=2 .x/ \ Ur=2 .y/ D ; wegen der Dreiecksungleichung. Teilräume von
A Grundlagen aus der Topologie
9
H AUSDORFF-Räumen sind wieder hausdorffsch und auch RPn und CPn sind hausdorffsch. Sind nämlich Œx 2 RPn und Œy 2 RPn ; Œx 6D Œy und x 2 1 .Œx/; y 2 1 .Œy/ Urbilder in Sn ; so gibt es offene Umgebungen Ux und Uy von x bzw. y in Sn ; so dass .Ux [ .Ux // \ .Uy [ .Uy // D ; ist. Dann sind .Ux / und .Uy / die gesuchten disjunkten offenen Umgebungen in RPn . Ebenso folgt, dass CPn ein H AUSDORFFraum ist. Bemerkung: In H AUSDORFFräumen ist der Grenzwert einer Folge (sofern er existiert) stets eindeutig. Beweis. Würde .xn /n2N sowohl gegen a 2 X als auch gegen b 2 X konvergieren, so gäbe es offene Umgebungen U.a/; U.b/ von a bzw. b mit U.a/ \ U.b/ D ;; so dass alle Folgenglieder bis auf endlich viele sowohl in U.a/ als auch in U.b/ wären, was offenbar ein Widerspruch ist. t u
Stetigkeit Stetigkeit wird für Abbildungen zwischen topologischen Räumen analog zu 1.3 definiert: Definition 1.10. Seien X und Y topologische Räume. Eine Abbildung f W X ! Y heißt stetig bei a 2 X; wenn für jede Umgebung U von f .a/ gilt: f 1 .U / ist Umgebung von a. Eine Abbildung f heißt stetig, falls f bei jedem a 2 X stetig ist. Meistens werden wir die folgende Charakterisierung stetiger Funktionen benutzen: Satz 1.11. f ist genau dann stetig, wenn für alle offenen Teilmengen U Y gilt: f 1 .U / ist offen in X . Beweis. „)“
„(“
Sei f stetig, U Y offen, x 2 f 1 .U / und y D f .x/ 2 U . Dann ist U Umgebung von y; also f 1 .U / Umgebung von x. Somit enthält f 1 .U / eine offene Teilmenge V X mit x 2 V f 1 .U /; d. h. x ist innerer Punkt von f 1 .U /. Dies zeigt, dass f 1 .U / offen ist. Sei f W X ! Y so, dass f 1 .U / X offen, falls U Y offen. Sei x 2 X; y D f .x/ und U Umgebung von y. Dann gibt es eine offene e U mit y 2 U e ; also ist f 1 .U e / offen und x 2 f 1 .U e /. Teilmenge U 1 e 1 1 Weiter ist f .U / f .U /; also ist f .U / eine Umgebung von x. Dies zeigt die Stetigkeit von f in dem beliebigen Punkt x. t u
Bemerkung: Sind .X; d1 / und .Y; d2 / metrische Räume, so ist f W X ! Y offenbar genau dann stetig als Abbildung zwischen den metrischen Räumen, wenn f als Abbildung zwischen den topologischen Räumen .X; Td1 / und .Y; Td2 / stetig ist.
10
1 Mannigfaltigkeiten
Beispiel: Sei Y ein beliebiger topologischer Raum. Nach Definition der Topologie auf RPn folgt, dass f W RPn ! Y genau dann stetig ist, wenn f ı W Sn ! Y stetig ist, analog für CPn . Ebenso wie für stetige Abbildungen auf metrischen Räumen folgt auch, dass Summe, Produkt und Komposition stetiger Abbildungen auf topologischen Räumen wieder stetig sind. Die Umkehrfunktion einer stetigen Abbildung muss aber nicht stetig sein, wie das Beispiel der Abbildung ˚ f W Œ0; 1Œ7! S1 D .x; y/ 2 R2 j x 2 C y 2 D 1 ; f .t/ D .cos 2 t sin 2 t/ zeigt, deren Umkehrabbildung am Punkt .1; 0/ 2 S1 nicht stetig ist. Darum definiert man: Definition 1.12. Eine stetige Bijektion zwischen topologischen Räumen, deren Umkehrung f 1 ebenfalls stetig ist, heißt ein Homöomorphismus.
Kompaktheit Eine beschränkte und abgeschlossene Teilmenge im Rn heißt auch eine kompakte Teilmenge, und diese Mengen sind für die Analysis von fundamentaler Bedeutung, z. B. weil jede in einer solchen Menge verlaufende Folge eine konvergente Teilfolge besitzt oder weil jede stetige Funktion darauf ihr Maximum und ihr Minimum annimmt. Grob gesprochen sind die kompakten Räume für die Topologie das, was die endlichen Mengen für die Mengenlehre sind. Aber schon in metrischen Räumen hat nicht jede abgeschlossene beschränkte Teilmenge diese erwünschten Eigenschaften, und in allgemeinen topologischen Räumen kann gar nicht von Beschränktheit gesprochen werden, weil man keine Abstände messen kann. Der klassische Überdeckungssatz von H EINE -B OREL liefert jedoch eine Beschreibung der Kompaktheit, die sich auch in allgemeinstem Rahmen als tragfähig erwiesen hat. Man definiert: Definition 1.13. Eine Teilmenge K eines topologischen Raums X heißt kompakt, wenn jede offene Überdeckung von K eine endliche Teilüberdeckung besitzt. Eine offene Überdeckung ist dabei ein System von offenen Teilmengen, dessen Vereinigung ganz K umfasst. [ Ui mit offenen Mengen Ui Ausführlich bedeutet diese Bedingung: Ist K i 2I
(wobei i eine beliebige Indexmenge I durchlaufen kann), so gibt es endlich viele dieser Mengen, etwa Ui1 ; : : :; UiN ; so dass diese schon für sich alleine eine Überdeckung bilden, so dass also K Ui1 [ : : :UiN ist. Für metrische Räume fällt dieser Kompaktheitsbegriff mit dem dort eingeführten zusammen. Insbesondere sind in metrischen Räumen kompakte Mengen stets beschränkt und abgeschlossen und im Rn und Cn mit der Standardtopologie gilt
B Mannigfaltigkeiten
11
auch, dass die beschränkten und abgeschlossenen Teilmengen im Sinne der obigen Definition kompakt sind. Das ist gerade die Aussage des Satzes von H EINE-B OREL. Wir überzeugen uns nun, dass kompakte Teilmengen von topologischen Räumen (oder zumindest von H AUSDORFFräumen) die aus der Analysis vertrauten Besonderheiten aufweisen: Lemma. Kompakte Teilmengen von H AUSDORFF-Räumen sind abgeschlossen. Beweis. Ist K X kompakt, y 2 X n K; so gibt es zu jedem x 2 K offene Umgebungen Ux von x und Vx von y mit Ux \Vx D ;. Da K kompakt nist, genügen n S T Uxi gilt. Also ist K \ Vxi D ;; endlich viele, etwa x1 ; : : :; xn ; so dass K und
n T
i D1
i D1
Vxi ist eine offene Umgebung von y. Das bedeutet, dass X n K offen ist, K
i D1
also abgeschlossen.
t u
Stetige Abbildungen auf kompakten topologischen Räumen haben nun die für Rn oder für metrische Räume bekannten Eigenschaften (vgl. etwa [36], Kap. 14). Sie lassen sich überraschend einfach aus Definition 1.13 herleiten, wofür wir jedoch auf die Lehrbuchliteratur über Allgemeine Topologie verweisen, etwa auf [49]. Dort wird u. a. bewiesen: Theorem 1.14. a. Ist X kompakt und f W X ! Y stetig, so ist das Bild f .X / kompakt. Insbesondere nimmt jede stetige reelle Funktion auf einem kompakten Raum ihr Maximum und ihr Minimum an. b. Eine stetige Bijektion eines kompakten Raums auf einen H AUSDORFFraum ist stets ein Homöomorphismus. Beispiel: Die Sphären Sn sind kompakt als beschränkte abgeschlossene Teilmengen von RnC1 . Die Projektiven Räume sind nach Theorem 1.14a. dann ebenfalls kompakt, denn RPn D .Sn / und CPn D .S2nC1 / ; und die jeweilige Abbildung ist stetig, wie sofort aus der Definition der Topologien auf den projektiven Räumen folgt.
B Mannigfaltigkeiten Mannigfaltigkeiten sind topologische Räume, die „lokal aussehen“ wie Rn . Global kann eine Mannigfaltigkeit jedoch ein ganz anderes Aussehen haben. So ist z. B. die Erdoberfläche ein gutes Beispiel für eine Mannigfaltigkeit. Kleine Gebiete können mittels Karten auf die Seiten eines Atlasses abgebildet werden, also auf Stücke aus der Ebene R2 . Will man aber die ganze Erdoberfläche abbilden, so ist dies nicht auf stetige Weise möglich.
12
1 Mannigfaltigkeiten
Sie kennen dies wahrscheinlich bereits von Untermannigfaltigkeiten des Rn ; wie sie z. B. in [36], Kap. 21 betrachtet werden. Mannigfaltigkeiten sind jedoch nicht notwendig Teilmengen eines euklidischen Raumes. Ein Beispiel ist etwa der Projektive Raum, dessen Punkte zwar Geraden im RnC1 sind, der als Menge jedoch keine Teilmenge des RnC1 ist. Ein Grund, allgemeine Mannigfaltigkeiten und nicht nur Teilmannigfaltigkeiten des Rn zu betrachten, liegt in der allgemeinen Relativitätstheorie. Die physikalische Raumzeit wird als 4-dimensionale Mannigfaltigkeit modelliert. Es macht aber keinen Sinn, sie als Teilmenge eines euklidischen Raumes aufzufassen, da sich alle physikalischen Beobachtungen nur auf Gegebenheiten innerhalb der Raumzeit beziehen. Insbesondere ist kein physikalischer Mechanismus denkbar, durch den die beobachtete Metrik von der Geometrie eines umgebenden euklidischen Raumes erzeugt würde. Eine abstraktere Definition ist daher unumgänglich. Definitionen 1.15. a. Ein topologischer Raum M heißt lokal euklidisch der Dimension n; wenn es zu jedem p 2 M eine offene Umgebung U M und einen Homöomorphismus h W U ! U 0 auf eine offene Teilmenge U 0 Rn gibt. b. Das Paar .U; h/ oder auch nur h heißt dann Karte, Kartenabbildung oder Koordinatenabbildung, ' D h1 lokale Parametrisierung um p. Der Definitionsbereich U der Karte heißt Kartengebiet oder Koordinatengebiet. Schreiben wir h in Komponenten h D .h1 ; : : :; hn /; so heißen x j D hj .q/ die Koordinaten des Punktes q 2 U in Bezug auf die betrachtete Karte. S U D M gilt. c. Eine Familie von Karten .U ; h /2 heißt Atlas für M; falls 2
Sind h1 und h2 Karten für M; so heißt der Homöomorphismus ˇ ˇ w12 D h2 ı h1 W h1 .U1 \ U2 / ! h2 .U1 \ U2 / 1 ˇ h1 .U1 \U2 /
der Kartenwechsel.
M U1
U2
h1
U1 Abb. 1.2 Kartenwechsel
h2 w12 U2
B Mannigfaltigkeiten
13
d. Ist M lokal euklidisch der Dimension n und sind .Ui ; hi / und .Uj ; hj / Karten für M; so sagt man hi und hj wechseln .C k -/differenzierbar, wenn der Kartenwechsel wij ein (C k -)Diffeomorphismus ist. e. Ein C k -differenzierbarer Atlas ist ein Atlas, dessen Karten alle C k -differenzierbar wechseln. f. Atlanten A und B heißen C k -äquivalent, wenn alle Kartenwechsel der Karten von A mit den Karten aus B wieder C k -Diffeomorphismen sind. Sind A und B C k -äquivalente Atlanten, so ist A [ B D f.U ; h / j .U ; h / 2 A oder .U ; h / 2 Bg wieder ein C k -differenzierbarer Atlas. Im Allgemeinen interessiert uns ein Atlas, in dem alle äquivalenten enthalten sind, und diesen benutzt man, um einem lokal euklidischen Raum die Struktur einer differenzierbaren Mannigfaltigkeit zu verleihen. Genauer: Definitionen 1.16. a. Unter einer C k -differenzierbaren Struktur auf dem lokal euklidischen Raum M versteht man einen maximalen C k -differenzierbaren Atlas, d. h. einen Atlas, der schon alle Karten enthält, die mit den Karten des Atlasses C k differenzierbar wechseln. b. Unter einer n-dimensionalen C k -differenzierbaren Mannigfaltigkeit versteht man einen lokal euklidischen H AUSDORFF-Raum, der als Vereinigung von abzählbar vielen kompakten Teilmengen geschrieben werden kann, zusammen mit einer C k -differenzierbaren Struktur. Mit einer (differenzierbaren) Mannigfaltigkeit ist in diesem Buch stets eine C 1 differenzierbare Mannigfaltigkeit gemeint. Die topologischen Forderungen, dass M hausdorffsch ist und dass M D
1 [
Kj ;
Kj kompakt ;
(1.1)
j D1
ist für Teilmannigfaltigkeiten des Rn offenbar erfüllt, da man Rn selbst als Vereinigung der kompakten Kugeln Bm .0/; m 2 N; schreiben kann. Im Falle der allgemeinen Mannigfaltigkeiten folgen sie aber nicht etwa schon aus der Eigenschaft „lokal euklidisch“, sondern müssen gesondert gefordert werden. Über den Vorteil, wenn ein topologischer Raum hausdorffsch ist, wurde im letzten Abschnitt schon gesprochen. Die Eigenschaft (1.1) ist auch in den meisten Räumen, die wir betrachten, also z. B. Konfigurationsräumen, anschaulich ganz klar. Viele wichtige Mannigfaltigkeiten sind sogar selber kompakt, z. B. die Sphären Sn und die projektiven Räume, wie wir am Schluss des vorigen Abschnitts gesehen haben. Jedenfalls hat es große technische Vorteile, (1.1) zu fordern. So folgt aus dieser Eigenschaft zum Beispiel, dass jede Mannigfaltigkeit einen abzählbaren Atlas besitzt. Wir werden (1.1) sowie die H AUSDORFF-Eigenschaft oft benutzen aber selten explizit nachprüfen, und Sie können sich auf den Standpunkt stellen, dass die Räume, die Ihnen begegnen diese Eigenschaften haben.
14
1 Mannigfaltigkeiten
Beispiele 1.17. a. Als Wiederholung für ein Beispiel einer Untermannigfaltigkeit geben wir zuerst einen Atlas für Sn D fx 2 RnC1 j jxj2 D 1g an: Die Mengen .Ui;C ; Ui; /i D0;:::;n mit Ui;C D f.x0 ; : : :; xn / 2 Sn j xi > 0g ; Ui; D f.x0 ; : : :; xn / 2 Sn j xi < 0g bilden eine offene Überdeckung von Sn . Durch 1 x0 0 01 0 1 B :: C x1 x0 B:C B C B :: C B :: C C B ! U1 .0/; @ : A 7! B xO i C DW @ : A B :: C xn xn0 @:A 0
hi;˙ W Ui;˙
(1.2)
xn sind Kartenabbildungen gegeben. Die Kartenwechsel zwischen hi;C und hj;C sind für i < j durch 0
x10 :: :
1
B C B C B C 0 B C x Bp i C 0 01 0 2 B x1 jx j C B 1 C 0 B C B C x 0 D @ ::: A 7! B xi C1 C B C : :: B C xn0 B C B C 0 O xj B C B C : :: @ A 0 xn gegeben, und analog für die anderen auftretenden Fälle. Offenbar sind diese Abbildungen Diffeomorphismen. b. Ist M eine abzählbare Menge mit der diskreten Topologie, so ist M eine 0-dimensionale Mannigfaltigkeit. c. Der Raum Rn selbst ist natürlich eine n-dimensionale Mannigfaltigkeit. Dabei kommt man mit der einzigen Karte .Rn ; id/ aus. d. Ist M eine differenzierbare Mannigfaltigkeit der Dimension n; ˝ M eine offene Teilmenge, so ist ˝ ebenfalls eine differenzierbare Mannigfaltigkeit der Dimension n. Ist nämlich .U; h/ eine Karte um p 2 M von M; und ist p 2 ˝; so ist .U \ ˝; hjU \˝ / eine Karte für ˝ um p. e. Sind M und N Mannigfaltigkeiten der Dimension m bzw. n; so ist M N eine Mannigfaltigkeit der Dimension m C n.
B Mannigfaltigkeiten
15
Ist .p; q/ 2 M N; .U; h/ eine Karte von M um p; .V; k/ eine Karte von N um q; so ist U V M N eine offene Umgebung von .p; q/ und h k W U V ! U 0 V 0 ; .x; y/ 7! .h.x/; k.y// die gesuchte Kartenabbildung. Die entsprechenden Kartenwechsel sind offenbar differenzierbar. Zum Beispiel ist Sm Sn RmCnC2 eine Mannigfaltigkeit der Dimension m C n. f. RPn und CPn sind Mannigfaltigkeiten. Wir behandeln wieder nur den reellen Fall – der komplexe geht ganz analog. Eine offene Überdeckung von RPn ist durch Vi D fŒx0 W W xn 2 RPn j xi 6D 0g gegeben. Diese Teilmengen sind offen, denn 1 .Vi / D Ui;C [Ui; mit Ui;˙ Sn wie in a. Kartenabbildungen hi W Vi ! Vi0 D Rn sind dann durch hi W Œx0 W W xn 7!
x0 xi 1 xi C1 xn ; : : :; ; ; : : :; xi xi xi xi
(1.3)
gegeben. Sie sind wohldefinierte stetige Abbildungen mit der stetigen Umkehrung 0
0 0 0 0 0 h1 i W x1 ; ; xn 7! x1 W W xi W 1 W xi C1 W W xn : Damit ist der Kartenwechsel wij D hj ı h1 i für i < j durch f.x1 ; : : :; xn / 2 Rn j xj ¤ 0g ! f.x1 ; : : :; xn / 2 Rn j xi C1 ¤ 0g ; .x1 ; : : :; xn / 7!
x1 xi 1 xi xO j xn ; : : :; ; : : : ; : : :; xj xj xj xj xj
gegeben. Analog zu den Teilmannigfaltigkeiten des Rn kann man auch für beliebige Mannigfaltigkeiten M diejenigen Teilmengen charakterisieren, die innerhalb von M so glatt verlaufen, dass sie (mit der Teilraumtopologie) schon für sich Mannigfaltigkeiten bilden: Definition 1.18. Sei M eine n-dimensionale Mannigfaltigkeit. M0 M heißt eine k-dimensionale Untermannigfaltigkeit (= Teilmannigfaltigkeit) von M; wenn um jedes p 2 M0 eine Karte .W; H / von M existiert, so dass H.W \ M0 / D .Rk f0g/ \ W 0 Š
ist, wobei H W W ! W 0 . Das Paar .W; H / (oder auch H alleine) heißt dann Flachmacher oder Untermannigfaltigkeitskarte für M0 um p 2 M0 .
16
1 Mannigfaltigkeiten
W
H
W
’ pr
Abb. 1.3 Ein Flachmacher
Ist M0 M eine k-dimensionale Untermannigfaltigkeit von M; so ist M0 tatsächlich eine k-dimensionale Mannigfaltigkeit im Sinne unserer Definition 1.16b. Ist nämlich ˇ .W; H / eine Untermannigfaltigkeitskarte für M0 um p; so ist .W \ M0 ; prk ı H ˇW \M0 /; wobei prk W Rn ! Rk die Projektion auf die ersten k Koordinaten bezeichnet, eine Karte um p von M0 . Dass die entstehenden Kartenwechsel differenzierbar sind, rechnet man mühelos nach (Übung!). Teilmannigfaltigkeiten des Rn sind offenbar Untermannigfaltigkeiten im hier definierten Sinn, wenn man Rn wie in Bsp. 1.17c. als Mannigfaltigkeit betrachtet. Ferner sind Sn SnCm und RPn RPnC1 ebenfalls Untermannigfaltigkeiten. Ein wichtiges Hilfsmittel um Teilmengen von Rn als Teilmannigfaltigkeiten zu erkennen, ist der Satz vom regulären Wert. Damit ist die bekannte Folgerung aus dem Satz über implizite Funktionen gemeint, die besagt, dass die Lösungsmenge eines (nichtlinearen) Gleichungssystems fj .x1 ; : : :; xn / D pj ;
j D 1; : : :; m
eine Teilmannigfaltigkeit der Dimension n m von Rn bildet, wenn die JACO BImatrix .@fj =@xk /jk überall auf der Lösungsmenge den Höchstrang hat (vgl. etwa [36], Kap. 21). Der Satz gilt sinngemäß genauso für Untermannigfaltigkeiten beliebiger Mannigfaltigkeiten. Bevor er aber formuliert werden kann, muss zunächst geklärt werden, was man unter differenzierbaren Abbildungen auf einer Mannigfaltigkeit versteht.
B Mannigfaltigkeiten
17
U
V
f
p h
f (p)
k
U’ h(p)
V’
~ f
k(P)
Abb. 1.4 Differenzierbarkeit einer Abbildung f
Definitionen 1.19. Sei r 0 r. 0
a. Sei M eine n-dimensionale C r -differenzierbare Mannigfaltigkeit. Eine stetige Abbildung f W M ! Rk heißt C r -differenzierbar bei p 2 M; wenn für eine (dann auch jede) Karte .U; h/ um p gilt: fQ D f ı h1 ist C r -differenzierbar bei h.p/. 0
b. Seien M und N zwei C r -differenzierbare Mannigfaltigkeiten. Eine stetige Abbildung f W M ! N heißt C r -differenzierbar bei p 2 M; wenn für ein (und dann jedes) Paar von Karten .U; h/ von M mit p 2 U und .V; k/ von N mit f .p/ 2 V und f .U / V die Abbildung fQ WD k ı f ı h1 C r -differenzierbar bei h.p/ ist (vgl. Abb. 1.4). c. Eine Abbildung f W M ! N heißt C r -Diffeomorphismus, falls f bijektiv und f sowie f 1 C r -differenzierbar sind. Falls ein C 1 -Diffeomorphismus f W M ! N existiert, so sagt man, M und N seien diffeomorph. Eine Abbildung f W M ! N heißt lokaler Diffeomorphismus bei p; falls es offene ˇ Teilmengen U M mit p 2 U und V N mit f .p/ 2 V gibt, so dass f ˇU W U ! V ein Diffeomorphismus ist. f heißt lokaler Diffeomorphismus, falls f bei jedem p 2 M ein lokaler Diffeomorphismus ist. d. Ist f W M ! N eine differenzierbare Abbildung zwischen differenzierbaren Mannigfaltigkeiten M und N; so ist für x 2 M der Rang von f bei x durch rangx f rang f .x/ WD rangJfQ .h.x// mit fQ D k ı f ı h1 wie in b. wohldefiniert, da die Kartenwechsel alle Diffeomorphismen, ihre JACOBImatrizen also regulär sind. Die Kartenabbildungen h W U ! U 0 einer C r -Mannigfaltigkeit sind damit also genau die Diffeomorphismen h W U ! U 0 . Mit diesen Definitionen kann nun die Analysis in mehreren Variablen auf Mannigfaltigkeiten übertragen werden. Die Komposition differenzierbarer Abbildungen
18
1 Mannigfaltigkeiten
zwischen Mannigfaltigkeiten ist wieder differenzierbar. Dies folgt daraus, dass die Komposition differenzierbarer Abbildungen auf Rn differenzierbar ist (Kettenregel!). Aus dem Satz über inverse Funktionen folgt sofort auch der entsprechende Satz für Mannigfaltigkeiten: Theorem 1.20. Ist f W M ! N eine differenzierbare Abbildung zwischen Mannigfaltigkeiten der Dimension n und ist rangp f D n; so ist f lokaler Diffeomorphismus bei p. Nun können wir auch den Satz vom regulären Wert für Mannigfaltigkeiten formulieren und beweisen: Theorem 1.21 (Satz vom regulären Wert). Seien M; N differenzierbare Mannigfaltigkeiten, f W M ! N differenzierbar, p 2 N regulärer Wert (d. h. für alle q 2 f 1 .p/ ist rangq f D dim N ). Dann ist f 1 .p/ M eine Untermannigfaltigkeit von M der Dimension dim M dim N . Beweis. Sei q 2 f 1 .p/; .W1 ; H1 / Karte um q und .W2 ; H2 / Karte um p mit f .W1 / W2 . Dann ist H2 .p/ regulärer Wert von fQ D H2 ı f ı H11 . Also existiert nach dem Satz vom regulären Wert im Rn ein Flachmacher K1 W H1 .W1 / ! W 0 von fQ1 .H2 .p//. Dann ist K1 ı H1 W W1 ! W 0 der gesuchte Flachmacher um q. t u Dieser Beweis ist ein typisches Beispiel dafür wie sich im Rn bekannte Sachverhalte auf Mannigfaltigkeiten übertragen. In Kurzform lautet der Beweis: Das Problem ist lokal, d. h. mittels Karten zu zeigen. Damit folgt der Satz aus der Rn Version, die wir vor Definition 1.19 besprochen haben. „Lokale“ Eigenschaften lassen sich immer nach diesem Schema vom Rn auf Mannigfaltigkeiten übertragen. Bald werden wir auch globale (d. h. nichtlokale) Fragestellungen kennen lernen. Die meisten Beispiele, die man konkret berechnet, sind Untermannigfaltigkeiten des Rn . Wir geben daher hier noch ein Beispiel an, wie der Satz vom regulären Wert dort angewandt wird. Beispiel: Die orthogonale Gruppe O.n/ D fA 2 End .Rn / D Rnn j AT A D En g 2
ist eine Untermannigfaltigkeit des Rn D Rnn der Dimension 12 n.n 1/. Beweis. Es sei Sym .n/ der Vektorraum aller symmetrischen reellen nn-Matrizen. Dann ist durch F W GL.n; R/ ! Sym .n/ A 7! AT A
(1.4)
eine differenzierbare Abbildung gegeben. Wegen O.n/ D F 1 .En / genügt es zu zeigen, dass En regulärer Wert von F ist. Die Gruppe GL .n; R/ Rnn der invertierbaren Matrizen ist eine offene Teilmenge. Wir können also für A 2 O.n/
C Tangentialraum und Differential
19
GL .n; R/ das Differential dFA mit Hilfe der Richtungsableitungen berechnen. Für X 2 Rnn ist d ˇˇ F .A C tX / dt t D0 d ˇˇ D .A C tX /T .A C tX / dt t D0 D AT X C X T A :
dFA .X / D
Sei B 2 Sym.n/; also B D A 2 O.n/
1 2
.B T C B/. Setze X D
dFA .X / D D
1 2 1 2
1 2
AB. Dann ist wegen
.AT AB C B T AT A/ .B C B T / D B :
Also ist für A 2 O.n/ das Differential dFA surjektiv, und damit ist En regulärer Wert von F; wie gewünscht. Die Dimension errechnet sich zu n2 dim Sym.n/ D t u n2 12 n.n C 1/ D 12 n.n 1/. Zu Beginn des Kapitels wurde argumentiert, dass wir uns nicht auf Untermannigfaltigkeiten des euklidischen Raums beschränken wollen. Der folgende Satz scheint unsere Argumentation zunächst einmal zunichte zu machen: Satz 1.22. Sei M eine n-dimensionale Mannigfaltigkeit. Dann gibt es für geeignetes m > n eine Untermannigfaltigkeit M 0 des Rm und einen Diffeomorphismus f W M ! M 0 . Die Abbildung f heißt dann eine Einbettung von M . Ein Beweis findet sich in [13]. In Satz 4.5 wird eine schwächere Version für kompakte Mannigfaltigkeiten bewiesen werden. Aufgrund dieses Satzes kann man sich auf den Standpunkt stellen, dass man statt einer Mannigfaltigkeit M stets eine dazu diffeomorphe Untermannigfaltigkeit M 0 des euklidischen Raums betrachten kann. Dies ist in gewissen Grenzen möglich, aber da die Einbettung f W M ! M 0 nicht eindeutig ist, muss dann bei jeder Aussage untersucht werden, wie sie von der Wahl von Einbettungen f abhängt. So kann man zum Beispiel den Abstand zwischen zwei Punkten p und q in M nicht etwa definieren als Abstand zwischen f .p/ und f .q/; denn dieser würde ja offenbar von der Wahl von f abhängen. Daher wird im nächsten Abschnitt auch der Tangentialraum für differenzierbare Mannigfaltigkeiten definiert, auch wenn dies etwas technischer ist als der Begriff des Tangentialraums an eine Untermannigfaltigkeit.
C Tangentialraum und Differential Ab jetzt bezeichnet M immer eine n-dimensionale C 1 -Mannigfaltigkeit, sofern nichts anderes gesagt wird. Bei glatten Kurven ˛ W "; "Œ! RN bezeichnen wir die Ableitung (= Geschwindigkeitsvektor) wahlweise mit
20
1 Mannigfaltigkeiten
d ˛.t/ D ˛.t/ P D ˛ 0 .t/ : dt (Den Strich 0 erlauben wir uns, wenn die Kurve eine komplizierte Bezeichnung hat.) Ist M RN eine n-dimensionale Untermannigfaltigkeit, so gibt es verschiedene Möglichkeiten, den Tangentialraum zu definieren (vgl. [36], Kap. 21). Eine Möglichkeit ist, den Untermannigfaltigkeitstangentialraum von M an der Stelle p durch Tpunt M WD f.0/ P j W "; "Œ! M; glatte Kurve mit .0/ D pg zu definieren. Dies ist ein n-dimensionaler Untervektorraum des RN . Offenbar ist es nicht möglich, diese Definition auf abstrakte Mannigfaltigkeiten zu übertragen, da für C 1 -Abbildungen W "; "Œ! M die Größe P .0/ nicht definiert ist, sondern nur für jede Karte .U; h/ um p die Größe .h ı /0 .0/ 2 Rn . Dieser Vektor ist aber abhängig von der Wahl der Karte. Wir können also .h ı /0 .0/ nicht als Tangentialvektor an M auffassen. Die Anschauung sagt aber, dass zwei Kurven mit Startpunkt p dieselbe Geschwindigkeit bei 0 haben, also denselben Tangentialvektor bei p definieren sollten, wenn ihre Geschwindigkeitsvektoren in Karten übereinstimmen. Dies ist die Motivation für die folgenden Definitionen: Definitionen 1.23. Sei p 2 M ein Punkt. a. Kp .M / sei die Menge aller differenzierbaren Abbildungen W "; "Œ! M mit .0/ D p. Zwei Kurven ˛; ˇ 2 Kp .M / heißen tangential äquivalent, wenn für eine – und dann für jede – Karte h W U ! U 0 mit p 2 U gilt .h ı ˛/0 .0/ D .h ı ˇ/0 .0/ : Wir schreiben dann ˛ p ˇ. b. Die Äquivalenzklasse Œ˛ WD f 2 Kp .M / j p ˛g
(1.5)
heißt Tangentialvektor von M an der Stelle p; Tp M D fŒ˛ j ˛ 2 Kp M g heißt Tangentialraum von M an der Stelle p. Ist vp D Œ˛ 2 Tp M so heißt ˛ eine den Vektor vp repräsentierende Kurve. Offenbar gibt es also zu einem Tangentialvektor mehrere repräsentierende Kurven, wie schon im Fall des Untermannigfaltigkeitstangentialraums. Die Ableitungen dieser Kurven in einer Karte stimmen jedoch alle überein. Die Definition (1.5) des Tangentialvektors als einer Menge ist dabei nur ein logischer Trick – eigentlich stellt man sich einen Tangentialvektor als einen Pfeil vor, der am Punkt p angehängt ist,
C Tangentialraum und Differential
21
Abb. 1.5 Tangential äquivalente Kurven
M
h
oder als die Geschwindigkeit eines Teilchens, das sich innerhalb der Mannigfaltigkeit bewegt und dabei zur Zeit t D 0 den Punkt p passiert. Aber für eine rigorose mathematische Theorie benötigt man eben ein konkretes Objekt, in dem diese Vorstellung kodiert ist, und dafür eignet sich hier die Menge aller Kurven, die gerade das, was kodiert werden soll, gemeinsam haben, und das ist die Menge (1.5). Anmerkung 1.24. Die Bildung von Äquivalenzklassen, die bei der Konstruktion der Tangentialräume eine entscheidende Rolle gespielt hat, kommt in der Mathematik in den unterschiedlichsten Zusammenhängen vor und gehört gewissermaßen zu den fundamentalen Prozeduren der modernen Mathematik. Es handelt sich dabei um die folgende Grundsituation: Gegeben ist eine Menge S sowie eine Relation „ “ zwischen den Elementen von S; d. h. für jedes Paar .x; y/ 2 S S muss eindeutig feststehen, ob die Aussage „x y“ wahr oder falsch ist. Was diese Aussage im Einzelnen bedeutet, ist natürlich von Fall zu Fall verschieden, doch sollen dabei die folgenden drei Bedingungen erfüllt sein: (A1) (A2) (A3)
x x; x y H) y x; x y und y z H) x z
für alle x; y; z 2 S . Dann bezeichnet man die betreffende Relation als eine Äquivalenzrelation, und man spricht „x y“ auch aus als „x äquivalent zu y“. Man kann sich vorstellen, dass zwei äquivalente Elemente von S sich nur in gewissen,
22
1 Mannigfaltigkeiten
für die gerade vorliegende Situation unwesentlichen Details unterscheiden, also im Wesentlichen als gleich betrachtet und daher miteinander identifiziert werden können. Um diese Identifikation mathematisch sauber durchzuführen, geht man über zur Menge SQ S= der Äquivalenzklassen Œx WD fy 2 S j x yg : Die Bedingungen (A1) – (A3) stellen sicher, dass x 2 Œx und x y ” Œx D Œy : Es ist sogar Œx \ Œy D ;; wenn x; y nicht äquivalent sind. (Beweise als Übung!) Die Elemente einer Äquivalenzklasse 2 S= werden wieder als deren Repräsentanten oder Vertreter bezeichnet, und man stellt sich solch eine Klasse meist nicht als Menge von Elementen von S vor, sondern als einen typischen Vertreter x 2 S; wobei aber der Übergang zu einem äquivalenten Element (also einem Vertreter derselben Klasse) eine vernachlässigbare Abänderung darstellt. Ist M RN eine Untermannigfaltigkeit, so ist die Abbildung Tp M ! Tpunt M; Œ˛ 7! ˛.0/ P
(1.6)
wohldefiniert und bijektiv, denn ist Œ˛ D Œˇ; so ist .h ı ˛/0 .0/ D .h ı ˇ/0 .0/ für jede Karte h um p; insbesondere für einen Flachmacher H . Anwenden von H 1 P ergibt mit der Kettenregel also ˛.0/ P D ˇ.0/. Wir werden vorläufig in der Notation Tpunt M und Tp M unterscheiden. Einen wichtigen Unterschied gibt es zwischen Tpunt M und Tp M : Für alle p; p 0 2 M mit p 6D p 0 ist Kp .M / 6D Kp0 .M /; also ist Tp M \ Tp0 M D ;. Jedoch unt unt 0 Tpunt M \ Tpunt 0 M f0g; und manchmal gilt sogar Tp M D Tp 0 M für p 6D p ; unt 1 unt 1 z. B. T.1;0/ S D T.1;0/ S D f0g R. Ist U Rn eine offene Teilmenge, so ist für p 2 U der Tangentialraum an der Stelle p durch Tpunt U D Rn gegeben. Eine repräsentierende Kurve für v 2 Rn ist v;p W "; "Œ! M ; v;p .t/ D p C tv
(1.7)
für " so klein, dass das Bild der Kurve in U enthalten ist. Kombiniert man das mit (1.6), so ist also für offenes U Rn Tp U Š Rn ; Œv;p 7! v eine bijektive Abbildung. Man betrachtet nun Tp U mit Hilfe dieser Abbildung als Vektorraum, d. h. für Œ˛; Œˇ 2 Tp U setzt man Œ˛ WD Œ˛.0/;p P
für 2 R ,
: Œ˛ C Œˇ WD Œ˛.0/C P ˇP .0/;p
C Tangentialraum und Differential
23
Entsprechend verfährt man auch für beliebige Mannigfaltigkeiten M; um Tp M als Vektorraum aufzufassen: Definition 1.25. Sei .U; h/ eine Karte von M um p und vp 2 Tp M ein Tangentialvektor. Man definiert hp .vp / als den gemeinsamen Wert von .h ı ˛/0 .0/; wenn ˛ die vp repräsentierenden Kurven durchläuft. Dies ergibt die Abbildung hp W Tp M ! Rn ; Œ˛ 7! .h ı ˛/0 .0/ :
(1.8)
Satz 1.26. Sei .U; h/ eine Karte von M um p. a. Die Abbildung hp ist bijektiv, und ihre Inverse ist gegeben durch 'p W Rn ! Tp M ; v 7! Œv;h ;
(1.9)
wobei v;h .t/ D h1 .v;h.p/ .t// mit v;h.p/ wie in (1.7) ist. Die Abbildung 'p hängt also nur von der Parametrisierung ' D h1 ab. b. Auf Tp M ist eine Vektorraum-Struktur durch Œ˛ C Œˇ WD 'p hp .Œ˛/ C hp .Œˇ/ definiert, für die hp und 'p Isomorphismen sind. Diese Struktur hängt nicht von der betrachteten Karte ab. Beweis. a. Man rechnet anhand der Definitionen sofort nach, dass hp .'p .v// D v für alle v 2 Rn und 'p .hp .vp // D vp für alle vp 2 Tp M . b. Nur die Unabhängigkeit von der betrachteten Karte ˇ ist nicht völlig trivial. Ist .V; k/ eine weitere Karte um p und w D k ı h1 ˇh.U \V / ; so ist d ˇˇ d ˇˇ .k ı ˛/ D .k ı h1 / ı .h ı ˛/ D Jw .h.p//hp .Œ˛/ : t D0 dt dt t D0 (1.10) Die Wohldefiniertheit der Vektorraumstruktur folgt nun sofort aus der Linearität von Jw .h.p//; denn ist p durch (1.9) definiert, jedoch mit k 1 statt h1 ; so folgt aus (1.10) kp .Œ˛/ D
p .v/
D 'p ..Jw .h.p///1 .v// D 'p .Jw 1 .k.p//.v//
t u
Ist M RN eine Untermannigfaltigkeit, ' W U 0 ! M RN eine lokale Parametrisierung mit '.p 0 / D p; so ergibt (1.6) kombiniert mit 'p das Differential Rn ! Tpunt M ; v 7! Pv;h .0/ D J' .p 0 /v : In analoger Weise erzeugt auch bei allgemeinen Mannigfaltigkeiten eine lokale Parametrisierung eine spezielle Basis für den Tangentialraum:
24
1 Mannigfaltigkeiten
U
p
k
h
h(p)
w
k(p)
Abb. 1.6 Wirkung eines Kartenwechsels auf den Tangentialraum
Definition 1.27. Ist .U; h/ eine Karte von M um p und ' D h1 ; so heißt .h/ .p/; : : :; @ .p/ mit @.h/ Dp.h/ D @.h/ n 1 j .p/ WD 'p .e j / und p 2 U die (durch .U; h/ gegebene) Koordinatenbasis von Tp M . Ist klar von welcher Karte die Rede ist, so schreibt man auch @j .p/ statt @.h/ j .p/. Man benutzt auch die Notation @i;p WD @i .p/. .h/
Da 'p ein Isomorphismus ist, bilden die Vektoren @j .p/ tatsächlich eine Basis von Tp M . Dass die Symbole für die Koordinatenbasis denen für die partiellen Ableitungen so ähnlich sehen, ist kein Zufall. Tangentialvektoren erlauben nämlich die Definition von entsprechenden Richtungsableitungen: Satz 1.28. Ist vp 2 Tp M; p 2 U M offen, f; g 2 C 1 .U / und ˛ eine vp repräsentierende Kurve, so ist vp f WD
d ˇˇ f ı˛ dt t D0
(1.11)
wohldefiniert (also unabhängig vom Repräsentanten ˛), und es gilt: (i) (ii)
.vp C wp /f D vp f C wp f sowie vp .f C g/ D vp f C vp g für vp ; wp 2 Tp M; ; 2 R (Linearität), vp .f g/ D .vp f /g.p/ C f .p/.vp g/ (Derivations-Eigenschaft).
Der Wert vp f heißt Richtungsableitung von f in Richtung vp .
C Tangentialraum und Differential
25
∂2
U ∂1
Abb. 1.7 Koordinatenbasis
Beweis (der Wohldefiniertheit). Ist Œ˛ D Œˇ; so ist .h ı ˇ/0 .0/ D .h ı ˛/0 .0/ für jede Karte um p D ˛.0/ D ˇ.0/; also d ˇˇ d ˇˇ .f ı ˛/ D .f ı h1 ı h ı ˛/ t D0 dt dt t D0 D Jf ıh1 .h.p//..h ı ˛/0 .0// D Jf ıh1 .h.p//.h ı ˇ/0 .0/ d ˇˇ D .f ı ˇ/ : dt t D0 t u Der Zusammenhang mit partiellen Ableitungen wird nun ganz deutlich, wenn .h/ man speziell vp D @i;p betrachtet. Ist nämlich .U; h/ Karte um p 2 M; so ist d ˇˇ f .h1 .h.p/ C te i // D dt t D0 @ D .f ı h1 /.h.p// : @xi
@.h/ i;p f D
.id/
Ist insbesondere M Rn offen, so ist @i;p f D
@f @xi
.p/.
Als Nächstes werden wir das Differential einer differenzierbaren Abbildung f W M ! N definieren. An jeder Stelle x 2 M wird dies eine lineare Approximation von f sein, also dfx 2 Hom .Tx M; Tf .x/ N /.
26
1 Mannigfaltigkeiten
Definitionen 1.29. a. Ist f W M ! N eine bei p 2 M differenzierbare Abbildung zwischen zwei differenzierbaren Mannigfaltigkeiten, so ist das Differential von f an der Stelle p durch die lineare Abbildung dfp W Tp M ! Tf .p/ N ; Œ˛ 7! Œf ı ˛ gegeben. b. Das Differential von f ist durch df W M ! Hom .TM; f T N / ; x 7! dfx S mit Hom .TM; f T N / WD Hom .Tx M; Tf .x/ N / definiert. x2M
Die Linearität des Differentials, die wir hier behauptet haben, wird erst in Korollar 1.31 gezeigt werden. Zuerst einmal wollen wir sehen, was diese Definition in den Spezialfällen bedeutet, wo N Rk eine Untermannigfaltigkeit oder M Rk eine offene Teilmenge ist. Ist N Rk ; so unterscheidet man nicht zwischen dfp W Tp M ! Tf .p/ N und der Zusammensetzung k 0 Tp M ! Tf .p/ N ! Tfunt .p/ N R ; Œ˛ 7! .f ı ˛/ .0/ ;
also gilt im Fall N D R
dfp .vp / D vp f :
(1.12)
Ist M R offen, so wird nicht zwischen dfp W Tp M ! Tf .p/ N und der Zusammensetzung k
Rk Š Tp M ! Tf .p/ N ; v 7! Œf .p C tv/ unterschieden. Damit erhalten die Abbildungen aus 1.25 und 1.26 eine neue Bedeutung: Für eine Karte h und die entsprechende Parametrisierung ' WD h1 ist 'p D d'p 2 Hom .Rn ; Tp M / ;
(1.13)
hp D dhp 2 Hom .Tp M; Rn / :
(1.14)
Nun überlegen wir uns, wie das Differential aussieht, wenn man die Abbildung f lokal durch Karten beschreibt: Satz 1.30. Sei f W M ! N eine differenzierbare Abbildung zwischen differenzierbaren Mannigfaltigkeiten. Sei p 2 M; .U; h/ eine Karte von M um p und .V; k/ eine Karte von N um f .p/ mit f .U / V . Sei D k 1 . Dann ist dfp .v/ D d k.f .p// JfQ .h.p// . dhp .v// für alle v 2 Tp M . Dabei bezeichnet wie üblich fQ die Beschreibung von f durch Karten: fQ WD k ı f ı h1 W U 0 ! V 0 .
C Tangentialraum und Differential
27
Beweis. Sei v 2 Tp M; ˛ W "; "Œ! U eine v repräsentierende Kurve. Dann gilt nach der Kettenregel: d ˇˇ .k ı f ı ˛.t// dt t D0 d ˇˇ .fQ ı h ı ˛.t// D JfQ .h.p//.h ı ˛/0 .0/ D dt t D0 D JfQ .h.p// dhp .v/ :
dkf .p/ . dfp .v// D
t u Damit können nun leicht die wichtigsten Eigenschaften des Differentials einer Abbildung zwischen Mannigfaltigkeiten aus den Eigenschaften des Differentials einer Abbildung zwischen offenen Teilmengen des Rk hergeleitet werden. Korollar 1.31. a. Das Differential dfp ist linear für jedes p 2 M . b. Das Differential der Identität ist die Identität d.idM /p D idTp M . c. Es gilt die Kettenregel: Ist f W M ! N differenzierbar bei p und g W N ! L differenzierbar bei f .p/; so ist g ı f W M ! L differenzierbar bei p und es gilt: d.g ı f /p D dgf .p/ ı dfp : Für Untermannigfaltigkeiten, die als Urbilder eines regulären Wertes gegeben sind, ist der Tangentialraum mit Hilfe des Differentials leicht zu berechnen: Satz 1.32. Ist f W M ! N differenzierbar, p 2 N regulärer Wert und M0 D f 1 .p/; so ist für q 2 M0 Tq M0 D Kern dfq : Beweis. Aus Dimensionsgründen genügt es, Tq M0 Kern dfq zu zeigen. Ist aber v D Œ˛ 2 Tq M0 ; so ist dfq .v/ D Œf ı ˛ D 0 wegen .f ı ˛/.t/ p. t u Beispiele: a. Zur Berechnung des Tangentialraums der Sphäre benutzt man Tp Sn D Kern dFp ; wobei F W RnC1 ! R; x 7! jxj2 also dFp .v/ D 2hp j vi ist. Damit ist Tp Sn D fv 2 RnC1 j hp j vi D 0g. b. Für den Tangentialraum der orthogonalen Gruppe gilt Tid O.n/ D so.n/ WD fX 2 Rnn j X T D X g. Wir benutzen zum Beweis die Abbildung (1.4). Dann ist Tid O.n/ D Kern dFid mit F .A/ WD AT A; also dFA .X / D AT X C X T A. Damit ist dFid .X / D X C X T und folglich Kern dFid D so.n/.
28
1 Mannigfaltigkeiten
Aufgaben zu Kap. 1 1.1. a. Sei K der Doppelkegel K WD f.x; y; z/ 2 R3 j z 2 D x 2 C y 2 g R3 : Zeigen Sie, dass K nicht lokal euklidisch ist. (Hinweis: Man betrachte den Rand einer offenen Umgebung des Punktes .0; 0; 0/ in K.) b. Wir betrachten auf X WD R2 n f0g die Relation: .x; y/ .x; y 0 / falls x 6D 0; .0; y/ .0; y 0 / falls sign y D sign y 0 . (i)
Man zeige ist eine Äquivalenzrelation. Vermöge zerfällt X also in disjunkte Äquivalenzklassen [ XD K.v/; wobei K.v/ WD fv 0 j v 0 2 X; v 0 vg ; v2X
und wir haben eine Abbildung W X ! X= ; v 7! K.v/. Wir definieren U X ist offen ” 1 .U / ist offen in R2 . (ii)
und bezeichnen das zugehörige Mengensystem mit . Man zeige: .X; / ist ein topologischer Raum, der lokal euklidisch aber nicht H AUSDORFFsch ist. (Hinweis: Man mache sich klar, dass man sich X= vorstellen kann wie .Rnf0g/[f0C ; 0 g; wobei jede Umgebung von 0˙ eine Menge der Form ı; 0Œ[f0˙ g[0; ı Œ enthält.)
c. Ist die Oberfläche des Einheitswürfels lokal euklidisch? Ist sie eine Untermannigfaltigkeit des R3 ? 1.2. Seien X und Y topologische Räume. a. Verifizieren Sie, dass durch die in 1.5d gegebene Definition eine Topologie auf X Y definiert wird (die sogenannte Produkttopologie). b. Zeigen Sie: Sind X und Y H AUSDORFF-Räume, so ist auch X Y mit der Produkttopologie aus a. ein H AUSDORFF-Raum. c. Zeigen Sie: Genau dann ist ein topologischer Raum X ein H AUSDORFF-Raum, wenn die Diagonale 4X WD f.x; x/ W x 2 X g X X abgeschlossen in X X (bezüglich der Produkttopologie) ist. 1.3. a. Es sei PC D .0; : : :; 0; 1/T der „Nordpol“ und P D .0; : : :; 0; 1/T der „Südpol“ der n-Sphäre n S W D x D .x1 ; : : :; xnC1 / 2 RnC1 W jxj q 2 2 D x1 C C xnC1 D 1 RnC1 :
Aufgaben
29
Wir definieren eine Abbildung 'C W Sn n fPC g ! Rn wie folgt: für jeden Punkt P 2 Sn n fPC g sei 'C .P / derjenige Punkt in Rn ; so dass .'C .P /; 0/ 2 Rn f0g der Schnittpunkt der Geraden durch PC und P mit der Äquatorialebene f.x; 0/T j x 2 Rn g RnC1 ist. [Am besten veranschaulichen Sie sich die Definition zunächst anhand der S2 .] Ersetzt man in dieser Definition den Nordpol durch den Südpol P ; so erhält man analog eine Abbildung ' W Sn n fP g ! Rn . Die Abbildungen 'C und ' heißen stereographische Projektionen. Geben Sie explizite Formeln für sie an und zeigen Sie, dass durch die stereographischen Projektionen ein differenzierbarer Atlas gegeben ist. b. Gibt es einen Atlas für Sn ; der aus genau einer Karte besteht? c. (Kugelkoordinaten) Wir betrachten die Sphäre S2 . Sei U WD 0; 2Œ 0; Œ und 0 1 cos ' sin # W U ! S2 ; .'; #/ WD @ sin ' sin # A cos # Zeigen Sie, dass W U ! .U / ein Homöomorphismus ist. Folglich ist eine lokale Parametrisierung der S2 und . .U /; 1 / eine Karte. Was ist das Koordinatengebiet? Wie kann man diese Karte zu einem differenzierbaren Atlas der Sphäre ergänzen, der genau zwei Karten enthält? d. Bestimmen Sie den Tangentialraum am Punkt p D 12 ; 12 ; p1 für die Sphäre 2
S2 . 1.4. Seien R; r 2 R; 0 < r < R. Unter einem Rotationstorus Tr;R verstehen wir die 2-dimensionale Fläche im R3 ; die durch Rotation des Kreises f.x; y; z/ 2 R3 j .x R/2 C z 2 D r 2 ; y D 0g um die z-Achse entsteht. a. Beweisen Sie mit Hilfe des Satzes vom regulären Wert, dass Tr;R eine 2dimensionale Fläche ist. b. Geben Sie einen Atlas für Tr;R an, indem Sie zeigen, dass durch
W0; 2Œ0; 2Œ! Tr;R ; 1 0 .R C r cos #/ cos '
.'; #/ WD @ .R C r cos #/ sin ' A r sin # eine lokale Parametrisierung gegeben ist und die dadurch gegebene Kartenabbildung geeignet zu einem Atlas ergänzen. c. Zeigen Sie, dass S1 S1 diffeomorph zu Tr;R ist. d. Bestimmen Sie den Tangentialraum von Tr;R im Punkt p p ! p p 3R 6r R 2r 2r C ; C ; : 2 4 2 4 2
30
1 Mannigfaltigkeiten
1.5. Die beiden Endpunkte x und y eines Stabes der Länge l sollen sich auf der Einheitssphäre S2 in R3 befinden. Man zeige, dass die Menge Ml der möglichen Endpunkte .x; y/ des Stabes eine Untermannigfaltigkeit von R6 bildet. Was ist die Dimension von Ml ? Hinweis: Es ist hilfreich, die Fälle l 2 0; 2Œ und l D 2 zu unterscheiden. 1.6. Sei 2 R n Q; W R ! R4 ; t 7! .cos.t/; sin.t/; cos.t/; sin.t//. B WD f.t/ j t 2 Rg S1 S1 . Man zeige, dass stetig differenzierbar und injektiv ist und P .t/ 6D 0 für alle t 2 R. Ist B eine Untermannigfaltigkeit von R4 ? 1.7. Zeigen Sie: RP1 ist diffeomorph zu S1 . (Hinweis: Man betrachte die Abbildung f W RP1 ! S1, Œ.cos ; sin / 7! .cos 2; sin 2/.) 1.8. Es sei SL.n/ D fA 2 Rnn j det.A/ D 1g die Gruppe der reellen n n-Matrizen mit Determinante 1. Man zeige: a. SL.n/ ist eine .n2 1/-dimensionale Untermannigfaltigkeit von Rnn . b. Ist A 2 sl.n/ WD fA 2 Rnn j Spur .A/ D 0g eine Matrix mit Spur 0; so definiert .t/ WD etA ; t 2 R eine Kurve in SL.n/ mit .0/ D E und P .0/ D A. c. TE SL.n/ D sl.n/. 1.9. Seien M1 ; M2 differenzierbare Mannigfaltigkeiten und M WD M1 M2 die Produktmannigfaltigkeit, wie sie in Beispiel 1.17e. beschrieben wurde. Seien k W M ! Mk ; k D 1; 2 die kanonischen Projektionen. Zeigen Sie: a. Für p1 2 M1 ; p2 2 M2 ist die Abbildung T.p1 ;p2 / M ! Tp1 M1 Tp2 M2 ; v 7! . d1 /.p1 ;p2 / .v/; . d2 /.p1 ;p2 / .v/ stets ein Isomorphismus. In diesem Sinne kann also T.p1 ;p2 / M mit Tp1 M1 Tp2 M2 oder mit Tp1 M1 ˚ Tp2 M2 identifiziert werden. b. Sei N eine weitere Mannigfaltigkeit und f W M1 M2 ! N differenzierbar. Dann gilt mit der Identifizierung aus a. für v1 2 Tp1 M1 ; v2 2 Tp2 M2 df.p1 ;p2 / .v1 ; v2 / D d.1/ f.p1 ;p2 / .v1 / C d.2/ f.p1 ;p2 / .v2 / mit den „partiellen Differentialen“ d.1/ f.p1 ;p2 / WD df .; p2 /p1 W Tp1 M1 ! Tq N und d.2/ f.p1 ;p2 / WD df .p1 ; /p2 W Tp2 M2 ! Tq N (q WD f .p1 ; p2 /). 1.10. Unter einer L IEgruppe G versteht man eine differenzierbare Mannigfaltigkeit mit kompatibler Gruppenstruktur, d. h. G ist gleichzeitig eine Gruppe, und die Inversen-Abbildung i W G ! G; g 7! g1 und die Multiplikationsabbildung m W G G ! G; .g1 ; g2 / 7! g1 g2
Aufgaben
31
sind differenzierbar. Zeigen Sie, dass die Differentiale von i und m an der Einheit 1 2 G durch . di /1 W T1 G ! T1 G; x 7! x und . dm/.1;1/ W T1 G ˚ T1 G ! T1 G; .x; y/ 7! x C y gegeben sind.
Kapitel 2
Multilineare Algebra
Um die angestrebte begriffliche Klarheit zu fördern, haben wir die algebraischen – also die rein rechnerischen – Aspekte der Differentialgeometrie von den geometrischen abgekoppelt und in diesem Kapitel versammelt. Dieses Kapitel ist damit eine Fortführung der linearen Algebra. Insbesondere wird der Begriff des Tensors eingeführt, der eine Verallgemeinerung sowohl des Begriffs des Vektors als auch der linearen Abbildung ist. Im letzten Abschnitt widmen wir zwei speziellen Typen, nämlich den symmetrischen und den alternierenden Tensoren, besondere Aufmerksamkeit. Die alternierenden Tensoren eröffnen insbesondere die Möglichkeit, die geometrischen Begriffe von Orientierung und orientiertem Volumen präzis zu definieren, was wir am Schluss kurz erläutern werden. Hier sollte vor einem Missverständnis gewarnt werden: Unter Physikern (teilweise auch unter Mathematikern) ist es üblich, die Begriffe „Tensor“ und „Tensorfeld“ synonym zu verwenden. Die in diesem Kapitel betrachteten Tensoren sind jedoch definitiv keine Tensorfelder. Vielmehr ist ein Tensorfeld eine Abbildung, die jedem Punkt einer Mannigfaltigkeit einen Tensor im Sinne dieses Kapitels zuordnet, und diese Felder werden uns ab dem nächsten Kapitel noch sehr beschäftigen. Die Bezeichnungen werden in diesem Kapitel leider etwas aufwendig, weil man für die Komponenten der betrachteten Tensoren beliebig viele obere und untere Indizes zulassen muss. Es mag ein Trost sein, dass in der Praxis nur selten mehr als vier Indizes gebraucht werden. Trotzdem müssen wir die grundlegenden Definitionen für den Fall beliebig vieler Indizes formulieren, da nur so ihre begriffliche Klarheit gewährleistet werden kann. In diesem Punkt müssen wir also auf Ihre Geduld vertrauen.
A Dualität bei endlich dimensionalen Vektorräumen Als Vorbereitung skizzieren wir in diesem Abschnitt die Dualitätstheorie für endlichdimensionale Vektorräume. Sie ist eigentlich nur eine Neuformulierung von ge-
K.-H. Goldhorn, H.-P. Heinz, M. Kraus, Moderne mathematische Methoden der Physik DOI 10.1007/978-3-540-88544-3, © Springer 2009
33
34
2 Multilineare Algebra
wissen einfachen Resultaten über lineare Abbildungen in einem Spezialfall, und möglicherweise ist sie Ihnen wohlbekannt (vgl. etwa [36], Kap. 7 und 21). Stets sei V ein n-dimensionaler K-Vektorraum. Definitionen 2.1. Eine lineare Abbildung V ! K heißt ein lineares Funktional oder eine Linearform. Der Raum aller Linearformen auf V wird mit V bezeichnet und heißt der Dualraum zu V . Die Elemente von V werden auch als Kovektoren bezeichnet. Satz 2.2. a. Der Raum V der Linearformen auf V bildet zusammen mit der üblichen Addition von Abbildungen und Multiplikation mit Skalaren einen n-dimensionalen Vektorraum. b. Ist A D .a1 ; : : :; an / eine Basis von V; so ist A WD .˛ 1 ; : : :; ˛ n /; wobei ˛ i 2 V durch ˛ i .aj / D ıji ; 1 i; j n (2.1) gegeben ist, eine Basis von V . Diese Basis heißt die zu A duale Basis. Beweis. Wie aus der Linearen Algebra bekannt, ist dim HomK .V; W / D dim V dim W; insbesondere dim V D n. Es bleibt also nur die lineare Unabhängigkeit von f˛ 1 ; : : :; ˛ n g zu prüfen. Dies geschieht durch Einsetzen der Basis A in die Gleichung t u 1 ˛ 1 C C n ˛ n D 0. Ist in V eine Basis A gegeben, so kann man bekanntlich V mit K1n identifizieren, indem man jeder Linearform ' 2 V die Matrix 'A 2 K1n zuordnet (vgl. z. B. [36], Kap. 7). Insbesondere ist dann A D .˛ 1 ; : : :; ˛ n / durch 1 ˛A D .1; 0; : : :; 0/ ; :: : n D .0; : : :; 1/ ˛A
gegeben. Ist A D .a1 ; : : :; an / eine fest vorgegebene Basis von V; A D .˛ 1 ; : : :; ˛ n / die duale Basis, so kann man den Index A auch weglassen, schreibt also für v 2 V; ' 2V v D .v 1 ; : : :; v n / ' D .'1 ; : : :; 'n /
für v D für ' D
n X i D1 n X
v i ai ; 'i ˛ i :
i D1
Die Zahlen v i 2 K und 'i 2 K heißen die Komponenten von v und ' bezüglich A und A .
A Dualität bei endlich dimensionalen Vektorräumen
35
Es ist dann '.v/ D
n X
'i ˛ i .v/
i D1
D
n X
0 'i ˛ i @
i D1
D
n X
1 v j aj A
j D1
n X
'i v j ˛ i .aj / D
i;j D1
D
n X
n X
'i v j ıji
i;j D1
'i v i ;
i D1
insbesondere also auch '.ai / D 'i . Satz i 2.3. Sind A D .a1 ; : : :; an / und B D .b1 ; : : :; bn / Basen von V und C D ck k;i D1;:::;n die Transformationsmatrix, also bk D
n X
cki ai ;
i D1
so ist die Transformationsmatrix zwischen den dualen Basen A D .˛ 1 ; : : :; ˛ n / und B D .ˇ 1 ; : : :; ˇ n / durch die transponierte inverse Matrix, also durch ˛i D
n X
cki ˇ k
kD1
gegeben. Der Beweis ist eine leichte Übungsaufgabe. Ist .V; h j i/ ein endlich dimensionaler Prähilbertraum, also h j i ein Skalarprodukt auf V; so sind V und V nicht nur isomorph, sondern können sogar miteinander identifiziert werden, d. h. es existiert ein kanonischer Isomorphismus zwischen V und V : Satz 2.4. Ist .V; h j i/ ein Prähilbertraum, so ist durch V ! V ; v 7! v b mit v b W w 7! hv j wi ein Isomorphismus gegeben. Die Umkehrung bezeichnen wir mit V ! V ; ' 7! ' # : Beweis. Die angegebene Abbildung ist offenbar linear nach Definition eines Skalarprodukts. Sie ist injektiv, denn aus hv j wi D 0 für alle w 2 V; also insbesondere
36
2 Multilineare Algebra
für w D v; folgt auch v D 0. Damit folgt die Isomorphie aus Dimensionsgründen. t u Ist A D .a1 ; : : :; an / ; v D
n X
v i ai und hai j aj i D gij ;
i D1
*
so ist b
b
.v /i D v .ai / D hv j ai i D
n X
+ j
v aj j ai D
j D1
n X
v j gj i :
j D1
Die Matrix .gij / beschreibt also den Isomorphismus aus Satz 2.4 in Bezug auf die Basen A und A . Ist A D .a1 ; : : :; an/ speziell eine Orthonormalbasis von .V; h j i/; so ist offenbar A D a1b ; : : :; anb . Ist also auf V ein Skalarprodukt gegeben, so induziert dies einen Isomorphismus V ! V ; der unabhängig von der Wahl einer Basis ist. Im allgemeinen Fall eines K-Vektorraums ist ein Isomorphismus V ! V aber erst durch die Wahl einer Basis festgelegt. Da die Wahl einer Basis willkürlich ist – zum Beispiel im physikalischen Raum –, muss oft sorgfältig zwischen V und V unterschieden werden. Andererseits kann ein Vektor v 2 V durch das Einsetzen iv W V ! R; ' 7! '.v/ als Linearform auf V aufgefasst werden. Dies werden wir im weiteren Verlauf ausnutzen, um Dinge, die man mit Kovektoren (D Linearformen) leicht tun kann, auch mit Vektoren zu tun. Definition 2.5. .V / D V heißt der Bidualraum von V . Satz 2.6. Durch
j W V ! V ;
v 7! iv
(2.2)
ist ein kanonischer Isomorphismus gegeben. Ist A D .a1 ; : : :; an / eine Basis von V; so ist A D .ia1 ; : : :; ian / die duale Basis der dualen Basis. Wieder ist der Beweis eine leichte Übung. Bisher wurden Vektorräumen Dualräume zugeordnet. Auch Abbildungen A 2 HomK .V; W / zwischen Vektorräumen werden nun duale Abbildungen, jedoch in umgekehrter Richtung, zugeordnet. Definition 2.7. Sind V und W K-Vektorräume, A 2 HomK .V; W /; so ist die duale Abbildung A 2 HomK .W ; V / durch A .'/ WD ' ı A definiert. Man rechnet leicht nach, dass .idV / D idV gilt und .A ı B/ D B ı A für A 2 HomK .V; W / und B 2 HomK .U; V /. Ist schließlich C D .cji / die Matrix, die die lineare Abbildung A in Bezug auf die Basen A D fa1 ; : : :; an g von V; B D fb1 ; : : :; bm g von W beschreibt, so wird die duale Abbildung bzgl. der dualen Basen durch die transponierte Matrix C T D .cj i / beschrieben. Auch dies bestätigt man durch eine leichte Rechnung.
B Multilineare Abbildungen und Tensoren
37
B Multilineare Abbildungen und Tensoren j :::j
In der Physik werden Tensoren meist als Zahlensysteme ci11:::ipq mit unteren und oberen Indizes angesehen, die sich jedoch auf ein gegebenes Koordinatensystem beziehen und daher bei Koordinatenwechsel auf eine ganz bestimmte Art transformiert werden müssen. Diese Beschreibung lässt natürlich offen, was ein Tensor eigentlich ist, und außerdem verbaut sie von vornherein jede Möglichkeit, Rechnungen ohne den Rückgriff auf Koordinaten durchzuführen. Die multilineare Algebra, die wir jetzt erklären wollen, eröffnet die Möglichkeit, Ausdrücken der Form v1 ˝ v2 ˝ ˝ vq ˝ ' 1 ˝ ' 2 ˝ ˝ ' p
(2.3)
(und auch endlichem Summen von solchen Ausdrücken) einen konkreten mathematischen Sinn zu verleihen. Dabei sind v1 ; : : :; vq gegebene Vektoren aus einem Vektorraum V und ' 1 ; : : :; ' p 2 V entsprechende Kovektoren, und das Zeichen „˝“ (Tensorprodukt) soll sich wie eine Multiplikation verhalten, also insbesondere die üblichen Klammerregeln erfüllen. Die Festlegung eines Koordinatensystems entspricht der Wahl einer Basis fa1 ; : : :; an g von V und der dualen Basis ˛ 1 ; : : :; ˛ n in V . Entwickelt man nun die vj und die ' i nach diesen Basen, setzt die Entwicklungen in (2.3) ein und distribuiert alles aus, so ergibt sich eine Summe von Termen der Gestalt j :::j ci11:::ipq aj1 ˝ ˝ ajq ˝ ˛ i1 ˝ ˝ ˛ ip : j :::j
Auf diese Weise beschreibt das Zahlensystem der ci11:::ipq tatsächlich den Tensor (2.3), und es ist prinzipiell auch klar, wie man diese Koeffizienten beim Übergang zu einer anderen Basis von V – und damit auch zu einer neuen dualen Basis von V – umzurechnen hat, wenn das im Einzelnen auch kompliziert sein mag. Die Ausdehnung auf endliche Summen von Ausdrücken der Form (2.3) ist trivial. Wir werden mit dem Tensorprodukt von Kovektoren beginnen, da dieses am leichtesten mathematisch exakt eingeführt werden kann. Vektoren werden dann mittels (2.2) als Linearformen auf V aufgefasst, so dass man das vorher für Linearformen eingeführte Tensorprodukt auch für sie nutzbar machen kann. Am Schluss betrachten wir „gemischte Tensoren“, bei denen sowohl Vektoren als auch Kovektoren vorkommen. Im Folgenden seien V; V1 ; : : :; Vp R-Vektorräume der Dimensionen n; n1 ; : : :; np und W ein k-dimensionaler R-Vektorraum. Lineare Abbildungen und Linearformen werden nun verallgemeinert: Definitionen 2.8. a. Unter einer p-linearen oder multilinearen Abbildung auf V1 Vp mit Werten in W versteht man eine Abbildung ' W V1 Vp ! W; die in jeder Variablen bei Festhalten der übrigen linear ist, also '.v1 ; : : :; vj C vj0 ; : : :; vp / D '.v1 ; : : :; vj ; : : :; vp / C '.v1 ; : : :; vj0 ; : : :; vp /
38
2 Multilineare Algebra
für vk 2 Vk ; k D 1; : : :; p; vj0 2 Vj ; ; 2 R erfüllt. Ist W D K; so spricht man von einer Multilinearform. b. Den Raum der p-linearen Abbildungen auf V1 Vp mit Werten in W bezeichnet man mit Multp .V1 ; : : :; Vp I W /. Für V D V1 D D Vp schreibt man auch Multp .V I W / und für W D R auch Multp .V1 ; : : :; Vp / DW V1 ˝ ˝ Vp bzw. Multp .V / DW
p O
V:
V1 ˝ ˝ Vp heißt auch das Tensorprodukt von V1 ; : : :; Vp ; und Elemente aus V1 ˝ ˝ Vp heißen p-fach kovariante Tensoren. c. Statt von 2-linear spricht man auch von bilinear, statt von 3-linear von trilinear. Offenbar bildet Multp .V1 ; : : :; Vp I W / mit der üblichen Addition von Abbildungen und der skalaren Multiplikation einen Vektorraum. Ein Beispiel für eine nMultilinearform auf Rn ist die Determinante, für eine Bilinearform ein Skalarprodukt und für eine bilineare Abbildung auf R3 mit Werten in R3 das Vektorprodukt auf R3 . Sind in Vektorräumen V und W Basen gewählt, so werden lineare Abbildungen A 2 HomK R.V; W / bekanntlich durch Matrizen beschrieben. Ganz ähnlich kann man auch multilineare Abbildungen durch Systeme von Zahlen beschreiben: Definition 2.9. Ist ' 2 Multp .V1 ; : : :; Vp I W / .j / .j / A.j / D a1 ; : : :; anj ; j D 1; : : :; p Basen der Vj , B D .b1 ; : : :; bk / eine Basis von W ; so werden die Komponenten j 'i1 :::ip
von ' durch
;
1 ir nr ; 1 r p ; 1j k
k X .1/ .p/ j ' ai1 ; : : :; aip D 'i1 :::ip bj
(2.4)
j D1
definiert. Für W D R werden die Komponenten mit .'i1 :::ip /1i1 n1 ;:::;1ip np bezeichnet. Beispiele: (i)
Die Komponenten der Determinante im Rn sind durch ( 0 falls ir D is für ein r ¤ s .det/i1 :::in D sgn ./ sonst gegeben, wobei die Permutation ij abbildet.
1:::n i1 :::in
ist, d. h. die Permutation, die j auf
B Multilineare Abbildungen und Tensoren
(ii)
39
Die Komponenten des Kreuzprodukts auf R3 sind 8 ˆ < 1 ; falls .ij k/ eine zyklische Vertauschung von .1; 2; 3/ ist, k 'ij D 1 ; falls .ij k/ eine zyklische Vertauschung von .2; 1; 3/ ist, ˆ : 0 sonst.
Bemerkung: Das System der Komponenten des Kreuzprodukts wird in der Physik als der „Epsilon-Tensor“ bezeichnet und "kij geschrieben. Wir haben gerade einer gegebenen multilinearen Abbildung ein System von Komponenten zugeordnet. Umgekehrt ist bei gegebenen Basen von V1 ; : : :; Vp und W eine multilineare Abbildung durch n1 np k reelle Zahlen 'ij1 :::ip 2 R vermittels (2.4) definiert. Die Darstellung durch Komponenten gestattet es, die Dimension des Raums der multilinearen Abbildungen zu berechnen: Satz 2.10. Multp .V1 ; : : :; Vp ; W / ist ein reeller Vektorraum der Dimension n1 np k. Beweis. Sind A.j / und B Basen von Vj und W; so ist ein Isomorphismus Multp .V1 ; : : :; Vp I W / ! Rn1 np k durch die Abbildung auf die Komponenten gegeben. t u Wir definieren nun eine Art Multiplikation, durch die gegebenen Linearformen ein kovarianter Tensor zugeordnet wird. Ist nämlich ' j 2 Vj so ist durch .' 1 ˝ ˝ ' p /.v1 ; : : :; vp / WD ' 1 .v1 / ' p .vp / ; vj 2 Vj
(2.5)
eine multilineare Abbildung definiert, die man als das Tensorprodukt der ' j bezeichnet. Dabei gilt ˚ Multp .V1 ; : : :; Vp / D LH ' 1 ˝ ˝ ' p j ' j 2 Vj : Eine Basis von Multp .V1 ; : : :; Vp / ist durch ip i1 ; 1 ij nj ; j D 1; : : :; p ˝ ˝ ˛.p/ "i1 :::ip WD ˛.1/ nj 1 gegeben mit .A.j / / D ˛.j / ; : : :; ˛.j / Basis von Vj ; also ( ."
i1 :::ip
/j1 :::jp D
1 ; ir D jr ; r D 1; : : :; p 0 sonst.
Kovariante Tensoren stellen eine Verallgemeinerung der Linearformen dar. Vektoren werden jetzt durch kontravariante Tensoren verallgemeinert. Erinnert man sich daran, dass man mittels des Isomorphismus j aus Satz 2.6 die Elemente von V als Linearformen auf V auffassen kann, so liegt nahe, wie das Tensorprodukt von p Vektorräumen zu definieren ist:
40
2 Multilineare Algebra
Definitionen 2.11. a. Das Tensorprodukt von V1 ˝ ˝ Vp ist der Vektorraum der p-Linearformen auf V1 Vp . Elemente aus V1 ˝ ˝ Vp nennt man kontravariante Tensoren vom Rang p. ˝ ˝Vp ist der Vektorraum der b. Das Tensorprodukt von V1 ˝ ˝Vr ˝VrC1 p-Linearformen auf V1 Vr VrC1 Vp . Elemente aus V1 ˝ ˝ ˝ ˝ Vp nennt man r-fach kontra- und .p r/-fach kovariante Vr ˝ VrC1 Tensoren. c. Sind vr 2 Vr Vektoren, r D 1; : : :; p; so ist durch v1 ˝ ˝ vp W V1 Vp ! R .' .1/ ; : : :; ' .p/ / 7! ' .1/ .v1 / ' .p/ .vp / ein p-fach kontravarianter Tensor gegeben. Diesen bezeichnet man als das Tensorprodukt der Vektoren v1 ; : : :; vp . .r/ .r/ Insbesondere ist für Basen a1 ; : : :; anr D A.r/ von Vr ; r D 1; : : :; p durch .1/ .p/ ai1 ˝ ˝ aip 1i1 n1 ;:::;1ip np
eine Basis von V1 ˝ ˝ Vp gegeben, und durch irC1 ip .r/ ai.1/ ˝ ˝ a ˝ ˛ ˝ ˝ ˛ ir .rC1/ .p/ 1
1i1 n1 1ip np
ist eine Basis von V1 ˝ ˝ Vr ˝ VrC1 ˝ ˝ Vp gegeben, wobei A.r/ D 1 nr ˛.r/ ; : : :; ˛.r/ ist. Die Komponenten eines r-fach kontra- und .p r/-fach kovarianten Tensors ' sind durch .p/ i1 ir 1 :::ir D ' ˛.1/ ; : : :; ˛.r/ ; ai.rC1/ : : :a 'iirC1:::i ip rC1 p
gegeben. Natürlich sind auch Tensorprodukte wie V1 ˝V2 ˝V3 ˝ ˝Vp definiert, wobei die Komponenten eines Tensors aus diesem Raum dann als ' i1
i2
ir :::
ip
notiert werden. Offenbar kann dabei die Reihenfolge der Faktoren im Tensorprodukt nicht beliebig vertauscht werden, d. h. das Tensorprodukt ist nicht kommutativ. Es wurde bereits in (2.4) beschrieben wie die Anwendung einer Multilinearform auf Vektoren in Komponenten berechnet wird. Ähnlich kann man für r-fach ko- und p r-fach kontravariante Tensoren ' 2 V1 ˝ ˝ Vr ˝ VrC1 ˝ ˝ Vp vorgehen: Ist j D j1 ; : : :; jnj 2 Vj ; j D 1; : : :; r ; n vj D vj1 ; : : :; vj j 2 Vj ; j D r C 1; : : :; p ;
B Multilineare Abbildungen und Tensoren
41
so ist ' 1 ; : : :; r ; vrC1 ; : : :; vp D X ip 1 r irC1 1 :::ir 'iirC1 :::ip i1 : : :ir vrC1 : : :vp :
(2.6)
1i1 n1 ::: 1ip np
Die Stellung der Indizes oben und unten, wie sie hier benutzt wird, ist Teil des sogenannten R ICCI-Kalküls. Aus der Stellung der Indizes ersieht man das Transformationsverhalten bei Basiswechsel. Beschreibt eine Verknüpfung von Tensoren einen Skalar, wie z. B. in (2.6), so treten in der Beschreibung im R ICCI-Kalkül die Indizes jeweils paarweise oben und unten auf. In der physikalischen Literatur wird oft die E INSTEINsche Summenkonvention benutzt: Über gegenüberstehende gleiche Indizes wird immer summiert, das Summenzeichen wird weggelassen. Wir verwenden diese Konvention hier jedoch nicht. Das Verhalten der Komponenten bei Basiswechsel wird in Aufgabe 2.4 behandelt. Ist v 2 V; ' 2 Multp .V /; so wird als Verallgemeinerung von (2.2) das innere Produkt iv ' 2 Multp1 .V / von v und ' durch .iv '/.v1 ; : : :; vp1 / WD '.v; v1 ; : : :; vp1 /
für vj 2 V; j D 1; : : :; p 1 (2.7)
definiert. Ist bezüglich einer Basis A von V v D .v 1 ; : : :; v n / ; ' D .'i1 :::ip /ij D1:::n ; so ist .iv '/i1 :::ip1 D
n X
v j 'j i1 :::ip1 :
j D1
Lineare Abbildungen Aj 2 Hom .Vj ; Wj / und ihre dualen Aj 2 Hom .Wj ; Vj / setzen sich in natürlicher Weise fort zu linearen Abbildungen A1 ˝ ˝ Ar ˝ ArC1 ˝ ˝ Ap W V1 ˝ ˝ Vr ˝ WrC1 ˝ ˝ Wp ! ˝ ˝ Vp : W1 ˝ ˝ Wr ˝ VrC1
Diese Abbildung ist durch die Forderung .A1 ˝ ˝ Ar ˝ ArC1 ˝ ˝ Ap /.v1 ˝ ˝ vr ˝ ' rC1 ˝ ˝ ' p / D Av1 ˝ ˝ Avr ˝ A ' rC1 ˝ ˝ A ' p
(2.8)
eindeutig festgelegt, da jeder Tensor als Summe von Termen der Form v1 ˝ ˝ vr ˝ ' rC1 ˝ ˝ ' p geschrieben werden kann. Allerdings ist diese Darstellung nicht eindeutig, so dass man nachrechnen muss, dass (2.8) bei verschiedenen Darstellungen desselben Tensors immer den gleichen Wert liefert. Das ist aber nicht schwer und wird hier übergangen.
42
2 Multilineare Algebra
Ist r D 0 und Vj D V; Wj D W; Aj D A für j D 1; : : :; p; so schreibt man für diese Abbildung auch p O A Multp A Ap : Im nächsten Satz stellen wir die wichtigsten Rechenregeln für ko- und kontravariante Tensoren zusammen. Satz 2.12. a. b. c. d. e.
.V1 ˝ V2 / ˝ V3 D V1 ˝ .V2 ˝ V3 / ; .V1 ˚ V2 / ˝ V3 D .V1 ˝ V3 / ˚ .V2 ˝ V3 / ; V˝W ; HomR .V; W / D N p Mult .V; W / D p V ˝ W ; .V1 ˝ V2 / D V1 ˝ V2 :
Die Beweise sind jeweils leichte Übungsaufgaben. Wir geben hier nur die Identifizierung aus c. exemplarisch an: Ein A 2 HomR .V; W / fasst man als bilineare Abbildung ˛A auf, indem man ˛A .v; '/ WD '.A.v// setzt. Umgekehrt ist ˛ 2 Mult2 .V; W / als Homomorphismus A˛ 2 Hom .V; W / aufzufassen, indem man setzt: A˛ .v/ WD ˛.v; / 2 W W : Dem Tensor ˛ D ' ˝ w 2 V ˝ W entspricht dabei die lineare Abbildung A˛ v D '.v/w ;
v2V :
Bemerkung: Der Identifikation aus c. verdanken die Tensoren ihren Namen, der sich von dem lateinischen Wort für „spannen“ ableitet. Im 19. Jahrhundert bezeichnete man so nämlich u. a. die lineare Abbildung, die einem Verzerrungsvektor (in erster Näherung) den Kraftvektor zuordnet, den ein elastisches Material als Antwort auf die Verzerrung erzeugt. Erst E INSTEIN erkannte, dass diese Tensorrechnung aus der Elastizitätslehre zu dem R ICCI-Kalkül äquivalent ist, der kurz zuvor von italienischen Differentialgeometern eingeführt worden war.
C Alternierende und symmetrische Abbildungen und Tensoren Als besonders wichtig erweisen sich zwei spezielle Typen von multilinearen Abbildungen bzw. Tensoren, die sich dadurch auszeichnen, dass sie auf das Vertauschen von Argumenten entweder gar nicht oder durch Vorzeichenwechsel reagieren: Definitionen 2.13. a. Eine multilineare Abbildung ' 2 Multp .V I W / heißt symmetrisch, falls für 1 i; j p stets '.v1 ; : : :; vi ; : : :; vj ; : : :; vp / D '.v1 ; : : :; vj ; : : :; vi ; : : :; vp /
C Alternierende und symmetrische Abbildungen und Tensoren
43
gilt. Den Raum der symmetrischen p-linearen Abbildungen mit Werten in W bezeichnet man mit Symp .V I W /. Ferner schreibt man Symp .V I R/ DW Symp .V / DW S p V : b. Eine multilineare Abbildung ' 2 Multp .V I W / heißt antisymmetrisch oder alternierend, falls für 1 i < j p stets '.v1 ; : : :; vi ; : : :; vj ; : : :; vp / D '.v1 ; : : :; vj ; : : :; vi ; : : :; vp / gilt. Den Raum der p-linearen alternierenden Abbildungen mit Werten in W bezeichnet man mit Altp .V I W /. Ferner schreibt man p
p
Alt .V I R/ DW Alt .V / DW
p ^
V:
c. Den Vektorraum der p-linearen alternierenden Abbildungen auf V bezeichnet man mit p ^ V Altp .V / D und nennt ihn auch die p-te äußere Potenz von V . d. den Vektorraum der symmetrischen Abbildungen auf V bezeichnet man mit Symp .V / D S p V : Offenbar sind Symp .V / Multp .V / und Altp .V / Multp .V / Untervektorräume. Die Determinante im Rn ist ein Element in Altn .Rn /; Skalarprodukte auf einem reellen Vektorraum V sind Elemente in Sym2 .V / und das Vektorprodukt ist ein Element aus Alt2 .R3 I R3 /. In den nächsten Kapiteln werden für uns vor allem alternierende Multilinearformen wichtig werden. Der nun folgende Satz zeigt verschiedene äquivalente Möglichkeiten sie zu charakterisieren. Hier – und auch im weiteren Verlauf – bezeichnen wir mit S.p/ die Menge aller Permutationen der Zahlen .1; 2; : : :; p/. Satz 2.14. Für ' 2 Multp .V / sind äquivalent: (i) (ii) (iii) (iv)
' 2 Altp .V /; d. h. '.v1 ; : : :; vj ; : : :; vi ; : : :; vp / D '.v1 ; : : :; vi ; : : :; vj ; : : :; vp /; 1 i < j p. '.v1 ; : : :; vp / D sgn ./'.v.1/ ; : : :; v.p/ / für v1 ; : : :; vp 2 V und jede Permutation 2 S.p/. '.v1 ; : : :; vi ; : : :; vj ; : : :; vp / D 0; falls vi D vj für ein i 6D j . '.v1 ; : : :; vp / D 0; falls fv1 ; : : :; vp g linear abhängig sind.
Beweis. Wir führen hier nur den Beweis für die Folgerung .i i i / H) .i /; die übrigen folgen dem Muster von Rechnungen, die aus der Determinantentheorie wohl-
44
2 Multilineare Algebra
bekannt sind, und sie seien dem Leser als Übungsaufgabe überlassen: '.v1 ; : : :; vi ; : : :; vj ; : : :; vp / C '.v1 ; : : :; vj ; : : :; vi ; : : :; vp / D D '.v1 ; : : :; vi ; : : :; vj ; : : :; vp / C '.v1 ; : : :; vi ; : : :; vi ; : : :; vp / C '.v1 ; : : :; vj ; : : :; vi ; : : :; vp / C '.v1 ; : : :; vj ; : : :; vj ; : : :; vp / D D '.v1 ; : : :; vi ; : : :; vi C vj ; : : :; vp / C '.v1 ; : : :; vj ; : : :; vi C vj ; : : :; vp / D .i i i /
D '.v1 ; : : :; vi C vj ; : : :; vi C vj ; : : :; vp / D 0 : t u Aus der Charakterisierung .iv/ des Satzes ist auch sofort ersichtlich, dass Altp .V / D 0
für p > dim V
gilt. Die Komponenten der alternierenden Multilinearformen sind natürlich alternierend, d. h. für Multiindizes i D .i1 ; : : :; ip / 2 f1; : : :; ngp gilt 'i1 :::ir :::is :::ip D 'i1 :::is :::ir :::ip ; falls ' alternierend ist, und Analoges gilt für die symmetrischen Multilinearformen. Damit kann nun auch die Dimension der beiden Räume bestimmt werden: Satz 2.15. Ist .a1 ; : : :; an / eine Basis von V und bezeichnet 'i1 :::ip WD '.ai1 ; : : :; aip / ; 1 ij n die Komponenten von ' 2 Multp .V / bezüglich dieser Basis, so sind durch n
˚A W Altp .V / ! R.p/ W ' 7! .'i1 :::ip /1i1 0 und Tr p Ui.p/ . Sei Vp Tr p M eine offene Umgebung von p (z. B. Vp WD fx j p .x/ > 12 p .p/g). Da M kompakt ist, gibt es endlich viele r S Punkte p1 ; : : :; pr mit Vpj D M . Setze j WD pj ; also j 2 C 1 .M; Œ0; 1Œ/ j D1
und Tr j Ui.pj / . Definiere j .x/ WD
j .x/ 2 C 1 .M; Œ0; 1Œ/ : 1 .x/ C C r .x/
Der Nenner ist tatsächlich nirgends null, denn für jedes x existiert mindestens ein j 2 f1; : : :; rg mit x 2 Vpj ; also j .x/ > 0. Ferner gilt Tr j D Tr j Ui.pj / und r P j .x/ D 1. t u
j D1
Die Beispiele, die wir für die Anwendung zur Zerlegung der Einheit angeführt haben, dürfen nicht dazu verleiten, anzunehmen, dass man ab jetzt stets argumentieren kann: Ein Objekt X existiert auf offenen Teilmengen des Rn und folglich auch auf Mannigfaltigkeiten, denn wir können es mittels Zerlegung der Einheit aus lokalen Teilen zusammenkleben. Manchmal gehen nämlich die interessanten Eigenschaften beim „Verkleben“ verloren. Um dies einzusehen, betrachten wir folgendes Beispiel: Auf einer offenen Teilmenge U Rn existiert stets ein differenzierbares 0 1 1 B0C B C Vektorfeld v W U ! Rn mit v.x/ 6D 0 für alle x 2 U; z. B. v.x/ D B : C für alle : @:A 0 x 2 U . Wir können nicht argumentieren: „Durch Zerlegung der Einheit ist folglich auf einer Mannigfaltigkeit stets ein Vektorfeld gegeben, das nirgends verschwindet“, denn sind U1 ; U2 M offen und ist vi ein nullstellenfreies Vektorfeld auf Ui ; so ist nicht notwendig 1 .x/v1 .x/ C 2 .x/v2 .x/ 6D 0 für alle x 2 U1 \ U2 . In der Tat existiert auch nicht auf jeder Mannigfaltigkeit ein Vektorfeld, das nirgends verschwindet, und die Frage, ob und wie viele punktweise linear unabhängige Vektorfelder auf einer Mannigfaltigkeit existieren, ist eine wichtige „globale“ Problemstellung, d. h. sie ist ein typisches Beispiel für ein Problem, das nicht durch Betrachtung von Koordinatengebieten alleine gelöst werden kann. In den Übungen werden wir sehen, dass die Fragestellung nach dem NichtVerschwinden von Vektorfeldern eng verknüpft ist mit der Frage, auf welchen Mannigfaltigkeiten es eine L ORENTZmetrik gibt. Für den Fall der Dimension n D 4 läuft dies auf das grundlegende Problem hinaus, welche Mannigfaltigkeiten als Modell für die physikalische Raumzeit in Frage kommen. Zum Abschluss des Abschnitts zeigen wir noch als eine weitere Anwendung der Zerlegung der Einheit eine schwächere Version des Einbettungssatzes 1.22.
B Mannigfaltigkeiten mit Rand
81
Satz 4.5. Ist M eine kompakte n-dimensionale Mannigfaltigkeit, so gibt es ein N 2 N; eine Untermanigfaltigkeit M 0 RN und einen Diffeomorphismus f W M ! M 0. Beweis. Sei A D f.Ui ; hi / j i 2 I g ein Atlas für M; fj j j D 1; : : :; mg eine .Ui /i 2I untergeordnete Zerlegung der Einheit mit Tr j Uij . Sei hQ j 2 C 1 .M; Rn / durch ( j .x/hij .x/ x 2 Uij ; hQ j .x/ WD 0 sonst für j D 1; : : :; m gegeben. Dann ist f W M ! RmCnm ; x 7! .1 .x/; : : :; m .x/ ; hQ 1 .x/; : : :; hQ m .x// die gesuchte Abbildung, wie wir jetzt nachprüfen: f ist injektiv, denn ist f .x/ D f .y/; so ist j .x/ D j .y/ für alle j; also gibt es ein j 2 f1; : : :; mg mit x; y 2 Tr j Uij . Also ist auch hj .x/ D hj .y/ und somit x D y. Nach Theorem 1.14b. ist f W M ! f .M / ein Homöomorphismus. Eine ähnliche Rechnung zeigt, dass dfx für alle x 2 M injektiv ist. Dann ist M 0 WD f .M / RN ; N WD m C nm; eine Untermannigfaltigkeit und f W M ! M 0 ein Diffeomorphismus. Ist nämlich y 2 M 0 beliebig, etwa y D f .x/; x 2 Uij ; so wählen wir linear unabhängige Vektoren vnC1 ; : : :; vN 2 RN ; die nicht in dem n-dimensionalen Raum dfx .Tx M / liegen, und betrachten die Abbildung 1 0 N X k vk A ; g.1 ; : : :; N / WD @f h1 ij .1 ; : : :; n / ; kDnC1
die eine offene Umgebung V RN von .hij .x/; 0/ auf eine offene Umgebung W RN von y abbildet. Sie ist nach dem Satz über inverse Funktionen ein Diffeomorphismus, und da f ein Homöomorphismus ist, ist W \ M 0 eine Umgebung von y in M 0 . Also ist H WD g 1 ein Flachmacher von M 0 bei y; und f ist bei x ein lokaler Diffeomorphismus. Hieraus folgen alle Behauptungen. t u
B Mannigfaltigkeiten mit Rand In diesem Abschnitt wollen wir den Begriff der Mannigfaltigkeit ein wenig erweitern. Die n-dimensionalen Teilmannigfaltigkeiten des Rn sind genau die offenen Teilmengen des Rn . So ist also z. B. die abgeschlossene Kugel Brn WD fx 2 Rn j jxj rg keine Mannigfaltigkeit, denn Brn ist nicht lokal diffeomorph zu Rn ; sondern sie sieht lokal aus wie eine Teilmenge des Halbraums Rn WD fx 2 Rn j x1 0g Rn :
82
4 Integration und Differentiation von Differentialformen
Wir wollen dies nun präzisieren. Definitionen 4.6. a. Sei U Rn offen in Rn . Eine stetige Abbildung f W U ! Rk e Rn heißt differenzierbar bei p 2 U; wenn es eine in Rn offene Teilmenge U e und eine differenzierbare Abbildung gibt mit p 2 U e ! Rk fQ W U ˇ ˇ mit fQˇU \e D f ˇU \e . U U b. Eine bijektive Abbildung f W U ! V zwischen offenen Teilmengen des Rn heißt Diffeomorphismus, falls f und f 1 differenzierbar sind. c. Ist U Rn ; so heißt @U WD f.x1 ; : : :; xn / 2 U j x1 D 0g der Rand von U. Diese Definition des Randes stimmt i. a. nicht mit der Definition des Randes überein, die in der Topologie benutzt wird (siehe Abschn. 1A). Die Abbildung fQ aus Definition 4.6 ist natürlich nicht eindeutig bestimmt, aber die partiellen Ableitungen von fQ bei p 2 U sind alle eindeutig durch f festgelegt, denn ! ! fQ.p C te 1 / fQ.p/ fQ.p C te 1 / fQ.p/ D lim ; lim t !0C t !0 t t da fQ differenzierbar ist. Lemma. Ist f W U ! V ein Diffeomorphismus zwischen Teilmengen des Rn ; so ist f .@U / D @V und es gilt @f1 @f1 .p/ > 0 ; .p/ D 0 für j D 2; : : :; n; p 2 @U : @x1 @xj Beweis. Die erste Behauptung folgt, da Diffeomorphismen zwischen offenen Teilmengen im Rn offene Teilmengen auf offene abbilden (Details etwa in [48]). Die Behauptung über die partiellen Ableitungen folgt aus der Tatsache, dass für p 2 @U gilt sign .f1 .p C te 1 // D sign .t/ und f1 .p C te j / D 0 für j 6D 1 : t u Definitionen 4.7. a. Unter einem differenzierbaren berandeten Atlas für einen topologischen Raum M verstehen wir eine offene Überdeckung .U /2 von M; zusammen mit
B Mannigfaltigkeiten mit Rand
h(P)
83
P
Abb. 4.1 Karte für eine berandete Mannigfaltigkeit
Homöomorphismen h W U ! U0 ; U0 Rn oder
U0 Rn offen ;
so dass alle Kartenwechsel ˇ ˇ w WD h ı h1 h .U
\U /
W h .U \ U / ! h .U \ U /
Diffeomorphismen sind. Die Paare .U ; h / heißen dann berandete Karten. Ist .U ; h /2^ so, dass [2^ U D M , so heißt .U ; h /2^ berandeter Atlas. Ein maximaler berandeter Atlas heißt eine differenzierbare Struktur. Ein topologischer H AUSDORFF-Raum, der als Vereinigung von abzählbar vielen kompakten Teilmengen geschrieben werden kann, zusammen mit einer berandeten differenzierbaren Struktur heißt eine berandete (differenzierbare) Mannigfaltigkeit. b. Ist M eine berandete Mannigfaltigkeit, so heißt p 2 M Randpunkt, falls für eine (und dann jede) Karte .U; h/ mit p 2 U gilt: h.p/ 2 @U 0 . Die Menge der Randpunkte von M bezeichnet man als Rand @M von M . Offenbar ist der Rand einer berandeten n-dimensionalen Mannigfaltigkeit eine unberandete Mannigfaltigkeit der Dimension n 1. Mannigfaltigkeiten sind oft als Nullstellen von Gleichungen durch den Satz vom regulären Wert gegeben. Berandete Mannigfaltigkeiten hingegen werden oft durch Ungleichungen beschrieben. Dies wird durch den folgenden Satz ermöglicht: Satz 4.8. Sei B Rn offen, F 2 C 1 .B; Rm / und f 2 C 1 .B; R/. Sei C 2 Rm regulärer Wert von F und .C; c/ 2 RmC1 regulärer Wert von .F; f /. Dann ist fx 2 B j F .x/ D C ; f .x/ cg eine .n m/-dimensionale berandete Untermannigfaltigkeit des Rn . Der Beweis ist völlig analog zum Beweis des Satzes vom regulären Wert. Natürlich bleibt die Aussage ebenso richtig, wenn statt f .x/ c die Ungleichung f .x/ c gegeben ist.
84
4 Integration und Differentiation von Differentialformen
Beispiel: M D f.x; y; z/ 2 R3 j x 2 C y 2 C z 2 D 1 ; z 0g ist eine berandete Mannigfaltigkeit und @M D f.x; y; z/ 2 R3 j x 2 C y 2 D 1 ; z D 0g Š S1 : Die meisten Begriffe lassen sich sofort von Mannigfaltigkeiten auf berandete Mannigfaltigkeiten übertragen. Differenzierbarkeit ist wieder mittels Karten definiert. Zur Definition des Tangentialraums setzen wir für p 2 @M Kp .M / WD
f W Œ0; "/ ! M ; differenzierbar .0/ D pg [ f W ."; 0 ! M ; differenzierbar .0/ D pg :
ˇ Für 2 Kp .M / und eine Karte .U; h/ um p sind h..0// 2 @U 0 und dtd ˇt D0 h ı 2 Rn wohldefiniert. Auf Kp .M / ist daher eine Äquivalenzrelation wie in Abschn. 1C definiert und wir setzen wieder Tp M D Kp .M /= ; d. h. die Elemente von Tp M sind die Äquivalenzklassen von Kurven aus Kp .M /. Die Abbildungen 'p ; hp sind wie in (1.8) bzw. (1.9) aus Abschn. 1C definiert. Damit ist Tp M auch für p 2 @M ein n-dimensionaler Vektorraum, und Tp .@M / Tp M ist ein .n 1/-dimensionaler Untervektorraum. Das Differential ist wieder mittels Karten wie in Definition 1.29 definiert und wir setzen für p 2 @M Tpinnen M WD d'h.p/ .Rn n @Rn / ; Tpaußen M
n
WD d'h.p/ .R n
Rn /
;
(4.2) (4.3)
wobei ' eine lokale Parametrisierung um p ist. Für p 2 @M ist Tp M also die disjunkte Vereinigung von Tpinnen M; Tpaußen M und Tp @M . Differentialformen und Metriken sind auf berandeten Mannigfaltigkeiten ebenso wie auf unberandeten definiert. Ist M R IEMANNsche Mannigfaltigkeit, so ist auch auf @M durch Einschränkung der Metrik auf T @M eine R IEMANNsche Metrik gegeben. Ist M nur pseudoR IEMANNsch (z. B. eine L ORENTZsche Mannigfaltigkeit), so ist die Bilinearform, die durch Einschränkung auf T @M entsteht, jedoch möglicherweise entartet, definiert also eventuell keine pseudo-R IEMANNsche Metrik auf @M . Ist M eine R IEMANNsche Mannigfaltigkeit, so heißt die durch N W @M ! TM ; N.p/ 2 Tpaußen M ; jN.p/j D 1
(4.4)
N.p/ 2 .Tp .@M //? eindeutig definierte Abbildung das nach außen weisende Normaleneinheitsfeld auf @M .
C Integration auf Mannigfaltigkeiten
85
Ist M orientierte berandete Mannigfaltigkeit, so ist @M ebenfalls orientiert, und zwar durch folgende Konvention. Definition 4.9. Eine Basis .v1 ; : : :; vn1 / von Tp @M heiße positiv orientiert, falls für jeden nach außen weisenden Vektor V 2 Tpaußen M die Basis .V; v1 ; : : :; vn1 / von Tp M positiv orientiert ist. Ist !M die Volumenform auf einer orientierten R IEMANNschen Mannigfaltigkeit und N das nach außen weisende Normaleneinheitsfeld, so ist die kanonische Volumenform auf @M durch (4.5) !@M WD iN !M gegeben. Offenbar ist sie die zu der in 4.9 definierten Orientierung passende Volumenform auf @M .
C Integration auf Mannigfaltigkeiten In diesem Abschnitt verstehen wir unter Mannigfaltigkeiten sowohl berandete als auch unberandete Mannigfaltigkeiten. Spricht man über Integration auf Mannigfaltigkeiten, so muss als erstes geklärt werden, welches Objekt denn integriert werden soll. Erinnern wir uns zunächst an die Integration über n-dimensionale Flächenstücke M RN .N n/ mit Parametrisierung ' W U 0 ! U M; wie sie z. B. in [36], Kap. 22, eingeführt wurde. Für stetiges f W M ! R ist Z Z p f d WD .f ı '/ G dn x ; (4.6) U0
U
wobei G WD det.gij / die G RAMsche Determinante ist, d. h. die Determinante des metrischen Tensors gij WD h@i '; @j 'i. Vergleicht man dies mit der in Satz 3.20 gegebenen Beschreibung der Volumenform !M ; so sieht man, dass auf der rechten Seite von (4.6) Z .' .f !M //.e 1 ; : : :; e n / dn x U0 n
steht, wobei d x die gewöhnliche Integration bezüglich des L EBESGUEmaßes im Rn bezeichnet. Für 2 ˝ n Rn und messbares M Rn liegt es daher nahe, Z Z WD .e 1 ; : : :; e n / dn x (4.7) M
M
zu setzen. Ist nämlich WD f ı ^ ^ ı n mit f 2 C 1 .Rn / (Bezeichnungen wie in Abschn. 3B), so ergibt sich aus dieser Definition Z Z D f dn x : 1
M
M
86
4 Integration und Differentiation von Differentialformen
Die rechte Seite von (4.6) ist dann gleichbedeutend mit
R U0
' .f !M /. Dies führt
zu dem Ansatz, dass man auf einer n-dimensionalen Mannigfaltigkeit die n-Formen integriert, und zwar mit der Definition, die in dem nachfolgenden Satz gerechtfertigt wird. Allerdings bekommt man dabei ein Vorzeichenproblem, da sich unter einem Kartenwechsel w die n-Formen gemäß 2.12 mit dem Faktor det Jw transformieren, die Integrale aber mit j det Jw j. Daher geht man von orientierten Mannigfaltigkeiten M aus und legt eine Orientierung fest, bevor man n-Formen auf M integriert. Satz und Definition 4.10. Sei M eine orientierte n-dimensionale Mannigfaltigkeit, 2 ˝ n M und Tr U kompakt, wobei .U; h/ eine orientierungserhaltende Karte von M ist. Dann ist Z Z Z WD ' .' /.e 1 ; : : :; e n / dn x M
U0
U0
mit ' D h1 W U 0 ! U unabhängig von der Wahl der Karte und daher wohldefiniert. Beweis. Sei .V; k/ eine weitere orientierungserhaltende Karte mit Tr V; und sei WD k 1 W V 0 ! V; w WD k ı ' W U 0 ! V 0 . Dann ist ' D .
ı k ı '/
D w Zu zeigen ist also, dass
Z w U0
:
Z D
:
(4.8)
V0
Nach (2.12) ist w . / D det Jw . /. Also folgt (4.8) aus der Transformationsformel für das L EBESGUE-Integral, denn da beide Karten orientierungserhaltend sind, ist überall det Jw > 0. t u Bemerkung: Ist ' D h1 mit einer orientierungsumkehrenden Karte .U; h/; so ergibt eine analoge Rechnung: Z Z D ' : M
U0
Um nun die Integration von beliebigen n-Formen zu definieren, verfährt man genauso wie bei Teilmannigfaltigkeiten des Rn : Die Mannigfaltigkeit wird in einzelne Stücke zerlegt, die jeweils in Kartengebieten enthalten sind, und die Integrale über diese einzelnen Stücke werden summiert. Dies könnte mittels einer Zerlegung der Einheit geschehen, doch ziehen wir eine Definition vor, die dem praktischen Vorgehen bei der Berechnung von Integralen entspricht.
C Integration auf Mannigfaltigkeiten
87
Definitionen 4.11. Eine Teilmenge A einer n-dimensionalen differenzierbaren Mannigfaltigkeit M heißt messbar (bzw. Nullmenge), falls für eine (und dann jede) Überdeckung von A durch Karten .Ui ; hi /i 2I die Teilmengen hi .Ui \ A/ Rn messbar (bzw. Nullmengen) sind für alle i 2 I . Lemma. Jede Mannigfaltigkeit M hat eine Zerlegung in abzählbar viele disjunkte messbare Teilmengen .Ai /i 2N ; so dass jedes Ai ganz in einem Kartengebiet enthalten ist, d. h. es gilt S a. Ai D M und Ai \ Aj D ; für i ¤ j; i 2N
b. für jedes i 2 N existiert eine Karte .Ui ; hi / mit Ai Ui . Beweis. Die Mannigfaltigkeit M besitzt einen abzählbaren Atlas .Ui ; hi /i 2N ; denn sie kann als Vereinigung von abzählbar vielen kompakten Teilmengen geschrieben werden (Definition 1.16b.), und jede dieser kompakten Teilmengen kann durch endlich viele Kartengebiete überdeckt werden. Man erreicht nun das Gewünschte, indem man setzt: A1 WD U1 ; A2 WD U2 n A1 ; : : :; Ai C1 D Ui C1 n
i [
Aj :
j D1
t u Satz und Definition 4.12. a. Eine n-Form ! auf einer orientierten n-dimensionalen Mannigfaltigkeit M heißt integrierbar, wenn für eine – und dann jede – Zerlegung .Ai /i 2N von M wie in obigem Lemma und eine – und dann jede – Folge .Ui ; hi /i 2N von orientierungserhaltenden Karten mit Ai Ui und 'i D h1 i gilt: Für jedes i ist die lokale Koeffizientenfunktion ai W Ui0 D hi .Ui / ! R W
x 7! !'i .x/ .@1 .x/; : : :; @n .x// D .'i !/.e 1 ; : : :; e n /
.hi /
mit @j .x/ WD @j
.x/ über hi .Ai / D A0i integrierbar, und es gilt 1 Z X i D1
jai .x/j dn x < 1 :
A0i
b. Das Integral von ! über M ist dann durch Z ! WD M
wohldefiniert.
1 X
Z
i D1 h .A / i i
ai .x/ dx
88
4 Integration und Differentiation von Differentialformen
c. Ist M eine kompakte orientierte R IEMANNsche Mannigfaltigkeit mit Volumenform !M ; so ist das Volumen von M durch Z vol M D !M M
definiert. S d. Für den Spezialfall einer nulldimensionalen Mannigfaltigkeit M D fpi g i 2I P 1 jf .pi /j < 1; und man schreibt dann heißt f 2 C .M / integrierbar, falls i 2I R P f D f .pi /. i 2I
M
Beweis. Es ist zu zeigen, dass die definierten Eigenschaften und Größen unabhängig von der Wahl der Zerlegungen und Karten sind. Seien also .Ai /i 2N und .Bj /j 2N Zerlegungen wie im Lemma und .Ui ; hi /i 2N ; .Vj ; kj /j 2N orientierungserhaltende Karten mit Ai Ui ; Bj Vj ; 'i D h1 i und 1 j D kj ; sowie ai D 'i ! .e 1 ; : : :; e n / bj D j ! .e 1 ; : : :; e n / : Dann gilt nach Definition Z ai .x/ dn x D hi .Ai \Bj /
Z
Z
n
bj .x/ d x D
! Ai \Bj
kj .Ai \Bj /
und analog für die Integranden jai j;jbj j. Also ist nach dem Satz über monotone Konvergenz Z Z Z 1 1 X X jai .x/j dx D jai .x/j dx D jbj .x/j dx hi .Ai /
und damit
j D1 h .A \B / i i j
P
R
ij
kj .Ai \Bj /
j D1 k .A \B / j i j
jbj .x/j dx < 1. Folglich sind jbj j und bj über kj .Bj /
integrierbar, und es gilt nach dem Satz von der dominierten Konvergenz Z Z Z 1 1 X X bj .x/ dx D bj .x/ dx D ai .x/ dx ; i D1
kj .Bj /
also 1 X
Z bj .x/ dx D
j D1 k .B / j j
i D1
kj .Ai \Bj /
1 X
Z
i;j D1 h .A \B / i i j
Z
D
hi .Ai \Bj /
ai .x/ dx D
1 X
Z ai .x/ dx
i D1 h .A / i i
!: M
t u
C Integration auf Mannigfaltigkeiten
89
Bemerkung: Für die Berechnung von Integralen genügt es, die zerlegenden Mengen Ai so zu wählen, dass Ai \ Aj für i ¤ j stets eine Nullmenge ist. Das ist meist leichter zu erreichen als die völlige Disjunktheit. Ein wichtiges Hilfsmittel, um Integrale auszurechnen, ist in der Analysis in mehreren Veränderlichen die Transformationsformel. Für die Integration auf Mannigfaltigkeiten hat sie eine besonders einfache Form: Korollar 4.13 (Transformationsformel). Ist f W N ! M ein orientierungserhaltender Diffeomorphismus zwischen orientierten Mannigfaltigkeiten der Dimension n und ist ! 2 ˝ n M integrierbar, so ist Z Z f !D !: N
M
Ist f orientierungsumkehrend, so ist Z Z f ! D ! : N
M
Beweis. Seien .Ai /i 2N disjunkte messbare Teilmengen von N mit
S
Ai D N und
i 2N
.Ui ; hi / Karten mit Ai Ui . Dann sind Bi WD f .Ai / f .Ui / DW Vi M messbare Teilmengen von M und .Vi ; hi ı f 1 / Karten für M . Sind hi und f orientierungserhaltend so auch ki D hi ı f 1 . Sei ! eine integrierbare n-Form, 1 1 i D ki ; 'i D hi . Dann ist i .!jBi /
D .f ı 'i / .!jBi / D D 'i .f .!jBi // D
D 'i .f !jf 1 .Bi / / D D 'i .f !jAi / :
Also ist
Z !D M
X Z i k .B / i i
i !
D
X Z i h .A / i i
'i .f !/
Z D
f ! :
N
t u Bemerkung: Wir haben hier nur die Integration über berandete Mannigfaltigkeiten definiert. In der Physik treten oft Mannigfaltigkeiten mit „Ecken“ und „Kanten“ auf, und oft ist es in der Praxis möglich, dort genauso zu rechnen wie mit Mannigfaltigkeiten. In [4] wird die hierbei verwendete „Integration über Zykel“ genauer behandelt.
90
4 Integration und Differentiation von Differentialformen
D Die C ARTANsche Ableitung Einer der wichtigsten Sätze der Analysis in einer Veränderlichen ist der Hauptsatz der Differential- und Integralrechnung: Zb
fP.t/ dt D f .b/ f .a/ :
(4.9)
a
Fasst man Œa; b als 1-dimensionale berandete Mannigfaltigkeit auf, so ist (4.9) auch zu lesen als Z Z df D f : (4.10) M
@M
Die C ARTANsche Ableitung ist nun eine Verallgemeinerung des Differentials zu einer linearen Abbildung d.j / W ˝ j M ! ˝ j C1 M ; so dass (4.10) auch für kompakte n-dimensionale Mannigfaltigkeiten und f 2 ˝ n1 .M / gültig bleibt. Satz und Definition 4.14. Sei M eine n-dimensionale Mannigfaltigkeit. Dann gibt es genau eine Möglichkeit eine Folge linearer Abbildungen d.j / d.0/
d.1/
d.2/
d.n1/
d.n/
˝ 0 M ! ˝ 1 M ! ˝ 2 M ! ! ˝ n M ! 0 zu definieren, so dass gilt a. d.0/ f D df für f 2 C 1 M; b. . d.j C1/ ı d.j / /! d.j C1/ d.j / ! d2 ! D 0 für ! 2 ˝ j M und j 2 f0; : : :; n 1g (Komplexeigenschaft), c. d.rCs/ .! ^ / D d.r/ ! ^ C .1/r ! ^ d.s/ für ! 2 ˝ r M; 2 ˝ s M (Produktregel) . Die Abbildung d.j / heißt C ARTANsche Ableitung oder äußere Ableitung. Wir werden im Weiteren meist d statt d.j / schreiben. Ist die Definition von d.j / durch (4.10) motiviert, so liegt es auch nahe Eigenschaft b. zu fordern, da für jede berandete Mannigfaltigkeit M auch @@M D ; gilt, also stets Z Z Z d d! D d! D !D0: M
@M
@@M
Die Produktregel ist eine natürliche Verallgemeinerung der bekannten Produktregel für !; 2 C 1 M . Das Vorzeichen dabei ist eine notwendige Folgerung aus der
D Die C ARTAN sche Ableitung
91
Antikommutativität des äußeren Produkts. Eine ausführliche und sehr anschauliche Motivation der Definition der C ARTANschen Ableitung findet sich in [48]. Beweis. (i) Wir behandeln zuerst den Fall, dass M Rn offen ist. In diesem Fall ist ! 2 ˝ j M durch X !1 ;:::;j dx 1 ^ ^ dx j (4.11) !D 1 ;
(4.24)
Für offenes M R3 ; also G 1; ergibt P sich wieder die übliche Formel für die Rotation. Für v D .v 1 ; v 2 ; v 3 / ist v b D 3i D1 v i dx i ; also dv b D w3 dx1 ^ dx2 C w2 dx3 ^ dx1 C w1 dx2 ^ dx3 mit w D rot v; wobei 1 0 @ v @x@ 3 v2 @x2 3 C B rot v D @ @x@ 3 v1 @x@ 1 v3 A : @ @x1
v2
@ @x2
v1
Aus der Komplexeigenschaft der C ARTANschen Ableitung folgt nun sofort auch für die Differentialoperatoren auf Vektorfeldern: rot grad f D 0 div rot v D 0 :
(4.25) (4.26)
Aus der Produktregel für d lassen sich auch entsprechende Produktregeln für rot; grad und div herleiten (vgl. Übungen). Ein weiterer wichtiger Differentialoperator, der mittels der C ARTANschen Ableitung definiert ist, ist der L APLACEoperator: Definition 4.23. Der L APLACEoperator auf einer orientierten R IEMANNschen Mannigfaltigkeit M ist durch f WD div grad f für f 2 C 2 .M / gegeben.
F Die M AXWELLschen Gleichungen
99
Da in lokalen Koordinaten grad f D
P i;j
g ij .@i f /@j gilt (vgl. die Diskussion
hinter Satz 2.4), ist 1 X p div grad f D p @j G g ij @i f G i;j
(4.27)
mit .gij / D .gij /1 . Beispiel: In Kugelkoordinaten auf M WD R3 n f0g ist also @f 1 @ 2 r C f D r 2 sin sin
@r @r @f @ @ 1 @ sin @ C @' sin
@f @'
:
F Die M AXWELLschen Gleichungen Die M AXWELLschen Gleichungen beschreiben bekanntlich die Wechselwirkung zwischen elektrischem und magnetischem Feld. Sie werden in differentieller oder integraler Form angegeben, wobei die integrale Form leichter durch physikalische Interpretation motiviert werden kann, die differentielle Form hingegen leichter mathematisch zu handhaben ist. Im nächsten Abschnitt werden wir kurz auf die Beziehung zwischen beiden Formen eingehen. In diesem Abschnitt beschäftigen wir uns nur mit der differentiellen Form. Diese lautet in SI-Einheiten rot E D BP div B D 0 rot H D J C DP div D D D D "0 E ; 1 B H D 0
FARADAYsches Gesetz Nichtexistenz magnetischer Ladungen A MPÈREsches Gesetz G AUSSsches Gesetz
(4.28)
) Verknüpfungsregeln.
(4.29)
Dabei sind das elektrische Feld E; die magnetische Induktion B; die magnetische Feldstärke H; die dielektrische Verschiebung D; die Stromdichte J zeitabhängige Vektorfelder und die Ladungsdichte eine zeitabhängige skalare Funktion auf dem physikalischen Raum, den wir uns als 3-dimensionale Mannigfaltigkeit M vorstellen. Hier sind zeitabhängige Vektorfelder auf M als Abbildungen v W R ! TM zu verstehen. Die Beziehung zum G AUSSschen Einheitensystem ist z. B. in [84] dargestellt. Eine zeitabhängige Funktion auf M ist einfach eine Funktion auf R M . Die weiteren Größen sind Konstanten, nämlich die Dielektrizitätskonstante "0 und die magnetische Permeabilität 0 . Im Vakuum ist "0 D 10 . Wollen wir die M AX -
100
4 Integration und Differentiation von Differentialformen
WELL schen Gleichungen mit dem C ARTAN -Kalkül formulieren, so müssen wir zuerst definieren, was eine zeitabhängige Differentialform ist.
Definitionen 4.24. k .M / auf einer Manniga. Unter einer zeitabhängigen Differentialform ˛ 2 ˝Zeit faltigkeit M verstehen wir eine Abbildung
˛ W R ! ˝ k .M / ; so dass für jedes x 2 M die Abbildung ˛x W R ! Altk .Tx M / ; t 7! .˛.t//x beliebig oft differenzierbar ist. k k b. Ist ˛ 2 ˝Zeit .M /; so ist ˛P 2 ˝Zeit .M / durch ˛P x D
d dt
.˛x / definiert.
Offenbar ist eine zeitabhängige Differentialform ˛ in lokalen Koordinaten auf U M durch X ˛ WD ˛i1 ;:::;ik dx i1 dx ik mit ˛i1 ;:::;ik 2 C 1 .R U / gegeben. Ist M eine 3-dimensionale orientierte R IEMANNsche Mannigfaltigkeit mit Volumenform !M ; so können Vektorfelder als 1- bzw. 2-Formen interpretiert werden, wie wir im vorigen Abschnitt gesehen haben. Da die Rotation die „Übersetzung“ der C ARTANschen Ableitung von 1-Formen und die Divergenz die der von 2-Formen ist, betrachten wir die nach (4.17) und(4.19) durch E; B; H; D und J gegebenen 1 2 1 2 .M /; B 2 ˝Zeit .M /; H 2 ˝Zeit .M /; D 2 ˝Zeit .M /; Differentialformen E 2 ˝Zeit 2 j 2 ˝Zeit .M / und setzen schließlich r WD !M . Damit sind die ersten vier M AX WELL schen Gleichungen nach (4.21) und (4.23) durch dE D BP ; dB D 0 ; dH D DP C j ;
(4.30)
dD D r gegeben. Es bleibt die Frage, wie die Verknüpfungsregeln zu interpretieren sind. Dazu muss ein Zusammenhang zwischen 1- und 2-Formen hergestellt werden. Erinnert man sich daran wie beide nach (4.17) bzw. (4.19) als Vektorfelder interpretiert werden, so liegt nahe, wie dieser Isomorphismus zu definieren ist. Satz und Definition 4.25. Ist M eine 3-dimensionale orientierte R IEMANNsche Mannigfaltigkeit, so ist durch
W ˝ 1 M ! ˝ 2 M ; ˛ WD iv !M mit v WD ˛ # ein Isomorphismus gegeben.
F Die M AXWELLschen Gleichungen
101
Ist .e1 ; e2 ; e3 / eine positive Orthonormalbasis von Tx M; so ist . ˛/.e.1/ ; e.2/ / D .sign /˛.e.3/ / für jede Permutation von .1; 2; 3/. Damit entsprechen den Verknüpfungsregeln die Gleichungen D D "0 E ; (4.31) B D 0 H ; und die M AXWELLschen Gleichungen können als dB D 0 ; dE D BP ; 1 d 1 B D "0 EP C j ; 0 "0 d E D r gelesen werden. Wir werden jetzt sehen, dass die M AXWELLschen Gleichungen eine noch einfachere Gestalt erhalten, wenn man die darin enthaltenen Felder nicht als zeitabhängige Differentialformen auf dem 3-dimensionalen physikalischen Raum, sondern als gewöhnliche Differentialformen auf der 4-dimensionalen Raumzeit interpretiert. In der speziellen Relativitätstheorie geht man davon aus, dass die Raumzeit durch eine zu R4 diffeomorphe Mannigfaltigkeit X beschrieben wird. Genauer ist durch ein Inertialsystem I auf X eine Karte hI W X ! R4 gegeben. Ist I 0 ein weiteres Inertialsystem, so sind die Kartenwechsel 4 4 hI ı h1 I 0 W R ! R
durch eine P OINCARÉ-Transformation gegeben, d. h. 4 4 hI ı h1 I 0 W R ! R ; x 7! x C v
mit v 2 R4 ; 2 L"C ; wobei 0
mit I1;3
1 0 B0 1 DB @0 0 0 0
o n L D A 2 R44 j AT I1;3 A D I1;3 1
00 0 0C C die L ORENTZgruppe und 1 0A 01 "
LC WD fA 2 L j det A > 0 ; a11 > 0g ihre zeit- und raumorientierungserhaltende Komponente ist. Ist hxjyiM WD x T I1;3 y das M INKOWSKI Skalarprodukt auf R4 ; so ist durch g.v; w/ D h dhI .v/j dhI .w/iM eine L ORENTZmetrik auf X unabhängig von der Wahl des Inertialsystems, gegeben, das heißt eine symmetrische Bilinearform, die in geeigneten Koordinaten durch die
102
4 Integration und Differentiation von Differentialformen
Matrix I1;3 dargestellt ist (vgl. Definition 3.18). Ferner ist auf X eine Orientierung dadurch definiert, dass die Karten hI orientierungserhaltend sein sollen. Wir können zeitabhängige Differentialformen auf M nun als Differentialformen auf X D R M auffassen. Wir formulieren dies der größeren Übersichtlichkeit halber für allgemeines n; obwohl man es für die Zwecke der Relativitätstheorie nur im Fall n D 3 benötigt: Notationen: a. Ist X eine n C 1-dimensionale Mannigfaltigkeit und h W X ! R M ein Difk .M / als Teilmenge von ˝ k .X / aufzufassen durch feomorphismus, so ist ˝Zeit die Inklusion k ˝Zeit .M / ! ˝ k .X / ; ˛ 7! ˛Q (4.32) mit ˛Q h1 .t;p/ .v1 ; : : :; vk / WD ˛p .t/.prM dhh1 .p;t / .v1 /; : : :; prM dhh1 .p;t / .vk // mit der Projektion prM W T.t;p/ .R M / D R Tp M ! Tp M : b. Mit dt 2 ˝ 1 .X / bezeichnen wir die 1-Form dh0 mit h D .h0 ; h1 ; : : :; hn /. Damit können wir die k-Formen auf der 4-dimensionalen Raumzeit der speziellen Relativitätstheorie mit Hilfe eines Inertialsystems als zeitabhängige Differentialformen auf dem 3-dimensionalen physikalischen Raum lesen, genauer (und für allgemeines n): Lemma 4.26. Ist X eine nC1-dimensionale Mannigfaltigkeit und h W X ! R M ein Diffeomorphismus, so ist durch k1 k ˝Zeit .M / ˚ ˝Zeit .M / ! ˝ k .X / .ˇ; ˛/ 7! dt ^ ˇQ C ˛Q
ein Isomorphismus gegeben. Beweis. Lokale Koordinaten von M definieren via h auch lokale Koordinaten von X . In lokalen Koordinaten .x 1 ; : : :; x n / von M ist jede Differentialform 2 r .M / lokal von der Form ˝Zeit X .t;p/ D i1 ;:::;ir .t; p/ dx i1 ^ ^ dx ir und 2 ˝ r .X / lokal von der Form X .t;p/ D fi1 ;:::;ir1 .t; p/ dt ^ dx i1 ^ ^ dx ir1 C X C gi1 ;:::;ir .t; p/ ^ dx i1 ^ ^ dx ir DW dt ^ ˇQ.t;p/ C ˛Q .t;p/ : t u
F Die M AXWELLschen Gleichungen
103
Als letzten Schritt, bevor wir wieder zu den M AXWELL-Gleichungen zurückkehren, halten wir noch fest, wie sich die C ARTANsche Ableitung aufspaltet. Notation: .k/ Ist h W X ! R M; so bezeichnen wir mit d.k/ Raum und dZeit die durch die folgende Formel gegebene Aufspaltung der C ARTANschen Ableitung d.k/ auf X : ˇ k kC1 k M ! ˝Zeit M ˚ ˝Zeit M D ˝ kC1 X d.k/ ˇ˝ k M W ˝ k X ˝Zeit Zeit
Q 7! dRaum Q C dt ^ dZeit Q WD dQ k M ˝kX . für 2 ˝Zeit In Koordinaten sind diese beiden Anteile der C ARTANschen Ableitung also durch
dRaum .˛ dx i1 ^ ^ dx ik / D
n X @ ˛ dx j ^ dx i1 ^ ^ dx ik @xj
j D1
und
dZeit .˛ dx i1 ^ ^ dx ik / D ˛P ^ dx i1 ^ ^ dx ik
für ˛ 2 C 1 .R U / gegeben. Insgesamt ist also die C ARTANsche Ableitung auf ˝ k X die Summe kC1 k1 k k M ˚ ˝Zeit M ! ˝Zeit M ˚ ˝Zeit M d.k/ W ˝Zeit .k1/ .k/ .k/ ˇ C ˛ 7! dRaum ˇ C dZeit ˛ C dRaum ˛ ; k1 denn ist ˇ 2 ˝Zeit M; also dt ^ ˇQ 2 ˝ k X; so ist
Q D dt ^ d.k/ ˇQ D dt ^ d Q d.k/ . dt ^ ˇ/ Raum ˇ : .k1/
Dabei haben wir mit dem oberen Index d.j / ausnahmsweise angezeigt, dass die C ARTANsche Ableitung auf Differentialformen vom Grad j gemeint ist. Fassen wir jetzt die durch die magnetische Induktion und das elektrische Feld definierten Formen B und E mit der Notation (4.32) als eine einzige Form F 2 ˝ 2 .X / auf X Š R M; nämlich F D .E; B/ D dt ^ EQ C BQ also in lokalen Koordinaten F D
3 X
Ei dt ^ dx i C B1 dx 2 ^ dx 3 C B2 dx 3 ^ dx 1 C B3 dx 1 ^ dx 2
i D1
auf, dann ist dF D 0 gleichbedeutend mit den ersten beiden M AXWELLschen Gleichungen. Denn P d.1/ Raum E C dt ^ dZeit B D 0 ” dE D B sowie d.2/ Raum B D 0 ” dB D 0 :
104
4 Integration und Differentiation von Differentialformen
Die Matrixdarstellung der 2-Form F 0 1 0 E 1 E 2 E 3 BE 1 0 B 3 B 2 C C .F / D B @E 2 B 3 0 B 1 A E 3 B 2 B 1 0 wird als Feldstärketensor oder FARADAYtensor bezeichnet. Um die Verknüpfungsregeln zu vereinfachen, muss nun die Abbildung W ˝ 1 M ! ˝ 2 M für die 3-dimensionale R IEMANNsche Mannigfaltigkeit durch
W ˝ 2 X ! ˝ 2 X für die 4-dimensionale L ORENTZ-Mannigfaltigkeit X D R M ersetzt werden. In der Tat ist die hier definierte Abbildung nur ein Spezialfall des H OD GE schen Stern-Operators W ˝ k M ! ˝ nk M auf n-dimensionalen pseudoR IEMANNschen orientierten Mannigfaltigkeiten M . Dieser wird zum Beispiel in [48] ausführlich behandelt. Wir besprechen wieder nur den hier auftretenden Spezialfall: Definitionen 4.27. Ist M eine 3-dimensionale orientierte R IEMANNsche Mannigfaltigkeit und X D R M; versehen mit der durch die Produktstruktur gegebenen L ORENTZmetrik, so definieren wir 1 2
W ˝ 2 X D ˝Zeit M ˚ ˝Zeit M ! ˝ 2 X dt ^ ˇ C ˛ 7! dt ^ 1 M ˛ M ˇ :
Dabei ist M der in 4.25 definierte Stern-Operator auf M . Damit ist mit (4.31) im Vakuum
F D dt ^ 1 M B C M E D 0 . dt ^ H C D/ ; P C dRaum D/. also d F D 0 . dt ^ . dRaum H C D/ Die zweite Gruppe der M AXWELLschen Gleichungen ist also äquivalent zu d F DJ mit J D 0 .r dt ^ j /. Da d d D 0 gilt, folgt dann auch sofort dJ D 0; also rP C dRaum j D 0 ” .%P C div J /!M D 0 ; also die Kontinuitätsgleichung %P D div J :
(4.33)
G Der allgemeine Satz von S TOKES
105
Bisher haben wir stets eine feste Karte h W X ! R M benutzt. In einem anderen Inertialsystem hQ werden andere Werte für das elektrische Feld und die magnetische Induktion gemessen. Dies entspricht gerade der Tatsache, dass der FARA DAY tensor bezüglich einer anderen Karte durch andere Komponenten beschrieben wird. Der Kartenwechsel ist durch eine P OINCARÉtransformation C v gegeben, und der Tensor .F / transformiert sich gerade so, dass gemäß Satz 3.7 eine 2-Form auf der Raumzeit X wohldefiniert ist, also X F D F :
e
G Der allgemeine Satz von S TOKES In diesem Abschnitt formulieren wir die schon erwähnte Verallgemeinerung des Hauptsatzes der Differential- und Integralrechnung, den Satz von S TOKES, beweisen ihn und geben einige Anwendungen an. Theorem 4.28 (Integralsatz von S TOKES). Sei M eine orientierte Mannigfaltigkeit der Dimension n mit Rand @M; ! 2 ˝ n1 M eine .n 1/-Form mit kompaktem Träger, d. h. Tr .!/ D fx 2 M j!x ¤ 0g ist kompakt. Dann gilt
Z
Z d! D M
!: @M
Bevor wir zum Beweis des Satzes kommen, geben wir einige wichtige Anwendungen und Spezialfälle an. Offenbar ist für M D Œ0; 1 dieser Satz genau der Hauptsatz der Differential- und Integralrechnung. Aber auch weitere schon bekannte Integralsätze finden wir als Spezialfälle wieder. Korollar 4.29 (Satz von G AUSS). Sei M Rn eine kompakte n-dimensionale Untermannigfaltigkeit, N das nach außen weisende Normaleneinheitsfeld auf @M . Dann ist für jedes differenzierbare Vektorfeld v auf M Z Z div.v/ dn x D hvjN i dF ; M
@M
mit dF WD !@M („Flächenelement“). Beweis. Sei j W @M ! M die Inklusion. Für x 2 @M können wir v in eine zu @M normale Komponente hvjN iN D vn und eine zu @M tangentiale Komponente vt D v vn zerlegen. Wegen !@M D j .iN !M / (vgl. Gl. (4.5)) gilt dann j .iv !M /x D j .ivt !M C hvjN i!@M /x
für x 2 @M :
Es ist j .ivt !M / D 0; also j .iv !M / D hvjN i!@M
(4.34)
106
und damit
4 Integration und Differentiation von Differentialformen
Z
n
Z
Z
div .v/ d x D M
M
d.iv !M / D
hvjN i dF : @M
t u Anschaulich bedeutet dieser Satz, dass die „Durchflussrate“ durch die Oberfläche eines Bereichs durch die eingeschlossenen Quellen gegeben ist. Betrachten wir dazu ein aus der Physik bekanntes Beispiel. Beispiel 4.30. (Elektrisches Feld einer Punktladung) Sei M R3 kompakte 3-dimensionale Untermannigfaltigkeit mit 0 62 @M und x v.x/ WD jxj 3 für x ¤ 0. Dann ist Z 4 falls 0 2 M ; hvjN i!@M D : 0 sonst @M Beweis. Es ist div .v.x// D 0. Ist 0 62 M; dann ist v ein Vektorfeld auf M; also nach dem Satz von G AUSS Z Z hvjN i!@M D div .v/ d3 x D 0 : @M
M
Sei nun 0 2 M n@M . Da M nf0g nicht kompakt ist, ist der Satz von G AUSS nicht auf f D M n U" .0/ M n f0g anwendbar. Sei " > 0 so, dass B" .0/ M n @M . Dann ist M 2 2 f kompakt. Sei S" WD @B" .0/; also @M D @M [ S" . Folglich ist
Z Z Z ˇ ˇ x dF v ˇˇ 0 D hvjN i dF D hvjN i dF jxj e @M @M S"2 Z D hvjN i dF 4 : @M
Das Vorzeichen nach dem zweiten Gleichheitszeichen rührt davon her, dass das nach x M gerade jxj ist. t u außen weisende Normalenfeld auf S"2 @f Im nächsten Beispiel sehen wir, dass der Satz von G AUSS auch bei der praktischen Berechnung von Integralen oft hilfreich ist. Beispiel 4.31. Für die n-dimensionale Einheitskugel D n WD B1 .0/ Rn gilt vol.Sn1 / D nvol.D n /. Betrachte nämlich auf Rn das Vektorfeld v.x/ D x. Für x 2 Sn1 ist hv.x/jN i D 1. Außerdem gilt div v D n. Damit folgt aus dem Satz von G AUSS Z Z n1 vol.S / D hv.x/jN i!Sn1 D div v dn x D nvol.D n / : Sn1
Dn
Korollar 4.32 (klassischer Satz von S TOKES). a. Ist M R3 eine 2-dimensionale kompakte orientierte berandete Mannigfaltigkeit und v ein differenzierbares Vektorfeld auf einer offenen Umgebung von M; so ist
G Der allgemeine Satz von S TOKES
107
Z
Z M
hrot vjN i!M D
hvjT i ds ; @M
wobei ds D !@M ; N das orientierungsdefinierende Normaleneinheitsfeld auf M und T das positiv orientierte tangentiale Einheitsfeld an @M ist. b. Ist M eine geschlossene 2-dimensionale Fläche (d. h. @M D ;), so ist Z hrot vjN i!M D 0 : M
Beweis. Es ist irot v det D dv b . Ist j1 W M ! R3 die Inklusion, so ist j1 .irotv det/ D j1 ihrot vjN iN det C i.rot v/t det D hrot vjN i !M ; wobei .rot v/t D hrot vjN iN C rot v der tangentiale Anteil von rot v ist und damit j1 .i.rot v/t det/ D 0. Ferner ist iN det D !M die Volumenform auf M . Also ist hrot vjN i!M D j1 dv b D d j1 v b : Ist j2 W @M ! R3 die Inklusion, so ist j2 v b .T / D hvjT i ; also und damit
j2 v b D hvjT i!@M Z M
Z hrot vjN i!M D
Z@M
D @M
j2 v b hvjT i!@M : t u
Da @@M D ; ist für jede Mannigfaltigkeit M; folgt aus Teil b. des Korollars 4.6 und dem Beispiel 4.30 auch, dass es kein Vektorfeld w W R3 n f0g ! R3 gibt mit x rot w.x/ D jxj 3. Beispiel 4.33. (magnetisches Feld eines stromdurchflossenen Leiters) 0 1 x2 1 @ x1 A für .x1 ; x2 ; x3 / 2 R3 n .f0g f0g R/. Es ist rot v D 0. Sei v.x/ D x 2 Cx 2 1 2 0 3 Ist M R eine kompakte 2-dimensionale Fläche mit .f0g f0g R/ \ M D ;; so ist Z hvjT i ds D 0 : @M
108
4 Integration und Differentiation von Differentialformen
Nun sei M \ .f0g f0g R/ D .0; 0; a/ für ein a 2 R und .0; 0; a/ 62 @M . Ferner soll M die z-Achse in .0; 0; a/ transversal schneiden, d.h. der Vektor e 3 soll nicht zu T.0;0;a/ M gehören. Dann gilt mit demselben Argument wie in Beispiel (4.30) Z Z hvjT i ds D hvjT i ds D 2 : @M
S1
(Genau genommen, muss man, um das Argument aus Beispiel 4.30 anwenden zu können, die Fläche M zunächst so verbiegen, dass eine kleine Scheibe f.x; y; a/ j x 2 C y 2 "2 g in M liegt. Das ist aber wegen der angenommenen Transversalität möglich, ohne dass M in einer Umgebung von @M verändert wird.) Als Letztes behandeln wir noch den Spezialfall von eindimensionalen Untermannigfaltigkeiten. Korollar 4.34. Sei M Rn eine kompakte eindimensionale Mannigfaltigkeit und W Œ0; L ! M eine Parametrisierung von M . Sei f 2 C 1 .M /. Dann ist Z
L
hrf ..t//j.t/i P dt D f ..L// f ..0// :
0
Beweis. Dies folgt sofort aus Z
Z
L
df D M
hrf ..t//j.t/i P dt :
0
RL
t u
Insbesondere gilt: Ist M geschlossen, so ist 0 hgrad f ..t//jP .t/i dt D 0. Wieder folgt aus @@M D 0 mit Beispiel (4.33): Es gibt keine0differenzierbare Funktion 1 x2 1 @ x1 A ; d. h. es gibt kein f 2 C 1 .R3 n .f0g f0g R// mit grad f D x 2 Cx 2 1 2 0 Potential für das magnetische Feld. Korollar 4.35. Ist M eine kompakte n-dimensionale orientierte Riemannsche Mannigfaltigkeit und f 2 C 1 .M /; so ist Z Z f !M D hgrad f jN i!@M : M
@M
Beweis. Nach Definition ist f !M D d igrad f !M : Damit folgt die Behauptung aus dem Satz von S TOKES und j igrad f !M D hgrad f jN iiN !@M ; wobei j W @M ! M die Inklusion ist.
t u
G Der allgemeine Satz von S TOKES
109
Aus den Produktregeln für die klassischen Differentialoperatoren (vgl. Aufgabe 4.3) folgen nun auch die G REENschen Formeln für den L APLACEoperator auf einer R IE MANN schen Mannigfaltigkeit: Korollar 4.36. R R a. M .hgrad f jgrad gi C g f /!M D @M g hgrad f jN i!@M : b.
R
M .g f f g/!M f j@M D gj@M D 0
D
R
@M hggrad f
Z
f grad gjN i!@M ; also für Z
M
.g f / !M D
M
.f g/ !M :
Bevor wir zum Beweis des S TOKESschen Satzes kommen, zeigen wir noch an Hand der M AXWELLschen Gleichungen, wie mit Hilfe des Satzes von S TOKES „differentielle“ Gleichungen aus „integralen“ Gleichungen gewonnen werden können. Wir betrachten dazu eine 3-dimensionale Mannigfaltigkeit M und Differential1 2 M (das elektrische Feld) und B 2 ˝Zeit M (das magnetische Feld). formen E 2 ˝Zeit 2 Auf R M ist dann durch F WD EQ ^ dt C BQ 2 ˝ .R M / mit den Bezeichnungen aus 4F die Feldstärke-Form gegeben. Wir postulieren nun, dass für jede kompakte berandete 3-dimensionale Untermannigfaltigkeit N von R M gilt Z F D 0: (4.35) @N
Nach dem Satz von S TOKES ist dies gleichbedeutend damit, dass Z dF D 0 N
für jede kompakte 3-dimensionale Untermannigfaltigkeit gilt, also dF D 0 ; was bekanntlich den ersten beiden M AXWELLschen Gleichungen (4.30) entspricht. Umgekehrt folgt natürlich auch (4.35) aus dF D 0. Ebenso können die letzten beiden M AXWELLschen Gleichungen (4.30) aus der „Ladungserhaltung“ hergeleitet werden, nämlich aus Z Z
F D 4 J @N
N
mit den Bezeichnungen aus Abschn. F. Ebenso entsprechen die M AXWELLschen Gesetze in ihrer klassischen Form Integralgleichungen. Die Integralgleichungen haben den Vorteil, dass ihre physikalische Bedeutung klarer ist als die der entsprechenden Gleichungen in differentieller Form. Wir führen dies nur an einer der vier Gleichungen vor. Postuliert man, dass die gesamte Flussrate des magnetischen Feldes B durch die Oberfläche jedes kompakten 3-dimensionalen räumlichen Bereichs V null ist, so bedeutet dies Z hBjN i dF D 0 ; @V
110
4 Integration und Differentiation von Differentialformen
also mit dem Satz von G AUSS
Z div B dV D 0 V
und damit div B D 0; also die Quellenfreiheit des magnetischen Feldes. Kommen wir zum Schluss dieses Abschnittes noch zum Beweis des Satzes von S TOKES. Satz 4.37 (Spezialfall des Satzes von S TOKES). Sei .U; h/ eine berandete Karte für M; o.B.d.A. orientierungserhaltend. Ist Tr ! U kompakt, so gilt Z Z d! D !: M
@M
Beweis (des Spezialfalls). Z Z Z d! D d! D M
U
U0
' d! D
Z U0
d.' !/ ;
'
wobei h1 WD ' W U 0 ! U und Tr .' !/ U 0 . Mit Übungsaufgabe 4.12 gilt aber Z Z Z Z d.' !/ D ' ! D ! D !: @U 0
U0
@U
@M
t u Um den allgemeinen Fall zu beweisen benutzen wir eine Zerlegung der Einheit. Beweis (des Satzes von S TOKES). Sei ! 2 ˝ n1 M und Tr ! kompakt. Sei A D .Ui /i 2I ein Atlas für die berandete Mannigfaltigkeit M; .˛ /˛2A eine P untergeordnete Zerlegung der 1 mit Tr ˛ Ui˛ für ein i˛ 2 I . Dann ist ! D ˛2A ˛ !. Da Tr ! kompakt ist, kann A so gewählt werden, dass nur endlich viele Summanden nicht verschwinden. Auf jeden Summanden ist der Spezialfall anwendbar, also gilt Z Z Z X XZ XZ d! D d !˛ D d!˛ D !˛ D !: M
M
˛
˛
U i˛
˛
@Ui˛
@M
t u
H Das P OINCARÉ Lemma. Potentiale und Vektorpotentiale Kompakte Mannigfaltigkeiten ohne Rand werden auch als geschlossene Mannigfaltigkeiten bezeichnet (man denke nur an Sphären oder Tori). Ist M solch eine geschlossene n-dimensionale !; ! 0 2 ˝ n M mit ! D ! 0 C d für R Mannigfaltigkeit R n1 0 ein 2 ˝ M; so ist M ! D M ! nach dem Satz von S TOKES. Dies zeigt, dass man die Form ! um einen Term der Gestalt d abändern kann, sofern man
H Das P OINCARÉ Lemma. Potentiale und Vektorpotentiale
111
sich nur R für das Integral über ! interessiert. Ist insbesondere ! D d; so folgt dann M ! D 0. Dies legt nahe, für die Formen aus Kern und Bild der C ARTANAbleitung besondere Bezeichnungen einzuführen: Definitionen 4.38. Sei 0 k n und ! 2 ˝ k M . Ist d! D 0; so nennt man die Differentialform ! geschlossen oder einen Kozykel. Ist ! D d für ein 2 ˝ k1 ; so heißt ! exakt oder ein Korand.1 Da aus ! D d sofort d! D 0 folgt, führt dies zu der Frage, welche Kozykel zugleich Koränder sind. Da man auf 3-dimensionalen R IEMANNschen Mannigfaltigkeiten Differentialformen stets mit Vektorfeldern identifizieren kann, können wir auch diese Fragestellung in die Sprache der Vektorfelder übersetzen. Definitionen 4.39. Sei v ein differenzierbares Vektorfeld auf einer dreidimensionalen R IEMANNschen Mannigfaltigkeit M . Dann heißt ein Vektorfeld w auf M ein Vektorpotential von v; falls rot w D v gilt. Eine Funktion ' 2 C 1 .M / heißt Potential von v falls grad ' D v gilt. Die Frage: „Welche Kozykel sind Koränder?“ bedeutet in diesem Kontext: Welche rotationsfreien Vektorfelder besitzen ein Potential und welche divergenzfreien Vektorfelder ein Vektorpotential? Kommen wir zur allgemeineren Frage der Kozykel und Koränder auf einer Mannigfaltigkeit beliebiger Dimension zurück! In der mathematischen Literatur wird hierzu die „DE R HAM-Kohomologie“ studiert, auf die in dieser Einführung nicht näher eingegangen werden kann. Wir stellen hier nur einige einfache Resultate zusammen, deren Konsequenzen für Potentiale und Vektorpotentiale offensichtlich sind. Definition 4.40. Sind f; g W M ! N differenzierbare Abbildungen zwischen Mannigfaltigkeiten, so heißen f und g differenzierbar homotop, falls es eine (differenzierbare) Abbildung H W Œ0; 1 M ! N gibt mit H.0; x/ D f .x/ und H.1; x/ D g.x/. Man schreibt f ' g. Anschaulich bedeutet dies, dass f differenzierbar in g deformiert werden kann. Satz 4.41. Ist ! 2 ˝ k N ein Kozykel und sind f ' g W M ! N; so ist f ! g ! ein Korand. Insbesondere ist für geschlossene Mannigfaltigkeiten M im Fall k D dim M Z Z f ! D g ! : M
M
Beweis. Seien f; g W M ! N differenzierbare Abbildungen und f ' g. Sei ! 2 ˝ k N mit d! D 0. Zu zeigen ist: Es existiert ein ˛ 2 ˝ k1 M so, dass f ! g ! D d˛ : 1 Man spricht das wie „Ko-Rand“. In dem Teil der Topologie, den man als Homologietheorie bezeichnet, werden Zykel und Ränder eingeführt. Da die Differentialformen eine Art spiegelbildliche Variante einer Homologietheorie liefern, benutzt man dieselben Ausdrücke zusammen mit der Vorsilbe „Ko“.
112
4 Integration und Differentiation von Differentialformen
Sei H W Œ0; 1 M ! N eine Homotopie zwischen f und g; also H0 D f ; H1 D g; wobei Ht .x/ D H.t; x/. Auf der berandeten Mannigfaltigkeit Œ0; 1 M gibt es ein ausgezeichnetes Vektorfeld @t ; das am Punkt .t0 ; p0 / 2 Œ0; 1 M durch die Kurve 7! .t0 C ; p0 / repräsentiert wird. Sind .x 1 ; : : :; x n / lokale Koordinaten auf einer offenen Menge U M; so sind .x 0 D t; x 1 ; : : :; x n / lokale Koordinaten auf Œ0; 1 U; das entsprechende Koordinatenbasisfeld ist .@t ; @1 ; : : :; @n /; und das duale Basisfeld ist . dt; dx 1 ; : : :; dx n /. Wir zeigen nun, dass der Prismenoperator P W ˝ k .Œ0; 1 M / ! ˝ k1 M Z 1 7! i@t dt
(4.36)
P . d/ D j1 j0 dP ./
(4.37)
0
die Gleichung
erfüllt, wobei jt W M ! Œ0; 1 M ; x 7! .t; x/. Ist dies bewiesen, so folgt dP .H !/ D P . dH !/ C g ! f ! D g ! f ! ; da d! D 0. Also ist P .H !/ 2 ˝ k1 M die gesuchte Form ˛. Beweis von (4.37). Es genügt offenbar D a dx 1 ^ ^ dx k ; 0 1 < < k n zu betrachten, wobei .U; h/ eine Karte für M; . dx 0 ; dx 1 ; : : :; dx n / die dadurch gegebene Koordinatenbasis auf Œ0; 1 U ist und dx 0 dt. 1. Fall: 1 1. Dann ist P ./ D 0 sowie P . d/ D P
aP dt ^ dx
Z
1
D
1
^ ^ dx
a.t; P x/ dt
k
X @a C dx i ^ dx 1 ^ ^ dx k @x i
!
i
dx 1 ^ ^ dx k
0
D .a.1; x/ a.0; x// dx 1 ^ ^ dx k D j1 j0 : 2. Fall: Ist 1 D 0; so ist jt D 0; da jt dt D 0. Weiter ist P . d/ D
n Z X i D1
1 0
@a .t; x/ dt @xi
dx i ^ dx 1 ^ ^ dx k
und
Z 1 n X @ d.P .// D a.t; x/ dt dx i ^ dx 1 ^ ^ dx k : @xi 0 i D1
t u
H Das P OINCARÉ Lemma. Potentiale und Vektorpotentiale
113
Abb. 4.2 Zusammenziehbares Gebiet
p0
In manchen Fällen entscheidet nun schon das Aussehen von M darüber, ob geschlossene Differentialformen exakt sind: Korollar 4.42 (P OINCARÉ Lemma). a. Ist M zusammenziehbar, d.h. idM homotop zu einer konstanten Abbildung p W M ! M; p.x/ p0 für ein festes p0 2 M; so gibt es für jedes ! 2 ˝ k M mit d! D 0 ein ˛ 2 ˝ k1 M mit d˛ D !. b. Insbesondere gibt es auf jeder beliebigen Mannigfaltigkeit M zu jedem p 2 M eine offene Umgebung U; so dass für jeden Kozykel ! auf M gilt: !jU ist ein Korand auf U . So sichert die Bedingung dF D 0 für den Feldstärketensor F 2 ˝ 2 .X / lokal die Existenz von A 2 ˝ 1 .U / mit dA D F . Diese Differentialform entspricht dem Viererpotential. Wie wir in den Beispielen 4.31 und 4.33 in Abschnitt G gesehen haben, ist im Allgemeinen aber nicht jeder Kozykel ein Korand. Ist M Rn sogar sternförmig bezüglich p0 (d. h. für jedes p 2 M ist die Strecke pp0 WD ftpC.1t/p0 j t 2 Œ0; 1g M ), so kann die „Stammform“ dieses Korands explizit berechnet werden. Korollar 4.43 (Stammformel). Sei X Rn eine bezüglich x0 D 0 sternförmige Umgebung von 0; ! 2 ˝ k X ein Kozykel, also d! D 0. Dann ist ˛ 2 ˝ k1 mit d˛ D ! durch X
˛ WD
k X .1/i 1
1 0; für alle t; so heißt ' orientierungserhaltend, sonst orientierungsumkehrend. Rb c. LŒ WD a jP .t/j dt heißt die Länge von . d. Ist Wa; bŒ! Rn eine regulär parametrisierte Kurve mit j.t/j P D 1 für alle t 2a; bŒ; so heißt auf Bogenlänge parametrisiert. e. Ist j.t/j P D c ¤ 0 konstant, so heißt proportional zur Bogenlänge parametrisiert. Ist Wa; bŒ! Rn auf Bogenlänge parametrisiert, so ist offenbar LŒ D b a. Wir werden uns hauptsächlich mit auf Bogenlänge parametrisierten Kurven beschäftigen. Lemma 5.2. Ist Wa; bŒ! Rn eine regulär parametrisierte Kurve, so gibt es eine Umparametrisierung von auf Bogenlänge, d. h. es gibt einen Diffeomorphismus ' Wa0 ; b 0 Œ!a; bŒ ; so dass ı ' auf Bogenlänge parametrisiert ist. Dabei ist a0 ; b 0 Œ R ein Intervall der Länge LŒ . Beweis. Für ein t0 2a; bŒ definieren wir Wa; bŒ!s0 ; s0 C LŒ Œ durch Z s .s/ D j.t/j P d t und insbesondere t0 Z a jP .t/j d t : s0 D t0
Dann ist 0 .s/ D jP .s/j > 0. Folglich ist Q D ı sierung auf Bogenlänge, denn Q 0 .s/ D ı
1 0
.s/ D P D
1
1
.s/
1 jP .
also jQ 0 .s/j D 1 für alle s 2s0 ; s0 C LŒ Œ.
1 .s//j
die gesuchte Umparametri1 0.
P .
1 .s// 1
.s// ; t u
Die Umparametrisierung einer regulär parametrisierten Kurve auf Bogenlänge ist bis auf Verschiebung eindeutig. Genauer gilt Lemma 5.3. Sind 1 und 2 zwei orientierungserhaltende Umparametrisierungen von auf Bogenlänge, so gibt es ein t0 2 R; so dass 2 .t/ D 1 .t C t0 / gilt.
A Krümmung von Kurven in Untermannigfaltigkeiten des Rn
123
Der Beweis ist eine leichte Übungsaufgabe. Die Krümmung einer regulär parametrisierten Kurve wird nun unabhängig von der Parametrisierung definiert. Definitionen 5.4. a. Ist eine auf Bogenlänge parametrisierte Kurve, so ist die Krümmung von an der Stelle t durch .t/ WD jR .t/j definiert. b. Ist Q eine regulär parametrisierte Kurve und WD Q ı' eine Umparametrisierung auf Bogenlänge, so ist die Krümmung von Q durch Q .t/ WD .' 1 .t// definiert. Wir wollen die Bedeutung der Krümmung an zwei Beispielen veranschaulichen: Beispiele 5.5. a. Ist eine auf Bogenlänge parametrisierte Kurve mit 0; so gibt es ein x0 2 Rn und ein v 2 Sn1 mit .t/ D x0 C tv; d. h. das Bild von ist eine Gerade. Denn ist R .t/ D 0 für alle t; so ist P konstant, also P .t/ D v 2 Sn1 ; da auf Bogenlänge cos t parametrisiert1ist. b. Ist Q .t/ D R R sin t ; so ist Q .t/ D R . Um dies zu errechnen, muss Q zuerst Bogenlänge parametrisiert werden. cos.tauf =R/ eine Parametrisierung von Q auf Wegen jQ 0 .t/j D R ist .t/ D R R sin.t =R/ 1 cos.t =R/ Bogenlänge. Damit ist R .t/ D R sin.t =R/ ; und die Behauptung folgt. Ist eine Kurve in der Ebene R2 ; so kann auch die „Richtung“ der Krümmung in die Definition mit einbezogen werden. Definition 5.6. Ist W I ! R2 auf Bogenlänge parametrisiert, so heißt .t/or WD hR .t/ j U.t/i mit U.t/ WD
0 1
1 0
P .t/ die orientierte Krümmung von .
Ist jP .t/j D 1; so ist hR .t/ j P .t/i D 0; also R .t/ D .t/or U.t/. Daher ist .t/ D j .t/or j. In obigem Beispiel b. wäre .t/or D .t/. Eine orientierungsumkehrende Umparametrisierung ändert offenbar das Vorzeichen der orientierten Krümmung. Beschreibt die Bahnkurve eines Massenpunktes, so ist nach dem N EWTONschen Gesetz R proportional zu der Kraft, die auf den Massenpunkt einwirkt. Bewegt sich der Punkt auf einer Fläche, so spielen die Zwangskräfte, die senkrecht zur Fläche stehen, eine besondere Rolle. Es liegt also nahe, in diesem Falle die Krümmung in zwei Anteile aufzuspalten.
124
5 Geodätische und Krümmung
Definitionen 5.7. Sei M Rn eine m-dimensionale Fläche (= Untermannigfaltigkeit), W I ! M eine auf Bogenlänge parametrisierte Kurve. Für jedes x 2 M bezeichne prM;x W Rn ! Tx M ; pr?;x W Rn ! Tx? M die beiden Orthogonalprojektionen. a. Dann heißt jprM;.t / R .t/j DW g .t/ die (absolute) geodätische Krümmung von an der Stelle t und jpr?;.t / R .t/j DW k .t/ die (absolute) Normalkrümmung von an der Stelle t. b. Ist g .t/ D 0 für alle t; so heißt geodätische Kurve oder kurz Geodätische. c. Ist m D n 1 und M durch ein Normaleneinheitsfeld U orientiert, so heißt k .t/ WD hR .t/ j U..t//i die (orientierte) Normalkrümmung von an der Stelle t. d. Ist dim M D 2 und M orientiert, so bezeichnet V W I ! Rn die Abbildung, für die .P .t/; V .t// eine positiv orientierte Orthonormalbasis von T.t /M für alle t 2 I ist. Die Größe g .t/ WD hR .t/ j V .t/i heißt dann die orientierte geodätische Krümmung von an der Stelle t. Eine auf Bogenlänge parametrisierte Kurve W I ! M ist also genau dann geodätische Kurve, wenn R .t/ ? T.t / M für alle t 2 I gilt. Denkt man sich wieder als Bahnkurve eines Teilchens, so heißt das, dass die Zwangskräfte, die das Teilchen auf der Fläche halten, die einzigen Kräfte sind, die auf das Teilchen wirken. Mit dem Satz von P YTHAGORAS folgt sofort, dass 2 .t/ D .g .t//2 C .k .t//2 : Wegen jP .t/j 1 folgt weiterhin hR .t/ j P .t/i D 0; also im Fall von dim M D 2 R .t/ D pr?;.t / R .t/ C hR .t/ j V .t/iV .t/ und damit g .t/ D jg .t/j :
A Krümmung von Kurven in Untermannigfaltigkeiten des Rn
125
U (γ1 (t)) γ¨1 (t)
γ¨2 (t)
U (γ2 (t))
Abb. 5.1 Breitenkreise auf der zweidimensionalen Sphäre
Ist dim M D n 1 und U ein Normaleneinheitsfeld auf M; so ist R j U..t//i U..t// ; pr?;.t / R .t/ D h.t/ also k .t/ D jk .t/j : Beispiel 5.8. Wir betrachten Kurven auf M D S2 ; die entlang der Breitenkreise verlaufen (vgl. Abb. 5.1), also 0 1 c cos.t=c/ .t/ D @ cpsin.t=c/ A für c 2 Œ0; 1 : 1 c2 Dann ist U..t// D .t/ und 0 1 cos.t=c/ 1 @ sin.t=c/ A ; R .t/ D c 0 r
also g .t/ D
1 c2 c2
und k .t/ D 1. Also ist nur der Äquator geodätisch. Ein beliebiger Kreis auf der Sphäre ist aber bezüglich eines gedrehten Koordinatensystems ein Breitenkreis, und die Krümmungen sind unter Drehungen invariant, wie man leicht nachrechnet (vgl. Aufgabe 5.3). Damit sind genau die Großkreise die Geodätischen auf S2 . Das folgende Lemma zeigt, dass die Normalkrümmung einer Kurve an einem Punkt auf einer Fläche von ihrer Geschwindigkeit an dieser Stelle und dem Normaleneinheitsfeld der Fläche abhängt.
126
5 Geodätische und Krümmung
Lemma 5.9. Ist M eine .n 1/-dimensionale orientierte Untermannigfaltigkeit des Rn mit orientierungsdefinierendem Normaleneinheitsfeld U und W I ! M eine auf Bogenlänge parametrisierte Kurve, so ist k .t/ D h dU.t /.P .t// j P .t/i :
(5.1)
Beweis. Wegen h.t/ P j U..t//i D 0 für alle t folgt mittels Ableiten hR .t/ j U..t//i D h dU.t / .P .t// j .t/i P : t u Im Fall n D 2 stimmt die Normalkrümmung natürlich mit der Krümmung der M parametrisierenden Kurve überein und (5.1) liefert eine Möglichkeit, die Krümmung zu berechnen. In diesem Fall ist 0 1 U..t// D P .t/ : 1 0
B Krümmung von Hyperflächen des Rn In diesem Abschnitt ist M stets eine orientierte .n 1/-dimensionale Teilmannigfaltigkeit des Rn ; also eine orientierte Hyperfläche. Das orientierungsdefinierende Normaleneinheitsfeld wird mit U bezeichnet. Gleichung (5.1) ist schon ein erster Hinweis darauf, dass die Krümmung einer Fläche durch die Änderung des Normaleneinheitsfeldes beschrieben wird. Offenbar ist dUp 2 End .Tp M / für jedes p 2 M; denn ist v 2 Tp M und repräsentierende Kurve, also dUp .v/ D
d jt D0 U..t// ; dt
so ist wegen jU..t//j2 D 1 auch 2h dUp .v/ j U.p/i D 0 ; also dUp .v/ 2 Tp M . Definition 5.10. Die lineare Abbildung Sp WD dUp 2 End .Tp M / heißt der W EINGARTENoperator von M an der Stelle p.
B Krümmung von Hyperflächen des Rn
127
Mit (5.1) kann jetzt die Normalkrümmung einer Kurve in M stets aus dem W EIN GARTEN operator berechnet werden. In lokalen Koordinaten ist der W EINGAR TEN operator leicht explizit zu bestimmen: Lemma 5.11. Ist .V; h/ eine Karte von M mit Parametrisierung h1 D ' W V 0 ! Rn und sind @1 ; : : : ; @n1 die zugehörigen Koordinatenbasisfelder, so ist ˇ ˇ @2 ' ˛ ˝ .h.p// : Sp .@i .p// ˇ @j .p/ D U.p/ ˇ @xi @xj Beweis. Die Koordinatenbasisfelder sind durch @i .p/ D gegeben. Wegen ˇ @' .p 0 / D 0 .U ı '/.p 0 / ˇ @xj für alle p 0 2 V 0 ist
ˇ @' @ .U ı '/ ˇ @xi @xj
also
ˇ D U ı'ˇ
@' @xi
@2 ' @xi @xj
.h.p// für p 2 V
;
ˇ @' @ ˇ .U ı '/.h.p// .h.p// @xi @xj ˇ @2 ' .h.p// : D U.p/ ˇ @xi @xj
ˇ ˛ ˝ Sp .@i .p// ˇ @j .p/ D
t u Wegen
@2 ' @xi @xj
D
@2 ' @xj @xi
folgt daraus sofort
Korollar 5.12. Der W EINGARTENoperator ist selbstadjungiert, d. h. es gilt hSp .v/jwi D hvjSp .w/i für alle v; w 2 Tp M . Aus der linearen Algebra ist bekannt, dass symmetrische Matrizen stets eine Orthogonalbasis von Eigenvektoren und reelle Eigenwerte besitzen. Dies ermöglicht die Einführung von wichtigen Krümmungsgrößen: Definitionen 5.13. a. Die symmetrische Bilinearform IIp W Tp M Tp M ! R .v; w/ 7! hSp .v/ j wi heißt die zweite Grundform auf M .1 1
Die erste Grundform ist der metrische Tensor g.v; w/ D hv j wi.
128
5 Geodätische und Krümmung
b. K.p/ WD det Sp heißt die G AUSSsche Krümmung von M an der Stelle p. 1 Spur Sp heißt die mittlere Krümmung von M an der Stelle p. c. H.p/ WD n1 d. Die Eigenwerte von Sp heißen die Hauptkrümmungen von M an der Stelle p; die Eigenvektoren heißen die Hauptkrümmungsrichtungen. Ist W I ! M eine auf Bogenlänge parametrisierte Kurve in M; so ist also k .t/ D II.P .t/; P .t// : Ist zusätzlich P .t/ Hauptkrümmungsrichtung zur Hauptkrümmung ; so ist k .t/ D : Bezüglich einer Karte .U; h/ mit zugehöriger Koordinatenbasis .@1 ; : : : ; @n1 / wird die zweite Grundform durch die .n 1/-reihige Matrix .hjk / mit hjk WD II.@j ; @k /
(5.2)
wiedergegeben. Bezeichnen wir mit . i j / die Matrix, die den W EINGARTENoperator bzgl. dieser Basis wiedergibt, also S @j D
n1 X
i j @i ;
i D1
P i so erhalten wir hjk .p/ D hSp @j .p/j@k .p/i D gp i j .p/@i .p/; @k .p/ D P i 2 U . Für die Determinanten ergibt sich daher i j .p/gi k .p/ für p det .hjk .p// D K.p/G.p/; wo G wieder die G RAMsche Determinante bezeichnet. So erhalten wir eine lokale Formel für die G AUSSsche Krümmung, nämlich K.p/ D
det.IIp .@j .p/; @k .p/// : G.p/
(5.3)
Betrachten wir nun einige Beispiele, um eine Vorstellung von den Krümmungsbegriffen zu bekommen. Beispiele 5.14.
0 1 0 a. Ist M D R2 f0g R3 ; so ist U.p/ D @0A ; also Sp D 0; und somit 1 verschwinden mittlere Krümmung und G AUSSsche Krümmung. b. Ist M D S2 R3 ; so ist U.p/ D p; also Sp D id und damit K.p/ D 1 sowie H.p/ D 1. c. Sei V R2 offen, f 2 C 1 .V / und M D f.x; f .x//jx 2 V g die Graphenfläche zu f . Eine Parametrisierung von M ist durch ' W V ! R03 ; x17! .x; f .x// 0 gegeben. Ist p 2 V mit grad f .p/ D 0; so ist U.p; f .p// D @0A D e 3 ; also 1
C Die kovariante Ableitung auf Untermannigfaltigkeiten des Rn
K=0
129
K0
Abb. 5.2 G AUSSsche Krümmung beim Torus
ˇ 2 ˇ @ ' @2 f ˇ hS.p;f .p// .@i /j@j i D e 3 ˇ .p/ D .p/ : @xi @xj @xi @xj Hat die Graphenfläche also am Punkt .p; f .p// positive G AUSSsche Krümmung, so hat der Graph an der Stelle p ein lokales Extremum; hat sie negative G AUSSsche Krümmung, so hat der Graph an der Stelle p einen Sattelpunkt. Legt man die Koordinaten im R3 entsprechend, so sieht man daraus leicht, dass der in den R3 eingebettete Torus auf der äußeren Hälfte – wie in Abb. 5.2 gezeigt – positive Krümmung hat, am oberen und unteren Kreis die Krümmung 0 und innen negative Krümmung. Flächen mit verschwindender mittlerer Krümmung heißen Minimalflächen. Obwohl auch sie für die Physik eine wichtige Rolle spielen, ist hier nicht der Platz, näher darauf einzugehen. Eine erste Einführung ist in [9] oder auch [31] gegeben. Im Gegensatz zur mittleren Krümmung kann man zeigen, dass die G AUSSsche Krümmung allein durch die Metrik der Fläche, nicht durch ihre Lage im R3 bestimmt ist. Dies ist der Gegenstand des „Theorema egregium “ von G AUSS. In Abschn. C werden wir wieder darauf zurück kommen.
C Die kovariante Ableitung auf Untermannigfaltigkeiten des Rn In diesem Abschnitt sei M Rn wieder eine Teilmannigfaltigkeit beliebiger Dimension. In Abschn. A haben wir den tangentialen Anteil der Beschleunigung R .t/ D dtd P .t/ einer mit gleichförmiger Geschwindigkeit durchlaufenen Kurve in M als die geodätische Krümmung definiert. Es ist nun ein entscheidender Schritt, sich hier von den Geschwindigkeitsvektoren P .t/ zu lösen und auch für allgemeine Vektorfelder v auf M den tangentialen Anteil der Ableitung als eine wichtige Größe zu erkennen. Man nennt sie die kovariante Ableitung rv; und ihre systematische Untersuchung führt schließlich auch zu den relevanten Krümmungsgrößen für allgemeine Mannigfaltigkeiten beliebiger Dimension, die die Geometrie solch einer Mannigfaltigkeit wesentlich mitbestimmen und die physikalisch als Feldstärke interpretiert werden können (vgl. Abschn. G und H). Hierbei wird auch die Betrach-
130
5 Geodätische und Krümmung
tung des Normaleneinheitsfeldes oder anderer Größen, die den umgebenden Rn betreffen, vermieden, und es gelingt, alle entscheidenden Krümmungsgrößen aus der pseudo-R IEMANNschen Metrik g alleine zu berechnen. Erst dadurch wird es möglich, die Krümmungstheorie auch für allgemeine Mannigfaltigkeiten zu entwickeln, bei denen kein umgebender euklidischer Raum mehr vorhanden ist. Ein Vektorfeld v auf M Rn ist durch eine Abbildung v W M ! Rn gegeben, so dass v.x/ 2 Tx M für jedes x 2 M gilt. Damit ist dann dvx 2 Hom.Tx M; Rn /. Ist w ein weiteres Vektorfeld auf M; so ist dvx .w.x// 2 Rn ; aber im Allgemeinen kein Tangentialvektor an M . Wir haben in Abschn. 3D mit der L IE-Ableitung bereits eine Möglichkeit kennen gelernt, wie man ein Vektorfeld trotzdem differenzieren kann. Hier lernen wir nun eine weitere kennen. Wir verwenden dabei die schon in Definition 5.7 eingeführte Notation. Notation: Für x 2 M bezeichnen wir in diesem Abschnitt mit prM;x W Rn ! Tx M die Orthogonalprojektion. Die Notation TM für den Raum der differenzierbaren Vektorfelder wird jetzt etwas verallgemeinert. Ist M eine differenzierbare Mannigfaltigkeit, E D ˝rs TM oder E D Altr .TM; ˝s TM / [ D Altr .Tx M; ˝s Tx M / ; x2M
so bezeichnet man mit E den Raum der differenzierbaren Schnitte in E; d. h. den Raum der Schnitte in E; deren Komponentenfunktionen bezüglich gegebener Koordinatenbasen durch differenzierbare Abbildungen gegeben sind (vgl. Definition 3.2 und die darauf folgenden Erläuterungen). So ist z. B. durch f 2 End .TM / für jedes x 2 M ein Endomorphismus f .x/ 2 End .Tx M / gegeben. Ist U ein Kartengebiet, so ist f jU bezüglich der Koordinatenbasen .@1 ; : : : ; @n / in diesem Gebiet durch eine differenzierbare Abbildung U ! Rnn gegeben. Definitionen 5.15. a. Ist v ein differenzierbares Vektorfeld und w 2 Tx M; so heißt rw v WD prM;x dvx .w/ 2 Tx M die kovariante Ableitung von v in Richtung w an der Stelle x. Damit ist rv 2 End .TM / wohldefiniert. b. Ist W I ! M differenzierbar und v W I ! TM eine differenzierbare Abbildung mit v.t/ 2 T.t / M; so heißt r ˇˇ v WD prM;.t0/ v.t/ P ˇ dt t Dt0 die kovariante Ableitung von v in Richtung .
C Die kovariante Ableitung auf Untermannigfaltigkeiten des Rn
131
Abb. 5.3 Paralleles Vektorfeld längs Kurve
Ist vQ ein Vektorfeld in einer offenen Umgebung von .t0 /; so dass für " > 0 gilt v.t/ D v..t// Q für alle t 2t0 "; t0 C "Œ; so ist offenbar r ˇˇ v D rP .t0 / vQ : ˇ dt t Dt0 Insofern ist die Verwendung des selben Symbols und Namens gerechtfertigt. Eine auf Bogenlänge parametrisierte Kurve ist also genau dann geodätische Kurve, wenn r P D 0 gilt. dt Definitionen 5.16. a. Ein Vektorfeld v heißt horizontal oder parallel, falls rv D 0 gilt. b. Ist W Œ0; L ! M eine Kurve in M und v W I ! TM eine differenzierbare r Abbildung mit v.t/ 2 T.t / M und dt v 0; so heißt v ein paralleles Vektorfeld längs . Eine geodätische Kurve ist also eine auf Bogenlänge parametrisierte Kurve, bei der P ein paralleles Vektorfeld längs ist. Wir werden auf diesen Begriff in Abschn. E noch einmal in einem allgemeineren Zusammenhang zurück kommen. Im folgenden Satz halten wir die wichtigsten Eigenschaften der kovarianten Ableitung fest: Satz 5.17. Für die kovariante Ableitung r auf M Rn gilt: a. Für jedes v 2 TM ist rv 2 End.TM /; d. h. rw1 Cw2 v D rw1 v C rw2 v für alle x 2 M; w1 ; w2 2 Tx M und 2 R.
132
5 Geodätische und Krümmung
b. Die Abbildung r W TM ! End.TM / ist linear, also r.v1 C v2 / D rv1 C rv2 ; falls vi 2 TM; i D 1; 2 und 2 R. c. Ist f 2 C 1 .M / und v 2 TM; so gilt für jedes x 2 M ; w 2 Tx M rw .f v/ D dfx .w/ v.x/ C f .x/ rw v (Produktregel). d. Für v1 ; v2 2 TM sowie x 2 M ; w 2 Tx M gilt stets d.hv1 jv2 i/x .w/ D hrw v1 .x/jv2 .x/i C hv1 .x/jrw v2 .x/i (Isometrie). e. Für alle Vektorfelder v; w 2 TM gilt rv w rw v D Œv; w (Torsionsfreiheit der kovarianten Ableitung). Beweis. Die Eigenschaften a.–d. folgen unmittelbar aus der Definition. Die Formel aus e. folgt sofort für Koordinatenbasisfelder .@1 ; : : : ; @n / auf U M; denn r@i .x/ @j D prM;x
@2 ' @2 ' .x/ D prM;x D r@j .x/ @i @xi @xj @xj @xi
für jedes x 2 U; also r@i @j r@j @i D 0 D Œ@i ; @j : Damit folgt aus a.–c. für v D rv w rw v D
P i
v i @i und w D
P j
w j @j
X v i w j r@i @j r@j @i C v i @i w j @j w i @i v j @j i;j
D Œv; w : t u Wie wir im Beweis von Satz 5.17e gesehen haben, genügt es auf Grund der Linearität und der Produktregel, die kovariante Ableitung auf den Koordinatenbasisfeldern zu kennen. Dies motiviert die folgende Definition 5.18. Sind .@1 ; : : : ; @m / Koordinatenbasisfelder zur Karte .U; h/; so heißen die durch m X r@i @j D ij @ D1
ij
eindeutig bestimmten Funktionen auf U die C HRISTOFFELsymbole (bezüglich P i P j der Karte .U; h/). Sind v D v @i und w D w @j lokale Vektorfelder, so gilt dann X v i w j ij C .@i w / @ (5.4) rv w D i;j;
C Die kovariante Ableitung auf Untermannigfaltigkeiten des Rn
133
Diese Formel wird später hilfreich sein, wenn wir die kovariante Ableitung auf allgemeinen R IEMANNschen Mannigfaltigkeiten definieren. Die C HRISTOFFELsymbole lassen sich nämlich aus der Metrik alleine berechnen: Lemma 5.19. Ist .@1 ; : : : ; @m / eine Koordinatenbasis, gij D h@i j@j i und .g ij / die zu .gij / inverse Matrix, so gilt ! 1 X ` ij D g .@j gi ` C @i gj ` @` gij / : (5.5) 2 `
Beweis. Aus der Isometrie der kovarianten Ableitung folgt X @i gj D ij` g` C i` gj ` : `
Nutzt man die Beziehung ij D ji aus, die sofort aus der Torsionsfreiheit folgt, so erhält man daraus X @i gj ` C @j gi ` @` gij D 2 ijr gr` r
und daraus schließlich die Formel (5.5).
t u
Mit Hilfe von (5.4) und (5.5) können Geodätische und horizontale Vektoren aus der Metrik bestimmt werden. Dies werden wir im nächsten Abschnitt benutzen, um diese Begriffe auf allgemeine R IEMANNsche Mannigfaltigkeiten zu übertragen. Als nächstes soll auch die G AUSSsche Krümmung mit Hilfe der kovarianten Ableitung beschrieben werden. Ist M eine .n 1/-dimensionale Untermannigfaltigkeit des Rn und U das Normaleneinheitsfeld auf M; so ist wegen hwjU i 0 für alle Vektorfelder w auf M . dw/.v/ D rv w C h dw.v/jU iU D rv w C II.v; w/U :
(5.6)
Lemma 5.20. Ist M eine .n 1/-dimensionale Teilmannigfaltigkeit des Rn und .@1 ; : : : ; @n1 / eine lokale Koordinatenbasis, so gilt II.@i ; @j / II.@` ; @m / II.@i ; @` / II.@j ; @m / ˇ E D ˇ D r@` r@j @i r@j r@` @i ˇ @m : Beweis. Aus (5.6) folgt für die Koordinatenbasis zur Parametrisierung ' r@j @i D
@2 ' II.@i ; @j / U ; @xi @xj
(5.7)
134
5 Geodätische und Krümmung
also folgt aus hU j@m i D 0 ˇ E D ˇ r@` r@j @i ˇ @m D
ˇ @' ˇ @' ˇ ˇ II .@ ; @ / dU.@ / ˇ i j ` ˇ @xm @xm ˇ @' @3 ' ˇ C II.@i ; @j /II.@` ; @m / : D ˇ @xi @xj @x` @xm @3 ' @xi @xj @x`
Damit folgt die Gleichung, da die Parametrisierung eine C 1 -Abbildung ist.
t u
Formel (5.7) ist nur für Koordinatenbasisfelder richtig. Wir werden darauf in Abschn. E noch einmal zurück kommen. Im Augenblick kommt es uns darauf an, zu sehen, dass für Flächen im R3 die G AUSSsche Krümmung durch die kovariante Ableitung beschrieben und als Maß dafür verstanden werden kann, wie weit der Paralleltransport in Richtung verschiedener Koordinatenfelder vertauschbar ist. Insbesondere ist die G AUSSsche Krümmung durch den metrischen Tensor alleine bestimmt, wird also von der Art, wie die Fläche in den R3 eingebettet ist, nicht beeinflusst. Um genau zu formulieren, was das bedeutet, muss man allerdings die Abbildungen charakterisieren, die die R IEMANNsche Geometrie unverändert lassen. Dazu definieren wir (vgl. Aufgabe 3.1): Definitionen 5.21. Seien .M; g/; .MQ ; g/ Q zwei pseudo-R IEMANNsche Mannigfaltigkeiten und F W M ! MQ eine differenzierbare Abbildung. a. Man nennt F eine lokale Isometrie, wenn für alle x 2 M und alle v; w 2 Tx M gilt: gQ F .x/ . dFx .v/; dFx .w// D gx .v; w/ : b. Eine Isometrie ist eine lokale Isometrie, die gleichzeitig ein Diffeomorphismus M ! MQ ist. c. Die beiden pseudo-R IEMANNschen Mannigfaltigkeiten heißen isometrisch, wenn es eine Isometrie F W M ! MQ gibt. Man sieht leicht, dass eine lokale Isometrie zwischen Mannigfaltigkeiten gleicher Dimension auch ein lokaler Diffeomorphismus ist (vgl. Aufgabe 3.1). Eine Isometrie kann daher in diesem Fall auch beschrieben werden als eine bijektive lokale Isometrie. Die Isometrien des Rn sind die euklidischen Bewegungen, d. h. die Abbildungen der Form F .x/ WD Ax C b mit einem festen Vektor b 2 Rn und einer orthogonalen Transformation A 2 O.n/. Ist nun M Rn eine Untermannigfaltigkeit, F eine euklidische Bewegung und ˇ MQ WD F .M /; so ist offenbar F ˇM W M ! MQ eine Isometrie (alles in Bezug auf den metrischen Tensor g.v; w/ WD hvjwi). Eine lokale Isometrie, die kein Diffeomorphismus ist, entsteht z. B., wenn man die Ebene R2 auf den Zylinder R S1 abrollt (vgl. Aufgabe 5.11b.).
D Die kovariante Ableitung auf Mannigfaltigkeiten
135
Nun zu den angekündigten Eigenschaften der G AUSSschen Krümmung: Theorem 5.22 (Theorema egregium). Die G AUSSsche Krümmung einer Fläche ist eine Isometrie-Invariante. Ist .@1 ; @2 / eine Koordinatenbasis, so ist ˇ D E ˇ K.p/ D r@2 .p/ r@1 @1 r@1 .p/ r@2 @1 ˇ @2 .p/ = G.p/ (5.8) mit G D det .gij /. Beweis. Formel (5.8) folgt sofort aus der Definition von K; (5.7) und (5.3) in Abschn. B. Damit folgt aber auch, dass K invariant unter Isometrien ist, denn ist f W M ! MQ eine Isometrie und @1 ; : : : ; @n eine Koordinatenbasis für M; so ist @Q 1 D df .@1 /; : : : ; @Q n D df .@n / eine Koordinatenbasis für MQ ; und bezüglich dieser Koordinatenbasis werden die Metriken auf M und MQ und damit auch die kovarianten Ableitungen auf M und MQ durch die selben Matrizen beschrieben. Da auch die kovariante Ableitung nach (5.5) vollständig durch .gij / bestimmt ist, ist K invariant unter Isometrien. t u Die G AUSSsche Krümmung kann damit vollständig aus den Koeffizienten .gij / gewonnen werden. Wir werden dies etwas allgemeiner in den Übungen behandeln. Das Theorema egregium macht es in vielen Fällen leicht, zu entscheiden, ob es eine Isometrie zwischen Flächen geben kann. So sieht man sofort, dass es keine isometrische Karte (eines Teiles) der Erdoberfläche gibt, denn die G AUSSsche Krümmung der Sphäre ist 1, die G AUSSsche Krümmung der Ebene ist 0.
D Die kovariante Ableitung auf Mannigfaltigkeiten In diesem Abschnitt werden wir die Konzepte aus Abschn. A, B und C auf allgemeine Mannigfaltigkeiten übertragen. Bei einer Mannigfaltigkeit, die nicht als Untermannigfaltigkeit des Rn gegeben ist, können wir nicht von einem „Normalenfeld“ auf der Mannigfaltigkeit sprechen. Die Definitionen 5.7 und 5.13 können also nicht auf Mannigfaltigkeiten übertragen werden. Für die kovariante Ableitung wurde aber in (5.5) eine Formel angegeben, die nur von der Metrik abhängt, also auch auf R IEMANNschen Mannigfaltigkeiten einen Sinn hat. Ein möglicher Weg wäre, die kovariante Ableitung durch (5.4) und (5.5) zu definieren und dann die Unabhängigkeit von der Koordinatenwahl nachzuprüfen. Hier soll allerdings ein anderer Weg eingeschlagen werden. Zunächst fassen wir den Begriff der kovarianten Ableitung auf dem Tangentialbündel etwas allgemeiner als in Abschn. C. Definitionen 5.23. Sei M eine Mannigfaltigkeit. a. Unter einer allgemeinen kovarianten Ableitung auf M verstehen wir eine lineare Abbildung r W TM ! Hom .TM; TM / ;
136
5 Geodätische und Krümmung
für die die Produktregel r.f v/ D df ˝ v C f rv
(5.9)
für f 2 C 1 .M / und v 2 TM gilt. (Hier ist dfx ˝ v.x/ gemäß der Identifikation aus Satz 2.12c. als lineare Abbildung aufzufassen.) b. Statt .rv/.w/ schreibt man auch rw v und .rv/x .w.x// DW rw.x/ v 2 Tx M : c. Ein Vektorfeld v auf M heißt horizontal oder parallel (bezüglich der allgemeinen kovarianten Ableitung r), falls rv 0 gilt. Die Existenz von kovarianten Ableitungen auf beliebigen Mannigfaltigkeiten werden wir im nächsten Abschnitt nachweisen. Offenbar ist die im letzten Abschnitt für (n 1/-dimensionale Untermannigfaltigkeiten des Rn definierte kovariante Ableitung auch eine allgemeine kovariante Ableitung. Jedoch gibt es viele weitere allgemeine kovariante Ableitungen: Ist A 2 Mult2 .TM I TM / und r eine allgemeine kovariante Ableitung, so ist durch .r C A/.v/.w/ WD rw v C A.w; v/ eine weitere allgemeine kovariante Ableitung gegeben. Aus der Produktregel folgt, dass kovariante Ableitungen stets in folgendem Sinn lokal sind: Sind v1 und v2 differenzierbare Vektorfelder und ist v1 .x/ D v2 .x/ für alle x 2 U für eine offene Teilmenge U M; so ist für alle x 2 U auch .rv1 /x D .rv2 /x : Das beweist man genauso wie die entsprechende Aussage für den C ARTAN-Operator d; die im Verlaufe des Beweises von Theorem 4.14 hergeleitet wurde. Daher ist auch für lokale Vektorfelder die kovariante Ableitung wohldefiniert. Für allgemeine kovariante Ableitungen gilt damit – genauso wie für die kovariante Ableitung auf Hyperflächen –, dass sie bereits durch ihre Werte auf den lokalen Koordinatenbasisfeldern wohlbestimmt sind, d. h. ist X k aij @k ; r@i @j D k
so ist rw v D
X k w i v j aij C @i v k @k :
(5.10)
i;j;k
Sprechen wir vom Geschwindigkeitsfeld P einer Kurve W I ! M; so ist dies natürlich kein Vektorfeld auf der Mannigfaltigkeit M; nicht einmal ein Vektorfeld auf einer offenen Teilmenge von M . Wir müssen daher den Begriff des Vektorfelds jetzt etwas allgemeiner fassen.
D Die kovariante Ableitung auf Mannigfaltigkeiten
γ t1
t2
137
v(t1 ) p1 = p2v(t2 )
Abb. 5.4 Vektorfeld längs einer Kurve (pi WD .ti /)
Definition 5.24. Ist f W N ! M eine differenzierbare Abbildung, so versteht man unter einem Vektorfeld längs f eine Abbildung v W N ! TM mit v.x/ 2 Tf .x/ M . Ein Vektorfeld v längs f heißt differenzierbar (bei x 2 N ), falls gilt: Die in einer Umgebung U von x durch X v i .x 0 /@i .f .x 0 // v.x 0 / D i
durch eine Koordinatenbasis eindeutig definierten Funktionen v i W U ! R sind (bei x/ differenzierbar. Die allgemeine kovariante Ableitung von Vektorfeldern längs Kurven auf Mannigfaltigkeiten ist damit genauso wie die kovariante Ableitung von Kurven auf Hyperflächen definiert. Definition 5.25. Ist W I ! M eine regulär parametrisierte Kurve in M; v W I ! TM ein differenzierbares Vektorfeld längs ; t0 2 I und vQ ein auf einer offenen Umgebung von .t0 / definiertes Vektorfeld, so dass es ein " > 0 gibt mit v.t/ D v..t// Q
für alle t 2t0 "; t0 C "Œ ;
dann ist die kovariante Ableitung von v längs bei t0 durch r ˇˇ D rP .t0 / vQ ˇ dt t Dt0 wohldefiniert. Die Wohldefiniertheit, d. h. die Unabhängigkeit von der Wahl von vQ folgt sofort aus (5.10). Die Anwendung der kovarianten Ableitung auf Vektorfelder längs Kurven ist ganz analog zu der auf gewöhnlichen Vektorfeldern, wie der folgende Satz zeigt. Satz 5.26. Sei W I ! M eine regulär parametrisierte Kurve. Dann gilt: a. Sind v und w Vektorfelder längs ; so ist r r r .v C w/ D vC w: dt dt dt
138
5 Geodätische und Krümmung
b. Ist v ein Vektorfeld längs und f 2 C 1 .I /; so ist r r .f v/ D f v C fPv : dt dt c. Ist ' W J ! I ein Diffeomorphismus, so ist r ˇˇ r ˇˇ .v ı '/ D ' 0 .s0 / v: ˇ ˇ ds sDs0 dt t D'.s0 / Damit kann nun auch der Begriff der Parallelität eines Vektorfelds leicht von Hyperflächen auf Mannigfaltigkeiten übertragen werden. Definitionen 5.27. Sei M eine Mannigfaltigkeit, r eine allgemeine kovariante Ableitung auf M; W I ! M eine regulär parametrisierte Kurve. a. Dann heißt ein Vektorfeld längs r-parallel (längs ), falls r v D 0 dt gilt. b. Ein Vektorfeld auf M heißt r-parallel längs ; falls injektiv ist und rP .t / v D 0 gilt für alle t 2 I . Ist die kovariante Ableitung r lokal bezüglich Koordinaten durch r@i @j D Pn P i k i v .t/@i ..t// genau dann r-parallel längs kD1 aij @k gegeben, so ist v.t/ D ; wenn gilt (vgl. (5.10)): X k P i .t/v j .t/aij ..t// C vP k .t/ D 0 i;j
für k D 1; : : : ; n. Bei vorgegebener Kurve ist dies ein System linearer Differentialgleichungen 1. Ordnung für v. Damit folgt aus dem Existenz- und Eindeutigkeitssatz für Lösungen gewöhnlicher Differentialgleichungen Satz 5.28. Sei r eine kovariante Ableitung auf einer Mannigfaltigkeit M; W I ! M eine regulär parametrisierte Kurve, t0 2 I; v0 2 T.t0 / M . Dann existiert genau ein r-paralleles Vektorfeld v längs mit v.t0 / D v0 . Definition 5.29. Sei W I ! M eine regulär parametrisierte Kurve, t0 ; t1 2 I . Dann heißt die Abbildung Ptr0 ;t1 W T.t0 / M ! T.t1 / M ; die einem Vektor v0 2 T.t0 / M den Vektor v.t1 / zuordnet, wobei v das r-parallele Vektorfeld mit v.t0 / D v0 ist, die Parallelverschiebung längs .
D Die kovariante Ableitung auf Mannigfaltigkeiten
139
Dies ermöglicht bei vorgegebener kovarianter Ableitung, Vektoren an verschiedenen Stellen von M miteinander zu vergleichen. Darauf wird im nächsten Abschnitt noch einmal eingegangen. Schon im Abschn. 3D wurde mit der L IE-Ableitung eine Möglichkeit vorgestellt, ein Vektorfeld längs eines anderen abzuleiten. Zwischen kovarianter und L IE-Ableitung gibt es allerdings einen fundamentalen Unterschied. Denn ist f 2 C 1 .M /; so gilt (5.11) Lf v .w/ D f Lv .w/ w.f / v ; aber rf v .w/ D f rv w :
(5.12)
Gleichung (5.11) zeigt, dass bei gegebenem Vektorfeld w der Vektor .Lv w/.x/ nicht nur von v.x/; sondern auch von der „Änderung“ von v in x abhängt, d. h. für gegebenes Vektorfeld w ist die Abbildung TM ! TM; v 7! Lv w ein Differentialoperator erster Ordnung. Im Gegensatz dazu ist rw ein einfach ko- und einfach kontravariantes Tensorfeld, denn .rv w/x hängt (nach Definition) nur vom Wert v.x/ ab. Insbesondere ist rv.x/ w eine sinnvolle Schreibweise, Lv.x/ w hingegen nicht. In Abschn. C haben wir gesehen, dass für die kovariante Ableitung auf Hyperflächen gilt: rv w rw v D Œv; w : Für allgemeine kovariante Ableitungen gilt dies nicht immer, doch kann die Abweichung durch ein Tensorfeld gemessen werden: Definitionen 5.30. Ist r eine kovariante Ableitung auf TM; so heißt Txr 2 Alt2 .Tx M; Tx M / für x 2 M Txr .v; w/ WD rv w rw v Œv; w die Torsion von r. Eine kovariante Ableitung heißt torsionsfrei, falls T r D 0 gilt. Dass durch die Torsion ein Tensorfeld gegeben ist, kann gezeigt werden, indem man Tx .f v; w/ D f .x/Tx .v; w/ für f 2 C 1 .U / nachprüft (U offene Umgebung von x 2 M ). Sind nämlich v; vQ zwei Vektorfelder mit v.x/ D v.x/; Q so haben wir bezüglich einer lokalen Koordinatenbasis .@1 ; : : : ; @n / v vQ D f1 @1 C C fn @n mit f1 .x/ D D fn .x/ D 0; also folgt Tx .v v; Q w/ D 0 und somit Tx .v; w/ D Tx .v; Q w/; d. h. der Wert von Tx .v; w/ hängt nur von v.x/ ab, nicht vom gesamten Vektorfeld v. Wegen T .v; w/ D T .w; v/ trifft dasselbe auf w zu, also ist tatsächlich Tx 2 Mult2 .Tx M I Tx M /.
140
5 Geodätische und Krümmung
E Die kovariante Ableitung auf pseudo-R IEMANNschen Mannigfaltigkeiten Auf Mannigfaltigkeiten gibt es, wie im letzten Abschnitt beschrieben, viele Möglichkeiten, kovariante Ableitungen zu definieren. Für Untermannigfaltigkeiten des Rn ist eine Möglichkeit besonders naheliegend, wie wir in Abschn. C gesehen haben. In diesem Abschnitt wird gezeigt, dass auch auf pseudo-R IEMANNschen Mannigfaltigkeiten eine kovariante Ableitung besonders ausgezeichnet ist. Dazu werden die wichtigsten Eigenschaften, die die kovariante Ableitung auf Untermannigfaltigkeiten des Rn besitzt, für die kovariante Ableitung auf einer pseudo-R IEMANNschen Mannigfaltigkeit gefordert, nämlich ihre Verträglichkeit mit dem Skalarprodukt und ihre Torsionsfreiheit. Zunächst präzisieren wir die „Verträglichkeit mit dem Skalarprodukt“: Definition 5.31. Eine allgemeine kovariante Ableitung auf einer pseudo-R IEMANNschen Mannigfaltigkeit .M; g/ heißt isometrisch, falls für alle Vektorfelder v1 und v2 auf M und jeden Tangentialvektor wx 2 Tx M gilt d.g.v1 ; v2 //x .wx / D g .rwx v1 ; v2 / C g.v1 ; rwx v2 / : Eine allgemeine kovariante Ableitung auf einer Mannigfaltigkeit legt, wie im letzten Abschnitt gezeigt, einen Begriff von Parallelverschiebung fest. Die isometrischen kovarianten Ableitungen verdienen ihren Namen, weil die entsprechenden Parallelverschiebungen tatsächlich Längen und Winkel der verschobenen Vektoren erhalten: Lemma 5.32. Die Parallelverschiebung einer isometrischen kovarianten Ableitung ist eine Isometrie. Beweis. Ist W I ! M eine regulär parametrisierte Kurve und sind v und w Vektorfelder längs ; so ist für t0 2 I d ˇˇ g.v; w/ D dg.v; Q w/ Q .t0 / .P .t0 // ˇ dt t Dt0 D g.rP .t0 / v; Q w/ Q C g.v; Q rP .t0 / w/ Q ˇ r ˇˇ rˇ v; w C g v; ˇ w ; Dg ˇ dt t Dt0 dt t Dt0 wobei vQ und wQ lokal um .t0 / definierte Vektorfelder mit v..t// Q D v.t/ ; w..t// Q D w.t/ sind. Sind also v und w parallele Vektorfelder, so ist g.v.t/; w.t// D konst.
t u
Der eigentliche Ausgangspunkt der R IEMANNschen Geometrie ist nun der folgende fundamentale Satz:
E Die kovariante Ableitung auf pseudo-R IEMANN schen Mannigfaltigkeiten
141
Theorem 5.33. Sei .M; g/ eine pseudo-R IEMANNsche Mannigfaltigkeit. Dann gibt es auf M genau eine allgemeine kovariante Ableitung, die isometrisch und torsionsfrei ist. Diese ist durch die KOSZUL-Formel g.rv w; u/ D
1 vg.w; u/ C wg.u; v/ 2 ug.v; w/ C g.u; Œv; w/ C g.w; Œu; v/ g.v; Œw; u/
(5.13)
eindeutig gegeben. Beweis. Wir zeigen zuerst, dass jede isometrische torsionsfreie kovariante Ableitung (5.13) erfüllt. Damit ist die Eindeutigkeit gezeigt. Ist r isometrisch, so gilt ug.v; w/ D g.ru v; w/ C g.v; ru w/ : Also ist für jede isometrische kovariante Ableitung vg.w; u/ C wg.u; v/ ug.v; w/ D g.rv w; u/ C g.rv u; w/ C g.rw u; v/ C g.rw v; u/ g.ru v; w/ g.ru w; v/ : Ist r zusätzlich torsionsfrei, so ist dies gleich g.rv w; u/ C g.rw v; u/ g.Œu; w; v/ C g.Œv; u; w/ D 2g.rv w; u/ C g.Œw; v; u/ g.Œu; w; v/ C g.Œv; u; w/ und damit folgt sofort (5.13) für jede isometrische torsionsfreie kovariante Ableitung. Um die Existenz einer isometrischen torsionsfreien kovarianten Ableitung nachzuweisen, muss nun nachgeprüft werden, dass durch (5.13) tatsächlich eine solche definiert werden kann. Als erstes zeigen wir: Ist v0 2 Tx M; u0 2 Tx M und sind v und u Vektorfelder auf M mit v.x/ D v0 und u.x/ D u0 ; so ist hrv0 wju0 i WD
1 .vg.w; u/ C wg.u; v/ ug.v; w/ 2 C g.u; Œv; w/ C g.w; Œu; v/ g.v; Œw; u//.x/ DW .kŒu; v; w/.x/
wohldefiniert, also unabhängig von der Fortsetzung der Vektoren u0 und v0 zu Vektorfeldern u und v.
142
5 Geodätische und Krümmung
Offenbar ist die rechte Seite linear in u; v und w. Es genügt daher zu zeigen, dass kŒu; v; w.x/ verschwindet, falls v.x/ D 0 oder u.x/ D 0 ist. Dazu genügt es nachzuweisen, dass kŒf u; v; w D f kŒu; v; w D kŒu; f v; w für jedes f 2 C 1 .M / gilt. Wir zeigen hier nur die erste Gleichung. 2kŒf u; v; w D vg.w; f u/ C wg.f u; v/ .f u/g.v; w/ C g.f u; Œv; w/ C g.w; Œf u; v/ g.v; Œw; f u/ D .vf / g.w; u/ C f .vg.w; u// C .wf /g.u; v/ C f .wg.u; v// f .ug.v; w// C fg.u; Œv; w/ C fg.w; Œu; v/ .vf /g.w; u/ .wf /g.v; u/ fg.v; Œw; u/ D f 2kŒu; v; w : Ebenso folgt die zweite Gleichung. Damit ist durch (5.13) eine lineare Abbildung TM ! Hom .TM; TM / wohldefiniert. Die Produktregel g.rv f w; u/ D fg.rv w; u/ C df .v/g.w; u/ folgt durch eine ähnliche Rechnung wie die Wohldefiniertheit. Isometrie und Torsionsfreiheit sind eine einfache Übungsaufgabe, wenn man die Symmetrie bzw. Antisymmetrie der einzelnen Terme sorgfältig berücksichtigt. t u Definitionen 5.34. a. Die eindeutig definierte torsionsfreie isometrische allgemeine kovariante Ableitung auf einer pseudo-R IEMANNschen Mannigfaltigkeit heißt die L EVI-C IVITAAbleitung. Koordinatenbasis zur Karte .U; h/; so heißen die b. Ist .@1 ; : : : ; @n / eine P lokale durch r@i @j D ijk @k gegebenen Funktionen ijk 2 C 1 .U /; i; j; k D k
1; : : : ; n die C HRISTOFFEL-Symbole (bezüglich der Karte .U; h/). Aus Satz 5.17 in Abschn. C folgt sofort, dass die kovariante Ableitung, die für Untermannigfaltigkeiten des Rn definiert ist, die L EVI-C IVITA-Ableitung ist. Die in (5.4) angegebene lokale Formel für die kovariante Ableitung überträgt sich sofort auf die L EVI-C IVITA-Ableitung, und auch die Formel (5.5) für die Berechnung der C HRISTOFFEL-Symbole aus der Metrik bleibt im allgemeineren Fall der L EVIC IVITA-Ableitung richtig. Sprechen wir in Zukunft von einer kovarianten Ableitung r auf einer pseudoR IEMANNschen Mannigfaltigkeit, so ist immer die L EVI-C IVITA-Ableitung gemeint.
E Die kovariante Ableitung auf pseudo-R IEMANN schen Mannigfaltigkeiten
143
Beispiele: a. Wir berechnen die C HRISTOFFEL-Symbole der kovarianten Ableitung auf dem R3 in Zylinderkoordinaten, d. h. bezüglich der Koordinatenbasis 1 @1 D @r D p .x@x C y@y / x2 C y 2 @2 D @' D .y@x C x@y / @3 D @z :
0
1 1 0 0 Die Metrik ist bezüglich dieser Basis durch @0 r 2 0A gegeben, also 0 0 1 8 r i D j D 2; k D 1 ˆ ˆ ˆ 0. Als differenzierbare Mannigfaltigkeit ist M D R .RC n f2mg/ S2 : Die Koordinate auf R bezeichnen wir mit t und die auf RC n f2mg mit r. Ferner ; also sei h.r/ WD 1 2m r h.r/ > 0 ” r > 2m : Statt dt ˝ dt schreibt man dt 2 ; ebenso dr ˝ dr D dr 2 . Die Metrik auf S2 wird mit gS2 bezeichnet. Dann ist die S CHWARZSCHILDmetrik auf M durch g D h dt 2 C gegeben.
1 2 dr C r 2 gS2 h
144
5 Geodätische und Krümmung
Diese Mannigfaltigkeit kann über die Singularität bei r D 2m isometrisch fortgesetzt werden, vgl. z. B. [80], S. 239. Die physikalische Interpretation, grob gesagt als Raumzeit, die nur einen einzigen kugelsymmetrischen Himmelskörper mit sehr kleiner Ausdehnung enthält, ist ausführlich in der physikalischen Literatur behandelt. Für die der S CHWARZSCHILDmetrik entsprechende L EVI -C IVITA-Ableitung ergibt sich: mh @r ; r2 m r@r @r D 2 @r ; r h r@t @t D
m @t ; r 2h r@t v D rv @t D 0 für v 2 T S2 ; 1 r@r v D rv @r D v : r
r@t @r D r@r @t D
(5.14)
Wir führen hier nur eine Rechnung exemplarisch aus: Da Œ@t ; @r D Œ@t ; @t D g.@r ; @t / D 0 ist, folgt aus der KOSZULformel 1 g.r@t @t ; @r / D @r g.@t ; @t / 2 m 1 D C @r h.r/ D 2 : 2 r Auch für jedes v 2 T S2 ist Œ@t ; v D g.@t ; v/ D 0 und auch vg.@t ; @t / D 0; also g.r@t @t ; v/ D 0 : Außerdem ist 0 D @t g.@t ; @t / D 2g.r@t @t ; @t /; also r@t @t D Die anderen Gleichungen sind eine leichte Übungsaufgabe.
mh r2
@r .
F Geodätische auf pseudo-R IEMANNschen Mannigfaltigkeiten Schon im Abschn. A wurde erläutert, dass Geodätische eine wichtige Rolle in der Physik spielen. Dies bleibt nicht auf den Fall von Untermannigfaltigkeiten des Rn beschränkt. Auch in der allgemeinen Relativitätstheorie werden Weltlinien von Teilchen, auf die keine Kräfte außer der Schwerkraft einwirken, durch Geodätische beschrieben.
F Geodätische auf pseudo-R IEMANN schen Mannigfaltigkeiten
145
In Abschn. A haben wir regulär parametrisierte Kurven auf Bogenlänge umparametrisiert. Dabei bedeutet „regulär parametrisierte Kurve“, dass g.P ; P / 6D 0 ist. Ist .M; g/ nicht R IEMANNSCH, so ist jedoch g.P ; P / < 0 möglich. Wir nennen solche Kurven zeitartig. Ist z. B. M die S CHWARZSCHILD-Mannigfaltigkeit, r > 2m und x 2 S2 ; so ist durch W R ! M; t 7! .t; r; x/ eine zeitartige Kurve definiert. Definitionen 5.35. Ist M eine L ORENTZmannigfaltigkeit, so heißt eine Kurve mit g.P ; P / D 1 auf Eigenzeit parametrisiert; g.P ; P / D 0 eine lichtartige Kurve; g.P ; P / D 1 auf Bogenlänge parametrisiert. Weltlinien von Teilchen werden in der allgemeinen Relativitätstheorie durch zeitartige Kurven beschrieben. Da wir also nicht mehr alle regulären Kurven auf Bogenlänge parametrisieren können, nutzen wir die vor Definition 5.16 gegebene Charakterisierung der Geodätischen, um den Begriff auch für L ORENTZ-Mannigfaltigkeiten zu definieren: Definition 5.36. Unter einer Geodätischen auf einer pseudo-R IEMANNschen Mannigfaltigkeit verstehen wir eine regulär parametrisierte Kurve mit r P D 0 : dt Geodätische Kurven sind immer proportional zur Bogenlänge parametrisiert, denn d r .jP .t/j2 / D 2 P ; P D 0 : dt dt Wir wollen in diesem Abschnitt auf ihre Rolle als Kurven „kleinster Länge“ und „kleinster Energie“ eingehen. Auf zusammenhängenden R IEMANNschen Mannigfaltigkeiten ist eine Metrik – also ein Abstandsbegriff im Sinne der metrischen Räume – durch .p; q/ WD inffLŒ j W Œ0; 1 ! M stückweise C 1 mit .0/ D p und .1/ D qg definiert. (Nachzuprüfen, dass dadurch wirklich eine Metrik gegeben ist, ist eine leichte Übungsaufgabe.) In Rn ist dies die euklidische Metrik. Das Infimum in der Definition ist in diesem Fall ein Minimum und es gilt .p; q/ D LŒp;q
mit p;q .t/ D tq C .1 t/p :
146
5 Geodätische und Krümmung
Im Allgemeinen ist nicht klar, dass eine Kurve minimaler Länge existiert. Existiert sie aber, so ist ihre Umparametrisierung auf Bogenlänge eine Geodätische. Auf pseudo-R IEMANNschen Mannigfaltigkeitenpist die Länge einer Kurve nicht notwendig definiert, da möglicherweise jP .t/j D g.P .t/; P .t// nicht mehr reell ist. Die Energie kann jedoch auch auf pseudo-R IEMANNschen Mannigfaltigkeiten definiert werden, und sie spielt in der allgemeinen Relativitätstheorie eine wichtige Rolle. Definition 5.37. Ist W Œa; b ! M eine differenzierbare Kurve, so heißt 1 EŒ WD 2
Zb jP .t/j2 dt a
die Energie der Kurve. Dabei steht jP .t/j2 für g.P .t/; P .t//. Aus der S CHWARZschen Ungleichung, angewandt auf die Funktion jP .t/j WD g.P .t/; P .t//1=2 ; erhält man im R IEMANNschen Fall sofort eine Abschätzung der Länge durch die Energie: Lemma 5.38. Für eine regulär parametrisierte Kurve W Œa; b ! M in einer R IEMANNschen Mannigfaltigkeit gilt stets LŒ 2 2.b a/EŒ ;
(5.15)
und Gleichheit gilt genau dann, falls jP .t/j D konst: ist. Im Gegensatz zur Länge ändert sich die Energie bei Umparametrisierung. Nimmt für p; q 2 M das Energiefunktional auf der Menge aller Verbindungskurven von p und q; also auf Cp;q .Œa; b/ WD f W Œa; b ! M j .a/ D p; .b/ D q ; regulär parametrisierte Kurveg ein Minimum an, so wird es von einer proportional zur Bogenlänge parametrisierten Kurve minimaler Länge angenommen, und es gilt EŒmin D
1 .LŒmin /2 : 2.b a/
Das lässt sich mit elementaren Mitteln beweisen, und es ist z. B. in [36] (erste Ergänzung zu Kap. 23) erläutert. Um nun ein lokales Extremum des Energie- oder Längenfunktionals zu bestimmen, muss zunächst definiert werden, was man unter einer Variation einer gegebenen Kurve versteht. Dazu führen wir zunächst für zwei Intervalle I; J R eine Notation für die partiellen Ableitungen einer differenzierbaren Abbildung f W I J ! M; .s; t/ ! f .s; t/ ein. Man bezeichnet mit @ f .s0 ; t0 / WD df.s0 ;t0 / .e 1 / 2 Tf .s0 ;t0 / M @s
F Geodätische auf pseudo-R IEMANN schen Mannigfaltigkeiten
147
den durch "; "Œ! M; s 7! f .s C s0 ; t0 / repräsentierten Vektor. Analog ist auch @t@ f .s0 ; t0 / 2 Tf .s0 ;t0 / M definiert. Man schreibt auch @ f .s; t/ D f 0 .s; t/ ; @s @ f .s; t/ D fP.s; t/ ; @t und beide Abbildungen sind offenbar Vektorfelder längs f . Definitionen 5.39. Sei M eine R IEMANNsche Mannigfaltigkeit, W Œa; b ! M eine regulär parametrisierte Kurve und X ein Vektorfeld längs . a. Unter einer Variation von in Richtung X versteht man eine differenzierbare Abbildung f W "; "ŒŒa; b ! M ; .s; t/ 7! f .s; t/ mit (i) (ii)
f .0; t/ D .t/ @ f .0; t/ D X.t/. @s
b. Eine Variation heißt endpunktfest, falls f .s; a/ D .a/ und f .s; b/ D .b/ für alle s 2 "; "Œ gilt. Jetzt soll untersucht werden, wie sich die Energie bei Variation der Kurve ändert. Satz 5.40. Sei f eine endpunktfeste Variation von in Richtung X . Dann gilt d ˇˇ ˇ EŒfs D ds sD0
Zb a
r P .t/ dt g X.t/; dt
(5.16)
mit fs W Œa; b ! M; fs .t/ WD f .s; t/ für s 2 "; "Œ. Beweis. Aufgrund der Torsionsfreiheit der L EVI-C IVITA-Ableitung ist r P r 0 f f D rf 0 fP rfP f 0 D Œf 0 ; fP : ds dt Die L IEklammer ist hier für die Vektorfelder längs f wie für Vektorfelder definiert. Die Details sind z. B. in [91] ausgeführt. Weiter gilt (auch wenn f kein Diffeomorphismus ist), wie man leicht nachrechnet, analog zu Œ@i ; @j D 0 auch Œf 0 ; fP D df Œe 1 ; e 2 D 0 ; also
r ds
fP D
r dt
f 0 . Damit folgt für die Ableitung des Energiefunktionals 1 d ˇˇ ˇ EŒfs D ds sD0 2
Zb a
d ˇˇ ˇ g fPs ; fPs dt ds sD0
148
5 Geodätische und Krümmung
Zb D
r ˇˇ ˇ fPs ; fP0 dt ds sD0
r 0 f .0; t/; P .t/ dt dt
r X.t/; P .t/ dt dt
g a
Zb D
g a
Zb D
g a
ˇt Db D g.X.t/; P .t//ˇt Da
Zb a
r P .t/ dt : g X.t/; dt
Dabei gilt das dritte Gleichheitszeichen aufgrund der Torsionsfreiheit, und das fünfte Gleichheitszeichen folgt durch partielle Integration. t u Aus (5.16) folgt sofort, dass für jede endpunktfeste Variation einer Geodätischen gilt: d ˇˇ ˇ EŒfs D 0 : ds sD0 Die Umkehrung ist genauso richtig. Um dies zu zeigen, muss man nachweisen, dass es zu vorgegebenem und vorgegebenem Vektorfeld X längs stets eine Variation in Richtung X gibt. Dies ist etwa in [10] ausgeführt. Dort findet sich auch der Beweis des folgenden Satzes: Theorem 5.41. Eine Kurve W Œa; b ! M in einer pseudo-R IEMANNschen Mannigfaltigkeit ist genau dann geodätisch, wenn für jede endpunktfeste Variation f von gilt d ˇˇ ˇ EŒfs D 0 : ds sD0 Insbesondere sind Kurven minimaler Energie stets Geodätische. Für R IEMANNsche Mannigfaltigkeiten folgt nun sofort, dass die kürzeste Verbindung zwischen zwei Punkten, falls sie existiert, eine Geodätische ist. Allerdings ist nicht jede geodätische Kurve die kürzeste Verbindung zwischen zwei Punkten. Man stelle sich nur vor, man wandert auf dem Äquator (also einer geodätischen Kurve) von einem Punkt p fast um die ganze Erde und stoppt kurz vor dem Punkt p am Punkt q. Dann hat man sicher nicht den kürzesten Weg von p nach q gewählt. Es existiert auch nicht immer eine Geodätische Kurve, die zwei Punkte p und q 2 einer Mannigfaltigkeit verbindet. Ein einfaches ist M D R n f0g; denn Beispiel nicht durch eine Gerade in dieser Mannigfaltigkeit können die Punkte 10 und 1 0 verbunden werden. Die „lokale“ Existenz von Geodätischen folgt aber sofort aus der Theorie der Differentialgleichungen. Die Gleichung für eine Geodätische ist ja eine (vektorielle) lineare Differentialgleichung zweiter Ordnung, nämlich nach (5.10)
F Geodätische auf pseudo-R IEMANN schen Mannigfaltigkeiten
X
149
ijk ..t//P j .t/P i .t/ C R k .t/ D 0
i;j
für k D 1; : : : ; n. Diese haben bekanntlich zu gegebenem Anfangspunkt und gegebener Anfangsgeschwindigkeit stets eine eindeutige maximale Lösung. Daher ist der folgende Satz nicht überraschend. Die Details sind z. B. in [10] ausgeführt. Theorem 5.42. Auf einer pseudo-R IEMANNschen Mannigfaltigkeit M gibt es zu jedem p 2 M und v 2 Tp M genau eine maximale Geodätische mit .0/ D p und P .0/ D v. Isometrien führen geodätische Kurven offenbar in geodätische Kurven über. Infinitesimal werden Isometrien durch K ILLING Vektorfelder beschrieben – genauer kann ein K ILLINGvektorfeld definiert werden als ein Vektorfeld dessen Fluss aus Isometrien besteht. Wir wählen hier eine äquivalente Definition, mit der sich besser rechnen lässt (vgl. z. B. [69]). Definition 5.43. Ein Vektorfeld v auf einer pseudo-R IEMANNschen Mannigfaltigkeit heißt K ILLING-Vektorfeld, falls für alle Paare .u; w/ von Vektorfeldern gilt: g.ru v; w/ C g.rw v; u/ D 0 : K ILLINGvektorfelder können oft hilfreich sein, um Geodätische zu bestimmen: Theorem 5.44. Ist v ein K ILLINGvektorfeld und eine Geodätische, so ist g.P ; v ı / D konst: Beweis.
d g.P ; v ı / D g.rP P ; v/ C g.P ; rP v/ D 0 : dt Der erste Term verschwindet da Geodätische, und der zweite, da v ein K IL LING vektorfeld ist. u t
Beispiel: Auf der S CHWARZSCHILDmannigfaltigkeit M sind offenbar @t und @' K ILLINGvektorfelder. Dabei haben wir die Sphäre wie in Aufgabe 1.3c. durch Kugelkoordinaten .'; #/ beschrieben. Ist .s/ D .t.s/; r.s/; '.s/; #.s// eine Geodätische auf M; so ist also g. 0 .s/; @t ..s/// D t 0 .s/ h..s// DW E..s// und g. 0 .s/; @' ..s/// D ' 0 .s/ r 2 DW L..s// konstant. E heißt die Energie und L der Drehimpuls von . Ist lichtartige Geodätische und #.s/ 2 ; so gilt r 02 C r 2 ' 02 h r 02 L2 E2 C C 2 : D h h r
0 D g. 0 .s/; 0 .s// D t 02 h C
150
5 Geodätische und Krümmung
Also ist E 2 D r 02 C
L2 h r2
(Energiegleichung für Lichtteilchen). Ist auf Eigenzeit parametrisierte Geodätische und wieder #.s/ ebenso 2 L 2 02 C1 h E Dr C r2
2;
so folgt
(Energiegleichung für Masseteilchen).
G Krümmung von pseudo-R IEMANNschen Mannigfaltigkeiten In Abschn. C, Gl. (5.8), haben wir gesehen, dass die G AUSSsche Krümmung einer Fläche, die eine Invariante unter Isometrien ist, durch zweimaliges Anwenden der kovarianten Ableitung berechnet werden kann. Dieser Ansatz lässt sich auf höhere Dimensionen verallgemeinern. Die so definierte Krümmung einer pseudoR IEMANNschen Mannigfaltigkeit ist, grob gesagt, ein Maß dafür, inwieweit Paralleltransport in verschiedenen Richtungen kommutiert oder inwieweit die entsprechenden kovarianten Ableitungen vertauschbar sind. Zunächst wollen wir definieren, was die zweite kovariante Ableitung ist, denn für vp 2 Tp M; wp 2 Tp M ist rvp rwp keine wohldefinierte Abbildung. Satz und Definition 5.45. Die zweite kovariante Ableitung an der Stelle p ist durch rv2p wp u WD rvp rw u rrvp w u wohldefiniert, wobei w 2 TM ein beliebiges Vektorfeld mit w.p/ D wp ist. Beweis. Die Wohldefiniertheit folgt mit der Methode, die am Schluss von Abschn. D für den Torsionstensor vorgeführt wurde, aus der Linearität in w und aus rvp rf w u rrvp f w u D rvp .f rw u/ rf rvp w u rvp .f /w u D f .rvp rw u/ C vp .f / rw u f rrvp w u vp .f /rw u D f .rvp rw u rrvp w u/ : t u Für jede torsionsfreie, insbesondere die L EVI-C IVITA-Ableitung gilt also 2 2 u rw;v u D rv rw u rw rv u rŒv;w u : rv;w
Satz und Definition 5.46. a. Sei M eine Mannigfaltigkeit mit kovarianter Ableitung r. Dann ist die Krümmung von r an der Stelle p durch
G Krümmung von pseudo-R IEMANN schen Mannigfaltigkeiten
151
2 F r .vp ; wp /up WD rv2p ;wp u rw u C r u T r .vp ;wp / p ;vp D rvp rw u rwp rv u rŒv;w u
p
p
für vp ; wp ; up 2 Tp M und v; w; u Vektorfelder mit v.p/ D vp ; u.p/ D up ; w.p/ D wp wohldefiniert. b. Ist M eine pseudo-R IEMANNsche Mannigfaltigkeit und r die L EVI-C IVITAAbleitung, so heißt F r der R IEMANNsche Krümmungstensor. Dieser wird mit R WD F r bezeichnet. Zum Beweis, dass es sich wirklich um ein Tensorfeld handelt, rechnet man die Beziehung .F r .v; w/.f u//p D f .p/.F r .v; w/u/p für Vektorfelder u; v; w und skalare Funktionen f nach und verwendet dann wieder die schon für den Torsionstensor demonstrierte Schlussweise. Der R IEMANNsche Krümmungstensor ist also ein Schnitt in Alt2 .T M / ˝ End .TM / T M ˝ T M ˝ T M ˝ TM : Wie üblich werden bezüglich einer Koordinatenbasis .@1 ; : : : ; @n / von TM die Komponenten von R geschrieben als R.@i ; @j /@k D
n X
l Rijk @l ;
lD1
und aus der Antisymmetrie in den ersten beiden Variablen folgt sofort l Rijk D Rjl i k :
Diese Komponenten können aus den C HRISTOFFEL-Symbolen berechnet werden. Einsetzen in die Definitionen ergibt nämlich: Lemma 5.47. l l Rijk D @i kj @j kil C
X
l m l mi kj mj kim :
m
Die Differenzierbarkeit der Komponentenfunktionen folgt damit sofort aus der Differenzierbarkeit der C HRISTOFFEL-Symbole. Den Raum der im üblichen Sinn differenzierbaren Schnitte in Altr .TM / ˝ End .TM / bezeichnet man mit ˝ r .M; End .TM //; also gilt insbesondere R 2 ˝ 2 .M; End .TM //. Um den R IE MANN schen Krümmungstensor einer 4-dimensionalen pseudo-R IEMANN schen Mannigfaltigkeit zu berechnen, müsste man 256 Komponenten berechnen. Zum Glück besitzt er einige Symmetrieeigenschaften:
152
5 Geodätische und Krümmung
Satz 5.48. Für den R IEMANNschen Krümmungstensor gilt: a. b. c. d.
g.R.u; v/w; z/ D g.R.v; u/w; z/; g.R.u; v/w; z/ D g.R.u; v/z; w/; R.u; v/w C R.v; w/u C R.w; u/v D 0 (erste B IANCHI-Identität), g.R.u; v/w; z/ D g.R.w; z/u; v/ (Blocksymmetrie).
Beweis. a. folgt aus der Definition. b.–d. seien dem Leser als Übungsaufgabe überlassen. Es folgt b. aus der Isometrie, c. aus der Torsionsfreiheit von r; und d. durch geschickte Kombination von a.–c. t u Beispiel: Wir berechnen als Beispiel den R IEMANNschen Krümmungstensor der S CHWARZSCHILD-Mannigfaltigkeit Es ist mit (5.14) R.@t ; @r /@t D R.@r ; @t /@t
m mh.r/ @ r D r@t r@r @t r@r r@t @t D r@t @ t r @r r 2 h.r/ r2 m mh.r/ mh.r/ m mh.r/ @r D 2 @r @r @r r h.r/ r 2 r2 r2 r 2 h.r/ 2m2 2m 6m2 D 4 @r C 3 @r 4 @r r r r 2m D 3 h.r/@r : r
Für v 2 T S2 ist
R.@t ; @r /v D r@t r@r v D r@t
1 v D0: r
(5.17)
Also ist g.R.@t ; @r /@r ; @t / D g.R.@t ; @r /@t ; @r / D g.R.@t ; @r /@r ; v/ D g.R.@t ; @r /v; @r / D 0 für v 2 T S2 und damit R.@t ; @r /@r D
2m @t : hr 3
Also haben wir insgesamt: 0
0
B 2mh j r3 R01i DB @ 0 0
2m hr 3
0 0 0 0 0 0 0
1 0 0C C : 0A 0
2m r3
G Krümmung von pseudo-R IEMANN schen Mannigfaltigkeiten
153
Dabei sind die Komponenten bezüglich der Koordinatenbasis @0 D @t ; @1 D @r , @2 D @' ; @3 D @# gegeben. Die übrigen Rechnungen sind dem Leser als Übungsaufgabe überlassen. Es ergibt sich 1 0 0 0 m r 0 B 0 0 0 0C j C ; R02i D B @ mh 0 0 0A r3 0 0 0 0 0 2 1 0 0 0 m sinr # B 0 00 0 C j C ; R03i D B @ 0 00 0 A
j
R12i
j R13i
j R13i
00 mh r3
0 1 0 0 0 0 B0 0 m 0C r C ; DB @0 m 0 0A r3h 0 0 0 0 0 1 0 0 0 0 B0 0 0 m sin2 # C C ; r DB @0 0 0 0 A 0 rm 0 3h 0 1 0 00 0 0 B0 0 0 0 C C DB @0 0 0 2m sin2 # A : 0
0 0 2m r
r
0
Mit Hilfe des R IEMANNschen Krümmungstensors werden nun weitere Krümmungsbegriffe definiert. Als Erstes führen wir die R IEMANNsche Schnittkrümmung ein, um eine Verbindung zur G AUSSschen Krümmung herzustellen. Die R IEMANNsche Schnittkrümmung an der Stelle p ist auf Ebenen (d. h. zweidimensionalen Teilvektorräumen) in Tp M definiert. Dazu nutzt man folgende Beobachtung aus: Sind E1 ; E2 orthonormale Vektoren und v D a1 E1 C b1 E2 ; w D a2 E1 C b2 E2 ; so ist g.R.v; w/v; w/ D .a1 b2 a2 b1 /2 g.R.E1 ; E2 /E1 ; E2 / D .g.v; v/g.w; w/ g.v; w/2 /g.R.E1 ; E2 /E1 ; E2 / ; also ist
g.R.v; w/v; w/ g.v; v/g.w; w/ .g.v; w//2
unabhängig von der Wahl der Basis .v; w/ in LH fE1 ; E2 g. Daher kann man definieren:
154
5 Geodätische und Krümmung
Definition 5.49. Ist M eine R IEMANNsche Mannigfaltigkeit und V Tp M ein 2-dimensionaler Untervektorraum mit Basis .v; w/; so ist die Schnittkrümmung, angewandt auf V durch K.V / WD
g.R.v; w/w; v/ g.v; v/g.w; w/ .g.v; w//2
wohldefiniert. Ist dim M D 2; also V D Tp M; so ist nach (5.8) K.Tp M / D K.p/ die G AUSSsche Krümmung. Der komplette R IEMANNsche Krümmungstensor kann aus der Schnittkrümmung wiedergewonnen werden, ähnlich wie eine bilineare Abbildung aus der zugehörigen quadratischen Form über die Polarisationsformel wieder gewonnen werden kann. Wir gehen darauf hier nicht näher ein, sondern führen noch zwei weitere Krümmungsbegriffe ein, die in der allgemeinen Relativitätstheorie eine wichtige Rolle spielen. Dazu müssen wir zuerst auf den Begriff der Spur eingehen: Die Spur einer Matrix ist als Summe der Diagonaleinträge definiert. Man zeigt leicht, dass sie ein Koeffizient des charakteristischen Polynoms, also für A 2 End .V / unabhängig von der Basis definiert ist, bezüglich der die Matrix zu A gebildet wird. Ist V ein Vektorraum mit (möglicherweise indefinitem) Skalarprodukt h j i und E1 ; : : : ; En eine Orthonormalbasis, also hEi j Ej i D "i ıij so ist Spur A D
X
mit "i D ˙1;
"i hAEi j Ei i :
N N Ist nun A 2 r V ˝ V; so ist für k r die k-te Spur Spurk A 2 r1 V als Spurbildung bezüglich des k-ten Faktors definiert, also X "i hA.: : : ; Ei ; : : :/jEi i ; Spurk A WD i
wobei Ei an der k-ten Stelle eingetragen ist. Wir schreiben Spur A WD Spur1 A : Ist V ein Vektorraum mit nichtentarteter symmetrischer Bilinearform, so ist durch die Zusammensetzung b˝id
Spur
V ˝ V ! V ˝ V D End .V / ! R eine Abbildung definiert, die ebenfalls als Spur bezeichnet wird. (Hier wurde das durch (2.8) definierte Tensorprodukt von linearen Abbildungen benutzt.) Für Tensorfelder ist die Spur punktweise an jeder Stelle p 2 M ebenso definiert.
G Krümmung von pseudo-R IEMANN schen Mannigfaltigkeiten
155
Definitionen 5.50. a. Die Abbildung ricp D Spur Rp W Tp M Tp M ! R ; also ricp .v; w/ D Spur .Rp . ; v/w/ D
X
"i gp .Rp .Ei ; v/w; Ei /
i
heißt R ICCI-Krümmung. Dabei ist E1 ; : : : ; En eine Orthonormalbasis von Tp M . b. Die R ICCI-Abbildung Ric 2 End.TM / ist durch gp .Ricp .v/; w/ D ricp .v; w/ gegeben. c. Die Skalarkrümmung ist die Spur der R ICCI-Abbildung, also s WD Spur Ric D Spur ric : Beispiel: Für die S CHWARZSCHILDmannigfaltigkeit ist ric D 0 und s D 0. Die Symmetrieeigenschaften des R IEMANNschen Krümmungstensors führen dazu, dass auch die R ICCI-Krümmung symmetrisch ist. Wir beweisen: Satz 5.51. Die R ICCI-Krümmung ist symmetrisch. Beweis. Wir wählen eine Orthonormalbasis .E1 ; : : : ; En / von Tp M und rechnen: ric .v; w/ D D D
n X i D1 n X i D1 n X
"i g.R.Ei ; v/w; Ei / "i g.R.w; Ei /Ei ; v/ "i g.R.Ei ; w/v; Ei /
i D1
D ric .w; v/ : t u Das folgende Lemma zeigt den Zusammenhang zwischen Schnittkrümmung und R ICCI-Krümmung auf: Lemma 5.52. Ist M eine R IEMANNsche Mannigfaltigkeit, .E1 ; : : : ; En / eine Orthonormalbasis von Tp M und Vj WD LH fE1 ; Ej g für j 2; so ist ric .E1 ; E1 / D
n X j D2
K.Vj / :
156
5 Geodätische und Krümmung
Insbesondere gilt: Ist die Schnittkrümmung K vom gewählten Unterraum V unabhängig, also als eine Funktion K 2 C 1 .M / aufzufassen, so ist ric D .n 1/K g und s D n .n 1/K. Beweis. ric .E1 ; E1 / D
n X
g.R.Ej ; E1 /E1 ; Ej /
j D1
D
n X
K.Vj /.g.Ej ; Ej /g.E1 ; E1 / g.E1 ; Ej /2 / :
j D2
t u Insbesondere ist damit für 2-dimensionale Flächen stets s D 2K : In Dimension 3 kann obige Überlegung auch umgekehrt werden: Gilt für die R ICCIKrümmung s ric D g ; 3 so folgt aus einer leichten linear-algebraischen Überlegung und obigem Lemma, dass die Schnittkrümmung K nur vom Punkt der Mannigfaltigkeit und nicht vom gewählten 2-dimensionalen Untervektorraum abhängt. Es gilt dann KD
s : 6
Im nächsten Abschnitt werden wir sehen, dass dann sogar s D konst. folgt. Die Komponentenfunktionen von R ICCI-Krümmung und -Abbildung sind wie üblich definiert und werden notiert als ricij WD ric .@i ; @j / ; n X j Ric .@i / DW Rici @j : j D1
Also haben wir: rici k D
X
Ricji gjk ;
j
sD
X
Ricjj
j
D
X j;k
ricjk g jk :
H Die E INSTEIN schen Gleichungen
157
H Die E INSTEINschen Gleichungen Die E INSTEINschen Gleichungen setzen die Materieverteilung in Beziehung zur Krümmung der Raumzeit. Die Materieverteilung wird dabei durch den EnergieImpulstensor T beschrieben. Sowohl Masse als auch Ladungsverteilung tragen zu T bei: Für das elektromagnetische Feld ist T aus dem FARADAYtensor zu berechnen, für ideale Strömungen geht der Strömungsvektor, Druck und Dichte der Strömung ein. In jedem Fall wird T durch eine symmetrische Bilinearform beschrieben und im Vakuum gilt T D 0. Die genauere Form von T in einigen Spezialfällen ist der physikalischen Literatur, z. B. [63] zu entnehmen. Die E INSTEINschen Gleichungen lauten nun ric
1 sg D T 2
(5.18)
Die S CHWARZSCHILDmannigfaltigkeit ist also eine Vakuumlösung, d. h. eine Lösung für T D 0 der E INSTEINschen Gleichungen. Die Gültigkeit von Gleichung (5.18) kann im mathematischen Sinn nicht bewiesen werden, es gibt aber viele Gründe, dass diese Gleichung die Wechselwirkung zwischen Materie und Krümmung der Raumzeit gut beschreibt. Sie kann auch aus einem Variationsprinzip hergeleitet werden, aber darauf kann hier nicht eingegangen werden. Wir werden hier einen anderen Aspekt besprechen, warum die Gleichung (5.18) plausibel ist und nicht etwa durch eine „einfachere“ Gleichung wie ric D T ersetzt werden kann. In Abschn. 4G haben wir gesehen, dass Erhaltungssätze aufgrund des S TOKESschen Satzes eine „infinitesimale“ Form wie z. B. div B D 0 haben. Aus physikalischen Gründen ist es daher sinnvoll anzunehmen, dass die Divergenz des Energieimpulstensors stets verschwindet, denn dies drückt eine Art „lokale Energieerhaltung“ aus. (Wie die Divergenz hier definiert ist, wird in diesem Abschnitt geklärt werden.) Die linke Seite ric 12 sg der E INSTEINschen Gleichung ist nun gerade so gewählt, dass ihre Divergenz ebenfalls verschwindet. Hingegen wird die Divergenz des R ICCItensors i. A. nicht verschwinden. Wir wollen zuerst erklären, was die Divergenz einer Bilinearform auf M bedeutet. Für die Divergenz eines Vektorfelds gilt nach Übungsaufgabe 5.15 X "i g.rEi v; Ei / div .v/ D i
D Spur rv für eine Orthonormalbasis .E1 ; : : : ; En / von Tx M; also g.Ei ; Ej / D "j ıij . Die Spur ist im letzten Abschnitt schon in geeigneter Weise verallgemeinert worden. Nun soll noch der Definitionsbereich der kovarianten Ableitung von Vektorfeldern auf andere Tensorfelder übertragen werden,und zwar so, dass r stets N linear ist und die Produktregel erfüllt. Dies ist ganz allgemein für Schnitte in rs TM möglich, aber wir geben nur die hier interessierenden Spezialfälle an.
158
5 Geodätische und Krümmung
Mit „Schnitten“ meinen wir dabei stets differenzierbare Schnitte, d. h. die Komponentenfunktionen bezüglich einer Koordinatenbasis sind stets als differenzierbar schreiben für den Raum der differenzierbaren Schnitte in Nr vorausgesetzt.NWir r TM dann TM . s s Für 2 End .TM / D .T M ˝ TM / ist durch r r End WD r ı ı r eine Abbildung r End W End .TM / ! Hom .TM; End .TM // definiert, die ebenso wie r linear ist und die Produktregel analog zu (5.9) r.f / D f r C df ˝
für f 2 C 1 .M / erfüllt. Für ˛ 2 .T M ˝ T M / ist durch .rX ˛/.Y; Z/ WD X.˛.Y; Z// ˛.rX Y; Z/ ˛.Y; rX Z/ wieder eine lineare Abbildung rX W .T M ˝ T M / ! .T M ˝ T M / definiert, die die Produktregel rX .f ˛/ D f rX ˛ C df .X / ˛ erfüllt. Offenbar ist r genau dann isometrisch für g; wenn rg D 0 gilt. Damit kann nun die Divergenz von Schnitten in T M ˝T M definiert werden. Definition 5.53. Die Divergenz von ˛ 2 .T M ˝ T M / bezüglich r ist durch divr ˛ D Spur r˛ 2 T M definiert, wobei .r˛/x 2 Tx M ˝ Tx M ˝ Tx M zu lesen ist. Ist r die L EVI-C IVITA-Ableitung, so schreibt man div statt divr . Der EnergieImpuls-Tensor wird stets als divergenzfrei vorausgesetzt. Im Gegensatz zur Divergenz von Vektorfeldern hat die Divergenz von zweifach kovarianten Tensorfeldern keine anschauliche Bedeutung. In der Anfangszeit der allgemeinen Relativitätstheorie war auch die Interpretation der Gleichung div T D 0
H Die E INSTEIN schen Gleichungen
159
damit zunächst nicht klar. Erst durch Einsetzen von K ILLING-Vektorfeldern kann divT D 0 als Erhaltungssatz interpretiert werden (vgl. [80]). Wir wenden uns aber jetzt der „geometrischen“ Seite ric 12 sg der E IN STEIN schen Gleichung zu, die ja nun ebenfalls divergenzfrei sein muss. Ihre Divergenzfreiheit folgt aus einer weiteren Symmetrie des R IEMANNschen Krümmungstensors. Um diese zu formulieren, definieren wir für Endomorphismen-wertige rFormen ˛ 2 ˝ r .M; End .TM // eine Verallgemeinerung der C ARTANschen Ableitung: Definition 5.54. Ist ! 2 ˝ r .M; End .TM //; so ist die äußere kovariante Ableitung von ! d r ! 2 ˝ rC1 .M; End .TM // durch . dr !/.X1 ; : : : ; XrC1 / WD
rC1 X End b i ; : : : ; XrC1 // .1/i 1 rX .!.X1 ; : : : ; X i i D1
C
X
bj ; : : : ; X b l ; : : : ; XrC1 / .1/j Cl !.ŒXj ; Xl ; X1 ; : : : ; X
j 2 mit ric 12 sg D T; so ist 1 Spur T g : dim M 2 Insbesondere gilt für jede Lösung der E INSTEIN-Gleichung: ric D T
ric D 0 ” T D 0 : Beweis. Gilt (5.18), so ist 1 s Spur g D 2 dim M dim M Ds s D 1 s : 2 2
Spur T D Spur ric
Also ist T
1 1 1 Spur T g D ric s g C s g dim M 2 2 2 D ric :
t u
Der R IEMANNsche Krümmungstensor einer Vakuumlösung muss jedoch nicht notwendig verschwinden, wie wir am Beispiel der S CHWARZSCHILDmannigfaltigkeit gesehen haben.
Aufgaben
161
Vakuumlösungen sind also R ICCI-flache Lösungen. Es liegt nahe, die Fragestellung etwas zu verallgemeinern, indem man anstelle von Mannigfaltigkeiten mit ric D 12 sg nach Mannigfaltigkeiten mit ric D f g für f 2 C 1 .M / sucht. Definition 5.58. Eine pseudo-R IEMANNsche Mannigfaltigkeit .M; g/ mit ric D f g 1
für ein f 2 C .M / heißt E INSTEIN-Mannigfaltigkeit. Offenbar ist dann f D dims M . Es stellt sich heraus, dass dies für dim M 3 eine sehr starke Forderung ist: Korollar 5.59. Ist M E INSTEIN-Mannigfaltigkeit der Dimension n 3; so ist die Skalarkrümmung konstant. Beweis. Nach Satz 5.56 ist div .ric/ D
1 1 div .sg/ D d s : 2 2
Andererseits ist
s 1 g D ds ; n n also ist für n > 2 tatsächlich d s D 0. div
Aufgaben zu Kap. 5 5.1. Kann eine (regulär) parametrisierte Kurve in R2 das Bild f.x; y/ 2 R2 j 1 < x < 1; y D jxjg haben? (Beispiel oder Gegenbeweis!) 5.2. a. Beweisen Sie die Krümmungsformel für reguläre Kurven ˛ in R3 : ˛ D
j˛P ˛j R : j˛P 3 j
b. Betrachten wir nun als Beispiel die Kurven i ; i D 1; 2. Wir parametrisieren 1 durch 0 1 R cos.t/ 1 W R ! R3 ; 1 .t/ D @ R sin.t/ A at und 2 durch
0 1 t 2 W R ! R3 ; 2 .t/ D @t 2 A : t3
Berechnen Sie die Krümmung .
162
5 Geodätische und Krümmung
5.3. Sei f W Rn ! Rn ; f .x/ D Ax C v mit A 2 SO.n/; v 2 Rn eine euklidische Bewegung. Sei M Rn eine .n 1/-dimensionale orientierte Untermannigfaltigkeit, W I ! M eine Kurve, MQ D f .M / und Q D f ı W I ! MQ . Zeigen Sie: Q D ; kQ D k und g D g Q . 5.4. Bestimmen Sie R ICCI- und Skalarkrümmung der n-dimensionalen Einheitssphäre. Hinweis: Benützen Sie Formel (5.7). Die Rechnungen können vereinfacht werden, wenn Sie berücksichtigen, dass die Schnittkrümmung aus Symmetriegründen konstant ist. 5.5. Sei I R ein offenes Intervall, f 2 C 1 .I / und W I ! R2 ; .t/ D .x.t/; f .x.t/// auf Bogenlänge parametrisiert. Ist x0 D x.t0 / so, dass f 0 .x0 / D 0; so ist k.t0 / D f 00 .x0 /. 5.6. Sei W I ! R2 eine auf Bogenlänge parametrisierte Kurve und # W I ! R so, dass P .t/ D .cos #.t/; sin #.t//. Dann ist P .t/or D #.t/ : 5.7. Sei Gf R3 eine Graphenfläche, also f 2 C 1 .U / für U R2 und Gf D f.x; f .x// j x 2 U g; x0 2 U ein lokales Extremum von f; also unt T.x G D R2 0 : 0 ;f .x0 // f
Sei # W"; "Œ! Gf eine regulär parametrisierte Kurve mit # .0/ D .x0 ; f .x0 //; P# .0/ D .cos #; sin #; 0/; deren Bild im Schnitt der Ebene E# D .x0 ; 0/ C f. cos #; sin #; / j ; 2 Rg mit Gf liegt. (Warum gibt es eine solche Kurve?) Es ist also etwa # .t/ D .x0 C .t cos #; t sin #/; f .x0 C .t cos #; t sin #//. Sei # .t/ WD # .t/. a. Zeigen Sie: # .0/ C #C 2 .0/ D
@2 f @2 f .x / C .x0 / : 0 @x12 @x22
Interpretieren Sie die linke Seite dieser Gleichung durch geeignete Wahl von # als das Doppelte der mittleren Krümmung. b. Folgern Sie: Z2 1 # .0/ d# D H.x0 ; f .x0 // 2 0
5.8. Berechnen Sie die G AUSSsche Krümmung des Rotationstorus Tr;R aus Aufgabe 1.3. Gibt es r; R; so dass Tr;R isometrisch zu S1 S1 ist? 5.9. a. Zeigen Sie: Ist f W M ! MQ eine lokale Isometrie zwischen R IE MANN schen Mannigfaltigkeiten, so ist Lg Œ D LgQ Œf ı für jede reguläre Kurve in M .
Aufgaben
163
b. Betrachten Sie den Rotationstorus Tr;R . Zeigen Sie mit Hilfe von a., dass f aus Aufgabe 3.2b. keine Isometrie ist. 5.10. Sei 0 < r < R und Tr;R der Rotationstorus mit der durch die Parametrisierung aus Aufgabe 1.4b. gegebenen Orientierung. a. Betrachten Sie die vier Kurven, die jeweils mit Einsgeschwindigkeit die Oberbzw. Außen- bzw. Innenseite bzw. einen Meridian des Torus entlanglaufen: 1 1 0 0 R cos.t=R/ .R C r/ cos.t=.R C r// 1 .t/ D @ R sin.t=R/ A ; 2 .t/ D @ .R C r/ sin.t=.R C r// A ; r 0 0 1 0 1 .R r/ cos.t=.R r// R C r cos.t=r/ A 0 3 .t/ D @ .R r/ sin.t=.R r// A ; 4 .t/ D @ 0 r sin.t=r/ mit t 2 R. Berechnen Sie für i ; i D 1; : : : ; 4; jeweils die orientierte geodätische und die orientierte Normalkrümmung sowie die Krümmung. Welche der Kurven sind Geodätische auf dem Torus? b. Berechnen Sie für p 2 Tr;R den W EINGARTENoperator Sp und damit die G AUSSsche Krümmung K.p/ sowie die mittlere Krümmung H.p/ im Punkt p. Für welche p ist die G AUSSsche Krümmung positiv bzw. negativ bzw. gleich Null? 5.11. a. Seien M; N orientierte (zweidimensionale) Flächen, W I ! M eine auf Bogenlänge parametrisierte Kurve und f W M ! N eine lokale Isometrie. Zeigen Sie, dass und f ı dieselbe orientierte geodätische Krümmung haben, d. h. g .t/ D gf ı .t/; t 2 I : b. Betrachten Sie den Zylinder Z WD S1 R R3 . Zeigen Sie, dass f W R2 ! Z; f .x; y/ WD .cos x; sin x; y/T eine lokale Isometrie ist. Was sind die Geodätischen auf R2 ? Schließen Sie mit Teil a., dass die Schraubenlinien .t/ WD .cos at; sin at; bt/T mit a2 C b 2 D 1 Geodätische auf Z sind. 5.12. Sei .M; g/ eine R IEMANNsche Mannigfaltigkeit. Sei 2 RC . Wie berechnet man die Krümmungsgrößen (R IEMANNscher Krümmungstensor, R ICCI- und Skalarkrümmung) von .M; g/ aus denen von .M; g/? 5.13. Sei S41 die DE -S ITTER-Raum-Zeit (vgl. Aufgabe 3.12). Zeigen Sie für die Krümmungsgrößen der DE -S ITTER-Raum-Zeit 3 g; r2 12 sD 2 : r
ric D
Die DE -S ITTER-Raum-Zeit ist also Vakuumlösung mit kosmologischer Konstante 3 . r2
164
5 Geodätische und Krümmung
Hinweis: Für 4-dimensionale Untermannigfaltigkeiten M des 5-dimensionalen M INKOWSKIraums, die mit der Einschränkung des M INKOWSKI-Skalarproduktes auf M wieder L ORENTZ-Mannigfaltigkeiten sind, gilt Formel (5.7) analog, also R.u; v/w D hS vjwiS u hS ujwiS v ; wobei S v D dN ist mit einem Normaleneinheitsfeld N . Diese Tatsache (vgl. etwa das Skript von Ch. Bär auf der Webseite geometrie.math.uni-potsdam.de/documents/ baer/skripte/skript-DiffGeo.pdf) dürfen Sie verwenden. 5.14. Sei M R3 eine 2-dimensionale orientierte Fläche, U W M ! S2 ; x 7! U.x/ die durch das Einheitsnormalenfeld gegebene Abbildung. a. Zeigen Sie
K !M D U !S2 :
Hinweis: Setzen Sie auf beiden Seiten eine Orthonormalbasis von Tx M ein. b. Sei jetzt V M und U W V ! V 0 S2 ein Diffeomorphismus. Dann ist Z K!M D Vol .V 0 / V
der Flächeninhalt von V 0 . 5.15. Sei .M; g/ eine Pseudo-R IEMANNsche Mannigfaltigkeit. Seien e1 ; : : : ; en lokale Vektorfelder auf U M; so dass für alle x 2 U gilt hei .x/jej .x/i D "i ıij mit "i D ˙1. Zeigen Sie: Für alle x 2 U ist X div .v/.x/ D "i g.rei v; ei / : i
5.16. Berechnen Sie die C HRISTOFFELsymbole für die Sphäre S2 in Kugelkoordinaten. 5.17. Zeigen Sie: In lokalen Koordinaten ist l l Rijk D @i kj @j kil C
n X l m l kj mj kim : mi mD1
5.18. Seien .M1 ; g1 / und .M2 ; g2 / R IEMANNsche Mannigfaltigkeiten mit R ICCIKrümmung ric1 und ric2 und Skalarkrümmung s1 und s2 . Sei M WD M1 M2 . Wir schreiben T.p1 ;p2 / M D Tp1 M1 ˚ Tp2 M2 gemäß Aufgabe 1.9. Sei nun eine Metrik g auf M1 M2 durch g..X1 ; X2 /; .Y1 ; Y2 // D g1 .X1 ; Y1 / C g2 .X2 ; Y2 /
Aufgaben
165
gegeben, und ric und s seien die R ICCI- und Skalarkrümmung von M . Zeigen Sie: a. ric ..X1 ; X2 /; .Y1 ; Y2 // D ric1 .X1 ; Y1 / C ric2 .X2 ; Y2 / : b. s.p1 ; p2 / D s1 .p1 / C s2 .p2 / : c. Sind M1 und M2 E INSTEIN-Mannigfaltigkeiten gleicher Dimension und Skalarkrümmung, so ist auch M1 M2 eine E INSTEIN-Mannigfaltigkeit. Hinweis: Man zeige zunächst, dass rX Y D rY X D 0 ist, falls X.p1 ; p2 / 2 Tp1 M1 f0g und Y .p1 ; p2 / 2 f0g Tp2 M2 für alle .p1 ; p2 / 2 M . Man überlege sich die Auswirkungen hiervon auf den Krümmungstensor und dann auf R ICCIund Skalarkrümmung. 5.19. Sei .M; g/ eine pseudo-R IEMANNsche Mannigfaltigkeit und ˛ 2 .T M ˝ T M /. Zeigen Sie: divr .f ˛/ D igrad f ˛ C f divr ˛ für f 2 C 1 .M /.
Kapitel 6
Koordinatenfreie Formulierungen der klassischen Mechanik
Der Konfigurationsraum K eines mechanischen Systems, also der Raum der möglichen Positionen seiner Bestandteile, wird oft durch eine Mannigfaltigkeit beschrieben. So ist z. B. die eindimensionale Sphäre S1 ein Modell für den Konfigurationsraum des ebenen Pendels. Allgemeiner wird ein System von N Massenpunkten, die r unabhängigen holonomen Zwangsbedingungen unterworfen sind, durch eine 3N r-dimensionale Untermannigfaltigkeit des R3N beschrieben. Ein weiteres Beispiel ist die spezielle orthogonale Gruppe SO.3/ WD fA 2 O.3/ j det A D 1g (vgl. Abschn. 1B) als Konfigurationsraum eines starren Körpers im Schwerpunktsystem, wobei die Position P des Körpers im Raum mathematisch durch die Drehung A 2 SO.3/ beschrieben wird, die ihn aus einer festen Ausgangsposition P0 in die Position P überführt. Die tatsächliche Bewegung entspricht dann einer Kurve im Konfigurationsraum. Der physikalische Zustand eines mechanischen Systems wird durch Ort und Geschwindigkeit, also durch einen Punkt im Tangentialbündel TK; oder durch Ort und Impuls, d. h. einen Punkt im Kotangentialbündel T K beschrieben. Der L AGRANGEformalismus der klassischen Mechanik kann koordinatenfrei formuliert werden, indem man die L AGRANGEfunktion als Funktion auf TK auffasst. Die Bewegungen des Systems werden dann durch ihre Geschwindigkeitskurven P W I ! TK beschrieben, die Lösungen gewisser Differentialgleichungen sind (vgl. Abschn. B und E). Analog kann der H AMILTONsche Formalismus koordinatenfrei formuliert werden, indem man die H AMILTON-Funktion als Funktion auf T K auffasst. Das Kotangentialbündel T K ist allerdings nur ein Spezialfall einer sog. symplektischen Mannigfaltigkeit, deren Einführung es erlaubt, die gesamte H A MILTONsche Mechanik als eine Art modifizierte Geometrie zu deuten (Abschn. C und D). Die Übersetzung der beiden Formalismen ineinander geschieht durch die L EGENDREtransformation, die am Schluss des Kapitels besprochen wird.
K.-H. Goldhorn, H.-P. Heinz, M. Kraus, Moderne mathematische Methoden der Physik DOI 10.1007/978-3-540-88544-3, © Springer 2009
167
168
6 Koordinatenfreie Formulierungen der klassischen Mechanik
A Tangential- und Kotangentialbündel In diesem Abschnitt sollen die dem L AGRANGE- und H AMILTONformalismus zugrunde liegenden Räume mit einer Mannigfaltigkeitsstruktur versehen werden. Zunächst sind ja Tangential- und Kotangentialbündel, wie in Abschn. 3A erläutert, die disjunkte Vereinigung von Vektorräumen [ [ Tx M und T M D Tx M : TM D x2M
x2M
Auf beiden Räumen ist eine Projektion nach M definiert, die wir in beiden Fällen mit bezeichnen. Ist M eine n-dimensionale Mannigfaltigkeit und .U; h/ eine Karte für M; so ist hQ W 1 .U / ! U Rn ; v D
n X i D1
1 n v i @.h/ i .x/ 7! .x; .v ; : : :; v //
(6.1)
ˇ eine bijektive Abbildung und hQ x WD pr2 ı hˇ 1 .x/ W 1 .x/ ! Rn ist für jedes x 2 U ein Isomorphismus, nämlich der in (1.8) definierte Isomorphismus hx W T x M ! Rn . Die Mannigfaltigkeitsstruktur auf TM soll nun so erklärt werden, dass die Abbildungen hı hQ W 1 .U / ! U 0 Rn mit b h W U Rn ! U 0 Rn ; .x; v/ 7! .h.x/; v/ HT WD b (6.2) einen Atlas für TM bilden. Bisher ist keine Topologie auf TM definiert, also kann noch nicht die Rede davon sein, dass durch (6.2) ein Homöomorphismus gegeben ist. Nun definieren wir aber die Topologie auf TM in geeigneter Weise: Definition 6.1. Eine Teilmenge V TM heißt offen, falls für jede Karte .U˛ ; h˛ / von M und hQ ˛ wie in (6.1) 0 hQ ˛ @V \
[
1 T x M A U ˛ Rn
x2U˛
offen in U˛ Rn ist. Es ist leicht nachzurechnen, dass auf diese Weise eine Topologie auf TM definiert ist und dass die durch (6.2) gegebenen Abbildungen Homöomorphismen sind. Nun ist noch zu prüfen, dass durch (6.2) eine differenzierbare Struktur gegeben ist. Sind h˛ W U˛ ! U˛0 und hˇ W Uˇ ! Uˇ0 zwei Karten für M und w˛ˇ WD hˇ ı h1 ˛ ; so ist nach (1.10)
A Tangential- und Kotangentialbündel
HT;ˇ
169
ˇ ı H 1 ˇ
T;˛ .h˛ .U˛ \Uˇ /Rn / h˛ .U˛ \ Uˇ / Rn !
W hˇ .U˛ \ Uˇ / Rn
.x; v/ 7! .w˛ˇ .x/; Jw˛ˇ .x/v/ also ein Diffeomorphismus. Insgesamt erhalten wir: Satz 6.2. Das Tangentialbündel TM ist zusammen mit der durch (6.2) definierten differenzierbaren Struktur eine differenzierbare Mannigfaltigkeit der Dimension 2 dim M . Die Bündelprojektion W TM ! M ist differenzierbar und die differenzierbaren Schnitte in TM sind genau die differenzierbaren Vektorfelder. Beweis. Es bleiben nur die Aussagen über die differenzierbaren Abbildungen zu beweisen. Diese sind aber sofort klar, wenn man sich erinnert, dass eine Abbildung auf einer Mannigfaltigkeit nach Definition differenzierbar bei x ist, wenn f ı h für eine Karte .U; h/ mit x 2 U differenzierbar ist. t u Die durch (6.2) gegebenen Koordinaten von 1 .U / TM werden üblicherweise mit .q1 ; : : :; qn ; qP1 ; : : :; qPn / bezeichnet. Bezeichnen @1 ; : : :; @2n die zugehörigen Koordinatenbasisfelder, so schreibt man für f 2 C 1 .TM / und 1 k n @ f ; @qk @ @nCk f D f : @qPk @k f D
(6.3)
Die Mannigfaltigkeitsstruktur auf T M wird ganz analog konstruiert. Ist .U; h/ eine Karte für M; so definiere h W 1 .U / ! U Rn n X ˛D ai .x/ dx i 7! ..˛/; a1 .x/; : : :; an .x// ;
(6.4)
i D1
HT W 1 .U / ! U 0 Rn X ˛D ai .x/ dx i 7! .h.x/; a1 .x/; : : :; an .x// :
(6.5)
i
Die Topologie auf T M ist wie die von TM definiert: Definition 6.3. Eine Teilmenge V T M heißt offen, wenn für jede Karte .U; h/ von M h.V \ 1 .U // U Rn offen in U Rn ist. Die Kartenwechsel der Karten HT werden durch Satz 2.3 beschrieben, und zwar mit der JACOBImatrix als Transformationsmatrix C .
170
6 Koordinatenfreie Formulierungen der klassischen Mechanik
Satz 6.4. Das Kotangentialbündel T M bildet zusammen mit der durch (6.5) definierten differenzierbaren Struktur eine 2n-dimensionale Mannigfaltigkeit. Der Raum der differenzierbaren Schnitte in T M ist genau ˝ 1 M . Die Koordinaten in T M werden mit .q1 ; : : :; qn ; p1 ; : : :; pn / bezeichnet, und (6.3) wird sinngemäß ebenso verwendet. Durch eine Metrik auf M sind die bijektiven Abbildungen b und # gegeben, die in Satz 2.4 und Abschn. 4E betrachtet wurden. Für sie gilt: Satz 6.5. Ist M eine pseudo-R IEMANNsche Mannigfaltigkeit, so sind die Abbildungen b W TM ! T M und # W T M ! TM fasertreue Diffeomorphismen, d. h. es sind Diffeomorphismen, für die gilt b.Tx M / D Tx M
#.Tx M /
und
D Tx M :
Für uns wird ein weiterer Typ von Abbildungen zwischen TM und T M interessant werden, die zwischen H AMILTONschem und L AGRANGEschem Formalismus vermitteln. Um sie zu definieren, beachten ˇ wir, dass für eine Funktion f 2 C 1 .TM / und x 2 M die Ableitung von f ˇTx M an einer Stelle v 2 Tx M eine Linearform auf dem Vektorraum Tx M und somit ein Element von Tx M ist. In Zeichen heißt das ˇ d.f ˇTx M /v 2 Tx M ; und wir können definieren: Definition 6.6. Ist f 2 C 1 .TM /; so heißt ˇ d0 f W TM ! T M ; v 7! d.f ˇT
.v/ M
/v
die Faserableitung von f . In lokalen Koordinaten ist die Faserableitung durch
@f d f W TM ! T M ; .q; q/ P 7! q; @qP 0
oder, ausführlicher: @f @f .q1 ; : : :; qn ; qP1 ; : : :; qPn / 7! q1 ; : : :; qn ; ; : : :; @qP1 @qPn gegeben. Offenbar ist die Faserableitung einer Funktion stets differenzierbar, aber nicht notwendig injektiv oder surjektiv. Man definiert: Definitionen 6.7. Eine Funktion f W TM ! R heißt regulär, wenn ihre Faserableitung d0 f W TM ! T M ein lokaler Diffeomorphismus ist, hyperregulär, wenn sie ein Diffeomorphismus ist.
A Tangential- und Kotangentialbündel
171
Eine Abbildung f 2 C 1 .TM / ist also genau dann regulär, wenn in lokalen Koordinaten die Matrix 2 @f @qPi @qPj i;j D1;:::;n regulär ist. Beispiel: Es sei .M; g/ eine R IEMANNsche Mannigfaltigkeit, U 2 C 1 .M / und m > 0. Dann ist durch L.v/ WD
1 mg.v; v/ U..v// 2
mit der Projektion W TM ! M eine hyperreguläre Funktion gegeben, denn 1 d ˇˇ mg.v C tw; v C tw/ U..v C tw// D mg.v; w/ ; . d0 L/.v/.w/ D ˇ dt t D0 2 also d0 L.v/ D mv b . In lokalen Koordinaten ist L durch 1 X m gij qP i qP j U.q/ 2 i;j
gegeben, also d0 L durch 0 @q 1 ; : : :; q n ; m
n X
g1j qP j ; : : :; m
j D1
und
n X
1 gnj qP j A
j D1
@2 L D mgij : @qPi @qPj
Für Funktionen f 2 C 1 .T M / kann man ganz analog vorgehen, denn dann ist für ˛ 2 Tx M ˇ d.f ˇT M /˛ 2 .Tx M / D Tx M ; x
und dann heißt d0 f W T M ! TM ˇ . d0 f /.˛/ WD d.f ˇT
.˛/ M
/˛
die Faserableitung von f . Die Funktion f heißt regulär, falls d0 f ein lokaler Diffeomorphismus und hyperregulär, falls d0 f ein Diffeomorphismus ist.
172
6 Koordinatenfreie Formulierungen der klassischen Mechanik
B E ULER-L AGRANGEgleichungen Die L AGRANGEfunktion eines mechanischen Systems ist durch eine (möglicherweise zeitabhängige) Funktion auf dem „Geschwindigkeitsraum“ TM gegeben. Wir gehen dabei davon aus, dass der Konfigurationsraum M zeitunabhängig ist (in [2, 47] z. B. wird auch der zeitabhängige Fall behandelt). So wird beispielsweise die Bewegung eines Teilchens der Masse m > 0 auf einer R IEMANNschen Mannigfaltigkeit, auf das keine äußeren Kräfte wirken, durch L.v/ D 12 mjvj2 beschrieben. Ist U W M ! R eine weitere Funktion, die physikalisch als potentielle Energie interpretiert wird, so ist die L AGRANGEfunktion durch 1 L.v/ D mjvj2 U..v// 2 definiert. Die Bewegungsgleichungen ergeben sich dann aus dem H AMILTONschen Prinzip der kleinsten Wirkung, d. h. man ermittelt die Bewegungsgleichungen durch Variation des Wirkungsfunktionals Zt1 L.P .t// dt ;
W Œ WD t0
d. h. durch die Forderung, dass d ˇˇ ˇ ds sD0
Zt1 L t0
d f .s; t/ dt
dt D 0
(6.6)
sein möge, wobei f W "; "ŒŒt0 ; t1 ! M .s; t/ 7! f .s; t/ D fs .t/ eine beliebige Variation von D f0 W Œt0 ; t1 ! M ist, für die die Endpunkte fs .t0 /; fs .t1 / fest bleiben. In [36], Kapitel 23, wurden Variationsprobleme im Fall, dass M Rn offen, also TM Rn Rn ist, ausführlich behandelt. Auch in Kap. 5 haben wir bereits ein Variationsproblem gesehen. Dort haben wir festgestellt (Satz 5.41), dass (6.6) mit LŒ D 12 jP j2 genau dann für jede endpunktfeste Variation erfüllt ist, wenn f0 D eine Geodätische ist. In [36], Band 2, wurde schon bewiesen, dass jedes lokale Minimum des Wirkungsfunktionals Zt1 P dt I Œ' D L.t; '; '/ t0
B E ULER -L AGRANGEgleichungen
173
für ' 2 C 1 .Œt0 ; t1 / das System von E ULER-L AGRANGE-Gleichungen d @L @L D ; dt @qPi @qi
i D 1; : : :; n
(6.7)
erfüllt. Dieselben Gleichungen gelten auch in lokalen Koordinaten, falls ' eine Kurve auf einer Mannigfaltigkeit und L 2 C 1 .R TM / ist. Im Folgenden verstehen wir unter einer L AGRANGEfunktion stets eine differenzierbare Funktion auf R TM . In den späteren Abschnitten werden wir dann die explizite Zeitabhängigkeit ausschließen und L 2 C 1 .TM / voraussetzen. Um (6.7) auf Mannigfaltigkeiten anwenden zu können, darf sich die Variation nur in einem Kartengebiet abspielen. Die folgende Definition dient dazu, dies präzise auszudrücken: Definition 6.8. Ist f eine Variation von f0 W Œt0 ; t1 ! M; so heißt Tf WD ft 2 Œt0 ; t1 j f .s; t/ 6D f .0; t/ für ein s 2 "; "Œg der Träger der Variation. Damit kann aus (6.7) und klassischen Methoden der Variationsrechnung (wie etwa den in [36], Band 2, entwickelten) sofort gefolgert werden: Lemma 6.9. Ist L 2 C 1 .TM R/ und d ˇˇ ˇ ds sD0
Zt1
L.t; fPs .t// dt D 0
t0
für jede Variation von f; so dass f . "; "ŒTf / ganz in einem Kartengebiet enthalten ist, so erfüllt f in lokalen Koordinaten die E ULER-L AGRANGEgleichung (6.7). Um aber zu beliebigen Variationen übergehen zu können, müssen wir die Bedeutung der E ULER-L AGRANGEgleichungen etwas besser verstehen. Dazu benötigen wir die Ableitung unserer Variationen in Bezug auf die s-Variable und verwenden in diesem Zusammenhang die in Definition 5.39 eingeführte Sprechweise. Satz 6.10. Ist L eine L AGRANGEfunktion und I WD Œt0 ; t1 ; so gibt es zu jedem W I ! M genau eine stetige Abbildung !EUL W I ! T M mit !EUL .t/ 2 T.t /M ;
so dass für jedes Vektorfeld X längs und jede Variation f mit kompaktem Träger von in Richtung X gilt d ˇˇ ˇ ds sD0
Zt1 t0
LŒfPs dt D
Zt1 !EUL .t/.X.t// dt : t0
(6.8)
174
6 Koordinatenfreie Formulierungen der klassischen Mechanik
Diese Abbildung nennt man die E ULERform zu L längs . In lokalen Koordinaten ist d @L @L i !EUL .t/ D .t; f0 .t/; fP0 .t// .t; f0 .t/; fP0 .t// : (6.9) @qi dt @qPi Haben wir Satz 6.10 bewiesen, so folgt sofort, dass obiges Lemma für beliebige Variationen richtig bleibt. Satz 6.11. Ist L eine L AGRANGEfunktion, so ist W I ! M genau dann extremal Rt1 P dt; falls in lokalen Koordinaten für i D 1; : : :; n für W D L.t; q; q/ t0
@L d @L .t; .t/; P .t// D .t; .t/; P .t// @qi dt @qPi gilt. Beweis (des Satzes 6.10). Die Eindeutigkeit ist klar, denn wären !EUL und !Q EUL zwei Formen wie im Satz, so wäre Zt1 .!EUL .t/ !Q EUL .t//.X.t// dt D 0 t0
für alle Vektorfelder längs ; und daraus folgt mit dem „Fundamentallemma der Variationsrechnung“ (z. B. Theorem 23.16, in [36], Band 2), dass !EUL .t/ D !Q EUL .t/ : Um die Existenz der E ULERform zu zeigen, wollen wir die „lokalen“ E U durch (6.8) gegeben sind, zusammenfügen. Die Zerlegung der Eins ist sicher ein geeignetes Hilfsmittel hierfür. Um sie anzuwenden, müssen allerdings erst einige Vorarbeiten geleistet werden. Sind U und UQ Kartengebiete für M; so sind nach Lemma 6.9 durch (6.9) jedenfalls auf U und UQ entsprechende E ULERformen !EUL und !Q EUL gegeben, deren Einschränkungen auf U \ UQ wieder E ULERformen auf U \ UQ sind, also dort übereinstimmen. Damit ist also durch (6.9) eine differenzierbare Abbildung loc W I ! T M gegeben, so dass (6.8) für jede Variation gilt, für die das Bild !EUL ihres Trägers ganz in einem Kartengebiet liegt. Ist jetzt aber f eine beliebige endpunktfeste Variation in Richtung X.t/; so zeigt die lokale Rechnung wie im Rn (vgl. [36], Band 2, Satz 23.12) jedenfalls, dass LERformen, die
d ˇˇ ˇ ds sD0
Zt1 t0
nur von X.t/ abhängt, und zwar linear.
L.t; fP.t// dt
C Symplektische Mannigfaltigkeiten
175
Mittels einer Zerlegung der Eins schreiben wir jetzt X.t/ D X1 .t/ C C Xn .t/; wobei der Träger von Xi .t/ so gewählt ist, dass sich die Variation in Richtung Xi für genügend kleines " ganz in einem Kartengebiet abspielt. loc Ist !EUL die entsprechende lokale E ULERFORM, so ist d ˇˇ ˇ ds sD0
Zt1
n Z X
t1
L.t; fPs .t// dt D
loc !EUL .t/.Xi .t// dt
i D1 t0
t0
Zt1 D
loc !EUL .t/.X.t// dt ; t0
loc also hat die oben konstruierte E ULERform !EUL tatsächlich die geforderte Eigenschaft, und wir können loc D !EUL !EUL
t u
setzen.
C Symplektische Mannigfaltigkeiten Der Zugang zur klassischen Mechanik über die H AMILTONfunktion beruht darauf, dass der Zustand eines mechanischen Systems durch Ort und Impuls festgelegt ist und dass die Angabe von Ort und Impuls einem Punkt des Kotangentialbündels (= Phasenraum) T M entspricht, wobei M der Konfigurationsraum des Systems ist. Die H AMILTONfunktion erscheint hierbei als eine Funktion H auf T M . Vom mathematischen Standpunkt aus gesehen, ist der H AMILTONformalismus besonders klar, da er von einer Funktion ausgeht, die auf T M definiert ist, und auf T M ist eine natürliche 2-Form wohldefiniert, die den Phasenraum zu einer symplektischen Mannigfaltigkeit macht. Diesen Begriff wollen wir nun diskutieren. In Kap. 5 haben wir Mannigfaltigkeiten mit einer Metrik, also einer nichtentarteten symmetrischen Bilinearform, untersucht. Hier haben wir es hingegen mit einer Mannigfaltigkeit zu tun, die eine nichtentartete antisymmetrische Bilinearform trägt. Definitionen 6.12. a. Unter einer symplektischen Form auf einer Mannigfaltigkeit Q versteht man eine Differentialform ! 2 ˝ 2 Q; für die gilt (i) (ii)
! ist nichtentartet, d. h. zu jedem q 2 Q und jedem v 2 Tq Q gibt es ein w 2 Tq Q mit !q .v; w/ 6D 0; ! ist geschlossen, d. h. d! D 0.
b. Eine Mannigfaltigkeit mit einer symplektischen Form heißt symplektische Mannigfaltigkeit.
176
6 Koordinatenfreie Formulierungen der klassischen Mechanik
Eine symplektische Form kann ähnlich wie eine Metrik benutzt werden, um Tangential- und Kotangentialbündel miteinander zu identifizieren. Lemma 6.13. Ist ! eine symplektische Form auf Q; so ist für jedes q 2 Q Iq W Tq Q ! Tq Q; v 7! !q .v; / D iv ! ein Isomorphismus. Damit ist auch I W TQ ! ˝ 1 Q ein Isomorphismus. Beweis. Dass ! nichtentartet ist, bedeutet gerade, dass Iq injektiv ist, und damit ist Iq aus Dimensionsgründen ein Isomorphismus. t u Beispiel 1: Ist Q D R2n und bezeichnen wir die Koordinaten mit .x1 ; : : :; xn ; y1 ; : : :; yn /; so ist n X !D dxi ^ dyi i D1
eine symplektische Form auf R
2n
und
I.x;y/ W R2n ! R2n ;
v w
! 7! .w T ; v T / ;
denn i. v / ! D v1 dy1 C w1 dx1 C w
vn dyn C wn dxn :
Beispiel 2: Das Kotangentialbündel Um eine symplektische Form auf T M; also an jeder Stelle ˛ 2 T M ein Element !˛ 2 Alt2 .T˛ T M /; zu definieren, nützt man aus, dass das Differential der Projektion W T M ! M an jeder Stelle ˛ 2 T M eine Abbildung d˛ W T˛ T M ! T.˛/ M definiert. Definition 6.14. Die 1-Form 2 ˝ 1 .T M /; die durch ˛ .v/ WD ˛.d ˛ .v// definiert ist, heißt kanonische 1-Form auf T M . Bezeichnen wir lokale Koordinaten in T M wieder mit .q; p/; so ist eine 1-Form ˇ 2 ˝ 1 .T M / lokal durch n X
ˇi .p; q/ dpi C
i D1
mit C 1 -Funktionen ˇi ; bi gegeben.
n X i D1
bi .p; q/ dqi
C Symplektische Mannigfaltigkeiten
177
Damit haben die Differentiale dqi eine Doppelbedeutung: Einerseits ist dqi eine lokale 1-Form auf M; andererseits eine lokale 1-Form auf T M . Wir wollen hierfür nur für einen Moment unterschiedliche Notationen einführen, nämlich dqiM und dqiT M . Dann ist dqiT M .w/ D dqiM . d˛ .w// ˛
.˛/
für w 2 T˛ .T M /. Im Folgenden benutzen wir wieder die Bezeichnung dqi in der Doppelbedeutung wie oben angekündigt. Dann ist die kanonische 1-Form lokal D
n X
pi dqi :
(6.10)
i D1
Denn wenn ˛ 2 Tq M lokal gegeben ist durch ˛ D .q; p/; so ist X .q;p/ .w/ D pi dqi . d.q;p/ .w// i
D
X
pi d.qi ı /.w/
i
D
X
pi dqi .w/ :
i
Beim letzten Gleichheitszeichen wurde Gebrauch von der Doppelbenutzung der Koordinaten qi gemacht. Satz 6.15. Ist die kanonische Form auf T M; so ist ! WD d eine symplektische Form auf T M . Beweis. Es ist d! D d d D 0. In lokalen Koordinaten ist !D
n X
dqi ^ dpi ;
i D1
t u
also ist ! offenbar nicht entartet.
Sprechen wir von der symplektischen Mannigfaltigkeit T M; so bezieht sich das stets auf diese symplektische Form auf T M . Dass die symplektische Form auf T M in lokalen Koordinaten dieselbe Form hat wie die symplektische Form aus Beispiel 1, ist kein Zufall. Vielmehr gilt: Theorem 6.16 (Satz von DARBOUX). Ist ! eine symplektische Form auf M; dann hat M gerade Dimension 2n; und um jeden Punkt x 2 M gibt es lokale Koordinaten .U; .q1 ; : : :; qn ; p1 ; : : :; pn //; so dass n X ˇ ! ˇU D dqi ^ dpi i D1
gilt.
178
6 Koordinatenfreie Formulierungen der klassischen Mechanik
Beweis. Die Behauptung über die Dimension m D 2n der Mannigfaltigkeit folgt mit linear-algebraischen Mitteln: Ist x 2 M und .@1 ; : : :; @m / eine Koordinatenbasis um x; so ist ˝ WD .!ij /i;j D1;:::;m
mit !ij D !x .@i .x/; @j .x//
(6.11)
eine schiefsymmetrische Matrix. Da ! nicht entartet ist, ist diese Matrix regulär, also ist 0 6D det ˝ D det.˝ T / D det.˝/ D .1/m det.˝/ : Also ist .1/m D 1 und somit m D 2n gerade. Sei nun x 2 M und .U; h/ eine Karte um x mit h.x/ D 0. Weiter sei .h/ @.h/ 1 ; : : :; @2n die Koordinatenbasis zu h. Sei ˝ durch (6.11) gegeben. Dann gibt 0 En 0 0 2n es eine Basis .e1 ; : : :; e2n / von R ; bezüglich der ˝ von der Gestalt En 0 ist. Auch dieser Teil des Beweises geschieht mit Mitteln der linearen Algebra. Zu 0 existiert mit zeigen ist, dass eine Basis e10 ; : : :; e2n ( 1 ; falls s D r C n ; 0T 0 er ˝es D (6.12) 0 ; falls r < s und s 6D r C n : Wir zeigen durch Induktion, dass eine solche Basis existiert. 0 Sei 0 ¤ e10 2 R2n beliebig und v1 so, dass e1T ˝v1 6D 0. Setze 0 enC1 WD
v1 : e1 ˝v1 0T
0 Dann ist e10 ˝enC1 D 1. 0 Angenommen, es sind 2k linear unabhängige Vektoren fe10 ; : : :; ek0 ; enC1 ; : : :; 0 enCk g schon konstruiert, die (6.12) erfüllen. Sei 0 0 Wk WD LH fe10 ; : : :; ek0 ; enC1 ; : : :; enCk g;
Vk WD fv 2 R2n j v T ˝w D 0 für alle w 2 Wk g : Dann ist Wk \ Vk D 0 und Vk ˚ Wk D R2n ; denn jedes x 2 R2n kann in der Form x D .x y/ C y geschrieben werden, wobei y 2 Wk definiert ist durch 0 0 0 e10 C y WD x T ˝e10 enC1 x T ˝ek0 enCk C x T ˝enC1 0 ek0 ; C x T ˝enCk
C Symplektische Mannigfaltigkeiten
179
und dann ist x y 2 Vk ; denn x T ˝ej0 D y T ˝ej0
für 1 j k und n C 1 j n C k :
Im Falle k D n ist man also fertig. Für k < n aber folgt dim Vk D 2n 2k > 2k D 0 dim Wk ; und man wählt ekC1 2 Vk n Wk . Dann existiert ein Vektor vkC1 2 Vk 0T v 0 mit ekC1 ˝vkC1 6D 0. Setze enCkC1 WD 0 T kC1 ; und der Induktionsschritt ist ekC1 ˝vkC1
vollzogen. 0 / ist also ˝ durch Bezüglich .e10 ; : : :; e2n 0 En En 0
(6.13)
gegeben. Sei A 2 R2n2n die Matrix, die die Standardbasis auf diese Basis abbildet, 0 also A1 D .e10 ; : : :; e2n / und hQ D A ı h. Dann hat !x in der durch hQ gegebenen Koordinatenbasis die Matrixdarstellung (6.13). Nun muss noch gezeigt werden, dass ! in einer ganzen Umgebung U von x in geeigneten Koordinaten durch (6.13) beschrieben wird. Sei !0 2 ˝ 2 U durch !0 WD hQ . dx1 ^ dxnC1 C C dxn ^ dx2n / definiert und ˇ !Q WD ! ˇU !0 ; insbesondere !Q x D 0 ;
!t WD !0 C t !Q ; ˇ also !1 D ! ˇU und .!t /x D .!0 /x für alle t. Sei ˝t .x 0 / WD .!t .@1 .x 0 /; @j .x 0 //i;j /; also 0 En : ˝t .x/ D En 0
0 En 6D 0; also existiert eine Umgebung U En 0 von x mit det ˝t .x 0 / 6D 0 für alle x 0 2 U; 1 t 1. In U sind dann alle diese !t nichtentartet. O.B.d.A. sei U D hQ 1 .U" .0// für ein " > 0. Sei Es ist daher det ˝t .x/ D det
Š
It W ˝ 1 .U / ! T U der durch !t gegebene Isomorphismus. Wegen d!Q D 0 existiert nach dem Lemma von P OINCARÉ ein ˛ 2 ˝ 1 U mit d˛ D !Q und ˛x D 0. Setze Xt WD It .˛/. Dann ist Xt .x/ D 0 und nach Korollar 4.17 LXt !t D d˛ C iXt d!t D !Q :
(6.14)
180
6 Koordinatenfreie Formulierungen der klassischen Mechanik
Wir betrachten nun die nichtautonome Differentialgleichung ˛.t/ P D Xt .˛.t//. Nach der Theorie der Anfangswertprobleme für solche Differentialgleichungen (vgl. etwa [36], Kapitel 20) gibt es eine differenzierbare Abbildung W
[
ax ; bx ŒU ! U mit
x2U
und
d ˇˇ .t; x 0 / D Xt0 . .t0 ; x 0 // ˇ dt t Dt0
.0; x 0 / D x 0 :
Wir schreiben wieder t W U ! M; t .x 0 / WD .t; x 0 /. Da Xt .x/ D 0 gilt, kann (nach etwaiger Verkleinerung von U ) angenommen werden, dass ax 0 < 1 und bx0 > 1 für alle x 0 2 U und dass alle t ; 1 t 1 Diffeomorphismen sind. Nach Anmerkung 4.18, angewandt auf die Diffeomorphismenscharen 7! Q WD t C ı t1 ; ist für jedes t 2 Œ0; 1 d D t LXt für 2 ˝ r M ; dt t also ist mit (6.14) d ˇˇ !t D t0 !Q C t0 LXt0 !t0 ˇ dt t Dt0 t D t0 !Q t0 !Q D 0 ; also
t !t D 0 !0 D !0 D 1 ! :
Damit ist
hQ ı 11
die gesuchte Karte, denn .hQ ı 11 / . dx1 ^ dxnC1 C C dxn ^ dx2n / D .11 / hQ . dx1 ^ dxnC1 C C dxn ^ dx2n / D .11 / !0 D ! : t u Definition 6.17. Koordinaten wie im Satz von DARBOUX heißen symplektische Normalkoordinaten. Im Fall der pseudo-R IEMANNschen Mannigfaltigkeiten existiert eine nirgends verschwindende n-Form – die Volumenform – nicht in jedem Fall, sondern nur, falls M orientierbar ist. Im Fall einer symplektischen Mannigfaltigkeit der Dimension m D 2n hingegen existiert stets eine nirgends verschwindende m-Form: Satz 6.18. Ist .M; !/ eine symplektische Mannigfaltigkeit der Dimension 2n; so ist ! n .x/ 6D 0 für alle x 2 M . Insbesondere ist M orientierbar.
C Symplektische Mannigfaltigkeiten
181
Beweis. In symplektischen Normalkoordinaten ist lokal ! n D .1/n . dq1 ^ dp1 C C dqn ^ dpn /n D .1/n nŠ dq1 ^ dp1 ^ dq2 ^ dp2 ^ ^ dqn ^ dpn h
D .1/
nC1 2
i
nŠ dq1 ^ ^ dqn ^ dp1 ^ ^ dpn : t u
Definitionen 6.19. a. Ist .M; !/ symplektische Mannigfaltigkeit, so heißt h
nC1 2
.1/ nŠ die kanonische Volumenform auf M . b. Ist M kompakt, so heißt Z
i
!n
!n
M
das symplektische Volumen von M . Im Falle R IEMANNscher Mannigfaltigkeiten spielten Isometrien, also Diffeomorphismen, die die Metrik erhalten, eine wichtige Rolle. Diese Rolle übernehmen jetzt Abbildungen, die die symplektische Form erhalten. Definition 6.20. Seien .M; !/ und .N; / symplektische Mannigfaltigkeiten. Eine differenzierbare Abbildung f W M ! N heißt symplektisch oder auch kanonische Transformation, falls f D ! gilt. Symplektische Transformationen haben zwar stets injektives Differential (sonst wäre f ja entartet), aber sie sind nicht notwendig regulär, wie man an folgendem Beispiel sieht: Beispiel: f W .R2 ; dx1 ^ dx2 / ! .R4 ; dy1 ^ dy3 C dy2 ^ dy4 / ; f .x1 ; x2 / D .x1 ; 0; x2 ; 0/ ist eine symplektische Transformation, denn f . dy1 ^ dy3 C dy2 ^ dy4 /.e 1 ; e 2 /
00 1 1 BB0C B C D . dy1 ^ dy3 C dy2 ^ dy4 / B @@0A ; 0
D 1 D . dx1 ^ dx2 /.e 1 ; e 2 /
0 11 0 B0CC B CC @1AA 0
182
6 Koordinatenfreie Formulierungen der klassischen Mechanik
Isometrien erhalten das Volumen kompakter Mengen, und für kanonische Transformationen folgt ebenso, dass das symplektische Volumen erhalten bleibt. Satz 6.21. Ist f W M ! N eine injektive kanonische Transformation zwischen symplektischen Mannigfaltigkeiten .M; !/ und .N; /; und ist K M eine 2mdimensionale kompakte Untermannigfaltigkeit, so ist Z Z !m D m : K
f .K/
Beweis. Da f kanonische Transformation ist, gilt .f m / D ! m für alle m. Da f injektives Differential hat und K kompakt ist, ist f W K ! f .K/ ein Diffeomorphismus (Beweis ähnlich wie im Beweis von Satz 4.5). Also folgt die Behauptung aus der Transformationsformel (vgl. Korollar 4.13). t u Symplektische Diffeomorphismen des Kotangentialbündels treten in natürlicher Weise auf: Satz 6.22. Ist f W M ! N ein Diffeomorphismus, so ist fQ W T N ! T M; ˛ 7! ˛ ı dff 1 ..˛// ein symplektischer Diffeomorphismus zwischen den Kotangentialbündeln mit den kanonischen symplektischen Formen. Eine Koordinatentransformation des Konfigurationsraums erzeugt also eine kanonische Transformation des Phasenraums. Es gilt sogar fQ M D N für die kanonischen 1-Formen M und N auf T M bzw. T N . Beweis. Sei ˛ 2 Tx N und v 2 T˛ .T N /. Dann ist .fQ M /˛ .v/ D .M /fQ.˛/ . dfQ˛ .v// D fQ.˛/. dfQ.˛/ . dfQ˛ .v// D fQ.˛/. d. ı fQ/˛ .v// D fQ.˛/. d.f 1 ı /˛ .v// 1 ı d˛ .v// D ˛ ı dff 1 ..˛// . df.˛/
D ˛. d˛ .v// D .N /˛ .v/ : Dabei gilt das vierte Gleichheitszeichen, da
. ı fQ/.˛/ D .˛ ı dff 1 ..˛// / D D .f 1 ı /.˛/ : t u
D Der H AMILTON formalismus
183
D Der H AMILTONformalismus Im H AMILTONformalismus wird ein physikalisches System durch eine Funktion H auf dem Kotangentialbündel beschrieben. Die Bewegungsgleichungen sind dann als Integralkurven eines Vektorfelds gegeben. Um dieses Vektorfeld zu definieren, nutzt man die kanonische symplektische Struktur, die auf T M gegeben ist. Auf R IEMANNschen Mannigfaltigkeiten haben wir mittels des Isomorphismus # das Differential einer Funktion in ein Vektorfeld übersetzt. Ähnlich können wir bei symplektischen Mannigfaltigkeiten verfahren, indem wir den Isomorphismus I aus Lemma 6.13 benutzen. Definitionen 6.23. Ist .M; !/ eine symplektische Mannigfaltigkeit und H 2 C 1 .M /; so heißt I 1 dH DW s-grad H der symplektische Gradient oder das H AMILTONsche Vektorfeld zu H . Beispiel: Ist H 2 C 1 .R2n / und bezeichnen .q1 ; : : :; qn ; p1 ; : : :; pn / die Koordinaten in R2n ; so ist bezüglich der kanonischen symplektischen Form ! D P 2n der symplektische Gradient von H durch i dpi ^ dqi auf R 1 0 @H
B @p: 1 C B : C B : C B @H C B @p C B n C s-grad H D B C B @H C B @q1 C B : C B : C @ : A @H @q n gegeben. Ist H.q; p/ D
(6.15)
jpj2 C U.q/ für U 2 C 1 .Rn / 2m
so ist s-grad H D
p m
grad U
:
Die Integralkurven dieses Vektorfelds erfüllen also die Gleichung p ; m pP D grad U : qP D
Dies ist äquivalent zur Differentialgleichung zweiter Ordnung mqR D grad U.q/ ; was gerade die N EWTONsche Bewegungsgleichung ist.
184
6 Koordinatenfreie Formulierungen der klassischen Mechanik
Nach dem Satz von DARBOUX können wir auf jeder symplektischen Mannigfaln ˇ P dpi ^ dqi ist, tigkeit lokale Koordinaten .U; q; p/ einführen, so dass ! ˇ D U
und damit s-grad H D
n X @H i D1
@pi
@qi
n X @H i D1
@qi
i D1
@pi
gilt. Korollar 6.24. Ist ˛ W R ! M Integralkurve des symplektischen Gradienten s-grad H; so gilt in kanonischen Koordinaten @H .p; q/ ; @qi @H .p; q/ : qPi D @pi
pPi D
Der Gradient einer Funktion steht immer senkrecht auf den Niveauflächen der Funktion. Der symplektische Gradient verhält sich hier allerdings ganz anders. Satz 6.25. Ist H eine differenzierbare Funktion auf einer symplektischen Mannigfaltigkeit M; so lässt der Fluss des Vektorfelds s-grad H die Funktion H invariant, d.h. H ist längs der Integralkurven von s-grad H konstant. Beweis. Für jedes ˛ 2 ˝ 1 M ist ˛.I 1 ˛/ D !.I 1 ˛; I 1 ˛/ D 0 : Also ist
dH.s-grad H / D dH.I 1 dH / D 0 :
Ist nun eine Integralkurve, so ergibt die Kettenregel . d= dt/ .H ı / 0 und damit die Behauptung. t u Eine Funktion, die längs der Integralkurven konstant ist, wird auch als Erhaltungsgröße oder Konstante der Bewegung bezeichnet, wenn klar ist, auf welchen Fluss sich das bezieht. Also ist H selbst eine Konstante der Bewegung in Bezug auf den Fluss ihres symplektischen Gradienten. Ebenso wie man sich die Frage stellt, wann ein Vektorfeld ein Potential hat, stellt man auch die Frage, wann – zumindest lokal – ein Vektorfeld ein H AMILTONsches Vektorfeld ist. Definition 6.26. Ein Vektorfeld v auf einer symplektischen Mannigfaltigkeit heißt lokal H AMILTONsch, falls d.I v/ D 0 gilt. Ein H AMILTONsches Vektorfeld ist natürlich lokal H AMILTONsch, denn dI.I 1 dH / D d dH D 0. Wieder ermöglicht das P OINCARÉ-Lemma die lokale Umkehrung dieser Aussage:
D Der H AMILTON formalismus
185
Lemma 6.27. Ist v ein lokal H AMILTONsches Vektorfeld, so gibt es um jedes x 2 M eine Umgebung U sowie eine Funktion H 2 C 1 .U / mit ˇ v ˇU D s-grad H : Beweis. Aufgrund des ˇP OINCARÉ Lemmas gibt es eine Umgebung U sowie H 2 C 1 .U / mit dH D I v ˇU ; also ˇ v ˇU D I 1 dH :
t u Damit lässt sich die Frage beantworten, für welche Vektorfelder die entsprechenden Flussdiffeomorphismen kanonische Transformationen sind: Theorem 6.28. Sei .M; !/ eine symplektische Mannigfaltigkeit und v ein Vektorfeld auf M . Dann sind die Flussdiffeomorphismen ˚t W M ! M zu v genau dann symplektisch, wenn v lokal H AMILTONSCH ist. Insbesondere erhält der Fluss eines H AMILTONschen Vektorfeldes das symplektische Volumen. Beweis. Sei v ein lokal H AMILTONsches Vektorfeld. Dann ist Lv ! D iv d! C div ! D dI v D 0 : Also gilt nach (3.8) und Definition 3.23 für den Fluss zu v ˇ d d ˇˇ ˚t ! D ˚ ! D ˚t Lv ! D 0 dt d ˇD0 t C und somit ˚t ! D ˚0 ! D !; für alle t; für die ˚t definiert ist. Ist umgekehrt ˚t ! D ! für alle t; so ist Lv ! D 0; also div ! D dI v D 0. Die Invarianz des symplektischen Volumens ergibt sich nun aus Satz 6.21. u t Bemerkung: Die Tatsache, dass der Fluss eines H AMILTONschen Vektorfelds das symplektische Volumen erhält, ist von grundlegender Bedeutung für die statistische Mechanik. Hier werden Systeme betrachtet, bei denen die Dimension des Konfigurationsraums K in der Größenordnung der L OSCHMIDTschen Zahl liegt, und es ist in dieser Situation ein hoffnungsloses Unterfangen, die Bahnen einzelner Teilchen verfolgen zu wollen. Stattdessen betrachtet man die Wahrscheinlichkeit dafür, dass der Zustand des Systems im Phasenraum T K in einer gegebenen Region B liegt, sowie die zeitliche Entwicklung dieser Wahrscheinlichkeitsverteilungen. Zum Beipspiel ist diese Wahrscheinlichkeit im thermischen Gleichgewicht bei der Temperatur T > 0 gegeben durch Z P.B/ WD Z 1
eˇH ! n
B
186
6 Koordinatenfreie Formulierungen der klassischen Mechanik
Z
mit Z WD
eˇH ! n ;
wobei H die H AMILTONfunktion ist und ˇ WD 1=kT (k D B OLTZMANNkonstante). Da das System den H AMILTONschen Bewegungsgleichungen folgt, ist seine Dynamik durch den Fluss eines H AMILTONschen Vektorfeldes auf T K gegeben, und Theorem 6.28 zusammen mit Satz 6.25 sorgen also dafür, dass diese Wahrscheinlichkeiten unter der Dynamik invariant bleiben. Anders ausgedrückt: Die Flussdiffeomorphismen ˚t sind in Bezug auf das Wahrscheinlichkeitsmaß P maßtreue Abbildungen, und daher kann man Methoden und Resultate der Ergodentheorie für die statistische Mechanik nutzbar machen (vgl. etwa [26, 62]).
P OISSONklammern In Abschn. 3D haben wir gesehen, dass durch die L IEklammer eine schiefsymmetrische bilineare Abbildung auf dem Raum der Vektorfelder gegeben ist. Eine ähnliche Abbildung ist nun auch auf dem Raum der C 1 Funktionen auf einer symplektischen Mannigfaltigkeit gegeben: Definition 6.29. Ist .M; !/ eine symplektische Mannigfaltigkeit, so heißt die Abbildung C 1 .M / C 1 .M / ! C 1 .M / ; .f; g/ 7! ff; gg mit
ff; gg WD !.I 1 dg ; I 1 df / D df .s-grad g/
die P OISSONklammer. Nach Definition ist also eine Funktion f genau dann konstant entlang des Flusses von s-grad H (also eine Erhaltungsgröße), wenn ff; H g D 0 ist. Satz 6.30. Durch die P OISSONklammer ist eine schiefsymmetrische bilineare Abbildung auf C 1 .M / gegeben. Genauer gilt für alle f1 ; f2 ; f; g 2 C 1 .M / und 2 R a. b.
ff; gg D fg; f g; f f1 C f2 ; gg D ff1 ; gg C ff2 ; gg.
Beweis. a. folgt aus der Schiefsymmetrie von !. b. folgt aus der Linearität des Differentials. t u In kanonischen Koordinaten ist wegen (6.15) ff; gg D df .s-grad g/ n X @f @g @f @g D ; C @pi @qi @qi @pi i D1
(6.16)
D Der H AMILTON formalismus
187
also insbesondere fqi ; qj g D fpi ; pj g D 0 für alle i; j 2 f1; : : :; ng ; fqi ; pj g D 0 für i 6D j ; fqi ; pi g D C1 ; @H fqi ; H g D C @pi
fpi ; H g D
@H : @qi
Die P OISSONklammer zweier Funktionen steht tatsächlich in enger Beziehung zur L IEklammer der entsprechenden H AMILTONschen Vektorfelder. Lemma 6.31. Sind f; g 2 C 1 .M /; so ist Œs-grad f ; s-grad g D s-grad fg; f g :
(6.17)
Beweis. Die Gleichung d! D 0 ist nach (4.15) gleichbedeutend damit, dass für beliebige Vektorfelder u; v; w gilt: u.!.v; w// C v.!.w; u// C w.!.u; v// C!.u; Œv; w/ C !.v; Œw; u/ C !.w; Œu; v/ D 0 : Ist nun v D s-grad g; w D s-grad f; so folgt 0 D uff; gg .s-grad g/u.f / C .s-grad f /u.g/ C!.u; Œs-grad g; s-grad f / dg.Œw; u df .Œu; v/ D uff; gg C .u.s-grad f //.g/ .u.s-grad g//.f / C!.u; Œs-grad g; s-grad f / D uff; gg C !.u; Œs-grad g; s-grad f / ; also s-grad ff; gg D Œs-grad g; s-grad f .
t u
Damit folgt sofort, dass die P OISSONklammer C 1 .M / zu einer L IEalgebra macht: Korollar 6.32. Für die P OISSONklammer gilt die JACOBI-Identität ff; fg; hgg C fg; fh; f gg C fh; ff; ggg D 0 : Den Beweis kann man in lokalen Koordinaten führen, indem man (6.16) benutzt, oder (was eleganter ist) man führt mittels (6.17) die JACOBI-Identität der P OIS SON klammer auf die schon bekannte JACOBI-Identität für die L IE klammer zurück. Die Ausführung ist dem Leser als Übungsaufgabe überlassen.
188
6 Koordinatenfreie Formulierungen der klassischen Mechanik
E Der L AGRANGEformalismus und die L EGENDREtransformation Im L AGRANGEformalismus wird das physikalische System durch eine Funktion L 2 C 1 .TM / beschrieben. In Abschn. B wurden schon die Bewegungsgleichungen aus dem Prinzip der kleinsten Wirkung hergeleitet. Hier wollen wir die Lösungen dieser Gleichung wieder als Integralkurven eines Vektorfeldes beschreiben und über die L EGENDREtransformation den Zusammenhang zum H AMIL TON formalismus herstellen. Mittels des Faserdifferentials von L können wir die symplektische Struktur von T M auf TM zurück holen: Definitionen 6.33. Sei die kanonische 1-Form auf T M und L 2 C 1 .TM /. a. Die 1-Form
L WD . d0 L/ 2 ˝ 1 .TM /
heißt L AGRANGE 1-Form. b. Die 2-Form !L D dL heißt L AGRANGE 2-Form. Die L AGRANGE-2-Form ist offenbar geschlossen. Ist L regulär, so ist sie auch nichtentartet, da sie ja von der kanonischen symplektischen Form auf T M induziert ist. Für v 2 TM und w 2 Tv .TM / ist .L /v .w/ D . d0 L/.v/ . d. d0 L/v .w// D . d0 L/.v/. d. ı d0 L/v .w//
(6.18)
0
D . d L/.v/. dv .w// ; wobei einmal die Projektion in T M und einmal in TM bedeutet. Damit können L und !L leicht in lokalen Koordinaten berechnet werden. Lemma 6.34. Bezeichnet man die Koordinaten auf U TM mit .q1 ; : : :; qn ; qP1 ; : : :; qPn /; so gilt X @L ˇ a. L ˇU D dqi ; @qPi i X ˇ @2 L @2 L ˇ dqj ^ dqi C dqPj ^ dqi . b. !L U D @qPi @qj @qPi @qPj i;j
Beweis. a. liest man sofort von (6.18) ab, und b. folgt dann aus der Formel für die t u C ARTANsche Ableitung. Beispiel: Ist L.v/ D
1 mjvj2 U..v// ; 2
E Der L AGRANGEformalismus und die L EGENDREtransformation
189
auf einer R IEMANNschen Mannigfaltigkeit .M; g/; so ist .L /v .w/ D mg.v; dv .w// : In lokalen Koordinaten ist L also m
X
qPj gij dqi :
i;j
Die L AGRANGE-2-Form ist damit X @ X m gi s qPs dqj ^ dqi C m gij dqPj ^ dqi : @qj i;j;s
i;j
Ist eine L AGRANGEfunktion gegeben, so kann man auch von der Energie sprechen: Definitionen 6.35. Sei L W TM ! R eine gegebene L AGRANGEfunktion. Dann heißt A 2 C 1 .TM /; A.v/ WD d0 L.v/.v/ die Wirkung von L und E D A L die Energie. In lokalen Koordinaten ist X @L ˇ A W TM ˇU ! R; .q; q/ P 7! qP i ; @qPi X @L ˇ E W TM ˇU ! R; .q; q/ P 7! qP i L.q; q/ P : @qPi Beispiel: Sind M und L wie im vorigen Beispiel, so ist A.v/ D mjvj2 m E D U..v// C jvj2 ; 2 wobei offensichtlich der erste Term als potentielle, der zweite als kinetische Energie zu interpretieren ist.
und
Definition 6.36. Sei L 2 C 1 .TM / und E D A L die Energiefunktion zu L. Ein Vektorfeld XE 2 .T TM / heißt ein L AGRANGE Vektorfeld, falls iXE !L D dE gilt. Ist L hyperreguläre L AGRANGEfunktion, so ist also XE D s-grad E : Wir werden jetzt das L AGRANGE Vektorfeld im Fall einer regulären L AGRAN lokalen Koordinaten berechnen.
GE funktion in
190
6 Koordinatenfreie Formulierungen der klassischen Mechanik
Ein Vektorfeld X auf TM wird in lokalen Koordinaten durch eine Abbildung U Rn ! .U Rn / .Rn Rn / beschrieben, also X.q; q/ P DW .q; q; P x1 .q; q/; P x2 .q; q// P ; und damit gilt lokal iX !L D
X
i dqi C
X
i
mit i D
i dqPi
i
X @2 L X @2 L j @2 L x1j C x ; @qPi @qj @qPj @qi @qPi @qPj 2 j
i D C
(6.19)
j
X @2 L xj : @qPi @qPj 1
(6.20)
j
Lokal ist E W T U ! R durch n X @L .q; q/ P qPi L.q; q/ P @qPi i D1
gegeben. Damit ist dE D
n X @E i D1
@E dqi C dqPi @qi @qPi
DW Eq dq C EqP dqP mit n X @2 L @L @E D qPj ; @qi @qPj @qi @qi
(6.21)
j D1
n X @E @2 L D qPj : @qPi @qPi @qPj
(6.22)
j D1
Ist D
@2 L @qP i @qP j
dass XE durch
i;j
invertierbar, so folgt aus dE D iXE !L mit (6.20) und (6.22), .q; q; P q; P x.q; q// P
gegeben ist. Aus (6.21) und (6.19) folgt dann @L B qP x.q; q/ P D 1 @qi i
(6.23)
(6.24)
E Der L AGRANGEformalismus und die L EGENDREtransformation
wobei
B WD
@2 L @qj @qPi
191
i;j D1;:::;n
ist. Beispiel: Wir betrachten
1 mg.v; v/ U..v// : 2 Dann ist in lokalen Koordinaten das Vektorfeld s-grad E durch .q; q; P q; P x/ mit L.v/ D
x j .q; q/ P D
n
1 X ij @U X j s r g rs qP qP m @qi r;s i D1
gegeben, wie in denP Übungen nachgerechnet wird. Dabei sind rsj die C HRIS TOFFEL symbole und g ij gjk D ıi k . j
Der symplektische Gradient von E ist also die Summe zweier Vektorfelder X1 und X2 ; wobei X1 .v/ 2 Tv .TM / der Vektor ist, der durch v C t m1 grad U repräsentiert wird, und X2 das Vektorfeld, dessen Integralkurven gerade Geschwindigkeitskurven von Geodätischen sind. Die Integralkurven ˛ von XE sind stets Kurven in TM; längs denen E konstant ist. Es stellt sich nun die Frage, ob eine Integralkurve ˛ von XE stets eine „Geschwindigkeitskurve“ ist, ob es also eine Kurve W I ! M mit ˛ D P gibt, also R .t/ D X..t// P : (6.25) Vektorfelder auf TM; deren Integralkurven diese Eigenschaft haben, werden jetzt eingeführt: Definitionen 6.37. a. Eine Differentialgleichung zweiter Ordnung auf einer Mannigfaltigkeit M ist ein Vektorfeld X auf TM; so dass dv .X.v// D v :
(6.26)
Dabei ist W TM ! M die kanonische Projektion. b. Ist X eine Differentialgleichung zweiter Ordnung auf M; so heißt W I ! M eine Lösungskurve von X; wenn P Integralkurve von X ist. Der folgende Satz zeigt, dass Lösungskurven von Gleichungen zweiter Ordnung tatsächlich die Eigenschaft (6.25) haben. Satz 6.38. Sei X ein Vektorfeld auf TM . Dann ist X genau dann Differentialgleichung zweiter Ordnung auf M; wenn für jede Integralkurve ˛ W I ! TM von X gilt (6.27) . ı ˛/0 D ˛ :
192
6 Koordinatenfreie Formulierungen der klassischen Mechanik
Beweis. Ist X Vektorfeld auf TM; ˛ Integralkurve von X; so gilt . ı ˛/0 D ˛ ” d˛.t / .˛.t// P D ˛.t/ ” d˛.t / .X.˛.t// D ˛.t/ : Da es durch jeden Punkt von TM eine Integralkurve gibt, folgt hieraus die Behauptung. t u Ob ein Vektorfeld auf TM eine Differentialgleichung zweiter Ordnung ist, ist in lokalen Koordinaten leicht zu entscheiden. Ist U M ein Kartengebiet, so ist T U Š U Rn TM offen und T T U Š .U Rn / .Rn Rn /. Nun gilt: Lemma 6.39. Ein Vektorfeld X auf TM sei in lokalen Koordinaten durch X.q; v/ D .q; v; w1 .q; v/; w2 .q; v// gegeben. Dann ist X genau dann Differentialgleichung zweiter Ordnung auf U; wenn w1 .q; v/ D v. Beweis. In lokalen Koordinaten ist W T U ! U durch .q; v/ 7! q gegeben, also d.q;v/ W T.q;v/ T U D f.q; v/g Rn Rn ! Tq U D fqg Rn ..q; v/; .w1 ; w2 // 7! .q; w1 / ; also d.q;v/ ..q; v/; .w1 ; w2 // D .q; v/ ” w1 D v.
t u
Korollar 6.40. Sei X eine Differentialgleichung zweiter Ordnung auf M . Dann ist genau dann Integralkurve von X; wenn in lokalen Koordinaten gilt X.q; q/ P D .q; q; P q; P v.q; q// P und Ri .t/ D vi ..t/; P .t// : Die letzte Gleichung stellt offenbar ein System von n Differentialgleichungen zweiter Ordnung im üblichen Sinn dar, woraus die Terminologie sich erklärt. Aus (6.23) folgt damit sofort: Satz 6.41. a. Ist L eine reguläre L AGRANGEfunktion, so ist das L AGRANGE-Vektorfeld XE eine Differentialgleichung zweiter Ordnung. b. Ist W I ! M Lösungskurve von XE ; so ist Lösung der E ULERL AGRANGE-Gleichung, d. h. in lokalen Koordinaten ist @L d @L .q; q/ P .q; q/ P D0: dt @qPi @qi
E Der L AGRANGEformalismus und die L EGENDREtransformation
193
Beweis. Nach (6.24) ist ˛ W I ! U genau dann Lösungskurve von XE ; wenn ! @L.˛; ˛/ P 1 B ˛P ˛R D @qi i D1;:::;n gilt. Nach Multiplikation beider Seiten mit ist dies gleichbedeutend zu n 2 X @L @ L.˛; ˛/ P P @2 L.˛; ˛/ .˛; ˛/ P D ˛R j C ˛P j @qi @qPi @qPj @qj @qPi j D1
D
d @L .˛; ˛/ P : dt @qPi t u
Im Fall dass L.v/ D 12 mg.v; v/ U..v// ist, sind die Lösungskurven also lokal Lösungen der Differentialgleichungen qR j C
X r;s
rsj qP r qP s D
1 X ij @U g m @qi
j D 1; : : :; n :
i
Im Fall U D 0 sind das die Gleichungen für die geodätischen Kurven. Zum Abschluss stellen wir nun noch den Zusammenhang zum H AMILTONschen Formalismus her. Satz und Definition 6.42. Sei M eine Mannigfaltigkeit und L 2 C 1 .TM / eine hyperreguläre L AGRANGEfunktion. Die Funktion H D E ı. d0 L/1 auf T M heißt dann die L EGENDREtransformierte von L. Für sie ist . d0 L/ s-grad E D s-grad H ; wobei der symplektische Gradient in T M bezüglich der kanonischen 2-Form ! 2 ˝ 2 .T M / und der in TM bezüglich der 2-Form !L D . d0 L/ ! 2 ˝ 2 .TM / gebildet wurde. Beweis. Es ist
dE D is-grad E . d0 L/ ! ;
also i. d. d0 L/.s-grad E // ! D dE ı d.. d0 L/1 / D dH ; also s-grad H D d. d0 L/.s-grad E/.
t u
194
6 Koordinatenfreie Formulierungen der klassischen Mechanik
Korollar 6.43. Sei L hyperreguläre L AGRANGEfunktion mit Energie E und H D E ı . d0 L/1 ihre L EGENDREtransformierte. Sei W I ! M Integralkurve des L AGRANGEschen Vektorfelds XE und ˇ W I ! T M Integralkurve von s-grad H . Dann ist .t/ D ı ˇ.t/ :
Aufgaben zu Kap. 6 6.1. Sei .M; g/ eine R IEMANNsche Mannigfaltigkeit. L 2 C 1 .TM / durch L.v/ D
1 g.v; v/ 2
gegeben. Sei E die dadurch definierte Energie. Zeigen Sie: a. Die L AGRANGE-2-Form ist in lokalen Koordinaten durch X X k .gi k js C gjk iks / dqi ^ dqj C gij dqPs ^ dqi i;j;s
i;j
gegeben. Hinweis: Benutzen Sie dazu lokale Koordinaten, insbesondere auch Formel (5.5) zur Berechnung der C HRISTOFFEL-Symbole. b. Die Flusslinien von s-grad E sind genau die Geodätischen auf M . Hinweis: Formel (5.10). 6.2. Sei H 2 C 1 .M / und ˚ der Fluss von s-grad H . Zeigen Sie: d f ı ˚t D ff; H g dt 6.3. Sei f W M ! N ein Diffeomorphismus zwischen symplektischen Mannigfaltigkeiten. Zeigen Sie: Für f ist äquivalent (i) (ii) (iii)
f ist kanonische Transformation. Für alle H 2 C 1 .M / ist df 1 .s-grad H / D s-grad .H ı f /. Für alle g; h 2 C 1 .M / ist ff g; f hg D f fg; hg.
6.4. Sei .M; !/ symplektische Mannigfaltigkeit, X D s-grad f D s-grad g. Zeigen Sie: f g D konst: 6.5. Sei .M; !/ eine symplektische Mannigfaltigkeit und G eine L IEgruppe (s. Aufgabe 1.10). Sei ferner eine G-Aktion auf M gegeben, d. h. eine differenzierbare Abbildung m W G M ! M mit m.1; x/ D x und m.g1 ; m.g2 ; x// D m.g1 g2 ; x/. Zu X 2 T1 G ist dann ein Vektorfeld XQ 2 TM durch XQ .p/ WD d.Rp /1 .X / mit Rp W G ! M; g 7! gp definiert. Sei ! D d und 2 ˝ 1 M G-invariant, also Lg D für Lg W M ! M; x 7! gx für alle g 2 G. Sei '.X / 2 C 1 .M / Q durch .'.X //.p/ WD ..X//.p/ gegeben. Zeigen Sie:
Aufgaben
195
a. s-grad .'.X // D XQ . b. '.ŒX; Y / D f'.Y /; '.X /g. c. Ist H 2 C 1 .M / G-invariant, d. h. Lg H D H für alle g 2 G; so ist fH; '.X /g D 0; und damit ist '.X / eine Konstante der Bewegung. 6.6. Sei M D T K; wobei der Konfigurationsraum K eine n-dimensionale Mannigfaltigkeit ist, und sei G eine L IEgruppe, die aus Diffeomorphismen g W K ! K besteht. Zeigen Sie: a. Mit den Bezeichnungen aus Satz 6.22 ist durch
e
m.g; ˛/ WD g 1 .˛/ ;
g 2 G; ˛ 2 T K
eine G-Aktion auf M definiert, die in Bezug auf die kanonische symplektische Form die Voraussetzungen aus der vorigen Aufgabe erfüllt. Zu X 2 T1 G ist also eine Funktion '.X / definiert, die die dort gezeigten Eigenschaften hat. b. Ist H eine G-invariante H AMILTONfunktion auf M (d. h. H ı gQ D H für alle g 2 G), so definiert jedes X 2 T1 G eine Konstante der Bewegung für den Fluss des symplektischen Gradienten von H . 6.7. Wir verwenden die Bezeichnungen aus den letzten beiden Aufgaben. Sei aber K nun speziell die 3N -dimensionale Mannigfaltigkeit K WD f.q1 ; : : :; qN / 2 R3N j qj ¤ qk für j ¤ kg ; und seien .q1 ; : : :; qN ; p1 ; : : :; pN / die kartesischen Koordinaten in M D T K D K .R3N / ; wobei qk D .xk ; yk ; zk / und pk D . k ; k ; k / gesetzt wurde. Ferner sei G die L IEgruppe der linearen Transformationen von K; die durch die Blockdiagonalmatrizen 1 0 R 0 0 B0 R 0C C B mit R 2 SO.3/ RN D B : : : :: C @ :: : :A 0 0 R gegeben sind. Bekanntlich kann man TE SO.3/ mit dem Vektorraum so.3/ WD fA 2 R33 j AT D Ag identifizieren (vgl. Beispiel in 1B). Daher kann man T1 G mit dem Raum der .3N 3N /-Blockdiagonalmatrizen A.N / identifizieren, die einen sich wiederholenden Block A 2 so.3/ in der Diagonale haben. Für jedes A 2 so.3/ (also jede „infinitesimale Drehung“) ist daher eine Funktion LA WD '.A.N / / wie in Aufgabe 6.6 definiert.
196
6 Koordinatenfreie Formulierungen der klassischen Mechanik
a. Zeigen Sie: Eine Funktion H 2 C 1 .T K/ ist genau dann G-invariant, wenn H.Rq1 ; : : :; RqN ; Rp1 ; : : :; RpN / D H.q1 ; : : :; qN ; p1 ; : : :; pN /
8 R 2 SO.3/ :
(drehinvariante H AMILTONfunktion) b. Beweisen Sie, dass für alle A 2 so.3/ gilt: LA .q1 ; : : :; qN ; p1 ; : : :; pN / D
N X
hqk jApk i :
kD1
c. Fassen Sie K als den Konfigurationsraum für ein System von N Massenpunkten auf und überzeugen Sie sich an Hand von Beispielen, dass LA D L eA ist. Dabei ist L der Gesamtdrehimpuls des Systems und eA ein Einheitsvektor, der die gemeinsame Achse der Drehungen RA .t/ WD exp tA aufspannt.
Kapitel 7
BANACH- und H ILBERTräume
In den ersten drei Kapiteln dieses Teils werden lineare Operatoren im Vordergrund stehen, also lineare Abbildungen zwischen reellen oder komplexen Vektorräumen, die im Allgemeinen unendliche Dimension besitzen. Konkret handelt es sich dabei zumeist um Vektorräume, deren Elemente reelle oder komplexe Funktionen auf einem gemeinsamen Definitionsbereich sind (Funktionenräume), und die betrachteten Operatoren entstehen durch Anwendung von gängigen Prozeduren aus der Analysis auf diese Funktionen: Differenzieren, Integrieren, Multiplizieren mit einer festen Funktion, Einsetzen einer Koordinatentransformation usw. Die Bedeutung solcher Operatoren für die Physik rührt in erster Linie von den folgenden beiden Tatsachen her: Erstens sind sie das fundamentale begriffliche und rechnerische Hilfsmittel für die mathematische Formulierung der Quantenmechanik, und zweitens liefern sie die wichtigsten und kraftvollsten Werkzeuge für die tiefer gehende Behandlung von linearen partiellen Differentialgleichungen, wie sie überall in der Physik vorkommen. Es ist daher für den angehenden theoretischen Physiker wichtig, sich ein möglichst gründliches Verständnis für die Natur solcher Operatoren und möglichst weitgehende Fertigkeiten im Umgang mit ihnen anzueignen. Dabei handelt es sich nicht nur um rein algebraische Manipulationen, sondern auch um unterschiedliche Arten von Grenzübergängen. Daher ist auf den Vektorräumen, zwischen denen die Operatoren wirken, praktisch immer ein Konvergenzbegriff vorgegeben, der zumeist durch eine Norm gestiftet wird (vgl. Abschn. A). Diese Situation müssen wir also zuerst diskutieren, obwohl die Vektorräume selbst eigentlich nicht im Zentrum unseres Interesses stehen, sondern lediglich als Definitionsund Wertebereiche für die Operatoren dienen. So gesehen, hat dieses Kapitel vorbereitenden Charakter: Wir definieren BANACH- und H ILBERTräume, diskutieren die wichtigsten Beispiele und machen in den Abschn. B–D einige theoretische Aussagen, die später immer wieder benötigt werden. Im Abschn. E schließlich besprechen wir das sog. Tensorprodukt von H ILBERTRÄUMEN. Tensorprodukte von H IL BERT räumen und linearen Operatoren werden nämlich in der Quantenmechanik zur Beschreibung von zusammengesetzten Systemen benötigt. Die eigentliche Diskussion linearer Operatoren wird dann in Kap. 8 beginnen.
K.-H. Goldhorn, H.-P. Heinz, M. Kraus, Moderne mathematische Methoden der Physik DOI 10.1007/978-3-540-88544-3, © Springer 2009
199
200
7 BANACH - und H ILBERTräume
A Definitionen und Beispiele Die folgenden Definitionen sind für Sie höchstwahrscheinlich eine Wiederholung (vgl. etwa [36], Kap. 6): Definitionen 7.1. Sei V ein K-Vektorraum. Eine Abbildung V V 3 .x; y/ 7! hx j yi 2 K heißt ein Skalarprodukt und V ein Prähilbertraum (PHR), wenn gilt a.
hx j ˛yi D ˛ hx j yi ;
b.
hx j y C zi D hx j yi C hx j zi ;
c.
hy j xi D hx j yi ;
d.
hx j xi > 0 für x 6D 0
für alle x; y; z 2 V; ˛ 2 K. Im Fall K D R bedeutet Forderung c. die Symmetrie hy j xi D hx j yi. Satz 7.2. Sei V ein Prähilbertraum und sei p kxk WD hx j xi
für x 2 V .
(7.1)
Dann gilt a. die S CHWARZsche Ungleichung jhx j yij kxk kyk
für x; y 2 V .
(7.2)
b. V ist ein normierter linearer Raum (NLR) und k k ist eine Norm auf V; d. h. für beliebige x; y 2 V; ˛ 2 K gilt (N1)
k˛ xk D j˛j kxk;
(N2)
kx C yk kxk C kyk;
(N3)
kxk > 0
für x 6D 0.
c. die Parallelogramm-Gleichung kx C yk2 C kx yk2 D 2kxk2 C 2kyk2 ;
x; y 2 V :
(7.3)
Beweis. Wir setzen die Teile a. und b. als bekannt voraus. Teil c. rechnet man nach, indem man die Normquadrate auf der linken Seite ausdistribuiert und erkennt, dass die gemischten Terme einander wegheben. t u
A Definitionen und Beispiele
201
Aus Teil b. geht auch hervor, was die allgemeine Definition eines normierten linearen Raumes ist: Ein NLR ist ein (reeller oder komplexer) Vektorraum V; auf dem eine Norm gegeben ist, d. h. eine reelle Funktion x 7! kxk; für die (N1)– (N3) gelten. Die Parallelogrammgleichung hingegen gilt für allgemeinere normierte lineare Räume nicht – sie ist charakteristisch für Normen, die von einem Skalarprodukt herrühren. Definitionen 7.3. Sei V ein NLR und .xn / eine Folge in V . a. .xn / heißt stark konvergent (oder einfach konvergent) gegen x 2 V; wenn lim kxn xk D 0 :
n!1
(7.4)
b. .xn / heißt eine starke C AUCHYfolge (oder einfach eine C AUCHYfolge), wenn es zu jedem " > 0 ein n0 2 N gibt, so dass kxn xm k < "
für alle n; m n0 :
(7.5)
c. V heißt vollständig, wenn jede starke C AUCHYfolge in V stark konvergiert. Ein vollständiger NLR heißt BANACHraum. Ein vollständiger PHR heißt H ILBERTraum. Für die Physik sind ohne Zweifel die H ILBERTräume der bei weitem wichtigste Typus von solchen abstrakten Räumen. Doch treten im Zusammenhang mit H IL BERT räumen immer wieder auch andere Arten von normierten linearen Räumen auf, so dass man diese nicht völlig ignorieren kann. Für eine Teilmenge A eines normierten linearen Raumes V bezeichnen wir, wie üblich, mit AN (Abschluss von A) die Menge aller Punkte von V; die sich als (starker) Grenzwert einer in A verlaufenden Folge darstellen lassen. Es ist also x 2 AN genau dann, wenn x D lim an ist für eine Folge .an / A. Das ist äquivalent zu der n!1
Forderung, dass es zu jedem " > 0 ein a 2 A mit kx ak < " gibt. Mit anderen Worten, der Abschluss AN besteht aus denjenigen x 2 V; die sich beliebig genau durch Elemente von A approximieren lassen. (Mehr darüber z. B. in [36], Kap. 13 und 14.) Damit können wir definieren: Definitionen 7.4. Sei V ein NLR. a. Eine Teilmenge S V heißt dicht in V; wenn S D V; wenn sich also jedes Element x 2 V beliebig genau durch Elemente von S approximieren lässt. b. Enthält V eine (endliche oder unendliche) Folge B D fb1 ; b2 ; : : :g; deren lineare Hülle LH.B/ dicht ist, so heißt V separabel. c. Eine Teilmenge K V heißt kompakt, wenn jede Folge .xn / K eine konvergente Teilfolge xnj ! x0 2 K enthält. Bemerkung: In der mathematischen Literatur wird die Separabilität eines NLR häufig durch die Forderung definiert, dass er eine abzählbare dichte Teilmenge ent-
202
7 BANACH - und H ILBERTräume
halten soll. Dies ist aber zu unserer Definition äquivalent, wie man sich (durch Betrachtung von Linearkombinationen mit rationalen Koeffizienten) leicht überlegen kann. Am wichtigsten ist die Separabilität im Zusammenhang mit Prähilberträumen. Wie üblich, bezeichnen wir eine abzählbare Teilmenge B D fe1 ; e2 ; : : :g eines Prähilbertraums H als Orthonormalsystem, wenn hej j ek i D ıjk ;
j; k D 1; 2; : : : ;
(7.6)
und in Bezug auf ein gegebenes Orthonormalsystem hat dann jedes x 2 H die (formale) F OURIERreihe 1 X x hek j xiek : (7.7) kD1
Das System B wird als Orthonormalbasis von H bezeichnet, wenn jedes x 2 H die Summe seiner F OURIERreihe ist, d. h. wenn für alle x 2 H xD
1 X
hek j xiek D lim
N !1
kD1
N X
hek j xiek
(7.8)
kD1
im Sinne der starken Konvergenz der Partialsummen. All dies sollte aus der Theorie der F OURIERreihen bekannt sein (vgl. z. B. [36], Kap. 29). Nun gilt: Satz 7.5. Ein unendlichdimensionaler PHR ist genau dann separabel, wenn er eine abzählbare Orthonormalbasis besitzt. Beweis. Eine abzählbare Orthonormalbasis ist offensichtlich eine Folge, die die für die Separabilität geforderte Bedingung erfüllt. Sei umgekehrt fb1 ; b2 ; : : :g eine Folge in dem gegebenen PHR H; deren lineare Hülle D dicht ist. Wir streichen aus dieser Folge jedes bm ; das in LH.b1 ; : : : ; bm1 / enthalten ist, und erhalten so eine Teilfolge, die aus linear unabhängigen Vektoren besteht und immer noch die lineare Hülle D hat. Auf diese Teilfolge (die wir wieder mit fb1 ; b2 ; : : :g bezeichnen, indem wir neu nummerieren) wenden wir rekursiv das bekannte G RAM -S CHMIDT sche Orthogonalisierungsverfahren an ([36], Kap. 6). Das ergibt ein Orthonormalsystem fe1 ; e2 ; : : :g mit der Eigenschaft LH.e1 ; : : : ; eN / D LH.b1 ; : : : ; bN /
für alle N 1
und insbesondere LH.e1 ; e2 ; : : :/ D D. Zu jedem x 2 H und jedem " > 0 gibt es dann N 1 sowie Skalare 1 ; : : : ; N so, dass N X k e k < " x kD1
ist. Wie man aus der Theorie der F OURIERreihen weiß, wird der Ausdruck auf der linken Seite (bei festem N ) aber minimal, wenn man für die k gerade die
A Definitionen und Beispiele
203
F OURIER koeffizienten k D hek j xi wählt. Also ist erst recht N X hek j xiek < " : x kD1
Somit gilt (7.8) für unser beliebiges x; d. h. die ek ; k 2 N bilden eine Orthonormalbasis. t u Beispiele 7.6. a. Der BANACHraum C 0 .K/: Sei K Rn eine kompakte Menge (oder allgemeiner irgendein kompakter metrischer Raum), und sei C.K/ C 0 .K/ der K-Vektorraum der stetigen Funktionen f W K ! K. Mit kf k1 WD sup jf .x/j D max jf .x/j x2K
x2K
(7.9)
wird C 0 .K/ zu einem BANACHraum, denn die starke Konvergenz in diesem Raum ist gerade die gleichmäßige Konvergenz auf K; und es ist bekannt, dass eine gleichmäßige C AUCHYfolge von stetigen Funktionen auch gleichmäßig gegen eine stetige Funktion konvergiert ([36], Kap. 14). b. Der Prähilbertraum LQ 2 .Œa; b/: Sei Œa; b R ein kompaktes Intervall und sei LQ 2 .Œa; b/ der K-Vektorraum der stetigen Funktionen ' W Œa; b ! K. Mit dem Skalarprodukt Zb h' j
i WD
'.x/ .x/ dx
(7.10)
a
wird LQ 2 .Œa; b/ zu einem Prähilbertraum, der allerdings nicht vollständig ist. Um zu einem H ILBERTraum zu kommen, benötigt man das L EBESGUE-Integral, wie etwa in [36], Kap. 28, erläutert. Wir wollen die Konstruktion jedoch kurz rekapitulieren: c. Der H ILBERTraum L2 .Œa; b/ Zunächst betrachtet man die Menge L2 .Œa; b/ der messbaren Funktionen f W Œa; b ! K; für die Z N2 .f / WD
b
jf .x/j2 dx < 1
a
ist (quadratsummierbare Funktionen). Wegen jf .x/ C g.x/j2 2jj2 jf .x/j2 C 2jj2 jg.x/j2 (; 2 K) ist L2 .Œa; b/ ein K-Vektorraum, und in Analogie zum vorigen Beispiel sollte N2 .f / das Normquadrat darstellen. Das Normaxiom (N3) ist
204
7 BANACH - und H ILBERTräume
dann aber verletzt, denn wenn f fast überall, jedoch nicht überall verschwindet, so ist N2 .f / D 0. Überhaupt sind alle auftretenden Integrale unempfindlich gegenüber Abänderungen der Funktionen auf einer Menge vom Maß Null. Daher geht man über zu einem Vektorraum L2 .Œa; b/; dessen Elemente durch Funktionen f 2 L2 .Œa; b/ repräsentiert werden, wobei zwei Funktionen f; g 2 L2 .Œa; b/ genau dann ein und dasselbe Element von L2 .Œa; b/ repräsentieren, wenn f .x/ D g.x/ f.ü. Dazu geht man vor wie in Definition 1.23 und Anmerkung 1.24: Für jedes f 2 L2 .Œa; b/ bildet man die Menge Œf aller Funktionen g 2 L2 .Œa; b/; die zu f äquivalent sind in dem Sinne, dass f .x/ D g.x/ f.ü. Diese Menge nennt man die von f repräsentierte Äquivalenzklasse, und diese Äquivalenzklassen sind die Elemente von L2 .Œa; b/. Genau genommen, ist ein Vektor v 2 L2 .Œa; b/ also eine Menge von Funktionen, nämlich der Funktionen, die die Äquivalenzklasse v repräsentieren. In Wirklichkeit stellt sich aber niemand v 2 L2 .Œa; b/ als Menge von Funktionen vor, sondern vielmehr als eine Funktion f; der es nichts ausmacht, auf einer Nullmenge abgeändert zu werden. Nun müssen wir für die Elemente von L2 .Œa; b/ noch Summen, skalare Vielfache und das Skalarprodukt definieren. Dazu repräsentiert man die einzelnen Elemente durch entsprechende Funktionen und setzt: Œf C Œg WD Œf C g ; Œf WD Œf ; Z b hŒf j Œgi WD f .x/g.x/ dx
(7.11) (7.12) (7.13)
a
für f; g 2 L2 .Œa; b/; 2 K. Dies sind sinnvolle Definitionen, da der Übergang zu anderen Repräsentanten für dieselben Äquivalenzklassen auf der rechten Seite nichts Neues liefert: Ist z. B. Œf D Œf1 und Œg D Œg1 ; so bedeutet dies, dass f .x/ D f1 .x/ f.ü. und g.x/ D g1 .x/ f.ü., also auch f .x/ C g.x/ D f1 .x/ C g1 .x/ f.ü. und damit Œf C g D Œf1 C g1 . Noch einfacher sieht man bei (7.12) und (7.13), dass der Wert der rechten Seite nicht von den gewählten Repräsentanten abhängt. Es ist auch eine triviale Übung, nachzurechnen, dass nun alle Axiome für einen PHR erfüllt sind. Insbesondere bedeutet Œf ¤ 0; dass die Menge der Punkte, wo f .x/ nicht verschwindet, positives Maß hat, und dann ist tatsächlich hŒf j Œf i D N2 .f / > 0. Dieser PHR ist tatsächlich vollständig. Das ist der wesentliche Inhalt des Satzes von R IESZ -F ISCHER (vgl. [36], Kap. 28 oder beliebige Lehrbücher der Funktionalanalysis, Integrationstheorie oder höheren Analysis wie etwa [5,44,51,55, 59, 78, 96, 104, 106]). Um den Zusammenhang zum vorhergehenden Beispiel herzustellen, machen wir uns noch Folgendes klar: Ist ' W Œa; b ! K stetig, so ist auf jeden Fall ' 2 L2 .Œa; b/; und seine Äquivalenzklasse Œ' gehört daher zu L2 .Œa; b/. Diese Klasse enthält aber nur einen stetigen Repräsentanten. Sind nämlich '; zwei stetige Funktionen auf Œa; b und gibt es einen Punkt x0 2 Œa; b; wo ' und verschiedene Werte annehmen, so ist '.x/ ¤ .x/ auf einem Intervall der
A Definitionen und Beispiele
205
Form x0 ı; x0 C ıŒ\Œa; b mit ı > 0; und solch ein Intervall hat positives Maß. Es gilt also: ';
stetig, '.x/ D
.x/ f.ü. H) '
:
Somit können wir LQ 2 .Œa; b/ als einen linearen Teilraum von L2 .Œa; b/ auffassen, indem wir für jedes ' 2 LQ 2 .Œa; b/ die Klasse Œ' mit ihrem eindeutig bestimmten stetigen Repräsentanten ' identifizieren. Schließlich wollen wir ab jetzt, wie es allgemein üblich ist, die umständliche Bezeichnung Œf fallenlassen und dafür einfach nur f schreiben. Man spricht auch davon, dass eine „Funktion“ f zu L2 gehört etc. Das ist, genau genommen, zwar nicht ganz korrekt, führt aber nicht zu Problemen, solange man sich immer darüber im klaren ist, dass damit eigentlich die Klasse Œf gemeint ist. d. Die H ILBERTräume L2 .S /: Für jede messbare Teilmenge S Rn – insbesondere also für jede offene und jede abgeschlossene Teilmenge – lässt sich der H ILBERTraum L2 .S / der quadratsummierbaren Funktionen auf S ganz genauso aufbauen wie es eben für den Spezialfall S D Œa; b R1 geschildert wurde. Allerdings wird dabei natürlich das n-dimensionale L EBESGUEsche Maß zu Grunde gelegt. Insbesondere definieren zwei quadratsummierbare Funktionen f; g auf S genau dann ein und dasselbe Element von L2 .S /; wenn die Menge fx 2 S j f .x/ ¤ g.x/g das ndimensionale L EBESGUE-Maß Null hat. Das Skalarprodukt ist gegeben durch Z f .x/g.x/ dn x : (7.14) hf j gi WD S
H ILBERTräume dieses Typs werden häufig in der Quantenmechanik benutzt. Zum Beispiel ist L2 .R3 / der H ILBERTraum der Einteilchen-Wellenfunktionen. Ist S selbst eine Nullmenge, so ist L2 .S / D f0g (wieso?) und daher uninteressant. e. Der BANACHraum l 1 : Mit l 1 bezeichnen wir die Menge aller beschränkten Zahlenfolgen x D .1 ; 2 ; : : :/; y D .1 ; 2 ; : : :/ usw. Mit x C y WD .1 C 1 ; 2 C 2 ; : : :/ ;
(7.15)
˛x WD .˛1 ; ˛2 ; : : :/ ;
(7.16)
kxk1 WD sup jn j
(7.17)
n
wird l 1 zu einem NLR. Wir zeigen, dass l 1 sogar vollständig, d. h. ein BA NACH raum ist. Sei dazu .x m /m2N mit x m D .1m ; 2m ; : : :/ 2 l 1 eine C AUCHYfolge in l 1 ; d. h. zu " > 0 existiert ein m0 2 N; so dass kx m x p k1 D sup jnm np j < " für m; p m0 : n
206
7 BANACH - und H ILBERTräume
Dann gilt für jedes feste n 2 N jnm np j < "
8 m; p > m0 ;
(7.18)
d. h. .nm /m2N ist eine C AUCHYfolge in K. Da K bekanntlich vollständig ist (für Zahlenfolgen gilt das C AUCHYsche Konvergenzkriterium!), haben wir also Grenzwerte 8n 2 N : lim nm DW n 2 K m!1
Setzen wir x WD .1 ; 2 ; : : :/; so folgt aus (7.18) für p ! 1: jnm n j " und daraus
für m m0 ;
(7.19)
jn j jnm0 j C jn nm0 j kx m0 k1 C " :
für alle n und damit x 2 l 1 . Aus (7.19) und (7.17) folgt dann kx m xk1 "
für m m0 ;
d. h. x m ! x in l 1 ; was die Vollständigkeit beweist. f. Der H ILBERTraum l 2 : Mit l 2 bezeichnen wir die Menge aller Folgen x D .n /; für die 1 X
jn j2 < 1 :
t u
(7.20)
nD1
Diese wird mit (7.15), (7.16) und hx j yi WD
1 X
n n
(7.21)
nD1
zu einem Prähilbertraum. l 2 ist sogar ein H ILBERTraum, wobei die Vollständigkeit ähnlich wie für l 1 bewiesen wird. Die Norm von l 2 ist nach (7.1) gegeben durch !1=2 1 X 2 jn j : (7.22) kxk2 D nD1 2
l ist separabel, denn man überlegt sich leicht (Übung!), dass die Menge der endlichen Folgen x D .1 ; : : : ; n ; 0; : : :/ ; k 2 K dicht in l 2 liegt. Diese Menge ist aber die lineare Hülle der Folge der „Einheitsvektoren“ e1 WD .1; 0; 0; 0; : : :/ ; e2 WD .0; 1; 0; 0; : : :/ ;
A Definitionen und Beispiele
207
e3 WD .0; 0; 1; 0; : : :/ ; :: : Auch bei Funktionenräumen lässt sich häufig Separabilität nachweisen: Satz 7.7. Die Räume C.K/ und L2 .S / aus 7.6 sind separabel. Beweis. Wir beweisen das nur für K D S D Œa; b R und verweisen für den allgemeinen Fall auf Lehrbücher der Funktionalanalysis. Aus der Theorie der F OURIERreihen ist bekannt (vgl. etwa [36], Kap. 29), dass jede stetige Funktion auf Œa; b gleichmäßig durch Linearkombinationen der Funktionen 2 k.x a/ '2k .x/ WD cos ba
und '2kC1 .x/ WD sin
2 k.x a/ ba
approximiert werden kann (k 2 N0 ). Die Folge .'k / leistet also für V D C 0 .Œa; b/ das in der Definition der Separabilität Geforderte. – Ebenso bekannt ist es, dass jedes f 2 L2 .Œa; b/ in Bezug auf die L2 -Norm Summe seiner F OURIERreihe ist, d. h. es lässt sich im quadratischen Mittel beliebig genau durch die Partialsummen seiner F OURIERreihe approximieren. Daher ist die lineare Hülle der abzählbaren t u Menge f'k j k 2 N0 g dicht in L2 .Œa; b/. Bemerkung: l 1 ist nicht separabel, d. h. keine abzählbare Menge liegt dicht in l . Um dies einzusehen, betrachten wir die Menge T der Folgen 1
y D .1 ; 2 ; : : :/
mit j 2 f0; 1g :
Für zwei verschiedene Elemente x; y 2 T ist dann kx yk1 D 1 ; und daher haben die Kugeln U.x/ WD fz 2 l 1 j kz xk1 < 1=2g; x 2 T keine gemeinsamen Punkte. Hätte l 1 nun eine abzählbare dichte Teilmenge S D fsn j n 2 Ng; so könnten wir auch T als Folge schreiben. Für jedes x 2 T enthält nämlich die offene Kugel U.x/ ein Element von S; weil S dicht ist. Wir wählen solch ein Element sn 2 S \ U.x/ und erteilen x die Nummer n. Zwei verschiedene Elemente x; y 2 T bekommen auf diese Weise stets verschiedene Nummern, da die Kugeln U.x/; U.y/ disjunkt sind. Damit ist T als abzählbar erwiesen. Andererseits können wir jedem y 2 T die reelle Zahl yO WD
1 X k 2 Œ0; 1 2k
kD1
für y D .1 ; 2 ; : : :/
(7.23)
208
7 BANACH - und H ILBERTräume
zuordnen. Da jedes ˛ 2 Œ0; 1 eine Dualdarstellung ˛D
1 X ˛m 2m mD1
mit ˛m 2 f0; 1g
hat, hätten wir damit auch das Intervall Œ0; 1 als abzählbar erwiesen. Aber dieses Intervall ist bekanntlich überabzählbar. t u
Weitere Beispiele von BANACHräumen. Die im Folgenden eingeführten Räume werden im weiteren Verlauf des Buches kaum oder gar nicht benötigt. Sie dienen hauptsächlich zur Abrundung des Bildes. a. Die Räume Lp .S /: Sei p 1 eine reelle Zahl und S Rn eine messbare Teilmenge. Für messbare Funktionen f W S ! K definieren wir Z Np .f / WD jf .x/jp dn x ; (7.24) S
wobei der Wert C1 zugelassen ist. Für diese Größen gilt die sog. M INKOWSKIsche Ungleichung Np .f C g/1=p Np .f /1=p C Np .g/1=p :
(7.25)
Ist Np .f / < 1; so nennen wir f p-summierbar. Die M INKOWSKIsche Ungleichung zeigt nun, dass die Menge Lp .S / der p-summierbaren Funktionen f W S ! K einen K-Vektorraum bildet. Dabei ist Np .f / D 0 ” f .x/ D 0 f.ü. Deshalb gehen wir wieder über zu den Äquivalenzklassen Œf ; wobei zwei Funktionen genau dann dieselbe Klasse repräsentieren, wenn sie fast überall übereinstimmen. Die Menge dieser Äquivalenzklassen (für f 2 Lp .S /) ist der Raum Lp .S /. Man definiert Summen und skalare Vielfache wieder durch (7.11), (7.12), und durch kf kp WD Np .f /1=p
(7.26)
führt man auf dem so entstandenen Vektorraum eine Norm ein. Es ist nicht schwer, die Gültigkeit der Normaxiome nachzuprüfen – insbesondere ist die Dreiecksungleichung gerade die M INKOWSKIsche Ungleichung. Eine entsprechende Version des Satzes von R IESZ -F ISCHER besagt, dass alle diese Räume vollständig sind, und man kann auch beweisen, dass sie separabel sind (s. u. Satz 10.39). Für p D 1 ergibt sich offenbar der aus der Integrationstheorie bekannte Raum L1 .S / der über S L EBESGUE-integrierbaren Funktio-
A Definitionen und Beispiele
209
nen, und für p D 2 haben wir wieder den aus 7.6d. bekannten H ILBERTraum. Bemerkung: Die M INKOWSKIsche Ungleichung ist für p D 1 trivial und wird für p > 1 aus der berühmten H ÖLDERschen Ungleichung Z jf .x/g.x/j dn x Np .f /1=p Nq .g/1=q ; für q WD p=.p 1/ (7.27) S
hergeleitet. Beweise für beide Ungleichungen finden sich in der in 7.6c. angegebenen Literatur. Für p D 2 reduziert sich die H ÖLDERsche Ungleichung offenbar auf die S CHWARZsche Ungleichung, die dem durch (7.14) definierten Skalarprodukt entspricht. b. Der Raum L1 .S /: Wieder sei S Rn messbar, und f W S ! K sei eine messbare Funktion. Eine reelle Zahl C heißt eine wesentliche Schranke für f; wenn jf .x/j C
f.ü.
Die Funktion f heißt wesentlich beschränkt, wenn sie eine wesentliche Schranke besitzt.1 Wie man sich leicht überlegt, gibt es für eine wesentlich beschränkte Funktion f stets die kleinste wesentliche Schranke (hier muss man zur Kontrolle der Ausnahmemengen beachten, dass die Vereinigung von abzählbar vielen Nullmengen wieder eine Nullmenge ist!), und diese bezeichnet man als das wesentliche Supremum von jf j und schreibt dafür N1 .f / ess sup jf .x/j :
(7.28)
x2S
Die Menge L1 .S / aller wesentlich beschränkten messbaren Funktionen f W S ! K bildet offensichtlich einen K-Vektorraum, und wenn wir wieder zu den bekannten Äquivalenzklassen Œf übergehen, so erhalten wir den NLR L1 .S / mit der Norm (7.29) kf k1 kŒf k1 WD N1 .f / : Auch dieser Raum ist vollständig, und der Beweis hierfür ist nur eine Variante des obigen Beweises für l 1 (Übung!). Jedoch ist L1 .S / nicht separabel, wenn S positives Maß hat. c. Die Räume l p : Die Räume l p ; p 1 sind für Reihen das, was die Lp .S / für Integrale sind. Wir betrachten also Zahlenfolgen x D .1 ; 2 ; : : :/; y D .1 ; 2 ; : : :/ usw. und setzen 1 X Np .x/ WD jk jp : (7.30) kD1 1
Eigentlich müsste es „im Wesentlichen beschränkt“ heißen – zumindest würde das besser wiedergeben, was gemeint ist. Die grammatisch fehlerhafte Ausdrucksweise „wesentlich beschränkt“ hat sich aber trotzdem durchgesetzt.
210
7 BANACH - und H ILBERTräume
(Reihen mit nichtnegativen Gliedern wird dabei im Falle ihrer Divergenz grundsätzlich der Wert C1 zugeschrieben.) Für solche Reihen gelten die Ungleichungen von H ÖLDER und M INKOWSKI in der Form 1 X
jk k j Np .x/1=p Nq .y/1=q
mit q WD p=.p 1/
(7.31)
kD1
bzw. Np .x C y/1=p Np .x/1=p C Np .y/1=p : Somit ist
(7.32)
l p WD fx j Np .x/ < 1g
ein Vektorraum (wobei Summen und skalare Vielfache wie bei l 1 komponentenweise gebildet werden), und durch kxkp WD Np .x/1=p ist auf diesem Vektorraum eine Norm definiert. Für p D 2 erhält man natürlich wieder den H ILBERTraum l 2 ; der in 7.6f. besprochen wurde, und auch für allgemeines p 1 kann man ohne große Mühe beweisen, dass l p vollständig und separabel ist.
B Endlich-dimensionale normierte lineare Räume Obwohl wir uns hauptsächlich mit unendlich-dimensionalen Räumen beschäftigen, ist es nützlich, einige Eigenschaften von endlich-dimensionalen NLR kennen zu lernen. Ausgangspunkt ist der folgende Satz: Lemma 7.8. Sei V ein NLR und sei fe 1 ; : : : ; e n g eine linear unabhängige Menge von Vektoren e i 2 V . Dann gibt es eine Konstante C > 0; so dass für alle ˛1 ; : : : ; ˛n 2 K gilt n n X X ˛k e k C j˛k j : (7.33) kD1
kD1
Beweis. Es ist zu zeigen: 8 < Es gibt ein C > 0; so dass n n P P . / ˇk e k mit jˇk j D 1. : kyk C für alle y D kD1
Für xD
n X kD1
˛k e k
mit s WD
kD1
n X kD1
j˛k j 6D 0
B Endlich-dimensionale normierte lineare Räume
211
setzt man dann nämlich ˇk D
so dass also
n P kD1
˛k ; s
yD
n X
ˇk e k ;
kD1
jˇk j D 1 ist, und wendet hierauf ( ) an. Das ergibt die Behauptung
(7.33). Angenommen, ( ) ist falsch. Dann gibt es ym D
n X
ˇkm e k
kD1
mit
n X
jˇkm j D 1 und y m ! 0:
(7.34)
kD1
Nun bilden die b m WD .ˇ1m ; : : : ; ˇnm / eine beschränkte Folge in Kn ; die nach dem Satz von B OLZANO -W EIERSTRASS (vgl. etwa [36], Kap. 13) eine konvergente Teilfolge n X b mj ! b D .ˇ1 ; : : : ; ˇn / mit jˇk j D 1 (7.35) kD1
enthält. Daraus folgt aber y
mj
! y D
n X
ˇk e k ;
kD1
was wegen (7.35) und (7.34) offenbar ein Widerspruch zur linearen Unabhängigkeit t u der Vektoren e 1 ; : : : ; e n ist. Wir wollen nun hieraus Konsequenzen ziehen. Zunächst definieren wir: Definitionen 7.9. Eine Teilmenge U eines NLR V heißt ein abgeschlossener Unterraum von V; wenn gilt: a. U ist ein linearer Teilraum von V; also mit der Norm von V selbst ein NLR. b. U ist eine abgeschlossene Teilmenge von V; d. h. U D U. Satz 7.10. a. Jeder abgeschlossene Unterraum U eines BANACHraumes ist vollständig, d. h. ebenfalls ein BANACHraum. b. Jeder endlich-dimensionale Unterraum U eines beliebigen NLR ist vollständig und damit abgeschlossen. c. Jeder endlich-dimensionale NLR ist ein BANACHraum. Beweis. a. Sei V vollständig, U V ein abgeschlossener Unterraum und sei .xn / U eine C AUCHYfolge. Dann gilt xn ! x 2 V; und damit gehört x zum Abschluss von U; also x 2 U.
212
7 BANACH - und H ILBERTräume
b. Sei V ein NLR, U V ein endlich-dimensionaler linearer Teilraum und sei fe 1 ; : : : ; e n g eine Basis von U. Sei ym D
n X
˛km e k 2 U
kD1
eine C AUCHYfolge. Nach Lemma 7.8 gibt es dann ein C > 0; so dass n n X X p p m p m ˛k ˛k e k C ky y k D j˛km ˛k j ; kD1
kD1
d. h. die am D .˛1m ; : : : ; ˛nm / bilden eine C AUCHYfolge in Kn . Da Kn bekanntlich vollständig ist ([36], Kap. 13), gilt daher am ! a D .˛1 ; : : : ; ˛n / 2 Kn : Daraus folgt dann y m ! y WD
n X
˛k e k 2 U ;
kD1
wie gewünscht. c. folgt direkt aus b. t u Auf ähnliche Weise beweist man: Satz 7.11. a. In einem NLR V ist jede kompakte Menge abgeschlossen und beschränkt. b. Ist dim V < 1; so ist jede abgeschlossene beschränkte Menge kompakt.
C Orthogonales Komplement Die folgende Definition ist sicher schon aus der linearen Algebra bekannt: Ist H ein PHR, M H eine Teilmenge, so heißt M ? D fx 2 H j hx j mi D 0
8m 2 Mg
(7.36)
das orthogonale Komplement von M . Seine grundlegenden Eigenschaften bilden den Ausgangspunkt für das Studium der H ILBERTräume, und sie sind in nachstehendem Theorem zusammengefasst. Wir notieren jedoch zunächst zwei einfache Eigenschaften, deren Beweise leichte Übungen sind: Lemma 7.12. Sei H ein PHR und M eine beliebige Teilmenge von H . a. M ? ist ein abgeschlossener Unterraum von H . b. .LH.M //? D M ? .
C Orthogonales Komplement
213
Theorem 7.13. Sei H ein H ILBERTraum und U H ein abgeschlossener Unterraum von H . Dann gilt: a. Zu jedem x0 2 H existiert ein eindeutiges u0 2 U mit kx0 u0 k D ı WD inf kx0 uk : u2U
(7.37)
b. Jedes x 2 H kann eindeutig in der Form x DuCv
mit u 2 U; v 2 U ?
(7.38)
und daher U ?? D U :
(7.39)
zerlegt werden, d. h. es gilt H D U ˚ U? Beweis. a. Wir zeigen zunächst die Existenz eines u0 2 U; das (7.37) erfüllt. Nach Definition des Infimums gibt es eine Folge .un / in U; so dass kx0 un k ! ı
für n ! 1 :
(7.40)
Um zu zeigen, dass .un / gegen ein u0 2 U konvergiert, genügt es, nachzuweisen, dass .un / eine C AUCHYfolge ist, weil U als abgeschlossener Unterraum eines H ILBERTraums nach Satz 7.10a. vollständig ist. Mit der Parallelogrammgleichung in Satz 7.2c. folgt: kun um k2 D k.x0 un / .x0 um /k2 D k.x0 un / C .x0 C um /k2 C 2kx0 un k2 C 2kx0 um k2 D 4kx0 12 .un C um /k2 C 2kx0 un k2 C 2kx0 um k2 4ı 2 C 2kx0 un k2 C 2kx0 um k2 ! 0 für m; n ! 1 wegen (7.40) und
x0 1 .un C um / ı : 2
Die letzte Ungleichung gilt nach Definition von ı; weil .un C um /=2 2 U ist. Also gilt un ! u0 2 U; und es folgt kx0 u0 k D ı. Um die Eindeutigkeit von u0 in (7.37) zu zeigen, nimmt man an, es gäbe u1 ; u2 2 U mit kx0 u1 k D ı D kx0 u2 k und zeigt wieder mit der Parallelogrammgleichung ku1 u2 k2 D k.x0 u1 / .x0 u2 /k2 D 4kx0 12 .u1 C u2 /k2 C 2kx0 u1 k2 C 2kx0 u2 k2 4ı 2 C 2ı 2 C 2ı 2 D 0 ; womit a. gezeigt ist.
214
7 BANACH - und H ILBERTräume
b. Es bleibt die eindeutige Zerlegung (7.38) zu zeigen. Zu x0 2 H bestimmen wir das eindeutige u0 2 U; das (7.37) erfüllt und setzen x0 D u0 C .x0 u0 / ;
(7.41)
wobei wir zeigen müssen, dass v0 WD x0 u0 2 U ?
(7.42)
gilt. Für beliebiges 0 ¤ u 2 U betrachten wir hierzu den Vektor uO D u0 C
hu j v0 i u2U : kuk2
Wegen (7.37) gilt dann ı 2 kx0 uk O 2 jhu j v0 ij2 jhu j v0 ij2 2 D kv0 k2 D ı : kuk2 kuk2 Dies kann aber nur gelten, wenn hu j v0 i D 0 ist. Zur Eindeutigkeit: Ist x0 D u1 C v1 noch eine Zerlegung in u1 2 U; v1 2 U ? ; so folgt u0 C v0 D u1 C v1 ; also w WD u0 u1 D v1 v0 2 U \ U ? und damit hwjwi D 0. Daher muss w D 0 sein, also u0 D u1 und v0 D v1 .
t u
Folgende Konsequenz wird häufig benötigt: Satz 7.14. In einem H ILBERTraum H gilt: a. Liegt eine Teilmenge M H dicht in H; so ist M ? D f0g. b. Ist W ein linearer Teilraum von H; so ist W genau dann dicht in H; wenn W ? D f0g. Beweis. a. Nach Lemma 7.12b. ist M ? D .M /? D H ? D f0g. b. Sei W ein linearer Teilraum mit W ? D f0g. Wir wenden Theorem 7.13b. auf den abgeschlossenen Unterraum U WD W an und erhalten ?
U D U ?? D .W /? D .W ? /? D f0g? D H ; also W D H; wie behauptet. t u
D Vervollständigung von normierten linearen Räumen
215
D Vervollständigung von normierten linearen Räumen In den Anwendungen benötigt man in der Regel vollständige Räume – BANACHoder H ILBERTräume. Vielfach sind aber die passenden Funktionenräume zunächst als unvollständige Räume gegeben. Man benötigt daher ein allgemeines Prinzip, um unvollständige Räume zu vervollständigen. Um dieses zu formulieren, müssen wir den Begriff der Isometrie einführen: Definition 7.15. Seien V; W zwei normierte lineare Räume. Eine Isometrie von V in W ist eine lineare Abbildung T W V ! W; für die gilt: kT xk D kxk
8x 2 V :
Wegen der Linearität folgt hieraus kT x T yk D kT .x y/k D kx yk für alle x; y 2 V; d. h. eine Isometrie lässt die Abstände der Vektoren unverändert. Theorem 7.16. Zu jedem NLR (bzw. PHR) V gibt es einen BANACHraum (bzw. H IL BERT raum) E und eine Isometrie T W V ! E; so dass T .V / dicht in E ist. Man sagt: Jeder NLR (PHR) V lässt sich dicht in einen BANACHraum (H ILBERTraum) E einbetten. Man nennt E die Vervollständigung von V und identifiziert T .V / und V; so dass V ein dichter Teilraum von E ist. Die verschiedenen möglichen Beweise dieses Theorems haben alle einen sehr theoretischen Charakter, und wir verweisen dafür auf Lehrbücher der Funktionalanalysis. Im nächsten Kapitel werden wir allerdings einen Beweis skizzieren (vgl. Anmerkung 8.15). Bemerkung: Die verschiedenen Beweise für Theorem 7.16 liefern durchaus unterschiedliche Objekte als Elemente des BANACHraums E; der den gegebenen Raum V vervollständigt. Man kann aber alle diese Konstrukte miteinander identifizieren und infolgedessen von „der“ Vervollständigung sprechen, als sei sie eindeutig bestimmt. Das hat folgenden Grund: Angenommen, V ist durch die Isometrien Ti W V ! Ei dicht in die BANACHräume Ei .i D 1; 2/ eingebettet. Auf den dichten Teilräumen T1 .V / bzw. T2 .V / sind dann die Isometrien S12 WD T2 ı T11 bzw. S21 WD T1 ı T21 definiert, und ihre Werte liegen in den vollständigen Räumen E2 bzw. E1 . Wir werden im nächsten Kapitel (vgl. Theorem 8.7) sehen, dass man in einer solchen Situation eindeutige isometrische lineare Fortsetzungen SO12 W E1 ! E2
bzw. SO21 W E2 ! E1
von S12 bzw. S21 hat. Offensichtlich sind S12 ; S21 zueinander inverse Bijektionen, und das überträgt sich (wegen (8.6)) sofort auf SO12 und SO21 . Wir identifizieren nun Elemente 2 E1 ; 2 E2 miteinander, wenn die äquivalenten Bedingungen D SO12 ;
D SO21
216
7 BANACH - und H ILBERTräume
erfüllt sind. Bei dieser Identifikation benutzen wir keinerlei externe Zusatzinformation, sondern nur die gegebenen Daten E1 ; E2 ; T1 ; T2 . Deshalb ist es für jede mögliche Anwendung der Vervollständigung völlig gleichgültig, ob man die Elemente von E1 oder die von E2 benutzt – man kann mit Hilfe der Isomorphismen SO12 ; SO21 immer die einen durch die anderen ersetzen. Der Mathematiker sagt, die Vervollständigung sei „eindeutig bestimmt bis auf natürlichen Isomorphismus“. Beispiel 7.17. Der Raum V WD LQ 2 .Œa; b/ aus Beispiel 7.6b. kann als dichter Teilraum des H ILBERTraums H WD L2 .Œa; b/ aufgefasst werden, denn jedes f 2 H kann im quadratischen Mittel beliebig genau durch die Partialsummen seiner F OU RIERreihe approximiert werden, und diese Partialsummen sind stetige Funktionen, gehören also zu V . Daher kann man H als die Vervollständigung von V ansehen. Im Prinzip könnte man also den H ILBERTraum L2 .Œa; b/ auch ohne das L EBES Q 2 .Œa; b/ anwendet. DieGUE -Integral konstruieren, indem man Theorem 7.16 auf L ses Vorgehen ist jedoch auf lange Sicht unbefriedigend, da man so keine konkrete Vorstellung von den Elementen des H ILBERTraums gewinnt. Anmerkung 7.18. Das gerade besprochene Phänomen, dass stetige Funktionen in Räumen summierbarer Funktionen dicht liegen, ist weit verbreitet und für die moderne Analysis von eminenter Bedeutung. Betrachten wir etwa eine offene Teilmenge ˝ Rn und bezeichnen mit Cc .˝/ den Vektorraum aller stetigen Funktionen ' W ˝ ! K; die außerhalb einer kompakten Teilmenge von ˝ verschwinden. Dann ist offenbar Cc .˝/ Lp .˝/ für 1 p 1. Somit kann man Cc .˝/ auch als Teilraum von Lp .˝/ auffassen, indem man jedes ' 2 Cc .˝/ mit seiner Äquivalenzklasse Œ' identifiziert, wie in 7.6c. erläutert. In der Integrationstheorie wird gezeigt (vgl. etwa Satz 10.39), dass für p < 1 sogar Cc .˝/ dicht in Lp .˝/ ist. (In [36] werden im Rahmen der Ergänzungen zu Kap. 29 Beispiele angegeben, die diese Aussage auch ohne detaillierten Beweis plausibel machen.) Somit kann man Lp .˝/ für p < 1 als die Vervollständigung des normierten linearen Raums Vp auffassen, der entsteht, wenn man den Vektorraum Cc .˝/ mit der Norm Z k'kp WD
j'.x/jp dn x
1=p
˝
versieht.
E Tensorprodukt von H ILBERTräumen Wir modifizieren jetzt das in Abschn. 2B eingeführte Tensorprodukt so, dass auch komplexe Räume sowie Räume unendlicher Dimension mit einbezogen werden. Anders als in Abschn. 2B beschränken wir uns jedoch auf H ILBERTräume und machen uns das Vorhandensein eines Skalarproduktes von vornherein zu Nutze. Im
E Tensorprodukt von H ILBERTräumen
217
Fall eines endlichdimensionalen reellen H ILBERTraums stimmen die beiden Konstruktionen jedoch überein (vgl. Aufg. 7.10). Seien H1 ; H2 also zwei K-H ILBERTräume. Bei beiden Räumen bezeichnen wir das Skalarprodukt mit h j i; so dass man immer an den eingesetzten Vektoren ablesen muss, welches Skalarprodukt gerade gemeint ist. Auf dem kartesischen Produkt H1 H2 D f.x1 ; x2 / j xi 2 Hi ; i D 1; 2g betrachten wir Bilinearformen, d. h. Funktionen B W H1 H2 ! K; die sich in jedem ihrer beiden Argumente reell-linear verhalten: B.˛x1 C ˇy1 ; x2 / D ˛B.x1 ; x2 / C ˇB.y1 ; x2 /
(7.43)
B.x1 ; ˛x2 C ˇy2 / D ˛B.x1 ; x2 / C ˇB.x1 ; y2 /
(7.44)
für x1 ; y1 2 H1 ; x2 ; y2 2 H2 ; ˛; ˇ 2 R. Zu jedem Vektorpaar .y1 ; y2 / 2 H1 H2 definieren wir eine spezielle Bilinearform B y1 ˝ y2 durch .y1 ˝ y2 /.x1 ; x2 / WD hx1 j y1 ihx2 j y2 i :
(7.45)
Wie immer bei Funktionen, bilden die Bilinearformen auf H1 H2 einen Vektorraum, indem man sie argumentweise addiert und mit Skalaren multipliziert. So können wir auch beliebige (endliche) Linearkombinationen unserer speziellen Formen y1 ˝ y2 bilden, also den linearen Teilraum H1 ˝ H2 WD LH.fy1 ˝ y2 j y1 2 H1 ; y2 2 H2 g/
(7.46)
betrachten, den man das algebraische Tensorprodukt der H ILBERTräume H1 ; H2 nennt. Seine Elemente nennt man Tensoren (genauer: Tensoren zweiter Stufe). Der in (7.45) definierte spezielle Tensor wird als das Tensorprodukt der Vektoren y1 und y2 bezeichnet, und, wie unmittelbar aus der Definition hervorgeht, verhält sich dieses Produkt als Funktion von y1 ; y2 bilinear, d. h. für B.y1 ; y2 / WD y1 ˝y2 gelten sinngemäß die Gleichungen (7.43) und (7.44), und zwar für alle ˛; ˇ 2 K; also auch für komplexe Skalare, wenn K D C. Den Vektorraum H1 ˝ H2 machen wir zu einem Prähilbertraum, indem wir ein Skalarprodukt definieren: Satz 7.19. Setzt man für die speziellen Elemente der Form y1 ˝ y2 ;
z1 ˝ z2 2 H1 ˝ H2
hy1 ˝ y2 j z1 ˝ z2 i WD hy1 j z1 ihy2 j z2 i
(7.47)
und für Linearkombinationen ˇ m * n + ˇX X ˇ ˛i .y1i ˝ y2i /ˇ ˇk .z1k ˝ z2k / WD ˇ i D1
D
kD1
m n X X
˛ i ˇk hy1i
(7.48) ˝
y2i
j
z1k
˝
z2k i
;
i D1 kD1
so wird durch (7.48) ein Skalarprodukt wohldefiniert, so dass H1 ˝ H2 zu einem Prähilbertraum wird.
218
7 BANACH - und H ILBERTräume
Beweis. Die Darstellung von Tensoren in der Form BD
n X
˛i y1i ˝ y2i ;
C D
i D1
m X
ˇk z1k ˝ z2k
kD1
ist nicht eindeutig, und daher muss gezeigt werden, dass das Skalarprodukt hB j C i nur von den Tensoren B; C selbst abhängt, nicht von der in (7.48) verwendeten Darstellung. Nach (7.45) ist aber E X D ED E D B j z1k ˝ z2k D ˛i y1i j z1k y2i j z2k D B z1k ; z2k i
und somit hB j C i D
X
ˇk B z1k ; z2k :
k
Also hängt das Skalarprodukt nur von B selbst ab, nicht von der für den linken Faktor benutzten Darstellung. Ebenso ergibt sich ˝ i ˛ X D i kE D i kE y1 ˝ y2i j C D ˇk y1 j z1 y2 j z2 D C y1i ; y2i k
und somit hB j C i D
X
˛i C y1i ; y2i ;
i
woran man erkennt, dass das Skalarprodukt auch nicht von der für C gewählten speziellen Darstellung abhängt. Die Rechenregeln 7.1a., b., c. sind P durch triviale Rechnung nachzuprüfen. Für i i d. betrachten wir einen Tensor B D i x1 ˝ x2 und müssen zeigen, dass hB j Bi > 0; falls B ¤ 0. Dazu führen wir in dem von den x1i aufgespannten (endlichdimensionalen) linearen Teilraum von H1 eine Orthonormalbasis fe 1 ; : : : ; e r g ein, ebenso eine Orthonormalbasis ff 1 ; : : : ; f s g in dem von den x2i aufgespannten linearen Teilraum von H2 . Entwickelt man die x1i bzw. die x2i nach diesen Basen und setzt diese Entwicklungen in die Darstellung für B ein, so ergibt sich die neue Darstellung s r X X jk e j ˝ f k : BD j D1 kD1
Diese verwenden wir, um das Skalarprodukt zu berechnen: X hB j Bi D jk lm he j ˝ f k j e l ˝ f m i j;k;l;m
D
X
jk lm ıjl ıkm D
j;k;l;m
außer wenn alle jk verschwinden.
X
j jk j2 > 0 ;
j;k
t u
E Tensorprodukt von H ILBERTräumen
219
Dieser Prozess lässt sich verallgemeinern: Definitionen 7.20. Seien H1 ; : : : ; Hn C-H ILBERTräume. a. Eine Multilinearform (oder ein multilineares Funktional) auf H1 Hn ist eine Abbildung M W H1 Hn ! C; die sich in jedem ihrer n Argumente linear verhält. b. Für yi 2 Hi definiert man auf H1 Hn multilineare Funktionale y1 ˝ ˝ yn W H1 Hn ! C durch .y1 ˝ ˝ yn /.x1 ; : : : ; xn / WD
n Y
hyi j xi i :
.7:45/
i D1
c. Der C-Vektorraum LH.fy1 ˝ ˝ yn j yi 2 Hi ; i D 1; : : : ; ng/ ; versehen mit dem Skalarprodukt hy1 ˝ ˝ yn j z1 ˝ ˝ zn i WD hy1 j z1 i hyn j zn i
.7:47/
und lineare Fortsetzung auf Linearkombinationen wird zu einem Prähilbertraum H1 ˝ ˝ Hn ; den man als das algebraische Tensorprodukt von H1 ; : : : ; Hn bezeichnet. Seine Elemente werden als Tensoren n-ter Stufe bezeichnet. O ˝H O n gemäß Theorem 7.16 von H1 ˝ ˝ Hn d. Die Vervollständigung H1 ˝ heißt das H ILBERT-Tensorprodukt von H1 ˝ ˝ Hn . Solche mehrfachen Tensorprodukte werden z. B. für die Konstruktion des F OCKraums der Quantenfeldtheorie benötigt (vgl. etwa [38, 73]). Das H ILBERT-Tensorprodukt von separablen H ILBERTräumen ist ebenfalls separabel, wie z. B. aus folgendem Satz hervorgeht: Satz 7.21. Seien Hi separable H ILBERTräume mit Orthonormalbasen fe ik j k 2 Ng; i D 1; : : : ; n. Dann ist ˚ 1 e i1 ˝ ˝ e nin j ik 2 N ; 1 k n O ˝H O n. eine Orthonormalbasis von H1 ˝ Beweis. Zunächst erinnern wir an den aus der Theorie der F OURIERreihen bekannten Ausdruck für den Fehler bei der F OURIERentwicklung (vgl. etwa [36], Kap. 29): Ist H ein beliebiger H ILBERTraum, fvk j k 2 Ng ein Orthonormalsystem in H; n X z 2 H ein beliebiger Vektor, so gilt für die Partialsummen sn D hvk j zivk : kD1
kz sn k2 D kzk2
n X kD1
jhvk j zij2 :
(7.49)
220
7 BANACH - und H ILBERTräume
Nun zum eigentlichen Beweis! Es genügt, ihn für n D 2 zu führen. Seien also fe k j k 2 Ng eine Orthonormalbasis von H1 ; ff j j j 2 Ng eine Orthonormalbasis von H2 . Dann ist natürlich e k ˝ f j 2 H1 ˝ H2 . Weiter folgt mit (7.47) he k ˝ f i j e l ˝ f j i D he k j e l ihf i j f j i D ıkl ıij ;
(7.50)
O 2 ; so dass nur d. h. B WD fe k ˝ f i j i; k 2 Ng ist ein Orthonormalsystem in H1 ˝H noch die Vollständigkeit von B zu zeigen bleibt. Dazu betrachten wir S WD LH.B/ ;
(7.51)
b H2 zeigen müssen. Hierfür genügt es aber H1 ˝ H2 S zu so dass wir S D H1 ˝ zeigen, weil (nach Definition der Vervollständigung) O 2 H1 ˝ H2 D H1 ˝H ist. Sei also x ˝ y 2 H1 ˝ H2 ; x 2 H1 ; y 2 H2 ; beliebig. Dann gilt X X k e k mit jk j2 D kxk2 ; xD k
yD
X
k
i f i
mit
i
X
ji j2 D kyk2 :
i
Daher ist nach (7.47) und den Rechenregeln für absolut konvergente Reihen X jk i j2 : kx ˝ yk2 D kxk2 kyk2 D i;k
Die Zahlen k i sind auch die F OURIERkoeffizienten von x ˝ y in Bezug auf das Orthonormalsystem B; wie man wieder mit (7.47) bestätigt. Setzt man also sn;m WD
n X m X
k i e k ˝ f i ;
kD1 i D1
so folgt aus (7.49) lim
m;n!1
kx ˝ y sm;n k D 2
lim
n;m!1
kx ˝ yk 2
n X m X
! jk i j
2
D0;
kD1 i D1
also x ˝ y 2 S . Damit ergibt sich H1 ˝ H2 S; also die Behauptung.
t u
Der letzte Satz zeigt, wie man sich des praktischerPdie Elemente P Tensorprodukts 1 2 1 2 D a e ; v D b e werden neue Vektoren weise vorstellt: Aus Vektoren v k k k l l l P 1 2 c e ˝ e gebildet, wobei das Tensorkreuz ˝ sich rechnerisch wie ein Prok;l kl k l dukt verhält. Die Bilinearformen, mit denen das Tensorprodukt anfangs definiert wurde, sind – ähnlich wie die Äquivalenzklassen bei der Bildung der Lp -Räume –
Aufgaben
221
nur ein logischer Trick, der dafür sorgt, dass ein konkretes mathematisches Objekt aufgewiesen wird, das die gewünschten rechnerischen Eigenschaften besitzt. Das Tensorprodukt von Funktionenräumen kann meist mit einem Funktionenraum desselben Typs identifiziert werden, wobei sich allerdings die Anzahl der Variablen entsprechend erhöht, von denen die Funktionen abhängen. Wir formulieren dies jetzt präzis für den Fall der Räume vom Typ L2 .S /; der für die physikalischen Anwendungen besonders wichtig ist. Der Beweis wird im Rahmen der Integrationstheorie in einem etwas allgemeineren Zusammenhang geführt (Satz 10.47). Satz 7.22. Seien S1 Rn ; S2 Rm messbare Teilmengen. a. Dann existiert ein eindeutig bestimmter isometrischer Isomorphismus O 2 .S2 / ! L2 .S1 S2 / U W L2 .S1 /˝L mit U.f ˝ g/ D h wo h.x; y/ WD f .x/g.y/
(7.52)
für f 2 L .S1 /; g 2 L .S2 /. Wir schreiben daher f ˝ g für die Funktion h D U.f ˝ g/. b. Ist .e m / eine Orthonormalbasis von L2 .S1 /; .f n / eine Orthonormalbasis von L2 .S2 /; so ist fe m ˝ f n j m; n 2 Ng (7.53) 2
2
eine Orthonormalbasis von L2 .S1 S2 /.
Aufgaben zu Kap. 7 7.1. Man zeige: Ist U ein linearer Teilraum eines normierten linearen Raums V; so ist der Abschluss U ebenfalls ein linearer Teilraum. 7.2. Für p 1 und Punkte x D .x1 ; : : : ; xn /; y D .y1 ; : : : ; yn / 2 Kn gilt stets n X
!1=p jxk C yk j
p
kD1
n X
!1=p jxk j
p
C
kD1
n X
!1=p jyk j
p
(7.54)
kD1
(M INKOWSKIsche Ungleichung für endliche Summen). Dies sei als bekannt vorausgesetzt. a. Man zeige, dass die Formel kxkp WD
n X
!1=p jxk j
p
kD1
eine Norm auf Kn definiert. b. Für welche Werte von p gilt dabei die Parallelogrammgleichung?
(7.55)
222
7 BANACH - und H ILBERTräume
c. Man beweise: lim kxkp D kxk1 WD max jxk j
p!1
(7.56)
1kn
für alle x D .x1 ; : : : ; xn / 2 Kn . (Hinweis: Man nehme zunächst an, es ist kxk1 D 1. Für diesen Fall betrachte man die Terme mit jxk j D 1 und die mit jxk j < 1 getrennt.) 7.3. a. Es sei X Rn eine beliebige nichtleere Teilmenge (oder allgemeiner: ein beliebiger metrischer Raum). Mit BC.X / bezeichnen wir den K-Vektorraum der stetigen beschränkten Funktionen f W X ! K; versehen mit der Norm kf k1 WD sup jf .x/j : x2X
Man zeige, dass BC.X / ein BANACHraum ist. b. Es sei Cc .Rn / die Menge der stetigen Funktionen u W Rn ! K; die außerhalb einer kompakten Menge verschwinden. Man zeige, dass dies ein linearer Teilraum von BC.Rn / ist. c. Man zeige: Der Abschluss von Cc .Rn / in BC.Rn / ist der Raum C0 .Rn / der stetigen Funktionen u W Rn ! K; für die gilt: lim u.x/ D 0 :
jxj!1
d. Man folgere, dass C0 .Rn / ein BANACHraum ist. 7.4. Es sei Œa; b R ein kompaktes Intervall (a < b), und C 1 .Œa; b/ sei der Vektorraum der einmal stetig differenzierbaren Funktionen auf Œa; b. Man zeige: a. Mit der Norm kf k1;0 WD max jf .x/j axb
1
ist C .Œa; b/ nicht vollständig. b. Mit der Norm kf k1;1 WD max.kf k1;0 ; kf 0 k1;0 / ist C 1 .Œa; b/ vollständig, also ein BANACHraum. c. Auf dem Raum C n .Œa; b/ der n-mal stetig differenzierbaren Funktionen auf Œa; b hat man die Normen kf k1;m WD max.kf k1;0 ; kf 0 k1;0 ; : : : ; kf .m/ k1;0 / für 0 m n. Mit k k1;n ist C n .Œa; b/ ein BANACHraum, mit k k1;m für m < n jedoch ein unvollständiger NLR. 7.5. Zwei Normen k k1 und k k2 auf einem K-Vektorraum E heißen äquivalent, wenn es Konstanten c2 c1 > 0 gibt, so dass c1 kxk1 kxk2 c2 kxk1
für alle x 2 E.
Mit Hilfe von Lemma 7.8 zeige man: Auf einem endlich-dimensionalen K-Vektorraum sind alle Normen äquivalent.
Aufgaben
223
7.6. In einem unendlich-dimensionalen K-Vektorraum sind nicht alle Normen äquivalent. Sei dazu E der R-Vektorraum der stetigen Funktionen f W Œ1; 1 ! R mit den beiden Normen Z1 kf k1 WD sup jf .t/j ; 1t 1
kf k1 WD
jf .t/j dt : 1
Man zeige an einem Beispiel, dass diese Normen nicht äquivalent sind. 7.7. Seien k k1 ; k k2 äquivalente Normen auf einem K-Vektorraum E; und seien E1 ; E2 die entsprechenden normierten linearen Räume. Man zeige: a. Eine Folge .xn / aus E ist genau dann konvergent (bzw. C AUCHYfolge) in E1 ; wenn .xn / konvergent (bzw. C AUCHYfolge) in E2 ist. b. E1 ist genau dann ein BANACHraum, wenn E2 ein BANACHraum ist. 7.8. Sei l 2 der H ILBERTraum aus Beispiel 7.6f, und sei B WD fej j j 2 Ng die Menge seiner kanonischen Einheitsvektoren ej WD .ıjk /k1 : Man zeige:
p a. kei ej k D 2ıij . b. B ist abgeschlossen und beschränkt. c. B ist nicht kompakt.
7.9. Sei H ein reeller PHR, und sei G H eine (affine) Gerade in H; d. h. G D fa C th j t 2 Rg mit einem gegebenen Punkt a 2 H und einem gegebenen Vektor 0 ¤ h 2 H . Man zeige: Für x 2 H und z 2 G ist die Bedingung kx zk D min kx vk v2G
äquivalent zu x z ? z a. (Hinweis: Die Funktion g.t/ WD kx a thk2 ist beliebig oft differenzierbar (wieso?), erlaubt also Kurvendiskussion.) 7.10. Seien H1 ; H2 H ILBERTräume der endlichen Dimensionen n1 bzw. n2 . Man zeige: O 2; H1 ˝ H2 D H1 ˝H und dieser H ILBERTraum hat die Dimension n1 n2 . (Hinweis: Man betrachte Orthonormalbasen!)
Kapitel 8
Beschränkte lineare Operatoren
In diesem Kapitel betrachten wir lineare Abbildungen T W E ! F zwischen normierten linearen Räumen E und F; wobei dem Fall der H ILBERTräume besondere Aufmerksamkeit geschenkt wird. Sind die Räume unendlich-dimensional, so gibt es Besonderheiten, die in der elementaren linearen Algebra keine Rolle gespielt haben. Entsprechende Begriffe und Resultate werden in den Abschn. A–E in einem abstrakten Rahmen entwickelt, denn es ist – besonders für die Quantenmechanik – wichtig, mitzuerleben, dass man mit Operatoren ähnlich wie mit Zahlen rechnen und dabei zu tragfähigen Ergebnissen gelangen kann, auch wenn eine konkrete Bedeutung der Operatoren nicht spezifiziert ist. Die Aufgaben enthalten jedoch auch eine Reihe von illustrierenden Beispielen. Überdies beschließen wir das Kapitel in Abschn. F damit, dass wir die F OURI ERtransformation als linearen Operator behandeln und einige ihrer wichtigsten Eigenschaften in der Sprache der Funktionalanalysis formulieren.
A Beschränkte lineare Operatoren und Funktionale Wir beginnen mit der Wiederholung einiger Grundbegriffe: Definitionen 8.1. Seien E; F normierte lineare Räume über demselben Körper K und sei D.A/ E ein linearer Teilraum. Dann heißt eine lineare Abbildung A W D.A/ ! F
(auch A W E D.A/ ! F geschrieben)
ein linearer Operator aus E nach F mit – –
Definitionsbereich D.A/ E ; Wertebereich oder Bild R.A/ WD fy 2 F j y D Ax
für ein x 2 D.A/g F ;
K.-H. Goldhorn, H.-P. Heinz, M. Kraus, Moderne mathematische Methoden der Physik DOI 10.1007/978-3-540-88544-3, © Springer 2009
225
226
–
8 Beschränkte lineare Operatoren
Graph G.A/ WD f.x; Ax/ j x 2 D.A/g E F ;
–
Kern oder Nullraum N.A/ WD fx 2 D.A/ j Ax D 0g E : Im Falle F D K heißt ein linearer Operator f W D.f / ! K ;
D.f / E ;
ein lineares Funktional oder eine Linearform. Die folgenden Aussagen werden im Rahmen der elementaren linearen Algebra bewiesen (vgl. z. B. [36], Kap. 7). Ob die beteiligten Vektorräume endliche oder unendliche Dimension haben, spielt für diese Aussagen absolut keine Rolle. Satz 8.2. Für jeden linearen Operator A W E D.A/ ! F gilt: a. Der Wertebereich R.A/ ist ein linearer Teilraum von F . b. Der Nullraum (Kern) N.A/ ist ein linearer Teilraum von E. c. A ist injektiv genau dann, wenn N.A/ D f0g. In diesem Fall existiert der inverse Operator A1 W F D.A1 / ! E mit
D.A1 / D R.A/
und R.A1 / D D.A/ ;
und er ist ebenfalls ein linearer Operator. Lineare Abbildungen zwischen endlich-dimensionalen Räumen sind einleuchtenderweise stetige Funktionen (s. u. Korollar 8.5). In unendlich-dimensionalen normierten linearen Räumen ist dies i. A. nicht der Fall. Vielmehr bilden die stetigen linearen Operatoren eine Teilklasse. Satz 8.3. a. Für lineare Operatoren A W E D.A/ ! F sind die folgenden vier Bedingungen äquivalent: (i) (ii)
A bildet beschränkte Mengen aus D.A/ in beschränkte Mengen aus F ab. Die Größe kAk WD
sup x2D.A/ x¤0
(iii)
kAxk D kxk
sup kAxk D x2D.A/ kxk1
sup kAxk
(8.1)
x2D.A/ kxkD1
ist endlich. Es gibt eine Konstante C 0; so dass kAxk C kxk für alle x 2 D.A/.
(8.2)
A Beschränkte lineare Operatoren und Funktionale
(iv)
227
A ist in ganz D.A/ stetig.
b. Die durch (8.1) definierte Größe kAk erfüllt auf dem Vektorraum B.E; F / der stetigen linearen Operatoren A W E ! F die Normaxiome, macht diesen also zu einem NLR. Ferner gilt kAxk kAk kxk
(8.3)
für alle x 2 E; A 2 B.E; F /. Beweis. a. Zunächst macht man sich klar, dass die drei in (8.1) angegebenen Suprema gleich sind. Das beruht auf der Beziehung A.x/ D Ax ;
2K
und ist eine leichte Übung. Damit sind die Implikationen (iii) H) (i) H) (ii) aber trivial. Gilt (ii), so erhalten wir sofort (iii), indem wir setzen: C WD sup x2D.A/ x¤0
kAxk : kxk
Somit sind (i)–(iii) äquivalent. Aus (iii) folgt für x0 ; x 2 D.A/ aber kAx Ax0 k D kA.x x0 /k C kx x0 k ; woraus die Stetigkeit folgt (sogar gleichmäßige Stetigkeit!). Ist schließlich (iv) vorausgesetzt, so können wir zu x0 D 0 und " D 1 ein ı > 0 finden, für das gilt: kx 0k < ı H) kAx A0k < 1 ; d. h. kxk < ı H) kAxk < 1 : Wegen der Linearität von A folgt hieraus sup kAxk x2D.A/ kxk1
1 0 gemäß Lemma 7.8. Ferner setzen wir M WD max kAe k k : 1kn
Für beliebiges x D ˛1 e 1 C C ˛n e n 2 D.A/ ist dann n X
j˛k j
kD1
und daher
1 kxk C
n n X X kAxk D ˛k Ae k j˛k j kAe k k kD1 n X
M
kD1
j˛k j
kD1
M kxk : C
Also ist A beschränkt und damit stetig.
t u
Die Übungen enthalten verschiedene Beispiele von beschränkten und unbeschränkten linearen Operatoren. Die Verkettung von zwei linearen Abbildungen ist bekanntlich wieder linear, und die Verkettung von zwei stetigen Abbildungen ist stetig. Für stetige lineare Operatoren A; B ergibt die Verkettung BA B ı A also wieder einen stetigen linearen Operator. Genauer haben wir: Korollar 8.6. Sind E; F; G normierte lineare Räume, A 2 B.E; F /; B 2 B.F; G/ beschränkte lineare Operatoren, so ist die Verkettung BA 2 B.E; G/ und für ihre Operatornorm gilt kBAk kBk kAk : (8.5)
A Beschränkte lineare Operatoren und Funktionale
229
Dies folgt unmittelbar aus (8.1) und (8.3), wird jedoch als Rechenregel bei Abschätzungen oft benötigt. In den Anwendungen hat man häufig den Fall, dass ein linearer Operator A aus einem BANACHraum E in einen BANACHraum F zunächst nur auf einem dichten Teilraum D.A/ E; D.A/ D E; definiert ist. Ist A beschränkt, so kann A als beschränkter Operator auf ganz E fortgesetzt werden. Theorem 8.7 (BLE-Theorem). Sei E ein NLR, F ein BANACHraum, und sei T W E D.T / ! F
mit D.T / D E
ein dicht definierter beschränkter linearer Operator. Dann existiert eine eindeutige lineare Fortsetzung TO W E ! F von T; d. h. TO x D T x
für x 2 D.T /;
und für ihre Operatornorm gilt kTO k D kT k. Beweis. Der Beweis besteht darin, T auf die Häufungspunkte von D.T / fortzusetzen. Sei also x 2 D.T / D E : Dann gibt es xn 2 D.T /
mit xn ! x :
Da T linear und stetig ist, gilt kT xn T xm k D kT .xn xm /k kT k kxn xm k ; d. h. .T xn / ist eine C AUCHYfolge in F und daher konvergent, weil F nach Voraussetzung vollständig ist. Wir definieren TO x WD
lim T xn
n!1
für xn ! x :
(8.6)
Wir müssen zeigen, dass dadurch ein beschränkter linearer Operator TO auf ganz E wohldefiniert wird. a. TO ist wohldefiniert: Seien xn ; zn 2 D.T / mit xn ! x
und zn ! x
gegeben. Dann setzen wir vn WD xn zn . Es folgt lim vn D lim xn lim zn D 0 ;
n!1
n!1
n!1
also wegen der Stetigkeit von T auch limn!1 T vn D 0 und damit lim T xn D lim T zn ;
n!1
n!1
230
8 Beschränkte lineare Operatoren
d. h. der Grenzwert in (8.6) ist unabhängig von der approximierenden Folge .xn /. Daher ist durchˇ (8.6) eindeutig eine Abbildung TO W E ! F definiert. ˇ D T; denn für x 2 D.T / kann man als approximieDiese erfüllt auch TO ˇ D.t /
rende Folge die konstante Folge xn x wählen. b. TO ist linear: Gelte dazu: xn ! x ;
zn ! z
mit xn ; zn 2 D.T /; x; z 2 E
und seien ˛; ˇ 2 K. Dann gilt ˛xn C ˇzn ! ˛x C ˇz und daher nach (8.6) TO .˛x C ˇz/ D lim T .˛xn C ˇzn / n!1
D ˛ lim T xn C ˇ lim T zn D ˛ TO x C ˇ TO z : n!1
n!1
c. TO ist beschränkt: Gelte dazu xn ! x ; Dann gilt wegen
also
T xn ! TO x :
kT xn k ! kTO xk j kTO xk kT xn k j kTO x T xn k ! 0 :
Aus kT xn k kT k kxn k ! kT k kxk folgt also kTO xk kT k kxk für beliebiges x 2 E. Somit ist TO beschränkt und kTO k kT k nach Definition der Operatornorm. Aber kTO k kT k ist klar, weil TO eine Fortsetzung von T ist. d. Zur Eindeutigkeit: Ist TQ irgendeine stetige Fortsetzung von T auf ganz E und ist x D limn!1 xn mit xn 2 D.T /; so haben wir wegen der Stetigkeit TQ x D lim TQ xn D lim T xn ; n!1
n!1
d. h. auch TQ ist durch (8.6) gegeben. Das ist also die einzige Möglichkeit.
t u
Auf Grund dieses Satzes kann man immer annehmen, dass ein dicht definierter beschränkter linearer Operator A aus E in F schon auf ganz E definiert ist. Das unterstreicht die Bedeutung des in Satz 8.3b. eingeführten normierten linearen Raums B.E; F /. Wichtig ist, dass dieser Raum selbst ein BANACHraum ist, wenn F ein BANACHraum ist. Satz 8.8. Sei E ein beliebiger NLR. Ist F ein BANACHraum, so ist B.E; F / ebenfalls ein BANACHraum.
A Beschränkte lineare Operatoren und Funktionale
231
Beweis. Sei .Tn / eine C AUCHYfolge in B.E; F /; d. h. zu " > 0 gibt es ein n0 2 N; so dass für alle n; m n0 : kTn Tm k < " Wegen kTn x Tm xk kTn Tm k kxk < "kxk
(8.7)
für jedes x 2 E ist dann .Tn x/ eine C AUCHYfolge in F und daher konvergent, weil F vollständig ist. Zu jedem x 2 E gibt es also ein y 2 F; so dass T x WD y D
lim Tn x :
n!1
(8.8)
Da der Limes eindeutig ist, definiert (8.8) einen linearen Operator T W E ! F . Ferner folgt aus (8.8), wenn wir in (8.7) mit m ! 1 gehen: kTn x T xk " kxk
für n n0 :
(8.9)
Daraus bekommen wir dann kT xk kTn0 xk C kT x Tn0 xk < .kTn0 k C "/ kxk ; d. h. T ist ein beschränkter linearer Operator. Bilden wir in (8.9) außerdem das Supremum über alle x 2 E; kxk D 1; so folgt aus (8.1) in Satz 8.3: kTn T k "
für alle n n0 ;
d. h. es gilt Tn ! T
in B.E; F / : t u
Ist T W E ! F beschränkt und injektiv, so existiert der inverse Operator T 1 W F R.T / ! E; ist jedoch i. A. kein beschränkter Operator. Das folgende einfache Kriterium sichert die Stetigkeit von T 1 : Satz 8.9. Genau dann besitzt T W E ! F einen beschränkten inversen Operator T 1 W R.T / ! E; wenn es eine Konstante c > 0 gibt, so dass kT xk c kxk
für alle x 2 E :
(8.10)
Beweis. Aus (8.10) folgt sofort: T x D 0 H) x D 0 ; d. h. T ist injektiv und damit existiert T 1 W R.T / ! E. Um zu zeigen, dass T 1 beschränkt ist, betrachten wir y 2 R.T / und wenden (8.10) auf x WD T 1 y an. Das ergibt: 1 1 kT xk D kyk ; kT 1 yk D kxk c c
232
8 Beschränkte lineare Operatoren
also ist T 1 in der Tat beschränkt. Die Umkehrung folgt direkt durch Anwendung t u von (8.2) auf den Operator T 1 . Der folgende Satz verallgemeinert die geometrische Reihe. Er wird später – in der Spektraltheorie – eine fundamentale Rolle spielen. Es geht dabei um Operatoren, die nicht zu sehr vom identischen Operator I W E ! E ;
Ix D x
(8.11)
abweichen. Bevor wir ihn formulieren, müssen wir aber ein Wort über unendliche einschieben: Reihen in BANACHräumen P Bei einer Reihe k xk von Vektoren xk eines normierten linearen Raums sagt man, wie üblich, dass die Reihe konvergiert, wenn der Limes n X
s WD lim
n!1
xk
kD1
im Sinne der starken Konvergenz existiert, und man bezeichnet diesen Limes dann als die Summe 1 X xk : sD kD1
Außerdem sagt man, die Reihe konvergiert absolut, wenn 1 X
kxk k < 1 :
kD1
Lemma 8.10. In einem BANACHraum ist jede absolut konvergente Reihe auch konvergent. Dabei gilt: 1 1 X X xk kxk k : (8.12) kD1
kD1
Der aus der elementaren Analysis bekannte Beweis, der auf dem C AUCHYschen Konvergenzkriterium beruht, lässt sich wörtlich auf diese Situation übertragen. Nun zu dem angekündigten Satz: Theorem 8.11. Sei T 2 B.E/ B.E; E/ und kT k < 1. Dann existiert .I T /1 als beschränkter Operator auf ganz E und es gilt die Darstellung durch die N EU MANN sche Reihe .I T /1 D
1 X
T j WD
j D0
lim
n!1
n X
Tj
(8.13)
j D0
im Sinne der Operatornorm auf B.E/. Dabei ist k.I T /1 k
1 : 1 kT k
(8.14)
B Beschränkte lineare Funktionale auf normierten linearen Räumen
233
Beweis. Setze q WD kT k. Wegen (8.5) ist kT j k kT kj D q j
8j ;
d. h. diePgeometrische Reihe ist eine konvergente Majorante für die N EUMANNsche Reihe j T j . Nach Satz 8.8 ist B.E/ ein BANACHraum, und auf diesen BA NACH raum können wir Lemma 8.10 anwenden. Daher existiert die Reihensumme S WD
1 X
Tj :
(8.15)
j D0
Für die Partialsummen Sn WD
n X
T j folgt
j D0
Sn .I T / D I CT C T 2 C T 3 C C T n T T 2 T 3 T nC1 D I T nC1 und ebenso .I T /Sn D I T nC1 . Für n ! 1 liefert das S.I T / D .I T /S D I ; also S D .I T /1 . Abschätzung (8.14) folgt nun aus (8.12) und der Summenformel für die geometrische Reihe. t u
B Beschränkte lineare Funktionale auf normierten linearen Räumen Wir gehen kurz auf einige Besonderheiten der stetigen linearen Funktionale ein, die für das tiefere Verständnis der normierten linearen Räume von grundlegender Bedeutung sind. Definition 8.12. Sei E ein NLR. Der topologische Dualraum (kurz: Dualraum)1 von E ist der BANACHraum E 0 D B.E; K/ der beschränkten linearen Funktionale f W E ! K. Die hier behauptete Vollständigkeit von E 0 folgt sofort aus Satz 8.8. Das Wichtigste am topologischen Dualraum ist, dass er stets genug Elemente enthält, um die Punkte von E voneinander zu unterscheiden. Genauer: 1 Im Gegensatz dazu ist der algebraische Dualraum E definiert als der Vektorraum aller linearen Abbildungen E ! K. Er spielt jedoch nur eine untergeordnete Rolle.
234
8 Beschränkte lineare Operatoren
Satz 8.13. Zu zwei verschiedenen Punkten x1 ; x2 2 E gibt es immer eine stetige Linearform f 2 E 0 mit f .x1 / ¤ f .x2 / : Zum Beweis wendet man auf x0 WD x1 x2 den folgenden fundamentalen Satz an: Theorem 8.14 (Satz von H AHN -BANACH). Sei E ein beliebiger NLR ¤ f0g. Zu jedem x0 2 E gibt es ein f 2 E 0 mit f .x0 / D kx0 k
und kf k D 1 :
Der Beweis beginnt mit der Setzung f0 .x0 / WD kx0 k für 2 K. Damit ist auf U0 WD LH.x0 / ein lineares Funktional f0 definiert, das die geforderten Eigenschaften besitzt. Dieses setzt man nun unter Erhaltung der Operatornorm auf immer größere lineare Teilräume fort, bis der Gesamtraum E als Definitionsbereich erreicht ist. Für Einzelheiten verweisen wir auf die Lehrbücher der Funktionalanalysis. Anmerkung 8.15. Der Satz von H AHN -BANACH gestattet es, einen einfachen Beweis für die Existenz der Vervollständigung (Thm. 7.16) zu geben. Dazu beachten wir, dass der Dualraum V 0 des gegebenen NLR V selbst auch ein NLR ist, also wieder einen Dualraum V 00 WD .V 0 /0 D B.V 0 ; K/ hat. Man nennt V 00 den Bidual von V; und er ist, wie in 8.12 festgestellt, ein BA NACH raum. Jeder Vektor x 2 V definiert nun in natürlicher Weise eine Abbildung 'x W V 0 ! K; nämlich die Auswertung der Linearformen f 2 V 0 an der Stelle x: 'x .f / WD f .x/ ;
f 2 V0 :
Diese Abbildung gehört zu V 00 ; denn erstens ist sie linear: 'x .f C g/ D .f C g/.x/ D f .x/ C g.x/ D 'x .f / C 'x .g/ ; und weiter ist sie dann nach Satz 8.3a. auch stetig, und zwar mit k'x k kxk; denn für alle f 2 V 0 ist j'x .f /j D jf .x/j kxk kf k : Ordnen wir nun jedem x 2 V die entsprechende Auswertungsabbildung 'x zu, so definiert dies eine Abbildung T W V ! V 00 W x 7! T x D 'x : Die Linearität der Funktionen f hat zur Folge, dass auch die Abbildung T linear ist. Für x; y 2 V; ; 2 K ist nämlich T .x C y/ D T x C T y ;
C Beschränkte Formen und adjungierter Operator
235
denn für jedes beliebige f 2 V 0 ergibt die Linearform auf der linken Seite den Wert f .x C y/; die auf der rechten Seite aber den Wert f .x/ C f .y/; und diese beiden Werte stimmen überein, weil f linear ist. Somit ist T eine stetige lineare Abbildung V ! V 00 . Der Satz von H AHN -BANACH liefert nun aber zu jedem x 2 V ein f 2 V 0 mit kf k D 1 und 'x .f / D f .x/ D kxk. Daher ist kT xk D sup j'x .f /j kxk f 2V 0 kf kD1
und somit kT xk D kxk. Das heißt die Abbildung T ist sogar eine lineare Isometrie und insbesondere injektiv. Wir definieren nun die Vervollständigung E von V als den Abschluss von T .V / in dem vollständigen Raum V 00 . Dann ist E als abgeschlossener Unterraum eines BANACHraums vollständig und T .V / dicht in E; wie verlangt. t u
C Beschränkte Formen auf H ILBERTräumen und der adjungierte Operator Im Folgenden seien immer H; H1 ; H2 H ILBERTräume über demselben Skalarbereich K. Wir schreiben aber alles für K D C auf – im reellen Fall vereinfachen sich die Dinge in offensichtlicher Weise, da das komplexe Konjugieren entfällt. Offenbar ist für jedes feste z 2 H durch fz .x/ WD hz j xi ein beschränktes lineares Funktional auf H definiert, wie sofort mit der S CHWARZschen Ungleichung folgt. Es gilt sogar die Umkehrung: Theorem 8.16 (R IESZscher Darstellungssatz). Zu jedem beschränkten linearen Funktional f W H ! K (also f 2 H 0 ) gibt es ein eindeutiges z 2 H; so dass f .x/ D hz j xi
für alle x 2 H :
(8.16)
Dabei gilt kf k D kzk ;
(8.17)
0
d. h. H und H sind isometrisch isomorph. Beweis. Da f stetig ist, ist U WD N.f / ein abgeschlossener Unterraum von H . Wir haben daher die durch Thm. 7.13a. gegebene Zerlegung H D N.f / ˚ N.f /? : Ist N.f /? D f0g; so ist f D 0; und dann gilt (8.16) mit z D 0. Anderenfalls aber gibt es z0 2 N.f /? mit f .z0 / 6D 0 :
236
8 Beschränkte lineare Operatoren
Zu gegebenem x 2 H betrachten wir den Vektor v WD f .x/z0 f .z0 /x : Er gehört zu N.f /; denn f .v/ D f .x/f .z0 /f .z0 /f .x/ D 0. Wegen z0 2 N.f /? gilt also (8.18) 0 D hz0 j vi D f .x/ kz0 k2 f .z0 / hz0 j xi : Lösen wir (8.18) nach f .x/ auf, so folgt: f .x/ D
f .z0 / hz0 j xi D kz0 k2
f .z0 /
ˇ z0 ˇˇ x ; kz0 k2 ˇ
was die Existenz eines z zeigt, das (8.16) erfüllt, nämlich z0 z WD f .z0 / : kz0 k2
(8.19)
Gäbe es z1 ; z2 2 H; so dass hz1 j xi D f .x/ D hz2 j xi
für alle x 2 H;
so folgte z1 z2 2 H ? D f0g; also z1 D z2 . Das zeigt die Eindeutigkeit von z in (8.16). Um (8.17) zu zeigen, bemerken wir zunächst, dass aus (8.16) mit der S CHWARZschen Ungleichung jf .x/j D jhz j xij kzk kxk
für alle x 2 H;
also kf k kzk folgt. Andererseits ist kzk2 D hzjzi D f .z/ kf k kzk ; woraus kf k kzk folgt.
t u
Bemerkung: Kombiniert man (8.17) mit der Definition der Norm in H 0 (vgl. (8.4)), so erhält man kzk D sup jhzjxij D sup jhzjxij : kxkD1
(8.20)
kxk1
Diese Formel für die Norm in einem H ILBERTraum ist zwar trivial, wird jedoch oft benötigt. Ein Skalarprodukt ist ein Spezialfall einer sogenannten Sesquilinearform. Definitionen 8.17. Eine Abbildung h W H1 H2 ! C heißt eine beschränkte Sesquilinearform, wenn h.x; ˛1 y1 C ˛2 y2 / D ˛1 h.x; y1 / C ˛2 h.x; y2 / ;
(8.21)
h.˛1 x1 C ˛2 x2 ; y/ D ˛ 1 h.x1 ; y/ C ˛2 h.x2 ; y/
(8.22)
C Beschränkte Formen und adjungierter Operator
237
und wenn es eine Konstante C 0 gibt, so dass jh.x; y/j C kxk1 kyk2 für alle x; x1 ; x2 2 H1 ; y; y1 ; y2 2 H2 und ˛1 ; ˛2 2 C. Dann heißt ˇ jh.x; y/j ˇˇ ; 0 D 6 y 2 H khk WD sup 0 D 6 x 2 H 1 2 kxk1 kyk2 ˇ
(8.23)
(8.24)
die Norm von h. Die Wichtigkeit der Sesquilinearformen rührt davon her, dass zwischen den beschränkten linearen Operatoren S 2 B.H2 ; H1 / einerseits und den beschränkten Sesquilinearformen auf H1 H2 andererseits eine bijektive Korrespondenz besteht, so dass man bei Bedarf immer einen Operator durch seine Sesquilinearform ersetzen kann und umgekehrt. Für S 2 B.H2 ; H1 / ist nämlich durch h.x; y/ D hx j Syi1
für alle x 2 H1 ; y 2 H2
(8.25)
eine beschränkte Sesquilinearform definiert, wie man mühelos nachrechnet (Übung!). Dass hierdurch eine bijektive Abbildung gestiftet wird, ist der Inhalt des folgenden Theorems. Theorem 8.18 (Allgemeiner Darstellungssatz). Zu jeder beschränkten Sesquilinearform h W H1 H2 ! C existiert ein eindeutiger beschränkter linearer Operator S W H2 ! H1 ; so dass Gl. (8.25) besteht. Dabei gilt kS k D khk : (8.26) Beweis. Für festes y 2 H2 ist fy .x/ WD h.x; y/ ;
x 2 H1
ein beschränktes lineares Funktional auf H1 . Nach Thm. 8.16 gibt es dann ein eindeutiges z 2 H1 ; so dass h.x; y/ D hz j xi
für alle x 2 H1 .
Die Zuordnung y 7! z DW Sy definiert also eine wohlbestimmte Abbildung S W H2 ! H1 . Diese hat alle geforderten Eigenschaften und ist hierdurch auch eindeutig bestimmt, wie man nachrechnet (Übung!). t u Die adjungierte lineare Abbildung, die für endlichdimensionale H ILBERT-Räume aus der linearen Algebra bekannt ist (z. B. aus [36], Kap. 7), lässt sich auch in beliebigen H ILBERTräumen einführen, und unser Allgemeiner Darstellungssatz gestattet hierfür eine besonders bequeme Formulierung:
238
8 Beschränkte lineare Operatoren
Theorem 8.19. Jeder beschränkte lineare Operator T W H ! H besitzt einen eindeutig bestimmten adjungierten Operator T W H ! H mit hT x j yi D hx j T yi Dabei ist
für alle x; y 2 H .
kT k D kT k :
(8.27) (8.28)
Beweis. Durch h.x; y/ D hT x j yi ;
x; y 2 H
ist eine beschränkte Sesquilinearform auf H H definiert mit khk D kT k : Nach Thm. 8.18 gibt es dann einen eindeutig bestimmten Operator T W H ! H mit h.x; y/ D hx j T yi ; und für diesen gilt kT k D khk.
t u
Aus der Definitionsgleichung (8.27) für den adjungierten Operator sowie der Eindeutigkeitsaussage von Thm. 8.19 ergeben sich wie in der Linearen Algebra die folgenden Eigenschaften (Übung): Satz 8.20. Seien S; T 2 B.H / und ˛ 2 C. Dann gilt: a.
.S C T / D S C T ;
.˛T / D ˛T ;
b.
.T / D T ;
c.
kT T k D kT T k D kT k2
.S T / D T S
Wichtig ist außerdem, dass man Kern und Bild (= Nullraum und Wertebereich) des adjungierten Operators mit Kern und Bild des ursprünglichen Operators in Beziehung setzen kann: Satz 8.21. Für jedes T 2 B.H / ist N.T / D R.T /? ;
N.T / D R.T /? ;
(8.29)
R.T / D N.T /? ;
R.T / D N.T /? :
(8.30)
Insbesondere ist H D N.T / ˚ R.T /. Beweis. y 2 N.T / H) für jedes z D T x 2 R.T / ist hz j yi D hx j T yi D 0 H) y 2 R.T /? . Umgekehrt: y 2 R.T /? H) für alle x 2 H ist hx j T yi D hT x j yi D 0 H) T y 2 H ? D f0g H) T y D 0 H) y 2 N.T /. Damit ist die erste Gleichung in (8.29) erwiesen. Die erste Gleichung aus (8.30) folgt daraus mittels Thm. 7.13b., angewandt auf den abgeschlossenen Unterraum U WD R.T /. Wegen Lemma 7.12b. ist nämlich N.T /? D .R.T /? /? D U ?? D U :
D H ERMITEsche und unitäre Operatoren
239
Die jeweils zweite Gleichung in (8.29), (8.30) folgt wegen T D T durch Anwent u dung der ersten auf T statt T . Bemerkung: Wahrscheinlich ist Ihnen auch dieser Satz für den Fall endlichdimensionaler H ILBERTräume bekannt, allerdings mit R.T / statt R.T /; R.T / statt R.T /. Das liegt daran, dass jeder endlich-dimensionale Teilraum sowieso abgeschlossen ist (Satz 7.10b.), so dass das Bilden der Abschlüsse entfallen kann. Die Räume N.T / und N.T / sind auch im Fall unendlicher Dimension stets abgeschlossen, weil T; T stetig sind, aber die Wertebereiche müssen es nicht sein und sind es in der Praxis häufig auch nicht.
D H ERMITEsche und unitäre Operatoren Sei H ein C-H ILBERTraum. Die folgenden Begriffe entsprechen ebenfalls bekannten Begriffen aus der Linearen Algebra: Definitionen 8.22. Ein Operator T 2 B.H / heißt a. – normal, wenn
T T D T T ;
b. – selbstadjungiert (= H ERMITEsch), wenn T D T ; c. – isometrisch, wenn hT x j T yi D hx j yi
für alle x; y 2 H;
d. – unitär, wenn T bijektiv und T D T 1 ist. Für selbstadjungierte Operatoren hat man dann folgende Aussagen: Satz 8.23. a. Ist T 2 B.H / selbstadjungiert, so ist hx j T xi reell für alle x 2 H; und es gilt kT k D sup jhx j T xij D sup jhx j T xij : kxkD1
(8.31)
kxk1
b. Sind S; T 2 B.H / selbstadjungiert, so ist S T genau dann selbstadjungiert, wenn S T D T S . c. Sind Tn 2 B.H / selbstadjungiert und gilt Tn ! T in B.H /; so ist T selbstadjungiert.
240
8 Beschränkte lineare Operatoren
Beweis. a. Ist T selbstadjungiert, so ist hx j T yi D hT y j xi D hy j T xi ;
x; y 2 H ;
d. h. hx j T yi C hy j T xi D 2Re hx j T yi ;
hx j T yi hy j T xi D 2iIm hx j T yi (8.32) und insbesondere hx j T xi 2 R. Um (8.31) zu beweisen, setzen wir WD sup jhx j T xij D sup jhx j T xij : kxkD1
kxk1
(Dass die beiden Suprema gleich sind, ist trivial.) Wegen jhx j T xij kxk kT xk kT k kxk2 ist klar, dass kT k gilt. Umgekehrt ist nach (8.20) kT k D sup kT yk D sup jhx j T yij : kykD1
kykD1 kxkD1
Wir haben also zu zeigen, dass kxk D kyk D 1 H) jhx j T yij :
. /
Zunächst einmal ergibt (8.32) durch Ausdistribuieren hx C y j T x C T yi D hx j T xi C 2Re hx j T yi C hy j T yi und daher hx C y j T x C T yi hx y j T x T yi D 4Re hx j T yi : Ferner beachten wir, dass für 0 ¤ v 2 H der Vektor w WD v=kvk die Norm 1 hat. Daher ist jhw j T wij ; also jhv j T vij kvk2 :
.
/
Nun betrachten wir beliebige x; y 2 H mit kxk D kyk D 1. Wir schreiben hx j T yi D jhx j T yij ei ; also jhx j T yij D hz j T yi ; wobei z WD e x ebenfalls die Norm 1 hat. Das ergibt i
4jhx j T yij D 4Re hz j T yi D hz C y j T z C T yi hz y j T z T yi
D H ERMITEsche und unitäre Operatoren
241
jhz C y j T .z C y/ij C jhz y j T .z y/ij ./
kz C yk2 C kz yk2 .7:3/ D 2kzk2 C 2kyk2 D 4 ; woraus . / folgt. b. Es ist nach Satz 8.20b. .S T / D S T ” T S D S T ” T S D S T : c. Für alle x; y 2 H und alle n 2 N haben wir hTn x j yi D hx j Tn yi : Wegen kT Tn k ! 0 ist aber T x D limn!1 Tn x und ebenso für y. Daher folgt hT x j yi D hx j T yi ; also T D T . t u Bemerkungen: (i) Für komplexe H ILBERTräume gilt auch die Umkehrung von Teil a.: Wenn hx j T xi für jedes x 2 H reell ist, so ist T selbstadjungiert. Das kann man durch ein paar geschickte Rechnungen beweisen, bei denen man zusammen mit zwei Vektoren x; y 2 H auch die Vektoren ix; iy betrachtet. Für reelle Räume ist es aber falsch. Schon in der Ebene H D R2 ist ein Gegenbeispiel gegeben durch die Drehung R um den Winkel =2. Es ist hx j Rxi D 0; also reell, für alle x 2 R2 . Aber R ist nicht selbstadjungiert, sondern orthogonal, d. h. R D RT ist die Drehung um =2. (ii) Bei Teil c. wurde eigentlich noch mehr bewiesen: Ist T x D lim Tn x n!1
8x 2 H
(„ starke Operatorkonvergenz“) und sind die Tn selbstadjungiert, so ist auch T selbstadjungiert. Für unitäre Operatoren hat man folgende Aussagen: Satz 8.24. a. U 2 B.H / ist genau dann unitär, wenn U isometrisch und surjektiv ist. b. Sind U; V 2 B.H / unitär, so auch U 1 und U V . Die unitären Operatoren von H bilden also eine Gruppe. c. Ist T 2 B.H / selbstadjungiert, U 2 B.H / unitär, so ist auch S D U T U D U T U 1 selbstadjungiert.
242
8 Beschränkte lineare Operatoren
Beweis. a. Ist U isometrisch und surjektiv, so ist U bijektiv sowie kUxk D kxk
für alle x 2 H;
und U 1 W H ! H existiert daher als beschränkter Operator nach Satz 8.9. Ferner ist hUx j yi D hUx j U.U 1 y/i D hx j U 1 yi für alle x; y 2 H; also U D U 1 . Umgekehrt: Ist U unitär, so auch surjektiv, und es gilt U U D U U D I . Es folgt 8 x; y ; hUx j Uyi D hx j U Uyi D hx j yi d. h. U ist isometrisch. b. und c. sind eine leichte Übung. t u
E Projektionsoperatoren Sei H ein H ILBERTraum, U ein abgeschlossener Unterraum von H . Nach Thm. 7.13 gibt es dann die direkte Zerlegung H D U ˚ U? ; d. h. jedes x 2 H kann eindeutig in der Form mit u 2 U; w 2 U ?
x D uCw
(8.33)
geschrieben werden. Dadurch werden lineare Operatoren P W H ! H mit P x D u ; R.P / D U ;
N.P / D U ? ;
Q W H ! H mit Qx D w ; R.Q/ D U ? ;
N.Q/ D U
(8.34)
(8.35)
definiert. Wegen (8.33) kann man dann schreiben x D P x C Qx ;
(8.36)
d. h. es ist Q DI P ;
P DI Q :
Aus (8.36) und P x ? Qx folgt kxk2 D kP xk2 C kQxk2 ;
(8.37)
E Projektionsoperatoren
243
also kP xk; kQxk kxk. Daher sind P; Q beschränkte lineare Operatoren und kP k; kQk 1. Definition 8.25. Der durch (8.33), (8.34) definierte beschränkte lineare Operator P heißt die orthogonale Projektion oder der orthogonale Projektor auf den abgeschlossenen Unterraum U. Bemerkung: Wie man sieht, handelt es sich bei P und Q einfach um die Projektionen, die im Sinne der linearen Algebra zu der direkten Zerlegung H D U ˚ U ? gehören (vgl. etwa [36], Ergänzungen zu Kap. 7). Das Besondere ist, dass Kern und Bild der Projektoren hier orthogonal zueinander sind. Ob ein gegebener Operator P 2 B.H / ein orthogonaler Projektor ist, kann durch den folgenden Test entschieden werden: Satz 8.26. Ein beschränkter linearer Operator P W H ! H ist genau dann eine orthogonale Projektion, wenn er die Bedingung P2 D P D P
(8.38)
erfüllt. In diesem Fall gilt auch hx j P xi D kP xk2
für alle x 2 H :
(8.39)
Beweis. Sei P der orthogonale Projektor auf den abgeschlossenen Unterraum U und Q WD I P der auf U ? . Für jedes x 2 H folgt dann P x 2 R.P / D U D N.Q/; also P x P 2 x D .I P /P x D QP x D 0 und somit P 2 x D P x. Für x; y 2 H ist P x ? Qy; P y ? Qx und daher hP x j yi D hP x j P y C Qyi D hP x j P yi sowie hx j P yi D hP x C Qx j P yi D hP x j P yi : Es folgt hP x j yi D hx j P yi; also P D P . Damit haben wir (8.38) gezeigt. Für x D y ergibt die gerade durchgeführte Rechnung auch (8.39). Umgekehrt sei nun P 2 B.H / ein Operator, für den (8.38) gilt. Es sei Q WD I P und U WD R.P /. Dann ist Qz D 0 ” z D P z ” z 2 R.P / ; wobei für die letzte Äquivalenz P 2 D P zu beachten ist. Also ist U D N.Q/ und damit ein abgeschlossener Unterraum, da Q stetig ist. Nach (8.29) aus Satz 8.21 ist ferner N.P / D N.P / D R.P /? D U ? : Für jedes x 2 H ist aber PQx D P x P 2 x D 0; also Qx 2 N.P / D U ? . Wir haben daher x D P x C Qx mit P x 2 U und Qx 2 U ? ; d. h. P ist tatsächlich der orthogonale Projektor auf U. t u
244
8 Beschränkte lineare Operatoren
Die folgenden Rechenregeln für Projektoren werden häufig benötigt: Satz 8.27. Seien P1 ; P2 W H ! H orthogonale Projektoren mit R.Pk / D Uk ; k D 1; 2. Dann gilt: a. P WD P1 P2 ist genau dann ein orthogonaler Projektor, wenn P1 P2 D P2 P1 . Dann ist (8.40) R.P / D U1 \ U2 : b. P WD P1 C P2 ist genau dann ein orthogonaler Projektor, wenn U1 ? U2 ; d. h. P1 P2 D P2 P1 D 0. Dann ist R.P / D U1 ˚ U2 :
(8.41)
c. P WD P2 P1 ist genau dann ein orthogonaler Projektor, wenn U1 U2 ; d. h. P1 P2 D P2 P1 D P1 . Dann ist R.P / D U2 \ U1? :
(8.42)
Beweis. a. Die Vertauschbarkeit P1 P2 D P2 P1 ist nach Satz 8.23b. notwendig und hinreichend für P D P; aber auch hinreichend für P 2 D P; wie man sofort nachrechnet. Auch (8.40) wird durch einfaches Nachrechnen bestätigt. b. P D P1 C P2 ist selbstadjungiert. Wegen P 2 D P12 C P1 P2 C P2 P1 C P22 D P1 C P1 P2 C P2 P1 C P2 folgt P 2 D P ” P1 P2 C P2 P1 D 0 : Aus P1 P2 C P2 P1 D 0 folgt einerseits P2 P1 D P1 P2 und andererseits (indem man von links und von rechts mit P2 multipliziert): 2P2 P1 P2 D 0 ; also 0 D P2 .P1 P2 / D P2 .P2 P1 / D P2 P1 D P1 P2 : Die Umkehrung P1 P2 D P2 P1 D 0 H) P1 P2 C P2 P1 D 0 ist aber trivial. Die Aussage (8.41) ist eine leichte Übung. c. P D P2 P1 ist selbstadjungiert. Wegen P 2 D P22 P2 P1 P1 P2 C P12 D P2 P2 P1 P1 P2 C P1 folgt P 2 D P ” 2P1 D P1 P2 C P2 P1 :
F Beispiel: F OURIER transformation und F OURIER -P LANCHEREL-Operator
245
Multiplikation der Gleichung 2P1 D P1 P2 C P2 P1 mit P2 von links führt zu 2P2 P1 D P2 P1 P2 C P2 P1 ;
also
P2 P1 D P2 P1 P2 :
Multiplikation mit P2 von rechts hingegen führt auf 2P1 P2 D P1 P2 C P2 P1 P2 ;
also
P1 P2 D P2 P1 P2 :
Insgesamt ergibt sich P2 P1 P2 D P1 P2 D P2 P1 und damit P1 D
1 .P1 P2 C P2 P1 / D P1 P2 D P2 P1 ; 2
wie behauptet. Die Umkehrung P1 P2 D P2 P1 D P1 H) 2P1 D P1 P2 C P2 P1 ist wieder trivial. Die Aussage (8.42) kann ebenfalls als Übung bewiesen werden. t u
F Beispiel: F OURIERtransformation und F OURIER -P LANCHEREL-Operator Einer der bedeutsamsten linearen Operatoren überhaupt ist ohne Zweifel die F OU RIERtransformation. Für f 2 L1 WD L1 .Rn / definiert man die Fouriertransformierte fO D F f durch Z fO./ WD .2/n=2 f .x/ eihjxi dn x ; D .1 ; : : : ; n / 2 Rn (8.43) wobei auf Rn das euklidische Skalarprodukt h j xi WD
n X
k xk
kD1
verwendet wird. (Der Integrationsbereich ist hier und im Folgenden stets der ganze Rn und wird daher nicht eigens angegeben.) Außerdem definiert man Z fL./ WD fO./ D .2/n=2 f .x/ eihjxi dn x ; (8.44) und man schreibt fL D F f . Es ist klar, dass fO und fL in linearer Weise von f abhängen, und damit erweisen sich F ; F als lineare Operatoren mit dem Definitionsbereich L1 . Die Grundeigenschaften dieser Operatoren, wie sie in Lehrbüchern
246
8 Beschränkte lineare Operatoren
der F OURIERanalysis, der Funktionalanalysis oder auch in den meisten modernen Büchern über partielle Differentialgleichungen erläutert und bewiesen werden, werden wir jetzt freizügig benutzen (vgl. etwa [59, 74, 78, 79, 96, 106] oder auch [36], Kap. 33). Wegen j eit j D 1 für t 2 R folgt sofort Z .2/n=2 jfO./j jf .x/j dn x DW kf k1 8 2 Rn (8.45) und ebenso für jfL./j. Mit dem Satz von der dominierten Konvergenz aus der L E BESGUE schen Integrationstheorie kann man daher leicht zeigen, dass fO und fL stetige Funktionen sind. Die Wertebereiche R.F /; R.F/ liegen also in dem BA NACH raum BC.Rn / WD C.Rn / \ L1 .Rn / der stetigen beschränkten Funktionen auf Rn ; versehen mit der Supremumsnorm k k1 (vgl. Aufgabe 7.3). Das sog. R IEMANN -L EBESGUE-Lemma besagt, dass die F OURIERtransformierte einer integrierbaren Funktion stets im Unendlichen verschwindet, und damit liegen R.F / und R.F/ sogar in dem abgeschlossenen Teilraum C0 WD C0 .Rn /; der ebenfalls in Aufgabe 7.3 eingeführt wurde. Geht man in (8.45) links zum Supremum über die 2 Rn über, so erhält man die äquivalente Formulierung kF f k1 .2/n=2 kf k1
8 f 2 L1 ;
(8.46)
und analog für F . Nach Satz 8.3a. haben wir es also mit beschränkten linearen Operatoren F ; F W L1 ! C0 zu tun, denn der in (8.45) definierte Ausdruck kf k1 ist ja nichts anderes als die übliche Norm auf L1 (vgl. (7.24), (7.26)). Zugleich liefert (8.46) eine obere Abschätzung für die Operatornorm, nämlich kF k .2/n=2 . Eine untere Abschätzung gewinnt man durch Einsetzen einer geschickt gewählten Probefunktion '; denn nach (8.1) ist kF 'k1 für 0 ¤ ' 2 L1 : kF k k'k1 Eine geschickte Wahl ist '.x/ WD exp.jxj2 =2/ mit jxj2 D hx j xi D x12 C C xn2 ; denn bekanntlich stimmt diese Funktion mit ihrer F OURIERtransformierten überein, und daher können wir die Normen, um die es geht, leicht berechnen: Einerseits ist kF 'k1 D sup ejj
2 =2
2Rn
D 1 D '.0/ O ;
und andererseits erhält man durch Einsetzen von D 0 in (8.43) Z n=2 '.x/ dn x D .2/n=2 k'k1 ; '.0/ O D .2/
F Beispiel: F OURIER transformation und F OURIER -P LANCHEREL-Operator
247
also k'k1 D .2/n=2 . Daher ist .2/n=2 auch eine untere Schranke für die Operatornorm, und insgesamt folgt kF k D .2/n=2 : Abgesehen vom R IEMANN -L EBESGUE-Lemma sind alle diese Überlegungen recht trivial und illustrieren einfach, wie man mit vielen konkret gegebenen Operatoren umgehen kann. Von zentraler Bedeutung ist jedoch der folgende Satz: Theorem 8.28 (F OURIERsche Umkehrformel). Ist f 2 L1 und auch fO 2 L1 ; so gilt (8.47) f D F fO D F Ff : Hieraus kann man sofort eine Reihe wichtiger Folgerungen ableiten: Es ist N.F / D f0g; denn fO D 0 gehört sicherlich zu L1 . Also ist F injektiv, d. h. die Äquivalenzklasse Œf 2 L1 ist durch die stetige Funktion fO eindeutig festgelegt. Wegen R.F/ C0 muss die Klasse von f im Falle fO 2 L1 einen stetigen Vertreter haben, und wenn wir diesen als unsere Funktion f wählen, so gilt für jedes x 2 Rn nach (8.44) Z n=2 fO./ eihxji dn : (8.48) f .x/ D .2/ Die Substitution 7! im Integral führt dann auf Z f .x/ D .2/n=2 fL./ eihxji dn ; d. h. unter denselben Voraussetzungen gilt auch f D F fL D F F f :
(8.49)
Bemerkung: Wir werden sehen, dass der Wertebereich von F dicht in C0 ist (vgl. Theorem 11.32). Andererseits kann man beweisen, dass nicht jede Funktion aus C0 die F OURIERtransformierte einer L1 -Funktion ist, d. h. der Operator F ist nicht surjektiv. Insbesondere ist R.F / nicht abgeschlossen in C0 . Der inverse Operator F 1 W C0 R.F / ! L1 muss daher unbeschränkt sein, d. h. eine Ungleichung der Form kf k1 C kfOk1
. /
mit einer von f unabhängigen Konstanten C kann nicht für alle f 2 L1 bestehen. Anderenfalls könnte man nämlich aus der Vollständigkeit von L1 die Vollständigkeit von R.F / bzgl. der Supremumsnorm herleiten, und dann müsste R.F / in C0 abgeschlossen sein. Auf L1 \ R.F / stimmt F 1 nach der F OURIERschen Umkehrformel aber mit F überein, und dieser Operator ist beschränkt. Seine Beschränktheit
248
8 Beschränkte lineare Operatoren
bedeutet aber das Bestehen einer Ungleichung der Form kf k1 C kfOk1 ;
.
/
wann immer f 2 L1 und fO 2 L1 . In dieser Ungleichung sind die Normen k k1 und k k1 gegenüber ( ) vertauscht, was den scheinbaren Widerspruch erklärt. Man sieht hier, dass es bei der Frage, ob ein Operator beschränkt oder unbeschränkt ist, sehr genau darauf ankommt, welche Normen auf seinem Definitions- und seinem Wertebereich betrachtet werden. Der Operator F wird oft als die inverse F OURIERtransformation bezeichnet, was durch die Beziehungen (8.47) und (8.49) gerechtfertigt ist. Die gerade diskutierten Schwierigkeiten mit den Definitions- und Wertebereichen sowie deren Normen zeigen aber, dass dieser Ausdruck nicht wörtlich zu nehmen ist – im strengen Sinne ist F nicht die inverse Abbildung zu F . Mit Hilfe des BLE-Theorems kann man F und F jedoch zu Operatoren L2 ! L2 fortsetzen, und diese erweisen sich als zueinander inverse Bijektionen. (Wir schreiben überall kurz L2 statt L2 .Rn /.) Ausgangspunkt ist der bekannte Satz Satz 8.29. Sind f; g 2 L1 \ L2 ; so sind fO; gO 2 C0 \ L2 ; und es gilt die PARSE VAL sche Gleichung Z Z fO./g./ O dn D f .x/g.x/ dn x : (8.50) Hieraus folgern wir: Theorem 8.30 (Satz von P LANCHEREL). Im H ILBERTraum L2 D L2 .Rn / gibt es genau einen beschränkten linearen Operator U; der auf L1 \ L2 mit der F OU RIERtransformation F übereinstimmt. Dieser Operator ist unitär, und U 1 D U stimmt auf L1 \ L2 mit F überein. Man nennt U den F OURIER -P LANCHERELOperator. Beweis. Zunächst zeigen wir, dass D WD L1 \ L2 dicht in H WD L2 ist. Dazu betrachten wir eine Folge Rk ! 1 von positiven Zahlen Rk sowie die Funktionen ( 1 für jxj Rk ; k .x/ WD 0 für jxj > Rk : R R Für beliebiges f 2 H ist dann jk f j2 dn x jf j2 dn x < 1 und nach der S CHWARZschen Ungleichung auch Z jk f j dn x kk k2 kf k2 < 1 ; also k f 2 D. Nach dem Satz über dominierte Konvergenz haben wir außerdem Z kf k f k22 D .1 k .x//jf .x/j2 dn x ! 0
F Beispiel: F OURIER transformation und F OURIER -P LANCHEREL-Operator
249
für k ! 1. Also ist jedes f 2 H der Grenzwert einer in D verlaufenden Folge, d. h. D D H; wie behauptet. Nach dem BLE-Theorem (Theorem 8.7) hat F jD also eine eindeutige stetige Fortsetzung U W H ! H; und diese ist gemäß (8.6) gegeben durch den starken Grenzwert (8.51) Uf D lim F .k f / : k!1
Die PARSEVALsche Gleichung hUf j Ugi D hf j gi gilt nach Satz 8.29 zunächst für alle f; g 2 D; überträgt sich aber durch diesen Grenzübergang sofort auf alle f; g 2 H . Somit ist U eine Isometrie. Wegen fL./ D fO./ gilt (8.50) auch für F statt F ; und wir können F jD ganz genauso zu einer Isometrie V W H ! H fortsetzen. Wir werden zeigen, dass V D U ist. Dann folgt mit (8.30) R.U / D N.V /? D f0g? D H : Da H vollständig und U isometrisch ist, ist auch R.U / vollständig, folglich abgeschlossen in H; also R.U / D R.U / D H . Satz 8.24a. sagt uns nun, dass U unitär ist, und zwar mit U 1 D U D V . Wir müssen also nur noch U D V nachweisen. Dazu betrachten wir zunächst f; g 2 D und beachten die Sätze von F UBINI und T ONELLI aus der Integrationstheorie ( [36], Kap. 28). Wegen “ jf .x/g./j d2n .x; / D kf k1 kgk1 < 1 ist f .x/g./ über R2n integrierbar, und deswegen darf bei der nachstehenden Rechnung die Integrationsreihenfolge vertauscht werden. Wir haben Z O hUf j gi D hf j gi D fO./g./ dn “ n=2 D .2/ f .x/ eihjxi g./ dn x dn “ n=2 f .x/g./ eihjxi dn dn x D .2/ Z D f .x/g.x/ L dn x D hf j Vgi : Wegen (8.51) (und seiner Entsprechung für V ) überträgt sich die Gleichung hUf j gi D hf j Vgi durch Grenzübergang aber auf alle f; g 2 H . Wegen der Eindeutigkeit des adjungierten Operators ist damit V D U nachgewiesen. t u
250
8 Beschränkte lineare Operatoren
Bemerkung: In der Quantenmechanik vermittelt der F OURIER -P LANCHERELOperator die Äquivalenz zwischen der Ortsdarstellung und der Impulsdarstellung. Manchmal schreibt man wieder fO statt Uf und gibt Formel (8.51) in der Gestalt Z fO./ D .2/n=2 lim f .x/ eihjxi dn x (8.52) R!1 jxjR
wieder. Dabei ist aber zu beachten, dass diese Gleichung i. A. nicht punktweise richtig ist, sondern nur in dem Sinne, dass die rechten Seiten, aufgefasst als Funktionen von ; für R ! 1 im quadratischen Mittel gegen die Klasse fO 2 L2 konvergieren.
Aufgaben zu Kap. 8 8.1. Bei den folgenden Beispielen von linearen Funktionalen f W E ! K beweise man die Beschränktheit und berechne die Operatornorm: P a. E WD l 1 ist der Raum aller Folgen x D .1 ; 2 ; : : :/; für die die Reihe k k absolut konvergent ist, versehen mit der Norm kxk1 WD
1 X
jk j;
kD1
und f ist definiert durch f .x/ WD
1 X
k k ;
kD1
wobei . 1 ; 2 ; : : :/ eine fest vorgegebene beschränkte Folge ist. b. E WD LQ 1R .Œa; b/ aller stetigen reellen Funktionen u auf dem kompakten Intervall Œa; b .a < b/; versehen mit der Norm Z b kuk1 WD ju.x/j dx ; a
und f ist definiert durch Z
b
f .u/ WD
h.x/u.x/ dx ; a
wobei h W Œa; b ! R eine fest vorgegebene stetige Funktion ist. c. E WD C.Œa; b/ ist der Raum aller stetigen Funktionen auf dem kompakten Intervall Œa; b; versehen mit der Norm kuk1 WD maxaxb ju.x/j ; und f ist definiert durch f .u/ WD u.x0 / ; wo x0 2 Œa; b ein fest vorgegebener Punkt ist.
Aufgaben
251
8.2. Eine Folge x D .1 ; 2 ; : : :/ in K heißt abbrechend, wenn k ¤ 0 nur für endlich viele Indizes k gilt. Die abbrechenden Folgen bilden offenbar einen KVektorraum V . Man zeige: a. Ist y D . 1 ; 2 ; : : :/ eine beliebige Folge in K; so ist durch fy .x/ WD
1 X
k k
kD1
eine lineare Abbildung fy W V ! K gegeben. b. Es sei E1 der Raum V; versehen mit der Norm k k1 von l 1 (vgl. Aufgabe 8.1a.). Dann ist fy als lineares Funktional auf E1 genau dann beschränkt, wenn die Folge y beschränkt ist. c. Es sei E1 der Raum V; versehen mit der Norm kxk1 WD sup jk j k1
für x D .k /k :
Dann ist fy als lineares Funktional auf E1 genau dann beschränkt, wenn 1 X
j k j < 1
kD1
ist. 8.3. Bei den folgenden Beispielen von linearen Operatoren A W E ! F beweise man jeweils die Beschränktheit und berechne eine (möglichst genaue) obere Schranke für die Operatornorm: a. E D l 1 ; F D l 1 (vgl. Aufgabe 8.1a. und Beispiel 7.6e.), und A ist gegeben durch eine doppelt unendliche Matrix .˛jk /; für die gilt: M WD sup j˛jk j < 1 : j;k2N
Dabei ist für x D .k /k1 2 l 1 der Vektor Ax D . 1 ; 2 ; : : :/ gegeben durch j WD
1 X
˛jk k ;
j 1:
(8.53)
kD1
(Wieso sind diese Reihen überhaupt konvergent, und wieso liefert (8.53) ein Element von l 1 ?) b. E D F D l 2 (vgl. 7.6f.), und A ist wieder durch (8.53) definiert, doch diesmal erfüllt die gegebene Matrix die Bedingung C WD
1 X j;kD1
j˛jk j2 < 1 :
252
8 Beschränkte lineare Operatoren
c. E D F D C.Œa; b/; und für u 2 E ist v D Au definiert durch Z b v.x/ WD K.x; y/ u.y/ dy ;
(8.54)
a
wobei K eine gegebene stetige Funktion auf Œa; bŒa; b ist. (Wieso ist v wieder stetig?) d. E D F D L2 .Œa; b/; und A ist wieder durch eine stetige Funktion K auf Œa; b Œa; b gegeben, indem v D Au durch (8.54) definiert wird. e. E D F D L2 .S /; wo S Rn eine messbare (z. B. eine offene oder eine abgeschlossene) Teilmenge ist, und A ist der Multiplikationsoperator zu einer gegebenen beschränkten messbaren Funktion ' W S ! K; d. h. für u 2 L2 .S / ist Au definiert durch .Au/.x/ WD '.x/u.x/ ;
x2S:
f. E D F D BC.R/; der Raum aller stetigen beschränkten Funktionen auf der reellen Geraden, versehen mit der Supremumsnorm, und A definiert durch .Au/.x/ WD u.x x0 / ;
x2R;
wobei x0 2 R eine fest vorgegebene Zahl ist. g. E D F D L2 .Rn /; und A definiert durch .Au/.x/ WD u.Bx/ ;
x 2 Rn ;
wobei B W Rn ! Rn eine fest vorgegebene lineare Abbildung ist (etwa durch eine n n-Matrix gegeben). h. E D C.Œa; b/; F D L2 .Œa; b/; und A ist der sog. Einbettungsoperator Au WD u. Hier ist Au also nichts anderes als das gegebene Element u 2 E; doch wird es jetzt als Element von F aufgefasst. 8.4. Sei a < b und E WD C.Œa; b/; versehen mit der Maximumsnorm. Wir definieren einen linearen Operator T W E D.T / ! E durch D.T / D C 1 .Œa; b/ ;
T u WD u0 du= dx :
Man zeige: a. Als linearer Operator in E ist T unbeschränkt. (Hinweis: Man betrachte z. B. das Verhalten von T entlang der Funktionenfolge um .x/ WD sin mx; m 1.) b. Es sei E1 der Raum D.T /; versehen mit der Norm k k1;1 aus Aufgabe 7.4. Dann ist T 2 B.E1 ; E/. 8.5. Sei E ein BANACHraum und B.E/ der BANACHraum der beschränkten linearen Operatoren A W E ! E. Man zeige: a. Für jedes A 2 B.E/ ist durch exp A eA WD
1 X Ak kD0
kŠ
(8.55)
Aufgaben
253
ein Element exp A 2 B.E/ definiert. Die Reihe ist dabei absolut konvergent, und es gilt (8.56) k exp Ak ekAk : b. exp A besitzt stets einen inversen Operator in B.E/; nämlich .exp A/1 D exp .A/ :
(8.57)
c. Wenn für S 2 B.E/ der inverse Operator S 1 2 B.E/ existiert, so gilt S 1 eA S D exp .S 1 AS / :
(8.58)
d. Sind A; B 2 B.E/ vertauschbar, d. h. AB D BA; so gilt eACB D eA eB D eB eA
(8.59)
sowie auch e B D B e . (Hinweis: Zunächst überzeuge man sich, dass für vertauschbare Operatoren die binomische Formel ! k X k k .A C B/ D Akm B m m mD0 A
A
gültig ist. Dann beachte man, dass man mit absolut konvergenten Reihen im BANACHraum B.E/ genauso rechnen kann wie mit solchen in K – die Beweise aus der elementaren Analysis übertragen sich Wort für Wort.) 8.6. Es sei E ein BANACHraum und J R ein Intervall. Man sagt, eine Funktion u W J ! E sei (stark) differenzierbar in t0 2 J; wenn der Differentialquotient u0 .t0 /
u.t0 C h/ u.t0 / du .t0 / WD lim h!0 dt h h¤0
im Sinne der starken Konvergenz existiert. Für u0 .t0 / gilt also 0 u.t0 C h/ u.t0 / D 0: .t / lim u 0 h!0 h h¤0 Damit ist auch klar, was eine differenzierbare bzw. eine stetig differenzierbare Ewertige Funktion auf J ist. Man zeige: a. Sind u; v W J ! E sowie ' W J ! K differenzierbar, so sind es auch u C v und 'u; und es gilt .u C v/0 D u0 C v 0 ;
.'u/0 D ' 0 u C 'u0 :
b. Ist F ein weiterer BANACHraum, A 2 B.E; F / und w WD A ı u; so ist auch w differenzierbar, und es gilt w 0 .t/ D Au0 .t/
für alle t 2 J :
Insbesondere ist für jedes f 2 E 0 die skalare Funktion f ı u differenzierbar.
254
8 Beschränkte lineare Operatoren
c. u ist genau dann konstant, wenn u0 0 auf J . (Hinweis: Man wende den Satz von H AHN -BANACH auf x0 D u.t1 / u.t2 / an (t1 ; t2 2 J beliebig).) 8.7. Seien E und J wie in der vorigen Aufgabe. Man zeige: a. Sind S; T W J ! B.E/ zwei differenzierbare operatorwertige Funktionen, so ist auch ihr punktweises Produkt S T W t 7! S.t/T .t/ differenzierbar, und es gilt .S T /0 D S 0 T C S T 0 . b. Sei A 2 B.E/ beliebig, und sei T .t/ WD etA (vgl. Aufgabe 8.5). Diese Funktion ist auf ganz R differenzierbar, und es gilt T 0 .t/ D AT .t/ D T .t/A ;
t 2R:
(Hinweis: Man schreibe T .t0 C h/ T .t0 / D T .t0 /.T .h/ I / D T .t0 /
1 X hk Ak : kŠ
kD1
Wieso sind diese Umformungen gerechtfertigt?) 8.8. Sei E ein BANACHraum und K Rn eine kompakte Teilmenge. Mit C.KI E/ bezeichnen wir den Raum der stetigen Funktionen u W K ! E; versehen mit der Norm kuk1 WD max ku.x/k ; x2K
wobei auf der rechten Seite die Norm von E gemeint ist. Man zeige: a. Zu u 2 C.KI E/ gibt es höchstens ein x0 2 E mit der Eigenschaft Z f .x0 / D f .u.x// dn x für alle f 2 E 0 :
(8.60)
K
(Hinweis: Satz 8.13.) Wenn solch ein Vektor x0 existiert, bezeichnet man ihn als das Integral und schreibt Z u.x/ dn x : x0 D K
b. Für das Integral gilt stets Z Z u.x/ dn x ku.x/k dn x : K
(8.61)
K
R (Hinweis: Man wende den Satz von H AHN -BANACH auf x0 D K u.x/ dn x an.) c. Es sei C.K/ ˝ E der lineare Teilraum der u 2 C.KI E/; die sich in der Form u.x/ D
m X kD1
'k .x/vk
(8.62)
Aufgaben
255
mit endlich vielen skalaren stetigen Funktionen '1 ; : : : ; 'm und endlich vielen Vektoren v1 ; : : : ; vm 2 E schreiben lassen. Für jedes derartige u existiert das Integral und ist gegeben durch Z u.x/ d x D n
K
m Z X
n
K
kD1
'k .x/ d x
vk :
(8.63)
Insbesondere ist die rechte Seite von (8.63) durch u eindeutig festgelegt, obwohl die Darstellung von uR in der Form (8.62) nicht eindeutig ist. d. Wir setzen J0 u WD K u.x/ dn x für u 2 C.K/ ˝ E. Hierdurch ist ein beschränkter linearer Operator J0 W C.K/ ˝ E ! E definiert, und seine Operatornorm ist das n-dimensionale Volumen (= L EBESGUE-Maß) von K. (Hier sei E ¤ f0g.) e. C.K/ ˝ E ist dicht in C.KI E/. (Hinweise: Hier muss man die gleichmäßige Stetigkeit von u 2 C.KI E/ verwenden. Für den Spezialfall K D Œa; b R1 ist die Aufgabe wesentlich leichter als für den allgemeinen Fall. Die Bearbeitung dieses Spezialfalls sei besonders empfohlen.) R f. Für jedes u 2 C.KI E/ existiert das Integral J u WD K u.x/ dn x. Die so definierte Abbildung J W C.KI E/ ! E ist ein beschränkter linearer Operator, und seine Operatornorm ist (für E ¤ f0g) gleich dem Volumen von K. (Hinweis: BLE-Theorem!) g. Sei F ein weiterer BANACHraum und T W E ! F ein beschränkter linearer Operator. Für jedes u 2 C.KI E/ ist dann Z Z T u.x/ dn x D T u.x/ dn x : K
K
8.9. Sei E ein BANACHraum und Œa; b R ein kompaktes Intervall. Für jede stetig differenzierbare Funktion u W Œa; b ! E gilt dann Z
b
u.b/ u.a/ D
u0 .t/ dt :
a
(Hinweis: Mittels (8.61) und Aufgabe 8.6c. kann man den aus der elementaren Analysis bekannten Beweis imitieren. Weitaus bequemer ist es aber, die Aussagen der Aufgaben 8.8a. und 8.6b. auszunutzen.) 8.10. Man beweise den Satz von H AHN -BANACH (Theorem 8.14) für Prähilberträume. Dabei gebe man das gesuchte Funktional in der Form f .x/ D hz j xi an. 8.11. Sei H ein H ILBERTraum und S 2 B.H /. Angenommen, es gibt c > 0 so, dass 8x 2 H : Re hx j S xi ckxk2 Man zeige, dass S dann bijektiv sein muss und eine beschränkte Inverse S 1 2 B.H / besitzt. (Hinweis: Das Schwierigste ist die Surjektivität. Dazu zeige man, dass R.S / sowohl dicht als auch vollständig ist. )
256
8 Beschränkte lineare Operatoren
8.12. a. Sei H D l 2 ; und sei A 2 B.H / der Operator aus Aufgabe 8.3b. Man zeige, dass A auf dieselbe Weise durch die Matrix .ˇjk / mit ˇjk WD ˛ kj ;
j; k 2 N
gegeben ist. b. Sei H D L2 .Œa; b/; und sei A der Operator aus Aufgabe 8.3d. Man zeige, dass A auf dieselbe Weise durch die Funktion K mit K .x; y/ WD K.y; x/ ;
x; y 2 Œa; b
gegeben ist. c. Es sei A der Multiplikationsoperator aus Aufgabe 8.3e. in H D L2 .S /. Man zeige, dass A dann der Multiplikationsoperator mit der konjugiert komplexen Funktion ' ist. Insbesondere ist der Multiplikationsoperator zur Funktion ' genau dann selbstadjungiert, wenn ' reellwertig ist. 8.13. In H D l 2 definiert man sog. Verschiebeoperatoren durch Vr .1 ; 2 ; : : :/ WD .0; 1 ; 2 ; : : :/ und Vl .1 ; 2 ; 3 ; : : :/ WD .2 ; 3 ; : : :/ : Vr
a. Man zeige, dass D Vl ; Vl D Vr . Ferner bestimme man den Nullraum und den Wertebereich von Vr und Vl und prüfe an diesem expliziten Beispiel die Gültigkeit von Satz 8.20a. b. Man zeige, dass Vr eine Isometrie ist und berechne Vr Vr und Vr Vr . Man folgere, dass Vr nicht unitär ist. 8.14. Sei H ein komplexer H ILBERTraum. Man zeige: a. Für jedes T 2 B.H / sind die Operatoren T CT;
i.T T / ;
T T ;
TT
alle selbstadjungiert. b. Jedes T 2 B.H / lässt sich eindeutig in der Form T D A C iB mit selbstadjungierten Operatoren A; B schreiben. Dabei ist T D A iB. Der Operator T ist genau dann normal, wenn AB D BA. c. Ist V 2 B.H / eine Isometrie, so ist V V D I; und V V ist eine orthogonale Projektion. d. Ist A 2 B.H / normal, so ist kA xk D kAxk für alle x 2 H . 8.15. Sei H ein H ILBERTraum, T W H ! H ein beschränkter linearer Operator. Man zeige: a. Ist T bijektiv und T 1 beschränkt, so existiert .T /1 und es gilt .T /1 D .T 1 / :
Aufgaben
257
b. Der Operator S D I C T T ist bijektiv und seine Inverse S 1 ist beschränkt. (Hinweis: Aufgabe 8.11.) 8.16. Sei H ein H ILBERTRAUM, A W H ! H ein beschränkter linearer Operator. Man zeige: a. Sind M1 ; M2 H Teilmengen mit A.M1 / M2 ; so gilt A M2? M1? : b. Sind U; V abgeschlossene Unterräume von H; so gilt A.U / V ” A .V ? / U ? : 8.17. Sei H ein H ILBERTraum, U H ein abgeschlossener Unterraum, A 2 B.H / ein beschränkter Operator und P die orthogonale Projektion auf U. Man zeige: a. b.
A.U/ U ” AP D PAP; A.U/ und A.U ? / U ? ” PA D AP .
8.18. Sei H ein H ILBERTraum, A W H ! H ein beschränkter linearer Operator. Man zeige: N.A/ D N.A A/ und R.A/ D R.AA / : 8.19. Sei H ein H ILBERTraum und A 2 B.H /. Man zeige, dass für die in Aufgabe 8.5 eingeführte Exponentialfunktion von Operatoren Folgendes gilt: a. exp A D .exp A/ . b. Ist A H ERMITEsch, so ist exp.iA/ unitär. c. Ist exp.itA/ unitär für alle t 2 R; so ist A H ERMITEsch. (Hinweis: Man verwende Aufgabe 8.7b. in t D 0.) 8.20. Sei H ein H ILBERTraum. Der Raum l 2 .H / ist definiert als der Vektorraum aller Folgen v D .v1 ; v2 ; : : :/ von Elementen von H; für die kvk2 WD
1 X
kvj k2 < 1
j D1
ist. Damit ist zugleich die Norm auf l 2 .H / gegeben. l 2 .H / ist ein H ILBERTraum mit dem Skalarprodukt 1 X hvj j wj i hv j wi WD j D1
für v D .vj /; w D .wj /; wobei rechts das Skalarprodukt von H gemeint ist. (All das kann genauso bewiesen werden wie für l 2 ; kann also hier akzeptiert werden.) Man zeige:
258
8 Beschränkte lineare Operatoren
a. Ist fbj j j 2 Ng eine Orthonormalbasis von H; so bilden die Vektoren ejk WD .0; : : : ; 0;
bk ; 0; : : :/ ; „ƒ‚…
j; k 2 N
j -te Stelle
eine Orthonormalbasis von l 2 .H /. b. Angenommen, H ist separabel. Dann gibt es einen isometrischen IsomorphisO mus U W l 2 ˝H ! l 2 .H / mit U.y ˝ v/ D . 1 v; 2 v; : : :/ für alle v 2 H und y D . j / 2 l 2 . (Hinweis: Man arbeite mit einer Orthonormalbasis von der in a. beschriebenen Art.) 8.21. Man beweise: Jeder abgeschlossene Unterraum eines separablen H ILBERTraums ist selbst ein separabler H ILBERTraum. (Hinweis: Man arbeite mit dem orthogonalen Projektor auf den Unterraum.) 8.22. Sei H ein beliebiger H ILBERTraum, U H ein abgeschlossener Unterraum und P der orthogonale Projektor auf U. Man zeige: a. Ist U endlich-dimensional, so gilt für jede Orthonormalbasis fe1 ; : : : ; em g von U m X Px D hek j xiek für alle x 2 H : kD1
b. Ist U separabel und fe1 ; e2 ; : : :g eine abzählbare Orthonormalbasis von U (vgl. Satz 7.5), so gilt Px D
1 X
hek j xiek
für alle x 2 H ;
kD1
wobei die Reihe in H stark konvergent ist. 8.23. Sei H ein H ILBERTraum, seien M; N abgeschlossene Unterräume von H und seien PM ; PN die orthogonalen Projektionen von H auf M bzw. N . Man zeige, dass folgende Aussagen äquivalent sind: a. hx j PM xi hx j PN xi für alle x 2 H; b. M N; c. PN PM D PM ; d. PM PN D PM . 8.24. Wir wollen beweisen, dass die kanonischen Vertauschungsrelationen der Quantenmechanik durch beschränkte lineare Operatoren in einem NLR E nicht erfüllt werden können. Wir nehmen also an, für zwei Operatoren P; Q 2 B.E/ gilt PQ QP D I
Aufgaben
259
mit einem Skalar 2 K. Zu zeigen ist, dass dann D 0 sein muss. Hierzu beweise man nacheinander: a. Für alle n 2 N ist
n Qn1 D PQn Qn P :
b. Für alle n ist nj j kQn1 k 2kP k kQk kQn1 k : c. Wenn Qn ¤ 0 ist für alle n 1; so folgt D 0. d. Wenn es n 2 N gibt, für das Qn D 0 ist, so muss ebenfalls D 0 sein. (Hinweis: Man betrachte das kleinste derartige n und verwende die Gleichung aus Teil a.)
Kapitel 9
Einführung in die Spektraltheorie
Das Thema dieses Kapitels ist die Verallgemeinerung der Eigenwerttheorie der komplexen n n-Matrizen auf beschränkte lineare Operatoren in einem BANACHraum. Eigenwerte und Eigenvektoren von linearen Operatoren – etwa von Differentialoperatoren – spielen schon in der klassischen Physik eine fundamentale Rolle, z. B. bei der Beschreibung von Schwingungsvorgängen aller Art. Die Eigenwerte bestimmen dann die möglichen Frequenzen der Schwingung, und die entsprechenden Eigenfunktionen beschreiben die Schwingungsform. In der Quantenmechanik werden Observable (D physikalische Messgrößen) durch lineare Operatoren in einem H ILBERTraum wiedergegeben, dessen (normierte) Vektoren den möglichen Zuständen des betrachteten Systems entsprechen. Ein Eigenvektor entspricht dabei einem Zustand, in dem die betreffende Observable einen scharfen Wert besitzt, also beliebig genau gemessen werden kann, und dieser Wert ist nichts anderes als der zugehörige Eigenwert. Genauso real sind jedoch physikalische Zustände, in denen die Observable keinen scharfen Wert besitzt, und dann kann nur noch die Wahrscheinlichkeit dafür angegeben werden, dass der Messwert in einem gegebenen Bereich gefunden wird. Schon diese physikalische Erwägung legt die Vermutung nahe, dass bei Operatoren in unendlich-dimensionalen Räumen neben den Eigenwerten selbst auch gewisse Typen von „verallgemeinerten Eigenwerten“ betrachtet werden müssen, und dies geschieht in der Spektraltheorie auf eine einfache Weise, die eine große Breite möglicher Situationen abdeckt. Die entsprechenden Grundbegriffe und ihre einfachsten Eigenschaften stellen wir in Abschn. A zusammen, und obwohl uns in erster Linie der Fall der H ILBERTräume interessiert, tun wir das im Rahmen eines allgemeinen BANACHraums, weil die zusätzlichen Strukturmerkmale der H ILBERTräume hierfür nicht benötigt werden. Im weiteren Verlauf jedoch beschränken wir uns auf H IL BERT räume und bemühen uns in Abschn. B zunächst, die aus der linearen Algebra bekannten Besonderheiten der unitären und der H ERMITEschen Matrizen zu verallgemeinern. Als Beispiel betrachten wir den F OURIER -P LANCHEREL-Operator, dessen Spektraltheorie sich als verblüffend einfach erweist. Wie wir in Abschn. D sehen werden, ist die Spektraltheorie der in Abschn C eingeführten kompakten Operatoren dem Fall der Matrizen besonders ähnlich, und
K.-H. Goldhorn, H.-P. Heinz, M. Kraus, Moderne mathematische Methoden der Physik DOI 10.1007/978-3-540-88544-3, © Springer 2009
261
262
9 Einführung in die Spektraltheorie
insbesondere ist hier jeder Spektralwert ¤ 0 schon ein Eigenwert und besitzt einen endlich-dimensionalen Raum von Eigenvektoren. In Abschn. C erörtern wir auch kurz den Begriff der schwachen Konvergenz in einem H ILBERTraum, doch dient uns dies nur als ein Hilfsmittel zur Vermeidung von allzu viel mengentheoretischer Topologie bei der Behandlung der kompakten Operatoren, und deswegen vertiefen wir ihn auch nicht weiter. Wie im vorigen Kapitel werden auch hier die abstrakten Operatoren als selbständige Rechengrößen ernst genommen, wie es ja auch im abstrakten Formalismus der Quantenmechanik geschieht. Dazu bedarf es keiner konkreten Interpretation der Operatoren. Ebenso wichtig ist jedoch, dass die Funktionalanalysis kraftvolle Werkzeuge für die Behandlung von ganz konkreten Problemen bereitstellt. Ein Paradebeispiel hierfür ist die Anwendung der Spektraltheorie der kompakten Operatoren auf F REDHOLMsche Integralgleichungen und auf Randwertprobleme für verallgemeinerte Schwingungsgleichungen, die wir im letzten Abschnitt dieses Kapitels darstellen.
A Spektrum und Resolvente Im Folgenden sei E immer ein komplexer BANACHraum. Für einen beschränkten linearen Operator A W E ! E und ein 2 C betrachten wir den Operator A I . Der Ausgangspunkt der Spektraltheorie besteht darin, die Werte des Parameters in Bezug auf die Abbildungseigenschaften von A I zu klassifizieren: Definitionen 9.1. Für A 2 B.E/ und 2 C gibt es folgende Möglichkeiten: a. A I ist nicht injektiv, d. h. N.A I / 6D f0g : Dann heißt ein Eigenwert von A mit Eigenraum N.A I / und Vielfachheit dim N.AI /. Jedes 0 6D x 2 N.AI / heißt ein Eigenvektor zum Eigenwert . Man nennt P .A/ D f 2 C j N.A I / 6D f0gg das Punktspektrum von A. b. A I ist injektiv, d. h. N.A I / D f0g. Dann existiert der Resolventenoperator (= Resolvente) RA ./ WD .A I /1 ; wobei folgende Fälle auftreten können: 1. 2.
RA ./ ist auf ganz E definiert und beschränkt. Dann heißt ein regulärer Wert von A. Die regulären Werte bilden die Resolventenmenge .A/. RA ./ ist auf einem dichten Teilraum definiert, aber unbeschränkt. Dann heißt ein verallgemeinerter Eigenwert von A. Diese bilden das kontinuierliche Spektrum C .A/.
A Spektrum und Resolvente
3.
263
Der Definitionsbereich von RA ./ ist nicht dicht. Diese bilden das Residualspektrum R .A/.
c. Man hat also disjunkte Zerlegungen C
D .A/ [ .A/ ;
.A/ D P .A/ [ C .A/ [ R .A/ ; und man nennt .A/ das Spektrum, 2 .A/ einen Spektralwert von A. Bemerkung: Damit sind wirklich alle auftretenden Fälle abgedeckt. Ist nämlich RA ./ beschränkt, so kann man leicht beweisen, dass sein Definitionsbereich D.RA .// D R.A I / vollständig ist (Übung!). Ist dieser Raum gleichzeitig dicht, so muss er mit E übereinstimmen, und ist ein regulärer Wert. Dass umgekehrt RA ./ auf ganz E definiert, aber gleichzeitig unbeschränkt ist, kann ebenfalls nicht vorkommen. Das liegt am sog. Satz von der offenen Abbildung, einem fundamentalen Theorem der Funktionalanalysis, das aber hier zu weit führen würde. Allerdings ist die Vollständigkeit von E für dieses Theorem eine entscheidende Voraussetzung. Warnung. In vielen Büchern wird die Resolvente als RA ./ WD .I A/1 definiert, unterscheidet sich also von unserer Resolvente um ein Vorzeichen! Beispiele 9.2. a. Sei E endlich-dimensional, etwa dim E D n. Man weiß aus der elementaren linearen Algebra, dass dann dim R.A I / D n dim N.A I / ist, und insbesondere gilt A I injektiv ” A I surjektiv ” A I bijektiv : Ist aber A I bijektiv, so ist RA ./ automatisch beschränkt (Korollar 8.5). In diesem Fall gibt es also nur die beiden Möglichkeiten, dass ein regulärer Wert oder ein Eigenwert ist, d. h. das Spektrum ist einfach die Menge der Eigenwerte, und man kann sagen, dass die Spektraltheorie für endlich-dimensionale Räume die Eigenwerttheorie ist. Im unendlich-dimensionalen Fall ist das aber nicht so, wie wir jetzt sehen werden. b. Sei E D L2 .Œa; b/; a < b; und sei A der Multiplikationsoperator mit einer gegebenen stetigen Funktion ' W Œa; b ! C (vgl. Aufgabe 8.3e.). Der Wertebereich W WD '.Œa; b/ von ' ist dann kompakt. Wir beweisen:
264
9 Einführung in die Spektraltheorie
Behauptung. (i) .A/ D W ; und (ii) ein 2 W gehört genau dann zu C .A/; wenn die Menge ' 1 .fg/ das L EBESGUE-Maß Null hat (also z. B. wenn ' den Wert nur an endlich vielen Punkten annimmt), (iii) ist genau dann ein Eigenwert, wenn die Menge ' 1 .fg/ positives Maß hat (also z. B. wenn ' auf einem Teilintervall Œ˛; ˇ Œa; b mit ˛ < ˇ konstant den Wert hat), (iv) R .A/ D ;. Beweis. Ist 62 W; so ist r WD d.; W / D min j j > 0 ; 2W
da W kompakt ist. Die Funktion .x/ WD 1=.'.x/ / ist dann beschränkt, denn j .x/j r 1 8 x. Sie definiert daher einen Multiplikationsoperator M 2 B.E/ durch .M u/.x/ WD .x/u.x/. Damit folgt M.A I /u D .A I /M u D u
für alle u 2 E :
Somit ist M D RA ./; also ein regulärer Wert. Für 2 W zeigen wir nun mittels Satz 8.9, dass A I keine beschränkte Inverse besitzen kann. Dazu nehmen wir an, es gäbe ein c > 0; mit dem (8.10) für den Operator T WD A I gilt. Wir wählen x0 2 ' 1 .fg/ und dazu ı > 0 mit jx x0 j < ı ; x 2 Œa; b H) j'.x/ j < c=2 ; was wegen der Stetigkeit von ' möglich ist. Schließlich wählen wir a ˛ < ˇ b so, dass Œ˛; ˇ x0 ı; x0 C ıŒ; und wir betrachten die Funktion u 2 E p mit u 1 auf Œ˛; ˇ und u 0 sonst. Es ist kuk2 D ˇ ˛ > 0 sowie Zˇ c
2
kuk22
k.A
I /uk22
D
j'.x/ j2 dx
kAk :
(9.6)
(9.7)
Beweis. a. Sei 0 2 .A/ und sei 2 C gemäß (9.4) gewählt. Setzen wir dann in Satz 9.4 L WD A 0 I ; so ist
S WD .0 /I ;
.L C S /1 D .A I /1 D RA ./ ;
und (9.1) ist dann wegen (9.4) erfüllt, so dass (9.5) aus (9.2) folgt. b. Gleichung (9.7) folgt ebenfalls aus (9.2), wenn man L WD I ;
S WD A
setzt. t u Satz 9.6. Für jeden beschränkten Operator A 2 B.E/ ist .A/ 6D ; : Beweis. Angenommen, es ist .A/ D ; und damit .A/ D C. Für feste x 2 E; f 2 E 0 ist dann die Funktion h./ WD f .RA ./x/ auf ganz C analytisch nach Theorem 9.5a., denn (9.5) liefert an jedem Punkt 0 2 C eine konvergente Potenzreihenentwicklung für h./. Da außerdem für jj > kAk k.A I /xk .jj kAk/ kxk gilt, folgt aus Satz 8.9. kRA ./k
1 jj kAk
für jj > kAk ;
so dass h./ auf ganz C beschränkt ist. Nach dem bekannten Satz von L IOUVILLE aus der komplexen Analysis (vgl. z. B. [36], Kap. 16) ist dann aber h./ konstant. Da f 2 E 0 beliebig war, folgt mit Satz 8.13, dass RA ./ als Funktion von konstant ist, was offenbar ein Widerspruch zur ersten Resolventengleichung aus Satz 9.3b. ist. t u
268
9 Einführung in die Spektraltheorie
B Spektrum beschränkter selbstadjungierter und unitärer Operatoren Ab jetzt betrachten wir stets einen komplexen H ILBERTraum H . Die folgende Aussage über unitäre Operatoren ist eine direkte Verallgemeinerung einer bekannten Aussage aus der Linearen Algebra. Satz 9.7. Für jeden unitären Operator U W H ! H gilt .U / f 2 C j jj D 1g : Beweis. Nach Definition 8.22d. ist ein unitärer Operator U bijektiv und isometrisch, und das Gleiche gilt für U 1 . Daher ist kU k D kU 1 k D 1 : Nach Theorem 9.5b. sind also D 0 und alle 2 C mit jj > 1 reguläre Werte von U . Für 0 < jj < 1 ist j1 j > 1; also 1 ein regulärer Wert von U 1 ; d. h. U 1 1 I hat eine beschränkte Inverse. Wegen U I D U.U 1 1 I / hat dann aber auch U I eine beschränkte Inverse, d. h. Spektralwerte von U können höchstens auf dem Einheitskreis liegen. u t 9.8 Beispiel: Das Spektrum des F OURIER -P LANCHEREL-Operators. In der Quantenmechanik spielen die H ERMITE-Funktionen eine wichtige Rolle als „Eigenfunktionen des harmonischen Oszillators“. Man kann sie auch verwenden, um die Spektraltheorie des F OURIER -P LANCHEREL-Operators (vgl. Abschn. 8F) vollständig zu klären. Die H ERMITE-Funktionen hn W R ! R können rekursiv definiert werden durch h0 .x/ WD ex =2 ; d hn1 .x/ ; hn .x/ WD x dx 2
n1:
(9.8)
Man sieht, dass sie die Form hn .x/ D Hn .x/ ex
2 =2
(9.9)
mit Polynomen Hn haben. Also sind sie von der Klasse C 1 und fallen im Unendlichen exponentiell ab. Daher gehören sie zu L2 .R/; und die bekannten Rechenregeln über die F OURIERtransformation lassen sich unbegrenzt auf sie anwenden, z. B. die Regeln d b b ./ ; F f 0 .x/ ./ D i f f ./ D iF Œxf .x/ ./ : (9.10) d
B Spektrum beschränkter selbstadjungierter und unitärer Operatoren
Daraus folgt
b 0 ./ f b.// : F Œxf .x/ f 0 .x/./ D i.f
269
(9.11)
Wegen hb0 D h0 folgt aus (9.8) und (9.11) durch Induktion hbn ./ D .i/n hn ./ :
(9.12)
Mit Hilfe des F OURIER -P LANCHEREL-Operators U können wir das kurz in der Form n0 U hn D .i/n hn ; schreiben, d. h. die hn sind Eigenvektoren zu den Eigenwerten .i/n . Bei diesen Eigenwerten handelt es sich natürlich nur um die vier Zahlen ˙1 und ˙i. Durch Linearkombination und Grenzwertbildung gewinnt man weitere Eigenfunktionen. Wir bezeichnen mit Uj den Abschluss der linearen Hülle von fh4kCj jk 2 N0 g (j D 0; 1; 2; 3) in L2 .R/ und haben dann Uf D .i/j f
für f 2 Uj :
Man weiß, dass die normierten H ERMITE-Funktionen 1 'n .x/ D p p hn .x/; n D 0; 1; 2; : : : n 2 nŠ
(9.13)
ein vollständiges Orthonormalsystem (d. h. eine Orthonormalbasis) im H ILBERTraum L2 .R/ bilden (vgl. etwa [96]). Jedes f 2 L2 .R/ hat also eine eindeutige, in der L2 -Norm konvergente F OURIER -H ERMITE-Entwicklung 1 X
f D
h'n j f i'n ;
nD0
und da U linear und stetig ist, ergibt sich hieraus b D Uf D f
1 X
.i/n h'n j f i'n :
(9.14)
nD0
Der Operator U ist also durch die Einführung des Systems .'n / auf eine einfache Form gebracht, die der Diagonalisierung einer normalen Matrix analog ist. Anders ausgedrückt: Der H ILBERTraum H D L2 .R/ hat die orthogonale Zerlegung H D U0 ˚ U1 ˚ U2 ˚ U3 in U -invariante abgeschlossene Teilräume Uj ; auf denen U mit .i/j I übereinstimmt. Hieraus folgt auch, dass die vier Eigenwerte D 1; i; 1; i das gesamte Spektrum von U ausmachen. Ist nämlich 2 C n f1; 1; i; ig; so haben wir für alle f 2 H .U I /f D .1 /P0 f C .i /P1 f C .1 /P2 f C .i /P3 f ;
270
9 Einführung in die Spektraltheorie
wobei die Pj die orthogonalen Projektoren auf Uj sind. Dann wird aber offensichtlich durch R./g WD
1 1 1 1 P0 g C P1 g C P2 g C P3 g 1 i 1 i
die Resolvente definiert, und es folgt 62 .U /. Ähnlich erkennt man auch, dass N.U .i/j I / D Uj für j D 0; 1; 2; 3 ist, dass es also außer den Elementen von Uj keine weiteren Eigenvektoren zu .i/j gibt (Übung!). Bemerkung: Für H D L2 .RN / sieht das Spektrum des entsprechenden F OU RIER -P LANCHEREL -Operators genauso aus. Man erkennt das durch Betrachtung der Orthonormalbasis, die aus den Funktionen '˛ .x1 ; : : : ; xN / WD
N Y
'˛k .xk /
kD1
besteht, wobei ˛ D .˛1 ; : : : ; ˛N / alle N -stelligen Multiindizes durchläuft. Das Spektrum von H ERMITEschen Operatoren lässt sich mit dem folgenden Lemma gut untersuchen: Lemma 9.9. Für einen H ERMITEschen Operator T 2 B.H / und ein 2 C sind folgende Aussagen äquivalent: a. 2 .T /. b. Es gibt ein c > 0; so dass k.T I /xk ckxk
8x 2 H :
(9.15)
Beweis. a. H) b. ist klar nach Satz 8.9. Gelte b., also (9.15) für geeignetes c > 0. Dann ist N.T I / D f0g. Wie in der elementaren linearen Algebra rechnet man N / D f0g. Nach nach, dass T D T H) P .T / R. Also ist auch N.T I Satz 8.21 folgt daraus R.T I / D H . Mit (9.15) sieht man direkt, dass R.T I / vollständig, also auch abgeschlossen ist. Daher ist T I surjektiv, also (wieder nach (9.15) und Satz 8.9) stetig invertierbar. t u In dem folgenden Theorem sind nun die wichtigsten Eigenschaften zusammengefasst, die das Spektrum von selbstadjungierten beschränkten Operatoren auszeichnen. Theorem 9.10. Für jeden H ERMITEschen Operator T 2 B.H / gilt: a. Das Spektrum .T / ist reell, d. h. R. b. Das residuale Spektrum R .T / ist leer.
B Spektrum beschränkter selbstadjungierter und unitärer Operatoren
271
c. Mit den Bezeichnungen m WD inf hx j T xi ; kxkD1
mC WD sup hx j T xi kxkD1
gilt kT k D max fjm j ; jmC jg : d. .T / Œm ; mC und m ; mC 2 .T /. Beweis. a. Sei D ˛ C iˇ mit ˛; ˇ 2 R. Dann ist S WD T ˛I ebenfalls selbstadjungiert. Für x 2 H gilt daher: k.T I /xk2 D kS x iˇxk2 D kS xk2 iˇhS x j xi C iˇhx j S xi C ˇ 2 kxk2 D kS xk2 C ˇ 2 kxk2 ˇ 2 kxk2 und damit k.T I /xk jˇj kxk. Nach Lemma 9.9 muss also 2 .T / sein, falls ˇ 6D 0. b. Sei 2 R und sei R.T I / nicht dicht in N . Dann gibt es 0 6D x0 2 ?
R.T I / D R.T I /? D N..T I / / D N.T I /; d. h. 2 P .T / mit Eigenvektor x0 . c. Folgt sofort aus Satz 8.23a. d. Wir führen den Beweis für mC und nehmen o.B.d.A. an, dass 0 m mC und damit kT k D mC . Die restlichen Fälle werden auf diesen Fall zurückgeführt, indem man Operatoren der Form ˙T C ˛I ; ˛ 2 R betrachtet. Zunächst folgt sofort aus Theorem 9.5b., dass jedes D mC C" für " > 0 zu .T / gehört. Wegen mC D sup hx j T xi D kT k kxkD1
gibt es nach Definition des Supremums eine Folge .xn / H mit kxn k D 1 ;
hxn j T xn i D mC ın ;
ın 0 ; ın ! 0 :
Aus kT xn k kT k kxn k D mC folgt daher k.T mC I /xn k2 D kT xn k2 2mC hxn j T xn i C m2C kxn k2 m2C 2mC .mC ın / C m2C ; also k.T mC I /xn k2 2mC ın ! 0 ;
n ! 1 :
Daher existiert keine Konstante c > 0; so dass k.T mC I /xk ckxk
für alle x 2 H .
Das bedeutet aber nach Lemma 9.9, dass mC 62 .T /.
t u
272
9 Einführung in die Spektraltheorie
C Kompakte Operatoren Wir betrachten nun eine wichtige Klasse von Operatoren, die praktisch nur ein Punktspektrum besitzen. Dazu führen wir folgenden Begriff ein: Definition 9.11. Eine Folge .xn / in einem H ILBERTraum H konvergiert schwach gegen ein x0 2 H (geschrieben xn + x0 ), wenn für jedes z 2 H lim hz j xn i D hz j x0 i :
n!1
Durch diese Forderung ist x eindeutig bestimmt (Übung!), und man nennt x den schwachen Limes der Folge .xn /. Wir stellen nun die wichtigsten Eigenschaften dieses Konvergenzbegriffes zusammen: Theorem 9.12. a. Aus starker Konvergenz xn ! x0 folgt schwache Konvergenz xn + x0 ; aber nicht umgekehrt. b. Aus xn + x0 und kxn k ! kx0 k folgt die starke Konvergenz xn ! x0 . c. Jede schwach konvergente Folge ist beschränkt. d. Jede beschränkte Folge enthält eine schwach konvergente Teilfolge. Beweis. a. Aus der starken Konvergenz xn ! x folgt für jedes z 2 H : jhz j xi hz j xn ij D jhz j x xn ij kzk kx xn k ! 0 ; also die schwache Konvergenz xn + x. – Dass die Umkehrung nicht gilt, sieht man z. B. an einem Orthonormalsystem .en / H . Für jedes z 2 H gilt dann bekanntlich die B ESSELsche Ungleichung 1 X
jhz j en ij2 kzk2 < 1
nD1
und damit limn!1 hz j en i D 0. Dies bedeutet en + 0; aber wegen ken k D 1 konvergiert diese Folge natürlich nicht stark gegen Null. (Sie hat noch p nicht einmal eine konvergente Teilfolge, weil für n ¤ m stets ken em k D 2 ist!) b. Für alle n ist kx xn k2 D kxk2 2Re hx j xn i C kxn k2 ; und unter den gegebenen Voraussetzungen liefert das lim kx xn k2 D kxk2 2Re hx j xi C kxk2 D kxk2 2kxk2 C kxk2 D 0 ;
n!1
also die behauptete starke Konvergenz.
C Kompakte Operatoren
273
c. und d. sind schwieriger zu beweisen und werden meist aus allgemeinen Prinzipien der Funktionalanalysis hergeleitet (c. aus dem Prinzip von der gleichmäßigen Beschränktheit, d. aus dem Satz von A LAOGLU), die in jedem Lehrbuch der Funktionalanalysis bewiesen werden. Für spezielle H ILBERTräume gibt es auch elementare Beweise – etwa für Räume vom Typ L2 .S / sind solche direkten Beweise in [59] angegeben. t u Satz 9.13. a. Für einen linearen Operator T W H ! H sind die folgenden Bedingungen äquivalent: (i) T bildet abgeschlossene beschränkte Mengen in kompakte Mengen ab, d. h. für jede beschränkte Folge .xn / in H hat die Folge .T xn / eine konvergente Teilfolge. (ii) T bildet schwach konvergente Folgen in stark konvergente Folgen ab, d. h. xn + x H) T xn ! T x. T heißt kompakt oder vollstetig, wenn eine dieser äquivalenten Bedingungen gilt. b. Jeder kompakte Operator ist beschränkt. Beweis. Angenommen, T erfüllt Bedingung (i). Dann muss T beschränkt sein, denn anderenfalls gäbe es eine Folge .xn / mit kxn k D 1 8 n und kT xn k % C1
für n ! 1 ;
und solch eine Folge kann keine konvergente Teilfolge haben. Damit ist schon b. gezeigt. Außerdem folgern wir xn + x H) T xn + T x ;
. /
denn für alle z 2 H haben wir hz j T .xn x/i D hT z j xn xi ! 0 : Dass sogar T xn ! T x gelten muss, zeigen wir durch Widerspruch. Wäre dies für eine gewisse Folge xn + x nicht der Fall, so gäbe es " > 0 und eine Teilfolge .xnj / mit kT xnj T xk " 8 j : Nach Theorem 9.12c. ist .xn / beschränkt, also enthält .T xnj / eine stark konvergente Teilfolge, etwa T xnj ! y für ! 1 : Dann ist kT x yk "; insbesondere y ¤ T x. Wegen 9.12a. ist y auch der schwache Limes der Folge .T xnj /; und wegen ( ) ist dieser schwache Limes gleich T x im Widerspruch zur Eindeutigkeit des schwachen Limes. Die Implikation (ii) H) (i) folgt unmittelbar aus Theorem 9.12d. t u
274
9 Einführung in die Spektraltheorie
Unterwirft man kompakte Operatoren einer der gängigen Prozeduren zur Gewinnung neuer Operatoren, so entstehen i. A. wieder kompakte Operatoren. Genauer: Theorem 9.14. a. Linearkombinationen von kompakten Operatoren sind kompakt. b. Sind Tn W H ! H kompakt und gilt Tn ! T in B.H /; so ist T kompakt. c. Ist T kompakt, S beschränkt, so sind T S und S T kompakt. d. Mit T ist auch T kompakt. Beweis. a. Ist eine leichte Übung. b. Wir weisen Bedingung (ii) für T nach. Sei also xm + x in H . Nach Definition der Operatornorm bedeutet die Konvergenz Tn ! T die gleichmäßige Konvergenz auf beschränkten Teilmengen von H; insbesondere auf der beschränkten Menge fxm j m 2 Ng. Daher darf man die Grenzprozesse vertauschen und erhält lim T xm D lim lim Tn xm D lim lim Tn xm D lim Tn x D T x ;
m!1
m!1 n!1
n!1 m!1
n!1
wie gewünscht. c. Ist T kompakt, S beschränkt und ist .xn / H eine beschränkte Folge, so ist .S xn / eine beschränkte Folge nach Satz 8.3a. Daher enthält .T .S.xn // eine stark konvergente Teilfolge. Also ist T S kompakt. Andererseits hat auch T xn eine konvergente Teilfolge, etwa T xnj ! y für j ! 1. Daraus folgt S.T xnj / ! Sy; weil S stetig ist. Also ist S T kompakt. d. Wird am Schluss dieses Abschnitts bewiesen. t u Die genauere Untersuchung der kompakten Operatoren und ihrer spektralen Eigenschaften werden wir auf den folgenden interessanten Approximationssatz gründen: Satz 9.15. a. Jeder beschränkte lineare Operator T W H ! H von endlichem Rang, d. h. mit dim R.T / < 1; ist kompakt. b. Zu jedem kompakten Operator T W H ! H existiert eine Folge .Tn / von beschränkten Operatoren von endlichem Rang, so dass lim kT Tn k D 0 :
n!1
Beweis. a. Ist dim R.T / < 1; so sind abgeschlossene beschränkte Mengen M R.T / kompakt (Satz 7.11b.), was nach Satz 9.13a. die erste Behauptung liefert.
C Kompakte Operatoren
275
b. Beweisen wir nur für separable H ILBERTräume (andere kommen in den physikalischen Anwendungen auch kaum vor). Sei also fe1 ; e2 ; : : :g eine abzählbare Orthonormalbasis von H (Satz 7.5), und sei T W H ! H kompakt. Wir betrachten die orthogonalen Projektoren Pm x WD
m X
hek j xiek :
kD1
Da jedes x 2 H die Summe seiner F OURIERreihe ist, haben wir Pm x ! x
für alle x 2 H .
(9.16)
Setzen wir Tm WD T Pm ; so gilt Tm x D
m X
hek j xi T ek
(9.17)
für alle x 2 H;
kD1
d. h. Tm ist von endlichem Rang. Nach Definition der Operatornorm gibt es nun zu jedem m 2 N ein xm 2 H mit kxm k D 1 und k.T Tm /xm k
1 kT Tm k : 2
(9.18)
Wegen (9.16) gilt dann für jedes y 2 H h.I Pm /xm j yi D hxm j .I Pm /yi ! 0 ; also .I Pm /xm + 0 : Da T kompakt ist, folgt hieraus .T Tm /xm D T .I Pm /xm ! 0 : Dies liefert mit (9.18) kT Tm k ! 0 :
t u
Beweis: von 9.14d.: Sei K 2 B.H / ein Operator von endlichem Rang. Die Einschränkung KjN.K/? ist ein Isomorphismus N.K/? ! R.K/; also folgt dim R.K / dim R.K / D dim N.K/? D dim R.K/ < 1 : Somit ist K ebenfalls von endlichem Rang.
276
9 Einführung in die Spektraltheorie
Nun sei T kompakt. Nach Satz 9.15b. ist T D limm!1 Tm mit Operatoren Tm von endlichem Rang. Wegen k.T Tm / k D kT Tm k ist dann auch T D limm!1 Tm . Kompaktheit von T folgt nun aus Theorem 9.14b., Satz 9.15a. und der gerade bewiesenen Tatsache, dass die Tm ebenfalls von endlichem Rang sind. t u
D Spektrum kompakter Operatoren Das Spektrum kompakter Operatoren ist ähnlich dem Spektrum von linearen Abbildungen in endlich-dimensionalen Räumen, wie wir jetzt sehen werden. Zunächst benötigen wir jedoch einige technische Vorbereitungen: Lemma 9.16. Für jeden kompakten Operator T W H ! H gilt: a. Ist H unendlich-dimensional, so ist T nicht stetig invertierbar. b. Die Einschränkung des Operators S WD I T auf den abgeschlossenen Unterraum U WD N.S /? ist immer stetig invertierbar. c. Der Wertebereich R.I T / ist abgeschlossen in H . Beweis. a. In einem unendlich-dimensionalen H ILBERTraum gibt es nach dem S CHMIDT schen Orthogonalisierungsverfahren immer ein abzählbares Orthonormalsystem .en /n1 ; und, wie wir im Beweis von Theorem 9.12a. gesehen haben, konvergiert solch eine Folge schwach gegen Null. Da T kompakt ist, konvergiert .T en / stark gegen Null. Wäre nun T stetig invertierbar, so hätten wir en D T 1 T en ! 0 im Widerspruch zu ken k D 1. b. Angenommen, die Einschränkung S jU ist nicht stetig invertierbar. Dann ist die Bedingung aus Satz 8.9 verletzt, und daher gibt es eine Folge .xn / U; für die kxn k D 1; aber kS xn k D kxn T xn k ! 0 gilt. Nach Übergang zu einer Teilfolge können wir annehmen, dass der Grenzwert z WD lim T xn existiert. Dann folgt n!1
xn D S xn C T xn ! z und daher Tz D T
für n ! 1
lim xn D lim T xn D z :
n!1
n!1
Also ist S z D z T z D 0; d. h. z 2 N.S /. Wegen xn 2 U ist aber auch z 2 U D U D N.S /? ; und folglich muss z D 0 sein. Wegen kxn k D 1 hat z aber die Norm 1; ein Widerspruch.
D Spektrum kompakter Operatoren
277
c. R.S / ist auch der Wertebereich der Einschränkung S jU . Da diese stetig invertierbar ist und U vollständig ist, folgert man leicht die Vollständigkeit von R.S /. Folglich ist R.S / auch abgeschlossen. t u Nun kommen wir zu dem angekündigten Hauptresultat über das Spektrum von kompakten Operatoren. Wir erinnern daran, dass man eine Punktmenge diskret nennt, wenn jeder ihrer Punkte isoliert ist, also eine Umgebung besitzt, die keinen weiteren Punkt der Menge enthält (vgl. etwa [36], Kap. 13). Theorem 9.17 (R IESZ -S CHAUDER). Für jeden kompakten Operator T W H ! H gilt: a. Das Spektrum .T / ist eine diskrete Punktmenge mit einzig möglichem Häufungspunkt D 0. b. Jedes 2 .T /; 6D 0; ist ein Eigenwert endlicher Vielfachheit. Beweis. a. Anstelle der Eigenwerte von T ist es praktisch, die sogenannten singulären Werte von T mit T x D x für ein x 6D 0 (9.19) zu betrachten und zu zeigen, dass diese in C eine Punktmenge ohne Häufungspunkte bilden. Ist nämlich kein singulärer Wert von T; so ist T I D .I T / injektiv, also stetig invertierbar nach Lemma 9.16b., und daher ist .T 1 I /1 D . T I /1 ein beschränkter, auf H definierter Operator, d. h. es ist 1 2 .T /. Um die Behauptung über die singulären Werte zu beweisen, betrachten wir für beliebiges 0 2 C die Kreisscheibe DW
j 0 j < R WD
1 2kT k
(9.20)
und zeigen, dass für 0 < ı < R die Scheibe D0 W
j 0 j R ı
nur endlich viele singuläre Werte von T enthält. Dies beweisen wir, indem wir T gemäß Satz 9.15 durch Operatoren von endlichem Rang approximieren. Es existiert also ein Operator Q W H ! H; Qx D
N X
hzi j xi yi
i D1
von endlichem Rang mit k 0 T Qk
y für alle x 2 E und somit mh;E .y/ D .E/. Für y ˛ haben wir ˛ C g.x/ > y ” g.x/ > y ˛ ; also mh;E .y/ D mg;E .y ˛/. Dies ergibt Z˛
Z h d D E
Z1 mh;E .y/ dy C
mh;E .y/ dy ˛
0
Z1 D ˛.E/ C Z D
mg;E .y ˛/ dy ˛
Z1
f d C E
mg;E .z/ dz 0
Z
Z f d C
D E
g d ; E
wobei wir noch Satz 10.20b., e. verwendet haben. Für ˛ D 1 ist die Aussage trivial. (ii) Nun betrachten wir messbare Funktionen f; die nur endlich viele Werte annehmen, und beweisen (10.27) durch Induktion nach der Anzahl N der verschiedenen Werte von f auf E. Der Induktionsanfang N D 1 ist gerade Teil (i). Sei die Aussage für Funktionen mit N 1 verschiedenen Werten schon bekannt, und sei f eine Funktion mit N verschiedenen Werten auf E (N 2). Sei ˛ einer dieser Werte und A WD fx 2 E j f .x/ D ˛g; B WD E n A. Dann nimmt f auf B nur N 1 verschiedene Werte an, also ist nach Induktionsvoraussetzung Z Z Z h d D f d C g d : B
B
B
322
10 Maß und Integral
Aber auf A stimmt f mit ˛A überein, also ist nach Teil (i) Z Z Z h d D f d C g d : A
A
A
Addition dieser beiden Gleichungen liefert wegen Satz 10.20g. wieder (10.27) für f. (iii) Ein beliebiges f 2 MC repräsentieren wir nun gemäß Lemma 10.23 als punktweiser Limes f D limn!1 'n ; wobei jedes 'n nur endlich viele Werte annimmt. Nach Teil (ii) gilt dann Z Z Z .'n C g/ d D 'n d C g d 8n : E
E
E
Dann folgt (10.27) nach dem Satz von der monotonen Konvergenz durch Grenzübergang n ! 1. t u Es ist klar, dass man diesen Satz durch Induktion sofort auf Summen aus endlich vielen Termen ausdehnen kann. Dann gilt er aber auch für unendliche Reihen, denn die Partialsummen einer Reihe von nichtnegativen Funktionen bilden ja eine monoton wachsende Funktionenfolge, so dass beim Grenzübergang der Satz über monotone Konvergenz herangezogen werden kann. Es ergibt sich: Korollar 10.25 (Satz von B EPPO L EVI). Für jede Folge .gn / 2 M C gilt: ! Z X 1 1 Z X gn d ; gn d D (10.28) nD1
nD1
wobei auf beiden Seiten der Wert C1 erlaubt ist. Wir ziehen schließlich aus dem Satz über monotone Konvergenz noch eine weitere Folgerung, die für die Behandlung von Integralen reell- oder komplexwertiger Funktionen im nächsten Abschnitt von entscheidender Bedeutung sein wird. Dabei verwenden wir die Begriffe und Schreibweisen aus 10.15. Satz 10.26 (Lemma von FATOU). Für jede Folge .fn / von Funktionen aus MC gilt Z Z (10.29) .lim inf fn / d lim inf fn d : n
n
Beweis. Für m 2 N setzen wir gm .x/ WD inf fn .x/ : nm
Dann ist .gm / monoton wachsend und es gilt gm fn
für n m
(10.30)
E Summierbare Funktionen
323
Z
Z
und daher
gm d
fn d für n m ; Z
Z
also weiter
gm d lim inf
fn d :
n
Wegen
lim gm D sup gm D sup
m!1
m
m1
folgt mit Theorem 10.21 aus (10.31) Z Z .lim inf fn / d D
(10.31)
inf fn
nm
D lim inf fn n
lim gm d Z D lim gm d m!1 Z lim inf fn d : m!1
n
t u Bemerkung: Wenn der Grenzwert f .x/ D lim fn .x/ n!1
-fast überall existiert, so ergibt das Lemma von FATOU die Abschätzung Z Z (10.32) f d lim inf fn d : n
Es kann leicht geschehen, dass hier eine echte Ungleichung vorliegt. RBetrachtet man z. B. auf der reellen Geraden die Funktionen fn WD n1 Œ0;n ; so ist fn .t/ dt D 1 für alle n; aber limn!1 fn .t/ D 0 für alle t.
E Summierbare Funktionen Wir betrachten immer noch den beliebigen, aber fest gewählten Maßraum .X; A; /. Bisher haben wir das Integral nur für nichtnegative -messbare Funktionen definiert, wobei C1 als Wert bei Integrand und Integral zugelassen war. Um zu einem endlichen Integral für R-wertige und C-wertige Funktionen zu kommen, definieren wir: Definitionen 10.27. a. Sei f W X ! R beliebig. Dann nennt man die Funktionen f C .x/ WD supff .x/; 0g ; f .x/ WD supff .x/; 0g den positiven bzw. den negativen Teil von f .
(10.33)
324
10 Maß und Integral
b. Eine Funktion f W X ! C heißt messbar, wenn u WD Re f und v WD Im f messbar sind. Wir bezeichnen die Menge aller dieser Funktionen wieder mit M.X / oder MC .X /. Für R-wertiges f gilt offenbar: f D fCf;
jf j D f C C f :
(10.34)
Ist f messbar, so sind nach Satz 10.16a. f C ; f 2 MC . Für komplexwertige messbare Funktionen f D u C iv zeigen Satz 10.14c. und Satz 10.17a., dass jf j D .u2 C v 2 /1=2 messbar ist. Definitionen 10.28. a. Eine messbare reelle Funktion f 2 M heißt -summierbar oder -integrierbar, wenn Z Z f d < 1 ; (10.35) f C d < 1 und und man nennt
Z
Z f d WD
f
C
Z d
f d
das Integral von f bezüglich . Für E 2 A setzt man Z Z Z Z f d WD f E d D f C d f d : E
E
(10.36)
(10.37)
E
b. Eine komplexe messbare Funktion f heißt -summierbar oder -integrierbar, wenn ihr Realteil u und ihr Imaginärteil v -summierbar sind, und dann setzt man Z Z Z f d WD u d C i v d (10.38) und analog für die Integrale über messbare Teilmengen. c. Die Menge der -summierbaren Funktionen auf X wird mit L1 .X / L1 .X; A; / L1 ./ bezeichnet, und wenn erforderlich, wird der Wertebereich durch untere Indizes R oder C gekennzeichnet. Die folgenden elementaren Eigenschaften der summierbaren Funktionen und des Integrals überzeugen uns, dass man mit dem allgemeinen Integral so umgehen kann, wie man es von einem Integral erwartet. Sie ergeben sich mehr oder weniger leicht aus den zuvor bewiesenen Fakten, insbes. aus Satz 10.20 und Satz 10.24: Theorem 10.29. Sei E X eine messbare Menge. Dann gilt: a. L1K .E/ ist ein K-Vektorraum und das Integral ist ein K-lineares Funktional auf L1K .E/.
E Summierbare Funktionen
325
b. Sind f; g R-wertige summierbare Funktionen und ist f .x/ g.x/ -f. ü. auf E; so ist Z Z f d g d : E
E
c. f 2 M.E/ ist genau dann summierbar, wenn jf j summierbar ist, und dann gilt ˇ ˇ ˇZ ˇ Z ˇ ˇ ˇ f dˇ jf j d : (10.39) ˇ ˇ ˇ ˇ E
E
C Insbesondere R ist f summierbar, wenn ein h 2 M existiert mit jf .x/j h.x/ -f. ü. und h d < 1. d. Sind f; g messbar und f .x/ D g.x/ -f. ü., so ist f summierbarRgenau dann, wenn g summierbar ist, und im Falle der Summierbarkeit ist E f d D R g d. E
Beweis. a. Wir beweisen die Additivität Z Z Z .f C g/ d D f d C g d E
E
(10.40)
E
für reelle Funktionen f; g 2 L .E/. Alles Weitere kann als Übung erledigt werden. Wir schreiben also f D f C f ; g D g C g und h WD f C g D hC h und setzen außerdem ˙ hf WD f ˙ C g ˙ : 1
Z
Dann ist
˙ hf d D
E
Z f
˙
Z d C
E
g ˙ d
(10.41)
E
nach Satz 10.24. Aus C f hC h D h D f C f C g C g D hf h
folgt
C f hC C h D hf C h ;
und da hier nur nichtnegative Summanden stehen, kann Satz 10.24 angewendet werden und ergibt Z Z Z Z C f hC d C h d D hf d C h d ; E
also
Z
E
Z h d D
E
C
h E
E
Z d
E
Z
h d D E
Einsetzen von (10.41) ergibt nun (10.40).
E
C d hf
Z E
f d : h
326
10 Maß und Integral
b. Man beachte f C f gC g ” f C C g gC C f und wende Satz 10.20a. an. R c. Die Äquivalenz f 2 L1 .E/ ” E jf j d < 1 geht sofort aus den Beziehungen 0 f ˙ jf j D f C C f für reelles f und juj; jvj jf j juj C jvj für komplexes fR D u C iv hervor. Um (10.39) zu beweisen, schreiben wir die komplexe Zahl E f d in Polarkoordinaten als r ei und setzen g.x/ WD ei f .x/ I u WD Re g ; v WD Im g : R R Dann ist E g d D r reell, also E v d D 0; und außerdem u juj jgj D jf j punktweise. Mit Teil b. folgt nun ˇ ˇ ˇZ ˇ Z Z ˇ ˇ ˇ f dˇ D r D u d jf j d ; ˇ ˇ ˇ ˇ E
E
E
also (10.39). d. Ist eine leichte Übung. t u Wir weisen noch auf einige weitere leicht zu beweisende Eigenschaften hin: Satz 10.30. a. Ist f 2 L1 .E/; so ist N D fx 2 E j f .x/ D ˙1g eine -Nullmenge. b. Ist f 2 L1 .E/; F E messbar, so ist f 2 L1 .F /. c. Ist f 2 L1 .E/ und .Am / eine disjunkte Mengenfolge, Am 2 A; Am E; so gilt Z 1 Z X f d D f d (10.42) mD1A m
A
für A WD
1 [
Am .
mD1
d. Sind f; g 2 L1 .X / und Z Z f d D g d E
so ist f .x/ D g.x/ -f. ü.
E
für alle E 2 A ;
E Summierbare Funktionen
327
Teile a., b. und d. beruhen auf Aussagen aus Satz 10.20, Teil c. auf dem Satz von B EPPO L EVI. Beispiele 10.31. a. Bei den einfachen Beispielen aus 10.2 waren alle Teilmengen von X messbar. Dann sind auch alle Funktionen f W X ! R bzw. f W X ! C messbar. Für die Integrale ergibt sich durch Betrachten der Definitionen folgendes: (i)
(ii)
(iii)
Für das Zählmaß aus Beispiel 10.2a. ist f genau dann integrierbar, wenn f außerhalb einer (von f abhängigen) Pabzählbaren Teilmenge A D fx1 ; x2 ; : : :g verschwindet und die Reihe 1 kD1 f .xk / absolut konvergiert. Die Summe dieser Reihe ist dann das Integral. Bei dem Maß (10.4) ist jede Funktion f summierbar, und der Wert des P Integrals ist N kD1 mk f .ak /. Die Integration bezüglich des D IRACmaßes im Punkt a ist insbesondere einfach die Auswertung der Funktion in diesem Punkt. Für das Maß (10.5) ist die Integrierbarkeit von f äquivalent mit der absoP luten Konvergenz der Reihe 1 kD1 mk f .ak /; und der Wert des Integrals ist dann die Summe dieser Reihe.
b. Nun seien ein Maßraum .X; A; / sowie eine „Gewichtsfunktion“ w 2 MC .X / gegeben. Wie Satz 10.30c. zeigt, definiert die Formel Z .A/ WD w d (10.43) A
dann wieder ein Maß auf derselben -Algebra A. Man schreibt D w oder d D w d und nennt w die Dichte von in Bezug auf oder auch die Ableitung w D d= d. Man überlegt sich leicht (Übung!), dass w1 D w2 ” w1 .x/ D w2 .x/ -f. ü. ; also ist die Dichte eindeutig bestimmt bis auf Änderungen auf einer -Nullmenge. Für die Summierbarkeit gilt Z 1 f 2 L ./ ” jf jw d < 1 ” f w 2 L1 ./ ; und im Fall der Summierbarkeit ist Z Z f d D f w d : E
(10.44)
E
Geht man vom L EBESGUE-Maß D n aus, so entstehen auf diese Weise viele wichtige Maße auf Rn . Bemerkung: Jede -Nullmenge ist offenbar auch eine -Nullmenge, wenn D w. Der sog. Satz von R ADON -N IKODYM besagt, dass – jedenfalls für
328
10 Maß und Integral
-endliche Maße im Sinne von Def. 10.43 – hiervon auch die Umkehrung gilt: Ist jede -Nullmenge auch eine -Nullmenge, so ist D w für ein geeignetes w 2 MC .A/. c. Für das L EBESGUE -S TIELTJES-Maß v ; das durch den Integrator v definiert wird (vgl. 10.12), gilt Z Z f dv D
f dv
(10.45)
für alle stetigen f; die außerhalb eines kompakten Intervalls verschwinden. Aus der Konstruktionsvorschrift für v kann man nämlich entnehmen, dass v .a; b/ D v.b C 0/ v.a C 0/
(10.46)
ist (rechtsseitige Grenzwerte!), und da man die stetige Funktion f gleichmäßig durch stückweise konstante Funktionen approximieren kann, erhält man hieraus Z Z f dv D f dvQ mit dem leicht abgeänderten Integrator v.x/ Q WD v.x C 0/. Dass aber v und vQ ein und dasselbe S TIELTJES-Integral liefern, folgt mittels der Stetigkeit von f leicht durch Betrachtung der Summen (10.16). Wir verzichten auf Details. Einer der Hauptgründe für die Einführung des L EBESGUE-Integrals sind seine besseren Konvergenzeigenschaften. Theorem 10.32 (Satz von L EBESGUE über dominierte Konvergenz). Sei E X messbar, f eine Funktion auf E; und seien fn 2 L1 .E/; n 2 N so, dass gilt: a. f .x/ D lim fn .x/ für fast alle x 2 E. n!1
b. Es existiert ein g 2 L1 .E/; so dass für alle n 2 N jfn .x/j g.x/
für fast alle x 2 E.
Dann ist f 2 L1 .E/; und es gilt Z Z lim fn d D f d : n!1
E
(10.47)
E
Beweis. Wegen Satz 10.29d. dürfen wir die Funktionen fn auf einer Nullmenge so abändern, dass 8x2E ; (10.48) f .x/ D lim fn .x/ n!1
jfn .x/j g.x/
8x 2E; 8n2N:
(10.49)
Dann gilt aber auch f 2 M.E/ nach Satz 10.16b., und jf .x/j g.x/ so dass f 2 L1 .E/ aus Satz 10.29c. folgt.
8x2E ;
(10.50)
E Summierbare Funktionen
329
Nun nehmen wir an, f sei R-wertig, denn der Fall eines komplexwertigen f kann durch Zerlegung in Real- und Imaginärteil leicht auf den reellen Fall zurückgeführt werden. Da nach (10.49) g C fn 0
auf E
können wir Satz 10.26 (FATOU) anwenden und bekommen: Z Z Z Z g d C f d D .g C f / d lim inf .g C fn / d E
E
E
g d C lim inf
D E
Daraus folgt dann
E
Z
Z
fn d : E
Z
Z f d lim inf
fn d :
n
E
(10.51)
E
Da andererseits nach (10.49) auch g fn 0 auf E ist, folgt wieder mit dem Lemma von FATOU Z Z Z g d f d D .g f / d E
E
E
Z
Z
.g fn / d D
lim inf E
Z g d lim sup
E
E
Z
Z
woraus dann
fn d
lim sup n
fn d ;
E
f d
(10.52)
E
folgt. Die Ungleichungen (10.51) und (10.52) liefern dann die behauptete Gleichung (10.47). t u Anwendung dieses Satzes auf die Partialsummen einer unendlichen Reihe ergibt das folgende Korollar: Korollar 10.33. Sei E X messbar und seien fn 2 L1 .E/ so, dass 1 Z X
jfn j d < 1 :
(10.53)
nD1 E
Dann existiert f. ü. auf E die Summe f .x/ WD
1 X nD1
fn .x/ :
(10.54)
330
10 Maß und Integral
Es ist f 2 L1 .E/ und
Z f d D
1 Z X
fn d :
(10.55)
nD1 E
E
Beweis. Wegen (10.53) und dem Satz von B EPPO L EVI (Kor. 10.25) ist die Funktion 1 X jfn .x/j g.x/ WD nD1
summierbar, also auch g.x/ < 1 f. ü. (Satz 10.20c. oder 10.30a.). Also ist die Reihe in (10.54) f. ü. absolut konvergent. Nun wende man 10.32 auf die Folge der Partialsummen dieser Reihe an, wobei g als integrierbare Majorante dient. t u 10.34 Räume p-summierbarer Funktionen. In Abschn. 7A haben wir für L EBES GUE -messbare Teilmengen S Rn die BANACH räume Lp .S; 1 p 1/ besprochen. Dabei stand der H ILBERTraum L2 .S / im Vordergrund, der für die Physik von entscheidender Bedeutung ist. Auch für einen beliebigen Maßraum .X; A; / lassen sich entsprechende Räume Lp .X; A; / in völliger Analogie hierzu konstruieren, und es genügt daher, wenn wir diese Konstruktion hier nur kurz rekapitulieren. Ist f W X ! K messbar, so ist jf j 2 MC .A/; also können wir definieren: Z (10.56) Np .f / WD jf .x/jp d für 1 p < 1 sowie N1 .f / W D ess sup jf .x/j
(10.57)
x2S
D inffs 0 j jf .x/j s -f. ü.g (vgl. (7.24) und (7.28)). Nun setzt man Lp LpK .X; A; / WD ff 2 MK j Np .f / < 1g :
(10.58)
Für p D 1 stimmt das mit der in 10.28c. getroffenen Definition von L1 überein. Da unser allgemeines Integral alle Eigenschaften besitzt, die man zum Beweis der Ungleichungen von H ÖLDER und M INKOWSKI benötigt, gelten diese Ungleichungen auch hier. Ist also p > 1; q WD p=.p 1/ und ist f 2 Lp ; g 2 Lq ; so ist fg 2 L1 und Z jfgj d Np .f /1=p Nq .g/1=q
(10.59)
(H ÖLDERsche Ungleichung). Für p D 1; q D 1 hat man stattdessen die Ungleichung Z jfgj d N1 .f /N1 .g/ ;
(10.60)
die unmittelbar aus Satz 10.20a.,b. folgt. Die M INKOWSKIsche Ungleichung lautet wieder Np .f C g/1=p Np .f /1=p C Np .g/1=p ; (10.61)
E Summierbare Funktionen
331
wobei 1 p < 1; und sie zeigt, dass Lp ein Vektorraum ist (was für p D 1 trivial ist). Aus Satz 10.20c. geht hervor, dass Np .f / D 0 ” f .x/ D 0 -f. ü. Um also zu einem normierten Raum zu gelangen, bildet man wieder die Äquivalenzklassen (vgl. Anmerkung 1.24) in Bezug auf die Äquivalenzrelation def
f g ” f .x/ D g.x/ -f. ü.
(10.62)
Der Raum Lp Lp .X; A; / ist definiert als die Menge dieser Äquivalenzklassen Œf mit f 2 Lp .X; A; / (1 p 1). Für diese Klassen definiert man Addition, Multiplikation mit Skalaren und eine Norm durch Œf C Œg WD Œf C g ;
˛Œf WD Œ˛f ;
kŒf kp WD Np .f /1=p
für p < 1 bzw. kŒf k1 WD N1 .f /; und in jedem Fall kann man durch triviale Rechnungen nachprüfen, dass diese Definitionen nicht von den gewählten Repräsentanten der Klassen abhängen, sondern nur von den Klassen selbst. Außerdem sind die Vektorraumaxiome und wegen (10.61) auch die Normaxiome erfüllt. Schließlich gilt – mit unverändertem Beweis – der Satz von R IESZ -F ISCHER, und damit handelt es sich um BANACHräume, und bei L2 .X; A; / handelt es sich sogar um einen H ILBERTraum. Sein Skalarprodukt ist gegeben durch Z hŒf j Œgi WD f .x/g.x/ d.x/ ; (10.63) was wieder von den gewählten Repräsentanten unabhängig ist. Die H ÖLDERsche Ungleichung für den Fall p D q D 2 ist nichts anderes als die S CHWARZsche Ungleichung für dieses Skalarprodukt. In der Praxis schreibt man f statt Œf und überlässt es dem mitdenkenden Leser, zu entscheiden, ob gerade die Funktion f selbst oder die durch sie festgelegte Äquivalenzklasse Œf gemeint ist. Bemerkung: Wählt man X D N und für das Zählmaß, so ergibt sich Lp .X; P.X /; / D l p in der Schreibweise aus Abschn. 7A (vgl. die Beispiele aus 10.31a.). Fasst man Folgen also als Funktionen auf, die auf N definiert sind, so sind die p-summierbaren Folgen gerade die p-summierbaren Funktionen in Bezug auf das Zählmaß. 10.35 Anwendung auf die Stochastik. Die Maßtheorie liefert, wie sich im Laufe des 20. Jahrhunderts herausgestellt hat, mit Abstand den besten Apparat für die mathematische Modellierung des Zufalls, d. h. für die Stochastik. Wir können hier nicht auf den mathematischen Gehalt der Stochastik eingehen – das würde ein eigenes Lehrbuch ergeben –, aber wir können an Hand von etwas grundlegender Terminologie erläutern, wie die abstrakte Integrationstheorie für die Behandlung des Zufalls eingesetzt wird. Als Wahrscheinlichkeitsraum bezeichnet man einen Maßraum .˝; A; P/; für den P.˝/ D 1
(10.64)
332
10 Maß und Integral
gilt. Die Mengen E 2 A modellieren zufällige Ereignisse und werden auch so genannt, und das Maß P.E/ ist die Wahrscheinlichkeit, mit der das Ereignis E eintritt. Für die Modellierung einfacher Glücksspiele ist natürlich keine allgemeine Maßund Integrationstheorie vonnöten, denn hier ist der entsprechende Wahrscheinlichkeitsraum eine endliche Menge ˝ D f!1 ; : : : ; !N g (etwa mit N D 6 für einen Würfel, N D 37 für ein Rouletterad), und das Maß P ist durch die Zahlen pk WD P.f!k g/ ;
k D 1; : : : ; N
vollständig festgelegt. Aber sobald das System kontinuierlich schwankende Parameter enthält, sieht die Sache anders aus. Zum Beispiel in der statistischen Mechanik ist ˝ der Phasenraum eines Systems aus sehr vielen Teilchen, also eine Mannigfaltigkeit von sehr hoher Dimension. Die Ergebnisse von Zufallsexperimenten werden i. A. durch reelle Zahlen ausgedrückt. Deshalb werden die messbaren Funktionen W ˝ ! R auf einem Wahrscheinlichkeitsraum .˝; A; P/ als Zufallsgrößen oder zufällige Variable bezeichnet. Für eine B ORELmenge B R ist dann E WD 1 .B/ ein Ereignis, und P. 1 .B// ist die Wahrscheinlichkeit dafür, dass das Ergebnis des durch beschriebenen Zufallsexperiments in der Menge B liegt. Daher nennt man Z h i WD .!/ dP.!/ (10.65) den Erwartungswert oder Mittelwert von ; und Z WD
1=2 . .!/ h i/2 dP.!/
(10.66)
nennt man die Streuung oder Standardabweichung von . Solange man es nur mit einer einzigen Zufallsvariablen x D .!/ zu tun hat, benötigt man den Raum ˝ eigentlich nicht. Man transportiert das Maß P nämlich auf die reelle Gerade, indem man setzt .B/ WD P. 1 .B// ;
B 2 B1 :
(10.67)
Damit ist ein B ORELmaß auf R definiert, das man als die Verteilung von bezeichnet, und man kann leicht beweisen, dass Z Z f .x/ d.x/ D f . .!// dP.!/ (10.68) gilt (was auch einschließt, dass f 2 L1 ./ ” f ı 2 L1 .P/). Damit nehmen insbesondere die Formeln für Erwartungswert und Streuung die Gestalt Z Z hxi D x d ; 2 D .x hxi/2 d an.
F Die Rolle der stetigen Funktionen
333
Statt des Maßes selbst betrachtet man in der Stochastik häufig die monotone Funktion v.x/ WD .1; x/ ; x2R; (10.69) die ebenfalls als Verteilung oder Verteilungsfunktion bezeichnet wird. Sie legt das Maß eindeutig fest, denn, wie man sich leicht überlegen kann, erzeugt das System aller Intervalle 1; x; x 2 R die gesamte B ORELalgebra B 1 (vgl. Aufg. 10.7). Die entsprechenden Integrale – und insbesondere Erwartungswert und Streuung – können nach Beispiel 10.31c. also als L EBESGUE -S TIELTJES-Integrale mit dem Integrator v ausgedrückt werden. Bemerkung: Bei der statistischen Deutung der Quantenmechanik wird durch den physikalischen Zustand des Systems für jede Observable (= Messgröße) eine Wahrscheinlichkeitsverteilung festgelegt, also ein B ORELmaß auf R mit .R/ D 1 (oder, äquivalent, eine Verteilungsfunktion v W R ! R mit limx!1 v.x/ D 0; limx!1 v.x/ D 1), und dabei ist – ähnlich wie in der Stochastik – .B/ als die Wahrscheinlichkeit dafür anzusprechen, dass eine Messung der betreffenden Observablen in dem betreffenden Zustand einen Wert x 2 B ergeben wird. Trotzdem sind diese Observablen keine Zufallsvariablen auf irgendeinem Wahrscheinlichkeitsraum, sondern ihre Wahrscheinlichkeitsverteilungen kommen auf eine ganz andere Art zustande (vgl. Kap. 16 (Band II)). Die genauen logischen und mathematischen Unterschiede zwischen klassischer statistischer Physik und Quantenmechanik sind z. B. in [26, 53, 61, 97, 98] erläutert.
F Die Rolle der stetigen Funktionen Im Rn – oder allgemeiner in einem metrischen Raum – wird man in erster Linie solche Maße betrachten wollen, bei denen sich stetige Funktionen so verhalten, wie man es vom L EBESGUE-Maß her gewöhnt ist. Zumindest muss es sich also um B ORELmaße handeln. Dann sind die stetigen Funktionen jedenfalls messbar, denn das Urbild einer offenen Menge unter einer stetigen Funktion ist offen und damit eine B ORELmenge. Aber das alleine reicht noch nicht. Wir beschränken uns auf offene Teilmengen ˝ Rn und definieren: Definition 10.36. Sei ˝ offen in Rn . Ein R ADONmaß auf ˝ ist ein Maß auf ˝; für das alle in ˝ enthaltenen B ORELmengen messbar sind und das die folgenden zusätzlichen Eigenschaften hat: (i)
Äußere Regularität: Für alle -messbaren Mengen E ˝ ist .E/ D inff.U / j U offen; U Eg :
(ii)
Innere Regularität: Für alle -messbaren E ist .E/ D supf.K/ j K kompakt ; K Eg :
(iii)
Für jedes kompakte K Rn ist .K/ < 1.
334
10 Maß und Integral
Das L EBESGUEmaß und die L EBESGUE -S TIELTJES-Maße haben diese Eigenschaft, ebenso die Maße d D jf j dx; wo f eine lokal integrable Funktion auf ˝ ist, d. h. eine messbare Funktion, für die Z jf j dx < 1 K
für alle kompakten K ˝ ist. Bemerkung: Eigentlich braucht man nur Bedingung (iii) zu fordern – die beiden anderen lassen sich dann beweisen, jedenfalls im Kontext offener Teilmengen des Rn (vgl. [78]). Es ist aber wichtig, festzuhalten, dass diese beiden Regularitätsbedingungen für R ADONmaße gelten, und bei Ausdehnung der Theorie auf allgemeinere Grundräume muss man sie auch gesondert fordern. Wie zu erwarten, gilt: Satz 10.37. Für jedes R ADONmaß auf ˝; jede kompakte R Teilmenge K ˝ und jede stetige Funktion f W ˝ ! C existiert das Integral K f d. Beweis. Sei M WD max jf .x/j. Dann ist jf jk Mk punktweise sowie x2K
Z Mk d D m.K/ < 1 :
Nun wende man Theorem 10.29c. an.
t u
Bemerkung: Unter den Voraussetzungen des letzten Satzes definiert f also eine Äquivalenzklasse Œf 2 L1 .K; d/. Die Funktion f muss jedoch nicht unbedingt der einzige stetige Repräsentant dieser Klasse sein. Ist z. B. D ıa das D IRACmaß im Punkt a 2 ˝ (offensichtlich ein R ADONmaß!), so ist f g ” f .a/ D g.a/ ; also gibt es sehr viele verschiedene stetige Funktionen, die ein und dieselbe Klasse repräsentieren. Unter der Voraussetzung (T)
Die einzige offene -Nullmenge ist die leere Menge
jedoch sind zwei stetige Funktionen gleich, wenn sie -f. ü. übereinstimmen (Beweis als Übung!) In diesem Fall kann man also, wie beim L EBESGUE-Maß (vgl. Anmerkung 7.18), die stetigen Funktionen auf K als Elemente von L1 .K; d/ auffassen. Wir hatten es schon öfter mit stetigen Funktionen zu tun, die außerhalb einer kompakten Menge verschwinden. Für diese führen wir jetzt eine systematische Sprechweise ein, die ansatzweise schon bei unserer Beweisskizze für Theorem 10.6d. verwendet worden war: Definitionen 10.38. a. Der Träger Tr f einer stetigen Funktion f ist der Abschluss der Menge fx j f .x/ ¤ 0g. Anders ausgedrückt: Ein Punkt x 2 ˝ gehört genau dann nicht zum Träger von f; wenn f in einer Umgebung von x verschwindet.
F Die Rolle der stetigen Funktionen
335
b. Mit Cc .˝/ bezeichnen wir den Vektorraum aller stetigen Funktionen auf ˝; deren Träger eine kompakte Teilmenge von ˝ ist. Bei Teil b. ist die Formulierung „kompakte Teilmenge von ˝“ zu beachten. Ist @˝ \ Tr f ¤ ;; so gehört f nicht zu Cc .˝/; auch wenn Tr f kompakt ist. Für viele Zwecke ist es wichtig, dass man p-summierbare Funktionen durch stetige Funktionen mit kompaktem Träger approximieren kann (besonders für p D 1 und p D 2). Daher beweisen wir: Satz 10.39. Sei ein R ADONmaß in ˝ und 1 p < 1. Die Klassen der h 2 Cc .˝/ bilden dann eine dichte Teilmenge von Lp .˝; d/. Insbesondere ist Lp .˝/ separabel. Beweis. Nach Satz 10.37 ist klar, dass Cc .˝/ Lp .˝; d/. Nun versuchen wir, f 2 Lp .˝; d/ durch h 2 Cc .˝/ zu approximieren, wobei wir mit speziellen Funktionen f beginnen und dann zu immer allgemeineren Fällen fortschreiten. (i) Sei f D E die charakteristische Funktion einer -messbaren Menge E ˝ mit .E/ < 1. Zu " > 0 finden wir auf Grund der Regularität von ein offenes U und ein kompaktes K mit K E U ˝; .E/ .K/ < "=2 und .U / .E/ < "=2. Dann ist .U n K/ D .U / .K/ < " : Der wesentliche Punkt ist nun die folgende Behauptung (Existenz einer „Abschmierfunktion“): Es gibt ein h 2 Cc .˝/ mit 0 h 1 in ganz ˝; hjK 1
Behauptung. (A) und Tr h U .
Für solch eine Funktion h (genauer: für ihre Äquivalenzklasse) ist Z Z d D .U n K/ < " kE hkpp D jE hjp d D U nK
˝
und somit kE hkp < "1=p ! 0 für " ! 0. Um Behauptung (A) zu beweisen, betrachten wir für abgeschlossene A Rn die Funktion d.x; A/ WD inf kx yk y2A
(mit irgendeiner Norm auf R ). Dann ist n
jd.x1 ; A/ d.x2 ; A/j kx1 x2 k ; wie man leicht aus der Dreiecksungleichung für die Norm herleitet. Dies zeigt, dass d.x; A/ eine stetige Funktion von x ist. Ferner ist offenbar d.x; A/ D 0 ” x 2 AN D A :
336
10 Maß und Integral
Für die abgeschlossene Menge B WD Rn n U ist B \ K D ;; und da K kompakt ist, folgt ı WD min d.x; B/ > 0 : x2K
Dann ist L WD Uı=2 .K/ eine kompakte Teilmenge von U . Mit A WD Rn n Uı=2 .K/ setzen wir d.x; A/ ; x2˝: h.x/ WD d.x; A/ C d.x; K/ Dann ist Tr h L U und hjK 1; also leistet h das Gewünschte. (ii) Nun sei f D ' eine Funktion aus Lp .˝; d/; die nur endlich viele Werte annimmt („simple Funktion“), und ˛1 ; : : : ; ˛m seien ihre verschiedenen Werte ¤ 0. Mit Ej WD ' 1 .˛j / haben wir dann 'D
m X
˛j Ej :
j D1
Z
Ferner ist k'kpp
j'jp d D j˛j jp .Ej /
Ej
und daher .Ej / j˛j jp k'kpp < 1 für alle j . Nach Teil (i) kann man also jedes Ej beliebig genau durch Funktionen aus Cc .˝/ approximieren, und durch Bildung der entsprechenden Linearkombinationen wird dann auch ' approximiert. (iii) Nun sei f 2 Lp .˝; d/ und f 0. Nach Lemma 10.23 gibt es eine Folge .'k / von simplen Funktionen mit 0 'k f und f .x/ D limk!1 'k .x/ für alle x. Dann ist 0 .f 'k /p f p ; also f 'k 2 Lp .˝; d/ und damit auch 'k 2 Lp .˝; d/ für alle k. Nach dem Satz von der dominierten Konvergenz (mit g D f p als Majorante) ergibt sich also Z lim kf 'k kpp D lim jf 'k jp d D 0 : k!1
k!1
˝
Zu " > 0 findet man daher ' D 'k mit kf 'kp < "=2 und dann nach Teil (ii) ein h 2 Cc .˝/ mit k' hkp < "=2. Es folgt kf hkp < "; wie gewünscht. (iv) Ein beliebiges f 2 Lp .˝; d/ wird in Real- und Imaginärteil zerlegt, und diese werden in positiven und negativen Teil zerlegt. Anwendung von (iii) auf alle vier Summanden und Linearkombination der entsprechenden Approximanden liefert dann das Ergebnis für das gegebene f . Die Separabilität von Lp .˝/ ergibt sich nun, indem man ˝ als Vereinigung einer aufsteigenden Folge .Km / von kompakten Teilmengen darstellt und die Separabilität der Räume C.Km / (Satz 7.7) ausnutzt. Wir übergehen die Details. t u
F Die Rolle der stetigen Funktionen
337
Der Vektorraum Cc .˝/ wird mit der Supremumsnorm k k1 zu einem normierten linearen Raum. Jedes R ADONmaß führt über das entsprechende Integral zu einem linearen Funktional auf Cc .˝/; nämlich Z .h/ WD h d ; h 2 Cc .˝/ : (10.70) ˝
Für dieses Funktional gilt offenbar j.h/j khk1 .Tr h/
8 h 2 Cc .˝/
(10.71)
sowie die Monotonieeigenschaft h1 h2 H) .h1 / .h2 / :
(10.72)
Man bezeichnet als ein positives lineares Funktional, denn die Monotonieeigenschaft ist offenbar äquivalent zu der Forderung .h/ 0
für alle h 0 :
Bei unserer Konstruktion des L EBESGUEschen Maßes (vgl. die Beweisskizze zu Theorem 10.11) waren wir vom R IEMANN-Integral für stetige Funktionen mit kompaktem Träger ausgegangen. Verwenden wir stattdessen ein beliebiges vorgegebenes positives lineares Funktional auf Cc .˝/; so führen im wesentlichen dieselben Argumente auf das folgende fundamentale Ergebnis: Theorem 10.40 (R IESZscher Darstellungssatz). Zu jedem linearen Funktional W Cc .˝/ ! C; das auf reellwertigen Funktionen reell ist und die Monotonieeigenschaft (10.72) besitzt, gibt es genau ein vollständiges R ADONmaß auf ˝; für das (10.73) gilt. Ein detaillierter Beweis hierfür ist in fast jedem Lehrbuch der Funktionalanalysis, Integrationstheorie oder höheren Analysis nachzulesen, z. B. in [27, 59] oder [78]. Die in 10.12 diskutierte Konstruktion der L EBESGUE -S TIELTJES-Maße ist natürlich ebenfalls ein Spezialfall von Theorem 10.40. Bemerkung: Der Satz sollte nicht mit dem gleichnamigen Theorem 8.16 verwechselt werden. Beide Ergebnisse verdienen die Bezeichnung „Darstellungssatz“, weil in beiden Fällen gewisse lineare Funktionale auf einem NLR durch konkrete Objekte der Analysis dargestellt werden, nämlich durch Vektoren des H IL BERT raums im Fall von Theorem 8.16 und durch R ADON maße hier. Ersetzt man das Gebiet ˝ Rn durch eine differenzierbare Mannigfaltigkeit M; so kann man Def. 10.36 sinnvoll formulieren und alle Ergebnisse dieses Abschnitts beweisen, insbesondere auch den R IESZschen Darstellungssatz. (Dies geschieht z. B. in [78] in noch allgemeinerem Kontext.) Ist M orientiert, dim M D n; so definiert jede positive n-Form ! 2 ˝ n .M / also ein R ADONmaß ! durch Anwenden des R IESZschen Darstellungssatzes auf das Funktional Z .'/ WD '! ; ' 2 Cc .M / : M
338
10 Maß und Integral
Dann ist f 2 L1 .M; M / genau dann, wenn die n-Form f ! im Sinne von 4.12 integrierbar ist. – Ist speziell .M; g/ eine orientierte R IEMANNsche Mannigfaltigkeit, so wählt man für ! die kanonische Volumenform !M und erhält so ein R ADONmaß M auf M; das als die korrekte Entsprechung des L EBESGUEschen Maßes gelten kann. Für jede B ORELmenge B M ist dann M .B/ das „euklidische Volumen“ von B. Auf einer symplektischen Mannigfaltigkeit .M; / der Dimension 2n erhält man entsprechend das symplektische Volumen der B ORELmengen von M; indem man die symplektische Volumenform h
nC1 2
.1/ ! WD nŠ
i
n
verwendet.
G Produktmaße und iterierte Integrale Mit Hilfe des Satzes von C ARATHÉODORY definieren wir Produktmaße und skizzieren Beweise für die Sätze von F UBINI und T ONELLI. Dabei verzichten wir weitgehend auf die – teilweise etwas aufwendigen – Einzelheiten der Beweise und verweisen hierzu auf die Fachliteratur, hauptsächlich auf [27] und [59], da wir dem in diesen Werken gewählten modernen Aufbau der Theorie folgen. Seien .X; A; /; .Y; B; / zwei Maßräume und Z D X Y das kartesische Produkt der zu Grunde liegenden Mengen. Unser Ziel ist, auf Z ein Maß einzuführen, für das A B messbar ist, sofern A 2 A und B 2 B ist, und zwar mit dem Wert .A B/ D .A/.B/ :
(10.73)
Wenn dies gelingt, so folgt für jede -messbare Menge S Z .S /
1 X
.Ak /.Bk /
kD1
für je zwei Folgen .Ak /; .Bk / von -messbaren Mengen Ak X und -messbaren Mengen Bk Y; für die 1 [ .Ak Bk / S kD1
ist. Daher definieren wir ˇ ( 1 ) 1 ˇ X [ ˇ .Ak /.Bk / ˇAk 2 A; Bk 2 B; S .Ak Bk / .S / WD inf ˇ kD1
kD1
(10.74)
G Produktmaße und iterierte Integrale
339
für jedes S Z. Man rechnet mühelos nach, dass diese Mengenfunktion ein äußeres Maß ist. Wir können hierauf den Satz von C ARATHÉODORY (Theorem 10.7) anwenden und erhalten so auf der -Algebra A. / der -messbaren Mengen ein Maß . Definition 10.41. Das Maß ; welches von dem durch (10.74) definierten äußeren Maß erzeugt wird, heißt das Produktmaß von und und wird mit oder ˝ bezeichnet. Die -Algebra der . ˝ /-messbaren Mengen wird mit A ˝ B bezeichnet. Damit ist das gesetzte Ziel erreicht, denn es gilt: Satz 10.42. Sei D ˝ das Produktmaß. a. Ist A 2 A und B 2 B; so ist A B -messbar, und es gilt (10.73). Insbesondere umfasst A ˝ B die von System der „Rechtecke“ A B; A 2 A; B 2 B erzeugte -Algebra. b. Zu beliebigem S X Y gibt es ein -messbares T S mit .S / D .T /. Die Berechnung des Maßes von komplizierteren Teilmengen S X Y kann, wie gewohnt, mit Hilfe des Prinzips von C AVALIERI erfolgen. Allerdings benötigt man dazu eine harmlose Zusatzvoraussetzung, die wir zunächst einführen müssen. Definition 10.43. Ein Maßraum .Z; C; / (oder auch das Maß ) heißt -endlich, wenn es abzählbar viele -messbare Mengen E1 ; E2 ; : : : gibt, für die .Em / < 1 sowie 1 [ ZD Em mD1
ist. Kurz: ist -endlich, wenn sich Z als abzählbare Vereinigung von Mengen mit endlichem Maß schreiben lässt. Wenn und beide -endlich sind, so ist auch ˝ -endlich. Das liegt an (10.73) und der Tatsache, dass N N abzählbar ist (Beweis als Übung!) Theorem 10.44 (Prinzip von C AVALIERI). Wenn D ˝ -endlich ist (also insbesondere, wenn und beide -endlich sind), so gilt für jedes -messbare S X Y: a. Der „Querschnitt“ S.x/ WD fy 2 Y j .x; y/ 2 S g ist -messbar für -fast alle x 2 X . b. Der „Querschnitt“ S.y/ WD fx 2 X j .x; y/ 2 S g ist -messbar Y. Z für -fast alle y 2 Z .S.x// d.x/ D .S.y// d.y/ ; c. .S / D X
Y
wobei die Integranden auf den Nullmengen, wo sie nicht definiert sind, in beliebiger Weise ergänzt werden. Die Behauptung schließt die Messbarkeit der auftretenden Integranden ein.
340
10 Maß und Integral
Bemerkung: Mit Hilfe dieses Satzes kann man die Rechnung rigoros durchführen, mit der am Beginn von Abschn. 10D unsere Definition des Integrals motiviert wurde. Sei nämlich .X; A; / ein -endlicher Maßraum, und sei f 2 MC .A/ gegeben. Wir schreiben wieder Sf .y/ WD fx 2 X j f .x/ > yg für y 0. Die Menge G WD f.x; y/ 2 X R j 0 y < f .x/g ist dann ˝ 1 -messbar, denn sie ist die abzählbare Vereinigung der „Rechtecke“ Sf .r/ Œ0; r; wobei r die positiven rationalen Zahlen durchläuft. Die Querschnitte sind G.x/ D Œ0; f .x/Œ für x 2 X bzw. G.y/ D Sf .y/
für y 0 :
Das C AVALIERIsche Prinzip liefert also Z1
Z f .x/ d.x/ D . ˝ 1 /.G/ D X
.Sf .y// dy : 0
Wenn man das Integral auf irgendeine andere Art einführt, kann man die Formel also wieder herleiten, die in 10.19 zu seiner Definition herangezogen wurde. Wir können nun leicht die grundlegenden Resultate über den Umgang mit mehrfachen Integralen ableiten. Wir formulieren sie nur für zwei Variable, aber sie gelten sinngemäß auch für eine beliebige (endliche) Anzahl von Variablen. Dies kann man z. B. durch Induktion beweisen, und auf jeden Fall ist es eine rein technische Angelegenheit, für die keine neuen Ideen erforderlich sind. Theorem 10.45. Seien .X; A; / und .Y; B; / zwei -endliche Maßräume, und sei D ˝ . a. (F UBINI) Für f 2 MC .A ˝ B/ gilt 0 0 1 1 Z Z Z Z Z f d D @ f .x; y/ d.y/A d.x/ D @ f .x; y/ d.x/A d.y/ ; XY
X
Y
Y
X
wobei überall der Wert C1 möglich ist. Insbesondere ist f -summierbar genau dann, wenn eines der iterierten Integrale (und dann auch das andere!) endlich ausfällt. b. (F UBINI) Ist f W X Y ! C eine -summierbare Funktion, so gilt 0 0 1 1 Z Z Z Z Z @ f .x; y/ d.y/A d.x/ D f d D @ f .x; y/ d.x/A d.y/ : X
Y
XY
Y
X
G Produktmaße und iterierte Integrale
341
Die Behauptung schließt die Existenz der iterierten Integrale rechts und links ein. c. (T ONELLI) Sei f W X Y ! C eine A ˝ B-messbare Funktion. Wenn eines der iterierten Integrale 1 1 0 0 Z Z Z Z @ jf .x; y/j d.y/A d.x/ oder @ jf .x; y/j d.x/A d.y/ X
Y
Y
X
endlich ausfällt, so ist f 2 L1 .X Y; d / und damit Teil b. auf f und jf j anwendbar. Beweis. a. Ist f D E die charakteristische Funktion einer A ˝ B-messbaren Menge E; so ergibt sich die Behauptung direkt aus Theorem 10.44c., denn für die Querschnitte ist offenbar E.x/ .y/ D E .x; y/ D E.y/ .x/ : Für allgemeines f folgt sie dann aus der Reihenentwicklung (10.26) zusammen mit dem Satz von B EPPO L EVI (Korollar 10.25). b. und c. folgen mit Theorem 10.29c. durch Anwendung von Teil a. auf die Summanden der Zerlegung f D uC u C iv C iv . t u Bemerkung: Bei Teil b. dieses Theorems sollte man sich sorgfältig klarmachen, was die Formulierung „Existenz eines iterierten Genau genomR R Integrals“ bedeutet. men, bedeutet z. B. die Existenz von X Y f .x; y/ d.y/ d.x/ nämlich die folgenden beiden Dinge: • Für -fast alle x 2 X ist die Funktion f .x; R / -summierbar (insbes. -messbar). • Die -f. ü. definierte Funktion g.x/ WD Y f .x; y/ d.y/ ist (bei beliebiger Ergänzung auf der Nullmenge, wo sie nicht definiert ist) -summierbar. Bei genauem Hinsehen erkennt man aber, dass der skizzierte Beweis tatsächlich alle diese Aussagen liefert. Wir betrachten kurz noch den Spezialfall, wo und auf offenen Teilmengen ˝1 von Rn bzw. ˝2 von Rm gegeben sind. Offenbar ist ˝ dann ein Maß auf der offenen Teilmenge ˝1 ˝2 von RnCm . Satz 10.46. a. Das Produkt zweier B ORELmaße ist ein B ORELmaß. b. Das Produkt zweier R ADONmaße ist ein R ADONmaß. c. Das Produkt der L EBESGUEmaße ist das entsprechende L EBESGUEmaß, d. h. n ˝ m D nCm .
342
10 Maß und Integral
Beweis. a. Jede offene Teilmenge U von RnCm kann als Vereinigung von abzählbar vielen „Rechtecken“ U1 U2 dargestellt werden, wo U1 offen in Rn und U2 offen in Rm ist. Zum Beispiel kann man um jeden Punkt a D .a1 ; : : : ; an ; anC1 ; : : : ; anCm / 2 U; dessen sämtliche Koordinaten rationale Zahlen sind, den offenen Würfel W .a; ıa / WD fx j jxk ak j < ıa für k D 1; : : : ; n C mg mit ıa WD
inf
y2RnCm nU
kx ak1 legen. Das sind nur abzählbar viele Würfel, ihre
Vereinigung ist genau U; und jeder Würfel ist im obigen Sinne ein „Rechteck“. Die -Algebra B n ˝ B m enthält also alle offenen Mengen von RnCm und damit auch alle B ORELmengen. b. Ist ein R ADONmaß auf ˝1 Rn ; ein R ADONmaß auf ˝2 Rm ; so ist WD ˝ nach a. jedenfalls ein B ORELmaß auf ˝1 ˝2 RnCm . Seien pn ; pm die Projektionen RnCm ! Rn bzw. RnCm ! Rm (d. h. pn .x/ besteht aus den ersten n Komponenten, pm .x/ aus den letzten m Komponenten des Vektors x 2 RnCm ). Ist K ˝1 ˝2 kompakt, so sind auch K1 WD pn .K/ ˝1 und K2 WD pm .K/ ˝2 kompakt, und es ist K K1 K2 . Mit (10.73) folgt .K/ .K1 K2 / D .K1 /.K2 / < 1 : Somit hat die Eigenschaft (iii) aus Def. 10.36. Wir haben aber im Anschluss an diese Definition bemerkt, dass dies schon ausreicht, um als R ADONmaß zu erweisen. c. Das Maß n ˝ m hat die Eigenschaften (L1)–(L3), die nach Theorem 10.11 das L EBESGUE-Maß charakterisieren. Bedingung (L1) ergibt sich aus Theorem 10.44c., und (L2) ist klar nach (10.73). Für (L3) beachte man, dass n ˝ m jedenfalls ein R ADONmaß ist, so dass man die äußere und innere Regularität heranziehen kann. t u Schließlich geben wir mit Hilfe des Produktmaßes eine nahe liegende Verallgemeinerung von Satz 7.22 an, bei dem das Tensorprodukt von H ILBERTräumen vom Typ L2 konkret beschrieben wird. Wir führen den Beweis unter der Voraussetzung, dass die beteiligten H ILBERTräume separabel sind, was für die Anwendungen ausreicht (vgl. die Sätze 7.7 und 10.39). Teil a. des folgenden Satzes gilt zwar auch im nichtseparablen Fall, doch ist dies für uns von untergeordnetem Interesse. Satz 10.47. Seien .Mi ; Ai ; i /; i D 1; 2; -endliche Maßräume. a. Dann existiert ein eindeutig bestimmter isometrischer Isomorphismus O 2 .M2 ; 2 / ! L2 .M1 M2 ; 1 ˝ 2 / U W L2 .M1 ; 1 /˝L mit U.f ˝ g/ D h ;
wo h.x; y/ WD f .x/g.y/
(10.75)
G Produktmaße und iterierte Integrale
343
für f 2 L2 .M1 ; 1 /; g 2 L2 .M2 ; 2 /. Wir schreiben daher f ˝ g für die Funktion h D U.f ˝ g/. b. Ist .e m / eine Orthonormalbasis von L2 .M1 ; 1 /; .f n / eine Orthonormalbasis von L2 .M2 ; 2 /; so ist (10.76) fe m ˝ f n j m; n 2 Ng eine Orthonormalbasis von L2 .M1 M2 ; 1 ˝ 2 /. Beweis. b. Sei M D M1 M2 ; WD 1 ˝ 2 . Für zwei Funktionen f 2 L2 .M1 ; 1 / ;
g 2 L2 .M2 ; 2 /
gehört das Produkt h.x; y/ WD f .x/ g.y/
(10.77)
zu L2 .M; /; wie sofort aus dem Satz von F UBINI folgt. Ebenso folgt für Orthonormalbasen .e m / von L2 .M1 ; 1 / bzw. .f n / von L2 .M2 ; 2 /; dass hmn .x; y/ D e m .x/f n .y/ ;
m; n 2 N
(10.78)
ein Orthonormalsystem in L2 .M; / bilden. Wir bezeichnen es mit B und zeigen seine Vollständigkeit, indem wir zeigen, dass es maximal orthogonal ist, d. h. dass kein Vektor außer dem Nullvektor zu allen Elementen von B orthogo?
nal ist. Dann folgt nämlich LH.B/ D B? D f0g und somit LH.B/ D f0g? D L2 .M; /; wie gewünscht (Theorem 7.13b. und Lemma 7.12b.). Gelte also “ g.x; y/e m .x/f n .y/ d.1 ˝ 2 / D 0 8 m; n (10.79) M1 M2
für ein g 2 L2 .M; /. Dann müssen wir zeigen: g.x; y/ D 0
für -fast alle .x; y/ 2 M :
(10.80)
Aus (10.79) und dem Satz von F UBINI folgt zunächst für jedes feste m Z Z g.x; y/e m .x/ d1 .x/ f n .y/ d2 .y/ D 0 8n : M2
Da
R M1 2
M1
g.x; /e m .x/ d1 .x/ 2 L2 .M2 ; 2 / ist und da .f n / maximal orthogonal
in L .M2 ; 2 / ist, folgt Z g.x; y/e m .x/ d1 .x/ D 0 M1
für alle y 2 M2 n Nm00
(10.81)
344
10 Maß und Integral
00
wobei 2 Nm D 0 ist. Setzen wir N 00 D
[
Nm00 ;
m
so ist 2 .N 00 / D 0. Daher gilt (10.81) für alle y 2 M2 nN 00 und alle m 2 N. Nun ist auch .e m / maximal orthogonal in L2 .M1 ; 1 /. Also gibt es nach derselben Überlegung eine 1 -Nullmenge N 0 M1 ; so dass g.x; y/ D 0 für alle x 2 M1 n N 0 ;
y 2 M2 n N 00 ;
d. h. es gilt g.x; y/ D 0
für -fast alle .x; y/ 2 M;
was die Vollständigkeit des Orthonormalsystems B in L2 .M; / beweist. a. Wir nehmen nun an, dass L2 .M1 ; 1 / und L2 .M2 ; 2 / separabel sind, so dass sie entsprechende Orthonormalbasen fe m j m 2 Ng bzw. ff n j n 2 Ng besitzen (Satz 7.5). Für den Moment schreiben wir f g für die Funktion f .x/g.y/ auf M1 M2 . Setzen wir nun E WD LH.fe m ˝ f n j m; n 2 Ng/ ;
F WD LH.fe m f n j m; n 2 Ng/ ;
O 2 .M2 ; 2 / und so ist E nach Satz 7.21 ein dichter Teilraum von L2 .M1 ; 1 /˝L 2 F ist, wie oben gezeigt, ein dichter Teilraum von L .M; /. Definieren wir daher einen linearen Operator U W E ! F durch U.e m ˝ f n / WD e m f n ;
m; n 2 N ;
so ist U ein linearer isometrischer Operator, der nach Theorem 8.7 (BLETheorem) zu einem isometrischen Isomorphismus O 2 .M2 ; 2 / ! L2 .M; / U W L2 .M1 ; 1 /˝L fortgesetzt werden kann. Für U gilt Gl. (10.75), wie man durch Einsetzen der F OURIERentwicklungen von f und g nach den jeweiligen Orthonormalsystemen bestätigt. t u
Aufgaben zu Kap. 10 10.1. Sei X eine beliebige Menge. Welche der im Folgenden angegebenen Systeme J von Teilmengen von X sind -Algebren, welche nicht? Bestimmen Sie in jedem Fall auch die von J erzeugte -Algebra. a. b.
J D fX; ;g. J D fX; E; X n E; ;g; wobei E eine feste Teilmenge mit ; ¤ E ¤ X ist.
Aufgaben
345
c. X habe mindestens zwei Elemente, und ein festes Element a 2 X sei vorgegeben. Dann sei J das System aller Teilmengen, die a enthalten. 10.2. Sei .X; A; / ein Maßraum, und f; g W X ! R seien messbare Funktionen. Man zeige, dass die folgenden Mengen messbar sind: fx j f .x/ < g.x/g ; fx j f .x/ g.x/g ; fx j f .x/ D g.x/g ; fx j f .x/ ¤ g.x/g : 10.3. Jede offene Teilmenge U der reellen Geraden kann eindeutig als endliche oder abzählbar unendliche Vereinigung von disjunkten offenen Intervallen dargestellt werden, nämlich ihren Zusammenhangskomponenten. Wir bezeichnen mit `.U / die Gesamtlänge von U; d. h. die Summe der Längen der disjunkten Intervalle, aus denen U besteht. Für beliebige Mengen E R setzen wir nun .E/ WD inff`.U / j U offen ; U Eg : Man zeige: a. ist ein äußeres Maß auf R. b. Das von erzeugte Maß ist das L EBESGUEsche Maß 1 . 10.4. Es sei v 2 C 1 .R/ und v 0 0; so dass v als Integrator dienen kann. Man zeige: a. Für jedes stetige f auf einem kompakten Intervall Œa; b ist Zb
Zb f dv D
a
f .x/v 0 .x/ dx :
a
b. Das von v erzeugte L EBESGUE -S TIELTJES-Maß ist dv D v 0 dx; d. h. für jede B ORELmenge E 2 B 1 gilt Z v .E/ D v 0 .x/ dx : E
10.5. a. Es sei v.x/ D 0 für x < 0; v.x/ D 1 für x > 0 und v.0/ D y0 mit irgendeinem y0 2 Œ0; 1. Man zeige, dass v dann das D IRACmaß im Nullpunkt ist. b. Nun sei v W R ! R eine monoton wachsende stückweise glatte Funktion mit endlich vielen Sprungstellen. Das heißt es gibt endlich viele Punkte 1 D 0 < 1 < 2 < < m < mC1 D C1; für die hk WD v.k C 0/ v.k 0/ > 0 ist (1 k m), und in den offenen Intervallen k ; kC1 Œ; k D 0; 1; : : : ; m ist v stetig differenzierbar. Man beschreibe das entsprechende L EBESGUE S TIELTJES-Maß v .
346
10 Maß und Integral
10.6. Es seien v; w W Œa; b ! R zwei stetige und monoton wachsende Funktionen. Man zeige: Zb Zb w dv D v.b/w.b/ v.a/w.a/ v dw : a
a
(Hinweis: Man betrachte für beide Integrale die approximierenden Summen (10.16) in Bezug auf dieselben Teilpunkte tk ; aber bei der einen mit den Stützstellen sk D tk ; bei der anderen mit sk D tk1 . Was passiert bei Addition dieser Summen?) 10.7. Es sei J das System aller Intervalle 1; x; x 2 R. Man zeige: a. Jedes offene Intervall und sogar jede offene Teilmenge von R lässt sich durch Bildung von Komplementen, abzählbaren Vereinigungen und abzählbaren Durchschnitten aus Mengen des Systems J konstruieren. Man beachte dabei: Jede offene Menge ist abzählbare Vereinigung von offenen Intervallen, nämlich ihren Zusammenhangskomponenten. b. Die von J erzeugte -Algebra ist B 1 . c. Zwei B ORELmaße 1 ; 2 auf R stimmen überein, wenn 1 .1; x/ D 2 .1; x/
8x 2 R
ist. 10.8. Wir wollen in unserem allgemeinen Rahmen die gängigen Rechenregeln über Integrale mit Parameter herleiten. Dazu betrachten wir einen Maßraum .X; A; /; einen metrischen Raum P (z. B. eine Teilmenge eines normierten linearen Raums) und eine Funktion f W X P ! K ; bei der die Funktionen f .; / für jedes feste 2 P messbar sind. Wir setzen Z J. / WD f .x; / d.x/ für jedes 2 P; für das das Integral existiert. Man zeige: a. Angenommen, es gilt: (i) (ii)
Für -fast alle x 2 X ist die Funktion f .x; / stetig in P; und zu jedem Punkt 0 2 P gibt es eine Umgebung U. 0 / und eine summierbare Funktion g 0 so, dass jf .x; /j g.x/
-f. ü.
für alle 2 U. 0 /. Dann ist J auf ganz P definiert und stetig. (Hinweis: Für eine Folge k ! 0 betrachte man die Funktionen fk .x/ WD f .x; k /.)
Aufgaben
347
b. Speziell sei P ein offenes Intervall. Angenommen, es gilt: (i) (ii)
Für -fast alle x 2 X ist die Funktion f .x; / stetig differenzierbar in P; und zu jedem Punkt 0 2 P gibt es eine Umgebung U. 0 / und zwei summierbare Funktionen g 0; h 0 so, dass ˇ ˇ ˇ ˇ@ ˇ -f. ü. jf .x; /j g.x/ ; ˇ f .x; /ˇˇ h.x/ @
für alle 2 U. 0 /.
Dann ist J auf ganz P stetig differenzierbar, und es gilt Z @f 0 .x; / d.x/ 8 2 P : J . / D @
(Hinweis: Man benutze das Produktmaß ˝ 1 sowie die für stetiges gültige R Formel dd 0 ./ d D . /.) c. Speziell sei P nun ein Gebiet in Rn ; ferner m 2 N. Angenommen, es gilt: (i) (ii)
Für -fast alle x 2 X ist die Funktion f .x; / m-mal stetig differenzierbar in P; und zu jedem Punkt 0 2 P gibt es eine Umgebung U. 0 / und -summierbare Funktionen g˛ 0; j˛j m; so, dass jD˛ f .x; /j g˛ .x/
-f. ü.
für alle 2 U. 0 /. Dann ist J 2 C m .P /; und für jeden Multiindex ˛ mit j˛j m gilt Z ˛ D J. / D D˛ f .x; / d.x/ : (Hinweis: Man benutze b. und Induktion nach m.) d. Speziell sei P nun ein Gebiet in der komplexen Ebene C. Angenommen, es gilt: (i) (ii)
Für -fast alle x 2 X ist die Funktion f .x; / holomorph in P; und zu jedem Punkt 0 2 P gibt es eine Umgebung U. 0 / und eine summierbare Funktion g 0 so, dass jf .x; /j g.x/
-f. ü.
für alle 2 U. 0 /. Dann ist J auf ganz P holomorph, und für alle m 2 N0 gilt Z m @ J .m/ . / D f .x; / d.x/ : @ m
348
10 Maß und Integral
(Hinweis: Man arbeite wie in Teil b. mit iterierten Integralen, benutze dazu aber die C AUCHYschen Integralformeln für die Funktionen f .x; / und deren Ableitungen.) 10.9. Sei .X; A; / ein Maßraum und H ein separabler H ILBERTraum. Wir betrachten H -wertige Funktionen auf X; also Abbildungen f W X ! H . Solch eine Funktion heißt schwach messbar, wenn für jedes v 2 H die skalare Funktion hf .x/jvi messbar ist. Zwei schwach messbare Funktionen f; g gelten als äquivalent, wenn f .x/ D g.x/ -f. ü. Man zeige: a. Ist f schwach messbar, so ist die Funktion ˛.x/ WD kf .x/k messbar. (Hinweis: PARSEVALsche Gleichung!) b. Die Äquivalenzklassen Œf der schwach messbaren Funktionen f; für die Z kf .x/k2 d.x/ < 1 ist, bilden mit dem Skalarprodukt Z hf j gi WD
hf .x/ j g.x/i d.x/
einen H ILBERTraum. (Die Vollständigkeit darf dabei ohne Beweis akzeptiert werden.) Man bezeichnet ihn mit L2H ./. c. Durch ! m m X X U0 'i ˝ vi D 'i vi i D1
i D1
ist eine isometrische lineare Abbildung U0 W L2 ./ ˝ H ! L2H ./ definiert. Dabei ist mit 'i vi die Funktion x 7! 'i .x/vi gemeint. Das Bild R.U0 / ist der Raum aller f 2 L2H ./; deren Wertebereich in einem endlich-dimensionalen Unterraum von H enthalten ist. (Hinweis: Wir schreiben L0 WD ff 2 L2H ./ j dim LH.f .X // < 1g und ordnen jedem f 2 L0 die reell bilineare Form Z Bf .g; w/ WD g.x/hw j f .x/i d.x/ ; g 2 L2 ./ ; w 2 H zu. Man zeige, dass durch V0 f D Bf dann eine lineare Bijektion V0 W L0 ! L2 ./ ˝ H gegeben ist. Man betrachte U0 WD V01 .) d. U0 lässt sich eindeutig fortsetzen zu einem isometrischen Isomorphismus O ! L2H ./ : U W L2 ./˝H
Kapitel 11
Distributionen und temperierte Distributionen
Die von P. A. M. D IRAC eingeführte „Delta-Funktion“ ı W Rn ! R sollte folgende Eigenschaften haben: ( Z 0 für x 6D 0; ı.x/ D ı.x/'.x/ dn x D '.0/ (11.1) ; C1 für x D 0 Rn
für jede stetige Funktion ' W Rn ! R. Nach der L EBESGUEschen Theorie ist aber ı.x/ fast überall D 0; und daher ist auch ı.x/'.x/ eine Nullfunktion, so dass nach Satz 10.20c. Z ı.x/'.x/ dn x D 0 Rn
für alle ' 2 L .R / sein muss. Selbst wenn man nur die Integraleigenschaft haben will, funktioniert dies nicht (vgl. Satz 11.2 unten). ı kann daher nicht sinnvoll als Funktion auf dem Rn aufgefasst werden, sondern ist eine „verallgemeinerte Funktion“ oder Distribution. Solche Distributionen sind stetige lineare Funktionale auf gewissen Funktionenräumen, deren Elemente man Testfunktionen nennt (Abschn. A). Die Idee ist, dass zur Beschreibung der Verteilung (= distribution) einer physikalischen Größe wie etwa Masse oder Ladung nicht nur Dichtefunktionen .x/ herangezogen R werden können, sondern auch allgemeinere Objekte, für die Integrale der Form .x/'.x/ dn x sinnvoll sind, obwohl die Werte .x/ an einzelnen Punkten nicht wohldefiniert sind. Genau genommen, sind die Äquivalenzklassen, aus denen die Lp -Räume bestehen, schon solche Objekte, aber es gibt noch viele andere, wie das Beispiel der Deltafunktion zeigt. Um eine mathematisch rigorose Theorie aufzubauen, die diesen Gedankengang realisiert, betrachtet man RAbbildungen ' 7! T .'/; die sich in vieler Hinsicht so verhalten wie T .'/ WD .x/'.x/ dn x es tut, wenn eine echte Funktion ist. Solche Funktionale T sind Distributionen, und man kann sich eine Testfunktion ' als ein Messgerät oder eine Sonde vorstellen, mit der die betreffende Verteilung einer physikalischen Gegebenheit untersucht wird und den Wert T .'/ als das Messergebnis. Zumeist möchte man dabei natürlich Auskunft über die physikalischen 1
n
K.-H. Goldhorn, H.-P. Heinz, M. Kraus, Moderne mathematische Methoden der Physik DOI 10.1007/978-3-540-88544-3, © Springer 2009
349
350
11 Distributionen und temperierte Distributionen
Gegebenheiten in einem u. U. sehr eng begrenzten räumlichen oder zeitlichen Bereich bekommen und benötigt daher Sonden, die nur in solch einem kleinen Bereich mit dem System wechselwirken. Daher ist es nicht verwunderlich, dass die brauchbaren Testfunktionen außerhalb einer kompakten Menge verschwinden oder doch im Unendlichen sehr schnell abklingen. Räume von brauchbaren Testfunktionen sowie dazu passende Konvergenzbegriffe werden wir in Abschn. A diskutieren. In Abschn. B werden dann Distributionen und sog. temperierte Distributionen systematisch eingeführt – das sind Distributionen, die im Unendlichen nicht allzu schnell anwachsen, und sie spielen eine Sonderrolle, weil man die F OURIERtransformation nur für diesen Typ von Distributionen sinnvoll erklären kann. In den weiteren Abschnitten werden dann Distributionen und temperierte Distributionen weitgehend parallel diskutiert: Wir klären die Beziehung zwischen Distributionen und punktweise (oder doch fast überall) definierten Funktionen genau, wir untersuchen, inwieweit Distributionen lokalisiert werden können, diskutieren kurz Distributionen mit kompaktem Träger, besprechen geeignete Konvergenzbegriffe für Folgen und Reihen von (temperierten) Distributionen und übertragen schließlich eine Reihe von wichtigen Rechenoperationen wie Variablensubstitution, Differentiation und F OURIERtransformation auf Distributionen. Weitere wichtige Rechenoperationen wie das Tensorprodukt und die Faltung von Distributionen werden wir im übernächsten Kapitel behandeln, während das nächste Kapitel in erster Linie expliziten Beispielen gewidmet sein wird.
A Testfunktionen In diesem Kapitel sei ˝ stets eine offene Teilmenge von Rn ; typischerweise ein Gebiet. Wir beginnen R mit der Einführung der größten Funktionenklasse, für die Integrale der Form ˝ f .x/'.x/ dx sinnvoll gebildet werden können, wenn ' eine stetige Funktion mit kompaktem Träger ist: Definition 11.1. Eine Funktion f W Rn ! C heißt lokal integrierbar, geschrieben f 2 L1loc .˝/; wenn Z jf .x/j dn x < 1 für jede kompakte Menge K Rn : (11.2) K
Der Vektorraum L1loc .˝/ besteht aus den Äquivalenzklassen Œf von lokal integrierbaren Funktionen f; wobei zwei derartige Funktionen f; g als äquivalent gelten, wenn f .x/ D g.x/ f. ü. in ˝. Wir können nun das Argument präzisieren, mit dem in der Einleitung begründet wurde, dass eine echte Funktion mit den Eigenschaften der Deltafunktion nicht existieren kann:
A Testfunktionen
351
Satz 11.2. Es gibt keine lokal integrierbare Funktion ı 2 L1loc .Rn / mit Z ı.x/'.x/ dn x D '.0/
.11:1/
Rn
für alle C 1 -Funktionen ' mit kompaktem Träger. Beweis. Sei ' eine C 1 -Funktion, die für jxj > R verschwindet, und sei M WD maxjxjR j'.x/j. Wir betrachten die Funktionenfolge .'k /; wobei 'k .x/ WD '.kx/. Alle 'k verschwinden außerhalb von K WD BR .0/; es ist limk!1 'k .x/ D 0 für alle x ¤ 0; und wir haben die integrierbare Majorante M jıjK . Der Satz über dominierte Konvergenz ergibt daher Z ı.x/'k .x/ dn x ! 0 für k ! 1 : R Nach (11.1) ist aber ı.x/'k .x/ dn x D 'k .0/ D '.0/ für alle k. Es folgt '.0/ D 0. Aus der Existenz einer lokal integrierbaren Funktion ı mit der angegebenen Eigenschaft würde also folgen, dass alle C 1 -Funktionen mit kompaktem Träger im Nullpunkt verschwinden müssen, was absurd ist. t u Man sieht also, dass es angebracht ist, den Bereich der lokal integrierbaren Funktionen in der Weise zu erweitern, die in der Einleitung angedeutet wurde. Es folgt die Definition der wichtigsten Räume von Testfunktionen und die Beschreibung der zugehörigen Konvergenzbegriffe. Für differenzierbare Funktionen auf ˝ verwenden wir durchweg die bekannte Multiindex-Schreibweise: @j˛j f D f D ˛1 ˛2 D @x1 @x2 @xn˛n
˛
@ @x1
˛1
@ @xn
˛n f
(11.3)
für ˛ D .˛1 ; : : : ; ˛n / 2 Nn0 ; wobei j˛j WD ˛1 C C ˛n ; x˛ D
n Y
˛
xj j ;
x D .x1 ; : : : ; xn / 2 Rn ;
(11.4) (11.5)
j D1
˛Š D
n Y
˛j Š :
(11.6)
j D1
Schließlich bezeichnen wir mit j j immer die euklidische Norm auf Rn ; also jxj WD
n X kD1
!1=2 xk2
für x D .x1 ; : : : ; xn / 2 Rn :
(11.7)
352
11 Distributionen und temperierte Distributionen
Definitionen 11.3. a. D.˝/ D Cc1 .˝/ ist der C-Vektorraum der finiten Testfunktionen in ˝; d. h. der C 1 -Funktionen ' in ˝; deren Träger Tr ' eine kompakte Teilmenge von ˝ ist. (Man beachte Def. 10.38 und die daran anschließende Erläuterung!) D.˝/ ist versehen mit folgendem Konvergenzbegriff: 'm ! ' ;
m ! 1
D
(11.8)
wenn es eine kompakte Menge K Rn gibt, so dass 1 Tr 'm K für alle m 2 N sowie 2 D ˛ 'm ! D ˛ ' gleichmäßig auf ˝ für alle Multiindizes ˛. b. S Sn ist der C-Vektorraum der schnell fallenden Testfunktionen, d. h. der C 1 -Funktionen ' auf ganz Rn ; bei denen die Funktion x ˛ D ˇ '.x/ für zwei beliebige Multiindizes ˛; ˇ beschränkt bleibt. Er ist versehen mit folgendem Konvergenzbegriff (11.9) 'm ! ' ; m ! 1 S
genau dann, wenn für alle Multiindizes ˛; ˇ x ˛ D ˇ 'm .x/ ! x ˛ D ˇ '.x/
(11.10)
gleichmäßig auf ganz Rn . In a. sichert die Bedingung 1 ; dass die Grenzfunktion ' wieder kompakten Träger hat, während 2 sichert, dass ' 2 C 1 .Rn / ist. In b. kann man die Gewichtsfunktionen x ˛ auch durch beliebige Polynome P .x/ in n Variablen ersetzen oder auch – was meist besonders bequem ist – durch Polynome von beliebig hohem Grad, die überall 1 sind. Wir formulieren dies genauer: Lemma 11.4. Folgende Bedingungen sind äquivalent: a. 'm ! ' ; S
m ! 1 ;
.11:9/
b. Für jedes k 2 N0 und jeden Multiindex ˛ gilt .1 C jxj2 /k D ˛ 'm .x/ ! .1 C jxj2 /k D ˛ '.x/ : glm:
(11.11)
Der Beweis dieser Aussage ist eine leichte Übung. In dem folgenden Satz sind für ˝ D Rn einige Beziehungen zwischen den beiden Arten von Testfunktionen zusammengefasst. Satz 11.5. a. D.Rn / ¤ Sn .
A Testfunktionen
353
b. Gilt 'm ! '; so gilt 'm ! '. D
S
c. D.Rn / liegt dicht in Sn ; d. h. zu jedem ' 2 Sn gibt es eine Folge von Funktionen 'm 2 D.Rn / mit 'm ! ' : S
Die Beweise für a. und b. sind leichte Übungen. Den etwas technischen Beweis von c. werden wir im Anschluss an Lemma 11.8 skizzieren. Zunächst müssen wir jedoch untersuchen, in welchem Umfang überhaupt geeignete Testfunktionen zur Verfügung stehen. Dazu erinnern wir an das Faltungsprodukt von Funktionen auf Rn (vgl. etwa [36], Kap. 33): Definition 11.6. Zwei messbare Funktionen f; g W Rn ! C heißen faltbar, wenn Z H.x/ WD jf .x y/g.y/j dn y Rn
fast überall endlich ist. In diesem Fall ist Z Z h.x/ WD f .x y/g.y/ dn y D f .y/g.x y/ dn y Rn
(11.12)
Rn
f. ü. definiert, und diese Funktion heißt das Faltungsprodukt f g oder kurz die Faltung von f und g. Eigenschaften und Anwendungen des Faltungsprodukts bilden ein hochinteressantes Thema der Analysis (vgl. z. B. [78, 79, 106]), von dem wir jetzt nur das zusammenstellen, was wir unmittelbar benötigen: Theorem 11.7. a. Ist f 2 L1loc .Rn / und ' 2 Cc .Rn /; so sind f; ' faltbar und ' f ist stetig. b. Ist f 2 L1loc .Rn / und sogar ' 2 D.Rn /; so ist ' f 2 C 1 ; und für alle Multiindizes ˛ gilt D ˛ .' f / D D ˛ ' f : R c. Sei f W Rn ! C stetig und ' 2 L1 .Rn / mit Rn ' dn x D 1 und ' 0 außerhalb einer Kugel BR .0/. Dann sind '; f faltbar, und für '" .x/ WD "n '.x="/ gilt f .x/ D lim .'" f /.x/ "!0C
gleichmäßig auf kompakten Mengen.
354
11 Distributionen und temperierte Distributionen
Beweis. a. und b. folgen sofort aus den bekannten Rechenregeln für Integrale mit Parameter (vgl. etwa [36], Kap. 28 oder auch unsere Aufgabe 10.8). c. Die Faltbarkeit ist klar. Seien x0 2 Rn und > 0 gegeben. Dann wähle ı > 0 so klein, dass jf .x/ f .x0 /j < =k'k1 für x 2 Uı .x0 / : R R Offenbar ist '" dn x D 1 und j'" j dn x D k'k1 für alle " (Substitution y D x=" !). Für 0 < " ı=R ergibt sich daher ˇZ ˇ Z ˇ ˇ n n ˇ ˇ j.'" f /.x0 / f .x0 /j D ˇ '" .y/f .x0 y/ d y '" .y/f .x0 / d y ˇ ˇ ˇ ˇ Z ˇ ˇ ˇ ˇ ˇ Dˇ '" .y/Œf .x0 y/ f .x0 / dn y ˇ ˇ ˇ ˇ jyj"R ˇ Z Z n j'" .y/j jf .x0 y/ f .x0 /j d y < j'" j dn y D ; k'k1 jyj"R
und dies bedeutet f .x0 / D lim"!0C .'" f /.x0 /. Die gleichmäßige Stetigkeit von f auf kompakten Mengen sorgt dafür, dass diese Konvergenz auf kompakten Mengen gleichmäßig ist. t u Mit Hilfe der Faltung kann man sozusagen maßgeschneiderte Testfunktionen konstruieren. Dabei geht man meist von der schon aus (4.1) bekannten speziellen Testfunktion aus, die nur um einen skalaren Faktor abgeändert wird. Wir betrachten nämlich ( e1=t für t > 0 ; 1 2 (11.13) .x/ WD C h0 .1 jxj / mit h0 .t/ WD 0 für t 0 ; Z
wobei C WD
h0 .1 jxj2 / dn x :
(11.14)
Man sieht, dass .x/ > 0 für jxj < 1; .x/ D 0 für jxj 1. Insbesondere ist Tr D B1 .0/ :
(11.15)
Die Wahl von C sorgt schließlich dafür, dass Z dn x D 1 :
(11.16)
B Distributionen
355
Lemma 11.8. Zu kompaktem K ˝ gibt es 2 D.˝/ mit 1 auf K und 0 1 auf ganz ˝. (Man bezeichnet solch ein als „glatte Abschmierfunktion“.) Beweis. Wir verwenden die Bezeichnungen aus dem Beweis von Satz 10.39 und setzen ı WD min d.x; Rn n ˝/ ; L WD Uı=2 .K/ : x2K
Mit der Funktion aus (11.13) und 0 < " < ı=2 setzen wir WD " L mit
" .x/ WD "n .x="/ :
Wir haben also 2 C
(11.17)
1
nach Theorem 11.7, und die explizite Darstellung Z n .x/ D " .y="/L .x y/ dn y jyj"
lässt wegen (11.16) erkennen, dass 0 .x/ 1 für alle x; dass 1 auf K und dass 0 auf der offenen Menge fx j d.x; L/ > "g. Wegen " < ı=2 folgt hieraus t u Tr Uı=2 .L/ ˝. Bemerkung: Um Satz 11.5c. zu beweisen, wählt man eine glatte Abschmierfunktion 2 D.Rn / mit 1 auf B1 .0/ und betrachtet bei gegebenem f 2 Sn die Folge 'm .x/ WD .x=m/f .x/ : Offenbar ist 'm 2 D.Rn /; und wir haben die punktweise Konvergenz 'm .x/ ! f .x/ für m ! 1. Um nachzuweisen, dass sogar die Konvergenz 'm ! f im S
Sinne von (11.10) besteht, bedarf es einiger technischer Abschätzungen, die wir übergehen. Der folgende Satz ist von fundamentaler Bedeutung: Theorem 11.9. Für 1 p < 1 ist D.˝/ dicht in Lp .˝/. Beweis. Der Beweis verläuft exakt wie der Beweis von Satz 10.39, außer dass Lemma 11.8 die Stelle der dortigen Behauptung (A) einnimmt. t u
B Distributionen Die Räume D.˝/ und Sn sind sogenannte topologische Vektorräume, d. h. Vektorräume mit einem Konvergenzbegriff. Man beachte, dass D.˝/ und Sn weder normierte Räume noch metrische Räume sind. Trotzdem kann man die Stetigkeit von linearen Funktionalen, die auf diesen Räumen definiert sind, durch das Folgenkriterium beschreiben. Deshalb definieren wir:
356
11 Distributionen und temperierte Distributionen
Definition 11.10. Sei V ein topologischer Vektorraum über K. Eine Abbildung T W V ! K heißt ein stetiges lineares Funktional auf V; wenn a. T .c1 '1 C c2 '2 / D c1 T .'1 / C c2 T .'2 / für alle 'i 2 V; ci 2 K; b. 'm ! ' H) T .'m / ! T .'/ : V
0
Der K-Vektorraum V der stetigen linearen Funktionale auf V (punktweise Addition und Skalarmultiplikation!) heißt der topologische Dualraum zu V . Bemerkung: In der mathematischen Literatur wird Eigenschaft 11.10b. als Folgenstetigkeit bezeichnet, und für allgemeine topologische Vektorräume ist dies eine schwächere Forderung als die Stetigkeit selbst. Wir erlauben uns hier eine Abweichung von der üblichen Sprechweise, weil es bei den uns interessierenden Räumen keinen Unterschied macht. Distributionen sind nun einfach die Elemente von .D.˝//0 D0 .˝/ bzw. Sn0 ; d. h. stetige lineare Funktionale auf Räumen von Testfunktionen. Definitionen 11.11. a. Die Elemente T 2 D0 .˝/; d. h. die stetigen linearen Funktionale T W D.˝/ ! C heißen Distributionen in ˝. b. Die Elemente T 2 Sn0 ; d. h. die stetigen linearen Funktionale T W Sn ! C heißen temperierte Distributionen. c. Eine (temperierte) Distribution T heißt regulär, wenn es ein f 2 L1loc .˝/ gibt, so dass Z T .'/ D f .x/ '.x/ dn x (11.18) ˝
für alle ' 2 D.˝/ (bzw. ' 2 Sn ). Man nennt dann T die von f erzeugte reguläre (temperierte) Distribution und schreibt T Œf :
(11.19)
Gibt es kein solches f 2 L1loc .˝/; so dass (11.18) gilt, so heißt T eine singuläre Distribution. d. Schreibweise: hT; 'i D T .'/ ; T 2 D0 .˝/ ; ' 2 D.˝/
(11.20) T 2 Sn0 ; ' 2 Sn : R Bemerkungen: (i) Zuweilen schreibt man auch ˝ T .x/'.x/ dn x; auch wenn es sich um eine singuläre Distribution handelt. Das ist natürlich nur eine symbolische Schreibweise für hT; 'i. Sie ist hauptsächlich dann praktisch, wenn mehrere Variable im Spiel sind, da aus ihr hervorgeht, auf welche Variable die Distribution T wirkt bzw.
B Distributionen
357
(d. h. von welcher Variablen die Testfunktionen abhängen, auf die T wirkt). Diese Situation werden wir hauptsächlich in Abschn. G und später in Kap. 13 antreffen. (ii) Jede temperierte Distribution T ist tatsächlich eine Distribution im Sinne von Def. 11.11a., denn nach Einschränkung auf D.Rn / ergibt T ein stetiges lineares Funktional auf D.Rn /; wie Satz 11.5b. zeigt. Wegen Satz 11.5c. ist T 2 Sn0 durch seine Einschränkung auf D.Rn / auch eindeutig bestimmt, d. h. verschiedene stetige lineare Funktionale auf Sn ergeben auch verschiedene Distributionen. Beim Nachweis, dass ein gegebener Ausdruck eine (temperierte) Distribution definiert, ist die Linearität i. A. kein Problem. Um die Stetigkeit nachzuprüfen, ist es meist praktisch, die folgenden Abschätzungen zu verwenden: Satz 11.12. a. Für ' 2 D.˝/; m 2 N0 und eine kompakte Teilmenge K ˝ sei pm;K .'/ WD max max jD ˛ '.x/j : j˛jm x2K
(11.21)
Dann gilt: Ein lineares Funktional T W D.˝/ ! C ist genau dann eine Distribution, wenn es zu jeder kompakten Teilmenge K ˝ ein C 0 und ein m 2 N0 gibt, so dass jhT; 'ij Cpm;K .'/ 8 ' 2 D.˝/ mit Tr ' K :
(11.22)
b. Für ' 2 Sn und m 2 N0 sei qm .'/ WD max sup .1 C jxj2 /m jD ˛ '.x/j : j˛jm x2Rn
(11.23)
Dann gilt: Ein lineares Funktional T W Sn ! C ist genau dann eine temperierte Distribution, wenn es ein C 0 und ein m 2 N0 gibt, so dass jhT; 'ij C qm .'/
8 ' 2 Sn :
(11.24)
Beweis. Wir führen nur den Nachweis, dass die angegebenen Bedingungen für die Stetigkeit der linearen Funktionale hinreichend sind. Dass die Bedingungen auch notwendig sind, beweist man durch Widerspruch. Da die Notwendigkeit aber für uns von untergeordnetem Interesse ist, verzichten wir diesbezüglich auf Einzelheiten. a. Angenommen, 'k ! ' für k ! 1. Dann gibt es ein kompaktes K ˝ so, D
dass Tr 'k ; Tr ' K. Zu K wählen wir C; m gemäß der Bedingung aus a. Es ist auch Tr .'k '/ K für alle k; also nach (11.22) jhT; 'k i hT; 'ij D jhT; 'k 'ij Cpm;K .'k '/ ; und wegen der gleichmäßigen Konvergenz aller Ableitungen (vgl. 11.3a.) geht das für k ! 1 gegen Null. Also ist hT; 'i D limk!1 hT; 'k i; wie verlangt. b. Sei nun T W Sn ! C ein lineares Funktional, welches (11.24) für ein C 0 und ein m 2 N0 erfüllt. Gelte 'k ! ' ; S
k ! 1 :
358
11 Distributionen und temperierte Distributionen
Nach 11.3b. und (11.23) gilt dann qm .'k '/ ! 0
für k ! 1 ;
und daraus folgt nach (11.24) jhT; 'k i hT; 'ij C qm .'k '/ ! 0
für k ! 1 .
Das bedeutet aber, dass T stetig bezüglich der S-Konvergenz ist, d. h. T 2 Sn0 . t u Beispiel: Für x0 2 ˝ ist ıx0 W D.˝/ ! C mit hıx0 ; 'i WD '.x0 /
(11.25)
eine singuläre Distribution, die sogenannte Delta-Distribution am Punkt x0 . Denn ıx0 ist sicher ein lineares Funktional, und wegen jhıx0 ; 'ij max j'.x/j x2˝
haben wir für jedes kompakte K auch (11.22) mit m D 0 ; C D 1. Also ist ıx0 eine Distribution. Dass diese Distribution nicht regulär ist, ist gerade die Aussage von Satz 11.2. Die Distributionsmengen D0 .˝/ und Sn0 sind Vektorräume, d. h. Linearkombinationen von (temperierten) Distributionen sind wieder (temperierte) Distributionen. Die Analogie zwischen Funktionen und Distributionen hat aber ihre Grenzen. Insbesondere können Produkte von Distributionen i. A. nicht sinnvoll definiert werden. Jedoch ist Folgendes möglich: Satz 11.13. Ist T 2 D0 .˝/ und f 2 C 1 .˝/; so wird durch hf T; 'i WD hT; f 'i ;
' 2 D.˝/
(11.26)
eine Distribution f T 2 D0 .˝/ definiert. Beweis. Ist ' 2 D.˝/; so ist auch f ' 2 D.˝/; also definiert (11.26) auf jeden Fall ein lineares Funktional auf D.˝/. Seine Stetigkeit folgt sofort aus der von T; sobald gezeigt ist, dass 'k ! ' H) f 'k ! f ' : D
D
./
Hierzu benötigt man die L EIBNIZ-Regel (also die Produktregel für höhere Ableitungen – vgl. etwa [36], Ergänzungen zu Kap. 9). Sie besagt D ˛ .f '/ D
X ˇ C D˛
˛Š ˇ D f D ' : ˇŠ Š
(11.27)
Nun sei 'k ! ' für k ! 1. Dann liegen Tr ' und die Träger aller 'k in einer D
kompakten Menge K ˝; und für alle m ist limk!1 pm;K .'k '/ D 0; wobei
C Reguläre Distributionen
359
pm;K durch (11.21) definiert ist. Offenbar ist Tr f 'k Tr 'k K und ebenso Tr f ' K. Da die D ˇ f stetig sind, haben wir endliche Maxima Mˇ WD max jD ˇ f .x/j < 1 ; x2K
und damit ergibt die L EIBNIZ-Regel für jeden Multiindex ˛: X ˛Š Mˇ max jD .'k .x/ '.x//j max jD ˛ .f 'k f '/j x2K x2K ˇŠ Š ˇ C D˛
C˛ pmK .'k '/ t u
mit festem C˛ > 0. Damit ergibt sich ./.
Um eine analoge Aussage für temperierte Distributionen machen zu können, benötigen wir weitere Funktionenklassen: Definitionen 11.14. a. Eine L EBESGUE-messbare Funktion f W Rn ! C heißt von polynomialem Wachstum, wenn es Konstanten C 0 und m 2 N0 gibt, so dass jf .x/j C.1 C jxj2 /m
8 x 2 Rn :
(11.28)
Wir schreiben dann: f 2 Pn . b. Die Klasse Pn1 besteht aus allen f 2 C 1 .Rn /; so dass zu jedem Multiindex ˛ Konstanten C D C.˛/ 0; m D m.˛/ 2 N0 existieren mit jD ˛ f .x/j C.1 C jxj2 /m
8 x 2 Rn ;
(11.29)
d. h. die Funktion f und alle ihre Ableitungen sind von polynomialem Wachstum. Satz 11.15. Ist T 2 Sn0 und f 2 Pn1 ; so wird durch hf T; 'i WD hT; f 'i ;
' 2 Sn
(11.30)
eine temperierte Distribution f T 2 Sn0 definiert. Der Beweis verläuft ganz ähnlich wie beim vorigen Satz. Insbesondere spielt die L EIBNIZregel wieder die entscheidende Rolle (Übung!).
C Reguläre Distributionen Zunächst untersuchen wir, welche Funktionen f auf die in Def. 11.11c. beschriebene Weise zu Distributionen bzw. zu temperierten Distributionen führen.
360
11 Distributionen und temperierte Distributionen
Satz 11.16. a. Für jede Funktion f 2 L1loc .˝/ wird durch Z hŒf ; 'i WD f .x/'.x/ dn x ;
' 2 D.˝/
(11.31)
˝
eine Distribution Œf 2 D0 .˝/ definiert. b. Jede Funktion f 2 Pn ; d. h. von polynomialem Wachstum, erzeugt gemäß Z hŒf ; 'i WD f .x/'.x/ dn x ; ' 2 Sn (11.32) Rn
eine reguläre temperierte Distribution Œf 2 Sn0 . Beweis. a. Dass das Integral in (11.31) für jedes ' 2 D.˝/ existiert und ein lineares Funktional definiert, ist nach Def. 11.1 klar, weil jedes ' 2 D.˝/ kompakten Träger hat. Ist K ˝ kompakt und Tr ' K; so folgt Z jf .x/j dn x D Cp0;K .'/ jhŒf ; 'ij max j'.x/j x2K
K
R
mit C WD K jf j dn x < 1. Nach Satz 11.12a. ist Œf also eine Distribution. b. Wenn f 2 Pn ist, so gibt es nach Definition 11.14a. Konstanten C 0; m 2 N0 ; so dass jf .x/j C.1 C jxj2 /m ; x 2 Rn : R Nun ist bekanntlich Rn .1 C jxj2 /k dn x < 1 für k > n=2; wie man durch Transformation auf Polarkoordinaten erkennt (vgl. etwa [36], Kap. 15), und daher Z jf .x/j .1 C jxj2 /mk dn x < 1 : Rn
Daraus folgt dann für ' 2 Sn : Z jhŒf ; 'ij jf .x/j j'.x/j dn x
Z n
Rn
jf .x/j.1 C jxj2 /mk
on
o .1 C jxj2 /mCk j'.x/j dn x
Rn
konst: qmCk .'/ ; was mit Satz 11.12b. die Behauptung ergibt.
t u
C Reguläre Distributionen
361
Bemerkung: Funktionen mit exponentiellem Wachstum ergeben keine temperier2 ten Distributionen. Zum Beispiel kann die reguläre Distribution zu ex nicht tempe2 riert sein, da ex zu S1 gehört (vgl. auch Aufgabe 11.2). Der Vorrat an Testfunktionen ist reichhaltig genug, um eine lokal integrierbare Funktion so weit festzulegen, wie Integrale es irgend könnnen, nämlich bis auf Übereinstimmung fast überall. Dies wird durch den folgenden fundamentalen Satz ausgedrückt: Theorem 11.17 (Fundamentallemma der Variationsrechnung). Ist f 2 L1loc .˝/ und Z f .x/'.x/ dn x D 0 für alle ' 2 D.˝/ ; ˝
so ist f .x/ D 0 f. ü. Bemerkung: Den Beweis hierfür in voller Allgemeinheit zu führen, ist technisch etwas aufwendig, und wir erleichtern uns die Sache, indem wir den Bereich der zugelassenen Funktionen f etwas einschränken. Es sei L2loc .˝/ der Raum der messbaren f W ˝ ! C; bei denen für jedes kompakte K ˝ Z jf j2 dn x < 1 K
ist. Jedes solche f ist lokal integrierbar, denn wir haben 0 11=2 Z Z p jf j dn x n .K/ @ jf j2 dn x A 1=m ; jxj < mg : Daher ist sogar f .x/ D 0 f. ü. auf ˝.
t u
Sind also f1 ; f2 zwei lokal integrierbare Funktionen, für die die entsprechenden regulären Distributionen übereinstimmen, so erfüllt f WD f1 f2 die Voraussetzungen von Theorem 11.17, und daher muss f1 .x/ D f2 .x/ f. ü. auf ˝ sein. Jede reguläre Distribution aus D0 .˝/ stammt also von einer eindeutigen Äquivalenzklasse Œf 2 L1loc .˝/; und daher bezeichnen wir mit Œf einmal die besagte Äquivalenzklasse und ein anderes Mal die entsprechende reguläre Distribution. In etwas abstrakterer Form lautet diese Eindeutigkeitsaussage: Korollar 11.18. Wird jeder Funktion f 2 L1loc .˝/ die entsprechende reguläre Distribution Œf gemäß (11.18) zugeordnet, so ergibt sich eine Einbettung, d. h. eine injektive lineare Abbildung L1loc .˝/ ,! D0 .˝/ : Ebenso ergibt sich eine Einbettung Pn ,! Sn0 ; wobei Pn den Vektorraum der Äquivalenzklassen von Funktionen mit polynomialem Wachstum bezeichnet. Bemerkung: Wenn die Äquivalenzklasse Œf eine stetige Funktion enthält, so ist diese, wie wir wissen, eindeutig bestimmt und wird als bevorzugter Repräsentant gewählt. Die entsprechende reguläre Distribution wird dann ebenfalls mit dem stetigen Repräsentanten identifiziert, und man sagt, die Distribution „ist“ diese Funktion.
D Lokalisierung und Träger Wir diskutieren zunächst das lokale Verhalten von Distributionen. Wie schon erläutert, hat es i. A. keinen Sinn, bei einer Distribution T von dem Wert T .x/; x 2 ˝ zu sprechen. Trotzdem kann man Distributionen ganz ähnlich wie Funktionen auf Teilmengen von ˝ einschränken, jedenfalls, wenn diese Teilmengen offen sind: Definitionen 11.19. a. Sei U eine offene Teilmenge von ˝; und sei T 2 D0 .˝/ eine Distribution. Man sagt, T verschwindet in U; wenn hT; 'i D 0
für alle ' 2 D.˝/ mit Tr ' U :
D Lokalisierung und Träger
363
b. Man sagt, dass zwei Distributionen T1 ; T2 2 D0 .˝/ in der offenen Teilmenge U von ˝ übereinstimmen (geschrieben: „T1 T2 in U “ oder „T1 jU D T2 jU “), wenn T1 T2 in U verschwindet, wenn also hT1 ; 'i D hT2 ; 'i für alle Testfunktionen ' 2 D.˝/; deren Träger in U liegen. c. Der Träger der Distribution T 2 D0 .˝/ ist die Menge Tr T; die folgendermaßen definiert ist: Ein Punkt x 2 ˝ gehört genau dann zu Tr T; wenn x keine offene Umgebung besitzt, in der T verschwindet. d. Ist Tr T kompakt, so heißt T eine finite Distribution. Bemerkungen: (i) Alle diese Sprechweisen können auch auf temperierte Distributionen angewendet werden, da man temperierte Distributionen ja als Distributionen aus D0 .Rn / auffassen kann, wie im Anschluss an 11.11 erläutert. (ii) Ist T D Œf die reguläre Distribution zu einer stetigen Funktion f; so ist Tr T D Tr f : Der Beweis sei als Übung empfohlen. Wenn zwei Distributionen in offenen Mengen U1 ; U2 ; : : : übereinstimmen, so stimmen sie auch in der Vereinigung U D U1 [ U2 [ überein. Diese Tatsache ist für Funktionen absolut trivial, für Distributionen aber keineswegs selbstverständlich. Andererseits ist sie eine entscheidende Voraussetzung dafür, dass die hier definierten Objekte als Mathematische Modelle für raumzeitlich lokalisierte physikalische Sachverhalte tauglich sind. Beim Beweis spielen die schon in Kap. 4 diskutierten Zerlegungen der Eins eine entscheidende Rolle. Die dabei betrachtete Mannigfaltigkeit ist einfach das Gebiet ˝. Die lokale Übereinstimmung von Distributionen kann natürlich durch das lokale Verschwinden ihrer Differenz getestet werden. Darum genügt es für unsere Zwecke, die größte offene Menge zu beschreiben, in der eine Distribution verschwindet: Satz 11.20. Sei T 2 D0 .˝/. Dann verschwindet T in einer offenen Teilmenge U ˝ genau dann, wenn U \ Tr T D ; ist. Insbesondere ist ˝ n Tr T die größte offene Menge, in der T verschwindet. Beweis. Ist U \ Tr T ¤ ;; so kann T nicht in U verschwinden, wie unmittelbar aus der Definition von Tr T folgt. Um die umgekehrte Richtung zu zeigen, betrachten wir eine beliebige Testfunktion ' 2 D.˝/; deren Träger K disjunkt von Tr T ist, und zeigen, dass hT; 'i D 0 sein muss. Wegen K \ Tr T D ; hat jeder Punkt x 2 K eine offene Umgebung Ux ; in der T verschwindet. Gemäß der in Def. 1.13 gegebenen Beschreibung der Kompaktheit durch die H EINE -B ORELsche Überdeckungseigenschaft kann man nun endlich viele Punkte x1 ; : : : ; xm 2 K wählen, für die K Ux1 [ : : : [ Uxm ist. Zusammen mit U0 WD ˝ n K bilden die Uj WD Uxj eine endliche offene Überdeckung von ˝.
364
11 Distributionen und temperierte Distributionen
Nach Theorem 4.2 gibt es auf ˝ eine dieser Überdeckung untergeordnete Zerlegung h0 ; h1 ; : : : ; hm der Eins. Da T für j 1 in Uj verschwindet, folgt hT; hj 'i D 0 für alle j 1. Da ' außerhalb von K verschwindet, folgt überdies m X
hj ' D '
j D1
m X
hj h0 ' D ' „ƒ‚… D0 „ƒ‚… j D0
D1
und daher hT; 'i D
Pm
j D1 hT; hj 'i
D 0 ; wie behauptet.
t u
Daraus ergibt sich sofort die Aussage, um die es uns ging: Korollar 11.21. Es sei .Ui /i 2I ein beliebiges System von offenen Teilmengen von ˝. Wenn zwei Distributionen T1 ; T2 2 D0 .˝/ in jedem Ui übereinstimmen, so stimmen sie auch in [ Ui U WD i 2I
überein. Beweis. Jedes Ui ist disjunkt von S WD Tr .T1 T2 /; also ist auch U disjunkt von S. t u Zum Schluss dieses Abschnitts gehen wir noch kurz auf die besondere Rolle der finiten Distributionen ein. Temperierte Distributionen zeichnen sich dadurch aus, dass sie im Unendlichen nicht schneller anwachsen als ein Polynom. Diese Faustregel wird zumindest durch die Sätze 11.15 und 11.16b. nahegelegt. Dazu passt es auch, dass die Distributionen mit kompaktem Träger sich als temperierte Distributionen auffassen lassen: Satz 11.22. Jede finite Distribution T 2 D0 .˝/ kann eindeutig zu einer temperierten Distribution T1 2 Sn0 fortgesetzt werden, d. h. genau: Ist T 2 D0 .˝/ finit, so gibt es genau eine temperierte Distribution T1 ; die auf ˝ mit T übereinstimmt und auf Rn n Tr T verschwindet. Ist 2 D.˝/ mit D 1 in einer Umgebung von Tr T; so ist T1 durch (11.33) hT1 ; 'i WD hT; 'i für ' 2 Sn gegeben. Beweis. Es ist zunächst zu zeigen, dass durch (11.33) ein stetiges lineares Funktional auf Sn definiert ist. Die Linearität ist dabei klar. Gelte also 'm ! ' ; S
m ! 1 :
Da Tr 'm K WD Tr für alle m und ebenso Tr ' K; folgt 'm ! ' ; D
m ! 1 :
E Konvergente Folgen von Distributionen
365
Da T auf D.˝/ stetig ist, gilt also mit (11.33) hT1 ; 'm i hT; 'm i ! hT; 'i hT1 ; 'i : Um zu zeigen, dass T1 in ˝ mit T übereinstimmt, betrachten wir ' 2 D.Rn / mit Tr ' ˝; so dass man ' auch als eine Testfunktion in ˝ auffassen kann. Nach Voraussetzung verschwindet 1 in einer Umgebung von Tr T; also ist Tr .1 /' \ Tr T D ; und daher nach Satz 11.20 hT; 'i hT1 ; 'i D hT; .1 /'i D 0 : Somit ist in der Tat hT1 ; 'i D hT; 'i. Ist hingegen Tr ' Rn n Tr T; so ist Tr ' \ Tr T D ;; also hT1 ; 'i D 0. Somit verschwindet T1 in Rn n Tr T . Die Eindeutigkeit von T1 folgt sofort aus Kor. 11.21, denn Rn D ˝ [ .Rn n Tr T / : t u
E Konvergente Folgen von Distributionen Als nächstes betrachten wir Folgen von Distributionen. Dabei definieren wir Konvergenz einfach als punktweise Konvergenz der Funktionale: Definition 11.23. Eine Folge von Distributionen Tm 2 D0 .˝/ (bzw. temperierten Distributionen Tm 2 Sn0 ) konvergiert gegen eine Distribution T 2 D0 .˝/ (bzw. gegen eine temperierte Distribution T 2 Sn0 ), wenn lim hTm ; 'i D hT; 'i 8 ' 2 D.˝/ bzw. alle ' 2 Sn :
m!1
Man schreibt: SD
1 X
Tm ”
mD1
lim
M !1
M X
Tm D S :
(11.34)
(11.35)
mD1
Beispiele 11.24. a. Sei f D limm!1 fm in L1loc .˝/; d. h. für jedes kompakte K ˝ soll Z lim jf .x/ fm .x/j dn x D 0 m!1
K
sein. Für die entsprechenden regulären Distributionen gilt dann auch Œf D limm!1 Œfm . Denn für ' 2 D.˝/; K WD Tr ' haben wir Z jhŒf ; 'i hŒfm ; 'ij jf .x/ fm .x/j j'.x/j dn x K
366
11 Distributionen und temperierte Distributionen
0 @
Z
1
A jf .x/ fm .x/j d x max j'.x/j ! 0 : n
x2K
K
b. Die Situation aus a. liegt insbesondere dann vor, wenn f D limm!1 fm im Raum Lp .˝/ ist (1 p 1). Für p D 1 oder p D 1 ist das trivial. Im Fall 1 < p < 1 setze man q WD p=.p 1/ und wende die H ÖLDERsche Ungleichung an. Das ergibt für kompaktes K ˝ Z
1=q jf fm j dn x n .K/ kf fm kp ! 0
K
für m ! 1. c. Wir wählen in Theorem 11.7c. die stetige Funktion f speziell als schnell fallende Testfunktion f 2 Sn und setzen fL.x/ WD f .x/. Betrachten wir dann für eine Nullfolge "m & 0 die Distributionen Tm WD Œ'"m (mit den Bezeichnungen und Voraussetzungen aus 11.7c.), so ergibt dieses Theorem Z hTm ; f i D '"m .y/f .y/ dn y D .'"m fL/.0/ ! fL.0/ D f .0/ D hı; f i : Das bedeutet, dass ı D limm!1 Tm in Sn0 und insbesondere in D0 .Rn /. Die manchmal – z. B. in [36] – verwendete Sprechweise, dass das System .'" / „die Deltafunktion approximiert“, ist hierdurch gerechtfertigt. d. Sei .ak / eine Folge von Punkten von ˝; die in ˝ keinen Häufungspunkt besitzt. Dann ist für jede beliebige Zahlenfolge .k / durch T WD
1 X
k ıak
kD1
eine Distribution T 2 D0 .˝/ definiert. Denn für jede Testfunktion ' 2 D.˝/ enthält die kompakte Menge Tr ' nur endlich viele Punkte aus der Folge .ak /; also besteht die Summe hT; 'i D
1 X
k '.ak /
kD1
in Wirklichkeit nur aus endlich vielen Termen. Es ist hierdurch daher ein lineares Funktional auf D.˝/ gegeben, und seine Stetigkeit nachzuprüfen, ist eine leichte Übung, die aber auch durch Zitieren des nächsten Satzes ersetzt werden kann. Sei nun .Tm / eine Folge in D0 .˝/ und nehmen wir an, dass für jedes ' 2 D.˝/ der punktweise Limes (11.36) T .'/ WD lim hTm ; 'i m!1
E Konvergente Folgen von Distributionen
367
existiert. Dann wird durch (11.36) eine Abbildung T W D.˝/ ! C definiert, die offenbar linear ist. Tatsächlich ist T sogar stetig und damit eine Distribution. Da C AUCHYfolgen in C konvergent sind, folgt daraus sogar (in gewissem Sinne) die Vollständigkeit der Räume D0 .˝/ und Sn0 . Satz 11.25. Sind Tm 2 D0 .˝/ (bzw. Sn0 ) und existiert T .'/ WD lim hTm ; 'i
.11:36/
m!1
für alle ' 2 D.˝/ (bzw. ' 2 Sn ), so ist T 2 D0 .˝/ (bzw. 2 Sn0 ). Beweis. Wir führen den Beweis für D 0 .Rn /. Sei also T .'/ durch (11.36) definiert. Da T linear ist, genügt es die Stetigkeit in ' D 0 zu zeigen, d. h. 'i ! 0 ; D
i ! 1 H) T .'i / ! 0 ;
i ! 1 :
(11.37)
Angenommen (11.37) ist falsch. Dann können wir eine D-Nullfolge .'i / so wählen, dass jT .'i /j ı > 0 für alle i ist. Nach Multiplikation der 'i mit einer festen komplexen Zahl erreichen wir sogar, dass Re T .'i / 2 für alle i :
(11.38)
Weil D-Konvergenz gegen 0 nach Definition 11.3a. bedeutet, dass alle partiellen Ableitungen gleichmäßig gegen 0 gehen, kann man durch Übergang zu einer Teilfolge auch erreichen dass jD ˛ 'i .x/j < 2i
für j˛j < i ;
x2˝:
Nun wählen wir aus den beiden Folgen .Tm /; .'i / Teilfolgen .Sm /; . gendem Schema aus: 1
2
i/
nach fol-
WD '1 ;
S1 WD Tm1 ; sodann
(11.39)
WD 'i2
so dass Re hS1 ;
so, dass jhS1 ;
S2 WD Tm2
2 ij
so, dass Re hS2 ;
1i
>1;
1; j D 1; 2
;
usw. Allgemein lautet die Vorschrift: k
D 'ik so, dass jhSj ;
k ij
Sk D Tmk so, dass Re hSk ;
< 2k ;
ji
> 1;
j D 1; : : : ; k 1 ; j D 1; : : : ; k 1 :
Diese Auswahl ist möglich, weil einerseits lim hTm ; 'i i D 0
i !1
für alle m
(11.40)
368
11 Distributionen und temperierte Distributionen
wegen Tm 2 D0 .˝/ und 'i ! 0; und weil andererseits D
lim hTm ; 'i i D T .'i / 2
m!1
nach der Annahme (11.38). Nun definieren wir 'D
1 X k
WD D lim
m X
m!1
kD1
k
:
(11.41)
kD1
Der Limes, der ' definiert, existiert wegen (11.39) und dem Majorantenkriterium, angewandt auf alle Ableitungen. Daher existiert nach Voraussetzung lim hSk ; 'i D T .'/ 2 C ;
(11.42)
k!1
weil .Sk / eine Teilfolge von .Tm / ist. Aus (11.40) und (11.41) folgt andererseits Re hSk ; 'i D
k P j D1
> k
Re hSk ; 1 P
ji
1 P
C
j DkC1
Re hSk ;
ji
2j k 1 ;
j DkC1
woraus hSk ; 'i ! C1 t u
im Widerspruch zu (11.42) folgt.
F Substitution und Differentiation Die Nützlichkeit der Distributionen als „verallgemeinerte Funktionen“ rührt u. a. davon her, dass man mit ihnen viele der Rechenoperationen durchführen kann, die man von (glatten) Funktionen her gewohnt ist. Dies geschieht jedesmal so, dass die betreffende Rechenoperation auf eine analoge Operation mit den Testfunktionen zurückgespielt wird. Wie dies genau vonstatten geht, kann man erkennen, wenn man den Fall regulärer Distributionen betrachtet. Auf diese Weise überlegen wir uns nun, wie man Variablensubstitution und Differentiation auf Distributionen übertragen kann, und im nächsten Abschnitt werden wir dasselbe für die F OURI ERtransformation tun. Sei also Œf 2 D0 .˝/ eine reguläre Distribution, die von einer stetigen Funktion f 2 C 0 .˝/ erzeugt wird: Z hŒf ; 'i D f .x/'.x/ dn x ; (11.43) ˝
F Substitution und Differentiation
369
sei G Rn eine weitere offene Menge, und sei x D g.y/; g W G ! ˝ eine C 1 -Koordinatentransformation, d. h. eine bijektive C 1 -Abbildung mit JACOBIDeterminante ˇ ˇ ˇ ˇ ˇ @x ˇ ˇ ˇ ˇ ˇ D j det g 0 .y/j 6D 0 ; ˇ @y ˇ D j det.g 1 /0 .x/j : (11.44) ˇ @y ˇ ˇ @x ˇ Dann gilt für ' 2 D.G/ nach der Transformationsformel für n-dimensionale Integrale ˇ ˇ Z Z ˇ @y ˇ f .g.y// '.y/ dn y D f .x/'.g 1 .x// ˇˇ ˇˇ dn x : (11.45) @x G
˝
Diese Formel übertragen wir auf beliebige Distributionen: Definition 11.26. Seien G; ˝ offene Teilmengen von Rn ; und sei x D g.y/ ;
y D g 1 .x/ ;
x 2˝; y 2G
eine C 1 -Koordinatentransformation. Für ' 2 D.G/ sei ˇ ˇ ˇ @y ˇ 1 .x/ WD '.g .x// ˇˇ ˇˇ ; @x was offenbar eine Testfunktion
(11.46)
2 D.˝/ definiert. Für T 2 D0 .˝/ wird durch hS; 'i WD hT; i
(11.47)
eine Distribution S 2 D0 .G/ definiert. Man schreibt S D T ı g g T; und es ist also (11.48) hT ı g; 'i D hT; .' ı g1 / j det Dg 1 ji oder, wenn man sich die etwas inkorrekte, aber dafür suggestive Schreibweise mit Nennung der Variablen erlaubt: ˇ ˇ ˇ @y ˇ 1 hT .g.y//; '.y/i D T .x/; '.g .x/ ˇˇ ˇˇ : (11.49) @x Man nennt T ı g die aus T durch Substitution erzeugte Distribution. Man überlegt sich sofort, dass durch (11.48) ein stetiges lineares Funktional auf D.G/ definiert wird. Wir listen einige Spezialfälle auf: Beispiele 11.27. Sei T 2 D0 .˝/. a. Affine Substitution: Hier ist A 2 Rnn eine reguläre quadratische Matrix, b 2 Rn D R1n ein Spaltenvektor, x D g.y/ WD Ay C b ;
y D A1 .x b/ :
370
11 Distributionen und temperierte Distributionen
Das ergibt: hT .Ay C b/; '.y/i D
1 hT .x/; '.A1 .x b//i : j det Aj
(11.50)
b. Die Translation x D y C b; y D x b führt zu: hT .y C b/; '.y/i D hT .x/; '.x b/i :
(11.51)
c. Orthogonale Transformation x D Ay mit AAT D E führt zu hT .Ay/; '.y/i D hT .x/; '.AT x/i :
(11.52)
Diese Klasse von Transformationen umfasst bekanntlich die Drehungen (= Rotationen) und die Spiegelungen. d. Die Streckung (= Homothetie) X D y; > 0 führt zu hT .y/; '.y/i D
1 hT .x/; '.x=/i : n
(11.53)
Man nennt eine Distribution invariant unter der Transformation g W ˝ ! ˝; wenn T ıg DT : (11.54) Solch eine Invarianz wird häufig als Symmetrie gedeutet. So spricht man z. B. von rotationssymmetrischen Distributionen etc. In den Räumen D0 .˝/ und Sn0 lässt sich sinnvoll eine Differentiation einführen, so dass Distributionen unendlich oft differenzierbare Objekte werden. Wir überlegen uns das zunächst wieder durch Betrachtung des regulären Falls. Sei also f 2 C 1 .˝/ und damit @i f fxi 2 C 0 .˝/; so dass f und @i f reguläre Distributionen erzeugen. Mit dem G AUSSschen Satz (oder einfach durch partielle Integration in der i -ten Variablen) ergibt sich für ' 2 D.˝/: R hŒ@i f ; 'i D fxi .x/'.x/ dn x ˝ R D f .x/'xi .x/ dn x D hŒf ; @i 'i : ˝
Diese Rechnung ist auch für ˝ D Rn und ' 2 Sn korrekt, wenn etwa f 2 Pn1 ist. Da die rechte Seite für ganz beliebige Distributionen sinnvoll ist, gibt dies Anlass zu definieren: Definitionen 11.28. a. Für T 2 D0 .˝/ (bzw. Sn0 ) definiert man die partielle Distributionsableitung @i T 2 D0 .˝/ (bzw. Sn0 ) durch h@i T; 'i WD hT; @i 'i ;
' 2 D.˝/ bzw. 2 Sn :
(11.55)
F Substitution und Differentiation
371
b. Höhere Ableitungen werden durch Multiindizes angegeben. Für jeden Multiindex ˛ gilt (11.56) hD ˛ T; 'i D .1/j˛j hT; D ˛ 'i : c. Ist f 2 L1loc .˝/ (bzw. f 2 Pn ), so nennt man die Distributionsableitung D ˛ Œf der von f erzeugten regulären Distribution Œf die ˛-te schwache Ableitung von f . Das durch (11.55) tatsächlich eine Distribution definiert wird, sieht man sofort, denn hT; @i 'i ist sicher linear in ' und die Stetigkeit folgt wegen D
D
S
S
'm ! ' H) @i 'm ! @i ' : Beispiel: Die H EAVISIDEsche Sprungfunktion ( 0 für t < 0; .t/ D 1 für t 0 ist lokal integrierbar auf R und erzeugt daher eine reguläre Distribution Œ . Für ' 2 D.R/ folgt 0
Z1
hD Œ ; 'i D hŒ ; ' i D
' 0 .t/ dt D '.0/ ;
0
Also D Œ D ı0 : Für die Ableitungen der Deltafunktion ergibt sich (' 2 D.Rn /) h@i ı0 ; 'i D hı0 ; 'xi i D 'xi .0/ : Physikalisch gesehen, ist @i ı ein Dipol im Nullpunkt, der in xi -Richtung orientiert ist (vgl. Aufgabe 11.13). Die höheren Ableitungen der Deltafunktion sind Multipole. Aufgrund der Ableitungsdefinition mit Hilfe von Testfunktionen ist klar, dass sich die Differentiationsregeln von Funktionen auf Distributionen übertragen: Satz 11.29. a. Die Differentiation in D0 und S 0 ist eine lineare Operation, d. h. für S; T 2 D0 .˝/ (bzw. 2 Sn0 ) und ; 2 C gilt: @i .S C T / D @i S C @i T :
(11.57)
b. Für f 2 C 1 .˝/ (bzw. f 2 Pn1 ) und T 2 D0 .˝/ (bzw. T 2 Sn0 ) gilt die Produktregel (11.58) @i .f T / D .@i f /T C f @i T :
372
11 Distributionen und temperierte Distributionen
Ebenso kann man eine Kettenregel beweisen, die wir jedoch im Folgenden nicht benötigen (vgl. jedoch Aufgabe 13.8). Während die gliedweise Differentiation von Funktionenfolgen und -reihen starke Voraussetzungen benötigt, sind solche bei Distributionen überflüssig. Satz 11.30. Konvergente Folgen und Reihen von Distributionen dürfen beliebig oft gliedweise differenziert werden, d. h. sind Tm 2 D0 .˝/ und gilt T D D0 .˝/ lim Tm
S D D0 .˝/
bzw.
1 X
Tm ;
(11.59)
D ˛ Tm :
(11.60)
mD1
so gilt ˛
˛
D T D lim D Tm m!1
1 X
˛
und D S D
mD1
Entsprechendes gilt in Sn0 . Beweis. Für Tm ! T in D0 .˝/ und ' 2 D.˝/ folgt aus (11.56) hD ˛ Tm ; 'i D .1/j˛j hTm ; D ˛ 'i ! .1/j˛j hT; D ˛ 'i D hD ˛ T; 'i : t u
G F OURIERtransformation von Distributionen In Anlehnung an Definition 11.28 für die Ableitung könnte man die F OURIER transformation durch folgende Gleichung definieren: hF ŒT ; 'i WD hT; F Œ'i :
(11.61)
Für Distributionen T 2 D0 .Rn / hat dies jedoch keinen Sinn, denn auf der rechten Seite ist F Œ' 62 D.Rn /; wenn ' 2 D.Rn / und ' 6 0. Um dies einzusehen, betrachten wir die definierende Formel (8.43), also Z (11.62) './ O D .2 /n=2 '.x/ eihjxi dn x : Rn
Die Funktionen Ex ./ WD eihjxi sind aber analytisch, und der Integrationsbereich erstreckt sich eigentlich nur über die kompakte Menge Tr '. Ein bekannter Satz über Integrale mit Parametern (Aufgabe 10.8d. oder [36], Ergänzungen zu Kap. 28) zeigt daher, dass 'O ebenfalls analytisch ist, und nach dem Prinzip der analytischen Fortsetzung ( [36], Kap. 17) kann 'O daher keinen kompakten Träger haben, außer wenn 'O 0; also auch ' 0 ist. Dies ist der Hauptgrund, weshalb temperierte Distributionen betrachtet werden. Für schnell fallende Testfunktionen ist der Ansatz (11.61) sinnvoll und erfolgreich,
G F OURIER transformation von Distributionen
373
denn der Funktionenbereich Sn ist so gestaltet, dass Differentiation, Multiplikation und F OURIERtransformation innerhalb dieses Bereichs unbeschränkt durchgeführt werden können und alle vertrauten Rechenregeln (vgl. etwa [36], Kap. 33) ohne weiteres anwendbar sind. Um dies genauer auszuführen, halten wir fest: Sn L1 .Rn / :
(11.63)
Das ergibt sich, wenn man in Satz 11.16b. f 1 wählt, denn es wurde dort bewiesen, dass das Integral auf der rechten Seite von (11.32) als L EBESGUE-Integral existiert, wenn f 2 Pn ist. Mit '.x/ gehören aber auch die Funktionen x ˛ '.x/ und D ˇ '.x/ zu Sn ; wie aus der Definition des Raums Sn hervorgeht. Alle diese Funktionen sind daher integrierbar. Sie haben also auch F OURIERtransformierte, und alle Umformungen, die zum Beweis der einschlägigen Rechenregeln durchgeführt werden, sind gerechtfertigt. Daher gilt z. B. Satz 11.31. Für ' 2 Sn und beliebige Multiindizes ˛; ˇ 2 Nn0 gilt: a. Dp˛ F Œ'.x/ .p/ D F Œ.ix/˛ '.x/ .p/; h i b. F Dxˇ '.x/ .p/ D .ip/˛ F Œ'.x/ .p/; h i c. p ˇ Dp˛ F Œ'.x/ .p/ D ij˛jCjˇ j F Dxˇ .x ˛ '.x// .p/. Dabei ist c. eine Kombination von a. und b. Wir haben nun die äußerst wichtige Konsequenz: Theorem 11.32. Die F OURIERtransformation ist eine bijektive, L2 .Rn /-isometrische lineare Abbildung von Sn auf Sn . Beweis. Nach Definition von Sn ist, wie erwähnt, D ˇ .x ˛ '.x// 2 Sn ;
wenn ' 2 Sn :
Daher folgt aus Satz 11.31c. ˇ ˇ ˇ ˇ ˛ O ˇ ˇp Dp f .p/ˇ D jF Œx ˛ f .x/ .p/j Z n=2 .2 / jD ˇ .x ˛ f .x//j dn x konst: < 1 ; Rn
was bedeutet, dass 'O 2 Sn ; falls ' 2 Sn ist. Insbesondere ist 'O 2 L1 .Rn /; die F OURIERsche Umkehrformel also anwendbar. Damit gilt (mit den Bezeichnungen aus Abschn. 8F) F Œ' O D ' und F Œ L D für alle '; 2 Sn . Dies zeigt, dass F W Sn ! Sn ein Vektorraum-Isomorphismus mit der Inversen F ist. Mit ' ist auch ' 2 2 Sn ; also ' 2 L2 .Rn /. Die L2 .Rn /-Isometrie von F ergibt sich daher sofort aus Satz 8.29. t u
374
11 Distributionen und temperierte Distributionen
Bemerkung: Wegen Sn D.Rn / und Theorem 11.9 ist Sn dicht in L2 .Rn /. Man könnte den F OURIER -P LANCHEREL-Operator U aus Theorem 8.30 und seine Inverse U 1 also auch so gewinnen, dass man F W Sn ! Sn bzw. F 1 W Sn ! Sn nach dem BLE-Theorem stetig fortsetzt. Nun können wir die F OURIERtransformation von temperierten Distributionen definieren und stellen fest, dass sich alle wichtigen Rechenregeln durch völlig triviale Rechnungen von Sn auf Sn0 übertragen lassen: Theorem 11.33. a. Für T 2 Sn0 wird durch (11.61) die F OURIERtransformation T 7! F ŒT definiert, welche einen linearen Isomorphismus von Sn0 auf sich mit der Inversen hF 1 ŒT ; '.x/i D hF ŒT ; '.x/i
(11.64)
darstellt. Kurzschreibweise: TO D F ŒT ; TL D F 1 ŒT . b. F und F 1 sind stetig in dem Sinne, dass Tm !0 T H) F ŒTm ! F ŒT 0 S
S
und ebenso für F 1 . c. Es gelten die folgenden Rechenregeln: D ˛ F ŒT D F Œ.ix/˛ T .x/ ;
(11.65)
F ŒD ˛ T D .i/˛ F ŒT ./ ;
(11.66)
und für eine reguläre Matrix A 2 Rnn und einen Spaltenvektor b 2 R gelten: n
F ŒT .A C b/ D
h i 1 1 F eihA bjxi T .A1 /T x ./ ; j det Aj
F ŒT .Ax C b/ ./ D
1 1 eihjA bi F ŒT .A1 /T : j det Aj
(11.67)
(11.68)
Bemerkung: Jedes f 2 L1 .Rn / erzeugt nach Satz 11.12b. eine temperierte Distribution Œf ; denn für ' 2 Sn haben wir Z jhŒf ; 'ij jf .x/j j'.x/j dn x kf k1 q0 .'/ : Die F OURIERtransformierte von f ist daher auf zwei Arten definiert, nämlich durch (8.43) und durch (11.61). Beide Definitionen führen aber zu demselben Ergebnis, d. h. es gilt Z Z fO' dn x D f 'O dn x für alle ' 2 Sn : (11.69)
G F OURIER transformation von Distributionen
375
Da L1 \ L2 dicht in L1 ist, brauchen wir das nur für f 2 L1 \ L2 zu beweisen. Für diesen Fall folgt es aber aus der PARSEVALschen Gleichung Z Z f gN dn x D fOgO dn x (vgl. Satz 8.29), wenn man g D F Œ' D F 1 Œ' N wählt. Ebenso erzeugt jedes f 2 L2 .Rn / eine temperierte Distribution Œf ; und F Œf ist dann die von der F OURIER -P LANCHEREL-Transformierten Uf erzeugte reguläre Distribution (vgl. Theorem 8.30). Dies wird in völlig analoger Weise begründet wie für L1 (Übung!). Allgemein kann – wie schon erläutert – die F OURIERtransformation für Distributionen T 2 D0 .Rn / nicht definiert werden. Eine Ausnahme bilden die finiten Distributionen, weil man diese nach Satz 11.22 über die Gleichung hT; 'i WD hT; 'i ;
' 2 Sn
(11.70)
( 2 D.Rn / mit D 1 auf einer Umgebung von Tr T ) als temperierte Distributionen auffassen kann. Satz 11.34. Ist T 2 D 0 .Rn / eine finite Distribution, so ist F ŒT eine reguläre temperierte Distribution, die von einer Pn1 -Funktion TO erzeugt wird. Dabei gilt TO ./ D .2 /n=2 hT .x/; .x/ eihjxi i ;
(11.71)
wobei 2 D.Rn / mit D 1 auf einer Umgebung von Tr T . Ferner gilt für jeden Multiindex ˛ D ˛ TO ./ D .2 /n=2 hT .x/; .x/.ix/˛ eihjxi i :
(11.72)
Beweis. Für jeden Multiindex ˛ setzen wir f˛ ./ WD hT .x/; .x/.ix/˛ eihjxi i
(11.73)
und zeigen, dass f˛ 2 Pn1 ist. Ist D limk!1 k ; so streben die Funktionen .x/.ix/˛ eihk jxi im Sinne der D-Konvergenz gegen .x/.ix/˛ eihjxi ; und damit folgt Stetigkeit der f˛ aus der Stetigkeit von T . Ebenso überzeugt man sich durch leichte Abschätzungen, dass die Ableitung von .x/.ix/˛ eihjxi nach der Limes der entsprechenden Differenzenquotienten im Sinne der D-Konvergenz ist, und daraus folgt, dass f˛ überall partiell differenzierbar ist, und zwar mit @j f˛ D f˛C"j ; ˛ C "j D .˛1 ; : : : ; ˛j C 1; : : : ; ˛n /. Also ist f0 2 C 1 .Rn /; f˛ D D ˛ f0 . Es bleibt zu zeigen, dass f˛ ./ von polynomialem Wachstum ist. Nach Satz 11.12b. existieren Konstanten C 0 und m 2 N0 ; so dass jhT; 'ij C sup max .1 C jxj2 /m jD ˛ '.x/j : x2Rn j˛jm
(11.74)
376
11 Distributionen und temperierte Distributionen
Wenden wir dies auf (11.73) an, so folgt mit (11.27) ˇ˝ ˛ˇ jf˛ ./j D ˇ T .x/; .x/.ix/˛ eihjxi ˇ ˇ ˇˇ ˇ C 0 sup max .1 C jxj2 /m ˇ@ˇx .x/x ˛ eihjxi ˇ x2Rn jˇ jm P C sup max .1 C jxj2 /m j ˇ jjD ..x/x ˛ /j x2Rn jˇ jm
j jjˇ j
C˛ .1 C jj2 /m ;
was zu zeigen war. Schließlich zeigen wir (11.71), also dass .2 /n=2 f0 wirklich die F OURIERtransformierte von T ist. Aus (11.70) folgt: hF ŒT ; 'i D hT; F Œ'i D hT; 'i O + * Z D T .x/; .2 /n=2 .x/'./ eihjxi dn : Rn
Nun beachten wir, dass die Funktion .x/'./ eihjxi der 2n Variablen .x; / zu folgert man durch leichte Abschätzungen, dass das Integral RS2n gehört. Daraus .x/'./ eihjxi dn im Sinne der S-Konvergenz der Limes der entsprechenden R IEMANNschen Summen ist. Da das Funktional T linear ist, vertauscht es mit diesen R IEMANN-Summen, und da es stetig auf Sn ist, vertauscht es auch mit dem Grenzübergang, der zum Integral führt. Man darf die Anwendung von T daher mit der Integration vertauschen, und es folgt Z D E T .x/; .x/ eihjxi './ dn D .2 /n=2 hŒf0 ; 'i hF ŒT ; 'i D .2 /n=2 Rn
für alle ' 2 Sn ; was gerade die Gleichung (11.71) ist.
t u
Als Anwendung berechnen wir die F OURIERtransformierte von ıx0 .x/ D ı.x x0 / : Aus (11.71) folgt F Œı.x x0 / ./ D .2 /n=2 hı.x x0 /; .x/ eihjxi i D .2 /n=2 .x0 / eihjx0 i D .2 /n=2 eihjx0 i wegen .x0 / D 1. Insbesondere haben wir für x0 D 0 F Œı.x/ ./ D .2 /n=2 1 ; wobei 1 die von der konstanten Funktion f ./ 1 erzeugte reguläre Distribution bezeichnet. Wir fassen zusammen:
Aufgaben
377
Beispiel 11.35. h i F Œı.x x0 / ./ D .2 /n=2 eihjx0 i ;
(11.75)
F Œı ./ D .2 /n=2 1 :
(11.76)
Aufgaben zu Kap. 11 11.1. Sei 2 D.R/ eine finite Testfunktion mit 1 auf Œ1; 1. Man zeige: Die Folge 'k .x/ WD ek .x=k/ konvergiert in S1 gegen Null, nicht aber in D.R1 /. 11.2. Man zeige, dass die reguläre Distribution zu f .x/ WD ex nicht temperiert ist. (Hinweis: Es sei 2 D.R/ eine Funktion mit 1 auf Œ1; 1. Man zeige zunächst, dass durch '.x/ WD . ex / ex eine schnell fallende Testfunktion ' 2 S1 gegeben ist.) 11.3. Man zeige: Für f 2 L1loc .˝/ und x0 2 ˝ gilt x0 2 Tr Œf ” x0 hat keine offene Umgebung, in der f .x/ D 0 f. ü. 11.4. Seien T1 ; T2 2 D0 .˝/; und seien f1 ; : : : ; fm C 1 -Funktionen, die auf dem Träger von T1 T2 keine gemeinsame Nullstelle haben. Man zeige: Ist dann fj T1 D fj T2 für j D 1; : : : ; m; so ist T1 D T2 . (Hinweis: Kor. 11.21.) 11.5. a. Seien f1 ; f2 ; : : : lokal integrierbare Funktionen auf ˝; für die f .x/ D limm!1 fm .x/ f. ü. existiert. Man zeige: Wenn g 2 L1loc .˝/ existiert, für das für alle m jfm .x/j g.x/ f. ü. ; so ist Œf D limm!1 Œfm in D0 .˝/. b. Sei fm WD m0;1=m ; m 2 N; also fm 2 L1loc .R/. Man zeige: Punktweise ist limm!1 fm .x/ D 0; aber in D0 .R/ ist limm!1 Œfm D ı0 . 11.6. Sei .Tm / eine Folge in D0 .˝/; von der Folgendes bekannt ist: Jeder Punkt x0 2 ˝ hat eine offene Umgebung U.x0 / ˝ so, dass der Limes SU.x0 / .'/ D lim hTm ; 'i m!1
für alle ' 2 D.˝/ existiert, deren Träger in U.x0 / liegt. Man zeige: Dann existiert der Grenzwert in D0 .˝/ ; S WD lim Tm m!1
378
11 Distributionen und temperierte Distributionen
und auf jedem U.x0 / stimmt S mit SU.x0 / überein. (Hinweis: Zerlegungen der Eins und Satz 11.25!) 11.7. Man zeige: Jede Distribution T 2 D0 .Rn / ist der D0 -Limes von finiten Distributionen. (Hinweis: Man wähle ein 2 D.Rn / mit .x/ D 1 für jxj 1 und setze m .x/ WD .x=m/; Tm WD m T .) 11.8. Die Elemente von H D L2 .˝/ sind lokal integrierbar, entsprechen also regulären Distributionen. Wir vergleichen die Konvergenz im Sinne der Distributionen mit der schwachen Konvergenz im H ILBERTraum H (vgl. 9.11). Man zeige: a. Aus fm + f folgt fm ! f. 0 D
b. Aus fm ! f und sup kfm k2 < 1 folgt fm + f . (Hinweis: Man benutze, 0 D
m1
dass D.˝/ in L2 .˝/ dicht ist!) c. Die Bedingung in b., dass die Normen kfm k2 beschränkt bleiben sollen, ist nicht entbehrlich. 11.9. Es sei g W G ! ˝ eine C 1 -Koordinatentransformation. Man zeige: Für jedes T 2 D0 .˝/ ist Tr .T ı g/ D g 1 .Tr T / : 11.10. Seien G0 ; G1 ; ˝ offene Teilmengen von Rn und g W G1 ! ˝; h W G0 ! G1 C 1 -Diffeomorphismen, also Koordinatentransformationen. Man zeige: Für T 2 D0 .˝/ gilt T ı .g ı h/ D .T ı g/ ı h : 11.11. Es seien G; ˝ offene Teilmengen von Rn und g W G ! ˝ eine C 1 Abbildung. Wir setzen voraus, dass ˝ den Nullpunkt enthält und dass gilt: g.y/ D 0 H) det Dg.y/ ¤ 0 : Wir schreiben N WD g1 .0/ D fy 2 G j g.y/ D 0g. Man zeige: a. Jedes y 2 N hat eine offene Umgebung U.y/ G; in der y der einzige Punkt von N ist. (Hinweis: Satz über inverse Funktionen!) b. Jede kompakte Teilmenge K G enthält nur endlich viele Punkte von N . c. Durch X '.y/ ; ' 2 D.G/ hı.g.y//; '.y/i WD j det Dg.y/j y2N
ist in G eine Distribution ı.g.y// definiert. d. Ist g bijektiv, also eine Koordinatentransformation, so ist ı.g.y// gerade die Distribution ı ı g im Sinne von Def. 11.26. e. Sei .'"m / eine Folge wie in Beispiel 11.24c., also insbesondere ı D limm!1 Œ'"m in D0 .˝/. Dann ist ı.g.y// D lim Œ'"m ı g m!1
in D0 .G/ :
Aufgaben
379
(Hinweis: Ist 2 D.G/ und sind y1 ; : : : ; yr die endlich vielen Punkte von N \ Tr ; so besteht für alle genügend großen m die Menge g1 .Tr '"m / aus r disjunkten kompakten Mengen Kj so, dass yj 2 Kj ; j D 1; : : : ; r (wieso?) R Dann kann man '"m .g.y// .y/ dn y in Integrale über die Kj aufspalten und in jedem einzelnen dieser Integrale die Transformationsformel anwenden.) 11.12. Es sei ih die Translation um den Vektor he i in Rn ; also ih .x/ WD x C he i für h 2 R. Man zeige, dass die distributionelle Ableitung in folgendem Sinn ein Limes von Differenzenquotienten ist: 1 T ı ih T : @i T D lim h!0 h h¤0 11.13. Es sei v D .v1 ; : : : ; vn / 2 Rn ein fester Vektor. Man zeige, dass im Sinne der Konvergenz in D0 .Rn / Folgendes gilt: X ı.x hv/ ı.x C hv/ D vj @j ı.x/ : 2h n
lim
h!0 h¤0
j D1
Bemerkung: Dies ist der Grund dafür, dass man die ersten Ableitungen der Deltafunktion als mathematische Beschreibung von Dipolen auffassen kann. 11.14. Man zeige: Ist T 2 Sn ; so sind auch alle Ableitungen D ˛ T temperiert. 11.15. Sei f .x/ WD sin ex ; x 2 R. Man zeige: a. T D Œf und T 0 D Œf 0 sind temperiert. b. f 0 ist nicht von polynomialem Wachstum. c. Die Formel Z1 0 f 0 .x/'.x/ dx hT ; 'i D 1
gilt für alle ' 2 S1 ; wenn man das Integral als bedingt konvergentes uneigentliches Integral auffasst. Für gewisse Testfunktionen (z. B. die aus Aufgabe 11.2) ist es aber kein L EBESGUE-Integral. 11.16. Sei ˝ D a; bŒ ein offenes Intervall (1 a < b C1), sei 1 2 D0 .˝/ die von der konstanten Funktion 1 erzeugte reguläre Distribution, also Zb h1; 'i D
'.x/ dx ; a
und sei W WD f
2 D.˝/ j h1; i D 0g :
380
11 Distributionen und temperierte Distributionen
Man zeige nacheinander: a. Für Testfunktionen 2 D.˝/ gilt: 2 W ” ' 2 D.˝/. b. Ist '0 2 D.˝/ so, dass h1; '0 i ¤ 0; so ist
D ' 0 für eine Testfunktion
D.˝/ D LH.'0 / ˚ W ; d. h. jedes ' 2 D.˝/ hat eine eindeutige Zerlegung in der Form ' D c'0 C mit c 2 C und 2 W . c. Ist T 2 D0 .˝/ eine Distribution, deren Distributionsableitung verschwindet, so ist T eine Konstante, genauer T D c1 für ein c 2 C. (Hinweis: Man betrachte die Distributionen der Form S D T c1 und verwende die Zerlegung aus b., um c geschickt zu wählen.) d. Sei S 2 D0 .R/. Ist S 0 D 0 in ˝; so stimmt S in ˝ mit einer Konstanten überein. 11.17. Auf ˝ Da; bŒ sei ein System von homogenen linearen Differentialgleichungen 1. Ordnung y 0 D A.x/y ./ gegeben. Die Koeffizientenmatrix A.x/ D .ajk .x// bestehe dabei aus C 1 -Funktionen ajk auf ˝. Wir sagen, die Funktionen u1 ; : : : ; un bilden eine klassische Lösung von ./; wenn für alle x 2 ˝ die Gleichungen n X
u0j .x/ D
ajk .x/uk .x/
j D 1; : : : ; n
kD1
erfüllt sind (was die Existenz der auftretenden Ableitungen einschließt!). Die Distributionen T1 ; : : : ; Tn 2 D0 .˝/ bilden eine Distributionslösung, wenn die Gleichungen n X Tj0 D ajk Tk ; j D 1; : : : ; n kD1 0
in D .˝/ gelten. Man zeige: a. Ist u D .u1 ; : : : ; un / eine klassische Lösung von ./; so sind die Funktionen uj 2 C 1 .˝/ für j D 1; : : : ; n. (Hinweis: Durch Induktion nach m zeigt man, dass uj 2 C m .˝/ für alle m.) b. Ist T D .T1 ; : : : ; Tn / eine Distributionslösung von ./; so sind alle Tj reguläre Distributionen Tj D Œuj mit C 1 -Funktionen uj ; die eine klassische Lösung bilden. Der Übergang zu Distributionen führt also nicht zu zusätzlichen Lösungen. (Hinweis: Sei ˚.x/ D fjk .x/ eine Fundamentalmatrix für ./ (vgl. etwa [36], Kap. 8), und sei ˚.x/1 D .gjk .x//. Die gjk sind dann C 1 Funktionen (wieso?), also kann man Distributionen Sj WD
n X kD1
gjk Tk ;
j D 1; : : : ; n
Aufgaben
381
oder kurz: S WD ˚ 1 T bilden. Man folgere T D ˚S ; differenziere diese Gleichung, verwende ./ und dann Aufgabe 11.16c.) c. Man folgere: Jede Distributionslösung der Differentialgleichung y .n/ C a1 .x/y .n1/ C C an1 .x/y 0 C an .x/y D 0 mit Koeffizienten a1 ; : : : ; an 2 C 1 .˝/ ist schon eine klassische Lösung und gehört zu C 1 .˝/. d. Man bestimme alle Lösungen T 2 D0 .R/ der inhomogenen Differentialgleichung y 00 C y D ı.x/ : (Hinweis: Eine spezielle Lösung gewinnt man durch intelligentes Raten oder durch „Variation der Konstanten“.) 11.18. a. Man zeige: 1 X
cos.2k 1/x D
kD1
1 X .1/k ı.x k / 2 kD1
im Sinne der Konvergenz in D0 .R/. (Hinweis: Die 2 -periodische Funktion f; die in Œ ; mit f .x/ D . =4/jxj übereinstimmt, kann leicht in eine F OURI ERreihe entwickelt werden. Diese differenziere man zweimal.) b. Ebenso zeige man 1 1 X 1 X ikx e D ı.x C 2k / : 2 kD1
kD1
(Hinweis: Hier gehe man aus von der periodisch fortgesetzten Funktion, die auf Œ0; 2 Œ mit 16 .3x 2 6 x C 2 2 / übereinstimmt.) 11.19. Eine doppelt unendliche Folge .ck /k2Z heißt von polynomialem Wachstum, wenn es Zahlen C 0; m 2 N0 gibt so, dass jck j C.1 C k 2 /m
8k 2 Z :
Man zeige: a. Wenn .ck /k2Z von polynomialem Wachstum ist, so konvergiert die Reihe T D
1 X
ck eikx
kD1
in S10 gegen eine temperierte Distribution (Hinweis: Man benutze ProdukP T . 2 tintegration sowie die Tatsache, dass 1 k < 1 ist. Außerdem hilft Satz kD1 11.25.)
382
11 Distributionen und temperierte Distributionen
b. Diese Distribution ist 2 -periodisch, d. h. für die Translationen j .y/ WD y C 2 j gilt T ı j D T . 1 X c. F ŒT D ck ı.x k/ : kD1
11.20. Für jede 2 -periodische Distribution T 2 D0 .R/ definiert man die F OURI ERkoeffizienten durch D E k2Z; (11.77) ck WD .2 /1 T .x/; ˛.x/ eikx ; wobei ˛ 2 D.R/ eine fest gewählte Testfunktion ist, für die 1 X
˛.x C 2k / 1
(11.78)
kD1
ist. Man zeige nacheinander: a. Ist ' 2 D.R/; so ist ' .x/ WD
1 X
'.x C 2k /
kD1
eine 2 -periodische C 1 -Funktion. (Hinweis: Auf jedem beschränkten Teilintervall besteht die Summe nur aus endlich vielen nichtverschwindenden Gliedern!) b. Sei ' 2 D.R/ eine nichtnegative Testfunktion so, dass '.x/ ı > 0 für jxj . Dann ist ˛ WD '=' eine Testfunktion, die (11.78) erfüllt. Bemerkung: Es gibt also solche Testfunktionen, und daher kann man die F OU RIERkoeffizienten von periodischen Distributionen definieren. Sie hängen auch nicht davon ab, welche derartige Funktion ˛ man bei der Definition heranzieht. Das werden wir in Aufgabe 13.9 sehen. c. Ist T D Œf mit einer lokal integrierbaren 2 -periodischen Funktion f; so ist 1 ck D 2
Z2
f .x/ eikx dx
8k ;
0
der klassische F OURIERkoeffizient. ikx i D 2 ıjk für alle j; k 2 Z. d. h eijx ; ˛.x/ P e imx e. Ist T D 1 b ; wobei die Reihe in D0 .R/ konvergiert, so ist bm D mD1 m e cm für alle m; d. h. die Koeffizienten in solch einer Reihenentwicklung müssen die F OURIERkoeffizienten sein. f. Die doppelt unendliche Folge .ck /k der F OURIERkoeffizienten einer 2 -periodischen Distribution T ist stets von polynomialem Wachstum (vgl. Aufgabe 11.19). (Hinweis: Man verwende Satz 11.12a. sowie die L EIBNIZregel.)
Aufgaben
383
Bemerkung: Nach Aufgabe 11.19b. existiert also in S10 die Summe SD
1 X
ck eikx :
kD1
Man kann beweisen, dass stets S D T ist (vgl. etwa [101]). Also ist jede periodische Distribution temperiert und im Sinne von S10 die Summe ihrer F OURI ERreihe. P 11.21. Jedes Polynom j˛jN c˛ x ˛ ; c˛ 2 C definiert eine temperierte Distribution ŒP (wieso?). Man berechne ihre F OURIERtransformierte F ŒP und zeige insbesondere, dass F ŒP außerhalb des Nullpunkts verschwindet. (Hinweis: Man kombiniere die Informationen aus Theorem 11.33a., c. mit Beispiel 11.35.) 11.22. Man zeige: Die F OURIERtransformierte einer rotationssymmetrischen temperierten Distribution ist wieder rotationssymmetrisch. 11.23. Für > 0 sei S .y/ WD y die Streckung um den Faktor . Man nennt eine Distribution T homogen vom Grad . 2 R/; wenn T ı S D T
8 > 0 :
Man zeige: a. Die Deltafunktion ı0 2 D0 .Rn / ist rotationssymmetrisch und homogen vom Grad D n. b. Ist T homogen vom Grad ; so ist D ˛ T homogen vom Grad j˛j für jeden Multiindex ˛. c. Ist T 2 Sn0 homogen vom Grad ; so ist F ŒT homogen vom Grad n.
Kapitel 12
Einige spezielle Distributionen
Bei den physikalischen Anwendungen der Distributionstheorie stehen verschiedene Typen von konkret gegebenen Distributionen im Vordergrund, und wir wollen in diesem Kapitel einige dieser Typen und ihre rechnerischen Beziehungen untereinander vorstellen. Wir beginnen mit einer Klasse von Distributionen T; bei denen die Ableitungen einer Testfunktion ' in die Berechnung des Wertes hT; 'i nicht explizit eingehen, und klären die Beziehung dieser Distributionen zu dem Maßen. Im weiteren Verlauf besprechen wir dann Distributionen, die die Ableitungen der Testfunktionen (bis zu einer gewissen Ordnung) tatsächlich „spüren“. Hierzu zählen die in Abschn. B zu besprechenden mehrfachen Schichten, die man sich als Verteilungen von Multipolmomenten auf einer Fläche im Raum (oder allgemeiner: auf einer Untermannigfaltigkeit des Rn ) vorstellen kann. In den Abschn. C–E geht es dann um verschiedene Konstruktionen von Regularisierungen divergenter Integrale, d. h. um singuläre Distributionen, welche aus Funktionen entstehen, die in gewissen Punkten nicht lokal integrabel sind, so dass man, um diese Singularitäten auszugleichen, gewissermaßen unendliche Beträge geschickt abziehen muss. Hier zeigt es sich, dass die Distributionstheorie der richtige begriffliche Rahmen für die verschiedensten Typen von bedingt konvergenten uneigentlichen Integralen ist. Im letzten Abschnitt führen wir schließlich die Berechnung von F OURIER transformierten von temperierten Distributionen in einigen wichtigen Fällen vor. Dabei konzentrieren wir uns auf eine Rechentechnik, bei der das Prinzip der analytischen Fortsetzung dazu ausgenutzt wird, Formeln rigoros herzuleiten, bei denen auf beiden Seiten Regularisierungen von divergenten Integralen stehen, so dass die formal dort auftretenden Integrale nicht mehr wörtlich genommen werden dürfen. Wir müssen uns bei all dem aus Platzgründen auf einige wenige Andeutungen beschränken und verweisen für ausführlicheres Beispielmaterial auf die Fachliteratur, vor allem auf [33].
K.-H. Goldhorn, H.-P. Heinz, M. Kraus, Moderne mathematische Methoden der Physik DOI 10.1007/978-3-540-88544-3, © Springer 2009
385
386
12 Einige spezielle Distributionen
A Distributionen nullter Ordnung Zunächst wollen wir präzisieren, was es heißt, dass eine Distribution die Ableitungen bis zur m-ten Ordnung „spürt“. Dazu erinnern wir uns an die Stetigkeitsbedingung aus Satz 11.12a. Dort wurde für jede kompakte Teilmenge K ˝ die Gültigkeit einer Abschätzung der Form (11.22) für alle ' mit Tr ' K verlangt. Die dabei auftretende Zahl m gibt an, wie viele Ableitungen von ' an der Beschränkung des Wertes hT; 'i beteiligt sind. Sie hängt von K ab, und man wird bestrebt sein, sie möglichst klein zu wählen, damit auf der rechten Seite nicht Ableitungen erscheinen, die in Wirklichkeit keine Rolle spielen. Daher definiert man: Definition 12.1. Sei T 2 D0 .˝/; wo ˝ Rn offen ist. Für kompaktes K ˝ sei o.KI T / die kleinste Zahl m; zu der es C 0 gibt so, dass (11.22) für alle ' 2 D.˝/ mit Tr ' K gilt. Die Ordnung ist dann definiert als o.T / WD supfo.KI T / j K ˝ kompaktg : Die Ordnung kann also den Wert C1 annehmen, z. B. für ˝ D R1 und T WD
1 X
ı .k/ .x k/ :
kD0
Aber lokal ist sie immer endlich. Ist nämlich T 2 D0 .˝/ beliebig, und ist ˝1 eine beschränkte offene Teilmenge mit ˝1 ˝; so wähle man K D ˝1 in Satz 11.12a., um zu erkennen, dass die Ordnung von T in ˝1 endlich ist. Für m D 0 lautet (11.22) jhT; 'ij C.K/ max j'.x/j D C.K/k'k1 x2˝
8 ' 2 D.˝/ mit Tr ' K ;
(12.1) und das erinnert an unsere Diskussion der R ADON-Maße in Abschn. 10F (insbes. 10.71). Tatsächlich hat man Beispiel 12.2. Sei ein R ADONmaß in ˝ und f 2 L1 .˝; /. Dann ist durch Z hT; 'i WD f ' d ; ' 2 D.˝/ (12.2) ˝
eine Distribution nullter Ordnung definiert, denn offenbar ist jhT; 'ij C.K/k'k1
mit C.K/ WD kf k1 .Tr0 / :
Von diesem Typ sind alle regulären Distributionen, denn für g 2 L1loc .˝/ betrachten wir das R ADONmaß WD jgjn (vgl. Beispiel 10.31b. sowie die Ausführungen im Anschluss an Def. 10.36) und haben dann Z hŒg; 'i D f ' d
A Distributionen nullter Ordnung
387
(
mit f .x/ WD
g.x/=jg.x/j ; 0
falls g.x/ ¤ 0 ; sonst :
Weiter gehören Deltafunktionen an verschiedenen Punkten dazu sowie deren (endliche oder unendliche) Linearkombinationen (vgl. Beispiel 11.24d.). Auf der reellen Geraden wird durch die L EBESGUE -S TIELTJES-Maße eine Fülle von Beispielen geliefert. Besonders bemerkenswert ist die Tatsache, dass mit Beispiel 12.2 alle Distributionen nullter Ordnung erschöpft sind. Das liegt am R IESZschen Darstellungssatz in der folgenden, allgemeineren Version, für deren Beweis wir auf [27] oder [78] verweisen: Theorem 12.3 (R IESZscher Darstellungssatz). Sei W Cc .˝/ ! K ein lineares Funktional, das die folgende Stetigkeitsbedingung erfüllt: Zu jedem kompakten K ˝ gibt es eine Konstante C D C.K/ so, dass j.h/j C.K/khk1
für alle h 2 Cc .˝/ mit Tr h K :
Dann gibt es genau ein vollständiges R ADONmaß in ˝ und eine – bis auf Übereinstimmung -f. ü. eindeutig bestimmte – Funktion f 2 L1 .˝; / so, dass Z .h/ D f .x/h.x/ d.x/ 8h 2 Cc .˝/ : ˝
Dabei ist jf .x/j D 1 -f. ü. Uns geht es hauptsächlich um die folgende Konsequenz: Korollar 12.4. Jede Distribution nullter Ordnung ist von der in Beispiel 12.2 beschriebenen Form. Beweis. Zu kompaktem K ˝ betrachten wir die beiden normierten linearen Räume D.˝I K/ WD f' 2 D.˝/ j Tr ' Kg ; Cc .˝I K/ WD fh 2 Cc .˝/ j Tr h Kg ; beide mit der Maximumsnorm k k1 . Wie wir aus Theorem 11.7c. wissen, kann jedes h 2 Cc .˝I K/ durch Funktionen der Form '" h gleichmäßig approximiert werden ('" wie im zitierten Theorem!), und für genügend kleines " > 0 gehört '" h zu D.˝I K/. Daher ist D.˝I K/ dicht in Cc .˝I K/. Nun sei T 2 D0 .˝/ eine beliebige Distribution nullter Ordnung. Zu unserer kompakten Teilmenge K gibt es dann eine Konstante C.K/ so, dass (12.1) gilt. Das bedeutet aber, dass T ein beschränktes lineares Funktional auf D.˝I K/ ist. Nach dem BLE-Theorem (Theorem 8.7) kann T also eindeutig zu einem beschränkten linearen Funktional auf Cc .˝I K/ fortgesetzt werden, das durch die Formel .h/ WD lim hT; 'm i m!1
(12.3)
388
12 Einige spezielle Distributionen
gegeben ist, und zwar mit einer Folge .'m / D.˝I K/; die gleichmäßig gegen h konvergiert. Man überlegt sich aber leicht, dass diese Fortsetzung gar nicht von der betrachteten kompakten Menge K abhängt. Vielmehr ist durch (12.3) eine eindeutige Fortsetzung von T zu einem linearen Funktional auf Cc .˝/ definiert, wobei man allerdings zu gegebenem h 2 Cc .˝/ die approximierende Folge .'m / D.˝/ so wählen muss, dass die Träger der 'm alle in einer gemeinsamen kompakten Teilmenge von ˝ liegen. Die Behauptung folgt nun durch Anwendung von Theorem 12.3 auf . t u Bemerkungen: (i) Der Beweis zeigt, dass die Funktion f in (12.2) so gewählt werden kann, dass jf .x/j D 1 -f. ü. ist (und dass hierdurch die Klasse Œf 2 L1 .˝; / eindeutig bestimmt ist). Bei dieser Darstellung kann der Träger von T als das Komplement der größten offenen -Nullmenge beschrieben werden, wie man sich leicht überlegt (Übung!). Man bezeichnet Tr T daher auch als den Träger des R ADONmaßes . Insbesondere bedeutet Bedingung (T) aus Abschn. 10F (vgl. die Bemerkung im Anschluss an Satz 10.37), dass der Träger von ganz ˝ ist. (ii) Eine Distribution T von nullter Ordnung kann nicht nur – wie in Satz 11.13 – mit C 1 -Funktionen multipliziert werden, sondern mit beliebigen stetigen Funktionen h W ˝ ! C. Man setzt einfach hhT; 'i WD .h'/ ;
' 2 D.˝/ ;
(12.4)
wobei die durch (12.3) gegebene Fortsetzung von T auf Cc .˝/ ist. Zu guter Letzt wollen wir noch festhalten, dass die Monotoniebedingung (10.72) ganz automatisch sicherstellt, dass man es mit einer Distribution nullter Ordnung, also mit einem R ADONmaß, zu tun hat. Satz 12.5. Sei T W D.˝/ ! C ein lineares Funktional, das auf reellen Testfunktionen reelle Werte annimmt und die Monotoniebedingung '1 '2 H) T .'1 / T .'2 /
für '1 ; '2 2 D.˝/ reellwertig
erfüllt. Dann ist T eine Distribution nullter Ordnung, gegeben durch Z T .'/ D ' d
(12.5)
(12.6)
˝
mit einem eindeutigen vollständigen R ADONmaß . Beweis. Wir zeigen zunächst, dass T eine Distribution nullter Ordnung ist. Dazu betrachten wir ein kompaktes K ˝ und wählen gemäß Lemma 11.8 ein 2 D.˝/ mit 1 auf K und 0 1 auf ganz ˝. Für reellwertiges ' 2 D.˝I K/ (Bezeichnungen wie im Beweis von Kor. 12.4!) haben wir dann punktweise k'k1 ' k'k1 ; also wegen (12.5) auch k'k1 T ./ T .'/ k'k1 T ./ :
B Schichten und mehrfache Schichten
389
Das bedeutet, dass jT .'/j C k'k1 für alle reellwertigen Testfunktionen, wobei C WD T ./ 0 ist. Für komplexwertige Testfunktionen ergibt sich daraus durch Zerlegung in Real- und Imaginärteil eine analoge Abschätzung (mit der doppelten Konstanten). Jedenfalls erfüllt T die Stetigkeitsbedingung (12.1), die eine Distribution nullter Ordnung charakterisiert. Diese ermöglicht es auch, T zu einem linearen Funktional auf Cc .˝/ fortzusetzen, und nach (12.3) ist klar, dass die Monotoniebedingung (10.72) erfüllt. Der R IESZsche Darstellungssatz in der Form 10.40 liefert daher das gesuchte R A DON maß . t u
B Schichten und mehrfache Schichten Häufig trifft man auf Distributionen, die auf eine Teilmannigfaltigkeit M von Rn konzentriert sind, d. h. die außerhalb von M verschwinden. Ist z. B. eine stetige Funktion W M ! R gegeben und ist dk das k-dimensionale Flächenelement auf der k-dimensionalen Teilmannigfaltigkeit M; so können wir definieren Z hS; 'i WD ' dk (12.7) M
und erhalten so eine Distribution, die die Verteilung einer physikalischen Größe beschreibt, wenn diese Größe auf M konzentriert ist und dort die k-dimensionale Flächendichte hat. Solche Distributionen werden – zumindest im Fall k D n 1 – als Schichten bezeichnet. Man kann aber die Differentialform dk auch durch eine ganz beliebige (stetige) k-Form ! auf M ersetzen und erhält dann Z hT; 'i WD '! : (12.8) M
Man überlegt sich leicht, dass beide Formeln Distributionen nullter Ordnung definieren (Übung!). In der Physik ist es jedoch üblich, solche Situationen mit Hilfe der Deltafunktion zu beschreiben. Um dies näher zu erläutern, beschränken wir uns auf den Fall k D n 1; also auf Hyperflächen, und nehmen überdies an, M sei als die Lösungsmenge einer Gleichung P .x/ D 0 gegeben. Dabei sei P eine reelle C 1 -Funktion der Variablen x D .x1 ; : : : ; xn / 2 Rn ; für die die Regularitätsbedingung P .x/ D 0 H) rP .x/ ¤ 0
(12.9)
390
12 Einige spezielle Distributionen
erfüllt ist, so dass M D P 1 .0/ tatsächlich eine reguläre Hyperfläche ist. Nun sei ı D ı0 2 D0 .R/ die eindimensionale Deltafunktion im Nullpunkt. Man versucht, der „zusammengesetzten Funktion“ ı ı P einen vernünftigen Sinn zu verleihen. In Def. 11.26 haben wir zwar T ı g für einen Diffeomorphismus g definiert, aber dies kann nicht auf allgemeine differenzierbare Abbildungen ausgedehnt werden. Für unseren Spezialfall gehen wir von der Beziehung ı D 0 aus (vgl. das Beispiel zwischen Def. 11.28 und Satz 11.29) und stellen uns auf den Standpunkt, dass die Kettenregel die Beziehungen @P @ .P .x// D ı.P .x// ; @xj @xj
j D 1; : : : ; n
(12.10)
liefern würde, wenn die H EAVISIDEsche Sprungfunktion glatt wäre. Wir versuchen daher, ı.P .x// so zu definieren, dass dies richtig bleibt. Die Distributionsableitungen von ı P können mit Hilfe des G AUSSschen Integralsatzes leicht berechnet werden. Dazu setzen wir G WD fx j P .x/ > 0g und beachten, dass @G D P 1 .0/ D M wegen (12.9). Der äußere Normaleneinheitsvektor ist im Punkt x 2 @G offenbar gegeben durch rP .x/ ; (12.11) .x/ D jrP .x/j und diese Formel definiert sogar ein Vektorfeld in einer offenen Umgebung U von @G. Zur Testfunktion ' betrachten wir die Vektorfelder K j .x/ WD 'xj e j ; j D 1; : : : ; n und erhalten mit dem G AUSSschen Integralsatz Z @ .P .x//; '.x/ D @j '.x/ dn x @xj G Z Z ' j dn1 D K dn1 D Z D
M
@G
@j P dn1 : ' jrP j
M
Wir können also (12.10) erfüllen, indem wir setzen Z hı ı P; 'i WD P 1 .0/
'.x/ dn1 .x/ : jrP .x/j
(12.12)
In der Praxis ist es nicht immer einfach, das Flächenelement dn1 auf M explizit zu bestimmen. Daher ist die folgende alternative Beschreibung von ı.P .x// vorteilhaft, die eine größere rechnerische Flexibilität gestattet:
B Schichten und mehrfache Schichten
391
Satz 12.6. Sei (12.9) erfüllt, und sei U eine offene Umgebung von M WD P 1 .0/. Ist ! irgendeine glatte .n 1/-Form, für die dP ^ ! D dn x dx1 ^ ^ dxn gilt, so ist für jede Testfunktion ' 2 D.U /
(12.13)
Z
hı.P .x//; '.x/i D
'! :
(12.14)
M
Beweis. Setze !0 WD iX dn x mit X WD rP .x/=jrP .x/j2 . Diese .n 1/-Form ist in einer offenen Umgebung von M definiert, und ihre Einschränkung auf M ist bekanntlich hX j i dn1 (vgl. (4.34)). Also ist nach (12.11) Z Z Z Z ' hrP j rP i dn1 '!0 D 'hX j i dn1 D ' dn1 D jrP j3 jrP j M
M
M
M
D hı.P .x//; '.x/i : Außerdem ist dP ^ !0 D dP .X / dn x D
hrP j rP i n d x D dn x ; jrP j2
d. h. !0 erfüllt (12.13). Nun sei ! eine weitere n1-Form, die (12.13) erfüllt. Dann ist dP ^.! !0 / D 0. Wie wir unten in Lemma 12.7 zeigen werden, gibt es dann eine .n 2/-Form ˇ mit ! !0 D dP ^ ˇ. Wegen dP jM D 0 ist also !jM D !0 jM und somit Z Z '! D '!0 D hı.P .x//; '.x/i : M
M
t u Hier noch das im letzten Beweis benötigte Lemma (das wir auch unten bei der Behandlung von mehrfachen Schichten noch brauchen werden): Lemma 12.7. In einer offenen Menge U Rn seien eine glatte 1-Form ˛ und eine glatte .n 1/-Form gegeben, wobei ˛x ¤ 0 für alle x 2 U sein möge. Ist ˛ ^ D 0; so ist D ˛ ^ ˇ mit einer glatten .n 2/-Form ˇ. Hat kompakten Träger, so kann man auch ˇ mit kompaktem Träger wählen. Beweis. Sei x0 2 U . Den Kovektor ˛x0 ¤ 0 können wir durch Kovektoren ˇ2 ; : : : ˇn zu einer Basis von .Rn / ergänzen. Für alle x aus einer gewissen offenen Umgebung U.x0 / bilden f˛x ; ˇ2 ; : : : ; ˇn g dann immer noch eine Basis von .Rn / . Dann hat in U.x0 / die Form D c1 .x/ˇ2 ^ ^ ˇn C
n X kD2
ck .x/˛ ^ ˇ2 ^ ^ ˇOk ^ ^ ˇn
392
12 Einige spezielle Distributionen
mit C 1 -Funktionen c1 ; : : : ; cn . Die Voraussetzung ergibt daher 0 D ˛ ^ D c1 .x/˛ ^ ˇ2 ^ ^ ˇn und somit D
n X
ck .x/˛ ^ ˇ2 ^ ^ ˇOk ^ ^ ˇn D ˛ ^ ˇ
kD2
mit ˇ WD
n X
ck .x/ˇ2 ^ ^ ˇOk ^ ^ ˇn :
kD2
Jeder Punkt x0 2 U hat also eine offene Umgebung, in der die Behauptung richtig ist. Nun nehmen wir an, hat den kompakten Träger K. Dann kann man K mit endlich vielen offenen Mengen U1 ; : : : ; Um überdecken, in denen die Behauptung gilt. Wir haben also D ˛ ^ ˇ`
in U` ;
` D 1; : : : ; m :
Sei h1 ; : : : ; hm eine dieser Überdeckung untergeordnete glatte Zerlegung der Eins (vgl. Theorem 4.2). Dann hat m X h` ˇ` ˇ WD `D1
ebenfalls kompakten Träger, und es ist ˛^ˇ D
m X `D1
h` .˛ ^ ˇ` / D
m X
! h` D :
`D1
„ ƒ‚ … D1 in K
Auch wenn der Träger von nicht kompakt ist, kann man durch Betrachtung geeigneter Überdeckungen und entsprechender Teilungen der Eins die Behauptung für ganz U beweisen. Gegenüber dem, was in Theorem 4.2 gesagt wurde, muss die Theorie der Teilungen der Eins hierfür allerdings noch etwas verfeinert werden, aber das wollen wir übergehen, zumal diese Verfeinerung in den meisten praktisch vorkommenden Fällen gar nicht nötig ist. t u Beispiel: In der relativistischen Quantenmechanik wird die Bewegung eines Teilchens der Masse m 0 im Impulsraum durch eine Wellenfunktion beschrieben, die auf die „Massenschale“ ˚ M WD .p0 ; p/ D .p0 ; p1 ; p2 ; p3 / 2 R4 j p02 D m2 C jpj2 konzentriert ist. Solch eine Wellenfunktion ist also, genau genommen, eine Distribution, und zwar eine Schicht auf der Teilmannigfaltigkeit M D P 1 .0/; wobei P .p0 ; p1 ; p2 ; p3 / WD m2 C jpj2 p02
B Schichten und mehrfache Schichten
393
gesetzt wurde. Im Falle massiver Teilchen (m > 0) ist (12.9) erfüllt, und die Schicht hat die Form .p0 ; p/ı m2 C jpj2 p02 : Im Falle masseloser Teilchen (m D 0) hingegen ist (12.9) im Nullpunkt nicht erfüllt. Dann ist M nur eine Teilmannigfaltigkeit von R4 n f0g; aber nicht von ganz R4 . Im Nullpunkt müssen die Wellenfunktionen daher auf geeignete Weise „regularisiert“ werden (vgl. z. B. [33]).
Mehrfache Schichten Häufig benötigt man auch Distributionen der Gestalt ı 0 ıP; ı 00 ıP usw., die ebenfalls die Hyperfläche M D P 1 .0/ als Träger haben und die Kettenregel erfüllen, d. h. @ .k/ @P .kC1/ ı .P .x// D ı .P .x// ; @xj @xj
j D 1; : : : ; n
(12.15)
sowie ı .0/ .P .x// D ı.P .x//. Für die Konstruktion dieser Distributionen müssen wir allerdings etwas weiter ausholen. Wir bezeichnen Differentialformen mit kompaktem Träger dabei als finite Formen. Lemma 12.8. Seien P; U; M wie in Satz 12.6, aber rP .x/ ¤ 0 8 x 2 U . Sei ' 2 D.U / gegeben. a. Es gibt in U eine Folge !0 ; !1 ; !2 ; : : : von finiten glatten .n 1/-Formen, für die gilt: k D 0; 1; 2; : : : (12.16) d!k D dP ^ !kC1 ; sowie !0 D '!; wo ! die Gleichung (12.13) löst. b. Sei 1 j n. Angenommen, in der offenen Menge U0 U können durch uj D P .x1 ; : : : ; xn / ;
ui D xi
für i ¤ j
(12.17)
neue Koordinaten eingeführt werden, wobei die inverse Koordinatentransformation durch x D Q.u/ gegeben ist. Dann können die !k ; k 0 so gewählt werden, dass sie in U0 die Gestalt ! k 'ıQ j 1 @ du1 ^ ^ duj ^ ^ dun !k D .1/ (12.18) @ukj Pxj ı Q
b
haben. R c. Die Zahlen Ak WD M !k hängen nicht von der gewählten Lösungsfolge .!k / des Gleichungssystems (12.16) ab, sondern nur von ' und P . Beweis. (i) Sei U0 wie in Teil b. Wir zeigen zunächst, dass !0 D '! in der Form (12.18) gewählt werden kann. Für die Funktionaldeterminante der Koordinatentransformation (12.17) gilt offenbar @P @.u1 ; : : : ; un / D D Pxj @.x1 ; : : : ; xn / @xj
394
12 Einige spezielle Distributionen
und insbesondere Pxj ¤ 0. Also ist dn x D
1 du1 ^ ^ dun : Pxj .Q.u//
(12.19)
Die Gleichung (12.13) lautet daher in den u-Koordinaten: duj ^ ! D
1 du1 ^ ^ dun : Pxj .Q.u//
Gleichung (12.13) wird daher gelöst durch ! D .1/j 1
1 O j ^ ^ dun ; du1 ^ ^ du Pxj ı Q
und dann hat !0 D '! die Gestalt (12.18). Es bleibt nachzurechnen, dass die Formen (12.18) für alle k die Beziehung (12.16) erfüllen. Diese Rechnung ist wegen dP D duj aber trivial. Somit ist b. bewiesen. (ii) Nun zeigen wir a. Der Träger K von ' ist eine kompakte Teilmenge von U; und in jedem x0 2 K ist rP .x0 / ¤ 0; also Pxj .x0 / ¤ 0 für mindestens ein j . Nach dem Satz über inverse Funktionen ist daher die Koordinatentransformation (12.17) in einer gewissen offenen Umgebung U0 von x0 möglich, Teil b. also anwendbar. In U0 existieren somit Formen !k0 ; die (12.16) erfüllen. Nach den Sätzen aus Abschn. 11D kann man K durch endlich viele derartige offene Mengen überdecken und hierzu eine glatte Zerlegung der Eins wählen. Damit gewinnt man die Formen !k nun genauso wie im Beweis von Lemma 12.7. Die Konstruktion zeigt auch, dass die so gebildeten Formen finit sind. (iii) Zum Beweis von c. benötigen wir die Behauptung. Sind .!k /; .!Q k / zwei Folgen von Formen mit den in b. geforderten Eigenschaften, so ist für alle k 0 !k !Q k D d˛k C ˇk ^ dP
(12.20)
mit glatten finiten .n 2/-Formen ˛k ; ˇk . Dies beweisen wir durch Induktion nach k. Aus (12.13) folgt zunächst dP ^ .! !/ Q D dn x dn x D 0 ; also ! !Q D dP ^ ˇ mit einer finiten .n 2/-Form ˇ (Lemma 12.7). Das ergibt !0 !Q 0 D ' dP ^ ˇ ; also (12.20) mit ˛0 D 0; ˇ0 D 'ˇ. Nun sei (12.20) für k bewiesen. Mit (12.16) folgt dann dP ^ .!kC1 !Q kC1 / D d!k d!Q k D d. d˛k C ˇk ^ dP / D dˇk ^ dP D .1/n1 dP ^ dˇk ; folglich dP ^ Œ!kC1 !Q kC1 .1/n1 dˇk D 0 :
B Schichten und mehrfache Schichten
395
Alle auftretenden Formen sind finit. Erneute Anwendung von Lemma 12.7 liefert daher eine finite Form so, dass !kC1 !Q kC1 D .1/n1 dˇk C dP ^ : Mit ˛kC1 WD .1/n1 ˇk und ˇkC1 WD haben wir also (12.20) für k C 1. (iv) Wir leiten Teil c. aus der obigen Behauptung her. Mit (12.20) und dem allgemeinen S TOKESschen Satz (Theorem 4.28) ergibt sich Z Z Z .!k !Q k / D d˛k D ˛k ; M
M
@M
denn dP verschwindet ja auf M D P 1 .0/. Ist M kompakt, so hat M keinen Rand wegen (12.9) und dem Satz über implizite Funktionen. Ist M hingegen nicht kompakt, so betrachten wir eine offene Menge V; die den Träger von ' (und damit die Träger aller auftretenden Formen!) umfasst und deren Rand glatt ist und M transversal schneidet. Dann ist @.M \ V / D M \ @V; also ˛k 0 auf @.M \ V /. Der S TOKESsche Satz, angewandt auf die Mannigfaltigkeit M \ V ; ergibt dann Z Z Z d˛k D d˛k D ˛k D 0 : M \V
M
In beiden Fällen folgt
R M
!k D
R M
@.M \V /
!Q k ; wie behauptet.
t u
Nun können wir die Distributionen ı .k/ .P .x// einführen. Neben der direkten Definition durch Integration von geeigneten Differentialformen beschreiben wir sie auch durch den Grenzübergang h i in D0 .Rn / ; (12.21) ı .k/ ı P D lim h.k/ m ıP m!1
wo .hm / eine beliebige Folge von Testfunktionen ist, die die (eindimensionale) Deltafunktion approximiert (vgl. Beispiel 11.24c.). Diese Beschreibung vermittelt vielleicht am ehesten einen anschaulichen Eindruck davon, was man sich unter ı .k/ .P .x// vorzustellen hat. Satz 12.9. Sei P eine C 1 -Funktion, die (12.9) erfüllt, und sei M WD P 1 .0/; U WD fx j rP .x/ ¤ 0g. a. In D0 .Rn / gibt es genau eine Folge von Distributionen Tk DW ı .k/ ı P ı .k/ .P .x//; k D 0; 1; 2; : : : ; für die gilt: (i) (ii)
Tk 0 in Rn n M; und In U ist hTk ; 'i D .1/
Z k
!k .'/ ; M
k0:
(12.22)
396
12 Einige spezielle Distributionen
Dabei sind !k D !k .'/ Differentialformen von der in Lemma 12.8a. beschriebenen Art. b. Ist .hm / eine Folge in D.R/ mit hm + ı; so gilt (12.21) für alle k. c. ı .0/ .P .x// D ı.P .x//; und für alle k 0 gilt (12.15). Beweis. a. Der Beweis ist nicht schwer, aber seine präzise Formulierung ist recht umständlich, und darum beschränken wir uns auf die folgenden Andeutungen: In der offenen Menge U definiert man die Tk durch (12.22). Dabei zeigt Lemma 12.8c., dass es nicht auf die genaue Wahl der Formen !k .'/ ankommt, solange sie nur die Eigenschaften aus Teil a. dieses Lemmas haben. Um nachzuweisen, dass hTk ; 'i linear und stetig von ' 2 D.U / abhängt, zieht man sich mittels geeigneter Teilungen der Eins auf den Fall zurück, wo Tr ' U0 für eine Teilmenge U0 U; wie sie in Lemma 12.8b. betrachtet wird. Definiert man dann die !k .'/ in U0 durch Gl. (12.18), so sind Linearität und Stetigkeit klar. Ferner ist klar, dass die so definierten Tk in der offenen Menge U n M verschwinden. Daher können sie durch Null auf ganz Rn fortgesetzt werden. b. Wegen Aufg. 11.6 genügt es, die Gültigkeit von (12.21) lokal nachzuprüfen, d. h. in einer geeigneten offenen Umgebung U0 eines beliebigen Punktes. Wir wählen U0 so, dass die Voraussetzungen von Lemma 12.8b. gegeben sind. Dann gilt (12.19), also auch dn x D
.1/j 1 O j ^ ^ dun : duj ^ du1 ^ ^ du Pxj .Q.u//
Sei ' eine Testfunktion mit Tr ' U0 . Integrieren der Form h.k/ m .P .x//'.x/ dx1 ^ ^ dxn liefert nun Dh i E h.k/ ı P ;' D m Z '.Q.u// duj ^ du1 ^ ^ duj ^ ^ dun D .1/j 1 h.k/ m .uj / Pxj .Q.u// 0 1 Z Z '.Q.u ; : : : ; u // 1 n @ h.k/ duj A D .1/j 1 m .uj / Pxj .Q.u1 ; : : : ; un //
b
Rn1
R
du1 duj 1 duj C1 dun : Wir betrachten für einen Moment feste Werte der Variablen ui ; i ¤ j und setzen .t/ WD
'.u1 ; : : : ; uj 1 ; t; uj C1 ; : : : ; un / ; Pxj .u1 ; : : : ; uj 1 ; t; uj C1 ; : : : ; un /
B Schichten und mehrfache Schichten
397
wobei wir diese Testfunktion durch Null auf ganz R fortsetzen. Produktintegration und die Voraussetzung über die Folge .hm / ergeben dann Z Z k h.k/ .t/ .t/ dt D .1/ hm .t/ .k/ .t/ dt ! .1/k .k/ .0/ m R
R
für m ! 1. Dies kann über die Variablen ui ; i ¤ j integriert werden, denn da die Integranden stetig mit kompaktem Träger sind, ist die Vertauschung der Grenzprozesse völlig unproblematisch. Unter Verwendung von (12.18), (12.22) findet man also lim hŒhm ı P ; 'i D
m!1
D .1/
kCj 1
Z
Rn1
@k @ukj
'.u1 ; : : : ; uj 1 ; 0; uj C1 ; : : : ; un / Pxj .u1 ; : : : ; uj 1 ; 0; uj C1 ; : : : ; un /
!
du1 duj 1 duj C1 dun Z D .1/k !k .'/ D hı .k/ ı P; 'i ; P 1 .0/
d. h. für unsere lokale Situation ist (12.21) erwiesen. c. Wegen !0 .'/ D '! folgt die Beziehung ı .0/ .P .x// D ı.P .x// unmittelbar aus den Definitionen. Zum Beweis der Rechenregel (12.15) schreiben wir ı D limm!1 hm mit geeigneten Testfunktionen hm und bemerken, dass nach der klassischen Kettenregel @P .kC1/ @ .k/ hm .P .x// D h .P .x// ; @xj @xj m
j D 1; : : : ; n
ist. Für m ! 1 ergibt sich hieraus (12.15) wegen Teil b. und Satz 11.30. t u An einigen Beispielen soll nun gezeigt werden, dass diese Konstruktion in konkreten Fällen das liefert, was man erwartet: Beispiele 12.10. a. Das einfachste Beispiel ist die Koordinatenhyperebene xj D 0. Dann ist P .x/ D xj ; also rP .x/ D e j . In den Bezeichnungen von Lemma 12.8b. kann man also U0 D Rn und ui D xi ; i D 1; : : : ; n wählen und daher (12.18) global für die Definition von ı .k/ .P .x// heranziehen. Das Ergebnis ist Z @k ' dx1 ^ ^ dxj ^ ^ dxn hı .k/ .xj /; 'i D .1/kCj 1 @xjk xj D0 Z D .1/k @kj '.x1 ; : : : ; xj 1 ; 0; xj C1 ; : : : ; xn /
b
Rn1
dx1 dxj 1 dxj C1 dxn :
398
12 Einige spezielle Distributionen
Das Vorzeichen .1/j 1 sorgt dafür, dass die Orientierung auf der Koordinatenhyperebene die vom Normaleneinheitsvektor e j induzierte ist. Deshalb verschwindet es in der zweiten Zeile. b. Wir beschreiben die Sphäre vom Radius R > 0 in der Form P .x/ WD jxj R D 0. In Rn n f0g ist dann (12.9) erfüllt. Um ı .k/ .jxj R/ zu bestimmen, transformieren wir auf Polarkoordinaten, was in der Sprache der Differentialformen so aussieht: (12.23) dn x D r n1 dr ^ : Dabei ist r D jxj; und
b
n 1 X WD n .1/j 1 xj dx1 ^ ^ dxj ^ ^ dxn r j D1
ist das n-dimensionale Raumwinkelelement, dessen Einschränkung auf die Einheitssphäre Sn1 gerade deren .n 1/-dimensionales Flächenelement ist (vgl. Aufg. 3.4d.). Wegen dP D dr lässt ein Vergleich von (12.23) und (12.13) sofort erkennen, dass man ! WD r n1 wählen kann, also !0 .'/ D 'r n1 für ' 2 D.Rn n f0g/. Da bekanntlich eine geschlossene Form ist (vgl. Aufg. 4.7), ergibt sich d!0 .'/ D d.'r n1 / ^ D
@ .'r n1 / dr ^ : @r
Also wird (12.16) mit k D 0 durch @ .'r n1 / @r gelöst. So kann man fortfahren und findet durch Induktion !1 .'/ D
!k .'/ D
@k .'r n1 / @r k
für alle k. Da das Flächenelement auf der Sphäre r D R gerade dn1 D Rn1 ist, bekommen wir also das einleuchtende Ergebnis Z @k .1/k hı .k/ .jxj R/; 'i D n1 .'r n1 / dn1 : (12.24) R @r k rDR
Dies gilt sogar für alle ' 2 D.R /; da die Distribution außerhalb der Sphäre r D R verschwindet. Um die Formel noch etwas expliziter zu gestalten, schreiben wir x D r ; wo die Einheitssphäre Sn1 durchläuft, und erhalten ˇˇ Z @k .k/ k n1 ˇ '.r /r hı .jxj R/; 'i D .1/ dn1 . / : ˇ ˇ @r k n
Sn1
rDR
(12.25)
B Schichten und mehrfache Schichten
399
c. Nun beschreiben wir dieselbe Sphäre durch P .x/ WD jxj2 R2 D 0. Dann ist dP D 2r dr; also ergibt (12.23) dn x D
1 n2 r dP ^ ; 2
d. h. man kann (12.13) durch ! WD 12 r n2 erfüllen. Analoge Rechnungen wie im vorigen Beispiel – allerdings unter Beachtung von dr D 2r1 dP – führen nun zu 1 1 @ k n2 'r !k .'/ D 2 2r @r und damit zu hı
.k/
.1/k .jxj R /; 'i D 2 2
Z
2
Sn1
1 @ 2r @r
k ˇˇ n2 ˇ '.r /r ˇ ˇ
dn1 . / : rDR
(12.26) Die letzten beiden Beispiele werfen die Frage auf, wie sich generell die Deltafunktionen und ihre Ableitungen voneinander unterscheiden, wenn man ein und dieselbe Hyperfläche M durch zwei verschiedene Gleichungen P .x/ D 0; Q.x/ D 0 beschreibt. Beide Funktionen P und Q sollen natürlich (12.9) erfüllen. Ist ein Normaleneinheitsvektor an M; so haben wir nach DE L’H OSPITAL rQ.x/ .x/ jrQ.x/j Q.x C t.x// D D ¤0 t !0 P .x C t.x// rP .x/ .x/ jrP .x/j lim
für alle x 2 M; und daher kann man den Quotienten A.x/ WD Q.x/=P .x/ stetig auf M fortsetzen. Mittels TAYLORentwicklung überzeugt man sich leicht, dass auf diese Weise sogar eine C 1 -Funktion A in einer offenen Umgebung U von M definiert ist. Es gilt also Q D AP mit A.x/ ¤ 0 in U : (12.27) Daher wird unsere Frage durch den folgenden Satz vollständig beantwortet: Satz 12.11. Seien P; A 2 C 1 .U /; wobei (12.9) gilt und wobei A.x/ in U keine Nullstelle hat. Dann gilt für alle k 0: ı .k/ .A.x/P .x// D A.kC1/ ı .k/ .P .x// : Beweis. (i) Zur Behandlung des Falles k D 0 wählen wir .n 1/-Formen !; !A mit dn x D dP ^ ! bzw. dn x D d.AP / ^ !A D .A dP C P dA/ ^ !A . Auf M D P 1 .0/ gilt dann dP ^ ! D A dP ^ !A ; also dP ^ .A1 ! !A / D 0 Wie im Beweis von Satz 12.6 schließt man hieraus mittels Lemma 12.7, dass !A und A1 ! auf M übereinstimmen. (Genau genommen, benötigt man eine Variante von
400
12 Einige spezielle Distributionen
Lemma 12.7, bei der die Voraussetzung nicht auf einer offenen Menge U; sondern nur auf M erfüllt ist. Diese lässt sich aber durch fast denselben Beweis herleiten.) Nach (12.14) ergibt das aber ı.A.x/P .x// D A1 ı.P .x// ; also die Behauptung für k D 0. (ii) Nun beweisen wir die (auch sonst nützliche) Formel P .x/ı .k/ .P .x// C kı .k1/ .P .x// D 0 ;
k1:
(12.28)
R Da P 0 auf M ist, haben wir hP .ı ı P /; 'i D M P '! D 0 für alle '; also P .ı ı P / D 0. Mit (12.15) und der Produktregel (11.58) folgt daraus Pxj .ı ı P / C PPxj .ı 0 ı P / D 0 ;
j D 1; : : : ; n :
Lokal findet man aber immer ein j mit Pxj ¤ 0; und deshalb kann man hier die Faktoren Pxj kürzen (Aufg. 11.4). Das ergibt (12.28) für k D 1. Mit einer analogen Rechnung erledigt man auch den Induktionsschritt von k auf k C 1 (Übung!). (iii) Nun betrachten wir k 2 und nehmen an, die Behauptung sei für k 1 schon nachgewiesen, also ı .k1/ .A.x/P .x// D A.x/k ı .k1/ .P .x// :
(12.29)
Differenzieren ergibt dann (wenn wir die Variable x für den Augenblick weglassen) für j D 1; : : : ; n .APxj C Axj P /ı .k/ .AP / D Ak Pxj ı .k/ .P / kA.kC1/ Axj ı .k1/ .P / : Wir stellen die Terme um und beachten erneut die Induktionsvoraussetzung (12.29) sowie schließlich (12.28) für AP statt P . Das ergibt: APxj ı .k/ .AP / Ak Pxj ı .k/ .P / D Axj .P ı .k/ .AP / C kA.kC1/ ı .k1/ .P // D Axj A1 .AP ı .k/ .AP / C kAk ı .k1/ .P // D Axj A1 .AP ı .k/ .AP / C kı .k1/ .AP // D0: Kürzen durch APxj ergibt also die Behauptung für k. Da man lokal immer ein geeignetes j findet, für das A.x/Pxj .x/ ¤ 0 ist, liefert Aufg. 11.4 tatsächlich den Nachweis, dass die Behauptung für k in ganz U gilt. t u Beispiel: Wir greifen noch einmal die beiden Darstellungen der Sphäre vom Radius R > 0 aus 12.10 auf. Mit P .x/ WD jxj R und A.x/ WD jxj C R hat man jxj2 R2 D A.x/P .x/; also ergibt der letzte Satz ı .k/ .jxj2 R2 / D
1 ı .k/ .jxj R/ : .jxj C R/kC1
(12.30)
Diese Beziehung lässt sich aus den expliziten Darstellungen (12.25), (12.26) nicht ohne weiteres ablesen.
C Regularisierung divergenter Integrale und H ADAMARD scher Hauptwert
401
Definition 12.12. Sei M Rn eine reguläre Hyperfläche. Eine k-fache Schicht auf M ist eine Distribution der Form T .x/ D .x/ı .k1/ .P .x// ; wobei eine glatte Funktion ist und die Gleichung P .x/ D 0 die Hyperfläche M beschreibt. Bemerkungen: (i) Man kann als die .n 1/-dimensionale Dichte der Schicht auffassen. Jedoch ist zu bedenken, dass von der gewählten Beschreibung der Hyperfläche abhängt. Satz 12.11 besagt gerade, dass man beim Übergang von der Beschreibung P D 0 zur Beschreibung AP D 0 die Dichte durch die Dichte Ak ersetzen muss. Dies zeigt aber auch, dass die Hyperfläche selbst und nicht ihre jeweilige Beschreibung durch eine konkrete Gleichung festlegt, welche Distributionen k-fache Schichten auf ihr sind. (ii) Physikalisch sollte man sich eine k-fache Schicht auf M als eine durch die Intensität .x/ gewichtete Verteilung von 2k -Multipolen auf M vorstellen. Zum Beispiel besteht eine Doppelschicht aus Dipolen, die in Normalenrichtung orientiert sind. Um sich dies plausibel zu machen, sollte man entweder (12.21) oder die durch (12.18) und (12.22) gegebene lokale Beschreibung heranziehen.
C Regularisierung divergenter Integrale und H ADAMARDscher Hauptwert Bei manchen Anwendungen – z. B. bei Lösungsformeln für die Wellengleichung und verwandte partielle Differentialgleichungen – liegt folgende Situation vor: Man hat im Gebiet ˝ Rn eine stetige Funktion P; die auf einer gewissen Teilmenge M ˝ verschwindet, sowie eine „harmlose“ Funktion g (z. B. messbar und beschränkt). Durch Z g.x/'.x/ n hŒg=P ; 'i WD d x ; ' 2 D.˝ n M / (12.31) P .x/ ˝nM
ist dann in ˝ n M eine reguläre Distribution definiert. Aber i. A. ist g=P nicht in ganz ˝ lokal integrierbar (z. B. ist schon 1=x nicht mehr lokal integrierbar, sobald das Grundintervall die Null im Inneren enthält!), und dann ist nicht klar, wie das R Integral ˝ .g'=P / dn x für beliebiges ' 2 D.˝/ aufzufassen ist. Genau genommen, existiert es zumeist gar nicht, sobald Tr ' \ M ¤ ;. Trotzdem kann man in vielen Fällen solche „divergenten Integrale“ erfolgreich betrachten, indem man eine Distribution T 2 D0 .˝/ findet, die auf ˝ n M mit Œg=P übereinstimmt. Solche Distributionen sind meist von höherer Ordnung, und sie sind auch nicht eindeutig bestimmt, doch sie leisten – etwa als Lösungsansatz für eineRpartielle Differentialgleichung – das, was man sich von dem divergenten Integral .g'=P / dn x erhofft hatte. Allgemein definieren wir:
402
12 Einige spezielle Distributionen
Definition 12.13. Sei M ˝ abgeschlossen und f 2 L1loc .˝ n M /. Eine R Regularisierung des divergenten Integrals ˝ f .x/'.x/ dn x ist eine Distribution T 2 D0 .˝/; die auf der offenen Teilmenge ˝ n M mit der regulären Distribution Œf übereinstimmt. Bemerkung: Zwei Regularisierungen T1 ; T2 von ein und demselben divergenten Integral stimmen auf ˝ n M überein, und daher verschwindet T1 T2 in ˝ n M . Es folgt also Tr .T1 T2 / M : Für die explizite Konstruktion von Regularisierungen beschränken wir uns auf den Fall, wo M aus einem einzigen Punkt besteht, und wir beginnen mit einem einfachen eindimensionalen Beispiel: Für ' 2 D.R/ betrachten wir das Integral Zb .t a/˛k '.t/ dt ;
a < b;
1 < ˛ 0 ;
k2N:
(12.32)
a
Wegen der Singularität der Ordnung ˛ k k 1 bei t D a existiert das Integral nicht als uneigentliches Integral, d. h. f .t/ WD Œa;b .t/.t a/˛k
(12.33)
ist nicht lokal integrierbar und erzeugt damit keine reguläre Distribution. Wir wollen zeigen, dass man das divergente Integral noch als singuläre Distribution interpretieren kann. Dazu entwickeln wir die Testfunktion '.t/ nach TAYLOR um t D a: '.t/ D
k1 .j / X ' .a/ .t a/j C .t a/k .t/ jŠ
(12.34)
j D0
mit dem TAYLORschen Restglied 1 .t/ D .k 1/Š
Z1 .1 s/k1 ' .k/ .a C s.t a// ds : 0
Einsetzen von (12.34) in das Integral (12.32) ergibt für " > 0 Zb .t a/˛k '.t/ dt D aC"
Zb D
.t a/ aC"
˛
.t/ dt C
Zb k1 .j / X ' .a/ j D0
jŠ aC"
.t a/˛kCj dt :
(12.35)
C Regularisierung divergenter Integrale und H ADAMARD scher Hauptwert
403
Im Fall 1 < ˛ < 0 folgt daraus Zb .t a/˛k '.t/ dt C
k1 X j D0
aC"
' .j / .a/ "˛kCj C1 j Š.˛ k C j C 1/
Zb .t a/˛ .t/ dt C
D
k1 X j D0
aC"
' .j / .a/ .b a/˛kCj C1 ; j Š.˛ k C j C 1/ (12.36)
und im Fall ˛ D 0 ergibt sich Zb
.t a/k '.t/ dt C
k2 X j D0
aC"
Zb D
.t/ dt C
k2 X j D0
aC"
' .j / .a/ ' .k1/ .a/ "j kC1 C ln " j Š.j k C 1/ .k 1/Š
' .k1/ .a/ ln.b a/ ' .j / .a/.b a/j kC1 C : j Š.j k C 1/ .k 1/Š
(12.37) Für die einzelnen Summanden auf der linken Seite von (12.36) und (12.37) existieren die Grenzwerte für " ! 0 allesamt nicht. Jedoch existieren die entsprechenden Grenzwerte der rechten Seite von (12.36) und (12.37) beide, weil .t/ nach (12.35) eine stetige Funktion ist. Folglich existieren die Grenzwerte der gesamten linken Seiten von (12.36) und (12.37). Man definiert: Definitionen 12.14. Seien a < b in R und k 2 N; ' 2 D.R/. a. Für 1 < ˛ < 0 nennt man1 0 b 1 Z Pf @ .t a/˛k '.t/ dt A WD a
D lim
8 b 0 ist somit gegeben durch Y Y 1 exp ˇ H Œ'
d'x D dPx .'x /; (A.28) dP Œ' D Z x2
x2
N
d. h. P D x2 Px ; wie in (A.15). Analog zur Konstruktion von Produktmaßen mit unendlich vielen Faktoren stellt sich in der Physik die Frage, wie man Betrachtungen eines endlichen Teilstücks 2 Pfin .Zd / des Kristallgitters auf ganz Zd ausdehnt. Die Schwierigkeit, unendlich viele Faktoren in ein Produkt von Maßen einzubringen spiegelt sich in der Beobachtung wider, dass z. B. für von x unabhängige Selbstenergien vx .'x / D 2 2 'x 1 die formale H AMILTONfunktion X 2 'x2 1 H ' D
(A.29)
x2Zd d
für beliebig herausgegriffene Spinkonfigurationen ' D .'x /x2Zd 2 RZ fast immer divergiert und man demzufolge ' keine Energie zuordnen kann. Nach Satz A.2 wissen wir aber, dass es eine mathematisch vernünftige -Algebra A.Z/ gibt, auf der ein W-Maß P definiert ist, das die Verteilung der Spinkonfigurationen von endlichen Teilen des Gitters 2 Pfin .Zd / auf die Spinkonfigurationen auf ganz Zd fortsetzt. Diese Fortsetzung mit Hilfe eines Grenzprozesses nennt man in der Physik den thermodynamischen Limes. Freilich ist das so fortgesetzte Produktmaß physikalisch völlig uninteressant. Um dies einzusehen führen wir mit Hilfe des W-Maßes P den Erwartungswert EŒu
einer Zufallsvariablen (hier synonym mit Observablen) u 2 L1 .˝; dP / durch Z EŒu WD u.'/ dP .'/ (A.30) ˝ d ein, Q wobei ' D .'x /x2Zd 2 ˝. Speziell für 2 Pfin .Z / und das Produkt u.'/ D x2 ux .'x / erhalten wir dann Y Y Z Y ux D ux .'x / dPx .'x / D EŒux ; (A.31) E x2
x2
R
x2
was man als Unabhängigkeit der Zufallsvariablen ' 7! ux .'x / x2Zd bezeichnet. Die Bezeichnung „Unabhängigkeit“ ist sehr treffend, denn etwa für u.'/ D
Unendliche Produkte von Maßen und Statistische Mechanik
459
ux .'x /uy .'y / und x ¤ y ist EŒux uy D EŒux EŒuy ; d. h. die Spinvariable 'x am Gitterpunkt x beeinflusst die Verteilung der Spinvariable 'y am Gitterpunkt y überhaupt nicht – sie treten nicht in Wechselwirkung. Es stellt sich die physikalische Frage, ob nichtwechselwirkende Spinsysteme wie in (A.27) die einzig möglichen sind bzw. stellt sich die mathematische Frage, ob sich d die Konstruktion von W-Maßen auf RZ in dem in (A.15) vorgestellten Produktmaß mit unendlich vielen Faktoren erschöpft. Die Erkenntnis, dass dem nicht so ist und dass im Gegenteil eine geradezu d unüberschaubare Vielfalt an W-Maßen auf RZ ; A.Z/ existiert, verdanken wir wesentlich dem russischen Mathematiker KOLMOGOROV. Dazu wiederholen wir ein Stück der anfänglichen Diskussion und betrachten eine Familie von W-Maßen .P /2Pfin .Zd / ; die durch die endlichen Teilmengen des Gitters Zd indiziert sind und jeweils auf dem Messraum .R ; ˝ B/ definiert sind. Damit diese W-Maße überhaupt etwas miteinander zu tun haben, müssen wir die Konsistenzbedingung (A.20), (A.32) P A R n D P ŒA ; für alle ; 2 Pfin .Zd / mit und alle A 2 ˝x2 B fordern, sodass zumindest die Wohldefiniertheit von P W Z ! Œ0; 1 ; 1 P ŒA WD P ŒA
(A.33) 1 für Zylindermengen ŒA gesichert ist. KOLMOGOROV hat gezeigt, dass (A.32) auch die einzige Forderung ist, die man an die Familie .P /2Pfin .Zd / stellen muss.
Theorem A.3. Ist .R ; ˝ B; P /2Pfin .Zd / eine Familie von W-Borelmaßen, die der Konsistenzbedingung (A.32) genügt, so gibt es genau ein W-Maß P auf Zd R ; A.Z/ ; das (A.33) fortsetzt, d. h. sodass 1 P ŒA D P ŒA
(A.34)
für alle endlichen Teilmengen 2 Pfin .Zd / und A 2 ˝ B gilt. Satz A.3 stellt die Vielfalt der Möglichkeiten dar; er gibt aber noch keinen Hinweis auf die Konstruktion solcher konsistenter Familien .P /2Pfin .Zd / von W-Maßen. Der folgende Satz löst dieses Problem auf überraschend einfache Weise. Dazu notieren wir mit (A.35) lim F . / WD lim F . ` /; `!1
%Zd
wobei ` WD f`; ` C 1; : : : ; ` 1; `gd 2 Pfin .Zd / die um den Ursprung zentrierten Würfel der Kantenlänge 2` C 1 bezeichnen und ` 2 N als genügend groß vorausgesetzt wird. Theorem A.4. Sei .R ; ˝ B; PQ / 2P .Zd / eine Familie von W-Borelmaßen, sofin
dass für alle endlichen Teilmengen 2 Pfin .Zd / und A 2 ˝ B der Limes P .A/ WD
lim PQ .A R n / 2 Œ0; 1
%Zd
(A.36)
460
Unendliche Produkte von Maßen und Statistische Mechanik
existiert. Dann definiert .R ; ˝ B; P /2Pfin .Zd / eine Familie von W-Borelmaßen, die der Konsistenzbedingung (A.32) genügt. Der Beweis des Satzes A.4 ist einfach: Sind ; Q 2 Pfin .Zd / mit Q und A 2 ˝x2 B; sowie ` 2 N so groß, dass Q ` ; so ist offensichtlich h i h i Q Q (A.37) PQ` A R` n D PQ` A Rn R` n : Bilden wir auf beiden Seiten den Limes ` ! 1; so erhalten wir h i Q Q P ŒA D lim PQ .A R n / D lim PQ` A Rn R` n %Zd
D PQ A R
Q n
%Zd
;
(A.38)
also die behauptete Konsistenzbedingung. Die Sätze A.3 und A.4 bilden die Grundlage der allgemeinen Theorie des thermodynamischen Limes in der statistischen Mechanik. Wir starten dazu von einer Familie .H /2Pfin .Zd / von H AMILTONfunktionen, wobei H 2 C R I RC 0 als stetig und genügend schnell wachsend angenommen wird, sodass Z Y Z WD exp.ˇ H Œ' / d'x < 1: (A.39) x2
R
Analog zu (A.30) definieren wir den Erwartungswert einer beschränkten Zufallsvariablen u 2 L1 ŒR durch Z Y QE Œu WD Z 1 u Œ' exp ˇ H Œ' ; ' n
d'x ; (A.40) x2
R
wobei ; 2 Pfin .Zd / endlich sind und gilt. Die Existenz des Limes (A.36) ist offenbar äquivalent zur Existenz von EŒu WD
Q Œu
lim E
%Zd
(A.41)
für alle 2 Pfin .Zd / und alle u 2 L1 ŒR . Die Gleichungen (A.40) und (A.41) stellen also die Vorgehensweise zur Etablierung des thermodynamischen Limes klar: Aus physikalischen Überlegungen erhält man die H AMILTONfunktionen H für endliche Teile des unendlich ausgedehnten Kristallgitters Zd ; und zur d Existenz des zugehörigen W-Maßes auf RZ muss also nur (A.40) gezeigt werden. Wir wollen dies an Hand eines weiteren konkreten Beispiels, das selbst von großer Bedeutung ist, belegen, nämlich der G AUSSschen W-Maße. Seien .A /2Pfin .Zd / eine Familie reeller, symmetrischer, strikt positiv definiter Matrizen. Mit anderen Worten, die Matrixelemente A .x; y/ erfüllen A .x; y/ D A .y; x/ 2 R; für alle x; y 2 ; und alle Eigenwerte von A sind strikt positiv. Wir definieren die H AMILTONfunktion H durch die von A induzierte quadrati-
Unendliche Produkte von Maßen und Statistische Mechanik
461
sche Form, X ˛ ˝ ˇ H Œ' WD ' ˇ A ' WD 'x A .x; y/ 'y ;
(A.42)
x;y2
und anschließend den speziellen Erwartungswert Z ˛ Y ˝ ˇ 1 exp ih ./ j ' i exp ˇ ' ˇ A ' d'x ; (A.43) F Œ WD Z x2
R d
für alle 2 RZ . Für diese W-Maße ist (A.36) bzw. (A.41) sogar schon äquivalent zur Existenz von (A.44) F Œ WD lim F Œ
%Zd
d
für alle 2 RZ ; die nur endlich viele nichtverschwindende Komponenten besitzen. Die rechte Seite in (A.43) ist jedoch ein G AUSSsches Integral, das wir durch quadratische Ergänzung leicht lösen können, 1 ˝ ˇˇ 1 ˛ A F Œ D exp 4ˇ ˇ Y Z i 1 1 ˇˇ i 1 Z exp ' ˇ A ˇˇA ' d'x 2 2 x2 R 1 ˝ ˇˇ 1 ˛ A : (A.45) D exp 4ˇ Somit folgt (A.44) und damit (A.36) für solche Familien quadratischer H AMIL TON funktionen bereits aus der Existenz des Limes ˇ ˝ ˛ lim ./ ˇ A1 (A.46) ./ %Zd
d
für alle 2 RZ ; die nur endlich viele nichtverschwindende Komponenten besitzen. Man kann sich nun leicht davon überzeugen, dass (A.46) durch uniforme Positivität der Matrizen A ; d. h. der Existenz einer Zahl > 0, sodass A 1; und Konvergenz der Matrixelemente AZd .x; y/ WD lim%Zd A .x; y/ für alle x; y 2 Zd gesichert ist. Wir schließen mit der Bemerkung, dass die Existenz des thermodynamischen Limes und die Untersuchung seiner Eigenschaften hinsichtlich der Abhängigkeit von 'x und 'y für weit voneinander entfernte Gitterpunkte x und y schon für die Summe der H AMILTONfunktionen (A.29) und (A.42), etwa X X 2 'x2 1 C J .'x 'y /2 ; (A.47) H Œ' WD x2
x;y2IjxyjD1
462
Unendliche Produkte von Maßen und Statistische Mechanik
mit J > 0; ein nicht mehr explizit lösbares, schwieriges und empfindlich von der Raumdimension d abhängiges Problem darstellt. Diese H AMILTONfunktion gehört zu den bekannten I SING-Modellen (für kontinuierliche Spins), die selbst schon eine große Vielfalt von Phänomenen beschreiben. Literatur: [8, 62].
Literaturverzeichnis
1. R. Abraham, J.E. Marsden, T. Ratiu: Manifolds, Tensor Analysis And Applications, 2 Auflg. (Springer, New York 1988) 2. R. Abraham, J.E. Marsden, T. Ratiu: Foundations of Mechanics (Benjamin, New York 1978) 3. N.I. Achieser, I.M. Glasmann: Theorie der linearen Operatoren im Hilbert-Raum (DeutschVerlag, Frankfurt a. M. 1977) 4. I. Agricola, Th. Friedrich: Globale Analysis – Differentialformen in Analysis, Geometrie und Physik (Vieweg, Braunschweig 2001) 5. H.W. Alt: Lineare Funktionalanalysis: Eine anwendungsorientierte Einführung, 5. Auflg. (Springer, Berlin 2006) 6. W.O. Amrein: Non-Relativistic Quantum Dynamics (Reidel, Dordrecht 1981) 7. V.I. Arnold: Mathematical Methods Of Classical Mechanics, 2. Auflg. (Springer, New York 1989) 8. H. Bauer: Wahrscheinlichkeitstheorie und Grundzüge der Maßtheorie, 3. Auflg. (de Gruyter, Berlin 1978) 9. Ch. Bär: Elementare Differentialgeometrie (de Gruyter, Berlin 2001) 10. R.L. Bishop, S.I. Goldberg: Tensor Analysis On Manifolds (McMillan, New York 1968) 11. W.M. Boothby: An Introduction to Differential Manifolds and Riemannian Geometry (Academic Press, New York 1986) 12. O. Bratteli, D.W. Robinson: Operator Algebras and Quantum Statistical Mechanics I, II, 2. Auflg., (Springer, New York 1987/1996) 13. Th. Bröcker, K. Jänich: Einführung in die Differentialtopologie (Springer, Berlin 1973) 14. W.L. Burke: Spacetime, Geometry, Cosmology (Univ. Sci. Books, Mill Valley 1980) 15. M. Carmeli: Classical Fields (Wiley, New York 2002) 16. S. Carroll: Spacetime and Geometry: An Introduction to General Relativity (AddisonWesley, San Francisco 2004) 17. H. Cartan: Differentialformen (BI, Mannheim 1974) 18. Y. Choquet-Bruhat, C. De Witt-Merette, M. Dillard-Bleck: Analysis, Manifolds and Physics (North Holland, Amsterdam 1977) 19. J.B. Conway: A Course in Functional Analysis (Springer, New York 1985) 20. W.D. Curtis, F.R. Miller: Differential Manifolds and Theoretical Physics (Academic Press, New York 1985) 21. W.F. Donoghue: Distributions and Fourier Transforms (Academic Press, New York 1969) 22. B.A. Dubrovin, A.T. Fomenko, S.P. Novikov: Modern Geometry – Methods and Applications I, II, III (Springer, New York 1984) 23. N. Dunford, J. Schwartz: Linear Operators I (Interscience, New York 1958) 24. N. Dunford, J. Schwartz: Linear Operators II (Interscience, New York 1969) 25. D.G.B. Edelen: Applied Exterior Calculus (Wiley, New York 1985) 26. G. Emch, C. Liu: The logic of thermostatistical physics (Springer, Berlin-Heidelberg 2002)
463
464
Literaturverzeichnis
27. L.C. Evans, R.F. Gariepy: Measure Theory and Fine Properties of Functions (CRC Press, Boca Raton 1992) 28. W.G. Faris: Selfadjoint Operators (Springer, Berlin 1972) 29. B. Felsager: Geometry, Particles and Fields (Springer, New York 1998) 30. H. Flanders: Differential Forms With Applications To The Physical Sciences (Academic Press, New York 1963) 31. Th. Frankel: The Geometry of Physics, 2.Auflg. (Cambridge University Press, Cambridge 2004) 32. Th. Frankel: Gravitational Curvature (Freeman, San Francisco 1979) 33. I.M. Gelfand, G.E. Schilow: Verallgemeinerte Funktionen (Distributionen) I: Verallgemeinerte Funktionen und das Rechnen mit ihnen, 2. Auflg. (Dt. Verl. der Wissenschaften, Berlin 1967) 34. J. Glimm, A. Jaffe: Quantum Physics: A Functional Integral Point of View (Springer, New York 1987) 35. M. Göckeler, T. Schücker: Differential Geometry, Gauge Theories and Gravity (Cambridge Univ. Press, Cambridge 1997) 36. K.-H. Goldhorn, H.-P. Heinz: Mathematik für Physiker, 3 Bde. (Springer, Berlin 2007/2008) 37. V. Guillemin, A. Pollack: Differential topology, (Prentice-Hall, Englewood Cliffs, NJ 1974) 38. S.J. Gustafson, I.M. Sigal: Mathematical Concepts of Quantum Mechanics (Springer, Berlin 2003) 39. R. Haag: Local Quantum Physics: Fields, Particles, Algebras (Springer, Berlin 1996) 40. P.R. Halmos: Measure Theory (van Nostrand Reinhold, New York 1972) 41. G. Hellwig: Differentialoperatoren der mathematischen Physik (Springer, Berlin 1964) 42. N. Hicks: Notes on Differential Geometry (Van Nostrand) 43. M.W. Hirsch: Differential Topology (Springer, New York 1976) 44. F. Hirzebruch, W. Scharlau: Einführung in die Funktionalanalysis (BI, Mannheim 1971) 45. P. Hislop, I.M. Sigal: Introduction to Spectral Theory. With Applications to Schrödinger Operators (Springer, New York 1996) 46. H. Holmann, H. Rummler: Alternierende Differentialformen, 2. Auflg. (BI, Mannheim 1981) 47. K. Jänich: Mathematik 2. Geschrieben für Physiker (Springer 2002) 48. K. Jänich: Vektoranalysis, 5. Auflg. (Springer, Berlin 2005) 49. K. Jänich: Topologie, 8. Auflg. (Springer, Berlin 2005) 50. K. Jänich: Lineare Algebra, 11. Auflg. (Springer, Berlin 2008) 51. W. Jantscher: Hilberträume (Akadem. Verlagsges., Wiesbaden 1977) 52. W. Jantscher: Distributionen (de Gruyter, Berlin 1971) 53. J.M. Jauch: Foundations of Quantum Mechanics (Addison-Wesley, Redding 1968) 54. S. Kobayashi, K. Nomizu: Foundations of Differential Geometry (Wiley) 55. E. Kreyszig: Introductory Functional Analysis with Applications (Wiley, New York 1978) 56. W. Kühnel: Differentialgeometrie: Kurven / Flächen / Mannigfaltigkeiten, 4. Auflg. (Vieweg, Wiesbaden 2005) 57. S. Lang: Differential Manifolds (Addison-Wesley, Reading, Mass. 1972) 58. J.M. Lee: Introduction to Smooth Manifolds (Springer, New York 2003) (BI, Mannheim 1966) 59. E.H. Lieb, M. Loss: Analysis (AMS, Providence, Rhode Island 1997) 60. M.J. Lighthill: Einführung in die Theorie der Fourier Analysis und verallgemeinerte Funktionen (BI, Mannheim 1966) 61. G.W. Mackey: Mathematical Foundations of Quantum Mechanics (W.A. Benjamin, New York 1963) 62. R.A. Minlos: Introduction to Mathematical Statistical Physics (AMS, Providence, RI 2000) 63. C.W. Misner, K.S. Thorne, J.A. Wheeler: Gravitation (Freeman, San Francisco 1973) 64. G.L. Naber: Topology, Geometry, and Gauge Fields I: Foundations (Springer, New York 1997) 65. G.L. Naber: Topology, Geometry, and Gauge Fields II: Interactions (Springer, New York 2000)
Literaturverzeichnis
465
66. M. Nakahara: Geometry, Topology and Physics, 2. Auflg. (Taylor&Francis, Boca Raton 2003) 67. R. Narasimhan: Analysis on Real and Complex Manifolds (North-Holland, New York 1968) 68. L.I. Nicolaescu: Lectures on the Geometry of Manifolds (World Scientific, Singapur 1999) 69. R. Oloff: Geometrie der Raumzeit – Eine mathematische Einführung in die Relativitätstheorie, 3. Auflg. (Vieweg, Wiesbaden, 2004) 70. B. O’Neill: Semi-riemannian Geometry With Applications To Relativity, 3. Auflg. (Academic Press, San Diego 1989 ) 71. E. Prugoveˇcki: Quantum Mechanics in Hilbert Space (Academic Press, New York 1971) 72. Rauch, J.: Partial Differential Equations (Springer, New York 1991) 73. M. Reed, B. Simon: Methods of Modern Mathematical Physics I: Functional Analysis, 2. Auflg. (Academic Press, London 1980) 74. M. Reed, B. Simon: Methods of Modern Mathematical Physics II: Fourier Analysis. SelfAdjointness (Academic Press, London 1975) 75. M. Reed, B. Simon: Methods of Modern Mathematical Physics III: Scattering Theory (Academic Press, London 1979) 76. M. Reed, B. Simon: Methods of Modern Mathematical Physics IV: Analysis of Operators (Academic Press, London 1978) 77. R. Riesz, B. Nagy: Vorlesungen über Funktionalanalysis (Deutscher Verlag der Wiss., Berlin 1956) 78. W. Rudin: Reelle und komplexe Analysis (Oldenbourgh, München 1999) 79. W. Rudin: Functional Analysis (Tata-MacGraw Hill, New Delhi 1979) 80. R.K. Sachs, H. Wu: General Relativity for Mathematicians (Springer, New York 1977) 81. M. Schechter: Operator Methods in Quantum Mechanics (North Holland, New York 1981) 82. F. Scheck: Theoretische Physik I, 8. Auflg. (Springer, Berlin 2007) 83. F. Scheck: Theoretische Physik II, 2. Auflg. (Springer, Berlin 2006) 84. F. Scheck: Theoretische Physik III, 2. Auflg. (Springer, Berlin 2006) 85. F. Scheck: Theoretische Physik IV, 2. Auflg. (Springer, Berlin 2007) 86. B.F. Schutz: Geometrical Methods of Mathematical Physics (Cambridge Univ. Press, Cambridge 1980) 87. L. Schwartz: Methoden der mathematischen Physik (BI, Mannheim 1965) 88. G.L. Sewell: Quantum Theory of Collective Phenomena (Clarendon Press, Oxford 1986) 89. G.L. Sewell: Quantum Mechanics and its Emergent Macrophysics (Princeton Univ. Press, Princeton 2002) 90. I.M. Singer, J.A. Thorpe: Lecture Notes on Elementary Topology and Geometry (Springer) 91. M. Spivak: Calculus On Manifolds: A Modern Approach To Classical Theorems Of Advanced Calculus (Benjamin, New York 1965) 92. N. Straumann: Allgemeine Relativitätstheorie und relativistische Astrophysik, 2. Auflg. (Springer, Berlin 1988) 93. R.F. Streater, A.S. Wightman: PCT, Spin, Statistics and All That (Benjamin, New York 1974) 94. A.S. Svarc: Topology for Physicists (Springer, Berlin Heidelberg 1994) 95. W. Thirring: Lehrbuch der mathematischen Physik I–IV (Springer, Wien 1979) 96. H. Triebel: Höhere Analysis (V E B Deutscher Verlag der Wissenschaften, Berlin 1972) 97. V.S. Varadarajan: Geometry of quantum theory, 2. Auflg. (Springer, New York 1985) 98. J. von Neumann: Mathematical Foundations of Quantum Mechanics, 12. Auflg. (Princeton Univ. Press, Princeton, NJ 1996) 99. C. von Westenholz: Differential Forms in Mathematical Physics (North Holland, Amsterdam 1986) 100. R.M. Wald: General Relativity (Univ. of Chicago Press) 101. W. Walter: Einführung in die Theorie der Distributionen (BI, Mannheim 1974) 102. J. Weidmann: Linear Operators in Hilbert Spaces (Springer, New York 1980) 103. S. Weinberg: Gravitation and Cosmology (Wiley, New York 1972) 104. D. Werner: Funktionalanalysis, 6. Auflg. (Springer, Berlin 2007) 105. H. Weyl: Raum, Zeit, Materie (Springer, Berlin 1970) 106. K. Yosida: Functional Analysis (Springer, Berlin 1965)
Sachverzeichnis
A
B
Abbildung C r -differenzierbare 17 multilineare 37 symplektische 181 abbrechende Folge 251 abgeschlossen 8 abgeschlossener Unterraum 211 Ableitung äußere kovariante 159 allgemeine kovariante 135 C ARTAN sche 90 eines Maßes 327 kovariante 130, 157 schwache 371 Abschluss 8 absolute Konvergenz 232 abzählbar xix adjungierter Operator 238 äquivalente Normen 222 Äquivalenzklasse 22, 204 Äquivalenzrelation 21 äußere Ableitung 90 äußere Potenz 43 äußere Regularität 310, 333 äußere kovariante Ableitung 159 äußeres Maß 305 äußeres Produkt 46 algebraisches Tensorprodukt 217, 219 Allgemeiner Darstellungssatz 237 alternierend 43 analytische Schar von Distributionen 411 antisymmetrisch 43 Atlas 12 Atlas, berandeter 82
Bahn 67 BANACH raum 201 Berührpunkt 8 berandete (differenzierbare) Mannigfaltigkeit 83 berandete Karten 83 berandeter Atlas 82 beschränkte Sesquilinearform 236 beschränkter linearer Operator 227 beschränktes lineares Funktional 228 B IANCHI -Identität erste 152 zweite 159 Bidual 234 Bidualraum 36 Bild 225 bilinear 38 Bilinearform nichtentartete 64 Bilinearformen 217 BLE-Theorem 229 Bogenlänge 145 B OREL-Algebra 306 B ORELmaß 307 B ORELmenge 306 von R 313 B OREL-messbar 306 C C ARATHÉODORY Kriterium von 307 Satz von 306 C ARTAN sche Ableitung 90 C AUCHY scher Hauptwert 408
467
468
Sachverzeichnis
C HRISTOFFEL-Symbole 132, 142 C k -differenzierbarer Atlas 13 C k -differenzierbare Struktur 13 D Definitionsbereich 225 Delta-Distribution 358 Derivations-Eigenschaft 24 D E S ITTER -Raumzeit 76 dicht 201 Dichte 327 diffeomorph 17 Diffeomorphismus 17, 82 Differential 26 Differentialform 57, 60 exakte 111 geschlossene 111 Differentialgleichung zweiter Ordnung 191 Differentialoperator, linearer 439 differenzierbar 17, 158 differenzierbare Mannigfaltigkeit 337 differenzierbare Struktur 83 D IRAC maß 302 D IRICHLETsche Randbedingungen 290 diskret 277 diskrete Topologie 6 Distribution 356 finite 363 homogene 383 singuläre 356 Distributionen reguläre 356 temperierte 356 Distributionsableitung, partielle 370 Divergenz 97, 158 duale Abbildung 36 duale Basis 34 Dualraum 34 topologischer 233, 356 Durchflussrate 106 dynamisches System 67 DYSON reihe 286 E Ebene hyperbolische 75 Eigenfunktion 118, 287 eines S TURM -L IOUVILLE-Problems Eigenraum 262 Eigenvektor 262 Eigenwert 262 eines S TURM -L IOUVILLE-Problems
289
289
Eigenzeit 145 Einbettung 19 Einbettungsoperator 252 Einschränkung einer Abbildung xix eines Maßes 302 E INSTEIN -Mannigfaltigkeit 161 E INSTEIN sche Summenkonvention 41 Endomorphismen xxi endpunktfest 147 Energie 146, 189 Energie-Impulstensor 157 Energiegleichung für Lichtteilchen 150 Energiegleichung für Masseteilchen 150 "-Umgebung 5 Erhaltungsgröße 184 erste B IANCHI -Identität 152 erste Resolventengleichung 265 Erwartungswert 332 erzeugte -Algebra 306 E ULER form 174 Evolutionsgleichungen 445 exakte Differentialform 111 F faltbar 353, 434 Faltung von Funktionen 353 FARADAY tensor 104 Faser 55 Faserableitung 170, 171 fast überall xix, 304 Feldstärketensor 104 finite Distribution 363 finite Form 393 finite Testfunktion 352 Flachmacher 15 Fluss 67 globaler 67 Flussdiffeomorphismus 69 Folgenstetigkeit 356 Form symplektische 175 Formel von D UHAMEL 448 Formeln von S OCHOZKI 410 F OURIER koeffizienten (einer periodischen Distribution) 382 F OURIER -P LANCHEREL-Operator 248 F OURIER reihe 202 F OURIER sche Umkehrformel 247 F OURIER transformation 245 F REDHOLM-Operator 282 F REDHOLMsche Alternative 281
Sachverzeichnis Fundamentallösung 440 des C AUCHY problems 446 Fundamentallemma der Variationsrechnung 361 Funktion harmonische 118 integrierbare 324 messbare 313 p-summierbare 208 quadratsummierbare 203 schwach messbare 348 summierbare 324 wesentlich beschränkte 209 Funktional beschränktes lineares 228 multilineares 219 stetiges lineares 356 G G AUSSsche Krümmung 128, 153 Geodätische 124, 172 geodätische Krümmung 124 geodätische Kurve 124 geschlossene Differentialform 111 geschlossene Mannigfaltigkeit 110 Geschwindigkeit 65 gleichorientiert 49 Gradient 96 symplektischer 183 Graph 114, 226 Graphenfläche 128 G REEN sche Formel 297 G REEN sche Funktion 291 G REEN scher Operator 291 G REEN sche Formel 109 H H ADAMARD scher Hauptwert 403, 412 H AMILTON funktion drehinvariante 196 H AMILTON sches Vektorfeld 183 harmonisch 118 Hauptkrümmungen 128 Hauptkrümmungsrichtungen 128 Hauptwert C AUCHY scher 408 H ADAMARD scher 403, 412 hausdorffsch 8 hermitescher Kern 288 H ILBERTraum 201 H ILBERT-Tensorprodukt 219 H ÖLDER sche Ungleichung 209, 330
469 Homöomorphismus 10 homogen 383 horizontal 131, 136 hyperbolische Ebene 75 hyperregulär 170, 171 I identische Abbildung xxi identischer Operator 232 Index (einer nichtentarteten Bilinearform) 65 Index (eines F REDHOLM-Operators) 282 innere Regularität 310, 333 innerer Punkt 8 inneres Produkt 41 Integral 317, 324 einer vektorwertigen Funktion 254 Integralgleichung adjungierte 283 F REDHOLMsche zweiter Art 283 mit stetigem Kern 283 Integralkurve 67 Integraloperator 283 Integrator 312 integrierbar 87, 324 invariant 370 inverse F OURIER transformation 248 inverser Operator 226 isolierter Punkt 277 Isometrie 134, 215 isometrisch 75, 134, 140, 141, 239 iterierter Kern 285 K kanonische 1-Form 176 kanonische Metrik 65 kanonische Transformation 181 kanonische Volumenform 85, 181 Karte 12 Karten, berandete 83 Kartenabbildung 12 Kartengebiet 12 Kartenwechsel 12 Kern 226 einer Integralgleichung 283 hermitescher 288 iterierter 285 Kettenregel für Distributionen 451 K ILLING -Vektorfeld 149 Klumpentopologie 6 Kommutator 71
470 kompakt 10, 201 kompakter Operator 273 Komplexeigenschaft 90 komplexer projektiver Raum 7 Komponenten 34, 38, 59 Komponentenfunktion 55 einer 1-Form 57 eines Tensorfelds 57, 58 Konstante der Bewegung 184, 195 Konstante, kosmologische 160 kontinuierliches Spektrum 262 Kontinuitätsgleichung 104 kontravariant 40 kontravariantes Tensorfeld 57 Konvergenz schwache 272 von Reihen 232 konvergiert 8 Koordinaten 12 Koordinatenabbildung 12 Koordinatenbasis 24, 59 Koordinatengebiet 12 Korand 111 kosmologische Konstante 160 KOSZUL-Formel 141 kovariante Ableitung 130, 157 allgemeine 135 kovariante Tensoren 38 Kovektoren 34 Kozykel 111 Krümmung 123, 150 G AUSSsche 128, 153 geodätische 124 mittlere 128 orientierte 123 orientierte geodätische 124 Krümmungsformel 161 Krümmungstensor 151 Kurve regulär parametrisierte 121 repräsentierende 20 L Länge 122 Lösungskurve 191 L AGRANGE Vektorfeld 189 L AGRANGEfunktion 172, 173 L EBESGUE-Maß 308 L EBESGUE -S TIELTJES-Maß 312 L EGENDREtransformierte 193 Lemma von FATOU 322 L EVI -C IVITA -Ableitung 142 lichtartig 145
Sachverzeichnis L IEalgebra 72 L IEklammer 71 L IE-Ableitung 69 L IE-Gruppe 30 Limes inferior 314 Limes superior 314 linearer Differentialoperator 439 linearer Operator 225 lineares Funktional 34, 226 Linearform 34, 226 Lösung des C AUCHY problems 446 logische Quantoren xvii lokal 18 lokal H AMILTON sches Vektorfeld 184 lokal euklidisch 12 lokal integrierbar 350 lokal verträglich 62 lokale Isometrie 72, 134 lokale Parametrisierung 12 lokaler Diffeomorphismus 17 L ORENTZmetrik 65 M Maß 301 Maßraum 301 vollständiger 304 Mannigfaltigkeit 13 symplektische 181 berandete 83 geschlossene 110 symplektische 175 maximal 67 Menge kompakte 10 messbare 301, 305 offene 5 messbar 87, 301, 305, 313, 324 L EBESGUE- 308 Minimalflächen 129 M INKOWSKI -Skalarprodukt 75 M INKOWSKI sche Sphäre 75 M INKOWSKI sche Ungleichung 208, 330 Mittelwert 332 sphärischer 416 mittlere Krümmung 128 multilineare Abbildung 37 multilineares Funktional 219 Multilinearform 38, 219 Multiplikationsoperator 252, 263 N Natürlichkeit des äußeren Produkts
61
Sachverzeichnis
471
negativer Teil (einer Funktion) 323 N EUMANN sche Reihe 232 n-Form integrierbare 87 nichtentartete Bilinearform 64 Norm 200 einer Sesquilinearform 237 eines linearen Funktionals 228 normal 239 Normaleneinheitsfeld 63, 84 orientierungsdefinierendes 64 Normalenfeld 63 Normalkoordinaten symplektische 180 Normalkrümmung 124 normierter linearer Raum 200 Nullmenge 87, 304 Nullraum 226 O offen 5, 168 offene Menge 5 Operator adjungierter 238 beschränkter H ERMITEscher 239 beschränkter linearer 227 beschränkter selbstadjungierter 239 identischer 232 inverser 226 isometrischer 239 kompakter 273 linearer 225 normaler 239 quasinilpotenter 294 unitärer 239 Operatornorm 227 Ordnung einer Distribution 386 orientierbar 62 orientiert 49 orientierte 63 orientierte geodätische Krümmung 124 Orientierung 62 orientierungserhaltend 62, 63, 122 orientierungsumkehrend 62, 63, 122 orthogonale Gruppe 18 orthogonale Projektion 243 Orthonormalbasis 202 Orthonormalsystem 202 P p-summierbare Funktion
208
parallel 131, 136 r- 138 Parallelogramm-Gleichung 200 Parallelverschiebung 138 PARSEVALsche Gleichung 248 partielle Distributionsableitung 370 P OINCARÉ Lemma 113 P OINCARÉ Scheibe 75 P OINCARÉ-Transformation 101 P OISSON klammer 186 polynomiales Wachstum 359 positiv orientiert 85 positiver Teil (einer Funktion) 323 positives lineares Funktional 337 Potential 111 Potenzmenge 302 Prähilbertraum 200 Prinzip von C AVALIERI 339 Prismenoperator 112 Produkt äußeres 46 inneres 41 Produktmaß 339 Produktregel 90 Produkttopologie 6, 28 Projektion orthogonale 243 stereographische 29 Propagator 446 Pseudo-R IEMANN sche Metrik 65 Punktspektrum 262 Q quadratsummierbare Funktionen quasinilpotent 294 quellenmäßig 289
203
R R ADON maß 333 Rand 82, 83 Randpunkt 8, 83 Rang 17 Raum hausdorffscher 8 komplexer projektiver 7 reeller projektiver 6 topologischer 5 Raumwinkelelement 115, 398 reeller projektiver Raum 6 regulär 170, 171 regulär parametrisierte Kurve 121 regulärer Wert 18, 262
472 Regularisierung 402 Regularität äußere 310, 333 innere 310, 333 repräsentierende Kurve 20 Residualspektrum 263 Resolvente 262 Resolventengleichung erste 265 zweite 266 Resolventenkern 286 Resolventenmenge 262 R ICCI -Kalkül 41 R ICCI -Abbildung 155 R ICCI -Krümmung 155 Richtungsableitung 24 R IEMANN -L EBESGUE-Lemma 246 R IEMANN scher Krümmungstensor 151 R IEMANN sche Metrik 65 R IEMANN sche Schnittkrümmung 153 R IEMANN -S TIELTJES-Integral 312 R IESZscher Darstellungssatz 235, 337, 387 Rotation 97 S Satz von B EPPO L EVI 322 von H AHN -BANACH 234 von M ALGRANGE -E HRENPREIS 443 von P LANCHEREL 248 von C ARATHÉODORY 306 von F UBINI 340 von F UBINI für Mannigfaltigkeiten 116 von H ILBERT-S CHMIDT 280, 288 von R ADON -N IKODYM 327 von R IESZ -F ISCHER 204 von R IESZ -S CHAUDER 277 von T ONELLI 341 von der dominierten Konvergenz 328 von der monotonen Konvergenz 318 von der offenen Abbildung 263 Schicht k-fache 401 Schichten 389 schnell fallende Testfunktionen 352 Schnitt 55 Schnittkrümmung 153, 154 schwach messbar 348 schwache Ableitung 371 schwache Konvergenz 272 schwacher Limes 272 S CHWARZsche Ungleichung 200
Sachverzeichnis S CHWARZSCHILD -Mannigfaltigkeit 152, 157 selbstadjungiert (= H ERMITEsch) 239 separabel 201 Sesquilinearform 236 beschränkte 236 -additiv 301 -Algebra 301 -endlich 339 singuläre Distribution 356 singulärer Wert 277, 287 Skalarkrümmung 155 Skalarprodukt 200 gewichtetes 293 S OCHOZKI , Formeln von 410 Spektralwert 263 Spektrum 263 kontinuierliches 262 Sphäre 28 M INKOWSKI sche 75 sphärischer Mittelwert 416 Spur 154 Stammformel 113 Standardabweichung 332 stark differenzierbar 253 stark konvergent 201 starke C AUCHY folge 201 starke Operatorkonvergenz 241 stereographische Projektion 29 sternförmig 113 stetig 9 stetiges lineares Funktional 356 Stochastik 331 Streuung 332 Struktur, differenzierbare 83 S TURM -L IOUVILLE-Probleme 289 Summe (einer Reihe) 232 summierbar 324 symmetrisch 42 symplektisch 181 symplektische Form 175 symplektische Mannigfaltigkeit 175, 181 symplektische Normalkoordinaten 180 symplektischer Gradient 183 symplektisches Volumen 181 T tangential äquivalent 20 Tangentialbündel 54 Tangentialraum 20 Tangentialvektor 20 Teilmannigfaltigkeit 15 Teilraumtopologie 6
Sachverzeichnis temperierte Distributionen 356 Tensor 217, 219 kontravarianter 40 kovarianter 38 Tensorfeld 57 differenzierbares 57 kontravariantes 57 stetiges 57 Tensorprodukt 38, 39, 45, 217 algebraisches 217, 219 von Distributionen 432 von Funktionen 429 von Vektoren 40 Testfunktion 349 finite 352 schnell fallende 352 Theorema egregium 135 Topologie 5 topologische Vektorräume 355 topologischer Dualraum 356 topologischer Raum 5 Torsion 139 torsionsfrei 139, 141 Träger 173, 308, 334, 388 einer Distribution 363 einer stetigen Funktion 78 Transformation kanonische 181 translationsinvariant 308 transponierter Differentialoperator trilinear 38 U Überdeckung 10 Umgebung 5, 8 Umparametrisierung 122 Ungleichung H ÖLDER sche 209, 330 M INKOWSKI sche 208, 330 Schwarzsche 200 unitär 239 Untermannigfaltigkeit 15 Untermannigfaltigkeitskarte 15 V Vakuumlösung 157 Variation 147
473 Vektorfeld 56 H AMILTON sches 183 differenzierbares 56 längs einer Abbildung 137 lokal H AMILTON sches 184 stetiges 56 Vektorpotential 111 Vektorräume, topologische 355 verallgemeinerte Lösung 439 verallgemeinerter Eigenwert 262 Verschiebeoperatoren 256 Verteilung 332 Verteilungsfunktion 333 Vervollständigung 215 von Maßräumen 304 Vielfachheit 262 vollständig 201 vollstetig 273 Volumen 88 symplektisches 181 Volumenform 50, 65 kanonische 181 W
439
Wachstum, polynomiales 359 Wahrscheinlichkeitsraum 331 W EINGARTEN operator 126 Wertebereich 225 wesentlich beschränkt 209 wesentliche Schranke 209 wesentlicher Wertebereich 294 wesentliches Supremum 209 Windungsform 115 Wirkung 189 Wirkungsfunktional 172 Z Zählmaß 302 zeitartig 145 Zerlegung der Eins 78, 309, 363 zufällige Variable 332 Zufallsgröße 332 zusammenziehbar 113 zweite B IANCHI -Identität 159 zweite Grundform 127 zweite Resolventengleichung 266
Springer-Lehrbuch
Für weitere Bände: http://www.springer.com/series/1183
Karl-Heinz Goldhorn · Hans-Peter Heinz Margarita Kraus
Moderne mathematische Methoden der Physik Band 2: Operator- und Spektraltheorie – Gruppen und Darstellungen
123
Dr. Karl-Heinz Goldhorn Johannes Gutenberg-Univ. Mainz FB 17 Mathematik Staudingerweg 9 55099 Mainz Deutschland [email protected]
Prof. Dr. Hans-Peter Heinz Universität Mainz Institut f. Mathematik Staudingerweg 9 55099 Mainz Deutschland [email protected]
PD Dr. Margarita Kraus Universität Mainz FB 8 Physik, Mathematik und Informatik Staudingerweg 9 55099 Mainz Deutschland [email protected]
ISSN 0937-7433 ISBN 978-3-642-05184-5 e-ISBN 978-3-642-05185-2 DOI 10.1007/978-3-642-05185-2 Springer Heidelberg Dordrecht London New York Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. c Springer-Verlag Berlin Heidelberg 2010 Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine Vervielfältigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland vom 9. September 1965 in der jeweils geltenden Fassung zulässig. Sie ist grundsätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Einbandentwurf: WMXDesign GmbH, Heidelberg Gedruckt auf säurefreiem Papier Springer ist Teil der Fachverlagsgruppe Springer Science+Business Media (www.springer.com)
Vorwort
In der Literatur über das mathematische Handwerkszeug des theoretischen Physikers scheint eine Lücke zu klaffen: Einerseits gibt es eine Reihe von hervorragenden Lehrbüchern zum Thema „Mathematik für Physiker“ für das Grundstudium, andererseits gibt es eine Fülle von ausgezeichneten Monographien über die mathematischen Grundlagen diverser physikalischer Theorien, meist verfasst von bekannten Fachvertretern aus der mathematischen Physik. Wir denken hier an Werke wie etwa [7, 10, 11, 14, 18, 26–28, 32, 35, 45, 59, 60, 62, 66–69, 78, 79, 85, 88] oder auch Klassiker wie [56, 90] oder [93]. Was uns aber zu fehlen scheint, ist ein Verbindungsstück zwischen diesen beiden Extremen, also ein Aufbaukurs, der es Studierenden im Hauptstudium oder graduierten Theoretikern erlaubt, mit begrenztem Aufwand einen fundierten Einstieg in die mathematischen Grundlagen der fortgeschrittenen Theorien zu gewinnen. Das zweibändige Werk, dessen zweiter Band hier vorliegt, versucht, diese Lücke zu schließen. Es beruht zum größten Teil auf Vorlesungen, die die Autoren in Mainz und Regensburg für Studierende der Physik im Hauptstudium gehalten haben. Als potentiellen Leserkreis haben wir aber nicht nur diese im Auge, sondern auch Studierende von Master-, Aufbau-, Graduierten- und Promotionsstudiengängen im Bereich der Physik, außerdem angehende mathematische Physiker, die von der Physik herkommen und möglichst zügig den Einstieg in die rigoros mathematische Behandlung der Probleme gewinnen möchten, und nicht zuletzt alle diejenigen unter den aktiven theoretischen Physikern, die das Bedürfnis verspüren, ein tieferes und klareres Verständnis ihrer mathematischen Werkzeuge zu gewinnen, dabei aber (verständlicherweise!) weder Zeit noch Muße finden, sich mit der mathematischen Fachliteratur und all ihren Beweisdetails ausführlich auseinanderzusetzen. Bei der großen und ständig wachsenden Vielfalt mathematischer Hilfsmittel, die in der modernen Physik Verwendung finden, war es natürlich nicht möglich, alle wichtigen Themen vollständig abzudecken, und, wie immer, bleibt die Stoffauswahl etwas subjektiv geprägt und ist von den Interessen und der wissenschaftlichen Ausrichtung der Autoren mitbestimmt. So wurden z. B. die statistische Physik und die nichtlineare Dynamik zugegebenermaßen stiefmütterlich behandelt. Im ersten Teil geben wir eine Einführung in die Differentialgeometrie – und damit auch in die moderne Formulierung der Tensorrechnung – als mathematische Grundlage für die klassische Mechanik, die klassische Feldtheorie und vor allem für die Relativiv
vi
Vorwort
tätstheorie. Die Präsentation ist hier insofern elementar gehalten, als dass affine Zusammenhänge nur in Gestalt ihrer kovarianten Ableitungsoperatoren auftreten und dass allgemeine Bündeltheorie und Prinzipalzusammenhänge gänzlich außen vor bleiben. Trotzdem reicht diese Einführung aus, um darauf aufbauend einen zwanglosen Einstieg in die moderne Gravitationsphysik oder die aktuellen Eichtheorien zu ermöglichen. Der zweite Teil von Band 1 befasst sich mit mathematischen Grundlagen der Quantenmechanik, die der Funktionalanalysis, der Integrationstheorie und der Distributionstheorie entstammen. Wiederum sind wir überzeugt, dass die Beschäftigung mit den vorgestellten Grundlagen einen leichten Zugang zu verschiedenen weiterführenden Themen ermöglicht, z. B. zur algebraischen Quantenfeldtheorie, zur Theorie der Pfadintegrale oder zur Verwendung von C ∗ -Algebren in der statistischen Physik. In diesem Band werden zwei der wichtigsten funktionalanalytischen Themen behandelt, nämlich die unbeschränkten Operatoren und die Spektralzerlegung von H ERMITEschen Operatoren. Den Abschluss dieses Bandes wird dann eine gründliche, doch recht elementare Diskussion von Gruppen und ihren Darstellungen im Hinblick auf ihre Rolle als mathematische Beschreibung von Symmetrien und Invarianzen in der Quantenphysik bilden. Den Schluss des ersten Bandes bildet ein Anhang, den Prof. V. Bach (Mainz) dankenswerterweise beigesteuert hat und in dem an einem konkreten Beispiel aufgezeigt wird, wie gewisse weiterführende Konzepte der allgemeinen Maß- und Integrationstheorie in der statistischen Physik Verwendung finden. Ferner behandeln wir im ersten Teil als Anwendung des dort entwickelten differentialgeometrischen Kalküls koordinatenfreie Formulierungen der klassischen Mechanik, der M AX WELL gleichungen und der E INSTEIN schen Feldgleichungen. In den Teilen II bis IV verzichten wir jedoch weitgehend auf konkrete physikalische Beispiele, abgesehen von einigen Bemerkungen über die statistische Interpretation der Quantenmechanik in Teil III und über die Entartung von Energieniveaus infolge von Symmetrien des H AMILTONoperators in Teil IV, beschränken uns aber ansonsten auf Andeutungen. Wir gehen davon aus, dass die behandelten mathematischen Themen dem Leser schon in irgendeiner Form bei seiner Beschäftigung mit Physik untergekommen sind (oder noch unterkommen werden) und betrachten es als unsere Aufgabe, die uns Mathematikern antrainierte rigorose Denkweise dazu zu nutzen, von den entsprechenden Begriffen und Resultaten ein klares, unzweideutiges Bild zu geben. Der Bezug zur Physik spiegelt sich hier vorwiegend in der Stoffauswahl wieder – so stehen z. B. bei unserer Einführung in die Funktionalanalysis die H ILBERTräume deutlich im Vordergrund, da sie in der Physik eine ungleich größere Rolle spielen als andere topologische Vektorräume, und in Teil IV werden wir uns selbstverständlich auf diejenigen konkreten Gruppen konzentrieren, die für die Betrachtung von Symmetrien und Invarianzen in der Physik relevant sind. Die gerade angesprochene streng mathematische Denkweise darf natürlich nicht dazu verleiten, alles detailliert beweisen zu wollen, wie man das bei einem Lehrbuch für angehende Mathematiker tun würde. Vielmehr haben wir uns – ähnlich wie bei unserem Grundkurs [34], in dem das hier vorliegende Buch auch schon angekündigt
Vorwort
vii
wurde – von dem Gedanken leiten lassen, dass ein mathematischer Beweis nur dann angebracht ist, wenn er gleichzeitig eine Rechentechnik demonstriert und einüben hilft, die bei den physikalischen Anwendungen wirklich vorkommt. Häufig ist die Beweistechnik, die für ein tieferliegendes mathematisches Resultat benötigt wird, jedoch von ganz anderem Charakter als die Technik seiner Anwendung, und in solchen Fällen beschränken wir uns auf eine bloße Skizze der maßgeblichen Ideen oder sogar auf ein Literaturzitat, das als Quellennachweis zu verstehen ist und nicht unbedingt als eine Aufforderung, sich mit der betreffenden Literatur aktiv auseinanderzusetzen. Auch im Übrigen verfolgen wir ähnliche didaktische Prinzipien wie sie schon in [34] zugrunde gelegt wurden, versuchen also, uns auf das Wesentliche zu konzentrieren, Langatmigkeit zu vermeiden und in wenigen wohlgesetzten Worten ein klares Bild von den Dingen zu vermitteln. Unterstützt wird dieses Bemühen durch eine große Zahl von Übungsaufgaben. Sie dienen teilweise dem Einüben von Rechentechniken, der Gewöhnung an abstrakte Begriffe, indem man diese an konkreten Beispielen diskutiert, und hier und da auch der kurzgefassten Behandlung von zusätzlichem Stoff. Zahlreiche Hinweise unterstützen die Lösung der Übungsaufgaben, so dass die erfolgreiche Behandlung einer Aufgabe nicht daran scheitern sollte, dass einem ein bestimmter raffinierter Trick gerade nicht eingefallen ist. Trotz der vielen verschiedenen mathematischen Sachgebiete (und trotz dreier verschiedener Autoren) haben wir versucht, generell einheitliche Notationen durchzuhalten, und die meisten dieser Bezeichnungen sind in einem vorbereitenden Abschnitt zusammengefasst und mit kurzen Erläuterungen versehen. Dies hat uns auch Gelegenheit gegeben, einige der benötigten Vorkenntnisse anzusprechen. Grundsätzlich sollte das Buch für alle zugänglich sein, die einen dreisemestrigen mathematischen Grundkurs für Physiker absolviert haben, wie er in Deutschland weitgehend üblich ist. Man wird uns nachsehen, dass wir bei Verweisen auf solche Vorkenntnisse unser eigenes Lehrbuch [34] zitieren, und wir sind überzeugt, dass niemandem, der seine Vorkenntnisse aus anderer Quelle bezieht, hieraus ein Nachteil erwächst. Schließlich möchten wir Professor Volker Bach unseren gebührenden Dank aussprechen, nicht nur für den von ihm beigesteuerten Artikel über unendliche Produkte von Maßen und statistische Mechanik, sondern auch für viele hilfreiche, interessante und bereichernde Gespräche. Unser Dank gilt überdies Professor Florian Scheck, der die Entstehung auch dieses Werkes mit Unterstützung und Ermutigung begleitet hat. Martin Huber hat kompetent und zuverlässig die Zeichnungen angefertigt, und das Umsetzen der Manuskripte in LaTeX-Quelltext wurde in ebenso kompetenter und zuverlässiger Weise von Renate Emerenziani und Ulrike Jacobi besorgt. Ihnen allen gilt unser aufrichtiger Dank.
Mainz, Mai 2010
Karl-Heinz Goldhorn Hans-Peter Heinz Margarita Kraus
Inhaltsverzeichnis
Teil III Unbeschränkte Operatoren und Spektralzerlegung 14 Unbeschränkte Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 A Abgeschlossene lineare Operatoren . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 B Beispiele: Multiplikations- und Differentialoperatoren . . . . . . . . . . . . 7 C Resolvente und Spektrum bei unbeschränkten Operatoren . . . . . . . . . 13 D Der adjungierte Operator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 E Symmetrische und selbstadjungierte Operatoren . . . . . . . . . . . . . . . . . 25 15 Spektralmaße . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A Motivierende Vorbemerkungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B Spektralmaße und Spektralintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . C Die C ∗ -Algebra der beschränkten messbaren Funktionen . . . . . . . . . . D Spektralintegrale von unbeschränkten messbaren Funktionen . . . . . . 16 Der Spektralsatz für selbstadjungierte Operatoren und die quantenmechanische Dynamik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A Der stetige Funktionalkalkül . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . B Der messbare Funktionalkalkül und die Spektralzerlegung für beschränkte selbstadjungierte Operatoren . . . . . . . . . . . . . . . . . . . . . . . C Unbeschränkte selbstadjungierte Operatoren . . . . . . . . . . . . . . . . . . . . D Unitäre Transformationsgruppen und die S CHRÖDINGERgleichung .
37 37 42 53 59
67 68 76 89 96
Teil IV Gruppen und Darstellungen 17 Grundsätzliches über Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 A Gruppen und Homomorphismen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118 B Symmetrie als Invarianz unter einer Gruppenoperation . . . . . . . . . . . . 126 18 Drehgruppe und L ORENTZgruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 A Die Gruppe SO(3) der räumlichen Drehungen . . . . . . . . . . . . . . . . . . . 147 ix
x
Inhaltsverzeichnis
B C D E F
Die L ORENTZgruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 Parametrisierung der L ORENTZgruppe . . . . . . . . . . . . . . . . . . . . . . . . . 153 Die Gruppen SU(2) und SL(2, C) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 Die Überlagerungsabbildung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159 Quaternionen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 166
19 L IE-Gruppen und L IE-Algebren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173 A Exponentialfunktion und Logarithmus von Matrizen . . . . . . . . . . . . . . 175 B Lineare L IE-Gruppen und allgemeine L IE-Gruppen . . . . . . . . . . . . . . 177 C Die L IE-Algebra einer L IE-Gruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 D Einige spezielle L IE-Algebren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193 20 Grundbegriffe der Darstellungstheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 A Definition und einfache Eigenschaften einer Darstellung . . . . . . . . . . 208 B Irreduzible und vollreduzible Darstellungen . . . . . . . . . . . . . . . . . . . . . 215 C Symmetrien des H AMILTONoperators . . . . . . . . . . . . . . . . . . . . . . . . . . 219 21 Darstellungstheorie kompakter Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . 229 A Das H AAR-Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 231 B Unendlich-dimensionale Darstellungen . . . . . . . . . . . . . . . . . . . . . . . . . 239 C Irreduzible Darstellungen kompakter Gruppen . . . . . . . . . . . . . . . . . . . 243 D Orthogonalitätsrelationen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246 E Vollständigkeit des Orthonormalsystems der Matrixelemente . . . . . . . 251 F Ein Vollständigkeitskriterium . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259 22 Die infinitesimale Methode in der Darstellungstheorie . . . . . . . . . . . . . 271 A Darstellungen von L IE-Algebren . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272 B Weitere Eigenschaften der Exponentialfunktion . . . . . . . . . . . . . . . . . . 274 C Beziehungen zwischen den Darstellungen von G und L(G) . . . . . . . . 277 D Lokale und globale Homomorphismen . . . . . . . . . . . . . . . . . . . . . . . . . 280 23 Die irreduziblen Darstellungen von SU(2) und SO(3) . . . . . . . . . . . . . . . 293 A Realisierung der irreduziblen Darstellungen . . . . . . . . . . . . . . . . . . . . . 294 B C LEBSCH -G ORDAN-Zerlegung und Vollständigkeit . . . . . . . . . . . . . . 298 C Die irreduziblen Darstellungen der L IE-Algebren von SU(2) und SO(3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300 D Die kanonische Basis einer irreduziblen Darstellung von su(2) . . . . . 301 E Ausreduktion einer gegebenen Darstellung . . . . . . . . . . . . . . . . . . . . . . 307 24 Einige Anwendungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315 A Kugelfunktionen und infinitesimale Drehungen . . . . . . . . . . . . . . . . . . 315 B Rotationssymmetrie eines Zwei-Teilchen-Systems . . . . . . . . . . . . . . . 323
Inhaltsverzeichnis
C D
xi
C LEBSCH-G ORDAN-Koeffizienten und W IGNER -E CKART-Theorem 325 Axialsymmetrische Störungen eines kugelsymmetrischen Potentials . 330
Literaturverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335 Sachverzeichnis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 339
Teil III
Unbeschränkte Operatoren und Spektralzerlegung
Kapitel 14
Unbeschränkte Operatoren
Die Grundlagen der Funktionalanalysis, die wir in den Kap. 7, 8 und 9 besprochen haben, sind zwar unverzichtbar – eben weil sie Grundlagen darstellen – aber sie reichen für viele Situationen, die in den physikalischen Anwendungen auftreten, nicht aus. Ein Beispiel von zentraler Bedeutung sind die Observablen in der Quantenmechanik, die meist durch unbeschränkte H ERMITEsche Operatoren dargestellt werden. Unbeschränkte Operatoren treten auch bei der mathematischen Behandlung von partiellen Differentialgleichungen aus den verschiedensten Bereichen der klassischen und der modernen Physik auf, und so kommen wir nicht umhin, uns mit diesem – zunächst etwas unnatürlich anmutenden – Typ von Operatoren näher zu befassen. Nun könnte man meinen, die Unbeschränktheit eines Operators rühre nur davon her, dass man auf den betrachteten Räumen die falschen Normen gewählt hat. Sind nämlich E, F normierte lineare Räume und ist A : E → F ein linearer Operator, so kann man auf E die neue Norm x A := x + Ax (die sog. Graphennorm) einführen, und dann ist A beschränkt, denn offenbar ist Ax ≤ x A für alle x ∈ E. Ist H ein Prähilbertraum und A : H → H , so wählt man die modifizierte Graphennorm 1/2 x A := x2 + Ax2 und erhält so einen neuen Prähilbertraum, von dem aus gerechnet A ebenfalls beschränkt ist. Die neue Norm rührt ja von dem Skalarprodukt x|y A := x|y + Ax|Ay her. Tatsächlich kann man mit diesem einfachen Trick einige der Resultate über beschränkte Operatoren auf unbeschränkte übertragen, aber die wirklich wichtigen Probleme bekommt man so nicht in den Griff. Es zeigt sich, dass man für K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_14, C Springer-Verlag Berlin Heidelberg 2010
3
4
14 Unbeschränkte Operatoren
eine erfolgreiche Behandlung von unbeschränkten Operatoren diejenigen in den Vordergrund stellen sollte, die einen abgeschlossenen Graphen haben. Dies geschieht in Abschn. A, und in B illustrieren wir die eingeführten Grundbegriffe durch konkrete Beispiele von der Art, wie sie in Anwendungen auftreten. In Abschn. C verallgemeinern wir die elementare Spektraltheorie aus Kap. 9 soweit wie möglich auf unbeschränkte Operatoren, und ab Abschn. D konzentrieren wir uns auf die Situation, die für die Quantenphysik bei weitem die wichtigste ist, nämlich auf unbeschränkte Operatoren im H ILBERTraum. Hier ist entscheidend, dass man den adjungierten Operator sinnvoll definieren und von H ERMITEschen Operatoren sprechen kann. Wir diskutieren insbesondere die Unterscheidung zwischen symmetrischen und selbstadjungierten Operatoren, die zwar in der Praxis meist ignoriert, jedoch von theoretischen Physikern auch immer wieder angemahnt wird, und wir versuchen, diesen Unterschied und seine Bedeutung durch präzise Definitionen und erhellende Beispiele völlig klar zu machen. Von den – oft schwierigen und tiefschürfenden – Untersuchungen, die in der modernen mathematischen Physik in diesem Zusammenhang angestellt wurden und werden, berichten wir am Schluss einige Resultate.
A Abgeschlossene lineare Operatoren Eine Verallgemeinerung der beschränkten Operatoren sind die abgeschlossenen Operatoren. Seien E, F BANACHräume, A : E ⊃ D(A) −→ F ein linearer Operator. Dann ist der Graph von A G(A) = {(x, Ax) | x ∈ D(A)}
(14.1)
eine Teilmenge des kartesischen Produktes E × F. Dieses wird durch (x1 , y1 ) + (x2 , y2 ) := (x1 + x2 , y1 + y2 )
(14.2)
λ(x, y) := (λx, λy) 1/2 (x, y) := x2E + y2F
(14.3) (14.4)
für x, x1 , x2 ∈ E, y, y1 , y2 ∈ F, λ ∈ C, zu einem BANACHraum. Definitionen 14.1 Ein linearer Operator A : E ⊃ D(A) −→ F heißt ein abgeschlossener Operator, wenn eine der folgenden äquivalenten Bedingungen erfüllt ist. a. Der Graph G(A) ist ein abgeschlossener Teilraum von E × F. b. Ist (xn ) eine Folge mit xn ∈ D(A), xn −→ x ∈ E, Axn −→ y ∈ F , so gilt x ∈ D(A) und y = Ax.
A
Abgeschlossene lineare Operatoren
5
Es ist eine leichte Übung, die Äquivalenz der beiden Bedingungen zu zeigen. Beispiel: Sei E = F = C([a, b]) der Raum der stetigen Funktionen auf dem Intervall [a, b] (vgl. Beispiel 7.6a). Der Operator A := d/dx mit dem Definitionsbereich D(A) := C 1 ([a, b]) ist bekanntlich nicht beschränkt (Aufgabe 8.4a). Aber er ist abgeschlossen, denn wenn (u k ) ⊆ C 1 ([a, b]) eine Folge ist, für die u k → u und Au k = u k → v gleichmäßig auf [a, b], so ist v stetig, u differenzierbar und u = v nach wohlbekannten Resultaten aus der elementaren Analysis (etwa aus [34], Kap. 14). Also ist u ∈ C 1 ([a, b]) = D(A) und Au = v, wie verlangt. Einen Zusammenhang zwischen den abgeschlossenen und den beschränkten Operatoren liefert der folgende Satz: Theorem 14.2 (Satz vom abgeschlossenen Graphen) Seien E, F BANACHräume, A : E ⊇ D(A) −→ F ein linearer Operator. Dann gilt: a. Ist A abgeschlossen und ist D(A) abgeschlossen, so ist A beschränkt. b. Ist A beschränkt, so ist A genau dann abgeschlossen, wenn D(A) abgeschlossen ist. Beweis a. Wenn G(A) und D(A) abgeschlossen sind, dann sind beide nach Satz 7.10 BANACHräume. Die beiden linearen Operatoren P : G(A) −→ D(A)
mit
P(x, Ax) = x,
Q : G(A) −→ F
mit
Q(x, Ax) = Ax
sind offenbar stetig. Ferner ist P bijektiv. Daher ist P −1 nach dem sog. Satz von der offenen Abbildung beschränkt. (Dieser fundamentale Satz wird in jedem Lehrbuch der Funktionalanalysis bewiesen.) Folglich ist A = Q P −1 ebenfalls stetig. b. Sei jetzt A stetig. Die Menge D(A) ist genau dann abgeschlossen, wenn für jede konvergente Folge (xn ) ⊆ D(A) auch der Limes zu D(A) gehört. Sind aber xn ∈ D(A) so, dass xn −→ x, so gilt Axn −→ y ∈ F, da F vollständig ist. Daher ist die Abgeschlossenheit von D(A) äquivalent zu Bedingung b. aus 14.1. Nun versuchen wir, einen beliebigen linearen Operator A : E ⊇ D(A) −→ F zu einem abgeschlossenen Operator fortzusetzen. Zunächst definieren wir: Definitionen 14.3 a. Für zwei lineare Operatoren A, B mit D(A), D(B) ⊆ E und R(A), R(B) ⊆ F schreiben wir A⊂B:
⇐⇒ ⇐⇒
G(A) ⊆ G(B) D(A) ⊆ D(B) und Ax = Bx ∀ x ∈ D(A).
(14.5)
6
14 Unbeschränkte Operatoren
Das bedeutet also, dass A eine Einschränkung von B bzw. B eine Fortsetzung (= Erweiterung) von A ist. b. Der Operator A heißt abschließbar, wenn er eine abgeschlossene Fortsetzung B ⊃ A besitzt. Um eine abgeschlossene Erweiterung von A zu finden, betrachten wir Folgen xn ∈ D(A)
mit
xn −→ x, Axn −→ y.
Man könnte dann einen Operator A ⊃ A definieren, indem man setzt Ax := y = lim Axn . n−→∞
Der Operator A wäre dann nach Bedingung 14.1b automatisch abgeschlossen. Das Problem jedoch ist, dass es Operatoren A gibt mit D(A) xn −→ x , D(A) xn −→ x ,
aber lim Axn = y = y = lim Axn . n→∞
n→∞
Für solche Operatoren funktioniert der oben beschriebene Prozess nicht. Er funktioniert aber, sobald die nachstehend in 14.4a formulierte Zusatzbedingung erfüllt ist (man wende sie auf vn = xn − xn an!), und dann kann man die kleinste abgeschlossene Fortsetzung einführen: Satz 14.4 a. Ein linearer Operator A : E ⊇ D(A) −→ F ist genau dann abschließbar, wenn aus vn ∈ D(A), vn −→ 0 und Avn −→ w immer folgt w = 0. b. Für einen abschließbaren Operator A existiert genau ein Operator A mit G(A) = G(A), der sogenannte Abschluss. Für ihn gilt: D(A) = {x ∈ E | ∃ (xn ) ⊆ D(A) : xn −→ x, (Axn ) konvergent in F} , (14.6) Ax := y := lim Axn , n−→∞
falls xn −→ x.
(14.7)
Beweis Nur die Notwendigkeit der Bedingung aus a. ist noch zu zeigen. Sei also vn → 0 , Avn → w, und sei B ⊃ A abgeschlossen. Dann folgt w = lim Avn = lim Bvn = B0 = 0. n→∞
n→∞
Bemerkung Der Raum E ist außerhalb von D(A) für den linearen Operator A eigentlich uninteressant. Deshalb betrachtet man meist nur dicht definierte Operatoren:
B
Beispiele: Multiplikations- und Differentialoperatoren
7
Definition 14.5 Der lineare Operator A : E ⊃ D(A) −→ F heißt dicht definiert, falls D(A) = E. Z. B. ist der Operator A = d/dx aus dem auf 14.1 folgenden Beispiel dicht definiert, denn nach dem W EIERSTRASSschen Approximationssatz ([34], Kap. 29) ist sogar C ∞ ([a, b]) dicht in C([a, b]).
B Beispiele: Multiplikations- und Differentialoperatoren Wegen ihrer grundsätzlichen Bedeutung diskutieren wir zwei Typen von Beispielen etwas ausführlicher, nämlich die Multiplikationsoperatoren und die Differentialoperatoren. Wir beginnen mit den Multiplikationsoperatoren: Satz 14.6 Sei 1 ≤ p < ∞ und E = L p (X, A, μ), wo (X, A, μ) ein Maßraum ist (vgl. Abschn. 10.34). Sei f : X −→ K eine beliebige A-messbare Funktion. Der Operator M f : D(M f ) −→ E mit D(M f ) := {u ∈ E | f u ∈ E} ,
(M f u)(x) := f (x)u(x)
ist dann abgeschlossen und dicht definiert. Beweis (i) Um zu zeigen, dass M f abgeschlossen ist, betrachten wir eine Folge (u k ) ⊆ D(M f ) mit u k → u , M f u k = f u k → v in E. Nach Übergang zu einer Teilfolge können wir dann annehmen, dass u k (x) → u(x) und f (x)u k (x) → v(x) μ-f.ü. (Dies wird im Zusammenhang mit dem Satz von R IESZ -F ISCHER bewiesen – vgl. Abschn. 10.34 und die in Beispiel 7.6c angegebene Literatur.) Nun folgt v(x) = f (x)u(x) μ-f.ü., also f u = v ∈ E und damit u ∈ D(M f ) , v = M f u. (ii) Um zu zeigen, dass D(M f ) in E dicht ist, betrachten wir die messbaren Mengen Am := {x | | f (x)| ≤ m} , Dann ist X =
∞
m=1
m ∈ N.
Am . Wir betrachten
D0 := {u ∈ E | ∃m : u ≡ 0 f.ü. in X \ Am }. Für u ∈ D0 ist dann mit geeignetem m ∈ N p p |u| p dμ < ∞, | f u| dμ ≤ m X
also f u ∈ E und damit u ∈ D(M f ). Wir haben also D(M f ) ⊇ D0 und brauchen daher nur zu zeigen, dass D0 dicht ist. Jedes v ∈ E ist aber der punktweise Limes der Funktionen vχ Am ∈ D0 , also genügt es, zu zeigen, dass lim v − vχ Am p = 0.
m→∞
8
14 Unbeschränkte Operatoren
Dies folgt jedoch direkt aus dem Satz von der dominierten Konvergenz, denn |v − vχ Am | p = (1 − χ Am ) p |v| p ≤ |v| p
∀ m.
Bemerkung Meist wird der Multiplikationsoperator M f einfach mit f bezeichnet, und man überlässt es dem Leser, an Hand des Kontexts zu entscheiden, ob die Funktion f selbst gemeint ist oder der von ihr in irgendeinem gerade betrachteten Raum E definierte Multiplikationsoperator. Wird z. B. ein quantenmechanisches System von N Teilchen durch Wellenfunktionen aus L 2 (R3N ) beschrieben, so haben diese Teilchen insgesamt 3N Ortskoordinaten x1 , . . . , x3N , und der Ortsoperator xi ist dann nichts anderes als der Multiplikationsoperator M f in E = L 2 (R3N ) für die Funktion f (x1 , . . . , x3N ) := xi . Er hat den Definitionsbereich
D(xi ) = ψ ∈ L 2 (R3N ) xi2 |ψ(x)|2 d3N x < ∞ ,
(14.8)
und er ist nach obigem Satz abgeschlossen und dicht definiert. Sei nun Ω ⊆ Rn ein Gebiet. Wie in Definition 13.13 betrachten wir einen linearen Differentialoperator L(x, D) :=
aα (x)D α ,
|α|≤m
D=
∂ ∂ ,..., ∂ x1 ∂ xn
.
(14.9)
mit Koeffizienten aα ∈ C ∞ (Ω) sowie den transponierten Operator
L T (x, D)ϕ :=
(−1)|α| D α (aα ϕ)
(14.10)
|α|≤m
Sowohl für die moderne Theorie der partiellen Differentialgleichungen als auch für die Quantenmechanik ist es von zentraler Bedeutung, solche Operatoren als dicht definierte lineare Operatoren in Räumen vom Typ E = L p (Ω) , 1 ≤ p < ∞, aufzufassen, vor allem für p = 2. Die Distributionstheorie macht es uns leicht, dies zu tun, denn wegen L p (Ω) ⊆ L 1loc (Ω) kann man jedes Element u ∈ L p (Ω) mit der entsprechenden regulären Distribution [u] ∈ D (Ω) identifizieren und so L p (Ω) als linearen Teilraum von D (Ω) auffassen. Mit dieser Vereinbarung definieren wir: Definitionen 14.7 Sei 1 ≤ p < ∞, und sei L(x, D) ein Differentialoperator mit C ∞ -Koeffizienten in Ω. Eine L p -Realisierung von L(x, D) ist eine Einschränkung auf einen dichten Teilraum D(L) von L p (Ω) so, dass L = L(x, D) D(L)
u ∈ D(L)
⇒
L(x, D)u ∈ L p (Ω).
B
Beispiele: Multiplikations- und Differentialoperatoren
9
Die maximale L p -Realisierung L max ist die mit dem Definitionsbereich D(L max ) = {u ∈ L p (Ω) | L(x, D)u ∈ L p (Ω)}, und die minimale L p -Realisierung L min ist die mit dem Definitionsbereich D(L min ) = D(Ω). Offenbar ist L min ⊂ L max , und wegen Theorem 11.9 ist klar, dass L min – also erst recht L max – dicht definiert ist, wie wir es von einer Realisierung verlangen. Wir haben: Satz 14.8 Für jeden linearen Differentialoperator mit C ∞ -Koeffizienten in Ω und jedes p ∈ [1, ∞[ gilt: L max ist abgeschlossen, und L min ist abschließbar in L p (Ω). Beweis Sei (u k ) ⊆ D(L max ) eine Folge mit u k → u und L max u k = vk → v in L p (Ω). Für jede Testfunktion ϕ ∈ D(Ω) ist dann auch L T (x, D)ϕ ∈ D(Ω) und somit L(x, D)u, ϕ = u, L T (x, D)ϕ = lim u k , L T (x, D)ϕ = lim vk , ϕ = v, ϕ , k→∞
k→∞
d. h. die Distributionen v und L(x, D)u stimmen überein. Wegen v ∈ L p (Ω) bedeutet dies: u ∈ D(L max ) und L max u = v. Daher ist L max abgeschlossen, und dann muss L min abschließbar sein, denn es hat ja die abgeschlossene Erweiterung L max . Den Abschluss von L min bezeichnen wir mit L 0 , schreiben also L 0 := L min ,
(14.11)
wobei natürlich aus dem Kontext heraus klar sein muss, auf welchen Raum L p (Ω) und auf welchen Differentialoperator L = L(x, D) sich dies bezieht. Im Allgemeinen ist es schwierig, die Definitionsbereiche D(L max ) und D(L 0 ) explizit zu bestimmen. Wir tun dies daher auch nur im allereinfachsten Beispiel, nämlich für ein beschränktes Intervall Ω =]a, b[⊆ R1 und den Differentialoperator L(x, D) := d/dx. Dazu führen wir die folgenden Funktionenräume ein: Definition 14.9 Sei a < b , 1 ≤ p ≤ ∞. Mit H 1, p [a, b] bezeichnen wir den KVektorraum aller Funktionen u : [a, b] −→ K, die als gleichmäßiger Limes u = limm→∞ u m einer Folge (u m ) ⊆ C ∞ ([a, b]) geschrieben werden können, für die gilt: u m ∈ D(]a, b[) für alle m, und die Folge (u m ) konvergiert in L p (]a, b[). Damit ist klar, dass alle Funktionen u ∈ H 1, p [a, b] stetig sind, d. h. H 1, p [a, b] ist ein linearer Teilraum von C[a, b]. Bemerkung Mit der Norm u1, p := a
b
(|u(x)| p + |u (x)| p ) dx
1/ p
10
14 Unbeschränkte Operatoren
wird H 1, p [a, b] zu einem BANACHraum, und dieser ist ein einfaches Beispiel für einen sog. S OBOLEWraum. Diese und ähnliche Funktionenräume spielen für die moderne Theorie der partiellen Differentialgleichungen eine zentrale Rolle, doch können wir hierauf nicht näher eingehen. Vgl. etwa [3, 52, 65, 66, 73, 92, 95]. Satz 14.10 Sei a < b und 1 ≤ p < ∞. Für die L p -Realisierungen des Differentialoperators L(x, D) = d/dx auf Ω =]a, b[ gilt: a. D(L max ) = H 1, p [a, b] und 1, p b. D(L 0 ) = H0 [a, b] := {u ∈ H 1, p [a, b] | u(a) = u(b) = 0}.
Beweis a. Wir erinnern daran, dass C ∞ ([a, b]) der Vektorraum aller derjenigen C ∞ Funktionen u auf ]a, b[ ist, bei denen sich u selbst sowie alle seine Ableitungen stetig auf ganz [a, b] fortsetzen lassen. Insbesondere ist also C ∞ ([a, b]) ⊆ D(L max ). Ist nun u = limm→∞ u m gleichmäßig auf [a, b], wobei die Folge (u m ) ⊆ C ∞ ([a, b]) die in der Definition von H 1, p [a, b] genannten Eigenschaften hat, und ist v der L p -Limes der u m , so ist (u, v) ∈ G(L max ), denn u − u m p ≤ (b − a)1/ p u − u m ∞ −→ 0. Da L max abgeschlossen ist, folgt u ∈ D(L max ) und v = L max u ist die schwache (= distributionelle) Ableitung von u. Nun sei umgekehrt u ∈ D(L max ), und u = L max u ∈ L p (]a, b[) sei seine schwache Ableitung. Nach Theorem 11.9 ist u der L p -Limes einer Folge (ϕm ) ⊆ D(Ω), und wir definieren
x
vm (x) :=
ϕm (t) dt ,
a≤x ≤b
a
für m ∈ N. Diese Funktionen bilden im BANACHraum C([a, b]) eine C AUCHYfolge. Denn mittels der H ÖLDERschen Ungleichung erkennt man, dass für alle x ∈ [a, b] |vm (x) − vn (x)| ≤
x
|ϕm (t) − ϕn (t)| dt
a
≤ (x − a)1/q
x
1/ p |ϕm (t) − ϕn (t)| p dt
a
≤ (b − a)1/q ϕm − ϕn p mit 1/q = 1 − 1/ p. Das ergibt
B
Beispiele: Multiplikations- und Differentialoperatoren
11
vm − vn ∞ ≤ (b − a)1/q ϕ m − ϕn p
≤ (b − a)1/q ϕm − u p + u − ϕn p
→0
für m, n → ∞, also die C AUCHY-Eigenschaft. Es existiert daher der gleichmäßige Limes v := limm→∞ vm , und er ist auch der L p -Limes. Nun haben wir = ϕ , also vm m lim vm − v p = 0 ,
m→∞
lim vm − u p = 0.
m→∞
Da L max abgeschlossen ist, folgt v ∈ D(L max ) und v = u , also (v − u) = 0 im Sinne der Distributionen. Aber nach Aufgabe 11.16d folgt hieraus, dass u−v eine konstante Funktion c ist. Für die C ∞ -Funktionen u m := c + vm haben wir daher in L p , d. h. u ∈ H 1, p [a, b]. u = limm→∞ gleichmäßig und u = limm→∞ vm b. Sei u ∈ D(L 0 ). Wegen L 0 ⊂ L max , also D(L 0 ) ⊆ D(L max ) = H 1, p [a, b] genügt es, zu zeigen, dass u(a) = u(b) = 0. Nach (14.6), (14.7) gibt es eine Folge (ψm ) ⊆ D(L min ) = D(]a, b[) mit ψm −→ u ,
ϕm := ψm −→ u
in L p (]a, b[). Dann ist ψm (x) =
x
ϕm (t) dt
für a ≤ x ≤ b,
a
und damit können wir für die ψm so argumentieren wie in Teil a. für die vm , finden also, dass die Folge (ψm ) gleichmäßig gegen ein ψ ∈ C([a, b]) konvergiert. Aber die gleichmäßige Konvergenz impliziert die L p -Konvergenz, und der L p -Limes ist eindeutig bestimmt. Also ist ψ = u, und damit ist u(a) = limm→∞ ψm (a) = 0 und ebenso für u(b). 1, p Nun sei umgekehrt u ∈ H0 [a, b] vorausgesetzt, und sei (u m ) eine entsprechende Folge wie in der Definition von H 1, p [a, b], also u − u m ∞ , u − u m p −→ 0 für m → ∞. Insbesondere ist lim u m (a) = u(a) = 0 ,
m→∞
lim u m (b) = u(b) = 0.
m→∞
Wähle eine Testfunktion η ∈ D(]a, b[) mit
b
η dt = 1 und setze
a
ψm (x) := u m (x) − u m (a) − (u m (b) − u m (a)) a
x
η dt
12
14 Unbeschränkte Operatoren
für a ≤ x ≤ b , m ∈ N. Dann ist ψm = u m − (u m (b) − u m (a))η, also ψm ∈ D(]a, b[) und außerdem u − ψm ∞ , u − ψm p −→ 0 für m → ∞. Schließlich ist ψm (a) = ψm (b) = 0 nach Definition, und wenn wir δm > 0 so klein wählen, dass Tr u m ∪ Tr η ⊆]a + δm , b − δm [, so muss ψm auf den Intervallen [a, a + δm ] und [b − δm , b] konstant sein, also verschwinden. Daher ist ψm ∈ D(]a, b[) = D(L min ), und nun zeigt (14.6), dass u ∈ D(L 0 ). Für die Bedürfnisse der Quantenmechanik reicht es allerdings nicht aus, nur Differentialoperatoren mit C ∞ -Koeffizienten zu betrachten. Schon der H AMILTONoperator eines Teilchens im C OULOMB-Potential, also H ψ = −Δψ −
2 ψ, |x|
x ∈ R3
hat seine Koeffizienten nicht mehr in C ∞ (R3 ), sondern nur in C ∞ (R3 \{0}), und etwa bei Systemen von N Teilchen hat man sogar höherdimensionale Untermannigfaltigkeiten von R3N als Träger von Singularitäten der Koeffizienten des H A MILTON operators. Die Definition einer maximalen L 2 -Realisierung stößt dann auf Schwierigkeiten, doch eine minimale abgeschlossene L 2 -Realisierung L 0 kann immer noch gebildet werden, und, wie sich noch zeigen wird, ist dies für die Quantenmechanik i. A. auch die günstige Wahl. Zur näheren Erläuterung kehren wir wieder zu unserem allgemeineren Rahmen zurück und betrachten L p -Realisierungen des durch (14.9) gegebenen Differentialoperators, jetzt aber unter den Voraussetzungen aα ∈ C |α| (Ω) für |α| > 0 ,
a0 ∈ L 1loc (Ω).
(14.12)
Unter diesen Voraussetzungen ist der transponierte Operator durch (14.10) wohldefiniert als ein Operator L T (x, D) : D(Ω) −→ L 1loc (Ω) ⊆ D (Ω), und man bestätigt mittels Produktintegration die erwartete Beziehung Ω
L(x, D)ϕ (x)ψ(x) dx =
ϕ(x) L (x, D)ψ (x) dx T
Ω
∀ ϕ, ψ ∈ D(Ω). (14.13)
C
Resolvente und Spektrum bei unbeschränkten Operatoren
13
Damit kann man nun leicht folgendes beweisen: Satz 14.11 Sei 1 ≤ p < ∞. Wenn L(x, D) die Voraussetzungen (14.12) erfüllt, so ist die minimale L p -Realisierung L min mit dem Definitionsbereich D(L min ) = D(Ω) abschließbar. Es existiert also L 0 := L min als abgeschlossener Operator in L p (Ω). Beweis Wir prüfen die Abschließbarkeit mittels Satz 14.4a. Sei also (vk ) eine L p Nullfolge mit wk := L(x, D)vk −→ w in L p (Ω). Für jedes feste ψ ∈ D(Ω) haben wir dann nach der H ÖLDERschen Ungleichung einerseits wψ dx − ≤ w ψ dx |w − wk | · |ψ| dx ≤ C0 w − wk p −→ 0 k Ω
Ω
Ω
und andererseits wk ψ dx = vk L T (x, D)ψ dx ≤ C1 vk p −→ 0 Ω
Ω
mit Konstanten C0 , C1 , die nur von ψ abhängen. Also ist w, ψ = 0 für alle ψ ∈ D(Ω) und damit nach Theorem 11.17 w ≡ 0 f.ü., wie gewünscht.
C Resolvente und Spektrum bei unbeschränkten Operatoren Die Definitionen und Sätze aus Abschn. 9A können mit geringfügigen Änderungen auf unbeschränkte Operatoren übertragen werden. Um unnötigen technischen Schwierigkeiten aus dem Weg zu gehen, beschränken wir uns dabei auf abgeschlossene Operatoren A : E ⊇ D(A) −→ E in einem komplexen BANACHraum E. Für solch einen Operator übernehmen wir alle Definitionen und Bezeichnungen aus 9.1 wörtlich, wobei natürlich D(A − λI ) = D(A) zu setzen ist (λ ∈ C). Wieder sind in der dort gegebenen Liste alle Fälle abgedeckt, denn wenn A abgeschlossen ist, so ist es auch B := A − λI , und im Fall der Injektivität folgt hieraus, dass R A (λ) = B −1 abgeschlossen ist, denn G(B −1 ) = {(y, x) | (x, y) ∈ G(B)}. Auf B −1 kann man also Theorem 14.2 anwenden, und dies zeigt: λ ∈ ρ(A)
⇐⇒
N (A − λI ) = {0}, R(A − λI ) dicht, (A − λI )−1 beschränkt
⇐⇒
N (A − λI ) = {0} , R(A − λI ) = E.
(14.14)
14
14 Unbeschränkte Operatoren
Den Ausgangspunkt für die weitere Diskussion bildet nun die folgende triviale Verallgemeinerung von Satz 9.4: Satz 14.12 Sei S ∈ B(E), sei L : E ⊇ D(L) −→ E linear und bijektiv mit beschränkter Inverse L −1 ∈ B(E), und es gelte S L −1 < 1
und
L −1 S < 1.
(14.15)
Dann ist L + S ein bijektiver linearer Operator D(L) −→ E, und es gilt (L + S)−1 =
∞
(−1)n L −1 (S L −1 )n
n=0
=
∞
(−1)n (L −1 S)n L −1 .
(14.16)
n=0
Nun kann man leicht die folgenden Aussagen beweisen, indem man die Beweise der entsprechenden Aussagen aus 9A imitiert: Theorem 14.13 Für jeden abgeschlossenen Operator A in E gilt: a. Die Resolventenmenge ρ(A) ist offen. Mit λ0 ∈ ρ(A) gehört die Kreisscheibe der λ ∈ C mit |λ − λ0 |
0 so, dass | f (x) − λ| < c/2 für x ∈ Uδ (x0 ) ⊆ Ω. Wegen Bedingung (T) ist m := μ(Uδ (x0 )) > 0, und weil es sich um ein R ADONmaß handelt, ist m ≤ μ(Bδ (x0 )) < ∞. Daher ist u := χUδ (x0 ) ∈ L p (Ω, dμ) und u p = m 1/ p > 0, also p
p
c p u p ≤ ( f − λ)u p =
Uδ (x0 )
| f (x) − λ| p dμ ≤
mit der absurden Konsequenz c ≤ c/2. Also ist λ ∈ f (Ω).
c p 2
p
u p
Auch die Beschreibungen von σC (M f ) und σ P (M f ) aus Beispiel 9.2b kann man leicht auf die gegenwärtige Situation verallgemeinern (Übung!)
16
14 Unbeschränkte Operatoren
b. Die L 2 -Realisierungen von Differentialoperatoren mit konstanten Koeffizienauf Multiplikationsoperatoten lassen sich mittels der F OURIERtransformation ren zurückführen. Sei also L(ξ ) = cα ξ α ein Polynom in den Variablen |α|≤m ξ = (ξ1 , . . . , ξn ), und sei L(D) = cα D α der entsprechende Differential|α|≤m
operator. Mit Theorem 11.33c errechnet man sofort, dass für jede temperierte Distribution T ∈ Sn gilt F[L(D)T ] = L(iξ )F[T ] .
(14.19)
(vgl. auch den Beweis von Satz 13.17). Fasst man nun Elemente von L 2 (Rn ) als temperierte Distributionen auf, so ergibt die F OURIERtransformation F : Sn → Sn , wie wir hinter Theorem 11.33 erläutert haben, gerade den F OURIER P LANCHEREL-Operator U : L 2 (Rn ) → L 2 (Rn ), ebenso für F −1 und U −1 . Für u ∈ L 2 (Rn ) schreiben wir uˆ = U u = F[u] und haben dann L(D)u ∈ L 2
⇐⇒
F[L(D)u] ∈ L 2
⇐⇒
L(iξ )uˆ ∈ L 2
sowie L(iξ )u(ξ ˆ ) = [U L(D)u](ξ ), und das bedeutet U L(D)max U −1 = M f
mit f (ξ ) := L(iξ ).
(14.20)
Das Spektrum der maximalen L 2 -Realisierung von L(D) kann daher mittels Satz 14.14 sofort aus dem vorigen Beispiel abgeleitet werden, und man erhält σ (L max ) = f (Rn )
mit f (ξ ) := L(iξ ) .
(14.21)
Bemerkung Die wichtigsten Spezialfälle sind der L APLACE-Operator L = −Δ, der in der Quantenmechanik die kinetische Energie vertritt, und die Komponenten pi := −i∂/∂ xi des Impulsoperators. Man bekommt: σ (−Δ) = [0, ∞[ ,
σ ( pi ) = R.
(14.22)
Systeme von linearen partiellen Differentialgleichungen mit konstanten Koeffizienten können durch vektorwertige Polynome wiedergegeben werden, und hierfür kann man ähnliche Überlegungen anstellen. In der Physik ist dies vor allem für die D IRACgleichung wichtig (vgl. [87]). c. Wir demonstrieren nun noch an einem einfachen Beispiel, dass das Spektrum stark vom Definitionsbereich abhängt. Dazu betrachten wir den „Impulsoperator“ Lu := −iu auf dem kompakten Intervall I = [a, b] im Raum E = C(I ).
D
Der adjungierte Operator
17
Wählen wir den maximalen Definitionsbereich D(L max ) = C 1 (I ), so haben wir für jedes λ ∈ C den Eigenvektor u(x) = eiλx , also ist σ (L max ) = σ P (L max ) = C. Aber auch auf den Definitionsbereichen D(L 1 ) = {u ∈ C 1 (I ) | u(a) = 0} , D(L 0 ) = {u ∈ C 1 (I ) | u(a) = u(b) = 0} entstehen abgeschlossene Operatoren, wie man sich leicht überzeugt. Für jedes f ∈ C(I ) , λ ∈ C hat die Anfangswertaufgabe −iu − λu = f ,
u(a) = 0
aber die eindeutige Lösung (Variation der Konstanten!) u(x) = i
x
eiλ(x−s) f (s) ds .
a
Die Zuordnung f −→ u ist offenbar ein beschränkter linearer Operator S : E → E, und wir haben S(L − λI ) f = (L − λI )S f = f für alle f ∈ E. d. h. S ist die Resolvente S = R L 1 (λ), und so zeigt es sich, dass σ (L 1 ) leer ist. Schließlich gehört u = S f genau dann zu D(L 0 ), wenn u(b) = 0, also wenn
b
eiλ(x−s) f (s) ds = 0,
a
und diese Bedingung definiert für jedes λ ∈ C einen echten linearen Teilraum von E. Also ist L 0 − λI niemals surjektiv, somit σ (L 0 ) = σ R (L 0 ) = C. Bemerkung Mit etwas mehr analytischem Aufwand kann man dieselben Überlegungen auch für die Räume L p (I ) , 1 ≤ p < ∞ und insbesondere für den H ILBERTraum L 2 (I ) anstellen, wobei statt C 1 (I ) der S OBOLEW-Raum H 1, p (I ) aus Satz 14.10 zu nehmen ist. Das liegt daran, dass gewöhnliche lineare Differentialgleichungen im Bereich der Distributionen nur die klassischen Lösungen haben (Aufgabe 11.17).
D Der adjungierte Operator Im Folgenden sei H immer ein komplexer H ILBERTraum. Ist dann T ∈ B(H ) ein beschränkter Operator, so existiert nach Theorem 8.19 ein eindeutiger adjungierter Operator T ∗ ∈ B(H ) mit x | T y = T ∗ x | y
für alle x, y ∈ H ,
(14.23)
wobei gilt: T ∗ = T .
(14.24)
18
14 Unbeschränkte Operatoren
Wesentlich haben wir dabei den verallgemeinerten R IESZschen Darstellungssatz 8.18 benutzt, den wir auf die beschränkte Sesquilinearform h(x, y) := T y | x
(14.25)
angewandt haben. Ist nun A : D(A) −→ H
mit D(A) ⊆ H
kein beschränkter Operator, so ist Ay | x keine beschränkte Sesquilinearform, so dass man etwas sorgfältiger vorgehen muss, um einen adjungierten Operator A∗ zu definieren. Satz und Definition 14.16 Sei A : H ⊇ D(A) −→ H
mit D(A) = H
(14.26)
ein dicht definierter linearer Operator. Sei D ∗ die Menge der y ∈ H , zu denen es z ∈ H gibt mit y | Ax = z | x
für alle x ∈ D(A).
(14.27)
Dann gilt: a. D ∗ ist ein linearer Teilraum von H und zu jedem y ∈ D ∗ gibt es genau ein z ∈ H , für das (14.27) gilt. b. Setzt man z := A∗ y
für y ∈ D ∗
(14.28)
so ist A∗ ein linearer Operator in H mit D(A∗ ) = D ∗ , der sogenannte adjungierte Operator zu A. c. Es gilt y | Ax = A∗ y | x
(14.29)
für alle x ∈ D(A), y ∈ D(A∗ ). Beweis a. Wir zeigen zunächst die Eindeutigkeit von z in (14.27). Angenommen es gibt z 1 , z 2 ∈ H mit z 1 | x = y | Ax = z 2 | x
D
Der adjungierte Operator
19
für ein y ∈ D ∗ und alle x ∈ D(A). Dann folgt z 1 − z 2 | x = 0
∀ x ∈ D(A),
d. h. z 1 − z 2 ∈ D(A)⊥ . Nach Satz 7.14a ist aber D(A)⊥ = {0}. Um zu zeigen, dass D ∗ ein linearer Teilraum ist, seien y1 , y2 ∈ D ∗ , α, β ∈ C gewählt. Dann gibt es eindeutige z 1 , z 2 ∈ H , so dass yi | Ax = z i | x
für alle x ∈ D(A)
und i = 1, 2. Damit folgt αy1 + βy2 | Ax = αy1 | Ax + βy2 | Ax = αz 1 | x + βz 2 | x = αz 1 + βz 2 | x für alle x ∈ D(A), d. h. zu y := αy1 + βy2 gehört das z = αz 1 + βz 2 , das (14.27) erfüllt. Daher ist αy1 + βy2 ∈ D ∗ . b. Wegen der Eindeutigkeit von z in (14.27) ist A∗ y := z als Abbildung wohldefiniert und, wie in a. gerade gezeigt, gilt αy1 + βy2 −→ αz 1 + βz 2 = α A∗ y1 + β A∗ y2 , was die Linearität von A∗ zeigt. c. (14.29) ist die Kombination von (14.27) und (14.28). Wir stellen nun einige einfache Eigenschaften des adjungierten Operators zusammen: Satz 14.17 Seien A, B dicht definierte Operatoren in H . a. b. c. d.
Ist A ⊂ B, so ist B ∗ ⊂ A∗ . Ist D(A∗ ) = H , so gilt A ⊂ A∗∗ . N (A∗ ) = R(A)⊥ . Ist A injektiv und R(A) = H , so ist A∗ injektiv mit (A∗ )−1 = (A−1 )∗ .
e. Ist D(AB) = {x ∈ D(B) | Bx ∈ D(A)} dicht in H , so gilt: B ∗ A∗ ⊂ (AB)∗ .
20
14 Unbeschränkte Operatoren
˜ = U (D(A)), so ist A˜ ∗ = f. Ist U ∈ B(H ) unitär und A˜ := U AU −1 mit D( A) ∗ −1 UA U . g. Ist B ∈ B(H ), so ist (A+ B)∗ = A∗ + B ∗ . Dabei ist D(A+ B) = D(A) , D(A∗ + B ∗ ) = D(A∗ ). Beweis a. Gelte A ⊂ B, d. h. (14.5). Nach (14.29) gilt dann für y ∈ D(B ∗ ) , x ∈ D(A) ⊆ D(B) B ∗ y | x = y | Bx = y | Ax , d. h. jedes y ∈ D(B ∗ ) gehört zu D(A∗ ), und es gilt A∗ y = B ∗ y
für y ∈ D(B ∗ ).
b. Ist A∗ dicht definiert, so existiert A∗∗ und D(A∗∗ ) besteht aus allen y ∈ H , zu denen ein z ∈ H existiert mit z | x = y | A∗ x
(14.30)
für alle x ∈ D(A∗ ). Für jedes y ∈ D(A) trifft dies nach (14.29) aber zu, und zwar mit z = Ay. D. h. jedes y ∈ D(A) gehört zu D(A∗∗ ) und Ay = A∗∗ y
für y ∈ D(A).
c. y ∈ R(A)⊥ bedeutet, dass z = 0 die Bedingung (14.27) erfüllt. d. Ist A injektiv und R(A) dicht in H , so existiert A−1 und ist dicht definiert. Daher existiert (A−1 )∗ . Ferner ist N (A∗ ) = R(A)⊥ = {0}, also existiert auch (A∗ )−1 . Die Übereinstimmung der beiden Operatoren prüft man am bequemsten mittels Graphen nach: Nach Definition ist G((A−1 )∗ ) = {(y, z) | y | A−1 v = z | v ∀ v ∈ R(A)} und G((A∗ )−1 ) = {(y, z) | z | Ax = y | x ∀ x ∈ D(A)}. Da A eine Bijektion von D(A) auf R(A) ist, stimmen diese beiden Mengen überein. e. Sei nun D(AB) dicht in H , so dass (AB)∗ existiert. Für x ∈ D(AB) und y ∈ D(B ∗ A∗ ) folgt dann B ∗ A∗ y | x = y | ABx ,
D
Der adjungierte Operator
21
d. h. also y ∈ D((AB)∗ ) und (AB)∗ y = B ∗ A∗ y. f. Nach e. ist A˜ ∗ = (U AU −1 )∗ ⊃ U A∗ U −1 (man beachte U −1 = U ∗ ). Aber A = ˜ −1 mit dem unitären Operator V := U −1 , also ist auch A∗ ⊃ V A˜ ∗ V −1 ⊃ V AV V U A∗ U −1 V −1 = A∗ , und damit herrscht Gleichheit. g. Ist y ∈ D(A∗ + B ∗ ) = D(A∗ ), so ist für jedes x ∈ D(A + B) = D(A) y | (A + B)x = y | Ax + y | Bx = A∗ y + B ∗ y | x , also y ∈ D((A + B)∗ ) und (A + B)∗ y = A∗ y + B ∗ y. Dies zeigt, dass A∗ + B ∗ ⊂ (A + B)∗ . Anwendung dieses Arguments auf A1 := A + B und B1 := −B zeigt dann aber, dass D((A + B)∗ ) = D(A∗1 ) = D(A∗1 + B1∗ ) ⊆ D((A1 + B1 )∗ ) = D(A∗ ) = D(A∗ + B ∗ ) und damit die Behauptung. Entscheidend für die H ILBERTraumtheorie der unbeschränkten Operatoren sind die im folgenden Satz angegebenen Zusammenhänge zwischen dem adjungierten Operator und dem Abschluss eines dicht definierten Operators. Vor allem Teil c. des Satzes verdient Beachtung: Satz 14.18 Sei A in H dicht definiert. Dann gilt: a. A∗ ist ein abgeschlossener Operator. b. Ist A abschließbar, so ist (A)∗ = A∗ .
(14.31)
c. D(A∗ ) ist genau dann dicht in H , wenn A abschließbar ist. In diesem Fall ist A = A∗∗ .
(14.32)
Beweis a. Seien yn ∈ D(A∗ ) und gelte yn −→ y, A∗ yn −→ z. Für alle x ∈ D(A) ist yn | Ax = A∗ yn | x . Grenzübergang n −→ ∞ liefert dann
22
14 Unbeschränkte Operatoren
y | Ax = z | x
für alle x ∈ D(A),
d. h. y ∈ D(A∗ ) und A∗ y = z. Also ist A∗ abgeschlossen nach Definition 14.1. b. Aus A ⊂ A¯ folgt A¯ ∗ ⊂ A∗ (Satz 14.17a). Betrachte also y ∈ D(A∗ ) und x ∈ ¯ = limn→∞ Axn . Dann ¯ etwa x = limn→∞ xn mit (xn ) ⊆ D(A) und Ax D( A), ist ¯ A∗ y | x = lim A∗ y | xn = lim y | Axn = y | Ax n→∞
n→∞
und damit y ∈ D( A¯ ∗ ) sowie A¯ ∗ y = A∗ y. c. Sei zunächst D(A∗ ) dicht in H . Dann existiert A∗∗ und A ⊂ A∗∗ nach Satz 14.17b. Ferner ist A∗∗ abgeschlossen nach Teil a. Somit besitzt A die abgeschlossene Erweiterung A∗∗ . Nun sei A als abschließbar vorausgesetzt und T := A. Betrachte die Menge C := {(x, y) ∈ H × H | x | T ∗ v = y | v ∀ v ∈ D(T ∗ )}. Aus der Definition von T ∗ folgt sofort, dass G(T ) ⊆ C. Wir versehen den Vektorraum H × H mit dem Skalarprodukt (x, y) | (u, v) := x | u + y | v ,
(14.33)
wodurch er ebenfalls ein H ILBERTraum wird. Außerdem ist C bezüglich der entsprechenden Norm abgeschlossen in H × H , also selbst ein H ILBERTraum. Da G(T ) abgeschlossen ist, gilt nach Theorem 7.13b. C = G(T ) ⊕ (G(T )⊥ ∩ C) . Betrachte nun ein (ξ, η) ∈ G(T )⊥ ∩ C. Für alle x ∈ D(T ) ist dann nach (14.33): 0 = ξ | x + η | T x , also η | T x = −ξ | x . Das aber bedeutet, dass η ∈ D(T ∗ ) , T ∗ η = −ξ . In der Definition von C können wir daher v = η wählen. Da (ξ, η) ∈ C ist, folgt −ξ | ξ = η | η , also ξ 2 = η2 = 0. Wir haben somit G(T )⊥ ∩ C = {(0, 0)}, also C = G(T ). Nun betrachte w ∈ D(T ∗ )⊥ . Dann ist w | v = 0 = 0 | T ∗ v , also (0, w) ∈ C = G(T ) und damit w = T 0 = 0. Somit ist D(T ∗ )⊥ = {0}, also D(T ∗ ) = H . Insbesondere existiert T ∗∗ , und es ist C = G(T ∗∗ ) nach Definition von C. Nun folgt T = T ∗∗ , also nach Teil b. auch A = T = A∗∗ .
D
Der adjungierte Operator
23
Beispiele 14.19 a. Wir betrachten einen beliebigen Maßraum (X, A, μ), eine messbare Funktion f : X → C und die Multiplikationsoperatoren M f , M f¯ mit f bzw. f im H ILBERTraum H = L 2 (X, A, μ) (vgl. Satz 14.6). Wegen | f | = | f | ist
2 2 D := D(M f ) = u ∈ H | f | |u| dμ < ∞ = D(M f¯ ), und für u, v ∈ D ergibt sich f¯uv dμ = M f¯ u | v , u | M f v = u¯ f v dμ = d. h. M ∗f ⊃ M f¯ . Es gilt aber sogar: Behauptung M ∗f = M f¯ . Beweis Nur noch M ∗f ⊂ M f¯ ist zu zeigen. Sei also u ∈ D(M ∗f ) und w := M ∗f u , w1 := f¯u. Dann ist w ∈ H , aber von w1 weiß man zunächst nur, dass es eine messbare Funktion ist. Setze Am := {x | | f (x)| ≤ m} für m ∈ N wie im Beweis von Satz 14.6. Wegen |χ Am f | ≤ m ist dann χ Am u ∈ D und χ Am w1 = χ Am f¯u ∈ H für alle m. Daher kann man für jedes v ∈ D folgendermaßen rechnen: χ Am w1 | v = u¯ f v dμ = u | M f (χ Am v) = M ∗f u | χ Am v Am wv ¯ dμ = χ Am w | v , = Am
also χ Am w1 − χ Am w | v = 0 für alle v ∈ D. Da D dicht ist, folgt hieraus, χ Am w1 = χ Am w als Elemente von H = L 2 (X, A, μ), d. h. w1 = w μ-f.ü. ∞ auf Am . Wegen X = m=1 Am folgt nun w1 = w ∈ H , und das bedeutet u ∈ D , M ∗f u = f¯u = M f¯ u. b. Sei L(x, D) der durch (14.9) gegebene Differentialoperator in der offenen Menge Ω ⊆ Rn . Für ϕ, ψ ∈ D(Ω) ist dann ϕ | L(x, D)ψ = L + (x, D)ϕ | ψ
(14.34)
mit dem formal adjungierten Differentialoperator L + (x, D)ϕ :=
|α|≤m
(−1)|α| D α (aα ϕ).
(14.35)
24
14 Unbeschränkte Operatoren
Sind die Koeffizienten reell, so stimmt er natürlich mit dem transponierten Operator (14.10) überein. Außerdem gilt stets L ++ = L ,
(14.36)
wie man direkt nachrechnet (z. B. wie in Aufgabe 13.10). Wir betrachten nun die L 2 -Realisierungen dieser beiden Differentialoperatoren und versuchen, die dazu adjungierten Operatoren zu berechnen. Wir beginnen mit der minimalen Realisierung L min von L(x, D). Die Bedingung (u, v) ∈ G((L min )∗ ) bedeutet, dass u, v ∈ H := L 2 (Ω) sind und v | ψ = u | L(x, D)ψ Wegen w | ψ = umformulieren in
Ω
∀ ψ ∈ D(L min ) = D(Ω).
wψ ¯ dx = w, ¯ ψ für w ∈ H , ψ ∈ D(Ω) kann man dies
v, ¯ ψ = u, ¯ L(x, D)ψ = L T (x, D)u, ¯ ψ = L + (x, D)u, ψ für alle ψ. D. h. (u, v) ∈ G((L min )∗ ) bedeutet, dass u ∈ H und dass die Distribution L + (x, D)u = v ∈ H ist. Nach Definition der maximalen Realisierung bedeutet dies aber, dass (u, v) ∈ G((L + )max ), und wir bekommen (L min )∗ = (L + )max .
(14.37)
(L 0 )∗ = (L + )max ,
(14.38)
Mit (14.31) folgt daraus auch
∗ ∗∗ = L . Wendet man dies auf L + und mit (14.32) folgt weiter (L + 0 max ) = (L 0 ) statt L an und beachtet (14.36), so ergibt sich
(L max )∗ = (L + )0 .
(14.39)
Beim Adjungieren wird also zwischen der maximalen und der minimalen abgeschlossenen Realisierung gewechselt, und diese sind i. A. durchaus verschieden, wie wir schon in Satz 14.10 an einem Beispiel gesehen haben. c. Hat der Differentialoperator L = L(D) konstante Koeffizienten, so können wir seine maximale Realisierung in L 2 (Rn ) wie in Beispiel 14.15b mit einem Multiplikationsoperator in Verbindung bringen und so die Adjungierte berechnen. Nach (14.20), Satz 14.17f und der Behauptung aus a. ist nämlich (L max )∗ = (U −1 M f U )∗ = U −1 M f¯U mit f (ξ ) = L(iξ ). Offenbar ist aber
E
Symmetrische und selbstadjungierte Operatoren
L(iξ ) =
25
cα (−iξ )α = L + (iξ ),
|α|≤m
also U −1 M f¯U = (L + )max und schließlich (L max )∗ = (L + )max .
(14.40)
Vergleich mit (14.39) liefert (L + )max = (L + )0 , und da man diese Überlegung auch auf L + statt L anwenden kann, ergibt sich die Folgerung. Für die Realisierungen eines Differentialoperators mit konstanten Koeffizienten im H ILBERTraum L 2 (Rn ) gilt: L max = L 0 . Bemerkung Diese Folgerung unterstützt die Vorstellung, dass der Unterschied zwischen L 0 und L max nur vom Verhalten am Rand von Ω herrührt. Da Rn selbst keinen Rand hat, entsteht eben kein Unterschied. Dies ist jedoch nicht ganz korrekt, denn bei variablen Koeffizienten können sich auch in L 2 (Rn ) die verschiedenen Realisierungen durchaus unterscheiden, wenn die Koeffizienten im Unendlichen stark anwachsen oder schwanken. In solchen Fällen macht das Unendliche sich sozusagen als virtueller Rand bemerkbar.
E Symmetrische und selbstadjungierte Operatoren Für einen beschränkten Operator T : H −→ H bedeuten die Bezeichnungen symmetrisch und selbstadjungiert ein und dasselbe. Bei unbeschränkten Operatoren muss man diese Begriffe jedoch unterscheiden. Definitionen 14.20 Sei A ein dicht definierter Operator in H . a. A heißt symmetrisch oder H ERMITEsch, wenn A ⊂ A∗ , d. h. D(A) ⊆ ∗ ∗ D(A ) , A = A. D(A)
b. A heißt selbstadjungiert, wenn A = A∗ ,
d. h. D(A) = D(A∗ ), Ax = A∗ x, x ∈ D(A) .
(14.41)
c. Der Operator A heißt wesentlich selbstadjungiert,1 wenn er symmetrisch – und ∗ damit auch abschließbar! – ist mit A = A. Offenbar ist jeder selbstadjungierte Operator symmetrisch, aber nicht umgekehrt. Es folgt auch sofort aus den Definitionen, dass Symmetrie von A äquivalent ist zu der folgenden expliziten Bedingung: 1 Eigentlich sollte es „im wesentlichen selbstadjungiert“ heißen, aber die missbräuchliche Bezeichnung „wesentlich selbstadjungiert“ hat sich eingebürgert.
26
14 Unbeschränkte Operatoren
Ax | y = x | Ay
∀ x, y ∈ D(A).
(14.42)
Beispiele 14.21 Wir greifen die Beispiele aus 14.19 wieder auf. a. Der Multiplikationsoperator M f ist selbstadjungiert in L 2 (X, A, μ), wenn die messbare Funktion f reellwertig ist, denn dann ist f¯ = f . Insbesondere sind die Ortsoperatoren der Quantenmechanik selbstadjungiert. (Dies bezieht sich natürlich auf die in (14.8) angegebenen Definitionsbereiche.) b. Ein Differentialoperator L = L(x, D) im Gebiet Ω ⊆ Rn heißt formal selbstadjungiert, wenn L + = L ist. Für seine L 2 -Realisierungen ergeben (14.37), (14.38) und (14.39) dann L ∗min = L ∗0 = L max ,
L ∗max = L 0 .
(14.43)
Die Operatoren L min und L 0 sind also symmetrisch, aber L max ist es i. A. nicht. Genauer gesagt, ist L max genau dann symmetrisch, wenn L max = L 0 ist, und dann ist dieser Operator auch selbstadjungiert. c. Nun sei speziell Ω = Rn und L = L(D) ein formal selbstadjungierter Differentialoperator mit konstanten Koeffizienten. Wie wir in Beispiel 14.19c. gesehen haben, ist dann L max = L 0 , und dieser Operator ist also selbstadjungiert. Die minimale Realisierung L min ist damit wesentlich selbstadjungiert. Für die Physik ist entscheidend, dass dies insbesondere auf die Impulsoperatoren −i∂/∂ x j und auf den Operator der kinetischen Energie T = − 12 Δ in L 2 (R3N ) zutrifft. Bei den Operatoren aus der Quantenmechanik, die der Physiker als H ERMITEsch anspricht, ist es meist so, dass die minimale Realisierung trivialerweise symmetrisch ist, wobei der eigentlich für die Physik benötigte Operator eine selbstadjungierte Erweiterung darstellt. Daher ist eine gewisse theoretische Einsicht in die Zusammenhänge zwischen symmetrischen und selbstadjungierten Operatoren wichtig. Insbesondere muss man der Frage nach selbstadjungierten Erweiterungen eines gegebenen symmetrischen Operators nachgehen. Dieser Thematik ist der Rest des Abschnitts gewidmet. Wir beginnen mit einem einfachen Fall: Satz 14.22 Sei A symmetrisch, und für ein gewisses μ ∈ R sei A − μI surjektiv. Dann ist A selbstadjungiert und μ ∈ ρ(A), insbesondere (A − μI )−1 beschränkt. Beweis Wegen (A−μI )∗ = A∗ −μI genügt es, den Fall μ = 0 zu betrachten. Dann ist N (A∗ ) = R(A)⊥ = {0}, wegen der Symmetrie also erst recht N (A) = {0}. Also sind A und A∗ Bijektionen von D(A) bzw. D(A∗ ) auf R(A) = H = R(A∗ ). Damit ist A−1 = (A−1 )∗ = (A∗ )−1 (Satz 14.17d) und folglich A = A∗ . Ferner ist A−1 = (A−1 )∗ ein abgeschlossener Operator, also nach dem Satz vom abgeschlossenen Graphen (Theorem 14.2a) auch beschränkt. Die Forderung R(A − μI ) = H ist aber eine starke Lösbarkeitsaussage und daher meist schwer nachzuprüfen. Man kommt weiter, wenn man μ rein-imaginär wählt:
E
Symmetrische und selbstadjungierte Operatoren
27
Satz 14.23 Für jeden symmetrischen Operator A in H und jede reelle Zahl β = 0 gilt a. A + iβ I ist injektiv, und es gilt (A + iβ I )x2 = Ax2 + β 2 x2
für x ∈ D(A).
(14.44)
b. A ist genau dann abgeschlossen, wenn R(A + iβ I ) abgeschlossen ist. Beweis a. Die Formel (14.44) ergibt sich mittels (14.42) durch Rechnung, und daraus folgt auch direkt die Injektivität von A + βiI . b. Durch (x, y)2β := β 2 x2 + y2 ist auf H × H offenbar eine äquivalente Norm gegeben. Nach (14.44) ist die Zuordnung T : R(A + βiI ) (A + βiI )x −→ (x, Ax) ∈ G(A) bezüglich dieser Norm eine isometrische Abbildung, so dass G(A) genau dann vollständig ist, wenn R(A + βiI ) vollständig ist. Die Vollständigkeit wiederum ist äquivalent zur Abgeschlossenheit. Im nächsten Satz führen wir auch einige wichtige Begriffe über symmetrische Operatoren ein: Satz und Definition 14.24 Sei A ein abgeschlossener symmetrischer Operator. Dann existiert die C AYLEY-Transformierte U := (A − iI )(A + iI )−1 : R(A + iI ) −→ R(A − iI )
(14.45)
und ist eine isometrische Abbildung. Dabei ist A = i(I + U )(I − U )−1 .
(14.46)
K ± (A) = R(A ± iI )⊥ = N (A∗ ∓ iI )
(14.47)
Man nennt
die Defekträume von A, und n ± (A) = dim K ± (A) die Defektindizes von A.
(14.48)
28
14 Unbeschränkte Operatoren
Beweis Nach Satz 14.23b ist R(A ± iI ) abgeschlossen, da A abgeschlossen ist. Nach 14.23a existiert (A + iI )−1 und daher auch U mit D(U ) = R(A + iI ) ,
R(U ) = R(A − iI ) .
Für x ∈ D(u) und y = (A + iI )−1 x folgt dann U x2 = (A − iI )y2 = Ay2 + y2 = (A + iI )y2 = x2 , was die Isometrie beweist. Die Gleichungen x = Ay + iy ,
U x = Ay − iy
lassen sich äquivalent umformen zu y=
1 (x − U x), 2i
Ay =
1 (x + U x). 2
Daraus folgert man leicht, dass I − U eine Bijektion von D(U ) = R(A + iI ) auf D(A) ist und dass A(I − U ) = i(I + U )
gilt, also (14.46).
Um die Selbstadjungiertheit eines symmetrischen Operators zu überprüfen, muss im Wesentlichen D(A) = D(A∗ ) gezeigt werden, was in der Praxis auf große Schwierigkeiten stößt. Daher sind die folgenden äquivalenten Bedingungen sehr wichtig. Theorem 14.25 Für einen symmetrischen Operator A in H sind folgende Aussagen äquivalent: a. b. c. d. e.
A ist selbstadjungiert. A ist abgeschlossen und N (A∗ ± iI ) = {0}. R(A ± iI ) = H . A ist abgeschlossen und die C AYLEY-Transformierte U ist unitär. A ist abgeschlossen, und für die Defektindizes gilt: n − (A) = n + (A) = 0
Beweis Nach Satz 8.24a ist ein isometrischer Operator genau dann unitär, wenn er surjektiv ist. Aus den Sätzen 14.17c, 14.24 und 14.23b folgt daher (Details als Übung!)
E
Symmetrische und selbstadjungierte Operatoren
c.
⇐⇒
d.
29
⇐⇒
e.
Es sind also nur noch die ersten drei Äquivalenzen zu zeigen: a.
⇒ b.: Gelte A = A∗ . Dann ist A abgeschlossen, weil A∗ nach Satz 14.18a abgeschlossen ist. Ferner ist A∗ ±iI injektiv nach Satz 14.23a, d. h. N (A∗ ±iI ) = {0}. Es gilt also b.
b.
⇒ c.: Sei A abgeschlossen und N (A∗ ± iI ) = {0}. Nach Satz 14.23b ist dann R(A ± iI ) abgeschlossen und somit H = {0}⊥ = N (A∗ ∓ iI )⊥ = R(A ± iI ) , d. h. es gilt c.
c.
⇒ a.: Gelte R(A ± iI ) = H , also auch N (A∗ ∓ iI ) = {0}. Wir haben nur D(A∗ ) ⊆ D(A) zu zeigen. Sei also x ∈ D(A∗ ). Nach Voraussetzung gibt es u ∈ D(A) mit (A − iI )u = (A∗ − iI )x. Wegen A ⊂ A∗ ist dann auch u ∈ D(A∗ ) und (A∗ − iI )u = (A∗ − iI )x, also x − u ∈ N (A∗ − iI ) = {0} und somit x = u ∈ D(A), wie gewünscht.
Als Folgerung ergibt sich ein naheliegender Zusammenhang zwischen Selbstadjungiertheit und Spektrum: Korollar 14.26 Ist A selbstadjungiert, so ist σ (A) ⊆ R. Ist A symmetrisch und σ (A) ⊆ R, so ist A selbstadjungiert. Beweis Sei A symmetrisch. Ist σ (A) ⊆ R, so ist insbesondere ±i ∈ ρ(A), also auch R(A ± iI ) = H , also A = A∗ nach Theorem 14.25. Für einen selbstadjungierten Operator A und λ = α + iβ , β = 0, haben wir N (A − λI ) = {0} und R(A − λI ) = R(A − λI ) nach Satz 14.23, angewandt auf den abgeschlossenen symmetrischen ¯ zu, also insbesondere {0} = N (A − Operator A − α I . Dasselbe trifft auf A − λI ¯λ I ) = N (A∗ − λ¯ I ) = N ((A − λI )∗ ) = R(A − λI )⊥ . Es folgt R(A − λI ) = H , und damit existiert (A − λI )−1 und ist ein überall definierter abgeschlossener Operator. Nach Theorem 14.2 ist er auch beschränkt, also λ ∈ ρ(A). Bemerkung Die Auszeichnung der Punkte λ = ±i in den letzten Sätzen ist reine Konvention. Man kann nämlich beweisen, dass für einen symmetrischen Operator A die Größe dim N (A∗ − λI ) in jeder der beiden Halbebenen H ± := {λ ∈ C | ±Im λ > 0}
30
14 Unbeschränkte Operatoren
konstant ist (vgl. etwa [1] oder [66]). Für beliebiges λ ∈ H ± gilt also n ± (A) = dim N (A∗ − λI ) für die durch (14.48) definierten Defektindizes. Man kann das auch spektraltheoretisch interpretieren: Ist A abgeschlossen und symmetrisch, aber nicht selbstadjungiert, so ist (mindestens) einer der Defektindizes positiv, etwa n + (A) > 0, und dann ist H + ⊆ σ P (A∗ ) und H − ⊆ σ R (A) wegen N (A∗ − λI ) = R(A − λ¯ I )⊥ . Da das Spektrum immer abgeschlossen ist, folgt nun H − ⊆ σ (A). Für das Spektrum eines abgeschlossenen symmetrischen Operators, der nicht selbstadjungiert ist, gibt es daher nur die drei Möglichkeiten H − , H + und C. Aber die nichtreellen Spektralwerte haben keine physikalische Signifikanz und zeigen eigentlich nur, dass man den falschen Definitionsbereich gewählt hat. Wir illustrieren die Anwendung von Theorem 14.25 am Beispiel eines S CHRÖ DINGER-Operators mit reellen C ∞ -Koeffizienten: Satz 14.27 Sei V : Rn → R eine nach unten beschränkte C ∞ -Funktion. Die minimale L 2 -Realisierung des Differentialoperators L := −Δ + V ist dann wesentlich selbstadjungiert. Beweis Zu zeigen ist L ∗0 = L 0 , und wegen (L 0 + μI )∗ = L ∗0 + μI für μ ∈ R können wir o. B. d. A. annehmen, dass V ≥ 0 ist. Die Behauptung folgt aus dem vorigen Satz, wenn wir nachgewiesen haben, dass N (L ∗0 ± iI ) = {0} ist. Da der Differentialoperator formal selbstadjungiert ist, ist L ∗0 = L max nach (14.43). Wir haben also zu zeigen, dass jede schwache Lösung ψ ∈ L 2 (Rn ) der Differentialgleichung −Δψ + V ψ = ±iψ verschwinden muss. Sei also ψ = u + iv (u, v reellwertig) solch eine Lösung. Zunächst einmal weiß man aus der elliptischen Regularitätstheorie (vgl. etwa [66, 73] oder [65]), dass ψ ∈ C ∞ , also sogar eine klassische Lösung der Differentialgleichung ist. Wir untersuchen nun die nichtnegative Funktion f (r ) := r n−1
Sn−1
|ψ(r ω)|2 dσn−1 (ω) ,
0 ≤ r < ∞,
wo dσn−1 das Flächenelement auf der Einheitssphäre ist. Mit Hilfe des G AUSSschen Integralsatzes errechnet man
E
Symmetrische und selbstadjungierte Operatoren
n−1 r n−1 = r n−1 = r n−1 = r
f (r ) =
f (r ) + r n−1 S
n−1
31
∂ (u(r ω)2 + v(r ω)2 ) dσn−1 (ω) ∂r
∇(u 2 + v 2 )(r ω) · ω dσn−1 (ω) f (r ) + r n−1 Sn−1 x f (r ) + ∇(u 2 + v 2 )(x) · dσn−1 (x) r |x|=r f (r ) + Δ(u 2 + v 2 )(x) dx . Br (0)
Die Gültigkeit der Differentialgleichung Δψ = V ψ∓iψ bedeutet nach Aufspaltung in Real- und Imaginärteil aber Δu = V u ± v ,
Δv = V v ∓ u .
Das ergibt Δ(u 2 + v 2 ) = 2div (u∇u + v∇v) = 2(|∇u|2 + |∇v|2 ) + 2(uΔu + vΔv) = 2(|∇u|2 + |∇v|2 ) + 2V (u 2 + v 2 ) ≥ 0. Insgesamt finden wir f (r ) ≥ 0, also ist f (r ) monoton wachsend. Andererseits ist aber nach der Transformationsformel für Polarkoordinaten
∞ 0
f (r ) dr =
Rn
|ψ(x)|2 dx = ψ2 < ∞.
und wegen der Monotonie ist das nur möglich, wenn f (r ) ≡ 0. Also ist ψ = 0 und damit ψ = 0, wie gewünscht.
Selbstadjungierte Erweiterungen Sei S eine selbstadjungierte Erweiterung des symmetrischen Operators A. Dann ist A ⊂ S = S ∗ ⊂ A∗ sowie A¯ = A∗∗ ⊂ S ⊂ A∗ = A¯ ∗ . Also kann man o. B. d. A. annehmen, dass A abgeschlossen ist, und etwaige selbstadjungierte Erweiterungen kann man als Einschränkungen von A∗ auf geeignet gewählte Definitionsbereiche realisieren. Mit Hilfe der C AYLEY-Transformierten kann man sogar alle abgeschlossenen symmetrischen Erweiterungen von A angeben und darunter die selbstadjungierten identifizieren (vgl. etwa [1, 66, 73, 91, 92] oder [95]). Dabei zeigt sich insbesondere, dass für jede abgeschlossene symmetrische Erweiterung B von A für die Defektindizes n + (A) − n + (B) = n − (A) − n − (B) =: k
32
14 Unbeschränkte Operatoren
gilt und dass für 0 ≤ k ≤ min(n + (A), n − (A)) auch stets mindestens eine abgeschlossene symmetrische Erweiterung B mit n ± (B) = n ± (A) − k existiert. Der Operator A hat also genau dann selbstadjungierte Erweiterungen, wenn n + (A) = n − (A) ist (man beachte Theorem 14.25!). Diese sog. V. N EUMANNsche Erweiterungstheorie ist zwar für den Mathematiker sehr befriedigend, in der Praxis jedoch wenig brauchbar, denn sie beschreibt die Definitionsbereiche der fraglichen Erweiterungen nur in recht indirekter Weise. Für formal selbstadjungierte Differentialoperatoren L(x, D) = L + (x, D) in einem Gebiet Ω ⊆ Rn ist die Situation etwas günstiger, denn die selbstadjungierten Erweiterungen von L 0 sind Einschränkungen von L ∗0 = L max , und daher sind ihre Definitionsbereiche durch Randbedingungen gegeben, wobei im Falle eines unbeschränkten Gebiets auch „Randbedingungen im Unendlichen“ zu berücksichtigen sind, die die Gestalt von Forderungen an das Abklingverhalten der betreffenden Funktionen im Unendlichen annehmen. Wir können dies hier nicht rigoros formulieren und noch weniger beweisen und sagen dazu nur soviel: Ist L 0 ⊂ L ⊂ L max und u ∈ D(L), so ist u + ϕ ∈ D(L) für alle Testfunktionen ϕ ∈ D(Ω), denn D(Ω) = D(L min ) ⊆ D(L). Die Funktionen aus D(L) können also auf kompakten Teilmengen von Ω beliebig abgeändert werden, ohne dass D(L) verlassen wird, und daher muss D(L) durch Bedingungen am Rand oder im Unendlichen festgelegt sein. In hinreichend einfachen Situationen kann man die Randbedingungen, die zu selbstadjungierten Erweiterungen führen, explizit bestimmen, und dabei stellt sich heraus, dass ein formal selbstadjungierter Differentialoperator mehrere verschiedene selbstadjungierte Realisierungen haben kann. Wir demonstrieren dies am einfachsten denkbaren Beispiel: Beispiel 14.28 Auf dem Intervall I := [a, b] betrachten wir die L 2 -Realisierungen des formal selbstadjungierten Differentialoperators Lu = −iu . Dann ist L 0 symmetrisch, und alle seine selbstadjungierten Erweiterungen sind Einschränkungen von L ∗0 = L max . Aus Satz 14.10 kennen wir die Definitionsbereiche D(L max ) = H 1,2 (I ) und D(L 0 ) = H01,2 (I ). Für jedes ζ ∈ C mit |ζ | = 1 definieren wir L ζ := L max
mit Dζ := {u ∈ H 1,2 (I ) | u(b) = ζ u(a)} Dζ
und behaupten: Behauptung Die Operatoren L ζ sind genau die sämtlichen selbstadjungierten Erweiterungen von L 0 . Beweis Die G REENsche Formel für L hat die Gestalt Lu|v − u|Lv = i u(b)v(b) − u(a)v(a) ,
(14.49)
E
Symmetrische und selbstadjungierte Operatoren
33
und sie gilt für alle u, v ∈ H 1,2 (I ). Zum Beweis schreibt man u = limm→∞ u m , v = limm→∞ vm wie in Definition 14.9 und beachtet, dass die Formel sich für u m , vm statt u, v trivial nachrechnen lässt und dass sie sich beim Grenzübergang m → ∞ dann auf u, v ∈ H 1,2 (I ) überträgt. Nun betrachte ζ ∈ S1 := {z ∈ C : |z| = 1}. Dann ist L ∗ζ ⊃ L ζ , denn für alle u, v ∈ Dζ ist u(b)v(b) = ζ ζ u(a)v(a) = u(a)v(a) , also Lu|v − u|Lv = 0 nach (14.49). Ist andererseits u ∈ D(L ∗ζ ) ⊆ D(L ∗0 ) = D(L max ) = H 1,2 (I ), so ist L ζ u = L max u = Lu im Sinne der Distributionen, also hat man für alle v ∈ Dζ 0 = Lu|v − u|Lv = i(u(b)ζ − u(a))v(a), und da v(a) = 0 gewählt werden kann, folgt u(b) = ζ u(a), also u ∈ Dζ . Damit ist L ∗ζ = L ζ . Sei nun umgekehrt L 0 ⊂ S = S ∗ ⊂ L max . Nach Satz 14.10 haben L 0 und L max unterschiedliche Definitionsbereiche, also ist L 0 nicht selbstadjungiert, und damit existiert w ∈ D(S)\D L 0 . Wegen w|Sw = Sw|w liefert die G REENsche Formel 0 = w(b)w(b) − w(a)w(a) , also |w(b)| = |w(a)|, und dieser Wert ist = 0, denn anderenfalls wäre w ∈ H01,2 (I ) = D(L 0 ). Für ζ := w(b)/w(a) haben wir also |ζ | = 1 und w ∈ Dζ . Für jedes u ∈ D(S) ergibt (14.49) 0 = Su|w − u|Sw = i(u(b)ζ − u(a))w(a), also u ∈ Dζ . Damit ist S ⊂ L ζ , und da beide Operatoren selbstadjungiert sind, folgt auch S = S ∗ ⊃ L ∗ζ = L ζ , also S = L ζ . In [66] (Ch. X.1 mit Anhang) ist ausführlich erläutert, inwiefern die verschiedenen selbstadjungierten Erweiterungen in diesem und ähnlichen Beispielen tatsächlich unterschiedliches physikalisches Verhalten von gewissen quantenmechanischen Systemen beschreiben. Jedoch lässt sich diese Komplikation vermeiden, wenn L min wesentlich selbstadjungiert ist. Das liegt an dem folgenden Satz: Satz 14.29 Der symmetrische Operator A ist genau dann wesentlich selbstadjungiert, wenn er eine eindeutige selbstadjungierte Erweiterung besitzt. Diese ist dann ¯ A∗∗ = A. Beweis Sei A wesentlich selbstadjungiert, also A¯ selbstadjungiert, und sei S eine ¯ weitere selbstadjungierte Erweiterung von A. Dann ist A¯ ⊂ S = S ∗ ⊂ A¯ ∗ = A, ¯ Die umgekehrte Implikation folgt aus der V. N EUMANNschen Erweitealso S = A. rungstheorie (vgl. die o. a. Literatur).
34
14
Unbeschränkte Operatoren
Bei quantenmechanischen Systemen mit dem Konfigurationsraum Ω = R3N kann in den physikalisch vernünftigen Fällen rigoros bewiesen werden, dass der H AMILTONoperator wesentlich selbstadjungiert ist. Hierzu gibt es eine umfangreiche Fachliteratur (vgl. etwa [21, 35, 41, 47, 66, 67, 91]). Wir erwähnen zwei wichtige Resultate: Satz 14.30 Die minimale Realisierung des S CHRÖDINGERschen Differentialoperators L = −Δ + V in L 2 (Rn ) ist wesentlich selbstadjungiert, wenn a. V ≥ 0 und V ∈ L 2loc (Rn ) oder b. n = 3 und V = V1 + V2 mit V1 ∈ L 2 (R3 ) und V2 ∈ L ∞ (R3 ). Einen Beweis für Teil a. findet man z. B. in [41], einen für b. in jedem der angegebenen Bücher. Die Aussage aus Teil b. erscheint zwar sehr speziell, erfasst jedoch grundlegende physikalische Beispiele wie das C OULOMB-Potential, und die verwendete Beweismethode ist Ausgangspunkt für viele physikalisch relevante Verallgemeinerungen.
Aufgaben zu Kap. 14 14.1 Im Raum E = L p ([a, b]) (mit a < b , 1 ≤ p < ∞) betrachten wir den linearen Operator A mit D(A) = C([a, b]) ,
Au := u(x0 )1 ,
wobei x0 ∈]a, b[ ein fest gewählter Punkt ist. Man zeige, dass A dicht definiert, aber nicht abschließbar ist. (Hinweis: Man betrachte eine Folge von „Zackenfunktionen“, wobei die Breite der Zacken gegen Null geht, die Zacken aber bei x0 eine feste maximale Höhe erreichen.) 14.2 Sei ∅ = X ⊆ Rn eine beliebige Teilmenge (oder allgemeiner (X, d) ein metrischer Raum), und sei E := BC(X ) der komplexe BANACHraum der stetigen beschränkten Funktionen auf X . Für eine stetige Funktion f : X → C definieren wir den Multiplikationsoperator M f wieder durch D(M f ) = {u ∈ E | f u ∈ E} ,
M f u := f u ,
wobei f u im Sinne der punktweisen Multiplikation zu verstehen ist. Man zeige: a. M f ist abgeschlossen. b. σ (M f ) = f (X ). (Hinweis: Man gehe vor wie in Beispiel 14.15a, verwende jedoch Hilfsfunktionen der Form u(x) = max(0, 1 − δ −1 |x − x0 |).) c. Man folgere, dass jede nichtleere abgeschlossene Teilmenge Z ⊆ C Spektrum eines linearen Operators ist. (Hinweis: Man wähle X = Z und f (z) = z.)
Aufgaben
35
14.3 Der Definitionsbereich eines Operatorprodukts AB wird stets so gewählt wie in Satz 14.17e angegeben. Hier betrachten wir Multiplikationsoperatoren M f , Mg in L p (X, A, μ) wie in Satz 14.6. a. Man zeige: D(M f Mg ) = D(Mg ) ∩ D(M f g ). b. Man gebe ein Beispiel an, wo M f Mg und Mg M f verschiedene Definitionsbereiche haben. 14.4 Sei A ein dicht definierter Operator in einem H ILBERTraum. Man zeige: A ist genau dann wesentlich selbstadjungiert, wenn A und A∗ beide symmetrisch (insbesondere dicht definiert!) sind. 14.5 Der Definitionsbereich der n-ten Potenz An eines Operators A ist rekursiv durch D(An ) := {x ∈ D(A) | Ax ∈ D(An−1 )},
n≥1
festgelegt, wobei A0 = I natürlich überall definiert ist. Man zeige: Ist A ein selbstadjungierter Operator in einem H ILBERTraum, so ist An für jedes n ∈ N0 dicht definiert. (Hinweis: Man nutze aus, dass A − iI eine überall definierte beschränkte Inverse hat.) 14.6 Sei A selbstadjungiert, und für ein gewisses γ ∈ R gelte x|Ax ≥ γ x2
für alle x ∈ D(A).
Man zeige: Dann ist ] − ∞, γ [⊆ ρ(A), und für jedes ε > 0 gilt (A − (γ − ε)I )−1 ≤ 1/ε. (Hinweis: Für λ < γ betrachte man S := A − λI und gehe ähnlich vor wie in Aufgabe 8.11.) 14.7 Sei Ω ⊆ Rn ein Gebiet und v = (v1 , . . . , vn ) ein C ∞ -Vektorfeld in Ω. Mit Hilfe der in Satz 1.28 eingeführten Richtungsableitung definieren wir den Differentialoperator 1 ∂f 1 vf = vk . i i ∂ xk n
L v (x, D) f :=
k=1
36
14
Unbeschränkte Operatoren
a. Man zeige: L v (x, D) ist genau dann formal selbstadjungiert, wenn div v ≡ 0 ist. b. Nun sei S eine reelle n × n-Matrix mit Spur Null, und v sei das entsprechende lineare Vektorfeld, also v(x) := Sx für x ∈ Ω = Rn . Man zeige: Dann ist L v (x, D) auf dem Definitionsbereich D(Rn ) wesentlich selbstadjungiert, ebenso auf dem Definitionsbereich Sn . c. Die Drehimpulsoperatoren der Quantenmechanik sind Spezialfälle der in b. beschriebenen Situation. Wieso? 14.8 Man zeige, dass das C OULOMB-Potential V (x, y, z) := −
2 x2
die Voraussetzungen von Satz 14.30b erfüllt.
+ y2 + z2
Kapitel 15
Spektralmaße
Schon in der elementaren linearen Algebra ist es wichtig, zu begreifen, dass die Eigenwerttheorie es ermöglicht, die Struktur eines linearen Operators zu analysieren und dadurch die Beantwortung von konkreten Fragen zu erleichtern, die mit Hilfe dieses Operators formuliert wurden (vgl. etwa [34], Ergänzungen zu Kap. 7). Bei den selbstadjungierten Operatoren, die die Observablen der Quantenmechanik beschreiben, – und auch bei Systemen von kommutierenden Observablen – steht diese Strukturanalyse in unmittelbarem Zusammenhang mit der statistischen Interpretation der Quantenmechanik, und dieser Zusammenhang wird durch projektorwertige Maße, die sog. Spektralmaße hergestellt, wie wir im einführenden Abschn. A an Beispielen erläutern werden. In Abschn. B definieren und untersuchen wir dann Spektralmaße in möglichst allgemeinem Rahmen und zeigen insbesondere, wie beschränkte messbare Funktionen in Bezug auf ein Spektralmaß integriert werden können. Die entstehenden Spektralintegrale liefern, wie sich zeigen wird, eine Darstellung einer C ∗ -Algebra, und da die Theorie der C ∗ -Algebren und ihrer Darstellungen heute in der statistischen Quantenmechanik und Quantenfeldtheorie von wachsender Bedeutung ist, nehmen wir die Gelegenheit wahr, hier wenigstens einige Grundbegriffe dieser Theorie einzuführen (Abschn. C), so dass wir die entsprechende Terminologie und Sichtweise in diesem und dem nächsten Kapitel verwenden können. In Abschn. D verallgemeinern wir dann die Integrationstheorie auf unbeschränkte messbare Funktionen, wobei als Spektralintegrale auch unbeschränkte Operatoren entstehen. Diese Verallgemeinerung wird im nächsten Kapitel für die Spektralzerlegung von unbeschränkten selbstadjungierten Operatoren benötigt.
A Motivierende Vorbemerkungen Wir betrachten zunächst ein quantenmechanisches System, das nur endlich viele Konfigurationen annehmen kann, z. B ein System von N Teilchen vom Spin 12 , die an den Gitterpunkten eines Kristalls fixiert sind, so dass die n = 2 N Spineinstellungen die einzig möglichen Konfigurationen darstellen. Derartige Systeme werden (etwa in der Theorie der Quantencomputer) tatsächlich diskutiert, aber für
K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_15, C Springer-Verlag Berlin Heidelberg 2010
37
38
15 Spektralmaße
uns dienen sie nur als einfaches Modell, an dem wir uns orientieren können. Der Zustandsraum eines solchen Systems ist der H ILBERTraum H = Cn , und seine Observablen sind die H ERMITEschen Operatoren in Cn . Zu jedem derartigen Operator A gibt es bekanntlich eine Orthonormalbasis von Eigenvektoren (vgl. z. B. [34], Kap. 7), etwa B = {b1 , . . . , bn }, und dann ist für alle ψ ∈ Cn ψ=
n
b j |ψ b j
und
n
Aψ =
j=1
μ j b j |ψ b j ,
(15.1)
j=1
wobei μ j der Eigenwert zum Eigenvektor b j ist. Diese Eigenwerte sind die einzig möglichen Messwerte für die durch A repräsentierte Observable, und ihre Vielfachheiten – also, was der Physiker „Entartung“ nennt – spielen dabei zunächst keine Rolle. Daher führen wir die verschiedenen Eigenwerte λ1 , . . . , λs von A ein, wobei λi mit der Vielfachheit m i auftritt. Die Menge {λ1 , . . . , λs } ⊆ R ist dann das Spektrum σ (A) von A (vgl. Beispiel 9.2a), und wir schreiben (15.1) in der Form ψ=
m s i i=1
bi,k |ψ bi,k
und Aψ =
k=1
s
m i λi bi,k |ψ bi,k ,
i=1
(15.2)
k=1
wobei wir die Eigenvektoren aus B neu nummeriert haben, so dass jeweils {bi,1 , . . . , bi,m i } eine Orthonormalbasis des Eigenraums Ni := N (A − λi I ) ist (i = 1, . . . , s). Die innere Klammer ist hier aber nichts anderes als Pi ψ, wo Pi : Cn → Ni die orthogonale Projektion auf Ni bezeichnet (vgl. Abschn. 8E). Damit erhält (15.2) die übersichtliche Form ψ=
s
Pi ψ
und
Aψ =
i=1
s
λi Pi ψ ,
i=1
und da dies für alle ψ ∈ Cn gilt, kann man noch kürzer schreiben: I =
s
Pi
und
A=
i=1
s
λi Pi .
(15.3)
i=1
Nun sei ψ = 1, so dass ψ einen physikalischen Zustand des Systems beschreibt. Die statistische Interpretation der Quantenmechanik besagt dann, dass die Größe wi := Pi ψ = ψ|Pi ψ = 2
mi
|bi,k |ψ |2
k=1
die Wahrscheinlichkeit dafür ist, bei einer Messung der Observablen in dem durch ψ bezeichneten Zustand den Wert λi zu finden. (Bei der Umrechnung wurde
A
Motivierende Vorbemerkungen
39
(8.39) benutzt, was wir im weiteren Verlauf noch oft tun werden!) Der Erwartungswert im Zustand ψ ist daher A =
s
λi wi =
i=1
s
λi ψ|Pi ψ = ψ|Aψ .
i=1
Die Angaben der Wahrscheinlichkeiten wi kann man zu einer echten Wahrscheinlichkeitsverteilung auf σ (A) ausbauen, indem man für S ⊆ σ (A) setzt: w(S) :=
wi .
λi ∈S
Diese Verteilungen hängen natürlich vom Zustand ψ ab, aber man kann die Abhängigkeit in der einfachen Form w(S) = ψ|E(S)ψ anschreiben, wenn man die Operatoren E(S) :=
Pi
(15.4)
λi ∈S
benutzt. Da für i = j stets Ni ∩ N j = {0}, also Pi P j = P j Pi = 0 ist, folgert man mittels Satz 8.27 sofort, dass E(S) ebenfalls ein orthogonaler Projektor ist, und zwar mit dem Bild Ni , R(E(S)) = λi ∈S
d. h. R(E(S)) ist die lineare Hülle der Eigenvektoren zu den Eigenwerten aus S. Für zwei Teilmengen S1 , S2 ⊆ σ (A) folgt überdies E(S1 )E(S2 ) = E(S2 )E(S1 ), und daher ergibt eine erneute Anwendung von Satz 8.27 (Übung!), dass E(S1 ∩ S2 ) = E(S1 )E(S2 )
(15.5)
und S1 ∩ S2 = ∅
⇒
E(S1 ∪ S2 ) = E(S1 ) + E(S2 ).
(15.6)
Man nennt die Abbildung, die jedem S ⊆ σ (A) den Projektor E(S) zuordnet, das Spektralmaß von A. Unter Verwendung des Spektralmaßes kann (15.3) offenbar wie folgt formuliert werden: I = E(σ (A)) ,
A=
λ∈σ (A)
λE({λ}).
(15.7)
40
15 Spektralmaße
Bemerkung Manchmal wird das Spektralmaß sogar für beliebige Teilmengen S ⊆ C definiert, indem man setzt: E(S) := E(S ∩ σ (A)). Ist S ⊆ ρ(A), so folgt dann E(S) = E(∅) = 0. Der Anwendungsbereich dieses Formalismus geht aber weit hierüber hinaus. Wir betrachten als weiteres Beispiel zwei kommutierende H ERMITEsche Operatoren A, B in Cn , so dass die entsprechenden Observablen also simultan beliebig genau gemessen werden können. Wieder schreiben wir σ (A) = {λ1 , . . . , λs } mit den Eigenräumen NiA := N (A − λi I ), ferner σ (B) = {μ1 , . . . , μt } mit N jB := N (B − μ j I ). Für ψ ∈ NiA ist dann A(Bψ) = B Aψ = λi Bψ , also auch Bψ ∈ NiA . Die Einschränkung von B auf NiA ist daher ein H ERMITEscher Operator im H ILBERTraum NiA , also besitzt dieser eine Orthonormalbasis aus Eigenvektoren von B. Wegen Cn = N1A ⊕ · · · ⊕ NsA können alle diese Basen zu einer Orthonormalbasis von ganz Cn zusammengefasst werden, und die Vektoren dieser Basis sind gleichzeitig Eigenvektoren von A und B. Daher ist Cn =
Ni j
mit Ni j := NiA ∩ N jB .
i, j
Bezeichnen wir nun mit Pi j den orthogonalen Projektor mit dem Bild Ni j , so ergeben sich ähnlich wie zuvor die Beziehungen I = A= ψ|Aψ =
i, j
Pi j ,
i, j
λi Pi j ,
i, j
λi wi j , ψ|Bψ =
B=
i, j
μ j Pi j ,
i, j
μ j wi j
mit wi j := ψ|Pi j ψ . Ist ψ ein Einheitsvektor, so ist wi j die Wahrscheinlichkeit dafür, dass eine simultane Messung der beiden Observablen in dem durch ψ beschriebenen Zustand das Wertepaar (λi , μ j ) liefern wird. Die Wahrscheinlichkeit dafür, dass die Messung ein Wertepaar aus einer gegebenen Menge S ⊆ σ (A) × σ (B) liefern wird, ist also w(S) = ψ|E(S)ψ mit E(S) := Pi j , (15.8) (λi ,μ j )∈S
und es ist eine leichte Übung, zu zeigen, dass die E(S) auch jetzt orthogonale Projektoren sind, die den Rechenregeln (15.5), (15.6) genügen. In diesem Sinne erzeugt das Paar A, B von kommutierenden H ERMITEschen Operatoren ein Spektralmaß auf σ (A) × σ (B), und es ist klar, dass man diese ganze Überlegung auch auf beliebige (endliche) Systeme von kommutierenden H ERMITEschen Operatoren ausdehnen kann.
A
Motivierende Vorbemerkungen
41
Zum Schluss dieser Einführung diskutieren wir noch ein möglichst einfaches System, das ein Kontinuum von Konfigurationen zulässt, nämlich ein Teilchen, das sich im R3 frei bewegen kann. Der Zustandsraum ist dann L 2 (R3 ), und wir betrachten die drei kommutierenden Observablen Q 1 , Q 2 , Q 3 , die die Komponenten x1 , x2 , x3 der Position des Teilchens messen. (Da diese Ortsoperatoren nicht überall in L 2 (R3 ) definiert sind, müsste die Aussage, dass sie kommutieren, eigentlich präzisiert werden, doch ist die Sache hier unproblematisch, da alle auftretenden Operatorprodukte den gemeinsamen dichten Definitionsbereich D(R3 ) haben und auf diesem wesentlich selbstadjungiert sind.) Nun sei ψ ∈ L 2 (R3 ) und ψ = 1. Die Wahrscheinlichkeit, dass die Position des Teilchens im Zustand ψ den bestimmten Wert (x1 , x2 , x3 ) ∈ R3 hat, ist natürlich Null, und man muss sich daher von vornherein auf die Betrachtung von größeren Mengen einlassen. Sei also S ⊆ R3 eine B ORELmenge. Die Wahrscheinlichkeit, das Teilchen innerhalb von S zu finden, ist dann bekanntlich
w(S) =
|ψ(x)| d x = 2
3
χ S |ψ|2 d3 x,
S
und auch dies kann man in der Form w(S) = ψ|E(S)ψ darstellen, nämlich indem man für E(S) den Multiplikationsoperator mit der charakteristischen Funktion χ S wählt. Es ist auch klar, dass für B ORELmengen S1 , S2 die Regeln (15.5), (15.6) gelten. Wie immer in der Maßtheorie erwartet man aber sogar eine Form der σ -Additivität, d. h. wenn S die Vereinigung von abzählbar vielen disjunkten B ORELmengen S1 , S2 , . . . ist, so sollte (in irgendeinem Sinne) gelten: E(S) =
∞
E(Sk ).
k=1
In Bezug auf die Operatornorm kann dies aber kaum je zutreffen, denn ein Projektor P = 0 hat immer die Norm 1, also können die Glieder der Reihe nicht gegen Null gehen, außer wenn die Reihe abbricht. Aber für jedes ψ ∈ L 2 (R3 ) ist wegen |ψ|2 d3 x konvergent, also ist |ψ|2 d3 x < ∞ die Reihe k
Sk
2 n ∞ 3 lim χ Sk ψ d x = lim |ψ|2 d3 x = 0, χ S ψ − n→∞ n→∞ Sk k=1
k=n+1
und dies bedeutet, dass E(S)ψ =
∞ k=1
E(Sk )ψ
∀ ψ ∈ L 2 (R3 )
(15.9)
42
15 Spektralmaße
in der Norm von L 2 (R3 ). In diesem Sinne ist die Abbildung S −→ E(S) also σ -additiv. Wir wissen, dass Q i der Multiplikationsoperator mit der Komponentenfunktion xi ist. Nach Beispiel 14.15a ist folglich σ (Q i ) = R, also σ (Q 1 )×σ (Q 2 )×σ (Q 3 ) = R3 , und somit entspricht die triviale Beziehung I = E(R3 ) der ersten Gleichung aus (15.7). Wie aber die zweite Gleichung zu verallgemeinern wäre, ist an dieser Stelle nicht klar, und tatsächlich benötigt man hierzu die Theorie der Spektralintegrale, die wir im folgenden entwickeln werden.
B Spektralmaße und Spektralintegrale Zunächst führen wir Spektralmaße in möglichst allgemeinem Kontext ein, nämlich für eine σ -Algebra A auf einer beliebigen nichtleeren Menge X . Das Paar (X, A) wird dann mitunter auch als messbarer Raum bezeichnet. Definition 15.1 Sei H ein H ILBERT raum, (X, A) ein messbarer Raum. Eine Abbildung A S −→ E(S) ∈ B(H ), die jeder Menge S ∈ A einen orthogonalen Projektor E(S) : H −→ H zuordnet, heißt ein Spektralmaß auf X , wenn gilt a. E(X ) = I.
(15.10)
b. Für jede disjunkte Folge (Sn ) in A ist E
∞ n=1
Sn x =
∞
E(Sn )x := lim
n=1
n−→∞
n
E(Sn )x
(15.11)
k=1
für alle x ∈ H . Setzt man in (15.11) Sn = ∅ für alle n ∈ N, so folgt E(∅) = 0. Setzt man in (15.11) Sn = ∅ für n > 2, so folgt E(S1 ∪ S2 ) = E(S1 ) + E(S2 )
für S1 ∩ S2 = ∅.
Da links ein orthogonaler Projektor steht, steht auch rechts ein orthogonaler Projektor. Für die Summe von Projektoren ist dies nach Satz 8.27b genau dann der
B
Spektralmaße und Spektralintegrale
43
Fall, wenn R(E(S1 )) ⊥ R(E(S2 )), also wenn E(S1 )E(S2 ) = 0. Für beliebige S1 , S2 ∈ A ist S1 (bzw. S2 ) die disjunkte Vereinigung von S1 \S2 und S1 ∩ S2 (bzw. von S2 \S1 und S1 ∩ S2 ), also ist E(S1 ) = E(S1 \S2 ) + E(S1 ∩ S2 ), E(S2 ) = E(S2 \S1 ) + E(S1 ∩ S2 ). Multipliziert man diese beiden Gleichungen, so fallen drei der vier Terme, die beim Ausdistribuieren entstehen, weg, da die entsprechenden Mengen disjunkt sind. Daher ergibt sich E(S1 )E(S2 ) = E(S1 ∩ S2 ) . Fassen wir zusammen: Satz 15.2 Zusätzlich zu (15.10) und (15.11) hat ein Spektralmaß E(S) auf (X, A) noch folgende Eigenschaften: E(∅) = 0, E(S1 )E(S2 ) = 0 ,
(15.12)
falls S1 ∩ S2 = ∅,
E(S\R) = E(S) − E(R)
(15.13)
falls R ⊆ S,
(15.14)
E(R)E(S) = E(R ∩ S) = E(S)E(R),
(15.15)
E(X \S) = I − E(S).
(15.16)
Es ist wichtig, sich klarzumachen, was das für die Bildräume der Projektoren E(S) bedeutet: Korollar 15.3 Ist S −→ E(S) ein Spektralmaß auf A, so gilt für die abgeschlossenen linearen Teilräume U(S) := R(E(S)) ⊆ H : a. U(X \S) = U(S)⊥ , b. S1 ∩ S2 = ∅ ⇒ U(S1 ) ⊥ U(S2 ). c. Ist S die disjunkte Vereinigung der messbaren Mengen Sn , n ∈ N, so hat jeder Vektor x ∈ U(S) eine eindeutige Reihenentwicklung x=
∞
xn
mit xn ∈ U(Sn ),
n=1
die in H konvergent ist. Es ist nämlich xn = E(Sn )x für alle n. Man sagt hierfür, U(S) sei die orthogonale direkte Summe (oder H ILBERTsche Summe) der U(Sn ) und schreibt
44
15 Spektralmaße
U(S) =
∞
⊥
U(Sn ) .
n=1
Sei im Folgenden ein Spektralmaß E(S), S ∈ A, in H gegeben. Für festes x ∈ H betrachten wir die Mengenfunktion μx (S) := x | E(S)x = E(S)x2 . Dann folgt aus (15.10), (15.11), (15.12), (15.13), (15.14), (15.15), und (15.16) sofort: Satz 15.4 Ist (X, A) ein messbarer Raum, E(S), S ∈ A, ein Spektralmaß in H , so ist für jedes x ∈ H durch μx (S) := x | E(S)x
(15.17)
ein endliches Maß auf A definiert. Wählt man verschiedene x, y ∈ H , so ist μx,y (S) := x | E(S)y natürlich kein Maß, weil die rechte Seite i. A. eine komplexe Zahl ist. Aus diesem Grund führt man die folgenden Begriffe ein: Definitionen 15.5 a. Sei (X, A) ein messbarer Raum. Eine C-wertige Mengenfunktion μ(S), S ∈ A, heißt komplexes Maß auf (X, A), wenn es endliche Maße μ1 , . . . , μ N auf (X, A) und Zahlen c1 , . . . , c N ∈ C gibt, so dass μ(S) =
N
cn μn (S).
(15.18)
n=1
Die bisher betrachteten Maße werden im Gegensatz dazu als positive Maße bezeichnet, wenn Verwechslungen zu befürchten sind. b. Eine Funktion f : X −→ C heißt μ-summierbar, wenn f bezüglich μ1 , . . . , μ N summierbar ist. Man setzt dann f dμ := S
N n=1
f dμn .
cn
(15.19)
S
Bemerkungen (i) Die Darstellung eines komplexen Maßes in der Form (15.18) ist natürlich nicht eindeutig, und man muss daher nachprüfen, dass Summierbarkeit und das
B
Spektralmaße und Spektralintegrale
45
Integral einer Funktion f nicht von der gewählten Darstellung abhängen. Das ist jedoch eine leichte Übung. (ii) Die hier (nach [64]) angegebene Definition von komplexen Maßen ist für unsere Zwecke besonders praktisch, ist aber nicht die in der mathematischen Literatur übliche. Eine gründlichere Einführung in die Theorie der komplexen Maße wird z. B. in [72] gegeben. Dort wird auch die sog. Polarzerlegung von komplexen Maßen hergeleitet, aus der sich die Äquivalenz der beiden Definitionen leicht folgern lässt. Rechenregeln für die Integrale bezüglich komplexer Maße ergeben sich trivial aus den entsprechenden Regeln für positive Maße. Klar ist auch, dass z. B. jede beschränkte A-messbare Funktion in Bezug auf jedes auf A definierte komplexe Maß summierbar ist. Bevor wir nun einen Zusammenhang zwischen komplexen Maßen und Spektralmaßen herstellen, wollen wir uns auf die (beschränkten) Sesquilinearformen auf H × H besinnen (vgl. Definition 8.17), die gemäß Theorem 8.18 in bijektiver Korrespondenz zu den beschränkten linearen Operatoren in H stehen. Dieses Theorem bedeutet, dass jeder Operator T ∈ B(H ) durch seine Matrixelemente x|T y , x, y ∈ H beschrieben werden kann. Hier und auch im weiteren Verlauf werden wir öfters ausnutzen, dass für K = C jede Sesquilinearform h : H × H −→ C – und damit auch jeder beschränkte lineare Operator T ∈ B(H ) – schon durch die entsprechende quadratische Form q(x) := h(x, x) eindeutig festgelegt ist: Lemma 15.6 Sei H ein komplexer H ILBERTraum. a. Für jede Sesquilinearform h auf H und die entsprechende quadratische Form q(x) := h(x, x) gilt die Polarisationsgleichung h(x, y) =
i 1−i 1 q(x + y) − q(x + iy) − (q(x) + q(y)) 2 2 2
für alle x, y ∈ H . b. Jedes T ∈ B(H ) ist durch die entsprechende quadratische Form qT (x) := x|T x eindeutig bestimmt. Beweis a. Wegen der Sesquilinearität (Gln. (8.21) und (8.22)) ergibt sich durch Ausdistribuieren q(x + y) = q(x) + q(y) + h(x, y) + h(y, x) , i
−1
q(x + iy) = i−1 (q(x) + q(y)) + h(x, y) − h(y, x).
46
15 Spektralmaße
Addieren dieser beiden Gleichungen und Auflösen nach h(x, y) ergibt die Polarisationsgleichung. b. Seien T1 , T2 ∈ B(H ) so, dass qT1 ≡ qT2 . Aus der Polarisationsgleichung folgt dann x|T1 y = x|T2 y für alle x, y ∈ H , also T1 = T2 nach Theorem 8.18. Bemerkung Hier ist wesentlich, dass K = C. Auf dem reellen H ILBERTraum H = R2 etwa hat man die Sesquilinearform h(x, y) = x1 y2 −x2 y1 mit der quadratischen Form q ≡ 0. Der zu h gehörige Operator ist die Drehung um den Winkel π/2. Satz 15.7 Eine Abbildung E : A −→ B(H ) auf einem messbaren Raum (X, A), deren Werte orthogonale Projektionen sind, mit E(X ) = I
(15.10)
ist genau dann ein Spektralmaß, wenn für je zwei Vektoren x, y ∈ H μx,y (S) := x | E(S)y
(15.20)
ein komplexes Maß ist. Beweis a. Sei zunächst E(S) ein Spektralmaß auf (X, A). Für x, y ∈ H gilt nach Lemma 15.6 μx,y (S) = x | E(S)y 1−i 1−i x | E(S)x − y | E(S)y (15.21) =− 2 2 1 i + x + y | E(S)(x + y) − x + iy | E(S)(x + iy) . 2 2 Nach Satz 15.4 steht auf der rechten Seite eine komplexe Linearkombination von 4 endlichen Maßen, was beweist, dass durch (15.20) ein komplexes Maß definiert ist. b. Sei nun umgekehrt μx,y stets ein komplexes Maß. Dann ist μx,y insbesondere endlich-additiv, d. h. für eine endliche disjunkte Mengenfolge (S1 , . . . , Sn ) in n A mit S := Sk gilt k=1
x|E(S)y = μx,y (S) =
n k=1
nach Theorem 8.18 also
n μx,y (Sk ) = x E(Sk )y , k=1
B
Spektralmaße und Spektralintegrale
47
E(S) =
n
E(Sk ) .
(∗)
k=1
Nun sei (Sk )k≥1 eine unendliche Folge von disjunkten Mengen aus A und S := ∞ n Sk . Mit Rn := Sk haben wir dann nach (∗) k=1
k=1
E(S) −
n
E(Sk ) = E(S\Rn ) .
k=1
Für jedes x ∈ H ist also 2 n E(Sk )x = E(S\Rn )x2 = x|E(S\Rn )x = μx (S\Rn ), E(S)x − k=1
und nach Satz 10.3d. verschwindet dies für n → ∞, denn μx ist ein endliches ∞ positives Maß und (S\Rn ) = ∅. Also folgt n=1
E(S)x =
∞
E(Sk )x
k=1
im Sinne der Norm von H , was nach Definition 15.1 zu zeigen ist. Nun besprechen wir, wie beschränkte messbare Funktionen auf X bezüglich eines gegebenen Spektralmaßes integriert werden können.
Notationen Wir bezeichnen mit M∞ ≡ M∞ (X, A) den normierten linearen Raum der beschränkten A-messbaren (komplexwertigen) Funktionen auf X , versehen mit der Supremumsnorm · ∞ . (Wegen Satz 10.16b ist er sogar ein BANACHraum, aber das benötigen wir nicht.) Weiter setzen wir M∞ e := LH(χ S | S ∈ A) . Die Elemente von M∞ e nennt man einfache messbare Funktionen. Es handelt sich offenbar um die messbaren Funktionen, die nur endlich viele Wertte annehmen. Sei nun E : A −→ B(H ) ein Spektralmaß, und seien μx die durch (15.17) gegebenen endlichen positiven Maße. Jedes f ∈ M∞ (X, A) ist dann μx -summierbar,
48
15 Spektralmaße
also auch μx,y -summierbar für die durch (15.20) gegebenen komplexen Maße μx,y , x, y ∈ H . Von einem sinnvollen Integral T = f dE wäre zu erwarten, dass gilt: x|T y = f dμx,y ∀ x, y ∈ H, (15.22) und nach Theorem 8.18 ist T durch diese Forderung jedenfalls eindeutig bestimmt. Für g ∈ M∞ e , etwa g=
m
a j χS j
(15.23)
j=1
ist auch klar, wie solch ein Integral zu definieren wäre, nämlich g dE :=
m
a j E(S j ) .
(15.24)
j=1
Dann ist (15.22) offenbar erfüllt. Die Darstellung einer einfachen messbaren Funktion in der Form (15.23) ist zwar nicht eindeutig, aber die gerade festgestellte Eindeutigkeit sichert, dass verschiedene derartige Darstellungen immer denselben Operator (15.24) liefern werden. Also ist durch (15.24) eine Abbildung Ψe : M∞ e −→ B(H ) wohldefiniert, und es ist auch klar, dass es sich um eine lineare Abbildung handelt. Diese hat die bemerkenswerte Eigenschaft Ψe (gh) = Ψe (g)Ψe (h) ,
g, h ∈ M∞ e .
Schreiben wir nämlich g=
a j χS j ,
j
h=
bk χ Rk ,
k
so ist wegen χ S χ R = χ S∩R einerseits a j bk χ S j ∩Rk gh = j,k
und wegen (15.15) andererseits Ψe (g)Ψe (h) =
j,k
a j bk χ S j ∩Rk = Ψe (gh) .
(15.25)
B
Spektralmaße und Spektralintegrale
49
Die orthogonalen Projektionen E(S) sind nach Satz 8.26 selbstadjungiert, also ergibt (15.24) sofort ¯ = Ψe (g)∗ . Ψe (g)
(15.26)
Nun folgt Ψe (|g|2 ) = Ψe (g)∗ Ψe (g), also für alle x ∈ H
|g|2 dμx = x|Ψe (g)∗ Ψe (g)x = Ψe (g)x2 ,
d. h. wir haben Ψe (g)x =
1/2 |g|2 dμx
für alle x ∈ H, g ∈ M∞ e .
(15.27)
Wegen (15.10) ist μx (X ) = x2 , also folgt weiter Ψe (g)x ≤ g∞ · x.
(15.28)
Insbesondere ist Ψe (g) ≤ g∞ für alle g ∈ M∞ e , und das zeigt, dass die lineare Abbildung Ψe auch stetig ist (vgl. Satz 8.3a). Dies ermöglicht es, das Integral f dE für allgemeines f ∈ M∞ durch Approximation zu definieren. Es gilt nämlich ∞ Lemma 15.8 M∞ e ist dicht in M .
Beweis Da man Real- und Imaginärteil getrennt approximieren kann, genügt es, eine reellwertige Funktion f ∈ M∞ (X, A) zu betrachten. Sei also etwa f (X ) ⊆ [−C, C]. Für m ∈ N und k ∈ Z |k| ≤ m setzen wir Sm,k := f −1
k−1 k C, C m m
und dann gm :=
m kC χS . m m,k
k=−m
Da f messbar ist, sind Sm,k ∈ A, also gm ∈ M∞ e . Ferner überprüft man leicht: f − gm ∞ ≤
C −→ 0 für m → ∞. m
Nach dem BLE-Theorem (Theorem 8.7) kann man Ψe also zu einem eindeutigen beschränkten linearen Operator Ψ : M∞ → B(H ) fortsetzen (man beachte auch
50
15 Spektralmaße
Satz 8.8), der durch (8.6) definiert ist. Damit übertragen sich auch die Beziehungen (15.22) sowie (15.25), (15.26), (15.27) und (15.28) auf Ψ , und wir bekommen: Satz und Definition 15.9 Sei (X, A) ein messbarer Raum, E : A −→ B(H ) ein Spektralmaß, und seien μx , μx,y für x, y ∈ H die durch (15.17) bzw. (15.20) gegebenen positiven bzw. komplexen Maße. Zu jedem f ∈ M∞ gibt es dann genau einen Operator T = Ψ ( f ) ∈ B(H ) mit x|T y =
∀ x, y ∈ H .
f dμx,y
(15.22)
Die hierdurch definierte Abbildung Ψ : M∞ −→ B(H ) ist ein stetiger linearer Operator. Man nennt Ψ ( f ) das Spektralintegral von f und schreibt Ψ(f) =
f dE =
f (t) dE(t). X
Es hat die folgenden zusätzlichen Eigenschaften:
f g dE =
f¯ dE =
g dE ,
f dE
∗ f dE
,
(15.25)
(15.26)
2 f dE x = | f |2 dμx ,
(15.27)
f dE ≤ f ∞
(15.28)
für f, g ∈ M∞ und x ∈ H . Bemerkung Wenn man ein gegebenes f ∈ M∞ nach Lemma 15.8 durch g = a1 χ S1 + . . . + am χ Sm approximiert, etwa mit f − g∞ < ε, so folgt mit (15.24) und (15.28) m f dE − a E(S ) j j < ε. j=1 Dies zeigt, dass man das Spektralintegral einer beschränkten messbaren Funktion in der Operatornorm durch so etwas wie „R IEMANNsche Summen“ approximieren kann.
B
Spektralmaße und Spektralintegrale
51
Man benötigt noch eine Eigenschaft der Spektralintegrale, die sich auf die Vertauschbarkeit mit weiteren Operatoren bezieht, und diese hat wichtige Konsequenzen für invariante Teilräume. Wie in der linearen Algebra üblich (vgl. etwa [34], Kap. 7), bezeichnen wir dabei einen linearen Teilraum U ⊆ H als T -invariant, wenn T (U) ⊆ U (T ∈ B(H ) gegeben). Um diese Konsequenzen zu diskutieren, betrachten wir eine orthogonale Zerlegung H = U ⊕ U ⊥, wo U ein abgeschlossener linearer Teilraum ist. Sei P die orthogonale Projektion auf U und Q = I − P die auf U ⊥ . Für beliebige Operatoren T ∈ B(H ) gilt dann T (U) ⊆ U
⇐⇒
QT P = 0 ,
T (U ⊥ ) ⊆ U ⊥
⇐⇒
P T Q = 0, (15.29)
wie man leicht nachrechnet (Übung!). Wegen (QT P)∗ = P T ∗ Q folgt hieraus sofort T (U) ⊆ U
⇒
T ∗ (U ⊥ ) ⊆ U ⊥ .
(15.30)
Sind U und U ⊥ beide T -invariant, so haben wir 0 = QT P = (I − P)T P = T P − P T P und auch 0 = P T Q = P T (I − P) = P T − P T P, also P T = P T P = T P. Ist umgekehrt T P = P T vorausgesetzt, so folgt QT P = Q P T = 0 und P T Q = T P Q = 0. Somit gilt auch T (U) ⊆ U und T (U ⊥ ) ⊆ U ⊥
⇐⇒
T P = PT
⇐⇒
T Q = QT. (15.31)
Satz 15.10 Sei E ein∞Spektralmaß auf dem messbaren Raum (X, A) , Ψ ( f ) := f dE für f ∈ M (X, A), und sei B ∈ B(H ) ein weiterer Operator. Dann sind äquivalent: (i) BΨ ( f ) = Ψ ( f )B für alle f , (ii) B E(S) = E(S)B für alle S ∈ A, (iii) für jedes S ∈ A sind die Teilräume R(E(S)) und N (E(S)) B-invariant, d. h. sie werden von B in sich abgebildet. Beweis Die Äquivalenz (i) ⇐⇒ (ii) folgt sofort aus (15.24) und der Stetigkeit von Ψ . Die Äquivalenz (ii) ⇐⇒ (iii) gilt nach (15.31).
Spektralscharen Für viele Zwecke ist es ausreichend, Spektralmaße auf dem messbaren Raum (R, B 1 ) zu betrachten, wo B 1 die B ORELalgebra der reellen Geraden ist (Defini-
52
15 Spektralmaße
tion 10.8b). Diese Spektralmaße kann man durch einfachere Projektorscharen beschreiben, nämlich durch E λ := E(] − ∞, λ]) ,
λ ∈ R.
(15.32)
Satz und Definition 15.11 Sei E ein Spektralmaß auf (R, B 1 ) und (E λ )λ∈R die durch (15.32) gegebene Projektionenschar. a. Es gilt: (i) Für λ ≤ μ ist E λ E μ = E μ E λ = E λ . (ii) lim E λ x = 0 und lim E λ x = x für alle x ∈ H . (iii)
λ→−∞
λ→+∞
lim E λ+δ x = E λ x für alle x ∈ H, λ ∈ R.
δ→0+
b. Jede Schar (E λ , λ ∈ R) von orthogonalen Projektionen in H , für die die drei Bedingungen aus Teil a. gelten, nennt man eine Spektralschar. c. Die durch (15.32) gegebene Spektralschar legt das Spektralmaß E eindeutig fest. Beweis Eigenschaft (i) folgt direkt aus (15.15) und (15.32), die beiden anderen aus der σ -Additivität des Spektralmaßes. Für (iii) z. B. betrachtet man eine Nullfolge (δn ) von positiven Zahlen und beachtet E λ+δn = E λ + E(]λ, λ + δn ]), also E λ+δn x − E λ x2 = E(]λ, λ + δn ])x2 = μx (]λ, λ + δn ]), und gemäß 10.3d geht das nach Null für n → ∞, da
∞
]λ, λ+δn ] = ∅. Eigenschaft
n=1
(ii) wird ganz ähnlich bewiesen (Übung!). Da das System der Intervalle ] − ∞, λ] die B ORELalgebra B 1 erzeugt, sind die Maße μx schon durch die Werte vx (λ) := μx (] − ∞, λ]) = x|E λ x eindeutig festgelegt (Aufgabe 10.7). Mit Lemma 15.6b folgt hieraus Teil c des Satzes. Das Spektralintegral einer stetigen Funktion mit kompaktem Träger kann mit Hilfe der Spektralschar als eine Art S TIELTJES-Integral mit projektorwertigem Integrator aufgefasst werden (vgl. Beispiel 10.12). Um dies einzusehen, betrachten wir ein f ∈ Cc (R), etwa mit Tr f ⊆ [a, b]. Wegen der gleichmäßigen Stetigkeit von f haben wir dann zu jedem ε > 0 eine Zerlegung a = t0 < t1 < · · · < tm = b, bei der die Durchmesser der Mengen f (]tk−1 , tk ]) für k = 1, . . . , m stets < ε sind. Wählt man nun irgendwelche Stützstellen sk ∈]tk−1 , tk ] und setzt
C
Die C ∗ -Algebra der beschränkten messbaren Funktionen
g :=
m
53
f (sk )χ]tk−1 ,tk ] ,
k=1
so ist offenbar g ∈ Mi∞ und f − g∞ < ε, also nach (15.24), (15.28) und (15.32) m f (sk )(E tk − E tk−1 ) < ε. f dE − k=1
Also ist f dE tatsächlich (in der Operatornorm!) der Limes von R IEMANN S TIELTJES-Summen, bei denen die Spektralschar die Rolle des Integrators spielt. Für x ∈ H ist natürlich
f dμx = x |
f dE x =
b
f (λ) dvx (λ)
a
mit dem monoton nichtfallenden Integrator vx (λ) := x|E λ x , d. h. μx ist das L EBESGUE -S TIELTJES-Maß, das vom Integrator vx erzeugt wird. Bemerkung Jede Spektralschar (E λ )λ∈R entsteht durch (15.32) aus einem geeigneten Spektralmaß auf B 1 . Dieses Spektralmaß kann konstruiert werden, indem man für λ ≤ μ E(]λ, μ]) := E μ − E λ setzt und die Abbildung E dann, ähnlich wie bei skalaren Maßen, auf immer allgemeinere Mengen ausdehnt (vgl. etwa [64]).
C Die C ∗ -Algebra der beschränkten messbaren Funktionen Wir führen nun eine neue Terminologie ein, in der sich Satz 15.9 bequem formulieren lässt. Sie ist der Ausgangspunkt einer umfangreichen Theorie, die für die Quantenmechanik von Systemen mit vielen Freiheitsgraden von eminenter Bedeutung ist, für deren weiteren Ausbau wir jedoch auf die entsprechende Fachliteratur verweisen müssen, etwa auf [11, 26, 27, 36, 78, 79]. Wir erinnern daran, dass eine bilineare Abbildung dadurch gekennzeichnet ist, dass sie sich in jedem ihrer beiden Argumente linear verhält (vgl. Definition 2.8 und Abschn. 7E). Definitionen 15.12 a. Sei (A, · ) ein normierter linearer Raum (über K). Eine Multiplikation auf A ist eine bilineare Abbildung
54
15 Spektralmaße
m : A × A −→ A , (x, y) −→ x y, für die das Assoziativgesetz x(yz) = (x y)z
∀ x, y, z ∈ A
gilt. Der NLR A zusammen mit einer gegebenen Multiplikation heißt normierte Algebra, falls noch x y ≤ x · y
∀ x, y ∈ A
gilt. Eine vollständige normierte Algebra heißt BANACHalgebra. b. Eine normierte Algebra A heißt kommutativ, wenn x y = yx
∀ x, y ∈ A.
c. Ein Einselement (kurz: eine Eins) der normierten Algebra A ist ein e ∈ A, für das gilt: ex = xe = x
∀ x ∈ A.
Hat A ein Einselement e und gilt dabei e = 1, so nennt man A eine normierte Algebra mit Eins bzw. eine BANACHalgebra mit Eins. d. Nun sei A eine normierte Algebra über K = C. Eine Involution in A ist eine Abbildung A −→ A : x −→ x ∗ mit den Eigenschaften (x + y)∗ = x ∗ + y ∗ , (αx)∗ = αx ¯ ∗, (x y)∗ = y ∗ x ∗ ,
x ∗∗ = x
für alle x, y ∈ A , α ∈ C. Hat A eine Eins e, so verlangt man zusätzlich e∗ = e. Eine C ∗ -Algebra ist eine komplexe BANACHalgebra mit Eins und einer Involution, für die außerdem noch gilt: (C ∗ )
x ∗ x = x2
∀x ∈ A.
Zwei Kommentare sind angebracht: (i) Das Einselement ist stets eindeutig bestimmt. Sind nämlich e, e Einselemente in A, so ist ee = e , weil e eine Eins ist, aber auch ee = e, weil e eine Eins ist. Es folgt e = e , und daher kann man von dem Einselement reden. (ii) Warum Bedingung (C ∗ ) von ausschlaggebender Bedeutung ist, kann hier nicht zwingend begründet werden, und man sollte es als Erfahrungstatsache akzeptieren. Einerseits ist sie in vielen wichtigen Fällen erfüllt, und andererseits hat sie Konsequenzen von großer Tragweite, die die C ∗ -Algebren – vor allem für
C
Die C ∗ -Algebra der beschränkten messbaren Funktionen
55
die Physik – deutlich über andere BANACHalgebren hinausheben. Wir wollen hier nur eine ganz einfache Folgerung herleiten, nämlich x ∗ = x
∀ x ∈ A.
(15.33)
Es ist nämlich x2 = x ∗ x ≤ x ∗ · x, also x ∗ ≤ x für alle x (für x = 0 ist (15.33) trivial!). Da dies auch für x ∗ gilt, haben wir auch x = x ∗∗ ≤ x ∗ , insgesamt also (15.33). Beispiele 15.13 a. Ist E ein normierter Raum, so ist A := B(E) eine normierte Algebra mit Eins. Die Multiplikation ist hier die übliche Multiplikation (= Verkettung) von linearen Operatoren, die Eins ist der identische Operator I , und die Norm ist die Operatornorm (beachte Korollar 8.6!). Nach Satz 8.8 ist B(E) sogar eine BANACHalgebra, wenn E ein BANACHraum ist. b. Ist H ein komplexer H ILBERTraum, so hat man in der komplexen BANACHalgebra A := B(H ) eine Involution, nämlich die Bildung des adjungierten Operators. Diese erfüllt auch Bedingung (C ∗ ) (vgl. Satz 8.20), und daher ist B(H ) eine C ∗ -Algebra. c. Beschränkte skalare Funktionen auf einer festen Menge M kann man punktweise multiplizieren, und für die Supremumsnorm gilt dabei f g∞ ≤ f ∞ · g∞ , d. h. der BANACHraum aller beschränkten skalaren Funktionen auf M ist sogar eine (kommutative) BANACHalgebra mit Eins. (Das Einselement ist die Funktion, die konstant den Wert 1 hat.) Im Fall K = C hat man ferner die Involution f ∗ := f¯, also die Bildung der konjugiert komplexen Funktion, und damit handelt es sich um eine C ∗ -Algebra, denn
∗
f f ∞ = sup | f (x)| = 2
x∈M
2 sup | f (x)| x∈M
= f 2∞ .
d. Nun sei M ein topologischer Raum, z. B. eine Teilmenge von Rn oder eine differenzierbare Mannigfaltigkeit. Das punktweise Produkt von stetigen Funktionen ist stetig, und der gleichmäßige Limes einer Folge von stetigen Funktionen ist ebenfalls stetig. Daher bilden die beschränkten stetigen komplexwertigen Funktionen auf M mit der punktweisen Multiplikation, der Supremumsnorm und der Involution f ∗ = f¯ wieder eine kommutative C ∗ -Algebra. Ist M kompakt, so besteht diese aus allen stetigen Funktionen und wird meist mit C(M) bezeichnet. e. Sei (X, A) ein messbarer Raum. Der im vorigen Abschnitt eingeführte BANACHraum M∞ (X, A) bildet mit der punktweisen Multiplikation und der Involution f ∗ = f¯ offenbar ebenfalls eine kommutative C ∗ -Algebra.
56
15 Spektralmaße
f. Bei einem Maßraum (X, A, μ) ändert sich das punktweise Produkt zweier messbarer Funktionen f, g nur auf einer μ-Nullmenge, wenn f und g auf μ-Nullmengen abgeändert werden. Daher induziert die punktweise Multiplikation auch auf dem BANACHraum L ∞ (X, μ) (vgl. 10.34 sowie Abschn. 7A) eine Multiplikation, und mit dieser Multiplikation sowie der Involution f ∗ = f¯ bildet auch L ∞ (X, μ) eine kommutative C ∗ -Algebra. g. Ein linearer Teilraum B einer normierten Algebra A wird als Teilalgebra bezeichnet, wenn gilt x, y ∈ B
⇒
xy ∈ B .
Ist A eine BANACHalgebra und B eine abgeschlossene Teilalgebra, so ist offenbar auch B eine BANACHalgebra. Eine abgeschlossene Teilalgebra B einer C ∗ -Algebra ist wieder eine C ∗ -Algebra, wenn sie selbstadjungiert ist, d. h. wenn gilt: x∈B
⇒
x ∗ ∈ B.
Zum Beispiel ist für eine kompakte Teilmenge X ⊆ Rn die Algebra C(X ) eine selbstadjungierte abgeschlossene Teilalgebra von M∞ (X, A), wobei A := {S ∩ X | S ∈ B n } die B ORELalgebra von X ist. Denn für stetiges f : X → R sind die Mengen (10.18) ja offen in X und damit auch B ORELmengen, und daher ist jede stetige Funktion B OREL-messbar. Für allgemeinere kompakte Räume gilt Analoges, wenn der Begriff der B ORELmenge in geeigneter Weise verallgemeinert wird (vgl. etwa [6]). Ein wesentlicher Punkt in dieser Theorie besteht darin, die Elemente einer gegebenen Algebra als lineare Operatoren auf einem Vektorraum „darzustellen“. Hierzu definieren wir: Definitionen 15.14 a. Sei A eine BANACH algebra und E ein BANACH raum. Eine Darstellung von A auf E ist eine stetige lineare Abbildung Ψ : A → B(E), die zugleich ein Algebrenhomomorphismus ist, d. h. für die gilt: Ψ (x y) = Ψ (x)Ψ (y)
∀ x, y ∈ A
sowie Ψ (e) = I , wenn A eine Eins e hat. b. Sei A eine C ∗ -Algebra und H ein komplexer H ILBERTraum. Eine Darstellung Ψ : A → B(H ) wird als ∗-Darstellung bezeichnet, wenn zusätzlich gilt: Ψ (x ∗ ) = (Ψ (x))∗
∀x ∈ A.
C
Die C ∗ -Algebra der beschränkten messbaren Funktionen
57
Bemerkung In der Physik spricht man oft von Darstellungen irgendwelcher Relationen (z. B. der kanonischen Vertauschungsrelationen) durch Operatoren im H ILBERTraum. Damit ist eigentlich nur die Angabe von konkreten Operatoren gemeint, die diese Relationen erfüllen. Die Terminologie ist jedoch mit der hier eingeführten kompatibel, denn man kann immer eine (abstrakte) Algebra angeben, in der die betrachteten Relationen gelten und sonst keine, und die Darstellung der Relationen durch Operatoren aus B(H ) entspricht dann einer Darstellung dieser Algebra auf H im hier definierten Sinne. Der Grund, warum all dies ins Umfeld der Spektralmaße gehört, liegt nun in dem folgenden fundamentalen Satz: Theorem 15.15 Sei (X, A) ein messbarer Raum, und sei H ein komplexer H ILBERTraum. a. Jedes Spektralmaß E : A −→ B(H ) definiert eine ∗-Darstellung der C ∗ Algebra M∞ (X, A) auf H durch (15.34) Ψ ( f ) := f dE , f ∈ M∞ . Diese erfüllt die Stetigkeitsbedingung (W) Ist ( f k ) eine beschränkte Folge in M∞ und f (t) = lim f k (t) für alle k→∞
t ∈ X , so gilt x | Ψ ( f )y = lim x | Ψ ( f k )y k→∞
∀ x, y ∈ H.
b. Jede ∗-Darstellung Ψ von M∞ (X, A) auf H , die die Bedingung (W) erfüllt, rührt auf diese Weise von einem eindeutigen Spektralmaß auf (X, A) her. Dieses Spektralmaß ist gegeben durch E(S) := Ψ (χ S ) ,
S ∈ A.
(15.35)
Beweis a. Nur Bedingung (W) ist noch zu zeigen, denn alles andere steht schon in Satz 15.9. Sei also ( f k ) eine beschränkte Folge in M∞ mit punktweisem Limes f . Dann ist f messbar nach Satz 10.16b, und wenn etwa f k ∞ ≤ C für alle k ist, so folgt auch supt∈X | f (t)| ≤ C < ∞, d. h. wir haben f ∈ M∞ . Für x ∈ H folgt nun f k (t) dμx (t) f (t) dμx (t) = lim k→∞
aus dem Satz über die dominierte Konvergenz, denn wegen μx (X ) < ∞ kann man eine konstante Funktion als integrierbare Majorante verwenden. Das bedeu-
58
15 Spektralmaße
tet aber schon die Behauptung für x = y, und für beliebige x, y ∈ H folgt sie dann aus der Polarisationsgleichung (Lemma 15.6a). b. Ist Ψ durch (15.34) gegeben und ist S ∈ A, so ist für jedes x ∈ H x|Ψ (χ S )x =
χ S dμx = μx (S) = x|E(S)x ,
also E(S) = Ψ (χ S ) nach Lemma 15.6b. Das Spektralmaß, von dem Ψ herrührt, ist also eindeutig bestimmt und durch (15.35) gegeben. Wir haben daher nur noch nachzuprüfen, dass (15.35) tatsächlich ein Spektralmaß definiert und dass dieses durch (15.34) die gegebene Darstellung Ψ liefert. Für S ∈ A ist χ S = χ S = χ S2 , und da Ψ eine ∗-Darstellung ist, folgt hieraus Ψ (χ S )∗ = Ψ (χ S ) = Ψ (χ S )2 , also E(S)∗ = E(S) = E(S)2 . Die E(S) sind nach Satz 8.26 also jedenfalls orthogonale Projektoren. Wegen Ψ (1) = I gilt dabei auch (15.10). Wir können also Satz 15.7 anwenden, und wegen der Polarisationsgleichung genügt es hierfür, nachzuweisen, dass die Mengenfunktionen μx (S) = x|E(S)x = x|Ψ (χ S )x für x ∈ H Maße auf der σ -Algebra A sind (Definition 10.1). Wegen (8.39) ist μx (S) = E(S)x2 ≥ 0, und μx (∅) = x|Ψ (0)x = 0 ist klar. Für zwei disjunkte Mengen S1 , S2 ∈ A ist χ S1 ∪S2 = χ S1 + χ S2 , also auch Ψ (χ S1 ∪S2 ) = Ψ (χ S1 ) + Ψ (χ S2 ) und somit μx (S1 ∪ S2 ) = μx (S1 ) + μx (S2 ). Dies überträgt sich durch Induktion sofort auf endliche Vereinigungen. Ist nun S die Vereinigung einer unendlichen Folge (S1 , S2 , . . .) von disjunkten Mengen aus A, so setzen n Sk und erhalten wir Rn := k=1
μx (Rn ) =
n
μx (Sk )
für alle n ∈ N .
k=1
Aber (χ Rn )n∈N ist eine beschränkte Folge in M∞ , die punktweise gegen χ S konvergiert. Bedingung (W) liefert daher μx (S) = lim μx (Rn ) = n→∞
∞
μx (Sk ),
k=1
also die σ -Additivität der μx . Somit ist E ein Spektralmaß und erzeugt gemäß (15.34) eine ∗-Darstellung Ψ von M∞ . Aber für g ∈ M∞ , etwa g = a χ + · · · + a χ haben wir 1 S1 m Sm e (g) = Ψ
m j=1
a j E(S j ) =
m
⎛ ⎞ m a j Ψ (χ S j ) = Ψ ⎝ a j χ S j ⎠ = Ψ (g).
j=1
j=1
D
Spektralintegrale von unbeschränkten messbaren Funktionen
59
(g) = g dE, und dann die Linearität von (Hier wurde zunächst benutzt, dass Ψ Ψ .) Auf dem dichten Teilraum M∞ e stimmen Ψ und Ψ also überein, und da sie beide stetig sind, folgt nun Ψ = Ψ . Korollar 15.16 Für jede ∗-Darstellung von M∞ (x, A), die Bedingung (W) erfüllt, gilt Ψ ( f ) ≤ f ∞
(15.36)
für alle f ∈ M∞ (X, A). Beweis Das folgt direkt aus Theorem 15.15b und Satz 15.9, insbesondere Gl. (15.28).
D Spektralintegrale von unbeschränkten messbaren Funktionen In diesem Abschnitt sei stets (X, A) ein messbarer Raum, E : A −→ B(H ) ein festes Spektralmaß, und es seien μx , μx,y für x, y ∈ H die durch (15.17) bzw. (15.20) gegebenen positiven bzw. komplexen Maße. Wir wollen auch für unbeschränktes messbares f das Spektralintegral f dE definieren und untersuchen. Dieses Spektralintegral ist dann allerdings i. A. auch nur ein unbeschränkter – und dementsprechend auch nicht überall in H definierter – linearer Operator. Satz und Definition 15.17 Sei M ≡ M(X, A) die Menge aller A-messbaren Funktionen f : X −→ C. a. Zu jedem f ∈ M gibt es genau einen dicht definierten Operator T in H mit dem Definitionsbereich D(T ) = {x ∈ H | | f |2 dμx < ∞}, bei dem für jedes x ∈ D(T ) gilt: T x = lim
f n dE x ,
n→∞
(15.37)
sobald die Folge ( f n ) ⊆ M∞ (X, A) in L 2 (X, dμx ) gegen f konvergiert. Diesen Operator nennt man das Spektralintegral von f bezüglich des gegebenen Spektralmaßes, und man schreibt wieder T = f dE = X f (t) dE(t). b. Für f ∈ M , T = f dE und x ∈ D(T ) gilt stets x|T x = und
f dμx
(15.38)
60
15 Spektralmaße
T x2 =
| f |2 dμx .
(15.39)
Beweis a. D(T ) ist ein linearer Teilraum. Denn für z = x + y , x, y ∈ D(T ) haben wir nach der Parallelogrammgleichung (7.3) μz (S) = E(S)x + E(S)y2 ≤ 2E(S)x2 + 2E(S)y2 = 2μx (S) + 2μ y (S) für alle S ∈ A, also nach Definition des Integrals
| f |2 dμz ≤ 2
| f |2 dμx + 2
| f |2 dμ y < ∞
und damit x + y ∈ D(T ). Die Implikation x ∈ D(T ) ⇒ cx ∈ D(T ) für c ∈ C ergibt sich analog, denn man errechnet sofort μcx = |c|2 μx . b. Wir zeigen, dass D(T ) dicht in H ist, und setzen dazu Yn := {t ∈ X | | f (t)| ≤ n} ,
n ∈N.
(15.40)
Zu gegebenem v ∈ H betrachten wir die Folge der xn := E(Yn )v. Ist Z ∈ A , Z ∩ Yn = ∅, so ist E(Z )E(Yn ) = 0, also μxn (Z ) = xn |E(Z )E(Yn )v = 0. Daher ist 2 | f | dμxn = | f |2 dμxn ≤ n 2 μxn (Yn ) = n 2 xn 2 < ∞, Yn
also xn ∈ D(T ) für alle n. Andererseits ist X die disjunkte Vereinigung der Mengen Yk \Yk−1 (mit Y0 := ∅), also v = E(X )v =
∞ k=1
E(Yk \Yk−1 )v = lim E(Yn )v = lim xn . n→∞
n→∞
c. Sei nun x ∈ D(T ) fest gewählt. Wir zeigen zunächst, dass M∞ (X, A) in L 2 (X, dμx ) dicht ist.1 Zu beliebigem g ∈ L 2 (X, dμx ) betrachten wir die Folge der beschränkten messbaren Funktionen gn := gχ Z n
mit Z n := {t ∈ X | |g(t)| ≤ n}.
(15.41)
1 Genau genommen geht es nicht um M∞ selbst, sondern um den Teilraum von L 2 (X, dμ ), der x entsteht, wenn man Funktionen aus M∞ identifiziert, die auf einer μx -Nullmenge übereinstimmen. Diese kleine Ungenauigkeit tut aber dem Beweis keinen Abbruch.
D
Spektralintegrale von unbeschränkten messbaren Funktionen
61
Dann ist g(t) = limn→∞ gn (t) punktweise sowie |g − gn |2 = |g|2 (1 − χ Z n )2 ≤ |g|2 , also limn→∞ g − gn 22 = 0 nach dem Satz über die dominierte Konvergenz (wobei mit · 2 die L 2 (X, dμx )-Norm gemeint ist). Nun ist durch Sx0 : M∞ −→ H , g −→ g dE x ein beschränkter linearer Operator definiert, denn Sx0 g = g2 nach (15.27) aus Satz 15.9. Man kann diesen Operator nach Theorem 8.7 also eindeutig zu einem beschränkten linearen Operator Sx : L 2 (X, dμx ) → H fortsetzen, und wir setzen T x := Sx f. Wegen (8.6) ist T x dann tatsächlich durch (15.37) gegeben. d. Nun wählen wir f n := f χYn mit den Yn aus (15.40). Dann ist f = limn→∞ f n in L 2 (X, dμx ) für jedes x ∈ D(T ), und somit ist T x auf ganz D(T ) durch (15.37) mit dieser festen Funktionenfolge ( f n ) gegeben. Daher ist T ein eindeutig bestimmter linearer Operator D(T ) → H , und (15.39) folgt aus (15.27) durch Grenzübergang n → ∞. Wegen
|g| dμx ≤
1/2 |g|2 dμx
μx (X )1/2
für g ∈ L 2 (X, dμx )
ist außerdem f ∈ L 1 (X, dμx ) für jedes x ∈ D(T ), und damit folgt auch (15.38) aus (15.22) durch Grenzübergang. Bemerkung Wählt man in (15.37) die f n als einfache messbare Funktionen, so erhält man T = f dE wieder als Grenzwert von einer Art R IEMANNscher Summen. Im Unterschied zu dem in Satz 15.9 beschriebenen Spektralintegral einer beschränkten Funktion ist dieser Limes aber nur noch im Sinne der starken Operatorkonvergenz zu verstehen, d. h. für jedes x ∈ H schreibt sich f dE x als ein Limes von endlichen Summen in H . Nun stellen wir die wichtigsten Eigenschaften dieser unbeschränkten Spektralintegrale zusammen. Dabei sind die Schreibweisen und Konventionen über Definitionsbereiche aus dem vorigen Kapitel zu beachten (vgl. Definition 14.3a und Satz 14.17, ferner D(S + T ) := D(S) ∩ D(T )). Theorem 15.18 Mit der Abkürzung Ψ ( f ) := f dE haben wir für alle f, g ∈ M(X, A). a. b. c. d.
Ψ ( f ) + Ψ (g) ⊂ Ψ ( f + g), Ψ ( f )Ψ (g) ⊂ Ψ ( f g). Dabei ist D(Ψ ( f )Ψ (g)) = D(Ψ(g)) ∩ D(Ψ ( f g)). Ψ ( f )∗ = Ψ ( f¯) und Ψ ( f )∗ Ψ ( f ) = Ψ ( f )Ψ ( f )∗ = Ψ | f |2 . Ψ ( f ) ist stets ein abgeschlossener Operator.
62
15 Spektralmaße
Beweis Teil a ist eine leichte Übung, und die Teile b und c folgen mittels der Approximationsformel (15.37) aus den entsprechenden Eigenschaften der Spektralintegrale von beschränkten Funktionen. Die Einzelheiten dieser etwas technischen Beweisführung übergehen wir – man findet sie z. B. in [57]. Teil d schließlich folgt sofort aus Satz 14.18a, denn nach c ist Ψ ( f ) = Ψ ( f¯)∗ . Zum Schluss besprechen wir noch eine Anwendung auf Eigenwerte, die sowohl für beschränkte als auch für unbeschränkte Funktionen f interessant ist: Korollar 15.19 Sei f ∈ M(X, A) , T := f dE und S := f −1 (λ0 ) für ein gegebenes λ0 ∈ C. Dann ist E(S) der orthogonale Projektor auf den Eigenraum N (T − λ0 I ). Insbesondere ist λ0 ein Eigenwert von T genau dann, wenn E(S) = 0. Beweis Wir setzen g(t) := f (t) − λ0 . Dann ist g dE = f dE − λ0 dE = T − λ0 I . Nach (15.39) ist also 2 2 T y − λ0 y = |g| dμ y = |g|2 dμ y , X \S
da g auf S verschwindet. Aber |g|2 > 0 auf X \S, also ist |g|2 dμ y = 0 ⇐⇒ y ∈ N (T − λ0 I ) ⇐⇒ X \S
μ y (X \S) = 0.
Aber wegen E(X ) = I ist μ y (X \S) = E(X \S)y2 = y − E(S)y2 und somit μ y (X \S) = 0
⇐⇒
y = E(S)y
⇐⇒
y ∈ R(E(S)).
Insgesamt folgt die Behauptung.
Aufgaben zu Kap. 15 15.1 a. Man zeige, dass durch (15.4) ein Spektralmaß im Sinne von Definition 15.1 auf A := P(σ (A)) gegeben ist (vgl. Beispiele 10.2) und dass λk dE(λ) = Ak für alle k ∈ N0 und sogar für alle k ∈ Z, falls 0 ∈ σ (A).
Aufgaben
63
b. Man zeige, dass durch (15.8) ein Spektralmaß auf A := P(σ (A) × σ (B)) gegeben ist und dass
λk μ dE(λ, μ) = Ak B
für k, ∈ N0 . c. Man zeige, dass auf der B ORELalgebra Bn ein Spektralmaß durch E(S) := Mχ S definiert ist und dass f dE = M f ist für alle f ∈ M∞ (Rn , B n ). Hierbei bezeichnet M f den Multiplikationsoperator mit der Funktion f im H ILBERTraum H = L 2 (Rn ). 15.2 Sei E : A → B(H ) ein Spektralmaß und U ∈ B(H ) ein unitärer Operator. Man zeige: Durch E(S) = U −1 E(S)U = U ∗ E(S)U ist dann ebenfalls ein Spektralmaß definiert. 15.3 Sei a : H × H → C eine Sesquilinearform auf dem komplexen H ILBERTraum H , und sei q(x) := a(x, x) die entsprechende quadratische Form. Man beweise die „alternative Polarisationgleichung“ a(x, y) =
i 1 (q(x + y) − q(x − y)) − (q(x + iy) − q(x − iy)). 4 4
15.4 Man definiert eine Relation „≤“ zwischen den selbstadjungierten Operatoren aus B(H ) durch A≤B
def
⇐⇒
x|Ax ≤ x|Bx
∀ x ∈ H.
(15.42)
Man zeige: a. Es handelt sich um eine Ordnungsrelation, d. h. es gilt (i) (ii)
A ≤ B und B ≤ C A ≤ B und B ≤ A
⇒ ⇒
A ≤ C, A = B.
b. Sei (E λ )λ eine Spektralschar. Dann gilt κ≤λ
⇒
Eκ ≤ Eλ.
Was bedeutet das für die Bildräume R(E κ ), R(E λ )? (Hinweis: Man beachte Aufgabe 8.23).
64
15 Spektralmaße
15.5 Man beweise, dass in jeder C ∗ -Algebra A gilt: x x ∗ = x2
∀ x ∈ A.
15.6 Ein Zustand auf der C ∗ -Algebra A ist ein lineares Funktional ψ : A → C mit den Eigenschaften (Z 1)
ψ(x ∗ x) ≥ 0
∀x ∈ A
und (Z 2)
ψ(e) = 1 .
(Physikalisch ist das so zu interpretieren, dass A aus Observablen eines Systems besteht und dass ψ( f ) der Erwartungswert der Observablen f in dem durch ψ beschriebenen physikalischen Zustand ist.) Nun sei Ψ : A → B(H ) eine ∗Darstellung von A auf dem komplexen H ILBERTraum H . Man zeige: a. Ist x ∈ H ein Einheitsvektor, so ist durch ψ( f ) := x|Ψ ( f )x ein Zustand auf A definiert (Vektorzustand). b. Ein weiterer Zustand ist gegeben durch ψ( f ) :=
∞
ρk ek |Ψ ( f )ek .
k=1
Dabei ist ein kompakter, selbstadjungierter und injektiver Operator ρ ∈ B(H ) zugrunde gelegt, dessen Eigenwerte ρk die Bedingungen ρk > 0 ,
∞
ρk = 1
k=1
erfüllen (eine sog. Dichtematrix). Die Vektoren ek bilden eine Orthonormalbasis für H , und jedes ek ist ein Eigenvektor zum Eigenwert ρk (Theorem 9.19). 15.7 Sei (X, A, P) ein Wahrscheinlichkeitsraum (vgl. 10.35). Man zeige: Durch ψ( f ) :=
f dP = f
ist ein Zustand auf der C ∗ -Algebra A = M∞ (X, A) gegeben. Bemerkung Dies entspricht einem klassischen System aus vielen Komponenten, das mit Mitteln der statistischen Physik beschrieben wird. Die C ∗ -Algebren von Ob-
Aufgaben
65
servablen, die in der Quantenmechanik eine Rolle spielen, sind im Allgemeinen nichtkommutativ. 15.8 Man erweitere das Resultat von Aufgabe 15.1c auf alle Funktionen f ∈ M(Rn , B n ). (Hinweis: Für den Nachweis der Übereinstimmung der Definitionsbereiche ist Beispiel 10.31b nützlich.) 15.9 Man zeige: In der Situation aus Aufgabe 15.2 ist
= U −1 f dE
f dE
U
für alle f ∈ M(X, A). 15.10 Es sei U : L 2 (Rn ) −→ L 2 (Rn ) : ψ −→ ψ die F OURIER -P LANCHERELTransformation (Theorem 8.30). Man zeige: a. Durch F(S)ψ := U −1 [χ S ψ] ist auf der B ORELalgebra von Rn ein Spektralmaß F gegeben. b. Es sei P j die (nach Beispiel 14.19c eindeutig bestimmte) L 2 (Rn )-Realisierung des Differentialoperators −i∂/∂ x j . Dann ist Pj =
ξ j dF(ξ ) ,
j = 1, . . . , n .
15.11 Unter den Voraussetzungen und mit den Bezeichnungen aus Korollar 15.19 betrachten wir für ε ≥ 0 die Menge Sε := {t ∈ X | | f (t) − λ0 | ≤ ε}. Man zeige: Jedes y ∈ R(E(Sε )) ist ein „Eigenvektor bis auf ε“ in dem Sinne, dass T y − λ0 y ≤ εy.
Kapitel 16
Der Spektralsatz für selbstadjungierte Operatoren und die quantenmechanische Dynamik
In diesem Kapitel beweisen wir den berühmten Spektralsatz, der besagt, dass jeder selbstadjungierte Operator A im H ILBERTraum H in der Form A = λ dE(λ) (16.1) geschrieben werden kann, wobei E ein eindeutiges Spektralmaß auf (R, B 1 ) ist. Das Integral kann dabei über ganz R erstreckt werden oder auch nur über das Spektrum σ (A), denn Teilmengen von ρ(A) liefern keinen Beitrag. Dieser Satz bildet die mathematische Grundlage für die statistische Interpretation der Quantenmechanik, denn für jeden Einheitsvektor x ∈ H ist μx (S) := x|E(S)x das Wahrscheinlichkeitsmaß für die Verteilung der Meßwerte von A im Zustand x. Darüber hinaus gestattet es der Spektralsatz, Funktionen von Observablen zu betrachten, denn die Vorschrift f (A) := f (λ) dE(λ) (16.2) gibt eine sinnvolle Definition dafür, was es heißt, den Operator A in die Funktion f ∈ M∞ (R, B 1 ) „einzusetzen“. Solche Einsetzungsprozeduren nennt man Funktionalkalküle, und man erwartet von ihnen die Gültigkeit der folgenden Rechenregeln: (α f + βg)(A) = α f (A) + βg(A) ,
( f g)(A) = f (A)g(A) ,
f¯(A) = f (A)∗ (16.3)
(α, β ∈ C) sowie j0 (A) = I ,
j1 (A) = A
für j0 (λ) ≡ 1 , j1 (λ) ≡ λ .
(16.4)
Tatsächlich gelten diese Rechenregeln, wenn man von (16.2) als Definition ausgeht, und sie bedeuten, dass Ψ ( f ) = f (A) eine ∗-Darstellung der betrachteten C ∗ Algebra M∞ liefert. Umgekehrt ergibt sich das gesuchte Spektralmaß aus (15.35), sobald man einen geeigneten Funktionalkalkül für die Algebra M∞ hat. In diesem K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_16, C Springer-Verlag Berlin Heidelberg 2010
67
68
16 Spektralsatz und quantenmechanische Dynamik
Sinne kann man sagen, dass der Spektralsatz äquivalent zur Existenz eines geeigneten M∞ -Funktionalkalküls für den gegebenen Operator A ist. Moderne Beweise des Spektralsatzes gehen zumeist den hier angedeuteten Weg über die Funktionalkalküle, und auch wir wollen dies tun. Dabei betrachten wir zunächst nur beschränkte selbstadjungierte Operatoren, denn für diese ist zumindest das Einsetzen in Polynomfunktionen absolut unproblematisch. Den so entstehenden Funktionalkalkül für die Algebra der Polynome erweitern wir dann in Abschn. A zu einem Funktionalkalkül für stetige Funktionen und dann in B zu einem M∞ Kalkül, der es gestattet, für beschränktes selbstadjungiertes A den Spektralsatz zu beweisen. In Abschn. C werden wir aufzeigen, wie sich ein unbeschränkter selbstadjungierter Operator als Funktion eines beschränkten darstellen lässt, und hierdurch den Spektralsatz auch im unbeschränkten Fall erhalten. Im abschließenden Abschn. D betrachten wir Anfangswertaufgaben der Form 1 d x(t) = Ax(t) , i dt
x(0) = x0 ,
(16.5)
wo x0 ∈ H ein gegebener Vektor und A ein gegebener selbstadjungierter Operator ist. Formal lautet die Lösung dieses Problems natürlich x(t) = eiAt , und wir werden die Spektralzerlegung bzw. den Funktionalkalkül dazu benutzen, diesem Ausdruck einen exakten mathematischen Sinn zu verleihen und zu zeigen, dass er wirklich das Gewünschte leistet. Die wichtigste Anwendung hiervon bezieht sich auf die Situation, wo A der H AMILTONoperator eines quantenmechanischen Systems ist. Dann ist durch die Operatorenschar Ut := eiAt die Dynamik des Systems gegeben, d. h. wenn das System sich zur Zeit t = 0 im Zustand x0 befindet, so befindet es sich zur Zeit t im Zustand x(t) := Ut x0 .
A Der stetige Funktionalkalkül Als Vorbemerkung betrachten wir einen beliebigen Vektorraum V und einen linean ck λk ein Polynom, so definiert man f (A) ren Operator A : V → V . Ist f (λ) = k=0
durch f (A) :=
n
ck Ak .
(16.6)
k=0
Dann sind alle Rechenregeln (16.3), (16.4) erfüllt und darüber hinaus noch (g ◦ f )(A) = g( f (A))
(16.7)
für Polynome f, g. Sind V und A von besonderem Typus, so kann dieser „triviale“ Funktionalkalkül auf größere Algebren von Funktionen ausgedehnt werden. Wir diskutieren dies für
A
Der stetige Funktionalkalkül
69
den Fall, wo V = H ein komplexer H ILBERTraum ist und A ∈ B(H ) ein beschränkter selbstadjungierter (= H ERMITEscher) Operator, und die Symbole H und A sollen für den Rest dieses Abschnitts stets diese Bedeutung haben. Ausgangspunkt aller weiteren Überlegungen ist nun das folgende Lemma: Lemma 16.1 Für jedes komplexe Polynom f gilt σ ( f (A)) = f (σ (A))
(16.8)
f (A) = max | f (λ)|.
(16.9)
und λ∈σ (A)
Beweis a. Wir leiten die zu (16.8) äquivalente Aussage μ ∈ ρ( f (A))
⇐⇒
μ ∈ f (σ (A))
(∗)
her. Zu μ ∈ C betrachten wir die Nullstellen λ1 , . . . , λn des Polynoms f (λ) − μ, jede in ihrer Vielfachheit gezählt. Bekanntlich ist dann (vgl. z. B. [34], Kap. 1) f (λ) − μ = a
n !
(λ − λ j )
mit a = 0.
j=1
Wegen (16.3), (16.4) führt dies auf f (A) − μI = a
n !
(A − λ j I ),
j=1
wobei die Faktoren rechts offenbar miteinander kommutieren. Ist nun μ ∈ f (σ (A)), so ist λ j ∈ σ (A) für alle j, also sind beide Seiten der letzten Gleichung invertierbar, und das bedeutet, dass μ ∈ ρ(A). Ist umgekehrt μ ∈ ρ(A), so hat A − λi I den inversen Operator a( f (A) − μI )−1
!
(A − λ j I ),
j=i
denn da die A − λ j I mit f (A) − μI kommutieren, kommutieren sie auch mit ( f (A) − μI )−1 . Also gehört keines der λi , i = 1, . . . , n , zu σ (A), und daher ist μ ∈ f (σ (A)). Damit ist (∗) gezeigt. b. Wir zeigen (16.9) zunächst für ein reelles Polynom f . Dann ist nämlich B := f (A) ebenfalls H ERMITEsch, also B = maxμ∈σ (B) |μ| nach Theorem 9.10d. Nun folgt (16.9) aus (16.8).
70
16 Spektralsatz und quantenmechanische Dynamik
c. Nun sei B = f (A) mit einem beliebigen komplexen Polynom f . Dann ist g := | f |2 = f¯ f ein reelles Polynom, und g(A) = f¯(A) f (A) = B ∗ B. Wie gerade bewiesen, folgt also
∗
B B = max |g(λ)| = λ∈σ (A)
2 max | f (λ)|
λ∈σ (A)
,
und wegen Satz 8.20c folgt wieder (16.9). Das Spektrum σ (A) ist bekanntlich eine kompakte Teilmenge von R (Theorem 9.10), und wir betrachten ein kompaktes Interall [a, b] ⊇ σ (A). Nach dem klassischen W EIERSTRASSschen Approximationssatz (vgl. etwa [34], Kap. 29) ist jede stetige Funktion auf [a, b] der gleichmäßige Limes einer Folge von Polynomfunktionen. Dies ermöglicht es, den Funktionalkalkül auf die Algebra C([a, b]) fortzusetzen: Satz und Definition 16.2 a. Sei σ (A) ⊆ [a, b]. Dann gibt es genau eine stetige ∗-Darstellung Ψ der C ∗ -Algebra C([a, b]) in H , für die gilt: Ψ ( j0 ) = I ,
Ψ ( j1 ) = A
für j0 (λ) ≡ 1 , j1 (λ) ≡ λ. Diese heißt der stetige Funktionalkalkül zu A auf dem Intervall [a, b], und man schreibt f (A) statt Ψ ( f ) für f ∈ C([a, b]). b. Für alle f ∈ C([a, b]) ist f (A) = max | f (λ)| ≤ f ∞ . λ∈σ (A)
Beweis Wir beginnen mit der Eindeutigkeit. Sei also Ψ : C[(a, b)] −→ B(H ) eine ∗-Darstellung, für die Ψ ( j0 ) = I und Ψ ( j1 ) = A gilt, und sei C P die Teilalgebra der Polynomfunktionen auf [a, b]. Ein Polynom f (λ) = nk=0 ck λk ist als Element der Algebra C([a, b]) dann gegeben durch f =
n
ck j1k ,
k=0
wobei j10 = j0 ist. Die Rechenregeln für eine Darstellung ergeben daher Ψ(f) =
n
ck Ak ,
k=0
d. h. Ψ ( f ) = f (A) im Sinne von (16.6). Da Ψ stetig ist und C P nach dem W EIER STRASS schen Approximationssatz in C([a, b]) dicht liegt, muss Ψ durch die Formel
A
Der stetige Funktionalkalkül
71
Ψ ( f ) = lim gm (A) m→∞
(16.10)
gegeben sein, wo (gm ) eine Folge von Polynomen ist, die gleichmäßig auf [a, b] gegen f konvergiert. Andererseits ist die durch (16.6) definierte ∗-Darstellung Ψ0 : C P −→ B(H ) : f −→ f (A) stetig, denn nach (16.9) ist Ψ0 ( f ) ≤ f ∞ für alle f ∈ C P . Nach dem BLE-Theorem (Theorem 8.7) hat Ψ0 also eine eindeutige, durch (16.10) gegebene Fortsetzung Ψ auf ganz C([a, b]). Durch Grenzübergang übertragen sich dann auch (16.3), (16.4) und (16.9) von Ψ0 auf Ψ , womit alles gezeigt ist. Anmerkung 16.3 Wenn zwei Funktionen f, g ∈ C([a, b]) auf σ (A) übereinstimmen, so ist f (A) = g(A), denn nach Teil b des letzten Satzes haben wir f (A) − g(A) = ( f − g)(A) = max | f (λ) − g(λ)| = 0. λ∈σ (A)
Der Operator f (A) hängt also eigentlich nur von der Einschränkung der Funktion f auf das Spektrum von A ab. Insbesondere spielt die genaue Wahl des Intervalls [a, b] ⊇ σ (A) keine Rolle: Ist f 1 eine stetige Fortsetzung von f ∈ C([a, b]) auf ein Intervall [a1 , b1 ] ⊇ [a, b], so ist f 1 (A) = f (A). Dies eröffnet auch die Möglichkeit, den Funktionalkalkül als Abbildung C(σ (A)) −→ B(H ) aufzufassen. Dazu wählt man ein beliebiges kompaktes Intervall [a, b] ⊇ σ (A) und beachtet, dass sich jede stetige Funktion g auf σ (A) zu einer stetigen Funktion f auf [a, b] fortsetzen lässt (z. B. indem man den Graphen von g über den Intervallen, aus denen [a, b]\σ (A) besteht, durch gerade Strecken ergänzt – vgl. Abb. 16.1). Wie gerade erörtert, hängt f (A) dann weder vom Intervall [a, b] noch von der gewählten Fortsetzung f ab, und man kann g(A) := f (A) setzen. Wir notieren einige Eigenschaften des stetigen Funktionalkalküls, die sich entweder aus den Rechenregeln für eine ∗-Darstellung oder (im Falle von Teil e) direkt aus der Definition ergeben: Korollar 16.4 Sei wieder [a, b] ⊇ σ (A). Für f, g ∈ C([a, b]) haben wir a. f (A)g(A) = g(A) f (A). b. f (A) ist normaler Operator (Definition 8.22). c. f reellwertig auf σ (A) ⇒ f (A) ist selbstadjungiert.
Abb. 16.1 Fortsetzung einer stetigen Funktion von σ (A) auf [a, b]
[
]
a
b
72
16 Spektralsatz und quantenmechanische Dynamik
d. | f (λ)| = 1 für alle λ ∈ σ (A) ⇒ f (A) ist unitär. e. B ∈ B(H ) , B A = AB ⇒ B f (A) = f (A)B. Teil e dieses Korollars hat wichtige Auswirkungen auf invariante Teilräume. Für unseren selbstadjungierten Operator A ergibt (15.30) ja insbesondere A(U) ⊆ U
⇒
A(U ⊥ ) ⊆ U ⊥ .
(16.11)
Verwenden wir in 16.4e also geeignete orthogonale Projektoren als B, so erhalten wir wegen (15.31): Korollar 16.5 Ist U ein A-invarianter abgeschlossener linearer Teilraum von H , so sind U und U ⊥ gegen jeden Operator f (A) , f ∈ C([a, b]), invariant. Ist T (U) ⊆ U, so können wir die Einschränkung T0 := T : U −→ U U
einführen, die ein Element von B(U) ist. Aus dem selbstadjungierten A entsteht dabei offenbar ein selbstadjungierter Operator A0 im H ILBERTraum U. Für diesen gilt: Satz 16.6 Sei U ein A-invarianter abgeschlossener Teilraum von H . Mit den obigen Bezeichnungen gilt: a. σ (A0 ) ⊆ σ (A), b. f (A0 ) = ( f (A))0 für alle f ∈ C([a, b]), wo [a, b] ⊇ σ (A). c. Ist λ0 ein Eigenwert von A und v0 ein entsprechender Eigenvektor, so gilt f (A)v0 = f (λ0 )v0 für jede Funktion f ∈ C([a, b]). Beweis a. Ist λ ∈ ρ(A) , R := (A − λI )−1 , so sind U und U ⊥ offenbar R-invariant. Daher ist R0 = (A0 − λI )−1 in B(U), insbesondere λ ∈ ρ(A0 ). b. Definiere eine Abbildung Ψ0 : C([a, b]) → B(U) durch Ψ0 ( f ) := ( f (A))0 . Triviale Rechnungen bestätigen, dass Ψ0 eine ∗-Darstellung von C([a, b]) in U ist, für die Ψ0 ( j0 ) = I0 , Ψ0 ( j1 ) = A0 gilt. Die Eindeutigkeitsaussage in Satz 16.2a liefert daher die Behauptung. c. Für den selbstadjungierten Operator A˜ := λ0 I ist der stetige Funktionalkal˜ = f (λ0 )I kül (wieder wegen der Eindeutigkeit in 16.2a) offenbar durch f ( A)
A
Der stetige Funktionalkalkül
73
gegeben. Daher folgt die Behauptung aus Teil b, angewandt auf den A-invarianten Unterraum U := LH(v0 ). Die Aussage (16.8) kann auf den stetigen Funktionalkalkül ausgedehnt werden, und das ist für seine Nützlichkeit von großer Bedeutung: Satz 16.7 (Spektraler Abbildungssatz) Für f ∈ C([a, b]) mit [a, b] ⊇ σ (A) gilt stets σ ( f (A)) = f (σ (A)) . Beweis Sei μ ∈ f (σ (A)). Dann ist auf σ (A) die stetige Funktion g0 (λ) := 1/( f (λ) − μ) wohldefiniert, und wir können sie zu einem g ∈ C([a, b]) fortsetzen, wie in Anmerkung 16.3 erläutert. Dann ist g(λ)( f (λ) − μ) = ( f (λ) − μ)g(λ) ≡ 1 auf σ (A), und daraus folgt g(A)( f (A) − μI ) = ( f (A) − μI )g(A) = I, d. h. f (A)−μI hat den inversen Operator g(A), und insbesondere ist μ ∈ ρ( f (A)). Damit ist σ ( f (A)) ⊆ f (σ (A)) gezeigt. Nun sei umgekehrt μ ∈ f (σ (A)), etwa μ = f (λ0 ) mit λ0 ∈ σ (A). Wir stellen f (A) in der Form (16.10) dar, wobei die Folge (gm ) von Polynomen gleichmäßig auf [a, b] gegen f konvergiert. Dann konvergieren die Operatoren Sm := gm (A) − gm (λ0 )I in der Operatornorm gegen T := f (A) − f (λ0 )I = f (A) − μI . Wäre also μ ∈ σ ( f (A)), so wäre T invertierbar, und nach Satz 9.4 wäre dann auch Sm für jedes genügend große m invertierbar, denn wir hätten (Sm − T )T −1 ≤ Sm − T · T −1 → 0. Aber die Sm können nicht invertierbar sein, denn für die Polynome gm stellt (16.8) sicher, dass gm (λ0 ) ∈ σ (gm (A)). Also folgt μ ∈ σ ( f (A)), wie gewünscht. Ist f ∈ C([a, b]) reellwertig, so ist B := f (A) wieder selbstadjungiert, und wenn wir ein Intervall [c, d] ⊇ σ (B) = f (σ (A)) wählen, so haben wir für eine stetige Funktion g : [c, d] → C sowohl den Operator g(B) = g( f (A)) als auch (g ◦ f )(A), denn g ◦ f ∈ C([a, b]). Die Schreibweise suggeriert, dass beide Operatoren übereinstimmen, und das ist auch tatsächlich der Fall: Satz 16.8 Sei [a, b] ⊇ σ (A), f ∈ C([a, b]) reellwertig und g ∈ C([c, d]) beliebig, wo [c, d] ⊇ σ ( f (A)) = f (σ (A)). Dann ist g( f (A)) = (g ◦ f )(A). Beweis Ist g = limm→∞ gm gleichmäßig auf [c, d], so ist auch g ◦ f = limm→∞ (gm ◦ f ) gleichmäßig auf [a, b]. Wenn wir die Behauptung also für den Fall zeigen können, wo g ein Polynom ist, so folgt sie nach dem W EIERSTRASSschen
74
16 Spektralsatz und quantenmechanische Dynamik
Approximationssatz und der Stetigkeitseigenschaft aus Satz 16.2b auch für den alln ck ξ k ein Polynom. Dann ist gemeinen Fall. Sei also g(ξ ) = k=0
g◦ f =
n
ck f k
k=0
mit f 0 = j0 , also folgt (g ◦ f )(A) =
n
ck ( f (A))k = g( f (A)),
k=0
da für die Funktionalkalküle zu A und zu f (A) jeweils die Regeln (16.3) und (16.4) gelten. Beispiel 16.9 (Quadratwurzel eines Operators) Sei nach wie vor A ∈ B(H ) H ER MITE sch. Nach Theorem 9.10d ist die Eigenschaft x|Ax ≥ 0
∀x ∈ H
(16.12)
äquivalent dazu, dass σ (A) ⊆ [0, ∞[. Operatoren, die diese Eigenschaften besitzen, nennt man positiv semidefinit oder kurz positiv und schreibt dafür A ≥ 0 in Übereinstimmung mit der in Aufgabe 15.4 getroffenen Definition. Der stetige Funktionalkalkül ermöglicht einen sehr einfachen Beweis für die folgende wichtige Behauptung Ist A positiv, so hat A genau eine positive selbstadjungierte Quadratwurzel, d. h. es gibt genau einen positiven selbstadjungierten Operator A1/2 mit (A1/2 )2 = A. Beweis Wir stetigen √ w, q : [0, ∞[−→ [0, ∞[ mit √ betrachten die beiden √ Funktionen 2 2 w(λ) := λ und q(λ) := λ . Wegen ( λ) = λ = λ2 für alle λ ≥ 0 ist q ◦ w = w ◦ q = j1 . Ist nun σ (A) ⊆ [0, ∞[, so existiert A1/2 := w(A), und dieser Operator ist selbstadjungiert und positiv nach Korollar 16.4c und Satz 16.7. Ferner ist (A1/2 )2 = q(w(A)) = (q ◦ w)(A) = j1 (A) = A. Ist andererseits W ∈ B(H ) eine positive selbstadjungierte Quadratwurzel von A, so folgt W = j1 (W ) = (w ◦ q)(W ) = w(W 2 ) = w(A) = A1/2 , womit auch die Eindeutigkeit erwiesen ist.
Bemerkung Im Allgemeinen gibt es zu einem positiven H ERMITEschen Operator A viele Quadratwurzeln, von denen aber eben nur eine positiv ist (vgl. Aufgabe 16.7).
A
Der stetige Funktionalkalkül
75
Sie entstehen alle aus A1/2 durch „partiellen Vorzeichenwechsel„, d. h. zu selbstadjungiertem W mit W 2 = A gibt es einen abgeschlossenen, unter W und A1/2 invarianten Unterraum U so, dass Wx =
A1/2 x für x ∈ U ,
W x = −A1/2 x für x ∈ U ⊥ .
Anwendung auf unitäre Operatoren Anwenden von Korollar 16.4d auf die Funktion f (λ) = eiλ zeigt sofort, dass U := exp iA = eiA stets ein unitärer Operator ist. Hiervon gilt auch die Umkehrung: Satz 16.10 Zu jedem unitären Operator U ∈ B(H ) gibt es einen selbstadjungierten Operator A ∈ B(H ) mit σ (A) ⊆ [−π, π ] und U = exp iA. Der Beweis ist ein gutes Beispiel für den Einsatz des stetigen Funktionalkalküls, und man findet ihn in [40] ausführlich dargestellt. Hier wollen wir ihn nur skizzieren, und wir beginnen als Vorbemerkung mit der vereinfachten Situation, wo wir es mit komplexen Zahlen zu tun haben statt mit Operatoren. Sei also u ∈ C , |u| = 1. Um nun den Phasenwinkel α ∈] − π, π ] zu bestimmen, für den u = eiα ist, kann man folgendermaßen vorgehen: Man schreibt u = v+iw mit v := Re u , w := Im u und setzt zunächst β := arccos v, wobei es sich um den√Zweig des Arkuskosinus handelt, der [−1, 1] auf [0, π ] abbildet. Dann ist sin β = 1 − v 2 = ±w, und man setzt α := β, falls sin β = w ist, anderenfalls α := −β (vgl. Abb. 16.2). Dieses Verfahren kann man für Operatoren mit etwas mehr technischem Aufwand imitieren. Zunächst schreibt man U = V + iW mit selbstadjungierten V, W , indem man setzt: V :=
1 (U + U ∗ ) , 2
W :=
1 (U − U ∗ ). 2i
β −β w
Abb. 16.2 Bestimmung des Phasenwinkels über den Arkuskosinus
u
v
76
16 Spektralsatz und quantenmechanische Dynamik
Dann ist V W = W V , also V 2 + W 2 = (V − iW )(V + iW ) = U ∗ U = I und daher V x2 + W x2 = x|V 2 x + x|W 2 x = x2 für alle x. Es folgt V , W ≤ 1 und daher σ (V ), σ (W ) ⊆ [−1, 1] nach Theorem 9.10. Wir können also B := arccos V setzen, und nach dem spektralen Abbildungssatz ist σ (B) ⊆ [0, π ]. Satz 16.8 ergibt außerdem sin B = (I − V 2 )1/2 = (W 2 )1/2 , und wieder unterscheiden sich W und sin B „nur um ein Vorzeichen“. Das bedeutet hier aber – ähnlich wie am Schluss des Beispiels 16.9 – , dass es einen B-invarianten abgeschlossenen Unterraum U ⊆ H gibt mit sin B = −W in U ⊥ ,
sin B = W in U , und man setzt dann " Ax :=
Bx −Bx
für x ∈ U , für x ∈ U ⊥ .
Dann kann man beweisen, dass σ (A) ⊆ [−π, π ] sowie cos A = cos B = V , sin A = W ist. Es folgt exp i A = cos A + i sin A = U , wie gewünscht.
B Der messbare Funktionalkalkül und die Spektralzerlegung für beschränkte selbstadjungierte Operatoren Auch in diesem Abschnitt ist H immer ein komplexer H ILBERTraum und A ein beschränkter selbstadjungierter Operator in H . Ist J ⊆ R ein beschränktes Intervall, so gehört die Funktion j1 (λ) ≡ λ offenbar zu M∞ (J ), und daher haben wir zu einem Spektralmaß E auf (J, B1 ) stets das Spektralintegral j1 dE = λ dE(λ). J
J
Den schon in der Einleitung angekündigten Spektralsatz formulieren wir nun – für den beschränkten Fall – wie folgt: Theorem 16.11 (Spektralsatz) Zu dem selbstadjungierten Operator A ∈ B(H ) und einem kompakten Intervall J = [a, b] ⊇ σ (A) gibt es genau ein Spektralmaß E : (J, B 1 ) −→ B(H ) mit λ dE(λ). (16.13) A= J
Beweis Wir beginnen mit der Eindeutigkeit. Sei also E ein Spektralmaß auf J , das (16.13) erfüllt. Durch Ψ ( f ) := f (λ) dE(λ) J
B
Messbare Funktionalkalkül und Spektralzerlegung
77
ist dann nach Theorem 15.15 eine ∗-Darstellung gegeben, welche die dortige Bedingung (W) erfüllt. Wegen (15.10) und (16.13) erfüllt sie auch Ψ ( j0 ) = I ,
Ψ ( j1 ) = A ,
und nach Satz 16.2a muss Ψ daher auf C(J ) mit dem stetigen Funktionalkalkül zu A übereinstimmen. Ist umgekehrt Ψ eine ∗-Darstellung von M∞ (J ), die (W) erfüllt und auf C(J ) mit dem stetigen Funktionalkalkül übereinstimmt, so wird nach Theorem 15.15 durch E(S) = Ψ (χ S ) ein Spektralmaß E definiert, und für dieses ist λ dE(λ) = Ψ ( j1 ) = j1 (A) = A. J
Daher folgen Existenz und Eindeutigkeit des (16.13) erfüllenden Spektralmaßes aus dem untenstehenden Satz 16.12. Satz und Definition 16.12 Sind A und J wie in Theorem 16.11, so gibt es genau eine stetige lineare Abbildung Ψ von M∞ (J, B 1 ) in B(H ), für die Bedingung (W) gilt sowie Ψ ( f ) = f (A) für alle f ∈ C(J ). Diese ist eine ∗-Darstellung von M∞ (J ). Man nennt sie den messbaren Funktionalkalkül zu A, und man schreibt für jede beschränkte messbare Funktion f wieder f (A) statt Ψ ( f ). Diesen Satz beweisen wir weiter unten in einem Anhang. Zuerst diskutieren wir einige wichtige zusätzliche Eigenschaften des Spektralmaßes zu A: Satz 16.13 Sei E(S) , S ∈ B 1 das Spektralmaß zu A auf J ⊇ σ (A). a. E(S) = 0, falls S ∩ σ (A) = ∅. b. Ist Ω offen in R, so gilt sogar E(Ω ∩ J ) = 0
⇐⇒
Ω ∩ σ (A) = ∅.
Beweis a. Um E(S) = 0 für S ∩ σ (A) = ∅ zu zeigen, verwenden wir die in Satz 15.4 eingeführten positiven endlichen Maße μx , x ∈ H . Es genügt, zu zeigen, dass μx (J \σ (A)) = 0
∀x ,
(∗)
denn dann folgt für S ⊆ J \σ (A) 0 ≤ μx (S) ≤ μx (J \σ (A)) = 0 für alle x und damit E(S) = 0 nach Lemma 15.6b. Um (∗) zu zeigen, betrachten wir für jedes m ∈ N die offene Umgebung U1/m (σ (A)) und wählen eine stetige Funktion ζm mit 0 ≤ ζm ≤ 1, ζm ≡ 0 auf σ (A) und ζm ≡ 1 auf K m := J \U1/m (σ (A)). (Nach Lemma 11.8 gibt es sogar eine
78
16 Spektralsatz und quantenmechanische Dynamik
C ∞ -Funktion mit diesen Eigenschaften, doch wenn nur Stetigkeit verlangt wird, kann man sie sich viel einfacher beschaffen, z. B. durch die Formel ζm (λ) := d(λ, σ (A))/(d(λ, σ (A)) + d(λ, K m )).) Für jedes m ist dann χ K m ≤ ζm , also
0 ≤ μx (K m ) ≤
ζm dμx = x | J
ζm dE x = x|ζm (A)x = 0, J
denn da ζm auf σ (A) verschwindet, ist ζm (A) = 0 nach Satz 16.2b. (vgl. An∞ merkung 16.3). Wegen J \σ (A) = K m folgt (∗) nun aus der σ -Additivität m=1
der μx . b. Für offenes Ω haben wir noch zu zeigen, dass E(Ω ∩ J ) = 0 ⇒ Ω ⊆ ρ(A). Dazu verwenden wir den in Satz 16.12 eingeführten messbaren Funktionalkalkül. Sei also E(Ω ∩ J ) = 0. Ist λ0 ∈ Ω, so gibt es δ > 0 mit Uδ (λ0 ) ⊆ Ω, weil Ω offen ist. Für die Funktion g(λ) := (λ − λ0 )−1 χ J \Ω (λ) gilt dann |g(λ)| ≤ 1/δ, also g ∈ M∞ (J ). Aus g(λ)(λ − λ0 ) = (λ − λ0 )g(λ) = χ J \Ω (λ) folgt g(A)(A − λ0 I ) = (A − λ0 I )g(A) = E(J \Ω) = E(J ) − E(Ω ∩ J ) = I, also g(A) = (A − λ0 I )−1 und insbesondere λ0 ∈ ρ(A).
Anmerkung 16.14 In Verallgemeinerung der für R ADONmaße verwendeten Terminologie (vgl. Bemerkung (i) nach dem Beweis von Korollar 12.4) bezeichnet man das Komplement der größten offenen Menge, in der ein Spektralmaß verschwindet, als den Träger dieses Spektralmaßes. Satz 16.13 lässt sich also zusammenfassen durch die Aussage: Der Träger des Spektralmaßes zu A ist das Spektrum von A.
Teil a. des Satzes hat wieder zur Folge, dass das Intervall J in Wirklichkeit gar keine Rolle spielt. Tatsächlich betrachtet man das Spektralmaß E zu A meist als eine Mengenfunktion, die auf allen B ORELmengen von R definiert ist, indem man ein beliebiges kompaktes Intervall J ⊇ σ (A) wählt und dann E(S) := E(S ∩ J ) setzt. Dies ist eben wegen Satz 16.13a wohldefiniert, d. h. von der speziellen Wahl von J unabhängig. Die Spektralintegrale werden dann auch über ganz R erstreckt, und man schreibt (16.13) in der Form A=
λ dE =
∞ −∞
λ dE(λ).
(16.14)
B
Messbare Funktionalkalkül und Spektralzerlegung
79
Der messbare Funktionalkalkül kann auf alle B OREL-messbaren Funktionen f ∈ M(R, B 1 ) ausgedehnt werden. Man setzt f (A) :=
∞
−∞
f (λ) dE(λ)
(16.15)
und erkennt wie in Anmerkung 16.3, dass dies nur von der Einschränkung f
σ (A)
abhängt. Ist die Funktion f anfangs nur auf σ (A) gegeben, so definiert man f (A) wieder dadurch, dass man sie irgendwie auf ein das Spektrum umfassendes Intervall (oder auf ganz R) fortsetzt. Im Allgemeinen ist f (A) natürlich ein unbeschränkter Operator (aber nach 15.17 und 15.18d immerhin abgeschlossen und dicht definiert!), doch ist er beschränkt, wenn f auf σ (A) beschränkt ist, denn dann kann man f ja zu einem Element von M∞ (R, B 1 ) fortsetzen. Von der Physik her erwartet man, dass die Messung der durch A repräsentierten Observablen nur Werte aus dem Spektrum von A mit positiver Wahrscheinlichkeit liefern wird. Diese Erwartung wird durch Satz 16.13 mathematisch fundiert. Die Aussagen von Korollar 16.4 übertragen sich auf den messbaren Funktionalkalkül. Für Teile a–d ist das klar, und die Verallgemeinerung von e, also die Aussage B A = AB
⇒
B f (A) = f (A)B
∀ f ∈ M∞
(16.16)
werden wir unten im Anhang beweisen. Dann gilt aber auch Korollar 16.5 sinngemäß. Die Eindeutigkeitsaussagen in den Sätzen 16.2 und 16.12 ergeben zusammen die Folgerung, dass der messbare Funktionalkalkül die einzige Bedingung (W) erfüllende ∗-Darstellung Ψ von M∞ ist, für die Ψ ( j0 ) = I ,
Ψ ( j1 ) = A
gilt. Dies wiederum erlaubt es, den Beweis von Satz 16.6 auf den messbaren Funktionalkalkül zu übertragen. Insgesamt können wir also konstatieren: Korollar 16.15 Die Aussagen aus 16.4, 16.5 und 16.6 gelten sinngemäß auch für den messbaren Funktionalkalkül auf M∞ . Dies sollte unbedingt im Zusammenhang mit Satz 15.10 gesehen werden, wo weitere Äquivalenzen bewiesen wurden, die Vertauschbarkeit und invariante Teilräume betreffen. Es ergibt sich: Korollar 16.16 Für B ∈ B(H ) sind äquivalent: (i) B A = AB, (ii) B f (A) = f (A)B für alle f ∈ M∞ , (iii) für die Spektralprojektoren E(S) zu A gelten die Aussagen (ii) und (iii) aus Satz 15.10.
80
16 Spektralsatz und quantenmechanische Dynamik
Besonders wichtig ist hier der Fall B = A. Wendet man Korollar 16.16 für diesen Fall auf das Spektralmaß zu A an, so erkennt man, dass die Spektralprojektionen E(S) stets mit A vertauschen, dass also die Spektralräume U(S) := R(E(S)) stets A-invariant sind. Eine disjunkte Zerlegung σ (A) =
∞
Sn
n=1
führt also zu einer Darstellung von H als orthogonale direkte Summe H=
∞
⊥
U(Sn )
n=1
in A-invariante abgeschlossene Teilräume (Korollar 15.3). Dies ist von grundsätzlicher Bedeutung (vgl. auch Aufgabe 16.10). Beispiele 16.17 a. Für einen beliebigen Maßraum (X, A, ν) betrachten wir den H ILBERTraum H := L 2 (X, A, ν). Gegeben sei eine reelle Funktion ϕ ∈ L ∞ (X, A, ν). Der entsprechende Multiplikationsoperator A = Mϕ (vgl. Beispiel 9.2b und Satz 14.6) ist dann beschränkt und selbstadjungiert. Offenbar ist Ak der Multiplikationsoperator mit ϕ k und allgemeiner p(A) = M p◦ϕ für jedes Polynom p. Dies legt die Vermutung nahe, dass der messbare Funktionalkalkül zu A gegeben ist durch Φ( f ) := M f ◦ϕ .
(16.17)
Um dies nachzuweisen, wählen wir ein kompaktes Intervall J ⊇ [−ϕ∞ , ϕ∞ ] und definieren Φ : M∞ (J, B 1 ) → B(H ) durch (16.17). Mit völlig trivialen Rechnungen bestätigt man, dass Φ eine ∗-Darstellung von M∞ (J ) ist und dass Φ( j0 ) = I , Φ( j1 ) = A gilt. Bedingung (W) folgt mit dem Satz von der dominierten Konvergenz, denn x|Φ( f )y = x(t) f (ϕ(t))y(t) dν(t) , und für f ∞ ≤ C wird der Integrand punktweise durch die ν-summierbare Funktion C|x(t)y(t)| majorisiert. Die Eindeutigkeit des messbaren Funktionalkalküls zeigt daher, dass f (A) = Φ( f ) = M f ◦ϕ für alle f ∈ M∞ . Insbesondere ist das Spektralmaß zu A durch E(S) = Mω S
mit ω S := χϕ −1 (S)
(16.18)
gegeben, denn χ S ◦ ϕ = χϕ −1 (S) . Das positive Maß μx zu einem Vektor x ∈ H ist damit
B
Messbare Funktionalkalkül und Spektralzerlegung
81
μx (S) = x|E(S)x =
ϕ −1 (S)
|x(t)|2 dν(t).
(16.19)
b. Wir betrachten einen kompakten selbstadjungierten Operator A in einem beliebigen komplexen H ILBERTraum H . Dabei nehmen wir an, es ist dim R(A) = ∞, denn der Fall dim R(A) < ∞ wäre eine triviale Vereinfachung, die über das in Abschn. 15A über H ERMITEsche Matrizen Gesagte nicht wesentlich hinausgeht. Seien (λn ) die Nullfolge der Eigenwerte und (en ) das Orthonormalsystem entsprechender Eigenvektoren gemäß dem Satz von H ILBERT-S CHMIDT (Theorem 9.19). Da dieses System eine Orthonormalbasis von R(T ) = N (T )⊥ bildet, haben wir für alle x ∈ H ∞ en |x en , (16.20) x = P0 x + n=1
wobei P0 die orthogonale Projektion auf N (T ) bezeichnet. Diese Beziehung sowie Gl. (9.31) kann man in Gestalt von Spektralintegralen schreiben, indem man die folgende projektorwertige Mengenfunktion einführt: Wir bezeichnen mit (αk )k≥1 die Folge der verschiedenen Eigenwerte = 0 von A (etwa nach absteigenden Beträgen geordnet), ergänzt durch α0 := 0, und setzen E(S) :=
∞
χ S (αk )Pk
Pk :=
mit
|en en | ,
k≥1
(16.21)
λn =αk
k=0
für S ⊆ R. (Hier haben wir die in der Physik übliche D IRAC-Notation verwendet.) Offenbar ist Pk der orthogonale Projektor auf den endlichdimensionalen Raum N (A −αk I ) der Eigenvektoren zu αk . Die unendliche Reihe ist konvergent im Sinne der starken Operatorkonvergenz, d. h. für jedes x ∈ H ist die Reihe E(S)x =
∞
χ S (αk )Pk x
k=0
in H konvergent. Das liegt an der Konvergenz der F OURIERreihe (16.20). Insbesondere ist x = P0 x +
∞
Pk x
∀x ∈ H ,
k=1
d. h. E(R) = I . Da Eigenvektoren zu verschiedenen Eigenwerten zueinander orthogonal sind, zeigt Satz 8.27b, dass E(S) stets ein orthogonaler Projektor ist, sofern die Summe nur aus endlich vielen Termen = 0 besteht. Besteht sie aber aus unendlich vielen Termen, so zeigt man mittels Satz 8.26 durch Grenzübergang, dass sie ebenfalls einen orthogonalen Projektor liefert (Übung!). Schließlich ist für jedes x ∈ H
82
16 Spektralsatz und quantenmechanische Dynamik
μx (S) =
∞
m k (x)χ S (αk )
mit m k (x) := Pk x2 ≥ 0,
(16.22)
k=0
und das ist nach Beispiel 10.2d ein Maß, das sogar auf der gesamten Potenzmenge von R definiert ist, erst recht also auf den B ORELmengen. Dies zeigt (Satz 15.7 und Lemma 15.6a), dass wir durch (16.21) in der Tat ein Spektralmaß (sogar auf der vollen Potenzmenge von R) definiert haben. Um Spektralintegrale in Bezug auf dieses Spektralmaß zu berechnen, ziehen wir Satz 15.9 und das dritte Beispiel aus 10.31a heran. Für f ∈ M∞ (J ) , J ⊇ σ (A) ist demnach x |
f dμx =
f dE x =
∞
m k (x) f (αk ) =
k=0
∞
f (αk )x|Pk x ,
k=0
also wegen Lemma 15.6b. f dE =
∞
f (αk )Pk = f (0)P0 +
k=0
∞
f (λn )|en en | ,
(16.23)
n=1
wobei diese Reihen wieder im Sinne der starken Operatorkonvergenz zu verstehen sind, d. h. nach Einsetzen eines x ∈ H liefern sie Reihen, die in H konvergieren. Insbesondere ist (9.31) nichts anderes als (16.13) für das hier vorliegende Spektralmaß, d. h. wir haben tatsächlich das Spektralmaß zu A konstruiert.
Anhang: Existenz und Eindeutigkeit des messbaren Funktionalkalküls Zum Beweis von Satz 16.12 benötigen wir das folgende Lemma, aus dem die Bedeutung von Bedingung (W) klar wird: Lemma 16.18 Sei α eine stetige Linearform auf dem BANACHraum M∞ (J ), die auf dem Teilraum C(J ) verschwindet. Angenommen, sie erfüllt außerdem die Bedingung (W0) Ist f der punktweise Limes einer beschränkten Folge ( f m ) ⊆ M∞ (J ), so ist α( f ) = lim α( f m ) . m→∞
Dann muss α ≡ 0 sein. Beweis Es sei A das System aller B ORELmengen S ⊆ J , für die α(χ S ) = 0 ist. Offenbar ist χ J \S = χ J − χ S , und wenn S die Vereinigung der disjunkten Mengen Sm , m ∈ N ist, so ist punktweise
B
Messbare Funktionalkalkül und Spektralzerlegung
χ S = lim
m→∞
m
83
χ Sm .
k=1
Mit der Linearität von α und Bedingung (W0) folgert man hieraus leicht, dass A eine σ -Algebra ist. Außerdem gehört jede abgeschlossene Teilmenge von J zu A. Ist nämlich K ⊆ J abgeschlossen, also auch kompakt, so gibt es zu jedem m ∈ N eine stetige Funktion ζm mit 0 ≤ ζm ≤ 1, die auf K mit 1, auf J \U1/m(K ) mit 0 übereinstimmt. Dann ist aber punktweise χ K = limm→∞ ζm , und Bedingung (W0) liefert α(χ K ) = limm→∞ α(ζm ) = 0. Die B ORELalgebra B 1 wird definitionsgemäß von den offenen Mengen von R erzeugt (vgl. Definition 10.8), also auch von den abgeschlossenen Mengen, da diese gerade die Komplemente der offenen sind. Die σ -Algebra B 1 (J ) der in J enthaltenen B ORELmengen wird daher von den abgeschlossenen Teilmengen von J erzeugt. Folglich ist A = B 1 (J ), d. h. α(χ S ) = 0 für alle S ∈ B 1 (J ). Da α linear ist, folgt nun α(g) = 0 für alle g ∈ M∞ e , und da α auch stetig (in Bezug auf die Norm von M∞ !) ist, folgt mit Lemma 15.8 schließlich α ≡ 0. Die Eindeutigkeitsaussage in Satz 16.12 folgt nun schon sofort aus dem folgenden Korollar: Satz 16.19 Sind Φ1 , Φ2 : M∞ (J ) → B(H ) zwei stetige lineare Abbildungen, die beide Bedingung (W) erfüllen, und ist Φ1 ( f ) = Φ2 ( f ) für alle f ∈ C(J ), so muss Φ1 ≡ Φ2 sein. Beweis Zu beliebigen Vektoren x, y ∈ H betrachten wir die Linearformen αx,y ( f ) := x | (Φ1 ( f ) − Φ2 ( f ))y . Sie erfüllen offenbar alle Voraussetzungen von Lemma 16.18, also ist x|Φ1 ( f )y = x|Φ2 ( f )y für alle x, y ∈ H , f ∈ M∞ (J ). Die Behauptung folgt daher aus Theorem 8.18.
Bemerkung Hieraus folgt leicht die (bisher unbewiesene) Aussage (16.16). Dazu betrachtet man die Abbildungen Φ1 ( f ) := BΨ ( f )
und
Φ2 ( f ) := Ψ ( f )B ,
wobei Ψ die ∗-Darstellung aus Satz 16.12 ist. Wegen x|Φ1 ( f )y = B ∗ x|Ψ ( f )y und x|Φ2 ( f )y = x|Ψ ( f )(By) folgt Bedingung (W) für die Φi aus ihrer Gültigkeit für Ψ . Nach Korollar 16.4e ist Φ1 ( f ) = Φ2 ( f ) für alle stetigen f , also auch für alle beschränkten messbaren f , wie behauptet. Beweis (von Satz 16.12) Wir brauchen nur noch die Existenz der Abbildung Ψ : M∞ (J ) → B(H ) mit den geforderten Eigenschaften zu zeigen, und dabei werden
84
16 Spektralsatz und quantenmechanische Dynamik
wir die Operatoren T = Ψ ( f ) gemäß Theorem 8.18 durch die entsprechenden Sesquilinearformen beschreiben, also durch ihre Matrixelemente. Zunächst definieren wir für jedes x ∈ H ein lineares Funktional Λx auf C(J ) durch Λx (g) := x|g(A)x ,
g ∈ C(J ) .
(16.24)
Ist g reellwertig, so ist g(A) selbstadjungiert, also Λx (g) ∈ R. Ist g ≥ 0, so ist √ g = w 2 mit w := g, also Λx (g) = x|w(A)2 x = w(A)x2 ≥ 0, also erfüllt Λx die Monotoniebedingung (10.72), und der R IESZsche Darstellungssatz 10.40 liefert nun ein vollständiges R ADONmaß μx auf J , für das gilt:1 Λx (g) = g dμx , g ∈ C(J ) . (16.25) J
Dabei ist μx (J ) =
1 dμx = Λx ( j0 ) = x2 < ∞ . J
Also ist jedes f ∈ M∞ (J ) μx -summierbar, und wenn wir f dμx für f ∈ M∞ (J ) q f (x) ≡ ηx ( f ) :=
(16.26)
J
setzen, so folgt |q f (x)| = |ηx ( f )| ≤ f ∞ · x2 .
(16.27)
Außerdem gilt Bedingung (W0) für die Linearformen ηx , wie man sofort mittels des Satzes über dominierte Konvergenz nachprüft. Diese Bedingung gilt dann offenbar auch für endliche Linearkombinationen verschiedener ηx . Nun setzen wir h f (x, y) :=
1 i 1−i q f (x + y) − q f (x + iy) − (q f (x) + q f (y)) 2 2 2
(16.28)
für x, y ∈ H und f ∈ M∞ (J ). Die auf M∞ (J ) definierten Linearformen ηx,y ( f ) := h f (x, y) 1
(16.29)
Um den Satz genau in der in Kap. 10 angegebenen Form benutzen zu können, müsste man eigentlich eine offene Umgebung Ω ⊇ J betrachten, Λx auf Cc (Ω) definieren und dann das gewonnene R ADONmaß auf J beschränken. Das ist aber eine rein technische Angelegenheit, die keine Probleme verursacht, und wenn man statt Theorem 10.40 eine etwas allgemeinere Version des R IESZschen Darstellungssatzes benutzt, ist es auch gar nicht nötig.
B
Messbare Funktionalkalkül und Spektralzerlegung
85
erfüllen dann Bedingung (W0). Für g ∈ C(J ) ist h f eine stetige Sesquilinearform, denn nach (16.24), (16.25), (16.26) und der Polarisationsgleichung (Lemma 15.6a) haben wir h g (x, y) = x|g(A)y .
(16.30)
Nun zeigen wir, dass h f auch für beliebiges f ∈ M∞ (J ) eine stetige Sesquilinearform ist. Um z. B. die Rechenregel h f (x, c1 y1 + c2 y2 ) = c1 h f (x, y1 ) + c2 h f (x, y2 )
(16.31)
für f ∈ M∞ (J ), x, y1 , y2 ∈ H und c1 , c2 ∈ C nachzuweisen, betrachten wir für einen Moment feste Vektoren x, y1 , y2 und Skalare c1 , c2 , setzen z := c1 y1 + c2 y2 und untersuchen die Linearform α := ηx,z − c1 ηx,y1 − c2 ηx,y2 . Diese erfüllt (W0) und verschwindet auf C(J ), da die Gültigkeit von (16.31) für stetiges f ja schon bekannt ist. Nach Lemma 16.18 ist also α ≡ 0 und somit gilt (16.31) für alle f , jedenfalls für die gewählten Werte von x, y1 , y2 , c1 , c2 . Diese waren aber beliebig gewählt, also gilt (16.31) tatsächlich generell. Ebenso prüft man nach, dass h f (c1 x1 + c2 x2 , y) = c1 h f (x1 , y) + c2 h f (x2 , y)
(16.32)
generell gilt. Also ist h f immer eine Sesquilinearform, und um ihre Stetigkeit nachzuprüfen, genügt es, zu zeigen, dass sie für x = y = 1 beschränkt bleibt. Aus (16.28), (16.27) folgt aber |h f (x, y)| ≤ f ∞ ≤ f ∞
1 1 x + y2 + x + iy2 + x2 + y2 2 2
(x + y)2 + x2 + y2 ,
also sup |h f (x, y)| ≤ 6 f ∞
x=1 y=1
und damit die Stetigkeit von h f . Für jedes f ∈ M∞ (J ) definieren wir nun T = Ψ ( f ) als denjenigen Operator, der gemäß Theorem 8.18 der Sesquilinearform h f entspricht. Es gilt also h f (x, y) = x | Ψ ( f )y = ηx,y ( f )
(16.33)
86
16 Spektralsatz und quantenmechanische Dynamik
für alle x, y ∈ H , f ∈ M∞ (J ). Da h f nach (16.26), (16.28) linear von f abhängt, ist Ψ : M∞ (J ) → B(H ) eine lineare Abbildung, und sie erfüllt (W), weil die ηx,y (W0) erfüllen. Da der Isomorphismus aus Theorem 8.18 isometrisch ist, haben wir außerdem Ψ ( f ) ≤ 6 f ∞
∀f,
und damit ist Ψ auch stetig. Für g ∈ C(J ) ist x|Ψ (g)y = x|g(A)y nach (16.30) und (16.33), also Ψ (g) = g(A), wie verlangt. Schließlich müssen wir noch nachweisen, dass Ψ eine ∗-Darstellung ist. Um die Rechenregel Ψ ( f¯) = Ψ ( f )∗
(16.34)
zu bestätigen, betrachten wir die stetigen linearen Abbildungen Φ1 ( f ) := Ψ ( f¯)
und
Φ2 ( f ) := Ψ ( f )∗ .
Beide erfüllen Bedingung (W) (für Φ2 beachte man x|Ψ ( f )∗ y = y|Ψ ( f )x ), also folgt (16.34) aus Satz 16.19 und der Tatsache, dass (16.34) für den stetigen Funktionalkalkül gilt. Ähnlich zeigen wir Ψ ( f g) = Ψ ( f )Ψ (g)
(16.35)
für f, g ∈ M∞ (J ), allerdings in zwei Schritten: Zuerst halten wir ein stetiges g fest und betrachten die Abbildungen Φ1 ( f ) := Ψ ( f g) und
Φ2 ( f ) := Ψ ( f )Ψ (g).
Beide erfüllen (W) (für Φ2 beachte man, dass x|Ψ ( f )Ψ (g)y = x|Ψ ( f )z mit dem festen Vektor z := Ψ (g)y), und auf C(J ) stimmen sie überein, weil der stetige Funktionalkalkül (16.35) erfüllt. Also gilt (16.35) sogar für alle f ∈ M∞ (J ), und das ist für jedes stetige g der Fall. Nun betrachten wir für ein beliebiges festes f ∈ M∞ (J ) die Abbildungen Φ1 (g) := Ψ ( f g) und
Φ2 (g) := Ψ ( f )Ψ (g) .
Beide erfüllen (W) (für Φ2 beachte man, dass x|Ψ ( f )Ψ (g)y = w|Ψ (g)y mit dem festen Vektor w := Ψ ( f )∗ x), und nach dem Ergebnis unseres ersten Schrittes gilt (16.35) für jedes stetige g, dann aber auch für jedes g ∈ M∞ (J ). Damit ist (16.35) für alle f, g nachgewiesen. Bemerkung Die in diesem Beweis hergeleitete Abschätzung Ψ ( f ) ≤ 6 f ∞ ist natürlich irreführend, denn nach Korollar 15.16 gilt ja die viel bessere Abschätzung
B
Messbare Funktionalkalkül und Spektralzerlegung
87
(15.36). Der überflüssige Faktor 6 ist gewissermaßen eine Schwäche des hier vorgestellten Beweisverfahrens, aber wir können diese leicht in Kauf nehmen, da sie keinen Schaden anrichtet. 16.20 Ausblicke (i) Bei der hier vorgestellten Form der Spektraltheorie ignoriert man die Vielfachheit (= Multiplizität, in der Physik meist Entartung genannt). Für einen Eigenwert λ ist die Vielfachheit bekanntlich die Dimension von N (A − λI ), also die maximale Anzahl von linear unabhängigen Eigenvektoren. Eine detaillierte darstellungstheoretische Untersuchung des Funktionalkalküls ermöglicht es jedoch, für das gesamte Spektrum eine Vielfachheitsfunktion zu definieren, und in diesem Zusammenhang wird der Spektralsatz dahingehend verfeinert, dass der H ILBERTraum zunächst als orthogonale Summe von abgeschlossenen A-invarianten Teilräumen geschrieben wird, für die die Einschränkungen von A jeweils nur einfaches Spektrum haben (Spektraldarstellung). Diese feinere Analyse führt zu einer vollständigen Beschreibung der selbstadjungierten Operatoren bis auf unitäre Äquivalenz. Das bedeutet: Wenn zwei selbstadjungierte Operatoren A1 , A2 in allen spektralen Daten (d.h. Spektrum, Spektralmaß und Vielfachheitsfunktion) übereinstimmen, so gibt es einen unitären Operator U ∈ B(H ) mit A2 = U −1 A1 U . Gewissermaßen sind A1 , A2 dann ein und derselbe Operator, nur in verschiedenen (unendlichdimensionalen!) Koordinatensystemen geschrieben. Diese Multiplizitätstheorie ist in [69] skizziert und z. B. in [24] ausführlich dargestellt. Vgl. auch [1] oder [91]. (ii) Man kann auch Funktionalkalküle in mehreren Variablen definieren und untersuchen, wenn die betreffenden Operatoren kommutieren. Sind also A1 , . . . , Am ∈ B(H ) kommutierende selbstadjungierte Operatoren, so betrachtet man die C ∗ Algebra C(Σ0 ) der stetigen komplexwertigen Funktionen auf der kompakten Menge Σ0 := σ (A1 ) × · · · × σ (Am ) ⊆ Cm und der stetige Funktionalkalkül für diese Operatoren ist dann die ∗-Darstellung Φ : C(Σ0 ) → B(H ), für die die Funktionen πk : Σ0 −→ C , (λ1 , . . . , λm ) −→ λk überführt werden in Φ(πk ) = Ak ,
k = 1, . . . , m.
(16.36)
Für Polynome in m Variablen p(λ1 , . . . , λm ) =
|α|≤n
cα λα
(16.37)
88
16 Spektralsatz und quantenmechanische Dynamik
(Multiindex-Schreibweise!) ergibt sich daraus
Φ( p) =
cα Aα = p(A1 , . . . , Am ),
|α|≤n
wie man es naiv erwartet, und man schreibt auch für allgemeinere Funktionen f wieder f (A1 , . . . , Am ) statt Φ( f ). Existenz und Eindeutigkeit dieser ∗-Darstellung zu beweisen, ist allerdings mit den in Abschn. A vorgestellten elementaren Methoden nicht mehr möglich, und wir können nicht darauf eingehen, wie das geschieht. Aber der Beweis des Fortsetzungssatzes 16.12 kann ohne Mühe auf die neue Situation übertragen werden, d. h. wir haben eine eindeutige Fortsetzung Ψ des stetigen Funktionalkalküls auf die Algebra M∞ (Σ0 , B n ), die Bedingung (W) erfüllt, und diese ist der messbare Funktionalkalkül für das Operatorensystem (A1 , . . . , Am ). Durch E(S) := χ S (A1 , . . . , Am )
(16.38)
ist dann ein eindeutiges Spektralmaß E auf den B ORELschen Teilmengen von Σ0 gegeben, das die Eigenschaft Ak =
Σ0
λk dE(λ1 , . . . , λm ) ,
k = 1, . . . , m
(16.39)
hat. Auf diese Weise sind A1 , . . . , Am gemeinsam spektral zerlegt, und für alle f ∈ M∞ (Σ0 , B n ) hat man f (A1 , . . . , Am ) =
Σ0
f (λ1 , . . . , λm ) dE(λ1 , . . . , λm ).
(16.40)
Der Träger Σ dieses Spektralmaßes ist allerdings i. A. nicht ganz Σ0 . Dies spiegelt das Bestehen von Relationen zwischen den Operatoren A1 , . . . , Am wider, also von Beziehungen wie etwa A21 A2 + A2 A23 − A1 A3 = 0 o. dgl. Eine solche Relation hat allgemein die Form p(A1 , . . . , Am ) ≡ 0, wo p ein Polynom (16.37) ist. Besteht diese Relation, so folgt Σ0
| p(λ)|2 dμx (λ) = 0
für alle x ∈ H , denn da p auf der kompakten Menge Σ0 beschränkt ist, kann man ja den Funktionalkalkül anwenden. Daraus folgt aber E(Ω) = 0 für jede offene Menge Ω ⊆ Cm \ p −1 (0), also muss Σ ⊆ p −1 (0) sein. Für den Funktionalkalkül bedeutet dies wieder, dass der Operator f (A1 , . . . , Am ) in Wirklichkeit nur von der Einschränkung f Σ abhängt. Einzelheiten hierzu findet man etwa in [9] oder [73]. In [70] wird eine andere Begründung für den Funktionalkalkül für mehrere Variable gegeben, bei der das
C
Unbeschränkte selbstadjungierte Operatoren
89
gemeinsame Spektralmaß für A1 , . . . , Am als eine Art Produktmaß aus den Spektralmaßen der einzelnen A j gewonnen wird. Bemerkung Bei dieser Theorie kommt es eigentlich nicht darauf an, dass die Operatoren A1 , . . . , Am selbstadjungiert sind, sondern die von ihnen erzeugte abgeschlossene Teilalgebra A ⊆ B(H ) soll selbstadjungiert sein in dem Sinne, dass B∈A
⇒
B∗ ∈ A .
In der mathematischen Literatur geht man daher zumeist von kommutierenden normalen Operatoren T1 , . . . , Tm aus und betrachtet die von diesen sowie ihren Adjungierten erzeugte abgeschlossene Teilalgebra. Diese ist wieder kommutativ, weil die Operatoren normal sind. Es handelt sich aber hier nicht um eine Verallgemeinerung, denn man könnte dieselbe Algebra ja durch die 2m selbstadjungierten Operatoren Ak := Tk + Tk∗ ,
Bk := i(Tk − Tk∗ ) ,
k = 1, . . . , m
erzeugen. (iii) In der Theorie der Operatoralgebren definiert man für Teilmengen M ⊆ B(H ) den Kommutanten M durch M := {B ∈ B(H ) | BT = T B ∀ T ∈ M} und den Bikommutanten durch M := (M ) . Korollar 16.16 besagt u. a., dass jedes Ψ ( f ) = f (A) , f ∈ M∞ mit jedem B ∈ B(H ) vertauscht, welches mit A vertauscht. Das bedeutet, dass das Bild R(Ψ ) des messbaren Funktionalkalküls zu A im Bikommutanten von {A} enthalten ist. Bemerkenswert ist der sog. Bikommutantensatz von J. VON N EUMANN, der besagt, dass sogar {A} = R(Ψ ) = { f (A) | f ∈ M∞ }
(16.41)
ist (vgl. etwa [1, 17, 95] oder Band I von [46]). Dieser Satz kann als der Ausgangspunkt der Theorie der VON N EUMANNschen Operatoralgebren gelten.
C Unbeschränkte selbstadjungierte Operatoren In diesem Abschnitt verallgemeinern wir Spektralsatz und messbaren Funktionalkalkül auf unbeschränkte selbstadjungierte Operatoren in H . Theorem 16.21 (Spektralsatz) Zu einem selbstadjungierten Operator A gibt es genau ein Spektralmaß E : (R, B 1 ) −→ B(H ) mit A = λ dE(λ). (16.42)
90
16 Spektralsatz und quantenmechanische Dynamik
Wir wollen hier nur die Konstruktion des fraglichen Spektralmaßes skizzieren und verweisen für die Eindeutigkeit sowie weitere Einzelheiten auf [57]. Wir gehen aus von der Beobachtung, dass nach Theorem 14.25 die C AYLEY-Transformierte U des selbstadjungierten Operators A ein unitärer Operator in H ist. Nach Satz 16.10 gibt es also einen beschränkten selbstadjungierten Operator B mit −U = exp iB
σ (B) ⊆ [−π, π ] .
und
Nach Theorem 16.11 ist B = ϕ d E(ϕ) mit einem eindeutig bestimmten Spek das außerhalb von [−π, π ] verschwindet. Da stetiger und messbarer tralmaß E, Funktionalkalkül für stetige Funktionen übereinstimmen, ergibt dies U = − exp iB = −
eiϕ d E(ϕ).
Aus Satz 14.24 wissen wir, dass I −U injektiv ist, und das bedeutet, dass −1 = e±iπ kein Eigenwert von exp iB ist. Also ist E({π, −π }) = 0 (Korollar 15.19), und daher ist sogar
eiϕ d E(ϕ)
U =−
mit X :=] − π, π [.
(16.43)
X
Nach Gl. (14.46) in Satz 14.24 kann man A aus seiner C AYLEYtransformierten zurückgewinnen durch A = i(I + U )(I − U )−1 . Einsetzen von λ = eiϕ in die Funktion g(λ) := i(1 − λ)/(1 + λ) ergibt aber g(eiϕ ) = i
1 − eiϕ ϕ = tan , iϕ 2 1+e
(16.44)
wie man durch Erweitern des Bruches mit e−iϕ/2 unschwer bestätigt. Einsetzen von U = −eiB in (14.46) liefert daher, zumindest formal B = A = tan 2
tan X
ϕ d E(ϕ). 2
(16.45)
Diese Schlussfolgerung ist allerdings etwas voreilig, denn dabei wird eine Variante von Satz 16.8 benutzt, bei der f nicht reellwertig und g nicht beschränkt zu sein braucht, und sie soll auch noch den korrekten Definitionsbereich mitliefern. Um diese Klippe zu umschiffen, beachten wir, dass durch T :=
tan X
ϕ d E(ϕ) 2
C
Unbeschränkte selbstadjungierte Operatoren
91
jedenfalls ein selbstadjungierter Operator T in H definiert ist (Theorem 15.18c). Aus (16.44) folgt aber tan
ϕ (1 + eiϕ ) = i(1 − eiϕ ) 2
für alle ϕ ∈ X , und damit liefert Theorem 15.18b. wegen (16.43) T (I − U ) ⊂ i(I + U ) = A(I − U ) , wobei D(T (I − U )) = D(I − U ) ∩ D(i(I + U )) = H ist. Daher ist R(I − U ) ⊆ D(T ), aber wir wissen aus Satz 14.24, dass R(I − U ) = D(A) ist. Es folgt T ⊃ A, aber da beide Operatoren selbstadjungiert sind, haben wir auch T = T ∗ ⊂ A∗ = A, also A = T , d. h. (16.45) gilt tatsächlich. Nun ist offenbar h : X −→ R , ϕ −→ tan (ϕ/2) ein Homöomorphismus, und der inverse Homöomorphismus ist gegeben durch h −1 : R −→ X , λ −→ 2 arctan λ. Also ist durch −1 (S)) E(S) := E(h
(16.46)
eine projektorwertige Mengenfunktion auf den B ORELmengen von R definiert, und man prüft durch triviale Rechnungen nach (vgl. wieder [57]), dass E ein Spektralmaß ist und dass f (λ) dE(λ) = f (h(ϕ)) d E(ϕ) (16.47) X
für alle messbaren Funktionen f auf R gilt. Insbesondere folgt nun (16.42) aus (16.45), und wir haben das gesuchte Spektralmaß gefunden. Beispiele 16.22 a. Sei (X, A, ν) ein Maßraum und ϕ ∈ M(X, A) reellwertig. Der Multiplikationsoperator Mϕ im H ILBERTraum H := L 2 (X, A, ν) ist dann selbstadjungiert (vgl. Satz 14.6 und die Beispiele 14.19a, 14.21a). Für den Fall einer beschränkten Funktion ϕ haben wir das entsprechende Spektralmaß schon in Beispiel 16.17a bestimmt, und es liegt nahe, die gefundene Formel (16.18) auch im jetzigen allgemeineren Fall anzusetzen, also E(S) := Mω S
mit ω S := χϕ −1 (S) .
92
16 Spektralsatz und quantenmechanische Dynamik
Es ist nicht schwer, nachzuprüfen, dass dies ein Spektralmaß definiert, und auch die Beziehung Mϕ = λ dE(λ) lässt sich mittels (15.37) leicht verifizieren. Wir empfehlen beides als Übungen. b. Sei L(D) ein formal selbstadjungierter linearer Differentialoperator in n Variablen mit konstanten Koeffizienten, und sei L seine (eindeutige!) L 2 (Rn )Realisierung (vgl. Beispiele 14.15b, 14.19c und 14.21c). Ferner sei U die F OURIER -P LANCHEREL-Transformation in Rn . Nach (14.20) ist U LU −1 = Mϕ
mit ϕ(ξ ) := L(iξ ) ,
also L = U −1 Mϕ U . Das Spektralmaß zu dem selbstadjungierten Operator L ist daher gegeben durch F(S)ψ := U −1 [χϕ −1 (S) ψ] für ψ ∈ L 2 (Rn ). Das folgt mittels der Ergebnisse der Aufgaben 15.2 und 15.9 sofort aus Beispiel a. Ein besonders wichtiger Spezialfall ist L = −Δ, also (bis auf physikalische Konstanten) der H AMILTONoperator für ein freies Teilchen. Für diesen ist ϕ(ξ ) = |ξ |2 , also entsteht F(S)ψ, indem man die F OURIERtransformierte ψ mit der charakteristischen Funktion der Menge ϕ −1 (S) = {ξ ∈ Rn | ξ12 + · · · + ξn2 ∈ S} multipliziert und anschließend die inverse F OURIERtransformation anwendet. Satz 16.23 Das Spektrum σ (A) ist der Träger des Spektralmaßes E zu A, d. h. für offene Teilmengen Ω ⊆ R gilt E(Ω) = 0
⇐⇒
Ω ∩ σ (A) = ∅ .
Ein detaillierter Beweis hiervon ist in [57] zu finden, und wir sagen hier nur soviel: Mit den Bezeichnungen aus der Beweisskizze zu Theorem 16.21 haben wir für offene Mengen Ω ⊆ R E(Ω) = 0
⇐⇒
−1 (Ω)) = 0 E(h
16.13b. −1 ⇐⇒ h (Ω) ∩ σ (B) = ∅
⇐⇒
Ω ∩ h(σ (B)) = ∅,
weil h ein Homöomorphismus ist. Die Behauptung folgt also aus h(σ (B)) = σ (A) = σ (h(B)).
C
Unbeschränkte selbstadjungierte Operatoren
93
Dies kann man zwar nicht direkt aus dem spektralen Abbildungssatz 16.7 folgern, weil dessen Voraussetzungen nicht erfüllt sind, aber es folgt aus einer Charakterisierung des Spektrums eines Spektralintegrals (s. [57]). Man kann dem Spektralmaß aber nicht nur ansehen, ob man sich im Spektrum befindet oder nicht, sondern auch, um welchen Teil des Spektrums es sich handelt. Dabei ist zu beachten, dass das Residualspektrum eines selbstadjungierten Operators immer leer ist, denn der in Theorem 9.10b. gegebene Beweis ist wegen Satz 14.17c auf unbeschränkte Operatoren übertragbar. Korollar 16.24 Sei E das Spektralmaß zu A und λ ∈ R. Dann ist a. λ ∈ ρ(A) ⇐⇒ es gibt δ > 0 mit E(]λ − δ, λ + δ[) = 0, b. λ ∈ σ P (A) ⇐⇒ E({λ}) = 0, und in diesem Fall ist E({λ}) die orthogonale Projektion auf N (A − λI ), c. λ ∈ σC (A) ⇐⇒ E({λ}) = 0, aber für jedes δ > 0 ist E(]λ−δ, λ+δ[) = 0. Beweis Da ρ(A) offen ist, folgt a aus Satz 16.23. Behauptung b ist wegen (16.42) ein Spezialfall von Korollar 15.19. Wegen σ R (A) = ∅ folgt c aus a und b, denn es ist die einzige verbleibende Möglichkeit, wenn weder a noch b zutreffen. Korollar 16.25 Der selbstadjungierte Operator A ist genau dann beschränkt (und überall definiert), wenn sein Spektrum beschränkt ist. Beweis Sei σ (A) beschränkt, etwa σ (A) ⊆ [−C, C] =: J . Ist E das Spektralmaß zu A, so haben wir nach Satz 16.23 λ dE(λ), A= J
also nach (15.39) Ax2 =
|λ|2 dμx (λ) ≤ C 2 x2 J
für alle x ∈ D(A), und somit ist A beschränkt. Da A auch abgeschlossen und dicht definiert ist, folgt auch D(A) = H (Theorem 14.2b). Die Umkehrung ist aus Kap. 9 wohlbekannt. Selbstverständlich wird nun der messbare Funktionalkalkül auch auf unbeschränktes A ausgedehnt: Definition 16.26 Für jedes f ∈ M(R, B1 ) setzt man f (A) := wo E das Spektralmaß zu A ist.
f dE,
94
16 Spektralsatz und quantenmechanische Dynamik
Die rechnerischen Eigenschaften dieses Funktionalkalküls ergeben sich als Spezialfälle der Sätze 15.17 und 15.18. Insbesondere ist f (A) beschränkt und überall definiert, wenn f ∈ M∞ (R) ist, und das Spektralmaß selbst ergibt sich aus dem Funktionalkalkül durch E(S) = χ S (A). Korollar 16.16 kann jedoch nicht ohne weiteres auf unbeschränkte Operatoren übertragen werden, denn die Bedingung AB − B A = 0 kann ziemlich nichtssagend sein, wenn die Definitionsbereiche von A und B ungünstig zueinander liegen. Daher bezeichnet man zwei unbeschränkte selbstadjungierte Operatoren als vertauschbar, wenn ihre Spektralprojektionen miteinander kommutieren, und man kann dies in vielen Fällen nachweisen, ohne die Spektralprojektionen explizit zu kennen. Diese Problematik sowie der angedeutete Lösungsansatz ist in [69], Ch. VIII.5, ausführlich diskutiert. 16.27 Ausblick: Entwicklungen nach verallgemeinerten Eigenfunktionen Wenn der Operator A nur Punktspektrum hat, so nimmt der Spektralsatz die Form Aψ =
∞
λn en |ψ en
(16.48)
n=1
an. Dabei ist (λn ) die Folge der Eigenwerte (mit Vielfachheit gezählt!), und (en ) ist eine Orthonormalbasis aus entsprechenden Eigenvektoren. Der Beweis für diese Tatsache ergibt sich sofort aus Korollar 16.24, indem man wie in Beispiel 16.17b vorgeht. Im allgemeinen Fall liefert die rechte Seite von (16.48) immer noch den Beitrag des Punktspektrums zur Spektralzerlegung. Für den Beitrag des kontinuierlichen Spektrums versucht man, analoge Ausdrücke mit Integralen statt Reihen anzusetzen, etwa in der Form Aψ =
∞ n=1
λn en |ψ en +
σC (A)
λeλ |ψ eλ dλ ,
(16.49)
wobei das Objekt E λ ≡ |λ einen „Zustand“ repräsentiert, in dem die Observable exakt den Wert λ hat. Dem Einwand, dass solch ein Objekt in dem zu Grunde liegenden H ILBERTraum H nicht zu finden sei, wird damit begegnet, dass es sich ja auch nicht um einen physikalisch realistischen Zustand handle, sondern um eine Idealisierung. In vielen Fällen können solche Entwicklungen tatsächlich konkret in rigoros gültiger Form angegeben werden. Z. B. für den Impulsoperator P = −id/dx in L 2 (R1 ) gilt P = U −1 Mϕ U mit ϕ(κ) ≡ κ (Beispiel 16.22b), und, zumindest für ψ ∈ S1 , bedeutet dies ∞ ∞ 1 κeiκ x ψ(κ) dκ = κeκ (x)eκ |ψ dκ (16.50) (Pψ)(x) = √ 2π −∞ −∞
C
Unbeschränkte selbstadjungierte Operatoren
95
mit eiκ x eκ (x) := √ 2π und eκ |ψ :=
∞
−∞
eκ (y)ψ(y) dy .
Die spitzen Klammern bezeichnen hier also formal denselben Ausdruck, durch den auch das Skalarprodukt in L 2 (R1 ) definiert ist, doch sind sie hier als Abbildung L ∞ (R1 ) × S1 −→ C aufzufassen. Die Gültigkeit der Entwicklungsformel (16.50) für ψ ∈ S1 ist für alle praktischen Zwecke auch ausreichend, denn der selbstadjungierte Operator P ist ja der Abschluss (Satz 14.4b) von P S . 1
Für größere Klassen von Operatoren kann man solche Entwicklungen etwa mit Hilfe der Distributionstheorie angeben (vgl. z. B. [31]) oder mit Hilfe von Spektraldarstellungen [24]. Für S CHRÖDINGERoperatoren A = −Δ + V existieren auch spezielle Entwicklungen nach Eigenfunktionen des Differentialoperators, die vorgegebene Wachstumseigenschaften haben [81]. Durch all das kann aber die hier vorgestellte Theorie der Spektralmaße nicht ersetzt werden, und zwar aus den folgenden Gründen: • Häufig kommt man in (16.49) nicht mit dem L EBESGUEmaß dλ auf der λ-Achse aus, benötigt also doch die allgemeine Maßtheorie. • Keine der hier angedeuteten Theorien ist allgemeingültig – sie handeln immer nur von speziellen Typen von Operatoren. • Im Gegensatz zu der mit dem Spektralmaß formulierten Spektralzerlegung sind diese Entwicklungen meist nicht eindeutig. • Die Spektralmaße führen direkt zu den Wahrscheinlichkeitsmaßen μ(S) = ψ|E(S)ψ und damit zur statistischen Interpretation der Quantenmechanik. Dies leistet keine der verallgemeinerten Eigenfunktionsentwicklungen. • Der mathematische Aufwand, der für eine rigorose Begründung einer verallgemeinerten Eigenfunktionsentwicklung betrieben werden muss, ist mindestens so hoch wie der für die Theorie der projektorwertigen Spektralmaße.
Die Spektralschar eines selbstadjungierten Operators Das Spektralmaß E zu einem (beschränkten oder unbeschränkten) selbstadjungierten Operator A liefert mittels der Definitionsgleichung (15.32) eine Spektralschar (E λ )λ∈R , die mit A assoziiert wird und für die A=
∞ −∞
λ dE λ
(16.51)
96
16 Spektralsatz und quantenmechanische Dynamik
ist. Der Funktionalkalkül ist dann (zumindest für stetiges f ) durch f (A) =
∞ −∞
f (λ) dE λ
(16.52)
gegeben, und beides sind verallgemeinerte S TIELTJES-Integrale, d. h. Grenzwerte von entsprechenden R IEMANN -S TIELTJES-Summen, und zwar im Sinne der Operatornorm, wenn f und A beschränkt sind, sonst immerhin im Sinne der starken Operatorkonvergenz. Dieser Formulierung der Spektralzerlegung mittels Spektralscharen wird in der älteren Literatur zumeist der Vorzug gegeben, weil sie ohne allgemeine Maß- und Integrationstheorie auskommt. Bleibt man aber bei diesem elementaren Zugang, so kann man den Funktionalkalkül nur für stetige Funktionen definieren (oder bestenfalls für Funktionen, die sich nicht sehr von stetigen unterscheiden), und man handelt sich auch eine Reihe technischer Umständlichkeiten ein. Bemerkenswert ist allerdings die Gestalt, die Korollar 16.24 annimmt, wenn man es mittels Spektralscharen formuliert: Korollar 16.28 Sei (E λ )λ die Spektralschar zum selbstadjungierten Operator A, und sei λ0 ∈ R. Dann: a. λ0 ∈ ρ(A) ⇐⇒ es gibt δ > 0, für das gilt: |λ − λ0 | < δ ⇒ E λ = E λ0 . b. λ0 ∈ σ P (A) ⇐⇒ Pλ0 := limδ→0+ E λ0 − E λ0 −δ = 0, und Pλ0 ist dann der orthogonale Projektor auf den Eigenraum zu λ0 . c. λ0 ∈ σC (A) ⇐⇒ Pλ0 = 0, aber für δ, ε > 0 ist E λ0 +ε − E λ0 −δ = 0. Der Limes in der Definition von Pλ0 ist natürlich wieder im Sinne der starken Operatorkonvergenz zu verstehen. Nach Satz 15.11 ist die Funktion λ −→ E λ rechtsseitig stetig (bzgl. der starken Operatorkonvergenz), und, wie wir hier sehen, sind die Eigenwerte gerade die Sprungstellen, während die Punkte des kontinuierlichen Spektrums die Stetigkeitsstellen sind, in denen die Funktion jedoch nicht lokal konstant ist. Die Bezeichnung „kontinuierliches Spektrum“ für σC (A) rührt vermutlich von dieser Tatsache her.
D Unitäre Transformationsgruppen und die S CHRÖDINGERgleichung Auch in diesem Abschnitt ist A stets ein (beschränkter oder unbeschränkter) selbstadjungierter Operator in dem komplexen H ILBERTraum H . Die Funktionen gt (λ) := eitλ , t ∈ R nehmen für reelles λ nur Werte vom Betrag 1 an, und für sie gilt gs gt = gs+t . Da der Funktionalkalkül eine ∗-Darstellung von M∞ ist, folgt hieraus für die Operatoren Ut := exp it A
D
Unitäre Transformationsgruppen und die S CHRÖDINGERgleichung
97
Us+t = Us Ut = Ut Us
(16.53)
Ut∗ = Ut−1 = U−t
(16.54)
sowie
für alle s, t ∈ R. Die Schar (Ut , t ∈ R) bildet daher (in Bezug auf die Multiplikation von Operatoren) eine kommutative Gruppe von unitären Operatoren. Man definiert: Definition 16.29 Die Schar der Ut := exp it A, t ∈ R heißt die unitäre Transformationsgruppe, die vom selbstadjungierten Operator A erzeugt wird. Wir wenden uns nun ihren wichtigsten Eigenschaften zu: Satz 16.30 Sei Ut , t ∈ R die von A erzeugte unitäre Transformationsgruppe. a. Für jedes x ∈ D(A) gilt: iAx =
Ut x − x d Ut x , := lim t=0 t−→0 dt t
(16.55)
und umgekehrt existiert der Limes genau dann, wenn x ∈ D(A) ist. Der Operator iA heißt der infinitesimale Generator der Gruppe {Ut | t ∈ R}. b. Die Schar (Ut ) ist stark stetig bezüglich t ∈ R, d. h. für jedes t0 ∈ R und x ∈ H gilt: lim Ut x − Ut0 x = 0.
t−→t0
(16.56)
Beweis a. Zunächst bemerken wir, dass für t = 0 der Operator f t (A) =
1 (Ut − I ) − iA t
(16.57)
auf D(A) definiert ist und offenbar die zu der Funktion f t (λ) :=
1 itλ (e − 1) − iλ t
(16.58)
gehörende Operatorfunktion ist. Nun ist nach dem Mittelwertsatz der Differentialrechnung 1 itλ (e − 1) = iλeiλθt , t
0 0 so, dass Ut y − y ≤ C|t| für alle genügend kleinen |t|, und dann folgt Ut x − x ≤ Ut y − y + 2x − y < C|t| + ε/2. Für alle genügend kleinen |t| ist auch der erste Term < ε/2, und damit folgt (16.56). Als Anwendung bekommen wir die eindeutige Lösbarkeit der Anfangswertaufgabe für die S CHRÖDINGER-Gleichung: Satz 16.31 Sei A ein selbstadjungierter Operator in H . Dann ist für jedes x ∈ D(A) die Anfangswertaufgabe 1 d ψ(t) = Aψ(t) , i dt
ψ(0) = x
(16.62)
eindeutig lösbar. Die Lösung ist ψ(t) = Ut x
mit Ut = eit A .
(16.63)
Beweis Zu gegebenem x ∈ D(A) definieren wir ψ(t) durch (16.63). Für beliebiges t0 ∈ R haben wir dann lim
τ →0
ψ(t0 + τ ) − ψ(t0 ) Uτ − I = lim U t0 x τ →0 τ τ Uτ − I = Ut0 lim x = Ut0 (iAx). τ →0 τ
Mit Satz 16.30a folgt hieraus, dass ψ(t0 ) ∈ D(A) und iAψ(t0 ) = lim
τ →0
ψ(t0 + τ ) − ψ(t0 ) dψ = (t0 ) τ dt
ist. Damit ist gezeigt, dass für x ∈ D(A) auch Ut x ∈ D(A) für alle t ∈ R ist und dass ψ(t) die Anfangswertaufgabe (16.62) löst. Sind ϕ(t), ψ(t) zwei Lösungen, so setzen wir u(t) := ϕ(t) − ψ(t) ,
h(t) := u(t)2 .
Dann ist u (t) = iAu(t) ,
u(0) = 0.
100
16 Spektralsatz und quantenmechanische Dynamik
Für differenzierbare H -wertige Funktionen v, w auf einem Intervall gilt allgemein d v(t)|w(t) = v (t)|w(t) + v(t)|w (t) , dt was man genauso wie die Produktregel für skalare Funktionen beweist (vgl. auch Aufgabe 8.7). Für v = w = u ergibt das h (t) = iAu(t)|u(t) + u(t)|iAu(t) = i u(t)|Au(t) − Au(t)|u(t) = 0.
Also ist h konstant, d. h. h(t) = h(0) = 0 für alle t, woraus die Eindeutigkeit folgt. Beispiele 16.32 In einfachen Fällen kann man Ut = eit A berechnen, indem man die Anfangswertaufgabe (16.62) explizit löst. Von dieser Art sind die folgenden Beispiele. Der H ILBERTraum ist dabei jedesmal H = L 2 (Rn ). a. Die Ortsoperatoren Q k sind die Multiplikationsoperatoren mit πk (x) := xk , k = 1, . . . , n. Die Anfangswertaufgabe (16.62) lautet dann 1 ∂ ψ(t, x) = xk ψ(t, x) , i ∂t
ψ(0, x) = ψ0 (x)
mit gegebenem ψ0 ∈ H . Ihre Lösung ist offenbar ψ(t, x) = eit xk ψ0 (x), und damit ist Ut = exp it Q k der Multiplikationsoperator mit eit xk . b. Die Impulsoperatoren Pk sind die eindeutigen L 2 -Realisierungen von i−1 ∂/∂ xk . Ihre Definitionsbereiche enthalten den Raum Sn der schnell fallenden Testfunktionen (Definition 11.3), und für ψ0 ∈ Sn hat die Anfangswertaufgabe 1 ∂ 1 ∂ ψ(t, x) = ψ(t, x) , i ∂t i ∂ xk
ψ(0, x) = ψ0 (x)
die eindeutige Lösung ψ(t, x) = ψ0 (x + t ek ) = ψ0 (x1 , . . . , xk + t, . . . , xn ). Da Sn in L 2 (Rn ) dicht ist (Theorem 11.9), folgt hieraus (exp it Pk )ψ = ψ(· + t ek ) ,
k = 1, . . . , n.
c. Der H AMILTONoperator eines freien Teilchens ist die L 2 -Realisierung von −Δ, und wieder ist Sn in seinem Definitionsbereich enthalten. Für ψ0 ∈ Sn ist das C AUCHY-Problem ∂ψ(t, x) = −iΔx ψ(t, x) , ∂t
ψ(0, x) = ψ0 (x)
D
Unitäre Transformationsgruppen und die S CHRÖDINGERgleichung
101
zu lösen, und seine Lösung ist nach Beispiel 13.26 für t = 0 gegeben durch i|x − y|2 1 ψ0 (y) exp ψ(t, x) = dn y. 4t (2π t)n/2 (1 + i)n Rn Das ist also (e−itΔ ψ0 )(x), falls ψ0 ∈ Sn . Diese Formel lässt zwar nicht unmittelbar erkennen, dass der dadurch gegebene Operator sich stetig zu einem unitären Operator in L 2 (Rn ) fortsetzt, aber wir wissen aus Satz 16.31, dass es so ist. Der berühmte Satz von S TONE, den wir jetzt beweisen werden, besagt, dass die hier besprochenen stark stetigen unitären Transformationsgruppen sozusagen die einzig möglichen sind. Um dies genau zu formulieren, definieren wir: Definition 16.33 Eine stark stetige unitäre Einparametergruppe in H ist eine Schar (Ut )t∈R von Operatoren aus B(H ), für die (16.53), (16.54) und (16.56) gelten. Wegen (16.54) besteht die Schar also aus unitären Operatoren, und U0 = I . Bemerkung Oft wird nur schwache Stetigkeit verlangt, d. h. die Bedingung lim x|Ut y = x|Ut0 y
t→t0
(16.64)
für alle x, y ∈ H , t0 ∈ R. Offenbar folgt dies aus (16.56), aber für Scharen von unitären Operatoren sind die beiden Bedingungen sogar äquivalent. Ist nämlich (16.64) für alle x, y erfüllt, so folgt Ut0 x|Ut x → Ut0 x2 = x2 für t → t0 , also Ut0 x − Ut x2 = Ut0 x2 − 2Re Ut0 x|Ut x + Ut x2 = 2x2 − 2Re Ut0 x|Ut x −→ 0 für t → t0 . In den Grundlagen der Quantenmechanik wird aus physikalischen Erwägungen hergeleitet, dass die Dynamik – also die zeitliche Evolution – eines Systems, dessen Zustände durch die Einheitsvektoren des H ILBERTraums H beschrieben werden, durch eine stark stetige unitäre Einparametergruppe in H gegeben sein muss (vgl. etwa [45] oder [54]). Wie der Satz von S TONE (zusammen mit Satz 16.31) zeigt, ist diese Dynamik also auch als Lösung der Anfangswertaufgabe für eine S CHRÖDINGERgleichung mit selbstadjungiertem H AMILTONoperator gegeben. Theorem 16.34 (Satz von S TONE) Zu jeder stark stetigen unitären Einparametergruppe {Ut | t ∈ R} in H existiert ein eindeutig bestimmter selbstadjungierter Operator A in H , so dass Ut = eit A .
102
16 Spektralsatz und quantenmechanische Dynamik
Beweis Nach Satz 16.30 ist klar, dass wir A durch die Gleichung iAx := lim
1
t−→0 t
(Ut − I )x
(16.55)
zu definieren versuchen. Es sei D(A) die Menge der x ∈ H , für die der Grenzwert (16.55) existiert. Dann zeigen wir zuerst: a. D(A) ist ein dichter Teilraum von H . Dies zeigen wir, indem wir einen Teilraum D0 von D(A) konstruieren, der dicht in H liegt. Sei dazu eine Funktion ϕ ∈ D(R) = C0∞ (R) gewählt. Dann existiert x(ϕ) =
ϕ(s)Us x ds
(16.65)
R
als normales R IEMANN-Integral, weil die Schar (Us ) stark stetig ist.2 Aus (16.65) und der Gruppeneigenschaft (16.53) bekommen wir dann 1 lim (Ut − I )x(ϕ) = lim t−→0 t t−→0
R
= lim
t−→0
=−
R
1 ϕ(s)(Ut+s − Us )x ds t ϕ(s − t) − ϕ(s) Us x ds t
ϕ (s)Us x ds = −x(ϕ ),
R
d. h. der Limes (16.55) existiert für jedes x(ϕ), und das bedeutet, dass D0 := {x(ϕ) | x ∈ H, ϕ ∈ C0∞ (R)} ⊂ D(A).
(16.66)
Wir zeigen als nächstes, dass D0 dicht in H ist, woraus dann a. wegen (16.66) folgt. Dazu wählen wir eine sogenannte δ-Folge (ϕn ) aus D(R), also eine Folge mit 1 (16.67) ϕn (s) ≥ 0 , ϕn (s) = 0 für |s| > , ϕn (s) ds = 1, n R
wie wir sie schon im Anschluss an Theorem 11.7 sowie in Beispiel 11.24c besprochen haben. Für beliebiges x ∈ H ist dann 2 Derartige Integrale von stetigen Funktionen mit Werten in einem BANACHraum wurden in den Aufgaben 8.8 und 8.9 ausführlich diskutiert.
D
Unitäre Transformationsgruppen und die S CHRÖDINGERgleichung
103
x(ϕn ) − x = ϕn (s)Us x dx − x Rn
= ϕn (s)[Us − I ]x ds R
≤ sup (Us − I )x. |s|≤ n1
Wegen Us x −→ x für s −→ 0 folgt hieraus lim x(ϕn ) − x = 0,
n−→∞
(16.68)
d. h. jedes x ∈ H kann durch eine Folge (x(ϕn )) aus D0 approximiert werden, und das bedeutet gerade D0 = H . b. A ist auf D(A) ein symmetrischer Operator. Seien nämlich x, y ∈ D(A). Dann folgt mit (16.55) und der Stetigkeit des Skalarproduktes # $ 1 x | Ay = −i lim x (Ut − I )y t−→0 t $ # 1 (U−t − I )x y = −i lim t−→0 t $ # 1 (U−t − I )x y = lim i t−→0 −t = iiAx | y = Ax | y , was die Symmetrie beweist. c. R(A ± iI ) ist dicht in H . Ist diese Behauptung gezeigt, so folgt, dass A wesentlich selbstadjungiert ist (man wende nämlich Satz 14.23b und Theorem 14.25 auf A¯ an). Wir wählen ein y ∈ R(A + iI )⊥ und zeigen y = 0. Für x(ϕ) ∈ D0 ist nach (16.65) Ut x(ϕ) =
ϕ(s)Ut+s x ds =
R
ϕ(s − t)Us x ds ∈ D0 , R
und aus (16.55) folgt dann d y | Ut x(ϕ) = y | iAUt x(ϕ) dt = −iA∗ y | Ut x(ϕ) .
104
16 Spektralsatz und quantenmechanische Dynamik
Nun ist aber y ∈ R(A + iI )⊥ = N (A∗ − iI ), d. h. es ist −iA∗ y = y, so dass wir bekommen d y | Ut x(ϕ) = y | Ut x(ϕ) . dt
(16.69)
Dies ist eine lineare Differentialgleichung erster Ordnung für die Funktion h(t) := y | Ut x(ϕ) ,
(16.70)
die sicher eine beschränkte Funktion ist, da Ut unitär ist. Sie erfüllt ferner h(0) = y | x(ϕ) .
(16.71)
Die Differentialgleichung (16.69) dagegen hat die eindeutige Lösung h(t) = h(0)et , die nur dann beschränkt ist, wenn h(0) = 0, d. h. (wegen (16.71)) wenn y | x(ϕ) = 0 ist. Also ist y ∈ D0⊥ = {0} und damit y = 0. Dies beweist, dass R(A + iI ) dicht in H ist, und für R(A − iI ) kann man den Beweis analog führen. d. A ist abgeschlossen Dies vervollständigt den Beweis, weil A schon wesentlich selbstadjungiert ist und damit als abgeschlossener Operator selbstadjungiert sein muss. iA ist nach (16.55) der infinitesimale Generator der Transformationsgruppe Ut . Wir setzen daher B := A
und Vt = eit B .
(16.72)
Dies ist möglich, da B selbstadjungiert ist. Nun zeigen wir Ut = Vt
für alle t ∈ R ,
(16.73)
weil daraus mit Satz 16.30 A = B und somit Abgeschlossenheit von A folgt. Sei also ein x ∈ D0 ⊆ D(A) ⊆ D(B) gewählt. Dann gilt, wie wir gezeigt haben U t x ∈ D0
und Vt x ∈ D(B),
und man hat nach Satz 16.30 d Vt x = iBVt x. dt
D
Unitäre Transformationsgruppen und die S CHRÖDINGERgleichung
105
Wegen A = B auf D0 folgt daraus d (Ut x − Vt x) = iAUt x − iBVt x dt = iB(Ut x − Vt x). Da B selbstadjungiert ist, bekommt man hieraus für die Funktion h(t) := Ut x − Vt x2 wie am Schluss des Beweises von Satz 16.31 das Ergebnis h (t) ≡ 0. Also ist h(t) ≡ h(0) = 0, und wir folgern Ut x = Vt x für alle t ∈ R , x ∈ C0 . Da D0 dicht in H ist, folgt (16.73) und damit die Behauptung. 16.35 Ausblick: Operatoralgebren statt unbeschränkter Operatoren Statt des (unbeschränkten) selbstadjungierten Operators A kann man die abgeschlossene lineare Hülle A von allen seinen Spektralprojektionen E(S) , S ∈ B1 betrachten. Wie aus der Bemerkung nach Satz 15.9 hervorgeht, ist A = R(Ψ ) = { f (A) | f ∈ M∞ (R)}, und insbesondere ist A eine kommutative C ∗ -Teilalgebra von B(H ). Man nennt sie die von A erzeugte VON N EUMANN-Algebra, und mittels des Spektralsatzes kann man selbstverständlich A aus A zurückgewinnen. Die Algebra A enthält offenbar die unitären Operatoren Ut = eit A und die Resolventen R A (ζ ) := (A − ζ I )−1 für ζ ∈ ρ(A). Nach Satz 16.30 lässt sich A schon aus der unitären Transformationsgruppe (Ut )t zurückgewinnen, und eine analoge Bemerkung gilt für die Resolventen, denn mittels der Formel von S TONE (Aufgabe 16.14) gewinnt man zunächst die Spektralschar und dann daraus das volle Spektralmaß. Zwar führen die naiven Quantisierungsvorschriften unmittelbar auf unbeschränkte Operatoren, doch erweist es sich für viele Zwecke als günstig, zu den VON N EUMANN-Algebren überzugehen. Hierfür sprechen auch physikalische Gründe – z. B. wird argumentiert, dass reale Messungen doch immer nur einen beschränkten Bereich von Werten für eine Observable liefern können, so dass für deren Beschreibung auch ein beschränkter selbstadjungierter Operator adäquat wäre (Korollar 16.25). 16.36 Ausblick: Unitäre Einparametergruppen und die kanonischen Vertauschungsrelationen In der klassischen Mechanik sind die Observablen eines Systems einfach die C ∞ -Funktionen auf dem Phasenraum M, der eine symplektische Mannigfaltigkeit ist. Da die üblichen Quantisierungsvorschriften immer nur lokale Situationen betreffen, können wir uns nach dem Satz von DARBOUX
106
16 Spektralsatz und quantenmechanische Dynamik
(Theorem 6.16) auf den Fall zurückziehen, wo M symplektische Koordinaten p1 , . . . , pn , q1 , . . . , qn hat, und dann ist jede Observable von der Form f ( p 1 , . . . , pn , q 1 , . . . , q n ) mit einer C ∞ -Funktion f . In gewissem Sinne wird also die Observablenalgebra des Systems lokal von den symplektischen Koordinaten p j , qk erzeugt. Bei Quantisierung müssen diese durch entsprechende Impuls- und Ortsoperatoren P j , Q k ersetzt werden, die die kanonischen Vertauschungsrelationen P j Q k − Q k P j = −iI δ jk ,
j, k = 1, . . . , n
(16.74)
erfüllen (wie immer, setzen wir die physikalischen Konstanten gleich 1). Dies aber zwingt zur Betrachtung von unbeschränkten Operatoren, denn innerhalb von B(H ) können diese Relationen nicht erfüllt werden (Aufgabe 8.24). Allerdings stößt die exakte mathematische Formulierung der kanonischen Vertauschungsrelationen im Bereich unbeschränkter selbstadjungierter Operatoren auf fundamentale Schwierigkeiten (vgl. [69], Ch. VIII.5), und das fügt den schon im vorigen Abschnitt genannten Argumenten dafür, dass man stattdessen geeignete C ∗ -Teilalgebren von B(H ) betrachten sollte, ein weiteres gewichtiges Argument hinzu. Um einen geeigneten Kandidaten für solch eine Algebra zu finden, betrachten wir die unitären Transformationsgruppen U j (t) := exp (it P j ) ,
Vk (t) := exp (it Q k )
(16.75)
Die naheliegendsten Beispiele für Operatoren, die die kanonischen Vertauschungsrelationen (16.74) erfüllen, sind die L 2 (Rn )-Realisierungen der Operatoren Pj ψ =
1 ∂ψ , i ∂x j
Q k ψ = xk ψ,
die wir bis jetzt immer als die Impuls- bzw. Ortsoperatoren angesehen hatten. Für sie haben wir die entsprechenden unitären Transformationsgruppen in Beispiel 16.32 berechnet. Mit den dortigen Ergebnissen bekommen wir für ψ ∈ L 2 (Rn ) % & U j (s)Vk (t)ψ (x) = eit (xk +sδ jk ) ψ(x + se j ), & % Vk (t)U j (s)ψ (x) = eit xk ψ(x + se j ). Es gelten also die sog. W EYL-Relationen U j (s)Vk (t) = eiδ jk st Vk (t)U j (s).
(16.76)
Hat man umgekehrt in B(H ) 2n unitäre Einparametergruppen U j , Vk ( j, k = 1, . . . , n), die die W EYL-Relationen erfüllen, und bezeichnet man mit P j bzw. Q k
D
Unitäre Transformationsgruppen und die S CHRÖDINGERgleichung
107
die selbstadjungierten Operatoren, von denen sie nach dem Satz von S TONE herrühren, so ergibt sich: Behauptung Für ψ ∈ D(P j Q k ) ∩ D(Q k P j ) gilt P j Q k ψ = −iδ jk ψ + Q k P j ψ. Beweis Wir betrachten feste j, k. Für ϕ ∈ D(P j ) ist nach (16.76) U j (−s)ϕ|Vk (t)ψ = eiδ jk st ϕ|Vk (t)U j (s)ψ . Anwenden von (1/i)∂/∂s auf beide Seiten und Auswerten bei s = 0 führt auf P j ϕ|Vk (t)ψ = δ jk tϕ|Vk (t)ψ + ϕ|Vk (t)P j ψ . Hierauf wenden wir (1/i)∂/∂t an und werten bei t = 0 aus. Wegen P j ψ ∈ D(Q k ) bekommen wir: P j ϕ|Q k ψ = −iδ jk ϕ|ψ + ϕ|Q k P j ψ . Wegen P j∗ = P j und Q k ψ ∈ D(P j ) bedeutet dies, dass ϕ|P j Q k ψ = ϕ|(−iδ jk ψ + Q k P j ψ) für alle ϕ aus dem dichten Teilraum D(P j ). Daher folgt die Behauptung.
Die kanonischen Vertauschungsrelationen sind also zumindest auf dem Teilraum erfüllt, wo die linke Seite von (16.74) definiert werden kann. Die Observablenalgebra eines Systems mit n Freiheitsgraden ist daher eine C ∗ Teilalgebra A von B(H ) (für einen geeigneten H ILBERTraum H ), die von 2n unitären Einparametergruppen U j , Vk erzeugt wird, welche die W EYL-Relationen erfüllen. Man nennt solch eine Algebra A eine Darstellung der W EYL-Relationen (oder auch der kanonischen Vertauschungsrelationen).3 Dass wir uns hier nicht auf einen bestimmten H ILBERTraum und eine bestimmte Algebra festlegen, schadet nichts, denn nach einem berühmten Eindeutigkeitssatz von J. V. N EUMANN sind die verschiedenen Möglichkeiten der Wahl von H und A in einem gewissen, ganz natürlichen Sinn äquivalent (s. [69], Ch. VIII.5). Systeme mit unendlich vielen Freiheitsgraden, wie sie für die Quantenfeldtheorie und die statistische Quantenphysik typisch sind, erfordern allerdings eine Observablenalgebra, die unendlich viele Einparametergruppen enthält, die (16.76) erfüllen, und dann ist die erwähnte Eindeutigkeit der Darstellung nicht mehr gegeben. Schon Die Einbettungsabbildung Ψ : A → B(H ) ist tatsächlich eine ∗-Darstellung von A im Sinne der Definition 15.14.
3
108
16
Spektralsatz und quantenmechanische Dynamik
im einfachsten Fall, nämlich bei einem quantisierten skalaren neutralen Feld, das für die Masse m > 0 die K LEIN -G ORDON-Gleichung erfüllt, entstehen für verschiedene Werte des Parameters m nicht-äquivalente Darstellungen der W EYL-Relationen (vgl. [66], Ch. X.7). All dies handelt aber von Systemen, die ein klassisches Analogon besitzen. Berücksichtigt man auch innere Quantenzahlen, so treten weitere Observable hinzu, die eigene Relationen erfüllen. Für ein Teilchen vom Spin 12 etwa benötigt man die Spineinstellungen Sx , S y , Sz in x, y und z-Richtung als weitere Observable, und diese erfüllen die Relationen [Sx , S y ] = iSz ,
[S y , Sz ] = iSx ,
[Sz , Sx ] = iS y
(16.77)
sowie Sx2 + S y2 + Sz2 =
3 I. 4
(16.78)
Diese Relationen können ohne weiteres durch beschränkte Operatoren dargestellt werden, sogar durch 2 × 2-Matrizen, nämlich durch Sx =
1 σx , 2
Sy =
1 σy , 2
Sz =
1 σz 2
mit den PAULIschen Spinmatrizen σx , σ y , σz , und wieder ist diese Darstellung in gewissem Sinne eindeutig. Aber auch hier geht die Eindeutigkeit verloren, sobald man es mit unendlich vielen Freiheitsgraden zu tun hat. Ein einfaches Beispiel hierfür, das nur mit Spinkonfigurationen arbeitet, findet sich in [78].
Aufgaben zu Kap. 16 16.1 Hier betrachten wir ausnahmsweise den H ILBERTraum H = Cn , n ∈ N. a. Sei T ∈ B(H ) = EndC (H ) eine lineare Abbildung, deren n Eigenwerte alle verschieden sind. Man zeige: Sind f (z), g(z) Polynome mit f (λ) = g(λ) für alle Eigenwerte λ von T , so ist f (T ) = g(T ). (Hinweis: Man berechne f (T ) − g(T ) in einer Basis, in der die Matrix zu T Diagonalgestalt besitzt. Wieso gibt es solch eine Basis?) b. Man zeige: Jedes T ∈ B(H ) kann als Grenzwert T = limν→∞ Tν geschrieben werden, wobei jedes Tν lauter verschiedene Eigenwerte besitzt. (Hinweis: Aus der linearen Algebra ist bekannt, dass es eine Basis gibt, in der die Matrix zu T Dreiecksgestalt hat mit den Eigenwerten in der Diagonale. Um die Tν zu konstruieren, ändere man diese Diagonalelemente leicht ab.) c. Man folgere den Satz von C AYLEY-H AMILTON: Für jedes T ∈ EndC (H ) ist χT (T ) = 0, wobei χT das charakteristische Polynom von T bezeichnet.
Aufgaben
109
16.2 Sei H ein beliebiger komplexer H ILBERTraum. Man zeige: Jedes T ∈ B(H ) kann als Linearkombination von (höchstens) vier unitären Operatoren geschrieben werden. (Hinweis: Zunächst zeige man: Ist A =√ A∗ und A ≤ 1, so ist A = 1 ∗ 2 2 (U + U ) mit U = f (A), wobei f (λ) := λ + i 1 − λ für −1 ≤ λ ≤ 1.) k 16.3 Sei A ∈ B(H ) selbstadjungiert, und sei f (z) = ∞ k=0 ck z eine Potenzreihe mit Konvergenzradius R > A. Man zeige, dass dann f (A) =
∞
ck Ak
k=0
gilt, wobei die Reihe in der Operatornorm konvergiert. Insbesondere ist für ζ ∈ C der durch den stetigen Funktionalkalkül gegebene Operator exp ζ A gleich dem in den Aufgaben 8.5 und 8.19 besprochenen Operator exp ζ A. 16.4 Sei A ∈ B(H ) , A = A∗ . Man zeige: A ist positiv und invertierbar genau dann, wenn es ein δ > 0 gibt mit A ≥ δ I im Sinne von Aufgabe 15.4. 16.5 Für einen beliebigen Operator T ∈ B(H ) zeige man: a. T ∗ T invertierbar ⇐⇒ T invertierbar ⇐⇒ T T ∗ invertierbar. b. Ist T invertierbar, so ist R := (T ∗ T )1/2 positiv und invertierbar. c. Ist T invertierbar, R := (T ∗ T )1/2 und U := T R −1 , so ist U unitär. Bemerkung Allgemein schreibt man R = |T | := (T ∗ T )1/2 . Man kann beweisen, dass dann T = UR gilt mit einem isometrischen Operator U ∈ B(H ) (Polarzerlegung). Die Isometrie U ist genau dann unitär, wenn T invertierbar ist. Die Polarzerlegung von Operatoren wird in den meisten Lehrbüchern der Funktionalanalysis behandelt, z. B. in [69]. 16.6 Für selbstadjungiertes A ∈ B(H ) setzen wir |A| := (A2 )1/2 ,
A± :=
1 (|A| ± A). 2
Man zeige: a. A+ und A− sind positive selbstadjungierte Operatoren, die mit A vertauschen. Ferner ist A = A+ − A− und |A| = A+ + A− . Wie kann man A± mittels des stetigen Funktionalkalküls aus A gewinnen? b. Sei E das Spektralmaß zu A und E 0 := E(] − ∞, 0]). Für x ∈ H gilt dann: x ∈ R(E 0 )
⇐⇒
A+ x = 0.
110
16
Spektralsatz und quantenmechanische Dynamik
c. Für die Spektralschar (E λ )λ , die mit A assoziiert ist, gilt: E λ ist die orthogonale Projektion auf den abgeschlossenen Unterraum N ((A − λI )+ ). Bemerkung Das Ergebnis von Teil c liefert eine verblüffend elementare Konstruktion der Spektralschar zu A. Man benötigt dazu noch nicht einmal den stetigen Funktionalkalkül, sondern nur die Existenz und Eindeutigkeit der positiven Quadratwurzel. Der Spektralsatz in der Form (16.51) kann über diesen Zugang bewiesen werden (vgl. etwa [70]). 16.7 Sei A ∈ B(H ) ein positiver selbstadjungierter Operator (Beispiel 16.9), und sei E das entsprechende Spektralmaß. Man zeige: Für jede B ORELmenge S ⊆ R ist durch ∞ √ (1 − 2χ S (λ)) λ dE(λ) W := 0
eine selbstadjungierte Quadratwurzel von A definiert, d. h. es ist W ∈ B(H ) , W = W ∗ und W 2 = A. Man gebe einen abgeschlossenen linearen Teilraum U an, für den gilt: W = A1/2 auf U, W = −A1/2 auf U ⊥ . 16.8 Sei A ein (möglicherweise unbeschränkter) selbstadjungierter Operator in H , sei E sein Spektralmaß, und sei J ein beschränktes Intervall mit unterer Grenze a und oberer Grenze b. Man zeige: Ist ψ ∈ R(E(J )) und ψ = 1, so ist a ≤ ψ|Aψ ≤ b und Aψ − λ0 ψ ≤ b − a für alle λ0 ∈ J . (Hinweis: Man verwende (15.38) und (15.39) aus Satz 15.17.) 16.9 Sei E das Spektralmaß zum selbstadjungierten Operator A, und sei S ⊆ R eine B ORELmenge. Man zeige: a. E(S)A ⊂ AE(S). b. Ist S beschränkt, so ist U(S) := R(E(S)) ⊆ D(A). Der Unterraum U(S) ist dann A-invariant, und die Einschränkung A0 von A auf U(S) ist ein beschränkter selbstadjungierter Operator im H ILBERTraum U(S). c. Unter den Voraussetzungen von Teil b. ist σ (A0 ) ⊆ S. (Hinweis: Ist λ0 ∈ R\S, so ist die Funktion g(λ) := (λ − λ0 )−1 χ S (λ) beschränkt und messbar auf ganz R.) 16.10 Sei A in H selbstadjungiert und δ > 0 gegeben. Man zeige: Jedes x ∈ H kann als Summe einer konvergenten Reihe x=
∞
xk
k=−∞
geschrieben werden, wobei Axk − kδxk ≤ δxk
∀k ∈ Z
Aufgaben
111
und xk |x = 0 für k = ist. (Hinweis: Mit dem Spektralmaß E zu A setzt man xk := E(](k − 1)δ, kδ])x und verwendet die vorige Aufgabe. Man beachte, dass xk = 0 für gewisse k zugelassen ist.) 16.11 Man zeige, dass für selbstadjungierte Operatoren A in H die folgenden Bedingungen äquivalent sind: x|Ax ≥ 0 für alle x ∈ D(A). σ (A) ⊆ [0, ∞[. Es gibt ein selbstadjungiertes W mit W 2 = A.
(i) (ii) (iii)
(Hinweis: Für (i) ⇒ (ii) verwende man Aufgabe 14.6, für (ii) ⇒ (iii) den Spektralsatz.) Bemerkung Sind diese Bedingungen erfüllt, so nennt man A positiv semidefinit oder kurz positiv und schreibt A ≥ 0. 16.12 Sei A in H selbstadjungiert, und seien f, g ∈ M∞ (R) reellwertig. Man zeige: Ist f (λ) ≤ g(λ) für alle λ ∈ R, so ist f (A) ≤ g(A) im Sinne von Aufgabe 15.4. 16.13 Sei A ein selbstadjungierter Operator in H , und sei g : [a, b] × R → C eine b beschränkte stetige Funktion, ferner f (λ) := g(t, λ) dt. Man zeige: Für alle a
x ∈ H ist g(t, A)x eine stetige H -wertige Funktion von t, und es gilt f (A)x =
b
g(t, A)x dt, a
wobei das Integral im Sinne von Aufgabe 8.8 zu verstehen ist. (Hinweis: Man verwende für beide Behauptungen (15.39) und den Satz von der dominierten Konvergenz. Das Integral wird dabei durch R IEMANNsche Zwischensummen bezüglich einer Folge von Zerlegungen und Stützstellen approximiert, die nicht von λ abhängt.) 16.14 Sei A ein selbstadjungierter Operator in H , und für ζ ∈ ρ(A) sei R A (ζ ) = (A − ζ I )−1 seine Resolvente. Ferner sei [a, b] ⊆ R ein kompaktes Intervall. Man zeige, dass im Sinne der starken Operatorkonvergenz gilt: a. Für jedes ε > 0 ist a
b
A − bI A − aI − arctan (R A (τ + iε) − R A (τ − iε)) dτ = 2i arctan ε ε
(Hinweis: Aufgabe 16.13 rechtfertigt die durchzuführenden Rechnungen.)
.
112
16
Spektralsatz und quantenmechanische Dynamik
b. Für das Spektralmaß E zu A gilt die sog. S TONEsche Formel 1 ε→0+ π i
b
lim
(R A (τ + iε) − R A (τ − iε)) dτ = E([a, b]) + E(]a, b[).
a
(Hinweis: Man verwende (15.39) und den Satz von der dominierten Konvergenz, um festzustellen, was mit dem Ergebnis von Teil a. für ε → 0+ passiert.) 16.15 Sei A selbstadjungiert und E sein Spektralmaß. Sei ferner B ∈ B(H ) ein Operator, der mit allen Spektralprojektionen E(S) vertauscht. Man zeige: a. Für alle f ∈ M gilt B f (A) ⊂ f (A)B. (Hinweis: Man zeige zunächst, dass μ Bx (S) ≤ B μx (S).) b. Für alle g ∈ M∞ ist Bg(A) = g(A)B. Insbesondere vertauscht B mit allen Ut = eit A und mit allen Resolventen (A − ζ I )−1 , ζ ∈ ρ(A). 16.16 Für ζ ∈ C mit |ζ | = 1 betrachten wir die selbstadjungierten Operatoren L ζ in L 2 (J ), die in Beispiel 14.28 eingeführt wurden, der Einfachheit halber aber nur (ζ ) für das Intervall J = [0, 1]. Wir setzen Ut := exp (it L ζ ), und wir definieren (ζ ) Operatoren Vt ∈ B(L 2 (J )) folgendermaßen: Zu jedem f ∈ L 2 (J ) definieren wir eine „periodische Fortsetzung mit Phasenverschiebung ζ “ durch f (x) := ζ m f (x − m) für m ≤ x < m + 1 ,
m∈Z
und setzen (ζ )
[Vt
f ](x) := f (x + t)
für 0 ≤ x ≤ 1, t ∈ R .
Außerdem sagen wir, eine Funktion g : R → C sei ζ -periodisch, wenn g(x + 1) = ζ g(x)
∀x ∈ R
gilt. Man zeige nacheinander: a. Jedes f ist ζ -periodisch, und jede ζ -periodische Funktion entsteht auf diese Weise aus ihrer Einschränkung auf J . b. Ist g ζ -periodisch, so auch gs , wo gs (x) := g(x + s) , s ∈ R. (ζ ) c. Die Vt , t ∈ R bilden eine unitäre Einparametergruppe in L 2 (J ). Sei iAζ ihr infinitesimaler Generator gemäß dem Satz von S TONE. f ∈ C 1 (R), und es gilt d. Ist f ∈ C 1 (J ) ∩ Dζ (Notation aus Beispiel 14.28), so ist (ζ )
lim
t→0
Vt
f − f = f . t
Aufgaben
113
e. Aζ = L ζ . (Hinweis: Da beide Operatoren selbstadjungiert sind, genügt es, L ζ ⊂ Aζ zu zeigen.) (ζ ) (ζ ) f. Ut = Vt für alle t. 16.17 Sei v ein C ∞ -Vektorfeld im Gebiet Ω ⊆ Rn . Wir nehmen der Einfachheit halber an, es besitze in Ω einen globalen Fluss (Φt )t∈R (vgl. die Definitionen in 3.21). Wir definieren lineare Operatoren Ut0 : D(Ω) → D(Ω) für t ∈ R durch Ut0 ψ := ψ ◦ Φt . Man zeige: 0 = U 0 U 0 . Ferner ist U 0 = I , und die U 0 sind a. Für alle s, t ∈ R ist Us0 Ut0 = Us+t t s t 0 0 . bijektiv mit (Ut0 )−1 = U−t b. Für alle ψ ∈ D(Ω) gilt
1 0 Ut ψ − ψ = vψ . t→0 t lim
c. Für 1 ≤ p < ∞ und alle ψ ∈ D(Ω) gilt: d dt t=0
0 p n |ψ(x)| p div v(x) dn x . Ut ψ d x = − Ω
Ω
(Hinweis: Man verwende die Transformationsformel (Korollar 4.13) mit f = Φ−t , ω = |Ut0 ψ| p dx1 ∧ · · · ∧ dxn und beachte auch Korollar 4.21 sowie die Definition der L IE-Ableitung eines kovarianten Tensorfeldes in Definition 3.23.) d. Ist v divergenzfrei, so haben die Ut0 eindeutige stetige Fortsetzungen Ut auf (Hinweis: Man beL 2 (Ω), und diese bilden eine unitäre Einparametergruppe. nötigt Teile a. und c., um zu zeigen, dass h(t) := Ω |Ut0 ψ|2 dn x auf ganz R verschwindende Ableitung hat!) e. Sei v divergenzfrei, und L v (x, D) sei der in Aufgabe 14.7 eingeführte formal selbstadjungierte Differentialoperator. Seine minimale L 2 -Realisierung besitzt dann eine selbstadjungierte Erweiterung Av . (Hinweis: Man verwende den Satz von S TONE.)
Teil IV
Gruppen und Darstellungen
Kapitel 17
Grundsätzliches über Gruppen
Der mathematische Gruppenbegriff kodiert eine Situation, die man in Mathematik und Physik an den verschiedensten Stellen antrifft, und die Beschäftigung mit Gruppen verteilt sich daher auch auf diverse Teildisziplinen. Die Theorie der diskreten Gruppen – d. h. der Gruppen, deren Elemente man sich als einzelne Punkte vorstellen sollte – gehört in die Algebra, und schon hier ist es ein großer Unterschied, ob man sich mit endlichen oder unendlichen Gruppen befasst. In der Theorie der topologischen Gruppen treten Aspekte aus Topologie und Funktionalanalysis hinzu, und bei der Behandlung von L IEschen Gruppen schließlich werden Begriffe und Methoden aus Algebra, Topologie, Differentialgeometrie und Funktionalanalysis herangezogen. Viele konkret wichtige Gruppen bestehen aus Matrizen, und daher benötigt man zu ihrer Untersuchung auch Werkzeuge aus der linearen Algebra und Matrizentheorie. Die Untersuchung von Kristallen in Physik und physikalischer Chemie führt ganz natürlich auf gewisse Fragestellungen über endliche Gruppen, doch ihre wirkliche Popularität haben die Gruppen in der Physik durch ihre Bedeutung in der Atom- und Elementarteilchenphysik gewonnen. Was dabei wirklich auftritt, sind L IE-Gruppen und zumeist konkrete Matrixgruppen: Die L ORENTZgruppe und die P OINCARÉgruppe werden zur Formulierung der Kovarianzeigenschaften relativistischer Systeme benötigt, bei der theoretischen Beschreibung des Drehimpulses in der Quantenmechanik, des Spins und anderer innerer Quantenzahlen treten gewisse Matrixgruppen auf, und schließlich bezieht sich jede Eichtheorie auf eine vorgegebene L IE-Gruppe als sog. Strukturgruppe. In diesem Kapitel führen wir einige Grundbegriffe ein, die für jedwede Art von Gruppen benötigt werden, illustrieren sie durch Beispiele und diskutieren ihre anschauliche und physikalische Bedeutung im Zusammenhang mit Symmetrien und Invarianzen. In den nächsten Kapiteln werden wir uns dann auf L IE-Gruppen und vor allem auf die physikalisch interessanten Matrixgruppen konzentrieren. Erst die Einführung der Darstellungstheorie in Kap. 20 erfolgt wieder in allgemeinerem Rahmen, doch bei ihrer Anwendung auf die Quantenmechanik stehen die vorher besprochenen Matrixgruppen im Vordergrund.
K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_17, C Springer-Verlag Berlin Heidelberg 2010
117
118
17 Grundsätzliches über Gruppen
A Gruppen und Homomorphismen Wir stellen zunächst die wichtigsten Begriffe und Beispiele zusammen. Alle Behauptungen, die hier nicht bewiesen werden, können durch sehr einfache Rechnungen verifiziert werden. Wir empfehlen dem Leser jedoch besonders dringend, diese Rechnungen wirklich durchzuführen, um sich an den Umgang mit Gruppen zu gewöhnen. Definitionen 17.1 a. Eine Menge G = ∅ heißt eine Gruppe mit der Verknüpfung G × G (g1 , g2 ) −→ g1 g2 ∈ G, wenn gilt 1. Assoziativgesetz: (ab)c = a(bc)
∀ a, b, c ∈ G.
2. Neutrales Element: Es gibt genau ein e ∈ G mit ea = ae = a
∀ a ∈ G.
3. Inverses Element: Zu jedem a ∈ G existiert genau ein a −1 ∈ G mit aa −1 = a −1 a = e. Gilt zusätzlich das Kommutativgesetz ab = ba
∀ a, b ∈ G,
so heißt G eine abelsche Gruppe.1 Hat G endlich viele Elemente, so heißt G eine endliche Gruppe und die Anzahl |G| der Elemente die Ordnung von G. b. Eine Teilmenge H ⊆ G, welche bezüglich der Verknüpfung von G selbst eine Gruppe ist, heißt eine Untergruppe von G. Dies ist genau dann der Fall, wenn 1. h 1 , h 2 ∈ H ⇒ h 1 h 2 ∈ H, 2. h ∈ H ⇒ h −1 ∈ H. c. Man schreibt H ≤ G bzw. H < G, wenn H eine Untergruppe (bzw. eine echte Untergruppe) der Gruppe G ist. 1 Eigentlich müsste man „A BELsche Gruppe“ schreiben, denn die Bezeichnung spielt auf den norwegischen Mathematiker N IELS H ENRIK A BEL an.
A
Gruppen und Homomorphismen
119
Der Durchschnitt von Untergruppen ist offenbar wieder eine Untergruppe von G. Beispiele 17.2 (Gruppen von Zahlen) a. R ist eine abelsche Gruppe bezüglich der Addition. Man bezeichnet sie mit (R, +). Z ist eine Untergruppe von (R, +). b. R∗ := R\{0} ist eine abelsche Gruppe bezüglich der Multiplikation. R+ := {x ∈ R | x > 0} und {1, −1} sind Untergruppen von R∗ . c. C ist bezüglich der Addition eine abelsche Gruppe, bezeichnet mit (C, +), und (R, +) ist eine Untergruppe von (C, +). d. C∗ := C\{0} ist bezüglich der Multiplikation eine abelsche Gruppe, und R∗ und U(1) := {eiα | α ∈ R} = {a ∈ C | |a| = 1} sowie auch {1, i, −1, −i} sind Untergruppen von C∗ . Statt Zahlen kann man hier auch Vektoren betrachten, also Elemente eines Vektorraums: Jeder Vektorraum ist bezüglich der Vektoraddition eine abelsche Gruppe. Die fundamentale Bedeutung des Gruppenbegriffs rührt jedoch viel eher von dem folgenden Beispieltyp her: Beispiele 17.3 (Transformationsgruppen) a. Bei jeder nichtleeren Menge M bilden die bijektiven Abbildungen A : M → M bezüglich der Verkettung (= Hintereinanderausführung) von Abbildungen eine Gruppe (S(M), ◦). Das neutrale Element ist hier die identische Abbildung id M , und das inverse Element zu einer Bijektion A ist die inverse Bijektion A−1 . b. Ist M eine endliche Menge, etwa M = {1, 2, . . . , n}, so nennt man die Bijektionen von M auf sich selbst auch Permutationen. Die Gruppe S(n) aller Permutationen von {1, . . . , n} heißt die symmetrische Gruppe vom Grad n. Permutationen tauchen schon in der elementaren linearen Algebra im Zusammenhang mit Determinanten auf (vgl. etwa [34], Kap. 5) oder auch bei der Behandlung von alternierenden Multilinearformen (vgl. Abschn. 2C). c. Wenn die Menge M irgendwie strukturiert ist, so bilden die Bijektionen A ∈ S(M), bei denen sowohl A als auch A−1 die Struktur in einem vernünftigen Sinn „respektieren“, eine Untergruppe von S(M). Diese nennt man die Automorphismengruppe der strukturierten Menge M. Wir wollen diese Begriffe nicht exakt definieren, sondern sie nur durch einige Beispiele illustrieren: Ist M ein topologischer Raum, so sind die stetigen Abbildungen die strukturtreuen, und die Automorphismengruppe ist dann die Gruppe aller Homöomorphismen M → M. Ist M eine differenzierbare Mannigfaltigkeit, so wird die Struktur von den C ∞ Abbildungen respektiert, und die Automorphismengruppe ist die Gruppe aller Diffeomorphismen von M auf sich. Bei einer (pseudo)-R IEMANNschen Mannigfaltigkeit (M, g) handelt es sich um die Isometrien, bei einer symplektischen Mannigfaltigkeit (M, ω) um die symplektischen Diffeomorphismen, also die kanonischen Transformationen. Ist V ein K-Vektorraum, so sind die K-linearen Abbildungen die strukturtreuen, und die Automorphismengruppe besteht daher
120
17 Grundsätzliches über Gruppen
aus den linearen Bijektionen (die Umkehrung einer linearen Abbildung ist ja automatisch ebenfalls linear!). Ist schließlich H ein H ILBERTraum, so sind die isometrischen linearen Abbildungen die strukturtreuen, und die Automorphismengruppe besteht daher aus den unitären Operatoren in H . Man bezeichnet sie als die unitäre Gruppe U(H ). Bei endlichdimensionalen Vektorräumen kann man die linearen Abbildungen natürlich durch Matrizen beschreiben, und die Bijektionen entsprechen dann den regulären Matrizen. Der Verkettung der linearen Abbildungen entspricht die Matrixmultiplikation, und so entstehen aus den Automorphismengruppen von endlichdimensionalen Vektorräumen Gruppen von Matrizen. Diese Gruppen – und etliche ihrer Untergruppen – sind besonders wichtig, und wir führen für sie Standardbezeichnungen ein: Definitionen 17.4 Allgemeine lineare Gruppe über C: G L (n, C) := {A ∈ Cn×n | det A = 0}, allgemeine lineare Gruppe über R: G L (n, R) := {A ∈ Rn×n | det A = 0}, spezielle lineare Gruppe über C: SL (n, C) := {A ∈ Cn×n | det A = 1}, spezielle lineare Gruppe über R: SL (n, R) = {A ∈ Rn×n | det A = 1}. Es gilt G L (n, R) < G L (n, C) , SL (n, C) < G L (n, C), SL (n, R) < SL (n, C) , SL (n, R) < G L (n, R). Alle diese Behauptungen folgen aus dem Determinanten-Multiplikationssatz. Ausgehend von einer festen Matrix G kann man Untergruppen der linearen Gruppen definieren, die für die Anwendungen besonders interessant sind. Es handelt sich im reellen (bzw. im komplexen) Fall um die Gruppe OG (n) (bzw. UG (n)) der reelllinearen Transformationen des Rn (bzw. der komplex-linearen Transformationen des Cn ), die die zu G gehörige Sesquilinearform aG (v, w) := v|Gw
A
Gruppen und Homomorphismen
121
invariant lassen. Wir beschreiben dies zunächst in allgemeinem Rahmen durch den folgenden Satz: Satz 17.5 a. Sei G ∈ Rn×n gegeben. Für reelle n × n-Matrizen S sind dann die folgenden beiden Bedingungen äquivalent: Sv|G Sw = v|Gw
∀ v, w ∈ Rn
(17.1)
und S T G S = G.
(17.2)
Die Menge OG (n) aller invertierbaren S ∈ Rn×n , die diese Bedingungen erfüllen, bildet eine Untergruppe von G L(n, R). Ihre Elemente nennt man G-orthogonale Transformationen. b. Sei G ∈ Cn×n gegeben. Für komplexe n × n-Matrizen T sind dann die folgenden beiden Bedingungen äquivalent: T v|GT w = v|Gw
∀ v, w ∈ Cn
(17.3)
und T ∗ GT = G.
(17.4)
Die Menge UG (n) aller invertierbaren T ∈ Cn×n , die diese Bedingungen erfüllen, bildet eine Untergruppe von G L(n, C). Ihre Elemente nennt man G-unitäre Transformationen. c. Ist G invertierbar, so ist | det S| = 1,
| det T | = 1
für S ∈ OG (n) bzw. für T ∈ UG (n). Der Beweis erfolgt durch einfache Matrizenrechnungen und ist z. B. in [34], Kap. 19, ausführlich dargestellt. Durch spezielle Wahlen der Matrix G erhält man nun die folgenden Gruppen: Definitionen 17.6 Sei 0 ≤ p ≤ n, q = n − p und sei G := E p ⊕ (−E q ), d. h. G ist die n × n-Diagonalmatrix, die zunächst p mal die 1, dann q mal die −1 als Eintrag in der Diagonalen hat. a. Dann ist die orthogonale Gruppe der Signatur ( p, q) definiert durch O( p, q) := O G (n) ≡ {A ∈ Rn×n | A T G A = G},
122
17 Grundsätzliches über Gruppen
und die spezielle orthogonale Gruppe der Signatur ( p, q) ist S O( p, q) = O( p, q) ∩ SL (n, R). Man nennt O(n) := O(n, 0) ,
S O(n) := S O(n, 0)
die orthogonale bzw. spezielle orthogonale Gruppe. b. Die unitäre Gruppe der Signatur ( p, q) ist definiert durch U( p, q) := U G (n) ≡ {A ∈ Cn×n | A∗ G A = G}. und die spezielle unitäre Gruppe der Signatur ( p, q) ist SU( p, q) = U( p, q) ∩ SL(n, C). Man nennt U(n) = U(n, 0)
bzw. SU(n) = SU(n, 0)
die unitäre bzw. spezielle unitäre Gruppe. c. Sei n = 2m gerade und E = E m ∈ Rm×m die Einheitsmatrix. Ferner sei
0 E J := −E 0
∈ Rn×n ,
also J T = J −1 = −J.
Dann ist die symplektische Gruppe definiert durch Sp(n) := O J (n) ≡ {A ∈ Rn×n | A T J A = J }. Diese Gruppen nennt man auch die klassischen Gruppen, und man begegnet ihnen überall in Mathematik und Physik an entscheidenden Stellen. Wir notieren hier noch einige einfache Eigenschaften ihrer Elemente: Satz 17.7 Ist A ∈ O( p, q) oder A ∈ U( p, q) oder A ∈ Sp(n), so gilt | det A| = 1. Ferner ist A−1 = G A T G −1
∗
falls A ∈ O( p, q),
A = G A G falls A ∈ U( p, q), A−1 = −J A T J falls A ∈ Sp(n)
A
Gruppen und Homomorphismen
123
Beweis Wegen G 2 = E und J 2 = −E können wir jedesmal 17.5c anwenden und erhalten in allen Fällen | det A| = 1, insbesondere die Existenz von A−1 . Ferner folgt: – in O( p, q) : (G A T G)A = G(A T G A) = G 2 = E – in U( p, q) : (G A∗ G)A = G(A∗ G A) = G 2 = E – in Sp(n) : (J A T J )A = J (A T J A) = J 2 = −E,
womit die Formeln für die inverse Matrix gezeigt sind.
Anmerkung 17.8 Die symplektischen Matrizen A ∈ Sp(2m) beschreiben die linearen kanonischen Transformationen aus der klassischen Mechanik. Um dies näher zu erläutern, versehen wir R2m mit der kanonischen symplektischen Form ω=
m
dxk ∧ dyk
k=1
(vgl. Beispiel 1 aus Abschn. 6C). Wie man leicht explizit nachrechnet, ist dann ω(v, w) = v|J w
(17.5)
für Vektoren v, w ∈ R2m . Wegen der Äquivalenz von (17.2) mit (17.1) ist daher A ∈ Sp(2m)
⇐⇒
α∗ω = ω
für den Diffeomorphismus α : R2m −→ R2m , x −→ Ax . Das bedeutet, dass die durch A beschriebene lineare Transformation der symplektischen Mannigfaltigkeit (R2m , ω) genau dann eine kanonische Transformation ist, wenn A zur symplektischen Gruppe gehört. Hieraus folgt eine Verschärfung von Satz 17.7 für die symplektische Gruppe: Behauptung det A = 1
für alle A ∈ Sp(2m) .
Beweis Die 2m-Form ωm verschwindet nirgends (Satz 6.18 oder direkte Rechnung), und aus α ∗ ω = ω folgt α ∗ (ωm ) = ωm . Andererseits ist α ∗ (ωm ) = (det α)ωm nach (2.12), also det A = det α = 1.
124
17 Grundsätzliches über Gruppen
Bemerkung Ein elementarer Beweis für diese Behauptung findet sich in [34] (Ergänzungen zu Kap. 24).
Homomorphismen und Isomorphismen Das Analogon zu den linearen Abbildungen zwischen Vektorräumen bilden die Homomorphismen von Gruppen: Definitionen 17.9 Seien G, H Gruppen, eG , e H ihre neutralen Elemente, und ϕ : G −→ H eine Abbildung. a. ϕ heißt ein Gruppenhomomorphismus, wenn ϕ(g1 g2 ) = ϕ(g1 )ϕ(g2 )
∀ g1 , g2 ∈ G.
(17.6)
Man setzt Kern ϕ = {g ∈ G | ϕ(g) = e H }, Bild ϕ = {h ∈ H | h = ϕ(g) für ein g ∈ G}. b. Ist Bild ϕ = H , d. h. ϕ surjektiv, so heißt ϕ ein Epimorphismus (von Gruppen). Ist Kern ϕ = {eG }, so heißt ϕ ein Monomorphismus (von Gruppen). Ist ϕ bijektiv, so heißt ϕ ein Isomorphismus (von Gruppen). c. Zwei Gruppen G 1 , G 2 werden als isomorph bezeichnet, wenn es einen Isomorphismus G 1 → G 2 gibt. Schreibweise: G 1 ∼ = G 2. Ähnlich wie bei linearen Abbildungen liegt der entscheidende Nutzen der Bedingung (17.6) darin, dass beliebige Relationen zwischen Elementen von G nach Anwendung eines Homomorphismus ϕ : G → H in analoge Relationen zwischen den jeweiligen Bildelementen übergehen. Sind also zwei Gruppen G 1 , G 2 isomorph, so kann man jede Relation in G 1 in eine analoge Relation in G 2 übertragen und umgekehrt, und daher kann man diese beiden Gruppen mit Mitteln der Gruppentheorie alleine nicht voneinander unterscheiden. Beispiele 17.10 a. exp : (R, +) −→ R+ mit exp(x) = ex ist ein Isomorphismus b. exp : (C, +) −→ C∗ mit exp(z) = ez ist ein Epimorphismus, und Kern exp = 2π Z. c. Ist (Ut )t eine unitäre Einparametergruppe im Sinne von Definition 16.33, so ist die Abbildung t −→ Ut ein Homomorphismus (R, +) → U(H ).
A
Gruppen und Homomorphismen
125
d. det : G L(n, C) −→ C∗ ist ein Epimorphismus mit Kern det = SL(n, C). Analog für R statt C. e. Die Signums-Abbildung sgn : S(n) −→ {1, −1} ist ein Epimorphismus. f. Sind V, W Vektorräume und T : V → W eine lineare Abbildung, so ist T auch ein Gruppenhomomorphismus (V, +) → (W, +). g. Sei G eine beliebige Gruppe und s ∈ G. Dann ist durch ϕs : G −→ G : g −→ s −1 gs ein Homomorphismus gegeben, und er ist sogar ein Isomorphismus, denn ϕs −1 = (ϕs )−1 . Man nennt ihn den von s erzeugten inneren Automorphismus. Man sollte sich vor Augen halten, dass auf der linken und der rechten Seite von (17.6) i. A. verschiedene Verknüpfungen stehen, nämlich die von G auf der linken und die von H auf der rechten. So haben wir etwa bei der Exponentialfunktion links die Addition, rechts aber die Multiplikation von Zahlen, so dass (17.6) hier die Form ϕ(g1 + g2 ) = ϕ(g1 )ϕ(g2 ) annimmt. Zur Illustration rechnen wir nach, dass die inneren Automorphismen ϕs aus Beispiel 17.10g tatsächlich (17.6) erfüllen: ϕs (g1 )ϕs (g2 ) = (s −1 g1 s)(s −1 g2 s) = (s −1 g1 )(ss −1 )(g2 s) = s −1 g1 g2 s = ϕs (g1 g2 ). Die folgenden Aussagen können als Übung bewiesen werden. Analoge Aussagen für lineare Abbildungen sind wohlbekannt, und deren Beweise kann man (mit kleinen Änderungen) übernehmen. Satz 17.11 Seien G, H Gruppen, U ≤ G, V ≤ H Untergruppen und ϕ : G −→ H ein Homomorphismus. Dann gilt a. b. c. d. e. f. g.
ϕ(eG ) = e H , ϕ(g −1 ) = (ϕ(g))−1 für alle g ∈ G. Kern ϕ ist eine Untergruppe von G. ϕ ist genau dann eine injektive Abbildung, wenn Kern ϕ = {e}. Bild ϕ ist eine Untergruppe von H . ϕ(U ) = {h ∈ H | h = ϕ(u) für ein u ∈ U } ist Untergruppe von H . ϕ −1 (V ) = {g ∈ G | ϕ(g) ∈ V } ist Untergruppe von G. Ist ϕ ein Isomorphismus, so ist ϕ −1 ebenfalls ein Isomorphismus.
126
17 Grundsätzliches über Gruppen
B Symmetrie als Invarianz unter einer Gruppenoperation Wir wollen nun an Beispielen diskutieren, was Symmetrie in ihrer naiven Bedeutung mit Gruppen zu tun hat und was die Symmetrien in der Physik mit Gruppen zu tun haben. Beispiel 1: Symmetrie von geometrischen Figuren In der elementaren Geometrie nennt man zwei Teilmengen M, N der Ebene R2 kongruent, wenn sie durch eine euklidische Bewegung ineinander überführt werden können. Eine euklidische Bewegung besteht dabei aus einer orthogonalen Transformation und einer Verschiebung, d. h. sie hat die Form β A,v (x) = Ax + v
mit A ∈ O(2) , v ∈ R2 .
(17.7)
Man kann sagen, dass zwei Teilmengen der Ebene genau dann zwei Exemplare von ein und derselben geometrischen Figur darstellen, wenn sie kongruent sind. Wie symmetrisch eine gegebene Teilmenge (oder Figur) ist, kann nun daran gemessen werden, ob es viele oder wenige Bewegungen gibt, die die Menge mit sich selbst zur Deckung bringen. Um dies zu präzisieren, beachten wir, dass die Menge aller euklidischen Bewegungen der Ebene mit der Verkettung als Verknüpfung eine Gruppe bildet (Aufgabe 17.11), die Isometriegruppe E(2) von R2 . Für jedes M ⊆ R2 ist dann die Menge Σ(M) := {β ∈ E(2) | β(M) = M} eine Untergruppe, wie man ohne weiteres nachrechnet. Diese Untergruppe ist umso größer, je mehr Symmetrie die geometrische Figur hat, die durch M dargestellt wird, und wir nennen sie die Symmetriegruppe von M. Um dies an konkreten Fällen zu verifizieren, erinnern wir uns ([34], Kap. 7), dass O(2) aus Drehungen R(α) =
cos α − sin α
sin α cos α
sowie Spiegelungen S(α) besteht, wobei S(α) an der Geraden Γα spiegelt, die vom Vektor (cos α, sin α)T aufgespannt wird. Also ist S(0) =
1 0 , 0 −1
und anstatt für S(α) eine Matrix anzugeben, stellen wir uns auf den Standpunkt, dass S(α) folgendermaßen entsteht: Man dreht zunächst um den Winkel −α, so dass die Achse Γα auf die x-Achse zu liegen kommt, dann spiegelt man, und dann dreht man wieder um α zurück. Das ergibt
B
Symmetrie als Invarianz unter einer Gruppenoperation
127
S(α) = R(α)S(0)R(α)−1 . Der Einfachheit halber betrachten wir jetzt nur Mengen, die um den Nullpunkt zentriert sind. Ist M solch eine Menge und β = β A,v ∈ E(2) , β(M) = M, so muss β(0) = 0 sein, also v = 0 und somit β(x) = Ax mit A ∈ O(2). Wir identifizieren jetzt die lineare Abbildung β mit der Matrix A, die sie definiert. Für Zahlen a, b > 0 betrachten wir speziell das achsenparallele Rechteck M = Ra,b := {(x, y) ∈ R2 | |x| ≤ a , |y| ≤ b} mit den Kantenlängen 2a, 2b (Abb. 17.1). Es wird durch die Drehung um π sowie durch die Spiegelungen an der x- und der y-Achse mit sich selbst zur Deckung gebracht, und natürlich von der identischen Abbildung R(0) = I . Weitere Bewegungen, die das Rechteck mit sich selbst zur Deckung bringen, gibt es nicht. Damit enthält Σ(Ra,b ) genau die 4 Elemente I, R(π ), S(0) und S(π/2), und man rechnet leicht nach, dass diese eine Untergruppe von O(2) bilden. Im Falle a = b bilden sie sogar ganz Σ(Ra,b ), aber für a = b (Quadrat!) treten noch die Drehungen R(±π/2) und die Spiegelungen S(±π/4) an den Diagonalen hinzu, d. h. die Ordnung von Σ(Ra,a ) ist 8. Hieran zeigt sich die erhöhte Symmetrie des Quadrats. Als weitere Illustration betrachten wir das regelmäßige n-Eck Pn . Es sei dem Einheitskreis einbeschrieben, und eine seiner Ecken sei auf die (komplexe) Eins gelegt (vgl. Abb. 17.2). Die Ecken sind dann die Punkte exp(2π ik/n) , k = 0, 1, . . . , n − 1, und Dn := Σ(Pn ) besteht aus den Drehungen R(2π k/n) ,
k = 0, 1, . . . , n − 1
sowie den Spiegelungen S(π k/n) ,
k = 0, 1, . . . , n − 1 .
Die Symmetriegruppe des regelmäßigen n-Ecks hat also 2n Elemente, und sie wird als Diedergruppe der Ordnung 2n bezeichnet. Für n → ∞ ergibt sich der Kreis, und seine Symmetriegruppe ist ganz O(2).
Γ3π/4
Γπ/2 R(π)
Γπ/2
Γπ/4
R(π2 ) Γ0
Abb. 17.1 Symmetrien von Rechteck und Quadrat
Γ0
128
17 Grundsätzliches über Gruppen
Abb. 17.2 Symmetrien von regelmäßigem Fünfeck und Sechseck
Am anderen Ende der Skala haben wir die völlig unregelmäßig geformten Mengen M, bei denen Σ(M) nur aus der identischen Abbildung I alleine besteht. Die Symmetrie einer geometrischen Figur sollte natürlich nicht davon abhängen, wo und wie diese in der Ebene liegt. Daher wollen wir die Symmetriegruppen Σ(M1 ) und Σ(M2 ) miteinander in Beziehung setzen, wenn M1 , M2 kongruent sind. Sei also γ ∈ E(2) so, dass γ (M2 ) = M1 . Dann ist β ∈ Σ(M2 )
⇐⇒
M2 = β(γ −1 (M1 ))
⇐⇒
M1 = γ (β(γ −1 (M1 ))) = (γ ◦ β ◦ γ −1 )(M1 )
⇐⇒
γβγ −1 ∈ Σ(M1 ) .
Also besteht Σ(M2 ) genau aus den γ −1 αγ , α ∈ Σ(M1 ), d. h. Σ(M2 ) geht aus Σ(M1 ) durch Anwendung des inneren Automorphismus ϕγ hervor, und insbesondere sind die beiden Gruppen isomorph. Haben wir z. B. ein Rechteck R irgendwo schräg in der Ebene liegen (Abb. 17.3), so wählen wir als γ eine Bewegung, die seinen Mittelpunkt in den Nullpunkt legt und seine Kanten achsenparallel ausrichtet. Dadurch entsteht eines der oben betrachteten speziellen Rechtecke Ra,b , und die Elemente von Σ(R) sind nun die vier Transformationen, die dadurch entstehen, dass man γ anwendet, das entstandene achsenparallele Rechteck dreht oder spiegelt, und schließlich mit γ −1 zurückbewegt. Alles bisher Gesagte kann ohne weiteres rigoros bewiesen werden, aber darum geht es hier nicht. Es soll nur eine Vorstellung davon gegeben werden, wie man mit Gruppen umgeht und wie man sie zur Diskussion von Symmetrie einsetzt. Auch die Wahl der Dimension n = 2 geschah nur der größeren Anschaulichkeit halber – man könnte ebensogut geometrische Figuren in Rn betrachten oder sogar auf einer R IEMANNschen Mannigfaltigkeit, vorausgesetzt, ihre Isometriegruppe ist groß genug. Bei den Symmetrien in der Physik hat man es häufig mit der Situation zu tun, dass die Elemente einer Gruppe G Transformationen – also bijektive Selbstabbil-
B
Symmetrie als Invarianz unter einer Gruppenoperation
129
γ
S(0)
γ –1
Abb. 17.3 Spiegelung eines Rechtecks in beliebiger Lage
dungen – einer (strukturierten) Menge Z in systematischer Weise hervorrufen, obwohl G gar nicht aus solchen Transformationen besteht. Auch in der Mathematik trifft man diese Situation sehr häufig an, und wir führen dafür die folgende gängige Terminologie ein: Definitionen 17.12 Sei Z = ∅ eine Menge, G eine Gruppe und e ihr neutrales Element. a. Eine Linksoperation (= Links-Aktion) von G auf Z ist eine Abbildung G × Z −→ Z : (g, z) −→ g · z ≡ gz mit den Eigenschaften (i) g1 (g2 z) = (g1 g2 )z für alle g1 , g2 ∈ G , z ∈ Z , (ii) ez = z für alle z ∈ Z . Ist eine Linksoperation von G auf Z gegeben, so sagt man auch, die Gruppe G operiert (von links) auf Z . b. Sei eine Linksoperation von G auf Z gegeben. Man schreibt g M := {gz | z ∈ M} für g ∈ G , M ⊆ Z .
130
17 Grundsätzliches über Gruppen
Die Symmetriegruppe einer Teilmenge M ⊆ Z ist dann definiert durch Σ(M) := {g ∈ G | g M = M}. Man bestätigt durch leichte Rechnung, dass Σ(M) tatsächlich eine Untergruppe von G ist. Wenn auf Z eine G-Linksoperation gegeben ist, so kann man zu jedem g ∈ G die Abbildung ϕ(g) : Z −→ Z : z −→ gz
(17.8)
bilden. Diese hat offenbar die Inverse ϕ(g −1 ), ist also bijektiv, und ferner gilt ϕ(g1 g2 ) = ϕ(g1 ) ◦ ϕ(g2 ) für alle g1 , g2 ∈ G. Damit ist ϕ ein Homomorphismus G → S(Z ) (Bezeichnung wie in Beispiel 17.3a). Ist umgekehrt ein solcher Homomorphismus ϕ gegeben, so ist durch gz := [ϕ(g)](z) ,
z∈ Z, g∈G
(17.9)
eine Linksoperation von G auf Z definiert. Auf diese Weise stehen die Linksoperationen von G auf Z in bijektiver Korrespondenz zu den Gruppenhomomorphismen G → S(Z ). Bemerkung Auf analoge Weise kann man natürlich auch Rechtsoperationen definieren. Der Unterschied liegt jedoch nicht nur in der Schreibweise, denn Bedingung (i) muss ersetzt werden durch (i’)
(zg1 )g2 = z(g1 g2 ) für alle g1 , g2 ∈ G , z ∈ Z .
Die Anwendung des Produkts g1 g2 auf Punkte von Z entspricht also hier der Anwendung von g1 und g2 in der umgekehrten Reihenfolge wie bei Linksoperationen. Auch die Rechtsoperationen stehen in bijektiver Korrespondenz zu den Homomorphismen G → S(Z ), doch muss (17.8) ersetzt werden durch ϕ(g) : Z −→ Z : z −→ zg −1 .
(17.10)
Wie schon am Beispiel der euklidischen Bewegungen der Ebene erläutert, ändert sich die Symmetriegruppe einer Teilmenge nicht wesentlich, wenn diese Teilmenge der Wirkung eines Gruppenelements unterworfen wird. Größe und Struktur der Symmetriegruppe bleiben erhalten, denn es gilt: Satz 17.13 Die Gruppe G operiere auf der Menge Z von links. Ist M1 = g M2 für ein g ∈ G und Teilmengen M1 , M2 ⊆ Z , so gilt Σ(M2 ) = g −1 Σ(M1 )g := {g −1 hg | h ∈ Σ(M1 )}, und insbesondere ist Σ(M2 ) ∼ = Σ(M1 ).
B
Symmetrie als Invarianz unter einer Gruppenoperation
131
Der Beweis besteht in genau derselben Rechnung, die oben in Beispiel 1 für den Spezialfall Z = R2 , G = E(2) durchgeführt worden ist. Nun betrachten wir einige aus der Physik stammende Beispiele von Gruppenoperationen und zugehörigen Symmetriegruppen: Beispiel 2: Drehinvariante H AMILTONsche Systeme Wir betrachten ein System von N Massenpunkten der Massen m 1 , . . . , m N und bezeichnen den Ort des j-ten Massenpunkts mit q j = (x j , y j , z j ), seinen Impuls mit p j = ( p j,x , p j,y , p j,z ). Der Konfigurationsraum ist dann Ω := {q = (q 1 , . . . , q N ) ∈ R3N | q j = q k für j = k} , und auf ihm operiert die Drehgruppe S O(3) von links durch R · (q 1 , . . . , q N ) = (Rq 1 , . . . , Rq N ) ,
R ∈ S O(3).
Der Phasenraum ist T ∗ Ω = Ω × R3N = {(q, p) | q ∈ Ω , p = ( p1 , . . . , p N ) ∈ R3N }, und auf ihm operiert S O(3) durch R · (q, p) = (Rq, R p) mit R( p1 , . . . , p N ) = (R p1 , . . . , R p N ). Die Wechselwirkung zwischen den Teilchen sei nun durch eine potentielle Energie V gegeben, die nur von den |q j | und den Abständen |q j − q k | , j = k abhängt. Dann ist V (Rq) = V (q) und für die kinetische Energie T =
N
∀ R ∈ S O(3),
1 j=1 2m j
T (R p) = T ( p)
| p j |2 gilt sowieso
∀ R ∈ S O(3).
Die H AMILTONfunktion H = T + V ist somit drehinvariant in dem Sinn, dass H (Rq, R p) = H (q, p)
∀ R ∈ S O(3).
(17.11)
Bei den physikalisch interessanten Potentialen V sind die Lösungen der H AMIL TON schen Bewegungsgleichungen auf ganz R definiert. In diesem Fall ist die Lösungsmenge M der H AMILTONschen Gleichungen eine Teilmenge von Z := {γ ∈ C 1 (R; R6N ) | γ (t) ∈ Ω × R3N ∀ t ∈ R}, und eine Linksoperation der Drehgruppe auf Z ist gegeben durch (R · γ )(t) := R · γ (t) für t ∈ R , R ∈ S O(3).
132
17 Grundsätzliches über Gruppen
Ist nun die Invarianzforderung (17.11) erfüllt und ist γ ∈ Z eine Lösung der H A MILTON gleichungen, so ist für jede Drehung R auch R · γ eine Lösung, wie man durch eine leichte Rechnung bestätigt (Kettenregel und R T = R −1 beachten!). Da die Drehungen eine Gruppe bilden, die auf Z operiert, ist damit auch schon die umgekehrte Schlussfolgerung klar: Ist R ·γ eine Lösung, so ist auch γ = (R −1 R)·γ = R −1 · (R · γ ) eine Lösung, denn R −1 gehört ja ebenfalls zu unserer Gruppe S O(3). Aus (17.11) folgt also, dass für die hier betrachtete Gruppenoperation gilt: Σ(M) = S O(3), und dies ist mit der Formulierung gemeint, die Drehgruppe sei eine Symmetriegruppe für ein mechanisches System mit drehinvarianter H AMILTONfunktion. Bemerkung Diese Überlegungen sind keineswegs auf Drehungen beschränkt. Die Gruppe G L(3, R) operiert ebenfalls auf Ω bzw. auf R3N vermöge A · q = (Aq 1 , . . . , Aq N ) und analog für die Impulse, und auf dem Phasenraum betrachten wir die Operation A · (q, p) = (Aq, (A−1 )T p) ,
A ∈ G L(3, R).
Nur diese Operation ist physikalisch sinnvoll, denn sie liefert symplektische Transformationen des Phasenraums (Aufgabe 17.10). Wir haben sie auch schon oben bei den Drehungen benutzt, aber das fällt nicht auf, weil R = (R −1 )T ist für orthogonale Matrizen R. Eine H AMILTONfunktion H : Ω × R3N → R heißt nun A-invariant, wenn gilt: H (Aq, (A−1 )T p) = H (q, p)
∀ (q, p) ∈ Ω × R3N .
(17.12)
Ist diese Forderung erfüllt, so ist mit γ = (q, p) auch A · γ = (Aq, (A−1 )T p) eine Lösung der entsprechenden Bewegungsgleichungen, wie man wieder mittels der Kettenregel leicht nachrechnet. Ist also G ≤ G L(3, R) eine Untergruppe mit der Eigenschaft, dass (17.12) für alle A ∈ G gilt, so ist G ≤ Σ(M) für die Lösungsmenge M der H AMILTONschen Gleichungen. Ganz allgemein kann man eine symplektische Mannigfaltigkeit (M, ω), eine Gruppe G und eine Linksoperation von G auf M betrachten, bei der für jedes g ∈ G die Abbildung ϕ(g) : M −→ M : x −→ gx ein symplektischer Diffeomorphismus von M auf sich ist. Eine C ∞ -Funktion H auf M heißt dann G-invariant, wenn H ◦ ϕ(g) = H
∀g ∈ G
B
Symmetrie als Invarianz unter einer Gruppenoperation
133
gilt. Wir nehmen an, dass das H AMILTONsche Vektorfeld v zu H (vgl. Definition 6.23) einen globalen Fluss besitzt, dass also alle seine Integralkurven auf ganz R definiert sind. Dann betrachtet man die Menge Z aller C 1 -Kurven γ : R → M und die durch g · γ := ϕ(g) ◦ γ definierte Linksoperation von G auf Z . Wenn H G-invariant ist, so führt jedes g ∈ G Integralkurven von v wieder in Integralkurven von v über. Denn da jedes f = ϕ(g) , g ∈ G symplektisch ist, ergibt sich mit Aufgabe 6.3 (d f )−1 p v( f ( p)) = s − grad(H ◦ f )( p) = v( p) ,
p∈ M,
und wenn γ eine Integralkurve ist, also γ˙ = v ◦ γ , so folgt für β := gγ = f ◦ γ ˙ = d f γ (t) γ˙ (t) = dgγ (t) v(γ (t)) = v(β(t)) β(t) für alle t, d. h. auch β ist eine Integralkurve von v. Für die Menge M H aller Integralkurven von v (also aller Lösungskurven der H AMILTONschen Gleichungen zur G-invarianten Funktion H ) gilt somit G = Σ(M H ). Wenn M, ω und H ein physikalisches System beschreiben, so kann man also sagen, dass dieses System G als Symmetriegruppe gestattet. Beispiel 3: Zeittranslation als Symmetrie eines autonomen Systems von Differentialgleichungen Sei Ω ⊆ Rn offen und f : R × Ω → Rn sei eine C 1 -Abbildung. Wir nehmen an, die Lösung des Anfangswertproblems x˙ = f (t, x),
x(t0 ) = x0
(vgl. etwa [34], Kap. 20) sei bei beliebiger Wahl von t0 ∈ R , x0 ∈ Ω stets auf ganz R definiert. Die Lösungskurven liegen dann in der Menge Z := {γ ∈ C 1 (R; Rn ) | γ (R) ⊆ Ω}, und auf dieser Menge ist eine Linksoperation der Gruppe G = (R, +) gegeben, indem man für τ ∈ R , γ ∈ Z setzt: (τ · γ )(t) := γ (t − τ ) ,
t ∈ R.
134
17 Grundsätzliches über Gruppen
Wenn das Differentialgleichungs-System autonom ist – d. h. wenn f nicht von t abhängt –, so ist mit γ auch jedes τ · γ , τ ∈ R eine Lösung des Systems x˙ = f (x) (nachrechnen!). Autonome Systeme haben also die Symmetriegruppe (R, +), die durch Zeittranslation operiert. Beispiel 4: Invarianz von quantenmechanischen Observablen Sei H ein komplexer H ILBERTraum, dessen Einheitsvektoren die Zustände eines quantenmechanischen Systems beschreiben. Die Automorphismengruppe von H ist dann die Gruppe U(H) aller unitären Operatoren in H, und die Menge Z aller selbstadjungierten Operatoren in H beschreibt die Gesamtheit der Observablen des betrachteten Systems. Eine Linksoperation von U(H) auf Z ist gegeben durch U · A = U AU −1 . Diese Operation ist naheliegend, denn für die Graphen gilt G(U AU −1 ) = {(U x, U y) | (x, y) ∈ G(A)} (nachrechnen!). Der physikalische Sinn dieser Operation liegt jedoch in dem Umstand, dass die statistische Verteilung der Messwerte von A ∈ Z im Zustand x ∈ H genau dieselbe ist wie die Verteilung der Messwerte von U AU −1 im Zustand U x. Um dies einzusehen, betrachten wir das Spektralmaß E von A und erinnern uns, dass das Spektralmaß des selbstadjungierten Operators U AU −1 durch F(S) := U E(S)U −1
(S ⊆ R B ORELmenge)
gegeben ist. (Dies folgt aus den Aufgaben 15.2 und 15.9 zusammen mit der Eindeutigkeit des Spektralmaßes.) Die Wahrscheinlichkeit, dass eine Messung von U AU −1 im Zustand U x einen Wert innerhalb der B ORELmenge S ergibt, ist also U x|F(S)U x = U x | U E(S)U −1 U x = U x|U E(S)x = x|E(S)x , und dies ist die Wahrscheinlichkeit, dass eine Messung von A im Zustand x einen Wert innerhalb von S ergibt. Die Symmetriegruppe Σ({A}) einer einzelnen Observablen A ∈ Z besteht also aus den U ∈ U(H), für die U AU −1 = A ist. Das ist offenbar äquivalent zu U (D(A)) = D(A) und U A = AU . Man sagt dann, die Observable A sei invariant unter U , und in diesem Fall ergibt der Zustand U x stets die gleiche statistische Verteilung der Messwerte wie der Zustand x. In der Quantenmechanik ist häufig eine Untergruppe G ≤ U(H) gegeben, und man fragt sich, welche Observablen A gegen alle U ∈ G invariant sind oder unter
B
Symmetrie als Invarianz unter einer Gruppenoperation
135
welchen Bedingungen bestimmte besonders wichtige Observable wie etwa die Energie unter G invariant sind. Dies werden wir im nächsten Beispiel näher illustrieren. Ist insbesondere der H AMILTONoperator H unter G invariant, so folgt U eit H U −1 = eit H für alle U ∈ G , t ∈ R, und damit ist die ganze Dynamik unter G invariant. Die Lösung der S CHRÖDINGERgleichung zum Anfangswert U x (mit U ∈ G) ergibt sich dann als eit H U x = (U eit H U −1 )U x = U (eit H x), also durch Anwenden von U auf die Lösung zum Anfangswert x. Bemerkung Hier sollte man beachten, dass zwei Einheitsvektoren x, y ∈ H genau dann ein und denselben physikalischen Zustand beschreiben, wenn sie sich nur um einen Phasenfaktor unterscheiden. Daher sollte man auf der Menge der Einheitsvektoren in H die Äquivalenzrelation x∼y
def
⇐⇒
es gibt θ ∈ R mit y = eiθ x
einführen. Der Zustandsraum des Systems ist in Wirklichkeit die Menge der Äquivalenzklassen [x], x ∈ H, x = 1, der sog. projektive H ILBERTraum PH (vgl. Beispiel 1.7b, wo der endlichdimensionale Sonderfall hiervon besprochen wurde). Auf PH × PH ist durch W ([x], [y]) := |x|y |2 eine reelle Funktion wohldefiniert, die physikalisch als die Wahrscheinlichkeit dafür aufgefasst werden kann, den Zustand [y] zu messen, wenn der Zustand [x] präpariert wurde. Als die physikalisch relevanten Automorphismen des Zustandsraums sollten daher die bijektiven Abbildungen α : PH → PH gelten, für die gilt: W (α[x], α[y]) = W ([x], [y])
∀ [x], [y] ∈ PH.
Jede unitäre Transformation U ∈ U(H) induziert solch einen Automorphismus, indem man setzt: % & % & α x := U x und nachrechnet, dass dies vom gewählten Repräsentanten x unabhängig ist. Es gibt jedoch noch weitere Automorphismen von PH, und daher ist die obige Erörterung der Symmetrien von Observablen eigentlich unvollständig. Zu den mathematischen Grundlagen der Quantenmechanik gehört also auch eine sorgfältige Diskussion der Automorphismen von PH, ihres Zusammenhangs mit unitären Operatoren und ihrer Operation auf Observablen. Wir verweisen dazu auf die Literatur, etwa auf [45, 54, 89].
136
17 Grundsätzliches über Gruppen
Beispiel 5: Drehsymmetrische quantenmechanische Systeme Wir diskutieren hier nur eine exemplarische einfache Situation, nämlich ein einziges Teilchen der Masse m > 0. Es soll sich in einem stationären Zustand befinden, der durch die Wellenfunktion ψ ∈ L 2 (R3 ) beschrieben wird. Wird die gesamte experimentelle Anordnung nun einer Drehung R unterworfen, so herrschen nach Ausführung dieser Drehung am Ort x genau dieselben Verhältnisse, die vor der Drehung am Ort R −1 x geherrscht haben. Die nach der Drehung entstandene Wellenfunktion ist daher gegeben durch ψ (x) = ψ(R −1 x). ψ
(17.13)
Daher betrachtet man auf dem Zustandsraum H = L 2 (R3 ) die durch R · ψ = ψ ◦ R −1 definierte Linksoperation der Gruppe S O(3).2 Die Transformationsformel ergibt sofort −1 2 3 |ψ(R x)| d x = |ψ(x)|2 d3 x, und daher ist der Operator U (R) : H −→ H : ψ −→ R · ψ stets unitär. Da es sich hierbei um einen Spezialfall von (17.8) handelt, erkennt man, dass die betrachtete Linksoperation durch einen Gruppenhomomorphismus U : S O(3) −→ U(L 2 (R3 )) gegeben ist. Solch ein Homomorphismus ist eine Darstellung der Gruppe S O(3), und mit diesen Darstellungen werden wir uns noch ausführlicher zu beschäftigen haben (vgl. Kap. 20 ff.). Nun sei A ein selbstadjungierter Operator in H, der eine Observable des Systems beschreibt. Ist das System rotationssymmetrisch, so erwarten wir, dass die Statistik der Messwerte von A durch die Drehung R der experimentellen Anordnung nicht beeinflusst wird. Wie in Beispiel 4 erläutert, ist dies äquivalent dazu, dass für jedes R ∈ S O(3) gilt: AU (R)ψ = U (R)Aψ
für alle ψ ∈ D(A) = U (R) D(A) .
(17.14)
2 Bei einer Drehung R des Koordinatensystems hätte man ψ (x) = ψ(Rx), aber das definiert eine Rechtsoperation.
B
Symmetrie als Invarianz unter einer Gruppenoperation
137
In unserem konkreten Fall bedeutet dies A(ψ ◦ R −1 ) = (Aψ) ◦ R −1
∀ R ∈ S O(3).
Da mit R auch R −1 die gesamte Gruppe S O(3) durchläuft, könnte man hier auch R schreiben statt R −1 . Ganz explizit bedeutet die Rotationsinvarianz von A also, dass für alle R ∈ S O(3) und für alle ψ ∈ D(A) fast überall gilt: )(x) = (Aψ)(Rx) (Aψ
(x) := ψ(Rx) . für ψ
Dies trifft z. B. auf A = −Δ zu, wie wir aus Aufgabe 17.17 wissen, und damit auch auf A = −Δ + V für ein Zentralpotential V (x) = v(|x|). Bemerkung In der relativistischen Quantenmechanik sind ähnliche Überlegungen, die man für die L ORENTZgruppe und die P OINCARÉgruppe anstellt, von entscheidender Bedeutung (vgl. z. B. [10, 84, 87]). Beispiel 6: Invarianz von Mehrteilchensystemen unter Vertauschung der Teilchen Der Zustand eines quantenmechanischen Systems von N Teilchen werde durch die Wellenfunktion ψ ∈ H := L 2 (R3N ) beschrieben. Sind die Teilchen gleichartig, so können sie prinzipiell nicht voneinander unterschieden werden, und daher repräsentieren die Funktionen ψ(q1 , . . . , q N ) und ψ(qπ 1 , . . . , qπ N ) ein und denselben Zustand, wenn π eine Permutation der Zahlen 1, 2, . . . , N ist (qk = (xk , yk , z k )). Also gibt es zu jeder Permutation π ∈ S(N ) eine komplexe Zahl ζ = ϕ(π ) vom Betrag 1 mit ψ(q1 , . . . , q N ) = ζ ψ(qπ 1 , . . . , qπ N )
f. ü.
Ist nun π = π1 ◦π2 , so führt die schrittweise Vertauschung der Teilchenpositionen – also zuerst die Anwendung von π2 , dann die von π1 – auf dieselbe Wellenfunktion wie die direkte Anwendung von π . Das erzwingt die Bedingung ϕ(π1 ◦ π2 ) = ϕ(π1 )ϕ(π2 ),
(17.15)
d. h. ϕ ist ein Homomorphismus der Gruppe S(N ) in die Gruppe U(1) = {z ∈ C | |z| = 1}. Wenn (17.15) gilt, so ist tatsächlich durch mit ψ (q1 , . . . , q N ) := ϕ(π )ψ(qπ 1 , . . . , qπ N ) π ·ψ =ψ eine Linksoperation von S(N ) auf H gegeben (nachrechnen!). Es gibt aber nur zwei Möglichkeiten, (17.15) zu erfüllen, denn es gilt: Lemma 17.14 Sei N ≥ 2. Dann gibt es genau zwei Homomorphismen S(N ) → U(1), nämlich
138
17 Grundsätzliches über Gruppen
ϕ B (π ) ≡ 1 und ϕ F (π ) = sgn π, die Signumsfunktion. Beweis Für 1 ≤ j < k ≤ N bezeichnen wir mit τ jk die Permutation, die j und k miteinander vertauscht und alle übrigen Elemente von {1, . . . , N } fest lässt (Transposition). In der Gruppe S(N ) haben wir dann τ 2jk = τ jk ◦ τ jk = id, und für jeden Homomorphismus ϕ : S(N ) → U(1) folgt hieraus ϕ(τ jk )2 = ϕ(τ 2jk ) = ϕ(id) = 1. Also ist ϕ(τ ) = ±1 für jede Transposition τ . Wir unterscheiden die beiden Fälle (i) ϕ(τ12 ) = 1, (ii) ϕ(τ12 ) = −1. Zu beliebigen Zahlen j, k mit 1 ≤ j < k ≤ N gibt es offenbar (mindestens) eine Permutation σ ∈ S(N ), für die gilt: σ1 = j ,
σ 2 = k.
Dann ist τ jk = σ τ12 σ −1 , wie man durch elementweises Nachprüfen sofort bestätigt. Da U(1) abelsch ist, folgt hieraus ϕ(τ jk ) = ϕ(σ )ϕ(τ12 )ϕ(σ )−1 = ϕ(τ12 ), d. h. im Fall (i) ist ϕ(τ jk ) = 1 für jede Transposition τ jk , und im Fall (ii) ist stets ϕ(τ jk ) = −1. Nun kann man die Zahlen 1, 2, . . . , N offenbar durch endlich viele Vertauschungen in jede beliebige Reihenfolge bringen (ein rigoroser Beweis hierfür kann z. B. durch Induktion nach N leicht erbracht werden). Das bedeutet, dass jede Permutation π ∈ S(N ) als Produkt von endlich vielen Transpositionen geschrieben werden kann, etwa π = τ (1) τ (2) · · · τ (m) mit τ (ν) = τ jν kν , ν = 1, . . . , m. Daraus folgt aber ϕ(π ) = 1 im Fall (i) und ϕ(π ) = (−1)m im Fall (ii). Im Fall (i) ist also ϕ = ϕ B . Da die Signumsfunktion ebenfalls ein Homomorphismus ist, der auf allen Transpositionen den Wert −1 annimmt, folgt im Fall (ii) ϕ(π ) = sgn π = ϕ F (π ), wie behauptet.
B
Symmetrie als Invarianz unter einer Gruppenoperation
139
Bei Teilchen, für die ϕ B der richtige Homomorphismus ist, sind die Wellenfunktionen also symmetrisch in den qk (Bosonen), im anderen Fall antisymmetrisch (Fermionen). Bemerkung Es wird immer wieder spekuliert, dass es außer Bosonen und Fermionen vielleicht noch andere Teilchentypen gibt („Parastatistiken“). Lemma 17.14 zeigt, dass die Wellenfunktionen solcher Teilchen nicht komplexwertig sein können – sie müßten ihre Werte in geeigneten Vektorräumen haben, auf denen S(N ) in nichttrivialer Weise operiert. Beispiel 7: Eichinvarianz Eichtheorien bilden eine fortgeschrittene Thematik, die über den Rahmen dieses Buches hinausgeht, doch können wir an einem einfachen Beispiel zumindest einige Grundgedanken erläutern. Dazu betrachten wir in R3 differenzierbare Vektorfelder A = (A1 , A2 , A3 ) , B = (B1 , B2 , B3 ) mit B = rot A und stellen uns B als ein Magnetfeld vor. Ein Teilchen der Masse m > 0 und der elektrischen Ladung e > 0, das sich in diesem Magnetfeld bewegt, hat den H AMILTONoperator H A :=
3 1 2 p A, j 2m
mit p A, j :=
j=1
1 ∂ − e A j (x), i ∂x j
aber dieser ist nicht eindeutig bestimmt, da man das Vektorpotential A „umeichen“ darf.3 Daher betrachtet man die Gruppe G aller C ∞ -Funktionen R3 → U(1) (vgl. Aufgabe 17.7) und definiert eine Linksoperation von G auf H = L 2 (R3 ) durch (γ · ψ)(x) := γ (x)ψ(x) ,
ψ ∈ H, x ∈ R3 .
Die Elemente von G werden als Eichtransformationen bezeichnet. Wegen |γ (x)| ≡ 1 ist der Operator U (γ ) : H → H, ψ → γ · ψ für jedes γ ∈ G unitär, und wir haben einen Homomorphismus U : G −→ U(H), γ −→ U (γ ). Wir ermitteln nun die Wirkung der U (γ ) auf die Observablen p A, j und H A . Dazu betrachten wir o. B. d. A. eine differenzierbare Wellenfunktion ψ ∈ H := U (γ ) p A, j U (γ )−1 ψ. Die folgende Rechnung ist punktund berechnen ψ weise zu verstehen – das Argument x ∈ R3 wurde der Kürze halber überall weggelassen:
3
Genau genommen, müssen an A und B geeignete Voraussetzungen gemacht werden, die dafür sorgen, dass H A ein wohldefinierter selbstadjungierter Operator in L 2 (R3 ) ist, aber diesen Aspekt können wir für die Zwecke dieses Beispiels getrost ignorieren.
140
17 Grundsätzliches über Gruppen
1 ∂ − e A j (γ −1 ψ) i ∂x j 1 ∂ψ 1 ∂γ − γ −2 ψ − γ −1 e A j ψ = γ γ −1 i ∂x j i ∂x j 1 ∂ψ 1 ∂ −1 1 ∂γ = − eAjψ − γ ψ= − eAj ψ i ∂x j i ∂x j i ∂x j
=γ ψ
mit j := A j + 1 γ −1 ∂γ , A ie ∂x j
j = 1, 2, 3.
Setzen wir also 1 A := A + γ −1 ∇γ , ie
(17.16)
U (γ ) p A, j U (γ )−1 = pA, j
(17.17)
so erhalten wir
für γ ∈ G , j = 1, 2, 3. Daraus ergibt sich weiter U (γ )H AU (γ )−1 =
3 1 (U (γ ) p A, j U (γ )−1 ) (U (γ ) p A, j U (γ )−1 ) 2m j=1
=
3 1 2 pA, j , 2m j=1
also U (γ )H AU (γ )−1 = HA .
(17.18)
Nun ist aber rot A = rot A = B. Am einfachsten sieht man das, wenn man γ (x) = exp(ieθ (x)) schreibt, was lokal immer möglich ist, und zwar mit einer reellwertigen Funktion θ . Dann ist offenbar 1 −1 γ ∇γ = ∇θ, ie und somit verschwindet die Rotation von A − A. Nun sei M(B) die Menge aller H AMILTONoperatoren H A zu Vektorpotentialen A für das gegebene Magnetfeld B. Unsere Überlegungen zeigen dann, dass für die betrachtete Operation von G auf der Menge der Observablen gilt: G = Σ(M(B)) .
Aufgaben
141
Außerdem findet man zu zwei beliebigen Vektorpotentialen A, A für B immer eine A − A) = 0 gibt Eichtransformation γ ∈ G, die H A in HA überführt. Wegen rot ( A = A + ∇θ (man beachte 4.42a. sowie es nämlich ein Skalarfeld θ : R3 → R mit die Tatsache, dass R3 zusammenziehbar ist). Dann setzt man γ (x) := eieθ(x) und bestätigt (17.18) durch dieselben Rechnungen wie vorher.
Aufgaben zu Kap. 17 17.1 Sei G eine Gruppe und ∅ = H ⊆ G. Man zeige: H ist genau dann eine Untergruppe von G, wenn für alle a, b gilt a, b ∈ H
⇒
ab−1 ∈ H.
17.2 Seien G, H zwei Gruppen, eG , e H ihre neutralen Elemente. Auf P := G × H erklären wir eine Verknüpfung durch (g1 , h 1 ) · (g2 , h 2 ) := (g1 g2 , h 1 h 2 ) für g1 , g2 ∈ G , h 1 , h 2 ∈ H . a. Man weise nach, dass P hierdurch zu einer Gruppe wird. Was ist das neutrale Element, und wie bildet man zu (g, h) ∈ P das inverse Element? (Man bezeichnet G × H mit dieser Verknüpfung als das direkte Produkt der beiden Gruppen.) b. Man definiere das direkte Produkt von m Gruppen G 1 , . . . , G m . 17.3 Sei B := {b1 , . . . , bn } eine Basis des reellen Vektorraums Rn . Die Menge " Γ :=
n k=1
' m k bk m 1 , . . . , m n ∈ Z
heißt dann das von B erzeugte Gitter. a. Man zeige: Jedes Gitter ist eine Untergruppe der Gruppe (Rn , +). b. Sei Zn das n-fache direkte Produkt der Gruppe (Z, +) mit sich selbst (Aufg. 17.2). Man zeige: Jedes Gitter in Rn ist als Gruppe zu Zn isomorph. 17.4 Sei G eine Gruppe und a ∈ G beliebig. Man erklärt die Potenzen a n dann in der üblichen Weise, also für n ∈ N0 durch die rekursive Festsetzung a0 = e ,
a n+1 = a · a n = a n · a
142
17
Grundsätzliches über Gruppen
und für n = −m < 0 durch a −m = (a −1 )m . Man zeige: a. Es gelten die Rechenregeln a m+n = a m a n = a n a m ,
a mn = (a m )n = (a n )m
für m, n ∈ Z. b. Durch pa (n) := a n ist ein Gruppenhomomorphismus pa : (Z, +) → G definiert. c. Angenommen, es gibt m = 0 mit a m = e. Dann ist Bild pa eine endliche Untergruppe von G, und m ist ein ganzzahliges Vielfaches der Ordnung |Bild pa |. Die Ordnung |Bild pa | ist die kleinste positive ganze Zahl k mit a k = e. Bemerkung Die Ordnung von Bild pa wird als die Ordnung des Gruppenelements a bezeichnet. Sie ist also genau dann unendlich, wenn pa ein Monomorphismus ist. 17.5 In jeder Gruppe G definiert man das Zentrum Z (G) durch Z (G) := {g ∈ G | ag = ga
∀ a ∈ G}.
Man zeige: a. Z (G) ist eine Untergruppe von G. b. Ist α ein Automorphismus von G, d. h. ein Isomorphismus von G auf G, so ist α(Z (G)) = Z (G). 17.6 a. Sei V ein Vektorraum und A : V → V eine lineare Abbildung, T : V → V eine lineare Bijektion. Man zeige: Ist v ∈ V ein Eigenvektor von A zum Eigenwert λ, so ist T v ein Eigenvektor von B := T AT −1 zum Eigenwert λ. Wenn T und A vertauschen, so überführt T also Eigenvektoren von A in Eigenvektoren von A (zu demselben Eigenwert). b. Man folgere: Das Zentrum von G L(n, C) besteht genau aus den Matrizen der Form λE n , λ ∈ C\{0}. Dabei bezeichnet E n die n ×n-Einheitsmatrix. (Hinweis: Jede komplexe n × n-Matrix hat mindestens einen Eigenwert!) c. Man folgere: Das Zentrum von G L(n, R) besteht genau aus den Matrizen der Form λE n , λ ∈ R\{0}. (Hinweis: Man verwende G L(n, R) ⊆ G L(n, C).) d. Mit derselben Methode bestimme man auch die Zentren von U(n) und O(n). 17.7 Sei Ω eine differenzierbare Mannigfaltigkeit (z. B. eine offene Teilmenge von Rm ), und sei G eine Matrixgruppe, d. h. eine Untergruppe von G L(n, R) 2 2 oder von G L(n, C). Wir fassen G als Teilmenge von Rn bzw. von Cn auf und
Aufgaben
143
definieren G als die Menge aller C ∞ -Abbildungen A : Ω → G. Man zeige: Mit der Verknüpfung (AB)(x) := A(x)B(x) ,
A, B ∈ G , x ∈ Ω
bildet G eine Gruppe. (Hinweis: Um zu zeigen, dass A(x)−1 wieder eine C ∞ Funktion von x ist, drücke man mittels der C RAMERschen Regel die Matrixelemente von A(x)−1 durch die Matrixelemente von A(x) aus.) 17.8 Sei G eine Gruppe und H ≤ G eine Untergruppe. Für a ∈ G definiert man dann die Rechts-Nebenklasse H a durch H a := {ha | h ∈ H } und die Links-Nebenklasse a H durch a H := {ah | h ∈ H } . Man zeige: a. Für a, b ∈ G ist H a = H b ⇐⇒ H a ∩ H b = ∅ ⇐⇒ ab−1 ∈ H ⇐⇒ ba −1 ∈ H und analog für Linksnebenklassen. b. G kann als disjunkte Vereinigung von Rechts- (oder Links-)Nebenklassen geschrieben werden. c. Ist H endlich, so haben alle Nebenklassen von H dieselbe Elementeanzahl wie H . (Hinweis: Bijektive Abbildungen erhalten die Elementeanzahl von Teilmengen!) d. Ist G endlich, so ist die Ordnung von G ein ganzzahliges Vielfaches der Ordnung von H . (Hinweis: Man verwende Teile b und c) 17.9 Sei G eine Gruppe und H ≤ G eine Untergruppe. Angenommen, die Anzahl k der verschiedenen Rechts-Nebenklassen von H in G ist endlich. Man zeige, dass dann die Anzahl der verschiedenen Links-Nebenklassen ebenfalls gleich k ist, insbesondere endlich. (Hinweis: Was geschieht unter Inversenbildung mit den verschiedenen Rechts-Nebenklassen H g1 , . . . , H gk ?) Bemerkung Die Anzahl k der Nebenklassen nennt man den Index von H in G. 17.10 Man zeige: a. Ist A eine reguläre reelle n × n-Matrix, so gehört die 2n × 2n-Matrix := A
A 0 0 (A−1 )T
144
17
Grundsätzliches über Gruppen
zur symplektischen Gruppe Sp(2n). (Hinweis: Man kann das leicht direkt nachrechnen, aber es ist auch ein Spezialfall von Satz 6.22, wovon man sich überzeugen sollte.) ist ein Grupppenhomomorphismus ϕ : G L(n, R) −→ Sp(2n) b. Durch ϕ(A) = A gegeben. c. Wie vereinfacht sich ϕ(A) für A ∈ O(n)? 17.11 Es sei E(n) die Menge aller Abbildungen β : Rn → Rn , die die Form β A,v (x) = Ax + v
mit A ∈ O(n) , v ∈ Rn
haben („euklidische Bewegungen“). Man zeige: a. Jedes β ∈ E(n) ist bijektiv und isometrisch, d. h. es gilt |β(x) − β(y)| = |x − y|
für alle x, y ∈ Rn .
(17.19)
b. Jedes β ∈ E(n) ist winkeltreu, d. h. für beliebige x, y, z ∈ Rn gilt stets β(x) − β(z) | β(y) − β(z) = x − z|y − z . c. Mit der Verkettung von Abbildungen als Verknüpfung bildet E(n) eine Gruppe (also eine Untergruppe der Gruppe aller Bijektionen von Rn auf sich). d. Wir versehen die Menge G := O(n) × Rn mit einer Verknüpfung, indem wir setzen (A, v) · (B, w) := (AB, Aw + v). Damit bildet G eine Gruppe, die zu E(n) isomorph ist. 17.12 Sei β : Rn → Rn eine bijektive Abbildung, die die Isometriebedingung (17.19) erfüllt. Wir wollen beweisen, dass dann β ∈ E(n) sein muss. Man zeige dazu nacheinander: a. Die Abbildung α(x) := β(x) − β(0) ist ebenfalls bijektiv und isometrisch, und sie erfüllt außerdem α(0) = 0. b. |α(x)| = |x| für alle x ∈ Rn . c. Für alle x, y ∈ Rn ist α(x)|α(y) = x|y . (Hinweis: Man verwende die Polarisationsgleichung in der Form 2v|w = |v|2 + |w|2 − |v − w|2 .) d. Für alle x, z ∈ Rn ist z|α(x) = α −1 (z)|x . e. α ist eine lineare Abbildung und damit durch eine reguläre reelle Matrix A gegeben. (Hinweis: Für gegebene x, y ∈ Rn , λ ∈ R beweise man zunächst, dass für alle z ∈ Rn
Aufgaben
145
z | α(x + y) = z|α(x) + α(y)
und
z | α(λx) = z | λα(x)
gilt.) f. A ∈ O(n). g. β ∈ E(n), wie angekündigt. Bemerkung Damit ist E(n) genaudie Isometriegruppe der R IEMANNschen Mannigfaltigkeit (Rn , g0 ), wo g0 = nj=1 dx j ⊗ dx j die Standardmetrik bezeichnet. Diese Tatsache wurde im Anschluss an 5.21 ohne Beweis erwähnt. 17.13 Sei (Rn , +) die additive Gruppe von Rn , d. h. wir wählen auf der Menge Rn die Addition als Gruppenverknüpfung. Man zeige: a. Die einzige kompakte Untergruppe von (Rn , +) ist {0}. (Hinweis: Für welche x ∈ Rn ist {nx | n ∈ Z} beschränkt?) b. Sei K eine Gruppe, die gleichzeitig ein kompakter topologischer Raum ist. Der einzige stetige Gruppenhomomorphismus ϕ : K → (Rn , +) ist dann ϕ ≡ 0. 17.14 Sei Z = ∅ eine Menge und G eine Gruppe, die auf Z von links operiert. Für z ∈ Z bezeichnet man die Menge Oz := {gz | g ∈ G} als die Bahn oder den Orbit von z unter der gegebenen Operation. Man zeige: a. Durch y∼z
def
⇐⇒
es gibt g ∈ G mit z = gy
ist auf Z eine Äquivalenzrelation definiert (vgl. Anmerkung 1.24). Die Bahn Oz ist dabei die Äquivalenzklasse von z. b. Man kann Z als disjunkte Vereinigung der Bahnen von gewissen z ∈ Z darstellen. 17.15 Zwei Elemente x, y einer Gruppe G heißen konjugiert, wenn es g ∈ G gibt so, dass y = gxg −1 . Man zeige, dass dies eine Äquivalenzrelation ist. Man folgere, dass G als disjunkte Vereinigung von Konjugiertenklassen K x := {gxg −1 | g ∈ G} geschrieben werden kann. (Hinweis: Man kann das direkt verifizieren oder auch beachten, dass durch (g, z) −→ gzg −1
146
17
Grundsätzliches über Gruppen
eine Linksoperation von G auf Z = G gegeben ist, so dass man die vorige Aufgabe benutzen kann.) 17.16 Gegeben sei eine Linksoperation einer Gruppe G auf einer Menge Z = ∅, die transitiv ist in dem Sinn, dass zu z 0 , z 1 ∈ Z stets ein g ∈ G existiert mit z 1 = gz 0 . (In der Terminologie von Aufgabe 17.14 bedeutet das, dass es nur eine einzige Bahn gibt, nämlich ganz Z .) Für ein festes z 0 ∈ Z betrachten wir die Untergruppe H = Σ({z 0 }) = {h ∈ G | hz 0 = z 0 }. a. Zu z ∈ Z bilden wir die Menge C z := {g ∈ G | gz 0 = z}. Man zeige, dass C z eine Links-Nebenklasse von H in G ist (vgl. Aufgabe 17.8) b. Sei G/H die Menge aller Links-Nebenklassen von H in G. Man zeige, dass die Abbildung β : Z −→ G/H , z −→ C z bijektiv ist. c. Für den Fall einer transitiven Rechtsoperation von G auf Z konstruiere man eine analoge Bijektion von Z auf die Menge H \G der Rechts-Nebenklassen von H = Σ({z 0 }). Bemerkung Die Untergruppe Σ({z 0 }) wird als der Stabilisator des Punktes z 0 bezeichnet. In physikalischen Anwendungen wird sie meist „little group“ genannt. 17.17 Man zeige: Für jede temperierte Distribution Ψ ∈ Sn und jedes R ∈ O(n) gilt Δ(Ψ ◦ R) = (ΔΨ ) ◦ R. Insbesondere gilt dies für Ψ ∈ L 2 (Rn ). (Hinweis: Am bequemsten geht das, wenn man die F OURIERtransformation benutzt, insbes. Theorem 11.33c.)
Kapitel 18
Drehgruppe und L ORENTZgruppe
Wie angekündigt, besprechen wir nun einige konkrete Matrixgruppen etwas näher, die für die Physik von entscheidender Bedeutung sind. Über die physikalische Anwendung hinaus dienen die hier dargestellten Einzelheiten im weiteren Verlauf auch als ein Fundus für Beispiele, an denen sich allgemeinere Begriffe und Methoden illustrieren lassen. Allerdings bietet unsere Darstellung nur einen ersten Einstieg, und wer mehr über die betrachteten Gruppen erfahren möchte, sei z. B. auf [14, 18, 48, 94] verwiesen oder auch – für die rein mathematischen Aspekte – auf [20, 37].
A Die Gruppe SO(3) der räumlichen Drehungen Wir wiederholen in diesem Abschnitt kurz die bekanntesten Eigenschaften der orthogonalen Gruppen (vgl. z. B. [34], Kap. 7E): Satz 18.1 a. Die Gruppe O(n) = {A ∈ Rn×n | A T A = E} zerfällt in zwei disjunkte Mengen O(n) = {A ∈ O(n) | det A = 1} ∪ {A ∈ O(n) | det A = −1} = S O(n) ∪ O(n)− . b. Ist n ungerade und A ∈ S O(n), so ist λ = 1 ein Eigenwert von A. c. Ist A ∈ O(n)− , so ist λ = −1 ein Eigenwert von A. d. Ist A ∈ O(n) und U ⊆ Rn ein Unterraum mit A(u) ⊆ U , so gilt A(U ⊥ ) ⊆ U ⊥ . Hauptsächlich interessiert uns im Folgenden die Gruppe S O(3). Ihre Elemente sind die Drehungen im R3 : K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_18, C Springer-Verlag Berlin Heidelberg 2010
147
148
18 Drehgruppe und L ORENTZgruppe
Satz 18.2 Zu jedem A ∈ S O(3) existiert eine Orthonormalbasis {u 1 , u 2 , u 3 } des R3 und ein α ∈ [0, 2π [, so dass A bezüglich dieser Basis folgende Gestalt hat ⎛ ⎞ 1 0 0 A = ⎝0 cos α − sin α ⎠ (Drehung um u 1 ). 0 sin α cos α Dabei ist der Drehwinkel α durch Spur A = 1 + 2 cos α bestimmt. Wichtig ist auch, dass man S O(3) durch die sogenannten E ULERschen Winkel parametrisieren kann. Satz 18.3 Sei {e1 , e2 , e3 } die Standardbasis des R3 . Für ein α ∈ [0, 2π [ sei ⎛
⎞ 1 0 0 R1 (α) = ⎝0 cos α − sin α ⎠ (Drehung um e1 -Achse), 0 sin α cos α ⎛ ⎞ cos α 0 sin α R2 (α) = ⎝ 0 1 0 ⎠ (Drehung um e2 -Achse), − sin α 0 cos α ⎛ ⎞ cos α − sin α 0 R3 (α) = ⎝ sin α cos α 0⎠ (Drehung um e3 -Achse). 0 0 1 Dann gilt a. Zu jedem A ∈ S O(3) existieren sogenannte E ULERsche Winkel α, β, γ ∈ [0, 2π [, so dass A = R3 (γ )R2 (β)R1 (α) . b. Zu jedem A ∈ S O(3) existieren ϕ, ψ, θ ∈ [0, 2π [, so dass A = R1 (ϕ)R2 (ψ)R1 (θ ) . Anmerkung 18.4 Die Zerlegung O(n) = S O(n) ∪ O(n)− und ähnliche Zerlegungen versteht man besser, wenn man den Begriff der Zusammenhangskomponente heranzieht: Wir nennen eine Teilmenge X eines topologischen Raums Y zusammenhängend, wenn jeder Punkt p ∈ X mit jedem anderen Punkt q ∈ X durch
B
Die L ORENTZgruppe
149
eine stetige, in X verlaufende Kurve verbunden werden kann.1 Die Vereinigung von zusammenhängenden Teilmengen, die alle einen festen Punkt p enthalten, ist nun zusammenhängend, denn zwei Punkte q1 , q2 aus dieser Vereinigung können ja verbunden werden, indem man zuerst q1 mit p und dann p mit q2 verbindet. Daher ist die Vereinigung aller zusammenhängenden Teilmengen, die p enthalten, selbst zusammenhängend, also die größte zusammenhängende Teilmenge, die p enthält, und man nennt sie die Zusammenhangskomponente von p. In S O(3) z. B. kann man jedes Element A durch eine stetige Kurve mit der Einheitsmatrix E verbinden – man schreibt A = R3 (γ )R2 (β)R1 (α) wie in Satz 18.3a. und definiert C : [0, 1] → SO(3) durch C(t) := R3 ((1 − t)γ )R2 ((1 − t)β)R1 ((1 − t)α) . Also ist S O(3) zusammenhängend. Dann ist aber auch O(3)− zusammenhängend, denn zu A, B ∈ O(3)− findet man eine innerhalb von O(3)− verlaufende Verbindungskurve D(t), indem man eine Kurve C(t) ∈ S O(3) , 0 ≤ t ≤ 1 wählt, die B −1 A ∈ SO(3) mit E verbindet, und setzt D(t) := BC(t) . Aber ganz O(3) ist nicht zusammenhängend. Denn wenn F : [0, 1] → O(3) eine beliebige stetige Kurve ist, so ist f (t) := det F(t) eine stetige Funktion, die nur die Werte ±1 annehmen kann. Nach dem Zwischenwertsatz aus der elementaren Analysis muss f dann konstant sein, und im Falle f ≡ +1 verläuft F ganz in S O(3), im Fall f ≡ −1 ganz in O(3)− . Daher besteht O(3) aus den beiden Zusammenhangskomponenten S O(3) und O(3)− . Für beliebiges n ist die Situation völlig analog. Es ist nur etwas schwieriger, zu beweisen, dass S O(n) zusammenhängend ist – man konstruiert zu gegebenem A ∈ S O(n) eine Kurve C : [0, 1] → S O(n), die A mit E = E n verbindet, indem man die Eigenwerttheorie der orthogonalen Matrizen geschickt einsetzt (vgl. etwa [20, 37] oder [58]) – aber der Rest der Argumentation verläuft ganz ebenso wie für den Fall n = 3 gerade skizziert.
B Die L ORENTZgruppe Die L ORENTZtransformationen, welche die Raum-Zeit-Transformationen der relativistischen Physik beschreiben, bilden die allgemeine L ORENTZgruppe L = O(1, 3)
1 Dies entspricht nicht genau dem in der Mathematik üblichen Begriff einer zusammenhängenden Menge, was jedoch bei den hier vorkommenden Mengen keinen Unterschied macht.
150
18 Drehgruppe und L ORENTZgruppe
im Sinne von Definition 17.6a. Ist also (vgl. Abschn. 4F) ⎛
G ≡ −I1,3
1 0 ⎜0 −1 = (gμν ) = ⎜ ⎝0 0 0 0
0 0 −1 0
⎞ 0 0⎟ ⎟, 0⎠ −1
(18.1)
so besteht die allgemeine L ORENTZgruppe L aus allen A = (aμν )0≤μ,ν≤3 ∈ R4×4 mit AT G A = G .
(18.2)
aνα gνν aνβ = gαβ .
(18.3)
In Komponenten lautet das: 3 ν=0
Für jedes A ∈ L gilt nach Satz 17.7 | det A| = 1 ,
A−1 = G A T G .
(18.4)
Aus der letzten Gleichung folgt G = A A−1 G = AG A T G 2 = AG A T , und somit gilt: A∈L
⇒
AT ∈ L .
(18.5)
Setzt man in (18.3) α = β = 0, so findet man sofort 2 2 2 2 a00 − (a10 + a20 + a30 )=1
(18.6)
und daher |a00 | ≥ 1
für A = (aμν ) ∈ L .
(18.7)
Da die 0-Achse der Zeitachse entspricht, nennt man L ORENTZ-Transformationen A mit • a00 ≥ 1 vorwärts-zeitartig oder orthochron, • a00 ≤ −1 rückwärts-zeitartig. Die beiden möglichen Vorzeichen von a00 sowie die beiden möglichen Vorzeichen von det A zerlegen L in 4 disjunkte Teilmengen. Diese werden von speziellen L ORENTZtransformationen ineinander überführt, nämlich durch
B
Die L ORENTZgruppe
⎛
1 0 ⎜0 −1 P=⎜ ⎝0 0 0 0
151
0 0 −1 0
⎞ 0 0⎟ ⎟, 0⎠ −1
⎛ −1 ⎜0 T =⎜ ⎝0 0
⎞ 000 1 0 0⎟ ⎟ , −E = P T , 0 1 0⎠ 001
(18.8)
also Raumspiegelung, Zeitspiegelung und Totalspiegelung im M INKOWSKI-Raum R4 . Genauer: Satz 18.5 a. Die L ORENTZgruppe zerfällt in folgende disjunkte Teilmengen: ↑
L + = {A ∈ L | det A = 1, a00 ≥ 1} , ↓
= (−E)L + ,
↑
↑
= P L+ ,
L + = {A ∈ L | det A = 1, a00 ≤ −1}
↑
L − = {A ∈ L | det A = −1, a00 ≥ 1} ↓
↑
L − = {A ∈ L | det A = −1, a00 ≤ −1} = T L + . b. Folgende Teilmengen sind Untergruppen von L: – – – –
↑
die eigentliche orthochrone L ORENTZ-Gruppe L + , ↑ ↑ die orthochrone oder vollständige L ORENTZ-Gruppe L ↑ := L + ∪ L − , ↑ ↓ die eigentliche L ORENTZ-Gruppe L + = L + ∪ L + = SO(1, 3), ↑ ↓ die orthochore L ORENTZ-Gruppe L 0 = L + ∪ L − .
Beweis a. ist trivial. b. Dass L + eine Untergruppe ist, ist klar. Ferner überlegt man sich mittels (18.4) und (18.6) (Aufgabe 18.1) (i) Ist A = (aμν ) ∈ L und B = (bμν ) = A−1 , so ist b00 = a00 . (ii) Sind A = (aμν ), B = (bμν ) ∈ L und C = A · B, so gilt " c00
≥ 1, ≤ −1,
falls a00 ≥ 1, b00 ≥ 1 oder a00 ≤ −1, b00 ≤ −1, falls a00 ≥ 1, b00 ≤ −1 oder a00 ≤ −1, b00 ≥ 1.
(18.9)
↑
Daraus folgt dann, dass auch L ↑ , L 0 und L + Untergruppen von L sind. ↑
↑
↓
↓
Bemerkung Die Teilmengen L + , L − , L + und L − sind die Zusammenhangs↑ komponenten von L. Wir werden nämlich im nächsten Abschnitt sehen, dass L +
152
18 Drehgruppe und L ORENTZgruppe
zusammenhängend ist, und daraus folgt, dass auch die drei anderen Mengen zusam↑ menhängend sind, da man sie aus L + durch Multiplikation mit den festen Matrizen P, T, −E gewinnt. Andererseits muss jede stetige Kurve F : [0, 1] → L nach dem Argument aus Anmerkung 18.4 konstante Determinante +1 oder −1 haben, und das Matrixelement f 00 (t) von F(t) kann keine Werte in ] − 1, 1[ annehmen, hat seine Werte also (nach dem Zwischenwertsatz!) entweder nur in [1, ∞[ oder nur in ] − ∞, −1]. Daraus folgt, dass die Kurve ganz in einer der vier Mengen verläuft, und somit sind sie die Zusammenhangskomponenten. ↑ Von Wichtigkeit ist, dass man die Gruppe SO(3) als Untergruppe von L + auffassen kann. Satz 18.6 a. Ist ⎛ ⎞ a11 · a13 R=⎝ · · · ⎠ a31 · a33
∈ SO(3) ,
so ist ⎛ 1 0 ⎜0 a11 = ⎜ R ⎝0 · 0 a31
⎞ 0 0 · a13 ⎟ ⎟ · · ⎠ · a33
↑
∈ L+ .
ist ein injektiver Gruppenhomomorphismus ι : Die Abbildung R −→ R ↑ SO(3) −→ L + . ↑ b. A = (aμν ) ∈ L + gehört genau dann zu ι(SO(3)), wenn a00 = +1 . ↑
c. Sei e0 = (1, 0, 0, 0)T ∈ R4 und seien A, B ∈ L + mit A e0 = B e0
(gleiche Wirkung auf Zeitachse).
Dann gibt es ein eindeutiges R ∈ SO(3) mit . A = BR mit R Bemerkung Meist wird ι in der Notation unterdrückt. Man identifiziert also R ↑ und realisiert so SO(3) als Untergruppe von L + .
C
Parametrisierung der L ORENTZgruppe
153
Beweis a. Wegen der Bauart von G gilt T G R = G R
⇐⇒
R T (−E)R = −E
⇐⇒
RT R = E .
∈ L. Wegen der Bauart von R ist klar, dass ι ein Monomorphismus Also ist R von Gruppen ist und dass = det R = 1 , det R
00 = 1 ( R)
gilt. b. Ist A ∈ L, so ist auch A T ∈ L, und daher ergibt (18.6) 2 2 2 2 2 2 2 a10 + a20 + a30 = a01 + a02 + a03 = a00 − 1.
Daher ist a00 = 1 äquivalent zu folgender Form von A: ⎛ 10 0 ⎜0 A=⎜ ⎝0 B 0
⎞ 0 ⎟ ⎟ ⎠
Aus A−1 = G A T G folgt dann B −1 = B T , und außerdem ist det B = det A = 1 ↑ für A ∈ L + , d. h. B ∈ SO(3). c. Setze R ≡ (rμν ) := B −1 A. Es ist A e0 = B e0
⇐⇒ ⇐⇒
R e0 = e0 ⇒ r00 = 1 mit R ∈ SO(3) . R ∈ ι(SO(3)) ⇐⇒ A = B R
C Parametrisierung der L ORENTZgruppe ↑
Sei B ∈ L + eine eigentliche orthochrone L ORENTZtransformation, welche die (x2 , x3 )-Ebene punktweise festlässt. Dann lässt auch B T = G B −1 G diese Ebene punktweise fest, und daher hat B die Form ⎛ b00 ⎜b10 ⎜ B=⎝ 0 0
b01 b11 0 0
⎞ 00 0 0⎟ ⎟. 1 0⎠ 01
154
18 Drehgruppe und L ORENTZgruppe
Die Bedingung (18.3) liefert dann für α, β = 0, 1 die folgenden Gleichungen: 2 2 b00 − b10 = 1, 2 b11
2 − b01
(18.10)
= 1,
(18.11)
b10 b11 − b00 b01 = 0
(18.12)
Daraus folgt dann: – Wegen (18.10) gibt es ein α ∈ R, so dass b00 = cosh α,
b10 = sinh α .
(18.13)
b01 = sinh β .
(18.14)
– Wegen (18.11) gibt es ein β ∈ R, so dass b11 = cosh β,
Einsetzen von (18.13) und (18.14) in (18.12) ergibt 0 = sinh α cosh β − cosh α sinh β = sinh(α − β), Somit ist
d. h. α = β
cosh α sinh α b00 b01 = . sinh α cosh α b10 b11
Analoge Überlegungen kann man auch für die anderen fünf Koordinatenebenen des M INKOWSKI-Raums anstellen. Bei den Ebenen, die die x0 -Achse enthalten, treten jedoch andere Vorzeichen auf, so dass hier die Parametrisierung durch trigonometrische Funktionen statt der Hyperbelfunktionen erfolgt. Insgesamt ergibt sich: Satz 18.7 Für α ∈ [0, 2π [, β ∈ R lassen die folgenden Transformationen A j (α), ↑ B j (β) ∈ L + jeweils eine Koordinatenebene im R4 punktweise fest, und sie sind die einzigen, die dies tun: ⎛
⎛ ⎞ ⎞ 10 0 0 1 0 0 0 ⎜0 1 0 ⎜0 cos α 0 sin α ⎟ 0 ⎟ ⎜ ⎟ ⎟ A1 (α) = ⎜ ⎝0 0 cos α − sin α ⎠ , A2 (α) = ⎝0 0 1 0 ⎠ , 0 0 sin α cos α 0 − sin α 0 cos α ⎛ ⎛ ⎞ ⎞ 1 0 0 0 cosh β sinh β 0 0 ⎜0 cos α − sin α 0⎟ ⎜ sinh β cosh β 0 0⎟ ⎜ ⎟ ⎟, A3 (α) = ⎜ ⎝0 sin α cos α 0⎠ , B1 (β) = ⎝ 0 0 1 0⎠ 0 0 0 1 0 0 01 ⎛ ⎞ ⎛ ⎞ cosh β 0 sinh β 0 cosh β 0 0 sinh β ⎜ 0 1 0 0⎟ ⎜ 0 10 0 ⎟ ⎟ ⎜ ⎟ B2 (β) = ⎜ ⎝ sinh β 0 cosh β 0⎠ , B3 (β) = ⎝ 0 0 1 0 ⎠ . 0 0 0 1 sinh β 0 0 cosh β
C
Parametrisierung der L ORENTZgruppe
155 ↑
Diese heißen die Generatoren von L + . Die A j (α) sind die reinen Raumdrehungen, die B j (β) die L ORENTZ-Boosts. Die folgende Aussage entspricht der Parametrisierung von SO(3) durch ↑ E ULERsche Winkel in Satz 18.3. Sie bedeutet außerdem, dass die Gruppe L + von den Generatoren erzeugt wird in dem Sinne, dass jedes Element der Gruppe als Produkt von endlich vielen Generatoren geschrieben werden kann. Hieraus folgt auch ↑ die schon im vorigen Abschnitt aufgestellte Behauptung, dass L + zusammenhän↑ gend ist, denn man kann jedes A ∈ L + nach der in Anmerkung 18.4 geschilderten ↑ Methode durch eine innerhalb von L + verlaufende stetige Kurve mit der Einheitsmatrix verbinden. Satz 18.8 ↑
a. Jedes A ∈ L + kann in der Form 2 1 B3 (β) R A=R
mit R1 , R2 ∈ SO(3)
dargestellt werden. ↑ b. Genauer: Zu jedem A ∈ L + gibt es ϕ, θ, ϕ , ψ , θ ∈ [0, 2π [ und β ∈ R, so dass A = A3 (ϕ +
π )A1 (θ )B3 (β)A3 (ϕ )A2 (ψ )A1 (θ ) . 2
(18.15)
↑
Beweis Sei A = (aμν ) ∈ L + , wobei wir A ∈ SO(3) annehmen können, d. h. es ist a00 > 1. Sei e0 = (1, 0, 0, 0)T . Dann ist A e0 = (a00 , a10 , a20 , a30 )T ,
(18.16)
2 2 2 2 + a20 + a30 = a00 − 1 > 0. r 2 := a10
(18.17)
und es gilt
2 − r 2 = 1 gibt es ein β ∈ R mit Wegen a00
r = sinh β ,
a00 = cosh β .
(18.18)
Wegen (18.17) können wir Kugelkoordinaten a10 = r cos ϕ sin θ, a20 = r sin ϕ sin θ, a30 = r cos θ einführen. Dann ergibt sich mit den Matrizen A j , B j aus Satz 18.7
(18.19)
156
18 Drehgruppe und L ORENTZgruppe
⎛ ⎞ a00 ⎜ 0 ⎟ π π ⎟ A3 (ϕ + 2 )A1 (θ )B3 (β) e0 = A3 (ϕ + 2 )A1 (θ ) ⎜ ⎝ 0 ⎠= r ⎛ ⎞ ⎛ ⎞ ⎛ ⎞ a00 a00 a00 ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ 0 r cos ϕ sin θ a ⎟=⎜ ⎟ ⎜ 10 ⎟ = A e0 , = A3 (ϕ + π2 ) ⎜ = ⎝−r sin θ ⎠ ⎝ r sin ϕ sin θ ⎠ (18.19) ⎝a20 ⎠ a30 r cos θ r cos θ d. h. A3 (ϕ +
π )A1 (θ )B3 (β) e0 = A e0 . 2
(18.20)
Dann können wir aber die Sätze 18.6c und 18.3a anwenden. Demgemäß existiert eine Drehung R2 mit 2 = A3 (ϕ )A2 (ψ )A1 (θ ) R
∈ SO(3)
so, dass 2 1 B3 (β) R A=R
1 = A3 (ϕ + π )A1 (θ ) mit R 2
(18.21)
D Die Gruppen SU(2) und SL(2, C) Nach Satz 18.3 ist SO(3) eine „3-parametrige Gruppe“, weil jedes Element A ∈ SO(3) in der Form A = R3 (γ )R2 (β)R1 (α) ,
0 ≤ α, β, γ < 2π
geschrieben werden kann. Wir betrachten nun die Gruppe SU(2) = {A ∈ C2×2 | A∗ A = E , det(A) = 1} .
(18.22)
Wertet man diese Bedingungen aus, so ergibt sich Satz 18.9 SU(2) besteht aus allen Matrizen der Form a −b , A= b a
a, b ∈ C mit |a|2 + |b|2 = 1 .
(18.23)
D
Die Gruppen SU(2) und SL(2, C)
157
Die Elemente von SU(2) entsprechen also den Punkten einer dreidimensionalen Sphäre S3 := {(a, b) ∈ C2 | |a|2 + |b|2 = 1} und hängen also ebenfalls von 3 reellen Parametern ab, so dass man fragen kann, ob ein Zusammenhang zu SO(3) besteht. Zunächst hat man folgende analoge Aussage zu Satz 18.3 Satz 18.10 Definiert man für α ∈ R die Matrizen
cos α/2 i sin α/2 S1 (α) = , i sin α/2 cos α/2
cos α/2 − sin α/2 S2 (α) = , sin α/2 cos α/2 (18.24)
iα/2 0 e , S3 (α) = 0 e−iα/2 so ist S j (α) ∈ SU(2), und es gilt: Zu jedem A ∈ SU(2) gibt es α, β, γ ∈ [0, 4π [, so dass A = S3 (γ )S2 (β)S1 (α) bzw. (evtl. mit anderen Winkeln!) A = S3 (α)S2 (β)S3 (γ )
(18.25)
(18.26)
Insbesondere ist SU(2) zusammenhängend. Beweis Wir begnügen uns damit, die Formel (18.26) zu beweisen. Sei also gemäß 18.9 a −b (18.23) A= , a, b ∈ C, |a|2 + |b|2 = 1 . b a Dann schreiben wir zunächst a = |a| eiϕ ,
b = |b| eiψ
(18.27)
% & mit ϕ, ψ ∈ [0, 2π [. Wegen (18.23) gibt es dann ein θ ∈ 0, π/2 , so dass |a| = cos θ ,
|b| = sin θ .
Die Matrix A hat dann die Form cos θ eiϕ − sin θ e−iψ A= sin θ eiψ cos θ e−iϕ = S3 (ϕ − ψ) S2 (2θ ) S3 (ϕ + ψ) ,
(18.28)
(18.29) (18.30)
wie man sofort überprüft. – Dass SU(2) zusammenhängend ist, folgt aus (18.25) oder (18.26) wie in Anmerkung 18.4.
158
18 Drehgruppe und L ORENTZgruppe
Bemerkung Der Beweis ergibt (18.26) mit α = ϕ−ψ ∈]−2π, 2π [ , β = 2θ ∈ [0, π ] und γ = ϕ + ψ ∈ [0, 4π [. Aber S3 (t ± 2π ) = −S3 (t), also kann man durch eine Verschiebung um ±2π auch erreichen, dass 0 ≤ α < 2π , 0 ≤ γ < 4π ist, und mit diesen Laufbereichen hat man dann eine eindeutige Parametrisierung von SU(2). ↑ Nach Satz 18.8 ist die eigentliche orthochrone L ORENTZgruppe L + eine ↑ 6-parametrige Gruppe, denn jedes A ∈ L + kann in der Form (18.15) geschrieben werden mit den in Satz 18.7 angegebenen Generatoren A j (α), B j (β). Ferner ist ↑ SO(3) nach Satz 18.6 eine Untergruppe von L + . Betrachten wir andererseits die Gruppe SL(2, C) = {A ∈ C2×2 | det A = 1} ,
(18.31)
so sehen wir, dass diese ebenfalls von 6 reellen Parametern abhängt. Ferner ist SU(2) eine Untergruppe von SL(2, C). Für die Gruppe SL(2, C) kann man einen ↑ analogen Satz wie Satz 18.8 für L + beweisen, und insbesondere ist auch diese Gruppe zusammenhängend. Das wollen wir aber nicht tun, weil wir im Folgenden lediglich die 6 Generatoren von SL(2, C) benötigen: Definitionen 18.11 (Generatoren von SL(2, C)) S1 (α) =
cos α/2 i sin α/2 i sin α/2 cos α/2
eiα/2 0 S3 (α) = 0 e−iα/2 K 2 (β) =
S2 (α) =
,
cos α/2 − sin α/2 , sin α/2 cos α/2
cosh β/2 sinh β/2 , K 1 (β) = sinh β/2 cosh β/2
,
cosh β/2 i sinh β/2 −i sinh β/2 cosh β/2
, K 3 (β) =
β/2 e 0 . 0 e−β/2
Die S j (α) sind die Generatoren von SU(2) aus Satz 18.10. Die Generatoren K j (α) dagegen sind nicht unitär. Benutzt man die bekannten Formeln cos iβ = cosh β ,
sin iβ = i sinh β ,
so sieht man, dass K j (β) = S j (−iβ) ist.
E
Die Überlagerungsabbildung
159
E Die Überlagerungsabbildung ↑
Wir wollen nun einen Zusammenhang zwischen den Gruppen L + und SL(2, C) einerseits und SO(3) und SU(2) andererseits herstellen, wie ihn die gerade angestellten Betrachtungen über die Anzahl der Parameter schon suggerieren. L ORENTZtransformationen Λ = (λμν ) operieren als lineare Abbildungen im M INKOWSKI-Raum M 4 = R4 der Vektoren x = x0 e0 + x1 e1 + x2 e2 + x3 e3 ,
xμ ∈ R
mit der quadratischen Form S(x) = x|Gx = x02 − x12 − x22 − x32
(18.32)
und sind durch S(Λx) = S(x) ,
x ∈ M4
(18.33)
charakterisiert. Dies ist zu Bedingung (18.2) äquivalent, da man Satz 17.5a sowie die Polarisationsgleichung 2v|Gw = S(v + w) − S(v) − S(w)
(18.34)
verwenden kann. In vielen Fällen ist es jedoch praktisch, den folgenden zu M 4 isomorphen Vektorraum H zu betrachten: Satz 18.12 Sei H ⊆ C2×2 der reelle Vektorraum der H ERMITEschen 2 × 2Matrizen, versehen mit dem Skalarprodukt X | Y :=
1 Spur (X Y ) . 2
(18.35)
a. Die vier Matrizen 10 01 0 i 1 0 σ0 = , σ1 = , σ2 = , σ3 = . 01 10 −i 0 0 −1
(18.36)
bilden eine Orthonormalbasis von H. Insbesondere ist H ein vierdimensionaler reeller H ILBERTraum. b. Für die Entwicklung X=
3 μ=0
x0 + x3 x1 − i x2 xμ σμ = x1 + i x2 x0 − x3
,
xμ ∈ R
(18.37)
160
18 Drehgruppe und L ORENTZgruppe
von X ∈ H nach dieser Basis gilt det X =
x02
−
x12
−
x22
−
x32
=S
3
x μ eμ ,
(18.38)
μ=0
d. h. der durch τ e μ = σμ ,
μ = 0, 1, 2, 3
(18.39)
gegebene Isomorphismus τ : R4 −→ H überführt die L ORENTZsche quadratische Form in die Determinante. c. Jede lineare Abbildung Λ : H −→ H mit det(Λ(X )) = det X
∀X ∈H
(18.40)
ist eine L ORENTZtransformation in dem Sinn, dass die Matrix, welche Λ bezüglich der Basis {σ0 , . . . , σ3 } repräsentiert, zu L = O(1, 3) gehört. Alle Behauptungen können sofort nachgerechnet werden (Übung!). Insbesondere folgt c aus b und der Charakterisierung (18.33). Bemerkungen (i) Das auf H verwendete Skalarprodukt ist ein Spezialfall des Skalarprodukts, das auf Cn×n durch die Formel X |Y :=
n 1 1 x jk y jk Spur X ∗ Y = n n j,k=1
für X = (x jk ) , Y = (y jk ) gegeben ist. Es handelt sich also im wesentlichen um 2 das euklidische Skalarprodukt auf Cn – der Faktor 1/n sorgt lediglich dafür, dass die Einheitsmatrix die Norm 1 hat. (ii) Die Matrizen (h¯ /2)σ1 , −(h¯ /2)σ2 und (h¯ /2)σ3 sind die berühmten PAULIschen Spinmatrizen. Sei nun A ∈ SL(2, C). Dann definieren wir eine Abbildung Λ A : H −→ H
durch Λ A (X ) := AX A∗ , X ∈ H.
(18.41)
Da die Matrizenmultiplikation distributiv ist, ist Λ A eine lineare Abbildung. Wegen Λ A (X )∗ = (AX A∗ )∗ = A∗∗ X ∗ A∗ = AX A∗
für X ∈ H
E
Die Überlagerungsabbildung
161
ist tatsächlich Λ A (X ) ∈ H. Ferner ist det(Λ A (X )) = det(AX A∗ ) = | det A|2 det X = det X
(18.42)
wegen det A = 1, d. h. Λ A : H −→ H ist eine L ORENTZtransformation in H. Auf diese Weise bekommen wir eine Abbildung Λ
SL(2, C) A −→ Λ A ∈ L = O(1, 3) .
(18.43)
Wir zeigen, dass diese Abbildung ein Gruppenhomomorphismus ist. Seien A, B ∈ SL(2, C). Dann folgt Λ AB (X ) = (AB)X (AB)∗ = A(B X B ∗ )A∗ = AΛ B (X )A∗ = Λ A (Λ B (X )) . Wir wollen noch den Kern Kern Λ = {A ∈ SL(2, C) | Λ A = idH } bestimmen. Es ist also A ∈ Kern Λ genau dann, wenn Λ A (X ) = AX A∗ = X
für alle X ∈ H.
Wählen wir insbesondere für X die Basiselemente σμ , so folgt Aσμ A∗ = σμ
für μ = 0, 1, 2, 3.
(18.44)
Hier setzen wir nacheinander μ = 0, 1, 2 ein und verwenden schließlich noch det A = 1. So ergeben sich die folgenden Konsequenzen: a. μ = 0: Aσ0 A∗ = σ0
⇐⇒
A A ∗ = σ0
⇐⇒
A ∈ SU(2)
⇐⇒
A=
a b −b a
Wir können daher (18.44) schreiben als Aσμ = σμ A
für μ = 1, 2, 3,
A ∈ SU(2) .
(18.45)
b. μ = 1:
a b −b a
a b 01 01 = 10 10 −b a
⇐⇒
a = a, b = −b
⇐⇒
⇐⇒
b a −b a = a −b a b
a = α, b = iβ,
α, β ∈ R .
.
162
18 Drehgruppe und L ORENTZgruppe
c. μ = 2:
α iβ iβ α
0 −i 0 −i α iβ = i 0 i 0 iβ α
⇐⇒
⇐⇒
−β −iα β −iα = iα β iα −β
β = 0.
d. α0 1 = det A = det = α 2 ⇒ α = ±1 . 0α Also ergibt sich insgesamt Kern Λ = {σ0 , −σ0 } ,
(18.46)
denn dass ±σ0 tatsächlich zum Kern gehören, ist klar. Betrachten wir nun noch Λ A für A ∈ SU(2). Dann folgt mit dem Skalarprodukt (18.35) Λ A (X ) | Λ A (Y ) = =
1 2
1 2
Spur (Λ A (X )Λ A (Y ))
Spur (AX A∗ AY A∗ ) = 12 Spur (X Y ) = X | Y ,
(18.47)
denn es ist A∗ = A−1 für A ∈ SU(2) sowie Spur (AX A∗ AY A∗ ) = Spur (A∗ AX Y ) = Spur (X Y ) . Gleichung (18.47) besagt, dass Λ A eine orthogonale Abbildung in H ist und daher zu O(4) gehört. Da ferner Λ A (σ0 ) = Aσ0 A∗ = A A∗ = σ0 für A ∈ SU(2) gilt, bleibt die σ0 -Achse (=e0 -Achse) fest. Nach Satz 18.1d ist daher das orthogonale Komplement LH(σ1 , σ2 , σ3 ) (=LH(e1 , e2 , e3 )) ebenfalls invariant unter Λ A , so dass die Einschränkung zu O(3) gehört. Wir fassen zusammen: Satz 18.13 a. Jedem A ∈ SL(2, C) wird durch Λ A (X ) := AX A∗ ,
X ∈H
eine L ORENTZtransformation Λ A in H zugeordnet. Für jedes A ∈ SU(2) ist Λ A eine orthogonale Abbildung in H, welche LH(σ0 ) und LH(σ1 , σ2 , σ3 ) als invariante Unterräume hat.
E
Die Überlagerungsabbildung
163
b. Die Zuordnung Λ
SL(2, C) A −→ Λ A ∈ L = O(1, 3) liefert einen Gruppenhomomorphismus Λ : SL(2, C) −→ L
mit Kern Λ = {σ0 , −σ0 } .
c. Die Zuordnung SU(2) A −→ Λ A ∈ O(3) liefert einen Gruppenhomomorphismus Φ = Λ
SU(2)
: SU(2) −→ O(3)
mit Kern Φ = {σ0 , −σ0 } .
wobei O(3) wie in Satz 18.6 als Untergruppe von L aufzufassen ist. Wir wollen noch Bild Λ ⊆ L
und
Bild Φ ⊆ O(3)
bestimmen. Dazu werden wir zu gegebenem A ∈ SL(2, C) die Matrix (λμν ) = (λμν (A)) berechnen, die die Transformation Λ A bezüglich der Basis {σ0 , σ1 , σ2 , σ3 } von H darstellt. Da H ein reeller Hilbertraum mit der Orthonormalbasis {σ0 , . . . , σ3 } bezüglich des Skalarproduktes X | Y =
1 Spur (X Y ) 2
ist, gilt λμν = σμ | Λ A (σν ) und damit nach Definition von Λ A : 1 (18.48) Spur (σμ Aσν A∗ ) . 2 a c ab Setzen wir A in der Form A = , also A∗ = an, so bekommen wir cd bd zunächst folgende Produkte λμν =
164
18 Drehgruppe und L ORENTZgruppe
2 |a| + |b|2 ac + bd , ac + bd |c|2 + |d|2 ab + ab bc + ad ∗ , Aσ1 A = ad + bc cd + cd iab − iab iad − ibc Aσ2 A∗ = , icb − iad icd − icd 2 |a| − |b|2 ac − bd . Aσ3 A∗ = ac − bd |c|2 − |d|2
Aσ0 A∗ =
Mit Formel (18.48) kann man hieraus die Matrixelemente sukzessive berechnen. Wir begnügen uns mit der 0-Spalte und stellen den Rest als Übung: λ00 = = λ10 = = λ20 = = λ30 = =
∗ 1 2 Spur (σ0 Aσ0 A ) 2 2 2 2 1 2 (|a| + |b| + |c| + |d| ) , ∗ 1 2 Spur (σ1 Aσ0 A ) 1 2 (ac + bd + ac + bd) = Re (ac + bd) , ∗ 1 2 Spur (σ2 Aσ0 A ) 1 2 (i(ac + bd) − i(ac + bd)) = Im (ac + bd) , ∗ 1 2 Spur (σ3 Aσ0 A ) 2 2 2 2 1 2 (|a| + |b| − |c| − |d| ) .
Fährt man in dieser Weise fort, so bekommt man folgendes Ergebnis: Satz 18.14 Für A=
ab ∈ SL(2, C) cd
hat die Abbildung Λ A : H −→ H bezüglich {σ0 , σ1 , σ2 , σ3 } die folgende Matrixdarstellung (λμν ): ⎞ − |b|2 + |c|2 − |d|2 ) ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ Re (ad + bc) −Im (ad − bc) Re (ac − bd) Re (ac + bd) ⎟ ⎜ ⎟ ⎜ ⎟. ⎜ ⎟ ⎜ ⎟ ⎜ Im (ad + bc) Re (ad − bc) Im (ac − bd) Im (ac + bd) ⎟ ⎜ ⎠ ⎝ 1 2 + |b|2 − |c|2 − |d|2 ) Re (ab − cd) −Im(ab − cd) 1 (|a|2 − |b|2 − |c|2 + |d|2 ) (|a| 2 2 ⎛1
2 2 (|a|
+ |b|2 + |c|2 + |d|2 ) Re (ab + cd) −Im (ab + cd)
1 2 2 (|a|
Insbesondere ist λ00 = 12 (|a|2 + |b|2 + |c|2 + |d|2 ) > 0
E
Die Überlagerungsabbildung
165
und Spur (Λ A ) = |a|2 + |d|2 + 2Re (ad) = (Re a + Re d)2 + (Im a + Im d)2 ≥ 0 . Aus den beiden letzten Aussagen lassen sich folgende Konsequenzen ziehen: a. Wegen λ00 > 0 ist Bild Λ ⊆ L ↑ , und insbesondere ist T ∈ Bild Λ und
− E ∈ Bild Λ .
b. Wegen Spur (Λ A ) ≥ 0 und Spur P = −2 ist auch P ∈ Bild Λ , ↑
↑
und das bedeutet: Bild Λ ⊆ L + . Dass tatsächlich Bild Λ = L + ist, überprüft man, ↑ indem man zeigt, dass die 6 Generatoren A j (α), B j (β) von L + gemäß Satz 18.7 allesamt in Bild Λ liegen: Satz 18.15 Bezeichnen S j (α), K j (β) die in Satz 18.11 angegebenen Generatoren von SL(2, C) und sind A j (α), B j (β) die in Satz 18.7 angegebenen Generatoren ↑ von L + , so gilt Λ(S j (α)) = A j (α) , Λ(K j (β)) = B j (β)
,
j = 1, 2, 3 .
Das rechnet man mit Satz 18.14 als Übung nach. Die explizite Formel für die Matrixelemente von Λ A zeigt auch, dass diese Polynome und damit analytische Funktionen der Matrixelemente von A sind. Wir können das Ergebnis aller dieser Überlegungen also folgendermaßen zusammenfassen: Theorem 18.16 ↑
a. Die in Satz 18.13 b. definierte Abbildung Λ : SL(2, C) −→ L + liefert einen analytischen Epimorphismus mit Kern Λ = {σ0 , −σ0 }. b. Die in Satz 18.13 c. definierte Abbildung Φ : SU(2) −→ SO(3) liefert einen analytischen Epimorphismus mit Kern Φ = {σ0 , −σ0 }. Bemerkung Die Homomorphismen Λ und Φ werden als Überlagerungsabbildungen (engl. „covering maps“) bezeichnet, und man sagt, SL(2, C) (bzw. SU(2)) sei die ↑ universelle Überlagerung (engl. „universal covering“) von L + (bzw. von SO(3)). Diese Terminologie hat nichts mit Überlagerungen im Sinne von Superposition zu
166
18 Drehgruppe und L ORENTZgruppe
tun. Vielmehr spielt sie auf gewisse topologische Aspekte an, die für die moderne Teilchenphysik durchaus wichtig sind, hier aber zu weit führen (vgl. [59, 60, 62, 85]). Wir werden in Abschn. 22D noch etwas näher darauf eingehen, müssen es aber, was Einzelheiten betrifft, bei den Literaturhinweisen belassen.
F Quaternionen Ist man nur an den Gruppen SO(3) und SU(2) interessiert, so ist es zweckmäßig, anstelle des H ILBERTraumes H = LHR (σ0 , σ1 , σ2 , σ3 ) aus Satz 18.12, der aus HERMITEschen Matrizen besteht, einen anderen H ILBERTraum zu benutzen, der die unitären Matrizen als Teilmenge enthält. Satz 18.17 Es seien 10 0 i 0 −1 i 0 e0 = , e1 = , e2 = , e3 = , 01 i 0 1 0 0 −i
(18.49)
und es sei H := LHR (e0 , e1 , e2 , e3 ) die Menge aller reellen Linearkombinationen q=
3 μ=0
x + ix3 −x2 + ix1 xμ eμ = 0 x2 + ix1 x0 − ix3
.
(18.50)
Dann gilt: a. H bildet einen 4-dimensionalen H ILBERTraum mit dem Skalarprodukt q1 | q2 = 12 Spur (q1∗ q2 )
(18.51)
und der Orthonormalbasis {e0 , e1 , e2 , e3 }. b. Die Menge SU(2) bildet die Einheitssphäre in H, d. h. SU(2) = {q ∈ H | q = 1} .
(18.52)
c. Die Menge H bildet bezüglich der Matrizenaddition und -multiplikation einen sogenannten Schiefkörper, d. h. es gelten alle Körperaxiome mit Ausnahme des Kommutativgesetzes der Multiplikation. Die Elemente q ∈ H heißen Quaternionen (die Bezeichnung H erinnert an ihren Entdecker H AMILTON). Die Aussagen des Satzes lassen sich wieder durch einfache Rechnungen bestätigen, die als Übungen empfohlen seien. Für Teil b. sollte man
F Quaternionen
167
dabei die Form (18.23) der Elemente von SU(2) heranziehen, und für c. ist zu beachten, dass man nur die Aussage q = 0
⇒
det q = 0
nachzuprüfen hat. Das ist aber klar wegen der Beziehung q2 = det q
für alle q ∈ H,
(18.53)
die man ohne weiteres aus (18.50) und (18.51) folgert. Mit Hilfe des Raumes H kann man nun ebenfalls den Epimorphismus Φ : SU(2) −→ SO(3) konstruieren. Für festes s ∈ SU(2) definiert man eine Abbildung Fs : H −→ H durch
Fs (q) := sqs ∗ ,
(18.54)
die sicher linear ist. Beachtet man (18.53), so folgt aus (18.54) Fs (q)2 = det(Fs (q)) = det(sqs ∗ ) = det q = q2 , d. h. jedes Fs ist eine orthogonale Abbildung in H, gehört also zu O(4). Wegen Fs (e0 ) = se0 s ∗ = e0
(18.55)
ist der 1-dimensionale Unterraum U0 := LHR (e0 ) invariant unter Fs und daher nach Satz 18.1d auch das orthogonale Komplement V := U0⊥ = LHR (e1 , e2 , e3 ) .
(18.56)
R(s) := Fs ,
(18.57)
Definieren wir daher V
so ist R(s) ∈ O(3), und genau wie im Beweis von Satz 18.13 erkennen wir, dass die Zuordnung R
SU(2) s −→ R(s) ∈ O(3) ein Gruppen-Homomorphismus mit Kern R = {e0 , −e0 } ist. Genau wie bei der Abbildung Λ : SL(2, C) −→ L aus Theorem 18.16 kann man nun die Matrix R(s) = (ri j )
bezüglich der Basis {e1 , e2 , e3 }
von V bestimmen. Es gilt allgemein ri j (s) = ei | R(s)e j =
1 2
Spur (ei∗ se j s ∗ ) .
(18.58)
168
18 Drehgruppe und L ORENTZgruppe
Wegen e j = iσ j und σ j∗ = σ j ergibt das ri j (s) = λi j (s) (i, j = 1, 2, 3), und durch Einsetzen in die Formel aus Satz 18.14 bekommt man dann folgendes Ergebnis: Satz 18.18 a. Ist
x + ix3 −x2 + ix1 A= 0 x2 + ix1 x0 − ix3
∈ SU(2) ⊆ H ,
so hat die lineare Abbildung R(A) ∈ SO(3) bezüglich der Basis {e1 , e2 , e3 } die folgende Matrixdarstellung: ⎛
x02 + x12 − x22 − x32
⎜ ⎝ 2(x0 x3 + x1 x2 ) 2(x1 x3 − x0 x2 )
2(x1 x2 − x0 x3 ) x02 − x12 + x22 − x32 2(x0 x1 + x2 x3 )
2(x0 x2 + x1 x3 )
⎞
⎟ 2(x2 x3 − x0 x1 ) ⎠ . x02 − x12 − x22 + x32
(18.59)
b. R stimmt mit dem Epimorphismus Φ aus Theorem 18.16b. überein. Bezeichnen S j (α), j = 1, 2, 3 die Generatoren von SU(2) aus Satz 18.10 und R j (α), j = 1, 2, 3 die Generatoren von SO(3) aus 18.3, so gilt insbesondere R(S j (α)) = R j (α),
j = 1, 2, 3 .
(18.60)
Aufgaben zu Kap. 18 18.1 Ohne die Behauptungen von Satz 18.5b zu benutzen, beweise man die Aussagen (i) und (ii) aus dessen Beweis und vervollständige den Beweis damit. (Hinweis zu (ii): Mittels der S CHWARZschen Ungleichung zeige man zunächst |a01 b10 + 2 − 1)1/2 (b2 − 1)1/2 .) a02 b20 + a03 b30 | ≤ (a00 00 18.2 Sei e0 = (1, 0, 0, 0)T , und Z ± := {x ∈ R4 | x|Gx > 0 , e0 |Gx ≷ 0} sei die Menge der in die Zukunft (bzw. in die Vergangenheit) gerichteten zeitartigen Weltvektoren. Man zeige: a. A ∈ L , Ae0 ∈ Z + ⇒ A ∈ L ↑ . A(Z + ) = Z + . (Hinweis: Man verwende Satz 18.8 und beb. A ∈ L ↑ ⇒ ⇒ v0 > |v j | für j = 1, 2, 3 achte, dass v = (v0 , v1 , v2 , v3 )T ∈ Z + (warum?).) c. L ↑ = {A ∈ L | A(Z + ) = Z + }.
Aufgaben
169 ↑
↓
18.3 Man zeige, dass L 0 = L + ∪ L − eine Untergruppe von L ist. 18.4 Für v = (x, y, z)T ∈ R3 setze ⎛
⎞ 0 −z y N (v) := ⎝ z 0 −x ⎠ −y x 0 Man zeige: a. Ist |v| = 1 und α ∈ R, so bewirkt die Matrix D(α, v) := E + (sin α)N (v) + (1 − cos α)N (v)2 Die Drehung um den Winkel α, deren Drehachse von v aufgespannt wird und deren Drehsinn durch die Rechte-Hand-Regel bestimmt ist. Insbesondere ist D(α, v) ∈ SO(3). b. Sei B 3 := {v ∈ R3 | |v| ≤ 1} die abgeschlossene Einheitskugel im dreidimensionalen Raum, und sei P : B 3 → SO(3) definiert durch " D(π |v|, v/|v|) für v = 0 P(v) := E für v = 0 . Diese Abbildung ist stetig und surjektiv. c. Für jedes A ∈ SO(3) ist −1 ≤ Spur A ≤ 3. Was bedeutet Spur A = −1 für den Drehwinkel? (Hinweis: Satz 18.2.) d. Sei H := {A ∈ SO(3) | Spur A = −1}. Dann bildet P die offene Kugel U := {v | |v| < 1} bijektiv auf SO(3) \ H ab. e. Die Sphäre S2 = ∂ B 3 wird von P auf H abgebildet. Dabei hat jedes A ∈ H genau zwei Urbilder ±v ∈ S2 . 18.5 Man beweise, dass SO(3) zum dreidimensionalen reellen projektiven Raum RP3 homöomorph ist (vgl. Beispiel 1.7a). (Hinweis: Man verwende (18.52) und den Epimorphismus Φ.) 18.6 Man bestimme die Konjugiertenklassen in G = SU(2) (vgl. Aufgabe 17.15). Dazu zeige man: a. Jede Matrix A ∈ SU(2) ist in G konjugiert zu S3 (α) für geeignetes α ∈ R. (Hinweis: Da A normal ist, ist sie diagonalisierbar, und die Ähnlichkeitstransformation auf Diagonalgestalt kann durch eine unitäre Matrix bewirkt werden.) b. S3 (α) und S3 (−α) sind konjugiert. c. Sei K α die Konjugiertenklasse von S3 (α). Auf K α hat die Spur den Wert Spur A = 2 cos
α . 2
170
18 Drehgruppe und L ORENTZgruppe
d. Die Konjugiertenklassen von G sind genau die K α mit 0 ≤ α ≤ 2π . e. Zwei Elemente A, B ∈ G sind genau dann in G konjugiert, wenn ihre Spuren übereinstimmen. f. Wird G wie in Satz 18.17 mit S3 identifiziert, so ist für 0 ≤ α ≤ 2π ⎧ 3 ⎨
⎫ ⎬ α xμ eμ x0 = cos Kα = , ⎩ 2⎭ μ=0 ist also für 0 = α = 2π eine zweidimensionale Sphäre vom Radius sin (α/2). Was sind K 0 und K 2π ? (Hinweis: Was sind die Spuren der Matrizen eμ ?) 18.7 Seien e0 , e1 , e2 , e3 die Matrizen aus (18.49). a. Die 8 Matrizen ±eμ , μ = 0, . . . , 3 bilden eine Untergruppe von SL(2, C). Man beweise dies durch explizite Berechnung aller vorkommenden Matrizenprodukte. b. Bei einer Quaternion q = v0 e0 + v1 e1 + v2 e2 + v3 e3 bezeichnet man v0 als den Realteil und den Vektor v = (v1 , v2 , v3 )T als den Vektorteil. Eine Quaternion heißt rein-imaginär, wenn ihr Realteil verschwindet. Man beweise: Sind q = v1 e1 + v2 e2 + v3 e3
und r = w1 e1 + w2 e2 + w3 e3
zwei rein-imaginäre Quaternionen, so hat ihr Produkt qr den Realteil −v · w = −(v1 w1 + v2 w2 + v3 w3 ) und als Vektorteil gerade das Vektorprodukt v × w. c. Die konjugierte Quaternion zu q = v0 e0 + v1 e1 + v2 e2 + v3 e3 ist q¯ := v0 e0 − v1 e1 − v2 e2 − v3 e3 . Man zeige: q q¯ = qq ¯ = q2 e0 ,
2 q −1 = q/q ¯ .
18.8 Man beweise, dass U(n) zusammenhängend ist. (Hinweis: Die Eigenwerte einer unitären Matrix U haben bekanntlich stets den Betrag 1, und man kann U unitär diagonalisieren, d. h. es gibt eine unitäre Matrix S, für die SU S −1 Diagonalgestalt hat. Aufgrund dieser Tatsachen ist es leicht, eine Kurve anzugeben, die U innerhalb von U(n) mit der Einheitsmatrix E verbindet.) 18.9 Sei G ≤ O(n) eine Untergruppe. Wenn es ein Gitter Γ des Rn (Aufgabe 17.3) gibt mit A(Γ ) = Γ
für alle A ∈ G
Aufgaben
171
(kurz: wenn G ein Gitter invariant lässt), so nennt man G eine kristallographische Punktgruppe. Für solch eine Gruppe G beweise man die folgenden Aussagen: a. Es gibt eine reguläre Matrix S ∈ Rn×n mit der Eigenschaft, dass die Matrixelemente der S −1 AS , A ∈ G sämtlich ganze Zahlen sind. b. Für jedes A ∈ G ist die Spur eine ganze Zahl zwischen −n und n. c. G ist eine endliche Gruppe. (Hinweis: Man betrachte S wie in Teil a und überlege sich, dass es für die Beträge der Matrixelemente von S −1 AS , A ∈ G eine feste obere Schranke gibt.) d. Ist n = 3 und R ∈ G ∩ SO(3) eine Drehung, so muss der Drehwinkel eine der Zahlen 2π, π, 2π/3, π/2, π/3 sein. (Hinweis: Der Drehwinkel bestimmt die Spur!) e. Ist n = 3, so kommen für die Ordnungen der Elemente von G (vgl. Aufgabe. 17.4) nur die Zahlen 1, 2, 3, 4, 6 in Frage. (Hinweis: Ist T ∈ G eine Spiegelung, so ist −T eine Drehung.) f. Warum gibt es keine Kristalle mit fünfzähliger Symmetrieachse?
Kapitel 19
L IE-Gruppen und L IE-Algebren
Abgesehen von den Permutationsgruppen (Beispiel 6 aus Kap. 17), den Gittern (Aufgabe 17.3) und den kristallographischen Gruppen (Aufgabe 18.9) interessieren in der Physik hauptsächlich kontinuierliche Gruppen, d. h. solche, deren Elemente kontinuierlich variiert werden können. Man kann sie auch als Transformationsscharen betrachten, welche von endlich vielen reellen Parametern abhängen (oder auch von unendlich vielen, doch ist das ein fortgeschrittenes Thema, auf das wir hier nicht eingehen können). Typische Beispiele hierfür haben wir im vorigen Kapitel kennengelernt: a. Nach Satz 18.3 kann jedes Element R ∈ SO(3) durch E ULERsche Winkel in der Form % % (19.1) R = R(α, β, γ ) := R3 (γ )R2 (β)R1 (α), α, β, γ ∈ 0, 2π beschrieben werden. Dies lässt sich auffassen als eine Parameterdarstellung der 3-dimensionalen Mannigfaltigkeit SO(3) im 9-dimensionalen Raum R3×3 . b. Nach Satz 18.10 kann jedes Element A ∈ SU(2) ebenfalls in der Form A = A(α, β, γ ) := S3 (γ )S2 (β)S1 (α),
% % α, β, γ ∈ 0, 4π
(19.2)
durch drei Winkel dargestellt werden. Dies lässt sich auffassen als eine Parameterdarstellung einer 3-dimensionalen Mannigfaltigkeit im komplexen H ILBERTraum C2×2 , der – nach Übergang zu Real- und Imaginärteil – mit R8 identifiziert werden kann. ↑ c. Nach Satz 18.8 lässt sich jedes Element Λ ∈ L + durch 6 Parameter beschreiben, und zwar in der Form Λ = Λ(ϕ, θ, β, ϕ , ψ , θ ) := A3 (ϕ + π2 )A1 (θ )B3 (β)A3 (ϕ )A2 (ψ )A1 (θ ) , (19.3) wobei 0 ≤ ϕ, θ, ϕ , θ , ψ < 2π, β ∈ R. Dies kann man auffassen als eine Para↑ meterdarstellung der 6-dimensionalen Mannigfaltigkeit L + im 16-dimensionalen reellen Raum R4×4 . K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_19, C Springer-Verlag Berlin Heidelberg 2010
173
174
19 L IE-Gruppen und L IE-Algebren
Alle physikalisch bedeutsamen Matrixgruppen sind von diesem Typ. Sie stel2 2 2 len also Untermannigfaltigkeiten von Rn bzw. Cn ≡ R2n dar, und wenn man diese (zumindest in der Nähe der Einheitsmatrix E) parametrisiert, so erhält man eine parameterabhängige Schar von Transformationen. Differentiation nach diesen Parametern an der Stelle X = E liefert dann die entsprechenden infinitesimalen Transformationen, und mittels der Exponentialfunktion kann man aus diesen die eigentlichen Gruppenelemente zurückgewinnen. Daher wiederholen und vertiefen wir in Abschn. A die einschlägigen Kenntnisse über die Exponentialfunktion und den Logarithmus von Matrizen. In Abschn. B definieren wir präzise, wann eine aus Matrizen bestehende Gruppe eine L IE-Gruppe ist („lineare L IE-Gruppen“), überzeugen uns, dass die klassischen Gruppen von diesem Typ sind, und geben auch einen Ausblick auf den allgemeinen Begriff der L IE-Gruppe als einer Mannigfaltigkeit mit kompatibler Gruppenstruktur. Das hervorstechendste Merkmal der infinitesimalen Transformationen ist die Tatsache, dass mit A, B auch der Kommutator [A, B] := AB − B A eine infinitesimale Transformation desselben Typs ist. Die infinitesimalen Transformationen, die aus den Transformationen einer gegebenen L IE-Gruppe durch Differentiation am Punkt Eins entstehen, bilden daher eine sog. L IE-Algebra, d. h. eine Rechenstruktur, in der die Bildung von Linearkombinationen und Kommutatoren unbegrenzt möglich ist. Dieser Begriff, der schon in den Kap. 3 und 6 angeklungen ist, wird in Abschn. C exakt definiert, es werden etliche Beispiele gegeben, und vor allem wird die Beziehung zwischen einer L IE-Gruppe und ihrer L IE-Algebra genauer untersucht. Wir beenden das Kapitel dann in Abschn. D mit einer knappen Diskussion der speziellen L IE-Algebren, die zu den in Kap. 18 betrachteten Gruppen gehören. Das Wechselspiel zwischen L IE-Gruppen und ihren L IE-Algebren (anders gesagt, zwischen Transformationen und infinitesimalen Transformationen) ist eigentlich der Angelpunkt der ganzen Theorie, und es wird uns in Kap. 22 auch noch einmal beschäftigen. Detaillierte Untersuchungen können zumeist in der entsprechenden L IE-Algebra viel leichter vorgenommen werden als in der L IE-Gruppe selbst, und die Ergebnisse können dann mittels der Exponentialfunktion weitgehend in die Gruppe übertragen werden. Dass diese Übertragung nicht völlig uneingeschränkt möglich ist, liegt daran, dass die Exponentialfunktion i. A weder injektiv noch surjektiv ist. Allerdings bildet die Exponentialfunktion stets eine Umgebung der Null in der L IE-Algebra diffeomorph auf eine Umgebung der Eins in der Gruppe ab (s. u. Satz 19.2 und Theorem 19.11b), und daher können die lokalen Verhältnisse, die in einer geeigneten Umgebung der Eins in der Gruppe herrschen, exakt durch die entsprechende L IE-Algebra beschrieben werden. In vielen Anwendungen hat man es denn auch gar nicht mit einer ganzen Gruppe zu tun, sondern nur mit einer sog. lokalen L IE-Gruppe, d. h. einer parametrisierten Schar von Transformationen in der Nähe der identischen Transformation, bei
A
Exponentialfunktion und Logarithmus von Matrizen
175
der Multiplikation und Inversenbildung durch analytische Funktionen der Parameter beschrieben werden und bei der die Gruppenaxiome immer dann erfüllt sind, wenn die betrachteten Transformationen in der betreffenden Umgebung der Eins liegen. Lokale L IE-Gruppen sowie die Auswirkung der in ihnen enthaltenen Transformationen auf die transformierten Größen können vollständig durch entsprechende L IE-Algebren beschrieben werden, und das eröffnet z. B. die Möglichkeit, explizite Lösungen von Differentialgleichungen durch Ausnutzung von deren Symmetrien und infinitesimalen Symmetrien zu gewinnen. Diesen interessanten Aspekt – der sogar den historischen Ausgangspunkt der ganzen L IE-Theorie bildet – können wir hier jedoch nicht vertiefen und verweisen dazu u. A. auf [18, 58, 75] oder [63].
A Exponentialfunktion und Logarithmus von Matrizen Die Exponentialfunktion einer quadratischen Matrix A ∈ Kn×n ist bekanntlich durch die konvergente Potenzreihe e A ≡ exp A :=
∞ Ak k!
(19.4)
k=0
definiert. Natürlich handelt es sich dabei um einen Spezialfall der in den Aufgaben 8.5, 8.7, 8.19 und 16.3 behandelten Exponentialfunktion eines beschränkten linearen Operators, und insbesondere kann man sich für eine H ERMITEsche Matrix A auch vorstellen, dass exp A mittels des stetigen Funktionalkalküls durch Einsetzen von A in die Funktion f (λ) = eλ zustande kommt. Für unsere jetzigen Zwecke reicht jedoch eine elementare Behandlung der Exponentialmatrix, wie sie etwa in [34], Kap. 19 gegeben wurde. Insbesondere wurden dort die folgenden Tatsachen bewiesen: Theorem 19.1 Für beliebige n × n-Matrizen A, B und Zahlen s, t gilt stets a.
d exp t A = A exp t A = (exp t A)A , t ∈ R . Für gegebenes x ∈ Kn dt ist die vektorwertige Funktion y(t) := et A x sogar die eindeutige Lösung der Anfangswertaufgabe y˙ = Ay ,
b. c. d. e. f. g.
y(0) = x.
e A+B = e A e B , falls A und B vertauschen, d. h. falls AB = B A. e(s+t)A = es A et A . −1 = e−A . e A ist regulär, e A A Spur A det e = e . −1 Se A S −1 = e S AS für jede reguläre Matrix S. T ∗ T ∗ e A = e A und e A = e A .
176
19 L IE-Gruppen und L IE-Algebren
h. Die Eigenwerte von e A sind die Zahlen eλ , wobei λ die Eigenwerte von A ∈ Cn×n durchläuft. Dabei ist die (algebraische) Vielfachheit eines Eigenwerts μ von e A stets gleich der Summe der Vielfachheiten der Eigenwerte λ von A, für die μ = eλ ist. 2
2
2
Wir erinnern nun daran, dass man Rn×n bzw. Cn×n mit Rn bzw. mit Cn = R2n identifizieren kann, indem man die n 2 Matrixelemente bzw. Real- und Imaginärteil der Matrixelemente als die Koordinaten auffasst. Die Gruppe GL(n, K) = {A ∈ Kn×n | det A = 0} ist dann eine offene Teilmenge und somit ebenfalls eine differenzierbare Mannigfaltigkeit. Die Exponentialreihe (19.4) definiert wegen 19.1d eine differenzierbare (sogar analytische!) Abbildung exp : Kn×n −→ GL (n, K), die in der Nähe des Nullpunktes ein lokaler Diffeomorphismus ist: Satz 19.2 a. Die Exponentialabbildung exp : Kn×n A −→ e A ∈ GL (n, K) liefert einen analytischen Diffeomorphismus von einer offenen Umgebung U0 von 0 ∈ Kn×n auf eine offene Umgebung U1 von E ∈ GL(n, K). Die Ableitung dieses Diffeomorphismus im Punkt X = 0 ist d exp0 = id.
(19.5)
b. Insbesondere existieren ε > 0, δ > 0, so dass jedes A ∈ GL(n, K) mit A − E < δ eindeutig in der Form A = eB ,
mit B ∈ Kn×n , B < ε
(19.6)
dargestellt werden kann. Beweis Wir brauchen nur (19.5) nachzuweisen, denn dann folgt a. aus dem klas2 sischen Satz über inverse Funktionen, angewandt auf den Raum Kn der n × nMatrizen, und b ist eine unmittelbare Folgerung aus a. Um das Differential zu berechnen, betrachten wir ein beliebiges H ∈ Kn×n . Nach d der Kettenregel ist dt exp(t H ) = d exp0 (H ). Aber nach Theorem 19.1a hat t=0 die linke Seite den Wert H . Somit ist d exp0 die identische Abbildung, wie behauptet. Es ist naheliegend, die lokale Umkehrabbildung als Logarithmus zu bezeichnen. Auch für den Logarithmus wollen wir nun eine Potenzreihendarstellung angeben. Dabei benutzen wir auf Kn×n stets die Operatornorm
B
Lineare L IE-Gruppen und allgemeine L IE-Gruppen
177
A := sup |Ax|, |x|≤1
wobei | · |, wie immer, die euklidische Norm auf Kn bezeichnet. Satz und Definition 19.3 Für A ∈ Cn×n mit A < 1 konvergiert die Reihe ln(E + A) :=
∞ (−1) j−1
j
j=1
Aj
(19.7)
absolut, und es gilt eln(E+A) = E + A ln(e ) = A A
für A < 1 ,
für A < ln 2 .
(19.8) (19.9)
Man nennt ln(E + A) den Logarithmus von E + A. Beweis Die absolute Konvergenz von (19.7) folgt aus A j ≤ A j (vgl. (8.5)) und der absoluten Konvergenz der TAYLORreihe ln(1 + z) =
∞ (−1) j−1 j=1
j
zj
für |z| < 1,
während sich (19.8) und (19.9) aus den Gleichungen eln(1+z) = 1 + z ln(ez ) = z
für |z| < 1,
für |z| < ln 2
ergeben. Setzt man hier statt z eine Matrix A ein, so ist jeder Term der entstehenden Potenzreihen von der Form cm Am mit cm ∈ C, und somit kommutieren alle diese Terme. Das Einsetzen der einen Potenzreihe in die andere liefert daher im Falle der Matrix dasselbe Ergebnis wie im Falle der Zahl z.
B Lineare L IE-Gruppen und allgemeine L IE-Gruppen Wir beginnen mit L IE-Gruppen, die aus Matrizen bestehen, und wenden uns erst danach dem allgemeinen Fall zu: Definition 19.4 Eine Untergruppe G ≤ GL(n, K) heißt eine lineare L IE-Gruppe, 2 wenn G gleichzeitig eine Untermannigfaltigkeit von Rn×n ≡ Rn bzw. von Cn×n ≡ 2 R2n ist.
178
19 L IE-Gruppen und L IE-Algebren
Alle klassischen Gruppen sind lineare L IE-Gruppen. Das folgt z. B. für SL(n, R) direkt aus dem Satz vom regulären Wert (Theorem 1.21), angewandt auf die Funktion f : Rn×n −→ R, X −→ det X . Dass 1 ein regulärer Wert für f ist, erkennt man am bequemsten mittels der bekannten (und leicht zu beweisenden!) E ULERschen Homogenitätsrelation: Wegen f (t X ) = t n f (X ) für t ∈ R ist d f X (X ) = n f (X ), also d f X = 0 für X ∈ SL(n, R) = f −1 (1). Für die orthogonalen Gruppen haben wir es schon in Kap. 1 als Anwendungsbeispiel für den Satz vom regulären Wert bewiesen, und die dort verwendete Methode kann auf G-orthogonale und G-unitäre Gruppen verallgemeinert werden, wobei sich allerdings für den Fall einer beliebigen Matrix G eine gewisse Komplikation ergibt: Satz 19.5 Die in Satz 17.5 beschriebenen Gruppen OG (n) und UG (n) sind lineare L IE-Gruppen. Die Tangentialräume im Punkt X = E sind dabei gegeben durch TE OG (n) = {H ∈ Rn×n | H T G + G H = 0} bzw. TE UG (n) = {H ∈ Cn×n | H ∗ G + G H = 0}.
Beweis Für die Gruppen UG (n) verläuft der Beweis ähnlich wie für die OG (n), und wir besprechen daher nur die letzteren ausführlich. Sei also G ∈ Rn×n fest vorgegeben. Ist A ∈ OG (n), so definiert die Linksmultiplikation mit A−1 einen Diffeomorphismus von Rn×n auf Rn×n , und außerdem haben wir A−1 X ∈ OG (n)
⇐⇒
X ∈ OG (n),
weil es sich um eine Gruppe handelt. Ein Flachmacher (vgl. Definition 1.18) für OG (n) um den Punkt A ∈ OG (n) ist also gegeben durch h(X ) := h 0 (A−1 X ), wenn h 0 ein Flachmacher um den Punkt E ist. Daher genügt es, einen Flachmacher h 0 um E zu finden. Dazu betrachten wir die differenzierbare Abbildung Ψ : Rn×n −→ Rn×n , X −→ X T G X − G. Nach Definition ist OG (n) = GL(n, R) ∩ Ψ −1 (0). Um die totale Ableitung dΨ E im Punkt X = E zu berechnen, betrachten wir ein beliebiges H ∈ Rn×n . Man hat:
B
Lineare L IE-Gruppen und allgemeine L IE-Gruppen
179
d Ψ (E + t H ) dt t=0 d T [t (H G + G H ) + t 2 H T G H ] = dt t=0
dΨ E (H ) =
= H T G + G H. Setze nun W := Bild dΨ E = {H T G + G H | H ∈ Rn×n } und d := dim W . Im n 2 -dimensionalen H ILBERTraum Rn×n haben wir den orthogonalen Projektor P auf W , und wir setzen Φ := P ◦ Ψ . Nach der Kettenregel ist dΦ E = P ◦ dΨ E , also Bild dΦ E = W und somit rang E Φ = d maximal. Daraus folgt rang X Φ = d in einer offenen Umgebung U0 ⊆ GL(n, R) von E, weil die Unterdeterminanten der JACOBImatrix stetig vom Punkt X abhängen. Für die Einschränkung Φ 0 := Φ U : U0 −→ W 0
bedeutet dies, dass der Nullvektor von W ein regulärer Wert ist, und somit zeigt Theorem 1.21, dass M1 := U0 ∩ Φ −1 (0) eine Untermannigfaltigkeit der Dimension k := n 2 − d von U0 ist. Offenbar ist U0 ∩ OG (n) ⊆ M1 . Andererseits betrachten wir den linearen Unterraum V := Kern dΨ E = {H ∈ Rn×n | H T G + G H = 0} sowie die Menge M0 := exp(V ). Zunächst zeigen wir: M0 ⊆ OG (n).
(∗)
Dazu betrachten wir die Kurve Y (t) := et H , 0 ≤ t ≤ 1 für ein H ∈ V . Es ist d d t HT t H Ge Ψ (Y (t)) = e dt dt T
= et H (H T G + G H )et H = 0 und somit Ψ (Y (1)) = Ψ (Y (0)) = 0. Dies zeigt, dass Y (1) = exp H ∈ OG (n), wie behauptet. Nach Satz 19.2 hat die Null in Rn×n eine offene Umgebung Ω mit U1 := exp(Ω) ⊆ U0 , für die exp Ω ein Diffeomorphismus Ω → U1 ist. Dann ist
180
19 L IE-Gruppen und L IE-Algebren
U1 ∩ M0 = exp(Ω ∩ V ) eine Untermannigfaltigkeit von U1 , und zwar von der Dimension k, denn nach der Dimensionsformel aus der linearen Algebra (vgl. etwa [34], Kap. 7) ist dim V = n 2 − dim Bild dΨ E = n 2 − d = k. Aber wegen (∗) ist U1 ∩ M0 ⊆ U1 ∩ OG (n) ⊆ M1 .
(∗∗)
Die Menge U1 ∩ M0 ist also eine k-dimensionale Untermannigfaltigkeit der kdimensionalen Mannigfaltigkeit M1 und daher eine offene Teilmenge. Somit hat der Punkt E eine offene Umgebung U2 ⊆ U1 mit U2 ∩ M0 = U2 ∩ M1 , und wegen (∗∗) ist dann auch U2 ∩ OG (n) = U2 ∩ M1 . Ein Flachmacher für M1 um E liefert daher (nach etwaiger Verkleinerung seines Definitionsbereiches) auch einen Flachmacher h 0 für OG (n) um E, wie gewünscht. Da also OG (n) in U2 durch die Gleichung Φ(X ) = 0 gegeben ist, ergibt sich der Tangentialraum in E zu TE OG (n) = Kern dΦ E = Kern dΨ E = V . Auch die SL(n, C) und die Gruppen G-orthogonaler (bzw. G-unitärer) Transformationen mit Determinante 1 sind lineare L IE-Gruppen, wie wir weiter unten sehen werden (vgl. Korollar 19.12). 2 Wenn man statt Untermannigfaltigkeiten von Kn allgemeine differenzierbare Mannigfaltigkeiten betrachtet, gelangt man zum allgemeinen Begriff der L IEGruppe. Dieser wurde schon in Kap. 1 (Aufgabe 1.10) gestreift, und wir wiederholen ihn hier: Definition 19.6 Eine L IE-Gruppe ist eine Gruppe G, die gleichzeitig die Struktur einer differenzierbaren Mannigfaltigkeit trägt, und bei der die Gruppenverknüpfung G × G −→ G , (g, h) −→ gh sowie die Inversenbildung G −→ G , g −→ g −1 differenzierbare Abbildungen sind. Die Mannigfaltigkeits-Struktur auf G × G ist dabei die in Beispiel 1.17e beschriebene. Man kann leicht nachprüfen, dass jede lineare L IE-Gruppe auch eine L IE-Gruppe in diesem allgemeinen Sinn ist (Übung!) Zum Nachweis der Differenzierbarkeit der Inversenbildung benutzt man dabei am besten die C RAMERsche Regel.
C
Die L IE-Algebra einer L IE-Gruppe
181
Anmerkung 19.7 Ein (nicht ganz leicht zu beweisender!) Satz von E. C ARTAN besagt: Jede abgeschlossene Untergruppe einer L IE-Gruppe ist auch eine Untermannigfaltigkeit und damit selbst eine L IE-Gruppe. Ein Beweis hierfür findet sich z. B. in [51] oder [61]. Insbesondere ist also jede abgeschlossene Untergruppe von GL(n, K) eine lineare L IE-Gruppe. Durch Verwendung dieses Satzes kann man daher ohne jede Rechenarbeit bestätigen, dass die klassischen Gruppen sämtlich L IE-Gruppen sind, doch wäre das nicht sehr instruktiv.
Kartesische Produkte Sind G1 , G2 zwei L IE-Gruppen, so hat man auf dem kartesischen Produkt G = G1 × G2 einerseits die Struktur der Produktmannigfaltigkeit (Beispiel 1.17e), andererseits die Gruppenverknüpfung des direkten Produkts (Aufgabe 17.2), und man überzeugt sich leicht, dass diese zusammen wieder eine L IE-Gruppe bilden. Analog kann man das Produkt von beliebig (aber endlich) vielen L IE-Gruppen definieren. Sind G1 , G2 lineare L IE-Gruppen, so kann man auch ihr Produkt als lineare L IEGruppe auffassen, indem man (X 1 , X 2 ) ∈ G1 × G2 mit der Block-Diagonalmatrix X=
X1 0 0 X2
identifiziert. Für mehr als zwei lineare L IE-Gruppen gilt Analoges.
Kompakte L IE-Gruppen Eine L IE-Gruppe heißt kompakt, wenn die zu Grunde liegende Mannigfaltigkeit kompakt ist. Wie wir noch sehen werden, kommt diesem Typ von Gruppen besondere Bedeutung zu. Eine Matrixgruppe G ist offenbar genau dann kompakt, wenn G eine beschränkte abgeschlossene Teilmenge von Kn×n ist. Die klassischen Gruppen sind offenbar abgeschlossen, da sie durch Gleichungen wie etwa X T G X = G oder det X = 1 gegeben sind. Beschränkt – und damit kompakt – sind die orthogonalen und die unitären Gruppen, denn aus X ∗ X = E folgt Spur (X ∗ X ) = n, und diese Spur ist gerade das Quadrat der euklidischen Norm auf Cn×n (vgl. Bemerkung (i) nach Satz 18.12). Die Argumentation im reellen Fall ist analog. Jedoch ist die L ORENTZgruppe oder die Gruppe der euklidischen Bewegungen nicht kompakt.
C Die L IE-Algebra einer L IE-Gruppe Wichtig ist, dass der Tangentialraum TE (G) an eine L IE-Gruppe G in E nicht nur ein Vektorraum ist, sondern eine zusätzliche algebraische Struktur trägt. Diese wollen wir nun zunächst in allgemeinem Rahmen definieren.
182
19 L IE-Gruppen und L IE-Algebren
Definition 19.8 Eine L IE-Algebra L über K ist ein K-Vektorraum mit einem sogenannten L IE-Produkt L × L −→ L , (A, B) −→ [A, B] , das folgende Eigenschaften hat: a. Linearität in beiden Faktoren: [A, λB + μC] = λ [A, B] + μ [ A, C] , [λA + μB, C] = λ [A, C] + μ [B, C] .
(19.10)
b. Antikommutativität: [A, B] = − [B, A] .
(19.11)
[A, [B, C]] + [C, [A, B]] + [B, [C, A]] = 0.
(19.12)
c. JACOBI-Identität:
Bemerkung Statt (19.11) für alle A, B ∈ L zu fordern, fordert man oft [A, A] = 0 ∀ A ∈ L .
(19.13)
Wegen der Bilinearität (19.10) sind beide Forderungen äquivalent (Übung!). Beispiele 19.9 a. Kn×n mit dem Kommutatorprodukt [A, B] := AB − B A
(19.14)
ist eine L IE-Algebra. b. Allgemeiner wird jede K-Algebra (d. h. jeder K-Vektorraum, der mit einer bilinearen und assoziativen Multiplikation versehen ist – vgl. Definition 15.12a) zu einer L IE-Algebra, indem man das Kommutatorprodukt [x, y] := x y − yx einführt. c. Sei M eine differenzierbare Mannigfaltigkeit und Γ (T M) der Raum der differenzierbaren Vektorfelder auf M. Mit der L IEklammer von Vektorfeldern als Klammerprodukt bildet Γ (T M) eine L IE-Algebra, wie wir schon in Satz 3.29 gesehen haben.
C
Die L IE-Algebra einer L IE-Gruppe
183
d. Sei (M, ω) eine symplektische Mannigfaltigkeit. Die P OISSONklammer macht dann C ∞ (M) zu einer L IE-Algebra, wie aus Satz 6.30 und Korollar 6.32 hervorgeht. e. R3 mit dem Vektorprodukt [v, w] := v × w ist eine L IE-Algebra. f. Sei L eine beliebige L IE-Algebra. Ein linearer Teilraum M von L wird L IETeilalgebra genannt, wenn gilt: A, B ∈ M
⇒
[A, B] ∈ M.
Dann bildet M offenbar für sich schon eine L IE-Algebra, wenn das in L definierte Klammerprodukt verwendet wird.
Das erste dieser Beispiele ist für uns das wichtigste, wie der nächste Satz zeigen wird. Dabei – und auch im gesamten weiteren Verlauf – ist zu beachten, dass wir bei einer linearen L IE-Gruppe G ⊆ Kn×n nicht zwischen den abstrakten Tangentialräumen TX G und den Räumen TXunt G unterscheiden werden (vgl. die Diskussion vor den Definitionen 1.23). Ein Element H ∈ Kn×n gehört also genau dann zu TX G, wenn H = α(0) ˙ ist für eine C ∞ -Kurve α :] − ε, ε[−→ G mit α(0) = X . Jede derartige Kurve repräsentiert den Tangentialvektor H . Theorem 19.10 Sei G eine lineare L IE-Gruppe. Dann ist der Tangentialraum TE (G) bezüglich des Kommutatorprodukts eine L IE-Algebra, die sogenannte L IEAlgebra L(G) von G. Beweis Es ist zu zeigen, dass für beliebige Tangentenvektoren A, B ∈ TE (G) der Kommutator [A, B] = AB − B A ebenfalls ein Tangentenvektor ist. Seien also α(t), β(t) Kurven die A bzw. B repräsentieren. Dann betrachten wir die Abbildung γ (s, t) := α(t)β(s)α(t)−1 ,
s, t ∈] − ε, ε[ .
(19.15)
Für jedes feste t ist γ (0, t) = E, also ist C(t) :=
∂γ −1 ˙ (0, t) = α(t)β(0)α(t) = α(t)Bα(t)−1 ∂s
ein Vektor aus TE G. Da TE G ein abgeschlossener linearer Teilraum von Kn×n ist (Satz 7.10b), gehört also auch
184
19 L IE-Gruppen und L IE-Algebren
C(t) − B ˙ C(0) = lim t→0 t t =0 d α(t)−1 t=0 = −A, wie sich sofort ergibt, wenn man die Gleichung dt ≡ E bei t = 0 differenziert. Daher folgt
zu TE G. Aber α(t)α(t)−1
dα −1 dα ˙ (0)Bα(0)−1 + α(0)B (0) = AB − B A C(0) = dt dt und somit [A, B] ∈ TE G.
Der folgende Satz gibt den Zusammenhang zwischen einer linearen L IE-Gruppe G und ihrer L IE-Algebra L(G) präzise wieder: Theorem 19.11 Sei G ≤ GL(n, K) eine lineare L IE-Gruppe. a. Eine Matrix A ∈ Kn×n gehört genau dann zu L(G), wenn für geeignetes ε > 0 et A ∈ G ist für alle t ∈] − ε, ε[. Dann ist sogar et A ∈ G für alle t ∈ R. b. Die Exponentialabbildung liefert einen Diffeomorphismus einer Umgebung der Null in L(G) auf eine Umgebung der Eins in G. c. Die differenzierbaren Kurven Φ : R → G mit der Eigenschaft Φ(s + t) = Φ(s)Φ(t) = Φ(t)Φ(s)
∀ s, t ∈ R
(19.16)
sind genau die Kurven der Form Φ(t) = exp t A
mit A ∈ L(G).
(19.17)
Man nennt sie die Ein-Parameter-Untergruppen von G. Beweis ˙ = A, also a. Sei α(t) := et A ∈ G für |t| < ε. Dann ist α(0) = E und α(0) A ∈ TE G = L(G). Ferner kann man zu beliebigem t ∈ R ein m ∈ N so wählen, dass |t/m| < ε ist, und dann folgt et A = (e(t/m)A )m ∈ G, weil es sich um eine Gruppe handelt. Nun sei umgekehrt ein A ∈ L(G) gegeben, etwa A = α(0) ˙ mit α(0) = E. Für ˙ beliebiges X ∈ G und β(t) := α(t)X haben wir dann β(0) = X und β(0) = AX , also AX ∈ TX G. Durch v(X ) := AX
C
Die L IE-Algebra einer L IE-Gruppe
185
ist demzufolge auf der Mannigfaltigkeit G ein differenzierbares Vektorfeld gegeben. Nach Theorem 3.22 hat dieses Vektorfeld für jeden Anfangspunkt X ∈ G eine Integralkurve γ X :] − ε, ε[→ G. Das bedeutet insbesondere, dass Y = γ E (t) , |t| < ε eine in G verlaufende Lösung des Anfangswertproblems Y˙ = AY ,
Y (0) = E
ist. Aber dieses Problem hat nach Theorem 19.1 in Kn×n die eindeutige Lösung Y (t) = et A . Für |t| < ε ist mithin et A = γ E (t) ∈ G. b. Sei m := dim G = dim L(G), und sei U0 eine Umgebung der Null in Kn×n , auf der die Exponentialabbildung ein Diffeomorphismus ist (Satz 19.2). Da L(G)∩U0 eine m-dimensionale Teilmannigfaltigkeit von U0 ist, ist ihr Bild V0 := exp(L(G) ∩ U0 ) eine m-dimensionale Teilmannigfaltigkeit von GL(n, K). Wir wählen U0 o. B. d. A. als Kugel, so dass A ∈ L(G)∩U0 ⇒ t A ∈ L(G)∩U0 für |t| ≤ 1. Nach Teil a ist dann V0 ⊆ G, d. h. V0 ist eine m-dimensionale Teilmannigfaltigkeit der m-dimensionalen Mannigfaltigkeit G und damit eine offene Teilmenge. c. Jede Kurve der Form (19.17) verläuft nach Teil a in G und erfüllt (19.16) nach Theorem 19.1c Ist umgekehrt Φ : R → G eine differenzierbare Kurve, die ˙ (19.16) erfüllt, so ist A := Φ(0) ∈ L(G) sowie ˙ Φ(t) =
d ˙ Φ(s + t) = Φ(0)Φ(t) = AΦ(t) ds s=0
für alle t. Ferner ist Φ(0) = E (man setze s = t = 0 in (19.16)!), und damit folgt Φ(t) = et A aus Theorem 19.1a. Korollar 19.12 Ist G ≤ GL(n, K) eine lineare L IE-Gruppe, so ist auch SG := {X ∈ G | det X = 1} eine lineare L IE-Gruppe, und es gilt L(SG) = {A ∈ L(G) | Spur A = 0}.
Beweis Wegen des Determinanten-Multiplikationssatzes ist klar, dass SG eine Untergruppe von G ist. Wie wir zu Beginn des Beweises von 19.5 gesehen haben, genügt es zum Nachweis der Untermannigfaltigkeits-Eigenschaft, einen Flachmacher für SG um den Punkt X = E zu finden. Dazu setzen wir U1 := exp(U0 ), wo U0 eine offene Kugel um Null ist, auf der die Exponentialabbildung ein Diffeomorphismus ist. Dabei wählen wir U0 so klein, dass |Im Spur A| < π ist für alle A ∈ U0 . Der auf U1 definierte Logarithmus ist dann ein Diffeomorphismus, und wegen Theorems 19.1e und 19.11b bildet dieser Diffeomorphismus die Menge U1 ∩ SG auf
186
19 L IE-Gruppen und L IE-Algebren
U0 ∩ {A ∈ L(G) | Spur A = 0} ab, ist also ein Flachmacher der gesuchten Art. Damit folgen beide Behauptungen. Damit haben wir für alle in Abschn. B aufgezählten Matrixgruppen den Beweis erbracht, dass sie lineare L IE-Gruppen sind. Aufgrund von Satz 19.5 und Korollar 19.12 können wir insbesondere die L IEAlgebren der klassischen linearen L IE-Gruppen charakterisieren, wobei das L IEProdukt immer das Kommutatorprodukt [A, B] = AB − B A ist: Korollar 19.13 (L IE-Algebren der klassischen Gruppen) a. gl(n, K) ≡ L(GL (n, K)) = Kn×n , b. sl(n, K) = L(SL (n, K)) = {A ∈ Kn×n | Spur A = 0}, c. u(n) = L(U(n)) = {B ∈ Cn×n | B ∗ = −B}, d. su(n) = L(SU(n)) = {B ∈ Cn×n | B ∗ = −B, Spur B = 0}, e. o(n) = L(O(n)) = so(n) = L(SO(n)) = {B ∈ Rn×n | B T = −B}. In den Anwendungen der L IE-Theorie ist es oft wichtig, eine L IE-Gruppe – zumindest lokal – als parameterabhängige Schar von Transformationen aufzufassen. Solche lokalen Parametrisierungen können mit Hilfe der Exponentialabbildung leicht gewonnen werden: Korollar 19.14 Sei G eine m-dimensionale lineare L IE-Gruppe und X 0 ∈ G fest. Ferner sei {B1 , . . . , Bm } eine Basis des Vektorraums L(G). Durch
C
Die L IE-Algebra einer L IE-Gruppe
187
Φ(t1 , . . . , tm ) := X 0 exp
m
tk Bk
(19.18)
k=1
und Ψ (t1 , . . . , tm ) := X 0 (exp t1 B1 )(exp t2 B2 ) · · · (exp tm Bm )
(19.19)
sind dann lokale Parametrisierungen der Mannigfaltigkeit G bei X 0 gegeben. Beweis Da Linksmultiplikation mit X 0 einen Diffeomorphismus liefert, genügt es wieder, den Punkt X 0 = E zu betrachten. Die Behauptung folgt dann für Φ direkt aus Theorem 19.11b. Für Ψ sieht man sofort, dass die JACOBImatrix im Nullpunkt des Rm maximalen Rang hat, denn offenbar ist ∂Ψ (0, . . . , 0) = B j , ∂t j
j = 1, . . . , m,
und die B j sind linear unabhängig.
Bemerkung Die in den Sätzen 18.3, 18.8, 18.10 sowie in Definition 18.11 vorge↑ stellten Parametrisierungen der Gruppen SO(3) , SU(2) , SL(2, C) und L + sind Spezialfälle von (19.19). Bei diesen Gruppen tritt jedoch die Besonderheit auf, dass die lokalen Parametrisierungen in Wirklichkeit sogar global sind, d. h. die gesamte Gruppe erfassen. 19.15 Ausblick: L IE-Algebra und Exponentialabbildung bei allgemeinen L IE-Gruppen Alles bisher Besprochene gilt sinngemäß auch für allgemeine L IE-Gruppen G – man muss nur die L IE-Algebra g ≡ L(G) sowie die Exponentialabbildung exp : g → G in geeigneter Weise definieren. Unser Beweis von Theorem 19.11a gibt einen Fingerzeig, wie dies geschehen kann: Man ersetzt einen Tangentenvektor A ∈ Te G (e das Einselement der Gruppe G) durch das Vektorfeld, das entsteht, wenn man A mittels Linksmultiplikation in die Tangentialräume an beliebigen Gruppenelementen verschiebt. Für Vektorfelder ist ein Klammerprodukt erklärt (Beispiel 19.9c), und die Exponentialabbildung gewinnt man durch die Flüsse zu diesen Vektorfeldern. Genauer: Für jedes g ∈ G ist die Linksmultiplikation λg : G −→ G , x −→ gx ein Diffeomorphismus. Daher operiert G von links auf der L IE-Algebra Γ T G, indem man setzt g · v := (λg )∗ v
für g ∈ G , v ∈ Γ T G,
188
19 L IE-Gruppen und L IE-Algebren
wobei die rechte Seite im Sinne von Definition 3.25 zu verstehen ist. Die Menge der G-invarianten Vektorfelder, also g˜ := {v ∈ Γ T G | g · v = v ∀ g ∈ G} ist dann wegen Satz 3.29e eine L IE-Teilalgebra von Γ T G, d. h. v, w ∈ g˜ ⇒ [v, w] ∈ g˜ . Die G-Invarianz eines Vektorfelds v ∈ g˜ bedeutet offenbar explizit, dass v(gx) = d(λg )x (v(x))
für alle g, x ∈ G,
also ist v durch seinen Wert A = v(e) beim Einselement e schon eindeutig festgelegt. Es ist nämlich v(g) = d(λg )e (A) ,
g ∈ G,
(19.20)
und bei gegebenem Tangentialvektor A ∈ g = Te G definiert diese Gleichung auch ein G-invariantes Vektorfeld v ≡ v A . Demzufolge ist die lineare Abbildung g˜ −→ g , v −→ v(e) bijektiv, und wir können sie benutzen, um die auf g˜ gegebene L IE-Klammer nach g zu übertragen: Für A, B ∈ g setzen wir %
& & % A, B := v A , v B (e)
(19.21)
mit v A (g) := d(λg )e (A) ,
v B (g) := d(λg )e (B).
Um für A ∈ g das Exponential exp A ∈ G zu definieren, betrachtet man den Fluss zu dem durch (19.20) gegebenen Vektorfeld v ≡ v A . Die G-Invarianz von v A führt dazu, dass für die Integralkurve α A durch e die folgende Beziehung gilt: α A (s + t) = α A (s)α A (t) = α A (t)α A (s).
(19.22)
Hieraus folgert man, dass die Integralkurve für alle t ∈ R definiert ist und dass (19.22) auch für alle s, t ∈ R gilt. Die Kurve α = α A ist somit ein Gruppenhomomorphismus α : R −→ G, und man nennt solch einen (differenzierbaren) Gruppenhomomorphismus eine Ein-Parameter-Untergruppe von G. Ist umgekehrt α irgendeine Ein-ParameterUntergruppe, so setzt man A := α(0), ˙ und dann ist A ∈ Te G = g sowie α = α A .
C
Die L IE-Algebra einer L IE-Gruppe
189
Die Ein-Parameter-Untergruppen von G sind somit genau die Integralkurven durch e der G-invarianten Vektorfelder. Nach diesen Betrachtungen dürfte es einleuchten, dass exp A := α A (1)
für A ∈ g
die richtige Definition für die Exponentialabbildung ist und dass die so definierte Abbildung exp : g → G die meisten Eigenschaften der Exponentialfunktion von Matrizen teilt. Einzelheiten hierüber findet man natürlich in jedem mathematischen Lehrbuch über L IE-Gruppen, aber auch in physikorientierten Werken wie [28, 33, 62, 85].
Die Zusammenhangskomponente der Eins und der Wertebereich der Exponentialabbildung Im folgenden betrachten wir eine L IE-Gruppe G, wobei es für unsere Zwecke genügt, an eine lineare L IE-Gruppe zu denken, doch ist diese Beschränkung eigentlich nicht erforderlich. Wir wollen das schon im vorigen Kapitel beobachtete Phänomen, dass G in mehrere zusammenhängende Teile zerfallen kann, etwas systematischer untersuchen. Satz 19.16 Sei G0 die Menge der X ∈ G, die innerhalb von G durch eine stetige Kurve mit der Eins E verbunden werden können. (Man nennt G0 die Zusammenhangskomponente der Eins.) Ferner sei W := exp(L(G)) der Wertebereich der Exponentialabbildung. Es gilt dann: a. G0 ist eine offene Untergruppe von G und damit ebenfalls eine L IE-Gruppe. b. W ⊆ G0 , und G0 wird von W erzeugt, d. h. jedes Element von G0 kann als Produkt von endlich vielen Elementen von W dargestellt werden. c. L(G0 ) = L(G).
Beweis a. Nach Theorem 19.11b. umfasst W eine Umgebung U von E. Betrachte ein X 0 ∈ G0 . Die Menge U0 := X 0 U = {X 0 Y | Y ∈ U} ist dann eine Umgebung von X 0 . Ein Punkt X = X 0 exp A ∈ U0 kann durch die Kurve C(t) := X 0 exp ((1 − t)A) ,
0≤t ≤1
190
19 L IE-Gruppen und L IE-Algebren
mit X 0 verbunden werden, und X 0 kann nach Voraussetzung mit E verbunden werden. Also ist auch X ∈ G0 , d. h. wir haben U0 ⊆ G0 , und somit ist G0 eine offene Teilmenge von G. Um zu zeigen, dass G0 eine Untergruppe ist, betrachten wir zwei Elemente X i , i = 0, 1 von G0 und verbinden diese durch Kurven Ci (t) , 0 ≤ t ≤ 1 mit E. Dann ist C(t) := C0 (t)C1 (t) ,
0≤t ≤1
eine stetige Kurve, die X 0 X 1 mit E verbindet. Ferner verbindet die Kurve B(t) := C0 (t)−1 ,
0≤t ≤1
das Element X 0−1 mit E. Somit gehören X 0 X 1 und X 0−1 wieder zu G0 , was zu zeigen war. b. Die Aussage W ⊆ G0 ist klar, denn X = exp A wird durch die Kurve C(t) := exp ((1 − t)A) , 0 ≤ t ≤ 1 mit der Eins verbunden. Nun betrachten wir die Menge G1 aller endlichen Produkte von Elementen von W . Wie in Teil a. für G0 geschehen, prüft man leicht nach, dass G1 eine offene Untergruppe ist. Dabei ist G1 ≤ G0 wegen W ⊆ G0 . Nach Aufgabe 17.8b. kann man G0 dann als disjunkte Vereinigung von Links-Nebenklassen schreiben, also G0 = G1 ∪
X i G1
i∈I
mit einer geeigneten Indexmenge I , wobei X i ∈ G1 für alle i. Da die Linksmultiplikation mit einem festen Element immer ein Homöomorphismus ist, ist auch jede Nebenklasse X i G1 offen, und da die Vereinigung von offenen Mengen stets offen ist, muss die Menge H := G0 \G1 offen sein. Die Behauptung ist offenbar äquivalent zu H = ∅, und wir werden jetzt die gegenteilige Annahme zum Widerspruch führen. Angenommen also, wir hätten ein X ∈ H ⊆ G0 . Wir verbinden X mit E durch eine stetige Kurve C und beachten, dass diese Kurve nach Definition von G0 innerhalb von G0 verläuft und dass C(1) = E ∈ G1 ist. Setze t1 := inf{t ∈ [0, 1] | C(t) ∈ G1 }. Das Element C(t1 ) muss entweder in G1 oder in H liegen. Ist C(t1 ) ∈ G1 , so ist t1 > 0, denn C(0) = X ∈ H . Aber G1 ist offen und C ist stetig, also gibt es δ > 0 so, dass C(t) ∈ G1 für t1 − δ < t ≤ t1 , und das steht im Widerspruch zur Definition von t1 . Ist andererseits C(t1 ) ∈ H , so ist t1 < 1, und da H offen und C stetig ist, ist C([t1 , t1 + δ[) ⊆ H für geeignetes δ > 0. Aber auch dies steht im Widerspruch zur Definition von t1 , und folglich muss H = ∅ sein. c. ist klar wegen W ⊆ G1 und Theorem 19.11a.
C
Die L IE-Algebra einer L IE-Gruppe
191
Jedes X ∈ G0 kann also in der Form X = (exp A1 )(exp A2 ) · · · (exp Am ) mit A1 , . . . , Am ∈ L(G) = L(G0 ) geschrieben werden. Dies verallgemeinert die im vorigen Kapitel für einige spezielle Gruppen angegebenen Darstellungen von Gruppenelementen durch Produkte von „Generatoren“ auf beliebige zusammenhängende L IE-Gruppen. Jedoch haben wir bei dieser Verallgemeinerung kein allgemeingültiges Rechenverfahren, mit dem man die Zahl m oder gar die A j bestimmen könnte. Die Sätze aus dem vorigen Kapitel liefern hier (für die betrachteten speziellen Gruppen!) wesentlich detailliertere Informationen. Bemerkung Manchmal ist die Frage interessant, ob W = G0 ist, ob also jedes Gruppenelement, das durch irgendeine stetige Kurve mit der Eins verbunden werden kann, schon von der Form exp A ist, so dass man als verbindende Kurve speziell C(t) = exp ((1 − t)A) , 0 ≤ t ≤ 1 wählen kann. Dies ist z. B. der Fall, wenn G abelsch ist, denn dann ist (exp A1 )(exp A2 ) · · · (exp Am ) = exp A mit A = A1 + · · · + Am ∈ L(G). Es kommt aber durchaus vor, dass W eine echte Teilmenge von G0 ist (Aufgabe 19.9). Die tieferliegende Strukturtheorie der L IE-Gruppen zeigt jedoch, dass bei kompakten L IE-Gruppen wieder W = G0 gilt (vgl. z. B. die Konsequenzen aus dem Hauptsatz über maximale Tori in [12]).
L IE-Untergruppen und L IE-Teilalgebren Sei G eine (lineare) L IE-Gruppe mit dem neutralen Element e, g = L(G) ihre L IE-Algebra. In praktisch jedem mathematischen Lehrbuch über L IE-Gruppen wird bewiesen, dass zwischen den L IE-Teilalgebren von g und den zusammenhängenden L IE-Untergruppen von G eine bijektive Korrespondenz besteht. Wir wollen das hier nicht beweisen, jedoch erläutern, denn es gibt dabei einige Feinheiten zu beachten. Sei also H ≤ G eine Untergruppe. Ist H abgeschlossen, so ist H auch eine Untermannigfaltigkeit (Anmerkung 19.7), also selbst eine L IE-Gruppe, und dann sieht man wie in Theorem 19.10, dass h := Te H eine L IE-Teilalgebra von g ist, und wie in Theorem 19.11a sieht man, dass h = {A ∈ g | exp t A ∈ H ∀ t ∈ R}
(19.23)
gilt. Es gibt jedoch i. A. noch weitere zusammenhängende Untergruppen H von G, für die durch (19.23) eine L IE-Teilalgebra von g definiert wird. Wir betrachten dazu ein einfaches, aber typisches Beispiel: Beispiel 19.17 Sei T2 := U(1) × U(1) der zweidimensionale Torus. Seine L IEAlgebra ist g = iR × iR ∼ = R2 mit dem Klammerprodukt [v, w] ≡ 0 (vgl. Aufga-
192
19 L IE-Gruppen und L IE-Algebren
be 19.5a). Daher ist jede Gerade durch den Ursprung in R2 eine L IE-Teilalgebra. Zu ν ∈ R betrachten wir die Gerade hν , die vom Vektor (1, ν) aufgespannt wird, sowie die Untergruppe Sν := exp (hν ) = Bild ϕν mit dem Gruppenhomomorphismus ϕν : R −→ T2 , t −→ (eit , eiνt ) . Da eit = 1 nur für t/2π ∈ Z eintritt, folgert man leicht, dass ν ∈ Q sein muss, falls es Zahlen t1 = t2 gibt, für die ϕν (t1 ) = ϕν (t2 ) ist. Für irrationales ν ist der Homomorphismus ϕν also injektiv. Überdies haben wir: Behauptung Ist ν irrational, so ist Sν dicht in T2 . Beweis Seien (eiα , eiβ ) ∈ T2 und ε > 0 beliebig. Nach Aufgabe 19.3d gibt es k ∈ Z so, dass |ei(β−να) − e2π ikν | < ε. Für t := α + 2π k liegt dann ϕν (t) in der ε-Umgebung des Punktes (eiα , eiβ ), denn für die erste Komponente ergibt sich eit = eiα e2π ik = eiα , und für die zweite Komponente |eiνt − eiβ | = |eiνα | · |e2π iνk − ei(β−να) | < ε. Wegen dieser Dichtigkeit kann Sν keine Untermannigfaltigkeit von T2 sein. Aber ϕν ist ein analytischer Gruppenisomorphismus der L IE-Gruppe (R, +) auf die Untergruppe Sν von T2 , und hν spielt offenbar die Rolle der L IE-Algebra dieser Untergruppe. Man kann sich die Situation gut anschaulich vorstellen, wenn man T2 wie in Aufgabe 19.5b mit einem Rotationstorus Tr,R identifiziert. Dieser sieht aus wie die Oberfläche eines glatten Reifens, und ϕν wickelt die reelle Gerade auf diesen Reifen auf. Ist ν irrational, so windet sich die Kurve t → ϕν (t) unendlich oft um den Reifen herum, ohne je in sich selbst zurückzulaufen. Die Teilraumtopologie (Definition 1.6) auf Sν ist dann auch deutlich verschieden von der Topologie der reellen Geraden. Eine typische Umgebung eines Punktes p ∈ Sν in der Teilraumtopologie ist nämlich der Schnitt von Sν mit einer kleinen Kreisscheibe auf der Oberfläche des Reifens (Abb. 19.1), und dieser besteht aus unendlich vielen getrennten, aber beliebig dicht nebeneinander liegenden Bögen. Man kann auf Sν jedoch eine neue
D
Einige spezielle L IE-Algebren
193
Abb. 19.1 Lokales Aussehen des Wertebereichs von ϕν bei irrationalem ν. Im linken Bild ist ein kürzeres, im rechten ein längeres Intervall mittels ϕν auf dem Torus aufgewickelt. Das Bild der gesamten reellen Geraden lässt sich nicht zeichnen, da die Parallelen beliebig dicht nebeneinander liegen müssten
Topologie einführen, indem man die Bilder der offenen Teilmengen von R unter ϕν als die offenen Mengen definiert. In dieser Topologie besteht eine typische Umgebung von p nur aus einem einzigen kurzen Bogen, der über p hinwegläuft (fett in Abb. 19.1). Auf jeder dieser neuen offenen Mengen ist ϕν−1 eine Karte, und die hierdurch definierte Struktur einer differenzierbaren Mannigfaltigkeit macht Sν in der Tat zu einer L IE-Gruppe, deren L IE-Algebra mit hν identifiziert werden kann. Um diesem Phänomen Rechnung zu tragen, definiert man: Definition 19.18 Eine Untergruppe H einer L IE-Gruppe G heißt L IE-Untergruppe, unter einem injektiven differenzierbaren wenn H das Bild einer L IE-Gruppe H Gruppenhomomorphismus ϕ : H → G ist. Für die so definierten L IE-Untergruppen gilt nun der anfangs erwähnte fundamentale Satz: Theorem 19.19 Bei jeder L IE-Gruppe G gibt es zwischen den zusammenhängenden L IE-Untergruppen H von G und den L IE-Teilalgebren h von g := L(G) eine bijektive Korrespondenz. Diese ordnet jeder L IE-Teilalgebra h ⊆ g das gruppentheoretische Erzeugnis H der Menge exp (h) zu, d. h. die Menge aller endlichen unter ϕ Produkte von Elementen von exp (h). Ist umgekehrt H ≤ G das Bild von H ) wie in Definition 19.18, so ist die entsprechende L IE-Teilalgebra das Bild von L( H unter de ϕ. Ferner wird sie durch (19.23) beschrieben. Bemerkung Manche Autoren bestehen darauf, dass eine L IE-Untergruppe eine Teilmannigfaltigkeit sein muss. Diese bezeichnen die in Definition 19.18 beschriebenen Untergruppen H als immersierte L IE-Gruppen.
D Einige spezielle L IE-Algebren Wir wollen die L IE-Algebren einiger Gruppen etwas genauer untersuchen. Dazu definieren wir zunächst algebraische Begriffe, die es gestatten, L IE-Algebren ihrer Struktur nach zu vergleichen oder zu beschreiben:
194
19 L IE-Gruppen und L IE-Algebren
Definitionen 19.20 a. Seien L1 , L2 beides L IE-Algebren über K. Eine lineare Abbildung ϕ : L1 −→ L2 heißt ein L IE-Algebren-Homomorphismus, wenn % & % & ϕ( A, B ) = ϕ(A), ϕ(B)
∀ A, B ∈ L1 .
(19.24)
Ist ϕ bijektiv, so heißt er ein Isomorphismus von L IE-Algebren. Die L IEAlgebren L1 , L2 heißen isomorph, wenn ein Isomorphismus L1 → L2 existiert. b. Sei L eine N -dimensionale L IE-Algebra über K, und sei (E 1 , . . . , E N ) eine Basis des Vektorraums L. Dann heißen die (eindeutig bestimmten!) Zahlen cikj mit %
&
Ei , E j =
N
cikj E k
(19.25)
k=1
die Strukturkonstanten von L bezüglich der Basis (E 1 , . . . , E N ). Die Tabelle der Strukturkonstanten legt eine L IE-Algebra bis auf Isomorphie fest: Satz 19.21 Zwei N -dimensionale L IE-Algebren L1 , L2 über K sind genau dann isomorph, wenn es Basen (E 1 , . . . , E N ) von L1 und (F1 , . . . , FN ) von L2 so gibt, dass %
N N & & % Ei , E j = cikj E k , Fi , F j = cikj Fk k=1
(19.26)
k=1
mit denselben Strukturkonstanten cikj ∈ K. Beweis Seien Basen gegeben, für die (19.26) gilt. Definiert man dann eine lineare Abbildung ϕ : L1 −→ L2 durch ϕ(E i ) := Fi ,
i = 1, . . . , N ,
so ist ϕ jedenfalls ein Vektorraum-Isomorphismus. Sind A=
ai E i ,
B=
i
bi E i ∈ L1 ,
i
so sind ϕ(A) =
i
sowie
ai Fi ,
ϕ(B) =
i
bi Fi
(19.27)
D
Einige spezielle L IE-Algebren
[A, B] = =
195
0 i
ai E i ,
1 % & b j E j = ai b j E i , E j
j
i, j
ai b j cikj E k
i, j,k
und daher
ϕ([A, B]) =
i jk
ai b j cikj Fk =
0
=
ai Fi ,
i
% & ai b j Fi , F j
i, j
1 b j F j = [ϕ(A), ϕ(B)] .
j
Ist umgekehrt ϕ : L1 → L2 ein Isomorphismus und sind cikj die Strukturkonstanten von L1 in Bezug auf eine Basis (E 1 , . . . , E N ) von L1 , so ist (F1 , . . . , FN ) mit F j := ϕ(E j ) , j = 1, . . . , N , eine Basis von L2 , und es gilt [Fi , F j ] = ϕ([E i , E j ]) = ϕ
cikj E k
k
=
cikj Fk ,
k
d. h. es gilt (19.26).
Nun beschreiben wir die L IE-Algebren näher, die zu den in Kap. 18 betrachteten Gruppen gehören. Dabei verwenden wir die dort eingeführten Bezeichnungen R j (α), S j (α), A j (α), B j (β) für spezielle Generatoren dieser Gruppen. Ferner ist (εi jk ) der übliche ε-Tensor. Satz 19.22 a. Die L IE-Algebra su(2) = L(SU(2)) besteht aus den Matrizen der Form B=
ix y + iz , −y + iz −ix
x, y, z ∈ R
(19.28)
und hat als R-Basis die infinitesimalen Generatoren S1 =
1 0 i , 2 i 0
S2 =
1 0 −1 , 2 1 0
S3 =
1 i 0 . 2 0 −i
(19.29)
Dabei ist Sj =
d S j (α) , α=0 dα
S j (α) = eα S j ,
(19.30)
196
19 L IE-Gruppen und L IE-Algebren
und es gelten die Vertauschungsrelationen %
3 & Si , S j = εi jk Sk .
(19.31)
k=1
b. Die L IE-Algebra so(3) = L(SO(3)) besteht aus den Matrizen der Form ⎛
⎞ 0 −z y B = ⎝ z 0 x⎠ , −y x 0
x, y, z ∈ R
(19.32)
und hat als R-Basis die infinitesimalen Generatoren ⎛
⎞ 00 0 R1 = ⎝0 0 −1⎠ , 01 0
⎛
⎞ 0 01 R2 = ⎝ 0 0 0⎠ , −1 0 0
⎛ ⎞ 0 −1 0 R3 = ⎝1 0 0⎠ . 0 0 0
(19.33)
Dabei ist Rj =
d R j (α) , α=0 dα
R j (α) = eα R j ,
(19.34)
und es gelten die Vertauschungsrelationen %
3 & εi jk Rk . Ri , R j =
(19.35)
k=1
c. su(2) und so(3) sind isomorphe L IE-Algebren. Beweis a. Nach Korollar 19.13 wissen wir B ∈ su(2)
⇐⇒
B ∈ C2×2 ,
B ∗ = −B, Spur B = 0.
Daraus ergibt sich sofort die Form (19.28). Offensichtlich sind S j ∈ su(2) und linear unabhängig. Die Formeln (19.30) und (19.31) rechnet man als Übung nach. b. Nach Korollar 19.13 wissen wir auch B ∈ so(3)
⇐⇒
B ∈ R3×3 ,
B T = −B,
woraus die Bauart (19.32) folgt. Die Beziehungen (19.33), (19.34) und (19.35) rechnet man nach.
D
Einige spezielle L IE-Algebren
197
c. folgt aus (19.31), (19.34) und Satz 19.21. Man beachte, dass die L IE-Algebren isomorph, die Gruppen nur epimorph sind. ↑ Für die L IE-Algebra L(L) = L(L + ) = L(L + ) der (eigentlichen orthochronen) L ORENTZgruppe liefert Satz 19.5 die Beschreibung ↑
B ∈ L(L + )
⇐⇒
B ∈ R4×4 , B T G = −G B,
(19.36)
wobei G die Matrix (18.1) ist. Wegen der Bauart von G führt dies auf folgende Gleichungen: bμμ = 0, 0 ≤ μ ≤ 3,
bμ0 = b0μ , 1 ≤ μ ≤ 3 ,
(19.37)
bμν = −bνμ , 1 ≤ μ, ν ≤ 3 , so dass wir folgende Aussage bekommen: ↑
Satz 19.23 Die 6-dimensionale reelle L IE-Algebra o(1, 3) = L(L + ) besteht aus den Matrizen der Form ⎛
0 ⎜u B=⎜ ⎝v w
u 0 z −y
v −z 0 x
⎞ w y ⎟ ⎟, −x ⎠ 0
u, v, w, x, y, z ∈ R
und hat als R-Basis die infinitesimalen Generatoren ⎛ ⎛ ⎛ ⎞ ⎞ 000 0 0 0 00 00 ⎜0 0 0 0 ⎟ ⎜0 0 0 1⎟ ⎜0 0 ⎜ ⎜ ⎟ ⎟ A1 = ⎜ ⎝0 0 0 −1⎠ , A2 = ⎝0 0 0 0⎠ , A3 = ⎝0 1 001 0 0 −1 0 0 00 ⎛
⎞ 0100 ⎜1 0 0 0 ⎟ ⎟ B1 = ⎜ ⎝0 0 0 0 ⎠ , 0000
⎛
⎞ 0010 ⎜0 0 0 0 ⎟ ⎟ B2 = ⎜ ⎝1 0 0 0 ⎠ , 0000
⎛
d dα
A j (α)
A j (α) = eα A j ,
α=0
,
Bj =
d dβ
B j (β) = eβ B j ,
und es gelten die Vertauschungsrelationen
0 −1 0 0
⎞ 0 0⎟ ⎟ 0⎠ 0
⎞ 0001 ⎜0 0 0 0 ⎟ ⎟ B3 = ⎜ ⎝0 0 0 0 ⎠ . 1000
Dabei ist Aj =
(19.38)
B j (β)
β=0
,
198
19 L IE-Gruppen und L IE-Algebren
%
3 & Ai , A j = εi jk Ak , k=1
%
3 & Bi , B j = − εi jk Ak , k=1
%
3 & Ai , B j = εi jk Bk . k=1
Alle diese Formeln rechnet man sofort nach. ↑ Nach Satz 18.15 ist die Gruppe SL(2, C) eine Überlagerungsgruppe von L + , ↑ d. h. es gibt einen analytischen Epimorphismus Λ : SL(2, C) −→ L + mit Kern (Λ) = {σ0 , −σ0 }. Nach Korollar 19.13b. gilt für die entsprechende L IEAlgebra B ∈ sl(2, C)
⇐⇒
B ∈ C2×2 , Spur B = 0.
Mit den Generatoren S j (α), K j (β) von SL(2, C) aus 18.11 bekommen wir dann: Satz 19.24 Die 6-dimensionale reelle L IE-Algebra sl(2, C) besteht aus den Matrizen der Form
a + ib x + iy B= , u + iv −a − ib
a, b, u, v, x, y ∈ R
und hat als R-Basis die infinitesimalen Generatoren S1 =
K1 =
1 2
1 2
0 i , S2 = i 0
1 2
01 , K2 = 10
0 −1 , S3 = 1 0
1 2
0 i , K3 = −i 0
1 2
1 2
i 0 , 0 −i
1 0 . 0 −1
Dabei ist Sj =
d dα
S j (α)
S j (α) = eα S j ,
α=0
,
Kj =
d dβ
K j (β)
K j (β) = eβ K j ,
und es gelten die Vertauschungsrelationen
β=0
,
Aufgaben
199
% % %
Si , S j
&
=
εi jk Sk ,
k
& K i , K j = − εi jk K k , Si , K j
&
=
k
εi jk K k .
k
d. h. die L IE-Algebren sl(2, C) und o(1, 3) sind isomorph.
Aufgaben zu Kap. 19 19.1 Sei G eine lineare L IE-Gruppe und H ≤ G eine Untergruppe. Man zeige, dass dann auch der Abschluss H eine Untergruppe ist. (Hinweis: Entscheidend ist, dass Multiplikation und Inversenbildung stetige Abbildungen sind.) Bemerkung Dies gilt – mit analogem Beweis – auch für allgemeine L IE-Gruppen. 19.2 a. Man zeige, dass die L ORENTZgruppe eine unbeschränkte Teilmenge von R16 darstellt und daher nicht kompakt ist. (Hinweis: Man betrachte die L ORENTZboosts aus Satz 18.7.) b. Man zeige, dass die Gruppen SL(n, K) und GL(n, K) nicht kompakt sind. c. Man zeige, dass die symplektische Gruppe Sp(2n) eine unbeschränkte Teilmenge des Raums der reellen 2n × 2n-Matrizen darstellt, also nicht kompakt ist. (Hinweis: Man verwende die speziellen symplektischen Matrizen aus Aufgabe 17.10.) 19.3 Wir identifizieren U(1) mit der Gruppe der komplexen Zahlen vom Betrag 1, wobei die Multiplikation komplexer Zahlen als Gruppenverknüpfung dient. Man zeige nacheinander: a. Die einzige unendliche abgeschlossene Untergruppe von U(1) ist U(1) selbst. (Hinweis: Ist H ≤ U(1) abgeschlossen und unendlich, so hat H nach B OLZANO W EIERSTRASS einen Häufungspunkt ζ0 ∈ H . Multiplikation mit ζ0−1 zeigt dann, dass es in jeder noch so kleinen Umgebung der Eins Elemente = 1 von H gibt. Deren Potenzen bilden insgesamt eine dichte Teilmenge von U(1), die ganz in H liegt.) b. Jede unendliche Untergruppe von U(1) ist dicht in U(1). (Hinweis: Aufgabe 19.1 verwenden!) c. Für jedes ν ∈ R bildet Hν := {e2π ikν | k ∈ Z} eine Untergruppe von U(1). d. Hν ist genau dann endlich, wenn ν eine rationale Zahl ist. Ist ν irrational, so ist Hν dicht in U(1).
200
19 L IE-Gruppen und L IE-Algebren
19.4 Sei G = G1 × G2 das Produkt zweier linearer L IE-Gruppen Gi , aufgefasst als Gruppe von Block-Diagonalmatrizen. a. Man zeige: Die L IE-Algebra L(G) besteht genau aus den Block-Diagonalmatrizen A=
A1 0 0 A2
mit
A1 ∈ L(G1 ) , A2 ∈ L(G2 ),
und die Exponentialabbildung ist gegeben durch
A1 0 exp 0 A2
0 exp A1 = . 0 exp A2
b. Man formuliere und beweise analoge Aussagen für zwei allgemeine L IEGruppen. (Hinweis: Man verwende Aufgabe 1.9, um Tangentialräume an G mit Produkten von Tangentialräumen an G1 , G2 zu identifizieren.)
19.5 Der n-dimensionale Torus ist die L IE-Gruppe Tn := U(1) × · · · × U(1) . 34 5 2 n-mal
a. Man zeige: L(Tn ) besteht aus den n × n-Diagonalmatrizen, deren Diagonalelemente sämtlich rein-imaginär sind. Sie kann also mit Rn identifiziert werden. b. Man gebe einen Diffeomorphismus von T2 auf den Rotationstorus Tr,R aus Aufgabe 1.4 an.
19.6 Man zeige: a. Die Mannigfaltigkeit Rn bildet zusammen mit der Addition als Gruppenverknüpfung eine L IE-Gruppe. Wir bezeichnen diese mit Vn („Gruppe der Verschiebungen“). b. Die invarianten Vektorfelder auf Vn sind genau die konstanten Vektorfelder auf Rn . c. Die L IE-Algebra L(Vn ) kann mit Rn identifiziert werden. Dabei ist das Klammerprodukt gegeben durch [v, w] = 0
für alle v, w ∈ Rn .
d. Die Exponentialabbildung exp : L(Vn ) → Vn ist die identische Abbildung Rn → Rn .
Aufgaben
201
e. Jedem v = (v1 , . . . , vn ) ∈ Rn ordnen wir die (n + 1) × (n + 1)-Matrix ⎛ 1 ... ⎜ .. . . ⎜ Φ(v) := ⎜ . . ⎝0 . . . 0 ...
⎞ v1 .. ⎟ .⎟ ⎟ 1 vn ⎠ 0 1 0 .. .
zu. Diese Matrizen sind invertierbar, und die dadurch definierte Abbildung Φ : Vn −→ GL(n + 1, R) ist ein injektiver Gruppenhomomorphismus. In diesem Sinn kann also Vn auch als Matrixgruppe aufgefasst werden. Bemerkung Analoge Aussagen gelten natürlich auch für Cn . 19.7 Sei G ≤ GL(n, R) eine lineare L IE-Gruppe und Vn die in Aufgabe 19.6 eingeführte n-dimensionale Verschiebungsgruppe. Man zeige: a. Auf EG := G × Vn ist durch (A, v) · (B, w) = (AB, Aw + v) eine Gruppenverknüpfung definiert. Was ist das neutrale Element dieser Gruppe? b. Die Gruppe EG operiert von links auf Rn durch die Vorschrift (A, v) · x := Ax + v
(19.39)
für A ∈ G , v ∈ Vn , x ∈ Rn . Die durch (A, v) definierte affine Transformation (19.39) bestimmt A und v eindeutig. Man kann EG daher als eine Gruppe von affinen Transformationen des Rn auffassen. c. Die Produktmannigfaltigkeit EG := G × Vn zusammen mit der Gruppenverknüpfung aus a. ist eine L IE-Gruppe. d. Die Abbildung Φ : EG −→ GL(n + 1, R) mit ⎛
a11 ⎜a21 ⎜ ⎜ Φ(A, v) := ⎜ ... ⎜ ⎝an1 0
⎞ v1 v2 ⎟ ⎟ .. ⎟ .⎟ ⎟ . . . ann vn ⎠ ... 0 1 ... ... .. .
a1n a2n .. .
mit A = (ai j ) , v = (v1 , . . . , vn )T
ist ein injektiver Gruppenhomomorphismus. Daher ist EG zu einer Matrixgruppe isomorph. (Hinweis: Am bequemsten ist es, mit linearen Abbildungen statt Matrizen zu rechnen. Dazu betrachte man die Abbildungen
202
19 L IE-Gruppen und L IE-Algebren
J : Rn −→ Rn+1 , (x1 , . . . , xn ) −→ (x1 , . . . , xn , 1), P : Rn+1 −→ Rn , (x1 , . . . , xn+1 ) −→ (x1 , . . . , xn ) und beachte, dass PΦ(A, v)J x = Ax + v.) e. Die Gruppe Elin G := Bild Φ ist eine Untermannigfaltigkeit von GL(n + 1, R), also eine lineare L IE-Gruppe. Der Gruppenisomorphismus Φ : EG −→ Elin G ist auch ein Diffeomorphismus. (Hinweis: Um Rechenarbeit einzusparen, verwende man den Satz aus Anmerkung 19.7.) f. Für G = O(n) ist EG, aufgefasst als eine Gruppe von affinen Transformationen, nichts anderes als die Gruppe En der euklidischen Bewegungen (Aufgaben 17.11 und 17.12). Man formuliere und beweise analoge Aussagen für den komplexen Fall. Bemerkung Ist n = 4 und G die L ORENTZgruppe, so ist EG die aus der Relativitätstheorie bekannte P OINCARÉgruppe. 19.8 a. Man zeige: Ist T = exp A mit einer reellen n × n-Matrix A, so ist die algebraische Vielfachheit eines jeden negativen reellen Eigenwertes von T eine gerade Zahl. (Hinweis: Man verwende die in Theorem 19.1 gegebene Beschreibung der Eigenwerte von e A und betrachte dabei die reellen und die nicht-reellen Eigenwerte von A getrennt.) b. Man folgere: Ist b > 0 und b = 1, so besitzt die Matrix T (b) :=
−b 0 0 −1/b
keinen reellen Logarithmus. 19.9 Es sei b > 0, aber b = 1. Wir betrachten die Matrix T (b) aus der vorigen Aufgabe. Man zeige: Für G = SL(2, R) liegt T (b) in der Zusammenhangskomponente der Eins, aber nicht im Wertebereich der Exponentialabbildung. (Hinweis: Man verbinde T (b) innerhalb von SL(2, R) zunächst mit −E und dann −E mit E.) 19.10 a. Sei V ein n-dimensionaler K-Vektorraum und End(V ), wie üblich, der Vektorraum der K-linearen Abbildungen V → V . Man zeige: Mit dem Kommutator [S, T ] := S ◦ T − T ◦ S als Klammerprodukt bildet End(V ) eine L IE-Algebra, und diese ist isomorph zu gl(n, K).
Aufgaben
203
b. Nun sei L eine beliebige n-dimensionale L IE-Algebra (also insbesondere ein n-dimensionaler Vektorraum!). Die adjungierte Darstellung von L ist definitionsgemäß die Abbildung ad : L −→ End(L) , a −→ [a, ·], d. h. für a ∈ L ist T = ad(a) der lineare Operator mit T x = [a, x] für x ∈ L. Man zeige, dass ad ein Homomorphismus von L IE-Algebren ist. (Hinweis: Hier ist die JACOBI-Identität wesentlich!) 19.11 Man zeige, dass die L IE-Algebra R3 aus Beispiel 19.9e zu so(3) und zu su(2) isomorph ist. 19.12 Sei M eine differenzierbare Mannigfaltigkeit und L = Γ (T M) die L IEAlgebra ihrer differenzierbaren Vektorfelder (Beispiel 19.9c). a. Man gebe mit Hilfe von Satz 3.27 einen Homomorphismus von L in die L IEAlgebra End(C ∞ (M)) aller linearen Operatoren C ∞ (M) → C ∞ (M) an. b. Nun sei G eine L IE-Gruppe mit dem Einselement e und m : M × G −→ M, ( p, g) −→ p · g eine differenzierbare Rechts-Operation von G auf M. Ähnlich wie in Aufgabe 6.5 ordnen wir jedem X ∈ L(G) ein Vektorfeld X ∈ Γ (M) zu, indem wir für jedes p ∈ M setzen: X ( p) := d(r p )e (X )
mit r p : G → M, g → p · g.
Man zeige: Die Abbildung L(G) −→ Γ (T M) , X −→ X ist ein Homomorphismus von L IE-Algebren. (Hinweis: Man benutze die Definition der L IE-Klammer von Vektorfeldern und beachte, dass der Fluss von X durch Φ(t, p) = p · exp(t X ) gegeben ist, zumindest in einer Umgebung von t = 0.) 19.13 Seien Rk , k = 1, 2, 3, die infinitesimalen Generatoren von so(3) gemäß (19.33) und seien Jk := i Rk ,
k = 1, 2, 3 ,
J+ := J1 + iJ2 ,
J− = J1 − iJ2 .
a. Man bestimme die Kommutatoren [Jk , Jl ] ,
1 ≤ k, l ≤ 3
204
19 L IE-Gruppen und L IE-Algebren
b. Man bestimme die Kommutatoren %
& J+ , J3 ,
%
& J− , J3 ,
%
& J+ , J− .
c. Man zeige J+∗ = J− ,
J−∗ = J+ .
19.14 Mit J1 , J2 , J3 , J+ , J− wie in 19.13 sei J 2 = J12 + J22 + J32 . Man zeige a. b. c.
J 2 = J J + J32 − J3 . % 2 &+ − J , L = 0 für alle L ∈ so(3). Man bestimme J 2 explizit. Ist J 2 ∈ so(3)?
19.15 a. Man bestimme die Eigenwerte und Eigenvektoren von J3 . b. Man zeige direkt mit den Vertauschungsrelationen: Ist X ∈ C3 ein Eigenvektor von J3 zum Eigenwert λ, so ist X + := J+ X
bzw. X − := J− X
ein Eigenvektor von J3 zum Eigenwert λ + 1 bzw. λ − 1, falls X + = 0 bzw. X − = 0. 19.16 Es sei E3 die Gruppe der euklidischen Bewegungen des dreidimensionalen Raums, also E3 = SO(3) × R3 als Mannigfaltigkeit. Wir identifizieren sie mit einer Gruppe Elin 3 von 4 × 4-Matrizen durch Verwendung des Isomorphismus Φ aus Aufgabe 19.7. Mit Hilfe der Translationen T j (t) := t e j ,
j = 1, 2, 3 , t ∈ R
und der Drehungen R j (t) aus Satz 18.3 definieren wir die folgenden Elemente der L IE-Algebra e3 := L(Elin 3 ): d (Φ(0, T j (t))) P j := , Dt t=0 d (Φ(R j (t), 0)) L j := Dt t=0 für j = 1, 2, 3.
Aufgaben
205
a. Man zeige, dass (P1 , P2 , P3 , L 1 , L 2 , L 3 ) eine Basis von e3 ist. b. Man bestimme die Matrizen P j , L j explizit. c. Man verifiziere die Vertauschungsrelationen [Pk , Pl ] = 0 , [L k , L l ] = εklm L m , m
[Pk , L l ] =
m
für k, l = 1, 2, 3.
εklm Pm
Kapitel 20
Grundbegriffe der Darstellungstheorie
Wie wir in Abschn. 17B gesehen haben, läuft die Diskussion von Symmetrien und Invarianzen stets darauf hinaus, eine Operation einer Gruppe G auf einer Menge Z zu untersuchen (wir betrachten o. B. d. A. nur Linksoperationen). Die dort angegebenen Beispiele machen schon klar, dass Z in vielen Fällen ein K-Vektorraum V ist und dass die Gruppenelemente als lineare Abbildungen operieren, d. h. man hat (L)
g · (αx + βy) = αg · x + βg · y
für x, y ∈ V , α, β ∈ K , g ∈ G .
Dann ist für jedes g ∈ G die Abbildung D(g) : V −→ V , x −→ g · x eine lineare Bijektion von V auf sich, gehört also zur Gruppe GL(V ) aller Vektorraum-Automorphismen von V . Die Rechenregeln (i), (ii) aus Definition 17.12 besagen nun, dass die hierdurch gegebene Abbildung D : G −→ GL(V ) ein Gruppenhomomorphismus ist, und solch einen Homomorphismus nennt man eine Darstellung von G auf V . Umgekehrt definiert jede Darstellung D : G −→ GL(V ) offenbar eine Linksoperation von G auf V , die Bedingung (L) erfüllt. Aufgabe der Darstellungstheorie ist es nun, zu untersuchen, wie eine gegebene Gruppe G auf Vektorräumen linear operieren kann.So gesehen, ist die Darstellungstheorie eine Verallgemeinerung der Spektraltheorie, denn bei der Spektraltheorie wird untersucht, wie ein linearer Operator T ∈ End(V ) auf den Vektorraum V wirkt, indem man ihn als Summe von möglichst einfachen Teilen schreibt. Am deutlichsten sieht man das im Falle eines diagonalisierbaren Operators T . Das bedeutet, dass V eine Basis besitzt, die aus lauter Eigenvektoren von T besteht, und man kann V dann als direkte Summe V = N (T − λ1 I ) ⊕ · · · ⊕ N (T − λs I ) schreiben, wobei λ1 , . . . , λs die verschiedenen Eigenwerte von T sind. Jeder Teilraum N (T − λ j I ) ist T -invariant, und die Einschränkung von T auf N (T − λ j I ) ist einfach λ j I , hat also eine völlig triviale und darüber hinaus explizit bekannte Form. K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_20, C Springer-Verlag Berlin Heidelberg 2010
207
208
20 Grundbegriffe der Darstellungstheorie
Im allgemeinen Fall erlaubt die Theorie der J ORDANschen Normalform eine ähnliche Reduktion auf einfache Bestandteile, wobei die Rolle der Eigenwerte von den sog. J ORDANblöcken übernommen wird (vgl. etwa [34], Ergänzungen zu Kap. 7). In der Darstellungstheorie spielen die irreduziblen Darstellungen die zentrale Rolle als Bausteine, aus denen beliebige Darstellungen aufgebaut werden, und in diese Thematik geben wir in Abschn. B dieses Kapitels eine erste Einführung, nachdem wir in Abschn. A die grundlegenden Begriffe definiert und durch Beispiele illustriert haben. Im abschließenden Abschn. C motivieren wir unsere Beschäftigung mit Darstellungstheorie durch eine erste physikalische Anwendung: Wir betrachten ein quantenmechanisches System, dessen H AMILTONoperator eine nichttriviale Symmetriegruppe G hat, und untersuchen dann, wie die Darstellungstheorie von G den Grad der Entartung der zulässigen Energieniveaus beeinflusst. Dabei wird auch klar werden, wieso es von grundlegender Bedeutung ist, die irreduziblen Darstellungen der einschlägigen Gruppen explizit bestimmen zu können.
A Definition und einfache Eigenschaften einer Darstellung Wir beginnen mit dem grundlegenden Vokabular der Darstellungstheorie von Gruppen: Definitionen 20.1 Sei G eine beliebige Gruppe, V ein K-Vektorraum, und sei GL(V ) die Gruppe der Vektorraum-Automorphismen von V , also der bijektiven linearen Abbildungen A von V auf V . Weiter sei GL(n, K), wie bisher, die allgemeine lineare Gruppe, also die Gruppe der invertierbaren Matrizen A ∈ Kn×n . a. Ein Gruppen-Homomorphismus D : G −→ GL (V ),
G a −→ D(a) ∈ GL (V )
heißt eine Darstellung von G auf dem Trägerraum (= Darstellungsmodul) V . Für eine Darstellung gilt also: (i) D(a) ∈ GL (V )
∀ a ∈ G,
(ii) D(a · b) = D(a)D(b)
∀ a, b ∈ G,
(iii) D(e) = I
(Identität),
A
Definition und einfache Eigenschaften einer Darstellung
209
(iv) D(a −1 ) = D(a)−1
∀ a ∈ G.
b. Ein Gruppenhomomorphismus D : G −→ GL (n, K) heißt eine Matrixdarstellung von G vom Grade n über K.
Wir illustrieren diese Begriffe zunächst durch einige Beispiele, bei denen Matrixdarstellungen im Vordergrund stehen: Beispiele 20.2 a. Ist I die identische Abbildung aus GL (V ), E = (δi j ) ∈ GL (n, K) die Einheitsmatrix, so ist durch D(a) = I
∀ a ∈ G,
bzw. D(a) = E
∀a ∈ G
(20.1)
die sogenannte triviale Darstellung von G auf V bzw. die triviale Matrixdarstellung vom Grade n definiert. b. Ist G ≤ GL(n, K), so ist die Einbettung J : G −→ GL(n, K) , X −→ X offenbar eine Matrixdarstellung vom Grad n. Man nennt sie die natürliche Darstellung oder die Standarddarstellung der Matrixgruppe G, und sie ist keineswegs uninteressant. c. Für A ∈ Kn×n ist D(t) := exp t A eine Matrixdarstellung der Gruppe G = (R, +) vom Grade n über K. d. Ist G = GL (n, K), so wird durch D(A) := det(A)
für A ∈ GL (n, K)
(20.2)
eine Matrixdarstellung von G vom Grade 1 definiert, denn D = det ist wegen dem Determinanten-Multiplikationssatz ein Gruppenhomomorphismus von GL (n, K) in die Gruppe K∗ ≡ GL (1, K). e. Die Abbildung J : U(1) e
iϕ
cos ϕ − sin ϕ −→ ∈ SO(2) sin ϕ cos ϕ
ist offenbar ein Isomorphismus von Gruppen. Dieser ist dann eine Matrixdarstellung von U(1) vom Grade 2 über R, und J −1 ist eine Matrixdarstellung von SO(2) vom Grade 1 über C.
210
20 Grundbegriffe der Darstellungstheorie
f. Nach Theorem 18.16b gibt es einen Gruppen-Epimorphismus Φ : SU(2) −→ SO(3) Dieser ist dann eine Matrixdarstellung von SU(2) vom Grade 3 über R. Bei den meisten praktisch vorkommenden Darstellungen hat man es aber mit linearen Operatoren in einem Trägerraum V zu tun. Wir skizzieren jetzt einige generelle Typen von solchen Beispielen: Beispiele 20.3 a. Sei G eine Gruppe, die auf einer Menge Z von links operiert. In vielen der Beispiele aus Abschn. 17B entstehen hieraus Darstellungen von G auf Funktionenräumen über Z in der folgenden Weise: Gegeben ist ein Vektorraum V von auf Z definierten Funktionen, und für jedes f ∈ V und jedes a ∈ G gehört die Funktion ga (z) := f (a −1 z) ,
z∈Z
wieder zu V . Durch D(a) f := ga ist dann für jedes a ∈ G eine lineare Abbildung D(a) : V → V gegeben, und man prüft durch leichte Rechnung, dass D(a1 )D(a2 ) = D(a1 a2 ) für beliebige a1 , a2 ∈ G gilt. Insbesondere ist D(a)D(a −1 ) = D(a −1 )D(a) = D(e) = idV , und somit ist jedes D(a) bijektiv mit der inversen Abbildung D(a −1 ). Auf diese Weise erhalten wir also eine Darstellung D von G auf V . b. Sei eine Darstellung D einer Gruppe G auf dem Vektorraum V gegeben. Der Raum End(V ) der linearen Operatoren in V ist dann der Trägerraum einer neuen die durch Darstellung D, D(a)T := D(a)T D(a)−1 ,
T ∈ End(V ) , a ∈ G
definiert ist. Dass dies tatsächlich eine Darstellung definiert, rechnet man (wie in Beispiel 17.10g) leicht nach (Übung!). c. Sei G eine lineare L IE-Gruppe und g = L(G). Ist A ∈ g und X ∈ G, so definiert γ (t) := X et A X −1 eine in G verlaufende Kurve, und wir haben γ (0) = E sowie γ˙ (0) = X AX −1 . Somit ist auch X AX −1 ∈ TE G = g, und es ist klar, dass dies linear von A abhängt. Für jedes X ∈ G haben wir daher die lineare Abbildung Ad(X ) : g −→ g , A −→ X AX −1 , und man rechnet problemlos nach, dass Ad(X Y ) = Ad(X )Ad(Y ) ist für X, Y ∈ G. Insbesondere ist Ad(X )Ad(X −1 ) = Ad(X −1 )Ad(X ) = Ad(E) = idg, also ist Ad(X ) invertierbar mit der Inversen Ad(X −1 ). Die so definierte Abbildung
A
Definition und einfache Eigenschaften einer Darstellung
211
Ad : G −→ GL(g) ist also eine Darstellung von G auf dem Trägerraum g = L(G). Man nennt sie die adjungierte Darstellung der (linearen) L IE-Gruppe G. Für allgemeine L IEGruppen kann man die adjungierte Darstellung in analoger Weise einführen. Eine Darstellung D auf einem endlich-dimensionalen Trägerraum kann stets durch eine Matrixdarstellung ersetzt werden. Ist etwa (b1 , . . . , bn ) eine Basis des Trägerraums V , so repräsentiert man für jedes g ∈ G die bijektive lineare Abbildung D(g) : V → V durch die reguläre Matrix (ai j (g)) mit D(g)b j =
n
ai j (g)bi ,
j = 1, . . . , n,
(20.3)
i=1
und diese Matrizen bilden dann eine Matrixdarstellung vom Grad n. Umgekehrt definiert jede Matrixdarstellung vom Grad n eine Darstellung auf dem Trägerraum Kn in offensichtlicher Weise. Bemerkung In der Quantenmechanik treten häufig endlichdimensionale Räume von Operatoren auf, die unter einer Darstellung von dem in Beispiel 20.3b beschriebenen Typ invariant sind. Dabei ist eine Symmetriegruppe G eines quantenmechanischen Systems gegeben sowie eine Darstellung D von G auf dem Zustandsraum V des Systems. Ferner hat man linear unabhängige Operatoren T1 , . . . , Tm ∈ End(V ) so, dass der von ihnen erzeugte lineare Teilraum W := LH(T1 , . . . , Tm ) unter allen , g ∈ G invariant ist, d. h. es gilt D(g) T ∈W
⇒
D(g)T ∈W
für alle g ∈ G.
durch eine Matrix In Bezug auf die Basis (T1 , . . . , Tm ) von W kann dann jedes D(g) ai j (g) repräsentiert werden, und dann gilt D(g)T j D(g)−1 =
m
ai j (g)Ti ,
j = 1, . . . , m
(20.4)
i=1
für alle g ∈ G. Das System (T1 , . . . , Tm ) wird dann als ein Tensoroperator zur Darstellung D bezeichnet. (Beispiele dazu in den Aufgaben!) Für die meisten Zwecke ist es nicht sinnvoll, zwischen Darstellungen zu unterscheiden, die sich mittels eines festen Isomorphismus ineinander umrechnen lassen, und man wird solche Darstellungen als äquivalent erklären. Als Beispiel betrachten wir den Basiswechsel für eine gegebene Darstellung D von G auf einem n-dimensionalen Trägerraum V . Diese ist bezüglich einer Basis (b1 , . . . , bn ) durch die Matrixdarstellung (20.3) gegeben, wobei wir die auftretenden Matrizen (ai j (g)) mit A(g) abkürzen wollen. Wählen wir eine andere Basis (b1 , . . . , bn ) von V , so
212
20 Grundbegriffe der Darstellungstheorie
bekommen wir eine andere Matrixdarstellung A (g) von D(g). Nach der elementaren linearen Algebra sind die Matrizen A(g) und A (g) jedoch ähnlich, d. h. es gibt eine Matrix T ∈ GL (n, K), so dass A (g) = T A(g)T −1
(20.5)
für alle g ∈ G. Dabei ist T nur abhängig von den beiden Basen und nicht etwa von g. Dies legt die im folgenden unter a., b. aufgeführten Begriffsbildungen nahe: Definitionen 20.4 a. Zwei Darstellungen D1 , D2 von G auf K-Vektorräumen V1 , V2 heißen äquivalent, wenn es einen Isomorphismus T : V1 −→ V2 gibt, so dass D2 (g) = T D1 (g)T −1
(20.6)
für alle g ∈ G. Gleichbedeutend hiermit ist die Forderung T D1 (g) = D2 (g)T
(20.7)
für alle g ∈ G. Man schreibt dann: D1 ∼ D2 . b. Zwei Matrixdarstellungen D1 , D2 : G −→ GL (n, K) heißen äquivalent, wenn es eine reguläre Matrix T ∈ GL (n, K) gibt, so dass D2 (g) = T D1 (g)T −1
∀ g ∈ G.
(20.8)
c. Ist D : G −→ GL (V ) eine Darstellung auf einem endlichdimensionalen Trägerraum, so heißt die Funktion χ D : G −→ K mit χ D (g) = Spur D(g)
(20.9)
der Charakter der Darstellung D. Äquivalente Darstellungen haben denselben Charakter, weil sich die Spur beim Übergang zu einer ähnlichen Matrix nicht ändert. Wir werden im nächsten Kapitel sehen, dass in gewissem Ausmaß die Äquivalenzklasse einer Darstellung schon durch den Charakter eindeutig festgelegt ist, also durch eine skalare Funktion auf G. Hieraus erklärt sich die grundsätzliche Bedeutung der Charaktere. Eine wichtige Teilklasse von Darstellungen bekommt man, wenn man als Trägerraum einen H ILBERTraum zu Grunde legt. Definition 20.5 Sei H ein H ILBERTraum. Eine Darstellung D von G auf H heißt eine unitäre Darstellung, wenn D(g)u | D(g)v = u | v
∀ g ∈ G,
∀ u, v ∈ H,
(20.10)
A
Definition und einfache Eigenschaften einer Darstellung
213
d. h. wenn D(g −1 ) = D(g)−1 = D(g)∗
∀ g ∈ G.
(20.11)
Ein äußerst nützlicher Kunstgriff der Darstellungstheorie besteht darin, zu einer gegebenen Darstellung auf einem H ILBERTraum durch eine Art Mittelbildung eine äquivalente unitäre Darstellung zu konstruieren. Dies ist zumindest für kompakte Gruppen immer möglich, wie wir in Kap. 21 sehen werden. Hier führen wir den besagten Trick aber schon einmal für den Spezialfall vor, wo die Gruppe endlich und der H ILBERTraum von endlicher Dimension ist: Theorem 20.6 (Satz von M ASCHKE) Ist G eine endliche Gruppe, H ein ndimensionaler H ILBERTraum, so ist jede Darstellung D von G auf H äquivalent zu einer unitären Darstellung. Beweis Sei D : G −→ GL (H ) eine gegebene Darstellung. Damit definieren wir in H ein neues Skalarprodukt (u | v) :=
D(g)u | D(g)v ,
u, v ∈ H.
(20.12)
g∈G
Es ist eine leichte Übung zu überprüfen, dass dies ein Skalarprodukt ist. Wir zeigen, dass jedes D(h) , h ∈ G bezüglich (· | ·) unitär ist: (D(h)u | D(h)v) =
D(g)D(h)u | D(g)D(h)v
g∈G
=
D(gh)u | D(gh)v
g∈G
=
D(k)u | D(k)v = (u | v),
k∈G
denn die Abbildung g −→ k := gh ist bijektiv. Die Darstellung D ist also unitär in Bezug auf das neue Skalarprodukt. Sei nun (u 1 , . . . , u n ) eine Orthonormalbasis bezüglich (· | ·) und (v1 , . . . , vn ) eine Orthonormalbasis bezüglich · | · , d. h. (u i | u j ) = δi j ,
vi | v j = δi j .
Wir definieren eine lineare Abbildung S : H −→ H durch Su i := vi ,
i = 1, . . . , n.
(20.13)
Dann gilt, wie man sofort nachrechnet Su | Sv = (u | v)
∀ u, v ∈ H
(20.14)
214
20 Grundbegriffe der Darstellungstheorie
und folglich S D(g)S −1 u | S D(g)S −1 v = (D(g)S −1 u | D(g)S −1 v) = (S −1 u | S −1 v) = u | v , d. h. die äquivalente Darstellung D (g) := S D(g)S −1
ist bezüglich des alten Skalarproduktes unitär.
Auf Grund dieses Satzes (und seiner noch zu besprechenden Verallgemeinerungen) können wir im Folgenden o.B.d.A. annehmen, dass eine Darstellung D einer kompakten Gruppe G auf einem H ILBERTraum H unitär ist. Abschließend besprechen wir noch kurz, wie man aus gegebenen Darstellungen weitere Darstellungen durch Bildung von direkten Summen und Tensorprodukten aufbauen kann. Definitionen 20.7 Seien V1 , V2 K-Vektorräume, auf denen Darstellungen D1 , D2 von G gegeben sind. a. Auf V := V1 × V2 ist durch D(g)(x1 , x2 ) := (D1 (g)x1 , D2 (g)x2 ) ,
xi ∈ Vi , g ∈ G
(20.15)
eine Darstellung definiert. Diese nennt man die direkte Summe von D1 und D2 und schreibt D = D1 ⊕ D2 . b. Sind V1 , V2 Teilräume eines Vektorraums V und ist V = V1 ⊕ V2 , so definiert man die direkte Summe D = D1 ⊕ D2 durch D(g) = D1 (g)P1 + D2 (g)P2 ,
(20.16)
wo Pi : V → Vi die zur direkten Zerlegung V = V1 ⊕V2 gehörigen Projektionen sind. c. Sind V1 , V2 von endlicher Dimension, so bilden wir das in Abschn. 2B besprochene Tensorprodukt V = V1 ⊗ V2 . Zu jedem g ∈ G gibt es dann genau eine lineare Abbildung D(g) ≡ D1 (g) ⊗ D2 (g) : V −→ V, für die gilt: D(g)(v1 ⊗ v2 ) = D1 (g)v1 ⊗ D2 (g)v2 ,
vi ∈ Vi .
(20.17)
Die Abbildung g −→ D(g) ist eine Darstellung von G, und diese bezeichnet man als das Tensorprodukt der Darstellungen D1 , D2 und schreibt D = D1 ⊗D2 .
B
Irreduzible und vollreduzible Darstellungen
215
Man kann die direkte Summe aus Teil a als einen Spezialfall von der aus b auffassen, wenn man V1 mit V1 × {0} ⊆ V und V2 mit {0} × V2 ⊆ V identifiziert. Dann ist tatsächlich V = V1 ⊕ V2 , und (20.15), (20.16) liefern dieselben Abbildungen D(g). Als Übung sollte man den folgenden Satz beweisen: Satz 20.8 Seien D1 , D2 endlichdimensionale Darstellungen von G, und seien χ1 bzw. χ2 ihre Charaktere. Der Charakter χ von D1 ⊕ D2 ist dann χ (g) = χ1 (g) + χ2 (g) ,
g ∈ G,
und der Charakter χ von D1 ⊗ D2 ist χ (g) = χ1 (g)χ2 (g) ,
g ∈ G.
B Irreduzible und vollreduzible Darstellungen Irreduzible Darstellungen haben wir schon als die einfachsten Bausteine von anderen Darstellungen beschrieben, und es ist nun an der Zeit, sie präzise zu definieren. Definitionen 20.9 Sei D eine Darstellung einer Gruppe G auf einem KVektorraum V . a. Ein linearer Teilraum U ⊆ V heißt invariant unter der Darstellung D, wenn D(g)u ∈ U
für alle u ∈ U, g ∈ G.
(20.18)
b. Die Darstellung D heißt irreduzibel, wenn es außer {0} und V keinen echten Unterraum U ⊆ V gibt, der invariant unter D ist. Anderenfalls heißt D reduzibel. c. Ein D-invarianter Teilraum U heißt irreduzibel (bzw. reduzibel), wenn die Einschränkung von D auf U irreduzibel (bzw. reduzibel) ist. Zum Beispiel ist die 3-dimensionale Standarddarstellung von SO(3) auf dem R3 irreduzibel, denn kein 1- oder 2-dimensionaler Unterraum von R3 bleibt unter allen A ∈ SO(3) invariant. Betrachten wir dagegen die folgende Darstellung von SO(2) auf dem R3 : ⎛ ⎞ 1 0 0 D cos α − sin α −→ ⎝0 cos α − sin α ⎠ ∈ GL(3, R) . SO(2) sin α cos α 0 sin α cos α Diese Darstellung ist reduzibel, denn es sind U1 = LH(e1 ) und U2 = LH(e2 , e3 ) echte invariante Unterräume. Wir wenden uns nun der Aufgabe zu, reduzible Darstellungen in irreduzible zu zerlegen. Den Ausgangspunkt hierfür bilde die folgende einfache Aussage:
216
20 Grundbegriffe der Darstellungstheorie
Satz 20.10 Sei D eine unitäre Darstellung von G auf einem H ILBERTraum H , und sei U ⊆ H ein D-invarianter Unterraum. Dann ist auch U ⊥ invariant unter D. Ferner ist D = D ⊕ D ,
(20.19)
wobei D = D U D = D ⊥ U
die Einschränkung von D auf U , die Einschränkung von D auf U ⊥ ist.
Man nennt dies eine direkte Zerlegung von D in Teildarstellungen D , D . Beweis Für T = D(g) ist T (U ) ⊆ U , also T ∗ (U ⊥ ) ⊆ U ⊥ nach (15.30). Aber T ∗ = D(g)−1 = D(g −1 ), da es sich um eine unitäre Darstellung handelt. Mit g durchläuft aber auch g −1 die ganze Gruppe, also ist U ⊥ invariant unter D. Sei nun H ein n-dimensionaler H ILBERTraum, und sei D eine unitäre Darstellung von G auf H . Sei U 1 ein D-invarianter Unterraum von minimaler Dimension. Dann ist D1 = D U eine irreduzible Teildarstellung von D. Nach Satz 1 20.10 ist U1⊥ ebenfalls invariant unter D, aber D := D U ⊥ ist i. A. reduzibel. 1
Sei daher U2 ⊆ U1⊥ ein D -invarianter Unterraum minimaler Dimension. Dann ist D2 = D U eine irreduzible Teildarstellung. Setzt man diesen Prozess fort, so endet 2 er wegen dim H = n < ∞ nach endlich vielen Schritten. So ergibt sich: Theorem 20.11 a. Jede endlich-dimensionale unitäre Darstellung D einer Gruppe G auf H ist vollreduzibel, d. h. es gibt eine direkte Zerlegung H = U1 ⊕ · · · ⊕ Um ,
D = D1 ⊕ · · · ⊕ Dm
(20.20)
in irreduzible Teildarstellungen Di = D U . i b. Ist χ der Charakter von D, χ j der Charakter von D j , so gilt χ (g) = χ1 (g) + · · · + χm (g) ∀ g ∈ G.
(20.21)
Wählt man in jedem Teilraum Ui eine Orthonormalbasis (e1i , . . . , eni i ) (wobei dim Ui = n i ), so ist (e11 , . . . , en11 , . . . , e1m , . . . , enmm ) eine Orthonormalbasis von H . Definiert man dann die zu diesen Basen gehörenden Matrixdarstellungen Di (g) ∈ GL(n i , K), so bekommt man
B
Irreduzible und vollreduzible Darstellungen
⎛ ⎜ ⎜ D(g) = ⎜ ⎝
D1 (g)
217
0
D2 (g)
0
⎞
⎟ ⎟ ⎟, .. ⎠ . Dm (g)
(20.22)
woraus dann auch sofort (20.21) folgt. Eine reduzible Darstellung D von G, die nicht unitär ist, ist i. A. nicht vollreduzibel (vgl. Aufgaben 20.5, 20.6, und 20.7). Der Beweis von Theorem 20.11a kann aber ohne weiteres imitiert werden, sobald man einen Ersatz für Satz 20.10 hat. Man hat daher folgendes Kriterium: Satz 20.12 Eine endlich-dimensionale Darstellung D einer Gruppe G auf einem K-Vektorraum V ist genau dann vollreduzibel, wenn zu jedem D-invarianten Unterraum U ⊆ V ein D-invarianter Unterraum W ⊆ V existiert, so dass V = U ⊕ W . Wir leiten nun zwei fundamentale Eigenschaften irreduzibler Darstellungen her. Theorem 20.13 Seien D1 , D2 irreduzible Darstellungen von G auf V1 bzw. V2 , und sei A : V1 −→ V2 eine lineare Abbildung, so dass D2 (g)A = AD1 (g) ∀ g ∈ G .
(20.23)
Dann gilt: Entweder D1 und D2 sind äquivalent und A ist ein Isomorphismus oder D1 und D2 sind nicht äquivalent und es ist A = 0. Beweis Seien N (A) = {v ∈ V1 | Av = 0}
der Nullraum von A,
R(A) = A(V1 )
der Wertebereich von A.
Wegen (20.23) ist AD1 (g)v = D2 (g)Av = 0
für v ∈ N (A),
also ist N (A) invariant unter D1 . Da D1 irreduzibel ist, gilt " N (A) =
V1 , d. h. A = 0, oder {0}, d. h. A injektiv.
Wegen (20.23) ist ferner D2 (g)Av = AD1 (g)v ∈ R(A)
für Av ∈ R(A),
(20.24)
218
20 Grundbegriffe der Darstellungstheorie
d. h. R(A) ist invariant unter D2 . Da D2 irreduzibel ist, gilt " R(A) =
{0}, d. h. A = 0, oder V2 , d. h. A surjektiv.
Aus (20.24) und (20.25) folgt dann die Behauptung.
(20.25)
Theorem 20.14 (S CHURsches Lemma) a. Ist D eine irreduzible Darstellung von G auf einem n-dimensionalen CVektorraum V , so sind die einzigen linearen Abbildungen A : V −→ V mit AD(g) = D(g)A
∀g ∈ G
(20.26)
Vielfache der Identität, d. h. von der Form A = λI,
λ ∈ C.
(20.27)
b. Ist D eine unitäre Darstellung von G auf einem n-dimensionalen H ILBERTraum H und sind die einzigen linearen Abbildungen A : H −→ H , die (20.26) erfüllen, von der Form (20.27), so ist D irreduzibel. Beweis a. Sei also D irreduzibel und sei A : V −→ V eine lineare Abbildung, die gemäß (20.26) mit allen D(g) vertauschbar ist. Da V ein C-Vektorraum ist, hat A einen Eigenwert λ ∈ C mit zugehörigem Eigenraum M(λ) = {v ∈ V | Av = λv} = {0}. Für ein v ∈ M(λ) folgt aus (20.26) AD(g)v = D(g)Av = λD(g)v,
also D(g)v ∈ M(λ),
d. h. M(λ) ist invariant unter D. Da D irreduzibel ist, folgt M(λ) = V,
d. h. Av = λv für alle v ∈ V ,
und somit gilt (20.27). b. Seien nun die linearen Abbildungen A : H −→ H , die mit allen D(g) vertauschen, sämtlich Vielfache der Identität. Nehmen wir an, D sei eine unitäre, aber reduzible Darstellung von G auf H . Dann gibt es einen echten D-invarianten Unterraum {0} = U ⊆ H . Nach Satz 20.10 ist dann auch W := U ⊥ invariant unter
C
Symmetrien des H AMILTONoperators
219
D, und es ist H = U ⊕ W . Sei P : H −→ H die orthogonale Projektion von H auf U . Nach (15.31) vertauscht P mit allen D(g), aber es ist kein Vielfaches der Identität im Widerspruch zur Voraussetzung. Bemerkung Auch Theorem 20.13 wird von vielen Autoren als Teil des S CHURschen Lemmas betrachtet. Das ist insofern sinnvoll, als dass die Aussagen von 20.13 und 20.14a. meist gleichzeitig angewendet werden, wie wir im nächsten Kapitel noch sehen werden. Als direkte Anwendung haben wir: Korollar 20.15 Für eine abelsche Gruppe G ist jede Darstellung auf einem n-dimensionalen komplexen Vektorraum reduzibel, falls n ≥ 2. Jede irreduzible Darstellung ist also eindimensional über C. Beweis Sei D eine irreduzible Darstellung der abelschen Gruppe G auf V . Für festes g0 ∈ G folgt dann: D(g0 )D(g) = D(g0 g) = D(gg0 ) = D(g)D(g0 )
∀ g ∈ G,
d. h. A0 := D(g0 ) erfüllt (20.26) und daher nach Theorem 20.14a auch (20.27). Alle D(g0 ) , g0 ∈ G sind also Vielfache der Identität, also wäre die Darstellung reduzibel, wenn der Trägerraum höhere Dimension als 1 hätte. Bemerkung Ein K-Vektorraum V wird in der mathematischen Fachliteratur oft als K[G]-Modul oder kurz G-Modul bezeichnet, wenn er der Trägerraum einer fest vorgegebenen Darstellung D von G ist. Dabei wird die Darstellung – wie in der Einleitung zu diesem Kapitel geschildert – als Linksoperation der Gruppe aufgefasst, und dementsprechend schreibt man für g ∈ G , x ∈ V auch g · x oder gx statt D(g) x. Eine lineare Abbildung A : V → V , die mit allen D(g) vertauscht, wird dann als G-Morphismus bezeichnet. Ein G-Morphismus verhält sich also rechnerisch wie eine lineare Abbildung, bei der die Gruppenelemente als zusätzliche Skalare fungieren. Das S CHURsche Lemma lautet in dieser Terminologie einfach: Jeder G-Morphismus eines irreduziblen G-Moduls ist ein Vielfaches der Identität.
C Symmetrien des H AMILTONoperators Bevor wir die Darstellungstheorie weiter diskutieren, wollen wir exemplarisch auf ihre Anwendung in der Quantenmechanik eingehen. Wir greifen dazu Beispiel 5 aus Abschn. 17B wieder auf, betrachten also die unitäre Darstellung D von G = SO(3) auf H = L 2 (R3 ), die durch die Formel (D(R)ψ)(x) := ψ(R −1 x),
R ∈ SO(3)
(20.28)
definiert ist. Der H AMILTONoperator eines Ein-Teilchen-Systems ist bekanntlich gegeben durch
220
20 Grundbegriffe der Darstellungstheorie
Hψ = −
h¯ 2 Δψ + V (x)ψ, 2m
(20.29)
wobei der erste Term die kinetische Energie, der zweite Term die potentielle Energie repräsentiert. Wir haben uns schon in Abschn. 17B überzeugt, dass dabei der folgende Satz gilt: Satz 20.16 Ist das Potential V (x) invariant unter SO(3), d. h. V (Rx) = V (x)
∀ R ∈ SO(3), x ∈ R3 ,
(20.30)
so ist der durch (20.29) gegebene H AMILTONoperator H auf seinem Definitionsbereich mit allen Operatoren D(R), R ∈ SO(3), der durch (20.28) gegebenen Darstellung vertauschbar. Man nennt dann SO(3) eine Symmetriegruppe des H AMILTONoperators. Dieser Satz hat wesentliche Konsequenzen für das Eigenwertproblem von H . Betrachten wir dazu die stationäre S CHRÖDINGER-Gleichung H ψ = λψ
(20.31)
und nehmen wir an, λ ∈ R sei ein Eigenwert von H und Mλ = {ψ ∈ D(H )|H ψ = λψ}
(20.32)
der zugehörige Eigenraum. Ist dann G = SO(3) eine Symmetriegruppe von H , so folgt für ψ ∈ Mλ H (D(R)ψ) = D(R)(H ψ) = λ(D(R)ψ) d. h. D(R)ψ ist ebenfalls Eigenvektor von H zum Eigenwert λ. Der Teilraum Mλ ist also invariant unter der Darstellung D. Nehmen wir nun an, M0 ⊆ D(H ) ⊆ L 2 (R3 ) sei ein irreduzibler Teilraum unter der Darstellung D von SO(3), d. h. M0 ist invariant unter D und die Einschränkung D0 = D ist eine irreduzible Darstellung von SO(3). Nach Satz 20.16 ist dann M0 der Operator H0 = H mit allen Operatoren D0 (R) vertauschbar. Dann können M0
wir aber das S CHURsche Lemma (Theorem 20.14a) anwenden und schließen, dass H0 ein Vielfaches der Identität ist, d. h. es gibt ein λ0 ∈ R, so dass H0 ψ = λ0 ψ
für alle ψ ∈ M0 .
Dann ist M0 also ein Eigenraum von H . Diese Überlegungen sind, wie man sieht, keineswegs auf die Drehgruppe beschränkt, sondern gelten in völlig analoger Weise für beliebige Symmetriegruppen des H AMILTONoperators. Wir fassen sie zu folgendem Satz zusammen:
Aufgaben
221
Satz 20.17 Sei der C-H ILBERTraum H der Zustandsraum eines quantenmechanischen Systems, dessen Gesamtenergie durch den H AMILTONoperator H : H ⊇ D(H ) −→ H repräsentiert wird. Sei ferner D eine unitäre Darstellung einer Gruppe G auf H, so dass D(R)H ψ = H D(R)ψ
∀ R ∈ G, ψ ∈ D(H ),
d. h. G ist eine Symmetriegruppe des H AMILTONoperators. Dann gilt: a. Jeder Eigenraum von H ist invariant unter der Darstellung D, d. h. ist ψ ein Eigenvektor von H zum Eigenwert λ, so ist auch jedes D(R)ψ, R ∈ G ein Eigenvektor von H zum Eigenwert λ. b. Jeder irreduzible Teilraum von H unter D ist ein Eigenraum von H , und die Dimension der irreduziblen Darstellung gibt eine untere Schranke für die Vielfachheit des zugehörigen Eigenwertes an.
Dieser Satz hat vielerlei Anwendungen in der Physik: I. Kennt man den H AMILTONoperator H und eine Symmetriegruppe G, so kann man Aussagen über die Lösungen der S CHRÖDINGER-Gleichung machen, ohne die Gleichung selbst zu lösen. II. In der Elementarteilchenphysik ist der H AMILTONoperator H – insbesondere das Potential V (x) – unbekannt. Man kann jedoch das Energiespektrum messen und damit die Teilchenmassen. Daraus kann man dann auf die Symmetriegruppe G von H schließen, womit man dann wieder Aussagen über das Potential V (x) machen kann. In jedem der Fälle muss man jedoch die irreduziblen Darstellungen der potentiellen Symmetriegruppen kennen. Daher ist es – auch unter dem Gesichtspunkt der physikalischen Anwendungen – eine Hauptaufgabe der Darstellungstheorie, die irreduziblen Darstellungen der wichtigen Gruppen zu bestimmen. Diese Aufgabe ist heute im wesentlichen gelöst, und wir werden in den beiden letzten Kapiteln auch noch auf einige der Ergebnisse zu sprechen kommen. Für die meisten derartigen Resultate müssen wir jedoch auf die weiterführende Literatur verweisen, z. B. auf [5, 8, 12, 14, 18, 29, 30, 37, 43, 58, 61, 82, 94, 96].
Aufgaben zu Kap. 20 20.1 Sei V ein beliebiger K-Vektorraum. Für invertierbare lineare Abbildungen T : V → V setzt man T −n := (T −1 )n = (T n )−1 ,
n ∈ N.
222
20 Grundbegriffe der Darstellungstheorie
Damit ist T m für alle ganzzahligen m definiert. Man zeige: a. Durch D(m) := T m ist eine Darstellung der Gruppe (Z, +) gegeben, wenn T : V → V eine feste lineare Bijektion ist. b. Seien T1 , . . . , Tk lineare Bijektionen von V auf sich, die paarweise vertauschen. Eine Darstellung der „Gittergruppe“ (Zk , +) ist dann gegeben durch D(m 1 , . . . , m k ) := T1m 1 T2m 2 · · · Tkm k . 20.2 Es sei D die Darstellung (D(R)ψ)(x) := ψ(R −1 x),
R ∈ GL(n, R)
von GL(n, R) auf L 2 (Rn ) (Verallgemeinerung von (20.28)). a. Sei M f der Multiplikationsoperator zu einer messbaren Funktion f : Rn → C. Man zeige: D(R)M f D(R)−1 = Mg
mit g(x) := f (R −1 x)
für R ∈ GL(n, R). b. Man folgere für den Fall n = 3: Das System Q = (Q 1 , Q 2 , Q 3 ) der quantenmechanischen Ortsoperatoren Q k := Mxk ist ein Tensoroperator zur Darstellung D. 20.3 Sei D dieselbe Darstellung wie in der vorigen Aufgabe, diesmal jedoch auf dem Trägerraum Sn , der aus den schnell fallenden Testfunktionen auf Rn besteht. a. Wie in Aufgabe 14.7 betrachten wir den Differentialoperator L v zu einem gegebenen C ∞ -Vektorfeld v auf Rn , der durch 1 1 d (L v ψ)(x) := (vψ)(x) = ψ(x + tv(x)) i i dt t=0 definiert ist. Man zeige: D(R)L v D(R)−1 = L w
mit w(x) := Rv(R −1 x)
für alle R ∈ GL(n, R). b. Man folgere für den Fall n = 3: Das System P = (P1 , P2 , P3 ) der quantenmechanischen Impulsoperatoren Pk := (h¯ /i)(∂/∂ xk ) ist ein Tensoroperator zur Darstellung D. 20.4 Sei (b1 , . . . , bn ) eine Basis des n-dimensionalen K-Vektorraums V , und sei L : V → V der entsprechende Links-Shift, d. h. der lineare Operator, der auf der Basis gegeben ist durch
Aufgaben
223
Lbk := bk−1 , Lb1 := 0.
2 ≤ k ≤ n,
Ferner sei T := I − L. Man zeige: a. L n = 0. b. T ist invertierbar, und zwar ist T −1 =
n−1
Lk.
k=0
c. Die Teilräume Wm := LH(b1 , . . . , bm ) , m = 1, . . . , n sind invariant unter der Darstellung von (Z, +), die gemäß Aufgabe 20.1a durch T gegeben ist. 20.5 Es seien V, b1 , . . . , bn , L und W1 , . . . , Wn wie in Aufgabe 20.4, aber speziell mit V = Kn . Wir betrachten die Darstellung D(t) := exp t L der Gruppe (R, +). Man zeige nacheinander: n−1 k t
Lk , t ∈ R. k! k=0 b. Die Wm sind D-invariante Unterräume. c. Für 1 ≤ j ≤ k ≤ n gilt a. D(t) =
lim
t→∞
1
t
" tL
e k−1
bj =
1 (k−1)! b1
0
für j = k , für j < k .
d. Zu 0 = v ∈ V gibt es stets ein k ∈ 1, . . . , n und einen Skalar λ = 0, für die gilt: lim
1
t→∞ t k−1
et L v = λb1 .
e. Jeder D-invariante Unterraum enthält den Vektor b1 . (Hinweis: Man beachte, dass die linearen Unterräume von Kn alle abgeschlossen sind.) f. Die Darstellung D ist nicht vollreduzibel. 20.6 Sei V ein n-dimensionaler C-Vektorraum und T ∈ GL(V ). Wir betrachten die Darstellung D von (Z, +), die gemäß Aufgabe 20.1 durch T gegeben ist. Man zeige: D ist vollreduzibel ⇐⇒ T ist diagonalisierbar. (Hinweis: Man verwende Korollar 20.15.) 20.7 a. Sei A ∈ Cn×n und D(t) := exp t A die entsprechende Darstellung der Gruppe (R, +). Man zeige, dass die folgenden drei Aussagen äquivalent sind:
224
20 Grundbegriffe der Darstellungstheorie
(i) D ist vollreduzibel. (ii) Es gibt eine Basis von Cn , deren Vektoren für alle exp t A Eigenvektoren sind. (iii) A ist diagonalisierbar. (Hinweis: Für den Schritt (i) ⇒ (ii) verwende man Kor. 20.15.) b. Sei L ein Links-Shift auf Cn (vgl. Aufgabe 20.4). Man zeige, dass L nicht diagonalisierbar ist. (Hinweis: Der einzige Eigenwert ist λ = 0 (wieso?). Welche Vielfachheit hat er?) c. Man gebe nun (für K = C) einen neuen Beweis, dass die Darstellung et L von (R, +) nicht vollreduzibel ist. 20.8 Sei D eine Darstellung einer endlichen Gruppe G auf einem beliebigen K-Vektorraum V . Man zeige, dass jeder Vektor v ∈ V in einem endlichdimensionalen D-invarianten Unterraum liegt. (Hinweis: Man betrachte Wv := LH({D(g)v | g ∈ G}).) 20.9 Seien G 1 , G 2 zwei Gruppen und P := G 1 × G 2 ihr direktes Produkt (Aufgabe 17.2). Sei weiterhin Di eine Darstellung von G i auf dem endlichdimensionalen Raum Vi (i = 1, 2). Für g = (g1 , g2 ) ∈ G 1 × G 2 setzen wir D(g) := D1 (g1 ) ⊗ D2 (g2 ), d. h. D(g) ist die eindeutig bestimmte lineare Abbildung V1 ⊗ V2 → V1 ⊗ V2 , für die D(g)(v ⊗ w) = D1 (g1 )v ⊗ D2 (g2 )w für alle v ∈ V1 , w ∈ V2 gilt. Man zeige: a. D ist eine Darstellung von P auf dem Trägerraum V1 ⊗ V2 . b. Im Fall G 1 = G 2 = G ist das Tensorprodukt D1 ⊗ D2 gegeben durch D1 ⊗ D2 = D ◦ Δ mit dem Gruppenhomomorphismus Δ : G −→ G × G , g −→ (g, g) . Bemerkung Die hier eingeführte Darstellung D wird manchmal als das äußere Tensorprodukt der Darstellungen D1 , D2 bezeichnet. 20.10 Seien D s , s = 1, 2 zwei Darstellungen einer Gruppe G auf n-dimensionalen Trägerräumen Vs . Man zeige: Sie sind genau dann äquivalent, wenn sie bzgl. geeigneter Basen von V1 , V2 durch ein und dieselbe Matrixdarstellung wiedergegeben werden können. Genauer: D 1 ∼ D 2 genau dann, wenn es Basen (b1s , . . . , bns ) von
Aufgaben
225
Vs , s = 1, 2 sowie eine Matrixdarstellung (ai j (g)) vom Grade n gibt, so dass für s = 1, 2 gilt: D s (g)bsj =
n
ai j (g)bis ,
j = 1, . . . , n .
(20.33)
i=1
20.11 Sei D eine Darstellung einer Gruppe G auf einem endlichdimensionalen Trägerraum V = V1 ⊕ V2 , wobei die Vs , s = 1, 2 zwei n-dimensionale D-invariante Teilräume sind. Setze D s := D V . s
a. Gegeben seien Basen (b1s , . . . , bns ) sowie eine Matrixdarstellung (ai j (g)) so, dass (20.33) für s = 1, 2 gültig ist. Für festes (0, 0) = (ξ, η) ∈ K2 setzen wir dann b j := ξ b1j + ηb2j ,
j = 1, . . . , n
sowie Wξ η := LH(b1 , . . . , bn ). Man zeige: Wξ η ist ebenfalls n-dimensional und D-invariant, und die Darstellung Dξ η := D W ist zu den D s äquivalent. ξη
b. Man folgere: Ist D 1 ∼ D 2 , so gibt es unendlich viele D-invariante Teilräume W ⊆ V , für die die Darstellung D W zu den D s äquivalent ist. (Hinweis: Man verwende Aufgabe 20.10.) c. Man formuliere und beweise analoge Aussagen für m ≥ 2 äquivalente n-dimensionale Darstellungen. Bemerkung Dies zeigt, dass die Zerlegung (20.20) nicht eindeutig sein kann, sobald ein Äquivalenztyp darin mehrfach auftritt. Das ist eine direkte Verallgemeinerung des Verhaltens der Spektralzerlegung beim Auftreten von entarteten Eigenwerten. 20.12 Eine Darstellung D der Gruppe G auf dem Trägerraum V sei gegeben. Ein Vektor v ∈ V heißt dann zyklisch, wenn V = LH({D(g)v | g ∈ G}) . Man zeige: Die Darstellung D ist genau dann irreduzibel, wenn jeder Vektor v = 0 zyklisch ist. 20.13 a. Man zeige: Die natürlichen Darstellungen der Matrixgruppen SO(n), SU(n) auf Rn bzw. Cn sind irreduzibel. (Hinweis: Man verwende die vorige Aufgabe und beachte, dass jeder Einheitsvektor nach dem S CHMIDTschen Orthogonalisierungsverfahren zu einer positiv orientierten Orthonormalbasis ergänzt werden kann. ) b. Man folgere für das Zentrum (Aufgabe 17.5) der orthogonalen und unitären Gruppen die Ergebnisse
226
20 Grundbegriffe der Darstellungstheorie
Z (SU(n)) = {e2π ik/n E | k = 0, 1, . . . , n − 1} , " {E, −E} , falls n gerade, Z (SO(n)) = {E} , falls n ungerade. 20.14 Sei G eine Gruppe und H eine Untergruppe. Ferner sei eine Darstellung D von H auf dem Trägerraum W gegeben. Wir konstruieren nun eine Darstellung T = D G von G, die man als die von D induzierte Darstellung bezeichnet. a. Ist g ∈ G und ist f : G → W eine beliebige Funktion, so bilden wir eine neue Funktion D R (g) f : G → W , indem wir setzen: [D R (g) f ](x) := f (xg) ,
x ∈G.
Damit ist ein Endomorphismus D R (g) ∈ End(F) des Vektorraums F aller Funktionen f : G → W definiert. Man zeige, dass D R eine Darstellung von G ist. (Der Index R steht für „rechts“.) b. Man zeige, dass die Menge V := { f ∈ F | f (hx) = D(h) f (x) für alle x ∈ G , h ∈ H } einen D R -invarianten linearen Teilraum von F bildet. Die induzierte Darstellung D G ist definitionsgemäß die Einschränkung von D R auf V . 20.15 Sei Z = {z 0 , z 1 , . . . , z k } eine endliche Menge und G eine Gruppe, die auf Z transitiv von rechts operiert (vgl. Aufgabe 17.16). Ferner sei H := Σ({z 0 }) der Stabilisator von z 0 und D eine Darstellung von H auf dem Trägerraum W . Man zeige: a. Die induzierte Darstellung D G : G → GL(V ) (Aufgabe 20.14) ist äquivalent zu einer Darstellung T von G auf dem Trägerraum V˜ = W k+1 , bei der für die direkte Zerlegung V˜ = Wz 0 ⊕ Wz1 ⊕ · · · ⊕ Wz k
(20.34)
mit Wz j := {0} × · · · × {0} × 2345 W ×{0} × · · · × {0} ,
j = 0, 1, . . . , k
j-te Stelle
folgendes gilt: (I1) Für alle g ∈ G , j = 0, 1, . . . , k ist T (g)(Wz j ) = Wz j g , und (I2) Für alle h ∈ H , w ∈ W ist T (h)(w, 0, . . . , 0) = (D(h)w, 0, . . . , 0).
Aufgaben
227
(Hinweis: Man setze g0 := e, und für j ≥ 1 wähle man ein g j ∈ G mit z j = z 0 g j . Die lineare Abbildung A : V −→ W k+1 , f −→ ( f (g0 ), f (g1 ), . . . , f (gk )) vermittelt dann die Äquivalenz der Darstellungen.) b. Ist T eine Darstellung von G auf W k+1 , die (I1), (I2) erfüllt, so ist T ∼ D G . c. Sei T ∼ D G und V der Trägerraum von T . Dann besitzt T auf Z ein System von Imprimitivitäten, d. h. eine Abbildung E, die jeder Teilmenge M ⊆ Z einen linearen Operator E(M) ∈ End(V) zuordnet, so dass folgendes gilt: (E1) E(∅) = 0 , E(Z ) = I . (E2) E(M1 ∩ M2 ) = E(M1 )E(M2 ) für M1 , M2 ⊆ Z . (E3) Sind M1 , M2 ⊆ Z disjunkt, so ist E(M1 ∪ M2 ) = E(M1 ) + E(M2 ), (E4) Für M ⊆ Z und g ∈ G ist E(Mg) = T (g)−1 E(M)T (g). (Hinweis: Für T = D G , insbesondere V = V , definiert man E(M) durch " [E(M) f ](g) :=
f (g) , falls z 0 g ∈ M, 0, falls z 0 g ∈ M.
Hieraus folgert man den allgemeinen Fall.) Bemerkung Aus (E2) folgt E(M)2 = E(M), also sind die E(M) Projektionsoperatoren. Man beachte die Analogie zu den Spektralmaßen (Definition 15.1 und Satz 15.2), die natürlich kein Zufall ist. 20.16 Sei G eine endliche Gruppe und A der Vektorraum der komplexen Funktionen auf G, versehen mit der Multiplikation ( f ∗ g)(x) :=
f (x y −1 )g(y)
y∈G
und der Norm f :=
| f (x)| .
x∈G
Man zeige: a. A ist eine BANACH-Algebra mit Eins, und die Abbildung f → f ∗ mit f ∗ (x) := f (x −1 ) ist eine Involution in A (vgl. die Definitionen in 15.12). Man nennt A die Gruppenalgebra zu G und schreibt A = C[G].
228
20 Grundbegriffe der Darstellungstheorie
b. Jedem g ∈ G ordnen wir die Funktion δg ∈ A zu, die für x = g den Wert 1 und sonst den Wert 0 annimmt. Dann gilt δgh = δg ∗ δh . Deshalb kann man G als Teilmenge von A auffassen, indem man g mit δg identifiziert, und dann schreiben sich die Elemente von A in der Form cg g mit cg = f (g) ∈ C . f = g∈G
c. Ist D eine Darstellung von G auf V , so ist durch Ψ ( f ) :=
f (x)D(x)
x∈G
eine Darstellung von A (im Sinne von 15.14) gegeben. Ist umgekehrt Ψ eine gegebene Darstellung von A, so definiert D(g) := Ψ (δg ) eine Darstellung der Gruppe G. d. Eine Darstellung D von G auf einem H ILBERTraum ist genau dann unitär, wenn die entsprechende Darstellung Ψ der Gruppenalgebra eine ∗-Darstellung ist, d. h. wenn für sie gilt: Ψ ( f ∗ ) = Ψ ( f )∗
für alle f ∈ A .
Kapitel 21
Darstellungstheorie kompakter Gruppen
Das einführende Material aus dem vorigen Kapitel ermöglicht es für endliche Gruppen schon, die Darstellungstheorie recht weit voranzutreiben: Zunächst einmal genügt es, sich auf endlichdimensionale Trägerräume zu beschränken (vgl. Aufgabe 20.8), und dann kann man nach dem Satz von M ASCHKE die beteiligten Darstellungen auch als unitär annehmen. Diese aber sind nach Theorem 20.11 vollreduzibel, und für ihre irreduziblen Bausteine gilt das S CHURsche Lemma in seinen beiden Varianten 20.13 und 20.14. Ausgehend vom S CHURschen Lemma kann eine sehr weitreichende algebraische Theorie der Darstellungen endlicher Gruppen entwickelt werden, doch ist diese für die Physik so lange nicht von zentraler Bedeutung, wie es nicht gelingt, sie auf gewisse unendliche Gruppen zu verallgemeinern. Zum Glück ist eine Verallgemeinerung auf kompakte L IE-Gruppen in sehr einfacher, überschaubarer und eleganter Weise möglich, und das ist das Thema des vorliegenden Kapitels. (Wir benutzen hier das Wort „Verallgemeinerung“ und nicht nur „Analogie“, weil man jede endliche Gruppe als (nulldimensionale) kompakte L IEGruppe auffassen kann. Die dabei betrachtete Topologie ist die diskrete aus Beispiel 1.5c.) Wir beginnen in Abschn. A mit der Einführung eines fundamentalen Hilfsmittels, das es gestattet, Funktionen auf einer kompakten Gruppe – und allgemeiner auf einer lokalkompakten topologischen Gruppe – in sinnvoller Weise zu mitteln. In Abschn. B bringen wir dann die Funktionalanalysis als zusätzliches Werkzeug ins Spiel und betrachten unendlichdimensionale Darstellungen auf BANACH- und H ILBERTräumen. Insbesondere beweisen wir hier eine geeignete Verallgemeinerung des Satzes von M ASCHKE. Alsdann führen wir ein weiteres funktionalanalytisches Hilfsmittel ein, den sog. W EYL-Operator und beweisen mit seiner Hilfe, dass jede irreduzible Darstellung einer kompakten Gruppe endlichdimensional ist (Abschn. C). Ausgehend von dieser Erkenntnis können die fundamentalen Orthogonalitätsrelationen für die Matrixelemente und die Charaktere von irreduziblen Darstellungen formuliert und bewiesen werden (Abschn. D). Jede endliche Gruppe G hat auf dem |G|-dimensionalen Raum W aller Funktionen f : G → K zwei naheliegende Darstellungen, nämlich die rechtsreguläre Darstellung
K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_21, C Springer-Verlag Berlin Heidelberg 2010
229
230
21 Darstellungstheorie kompakter Gruppen
[D R (g) f ](x) := f (xg),
f ∈ W , x, g ∈ G
sowie die linksreguläre Darstellung [D L (g) f ](x) := f (g −1 x),
f ∈ W , x, g ∈ G,
und der nächste Schritt in der Entwicklung der Darstellungstheorie von endlichen Gruppen würde darin bestehen, die Zerlegung dieser Darstellungen in ihre irreduziblen Bestandteile zu untersuchen. Bei unendlichen Gruppen sind die regulären Darstellungen von unendlicher Dimension, aber wieder gelingt es mit Hilfe von etwas Funktionalanalysis, diesen Schritt auch für unendliche kompakte Gruppen zu vollziehen. Das ist das Thema der letzten beiden Abschnitte, wo wir zum einen den berühmten Satz von P ETER -W EYL beweisen, zum anderen ein Kriterium dafür herleiten, wann ein System von irreduziblen Darstellungen einer gegebenen kompakten Gruppe bis auf Äquivalenz alle irreduziblen Darstellungen dieser Gruppe enthält. Das Material dieses Kapitels bildet den Kern desjenigen Teils der Darstellungstheorie, der in der Physik so vielfältige Anwendungen besitzt, und daher ist es eine unabdingbare Voraussetzung für ein korrektes mathematisches Verständnis dieser Anwendungen. Es ist zugegebenermaßen recht theoretisch und wird nur durch ein einziges Beispiel aufgelockert, in dem gezeigt wird, wie man die klassische Theorie der F OURIERreihen als einen Teil der Darstellungstheorie der Gruppe U(1) interpretieren kann. Weitere Beispiele und Anwendungen werden jedoch in den nächsten Kapiteln folgen. Wie schon erläutert, können die Ergebnisse und Methoden dieses Kapitels speziell auf endliche Gruppen angewendet werden, doch kann die Darstellungstheorie für endliche Gruppen noch viel weiter ausgebaut werden, indem man Zählprozesse und andere rein algebraische Methoden hinzunimmt. So entsteht eine reichhaltige mathematische Theorie, die zu den Glanzstücken der modernen Algebra zählt, auf die wir jedoch nicht näher eingehen können. Für gewisse Typen von endlichen Gruppen – vor allem die Permutationsgruppen – spielt die Bestimmung der irreduziblen Darstellungen aber auch für die Physik eine wichtige Rolle, und detaillierte Informationen hierzu findet man in etlichen physikalisch orientierten Büchern wie etwa [18, 58, 94] oder auch in mathematischen Einführungen wie [82]. Am anderen Ende der Skala haben wir die nicht-kompakten L IE-Gruppen, zu denen immerhin einige der für den Physiker interessantesten Gruppen zählen (vgl. Aufgabe 19.2). Für sie ist keine einheitliche Theorie nach dem Vorbild der kompakten Gruppen möglich, doch gibt es für große Beispielklassen sehr weitreichende Resultate, und die Forschung in diesem Bereich ist auch gegenwärtig stark im Fluss. In einem Ausblick am Schluss von Abschn. E erläutern wir einige der Phänomene, mit denen hier zu rechnen ist, an einem einfachen Beispiel. Für physikalisch relevante nicht-kompakte Gruppen wie die L ORENTZ-Gruppe und ihre universelle Überlagerung SL(2, C), die P OINCARÉgruppe, die G ALILEIgruppe und die Gruppe der euklidischen Bewegungen ist die Darstellungstheorie jedoch trotz der erwähnten Schwierigkeiten sehr gut untersucht, und man findet Einzelheiten hierüber in vielen Monographien wie z. B. [10, 13, 14, 30, 48, 80] oder [94].
A
Das H AAR-Integral
231
Ein weiteres wichtiges Thema, auf das wir nicht näher eingehen können, sind die induzierten Darstellungen. Sie sind von fundamentaler Bedeutung für die Grundlagen der Quantenmechanik und gestatten es u.a., die dynamischen Grundgleichungen aus elementaren Symmetriepostulaten abzuleiten (vgl. etwa [5, 45, 55, 56, 87]). In den Aufgaben 20.14, 20.15 und 24.2 vermitteln wir immerhin einen ersten Eindruck von induzierten Darstellungen.
A Das H AAR-Integral Für die Untersuchung von (insbesondere unendlich-dimensionalen) Darstellungen ist der Begriff des H AARschen Maßes oder H AARschen Integrals einer L IE-Gruppe besonders wichtig. Es handelt sich dabei um ein Maß auf G, das eine vernünftige Mittelung von Funktionen über die gesamte Gruppe ermöglicht. Dazu sei (vgl. Definition 10.38) C(G, K)
der K-Vektorraum der stetigen Funktionen f : G −→ K,
Cc (G, K)
der K-Vektorraum der stetigen Funktionen f : G −→ K mit kompaktem Träger.
Auf einer kompakten Gruppe stimmen diese Räume überein. Wir erinnern daran, dass der R IESZsche Darstellungssatz (Theorem 10.40) auch auf Mannigfaltigkeiten und insbesondere auf unseren L IE-Gruppen gilt (vgl. die Erörterungen am Schluss von Abschn. 10F). Das bedeutet, dass wir statt eines R ADONmaßes μ auf G ebenso gut das positive lineare Funktional λ auf Cc (G) betrachten können, das sich mittels λ( f ) = f dμ daraus ergibt, und das werden wir – hauptsächlich der einfacheren Notation wegen – im folgenden zumeist tun. Die Mittelbildung, auf die wir hinauswollen, sollte gegen Verschiebung einer Funktion und gegen Übergang zum inversen Argument invariant sein. Um dies präzise formulieren zu können, definieren wir: Definitionen 21.1 Sei f ∈ C(G, K) und sei A ∈ G ein festes Element. Dann definiert man die folgenden Funktionen: a. Linkstranslation: (L A f )(X ) := f (AX ) , X ∈ G, b. Rechtstranslation: (R A f )(X ) := f (X A) , X ∈ G, c. Inversion: (I f )(X ) := f (X −1 ) , X ∈ G.
232
21 Darstellungstheorie kompakter Gruppen
Mit Hilfe dieser Operationen charakterisieren wir gewisse positive lineare Funktionale auf Cc (G, K) und damit auch die entsprechenden R ADONmaße. Definitionen 21.2 a. Ein positives lineares Funktional λ : Cc (G, K) −→ K heißt ein linkes H AARIntegral, wenn es = 0 und linksinvariant ist, d. h. für f ∈ Cc (G, K) gilt: λ(L A f ) = λ( f )
für alle A ∈ G.
b. Ein positives lineares Funktional ρ : Cc (G, K) −→ K heißt ein rechtes H AARIntegral, wenn es = 0 und rechts-invariant ist, d. h. für f ∈ Cc (G, K) gilt: ρ(R A f ) = ρ( f )
für alle A ∈ G.
c. Ein H AAR-Integral μ : Cc (G, K) −→ K heißt invers-invariant, wenn μ(I f ) = μ( f )
für alle f ∈ Cc (G, K).
d. Ein R ADONmaß μ auf G heißt linkes (bzw. rechtes) H AARsches Maß, wenn das entsprechende Funktional f → G f dμ ein linkes (bzw. rechtes) H AARsches Integral ist. Ist G eine endliche Gruppe und |G| ihre Ordnung, so zeigt man leicht als Übung, dass durch ν( f ) :=
1 f (x) , |G|
f : G −→ K
x∈G
ein H AARsches Integral definiert ist, das rechts-, links- und invers-invariant ist. Ebenso ist für die Gruppe U(1) = {eiϕ | 0 ≤ ϕ < 2π } durch 1 λ( f ) := 2π
2π f (eiϕ ) dϕ ,
f ∈ C(U(1), C)
0
ein H AARsches Integral mit denselben Invarianzeigenschaften definiert. In beiden Fällen ist der Normierungsfaktor so gewählt, dass die konstante Funktion f ≡ 1 das Integral 1 hat, womit die Anwendung des Funktionals als eine Mittelung aufgefasst werden kann. Als Mannigfaltigkeit ist U(1) nichts anderes als der Kreis S1 := {(x, y) ∈ R2 | x 2 + y 2 = 1},
A
Das H AAR-Integral
233
und wenn wir diesen durch Ξ (ϕ) := (cos ϕ, sin ϕ) ,
0 ≤ ϕ < 2π
parametrisieren, so sehen wir, dass das o. a. H AARsche Integral als λ( f ) =
1 2π
S1
fω
geschrieben werden kann, wobei ω die rotationsinvariante 1-Form ω = i ∗ (xdy − ydx) = dϕ
mit Einbettung i : S1 → R2
ist (Aufgabe 21.1). Die Invarianz des Funktionals λ rührt also davon her, dass man eine invariante Differentialform integriert. Dieses Verfahren kann man auf beliebige L IE-Gruppen ausdehnen: Ist G eine m-dimensionale L IE-Gruppe mit der L IE-Algebra g, so beschafft man sich eine nullstellenfreie invariante m-Form ω aus einer m-fachen alternierenden Multilinearform auf g = Te G, indem man solch eine Multilinearform mittels Linksmultiplikation (bzw. Rechtsmultiplikation) auf die Tangentialräume an den übrigen Punkten von G transportiert, ähnlich wie wir in 19.15 invariante Vektorfelder aus den Vektoren von g gewonnen haben. Wegen ω X = 0 für alle X ∈ G legt dies auch eine Orientierung auf der Mannigfaltigkeit G fest (vgl. Definition 3.13 und den dortigen Äquivalenzbeweis), und daher kann man m-Formen f ω über G integrieren (vgl. die Sätze 4.10 und 4.12). Nun definiert man f ω,
λ( f ) :=
(21.1)
G
wenn man ω links-invariant gewählt hat, und analog ρ( f ), falls man eine rechtsinvariante Form benutzt hat. Für den Fall einer linearen L IE-Gruppe, wo sich alles etwas einfacher formulieren lässt, schildern wir diese Konstruktion jetzt genauer. Dabei beschränken wir uns auf den links-invarianten Fall – für rechts-invariante Formen und H AAR-Integrale verläuft alles völlig analog. Lemma 21.3 Sei G eine lineare L IE-Gruppe, g := L(G), und für Y ∈ G sei Y : G −→ G , X −→ Y X die Linksmultiplikation mit Y . Ist σ ∈ Altm (g) eine alternierende m-lineare Form auf g, so ist durch ω X (A1 , . . . , Am ) := σ (X −1 A1 , . . . , X −1 Am ) für X ∈ G , A j ∈ TX G
(21.2)
eine m-Form auf G definiert, und diese ist links-invariant in dem Sinn, dass ∗Y ω = ω für alle Y ∈ G.
234
21 Darstellungstheorie kompakter Gruppen
Beweis Sei G ≤ GL(n, K), und sei Y ∈ G für den Moment fest. Der Diffeomorphismus Y : G → G ist die Einschränkung der linearen Abbildung Kn×n −→ Kn×n , X −→ Y X, und daher ist sein Differential im Punkt Z ∈ G gegeben durch d(Y ) Z : TZ G −→ TY Z G , A −→ Y A. (Man kann das auch direkt an Hand der Definition 1.29a nachrechnen.) Für A ∈ TX G ist insbesondere X −1 A ∈ TE G = g, also ist die rechte Seite von (21.2) sinnvoll und definiert in der Tat eine m-Form auf G. Zum Nachrechnen der Invarianz benötigen wir außer (21.2) nur die Definition von (Y )∗ aus 3.11b. Für X, Y ∈ G und A1 , . . . , Am ∈ TX G hat man nämlich: (∗Y ω) X (A1 , . . . , Am ) = ωY X (Y A1 , . . . , Y Am ) = σ (X −1 Y −1 Y A1 , . . . , X −1 Y −1 Y Am ) = σ (X −1 A1 , . . . , X −1 Am ) = ω X (A1 , . . . , Am ). Nun betrachten wir eine feste m-lineare Form σ = 0 auf g und bilden dazu die m-Form ω ∈ Ω m (G) gemäß (21.2). (Auch bei einer Gruppe von komplexen Matrizen muss die L IE-Algebra hier als reeller Vektorraum aufgefasst werden!) Dann ist überall ω X = 0, so dass ω tatsächlich eine Orientierung auf G festlegt. Das lineare Funktional λ, das in Bezug auf diese Orientierung durch (21.1) definiert ist, ist somit positiv. Es ist sogar ein linkes H AAR-Integral, denn mit der Transformationsformel in der Form von Korollar 4.13 ergibt sich für f ∈ Cc (G) , Y ∈ G λ(L Y f ) = G
(∗Y f )ω =
G
(∗Y f )(∗Y ω) =
G
∗Y ( f ω) =
f ω = λ( f ). G
Bemerkungen (i) Verwendet man −ω statt ω, so erhält man dasselbe H AARsche Integral, da hierdurch gleichzeitig die umgekehrte Orientierung auf G zu Grunde gelegt wird. (ii) In lokalen Koordinaten kann das so konstruierte H AARsche Integral auch leicht explizit berechnet werden, und da viele L IE-Gruppen sogar globale Parametrisierungen gestatten (vgl. Kap. 18 sowie die Bemerkungen über den Wertebereich der Exponentialfunktion in Kap. 19), ist oft auch eine global für alle f ∈ Cc (G) gültige Formel möglich. Betrachten wir also eine Parametrisierung Ξ : Ω → U einer offenen Teilmenge U von G auf einem Gebiet Ω ⊆ Rm . Ist Tr f ⊆ U , so haben wir nach Satz 4.10 λ( f ) = f (Ξ (t))W (t) dm t (21.3) Ω
A
Das H AAR-Integral
235
mit W (t) = (Ξ ∗ ω)t (e1 , . . . , em ) . Da die Funktion W keine Nullstelle hat, kann sie auf der zusammenhängenden Menge Ω das Vorzeichen nicht wechseln, und man sorgt (evtl. durch Vertauschen von zwei der Komponenten von t = (t1 , . . . , tm )) dafür, dass überall W (t) > 0 ist (orientierungstreue Parametrisierung!). Wir schreiben σ = ω E in der Gestalt σ = β 1 ∧· · ·∧β m , wobei (β 1 , . . . , β m ) eine Basis des Dualraums g∗ ist. Mittels (2.9) kann man W (t) dann explizit berechnen: W (t) = ωΞ (t) (dΞt (e1 ), . . . , dΞt (em )) ∂Ξ ∂Ξ ∂Ξ , . . . , Ξ (t)−1 = σ Ξ (t)−1 = det β j Ξ (t)−1 , ∂t1 ∂tm ∂tk also ergibt sich
j W (t) = det wk (t)
∂Ξ j mit wk (t) = β j Ξ (t)−1 (t) . ∂tk
(21.4)
(iii) Besonders einfach wird dies, wenn man von einer Orthonormalbasis (B1 , . . . , Bm ) in Bezug auf das Skalarprodukt A | B = Spur A T B ausgeht und (β 1 , . . . , β m ) als die dazu duale Basis wählt. Dann ist β j (A) = B j | A , und wir bekommen ∂Ξ j (t) , j, k = 1, . . . , m . (21.5) wk (t) = Spur B Tj Ξ (t)−1 ∂tk (iv) Formel (21.3) zeigt auch, dass das Maß λ die Bedingung (T) erfüllt, die im Anschluss an Satz 10.37 in Abschn. 10F erörtert wurde. Allgemein hat man: Theorem 21.4 Jede L IE-Gruppe G besitzt ein linkes H AAR-Integral λ und ein rechtes H AAR-Integral ρ. Beide sind bis auf eine positive Konstante eindeutig bestimmt, und sie erfüllen Bedingung (T) aus Abschn. 10F Dies gilt sogar noch in wesentlich allgemeinerem Rahmen, nämlich für lokalkompakte topologische Gruppen. Details hierüber findet man z. B. in [38], Bd. I, oder auch in [39], und auch die Eindeutigkeitsaussage des Theorems ist dort bewiesen. Wir benötigen das H AARsche Integral aber in erster Linie für kompakte L IE-Gruppen, und für diese kann die Eindeutigkeit sehr einfach bewiesen werden. Sie folgt nämlich unmittelbar aus dem folgenden Satz: Satz 21.5 Die linken H AAR-Integrale auf einer kompakten Gruppe G sind auch rechts-invariant, die rechten auch links-invariant, und sie unterscheiden sich alle nur um einen positiven konstanten Faktor.
236
21 Darstellungstheorie kompakter Gruppen
Beweis Sei λ ein linkes und ρ ein rechtes H AAR-Integral auf G. Wir bezeichnen diese linearen Funktionale und die entsprechenden R ADONmaße auf G immer mit demselben Buchstaben, schreiben also λ( f ) = G f dŁλ usw. Da G kompakt ist, hat es endliches Maß, d. h. wir haben Zahlen b := λ(G) = λ(1) > 0 ,
c := ρ(G) = ρ(1) > 0.
Nun sei f ∈ Cc (G) beliebig. Wegen der Linksinvarianz von λ ist f (X Y ) dλ(Y ) = λ( f ) für alle X ∈ G, G
und wegen der Rechtsinvarianz von ρ ist f (X Y ) dρ(X ) = ρ( f )
für alle Y ∈ G.
G
Das Produktmaß λ ⊗ ρ ist ein R ADONmaß auf der kompakten Mannigfaltigkeit G × G, und die Funktion G × G −→ K , (X, Y ) −→ f (X Y ) ist auf G × G stetig. Daher ist sie λ ⊗ ρ-summierbar (Satz 10.37 in seiner auf Mannigfaltigkeiten verallgemeinerten Form!), und folglich ist der Satz von F UBINI anwendbar. Daher haben wir: cλ( f ) = f (X Y ) dλ(Y ) dρ(X ) G G = f (X Y ) dρ(X ) dλ(Y ) = bρ( f ). G
G
Also ist λ = (b/c)ρ, und insbesondere ist λ auch rechts-invariant und ρ auch linksinvariant. Für zwei linke H AAR-Integrale λ1 , λ2 folgt daraus λ = (bi /c)ρ (wo bi := λi (G)), also λ2 = (b2 /b1 )λ1 . Auf einer kompakten Gruppe braucht man also zwischen rechten und linken H AARschen Integralen nicht zu unterscheiden und spricht einfach von H AARschen Integralen bzw. H AARschen Maßen. Übergang von λ zu λ0 :=
1 λ λ(G)
führt offenbar zu einem H AARschen Integral, das die Normierungsbedingung λ0 (G) = 1 erfüllt, und dieses ist eindeutig bestimmt. Man nennt es das normierte H AARsche Integral auf G, und entsprechend für das Maß.
A
Das H AAR-Integral
237
Wir wollen noch einige Eigenschaften des H AARschen Integrals herleiten, die auch den nicht-kompakten Fall betreffen. Sei also G irgendeine lineare L IE-Gruppe und sei λ ein linkes H AAR-Integral auf G. Für festes Y ∈ G und f ∈ Cc (G) betrachten wir μY ( f ) := λ(RY −1 f ).
(21.6)
Dann ist μY sicher ein positives lineares Funktional auf Cc (G). Da Rechts- und Linkstranslationen vertauschbar sind, folgt für ein A ∈ G μY (L A f ) = λ(RY −1 L A f ) = λ(L A RY −1 f ) = λ(RY −1 f ) = μY ( f ) wegen der Links-Invarianz von λ. Also ist auch μY linksinvariant und daher ebenfalls ein linkes H AAR-Integral. Nach Theorem 21.4 existiert daher eine Konstante Δ(Y ) > 0, so dass μY ( f ) = Δ(Y )λ( f )
für alle f ∈ Cc (G),
(21.7)
und Δ ist offenbar eine stetige Funktion auf G. Aus (21.7) folgt für X, Y ∈ G weiter Δ(X Y )λ( f ) = μ X Y ( f ) = λ(R(X Y )−1 f ) = λ(RY −1 (R X −1 f )) = = Δ(Y )λ(R X −1 f ) = Δ(Y )Δ(X )λ( f ). Es gilt somit Δ(X Y ) = Δ(X )Δ(Y ) ,
X, Y ∈ G.
(21.8)
Da verschiedene linke H AAR-Integrale zueinander proportional sind, hängt Δ nicht davon ab, welches H AAR-Integral für seine Definition benutzt wurde, wie sofort aus (21.6), (21.7) hervorgeht. Definitionen 21.6 a. Die positive stetige Funktion Δ : G −→ R, welche für ein linkes H AAR-Integral λ auf G die Bedingung λ(RY −1 f ) = Δ(Y )λ( f ),
f ∈ Cc (G)
(und damit auch (21.8)) erfüllt, heißt die Modularfunktion von G. b. Die Gruppe G heißt unimodular, wenn Δ ≡ 1.
(21.7)
238
21 Darstellungstheorie kompakter Gruppen
Auf einer unimodularen Gruppe ist jedes linke H AAR-Integral nach (21.7) gleichzeitig ein rechtes H AAR-Integral, und man kann dann wieder einfach von einem H AAR-Integral sprechen. Mit diesen Begriffsbildungen lautet Satz 21.5 einfach: Jede kompakte Gruppe ist unimodular.
Die abelschen L IE-Gruppen sind trivialerweise ebenfalls unimodular. Beispiele für weitere unimodulare Gruppen sowie für solche, die es nicht sind, finden sich in den Aufgaben 21.4, 21.7 und 21.8. Die Bedeutung der Modularfunktion wird klar, wenn man in den Integralen die Substitution X → X −1 vornimmt. Es gilt nämlich: Satz 21.7 Sei λ ein linkes H AAR-Integral auf der L IE-Gruppe G, und G habe die Modularfunktion Δ. Dann gilt λ( f ) = λ
1 Δ
I( f ) ,
f ∈ Cc (G).
(21.9)
Insbesondere ist jedes H AAR-Integral auf einer unimodularen Gruppe inversinvariant. Beweis Wir setzen zur Abkürzung: f ∗ := I ( f ) ,
d. h. f ∗ (X ) = f (X −1 ), 1
μ( f ) = λ f∗ . Δ
(21.10) (21.11)
Dann ist es eine leichte Übung zu zeigen, dass μ(L Y f ) = μ( f ) für alle Y ∈ G, f ∈ Cc (G),
(21.12)
d. h. μ ist ebenfalls ein linkes H AAR-Integral auf Cc (G). Nach Theorem 21.4 gibt es daher eine Konstante C > 0, so dass μ( f ) = cλ( f )
für alle f ∈ Cc (G).
(21.13)
Es ist also c = 1 zu zeigen. Wegen Δ(E) = 1 und der Stetigkeit von Δ gibt es zu jedem ε > 0 eine Umgebung Uε von E in G mit
1 − 1 < ε Δ(X )
für alle X ∈ Uε .
(21.14)
Sei nun die Funktion h ∈ Cc (G) so gewählt, dass λ(h) > 0, aber h ≡ 0 auf G\Uε und h ∗ (X ) = h(X ) ,
X ∈ G.
(21.15)
B
Unendlich-dimensionale Darstellungen
239
Um dies zu erreichen, wählt man eine Umgebung U ⊆ Uε der Eins, für die gilt: X ∈U
⇒
X −1 ∈ Uε ,
und dann wählt man h 0 ∈ Cc (G) so, dass h 0 ≥ 0 , λ(h 0 ) > 0 und h 0 |G\U ≡ 0. Schließlich setzt man h(X ) := h 0 (X ) + h 0 (X −1 ). Dann folgt aus (21.14) h(X ) −
1 h(X ) ≤ εh(X ) Δ(X )
für alle X ∈ G
(21.16)
und daher durch Integration auch 1 h ≤ ελ(h) . λ(h) − λ Δ
(21.17)
1 1 h =λ h ∗ = cλ(h) , Δ Δ
(21.18)
Wegen (21.15) ist aber λ
und dies liefert mit (21.17) wegen λ(h) > 0 das Ergebnis |1 − c| < ε , d. h. c = 1, da ε > 0 beliebig war.
B Unendlich-dimensionale Darstellungen Bei den grundlegenden Definitionen in Kap. 20 war es durchaus zugelassen, dass der Trägerraum V einer Darstellung unendliche Dimension hat, und bei L IE-Gruppen spielen solche unendlich-dimensionalen Darstellungen auch eine wichtige Rolle. Dabei müssen wir jedoch beachten, dass bei unendlich-dimensionalen Darstellungen auch Stetigkeitseigenschaften zu berücksichtigen sind. Definition 21.8 Sei G eine lineare L IE-Gruppe, E ein BANACHraum und D : G → B(E) eine Darstellung von G auf E. Diese Darstellung heißt stetig, wenn D(g)x − D(g0 )x −→ 0 für g −→ g0 in G und alle x ∈ E. Die Operatoren D(g) gehören also zur Gruppe G(E) aller beschränkten linearen Operatoren in E, die eine beschränkte Inverse besitzen. Eine stetige Darstellung von G auf E ist somit ein Gruppenhomomorphismus D von G in die Gruppe G(E), bei dem für jeden Vektor x ∈ E die Abbildung G −→ E , g −→ D(g)x stetig ist.
240
21 Darstellungstheorie kompakter Gruppen
Beispiel 21.9 Auf E = L p (Rn ) (1 ≤ p < ∞) hat die orthogonale Gruppe O(n) die Darstellung (D(R)ψ)(x) := ψ(R −1 x),
R ∈ O(n),
(21.19)
die (20.28) verallgemeinert. Da | det R| = 1 ist für R ∈ O(n), zeigt die Transformationsformel für Integrale sofort, dass D(R)ψ p = ψ p ist, also D(R) ∈ B(E) und ebenso D(R)−1 = D(R −1 ) ∈ B(E). Wir zeigen, dass die Darstellung stetig ist. Sei also R = limk→∞ Rk in O(n), und sei zunächst h ∈ Cc (Rn ). Da h gleichmäßig stetig ist, konvergieren die h(Rk−1 x) gleichmäßig gegen h(R −1 x), und ihre Träger liegen in einer gemeinsamen kompakten Menge K ⊆ Rn . Daher haben wir p
D(R)h − D(Rk )h p = K
|h(R −1 x) − h(Rk−1 x)| p dx −→ 0
für k → ∞. Für beliebiges ψ ∈ E und ε > 0 beachten wir, dass man nach Satz 10.39 ein h ∈ Cc (Rn ) findet, für das ψ − h p < ε/3 ist. Dann sind auch D(Rk )ψ − D(Rk )h p < ε/3 und ebenso für D(R)ψ − D(R)h p , also folgt für alle genügend großen k D(R)ψ − D(Rk )ψ p ≤
ε ε + D(R)h − D(Rk )h p + < ε, 3 3
und das bedeutet, dass die gewünschte Beziehung D(R)ψ = limk→∞ D(Rk )ψ gilt. Bemerkung Dieses Beispiel zeigt auch, warum es unangebracht ist, die stärkere Bedingung D(R) − D(Rk ) → 0 für R = limk→∞ Rk zu fordern. Sind nämlich R, R zwei verschiedene Elemente von O(n), so kann man stets (auch wenn sich R und R noch so wenig unterscheiden!) eine Funktion h ∈ Cc (Rn ) finden, für die D(R)h und D(R )h disjunkte Träger haben. Man muss dazu den Träger von h nur in hinreichend großer Entfernung vom Ursprung ansiedeln (vgl. Abb. 21.1). Dann ist aber p p D(R)h − D(R )h p = 2 |h| p dx = 2h p , also ist D(R) − D(R ) ≥ 21/ p für R = R . Durch Verwendung des H AARschen Integrals sowie von etwas zusätzlicher Funktionalanalysis sind wir nun in der Lage, Theorem 20.6 in wesentlich allgemeinerer Form auszusprechen: Theorem 21.10 (Allgemeiner Satz von M ASCHKE) Jede stetige Darstellung D einer kompakten L IE-Gruppe G auf einem komplexen H ILBERTraum H ist zu einer
B
Unendlich-dimensionale Darstellungen
241
Tr D(R)h Tr h Abb. 21.1 Beliebig kleine Drehungen können zu disjunkten Trägern führen
unitären stetigen Darstellung äquivalent. Außerdem gibt es auf H ein alternatives Skalarprodukt, dessen zugehörige Norm zur ursprünglichen Norm auf H äquivalent ist, und in Bezug auf das die Darstellung D selbst unitär ist. Beweis Für jedes feste u ∈ H ist die Funktion G g −→ D(g)u eine stetige Funktion auf dem kompakten Raum G, also beschränkt, d. h. c(u) := supg∈G D(g)u < ∞. Das Prinzip von der gleichmäßigen Beschränktheit,1 das in jedem Lehrbuch der Funktionalanalysis formuliert und bewiesen wird, zeigt dann, dass sogar die Operatornormen D(g) beschränkt bleiben, dass also c0 := sup D(g) < ∞ g∈G
ist. Für alle u ∈ H , g ∈ G folgt u = D(g)−1 D(g)u ≤ ≤ D(g)−1 · D(g)u ≤ c0 D(g)u, also D(g)u ≥ (1/c0 )u und somit c0−1 u ≤ D(g)u ≤ c0 u
∀ g ∈ G , u ∈ H.
(21.20)
Nun sei λ das normierte H AARsche Maß auf G. Wir definieren ein neues Skalarprodukt durch (u | v) := D(g)u | D(g)v dλ(g). G
Eine triviale Rechnung zeigt, dass dies ein Skalarprodukt ist, und wie im Beweis von Theorem 20.6 bestätigt man, dass (D(h)u | D(h)v) = (u | v)
∀ u, v ∈ H , h ∈ G.
(21.21)
1 Auf dieses Theorem (engl. „uniform boundedness principle“) wurde im Zusammenhang mit Theorem 9.12 schon einmal hingewiesen.
242
21 Darstellungstheorie kompakter Gruppen
In Bezug auf das neue Skalarprodukt ist D also unitär. Aus (21.20) folgt c0−2 u2 ≤ (u | u) ≤ c02 u2
∀ u ∈ H,
und somit ist die von dem neuen Skalarprodukt gestiftete Norm (u | u)1/2 tatsächlich äquivalent zur gegebenen Norm. Ferner folgt aus (21.20) |(u | v)| ≤ G
|D(g)u | D(g)v | dλ(g) ≤ c02 u · v ,
also ist das neue Skalarprodukt eine beschränkte Sesquilinearform auf H und wird daher (vgl. Theorem 8.18) durch einen eindeutigen Operator T ∈ B(H) repräsentiert, d. h. wir haben (u | v) = u | T v ,
u, v ∈ H.
Aus (v | u) = (u | v) und der Eindeutigkeit des repräsentierenden Operators T folgt T ∗ = T . Nach (21.20) haben wir überdies für jedes u ∈ H u | T u = G
D(g)u2 dλ(g) ≥ c0−2 u2 ,
und nach Theorem 9.10 folgt hieraus für das Spektrum des selbstadjungierten Operators T : σ (T ) ⊆ [c0−2 , c02 ]. Insbesondere ist T positiv und hat daher eine positive selbstadjungierte Quadratwurzel S = T 1/2 (vgl. Beispiel 16.9). Nach dem spektralen Abbildungssatz (Satz 16.7) ist σ (S) ⊆ [c0−1 , c0 ], insbesondere also 0 ∈ σ (S), d. h. S hat eine beschränkte Inverse S −1 . Durch U (g) := S D(g)S −1 ,
g∈G
ist offenbar eine stetige Darstellung von G definiert, die zu D äquivalent ist, und wie im Beweis von 20.6 bestätigt man, dass U eine unitäre Darstellung ist, denn wegen Su | Sv = u | S 2 v = u | T v = (u | v) gilt (20.14) auch hier. Zum Schluss dieses Abschnitts greifen wir den aus Definition 20.7c bekannten Begriff des Tensorprodukts noch einmal auf. Für stetige Darstellungen D1 , D2 auf H ILBERTräumen H1 , H2 beliebiger Dimension kann man ebenfalls das Tensorprodukt D = D1 ⊗ D2 bilden, denn wenn man das in Abschn. 7E besprochene Tensorprodukt von H ILBERTräumen zu Grunde legt, so ist durch Gl. (20.17) für jedes g ∈ G ein beschränkter linearer Operator D(g) im H ILBERTraum H := H1 ⊗H2 definiert, und diese Operatoren bilden eine stetige Darstellung von G. Nach
C
Irreduzible Darstellungen kompakter Gruppen
243
Definition des Skalarprodukts in H ist auch klar, dass das Tensorprodukt zweier unitärer Darstellungen wieder unitär ist.
C Irreduzible Darstellungen kompakter Gruppen In diesem Kapitel betrachten wir von jetzt ab ausschließlich stetige Darstellungen einer kompakten L IE-Gruppe G. Für das normierte H AARsche Maß auf G führen wir keinen eigenen Buchstabenein, sondern schreiben die entsprechenden Integra le einfach als f (g) dg oder G f (g) dg. Wie wir in Abschn. A gesehen haben, bedeutet dies, dass die Funktion f über G „gemittelt“ wird. Zunächst ist zu beachten, dass auch Funktionen mit Werten in einem H IL BERT raum ohne weiteres über G gemittelt werden können: Satz und Definition 21.11 Sei H ein H ILBERTraum und F : G → H eine stetige Funktion. Dann existiert genau ein y ∈ H mit für alle z ∈ H. (21.22) y | z = F(g) | z dg G
Man nennt y das Integral von F über G und schreibt y= F(g) dg. G
Es hat folgende Eigenschaften: a. Das Integral hängt linear von F ab, und es gilt F(g) dg ≤ F(g) dg. G
(21.23)
G
b. Ist V ⊆ H ein linearer Teilraum und F(g) ∈ V für alle g ∈ G, so ist ¯ G F(g) dg ∈ V . Beweis Wegen supg∈G F(g) < ∞ definiert die rechte Seite von (21.22) offenbar ein stetiges lineares Funktional auf H , und dieses wird nach Theorem 8.16 eindeutig durch einen Vektor y ∈ H repräsentiert. Die Linearität des so definierten Integrals folgt unmittelbar aus der Eindeutigkeit, und (21.23) folgt aus y = sup |y | z | z≤1
(vgl. Gl. (8.17)) und der C AUCHY-S CHWARZschen Ungleichung. Unter den Voraussetzungen von b. ist F(g) | z = 0 für alle g ∈ G , z ∈ V ⊥ , also auch F(g) dg ∈ V ⊥⊥ = V¯ (wende Theorem 7.13 auf U := V¯ an). G
244
21 Darstellungstheorie kompakter Gruppen
Nach dem Satz von M ASCHKE (Theorem 21.10) können wir uns o.B.d.A. auf unitäre stetige Darstellungen beschränken, und das werden wir im folgenden durchweg tun. Ein wesentliches Hilfsmittel bei der Untersuchung solcher Darstellungen bilden die sogenannten W EYL-Operatoren: Satz 21.12 Sei D eine unitäre Darstellung einer kompakten Gruppe G auf einem H ILBERTraum H . Für festes x ∈ H definiert man den W EYL-Operator K x : H −→ H durch K x y :=
D(g)x | y D(g)x dg ,
y ∈ H.
(21.24)
G
Dann gilt a. K x ist ein kompakter und positiver selbstadjungierter Operator. b. K x vertauscht mit allen Operatoren D(h), h ∈ G. c. Ist x = 0, so ist x | K x x > 0, insbesondere K x = 0. Beweis a. Im ersten Schritt zeigen wir, dass K x ein beschränkter selbstadjungierter Operator in H ist. Für feste x, y ∈ H ist F(g) := D(g)x | y D(g)x ,
g∈G
(21.25)
eine stetige H -wertige Funktion auf G, weil D nach Voraussetzung eine stetige Darstellung ist. Für feste x, y ∈ H ist daher nach Satz 21.11 ein Vektor K x y ∈ H wohldefiniert, und dieser hängt linear von y ab. Dabei ist ax (z, y) := z | K x y =
D(g)x | y z | D(g)x dg
(21.26)
G
für x, y, z ∈ H , und dies definiert (bei festem x) eine beschränkte Sesquilinearform auf H × H , denn wegen D(g)x = x und (21.23) ist für alle z, y ∈ H |ax (y, z)| ≤
D(g)x2 y · z dg ≤ x2 y · z, G
und somit ist K x beschränkt, K x ≤ x2. Aus (21.26) ersieht man auch sofort, dass ax (y, z) = ax (z, y) und ax (y, y) = |D(g)x | y |2 dg ≥ 0, also ist K x selbstadjungiert und positiv. b. Als nächstes zeigen wir, dass K x mit allen Operatoren D(h), h ∈ G, vertauscht. Aus (21.26) folgt für beliebige x, y, z ∈ H und h ∈ G:
C
Irreduzible Darstellungen kompakter Gruppen
245
z | D(h)K x y =
D(g)x | y z | D(h)D(g)x dg G
D(g)x | y z | D(hg)x dg
= G
D(hg)x | D(h)y z | D(hg)x dg
= G
D(g)x | D(h)y z | D(g)x dg
= G
= z | K x D(h)y , wobei wir die Homomorphie-Eigenschaft einer Darstellung, die Unitarität der Operatoren D(g) und die Linksinvarianz des H AAR-Integrals benutzt haben. Da y, z ∈ H beliebig waren, gilt also D(h)K x = K x D(h) für alle h ∈ G, x ∈ H .
(21.27)
c. Um die Kompaktheit von K x zu zeigen, weisen wir nach, dass K x schwach konvergente Folgen in stark konvergente überführt (Eigenschaft (ii) aus Satz 9.13a). Sei also (yn ) eine Folge in H , die schwach gegen y ∈ H konvergiert. Dann ist nach (21.23)
K x y−K x yn ≤
|D(g) | y−yn |·D(g)xdg = x G
|D(g) | y−yn |dg, G
und für n → ∞ geht das gegen Null nach dem Satz von der dominierten Konvergenz. Denn nach Voraussetzung haben wir lim |D(g) | y − yn | = 0
n→∞
für alle g ∈ G, und da schwach konvergente Folgen beschränkt sind, etwa y − yn ≤ C (Theorem 9.12c), haben wir auch |D(g)x | y − yn | ≤ D(g)x · y − yn ≤ Cx, also ist die konstante Funktion Cx eine integrierbare Majorante. d. Angenommen, es ist 0 = x | K x x = G |D(g)x | x |2 dg. Dann folgt D(g)x | x = 0 fast überall. Da dies aber eine stetige Funktion von g ist und das Maß die Bedingung (T) aus 10F erfüllt, ist sogar D(g)x | x = 0 für alle g, also insbesondere 0 = D(e)x | x = x2 und somit x = 0.
246
21 Darstellungstheorie kompakter Gruppen
Wir verwenden nun den W EYL-Operator, um die Darstellungstheorie von kompakten Gruppen im wesentlichen auf die Betrachtung von endlichdimensionalen Darstellungen zu reduzieren: Theorem 21.13 Jede irreduzible Darstellung einer kompakten Gruppe G ist endlichdimensional. Beweis Sei D eine (o.B.d.A. unitäre) irreduzible Darstellung einer kompakten Gruppe G auf dem H ILBERTraum H = {0}. Sei K x der entsprechende W EYLOperator zu einem Vektor x = 0. Dann ist K x nach Satz 21.12 ein kompakter und positiver selbstadjungierter Operator in H mit λ := K x > 0. Nach den Sätzen 9.10c, d und 9.17b ist λ ein Eigenwert endlicher Vielfachheit von K x . Aus Satz 21.12b folgt aber, dass der Eigenraum N (K x − λI ) unter D invariant ist, also mit H übereinstimmt, denn D ist irreduzibel und N (K x − λI ) = {0}. Damit ist dim H < ∞. Eigenvektoren zu verschiedenen Eigenwerten eines selbstadjungierten Operators sind bekanntlich orthogonal zueinander. Ein ähnlicher Satz gilt auch für die irreduziblen Darstellungen einer kompakten Gruppe G: Satz 21.14 Seien V1 , V2 zwei irreduzible Teilräume einer unitären Darstellung D von G. Wenn die Teildarstellungen D s := D V , s = 1, 2 nicht äquivalent sind, so s ist V1 ⊥ V2 , d. h. x | y = 0 für x ∈ V1 , y ∈ V2 . Beweis Betrachte x ∈ V1 , o.B.d.A. x = 0. Für den entsprechenden W EYL-Operator K x gilt R(K x ) ⊆ V1 nach Satz 21.11b, denn der endlichdimensionale Raum V1 ist abgeschlossen (Satz 7.10b). Für s = 1, 2 definieren wir As : Vs → V1 durch As := K x V . Nach dem S CHURschen Lemma (Theorem 20.14a) ist dann A1 = λI mit s einem Skalar λ, und wegen Satz 21.12c ist 0 < x | K x x = x | A1 x = λx2 , also λ > 0. Nach Theorem 20.13 ist jedoch A2 ≡ 0, weil die beiden Darstellungen nicht äquivalent sind. Da K x selbstadjungiert ist, führt dies für y ∈ V2 auf λx | y = K x x | y = x | K x y = 0, woraus die Behauptung folgt.
D Orthogonalitätsrelationen Wir wissen nun nach Theorem 21.13, dass alle irreduziblen Darstellungen von kompakten Gruppen endlich-dimensional sind, und aus Satz 21.14, dass zwei nicht-äquivalente irreduzible Darstellungen zueinander orthogonal sind. Aus Theorem 20.11a und Theorem 21.10 wissen wir überdies, dass jede endlich-dimensionale Darstellung einer kompakten Gruppe vollreduzibel ist. In diesem Abschnitt geht es darum, für die Matrixelemente und die Charaktere von irreduziblen Darstellungen Orthogonalitätsrelationen abzuleiten.
D
Orthogonalitätsrelationen
247
Seien D s , s = 1, 2, zwei irreduzible unitäre Darstellungen einer kompakten Gruppe G auf n s -dimensionalen H ILBERTräumen Hs , und sei T : H1 → H2 eine lineare Abbildung (die wir uns als durch eine Matrix gegeben denken dürfen, weil die Räume endliche Dimensionen haben). Auf den Operator 2 −1 1 A := D (g )T D (g) dg = D 2 (g)∗ T D 1 (g) dg (21.28) G
G
können wir die fundamentalen Theoreme 20.13 und 20.14 anwenden, denn für alle h ∈ G ist 1 2 −1 1 D (g )T D (gh) dg = D 2 (h g˜ −1 )T D 1 (g) ˜ dg˜ = D 2 (h)A, AD (h) = G
G
d. h. A erfüllt (20.23). Sind die D s nicht äquivalent, so liefert Theorem 20.13 also A = 0. Ist hingegen D 1 = D 2 (und insbesondere n 1 = n 2 =: n), so liefert das S CHURsche Lemma A = λI mit einem Skalar λ ∈ C. Dieser lässt sich leicht berechnen, indem man rechts und links die Spur bildet:
λn = Spur A = Spur D 1 (g)−1 T D 1 (g) dg = Spur T, G
also λ = n −1 Spur T . Insgesamt finden wir
∗
D (g) T D (g) dg = 2
1
" 0, Spur T dim H1
G
I,
falls D 1 ∼ D 2 , falls D 1 = D 2 .
(21.29)
Nun sei {e1s , . . . , ens s } jeweils eine Orthonormalbasis von Hs . Dann können wir – wie in (20.3) – durch die Gleichungen D s (g)eks =
ns
d sjk (g)esj ,
g∈G
(21.30)
j=1
Matrixdarstellungen (d sjk ) von G vom Grade n s gewinnen, wobei (d sjk (g)) die unitäre Matrix ist, die durch d sjk (g) = esj | D s (g)eks
(21.31)
gegeben ist. Jedes der Matrixelemente d sjk : G −→ C ,
1 ≤ j, k ≤ n s , s = 1, 2
ist eine stetige Funktion auf G und damit ein Element des H ILBERTraumes L 2 (G), der in Bezug auf das normierte H AARsche Maß gebildet wird. (Weil G kompakt ist, enthält er alle stetigen Funktionen.)
248
21 Darstellungstheorie kompakter Gruppen
Wir leiten nun für diese Matrixelemente Orthogonalitätsrelationen her, indem wir (21.29) auf geeignet gewählte Operatoren T anwenden: Theorem 21.15 Seien D s = (d sjk ), 1 ≤ j, k ≤ n s , s = 1, 2, unitäre, irreduzible Matrixdarstellungen der kompakten Gruppe G über C. Dann bilden die Matrixelemente d sjk : G −→ C ein Orthogonalsystem in L 2 (G), d. h. es gilt 1 = 0 falls D 1 und D 2 nicht äquivalent sind, a. di2j | dkl s = b. disj | dkl
1 ns
δik δ jl .
Beweis Für feste Indizes i ∈ {1, . . . , n 2 } , k ∈ {1, . . . , n 1 } definieren wir den Operator E ik : H1 → H2 durch E ik := |ei2 ek1 |, oder ausführlich E ik x := ek1 | x ei2 . Die entsprechende Matrix hat also eine Eins am Platz (i, k) und sonst lauter Nullen, und daher ist Spur E ik = δik . Für die Größen # $ 2 2 ∗ ik 1 ηik := e D (g) E D (g) dg el1 j jl G
ergibt (21.29) also ηik jl
=
" 0,
δik n s δ jl
,
falls D 1 ∼ D 2 , falls D 1 = D 2 .
Andererseits ist aber nach (21.31) ηik jl
=
G
= G = G
e2j | D 2 (g)∗ E ik D 1 (g)el1 dg e2j | D 2 (g)∗ ei2 , ek1 | D 1 (g)el1 dg 1 1 di2j (g) dkl (g) dg = di2j | dkl ,
wo am Schluss das Skalarprodukt in L 2 (G) steht. Die Charaktere χs der irreduziblen Darstellungen D s sind definitionsgemäß χs (g) =
ns j=1
d sj j (g).
D
Orthogonalitätsrelationen
249
Sie sind also ebenfalls stetige Funktionen auf G. Ihre Skalarprodukte kann man durch Ausdistribuieren und Anwenden von Theorem 21.15 sofort berechnen, und es ergibt sich: Korollar 21.16 Seien D 1 , D 2 irreduzible Darstellungen der kompakten Gruppe G. Dann gilt für die Charaktere χ1 , χ2 dieser Darstellungen χ1 | χ2 =
χ1 (g) χ2 (g) dg =
G
" 0 = 1
χ1 (g −1 )χ2 (g) dg
G
, falls ∼ , falls D 1 ∼ D 2 . D1
D2
(21.32)
Hier ist zu beachten, dass äquivalente Darstellungen denselben Charakter haben. Im Fall D 1 ∼ D 2 ist also χ1 | χ2 = χ1 | χ1 , und daher kann man Theorem 21.15b bei der Berechnung des Skalarprodukts tatsächlich verwenden. Für endlich-dimensionale Darstellungen kann man Theorem 20.11 über die Ausreduzierung einer gegebenen Darstellung mit Hilfe der Orthogonalitätsrelationen für die Charaktere verschärfen. Dazu schreibt man (20.20) in der Form D=
m
ks D s
(21.33)
s=1
mit paarweise nicht-äquivalenten irreduziblen Darstellungen D s , die mit der Vielfachheit ks ∈ N0 in D auftreten. Der Term ks D s bedeutet also ks D s = D1s ⊕ · · · ⊕ Dkss , wobei die Darstellungen D sj , j = 1, . . . , ks alle äquivalent sind. Der Index s zählt hier also nicht die einzelnen Darstellungen, sondern vielmehr ihre Äquivalenzklassen. Die Möglichkeit ks = 0 wird zugelassen, damit man formal auch Äquivalenztypen D s in die Summe aufnehmen kann, die bei der Zerlegung von D in irreduzible Bestandteile in Wirklichkeit gar nicht auftreten. Mit dieser Schreibweise können wir nun formulieren: Theorem 21.17 Sei D eine endlich-dimensionale Darstellung der kompakten Gruppe G auf H , und sei χ der Charakter von D. Die Darstellung sei in der Form (21.33) in irreduzible Teildarstellungen zerlegt. a. Ist χs der Charakter zu D s , so ist die Vielfachheit ks eindeutig bestimmt durch ks = χs | χ =
χ (g)χs (g) dg. G
(21.34)
250
21 Darstellungstheorie kompakter Gruppen
Insbesondere ist χs | χ = 0 genau dann, wenn eine irreduzible Darstellung mit dem Charakter χs in der Zerlegung (21.33) wirklich auftritt. b. Die Darstellung D ist genau dann irreduzibel, wenn χ 22 =
|χ (g)|2 dg = 1. G
Beweis a. Gelte also (21.33). Dann folgt aus Satz 20.8a für die Charaktere χ=
m
k s χs .
(21.35)
s=1
Mit der Orthogonalitätsrelation (21.32) aus Korollar 21.16 folgt dann für r = 1, . . . , m: χr | χ =
m
ks χr | χs = kr .
s=1
b. Folgt direkt aus Teil a. Die Theoreme 20.11 und 21.17 führen nun zu der erstaunlichen Folgerung: Korollar 21.18 Jede endlich-dimensionale Darstellung ist bis auf Äquivalenz durch Vorgabe ihres Charakters eindeutig bestimmt. Wir geben ein einfaches Beispiel, das auch das Material der nächsten beiden Abschnitte gut illustrieren wird: Beispiel 21.19 Die irreduziblen komplexen Darstellungen von G = U(1) sind alle eindimensional, weil die Gruppe kommutativ ist (Korollar 20.15 und s wieTheorem 21.13). Jede davon wird also durch ein einziges Matrixelement d11 dergegeben, und dieses ist gleichzeitig der Charakter χs . Daher entsprechen die irreduziblen Darstellungen den stetigen Funktionen ϕ : U(1) → C, für die gilt: ϕ(eix eiy ) = ϕ(eix )ϕ(eiy )
∀ x, y ∈ R .
(21.36)
Eine unendliche Schar solcher Funktionen ist wohlbekannt, nämlich ϕs (eix ) := eisx ,
s ∈ Z.
Das Skalarprodukt in L 2 (U(1)) wird bzgl. des normierten H AARschen Maßes gebildet, ist also
E
Vollständigkeit des Orthonormalsystems der Matrixelemente
1 f | g := 2π
2π
251
f (t)g(t) dt .
0
Die Orthogonalitätsrelationen für die Matrixelemente und Charaktere der irreduziblen Darstellungen sind hier also einfach die bekannten trigonometrischen Orthogonalitätsrelationen. Die ϕs sind auch die einzigen (stetigen) irreduziblen Darstellungen von U(1), denn wenn ϕ eine weitere irreduzible Darstellung ist, die zu keinem der ϕs äquivalent ist, so ist 1 2π
2π
ϕ(s)e−isx dx = ϕs | ϕ = 0
∀ s ∈ Z,
0
d. h. alle F OURIERkoeffizienten von ϕ verschwinden, und damit ist ϕ ≡ 0. Ist aber ϕ ∼ ϕs für ein gewisses s, so ist ϕ = ϕs , weil es sich ja auch um die Charaktere handelt. Somit sind die ϕs die einzigen (stetigen) Lösungen der Funktionalgleichung (21.36).
E Vollständigkeit des Orthonormalsystems der Matrixelemente Nach Theorem 21.15 bilden die Matrixelemente d sjk , 1 ≤ j, k ≤ n s , s ∈ S der irreduziblen unitären Darstellungen D s einer kompakten Gruppe G ein Orthogonalsystem im H ILBERTraum L 2 (G). Wir untersuchen nun, inwieweit dieses Orthogonalsystem vollständig ist. Diese Untersuchung läuft auf den Versuch hinaus, zwei sehr besondere (i. A. unendlich-dimensionale) Darstellungen von G in irreduzible Teildarstellungen zu zerlegen, nämlich die folgenden (vgl. auch Beispiel 20.3a): Definition 21.20 Sei D R die durch (D R (g)ϕ)(x) := ϕ(xg) ,
ϕ ∈ L 2 (G) , x, g, ∈ G
(21.37)
definierte Darstellung von G auf L 2 (G). Sie heißt die rechtsreguläre Darstellung von G. Entsprechend ist die linksreguläre Darstellung D L definiert durch (D L (g)ϕ)(x) = ϕ(g −1 x) ,
ϕ ∈ L 2 (G) , x, g, ∈ G.
(21.38)
Wie in Beispiel 21.9 überzeugt man sich, dass D L und D R stetige unitäre Darstellungen von G sind. Wir konzentrieren uns im folgenden auf die rechtsreguläre Darstellung, obwohl man alles ganz analog für die linksreguläre formulieren und beweisen könnte. Die Antwort auf das Vollständigkeitsproblem liefert der folgende berühmte Satz: Theorem 21.21 (P ETER-W EYL) Sei G eine kompakte Gruppe und sei {D s | s ∈ S} eine Menge von irreduziblen unitären Darstellungen von G, in der jede Äquivalenzklasse von irreduziblen Darstellungen von G genau einmal vertreten ist. Es seien
252
21 Darstellungstheorie kompakter Gruppen
(d sjk (g)) ,
1 ≤ j, k ≤ n s ,
s∈S
zu den D s gehörende unitäre Matrixdarstellungen von G. Dann bildet das System √ n s d sjk (g) ,
s ∈ S,
1 ≤ j, k ≤ n s
eine Orthonormalbasis des H ILBERTraums L 2 (G). Zum Beweis haben wir zu zeigen, dass der lineare Teilraum L := LH({d sjk | s ∈ S , 1 ≤ j, k ≤ n s })
(21.39)
der endlichen Linearkombinationen von Matrixelementen von irreduziblen Darstellungen in L 2 (G) dicht ist. Als Vorbereitung hierzu beweisen wir eine Charakterisierung der zu L gehörigen Funktionen, die auch für sich interessant ist: Satz 21.22 Für f ∈ L 2 (G) sind folgende Aussagen äquivalent: (i) f ∈ L. (ii) f ist stetig, und der Unterraum L f := LH({D R (g) f | g ∈ G}) hat endliche Dimension. (iii) f gehört zu einem endlichdimensionalen D R -invarianten Unterraum von C(G). Eine analoge Äquivalenzaussage gilt für D L . Insbesondere ist L invariant unter D R und D L . Beweis (i) ⇒ (ii): Jedes f ∈ L ist stetig, denn die d sjk sind als Matrixelemente von stetigen Darstellungen stetig. Auch für die Aussage über L f genügt es, den Fall f = d sjk zu betrachten, denn sie überträgt sich auf endliche Linearkombinationen. Aber für alle x, g ∈ G ist [D R (g)d sjk ](x) = d sjk (xg) =
ns ν=1
s d sjν (x)dνk (g),
und somit gehört jedes D R (g)d sjk zu dem n s -dimensionalen Unterraum, der von den d sjν , ν = 1, . . . , n s aufgespannt wird. (ii) ⇒ (iii) ist trivial, denn L f ist ein endlichdimensionaler D R -invarianter Unterraum von C(G). (iii) ⇒ (i): Sei f ∈ V , wo V ⊆ C(G) ein invarianter Unterraum endlicher Dimension ist. Nach Theorem 20.11a zerfällt die Darstellung D R V in eine direkte Summe von irreduziblen Teildarstellungen, d. h. wir haben f = g1 + · · · + gm ,
E
Vollständigkeit des Orthonormalsystems der Matrixelemente
253
wobei jedes gi in einem irreduziblen Teilraum liegt. Da es genügt, g1 , . . . , gm ∈ L zu zeigen, können wir also o.B.d.A. annehmen, dass schon V irreduzibel ist. Da das System S alle Äquivalenzklassen von irreduziblen Darstellungen von G umfasst, muss D R V ∼ D s sein für ein gewisses s ∈ S. In Bezug auf eine geeignete Basis f 1 , . . . , f n s wird D R V also durch die Matrizen (d sjk (g)) , g ∈ G dargestellt, d. h. wir haben D R (g) f k =
ns
d sjk (g) f j ,
k = 1, . . . , n s , g ∈ G.
j=1
Werten wir dies bei der Eins e von G aus, so ergibt sich f k (g) = [D R (g) f k ](e) =
ns
d sjk (g) f j (e) ,
k = 1, . . . , n s , g ∈ G .
j=1 s , . . . , ds Also ist f k eine Linearkombination der Matrixelemente d1k n s k mit den Zahlen f j (e) als Koeffizienten (k = 1, . . . , n s ). Wir haben somit f 1 , . . . , f n s ∈ L und daher auch f ∈ L.
Wir werden nun erneut den W EYLoperator einsetzen, müssen ihn dazu aber für den Fall des H ILBERTraums L 2 (G) noch etwas genauer untersuchen: Lemma 21.23 Sei K y der W EYLoperator zu einem y ∈ L 2 (G) in Bezug auf die rechtsreguläre Darstellung. Der Wertebereich R(K y ) besteht dann aus stetigen Funktionen. Beweis Sei u ∈ L 2 (G) beliebig. Dann ist f (g) := D R (g)y | u eine stetige Funktion von g, weil D R eine stetige Darstellung ist. Insbesondere ist f ∈ L 2 (G), und wir setzen für x ∈ G f (g) y(xg) dg.
w(x) := G
Dann ist w(x) = f¯ | D L (x −1 )y , also ebenfalls stetig, denn auch D L ist eine stetige Darstellung. Die Behauptung folgt also aus w = K y u. Um dies zu zeigen, betrachten wir das Skalarprodukt beider Seiten mit einem beliebigen v ∈ L 2 (G):
D R (g)y | u v | D R (g)y dg = f (g) v(x)y(xg) dx dg G G G v(x) f (g)y(xg) dg dx = v | w , =
v | K y u =
G
G
254
21 Darstellungstheorie kompakter Gruppen
wie gewünscht. Die Anwendung des Satzes von F UBINI ist gerechtfertigt, denn G×G
|v(x)| · | f (g)| · |y(xg)| dx dg ≤ f ∞ v2 y2 < ∞.
Beweis (von Theorem 21.21) Es genügt, zu zeigen, dass L⊥ = {0} (Satz 7.14b). Angenommen also, es gäbe 0 = y ∈ L⊥ . Sei dann K y der entsprechende, bzgl. D R gebildete W EYL-Operator. Genau wie im Beweis von Theorem 21.13 erkennt man, dass λ := K y > 0 ein Eigenwert ist und dass N (K y − λI ) ein D R -invarianter Unterraum endlicher Dimension ist. Ist g ∈ N (K y − λI ), so ist g = K y (λ−1 g) ∈ R(K y ), also g ∈ C(G) nach Lemma 21.23. Damit zeigt Satz 21.22, dass N (K y − λI ) ⊆ L ist. Wegen y ∈ L⊥ und Satz 21.11b. ist aber auch R(K y ) ⊆ L⊥ , also N (K y − λI ) ⊆ L ∩ L⊥ = {0}, ein Widerspruch. Bemerkung Man kann sogar beweisen, dass jedes f ∈ C(G) der gleichmäßige Limes von Funktionen aus L ist. Auch diese Verschärfung wird als Satz von P ETER -W EYL oder Satz von P ETER -W EYL -N EUMANN bezeichnet, und man findet Beweise dafür in vielen Lehrbüchern über L IE-Gruppen, Darstellungstheorie oder Funktionalanalysis, etwa in [2, 12, 43, 82] oder [95]. Der folgende Satz ist wegen der Eigenschaften von vollständigen Orthonormalsystemen (vgl. z. B. [34], Kap. 29) lediglich eine andere Formulierung von Theorem 21.21. Theorem 21.24 Unter den Voraussetzungen und mit den Bezeichnungen von Theorem 21.21 gilt für jede Funktion ϕ ∈ L 2 (G) ϕ(g) =
ns
s s cik dik (g),
g∈G
(21.40)
s∈S i,k=1
mit s cik
=
s n s dik
| ϕ = n s
s (g) ϕ(g) dg, dik
(21.41)
G
wobei die F OURIERreihe in L 2 (G) konvergiert, d. h. im quadratischen Mittel in Bezug auf das H AARsche Maß. Insbesondere gilt die PARSEVALsche Gleichung |ϕ(g)|2 dg = G
s∈S
ns
ns
s 2 |cik | .
(21.42)
i,k=1
Man sieht also (Beispiel 21.19), dass die bekannte Vollständigkeit des trigonometrischen Orthonormalsystems ein Spezialfall des Satzes von P ETER -W EYL ist.
E
Vollständigkeit des Orthonormalsystems der Matrixelemente
255
Zum Schluss untersuchen wir noch etwas genauer, wie sich die rechts(bzw. links-)reguläre Darstellung aus den irreduziblen Darstellungen zusammensetzt. Als Vorbereitung beweisen wir: Satz 21.25 Sei (d jk (g)) eine irreduzible unitäre Matrixdarstellung von G vom Grade n. Dann gilt: a. Für j = 1, . . . , n spannen die orthonormalen Elemente e jk :=
√ n d jk ,
k = 1, . . . , n
(21.43)
2 in der j-ten Zeile der Matrix einen D R -irreduziblen Teilraum H j von L (G) auf. Insbesondere ist D ∼ D R H . j b. Wir haben explizit:
D R (g)e jk =
n
dik (g)e ji ,
g ∈ G.
(21.44)
i=1
Jede irreduzible Darstellung von G ist also äquivalent zu einer Teildarstellung der rechtsregulären Darstellung. c. Entsprechendes gilt für die linksreguläre Darstellung.
Beweis Die Matrixelemente d jk sind nach Theorem 21.15b orthogonal, und die Funktionen e jk , 1 ≤ k ≤ n, bilden für jedes feste j ein Orthonormalsystem. Aus (21.37) folgt für x, g ∈ G (D R (g)d jk )(x) = d jk (xg) n = d ji (x)dik (g) i=1
aufgrund der Homomorphismuseigenschaft von D, was (21.44) beweist und außerdem zeigt, dass H j = LH(e j1 , . . . , e jn ) invariant unter D R ist. Ferner besagt (21.44), dass (dik ) die Matrixdarstellung von D R H bezüglich der Orthonormalbasis (e jk , k = 1, . . . , n) ist, also auch D ∼ j DR . Hj
Kombinieren wir schließlich noch Satz 21.25 mit Theorem 21.21, so erhalten wir folgendes Ergebnis:
256
21 Darstellungstheorie kompakter Gruppen
Satz 21.26 a. Jede Äquivalenzklasse D s von irreduziblen Darstellungen der kompakten Gruppe G kommt als irreduzibler Bestandteil der rechtsregulären (linksregulären) Darstellung vor, und zwar mit Vielfachheit n s , die gleich der Dimension von D s ist. Man kann also schreiben: ns Ds , DL ∼ ns Ds . DR ∼ s∈S
s∈S
b. Die Vektoren esjk :=
√ n s d sjk ,
1 ≤ k ≤ ns
spannen für festes s ∈ S und festes j = 1, . . . , n s die irreduziblen Teilräume in der obigen Zerlegung der rechtsregulären Darstellung auf. c. Die Vektoren esjk :=
√ n s dks j ,
1 ≤ k ≤ ns
spannen für festes s ∈ S und festes j = 1, . . . , n s die irreduziblen Teilräume in der obigen Zerlegung der linksregulären Darstellung auf. Beweis Wir behandeln nur die rechtsreguläre Darstellung. Sei also Hsj := LH(esj1 , . . . , esjn s ) ,
s ∈ S, j = 1, . . . , n s .
Die Aussage des Satzes von P ETER -W EYL besagt dann, dass L 2 (G) die H IL BERT sche Summe der Hsj ist (vgl. Korollar 15.3c), und Satz 21.25 besagt, dass die auf jedem der invarianten Teilräume Hsj , j = 1, . . . , n s durch D R definierte Darvon D s mindestens stellung zu D s äquivalent ist. Insbesondere ist die Vielfachheit n s . Ist aber V irgendein irreduzibler Teilraum mit D R V ∼ D s , so ist V ⊆ H1s ⊕ · · · ⊕ Hns s , wie wir schon im Beweis von Satz 21.22 (Teil (iii) Daher ist die Vielfachheit genau n s .
⇒
(i)) gesehen haben.
Der letzte Satz hat eine naheliegende Konsequenz: Korollar 21.27 Eine unendliche kompakte Gruppe G besitzt unendlich viele verschiedene Äquivalenzklassen von stetigen irreduziblen Darstellungen. Eine endliche Gruppe hingegen besitzt nur endlich viele, und dabei gilt: |G| =
s∈S
n 2s .
(21.45)
E
Vollständigkeit des Orthonormalsystems der Matrixelemente
257
Beweis Ist G unendlich, so kann man eine unendliche Folge (gm ) von lauter verschiedenen Punkten von G wählen. Sei dann f m eine stetige Funktion auf G, für die f m (gn ) = δmn für alle m, n gilt. Für jedes N ∈ N sind dann die Vektoren f 1 , . . . , f N ∈ C(G) linear unabhängig, und daher hat C(G) unendliche Dimension. Dann ist aber auch L 2 (G) ⊇ C(G) unendlichdimensional, und nach Theorem 21.21 und Satz 21.26a wäre das nicht möglich, wenn es nur endlich viele Typen D s von irreduziblen Darstellungen gäbe. Ist G aber endlich, so ist L 2 (G) einfach der Vektorraum aller C-wertigen Funktionen auf G, hat also die Dimension |G| < ∞. Nach Satz 21.26a kann das System S dann auch nur aus endlich vielen Typen bestehen, und es gilt (21.45). Anmerkung 21.28 Satz 21.26 bedeutet, dass die beiden regulären Darstellungen in einem leicht verallgemeinerten Sinn vollreduzibel sind. Dies gilt aber sogar für jede stetige unitäre Darstellung einer kompakten Gruppe G. Aus dem Satz von P ETER W EYL kann man nämlich folgern (vgl. etwa [12]), dass es zu jeder stetigen unitären Darstellung D von G auf einem komplexen H ILBERTraum H ein System Hs , s ∈ Σ von irreduziblen Teilräumen Hs gibt, für die der Raum L D :=
" Hs = LH
s∈Σ
' Hs
s∈Σ
dicht in H ist. Ist H separabel, so ist die Indexmenge Σ abzählbar. Jeder Vektor x ∈ H hat dann eine eindeutige Reihenentwicklung x = s∈Σ xs mit xs ∈ Hs , die in H konvergiert. In dem in Korollar 15.3 definierten Sinn ist also H die H ILBERTsche Summe der irreduziblen Teilräume Hs . 21.29 Ausblick: Darstellungstheorie und harmonische Analyse bei nichtkompakten L IE-Gruppen Als Beispiel betrachten wir die stetigen Darstellungen der abelschen eindimensionalen nichtkompakten L IE-Gruppe G = (R, +). (i) Für jedes λ ∈ R haben wir die offensichtliche irreduzible Darstellung ϕλ (t) := eiλt ,
t ∈R
(21.46)
auf dem Trägerraum C. In gewissem Sinne kann man aus diesen jede stetige unitäre Darstellung von (R, +) durch Superposition gewinnen, aber man muss dazu den Begriff der linearen Superposition wesentlich weiter fassen als bisher. Sei also U : R → H eine solche unitäre Darstellung auf dem komplexen H ILBERTraum H . Nach Definition erfüllt U dann die Bedingungen (16.53), (16.54) und (16.56), ist also nichts anderes als eine stark stetige unitäre Einparametergruppe im Sinne von Definition 16.33. Nach dem Satz von S TONE ist daher
258
21 Darstellungstheorie kompakter Gruppen
Ut = eit A ,
t ∈R
(21.47)
mit einem eindeutigen (möglicherweise unbeschränkten!) selbstadjungierten Operator A. Ist nun E das Spektralmaß zu A, so haben wir nach Definition des M∞ -Funktionalkalküls eiλt dE(λ) , t ∈ R, (21.48) Ut = R
d. h. das entsprechende Spektralintegral gibt an, wie sich die Darstellung t → Ut aus den ϕλ durch Superposition zusammensetzt. Die Theorie der unitären Darstellungen von (R, +) ist also, wenn man so will, die in den Kap. 15 und 16 skizzierte Spektraltheorie. (ii) Um eine Entsprechung für den Satz von P ETER -W EYL zu finden, versuchen wir, speziell die rechtsreguläre Darstellung D R von (R, +) aus den ϕλ zusammenzusetzen. Dazu betrachten wir D R zunächst auf dem invarianten Teilraum S1 der schnell fallenden Testfunktionen. Für f ∈ S1 gilt nach der F OURIERschen Umkehrformel f (x) =
dλ f (λ)eiλx √ , 2π R
x ∈ R,
(21.49)
also entsteht f tatsächlich durch Superposition der ϕλ mit den Zahlen f (λ) als Koeffizienten. Das zur Superposition verwendete Maß ist hier bis auf den konstanten Faktor (2π )−1/2 das L EBESGUEmaß. Auf dem Exemplar von C, das dem Wert λ des Spektralparameters entspricht, liefert D R tatsächlich die Darstellung ϕλ , denn für g := D R (t) f ist g(x) = f (x + t), also g(λ) = f (λ)ϕλ (t) .
(21.50)
All dies kann auch auf den H ILBERTraum L 2 (R) ausgedehnt werden, aber dann muss man die F OURIER -P LANCHEREL-Transformation benutzen, und die Formeln (21.49), (21.50) gelten nicht mehr punktweise wörtlich, sondern nur noch im quadratischen Mittel (vgl. Abschn. 8F). Der Mechanismus der Superposition ist dann also noch komplizierter. Bemerkung Natürlich könnte man D R auch auf die unter (i) skizzierte Weise betrachten. Dann würde das Spektralmaß des Impulsoperators die entscheidende Rolle spielen. So gesehen, sind die F OURIERintegrale Entwicklungen nach verallgemeinerten Eigenfunktionen des Impulsoperators. (iii) In den Aufgaben 20.5–20.7 wurden endlichdimensionale Darstellungen der Gruppen (R, +) und (Z, +) diskutiert, die nicht vollreduzibel sind. Wegen Theorem 20.11 können sie nicht zu unitären Darstellungen äquivalent sein. Nichtunitäre Darstellungen spielen also für diese Gruppen ebenfalls eine bedeutende Rolle, sogar wenn man sich auf endlichdimensionale Trägerräume beschränkt. Bei einer nichtkommutativen nichtkompakten L IE-Gruppe hat man es nun mit höherdimensionalen irreduziblen Darstellungen zu tun und gleichzeitig mit dem
F Ein Vollständigkeitskriterium
259
Effekt, dass die Zusammensetzung dieser Darstellungen zu allgemeineren Darstellungen mittels einer delikaten Integrationstheorie erfolgen muss und nicht mehr durch einfache Bildung von direkten Summen oder konvergenten Reihen. Die Literatur teilt sich demgemäß auch in zwei Bereiche auf: Die eigentliche Darstellungstheorie bemüht sich – hauptsächlich mittels algebraischer Methoden – um die Bestimmung der irreduziblen Darstellungen, und die harmonische Analyse untersucht die in Frage kommenden Superpositionsmechanismen und die dabei auftretenden Konvergenzprobleme mit Methoden, die hauptsächlich der mathematischen Analysis entstammen. Beide Aspekte werden in der umfangreichen Monographie [5] angesprochen. Vgl. auch [56].
F Ein Vollständigkeitskriterium Für eine gegebene Gruppe G kann man kaum je direkt ermitteln, wie ihre irreduziblen Darstellungen aussehen. Es gibt jedoch etliche Methoden, möglichst umfangreiche Systeme von irreduziblen Darstellungen aufzufinden, und dann ist es wichtig, beurteilen zu können, wann man alle Äquivalenzklassen gefunden hat, so dass man die Suche beenden kann. Also muss man für eine gegebene Menge T = {D s | s ∈ T } von unitären irreduziblen Darstellungen entscheiden können, ob diese Menge bis auf Äquivalenz alle irreduziblen Darstellungen von G enthält. Ist G endlich, so kann (21.45) hierfür herangezogen werden. Bei unendlichen kompakten Gruppen kann man sich mit etwas Funktionalanalysis behelfen, und wir reduzieren die Frage nun zunächst auf eine Dichtigkeitseigenschaft für die Matrixelemente: Satz 21.30 Sei G eine kompakte Gruppe und sei T = {D s = (d sjk ) | s ∈ T } eine Menge von stetigen irreduziblen, paarweise nicht äquivalenten Matrixdarstellungen von G. Angenommen, die lineare Hülle der vorkommenden Matrixelemente d sjk (g) | s ∈ T ,
1 ≤ j , k ≤ ns
liegt dicht in CC (G). Jede stetige irreduzible Darstellung von G ist dann äquivalent zu einer Darstellung D s , s ∈ T , d. h. T enthält bis auf Äquivalenz alle stetigen irreduziblen Darstellungen von G. Beweis Angenommen, wir haben eine irreduzible Darstellung D von G, die zu keinem D s , s ∈ T , äquivalent ist. Nach dem (allgemeinen) Satz von M ASCHKE können wir sie als unitär annehmen. Nach Satz 21.25 ist D äquivalent zu einer Teildarstellung der rechtsregulären Darstellung D R , und diese entspricht bzgl. einer ge-
260
21 Darstellungstheorie kompakter Gruppen
eigneten Basis einer Matrixdarstellung (dkl )k,l=1,...,n . Nach Theorem 21.15a haben wir dann disj | dkl = 0 für alle s ∈ T , i, j = 1, . . . , n s , k, l = 1, . . . , n. Mit LT := LH({disj | s ∈ T , i, j = 1, . . . , n s }) folgt g | dkl = 0 für alle g ∈ LT , k, l = 1, . . . , n. Nach Voraussetzung ist aber LT dicht in C(G), und da G kompakt ist, folgt aus der gleichmäßigen Konvergenz auch die L 2 -Konvergenz. Daher ist sogar g | dkl = 0 für alle g ∈ C(G), z. B. auch für g = dkl , was absurd ist. Um diesen Satz anwenden zu können, benötigt man wiederum brauchbare hinreichende Bedingungen für die hier vorkommende Dichtigkeitsaussage. Ein solches Kriterium kann leicht aus dem aus der Funktionalanalysis bekannten Satz von S TONE-W EIERSTRASS gewonnen werden, den wir nun ohne Beweis angeben. Dabei geht es um Teilalgebren der C ∗ -Algebra C(K ), die aus den stetigen komplexwertigen Funktionen auf einem kompakten H AUSDORFF-Raum K besteht (Definitionen 15.12 und Beispiele 15.13). Der hier vorkommende kompakte H AUS DORFF-Raum (Definition 1.9) könnte z. B. eine kompakte L IE -Gruppe sein. Theorem 21.31 (S TONE-W EIERSTRASS) Sei K ein kompakter H AUSDORFFRaum und sei A eine Teilalgebra der BANACHalgebra C(K ) mit folgenden Eigenschaften a. A enthält die Funktion f ≡ 1. b. A trennt die Punkte von K , d. h. sind x1 , x2 ∈ K mit x1 = x2 , so gibt es eine Funktion f ∈ A mit f (x1 ) = f (x2 ). c. Ist f ∈ A, so ist auch die konjugiert komplexe Funktion f¯ ∈ A. Dann liegt A dicht in C(K ), d. h. jede stetige Funktion f : K −→ C kann durch Funktionen aus A beliebig genau gleichmäßig approximiert werden. Ein Beweis findet sich in fast jedem Lehrbuch der Funktionalanalysis, z. B. in [95]. Um den Satz richtig einzuordnen, sollte man sich klarmachen, dass der klassische W EIERSTRASSsche Approximationssatz eine einfache Konsequenz ist – man nehme ein kompaktes Intervall [a, b] ⊆ R als K und die Teilalgebra der Polynomfunktionen als A. Für die Anwendung auf die Darstellungstheorie ist zu beachten, dass das System der endlichdimensionalen Darstellungen einer festen Gruppe nicht nur eine „Addition“ zulässt (nämlich die direkte Summe), sondern auch eine „Multiplikation“, nämlich das Tensorprodukt (vgl. Definition 20.7). Sind nun D 1 , D 2 zwei irreduzible unitäre Darstellungen von G, so ist das Tensorprodukt D 1 ⊗ D 2 immer noch
F Ein Vollständigkeitskriterium
261
unitär und endlichdimensional, hat also nach Theorem 20.11 eine Zerlegung der Form (21.33) in endlich viele irreduzible Darstellungen. Diese bezeichnet man als die C LEBSCH -G ORDAN-Zerlegung des Tensorprodukts. Satz 21.32 Sei G eine kompakte Gruppe und sei T wie in Satz 21.30. Angenommen, T hat die folgenden Eigenschaften: 1. Die 1-Darstellung F mit F(g) = 1, g ∈ G, gehört zu T . 2. Zu jedem g ∈ G mit g = e existiert ein s ∈ T mit D s (g) = E. 3. Mit jedem D s ∈ T kommt auch (bis auf Äquivalenz) die zu D s konjugierte Darstellung s
D (g) := (d sjk (g)) , g ∈ G in T vor, d. h. zu jedem s ∈ T gibt es ein t ∈ T und ein C ∈ GL(n s , C), so dass s
D (g) = C D t (g)C −1
∀ g ∈ G.
4. In T ist stets eine C LEBSCH-G ORDAN-Zerlegung Ds ⊗ Dt ∼
m
Ds j ,
sj ∈ T
j=1
mit irreduziblen Darstellungen aus T möglich. Dann gilt: Die lineare Hülle der vorkommenden Matrixelemente d sjk | s ∈ T ,
1 ≤ j , k ≤ ns
liegt dicht in CC (G). Beweis Sei A = LH({d sjk | s ∈ T ,
1 ≤ j , k ≤ n s })
(21.51)
die lineare Hülle aller in den Darstellungen aus T vorkommenden Matrixelemente. Dann müssen wir zeigen, dass A die Voraussetzungen von Theorem 21.31 erfüllt: a. folgt aus der Voraussetzung 1. von Satz 21.32, denn es gibt ein s ∈ T mit n s = 1 und s d11 (g) = 1
für alle g ∈ G.
b. folgt aus der Voraussetzung 2. von Satz 21.32, denn für g1 = g2 in G gibt es ein D s ∈ T mit
262
21 Darstellungstheorie kompakter Gruppen
E = D s (g1 g2−1 ) = D s (g1 )D s (g2 )−1 ,
d. h. D s (g1 ) = D s (g2 )
und daher d sjk (g1 ) = d sjk (g2 )
für wenigstens ein Paar ( j, k).
c. folgt aus der Voraussetzung 3. von Satz 21.32, denn zu jedem s ∈ T gibt es ein t ∈ T und eine reguläre Matrix C, so dass s (g)) = C(d t (g))C −1 , (dkl ij
d. h. nach Bildung des Matrizenproduktes hat man mit geeigneten Konstanten ij ckl : s (g) = dkl
ij
ckl ditj (g).
i, j
Linearkombinationen der disj gehören aber wieder zu A. d. Es ist noch zu zeigen, dass das Produkt zweier Funktionen aus A wieder zu A gehört, denn dann ist A Unteralgebra von CC (G). Dazu benötigen wir die C LEBSCH-G ORDAN-Zerlegung in Voraussetzung 4. von Satz 21.32. In Matrixdarstellung schreibt sich diese: ⎛ ⎜ ⎜ D s (g) ⊗ D t (g) = C ⎜ ⎝
D s1 (g)
0
D s2 (g)
0
..
⎞
⎟ ⎟ −1 ⎟C ⎠ . s m D (g)
mit einer passenden regulären Matrix C, also nach Ausführung der Matrizenmultiplikation n
disj (g)dklt (g)
=
sp m
s
s
p ai jklqr dqrp (g)
p=1 q,r =1 s
p . Ein Produkt von Matrixelementen kann demmit skalaren Koeffizienten ai jklqr zufolge als Linearkombination von Matrixelementen geschrieben werden und gehört damit ebenfalls zu A. Das Produkt von zwei Linearkombinationen von Matrixelementen gehört dann aber ebenfalls zu A.
Theorem 21.31 liefert nun die Behauptung.
Aufgaben
263
Aufgaben zu Kap. 21 21.1 Man zeige, dass ω = xdy − ydx unter allen Drehungen der Ebene R2 invariant ist, d. h. R ∗ ω = ω für alle R ∈ SO(2). 21.2 Man zeige: a. Für G = {x ∈ R | x > 0} mit der Multiplikation als Gruppenverknüpfung ist
∞
λ( f ) =
f (x)
0
dx x
ein H AARsches Integral. b. Für G = C∗ (vgl. Beispiel 17.2d) ist λ( f ) =
f (x + iy) dx dy x 2 + y2
ein H AARsches Integral. 21.3 Es seien e0 , e1 , e2 , e3 die Matrizen aus (18.49), und J : R4 → H sei der in (18.50) angegebene Isomorphismus. Man zeige: a. J ist eine Isometrie, und das Bild der Sphäre S3 = {(x0 , x1 , x2 , x3 ) ∈ R4 | x02 + x12 + x22 + x32 = 1} unter J ist G = SU(2). b. Ist X ∈ SU(2) und X die Linksmultiplikation mit X in H, so ist J −1 X J ein Element von SO(4). (Hinweis: Man beachte (18.53) und die Tatsache, dass SU(2) zusammenhängend ist.) c. Das normierte H AARsche Integral auf SU(2) ist gegeben durch λ( f ) =
1 2π 2
S3
f (J x) dσ ,
wo dσ die euklidische Volumenform auf S3 (also das „dreidimensionale Oberflächenelement“) bezeichnet. 21.4 Die sog. H EISENBERGgruppe ist R3 mit der Verknüpfung (x, y, z) · (x , y , z ) = (x + x , y + y , z + z + x y − x y). Man zeige, dass dies eine L IE-Gruppe ist. Man zeige ferner, dass das L EBESGUEMaß links- und rechtsinvariant ist. Insbesondere ist die Gruppe unimodular.
264
21 Darstellungstheorie kompakter Gruppen
21.5 Parametrisiere G := SO(3) wie in Satz 18.3b. Zwecks Vereinheitlichung der Bezeichnungen ersetzen wir jedoch die x-Achse durch die z-Achse und benennen auch die E ULERschen Winkel anders. Die gewählte Parametrisierung lautet R = R3 (ϕ)R2 (θ )R3 (α),
α, ϕ ∈ [0, 2π [ , θ ∈ [0, π ].
a. Es sei S := {x = (x, y, z) ∈ R3 | x 2 + y 2 + z 2 = 1} die Einheitssphäre im R3 . Für f ∈ C(G) setzen wir 1 f˜(x) := 2π
2π
f (A R3 (α)) dα ,
x ∈ S,
0
wobei A ∈ G so gewählt ist, dass Ae3 = x. Man zeige, dass hierdurch eine stetige Funktion auf S wohldefiniert ist. (Hinweis: Ist Ae3 = A e3 , so ist A−1 A eine Drehung um die z-Achse.) b. Man zeige: Durch 1 λ( f ) := 4π
f˜(x) dσ S
ist das normierte H AARsche Integral auf SO(3) gegeben. Dabei bedeutet dσ das euklidische Oberflächenelement, also die Volumenform ω S auf der euklidischen Sphäre S. c. Man folgere: Das normierte H AARsche Integral ist explizit λ( f ) =
1 8π 2
2π
0
π
0
2π
f (R3 (ϕ)R2 (θ )R3 (α)) sin θ dαdθ dϕ .
0
(Hinweis: Parametrisiere S durch Kugelkoordinaten x = cos ϕ sin θ,
y = sin ϕ sin θ,
z = cos θ,
0 ≤ ϕ < 2π, 0 ≤ θ ≤ π
und beachte, dass R3 (ϕ)R2 (θ )e3 der Punkt mit den Koordinaten (ϕ, θ ) ist.) 21.6 Parametrisiere SU(2) wie in Satz 18.10 durch Gl. (18.26). Dann ist das normierte H AARsche Integral gegeben durch λ( f ) =
1 16π 2
2π 0
π 0
4π
f (S3 (γ )S2 (β)S3 (α)) sin β dαdβdγ .
0
(Hinweis: Mittels des Epimorphismus Φ : SU(2) → SO(3) kann dies auf die vorige Aufgabe zurückgeführt werden. Dazu beachte man, dass S3 (α ± 2π ) = −S3 (α) und dass Φ auf jeder der Teilmengen
Aufgaben
265
G 1 := {S3 (γ )S2 (β)S3 (α) | 0 ≤ γ < 2π , 0 ≤ β ≤ π , 0 ≤ α < 2π } , G 2 := {S3 (γ )S2 (β)S3 (α) | 0 ≤ γ < 2π , 0 ≤ β ≤ π , 2π ≤ α < 4π } eindeutig invertiert werden kann.) 21.7 Für x, y ∈ R , x = 0 setze A(x, y) :=
x y . 01
Man zeige: a. Die Menge G := {A(x, y) | x, y ∈ R , x = 0} bildet eine lineare L IE-Gruppe. Die Abbildung A : (R \ {0}) × R → G ist eine globale Parametrisierung. b. Das Funktional f (A(x, y)) λ( f ) = dx dy x2 ist ein linkes H AAR-Integral, und das Funktional ρ( f ) =
f (A(x, y)) dxdy |x|
ist ein rechtes H AAR-Integral für G. c. Man berechne die Modularfunktion ΔG . Ist G unimodular? 21.8 Die m-dimensionale L IE-Gruppe G möge eine globale Parametrisierung A : Ω → G (Ω ⊆ Rm offen) besitzen, in der die Gruppenverknüpfung folgendermaßen ausgedrückt werden kann: A(x 1 , . . . , x m )A(y 1 , . . . , y m ) = A(z 1 , . . . , z m ) mit zi =
m j,k=1
a ijk x j y k +
m j=1
u ij x j +
m
vki y k + wi ,
k=1
wobei die a ijk , u ij , vki , wi feste reelle Zahlen sind. Die Rechts- und Linksmultiplikation mit einem festen g ∈ G drücken wir nun in der gegebenen Parametrisierung aus, setzen also
266
21 Darstellungstheorie kompakter Gruppen
δg (x 1 , . . . , x m ) := η(A(x 1 , . . . , x m )g) ,
σg (x 1 , . . . , x m ) := η(g A(x 1 , . . . , x m ))
für (x 1 , . . . , x m ) ∈ Ω, wo η : G → Ω die inverse Abbildung zu A bezeichnet. Man zeige: a. Die JACOBImatrizen J δg , J σg sind auf Ω konstant. Wir bezeichnen ihre Determinanten mit D(g) := det J δg bzw. S(g) := det J σg . b. Die so definierten Abbildungen D, S : G → R∗ sind stetige Gruppenhomomorphismen in die multiplikative Gruppe R∗ = R\{0}. (Hinweis: Kettenregel!) c. Ein linkes bzw. rechtes H AARsches Integral auf G ist gegeben durch λ( f ) =
Ω
f (A(x)) m d x |S(A(x))|
Ω
f (A(x)) m d x. |D(A(x))|
bzw. ρ( f ) =
d. Man berechne H AARsche Integrale für die Gruppe aus Aufgabe 21.7 (natürlich ohne die dort schon verratenen Resultate zu beachten!). e. Man bestimme H AARsche Integrale für GL(n, R) und beweise insbesondere, dass diese Gruppen unimodular sind. (Hinweis: Hier wähle man für A die identische Abbildung. Die Parameter sind also die Matrixelemente selbst.) 21.9 Man zeige: Ist G unimodular, so ist für jedes linke H AARsche Maß λ
f (g −1 xg) dλ(x) = G
f (x) dλ(x) = λ( f ) G
für alle f ∈ Cc (G) , g ∈ G. 21.10 Man zeige: Die Modularfunktion auf einer linearen L IE-Gruppe ist Δ(X ) = | det Ad(X )| . Dabei ist Ad die adjungierte Darstellung, die in Beispiel 20.3c eingeführt wurde. (Hinweis: Man betrachte ein linkes H AAR-Integral, das durch (21.1) in Verbindung mit (21.2) gegeben ist.) 21.11 Sei D eine stetige unitäre Darstellung der kompakten Gruppe G auf dem H ILBERTraum H . Für ϕ ∈ H setze Pϕ :=
D(g)ϕ dg. G
Aufgaben
267
Man zeige, dass P der orthogonale Projektor auf den abgeschlossenen linearen Teilraum H1 := N (D(g) − I ) = {ϕ ∈ H | D(g)ϕ = ϕ ∀ g ∈ G} g∈G
ist. (Hinweis: Zunächst überlege man sich, dass R(P) ⊆ H1 und Pϕ = ϕ ⇐⇒ ϕ ∈ H1 . Dann betrachte man die Zerlegung von H in die beiden D-invarianten abgeschlossenen linearen Teilräume H1 und H1⊥ .) 21.12 Sei G eine kompakte Gruppe, D s = (d sjk ) eine irreduzible Matrixdarstellung vom Grad n s und U eine unitäre Darstellung von G auf H . Setze s P jk
:= n s G
d sjk (g) U (g) dg ,
j, k = 1, . . . , n s .
Man zeige: s sind beschränkt, und (P s )∗ = P s . a. Die Operatoren P jk jk kj b. s s P jt k = δst δk j P jk P jk .
c. P jsj ist orthogonale Projektion. s = n s d s (g)P s und P s U (g) = n s d s (g)P s . d. U (g)P jk lk jk jl l=1 l j l=1 kl s u. Der Raum V := LH(v , . . . , v ) e. Ist 0 = u ∈ H und k fest, so setze v j := P jk 1 ns ist dann U -invariant, und U V ist zu D s äquivalent. f. Sei dim H < ∞. Wir zerlegen U gemäß (21.33) in irreduzible Darstellungen D t, p = U V t, p mit D t, p ∼ D t für alle p. In V t, p führen wir eine Basis t, p t, p {e1 , . . . , en t } ein, in Bezug auf die D t, p gerade die Matrixdarstellung (d tjk ) s durch Angabe ihrer Werte auf hat. Man beschreibe die lineare Abbildung P jk t, p
den Basisvektoren el
von H .
21.13 Unter den Voraussetzungen und mit den Bezeichnungen aus Aufgabe 21.12 setzen wir P s := n s
χ s (g)U (g) dg = G
ns
P jsj .
j=1
Man zeige: a. (P s )∗ = P s , P s P t = δst P s . Insbesondere ist jedes P s ein orthogonaler Projektor.
268
21 Darstellungstheorie kompakter Gruppen
b. P s U (g) = U (g)P s für alle g ∈ G. c. Im Falle dim H < ∞ ist s P s = id H sowie s, j P jsj = id H . d. P s ist der orthogonale Projektor auf den Teilraum V s von H , der die Summe aller irreduziblen Teilräume ist, auf denen U zu D s äquivalent ist. 21.14 Seien G 1 , G 2 zwei kompakte Gruppen und Di endlichdimensionale Darstellungen von G i , i = 1, 2. Man zeige: Das äußere Tensorprodukt von D1 und D2 (Aufg. 20.9) ist genau dann irreduzibel, wenn D1 , D2 irreduzibel sind. (Hinweis: Am bequemsten ist es, das Kriterium aus Theorem 21.17b zu verwenden.) 21.15 Sei G eine kompakte Gruppe. Eine Funktion f ∈ C(G) heißt Klassenfunktion, wenn f (g −1 xg) = f (x)
∀ x, g ∈ G .
(21.52)
Man zeige: a. Die Menge C K l (G) der Klassenfunktionen ist ein abgeschlossener linearer Unterraum von C(G). b. Die Charaktere der endlichdimensionalen Darstellungen von G gehören zu C K l (G). c. Durch f (h −1 xh) dh , x∈G (P f )(x) := G
ist ein beschränkter linearer Operator C(G) → C K l (G) gegeben. Dabei ist f ∈ C K l (G) ⇐⇒ P f = f . d. Ist d jk ein Matrixelement einer irreduziblen unitären Darstellung D von G, so ist P(d jk ) = n −1 χ D δ jk , wo χ D der Charakter und n der Grad von D ist. (Hinweis: Man verwende (21.29) für T = D(x) sowie (21.31).) 21.16 Sei G eine kompakte Gruppe. Mit den Bezeichnungen aus Abschn. E setzen wir K := LH({χs | s ∈ S}), wobei χs der Charakter von D s ist. Man beweise, dass jede Klassenfunktion f ∈ C K l (G) gleichmäßiger Limes von Elementen von K ist. (Hinweis: Man verwende die vorige Aufgabe sowie den Satz von P ETER -W EYL in der verschärften Fassung, die in der Bemerkung vor Theorem 21.24 berichtet wird.)
Aufgaben
269
21.17 Sei G eine endliche Gruppe und h ihre Klassenzahl, d. h. die Anzahl ihrer Konjugiertenklassen (vgl. Aufgabe 17.15). Da in Bezug auf die diskrete Topologie (Beispiel 1.5c) alle Funktionen auf G stetig sind, besteht C K l (G) aus allen Funktionen f : G → C, für die (21.52) gilt. a. Man zeige: Die Dimension des C-Vektorraums C K l (G) ist h. b. Sei {D s | s ∈ S} wieder ein System von irreduziblen Darstellungen von G, das aus jeder Äquivalenzklasse von irreduziblen Darstellungen genau einen Vertreter enthält, und sei χs der Charakter von D s . Man zeige: Die Menge der χs , s ∈ S, ist eine Orthonormalbasis von C K l (G) in Bezug auf das Skalarprodukt f 1 | f 2 :=
1 f 1 (g) f 2 (g). |G| g∈G
c. Man folgere: Die Anzahl der Äquivalenztypen von irreduziblen Darstellungen von G ist die Klassenzahl h. 21.18 Für eine kompakte lineare L IE-Gruppe G ≤ GL(n, K) folgere man den Satz von P ETER -W EYL aus Satz 21.32. (Hinweis: Um Bedingung 2 aus Satz 21.32 zu verifizieren, benutze man die natürliche Darstellung (vgl. Beispiel 20.2b). Man beachte auch Satz 10.39.)
Kapitel 22
Die infinitesimale Methode in der Darstellungstheorie
Nach Theorem 19.10 können wir jeder linearen L IE-Gruppe G ≤ GL(n, K) ihre L IE-Algebra L(G) zuordnen, die den Tangentialraum an G in E darstellt und als L IE-Produkt das Kommutatorprodukt trägt. Bei der detaillierten Untersuchung und vor allem bei der expliziten Berechnung der irreduziblen Darstellungen arbeitet man lieber mit L IE-Algebren als mit den L IE-Gruppen selbst, weil die Struktur von L IE-Algebren wesentlich leichter durchschaut werden kann. Dazu muss man die Darstellungstheorie auf die L IE-Algebren übertragen, und man muss untersuchen, was die Darstellungen von L(G) mit denen von G selbst zu tun haben. Wir führen in Abschn. A einige Grundbegriffe der Darstellungstheorie der L IEAlgebren ein, geben in Absch. B einige zusätzliche Informationen zu Exponentialfunktion und Logarithmus von Matrizen und diskutieren dann in Abschn. C, wie eine Darstellung D einer linearen L IE-Gruppe G „linearisiert“ werden kann, was zu einer Darstellung von L(G) führt. Wie man dann umgekehrt von einer Darstellung von L(G) zu einer Darstellung von G gelangt, ist das Thema des letzten Abschnitts. Allerdings sind hierbei einige topologische Feinheiten zu beachten, und wir werden versuchen, von diesen eine Vorstellung zu geben, ohne alle mathematischen Details auszuarbeiten. Das Problem besteht darin, dass eine gegebene Darstellung von L(G) zunächst nur zu einer lokalen Darstellung von G führt (d. h. zu einer Darstellung, die nur in einer Umgebung der Eins definiert ist) und dass man, um zu einer globalen ersetzen Darstellung zu gelangen, die Gruppe G durch eine modifizierte Gruppe G muss, die dieselbe L IE-Algebra besitzt wie G. In der Sprache der Topologie ist eine Überlagerung von G, und die topologische Theorie der Überlagerungen G = G ist, wenn G einfach-zusammenhängend ist. Für einfachzeigt nun, dass G zusammenhängende L IE-Gruppen besteht also tatsächlich eine bijektive Korrespondenz zwischen den Darstellungen der Gruppe und denen ihrer L IE-Algebra. Fast alles, was in diesem Kapitel besprochen wird, gilt nicht nur für Darstellungen, sondern für ganz beliebige (stetige) Homomorphismen zwischen allgemeinen L IE-Gruppen bzw. deren L IE-Algebren. Wir beschränken uns hier weitgehend auf Darstellungen von linearen L IE-Gruppen, weil es uns letzten Endes darum geht, die Darstellungen von physikalisch interessanten L IE-Gruppen zu berechnen und zu untersuchen. Bei dem Thema des letzten Abschnitts erweist sich diese Beschränkung jedoch als sehr hinderlich für eine übersichtliche Formulierung der K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_22, C Springer-Verlag Berlin Heidelberg 2010
271
272
22 Die infinitesimale Methode in der Darstellungstheorie
mathematischen Tatsachen, und deshalb gehen wir dort kurz auf die Verallgemeinerung auf beliebige Homomorphismen ein und formulieren den Zusammenhang zwischen lokalen und globalen Homomorphismen in voller Allgemeinheit.
A Darstellungen von L IE-Algebren Die Grundbegriffe der Darstellungstheorie von L IE-Algebren sind denen für Gruppen weitgehend analog, und wir stellen hier zunächst die wichtigsten derartigen Begriffe zusammen: Definitionen 22.1 Für einen n-dimensionalen K-Vektorraum V sei L(V ) die zu gl(n, K) isomorphe L IE-Algebra der linearen Abbildungen A : V −→ V mit dem Kommutatorprodukt [A, B] = AB − B A
(22.1)
als L IE-Produkt. a. Sei L eine beliebige L IE-Algebra über K. Eine Darstellung D von L auf V ist ein L IE-Algebren-Homomorphismus D : L −→ L(V ), d. h. eine lineare Abbildung mit D([L 1 , L 2 ]) = [D(L 1 ), D(L 2 )] ,
L i ∈ L.
(22.2)
Entsprechend nennt man einen L IE-Algebren-Homomorphismus D : L −→ gl(n, K) eine Matrixdarstellung von L vom Grade n über K. b. Ist V ein n-dimensionaler C-H ILBERTraum, so heißt eine L IE-AlgebrenDarstellung D von L auf V 1. selbstadjungiert, wenn D(L)∗ = D(L) für alle L ∈ L ,
(22.3)
2. schiefadjungiert, wenn D(L)∗ = −D(L) für alle L ∈ L.
(22.4)
c. Eine Darstellung D von L auf V heißt irreduzibel, wenn {0} und V die einzigen Unterräume von V sind, die invariant unter allen D(L), L ∈ L, sind. d. Eine Darstellung D von L auf V heißt vollreduzibel, wenn V =
m
Vj
(22.5)
j=1
ist, wobei die Unterräume V j D-invariant und die D j := D
Vj
irreduzibel sind.
A
Darstellungen von L IE-Algebren
273
e. Zwei Darstellungen D1 von L auf V1 , D2 von L auf V2 heißen äquivalent, wenn es einen Isomorphismus T : V1 −→ V2 gibt, so dass D2 (L)T = T D1 (L) ∀ L ∈ L.
(22.6)
Man kann diese Begriffe auch formulieren, wenn der Trägerraum der Darstellung ein unendlich-dimensionaler H ILBERTraum ist. Solche Darstellungen werden bei den Anwendungen in der Quantenmechanik benötigt. Jedoch erfordert die Theorie solcher unendlich-dimensionalen L IE-Algebren-Darstellungen erhebliche Hilfsmittel aus der Operatortheorie, und wir können aus Platzgründen hier nicht näher darauf eingehen (vgl. etwa [5]). Wir werden uns daher im Folgenden auf endlich-dimensionale Darstellungen beschränken und lediglich in Beispielen auf den unendlich-dimensionalen Fall eingehen. Für L IE-Algebren-Darstellungen hat man folgende Variante des S CHURschen Lemmas aus Satz 20.14: Satz 22.2 Sei L eine L IE-Algebra, und sei D eine selbstadjungierte oder schiefadjungierte Darstellung von L auf dem n-dimensionalen C-H ILBERTraum H . Dann gilt: Genau dann ist D irreduzibel, wenn jeder selbstadjungierte Operator C : H −→ H mit CD(L) = D(L)C
∀L ∈L
(22.7)
ein Vielfaches der Identität ist, d. h. die Form C = λI,
λ∈R
(22.8)
hat. Jeder Operator C, der (22.7) erfüllt, heißt ein C ASIMIR-Operator der Darstellung D. Beweis Wir führen den Beweis für selbstadjungierte Darstellungen. Die Aussage überträgt sich dann auf jede schiefadjungierte Darstellung D durch Übergang zu der := iD. selbstadjungierten Darstellung D a. Sei D irreduzibel, und sei C : H −→ H ein selbstadjungierter Operator, der (22.7) erfüllt. Nach einer schon mehrfach benutzten Schlussweise ist dann jeder Eigenraum Mλ von C invariant unter allen Operatoren D(L), L ∈ L. Aber C besitzt mindestens einen reellen Eigenwert λ, und da D irreduzibel ist, gilt Mλ = H,
d. h. C = λI auf ganz H .
b. Angenommen, es gibt einen echten D-invarianten Unterraum U ⊆ H . Da die D(L) selbstadjungiert sind, ist auch U ⊥ invariant unter allen D(L), L ∈ L. Die
274
22 Die infinitesimale Methode in der Darstellungstheorie
orthogonale Projektion P : H −→ H von H auf U ist dann selbstadjungiert und vertauscht nach (15.31) mit allen D(L). Aber P ist kein Vielfaches der Identität.
B Weitere Eigenschaften der Exponentialfunktion Für die Untersuchung der L IE-Gruppen und ihrer Darstellungen mittels der entsprechenden L IE-Algebren und deren Darstellungen ist es, wie wir sehen werden, von entscheidender Bedeutung, die Matrizen e A e B , e A+B und e[A,B] vergleichen zu können. Sind etwa A, B klein genug, so kann man C := ln(e A e B )
(22.9)
bilden, und dann ist e A e B = eC . Ist [A, B] = 0, so ist natürlich C = A + B. Im allgemeinen Fall [A, B] = 0 ist der Zusammenhang komplizierter und wird durch die sogenannte BAKER-C AMPBELL-H AUSDORFF-Formel gegeben (vgl. etwa [39] oder [58]), von der wir nur den folgenden Spezialfall benötigen: Satz 22.3 Seien A, B ∈ Cn×n , |t| hinreichend klein, so dass C(t) := ln(et A et B )
(22.10)
wohldefiniert ist. Dann gilt: C(t) =
∞
t k Ck
(22.11)
k=1
mit C1 = A + B, C3 =
1 12
C2 =
1 2
[A, B] ,
([[A, B] , B] + [[A, B] , A] ).
(22.12)
Insbesondere gilt für t → 0 die Asymptotik C(t) = t (A + B) +
t2 [A, B] + O(t 3 ). 2
(22.13)
Beweis Wählt man ε > 0 so klein, dass et A et B − E < 1
für |t| < ε,
so ist C(t) eine durch (22.10) eindeutig definierte analytische Funktion von t, und es gilt C(0) = 0. Daher hat C(t) tatsächlich eine Potenzreihenentwicklung der Form (22.11). Für |t| < ε ist außerdem
B
Weitere Eigenschaften der Exponentialfunktion
275
et A et B = eC(t) .
(22.14)
Setzt man in diese Gleichung die Reihenentwicklungen von et A , et B und von C(t) gemäß (22.11) ein, so führt Koeffizientenvergleich auf (22.12) (wobei wir die Einzelheiten dieser Rechnung dem Leser überlassen). Daraus folgt auch (22.13). Bemerkung Prinzipiell kann man auch alle weiteren Ck nach dieser Methode bestimmen, da der Koeffizientenvergleich entsprechende Rekursionsformeln ergibt. Die entstehenden Ausdrücke sind sämtlich Linearkombinationen von iterierten Kommutatoren, doch nimmt ihre Komplexität rasch zu, und es gelingt auf diese Weise nicht, zu einer geschlossenen Formel wie der von BAKER, C AMPBELL und H AUSDORFF zu gelangen. Als Konsequenz des letzten Satzes erhält man: Satz 22.4 Für A, B ∈ Cn×n gilt: 1
1
lim (e m A e m B )m = e A+B ,
(22.15)
m−→∞ 1
1
1
1
lim (e− m A e− m B e m A e m B )m = e[A,B] . 2
m−→∞
(22.16)
Beweis a. Um (22.15) zu beweisen, benutzen wir (22.13) in der Form C(t) = t (A + B) + O(t 2 ) Mit t =
1 m
für t → 0.
folgt dann aus (22.14) 1
1
1
(e m A e m B )m = (e m (A+B)+O(1/m ) )m 2
1
= e A+B+O( m ) −→ e A+B . m−→∞
b. Zum Beweis von (22.16) benutzen wir (22.13). Dazu schreiben wir 1
1
1
1
e− m A e− m B = e m C mit C = −(A + B) + 1
1
e m Ae m B
= e m C mit C = (A + B) +
Somit folgt, wenn wir (22.13) erneut benutzen
1 2m
1 2m
[A, B] + O( m12 ),
[A, B] + O( m12 ).
276
22 Die infinitesimale Methode in der Darstellungstheorie 1
1
1
1
(e− m A e− m B e m A e m B )m = 7 2 6 % & = (exp m1 (C + C ) + 2m1 2 C , C + O( m13 ) )m = 7 2 6 = (exp m12 [A, B] + O( m13 ) )m −→ e[A,B] . 2
Bemerkung Gl. (22.15) wird T ROTTERsche Produktformel genannt. Die speziellen Eigenschaften der Exponentialabbildung führen schließlich dazu, dass man bei stetigen Darstellungen – und anderen stetigen Homomorphismen – von L IE-Gruppen o.B.d.A. davon ausgehen kann, dass sie beliebig oft differenzierbar sind. Jeder stetige Gruppenhomomorphismus Φ : (R, +) −→ GL(n, K) ist schon von der Klasse C 1 , wie man mit etwas Analysis nachweisen kann (Details z. B. in [34], Ergänzungen zu Kap. 19), und somit (Theorem 19.11c) ist er von der Form Φ(t) = exp t A mit einer Matrix A ∈ Kn×n . Er ist also reell-analytisch und insbesondere von der Klasse C ∞ . Betrachten wir nun allgemeiner einen stetigen Gruppenhomomorphismus Φ : G −→ H, wo G , H lineare L IE-Gruppen sind (also z. B. eine stetige Matrixdarstellung von G), und fixieren wir einen Punkt X 0 ∈ G. In einer Umgebung von X 0 haben wir dann gemäß Korollar 19.14 eine Parametrisierung der Form Ξ (t1 , . . . , tm ) := X 0 (exp t1 B1 )(exp t2 B2 ) · · · (exp tm Bm ). Die Kurven R −→ H , t −→ Φ(exp t B j ) sind stetige Gruppenhomomorphismen, also ist Φ(exp t B j ) = exp t A j mit geeigneten Matrizen A1 , . . . , Am , wie gerade erläutert. Also ist Φ(Ξ (t1 , . . . , tm )) = Φ(X 0 )Φ(exp t1 B1 ) · · · Φ(exp tm Bm ) = Φ(X 0 )(exp t1 A1 ) · · · (exp tm Am ), und das ist in den Koordinaten (t1 , . . . , tm ) reell-analytisch und insbesondere C ∞ . Diese Überlegung kann auf allgemeine L IE-Gruppen ausgedehnt werden und führt zu dem folgenden Satz, der z. B. in [74] detailliert bewiesen wird: Satz 22.5 Seien G, H zwei L IE-Gruppen. Jeder stetige Gruppenhomomorphismus G → H ist reell-analytisch und insbesondere beliebig oft differenzierbar. Um den Satz in dieser Allgemeinheit aussprechen zu können, muss man allerdings zunächst sicherstellen, dass jede L IE-Gruppe in eindeutiger Weise mit der Struktur einer reell-analytischen Mannigfaltigkeit versehen werden kann, was
C
Beziehungen zwischen den Darstellungen von G und L(G)
277
ebenfalls in [74] und vielen anderen Büchern über L IE-Gruppen geschieht. Wir werden den Satz jedoch nur auf lineare L IE-Gruppen anwenden, wo dieser Aspekt unproblematisch ist. Die hauptsächliche Nutzanwendung für uns ist, dass wir Darstellungen unserer linearen L IE-Gruppen unbekümmert differenzieren können, auch wenn sie nur als stetig vorausgesetzt wurden.
C Beziehungen zwischen den Darstellungen von G und L(G) Wir zeigen zunächst, wie man von einer Gruppendarstellung zu einer Darstellung der zugehörigen L IE-Algebra kommt. Satz und Definition 22.6 Sei G eine lineare L IE-Gruppe, L(G) ihre L IE-Algebra, und sei D eine stetige Darstellung von G auf einem n-dimensionalen Vektorraum V . a. Dann wird durch D(L) := dD E (L) =
d D(et L ) t=0 dt
(22.17)
für L ∈ L(G) eine Darstellung von L(G) auf V definiert. Wir nennen D die Linearisierung der Darstellung D und schreiben D = D∗ . b. Es gilt D(e L ) = e D∗ (L) ,
L ∈ L(G) .
(22.18)
Beweis a. Die Darstellung D ist nach Satz 22.5 ein differenzierbarer Gruppenhomomorphismus G −→ GL(V ). Ihr Differential dD E am Einselement E von G ist daher eine lineare Abbildung L(G) = TE G −→ TE GL(V ) = L(V ). Wir brauchen also nur noch die Gleichung D([L 1 , L 2 ]) = [D(L 1 ), D(L 2 )]
(22.19)
für L 1 , L 2 ∈ L(G) nachzuweisen. Dazu benutzen wir Satz 22.4 sowie Teil b, den wir gleich unabhängig von (22.19) beweisen werden. Wir haben:
278
22 Die infinitesimale Methode in der Darstellungstheorie
et D([L 1 ,L 2 ]) = D(et[L 1 ,L 2 ] ) t
t
t
t
= D( lim (e− m L 1 e− m L 2 e m L 1 e m L 2 )m ) m−→∞
t
t
2
t
t
= lim {D(e− m L 1 )D(e− m L 2 )D(e m L 1 )D(e m L 2 )}m m−→∞
= lim {e− m D(L 1 ) e− m D(L 2 ) e m D(L 1 ) e m D(L 2 ) }m m−→∞ = et [D(L 1 ),D(L 2 )] . t
t
t
t
2
2
Differentiation bei t = 0 liefert nun (22.19). b. Für festes L ∈ L(G) ist durch Φ(t) := D(exp t L) ,
t ∈R
offenbar eine Ein-Parameter-Untergruppe von GL(V ) gegeben. Nach Theorem 19.11c gibt es daher A ∈ L(V ) so, dass D(exp t L) = exp t A
∀ t ∈ R.
Differenzieren wir dies bei t = 0, so finden wir A = D∗ (L). Für t = 1 ergibt sich somit (22.18). Beispiel 22.7 Für eine beliebige lineare L IE-Gruppe G berechnen wir die Linearisierung der adjungierten Darstellung D = Ad (Beispiel 20.3c). Sind L , M ∈ g = L(G), so schreiben wir Y (t) := et L , und dann haben wir nach Definition Ad(Y (t)) M = Y (t)MY (−t) für alle t ∈ R. Also ergibt (22.17) Ad∗ (L) M = Y˙ (0)MY (0) − Y (0)M Y˙ (0) = L M − M L = [L , M]. Man schreibt ad := Ad∗ und nennt dies die adjungierte Darstellung der L IE-Algebra g. Insbesondere folgt mit Satz 22.6, dass die Abbildung ad : g −→ L(g) , L −→ [L , ·] ein Homomorphismus von L IE-Algebren ist. Das kann man allerdings auch rein algebraisch aus der JACOBI-Identität ableiten (Aufgabe 19.10). Die Gl. (22.18) sorgt dafür, dass man D in gewissem Umfang aus seiner Linearisierung D∗ zurückgewinnen kann: Korollar 22.8 Seien D 1 , D 2 zwei stetige Darstellungen einer zusammenhängenden linearen L IE-Gruppe G auf dem n-dimensionalen Raum V . Dann gilt: D∗1 = D∗2
⇒
D1 = D2 .
C
Beziehungen zwischen den Darstellungen von G und L(G)
279
Beweis Nach Satz 19.16b ist jedes X ∈ G ein endliches Produkt X = eL 1 eL 2 · · · eL m mit L 1 , L 2 , . . . , L m ∈ L(G). Da D 1 , D 2 Homomorphismen sind, folgt mit (22.18) also D 2 (X ) = D 2 (exp L 1 ) · · · D 2 (exp L m ) = (exp D∗2 (L 1 )) · · · (exp D∗2 (L m )) = (exp D∗1 (L 1 )) · · · (exp D∗1 (L m )) = D 1 (exp L 1 ) · · · D 1 (exp L m ) = D 1 (X ). Auf die Voraussetzung, dass G zusammenhängend ist, kann nicht verzichtet werden, wie schon das einfache Beispiel der Determinante zeigt: Für die Gruppe GL(n, R) betrachten wir die beiden Matrixdarstellungen vom Grade 1: D(X ) := det X ,
D + (X ) := | det X |.
In einer Umgebung der Einheitsmatrix ist die Determinante positiv, also stimmen D und D + dort überein. Die Definition (22.17) liefert daher D∗ = D∗+ . Aber im Falle det X < 0 ist natürlich D + (X ) = D(X ). Zum Schluss untersuchen wir noch, wie es sich auf die Linearisierung auswirkt, wenn eine Darstellung unitär bzw. irreduzibel ist: Satz 22.9 Sei G eine lineare L IE-Gruppe, und sei D eine stetige unitäre Darstellung auf einem n-dimensionalen C-H ILBERTraum H . a. Dann ist D∗ eine schiefadjungierte und D(L) := iD∗ (L),
L ∈ L(G)
(22.20)
eine selbstadjungierte Darstellung von L(G) auf H . b. Ist G zusätzlich zusammenhängend, so ist D genau dann irreduzibel, wenn D∗ irreduzibel ist. Beweis a. Die unitäre Darstellung D ist ein analytischer Homomorphismus G −→ U(n), also ist D∗ ein L IE-Algebrenhomomorphismus L(G) −→ u(n). Aber nach Korollar 19.13 ist u(n) = {B ∈ Cn×n | B ∗ = −B}, was die Schiefadjungiertheit zeigt. Dass (22.20) dann eine selbstadjungierte Darstellung definiert, ist klar. b. Angenommen, D ist irreduzibel. Dann zeigen wir die Irreduzibilität von D∗ mittels Satz 22.2. Sei also C ein C ASIMIRoperator für D∗ . Für X 1 = exp L , L ∈ L(G), ist dann nach (22.18) C D(X 1 ) = D(X 1 )C, denn aus C D∗ (L) =
280
22 Die infinitesimale Methode in der Darstellungstheorie
D∗ (L)C folgt C exp D∗ (L) = (exp D∗ (L))C nach Definition der Exponentialabbildung. Aber nach Satz 19.16b ist jedes X ∈ G ein endliches Produkt X = X 1 X 2 · · · X m mit X j ∈ exp(L(G)) , j = 1, . . . , m, also auch D(X ) = D(X 1 )D(X 2 ) · · · D(X m ) und folglich C D(X ) = D(X )C, da C mit jedem D(X j ) vertauscht werden kann. Nach Theorem 20.14a ist also C = λI mit einem Skalar λ, und dieser muss reell sein, da C selbstadjungiert ist. Nun sei umgekehrt D∗ als irreduzibel vorausgesetzt. Wir zeigen Irreduzibilität von D mittels Theorem 20.14b. Sei also A : H → H ein linearer Operator, der mit allen D(X ) , X ∈ G, vertauscht. Da D unitär ist, folgt dann auch A∗ D(X ) = (D(X −1 )A)∗ = (AD(X −1 ))∗ = D(X )A∗ für alle X . Somit vertauschen auch die selbstadjungierten Operatoren B :=
1 (A + A∗ ) 2
und C :=
1 (A − A∗ ) 2i
mit allen D(X ). Für L ∈ L(G) ist also Bet L = et L B für alle t, und durch Differenzieren bei t = 0 ergibt sich dann B D∗ (L) = D∗ (L)B. Also ist B ein C ASIMIRoperator, und das Gleiche gilt für C. Nach Satz 22.2 ist demnach B = β I , C = γ I mit reellen Skalaren β, γ . Es folgt A = B +iC = λI , λ := α +iβ, wie gewünscht.
D Lokale und globale Homomorphismen Sei zunächst wieder G eine lineare L IE-Gruppe und g := L(G). Ist eine Darstellung D : g → L(V ) gegeben, so liegt es nahe, durch D(e L ) := exp (D(L)) ,
L∈g
(22.21)
eine Abbildung D mit Werten in GL(V ) zu definieren und zu hoffen, dass diese zu einer Darstellung D von G führt, deren Linearisierung dann das gegebene D wäre. Allerdings ist D zunächst nur auf dem Wertebereich der Exponentialfunktion definiert. Immerhin erfüllt es in einer Umgebung der Eins die Rechenregeln für eine Darstellung, denn es gilt: Satz 22.10 Sei G eine lineare L IE-Gruppe mit L IE-Algebra g = L(G), und sei D eine stetige Darstellung von g auf einem endlich-dimensionalen Vektorraum V . Dann gibt es eine Umgebung U von E in G so, dass durch (22.21) ein lokaler Gruppenhomomorphismus D : U −→ GL(V ) definiert ist, d. h. es gilt D(E) = E und
D
Lokale und globale Homomorphismen
281
D(X Y ) = D(X )D(Y ),
falls X, Y, X Y ∈ U.
Man nennt dann D eine lokale Darstellung von G auf V . Beweis Wir benutzen die BAKER -C AMPBELL -H AUSDORFF-Formel in Gestalt von Satz 22.3. Sind also A, B ∈ g und A , B < ε hinreichend klein, so existiert C(t) = ln(et A et B ) =
∞
t k Ck
(22.22)
k=1
für alle t ∈] − 1 − δ, 1 + δ[ mit einem δ > 0. Dabei ist C1 = A + B,
C2 =
1 [A, B] , 2
usw.
(22.23)
Ebenso existiert (evtl. nach Verkleinerung von ε) = ln(et D(A) et D(B) ) = C(t)
∞
k tkC
für |t| < 1 + δ.
k=1
Dabei ist 1 = D(A) + D(B) = D(A + B) = D(C1 ), C 2 = 1 [D(A), D(B)] = 1 D([A, B]) = D(C2 ), C 2 2
usw.
Tatsächlich ist k = D(Ck ) C
∀ k,
(22.24)
da alle diese Koeffizienten durch Linearkombinationen von iterierten Kommutatoren ausgedrückt werden können. Wegen der Konvergenz der Reihen folgt hieraus = D(C(t)) C(t)
für |t| < 1 + δ,
und das ergibt D(e A e B ) = D(eC(1) ) = eD(C(1))
= eC(1) = eD(A) eD(B) = D(e A )D(e B ). Dass D die Einheitsmatrix in die Einheitsmatrix überführt, ist klar.
Bemerkung Unsere Begründung für (22.24) ist nicht völlig rigoros, doch kann man sie durch den Einsatz der vollen BAKER -C AMPBELL -H AUSDORFF-Formel rigoros machen (vgl. etwa [39] oder [58]).
282
22 Die infinitesimale Methode in der Darstellungstheorie
Für das Weitere benötigen wir eine leichte Verallgemeinerung von Satz 19.16b: Lemma 22.11 Sei G eine L IE-Gruppe, G 0 die Zusammenhangskomponente der Eins und U ⊆ G 0 eine Umgebung der Eins. Dann wird G 0 von U erzeugt, d. h. jedes Element von G 0 kann als endliches Produkt von Elementen von U geschrieben werden. Beweis Da die Inversenbildung eine stetige Abbildung G → G ist, gibt es eine Umgebung V ⊆ G 0 der Eins so, dass V −1 := {X −1 | X ∈ V } ⊆ U. Die Umgebung W0 := V ∩ V −1 ist dann gegen Inversenbildung invariant und liegt in U. Die Menge G 1 aller endlichen Produkte von Elementen von W0 ist somit eine offene Untergruppe von G 0 , und genau wie im Beweis von Satz 19.16b. folgert man hieraus, dass sogar G 1 = G 0 sein muss. Nun sei G zusammenhängend und die Situation ansonsten wie in Satz 22.10. Dann kann man nach Lemma 22.11 jedes X ∈ G als endliches Produkt X = X 1 X 2 · · · X m mit X j ∈ U schreiben, und daher wird man versuchen, D durch die Festsetzung D(X 1 · · · X m ) := D(X 1 ) · · · D(X m )
(22.25)
auf ganz G fortzusetzen. Aber die Darstellung X = X 1 · · · X m ist nicht eindeutig, und dies kann die Fortsetzung von D zu einem echten Gruppenhomomorphismus vereiteln. Betrachten wir etwa G = U(1) mit der L IE-Algebra u(1) = iR. Für jedes c ∈ R ist die Abbildung Dc : u(1) −→ L(R) = R , it −→ ct eine Darstellung dieser L IE-Algebra auf dem Trägerraum V = R. Mittels (22.21) gewinnt man daraus die lokale Darstellung D c (eit ) = ect von U(1), die etwa auf U := {it | −π < t < π } wohldefiniert ist. Aber für c = 0 ist es unmöglich, D c stetig auf ganz U(1) fortzusetzen, denn eiπ = −1 = e−iπ und lim D c (eit ) = ecπ ,
t/π
lim D c (eit ) = e−cπ .
t0−π
Tatsächlich besitzt U(1) außer D 0 ≡ 1 überhaupt keine stetige reelle Darstellung auf V = R, wie man sich leicht überlegen kann (Aufgabe 22.8). Um die Sachlage vollständig zu klären, ist es zweckmäßig, sich von den Darstellungen zu lösen und allgemeine Homomorphismen von allgemeinen L IE-Gruppen und deren L IE-Algebren zu betrachten. Dann gelten die Sätze 22.6, 22.8 und 22.10 sinngemäß, und da bei der Bildung der Linearisierung D∗ eigentlich nur die
D
Lokale und globale Homomorphismen
283
Beschränkung von D auf eine (beliebig kleine!) Umgebung der Eins berücksichtigt wird, kann man das Resultat von Satz 22.6 sogar für lokale Homomorphismen aussprechen. Zusammenfassend halten wir folgendes fest: Theorem 22.12 Seien G, H zwei L IE-Gruppen, eG , e H ihre neutralen Elemente und g = L(G) , h = L(H ) ihre L IE-Algebren a. Sei Φ : U → H ein lokaler analytischer Gruppenhomomorphismus, d. h. sein Definitionsbereich U ist eine Umgebung von eG in G, es ist Φ(eG ) = e H , und wenn x, y sowie x y zu U gehören, so gilt Φ(x y) = Φ(x)Φ(y). Dann ist das Differential ϕ := dΦeG : g −→ h ein Homomorphismus von L IE-Algebren. Wir nennen es die Linearisierung von Φ und schreiben ϕ = Φ∗ . Es gilt Φ(exp L) = exp (Φ∗ (L))
(22.26)
für alle L ∈ g mit exp L ∈ U. b. Seien Φ 1 , Φ 2 : G → H zwei stetige (und damit analytische!) Gruppenhomomorphismen, und sei Φ∗1 = Φ∗2 . Wenn G zusammenhängend ist, so folgt Φ 1 = Φ 2. c. Jeder L IE-Algebren-Homomorphismus ϕ : g → h ist die Linearisierung eines lokalen Gruppenhomomorphismus Φ : U → H , der auf einer Umgebung U der Eins in G definiert ist. Unsere nächste Aufgabe ist es, festzustellen, unter welchen Umständen die Linearisierung eines (lokalen) Gruppenhomomorphismus Φ ein Isomorphismus ist. Der Satz über inverse Funktionen gibt hierauf sofort eine lokale Antwort: Φ∗ ist genau dann ein Isomorphismus von g auf h, wenn Φ (nach etwaiger Verkleinerung seines Definitionsbereichs) ein Diffeomorphismus einer offenen Umgebung U der Eins in G auf eine offene Umgebung V der Eins in H ist. Global gilt jedoch nichts Entsprechendes, sondern nur die folgende Aussage: Satz 22.13 Seien G, H zusammenhängende L IE-Gruppen mit den L IE-Algebren g bzw. h, und sei Φ : G → H ein stetiger Gruppenhomomorphismus. Dann sind äquivalent: a. Φ∗ ist ein Isomorphismus g → h. b. Φ ist surjektiv, und der Kern K von Φ ist eine diskrete Teilmenge von G, d. h. jeder Punkt von K ist isoliert.
284
22 Die infinitesimale Methode in der Darstellungstheorie
Beweis (i) Sei ϕ := Φ∗ ein Isomorphismus. Nach dem Satz über inverse Funktionen bildet Φ dann eine offene Umgebung U der Eins e in G diffeomorph auf eine offene Umgebung V der Eins in H ab. Da H zusammenhängend ist, wird H nach Lemma 22.11 von V erzeugt. Zu jedem y ∈ H gibt es also endlich viele Elemente x1 , . . . , xm ∈ U mit y = Φ(x1 )Φ(x2 ) · · · Φ(xm ) = Φ(x1 x2 · · · xm ) ∈ Bild Φ. Somit ist Φ surjektiv. Für K := Kern Φ ist überdies K ∩ U = {e}, da Φ U eine Bijektion U → V ist. Die Linksmultiplikation mit einem festen g ∈ K ist aber ein Homöomorphismus G → G, und deshalb ist gU := {gx | x ∈ U} eine offene Umgebung von g mit K ∩ gU = {g}. Daher ist K diskret. (ii) Nun sei umgekehrt Φ surjektiv und K = Kern Φ diskret. Zunächst zeigen wir, dass Kern ϕ = {0}. Sei also L ∈ Kern ϕ. Nach Voraussetzung hat die Eins e in G eine offene Umgebung U in G mit K ∩U = {e}. Passend zu U wählen wir δ > 0 so, dass |t| < δ ⇒ exp t L ∈ U (Stetigkeit der Exponentialabbildung!). Wegen ϕ(L) = 0 folgt dann Φ(exp t L) = exp (tϕ(L)) = e H , d. h. für |t| < δ ist exp t L ∈ K ∩ U und somit exp t L = e. Differenziert man das bei t = 0, so ergibt sich L = 0, wie gewünscht. Also ist ϕ jedenfalls injektiv. Wäre nun dim H > dim G, so wäre nach einem bekannten Resultat aus der elementaren Theorie der differenzierbaren Mannigfaltigkeiten (z. B. Theorem 10.5 aus [51]) H \Φ(G) dicht in H , und insbesondere könnte Φ nicht surjektiv sein. Daher ist dim H ≤ dim G, also auch dim h ≤ dim g, und da ϕ eine injektive lineare Abbildung g → h ist, müssen die Dimensionen übereinstimmen, und ϕ muss ein Isomorphismus sein. Gerade hierdurch kommt die globale topologische Struktur von G ins Spiel, wie wir noch sehen werden. Zunächst aber geben wir einige wichtige Beispiele, wo Epimorphismen mit diskretem Kern auftreten: Beispiele 22.14 a. G = (R, +) , H = U(1) , Φ(t) = eiωt mit festem ω ∈ R\{0}. Der Kern ist dann K = (2π/ω)Z = {2π k/ω | k ∈ Z}, und die Linearisierung ist Φ∗ (t) = iωt. (Um dieses Beispiel richtig in die allgemeine Theorie einzuordnen, sollte man sich erinnern, dass hier L(G) = R und die Exponentialabbildung die identische Abbildung ist – vgl. Aufgabe 19.6, wo G als V1 bezeichnet wurde.)
D
Lokale und globale Homomorphismen
285
b. G = SU(2) , H = SO(3), und Φ ist der Epimorphismus aus Satz 18.13 c. und Theorem 18.16b. Der Kern besteht hier nur aus den zwei Elementen ±σ0 = ±e, und die Linearisierung bestimmt man durch Betrachtung der Generatoren S j , R j aus den Sätzen 18.10 und 18.3. Nach Satz 18.15 ist nämlich Φ(S j (α)) = Λ(S j (α)) = R j (α) ,
j = 1, 2, 3 ,
und somit ist d d Φ∗ ( S j ) = Φ(S j (α)) R j (α) = = Rj , dα dα α=0 α=0 d. h. Φ∗ ist nichts anderes als der in Satz 19.22 angegebene Isomorphismus su(2) → so(3). ↑ c. Für G = SL(2, C) , H = L + ist die Situation analog. Der Epimorphismus Λ aus Satz 18.13b und Theorem 18.16a hat den zweielementigen Kern K = {σ0 , −σ0 }, und seine Linearisierung führt die in Satz 19.24 angegebene Basis von sl(2, C) ↑ in die in Satz 19.23 angegebene Basis von o(1, 3) = L(L + ) über, wie wieder aus Satz 18.15 hervorgeht. Nun kommen wir auf die ursprüngliche Frage zurück, ob Homomorphismen von L IE-Algebren immer als Linearisierungen von geeigneten Gruppenhomomorphismen aufgefasst werden können. Theorem 22.15 Seien G, H zusammenhängende L IE-Gruppen mit den L IEAlgebren g = L(G) und h = L(H ). Zu jedem Homomorphismus ϕ : g → h von L IE-Algebren gibt es eine L IE-Gruppe G und zwei stetige Gruppenhomomorphismen Φ : G → H , Π : G → G so, dass gilt: Π∗ ist ein Isomorphismus L(G) → g, und ϕ = Φ∗ ◦ (Π∗ )−1 .
(22.27)
Bevor wir diesen Satz beweisen, wollen wir uns seine Bedeutung klarmachen: Da Π∗ ein Isomorphismus ist, bildet Π nach dem Satz über inverse Funktionen eine Umgebung U der Eins in G diffeomorph auf eine Umgebung U der Eins in G ab, und auf U ist nach Theorem 22.12c (nach etwaiger Verkleinerung der Umgebungen) ein lokaler Gruppenhomomorphismus Φ 0 definiert, dessen Linearisierung ϕ ist. Möglicherweise kann man diesen nicht zu einem globalen Homomorphismus fortsetzen, aber Φ 0 ◦Π U kann man sehr wohl zu einem globalen Homomorphismus Φ : G → H fortsetzen. Mittels Π∗ kann man also L(G) mit g identifizieren, und mittels Π U kann man G lokal bei der Eins mit G identifizieren. Tut man das, so hat man die Fortsetzbarkeit von Φ 0 zu einem globalen Homomorphismus dadurch erreicht, dass man G in seiner globalen Struktur zu G abgeändert hat, ohne das Aussehen lokal bei der Eins wesentlich zu beeinflussen.
286
22 Die infinitesimale Methode in der Darstellungstheorie
Beweis (von Theorem 22.15) Das direkte Produkt G × H hat als L IE-Algebra g × h, wobei sowohl die linearen Operationen als auch die L IE-Klammer komponentenweise definiert sind (Aufgabe 19.4). Insbesondere ist also [(A1 , A2 ), (B1 , B2 )] = ([A1 , B1 ], [A2 , B2 ]) für A1 , B1 ∈ g und A2 , B2 ∈ h. Der Graph Γ der Abbildung ϕ ist nun eine L IE-Teilalgebra von g × h, denn für A, B ∈ g haben wir [(A, ϕ(A)), (B, ϕ(B))] = ([A, B], [ϕ(A), ϕ(B)]) = ([A, B], ϕ([A, B])) ∈ Γ, weil ϕ ein Homomorphismus von L IE-Algebren ist. Nach Theorem 19.19 gibt es zu dieser L IE-Teilalgebra eine zusammenhängende L IE-Untergruppe G von G × H mit L(G) = Γ . Nun betrachten wir die kanonischen Projektionen Π1 : G × H −→ G , (g, h) −→ g, Π2 : G × H −→ H , (g, h) −→ h, π1 : g × h −→ g , (A1 , A2 ) −→ A1 , π2 : g × h −→ h , (A1 , A2 ) −→ A2 und setzen Π := Π1 G ,
Φ := Π2 G .
Offenbar sind die Πi Gruppenhomomorphismen mit Πi ∗ = πi für i = 1, 2 und daher Π ∗ = π 1 Γ ,
Φ ∗ = π 2 Γ .
Da Γ ⊆ g × h ein Graph ist, gehört zu jedem A1 ∈ g genau ein Element von Γ , dessen erste Komponente A1 ist, nämlich dasjenige mit der zweiten Komponente A2 = ϕ(A1 ). Das bedeutet, dass π1 Γ eine Bijektion von Γ auf g ist, und daher ist Π∗ ein Isomorphismus. Wieder nach Definition des Graphen ist außerdem Φ∗ = π2 Γ = ϕ ◦ π1 Γ , und daraus folgt (22.27).
Um die Diskussionen dieses Abschnitts zu einem befriedigenden Ende zu bringen, müssen wir nun noch einige Begriffe und Resultate aus der Topologie zumindest streifen:
D
Lokale und globale Homomorphismen
287
Überlagerungen Wir benötigen die folgenden topologischen Begriffe zwar nur für L IE-Gruppen, definieren sie aber in ihrem natürlichen Kontext, nämlich für H AUSDORFFräume (Definition 1.9). Viele Beweisdetails, die in die Topologie gehören, werden wir im folgenden übergehen und verweisen dazu auf Lehrbücher der algebraischen Topologie oder der Differentialtopologie, insbesondere auf solche, wo Topologie für die Bedürfnisse der Physik aufbereitet ist, wie etwa [59, 60, 62, 85]. Definitionen 22.16 Sei Y ein zusammenhängender H AUSDORFFraum. a. Eine Überlagerung von Y besteht aus einem H AUSDORFFraum X und einer surjektiven stetigen Abbildung p : X → Y , die folgende Eigenschaft besitzt: Jeder Punkt y0 ∈ Y hat eine Umgebung V, deren Urbild p −1 (V) die Vereinigung von paarweise disjunkten offenen Mengen Ui ist, für die die Einschränkungen p U Homöomorphismen Ui → V sind. (Der Index i kann dabei eine beliebige i Indexmenge durchlaufen.) Die Abbildung p heißt die Überlagerungsabbildung oder die Projektion. b. Y heißt einfach-zusammenhängend, wenn jede geschlossene Kurve in Y zu einer konstanten Kurve homotop ist. (Der Begriff der Homotopie ist dabei wie in Definition 4.40 zu verstehen, außer dass von den beteiligten Abbildungen nur Stetigkeit verlangt wird. Geschlossene Kurven sind als stetige Abbildungen S1 → Y zu verstehen.) Das erste der beiden folgenden Beispiele zeigt, wie man sich eine Überlagerung anschaulich vorstellen sollte. Beispiele 22.17 a. X = R , Y = U(1) = {z ∈ C | z z¯ = 1} und p(t) = eit bilden eine Überlagerung. Ist nämlich z 0 ∈ U(1), so wählen wir t0 ∈ R mit eit0 = z 0 und Uk =]t0 + 2π k − β, t0 + 2π k + β[ für k ∈ Z, wo β ∈]0, π ] fest gewählt ist. Dann ist Uk eine offene Umgebung von tk := t0 + 2π k, die Uk , k ∈ Z sind paarweise disjunkt, und p U k ist für jedes k ein Homöomorphismus von Uk auf einen Kreisbogen V, der nicht von k abhängt und der eine offene Umgebung von z 0 in U(1) ist. Man kann sich die Gerade R als eine Schraubenlinie vorstellen, die durch p senkrecht auf einen Kreis projiziert wird (Abb. 22.1), und derartige Bilder, die diese und verwandte Situationen betreffen, erklären den Ausdruck „Überlagerung“. b. Das vorige Beispiel ist ein Spezialfall der folgenden Situation: Seien G, H zusammenhängende L IE-Gruppen, und sei Φ : G → H ein Epimorphismus mit diskretem Kern K . Dann hat die Eins in G eine Umgebung U0 , für die Φ U ein 0 Homöomorphismus von U0 auf eine Umgebung V0 der Eins in H ist. Zu festem h 0 ∈ H betrachten wir die Umgebung V := V0 h 0 . Ihr Urbild unter Φ ist die Vereinigung der Ug := U0 g , g ∈ Φ −1 (h 0 ), und jedes Ug ist eine Umgebung von g, die von Φ homöomorph auf V abgebildet wird. Für g1 , g2 ∈ Φ −1 (h 0 ), g1 = g2
288
22 Die infinitesimale Methode in der Darstellungstheorie t0
Abb. 22.1 Die reelle Gerade als Überlagerung des Kreises U(1)
z0
U(1)
ist schließlich Ug1 ∩ Ug2 = ∅, denn andernfalls gäbe es x1 , x2 ∈ U0 so, dass x1 g1 = x2 g2 , und dann wäre Φ(x1 )h 0 = Φ(x2 )h 0 , also Φ(x1 ) = Φ(x2 ), und da Φ U injektiv ist, folgt x1 = x2 . Dann ist aber x1 g1 = x1 g2 , also g1 = g2 im 0 Widerspruch zur Annahme. Somit ist Φ eine Überlagerungsabbildung. Daraus erklärt sich auch die in Abschn. 18E verwendete Terminologie. c. Die Sphäre Sn = {(x0 , x1 , . . . , xn ) ∈ Rn+1 | x02 + · · · + xn2 = 1} ist für n ≥ 2 einfach-zusammenhängend. Das leuchtet anschaulich unmittelbar ein, aber ein rigoroser Beweis ist, wie häufig in der Topologie, recht aufwendig. Wir geben hier eine Skizze: Ist γ : S1 → Sn eine stetige geschlossene Kurve, so approximiert man diese zunächst, etwa nach dem W EIERSTRASSschen Approximationssatz, durch eine geschlossene C ∞ -Kurve. Wenn die Approximation gut genug ist, so sind die beiden Kurven dann auch homotop, wie man sich leicht überlegen kann. Daher dürfen wir o.B.d.A. annehmen, dass γ eine C ∞ -Kurve ist. Wegen n = dim Sn > 1 ist dann aber γ (S1 ) = Sn ([51], Theorem 10.5), und wir wählen einen Punkt P ∈ Sn \γ (S1 ). Dann kann man ganz Sn \{P} auf den gegenüberliegenden Punkt −P zusammenziehen, und dadurch wird insbesondere die Kurve γ zu einer konstanten Kurve deformiert. In einem Koordinatensystem, in dem P der Nordpol ist, lautet solch eine Homotopie etwa h(z, s) = mit
η(γ (z), s) , |η(γ (z), s)|
z ∈ S1 , s ∈ [0, 1]
D
Lokale und globale Homomorphismen
289
ηi (x, s) := (1 − s)xi für 0 ≤ i < n , ηn (x, s) := xn − s(xn + 1). d. Insbesondere ist SU(2) einfach-zusammenhängend, denn sie ist zu S3 diffeomorph, wie wir aus Satz 18.17 wissen. Das einzige substantielle Ergebnis aus der Topologie, das wir hier benötigen, ist Satz 22.18 Ist p : X → Y eine Überlagerung, X zusammenhängend und Y einfachzusammenhängend, so ist p ein Homöomorphismus. Auch hier skizzieren wir einen Beweis, ohne auf Einzelheiten einzugehen: Nach der Definition einer Überlagerung ist es klar, dass nur noch die Injektivität von p zu zeigen ist. Seien also x1 , x2 ∈ X so, dass p(x1 ) = p(x2 ) = y0 . Dann wählen wir Umgebungen V von y0 und Ui von xi wie in der Definition einer Überlagerung. Nach Voraussetzung gibt es eine stetige Kurve γ : [0, 1] → X , die x1 mit x2 verbindet, und dann ist p ◦ γ : [0, 1] → Y eine geschlossene Kurve. Sie ist (aufgefasst als Abbildung S1 → Y ) nach Voraussetzung also homotop zu einer konstanten Kurve, und solch eine Homotopie kann man immer so einrichten, dass der Punkt y0 bei der Deformation nicht bewegt wird. Es gibt also eine Abbildung h : [0, 1] × [0, 1] → Y mit h(t, 0) = p(γ (t)) für 0 ≤ t ≤ 1, h(t, 1) = y0 für 0 ≤ t ≤ 1, h(t, s)
= y0
für t = 0, t = 1 und 0 ≤ s ≤ 1.
Die Eigenschaften einer Überlagerung haben zur Folge (hier wäre wieder etwas Detailarbeit nötig!), dass h „geliftet“ werden kann zu einer Homotopie η : [0, 1] × [0, 1] → X , für die gilt: p◦η =h,
η(·, 0) = γ .
Insbesondere ist η(0, 0) = γ (0) = x1 ∈ U1 , und da p U injektiv ist, muss η(0, s) ≡ 1 x1 sein, denn x1 ist in U1 das einzige Urbild von p(η(0, s)) = h(0, s) = y0 . Aber auch p U ist injektiv und p(η(1, s)) = h(1, s) = y0 , also muss η(1, s) ≡ η(1, 0) = 2 γ (1) = x2 sein. Mit β(t) := η(t, 1) haben wir also eine Kurve, die x1 mit x2 verbindet und für die p ◦ β ≡ y0 ist. Da p −1 (y0 ) eine diskrete Menge ist, kann dies nur für konstantes β geschehen. Also ist x1 = x2 . Korollar 22.19 Seien G, H L IE-Gruppen mit den L IE-Algebren g bzw. h. Die Gruppe G sei zusammenhängend und einfach-zusammenhängend. Zu jedem Homomorphismus ϕ : g → h von L IE-Algebren gibt es dann genau einen Homomorphismus Φ : G → H von L IE-Gruppen mit ϕ = Φ∗ . Insbesondere gibt es zu jeder Darstellung D von g auf einem endlich-dimensionalen Raum V genau eine Darstellung D von G auf V , deren Linearisierung D ist.
290
22
Die infinitesimale Methode in der Darstellungstheorie
Beweis Es geht nur um die Existenz von Φ, denn die Eindeutigkeit ist schon aus Theorem 22.12b bekannt. Wir können H als zusammenhängend annehmen, indem wir H durch die Zusammenhangskomponente der Eins ersetzen. Dann erhalten wir mit Theorem 22.15 eine Gruppe G und Homomorphismen Φ : G → H , Π : G → G mit (22.27), d. h. mit ϕ = Φ∗ ◦ (Π∗ )−1 . Dabei ist Π∗ ein Isomorphismus, also Π eine Überlagerungsabbildung (Satz 22.13 und Beispiel 22.17b). Nun zeigt Satz 22.18 aber, dass Π ein Homöomorphismus, also sogar ein Isomorphismus von L IEGruppen, ist. Damit können wir Φ := Φ◦Π −1 setzen, was offenbar das Gewünschte leistet. Für eine zusammenhängende und einfach-zusammenhängende L IE-Gruppe G stiftet die Linearisierung also eine bijektive Korrespondenz zwischen den Gruppenhomomorphismen G → H auf der einen und den L IE-Algebren-Homomorphismen L(G) → L(H ) auf der anderen Seite. Insbesondere haben wir diese Korrespondenz für die Darstellungen.
22.20 Ausblick: Die universelle Überlagerung Zu jeder zusammenhängenden → G, die jede andere ÜberL IE-Gruppe G gibt es eine Überlagerung P : G lagerung von G überlagert und die deshalb die universelle Überlagerung genannt wird. Aufgrund dieser universellen Eigenschaft ist sie bis auf Isomorphie eindeutig eine zusammenhängende und einfach-zusammenhängende bestimmt. Dabei ist G L IE-Gruppe und P ein Epimorphismus von L IE-Gruppen, der diskreten Kern hat. In Theorem 22.15 kann man die von ϕ abhängende Gruppe G also durch die feste ersetzen, da G von G überlagert wird. Gruppe G Ist Π : G → G irgendein Epimorphismus mit diskretem Kern, wobei G ist. einfach-zusammenhängend ist, so erkennen wir mit Satz 22.17, dass G ∼ = G Um die universelle Überlagerung konkret anzugeben, genügt es also, eine einfachzusammenhängende Gruppe G zu finden, die einen Homomorphismus Φ mit diskretem Kern und Bild Φ = G besitzt. So haben wir in Beispiel 22.17a. die universelle Überlagerung von U(1) vor uns, und die universelle Überlagerung von SO(3) ↑ ist SU(2), die von L + ist SL(2, C), jeweils mit dem Epimorphismus aus 18E als Überlagerungsabbildung. Vorsicht ist jedoch geboten, wenn man sich nur auf lineare L IE-Gruppen beschränken will, wie wir es weitgehend tun. Z. B. kann die universelle Überlagerung von SL(2, R) nicht als lineare L IE-Gruppe realisiert werden (vgl. [71], S. 160).
Aufgaben zu Kap. 22 22.1 Die Determinante ist ein Homomorphismus GL(n, K) → K∗ = GL(1, K). Was ist ihre Linearisierung? 22.2 Für A ∈ gl(n, R) = Rn×n und f ∈ C ∞ (Rn ) definieren wir eine neue Funktion D(A) f durch
Aufgaben
291
[D(A) f ](x) :=
d f (x exp(t A)) , dt t=0
x ∈ Rn .
a. Man zeige: Ist A = (ai j ), so ist [D(A) f ](x) =
n i, j=1
xi ai j
∂f (x) ∂x j
für alle f ∈ C ∞ (Rn ). b. Man folgere: Die Abbildung D ist eine Darstellung der L IE-Algebra gl(n, R) auf dem Raum V = C ∞ (Rn ). c. Sei m ∈ N, und Vm ⊆ C ∞ (Rn ) sei der Teilraum der Polynome in n Variablen, deren Grad höchstens m beträgt. Man zeige: Vm ist D-invariant, und auf dem endlichdimensionalen Raum Vm ist D die Linearisierung einer geeigneten Darstellung der Gruppe GL(n, R). 22.3 Sei M eine differenzierbare Mannigfaltigkeit, auf der eine L IE-Gruppe G differenzierbar von rechts operiert. Für L ∈ L(G) und f ∈ C ∞ (M) definieren wir eine Funktion D(L) f durch d f (x · exp(t L)) [D(L) f ](x) := , dt t=0
x ∈ M.
a. Man zeige, dass D eine Darstellung der L IE-Algebra L(G) auf dem Raum V := C ∞ (M) ist. (Hinweis: Man kombiniere die beiden Teile von Aufgabe 19.12.) b. Sei W ein endlichdimensionaler Teilraum von C ∞ (M), der unter der Darstellung [T (g) f ](x) := f (x · g) ,
g ∈ G, x ∈ M
von G invariant ist, und sei D die Teildarstellung, die T auf W induziert. Man zeige, dass W dann auch unter der Linearisierung D∗ invariant ist und dass D∗ auf W mit D übereinstimmt. c. Man folgere die Ergebnisse der vorigen Aufgabe als Spezialfall. Bemerkung Obwohl C ∞ (M) unendliche Dimension hat, ist es wegen Teil b. angebracht, D als die Linearisierung von T anzusprechen. 22.4 Seien V1 , V2 endlichdimensionale K-Vektorräume. a. Seien D1 , D2 zwei Darstellungen einer L IE-Algebra L auf den Trägerräumen V1 bzw. V2 . Man zeige: Durch
292
22
Die infinitesimale Methode in der Darstellungstheorie
D(L) := D1 (L) ⊗ idV2 + idV1 ⊗ D2 (L) ,
L∈L
ist eine Darstellung von L auf V1 ⊗ V2 gegeben. b. Seien D 1 , D 2 stetige Darstellungen einer L IE-Gruppe G auf V1 bzw. V2 . Man zeige: (D 1 ⊗ D 2 )∗ (L) = D∗1 (L) ⊗ idV2 + idV1 ⊗ D∗2 (L) ,
L ∈ L(G) .
22.5 Sei D eine Darstellung der L IE-Algebra L auf dem Vektorraum V . Man zeige: Durch D(L)A := [D(L), A] ,
L∈L
ist eine L IE-Algebren-Darstellung von L auf dem Vektorraum End(V ) gegeben. (Hinweis: Aufgabe 19.10 ist hilfreich.) Bemerkung Man sagt, die Operatoren T1 , . . . , Tm ∈ End(V ) bilden einen Tensor operator zu D, wenn sie linear unabhängig sind und LH(T1 , . . . , Tm ) D-invariant ist. 22.6 Sei D eine stetige Darstellung einer (linearen) L IE-Gruppe auf einem ndimensionalen Vektorraum V , und sei W ein linearer Teilraum von V . Man zeige: a. Ist W D-invariant, so ist W auch D∗ -invariant. b. Ist W D∗ -invariant und die Gruppe zusammenhängend, so ist W auch D-invariant. 22.7 Sei D eine stetige Darstellung einer (linearen) L IE-Gruppe G auf einem n die gemäß Beispiel 20.3b. auf dimensionalen Vektorraum V , D := D∗ , und sei D End(V ) gelieferte Darstellung. Schließlich sei D die von D erzeugte Darstellung der L IE-Algebra L(G) auf End(V ) gemäß Aufgabe 22.5. Man zeige: ∗ = D. a. D b. Sei G zusammenhängend, und seien T1 , . . . , Tm lineare Operatoren aus End(V ). Sie bilden einen Tensoroperator in Bezug auf D genau dann, wenn sie in Bezug auf D einen Tensoroperator bilden. 22.8 Man zeige: Die Gruppe U(1) besitzt außer der trivialen Darstellung D ≡ 1 keine reelle Matrixdarstellung vom Grad 1. (Hinweis: Man wende Aufgabe 17.13b auf den Homomorphismus ϕ(z) := ln |D(z)| an.) 22.9 Seien G, H L IE-Gruppen, G zusammenhängend, und sei Φ : G → H ein stetiger Gruppenhomomorphismus mit diskretem Kern K . Man zeige: Dann ist K ≤ Z (G), d. h. die Elemente von K vertauschen mit jedem Element von G. (Hinweis: Seien x ∈ K , g ∈ G. Man verbinde x durch eine stetige Kurve γ mit der Eins und betrachte β(t) := gγ (t)g −1 . Welche Werte kann β(t) annehmen?)
Kapitel 23
Die irreduziblen Darstellungen von SU(2) und SO(3)
Die in den letzten vier Kapiteln entwickelten theoretischen Resultate und Methoden werden jetzt auf die speziellen Gruppen SU(2) und SO(3) angewendet. Diese beiden Gruppen sind nicht nur für die Physik besonders wichtig, sondern bilden auch ein Modellbeispiel und sozusagen einen Ausgangspunkt für die weitergehende mathematische Theorie der kompakten halbeinfachen L IE-Gruppen. In den ersten beiden Abschnitten besprechen wir die irreduziblen Darstellungen der beiden Gruppen, wobei wir allerdings nicht die im vorigen Kapitel besprochene „infinitesimale Methode“ verwenden, sondern direkt eine – sozusagen intelligent geratene – Folge (D s , s ∈ S) von irreduziblen Darstellungen angeben und dann beweisen, dass darin bis auf Äquivalenz alle irreduziblen Darstellungen vorkommen. Die infinitesimale Methode verwenden wir alsdann jedoch, um diese Darstellungen besser zu verstehen. Wir analysieren also in den Abschn. C–E die irreduziblen Darstellungen der gemeinsamen L IE-Algebra su(2) ∼ = so(3), die sämtlich durch Linearisierung aus den D s hervorgehen. Dabei handelt es sich um schiefadjungierte Darstellungen auf komplexen H ILBERTräumen, und es zeigt sich, dass die Benutzung von komplexen Koeffizienten es ermöglicht, den Darstellungen eine sehr einfache Form zu geben. Diese Beschreibung der irreduziblen Darstellungen in komplexifizierter Form ist aus der Physik wohlbekannt, denn es handelt sich im Prinzip um die quantenmechanische Theorie des Drehimpulses, die wir hier allerdings als eine rein mathematische Angelegenheit präsentieren. Die physikalischen Interpretationen der betrachteten Objekte sind Physikern vertraut und müssen hier nicht wiederholt werden. Andererseits ist diese Theorie als mathematische Methode ausbaufähig und kann auch auf andere L IE-Algebren übertragen werden, wobei die physikalischen Interpretationen auf der Strecke bleiben oder – wie im Falle von su(3) und ihrer Anwendung auf die starke Wechselwirkung (Klassifikation der Quarks und Quantenchromodynamik) – durch neue physikalische Deutungen ergänzt werden müssen (vgl. etwa [15, 19, 58, 75, 83] oder Band 2 von [18]).
K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_23, C Springer-Verlag Berlin Heidelberg 2010
293
294
23 Die irreduziblen Darstellungen von SU(2) und SO(3)
A Realisierung der irreduziblen Darstellungen In diesem Abschnitt konstruieren wir explizit eine unendliche Folge von irreduziblen Darstellungen der Gruppen SU(2) und SO(3). Diese sind tatsächlich bis auf Äquivalenz alle irreduziblen Darstellungen von SU(2) bzw. SO(3), was wir jedoch erst im nächsten Abschnitt beweisen. Für s = 0, 12 , 1, 32 , 2, . . . bezeichnen wir mit V s den (2s + 1)-dimensionalen C-Vektorraum der homogenen Polynome vom Grade 2s in 2 Variablen p(z) = p(x, y) =
2s
c j x j y 2s− j .
(23.1)
j=0
Sei nun A ∈ SU(2), also A=
a b −b a
mit |a|2 + |b|2 = 1.
Auf dem Raum C2 der Paare z = (x, y) operiere SU(2) durch Rechtsmultiplikation z = (x , y ) = (x, y)
a b = (ax − by, a y + bx) = z A. −b a
(23.2)
Für p ∈ V s kann man nun definieren (D s (A) p)(x, y) = p((x, y)A) = p(ax − by, a y + bx) =
2s
c j (ax
− by) j (a y
(23.3) + bx)2s− j .
j=0
Man rechnet sofort nach, dass dies in der Tat eine Darstellung definiert – es handelt sich ja um die in Beispiel 20.3a beschriebene Situation, außer dass hier eine Rechtsoperation der Gruppe G = SU(2) auf der Menge Z = C2 zu Grunde gelegt ist. Sie sind auch stetig, da p(z A) stetig von den Matrixelementen von A abhängt. Die entscheidenden Aussagen über die D s sind: Satz 23.1 a. Die durch (23.3) definierten Darstellungen D s , s = 0, 12 , 1, . . . sind irreduzibel und (in Bezug auf geeignete Skalarprodukte) auch unitär. Der Parameter s wird als das Gewicht bezeichnet.
A
Realisierung der irreduziblen Darstellungen
295
b. Für den Charakter χs der Darstellung D s gilt χs (A) = e−isα
2s
eikα =
k=0
sin[(2s + 1)(α/2)] , sin(α/2)
(23.4)
wobei α bestimmt ist durch Spur A = 2 cos (α/2) ,
0 ≤ α ≤ 2π.
(23.5)
Dabei ist A ∈ SU(2) ähnlich zu iα/2 0 e . S3 (α) = 0 e−iα/2
(23.6)
Beweis a. Man kann direkt ein Skalarprodukt auf V s angeben, in Bezug auf welches D s unitär ist, z. B. p1 (x1 + ix2 , y1 + iy2 ) p2 (x1 + ix2 , y1 + iy2 ) dx1 dx2 dy1 dy2 p1 | p2 := B
(23.7)
mit B := {(x, y) ∈ C2 | |x|2 + |y|2 ≤ 1}. (Im übrigen kann man solch ein Skalarprodukt auch finden, indem man so vorgeht wie im Beweis des Satzes von M ASCHKE.) Die Irreduzibilität zeigen wir nun mittels Theorem 20.14b. Sei also T ∈ EndC V s ein Operator, der mit allen D s (A) , A ∈ SU(2) vertauscht. Wir haben zu zeigen, dass T ein skalares Vielfaches der Identität ist. Dazu betrachten wir zua 0 nächst Matrizen A mit b = 0, also A = , wo |a| = 1 ist. Die 0 a −1 Monome p j (x, y) := x j y 2s− j ,
j = 0, 1, . . . , 2s
(23.8)
bilden offenbar eine Basis von V s , und (23.3) ergibt für b = 0 (D s (A) p j )(x, y) = p j (ax, a −1 y) = a 2 j−2s p j (x, y),
(23.9)
d. h. p j ∈ M j := N (D s (A)−a 2 j−2s I ). Für die Vektoren T p j ∈ V s folgt daraus: D s (A)T p j = T D s (A) p j = a 2 j−2s T p j ,
296
23 Die irreduziblen Darstellungen von SU(2) und SO(3)
d. h. wir haben auch T p j ∈ M j für j = 0, . . . , 2s. Wir wählen a ∈ S1 nun so, s dass die Zahlen a 2 j−2s alle verschieden sind. Da 2s j=0 dim M j = dim V = 2s + 1 sein muss, hat dies zur Folge, dass alle M j eindimensional sind, also M j = LH( p j ) für 0 ≤ j ≤ 2s. Insbesondere ist T p j = λ j p j für geeignete Skalare λ j , j = 0, . . . , 2s. Nun betrachten wir die reelle Drehung um π/4, also die Matrix 1 1 −1 ∈ SU(2). R := √ 2 1 1 Man findet
x y y x √ +√ ,√ −√ 2 2 2 2 2s 2s x k y 2s−k , = 2−s (x + y)2s = 2−s k
(D s (R) p2s )(x, y) = p2s
k=0
also D s (R) p2s = 2−s 2−s
2s 2s k=0
k
2s 2s k=0
k
pk und somit
λ2s pk = λ2s D s (R) p2s = D s (R)T p2s = T D s (R) p2s −s
=2
2s 2s
k
k=0
−s
T pk = 2
2s 2s λk p k . k k=0
Da die pk linear unabhängig sind, können wir hier die Koeffizienten vergleichen. Das führt zu λk = λ2s für alle k, also T = λ2s I . b. Die Matrix A ∈ SU(2) hat die Eigenwerte eiα/2 , e−iα/2 mit α ∈ [0, 2π ], das durch (23.5) wohlbestimmt ist. Sie ist daher ähnlich zu S3 (α). Es genügt somit, die Spur der Matrix zu D s (S3 (α)) bezüglich der Basis (23.8) zu bestimmen. Aus (23.9) folgt mit a = eiα/2 , b = 0: (D s (S3 (α)) p j )(x, y) = eiα( j−s) p j (x, y), und somit ergibt sich für die Spur: χs (S3 (α)) = Spur D (S3 (α)) = s
2s
eiα(k−s) ,
k=0
also der erste Teil von (23.4). Der zweite Teil folgt daraus durch Aufsummieren der endlichen geometrischen Reihe und Erweitern mit e−i(2s+1)(α/2) :
A
Realisierung der irreduziblen Darstellungen
e−isα
2s
eikα = e−isα
k=0
=
297
ei(2s+1)α − 1 eiα − 1
ei(2s+1)(α/2) − e−i(2s+1)(α/2) sin [(2s + 1)(α/2)] . = iα/2 −iα/2 sin (α/2) e −e
Wir übertragen diese Ergebnisse für SU(2) nun auf die Gruppe SO(3). Nach Theorem 18.16 gibt es einen stetigen Epimorphismus Φ : SU(2) −→ SO(3), der SO(3) doppelt überlagert. Für eine irreduzible Darstellung D s von SU(2) ist der Ansatz Fs (Φ(A)) := D s (A)
für A ∈ SU(2)
(23.10)
naheliegend. Nun ist aber KernΦ = {σ0 , −σ0 }, σ0 = (δi j ) ∈ C2×2 , und daher Φ(A) = Φ(B)
⇐⇒
B = −A.
Also liefert (23.10) genau dann eine wohldefinierte Abbildung, wenn D s (A) = D s (−A) für alle A ∈ SU(2). Aber (23.9) ergibt für a = −1 D s (−σ0 ) p j = (−1)2s p j ,
j = 0, . . . , 2s ,
also D s (−σ0 ) = (−1)2s I und folglich D s (−A) = (−1)2s D s (A) ,
A ∈ SU(2) .
(23.11)
Daher ist Fs genau dann eine wohldefinierte Darstellung von SO(3), wenn 2s gerade, d. h. s ganzzahlig ist. Weil Φ lokal stetig invertierbar ist (vgl. Beispiel 22.17b), ist dann Fs eine stetige Darstellung von SO(3) auf V s , die überdies irreduzibel ist, weil D s irreduzibel ist. Da nach Satz 18.15 Φ(S3 (α)) = R3 (α) gilt und überdies jede Drehmatrix mit Drehwinkel α zu R3 (α) ähnlich ist, überträgt sich auch die Formel für den Charakter, wobei der Parameter α mit dem Drehwinkel identifiziert wird. Wir haben also folgendes Ergebnis: Satz 23.2 Sei Φ : SU(2) −→ SO(3) der in Abschn. 18E konstruierte Epimorphismus, und seien D s , s = 0, 12 , 1, . . . die in Satz 23.1 angegebenen irreduziblen Darstellungen von SU(2) auf V s . Dann gilt: a. Für s = 0, 1, 2, . . . werden durch Fs (Φ(A)) := D s (A),
A ∈ SU(2)
stetige unitäre irreduzible Darstellungen von SO(3) definiert.
(23.10)
298
23 Die irreduziblen Darstellungen von SU(2) und SO(3)
b. Bezeichnet R(α) ∈ SO(3) eine Drehung um den Winkel α, so gilt für den Charakter ψs der Darstellung Fs ψs (R(α)) =
sin[(2s + 1)(α/2)] , sin(α/2)
α = 0.
(23.12)
B C LEBSCH -G ORDAN-Zerlegung und Vollständigkeit Wenn das Tensorprodukt von zwei irreduziblen Darstellungen einer Gruppe wieder in irreduzible Darstellungen zerlegt wird, so spricht man von einer C LEBSCH G ORDAN-Zerlegung. Diese wurden schon in Abschn. 21F kurz angesprochen. Solche Zerlegungen wollen wir nun für die im vorigen Abschnitt konstruierten Darstellungen D s bzw. Fs der Gruppen SU(2) und SO(3) herleiten. Satz 23.3 Für s = 0, 12 , 1, . . . sei V s der C-Vektorraum der homogenen Polynome p(x, y) =
2s
c j x j y 2s− j ,
j=0
und es sei D s die durch (23.3) definierte irreduzible Darstellung von SU(2) vom Gewicht s auf V s . Dann gilt die C LEBSCH-G ORDAN-Formel D s ⊗ D t ∼ D s+t ⊕ D s+t−1 ⊕ · · · ⊕ D |s−t| .
(23.13)
Beweis Nach Korollar 21.18 ist eine endlich-dimensionale Darstellung durch Angabe ihres Charakters bis auf Äquivalenz vollständig bestimmt. Ist also χs der Charakter von D s , so gilt nach Satz 20.8 χ D s ⊗D t (A) = χs (A)χt (A),
(23.14)
und der Charakter von D s+t ⊕ D s+t−1 ⊕ · · · ⊕ D |s−t| ist χs+t (A) + χs+t−1 (A) + · · · + χ|s−t| (A).
(23.15)
Nach Satz 23.1 gilt aber χs (A) =
2s
eiα(k−s) ,
(23.16)
k=0
wenn A ähnlich zu S3 (α) ∈ SU(2) ist. Nun findet man jedoch, indem man ausdistribuiert und die entstehenden Terme neu zusammenfasst, für s ≥ t
B
C LEBSCH -G ORDAN-Zerlegung und Vollständigkeit
χs (A) · χt (A) =
2s k=0
=
s+t p=s−t
299
⎞ ⎛ 2s eiα(k−s) ⎝ eiα( j−t) ⎠ ⎛ ⎝
j=0 2p
⎞
eiα(l− p) ⎠
l=0
= χs+t (A) + · · · + χs−t (A), und das ist gerade die Behauptung. Für t ≥ s verfährt man analog.
Als Folgerung aus Satz 23.3 ergibt sich dann: Satz 23.4 Sind Fs , s = 0, 1, 2, . . . die in Satz 23.2 angegebenen irreduziblen Darstellungen von SO(3), so gilt Fs ⊗ Ft ∼ Fs+t ⊕ Fs+t−1 ⊕ · · · ⊕ Fs−t ,
s ≥ t.
(23.17)
Auf die Anwendung dieser beiden Sätze in der Quantenmechanik kommen wir im nächsten Kapitel zurück. Hier nutzen wir sie aus, um die Vollständigkeit der konstruierten Systeme von irreduziblen Darstellungen nachzuweisen: Korollar 23.5 Jede stetige irreduzible Darstellung von SU(2) ist äquivalent zu einer der Darstellungen D s , 2s ∈ N0 , aus Satz 23.1. Jede stetige irreduzible Darstellung von SO(3) ist äquivalent zu einer der Darstellungen Fs , s ∈ N0 , aus Satz 23.2. Beweis Das folgt aus den Sätzen 21.30 und 21.32, sobald die vier Voraussetzungen aus 21.32 nachgeprüft sind. Diese Nachprüfung verläuft für SO(3) völlig analog zu der für SU(2), und wir besprechen nur die letztere Gruppe ausführlich. Voraussetzung 1. ist erfüllt, denn D 0 ≡ 1, und 2. ist erfüllt, weil D 1/2 zu der natürlichen Darstellung von SU(2) äquivalent ist. Um 3. nachzuweisen, gehen wir zu den Matrixdarstellungen über, die den Basen (23.8) in den V s entsprechen, schreiben also D s (A) pk =
2s
d sjk (A) p j ,
k = 0, . . . , 2s.
d sjk (A) p j ,
k = 0, . . . , 2s.
j=0
Das führt zu D s (A) pk =
2s j=0
Führen wir also den Raum W s der homogenen Polynome vom Grad 2s in den Variablen x, y sowie den reell-linearen Isomorphismus C : V s −→ W s , p −→ p
300
23 Die irreduziblen Darstellungen von SU(2) und SO(3)
ein, so haben wir C D s (A) = D s (A) C ,
A ∈ SU(2)
und somit ist D s (A) = C D s (A)C −1 für alle A, also D s ∼ D s . Schließlich ist Voraussetzung 4. wegen Satz 23.3 erfüllt.
C Die irreduziblen Darstellungen der L IE-Algebren von SU(2) und SO(3) Wir wollen nun die irreduziblen Darstellungen von SU(2) und SO(3) mit Hilfe der zugehörigen L IE-Algebren su(2) = {B ∈ C2×2 | B ∗ = −B,
Spur B = 0},
so(3) = {B ∈ R3×3 | B = −B} T
(23.18) (23.19)
studieren. Wie wir in den Sätzen 23.1, 23.2 gesehen haben, sind die Darstellungen D s bzw. Fs bzgl. geeigneter Skalarprodukte unitär, und da die Gruppen SU(2) und SO(3) zusammenhängend sind, können wir Satz 22.9 auf sie anwenden. Es liefert also jede irreduzible Darstellung D s von SU(2) eine irreduzible und schiefadjungierte Darstellung Ds von su(2) gemäß Ds (L) = D∗s (L) =
d s t L D (e ) , t=0 dt
L ∈ su(2),
(23.20)
und jede irreduzible Darstellung Fs von SO(3) liefert eine schiefadjungierte irreduzible Darstellung Fs von so(3) gemäß Fs (L ) = Fs∗ (L ) =
d Fs (et L ) , t=0 dt
L ∈ so(3).
(23.21)
Bereits mit den Ds haben wir aber – bis auf Äquivalenz – alle irreduziblen Darstellungen von su(2) gefunden: Korollar 23.6 Jede irreduzible Darstellung der L IE-Algebra su(2) ist zu einem der Ds äquivalent. Beweis Jede irreduzible Darstellung D von su(2) ist die Linearisierung D = D∗ einer stetigen und o.B.d.A. unitären Darstellung D von SU(2), denn SU(2) ist einfach-zusammenhängend (vgl. Korollar 22.19 und Beispiel 22.17d). Nach Satz 22.9b ist D irreduzibel, also äquivalent zu einem der D s (Korollar 23.5), und dann ist D ∼ Ds . Für G = SO(3) ist keine bijektive Korrespondenz zwischen den irreduziblen Darstellungen von G und denen von L(G) zu erwarten, da SO(3) nicht einfach-
D
Die kanonische Basis einer irreduziblen Darstellung von su(2)
301
zusammenhängend ist. Tatsächlich ist auch keine vorhanden, wie wir gleich sehen werden. Nach Satz 19.22c sind die L IE-Algebren su(2) und so(3) isomorph. Versehen wir nämlich su(2) nach Satz 19.22a mit der Standardbasis S1 =
1 0 i , 2 i 0
S2 =
1 0 −1 , 2 1 0
S3 =
1 i 0 2 0 −i
(23.22)
und so(3) nach Satz 19.22b. mit der Standardbasis ⎡
⎤ 00 0 R1 = ⎣0 0 −1⎦ 01 0
⎡
⎤ 0 01 R2 = ⎣ 0 0 0⎦ , −1 0 0
⎡
0 −1 R3 = ⎣1 0 0 0
⎤ 0 0⎦ , 0
(23.23)
so gelten die Vertauschungsrelationen 3 & % εi jk Sk , Si , S j =
3 & % Ri , R j = εi jk Rk .
k=1
(23.24)
k=1
Die lineare Abbildung ϕ : su(2) −→ so(3), die S j in R j überführt ( j = 1, 2, 3), ist daher ein Isomorphismus, und für diesen haben wir schon in Beispiel 22.14b gesehen, dass ϕ = Φ∗ die Linearisierung des Epimorphismus Φ aus Abschn. 18E ist, der in Satz 23.2 zur Konstruktion der Fs benutzt wurde. Aus Fs ◦ Φ = D s folgt also mit der Kettenregel Fs ◦ ϕ = Ds , oder, anders geschrieben: Fs = Ds ◦ ϕ −1 ,
s = 0, 1, 2, . . .
Die Fs sind also nichts anderes als die Ds , s ∈ N0 , die nur mittels des Isomorphismus ϕ in Darstellungen von so(3) umgeschrieben wurden. Jedoch sind auch die Ds ◦ ϕ −1 mit s = 12 , 32 , . . . irreduzible Darstellungen von so(3), die sich aber nicht über (23.21) aus Gruppendarstellungen ergeben, denn solche gibt es nach Satz 23.2 nur für ganzzahlige Gewichte s. Dieses Phänomen ist natürlich nur deshalb möglich, weil SO(3) nicht einfach-zusammenhängend ist. Wir werden dies nicht weiter verfolgen, sondern betrachten die L IE-Algebren im Folgenden unabhängig von den Gruppen.
D Die kanonische Basis einer irreduziblen Darstellung von su(2) Sei L eine 3-dimensionale reelle L IE-Algebra mit R-Basis {E 1 , E 2 , E 3 } und %
3 & εi jk E k , Ei , E j = k=1
(23.25)
302
23 Die irreduziblen Darstellungen von SU(2) und SO(3)
d. h. L ist isomorph zu su(2) und so(3). Daher hat L schiefadjungierte irreduzible Darstellungen Ds vom Gewicht s = 0, 12 , 1, . . . auf (2s +1)-dimensionalen komplexen H ILBERTräumen Hs . Weil eine L IE-Algebren-Darstellung ein L IE-AlgebrenHomomorphismus ist, übertragen sich alle Vertauschungsrelationen, so dass wir folgende Ergebnisse bekommen: a. Setzt man A j := Ds (E j ),
j = 1, 2, 3,
(23.26)
εklm Am .
(23.27)
k = 1, 2, 3
(23.28)
so sind die A j schiefhermitesch, und es gilt [Ak , Al ] =
m
b. Die Operatoren Jk := iAk , sind hermitesch und erfüllen [Jk , Jl ] = i
εklm Jm .
(23.29)
m
Hieraus folgert man durch leichte Rechnung (wie in Aufgabe 19.13): Satz 23.7 Sei L eine 3-dimensionale L IE-Algebra über R mit R-Basis {E 1 , E 2 , E 3 }, die (23.25) erfüllt. Sei Ds eine schiefadjungierte irreduzible Darstellung vom Gewicht s auf dem komplexen H ILBERTraum Hs . Für die Operatoren J+ := J1 + iJ2 = −A2 + iA1 ,
J− := J1 − iJ2 = A2 + iA1
(23.30)
und J3 gelten die Vertauschungsrelationen %
& J+ , J3 = −J+ ,
%
& J− , J3 = J− ,
%
& J+ , J− = 2J3 .
(23.31)
Ferner gilt J+∗ = J− ,
J−∗ = J+ .
(23.32)
Da J3 eine hermitesche Abbildung ist, besitzt sie nur reelle Eigenwerte. Nun kann man aus (23.31) – wie in Aufgabe. 19.15 – leicht die folgende Aussage ableiten, aus der die Rolle der Operatoren J+ , J− als „Auf- und Absteigeoperatoren“ deutlich wird:
D
Die kanonische Basis einer irreduziblen Darstellung von su(2)
303
Satz 23.8 Sei f ∈ Hs ein Eigenvektor von J3 zum Eigenwert λ ∈ R, also J3 f = λ f.
(23.33)
Dann gilt: a. Ist f + := J+ f = 0, so ist f + Eigenvektor von J3 zum Eigenwert λ + 1, d. h. J3 f + = (λ + 1) f + .
(23.34)
b. Ist f − := J− f = 0, so ist f − Eigenvektor von J3 zum Eigenwert λ − 1, d. h. J3 f − = (λ − 1) f − .
(23.35)
Mit Hilfe dieser Operatoren J+ , J− , J3 konstruieren wir nun eine spezielle Basis des Trägerraumes Hs der irreduziblen Darstellung Ds . Dazu sei λ der größte Eigenwert von J3 und f λ ein zugehöriger normierter Eigenvektor. Wir haben also (man beachte Satz 23.8) J3 f λ = λ f λ ,
J+ f λ = 0,
f λ = 1.
(23.36)
Ist J− f λ = 0, so setzen wir J− f λ = αλ f λ−1
mit αλ , so dass f λ−1 = 1.
(23.37)
Nach Satz 23.8 ist dann J3 f λ−1 = (λ − 1) f λ−1 ,
f λ | f λ−1 = 0 ,
(23.38)
weil Eigenvektoren zu verschiedenen Eigenwerten des hermiteschen Operators J3 orthogonal sind. Ist nun wieder J− f λ−1 = 0, so setzen wir J− f λ−1 = αλ−1 f λ−2
mit αλ−1 , so dass f λ−2 = 1.
(23.39)
Wieder ist nach Satz 23.8 J3 f λ−2 = (λ − 2) f λ−2 . Setzen wir diesen Prozess fort, so bekommen wir ein Orthonormalsystem f λ , f λ−1 , f λ−2 , . . . von Eigenvektoren von J3 zu Eigenwerten λ, λ−1, λ−2, . . .. Da dim Hs = 2s+1 < ∞ ist, hat J3 nur endlich viele Eigenwerte, so dass der Prozess nach endlich vielen Schritten abbrechen muss, d. h. es gibt ein κ mit J− f κ = 0. So erhalten wir das endliche Orthonormalsystem ( f μ ) von normierten Eigenvektoren von J3 , für das gilt
304
23 Die irreduziblen Darstellungen von SU(2) und SO(3)
J3 f μ = μf μ ,
J− f μ = αμ f μ−1 ,
μ = λ, λ − 1, . . . , κ ,
(23.40)
wobei wir ακ = 0 setzen. Wir untersuchen nun die Wirkung des Operators J+ auf die Eigenvektoren f μ . Nach Wahl von λ als maximaler Eigenwert von J3 ist, wie schon in (23.36) erwähnt, J+ f λ = 0. Weiter ergibt sich mit den Vertauschungsrelationen aus Satz 23.7: 1 J+ J− f λ αλ & = % 1 < J− J+ f λ + J+ , J− f λ = αλ 2 2λ = J3 f λ = fλ , αλ αλ
J+ f λ−1 =
d. h. J+ f λ−1 ist proportional zu f λ , etwa J+ f λ−1 = βλ f λ .
(23.41)
Wir zeigen, dass allgemein für μ ≥ κ J+ f μ = βμ+1 f μ+1
(23.42)
gilt, und zwar durch absteigende Induktion nach μ mit (23.41) als Induktionsanfang. Gelte (23.42) also bereits für f λ , f λ−1 , . . . , f μ+1 , wo μ ≥ κ. Dann folgt aus (23.40) wie bei der Herleitung von (23.41): J+ f μ =
1
J+ J− f μ+1 αμ+1 & = % 1 < J− J+ f μ+1 + J+ , J− f μ+1 = αμ+1 = 1 < = βμ+2 J− f μ+2 + 2J3 f μ+1 αμ+1 = 1 < = βμ+2 αμ+2 f μ+1 + 2(μ + 1) f μ+1 αμ+1 = βμ+1 f μ+1
mit βμ+1 =
2(μ + 1) + αμ+2 βμ+2 . αμ+1
(23.43)
D
Die kanonische Basis einer irreduziblen Darstellung von su(2)
305
Damit ist der Induktionsschritt vollzogen. Aus den Relationen J− f μ = αμ f μ−1 ,
J+ f μ = βμ+1 f μ+1
folgt nun für μ > κ βμ f μ | f μ = J+ f μ−1 | f μ = f μ−1 | J− f μ = αμ f μ−1 | f μ−1 und damit wegen f μ = 1 αμ = βμ
für μ > κ.
(23.44)
Setzen wir dies in (23.43) ein und ersetzen μ + 1 durch μ, so folgt 2 αμ2 − αμ+1 = 2μ
für μ ≥ κ.
(23.45)
Wir summieren diese Gleichung nun bezüglich μ von λ abwärts bis zu einem beliebigen Wert ν ≥ κ. Das ergibt 2 = 2λ + 2(λ − 1) + · · · + 2ν. αν2 − αλ+1
Nun ist aber αλ+1 = βλ+1 = 0, und dies liefert, wenn wir die rechte Seite zusammenfassen αν2 = (λ + ν)(λ − ν + 1).
(23.46)
Mit dieser Formel können wir die Anzahl der Eigenvektoren von J3 in der Folge f λ , f λ−1 , . . . , f κ bestimmen. Wegen ακ = 0 folgt aus (23.46) nämlich für ν = κ (λ + κ)(λ − κ + 1) = 0. Wegen κ ≤ λ ist κ = −λ die einzige mögliche Lösung dieser Gleichung. Somit liefert das beschriebene Verfahren ein Orthonormalsystem von Eigenvektoren f λ , f λ−1 , . . . , f −λ zum Operator J3 , wobei f λ−m zum Eigenwert λ − m gehört. Dies ergibt aber notwendig eine Bedingung an die Zahl λ, von der wir bisher nur wissen, dass sie der größte Eigenwert von J3 ist. Da die Eigenwerte, die wir aus λ durch Anwendung des Operators J− gewinnen, alle von der Form λ−m mit m = 0, 1, 2, . . . sind, muss auch −λ = λ − m
für ein m ∈ N0
306
23 Die irreduziblen Darstellungen von SU(2) und SO(3)
sein, d. h. λ muss von der Form λ=
m 2
für ein m ∈ N0
(23.47)
sein, also ganz- oder halbzahlig. Um λ festzulegen, beachten wir, dass wir von einer (2s + 1)-dimensionalen irreduziblen Darstellung ausgegangen sind. Da kein echter Teilraum des Trägerraums Hs unter allen Ds (L), L ∈ L, invariant ist und da die Ds (L) als Linearkombinationen der Operatoren J+ , J− , J3 geschrieben werden können, spannen die Vektoren f λ , f λ−1 , . . . , f −λ ganz Hs auf. Ihre Anzahl 2λ + 1 ist also gleich dim Hs = 2s + 1, und es folgt λ = s. So bekommen wir folgendes Ergebnis: Satz 23.9 Sei L eine zu su(2) und so(3) isomorphe L IE-Algebra mit Basis {E 1 , E 2 , E 3 }, und sei Ds eine schiefadjungierte irreduzible Darstellung von L vom Gewicht s auf einem (2s +1)-dimensionalen H ILBERTraum Hs . Definiert man dann J+ = −Ds (E 2 ) + iDs (E 1 ), J− = Ds (E 2 ) + iDs (E 1 ), J3 =
iDs (E
(23.48)
3 ),
so existiert eine Orthonormalbasis { f ms | −s ≤ m ≤ s} von Hs , die aus Eigenvektoren von J3 besteht und kanonische Basis der Darstellung Ds von L heißt. Für diese gilt s s J+ f ms = αm+1 f m+1 ,
J− f ms J3 f ms
= =
s fs αm m−1 , s m fm ,
−s ≤ m ≤ s − 1, −s + 1 ≤ m ≤ s,
(23.49)
−s ≤ m ≤ s
mit s = αm
(s + m)(s − m + 1),
−s ≤ m ≤ s.
(23.50)
Diese ist bis auf einen Phasenfaktor eindeutig bestimmt, d. h. für jede Orthonormalf ms = ζ f ms für alle m, wobei ζ ∈ C basis { f ms | −s ≤ m ≤ s}, die (23.49) erfüllt, ist eine feste Zahl mit |ζ | = 1 ist. Die Formel (23.50) folgt dabei aus (23.46). Die Eindeutigkeitsaussage ergibt sich daraus, dass der normierte Eigenvektor f ss zum größten Eigenwert von J3 bis auf einen Phasenfaktor eindeutig ist und alle anderen f ms aus ihm durch iteriertes Anwenden von J− und nachfolgendes Normieren hervorgehen.
E
Ausreduktion einer gegebenen Darstellung
307
E Ausreduktion einer gegebenen Darstellung Sei weiterhin L eine zu su(2) und so(3) isomorphe L IE-Algebra. Zunächst halten wir fest: Korollar 23.10 Jede Darstellung D von L auf einem endlich-dimensionalen H ILBERTraum H ist vollreduzibel. Beweis Man kann o.B.d.A. L = su(2) annehmen. Nach Korollar 22.19 und Beispiel 22.17d ist D die Linearisierung einer stetigen Darstellung D der kompakten Gruppe SU(2), und D ist vollreduzibel nach Theorem 21.10 und Theorem 20.11a. Wegen Korollar 23.6 bedeutet dies, dass H in der folgenden Form zerlegt werden kann: H=
ks V s =
s∈S
ks
H js ,
(23.51)
s∈S j=1
wobei die Einschränkung von D auf den invarianten Teilraum H js stets zur irreduziblen Darstellung D s vom Gewicht s äquivalent ist. (Hier ist immer ks > 0 – es werden also in der endlichen Indexmenge S ⊆ {n/2 | n ∈ N0 } nur die tatsächlich vorkommenden Gewichte aufgeführt!) Da die H js abgeschlossene lineare Unterräume sind, sind sie auch gegenüber den Linearisierungen Ds := D∗s invariant, und somit ergibt (23.51) auch die Zerlegung D=
ks D s
s∈S
in irreduzible Darstellungen von L.
Für die Anwendungen ist es von entscheidender Bedeutung, eine Zerlegung der Form (23.51) explizit bestimmen zu können, und dies wird als Ausreduzieren der gegebenen Darstellung bezeichnet. Im Falle der L IE-Algebra L ∼ = su(2) ist dies sogar algorithmisch möglich, und die Grundlage hierfür bildet ein explizit bekannter C ASIMIR-Operator: Satz 23.11 Sei L eine zu su(2) isomorphe L IE-Algebra mit Basis {E 1 , E 2 , E 3 }, die die Vertauschungsrelationen (23.25) erfüllt, und sei D eine schiefadjungierte Darstellung von L auf einem (endlich-dimensionalen) H ILBERTraum H . Seien J+ = −D(E 2 ) + iD(E 1 ), J− = D(E 2 ) + iD(E 1 ),
(23.52)
J3 = iD(E 3 ). Dann gilt: a. Der Operator J 2 = J12 + J22 + J32 = J+ J− − J3 + J32
(23.53)
308
23 Die irreduziblen Darstellungen von SU(2) und SO(3)
ist ein C ASIMIR-Operator der Darstellung D, d. h. 0
1 J 2 , D(L) = 0
für alle L ∈ L.
(23.54)
b. Ist insbesondere D eine irreduzible Darstellung vom Gewicht s, so gilt J 2 f = s(s + 1) f
für alle f ∈ H = Hs ,
(23.55)
d. h. jedes f ∈ H ist Eigenvektor von J 2 zum (2s + 1)-fachen Eigenwert λs = s(s + 1). Beweis a. Dass J 2 ein C ASIMIR-Operator ist, rechnet man als leichte Übung nach (analog zu Aufgabe 19.14), ebenso die Umrechnung aus (23.53). b. Ist D irreduzibel, so folgt aus (23.54) und Satz 22.2, dass J 2 ein Vielfaches der Identität ist, d. h. J 2 f = λ f,
λ ∈ R,
für alle f ∈ H ,
da J 2 hermitesch ist. Allerdings benötigt man dieses Argument eigentlich gar nicht, denn (23.55) kann mittels Satz 23.9 durch direkte Rechnung bestätigt werden. Ist nämlich { f ms | −s ≤ m ≤ s} eine kanonische Basis von H , so folgt aus (23.53) und den Wirkungen von J+ , J− , J3 auf f ms nach Satz 23.9 J 2 f ms = J+ J− f ms − J3 f ms + J32 f ms 2 s = αm f m − m f ms + m 2 f ms .
Wegen 2 = (s + m)(s − m + 1) αm
folgt J 2 f ms = ((s + m)(s − m + 1) − m + m 2 ) f ms = (s + 1)s f ms . H js
aus der Zerlegung (23.51) sind also J 2 -invariant und bestehen Die Räume aus Eigenvektoren zum Eigenwert s(s + 1). Diese Eigenwerte sind für verschiedene Gewichte s auch verschieden. Das Spektrum des selbstadjungierten Operators J 2 besteht daher genau aus den λs := s(s + 1) mit s ∈ S, und der Eigenraum zu λs ist N (J 2 − λs I ) = ks V s = H1s ⊕ · · · ⊕ Hkss .
E
Ausreduktion einer gegebenen Darstellung
309
Die Darstellung D kann daher in folgender Weise explizit ausreduziert werden: I. Zur Basis {E 1 , E 2 , E 3 } von L berechne man die Operatoren Jk = iD(E k ),
J 2 = J12 + J22 + J32 .
II. Für jedes s = 0, 12 , 1, . . . bestimme man die Maximalzahl n s linear unabhängiger Lösungen der Eigenwertgleichung J 2 f (i) = s(s + 1) f (i) ,
i = 1, . . . , n s .
(23.56)
Sei H s = LH( f (1) , . . . , f (n s ) ). Dann gibt es zwei Möglichkeiten: a. H s ist isotypisch, d. h. direkte Summe irreduzibler Räume H js gleicher Dimension. b. H s ist irreduzibel. III. Ist H s isotypisch, so haben die Gleichungen J3 f = s f,
J+ f = 0
(23.57)
p = ks linear unabhängige Lösungen f 1 , . . . , f p , und es ist H s = H1s ⊕ · · · ⊕ H ps , dim H s = p · dim H js = p(2s + 1).
(23.58)
IV. Ist H s irreduzibel, so haben die Gl. (23.57) genau eine linear unabhängige Lösung f 1 , und es ist H s = H1s
mit dim H s = 2s + 1.
(23.59)
V. Ist Hqs ein irreduzibler Teilraum aus (III) oder (IV), so wird eine kanonische Basis von Hqs gegeben durch q
f s−m = (J− )m f q , wo f q eine normierte Lösung von (23.57) ist. Damit ergibt sich die Basis q
f s−m = (J− )m f q ,
m = 0, . . . , 2s,
q = 1, . . . , p
(23.60)
von Hs , die aus Eigenvektoren von J3 besteht und als eine kanonische Basis der Teildarstellung pDs von L bezeichnet wird. Insbesondere gilt:
310
23 Die irreduziblen Darstellungen von SU(2) und SO(3) q
q
s J+ f m = αm+1 f m+1 ,
−s ≤ m ≤ s − 1,
q J− f m q J3 f m
−s + 1 ≤ m ≤ s,
= =
s fq , αm m−1 q m fm ,
(23.61)
−s ≤ m ≤ s
mit s αm =
(s + m)(s − m + 1),
−s ≤ m ≤ s.
(23.62)
Die Formel (23.62) folgt dabei aus (23.50). Lässt man nun s alle in D vorkommenden Gewichte durchlaufen, so erhält man insgesamt eine Orthonormalbasis s,q
{ f m | s ∈ S, q = 1, . . . , ks , m = −s, −s + 1, . . . , s − 1, s} von H , eine kanonische Basis der Darstellung D. Zuweilen wird sie auch als eine der Darstellung D angepasste Basis bezeichnet.
Aufgaben zu Kap. 23 23.1 Sei D eine stetige Darstellung von SO(3) auf dem endlichdimensionalen komplexen Trägerraum V und d Jk := i Rk = i , Rk (α) dα α=0
k = 1, 2, 3.
a. Man zeige: Die Eigenwerte des hermiteschen Operators J3 sind ganzzahlig, und für jedes m ∈ Z ist die Dimension von N (J3 − m I ) gleich der Anzahl von irreduziblen Teildarstellungen vom Typ Fl mit l ≥ |m|, die in der Zerlegung von D in irreduzible Teile auftreten. b. Man folgere: Wenn es einen Vektor 0 = v ∈ V gibt, für den D(R3 (α))v = e±ilα v ,
α ∈ R,
so enthält D eine irreduzible Teildarstellung vom Typ Fl . 23.2 Für n, l ∈ N sei Wn,l der C-Vektorraum der komplexwertigen homogenen Polynome p(x) =
|ν|=l
xν
Multiindex-Schreibweise!
Aufgaben
311
vom Grad l in n Variablen. Man zeige: a. Durch [D(A) p](x) := p(x A) ,
A ∈ SO(n)
ist eine stetige Darstellung der Gruppe SO(n) auf Wn,l gegeben. b. Ist l = 2k gerade (k ∈ N), so hat D eine eindimensionale irreduzible Teildarstellung. (Hinweis: Betrachte p(x) = (x12 + · · · + xn2 )k .) c. Der Teilraum Vn,l := { p ∈ Wn,l | Δp = 0} der harmonischen homogenen Polynome vom Grad l ist D-invariant. (Hinweis: Man beachte die in Aufgabe 17.17 bewiesene Rotationsinvarianz des L APLACEOperators.) 23.3 Wir geben eine konkrete Beschreibung der irreduziblen SO(3)-Darstellungen Fl , ohne auf die Überlagerungsgruppe SU(2) zurückzugreifen. Wir verwenden die Bezeichnungen aus der vorigen Aufgabe, betrachten aber speziell n = 3. Mit Δ3 bzw. Δ2 bezeichnen wir den drei- bzw. zweidimensionalen L APLACE-Operator. Man zeige nacheinander, dass für beliebiges l ∈ N die folgenden Aussagen gelten: a. Schreibt man ein Polynom p ∈ W3,l in der Form p(x1 , x2 , x3 ) =
l x3k qk (x1 , x2 ) k! k=0
mit qk ∈ W2,l−k , so ist Δ3 p(x1 , x2 , x3 ) =
l−2 k l−2 k x3 x3 qk+2 (x1 , x2 ) + Δ2 qk (x1 , x2 ), k! k! k=0
k=0
und es ist Δ3 p = 0 genau dann, wenn qk+2 = −Δ2 qk
für k = 0, 1, . . . , l − 2.
Daher ist ein harmonisches p durch Vorgabe von q0 , q1 schon eindeutig festgelegt. b. Die C-Vektorräume V3,l und W2,l × W2,l−1 sind isomorph. c. dim W2,l = l + 1 und dim V3,l = 2l + 1.
312
23 Die irreduziblen Darstellungen von SU(2) und SO(3)
d. Das Polynom v(x1 , x2 , x3 ) := (x1 + ix2 )l gehört zu V3,l und erfüllt D(R3 (α)) = e−ilα v ,
α ∈ R.
e. Der Raum V3,l ist D-irreduzibel mit D V ∼ Fl . (Hinweis: Man verwende 3,l Aufgabe 23.1.) 23.4 a. Sei n ≥ 3, S = Sn−1 , und für 0 < θ < π sei Sθ ⊆ S der „Breitenkreis“ 2 Sθ := {(x1 , . . . , xn ) ∈ Rn | x12 + · · · + xn−1 = sin2 θ , xn = cos θ }.
Sei f : S → C eine stetige Funktion auf S, die nicht von x1 , . . . , xn−1 abhängt, sondern nur von xn . Man zeige, dass dann gilt:
π
f ω S = Ωn−2
f (sin θ, 0, . . . , 0, cos θ ) sinn−2 θ dθ.
0
S
Dabei bedeutet ωs die euklidische Volumenform auf S und Ωn−2 die Oberfläche der (n − 2)-dimensionalen Einheitssphäre. (Hinweis: Ein rigoroser Beweis ist mittels Aufgabe 4.9c möglich.) b. Man zeige: Jede Klassenfunktion (vgl. Aufgabe 21.15) g auf SU(2) kann eindeutig in der Form g(A) = f (α) mit einer stetigen geraden 2π -periodischen Funktion f geschrieben werden. Dabei ist α bestimmt durch Spur A = 2 cos
α . 2
Für das H AARsche Integral gilt dann SU(2)
1 g(A) dA = π
2π
f (α) sin2
0
α dα. 2
(Hinweis: Neben Teil a. verwende man Aufgaben 18.6 und 21.3.) 23.5 Man berechne
|χs (A)|2 dA und gebe dann mittels Theorem 21.17b einen
SU(2)
neuen Beweis für die Irreduzibilität der Darstellungen D s . 23.6 Man beweise die Vollständigkeit des Systems der Darstellungen D s (Korollar 23.5), ohne auf Abschn. 21F und damit auf den S TONE -W EIERSTRASSschen Satz zurückzugreifen. (Hinweis: Neben Korollar 21.16 und Aufgabe 23.4 verwende man die wohlbekannte Tatsache, dass die Funktionen sin kθ , k ∈ N ein vollständiges Orthonormalsystem im Raum der ungeraden 2π -periodischen Funktionen bilden.)
Aufgaben
313
23.7 Sei L eine reelle L IE-Algebra (z. B. die L IE-Algebra zu einer L IE-Gruppe). Die Komplexifizierung von L ist der C-Vektorraum LC := L × L mit der komplexen Skalarmultiplikation (a + ib)(v, w) := (av − bw, aw + bv) ,
a, b ∈ R , v, w ∈ L
und der L IE-Klammer [(v1 , w1 ), (v2 , w2 )] = ([v1 , v2 ] − [w1 , w2 ], [v1 , w2 ] + [w1 , v2 ]) . Man zeige: a. LC ist eine komplexe L IE-Algebra, und die injektive Abbildung L → LC : v → (v, 0) ist ein Homomorphismus von L IE-Algebren. Ferner ist i(v, 0) = (0, v) und i(0, w) = (−w, 0). Daher schreibt man v + iw statt (v, w) und kann dann mit den Elementen von LC in gewohnter Weise rechnen. b. LC = L ⊕ iL. Ist (b1 , . . . , bn ) eine R-Basis von L, so ist dieses System auch eine C-Basis von LC , und zwar mit denselben Strukturkonstanten. Ferner ist (b1 , . . . , bn , ib1 , . . . , ibn ) eine R-Basis von LC . c. (su(2))C ∼ = sl(2, C). (Hinweis: Jede Matrix X ∈ C2×2 kann eindeutig in der Form X = A + iB mit H ERMITEschen Matrizen A, B geschrieben werden.) Bemerkung Bekanntlich ist sl(2, C) isomorph zur L IE-Algebra der eigentlichen or↑ thochronen L ORENTZgruppe L + (Satz 19.24). Dass diese L IE-Algebra als Komplexifizierung von su(2) aufgefasst werden kann, ermöglicht es, mittels der Darstellun↑ gen Ds die irreduziblen Darstellungen von L + zu klassifizieren, einschließlich der unendlich-dimensionalen und der nicht-unitären.
Kapitel 24
Einige Anwendungen
Unsere erste Anwendung (Abschn. A) bezieht sich auf spezielle Funktionen: Wir werden die bekannten Kugelflächenfunktionen Ylm darstellungstheoretisch motivieren und zeigen, dass ihre wichtigsten Eigenschaften Spezialfälle von Grundprinzipien der Darstellungstheorie sind, die wir in den Kap. 21–23 diskutiert haben. Dabei nehmen wir die Gelegenheit wahr, an einem konkreten Beispiel kurz auf homogene Räume einzugehen, eine wichtige Verallgemeinerung der L IE-Gruppen, für die wir im übrigen auf die weiterführende Literatur verweisen, etwa auf [5] oder [71]. In den restlichen Abschnitten greifen wir das Thema von Abschn. 20C wieder auf und befassen uns mit den Eigenwerten und den Matrixelementen von H AMIL TON operatoren, die eine Kugel- oder Axialsymmetrie besitzen. Wie schon im vorigen Kapitel geht es bei diesen Schlussabschnitten nicht darum, dem physikalisch vorgebildeten Leser etwas Neues zu vermitteln. Vielmehr ist es unser Bestreben, Bekanntes in der hier entwickelten mathematisch rigorosen Sprache zu formulieren und damit zum besseren Verständnis der gruppentheoretischen Methoden und zum Abbau von eventuell vorhandenen Sprachbarrieren beizutragen. Für das weitere Studium der physikalischen Anwendungen gibt es eine Fülle von guter Fachliteratur, und wir erwähnen hier nur die Titel [15, 25, 53, 83] sowie den Klassiker [93].
A Kugelfunktionen und infinitesimale Drehungen Im Folgenden sei S := {x = (x, y, z) ∈ R3 | x 2 + y 2 + z 2 = 1} die Einheitssphäre im R3 , parametrisiert durch Kugelkoordinaten x = cos ϕ sin θ,
y = sin ϕ sin θ,
z = cos θ,
0 ≤ ϕ < 2π, 0 ≤ θ ≤ π,
und es sei L 2 (S) der H ILBERTraum der (Klassen von) messbaren Funktionen f : S −→ C mit 2π π f =
| f (ϕ, θ )|2 sin θ dθ dϕ < ∞,
2
0
(24.1)
0
K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2_24, C Springer-Verlag Berlin Heidelberg 2010
315
316
24 Einige Anwendungen
dessen Skalarprodukt gegeben ist durch 2π π f (ϕ, θ ) g(ϕ, θ ) sin θ dθ dϕ.
f | g = 0
(24.2)
0
Wie in Beispiel 21.9 überzeugt man sich von den folgenden Tatsachen (man beachte, dass sin θ dθ dϕ das euklidische Oberflächenelement auf S und somit rotationsinvariant ist!): Satz 24.1 a. Auf L 2 (S) wird durch %
& T (R) f (x) := f (R −1 x),
x ∈ S, R ∈ SO(3)
(24.3)
für f ∈ L 2 (S) eine unitäre stetige Darstellung von SO(3) definiert. b. Bezeichnet # : SU(2) −→ SO(3) den im Satz 18.13c konstruierten Epimorphismus, so wird durch %
& % & D(A) f (x) = T (#(A)) f (x) = f (#(A)−1 x)
(24.4)
eine unitäre Darstellung von SU(2) auf L 2 (S) definiert.
Bevor wir diese Darstellung näher untersuchen, wollen wir die Mittelbildung auf der Sphäre S mit dem H AARschen Maß auf SO(3) in Verbindung bringen: Lemma 24.2 Für g ∈ C(S) und x 0 ∈ S gilt 1 4π
2π 0
π
g(ϕ, θ ) sin θ dθ dϕ =
0
g(R −1 x 0 ) dR.
SO(3)
Beweis Wähle A0 ∈ SO(3) so, dass x 0 = A0 e3 . Da SO(3) unimodular ist, haben wir −1 g(R x 0 ) dR = g(Rx 0 ) dR = g(R A0 e3 ) dR = g(Re3 ) dR. SO(3)
SO(3)
SO(3)
SO(3)
Nun verwenden wir die aus Aufgabe 21.5 bekannte explizite Formel für das normierte H AARsche Maß auf SO(3) und beachten, dass R3 (α)e3 = e3 für alle α:
A
Kugelfunktionen und infinitesimale Drehungen
1 g(Re3 ) dR = 8π 2
SO(3)
=
1 4π
2π
0
2π
π 0
0
π
2π
317
g(R3 (ϕ)R2 (θ )R3 (α)e3 ) sin θ dαdθ dϕ
0
g(R3 (ϕ)R2 (θ )e3 ) sin θ dθ dϕ.
0
Aber R3 (ϕ)R2 (θ )e3 ist der Punkt mit den Kugelkoordinaten (ϕ, θ ), also haben wir die behauptete Identität. Bemerkung Dieses Lemma und sein Beweis reflektieren die Tatsache, dass die Sphäre S als der homogene Raum SO(3)/SO(2) aufgefasst werden kann. Hierzu betrachte man die zu SO(2) isomorphe Untergruppe G 3 := {R3 (α) | α ∈ R}, also den Stabilisator des Punktes e3 ∈ S (Aufgabe 17.16). Der fragliche homogene Raum ist dann definiert als die Menge der Links-Nebenklassen AG 3 , A ∈ SO(3) (vgl. Aufgabe 17.8), und man identifiziert ihn mit S, indem man jeder Nebenklasse AG 3 den Punkt Ae3 zuordnet. Dies ist sinnvoll und liefert eine bijektive Abbildung SO(3)/SO(2) → S, denn Ae3 = A e3
⇐⇒
A−1 A ∈ G 3
⇐⇒
AG 3 = A G 3 .
Diese Abbildung führt die natürliche Linksoperation von SO(3) auf dem homogenen Raum über in die natürliche Linksoperation auf S, und man überträgt die Mannigfaltigkeitsstruktur von S mittels dieser Bijektion auf die Menge der Nebenklassen. So wird der homogene Raum zu einer Mannigfaltigkeit, auf der die Gruppe SO(3) von links operiert. Für allgemeine Gruppen, die auf irgendwelchen Mengen operieren, haben wir diese Konstruktion schon in Aufgabe 17.16 betrachtet. Wir wollen die Darstellung T von SO(3) aus (24.3) nun mit Hilfe der zugehörigen L IE-Algebren-Darstellung T = T∗ untersuchen. Formal ist diese nach Satz 22.10 definiert durch T (L) f := lim
t−→0
1 (T (et L ) − I ) f, t
L ∈ so(3) ,
(24.5)
wobei wir jedoch beachten müssen, dass T eine unendlich-dimensionale Darstellung ist. Um die dabei auftretenden Schwierigkeiten zu umgehen, betrachten wir T nur für Funktionen f ∈ C ∞ (S). Dann können wir schreiben % & d f (e−t L x) , T (L) f (x) = t=0 dt
(24.6)
was wir auf Grund unserer Differenzierbarkeitsvoraussetzung explizit ausrechnen können. Nach Satz 23.9 genügt es, die „infinitesimalen Operatoren“ J1 , J2 , J3 der
318
24 Einige Anwendungen
Darstellung zu bestimmen, die der Standardbasis R1 , R2 , R3 von so(3) entsprechen (vgl. (23.23)). Für t → 0 ergibt sich ⎛ ⎞ x e−t R1 x = ⎝ y ⎠ z ⎛ ⎞ x e−t R2 x = ⎝ y ⎠ z ⎛ ⎞ x e−t R3 x = ⎝ y ⎠ z
⎛
⎞ 0 −t ⎝−z ⎠ +O(t 2 ), y ⎛ ⎞ z −t ⎝ 0 ⎠ +O(t 2 ), −x ⎛ ⎞ −y −t ⎝ x ⎠ +O(t 2 ). 0
(24.7)
Daraus folgt dann durch TAYLORentwicklung von f (e−t L x): f (e−t R1 x) = f ((x, y + t z, z − t y) + O(t 2 ))
∂ = f (x, y, z) + t z ∂∂y − y ∂z f (x, y, z) + · · ·, f (e−t R2 x) = f ((x − t z, y, z + t x) + O(t 2 ))
∂ = f (x, y, z) + t x ∂z − z ∂∂x f (x, y, z) + · · ·,
(24.8)
f (e−t R3 x) = f ((x + t y, y − t x, z) + O(t 2 ))
= f (x, y, z) + t y ∂∂x − x ∂∂y f (x, y, z) + · · · .
Aus diesen Entwicklungen kann man die infinitesimalen Operatoren T (R j ) der Darstellung (24.6) (in kartesischen Koordinaten) direkt ablesen. Ihre Umrechnung auf Kugelkoordinaten folgt dann einfach mit der Kettenregel (vgl. etwa [34], Kap. 10): Satz 24.3 Sei T die gemäß (24.3) definierte unitäre Darstellung von SO(3) auf L 2 (S) und sei T ihre Linearisierung, betrachtet als Darstellung auf C ∞ (S). Dann gilt: a. In kartesischen Koordinaten sind die infinitesimalen Operatoren der Darstellung T gegeben durch
∂ , J1 = iT (R1 ) = i z ∂∂y − y ∂z
∂ ∂ J2 = iT (R2 ) = i x ∂z − z ∂ x ,
J3 = iT (R3 ) = i y ∂∂x − x ∂∂y .
(24.9)
A
Kugelfunktionen und infinitesimale Drehungen
319
b. In Kugelkoordinaten sind die infinitesimalen Operatoren gegeben durch ∂ ∂ J1 = i cot θ cos ϕ ∂ϕ + i sin ϕ ∂θ , ∂ ∂ J2 = i cot θ sin ϕ ∂ϕ − i cos ϕ ∂θ ,
J3 =
(24.10)
∂ i ∂ϕ .
c. Für die „Leiteroperatoren“ (23.30) gilt in Kugelkoordinaten J+ = eiϕ
∂ ∂θ
∂ , + i cot θ ∂ϕ
∂ ∂ + i cot θ ∂ϕ J− = e−iϕ − ∂θ .
(24.11)
d. Für den C ASIMIR-Operator (23.53) der Darstellung gilt: 1 ∂ C = −J = sin θ ∂θ 2
∂2 ∂ 1 . sin θ + ∂θ sin2 θ ∂ϕ 2
(24.12)
Wir wollen nun die Darstellung T in irreduzible Teildarstellungen zerlegen und diese mit Hilfe der Operatoren aus Satz 24.3 explizit berechnen. Theoretische Grundlage für die Durchführbarkeit dieses Vorhabens sind die folgenden beiden Aussagen: Lemma 24.4 a. L 2 (S) ist die H ILBERTsche Summe von T -invarianten Teilräumen Hs , für die T H zu einer der Darstellungen Fl aus Satz 23.2 äquivalent ist. Jedes f ∈ L 2 (S) s hat also eine eindeutige, in L 2 (S) konvergente, Reihenentwicklung f =
fs
mit f s ∈ Hs
s
und f s | f t = 0 für s = t (vgl. die in Korollar 15.3 getroffene Definition). b. Hs ⊆ C ∞ (S) für alle s. Beweis a. Aus Anmerkung 21.28 wissen wir, dass H = L 2 (S) als H ILBERTsche Summe von irreduziblen Teilräumen Hs dargestellt werden kann. Aber nach Korollar 23.5 ist T H dann äquivalent zu einer der irreduziblen Darstellungen Fl mit s l = l(s) ∈ N0 . b. Sei Hs ein irreduzibler Teilraum für die Darstellung T , etwa T H ∼ Fl und s insbesondere dim Hs = 2l + 1. Zunächst zeigen wir, dass Hs ⊆ C(S) ist.
320
24 Einige Anwendungen
Sei ψl der Charakter von Fl und G := SO(3). Wir definieren einen linearen Operator P0 in C(S) durch (P0 g)(x) := (2l + 1) ψl (R)g(R −1 x) dR , x ∈ S. G
Wegen der Kompaktheit von G ist klar, dass P0 g tatsächlich eine stetige Funktion auf S ist. Außerdem ergibt die C AUCHY-S CHWARZsche Ungleichung 1/2
|(P0 g)(x)| ≤ (2l + 1)
|ψl (R)| dR
|g(R
2
G
−1
1/2 2
x)| dR
G
für alle x ∈ S. Aber ψl ist beschränkt auf G, und für das zweite Integral bekommen wir mit Lemma 24.2 und (24.1) 1 g2 |g(R −1 x)|2 dR = 4π G unabhängig von x. Daher gibt es eine Konstante C ≥ 0 so, dass P0 g∞ ≤ Cg für alle g ∈ C(S). Nach dem BLE-Theorem (Theorem 8.7) hat P0 also eine eindeutige Fortsetzung zu einem stetigen linearen Operator P : L 2 (S) → C(S) (beachte auch Satz 10.39 in seiner auf Mannigfaltigkeiten verallgemeinerten Form!), und man kann P auch als einen Operator L 2 (S) → L 2 (S) auffassen, dessen Wertebereich aus (Klassen von) stetigen Funktionen besteht. Mittels der Definition des vektorwertigen Integrals (Definition 21.11) und (8.6) prüft man leicht nach, dass P f = (2l + 1) ψl (R)T (R) f dR G
für alle f ∈ L 2 (S). Ist f ∈ Hs , so führen die Orthogonalitätsrelationen für die Matrixelemente von Fl nach leichter Rechnung zu Pf = f (man kann z. B. Aufgabe 21.13 auf die Darstellung U = T H anwenden). Damit s ist aber klar, dass jedes f ∈ Hs stetig ist. Folglich ist auch P0 f = P f = f , und dies bedeutet die punktweise Identität ψl (R) f (R −1 x) dR , x∈S (∗) f (x) = (2l + 1) G
für jedes f ∈ Hs .
A
Kugelfunktionen und infinitesimale Drehungen
321
Nun beachten wir erneut, dass R3 (ϕ)R2 (θ )e3 der Punkt mit den Kugelkoordinaten (ϕ, θ ) ist. Wegen der Invarianz des H AARschen Maßes führt (∗) daher zu
ψl (R) f (R −1 R3 (ϕ)R2 (θ )e3 ) dR
f (ϕ, θ ) = (2l + 1) G = (2l + 1)
˜ 3 ) d R, ˜ ψl (R3 (ϕ)R2 (θ ) R˜ −1 ) f ( Re
G
und der Integrand im letzten Integral ist bei festem R˜ eine analytische Funktion der Variablen (ϕ, θ ), denn nach Konstruktion sind die Matrixelemente von Fl (R) Polynomfunktionen der Matrixelemente von R. Da der Integrationsbereich G kompakt ist, sagt ein klassischer Satz über Integrale mit Parameter nun, dass f ∈ Hs sogar analytisch ist, erst recht also C ∞ . Nun sei l ∈ N0 gegeben. Mit Hilfe der Operatoren aus Satz 24.3 bestimmen wir kanonischen Basis eines irreduziblen Teilraumes die Basisvektoren f ml (ϕ, θ ) einer Hs mit T H ∼ Fl , also T H ∼ Fl . Nach Satz 23.9 sind diese Basisvektoren s s Eigenvektoren des Operators J3 , d. h. nach (24.10) gilt −i
∂ l f (ϕ, θ ) = m f ml (ϕ, θ ), ∂ϕ m
−l ≤ m ≤ l,
(24.13)
woraus sofort die Gestalt l (θ ), f ml (ϕ, θ ) = eimϕ gm
−l ≤ m ≤ l
(24.14)
folgt. Nach Wahl des Winkels ϕ muss f ml (ϕ, θ ) 2π -periodisch in ϕ sein, was dadurch gewährleistet ist, dass m ganzzahlig ist. Ferner ist nach Satz 23.11b jeder Vektor f ∈ Hs Eigenvektor des C ASIMIR-Operators J 2 zum Eigenwert l(l + 1): J 2 f = l(l + 1) f
für alle f ∈ Hs .
Mit den Formeln (24.12) für J 2 und (24.14) für die Basisfunktionen f ml folgt daraus l : folgende Differentialgleichung für die Funktionen gm 1 d sin θ dθ
sin θ
> m2 d l l (θ ) = 0. gm (θ ) + l(l + 1) − gm dθ sin2 θ
(24.15)
Diese Differentialgleichung ist aus der klassischen Feldtheorie wohlbekannt (vgl. etwa [34], Kap. 30 und 31), denn durch die Substitution x = cos θ geht (24.15) über in die zugeordnete L EGENDRE-Differentialgleichung, so dass l gm (θ ) = Plm (cos θ )
322
24 Einige Anwendungen
gelten muss, wobei Plm die entsprechende zugeordnete L EGENDRE-Funktion bezeichnet. Somit ist f ml proportional zu der üblichen Kugelflächenfunktion Ylm . Wir haben also Ylm (ϕ, θ ) = clm eimϕ Plm (cos θ ),
−l ≤ m ≤ l
(24.16)
mit den Proportionalitätsfaktoren clm
= (−1)
m
(l − m)! (l + m)!
1/2 (l + 1/2)1/2 ,
(24.17)
die so eingerichtet sind, dass Ylm = 1 ist. Aus T H ∼ Fl folgt also s
Hs = LH Ylm − l ≤ m ≤ l , und insbesondere ist Hs durch l eindeutig bestimmt, d. h. der Äquivalenztyp Fl kommt in der Zerlegung von T nur einmal vor. Wir fassen zusammen: Satz 24.5 a. Die Darstellung T von SO(3) aus (24.3) wird durch die orthogonale direkte Zerlegung L 2 (S) =
∞
⊥
Hl
mit Hl = LH Ylm − l ≤ m ≤ l
l=0
in irreduzible Teildarstellungen zerlegt. Die Teildarstellung auf Hl ist dabei zu der Darstellung Fl aus Satz 23.2 äquivalent. b. Zu gegebenem l bilden die Funktionen Ylm (ϕ, θ ) eine kanonische Basis des (2l + 1)-dimensionalen irreduziblen Teilraumes Hl ⊆ L 2 (S) zur Darstellung T aus (24.6) von so(3). Die Elemente von Hl nennt man Kugelflächenfunktionen der Ordnung l. Die wohlbekannte Tatsache, dass die Ylm in L 2 (S) ein vollständiges orthonormales System bilden, findet so eine darstellungstheoretische Erklärung. Auch andere Eigenschaften der Kugelfunktionen, wie etwa die Additionstheoreme, kann man aus ihrer darstellungstheoretischen Rolle ableiten. Ähnliches trifft auf praktisch alle speziellen Funktionen zu, die in der Physik eine Rolle spielen – allerdings muss man hierfür andere L IE-Gruppen und L IE-Algebren heranziehen. Wir können nicht näher darauf eingehen und verweisen z. B. auf [58, 94].
B
Rotationssymmetrie eines Zwei-Teilchen-Systems
323
B Rotationssymmetrie eines Zwei-Teilchen-Systems Wir betrachten ein quantenmechanisches 2-Teilchen-System. Nach der Axiomatik der Quantenmechanik ist sein Zustandsraum H = L 2 (R3 ) ⊗ L 2 (R3 ) ∼ = L 2 (R6 )
(24.18)
(vgl. auch Satz 7.22). Wir schreiben (x 1 , x 2 ) = (x1 , y1 , z 1 , x2 , y2 , z 2 ) für die Variable in R6 , so dass x j die Position des j-ten Teilchens bezeichnet ( j = 1, 2). Liegt keine Wechselwirkung vor, so ist der H AMILTONoperator H = H1 + H2 , H j = − 2m1 j Δ j + V j (x j ),
j = 1, 2 ,
(24.19)
wobei der dreidimensionale L APLACEoperator Δ j nur auf die Variable x j wirkt. Genau genommen ist also H = H1 ⊗ I + I ⊗ H2 , wobei jedes H j ein Operator in L 2 (R3 ) ist. Wir setzen voraus, dass beide Potentiale invariant unter SO(3) sind, d. h. V j (Rx j ) = V j (x j ),
R ∈ SO(3), j = 1, 2.
(24.20)
Wir betrachten nun die Gruppe G := SO(3) × SO(3), d. h. das direkte Produkt von SO(3) mit sich selbst (vgl. Aufgabe 17.2 und den Schluss von Abschn. 19B). Auf H = L 2 (R6 ) wird dann durch [S(R1 , R2 )ψ] (x 1 , x 2 ) := ψ(R1−1 x 1 , R2−1 x 2 )
(24.21)
eine unitäre Darstellung von G definiert. Wie in Satz 20.16 zeigt man, dass H mit allen Operatoren S(R1 , R2 ) vertauschbar ist, d. h. G = SO(3) × SO(3) ist eine Symmetriegruppe von H . Nach Satz 20.17 ist die Kenntnis der irreduziblen Darstellungen von G für die Untersuchung der Eigenwerte von H wichtig. Nach Aufgabe 21.14 sind diese genau die äußeren Tensorproduktdarstellungen Sl1 ,l2 := Fl1 Fl2 , d.h. Sl1 ,l2 (R1 , R2 ) := Fl1 (R1 ) ⊗ Fl2 (R2 ) ,
(24.22)
wobei die Fl die irreduziblen Darstellungen von SO(3) gemäß Satz 23.2 sind. Sei nun λ ein Eigenwert von H . Wir nehmen an, dass der zugehörige Eigenraum Wλ Trägerraum der irreduziblen Darstellung Sl1 ,l2 aus (24.22) ist. Dann ist dim Wλ = (2l1 + 1)(2l2 + 1),
324
24 Einige Anwendungen
d. h. λ ist (2l1 + 1)(2l2 + 1)-fach entartet. l Es bezeichne {ψmj j (x j ) | −l j ≤ m j ≤ l j } eine kanonische Basis zur irreduziblen Darstellung Fl j von SO(3) gemäß Satz 23.9. Dann überlegt man sich sofort, dass {ψml11 (x 1 ) · ψml22 (x 2 ) | −l j ≤ m j ≤ l j ,
j = 1, 2}
(24.23)
eine Orthonormalbasis des G-irreduziblen Teilraums Wλ ist. Bisher haben wir ein ungekoppeltes 2-Teilchensystem betrachtet. Nun führen wir eine Wechselwirkung ein, indem wir zu dem Operator H ein Wechselwirkungspotential V hinzufügen. Der H AMILTONoperator des wechselwirkenden Systems ist also H := H + V (x 1 , x 2 ),
(24.24)
und wir setzen voraus, dass V nur vom Abstand der Teilchen abhängt, d. h. V (x 1 , x 2 ) = V (|x 1 − x 2 |).
(24.25)
Dann ist V zwar noch invariant unter der Gruppe SO(3), die gemäß R · (x 1 , x 2 ) := (Rx 1 , Rx 2 ) auf R3 × R3 operiert, aber nicht mehr invariant unter G = SO(3) × SO(3). Folglich hat der H AMILTONoperator H aus (24.24) nicht mehr G als Symmetriegruppe, sondern nur noch die Untergruppe G0 = {(R, R) | R ∈ SO(3)} ∼ = SO(3).
(24.26)
Das hat nun Konsequenzen für das Eigenwertproblem. Wir hatten angenommen, dass der Eigenraum Wλ zum Eigenwert λ des ungekoppelten Operators irreduzibel unter der Darstellung Sl1 ,l2 (R1 , R2 ) = Sl1 (R1 ) ⊗ Sl2 (R2 ) ist. Unter der Einschränkung S0l1 ,l2 (R) := Sl1 (R) ⊗ Sl2 (R) auf die Untergruppe G0 ∼ = SO(3), also der „inneren“ Tensorproduktdarstellung (Aufgabe 20.9), ist Wλ nicht mehr irreduzibel, sondern zerfällt gemäß Satz 23.4 nach der C LEBSCH-G ORDAN-Formel S0l1 ,l2 = Fl1 ⊗ Fl2 ∼ Fl1 +l2 ⊕ Fl1 +l2 −1 ⊕ · · · ⊕ F|l1 −l2 |
(24.27)
C
C LEBSCH-G ORDAN-Koeffizienten und W IGNER -E CKART-Theorem
325
in eine direkte Summe von irreduziblen SO(3)-Darstellungen. Wir fassen zusammen: Wird ein ungekoppeltes 2-Teilchensystem mit dem H AMILTON-Operator H = H1 + H2 , H j = −
1 Δ j + V j (x j ) 2m j
(24.19)
und kugelsymmetrischen Potentialen V j (x j ) durch ein Wechselwirkungspotential V (|x 1 − x 2 |) gestört, (24.24) H = H + V , so spaltet sich ein (2l1 +1)(2l2 +1)-fach entarteter Eigenwert λ von H auf in 2·min(l1 , l2 )+ 1 Eigenwerte λl , |l1 − l2 | ≤ l ≤ l1 + l2 , von H , die jeweils (2l + 1)-fach entartet sind.
C C LEBSCH-G ORDAN-Koeffizienten und W IGNER -E CKARTTheorem Für praktische Anwendungen muss man etwas mehr wissen, denn um die Matrixelemente von H und H zu berechnen, braucht man einen Zusammenhang zwischen einer Basis von Fl1 ⊗ Fl2 , die sich aus kanonischen Basen von Fl1 , Fl2 durch Bildung des Tensorprodukts ergibt, auf der einen Seite, und kanonischen Basen der direkten Summanden Fl , |l1 − l2 | ≤ l ≤ l1 + l2 auf der anderen. Dieser Zusammenhang wird durch die C LEBSCH-G ORDAN-Koeffizienten hergestellt, wie wir nun ausführlicher diskutieren wollen. l (x , x ) | −l ≤ m ≤ l} eine Für irgendein l, |l1 −l2 | ≤ l ≤ l1 +l2 , bezeichne {ϕm 1 2 l1 ,l2 kanonische Basis der Fl -Teildarstellung von S0 , die wir mit den infinitesimalen J -Operatoren berechnen können, indem wir die Linearisierung von S0l1 ,l2 auf die am Schluss von Kap. 23 dargestellte Weise ausreduzieren. Andererseits gehört zur linken Seite der C LEBSCH-G ORDAN-Zerlegung Fl1 ⊗ Fl2 ∼ Fl1 +l2 ⊕ · · · ⊕ F|l1 −l2 |
(24.28)
die Basis {ψml11 (x 1 ) · ψml22 (x 2 ) | −l j ≤ m j ≤ l j ,
j = 1, 2},
(24.29)
wie wir bereits gezeigt haben. Dies ist jedoch keine kanonische Basis des Trägerraumes Wλ der Tensorproduktdarstellung, sondern diese ist l (x 1 , x 2 ) | −l ≤ m ≤ l, |l1 − l2 | ≤ l ≤ l1 + l2 }. {ϕm
(24.30)
Die Berechnung der Matrixelemente des H AMILTONoperators ist in der kanonischen Basis (24.30) wesentlich einfacher als in der Tensorproduktbasis (24.29). Jedoch kann die Basis (24.29) (z. B. mit Hilfe von Kugelfunktionen) wesentlich einfacher konstruiert werden. Für praktische Rechnungen benötigt man daher die Transformationsmatrix zwischen diesen beiden Orthonormalbasen von Wλ :
326
24 Einige Anwendungen
Definition 24.6 Es sei {ψml (x) | −l ≤ m ≤ l} kanonische Basis eines SO(3)l (x , x ) | −l ≤ m ≤ l} irreduziblen Teilraumes V l von L 2 (R3 ), und es sei {ϕm 1 2 kanonische Basis eines SO(3)-irreduziblen Teilraumes W l von L 2 (R6 ) ∼ = L 2 (R3 )⊗ 2 3 L (R ). Dann heißen die Koeffizienten C(l1 , m 1 ; l2 , m 2 | l, m) in der Entwicklung l (x 1 , x 2 ) = ϕm
m 1 ,m 2
C(l1 , m 1 ; l2 , m 2 | l, m)ψml11 (x 1 )ψml22 (x 2 )
(24.31)
die C LEBSCH-G ORDAN-Koeffizienten von SO(3) bezüglich der Zerlegung V ⊗V l1
l2
=
l 1 +l2
Wl.
(24.32)
l=|l1 −l2 |
Die aus den C LEBSCH-G ORDAN-Koeffizienten gebildete Matrix der Ordnung (2l1 + 1)(2l2 + 1) ist als Transformationsmatrix zwischen Orthonormalbasen unitär. Außerdem ist C(l1 , m 1 ; l2 , m 2 | l, m) = 0 ,
falls m = m 1 + m 2 .
(24.33)
Wendet man nämlich J3 auf (24.31) an (wobei das Ergebnis von Aufgabe 22.4b. zu beachten ist!), so erhält man l mϕm (x 1 , x 2 ) =
m 1 ,m 2
C(l1 , m 1 ; l2 , m 2 | l, m)(m 1 + m 2 )ψml11 (x 1 )ψml22 (x 2 )
und folglich m 1 ,m 2
C(l1 , m 1 ; l2 , m 2 | l, m)(m − m 1 − m 2 )ψml11 (x 1 )ψml22 (x 2 ) = 0,
woraus (24.33) durch Koeffizientenvergleich folgt. Allerdings sind die oben definierten C LEBSCH -G ORDAN-Koeffizienten nur bis auf einen Phasenfaktor eindeutig, weil die kanonischen Basen noch die Abänderung um einen Phasenfaktor gestatten (Satz 23.9). Eindeutig festgelegt werden sie durch die sog. C ONDON -S HORTLEY-Konvention, bei der die Phasenfaktoren so eingerichtet werden, dass C(l1 , l1 ; l2 , l − l1 | l, l) > 0
für |l1 − l2 | ≤ l ≤ l1 + l2
(24.34)
C
C LEBSCH-G ORDAN-Koeffizienten und W IGNER -E CKART-Theorem
327
und alle übrigen C LEBSCH -G ORDAN-Koeffizienten reell werden. Die aus ihnen gebildete Transformationsmatrix ist dann also orthogonal. Man kann sie sogar explizit berechnen, was allerdings mühsam ist (vgl. etwa [30]), und aus der gewonnenen Formel kann man einige interessante Symmetrie-Eigenschaften ablesen wie z. B. C(l1 , m 1 ; l2 , m 2 | l, m) = C(l2 , m 2 ; l1 , m 1 | l, m).
(24.35)
Weitere derartige Symmetrien werden z. B. in [30], in [94] und in der physikalischen Literatur über Drehimpulse in der Quantenmechanik diskutiert. Bemerkung Da die C(l1 , m 1 ; l2 , m 2 | l, m) für feste Werte von l1 , l2 eine orthogonale Matrix bilden, kann man (24.31) auch in der äquivalenten Form ψml11 (x 1 )ψml22 (x 2 ) =
l C(l1 , m 1 ; l2 , m 2 | l, m)ϕm (x 1 , x 2 )
l,m
anschreiben, die eigentlich besser zur Zerlegung (24.32) passt. Die Gestalt (24.31) ist jedoch aus physikalischer Sicht vorzuziehen, denn sie gibt unmittelbar wieder, wie sich die einzelnen Drehimpulse l1 , l2 bzw. die einzelnen z-Komponenten m 1 , m 2 bei Kopplung der Systeme zu einem Gesamtdrehimpuls l (bzw. zu einer Gesamtkomponente m = m 1 + m 2 in z-Richtung) zusammensetzen. Wir demonstrieren nun zunächst allgemein, wie man die Matrixelemente des H AMILTONoperators H mit SO(3) als Symmetriegruppe besonders einfach bestimmen kann. Sei also SO(3) Symmetriegruppe des H AMILTONoperators H im komplexen H ILBERTraum H. Sei {ϕn | n ∈ N} eine Orthonormalbasis von H, die im Definitionsbereich D(H ) enthalten ist. Wie in der Physik üblich, nennen wir die Zahlen ϕi | H ϕ j die Matrixelemente von H bezüglich dieser Orthonormalbasis. Nach Voraussetzung gilt für eine gewisse unitäre Darstellung T von SO(3) auf H dann T (R)H = H T (R)
für alle R ∈ SO(3).
(24.36)
Angenommen wir haben eine orthogonale direkte Zerlegung H=
kl Hl , l
T =
kl Fl
(24.37)
l
in irreduzible Teildarstellungen Fl , wobei Fl kl -mal auftritt. Dann versehen wir jeden der vorkommenden Teilräume j
Hl ,
1 ≤ j ≤ kl ,
falls kl = 0,
328
24 Einige Anwendungen
mit einer kanonischen Basis {ψ ljm | −l ≤ m ≤ l}. Es gilt also J 2 ψ ljm = l(l + 1)ψ ljm , l ψ lj,m+1 , J+ ψ ljm = αm+1
J3 ψ ljm = mψ ljm , l ψl J− ψ ljm = αm j,m−1 ,
(24.38)
wobei diese Konstruktion völlig unabhängig von dem H AMILTONoperator H ist. Jedoch ist die Berechnung der Matrixelemente k ψ ljm | H ψin
in der kanonischen Basis besonders einfach, wie wir jetzt sehen werden. Aus (24.36) folgt H J3 = J3 H
und außerdem J3∗ = J3
und daher mit (24.38) k = ψ l | H J ψ k n ψ ljm | H ψin 3 in jm l k = mψ l | H ψ k , = J3 ψ jm | H ψin jm in
Also k =0 ψ ljm | H ψin
für m = n.
(24.39)
Aus (24.36) folgt weiterhin H J2 = J2H
und außerdem
(J 2 )∗ = J 2
und daher mit (24.38), (24.39) k = ψ l | H J 2 ψ k k(k + 1) ψ ljm | H ψim jm im k = l(l + 1)ψ l | H ψ k , = J 2 ψ ljm | H ψim jm im
Also k = 0 für k = l. ψ ljm | H ψim
Schließlich gilt noch H J+ = J+ H
und J+∗ = J−
und daher folgt mit (24.38), (24.39), und (24.40) l l l αm+1 ψ lj,m+1 | H ψi,m+1 = ψ lj,m+1 | H J+ ψi,m l l l l l , = J− ψ j,m+1 | H ψi,m = αm+1 ψ j,m | H ψi,m
(24.40)
C
C LEBSCH-G ORDAN-Koeffizienten und W IGNER -E CKART-Theorem
329
Also l l ψ lj,m+1 | H ψi,m+1 = ψ lj,m | H ψi,m ,
(24.41)
d. h. die Matrixelemente sind unabhängig von m. Damit haben wir den folgenden Spezialfall des sogenannten W IGNER-E CKART-Theorems bewiesen, das Rechnungen stark vereinfacht. Satz 24.7 Sei SO(3) eine Symmetriegruppe des H AMILTONoperators H auf einem H ILBERTraum H, und sei {ψ lj,m | −l ≤ m ≤ l,
1 ≤ j ≤ kl ,
l = 0, 1, . . .}
ein kanonisches Basissystem von H bezüglich SO(3). Dann gilt für die Matrixelemente von H k = λli j δkl δmn , ψ lj,m | H ψi,n
(24.42)
wobei λli j das sogenannte reduzierte Matrixelement ist. Diese Vereinfachung wollen wir jetzt benutzen, um für den gestörten H AMILTONoperator H = H + V
auf H = L 2 (R6 ) = L 2 (R3 ) ⊗ L 2 (R3 )
(24.43)
die Matrixelemente ψml11 ψml22 | H ψnl11 ψnl22
(24.44)
bezüglich der Tensorproduktbasis des invarianten Teilraumes Wλ zu bestimmen, auf dem SO(3) durch Sl1 ,l2 ∼ Fl1 ⊗ Fl2 dargestellt wird. Diese Bestimmung ist wichtig, denn die Tensorproduktbasis (24.29) steht wirklich zur Verfügung. Andererseits ist jedoch die Berechnung der Matrixelemente l | H ϕnk ϕm
bezüglich der kanonischen Basis (24.30) von Wλ besonders einfach, denn nach Satz 24.7 gilt l ϕm | H ϕnk = λl δkl δmn ,
(24.45)
wobei die Zahl λl nur vom Gewicht l abhängt und gerade der Eigenwert von H ist, der zu dem Eigenraum l | −l ≤ m ≤ l}) Wλl = LH({ϕm
gehört.
330
24 Einige Anwendungen
Nun folgt aber aus (24.31) in Definition 24.6 ψml11 ψml22 | H ψnl11 ψnl22 = = C(l1 , m 1 ; l2 , m 2 | l, m) · C(l1 , n 1 ; l2 , n 2 | k, n) l,m k,n
(24.46)
l | H ϕk . · ϕm n
Kombinieren wir dieses Ergebnis mit (24.45), so erhalten wir: Satz 24.8 Sei {ψml | −l ≤ m ≤ l} eine kanonische Basis eines SO(3)-irreduziblen Teilraumes von L 2 (R3 ) vom Gewicht l. Hat dann ein H AMILTONoperator H auf L 2 (R3 ) ⊗ L 2 (R3 ) die Gruppe SO(3) als Symmetriegruppe, so gilt für die Matrixelemente bezüglich der Tensorproduktbasis ψml11 ψml22 | H ψnl11 ψnl22 = =
l1 +l2
l
l=|l1 −l2 | m=−l
C(l1 , m 1 ; l2 , m 2 | l, m)C(l1 , n 1 ; l2 , n 2 | l, m)λl .
(24.47)
D Axialsymmetrische Störungen eines kugelsymmetrischen Potentials Wir wollen nun als weitere Anwendung ein einfaches Störungsproblem untersuchen. Wir betrachten ein Ein-Teilchen-System mit dem H AMILTONoperator H0 = −
1 Δ + V (x) 2m
(24.48)
auf H = L 2 (R3 ). Das Potential V (x) sei invariant unter SO(3), also V (Rx) = V (x)
für R ∈ SO(3),
(24.49)
was bei einem kugelsymmetrischen Potential V (x) = V (|x|) der Fall ist. Wir wissen, dass dann SO(3) eine Symmetriegruppe von H0 ist, d. h. für die Darstellung [T (R)ψ] (x) := ψ(R −1 x),
R ∈ SO(3)
(24.50)
von SO(3) auf H gilt T (R)H0 = H0 T (R)
auf D(H0 )
(24.51)
D
Axialsymmetrische Störungen eines kugelsymmetrischen Potentials
331
für alle R ∈ SO(3). Nach Satz 20.17 ist dann jeder Eigenraum Wλ0 von H0 invariant unter T und zerfällt daher in eine direkte Summe von irreduziblen Teilräumen. Wir wollen im folgenden annehmen, dass Wλ0 bereits irreduzibel ist, so dass T W 0 ∼ Fl , λ
(24.52)
also äquivalent zu der irreduziblen SO(3)-Darstellung vom Gewicht l ist. Nach Satz 23.2 ist der Charakter dieser Darstellung gegeben durch ψl (R) =
sin(l + 12 )α , sin α2
(24.53)
wenn R ∈ SO(3) eine Drehung mit dem Drehwinkel α ist. Nun stören wir den kugelsymmetrischen H AMILTONoperator H0 durch ein Potential V1 (x): H = H0 + V1 ,
(24.54)
wobei wir annehmen, dass V1 nur noch zylindersymmetrisch, z. B. bezüglich der z-Achse, ist. Die Symmetriegruppe von V1 und damit von H ist dann die Gruppe ⎧⎛ ⎫ ⎞ ⎨ cos β sin β 0 ⎬ G = ⎝− sin β cos β 0⎠ | 0 ≤ β ≤ 2π ∼ = SO(2), ⎩ ⎭ 0 0 1
(24.55)
also eine echte Untergruppe G von SO(3), die isomorph zu SO(2) ist. Schränken wir die irreduzible Darstellung Fl von SO(3) auf die Untergruppe G ein, so ist dies i. A. keine irreduzible Darstellung von G, sondern zerfällt in eine direkte Summe von irreduziblen SO(2)-Darstellungen Dm . Die irreduziblen Darstellungen von SO(2) ∼ = U(1) sind uns aus Beispiel 21.19 bekannt. Es handelt sich um die eindimensionalen Darstellungen Dm (R3 (α)) = eimα
mit m ∈ Z.
(24.56)
Wir haben damit eine direkte Zerlegung der Form 2l+1 ? Fl G = Dm j ,
Wλ0 =
j=1 2l+1 ? j=1
wobei Vm j Trägerraum von Dm j ist.
(24.57) Vm j ,
dim Vm j = 1,
332
24 Einige Anwendungen
Um festzustellen, welche m j in (24.57) vorkommen, vergleichen wir die Charaktere. Es ist χm j (R3 (α)) = eim j α ,
(24.58)
und daraus folgt dann mit (24.53) und (24.57) nach Satz 20.8 2l+1 sin(l + 12 )α = eim j α . α sin 2 j=1
Mit der Summenformel für die endliche geometrische Reihe bestätigt man aber sofort die folgende elementare Beziehung: l
eimα =
m=−l
sin(l + 12 )α , sin α2
und da die linke Seite die F OURIER-Entwicklung der rechten Seite ist, sind die vorkommenden Werte m j = j hierbei auch eindeutig bestimmt. Damit sind die Darstellungen Dm j eindeutig festgelegt, und die Zerlegung lautet: l Dm . Fl G =
(24.59)
m=−l
Somit haben wir folgendes Ergebnis: Die axialsymmetrische Störung V1 des kugelsymmetrischen H AMILTONoperators H0 spaltet einen (2l +1)-fach entarteten Eigenwert λ von H0 in 2l +1 Eigenwerte von H = H0 +V1 auf.
Im Allgemeinen werden dies einfache Eigenwerte von H1 sein. Der analoge Effekt der Aufspaltung der Energieniveaus, der sich im Falle eines äußeren Magnetfelds ergibt, ist als Z EEMAN-Effekt bekannt.
Aufgaben zu Kap. 24 24.1 Sei E3 die Gruppe der euklidischen Bewegungen von R3 wie in Aufgabe 19.16, und sei (P1 , P2 , P3 , L 1 , L 2 , L 3 ) die dort angegebene Basis ihrer L IE-Algebra. Auf dem Vektorraum V := C ∞ (R3 ) haben wir zu jedem Element Q ∈ L(E3 ) den linearen Operator D(Q) mit d f (x · exp(t Q)) [D(Q) f ](x) := , dt t=0
Aufgaben
333
wobei die Rechtsoperation x · (A, v) := A−1 (x − v) von E3 = SO(3) × R3 zu Grunde gelegt ist. a. Man bestimme die Differentialoperatoren D(P j ) und D(L j ) für j = 1, 2, 3. b. Man weise nach, dass D eine Darstellung der L IE-Algebra L(E3 ) ist. c. Man beweise, dass die Operatoren D(P j ) , D(L j ) mit dem L APLACE-Operator vertauschen und folgere, dass W := { f ∈ C ∞ (R3 ) | Δf = 0} ein D-invarianter Teilraum ist. d. Sei m ∈ N fest und Vm ⊆ C ∞ (R3 ) der Teilraum der Polynome in drei Variablen, deren Grad nicht größer als m ist. Man gebe eine Darstellung von E3 auf Vm an, deren Linearisierung mit D übereinstimmt. 24.2 Es sei G = SO(3), und S = S2 sei die Einheitssphäre im dreidimensionalen Raum. Zu gegebenem m ∈ Z bilden wir den Raum Hm := { f ∈ L 2 (G) | f (R3 (α)A) = eimα f (A) für alle A ∈ G, α ∈ R}. Man zeige: a. Hm ist ein abgeschlossener Teilraum von L 2 (G), der unter der rechtsregulären Darstellung (21.37) von G invariant ist. b. Sind f, g ∈ Hm , so ist durch h(Ae3 ) := f (A)g(A) eine Funktion h auf S wohldefiniert, und es gilt 1 f | g = 4π
hdσ, S
wobei dσ = ω S das euklidische Oberflächenelement bezeichnet. c. Ist l ≥ |m|, so definiert Z lm (A) := Ylm (Ae3 ) eine Funktion aus Hm . Der Raum Hm hat also unendliche Dimension. Bemerkung Die Darstellung, die durch Einschränken der rechtsregulären Darstellung auf Hm entsteht, ist induziert von der eindimensionalen Darstellung #m (R3 (α))z = eimα z ,
z∈C
334
24 Einige Anwendungen
der zu U(1) isomorphen Untergruppe (24.55). Vgl. auch die Aufgaben 20.14 und 20.15. 24.3 Wir übernehmen die Bezeichnungen aus den Aufgaben 23.2 und 23.3, ferner die aus Abschn. A Betrachte ein festes l ∈ N0 . a. Man zeige: Die Einschränkung von homogenen Polynomen auf die Einheitssphäre, also die Abbildung ρ : W3,l −→ C(S) , f −→ f S , ist eine injektive lineare Abbildung, die mit den gegebenen Darstellungen D und T von G = SO(3) verträglich ist, d. h. es gilt: ρ ◦ D(R) = T (R) ◦ ρ
∀ R ∈ G.
(Hinweis: Man beachte R −1 = R T .) b. Für D := D∗ berechne man die Differentialoperatoren J1 , J2 , J3 , J+ , J− . c. Für das Polynom v(x1 , x2 , x3 ) := (x1 + ix2 )l (das zu V3,l gehört, wie wir aus Aufgabe 23.3 wissen!) weise man nach, dass J3 v = lv
und
J+ v = 0.
j
d. Definiere ηl, j := J− v für j = 0, 1, . . . , 2l. Man zeige, dass stets ηl, j ∈ V3,l ist. (Hinweis: Man muss nicht rechnen. Der Raum V3,l ist ja D∗ -invariant (wieso?).) e. Man folgere: für 0 ≤ j ≤ 2l ist ηl, j S proportional zur Kugelflächenfunktion l− j
Yl . (Hinweis: Man beachte, dass die kanonische Basis bis auf einen Proportionalitätsfaktor eindeutig bestimmt ist.)
Literaturverzeichnis
1. N.I. Achieser, I.M. Glasmann, Theorie der linearen Operatoren im Hilbert-Raum (Deutsch, Frankfurt a. M., 1977) 2. J.F. Adams, Lectures on Lie-Groups (W. A. Benjamin, New York, NY, 1969) 3. H.W. Alt, Lineare Funktionalanalysis: Eine anwendungsorientierte Einführung, 5. Auflg. (Springer, Berlin, 2006) 4. W.O. Amrein, Non-relativistic Quantum Dynamics (Reidel, Dordrecht, 1981) 5. A.O. Barut, R. Raczka, Theory of Group Representations and Applications, 2. Auflg. (World Scientific Publishing, Singapore, 1986) 6. H. Bauer, Wahrscheinlichkeitstheorie und Grundzüge der Maßtheorie, 3. Auflg. (de Gruyter, Berlin, 1978) 7. F.A. Berezin, M.A. Shubin, The Schrödinger Equation (Kluwer, Dordrecht, 1991) 8. R. Berndt, Representations of Linear Groups – An Introduction Based on Examples from Physics and Number Theory (Vieweg, Wiesbaden, 2007) 9. M.Sh. Birman, M.Z. Solomjak, Spectral Theory of Self-Adjoint Operators in Hilbert Space (Springer, Berlin, 1987) 10. N.N. Bogoliubov, A.A. Logunov, I.T. Todorov, Introduction to Axiomatic Quantum Field Theory (W. A. Benjamin, Reading, MA, 1975) 11. O. Bratteli, D.W. Robinson, Operator Algebras and Quantum Statistical Mechanics I, II, 2. Auflg. (Springer, New York, NY, 1987/1996) 12. Th. Bröcker, T. tom Dieck, Representations of Compact Lie Groups (Springer, New York, NY, 2003) 13. M. Carmeli, Representations of the Rotation and Lorentz Groups: An Introduction (Dekker, New York, NY, 1976) 14. M. Carmeli, Group Theory and General Relativity (McGraw-Hill, New York, NY, 1977) 15. P. Carruthers, Unitary Symmetry of Strong Interactions (Wiley, New York, NY, 1966) 16. R. Carter, G. Segal, I. MacDonald, Lectures on Lie Groups and Lie Algebras (Cambridge University Press, Cambridge, 1995) 17. J.B. Conway, A Course in Functional Analysis (Springer, New York, NY, 1985) 18. J.F. Cornwell, Group Theory and Physics I, II, III (Academic Press, New York, NY, 1984) 19. J.F. Cornwell, Group Theory in Physics – An Introduction (Academic Press, Cambridge, 1997) 20. M.L. Curtis, Matrix Groups (Springer, New York, NY, 1979) 21. H.L. Cycon, R.E. Froese, W. Kirsch, B. Simon, Schrödinger Operators – With Applications to Quantum Mechanics and Global Geometry (Springer, New York, NY, 1987) 22. B.A. Dubrovin, A.T. Fomenko, S.P. Novikov, Modern Geometry – Methods and Applications I, II, III (Springer, New York, NY, 1984) 23. N. Dunford, J. Schwartz, Linear Operators I (Interscience, New York, NY, 1958) 24. N. Dunford, J. Schwartz, Linear Operators II (Interscience, New York, NY, 1969) 25. J.P. Elliott, P.G. Dawber, Symmetry in Physics I, II (Oxford University Press, Oxford, 1972) K.-H. Goldhorn et al., Moderne mathematische Methoden der Physik, Springer-Lehrbuch, DOI 10.1007/978-3-642-05185-2, C Springer-Verlag Berlin Heidelberg 2010
335
336
Literaturverzeichnis
26. G.G. Emch, Algebraic Methods in Statistical Mechanics and Quantum Field Theory (Wiley, New York, NY, 1972) 27. G.G. Emch, C. Liu, The Logic of Thermostatistical Physics (Springer, Berlin, Heidelberg, 2002) 28. Th. Frankel, The Geometry of Physics, 2.Auflg. (Cambridge University Press, Cambridge, 2004) 29. W. Fulton, J. Harris, Representation Theory. A First Course (Springer, New York, NY, 2004) 30. I.M. Gelfand, R.A. Minlos, Z.Y. Shapiro, Representations of the Rotation and Lorentz Groups and their Applications (Pergamon Press, New York, NY, 1963) 31. I.M. Gelfand, N.Ya. Vilenkin, Generalized Functions, vol. IV (Academic Press, New York, NY, 1964) 32. J. Glimm, A. Jaffe, Quantum Physics: A Functional Integral Point of View (Springer, New York, NY, 1987) 33. M. Göckeler, T. Schücker, Differential Geometry, Gauge Theories and Gravity (Cambridge University Press, Cambridge, 1997) 34. K.-H. Goldhorn, H.-P. Heinz, Mathematik für Physiker I, II, III (Springer, Berlin, 2007/2008) 35. S.J. Gustafson, I.M. Sigal, Mathematical Concepts of Quantum Mechanics (Springer, Berlin, 2003) 36. R. Haag, Local Quantum Physics: Fields, Particles, Algebras (Springer, Berlin, 1996) 37. W. Hein, Einführung in die Struktur- und Darstellungstheorie der klassischen Gruppen (Springer, Berlin, 1990) 38. E. Hewitt, K.A. Ross, Abstract Harmonic Analysis I, II (Springer, Berlin, 1963) 39. J. Hilgert, K.H. Neeb, Lie-Gruppen und Lie-Algebren (Vieweg, Braunschweig, 1991) 40. F. Hirzebruch, W. Scharlau, Einführung in die Funktionalanalysis (BI, Mannheim, 1971) 41. P. Hislop, I.M. Sigal, Introduction to Spectral Theory. With Applications to Schrödinger Operators (Springer, New York, NY, 1996) 42. W.Y. Hsiang, Lectures on Lie Groups (World Scientific Publishing, Singapore, 2000) 43. Jing-Song Huang, Lectures on Representation Theory (World Scientific Publishing, Singapore, 1999) 44. W. Jantscher, Hilberträume (Akadem. Verlagsges., Wiesbaden, 1977) 45. J.M. Jauch, Foundations of Quantum Mechanics (Addison-Wesley, Redding, MA, 1968) 46. R.V. Kadison, J.R. Ringrose, Fundamentals of the Theory of Operator Algebras I–IV (Academic Press, New York, NY, 1983–1992) 47. T. Kato, Perturbation Theory for Linear Operators (Springer, Berlin, 1988) 48. Y.S. Kim, M.E. Noz, Theory and Application of the Poincaré Group (Reidel, Dordrecht, 1986) 49. S. Kobayashi, K. Nomizu, Foundations of Differential Geometry I, II (Wiley, New York, NY, 1963/1969) 50. E. Kreyszig, Introductory Functional Analysis with Applications (Wiley, New York, NY, 1978) 51. J.M. Lee, Introduction to Smooth Manifolds (Springer, New York, NY, 2006) 52. E.H. Lieb, M. Loss, Analysis (Amer. Math. Soc., Providence, RI, 1997) 53. W. Ludwig, C. Falter, Symmetries in Physics (Springer, Berlin, 1998) 54. G.W. Mackey, Mathematical Foundations of Quantum Mechanics (W. A. Benjamin, New York, NY, 1963) 55. G.W. Mackey, Induced Representations of Groups in Quantum Mechanics (W. A. Benjamin, New York, NY, 1968) 56. G.W. Mackey, The Theory of Unitary Group Representations (University of Chicago Press, Chicago, IL, 1976) 57. R. Meise, D. Vogt, Einführung in die Funktionalanalysis (Vieweg, Braunschweig, 1992) 58. W. Miller, Symmetry Groups and their Applications (Academic Press, New York, NY, 1973) 59. G.L. Naber, Topology, Geometry, and Gauge Fields I: Foundations (Springer, New York, NY, 1997) 60. G.L. Naber, Topology, Geometry, and Gauge Fields II: Interactions (Springer, New York, NY, 2000) 61. M.A. Naimark, A.I. Stern, Theory of Group Representations (Springer, New York, NY, 1982)
Literaturverzeichnis
337
62. M. Nakahara, Geometry, Topology and Physics, 2. Auflg. (Taylor & Francis, Boca Raton, FL, 2003) 63. P.J. Olver, Applications of Lie Groups to Differential Equations (Springer, New York, NY, 1986) 64. E. Prugoveˇcki, Quantum Mechanics in Hilbert Space (Academic Press, New York, NY, 1971) 65. J. Rauch, Partial Differential Equations (Springer, New York, NY, 1991) 66. M. Reed, B. Simon, Methods of Modern Mathematical Physics II: Fourier Analysis. SelfAdjointness (Academic Press, London, 1975) 67. M. Reed, B. Simon, Methods of Modern Mathematical Physics IV: Analysis of Operators (Academic Press, London, 1978) 68. M. Reed, B. Simon, Methods of Modern Mathematical Physics III: Scattering Theory (Academic Press, London, 1979) 69. M. Reed, B. Simon, Methods of Modern Mathematical Physics I: Functional Analysis, 2. Auflg. (Academic Press, London, 1980) 70. F. Riesz, B. Sz.-Nagy, Vorlesungen über Funktionalanalysis, 4. Auflg. (Deutsch, Thun, 1982) 71. W. Rossmann, Lie Groups – An Introduction through Linear Groups (Oxford University Press, Oxford, 2002) 72. W. Rudin, Reelle und komplexe Analysis (Oldenbourgh, München, 1999) 73. W. Rudin, Functional Analysis (Tata-McGraw Hill, New Delhi, 1979) 74. A.A. Sagle, R.E. Walde, Introduction to Lie Groups and Lie Algebras (Academic Press, New York, NY, 1973) 75. D.H. Sattinger, O.L. Weaver, Lie Groups and Algebras with Applications to Physics, Geometry, and Mechanics (Springer, New York, NY, 1986) 76. M. Schechter, Operator Methods in Quantum Mechanics (North Holland, New York, NY, 1981) 77. B.F. Schutz, Geometrical Methods of Mathematical Physics (Cambridge University Press, Cambridge, 1980) 78. G.L. Sewell, Quantum Theory of Collective Phenomena (Clarendon Press, Oxford, 1986) 79. G.L. Sewell, Quantum Mechanics and Its Emergent Macrophysics (Princeton University Press, Princeton, NJ, 2002) 80. R.U. Sexl, H.K. Urbantke, Relativität, Teilchen, Gruppen (Springer, New York, NY, 1975) 81. B. Simon, Bull. Amer. Math. Soc. 7, 447 (1982) 82. B. Simon, Representations of Finite and Compact Groups (Amer. Math. Soc., Providence, RI, 1996) 83. E. Stiefel, A. Fässler, Gruppentheoretische Methoden und ihre Anwendungen (Teubner, Stuttgart, 1979) 84. R.F. Streater, A.S. Wightman, PCT, Spin, Statistics and All That (W. A. Benjamin, New York, NY, 1974) 85. A.S. Svarc, Topology for Physicists (Springer, Berlin, Heidelberg, 1994) 86. K. Tapp, Matrix Groups for Undergraduates (Amer. Math. Soc., Providence, RI, 2005) 87. B. Thaller, The Dirac Equation (Springer, New York, NY, 1992) 88. W. Thirring, Lehrbuch der mathematischen Physik I–IV (Springer, Wien, 1979) 89. V.S. Varadarajan, Geometry of Quantum Theory, 2. Auflg. (Springer, New York, NY, 1985) 90. J. von Neumann, Mathematical Foundations of Quantum Mechanics, 12. Auflg. (Princeton University Press, Princeton, NJ, 1996) 91. J. Weidmann, Linear Operators in Hilbert Spaces (Springer, New York, NY, 1980) 92. D. Werner, Funktionalanalysis, 6. Auflg. (Springer, Berlin, 2007) 93. E. Wigner, Gruppentheorie und ihre Anwendung auf die Quantenmechanik der Atomspektren (Vieweg, Braunschweig, 1977) 94. W.K. Tung, Group Theory in Physics (World Scientific Publishing, Singapore, 1985) 95. K. Yosida, Functional Analysis (Springer, Berlin, 1965) 96. D.P. Zelobenko, Compact Lie Groups and Their Representations (Amer. Math. Soc. Transl., Providence, RI, 1973)
Sachverzeichnis
A abelsche Gruppe, 118 abgeschlossener Operator, 4 abschließbar, 6 Abschluss (eines linearen Operators), 6 adjungierte Darstellung, 203, 211, 278 adjungierter Operator, 18 Algebrenhomomorphismus, 56 allgemeine L ORENTZgruppe, 149 Assoziativgesetz, 54, 118 Ausreduzieren, 307 Automorphismengruppe, 119 Automorphismus, 142 B Bahn, 145 BAKER-C AMPBELL-H AUSDORFF-Formel, 274 BANACHalgebra, 54 mit Eins, 54 Bikommutant, 89 Bikommutantensatz, 89 C C ∗ -Algebra, 54 C ASIMIR-Operator, 273, 308 C AYLEY-Transformierte, 27 Charakter, 212 C LEBSCH -G ORDAN-Zerlegung, 261 C ONDON -S HORTLEY-Konvention, 326 D Darstellung, 56, 107, 136, 207, 208 ∗-, 56 adjungierte, 211, 278 einer L IE-Algebra, 272 induzierte, 226, 231 irreduzible, 215 linksreguläre, 251
lokale, 281 natürliche, 209 rechtsreguläre, 251 reduzible, 215 stetige, 239 triviale, 209 unitäre, 212 vollreduzible, 216 Darstellungen äquivalente, 212, 273 Darstellungsmodul, 208 Defektindizes, 27 Defekträume, 27 dicht definiert, 7 Dichtematrix, 64 Diedergruppe, 127 Differentialoperator formal selbstadjungierter, 26 D IRACgleichung, 16 direkte Summe (von Darstellungen), 214 direktes Produkt, 141 E Eichtransformationen, 139 Eigenfunktionen verallgemeinerte, 94 eigentliche L ORENTZ-Gruppe, 151 eigentliche orthochrone L ORENTZ-Gruppe, 151 Ein-Parameter-Untergruppe, 184, 188 einfach-zusammenhängend, 287 Einschränkung, 72 Einselement, 54 endliche Gruppe, 118 Entartung, 87 Epimorphismus (von Gruppen), 124 erste Resolventengleichung, 14 Erweiterung, 6
339
340 F formal adjungiert, 23 formal selbstadjungiert, 26 Funktionalkalkül, 67 messbarer, 77 stetiger, 70 G Generator infinitesimaler, 97 Generatoren infinitesimale, 195, 197, 198 Generatoren (der L ORENTZgruppe), 155 Gewicht (einer Darstellung von SU(2)), 294 Gitter, 141 G-Modul, 219 G-Morphismus, 219 Graph eines linearen Operators, 4 Graphennorm, 3 Gruppe, 118 abelsche, 118 endliche, 118 orthogonale, 121 spezielle orthogonale, 122 symplektische, 122 unimodulare, 237 unitäre, 122 Gruppenalgebra, 227 Gruppenhomomorphismus, 124 lokaler, 280 H H AAR-Integral linkes, 232 normiertes, 236 rechtes, 232 H AARsches Maß, 232 H AMILTONoperator Symmetriegruppe des, 220 harmonische Analyse, 259 H EISENBERGgruppe, 263 H ILBERTsche Summe, 43 homogener Raum, 317 I immersierte L IE-Gruppen, 193 Index (einer Untergruppe), 143 induzierte Darstellung, 226, 231 infinitesimale Generatoren, 195, 197, 198 infinitesimaler Generator, 97 innerer Automorphismus, 125 invariant, 134 unter einer Darstellung, 215
Sachverzeichnis invariante Teilräume, 72 invers-invariant, 232 Inverses Element, 118 Inversion, 231 Involution, 54 irreduzibel, 215 irreduzible Darstellung einer L IE-Algebra, 272 Isomorphismus von L IE-Algebren, 194 von Gruppen, 124 isotypisch, 309 K kanonische Basis, 306, 309, 310 Klassenfunktion, 268 Klassenzahl, 269 Kommutant, 89 kommutativ, 54 Kommutativgesetz, 118 Kommutatorprodukt, 182 komplexes Maß, 44 Komplexifizierung, 313 kongruent, 126 konjugierte Gruppenelemente, 145 konjugierte Quaternion, 170 Konjugiertenklasse, 145 kristallographische Punktgruppe, 171 Kugelflächenfunktion, 322 L L IE-Algebra, 182 einer linearen L IE-Gruppe, 183 L IE-Algebren-Homomorphismus, 194 L IE-Gruppe lokale, 174 L IE-Gruppe allgemeine, 180 lineare, 177 L IE-Teilalgebra, 183 L IE-Untergruppe, 193 lineare L IE-Gruppe, 177 Linearisierung, 277, 283 linkes H AAR-Integral, 232 Links-Aktion, 129 Links-Nebenklasse, 143 linksinvariant, 232 Linksoperation, 129 linksreguläre Darstellung, 251 Linkstranslation, 231 Logarithmus (einer Matrix), 177 lokale Darstellung, 281 lokaler Gruppenhomomorphismus, 280 L ORENTZ-Gruppe eigentliche, 151
Sachverzeichnis eigentliche orthochrone, 151 orthochore, 151 orthochrone, 151 L ORENTZgruppe allgemeine, 149 L ORENTZtransformation, 149 orthochrone, 150 M Matrixdarstellung, 209 einer L IE-Algebra, 272 triviale, 209 Matrixelement reduziertes, 329 Matrixelemente, 45, 84, 327 messbarer Funktionalkalkül, 77 messbarer Raum, 42 Modularfunktion, 237 Monomorphismus (von Gruppen), 124 Multiplikation, 53 Multiplizität, 87 μ-summierbar (bzgl. eines komplexen Maßes), 44
341 P PAULIsche Spinmatrizen, 160 Permutationen, 119 P OINCARÉgruppe, 202 Polarisationsgleichung, 45 Polarzerlegung, 109 positiv semidefinit, 74, 111 Produkt direktes, 141 Q quadratische Form, 45 Quaternionen, 166 rein-imaginäre, 170
N natürliche Darstellung, 209 Neutrales Element, 118 normierte Algebra, 54 mit Eins, 54
R Raumspiegelung, 151 Realisierung, 8 maximale, 9 minimale, 9 Realteil (einer Quaternion), 170 rechtes H AAR-Integral, 232 rechts-invariant, 232 Rechts-Nebenklasse, 143 rechtsreguläre Darstellung, 251 Rechtstranslation, 231 reduzibel, 215 reduziertes Matrixelement, 329 Resolventengleichung erste, 14
O Operator H ERMITEscher, 25 abgeschlossener, 4 abschließbarer, 6 adjungierter, 18 positiver, 74, 111 selbstadjungierter, 25 symmetrischer, 25 wesentlich selbstadjungierter, 25 Operatorkonvergenz starke, 81 Orbit, 145 Ordnung einer Gruppe, 118 eines Gruppenelements, 142 Ordnungsrelation, 63 orthochore L ORENTZ-Gruppe, 151 orthochrone L ORENTZ-Gruppe, 151 orthogonale direkte Summe, 43 orthogonale Gruppe der Signatur ( p, q), 121 Ortsoperator, 8
S Satz vom abgeschlossenen Graphen, 5 Satz von C AYLEY-H AMILTON, 108 Satz von S TONE, 101 Satz von S TONE –W EIERSTRASS, 260 schiefadjungierte Darstellung einer L IE-Algebra, 272 Schiefkörper, 166 schwache Stetigkeit, 101 selbstadjungiert, 25, 56 selbstadjungierte Darstellung einer L IE-Algebra, 272 S OBOLEWraum, 10 Spektraldarstellung, 87 Spektraler Abbildungssatz, 73 Spektralintegral, 50, 59 Spektralmaß, 39 Spektralmaß, 42 Spektralräume, 80 Spektralsatz, 76, 89 Spektralschar, 52, 95 spezielle orthogonale Gruppe der Signatur ( p, q), 122
342 spezielle unitäre Gruppe der Signatur ( p, q), 122 Stabilisator, 146, 317 Standarddarstellung, 209 starke Operatorkonvergenz, 81 stetiger Funktionalkalkül, 70 S TONE –W EIERSTRASS Satz von, 260 S TONEsche Formel, 112 Strukturkonstanten, 194 Symmetriegruppe, 126, 130 Symmetriegruppe des H AMILTONoperators, 220 symmetrische Gruppe, 119 symplektische Gruppe, 122 System von Imprimitivitäten, 227 T Teilalgebra, 56 Teilraum T -invarianter, 51 irreduzibler, 215 reduzibler, 215 Tensoroperator, 211, 292 Tensorprodukt von Darstellungen, 214, 242 Torus, 200 Totalspiegelung, 151 Träger eines Spektralmaßes, 78 Trägerraum, 208 Transformationen G-orthogonale, 121 G-unitäre, 121 transitiv, 146 Transposition, 138 triviale Darstellung, 209 triviale Matrixdarstellung, 209 T ROTTERsche Produktformel, 276
Sachverzeichnis U Überlagerung, 271, 287 Überlagerungsabbildungen, 165 unimodular, 237 unitäre Darstellung, 212 unitäre Gruppe, 120 unitäre Gruppe der Signatur ( p, q), 122 unitäre Transformationsgruppe, 97 universelle Überlagerung, 165, 290 Untergruppe, 118 V Vektorteil (einer Quaternion), 170 Vektorzustand, 64 verallgemeinerte Eigenfunktionen, 94 Verknüpfung, 118 vertauschbar, 94 Vertauschbarkeit, 51 Vertauschungsrelationen, 196 Vielfachheit, 87 vollreduzibel, 216 vollreduzible Darstellung einer L IE-Algebra, 272 W wesentlich selbstadjungiert, 25 W EYL-Operator, 244 W EYL-Relationen, 106 W IGNER-E CKART-Theorem, 329 Z Zeitspiegelung, 151 Zentrum, 142 zusammenhängend, 148 Zusammenhangskomponente, 148 der Eins, 189 Zusammenhangskomponenten der L ORENTZgruppe, 151 Zustand, 64 zyklischer Vektor, 225