120 92 10MB
German Pages 691 Year 2021
Michael Ruhrländer
Allgemeine Relativitätstheorie Schritt für Schritt Eine Einführung mit Details, Beispielen und Aufgaben
Allgemeine Relativitätstheorie Schritt für Schritt
Michael Ruhrländer
Allgemeine Relativitätstheorie Schritt für Schritt Eine Einführung mit Details, Beispielen und Aufgaben
Michael Ruhrländer Mainz, Rheinland-Pfalz, Deutschland
ISBN 978-3-662-62082-3 ISBN 978-3-662-62083-0 (eBook) https://doi.org/10.1007/978-3-662-62083-0 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von allgemein beschreibenden Bezeichnungen, Marken, Unternehmensnamen etc. in diesem Werk bedeutet nicht, dass diese frei durch jedermann benutzt werden dürfen. Die Berechtigung zur Benutzung unterliegt, auch ohne gesonderten Hinweis hierzu, den Regeln des Markenrechts. Die Rechte des jeweiligen Zeicheninhabers sind zu beachten. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag, noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral. Planung/Lektorat: Lisa Edelhaeuser Springer Spektrum ist ein Imprint der eingetragenen Gesellschaft Springer-Verlag GmbH, DE und ist ein Teil von Springer Nature Die Anschrift der Gesellschaft ist: Heidelberger Platz 3, 14197 Berlin, Germany
Vorwort
Einführende Bemerkungen Die Allgemeine Relativitätstheorie (ART), die Einstein im Jahr 1915 erstmals der Öffentlichkeit präsentiert hat, gilt bis heute als eine der größten Errungenschaften des menschlichen Geistes. Sie beschreibt eine allgegenwärtige Erscheinung der uns umgebenen Erfahrungswelt, nämlich die Gravitation, und nutzt dazu eine elegante mathematische Darstellungsmethode, und zwar die Differenzialgeometrie in einer gekrümmten Raumzeit. Zusammen mit der Quantenfeldtheorie bildet die Allgemeine Relativitätstheorie das Fundament der modernen Physik, und ihre Vorhersagen sind in den mehr als hundert Jahren ihres Bestehens in zahlreichen Experimenten mit immer größerer Genauigkeit bestätigt worden. Insbesondere ihre Anwendung in Astrophysik und Kosmologie hat in den letzten Jahrzehnten dazu geführt, dass eine Vielzahl von astrophysikalischen Erscheinungen, wie z. B. die Entstehung und Entwicklung unseres Universums, die Existenz von Pulsaren und Schwarzen Löchern und das Phänomen der Gravitationswellen, immer besser verstanden werden. Gerade das zuletzt genannte Gebiet hat im Jahr 2015 einen spektakulären Höhepunkt erreicht, als es nach jahrzehntelanger Optimierung der benötigten Messinstrumente erstmals gelang, Gravitationswellen auf der Erde nachzuweisen. Doch auch im täglichen Leben begegnet uns die Einstein’sche Gravitationstheorie, z. B. sorgt ihre Berücksichtigung bei der Entwicklung des Global-Positioning-Systems dafür, dass unsere Navigationssysteme korrekt funktionieren. Einordnung des Buches und Zielgruppe Die wachsende Bedeutung der Einstein’schen Gravitationstheorie in den letzten Jahrzehnten hat auch dazu geführt, dass heute eine große Auswahl von Fachbüchern über die Allgemeine Relativitätstheorie mit teilweise unterschiedlichen Schwerpunkten am Markt zur Verfügung steht. Das vorliegende Lehrbuch ist für Studenten der Physik geschrieben, die sich im Masterstudium oder im fortgeschrittenen Bachelorstudium befinden, und beinhaltet eine übersichtliche Einführung in die Allgemeine Relativitätstheorie. Es unterscheidet sich hauptsächlich durch seine detaillierten Darstellungen von anderen einführenden Texten. So leiten wir – wenn immer möglich – die präsentierten Resultate V
VI
Vorwort
sorgfältig und ausführlich her. In den wenigen Fällen, wo wir auf detaillierte Ableitungen verzichten, verweisen wir auf geeignete Sekundärliteratur, in der die ausgelassenen Deduktionen wörtlich oder sinngemäß behandelt werden und die im Literaturverzeichnis am Ende des Buches aufgelistet ist. Auch haben wir uns bemüht, auf Phrasen wie „es kann gezeigt werden, dass…“ oder schlimmer noch „wie man leicht zeigt, gilt…“ zu verzichten, und haben dem Leser nur Rechenschritte überlassen, die mit wenig oder sehr überschaubarem Aufwand abzuarbeiten sind. Das ausschließliche Ansinnen dieses Textes besteht darin, die einführenden Themeninhalte der Allgemeinen Relativitätstheorie möglichst einfach und verständlich zu vermitteln, auf besondere Originalität oder komplette Vollständigkeit wird daher überwiegend verzichtet. Voraussetzungen Um den Darstellungen in diesem Buch folgen zu können, sind physikalische und mathematische Voraussetzungen in dem Umfang wünschenswert, wie man sie in den ersten zwei Jahren eines Bachelorstudiums lernt. Vorkenntnisse in der Lagrange’schen Mechanik, in der Elektrodynamik und in der Speziellen Relativitätstheorie sind für ein rasches Fortschreiten von Vorteil, aber nicht zwingend erforderlich, da wir die für uns wesentlichen Punkte aus diesen Themenbereichen am Anfang des Buches zur Wiederholung bereitstellen. An mathematischen Fähigkeiten wird im Wesentlichen ein gutes Verständnis der Linearen Algebra sowie der Analysis im Rn erwartet, Kenntnisse über komplexe Zahlen sind von Vorteil. Alle weiterführenden, zum Erlernen der Allgemeinen Relativitätstheorie notwendigen physikalischen und mathematischen Grundlagen entwickeln wir detailliert im ersten Drittel des Buches. So werden z. B. keinerlei Vorkenntnisse in der Differenzialgeometrie erwartet. Die für die ART benötigten Konstrukte aus der Tensorrechnung und der Analysis auf Semi-Riemann’schen Mannigfaltigkeiten sowie aus dem Differenzialformenkalkül werden sorgfältig eingeführt und ausführlich erörtert. Aufbau des Buches Das Buch ist in fünf Einheiten aufgeteilt. • Im ersten Teil behandeln wir die Grundlagen der Speziellen Relativitätstheorie und deren Folgerungen für die relativistische Mechanik und Elektrodynamik. Mithilfe der Tensorrechnung auf dem Minkowski-Raum zeigen wir die Lorentz-Invarianz der Elektrodynamik. Da sich die Rechnungen mit Tensoren durch den gesamten Text ziehen, stellen wir den Tensorkalkül schon in diesem Teil bewusst ausführlich dar. Wir entwickeln den Lagrange-Formalismus für die Elektrodynamik und definieren für die Hauptquellen des Gravitationsfeldes (ideale Fluide, Staub, elektrische Ladungen) die entsprechenden Energie-Impuls-Tensoren (im Minkowski-Raum). • Der zweite Teil startet mit einem Rückblick auf wichtige Ergebnisse des Newton’schen Gravitationsmodells und macht deutlich, dass diese Theorie nicht mit der Speziellen Relativitätstheorie vereinbar und somit ein neuer Ansatz für die
Vorwort
VII
Beschreibung der Gravitation erforderlich ist. Dazu muss die Tensorrechnung auf differenzierbare Mannigfaltigkeiten verallgemeinert sowie der Cartan’sche Differenzialformenkalkül eingeführt werden. Wir zeigen, dass die Raumzeit durch eine Lorentz-Mannigfaltigkeit modelliert werden kann, und leiten die Größen zur Berechnung von Krümmungen solcher Mannigfaltigkeiten her. Die Cartan’schen Strukturgleichungen und Killing-Vektoren sind nützliche Hilfsmittel, um in späteren Kapiteln exakte Lösungen der Einstein-Gleichungen abzuleiten. Bei den meisten differenzialgeometrischen Größen haben wir einen zweifachen Ansatz gewählt und sie sowohl abstrakt (koordinatenfrei) als auch koordinatenbasiert dargestellt. Wir hoffen, damit einen Betrag für die Verständigung zwischen der Sprache der Mathematiker (koordinatenfrei) und der der Physiker (koordinatenbasiert) geleistet zu haben. • Im dritten Teil, der überwiegend physikalisch geprägt ist, leiten wir zunächst die Einstein-Gleichungen heuristisch her und anschließend mit dem Lagrange-Formalismus nochmals etwas analytischer. Wir zeigen, dass sie im schwachen statischen Gravitationsfeld in die Newton’schen Schwerkraftgesetze übergehen. Mithilfe des Differenzialformenkalküls leiten wir die äußere Schwarzschild-Lösung der EinsteinGleichungen im Vakuum her, die schon ein Jahr nach Einsteins Veröffentlichung der ART gefunden wurde. Die Schwarzschild-Metrik führt uns zu den „klassischen“ Tests (Periheldrehung des Merkurs, gravitative Rotverschiebung, Lichtablenkung an der Sonne) der Allgemeinen Relativitätstheorie in unserem Sonnensystem. Ein abschließendes längeres Kapitel behandelt die Theorie der Gravitationswellen und beschreibt auch das Ringen um die erste Detektion einer solchen Welle auf der Erde im Jahr 2015. • Zu Beginn des vierten Teils begeben wir uns in das Innere eines Sterns und leiten die innere Schwarzschild-Metrik her. Wir untersuchen anschließend einige Eigenschaften nichtrotierender Schwarzer Löcher und führen dazu in der Schwarzschild-Raumzeit die Eddington-Finkelstein- bzw. Kruskal-Koordinaten ein. Die Reissner-NordströmLösung beschreibt die Eigenschaften geladener Schwarzer Löcher, die wir mit PenroseDiagrammen visualisieren. Um die Kerr-Lösung für rotierende Schwarze Löcher aus der Schwarzschild-Lösung herzuleiten, benutzen wir Nulltetraden und geschickte Koordinatentransformationen. Wir beschreiben einige Eigenschaften rotierender Schwarzer Löcher und zeigen, dass man (theoretisch) mit dem Penrose-Prozess Energie aus der Ergosphäre eines rotierenden Schwarzen Lochs gewinnen kann. • Der letzte und fünfte Teil beschäftigt sich mit der Anwendung der Allgemeinen Relativitätstheorie auf unser Universum. Wir plausibilisieren anhand von astronomischen Beobachtungen, dass unser Universum auf den größten Skalen homogen und isotrop ist. Basierend auf diesen beiden Symmetrien leiten wir, wieder mit dem Differenzialformenkalkül, die Robertson-Walker-Metrik sowie die Friedmann-Gleichungen her. Mithilfe der Friedmann-Gleichungen diskutieren wir mögliche Entwicklungen der Energiedichten in unserem Universum und damit einige Ausdehnungs- bzw. Zusammenziehungsvarianten des Universums.
VIII
Vorwort
Bedienungsanleitung Das Buch ist nicht nur inhaltlich, sondern auch textlich strukturiert. Quer durch alle Kapitel ziehen sich nummerierte Beispiele und Aufgabenstellungen. Aufgaben und Lösungen Um den Haupttext des Buches nicht allzu sehr mit Details zu überfrachten, haben wir viele, meist technische Sachverhalte als Aufgaben in die einzelnen Kapitel eingefügt. Weitere Aufgabentypen enthalten Beispiele oder auch konkrete Berechnungen von Sachverhalten. Für alle gestellten Aufgaben findet man ausführliche Darstellungen der erwarteten Ergebnisse, die im Text jeweils direkt nach den Aufgabenstellungen aufgelistet sind. Hier weichen wir von der üblichen Praxis ab, die die Lösungen oftmals in einen Anhang am Ende des Buches verbannt. Aber natürlich sollte man auch in diesem Lehrbuch immer zunächst versuchen, die Aufgaben selbstständig zu lösen, und anschließend seine gefundenen Ergebnisse mit den Lösungen im Text abgleichen. Kapitel mit physikalischem Inhalt In den physikalisch orientierten Kapiteln strukturieren wir die Inhalte überwiegend durch Abschnitte, Unterabschnitte und Paragraphen und benutzen für die Darstellung hauptsächlich Fließtext und anschauliche, durchnummerierte Abbildungen. Wichtige physikalische Aussagen und Zusammenfassungen werden durch graue Unterlegungen textlich hervorgehoben. Kapitel mit mathematischem Inhalt Bei der Darstellung der mathematischen Lerninhalte, die hauptsächlich den zweiten Teil des Buches ausmachen, orientieren wir uns an der üblichen Strukturierung in der mathematischen Literatur, indem wir überwiegend die Konstrukte Definition, Satz, Bemerkung, Lemma usw. jeweils ebenfalls durchnummeriert einsetzen. Mit dieser „strengen“ Strukturierung wird die Referenzierung aus den physikalischen Teilen des Buches auf mathematische Aussagen erleichtert. Danksagung Herzlich bedanken möchte ich mich bei Dominik Hosefelder von der Universität Mainz. Er hat große Teile des Textes sehr gründlich durchgesehen und eine Vielzahl von fachlichen und sprachlichen Verbesserungen vorgeschlagen, die ich ganz überwiegend im Buch berücksichtigt habe. Mein Dank geht auch an den Springer-Verlag, hier insbesondere an Dr. Lisa Edelhäuser und Stella Schmoll für die hervorragende Zusammenarbeit.
Vorwort
IX
Schlusswort Obwohl ich mich sehr darum bemüht habe, das Buch fehlerfrei zu gestalten, wird es vermutlich einige (hoffentlich wenige) fehlerhafte Stellen im Text geben. Die möglichen Fehlerstellen und die dazugehörigen Richtigstellungen werden in einer stets aktuellen Errataliste auf meiner Homepage www.michael-ruhrlaender.de einsehbar sein. Dort werde ich auch etwaige Zusatzmaterialien zum Buch veröffentlichen. Dr. Michael Ruhrländer
Anmerkungen zur Notation und Vorzeichenkonvention
Textliche Hervorhebungen Im Text werden neu eingeführte Begriffe mit fetten Buchstaben hervorgehoben. Soll eine Passage besonders betont werden, so schreiben wir die relevanten Wörter mit schräggestellten Buchstaben. Indizierung der Koordinaten • Die Punkte der Raumzeit haben nach Wahl eines Koordinatensystems S (in der Speziellen Relativitätstheorie) bzw. einer Koordinatenumgebung (Up, h) (in der Allgemeinen Relativitätstheorie) vier Koordinaten, die wir abkürzend mit x bzw. x µ (µ = 0, 1, 2, 3) bezeichnen wollen, z. B. gilt im Minkowski-Raum x = x µ = (t, x, y, z) in kartesischen oder
x = x µ = (t, r, ϑ, ϕ)
in Kugelkoordinaten. Dabei kann die Kurzschreibweise x µ entweder den Raumzeitpunkt x bzw. p oder auch nur eine einzelne Koordinate bezeichnen, und es ist aus dem Zusammenhang zu schließen, welcher Fall jeweils vorliegt. • Im dreidimensionalen euklidischen Raum R3 indizieren wir die Koordinaten mit lateinischen Buchstaben xi, wobei i die Werte 1,2,3 annehmen ′ ′ kann. 1 • In einem zweiten Koordinatensystem S bzw. Up , h kennzeichnen wir die ′ Koordinaten eines Raumzeitpunkts als x µ . Diese Schreibweise soll verdeutlichen, dass der betrachtete Raumzeitpunkt x (bzw. p) sich bei einem Wechsel des Koordinatensystems selbst nicht verändert, seine Koordinaten im Allgemeinen schon.
XI
XII
Anmerkungen zur Notation und Vorzeichenkonvention
Darstellung von Vektoren und Tensoren • Dreidimensionale Vektoren im euklidischen Raum kennzeichnen wir mit einem Pfeil über dem definierenden Buchstaben, z. B. υ für den Geschwindigkeitsvektor bzw. E für die elektrische Feldstärke. Für die Komponenten eines dreidimensionalen Vektors υ benutzen wir folgende Schreibweisen 1 υ � � υ� = υ i = υ 1 , υ 2 , υ 3 = υ 2 , υ3 d. h., wir unterscheiden nicht zwischen Zeilen- und Spaltenvektoren. In der Indexschreibweise tragen die Vektorkomponenten hochgestellte Indizes. • Für die Darstellung von Vierervektoren und Tensoren benutzen wir überwiegend große Buchstaben, z. B. U für die Vierergeschwindigkeit oder R für den RiemannTensor. • Differenzialformen (auch Einsformen) kennzeichnen wir überwiegend mit kleinen griechischen Buchstaben. • Der Buchstabe g steht für den metrischen Tensor der allgemeinen Raumzeit, das η für den metrischen Tensor des Minkowski-Raumes. • Den räumlichen Anteil eines Vierervektors schreiben wir wie die dreidimensionalen Die räumlichen Komponenten von Vierervektoren Vektoren mit einem Pfeil, z. B. U. werden wie dreidimensionale Vektoren mit lateinischen Buchstaben indiziert. • Im Vierdimensionalen kennzeichnen wir die Komponenten eines Vierervektors V durch V = V µ = V 0, V 1, V 2, V 3 , S
wobei S bzw. (U, h) das benutzte Koordinatensystem bezeichnet. Ist das Koordinatensystem nicht relevant bzw. geht es eindeutig aus dem Zusammenhang hervor, lassen wir das S weg. ′ ′ • In einem weiteren Koordinatensystem S‘ bzw. Up , h kennzeichnen wir die Komponenten eines Vektors durch ′ ′ ′ ′ ′ V =′ V µ = V 0 , V 1 , V 2 , V 3 . S • Für die Indizierung der Vektorkomponenten (genauso der Komponenten beliebiger Tensoren) benutzen wir griechische Buchstaben μ, v, ρ, die die Werte 0,1, 2, 3 bzw. t, x, y, z bzw. t, r, ϑ, ϕ, usw. annehmen können. • Wenn wir zur Darstellung eines dreidimensionalen Vektors die Schreibweise υ� = υ i bzw. eines vierdimensionalen Vektors die Schreibweise V = V µ benutzen, muss jeweils aus dem Zusammenhang geschlossen werden, ob wir den ganzen Vektor oder nur eine (beliebige) Komponente meinen. Diese Systematik übertragen wir auf vierdimensionale Tensoren, so beschreibt zum Beispiel der Ausdruck gμv entweder das Objekt „metrischer Tensor“ oder eine beliebige Tensorkomponente von g.
Anmerkungen zur Notation und Vorzeichenkonvention
XIII
• Allgemeine Basisvektoren im Minkowski- bzw. Tangentialraum schreiben wir mit kleinen lateinischen Buchstaben, die unten indiziert werden, z. B. B = eµ . • Für die speziellen Koordinatenbasisvektoren im Tangentialraum benutzen wir die Symbole B = ∂µ .
• Allgemeine duale Basiseinsformen im Minkowski- bzw. Tangentialraum schreiben wir mit kleinen lateinischen Buchstaben, die oben indiziert werden, z. B. B = (eµ ). • Für die duale Basis der Koordinatenbasisvektoren benutzen wir die Symbole B = (dx µ ). Abweichungen von diesen Schreibweisen werden im Text angekündigt und erläutert. Vorzeichenkonvention In diesem Buch verwenden wir die sogenannte Landau-Liftschitz-Vorzeichenkonvention, siehe z. B. [17, 20]. Darunter versteht man folgende Festlegungen: + ++, • Die Signatur der Metrik ist − kartesischen Komponenten −1 0 0 � � 0 1 0 η = ηµν = 0 0 1 0 0 0
z. B. gilt für die Minkowski-Metrik in
0 0 = diag(−1, 1, 1, 1). 0 1
dazu trifft man in der Quantenfeldtheorie häufig die Vereinbarung Im Gegensatz ηµν = diag(1, −1, −1, −1). • Der Riemann-Tensor R wird durch R(X, Y ) = ∇X ∇Y − ∇Y ∇X − ∇[X, Y ] mit den Komponenten µ
µ
µ
µ τ µ τ Rρν = ∂ν Ŵρ − ∂ Ŵνρ + Ŵρ Ŵντ − Ŵνρ Ŵτ
definiert. • Die Komponenten des Ricci-Tensors werden durch ρ Rµν = Rµρν
festgelegt. • Die Einstein-Gleichungen haben auf der rechten Seite ein Pluszeichen: 1 Rµν − gµν R = 8π GTµν 2
Inhaltsverzeichnis
Teil I Spezielle Relativitätstheorie 1
Grundlagen der Speziellen Relativitätstheorie . . . . . . . . . . . . . . . . . . . . . . . 3 1.1 Das Newton’sche Relativitätsprinzip. . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2 Das Einstein’sche Relativitätsprinzip. . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.3 Relativität der Gleichzeitigkeit, Zeitdilatation. . . . . . . . . . . . . . . . . . . . . 10 1.4 Längenkontraktion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 1.5 Doppler-Effekt in der Speziellen Relativitätstheorie. . . . . . . . . . . . . . . . 16 1.6 Lorentz-Transformationen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 1.7 Raumzeitintervalle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 1.8 Lorentz- und Poincaré-Gruppe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2
Die Raumzeit der Speziellen Relativitätstheorie. . . . . . . . . . . . . . . . . . . . . . 39 2.1 Indexnotation und Einstein’sche Summenkonvention. . . . . . . . . . . . . . . 39 2.2 Minkowski-Raum. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 2.3 Semi-Skalarprodukt im Minkowski-Raum . . . . . . . . . . . . . . . . . . . . . . . 43 2.4 Transformationen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 2.5 Weltlinien in der Raumzeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3
Relativistische Mechanik. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 3.1 Impuls, Masse, Energie, Kraft. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 3.2 Natürliche Einheiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 3.3 Vierergeschwindigkeit, Viererimpuls. . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 3.4 Relativistische Dynamik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4
Tensorrechnung im Minkowski-Raum. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 4.1 Dualraum und Einsformen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 4.2 Tensoren vom Rang (0, N). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 4.3 Tensoren vom Rang (M, 0). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80 4.4 Tensoren vom Rang (M, N). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81 4.5 Kontraktion von Tensoren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 4.6 Ableitungen von Tensoren im Minkowski-Raum . . . . . . . . . . . . . . . . . . 84 XV
XVI
Inhaltsverzeichnis
5 Elektrodynamik. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 5.1 Maxwell-Gleichungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 5.2 Feldstärketensor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93 5.3 Lorentz-Invarianz der Maxwell-Gleichungen. . . . . . . . . . . . . . . . . . . . . 96 5.4 Lorentz-Kraft. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100 5.5 Lorentz-invarianter Lagrange-Formalismus . . . . . . . . . . . . . . . . . . . . . . 101 6
Energie-Impuls-Tensoren in der Speziellen Relativitätstheorie. . . . . . . . . . 113 6.1 Energie-Impuls-Tensor des elektromagnetischen Feldes. . . . . . . . . . . . . 113 6.2 Energie-Impuls-Tensor für Staub. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116 6.3 Ideale Fluide. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124 6.4 Allgemeine Energie-Impuls-Tensoren. . . . . . . . . . . . . . . . . . . . . . . . . . . 129
Teil II Grundlagen der Allgemeinen Relativitätstheorie 7
Gravitation und Raumzeitmodell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133 7.1 Newton’sche Gravitation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 7.2 Schwere und träge Masse, Äquivalenzprinzip. . . . . . . . . . . . . . . . . . . . . 140 7.3 Gravitativer Doppler-Effekt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 7.4 Lichtablenkung an der Sonne im Newton’schen Gravitationsfeld. . . . . . 144 7.5 Gravitation und Krümmung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145 7.6 Allgemeine Koordinatensysteme. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
8 Mannigfaltigkeiten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 8.1 Topologische und differenzierbare Mannigfaltigkeiten. . . . . . . . . . . . . . 157 8.2 Differenzierbare Abbildungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 8.3 Tangentialraum. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168 8.4 Basis des Tangentialraumes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 8.5 Vektorfelder. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175 9
Tensorrechnung auf Mannigfaltigkeiten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 9.1 Einsformen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 183 9.2 Tensorfelder. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186 9.3 Kontraktion und Quotientenregel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192 9.4 Abbildungen zwischen Mannigfaltigkeiten. . . . . . . . . . . . . . . . . . . . . . . 194 9.5 Tensoranalysis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 9.6 Lie-Ableitung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
10 Differenzialformen auf Mannigfaltigkeiten. . . . . . . . . . . . . . . . . . . . . . . . . . 215 10.1 Differenzialformen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 10.2 Dachprodukt. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218 10.3 Die äußere (Cartan’sche) Ableitung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 10.4 Integration auf Mannigfaltigkeiten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 229 10.5 Der Satz von Stokes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236 10.6 Differenzialformen und klassische Vektoranalysis . . . . . . . . . . . . . . . . . 244
Inhaltsverzeichnis
XVII
11 Semi-Riemann’sche Mannigfaltigkeiten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251 11.1 Die Metrik. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251 11.2 Längen, Integration und Isometrien. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257 11.3 Zusammenhang und kovariante Ableitung. . . . . . . . . . . . . . . . . . . . . . . . 265 11.4 Der Levi-Civita-Zusammenhang. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 274 11.5 Paralleltransport und Geodäten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278 11.6 Normalkoordinaten und Äquivalenzprinzip. . . . . . . . . . . . . . . . . . . . . . . 294 12 Krümmung der Raumzeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 299 12.1 Paralleltransport und Krümmung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300 12.2 Riemann’scher Krümmungstensor. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303 12.3 Symmetrien des Riemann’schen Krümmungstensors. . . . . . . . . . . . . . . 309 12.4 Ricci-Tensor und Krümmungsskalar. . . . . . . . . . . . . . . . . . . . . . . . . . . . 314 12.5 Zusammenhangs- und Krümmungsformen, Cartan’sche Strukturgleichungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318 12.6 Symmetrien und Killing-Vektoren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 332 Teil III Einstein-Gleichungen, Schwarzschild-Lösung, Gravitationswellen 13 Physikalische Gesetze in der Raumzeit, Einstein-Gleichungen. . . . . . . . . . 347 13.1 Kovarianzprinzip. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347 13.2 Energie-Impuls-Tensoren in der Lorentz-Mannigfaltigkeit. . . . . . . . . . . 350 13.3 Newton’scher Grenzfall. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 352 13.4 Einstein’sche Feldgleichungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 354 13.5 Interpretation der Einstein-Gleichungen. . . . . . . . . . . . . . . . . . . . . . . . . 360 13.6 Ableitung der Einstein-Gleichungen mit dem Lagrange-Formalismus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 366 14 Die Schwarzschild-Lösung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375 14.1 Äußere Schwarzschild-Metrik. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 375 14.2 Der Riemann-Tensor der (äußeren) Schwarzschild-Raumzeit. . . . . . . . . 386 14.3 Physikalische Interpretation der (äußeren) Schwarzschild-Lösung. . . . . 388 14.4 Isotrope Schwarzschild-Koordinaten. . . . . . . . . . . . . . . . . . . . . . . . . . . . 390 14.5 Birkhoff’sches Theorem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 393 14.6 Die Killing-Vektoren der Schwarzschild-Metrik. . . . . . . . . . . . . . . . . . . 397 15 Klassische Tests der Allgemeinen Relativitätstheorie . . . . . . . . . . . . . . . . . . 401 15.1 Kepler-Bewegung in der Newton’schen Gravitationstheorie. . . . . . . . . . 401 15.2 Geodäten in der Schwarzschild-Raumzeit. . . . . . . . . . . . . . . . . . . . . . . . 408 15.3 Die Periheldrehung des Merkurs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 417 15.4 Lichtablenkung in der Schwarzschild-Raumzeit. . . . . . . . . . . . . . . . . . . 421 15.5 Gravitative Rotverschiebung in der Schwarzschild-Raumzeit. . . . . . . . . 425
XVIII
Inhaltsverzeichnis
16 Gravitationswellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 431 16.1 Einstein-Gleichungen für schwache Gravitationsfelder. . . . . . . . . . . . . . 431 16.2 Ausbreitung von Gravitationswellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . 437 16.3 Beobachtung von Gravitationswellen . . . . . . . . . . . . . . . . . . . . . . . . . . . 441 16.4 Erzeugung von Gravitationswellen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445 16.5 Gravitationswellenenergie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 450 16.6 Nachweis von Gravitationswellen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 469 Teil IV Gravitationskollaps und Schwarze Löcher 17 Gravitationskollaps und die innere Schwarzschild-Metrik . . . . . . . . . . . . . 485 17.1 Einführendes Beispiel: Innere Lösung in der Elektrodynamik. . . . . . . . 486 17.2 Innere Schwarzschild-Metrik. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 488 17.3 Innere Schwarzschild-Metrik für nichtkomprimierbare Fluide. . . . . . . . 493 17.4 Physikalische Interpretation der inneren Lösung. . . . . . . . . . . . . . . . . . . 498 18 Schwarze Löcher in der Schwarzschild-Raumzeit . . . . . . . . . . . . . . . . . . . . 505 18.1 Singularitäten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 505 18.2 Einige Eigenschaften Schwarzer Löcher. . . . . . . . . . . . . . . . . . . . . . . . . 507 18.3 Radialer Fall in der Schwarzschild-Raumzeit. . . . . . . . . . . . . . . . . . . . . 510 18.4 Eddington-Finkelstein-Koordinaten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 519 18.5 Kruskal-Koordinaten. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 525 19 Diagramme, Flächen und Horizonte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 535 19.1 Einbettungsdiagramme und Wurmlöcher. . . . . . . . . . . . . . . . . . . . . . . . . 535 19.2 Penrose-Diagramme. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 540 19.3 Dreidimensionale Flächen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 549 20 Geladene Schwarze Löcher. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553 20.1 Die Reissner-Nordström-Lösung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553 20.2 Grundlegende Eigenschaften der Reissner-Nordström-Lösung. . . . . . . . 557 20.3 Eddington-Finkelstein-Koordinaten der Reissner-Nordström-Lösung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 559 20.4 Penrose-Diagramme für die Reissner-Nordström-Lösung . . . . . . . . . . . 562 21 Rotierende Schwarze Löcher. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 567 21.1 Die Kerr-Lösung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 567 21.2 Nulltetraden. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 568 21.3 Die Kerr-Metrik in Kerr-Eddington-Koordinaten . . . . . . . . . . . . . . . . . . 571 21.4 Die Kerr-Metrik in Boyer-Lindquist-Koordinaten. . . . . . . . . . . . . . . . . . 576 21.5 Singularitäten und Horizonte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 580 21.6 Die Ergosphäre. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 585 21.7 Der Penrose-Prozess . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 590 21.8 Die Thermodynamik von Schwarzen Löchern . . . . . . . . . . . . . . . . . . . . 594
Inhaltsverzeichnis
XIX
Teil V Kosmologie 22 Unser Universum. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 603 22.1 Die beobachtete Zusammensetzung unseres Universums. . . . . . . . . . . . 603 22.2 Entfernungsbestimmung im Weltall. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 607 22.3 Ausdehnung des Universums. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 612 22.4 Homogenität und Isotropie des Universums . . . . . . . . . . . . . . . . . . . . . . 615 23 Kosmologische Modelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 619 23.1 Ein Modell des Universums in der klassischen Mechanik. . . . . . . . . . . . 619 23.2 Robertson-Walker-Metrik . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 622 23.3 Kosmologische Rotverschiebung und Hubble-Parameter. . . . . . . . . . . . 633 23.4 Die Friedmann-Gleichungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 637 24 Evolution des Universums . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 645 24.1 Entwicklung der Energiedichte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 645 24.2 Zustandsgleichungen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 647 24.3 Qualitative Analyse der Friedmann-Gleichung. . . . . . . . . . . . . . . . . . . . 651 24.4 Spezielle analytische Lösungen der Friedmann-Gleichungen. . . . . . . . . 656 A Anhang: Nützliche Formeln, Einheiten und Tabellen. . . . . . . . . . . . . . . . . . . . 663 Literatur. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 673 Stichwortverzeichnis. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 677
Abbildungsverzeichnis
Abb. 1.1 Abb. 1.2 Abb. 1.3 Abb. 1.4 Abb. 1.5 Abb. 1.6 Abb. 1.7 Abb. 1.8 Abb. 1.9 Abb. 1.10 Abb. 1.11 Abb. 1.12 Abb. 1.13 Abb. 2.1 Abb. 2.2 Abb. 3.1 Abb. 3.2 Abb. 3.3 Abb. 6.1 Abb. 6.2 Abb. 6.3 Abb. 6.4 Abb. 7.1 Abb. 7.2 Abb. 7.3 Abb. 7.4 Abb. 7.5 Abb. 7.6 Abb. 8.1 Abb. 8.2
Galilei-Transformation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Relativität der Gleichzeitigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Zeitdehnung, Zeitdilatation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 Verlauf des Gammafaktors. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 Klassischer Doppler-Effekt I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 Klassischer Doppler-Effekt II. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 Lorentz-Transformation I . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 Lorentz-Transformation II . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 Zerlegung eines Vektors. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 Raumzeit mit Lichtkegel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 Sinus und Kosinus am rechtwinkligen Dreieck. . . . . . . . . . . . . . . . . . 34 Sinh und Cosh an der Einheitshyperbel. . . . . . . . . . . . . . . . . . . . . . . . 35 Raumzeitdiagramm. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 Zeitartige Weltlinie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 Weltlinien zweier Beobachter. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 Relativistischer Impuls. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 Hyperbolische Bewegung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 Impulserhaltung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 Teilchendichte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Teilchenfluss senkrecht zur Oberfläche . . . . . . . . . . . . . . . . . . . . . . . . 118 Teilchenfluss schräg zur Oberfläche. . . . . . . . . . . . . . . . . . . . . . . . . . . 119 Druckdifferenz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 Körper mit kugelsymmetrischer Dichte. . . . . . . . . . . . . . . . . . . . . . . . 137 Lichtablenkung an der Sonne nach Newton. . . . . . . . . . . . . . . . . . . . . 144 Die Erde ist kein Inertialsystem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 Das Gravitationsfeld der Erde ist nicht homogen . . . . . . . . . . . . . . . . 148 Gezeitenkräfte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 Von der SRT durch Koordinatentransformation zur ART . . . . . . . . . . 155 Kartenwechsel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160 Heruntergeholte Abbildung zwischen zwei Mannigfaltigkeiten . . . . . 166 XXI
XXII
Abb. 8.3 Abb. 8.4 Abb. 8.5 Abb. 9.1 Abb. 9.2 Abb. 9.3 Abb. 10.1 Abb. 10.2 Abb. 11.1 Abb. 11.2 Abb. 11.3 Abb. 11.4 Abb. 11.5 Abb. 12.1 Abb. 13.1 Abb. 14.1 Abb. 14.2 Abb. 15.1 Abb. 15.2 Abb. 15.3 Abb. 15.4 Abb. 15.5 Abb. 15.6 Abb. 15.7 Abb. 15.8 Abb. 15.9 Abb. 15.10 Abb. 16.1 Abb. 16.2 Abb. 16.3 Abb. 16.4 Abb. 16.5 Abb. 16.6 Abb. 16.7 Abb. 17.1 Abb. 17.2 Abb. 17.3 Abb. 18.1 Abb. 18.2 Abb. 18.3 Abb. 18.4
Abbildungsverzeichnis
Pullback einer Funktion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 Vektorfeld r∂r. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 Vektorfeld ∂ϕ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 Pushforward von Vektoren. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 Pullback von Einsformen. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196 Kurve auf Mannigfaltigkeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 Umgebungen im Halbraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237 Differenzierbare Funktion im Halbraum . . . . . . . . . . . . . . . . . . . . . . . 238 Parallelverschiebung eines Vektors. . . . . . . . . . . . . . . . . . . . . . . . . . . . 266 Paralleltransport in Polarkoordinaten. . . . . . . . . . . . . . . . . . . . . . . . . . 267 Parallelverschiebung n euklidischer Ebene . . . . . . . . . . . . . . . . . . . . . 279 Parallelverschiebung auf einer Kugeloberfläche . . . . . . . . . . . . . . . . . 280 Exponentialabbildung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 296 Paralleltransport eines Vektors auf zwei Wegen. . . . . . . . . . . . . . . . . . 301 Kovarianzprinzip . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348 Sphärische symmetrische Mannigfaltigkeit. . . . . . . . . . . . . . . . . . . . . 379 Konzentrische Kugeln in Schwarzschild-Raumzeit. . . . . . . . . . . . . . . 390 Effektives Potenzial bei Newton. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404 Schwerpunkt S . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 407 Umlaufbahnen zweier Körper mit m1 : m2 = 1 : 10 . . . . . . . . . . . . . . 408 Masseloses effektives Potenzial in Schwarzschild-Raumzeit . . . . . . . 412 Massives effektives Potenzial in Schwarzschild-Raumzeit . . . . . . . . . 413 Effektives Potenzial, L 2 < 12M 2 G2. . . . . . . . . . . . . . . . . . . . . . . . . . . 415 Periheldrehung des Merkurs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 417 Lichtablenkung an der Sonne in der Schwarzschild-Raumzeit . . . . . . 422 Lichtablenkung bei Sonnenfinsternis. . . . . . . . . . . . . . . . . . . . . . . . . . 425 Emission von Lichtwellen in der Schwarzschild-Raumzeit. . . . . . . . . 427 Verformung beim Durchgang einer + Gravitationswelle. . . . . . . . . . . 443 Verformung beim Durchgang einer × Gravitationswelle. . . . . . . . . . . 445 Große-Distanz-Approximation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 446 Doppelsternsystem. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 448 Abnahme der Umlaufzeit im Hulse-Taylor-Pulsarsystem. . . . . . . . . . 473 Laserinterferometer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 476 GW150914. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 478 Gleichmäßig geladene Kugel. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 487 Gleichgewicht zwischen Druck und Schwerkraft . . . . . . . . . . . . . . . . 498 Relativer Druckverlauf bei konstanter Dichte . . . . . . . . . . . . . . . . . . . 502 Radialer Fall eines Teilchens in ein Schwarzes Loch. . . . . . . . . . . . . . 510 Zukunftslichtkegel in Schwarzschild-Koordinaten . . . . . . . . . . . . . . . 517 Lichtstrahlen in der Schwarzschild-Raumzeit. . . . . . . . . . . . . . . . . . . 517 Zukunfts-Lichtkegel in Eddington-Finkelstein-Koordinaten. . . . . . . . 522
Abbildungsverzeichnis
XXIII
Abb. 18.5 Lichtstrahlen in avancierten Eddington-Finkelstein-Koordinaten. . . . 523 Abb. 18.6 Lichtstrahlen in retardierten Eddington-Finkelstein-Koordinaten . . . . 525 Abb. 18.7 Lichtstrahlen in (r ∗ , t)-Koordinaten . . . . . . . . . . . . . . . . . . . . . . . . . . . 526 Abb. 18.8 Kruskal-Diagramm der Schwarzschild-Raumzeit . . . . . . . . . . . . . . . . 532 Abb. 19.1 Zweidimensionaler Flächenschnitt, eingebettet im R3. . . . . . . . . . . . . 538 Abb. 19.2 Schwarzschild-Wurmloch, Einstein-Rosen-Brücke. . . . . . . . . . . . . . . 540 Abb. 19.3 Minkowski-Raumzeit, eingebettet in das Einstein'sche statische Universum. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 544 Abb. 19.4 Penrose-Diamant der Minkowski-Raumzeit. . . . . . . . . . . . . . . . . . . . . 545 Abb. 19.5 Penrose-Diagramm der Minkowski-Raumzeit. . . . . . . . . . . . . . . . . . . 546 Abb. 19.6 Penrose-Diagramm der Kruskal-Lösung. . . . . . . . . . . . . . . . . . . . . . . 548 Abb. 19.7 Lichtkegel als Nullfläche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 550 Abb. 20.1 Reissner-Nordström-Horizonte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 558 Abb. 20.2 Penrose-Diagramm für die RN-Lösung mit GM 2 < Q2. . . . . . . . . . . . 559 Abb. 20.3 Lichtstrahlen in Eddington-Finkel-Koordinaten in der RN-Lösung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 561 Abb. 20.4 Penrose-Diagramm für den Fall GM 2 > Q2. . . . . . . . . . . . . . . . . . . . . 564 Abb. 20.5 Penrose-Diagramm für die maximale RN-Lösung. . . . . . . . . . . . . . . . 566 Abb. 21.1 Vergleich einer Kugel mit einem rotierenden Körper . . . . . . . . . . . . . 568 Abb. 21.2 Intrinsische Ringsingularität der Kerr-Metrik . . . . . . . . . . . . . . . . . . . 581 Abb. 21.3 Kerr-Raumzeit für ϑ = π/2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 584 Abb. 21.4 Horizonte und Ergosphäre der Kerr-Lösung . . . . . . . . . . . . . . . . . . . . 586 Abb. 21.5 Penrose-Prozess . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 591 Abb. 22.1 Andromeda-Galaxie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 604 Abb. 22.2 Hubble Ultra Deep Field . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 604 Abb. 22.3 Rotationsgeschwindigkeit der Galaxie NGC4183. . . . . . . . . . . . . . . . 606 Abb. 22.4 Parallaxenmethode. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 609 Abb. 22.5 Hubble-Diagramm von Galaxien. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 613 Abb. 22.6 Fluchtgeschwindigkeiten von Galaxien. . . . . . . . . . . . . . . . . . . . . . . . 614 Abb. 22.7 2dF Galaxiendurchmusterung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 616 Abb. 22.8 Kosmologische Mikrowellenhintergrundstrahlung . . . . . . . . . . . . . . . 617 Abb. 23.1 Kosmologische Rotverschiebung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 634 Abb. 24.1 Effektives Potenzial mit heutigen Werten. . . . . . . . . . . . . . . . . . . . . . . 654 Abb. 24.2 Effektives Potenzial im geschlossenen Universum . . . . . . . . . . . . . . . 655 Abb. 24.3 Effektives Potenzial mit negativer Vakuum-Dichte . . . . . . . . . . . . . . . 655 Abb. 24.4 Verläufe des Skalenfaktors in Materie-dominierten Universen. . . . . . 662
Teil I Spezielle Relativitätstheorie
In diesem ersten Teil werden diejenigen Inhalte der Speziellen Relativitätstheorie (SRT) erörtert, die wir im weiteren Verlauf bei der Herleitung und Darstellung der Allgemeinen Relativitätstheorie benötigen. Alle hier aufgeführten physikalischen Sachverhalte inklusive der dafür notwendigen mathematischen Hilfsmittel sollten dem Leser aus den Vorlesungen zu Beginn des Studiums bekannt sein. Sollten sich beim Leser in diesem ersten Teil trotzdem Wissenslücken auftun, so kann und sollte er auf die im Text genannten Literaturstellen, die alle am Ende des Buches im Literaturverzeichnis zusammengefasst sind, zurückgreifen. Wir behandeln die Newton’schen und Einstein’schen Relativitätsprinzipien und leiten aus Letzterem die klassischen Ergebnisse der SRT (Zeitdilatation, Längenkontraktion und die Transformationen der Lorentz- und Poincaré-Gruppe) her. Die Raumzeit der SRT wird durch den Minkowski-Raum modelliert, d.h. durch einen reellen vierdimensionalen Vektorraum, der mit einer Semi-Riemann’schen Metrik ausgestattet ist. Wir verallgemeinern die Newton’sche Mechanik zur relativistischen Mechanik und schauen uns an, welche Formen die physikalischen Konstrukte Masse, Geschwindigkeit, Impuls, Kraft, Energie usw. in der SRT annehmen. Anschließend führen wir auf dem Minkowski-Raum die Tensorrechnung ein und zeigen, dass die Elektrodynamik in natürlicher Art und Weise die Anforderungen der Speziellen Relativitätstheorie erfüllt. Maxwell-Gleichungen und Lorentz-Kraft können mit dem Feldstärketensor Lorentzinvariant dargestellt werden. Wir zeigen, dass sich die Maxwell-Gleichungen durch einen Lorentz-invarianten Lagrange-Mechanismus herleiten lassen, und definieren auf dem Minkowski-Raum Energie-Impuls-Tensoren für das elektromagnetische Feld sowie für Staub und ideale Fluide.
1
Grundlagen der Speziellen Relativitätstheorie
1.1
Das Newton’sche Relativitätsprinzip
Wir beschreiben in diesem Absatz, wie man sich zu Zeiten von Galilei und Newton Raum und Zeit vorstellte und welche Prinzipien der Physik sich aus diesen Vorstellungen ableiten lassen. Galilei und Newton gingen generell davon aus, dass der Raum, die Zeit und auch die Masse eines Körpers absolut sind, d. h., dass räumliche Abstände und zeitliche Differenzen sowie die Masse eines Körpers, die in einem Bezugssystem gemessen werden, auch in jedem anderen Bezugssystem, das sich gegenüber dem ersten in Ruhe befindet oder mit konstanter Geschwindigkeit bewegt (ein sogenanntes Inertialsystem), dieselben Messwerte aufweisen. Im Folgenden wollen wir zunächst die für uns relevanten elementaren Transformationen aufführen, die die Koordinaten eines Inertialsystems S auf die eines zweiten S abbilden: 1. Eine Verschiebung des Nullpunktes von S um einen konstanten Vektor a . Die Transformationsvorschrift für alle Punkte in S lautet x = x + a . 2. Eine gleichförmige Bewegung von S relativ zu S mit konstanter Geschwindigkeit v, wobei wir unterstellen, dass zum Zeitpunkt t = 0 die beiden Inertialsysteme übereinander liegen, d. h. x = x + vt. 3. Eine Drehung von S gegenüber S um den (gleichen) Ursprung beider Systeme x = R x mit einer Drehmatrix R. Da die Beträge von x und x unter dieser Transformation gleich bleiben, folgt (mit der Identität a · b = a T b für zwei Vektoren a , b (siehe [5])): © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_1
3
4
1 Grundlagen der Speziellen Relativitätstheorie !
x 2 = x · x = (R x) · (R x) = (R x)T (R x) = x T R T R x = x 2 und daraus RT R = I mit der Einheitsmatrix
(1.1)
⎞ 100 I = δi j = ⎝ 0 1 0 ⎠ 001 ⎛
und dem Kronecker-Delta δi j =
1 i= j 0 i = j
.
R ist also eine reelle orthogonale 3 × 3-Matrix. Jede Drehmatrix R kann man als Produkt von drei einfachen Drehmatrizen: ⎞ ⎛ cos γ − sin γ 0 R3 (α) = ⎝ sin γ cos γ 0 ⎠ Drehung um die z-Achse, 0 0 1 ⎞ 1 0 0 R1 (β) = ⎝ 0 cos β − sin β ⎠ Drehung um die x-Achse 0 sin β cos β ⎞ ⎛ cos γ − sin γ 0 R3 (γ ) = ⎝ sin γ cos γ 0 ⎠ Drehung um die z-Achse, 0 0 1 ⎛
mit R = R3 (α) R1 (β) R3 (γ )
(1.2)
schreiben. Die drei Winkel α, β, γ nennt man Euler’sche Winkel, und man kann an der Darstellung von R ablesen, dass det R = 1 gilt. R ist damit ein Element der speziellen orthogonalen Gruppe S O (3). 4. Eine Verschiebung des Nullzeitpunktes um eine feste Zahl s: t = t + s Kombiniert man diese elementaren Transformationen, so erhält man t = t + s t → . x G x = R x + vt + a Die Transformationen G bilden die sogenannte eigentliche, orthogonale Galilei-Gruppe ↑ G + (siehe [3]), wobei der Pfeil nach oben dafür steht, dass die Zeitrichtung nicht geändert
1.1
Das Newton’sche Relativitätsprinzip
5
wird; das Pluszeichen steht für die Wahl det R = 1. Die Elemente der Gruppe wollen wir einfach Galilei-Transformationen nennen; diese bilden Inertialsysteme auf Inertialsysteme ab, wie man folgendermaßen einsieht. Nach dem ersten Newton’schen Gesetz bewegt sich ein kräftefreies Teilchen im Inertialsystem S gradlinig gleichförmig oder verharrt in Ruhe, d. h., es wird nicht beschleunigt: d 2 x =0 dt 2 Mit dt = dt folgt wegen der Konstanz von R, a und v d d x d x d x = + v, = (R x + vt + a ) = R dt dt dt dt woraus nach nochmaliger Ableitung d 2 x d 2 x = R =0 dt 2 dt 2 folgt, also ist S ebenfalls ein Inertialsystem. Wir können zusammenfassend das sogenannte Newton’sche Relativitätsprinzip formulieren: Die Gesetze in der Newton’schen Mechanik sind formgleich („kovariant“) in allen Inertialsystemen, die über eine Galilei-Transformation miteinander verknüpft sind.
Abstandsquadrat, Linienelement Die sogenannte euklidische Geometrie des uns umgebenden Raumes R3 kann man in kartesischen Koordinaten mit dem Abstandsquadrat zweier Punkte x1 = (x1 , y1 , z 1 ) und x2 = (x2 , y2 , z 2 ): x2 − x1 )2 = (x2 − x1 )2 + (y2 − y1 )2 + (z 2 − z 1 )2 = x 2 + y 2 + z 2 (1.3) s 2 := ( beschreiben. Das Abstandsquadrat nimmt in allen Inertialsystemen denselben Wert an und ist damit invariant unter den Galilei-Transformationen. Denn es gilt für die Differenz zweier Zeitpunkte t = t2 − t1 = t2 + s − (t1 + s) = t2 − t1 = t sowie s 2
=
x2 − x1
2
=
((R x2 + vt + a ) − (R x1 + vt + a ))2
=
x2 − x1 ))2 = R ( x2 − x1 ) · R ( x2 − x1 ) (R (
=
x2 − x1 )2 = s 2 . (
R orthogonal
(1.4)
6
1 Grundlagen der Speziellen Relativitätstheorie
Das Linienelement ds 2 gibt das Quadrat der Länge zwischen zwei infinitesimal benachbarten Raumpunkten (x, y, z) und (x + d x, y + dy, z + dz) an, und es gilt analog ds 2 = ds 2 . Spezielle Galilei-Transformationen Für unsere Zwecke besonders wichtig sind diejenigen Galilei-Transformationen, die keine Drehungen oder Verschiebungen beinhalten, also t t = t → . (1.5) x x = x + vt Diese werden spezielle Galilei-Transformationen genannt, und wir werden in Abschn. 1.2 sehen, dass sie für die Spezielle Relativitätstheorie nicht ausreichen und eine Erweiterung erhalten müssen, während Drehungen und Verschiebungen unverändert auch in der SRT genutzt werden können.
Aufgabe 1.1 Zeigen Sie die Kovarianz des zweiten Newton’schen Gesetzes für eine spezielle Galilei-Transformation. Das Bezugssystem S möge sich mit konstanter Geschwindigkeit entlang der positiven x-Achse bewegen.
Lösung Wir zeigen die Kovarianz des zweiten Newton’schen Gesetzes für eine spezielle GalileiTransformation, bei der wir die Relativgeschwindigkeit v der beiden Inertialsysteme in xRichtung legen. Wir betrachten zwei Inertialsysteme S und S mit kartesischen Koordinaten x, y, z und Ursprung 0 bzw. x , y , z und 0 . Das Inertialsystem S möge sich mit einer konstanten Geschwindigkeit v entlang der positiven x-Achse des Inertialsystems S bewegen. Ferner wollen wir einfacherweise annehmen, dass die Ursprünge der beiden Inertialsysteme zum Zeitpunkt t = 0 übereingestimmt haben. Abb. 1.1 zeigt den im Nullpunkt des Inertialsystems S ruhenden Beobachter B1 und den in seinem Inertialsystem S ebenfalls im Nullpunkt ruhenden Beobachter B2 . Das Inertialsystem S bewegt sich mit konstanter Geschwindigkeit v = (v, 0, 0) parallel zur x-Achse und hat sich zum Zeitpunkt t um den Abstand vt von S entfernt. Betrachtet man nun den Punkt P, so hat P im System S die Koordinaten P = (x, y, z) und im System S die Koordinaten P = (x , y , z ), wobei wir der Einfachheit halber die z- und z -Achse in Abb. 1.1 weggelassen haben. Bezeichnen wir die Zeit im System S mit t und in S mit t , so besagt die Annahme einer absoluten Zeit, dass B1 und B2 jeweils dieselbe Zeit messen, dass also t und t gleich sind. Da die beiden Inertialsysteme zum Zeitpunkt t = t = 0 übereingestimmt haben und sich S nur entlang der x-Achse bewegt, werden durch diese Bewegung die y und z -Koordinaten im Inertialsystem S zeitlich nicht verändert. Die Beziehungen zwischen den Koordinaten ergeben sich also durch:
1.1
Das Newton’sche Relativitätsprinzip
7
Abb. 1.1 Galilei-Transformation
x = x − vt y = y
(1.6)
z =z t = t Natürlich gilt hierfür auch die Umkehrung, d. h., mit den Gleichungen x = x + vt y = y z = z t = t erhält man eine Vorschrift, wie aus Größen im System S die entsprechenden im System S abgeleitet werden können. Besitzt ein Teilchen im System S die Geschwindigkeit x y z
d x dy dz , , , u = u , u , u = S dt dt dt dann errechnet sich seine Geschwindigkeit im Inertialsystem S wegen dt = dt mit der speziellen Galilei-Transformation zu d x dy dy d(x − vt) dy dz
x y z , , = u x − v, u y , u z , , , = u = u , u , u = dt dt dt dt dt dt S (1.7) also (1.8) u = u − v.
8
1 Grundlagen der Speziellen Relativitätstheorie
Nochmalige Differenziation ergibt unter Beachtung, dass die Relativgeschwindigkeit v der beiden Systeme konstant ist, eine Beziehung zwischen den Beschleunigungen in den beiden Systemen d (u x − v) du y du z du x du y du z
, , = ax , a y , az , , , = a = a x , a y , a z = dt dt dt dt dt dt S also
a = a ,
die Beschleunigungen sind also identisch. Da sich auch die Masse eines Teilchens in verschiedenen Inertialsystemen nicht ändert (m = m), gilt das zweite Newton’sche Gesetz in beiden Systemen in gleicher Weise: F = m a = m a = F Das zweite Newton’sche Gesetz hat in den beiden Inertialsystemen die gleiche Form, es ist kovariant. Additionsgesetz für die Geschwindigkeiten in der Newton’schen Mechanik Bewegt sich ein Teilchen im System S mit der Geschwindigkeit u und das System S mit der Relativgeschwindigkeit v, so addieren sich im System S die beiden Geschwindigkeiten: u = u + v
1.2
(1.9)
Das Einstein’sche Relativitätsprinzip
Ende des 19. Jahrhunderts untersuchten Physiker die Fragestellung, ob neben den Gesetzen der Mechanik auch die von James Clerk Maxwell (1831–1879) aufgestellten Gesetze der Elektrodynamik dem Newton’schen Relativitätsprinzip folgen. Ein Problem, mit dem sie zu tun hatten, war die Tatsache, dass aus der Maxwell-Theorie die Konstanz der Lichtgeschwindigkeit c folgt: 1 c= √ , ε0 μ0 wobei ε0 die elektrische und μ0 die magnetische Feldkonstante des Vakuums bezeichnen (siehe [1]). Setzt man die Werte ein, so ergibt sich c ≈ 3 × 108 ms −1 , also die beobachtete Geschwindigkeit des Lichts. In der Elektrodynamik hängt die Lichtgeschwindigkeit nur von elektrischen und magnetischen Eigenschaften des Vakuums ab und ist damit absolut. Alle Versuche, die Relativität der Lichtgeschwindigkeit nachzuweisen,
1.2
Das Einstein’sche Relativitätsprinzip
9
indem man z. B. ein ausgezeichnetes Inertialsystem („Äther“) aufspüren wollte, schlugen fehl, und es war schließlich Einstein, der 1905 zwei Postulate aufstellte und damit die Spezielle Relativitätstheorie begründete. 1. Postulat (Relativitätsprinzip): Es gibt kein physikalisch bevorzugtes Inertialsystem. Alle Gesetze der Physik nehmen in allen Inertialsystemen dieselbe Form an. 2. Postulat (Prinzip der Konstanz der Lichtgeschwindigkeit): Das Licht breitet sich im Vakuum bezüglich jedes Inertialsystems in allen Richtungen mit der gleichen Geschwindigkeit c aus.
Einstein vermutete hinter dem Scheitern der Versuche, die Bewegung der Erde im Äther zu messen, ein allgemeines Naturgesetz. Wenn es den Äther gar nicht gibt, ist die Vorstellung einer Absolutbewegung bzw. absoluten Ruhe sinnlos, und nur die Relativbewegung eines Körpers in Bezug auf einen anderen kann in der Physik von Bedeutung sein. Das erste Postulat verwirft die Idee einer Äthers nicht direkt, sondern sagt aus, dass er bei der Formulierung der physikalischen Gesetze keine Rolle spielt. Der genau gemessene Wert für die Lichtgeschwindigkeit im Vakuum ist c = 299.792,458 km/s, siehe Tab. A.3. Breitet sich das Licht in einem materiellen Medium wie z. B. Wasser oder Glas aus, so kann die Relativgeschwindigkeit des Lichts in Bezug auf das Wasser oder Glas auch andere Werte annehmen. Das 2. Postulat gilt in solchen Fällen sinngemäß. Weder das Prinzip der Konstanz der Lichtgeschwindigkeit noch das Relativitätsprinzip erscheinen auf den ersten Blick ungewöhnlich. Sie beinhalten aber grundlegende Veränderungen der Begriffe Raum und Zeit. Nehmen wir z. B. ein Lichtsignal, das sich im Raum ausbreitet. Wenn wir versuchen, diesem Lichtsignal nachzulaufen, so wird es sich – egal wie schnell wir laufen – immer mit der gleichen Geschwindigkeit c von uns entfernen. Damit ist auch das Additionsgesetz für Geschwindigkeiten der Newton’schen Mechanik (1.9) hinfällig, zumindest wenn man es auf Licht anwendet. Wir werden jetzt drei grundlegende Folgerungen aus den Einstein’schen Postulaten ableiten, nämlich dass erstens die Gleichzeitigkeit ihren absoluten Charakter verliert, dass zweitens verschiedene Beobachter für einen Vorgang nicht mehr dieselbe Dauer messen und dass drittens die Länge eines Objekts in unterschiedlichen Inertialsystemen unterschiedlich gemessen wird.
10
1.3
1 Grundlagen der Speziellen Relativitätstheorie
Relativität der Gleichzeitigkeit, Zeitdilatation
In der Speziellen Relativitätstheorie verstehen wir unter einem Ereignis einen festen Punkt im Raum zu einer bestimmten Zeit, d. h., wir können ein Ereignis durch die Angabe von drei Ortskoordinaten und einer Zeitkoordinate beschreiben. Zwei Ereignisse sollen für einen Beobachter gleichzeitig sein, wenn Lichtsignale, die von den Orten der Ereignisse ausgesendet werden, bei dem Beobachter zum gleichen Zeitpunkt eintreffen. Bezeichnet man den Ort des ersten Ereignisses mit A und den des zweiten mit B, so folgt aus der Konstanz der Lichtgeschwindigkeit, dass die Strecke A – Beobachter gleich der Strecke B – Beobachter sein muss, der Beobachter wird sich also in der Mitte der beiden Punkte A und B aufhalten. Dabei ist es wieder wegen der Konstanz der Lichtgeschwindigkeit unerheblich, ob sich die Lichtquellen relativ zum Beobachter in Ruhe oder in gleichförmiger Bewegung befinden. Natürlich kann man diese Definition der Gleichzeitigkeit auch auf beliebig viele weitere Ereignisse ausdehnen und kommt so zu einer Definition der „Zeit“ in der Physik. Stellt man sich vor, dass in verschiedenen Punkten eines Bezugssystems S Uhren gleicher Beschaffenheit aufgestellt sind, deren Zeigerstellung gleichzeitig dieselben sind, dann versteht man unter der Zeit eines Ereignisses die Zeitangabe/Zeigerstellung derjenigen Uhr, die dem Ereignis räumlich benachbart ist. Um die Relativität der Gleichzeitigkeit zu erläutern, benutzen wir ein Beispiel, das von Einstein selbst stammt (siehe [7]). In Abb. 1.2 sieht man einen Zug, der an einem Bahndamm mit der konstanten Geschwindigkeit v vorbei fährt. Es mögen nun zwei Blitze in A und B einschlagen, die aus der Sicht eines in der Mitte zwischen A und B in M befindlichen Beobachters auf dem Bahndamm gleichzeitig passieren. Sei M der Mittelpunkt der Strecke AB im fahrenden Zug. Dieser Punkt M befindet sich zum Zeitpunkt des Einschlagens der beiden Blitze auf der Höhe von M. Würde sich der Zug nicht bewegen, so würde ein Beobachter in M die Blitze ebenfalls gleichzeitig wahrnehmen. Der Zug fährt allerdings vom Bahndamm gesehen mit der konstanten Geschwindigkeit v nach rechts, d. h. dem Lichtsignal von B entgegen und dem Lichtsignal von A voraus. Da die Geschwindigkeit des Lichtblitzes, der von A ausgesendet wird, gleich der Geschwindigkeit des Lichtblitzes ist, der von B ausgesendet wird, kommt der Beobachter in M also zu dem Ergebnis, das Ereignis B habe früher stattgefunden als das Ereignis A. Allgemein können wir das Relativitätsprinzip der Gleichzeitigkeit formulieren: Abb. 1.2 Relativität der Gleichzeitigkeit
1.3
Relativität der Gleichzeitigkeit, Zeitdilatation
11
Ereignisse, die bezogen auf ein Inertialsystem S gleichzeitig sind, sind bezogen auf ein zweites Inertialsystem S nicht gleichzeitig und umgekehrt. Jedes Inertialsystem hat seine eigene Zeit. Eine Zeitangabe ist nur dann sinnvoll, wenn das Inertialsystem, auf das sich die Zeitangabe bezieht, mit angegeben wird. Mit diesem Relativitätsprinzip der Gleichzeitigkeit, das unmittelbar aus den Einstein’schen Postulaten folgt, ist die von Newton angenommene absolute Zeit t = t hinfällig geworden. Wir wollen nun auch quantitativ feststellen, welche Beziehungen zwischen den unterschiedlichen Zeiten in unterschiedlichen Bezugssystemen konkret bestehen. Dafür konstruieren wir uns eine möglichst einfache Uhr, siehe Abb. 1.3. In dieser „Lichtuhr“ ist die Unruh ein hin- und herlaufendes Lichtsignal. In einem Zylinder läuft ein Lichtblitz von unten nach oben zu einem Spiegel, wird dort reflektiert und läuft zurück zum Boden. Dort wird er registriert, löst unmittelbar einen neuen Blitz aus, und der Zählerstand wird um eins erhöht. Wir stellen uns vor, dass wir mehrere solcher Uhren entlang der x-Achse des (ruhenden) Inertialsystems S in genügend kleinen Abständen aufgestellt und synchronisiert haben, sodass wir an allen interessierenden Orten die Zeit t im Inertialsystem S ablesen können. Eine weitere baugleiche Uhr bewege sich mit der konstanten Geschwindigkeit v = (v, 0, 0) relativ zum System S in positiver x-Achsenrichtung vorwärts. Wir wollen die Frage beantworten, wie viel Zeit t im ruhenden System S vergeht, wenn im System S der bewegten Uhr die Zeit t vergeht. Zur Zeit t1 im System S und t1 im System S befinde sich die Uhr an der gestrichelten Position, und ein Lichtblitz werde nach oben abgeschossen. Die Uhr bewegt sich innerhalb einer Zeitspanne t um die Strecke vt im System S. Der vom Licht zurückgelegte Weg beträgt im ruhenden System S wegen der Konstanz der Lichtgeschwindigkeit ct. Im bewegten System S legt der Lichtstrahl die Strecke ct = c(t2 − t1 ) zurück. Diese beiden Weglängen sind aber nicht gleich lang, also müssen sich die Zeitintervalle t und t unterscheiden! Mit dem Satz des Pythagoras folgt für den Zusammenhang zwischen den beiden Messwerten (vt)2 + (ct )2 = (ct)2 ⇒ c2 (t )2 = (t)2 (c2 − v 2 ) ⇒
v2 2 2 (t ) = (t) 1 − 2 c und daraus schließlich t = t
1−
v2 . c2
12
1 Grundlagen der Speziellen Relativitätstheorie
Abb. 1.3 Zeitdehnung, Zeitdilatation
Die Zeitspanne t , die im Inertialsystem S am gleichen Ort gemessen wird, ist also immer kleiner als t. Definiert man den sogenannten Gammafaktor durch γ := so gilt
1 1 − v 2 /c2
> 1,
t = γ t .
(1.10)
Diese Dehnung des Zeitintervalls t im Vergleich zu t heißt Zeitdilatation. Beispiel 1.1
Um ein konkretes Zahlenbeispiel zu rechnen, stellen wir uns vor, dass ein Raumschiff mit konstanter Geschwindigkeit v = 0,6 c von der Erde fortfliegt. Die Astronauten teilen der Bodenstation mit, dass sie eine Stunde schlafen werden. Wie lange schlafen sie im Bezugssystem S der Erde? Da die Astronauten in ihrem Inertialsystem S am gleichen Ort einschlafen und aufwachen, ist ihre Schlafdauer t , und das Zeitintervall auf der Erde beträgt mit (1.10) 1 1 1 t = γ t = = =√ = 1,25 Std., 0,64 1 − v 2 /c2 1 − (0,6c)2 /c2 also schlafen sie im Zeitsystem auf der Erde eine Stunde und 15 min!
1.4
1.4
Längenkontraktion
13
Längenkontraktion
Aus der Zeitdehnung folgt unmittelbar, dass sich auch die Längenmessungen in zwei mit einer Geschwindigkeit v gegeneinander bewegten Inertialsystemen unterscheiden. Zunächst unterstellen wir, dass, wenn sich das Inertialsystem S aus Sicht eines (ruhenden) Inertialsystems S mit Geschwindigkeit v in positiver x-Richtung nach rechts bewegt (die Inertialsysteme seien wieder so konstruiert, dass die x- und die x -Achsen übereinstimmen), dann gilt auch die Umkehrung. Das heißt, dass sich aus Sicht eines (ruhenden) Beobachters B2 in S das Inertialsystem S mit der gleichen Geschwindigkeit v nach links bewegt. Denn würde B2 z. B. eine geringere Geschwindigkeit u relativ zu S messen, also u < v, so wäre das ein physikalisches Gesetz, das nach dem Relativitätsprinzip in jedem Inertialsystem gilt. Das bedeutet, dass ein Beobachter B1 im System S auch eine kleinere Geschwindigkeit v relativ zu S messen würde, also v < u, was offensichtlich ein Widerspruch ist. Wir stellen uns nun vor, dass im System S an zwei verschiedenen Stellen auf der x-Achse im Abstand x zwei synchronisierte Uhren aufgestellt sind, an denen der Beobachter B2 im System S mit Relativgeschwindigkeit v vorbeifährt. Er misst die jeweiligen Zeitpunkte, in denen er an den beiden Uhren vorbeikommt, und erhält als Dauer von einer Uhr zur anderen ein Zeitintervall t . Genau das Gleiche passiert im System S. Wenn der Beobachter B2 an der ersten Uhr vorbeikommt, wird die Zeit genommen und ebenso beim Erreichen der zweiten Uhr, diese Zeitdifferenz sei mit t bezeichnet. Da in beiden Systemen betragsmäßig die gleiche Relativgeschwindigkeit v gemessen wird, gilt also: x x =v= , t t woraus mit (1.10) folgt, dass t = x x = x t
1−
v2 , c2
d. h., die Länge x , die in einem bewegten Inertialsystem gemessen wird, ist immer kürzer als die Länge x im ruhenden Inertialsystem. Diesen Verkürzungseffekt nennt man Längenkontraktion x = x
1−
v2 1 = x. c2 γ
(1.11)
Nun überlegen wir, ob es auch eine Längenverzerrung in Richtungen quer zur Relativgeschwindigkeit v geben kann. Wir machen wieder ein Gedankenexperiment und stellen uns vor, dass ein Zug im Ruhezustand gerade so eben in einen schmalen Tunnel passt. Würde sich bei einer hohen Relativgeschwindigkeit die Breite des Tunnels aus Sicht des Zuges verkleinern, so würde er nicht mehr in den Tunnel, der ja aus seiner Sicht auf ihn zukommt, passen. Der Eingang des Tunnels würde entweder auf den Zug aufprallen oder zumindest einige Kratzer am Zug hinterlassen. Schauen wir uns nun die Situation von der anderen Seite
14
1 Grundlagen der Speziellen Relativitätstheorie
an. Aus Sicht des Tunnels kommt der Zug mit hoher Geschwindigkeit auf ihn zu. Die Querkontraktion des Tunnels, die der Zug wahrgenommen hat, würde jetzt eine Querkontraktion des Zuges aus Sicht des Tunnels bedeuten. Der Zug wäre schmaler und würde bequem durch den Tunnel durchfahren können. Diesen Widerspruch kann man nur auflösen, wenn man die obige Annahme verwirft. Wir können also zusammenfassend feststellen: Die Länge x , die in einem bewegten Inertialsystem in Bewegungsrichtung gemessen wird, ist immer um den Faktor γ kürzer als die Länge x im ruhenden Inertialsystem: γ x = x. Strecken quer zur Bewegungsrichtung verkürzen oder verlängern sich dagegen nicht. Die Invarianz von Strecken quer zur Bewegungsrichtung haben wir übrigens schon bei der Ableitung der Formel zur Zeitdilatation implizit genutzt, als wir unterstellt haben, dass sich beide Beobachter einig darüber sind, dass der Lichtstrahl in der Lichtuhr tatsächlich die weiter oben berechnete Strecke quer zur Bewegungsrichtung zurücklegt. Abb. 1.4 zeigt den Verlauf von γ als Funktion des Betrags der Geschwindigkeitsrelation v/c.
Abb. 1.4 Verlauf des Gammafaktors
1.4
Längenkontraktion
15
Man sieht, dass der γ – Faktor erst ab einer Relativgeschwindigkeit von ca. 0,2 c signifikant von der Linie γ = 1 abweicht, deswegen konnten Zeitdilatation und Längenkontraktion vor allem erst durch Experimente in Teilchenbeschleunigern praktisch nachgewiesen werden. Aber auch Beobachtungen an sehr schnellen Teilchen, die aus der kosmischen Strahlung durch Reaktionen mit Atomkernen und Molekülen der Atmosphäre entstehen, haben Zeitdilatation bzw. Längenkontraktion eindrucksvoll nachweisen können. Beispiel 1.2 Lebensdauer von Myonen
Myonen sind solche Sekundärteilchen, sie besitzen eine Geschwindigkeit von v = 0,998 c und zerfallen nach dem Gesetz N (t) = N0 e−t/τ ,
(1.12)
wobei N0 die Anzahl der Myonen zum Zeitpunkt t = 0 ist. N (t) bezeichnet die Anzahl der Myonen zum Zeitpunkt t und τ die mittlere Lebensdauer, die für ein Myon im Ruhesystem ca. 2 µs (= 2 · 10−6 s = 2 μs) beträgt. Da Myonen in einer Höhe von mehreren tausend Metern entstehen, sollten nur wenige die Erdoberfläche erreichen. Ein typisches Myon würde in 2 μs nur etwa 600 m zurücklegen. Im Bezugssystem der Erde erhöht sich allerdings die Lebensdauer des Myons nach der Zeitdilatation um den Faktor 1 1 γ = = ≈ 15,8, 1 − v 2 /c2 1 − (0,998)2 c2 /c2 d. h., die Lebensdauer im Inertialsystem Erde ist ca. 31 μs, das Myon legt in dieser Zeit ca. 9500 m zurück. Das gleiche Ergebnis erhält man, wenn man sich in das Inertialsystem des Myons begibt. Hier ist die Eigenlebenszeit weiterhin 2 μs, aber eine Entfernung Myon – Erdoberfläche von 9500 m kontrahiert sich im Inertialsystem des Myons auf 2 2 v v (0,998)2 c2 x = x 1 − 2 = 9500 1 − 2 = 950 1 − ≈ 600. c c c2 Wir wollen überprüfen, ob diese Vorhersagen der Speziellen Relativitätstheorie zutreffend sind. Angenommen, man beobachtet zum Zeitpunkt t = 0 in 9000 m Höhe 108 Myonen. Nach der nichtrelativistischen Vorhersage brauchen die Myonen für die 9000 m bis zur Erdoberfläche die Zeit 9000 m 9000 m = ≈ 30 μs, 0,998 c 0,998 · 300.000.000 m/s also das 15-Fache der mittleren Zerfallsdauer τ . Setzt man das in die obige Formel (1.12) ein, so erhält man N = 108 e−15 ≈ 30,6,
16
1 Grundlagen der Speziellen Relativitätstheorie
d. h., von den ursprünglichen 100 Mio. Myonen würden nur ca. 30 die Erdoberfläche erreichen. Nach der Speziellen Relativitätstheorie muss die Erde nur 600 m im Inertialsystem des Myons zurücklegen, was etwa 2 μs = 1τ dauert. Damit berechnet sich die Anzahl der auf Meereshöhe erwarteten Myonen auf N = 108 e−1 ≈ 3,68 · 107 . Experimente haben bestätigt, dass die Vorhersagen der Speziellen Relativitätstheorie zutreffend sind, man beobachtet tatsächlich ca. 36,8 Mio. Myonen auf der Erdoberfläche.
1.5
Doppler-Effekt in der Speziellen Relativitätstheorie
Als ein weiteres Beispiel wollen wir den sogenannten Doppler-Effekt untersuchen. Den Doppler-Effekt kann man bei jeder beliebigen Welle beobachten, er ist z. B. bei Schallwellen dafür verantwortlich, dass man den Pfeifton eines herannahenden Zuges höher wahrnimmt als bei einem Zug in Ruhe oder bei einem, der sich entfernt. Wir beschränken uns in diesem Beispiel aber auf Lichtwellen im Vakuum. Klassischer Doppler-Effekt Wir nehmen an, dass sich eine Lichtwelle mit konstanter Geschwindigkeit c und zeitlich unveränderlicher Frequenz (Farbe) f in positiver x-Richtung ausbreitet. Wenn zwei Beobachter, die sich relativ zueinander bewegen, auf diesen Lichtstrahl schauen, so sehen sie diesen in unterschiedlichen Farben, d. h., die wahrgenommenen Frequenzen unterscheiden sich. Dieses Phänomen heißt Doppler-Effekt, oft auch einfach Rotverschiebung genannt, obwohl das nur eine mögliche Ausprägung des Doppler-Effekts ist, wie wir gleich sehen werden. In Abb. 1.5 ist eine Lichtwelle vom Punkt A in die positive x-Richtung emittiert worden. Zum Zeitpunkt null hat ein in S befindlicher Beobachter angefangen, die Wellenberge der Lichtwelle zu zählen. Bis zu Zeitpunkt t hat die Welle die Strecke ct zurückgelegt, und der Beobachter hat die in Abb. 1.5 fett markierten Wellenberge an ihm vorbeilaufen sehen. Der fette Wellenberg ganz rechts war der erste, und der fette ganz links war der letzte Wellenberg, den er im Zeitraum t gezählt hat. Wenn die Anzahl der gezählten Wellenberge gleich N ist, so hat die Welle aus Sicht S die Frequenz f =
N . t
Nun betrachten wir einen relativ zu S bewegten Beobachter S , der sich in positiver xRichtung mit der Relativgeschwindigkeit v bewegen möge.
1.5
Doppler-Effekt in der Speziellen Relativitätstheorie
17
Abb. 1.5 Klassischer Doppler-Effekt I
Abb. 1.6 Klassischer Doppler-Effekt II
Der Beobachter S befindet sich in Abb. 1.6 zur Zeit t = 0 an der Stelle von S und bewegt sich in dem Zeitintervall t um die Strecke vt nach rechts. Dabei zählt er die Wellenberge, die an ihm vorbeilaufen und die in Abb. 1.6 wieder fett markiert sind. Die Anzahl N , die er zählt, ist wegen seiner Bewegung in Ausbreitungsrichtung der Welle geringer als die von S. Das Verhältnis von N zu N ist das gleiche wie das der Strecken (c − v)t zu ct, also (c − v)t N = = 1 − v/c. N ct
18
1 Grundlagen der Speziellen Relativitätstheorie
Für die Frequenzen folgt daraus f =
N N = (1 − v/c) = (1 − v/c) f . t t
(1.13)
f ist also kleiner als f , der bewegte Beobachter nimmt das Licht mit geringerer Frequenz wahr, d. h., für ihn ist die Farbe des Lichts zum roten Ende des Lichtspektrums verschoben. Das ist der Grund, warum man von Rotverschiebung spricht. Bewegt sich der Beobachter S allerdings auf die Lichtquelle zu, so muss man in obiger Formel v durch −v ersetzen, und man erhält f > f . Diesen Effekt nennt man Blauverschiebung. Schon in dieser klassischen Betrachtung ist klar geworden, dass die Frequenz einer Welle keine intrinsische Eigenschaft ist, sondern von der Bewegung des Beobachters abhängt, der die Frequenz misst. Doppler-Effekt in der Speziellen Relativitätstheorie Die Formel (1.13) gilt für Geschwindigkeiten deutlich unterhalb der Lichtgeschwindigkeit. Für astronomische Anwendungen (Messungen von Abstandsveränderungen von Objekten, Bestimmung von Planeten in anderen Sonnensystemen) reicht sie meist aus. Aber auch auf der Erde, etwa bei der Geschwindigkeitsmessung über Radar, findet sie Anwendung. Bei größeren Geschwindigkeiten muss die Formel an die Erfordernisse der Speziellen Relativitätstheorie angepasst werden. Gemäß der Zeitdilatation wird im Inertialsystem S die Zeit t = t · 1 − v 2 /c2 gemessen, woraus für die Frequenzen N N 1 − v/c f = (1 − v/c) = √ t (1 − v/c)(1 + v/c) t 1 − v 2 /c2 1 − v/c f = 1 + v/c
f =
(1.14)
folgt. Diese Beziehung nennt man relativistischen Doppler-Effekt. Auch in diesem Fall gilt, dass sich die Formel „umdreht“, wenn sich der Beobachter auf die Lichtquelle zubewegt bzw. die Lichtquelle auf einen Beobachter zukommt, da man die Geschwindigkeit v durch −v ersetzen muss. Der Doppler-Effekt führt dazu, dass man bei der Registrierung einer Lichtwelle im Weltraum deren Ausgangsfrequenz grundsätzlich nicht feststellen kann, wenn die Geschwindigkeit der Lichtquelle nicht bekannt ist. Jeder Beobachter misst eine andere Frequenz der Lichtwelle, was wieder ein schönes Beispiel für die „Demokratie“ der Inertialsysteme ist.
1.6
1.6
Lorentz-Transformationen
19
Lorentz-Transformationen
Wir wollen zunächst mithilfe der Längenkontraktion die sogenannte spezielle LorentzTransformation herleiten und nehmen dafür wieder an, dass sich zwei Inertialsysteme S und S relativ zueinander mit der Geschwindigkeit v = (v, 0, 0) entlang der x-Achse bewegen. Wir nehmen an, dass die beiden Koordinatensysteme zur Zeit t = t = 0 übereinander lagen. In Abb. 1.7 liegt ein Stab der Länge L auf der x -Achse mit der linken Seite im Ursprung von S . Nach einer Zeitspanne t hat die rechte Seite des Stabes die Koordinatenpositionen x = L und x = vt + (L/γ ), wobei wir die Längenkontraktion (1.11) für den Stab im Inertialsystem S benutzt haben. Setzt man die erste Gleichung in die zweite ein, so ergibt sich x = γ (x − vt) . (1.15) Nun tauschen wir die Rollen von S und S und schauen uns Abb. 1.8 an. Der Stab befindet sich im System S, das sich aus Sicht S nach links bewegt, in Ruhe. Die Länge des Stabes gemessen in S beträgt L/γ . Wir erhalten analog zu oben für die Koordinaten x = L und x = −vt + (L/γ ), also zusammenfassend
Abb. 1.7 LorentzTransformation I
Abb. 1.8 LorentzTransformation II
20
1 Grundlagen der Speziellen Relativitätstheorie
x = γ x + vt .
(1.16)
Wir setzen (1.15) in (1.16) ein:
x = γ γ (x − vt) + vt ⇒ γ vt = x − γ 2 x + γ 2 vt, woraus t =
γx 1 − γ2 v x − + γt = γt + x =γ t− 2 x γv v γv c
(1.17)
folgt. Damit haben wir für den Fall v = (v, 0, 0) die speziellen Lorentz-Transformationen gefunden. Die Herleitung basierte auf der Längenkontraktion, die wiederum aus der Zeitdilatation folgt, d. h., die Lorentz-Transformationen sind eine unmittelbare Folge der postulierten Konstanz der Lichtgeschwindigkeit. Wir fassen die spezielle Lorentz-Transformation nochmals zusammen: v t = γ t − 2 x c x = γ (x − vt) y = y z = z
(1.18)
Diese vier Gleichungen wurden schon Ende des 19. Jahrhunderts (also vor Einstein) von dem niederländischen Physiker H. A. Lorentz (1853–1928) im Rahmen seiner Untersuchungen zur Äthertheorie aufgestellt. Ist die Relativgeschwindigkeit v klein gegen die Lichtgeschwindigkeit v c, so ist v 2 /c2 ≈ 0 und x · v/c2 ≈ 0, d. h., für kleine Geschwindigkeiten geht die spezielle Lorentz-Transformation in die spezielle Galilei-Transformation (1.5) über. Die Lorentz-Transformationen gelten auch für die (infinitesimalen) Koordinatenintervalle. Ist z. B. x = x2 − x1 , x = x2 − x1 , t = t2 − t1 , so folgt x = x2 − x1 = γ (x2 − vt2 ) − γ (x1 − vt1 ) = γ (x2 − x1 ) − v (t2 − t1 ) = γ (x − vt) . Insgesamt erhält man:
1.6
Lorentz-Transformationen
21
v t = γ t − 2 x , x = γ (x − vt) , y = y, z = z c v dt = γ dt − 2 d x , d x = γ (d x − vdt) , dy = dy, dz = dz (1.19) c Sind die Koordinaten t , x , y , z des bewegten Systems S bekannt, so kann man diese in die Koordinaten des eigenen Systems umrechnen. Beachtet man, dass sich das Vorzeichen der Relativgeschwindigkeit v ändert, wenn man S als ruhend und S als bewegt annimmt, so erhält man die umgekehrten Lorentz-Transformationen: v t = γ t + 2 x c
x = γ x + vt y = y z = z
(1.20)
Analog ergeben sich die umgekehrten Lorentz-Transformationen für die (infinitesimalen) Koordinatenintervalle. Folgerungen aus den Lorentz-Transformationen Aus den Lorentz-Transformationen ergeben sich unmittelbar einige der im letzten Abschnitt direkt aus den Einstein’schen Postulaten hergeleiteten Ergebnisse: 1. Passieren zwei Ereignisse am selben Ort (x = 0) mit Zeitunterschied t, so folgt aus (1.19) t = γ t, also die Zeitdilatation (1.10). 2. Ein Stab der Länge L ruhe im System S , die Koordinaten der Stabenden seien x1 und x2 , d. h. L = x2 − x1 . Will ein Beobachter im System S die Länge des Stabes messen, so muss er dafür (für ihn) gleichzeitig Stabanfang und Stabende messen, andernfalls wäre das Messergebnis durch die Relativgeschwindigkeit zwischen den beiden Systemen verfälscht. Daraus folgt mit (1.19) L = x2 − x1 = γ (x2 − vt2 ) − γ (x1 − vt1 ) = γ (x2 − x1 ) t2 =t1
= γ L, also die Längenkontraktion (1.11).
22
1 Grundlagen der Speziellen Relativitätstheorie
3. Wie bei dem Additionsgesetz für Geschwindigkeiten in der Newton’schen Mechanik (1.9) nehmen an, dass sich ein Teilchen im Inertialsystem S mit Geschwindigkeit wir u = u x , u y , u z entlang der positiven x-Achse bewegt und dass zwischen S und S die Relativgeschwindigkeit v = (v, 0, 0) beträgt. Dann folgt mit der umgekehrten Lorentz-Transformation für die Geschwindigkeit u im System S
γ d x + vdt dx ux + v x u = = 2 = dt 1 + u x v/c2 γ dt + v/c d x
uy =
dy dy uy
= 2 = dt γ dt + v/c d x γ 1 + u x v/c2
dz dz uz
u = = 2 = dt γ dt + v/c d x γ 1 + u x v/c2 z
(1.21)
das Additionsgesetz für Geschwindigkeiten in der SRT. Sind u x und v klein gegen über der Lichtgeschwindigkeit, so ist der Faktor u x v/c2 nahe null, und man erhält die Additionsformel für Geschwindigkeiten (1.9) in der Newton’schen Welt. Betrachten wir noch ein paar Spezialfälle. Beispiel 1.3
1. Die aktuell schnellste Rakete hat eine Höchstgeschwindigkeit von ca. u = 10.000 km/h ≈ 2,8 km/s, die Erde wiederum bewegt sich mit etwa v = 30 km/s auf ihrer Umlaufbahn um die Sonne. Schießt man die Rakete in Richtung der Erdumlaufbahn ab, so ist die Geschwindigkeit der Rakete für einen Beobachter, der sich nicht mit der Erde bewegt, u=
32,8 = 32,8 km/s − 0,03 mm/s, 84 1+ 300.0002
im Vergleich zu 32,8 km/s in der Newton’schen Mechanik, d. h., das relativistische Additionstheorem spielt in der heutigen Raumfahrt keine Rolle. 2. In Teilchenbeschleunigern wie dem LHC in Genf können Elementarteilchen auf Geschwindigkeiten beschleunigt werden, die nahe bei der Lichtgeschwindigkeit sind. Unterstellen wir u = v = 0,8 c, so folgt u=
1,6 c 1 + (0,8c/c)
2
Hier ist der relativistische Effekt groß.
=
1,6 c = 0,975 c. 1 + 0,64
1.6
Lorentz-Transformationen
23
3. Gilt u = v = c, so folgt u=
c+c u + v = = c. 1 + u v/c2 1 + c · c/c2
Wir können feststellen, dass durch Addition von Geschwindigkeiten die Lichtgeschwindigkeit nie überschritten werden kann. Spezielle Lorentz-Transformation mit beliebiger Relativgeschwindigkeit Bislang haben wir bei der Herleitung der Lorentz-Transformation der Einfachheit halber immer unterstellt, dass sich der Beobachter im System S parallel zur x-Achse mit der Geschwindigkeit v = (v, 0, 0) bewegt. Diese Voraussetzung lassen wir jetzt fallen und leiten die speziellen Lorentz-Transformationen für beliebige Relativgeschwindigkeiten her. Wir unterstellen, dass die Koordinatenursprünge von S und S zur Zeit t = t = 0 über
einstimmen. S bewegt sich relativ zu S mit der Geschwindigkeit v = v 1 , v 2 , v 3 . Die räumlichen Komponenten im System S seien x = (x, y, z). Wir nutzen im Weiteren die S
Tatsache, dass sich ein dreidimensionaler Vektor x in einen Vektor x parallel zu v und einen Vektor x⊥ senkrecht zu v aufteilen lässt, siehe Abb. 1.9: x =
v · x
v | v |2 x⊥ = x − x , wobei x die Projektion von x auf v genannt wird (siehe [5]). Nach Definition des Skalarproduktes folgt v · x = v · ( x + x⊥ ) = v · x = | v | x . Es gilt folgende Lorentz-Transformation für das System S : | v · x v| t = γ t − 2 x = γ t − 2 c c
Abb. 1.9 Zerlegung eines Vektors
24
1 Grundlagen der Speziellen Relativitätstheorie
x = γ ( x − vt)
x ⊥ = x⊥
(1.22)
Die letzte Gleichung folgt aus der Tatsache, dass Längen senkrecht zur Relativgeschwindigkeit nicht verändert werden. Wir setzen nun die Ausdrücke für x und x⊥ ein und erhalten x = x + x ⊥
= γ x − vt + x − x v · x v · x =γ v − vt + x − v 2 | | v| v |2 v · x v − γ vt. = x + (γ − 1) | v |2 Insgesamt erhalten wir also die speziellen Lorentz-Transformationen mit beliebiger Relativgeschwindigkeit, die man auch Boosts nennt: v · x t =γ t− 2 c v · x v − γ vt. (1.23) x = x + (γ − 1) | v |2 Im weiteren Verlauf unserer Überlegungen greifen wir allerdings meistens auf die einfache Form der speziellen Lorentz-Transformation (d. h. Relativbewegung parallel zur x-Achse) zurück, falls nicht explizit etwas anderes gesagt wird.
1.7
Raumzeitintervalle
In diesem Abschnitt wollen wir anfangen, uns mit der Frage zu beschäftigen, was Raumzeit bedeutet und wie man (geometrische) Größen identifiziert, die beobachterunabhängig sind. Eine erste solche Größe, nämlich die Lichtgeschwindigkeit c im Vakuum, ist als Postulat der Speziellen Relativitätstheorie gesetzt. Wir haben in den letzten Abschnitten gezeigt, dass Beobachter, die sich in unterschiedlichen Inertialsystemen befinden, Zeitabschnitte und Strecken unterschiedlich wahrnehmen, d. h., in der Speziellen Relativitätstheorie gibt es anders als in der Newton’schen Physik keine unabhängigen Orts- oder Zeitangaben mehr. Die sogenannte Raumzeit, die Raum und Zeit verbindet, tritt an die Stelle der getrennten Konstrukte Raum und Zeit. Konkret definieren wir die Raumzeit als Menge aller möglichen Ereignisse. Da ein Ereignis immer durch Raumund Zeitangaben beschrieben wird, benötigt man zur Festlegung eines Ereignisses A die vier Größen (ct, x, y, z), wobei ct die Zeitkoordinate (jetzt in Längeneinheiten gemessen) und x, y, z die Raumkoordinaten in einem Inertialsystem S bezeichnen. In einem anderen Inertialsystem S wird das gleiche Ereignis A mit (im Allgemeinen unterschiedlichen) Koor-
1.7
Raumzeitintervalle
25
dinaten (ct , x , y , z ) beschrieben. Wegen dieser vier benötigten Angaben bezeichnet man die Raumzeit auch als vierdimensional bzw. die Zeit als vierte Dimension. In einem späteren Kapitel werden wir uns tiefer mit den Strukturen der Raumzeit befassen und beispielsweise zeigen, dass sich die Raumzeit als Menge von vierdimensionalen Vektoren darstellen lässt. Hier wollen wir zunächst zeigen, dass für zwei Ereignisse A1 = (ct1 , x1 , y1 , z 1 ) und A2 = (ct2 , x2 , y2 , z 2 ) die Größe s 2 = −c2 (t2 − t1 )2 +(x2 − x1 )2 +(y2 − y1 )2 +(z 2 − z 1 )2 = −c2 t 2 +x 2 +y 2 +z 2 , (1.24) die man Raumzeitintervall (oder auch Abstandsquadrat der Ereignisse A1 und A2 ) nennt, Lorentz-invariant ist, also in jedem Inertialsystem denselben Wert annimmt.
Aufgabe 1.2 Zeigen Sie die Invarianz der Raumzeitintervalle:
s 2 = s 2
(1.25)
für zwei Inertialsysteme S und S , die sich mit der Relativgeschwindigkeit v = (v, 0, 0) zueinander bewegen. Lösung Wir unterstellen, dass sich zwei Inertialsysteme S und S mit der Relativgeschwindigkeit v = (v, 0, 0) zueinander bewegen, und zeigen die Invarianz von s 2 mit der Transformation (1.19): s 2 = −c2 t 2 + x 2 + y 2 + z 2 2 v = −c2 γ t − 2 x + (γ (x − vt))2 + y 2 + z 2 c v2 = γ 2 −c2 t 2 + 2vxt − 2 x 2 + x 2 − 2vxt + v 2 t 2 + y 2 + z 2 c 2 v v2 = γ 2 − 1 − 2 c2 t 2 + 1 − 2 x 2 + y 2 + z 2 c c = −c2 t 2 + x 2 + y 2 + z 2 = s 2 Sind die Zeit- und Raumintervalle infinitesimal klein, so schreibt man für das infinitesimale Raumzeitintervall (auch – wie im Dreidimensionalen – Linienelement genannt) ds 2 = −c2 dt 2 + d x 2 + dy 2 + dz 2 .
(1.26)
26
1 Grundlagen der Speziellen Relativitätstheorie
Man beachte, dass der Ausdruck c · t die Dimension einer Länge hat und somit als gleichberechtigte, die Zeit repräsentierende vierte Dimension neben den drei Raumdimensionen x, y, z angesehen werden kann. Das Minuszeichen vor der Größe c · t zeigt uns aber schon, dass wir keine „normalen“ Intervalle messen (normal im Sinne einer euklidischen Erweiterung von drei auf vier Dimensionen wäre als Abstandsquadrat die Größe: c2 t 2 +x 2 +y 2 +z 2 ). In der Raumzeit werden (invariante) Abstände also anders gemessen als im Raum. Und da die Art und Weise, wie man Abstände misst, die Geometrie eines Raumes mitbestimmt, ist die Geometrie der Raumzeit nicht euklidisch. Dieses wollen wir ein wenig detaillierter beleuchten und schauen uns das Quadrat des Raumzeitintervalls s 2 etwas näher an: s 2 = −
+ x 2 + y 2 + z 2 c2 t 2 Quadrat der Strecke, Quadrat des die das Licht in der r¨aumlichen Zeit t zur¨ucklegt Abstandes
Das Symbol s 2 ist dabei nur eine Bezeichnung, man darf nicht davon ausgehen, dass damit immer auch eine (positive) Quadratzahl vorliegt. Im Gegenteil ist in den meisten interessierenden Fällen der Ausdruck −c2 t 2 + x 2 + y 2 + z 2 negativ! Wir können drei Fälle unterscheiden: 1. Ein Lichtstrahl wird am Ort 1 abgesendet (Ereignis 1) sowie am Ort 2 empfangen (Ereignis 2). Dann ist der räumliche Abstand x 2 + y 2 + z 2 genauso groß wie der Lichtweg c · t, also gilt s 2 = 0. (1.27) Zwei Ereignisse, die durch Lichtstrahlen verbunden werden können, heißen lichtartig zueinander und haben das Raumzeitintervall null! Das ist ein erster wesentlicher Unterschied zur euklidischen Abstandsmessung. Dort haben Abstände nur dann den Wert null, wenn die Punkte zusammenfallen. 2. Ein Lichtstrahl wird am Ort 1 abgesendet (Ereignis 1). Das Ereignis 2 findet am Ort 2 statt, nachdem der Lichtstrahl Ort 2 passiert hat. Der Laufweg des Lichtes ist also größer als der räumliche Abstand der beiden Ereignisse c · t > x 2 + y 2 + z 2 , d. h. s 2 < 0. (1.28) Zwei Ereignisse, deren Raumzeitintervall kleiner als null ist, heißen zeitartig zueinander. Da der räumliche Abstand zwischen den beiden Ereignissen kleiner als der Lichtlaufweg ist, kann das Ereignis 2 durch das Ereignis 1 beeinflusst werden, z. B. indem der Lichtstrahl, der am Ort 2 empfangen wird, einen Mechanismus in Gang setzt, der das Ereignis 2 auslöst. Man sagt dann auch, dass die beiden Ereignisse kausal zusammenhängen. Wenn sich materielle Teilchen von Ereignis 1 (Start am Ort 1) zu Ereignis 2 (Ankunft am Ort 2) bewegen sollen, so muss das Raumzeitintervall zwischen den beiden
1.7
Raumzeitintervalle
27
Ereignissen also zeitartig sein. Im Ruhesystem der materiellen Teilchen passieren die beiden Ereignisse nacheinander am selben Ort, denn aus Sicht der Teilchen fliegt der Ort 1 am Teilchen vorbei (Ereignis 1) und nach einer Zeitspanne der Ort 2 (Ereignis 2). Im Inertialsystem der Teilchen ist der räumliche Abstand zwischen den beiden Ereignissen gleich null x 2 + y 2 + z 2 = 0, d. h., es ist s 2 = −c2 t 2 . Dieses Zeitintervall im Ruhesystem nennt man auch Eigenzeit und benutzt dafür die Schreibweise s 2 = −c2 τ 2 . (1.29) Wegen der Invarianz des Raumzeitintervalls sind sich alle Beobachter einig über den Wert der im Ruhesystem gemessenen Eigenzeit. Das Quadrat des Raumzeitintervalls ist im Ruhesystem maximal negativ. Auch das hört sich gewöhnungsbedürftig an. Wenn man an einem Ort ruht, bewegt man sich doch (sogar maximal) durch die Raumzeit. 3. Ein Lichtstrahl wird am Ort 1 abgesendet (Ereignis 1). Das Ereignis 2 findet am Ort 2 statt, bevor der Lichtstrahl Ort 2 passiert hat. Der Laufweg des Lichtes ist also kleiner als der räumliche Abstand der beiden Ereignisse: c · t < x 2 + y 2 + z 2 d. h. s 2 > 0 (1.30) Zwei Ereignisse, deren Raumzeitintervall größer als null ist, heißen raumartig zueinander. Da der räumliche Abstand zwischen den beiden Ereignissen größer als der Lichtlaufweg ist, kann das Ereignis 2 nicht durch das Ereignis 1 beeinflusst werden, denn ein Signal von Ereignis 1 zu Ereignis 2 müsste sich mit Überlichtgeschwindigkeit bewegen. Im Extremfall geschehen für einen Beobachter die beiden räumlich getrennten Ereignisse gleichzeitig, d. h. c2 t 2 = 0, also ist das Raumzeitintervall s 2 = x 2 + y 2 + z 2 maximal positiv und entspricht (dem Quadrat) der Eigenlänge. Für andere Beobachter ist zwar die Gleichzeitigkeit zerstört, für einige liegt das Ereignis 1 zeitlich vor dem Ereignis 2, für wieder andere ist es genau umgekehrt, aber alle messen das gleiche Raumzeitintervall. Da das Raumzeitintervall eine invariante Größe ist, sind sich alle Beobachter immer darüber einig, ob zwei Ereignisse licht-, zeit- oder raumartig zueinander sind. Die Raumzeit lässt sich also überschneidungsfrei in drei Regionen aufteilen.
28
1 Grundlagen der Speziellen Relativitätstheorie
Abb. 1.10 Raumzeit mit Lichtkegel
1. Ereignisse, die durch Lichtstrahlen mit dem Ursprung verbunden sind, liegen auf den Winkelhalbierenden. Diese Ereignisse haben wir lichtartig genannt. 2. Ereignisse, deren Weltlinie innerhalb der durch die Winkelhalbierenden markierten Bereiche, die man auch Lichtkegel nennt (in Abb. 1.10 durch Hinzunahme einer weiteren Raumdimension mithilfe von Ellipsen angedeutet), liegt, lassen sich in der oberen Hälfte (t > 0) vom Ursprung aus mit einer Geschwindigkeit erreichen, die kleiner als die Lichtgeschwindigkeit ist, sie sind also zeitartig. Die Ereignisse in der unteren Hälfte des Lichtkegels können das Ereignis im Ursprung beeinflussen, diese finden früher statt (t < 0). Die obere Hälfte des Lichtkegels nennt man deswegen Zukunft, die untere Hälfte Vergangenheit des Ereignisses im Ursprung. 3. Ereignisse, die außerhalb der Lichtkegel liegen. Diese lassen sich nicht durch Signale vom Ursprung erreichen, sie sind raumartig.
1.8
Lorentz- und Poincaré-Gruppe
Bislang haben wir die speziellen Lorentz-Transformationen (Boosts) untersucht, und wir machen uns nun auf die Suche nach weiteren Koordinatentransformationen, die das Raumzeitintervall s 2 = −c2 t 2 + x 2 + y 2 + z 2 invariant lassen. Wir schreiben den Ausdruck auf der rechten Seite als
1.8
Lorentz- und Poincaré-Gruppe
29
⎛
−1 ⎜ 0 2 2 2 2 2 − c t + x + y + z = (ct, x, y, z) ⎜ ⎝ 0 0
0 1 0 0
0 0 1 0
⎞⎛ ⎞ 0 ct ⎜ ⎟ 0⎟ ⎟ ⎜ x ⎟ . ⎠ ⎝ 0 y ⎠ 1 z
(1.31)
Die 4 × 4-Matrix ⎛
η = ημν
−1 ⎜ 0 =⎜ ⎝ 0 0
0 1 0 0
0 0 1 0
⎞ 0 0⎟ ⎟ = diag (−1, 1, 1, 1) , μ, ν = 0, 1, 2, 3 0⎠
(1.32)
1
nennt man Minkowski-Metrik oder auch Minkowski-Tensor (in kartesischen Koordinaten). Beispiel 1.4
Wir berechnen das infinitesimale Raumzeitintervall und die Minkowski-Metrik in Kugelkoordinaten: x = r sin ϑ cos ϕ, y = r sin ϑ sin ϕ, z = r cos ϑ Es gilt d x = sin ϑ cos ϕ dr + r cos ϑ cos ϕ dϑ − r sin ϑ sin ϕ dϕ dy = sin ϑ sin ϕ dr + r cos ϑ sin ϕ dϑ + r sin ϑ cos ϕ dϕ dz = cos ϑ dr − r sin ϑ dϑ. Quadrieren, Summieren und Vereinfachen führt zu ds 2 = −c2 dt 2 + dr 2 + r 2 dϑ 2 + r 2 sin2 ϑ dϕ 2 .
(1.33)
Die zugehörige Minkowski-Metrik ist ⎛
η = ημν
−1 ⎜ 0 =⎜ ⎝ 0 0
⎞ 0 0 0 ⎟ 1 0 0 ⎟ , μ, ν = 0, 1, 2, 3. 2 ⎠ 0 0r 2 2 0 0 r sin ϑ
(1.34)
Mit der Minkowski-Metrik und
30
1 Grundlagen der Speziellen Relativitätstheorie
⎛
⎞ ct ⎜ x ⎟ ⎟ X = ⎜ ⎝ y ⎠ z können wir das Raumzeitintervall (1.31) auch kurz als −c2 t 2 + x 2 + y 2 + z 2 = X T ηX schreiben. Wir betrachten nun die Abbildung X → X = X , wobei eine lineare Transformation ist, die die Forderung !
X T ηX = ( X )T η ( X ) = X T T η X = X T ηX , d. h.
!
T η = η
(1.35)
erfüllen soll. Die Menge dieser Transformationen bezeichnet man als Lorentz-Gruppe bzw., wenn man noch die Translationen hinzunimmt, als inhomogene Lorentz-Gruppe (oder Poincaré-Gruppe). Die Relation (1.35) ist das Pendant zu (1.1), d. h. zur Orthogonalität der Drehungen im Dreidimensionalen: x T x = I ⇔ x T I x = I , d. h., was im dreidimensionalen euklidischen Raum die Identität ⎞ ⎛ 100
I = δi j = ⎝ 0 1 0 ⎠ 001 ist, ist in der Raumzeit die Metrik η. Wegen der Eins-zu-eins-Korrespondenz zwischen linearen Abbildungen und Matrizen (siehe [5]) schreiben wir die Lorentz-Transformationen auch als Lorentz-Matrizen:
= μν , μ, ν = 0, 1, 2, 3 ,
(1.36)
wobei der obere Index den Zeilen- und der untere den Spaltenindex bezeichnet. Warum wir die Indexstellung so wählen, wird später klar werden. Wir wollen an dieser Stelle nicht alle Einzelheiten der Lorentz-Gruppe auflisten, sondern zeigen, dass die für uns wichtigen Rotationen und Boosts dazugehören.
1.8
Lorentz- und Poincaré-Gruppe
31
Rotationen und Boosts Rotationen
Die Bedingung (1.35) für die Lorentz-Matrizen lautet ausgeschrieben 3 μ,ν=0
!
ημν μρ ν σ = ηρσ .
(1.37)
Wir zeigen, dass diese Bedingung für eine Rotation um die z-Achse erfüllt ist. Sei ϕ der Drehwinkel, dann gilt für die Koordinaten im gedrehten System S ct = ct x = x cos ϕ + y sin ϕ y = −x sin ϕ + y cos ϕ z = z.
(1.38)
Die korrespondierende Lorentz-Matrix ist ⎛
⎞ 1 0 0 0
⎜ 0 cos ϕ sin ϕ 0 ⎟ ⎟
= μν = ⎜ ⎝ 0 − sin ϕ cos ϕ 0 ⎠ , 0 0 0 1
(1.39)
und es gilt (1.35):
T η = η
Aufgabe 1.3. Zeigen Sie, dass für die Matrix (1.39) die Lorentz-Bedingung (1.35) erfüllt ist.
Lösung. Wir überprüfen, ob (1.35) erfüllt ist: ⎛
1 ⎜ 0
T η = ⎜ ⎝0 0 ⎛ 1 ⎜0 =⎜ ⎝0 0
⎞⎛ ⎞⎛ ⎞ 0 −1 0 0 0 1 0 0 0 ⎜ ⎟⎜ ⎟ 0⎟ ⎟ ⎜ 0 1 0 0 ⎟ ⎜ 0 cos ϕ sin ϕ 0 ⎟ 0 ⎠ ⎝ 0 0 1 0 ⎠ ⎝ 0 − sin ϕ cos ϕ 0 ⎠ 1 0 001 0 0 0 1 ⎞⎛ ⎞ 0 0 0 −1 0 0 0 ⎜ 0 cos ϕ sin ϕ 0 ⎟ cos ϕ − sin ϕ 0 ⎟ ⎟⎜ ⎟ sin ϕ cos ϕ 0 ⎠ ⎝ 0 − sin ϕ cos ϕ 0 ⎠ 0 0 1 0 0 0 1 0 0 cos ϕ − sin ϕ sin ϕ cos ϕ 0 0
32
1 Grundlagen der Speziellen Relativitätstheorie
⎛
−1 ⎜ 0 =⎜ ⎝ 0 0
0 1 0 0
0 0 1 0
⎞ 0 0⎟ ⎟=η 0⎠ 1
Die Lorentz-Bedingung (1.35) gilt auch für die Drehungen um die anderen Achsen. Das bedeutet, dass die Drehmatrizen um die Koordinatenachsen Elemente der Lorentz-Gruppe sind. Da sich nach (1.2) eine beliebige Drehung als eine Hintereinanderausführung von Drehungen um die Achsen darstellen lässt, sind die allgemeinen Drehungen ebenfalls Elemente der Lorentz-Gruppe. Boosts Wir betrachten nun einen Boost entlang der x-Achse und können die Lorentz-Transformation (1.18) auf unsere Koordinaten ct, x, y, z umschreiben: v ct = γ ct − x v c x = γ − ct + x c y = y z = z,
(1.40)
woraus sich die korrespondierende Matrix ablesen lässt: ⎛
=
μν
γ
⎜ ⎜ −γ v =⎜ c ⎜ ⎝ 0 0
⎞ v 00 c ⎟ γ 0 0⎟ ⎟, ⎟ 0 1 0⎠ 0 01
−γ
(1.41)
und es gilt
T η = η.
Aufgabe 1.4. Zeigen Sie, dass für die Boost-Matrix (1.41) die Lorentz-Bedingung (1.35) erfüllt ist.
Lösung. Wir überprüfen, ob auch hier die Bedingung (1.35) erfüllt ist:
1.8
Lorentz- und Poincaré-Gruppe ⎛
33
⎞ ⎞ ⎛ v v 0 0 ⎛ −1 0 0 0 ⎞ γ −γ 0 0 c c ⎜ ⎟ ⎟ ⎜ v v ⎜ ⎟⎜ ⎟ ⎟⎜ γ 0 0 ⎟ ⎜ 0 1 0 0 ⎟ ⎜ −γ γ 0 0⎟ −γ
T η = ⎜ ⎜ ⎟⎝ 0 0 1 0⎠⎜ ⎟ c c ⎝ 0 ⎝ 0 0 1 0⎠ 0 1 0⎠ 0 001 0 0 01 0 0 01 ⎛ ⎞⎛ ⎞ v v −γ γ 0 0 γ −γ 0 0 c ⎜ ⎟⎜ ⎟ v v c ⎜ ⎟⎜ ⎟ γ 0 0 γ 0 0 −γ −γ ⎜ ⎜ ⎟ ⎟ =⎜ ⎟⎜ ⎟ c c ⎝ 0 0 1 0⎠⎝ 0 0 1 0⎠ 0 0 01 0 0 01 ⎛ ⎞ v 2 ⎛ ⎞ 2 + γ2 2 v − γ2 v 0 0 −γ γ −1 0 0 0 ⎜ ⎟ c c c ⎜ ⎟ ⎜ 0 1 0 0⎟ v v v 2 ⎜ ⎟ −γ 2 + γ2 0 0⎟ = ⎜ γ2 − γ2 ⎟=⎜ c c c ⎜ ⎟ ⎝ 0 0 1 0⎠ ⎝ 0 0 1 0⎠ 0 001 0 0 01 γ
−γ
Die Boosts gehören damit ebenfalls zur Lorentz-Gruppe. Wir übertragen noch die spezielle
Lorentz-Transformation mit beliebiger Relativgeschwindigkeit v = v 1 , v 2 , v 3 in die neue Schreibweise. Die Lorentz-Matrix des allgemeinen Boosts lautet nach (1.23): ⎛
= μν
γ
⎜ ⎜ ⎜ ⎜ −γ ⎜ =⎜ ⎜ ⎜ −γ ⎜ ⎜ ⎝ −γ
v2 v3 −γ c c v1v1 v1v2 v1v3 1 + (γ − 1) − 1) − 1) (γ (γ | | | v |2 v |2 v |2 v2 v2 v2 v3 v2 v1 1 + (γ − 1) (γ − 1) (γ − 1) | | | v |2 v |2 v |2 3 1 3 2 v3v3 v v v v 1 + − 1) − 1) (γ (γ (γ − 1) | | | v |2 v |2 v |2 −γ
v1 c v2 c v3 c
v1 c
−γ
⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ (1.42) ⎟ ⎟ ⎟ ⎟ ⎠
bzw. etwas knapper ⎛ ⎜
= μν = ⎜ ⎝
γ
vj −γ c
⎞
⎟ ⎟ vi v j ⎠ vi i δ j + (γ − 1) −γ c | v |2
(1.43)
mit i, j = 1, 2, 3. Verwandtschaft von Rotationen und Boosts Wir schauen uns einige Ähnlichkeiten zwischen Drehungen und Boosts an. Wir wissen, dass sich im Zweidimensionalen die Koordinaten in einem um den Winkel ϕ gedrehten Koordinatensystem S durch
34
1 Grundlagen der Speziellen Relativitätstheorie
x y
=
cos ϕ sin ϕ − sin ϕ cos ϕ
x y
aus den Koordinaten im System S berechnen lassen. Die trigonometrischen Funktionen werden am rechtwinkligen Dreieck durch sin ϕ =
y x2
+
y2
, cos ϕ =
x x2
+
y2
, tan ϕ =
y x
definiert, siehe Abb. 1.11. Die hyperbolischen Funktionen werden analog an der Einheitshyperbel x 2 − y 2 = 1 durch y x y sinh ϕ = (1.44) , cosh ϕ = , tanh ϕ = 2 2 2 2 x x −y x −y definiert. Hier ist der Parameter ϕ zwar kein Winkel, sondern der Flächeninhalt der markierten Fläche in Abb. 1.12, wir können aber trotzdem die Ähnlichkeiten in den Definitionen erkennen. Ist v = (v, 0, 0) die Relativgeschwindigkeit zwischen zwei Inertialsystemen S und S , und definieren wir den Parameter ϕ als Rapidität durch tanh ϕ = so folgt mit y =
v , c
v und x = 1 aus der Definition (1.44) c
Abb. 1.11 Sinus und Kosinus am rechtwinkligen Dreieck
1.8
Lorentz- und Poincaré-Gruppe
35
Abb. 1.12 Sinh und Cosh an der Einheitshyperbel
cosh ϕ =
sinh ϕ =
x x2
−
y2
y x2
−
y2
=
=
1 v2 1− 2 c v/c 1−
v2
=γ
=γ
v , c
c2
d. h., wir können die spezielle Lorentz-Transformation entlang der x-Achse (1.41) auch durch ⎛ ⎞ cosh ϕ − sinh ϕ 0 0 ⎜ − sinh ϕ cosh ϕ 0 0 ⎟ ⎟ (1.45)
= μν = ⎜ ⎝ 0 0 1 0⎠ 0 0 01 darstellen. Wir zeigen, dass durch diese Matrix eine (sogenannte „raumzeitliche“) Drehung der Koordinatenachsen von S in der (x, t)-Ebene bewirkt wird. Dazu schauen wir uns das Raumzeitdiagramm in Abb. 1.13 an. Die Weltlinie eines Teilchen, das im Inertialsystem S im Ursprung ruht, d. h. x = y = z = 0,
36
1 Grundlagen der Speziellen Relativitätstheorie
Abb. 1.13 Raumzeitdiagramm
ist die ct -Achse. Mit der speziellen Lorentz-Transformation (1.45) folgt 0 = x = − sinh ϕ ct + cosh ϕ x ⇒ ct =
1 x. tanh ϕ
Für den Steigungswinkel α gilt also tan α =
1 c ct = = , x tanh ϕ v
und der Winkel β zwischen den ct- und ct -Achsen ist β=
π − α. 2
Wenn wir uns die x -Achse anschauen, so gilt dort ct = 0, d. h., mit (1.45) folgt 0 = ct = cosh ϕ ct − sinh ϕ x ⇒ ct = tanh ϕ x und damit für den Winkel β zwischen x- und x -Achse tan β =
π 1 ct = tanh ϕ = = cot α = cot − β = tan β, x tan α 2
1.8
also
Lorentz- und Poincaré-Gruppe
37
β = β.
Bewegt sich das Inertialsystem S mit positiver Geschwindigkeit v entlang der x-Achse, so bedeutet das für einen Beobachter im System S, dass sich die x - und die t -Achse um den gleichen Winkel β jeweils in Richtung der ersten Winkelhalbierenden drehen. Daher bezeichnet man die speziellen Lorentz-Transformationen auch als Pseudodrehungen.
2
Die Raumzeit der Speziellen Relativitätstheorie
2.1
Indexnotation und Einstein’sche Summenkonvention
Einstein’sche Summenkonvention
Immer wenn ein Ausdruck einen Index beinhaltet, der bei dem einen Objekt hoch und bei einem anderen tief gestellt ist, dann wird eine Summation über die Werte, die der Index annehmen kann, ausgeführt. Zum Beispiel ist der Ausdruck Aα B α eine abkürzende Schreibweise für die Summe Aα B α = A0 B 0 + A1 B 1 + A2 B 2 + A3 B 3 , wenn der Index α die Werte 0, 1, 2, 3 annehmen kann. Den Index selbst kann man frei wählen, z. B. ist Aα B α = Aβ B β = Aμ B μ .
Wird über einen Index summiert, so nennt man diesen Index Summationsindex. Enthält ein Ausdruck einen Index, über den nicht summiert wird, so nennen wir diesen Index freien Index. Ist α ein freier Index, so kann der Ausdruck Aα einen beliebigen Wert aus 0 1 2 3 A , A , A , A annehmen. Kommen in einer Gleichung freie Indizes vor, so handelt es sich immer um ein System von vier Gleichungen. Beispiel 2.1
Betrachten wir als Beispiel
A α = B αβ C β ,
so ist das die Kurzform von © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_2
39
40
2 Die Raumzeit der Speziellen Relativitätstheorie
A0 = B 0 0 C 0 + B 0 1 C 1 + B 0 2 C 2 + B 0 3 C 3 A1 = B 1 0 C 0 + B 1 1 C 1 + B 1 2 C 2 + B 1 3 C 3 A2 = B 2 0 C 0 + B 2 1 C 1 + B 2 2 C 2 + B 2 3 C 3 A3 = B 3 0 C 0 + B 3 1 C 1 + B 3 2 C 2 + B 3 3 C 3 . In einer indizierten Gleichung stehen die freien Indizes auf beiden Seiten der Gleichung immer jeweils oben bzw. unten.
Aufgabe 2.1 1. Stellen Sie die Matrixmultiplikation in der Indexschreibweise dar. 2. Schreiben Sie alle möglichen Kombinationen von Aμ B ν in Matrixform auf, wobei μ den Zeilenindex und ν den Spaltenindex bezeichne.
Lösung 1. Wir schauen uns die Matrixmultiplikation an. Seien A = A α β , B = B αβ zwei 4 × 4-Matrizen, dann ist Matrix C = AB definiert durch 3 γ γ γ C = C αβ = Aα γ B β = Aα γ B β = B β Aα γ , γ =0
d. h., in der Indexnotation darf man die Elemente vertauschen (die Indizes aber nicht!), während bei der Matrixmultiplikation im Allgemeinen AB = B A gilt. 2. Es gilt ⎞ ⎛ A0 B 0 A0 B 1 A0 B 2 A0 B 3 ⎜ A1 B 0 A1 B 1 A1 B 2 A1 B 3 ⎟ ⎟ Aμ B ν = ⎜ ⎝ A2 B 0 A2 B 1 A2 B 2 A2 B 3 ⎠ . A3 B 0 A3 B 1 A3 B 2 A3 B 3 In der Indexnotation und mit der Einstein’schen Summenkonvention ergibt sich für das Raumzeitintervall (1.24) kurz (2.1) s 2 = ημν x μ x ν . Hier haben wir die Summationsindizes unterschiedlich gewählt, was bei mehrfachen Summationen immer erforderlich ist, damit transparent bleibt, was mit wem addiert wird. Mit der Indexschreibweise und der Boost-Matrix (1.41) lassen sich die vier Gleichungen der speziellen Lorentz-Transformation (1.18) komprimiert als
2.2
Minkowski-Raum
41
x μ = μν x ν
(2.2)
aufschreiben, also im Vergleich mit der indexfreien Darstellung X = X ebenfalls kurz und kompakt. Indexnotation und Einstein’sche Summenkonvention sind hervorragende Instrumente zur Vereinfachung von Schreibweisen, allerdings erfordern sie Aufmerksamkeit und Erfahrung, und nicht ohne Grund gilt diese „Indexgymnastik“ als lernaufwendig.
Aufgabe 2.2 Zeigen Sie die Identität
−1 β η = ημρ μα . ρ αβ
Lösung Wegen der Invarianz des Raumzeitintervalls gilt
β β
ds 2 = ηα β d x α d x β = ηα β α α
d x α d x β = ηαβ d x α d x β .
Da die d x μ beliebig gewählt werden können, folgt nach Umbenennung der Indizes: ημν μα ν β = ηαβ
β Multiplikation mit der inversen Matrix −1 ρ führt zu
β
β ημν μα ν β −1 ρ = ηαβ −1 ρ ⇔
β ημν μα δρν = ηαβ −1 ρ ⇔
β ημρ μα = ηαβ −1 ρ .
2.2
Minkowski-Raum
Wir geben nun eine präzise Definition dessen, was wir in der Speziellen Relativitätstheorie unter dem Begriff Raumzeit verstehen wollen. Diese Definition werden wir in der Allgemeinen Relativitätstheorie auf sogenannte Mannigfaltigkeiten verallgemeinern.
42
2 Die Raumzeit der Speziellen Relativitätstheorie
Definition 2.1 • Die Raumzeit der Speziellen Relativitätstheorie ist ein vierdimensionaler reeller Vektorraum M, der mit einem Semi-Skalarprodukt η ausgestattet ist. Den Vektorraum M nennt man nach seinem „Erfinder“ auch Minkowski-Raum. Hermann Minkowski (1864–1909) war ein deutscher Mathematiker und Physiker, der die mathematischen Grundlagen der Speziellen Relativitätstheorie entwickelt hat. • Die Elemente des Minkowski-Raums nennen wir Raumzeitvektoren oder Vierervektoren bzw. kurz: Vektoren. Raumzeitvektoren schreiben wir meist mit großen lateinischen Buchstaben, sie unterscheiden sich in ihrer Darstellung nicht von gewöhnlichen Vektoren im R4 . Nach Wahl eines Koordinatensystems S mit einer Basis B von M, z. B. der Standardbasis, die aus den vier Vektoren
B = eμ = (e0 , e1 , e2 , e3 ) mit e0 = (1, 0, 0, 0) , e1 = (0, 1, 0, 0) , e2 = (0, 0, 1, 0) , e3 = (0, 0, 0, 1)
(2.3)
besteht, lässt sich jeder Raumzeitvektor V als V = V μ eμ darstellen, wobei die reellen Zahlen V μ die Komponenten von V (in der Basis B) genannt werden. Für die Darstellung von V = V μ eμ in einem Koordinatensystem S mit
Basis eμ schreiben wir zukünftig auch kurz:
V = V μ = V 0 , V 1 , V 2 , V 3 = V 0 , V S
und lassen das S weg, wenn klar ist, welche Basis wir gewählt haben. • Sind S und S zwei Inertialsysteme, so transformieren sich die Komponenten eines Vierervektors A unter einer Lorentz-Transformation wie die Koordinaten in (2.2), d. h.
Aμ = μν Aν , μ
(2.4)
wobei ν eine Lorentz-Matrix bezeichnet und die Einstein’sche Summenkonvention beachtet werden muss. • Die Addition und Multiplikation mit einem Skalar erfolgt wie im R4 auch bei Raumzeitvektoren komponentenweise: – Sind A = Aμ , B = B μ zwei Raumzeitvektoren, so gilt
A + B := Aμ + B μ = A0 + B 0 , A1 + B 1 , A2 + B 2 , A3 + B 3 .
2.3
Semi-Skalarprodukt im Minkowski-Raum
43
– Ist A = Aμ ein Raumzeitvektor und b ∈ R ein Skalar, so gilt
b A := b Aμ = b A0 , b A1 , b A2 , b A3 . Bemerkung 2.1 • Da wir die Raumzeit als Vektorraum definiert haben, können wir die beiden großen Vorteile der Vektordarstellung nutzen. Zum einen ist das die abkürzende Schreibweise: Statt drei oder vier Gleichungen mit Komponenten schreiben zu müssen, kommt man meistens mit einer aus. Diese koordinatenfreie Darstellung macht viele komplizierte Sachverhalte optisch deutlich einfacher. Zum anderen wollen wir erreichen, dass die Vektorgleichungen, die oftmals physikalische Gesetze sind, formgleich unter Lorentz-Transformationen sind, was man auch als Lorentz-invariant bezeichnet. Einige Lorentz-invariante Zahlen haben wir in den letzten Abschnitten kennengelernt, nämlich die Lichtgeschwindigkeit
c, das (infinitesimale) Raumzeitintervall ds 2 s 2 sowie die (infinitesimale) Eigenzeit
2 dτ τ 2 , diese nennt man auch Lorentz-Skalare. • Für Punkte (Ereignisse) in der Raumzeit werden die drei (kartesischen) Raumkoordinaten (x, y, z) um eine Zeitkomponente ct zu einem Vierervektor
x = x μ = x 0 , x 1 , x 2 , x 3 = (ct, x, y, z) erweitert.
2.3
Semi-Skalarprodukt im Minkowski-Raum
Der Hauptunterschied zwischen dem Minkowski-Raum und dem euklidischen R4 besteht darin, dass im Minkowski-Raum (raumzeitliche) Abstände anders gemessen werden als im R4 . Definition 2.2 Im Minkowski-Raum wird nach Wahl eines Inertialsystems S für zwei Raumzeitvektoren
A = A0 , A1 , A2 , A3 und B = B 0 , B 1 , B 2 , B 3 S
S
ein Semi-Skalarprodukt η durch A · B := η (A, B) := −A0 B 0 + A1 B 1 + A2 B 2 + A3 B 3 = ημν Aμ B ν
(2.5)
44
2 Die Raumzeit der Speziellen Relativitätstheorie
definiert, wobei η = ημν die Minkowski-Metrik bezeichnen. Ist A = B, so erhält man das Quadrat des Vektors:
2 2 2 2 A2 := A · A = − A0 + A1 + A2 + A3 = ημν Aμ Aν , also einen Ausdruck, der wie das Raumzeitintervall invariant unter LorentzTransformationen, d. h. ein Lorentz-Skalar ist (siehe (1.25)). • Genauso wie das Raumzeitintervall kann das Quadrat eines Vektors positiv sein, dann heißt A raumartig. • Ist das Quadrat gleich null, so heißt A lichtartig. • Und ist das Quadrat negativ, so heißt A zeitartig. Und hier ist es auch wieder so, dass aus A2 = 0 nicht generell geschlossen werden darf, dass alle Komponenten von A null sind. Bemerkung 2.2 • Das (Semi-)Skalarprodukt η ist 1. bilinear, d. h., es gilt mit beliebigen Raumzeitvektoren A, B, C, D und reellen Zahlen c1 , c2 , c3 , c4 (c1 A + c2 B) · C = c1 A · C + c2 B · C A · (c3 C + c4 D) = c3 A · C + c4 A · D, 2. symmetrisch A·B = B· A 3. und nicht ausgeartet, d. h., gilt für ein A A · B = 0, f¨ur alle B,
(2.6)
so ist A der Nullvektor, wie man für (1.) , (2.) durch Einsetzen in (2.5) nachrechnet. Die Aussage (3.) sieht man ein, wenn man der Reihe nach die vier Vektoren B0 → (1, 0, 0, 0) , B1 → (0, 1, 0, 0) , B2 → (0, 0, 1, 0) , B3 → (0, 0, 0, 1) auswählt und daraus A0 = A1 = A2 = A3 = 0 ableitet.
2.4 Transformationen
45
• Das Semi-Skalarprodukt, das wir in späteren Kapiteln auch Semi-Riemann’sche Metrik nennen werden, ist kein Skalarprodukt im üblichen Sinne, da es nicht positiv definit ist. Im dreidimensionalen euklidischen Raum gilt für das übliche Skalarprodukt zusätzlich v · v ≥ 0 und v · v = 0 ⇔ v = 0. Diese positive Definitheit liegt im Minkowski-Raum nicht vor! Zukünftig verzichten wir auf die genaue Bezeichnung „(Semi-)Skalarprodukt“ und nennen die Bilinearform η schlicht „Skalarprodukt“. • Zur Unterscheidung von M und dem Vektorraum R4 schreibt man häufig M = R1,3 .
Aufgabe 2.3 Zeigen Sie die Lorentz-Invarianz des Skalarprodukts.
Lösung Es gilt mit der Bilinearität und Symmetrie (A + B)2 = (A + B) · (A + B) = A2 + 2 A · B + B 2 , also
1 (A + B)2 − B 2 − A2 . 2 Da auf der rechten Seite ein Lorentz-Skalar steht, muss auch die linke Seite ebenfalls invariant unter Lorentz-Transformationen sein. A·B =
2.4
Transformationen
Da die Lorentz-Transformationen eine Gruppe bilden, existiert zu jedem die inverse Transformation/Matrix −1 . Multipliziert man die Gleichung (2.4) mit der inversen LorentzMatrix, so erhält man die Umkehrtransformation in Indexnotation
μ Aμ = −1 μ Aμ .
(2.7)
Transformation der Basisvektoren Wir betrachten zwei Inertialsysteme S und S mit ausgewählten Basisvektoren eμ bzw. eμ , dann lässt sich ein beliebiger Raumzeitvektor V jeweils als Linearkombination der Basisvektoren schreiben: V = V μ eμ = V μ eμ Wir transformieren die Komponenten V μ mit (2.7) und erhalten
46
2 Die Raumzeit der Speziellen Relativitätstheorie
μ V μ = −1 μ V μ ,
μ μ V μ eμ = −1 μ V μ eμ = V μ −1 μ eμ = V μ eμ .
also
Da die V μ beliebig gewählt werden können, folgt daraus die Transformationsregel für die Basisvektoren:
μ eμ = −1 μ eμ (2.8) μ
Wenn wir die Gleichung mit der zu −1 inversen Matrix ν multiplizieren, so erhalten wir μ μν eμ = μν −1 μ eμ = δνμ eμ = eν , also die Umkehrtransformation:
eμ = μμ eμ
(2.9)
Transformation der Standardbasis Wenn wir uns die Standardbasis (2.3) hernehmen und die Skalarprodukte berechnen, so folgt eμ · eν = ημν .
(2.10)
Die gleiche Aussage gilt für alle Basen, die aus der Standardbasis durch eine LorentzTransformation entstehen. Denn mit (2.8) folgt: μ ν μ ν eμ · eν = −1 μ eμ · −1 ν eν = −1 μ −1 ν eμ · eν
μ ν = −1 μ −1 ν ημν = ημ ν (2.11) Die letzte Gleichung folgt aus (1.37), da die Umkehrmatrix −1 ebenfalls ein Element der Lorentz-Gruppe ist. Da ⎧ ⎪ ⎪ ⎨−1 μ = ν = 0 eμ · eν = ημν = 1 μ = ν = 1, 2, 3 ⎪ ⎪ ⎩0 μ = ν gilt, nennt man die Basisvektoren auch orthogonal zueinander.
2.5
Weltlinien in der Raumzeit
Wir definieren in einem beliebigen Inertialsystem S die Weltlinie eines massebehafteten Teilchens in der Raumzeit als einen zeitartigen Vierervektor X (t) = (t, x(t), y(t), z(t)) ,
2.5 Weltlinien in der Raumzeit
47
dessen Raumkomponenten in beliebiger (differenzierbarer) Weise von der Koordinatenzeit t abhängen können. Es wird also nicht vorausgesetzt, dass das Teilchen sich auf einer geraden Linie bewegen muss. Wegen ds 2 < 0 folgt mit (1.26) −dt 2 + d x 2 + dy 2 + dz 2 ds 2 = = −1 + u 1 (t)2 + u 2 (t)2 + u 3 (t)2 < 0, 2 dt dt 2 also | u (t)|2 < 1, d. h., entlang einer zeitartigen Weltlinie ist die Geschwindigkeit
2 2 2 u = | u| = u1 + u2 + u3 eines Teilchens mit Masse immer kleiner als die Lichtgeschwindigkeit. In Abb. 2.1 wird der Einfachheit halber wieder unterstellt, dass sich das Teilchen nur in x-Richtung bewegt, d. h., die y- und z-Komponenten werden als konstant angenommen und nicht angezeigt. Wir sehen, dass sich die Weltlinie X (t) wegen u < 1 komplett im Zukunftskegel befindet. Die Weltlinie unterteilen wir in infinitesimale Teilstücke ds, die von jeweils zwei Raumzeitpunkten (in Abb. 2.1 E 1 = (t1 , x1 , y1 , z 1 ) und E 2 = (t2 , x2 , y2 , z 2 )) eingegrenzt werden, und führen bewegte Inertialsysteme S = (t , x ) in der Weise ein (in Abb. 2.1 ist nur die t -Achse eingezeichnet), dass die Teilstücke ds (annähernd) parallel zur Zeitachse t liegen, d. h. ds ≈ dt . Das betrachtete Teilchen ruht dann momentan in dem jeweiligen System S , das deswegen auch momentanes Ruhesystem genannt wird. Für das bewegte Teilchen
Abb. 2.1 Zeitartige Weltlinie
48
2 Die Raumzeit der Speziellen Relativitätstheorie
entspricht dann die gemessene Zeit zwischen den Raumzeitpunkten E 1 und E 2 der Eigenzeit dt im System S . Bewegt sich die Uhr entlang der gesamten Weltlinie, so kommt sie von einem momentanen Ruhesystem zum nächsten, es gibt also unendlich viele momentane Ruhesysteme. Die bewegte Uhr summiert alle Zeiten, die sie in dem jeweiligen Ruhesystem verbringt. Die Zeitangabe auf der Uhr kann man also als Maß für die Länge der Weltlinie betrachten. Die Zeitdifferenz einer beliebig bewegten Uhr gibt die Länge ihrer Weltlinie zwischen zwei Ereignissen an. Da sich die Zeit, die auf der bewegten Uhr angezeigt wird, aus einer Summe von Eigenzeiten zusammensetzt und die Eigenzeiten eines Systems invariant sind, ist damit auch die Länge einer gekrümmten Weltlinie unabhängig vom Beobachter. Zur konkreten Berechnung benutzen wir (1.29) und erhalten für die infinitesimale Eigenzeit: dτ = dt = −ds 2 = − d x 2 + dy 2 + dz 2 − dt 2 = dt 1 − u 2 Integration von t1 bis t2 ergibt die Länge der Weltlinie zwischen den beiden Ereignissen t2 dt 1 − u (t)2 . τ = t1
Ist u = 0 für ein noch so kleines Zeitintervall, so folgt daraus t2 t2 dt 1 − u 2 < dt = t2 − t1 = t, τ = t1
t1
und wir erhalten wie bei der Zeitdilatation auch im Fall einer nichtgleichförmigen Bewegung, dass die Eigenzeit eines sich bewegenden Beobachters immer kleiner als die Zeit ist, die im ruhenden Inertialsystem vergeht. Wir vergleichen die Eigenzeiten unterschiedlicher Weltlinien zwischen zwei Ereignissen E 1 und E 2 und schauen uns dazu Abb. 2.2 an. Der Beobachter A ruht in seinem Inertialsystem, während der Beobachter B zum Zeitpunkt t1 eine Reise beginnt und zum Zeitpunkt t2 wieder an den (unveränderten) Ort des Beobachters A zurückkommt. Nach den obigen Ausführungen ist die Länge der Eigenzeit/Weltlinie von B kleiner als die von A, was nochmals zeigt, dass unsere natürliche geometrische Anschauung im Minkowski-Raum keine Gültigkeit hat. Diese beiden Weltlinien beschreiben das sogenannte Zwillingsparadoxon, denn beim erneuten Treffen der beiden Beobachter ist auf der Uhr von B weniger Zeit verstrichen als bei A (eine ausführliche Darstellung des Zwillingsparadoxons findet man in [6]). Wir können festhalten, dass die Weltlinie eines ruhenden Teilchens zwischen zwei Ereignissen die mit der größten Länge unter allen Weltlinien zwischen diesen beiden Ereignissen ist.
2.5 Weltlinien in der Raumzeit
49
Abb. 2.2 Weltlinien zweier Beobachter
Aufgabe 2.4 Zeigen Sie, dass die Kurve definiert durch t = dt r (t) x (t) = dt r (t) cos ϑ (t) cos ϕ (t) dt y (t) = dt r (t) cos ϑ (t) sin ϕ (t) dt z (t) = dt r (t) sin ϑ (t)
lichtartig ist. Lösung Es gilt
−dt 2 + d x 2 + dy 2 + dz 2 = r 2 dt 2 −1 + cos2 ϑ cos2 ϕ + cos2 ϑ sin2 ϕ + sin2 ϑ
= r 2 dt 2 −1 + cos2 ϑ + sin2 ϑ = 0.
3
Relativistische Mechanik
In diesem Kapitel behandeln wir einige Modifikationen, die an der klassischen dreidimensionalen Newton’schen Mechanik vorgenommen werden müssen, damit diese mit der vierdimensionalen Speziellen Relativitätstheorie verträglich wird. Dabei beschränken wir uns hauptsächlich auf die physikalischen Größen Geschwindigkeit, Impuls, Masse, Energie und Kraft. Die Erweiterung der Newton’schen Gravitationstheorie zur Allgemeinen Relativitätstheorie ist den folgenden Kapiteln vorbehalten.
3.1
Impuls, Masse, Energie, Kraft
Nachdem wir in den letzten Abschnitten einige Konsequenzen der Einstein’schen Postulate für die Größen Zeit, Raum und Geschwindigkeit abgeleitet haben, zeigen wir in diesem Abschnitt, welche Modifikationen an den klassischen Konzepten Impuls, Masse, Energie und Kraft durch die Gesetze der Speziellen Relativitätstheorie vorgenommen werden müssen. Wir bezeichnen die Geschwindigkeit eines Teilchens in einem Inertialsystem mit u, während wir v für die Relativgeschwindigkeit zwischen zwei Inertialsystemen reservieren wollen. Relativistischer Impuls In der Newton’schen Mechanik ist der Impuls p eines Teilchens definiert als das Produkt p = m u der Masse m und der Geschwindigkeit u. Wir werden zeigen, dass diese Gleichung nur eine Näherungslösung einer allgemeineren Definition darstellt. Dazu machen wir folgendes Gedankenexperiment. Wir stellen uns vor, ein Ball der Masse m wird mit einer bestimmten Geschwindigkeit u gegen eine Wand geworfen, wobei der Abstand zwischen Werfer und Wand l betragen möge. Werfer, Ball und Wand befinden sich auf einem Zug, der mit Geschwindigkeit v an einem Beobachter B am Bahndamm nach rechts vorbeifährt, siehe Abb. 3.1.
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_3
51
52
3 Relativistische Mechanik
Abb. 3.1 Relativistischer Impuls
Wenn der Werfer im Zug und der Beobachter auf einer Höhe sind, wird der Ball gegen die Wand geworfen. Aus Sicht des Werfers fliegt der Ball mit der Geschwindigkeit u direkt auf die Wand zu. Für den Beobachter B auf dem Bahndamm entspricht der gestrichelte Pfeil der Flugbahn des Balles. Sei S das Inertialsystem des Zuges und S das Inertialsystem des Beobachters B. Im Inertialsystem des Zuges gilt für den Betrag des Impulses p = | p|: l p =m·u =m t und analog für den Impuls p im Inertialsystem des Beobachters: p = m · u = m
l t
Nun wissen wir nach Abschn. 1.4, dass sich Längen senkrecht zur Bewegungsrichtung nicht unterscheiden, d. h., es ist l = l. Ferner ist t größer als t, denn nach der Zeitdilatation gilt: t = γ · t. Wir erhalten also l p = m · u = m . (3.1) γ ·t Wenn wir annehmen, dass die beiden Impulse gleich sind: p = p , so erhalten wir m
l l = m t γ ·t
⇒ m = γ · m =
m 1 − v 2 /c2
.
(3.2)
Massen erscheinen also in anderen Inertialsystemen um den γ – Faktor größer als die Ruhemasse m im Ruhesystem des Teilchens. Ist die Relativgeschwindigkeit v = 0, so findet keine Massenzunahme statt: m = m. Bei v = c wäre die Masse m unendlich. Man kann also keinen Körper mit Ruhemasse m > 0 auf Lichtgeschwindigkeit bringen,
3.1
Impuls, Masse, Energie, Kraft
53
die dafür aufzuwendende Kraft wäre unendlich groß. Anders ist das bei Teilchen ohne Ruhemasse wie beispielsweise den Photonen (Lichtteilchen). Diese können (und müssen) sich mit Lichtgeschwindigkeit c im Vakuum bewegen, wie wir später sehen werden. Betrachten wir die Situation nochmals aus einem anderen Blickwinkel und unterstellen, dass die Masse m eines Teilchens (des Balles) invariant, also in allen Inertialsystemen die gleiche ist: m = m. Dann gilt der klassische Impulserhaltungssatz nicht mehr. Denn aus Gl. (3.1) können wir ableiten, dass für die vom Beobachter am Bahndamm gemessene Geschwindigkeit u in y-Richtung gilt: u l u = = = u 1 − v 2 /c2 , γ ·t γ d. h., der Beobachter sieht den Ball mit einer geringeren Geschwindigkeit gegen die Wand fliegen, woraus auch p = m · u = m · u = p folgt. Wir definieren jetzt den relativistischen Impuls P eines Teilchens mit Ruhemasse m, das sich im System S mit Geschwindigkeit u bewegt, durch m u P = = γ m u. 1 − u 2 /c2
(3.3)
Der relativistische Impuls wächst also über alle Grenzen, wenn sich die Geschwindigkeit u der Lichtgeschwindigkeit nähert. Ist die Geschwindigkeit u klein gegenüber der Lichtgeschwindigkeit, so ist u 2 /c2 ≈ 0, und der relativistische Impuls geht – wie erwünscht – in den klassischen über: P ≈ p. Interpretiert man in der obigen Definition die Größe m mr = 1 − u 2 /c2
(3.4)
als relativistische Masse, so kann man den relativistischen Impuls auch als P = m r u = γ m u schreiben.
Aufgabe 3.1 Zeigen Sie, dass die y-Komponente des relativistischen Impulses (3.3) in unserem Gedankenexperiment invariant ist.
Lösung Dazu überprüfen wir die y-Komponenten der relativistischen Impulse im System S des fahrenden Zuges und im System S des Beobachters am Bahndamm. Für den Werfer im Zug
54
3 Relativistische Mechanik
ist die Geschwindigkeit des Balles, der sich im seinem System S nur in y-Richtung bewegt, gleich u = (0, u, 0), also folgt für die y-Komponente seines Impulses S
P y = γ mu. Für den Beobachter am Bahndamm bewegt sich der Ball sowohl in x-Richtung (mit Geschwindigkeit v) als auch in y-Richtung (mit Geschwindigkeit u = u/γ ). In seinem System S hat der Ball eine Geschwindigkeit u = (v, u/γ , 0) , S
woraus
u 2 = v 2 + u 2 1 − v 2 /c2
folgt, d. h., die y-Komponente seines Impulses ist mu/γ Py = 1 − | u | 2 /c2 mu/γ = v 2 + u 2 1 − v 2 /c2 1− c2 mu/γ = u 2 1 − v 2 /c2 v2 1− 2 − c c2 mu 1 − v 2 /c2 = 1 − v 2 /c2 1 − u 2 /c2 mu = 1 − u 2 /c2 = P y. Also ist der Impuls erhalten, d. h. in beiden Inertialsystemen gleich groß.
Relativistische Energie Wenn wir die relativistische Masse (3.4) m r mit c2 multiplizieren, so erhalten wir die relativistische Energie mc2 E = m r c2 = = γ mc2 . (3.5) 1 − u 2 /c2 Wir sehen, dass die relativistische Energie selbst dann nicht null ist, wenn das Teilchen in Ruhe (u = 0) ist. Wir bezeichnen dies als Ruheenergie und erhalten Einsteins berühmteste Gleichung: E = mc2
3.1
Impuls, Masse, Energie, Kraft
55
Bewegt sich das Teilchen, so nennt man den verbleibenden Rest die relativistische kinetische Energie 1 E kin = E − mc2 = m r c2 − mc2 = mc2 (γ − 1) = mc2 −1 . (3.6) 1 − u 2 /c2 Wenn wir wieder u c unterstellen, dann folgt mit der Taylor-Entwicklung 1 3 1 1 = 1 + x + x2 + · · · ≈ 1 + x √ 2 8 2 1−x für die kinetische Energie E kin
1 u2 1 ≈ mc 1 + − 1 = mu 2 . 2 c2 2 2
Wir erhalten also in diesem Grenzfall das klassische Resultat der Newton’schen Mechanik. Eine wichtige Deutung der Gl. (3.5) besteht darin, dass die bei einer Beschleunigung investierte Arbeit/Energie nicht nur eine erhöhte Geschwindigkeit, sondern gleichzeitig auch eine Massenzunahme bewirkt. Und die relativistische Masse m r wird um so größer, je mehr sich die Geschwindigkeit des Teilchens der Lichtgeschwindigkeit nähert. In diesem Sinne ist also in der relativistischen Mechanik Energieerhaltung gleichbedeutend mit Massenerhaltung; Masse und Energie sind zwei Aspekte der gleichen Sache. Diesen Zusammenhang nennt man auch Masse-Energie-Äquivalenz. Beispiel 3.1
Selbst in winzigen Massen stecken wegen des Proportionalitätsfaktors c2 zwischen Ruhemasse und Ruheenergie riesige Energiemengen. Würde es gelingen, ein Gramm Hausstaub vollständig in Energie umzuwandeln, dann ergäben sich E = mc2 = 0,001 kg · 9 · 1016 m 2 /s 2 = 9 · 1013 W attsek. = 25.000.000 kW h, was ungefähr dem Jahresverbrauch von 5000 Haushalten entspricht. Ein weiteres wichtiges, für uns Menschen sogar lebenswichtiges Beispiel der Masse-Energie-Äquivalenz ist die Energieabstrahlung der Sonne. Im Inneren der Sonne werden bei hohem Druck und hohen Temperaturen aus Wasserstoffprotonen Heliumkerne durch Fusion hergestellt. Dabei wiegt jeder Heliumkern etwas weniger als die Bausteine, aus denen er gebildet wird. Diese minimale Massendifferenz wird gemäß der Formel E = mc2 in Energie umgewandelt und abgestrahlt. Und schließlich noch ein Beispiel aus dem Alltag. Zieht man eine mechanische Uhr auf, so fügt man ihr Energie hinzu. Durch diese Energiezufuhr wird nur eine Feder gespannt und nicht etwa die Uhr in Bewegung gesetzt. Diese Federspannung erhöht die Masse der Uhr, d. h., aufgezogene Uhren wiegen schwerer als nichtaufgezogene!
56
3 Relativistische Mechanik
Relativistische Kraft Wir können das zweite Newton’sche Gesetz FN = m a auch mit dem Newton’schen Impuls schreiben: d (m u) d p d u = = , FN = m dt dt dt da wir die Masse m als konstant annehmen. Da wir die Kraft in der SRT ebenfalls mit dem Buchstaben F schreiben wollen, haben wir zur Kennzeichnung der Newton’schen Kraft ein N als Index hinzugefügt. Wir definieren die relativistische Dreierkraft F durch d P d (γ m u) F = = dt dt
(3.7)
und wollen das zweite Newton’sche Gesetz verallgemeinern, indem wir die relativistische Kraft durch die Beschleunigung a ausdrücken. Dazu berechnen wir die Ableitung auf der rechten Seite von (3.7) und erhalten zunächst 1 2 3
dγ d 1 γ3 γ3 d u γ3 1 du 2 du 3 du = +u +u = 2 u · = 2 u · a = 2 u dt dt c dt dt dt c dt c 1 − u 2 /c2 (3.8) und daraus mit der Produktregel γ3 d (γ m u) = 2 m ( u · a ) u + γ m a . F = dt c
(3.9)
Diese Gleichung nennt man auch relativistische Bewegungsgleichung. Kraft und Beschleunigung sind anders als in der Newton’schen Welt nicht mehr parallel. Im Fall kleiner Geschwindigkeiten, d. h. u/c ≈ 0, γ ≈ 1, reduziert sich (3.9) auf F = m a . Wir zeigen an einem Beispiel die Bewegung eines Teilchens aufgrund einer konstanten einwirkenden Kraft. Beispiel 3.2
Auf ein Teilchen der Masse m werde eine konstante Kraft F = (F, 0, 0) in x-Richtung ausgeübt. Das Teilchen soll sich bei t = 0 im Ursprung in Ruhe befinden und bewegt sich mit der Geschwindigkeit u (t) = (u (t) , 0, 0) und dem Impuls P (t) = (P (t) , 0, 0) entlang der x-Achse. Damit folgt dP = F ⇒ P = Ft + const., dt wobei die Konstante wegen u (0) = 0 = P (0) null ist. Daher gilt
3.1
Impuls, Masse, Energie, Kraft
57
P = γ mu = Ft ⇒
u 1 − u 2 /c2
= Ft/m ⇒
u 2 = (Ft/m)2 1 − u 2 /c2 ⇒ (F/m) t , u= (Ft/m)2 1+ c2
was im nichtrelativistischen Fall (F/m) t c zu u = (F/m) t führt. Um das Weg-ZeitGesetz zu erhalten, integrieren wir
F t mc2 t x (t) = dt = 1 + (Ft/mc)2 − 1 . m 0 F 1 + (Ft /mc)2 In Abb. 3.2 erhalten wir anstelle der klassischen Parabel x (t) = F/ (2 m) t 2 in der SRT als Graphen eine Hyperbel, was der Grund dafür ist, dass die durch eine konstante Kraft verursachte Bewegung auch hyperbolisch genannt wird. Sie tritt beispielsweise dann auf, wenn sich ein geladenes Teilchen in einem homogenen elektrischen Feld befindet.
Abb. 3.2 Hyperbolische Bewegung
58
3 Relativistische Mechanik
Wir wollen die Gl. (3.9) nach a auflösen und multiplizieren zunächst beide Seiten skalar mit u: ⎛ ⎞
⎜ ⎟ γ2 u2 1 ⎜ ⎟ F · u = γ m ( u · a ) 1 + 2 u · u = γ m ( u · a ) ⎜1 + 2 u · a ) ⎟ = γ 3 m ( ⎝ c c 1 − u 2 /c2 ⎠ =γ 2
(3.10) Das in (3.9) eingesetzt, ergibt 1 1 F = 2 F · u u + γ m a ⇒ a = c γm
· u F F − 2 u . c
(3.11)
Aufgabe 3.2 Leiten Sie mit den obigen Ergebnissen die relativistische Bilanzgleichung
d E kin = F · u dt
(3.12)
ab. Lösung Wir differenzieren (3.6) nach der Zeit und erhalten dm r 2 d E kin d = m r c2 − mc2 = c . dt dt dt Ferner ist
d (m r u) dm r d P d u = = u + m r . F = dt dt dt dt
Einsetzen führt zu 1 d E kin 1 d E kin F = 2 u + γ m a ⇒ γ m a = F − 2 u. c dt c dt Wir vergleichen (3.4) mit (3.11), dann folgt d E kin = F · u. dt Dies entspricht genau der Bilanzgleichung für die kinetische Energie E kin =
1 m | u |2 2
(3.13)
3.2
Natürliche Einheiten
59
in der Newton’schen Mechanik: d E kin = m a · u = FN · u dt
3.2
Natürliche Einheiten
Wir haben in den Abschnitten zuvor mehrmals darauf hingewiesen, dass die Spezielle Relativitätstheorie sich nur dann deutlich von der Newton’schen Mechanik und anderen nichtrelativistischen physikalischen Theorien unterscheidet, wenn die Relativgeschwindigkeiten zwischen Inertialsystemen groß sind. Ferner gilt in der Speziellen Relativitätstheorie die Konstanz der Lichtgeschwindigkeit im Vakuum, d. h., alle Beobachter in allen Inertialsystemen messen denselben Wert, c ist also eine universelle Konstante. Diese beiden Eigenschaften der Speziellen Relativitätstheorie machen wir uns zu eigen und definieren ein neues Einheitensystem, das wir ab jetzt hauptsächlich benutzen wollen. Bislang haben wir physikalische Größen im Internationalen Einheitensystem (SI) dargestellt. Im SI-System werden die Länge in Metern (m), die Zeit in Sekunden (s) und die Masse in Kilogramm (kg) gemessen. Im SI-System ist die Einheit der Geschwindigkeit gleich Weg dividiert durch Zeit ([v] = m/s). Für weitere Details siehe Abschn. A.2. Wir wollen nunmehr als Einheit für die Zeit ebenfalls Meter definieren, wozu wir die Konstanz der Lichtgeschwindigkeit benutzen: Ein Zeitmeter soll die Strecke sein, die das Licht braucht, um die Strecke von einem Meter zu durchqueren. Wählt man diese Längeneinheit für die Zeit, so arbeitet man anstelle der SI-Einheiten mit natürlichen Einheiten, siehe Abschn. A.2. Schauen wir uns an, welchen Wert die Lichtgeschwindigkeit in diesen Einheiten annimmt: 1m 1m c= = =1 1 cm 1m Der Wert der Lichtgeschwindigkeit ist also gleich 1, und darüber hinaus ist c dimensionslos! Zu den Festlegungen des natürlichen Einheitensystems in der Relativitätstheorie gehört neben c = 1 oftmals auch G = 1, wobei G die Newton’sche Gravitationskonstante bezeichnet. Wir verzichten in diesem Text allerdings darauf und führen die Newton’sche Gravitationskonstante in den relevanten Formeln immer als G mit auf. Das SI-System enthält eine Menge abgeleiteter Einheiten, wie z. B. Newton für die Kraft, siehe Abschn. A.2. Bei Benutzung von natürlichen Einheiten vereinfachen sich die Dimensionen von vielen physikalischen Größen beträchtlich, z. B. gilt für Newton (=N) in SIEinheiten N = kg · m/s 2 und in natürlichen Einheiten N = kg/m.
60
3 Relativistische Mechanik
Schauen wir uns an, wie sich einige Größen der Speziellen Relativitätstheorie in natürlichen Einheiten darstellen lassen. Beispiel 3.3
Beginnen wir mit Einsteins berühmter Gleichung: E = mc2 verkümmert zu E = m. Der Wiedererkennungswert der letzten Gleichung ist nicht sehr groß, weshalb wir in der Folge an einigen Stellen in diesem Buch die Ergebnisse auch nochmals in SI-Einheiten darstellen werden. Andererseits drückt die Gleichung E = m am klarsten die Äquivalenz zwischen Energie und Masse aus, in natürlichen Einheiten ist Energie gleich Masse! Beispiel 3.4
Als zweites Beispiel wollen wir die speziellen Lorentz-Transformationen in SI-Einheiten denen in natürlichen Einheiten gegenüberstellen: SI ct − x v/c ct = 1 − v 2 /c2 −ct v/c + x x = 1 − v 2 /c2 y = y z = z
N at t −v·x t = √ 1 − v2 x −v·t x = √ 1 − v2 y = z =
= γ (t − vx) = γ (x − vt) y z
In natürlichen Einheiten besteht zwischen Zeit (t) und Raum (x) eine vollständige Symmetrie, die speziellen Lorentz-Transformationen haben sich nicht nur vereinfacht, sondern auch vereinheitlicht.
3.3
Vierergeschwindigkeit, Viererimpuls
In diesem Abschnitt beginnen wir damit, die in Abschn. 3.1 hergeleiteten dreidimensionalen speziell-relativistischen physikalischen Größen so zu verallgemeinern, dass diese zu vierdimensionalen Objekten des Minkowski-Raums werden. Basis unserer Herleitungen und Berechnungen ist das natürliche Einheitensystem. Vierergeschwindigkeit Wir wollen die Vierergeschwindigkeit wie im Dreidimensionalen als „Ableitung des Weges nach der Zeit” definieren. Dazu nehmen wir an, dass ein massebehaftetes Teilchen in einem Inertialsystem S eine infinitesimal kleine Verschiebung
3.3 Vierergeschwindigkeit, Viererimpuls
61
d X = (dt, d x, dy, dz) S
entlang seiner Weltlinie erfährt. Das Quadrat der Verschiebung ist gleich d X · d X = ds 2 = −dt 2 + d x 2 + dy 2 + dz 2 , was nach Formel (1.26) dem infinitesimalen Raumzeitintervall entspricht: ds 2 = −dτ 2 Da die Weltlinie des Teilchens zeitartig ist, ist ds 2 negativ und somit dτ = −ds 2 . Wir betrachten den Vektor d X /dτ , der, da dτ eine Zahl ist, parallel zu d X und damit tangential zur Weltlinie des Teilchens liegt. Es gilt ds 2 −dτ 2 dX dX · = = = −1, dτ dτ dτ 2 dτ 2
(3.14)
daher ist d X /dτ ein zeitartiger Einheitsvektor. Im momentanen Ruhesystem des Teilchens S gilt dt = dτ , also d X = (dτ, 0, 0, 0), S
woraus
dX = (1, 0, 0, 0) dτ S
folgt. Allgemein definieren wir die Vierergeschwindigkeit U durch U=
dX . dτ
(3.15)
Man beachte, dass die „natürliche” Definition der Geschwindigkeit durch d X /dt zu einer Größe geführt hätte, die kein Vierervektor ist, da bei Lorentz-Transformationen nicht nur der Zähler d X , sondern auch der Nenner dt transformiert werden müsste, wobei hingegen die Eigenzeit dτ eine invariante Größe ist! Die Komponenten von d X /dτ in einem beliebigen Inertialsystem S errechnen sich wegen dτ = dt
dt 1 − u2 = γ
mit der Kettenregel zu dt d x dy dz d X dt dX dX = =γ = γ ( , , , ) = (γ , γ u 1 , γ u 2 , γ u 3 ). dτ dt dτ dt S dt dt dt dt Für kleine Geschwindigkeiten u 1 gilt
(3.16)
62
3 Relativistische Mechanik
γ ui = √
ui 1 − u2
≈ u i , i = 1, 2, 3,
d. h., die Raumkomponenten von U in S entsprechen dann den Geschwindigkeitskomponenten von u, woraus sich der Name „Vierergeschwindigkeit“ für U erklären lässt. Man beachte aber, dass die Raumkomponenten von U im Allgemeinen (da dann γ = 1 ist) nicht identisch mit den Komponenten von u sind. Wir können mit (3.14) festhalten, dass das Quadrat der Vierergeschwindigkeit in allen Inertialsystemen 2 2 2 2 U 2 = U · U = − U 0 + U 1 + U 2 + U 3 = −1
(3.17)
ist.
Aufgabe 3.3 Wie groß ist die Vierergeschwindigkeit U im System S im Vergleich zu U , wenn sich das System S mit der Geschwindigkeit v → (v, 0, 0) relativ zu S bewegt?
Lösung Da wir für die folgende Rechnung den Gammafaktor für verschiedene Geschwindigkeiten brauchen, indizieren wir ihn und schreiben γv , γu , γu . Mit der Lorentzmatrix (1.41) folgt dann ⎛ ⎞ ⎛ ⎞ ⎞⎛ γu γu γv −γv v 0 0 ⎜ γ u1 ⎟ ⎜ 1⎟ ⎜ −γv v v 0 0 ⎟ ⎜ ⎟ ⎟ ⎜ γu u ⎟ . U μ = ⎜ u 2 ⎟ = ⎜ 2 ⎠ ⎝ ⎝ 0 0 10 γu u ⎠ ⎝ γu u ⎠ 0 0 01 γu u 3 γu u 3 Wir setzen die erste Gleichung γu = γv γu 1 − u 1 v in die drei anderen ein und erhalten nach einigen Rechenschritten
u1 − v 1 − u1v u2 = γv 1 − u 1 v
u1 = u2
u3 =
u3 , γv 1 − u 1 v
also wieder das Additionstheorem für Geschwindigkeiten (1.21).
3.3 Vierergeschwindigkeit, Viererimpuls
63
Viererimpuls Für ein Teilchen mit Masse m definieren wir den Viererimpuls durch P = mU = P 0 , P 1 , P 2 , P 3 = γ m, γ mu 1 , γ mu 2 , γ mu 3
(3.18)
mit der (Lorentz-invarianten) Ruhemasse m des Teilchens. Das heißt, der Viererimpuls ist ebenfalls ein Vierervektor. Für das Quadrat von P folgt daraus P 2 = mU · mU = −m 2 .
(3.19)
Die Zeitkomponente von P ist nach (3.5) die relativistische Energie: P 0 = E. Die Raumkomponenten P von P sind nach (3.3) die Komponenten des relativistischen Impulses. Mit diesen Definitionen folgt P = E, Eu 1 , Eu 2 , Eu 3 (3.20) sowie
P = u. E Wir berechnen nochmals das Quadrat von P und erhalten mit (3.19)
(3.21)
P 2 = −E 2 + P 2 = −m 2 ⇒ E 2 = m 2 + P 2 .
(3.22)
Dieses ist der relativistische Energiesatz, mit dem man die Gesamtenergie eines Teilchens berechnen kann. Ist bei einem Teilchen die Ruhemasse null, so folgt aus (3.22) E = P , (3.23) d. h., auch die masselosen Photonen haben einen Impuls und können damit einen sogenannten Strahlungsdruck auf andere Teilchen ausüben. Für masselose Teilchen folgt mit (3.21) und (3.23) |P| | u| = = 1, E d. h., masselose Teilchen bewegen sich mit Lichtgeschwindigkeit. Bewegt sich umgekehrt ein Teilchen mit Lichtgeschwindigkeit: | u |2 = 1, so folgt mit (3.22) und (3.21) 2 m 2 = E 2 − P = E 2 − E 2 u 2 = E 2 − E 2 = 0, d. h., das Teilchen ist masselos. Wir zeigen zum Abschluss dieses Abschnittes an einem Beispiel, dass der Impulserhaltungssatz der Newton’schen Mechanik nicht mit dem Relativitätsprinzip übereinstimmt.
64
3 Relativistische Mechanik Beispiel 3.5 Impulserhaltung
In einem Inertialsystem S bewegen sich zwei Teilchen mit gleicher Masse m und den Geschwindigkeiten u1 = (u, 0, 0) und u2 = (−u, 0, 0) aufeinander zu. Die Teilchen kollidieren und bilden ein drittes Teilchen mit Masse 2m und Geschwindigkeit u3 = (0, 0, 0). Das heißt, der Newton’sche Gesamtimpuls ist vor und nach dem Stoß gleich null und somit im System S erhalten. Nun berechnen wir die Kollision in einem Inertialsystem S , das sich mit der Relativgeschwindigkeit v = (u, 0, 0) entlang der x-Achse bewegt. Dann ruht das erste Teilchen in S , und mit dem Additionstheorem für Geschwindigkeiten (1.21) folgt für das zweite Teilchen
−2u , 0, 0 , u3 = (−u, 0, 0) . u1 = (0, 0, 0) , u2 = 1 + u2 S S S Für einen Beobachter im S in Abb. 3.3 ist der Gesamtimpuls vor der Kollision −2mu/ 1 + u 2 und −2mu nach dem Stoß, d. h., für ihn ist der Newton’sche Impuls nicht erhalten. Die Erhaltung des Gesamtviererimpulses hingegen ist mit Relativitätsprinzip vereinbar. Gilt in einem Inertialsystem S die Impulserhaltung, d. h. Pvor = Pnach ⇔ Pvor − Pnach = 0, dann folgt in einem weiteren Inertialsystem S wegen der Linearität der LorentzTransformationen Pvor − Pnach = Pvor − Pnach = Pvor − Pnach = 0,
Abb. 3.3 Impulserhaltung
3.4
Relativistische Dynamik
also
65
Pvor =
Pnach .
Dieses „Beweisprinzip“ der Lorentz-Invarianz gilt übrigens für jede Gleichung, deren Seiten nur aus Vierervektoren oder Lorentz-Skalaren bestehen.
3.4
Relativistische Dynamik
Viererbeschleunigung Wir betrachten die Größe
dU d2 X = , dτ dτ 2 die mit den gleichen Argumenten wie oben ein Vierervektor ist. Den Vektor A nennt man Viererbeschleunigung. Wir wählen ein momentanes Ruhesystem S , in dem das Teilchen aus der Ruhe beschleunigt wird. In S stimmt die Eigenzeit mit der Koordinatenzeit überein: dτ = dt, daher folgt d 2t d 2 x d 2 y d 2 z d2 X = , , , A= = (0, a 1 , a 2 , a 3 ), dτ 2 S dt 2 dt 2 dt 2 dt 2 A=
da wegen dt/dt = 1 folgt, dass d 2 t/dt 2 = 0 ist.
Aufgabe 3.4 Zeigen Sie, dass die Viererbeschleunigung senkrecht auf der Vierergeschwindigkeit steht, d. h. A · U = 0. (3.24)
Lösung Wenn wir die Gleichung (3.14) nach der Eigenzeit τ differenzieren, so folgt mit der Produktregel
d dX dX d2 X d X d X d2 X 0= · = + · = 2 A · U ⇒ A · U = 0. · 2 dτ dτ dτ dτ dτ dτ d 2 τ Die Komponenten der Viererbeschleunigung in einem beliebigen Inertialsystem berechnen sich mit (3.8), d. h. d (γ ) = γ 3 u · a , dt und ganz ähnlich wie bei der Herleitung der relativistischen Bewegungsgleichung (3.9) zu
66
3 Relativistische Mechanik
d d X0 =γ (γ ) = γ γ 3 u · a = γ 4 u · a dτ dt d d X d A = =γ u · a ) u + γ 2 a , (γ u) = γ 4 ( dτ dτ dt
A0 =
d dτ
(3.25) (3.26)
wobei wir zweimal d/dτ = γ (d/dt) benutzt haben.
Aufgabe 3.5 Berechnen Sie das Quadrat A · A der Viererbeschleunigung.
Lösung Das Quadrat der Viererbeschleunigung berechnet sich durch A · A = −γ 8 ( u |2 + 2γ 6 ( a |2 u · a )2 + γ 8 ( u · a )2 | u · a )2 + γ 4 | u |2 + 2γ 6 ( = −γ 8 ( a |2 u · a )2 1 − | u · a )2 + γ 4 | = γ 6 ( a |2 . u · a )2 + γ 4 | Minkowski-Kraft Wie in der Newton’schen Mechanik definieren wir die sogenannte Minkowski-Kraft (Viererkraft) K als Ableitung des Impulsvektors nach der Zeit K =
dP dU d2 X =m =m . dτ dτ dτ 2
(3.27)
dX d2 X = const. sowie mit (3.16) auch = 0 und daraus U = 2 dτ dτ u = const. Das heißt, das erste Newton’sche Gesetz gilt auch in der Speziellen Relativitätstheorie: In einem Inertialsystem bewegt sich ein kräftefreies Teilchen mit konstanter Geschwindigkeit. Mit (3.24) folgt d2 X · U = 0 ⇒ K · U = 0, (3.28) dτ 2 die Viererkraft steht senkrecht auf der Vierergeschwindigkeit. Für die Komponenten der Minkowski-Kraft im Inertialsystem S folgt dann
d d dE d E, P = γ E, P = γ , Kμ = (γ m u) , dτ dt dt dt Ist K = 0, so folgt
woraus sich für die räumlichen Komponenten K = γ F
3.4
Relativistische Dynamik
67
mit der relativistischen Kraft F (3.7) sowie K0 = γ
d dE d E kin =γ = γ F · u (m + E kin ) = γ dt dt dt
mit der relativistischen Bilanzgleichung (3.12) ergeben. Für die Komponenten von K folgt insgesamt K μ = K 0 , K = γ F · u, F . (3.29) Wir zeigen noch, dass auch im Minkowski-Raum die Newton’sche Bewegungsgleichung K =mA
(3.30)
gilt, und überprüfen komponentenweise. Mit (3.10) und (3.25) folgt K 0 = γ F · u = γ γ 3 m u · a = m γ 4 u · a = m A0 . Mit (3.9) und (3.26) folgt K = γ F = γ γ 3 m ( u · a ) u + γ m a = m γ 4 ( u · a ) u + γ 2 a = m A. Photonen Lichtteilchen (Photonen) haben keine Masse und bewegen sich mit Lichtgeschwindigkeit, sind also lichtartig, d. h., für ein Lichtteilchen gilt ds 2 = 0 und damit auch dτ = 0, was mit Gleichung (3.15) bedeutet, dass für Photonen keine Vierergeschwindigkeit definiert werden kann. Es gibt also kein Inertialsystem, in dem Photonen ruhen. Der Viererimpuls eines Photons ist wegen 2 PPhoton = −m 2 = 0
lichtartig, aber in der Regel kein Einheitsvektor. Seine Komponenten bestehen aus der Energie und dem (räumlichen) Impuls des Teilchens. Ein Photon mit der Energie E, das sich im System S in x-Richtung bewegt, hat die Viererimpulskomponenten PPhoton = (E, P x , 0, 0), S
woraus
2 2 PPhoton = −E 2 + P x = 0
folgt. Damit erhalten wir wieder das Ergebnis, dass der räumliche Impuls eines Photons seiner Energie entspricht.
68
3 Relativistische Mechanik
Nach Einstein hat ein Photon die Energie E = h · f, wobei f die Frequenz des Photons bezeichnet, und h ist die sogenannte Planck-Konstante h = 6,6261 · 10−34 Js in SI-Einheiten. Angenommen, in einem Inertialsystem S hat ein Photon die Frequenz f und bewegt sich in x-Richtung. Dann hat das Teilchen in einem Inertialsystem S , das sich mit Geschwindigkeit v relativ zu S ebenfalls in x-Richtung bewegt, mit der Lorentz-Transformation und wegen E = h f = Px die Energie E = P t = γ P t − vγ P x = E/ 1 − v 2 − P x v/ 1 − v 2 1−v = h f / 1 − v 2 − h f v/ 1 − v 2 = E √ . 1 − v2 Also folgt wegen E = h f für die Frequenz f in S E 1−v f (1 − v) = =√ . = 2 f E (1 + v) 1−v Das ist wieder die relativistische Doppler-Effekt-Formel für Photonen (1.14).
4
Tensorrechnung im Minkowski-Raum
In diesem Kapitel listen wir einige für das Verständnis der folgenden Kapitel erforderlichen Ergebnisse aus der vierdimensionalen Tensorrechnung auf dem Minkowski-Raum M auf. Diese bleiben hier bewusst kurz gehalten, die ausführlichen Darstellungen und Herleitungen findet man in den ersten vier Abschnitten von Kap. 9. Wir haben im letzten Kapitel festgestellt, dass physikalische Gesetze in der Speziellen Relativitätstheorie in jedem Inertialsystem die gleiche Form aufweisen, wenn sie sich als (Vierer-)Vektorgleichungen schreiben lassen. Die physikalischen Gesetze der Raumzeit verhalten sich also so wie die klassischen Gesetze der Newton’schen Physik: Diese sind invariant unter Galileo-Transformationen, wenn sie in (dreidimensionaler) Vektorform formuliert sind. Die (Vierer-)Vektoren sind geometrische Objekte, die zwar in verschiedenen Koordinatensystemen unterschiedliche Komponenten haben, aber im Minkowski-Raum unverändert bleiben. Wir haben auch an einigen Beispielen gesehen, dass einige spezielle Rechnungen mit Vektoren in jedem Inertialsystem stets das gleiche Ergebnis haben, z. B. ist das Quadrat eines Vierervektors bzw. das Skalarprodukt zweier Vierervektoren eine invariante Größe, die in jedem Inertialsystem jeweils die gleiche Zahl liefert. In diesem Abschnitt wollen wir das Konzept der Vektorrechnung im Minkowski-Raum auf die Tensorrechnung erweitern. Der Grund für diese Abstraktion liegt darin, dass sich manche physikalischen Zusammenhänge in der Speziellen Relativitätstheorie (z. B. die Vereinigung von elektrischem und magnetischem zum elektromagnetischen Feld) nicht mehr als Vektorgrößen darstellen lassen, sondern komplexere Ausdrücke (d. h. Tensoren) verlangen. Natürlich erwarten wir von Tensorgleichungen, die physikalische Gesetze darstellen, dass sie die gleiche Form in jedem Inertialsystem annehmen.
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_4
69
70
4.1
4 Tensorrechnung im Minkowski-Raum
Dualraum und Einsformen
Ist M der vierdimensionale Minkowski-Raum, so nennt man M∗ = {α : M → R, α linear} den Dualraum von M. M∗ ist mit der Addition und Multiplikation mit einem Skalar: (α + β) (V ) = α (V ) + β (V ) (λα) (V ) = λα (V ) , λ ∈ R selbst wieder ein vierdimensionaler Vektorraum (siehe z. B. [4, 11]). Die Elemente von M∗ , die wir überwiegend mit kleinen griechischen Buchstaben schreiben, heißen Einsformen, Linearformen oder auch Kovektoren. Ist A = (e0 , e1 , e2 , e3 ) eine Basis von M, so wird durch (4.1) eμ (eν ) = δνμ eine Basis A∗ = e0 , e1 , e2 , e2 von M∗ definiert, die man duale Basis zu A nennt. Die duale Basis A∗ hängt also von der Auswahl der Basis A ab. Wir können jede Einsform als Linearkombination von Basiseinsformen darstellen: α = α0 e0 + α1 e1 + α2 e2 + α3 e3 = αμ eμ mit den reellen Komponenten αμ von α. Ist V = V ν eν ein Vierervektor, so folgt α (V ) = αμ eμ (V ) = αμ eμ V ν eν = αμ V ν eμ (eν ) = αμ V ν δνμ = αμ V μ , speziell folgt mit V = eμ
(4.2)
α eμ = αμ .
(4.3)
eμ (V ) = eμ V ν eν = V ν eμ (eν ) = V ν δνμ = V μ .
(4.4)
Ebenso erhalten wir
Transformationen der Einsformen Sind A = (e0 , e1 , e2 , e3 ) sowie A = (e0 , e1 , e2 , e3 ) zwei Basen von M und ist A∗ = 0 1 2 3 e , e , e , e die korrespondierende duale Basis zu A, so folgt mit μ eμ = −1 μ eμ (siehe (2.8)) die Beziehung ν ν ν μ eμ (eν ) = eμ −1 ν eν = −1 ν eμ (eν ) = −1 ν δνμ = −1 ν .
(4.5)
4.1
Dualraum und Einsformen
71
μ Andererseits lässt sich jede e als Linearkombination der Basiseinsformen Basiseinsform der dualen Basis A∗ = e0 , e1 , e2 , e3 schreiben:
eμ = T
μ μ μ e ,
(4.6)
mit einer (unbekannten) Matrix T . Setzt man in (4.6) den Basisvektor eν ein, so ergibt sich eμ (eν ) = T
μ μ μ e
(eν ) = T
μ μ μ δν
=T
μ ν .
Vergleicht man diese Gleichung mit (4.5), so ergibt sich die Transformationsformel für die Basiseinsformen: μ eμ = −1 ν eν (4.7) Multipliziert man diese Gleichung mit der zu −1 inversen Matrix
μ μ,
so erhält man :
μ μ μμ eμ = μμ −1 ν eν = δν eν = eμ , also die Umkehrtransformation:
eμ = μμ eμ
(4.8)
Die Basiseinsformen transformieren sich also genauso wie die Komponenten der Vierervektoren. Mit (4.7) folgt analog:
α = αμ eμ = αμ eμ = αμ μμ eμ ⇒ αμ = μμ αμ sowie die Umkehrung:
μ αμ = −1 μ αμ ,
(4.9)
d. h., die Komponenten der Einsformen transformieren sich wie die Basisvektoren.
Aufgabe 4.1 Zeigen Sie explizit, dass der Ausdruck für α (V ) in Gl. (4.2) unabhängig von der Auswahl der Basis immer die gleiche reelle Zahl ergibt.
Lösung Wir wählen zwei Basen in M und die dazu korrespondierenden Basen in M∗ und erhalten σ σ V μ αμ = μμ V μ −1 μ ασ = μμ −1 μ V μ ασ = δμσ V μ ασ = V μ αμ , (4.10) also das gewünschte Ergebnis. Den Ausdruck V μ αμ nennt man auch Kontraktion von V und α, und wir werden später sehen, dass Kontraktionen immer Lorentz-invariant sind.
72
4 Tensorrechnung im Minkowski-Raum
Skalarprodukte Wir können das Skalarprodukt im Minkowski-Raum als eine bilineare Abbildung g schreiben: g : M × M → R mit g (A, B) = A · B Nach Wahl eines Inertialsystems S mit Basis (e0 , e1 , e2 , e3 ) ergibt sich g (A, B) = A · B = ημν Aμ B ν und daraus mit (2.10) speziell g eμ , eν = eμ · eν = ημν . Es gibt eine Eins-zu-eins-Korrespondenz zwischen M und M∗ , die mithilfe des Skalarproduktes definiert wird. Die Abbildung M → M∗ Φ: V → αV
mit αV = g (V , ·) :
M →R W → αV (W ) = g (V , W )
(4.11)
nennt man kanonischen Isomorphismus (das ist eine lineare und bijektive Abbildung) zwischen M und M∗ , siehe [11]. Jeder Vierervektor V generiert also eine Einsform αV , deren Komponenten sich nach Wahl einer Basis A = (e0 , e1 , e2 , e3 ) und mit (4.3) durch die Komponenten von V berechnen lassen: (αV )μ = αV eμ = g V , eμ = g V ν eν , eμ = V ν g eν , eμ = ημν V ν
(4.12)
3
Ist also V μ = V 0 , V 1 , V 2 , V , so gilt (αV )μ = ((αV )0 , (αV )1 , (αV )2 , (αV )3 ) = −V 0 , V 1 , V 2 , V 3 , d. h., die Komponenten von V und αV stimmen bis auf ein Vorzeichen in der Zeitkomponente von V überein. Die Berechnung der Komponenten (αV )μ in (4.12) nennt man auch Index-mit-der-Metrik-Herunterziehen. Der hoch gestellte Index ν von V wird (durch Kontraktion) mit der Minkowski-Metrik ημν in einen tief gestellten Index μ umgewandelt. Für die Basisvektoren eμ erhält man analog αeμ = g eμ , · ⇒ αeμ (eν ) = g eμ , eν = ημν .
4.1
Dualraum und Einsformen
73
Andererseits lässt sich jede Einsform als Linearkombination der Basiseinsformen schreiben: αeμ = Tμρ eρ mit einer (unbekannten) Matrix T . Damit folgt αeμ (eν ) = Tμρ eρ (eν ) = Tμρ δνρ = Tμν ⇒ Tμν = ημν , also
αeμ = ημν eν .
(4.13)
Umgekehrt generiert auch jede Einsform α einen Vierervektor durch M∗ → M −1 , Φ : α → Vα wobei α = g (Vα , ·) gilt, und wegen der Bijektivität von Φ ist der Vektor Vα eindeutig bestimmt. Für eine Basiseinsform erhalten wir analog eμ = g (Veμ , ·) .
(4.14)
Mit dem Skalarprodukt g können wir durch G (α, β) := g Vα , Vβ ein Skalarprodukt G auf dem Dualraum M∗ definieren. Dann folgt ημν = g eμ , eν = G αeμ , αeν = G ημρ eρ , ηνσ eσ = ημρ ηνσ G eρ , eσ .
(4.15)
Aufgabe 4.2 Zeigen Sie mit (4.15), dass G (eρ , eσ ) die inverse Matrix von η = ημν ist, d. h.
G eμ , eν = ημν .
(4.16)
Lösung Mit η−1 = (ηρσ ) und Gl. (4.15) gilt ημν = ημρ δνρ = ημρ ηνσ ηρσ = ημρ ηνσ G eρ , eσ ⇒ G eρ , eσ = ηρσ .
ρ
=δν
74
4 Tensorrechnung im Minkowski-Raum
Aufgabe 4.3 Zeigen Sie, dass in kartesischen Koordinaten
ημν = ημν
gilt. Lösung Es gilt ⎛
⎞⎛ ⎞ ⎛ −1 0 0 0 −1 0 0 0 1 ⎜ 0 1 0 0⎟⎜ 0 1 0 0⎟ ⎜0 ⎟⎜ ⎟ ⎜ ημν ημν = ⎜ ⎝ 0 0 1 0⎠⎝ 0 0 1 0⎠ = ⎝0 0 001 0 001 0 μν −1 = ημν . = ημν ⇒ η
0 1 0 0
0 0 1 0
⎞ 0 0⎟ ⎟ = δμν 0⎠ 1
Wir können die Gl. (4.16) dazu benutzen, die Komponenten von Vα mithilfe der Komponenten von α zu bestimmen. Mit (4.4) und (4.14) folgt Vαμ = eμ (Vα ) = g (Veμ , Vα ) = G eμ , α = G eμ , αν eν = αν G eμ , eν = ημν αν . (4.17) Diese Beziehung können wir (etwas einfacher) auch aus der Formel (4.12) erhalten, wenn wir diese mit ημν multiplizieren. Die Berechnung der Komponenten von Vα durch die von α nennt man auch Index-mit-der-Metrik-Hochziehen. Bidualraum Manchmal ist es günstiger, mit Einsformen statt mit Vektoren zu rechnen. Es gibt aber eine Möglichkeit, einen Vektor als eine Einsform aufzufassen. Dazu sei durch M∗∗ = V : M∗ → R, V linear der Bidualraum von M definiert. Dann ist durch die Abbildung M → M∗∗ Φ: V → ΦV mit ΦV (α) := Φ (V ) (α) = α (V ) ein Isomorphismus zwischen M und M∗∗ gegeben. Man kann also einen Vektor als Einsform auf dem Dualraum M∗ auffassen und schreibt oftmals kurz
4.1
Dualraum und Einsformen
75
V (α) = α (V ) .
(4.18)
Gradient als Einsform Eines der wichtigsten Beispiele für eine Einsform ist der Gradient einer skalaren Funktion φ (X ). Wenn wir die Weltlinie von X in kartesischen Koordinaten durch die Eigenzeit τ parametrisieren, so gilt X (τ ) = (t (τ ) , x (τ ) , y (τ ) , z (τ )) , (4.19) und die Funktion φ hängt entlang der Weltlinie indirekt auch von τ ab. Die Vierergeschwindigkeit U hat nach (3.15) die kartesischen Komponenten dX dt d x dy dz U= = , , , . dτ dτ dτ dτ dτ Mit der Kettenregel erhalten wir damit dφ ∂φ dt ∂φ d x ∂φ dy ∂φ dz = + + + dτ ∂t dτ ∂ x dτ ∂ y dτ ∂z dτ ∂φ 0 ∂φ 1 ∂φ 2 ∂φ 3 = U + U + U + U ∂t ∂x ∂y ∂z dφ = μ U μ, ∂x
(4.20)
dφ stellt die Änderungsrate von φ entlang einer Kurve mit Tangentialvektor dτ ∂φ U dar und hängt linear von U ab. Wir können also die Größen μ als die Komponenten ∂x einer Einsform dφ auffassen, die wir den Gradienten (üblich ist auch: das Differenzial) von φ nennen wollen. In kartesischen Koordinaten gilt somit ∂φ ∂φ ∂φ ∂φ ∂φ , , , . dφ = μ = ∂x ∂t ∂ x ∂ y ∂z d. h., die Zahl
Aufgabe 4.4 Zeigen Sie explizit, dass sich die Komponenten von dφ wie eine Einsform transformieren.
Lösung Mit der Kettenregel folgt
∂φ ∂ x μ ∂φ = , ∂ x μ ∂ x μ ∂xμ
d. h. (dφ)μ = Andererseits soll nach (4.9)
∂xμ (dφ)μ . ∂xμ
76
4 Tensorrechnung im Minkowski-Raum
μ (dφ)μ = −1 μ (dφ)μ gelten. Nun folgt aus
μ x μ = −1 μ x μ
auch
−1 μ ∂xμ , (4.21) = μ μ ∂x da die Elemente von Lorentz-Matrizen nicht von den Punkten der Raumzeit abhängen, sondern konstant sind. Die in Aufgabe 4.4 zu benutzende Transformationsmatrix ∂ x μ /∂ x μ nennt man JacobiMatrix, und wir werden später sehen, dass bei beliebigen Koordinatentransformationen in der Allgemeinen Relativitätstheorie die Jacobi-Matrizen die gleiche Rolle spielen wie die Lorentz-Matrizen in der Speziellen Relativitätstheorie. Gradienten der Koordinatenlinien Ist die skalare Funktion φ eine Koordinatenlinie φ = x μ , dann erhalten wir wegen ∂xμ = δνμ ∂xν durch Vergleich mit (9.4) die Beziehung d x μ = eμ ,
(4.22)
d. h., die Gradienten der Koordinatenlinien sind die Basiseinsformen. Damit können wir den Gradienten einer beliebigen Funktion φ auch als dφ =
∂φ d x μ, ∂xμ
(4.23)
also als Linearkombination der Basiseinsformen schreiben, und wir werden später wieder darauf zurückkommen. Achtung: Die Formel hat zwar große Ähnlichkeit mit der Definition des üblichen Differenzials einer Funktion, hier ist dφ aber eine Einsform und keine infinitesimal kleine Veränderung von φ!
4.2
Tensoren vom Rang (0, N) ρσ τ
Tensoren werden in der Physik häufig als Zahlensysteme T μν mit unteren und oberen Indizes definiert, die sich auf ein bestimmtes Koordinatensystem beziehen und bei einem Koordinatenwechsel auf eine ganz bestimmte Art transformiert werden müssen. Wir wollen hier einen anderen Weg gehen und die Tensoren, ähnlich wie die Vektoren und Einsformen zuvor, als (multi-)lineare Abbildungen definieren und uns anschließend anschauen, welche
4.2 Tensoren vom Rang (0, N )
77
Gesetze für die Koordinatenwechsel sich aus den Definitionen ergeben. Damit eröffnet sich uns generell die Möglichkeit, Rechnungen ohne Rückgriff auf Koordinatensysteme, d. h. koordinatenfrei, durchzuführen. Unter einem Tensor vom Rang (0, N ) verstehen wir eine multilineare Abbildung TN0 : M ×M× · · · × M → R. N mal
Dabei heißt multilinear, dass die Abbildung TN0 in jedem ihrer N Argumente linear ist. Die Menge aller Tensoren vom Rang (0, N ) ⎧ ⎫ ⎨ ⎬ 0 T0N := TN0 : M × M × · · · × M → R, T multilinear N
⎩ ⎭ N mal
ist ein 4 N -dimensionaler Vektorraum (siehe z. B. [4, 11]), der auch N -faches Tensorprodukt von M∗ genannt wird. Die Elemente von T0N nennt man auch kovariante Tensoren der Stufe N . Eine auf der Raumzeit definierte skalare Funktion φ (t, y, y, z) ist ein Tensor vom Rang (0, 0), da sie keinen Vektor als Argument besitzt. Eine Einsform ist nach der obigen Definition ein Tensor vom Rang (0, 1). Damit die Darstellungen übersichtlich bleiben, wollen wir im Folgenden die wichtigsten Eigenschaften dieser Tensoren hauptsächlich für den Spezialfall N = 2 untersuchen. Tensoren vom Rang (0, 2) Ein Tensor T02 vom Rang (0, 2) hat zwei Vierervektoren als Argumente und bildet diese in die reellen Zahlen ab. Ein Beispiel solcher Tensoren haben wir schon kennengelernt: Es ist das Skalarprodukt bzw. der Minkowski-Tensor η : M × M → R. Der einfachste Tensor vom Rang (0, 2) entsteht durch Multiplikation von zwei Einsformen α und β und wird für zwei beliebige Vierervektoren U und V durch α ⊗ β (U , V ) := α (U ) · β (V ) definiert. Das Symbol ⊗ kennzeichnet die tensorielle Multiplikation. Das Tensorprodukt der beiden Einsformen ist nicht kommutativ, d. h., es gilt im Allgemeinen α ⊗ β (U , V ) = α (U ) β (V ) = β (U ) α (V ) = β ⊗ α (U , V ) . α ⊗ β und β ⊗ α sind also generell unterschiedliche Tensoren. Nicht jeder Tensor vom Rang (0, 2) ist ein Produkt von zwei Einsformen, jedoch kann jeder Tensor vom Rang (0, 2) als Summe tensorieller Produkte dargestellt werden, wie wir jetzt zeigen wollen. Zunächst definieren wir die 16 Komponenten eines beliebigen Tensors T20 nach Auswahl einer Basis A = (e0 , e1 , e2 , e3 ) von M durch
78
4 Tensorrechnung im Minkowski-Raum
Tμν := T20 eμ , eν . Für zwei beliebige Vierervektoren folgt daraus T20 (U , V ) = T20 U μ eμ , V ν eν = U μ V ν T20 eμ , eν = U μ V ν Tμν .
(4.24)
Die zwei unten stehenden Indizes nennt man auch kovariante Indizes, die oben stehenden kontravariante Indizes. Wir wollen nun die Frage beantworten, ob es eine Basis eμν von T02 gibt, sodass sich jeder Tensor T20 als Linearkombination T20 = Tμν eμν schreiben lässt. Wenn es eine solche Darstellung gibt, dann folgt Tμν = T20 eμ , eν = Tρσ eρσ eμ , eν und daraus
eρσ eμ , eν = δμρ δνσ .
(4.25)
Nach Definition der dualen Basis gilt aber δμρ = eρ eμ δνσ = eσ (eν ) . Damit ergibt sich aus (4.25) eρσ eμ , eν = eρ eμ eσ (eν ) = eρ ⊗ eσ eμ , eν , d. h., die Tensorprodukte der dualen Basiseinsformen bilden eine Basis von T02 , und es gilt T20 = Tμν eμ ⊗ eν . Aus der Bilinearität von Tensoren vom Rang (0, 2) folgen unmittelbar die Rechenregeln: • α ⊗ β + γ ⊗ β = (α + γ ) ⊗ β, • α ⊗ β + α ⊗ γ = α ⊗ (β + γ ) , • (λα) ⊗ β = α ⊗ (λβ) = λ (α ⊗ β) f ur ¨ λ ∈ R. Transformation der Tensoren vom Rang (0, 2) Wir untersuchen das Transformationsverhalten der Komponenten und Basen von Tensoren vom Rang (0, 2). Seien dazu zwei Basen A = (e0 , e1 , e2 , e3 ) und A = (e0 , e1 , e2 , e3 ) von M ausgewählt, dann folgt mit den Transformationsformeln für die Basen
4.2 Tensoren vom Rang (0, N )
79
μ ν Tμ ν = T20 eμ , eν = T20 −1 μ eμ , −1 ν eν μ ν μ ν = −1 μ −1 ν T20 eμ , eν = −1 μ −1 ν Tμν . Wir erhalten also genau das gleiche Transformationsverhalten, welches wir für den Minkowski-Tensor schon in (2.11) gezeigt haben. Analog gilt mit den obigen Rechenregeln: eμ ⊗ eν = μμ eμ ⊗ ν ν eν = μμ ν ν eμ ⊗ eν
Aufgabe 4.5 Zeigen Sie mit den Transformationsgesetzen, dass die rechte Seite von (4.24) eine Invariante ist.
Lösung Es gilt ρ σ U μ V ν Tμ ν = μμ U μ ν ν V ν −1 μ −1 ν Tρσ ρ σ = μμ −1 μ ν ν V ν −1 ν U μ V ν Tρσ
ρ
=δμ
=δνσ
= U μ V ν Tμν . Symmetrie und Antisymmetrie Wir haben gesehen, dass das tensorielle Produkt nicht kommutativ ist. Daher heißt ein Tensor T20 symmetrisch, wenn T20 (U , V ) = T20 (V , U ) für alle Vierervektoren U , V gilt. Für die Komponenten eines symmetrischen Tensors gilt dann Tμν = Tνμ . Wir haben schon gezeigt, dass der Minkowski-Tensor g symmetrisch ist. Einen Tensor T20 nennt man antisymmetrisch, wenn T20 (U , V ) = −T20 (V , U ) für alle Vierervektoren U , V gilt. Für die Komponenten folgt dann Tμν = −Tνμ .
80
4.3
4 Tensorrechnung im Minkowski-Raum
Tensoren vom Rang (M, 0)
Unter einem Tensor vom Rang (M, 0) verstehen wir eine multilineare Abbildung: T0M : M∗ × M∗ × · · · × M ∗ → R M mal
Die Menge aller Tensoren vom Rang (M, 0) ⎧ ⎫ ⎨ ⎬ × · · · × M ∗ → R, T0M multilinear T0M := T0M : M∗ × M∗ ⎩ ⎭ M mal
ist ebenfalls ein 4 M -dimensionaler Vektorraum, der auch M-faches Tensorprodukt von M genannt wird. In (4.18) haben wir durch V (α) = α (V ) einen Vierervektor als eine lineare Abbildung V : M∗ → R dargestellt. Ein Vierervektor ist demnach ein Tensor vom Rang (1, 0). Wir betrachten den Fall M = 2 wieder etwas ausführlicher und übertragen die wichtigsten Ergebnisse aus dem vorherigen Abschnitt. Tensoren vom Rang (2, 0) Unter einem (kontravarianten) Tensor vom Rang (0, 2) verstehen wir eine multilineare Abbildung: T02 : M∗ × M∗ → R Ein Tensor vom Rang (2, 0) hat zwei Einsformen als Argumente und bildet diese in die reellen Zahlen ab. Ein Beispiel haben wir schon kennengelernt: Es ist das Skalarprodukt G : M∗ × M∗ → R auf dem Dualraum. Der einfachste Tensor vom Rang (2, 0) entsteht durch (tensorielle) Multiplikation von zwei Vektoren U und V und wird für zwei beliebige Einsformen α und β durch U ⊗ V (α, β) := U (α) V (β) = α (U ) β (V ) (4.26) definiert. Wir definieren die 16 Komponenten eines beliebigen Tensors T02 nach Auswahl einer dualen Basis e0 , e1 , e2 , e3 von M∗ durch T μν := T02 eμ , eν . Für zwei beliebige Einsformen folgt daraus T02 (α, β) = αμ βν T μν .
(4.27)
4.4 Tensoren vom Rang (M, N )
81
Die tensoriellen Produkte der Basisvektoren bilden eine Basis der Menge der Tensoren vom Rang (2, 0), und es gilt T02 = T μν eμ ⊗ eν . Die Komponenten und Basen von Tensoren vom Rang (2, 0) transformieren sich wie folgt:
eμ
T μ ν = μμ ν ν T μν μ ν ⊗ eν = −1 μ −1 ν eμ ⊗ eν
(4.28) (4.29)
Die Definitionen für symmetrische und antisymmetrische (2, 0)-Tensoren übertragen sich eins zu eins aus dem vorherigen Abschnitt.
4.4
Tensoren vom Rang (M, N)
Unter einem Tensor vom Rang (M, N ) verstehen wir eine multilineare Abbildung ∗ TNM : M · · × M ∗ × M · · × M → R. × · × · M mal
N mal
Die Menge aller (M, N )-Tensoren ⎧ ⎫ ⎨ ⎬ M M M∗ × · · · × M ∗ × M × · · · × M → R, T multilinear TM N := ⎩ TN : N
⎭ M mal
N mal
ist ein 4 M+N -dimensionaler Vektorraum. Wir betrachten als Beispiel einen Tensor T11 vom Rang (1, 1). Tensoren vom Rang (1, 1) Der einfachste (1, 1)-Tensor entsteht durch tensorielle Multiplikation eines Vektors V mit einer Einsform α für beliebige β und U durch V ⊗ α (β, U ) := V (β) α (U ) = β (V ) α (U ) . Die Komponenten von T11 ergeben sich durch T μν = T11 eμ , eν . Damit folgt für beliebige Einsformen und Vektoren die Invariante T11 (α, V ) = αμ V ν T μν .
82
4 Tensorrechnung im Minkowski-Raum
Die tensoriellen Produkte von Basiseinsformen und Basisvektoren bilden eine Basis von T11 , und es gilt T11 = T μν eμ ⊗ eν . Die Komponenten und Basen von (1, 1)-Tensoren transformieren sich wie folgt: ν = μμ −1 ν T μν μ ⊗ e = −1 μ ν ν eμ ⊗ eν T
eμ
μ ν ν
Dahinter steckt ein allgemeines Prinzip: Zu jedem oberen Index gehört eine Lorentz-Matrix und zu jedem unteren Index eine inverse Lorentz-Matrix.
4.5
Kontraktion von Tensoren
Wir wollen noch die Kontraktion, die uns für Vektoren und Einsformen schon in Gl. (4.2) begegnet ist, auf beliebige Tensoren erweitern. Wenn wir uns den (1, 1)-Tensor T11 = V ⊗ α anschauen, dann definieren wir die lineare Kontraktionsabbildung C : T11 → T00 durch C T11 = C (V ⊗ α) = α (V ) . Das ist die koordinatenfreie Darstellung von (4.2). Die Kontraktion ist einfach die Wirkung der Einsform α auf den Vektor V und macht aus einem Tensor vom Rang (1, 1) einen Tensor vom Rang (0, 0), also eine Funktion. Stellen wir einen beliebigen Tensor vom Rang (1, 1) durch seine Komponenten dar T11 = T μν eμ ⊗ eν , dann ist
C T11 = T μν C eμ ⊗ eν = T μν eν eμ = T μν δμν = T μμ .
Ist T ein Tensor höherer Stufe, so muss man zunächst angeben, welcher kovariante Index mit welchem kontravarianten Index kontrahiert werden soll. Ist z. B. T23 ein Tensor vom Rang (3, 2) und eμ ⊗ eν ⊗ eρ ⊗ eσ ⊗ eτ eine Basis von T32 und sollen der erste kontravariante und zweite kovariante Index kontrahiert werden, so definieren wir die lineare Kontraktionsabbildung C21 : T32 → T21 durch C21 eμ ⊗ eν ⊗ eρ ⊗ eσ ⊗ eτ = eν ⊗ eρ ⊗ eσ eτ eμ = eν ⊗ eρ ⊗ eσ δμτ . Damit ergibt sich für einen beliebigen Tensor T23 aus T32 : τ μνρ μνρ μνρ C21 T23 = T σ τ C21 eμ ⊗ eν ⊗ eρ ⊗ eσ ⊗ eτ = T σ τ eν ⊗ eρ ⊗ eσ δμ = T σ μ eν ⊗ eρ ⊗ eσ
(4.30)
4.5
Kontraktion von Tensoren
83
Kontraktion von symmetrischen mit antisymmetrischen Tensoren Wenn wir das Tensorprodukt eines kontravarianten symmetrischen Tensors F02 mit einem kovarianten antisymmetrischen Tensor G 02 in beiden Indizes kontrahieren, so erhalten wir als Ergebnis null: F μν G μν = F νμ G μν F sym
=
G antisym
−F νμ G νμ = −F μν G μν ⇒ F μν G μν = 0 ν↔μ
(4.31)
Dieses Resultat überträgt sich sinngemäß auf Tensoren beliebigen Ranges. Index hoch- und runterziehen Ähnlich wie wir einen Vektor V in eine Einsform αV abgebildet haben, können wir mit dem Minkowski-Tensor g20 einen Tensor vom Rang (M, N ) auf einen Tensor vom Rang (M − 1, N + 1) sowie mit dem inversen Tensor G 20 einen Tensor vom Rang (M, N ) auf einen Tensor vom Rang (M + 1, N − 1) abbilden. Wir schauen uns einige Beispiele in Koordinatenform an. Beispiel 4.1
1. Sind T μν die Komponenten eines Tensors T02 , so sind ηρν T μν = T μρ die Komponenten eines (1, 1)-Tensors T11 . 2. Nimmt man einen Tensor T20 mit dem Komponenten Tμν , so sind ηρν Tμν = T ρμ die Komponenten eines (1, 1)-Tensors T11 . 3. Wählen wir als Tensor vom Rang (0, 2) speziell den Minkowski-Tensor g20 mit den Komponenten ημν , so erhalten wir ην μ = ηνρ ημρ = δ νμ ,
(4.32)
da die beiden Matrizen invers zueinander sind. Wenn wir den anderen Index auch noch raufziehen, erhalten wir ημρ ην ρ = ημρ δ ν ρ = ημν , d. h., durch zweimaliges Raufziehen der Indizes der Komponenten von g20 erhalten wir die Komponenten von G 20 . Die Minkowski-Metrik ist der einzige Tensor mit dieser Eigenschaft.
84
4 Tensorrechnung im Minkowski-Raum
4.6
Ableitungen von Tensoren im Minkowski-Raum
Wir haben gezeigt, dass eine skalare Funktion φ ein Tensor vom Rang (0, 0) und der Gradient dφ ein Tensor vom Rang (0, 1) ist. Durch die Ableitung ist ein Tensor entstanden, der einen (kovarianten) Grad höher ist, d. h. einen unteren Index mehr hat als der Tensor φ vom Rang (0, 0). Diese Systematik überträgt sich auf die Ableitungen beliebiger Tensoren. Wir wählen ein kartesisches Koordinatensystem mit Basisvektoren (e0 , e1 , e2 , e3 ) aus und schauen uns zunächst einen Vierervektor V = V μ eμ an, dessen Komponenten V μ = V μ (X ) Funktionen der Koordinaten sein mögen. Wie in (4.19) nehmen wir an, dass wir uns entlang der durch die Eigenzeit τ parametrisierten Weltlinie X (τ ) = (t (τ ) , x (τ ) , y (τ ) , z (τ )) bewegen. Dann folgt dV μ V (τ + τ ) − V (τ ) V μ (τ + τ ) − V μ (τ ) dV = lim = lim eμ = eμ , τ →0 τ →0 dτ τ τ dτ da die Basisvektoren nicht von τ abhängen. Nun gilt wie in (4.20) ∂V μ ∂xν ∂V μ ν dV μ = = U . dτ ∂ x ν dτ ∂xν Als Differenz von zwei Vektoren ist d V /dτ ebenfalls ein Vektor und es gilt μ ∂V dV ν = U eμ . dτ ∂xν
(4.33)
Ableitungen und Viererdivergenz Durch ∂V μ eμ ⊗ e ν ∇V := ∂xν wird ein Tensor vom Rang (1, 1) definiert, den wir Ableitung von V nennen wollen. Kontrahiert man die Ableitung von V , so erhält man den Lorentz-Skalar ∂V 1 ∂V 2 ∂V 3 ∂V 0 ∂V μ + + + , = ∂xμ ∂t ∂x ∂y ∂z
(4.34)
den man auch Viererdivergenz nennt. Die Gl. (4.33) schreiben wir auch als dV = ∇U V . dτ ∇U V nennt man auch Richtungsableitung von V in Richtung U . Die Herleitung der Ableitung eines Vierervektors lässt sich analog auf beliebige Tensoren übertragen. So ist μν z. B. die Ableitung eines Tensors T32 = T ρσ τ vom Rang (2, 3) ein Tensor vom Rang (2, 4)
4.6
Ableitungen von Tensoren im Minkowski-Raum
mit
μν
85
∂ T ρσ τ eμ ⊗ eν ⊗ e α ⊗ e ρ ⊗ e σ ⊗ e τ . ∂xα Wir haben bei der Berechnung der Ableitungen genutzt, dass die Basisvektoren und Basiseinsformen konstant waren und deshalb selbst nicht als Ableitungen auftauchen. Später werden wir sehen, dass das in der gekrümmten Raumzeit der Allgemeinen Relativitätstheorie nicht mehr gilt und die Ableitungen von Tensoren dort eine kompliziertere Form annehmen. ∇T32 =
5
Elektrodynamik
Wir wollen in diesem Kapitel untersuchen, wie sich andere physikalische Teilgebiete, die über die Newton’sche Mechanik hinausgehen, in der Speziellen Relativitätstheorie darstellen lassen. Dazu unterstellen wir durchgehend, dass wir bei der Auswahl von Inertialsystemen immer mit kartesischen Koordinaten arbeiten, d. h. insbesondere, dass die Minkowski-Metrik η die Komponenten ημν = diag (−1, 1, 1, 1) besitzt.
5.1
Maxwell-Gleichungen
In diesem Abschnitt werden wir zeigen, dass die vier Maxwell-Gleichungen der Elektrodynamik (in natürlichen Einheiten) ∂ B = 0 (homogen) ∂t ∂ E ∇ × B − = j (inhomogen) ∂t
∇ · B = 0, ∇ × E +
(5.1)
∇ · E = ρ,
(5.2)
forminvariant gegenüber Lorentz-Transformationen sind. E und B bezeichnen die elektrischen und magnetischen Felder, ρ ist die Ladungsdichte und j der Stromdichtevektor (siehe [1]). Im Vergleich mit den Ergebnissen aus den Abschn. 3.3 und 3.4, in denen wir gezeigt haben, dass die relativistische Mechanik nur bei sehr kleinen Geschwindigkeiten mit der Newton’schen Mechanik übereinstimmt, ist die vollständige Lorentz-Invarianz der Elektrodynamik, die ja ebenfalls im dreidimensionalen euklidischen Raum definiert ist, durchaus überraschend. Die Lorentz-Invarianz wird aber sofort deutlich, wenn wir die MaxwellGleichungen eins zu eins auf Tensorgleichungen umschreiben. Diese werden dadurch einfacher, und die enge Verknüpfung zwischen elektrischen und magnetischen Feldern wird unmittelbar sichtbar. © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_5
87
88
5 Elektrodynamik
Kontinuitätsgleichung Wir schauen zunächst auf die Quellen ρ, j der elektromagnetischen Felder. Dazu nutzen wie ein weiteres, oftmals stillschweigend vorausgesetztes Postulat der Speziellen Relativitätstheorie, dass nämlich die Ladung eines Teilchens nicht vom Inertialsystem abhängt, was auch experimentell sehr gut abgesichert ist. Ist ρ0 =
dq dq = d V0 d x0 dy0 dz 0
die Ladungsdichte einer ruhenden Ladungsverteilung dq pro Volumenelement d V0 , so gilt für eine Ladungsdichte ρ, die sich mit der Geschwindigkeit u = (u, 0, 0) parallel zur xAchse bewegt, mit der Ladungsinvarianz und Längenkontraktion: ρ=
dq dq dq = = = γρ0 , d x0 dV d xd ydz dy0 dz 0 γ
und die Stromdichte ist
j = ρ u = γρ0 u.
(5.3)
(5.4)
Aus den beiden letzten Gl. (5.3) und (5.4) definieren wir die Viererstromdichte J := J μ = ρ, j = ρ0 (γ , γ u) = ρ0 U μ = ρ0 U , wobei U die Vierergeschwindigkeit ist.
Aufgabe 5.1 Zeigen Sie mithilfe der Kontinuitätsgleichung in der Elektrodynamik (siehe [1]):
∂ρ ∇ · j = − , ∂t dass die Viererstromdichte divergenzfrei ist. Lösung Es gilt ∂ J1 ∂ J2 ∂ J3 ∂ Ji ∇ · j = + + = ∂x ∂y ∂z ∂xi sowie
∂ J0 ∂ J0 ∂ρ =− =− 0. ∂t ∂t ∂x Wir erhalten also die kompakte Form der Kontinuitätsgleichung −
∂ Jμ = 0. ∂xμ
(5.5)
5.1
Maxwell-Gleichungen
89
Die Viererstromdichte ist demnach divergenzfrei, siehe (4.34). Relativistische Wellengleichung Aus der Vektoranalysis (siehe z. B. [9]) ist bekannt, dass (unter bestimmten Voraussetzungen, die wir hier unterstellen) für das nach (5.1) divergenzfreie magnetische Feld B ein Vektorpotenzial A existiert, sodass B = ∇ × A
(5.6)
gilt. Wir setzen das in die zweite homogene Maxwell-Gleichung (5.1) ein und erhalten ∂ ∂ A ∇ × E = − ∇ × A ⇒ ∇ × E + = 0. ∂t ∂t Ein wirbelfreies Feld besitzt eine skalare Potenzialfunktion φ, sodass sich ∂ A ∂ A = −∇φ ⇒ E = −∇φ − E + ∂t ∂t
(5.7)
ergibt. Die Gl. (5.6) und (5.7) definieren die Potenziale nicht eindeutig. Man hat noch die Freiheit, eine Eichfunktion χ (t, x) zu wählen und dann die Potenziale durch A = A + ∇χ ∂χ φ = φ − ∂t
(5.8)
zu ersetzen.
Aufgabe 5.2 φ Zeigen Sie, dass sich die Felder E und B nicht ändern, wenn man die Potenziale A, wie in (5.8) durch A , φ ersetzt.
Lösung Es gilt: ∇ × A = ∇ × A + ∇χ = ∇ × A + ∇ × ∇χ = ∇ × A = B =0
∂χ ∂ ∂ A ∂ A = −∇ φ − − A + ∇χ = −∇φ − = E −∇φ − ∂t ∂t ∂t ∂t
90
5 Elektrodynamik
Wenn man die Funktion χ (t, x) so wählt, dass ∂φ ∇ · A = − ∂t gilt (sogenannte Lorenz-Eichung, nach dem Physiker L. V. Lorenz (1829–1891), nicht zu verwechseln mit dem Niederländer H. A. Lorentz!), dann ergeben sich nach einigen Rechenschritten aus den zwei inhomogenen Maxwell-Gleichung (5.2) die beiden (eigentlich j) Wellengleichungen vier: eine für φ, ρ und jeweils eine für die drei Komponenten von A, ∂ 2 A ∇ 2 A − 2 = − j ∂t ∂ 2φ ∇ 2 φ − 2 = −ρ. ∂t
(5.9) (5.10)
Diese beiden Gleichungen können wir durch das Viererpotenzial A := Aμ = φ, A1 , A2 , A3 = φ, A in einer Gleichung zusammenfassen: A = −J , wobei der D’Alembert-Operator durch := ∇ 2 −
∂2 ∂t 2
definiert wird. In Komponentenschreibweise erhalten wir mit =−
∂2 ∂2 ∂2 ∂2 ∂ ∂ ∂ ∂ + 2 + 2 + 2 = ημν μ ν =: =: ∂ ν ∂ν 2 ∂t ∂x ∂y ∂z ∂x ∂x ∂ xν ∂ x ν
(5.11)
die relativistische Wellengleichung ∂ ν ∂ν Aμ = −J μ ,
(5.12)
die eine Vierervektorgleichung, d. h. Lorentz-invariant ist. Die Lorenz-Eichung lässt sich als ∂μ Aμ = 0,
(5.13)
also ebenfalls Lorentz-invariant darstellen. Lösung der Wellengleichung Wir geben hier nur eine spezielle Lösung der inhomogenen Wellengleichung (5.12) an. Die allgemeine Lösung erhält man, wenn man zur speziellen Lösung eine beliebige Lösung der
5.1
Maxwell-Gleichungen
91
homogenen Differenzialgleichung
∂ ν ∂ν A μ = 0
addiert. Im statischen Fall, d. h., wenn φ und A nicht von der Zeit t abhängen, reduzieren sich die Gleichungen in (5.12) auf die vier Poisson-Gleichungen ∇ 2 φ = −ρ,
∇ 2 A = − j,
vergleiche (7.10), mit den Lösungen φ ( x) =
ρ x d x , | x − x | 3
A ( x) =
j x d x , | x − x | 3
(5.14)
wobei x − x die Entfernung zwischen dem Quellpunkt x und dem Feldpunkt x ist, siehe [1]. Da sich elektromagnetische Effekte mit Lichtgeschwindigkeit ausbreiten, kommt es daher im nichtstatischen Fall nicht auf den Zustand der Quelle zum jetzigen Zeitpunkt t an, sondern auf den Zustand, den die Quelle zu dem früheren Zeitpunkt tr = t − x − x besaß. Da wir c = 1 gesetzt haben, ist x − x die Zeit, die das Licht für die Strecke x − x braucht. Die Größe tr wird retardierte Zeit genannt. Die nichtstatischen Lösungen von (5.12) ergeben sich damit zu j tr , x 1 1 3 ρ tr , x 3 d x d x φ (t, x) = , A (t, x) = , (5.15) | | 4π 4π x − x | x − x | wobei die Größen ρ tr , x und j tr , x zur jeweiligen retardierten Zeit auszuwerten sind. Die Integranden in (5.15) nennt man auch retardierte Potenziale. Für statische φ und A gehen die Lösungen (5.15) in (5.14) über. Wir haben hier die Lösungen der Wellengleichung (5.12) nur kurz aufgelistet, die entsprechenden Herleitungen findet man z. B. in [1] oder etwas ausführlicher und mathematisch anspruchsvoller in [37]. In Kap. 16 über Gravitationswellen werden wir uns nochmals intensiv mit dem Wellenformalismus beschäftigen. Multipolentwicklung Wir wollen die Gl. (5.14)
φ ( x) =
ρ x d x | x − x | 3
(5.16)
für einen weit außerhalb der Ladungsverteilung liegenden Feldpunkt x mithilfe der TaylorEntwicklung um die Stelle x = 0 näherungsweise lösen.
92
5 Elektrodynamik
Aufgabe 5.3 Zeigen Sie, dass die Taylor-Entwicklung von 1/ x − x bei x = 0 bis zur zweiten Ordnung zu
1 i i 3 1 i j r 2 i j 1 1 x x i x j , + δ x x + x − = | r r3 2 r5 3 x − x | i
(5.17)
i, j
mit r = | x | führt. Lösung Wir gehen von 3 2 x − x = x i − x i i=1
∂ x i − x i x − x = | ∂ x i x − x | ∂ x i − x i x i − x i −1 x − x = − = ∂ x i | | x − x |3 x − x |3 aus und erhalten für die zweiten Ableitungen: ∂ x i − x i 1 ∂ ∂ = ∂ x j ∂ x i | ∂ x j | x − x | x − x |3 1 3 i i j j x x =− δi j + − x − x 3 | x − x | | x − x |5 Wir definieren r := | x | und berechnen die Taylor-Reihe mit den Ableitungen bei x = 0 bis zur 2. Ordnung
1 i i 3 1 i j r 2 i j 1 1 x x i x j . + δ = x x + x − | r r3 2 r5 3 x − x | i
i, j
Die Gl. (5.17) eingesetzt in 5.16 führt zu φ ( x) ≈
d · x 3 1 Q + 3 + Qi j x i x j r r 2 r5 i, j
mit
5.2
Feldstärketensor
93
• der Gesamtladung:
Q :=
• dem Dipolmoment: d :=
d 3 x ρ x ,
d 3 x x ρ x und
(5.18)
• dem Quadrupolmoment: Q i j :=
r 2 i j ρ x . δ d 3 x x i x j − 3
(5.19)
Üblicherweise wird die Multipolentwicklung bei großem r durch den Monopolterm φmono ( x) =
Q r
dominiert. Ist dieser null, so liefert der Dipol den größten Beitrag zum Potenzial. In der Elektrodynamik spielt der Potenzialanteil des Quadrupolmoments eine eher untergeordnete Rolle, da er nur mit dem Faktor r −5 beiträgt. Wir werden aber in Kap. 16 über Gravitationswellen sehen, dass die Ableitungen des gravitativen Quadrupolmoments dort wichtige Größen zur Berechnung von Wellenfunktionen, Energieflüssen usw. sind.
5.2
Feldstärketensor
Wir betrachten die beiden Gl. (5.6) und (5.7) etwas genauer und rechnen die x-Komponenten von E und B aus: ∂φ ∂ A1 ∂ A1 ∂φ ∂ A1 ∂ A0 − =− 0 − 1 = − = ∂ 0 A1 − ∂ 1 A0 ∂t ∂x ∂x ∂x ∂ x0 ∂ x1 ∂ A2 ∂ A3 ∂ A3 ∂ A2 ∂ A3 ∂ A2 − = B1 = − = − = ∂ 2 A3 − ∂ 3 A2 2 3 ∂y ∂z ∂x ∂x ∂ x2 ∂ x3
E1 = −
Ganz ähnlich rechnet man jeweils die beiden anderen Komponenten aus. Da auf den rechten Seiten Ausdrücke mit zwei oberen Indizes stehen, lassen sich die beiden Felder offensichtlich nicht zu Vierervektoren erweitern. Vielmehr definieren wir den Feldstärketensor F02 := F μν := ∂ μ Aν − ∂ ν Aμ , in Matrixschreibweise
⎞ 0 E1 E2 E3 ⎜ −E 1 0 B 3 −B 2 ⎟ ⎟. =⎜ ⎝ −E 2 −B 3 0 B1 ⎠ −E 3 B 2 −B 1 0
(5.20)
⎛
F μν
(5.21)
94
5 Elektrodynamik
Es ist aus der Definitionsgleichung (5.20) klar, dass F ein antisymmetrischer Tensor vom Rang (2, 0) ist, d. h. F νμ = −F μν .
Aufgabe 5.4 Zeigen Sie, dass der Feldstärketensor unter der Eichtransformation
Aμ → A μ = Aμ + ∂ μ χ
(5.22)
invariant ist. Lösung Es gilt: F μν = ∂ μ Aν − ∂ ν Aμ
= ∂ μ Aν − ∂ μ ∂ ν χ − ∂ ν Aμ − ∂ ν ∂ μ χ = F μν
Da wir später sehen werden, dass die Maxwell-Gleichungen aus dem Feldstärketensor F02 ableitbar sind, sind auch die Maxwell-Gleichungen unter der Eichtransformation (5.22) invariant. Wenn wir die Indizes von F02 nach unten ziehen, so erhalten wir den kovarianten Feldstärketensor F20 : ⎞ 0 −E 1 −E 2 −E 3 ⎜ E1 0 B 3 −B 2 ⎟ ⎟ =⎜ 2 3 ⎝ E −B 0 B1 ⎠ E 3 B 2 −B 1 0 ⎛
F20 := Fμν = ημρ ηνσ F ρσ
(5.23)
Wir schauen uns an, wie sich F02 unter einer Lorentz-Transformation verhält. Es gilt nach den Transformationsregeln für Tensoren vom Rang (2, 0) im Minkowski-Raum, siehe (4.28):
F μ ν = μμ ν ν F μν Ist die Lorentz-Transformation ein Boost mit v = (v, 0, 0) entlang der x-Achse, d. h., ⎛
μν
⎞ γ −γ v 0 0 ⎜ −γ v γ 0 0 ⎟ ⎟, =⎜ ⎝ 0 0 1 0⎠ 0 0 01
5.2
Feldstärketensor
95
so erhalten wir folgende Transformationsgesetze: E 1, E 2 = γ E 2 − v B3 , E 3 = γ B1, B2 = γ B2 + v E 3 , B3 = γ
E1 = 1
B =
E 3 + v B2 B − vE 3
2
(5.24) (5.25)
Aufgabe 5.5 Zeigen Sie die Gültigkeit der Transformationsgesetze für E 1 und E 2 .
Lösung Es gilt
E 1 = F 0 1 = 0 μ 1 ν F μν =
= 0 0 1 0 F 00 + 0 0 1 1 F 01 + 0 1 1 0 F 10 + 0 1 1 1 F 11 = γ 2 F 01 + (γ v)2 F 10 = γ 2 E 1 1 − v 2 = E 1.
Die Summation in der zweiten Zeile reicht aus, da 0 μ = 1 ν = 0 für μ, ν > 1. Genauso folgt:
E 2 = F 0 2 = 0 μ 2 ν F μν =
= 0 0 2 2 F 02 + 0 1 2 2 F 12 = γ F 02 − γ v F 12 = γ E 2 − v B3 Die Transformationsregeln (5.24) und (5.25) machen nochmals deutlich, dass sich die elektrischen und magnetischen Felder nicht wie Vierervektoren transformieren.
Aufgabe 5.6 Berechnen Sie Felder B bzw. E , wenn in S B = 0 bzw. E = 0 gilt.
Lösung Ist B = 0 in S, so folgt v × E , B = γ v 0, E 3 , −E 2 = −γ v × E = − da v = (v, 0, 0). Ein Beobachter in S nimmt also ein magnetisches Feld wahr, das im System S nicht vorhanden ist, und er kann es durch sein elektrisches Feld bestimmen. Ist E = 0 in S, so folgt analog
96
5 Elektrodynamik
E = γ v 0, −B 3 , B 2 T = γ v × B = v × B . Ein Beobachter in S nimmt also ein elektrisches Feld wahr, das im System S nicht vorhanden ist, und er kann es durch sein magnetisches Feld bestimmen.
5.3
Lorentz-Invarianz der Maxwell-Gleichungen
Inhomogene Maxwell-Gleichungen Die inhomogenen Maxwell-Gleichungen (5.2) können als ∇ · E = ρ = J 0 ∂ E = j = J ∇ × B − ∂t geschrieben werden. Diese können wir zur Viervektorgleichung ∂ν F μν = J μ bzw. koordinatenfrei
(5.26)
C12 ∇ F02 = J
zusammenfassen.
Aufgabe 5.7 Beweisen Sie die Gl. (5.26).
Lösung. Wir rechnen in der zweiten Gleichung beispielhaft die erste Komponente der linken Seite aus: ∂ E1 ∂ E2 ∂ E3 ∂ Ei ∂ F 0i ∇ · E = + + = = = ∂i F 0i = ∂ν F 0ν ∂x1 ∂x2 ∂x3 ∂xi ∂xi 1 ∂ E 1 ∂ B3 ∂ B2 ∂ E1 ∇ × B − = − + = ∂2 F 12 + ∂3 F 13 + ∂0 F 10 = ∂i F 1i = ∂ν F 1ν , 2 3 ∂t ∂x ∂x ∂x0 wobei der jeweils letzte Schritt ausnutzt, dass die Diagonalelemente von F μν gleich null sind. Wenn wir die linke Seite von (5.26) nochmals ableiten und kontrahieren, erhalten wir ∂μ ∂ν F μν = 0,
5.3
Lorentz-Invarianz der Maxwell-Gleichungen
97
da nach (4.31) die Kontraktion des symmetrischen Tensors ∂μ ∂ν mit dem antisymmetrischen F μν null ergibt. Dann gilt aber auch ∂μ J μ = 0, d. h., aus den inhomogenen Maxwell-Gleichungen folgt direkt die Kontinuitätsgleichung. Homogene Maxwell-Gleichungen Die beiden homogenen Maxwell-Gleichungen lauten nach (5.1) ∇ · B = 0 ∂ B ∇ × E + = 0. ∂t Sie lassen sich durch die Tensorgleichung ∂ ρ F μν + ∂ μ F νρ + ∂ ν F ρμ = 0
(5.27)
ausdrücken. Die drei Summanden sind Tensoren vom Rang (3, 0) und entstehen durch zyklische Vertauschung der Indizes.
Aufgabe 5.8 Beweisen Sie Gl. (5.27).
Lösung Mit dem Feldstärketensor F02 lässt sich die erste homogene Maxwell-Gleichung in folgender Form schreiben: ∂ B1 ∂ B2 ∂ B3 0 = ∇ · B = + + = ∂1 F 32 + ∂2 F 13 + ∂3 F 21 ∂x1 ∂x2 ∂x3 = − ∂ 1 F 23 + ∂ 2 F 31 + ∂ 3 F 12 , im letzten Schritt erhält man den Faktor (−1) durch Vertauschen der Indizes bei F μν . Für die x-Komponente der zweiten Gleichung folgt analog: ∂ E3 ∂ B1 ∂ E2 ∂ B1 = − + = ∂2 F 03 − ∂3 F 02 + ∂0 F 23 2 3 ∂t ∂x ∂x ∂x0 = −(∂ 0 F 23 + ∂ 2 F 30 + ∂ 3 F 02 ),
0 = (∇ × E)1 +
wobei ∂ 0 = −∂0 beachtet werden muss. Die Ergebnisse für die beiden anderen Komponenten folgen analog. Wegen F μν = ∂ μ Aν − ∂ ν Aμ können wir nachrechnen:
98
5 Elektrodynamik
∂
ρ
∂ μ Aν − ∂ ν A
μ
∂ ρ F μν + ∂ μ F νρ + ∂ ν F ρμ = + ∂ μ ∂ ν Aρ − ∂ ρ Aν + ∂ ν ∂ ρ Aμ − ∂ μ Aρ = 0,
(5.28)
da die partiellen Ableitung kommutieren und sich alle Terme aufheben. Die homogenen Maxwell-Gleichungen folgen also schon direkt aus der Definition des Feldstärketensors. Die Gl. (5.27) nennt man auch Jacobi-Identität. Dualer Feldstärketensor Alternativ lassen sich die homogenen Maxwell-Gleichungen etwas kompakter durch den ebenfalls antisymmetrischen dualen Feldstärketensor F˜02 mit ⎞ 0 B1 B2 B3 ⎜ −B 1 0 −E 3 E 2 ⎟ ⎟ =⎜ ⎝ −B 2 E 3 0 −E 1 ⎠ −B 3 −E 2 E 1 0 ⎛
1 F˜02 := F˜ μν := εμνρσ Fρσ 2
darstellen. Dabei ist ⎧ ⎪ falls (μνρσ ) gerade Permutation von (0, 1, 2, 3) ⎪ ⎨1, μνρσ ε = −1, falls (μνρσ ) ungerade Permutation von (0, 1, 2, 3) ⎪ ⎪ ⎩0 sonst (d. h., falls zwei oder mehrere Indizes gleich)
(5.29)
(5.30)
das sogenannte Levi-Civita-Symbol, der vollständig antisymmetrische Einheitstensor vierter Stufe. Die homogenen Maxwell-Gleichungen lauten mit dem dualen Feldstärketensor: ∂ν F˜ μν = 0
(5.31)
Aufgabe 5.9 Berechnen Sie die Komponenten des dualen Feldstärketensors in (5.29).
Lösung In den folgenden Rechnungen behandeln wir nur die Fälle, in denen das Levi-Civita-Symbol ungleich null ist. Mit 1 F˜ μν = μνρσ Fρσ 2 folgt F˜ 00 = F˜ 11 = F˜ 22 = F˜ 33 = 0, wegen ααρσ = 0. Darüber hinaus gilt 1 1 F˜ νμ = νμρσ Fρσ = − μνρσ Fρσ = − F˜ μν , 2 2
5.3
Lorentz-Invarianz der Maxwell-Gleichungen
99
d. h., F˜ μν ist auch antisymmetrisch, und wir müssen nur die folgenden Komponenten berechnen: ⎡ ⎤ 1 0132 1 ⎦ F˜ 01 = ⎣ 0123 F23 + F32 = F23 = B 2 =1 =−1 ⎡ ⎤ 1 0231 2 ⎦ F˜ 02 = ⎣ 0213 F13 + F31 = −F13 = B 2 =−1 =1 ⎡ ⎤ 1 0321 3 ⎦ F˜ 03 = ⎣ 0312 F12 + F21 = F12 = B 2 ⎡
F˜ 12
F˜ 13
=−1
=−1
=1
=1
=−1
⎤ 1 ⎣ 1203 3 ⎦ = F03 + 1230 F30 = F03 = −E 2 =1 =−1 ⎡ ⎤ 1 ⎣ 1302 2 ⎦ = F02 + 1320 F20 = −F02 = E 2 ⎡
F˜ 23
=1
⎤ 1 ⎣ 2301 1 ⎦ = F01 + 2310 F10 = F01 = −E 2
Lorentz-Skalare Wir stellen noch einige Lorentz-Skalare (Tensorinvarianten) vor, die wir später noch benötigen werden. Es gilt F μν Fμν = 2 B 2 − E 2 . (5.32) Ganz ähnlich ergibt sich
F˜ μν F˜μν = 2 E 2 − B 2 ,
also die gleiche Invariante, sowie F μν F˜μν = −4 E · B .
Aufgabe 5.9 Beweisen Sie Gl. (5.32).
100
5 Elektrodynamik
Lösung Es gilt: F μν Fμν = −F 01 F 01 − F 02 F 02 − F 03 F 03 − F 10 F 10 − F 20 F 20 − F 30 F 30 + F 12 F 12 + F 13 F 13 + F 21 F 21 + F 23 F 23 + F 31 F 31 + F 32 F 32 2 2 2 2 2 2 + 2 B1 + B2 + B3 = −2 E 1 + E 2 + E 3 = 2 B 2 − E 2
5.4
Lorentz-Kraft
Wir wollen die Lorentz-Kraft für ein Teilchen mit der Ladung q und der Geschwindigkeit u: F = q E + u × B (5.33) vierdimensional darstellen und greifen dazu auf einige Ergebnisse aus Abschn. 3.4 zurück. Dort haben wir in (3.29) die Komponenten der Minkowski-Kraft K = d P/dτ hergeleitet: K μ = K 0 , K = γ F · u, F Wir setzen die Lorentz-Kraft ein und erhalten für die Raumkomponenten γ F = q γ E + γ u × B = q U 0 E + U × B mit der Vierergeschwindigkeit U = (γ , γ u). Die rechte Seite ersetzen wir durch den Feldstärketensor F02 und erhalten für die x-Komponente K 1 = q U 0 F 01 + U 2 F 12 + U 3 F 13 = q F 10 U0 + F 12 U2 + F 13 U3 = q F 1ν Uν , da die Diagonalelemente von F μν gleich null sind. Analog berechnet man die anderen Komponenten, und insgesamt ergibt sich K i = q F iν Uν , i = 1, 2, 3. Für die Zeitkomponente folgt K 0 = γ F · u = γ q E + u × B · u = γ q E · u = q E 1 U 1 + E 2 U 2 + E 3 U 3 = q E 1 U1 + E 2 U2 + E 3 U3 = q F0 jU j .
5.5
Lorentz-invarianter Lagrange-Formalismus
101
Zusammengefasst haben wir die Lorentz-invariante Form der Lorentz-Kraft gefunden: K μ = γ F · u, F = q F μν Uν (5.34)
5.5
Lorentz-invarianter Lagrange-Formalismus
In diesem Abschnitt erweitern wir den aus der Newton’schen Mechanik bekannten LagrangeFormalismus in zweierlei Hinsicht. Zum einen ersetzen wir die dreidimensionalen Variablen durch Vierervektoren und können damit (erneut) die kovarianten Bewegungsgleichungen der relativistischen Mechanik bzw. Elektrodynamik ableiten, zum anderen verallgemeinern wir den Formalismus auf kontinuierliche Systeme, indem wir die Variablen durch Felder ersetzen. Wir wollen zunächst die grundlegenden Mechanismen der Lagrange-Formulierung im euklidischen Raum wiederholen. Hamilton’sches Prinzip im Dreidimensionalen Eine typische Aufgabe der Variationsrechnung in der Physik besteht darin, unter allen möglichen Kurven x (t) = x i (t) , i = 1, 2, 3 diejenige herauszufinden, die das Wirkungsfunktional S=
t2
dt L 0 t, x i (t) , x˙ i (t)
(5.35)
t1
extremal, d. h. minimal oder maximal, macht. Dabei ist L 0 eine vorgegebene reellwertige Funktion, die von den Variablen t, x i (t) und deren Ableitungen x˙ i (t) abhängt. Die Funktion L 0 nennt man Lagrange-Funktion nach dem italienischen Mathematiker Joseph-Louis Lagrange (1736–1813), und wir schreiben sie mit einem unteren Index 0, wenn wir uns im dreidimensionalen euklidischen Raum befinden. Nach dem Hamilton’schen Prinzip stellen diejenigen Funktionen x i (t), die an den Randpunkten vorgegebene Werte x (t1 ) = P1 sowie x (t2 ) = P2 annehmen und S extremal machen, die tatsächlichen Bahnkurven eines Teilchens zwischen P1 und P2 dar. Ist x (t) eine solche extremale Kurve, so wählt man folgenden Variationsansatz für x i (t) und betrachtet t2 dt L 0 t, x iε , x˙ iε , S (ε) = t1
wobei x iε (t) durch
x iε (t) = x i (t) + εηi (t)
definiert wird. Dabei kann man sich ε als eine „kleine“ Zahl vorstellen, und die ηi (t) sind glatte Funktionen, die an den Randpunkten verschwinden: ηi (t1 ) = ηi (t2 ) = 0,
102
5 Elektrodynamik
sodass die x iε (t) zulässige Funktionen sind. Man bildet dann die sogenannte (erste) Variation von S, d. h. " # " t2 $ %# d dS i i δS := = dt L 0 t, x ε , x˙ ε dε ε=0 dε t1 ε=0 # " t2 d $ i i % L 0 t, x ε , x˙ ε = dt dε t1 ε=0 '# " t2 & ∂ L 0 d x˙ iε ∂ L 0 d x iε + i = dt , (5.36) ∂ x iε dε ∂ x˙ ε dε t1 ε=0 wobei die Summenkonvention beachtet werden muss. Wir setzen ε = 0 ein und beachten, dass damit d x˙ iε d x iε = ηi , = η˙ i , ∂ x iε = ∂ x i , ∂ x˙ iε = ∂ x˙ i , dε dε d. h. ' t2 & ∂ L0 i ∂ L0 i δS = , dt η + η ˙ ∂xi ∂ x˙ i t1 folgt. Den zweiten Term in der letzten Gleichung kann man mit partieller Integration umformen: #
" t2 t2 ∂ L0 i ∂ L 0 i t2 d ∂ L0 ηi dt η ˙ = η − dt i i i ∂ x ˙ ∂ x ˙ dt ∂ x ˙ t1 t1 t1 Wegen ηi (t1 ) = ηi (t2 ) = 0 entfällt der Term in der eckigen Klammer, und wir erhalten insgesamt
' & t2 d ∂ L0 ∂ L0 ηi (t) . dt − δS = i i ∂ x dt ∂ x ˙ t1 Da S (ε) extremal werden soll, muss δS = 0 gelten und das für beliebige Variationen ηi (t), d. h., der Ausdruck in den geschweiften Klammern im Integrand in der letzten Gleichung verschwindet nach dem Fundamentallemma der Variationsrechnung (siehe [12]), und wir erhalten
∂ L0 d ∂ L0 = 0. (5.37) − ∂xi dt ∂ x˙ i Diese Gleichungen nennt man Euler-Lagrange-Differenzialgleichungen der Variationsrechnung. Kanonisch konjugierter Impuls Mit der Lagrange-Funktion definiert man den zu den Koordinaten x i kanonisch konjugierten Impuls pi durch ∂ L0 pi = , (5.38) ∂ x˙ i
5.5
Lorentz-invarianter Lagrange-Formalismus
103
mit dem sich die Euler-Lagrange-Gleichungen knapp als ∂ L0 = p˙ i ∂xi
(5.39)
formulieren lassen. Aus dieser Gleichung folgt sofort ein Erhaltungssatz: Ist ∂ L 0 /∂ x i = 0, so ist der kanonisch konjugierte Impuls konstant. Das ist z. B. der Fall, wenn sich die Lagrange-Funktion bei Verschiebungen der Koordinaten x i → x i + x i nicht ändert. Beispiel 5.1
In der Mechanik ist die Lagrange-Funktion oftmals die Differenz aus kinetischer und potenzieller Energie: L0 = T − V Wir betrachten als einfaches Beispiel den eindimensionalen harmonischen Oszillator mit T (x) ˙ =
1 1 1 1 m x˙ 2 ; V (x) = kx 2 ⇒ L 0 (x, x) ˙ = m x˙ 2 − kx 2 , 2 2 2 2
wobei k > 0 eine Konstante ist. Eingesetzt in die Euler-Lagrange-Bewegungsgleichungen erhalten wir (
d ∂ L0 ∂ L0 d k 2 0= − = ˙ + kx ⇒ x¨ + ω x = 0, mit ω := (m x) dt ∂ x˙ ∂x dt m mit den allgemeinen Lösungen x (t) = c1 cos (ωt) + c2 sin (ωt) . Für den kanonisch konjugierten Impuls ergibt sich p=
∂ L0 = m x, ˙ ∂ x˙
also das Resultat aus der Newton’schen Mechanik. Hamilton-Funktion Mit (5.38), (5.39) und der Kettenregel ergibt sich für die Lagrange-Funktion ∂ L0 ∂ L0 i ∂ L0 i d L0 = + x˙ + x¨ dt ∂t ∂xi ∂ x˙ i ∂ L0 + p˙ i x˙ i + pi x¨ i , = ∂t woraus wir
104
5 Elektrodynamik
d ∂ L0 (5.40) = L 0 − pi x˙ i ∂t dt ableiten können. Wir definieren (bzw. erhalten durch eine Legrende-Transformation) die Hamilton-Funktion H durch H = H t, x i , pi = pi x˙ i − L 0 (5.41) und erhalten mit (5.40) die Beziehung ∂ L0 = − H˙ . ∂t Auch diese Gleichung führt zu einem Erhaltungssatz: Hängt die Lagrange-Funktion nicht explizit von der Zeit ab, so ist die Hamilton-Funktion, die in der Regel die Energie des Teilchens darstellt, zeitlich konstant. Lorentz-invariantes Hamilton’sches Prinzip Wenn wir den Lagrange-Formalismus auf die Raumzeit erweitern wollen, so sollte das Wirkungsfunktional, aus dem die Bewegungsgleichungen folgen, nach dem Relativitätsprinzip Lorentz-invariant sein. Das bedeutet, dass wir Integrationsvariable t durch die Eigenzeit, d. h. durch den Lorentz-Skalar τ ersetzen. Ferner sollte auch die Lagrange-Funktion ein Lorentz-Skalar sein und von den Vierervektoren X = X μ und von U=
dX = U μ = X˙ μ dτ
sowie τ abhängen. Damit erhalten wir das Lorentz-invariante Wirkungsfunktional τ2 S= dτ L τ, X μ (τ ) , U μ (τ ) τ1
mit der relativistischen Lagrange-Funktion L und daraus ganz analog zu oben die EulerLagrange-Gleichungen
∂L d ∂L = 0. (5.42) − ∂ Xμ dτ ∂ X˙ μ Um die relativistische Lagrange-Funktion für eine Problemstellung zu finden, greift man häufig auf die nichtrelativistische Mechanik zurück, was wir an einem Beispiel demonstrieren wollen. Beispiel 5.2
Wir suchen die Lagrange-Funktion, aus der die Bewegungsgleichung m
dU μ =0 dτ
5.5
Lorentz-invarianter Lagrange-Formalismus
105
für ein kräftefreies Teilchen folgt. Das Teilchen habe die Masse m und bewege sich mit der Geschwindigkeit u = u i . Wir nehmen an, dass der kanonisch konjugierte Impuls gleich dem relativistischen Impuls (3.3) ist, d. h. ∂ L0 mu i = Pi = √ . i ∂u 1 − u2 Durch Integration folgt daraus L 0 = −m
) 1 − u2.
Wir berechnen die Hamilton-Funktion und erhalten mit (5.41) ) m ui ui i + m 1 − u 2 = γ m, H = Pi u − L 0 = √ 1 − u2 also nach (3.5) die relativistische Energie E. Wir substituieren im Wirkungsfunktional (5.35) die Zeit t durch die Eigenzeit τ und erhalten τ S=
2
τ1
dτ γ L 0 ,
also L = γ L 0 = −m, d. h., L ist ein Lorentz-Skalar, den wir mit Gl. (3.17), d. h., U 2 = −1, als L = −m = mU 2 = mU μ Uμ
(5.43)
schreiben können. Die Euler-Lagrange-Terme ergeben sich zu ∂ (U ν Uν ) =0 ∂ Xμ d ∂ ηνρ U ν U ρ d ∂ (U ν Uν ) =m m dτ ∂U μ dτ ∂U μ 0 2 1 2 2 2 3 2 + U + U + U ∂ − U d =m μ dτ ∂U d 2Uμ , =m dτ m
woraus
dU μ =0 dτ folgt. Der Ansatz für L (5.43) war also zielführend. m
106
5 Elektrodynamik
Lagrange-Dichte und Bewegungsgleichungen Das Hamilton’sche Prinzip lässt sich auf Systeme mit überabzählbar unendlich vielen Freiheitsgraden erweitern, die durch Felder φ (t, x) = φ (t, x, y, z) beschrieben werden. Die Lagrange-Funktion L definiert man durch L := d x d y dz L = d 3 x L, V
V
wobei V das Volumen des betrachteten Systems und L = L t, x, φ, ∂μ φ
(5.44)
die Lagrange-Dichte bezeichnet. Man beachte, dass im Vergleich zur Lagrange-Funktion L 0 t, x i (t) , x˙ i (t) in der Lagrange-Dichte das Feld φ die Rolle der Koordinaten x i übernimmt, die Ableitungen ∂μ φ übernehmen die Rolle der Geschwindigkeiten x˙ i . Die explizite Abhängigkeit von der Zeit t wird auf (t, x) erweitert. In der Lagrange-Funktion waren die x i , x˙ i unabhängige Freiheitsgrade, in der Lagrange-Dichte bilden die Felder φ, ∂μ φ die Freiheitsgrade. Das Wirkungsfunktional überträgt sich analog: t2 t2 3 dt L = dt d xL= d4x L (5.45) S= t1
t1
Ω
V
mit dem Raumzeitvolumen Ω = [t1 , t2 ]× V . Das Wirkungsfunktional ist Lorentz-invariant, wenn die Lagrange-Dichte ein Lorentz-Skalar ist. Denn das infinitesimale Viervolumenelement d 4 x ist schon Lorentz-invariant, wie man folgendermaßen einsieht. Es gilt (siehe Bemerkung 11.2): d 4 x = |det J | d 4 x, (5.46)
wobei J=
∂xμ ∂xμ
wieder die Jacobi-Matrix des Koordinatenwechsels ist. Nun ist
∂xμ = μμ ∂xμ und mit (1.35): T η = η folgt det T η = det η ⇔ det T det η det = −1 ⇔ (det )2 = 1 ⇒ det = ±1
5.5
Lorentz-invarianter Lagrange-Formalismus
und daraus
107
∂ x μ |det J | = det = det μμ = |det | = 1, μ ∂x
also
d 4 x = d 4 x.
Variationsansatz für Felder Ist φ (t, x) ein Feld, das das Wirkungsfunktional (5.45) extremal macht, so wählen wir analog zu oben folgenden Variationsansatz: S (ε) = d 4 x L t, x, φ ε , ∂μ φ ε , (5.47) Ω
wobei φ ε (t, x) durch
φ ε (t, x) = φ(t, x) + εη (t, x)
definiert wird. Die Variation auf der rechten Seite von (5.47) bezieht sich nur auf die Freiheitsgrade φ und ∂μ φ, also nicht auf die Koordinaten t, x in der Lagrange-Dichte. Das Raumzeitvolumen Ω bleibt bei der Variation konstant, und φ (t, x) soll auf dem Rand ∂Ω nicht mitvariieren, was bedeutet, dass das Feld η auf dem Rand verschwindet: η (t, x) = 0 f ur ¨ (t, x) ∈ ∂Ω Die Wirkung S (ε) ist an der Stelle φ extremal, wenn ihre Ableitung in jeder „Richtung“ η verschwindet: " # dS ! δS = =0 (5.48) dε ε=0
Aufgabe 5.11 Leiten Sie die Euler-Lagrange-Gleichungen für Felder: ∂L ∂L =0 − ∂μ ∂φ ∂ ∂μ φ
(5.49)
aus dem Extremalprinzip (5.48) ab, indem Sie eine analoge Rechnung wie in (5.36) durchführen.
108
5 Elektrodynamik
Lösung Es gilt "
dS dε
#
"
ε=0
t2
= t
=
# + d * L t, x, φ ε , ∂μ φ ε dε V ε=0 ./ ε d ∂μ φ ε ∂ L dφ L ∂ 3 + dt dx ∂φ ε dε dε ∂ ∂μ φ ε V
dx3
dt , 1 t2 t1
. ε=0
Wir setzen ε = 0 ein und beachten, dass damit d ∂μ φ ε dφ ε = η, = ∂μ η, ∂φ ε = ∂φ, ∂ ∂μ φ ε = ∂ ∂μ φ , dε dε also
"
dS dε
# ε=0
=
-
t2
dt t1
dx V
3
∂L ∂L ∂μ η η+ ∂φ ∂ ∂μ φ
. (5.50)
folgt. Den zweiten Term können wir mithilfe der Produktregel als ∂L ∂L ∂L ∂μ η = ∂μ η − ∂μ η ∂ ∂μ φ ∂ ∂μ φ ∂ ∂μ φ schreiben und wenden auf die Viererdivergenz ∂L η , ∂μ ∂ ∂μ φ siehe (4.34), den vierdimensionalen Gauß’schen Satz (siehe Abschn. 10.6) mit dem infinitesimalen äußeren Normaleneinheitsfeld dσμ an: ∂L ∂L 4 η = η = 0, d x ∂μ dσμ (5.51) ∂ ∂μ φ ∂ ∂μ φ Ω ∂Ω da η auf dem Rand ∂Ω verschwindet. Wir erhalten damit aus (5.50): . " # t2 dS ∂L ! 3 ∂L − ∂μ = dt dx η=0 dε ε=0 ∂φ ∂ ∂μ φ t1 V und daraus wieder mit dem Fundamentallemma die Euler-Lagrange-Gleichungen für Felder: ∂L ∂L = 0. − ∂μ ∂φ ∂ ∂μ φ
5.5
Lorentz-invarianter Lagrange-Formalismus
109
Beispiel 5.3
Wir betrachten für ein skalares Feld φ ( x ) die Lagrange-Dichte 1 μν 1 η L φ, ∂μ φ = ∂μ φ (∂ν φ) − m 2 φ 2 2 2 und berechnen ∂L = −m 2 φ ∂φ 1 ∂ ∂L = ηρσ ∂ρ φ ∂σ φ 2 ∂ ∂μ φ ∂ ∂μ φ 1 = ηρσ δρμ ∂σ φ + δσμ ∂ρ φ 2 1 μσ = η ∂σ φ + ηρμ ∂ρ φ 2 = ημν ∂ν φ = ∂ μ φ.
(5.52)
Die Bewegungsgleichungen folgen aus den Euler-Lagrange-Gleichungen: ημν ∂μ ∂ν φ − m 2 φ = 0 ⇔ φ − m 2 φ = 0 mit dem D’Alembert-Operator (5.11), sie werden Klein-Gordon-Gleichungen genannt. Impulsfeld Mit der Lagrange-Dichte kann man auch das kanonisch konjugierte Impulsfeld π (t, x) =
∂L ∂ (∂0 φ)
definieren. Die Hamilton-Funktion ist dann H = d 3 x H (t, x, φ, π ) mit der Hamilton-Dichte
H = π ∂0 φ − L. Kanonischer Energie-Impuls-Tensor Wir nehmen nun an, dass die Lagrange-Dichte nur von φ und ∂μ φ und nicht explizit von den Raumzeitpunkten (t, x) abhängt, dann ergibt sich mit der Kettenregel und den EulerLagrange-Gleichungen (5.49):
110
5 Elektrodynamik
∂L ν ∂L ∂ ν ∂μ φ ∂ φ+ ∂ ν L φ, ∂μ φ = ∂φ ∂ ∂μ φ ∂L ∂L + ∂μ ∂ ν φ = ∂μ ∂ ∂μ φ ∂ ∂μ φ ∂L ν ∂ φ = ∂μ ∂ ∂μ φ Wir definieren den kanonischen Energie-Impuls-Tensor T02 = T μν durch T μν :=
∂L ∂ ν φ − ημν L ∂ ∂μ φ
(5.53)
und erhalten aus der eben durchgeführten Rechnung, dass für alle Lösungen der EulerLagrange-Gleichungen die Kontinuitätsgleichung ∂μ T μν = 0
(5.54)
gilt. Beispiel 5.4
Wir berechnen den kanonischen Energie-Impuls-Tensor für das Skalarfeld aus Beispiel 5.3 mit 1 μν 1 η ∂ μ φ ∂ν φ − m 2 φ 2 . L φ, ∂μ φ = 2 2 Dann folgt mit (5.52) T μν =
∂L 1 μ ν ∂ ν φ − ημν L = 2 ∂ φ ∂ φ − ημν ∂ ρ φ ∂ρ φ + ημν m 2 φ 2 . 2 ∂ ∂μ φ (5.55)
Bemerkung 5.1 Addiert man zu T μν in (5.53) einen Term ∂ρ B μρν , wobei B μρν antisymmetrisch in μ und ρ ist, d. h. B ρμν = −B μρν , so folgt mit (5.54) ∂μ T μν + ∂ρ B μρν = ∂μ T μν + ∂μ ∂ρ B μρν = 0, da der zweite Term, der eine Kontraktion eines symmetrischen und eines antisymmetrischen Tensors ist, wegen (9.20) ebenfalls gleich null ist. Der kanonische Energie-Impuls-Tensor ist durch (5.53) also nicht eindeutig bestimmt. Das „Eichfeld“ ∂ρ B μρν kann z. B. dazu
5.5
Lorentz-invarianter Lagrange-Formalismus
111
benutzt werden, die Symmetrie des kanonischen Energie-Impuls-Tensors, d. h. T μν = T νμ , sicherzustellen. Wir werden uns in Kap. 6 intensiv mit einigen Energie-Impuls-Tensoren in der Speziellen Relativitätstheorie beschäftigen. Lagrange-Dichte der Elektrodynamik Wir wollen die (inhomogenen) Maxwell-Gleichungen aus den Euler-Lagrange-Gleichungen ableiten und machen uns auf die Suche nach einer geeigneten Lagrange-Dichte L E D der Elektrodynamik. Diese muss eine Funktion des Viererpotenzials Aμ , seiner Ableitungen ∂ ν Aμ sowie der Viererstromdichte J μ sein. Da die Viererstromdichte eine Raumzeitfunktion ist J μ = J μ (t, x), hat die Lagrange-Dichte folgende Gestalt: L E D t, x, Aμ , ∂ ν Aμ Die Lagrange-Dichte L E D muss ein Lorentz-Skalar sein, d. h., alle darin vorkommenden Vierervektoren bzw. Tensoren müssen mit anderen Vierervektoren bzw. Tensoren zu LorentzSkalaren kontrahiert werden. Kandidaten dafür sind die in Abschn. (5.1) berechneten Skalare Fμν F μν = 2 B 2 − E 2 , F˜μν F μν = −4 E · B , siehe (5.32), sowie für den Quellterm der Skalar Jμ Aμ . Man kann zeigen, dass der Ausdruck F˜μν F μν nicht invariant unter Raumspiegelungen ist (siehe [13]) und somit in der LagrangeDichte nicht vorkommt. Wir werden zeigen, dass der Ansatz 1 L E D = − Fμν F μν + Jμ Aμ 4
(5.56)
uns zu den inhomogenen Maxwell-Gleichungen führen wird. Die Euler-LagrangeGleichungen lauten: ∂ LE D ∂ LE D = (5.57) ∂μ ∂ Aν ∂ ∂μ A ν Der erste Term in der Lagrange-Dichte hängt nur von den Ableitungen ∂ Aν ab. Wir berechnen zunächst ∂ LE D ∂ 1 =− Fαβ F αβ 4 ∂ ∂μ A ν ∂ ∂μ A ν ∂ 1 Fαβ Fρσ ηρα ησβ =− 4 ∂ ∂μ A ν ∂ Fαβ ∂ Fρσ 1 Fρσ + Fαβ ηρα ησβ . =− 4 ∂ ∂μ A ν ∂ ∂μ A ν
112
5 Elektrodynamik
Mit der Definition des Feldstärketensors (5.20) Fαβ = ∂α Aβ − ∂β Aα folgt
∂ Fαβ ∂ = ∂α Aβ − ∂β Aα = δ μα δ νβ − δ μβ δ να . ∂ ∂μ A ν ∂ ∂μ A ν
Wir erhalten also ∂ LE D 1 μ ν μ =− δ α δ β − δ β δ να Fρσ + Fαβ δ μρ δ νσ − δ μσ δ νρ ηρα ησβ 4 ∂ ∂μ A ν 1 ρμ σ ν η η − ησ μ ηρν Fρσ + Fαβ ημα ηνβ − ημβ ηνα =− 4 1 = − F μν − F νμ + F μν − F νμ 4 1 = − F μν + F μν + F μν + F μν = −F μν = F νμ , (5.58) 4 in der letzten Zeile haben wir zweimal die Antisymmetrie des Feldstärketensors genutzt. Für den zweiten Term in (5.56), der nur von den Feldern Aν abhängt, ergibt sich ∂ ∂ ∂ LE D = Jα Aα = Jα ηαβ Aβ = Jα ηαβ δβν = Jα ηαν = J ν . ∂ Aν ∂ Aν ∂ Aν Zusammengefasst erhalten wir also aus den Euler-Lagrange-Gleichungen ∂μ F νμ = J ν , also die inhomogenen Maxwell-Gleichungen (5.26). Die homogenen Maxwell-Gleichungen folgen ja schon direkt aus der Definition des Feldstärketensors, siehe (5.27).
6
Energie-Impuls-Tensoren in der Speziellen Relativitätstheorie
6.1
Energie-Impuls-Tensor des elektromagnetischen Feldes
Wir betrachten die Lagrange-Dichte (5.56) ohne die Kopplung an äußere Quellen, d. h. 1 L M = − Fμν F μν , 4 setzen diese in Gl. (5.53): T μν = ein und erhalten T μν =
(6.1)
∂L ∂ ν φ − ημν L ∂ ∂μ φ
∂ 1 1 − Fαβ F αβ ∂ ν Aσ + ημν Fαβ F αβ . 4 4 ∂ ∂μ A σ
Den ersten Term auf der rechten Seite haben wir schon in (5.58) ausgerechnet. Es ist ∂ 1 − Fαβ F αβ = −F μσ . 4 ∂ ∂μ A σ Im zweiten Term ergänzen wir Aν um eine Eichtransformation (5.22) mit χ = Aν und erhalten ∂ ν Aσ → ∂ ν Aσ − ∂σ Aν = F νσ . Der Vorteil dieses Ansatzes liegt darin, dass die Variation von Aσ bei weiteren Eichtransformationen Aσ → Aσ = Aσ − ∂σ ψ (t, x) unverändert bleibt (siehe [13]). Beachtet man noch, dass F νσ = ητ σ F ντ = −ησ τ F τ ν = −Fσ ν © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_6
(6.2) 113
114
6 Energie-Impuls-Tensoren in der Speziellen Relativitätstheorie
gilt, so erhalten wir insgesamt den Energie-Impuls-Tensor (auch Maxwell-Tensor genannt) für das elektromagnetische Feld μν
TM = TM = F μσ Fσ ν +
1 μν η Fαβ F αβ . 4
(6.3)
Bemerkung 6.1 Den allgemeinen Energie-Impuls-Tensor (5.53) kann man auch durch T μν = ημν L −
∂L ∂νφ ∂ ∂μ φ
definieren. Setzt man dann die Lagrange-Dichte (6.1) ein, so erhält man unter Beachtung von (6.2) 1 μν TM = F μσ F νσ − ημν Fαβ F αβ , (6.4) 4 was man häufig in der Literatur findet (siehe z. B. [17]). Der Energie-Impuls-Tensor erfüllt nach (5.54) die Erhaltungssätze μν
∂μ TM (t, x) = 0, wenn keine äußeren Quellen vorhanden sind (J μ = 0).
Aufgabe 6.1. Zeigen Sie, dass der Maxwell-Tensor (6.3) symmetrisch ist.
Lösung Wir zeigen die Symmetrie nur für den ersten Summanden in (6.3), da die inverse MinkowskiMetrik ημν symmetrisch ist. Es gilt F νσ Fσ μ = ησρ F νρ ητ σ Fτ μ = F νσ F σ μ = F μσ Fσ ν , wobei wir in der letzten Gleichung die Antisymmetrie von F μν sowie (6.2) genutzt haben. TM ist symmetrisch und hat damit zehn unabhängige Komponenten. Wir wollen den EnergieImpuls-Tensor physikalisch deuten und schauen uns dazu dessen Komponenten an. Mit μ ημρ ηρν = δ ν ergibt sich aus (6.3): (TM )μν = F μσ Fσ ν +
1 μ δ Fαβ F αβ 4 ν
Durch das Herunterziehen eines oberen Index mit der Metrik ist die Symmetrie natürlich zerstört. Zur Berechnung des ersten Terms multiplizieren wir die beiden Matrizen
6.1
Energie-Impuls-Tensor des elektromagnetischen Feldes
115
⎞ ⎞ ⎛ 0 E1 E2 E3 0 −E 1 −E 2 −E 3 ⎜ −E 1 0 ⎜ 1 0 B 3 −B 2 ⎟ B 3 −B 2 ⎟ ⎟ und Fσ ν = ⎜ E ⎟. =⎜ 1 2 3 ⎠ ⎝ −E 2 −B 3 0 ⎝ B E −B 0 B1 ⎠ −E 3 B 2 −B 1 0 E 3 B 2 −B 1 0 ⎛
F μσ
Der zweite Summand ist die Einheitsmatrix multipliziert mit
1 2 1 Fαβ F αβ = B − E 2 4 2 nach (5.32). Nach einigen Detailrechnungen erhalten wir 1 2 2 E + B =: u (t, x) 2
i = − E × B =: pi (t, x)
(TM )0 0 = (TM )0 i (TM )i
0
i = E × B =: s i (t, x)
1 i j 2 2 δ E +B , j 2 dabei ist u (t, x) die Energiedichte. Der Vektor p = p 1 , p 2 , p 3 wird als Impulsdichte 1 2 3 bezeichnet. Der Vektor s = s , s , s stellt die Energieflussdichte dar und wird auch Poynting-Vektor genannt. Schließlich bilden die Raumkomponenten (TM )i j des EnergieImpuls-Tensors den sogenannten (Maxwell’schen) Spannungstensor. (TM )i
= E i E j + Bi B j −
Divergenz des Energie-Impuls-Tensors bei Vorliegen äußerer Quellen Wir wollen jetzt zulassen, dass die in F μν enthaltenen Felder mit äußeren Quellen J μ wechselwirken, und erhalten den sogenannten Energie-Impuls-Satz: μν
∂μ TM = Jσ F σ ν = −F νσ Jσ =: − f ν ,
(6.5)
wodurch die elektromagnetische Minkowski-Kraftdichte f ν , die das Feld auf die Stromverteilung ausübt, definiert wird.
Aufgabe 6.2 Zeigen Sie die Gültigkeit von (6.5).
Lösung Wir berechnen mithilfe der inhomogenen Maxwell-Gleichungen (5.26) die Viererdivergenz μν ∂μ T M :
116
6 Energie-Impuls-Tensoren in der Speziellen Relativitätstheorie
1 μν ∂μ TM = ∂μ F μσ Fσ ν + F μσ ∂μ Fσ ν + ∂ ν F ρτ ηαρ ηβτ F αβ 4 1 = J σ Fσ ν + F μσ ∂μ Fσ ν + ηαρ ηβτ F ρτ ∂ ν F αβ + F αβ ∂ ν F ρτ 4 Die letzten beiden Summanden sind nach Umbenennen der Indizes αβ ↔ ρτ identisch, d. h., wir erhalten mit Indexumstellung des ersten Terms μν
∂μ TM = Jσ F σ ν + F μσ ∂μ Fσ ν +
1 Fαβ ∂ ν F αβ . 2
Nun benutzen wir die Jacobi-Identität (5.28) für den letzten Term, und es ergibt sich μν
∂μ TM = Jσ F σ ν + F μσ ∂μ Fσ ν −
1 Fαβ ∂ α F βν + ∂ β F να . 2
Wir rechnen den letzten Term etwas um: −
1 Fαβ ∂ β F να + ∂ α F βν 2
= =
α↔β
1 Fαβ ∂ α F βν − Fβα ∂ β F να 2 1 − Fαβ ∂ α F βν − ∂ α F νβ 2 −
=
−Fαβ ∂ α F βν
=
−F μσ ∂μ Fσ ν
α→μ,β→σ
und erhalten zusammenfassend die Behauptung.
6.2
Energie-Impuls-Tensor für Staub
Das Maxwell’sche Tensorfeld ist für die Beschreibung von Energie und Materie im Universum wichtig, wenn hohe Dichten von Maxwell-Feldern auftreten. Um die Wirkung von Materie auf die Geometrie der Raumzeit zu beschreiben, brauchen wir vereinfachende Modelle für den Energie-Impuls-Tensor. Teilchendichte In diesem Abschnitt orientieren wir uns an [6] bzw. [14] und untersuchen den EnergieImpuls-Tensor der inkohärenten Materie (auch schlicht Staub genannt). Hierfür wählen wir einen anderen, anschaulicheren Ansatz als bei der Herleitung des Maxwell’schen Tensors. Staub wollen wir als eine Ansammlung von nichtwechselwirkenden Teilchen definieren, die sich in einem Inertialsystem S mit einer gemeinsamen Geschwindigkeit u bewegen, d. h., die Teilchen bewegen sich relativ zueinander nicht. Wenn wir die Frage beantworten wollen, wie viele Teilchen sich in einem (kleinen) Volumen in dem momentanen Ruhesys-
6.2
Energie-Impuls-Tensor für Staub
117
tem S der Teilchen befinden, so zählen wir einfach die Teilchen. Befinden sich in einem rechteckigen Volumen V = x y z N Teilchen, so definieren wir die Teilchendichte n 0 in dem Volumen durch N N n0 = = . V x y z Die Teilchendichte kann von Raumzeitpunkt zu Raumzeitpunkt variieren, wenn wir das Volumen entsprechend klein wählen. Wie sieht die Teilchendichte im Inertialsystem S aus, wenn sich die Teilchen mit Geschwindigkeit u = (u, 0, 0) entlang der x-Achse bewegen? Wenn man von S aus die Teilchen zählt, so erhält man die gleiche Anzahl wie im Ruhesystem, allerdings verändert sich aus Sicht von S durch die Lorentz-Kontraktion das Volumen, in dem sich die Teilchen befinden. In Abb. 6.1 ist der Einfachheit halber die z-Koordinate weggelassen. Damit wird die Seitenlänge x in S durch die Lorentz-Kontraktion zu x = x 1 − u 2 , während die senkrecht zur Geschwindigkeit u stehenden Seiten in beiden Systemen die gleichen sind, d. h. y = y z = z .
Abb. 6.1 Teilchendichte
118
6 Energie-Impuls-Tensoren in der Speziellen Relativitätstheorie
Damit folgt, dass die Teilchendichte n im System S, in dem die Teilchen die Geschwindigkeit u haben, größer ist als im Ruhesystem S : n=
N N N = = = γ n0 √ V xyz x 1 − u 2 y z
Teilchenfluss Als Nächstes wollen wir den Fluss der Teilchen durch eine Oberfläche betrachten. Dieser wird definiert durch die Anzahl der Teilchen, die eine Einheitsfläche auf dieser Oberfläche in einer Zeiteinheit durchqueren. Der Fluss ist vom Inertialsystem abhängig, da Fläche und Zeit vom Inertialsystem abhängige Größen sind. Eine weitere Abhängigkeit besteht in der Orientierung der Fläche. Ist die Fläche parallel zur Bewegungsrichtung der Teilchen, so durchquert kein einziges Teilchen die Fläche, steht die Fläche senkrecht zur Bewegungsrichtung der Teilchen, ist der Fluss der Teilchen durch die Fläche maximal. Im Ruhesystem der Teilchen ist der Fluss gleich null, die Teilchen bewegen sich dort nicht. Wir betrachten wieder ein Inertialsystem S, in dem sich alle Teilchen mit Geschwindigkeit u in x-Richtung bewegen mögen. Die Oberfläche A sei zunächst so ausgerichtet, dass sie senkrecht zur x-Achse steht. In Abb. 6.2 sind drei Teilchen (dicke Punkte) eingezeichnet, die sich in x-Richtung bewegen. Das rechteckige Volumen V , das durch die gestrichelte Linie begrenzt ist, enthält genau die Teilchen, die in der Zeit t die Teilfläche A = yz durchqueren. Dieses Volumen berechnet sich also zu V = utA = utyz und enthält
1 N =n·V = √ n 0 · utA 1 − u2
Teilchen. Den Teilchenfluss f 1 in x-Richtung erhält man daraus mit Division durch t und A: Abb. 6.2 Teilchenfluss senkrecht zur Oberfläche
6.2
Energie-Impuls-Tensor für Staub
119
n0 · u f1 = √ = γ n0 · u 1 − u2 Wir verallgemeinern jetzt die Situation und nehmen an, dass sich die Teilchen mit einer Geschwindigkeit u bewegen, die auch eine Komponente in y-Richtung hat: u = (u 1 , u 2 , 0) Wieder befinden sich im gestrichelt umrandeten Volumen der Abb. 6.3 alle Teilchen, die in der Zeit t die Fläche A durchqueren. Das Volumen errechnet sich aus Grundfläche mal Höhe H , also A · H . Die Höhe ist aber gleich H = u 1 t, also V = u 1 tA = u 1 tyz, und für den Fluss durch A in x-Richtung gilt n0 · u1 f1 = √ = γ n0 · u1 1 − u 2 und analog für die Flüsse in die anderen Richtungen. Allgemein definieren wir den Teilchenfluss-Vierervektor N durch N = n0 U , wobei U die Vierergeschwindigkeit der Teilchen ist. Haben die Teilchen im Inertialsystem S die Geschwindigkeit u = (u 1 , u 2 , u 3 ), so gilt mit Gl. (3.16) U = (γ , γ u 1 , γ u 2 , γ u 3 ) und somit Abb. 6.3 Teilchenfluss schräg zur Oberfläche
120
6 Energie-Impuls-Tensoren in der Speziellen Relativitätstheorie
N = (γ n 0 , γ n 0 u 1 , γ n 0 u 2 , γ n 0 u 3 ).
(6.6)
In jedem Inertialsystem ist die Zeitkomponente von N die Teilchendichte, und die Raumkomponenten sind die Teilchenflüsse durch die Flächenanteile senkrecht zu den Raumkoordinatenachsen. In der klassischen Physik, in der es keine Lorentz-Kontraktion gibt, ist die Teilchendichte eine vom Inertialsystem unabhängige Größe, wohingegen der Teilchenfluss wegen der darin vorkommenden Geschwindigkeitskomponenten vom Inertialsystem abhängig ist. Die Vereinigung dieser beiden physikalischen Größen zu einem vom Inertialsystem invarianten Teilchenfluss-Vierervektor ist also ganz ähnlich wie die Vereinigung von Energie und Impuls zum Viererimpuls. Aus Gl. (6.6) folgt ähnlich wie bei der Ruhemasse mit U 2 = −1: N 2 = n 20 U 2 = −n 20 und daraus n0 =
−N 2 ,
d. h., die „Ruheteilchendichte“ n 0 ist ein Lorentz-Skalar, genauso wie auch die Ruhemasse m eines Teilchens ein Lorentz-Skalar ist. Energie-Impuls-Tensor für Staub Im momentanen Ruhesystem ist die Energie eines Teilchens gleich der Ruhemasse m, und die Anzahl der Teilchen pro Einheitsvolumen ist gleich n 0 , d. h., die Energie pro Einheitsvolumen, die sogenannte Energiedichte ρ0 , ist für Staub im Ruhesystem gleich ρ0 = n 0 m. Die Größe ρ0 ist wie n 0 und m ein Skalar. In einem Inertialsystem S, in dem sich die Teilchen mit Geschwindigkeit u bewegen, ist die Teilchendichte gleich γ n 0 und die Energie eines Teilchens nach Gl. (3.5) gleich γ m, woraus sich für die Energiedichte ρ = γ n · γ m = γ 2 ρ0 ergibt. Man beachte, dass zur Transformation von ρ0 auf ρ zweimal der Faktor γ erforderlich ist, von daher können ρ0 bzw. ρ nicht die Komponenten eines Vektors sein. Wir definieren den Energie-Impuls-Tensor für Staub TS durch das Tensorprodukt (siehe (9.13)) TS = P ⊗ N . Da N = nU und P = mU , folgt TS = P ⊗ N = n 0 mU ⊗ U = ρ0 U ⊗ U , d. h. in Koordinaten
μν
TS
= ρ0 U μ U ν .
6.2
Energie-Impuls-Tensor für Staub
121
Aufgabe 6.3 μν Schreiben Sie die Komponenten TS als Matrix und leiten Sie daraus die Symmetrie von TS ab.
Lösung Für die Komponenten von TS in Matrixschreibweise ergibt sich ⎛
μν
TS
⎞ ρ0 γ 2 ρ0 γ 2 u 1 ρ0 γ 2 u 2 ρ0 γ 2 u 3 ⎜ ρ γ 2u1 ρ γ 2 u1 2 ρ γ 2u1u2 ρ γ 2u1u3 ⎟ 0 0 0 ⎜ 0 ⎟ 2 =⎜ ⎟ ⎝ ρ0 γ 2 u 2 ρ0 γ 2 u 2 u 1 ρ0 γ 2 u 2 ρ0 γ 2 u 2 u 3 ⎠ 2 ρ0 γ 2 u 3 ρ0 γ 2 u 3 u 1 ρ0 γ 2 u 3 u 2 ρ0 γ 2 u 3 ⎛ ⎞ 1 u1 u2 u3 ⎜ u1 u1 2 u1u2 u1u3 ⎟ ⎜ ⎟ = ρ ⎜ 2 2 1 2 2 2 3 ⎟ . ⎝u u u u u u ⎠ 2 u3 u3u1 u3u2 u3
Man beachte, dass
μν
TS
νμ
= TS
gilt, d. h., TS ist ein symmetrischer Tensor. μν
Wir können die Komponenten TS als Flüsse verschiedener Dichten interpretieren: • TS00 = ρ ist die Energiedichte, die man als Energiefluss durch eine Fläche mit t = const. ansehen kann. • TS0i = ρu i ist der Energiefluss durch eine Fläche mit i = const. • TSi0 = ρu i ist die i-te Impulsdichte, d. h. der i-te Impulsfluss durch eine Fläche mit t = const. ij • TS = ρu i u j ist der i-te Impulsfluss durch eine Fläche mit j = const. Im momentanen Ruhesystem S der Teilchen gilt U = (1, 0, 0, 0), u = 0, γ = 1 S
und damit in S
⎛
μν
TS
ρ0 ⎜0 =⎜ ⎝0 0
0 0 0 0
0 0 0 0
⎞ 0 0⎟ ⎟. 0⎠ 0
122
6 Energie-Impuls-Tensoren in der Speziellen Relativitätstheorie
Im momentanen Ruhesystem S sind die Teilchendichte n 0 und die Energie m, also die Energiedichte ρ0 , zeitlich konstant, also
∂ TS0 0 ∂ρ0 = = 0. ∂t ∂t Da im Ruhesystem alle anderen Komponenten von TS gleich null sind, folgt dort für alle μ μ ν
∂μ TS
= 0.
Die Komponenten ∂μ T μν der Viererdivergenz transformieren sich vom Ruhesystem S’ in ein beliebiges Inertialsystem S durch μν
∂μ TS
μ ν ν ρν μ ν = μμ −1 ρ −1 ν ∂μ TS = −1 ν ∂μ TS = 0, =δ
μ ρ
d. h., der Energie-Impuls-Tensor ist in jedem Inertialsystem divergenzfrei. Wir wollen dieses Ergebnis etwas ausführlicher physikalisch interpretieren. Schreibt man die Gleichung für ν = 0 aus, so erhält man mit ρ = ρ0 γ 2 ∂(ρu 1 ) ∂(ρu 2 ) ∂(ρu 3 ) ∂ρ μ0 0μ + + + = 0. (6.7) ∂μ TS = ∂μ TS = ∂t ∂x ∂y ∂z Diese Gleichung besagt, dass die Zuwachsrate der Energie im Volumen (∂ρ/∂t) gleich dem Nettozufluss der Energie in das Volumen ist. Der Klammerausdruck ist die dreidimensionale Divergenz, d. h., man kann die Gl. (6.7) auch als ∂ρ + ∇ · (ρ u) = 0 ∂t
(6.8)
schreiben. Sie wird in der klassischen Hydrodynamik auch Kontinuitätsgleichung genannt. Aus der Kontinuitätsgleichung folgt also die Energieerhaltung für Staub. Wir wollen noch die anderen Komponenten der Viererdivergenz von TS untersuchen. Die drei Gleichungen ∂(ρu i ) ∂(ρ u i u 1 ) ∂(ρu i u 2 ) ∂(ρu i u 3 ) iμ + + + =0 (6.9) ∂μ TS = ∂t ∂x ∂y ∂z mit i = 1, 2, 3 können wir zu einer dreidimensionalen Vektorgleichung zusammenfassen: ∂ u + ∇ u · u = 0 (6.10) ρ ∂t mit der Jacobi-Matrix ∇ u. Wir erhalten die Euler-Gleichung der Hydrodynamik für den Fall, dass keine äußeren Kräfte und kein Druck vorhanden sind. Die Euler-Gleichung liefert
6.2
Energie-Impuls-Tensor für Staub
123
analog zur Energieerhaltung die Impulserhaltung bei der Durchquerung des Einheitsvolumens. Insgesamt ist also die Divergenzfreiheit des Energie-Impuls-Tensors für Staub gleichbedeutend mit der Erhaltung von Energie und Impuls.
Aufgabe 6.4 Zeigen Sie die Äquivalenz der Gleichungen (6.9) und (6.10).
Lösung Für ν = 1 erhält man aus der Divergenzfreiheit von TS 1μ
∂μ TS
=
2 ∂(ρu 1 ) ∂(ρ u 1 ) ∂(ρu 1 u 2 ) ∂(ρu 1 u 3 ) + + + = 0. ∂t ∂x ∂y ∂z
Mit der Produktregel erhalten wir 1μ
∂μ T S
u 1 ∂ρ ρ∂u 1 u 1 ∂(ρu 1 ) ρu 1 ∂u 1 u 1 ∂(ρu 2 ) ρu 2 ∂u 1 u 1 ∂(ρu 3 ) ρu 3 ∂u 1 + + + + + + + ∂t ∂t ∂x ∂x ∂y ∂y ∂z ∂z 1) 2) 3) 1 1 ∂u 1 2 ∂u 1 3 ∂u 1 ∂ρ ∂(ρu ∂(ρu ∂(ρu ∂u u u u = u1 + + + +ρ + + + . ∂t ∂x ∂y ∂z ∂t ∂x ∂y ∂z
=
Die erste Klammer in der letzten Gleichung ist aber wegen der Kontinuitätsgleichung (6.7) null, und es ergibt sich 1 1 1 ∂u ∂u 1 ∂u 1 ∂u ∂u 1μ ∂μ TS = ρ + , , · u = ρ + ∇ u 1 · u = 0. ∂t ∂ x ∂ y ∂z ∂t Genauso folgt für ν = 2, 3
2μ ∂μ TS 3μ
∂μ TS
2 ∂u 2 + ∇ u · u = 0 =ρ ∂t 3 ∂u + ∇ u 3 · u = 0. =ρ ∂t
Divergenz des Teilchenflussvektors Wir unterstellen in unserem Modell der inkohärenten Materie auch, dass keine Teilchen vernichtet oder erzeugt werden, dass also die Anzahl der Teilchen konstant bleibt. Dieses Erhaltungsgesetz kann man genauso ableiten wie die obigen, indem man die Änderungsrate der Anzahl der Teilchen in einem Fluidelement dem Zu- und Abfluss der Teilchen
124
6 Energie-Impuls-Tensoren in der Speziellen Relativitätstheorie
durch die Begrenzungsflächen gegenüberstellt, woraus wir für den Teilchenflussvektor N das Erhaltungsgesetz für die Anzahl der Teilchen ∂N1 ∂N2 ∂N3 ∂N0 =− − − ∂t ∂x ∂y ∂z bzw.
∂μ N μ = ∂μ (n 0 U μ ) = 0,
(6.11)
d. h. die Divergenzfreiheit des Teilchenflussvektors, erhalten.
6.3
Ideale Fluide
Unter Fluid wollen wir eine kontinuierliche Ansammlung von Teilchen verstehen, die ein bestimmtes Volumen, aber keine bestimmte Form einnehmen. Fluide umfassen also Flüssigkeiten und Gase. Das Kontinuum soll so groß sein, dass die Dynamik einzelner Teilchen keine Rolle spielt, sondern nur „Durchschnittswerte“, wie Anzahl der Teilchen in einem Einheitsvolumen, Energie- und Impulsdichte, Druck, Temperatur usw., zur Beschreibung herangezogen werden. Diese Eigenschaften einer bestimmten Ansammlung von Teilchen, die wir Element nennen wollen, sollen in einem beliebig kleinen Volumen beobachtbar sein, sodass wir vereinfacht annehmen, dass sie von Raumzeitpunkt zu Raumzeitpunkt variieren können. Wir wollen nun das Staubmodell um zwei Aspekte erweitern und kommen damit zu den allgemeinen Fluiden. Zum einen können sich die Teilchen relativ zueinander zufällig bewegen, und zum anderen kann es verschiedene Kräfte zwischen den Teilchen geben, die zur Gesamtenergie der Teilchenmenge beitragen. Für jedes einzelne Element gibt es weiterhin ein momentanes Inertialsystem (Inertialsystem, das von Raum und Zeit abhängt), in dem die Geschwindigkeit u der Teilchen momentan gleich null ist, allerdings haben im Gegensatz zum Staub jeweils zwei Elemente in der Regel kein gemeinsames momentanes Inertialsystem mehr, da sie sich ja relativ zueinander bewegen können. Alle den Fluidelementen zugeordneten physikalischen Größen, wie Vierergeschwindigkeit, Teilchen- und Energiedichte, Flussvektor, Temperatur sowie Druck, Spannung und Dehnung, werden als Werte in den momentanen Inertialsystemen definiert. Bei allgemeinen Fluiden können zwischen den Elementen Oberflächenspannungen, Reibungen, Wärmeaustausch usw. auftreten. Die idealen Fluide hingegen sind dadurch definiert, dass kein Wärmeaustausch stattfindet und keine Kräfte parallel zur Oberfläche der Elemente auftauchen. Mit anderen Worten, sie haben konstante Temperatur, die Teilchen sind kräftefrei verschiebbar, und die Gesamtkraft wirkt senkrecht auf die Oberfläche. Der Druck p in einem Fluidelement ist definiert als Quotient aus Kraft F durch Fläche A des Elements: p=
F A
6.3
Ideale Fluide
125
Wir betrachten im momentanen Inertialsystem S ein beliebiges quaderförmiges Volumenelement V = x y z . In Abb. 6.4 ist wieder die z -Achse unterdrückt. Auf das linke Flächenelement y z möge der Druck p(x ) wirken. Ändert sich der Druck in x -Richtung, so wirkt auf die Gegenseite der Druck p(x + x ). Die Druckdifferenz in x-Richtung beträgt also p(x ) − p(x + x ) ≈ −
∂p x . ∂x
Die resultierende Kraft in x -Richtung ist dann
F1 ≈ −
∂p ∂p x y z = − V . ∂x ∂x
Analog erhält man für die anderen Kraftkomponenten
∂p V ∂ y ∂p ≈ − V . ∂z
F2 ≈ −
F3
Mit dem Grenzübergang V → d V ergibt sich daraus die Vektorgleichung F = −∇ p d V . Wegen der freien Beweglichkeit der Fluidmoleküle muss die Gesamtkraft auf ein ruhendes Element null sein. Kann das Eigengewicht des Fluidelements vernachlässigt werden, so bedeutet das, dass ∇p = 0 ist, d. h., der Druck im gesamten Flüssigkeitsvolumen ist konstant, siehe [61]. Auf jedes Flächenelement d A der umgebenden Wände wirkt daher in einem ruhenden Element der gleiche Druck. Energie-Impuls-Tensor für ideale Fluide Damit sind wir in der Lage, den Energie-Impuls-Tensor TF für ideale Fluide im momentanen Ruhesystem aufzustellen. Zunächst gilt wie bei Staub, dass
Abb. 6.4 Druckdifferenz
126
6 Energie-Impuls-Tensoren in der Speziellen Relativitätstheorie
TF00 = ρ0 die Energiedichte ist. Da im momentanen Ruhesystem die Geschwindigkeit u gleich null ist und auch sonst keine (Wärme-)Energie fließen kann, gilt TF0i = TFi0 = 0, i = 1, 2, 3. Da keine Kräfte parallel zu den Elementflächen wirken und der Impulsfluss wegen u = 0 ebenfalls null ist, gilt ij TF = 0, f ur ¨ i = j. Die einzigen Kräfte pro Einheitsfläche, die auf das Fluidelement wirken, stehen senkrecht auf den Oberflächen und sind nach obiger Überlegung in jeder Richtung gleich dem Druck p. Das heißt TF11 = TF22 = TF33 = p. Zusammengefasst gilt also für die Komponenten des Energie-Impuls-Tensors TF eines idealen Fluids im Ruhesystem S ⎛
μ ν
TF = TF S
ρ0 ⎜0 =⎜ ⎝0 0
0 p 0 0
0 0 p 0
⎞ 0 0⎟ ⎟, 0⎠ p
(6.12)
was bedeutet, dass der Energie-Impuls-Tensor für ein ideales Fluid ohne Druck ( p = 0) gleich dem der inkohärenten Materie ist. Bewegen sich die Teilchen mit der Geschwindigkeit u = (u 1 , u 2 , u 3 ), so machen wir mit U = (γ , γ u 1 , γ u 2 , γ u 3 ) folgenden Ansatz für die Komponenten von TF in einem beliebigen Inertialsystem S: μν
TF = TF = (ρ0 + p)U μ U ν + pημν S
(6.13)
Aufgabe 6.5 Stellen Sie die Komponenten von TF in (6.13) als Matrizen dar, und zeigen Sie, dass sie im Ruhesystem mit (6.12) übereinstimmen.
Lösung In der Matrixschreibweise gilt
6.3
Ideale Fluide
127
⎛
μν
TF
1 ⎜ u1 ⎜ = (ρ0 + p)γ 2 ⎜ 2 ⎝u u3
u1 1 2 u u2u1 u3u1
u2 u1u2 2 2 u u3u2
⎞ ⎛ u3 −p ⎜ u1u3 ⎟ ⎟ ⎜ 0 ⎟+ 2 3 u u ⎠ ⎝ 0 3 2 0 u
0 p 0 0
0 0 p 0
⎞ 0 0⎟ ⎟. 0⎠ p
(6.14)
Im Ruhesystem S gilt u 1 = u 2 = u 3 = 0 sowie γ = 1, d. h. ⎛
μ ν
TF
1 ⎜0 = (ρ0 + p) ⎜ ⎝0 0
0 0 0 0
0 0 0 0
⎞ ⎛ ⎞ ⎛ 0 −p 0 0 0 ρ0 ⎜ 0 p 0 0⎟ ⎜ 0 0⎟ ⎟+⎜ ⎟=⎜ 0⎠ ⎝ 0 0 p 0 ⎠ ⎝ 0 0 0 0 0 0 p
0 p 0 0
0 0 p 0
⎞ 0 0⎟ ⎟. 0⎠ p
Damit ist aber noch nicht bewiesen, dass die Komponenten von TF sich wie in (6.13) errechnen lassen.
Aufgabe 6.6 Zeigen Sie durch Anwendung einer allgemeinen Lorentz-Transformation (1.43), dass sich die Komponenten von TF in einem beliebigen Inertialsystem (6.13) aus denen im Ruhesystem (6.12) errechnen lassen.
Lösung Es ist darauf zu achten, dass sich das System S aus Sicht des Ruhesystems mit der Geschwindigkeit − u bewegt und deswegen die inverse Lorentz-Transformation angewendet werden muss. Die allgemeine (inverse) Lorentz-Transformation hat nach (1.43) die Matrixdarstellung ⎛ ⎞ γ γ ui −1 μ u i u j ⎠ , i, j = 1, 2, 3, =⎝ i i ν γ u δ j + (γ − 1) | u |2 und wir zeigen, dass
μ ν μν μ ν TF = −1 μ −1 ν TF
gilt, d. h., wir müssen folgende Matrixmultiplikation durchführen: ⎛
μν
TF
⎞ ⎛ γ γ ui ρ 0 0 i j ⎠ ⎝ ui u j ⎠ = ⎝ i ij ij p i δ i j + (γ − 1) u u 0 δ γ u δ + (γ − 1) γ u | | u |2 u |2 ⎛ ⎞ ⎛ ⎞ γ γ ui ρ0 γ ρ0 γ u i i j i j ⎠ ⎝ ⎠ ⎝ uu = . i p δ i j + (γ − 1) u u γ u i δ i j + (γ − 1) pγ u | | u |2 u |2 γ
γ ui
⎞
128
6 Energie-Impuls-Tensoren in der Speziellen Relativitätstheorie
Wir benutzen die Formel γ 2 − 1 = γ 2 | u |2 und erhalten nach einige Detailrechnungen: TF00 = γ 2 ρ0 + γ 2 p | u |2 = γ 2 ρ0 + γ 2 − 1 p = γ 2 (ρ0 + p) − p T 0i = T i0 = γ u i (γρ0 + p + p (γ − 1)) = γ 2 (ρ0 + p) u i T i j = δ i j p + ρ0 γ 2 u i u j + 2 p (γ − 1) = δ i j p + ρ0 γ 2 u i u j − 2 p
ui u j
ui u j | u|
2
+ pγ 2
+ p (γ − 1)2 ui u j
| | u |2 u |2 ui u j 2 = δ i j p + ρ0 γ 2 u i u j + p γ −1 2 | u|
+p
ui u j | u |2
ui u j | u |2
= δ i j p + (ρ0 + p) γ 2 u i u j Wir erhalten also insgesamt die gleiche Matrix wie in (6.14). Wir können den Energie-Impuls-Tensor für ideale Fluide auch koordinatenfrei als TF = (ρ0 + p)U ⊗ U + pG
(6.15)
schreiben, wobei G wieder den metrischen Tensor für Einsformen (11.11) bezeichnet: G = ημν Den Energie-Impuls-Tensor für Staub erhält man im Spezialfall p = 0. Das heißt, ein ideales Fluid kann nur dann ohne Druck sein, wenn seine Teilchen überhaupt keine zufälligen Bewegungen machen. TF ist symmetrisch und divergenzfrei Genauso wie im Fall der inkohärenten Materie ist der Energie-Impuls-Tensor für ein ideales Fluid symmetrisch und divergenzfrei, wie man mit identischer Herleitung wie im Abschnitt über Staub nachrechnet. Es gilt also μν ∂μ TF = ∂μ (ρ0 + p)U μ U ν + p ημν = 0.
(6.16)
Symmetrie und Divergenzfreiheit sind die beiden herausragenden Merkmale von EnergieImpuls-Tensoren. Sie gelten auch für allgemeine Fluide und für das elektromagnetische Feld ohne äußere Quellen.
6.4
Allgemeine Energie-Impuls-Tensoren
129
Nichtrelativistischer Grenzfall Wenn die Geschwindigkeiten nicht relativistisch sind, übersteigt die Ruheenergie der Materie die kinetischen Energiebeiträge um viele Größenordnungen. Insbesondere sind die Geschwindigkeiten der Fluidteilchen gering, sodass der Druck gegenüber der Teilchendichte vernachlässigt werden kann. Wir nehmen also an, dass γ ≈ 1, ρ0 + p ≈ ρ0 , p ≈ 0, | u| 1 gilt. Dann folgt für den nichtrelativistischen Grenzfall ⎛
ρ0 μν ⎜ 0 TF ≈ ⎜ ⎝0 0
6.4
0 0 0 0
0 0 0 0
⎞ 0 0⎟ ⎟. 0⎠
(6.17)
0
Allgemeine Energie-Impuls-Tensoren
Energie- und Impulserhaltung gelten nur in abgeschlossenen Systemen. Dazu sind alle Teile eines physikalischen Systems, wozu auch die Wechselwirkungen zwischen den Teilen gehören, zu berücksichtigen. Als Beispiel schauen wir uns eine geladene ideale Flüssigkeit an, auf die elektromagnetische Kräfte wirken. Mit (6.5) folgt μν
μν
∂μ TF = f ν = −∂μ TM bzw.
μν μν μν μν ∂μ TF + ∂μ TM = ∂μ TF + TM = 0.
Die Energie-Impuls-Erhaltung gilt nicht mehr separat für die Flüssigkeit und das elektromagnetisches Feld, sondern nur für das Gesamtsystem. Im Allgemeinen sind also alle auftretenden Energieformen im Energie-Impuls-Tensor T μν zu berücksichtigen: μν
μν
T μν = TF + TM + · · ·
(6.18)
Für diesen allgemeinen Energie-Impuls-Tensor folgt die Symmetrie aus der Symmetrie der einzelnen Bestandteile. Der Erhaltungssatz ∂μ T μν = 0 gilt generell nur für das Gesamtsystem. Wechselwirken aber die einzelnen Bestandteile nicht miteinander, so folgt der Erhaltungssatz direkt aus der Divergenzfreiheit der einzelnen Teilsysteme.
Teil II Grundlagen der Allgemeinen Relativitätstheorie
In diesem Teil behandeln wir die für das Verständnis der Allgemeinen Relativitätstheorie notwendigen (mathematischen) Konzepte und Ergebnisse insbesondere aus der sogenannten Differenzialgeometrie, die Mitte des 19. Jahrhunderts im Wesentlichen von Bernhard Riemann (1826–1866) erstmals erforscht wurde und damit Einstein Anfang des 20. Jahrhunderts zur Verfügung stand. Die Differenzialgeometrie ermöglicht es, die physikalischen Größen in einer koordinatenfreien Weise darzustellen, was in vielen Fällen komplizierte Sachverhalte übersichtlich macht. Wir werden im Folgenden aber auch meist die (alte) koordinatenbasierte Formulierung, die man oftmals zur konkreten Berechnung benötigt, mit angeben. Das bietet die Möglichkeit, die manchmal sehr abstrakten Konstrukte der Differenzialgeometrie durch Wahl von geeigneten Koordinatensystemen etwas „griffiger“ zu machen. Wir folgen in unseren Beschreibungen den üblichen mathematischen Fachbüchern, wie etwa [4, 15, 16, 18–19, 52–54, 56]. Gute und an die Physik angepasste Darstellungen der Differenzialgeometrie findet man aber auch in Physik-Lehrbüchern wie [3, 13] und insbesondere in [32]. Wir behandeln die Differenzialgeometrie hier nur in den Aspekten, die zur Beschreibung der Phänomene der Allgemeinen Relativitätstheorie erforderlich sind. Zum Beispiel beschränken wir uns auf vierdimensionale Räume, was insbesondere manche koordinatenbasierte Darstellungen vereinfacht. Viele Leser, insbesondere diejenigen, die ihr Bachelorstudium der Physik hinter sich gebracht haben, werden die Inhalte dieses Teils schon gut kennen. Für diese reicht wahrscheinlich ein kurzer Blick auf die hier verwendete Notation. Leser, die mit den manchmal abstrakten Konzepten der Differenzialgeometrie noch nicht vertraut sind, sollten die nachfolgenden Kapitel sorgfältig durcharbeiten, bevor sie sich mit der Allgemeinen Relativitätstheorie ab Teil III auseinandersetzen. Für die Themen der Speziellen Relativitätstheorie im ersten Teil reicht ein gutes Verständnis über die ersten vier Abschnitte des nachfolgenden Kap. 9 über die Tensorrechnung aus, die man für die Darstellung der Elektrodynamik und der Energie-Impuls-Tensoren benötigt. Ganz allgemein sind die mathematischen Grundlagen der Speziellen Relativitätstheorie ein
132
Teil II Grundlagen der Allgemeinen Relativitätstheorie
Spezialfall der Grundlagen der Allgemeinen Relativitätstheorie. Zum Beispiel gelten die im Folgenden vorgestellten Aussagen über Mannigfaltigkeiten immer auch für den in Kap. 2 eingeführten Minkowski-Raum M. Beginnen wollen wir allerdings diesen Teil mit einem Kapitel, in dem wir zunächst einfache physikalische Überlegungen anstellen wollen, die in die Problematik der Allgemeinen Relativitätstheorie einführen und deutlich machen, dass wir physikalisch und mathematisch neue Wege beschreiten müssen, um zu einer quantitativen Beschreibung der Phänomene rund um die Schwerkraft zu gelangen.
7
Gravitation und Raumzeitmodell
Einsteins Allgemeine Relativitätstheorie (ART), die er Ende 1915 vorstellte, ist eine Theorie der Schwerkraft. Der Name deutet schon an, dass die ART eine Verallgemeinerung der Speziellen Relativitätstheorie ist, die Einstein im Jahre 1905 veröffentlichte. Eine erste Frage stellt sich unmittelbar: Warum ist eine neue Theorie der Schwerkraft überhaupt erforderlich, wo doch die Newton’sche Gravitation über Jahrhunderte bewiesen hat, dass sie in der Lage ist, die allermeisten der beobachteten Phänomene, die mit der Schwerkraft zusammenhängen, zu erklären? Für die folgenden Fragen und noch viele mehr gibt die Newton’sche Gravitation befriedigende Antworten. Was hält die Planeten und Monde auf ihren Bahnen? Warum sind diese Bahnen elliptisch, und wie kann ich sie berechnen? Warum gibt es auf der Erde die Gezeiten der Meere, und wie kann man sie erklären? Eine weitere auf der Hand liegende Frage ist: Warum ist eine Verallgemeinerung der Speziellen Relativitätstheorie eine Theorie der Schwerkraft? Warum keine Theorie des Elektromagnetismus oder der Elementarteilchen oder eine ganz neue Theorie? Was ist das Besondere an der Schwerkraft, dass eine Verallgemeinerung der SRT, die ja eine Theorie von Raum und Zeit ist, zwangsläufig zu ihr führt? Wir wollen uns hier, in diesem einführenden Kapitel, vor allem der ersten Frage widmen. Der einfache Grund für die Notwendigkeit einer neuen Gravitationstheorie liegt darin, dass die Newton’sche Theorie nicht mit der Speziellen Relativitätstheorie vereinbar ist. Wenn man also davon ausgeht, dass die SRT richtig ist (und das unterstellen wir), so muss das Newton’sche Modell der Schwerkraft verworfen werden. Um das besser zu verstehen, schauen wir uns das Newton’sche Gravitationsgesetz an, das besagt, dass die Kraft, die eine zeitabhängige Masse M (t) auf eine zweite Masse m ausübt, durch F = −
G M (t) m r2
· rˆ
gegeben ist. Das bedeutet, dass die Kraft, die die Masse m zur Zeit t erfährt, von der Masse M(t) zur gleichen Zeit t abhängt. Änderungen an der Masse M zum Zeitpunkt t am Ort der © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_7
133
134
7 Gravitation und Raumzeitmodell
Masse M würden also zeitgleich am Ort der Masse m spürbar sein. Das aber würde eine unmittelbare („instantane“) Übertragung der Kraft erfordern, im Widerspruch zur Speziellen Relativitätstheorie, die besagt, dass sich nichts schneller als mit Lichtgeschwindigkeit bewegen kann. Das Newton’sche Gravitationsgesetz ist somit nicht mit der Speziellen Relativitätstheorie vereinbar. Wir können die Unverträglichkeit der beiden Theorien auch mit der folgenden, eher formalen Überlegung nachweisen. Die gravitative Feldstärke g =
GM F = − 2 · rˆ m r
hängt von r , aber nicht von t ab. Ein solches (dreidimensionales) Vektorfeld ist aber mit der Speziellen Relativitätstheorie nicht vereinbar, da es nicht Lorentz-invariant sein kann. Es sollte aber klar sein, dass ungeachtet der Tatsache, dass die Newton’sche Theorie „falsch“ ist, jede neue Gravitationstheorie das Newton’sche Schwerkraftgesetz als Spezialfall beinhalten muss. Wir beginnen mit einigen Überlegungen, die zeigen, dass das Raumzeitmodell der Speziellen Relativitätstheorie erweitert werden muss, damit die physikalischen Phänomene, die mit der Gravitation zusammenhängen, erklärt werden können. Wir untersuchen die Äquivalenz zwischen träger und schwerer Masse und zeigen, dass sich Uhren im Newton’schen Gravitationsfeld verlangsamen. Wir berechnen mit der Newton’schen Gravitationstheorie die Ablenkung eines Lichtstrahls, der sich einem massiven Objekt nähert, und stellen dar, dass es im Erd- und Sonnenumfeld keine globalen, sondern nur lokale Inertialsysteme geben kann. Die von uns gewählte Darstellung orientiert sich an [6] und [14].
7.1
Newton’sche Gravitation
Zunächst wiederholen wir einige Ergebnisse aus der Newton’schen Gravitationstheorie. Newton’sches Gravitationsgesetz Neben den drei Grundgesetzen der Newton’schen Mechanik spielt für uns das Newton’sche Gravitationsgesetz eine überragende Rolle. Es besagt, dass jeder Massenpunkt M eine anziehende Kraft auf jeden anderen Massenpunkt m ausübt. Diese Gravitationskraft ist entlang der Verbindungslinie der beiden Massenpunkte gerichtet, ihre Stärke ist proportional zu dem Produkt der Massen der beiden Körper und umgekehrt proportional zu dem Quadrat ihres Abstandes: G Mm G Mm F = − 3 · r = − 2 · rˆ , (7.1) r r wobei die Kraft F von dem im Koordinatenursprung sitzenden Körper mit der Masse M generiert wird. Sie wirkt auf den zweiten Körper mit der Masse m, der sich am Ort r befindet. r Mit r = x 2 + y 2 + z 2 bezeichnen wir den Betrag von r und mit rˆ = den Einheitsvektor r
7.1
Newton’sche Gravitation
135
in Richtung r. Die Proportionalitätskonstante G nennt man auch Newton’sche Gravitationskonstante. Sie hat (in SI-Einheiten) den Wert G ≈ 6,67 · 10−11 m 3 kg −1 s −2 . Wir definieren die Gravitationsfeldstärke g (auch Gravitationsbeschleunigung genannt) durch GM F g = = − 2 · rˆ . (7.2) m r Sie beschreibt die Stärke eines Gravitationsfeldes im Abstand r zu einer Masse M im Koordinatenursprung und ist unabhängig von der Masse m eines Probekörpers, der sich im Gravitationsfeld befindet. Wir können eine Parallele zur Elektrostatik ziehen. Dort wird das definiert, d. h., das elektrische Feld ist Kraft pro Einheitselektrische Feld durch E = F/q ladung, während das Gravitationsfeld Kraft pro Einheitsmasse ist. Wir können sagen, dass Masse die Quelle des Gravitationsfeldes ist, genauso wie Ladung die Quelle des elektrischen Feldes ist. Gravitationspotenzial Die rechte Seite von Gl. (7.2) kann man als Gradienten einer skalaren Funktion φ (r ) schreiben: GM g = −∇φ, φ (r ) = − (7.3) r ∂ ∂ ∂ mit ∇ = , , . Das Skalarfeld φ (r ) nennt man Gravitationspotenzial. Damit ∂ x ∂ y ∂z können wir die Newton’sche Bewegungsgleichung im Gravitationsfeld als m r¨ = −m∇φ (r )
(7.4)
schreiben. Multipliziert man das Gravitationspotenzial mit der Masse m eines Körpers, so erhält man die zur Gravitationskraft F gehörige potenzielle Energie U (r ), d. h. G Mm , r
(7.5)
F ( r ) = −∇U (r ) .
(7.6)
U (r ) = − und es gilt
Gravitation ausgedehnter Körper Die bislang hergeleiteten Gleichungen beziehen sich alle auf punktförmige Objekte, d. h. auf Teilchen, die zwar eine endliche Masse, aber keine Ausdehnung haben. Wir wollen die bisherigen Aussagen verallgemeinern, indem wir die Massenpunkte durch endliche ausgedehnte Massenverteilungen ersetzen. Dabei bedeutet endliche Ausdehnung, dass man immer eine Kugel mit endlichem Radius angeben kann, in die sich der Körper einbetten lässt. Der
136
7 Gravitation und Raumzeitmodell
Körper habe die gesamte Masse m und sei durch eine (zeitunabhängige) Massendichte ρ ( x) charakterisiert. Integriert man über den gesamten Raum, so ergibt sich natürlich m = d 3 x ρ ( x) . (7.7) Beispiel 7.1
Wir berechnen die Masse m eines Körpers mit kugelsymmetrischer Massendichte ρ ( x) um den Nullpunkt. Das Volumenelement in Kugelkoordinaten ist (siehe [1]) d 3 x = r 2 sin ϑ dϑ dϕ dr . Da die Massendichte ρ nicht von ϑ und ϕ abhängt, kann man über diese beiden Variablen integrieren und erhält m=
2π
dϕ 0
π
sin ϑ dϑ
0
∞
∞
r 2 ρ (r ) dr = 4π
0
r 2 ρ (r ) dr .
0
Es ist üblich (siehe z. B. [3]), die Größe dm := ρ ( x) d3x als differenzielles Massenelement aufzufassen und wie einen Massenpunkt zu behandeln. Greift nun an diesem Massenelement die resultierende (differenzielle) Kraft d F an, so verallgemeinert sich das zweite Newton’sche Gesetz F = m a zu d F = dm x¨ .
(7.8)
Ein Massenelement eines Körpers am Ort x erzeugt für einen Probekörper an einem beliebigen Ort y, der außerhalb oder auch innerhalb des Körpers liegen kann, ein differenzielles Gravitationspotenzial: dφ (y ) = −
G dm G ρ ( x) 3 =− d x |y − x| |y − x|
Hat der Probekörper die Masse m P , so ergibt sich die differenzielle Gravitationskraft durch m P G ρ ( x ) y − x 3 d x. d F = −m P ∇ y dφ = − |y − x|2 |y − x| Das Symbol ∇ y soll dabei verdeutlichen, dass wir nach der Variable y = (y1 , y2 , y3 ) ableiten. Wir integrieren das differenzielle Gravitationspotenzial über den ganzen Körper und erhalten
7.1
Newton’sche Gravitation
137
ρ ( x) 3 d x |y − x|
φ (y ) = −G
(7.9)
F (y ) = −m P ∇ y φ (y ) .
Aufgabe 7.1 Zeigen Sie, dass das Gravitationspotenzial eines kugelsymmetrischen Körpers mit Dichte ρ ( x ) = ρ (s) mit s := | x | und ρ (s) = 0 f¨ur s > R
φ (r ) = −
Gm fur ¨ r>R r
beträgt. Lösung Wir benutzen Kugelkoordinaten und legen das Koordinatensystem so, dass die z-Achse in Richtung des Vektors y zeigt. Mit r bezeichnen wir den Betrag von y. In Abb. 7.1 sieht man, dass die Vektoren x, y, y − x ein Dreieck bilden. Mit dem Kosinussatz der elementaren Geometrie folgt |y − x| = s 2 + r 2 − 2sr cos ϑ. Damit erhalten wir φ (r ) = −G
2π π ∞ ρ ( x) 3 ρ (s) d x = −G ds. dϕ sin ϑ dϑ s2 2 2 |y − x| 0 0 0 s + r − 2sr cos ϑ
Wir integrieren über ϕ und substituieren z = cos ϑ, dann folgt dz = − sin ϑ dϑ und
−1
∞
ρ (s) s2 √ ds 2 s + r 2 − 2sr z +1 0 +1 ∞ ρ (s) = −2π G dz s2 √ ds. 2 s + r 2 − 2sr z −1 0
φ (r ) = −2π G
Das Integral über z ergibt sich zu
Abb. 7.1 Körper mit kugelsymmetrischer Dichte
(−dz)
138
7 Gravitation und Raumzeitmodell +1 −1
1 1 1 1 2 dz √ s + r 2 − 2sr z = − (|s − r | − (s + r )) =− −1 sr sr s 2 + r 2 − 2sr z ⎧ 2 ⎪ ⎨ s ≥r = 2s ⎪ ⎩ s < r, r
und wir erhalten für das (ebenfalls kugelsymmetrische) Gravitationspotenzial
r ∞ 1 s 2 ρ (s) ds + sρ (s) ds . φ (r ) = −4π G r 0 r Für s > R liefert das zweite Integral keinen Beitrag, da dort ρ (s) = 0 gilt. Das erste Integral hat dann die obere Grenze R und ist gemäß Beispiel 7.1
R
∞
s 2 ρ (s) ds =
0
s 2 ρ (s) ds =
0
m . 4π
Insgesamt erhalten wir φ (r ) = −
Gm f ur ¨ r ≥ R. r
Dieses wichtige Resultat fassen wir nochmals zusammen. Ein kugelsymmetrischer Körper der Masse m erzeugt im Raum außerhalb seiner Massendichte dasselbe Gravitationspotenzial wie ein Massenpunkt mit Masse m, der im Mittelpunkt des Körpers sitzt. Wenn wir also z. B. die Planetenbahnen im Sonnensystem berechnen, so unterstellen wir, dass wir es mit kugelsymmetrischen Körpern zu tun haben. Dadurch können wir die Planeten als Massenpunkte ansehen, und die Herleitungen werden erheblich vereinfacht. Natürlich sind reale Planeten nicht genau kugelsymmetrisch und es gibt weiterführende Theorien und Messmethodiken, wie die Gravitationsfelder von nichtrotationssymmetrischen Himmelskörpern genauer bestimmt werden können (siehe z. B. [2]). Poisson-Gleichung Wir wollen die Integralgleichung für das Gravitationspotenzial (7.9) noch als Differenzialgleichung schreiben, da diese bei der späteren Herleitung der Einstein-Gleichungen eine wichtige Rolle spielen wird. Dazu benutzen wir die Identität (siehe z. B. [1]): ∇ y2
1 = −4π δ 3 (y − x) , |y − x|
7.1
Newton’sche Gravitation
139
wobei ∇ y2 =
∂2 ∂2 ∂2 + + ∂ y12 ∂ y22 ∂ y32
den Laplace-Operator (in kartesischen Koordinaten) und δ 3 (y − x) die dreidimensionale Dirac’sche Deltafunktion bezeichnet. Diese Identität wenden wir auf (7.9), d. h. auf ρ ( x) 3 d x, φ (y ) = −G |y − x| an und erhalten nach Vertauschen von Integration und Differenziation 1 2 2 d3x x ) ∇y ∇ y φ (y ) = −G ρ ( |y − x| = −G ρ ( x ) −4π δ 3 (y − x) d 3 x = 4π Gρ (y ) .
(7.10)
Diese Differenzialgleichung nennt man Poisson-Gleichung nach dem französischen Mathematiker Siméon Denis Poisson. Sie wird uns bei der Herleitung der Einstein-Gleichungen sehr behilflich sein, und man kann sie so interpretieren, dass auf der linken Seite das Gravitationsfeld φ steht und auf der rechten Seite dessen Quelle, nämlich die Massendichte ρ. Liegt keine Massenverteilung vor, so erhält man ∇ 2 φ = 0, d. h., die Differenzialgleichung fürs Vakuum ist eine Laplace-Gleichung.
Aufgabe 7.2 Zeigen Sie, dass aus der Poisson-Gleichung für einen Massenpunkt M die Gl. (7.3) folgt.
Lösung Ist M ein Massenpunkt im Ursprung, so gilt ρ (y ) = Mδ 3 (y ) , und aus der Poisson-Gleichung folgt ∇ 2 φ (y ) = 4π G Mδ 3 (y ) = −G M∇ 2
1 |y |
⇒ φ (y ) = −
GM |y |
und damit die Gl. (7.3).
140
7 Gravitation und Raumzeitmodell
Die Poisson-Gleichung enthält also auch den Spezialfall eines Massenpunktes. Insgesamt haben wir gezeigt, dass man die Newton’sche Gravitationstheorie durch eine Differenzialgleichung darstellen kann. In Kap. 13 werden wir zeigen, dass die Allgemeine Relativitätstheorie durch zehn Gleichungen beschrieben wird und dass im nichtrelativistischen Grenzfall genau eine Gleichung, nämlich die Poisson-Gleichung, übrig bleibt.
7.2
Schwere und träge Masse, Äquivalenzprinzip
Die Eigenschaft eines Gegenstandes, die Ursache dafür ist, dass die Gravitationskraft auf einen anderen Gegenstand wirkt, haben wir Masse genannt und mit m bezeichnet. Genau den gleichen Begriff und die gleiche Notation wird im zweiten Newton’schen Gesetz verwendet, um den Widerstand eines Körpers gegen Beschleunigungen zu kennzeichnen, ohne dass klar ist, ob es sich bei diesen Eigenschaften eines Gegenstandes um das Gleiche handelt. Tatsächlich unterscheidet man in der Physik diese beiden Phänomene und nennt die erste Eigenschaft schwere und die zweite träge Masse. Man kann sich vorstellen, dass schwere und träge Masse eines Gegenstandes nicht gleich sein müssen. Schreibt man m s für die schwere Masse und m t für die träge Masse eines Körpers, so gilt für den Betrag der Kraft, die die Erde auf den Körper in der Nähe des Erdbodens ausübt, F=
G ME ms R 2E
,
wobei M E die schwere Masse der Erde und R E den Erdradius bezeichnen. Andererseits gilt nach dem zweiten Newton’schen Gesetz für eine beliebige Kraft F = m t a , woraus sich der Betrag der Fallbeschleunigung durch a=
G ME ms F = · mt R 2E m t
ergibt. Wenn die Gewichtskraft nur eine weitere Eigenschaft der Materie wäre, wie beispielsweise die elektrische Ladung oder Dichte, dann sollte das Verhältnis m s /m t von der chemischen Zusammensetzung des Körpers, seiner Temperatur oder irgendeiner anderen physikalischen Größe abhängen, d. h., die Fallbeschleunigung wäre für verschiedene Körper unterschiedlich. Die Erfahrungen zeigen jedoch, dass die Fallbeschleunigung a für alle Gegenstände gleich ist. Damit hat auch das Verhältnis m s /m t für jeden Körper denselben Wert, was der Grund dafür ist, dass man ms = mt = m
7.2
Schwere und träge Masse, Äquivalenzprinzip
141
setzt und damit gleichzeitig Betrag und Einheiten der Newton’schen Gravitationskonstante G festlegt. Der Betrag der Fallbeschleunigung ergibt sich damit zu a=
G ME R 2E
(7.11)
und ist nicht mehr von der Masse des Körpers abhängig. Obwohl die Äquivalenz von schwerer und träger Masse dank raffinierter Experimente bis auf einen relativen Fehler von 10−13 überprüft wurde (siehe [2]) und damit zu den am besten gesicherten physikalischen Gesetzen zählt, darf man nicht vergessen, dass sie (nur) eine experimentelle Erkenntnis ist. Die Gleichheit von schwerer und träger Masse, die man auch (schwaches) Äquivalenzprinzip nennt, bildet eine der wichtigsten physikalischen Grundlagen von Einsteins Allgemeiner Relativitätstheorie. Mit dem Äquivalenzprinzip ist die Fallbeschleunigung a für alle Körper gleich, wobei der Luftwiderstand und andere möglichen Kräfte vernachlässigt sind. Stellen wir uns nun vor, wir würden gemeinsam mit einem schweren Ball von einem hohen Turm fallen. Der Ball würde an unserer Seite verbleiben, und wir hätten den Eindruck, dass keinerlei Kräfte auf ihn wirken. Wenn wir dem Ball einen Schubs geben, so würde er sich mit gleichmäßiger Geschwindigkeit in einer geraden Linie von uns entfernen (auch nach unten!). Natürlich würden der Ball und wir durch die gemeinsame Fallbeschleunigung nach unten auf die Erde zu fallen, die relativen Bewegungen zwischen uns wären aber gleichmäßig, die auf uns und den Ball wirkenden Fallbeschleunigungen heben sich gegenseitig auf. Wir können damit das Äquivalenzprinzip umformulieren: Im erdnahen Gravitationsfeld erscheinen einem frei fallenden Beobachter alle Objekte so, als ob kein Gravitationsfeld vorhanden wäre. Das heißt, für einen frei fallenden Beobachter sind die physikalischen Gesetzmäßigkeiten so, wie sie „weit draußen“ im Universum ohne gravitative Beeinflussung durch irgendwelche Massen wären, aus seiner Sicht befindet er sich in einem Inertialsystem. Natürlich würden wir auch ohne Luftreibung spüren, dass wir uns im freien Fall befinden, das liegt aber nur daran, dass unser Körper an das Schwerefeld der Erde gewöhnt ist. Rein physikalisch betrachtet, ist der freie Fall gleichbedeutend mit einem Zustand ohne Gravitation, wenn wir ein homogenes Gravitationsfeld unterstellen (homogen heißt: Das Feld ist zeitlich und räumlich konstant und zeigt immer in die gleiche Richtung). Man kann die Argumentation, dass frei fallende Beobachter gravitationsfrei sind, auch umdrehen. Wir benutzen dazu ein Gedankenexperiment, das in ähnlicher Form von Einstein erfunden wurde (siehe [7]). Wir unterstellen, dass sich eine Rakete in einem leeren Raum ohne Gravitation mit gleichmäßiger Beschleunigung a bewegt. Einem Beobachter im Inneren der Rakete erscheint es so, als ob in der Rakete ein Gravitationsfeld vorhanden
142
7 Gravitation und Raumzeitmodell
ist. Lässt er Gegenstände fallen, so fallen sie aus seiner Sicht alle unabhängig von ihrer internen Zusammensetzung mit der gleichen Beschleunigung auf den Boden der Rakete. Von außen gesehen, fallen die Gegenstände nicht auf den Boden, sondern bleiben da, wo sie losgelassen werden, der Boden bewegt sich wegen der gleichmäßigen Beschleunigung allerdings so auf die Gegenstände zu, dass der Raketeninsasse den Eindruck hat, dass die Gegenstände auf den Boden fallen. Hält er einen Gegenstand in seiner Hand, so spürt er ein Gewicht, das exakt mit dem übereinstimmt, das der Gegenstand auch auf der Erde hätte. Setzen wir voraus, dass er nur wahrnehmen kann, was innerhalb der Rakete passiert, so kann er seinen Zustand nicht von dem unterscheiden, bei dem die Rakete auf dem Erdboden steht. In diesem Sinne sind homogene Gravitationsfelder äquivalent zu Bezugssystemen, die gegenüber einem Inertialsystem gleichmäßig beschleunigt sind. Man kann also die Effekte der Gravitation durch Beschleunigung des Bezugssystems (z. B. durch die Fallbeschleunigung der Rakete im Gravitationsfeld) eliminieren. Diese Aufhebung der Gravitation gelingt bei realen Feldern, die in der Regel (z. B. Erde, Sonne) nicht homogen sind, nur punktuell. Das heißt, es gibt kein beschleunigtes gleichförmiges Bezugssystem, das die Gravitation überall aufhebt.
7.3
Gravitativer Doppler-Effekt
Wir wollen das Äquivalenzprinzip benutzen, um zu zeigen, dass die Schwerkraft einen Doppler-Effekt des Lichtes verursacht. Dazu machen wir folgendes Gedankenexperiment, das man in ähnlicher Form in [29] findet. Wir nehmen an, dass sich ein Lichtsender mit wohldefinierter Frequenz f S auf der Spitze eines Turms mit Höhe h befindet und einen Lichtstrahl senkrecht nach unten richtet. Am Erdboden ist ein Empfänger installiert, der die Signale des Senders aufnimmt und deren Frequenz bestimmt. Wir wollen herausfinden, ob es einen Unterschied zwischen der Empfängerfrequenz f E und der Senderfrequenz f S gibt. Dazu nehmen wir weiterhin an, dass es einen Beobachter in einem Labor gibt, das sich ebenfalls auf Höhe der Turmspitze befindet und zu dem Zeitpunkt, als der Sender ein Lichtsignal nach unten schickt, beginnt, sich im freien Fall entlang der Turmmauer nach unten zu bewegen. Der Beobachter im Labor misst beim Auslösen des Lichtsignals, als sich das Labor noch in Ruhe befand, dessen Frequenz und erhält den Wert f s des Senders. Da er sich in einem frei fallenden Bezugssystem (in seinem Ruhesystem) befindet, ändert sich die Frequenz des nach unten fallenden Lichtsignals für ihn nicht. Einen Augenblick später bemerkt er, dass aus seiner Sicht der Empfänger auf dem Boden auf ihn zukommt. Wenn der herannahende Empfänger das Lichtsignal empfängt, muss er nach dem Doppler-Effekt (siehe Abschn. 1.5) eine höhere Frequenz f E feststellen als die, die der Beobachter im Labor gemessen hat. Für den Empfänger findet eine Blauverschiebung statt. Wären in unserem Gedankenexperiment der Sender am Boden und der Empfänger an der Spitze des Turms gewesen, so hätte sich für den Empfänger analog eine Rotverschiebung ergeben, denn aus Sicht des frei fallenden Labors hätte sich der Empfänger auf der Turm-
7.3
Gravitativer Doppler-Effekt
143
spitze von ihm wegbewegt. Obwohl also das Ergebnis je nach Versuchsanordnung eine Blaubzw. Rotverschiebung sein kann, nennt man diesen Effekt Gravitationsrotverschiebung. Wir wollen noch ermitteln, wie groß die gravitative Rotverschiebung ist, und berechnen die Geschwindigkeit des frei fallenden Beobachters, wenn das Licht in der Versuchsanordnung „Sender unten, Empfänger oben“ die Turmspitze erreicht. Da die Fallgeschwindigkeit des Labors verglichen mit der der Lichtgeschwindigkeit klein ist, verwenden wir zur Berechnung der Einfachheit halber die klassische Doppler-Effekt-Formel (1.13). Um die Turmspitze zu erreichen, braucht das Licht die Zeit h (beachte, dass wir weiterhin mit natürlichen Einheiten arbeiten, d. h., die Lichtgeschwindigkeit ist c = 1). In dieser Zeit ist der fallende Beobachter mit der Erdbeschleunigung g gefallen, d. h., der Betrag seiner Endgeschwindigkeit ist v = gh. Aus seiner Sicht hat sich die Turmspitze mit dieser Geschwindigkeit von ihm entfernt. Damit folgt mit der klassischen Doppler-Formel (1.13) f E = (1 − v) f S = (1 − gh) f S .
(7.12)
Der Unterschied zwischen den beiden Frequenzen ist sehr gering, ist z. B. der Turm 100 m hoch, dann ist die Geschwindigkeit v = gh nur 1,1 × 10−14 groß. Trotzdem konnte der Effekt schon in den 1960er-Jahren in vielen Versuchen mit hoher Genauigkeit nachgewiesen werden, siehe [29]. Heutzutage wird er z. B. routinemäßig bei der Korrektur von Zeitunterschieden bei der Übermittlung von GPS-Signalen berücksichtigt. Wie schon in Abschn. 1.5 über den Doppler-Effekt dargestellt, ist die Rotverschiebung sowohl eine Eigenschaft des Beobachters als auch des Lichtes selbst. Licht hat je nach Höhe im Gravitationsfeld der Erde unterschiedliche Frequenzen. Messen wir die Frequenz in einer bestimmten Höhe über dem Erdboden und vergleichen sie mit der auf dem Erdboden, so sehen wir eine Rotverschiebung. Die gravitative Rotverschiebung hat auch Auswirkungen auf die Zeit selbst: Schwerkraft verlangsamt die Zeit. Stellen wir uns vor, es gäbe zwei identische Uhren, die mit der gleichen Frequenz f S „ticken“ wie das vom Boden ausgesandte Licht im obigen Gedankenexperiment. Eine Uhr bringen wir auf die Turmspitze, die andere bleibt am Boden. Wir senden Licht mit der Frequenz f S vom Boden zur Turmspitze, und zwar ca. 1020 Ticks lang. Da sichtbares Licht mit etwa 1015 pro Sekunde oszilliert, würde das ungefähr einen Tag bedeuten. Nun empfängt die Uhr auf der Turmspitze das Licht vom Boden rotverschoben, die Frequenz ist um etwa einen Tick in 1014 (siehe oben) geringer als seine eigene. Das heißt, die Uhr unten geht vom Beobachter oben gesehen langsamer! Innerhalb eines Tages hat also die Uhr oben ca. 106 -mal häufiger getickt als die Uhr unten. Bringt man anschließend beide Uhren wieder zusammen, so stellt man diesen Zeitunterschied fest. Er beträgt zwar nur eine Nanosekunde (1 ns = 10−9 s), ist aber messbar und in vielen Experimenten nachgewiesen, siehe wieder [29].
144
7.4
7 Gravitation und Raumzeitmodell
Lichtablenkung an der Sonne im Newton’schen Gravitationsfeld
Mit dem Äquivalenzprinzip lässt sich zeigen, dass Licht seine Richtung ändert, wenn es die Sonne passiert. Die Fallbeschleunigung im Newton’schen Gravitationsfeld der Sonne beträgt nach Gl. (7.11) G M Sonne a= d2 für ein Teilchen, das sich im Abstand d von der Sonne befindet. In Abb. 7.2 ist ein Lichtstrahl (gepunktete Linie) eingezeichnet, der genau an der Sonnenoberfläche vorbeistreift, d. h., der Abstand d ist der Radius der Sonne. Die gestrichelte Linie zeigt, wie der Lichtstrahl laufen würde, wenn er nicht von dem Gravitationsfeld der Sonne abgelenkt würde. Der Winkel ϕ∞ gibt die Größe der Ablenkung an. Wie wollen diesen Beugungswinkel näherungsweise bestimmen. Dazu machen wir ein ähnliches Gedankenexperiment wie im letzten Abschnitt. Wir betrachten einen Lichtstrahl, der die Sonne passiert. Für einen im Gravitationsfeld der Sonne frei fallenden Beobachter bewegt sich der Lichtstrahl auf einer geraden Linie. Da aber der frei fallende Beobachter sich auf das Gravitationszentrum zubewegt, muss das Licht kontinuierlich seine Richtung ändern, damit der Beobachter es als gerade Linie wahrnehmen kann. Um die Größe dieses Effekts abzuschätzen, stellen wir uns vor, dass sich der Beobachter im Abstand d, also dort wo der Lichtstrahl der Sonne am nächsten kommt, relativ zur Sonne in Ruhe befindet. In dem Augenblick, wo ihn der Lichtstrahl passiert, fällt er mit der obigen Beschleunigung auf das Innere der Sonne zu. Das Licht bewegt sich mit der Lichtgeschwindigkeit c und erfährt die größte Ablenkung in einer Zeit der Größenordnung t ≈ d/c, also der Zeit, die das Licht braucht, um wieder
Abb. 7.2 Lichtablenkung an der Sonne nach Newton
7.5
Gravitation und Krümmung
145
deutlich von der Sonne entfernt zu sein. Während dieser Zeit hat der Beobachter eine zum Lichtstrahl senkrecht stehende Geschwindigkeit von v =a·t ≈
G M Sonne d d2
=
c
G M Sonne cd
erreicht. Nach dem Äquivalenzprinzip muss das Licht die gleiche Geschwindigkeit senkrecht zu seiner ursprünglichen Richtung erhalten haben. Da sich die Geschwindigkeit des Lichtes in der ursprünglichen Richtung nur wenig geändert hat, berechnen wir den Beugungswinkel durch einfache Geometrie. Das Verhältnis v/c gibt ungefähr die Steigung der gepunkteten Linie an, d. h. v tan ϕ∞ ≈ . c Da der Beugungswinkel ϕ∞ klein ist, können wir den Tangens mit dem Differenzial abschätzen: tan ϕ∞ ≈ tan 0 +ϕ∞ tan (0) = ϕ∞ (1 + tan2 (0)) = ϕ∞ =0
und erhalten
G M Sonne v ≈ . c c2 d Die Gesamtabweichung ist doppelt so groß, da sowohl das einfallende als auch das ausfallende Licht gleichsam abgelenkt wird, d. h., die Vorhersage aus der Newton’schen Gravitationstheorie für die Gesamtablenkung von Licht an der Sonne beträgt ϕ∞ ≈
2G M Sonne c2 d
.
Wir werden später sehen, dass die Allgemeine Relativitätstheorie eine Vorhersage über die Ablenkung des Lichtes durch die Sonne macht, die doppelt so groß wie die Newton’sche ist. Diese Vorhersage von Einstein wurde erstmals 1919 bei einer Sonnenfinsternis experimentell überprüft und seitdem ebenso in zahlreichen weiteren Experimenten bestätigt, siehe z. B. [29]. Die Newton’sche Vorhersage für die Lichtablenkung an der Sonne stimmt also nicht mit den Experimenten überein. Sie ist neben weiteren Phänomenen (wie z. B. der Periheldrehung des Merkurs) ein Indiz dafür, dass man insbesondere für Objekte mit hohen Geschwindigkeiten oder großen Massen eine Erweiterung der bisherigen Gravitationstheorie braucht.
7.5
Gravitation und Krümmung
In der Speziellen Relativitätstheorie wird unterstellt, dass es Inertialsysteme gibt, die die gesamte Raumzeit ausfüllen. Jedes Ereignis kann durch ein einziges Inertialsystem beschrieben werden, dessen Koordinatenpunkte sich relativ zum Ursprung in Ruhe befinden und
146
7 Gravitation und Raumzeitmodell
dessen Uhren an jedem Raumpunkt mit der Uhr im Ursprung synchronisiert sind. Wir werden in diesem Abschnitt zeigen, dass es in einem nichthomogenen Gravitationsfeld nicht möglich ist, ein globales Inertialsystem zu konstruieren, in dem alle Uhren gleich gehen. So gesehen sind Gravitationsfelder nicht kompatibel mit der Speziellen Relativitätstheorie. Es gibt allerdings die Möglichkeit, in „kleinen“ Raumzeitgebieten (klein genug, sodass die Inhomogenitäten der gravitativen Kräfte keine Rolle spielen) sogenannte lokale Inertialsysteme zu definieren. Zunächst zeigen wir, dass es nicht möglich ist, z. B. ein Labor auf der Erde als ein Ruhesystem im Sinne der Speziellen Relativitätstheorie zu betrachten. Wir verwenden wieder das Gedankenexperiment von oben und stellen uns vor, dass kurz nacheinander zwei Lichtsignale vom Boden zur Turmspitze hinauf geschickt werden. In Abb. 7.3 ist ein Raumzeitdiagramm gezeichnet, das den Boden und die Spitze des Turmes als ruhend darstellt, deren Weltlinien verlaufen also senkrecht. Im Zeitintervall tu werden die zwei Lichtsignale vom Boden ausgesendet. Die gestrichelten Linien sollen andeuten, dass es grundsätzlich möglich ist, dass sich Lichtstrahlen im Gravitationsfeld der Erde nicht auf einer geraden Linie bewegen, wie wir es in Abb. 7.3 der Einfachheit halber unterstellt haben. Aber wie auch immer die Weltlinien des Lichtes in einem Gravitationsfeld verlaufen, der Effekt muss für beide Lichtstrahlen derselbe sein, da wir annehmen, dass das Gravitationsfeld zeitlich und räumlich homogen, also konstant ist. Das heißt, die Weltlinien der beiden Lichtstrahlen verlaufen kongruent, und wir schließen aus der angenommenen Minkowski Geometrie, dass tu = to ist. Nun wissen wir aber aufgrund der Rotverschiebung durch das Gravitationsfeld, dass to > tu ist. Also ist die angenommene Minkowski-Geometrie falsch, und das Laborsystem auf der Erde ist kein Inertialsystem. Abb. 7.3 Die Erde ist kein Inertialsystem
7.5
Gravitation und Krümmung
147
Das heißt allerdings noch nicht, dass es überhaupt keine Inertialsysteme in Gravitationsfeldern gibt. Eine wichtige Eigenschaft von Inertialsystemen besteht darin, dass sich ein Teilchen mit konstanter Geschwindigkeit bewegt, solange keine Kraft ausgeübt wird. Die Gravitationskraft unterscheidet sich von allen anderen Kräften dadurch, dass alle Körper mit derselben Anfangsgeschwindigkeit derselben Weltlinie folgen. Von daher ist ein Bezugssystem, das frei in einem Gravitationsfeld fällt, ein Kandidat für ein Inertialsystem, da – wie in den letzten Abschnitten ausgeführt - in einem solchen Bezugssystem keine gravitative Rotverschiebung auftritt und unbeschleunigte Teilchen eine uniforme Geschwindigkeit beibehalten. Man könnte also annehmen, dass ein frei fallendes Bezugssystem im Gravitationsfeld der Erde ein (globales) Inertialsystem darstellt. Doch auch das ist nicht der Fall, da frei fallende Bezugssysteme auf unterschiedlichen Seiten der Erde in unterschiedliche Richtungen fallen. Es ist also weiter nicht möglich, ein globales Inertialsystem zu konstruieren. Das Höchste, was wir anstreben können, sind sogenannte lokale Inertialsysteme, mit denen wir uns jetzt beschäftigen wollen. Wir betrachten dazu ein frei fallendes Bezugssystem im Gravitationsfeld der Erde. Auf der linken Seite der Abb. 7.4 sind vier Teilchen T1 , T2 , T3 , T4 eingezeichnet, die sich zum Zeitpunkt t = 0 in einem frei fallenden Bezugssystem (gestrichelter Kasten) auf die Erde zu bewegen. Die vier Teilchen sind aus rein optischen Gründen miteinander verbunden gezeichnet, bewegen sich aber unabhängig voneinander. Zum Zeitpunkt t = 0 bilden die vier Teilchen die Eckpunkte eines (gedachten) Quadrats. Nach dem Newton’schen Gravitationsgesetz Gm 1 m 2 F = − rˆ r2 ist die Gravitationskraft auf den Erdmittelpunkt gerichtet, d. h., die Teilchen T1 und T3 fallen senkrecht nach unten, die Teilchen T2 und T4 entlang der gestrichelten Pfeile. Nach einer Zeitspanne t hat das Bezugssystem die Position auf der rechten Seite der Abbildung erreicht. Wir beobachten, dass sich die Positionen der Teilchen relativ zueinander zu einem Drachenviereck verändert haben. Zum einen sind die Teilchen T2 und T4 durch die Bewegung entlang der gestrichelten Pfeile aufeinander zu gefallen, sie haben sich durch die waagerechte Komponente der Gravitationskraft einander angenähert. Zum anderen hat sich der Abstand zwischen T1 und T3 vergrößert. Dies ist darauf zurückzuführen, dass im Newton’schen Gravitationsfeld die Kraft zwar zeitlich, aber nicht räumlich konstant ist. Teilchen, die sich näher am Gravitationszentrum befinden (T3 ), erfahren eine stärkere gravitative Beschleunigung als Teilchen, die weiter entfernt sind (T1 ). Teilchen, die im Gravitationsfeld der Erde frei fallen, erfahren also Kräfte, die sie horizontal zusammendrücken und vertikal auseinanderziehen. Diese Kräfte werden Gezeitenkräfte genannt und sind diejenigen, die letztlich für Ebbe und Flut auf der Erde verantwortlich sind.
148
7 Gravitation und Raumzeitmodell
Abb. 7.4 Das Gravitationsfeld der Erde ist nicht homogen
Aufgabe 7.3 Berechnen Sie die Gezeitenkräfte, die auf zwei Massenpunkte A und B mit Abstand x = AB mit gleicher Masse m und gleichem Abstand r vom Erdmittelpunkt wirken.
Lösung Wir schauen uns einen Ausschnitt aus Abb. 7.4 an und berechnen die Gezeitenkräfte, die auf zwei Massenpunkte A und B wirken. Die beiden Teilchen A und B in Abb. 7.5 haben jeweils die Masse m und erfahren gleichgroße Gravitationskräfte: G Mm F A = FB = r2
7.5
Gravitation und Krümmung
149
Abb. 7.5 Gezeitenkräfte
Die Gezeitenkräfte zeigen jeweils von den Teilchen auf deren Mittelpunkt S und errechnen sich zu G Mm x G Mm , sin α = FAS = FB S = 2 r r 2 2r wobei x den Abstand von A zu B bezeichnet. Addition führt zu FGezeiten =
G Mm x, r3
wobei das 1/r 3 -Verhalten typisch für Gezeitenkräfte ist (siehe z. B. [8]).
Die Inhomogenitäten (unterschiedliche Richtungen, räumlich unterschiedliche Beschleunigungen) im Gravitationsfeld sorgen also dafür, dass sich Teilchen, die mit der gleichen Anfangsgeschwindigkeit frei fallen, nicht entlang paralleler Bahnen bewegen, was sie aber tun müssten, wenn sie sich in einem globalen Inertialsystem bewegen würden. Kann man die Inhomogenitäten vernachlässigen, so ist ein frei fallendes Bezugssystem ein Inertialsystem. Jedes Gravitationsfeld kann in einer „kleinen“ Raumzeitregion als homogen angenommen werden, sodass lokale Inertialsysteme konstruiert werden können. Lokale Inertialsysteme sind den momentanen Inertialsystemen von Fluiden ähnlich, hier ist das Bezugssystem nur in einer kleinen Region und für kurze Zeit inertial. Wie klein das Raumzeitgebiet bei
150
7 Gravitation und Raumzeitmodell
physikalischen Untersuchungen gewählt werden muss, hängt einerseits von der Stärke der Inhomogenitäten und andererseits von der Experimentsituation ab. Da jede Inhomogenität grundsätzlich aufspürbar ist, kann ein Bezugssystem mathematisch nur in einer verschwindend kleinen Region inertial sein, und eine Theorie der Gravitation muss lokale Inertialsysteme mit beinhalten. In der Speziellen Relativitätstheorie bleiben die Weltlinien zweier Teilchen immer parallel zueinander, wenn sie parallel gestartet sind. Das ist auch eine wichtige Eigenschaft der euklidischen Geometrie. Die Raumzeitgeometrie der Speziellen Relativitätstheorie ist zwar nicht euklidisch, denn die Metrik g = ημν der SRT ist von der euklidischen Metrik δμν verschieden. Trotzdem bleiben auch in der Raumzeitgeometrie der SRT parallel gestartete Teilchen parallel. Räume, die diese Eigenschaft haben, nennt man auch flach. Wir haben gesehen, dass in einem inhomogenen Gravitationsfeld die Weltlinien zweier Teilchen nicht parallel bleiben, auch wenn sie parallel gestartet sind, woraus folgt, dass die gravitative Raumzeit, was immer das sein mag, nicht flach sein kann. Lässt man in der euklidischen Geometrie das Parallelenaxiom fallen, so nennt man Räume, die mit solchen Geometrien charakterisiert werden können, gekrümmt. Zum Beispiel ist die Erdoberfläche gekrümmt. Wenn zwei Menschen am Äquator parallel zueinander Richtung Norden starten und immer geradeaus weiterlaufen, so treffen sie sich am Nordpol. Oder allgemeiner: Lokal gerade Linien auf einer Kugeloberfläche bilden aneinander geheftet sogenannte Großkreise, und Großkreise haben gemeinsame Schnittpunkte. Nichtsdestoweniger kann man behaupten, dass die Erdoberfläche lokal flach ist. Es führt zu keinen großen Verwerfungen (d. h. Verzerrungen der Entfernungen), wenn man einen Stadtplan auf ein flaches Stück Papier druckt, während der Versuch, die gesamte Erde „flach zu machen“, schiefgeht. Die Kugeloberfläche ist also lokal flach, aber die lokal geraden Linien, die man auch Geodäten (Großkreise auf einer Kugeloberfläche sind also Geodäten) nennt, bleiben im Allgemeinen nicht parallel. Einsteins großer Fortschritt bei der Entwicklung der Allgemeinen Relativitätstheorie war die Erkenntnis, dass die gravitative Theorie, die er aufstellen wollte, auf einer Geometrie basieren müsste, mit der man eine gekrümmte Raumzeit beschreiben kann. Er identifizierte die Weltlinien frei fallender Teilchen mit den Geodäten dieser gekrümmten Raumzeit. Die Weltlinien sind in den lokalen Inertialsystemen gerade Linien, aber global bleiben sie nicht parallel. Wir werden in den nächsten Abschnitten diesem Gedanken folgen und nach einer Theorie der Gravitation Ausschau halten, die eine gekrümmte Raumzeit unterstellt, um die Effekte der Gravitation auf die Weltlinien von Teilchen zu erläutern. Dazu müssen wir mehr über (die Mathematik von) Raumzeit und Krümmungen wissen. Der einfachste Weg dies zu erlernen, besteht darin, einige Begriffe und Konzepte über krummlinige Koordinatensysteme vom euklidischen Raum zu übernehmen und anschließend auf die vierdimensionale Raumzeit zu übertragen, was wir zunächst an einigen Beispielen demonstrieren wollen.
7.6
7.6
Allgemeine Koordinatensysteme
151
Allgemeine Koordinatensysteme
Wir beschäftigen uns in diesem Abschnitt mit beliebigen Nichtinertialsystemen in der Raumzeit der SRT. Die als Tensorgleichungen formulierten Gesetze der Speziellen Relativitätstheorie gelten zwar nur in Inertialsystemen, das heißt aber nicht, dass andere Bezugssysteme unzulässig sind. Beschleunigte Bezugssysteme in der SRT In der klassischen Mechanik verwendet man z. B. rotierende Bezugssysteme zur Beschreibung der Kreiselbewegungen, obwohl die Newton’schen Gesetze zunächst nur in Inertialsystemen gelten. In solchen Nichtinertialsystemen haben die Newton’schen Gesetze eine andere Form. Zum Beispiel treten durch die Transformation in ein rotierendes Bezugssystem in den Bewegungsgleichungen zusätzliche Terme wie Zentrifugal- oder Coriolis-Kräfte auf. Als Beispiel für ein beschleunigtes Bezugssystem betrachten wir ein Bezugssystem K , das gegenüber einem kartesischen Inertialsystem S gleichförmig rotiert. Eine einfache Form der Transformation zwischen den beiden Koordinatensystemen ist nach (1.38) gegeben durch t = t x = x cos(ωt) + y sin(ωt) y = −x sin(ωt) + y cos(ωt) z = z, wobei ω 1 die (konstante) Winkelgeschwindigkeit bezeichnet. Das Raumzeitintervall im Inertialsystem S lautet ds 2 = ημν d x μ d x ν = −dt 2 + d x 2 + dy 2 + dz 2 .
Aufgabe 7.4 Zeigen Sie, dass sich das Linienelement in K zu
∂xμ ∂xν μ ν = ω2 (x 2 + y 2 ) − 1 dt 2 + d x 2 dx dx μ ν ∂x ∂x + dy 2 + dz 2 − 2ωy dt d x + 2ωx dt dy
ds 2 = ημν
ergibt. Lösung Wir berechnen die Differenziale dt = dt
(7.13)
152
7 Gravitation und Raumzeitmodell
∂x ∂x ∂x ∂x dt + d x + dy + dz ∂t ∂x ∂y ∂z = ω −x sin(ωt ) − y cos(ωt ) dt + cos(ωt) d x − sin(ωt) dy dy = ω x cos(ωt ) − y sin(ωt ) dt + sin(ωt) d x + cos(ωt) dy
dx =
dz = dz . Quadrieren und Addieren ergibt nach einigen Detailrechnungen ds 2 = ω2 (x 2 + y 2 ) − 1 dt 2 + d x 2 + dy 2 + dz 2 − 2ωy dt d x + 2ωx dt dy ∂xμ ∂xν = ημν μ ν d x μ d x ν . ∂x ∂x Durch
∂xμ ∂xν (7.14) ∂xμ ∂xν wird der metrische Tensor im Bezugssystem K definiert. Im beschleunigten Bezugssystem hat das Raumzeitintervall also eine kompliziertere Gestalt, die Größen gμ ν sind zwar symmetrisch, aber ortsabhängig, und ⎞ ⎛ 2 2 ω x + y 2 − 1 −ωy ωx 0 ⎜ −ωy 1 0 0⎟ ⎟ gμ ν = ⎜ ⎝ ωx 0 1 0⎠ gμ ν := ημν
0
0
0 1
ist keine Diagonalmatrix. Im beschleunigten Bezugssystem treten Trägheitskräfte auf. So ergibt sich der Betrag der Zentripetalbeschleunigung zu azp
2 ωr v2 2 2 = = = ω r = ω x 2 + y 2 . r r
Die Zentrifugalbeschleunigung ist vom Betrag her gleich der Zentripetalbeschleunigung, sie wirkt allerdings nach außen, d. h. 2 x . azentri f ugal = ω y Setzt man φ=− so folgt für die Zentrifugalkraft
ω2 2 x + y 2 , 2
7.6
Allgemeine Koordinatensysteme
Z = −m∇φ = −m
153
∂φ ∂φ , ∂ x ∂ y
= −m −ω2 x , −ω2 y = m azentri f ugal .
Man kann φ also als Zentrifugalpotenzial betrachten und feststellen, dass g00 mit φ zusammenhängt: g00 = −(1 + 2φ) (7.15) Das Zentrifugalpotenzial taucht also in der Metrik auf. Wir werden später sehen, dass die ersten Ableitungen der Metrik die Kräfte in den relativistischen Bewegungsgleichungen bestimmen. Von daher kann man schon jetzt vermuten, dass die Gravitationsfelder durch die gμν beschrieben werden. Und da die Metrik auch die Raum-Zeit-Geometrie bestimmt, hängen Gravitation und Raum-Zeit-Geometrie zusammen. Erweitertes Äquivalenzprinzip Wir wollen noch einmal auf das Äquivalenzprinzip, also auf die Gleichheit von schwerer und träger Masse zurückkommen. Wenn schwere und träge Masse gleich sind, sind Gravitationskräfte gleichzeitig Trägheitskräfte. Das heißt, man kann homogene Gravitationsfelder durch einen Übergang in ein beschleunigtes Koordinatensystem eliminieren. Als einfaches Beispiel betrachten wir das als homogen angenommene Schwerefeld an der Erdoberfläche, in dem die Newton’sche Bewegungsgleichung für einen Massenpunkt m t r¨ = m s g gilt, wobei m t die träge Masse und m s die schwere Masse des Teilchens sowie g = (0,0 − g) die konstante Erdbeschleunigung bezeichnen. Wir betrachten folgende Transformation zu einem Bezugssystem S : t = t x = x y = y z = z −
1 2 gt 2
Aufgabe 7.5 Zeigen Sie, dass unter der Voraussetzung m t = m s das Bezugssystem S inertial ist.
154
7 Gravitation und Raumzeitmodell
Lösung Der Ursprung von S ( r = 0) bewegt sich aus Sicht des ruhenden Systems so, dass r =
1 2 gt 2
gilt. Setzen wir die Transformation in die Bewegungsgleichung ein, so erhalten wir ⎞ ⎞ ⎞ ⎛ ⎛ ⎞ ⎛ x¨ x¨ x¨ 0 m t r¨ = m t ⎝ y¨ ⎠ = m t ⎝ y¨ ⎠ = m t ⎝ y¨ ⎠ − m t ⎝ 0 ⎠ . z¨ − g z¨ −g z¨ ⎛
Für den ersten Term auf der rechten Seite gilt nach der Newton’schen Bewegungsgleichung ⎞ ⎛ ⎞ ⎛ x¨ 0 m t ⎝ y¨ ⎠ = m s ⎝ 0 ⎠ , z¨ −g sodass
⎞ ⎛ ⎞ ⎞ ⎞ ⎛ ⎛ 0 0 0 0 m t r¨ = m s ⎝ 0 ⎠ − m t ⎝ 0 ⎠ = (m s − m t ) ⎝ 0 ⎠ = ⎝ 0 ⎠ 0 −g −g −g ⎛
folgt, da m t = m s .
Die Gleichheit von träger und schwerer Masse ermöglicht also, ein Bezugssystem („frei fallend“) zu wählen, in dem die Gravitationskräfte wegfallen. In Abschn. 7.5 hatten wir schon dargestellt, dass in inhomogenen Gravitationsfeldern nur lokale Inertialsysteme existieren. Mit diesen Überlegungen können wir zusammenfassend das Äquivalenzprinzip präziser formulieren und vergeben dafür einen neuen Namen:
Starkes Äquivalenzprinzip: In lokalen Inertialsystemen laufen alle Vorgänge so ab, als ob kein Gravitationsfeld vorhanden wäre. In lokalen Inertialsystemen gelten die Gesetze der Speziellen Relativitätstheorie.
Das starke Äquivalenzprinzip erlaubt die Aufstellung von relativistischen Gesetzen mit Gravitation. Dazu geht man von bekannten Gesetzen in der Speziellen Relativitätstheorie aus und transformiert diese durch eine allgemeine Koordinatentransformation in ein anderes Bezugssystem, siehe [22]: In der Koordinatentransformation ist die relative Beschleunigung der beiden Bezugssysteme enthalten: Das auf der rechten Seite in Abb. 7.6 stehende Gesetz enthält das den Beschleunigungen entsprechende Gravitationsfeld. Lesen wir das obige Beispiel einmal rückwärts, so ist
7.6
Allgemeine Koordinatensysteme
155
Abb. 7.6 Von der SRT durch Koordinatentransformation zur ART
m r¨ = 0 das Gesetz im (frei fallenden) Inertialsystem, und wendet man die Koordinatentransformationen an, so erhält man m r¨ = m g, also die Bewegungsgleichung im Gravitationsfeld. Im allgemeinen Fall eines inhomogenen Gravitationsfeldes ist eine solche Koordinatentransformation allerdings nicht global, wie in diesem einfachen Beispiel, sondern nur lokal möglich.
8
Mannigfaltigkeiten
In Kap. 7 haben wir dargestellt, dass es bei Anwesenheit von Gravitationsfeldern keine globalen, sondern nur lokale Inertialsysteme in der vierdimensionalen Raumzeit geben kann. Die Raumzeit sieht also lokal wie ein Minkowski-Raum aus, wie sie global aussieht, hängt von der physikalischen Situation, d. h. von den vorhandenen Gravitationsfeldern an den verschiedenen Raumzeitpunkten ab. Das bedeutet, dass die Messungen von Zeiten und Abständen von Raumzeitpunkt zu Raumzeitpunkt unterschiedlich sein können, was in der Regel dazu führt, dass man an unterschiedlichen Raumzeitpunkten mit unterschiedlichen Koordinatensystemen rechnen muss. Und das Erfordernis, unterschiedliche Koordinatensysteme benutzen zu müssen, führt dazu, dass die Raumzeit selbst ein gekrümmter Raum ist. Das geeignete mathematische Objekt zur Beschreibung der Raumzeit ist eine sogenannte differenzierbare Mannigfaltigkeit, die mit einer besonderen metrischen Struktur ausgestattet wird, die das (starke) Äquivalenzprinzip enthält. Eine (vierdimensionale) Mannigfaltigkeit ist im Wesentlichen eine kontinuierliche Ansammlung von Punkten (ein „Raum“), die lokal wie der (vierdimensionale) euklidische Raum aussieht. Um diese Aussagen in ein mathematisches Konzept zu bringen, benötigen wir einige grundlegende Definitionen.
8.1
Topologische und differenzierbare Mannigfaltigkeiten
Wir unterstellen in den nachfolgenden Formeln – wenn nicht anders dargestellt – immer die Einstein’sche Summenkonvention (siehe Abschn. 2.1), d. h., über gleiche Indizes, die einmal oben und einmal unten stehen, wird summiert. Definition 8.1 Ein topologischer Raum ist ein Paar (M, T ) bestehend aus einer Menge M und einer Menge T von Teilmengen (offene Mengen genannt) von M, sodass folgende Aussagen gelten: © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_8
157
158
8 Mannigfaltigkeiten
1. Beliebige Vereinigungen von offenen Mengen sind offen. 2. Der Durchschnitt von zwei offenen Mengen ist offen. 3. ∅ und M sind offen.
T nennt man auch Topologie von (M, T ). 4. Eine Teilmenge B ⊂ T heißt Basis der Topologie, wenn sich jede offene Menge als Vereinigung von Mengen aus B darstellen lässt. 5. Ein topologischer Raum erfüllt das zweite Abzählbarkeitsaxiom, wenn er eine abzählbare Basis der Topologie besitzt. Definition 8.2 Sei (M, T ) ein topologischer Raum. 1. Eine Menge U ⊂ M heißt Umgebung eines Punktes p von M, wenn es eine offene Menge V mit p ∈ V ⊂ U gibt. 2. Einen topologischen Raum bezeichnet man als Hausdorff-Raum, wenn man zu je zwei verschiedenen Punkten aus M stets disjunkte Umgebungen finden kann. 3. Sei A ⊂ M, dann heißt ein Punkt p ∈ A innerer Punkt von A, falls es eine Umgebung U p ⊂ A gibt. Man nennt die Menge int (A) := { p ∈ A|x ist innerer Punkt von A} das Innere von A. 4. Eine Teilmenge A ⊂ M heißt abgeschlossen, falls M \ A offen ist. Man nennt die Menge cl (A) := A¯ := M \ int (M \ A) Abschluss (bzw. abgeschlossene Hülle) von A. 5. Die Menge ∂ A := cl (A) \ int (A) heißt Rand von A. Für jedes p ∈ ∂ A gilt, dass sich jede Umgebung von p mit A und auch mit M \ A schneidet.
Aufgabe 8.1 Zeigen Sie, dass der R4 ein topologischer Hausdorff-Raum mit abzählbarer Basis ist.
8.1 Topologische und differenzierbare Mannigfaltigkeiten
159
Lösung Wir definieren die (übliche) Topologie auf R4 als die Menge aller offenen vierdimensionalen Kugeln T = K (x, r ) , x ∈ R4 , r ∈ R>0 ∪ ∅ ∪ R4 mit K (x, r ) = y ∈ R4 : |y − x| < r , dann bilden die Kugeln
1 , q ∈ Q4 , n ∈ N ∪ ∅ ∪ R4 K q, n
1 eine abzählbare Basis von T . Sind p1 und n 4 Punkte im R mit dem Abstand d = | p1 − p2 | > 0, dann sind p2 zwei unterschiedliche d d und K p2 , zwei disjunkte Umgebungen der beiden Punkte, d. h., R4 ist K p1 , 4 4 ein topologischer Hausdorff-Raum mit abzählbarer Basis.
mit rationalem Mittelpunkt q und Radius
Funktionen zwischen topologischen Räumen Definition 8.3 1. Eine Funktion f : M1 → M2 zwischen zwei topologischen Räumen (M1 , T1 ) und (M2 , T2 ) heißt stetig, wenn das Urbild jeder offenen Menge wieder offen ist, d. h. V ∈ T2 ⇒ f −1 (V ) ∈ T1 . 2. Eine bijektive Abbildung, die in beiden Richtungen stetig ist, bezeichnet man als Homöomorphismus. 3. Unter einer (vierdimensionalen) Karte (auch Koordinatensystem genannt) verstehen wir ein Paar (U , h), wobei U ⊂ M eine offene Teilmenge und h : U → U ein Homöomorphismus auf eine offene Teilmenge U ⊂ R4 ist. Die Menge U nennt man auch ein zu p ∈ M gehöriges Kartengebiet. 4. Eine (vierdimensionale) topologische Mannigfaltigkeit M ist ein topologischer Hausdorff-Raum mit abzählbarer Basis, der lokal homöomorph zum R4 ist. Die letzte Eigenschaft bedeutet, dass es zu jedem Punkt p ∈ M eine Karte (U , h) gibt. 5. Eine Menge von Karten {(Uα , h α ) , α ∈ I } heißt (vierdimensionaler) Atlas von M, wenn die Kartengebiete ganz M überdecken, d. h., wenn Uα = M α∈I
gilt.
6. Zwei Karten (Uα , h α ) und Uβ , h β definieren auf dem Durchschnitt ihrer Gebiete Uαβ := Uα ∩ Uβ einen Homöomorphismus
160
8 Mannigfaltigkeiten
h αβ := h β ◦ h α −1 : h α Uαβ → h β Uαβ ,
(8.1)
der Kartenwechsel (bzw. Koordinatenwechsel) von h α nach h β genannt wird. Für den Punkt p in Abb. 8.1 gibt es zwei lokale Koordinatensysteme (Uα , h α ) und (Uβ , h β ), deren Überlappungsbereich der grau ausgefüllte Teilbereich von M ist. Die Abbildung h α bildet den Teilbereich Uα auf den linken Teilbereich des R4 ab, die Abbildung h β den Teilbereich Uβ auf den rechten Teilbereich des R4 . Die grau markierten Flächen im linken und rechten unteren Bereich sind jeweils die Bilder des Überlappungsbereichs, d. h.
Uα = h α Uαβ , Uβ = h 2 Uαβ . 7. Ist der Kartenwechsel sogar ein Diffeomorphismus (d. h. hier: beliebig oft stetig partiell differenzierbar, was wir auch glatt bzw. C ∞ nennen), so nennen wir ihn differenzierbar. 8. Ein Atlas heißt differenzierbar, wenn alle seine Karten differenzierbar miteinander wechseln.
Abb. 8.1 Kartenwechsel
8.1 Topologische und differenzierbare Mannigfaltigkeiten
161
9. Ein differenzierbarer Atlas A heißt maximal, wenn eine Karte, die mit jeder Karte aus A differenzierbar wechselt, schon in A enthalten ist. Jetzt haben wir alles zusammen und können eine differenzierbare Mannigfaltigkeit definieren. Definition 8.4 Eine (vierdimensionale) differenzierbare Mannigfaltigkeit ist ein Paar (M, A) bestehend aus einer vierdimensionalen topologischen Mannigfaltigkeit M und einem vierdimensionalen maximalen differenzierbaren Atlas A = {(Uα , h α ) , α ∈ I } von M. Für p ∈ Uα und
h α ( p) = x 0 ( p) , x 1 ( p) , x 2 ( p) , x 3 ( p) ∈ R4 bezeichnet man das Kartengebiet Uα auch als Koordinatenumgebung von p und die Zahlen x μ ( p) als lokale Koordinaten von p. Beispiel 8.1
1. Die einfachsten Beispiele für Mannigfaltigkeiten sind die euklidischen Räume und auch der Minkowski-Raum. Für diese Räume existiert zur Identifikation der Punkte jeweils eine einzige (globale) Karte, nämlich z. B. für die euklidische Ebene (U , h) = (R2 , id) und für den Minkowski-Raum analog (U , h) = (M, id), wobei die Funktion id die Identität ist. Da die Definition einer Mannigfaltigkeit einen maximalen Atlas unterstellt, müssen wir noch alle mit der Identität differenzierbar wechselnden Abbildungen als Karten hinzunehmen. In der Folge werden wir uns in Beispielen immer auf die Konstruktion eines einzigen Atlas beschränken und keine weiteren Untersuchungen auf Maximalität durchführen. 2. Stereografische Projektion: Die Oberfläche der Einheitskugel im R3 lässt sich durch S 2 = (x, y, z) ∈ R3 : x 2 + y 2 + z 2 = 1
(8.2)
darstellen. Die Punkte N = (0, 0, 1) bzw. S = (0, 0, −1) seien als Nord- bzw. Südpol bezeichnet. Auf S 2 sind zwei offene Mengen U1 = S 2 \ {N } , U2 = S 2 \ {S} definiert.
162
8 Mannigfaltigkeiten
Ist p = (x1 , y1 , z 1 ) ein Punkt aus U1 , so definiert dieser zusammen mit dem Nordpol die eindeutig bestimmte Gerade (x, y, z) = (0, 0, 1) + λ (x1 , y1 , z 1 − 1) . Für den Schnittpunkt dieser Geraden mit der Äquatorebene E = {(x, y, 0) , x, y ∈ R} ergibt sich 1 λ= , 1 − z1 woraus 1 h 1 ( p) = (x1 , y1 ) 1 − z1 folgt. Analog erhalten wir für ein p ∈ U2 : h 2 ( p) =
1 (x1 , y1 ) 1 + z1
Wir prüfen, ob h 2 ◦ h −1 1 auf dem Überlappungsbereich der beiden offenen Mengen eine differenzierbare Abbildung ist. Es gilt zunächst: h 1 (U1 ∩ U2 ) = R2 \ {(0, 0)} = h 2 (U1 ∩ U2 ) . Ist (u, v) ∈ R2 \ {(0, 0)}, so muss mit einem μ = 0 die Bedingung |(0, 0, 1) + μ ((u, v, 0) − (0, 0, 1))|2 = |(μu, μv, 1 − μ)|2 = 1 erfüllt sein, was zu μ= und damit zu
2 u 2 + v2 + 1
2v 2 2u , ,1 − 2 u 2 + v2 + 1 u 2 + v2 + 1 u + v2 + 1 2v u 2 + v2 − 1 2u , , = u 2 + v2 + 1 u 2 + v2 + 1 u 2 + v2 + 1
h −1 1 (u, v) =
führt. Beachten wir noch, dass 1 = 1 + z1 gilt, so erhalten wir
1 u 2 + v2 + 1
= 2 2 2 u + v2 +v −1 1+ 2 u + v2 + 1 u2
8.1 Topologische und differenzierbare Mannigfaltigkeiten
h 2 ◦ h −1 1 (u, v)
163
2u 2v , u 2 + v2 + 1 u 2 + v2 + 1 2v u 2 + v2 + 1 2u
, = 2 u 2 + v2 + 1 u 2 + v2 + 1 2 u + v2 v u , , = u 2 + v2 u 2 + v2 1 = 1 + z1
d. h. eine differenzierbare Abbildung. Die gewählten Koordinaten sind nicht die einzigen, die es für die Kugeloberfläche gibt, da gibt es sogar unendlich viele. Festzuhalten ist allerdings, dass man immer mindestens zwei lokale Koordinatensysteme braucht, um alle Punkte der Kugeloberfläche zu überdecken.
Aufgabe 8.2 Zeigen Sie, dass die Kreislinie
S 1 = (x, y) ∈ R2 : x 2 + y 2 = 1 ⊂ R2 eine differenzierbare Mannigfaltigkeit ist. Lösung Wir betrachten im R2 die Kreislinie des Einheitskreises mit Mittelpunkt im Ursprung: S 1 = (x, y) ∈ R2 : x 2 + y 2 = 1 In Polarkoordinaten gilt x = cos ϕ,
y = sin ϕ.
1 Die zwei Gleichungen liefern uns eine Abbildung h −1 α : (−π, π ) → S mit
h −1 α (ϕ) = (x (ϕ) , y (ϕ)) = (cos ϕ, sin ϕ) . Die Abbildung h −1 α ist injektiv mit dem Bildbereich 1 h −1 α (−π, π ) = S \ {(−1, 0)} = Uα .
Um zu einer Karte (Uα , h α ) für die Kugeloberfläche zu kommen, benötigen wir die Umkehrabbildung der Funktion h −1 α . Den Winkel ϕ erhalten wir durch die Arcus-Funktion: h α (x, y) = ϕ =
arccos x
y≥0
− arccos x y < 0
164
8 Mannigfaltigkeiten
Wir haben den Definitionsbereich von h α so eingeschränkt, dass der Punkt (−1, 0) nicht erreicht wird. Wir brauchen also ein weiteres Koordinatensystem, das diesen Punkt eindeutig mit abdeckt. Dieses zweite Koordinatensystem (Uβ , h β ) definieren wir durch h −1 β : 1 (0, 2π ) → S mit h −1 β (ϕ) = (x (ϕ) , y (ϕ)) = (cos ϕ, sin ϕ) . Die Abbildung h −1 β ist injektiv mit dem Bildbereich 1 h −1 β (0, 2π ) = S \ {1, 0} = Uβ ,
und analog erhalten wir h β (x, y) = ϕ = ar c(x, y) =
arccos x
y≥0
2π − arccos x y < 0
.
Wir haben also erreicht, dass die beiden offenen Mengen Uα und Uβ zusammen die gesamte Kreislinie abdecken. Die beiden Teilbereiche überlappen sich in allen Punkten ausgenommen die Punkte (1, 0) und (−1, 0). Die Abbildungen h α und h β sind invertierbar und stetig, also Homöomorphismen, und die Abbildung h β ◦ h −1 α : (0, 2π ) → (0, 2π ) ϕ ϕ ∈ (0, π ) ϕ ϕ ∈ (0, π ) = ϕ → ϕ ϕ ∈ (π, 2π ) 2π − ϕ ϕ ∈ (−π, 0) ist differenzierbar. Dass π nicht im Bild des Kartenwechsels auftaucht, ist darin begründet, dass der Punkt (−1, 0) nicht im Überlappungsbereich der beiden Karten liegt. Definition 8.5 Im Folgenden sei (M, A) eine vierdimensionale differenzierbare Mannigfaltigkeit. 1. Ist B eine offene Teilmenge von M, so ist B mit dem Atlas
A B := {(B ∩ U , h| B∩U ) | (U , h) ∈ A} eine vierdimensionale differenzierbare Mannigfaltigkeit, die offene Untermannigfaltigkeit genannt wird. 2. Ist B eine beliebige Teilmenge von M, dann heißt B n-dimensionale Untermannigfaltigkeit (n ∈ {1, 2, 3}), falls um jeden Punkt p ∈ B eine Karte (U , h) von M existiert,
sodass mit h ( p) = x 0 , x 1 , x 2 , x 3 h (B ∩ U ) = h (U ) ∩ x n = · · · = x 3 = 0
8.2
Differenzierbare Abbildungen
165
gilt. Jede n-dimensionale Untermannigfaltigkeit von M ist eine n-dimensionale Mannigfaltigkeit mit dem Atlas
A B := (B ∩ U , h| B∩U ) | (U , h) ∈ A mit h (B ∩ U ) = h (U ) ∩ x n = · · · = x 3 = 0 .
3. Ist (N , B ) eine weitere differenzierbare Mannigfaltigkeit, so definieren wir auf M × N einen Atlas durch
A M×N := {(U × V ) , h × k | (U , h) ∈ A, (V , k) ∈ B } . Damit ist (M × N , A M×N ) eine (dim M + dim N )-dimensionale differenzierbare Mannigfaltigkeit, die Produktmannigfaltigkeit genannt wird. Weitere Details zur Produkttopologie und zu den Kartenprodukten h × k findet man z. B. in [15]. Da wir es im Weiteren fast ausschließlich mit (vierdimensionalen) differenzierbaren Mannigfaltigkeiten zu tun haben, sprechen wir ab jetzt nur noch von Mannigfaltigkeiten und unterdrücken meistens auch die Nennung des maximalen Atlas. Wenn wir von einer Karte (U , h) sprechen, so soll sie immer aus dem maximalen Atlas stammen, falls nichts Gegenteiliges gesagt wird. Bei den Karten lassen wir zukünftig oftmals die Koordinatenumgebungen weg und nennen einfach h eine Karte bzw. ein Koordinatensystem.
8.2
Differenzierbare Abbildungen
Sei f : M → N eine stetige Abbildung zwischen zwei Mannigfaltigkeiten, p ∈ M und (V , k) eine Karte um f ( p). Ferner soll (U , h) eine Karte um p mit f (U ) ⊂ V sein (ist f stetig, so existiert ein solches U immer, siehe [15]). Dann ist die „heruntergeholte“ Abbildung k ◦ f ◦ h −1 : U → V eine Abbildung zwischen offenen Mengen in euklidischen Räumen, wie Abb. 8.2 zeigt. Die Abbildung k ◦ f ◦ h −1 nennt man auch Kartendarstellung oder Koordinatendarstellung von f . Hat die Koordinatendarstellung k ◦ f ◦ h −1 bestimmte Eigenschaften lokal um h ( p), so sagt man, f habe sie bezüglich der Karte (U , h). Ist eine solche Eigenschaft unabhängig von der Wahl der Karte, dann sagen wir, dass die Funktion f diese Eigenschaften bei p hat. Definition 8.6 Eine Abbildung f : M → N heißt bei p ∈ M differenzierbar, wenn für eine Karte (U , h) die Kartendarstellung k ◦ f ◦ h −1 in einer Umgebung von h ( p) differenzierbar ist. Die Menge aller glatten, d. h. beliebig oft stetig differenzierbaren Funktionen von M nach
166
8 Mannigfaltigkeiten
Abb. 8.2 Heruntergeholte Abbildung zwischen zwei Mannigfaltigkeiten
N schreiben wir als C ∞ (M, N ). Ist speziell N = R, so schreiben wir F (M) := C ∞ (M, R) = { f : M → R, f ist glatt} . Die Differenzierbarkeitseigenschaft ist kartenunabhängig, da bei einem Kartenwechsel lokal nur ein Diffeomorphismus vorgeschaltet wird. Definition 8.7 • Ist f bijektiv und glatt mit glatter Umkehrfunktion und sind die Kartendarstellungen ebenfalls bijektiv und glatt, so heißt f Diffeomorphismus, und die Mannigfaltigkeiten sind diffeomorph zueinander: M N .
8.2
Differenzierbare Abbildungen
167
• Kurven auf Mannigfaltigkeiten, beispielsweise Bahnkurven eines Teilchens, gehen als Abbildungen den umgekehrten Weg. Ist I ⊂ R ein offenes Intervall um null, so definieren wir eine Kurve γ als eine glatte Abbildung γ : I → M, d. h., für eine und somit alle Karten (U , h) ist die Abbildung h ◦ γ : I → h (U ) ⊂ R4 eine glatte Funktion. Für eine Kurve γ , die durch den Punkt p ∈ M verlaufen soll, verlangen wir meistens: γ (0) = p. Beispiel 8.2
Ist (M, A) eine Mannigfaltigkeit und (U , h) eine Karte. Dann ist h : U → U ⊂ R4 ein Diffeomorphismus. Denn nach Beispiel 8.5 ist U eine Mannigfaltigkeit mit Karte
(U , h) und U eine Mannigfaltigkeit mit Karte U , id . Die Kartendarstellung ist id ◦ h ◦ h −1 = id,
also glatt.
Wiederholung: Kettenregel im Rn In der Folge werden wir häufig auf die Standardkettenregel bei multivariaten vektorwertigen Funktionen zurückgreifen. Seien f : Rm → Rn , g : Rn → Rl zwei differenzierbare Funktionen, dann ist die Komposition g ◦ f : Rm → Rl differenzierbar mit d (g ◦ f ) ( x ) = dg ( f ( x )) ◦ d f ( x) , wobei d das (totale) Differenzial (siehe z. B. [9]) bezeichne. Für die korrespondierenden Jacobi-Matrizen J folgt entsprechend
J (g ◦ f ) ( x ) = Jg ( f ( x )) · J f ( x) .
168
8 Mannigfaltigkeiten
Schreibt man y i = f i (x1 , . . . , xm ) , i = 1, . . . , n z j = g j (y1 , . . . , yn ) , j = 1, . . . , l
mit den Komponentenfunktionen f = f 1 , . . . , f n und g = g 1 , . . . , gl , so lautet die Kettenregel ∂z j ∂ y k ∂z j = k i, (8.3) i ∂x ∂ y ∂x wobei die Summenkonvention beachtet werden muss. Die Formel (8.3) wird in der physikalischen Literatur üblicherweise durch ∂ ∂ yk ∂ = ∂xi ∂ x i ∂ yk
(8.4)
abgekürzt.
8.3
Tangentialraum
Wir wollen auf einer Mannigfaltigkeit physikalische Gesetze formulieren, die auch bei Wechsel des lokalen Koordinatensystems ihre Form nicht ändern. Die Schlüsselidee dazu besteht darin, jedem Punkt p der Mannigfaltigkeit M einen (vierdimensionalen) Vektorraum, den Tangentialraum T p M, zuzuordnen. Bemerkung 8.1 Zur Vorbereitung der Definition der Vektoren des Tangentialraumes schauen wir uns die Richtungsableitung ∂v f ( x ) einer glatten Funktion f : R3 → R in Richtung eines Vektors v ∈ R3 an der Stelle x an. Es gilt ∂v f ( x ) = ∇ f ( x ) · v. Man kann die Richtungsableitung bei festem v und festem x auch als eine Abbildung
F R3 → R (8.5) vx : x) f → vx ( f ) = ∂v f ( von der Menge der glatten Funktionen in die reellen Zahlen darstellen. Diese Abbildung vx
ist offensichtlich linear und erfüllt mit der Produktregel für zwei Funktionen f , g ∈ F R3 : vx ( f g) = vx ( f ) g ( x ) + f ( x ) vx (g)
(8.6)
8.3 Tangentialraum
169
Aufgabe 8.3 Zeigen Sie die Gültigkeit von (8.6).
Lösung Es gilt: vx ( f g) = ∇ ( f g) ( x ) · v = ∇ ( f ( x ) g ( x )) · v = (g ( x ) ∇ f ( x )) · v + ( f ( x ) ∇g ( x )) · v = g ( x ) (∇ f ( x ) · v) + f ( x ) (∇g ( x ) · v) = vx ( f ) g ( x ) + f ( x ) vx (g) Für beliebige Mannigfaltigkeiten M übertragen wir diese Eigenschaften sinngemäß. Definition 8.8 Seien f 1 , f 2 ∈ F (M) und c1 , c2 ∈ R. Ein Tangentialvektor V p im Punkt p ∈ M ist eine reellwertige Funktion V p : F (M) → R mit folgenden Eigenschaften: 1. V p ist linear: V p (c1 f 1 + c2 f 2 ) = c1 V p ( f 1 ) + c2 V p ( f 2 )
(8.7)
2. V p erfüllt die Leibniz-Regel (Produktregel): V p ( f 1 · f 2 ) = V p ( f 1 ) f 2 ( p) + f 1 ( p) V p ( f 2 )
(8.8)
Eine Abbildung mit den Eigenschaften 1. und 2. nennt man auch Derivation. 3. Der Tangentialraum T p M aller Tangentialvektoren in p ∈ M ist ein reeller (vierdimensionaler) Vektorraum. Die Addition und Multiplikation mit Skalaren wird mit f ∈ F (M) wie üblich punktweise durch
a) V p + U p ( f ) = V p ( f ) + U p ( f ) ,
b) cV p ( f ) = c V p ( f ) , c ∈ R definiert. Bemerkung 8.2 1. Falls f ∈ F (M) eine konstante Funktion ist, d. h. f ( p) = c ∈ R,
170
8 Mannigfaltigkeiten
so folgt V p ( f ) = V p (c) = 0.
(8.9)
Denn mit (8.8) und (8.7) folgt cV p (1) = V p (c1) = 1V p (c) + cV p (1) ⇒ V p (c) = 0. 2. Wir haben den Tangentialraum als Menge der Derivationen auf dem Funktionenraum F (M) definiert, vergleiche auch [13]. In der differenzialgeometrischen Literatur (siehe z. B. [15, 32]) findet man oftmals eine etwas differenziertere Darstellung, bei der Tangentialvektoren nicht auf glatte Funktionen, sondern auf sogenannte Keime glatter Funktionen wirken. Diese sind Äquivalenzklassen glatter Funktionen, die auf einer (kleinen) Umgebung von p übereinstimmen. Wir verzichten hier auf diese Feinheiten und halten damit die - ohnehin abstrakten - Notationen etwas einfacher. 3. Die Definition des Tangentialraumes als Menge von Derivationen (auch algebraische Definition genannt) ist nur eine von drei äquivalenten Möglichkeiten. Daneben gibt es noch die sogenannten geometrischen und physikalischen Versionen, siehe z. B. [15, 32]. a) Bei der geometrischen Sichtweise betrachtet man alle glatten Kurven γ : I → M, die bei t = 0 durch p gehen, und nennt zwei solcher Kurven γ , δ äquivalent, wenn für eine Umgebung (U , h) (h ◦ γ ) (0) = (h ◦ δ) (0) gilt. Ein Tangentialvektor in p ∈ M ist dann eine Äquivalenzklasse γ von Kurven durch p. b) Die physikalische Definition geht von der Menge aller Karten K p = {(U , h) ∈ A | p ∈ U } um den Punkt p aus. Ein Tangentialvektor in p ist dann eine Abbildung V p : K p → R4
mit der Eigenschaft, dass für zwei Karten (Uα , h α ) , Uβ , h β ∈ K p die zugeordneten Vektoren im R4 durch das Differenzial des Kartenwechsels h αβ (8.1) im Punkt h α ( p) auseinander hervorgehen:
V p Uβ , h β = dh αβ h ( p) V p (Uα , h α ) (8.10) α
8.3 Tangentialraum
171
Differenzial einer Funktion auf Mannigfaltigkeiten Ist φ : M → N eine glatte Abbildung zwischen den Mannigfaltigkeiten M, N und f ∈ F (N ), so wird durch φ ∗ : F (N ) → F (M) mit
φ∗ ( f ) = f ◦ φ
(8.11)
eine Abbildung definiert. Diese Abbildung nennt man auch Pullback von f durch φ. Abb. 8.3 zeigt, dass die Bezeichnung sinnvoll ist. Die Funktion f wird durch φ von N auf M „zurückgezogen“. Definition 8.9 1. Mithilfe des Pullbacks definieren wir das Differenzial von φ in p durch dφ p : T p M → Tφ( p) N mit
dφ p V p = V p ◦ φ ∗ ,
(8.12)
dφ p V p ( f ) = V p φ ∗ ( f ) = V p ( f ◦ φ) .
(8.13)
d. h., für f ∈ F (N ) gilt
Das Differenzial ist offensichtlich eine lineare Abbildung zwischen den Vektorräumen T p M und Tφ( p) N . 2. Ist dφ p : T p M → Tφ( p) N eine injektive Abbildung für alle p ∈ M, so nennt man φ Immersion. Ist dφ p surjektiv, so nennt man φ Submersion. 3. Ist φ eine injektive Immersion und φ : M → φ (M) ⊂ N ein Homöorphismus bzgl. der auf φ (M) durch N induzierten Topologie, so nennt man φ Einbettung.
Abb. 8.3 Pullback einer Funktion
172
8 Mannigfaltigkeiten
Aufgabe 8.4 Beweisen Sie die Kettenregel für Differenziale:
d (ψ ◦ φ) p = dψφ( p) ◦ dφ p
(8.14)
Lösung Es gilt für zwei glatte Funktionen M → N → O und f ∈ F (O): φ
ψ
φ ∗ ψ ∗ ( f ) = ψ ∗ ( f ) ◦ φ = f ◦ ψ ◦ φ = (ψ ◦ φ)∗ ( f ) , also
(ψ ◦ φ)∗ = φ ∗ ◦ ψ ∗
und damit
d (ψ ◦ φ) p V p = V p ◦ (ψ ◦ φ)∗ = V p ◦ φ ∗ ◦ ψ ∗ = dφ p V p ◦ ψ ∗
= dψφ( p) dφ p V p = dψφ( p) ◦ dφ p V p , und wir erhalten die Kettenregel für Differenziale.
Bemerkung 8.3 1. Das Differenzial der Identität I ist die Identität. Denn mit I : M → M folgt für f ∈ F (M):
I ∗ ( f ) = f ⇒ d I p V p ( f ) = V p I ∗ ( f ) = V p ( f ) ⇒ d I p V p = V p ⇒ d I p = IT p M
2. Ist φ : M → N eine injektive Immersion und M kompakt, so ist φ eine Einbettung. 3. Ist φ : M → N ein Diffeomorphismus, so ist dφ p : T p M → Tφ( p) N ein Isomorphismus zwischen den Vektorräumen T p M und Tφ( p) N . Denn es gilt mit der Kettenregel (8.14)
−1 IT p M = d φ −1 ◦ φ = dφφ( p) ◦ dφ p und
8.4
−1 ITφ( p) N = d φ ◦ φ −1 = dφ p ◦ dφφ( p) .
Basis des Tangentialraumes
Wir wollen den Tangentialraum T p M mit einer Basis ausstatten und uns zunächst damit beschäftigen, wie man den Tangentialraum T p R4 mit dem Vektorraum R4 identifizieren kann. Für jedes p ∈ R4 gibt es einen kanonischen Isomorphismus
8.4
Basis des Tangentialraumes
173
Φ p : R4 → T p R4 zwischen beiden Vektorräumen, der einem beliebigen Vektor v ∈ R4 durch die Vorschrift
F R4 → R (8.15) v) : Φ p ( f → ∇ f ( p) · v einen Tangentialvektor Φ p ( v ) aus T p R4 zuordnet, siehe [15] bzw. für einen Beweis dieser Aussage [32]. In unserer einführenden Bemerkung 8.1 haben wir schon gezeigt, dass dadurch eine Derivation definiert wird. Alternativ kann man Φ p ( v ) auch durch folgende Vorschrift definieren, die etwas näher an der geometrischen Definition eines Tangentialraums ist: d f ( p + t v) , (8.16) v) ( f ) = Φ p ( dt t=0 siehe [15].
Aufgabe 8.5 Zeigen Sie, dass die beiden Definitionen (8.15) und (8.16) äquivalent sind.
Lösung Die beiden Definitionen sind äquivalent, da mit der Kettenregel
∂f ∂ f ( p) μ d d μ f ( p + t v) p + tv μ = μ = v = ∇ f ( p) · v dt ∂ x ( p+t v)|t=0 dt ∂xμ t=0 t=0 folgt.
Für die vier euklidischen Basisvektoren eμ ∈ R4 folgt mit einer beliebigen Funktion f ∈
F R4
∂ ∂ Φ p eμ ( f ) = ∇ f · eμ = μ ( f ) ⇒ Φ p eμ = μ , ∂x ∂x d. h., da der Vektorraumisomorphismus Φ p Basen auf Basen abbildet, dass die vier Vektoren ∂ ∂ ∂ ∂ ∂ = , , , ∂xμ ∂x0 ∂x1 ∂x2 ∂x3 eine Basis von T p R4 bilden. Wir betrachten nun eine Karte (U , h) um einen beliebigen Punkt p ∈ M. Wir wissen, dass h : U → U ⊂ R4 ein Diffeomorphismus ist und dass nach Bemerkung 8.3 das Differenzial 4 dh −1 h( p) : T p R → T p M ein Isomorphismus ist, der Basen auf Basen abbildet. Die vier Vektoren
174
8 Mannigfaltigkeiten
dh −1 h( p)
∂ ∂xμ
bilden also eine Basis von T p M, womit explizit gezeigt ist, dass T p M wirklich ein vierdimensionaler Vektorraum ist. Wir schreiben die vier gefundenen Basisvektoren von T p M als ∂μ p (bzw., wenn der Punkt p bekannt oder nicht relevant ist, kurz als ∂μ ), d. h., es gilt für f ∈ F (M) ∂μ ( f ) := ∂μ p ( f ) := dh −1 h( p)
∂ ∂xμ
∂ ∂xμ
(f) =
h −1
∗ h( p)
(f) =
∂ −1 f ◦ h . ∂xμ h( p)
(8.17)
Die Basis ∂μ von T p M wird auch Koordinatenbasis genannt, da sie vom Koordinatensystem h ( p) = x μ abhängt. Wie aus der Linearen Algebra bekannt, können wir also jeden Tangentialvektor als Linearkombination der Basisvektoren darstellen: V p = V pμ ∂μ μ
mit reellen Zahlen V p , die man auch Komponenten des Tangentialvektors V p nennt. Bemerkung 8.4 Ein Wort zu der von uns gewählten Notation. In vielen physikalischen Fachbüchern (z. B. [13, 32]) schreibt man die Basisvektoren des Tangentialraumes T p M auch als ∂/∂ x μ und wählt damit eine Schreibweise, die nicht zwischen der partiellen Ableitung im R4 und den Basisvektoren unterscheidet. Der Grund dafür liegt darin, dass man die Komponentenfunktionen h = h μ einer Karte (U , h) um p ∈ U oftmals wie die Koordinaten im R4 schreibt, d. h. h ( p) = h 0 ( p) , h 1 ( p) , h 2 ( p) , h 3 ( p) = x 0 ( p) , x 1 ( p) , x 2 ( p) , x 3 ( p) = x 0 , x 1 , x 2 , x 3 .
Man macht also keinen Unterschied zwischen den Koordinaten x μ und den Koordinatenfunktionen: hμ = x μ : U → R und muss jeweils aus dem Zusammenhang schließen, welches Objekt mit ∂/∂ x μ bzw. ∂μ gemeint ist. Wir unterscheiden in diesem mathematisch geprägten Teil auch optisch zwischen partiellen Ableitungen und Tangentialbasisvektoren und schreiben Erstere als ∂/∂ x μ und Letztere als ∂μ . Transformation der Basisvektoren Ist h ein weiteres Koordinatensystem um p ∈ M mit h ( p) = x μ , so folgt ∂μ ( f ) =
∂
∂xμ
und mit der Kettenregel (8.3) ergibt sich
f ◦h
−1
h ( p)
,
8.5 Vektorfelder
175
∂μ ( f ) = = =
∂ ∂xμ
f ◦h
∂ μ
∂x ∂ ∂xμ
−1
f ◦ h −1
h ◦ h −1
∂
=
∂xμ
h( p)
h ( p)
μ h( p)
·
∂ ∂xμ
f ◦ h −1 ◦ h ◦ h −1 h( p)
h ◦ h −1
μ h( p)
· ∂μ ( f ) .
(8.18)
Zwei unterschiedliche Koordinatenbasen um p transformieren sich also über die JacobiMatrix des Koordinatenwechsels: ∂ ∂xμ
μ −1 μ J μ := μ h ◦ h h( p) = ∂x ∂xμ Wir können also kurz schreiben:
∂μ = mit der Umkehrmatrix
∂xμ
∂xμ
∂xμ
∂μ ⇔ ∂μ =
∂xμ
∂xμ
∂μ
(8.19)
. Damit erhalten wir das gleiche Transformationsverhalten ∂xμ wie bei den Basisvektoren in der Speziellen Relativitätstheorie, dort war
eμ = μμ eμ , siehe (2.9). Allerdings ist die Transformationsformel (8.18) allgemeiner, da sie für beliebige glatte Koordinatentransformationen gilt und nicht nur für lineare, wie die Lorentzμ Transformation ν . Für die Vektorkomponenten folgt mit (8.18):
V p = V pμ ∂μ = V pμ ∂μ = V pμ und daraus die Beziehung V pμ
∂xμ
∂xμ
∂μ
(8.20)
∂xμ
V μ, (8.21) ∂xμ p da die ∂μ beliebig gewählt werden können. Die Vektorkomponenten transformieren sich also mit der inversen Jacobi-Matrix im Vergleich zu den Basisvektoren.
8.5
=
Vektorfelder
Anders als in der Speziellen Relativitätstheorie gilt die Darstellung V p = V pμ ∂μ
176
8 Mannigfaltigkeiten
nur lokal, d. h. nur im Tangentialraum um p. Wählen wir einen anderen Punkt q aus der Mannigfaltigkeit M, so können wir dort wiederum einen Tangentialraum Tq M konstruieren, diesen aber nicht mit T p M gleichsetzen. Das führt zu folgender Definition. Definition 8.10 1. Ein Vektorfeld V auf einer Mannigfaltigkeit M ist eine Abbildung M → TM V : p → V p mit T M := T p M : p ∈ M , die jedem Punkt p ∈ M einen Tangentialvektor V p im korrespondierenden Tangentialraum T p M zuordnet. In der Koordinatendarstellung V ( p) = V μ ( p) ∂μ sind die Komponenten V μ ( p) glatte Funktionen. Wir unterscheiden aber zukünftig meistens nicht mehr zwischen V und V p , sondern benutzen überwiegend V auch als Bezeichnung für einen Tangentialvektor. Ebenso nennen wir Vektorfelder häufig kurz (Tangential-)Vektoren. 2. Man nennt für f ∈ F (M) die Abbildung V f : M → R definiert durch V f ( p) := V p ( f ) (Richtungs-)Ableitung von f nach dem Vektorfeld V . An der Koordinatendarstellung V f ( p) = V μ ( p) ∂μ f ( p)
(8.22)
erkennen wir, dass V f ebenfalls eine glatte Funktion ist. 3. Die Menge aller Vektorfelder bezeichnen wir mit T10 (M) (siehe unten Definition 9.2). Vektorfelder kann man sich als Strömungsfelder von idealen Flüssigkeiten vorstellen. In jedem Punkt des betrachteten Raumes zeichnen sie einen lokalen Vektor aus. Bewegt man sich in der Flüssigkeit, so ändert sich das Vektorfeld stetig und differenzierbar. Wir schauen uns ein Beispiel an. Beispiel 8.3
M sei die Mannigfaltigkeit R2 . Wir definieren U := R2 \ {(t, 0) , t ≥ 0} , U := (0, ∞) × (0, 2π )
8.5 Vektorfelder
und die Karte h durch
177
h −1 (r , ϕ) = (r cos ϕ, r sin ϕ)
(vergleiche Beispiel 8.1). Wir betrachten das auf U definierte Vektorfeld V = r ∂r ⇒ V r (r , ϕ) = r , V ϕ (r , ϕ) = 0 in Polarkoordinaten. In kartesischen Koordinaten erhalten wir: ∂x ∂ ∂y ∂ r ∂r = r + ∂r ∂ x ∂r ∂ y ∂ (r cos ϕ) ∂ ∂ (r sin ϕ) ∂ =r + ∂r ∂x ∂r ∂y ∂ ∂ = r cos ϕ + sin ϕ ∂x ∂y ∂ ∂ +y =x ∂x ∂y Also folgt: V x (x, y) = x, V y (x, y) = y In Abb. 8.4 wird das Vektorfeld V = r ∂r als Strömungsfeld dargestellt.
Abb. 8.4 Vektorfeld r ∂r
178
8 Mannigfaltigkeiten
Aufgabe 8.6 Stellen Sie analog zu Beispiel 8.3 das Vektorfeld V = ∂ϕ grafisch dar.
Lösung Für das Vektorfeld gilt V = ∂ϕ ⇒ V r (r , ϕ) = 0, V ϕ (r , ϕ) = 1 in Polarkoordinaten. In kartesischen Koordinaten erhalten wir: ∂ (r sin ϕ) ∂ ∂ (r cos ϕ) ∂ + ∂r ∂x ∂r ∂y ∂ ∂ = −r sin ϕ + r cos ϕ ∂x ∂y ∂ ∂ = −y +x ∂x ∂y
∂ϕ =
Also folgt: V x (x, y) = −y, V y (x, y) = x sowie die grafische Darstellung von V = ∂ϕ in Abb. 8.5.
Abb. 8.5 Vektorfeld ∂ϕ
8.5 Vektorfelder
179
Kommutator zweier Vektorfelder Definition 8.11 Sind V , X ∈ T10 (M) zwei Vektorfelder, dann wird der Kommutator oder die LieKlammer durch [V , X ] ( f ) =: V (X f ) − X (V f ) für alle f ∈ F (M) definiert.
Aufgabe 8.7 Zeigen Sie , dass der Kommutator selbst wieder ein Vektorfeld ist, also insbesondere die Leibniz-Regel
[V , X ] ( f g) = [V , X ] ( f ) g + f [V , X ] (g) ,
(8.23)
erfüllt. Lösung Die Linearität (8.7) folgt sofort durch Einsetzen. Die Leibniz-Regel (8.8) sieht man folgendermaßen ein: [V , X ] ( f g) = V (X ( f g)) − X (V ( f g)) = V ((X f ) g + f (Xg)) − X ((V f ) g + f (V g)) = V (X f ) g + (X f ) (V g) + (V f ) (Xg) + f V (Xg) − {X (V f ) g + (V f ) (Xg) + (X f ) (V g) + f X (V g)} = V (X f ) g − X (V f ) g + f V (Xg) − f X (V g) = [V , X ] ( f ) g + f [V , X ] (g) , da die gemischten Terme sich gegenseitig aufheben. Die Berechnung zeigt auch, dass das Produkt zweier Vektorfelder im Allgemeinen kein Vektorfeld ist.
180
8 Mannigfaltigkeiten
Bemerkung 8.5 Für V , X , Y ∈ T10 (M) und f , g, h ∈ F (M) gelten folgende Aussagen: 1. [X , Y ] = − [Y , X ] (Schiefsymmetrie). 2. Mit der Leibniz-Regel für Vektorfelder (8.8) folgt [ f V , g X ] h = f V (g X h) − g X ( f V h) = f (V g) (X h) + f gV (X h) − g (X f ) (V h) − g f X (V h) = f g [V , X ] h + f (V g) X h − g (X f ) V h, also [ f V , g X ] = f g [V , X ] + f (V g) X − g (X f ) V . 3. Ist (U , h) eine Umgebung von p ∈ M und f ∈ F (M), dann folgt für die Basisvektoren
∂μ , ∂ν ( f ) = ∂μ (∂ν ( f )) − ∂ν ∂μ ( f )
∂ ∂ ∂ ∂ −1 −1 f ◦h f ◦h − ν = μ ∂x ∂xν ∂x ∂xμ h( p) h( p)
∂ ∂ ∂ ∂ f ◦ h −1 − ν μ (8.24) = ∂xμ ∂xν ∂x ∂x h( p) = 0,
da die zweiten Ableitungen nach dem Satz von Schwarz kommutieren. 4. In der Koordinatendarstellung V = V μ ∂μ und X = X ν ∂ν gilt
[V , X ] = V μ ∂μ , X ν ∂ν = V μ ∂μ X ν ∂ν − X ν ∂ν V μ ∂μ
= V μ ∂μ X ν ∂ν + X ν ∂μ ∂ν − X ν ∂ν V μ ∂μ + V μ ∂ν ∂μ
= V μ ∂ μ X ν ∂ ν − X ν ∂ ν V μ ∂ μ + V μ X ν ∂ μ , ∂ν
= V μ ∂μ X ν − X μ ∂μ V ν ∂ν ,
=0
(8.25)
wobei wir in der letzten Gleichung die Indizes vertauscht haben.
Aufgabe 8.8 Zeigen Sie die sogenannte Jacobi-Identität:
[[V , X ] , Y ] + [[Y , V ] , X ] + [[X , Y ] , V ] = 0
(8.26)
8.5 Vektorfelder
181
Lösung Wir berechnen [[V , X ] , Y ] + [[Y , V ] , X ] + [[X , Y ] , V ] = [V X − X V , Y ] + [Y V − V Y , X ] + [X Y − Y X , V ] = V XY − XV Y − Y V X + Y XV + Y V X − V Y X − XY V + XV Y + XY V − Y XV − V XY + V Y X = 0.
9
Tensorrechnung auf Mannigfaltigkeiten
Viele der physikalischen Größen in der Allgemeinen Relativitätstheorie lassen sich nicht als Vektorfelder darstellen, sondern sind kompliziertere Objekte, für deren Beschreibung wir die in Kap. 4 eingeführte Tensorrechnung im Minkowski-Raum auf differenzierbare Mannigfaltigkeiten verallgemeinern müssen. Dabei übernehmen wir zwar die generelle Vorgehensweise aus Kap. 4, schreiben aber in diesem Kapitel die (manchmal ähnlichen) Ergebnisse zum Teil detaillierter und ausführlicher auf. Daher ist Kap. 4 ein guter und einfacher Einstieg in die hier behandelte Tensorrechnung auf Mannigfaltigkeiten.
9.1
Einsformen
Definition 9.1 1. Am Punkt p einer differenzierbaren Mannigfaltigkeit M definieren wir den Dualraum T p∗ M als die Menge der linearen Abbildungen des Tangentialraumes T p M in die reellen Zahlen: T p∗ M := ω p : T p M → R, ω p linear T p∗ M ist mit der Addition und Multiplikation mit einem Skalar:
α p + β p V p := α p V p + β p V p λα p V p := λ α p V p
selbst wieder ein vierdimensionaler Vektorraum (siehe z. B. [11]). 2. Die Elemente von T p∗ M, die wir überwiegend mit kleinen, meist griechischen Buchstaben schreiben, heißen Einsformen, Linearformen oder auch Kovektoren. 3. Wie bei der Definition der Vektorfelder verstehen wir unter einem Einsformfeld eine Abbildung
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_9
183
184
9 Tensorrechnung auf Mannigfaltigkeiten
ω:
M → T ∗M p
→ ω p
(9.1)
mit T ∗ M = T p∗ M, p ∈ M , unterscheiden aber zukünftig meistens nicht mehr zwischen ω und ω p , sondern benutzen überwiegend ω auch als Bezeichnung für eine Einsform. Ebenso nennen wir Einsformfelder häufig kurz Einsformen. Die Menge der Einsformfelder bezeichnen wir mit T01 (M) (siehe unten Definition 9.2). Beispiel 9.1
Ähnlich wie in (8.22) definieren wir das Differenzial einer glatten Funktion f ∈ F (M) durch Tp M → R , (9.2) df : → d f V p := V p ( f ) Vp d. h. d f ∈ T p∗ M. In lokalen Koordinaten h = x μ ( p) erhalten wir d f V p = V pμ ∂μ ( f ) .
(9.3)
Duale Basis Ist A = (e0 , e1 , e2 , e3 ) eine beliebige Basis von T p M, so wird durch eμ (eν ) = δ μν
(9.4)
eine Basis A∗ = e0 , e1 , e2 , e2 von T p∗ M definiert, die man duale Basis zu A nennt. Die duale Basis A∗ hängt also von der Auswahl der Basis A ab. Wenn wir im obigen Beispiel 9.1 für f die Koordinatenfunktionen, f ( p) = x μ ( p) , und für V p die Basistangentialvektoren ∂μ wählen, so ergibt sich mit (8.17) ∂ 1 d x μ (∂ν ) = ∂ν x μ = ν x μ ◦ h −1 h( p) = ν x μ p = δ μν , ∂x ∂x
d. h., die vier Einsformen (d x μ ) bilden die duale Basis zur Koordinatenbasis ∂μ . Nach Wahl einer Koordinatenumgebung von p ∈ M lässt sich also jede Einsform ω eindeutig als Linearkombination der Basiseinsformen schreiben: ω = ωμ ( p) d x μ
(9.5)
9.1
Einsformen
185
Setzen wir einen Basisvektor ∂μ in (9.5) ein, so erhalten wir die Einsformkomponentenfunktionen ωμ ( p) = ω ∂μ . Diese sollen immer glatt von p abhängen. Die Wirkung einer Einsform ω auf ein Vektorfeld V errechnet sich durch ω (V ) = ωμ ( p) d x μ V pν ∂ν = ωμ ( p) V pν d x μ (∂ν ) = ωμ ( p) V pν δ μν = ωμ ( p) V pμ . (9.6) Diese Wirkung einer Einsform auf einen Tangentialvektor nennt man auch Kontraktion, und wir werden weiter unten in Abschn. 9.3 sehen, dass die Ergebnisse von Kontraktionen unabhängig von der Wahl des Koordinatensystems sind. Transformationsregeln
für Einsformen Sind (U , h = x μ ) und U , h = x μ zwei Karten um p ∈ M, so folgt mit (8.18) μ
d x (∂ν ) = d x
μ
∂xν ∂x
ν
∂ν
=
∂xμ ∂xν μ ∂xν μ ∂ δ = d x = ν . ∂xν ∂xν ν ∂xν
(9.7)
Andererseits lässt sich jede Basiseinsform d x μ als Linearkombination der Basiseinsformen d x μ schreiben: μ d x μ = T μ d x μ , (9.8) mit einer (unbekannten) Matrix T . Setzt man in (9.8) den Basisvektor ∂ν ein, so ergibt sich d x μ (∂ν ) = T
μ μ
d x μ (∂ν ) = T
μ μ μ δν
=T
μ ν .
Vergleicht man diese Gleichung mit (9.7), so ergibt sich die Transformationsformel für die Basiseinsformen: ∂xμ ∂xμ d x μ = ν d x ν ⇔ d x μ = dxν (9.9) ∂xν ∂x Die Basiseinsformen transformieren sich also genauso wie die Komponenten der Tangentialvektoren. Mit (9.9) folgt analog:
ω = ωμ d x μ = ωμ d x μ = ωμ
ωμ =
∂xμ
∂xμ
ωμ ⇔ ωμ =
∂xμ
∂xμ
∂xμ
∂xν
dxν ⇒
ωμ ,
d. h., die Komponenten der Einsformen transformieren sich wie die Basisvektoren.
(9.10)
186
9 Tensorrechnung auf Mannigfaltigkeiten
Bidualraum Manchmal ist es günstiger, mit Einsformen statt mit Vektoren zu rechnen. Es gibt aber eine Möglichkeit, einen Vektor als eine Einsform aufzufassen. Dazu sei durch T p M ∗∗ = V : T p M ∗ → R, V linear der Bidualraum von M definiert. Dann ist durch die Abbildung T p M → T p M ∗∗ Φ: Vp → ΦV p mit
ΦV p (ω) := Φ V p (ω) = ω V p
ein Isomorphismus zwischen T p M und T p M ∗∗ gegeben. Man kann also einen Vektor als Einsform auf dem Dualraum T p M ∗ auffassen und schreibt oftmals kurz V p (ω) = ω V p .
9.2
(9.11)
Tensorfelder
Definition 9.2 1. Unter einem Tensor vom Rang (r , s) verstehen wir eine multilineare Abbildung:
Tsr
p
: T p∗ M × · · · × T p∗ M × T p M × · · · × T p M → R
s mal
r mal
Die Menge aller Tensoren vom Rang (r , s) ⎧ ⎪ ⎨
⎫ ⎪ ⎬ Trs (M) p := Ts p : T p∗ M × · · · × T p∗ M × T p M × · · · × T p M → R, Tsr p multilinear ⎪ ⎪
⎩ ⎭ r
r mal
s mal
ist mit der Addition und Multiplikation mit einem Skalar:
Tsr p + Rsr p (α1 , . . . , αr , V1 , . . . , Vs ) := Tsr p (α1 , . . . , αr , V1 , . . . , Vs ) + Rsr p (α1 , . . . , αr , V1 , . . . , Vs )
λ Tsr p (α1 , . . . , αr , V1 , . . . , Vs ) := λ Tsr p (α1 , . . . , αr , V1 , . . . , Vs ) selbst wieder ein 4r +s -dimensionaler Vektorraum (siehe z. B. [4, 11]). 2. Ähnlich wie bei der Definition der Einsformfelder (9.1) verstehen wir unter einem Tensorfeld vom Rang (r , s) eine Abbildung
9.2 Tensorfelder
187
Tsr
:
M → Trs (M) p → Tsr p
mit Trs (M) = Trs (M) p , p ∈ M , unterscheiden aber zukünftig meistens nicht mehr zwischen Tsr und Tsr p , sondern benutzen überwiegend Tsr auch als Bezeichnung für einen Tensor vom Rang (r , s). Ebenso nennen wir Tensorfelder häufig kurz Tensoren. Die Menge der Tensorfelder bezeichnen wir mit Trs (M). 3. Eine auf M definierte glatte skalare Funktion φ : M → R wird als ein Tensor vom Rang (0, 0) definiert, da sie keine Vektoren oder Einsformen als Argumente besitzt. Damit gilt auch T00 (M) = F (M) . 4. Die Elemente von Tr0 (M) nennt man kontravariante Tensoren vom Rang r . Ein Tangentialvektor ist nach (9.11) ein Tensor vom Rang (1, 0), daher ist auch die Bezeichnung T10 (M) für die Menge der Tangentialvektoren sinnvoll. 5. Die Elemente von T0s (M) nennt man kovariante Tensoren vom Rang s. Eine Einsform ist nach der obigen Definition ein Tensor vom Rang (0, 1), woher auch die Bezeichnung T01 (M) für die Menge der Einsformen herrührt. Koordinatendarstellungen Lokale Koordinatenausdrücke von Tensoren erhält man, wenn man diese auf Basiseinsformen und Basis-Tangentialvektoren in einer Karte (U , h) um p ∈ M auswertet. Für einen Tensor vom Rang (r , s) ergeben sich die Komponentenfunktionen: μ μr 1 ...μr p) := T r 1 Tνμ1 ...ν ( s p d x , . . . , d x , ∂ν1 , . . . , ∂νs , s wobei die Indizes μi , ν j ; i = 1, . . . , r ; j = 1, . . . , s jeweils die Werte 0, 1, 2, 3 annehμ1 ...μr men können. Die Komponenten Tν1 ...ν s ( p) sollen stets glatt von p abhängen. Sie werden (ergänzt um Transformationsregeln bei Koordinatenwechsel) in der „traditionellen“ Tensorrechnung, deren Darstellungen ausschließlich koordinatenbasiert sind, als Tensoren bezeichnet. Der Grund dafür liegt darin, dass man ähnlich wie bei den Tangentialvektoren bzw. Einsformen jeden Tensor Tsr als Linearkombination von Tensorprodukten schreiben kann: ν νs 1 ···μr p) ∂ 1 Tsr = Tνμ1 ···ν , (9.12) ( μ1 ⊗ · · · ⊗ ∂μr ⊗ d x ⊗ · · · ⊗ d x s wobei wieder die Summenkonvention zu beachten ist. Wir wollen uns das Tensorprodukt, die Basistensoren von Tensorräumen, die Transformationsregeln usw. für den Spezialfall von zweirangigen kovarianten Tensoren genauer anschauen.
188
9 Tensorrechnung auf Mannigfaltigkeiten
Tensoren vom Rang (0,2) Der einfachste (0,2)-Tensor entsteht durch Multiplikation von zwei Einsformen α und β und wird für zwei beliebige Tangentialvektoren U und V durch α ⊗ β (U , V ) := α (U ) · β (V )
(9.13)
definiert. Das Symbol ⊗ kennzeichnet die tensorielle Multiplikation. Das Tensorprodukt der beiden Einsformen ist nicht kommutativ, d. h., es gilt im Allgemeinen α ⊗ β (U , V ) = α (U ) β (V ) = β (U ) α (V ) = β ⊗ α (U , V ) . α ⊗ β und β ⊗ α sind also generell unterschiedliche Tensoren. Nicht jeder Tensor vom Rang (0,2) ist ein Produkt von zwei Einsformen, jedoch kann jeder Tensor vom Rang (0, 2) als endliche Summe tensorieller Einsformprodukte dargestellt werden, wie wir jetzt zeigen wollen. Basis von T02 Zunächst definieren wir die 16 Komponenten eines beliebigen (0,2)-Tensors T20 nach Auswahl einer Basis eμ von T p M, die nicht unbedingt die Koordinatenbasis ∂μ sein muss, durch Tμν := T20 eμ , eν . Für zwei beliebige Tangentialvektoren folgt daraus T20 (U , V ) = T20 U μ eμ , V ν eν = U μ V ν T20 eμ , eν = U μ V ν Tμν .
(9.14)
Die zwei unten stehenden Indizes nennt man auch kovariante Indizes, die oben stehenden kontravariante Indizes.
Aufgabe 9.1 Zeigen Sie, dass die Tensorprodukte eμ ⊗ eν eine Basis von T02 bilden.
Lösung Wir wollen die Frage beantworten, ob es eine Basis eμν von T02 gibt, sodass sich jeder Tensor T20 als Linearkombination T20 = Tμν eμν schreiben lässt. Wenn es eine solche Darstellung gibt, dann folgt Tμν = T20 eμ , eν = Tρσ eρσ eμ , eν und daraus
eρσ eμ , eν = δμρ δνσ .
Nach Definition der dualen Basis gilt aber
(9.15)
9.2 Tensorfelder
189
δμρ = eρ eμ
δνσ = eσ (eν ) . Damit ergibt sich aus (9.15) eρσ eμ , eν = eρ eμ eσ (eν ) = eρ ⊗ eσ eμ , eν , d. h., die Tensorprodukte der dualen Basiseinsformen bilden eine Basis von T02 , und es gilt T20 = Tμν eμ ⊗ eν . Transformationsregeln Wir untersuchen noch das Transformationsverhalten der Komponenten und Basen von Ten soren vom Rang (0, 2). Seien dazu zwei Basen eμ und eμ von T p M ausgewählt, dann folgt mit den Transformationsformeln für die (dualen) Basen ∂xν ∂xμ 0 0 Tμ ν = T2 eμ , eν = T2 eμ , eν ∂xμ ∂xν =
∂xμ ∂xν
∂xμ ∂xν T20 eμ , eν = μ ν Tμν . ∂x ∂x ∂x ∂x μ
ν
Wir erhalten also genau das gleiche Transformationsverhalten, das wir für die MinkowskiMetrik schon in (2.11) gezeigt haben. Analog gilt mit den obigen Rechenregeln: μ ν ∂ x ∂ x ∂xμ ∂xν μ μ ν μ ν e ⊗e = e e = e ⊗ eν ⊗ ∂xμ ∂xν ∂xμ ∂xν
Aufgabe 9.2 Zeigen Sie, dass die rechte Seite von (9.14) eine Invariante ist.
Lösung Es gilt: U
μ
V
ν
T
μ ν
=
∂xμ
U
μ
∂xν
Vν
∂xρ ∂xσ
Tρσ ∂xμ ∂xν ∂xμ ∂xν ∂xμ ∂xρ ∂xν ∂xσ μ ν = U V Tρσ μ ν μ ν
∂ x ∂ x ∂ x ∂ x ρ
=δμ μ ν
=δνσ
= U V Tμν
190
9 Tensorrechnung auf Mannigfaltigkeiten
Symmetrie und Antisymmetrie Wir haben gesehen, dass das tensorielle Produkt nicht kommutativ ist. Definition 9.3 1. Ein Tensor T20 heißt symmetrisch, wenn T20 (U , V ) = T20 (V , U ) für alle Vektoren U , V gilt. Für die Komponenten eines symmetrischen Tensors gilt dann Tμν = Tνμ . Wir haben in Abschn. 2.3 gezeigt, dass der Minkowski-Tensor η = ημν symmetrisch ist. 2. Einen (0, 2)-Tensor T20 nennt man antisymmetrisch, wenn T20 (U , V ) = −T20 (V , U ) für alle Vierervektoren U , V gilt. Für die Komponenten folgt dann Tμν = −Tνμ . In (5.23) haben wir gesehen, dass der kovariante Feldstärketensor F20 der Elektrodynamik antisymmetrisch ist. 3. Wir können die Komponenten eines beliebigen Tensors Tμν als Summe der Komponenten eines symmetrischen und eines antisymmetrischen Teils schreiben: Tμν = T(μν) + T[μν] mit 1 Tμν + Tνμ 2 1 Tμν − Tνμ . := 2
T(μν) : = T[μν]
4. Für die Komponenten Tμ1 μ2 ···μ N beliebiger Tensoren T vom Rang (0, N ) werden die Komponenten des symmetrischen Anteils von T durch T(μ1 μ2 ···μ N ) :=
1 Tμσ (1) μσ (2) ···μσ (N ) N!
(9.16)
σ ∈S N
definiert, wobei S N die Menge aller Permutationen σ : {1, 2, . . . , N } → {1, 2, . . . , N } bezeichnet.
9.2 Tensorfelder
191
5. Entsprechend lautet die Verallgemeinerung für den antisymmetrischen Anteil 1 sgn (σ ) Tμσ (1) μσ (2) ···μσ (N ) N!
T[μ1 μ2 ···μ N ] :=
(9.17)
σ ∈S N
mit sgn (σ ) =
1
σ gerade Permutation
−1 σ ungerade Permutation
.
Wir schauen uns einige weitere Beispiele an. Beispiel 9.2
Wir wählen die Koordinatenbasen ∂μ sowie d x μ . 1. Ein antisymmetrischer kovarianter Tensor zweiter Stufe hat die Koordinatendarstellung T20 = Tμν ( p) d x μ ⊗ d x v mit Tνμ = −Tμν . Damit folgt T20 =
1 Tμν ( p) d x μ ⊗ d x v − d x ν ⊗ d x μ . 2
2. Ein gemischter Tensor vom Rang (3, 1) hat die Koordinatendarstellung T13 = T μνρσ ( p) ∂μ ⊗ ∂ν ⊗ ∂ρ ⊗ d x σ . 3. Der einfachste Tensor vom Rang (1, 1) entsteht durch Multiplikation eines Vektors V mit einer Einsform α und wird für beliebige β und U durch V ⊗ α (β, U ) := V (β) α (U ) = β (V ) α (U ) definiert. Die Komponenten von T11 ergeben sich durch T μν = T11 d x μ , ∂ν . Damit folgt für beliebige Einsformen und Vektoren die Kontraktion T11 (α, V ) = αμ V ν T μν .
(9.18)
Die tensoriellen Produkte von Basiseinsformen und Basisvektoren bilden eine Basis von T11 , und es gilt
192
9 Tensorrechnung auf Mannigfaltigkeiten
T11 = T μν ∂μ ⊗ d x ν . Die Komponenten und Basen von Tensoren vom Rang (1, 1) transformieren sich wie folgt: T
μ ν
=
∂μ ⊗ d x ν =
∂xμ ∂xν ∂ x μ ∂ x ν ∂xμ ∂xν ∂xμ ∂xν
T μν ∂μ ⊗ d ν
Dahinter steckt ein allgemeines Prinzip: Zu jedem oberen (gestrichenen) Index gehört eine Jacobi-Matrix und zu jedem unteren Index eine inverse Jacobi-Matrix. Koordinatenausdrücke sind in der Koordinatenumgebung (U , h) eindeutig und lassen sich durch Koordinatenwechsel auf andere, mit U überlappende Umgebungen und damit auf ganz M fortsetzen. Sie sind vollwertige Darstellungen von Tensoren, die immer dann ins Spiel kommen, wenn man konkrete Berechnungen durchführen muss. Wir werden daher in den folgenden Abschnitten oftmals sprachlich nicht mehr zwischen den indexfreien Tensoren T μ und seinen indizierten Komponenten unterscheiden, sondern auch Ausdrücke wie z. B. T ν als Tensoren bezeichnen.
9.3
Kontraktion und Quotientenregel
Kontraktion Wir wollen die Kontraktion, die uns für Vektoren und Einsformen schon in Gleichung (9.6) begegnet ist, auf beliebige Tensoren erweitern. Wenn wir uns einen Tensor T11 = V ⊗ α anschauen, dann definieren wir die lineare Kontraktionsabbildung C : T11 (M) → T00 (M) durch
C T11 = C (V ⊗ α) = α (V ) .
Das ist die koordinatenfreie Darstellung von (9.6). Die Kontraktion ist einfach die Wirkung der Einsform α auf den Vektor V und macht aus einem (1, 1)-Tensor einen (0, 0)-Tensor, also eine Funktion. Stellen wir einen beliebigen (1, 1)-Tensor durch seine Komponenten in den Basen eμ und (eμ ) dar: T11 = T μν eμ ⊗ eν ,
9.3
Kontraktion und Quotientenregel
193
dann gilt C T11 ( p) = T μν ( p) C eμ ⊗ eν = T μν ( p) eν eμ = T μν ( p) δμν = T μμ ( p) , also ist das Ergebnis wieder eine Funktion. Ist T eine Tensor höherer Stufe, so muss man zunächst angeben, welcher kovariante Index mit welchem kontravarianten Index kontrahiert werden soll. Ist z. B. T23 ein Tensor vom Rang (3, 2) und eμ ⊗ eν ⊗ eρ ⊗ eσ ⊗ eτ eine Basis von T32 , und sollen der erste kontravariante und zweite kovariante Index kontrahiert werden, so definieren wir die lineare Kontraktionsabbildung C21 : T32 → T21 durch C21 eμ ⊗ eν ⊗ eρ ⊗ eσ ⊗ eτ = eν ⊗ eρ ⊗ eσ eτ eμ = eν ⊗ eρ ⊗ eσ δμτ . Damit ergibt sich für einen beliebigen Tensor T23 aus T32 : 1 σ τ σ C21 T23 = T μνρ = T μνρ ∈ T21 σ τ C 2 e μ ⊗ eν ⊗ eρ ⊗ e ⊗ e σ μ e ν ⊗ eρ ⊗ e
(9.19)
In der Koordinatendarstellung bedeutet die Kontraktion also dieSummation über einen kontravarianten und einen kovarianten Index. Kontraktion von symmetrischen mit antisymmetrischen Tensoren Wenn wir das Tensorprodukt eines kontravarianten symmetrischen Tensors FNM mit einem N in allen Indizes kontrahieren, so erhalten wir kovarianten antisymmetrischen Tensor G M als Ergebnis null.
Aufgabe 9.3 Zeigen Sie, dass die totale Kontraktion eines symmetrischen Tensors F02 mit einem antisymmetrischen Tensor G 02 null ergibt.
Lösung Wir betrachten die zweistufigen Tensoren F02 und G 02 und erhalten F μν G μν
= F νμ G μν
F sym
=
G antisym
−F νμ G νμ = −F μν G μν ⇒ F μν G μν = 0. ν↔μ
(9.20) Quotientenregel Die Quotientenregel erlaubt es, in einer Tensorgleichung Objekte als Tensoren zu identifizieren. Wir zeigen diese Möglichkeit an einem Spezialfall. Gilt für zwei Vektoren U und V μ und einem Objekt S mit den Komponenten S ν die Beziehung S μν U ν = V μ ,
(9.21)
so ist S = S11 ein (1, 1)-Tensor. Um das zu sehen, multiplizieren wir (9.21) mit den Komponenten einer Einsform α = αμ und erhalten
194
9 Tensorrechnung auf Mannigfaltigkeiten
S μν αμ U ν = V μ αμ . Da die rechte Seite ein Skalar ist, ist die linke Seite auch ein Skalar, d. h. vom Koordinatensystem unabhängig: μ S ν αμ U ν = S μν αμ U ν Mit den Transformationsregeln für Vektoren und Einsformen ergibt sich daraus μ S ν
∂xμ
∂xμ
αμ
∂xν
∂xν
U ν = S μν αμ U ν .
Da α und U beliebig sind, folgt μ S ν
=
∂xμ ∂xν
∂xμ ∂xν
S μν ,
(9.22)
μ
also transformieren sich die S ν wie die Komponenten eines Tensors vom Rang (1, 1), und damit folgt S = S11 . Die gerade gezeigte Aussage ist eine (einfache) Version der sogenannten Quotientenregel für Tensoren. Allgemein gilt: Ist ein Tensor vom Rang (r1 + r2 , s1 + s2 ) das Produkt von zwei Objekten, von denen eines ein Tensor vom Rang (r1 , s1 ) ist, dann ist das andere Objekt ein Tensor vom Rang (r2 , s2 ).
9.4
Abbildungen zwischen Mannigfaltigkeiten
In diesem Abschnitt untersuchen wir Abbildungen zwischen Mannigfaltigkeiten (siehe Definition 8.7) detaillierter und fokussieren uns insbesondere darauf, wie man mithilfe von Abbildungen Tensoren von einer zu einer anderen Mannigfaltigkeit transportieren kann. Wir wählen zwei beliebige Mannigfaltigkeiten M und N , deren Dimensionen unterschiedlich sein dürfen, und betrachten eine Abbildung φ : M → N sowie eine glatte Funktion f : N → R. Ferner sei (U , h ( p) = x μ ) ein Koordinatensystem um den Punkt p ∈ M sowie (V , k (φ ( p)) = y ν ) ein weiteres um den Punkt φ ( p) ∈ N . Pushforward von Vektoren In (8.11) haben wir den Pullback der Funktion f durch φ durch φ ∗ : F (N ) → F (M) , φ ∗ ( f ) = f ◦ φ definiert und damit in (8.12) das Differenzial dφ p durch
9.4
Abbildungen zwischen Mannigfaltigkeiten
195
dφ p V p ( f ) = V p φ ∗ ( f ) = V p ( f ◦ φ) eingeführt. Wir interpretieren die Differenzialabbildung jetzt als eine Möglichkeit, einen Tangentialvektor V p von T p M zu einem Tangentialvektor von Tφ( p) N zu machen, was man als Pushforward von V p bezeichnet. Wir schreiben das Differenzial auch als φ∗ V p ( f ) := dφ p V p ( f ) .
(9.23)
Das heißt, die Aktion von φ∗ V p auf eine beliebige Funktion ist einfach die Aktion von V p auf den Pullback dieser Funktion. Abb. 9.1 zeigt nochmals die Zusammenhänge zwischen den Funktionenräumen. Wir wollen diese relativ abstrakten Definitionen etwas griffiger machen. Dazu wählen wir eine Basis ∂μ p von T p M sowie eine weitere ∂ν φ( p) von Tφ( p) N und vergleichen die Komponenten von V p = V μ ∂μ p mit denen von
ν φ∗ V p = φ∗ V p ∂ν φ( p) ,
indem wir eine Testfunktion f ∈ F (N ) wählen: ν φ∗ V p ∂ν φ( p) ( f ) = V μ ∂μ p ( f ◦ φ) ⇔
ν ∂ ∂ f ◦ k −1 k(φ( p)) = V μ μ f ◦ φ ◦ h −1 h( p) φ∗ V p ν ∂y ∂x
(9.24)
Wir wählen speziell f = y ν und erhalten ν ∂ φ∗ V p = V μ μ y ν ◦ φ ◦ h −1 h( p) , ∂x
(9.25)
wobei die Matrix auf der rechten Seite die Jacobi-Matrix der Koordinatendarstellung von φ : M → N an der Stelle h ( p) ∈ R4 ist, siehe Abb. 8.2. In der Physik-Literatur (siehe z. B. [18]) schreibt man (9.25) manchmal auch kurz als ν ∂ yν φ∗ V p = V μ μ , ∂x Abb. 9.1 Pushforward von Vektoren
(9.26)
196
9 Tensorrechnung auf Mannigfaltigkeiten
∂ yν wobei Vorsicht geboten ist, da die Matrix nicht die Jacobi-Matrix des Koordinaten∂xμ wechsels, sondern - wie gesagt - die Jacobi-Matrix der Koordinatendarstellung von φ ist. Die Kettenregel für Differenziale (8.14) d (ψ ◦ φ) p = dψφ( p) ◦ dφ p überträgt sich eins zu eins auf den Pushforward (ψ ◦ φ)∗ = ψ∗ ◦ φ∗ .
(9.27)
Pullback von Einsformen So wie Funktionen nicht vorwärts gepusht werden können, können Vektoren im Allgemeinen nicht zurückgezogen werden. Es wird aber nicht überraschen, dass Einsformen zurückgezogen werden können. Ist ω eine Einsform auf N , so definieren wir den Pullback von ω durch φ: ∗ ∗ φ ∗ : Tφ( p) N → T p M mit für V p ∈ T p M. Ist
φ∗ω
p
V p := ωφ( p) φ∗ V p ,
(9.28)
∗ ω = ωμ dy μ ∈ Tφ( p) N
die Komponentendarstellung von ω, so ergibt sich ganz ähnlich wie in (9.26) für die Komponenten von φ ∗ ω in der Kurzschreibweise:
φ∗ω
ν
=
∂ yμ ωμ ∂xν
(9.29)
Die Matrix ∂ y μ/∂ x ν ist die gleiche wie beim Pushforward von Vektoren, allerdings wird hier über andere Indizes summiert. Den Pullback von Einsformen kann man ebenfalls als Komposition von zwei Abbildungen darstellen, wie Abb. 9.2 zeigt.
Abb. 9.2 Pullback von Einsformen
9.4
Abbildungen zwischen Mannigfaltigkeiten
197
Verallgemeinerung auf Tensoren Wir können die Konzepte Pullback bzw. Pushforward auf beliebige kovariante bzw. kontravariante Tensoren erweitern. Ist Ts0 ein kovarianter Tensor vom Rang (0, s), so wird der Pullback von Ts0 durch φ durch φ ∗ : T0s φ( p) (N ) → T0s p (M) mit
∗ 0 φ Ts (V1 , . . . , Vs ) := Ts0 (φ∗ V1 , . . . , φ∗ Vs )
(9.30)
definiert. Ganz ähnlich können wir den Pushforward eines Tensors T0r vom Rang (r , 0) durch φ∗ : Tr0 p (M) → Tr0 φ( p) (N ) mit
φ∗ T0r
1 ω , . . . , ωr := T0r φ ∗ ω1 , . . . , φ ∗ ωr
(9.31)
definieren. Für die Komponentendarstellungen folgt analog
φ ∗ Ts0
bzw.
ν1 ...νs
=
∂ y ρ1 ∂ y ρs 0 · · · T ∂ x ν1 ∂ x νs s ρ1 ...ρs
(9.32)
∂ y μ1 ∂ y μr r σ1 ...σr · · · . T ∂ x σ1 ∂ x σr 0 Für jeden Index gibt es also eine Jacobi-Matrix der Koordinatendarstellung von φ. Man beachte, dass gemischte Tensoren im Allgemeinen weder zurückgezogen noch vorwärts gepusht werden können. Wir schauen uns ein Beispiel an.
φ∗ T0r
μ1 ...μr
=
Beispiel 9.3
Wir betrachten die Mannigfaltigkeit M = S 2 , d. h. die Oberfläche der Einheitskugel im R3 = N (8.2), und statten die Zweisphäre S 2 mit Höhen- und Azimutwinkel aus, d. h. x μ = (ϑ, ϕ). Die Koordinaten von N seien die üblichen, d. h. y ν = (x, y, z). Die Abbildung φ:M→N sei gegeben durch φ (ϑ, ϕ) = (sin ϑ cos ϕ, sin ϑ sin φ, cos ϑ) .
198
9 Tensorrechnung auf Mannigfaltigkeiten
Wir wollen die euklidische Metrik g → diag (1, 1, 1) des R3 auf die Zweisphäre zurückziehen und berechnen die Matrix ∂ yμ cos ϑ cos ϕ cos ϑ sin ϕ − sin ϑ = . − sin ϑ sin ϕ sin ϑ cos ϕ 0 ∂xν Dann folgt mit (9.32) für die zurückgezogene Metrik der Zweisphäre: ∗ ∂ yρ ∂ yσ gρσ φ g μν = ∂xμ ∂xν ⎛ ⎞⎛ ⎞ 100 cos ϑ cos ϕ − sin ϑ sin ϕ cos ϑ cos ϕ cos ϑ sin ϕ − sin ϑ ⎝ 0 1 0 ⎠ ⎝ cos ϑ sin ϕ sin ϑ cos ϕ ⎠ = − sin ϑ sin ϕ sin ϑ cos ϕ 0 001 − sin ϑ 0 ⎛ ⎞ cos ϑ cos ϕ − sin ϑ sin ϕ cos ϑ cos ϕ cos ϑ sin ϕ − sin ϑ ⎝ cos ϑ sin ϕ sin ϑ cos ϕ ⎠ = − sin ϑ sin ϕ sin ϑ cos ϕ 0 − sin ϑ 0 1 0 (9.33) = 0 sin2 ϑ
Der Grund dafür, dass gemischte Tensoren im Allgemeinen nicht zurückgezogen bzw. vorwärts gepusht werden können, liegt daran, dass die Abbildung φ nicht bijektiv sein muss. Setzen wir dies allerdings voraus, d. h., wir unterstellen, dass φ ein Diffeomorphismus ist, dann können wir den Pushforward eines Tensors Tsr ∈ Trs (M) durch φ∗ Tsr ω1 , . . . , ωr , V1 , . . . , Vs := Tsr φ ∗ ω1 , . . . , φ ∗ ωr , φ −1 ∗ V1 , . . . , φ −1 ∗ Vs (9.34) definieren, wobei die ωμ Einsformen und die Vν Vektoren auf N sind. Entsprechend wird der Pullback eines Tensors Tsr ∈ Trs (N ) durch
∗ ∗ ∗ r 1 φ Ts ω , . . . , ωr , V1 , . . . , Vs := Tsr φ −1 ω1 , . . . , φ −1 ωr , φ∗ V1 , . . . , φ∗ Vs (9.35) definiert, wobei die ωμ Einsformen und die Vν Vektoren auf M sind. In den Koordinatendarstellungen erhalten wir
φ∗ Tsr
φ ∗ Tsr
μ1 ...μr ν1 ...νs
μ1 ...μr ν1 ...νs
∂ y μ1 ∂ y μr · · · ∂ x ρ1 ∂ x ρr μ 1 ∂x ∂ x μr = · · · ∂ y ρ1 ∂ y ρr =
∂ x σs ∂ x σ1 · · · ∂ y ν1 ∂ y νs σ 1 ∂ y σs ∂y · · · ∂ x ν1 ∂ x νs
Tsr Tsr
ρ1 ...ρr σ1 ...σs
ρ1 ...ρr σ1 ...σs
,
9.5 Tensoranalysis
199
mit den inversen Matrizen ∂ x μ /∂ y ν , deren Existenz wegen der Invertierbarkeit von φ gesichert ist. Durch Vergleich von (9.34) und (9.35) sieht man, dass ∗ φ∗ = φ −1
(9.36)
∗ ist, d. h., wir können uns bei Diffeomorphismen auf die Betrachtung von φ ∗ und φ −1 beschränken. Koordinatentransformation mit Diffeomorphismen Mithilfe eines Diffeomorphismus φ : M → M können wir einen Tensor bei p auf einen Tensor bei φ ( p) abbilden. Ist (U , h = x μ ) eine Koordinatenumgebung von p und wir φ auch dazu benutzen, ein neues Koordinaten(V , k = y μ ) eine von φ ( p), so können
−1 μ um p mit system W := φ (V ) , h = x
x μ (q) := y (φ (q)) , f¨ur q ∈ W zu definieren. Der Diffeomorphismus φ induziert also eine Koordinatentransformation x μ → x μ . Diese bietet die Möglichkeit, ein Tensorfeld T an der Stelle p mit dem Tensorfeld φ ∗ T an der Stelle φ ( p) zu vergleichen, denn die Komponenten von φ ∗ T im Koordinaten system y μ sind exakt die Komponenten von T im Koordinatensystem x μ .
9.5
Tensoranalysis
Um die Tensorrechnung weiter zu vervollständigen, stellen wir in diesem Abschnitt, der sich an [16] und [13] anlehnt, eine Systematik vor, wie Tensoren generell abzuleiten sind. Hierbei gehen wir wieder so vor, dass wir sowohl koordinatenfreie als auch koordinatenbasierte Darstellungen entwickeln. Als ein Beispiel der generellen Ableitungsvorschrift schauen wir uns in Abschn. 9.6 die Lie-Ableitung, mit der wir ein geometrisches Objekt entlang des Flusses eines Vektorfeldes differenzieren können, etwas genauer an. Definition 9.4 Eine Tensorderivation D auf M ist ein Menge linearer Abbildungen
D = Dsr : Trs (M) → Trs (M) , (r ≥ 0, s ≥ 0) mit folgenden Eigenschaften: 1. Leibniz-Regel: Sind S und T zwei beliebige Tensorfelder, so gilt
D (S ⊗ T ) = D (S) ⊗ T + S ⊗ D (T ) .
(9.37)
200
9 Tensorrechnung auf Mannigfaltigkeiten
2. Kommutativität mit beliebiger Kontraktion C:
D (C (T ))) = C (D (T ))
(9.38)
Bemerkung 9.1 1. Eine Tensorderivation verändert den Rang (r , s) der Tensorfelder, auf die sie wirkt, nicht. 2. Da T00 (M) = F (M) ist, gibt es eine Eins-zu-eins-Beziehung zwischen den Derivationen D00 und den Vektorfeldern, d. h., zu jeder Derivation gibt es ein (eindeutig bestimmtes) Vektorfeld V mit D00 ( f ) = V ( f ) für alle f ∈ F (M). In Definition 8.8 haben wir dargestellt, dass jeder Tangentialvektor eine Derivation auf F (M) ist. Ist umgekehrt eine Derivation D00 auf F (M) gegeben, so definieren wir für ein p ∈ M eine Funktion V p : F (M) → R durch V p ( f ) := D00 ( f ) ( p) , und prüfen nach, dass V p ein Tangentialvektor auf M und V := D00 ein wohldefiniertes Vektorfeld auf M ist. 3. Das Tensorprodukt einer Funktion f mit einem Tensor Tsr ist das übliche Produkt f ⊗ Tsr = f Tsr . Damit folgt D f Tsr = D ( f ) Tsr + f D Tsr ⇔ Dsr f Tsr = D00 ( f ) Tsr + f Dsr Tsr . Die folgende Aussage ist sehr hilfreich, wenn man zeigen will, dass zwei Derivationen übereinstimmen. Wir schreiben hier nur das Ergebnis auf, den Beweis findet man in [16] oder auch in [32]. Bemerkung 9.2 Eine Tensorderivation D = Dsr ist durch D00 und D01 , d. h. durch ihr Verhalten auf Funktionen und Vektorfelder, schon eindeutig bestimmt. Beispiel 9.4
Die Aussage in Bemerkung 9.2 demonstrieren wir für eine Einsform: ω = ωμ ( p) d x μ
9.5 Tensoranalysis
201
Ist
V = V ν ( p) ∂ν
ein beliebiges Vektorfeld, so ist ω (V ) = ωμ ( p) d x μ V ν ( p) ∂ν = ωμ ( p) V ν ( p) d x μ (∂ν ) = ωμ ( p) V μ ( p)
=δ
μ ν
eine Funktion, und es gilt nach (9.6) ω (V ) = C (ω ⊗ V ) . Mit (9.37) und (9.38) folgt dann D00 (ω (V )) = D00 (C (ω ⊗ V )) = C D11 (ω ⊗ V ) = C D10 (ω) ⊗ V + ω ⊗ D01 (V ) = C D10 (ω) ⊗ V + C ω ⊗ D01 (V ) = D10 (ω) (V ) + ω D01 (V ) . Umstellen nach D10 führt zu D10 (ω) (V ) = D00 (ω (V )) − ω D01 (V ) ,
(9.39)
wir können also die Derivation einer Einsform aus der für Funktionen und Vektorfelder ableiten. Der allgemeine Fall ist etwas unübersichtlicher, folgt aber der gleichen Systematik. Wir setzen r Einsformen und s Vektorfelder in die Koordinatendarstellung von Tsr (9.12) ein und erhalten 1 ···μr p) ω 1 · · · ωr V ν1 · · · V νs . Tsr ω1 , . . . , ωr , V1 , . . . , Vs = Tνμ1 ···ν ( s μ1 μr 1 s Der Ausdruck auf der rechten Seite ist eine Funktion, die durch jeweils eine Kontraktion eines kovarianten mit einem kontravarianten Index, d. h. aus einer kombinierten Kontraktion des Tensorproduktes Tsr ⊗ ω1 ⊗ · · · ⊗ ωr ⊗ V1 ⊗ · · · ⊗ Vs , entstanden ist. Wir wenden nun die Tensorderivation D auf dieses Tensorprodukt an und erhalten mit der Leibniz-Regel (9.37) eine Summe von Ausdrücken, in denen die Derivation auf jeden Faktor des Tensorproduktes einmal wirkt:
202
9 Tensorrechnung auf Mannigfaltigkeiten
! D00 Tsr ω1 , . . . , ωr , V1 , . . . , Vs = Dsr Tsr ω1 , . . . , ωr , V1 , . . . , Vs r
Tsr ω1 , . . . , D10 ωi , . . . , ωr , V1 , . . . , Vs + i=1
+
s
Tsr ω1 , . . . , ωr , V1 , . . . , D01 V j , . . . , Vs
j=1
(9.40) Stellt man diese Gleichung nach Dsr um, so benötigt man zur Berechnung die Derivationen 0 1 0 D0 , D0 , D1 , also wegen (9.39) nur die Derivationen auf Funktionen und Vektorfelder. Wir können also festhalten, dass zwei Tensorderivationen gleich sind, wenn sie auf Funktionen und Vektorfeldern übereinstimmen. Und wir können Tensorderivationen konstruieren, wenn wir Informationen über Wirkungen auf F (M) und auf T10 (M) haben, wie das nachfolgende Lemma, dessen Beweis man in [16] findet, zeigt. Lemma 9.1 Gegeben sei ein Vektorfeld V ∈ T10 (M) und eine lineare Abbildung δ : T10 (M) → T10 (M) mit δ ( f X ) = (V f ) X + f δ (X ) (9.41) für alle f ∈ F (M) und alle X ∈ T10 (M), dann gibt es eine eindeutig bestimmte Tensorderivation D auf M mit 1. D00 = V : F (M) → F (M) , 2. D01 = δ : T10 (M) → T10 (M).
9.6
Lie-Ableitung
Die sogenannte Lie-Ableitung ist ein wichtiges Beispiel für eine Tensorderivation. Definition 9.5 Für ein festes Vektorfeld V ∈ T10 (M) wird die Lie-Ableitung L V durch folgende Aussagen definiert: 1. Für alle f ∈ F (M) gilt 2. Für alle X ∈ T10 (M) gilt
D00 = L V ( f ) := V ( f ) .
(9.42)
D01 = L V (X ) := [V , X ] .
(9.43)
9.6
Lie-Ableitung
203
Aufgabe 9.4 Zeigen Sie, dass mit (9.43) die Voraussetzungen des Konstruktionslemmas 9.1 erfüllt sind.
Lösung Es gilt L V ( f X ) = [V , f X ] = V ( f X ) − f (X V ) = (V f ) X + f (V X ) − f (X V ) = (V f ) X + f [V , X ] = L V ( f ) X + f L V (X ) . Bemerkung 9.3 1. Mit Aufgabe 9.4 folgt, dass die Lie-Ableitung eine echte Tensorderivation darstellt, die auf beliebige Tensoren angewendet werden kann. 2. Wir berechnen beispielhaft die Lie-Ableitung für eine Einsform ω mit der Formel (9.39): (L V ω) (X ) = L V (ω (X )) − ω (L V (X )) = V (ω (X )) − ω [V , X ]
(9.44)
Beispiel 9.5
In Beispiel 9.1 haben wir das Differenzial einer Funktion f ∈ F (M) durch d f (X ) = X ( f ) für alle Vektoren X ∈ T10 (M) definiert. Wir berechnen die Lie-Ableitung des Differenzials mit (9.44): L V d f (X ) = V (d f (X )) − d f [V , X ] = V (X ( f )) − [V , X ] f = V (X ( f )) − V (X ( f )) + X (V ( f )) = X (V ( f ))
(9.45)
Andererseits gilt mit (9.42) d (L V f ) (X ) = d (V ( f )) (X ) = X (V ( f )) , d. h., wir haben damit zusammengenommen die Identität L V d f = d (L V f ) bewiesen.
(9.46)
204
9 Tensorrechnung auf Mannigfaltigkeiten
Koordinatendarstellung der Lie-Ableitung Wir betrachten in einer geeigneten Umgebung (U , h) zwei Vektoren V = V μ ∂μ und X = X ν ∂ν sowie eine Einsform ω = ωρ d x ρ . Dann erhalten wir mit (9.42) und (9.43) für f ∈ F (M) die Koordinatendarstellungen: 1.
L V ( f ) = V μ ∂μ ( f ) ,
(9.47)
2. ! L V (X ) = V μ ∂μ , X ν ∂ν = V μ ∂μ X ν ∂ν − X ν ∂ν V μ ∂μ = V μ ∂ μ X ν ∂ ν + V μ X ν ∂ μ ∂ν − X ν ∂ ν V μ ∂ μ − X ν V μ ∂ ν ∂μ ⎛ ⎞ ⎜ ⎟ = V μ ∂μ X ν ∂ν − X ν ∂ν V μ ∂μ + V μ X ν ⎝∂μ ∂ν − ∂ν ∂μ ⎠
= V
μ
∂μ X
ν
−X
μ
∂μ V
ν
=0
∂ν ,
(9.48)
! da nach (8.24) die Basisvektoren kommutieren, ∂μ , ∂ν = 0. In der letzten Gleichung haben wir die Indizes im zweiten Term umbenannt. 3. Die Lie-Ableitung der Einsform in Koordinaten ist durch L V ω = V μ ∂ μ ωρ + ωμ ∂ ρ V μ d x ρ
(9.49)
gegeben. 4. Für die Basisvektoren bzw. Basiseinsformen vereinfachen sich die Formeln (9.48) und (9.49): ! L V ∂μ = V , ∂μ = V μ ∂μ 1 − ∂μ V ν ∂ν = − ∂μ V ν ∂ν L V d x μ = V μ ∂μ 1 + ∂ρ V μ d x ρ = ∂ρ V μ d x ρ
(9.50) (9.51)
5. Die Koordinatendarstellung der Lie-Ableitung für beliebige Tensoren Tsr folgt aus den letzten beiden Formeln und der Darstellung (9.40) für allgemeine Derivationen:
L V Tsr
μ1 ···μr ν1 ···νs
1 ···μr = V ρ ∂ρ Tνμ1 ···ν s r ∂ V μ1 − · · · − T μ1 ···ρ ∂ V μr − Tνρ···μ ρ ρ ν1 ···νs 1 ···νs μ1 ···μr ρ 1 ···μr ∂ ∂ν1 V ρ + · · · + Tνμ1 ···ρ + Tρ···ν νs V s
(9.52)
Aufgabe 9.5 Zeigen Sie die Gültigkeit von (9.49).
9.6
Lie-Ableitung
205
Lösung Für die Koordinatendarstellung der Einsform berechnen wir zunächst mit (9.44) und (9.48): (L V ω) (X ) = V μ ∂μ ωρ d x ρ X ν ∂ν − ωρ d x ρ V μ ∂μ X ν − X μ ∂μ V ν ∂ν = V μ ∂μ ωρ X ν δ ρν − ωρ V μ ∂μ X ν δ ρν − X μ ∂μ V ν δ ρν = V μ ∂μ ω ρ X ρ − ωρ V μ ∂ μ X ρ + ωρ X μ ∂ μ V ρ = V μ ∂ μ ω ρ X ρ + V μ ω ρ ∂ μ X ρ − ω ρ V μ ∂ μ X ρ + ωρ X μ ∂ μ V ρ = V μ ∂ μ ω ρ X ρ + ωμ ∂ ρ V μ X ρ , wobei wir in der letzten Gleichung wieder die Indizes umbenannt haben. Wenn wir das Vektorfeld X aus der Berechnung herausnehmen, so erhalten wir (9.49). Die Formel (9.52) ist kompliziert, deshalb schauen wir uns einige Beispiele an. Beispiel 9.6
1. Wir berechnen für T11 = Tμν ∂ν ⊗ d x μ ∈ T11 die Lie-Ableitung zunächst nach (9.40) koordinatenfrei:
L V T11 (ω, X ) = L V T11 (ω, X ) − T11 (L V ω, X ) − T11 (ω, L V X ) ,
setzen nun die Basiseinsformen und Basisvektorfelder ein, d. h. ω = d x μ , X = ∂ν , und erhalten:
L V T11
d x μ , ∂ν = L V Tνμ − T11 L V d x μ , ∂ν − T11 d x μ , L V ∂ν
Wir benutzen (9.50) sowie (9.51), und es ergibt sich die Koordinatendarstellung
L V T11
μ ν
= V Tνμ − T11 ∂ρ V μ d x ρ , ∂ν − T11 d x μ , − ∂ν V ρ ∂ρ . (9.53) = V ρ ∂ρ Tνμ − Tνρ ∂ρ V μ + Tρμ ∂ν V ρ .
2. Für T20 = Tμν d x μ ⊗ d x ν erhalten wir analog
L V T20 (X , Y ) = L V T20 (X , Y ) − T20 (L V X , Y ) − T20 (X , L V Y ) = V T20 (X , Y ) − T20 ([V , X ] , Y ) − T20 (X , [V , Y ]) (9.54)
sowie mit X = ∂μ , Y = ∂ν in der Koordinatendarstellung
L V T20
μν
= V ρ ∂ρ Tμν + Tρν ∂μ V ρ + Tμρ ∂ν V ρ .
(9.55)
206
9 Tensorrechnung auf Mannigfaltigkeiten
Lie-Ableitung entlang eines Vektorfeldes Wir haben die Lie-Ableitung als Beispiel einer Tensorderivation, also relativ abstrakt, eingeführt. Jetzt schauen wir uns an, wie man sie etwas anschaulicher als Veränderungsrate entlang eines „Vektorflusses“ beschreiben kann. Fluss eines Vektorfeldes Nach Definition 8.7 ist eine Kurve eine glatte Abbildung γ : I → M von einem offenen Intervall I ⊂ R nach M. Für eine solche Kurve können wir einen Tangentialvektor γ˙ (t) an jedem Punkt γ (t) , t ∈ I wie in (8.13) durch γ˙ (t) ( f ) :=
d ( f ◦ γ ) (t) , dt
f ∈ F (M)
(9.56)
definieren. Definition 9.6 Sei I ⊂ R ein offenes Intervall um 0 ∈ R und V ∈ T10 (M) ein Vektorfeld . Dann heißt eine Kurve γ : I → M Integralkurve von V durch p ∈ M, falls γ (0) = p und γ˙ (t) = V (γ (t)) für alle t ∈ I gilt.
Definition 9.7 Wir nennen eine glatte Funktion γ : M × R → M eine einparametrige Gruppe von Diffeomorphismen, wenn für jedes feste t ∈ R die Abbildung γ (·, t) : M → M ein Diffeomorphismus und für jeden festen Punkt p ∈ M die Abbildung γ ( p, ·) : R → M
(9.57)
eine differenzierbare Kurve ist. Die Kurven sollen folgende Eigenschaften erfüllen: Für alle s, t ∈ R gilt 1. γ ( p, 0) = p ⇔ γ (·, 0) = id M ,
(9.58)
2. γ (γ ( p, s) , t) = γ ( p, s + t) ⇔ γ (·, t) ◦ γ (·, s) = γ (·, s + t) . Damit folgt auch
γ (·, t)−1 = γ (·, −t) ,
(9.59)
9.6
Lie-Ableitung
207
d. h., die einparametrigen Diffeomorphismen γ bilden eine Untergruppe der Diffeomorphismen. Beispiel 9.7
Wir betrachten die Zweisphäre aus Beispiel 9.3 mit den Koordinaten x μ = (ϑ, ϕ) und definieren eine einparametrige Gruppe durch γ ((ϑ, ϕ) , t) = (ϑ, ϕ + t) .
Die Eigenschaften (9.58) und (9.59) folgen unmittelbar.
Aufgabe 9.6 Zeigen Sie, dass die Drehungen im R2
γ ((x, y) , t) =
(cos t) x − (sin t) y (sin t) x + (cos t) y
eine einparametrige Familie von Diffeomorphismen sind. Lösung Es gilt:
x γ ((x, y) , 0) = y
sowie γ (γ ((x, y) , s) , t) = γ
(cos s) x − (sin s) y (sin s) x + (cos s) y
,t
cos t ((cos s) x − (sin s) y) − sin t ((sin s) x + (cos s) y) = sin t ((cos s) x − (sin s) y) + cos t ((sin s) x + (cos s) y) (cos t cos s − sin t sin s) x − (cos t sin s + sin t cos s) y = (sin t cos s + cos t sin s) x + (cos t cos s − sin t sin s) y cos (s + t) x − sin (s + t) y = sin (s + t) x + cos (s + t) y
Eine Familie von Diffeomorphismen kann man sich als einen Fluss vorstellen. Den Parameter t betrachten wir als Zeitvariable und beobachten, wie der Punkt p ∈ M entlang der Kurve t → γ ( p, t), die man auch Flusslinie nennt, fließt. Nicht jeder Punkt hat seine eigene Flusslinie. Liegt ein Punkt q ∈ M auf der Flusslinie von p, z. B. an der Stelle q = γ ( p, s), so fließt q entlang derselben Flusslinie, denn es gilt mit (9.59)
208
9 Tensorrechnung auf Mannigfaltigkeiten
γ (q, t) = γ (γ ( p, s) , t) = γ ( p, s + t) . Anschaulich gesprochen behält der Punkt q entlang des Flusses seinen „Vorsprung“ s vor p. Wir können die Flusslinien auf M durch ein Vektorfeld V beschreiben. Wir bilden wie in (9.56) den Tangentialvektor der Flusslinie von p an der Stelle p und definieren d (γ ( p, t)) γ˙ ( p, 0) := V ( p) := (9.60) . dt t=0 Den Vektor γ˙ ( p, 0) nennt man auch Geschwindigkeitsvektor von γ ( p, ·) im Punkt p. In lokalen Koordinaten (h ( p) = h (γ ( p, 0)) = x μ ) erhalten wir für f ∈ F (M) mit der Kettenregel (8.3) d f ◦ h −1 ◦ h ◦ γ d ( f ◦ γ ( p, t)) γ˙ ( p, 0) ( f ) = = dt dt 0 0 −1 d (h ◦ γ )μ d f ◦ h = dt dxμ 0
dxμ ∂μ f , = dt
h(γ (0))
(9.61)
wie man anhand Abb. 9.3 nachvollziehen kann. Wenn wir diese Definition auf alle p ∈ M anwenden, so erhalten wir ein Vektorfeld V auf M. Dieses Vektorfeld gibt an jeder Stelle, d. h. auch für t = 0, den Tangentialvektor der jeweiligen Flusslinie an, denn es gilt wieder mit (9.59) d (γ ( p, t + s)) d (γ (γ ( p, t) , s)) d (γ ( p, t)) = = = V (γ ( p, t)) . (9.62) dt ds ds s=0 s=0 Die Beziehung zwischen einparametrigen Gruppen und Vektorfeldern ist im folgenden Sinne umkehrbar. Zu einem glatten Vektorfeld V auf M gehört eine einparametrige Gruppe von Diffeomorphismen γ : M × R → M, die wir als Fluss von V (Details siehe unten) bezeichnen. Dieser wird wie in (9.62) definiert, nur dass wir diese Gleichung jetzt als Differenzialgleichung mit einer Anfangsbedingung für die unbekannte Funktion γ auffassen: d (γ ( p, t)) = V (γ ( p, t)) , γ ( p, 0) = p dt
(9.63)
Die Kurve γ ( p, ·) ist also die Integralkurve von V ( p), und man nennt V den infinitesimalen Erzeuger von γ . In Koordinaten stellt sich eine Integralkurve folgendermaßen dar. Ist (U , h) eine Koordinatenumgebung von p ∈ M mit V (γ ( p, t)) = V μ (γ ( p, t)) ∂μ
9.6
Lie-Ableitung
Abb. 9.3 Kurve auf Mannigfaltigkeit
209
210
9 Tensorrechnung auf Mannigfaltigkeiten
und ist wie in (9.61) x μ (t) die μ-te Komponente von h (γ ( p, t)), so erfüllt eine Integralkurve einen Satz von gewöhnlichen Differenzialgleichungen erster Ordnung: dxμ = V μ (γ ( p, t)) , dt
(9.64)
μ
welche bei Vorgabe eines Anfangswertes x μ (0) = x0 nach einem Satz der Analysis (siehe z. B. [12]) zumindest in einer Umgebung von 0 eindeutig lösbar sind. Die größte Umgebung, für die diese Lösungen existieren, bildet die maximale Integralkurve des Vektorfeldes. Kann diese Umgebung auf ganz R ausgedehnt werden, so heißt das Vektorfeld vollständig bzw. der Fluss global. Muss der Definitionsbereich von γ auf offene Teilmengen I × U ⊂ R × M eingeschränkt werden, so liegt ein lokaler Fluss vor. Wir schauen uns ein Beispiel an. Beispiel 9.8
Sei M = R2 und
V (x, y) :=
01 10
x y = = y∂x + x∂ y . y x
Gesucht ist eine Funktion γ ((x, y) , t) mit d (γ ((x, y) , t)) = V (γ ((x, y) , t)) = dt
01 γ ((x, y) , t) . 10
Das ist ein lineares Differenzialgleichungssystem mit der Lösung 01 x γ ((x, y) , t) = exp t 10 y $ t2 0 1 2 t3 0 1 3 t4 0 1 4 x 10 01 + + ··· = +t + y 01 10 2 10 3! 1 0 4! 1 0 $ t3 0 1 t4 1 0 t2 1 0 x 10 0 t + + ··· = + + y 01 t 0 2 01 3! 1 0 4! 0 1 ⎛ ⎞ t2 t4 t3 + ··· t+ · · · ⎟ x cosh t sinh t x ⎜1 + 2 4! 3! ⎟ . =⎜ ⎝ ⎠ y = sinh t cosh t y t2 t4 t3 ··· 1+ + ··· t+ 3! 2 4!
Lie-Ableitung entlang eines Flusses Wir haben ein Vektorfeld V als infinitesimale Erzeuger bezeichnet und wollen diese Aussage etwas näher beleuchten. Dazu entwickeln wir die Koordinatendarstellungen γ μ ( p, ) des
9.6
Lie-Ableitung
211
zugehörigen Flusses bis zur ersten Ordnung in (klein), lassen also alle Terme der Ordnung 2 und höher weg und erhalten mit p = x μ und (9.63) d (γ μ ( p, )) μ μ γ ( p, ) = γ ( p, 0) + d =0 μ μ μ μ = x + V γ ( p, 0) = x + V μ ( p) , (9.65) d. h., die Koordinaten des Punktes p werden ein wenig „in Richtung“ der Koordinaten des Vektors V ( p) verschoben. Wir betrachten nun ein zweites Vektorfeld W und wollen die Veränderung von W entlang des Flusses γ von V berechnen. Dazu vergleichen wir den Vektor W an einem Punkt p = γ ( p, 0) mit W an einem benachbarten Punkt p = γ ( p, ). Wir können aber nicht einfach die Differenz von W an diesen beiden Punkten bilden, da die Vektoren zu unterschiedlichen Tangentialräumen T p M sowie T p M gehören und damit keine Subtraktion definiert ist. Daher „transportieren“ wir zunächst W p mit dem Pushforward des Diffeomorphismus γ− := γ (·, −) = γ −1 (·, ) =: γ−1 , d. h. (γ− )∗ : Tγ ( p,) M → T p M in den Tangentialraum bei p, und definieren die Lie-Ableitung von W entlang des Flusses γ von V am Punkt p durch L V (W ) = lim
→0
1 (γ− )∗ W (γ ( p, )) − W ( p) .
(9.66)
Bemerkung 9.4 1. Wir wissen nach (9.36), dass bei Diffeomorphismen der Pushforward der Umkehrabbildung gleich dem Pullback der Ursprungsabbildung ist. Demnach können wir die LieAbleitung auch alternativ durch L V (W ) = lim
→0
1 (γ )∗ W (γ ( p, )) − W ( p)
(9.67)
definieren. In der physikalischen Literatur findet man beide Schreibweisen, z. B. die Schreibweise (9.66) in [18] und bei [21] die Schreibweise (9.67). 2. Die Lie-Ableitung entlang eines Vektorflusses ist eine Tensorderivation, wie man z. B. in [16, 20] nachlesen kann. Sie kann also auf beliebige Tensoren Trs durch 1 L V Tsr = lim (γ )∗ Tsr (γ ( p, )) − Tsr ( p) →0
(9.68)
verallgemeinert werden.
212
9 Tensorrechnung auf Mannigfaltigkeiten
Äquivalenz der Lie-Ableitungen Wir wollen noch die Gleichheit der beiden vorgestellten Lie-Ableitungen zeigen. Dazu genügt es nach Bemerkung 9.2, die Ableitungen für Funktionen und Vektorfelder zu betrachten. 1. Ist f ∈ F (M), so wird die Lie-Ableitung von f entlang des Flusses γ von V durch L V ( f ) = lim
→0
1 { f (γ ( p, )) − f ( p)}
definiert. Daraus folgt mit (9.61): 1 { f (γ ( p, )) − f ( p)} d ( f ◦ γ ( p, )) 1 = lim { f ◦ γ ( p, ) − f ◦ γ ( p, 0)} = →0 d 0 = γ˙ ( p, 0) ( f ) = V ( p) ( f ) ,
L V ( f ) = lim
→0
also eine Übereinstimmung mit (9.42). 2. Ferner gilt L V (W ) = lim
→0
1 (γ− )∗ W (γ ( p, )) − W ( p) = [V , W ] .
(9.69)
Also stimmen die beiden Lie-Ableitungen auch für Vektorfelder und damit für alle Tensoren überein.
Aufgabe 9.7 Beweisen Sie die Äquivalenz (9.69).
Lösung Um die Übereinstimmung der Lie-Ableitungen auf Vektorfelder zu überprüfen, wählen wir uns ein lokales Koordinatensystem mit V = V μ ∂μ , W = W μ ∂μ und p = x μ , dann gilt mit (9.65) und Entwicklung bis zur ersten Ordnung in : W (γ ( p, )) = W μ x μ + V μ ( p) ∂μ p+V ( p) = W μ ( p) + V ν ( p) ∂ν W μ ∂μ p+V ( p)
Um den Pushforward in (9.66) zu berechnen, betrachten wir zunächst (γ− )∗ (γ ( p, )) = γ ((γ ( p, −)) , ) = γ ( p, − ) = γ ( p, 0) = p, wobei wir (9.65) und (9.59) genutzt haben. Nun berechnen wir mit (9.65) und (9.24) wieder bis zur ersten Ordnung in :
9.6
Lie-Ableitung
213
(γ− )∗ W (γ ( p, )) = (γ− )∗ W μ ( p) + V ν ( p) ∂ν W μ ∂μ p+V ( p) = W μ ( p) + V ρ ( p) ∂ρ W μ ∂μ γ ν ( p, −) ∂ν p = W μ ( p) + V ρ ( p) ∂ρ W μ ∂μ x ν − V ν ( p) ∂ν p = W μ ( p) + V ρ ( p) ∂ρ W μ δμν − ∂μ V ν ( p) ∂ν p = W μ ( p)∂μ| p + V ν ( p) ∂ν W ν − W μ ( p)∂μ V ν ( p) ∂ν p , wobei wir in der letzten Gleichung ρ durch ν ersetzt haben. Wenn wir jetzt mit (9.66) die Lie-Ableitung von W längs V berechnen, ergibt sich 1 (γ− )∗ W (γ ( p, )) − W ( p) →0 1 ρ V ( p) ∂ρ W ν − W μ ( p)∂μ V ν ( p) ∂ν = lim →0 ρ = V ( p) ∂ρ W ν − W μ ( p)∂μ V ν ( p) ∂ν .
L V (W ) = lim
(9.70)
Das ist aber mit (8.25) nichts anderes als die Koordinatendarstellung der Lie-Klammer von V und W , d. h., wir haben bewiesen, dass L V (W ) = lim
→0
gilt.
1 (γ− )∗ W (γ ( p, )) − W ( p) = [V , W ]
Differenzialformen auf Mannigfaltigkeiten
10
Differenzialformen stellen eine spezielle Klasse von (kovarianten) Tensoren vom Rang (0, k) dar. Wir werden in den nächsten Abschnitten mittels Differenzialformen Maße für orientierte Mannigfaltigkeiten definieren und einige wichtige Eigenschaften der dadurch entstehenden Integrale untersuchen. Differenzialformen kommen auch ins Spiel, wenn wir uns mit Krümmungen auf Mannigfaltigkeiten beschäftigen und wir werden sehen, dass der Differenzialformenkalkül (nach dem französischen Mathematiker Élie Joseph Cartan (1869–1951) auch Cartan’scher Kalkül genannt) eine gute Hilfestellung leistet, wenn wir uns mit exakten Lösungen der Einstein-Gleichungen auseinandersetzen.
10.1
Differenzialformen
Definition 10.1 Sei M eine (vierdimensionale) Mannigfaltigkeit und p ∈ M. 1. Unter einer alternierenden (auch: schiefsymmetrischen) k-Form um p versteht man einen kovarianten Tensor ω vom Rang (0, k) k
ω p : Tp M × · · · × Tp M → R k−mal
mit der folgenden Eigenschaft: Sind V1 , . . . , Vk ∈ T p M linear abhängig, so gilt k
ω p (V1 , . . . , Vk ) = 0. 2. Die Menge aller alternierenden k-Formen um p bildet einen Vektorraum, den wir kp (M) nennen wollen. Wir setzen außerdem 0p (M) := R und 1p (M) := T p∗ M. © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_10
215
216
10 Differenzialformen auf Mannigfaltigkeiten
3. Eine Differenzialform vom Rang k oder kurz eine k-Form ist eine (beliebig oft) diffek
k
renzierbare Abbildung ω, die jedem p ∈ M eine alternierende k-Form ω p zuweist. Wie bei Tensoren üblich nennen wir die k-Form differenzierbar, wenn ihre Komponentenfunktionen in einer Karte (U , h): k ωμ1 ...μk ( p) := ω p ∂μ1 , . . . , ∂μk differenzierbar sind. 4. Die Menge aller k-Formen bildet einen Vektorraum, den wir mit k (M) bezeichnen wollen. Wir vereinbaren außerdem 0 (M) := F (M) sowie 1 (M) := T01 (M). Wir unterscheiden zukünftig sprachlich nicht mehr zwischen alternierenden k-Formen und Differenzialformen, sondern benutzen beide Begriffe synonym. Bemerkung 10.1 1. Da in einem n-dimensionalen Vektorraum höchstens n Vektoren linear unabhängig sein können, folgt wegen dim T p M = 4 sofort k
ω p (V1 , . . . , Vk ) = 0 für k ≥ 5. Das heißt, auf M gibt es nur fünf (k = 0, 1, 2, 3, 4) verschiedene Arten von k-Formen. 2. Für k-Formen sind folgende Aussagen äquivalent: k
k
a) ω p ist alternierend, d. h. ω p (V1 , . . . , Vk ) = 0, wenn (V1 , . . . , Vk ) linear unabhängig sind. k b) ω p (V1 , . . . , Vk ) = 0, wenn zwei der Vi gleich sind. c) Beim Vertauschen zweier Argumente kehrt sich das Vorzeichen um, d. h., für i < j gilt k k ω p (V1 , . . . , Vk ) = −ω p V1 , . . . , V j , . . . , Vi , . . . , Vk . d) Ist σ : {1, . . . , k} → {1, . . . , k} eine Permutation, so gilt k k ω p Vσ (1) , . . . , Vσ (k) = sgn (σ ) ω p (V1 , . . . , Vk ) . Pullback von k-Formen Eine glatte Abbildung f : M → N zwischen zwei Mannigfaltigkeiten induziert eine lineare Abbildung f ∗ : k (N ) → k (M)
10.1
Differenzialformen
mit
∗k
217
k
f ω (V1 , . . . , Vk ) := ω ( f ∗ (V1 ) , . . . , f ∗ (Vk )) ,
(10.1)
die man wie in (9.30) auch hier Pullback nennt. Für Nullformen g ∈ 0 (N ), also für glatte Funktionen, definieren wir wie in (8.11) f ∗ g := g ◦ f . Ist M = N und f = id M , so folgt k ∗ k ∗ id M ω (V1 , . . . , Vk ) = ω (V1 , . . . , Vk ) ⇒ id M = idk (M) . Sind f : M → N , g : N → P zwei glatte Funktionen zwischen Mannigfaltigkeiten, so folgt die Kettenregel für Pullbacks: (g ◦ f )∗ = f ∗ ◦ g ∗
Aufgabe 10.1
(10.2)
Beweisen Sie die Kettenregel (10.2).
Lösung Es gilt: k k (g ◦ f )∗ ω (V1 , . . . , Vk ) = ω (g ◦ f )∗ (V1 ) , . . . (, g ◦ f )∗ (Vk ) k
= ω ((g∗ ◦ f ∗ ) (V1 ) , . . . (, g∗ ◦ f ∗ ) (Vk )) k
= ω ◦ g∗ ( f ∗ (V1 ) , . . . , f ∗ (Vk )) k = f ∗ ω ◦ g∗ (V1 , . . . , Vk ) k = f ∗ ω (g∗ (V1 ) , . . . , g∗ (Vk )) k = f ∗ g ∗ ω (V1 , . . . , Vk ) k = f ∗ ◦ g ∗ ω (V1 , . . . , Vk )
218
10 Differenzialformen auf Mannigfaltigkeiten
Koordinatendarstellung von k-Formen Wie bei jedem Tensor erhalten wir die lokalen Komponenten einer k-Form durch k ωμ1 ...μk := ω ∂μ1 , · · · , ∂μk .
(10.3)
Die Komponenten sind antisymmetrisch, d. h. ωμσ (1) ...μσ (k) = sgn (σ ) ωμ1 ...μk für 0 ≤ μi ≤ 3. Es reicht somit, die Komponenten ωμ1 ...μk für μ1 < · · · < μk zu kennen, um alle zu kennen. Die Anzahl der unterschiedlichen Komponenten einer k-Form bestimmt sich durch die Anzahl der Möglichkeiten, k unterschiedliche Elemente ohne Berücksichtigung 4 der Reihenfolge aus den vier Zahlen 0, 1, 2, 3 zu gewinnen, ist also . Damit folgt für k die Dimensionen der Vektorräume 4 k . dim p (M) = k Für k = 0 stimmt das wegen der Festlegung 0p (M) = R, und für k = 1 wissen wir, dass dim 1p (M) = dim T p∗ M = dim T p M = 4 gilt. Der Vektorraum aller Vierformen hat ebenfalls die Dimension 1, und wir können fest4
halten, dass es für jede reelle Zahl a ∈ R genau eine Vierform ω p gibt mit 4
ω p (∂0 , ∂1 , ∂2 , ∂3 ) = a. Beispiel 10.1
Ist M = T p M = Rn und (e1 , . . . , en ) die Standardbasis, so ist die Determinante einer n × n-Matrix - aufgefasst als n-Form der Spaltenvektoren - die einzige Abbildung von der Menge der n × n-Matrizen nach R, die multilinear sowie alternierend in den Spalten ist und der Einheitsmatrix die 1 zuordnet: det (e1 , . . . , en ) = 1
10.2
Dachprodukt
Wir wollen auf den Vektorräumen der k-Formen Basen konstruieren und definieren zunächst das Dachprodukt von Einsformen.
10.2
Dachprodukt
219
Definition 10.2 Das Dachprodukt zweier Basiseinsformen d x μ , d x ν ist eine Zweiform und wird durch d x μ ∧ d x ν := d x μ ⊗ d x ν − d x ν ⊗ d x μ definiert. Sind V = V ρ ∂σ und W = W σ ∂σ zwei Vektoren, so folgt μ μ V W . d x μ ∧ d x ν (V , W ) = V μ W ν − V ν W μ = det Vν Wν Bemerkung 10.2 1. Das Dachprodukt zweier Basiseinsformen ist bilinear und antisymmetrisch d x μ ∧ d x ν = −d x ν ∧ d x μ . 4 2. Wegen der Antisymmetrie gibt es = 6 Produkte d x μ ∧ d x ν mit μ < ν, diese 2 bilden eine Basis von 2 (M), wie man z. B. in [11] nachlesen kann. Wir können also 2
jede Zweiform ω als Linearkombination der Dachprodukte darstellen: 2
ω=
3
1
ωμν d x μ ∧ d x ν = ωμν d x μ ∧ d x ν , 2! μ 0, erhalten wir Andererseits gilt
det gμν = (det A) det gρ σ .
d x 1 ∧ · · · ∧ d x n = (det A) d x 1 ∧ · · · ∧ d x n , woraus sich det gμν d x 1 ∧ · · · ∧ d x n = (det A)2 det gρ σ (det A)−1 d x 1 ∧ · · · ∧ d x n = det gρ σ d x 1 ∧ · · · ∧ d x n ergibt. Wir haben damit gezeigt, dass die 4-Form d M p definiert durch d M p := |det g| d x 1 ∧ · · · ∧ d x n unabhängig vom gewählten Koordinatensystem ist.
(11.15)
11.2
Längen, Integration und Isometrien
261
Definition 11.4 1. Die eindeutig bestimmte n-Form d M ∈ Ω n (M) mit d M : p → d M p heißt Volumenform von (M, g, O M ). 2. Ist A ⊂ M eine messbare Teilmenge (siehe Definition 10.11), so heißt dM V ol (A) := A
Volumen von A in (M, g, O M ). 3. Für eine Funktion f : M → R, deren kompakter Träger in einer Karte (U , h = x μ ) enthalten ist, ist mit (10.25) das Integral f |det g| ◦ h −1 d n x f dM = h(U )
M
unabhängig von der Wahl der Karte. Wie in der physikalischen Literatur üblich (siehe [20, 32]), schreiben wir zukünftig die letzte Gleichung kurz als f dM = f (x) |det g| d n x. (11.16) M
U
4. Der Satz von Gauß (10.36) in Koordinaten spezialisiert sich hier zu 1 |det g|X μ d M = ∂μ X μ ημ d M ∂ M √ |det g| M ∂M bzw. dn x M
1 |det g| √ |det g|X μ = ∂μ |det g|
∂M
d x n−1 det g ∂ M X μ ημ , (11.17)
und wir werden später sehen, dass der Ausdruck √
1 |det g|X μ ∂μ |det g|
die kovariante Divergenz des Vektorfeldes X darstellt, siehe (13.45).
262
11 Semi-Riemann’sche Mannigfaltigkeiten
Beispiel 11.3
1. Für (M, g) = R4 , , R4 ist das Volumen einer messbaren Menge A gleich dem Lebesque-Maß λ auf R4 : V ol (A) = λ (A) . 2. Im R3 sind die Komponenten der Metrik der Kugelkoordinaten nach (1.34) durch gμν = diag 1, r 2 , r 2 sin2 ϑ gegeben, d. h.
det gμν = r 2 sin ϑ.
Damit gilt
d x d y dz =
dr dϑ dϕ
det gμν =
dr dϑ dϕ r 2 sin ϑ.
Isometrien und konforme Abbildungen Definition 11.5 Seien (M, g) und (N , g) ¯ zwei Semi-Riemann’sche Mannigfaltigkeiten. Eine diffeomorphe Abbildung φ : M → N mit φ ∗ g¯ p = g p (11.18) heißt Isometrie. Eine Isometrie lässt also die Metrik invariant.
Bemerkung 11.3 1. Mit (9.35) kann man (11.18) auch ausführlich als g¯ φ( p) (φ∗ V , φ∗ W ) = g¯ φ( p) (dφ (V ) , dφ (W )) = g p (V , W ) mit zwei beliebigen Vektoren V , W ∈ T p M schreiben. Das heißt, dφ : T p M → Tφ( p) N ist eine lineare Isometrie zwischen den Vektorräumen. 2. Mit p = x μ und φ ( p) = y ν ist ∂ yρ ∂ yσ g¯ ρσ (φ ( p)) = gμν ( p) ∂xμ ∂xν
(11.19)
11.2
Längen, Integration und Isometrien
263
die Koordinatendarstellung von (11.18), wobei die Jacobi-Matrizen auf der linken Seite wieder in Kurzform geschrieben sind, vergleiche (9.26). 3. Da die identische Abbildung, die Komposition von Isometrien und die Inverse einer Isometrie wieder Isometrien sind, bilden die Isometrien eine Gruppe. Beispiel 11.4
Im Minkowski-Raum M lassen die Poincaré-Transformationen
x μ → x μ = μν x ν + a μ
mit beliebigem a μ ∈ M die Minkowski-Metrik invariant:
ημ ν μμ ν ν = ημν , siehe (1.37). Die Poincaré-Gruppe ist also eine Untergruppe der Isometriegruppe des Minkowki-Raumes. Definition 11.6 Seien (M, g) und (N , g) ¯ zwei Semi-Riemann’sche Mannigfaltigkeiten und φ : M → N eine diffeomorphe Abbildung. 1. Gilt für alle p ∈ M
φ ∗ g¯ p = σ 2 g p
(11.20)
mit σ ∈ F (M) ,σ > 0, so heißt φ konform. 2. φ heißt längentreu, wenn für alle Kurven γ : I → M l g (γ ) = l g¯ (φ ◦ γ )
(11.21)
gilt. 3. φ heißt volumentreu, wenn für alle messbaren Mengen A ⊂ M V ol g (A) = V ol g¯ (φ (A))
(11.22)
gilt. 4. φ heißt orthogonalitätserhaltend, wenn für je zwei Vektoren V , W ∈ T p M mit g (V , W ) = 0 g¯ (dφ (V ) , dφ (W )) = 0 (11.23) gilt. 5. φ heißt typerhaltend, wenn für alle zeitartigen (raumartigen) Vektoren V ∈ T p M auch jeweils dφ (V ) zeitartig (raumartig) ist.
264
11 Semi-Riemann’sche Mannigfaltigkeiten
Es gibt eine Reihe von Beziehungen zwischen den verschiedenen in Definition 11.6 aufgelisteten möglichen Eigenschaften von Diffeomorphismen. Bemerkung 11.4 Ist φ : M → N ein typerhaltender Diffeomorphismus, so gelten folgende Aussagen: 1. φ ist Isometrie ⇔ φ ist längentreu. 2. φ ist konform ⇔ φ ist orthogonalitätserhaltend. 3. φ ist längentreu ⇔ φ ist konform und volumenerhaltend.
Aufgabe 11.6
Zeigen Sie die Aussage 1. aus Bemerkung 11.4.
Lösung 1. (⇒): l g¯ (φ (γ )) =
b
a
=
b
a
=
b
a
=
a
b
φ (γ ) (t) dt = g¯
a
b
dφγ (t) (γ˙ (t)) dt g¯
g¯ φ(γ (t)) dφγ (t) (γ˙ (t)) , dφγ (t) (γ˙ (t)) dt (φ ∗ g) ¯ φ(γ (t)) (γ˙ (t) , γ˙ (t)) dt gγ (t) (γ˙ (t) , γ˙ (t)) dt =
a
= l g (γ )
b
γ˙ (t) g dt
2. (⇐): Wegen g (V , W ) = genügt es zu zeigen, dass
1 (g (V , V ) + g (W , W ) − g (V − W , V − W )) 2 φ ∗ g¯ (V , V ) = g (V , V )
gilt. Sei γ : (−, ) → M eine Kurve mit γ (0) = p und γ˙ (0) = V . Wir definieren (φ ◦ γ ) (t) dt,
γ˙ (t) g dt, L¯ (t) = l g¯ (φ (γ )) = L (t) = l g (γ ) = g¯ −
dann gilt nach Voraussetzung L (t) = L¯ (t) und damit
γ˙ (t) g = (φ ◦ γ ) (t)
−
g¯
11.3
Zusammenhang und kovariante Ableitung
265
bzw. |g (V , V )| = |φ ∗ g¯ (V , V )| . Da φ typerhaltend ist, folgt die Behauptung. Die Beweise der restlichen Aussagen von Bemerkung 11.4 kann man in [55] nachlesen.
11.3
Zusammenhang und kovariante Ableitung
Ein Tangentialvektor ist eine Richtungsableitung, die auf eine glatte Funktion f ∈ F (M) wirkt. Es gibt jedoch keine aus den differenziellen Eigenschaften von M direkt ableitbare Richtungsableitung, die auf Vektoren, Einsformen oder beliebige Tensoren wirkt. Wir brauchen eine zusätzliche Struktur, die insbesondere den Transport von Tensoren aus unterschiedlichen (Ko-)Tangentialräumen festlegt. Für Vektorfelder beginnen wir mit einer anschaulichen Einführung, die sich an [18] anlehnt. Heuristische Einführung Die Ableitung eines Vektorfeldes V = V μ eμ nach x ν im Rn hat die μ-te Komponente V μ x 1, . . . , x ν + d x ν , . . . , x n − V μ x 1, . . . , x ν , . . . , x n ∂V μ = lim , d x ν →0 ∂xν dxν dabei ist der erste Term im Zähler an der Stelle x +d x und der zweite an der Stelle x definiert. Um die Differenz der Vektorkomponenten bilden zu können, haben wir stillschweigend unterstellt, dass wir V (x) ohne Änderung nach x +d x transportiert haben und dass V dort die gleichen Komponenten V μ (x) hat. Eine solche Verschiebung nennt man Paralleltransport. In beliebigen Mannigfaltigkeiten besteht das Problem darin, dass Vektoren an unterschiedlichen Stellen der Mannigfaltigkeit aus unterschiedlichen Tangentialräumen stammen und es keinen natürlichen Mechanismus gibt, der einen Vektor aus einem Tangentialraum in einen anderen parallel transportiert. Um eine valide Ableitung zu konstruieren, müssen wir einen solchen Paralleltransport separat spezifizieren. Dazu betrachten wir am Punkt (x ν + d x ν ) zwei Vektoren, der eine ist V xν + dxν = V xν + dV , und der andere ist ein Vektor, der parallel zu V an der Stelle (x ν ) ist und den wir mit V˜ x ν + d x ν = V x ν + δV bezeichnen, siehe Abb. 11.1.
266
11 Semi-Riemann’sche Mannigfaltigkeiten
Abb.11.1 Parallelverschiebung eines Vektors
Wir bilden jetzt die Differenz der beiden Vektoren, die wir mit DV bezeichnen, dann folgt für die Komponenten DV μ = V μ x ν + d x ν − V˜ μ x ν + d x ν = d V μ − δV μ . Wir verlangen nun, dass die Komponenten δV μ sowohl proportional zu den Vektorkompoμ nenten V ρ als auch zu den „Verschiebungen“ d x ν sind, d. h., es gibt Zahlen νρ , sodass δV μ = − μνρ V ρ d x ν
(11.24)
gilt. Den Grenzwert lim ν
d x →0
DV μ V μ (x ν + d x ν ) − V˜ μ (x ν + d x ν ) ∂ = lim ∂μ = μ d x ν →0 dxν dxν
∂V μ μ ρ ∂μ + V νρ ∂xν
nennt man kovariante Ableitung von V nach x ν . Sie ist ein Vektor, da sie aus der Differenz von zwei Vektoren am gleichen Ort (x ν + d x ν ) entstanden ist. Die kovariante Ableitung ist nicht eindeutig, da es viele verschiedene Arten des Paralleltransports, d. h. viele verschiedene μ Auswahlmöglichkeiten der νρ gibt. Wir schauen uns ein einfaches Beispiel an (siehe auch [18]).
Beispiel 11.5
Wir betrachten den zweidimensionalen euklidischen Raum R2 zunächst mit der Metrik
10 , μ, ν ∈ {x, y} . gμν = δμν = 01 μ
In kartesischen Koordinaten sind alle ρν = 0, da mit der üblichen Parallelverschiebung von Vektoren V˜ μ (x + d x, y + dy) = V μ (x, y)
11.3
Zusammenhang und kovariante Ableitung
267
gilt. Nun wechseln wir zu Polarkoordinaten (μ, ν ∈ {r , ϕ}) (r , ϕ) → (r cos ϕ, r sin ϕ) und erhalten mit grr = 1, gr ϕ = gϕr = 0, gϕϕ = r 2 für die Metrik g pol = dr ⊗ dr + r 2 dϕ ⊗ dϕ. Wir betrachten nun einen Vektor V = V r ∂r + V ϕ ∂ϕ am Ort (r , ϕ), den wir als Erstes zum Ort (r + dr , ϕ) parallel verschieben wollen und dort mit V˜ (r + dr , ϕ) = V˜ r ∂r + V˜ ϕ ∂ϕ bezeichnen, siehe Abb. 11.2. Den Vektor V in (r , ϕ) können wir in seine Komponenten zerlegen und erhalten
Abb. 11.2 Paralleltransport in Polarkoordinaten
268
11 Semi-Riemann’sche Mannigfaltigkeiten
V r = |V | cos ϑ 1 V ϕ = |V | sin ϑ, r wobei ϑ der Winkel zwischen V und ∂r ist. Der Faktor
1 bei V ϕ ist wegen r
g pol (V , V ) = dr ⊗ dr + r 2 dϕ ⊗ dϕ |V | cos ϑ ∂r + |V | 1 sin ϑ ∂ϕ, |V | cos ϑ ∂r + |V | 1 sin ϑ ∂ϕ r r 2 2 2 2 = |V | cos ϑ + sin ϑ = |V |
erforderlich. Aus Abb. 11.2 liest man ab, dass V˜ r = V r ist. Für die zweite Komponente ergibt sich r 1 sin ϑ = V ϕ. V˜ ϕ = |V | r + dr r + dr Mithilfe des Differenzials erhalten wir dr r =1− , r + dr r also V˜ ϕ = |V |
1 dr ϕ sin ϑ = V ϕ − V , r + dr r
und damit zusammengefasst δV r = V˜ r − V r = 0 dr δV ϕ = V˜ ϕ − V ϕ = − V ϕ . r Ein Vergleich mit (11.24) führt zu r r r 0 = − rr V dr + rr ϕ V ϕ dr ⇒ rr = rr ϕ = 0 ϕ r dr 1 ϕ − V ϕ = − rr V dr + rϕϕ V ϕ dr ⇒ rr = 0, rϕϕ = . r r Als Zweites verschieben wir den Vektor V parallel zum Punkt (r , ϕ + dϕ) und sehen in Abb. 11.2, dass der Winkel zwischen V˜ am Ort (r , ϕ + dϕ) und ∂r jetzt ϑ − dϕ beträgt. Wir erhalten ganz ähnlich wie oben V˜ r = |V | cos (ϑ − dϕ) = |V | cos ϑ + |V | sin ϑ dϕ = V r + V ϕ r dϕ 1 1 1 1 V˜ ϕ = |V | sin (ϑ − dϕ) = |V | sin ϑ − |V | cos ϑ dϕ = V ϕ − V r dϕ r r r r
11.3
Zusammenhang und kovariante Ableitung
269
und wiederum durch Vergleich r r r r r V ϕ r dϕ = − ϕr V dϕ + ϕϕ V ϕ dϕ ⇒ ϕr = 0, ϕϕ = −r ϕ r dϕ r 1 ϕ ϕ ϕ − V = − ϕr V dϕ + ϕϕ V ϕ dϕ ⇒ ϕr = , ϕϕ = 0. r r Die acht Zahlen σ μν werden Christoffel-Symbole genannt, und wir werden sehen, dass diese stets bei sogenannten Zusammenhängen auftauchen. In unserem Beispiel sind die Christoffel-Symbole in den beiden unteren Indizes symmetrisch σ μν = σ νμ und wir haben auch unterstellt, dass die Länge des Vektors sich bei Parallelverschiebungen nicht ändert. Diese beiden Eigenschaften zeichnen einen besonderen Zusammenhang aus, dem wir uns im Folgenden nähern werden. Affiner Zusammenhang und kovariante Ableitung Wir verallgemeinern die Ergebnisse des letzten Beispiels und definieren die Objekte zunächst koordinatenfrei. Definition 11.7 Seien V1 , V2 , X 1 , X 2 ∈ T10 (M), f , g ∈ F (M) und λ1 , λ2 ∈ R. 1. Ein affiner (linearer) Zusammenhang ∇ ist eine Abbildung T10 (M) × T10 (M) → T10 (M) ∇: → ∇ (V , X ) =: ∇V X (V , X ) mit folgenden Eigenschaften: a) f -Linearität im ersten Argument: ∇ f V1 +gV2 X = f ∇V1 X + g∇V2 X ,
(11.25)
b) Linearität im zweiten Argument: ∇V (λ1 X 1 + λ2 X 2 ) = λ1 ∇V X 1 + λ2 ∇V X 2 , c) Leibniz- bzw. Produkt-Regel: ∇V ( f X ) = V ( f ) X + f ∇V X . 2. Wählt man ein festes V ∈ T10 (M), so heißt DV := ∇ (V , ·) : T10 (M) → T10 (M)
(11.26)
270
11 Semi-Riemann’sche Mannigfaltigkeiten
die kovariante Ableitung in Richtung V . Sie ist wegen (c) nach dem Konstruktionshilfssatz 9.1 eine Tensorderivation und somit nicht nur auf Vektorfelder, sondern auf jeden Tensor Tsr anwendbar. 3. Den Zusammenhang ∇ allein kann man auch als Abbildung T10 (M) → T11 (M) (11.27) ∇: X → ∇ (·, X ) =: ∇ X mit ∇ X (V , ω) := ω (∇V X ) , ω ∈ T01 (M) auffassen und nennt ihn dann einfach kovariante Ableitung von X . 4. Setzt man V = ∂μ und X = ∂ν , so ist ∇V X wieder ein Vektorfeld, das sich lokal als Linearkombination der Basis-Vektoren darstellen lässt: ρ ∇∂μ ∂ν = μν ( p) ∂ρ .
(11.28)
ρ
Die Komponentenfunktionen μν ( p) werden Christoffel-Symbole des Zusammenhangs ∇ genannt und beschreiben, wie sich die Basisvektoren von Punkt zu Punkt verändern. Für die linke Seite schreiben wir – wie in der physikalischen Literatur (siehe z. B. [18]) üblich – zukünftig meist kurz: ∇μ ∂ν := ∇∂μ ∂ν Beispiel 11.6
Ist M = Rn und (∂1 , . . . , ∂n ) die Koordinatenbasis im T (Rn ) ∼ = Rn , dann wird der euklidische Zusammenhang durch ∇V (X ) := V (X ) definiert. In Koordinaten erhalten wir ∇V (X ) = V X μ ∂μ = V ν ∂ν X μ ∂μ = V ν
(11.29)
∂ Xμ ∂xν
∂μ .
Der Tangentialvektor V ∈ T p M wirkt in einem Punkt p ∈ Rn auf die Komponentenfunktionen X μ ( p), und die daraus entstehenden Funktionen V (X μ ) ( p) sind die Komponenten des in Richtung V transportierten Vektors V (X μ ) ∂μ . Für die kartesische Basis eμ gilt ∇eμ eν = eμ (eν ) = 0,
11.3
Zusammenhang und kovariante Ableitung
271
da eν ein konstantes Vektorfeld ist. Damit sind nach (11.28) die Christoffel-Symbole ρ null, μν = 0. Neben den drei Eigenschaften aus dem ersten Teil der Definition 11.7 erfüllt der euklidische Zusammenhang zusätzlich: d) V (X · Y ) = ∇V (X ) · Y + X · ∇V (Y ), e) ∇V (X ) − ∇ X (V ) = [V , X ] , wobei der Punkt · das übliche Skalarprodukt im Rn bezeichnet.
Aufgabe 11.7 Zeigen Sie, dass der euklidische Zusammenhang die Eigenschaften a) bis d) erfüllt.
Lösung Wir überprüfen die verlangten Eigenschaften: a) ∇ f V1 +gV2 X = ( f V1 + gV2 ) X μ ∂μ = ( f V1 X μ + gV2 X μ ) ∂μ = f ∇V1 X + g∇V2 X , b) ∇V (λ1 X 1 + λ2 X 2 ) = V (λ1 X 1 + λ2 X 2 ) = λ1 V (X 1 ) + λ2 V (X 2 ) = λ1 ∇V X 1 + λ2 ∇V X 2 , c) ∇V ( f X ) = V ( f X ) = V ( f ) X + f V (X ) = V ( f ) X + ∇V X , d) V (X · Y ) = V (X ) · Y + X · V (Y ) = (∇V X ) · Y + X · (∇V Y ) , e) ∇V X − ∇ X V = V X − X V = [V , X ]. Auf einer beliebigen Mannigfaltigkeit sind die Eigenschaften d) und e) im Allgemeinen nicht erfüllt, und wir werden später sehen, dass es auf einer Semi-Riemann’schen Mannigfaltigkeit einen Zusammenhang gibt, der etwas ganz Ähnliches bewirkt. Zunächst schauen wir uns einige Koordinatendarstellungen der kovarianten Ableitung an. Koordinatendarstellung von kovarianten Ableitungen 1. Ist in lokalen Koordinaten X = X ρ ∂ρ , so folgt für die kovariante Ableitung in Richtung ∂μ mit (11.26) und (11.28) ∇μ X = ∇μ X ρ ∂ρ = ∂μ X ρ ∂ρ + X ρ ∇μ ∂ρ σ = ∂μ X ρ ∂ρ + X ρ μρ ∂σ
ρ ∂X ρ = + μν X ν ∂ρ , ∂xμ
(11.30)
272
11 Semi-Riemann’sche Mannigfaltigkeiten
wobei wir in der letzten Gleichung die Vertauschung ρ → ν, σ → ρ vorgenommen haben. Spezifiziert man die Ableitungsrichtung nicht, so ergibt sich für die kovariante Ableitung:
ρ μ ∂X ρ ν ∇ X = ∇μ X d x = + μν X ∂ρ ⊗ d x μ ∂xμ 2. Ist V = V μ ∂μ eine lokale Koordinatendarstellung, so gilt mit (11.25) ρ
ρ μ μ ∂X ρ ν μ ∇V X = ∇V ∂μ X = V ∇μ X ∂ρ = V + μν X ∂ρ , ∂xμ
(11.31)
∇V X ist also im Gegensatz zur Lie-Ableitung (9.48) unabhängig von der Ableitung von V . Ein Vergleich mit (11.29) zeigt nochmals, dass die Christoffel-Symbole in kartesischen Koordinaten für M = Rn gleich null sind. 3. Speziell für X = ∂ν folgt aus (11.31) ρ ∇V ∂ν = V μ μν ∂ρ .
(11.32)
4. Da die kovariante Ableitung eine Tensorderivation ist, können wir beliebige Tensoren kovariant ableiten. Für die kovariante Ableitung einer glatten Funktion f ∈ F (M) folgt aus der Definition 9.4 ∇V f = V ( f ) . (11.33) 5. Für eine Einsform ω erhalten wir aus (9.39) koordinatenfrei: (∇V ω) (X ) = ∇V (ω (X )) − ω (∇V X ) = V (ω (X )) − ω (∇V X )
(11.34)
Für die Koordinatendarstellung betrachten wir eine Basiseinsform d x ρ und berechnen deren Ableitung: ∇V d x ρ (∂ν ) = V d x ρ (∂ν ) − d x ρ (∇V ∂ν ) σ ∂σ = V δ ρν −d x ρ V μ μν =0
σ = −V μ μν d x ρ (∂σ ) ρ , = −V μ μν
wobei wir in der zweiten Gleichung die Formel (8.9) genutzt haben. Für ω = ων d x ν folgt daraus σ ∂σ (∇V ω)ρ = (∇V ω) ∂ρ = V μ ∂μ ων d x ν ∂ρ − ων d x ν V μ μρ σ ωσ . (11.35) = V μ ∂μ ωρ − V μ μρ 6. Ist V = ∂μ , so erhalten wir
∇μ ω
ρ
σ = ∂μ ωρ − μρ ωσ =
∂ωρ σ − μρ ωσ . ∂xμ
11.3
Zusammenhang und kovariante Ableitung
273
7. Die allgemeine Formel für beliebige Tensoren: ν νs r 1 Tsr = T μν11...μ ...νs ∂μ1 ⊗ · · · ⊗ ∂μr ⊗ d x ⊗ · · · ⊗ d x ergibt sich mit (9.40): μ ...μ μ1 σ μ2 ...μr μ2 μ1 σ ...μr μr μ1 ...μr −1 σ r r 1 ∇ρ T μν11...μ ...νs = ∂ρ T ν1 ...νs + ρσ T ν1 ...νs + ρσ T ν1 ...νs + · · · + ρσ T ν1 ...νs τ μ1 ...μr τ μ1 ...μr r − τ − ρν T μτ1ν...μ ρν2 T ν1 τ ...νs − · · · − ρνs T ν1 ...νs−1 τ 1 2 ...νs
(11.36)
Die Formel ist recht unübersichtlich, deshalb schauen wir uns zwei Beispiele an. Beispiel 11.7
1. Sei T02 = T μν ∂μ ⊗ ∂ν ein kontravariantes Tensorfeld zweiter Stufe, dann gilt für die Komponenten von ∇ρ T02 : μ ν ∇ρ T μν = ∂ρ T μν + ρσ T σ ν + ρτ T μτ
(11.37)
2. Für einen Tensor vom Rang (1, 2) erhalten wir analog: τ ∇σ T μνρ = ∂σ T μνρ + σμτ T τνρ − στ ν T μτρ − σρ T μντ
Transformation der Christoffel-Symbole Wir wollen noch explizit die Koordinatentransformationsformel für die Christoffel-Symbole ableiten und damit zeigen, dass diese keine Tensoren sind. Ausgangspunkt ist die Transformationsgleichung für die Komponenten der kovarianten Ableitung eines Vektors X = X ν eν :
∇μ X ν =
∂xμ ∂xν ∇μ X ν ∂xμ ∂xν
(11.38)
Wir rechnen zunächst mit (11.30) die linke Seite der Gl. (11.38) aus: ρ ∂xμ ∂xν ν ν ν ν ρ ν ∂ x X Xρ + ∇μ X = ∂μ X + μ ρ X = μ ∂μ μρ ∂xν ∂xρ ∂x
=
∂xμ ∂xν ∂ xμ ∂2xν ∂xρ ρ ∂μ X ν + μ μ ν X ν + μν ρ X ν μ ∂xρ ∂x ∂x ∂x ∂x ∂x
Die rechte Seite von (11.38) ergibt
∂xμ ∂xν ∂xμ ∂xν ν ∂xμ ∂xν ν ν ∇ X = ∂ X + Xρ. μ μ ∂xμ ∂xν ∂xμ ∂xν ∂ x μ ∂ x ν μρ Gleichsetzen und Vereinfachen führt mit ν → ρ im letzten Term zu
274
11 Semi-Riemann’sche Mannigfaltigkeiten
∂xμ ∂xν ν ∂ xμ ∂2xν ∂xρ ρ X = μ μρ X ρ − μ μ ρ X ρ . ρ ν ∂x ∂x ∂x ∂x ∂x ∂x
μν ρ
Diese Gleichung gilt für beliebige Vektoren X , d. h., wir können die Vektorkomponenten ∂xρ weglassen und erhalten nach Multiplikation mit ρ ∂x μν ρ
∂xμ ∂xν ∂xρ ν ∂ xμ ∂ xρ ∂2xν = μ − , μρ ∂x ∂xν ∂xρ ∂xμ ∂xρ ∂xμ ∂xρ
(11.39)
also die Transformationsformel für die Christoffel-Symbole. Diese ist keine Koordinatentransformation eines Tensors, denn der zweite Term auf der rechten Seite verhindert das. ν Wenn wir einen weiteren Zusammenhang ∇¯ mit zugehörigen Christoffel-Symbolen ¯ μρ hernehmen und die Differenz der Christoffel-Symbole transformieren, so erhalten wir μν ρ − ¯ μν ρ =
∂xμ ∂xν ∂xρ ν ¯ν μρ − μρ , ν μ ρ ∂x ∂x ∂x
(11.40)
da die zweiten Ableitungen in (11.39) sich gegenseitig aufheben. Wir erhalten folgende wichtige Aussage:
Die Differenz zweier Christoffel-Symbole ist ein Tensor vom Rang (1, 2).
11.4
Der Levi-Civita-Zusammenhang
Der folgende Satz wird auch Fundamentalsatz der Riemann’schen Geometrie genannt. Er besagt, dass es auf Semi-Riemann’schen Mannigfaltigkeiten einen eindeutig bestimmten Zusammenhang gibt, der – ähnlich wie der euklidische Zusammenhang (11.29) – zwei zusätzliche Eigenschaften aufweist. Dieser Zusammenhang ist nach dem italienischen Mathematiker Tullio Levi-Civita (1873–1941) benannt. Satz 11.1 Auf einer Semi-Riemannn’schen Mannigfaltigkeit (M, g) existiert genau ein Zusammenhang ∇ mit zwei im Vergleich mit Definition 11.7 zusätzlichen Eigenschaften: d) Ricci-Bedingung: V (g (X , Y )) = g (∇V X , Y ) + g (X , ∇V Y ) ,
(11.41)
11.4
Der Levi-Civita-Zusammenhang
275
e) Torsionsfreiheit: ∇V X − ∇ X V = [V , X ] . ∇ wird Levi-Civita-Zusammenhang genannt.
(11.42)
Bemerkung 11.5 1. Als Torsion wird ein Tensorfeld T ∈ T21 (M) mit T (ω, V , X ) := ω (∇V X − ∇ X V − [V , X ])
(11.43)
bzw. gleichwertig T : T10 (M) × T10 (M) → T10 (M) mit T (V , X ) := ∇V X − ∇ X V − [V , X ] bezeichnet. Für den Levi-Civita-Zusammenhang verschwindet also die Torsion. 2. Wenn wir die Metrik auf zwei Vektorfeldern X und Y auswerten, so erhalten wir die Funktion g (X , Y ), deren kovariante Ableitung sich als Tensorderivation gemäß (9.40) durch ∇V (g (X , Y )) = (∇V g) (X , Y ) + g (∇V X , Y ) + g (X , ∇V Y )
(11.44)
berechnen lässt. Nun gilt für die Funktion auf der linken Seite ∇V (g (X , Y )) = V (g (X , Y )) , d. h., aus der Ricci-Bedingung folgt (∇V g) (X , Y ) = 0 für alle X , Y ∈ T10 (M), d. h.
∇V g = 0.
(11.45)
Die kovariante Ableitung der Metrik ist identisch null; diese Eigenschaft des Zusammenhangs nennt man auch metrisch bzw. metrische Verträglichkeit.
Aufgabe 11.8
Beweisen Sie die Formel von Koszul:
2 g (∇V X , Y ) = V (g (X , Y )) + X (g (Y , V )) − Y (g (V , X )) + g (X , [Y , V ]) + g (Y , [V , X ]) − g (V , [X , Y ])
(11.46)
276
11 Semi-Riemann’sche Mannigfaltigkeiten
Lösung Setzt man (11.42) in (11.41) ein, so erhält man V (g (X , Y )) = g (∇V X , Y ) + g (X , ∇Y V ) + g (X , [V , Y ]) und entsprechend durch zyklische Vertauschung X (g (Y , V )) = g (∇ X Y , V ) + g (Y , ∇V X ) + g (Y , [X , V ]) Y (g (V , X )) = g (∇ Z V , X ) + g (V , ∇ X Y ) + g (V , [Y , X ]) . Wir addieren die beiden ersten Gleichungen, ziehen die dritte ab und erhalten nach einigen Detailrechnungen die Formel von Koszul (11.46). Mit der Formel von Koszul kann man die Existenz und Eindeutigkeit des Levi-CivitaZusammenhangs beweisen (siehe z. B. [19] oder [32]). Bemerkung 11.6 1. Wir setzen in die Formel von Koszul drei Basisvektorfelder V = ∂μ , X = ∂ν , Y = ∂ρ ein und erhalten 2 g ∇∂μ ∂ν , ∂ρ = ∂μ g ∂ν , ∂ρ + ∂ν g ∂ρ , ∂μ − ∂ρ g ∂μ , ∂ν = ∂μ gνρ + ∂ν gρμ − ∂ρ gμν , da die Lie-Klammern der Basisvektoren nach (8.24) verschwinden. Die linke Seite berechnet sich mit (11.28) zu σ σ σ 2 g ∇∂μ ∂ν , ∂ρ = 2 g μν ∂σ , ∂ρ = 2μν g ∂σ , ∂ρ = 2μν gσρ , woraus nach Multiplikation mit der Inversen g τρ die wichtige Formel τ = μν
1 τρ g ∂μ gνρ + ∂ν gρμ − ∂ρ gμν 2
(11.47)
folgt. Die Christoffel-Symbole kann man also durch die Metrik und ihre ersten Ableitungen berechnen. Hat die Metrik konstante Komponenten wie bspw. in der kartesischen Minkowski-Raumzeit, so sind die Ableitungen der Metrik und damit die ChristoffelSymbole gleich null. 2. Die Torsionsfreiheit (11.42) angewendet auf die Basisvektoren ergibt σ σ ∇∂μ ∂ν − ∇∂ν ∂μ = μν − νμ ∂σ = ∂μ , ∂ν = 0. Daraus folgt die Symmetrie der Christoffel-Symbole in den beiden unteren Indizes:
11.4
Der Levi-Civita-Zusammenhang
277 σ σ μν = νμ ,
(11.48)
was man wegen der Symmetrie der Metrik auch direkt an (11.47) ablesen kann. 3. Aus der Torsionsfreiheit folgt sofort, dass die Lie-Ableitung zweier Vektorfelder (9.43) als L V X = [V , X ] = ∇V X − ∇ X V (11.49) geschrieben werden kann. Das ist aber nichts anderes als Gl. (8.25): [V , X ] = V μ ∂μ X ν − X μ ∂μ V ν ∂ν , da sich aufgrund der Symmetrie in den beiden unteren Indizes die Christoffel-Symbole in der Differenz der kovarianten Ableitung gegenseitig aufheben und nur noch die partiellen Ableitungen übrig bleiben.
Wir setzen ab sofort immer voraus, dass die von uns untersuchte Lorentz-Mannigfaltigkeit mit dem Levi-Civita-Zusammenhang ausgestattet ist.
Beispiel 11.8
Wir berechnen mit der Formel (11.47) die Christoffel-Symbole der Kugeloberfläche mit festem Radius R und benutzen Kugelkoordinaten. Aus der in (9.33) angegebenen Metrik folgt das Linienelement: ds 2 = R 2 dϑ 2 + R 2 sin2 ϑ dϕ 2 , woraus sich die Komponenten der Metrik:
2 0 R gμν = 0 R 2 sin2 ϑ ableiten. Die inverse Metrik ist ⎛
1 μν ⎜ 2 R =⎝ g 0
⎞ 0 ⎟ ⎠. 1 2 R 2 sin ϑ
Die einzige nichtverschwindende Ableitung ist ∂ϑ gϕϕ = 2R 2 sin ϑ cos ϑ.
278
11 Semi-Riemann’sche Mannigfaltigkeiten
Damit folgt für die Christoffel-Symbole: ϑ = ϑϑ ϕ
ϑϑ = ϑ = ϑϕ ϕ
ϑϕ = = ϑ ϕϑ = ϑ = ϕϕ
= ϕ = ϕϕ
1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2 1 2
1 ϑϕ g ∂ϑ g ϕϑ + ∂ϑ g ϕϑ − ∂ϕ g ϑϑ = 0 2 1 g ϕϑ (∂ϑ g ϑϑ + ∂ϑ g ϑϑ − ∂ϑ g ϑϑ ) + g ϕϕ ∂ϑ g ϕϑ + ∂ϑ g ϕϑ − ∂ϕ g ϑϑ = 0 2 1 g ϑϑ ∂ϕ g ϑϑ + ∂ϑ g ϑϕ − ∂ϑ g ϑϕ + g ϑϕ ∂ϕ g ϕϑ + ∂ϑ g ϕϕ − ∂ϕ g ϑϕ = 0 2 1 g ϕϑ ∂ϕ g ϑϑ + ∂ϑ g ϑϕ − ∂ϑ g ϑϕ + g ϕϕ ∂ϕ g ϕϑ + ∂ϑ g ϕϕ − ∂ϕ g ϑϕ 2 1 cos ϑ ϕ 2 · 2 2 2R sin ϑ cos ϑ = = cot ϑ = ϕϑ sin ϑ R sin ϑ 1 g ϑϑ ∂ϑ g ϑϕ + ∂ϕ g ϑϑ − ∂ϑ g ϕϑ + g ϑϕ ∂ϑ g ϕϕ + ∂ϕ g ϕϑ − ∂ϕ g ϕϑ = 0 2 1 ϑϕ ϑϑ g ∂ϕ g ϑϕ + ∂ϕ g ϑϕ − ∂ϑ g ϕϕ + g ∂ϕ g ϕϕ + ∂ϕ g ϕϕ − ∂ϕ g ϕϕ 2 1 2 · 2 −2R sin ϑ cos ϑ = − sin ϑ cos ϑ R 1 g ϕϑ ∂ϕ g ϑϕ + ∂ϕ g ϑϕ − ∂ϑ g ϕϕ + g ϕϕ ∂ϕ g ϕϕ + ∂ϕ g ϕϕ − ∂ϕ g ϕϕ = 0 2 g ϑϑ (∂ϑ g ϑϑ + ∂ϑ g ϑϑ − ∂ϑ g ϑϑ ) +
Also sind alle Christoffel-Symbole gleich null, bis auf ϕ
ϕ
ϑϕ = ϕϑ = cot ϑ
(11.50)
ϑ ϕϕ = − sin ϑ cos ϑ.
11.5
Paralleltransport und Geodäten
Paralleltransport Wir wollen in der Raumzeit, d. h. auf einer Lorentz-Mannigfaltigkeit (M, g), den Paralleltransport (wir benutzen alternativ auch die Bezeichnung Parallelverschiebung) eines Vektors entlang einer Kurve definieren und schauen uns zunächst ein Beispiel aus der euklidischen Geometrie an.
Beispiel 11.9
Wir nehmen einen Vektor und verschieben ihn parallel um eine geschlossene Kurve herum. In Abb. 11.3 demonstrieren wir das an einem Kreis in der euklidischen Ebene, um den herum der Vektor v parallel transportiert wird. Dabei heißt parallel transportiert, dass
11.5
Paralleltransport und Geodäten
279
Abb. 11.3 Parallelverschiebung n euklidischer Ebene
an jedem Punkt entlang einer Umrundung des Kreises der Vektor parallel zu dem am vorherigen Punkt ist. Wir stellen fest, dass der Vektor nach Umrundung der Kurve in genau die gleiche Richtung zeigt wie beim Start. Anders sieht die Situation auf intrinsisch gekrümmten Flächen aus. Als Beispiel betrachten wir die Kugeloberfläche. In Abb. 11.4 wird ein Vektor von einem Punkt A über den Nordpol und den Punkt B parallel zurück nach A transportiert. Auf dem ersten Wegstück von A zum Nordpol wird der Vektor so auf dem Großkreis verschoben, dass er stets tangential zum Großkreis ist. Am Nordpol angekommen, bildet der Vektor mit dem Großkreis, der von B und dem Nordpol gebildet wird, einen bestimmten Winkel. Er wird vom Nordpol nach B in der Weise verschoben, dass dieser Winkel stets gleich bleibt. In B angekommen, bildet der Vektor mit dem Großkreis, der von A und B gebildet wird (in Abb. 11.4 der Äquator), einen Winkel, und er wird unter Beibehaltung dieses Winkels zurück nach A geschoben. Wie man der Abbildung entnehmen kann, stimmt der Anfangsvektor nicht mit dem Endvektor im Punkt A überein. Beide Vektoren an der Stelle A bilden einen Winkel, der von null verschieden ist, α = 0. Wir werden später sehen, dass man mit diesem Winkel die (überall gleiche) Krümmung der Kugeloberfläche ausrechnen kann. Für die mathematisch genaue Beschreibung des Paralleltransports auf Mannigfaltigkeiten benötigen wir einige neue Begriffe.
280
11 Semi-Riemann’sche Mannigfaltigkeiten
Abb. 11.4 Parallelverschiebung auf einer Kugeloberfläche
Definition 11.8 Sei γ : I ⊂ R → M eine glatte Kurve mit dem Geschwindigkeitsvektorfeld γ˙ (t), siehe (9.60). 1. Ein Vektorfeld entlang γ ist eine Abbildung I → TM , X: t → X (t) ∈ Tγ (t) (M) mit T M wie in Definition 8.10, die glatt ist, d. h., für jede Karte (U , h) mit U ∩γ (I ) = ∅ sind die Komponenten X μ (t) in der Koordinatendarstellung X (t) = X μ (t) ∂μ (γ (t)) ,
γ (t) ∈ U
glatte Funktionen in t. 2. Mit Xγ (M) bezeichnen wir die Menge aller Vektorfelder entlang γ . 3. Sei V ∈ T10 (M) ein Vektorfeld, das in einer offenen Umgebung von γ (I ) definiert ist. Gilt dann
11.5
Paralleltransport und Geodäten
281
∇γ˙ (t) V = 0
(11.51)
für alle t ∈ I , so sagt man, dass V entlang γ parallel transportiert (oder parallel verschoben) wird. Der Vektor ∇γ˙ (t) V wird oftmals auch als ∇V dt
oder
DV dt
geschrieben und heißt kovariante Ableitung von V entlang γ .
Bemerkung 11.7 1. Mit den Koordinatendarstellungen V = V μ ∂μ ,
γ˙ =
dxν ∂ν dt
berechnet sich der Paralleltransport entlang γ mit Formel (11.31):
ν ν μ dxν dx ∂V μ μ dx ρ ν ∂μ ∇ν V ∂μ = V + νρ ∇γ˙ V = ∇ d x ∂ν V = dt dt dt ∂ x ν dt
μ ν dV μ dx + νρ V ρ ∂μ = 0, = (11.52) dt dt wobei wir in der letzten Gleichung die Kettenregel dxν ∂ d = dt dt ∂ x ν benutzt haben. 2. Für die Komponenten folgt also aus (11.52) ν dV μ μ dx + νρ V ρ = 0. dt dt
(11.53)
3. Etwas genauer als in Definition 11.8 gilt folgende Aussage. Ist (M, ∇) eine LorentzMannigfaltigkeit mit dem Zusammenhang ∇ und γ : I → M eine Kurve, so gibt es eine eindeutig bestimmte Abbildung ⎧ ∇ ⎨Xγ (M) → Xγ (M) : ∇X dt ⎩ X → dt mit folgenden Eigenschaften:
282
11 Semi-Riemann’sche Mannigfaltigkeiten
∇ ∇ ∇ X 1 + λ2 X 2 , f ur ¨ alle λ1 , λ2 ∈ R, (λ1 X 1 + λ2 X 2 ) = λ1 dt dt dt ∇ ∇ X b) , f ur ¨ alle f ∈ F (I ) , ( f · X ) = f˙ X + f dt dt 1 c) Ist X¯ ∈ T0 (M) mit a)
X¯ (γ (t)) = X (t) , so gilt
∇X = ∇γ˙ X¯ , dt
f ur ¨ t ∈ I¯ ⊂ I ,
f ur ¨ t ∈ I¯ ⊂ I .
Einen Beweis findet man in [55]. 4. Analog zu (11.51) können wir auch für beliebige Tensoren Tsr den Paralleltransport entlang γ (t) definieren: dxν ∇γ˙ (t) Tsr = ∇ν Tsr = 0 (11.54) dt 5. Da der Levi-Civita-Zusammenhang metrisch verträglich ist, gilt mit (11.45) ∇γ˙ (t) g =
dxν ∇ν g = 0. dt
Die Metrik wird also immer parallel transportiert. Damit und mit (11.44) können wir zeigen, dass das „innere Produkt“ zweier parallel transportierter Vektoren V , W ebenfalls parallel transportiert wird: ⎞ ⎞ ⎞ ⎛ ⎛ ⎛ ⎟ ⎟ ⎟ ⎜ ⎜ ⎜ ∇γ˙ (t) (g (V , W )) = ⎝∇γ˙ (t) g ⎠ (V , W ) + g ⎝∇γ˙ (t) V , W ⎠ + g ⎝V , ∇γ˙ (t) W ⎠ = 0 =0
=0
=0
(11.55)
Beispiel 11.10
Wir betrachten nochmals den euklidischen Zusammenhang im Rn aus Beispiel 11.7, d. h. ∇V X = V (X ) . Für X ∈ Xγ (Rn ) gilt mit der kartesischen Basis eμ X (t) = X μ (t) eμ und mit (11.52)
∇X d Xμ eμ = X˙ (t) , (t) = dt dt
11.5
Paralleltransport und Geodäten
283
da alle Christoffel-Symbole verschwinden. X ist also genau dann parallel verschoben, wenn X˙ (t) = 0 ⇔ X (t) = const.
gilt.
Satz 11.2 Ist (M, ∇) eine Lorentz-Mannigfaltigkeit mit dem Zusammenhang ∇ und γ : [a, b] → M eine Kurve, dann existiert für ein X a ∈ Tγ (a) M ein eindeutig bestimmtes entlang γ paralleltransportiertes Vektorfeld X ∈ Xγ (M) mit X (a) = X a . Die Abbildung
Pγ :
Tγ (a) M
→ Tγ (b) M
X (a) = X a → X (b)
ist ein linearer Isomorphismus der Tangentialräume und unabhängig von der Parametrisierung von γ . Sie wird Parallelverschiebung entlang γ genannt. Wir zeigen hier nur die Existenz des Vektorfeldes, die Beweise der übrigen Behauptungen findet man in [55]. Die Differenzialgleichung (11.53) ist von der Form ρ X˙ μ (t) = M (t)μ ρ X
(11.56)
mit einer Matrix M (t), also linear mit dem vorgegebenen Anfangswert X (a). Nach dem Satz von Picard-Lindelöf (siehe [12]) existiert eine lokal eindeutige Lösung des Anfangswertproblems (11.56). Wir überdecken γ ([a, b]) mit geeigneten Karten und erhalten die Lösungen des Anfangswertproblems auf den Teilintervallen. Bemerkung 11.8 Mit den Voraussetzungen von Satz 11.2 gilt für zwei entlang γ parallel verschobene Vektorfelder V , W gγ (t) (V (t) , W (t)) = gγ (a) (V (a) , W (a)) für alle t ∈ [a, b]. Denn mit (11.55) folgt d gγ (t) (V (t) , W (t)) = 0, dt
(11.57)
die Parallelverschiebung Pγ ist damit eine (semi-)orthogonale Abbildung, d. h., Längen (und Winkel) von Vektoren bleiben invariant.
284
11 Semi-Riemann’sche Mannigfaltigkeiten
Geodäten Als Spezialfall der Parallelverschiebung betrachten wir das Geschwindigkeitsvektorfeld γ˙ (t) einer gegebenen Kurve γ : I → M. Definition 11.9 Wir nennen eine Kurve γ (t), deren Geschwindigkeitsfeld parallel entlang der Kurve transportiert wird, Geodäte. Eine Geodäte erfüllt also ∇γ˙ γ˙ = bzw. mit γ˙ =
∇ γ˙ =0 dt
(11.58)
dxν ∂ν dt
in Komponenten ν ν ρ d2xμ (d γ˙ )μ μ dx μ dx dx + νρ = 0. + (γ˙ )ρ = νρ dt dt dt 2 dt dt
Geodäten werden auch autoparallele Kurven genannt.
(11.59)
Bemerkung 11.9 1. Gl. (11.59) stellt ein gekoppeltes System von vier gewöhnlichen Differenzialgleichungen zweiten Grades dar. Daher gibt es bei Vorgabe von Anfangswerten für x μ und d x μ /dt eine eindeutige (lokale) Lösung. Das heißt, für jeden Punkt p ∈ M und jeden Tangentialvektor V p ∈ T p M gibt es eine eindeutig bestimmte (maximale) Geodäte γ : 0 ∈ I → M mit γ (0) = p und γ˙ (0) = V p . dxμ 2. Ist U = U μ = die Vierergeschwindigkeit, so können wir die Geodätengleichung dt (11.59) auch als U ν ∇ν U μ = 0 (11.60) bzw. mit dem Viererimpuls P μ = mU μ auch als P ν ∇ν P μ = 0
(11.61)
schreiben. Die letzte Gleichung drückt aus, dass freifallende Teilchen sich in die Richtung bewegen, in die ihr Impuls zeigt. 3. Ist γ eine geodätische Kurve, so gilt mit (11.57)
γ˙ (t) = const., da die Parallelverschiebung die Längen erhält. Wir schauen uns einige Beispiele für Geodäten an.
11.5
Paralleltransport und Geodäten
285
Beispiel 11.11
1. Wir betrachten als Erstes die euklidische Ebene mit kartesischen Koordinaten. Dann μ folgt wegen νρ = 0 aus (11.59) d2x d2 y = 2 = 0. 2 dt dt Durch zweimalige Integration erhalten wir x = a·t +b y = c · t + d, und
a b γ (t) = t+ c d
ist wie erwartet eine gerade Linie. 2. Wir wollen die geodätischen Linien auf der Oberfläche einer Kugel mit Radius R bestimmen. Nach Beispiel 11.8 gilt ds 2 = R 2 dϑ 2 + R 2 sin2 ϑ dϕ 2 mit der Metrik
gμν =
0 R2 2 0 R sin2 ϑ
(11.62)
und den Christoffel-Symbolen ϕ
ϕ
ϑϕ = ϕϑ = cot ϑ ϑ ϕϕ = − sin ϑ cos ϑ.
Wir setzen μ, ν = ϑ, ϕ und erhalten aus der Geodätengleichung die beiden Gleichungen: d 2ϑ d 2ϑ ϑ dμ dν ϑ dϕ dϕ = + μν + ϕϕ 2 2 dt dt dt dt dt dt 2 d 2ϑ dϕ − sin ϑ cos ϑ =0 = 2 dt dt d 2ϕ d 2ϕ ϕ dϑ dϕ ϕ dμ dν = 2 + 2ϑϕ + μν 2 dt dt dt dt dt dt dϑ dϕ d 2ϕ =0 = 2 + 2 cot ϑ dt dt dt
(11.63)
(11.64)
Wir wollen die zweite Gleichung in die erste einsetzen und formen die erste etwas um. Zunächst gilt
286
11 Semi-Riemann’sche Mannigfaltigkeiten
" # dϑ d 2 ϕ d dϑ dϕ d 2ϑ d dϑ dϕ = + = = 2 dt dt dϕ dt dt dϕ dt dϕ dt 2 # " dϑ d 2 ϕ d 2 ϑ dϕ 2 dϑ d 2 ϕ dϕ dϕ d dϑ + = + . = dt dϕ dϕ dt dϕ dt 2 dϕ 2 dt dϕ dt 2 Damit folgt für die erste Gl. (11.63) d 2ϑ dϕ 2
dϕ dt
2
dϑ d 2 ϕ + − sin ϑ cos ϑ dϕ dt 2
dϕ dt
2 = 0.
Wir setzen die zweite Geodätengleichung (11.64): dϑ dϕ d 2ϕ = −2 cot ϑ dt 2 dt dt in die erste ein und erhalten:
dϕ 2 dϑ −2 cot ϑ + dt dϕ d 2 ϑ dϕ 2 dϑ −2 cot ϑ = + dϕ dϕ 2 dt
0=
d2ϑ dϕ 2
2 dϑ dϕ dϕ − sin ϑ cos ϑ dt dt dt 2 2 dϑ dϕ dϕ − sin ϑ cos ϑ (11.65) dϕ dt dt
2 Wir wollen den Term dϕ/dt kürzen und betrachten zunächst den Fall dϕ/dt = 0. Dann ist ϕ konstant, und die zweite Gleichung ist erfüllt. Es folgt aus der ersten Gleichung d 2ϑ = 0 ⇒ ϑ = a · t + b. dt 2 Diese Gleichung beschreibt alle Kurven auf der Kugel, die einen festen Längengrad haben, d. h. alle (halben) Längenkreise auf der Kugeloberfläche, die durch den Nordund Südpol gehen. Auf der Erde nennt man diese Kurven Meridiane. Ist dϕ/dt = 0, so können wir die Gl. (11.65) vereinfachen und erhalten 0=
d 2ϑ − 2 cot ϑ dϕ 2
dϑ dϕ
2 − sin ϑ cos ϑ.
Sei nun f (ϑ (ϕ)) = cot ϑ (ϕ), dann gilt df 1 =− 2 dϕ sin ϑ 1 d2 f =− 2 2 dϕ sin ϑ Wir setzen (11.66) ein und erhalten
dϑ dϕ d 2ϑ 2 cos ϑ + 2 dϕ sin3 ϑ
dϑ dϕ
2 .
(11.66)
11.5
Paralleltransport und Geodäten
287
2 cos ϑ dϑ 2 + sin ϑ cos ϑ + . 2 cot ϑ sin3 ϑ dϕ 2 cos ϑ dϑ 2 2 cos ϑ dϑ 2 =− 3 − cot ϑ + = − cot ϑ = − f (ϑ) . sin ϑ dϕ sin3 ϑ dϕ
1 d2 f =− 2 dϕ 2 sin ϑ
dϑ dϕ
2
Für die Funktion f erhalten wir als Lösung der Differenzialgleichung f = − f : f (ϑ (ϕ)) = A sin ϕ + B cos ϕ (= cot ϑ) mit zwei Integrationskonstanten A und B . Multiplikation der letzten Gleichung mit R sin ϑ ergibt schließlich: A R sin ϑ sin ϕ +B R sin ϑ cos ϕ − R cos ϑ = 0,
=y
=z
=x
also eine Gleichung der Form Ay + Bx + C z = 0. Diese Gleichung beschreibt eine Ebene durch den Nullpunkt, wenn x, y, z beliebig gewählt werden. Da wir den Mittelpunkt der Kugel in den Nullpunkt gelegt haben und x, y, z Punkte auf der Kugeloberfläche darstellen, erhalten wir alle Punkte, die auf Kurven liegen, die aus den Schnitten zwischen den Ebenen durch den Mittelpunkt und der Kugeloberfläche entstehen. Diese Kurven heißen Großkreise. Und da die Meridiane ebenfalls auf Großkreisen liegen, sind alle Geodäten auf einer Kugeloberfläche Großkreise.
Aufgabe 11.9 Berechnen Sie die Geodäten in der mit Polarkoordinaten ausgestatteten euklidischen Ebene.
Lösung Wir betrachten Polarkoordinaten in der euklidischen Ebene. Nach Beispiel 11.5 gilt ds 2 = dr 2 + r 2 dϕ 2 sowie
gμν =
1 0 0 r2
und ϕ = rϕϕ = ϕr
1 r
288
11 Semi-Riemann’sche Mannigfaltigkeiten r ϕϕ = −r ,
alle anderen Christoffel-Symbole verschwinden. Da die Polarkoordinaten auch in der euklidischen Ebene „leben“, sollten die Geodäten in Polarkoordinaten ebenfalls gerade Linien sein. Die allgemeinste Form einer Geraden in der Ebene lautet ax + by = c mit Konstanten a, b, c. Setzen wir Polarkoordinaten für x = r cos ϕ und y = r sin ϕ ein, so erhalten wir a r cos ϕ + b r sin ϕ = c. (11.67) Ein Ergebnis dieser Form erwarten wir also für die Geodätengleichung in Polarkoordinaten. Wir setzen μ = r , ϕ und ν = r , ϕ und erhalten aus der allgemeinen Geodätengleichung die beiden Gleichungen: μ ν d 2r r dx dx =0 + μν 2 ds ds ds d 2ϕ ϕ dμ dν =0 + μν 2 ds ds ds
Die erste Gleichung ergibt wegen r μν
=
−r μ = ϕ, ν = ϕ 0
sonst
die Beziehung d 2r d 2r r dϕ dϕ = 2 −r + ϕϕ 2 ds ds ds ds Analog ergibt sich wegen
ϕ μν
dϕ ds
2 = 0.
⎧1 ⎪ μ = r, ν = ϕ ⎪ ⎪ ⎪ r ⎪ ⎪ ⎪ ⎪ ⎨ = 1 μ = ϕ, ν = r ⎪ ⎪ r ⎪ ⎪ ⎪ ⎪ ⎪ ⎪ ⎩ 0 sonst
für die zweite Gleichung d 2ϕ dr dϕ ϕ dr dϕ + ϕr + rϕϕ ds 2 ds ds ds ds 2 dr dϕ d 2ϕ . + = ds 2 r ds ds
0=
11.5
Paralleltransport und Geodäten
289
Zusammengefasst erhält man also die beiden Gleichungen d 2r −r ds 2
dϕ ds
2 = 0,
(11.68)
2 dr dϕ d 2ϕ = 0. + ds 2 r ds ds
(11.69)
Ist ϕ = dϕ/ds = 0, so ist ϕ konstant, und es folgt auch d 2 ϕ/ds 2 = 0, d. h., die Gl. (11.69) ist erfüllt. Setzt man dϕ/ds = 0 in die Gl. (11.68) ein, so folgt d 2r = 0 ⇒ r = a · s + b. ds 2 Dies ist eine gerade Linie durch den Ursprung. Ist dϕ/ds = 0, so dividieren wir die Gleichung (11.69) durch ϕ und erhalten 0=
"
2 dr dϕ d 2ϕ + dϕ ds 2 r ds ds ds
# =
1 dϕ 2 dr + . ϕ ds r ds
Wir integrieren diese Gleichung, dann folgt # " 2 dr 1 dϕ 1 2 + ds = dr dϕ + 0= ϕ ds r ds ϕ r = ln ϕ + 2 ln r = ln ϕ + ln r 2 = ln r 2 ϕ . Exponieren ergibt eln
2 r |ϕ |
= r 2 ϕ = e0 = 1,
also r 2 ϕ = ±1 = h = const. ⇒ ϕ =
h dϕ = 2. dλ r
Wir dividieren das Linienelement ds 2 = dr 2 + r 2 dϕ 2 durch ds 2 und erhalten 2 2 2 2 2 h2 dϕ h dr dr dr + r2 = + r2 2 = + 2, 1= ds ds ds r ds r woraus
folgt. Wir bilden nun
% dr h2 =± 1− 2 ds r
290
11 Semi-Riemann’sche Mannigfaltigkeiten
h dϕ h dϕ 2 ds r = = ±& =± √ , 2 2 dr dr r r − h2 h 1− 2 ds r integrieren mit der Substitution u = h/r die rechte Seite: 1 h h dr = ∓ √ du = ∓ arccos u = ∓ arccos ± √ 2 2 2 r r r −h 1−u und erhalten mit einer geeigneten Integrationskonstanten h h ⇒ = cos(ϕ − ϕ0 ). ϕ − ϕ0 = arccos r r Beachtet man noch, dass mit einem Additionstheorem der Winkelfunktionen cos(ϕ − ϕ0 ) = cos ϕ cos ϕ0 + sin ϕ sin ϕ0 gilt, so ergibt sich schließlich die erwartete Geradengleichung (11.67) h = cos ϕ0 r cos ϕ + sin ϕ0 r sin ϕ. Bleibt eine Geodäte bei einer Umparametrisierung eine Geodäte? Die Antwort ist: nur bei bestimmten (einfachen) Umparametrisierungen. Satz 11.3 Sei γ : I → M eine nichtkonstante Geodäte und ϕ : J → I eine Umparametrisierung, dann ist die Kurve γ˜ := γ ◦ ϕ : J → M genau dann eine Geodäte, wenn ϕ eine affine Umparametrisierung ist, d. h., wenn ϕ (t) = at + b mit a, b ∈ R gilt.
Aufgabe 11.10
Beweisen Sie die Behauptung in Satz 11.3.
Lösung Zunächst gilt mit t˜ = ϕ (t) in einer Karte γ (t) = x μ (t) ∂μ ⇒ γ˜ (t) = x μ (ϕ (t)) ∂μ = x μ t˜ ∂μ . Mit (11.59) folgt
11.5
Paralleltransport und Geodäten
∇ γ˜ (t) dt
μ
= = = =
291
ρ ν ˜ d 2 x μ t˜ t˜ μ dx t dx + νρ 2 dt dt dt ρ 2 μ ν ˜ t˜ d t˜ d d x t˜ d t˜ μ dx t dx + νρ dt dt d t˜ dt d t˜ d t˜ ρ 2
2 ν ˜ d 2 x μ t˜ d t˜ d x μ t˜ d 2 t˜ t˜ d t˜ μ dx t dx + + νρ 2 2 dt dt d t˜ d t˜ dt d t˜ d t˜ ρ 2 2 μ ν μ 2 ˜ d x t˜ d x t˜ d t˜ t˜ d t˜ μ dx t dx + νρ + , 2 2 ˜ dt d t˜ d t˜ d t˜ d t dt
=0 =0
da γ eine Geodäte und nicht konstant ist. Also gilt
d 2 t˜ ∇ γ˜ (t) μ = 0 ⇔ 2 = 0 ⇔ t˜ = ϕ (t) = at + b. dt dt Geodäten als Kurven extremaler Länge Geodäten in flachen Raumzeiten sind Geraden, auf Lorentz-Mannigfaltigkeiten sind es Kurven, die so gerade wie möglich sind. In diesem Abschnitt zeigen wir, dass Geodäten, die zwei zeitartige Ereignisse in der Raumzeit verbinden, die Weltlinien von Teilchen mit der längsten Eigenzeit sind. Ein analoges Ergebnis haben wir für den Minkowski-Raum schon in Abschn. 2.5 hergeleitet. Wir verallgemeinern also diese Extremalaussage auf beliebige Lorentz-Mannigfaltigkeiten. Zunächst führen wir für Kurven auf Mannigfaltigkeiten eine Zeitorientierung ein. Definition 11.10 Ist g eine Metrik auf einer Lorentz-Mannigfaltigkeit, so nennt man eine Kurve γ (t) : I → M mit Tangentialvektor Vγ (t) = γ˙ (t) • zeitartig, wenn g Vγ (t) , Vγ (t) < 0, • lichtartig, wenn g Vγ (t) , Vγ (t) = 0, • raumartig, wenn g Vγ (t) , Vγ (t) > 0 für alle t ∈ I gilt.
Wir betrachten zwei Ereignisse A und B, die zeitartig getrennt sind, d. h., es gibt zeitartige Kurven γ (t), die die beiden Ereignisse verbinden. Dann wird – analog zur Speziellen Relativitätstheorie – die Eigenzeit zwischen A = γ (t1 ) und B = γ (t2 ) entlang einer solchen Weltlinie γ mit (11.4) durch
292
11 Semi-Riemann’sche Mannigfaltigkeiten
τ :=
−ds 2 = −gμν d x μ d x ν = γ
γ
t2
t1
& −gμν
dxμ dxν dt dt dt
(11.70)
definiert. Aus dieser Definition folgt unmittelbar dτ 2 = −ds 2 = −gμν d x μ d x ν und daraus gμν
2 dxμ dxν dτ =− = −1, dτ dτ dτ
(11.71)
(11.72)
also ein völlig analoges Ergebnis zum Skalarprodukt der Vierervektoren (3.14) in der Speziellen Relativitätstheorie: dX dX · = −1 U ·U = dτ dτ Um eine Kurve mit maximaler Eigenzeit zu finden, wenden wir den Lagrange-Mechanismus an. Aber anstatt direkt mit der Lagrange-Funktion & dxμ dxν L = −gμν dt dt zu arbeiten, vereinfachen wir zunächst die Aufgabenstellung. Dazu zeigen wir als Erstes, dass sich die Eigenzeit τ nicht ändert, wenn wir die Kurve umparametrisieren. Sei s = s (t) eine neue Parametrisierung, dann ist dt d x μ dxμ = ds ds dt der neue Tangentialvektor und die neue Eigenzeit τ ist s(t2 ) & dxμ dxν ds −gμν τ = ds ds s(t1 ) s(t2 ) & d x μ d x ν dt = ds −gμν dt dt ds s(t1 ) t2 & dxμ dxν = dt = τ. −gμν dt dt t1 Das Integral (11.70) ist von der Form τ=
− f dt,
und die Variation von τ (vergleiche (5.36)) ergibt sich zu 1 δτ = δ δ ( f ) dt. − f dt = − √ 2 −f
11.5
Paralleltransport und Geodäten
293
Wenn wir jetzt als Parameter der Kurve die Eigenzeit τ wählen, dann folgt mit (11.72) f = gμν und damit δτ = −
dxμ dxν = −1 dτ dτ 1 2
δ ( f ) dτ,
d. h., wir können als Lagrange-Funktion L=
1 dxμ dxν gμν 2 dτ dτ
(11.73)
wählen, was die folgenden Rechnungen deutlich vereinfacht. Die relativistischen EulerLagrange-Gleichungen (5.42) ergeben sich mit x˙ μ = d x μ /dτ zu
⎞
⎛ 1 1 μ ν μ ν
∂ gμν x˙ x˙ gμν x˙ x˙ ∂ ⎟ ∂L d d ⎜ ∂L 2 2 ⎟− ⎜ − 0= = ⎠ dτ ∂ x˙ ρ ∂xρ dτ ⎝ ∂ x˙ ρ ∂xρ ν 1 ∂ gμν μ ν d 1 ∂ x˙ μ ν 1 μ ∂ x˙ − gμν g x ˙ + x ˙ x˙ x˙ μν ρ ρ dτ 2 ∂ x˙ 2 ∂ x˙ 2 ∂xρ 1 ∂ gμν μ ν d gρμ x˙ μ − = x˙ x˙ dτ 2 ∂xρ ∂ gρμ μ ν 1 ∂ gμν μ ν d2xμ = x˙ x˙ + gρμ − x˙ x˙ ν ∂x dτ 2 2 ∂xρ
∂ gρμ ∂ gμν d x μ d x ν 1 ∂ gρν d2xμ . = gρμ + + − dτ 2 2 ∂xμ ∂xν ∂xρ dτ dτ =
Multiplikation mit g σρ führt mit (11.47) zu
∂ gρμ ∂ gμν d x μ d x ν d2xσ 1 σρ ∂ gρν 0= g + + − dτ 2 2 ∂xμ ∂xν ∂xρ dτ dτ =
μ ν d2xσ σ dx dx , + μν 2 dτ dτ dτ
(11.74)
also zur Geodätengleichung (11.59). Damit haben wir gezeigt, dass die Geodäten Kurven mit extremaler Eigenzeit sind. Dass diese tatsächlich die Eigenzeit (lokal) maximieren, liegt daran, dass man zu jeder zeitartigen Kurve zwischen zwei Ereignissen immer noch eine finden kann, deren Eigenzeit kleiner als die betrachtete ist (siehe z. B. [21]). Für spätere Zwecke merken wir uns ein Zwischenergebnis aus obiger Rechnung: 1 ∂ gμν μ ν d gρμ x˙ μ − x˙ x˙ = 0, dτ 2 ∂xρ
(11.75)
294
11 Semi-Riemann’sche Mannigfaltigkeiten
womit man die Geodätengleichung ohne die Christoffel-Symbole berechnen kann. Umgekehrt können in manchen Fällen die Christoffel-Symbole bequem mithilfe der LagrangeFunktion und den Euler-Lagrange-Gleichungen berechnet werden, was wir an einem Beispiel demonstrieren wollen. Beispiel 11.12
Auf der Einheitskugel im R3 ausgestattet mit dem Linienelement ds 2 = dϑ 2 + sin2 ϑ dϕ 2 lautet die Lagrange-Funktion 1 1 dxμ dxν = L = gμν 2 dτ dτ 2
dϑ dτ
2
+ sin ϑ 2
dϕ dτ
2 =
1 2 ϑ˙ + sin2 ϑ ϕ˙ 2 . 2
Daraus folgt d ∂L − dτ ∂ ϑ˙ d ∂L − dτ ∂ ϕ˙
2 ∂L d 2ϑ dϕ = − sin ϑ cos ϑ ∂ϑ dτ 2 dτ ∂L d 1 1 = sin2 ϑ ϕ˙ = sin ϑ cos ϑ ϑ˙ ϕ˙ + sin2 ϑ ϕ¨ ∂ϕ dτ 2 2
und damit die Euler-Lagrange-Gleichungen: d 2ϑ − sin ϑ cos ϑ dτ 2
dϕ dτ
2 =0
dϑ dϕ d 2ϕ = 0, + 2 cot ϑ dτ 2 dτ dτ woraus wir im Vergleich mit (11.74) die Christoffel-Symbole ϕ
ϕ
ϑ ϕϕ = − sin ϑ cos ϑ , ϕϑ = ϑϕ = cot ϑ
ablesen können.
11.6
Normalkoordinaten und Äquivalenzprinzip
In diesem Abschnitt präzisieren wir, was ein lokales Inertialsystem auf einer LorentzMannigfaltigkeit ist und wie das starke Äquivalenzprinzip (siehe Abschn. 7.6) in der SemiRiemann’schen Geometrie erfüllt wird. Dabei gehen wir eher anschaulich vor und lassen einige technische Details aus. Eine mathematisch genaue und ausführliche Herleitung der Ergebnisse in diesem Abschnitt findet man z. B. in [16].
11.6
Normalkoordinaten und Äquivalenzprinzip
295
In Definition 11.1 haben wir erläutert, dass man in einem Punkt p ∈ M einer Lorentz Mannigfaltigkeit stets eine Basis eμ von T p M mit g eμ , eν ( p) = gμν ( p) = ημν = diag (−1, 1, 1, 1)
(11.76)
finden kann. Wir werden zeigen, dass eine solche Basis immer eine Koordinatenbasis sein kann, d. h., es gibt ein Koordinatensystem x μ , sodass eμ = ∂μ gilt. Definition 11.11 Ist x μ ( p) ein Koordinatensystem für p ∈ M mit gμν ( p) = ημν ∂ gμν ( p) = 0, ∂xσ
(11.77)
so nennt man das Koordinatensystem lokales Inertialsystem (LIS).
In lokalen inertialen Koordinaten sieht die Metrik bei p wie die Minkowski-Metrik bis zur ersten Ordnung aus. Über die zweiten Ableitungen von gμν können wir keine Aussagen machen, werden aber später sehen, dass auf gekrümmten Mannigfaltigkeiten nicht alle zweiten Ableitungen verschwinden dürfen. Wir wollen nun mithilfe von Geodäten lokale inertiale Koordinaten konstruieren. Sind p ∈ M und V = V μ eμ ∈ T p M, dann bezeichne γV (t) die nach Bemerkung 11.9 eindeutig bestimmte Geodäte mit γ V (0) = p und γ˙ V (0) = V . Wir definieren jetzt eine Abbildung, die uns die gesuchten Koordinaten liefern wird. Definition 11.12 Zu V ∈ T p M setze exp p (V ) := γ V (1) , falls der maximale Definitionsbereich von γ V die 1 enthält. Wir definieren D p := V ∈ T p M : 1 ist im maximalen Definitionsbereich von γ V , dann heißt exp p : D p → M Riemann’sche Exponentialabbildung im Punkt p. Abb. 11.5 erläutert diese Definition.
296
11 Semi-Riemann’sche Mannigfaltigkeiten
Abb.11.5 Exponentialabbildung
Bemerkung 11.10 1. Sei für ein τ ∈ R die Kurve γ˜ (t) durch γ˜ (t) := γ V (τ t)
(11.78)
definiert, dann folgt ∇γ˙˜ (t) γ˙˜ (t) = ∇τ γ˙ V (τ t) (τ γ˙ V (τ t)) = τ 2 ∇γ˙ V γ˙ V (τ t) = 0 d. h., γ˜ ist ebenfalls eine Geodäte (was auch schon aus Satz 11.3 folgt, da die Umparametrisierung (11.78) affin ist), und für die Anfangsbedingungen gilt γ˜ (0) = γ V (0) = p γ˜˙ (0) = τ γ˙ V (0) = τ V , woraus wegen der Eindeutigkeit der Geodäten γ V (τ t) = γτ V (t) folgt. Daraus ergibt sich exp p (τ V ) = γτ V (1) = γV (τ ) . Durch die Exponentialabbildung werden also Geraden durch den Ursprung von T p M (τ → τ V ) zu Geodäten in M gemacht. 2. Für ein p ∈ M existiert eine Umgebung U˜ des Nullpunktes 0 ∈ T p M, sodass exp p U˜ ein Diffeomorphismus ist. U˜ ist ein Sterngebiet, d. h. V ∈ U˜ ⇒ λV ∈ U˜ , |λ| ≤ 1,
11.6
Normalkoordinaten und Äquivalenzprinzip
297
und man nennt den Bildbereich U = exp p U˜ ⊂ M Normalumgebung von p. Den Beweis dieser Aussagen findet man z. B. in [16]. Definition 11.13 Wir wählen ein q ∈ U , das auf einer Geodäte liegt, q = γV (τ ) für ein geeignetes τ , und definieren die Komponenten x μ von exp−1 p (q) ∈ T p M durch μ exp−1 p (q) = x (q) eμ .
Diese x μ werden Riemann’sche Normalkoordinaten genannt. Es gilt −1 −1 exp−1 p (q) = exp p (γ V (τ )) = exp p exp p (τ V ) = τ V , und für die Normalkoordinaten folgt daraus mit der Kurzschreibweise x μ (τ ) := x μ (γ V (τ )) x μ (τ ) = τ V μ .
(11.79)
Diese Aussage gilt für jede Geodäte durch p mit einem geeigneten (festen) Tangentialvektor V ∈ D p . Aus (11.79) folgt sofort dxμ d (τ V μ ) = = Vμ dτ dτ d 2 (τ V μ ) d2xμ = = 0, dτ 2 dτ 2 und mit der Geodätengleichung (11.59) ergibt sich μ μ V ν V ρ = 0 ⇒ νρ = 0. νρ
Wir zeigen noch, dass die ersten Ableitungen der Metrik verschwinden. In Gl. (11.45) haben wir bewiesen, dass die kovariante Ableitung der Metrik gleich null ist: 0 = ∇ρ gμν ∂ σ σ = gμν − ρμ gσ ν − ρν gμσ ∂xρ ∂ = gμν , ∂xρ wobei alle Größen am Punkt p berechnet werden. Wir können jetzt das starke Äquivalenzprinzip in seiner präzisesten Form ausdrücken:
298
11 Semi-Riemann’sche Mannigfaltigkeiten
Starkes Äquivalenzprinzip in mathematischer Form
An jedem Punkt p einer Lorentz-Mannigfaltigkeit (M, g) gibt es ein Koordinatensystem, an dem die Metrik g die Form der Minkowski-Metrik hat, gμν ( p) = ημν , und an dem die Christoffel-Symbole sowie die ersten Ableitungen der Metrik verschwinden, ∂ μ ρν ( p) = ρ gμν ( p) = 0. ∂x
Ein großer Vorteil der Existenz eines solchen lokalen Inertialsystems liegt darin, dass die Gleichungen der Physik dort oftmals so einfach wie im flachen Raum werden. Und wenn die Gleichungen tensorieller Natur, d. h. koordinateninvariant sind, gelten sie auch in der gekrümmten Raumzeit. Wir werden später auf diese Aussagen zurückkommen und ein „Rezept“ für die Transformation von Gesetzen der Speziellen Relativitätstheorie zu Gesetzen mit Gravitation vorstellen.
Krümmung der Raumzeit
12
In diesem Kapitel unterstellen wir wieder, dass die Raumzeit eine Lorentz-Mannigfaltigkeit ist, die mit dem Levi-Civita-Zusammenhang ausgestattet ist. Bislang haben wir bei den Definitionen und Herleitungen von Tensoren und Ableitungen intensiv von der Existenz von lokalen Koordinatensystemen Gebrauch gemacht, ohne explizit auf den Aspekt der Krümmung einzugehen. Da wir aufgrund unserer eingeschränkten Sinnesorgane Krümmung nur wahrnehmen können, wenn sie sich in eindimensionalen (z. B. Kurven) oder zweidimensionalen (z. B. Flächen) Objekten zeigt (wir können uns einen dreidimensionalen Raum nicht gekrümmt vorstellen, geschweige denn die vierdimensionale Raumzeit), wollen wir an einfachen Beispielen einige der Begrifflichkeiten und Konzepte erläutern, ehe wir sie dann in der vierdimensionalen Raumzeit exakt definieren. Bei der Krümmung müssen zwei verschiedene Arten, die man extrinsisch und intrinsisch nennt, unterschieden werden. Wir betrachten einen Zylinder. Da der Zylinder in einer Richtung rund ist, nehmen wir seine Oberfläche aus unserer dreidimensionalen Sicht als gekrümmt wahr. Diese Sicht bezeichnet man als extrinsische Krümmung, als Krümmung von außen, vom Höherdimensionalen aus betrachtet. Andererseits kann man einen Zylinder aus einem flachen rechteckigen Stück Papier herstellen, das man zusammenrollt und an den Kanten verklebt. Zeichnet man auf dem flachen Stück Papier parallele Linien oder berechnet den Abstand zwischen zwei Punkten, so bleiben die Parallelen nach dem Zusammenrollen auf dem Zylinder parallel, und auch die Abstände bleiben gleich. Alle euklidischen Gesetze (z. B. dass die Winkelsumme im Dreieck 180◦ beträgt) gelten auf der Zylinderoberfläche genauso wie in der euklidischen Ebene. In dieser Hinsicht ist der Zylinder flach, und man sagt, er ist intrinsisch flach. Die intrinsische Geometrie betrachtet nur die Beziehungen zwischen Punkten auf Kurven, die komplett in der betrachteten Oberfläche verlaufen. Wenn wir die Oberfläche des Zylinders als gekrümmt bezeichnen, so vergleichen wir diese mit geraden Linien bzw. Ebenen im dreidimensionalen Raum. Wir wollen uns in der Folge ausschließlich mit den intrinsischen Eigenschaften der Raumzeit beschäftigen und unterstellen, dass alle Weltlinien von Teilchen in der Raumzeit liegen. Ob es einen höherdimensionalen © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_12
299
300
12 Krümmung der Raumzeit
Raum gibt, in den die vierdimensionale Raumzeit eingebettet ist, interessiert uns hier nicht, abgesehen davon, dass wir auch keinen physikalisch motivierten Grund haben, uns Zugang zu diesem, der in der mathematischen Theorie tatsächlich existiert, zu verschaffen. Der Zylinder ist intrinsisch flach, die Oberfläche einer Kugel ist es nicht. Wenn wir zwei Linien zeichnen, die senkrecht auf dem Äquator stehen und deshalb dort parallel sind, und wir verlängern die Linien lokal so gerade wie möglich, so folgen diese Linien Großkreisen, die sich am Pol treffen. Parallele Linien bleiben nicht parallel, wenn man sie verlängert, d. h., die Kugeloberfläche ist nicht flach. Das kann man auch sehen, wenn wir wiederum am Äquator zwei Punkte markieren, die ein Viertel der Äquatorlänge, also 90◦ auseinander liegen, und dann jeweils senkrecht zum Nordpol „gerade” Linien zeichnen, sodass sich ein Dreieck ergibt. Dieses Dreieck hat die Winkelsumme von 90◦ + 90◦ + 90◦ = 270◦ , was ebenfalls zeigt, dass die Kugeloberfläche nicht flach sein kann. Eine andere Möglichkeit, die intrinsische Krümmung der Kugeloberfläche sichtbar zu machen, besteht in der Parallelverschiebung, die wir mathematisch im letzten Kapitel eingeführt und im Beispiel 11.9 geometrisch anschaulich dargestellt haben.
12.1
Paralleltransport und Krümmung
Mithilfe des Paralleltransports kann man entscheiden, ob ein Raum gekrümmt ist, und man kann auch ein Maß für die Krümmung definieren, was wir im Folgenden näher untersuchen wollen und dabei den Ausführungen in [6] folgen. Berechnung der Krümmung mit geometrischen Mitteln Bei dem Paralleltransport in gekrümmten Räumen erhält man unterschiedliche Ergebnisse, wenn man Vektoren von einem Punkt zu einem anderen Punkt auf verschiedenen Wegen parallel transportiert. Wir werden sehen, dass diese Unterschiede durch die jeweiligen Parallelverschiebungen entlang der unterschiedlichen Wege berechnet werden können. Der Einfachheit halber betrachten wir ein infinitesimal kleines Flächenelement in einem zweidimensionalen gekrümmten Raum mit den Koordinaten x, y. In Abb. 12.1 ist das infinitesimale Flächenelement begrenzt durch die vier Koordinatenlinien x = a, y = b, x = a + da, y = b + db. Wir wollen den Vektor V = V μ eμ im Punkt (a, b) einmal auf dem Weg 1 → 2 → 3 von (a, b) über (a + da, b) nach (a + da, b + db) parallel transportieren und zum Zweiten über den Weg 1 → 2 → 3 und die Differenz V μ (3) − V μ (3 ) ausrechnen, wobei wir für die Positionen der Einfachheit halber z. B.
12.1
Paralleltransport und Krümmung
301
Abb. 12.1 Paralleltransport eines Vektors auf zwei Wegen
V μ (3) = V μ (a + da, b + db) schreiben wollen. Die Kurven, entlang derer die Verschiebungen stattfinden, sind die Koordinatenlinien, und wir bezeichnen die einzelnen Wegstücke mit x i→ j (t) d. h., es gilt mit geeigneten Parametrisierungen x1→2 (t) = (x(t), b) x2→3 (t) = (a + da, y(t))
x1→2 (t) = (a, y(t))
x2 →3 (t) = (x(t), b + db) , wobei die Anfangs- und Endwerte der Parametrisierung ta und te so gewählt werden, dass x(ta ) = a,
x(te ) = a + da
y(ta ) = b,
y(te ) = b + db
gilt. Für die Tangentialvektoren folgt dann d x1→2 d x db dx = , = ,0 dt dt dt dt 2→3 d(a + da) dy dy d x = , = 0, dt dt dt dt
302
12 Krümmung der Raumzeit
dy = 0, dt d x d(b + db) dx = , = ,0 . dt dt dt
d x1→2 = dt
d x2 →3 dt
da dy , dt dt
Wir verwenden für die Komponenten des Paralleltransports die Formel (11.52): μ ν ∂V μ σ dx = 0, + V νσ ∂xν dt die sich mit μ, ν, σ = x, y auf die zwei Gleichungen μ ∂V μ ∂V dx μ μ + xσ =0⇒ = −xσ Vσ Vσ ∂x dt ∂x μ ∂V μ ∂V μ σ dy σ + yσ V =0⇒ = − μ yσ V ∂y dt ∂y konkretisiert. Daraus ergibt sich für die Differenzen der Vektoren mit dem Differenzial ∂V μ ∂x ∂ Vμ V μ (3) − V μ (2) = ∂y ∂V μ V μ 2 − V μ (1) = ∂y ∂ Vμ V μ 3 − V μ 2 = ∂x V μ (2) − V μ (1) =
μ (1) V σ (1) da (1) da = −xσ σ (2) db = − μ yσ (2) V (2) db σ (1) db = − μ yσ (1) V (1) db
σ μ 2 da = −xσ 2 V 2 da.
Wir benutzen erneut das Differenzial, um die Christoffel-Symbole an den verschiedenen Orten zu berechnen. Es gilt μ μ μ yσ (2) = yσ (1) + ∂x yσ (1) da μ μ μ xσ 2 = xσ (1) + ∂ y xσ (1) db. Wenn man dies in die obigen Gleichungen einsetzt, erhält man μ V μ (2) − V μ (1) = −xσ (1) V σ (1) da μ V μ (3) − V μ (2) = − μ + ∂ da V σ (2) db (1) (1) x yσ yσ σ V μ 2 − V μ (1) = − μ yσ (1) V (1) db
μ μ V μ 3 − V μ 2 = − xσ (1) + ∂ y xσ (1) db V σ 2 da.
Wir setzen noch
12.2
Riemann’scher Krümmungstensor
303
σ V σ (2) = V σ (1) − xτ (1) V τ (1) da V σ 2 = V σ (1) − σyτ (1) V τ (1) db
und erhalten insgesamt durch Einsetzen und Vereinfachen und Austausch von σ ↔ τ in den Termen mit den Ableitungen der Christoffel-Symbole V μ (3) − V μ 3
= V μ (3) − V μ (2) + V μ (2) − V μ (1) − V μ 2 − V μ (1) − V μ 3 − V μ 2 μ μ σ μ σ = da db V τ (1) ∂ y xτ (1) − ∂x μ yτ (1) + yσ (1) xτ (1) − xσ (1) yτ (1) σ 2 τ μ − da 2 db V τ (1) ∂x μ ∂ y xσ (1) σyτ (1) yσ (1) xτ (1) − da db V μ μ σ μ σ ≈ da db V τ (1) ∂ y xτ (1) − ∂x μ yτ (1) + yσ (1) xτ (1) − xσ (1) yτ (1) ,
wobei wir im letzten Schritt die Terme dritter Ordnung da 2 db bzw. da db2 vernachlässigt haben. Insgesamt ist gezeigt, dass d V μ (3) = V μ (3) − V μ 3 = da db V τ (1) R μτ yx (1) mit
(12.1)
μ μ σ μ σ R μτ yx (1) = ∂ y xτ (1) − ∂x μ yτ (1) + yσ (1) xτ (1) − xσ (1) yτ (1) μ
gilt, d. h., man kann mit R τ yx den Paralleltransport auf unterschiedlichen Wegen bzw. auf geschlossenen Kurven messen. Die Parallelverschiebung ist proportional zum Vektor, der transportiert wird, und auch zur Fläche d A = da db, die die Kurve umrundet. Mit der μ Quotientenregel (9.21) folgt, dass die Größen R τ yx die Komponenten eines Tensors sein müssen, da in Gl. (12.1) alle anderen Größen die Komponenten von Vektoren sind. Diesen Tensor definieren wir jetzt allgemein für die vierdimensionale Raumzeit.
12.2
Riemann’scher Krümmungstensor
In den Abschn. 7.5 und 7.6 haben wir schon plausibel gemacht, dass die Komponenten der Metrik gμν einen Hinweis auf die Krümmung eines Semi-Riemann’schen Raumes geben. Jetzt wollen wir einen Tensor einführen, der die Krümmung quantitativ beschreibt. Da die Krümmung des Raumes auf die Anwesenheit eines Gravitationsfeldes hinweist, spielt dieser Krümmungstensor eine große Rolle bei den Einstein’schen Feldgleichungen. An den Komponenten einer Metrik kann man im Allgemeinen nicht unmittelbar ablesen, ob diese nur krummlinige Koordinaten in einem flachen Raum sind (wie z. B. die Polarkoordinaten in der euklidischen Ebene) oder ob sie auf einem gekrümmten Raum „leben” (wie z. B. die Winkelkoordinaten auf einer Kugeloberfläche). Wir werden aber sehen, dass man aus den gμν bzw. den Christoffel-Symbolen den Krümmungstensor berechnen kann. Und wenn dieser Tensor überall gleich null ist, so ist der Raum flach. Ist er von null verschieden, so ist der Raum gekrümmt.
304
12 Krümmung der Raumzeit
Wir gehen wieder so vor, wie wir es auch in den letzten Abschnitten häufiger gemacht haben, und betrachten zunächst die Koordinatendarstellungen der Objekte in einer lokalen Karte. Anschließend stellen wir die gefundenen (neuen) Tensoren in ihrer koordinatenfreien Form dar. Koordinatendarstellung des Riemann’schen Krümmungstensors Die gewöhnlichen und die kovarianten Ableitungen haben viele vergleichbare Eigenschaften. Es gibt aber einen wesentlichen Unterschied, denn die Differenziationsreihenfolge bei zweiten Ableitungen ist bei kovarianten Ableitungen im Allgemeinen nicht vertauschbar, bei partiellen Ableitungen schon. Ist φ ein Skalarfeld, so gilt ∂μ (∂ν φ) = ∂ν ∂μ φ , da die Basisvektoren nach (8.24) kommutieren. Wir schauen uns zunächst die kovariante Ableitung des Skalarfeldes φ an und beachten, dass bei Skalarfeldern ∇μ φ = ∂μ φ gilt, wobei die ∂μ φ nach (9.3) die Komponenten der Einsform dφ sind. Durch nochmalige kovariante Ableitung erhalten wir σ ∇μ (∇ν φ) = ∇μ (∂ν φ) = ∂μ (∂ν φ) − μν ∂σ φ
und
σ ∇ν ∇μ φ = ∇ν ∂μ φ = ∂ν ∂μ φ − νμ ∂σ φ.
Da die Christoffel-Symbole in den unteren beiden Indizes symmetrisch sind, ergibt sich also auch ∇μ (∇ν φ) = ∇ν ∇μ φ .
Aufgabe 12.1 Zeigen Sie, dass für die zweiten kovarianten Ableitungen der Komponenten des Vektors V = V μ eμ folgende Identität gilt:
μ μ σ μ σ ∇ν ∇λ V μ − ∇λ ∇ν V μ = V ρ ∂ν ρλ − ∂λ ρν + σμν ρλ − σ λ ρν
(12.2)
Lösung Es gilt μ τ ∇ν ∇λ V μ = ∂ν ∇λ V μ + νρ ∇λ V ρ − λν ∇τ V μ μ μ τ = ∂ν ∂λ V μ + λρ V ρ + νρ ∇λ V ρ − λν ∇τ V μ . Wir berechnen die Ableitung des ersten Klammerausdrucks auf der rechten Seite mit der Produktregel μ μ μ ∂ν ∂λ V μ + λρ V ρ = ∂ν ∂λ V μ + λρ ∂ν V ρ + ∂ν λρ V ρ .
12.2
Riemann’scher Krümmungstensor
305
Damit ergibt sich μ μ μ τ ∇ν ∇λ V μ = ∂ν ∂λ V μ + λρ ∂ν V ρ + ∂ν λρ V ρ + νρ ∇λ V ρ − λν ∇τ V μ . ρ
Nun ersetzen wir noch (∇λ V ρ ) durch ∂λ V ρ + λσ V σ und erhalten μ μ ∇ν ∇λ V μ = ∂ν ∂λ V μ + λρ ∂ν V ρ + ∂ν λρ V ρ ρ μ τ μ + νρ Vρ . ∂λ V ρ + λσ V σ − λν ∂τ V μ + τρ Nun vertauschen wir die Ableitungsreihenfolge und erhalten mit λ ↔ ν ρ μ μ ∇λ ∇ν V μ = ∂λ ∂ν V μ + νρ ∂λ V ρ + ∂λ νρ V μ ρ ρ σ τ μ μ + λρ ∂ν V + νσ V − νλ ∂τ V + τρ Vρ . Wir bilden die Differenz dieser beiden Ableitungen und erhalten unter Beachtung der Symmetrien bei partiellen Ableitungen bzw. Christoffel-Symbolen nach einigen Detailrechnungen: ∇ν ∇λ V μ − ∇λ ∇ν V μ = ∂ν μ ρλ V ρ + μ ρν ρ σ λ V σ − μ ρν,λ V ρ + μ ρλ ρ σ ν V σ μ μ μ σ μ σ = V ρ ∂ν ρλ − ∂λ ρν + σ ν ρλ − σ λ ρν
Wir setzen
μ
μ
μ
μ σ σ R ρνλ := ∂ν ρλ − ∂λ ρν + σμν ρλ − σ λ ρν
(12.3)
und erhalten mit (12.2) μ ∇ν ∇λ V μ − ∇λ ∇ν V μ = V ρ R ρνλ . Da auf der linken Seite von Gl. (12.2) die Komponenten eines Tensors stehen, muss das für μ die rechte Seite ebenfalls gelten. Da V ein Vektor ist, definiert somit der Ausdruck R ρνλ nach der Quotientenregel (9.21) ebenfalls einen Tensor (mit dem Rang (1, 3)). Dieser heißt Riemann’scher (Krümmungs-)Tensor. Bemerkung 12.1 1. Im Minkowski-Raum sind die Christoffel-Symbole und deren Ableitungenin kartesischen Koordinaten (t, x, y, z) überall gleich null, d. h., dort ist μ
R ρνλ = 0
306
12 Krümmung der Raumzeit μ
und damit in allen Koordinatensystemen, da die R ρνλ die Komponenten eines Tensors sind. Es gilt auch die Umkehrung: Ist der Riemann’sche Krümmungstensor überall gleich null, so kann man ein Koordinatensystem finden, in dem die Metrikkomponenten überall konstant sind. Ein Beweis dieser Aussage findet man z. B. in [21]. 2. An der Formel (12.3) liest man unmittelbar ab, dass der Riemann’sche Tensor antisymmetrisch in den beiden letzten Indizes ist: μ
μ
R ρνλ = −R ρλν
(12.4)
Der Riemann’sche Tensor setzt sich aus Christoffel-Symbolen und deren Ableitung zusammen und ist somit eine intrinsische Größe. Da die Christoffel-Symbole selbst aus der Metrik und deren Ableitung bestehen, hängt der Riemann’sche Tensor nur von der Metrik und deren ersten und zweiten Ableitungen ab. Damit wird die Krümmung eines Raumes durch die Metrik festgelegt. Wir wissen schon, dass aus Einsteins Sicht die Gravitation als eine Krümmung der Raumzeit beschreibbar sein sollte. Nun haben wir hergeleitet, wie man die Krümmung eines Raumes berechnen kann, und haben damit einen großen Schritt in Richtung der Einstein-Gleichungen geschafft. Koordinatenfreie Darstellung des Riemann’schen Krümmungstensors Wir stellen den Riemann’schen Krümmungstensor als einen Tensor vom Rang (1, 3) dar, d. h. als ein Element von T31 (M). Definition 12.1 1. Das Riemann’sche Krümmungsfeld R wird durch seine Wirkung auf drei beliebige Vektorfelder X , Y , Z definiert: R : T10 (M) × T10 (M) × T10 (M) → T10 (M) mit R (X , Y ) Z := ∇ X (∇Y Z ) − ∇Y (∇ X Z ) − ∇[X ,Y ] Z ,
(12.5)
wobei [X , Y ] wieder den Kommutator (die Lie-Klammer) zwischen den Vektorfeldern und ∇ X Z die kovariante Ableitung von Z nach X bezeichne. R bildet also drei Vektorfelder auf ein Vektorfeld ab. Eine etwas kompaktere Schreibweise ist R (X , Y ) Z = [∇ X ∇Y ] Z − ∇[X ,Y ] Z . Darüber hinaus sind auch die Schreibweisen R (X , Y ) Z = R (X , Y , Z ) bzw. R (X , Y ) Z = R X Y Z
12.2
Riemann’scher Krümmungstensor
307
gebräuchlich. 2. Die mit (12.5) gleichwertige Abbildung T31 (M) → F (M) (ω, X , Y , Z ) → ω (R (X , Y ) Z )
(12.6)
definiert einen Tensor vom Rang (3, 1), der Riemann’scher (Krümmungs-)Tensor genannt wird. Sprachlich unterscheiden wir künftig nicht mehr zwischen dem Riemann’schen Krümmungsfeld und dem Riemann’schen Krümmungstensor, sondern nennen beide einfach „Riemann’schen Tensor“. Bemerkung 12.2 Aufgrund der Antisymmetrie des Kommutators folgt unmittelbar aus der Definition (12.5): R (X , Y ) Z = −R (Y , X ) Z ,
(12.7)
d. h., R ist antisymmetrisch in X und Y . Diese Aussage ist identisch mit (12.4), dort wird das Gleiche in der Koordinatendarstellung ausgedrückt.
Aufgabe 12.2 Zeigen Sie dieerste Bianchi-Identität:
R (X , Y ) Z + R (Z , X ) Y + R (Y , Z ) X = 0
(12.8)
Lösung Es gilt R (X , Y ) Z + R (Z , X ) Y + R (Y , Z ) X = ∇ X (∇Y Z − ∇ Z Y ) + ∇Y (∇ Z X − ∇ X Z ) + ∇ Z (∇ X Y − ∇Y X ) − ∇[X ,Y ] Z − ∇[Z ,X ] Y − ∇[Y ,Z ] X = ∇ X [Y , Z ] − ∇[Y ,Z ] X + ∇Y [Z , X ] − ∇[Z ,X ] Y + ∇ Z [X , Y ] − ∇[X ,Y ] Z = [X , [Y , Z ]] + [Y , [Z , X ]] + [Z , [X , Y ]] = 0, wegen der Jacobi-Identität der Lie-Klammer (8.26). In der Rechnung haben wir an mehreren Stellen von der Torsionsfreiheit (11.42) des Levi-Civita-Zusammenhangs Gebrauch gemacht.
308
12 Krümmung der Raumzeit
Koordinatendarstellung des Riemann’schen Tensors Wir wollen nun zeigen, dass die Komponenten des Riemann’schen Tensors mit denen übereinstimmen, die wir im letzten Abschnitt in lokalen Koordinaten hergeleitet haben. Dazu nehmen wir uns eine lokale Basis ∂ρ von T p M her und berechnen zunächst den Ausdruck R (∂ν , ∂λ ) ∂ρ , indem wir die Terme auf der rechten Seite von (12.5) einzeln betrachten. Zunächst gilt mit (11.28) σ σ τ σ ∇∂ν ∇∂λ ∂ρ = ∇∂ν λρ ∂σ = ∂ν λρ ∂σ + λρ ντ ∂σ , wobei wir in der zweiten Gleichung die Indizes σ ↔ τ vertauscht haben. Genauso erhält man σ τ σ ∇∂λ ∇∂ν ∂ρ = ∂λ νρ ∂σ + νρ λτ ∂σ . Wir benutzen (8.24), d. h. [∂ν , ∂λ ] = 0 ⇒ ∇[∂ν ,∂λ ] ∂ρ = 0, und erhalten zusammengefasst σ τ σ σ τ σ R (∂ν , ∂λ ) ∂ρ = ∂ν λρ ∂σ + λρ ντ ∂σ − ∂λ νρ ∂σ + νρ λτ ∂σ σ σ τ σ τ σ = ∂ν λρ ∂σ . − ∂λ νρ + λρ ντ − νρ λτ Wir wählen noch die zu ∂μ duale Basis (d x μ ) und erhalten die Komponenten μ σ σ τ σ τ σ ∂σ − ∂λ νρ + λρ ντ − νρ λτ R ρνλ = d x μ R (∂ν , ∂λ ) ∂ρ = d x μ ∂ν λρ μ
μ
μ τ μ τ = ∂ν λρ − ∂λ νρ + λρ ντ − νρ λτ
(12.9)
und damit die Übereinstimmung mit Gl. (12.3). Kovariante Ableitung des Riemann’schen Tensors Die kovariante Ableitung des Riemann’schen Tensors ergibt sich mit der Formel für die Derivationen von allgemeinen Tensoren (9.40) zu ∇ X (R (Y , Z ) V ) = (∇ X R) ((Y , Z ) V )+R (∇ X Y , Z ) V +R (Y , ∇ X Z ) V +R (Y , Z ) ∇ X V bzw. äquivalent zu (∇ X R) ((Y , Z ) V ) = ∇ X (R (Y , Z ) V ) − R (∇ X Y , Z ) V − R (Y , ∇ X Z ) V − R (Y , Z ) ∇ X V .
(12.10)
12.3
12.3
Symmetrien des Riemann’schen Krümmungstensors
309
Symmetrien des Riemann’schen Krümmungstensors
Wir wollen einige weitere Symmetrien des Riemann’schen Tensors ableiten, die uns in Summe dahin führen werden, dass aus den rechnerischen 256 Komponenten des Tensors nur 20 unterschiedlich sind. Wir haben schon gezeigt, dass der Riemann’sche Tensor antisymmetrisch in den letzten beiden Indizes ist. Das bedeutet, dass von den 16 möglichen Kombinationen der letzten beiden Indizes die folgenden vier null ergeben: μ
μ
μ
R ρ00 = −R ρ00 ⇒ R ρ00 = 0 und genauso
μ
μ
μ
R ρ11 = R ρ22 = R ρ33 = 0 Von den restlichen zwölf Zahlen sind nur sechs unabhängig, die anderen ergeben sich aus diesen sechs durch Multiplikation mit −1. Vollständig kovarianter Riemann’scher Tensor Weitere Symmetrien des Riemann’schen Tensors werden sichtbar, wenn wir diesen durch „Indexverschiebung“ modifizieren. Definition 12.2 Der (vollständig) kovariante Riemann’sche Tensor ist das Tensorfeld R vom Rang (4, 0) , das für V , X , Y , Z ∈ T10 (M) durch R (V , X , Y , Z ) := g (V , R (Y , Z ) X ) definiert wird. Wir haben auch für diesen Tensor den Buchstaben R verwendet, es sollte aber aus dem jeweiligen Kontext klar sein, welcher wirklich gemeint ist. Die Komponenten des kovarianten Tensors berechnen sich durch Rμρνλ = R ∂μ , ∂ρ , ∂ν , ∂λ = g ∂μ , R ∂ν , ∂λ , ∂ρ = g ∂μ , R τρνλ ∂τ = g ∂μ , ∂τ R τρνλ = gμτ R τρνλ . Satz 12.1 Der kovariante Krümmungstensor R hat folgende Symmetrien: 1. R (V , X , Y , Z ) = −R (V , X , Z , Y ), in Koordinaten: Rμρνλ = −Rμρλν
310
12 Krümmung der Raumzeit
2. R (V , X , Y , Z ) + R (V , Z , X , Y ) + R (V , Y , Z , X ) = 0, in Koordinaten: Rμρνλ + Rμλρν + Rμνλρ = 0
(12.11)
3. R (V , X , Y , Z ) = −R (X , V , Y , Z ), in Koordinaten: Rμρνλ = −Rρμνλ 4. R (V , X , Y , Z ) = R (Y , Z , V , X ), in Koordinaten: Rμρνλ = Rνλμρ Die Punkte (1.) und (2.) haben wir bereits in Bemerkung 12.2 bzw. in Aufgabe 12.2 gezeigt.
Aufgabe 12.3 Beweisen Sie die Aussagen 3. und 4. des Satzes 12.1, ohne Koordinaten zu benutzen.
Lösung Wegen R (V + X , V + X , Y , Z ) = R (V , V , Y , Z ) + R (X , X , Y , Z ) + R (V , X , Y , Z ) + R (X , V , Y , Z ) genügt es für 3., R (X , X , Y , Z ) = 0 zu zeigen. Es gilt mit mehrmaligem Anwenden der Ricci-Bedingung R (X , X , Y , Z ) = g (X , R (Y , Z ) X ) = g (X , ∇Y ∇ Z X ) − g (X , ∇ Z ∇Y X ) − g X , ∇[Y ,Z ] X = Y g (X , ∇ Z X ) − g (∇Y X , ∇ Z X ) − (Zg (X , ∇Y X ) − g (∇ Z X , ∇Y X )) − [Y , Z ] g (X , X ) − g ∇[Y ,Z ] X , X = Y Zg (X , X ) − Y g (∇ Z X , X ) − Z Y g (X , X ) + Zg (∇Y X , X ) − [Y , Z ] g (X , X ) + g ∇[Y ,Z ] X , X = −g (∇ Z X , ∇Y X ) − g (∇Y ∇ Z X , X ) + g (∇Y X , ∇ Z X ) + g (∇ Z ∇Y X , X ) + g ∇[Y ,Z ] X , X = −R (X , X , Y , Z ) ⇒ R (X , X , Y , Z ) = 0.
Die Behauptung 4. beweisen wir mit der ersten Bianchi-Identität und der Schiefsymmetrie: Es gilt:
12.3
Symmetrien des Riemann’schen Krümmungstensors
311
R (V , X , Y , Z ) + R (V , Z , X , Y ) + R (V , Y , Z , X ) = 0 R (X , V , Y , Z ) + R (X , Z , V , Y ) + R (X , Y , Z , V ) = 0 R (Y , X , V , Z ) + R (Y , Z , X , V ) + R (Y , V , Z , X ) = 0 R (Z , X , Y , V ) + R (Z , V , X , Y ) + R (Z , Y , V , X ) = 0 Wir summieren die Gleichungen und erhalten 2 (R (X , Y , Z , V ) + R (Z , V , X , Y )) = 0 ⇒ R (X , Y , Z , V ) = R (Z , V , X , Y ) . Wir gehen hier noch einen anderen Weg und wählen ein lokales Inertialsystem. Wir wissen, dass dort die ersten Ableitungen der Metrik und damit die Christoffel-Symbole gleich null sind, d. h., im lokalen Inertialsystem gilt μ
μ
μ R ρνλ = ∂ν ρλ − ∂λ ρν .
(12.12)
Nach (11.47) können die Christoffel-Symbole durch die Metrik ausgedrückt werden: μ
ρλ =
g μσ ∂λ gρσ + ∂ρ gλσ − ∂σ gρλ 2
Wir leiten mit der Produktregel ab: μ
g μσ ∂ν g μσ ∂λ gρσ + ∂ρ gλσ − ∂σ gρλ + ∂ν ∂λ gρσ + ∂ν ∂ρ gλσ − ∂ν ∂σ gρλ 2 2 g μσ ∂ν ∂λ gρσ + ∂ν ∂ρ gλσ − ∂ν ∂σ gρλ , = 2
∂ν ρλ =
da im lokalen Inertialsystem ∂ν g μσ = 0 gilt. Genauso folgt μ = ∂λ ρν
g μσ ∂λ ∂ν gρσ + ∂λ ∂ρ gνσ − ∂λ ∂σ gρν 2
und damit für den Riemann’schen Tensor im lokalen Inertialsystem μ
g μσ 2 g μσ = 2
R ρνλ =
∂ν ∂λ gρσ + ∂ν ∂ρ gλσ − ∂ν ∂σ gρλ − ∂λ ∂ν gρσ + ∂λ ∂ρ gνσ − ∂λ ∂σ gρν
∂ν ∂ρ gλσ − ∂ν ∂σ gρλ − ∂λ ∂ρ gνσ + ∂λ ∂σ gρν .
(12.13)
Für den kovarianten Krümmungstensor erhalten wir (immer noch im lokalen Inertialsystem): gτ σ ∂ν ∂ρ gλσ − ∂ν ∂σ gρλ − ∂λ ∂ρ gνσ + ∂λ ∂σ gρν 2 1 = ∂ν ∂ρ gλμ − ∂ν ∂μ gρλ − ∂λ ∂ρ gνμ + ∂λ ∂μ gρν 2
Rμρνλ = gμτ
(12.14)
312
12 Krümmung der Raumzeit
Aus dieser Darstellung können wir die Symmetrien (3.) und (4.) direkt ablesen: 3. Rμρνλ = −Rρμνλ 4. Rμρνλ = Rνλμρ Da die vier Gleichungen aus Satz 12.1 im lokalen Inertialsystem gelten und Tensorgleichungen sind, gelten sie in allen Koordinatensystemen. Rμρνλ ist also antisymmetrisch im ersten und im zweiten Paar der Indizes und symmetrisch im Vertauschen der beiden Paare. Die Gl. 1. und 3. besagen, dass es jeweils sechs unabhängige Komponenten in den beiden Indexpaaren gibt. Wir können also schreiben Rμρνλ = R AB , wobei A das erste Indexpaar und B das zweite Indexpaar bezeichne. R AB ist also eine 6 × 6-Matrix, die nach der vierten Gleichung symmetrisch ist, also R AB = R B A . Eine symmetrische 6×6 - Matrix hat 21 unabhängige Komponenten, da die Elemente unterhalb der Hauptdiagonalen durch Spiegelung an der Hauptdiagonalen entstehen. Die Gl. (2.) reduziert diese Anzahl noch durch eine Bedingung, sodass es letztlich statt rechnerisch 256 nur 20 unabhängige Komponenten des Riemann’schen Tensors in vier Dimensionen gibt. Die zweite Bianchi-Identität Neben der ersten Bianchi-Identität gibt es eine weitere, die die kovariante Ableitung des Riemann’schen Tensors ins Spiel bringt. Satz 12.2 Seien X , Y , Z ∈ T10 Vektorfelder, dann gilt die zweite Bianchi-Identität (∇ X R) (Y , Z ) + (∇Y R) (Z , X ) + (∇ Z R) (X , Y ) = 0.
(12.15)
Aufgabe 12.4 Zeigen Sie die zweite Bianchi-Identität (12.15), ohne Koordinaten zu benutzen.
Lösung Wir schauen zunächst auf die kovariante Ableitung des Riemann’schen Tensors (12.10): (∇ X R) (Y , Z ) = ∇ X R (Y , Z ) − R (∇ X Y , Z ) − R (Y , ∇ X Z ) − R (Y , Z ) ∇ X und betrachten die zyklische Summe der beiden mittleren Terme:
12.3
Symmetrien des Riemann’schen Krümmungstensors
313
−R (∇ X Y , Z ) − R (Y , ∇ X Z ) − R (∇Y Z , X ) − R (Z , ∇Y X ) −R (∇ Z X , Y ) − R (X , ∇ Z Y ) = − [R (∇ X Y , Z ) + R (Z , ∇Y X ) + zyklische V er tauschungen] = − [R (∇ X Y , Z ) − R (∇Y X , Z ) + zyklische V er tauschungen] = − [R ([X , Y ] , Z ) + zyklische V er tauschungen] , wobei wir in der letzten Gleichung die Torsionsfreiheit und Linearität von ∇ genutzt haben. Damit wird die linke Seite von (12.15) zu ∇ X R (Y , Z ) − R ([X , Y ] , Z ) − R (Y , Z ) ∇ X + zyklische V er tauschungen = ∇ X ∇Y ∇ Z − ∇ Z ∇Y − ∇[Y ,Z ] − ∇Y ∇ Z − ∇ Z ∇Y − ∇[Y ,Z ] ∇ X − ∇[X ,Y ] ∇ Z − ∇ Z ∇[X ,Y ] − ∇[[X ,Y ],Z ] + zyklische V er tauschungen. Die letzten Terme in der zyklischen Summe − ∇[[X ,Y ],Z ] + ∇[[Y ,Z ],X ] + ∇[[Z ,X ],Y ] = −∇[[X ,Y ],Z ]+[[Y ,Z ],X ]+[[Z ,X ],Y ] = −∇0 = 0 verschwinden aufgrund der Jacobi-Identität für die Lie-Klammer (8.26). Es bleibt
∇ X ∇Y ∇ Z −∇ Z ∇Y −∇[Y ,Z ] − ∇Y ∇ Z −∇ Z ∇Y −∇[Y ,Z ] ∇ X −∇[X ,Y ] ∇ Z +∇ Z ∇[X ,Y ] +
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
∇ Z ∇ X ∇Y −∇Y ∇ X −∇[X ,Y ] − ∇ X ∇Y −∇Y ∇ X −∇[X ,Y ] ∇ Z −∇[Z ,X ] ∇Y +∇Y ∇[Z ,X ] +
(9)
(5)
(8)
(1)
(10)
(7)
(11)
(12)
∇Y ∇ Z ∇ X −∇ X ∇ Z −∇[Z ,X ] − ∇ Z ∇ X −∇ X ∇ Z −∇[Z ,X ] ∇Y −∇[Y ,Z ] ∇ X +∇ X ∇[Y ,Z ] = 0. (4)
(10)
(12)
(9)
(2)
(11)
(6)
(3)
Alle Terme heben sich paarweise (gleiche Ziffern unter den Termen) auf, und wir erhalten die Behauptung (12.15). Wir zeigen die zweite Bianchi-Identität nochmals in der Koordinatendarstellung, wobei wir wieder auf ein lokales Inertialsystem zurückgreifen und damit die Rechnungen erheblich vereinfachen. Für die folgenden Rechnungen benutzen wir die Formel (12.14). Es gilt: ∂σ Rμρνλ + ∂λ Rμρσ ν + ∂ν Rμρλσ 1 ∂σ ∂ν ∂ρ gλμ − ∂σ ∂ν ∂μ gρλ − ∂σ ∂λ ∂ρ gνμ + ∂σ ∂λ ∂μ gρν = 2 1 + ∂λ ∂σ ∂ρ gνμ − ∂λ ∂σ ∂μ gρν − ∂λ ∂ν ∂ρ gσ μ + ∂λ ∂ν ∂μ gρσ 2 1 + ∂ν ∂λ ∂ρ gσ μ − ∂ν ∂λ ∂μ gρσ − ∂ν ∂σ ∂ρ gλμ + ∂ν ∂σ ∂μ gρλ 2
314
12 Krümmung der Raumzeit
Beachtet man die Symmetrie des metrischen Tensors und die der zweiten partiellen Ableitungen, so heben sich alle Terme auf. Da wir uns im lokalen Inertialsystem befinden und dort die partielle Ableitung mit der kovarianten übereinstimmt, ergibt sich ∇σ Rμρνλ + ∇λ Rμρσ ν + ∇ν Rμρλσ = 0,
(12.16)
und da dies eine Tensorgleichung ist, gilt sie in allen Koordinatensystemen.
12.4
Ricci-Tensor und Krümmungsskalar
Man kann aus dem Riemann’schen Tensor durch spezielle Kontraktionen zwei weitere Tensoren gewinnen, die in der Allgemeinen Relativitätstheorie eine bedeutende Rolle spielen. Definition 12.3 Zunächst entsteht der sogenannte Ricci-Tensor R Ric ∈ T02 (M) durch Kontraktion des oberen mit einem unteren Index des Riemann’schen Krümmungstensors R Ric := C21 (R) ,
(12.17)
wobei C21 die Kontraktion des oberen Index mit dem zweiten unteren Index bezeichne (siehe Gl. (9.19)). In Koordinaten ergibt sich Rμν := R Ric ∂μ , ∂ν = R ρμρν = g ρσ Rσ μρν .
(12.18)
Der Ricci-Tensor ist vom Rang (0, 2) und symmetrisch, da Rνμ = g ρσ Rσ νρμ = g σρ Rρμσ ν = R σμσ ν = Rμν . 4.
Dabei haben wir Gl. (4.) aus Satz 12.1 und die Symmetrie des metrischen Tensors genutzt. Die Komponenten des Ricci-Tensors bilden also eine symmetrische 4 × 4 – Matrix, damit hat er 10 unabhängige Komponenten. Andere Kontraktionen des Riemann’schen Tensors sind übrigens nicht sinnvoll, da sich bei R ρρμν = g ρσ Rσρμν alle Summanden in der Doppelsumme wegen Rσρμν = −Rρσ μν gegenseitig aufheben. Denn für alle Werte, die σ und ρ annehmen können, ist die Summe der beiden Terme
12.4
Ricci-Tensor und Krümmungsskalar
315
g ρσ Rσρμν + g σρ Rρσ μν = g ρσ Rσρμν + Rρσ μν = g ρσ Rσρμν − Rσρμν = 0. Das ist ein weiteres Beispiel (siehe Formel (9.20)) für die Tatsache, dass die Kontraktion eines symmetrischen Tensors (hier g ρσ ) mit einem antisymmetrischen (hier Rσρμν in den ersten beiden Indizes) stets null ergibt. Das heißt, wir erhalten auch für die dritte Möglichkeit der Kontraktion des Riemann’schen Tensors: R ρμνρ = g ρσ Rμνσρ = 0 Die Komponenten des Ricci-Tensors kann man auch durch die Christoffel-Symbole ausdrücken, dazu benutzen wir die Formel (12.3): ρ ρ ρ σ σ Rμν = R ρμρν = ∂ρ μν − ∂ν μρ + σρ μν − σρ ν μρ
Definition 12.4 Der Krümmungsskalar R ist die Kontraktion des Ricci-Tensors R = C R Ric ∈ T00 (M) = F (M) ,
(12.19)
(12.20)
also eine glatte Funktion, die in Komponenten der Metrik und des Ricci-Tensors ausgedrückt werden kann: R = g μν Rμν (12.21) Durch die Konstruktion ist der Krümmungsskalar wirklich ein Skalar und nimmt deshalb in jedem Koordinatensystem den gleichen Wert an, was die Riemann’schen und Ricci-Tensoren ja nicht tun. Wir wollen ein einfaches Beispiel des Krümmungstensors berechnen. Beispiel 12.1
Krümmung der Ebene Zunächst bemerken wir, dass die Indizes nur die Werte x und y annehmen können. Wegen der Antisymmetrie des kovarianten Riemann’schen Tensors in den ersten beiden und letzten beiden Indizes sind die einzigen von null verschiedenen Komponenten diejenigen, deren Indizes in den beiden Indexpaaren unterschiedlich sind, d. h., es bleiben nur vier übrig, nämlich Rx yx y , R yx x y , Rx yyx und R yx yx . Es gilt aber Rx yx y = −R yx x y Rx yx y = −Rx yyx Rx yx y = R yx yx ,
316
12 Krümmung der Raumzeit
sodass der Riemann’sche Tensor durch eine einzige Größe, z. B. Rx yx y , bestimmt ist. Wir rechnen in Polarkoordinaten und setzen wieder μ = r , ϕ. Das Linienelement in Polarkoordinaten war ds 2 = dr 2 + r 2 dϕ 2 . Die Christoffel-Symbole ergeben sich mit Beispiel 11.5 zu ϕ = rϕϕ = ϕr
1 r
r = −r , ϕϕ
alle anderen Christoffel-Symbole sind gleich null. Nun berechnen wir den Riemann’schen Tensor mit Gl. (12.3): r r σ σ R rϕr ϕ = ∂r ϕϕ − ∂ϕ ϕr + σr r ϕϕ − σr ϕ ϕr
r r r r r ϕ r r ϕ = ∂r ϕϕ − ∂ϕ ϕr + rr ϕϕ + ϕr ϕϕ − rr ϕ ϕr − ϕϕ ϕr
=
∂(−r ) ∂r
− 0 + 0 + 0 − 0 − (−r ) ·
1 r
= −1 + 1 = 0
Der Riemann’sche Tensor ist gleich null, und damit ist der betrachtete Raum flach, was wir ja schon wissen. Der Ricci-Tensor und der Krümmungsskalar sind damit ebenfalls gleich null.
Aufgabe 12.5 Radius a.
Berechnen Sie die Krümmung der Oberfläche einer Kugel mit
Lösung Die Kugel hat nach Beispiel 11.5 mit μ = ϑ, ϕ das Linienelement ds 2 = a 2 dϑ 2 + a 2 sin2 ϑ dϕ 2 , die Metriken
gμν =
0 a2 2 0 a sin2 ϑ
⎛
1 μν ⎜ 2 a , g =⎝ 0
⎞ 0 ⎟ ⎠ 1 a 2 sin2 ϑ
und die Christoffel-Symbole ϕ
ϕ
ϑϕ = ϕϑ = cot ϑ ϑ ϕϕ = − sin ϑ cos ϑ,
alle anderen Christoffel-Symbole verschwinden. Damit erhalten wir für den Riemann’schen Krümmungstensor
12.4
Ricci-Tensor und Krümmungsskalar
317
ϑ ϑ σ σ R ϑϕϑϕ = ∂ϑ ϕϕ − ∂ϑ ϕϑ + σϑϑ ϕϕ − σϑϕ ϕϑ ϑ ϑ ϑ ϑ ϑ ϕ = ∂ϑ ϕϕ − ∂ϑ ϕϑ + ϑϑ ϕϕ + ϕϑ ϕϕ ϕ
ϑ ϑ θ − ϑϕ ϕϑ − ϕϕ ϕϑ
∂(− sin ϑ cos ϑ)
− 0 + 0 + 0 − 0 − (− sin ϑ cos ϑ) · cot ϑ ∂ϑ = − cos2 ϑ + sin2 ϑ + cos2 ϑ = sin2 ϑ. =
Der Riemann’sche Tensor ist also ungleich null, der Raum ist damit gekrümmt. Am Nordund Südpol ist sin2 ϑ = 0, aber das ist keine intrinsische Eigenschaft, sondern hängt davon ab, wie wir das Koordinatensystem gewählt haben. Die Kugeloberfläche ist homogen, und man kann den Nord- und Südpol überall hinlegen. Der Ricci-Tensor ist definiert durch Rμν = g ρσ Rσ μρν , d. h., wir müssen zunächst den vollständig kovarianten Riemann’schen Tensor ausrechnen: ϕ
Rϑϕϑϕ = gϑτ R τϕϑϕ = gϑϑ R ϑϕϑϕ + gϑϕ R ϕϑϕ = gϑϑ R ϑϕϑϕ = a 2 sin2 ϑ Damit folgt Rϑϑ = g ρσ Rσ ϑρϑ = g ρϑ Rϑϑρϑ + g ρϕ Rϕϑρϑ = g ϑϑ Rϑϑϑϑ + g ϕϑ Rϑϑϕϑ + g ϑϕ Rϕϑϑϑ + g ϕϕ Rϕϑϕϑ 2 2 1 a sin ϑ = 1 = g ϕϕ Rϕϑϕϑ = 2 2 a sin ϑ und genauso Rϑϕ = g ρσ Rσ ϑρϕ = g ϑϑ Rϑϑϑϕ + g ϕϑ Rϑϑϕϕ + g ϑϕ Rϕϑϑϕ + g ϕϕ Rϕϑϕϕ = 0 = Rϕϑ Rϕϕ = g ρσ Rσ ϕρϕ = g ϑϑ Rϑϕϑϕ + g ϕϑ Rϑϕϕϕ + g ϑϕ Rϕϕϑϕ + g ϕϕ Rϕϕϕϕ 1 = g ϑϑ Rϑϕϑϕ = 2 a 2 sin2 ϑ = sin2 ϑ. a Der Krümmungsskalar ergibt sich zu
R = g ϑϑ Rϑϑ + g ϕϕ Rϕϕ =
2 1 sin2 θ + 2 2 = 2. 2 a a a sin ϑ
(12.22)
Er ist vom Koordinatensystem unabhängig und auch unabhängig von der Position auf der Kugeloberfläche. Die Kugeloberfläche ist überall gleich gekrümmt, also homogen gekrümmt. Der Krümmungsskalar ist umgekehrt proportional zum Radiusquadrat a 2 der Kugel, und das entspricht ganz unserer Anschauung. Eine Kugeloberfläche ist umso stärker gekrümmt, je kleiner der Radius der Kugel ist.
318
12.5
12 Krümmung der Raumzeit
Zusammenhangs- und Krümmungsformen, Cartan’sche Strukturgleichungen
In diesem Abschnitt sei (M, g) wieder eine Lorentz-Mannigfaltigkeit, die mit dem LeviCivita-Zusammenhang ausgestattet ist. Das einfache Beispiel der Kugeloberfläche hat schon gezeigt, dass die Herleitungen des Riemann’schen Krümmungstensors und seiner Kontraktionen erhebliche Aufwände verursachen können. Eine vereinfachte und übersichtliche Berechnung wird durch Einführung von speziellen Differenzialformen (siehe Kap. 10) ermöglicht. Wenn man insgesamt die Aufwände addieren würde, so wären sie für beide Methoden wahrscheinlich ähnlich. Die in diesem Abschnitt vorgestellten Konstrukte müssen, bevor sie für Berechnungen eingesetzt werden können, erst einmal erlernt werden. Die Berechnungen der Krümmungsgrößen selbst sind dann etwas einfacher. Dieses „Aufwandsgleichgewicht“ ist vermutlich auch der Grund dafür, dass in vielen Büchern über die Allgemeine Relativitätstheorie (z. B. [13, 14, 21, 22]) auf die Einführung dieser Formen verzichtet wird. Nichtkoordinatenbasen Wir haben bislang für die Vektorräume T p M und T p∗ M überwiegend Koordinatenbasen (auch holonome Basen genannt) betrachtet, d. h. Basen, die sich direkt aus den gewählten Koordinaten ableiten lassen: T p M = Span ∂μ , T p∗ M = Span d μ Diese Koordinatenbasen sind oftmals nicht orthonormal, d. h., es gilt im Allgemeinen g ∂μ , ∂ν = ημν , wobei ημν = diag (−1, 1, 1, 1) wieder die Minkowski-Metrik in kartesischen Koordinaten bezeichne. Beispiel 12.2
In Beispiel 1.4 haben wir die Minkowski-Metrik in Kugelkoordinaten hergeleitet: ⎛
−1 ⎜ 0 ημν = ⎜ ⎝ 0 0 woraus wir ablesen:
⎞ 0 0 0 ⎟ 1 0 0 ⎟, 2 ⎠ 0 0r 2 2 0 0 r sin ϑ
12.5
Zusammenhangs- und Krümmungsformen, Cartan’sche Strukturgleichungen
319
ηϑϑ = η (∂ϑ , ∂ϑ ) = r 2 = 1 ηϕϕ = η ∂ϕ , ∂ϕ = r 2 sin2 ϑ = 1, d. h., die beiden Basisvektoren ∂ϑ , ∂ϕ sind nicht normiert.
Wir wollen mit orthonormalen Basen arbeiten, da damit die Rechnungen oftmals einfacher werden. In Bemerkung 11.1 haben wir schon gezeigt, dass man in jedem Punkt p ∈ M stets eine orthonormale Basis (eα ) von T p M mit g eα , eβ = ηαβ
(12.23)
finden kann, d. h., solche orthonormalen Basen existieren. Die (invertierbare) Basistransformationsmatrix zwischen ∂μ und (eα ) bezeichnen wir μ mit Λ = Λα (nicht zu verwechseln mit den Lorentz-Matrizen in der Speziellen Relativitätstheorie!): eα = Λμ (12.24) α ∂μ μ
und verlangen, dass det Λα > 0 ist. Das heißt, dass (eα ) eine Basis ist, die aus einer orientierungserhaltenden Transformation (siehe Definition 10.7) aus ∂μ hervorgeht. Wir erhalten ν μ ν g eα , eβ = Λμ α Λβ g ∂μ , ∂ν = Λα Λβ gμν = ηαβ bzw. umgekehrt
α β gμν = Λ−1 μ Λ−1 ν ηαβ , d. h., Λ−1 ist die Matrix, die gμν auf Diagonalgestalt bringt. Für einen Vektor V ∈ T p M mit V = V μ ∂μ = V α eα = V α Λμ α ∂μ ergibt sich α V μ = Λμ α V α V α = Λ−1 μ V μ .
Die zu (eα ) duale Basis wollen wir mit (eα ) bezeichnen, d. h., es gilt eα eβ = δ αβ sowie
α eα = Λ−1 μ d x μ .
320
12 Krümmung der Raumzeit
Die Metrik lässt sich damit als g = gμν d x μ ⊗ d x ν = ηαβ eα ⊗ eβ
(12.25)
schreiben. Die Basen (eα ) und (eα ) bezeichnen wir als Nichtkoordinatenbasen (nichtholonome Basen) und benutzen zur Indizierung der Basisvektoren überwiegend die Buchstaben α, β, γ , . . . aus dem Anfang des griechischen Alphabets. Diese Indizes charakterisieren das lokale Inertialsystem und werden deshalb auch Lorentz-Indizes genannt, während man die μ, ν, ρ, . . . Indizes als Weltindizes bezeichnet. In praktischen Rechnungen verfährt man oft so, dass man bei Vorliegen einer orthogonalen Koordinatenbasis eine orthonormale (nichtholonome) Basis einfach durch eine Normierung der Koordinatenbasisvektoren generiert. Beispiel 12.3
Wir setzen Beispiel 12.2 fort und definieren als orthonormale Basis: e t = ∂t er = ∂r 1 e ϑ = ∂ϑ r 1 ∂ϕ eϕ = r sin ϑ
(12.26)
Aus dieser Darstellung lässt sich auch sofort die Basistransformationsmatrix ablesen: ⎞ ⎛ 10 0 0 ⎜0 1 0 0 ⎟ ⎟ μ ⎜ ⎟ ⎜ Λ = Λα = ⎜ 0 0 1 ⎟ 0 ⎟ ⎜ r ⎝ 1 ⎠ 00 0 r sin ϑ Entscheidungskriterien für Nichtkoordinatenbasen Um entscheiden zu können, ob eine Basis holonom oder nichtholonom ist, kann man die Lie-Klammer der Basisvektoren zu Hilfe nehmen. In Formel (8.24) haben wir gezeigt, dass der Kommutator von Koordinatenbasis-Vektoren immer gleich null ist:
∂μ , ∂ν = 0
12.5
Zusammenhangs- und Krümmungsformen, Cartan’sche Strukturgleichungen
321
Aufgabe 12.6 Zeigen Sie, dass man die Lie-Klammer von nichtholonomen Basisvektoren (eα ) durch
γ μ ν ν ∂ Λ − Λ ∂ Λ eα , eβ = Λ−1 ν Λμ α μ β β μ α eγ
berechnen kann. Lösung Es gilt μ ν μ ν ν e α , e β = Λμ α ∂μ , Λβ ∂ν = Λα ∂μ Λβ ∂ν − Λβ ∂ν Λα ∂μ ν μ ν ν μ ν μ ∂ ∂ Λ + Λ Λ ∂ ∂ − Λ Λ + Λ Λ ∂ ∂ ∂ ∂ = Λμ μ β ν μ α α β μ ν β ν α β α ν μ ⎛ ⎞ ⎟ ν ν μ μ ν ⎜ = Λμ α ∂μ Λβ ∂ν − Λβ ∂ν Λα ∂μ + Λα Λβ ⎝∂μ ∂ν − ∂ν ∂μ ⎠
=
Λμ α
∂μ Λνβ
γ Λ−1 ν
eγ − Λνβ
∂ν Λμ α
γ μ ν ν = Λ−1 ν Λμ α ∂μ Λβ − Λβ ∂μ Λα eγ ,
γ Λ−1 μ eγ
=0
wobei wir im letzten Schritt im zweiten Term μ ↔ ν vertauscht haben.
Definition 12.5 Die Lie-Klammer zweier Vektoren ist ein Vektor und kann als Linearkombination der Basisvektoren dargestellt werden:
γ eα , eβ = Cαβ eγ (12.27) γ γ μ ν ν Cαβ := Λ−1 ν Λμ α ∂μ Λβ − Λβ ∂μ Λα
mit
(12.28)
γ
Die Größen Cαβ werden Kommutationskoeffizienten genannt. Aus (12.28) folgt sofort, dass die Kommutationskoeffizienten antisymmetrisch in den unteren Indizes sind: γ
γ
Cαβ = −Cβα
Die Kommutationskoeffizienten von Koordinatenbasen sind alle identisch null.
(12.29)
Das folgende Beispiel zeigt, dass die Kommutationskoeffizienten von nichtholonomen Basen im Allgemeinen von null verschieden sind.
322
12 Krümmung der Raumzeit
Beispiel 12.4
Wir berechnen die Lie-Klammer von eϑ und eϕ aus Beispiel 12.3:
1 1 1 1 1 1 eϑ , eϕ = ∂ϑ , ∂ϕ = ∂ ϑ ∂ϕ − ∂ϕ ∂ϑ r r sin ϑ r r sin ϑ r sin ϑ r ⎛ =
1 ∂ϑ r
1 r sin ϑ
∂ϕ +
1 1 1 ∂ϑ ∂ ϕ − r r sin ϑ r sin ϑ
=
⎜ 1 ⎟ 1 ⎜ ⎟ ∂ϑ + ∂ϕ ∂ϑ ⎟ ⎜∂ϕ ⎝ ⎠ r r
⎞
⎛
⎞
=0
1 1 ⎜ − cos ϑ ⎟ ∂ϕ + ⎝∂ϑ ∂ϕ − ∂ϕ ∂ϑ ⎠ 2 2 r r sin ϑ r sin ϑ =0
− cos ϑ 1 − cot ϑ = ∂ϕ = eϕ . r sin ϑ r sin ϑ r Die nichtverschwindenden Kommutationskoeffizienten sind also ϕ
ϕ
Cϑϕ = −Cϕϑ =
− cot ϑ . r
Eine zweite Möglichkeit zur Bestimmung der Basisart besteht darin, die nichtholonomen Basiseinsformen zu untersuchen. Satz 12.3 γ Seien (eα ), (eα ) duale nichtholonome Basen und Cαβ die Kommutationskoeffizienten von (eα ), dann gilt 1 (12.30) d eα = − Cβγa eβ ∧ eγ , 2 wobei d die äußere Ableitung der Einsform eα (siehe Definition 10.5) und ∧ das Dachprodukt der Einsformen (siehe Definition 10.2) bezeichnen. Da die Kommutationskoeffizienten einer Koordinatenbasis alle verschwinden, muss in diesem Fall die linke Seite ebenfalls null sein. Das ist auch so, denn es gilt mit (10.13) d d x μ = d d x μ = 0, da die zweiten äußeren Ableitungen von Differenzialformen nach (10.20) verschwinden. Die Gl. (12.30) bietet die Möglichkeit, die Kommutationskoeffizienten durch Berechnung der Ableitung d eα zu bestimmen.
12.5
Zusammenhangs- und Krümmungsformen, Cartan’sche Strukturgleichungen
323
Aufgabe 12.7 Beweisen Sie die Formel (12.30), indem Sie zwei Basisvektoren in die rechte und linke Seite der Gleichung einsetzen.
Lösung Wir wollen die Gl. (12.30) Schritt für Schritt detailliert nachweisen und damit einige Rechenoperationen für Differenzialformen einüben. Die linke Seite von (12.30) stellt eine Zweiform dar. Wir nehmen zwei Basisvektoren eβ , eγ und berechnen die Ableitung mit der Formel (10.15):
d eα eβ , eγ = eβ eα eγ − eγ eα eβ − eα eβ , eγ Für die Lie-Klammer setzen wir nach (12.27) die Kommutationskoeffizienten ein und erhalten d eα eβ , eγ = eβ δγα − eγ δβα −eα Cβγδ eδ . =0
=0
Die beiden ersten Terme auf der rechten Seite verschwinden, da die Wirkung eines Tangentialvektors auf eine Konstante nach Gl. (8.9) null ergibt. Damit folgt d eα eβ , eγ = −Cβγδ δδα = −Cβγα . Für die rechte Seite von (12.30) wählen wir die gleiche Vorgehensweise und berechnen mit Definition 10.2: 1 1 − Cζ ηα eζ ∧ eη eβ , eγ = − Cζ ηα eζ eβ eη eγ − eη eβ eζ eγ 2 2 1 η ζ = − Cζ ηα δβ δγη − Cζ ηα δβ δγζ 2 1 = − Cβγα − Cγβα 2 1 = − 2 Cβγα = −Cβγα , 2 wobei wir in der letzten Zeile die Antisymmetrie der Kommutationskoeffizienten in den beiden unteren Indizes genutzt haben. Damit ist (12.30) bewiesen. Beispiel 12.5
Wir berechnen einige Kommutationskoeffizienten der orthonormalen Basis aus Beispiel 12.3 mithilfe der äußeren Ableitung aus (12.30). Die nichtholonomen dualen Basiseins formen müssen eα eβ = δβα erfüllen und lauten somit et = dt, er = dr , eϑ = r dϑ, eϕ = r sin ϑ dϕ. Wir berechnen mit der Produktregel (10.12)
324
12 Krümmung der Raumzeit
d eϕ = d (r sin ϑ dϕ) = d (r sin ϑ) ∧ dϕ + (−1)0 r sin ϑ ∧ d (dϕ), =0
der zweite Summand auf der rechten Seite ist gleich null, da die zweiten äußeren Ableitungen nach (10.20) verschwinden. Da die äußere Ableitung der Funktion (r sin ϑ) nach Definition 10.5 gleich deren Differenzial ist, folgt ∂ (r sin ϑ) ∂ (r sin ϑ) ϕ dr + dϑ ∧ dϕ d e = d (r sin ϑ) ∧ dϕ = ∂r ∂ϑ = sin ϑ dr ∧ dϕ + r cos ϑ dϑ ∧ dϕ = dr ∧ sin ϑ dϕ + cos ϑ dϑ ∧ r dϕ 1 cos ϑ = dr ∧ r sin ϑ dϕ + r dϑ ∧ r sin ϑ dϕ r r sin ϑ cot ϑ ϑ 1 e ∧ eϕ . = er ∧ e ϕ + r r Nun nutzen wir die Antisymmetrie des Dachproduktes und erhalten 1 r cot ϑ ϑ e ∧ eϕ + e ∧ eϕ r r 1 cot ϑ ϑ 1 1 r 1 ϕ cot ϑ ϕ ϕ r ϕ ϑ e ∧e − e ∧e + e ∧e − e ∧e = 2 r r 2 r r 1 1 1 r cot ϑ ϑ 1 ϕ cot ϑ ϕ ϕ r ϕ ϑ =− − e ∧e + e ∧e − − e ∧e + e ∧e . 2 r r 2 r r
d eϕ =
Aus dieser Darstellung können wir mit (12.30) die Kommutationskoeffizienten ablesen: 1 r cot ϑ , =− r
Cr ϕϕ = −Cϕrϕ = − ϕ
ϕ
Cϑϕ = −Cϕϑ
und wir erhalten in der zweiten Zeile natürlich das gleiche Ergebnis wie in Beispiel 12.4. Zusammenhangs- und Krümmungsformen γ Seien wieder (eα ), (eα ) duale nichtholonome Basen und Cαβ die Kommutationskoeffizienten von (eα ). Definition 12.6 γ Die Zusammenhangskoeffizienten αβ werden durch γ
∇eα eβ =: ∇α eβ = αβ eγ definiert.
(12.31)
12.5
Zusammenhangs- und Krümmungsformen, Cartan’sche Strukturgleichungen
325
Bemerkung 12.3 1. Wir haben in Definition 12.6 zur Kennzeichnung der Zusammenhangskoeffizienten das große Gamma benutzt, und es ist Vorsicht geboten, da es sich hier nicht um ChristoffelSymbole handelt. Die Indizes der Zusammenhangskoeffizienten schreiben wir zur Unterscheidung immer mit kleinen griechischen Buchstaben aus dem Anfang des Alphabets. Es gibt eine formale Ähnlichkeit mit den Christoffel-Symbolen, die wir in (11.28) auf analoge Weise dort allerdings in einer Koordinatenbasis definiert haben. μ 2. Mit eα = Λα ∂μ können wir die Zusammenhangskoeffizienten durch die ChristoffelSymbole ausdrücken. Aus Gl. (12.31) folgt γ ρ ν ν ν Λμ ∂ Λ + Λ μ α β β μρ ∂ν = αβ Λγ ∂ν und daraus γ γ ρ ν ν −1 γ ν αβ = Λ−1 ν Λμ Λμ α ∂μ Λβ + Λβ μρ = Λ α ∇μ Λβ . ν
(12.32)
3. Da wir uns in einer Lorentz-Mannigfaltigkeit mit torsionsfreiem Levi-CivitaZusammenhang bewegen, folgt aus (11.42)
γ γ eα , eβ = ∇α eβ − ∇β eα = αβ eγ − βα eγ . Andererseits gilt nach (12.27)
γ eα , eβ = Cαβ eγ ,
woraus insgesamt
γ
γ
γ
Cαβ = αβ − βα
(12.33)
folgt. Insbesondere sind die Zusammenhangskoeffizienten im Gegensatz zu den Christoffel-Symbolen nicht symmetrisch in den unteren Indizes. 4. In Gl. 12.5 hatten wir das Riemann’sche Krümmungsfeld durch R (X , Y ) Z = ∇ X (∇Y Z ) − ∇Y (∇ X Z ) − ∇[X ,Y ] Z definiert. Da dies eine koordinatenunabhängige Definition ist, können wir analog zu (12.9) die Komponenten auch in der nichtholonomen Basis berechnen: R αβγ δ = eα ∇γ ∇δ eβ − ∇δ ∇γ eβ − ∇[eγ ,eδ ] eβ ε ε eε − ∇δ γβ eε − Cγ δ ∇ε eβ = eα ∇γ δβ Wir führen mit (11.30) und ein wenig „Indexgymnastik“ die drei kovarianten Ableitungen aus und erhalten ζ ε ε ε ε R αβγ δ = eα eγ δβ eε + δβ ∇γ eε − eδ γβ eε − γβ ∇δ eε − Cγ δ εβ eζ
326
12 Krümmung der Raumzeit
ζ ζ ε ε ε ε = eα eγ δβ eε + δβ γζ ε eζ − eδ γβ eε − γβ δε eζ − Cγ δ εβ eζ α ε α ε α α + δβ − γβ γαε − eδ γβ δε − Cγ δ εβ . (12.34) = eγ δβ Nun ersetzen wir noch mit (12.33) die Kommutationskoeffizienten durch die Zusammenhangskoeffizienten und erhalten schließlich die Komponenten des Riemann’schen Tensors in einer nichtholonomen Basis: α α ε ε α α R αβγ δ = eγ δβ − eδ γβ + δβ εβ γαε − γβ δε − γ δ − δγ (12.35) Aus der Darstellung lesen wir ab, dass auch die nichtholonomen (ebenso wie die holonomen) Komponenten antisymmetrisch in den beiden letzten Indizes sind. Definition 12.7 1. Die 16 Einsformen ωαβ , die durch α γ ωαβ := γβ e
(12.36)
definiert werden, nennt man Zusammenhangseinsformen (auch kurz: Zusammenhangsformen). Für deren Komponenten gilt α δ α ωαβ = ωαβ eγ = δβ e eγ = γβ . (12.37) γ
2. Die 16 Krümmungszweiformen (Krümmungsformen) R αβ werden durch R αβ :=
1 α R eγ ∧ eδ 2 βγ δ
(12.38)
definiert. Bemerkung 12.4 1. Wenn wir ein Vektorfeld X = X δ eδ in (12.36) einsetzen, so erhalten wir α γ α ωαβ (X ) = γβ e X δ eδ = X γ γβ , d. h., wir können die Zusammenhangsformen auch durch α ωαβ (X ) eα := X γ γβ eα = ∇ X eβ
(12.39)
12.5
Zusammenhangs- und Krümmungsformen, Cartan’sche Strukturgleichungen
327
definieren, wobei X ein beliebiges Vektorfeld ist; vgl. die Formel der kovarianten Ableitung eines (holonomen) Basisvektors nach einem Vektorfeld in (11.32). In der nichtholonomen Basis gilt ⎧ ⎪ α = β ⎪0 ⎨ g eα , eβ = εα = −1 α = β = 0 . ⎪ ⎪ ⎩ε = 1 α = β = 0 α Mit (8.9) folgt daraus für ein beliebiges Vektorfeld X : X g eα , eβ = 0 Andererseits gilt mit der Ricci-Bedingung (11.41) X g e α , e β = g ∇ X eα , e β + g e α , ∇ X eβ und damit mit (12.39) 0 = g ∇ X eα , e β + g e α , ∇ X eβ = ωγα (X ) g eγ , eβ + ωδ β (X ) g (eα , eδ ) = ωβα (X ) εβ + ωαβ (X ) εα . Daraus erhalten wir
ωβα (X ) = −εα εβ ωαβ (X ) ,
wobei keine Summation über gleiche Indizes erfolgt. Da X beliebig ist, ergibt sich ωβα = −εα εβ ωαβ ,
(12.40)
also eine Symmetrieeigenschaft der Zusammenhangsformen. Insbesondere folgt aus (12.40) für α = β: ωαα = −ωαα ⇒ ωαα = 0 (12.41) sowie
β
ω α = ωαβ falls α = 0 ∨ β = 0, β ω α = −ωαβ sonst.
(12.42)
Mit (12.37) überträgt sich die gleiche Symmetrie auf die Krümmungsformen: R βα = −εα εβ R αβ 2. Wenn wir zwei Basisvektoren in (12.38) einsetzen, so erhalten wir 1 R αβ eζ , eη = R αβγ δ eγ ∧ eδ eζ , eη 2 1 = R αβγ δ eγ eζ eδ eη − eγ eη eδ eζ 2
(12.43)
328
12 Krümmung der Raumzeit
=
1 α γ R βγ δ δζ δηδ + R αβδγ δηγ δζδ = R αβζ η . 2
(12.44)
Damit können wir auch direkt die Komponenten des Ricci-Tensors R Ric durch die Krümmungsformen ausrechnen: R Ric = Rβγ = R αβαγ = R αβ eα , eγ
(12.45)
Diese Formel wird uns später bei den Berechnungen von Lösungen der EinsteinGleichungen noch gute Dienste erweisen. Cartan’sche Strukturgleichungen Mithilfe der Zusammenhangseinsformen können wir die sogenannten Cartan’schen Strukturgleichungen formulieren. Satz 12.4 1. Erste Cartan’sche Strukturgleichung: deα + ωαβ ∧ eβ = 0
(12.46)
2. Zweite Cartan’sche Strukturgleichung: dωαβ + ωαγ ∧ ω
γ β
= R αβ
(12.47)
Diese Gleichung bietet eine Möglichkeit, den Riemann’schen Krümmungstensor bzw. den Ricci-Tensor zu berechnen, ohne vorher die Christoffel-Symbole ermitteln zu müssen.
Aufgabe 12.8 Beweisen Sie die zwei Cartan’schen Strukturgleichungen, indem Sie zwei nichtholonome Basisvektoren erst in die linke und dann in die rechte Seite der Gleichungen einsetzen und anschließend die beiden Ergebnisse vergleichen.
Lösung 1. Wir betrachten zunächst die Gl. (12.46) und gehen ähnlich vor wie beim Beweis von (12.30), in dem manche der folgenden Rechenschritte ausführlicher kommentiert werden. Wir setzen in die Zweiform auf der linken Seite zwei nichtholonome Basisvektoren ein:
12.5
Zusammenhangs- und Krümmungsformen, Cartan’sche Strukturgleichungen
329
deα eγ , eδ + ωαβ ∧ eβ eγ , eδ = eγ eα (eδ ) − eδ eα eγ −eα eγ , eδ + ωαβ
∧e
β
eγ , eδ
=0
=0
Dabei haben wir zur Berechnung der äußeren Ableitung wieder (10.15) genutzt. Wir setzen die Definitionen der Kommutationskoeffizienten und Zusammenhangsformen ein und erhalten deα eγ , eδ + ωαβ ∧ eβ eγ , eδ = −eα Cγ δε eε + ωαβ eγ eβ (eδ ) − eβ eγ ωαβ (eδ ) α ε α ε = −Cγ δα + εδ e eγ − εγ e (eδ ) α = 0. = −Cγ δα + γαδ − δγ
Die letzte Gleichung folgt mit (12.33). 2. Für den Beweis der zweiten Strukturgleichung rechnen wir zuerst die linke Seite aus: γ γ dωαβ eε , eζ + ωαγ (eε ) ω β eζ − ω β (eε ) ωαγ eζ
= eε ωαβ eζ − eζ ωαβ (eε ) − ωαβ eε , eζ γ γ α η α η e (eε ) ηβ eη eζ − ηβ eη (eε ) ηγ e eζ + ηγ α η α η α η e eζ − eζ ηβ e (eε ) − ηβ e Cεζθ eθ = eε ηβ γ
γ
α ζβ − εβ ζαγ + εγ
γ
γ
η
α α α α = eε ζβ − eζ εβ + εγ ζβ − εβ ζαγ − ηβ Cεζ
Die rechte Seite ergibt: 1 R αβ eε , eζ = R αβγ δ eγ ∧ eδ eε , eζ 2 1 = R αβγ δ eγ (eε ) eδ eζ − eδ (eε ) eγ eζ 2 1 1 γ = R αβγ δ δεγ δζδ − R αβγ δ δεδ δζ 2 2 1 α 1 α = R βεζ − R βζ ε = R αβεζ , 2 2 da die Komponenten des Riemann’schen Tensors antisymmetrisch in den beiden letzten Indizes sind. Ein Vergleich mit (12.34) zeigt, dass die beiden Seiten übereinstimmen.
330
12 Krümmung der Raumzeit
Bemerkung 12.5 Die erste Cartan’sche Strukturgleichung gibt es in allgemeinerer Form auch für LorentzMannigfaltigkeiten, die nicht mit dem Levi-Civita-Zusammenhang ausgestattet sind. Sie lautet dann deα + ωαβ ∧ eβ = T α , mit der Torsionszweiform
1 α β T e ∧ eγ , 2 βγ die Komponenten des Torsionstensors (11.43) bezeichnen. Tα =
wobei die T αβγ
Beispiel 12.6
Wir berechnen mithilfe der Cartan’schen Strukturgleichungen nochmals den Riemann’schen Krümmungsskalar einer Kugeloberfläche mit Radius a und haben damit einen direkten Vergleich zwischen der „Tensormethode“ und der „Differenzialformenmethode“. Zunächst ermitteln wir die Zusammenhangseinsformen für die nichtholonome Basis. Das Linienelement der Kugel ist ds 2 = a 2 dϑ 2 + a 2 sin2 ϑ dϕ 2 , d. h., die nichtholonome duale Basis ist eϑ = a dϑ, eϕ = a sin ϑ dϕ. Es gilt einerseits mit (10.20) d eϑ = d (a dϑ) = a d (dϑ) = 0 und andererseits nach (12.46) d eϑ = −ωϑβ ∧ eβ = −ωϑϑ ∧ eϑ − ωϑϕ ∧ eϕ . Mit (12.41) erhalten wir ωϑϑ = 0 und damit zusammenfassend 0 = d eϑ = −ωϑϕ ∧ eϕ ⇒ ωϑϕ = 0. Für die zweite Basiseinsform folgt einerseits ∂ (a sin ϑ) ∂ (a sin ϑ) dϑ + dϕ ∧ dϕ d eϕ = d (a sin ϑ) ∧ dϕ = ∂ϑ ∂ϕ = a cos ϑ dϑ ∧ dϕ cos ϑ a dϑ ∧ a sin ϑ dϕ = a sin ϑ
12.5
Zusammenhangs- und Krümmungsformen, Cartan’sche Strukturgleichungen
=
331
cot ϑ ϑ cot ϑ ϕ e ∧ eϕ = − e ∧ eϑ a a
und andererseits mit (12.41) d eϕ = −ω
ϕ ϑ
∧ eϑ − ωϕϕ ∧eϕ = −ω
ϕ ϑ
∧ eϑ .
=0
Insgesamt ergibt sich für die einzige von null verschiedene Zusammenhangseinsform: ω
ϕ ϑ
=
cot ϑ ϕ cot ϑ ϕ e ⇒ ϕϑ = a a
Mit der zweiten Cartan’schen Strukturgleichung (12.47) folgt daraus für die Krümmungsform R
ϕ ϑ
= dω =
ϕ ϑ
ϕ dω ϑ
=d
+ω
ϕ ϑ
=d
∧ ωϑϑ + ωϕϕ ∧ ω =0
cot ϑ ϕ e a
cos ϑ a sin ϑ dϕ a sin ϑ
=0
= − sin ϑ dϑ ∧ dϕ = − =−
ϕ ϑ
= d (cos ϑ dϕ) 1 (a dϑ ∧ a sin ϑ dϕ) a2
1 ϑ e ∧ eϕ . a2
(12.48)
Nun benutzen wir (12.45), um direkt die Komponenten des Ricci-Tensors zu bestimmen: ϕ Rϑϕ = R ϑϑ eϑ , eϕ + R ϑ eϕ , eϕ =0
1 ϑ e ∧ e ϕ eϕ , eϕ = 0 2 a ϕ = R ϑϑ (eϑ , eϑ ) + R ϑ eϕ , eϑ
=− Rϑϑ
=0
1 ϑ 1 e ∧ e ϕ eϕ , eϑ = 2 2 a a = R ϑϕ eϑ , eϕ + R ϕϕ eϕ , eϕ =−
Rϕϕ
= −R
ϕ ϑ
=0
1 1 eϑ , eϕ = − − 2 e ϑ ∧ e ϕ eϑ , eϕ = 2 a a
Der Krümmungsskalar ergibt sich mit
332
12 Krümmung der Raumzeit
ηαβ =
10 01
daraus zu
2 , a2 und wir erhalten natürlich das gleiche Ergebnis wie in Aufgabe 12.5, vgl. (12.22).
R = ηϑϑ Rϑϑ + ηϕϕ Rϕϕ =
12.6
Symmetrien und Killing-Vektoren
Symmetrien spielen eine wichtige Rolle in der Physik und helfen oftmals, komplizierte Aufgaben deutlich zu vereinfachen, wie z. B. das Auffinden von Lösungen der EinsteinGleichungen (siehe Kap. 13). Wir wollen in diesem Abschnitt Symmetrien auf einer Lorentz-Mannigfaltigkeit M, die mit dem Levi-Civita-Zusammenhang ausgestattet ist, näher beleuchten. Definition 12.8 Sei φ : M → M ein Diffeomorphismus und T ein Tensorfeld beliebigen Ranges auf M. Dann können wir an jedem Punkt der Mannigfaltigkeit T mit dem Pullback φ ∗ T vergleichen, siehe (9.35). 1. Gilt
T = φ∗ T ,
so nennt man φ eine Symmetrie des Tensors T . Unter einer Symmetrietransformation ändert sich der Tensor also nicht, obwohl er durch φ ∗ „bewegt“ wurde. 2. Gilt diese Aussage speziell für den metrischen Tensor g, d. h., gilt mit V p , W p ∈ T p M gφ( p) φ∗ V p , φ∗ W p = g p V p , W p ,
(12.49)
wobei φ∗ den Pushforward, siehe (9.24) bezeichnet, so nennt man die Symmetrietransformation eine Isometrie, siehe (11.18). In Koordinaten erhalten wir mit p = x μ und φ ( p) = y ν ∂ yρ ∂ yσ gρσ (φ ( p)) = gμν ( p) . (12.50) ∂xμ ∂xν Definition 12.9 Ein Vektorfeld X = X μ ∂μ heißt Killing-Vektorfeld, wenn die infinitesimale diffeomorphe Transformation xμ → xμ + Xμ mit 1 eine Isometrie ist.
12.6
Symmetrien und Killing-Vektoren
333
Beispiel 12.7
Ist gμν unabhängig von der Koordinate x 0 , d. h., gμν x 0 , x 1 , x 2 , x 3 = gμν x 0 + c, x 1 , x 2 , x 3 für ein beliebiges c ∈ R, so folgt mit der Transformation μ
x μ → x μ + δ0
und mit (12.50) die Beziehung ρ ∂ x ρ + δ0 ∂ x σ + δ0σ gρσ x τ + δ0τ = δμρ δνσ gρσ x τ + δ0τ = gμν x τ , μ ν ∂x ∂x μ
μ
d. h., X μ = δ0 ist ein Killing-Vektor. Analog sind δi , i = 1, 2, 3 Killing-Vektoren, falls die Metrik unabhängig von x i ist. Berechnungsmethoden für Killing-Vektorfelder Ist X ein Killing-Vektorfeld, so gilt mit p = x μ ∂ (x ρ + X ρ ) ∂ (x σ + X σ ) gρσ ( p + X ) = gμν ( p) . ∂xμ ∂xν Es gilt in erster Ordnung in gρσ ( p + X ) = gρσ ( p) + X τ ∂τ gρσ ( p) sowie
∂ (x ρ + X ρ ) ∂ (x σ + X σ ) ρ ρ = δ + ∂ X , = δνσ + ∂ν X σ . μ μ ∂xμ ∂xν Zusammengefasst ergibt sich in erster Ordnung in gμν ( p) = δμρ + ∂μ X ρ δνσ + ∂ν X σ gρσ ( p) + X τ ∂τ gρσ ( p) = gμν ( p) + X τ ∂τ gμν ( p) + gμσ ( p) ∂ν X σ + gρν ( p) ∂μ X ρ . Daraus folgt wieder in erster Ordnung in , dass der Term in der geschweiften Klammer verschwinden muss, also X τ ∂τ gμν ( p) + gμσ ( p) ∂ν X σ + gρν ( p) ∂μ X ρ = 0.
(12.51)
Die linke Seite dieser Gleichung ist nach (9.55) aber nichts anderes als die Lie-Ableitung der Metrik.
334
12 Krümmung der Raumzeit
Bemerkung 12.6 1. Für einen Killing-Vektor X gilt die Gleichung L X g = 0,
(12.52)
die auch Killing-Gleichung genannt wird. 2. Da wir den Levi-Civita-Zusammenhang unterstellt haben, können wir die KillingGleichung mit der Torsionsfreiheit (11.42): [X , V ] = ∇ X V − ∇V X sowie der Ricci-Bedingung (11.41): X (g (V , W )) = g (∇ X V , W ) + g (V , ∇ X W ) für zwei beliebige Vektorfelder V , W folgendermaßen umschreiben: 0 = (L X g) (V , W ) = L X (g (V , W )) − g (L X V , W ) − g (V , L X W ) = X (g (V , W )) − g ([X , V ] , W ) − g (V , [X , W ]) = X (g (V , W )) − g (∇ X V − ∇V X , W ) − g (V , ∇ X W − ∇W X ) = g (∇V X , W ) + g (V , ∇W X ) 3. Mit
(12.53)
X = X ρ ∂ρ , V = ∂μ , W = ∂ν
ergibt sich daraus die Killing-Gleichung in Koordinaten: 0 = g ∇ μ X ρ ∂ ρ , ∂ ν + g ∂ μ , ∇ν X ρ ∂ ρ = gρν ∇μ X ρ + gμρ ∇ν X ρ = ∇μ gρν X ρ + ∇ν gμρ X ρ = ∇μ X ν + ∇ν X μ ,
(12.54)
wobei wir in der vorletzten Gleichung ausgenutzt haben, dass die kovariante Ableitung der Metrik verschwindet. Bemerkung 12.7 1. Ist γt : M → M eine einparametrige Gruppe, die das Killing-Vektorfeld generiert (siehe (9.62)), so besagt die Killing-Gleichung, dass sich die lokale Geometrie nicht ändert, wenn wir uns entlang des Flusses bewegen. In diesem Sinne repräsentieren die KillingVektorfelder die Richtung von Symmetrien auf der Mannigfaltigkeit.
12.6
Symmetrien und Killing-Vektoren
335
2. Die Killing-Gleichung in Koordinaten kann auch als ρ ∂μ X ν + ∂ν X μ − 2μν Xρ = 0
(12.55)
geschrieben werden. Für flache Mannigfaltigkeiten reduziert sie sich auf ∂μ X ν + ∂ν X μ = 0.
(12.56)
3. Der Kommutator von Killing-Vektoren ist wieder ein Killing-Vektor. Damit bildet die Menge aller Killing-Vektoren eine sogenannte Lie-Algebra.
Aufgabe 12.9 Zeigen Sie, dass der Kommutator zweier Killing-Vektoren wieder ein Killing-Vektor ist.
Lösung Wegen der Linearität der Lie-Ableitung ist eine Linearkombination von zwei KillingVektoren X , Y wieder ein Killing-Vektor, d. h. L a X +bY g = 0 für a, b ∈ R. Ferner gilt mit der Jacobi-Identität für Lie-Klammern (8.26)
L [X ,Y ] g (V , W ) = [X , Y ] g (V , W ) − g ([[X , Y ] , V ] , W ) − g (V , [[X , Y ] , W ]) = X Y g (V , W ) − Y Xg (V , W ) − g ([X , [Y , V ]] , W ) − g ([Y , [V , X ]] , W ) − g (V , [X , [Y , W ]]) − g (V [Y , [W , X ]]) = L X (L Y g (V , W )) − L Y (L X g (V , W )) − g ([X , L Y V ] , W ) + g ([Y , L X V ] , W ) − g (V , [X , L Y W ]) + g (V , [Y , L X W ]) = L X (L Y g (V , W )) − g (L X (L Y V ) , W ) − g (V , L X (L Y W )) − {L Y (L X g (V , W )) − g (L Y (L X V ) , W ) − g (V , L Y (L X W ))} = (L X L Y g) (V , W ) − (L Y L X g) (V , W ) = 0,
da L X g = L Y g = 0.
Bemerkung 12.8 Es gibt einen Zusammenhang zwischen einem Killing-Vektor X und dem Krümmungstensor, nämlich ρ ∇μ ∇λ X ν = Rνμλ X ρ . (12.57)
336
12 Krümmung der Raumzeit
Diese Formel kann dabei helfen, die Killing-Vektoren einer Mannigfaltigkeit zu bestimmen.
Aufgabe 12.10 Beweisen Sie die Gl. (12.57).
Lösung Zunächst folgt mit (12.2) ρ
∇ν ∇λ X μ − ∇λ ∇ν X μ = Rμνλ X ρ = Rρμνλ X ρ .
(12.58)
Mit der 1. Bianchi-Identität (12.11) ergibt sich daraus ∇ν ∇λ X μ − ∇μ X λ + ∇λ ∇μ X ν − ∇ν X μ + ∇μ (∇ν X λ − ∇λ X ν ) ⎞ ⎛ ⎟ ⎜ = ⎝ Rρμνλ + Rρνλμ + Rρλμν ⎠ X ρ = 0. =0
Für ein Killing-Vektorfeld sind die Terme in den Klammern in der ersten Zeile jeweils das Doppelte des ersten Summanden, z. B. ∇λ X μ − ∇μ X λ = 2 ∇λ X μ , d. h., es folgt ∇ν ∇λ X μ + ∇λ ∇μ X ν + ∇μ ∇ν X λ = 0 und daraus wieder mit der Killing-Gleichung ∇ν ∇λ X μ − ∇λ ∇ν X μ − ∇μ ∇λ X ν = 0. Mit (12.58) ergibt sich schließlich für den Killing-Vektor ρ
∇μ ∇λ X ν = Rνμλ X ρ . Wir schauen uns ein Beispiel an. Beispiel 12.8
Wir ermitteln alle Killing-Vektoren X μ des Minkowski-Raumes und verwenden die kartesischen Koordinaten (t, x, y, z). Der Minkowski-Raum ist flach, und die kovariante Ableitung stimmt mit der partiellen Ableitung überein. Damit ergibt sich mit (12.57)
12.6
Symmetrien und Killing-Vektoren
337
∇ρ ∇ν X μ = ∂ρ ∂ν X μ = 0, woraus ∂ν X μ = aμν = const. mit aμν = ∂ν X μ = −∂μ X ν = −aνμ und
X μ = aμν x ν + bμ folgt. Da aμν schiefsymmetrisch ist, ist aμν durch sechs Parameter bestimmt, bμ durch weitere vier, es gibt also insgesamt zehn Killing-Vektoren. Wir setzen zunächst aμν = 0 und erhalten wie in Beispiel 12.7, dass die vier Translationen ∂t = (1, 0, 0, 0) ∂x = (0, 1, 0, 0) ∂ y = (0, 0, 1, 0) ∂z = (0, 0, 0, 1) Killing-Vektoren sind. Nun setzen wir bμ = 0 und wählen für aμν sechs schiefsymmetrische Basismatrizen, d. h. zum Beispiel ⎛
L xt
0 ⎜ −1 →⎜ ⎝ 0 0
1 0 0 0
0 0 0 0
⎞⎛ ⎞ ⎛ ⎞ 0 t x ⎜ x ⎟ ⎜ −t ⎟ 0⎟ ⎟⎜ ⎟ = ⎜ ⎟, 0⎠⎝ y ⎠ ⎝ 0 ⎠ 0 z 0
und erhalten als Killing-Vektoren die drei Lorentz-Boosts ⎛
L xt
⎞ ⎛ ⎞ ⎛ ⎞ x y z ⎜ −t ⎟ ⎜ 0 ⎟ ⎜ 0 ⎟ ⎟ ⎜ ⎟ ⎜ ⎟ →⎜ ⎝ 0 ⎠ , L yt → ⎝ −t ⎠ , L zt → ⎝ 0 ⎠ 0 0 −t
sowie die drei Drehungen um die Raumachsen ⎛
⎞ ⎛ ⎞ ⎛ ⎞ 0 0 0 ⎜ −y ⎟ ⎜ z ⎟ ⎜ 0 ⎟ ⎟ ⎜ ⎟ ⎜ ⎟ Rz → ⎜ ⎝ x ⎠ , R y → ⎝ 0 ⎠ , Rx → ⎝ −z ⎠ . 0 −x y
(12.59)
338
12 Krümmung der Raumzeit
Erhaltungssätze Wenn sich ein Teilchen mit Masse m entlang einer Geodäte γ mit dem Tangentialvektor U μ bewegt, so gilt für den Impulsvektor P μ = mU μ die Geodätengleichung (11.61): P ν ∇ν P μ = 0 Ist X = X μ ein Killing-Vektor, so folgt daraus und mit der Killing-Gleichung P ν ∇ν P μ X μ = P νP μ ∇ν X μ +X μ P ν ∇ν P μ = 0. sym.
anti−sym.
=0
Auch der erste Summand verschwindet, da eine totale Kontraktion eines symmetrischen mit einem antisymmetrischen Tensor vorliegt. Es ergibt sich also mit (11.33) ∇ν P μ X μ = ∂ν P μ X μ = 0 ⇒ P μ X μ = const.,
(12.60)
d. h. ein Erhaltungsgesetz. Beispiel 12.9
Ist die Metrik unabhängig von den Koordinaten x μ , so sind nach Beispiel 12.7 die Vekμ toren X μ = δν Killing-Vektoren und aus (12.60) ergibt sich P μ X μ = Pμ X μ = Pμ δνμ = Pν = const.,
also die Impulserhaltung.
Freifallende massive Teilchen und auch Lichtstrahlen bewegen sich entlang Geodäten. Die Konstanz von P μ X μ in Gl. (12.60) bedeutet, dass jedes Killing-Vektorfeld zu einem Erhaltungssatz für freifallende Teilchen bzw. Lichtstrahlen führt. Killing-Vektoren generieren eine Isometrie, d. h., die Symmetrietransformationen der Metrik erzeugen Erhaltungssätze. Homogene, isotrope und maximal symmetrische Räume Wie viele Killing-Vektoren kann es in einer Mannigfaltigkeit geben? Das Beispiel 12.8 zeigt schon, dass die Anzahl der Killing-Vektoren größer sein kann als die Dimension der Mannigfaltigkeit. Wir wollen zeigen, dass in einer d-dimensionalen Mannigfaltigkeit die Anzahl der linear-unabhängigen Killing-Vektoren nicht größer als d (d + 1) /2 sein kann. Dazu schauen wir uns nochmals die Gl. (12.57) ρ
∇μ ∇λ X ν = Rνμλ X ρ
(12.61)
an, die besagt, dass die zweite Ableitung eines Killing-Vektors sich durch den Krümmungstensor und den Vektor selbst ausdrücken lässt. Nach expliziter Ausschreibung der kovarianten Ableitungen können wir diese Formel als ein System von Differenzialgleichungen
12.6
Symmetrien und Killing-Vektoren
339
zweiter Ordnung für die d Funktionen X μ ( p) in d Variablen p = x ν , ν = 0, . . . , d − 1 auffassen. Um es eindeutig zu lösen, müssen wir an einer beliebigen Stelle p0 den KillingVektor sowie seine ersten Ableitungen: Aμ := X μ ( p0 ) , als Anfangswerte vorgeben. Die Matrix B
μ ν
B μν := ∇ν X μ ( p0 ) ist allerdings nicht beliebig, sondern wegen
∇ν X μ ( p0 ) = −∇μ X ν ( p0 ) antisymmetrisch und hat damit d (d − 1) /2 unabhängige Elemente. Zählen wir noch die d Komponenten von Aμ hinzu, so erhalten wir insgesamt d (d + 1) /2 freie Parameter für die Differenzialgleichungen. Natürlich können diese nicht immer bzw. nicht überall lösbar sein, aber wenn sie lösbar sind, dann genügen höchstens d (d + 1) /2 Angaben, um die Lösung eindeutig zu fixieren. Da das Differenzialgleichungssystem (12.61) linear in X μ ist, folgt auch, dass es maximal d (d + 1) /2 linear unabhängige Lösungen geben kann. Diese Überlegungen führen zu folgender Definition. Definition 12.10 1. Eine d-dimensionale Lorentz-Mannigfaltigkeit heißt homogen, wenn ein beliebiger Punkt p0 durch eine infinitesimale Isometrie zu jedem anderen Punkt in einer Umgebung von p0 verschoben werden kann. Die Metrik besitzt also Killing-Vektoren, die an jedem Punkt p0 jeden beliebigen Wert annehmen können, d. h., es sollen Lösungen von (12.61) für eine beliebige Wahl von Aμ = X μ ( p0 ) existieren. Diese Lösungen nennen wir translationsbezogene Killing-Vektoren, von denen es d linear unabhängige geben soll. In einem homogenen Raum sind also alle Punkte gleichberechtigt. Es gibt keinen Punkt mit einer besonderen Eigenschaft (z. B. maximaler Krümmung), denn wäre das so, dann könnte der Punkt mit einer Isometrie auf einen anderen Punkt abgebildet werden, der dann die gleiche Eigenschaft hätte. 2. Eine d-dimensionale Lorentz-Mannigfaltigkeit heißt isotrop an der Stelle p0 , wenn es Isometrien gibt, die den Punkt p0 fix lassen, sodass jeder Vektor in p0 in jeden anderen Vektor in p0 rotiert werden kann. Die Metrik besitzt also Killing-Vektoren, die Lösungen μ von (12.61) mit Aμ = 0 und beliebiger antisymmetrischer Matrix B ν := ∇ν X μ ( p0 ) sind. Diese Lösungen nennen wir rotationsbezogene Killing-Vektoren, von denen es d (d − 1) /2 linear unabhängige geben soll. Ein isotroper Raum sieht in jeder Richtung gleich aus. 3. Eine d-dimensionale Lorentz-Mannigfaltigkeit heißt maximal symmetrisch, wenn sie d (d + 1) /2 linear unabhängige Killing-Vektorfelder besitzt.
340
12 Krümmung der Raumzeit
Bemerkung 12.9 1. Eine homogene und isotrope Mannigfaltigkeit ist maximal symmetrisch. 2. Eine in allen Punkten p isotrope Mannigfaltigkeit ist auch homogen. Das heißt, eine in allen Punkten isotrope Mannigfaltigkeit ist maximal symmetrisch. 3. Es gilt auch die Umkehrung von (1.): Eine maximal symmetrische Mannigfaltigkeit ist homogen und isotrop. Die Beweise von (2.) und (3.) findet man z. B. in [25].
Beispiel 12.10
1. In Beispiel 12.8 haben wir gezeigt, dass es 10 = 4 (4 + 1) /2 Killing-Vektoren für den vierdimensionalen Minkowski-Raum gibt. Der Minkowski-Raum ist also maximal symmetrisch. 2. Nach Beispiel 9.3 ist die Metrik der Zweisphäre S 2 durch 1 0 , μ, ν = ϑ, ϕ gμν = 0 sin2 ϑ gegeben. Wir berechnen die Killing-Vektoren mithilfe von (12.51): X τ ∂τ gμν + gμσ ∂ν X σ + gρν ∂μ X ρ = 0 und erhalten folgende Gleichungen: a) μ = ν = ϑ:
∂ϑ X ϑ = 0,
b) μ = ν = ϕ: 2 sin ϑ cos ϑ X ϑ + 2 sin2 ϑ ∂ϕ X ϕ = 0 ⇒ cos ϑ X ϑ + sin ϑ ∂ϕ X ϕ = 0, c) μ = ϑ, ν = ϕ:
∂ϕ X ϑ + sin2 ϑ ∂ϑ X ϕ = 0.
Da ∂ϑ X ϑ = 0, ist X ϑ unabhängig von ϑ, d. h. X ϑ (ϑ, ϕ) = f (ϕ) mit einer geeigneten Funktion f (ϕ). Dies eingesetzt in Gleichung (b) führt mit F = f zu ∂ϕ X ϕ = − cot ϑ f (ϕ) ⇒ X ϕ =
− cot ϑ f (ϕ) dϕ = − cot ϑ F (ϕ) + g (ϑ)
12.6
Symmetrien und Killing-Vektoren
341
mit der „Integrationskonstanten“ g (ϑ). Einsetzen in (c) ergibt mit F = f 0 = ∂ϕ f (ϕ) + sin2 ϑ ∂ϑ (− cot ϑ F (ϕ) + g (ϑ)) = F (ϕ) + F (ϕ) + sin2 ϑ g (ϑ) , d. h.
−F (ϕ) − F (ϕ) = sin2 ϑ g (ϑ) .
Beide Seiten müssen getrennt konstant (= C) sein, d. h., wir erhalten die beiden gewöhnlichen Differenzialgleichungen: a) sin2 ϑ g (ϑ) = C ⇒ g (ϑ) =
C ⇒ g (ϑ) = −C cot ϑ + C1 sin2 ϑ
mit der Integrationskonstanten C1 , b)
F (ϕ) + F (ϕ) = −C mit der Lösung, siehe Beispiel 11.11: F (ϕ) = −A cos ϕ + B sin ϕ − C ⇒ f (ϕ) = A sin ϕ + B cos ϕ
Damit folgt X ϕ = (− cot ϑ) (−A cos ϕ + B sin ϕ − C) − C cot ϑ + C1 = A cot ϑ cos ϕ − B cot ϑ sin ϕ + C1 , und insgesamt X = X ϑ ∂ϑ + X ϕ ∂ϕ = (A sin ϕ + B cos ϕ) ∂ϑ + (A cot ϑ cos ϕ − B cot ϑ sin ϕ + C1 ) ∂ϕ = A sin ϕ∂ϑ + cot ϑ cos ϕ∂ϕ + B cos ϕ∂ϑ − cot ϑ sin ϕ∂ϕ + C1 ∂ϕ .
Es gibt drei Integrationskonstanten A, B, C1 und damit drei Killing-Basisvektoren X 1 , X 2 , X 3 , die wir wie folgt festlegen: a) A = 1, B = 0, C1 = 0 : X 1 = sin ϕ ∂ϑ + cot ϑ cos ϕ ∂ϕ, b) A = 0, B = 1, C1 = 0 : X 2 = cos ϕ ∂ϑ − cot ϑ sin ϕ ∂ϕ,
342
12 Krümmung der Raumzeit
c) A = 0, B = 0, C1 = 1 : X 3 = ∂ϕ. Die so gewählten drei Killing-Vektoren sind linear unabhängig, d. h., wegen dim S 2 = 2 besitzt die Zweisphäre die maximale Anzahl von unabhängigen KillingBasisvektoren und ist somit maximal symmetrisch. Die Zweisphäre besteht aus der Menge der Punkte im R3 , die den Abstand 1 vom Ursprung haben und durch Rotationen um Achsen durch den Nullpunkt auf der Kugeloberfläche bleiben. Es ist daher nicht verwunderlich, dass die gefundenen drei Killing-Vektoren für die Sphäre genau den rotationsbezogenen Killing-Vektoren im R3 entsprechen. In Gl. (12.59) aus Beispiel 12.8 haben wir diese für den MinkowskiRaum hergeleitet, sie gelten aber auch im dreidimensionalen euklidischen Raum, wenn wir einfach die Zeitkomponente weglassen. Es gilt also X 1 = Rx = −z∂ y + y∂z X 2 = R y = z∂ x − x∂z X 3 = Rz = −y∂ x + x∂ y,
(12.62)
was wir exemplarisch für die zweite Gleichung zeigen wollen. Mit Beispiel 1.4 folgt für die Jacobi-Matrix J der Kugelkoordinaten ⎞ sin ϑ cos ϕ r cos ϑ cos ϕ −r sin ϑ sin ϕ J = ⎝ sin ϑ sin ϕ r cos ϑ sin ϕ r sin ϑ cos ϕ ⎠ cos ϑ −r sin ϑ 0 ⎛
und daraus X 2 = cos ϕ ∂ϑ − cot ϑ sin ϕ ∂ϕ ⎞ ⎞ ⎛ ⎛ −r sin ϑ sin ϕ r cos ϑ cos ϕ = cos ϕ ⎝ r cos ϑ sin ϕ ⎠ − cot ϑ sin ϕ ⎝ r sin ϑ cos ϕ ⎠ 0 −r sin ϑ ⎞ ⎞ ⎛ ⎛ z r cos ϑ ⎠ = ⎝ 0 ⎠. =⎝ 0 −x −r sin ϑ cos ϕ Riemann’scher Tensor in maximal symmetrischen Räumen Wir zeigen noch, dass der Riemann’sche Tensor in vierdimensionalen maximal symmetrischen Räumen eine besonders einfache Gestalt annimmt. Dabei argumentieren wir eher heuristisch, einen formalen Beweis findet man in [25] oder [35]. Die Basisidee besteht darin,
12.6
Symmetrien und Killing-Vektoren
343
dass in Räumen, die in alle Richtungen gleich aussehen, auch der Krümmungstensor gleich aussehen sollte. Wir wählen in einem Punkt p0 ∈ M ein lokales Inertialsystem, d. h. gμν ( p0 ) = ημν = diag (−1, 1, 1, 1) . Die lokal inertialen Koordinaten sind nicht eindeutig, wir können zum Beispiel eine LorentzTransformation bei p0 anwenden und erhalten wieder die gleichen Metrikkomponenten ημν . Da wir maximale Symmetrie unterstellen, verlangen wir ebenso, dass sich die Komponenten Rρσ μν des Riemann’schen Tensors unter Lorentz-Transformationen nicht ändern. Nun wissen wir nach [17], dass die einzigen Invarianten der Lorentz-Gruppe die Minkowski-Metrik (und Produkte davon) sowie das Levi-Civita-Symbol sind. Das heißt, der Riemann’sche Tensor muss von der Form Rρσ μν ( p0 ) = A ηρσ ημν + B ηρμ ησ ν + C ηρν ημσ + D ερσ μν sein. Die Symmetrien des Riemann’schen Tensors, siehe Satz 12.1, verlangen, dass A = 0, B + C = 0, D = 0 gilt, wobei D = 0 mit der ersten Bianchi-Identität (12.11) folgt. Wir erhalten also Rρσ μν ( p0 ) = B ηρμ ησ ν − ηρν ημσ . Das ist eine tensorielle Gleichung, also gilt in jedem Koordinatensystem Rρσ μν ( p0 ) = B gρμ ( p0 ) gσ ν ( p0 ) − gρν ( p0 ) gμσ ( p0 ) , und wegen der maximalen Symmetrie gilt diese Gleichung in jedem Punkt p ∈ M: Rρσ μν ( p) = B ( p) gρμ ( p) gσ ν ( p) − gρν ( p) gμσ ( p)
(12.63)
Den Wert von B erhalten wir durch zweimalige Kontraktion. Zunächst gilt für den RicciTensor Rσ ν = Rρσ μν g ρμ = B gρμ g ρμ gσ ν − gρν gμσ g ρμ . = B 4gσ ν − gρν δσρ = 3B (gσ ν ) , woraus für den Krümmungsskalar R = Rσ ν g σ ν = 3B gσ ν g σ ν = 3 · 4 B folgt. Insgesamt erhalten wir den Riemann-Tensor Rρσ μν ( p) =
R gρμ ( p) gσ ν ( p) − gρν ( p) gμσ ( p) . 12
344
12 Krümmung der Raumzeit
In Kap. 13 zeigen wir in (13.18), dass der Tensor R ric −
1 Rg 2
divergenzfrei ist, d. h., in unserem Fall gilt 1 σ Rσ ν − R gσ ν = ∇ σ {−3B gσ ν } , 0=∇ 2 woraus die Konstanz der Funktion B ( p) und damit von R folgt. In einem maximal symmetrischen Raum hat jeder Punkt die gleiche Krümmung. Wir werden uns in späteren Kapiteln bei der Diskussion der verschiedenen kosmologischen Modelle noch intensiv mit maximal symmetrischen Mannigfaltigkeiten beschäftigen.
Teil III Einstein-Gleichungen, Schwarzschild-Lösung, Gravitationswellen
Nach den mathematischen und physikalischen Vorbereitungen in den letzten Kapiteln beschäftigen wir uns ab diesem Teil mit den Eigenschaften und Anwendungsbereichen der Allgemeinen Relativitätstheorie (ART). Nach einer heuristischen Herleitung der Einstein-Gleichungen zeigen wir, dass die Newton’sche Gravitationstheorie als Grenzfall schwacher statischer Felder in der ART enthalten ist. Anschließend beweisen wir, dass sich die Einstein-Gleichungen auch aus dem Lagrange-Formalismus ableiten lassen. Die (äußere) Schwarzschild-Metrik war die erste exakte Lösung der EinsteinGleichungen im Vakuum. Sie beschreibt das Gravitationsfeld außerhalb sphärischer statischer Körper, und mit ihr können beobachtete Phänomene in unserem Sonnensystem schlüssig erklärt werden. Zum Beispiel wird die seit Jahrhunderten beobachtete Periheldrehung des Merkurs durch die Schwarzschild-Lösung exakt bestätigt, was bei Anwendung der Newton’schen Theorie nicht der Fall ist. Wir berechnen mit der Schwarzschild-Metrik außerdem die Ablenkung von Licht an der Sonne sowie die gravitative Rotverschiebung. Gravitationswellen sind Verwerfungen der Raumzeit, die durch sich schnell verändernde relativistische Massen generiert werden. Sie breiten sich ähnlich wie elektromagnetische Wellen mit Lichtgeschwindigkeit aus. Die Einstein-Gleichungen für schwache nichtstationäre Gravitationsfelder lassen sich auf Wellengleichungen reduzieren, deren Lösungen Gravitationswellen sind. Wir untersuchen die Ausbreitung von Gravitationswellen, die sich frei durch den leeren Raum ausbreiten, und zeigen, welche Wirkung Gravitationswellen auf Testteilchen haben. Die schon von Einstein gefundene Quadrupolformel, die wir mit vielen Detailrechnungen ausführlich herleiten, stellt die gesamte von einer Massenquelle abgestrahlte Energie pro Zeiteinheit dar. Für den Nachweis von Gravitationswellen beschreiben wir zwei unterschiedliche Methoden. Die erste besteht darin, die Folgen des durch die Gravitationswellenabstrahlung eintretenden Energieverlustes eines Systems zu messen, z. B. indem die Veränderungen der Rotationsgeschwindigkeit eines Binärsystems über einen langen Zeitraum aufgezeichnet werden. Die zweite Methode beinhaltet das Aufspüren von Gravitationswellen mit Messgeräten auf der Erde. Die hauptsächliche Schwierigkeit, Gravitationswellen auf der
346
Teil III Einstein-Gleichungen, Schwarzschild-Lösung, Gravitationswellen
Erde zu messen, ist darin begründet, dass die Amplituden der ankommenden Wellen in einer Größenordnung von etwa nur 10−21 Metern liegen. Seit den 1980er-Jahren wurden die notwendigen Messinstrumente ständig verbessert, bis im September 2015 erstmals Gravitationswellen auf der Erde nachgewiesen werden konnten. Für diesen Erfolg wurden drei der hauptsächlich beteiligten Wissenschaftler (Kip Thorne, Rainer Weiss, Barry Barish) 2017 mit dem Nobelpreis für Physik ausgezeichnet.
Physikalische Gesetze in der Raumzeit, Einstein-Gleichungen
13
In den letzten Kapiteln haben wir herausgearbeitet, dass es kein globales Inertialsystem bei Anwesenheit eines nichthomogenen Gravitationsfeldes gibt und dass die Raumzeit, die wir wieder als eine mit dem Levi-Civita-Zusammenhang ausgestattete Lorentz-Mannigfaltigkeit ansehen, gekrümmt ist, wenn Gravitation wirksam ist. Wir haben mit mathematischen Argumenten die Größen hergeleitet, die man zur Beschreibung der Krümmung der Raumzeit braucht, und wollen in diesem Kapitel unser Augenmerk wieder stärker auf die physikalischen Gesetze der Raumzeit legen. Wir untersuchen, wie sich physikalische Objekte (wie z. B. Teilchen oder Fluide) in der gekrümmten Raumzeit verhalten, und finden heraus, wie umgekehrt die Krümmung der Raumzeit durch diese Objekte generiert und festgelegt wird.
13.1
Kovarianzprinzip
Das Kovarianzprinzip (auch Prinzip der minimalen Kopplung bzw.. Übertragungsregel genannt, siehe z. B. [21, 23]) ist ein Verfahren, mit dem physikalische Gesetze mit Gravitation aus bekannten Gesetzen der Speziellen Relativitätstheorie abgeleitet werden können. Die in diesem Verfahren beschriebene Vorgehensweise haben wir in den letzten Kapiteln schon einige Male angewendet: Zunächst werden die physikalischen Phänomene im lokalen Inertialsystem beschrieben und dann durch Koordinatentransformation in das tatsächlich benutzte Koordinatensystem gebracht. Wir wissen auch schon, wie wir Gleichungen formulieren müssen, damit sie in allen Koordinatensystemen formgleich („kovariant“) sind, nämlich, indem wir ausschließlich Tensoren und kovariante Ableitungen dieser Tensoren in den Gleichungen benutzen. Wir können also das Kovarianzprinzip für die im Gravitationsfeld gültigen Gleichungen durch folgende beiden Aussagen definieren:
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_13
347
348
13 Physikalische Gesetze in der Raumzeit, Einstein-Gleichungen
• Das physikalische Gesetz muss in Form einer Tensorgleichung in der LorentzMannigfaltigkeit vorliegen, damit ist es forminvariant/kovariant in allen Koordinatensystemen. • Das Gesetz muss im lokalen Inertialsystem gültig sein. Das heißt, ersetzt man die Komponenten der allgemeinen Metrik gμν durch die der Minkowski-Metrik ημν sowie die kovarianten durch die partiellen Ableitungen, so muss sich das entsprechende Gesetz der Speziellen Relativitätstheorie (SRT) ergeben. Gegenüber der Vorgehensweise in Abschn. 7.6, die durch Abb. 13.1 illustriert wird, kann man sich also das (oftmals mühsame) Umformen einer SRT-Gleichung durch eine allgemeine Koordinatentransformation ersparen, indem man das SRT-Gesetz gleich in kovarianter Form schreibt. Danach ändert es seine Form durch Koordinatentransformationen nicht mehr, es ist damit bereits das gesuchte relativistische Gesetz mit Gravitation. Wir schauen uns einige Beispiele an. Beispiel 13.1
1. Im lokalen Inertialsystem gilt nach (11.77) ∇α g eβ , eγ = ∂α ηβγ = 0. Da ∇α g = 0 eine Tensorgleichung ist, verschwindet die kovariante Ableitung der Metrik in jedem Koordinatensystem. 2. Wir betrachten die Bewegung eines kräftefreien Teilchens im Gravitationsfeld und schauen uns dazu die Bewegungsgleichung im lokalen Inertialsystem an. Dort gelten die Gesetze der Speziellen Relativitätstheorie, und wir können die relativistische Newton’sche Bewegungsgleichung (3.27) mit der Minkowski-Kraft K = 0 aufstellen: dU d2 X d2 X dU m =m = =0⇒ = 0, (13.1) 2 dτ dτ dτ dτ 2 wobei m die Masse, U = U α die Vierergeschwindigkeit, X = X (τ ) = x α (τ ) die Weltlinie des Teilchens und τ die Eigenzeit im lokalen Inertialsystem bezeichne. Nach dem Kovarianzprinzip suchen wir eine kovariante Gleichung, die sich für gαβ = ηαβ
Abb. 13.1 Kovarianzprinzip
13.1
Kovarianzprinzip
349
auf die obige Gleichung reduziert. Wir machen eine Koordinatentransformation und erhalten für die Komponenten von U in einer beliebigen (holonomen) Basis: Uμ =
dxμ ∂xμ ν ∂xμ dxν = U = ∂xν ∂ x ν dτ dτ
(13.2)
Die kovariante Ableitung von U ergibt sich mit (11.30) zu μ μ ∂U μ σ ∂μ . + σ ν U ∇ν U = ∇ν U ∂μ = ∂xν dxν Kontrahiert man die Komponenten mit U ν = , so erhält man die Komponenten dτ des Vektors μ ∂U μ d x ν DU dxν ∂U μ σ Uν = := + σμν U σ + U σν ν ν dτ ∂x ∂ x dτ dτ σ dxν μ σ dxν dU μ d x d x d x = + σμν = , + σμν dτ dτ dτ dτ 2 dτ dτ wobei wir mehrfach (13.2) benutzt haben. Als kovariante Verallgemeinerung von Gl. (13.1) bietet sich also DU =0 (13.3) dτ an. Natürlich erhalten wir aus dieser Gleichung wiederum die Komponentenform der Geodätengleichung im Gravitationsfeld σ ν dxμ μ dx dx = 0, + σ ν dτ 2 dτ dτ
(13.4)
die wir in (11.74) mühsam mit dem Lagrange-Mechanismus hergeleitet haben.
Aufgabe 13.1 Leiten Sie mit dem Kovarianzprinzip die kovarianten MaxwellGleichungen her.
Lösung Der kovariante Feldstärketensor sowie die kovariante Stromdichte ergeben sich mit einer Koordinatentransformation aus dem lokalen Inertialsystem durch ∂ x μ ∂ x ν αβ F ∂xα ∂xβ ∂xμ α Jμ = J . ∂xα
F μν =
Daraus und aus (5.26) sowie (5.27) folgen die kovarianten Maxwell-Gleichungen:
350
13 Physikalische Gesetze in der Raumzeit, Einstein-Gleichungen
∇ν F μν = J μ ∇ ρ F μν + ∇ μ F νρ + ∇ ν F ρμ = 0
(13.5)
mit ∇ μ = g μν ∇ν .
Wir können also festhalten, dass das Kovarianzprinzip das Aufstellen der Gesetze mit Gravitation oftmals wesentlich vereinfacht. Und weil das Kovarianzprinzip so wichtig ist, formulieren wir es nochmals auf eine leicht andere Art und Weise: Gesetze im Gravitationsfeld gμν sind kovariante Gleichungen, die sich ohne Gravitationsfeld, d. h., wenn gμν = ημν gilt, auf die Gesetze der Speziellen Relativitätstheorie reduzieren.
13.2
Energie-Impuls-Tensoren in der Lorentz-Mannigfaltigkeit
In Kap. 6 haben wir Energie-Impuls-Tensoren in der Speziellen Relativitätstheorie untersucht und insbesondere die Energie-, Impuls- und Teilchenzahl-Erhaltungssätze durch die Divergenzfreiheit der entsprechenden Tensoren für das elektromagnetische Feld sowie für ideale Flüssigkeiten und Staub nachgewiesen. Wir wollen nun die entsprechenden Verallgemeinerungen mithilfe des Kovarianzprinzips ableiten. Bemerkung 13.1 1. Der Energie-Impuls-Tensor für das elektromagnetische Feld ist nach (6.3) μν
TM = TM = F μσ Fσ ν +
1 μν η Fαβ F αβ . 4
Den kovarianten Tensor erhalten wir mit dem Kovarianzprinzip, indem wir die inverse Minkowski-Metrik ημν durch die inverse allgemeine Metrik g μν ersetzen: μν
TM = TM = F μσ Fσ ν +
1 μν g Fαβ F αβ 4
(13.6)
2. Der Energie-Impuls-Tensor für ideale Fluide in der Speziellen Relativitätstheorie lautet gemäß (6.15): TF = (ρ + p)U ⊗ U + p G, wobei U die Vierergeschwindigkeit und G = ηαβ die inverse Minkowski-Metrik bezeichnet. Wir ersetzen die inverse Minkowski-Metrik durch die allgemeine inverse Metrik g −1 = g μν und erhalten die koordinatenfreie Definitionsgleichung für den kovarianten Energie-Impuls-Tensor für ideale Fluide bzw. für Staub im Fall p = 0:
13.2
Energie-Impuls-Tensoren in der Lorentz-Mannigfaltigkeit
TF = (ρ + p) U ⊗ U + p g −1 ,
351
(13.7)
dessen Komponenten sich zu μν
TF = (ρ + p) U μ U ν + p g μν
(13.8)
ergeben. 3. Der allgemeine kovariante Energie-Impuls-Tensor T ist dann wie in (6.18) die Summe aller im Gesamtsystem vorkommenden μν
μν
T = T μν = TF + TM + · · · .
(13.9)
Man liest ab, dass auch die kovarianten Energie-Impuls-Tensoren symmetrisch sind. Die Divergenzfreiheit der Energie-Impuls-Tensoren in der SRT haben wir mithilfe der Viererdivergenz (siehe (4.43)) beschrieben. Die kovariante Divergenz kann man koordinatenfrei mithilfe der Kontraktion (9.19) definieren. Definition 13.1 Zunächst bilden wir die kovariante Ableitung ∇T ∈ T21 (M) (vergleiche (11.27)) und kontrahieren diese dann mit C11 oder C12 , was wegen der Symmetrie von T das Gleiche ist. Die kovariante Divergenz wird dann koordinatenfrei durch div T := C11 (∇T ) = C12 (∇T ) definiert. Das Ergebnis ist ein Vektorfeld, d. h. div T ∈ T10 (M). Das Tensorfeld T hat die Komponenten T μν , ∇T hat die Komponenten ∇ρ T μν , und durch die Kontraktion wird daraus das Vektorfeld div T = ∇μ T μν = ∇ν T μν . Im lokalen Inertialsystem gilt für den allgemeinen Energie-Impuls-Tensor der Erhaltungssatz ∂α T αβ = 0. Nach dem Kovarianzprinzip wird dies zu ∇μ T μν = 0.
(13.10)
Das Gravitationsfeld geht über die Christoffel-Symbole in die kovariante Ableitung ein. Alle anderen Kräfte sind über ihren Beitrag zu (13.9) berücksichtigt. Der allgemeine kovariante Energie-Impuls-Tensor, den wir zukünftig kurz „Energie-Impuls-Tensor“nennen wollen, ist
352
13 Physikalische Gesetze in der Raumzeit, Einstein-Gleichungen
die relativistische Verallgemeinerung der Massendichte ρ in der Newton’schen Gravitationstheorie und bildet die Quelle des relativistischen Gravitationsfeldes. Er enthält alle relevanten Energieformen (außer dem Gravitationsfeld selbst). In den meisten Anwendungen der nachfolgenden Kapitel wird sich T μν auf den Tensor für Fluide (13.8) reduzieren.
13.3
Newton’scher Grenzfall
Wir wollen zeigen, dass sich die Geodätengleichung (13.4) im Grenzfall kleiner Geschwindigkeiten und eines schwachen, statischen Gravitationsfeldes auf die Newton’sche Bewegungsgleichung reduziert. Diese lautet nach (7.4) m r¨ = −m∇φ ( r) bzw. in Koordinatenform nach Division durch die Masse m d 2 x i (t) dt 2
=−
∂φ , ∂xi
wobei φ das Newton’sche Gravitationspotenzial bezeichne und der Index i die Werte 1, 2, 3 annehmen kann. Dabei bedeutet kleine Geschwindigkeit, dass in natürlichen Einheiten | v| 1 ist und deshalb die Komponenten der Vierergeschwindigkeit (3.15) U= die Bedingungen
dX = (γ , γ v 1 , γ v 2 , γ v 3 ) dτ
d x i i dt , i = 1, 2, 3 v = dτ dτ
sowie
1 dt =γ = √ ≈1 dτ 1 − v2 erfüllen. Aus der letzten Gleichung folgt auch, dass d x μ dt dxμ dxμ = ≈ dτ dt dτ dt
ist. Die Annahme schwacher Felder bedeutet, dass die Metrik gμν nicht sehr von der Minkowski-Metrik ημν abweicht. Wir machen den Ansatz gμν = ημν + h μν
13.3
Newton’scher Grenzfall
353
mit einer sehr kleinen statischen Störfunktion h μν , d. h. h μν 1, deren Ableitungen und damit auch die Christoffel-Symbole ebenfalls klein sein mögen. Die Koordinaten sind daher bis auf kleine Abweichungen die Minkowski-Koordinaten, und die Geodätengleichung reduziert sich auf σ ν dxμ μ dt dt μ μ dx dx ≈ − 00 ≈ − 00 . = − σ ν dτ 2 dτ dτ dτ dτ
Nun sind die Komponenten von gμν wegen der angenommenen Statik zeitlich konstant, also die zeitlichen Ableitungen gleich null, sodass mit Gl. (3.15) folgt: μ
00 =
g μν ημν ημν ∂ν g00 = − ∂ν h 00 (∂0 g0ν + ∂0 g0ν − ∂ν g00 ) ≈ − 2 2 2
Nun ist die zeitliche Ableitung von h 00 ebenfalls null, und wir erhalten 1 2 1 ≈− 2 1 ≈− 2 = 0.
1 00 ≈− 2 00 3 00 0 00
∂h 00 ∂x1 ∂h 00 ∂x2 ∂h 00 ∂x3
Zusammengefasst ergibt sich für die räumlichen Komponenten der Teilchenbahn d2xi 1 ∂h 00 d2xi ≈ ≈ , dt 2 dτ 2 2 ∂xi was man in der Näherung auch als dreidimensionale Vektorgleichung schreiben kann: 1 1 ∂h 00 ∂h 00 ∂h 00 d 2 r = ∇h 00 = , , dt 2 2 2 ∂x1 ∂x2 ∂x3 Diese Gleichung stimmt für h 00 = −2φ
(13.11)
mit der Newton’schen Bewegungsgleichung überein. Beachtet man noch, dass g00 = η00 + h 00 = −(1 + 2φ)
(13.12)
gilt, so erhält man den gleichen Zusammenhang zwischen der „Zeit-Zeit”-Komponente der Metrik und dem Gravitationspotenzial φ wie in Gl. (7.15) beim Zentrifugalpotenzial. In einer Entfernung r eines Körpers mit Masse M ist
354
13 Physikalische Gesetze in der Raumzeit, Einstein-Gleichungen
φ=− siehe Formel (7.3), d. h.
GM r
g00 = − 1 −
,
2G M r
.
(13.13)
Wir haben also eine Komponente der Metrik gefunden, und das ist auch alles, was wir finden können, wenn wir die Newton’sche Theorie mit der Einstein’schen vergleichen, da die Newton’sche Gravitation durch nur eine Funktion, nämlich durch das Gravitationspotenzial φ beschrieben wird.
13.4
Einstein’sche Feldgleichungen
In diesem Abschnitt, der sich an [6] anlehnt, stellen wir die Gesetze für die Beschreibung des Gravitationsfeldes auf, d. h., wir zeigen, wie die Quellen des Gravitationsfeldes die Metrik festlegen. Diese Feldgleichungen lassen sich nicht aus der Newton’schen Physik und auch nicht aus der Speziellen Relativitätstheorie bspw. durch das Kovarianzprinzip ableiten. Vielmehr sind sie von Einstein nach immerhin zehnjährigem Nachdenken gefunden und postuliert worden. Die Gültigkeit der ART, d. h. die Richtigkeit der Feldgleichungen, muss sich durch Experimente und Beobachtungen bestätigen, wie jede andere physikalische Theorie auch. Auch wenn die Feldgleichungen durch Einsteins kreative Eingebung zustande gekommen sind, lassen sie sich im Nachhinein ganz gut nachvollziehen und plausibilisieren. Stellen wir uns also vor, wir hätten die Aufgabe, die allgemeinen Gleichungen für die Beschreibung eines Gravitationsfeldes zu finden. Dann wäre es nicht unvernünftig, wenn wir drei Forderungen an diese Gleichungen richteten: 1. Die Gleichungen sollten kovariant, also als allgemeine Tensorgleichungen aufstellbar sein. Damit hätten sie in jedem beliebigen Koordinatensystem die gleiche Form. 2. Die Gleichungen sollten sich im Newton’schen Grenzfall (schwaches, statisches Gravitationsfeld, kleine Geschwindigkeiten) auf das Newton’sche Gravitationsgesetz, speziell auf die Poisson-Gleichung (7.10):
φ = 4π Gρ
(13.14)
reduzieren und somit die bewährte Newton’sche Gravitationstheorie als Spezialfall enthalten. 3. Die Gleichungen sollten zudem so einfach wie möglich sein. Diese Forderung entspricht einem allgemeinen Wissenschaftsprinzip („Ockhams Gesetz”), das besagt, dass von mehreren möglichen Erklärungen ein und desselben Sachverhalts die einfachste Theorie allen anderen vorzuziehen ist.
13.4
Einstein’sche Feldgleichungen
355
Schauen wir uns zunächst die rechte Seite der Poisson-Gleichung an. Die Quelle des Gravitationsfelds in Newtons Theorie ist die Massendichte ρ. In der gesuchten relativistischen Theorie müssen die Quellen einem relativistischen Ansatz entsprechen, was durch die Masse allein nicht gegeben ist. Eine offensichtliche relativistische Verallgemeinerung ist die Gesamtenergie (3.5), die die Ruhemasse mit beinhaltet. In Abschn. 6.3 haben wir die Energiedichte einer idealen Flüssigkeit im momentanen Inertialsystem (ebenfalls) mit ρ bezeichnet, und es liegt nahe, diese als Quelle des Gravitationsfeldes zu benutzen. Doch auch dieser Ansatz schlägt fehl, da ρ nur für den mitbewegten Beobachter die Energiedichte darstellt, andere Beobachter messen die Energiedichte als die Komponente T 00 des Energie-Impuls-Tensors in ihrem eigenen Bezugssystem. Also verwerfen wir den Ansatz mit der Energiedichte ρ und betrachten T 00 als Verallgemeinerung der Newton’schen Massendichte. Nun ist T 00 nur eine Komponente des Energie-Impuls-Tensors, nach Forderung (1.) sollten die Gleichungen aber aus (kompletten) Tensoren bestehen. Deswegen wählen wir für die rechte Seite der gesuchten Gleichungen den Ansatz kT = k T μν , mit einer noch zu bestimmenden Konstanten k, wobei die T μν die Komponenten des EnergieImpuls-Tensors T sind. Wenn wir nun die linke Seite der Poisson-Gleichung (13.14) betrachten, so stellen wir fest, dass dort wegen ∂ 2φ ∂ 2φ ∂ 2φ
φ = + + ∂x2 ∂ y2 ∂z 2 zweite Ableitungen des Gravitationspotenzials φ vorkommen. Da im Newton’schen Grenzfall nach (13.13) 1 g00 = −(1 + 2φ) ⇒ φ = (−1 − g00 ) 2 ist und damit 1 ∂ 2 (1 + g00 ) ∂ 2 (1 + g00 ) ∂ 2 (1 + g00 )
φ = − + + 2 ∂x2 ∂ y2 ∂z 2 2 1 1 ∂ g00 ∂ 2 g00 ∂ 2 g00 = − g00 =− + + 2 ∂x2 ∂ y2 ∂z 2 2 gilt, ergibt sich aus der Poisson-Gleichung − g00 = 8π Gρ. Daraus können wir zweierlei ableiten. Zum einen ergibt sich für die Konstante k auf der rechten Seite unseres Ansatzes k = 8π G,
356
13 Physikalische Gesetze in der Raumzeit, Einstein-Gleichungen
und zum anderen müssen auf der linken Seite der Gleichung im Newton’schen Grenzfall zweite Ableitungen der Metrik vorkommen, speziell muss sich für die 00-Komponente des gesuchten Tensors der linken Seite die Größe − g00 ergeben. Nun wissen wir, dass der Ricci-Tensor (siehe Definition 12.18) aus zweiten Ableitungen der Metrik besteht, sodass wir nach Forderung (3.) als einfachsten Ansatz nunmehr R μν = 8π G T μν wählen. Divergenz des Ricci-Tensors Um diesen Ansatz zu überprüfen, erinnern wir uns daran, dass die kovariante Divergenz des Energie-Impuls-Tensors verschwindet ∇ν T μν = 0, d. h., wenn unser Ansatz richtig ist, so muss auch die Divergenz des Ricci-Tensors verschwinden. Um diese auszurechnen, multiplizieren wir die zweite Bianchi-Identität (12.16) mit g μν und erhalten g μν ∇σ Rμρνλ + ∇λ Rμρσ ν + ∇ν Rμρλσ = 0. Nach der Definition des Ricci-Tensors (12.18) ergibt sich für den ersten Term g μν ∇σ Rμρνλ = ∇σ Rρλ .
Aufgabe 13.2
(13.15)
Zeigen Sie die Gültigkeit von (13.15).
Lösung Wegen ∇σ g μν = 0 folgt mit der Produktregel ∇σ Rρλ = ∇σ g μν Rμρνλ = ∇σ g μν Rμρνλ + g μν ∇σ Rμρνλ = g μν ∇σ Rμρνλ . Wegen der Antisymmetrie des Riemann-Tensors in den letzten beiden Indizes ergibt sich für den zweiten Term ebenso g μν ∇λ Rμρσ ν = −g μν ∇λ Rμρνσ = −∇λ Rρσ . Der dritte Term lässt sich als g μν ∇ν Rμρλσ = ∇ν R νρλσ
13.4
Einstein’sche Feldgleichungen
357
schreiben, sodass insgesamt folgt ∇σ Rρλ − ∇λ Rρσ + ∇ν R ν ρλσ = 0.
Aufgabe 13.3
(13.16)
Zeigen Sie, dass aus (13.16) für die Divergenz des Ricci-Tensors ∇λ R τ λ =
1 τλ g ∇λ R 2
(13.17)
folgt. Lösung Die Gl. (13.16) multiplizieren wir mit g ρλ und erhalten mit der Definition des Krümmungsskalars (12.21): R = g ρλ Rρλ für den ersten Term für den zweiten
g ρλ ∇σ Rρλ = ∇σ R, −g ρλ ∇λ Rρσ = −∇λ R λ σ
und wieder wegen der Antisymmetrie des Riemann-Tensors in den beiden letzten Indizes für den dritten Term g ρλ ∇ν R ν ρλσ = −g ρλ ∇ν R ν ρσ λ = −g ρλ g ντ ∇ν R τρσ λ . Wir vertauschen nun sowohl die ersten als auch die zweiten Indexpaare des Riemann-Tensors und erhalten −g ρλ g ντ ∇ν R τρσ λ = −g ντ g ρλ ∇ν R ρτ λσ = −g ντ ∇ν R λ τ λσ = −g ντ ∇ν Rτ σ = −∇ν R ν σ = −∇λ R λ σ , wobei in der letzten Gleichung der Summationsindex vertauscht wurde λ ↔ ν. Wir erhalten also insgesamt ∇σ R − ∇λ R λ σ − ∇λ R λ σ = ∇σ R − 2∇λ R λ σ = 0 und wegen
∇σ R = δ λ σ ∇λ R
daraus nach Multiplikation mit g τ σ ∇λ R τ λ = g τ σ ∇λ R λ σ =
1 τσ λ 1 g δ σ ∇λ R = g τ λ ∇λ R. 2 2
358
13 Physikalische Gesetze in der Raumzeit, Einstein-Gleichungen
Die rechte Seite von (13.17) ist im Allgemeinen nicht null. Wir müssen also unseren Ansatz erweitern. Beachtet man, dass die kovariante Ableitung der Metrik gleich null ist, so folgt für die Ableitung des Tensors g τ λ R/2 1 1 1 1 τλ g R = ∇λ g τ λ R + g τ λ ∇λ R = g τ λ ∇λ R ∇λ 2 2 2 2 =0
und damit mit Indexwechsel τ → μ, λ → ν 1 ∇ν R μν − g μν R = 0. 2
(13.18)
Den (divergenzfreien) Tensor G := R Ric −
1 gR 2
(13.19)
mit den Komponenten 1 μν g R (13.20) 2 nennt man Einstein-Tensor, und dieser bildet die linke Seite der Einstein’schen Feldgleichungen (auch: Einstein-Gleichungen): G μν = R μν −
Koordinatenfrei G = R Ric −
1 g R = 8π G T , 2
(13.21)
in Komponenten G μν = R μν −
1 μν g R = 8π G T μν . 2
(13.22)
Diese Gleichungen wurden 1915 von Einstein aufgestellt. Sie sind zusammen mit den Bewegungsgleichungen im Gravitationsfeld (13.4), σ ν dxμ μ dx dx = 0, + σ ν dτ 2 dτ dτ
die gesuchten Grundgleichungen der Allgemeinen Relativitätstheorie. Weiter unten (siehe Aufgabe 13.5) werden wir für einen Spezialfall zeigen, dass die Bewegungsgleichungen direkt aus den Einstein-Gleichungen ableitbar sind. Wegen G μν = gμσ gντ G σ τ = gμσ gντ 8π G T σ τ = 8π G Tμν kann man die Einstein-Gleichungen auch in der Form G μν = Rμν −
1 gμν R = 8π G Tμν 2
(13.23)
13.4
Einstein’sche Feldgleichungen
359
schreiben, die man auch kovariante Form nennt. Aufgrund der Symmetrie des Einsteinund Energie-Impuls-Tensors sowie der Metrik gibt es zunächst zehn statt 16 unabhängige Einstein’sche Feldgleichungen. Wir müssen allerdings beachten, dass die Komponenten der Metrik vom gewählten Koordinatensystem abhängen. Da es vier Koordinaten gibt, gibt also auch vier Freiheitsgrade für die zehn gμν , d. h., es ist nicht möglich, alle zehn Komponenten der Metrik aus zehn vorgegebenen Komponenten des Energie-Impuls-Tensors zu bestimmen, da ja das Koordinatensystem frei wählbar sein soll. Das Problem löst sich aber dadurch, dass es wegen der Divergenzfreiheit des Einstein-Tensors ∇ν G μν = 0 vier (für jeden Wert von μ) Bedingungen für die zehn Einstein-Gleichungen gibt, sodass letztlich sechs unabhängige Gleichungen für die sechs Komponenten des metrischen Tensors, die koordinatenunabhängig die Geometrie beschreiben, übrig bleiben. Für weitergehende Ausführungen siehe z. B. [14] bzw. [17].
Aufgabe 13.4
Zeigen Sie, dass man die Einstein-Gleichungen auch in der Form 1 (13.24) Rμν = 8π G Tμν − gμν T 2
umschreiben kann, wobei T den kontrahierten Energie-Impuls-Tensor bezeichnet. Lösung Wir multiplizieren zunächst die Gl. (13.23) mit g μν und erhalten für die linke Seite g μν Rμν −
1 μν 1 1 g gμν R = R − δμμ R = R − 4 R = −R. 2 2 2
Für die rechte Seite definieren wir T durch
T := g μν Tμν und erhalten
R = −8π G T . Damit können wir die Feldgleichungen (13.23) umschreiben zu 1 Rμν = 8π G Tμν − gμν T . 2 Wir werden später sehen, dass die Form (13.24) der Einstein’schen Feldgleichungen für konkrete Berechnungen oftmals besser geeignet ist.
360
13 Physikalische Gesetze in der Raumzeit, Einstein-Gleichungen
In der Allgemeinen Relativitätstheorie versteht man unter Vakuum einen Raumzeitbereich, in dem der Energie-Impuls-Tensor verschwindet. Wenn wir die Einstein-Gleichungen im Vakuum lösen wollen (z. B. außerhalb eines Sterns und ohne elektromagnetisches Feld), so reduzieren sich diese nach (13.24) auf die einfache Form Rμν = 0.
13.5
(13.25)
Interpretation der Einstein-Gleichungen
Wir wollen uns nochmals explizit klarmachen, ob und wie die Einstein’schen Feldgleichungen die drei am Anfang des Abschn. 13.4 aufgestellten Anforderungen erfüllen. Zunächst stellen wir fest, dass die Einstein-Gleichungen kovariant sind. Sowohl die rechte als auch die linke Seite der Feldgleichungen bestehen aus Tensoren gleichen Ranges. Aus Einstein folgt Newton Die zweite Forderung bestand darin, dass sich für den Newton’schen Grenzfall aus den Einstein-Gleichungen die Poisson-Gleichung (7.10) ergeben muss. Wir unterstellen wie in Abschn. 13.3 jetzt wieder, dass gμν = ημν + h μν mit sehr kleinen statischen h μν , d. h. h μν 1, gilt. Dann folgt μρ η − h μρ ηρν + h ρν = δνμ − h μ ν + h μ ν − h μρ h ρν ≈ δνμ ,
(13.26)
in linearer Näherung, d. h., wenn man den quadratischen Term h μρ h ρν vernachlässigt. Wegen δνμ = g μρ gρν = g μρ ηρν + h ρν folgt aus den letzten beiden Gleichungen also in linearer Näherung g μν = ημν − h μν .
(13.27)
Wir berechnen jetzt die rechte Seite von (13.24) und erinnern uns daran, dass nach Gl. (6.17) für den Energie-Impuls-Tensor im Newton’schen Grenzfall ⎛
ρ μν ⎜ 0 T =⎜ ⎝0 0
0 0 0 0
0 0 0 0
⎞ 0 0⎟ ⎟ = (Tμν ) 0⎠ 0
13.5
Interpretation der Einstein-Gleichungen
361
gilt. Damit folgt T = g μν Tμν = ημν − h μν Tμν ≈ ημν Tμν = η00 T00 = −ρ und daraus Tμν −
1 1 1 gμν T = Tμν − ημν + h μν T ≈ Tμν − ημν T 2 2 2 ⎛ ⎛ ⎞ ⎞ −1 0 0 0 ρ000 ⎜ 0 0 0 0 ⎟ −ρ ⎜ 0 1 0 0 ⎟ ρ ⎜ ⎟ ⎟ =⎜ ⎝ 0 0 0 0 ⎠ − 2 ⎝ 0 0 1 0 ⎠ = 2 δμν . 0 001 0000
(13.28)
Nun berechnen wir R00 und benutzen dazu die Beziehung (12.19): ρ ρ ρ σ σ Rμν = R ρ μρν = ∂ρ μν − ∂ν μρ + σρ μν − σρ ν μρ
Die Christoffel-Symbole lassen sich nach (11.47) durch die Metrik darstellen: τ = μλ
1 τν g ∂λ gμν + ∂μ gλν − ∂ν gμλ 2
Multipliziert man zwei Christoffel-Symbole miteinander, so ergeben sich ausschließlich Terme in h 2 und höher. In linearer Näherung fallen diese weg, und es ergibt sich daraus für den Ricci-Tensor ρ ρ Rμν = ∂ρ μν − ∂ν μρ , woraus genauso wie bei der Herleitung der Formel (12.14) und unter Berücksichtigung, dass die partiellen Ableitungen von ημν verschwinden, Rμν =
ηλσ ∂λ ∂μ h νσ − ∂λ ∂σ h μν − ∂ν ∂μ h λσ + ∂ν ∂σ h μλ 2
(13.29)
in linearer Näherung und somit R00 =
ηλσ (∂λ ∂0 h 0σ − ∂λ ∂σ h 00 − ∂0 ∂0 h λσ + ∂0 ∂σ h 0λ ) 2
folgt. Da die h μν als statisch vorausgesetzt sind, sind alle Ableitungen nach der Zeit gleich null, d. h., alle Terme, die mindestens einmal nach x 0 abgeleitet werden, verschwinden. Es bleibt also ⎛ ⎞ λσ η 1 ∂λ ∂σ h 00 = − ⎝− ∂0 ∂0 h 00 +∂1 ∂1 h 00 + ∂2 ∂2 h 00 + ∂3 ∂3 h 00 ⎠ R00 = − 2 2 =0
362
13 Physikalische Gesetze in der Raumzeit, Einstein-Gleichungen
1 =− 2
∂ 2 h 00 ∂ 2 h 00 ∂ 2 h 00 2 + 2 + 2 ∂x1 ∂x2 ∂x3
1 = − h 00 2
übrig. In Gl. (13.11) haben wir herleitet, dass im Newton’schen Grenzfall h 00 = −2φ ist. Wir erhalten also
1 R00 = − h 00 = φ 2 und damit insgesamt mit (13.28) für μ = ν = 0 1 ρ
φ = R00 = 8π G T00 − g00 T = 8π G δ00 = 4π Gρ. 2 2 In der Newton’schen Näherung folgt also aus den Einstein-Gleichungen die PoissonGleichung und damit die Newton’sche Gravitationstheorie. Kosmologische Konstante Wir betrachten die dritte Forderung, die wir an die Feldgleichungen der Allgemeinen Relativitätstheorie gestellt haben: Sie sollten so einfach wie möglich sein. Die obige Herleitung hat gezeigt, dass die Einstein-Gleichungen R μν −
1 μν g R = 8π G T μν 2
quasi das Minimum darstellen, das man aufgrund der anderen Forderungen, insbesondere der Divergenzfreiheit, erreichen kann. Die Struktur der Gleichungen lassen allerdings zu, dass ein weiterer Term hinzugefügt werden kann, der linear von der Metrik abhängt. Die Gleichungen nehmen dann die Form G μν + g μν = R μν −
1 μν g R + g μν = 8π G T μν 2
(13.30)
an, wobei ein Riemann-Skalar ist. Die Divergenzfreiheit der linken Seite ist gewährleistet, da die kovariante Ableitung der Metrik gleich null ist. Man kann zeigen, dass bei einem Ansatz der Form A = κ T , wobei A ∈ T02 (M) nur von g und deren ersten und zweiten Ableitungen abhängen darf und zugleich divergenzfrei ist, der Tensor A die Gestalt A = G +g mit ∈ R haben muss (siehe [13, 17]). Das heißt, die Erweiterung der Einstein-Gleichungen um den Term g μν ist auch die einzige physikalisch sinnvolle. Einstein selbst hat diesen Term 1917 zu seinen Gleichungen hinzugefügt, damit seine Gleichungen gewährleisten, dass das Universum in einem statischen Zustand verbleibt. Aus
13.5
Interpretation der Einstein-Gleichungen
363
diesem Grund nennt man auch kosmologische Konstante. Als Ende der zwanziger Jahre des vorherigen Jahrhunderts insbesondere durch Beobachtungen des Astronomen Hubble klar wurde, dass sich das Universum ausdehnt, widerrief Einstein die Erweiterung seiner Feldgleichungen und sprach von der „größten Eselei”, die er jemals fabriziert habe. Heutzutage glaubt man allerdings, dass die kosmologische Konstante eine Möglichkeit sein könnte, in der ART die sogenannte Vakuumenergie zu berücksichtigen (siehe Kap. 22). Mit anderen Worten: Auch wenn die kosmologische Konstante aus Sicht Einsteins eine falsche Erweiterung seiner Gleichungen darstellt, scheint ihr aus heutiger Sicht eine wesentliche Bedeutung zuzukommen. Die Einstein-Gleichungen inklusive der kosmologischen Konstanten erfüllen nicht mehr die Anforderung, dass sie im Newton’schen Grenzfall auf die Poisson-Gleichung reduziert werden können. Auch ist die flache Metrik gμν = ημν dann keine Lösung der EinsteinGleichungen mehr. Da der Ricci-Tensor R μν zweite Ableitungen nach den Koordinaten enthält, ist die Dimension der kosmologischen Konstanten (genau wie die des Krümmungsskalars) 1/L¨ange2 . Die Newton’sche Gravitationstheorie ist zur Beschreibung fast aller Phänomene in unserem Sonnensystem bestens geeignet, d. h., der Zusatzterm mit der kosmologischen Konstanten muss also sehr klein sein. Konkret muss die Länge −1/2 sehr viel größer als der Durchmesser unseres Sonnensystems sein: −1/2 105 Lichtjahre (Lj) Wegen dieser Einschränkung spielt die kosmologische Konstante erst bei der großräumigen Betrachtung des Universums (siehe Kap. 24) eine Rolle, die aktuellen Modelle favorisieren eine kosmologische Konstante in der Größenordnung −1/2 ∼ 1010 Lj (siehe [22]). Die kosmologische Konstante wird häufig als Vakuum-Energiedichte ρv =
8π G
(13.31)
aufgefasst und als Bestandteil des Energie-Impuls-Tensors angesehen, sodass die EinsteinGleichungen sich als 1 R μν − g μν R = 8π G T μν − ρv g μν (13.32) 2 schreiben lassen. Da wir uns in den nächsten Kapiteln noch nicht mit kosmologischen Weltmodellen beschäftigen, sondern Phänomene unseres Sonnensystems bzw. einzelner Objekte im Universum untersuchen wollen, arbeiten wir zunächst mit den Einstein-Gleichungen ohne den Zusatzterm, also mit 1 R μν − g μν R = 8π G T μν 2 bzw.
364
13 Physikalische Gesetze in der Raumzeit, Einstein-Gleichungen
Rμν = 8π G Tμν
1 − gμν T 2
.
Divergenzfreiheit des Energie-Impuls-Tensors als Konsequenz der Raumzeit Geometrie Wir haben die spezielle Form des Einstein-Tensors G μν aus der Forderung abgeleitet, dass die Divergenzfreiheit des Energie-Impuls-Tensors ∇μ T μν = 0 gelten soll. Wenn wir die Einstein-Gleichungen G μν = 8π G T μν betrachten und nur annehmen, dass der Einstein-Tensor (wie der Energie-Impuls-Tensor) symmetrisch ist, ohne dass die Divergenzfreiheit vorausgesetzt wird, so bestehen die Einstein-Gleichungen aus zunächst zehn unabhängigen Gleichungen. Wie wir weiter oben schon ausgeführt haben, dürfen die Komponenten der Metrik nur aus sechs der zehn Gleichungen bestimmt werden, da wir vier Gleichungen für die beliebige Wahl eines Koordinatensystems brauchen. Wir benötigen also vier weitere (interne) Gleichungen, die nach der getroffenen Annahme nicht aus der Divergenzfreiheit des Energie-Impuls-Tensors abgeleitet werden dürfen. Bei der Herleitung der Einstein-Gleichungen haben wir die Divergenzfreiheit des Einstein-Tensors ∇ν G μν = 0 einzig aus der zweiten Bianchi-Identität (12.16), also aus rein geometrischen Sachverhalten hergeleitet. Das heißt, wenn wir die Einstein-Gleichungen als gültig voraussetzen, dann folgt umgekehrt, dass wegen der Divergenzfreiheit des Einstein-Tensors auch der EnergieImpuls-Tensor divergenzfrei sein muss. Geodäten als Folge der Einstein-Gleichungen Wie wir gesehen haben, folgt aus der Divergenzfreiheit des Einstein-Tensors die des EnergieImpuls-Tensors: ∇ν T μν = 0 Wir wollen nun zeigen, dass daraus auch die Geodätengleichung folgt, wobei wir hier der Einfachheit halber unterstellen, dass das zu untersuchende Objekt ein Staubteilchen ist. Der Energie-Impuls-Tensor ist dann wegen p = 0 laut Gl. (13.8) T = T μν = (ρ + p) U μ U ν + pg μν = ρU μ U ν .
(13.33)
Aufgabe 13.5 Zeigen Sie, dass aus der kovarianten Ableitung von (13.33) die Geodätengleichung (13.4)
13.5
Interpretation der Einstein-Gleichungen
365
ρ ν d2xμ μ dx dx =0 + ρν 2 dτ dτ dτ
folgt. Lösung Mit der Produktregel folgt aus (13.33) 0 = ∇ν T μν = ∇ν gμρ U μ U ρ = U μ ∇ν ρU ν + ρU v ∇ν U μ .
(13.34)
Nun gilt für die Vierergeschwindigkeit U = U μ die Beziehung −1 = gμρ U μ U ρ , woraus mit der Produktregel wegen ∇ν gμρ = 0 0 = ∇ν gμρ U μ U ρ = gμρ U μ ∇ν U ρ + gμρ U ρ ∇ν U μ = 2gμρ U μ ∇ν U ρ und damit
0 = gμρ U ρ ∇ν U μ
folgt. Nun multiplizieren wir die Gl. (13.34) mit gμρ U ρ und erhalten 0 = gμρ U ρ ∇ν ρU μ U ν = gμρ U ρ U μ ∇ν ρU ν + ρU v gμρ U ρ ∇ν U μ ,
=−1
also
=0
0 = ∇ν ρU ν .
Das setzen wir in Gl. (13.34) ein, und mit der Definition der kovarianten Ableitung folgt μ μ ν ν ∂U μ ρ + ρν U . 0 = U ∇ν U = U ∂xν Nun gilt Uν =
dxν dτ
und damit und mit der Kettenregel folgt 0=
ρ ν ρ ν ρ ν ∂U μ d x ν dU μ d2xμ μ dx dx μ dx dx μ dx dx + ρν = + ρν = , + ρν ν 2 ∂ x dτ dτ dτ dτ dτ dτ dτ dτ dτ
also die Geodätengleichung (13.4).
366
13.6
13 Physikalische Gesetze in der Raumzeit, Einstein-Gleichungen
Ableitung der Einstein-Gleichungen mit dem Lagrange-Formalismus
In Abschn. 13.4 haben wir die Einstein-Gleichungen mit heuristischen Überlegungen hergeleitet, jetzt zeigen wir, dass sie auch aus einem Wirkungsprinzip folgen. Bevor wir das Wirkungsfunktional aufstellen, benötigen wir einige Vorbereitungen. Die Palatini-Gleichung Für die nachfolgenden Rechnungen benötigen wir einige Ergebnisse aus der Tensorrechnung. Wie schon bei dem Beweis der Symmetrien des Riemann-Tensors nutzen wir aus, dass sich Tensoridentitäten am leichtesten im lokalen Inertialsystem herleiten lassen. In (12.12) haben wir gezeigt, dass sich dort die Komponenten des Riemann-Tensors als μ
μ
μ R ρνλ = ∂ν ρλ − ∂λ ρν
schreiben lassen, da die Christoffel-Symbole verschwinden. Wir betrachten eine Variation μ der Christoffel-Symbole ρν zu einem neuen Zusammenhang: μ μ μ μ ρν → ¯ ρν := ρν + δ ρν , μ
dann ist δ ρν als Differenz zweier Christoffel-Symbole nach (11.40) ein Tensor vom Rang (1, 2). Für die Variation des Riemann’schen Tensors folgt analog μ μ μ μ R ρνλ → R¯ ρνλ = R ρνλ + δ R ρνλ
mit
μ μ μ μ μ = ∂ν δ ρλ − ∂λ δ ρν δ R ρνλ = δ ∂ν ρλ − ∂λ ρν ,
da die partiellen Ableitungen mit der Variation vertauschen. Da wir uns im lokalen Inertialsystem befinden, können wir die partiellen Ableitungen auf der rechten Seite durch kovariante ersetzen und erhalten μ μ μ δ R ρνλ = ∇ν δ ρλ − ∇λ δ ρν . (13.35) Die linke Seite besteht aus der Differenz zweier Riemann-Tensoren und ist somit ein Tensor. Die rechte besteht aus der Differenz zweier kovarianter Ableitungen, ist also auch ein Tensor. Das heißt, die Tensorgleichung (13.35), die man auch Palatini-Gleichung nennt, gilt in allen Koordinatensystemen. Durch Kontraktion von μ und ν ergeben sich die Variationen der Komponenten des Ricci-Tensors: μ μ δ Rρλ = ∇μ δ ρλ − ∇λ δ ρμ (13.36)
13.6
Ableitung der Einstein-Gleichungen mit dem Lagrange-Formalismus
367
Variation der Determinante der Metrik Um die Variation von det g = det gμν zu berechnen, wollen wir untersuchen, wie man die Ableitung der Determinante einer Matrix findet, deren Elemente von den Koordinaten abhängen. Ist A = ai j eine invertierbare n × n-Matrix, dann können wir ihre Inverse A−1 = a i j nach einem Satz der Linearen Algebra durch ai j =
1 i j T 1 ji (13.37) A A = det A det A berechnen, wobei die Matrix A ji die zu A adjunkte Matrix und die Zahlen Ai j die Kofaktoren von ai j bezeichnen (siehe [5]). Wir entwickeln die Determinante nach der i-ten Zeile (i fix) und erhalten n ai j Ai j , det A = j=1
wobei wir hier das Summenzeichen explizit ausgeschrieben haben. Partielle Ableitung nach ai j auf beiden Seiten führt zu ∂ det A = Ai j , ∂ ai j da ai j in keinem Kofaktor Ai j auftritt. Da die Matrixelemente ai j Funktionen der Koordinaten sind, ist auch die Determinante von den Koordinaten abhängig. Wir erhalten also mit (13.37) und der Kettenregel ∂ ai j ∂ ai j ∂ det A ∂ det A ∂ ai j = = Ai j = det A a ji . k k k ∂x ∂ ai j ∂ x ∂x ∂xk
(13.38)
Wenn wir dieses Ergebnis auf die Determinante der (symmetrischen) Metrik g = gμν anwenden, ergibt sich ∂ρ det g = det g g μν ∂ρ gμν (13.39) bzw. für die Variation von det g δ det g = (det g) g μν δgμν = − (det g) gμν δg μν .
(13.40)
Die letzte Gleichung resultiert aus g μρ gρν = δνμ ⇒ δ g μρ gρν = gρν δg μρ + g μρ δgρν = 0 ⇒ g μρ δgρν = −gρν δg μρ .
(13.41)
Aus (13.40) folgt 1 1 δ − det g = − √ − det g gμν δg μν . δ det g = − 2 2 − det g
(13.42)
368
13 Physikalische Gesetze in der Raumzeit, Einstein-Gleichungen
Kovariante Divergenz von Vektoren Wir leiten mit den bisherigen Resultaten noch eine einfache Formel für die kovariante Divergenz von Vektoren ab. Es gilt mit (13.42) ∂ρ ln
1 1 1 1 ∂ρ det g. ∂ρ − det g = − √ ∂ρ det g = − det g = √ √ 2 det g − det g − det g 2 − det g
(13.43)
Ferner folgt mit (11.47) μ ρμ =
1 1 μσ g ∂μ gρσ + ∂ρ gμσ − ∂σ gρμ = g μσ ∂ρ gμσ , 2 2
da der erste und dritte Term sich gegenseitig aufheben. Mit (13.39) und (13.43) ergibt sich daraus μ = ρμ
1 ∂ρ det g 1 = ∂ρ ln − det g = √ ∂ρ − det g. 2 det g − det g
(13.44)
Für die Komponenten der kovarianten Divergenz eines Vektors V = V μ ∂μ folgt μ ∇μ V μ = ∂μ V μ + ρμ Vρ 1 = √ − det g ∂μ V μ + ∂μ − det g V μ − det g 1 − det g V μ , ∂μ = √ − det g
(13.45)
wobei wir in der zweiten Gleichung die Indizes vertauscht (ρ → μ) und in der dritten die Produktregel „rückwärts“angewendet haben. Gauß’scher Integrationssatz Wenn wir noch beachten, dass in einer Lorentz-Mannigfaltigkeit der Index von g gleich eins ist (siehe Definition 11.1) und somit |det g| = − det g gilt, so folgt aus (13.45) und dem Gauß’schen Satz für Semi-Riemann’sche Mannigfaltigkeiten in Koordinaten (11.17): 1 n μ |det |det ∂μ = d x d x n−1 det g ∂ M X μ ημ g| √ g|X |det g| M ∂M nunmehr die erwartete Form d n x |det g| ∇μ V μ = M
∂M
d x n−1
det g
∂M
μ X ημ ,
(13.46)
13.6
Ableitung der Einstein-Gleichungen mit dem Lagrange-Formalismus
369
die im Fall gμν = ημν (d. h. |det g| = 1) mit dem Gauß’schen Satz im Minkowski-Raum übereinstimmt. Einstein-Hilbert-Wirkung Wir wollen zunächst die Einstein-Gleichungen im Vakuum mit einem Variationsprinzip ableiten, das von einer Lagrange-Dichte LG ausgeht, die von der (inversen) Metrik und ihren Ableitungen abhängt und so einfach wie möglich ist. Nach unserem Ergebnis für die Volumenform (11.15) erwarten wir, dass sich die Lagrange-Dichte als LG = − det g L˜ G mit einem Skalar L˜ G schreiben lässt. Welche einfachen Skalare können wir aus der Metrik und ihren Ableitungen bilden? Nun, der einfachste ist sicherlich L˜ G = const., d. h. LG = const. − det g. Dieser Ansatz führt aber nicht zu den Einstein-Gleichungen, sondern nur dazu, dass die kovarianten Ableitungen der Metrik und deren Determinante verschwinden, wie in [24] gezeigt wird. Wir wollen beweisen, dass sich mit dem (nächst komplizierteren) Skalar in der sogenannten Einstein-Hilbert-Lagrange-Dichte LG := − det g (R − 2) die Einstein-Gleichungen im Vakuum ableiten lassen, wobei wieder R den Krümmungsskalar und die kosmologische Konstante bezeichnen. Das Wirkungsfunktional wird mit R = g μν Rμν und (11.16) durch d M (R − 2) = d x 4 − det g (R − 2) SG g μν := = d x 4 − det g g μν Rμν − 2 Ω
definiert, wobei wir annehmen, dass ⊂ M ein kompaktes Gebiet der Mannigfaltigkeit und Teilmenge einer geeigneten Umgebung (U , h) ist. Ähnlich wie in Abschn. 5.5 definieren wir für die (inverse) Metrik sowie deren 1. Ableitung: gμν := g μν + h μν
∂ρ gμν := ∂ρ g μν + ∂ρ h μν mit kleinem > 0, wobei h = h μν ein symmetrisches Tensorfeld vom Rang (2, 0) ist, das mit seinen Ableitungen auf dem Rand von Ω verschwindet, also h μν ∂Ω = ∂ρ h μν ∂Ω = 0
370
13 Physikalische Gesetze in der Raumzeit, Einstein-Gleichungen
erfüllt. Wie in der physikalischen Literatur üblich, bezeichnen wir die Variationen mit μν dg μν δg : = = h μν d =0 μν μν g d ∂ ρ ∂ρ δg = ∂ρ h μν , : = δ ∂ρ g μν = d =0
d. h., es gilt
δg μν ∂Ω = ∂ρ δg μν ∂Ω = 0.
(13.47)
Die Variation der Wirkung ergibt sich damit zu δSG =
Ω
dx4
− det g g μν δ Rμν +
− det g Rμν δg μν − g μν Rμν − 2 δ − det g .
(13.48)
Zeigen Sie, dass aus (13.48) die Darstellung 1 d x 4 − det g Rμν − R gμν + gμν δg μν δSG = 2 Ω
Aufgabe 13.6
ableitbar ist.
Lösung Wir schauen uns die drei Summanden in (13.48) einzeln an und stellen fest, dass der zweite Summand dx4 − det g Rμν δg μν (δSG )2 := Ω
schon die gewünschte Form: Term · δg μν hat. Für den ersten Summanden benutzen wir die Palatini-Gleichung für die Variation des Ricci-Tensors (13.36) und erhalten (δSG )1 := =
Ω Ω
dx4 dx4
ρ − det g g μν δ Rμν = dx4 − det g g μν ∇ρ δ μν − ∇ν δ σσ μ .
Ω
ρ − det g ∇ρ g μν δ μν − g μρ δ σσ μ
,
wobei wir für die letzte Gleichung die metrische Verträglichkeit von ∇, d. h., ∇ρ g μν = 0, benutzt haben. Der Integrand ist (fast) eine kovariante Divergenz, wir können ihn mit (13.45) umschreiben und erhalten ρ − det g g μν δ Rμν = − det g ∇ρ g μν δ μν − g μρ δ σσ μ ρ = ∂ρ − det g g μν δ μν − − det g g μρ δ σσ μ , also eine totale Divergenz. Mit dem Gauß’schen Satz (13.46) folgt:
13.6
Ableitung der Einstein-Gleichungen mit dem Lagrange-Formalismus
Ω
∂Ω
d 4 x ∂ρ d 3 x ημ
ρ − det g g μν δ μν − ρ − det g g μν δ μν −
371
− det g g μρ δ σσ μ = − det g g μρ δ σσ μ
(13.49)
Das Integral in der zweiten Zeile enthält Variationen der Christoffel-Symbole, die wir uns näher anschauen. Mit (11.47) τ = μν
1 τρ g ∂μ gνρ + ∂ν gρμ − ∂ρ gμν 2
erhalten wir τ = δ μν
1 1 τρ δg ∂μ gνρ + ∂ν gρμ − ∂ρ gμν + g τρ ∂μ δ gνρ + ∂ν δ gρμ − ∂ρ δ gμν , 2 2
und wegen (13.47) folgt daraus
τ δ μν = 0. ∂Ω
Zusammenfassend ergibt sich (δSG )1 :=
Ω
dx4
− det g g μν δ Rμν = 0.
Für den dritten Term in (13.48) erhalten wir mit (13.40): 1 − det g gμν δg μν δ − det g = − 2 den Ausdruck
:= d x 4 g μν Rμν − 2 δ − det g (δSG )3 Ω 1 = d x 4 − det g − R gμν + gμν δg μν . 2 Ω
Zusammengefasst folgt 1 4 dx − det g Rμν − R gμν + gμν δg μν . δSG = 2 Ω
Aus δSG =
Ω
dx
4
− det g Rμν
1 ! − R gμν + gμν δg μν = 0 2
folgen mit dem Fundamentallemma für Variationen (siehe [12]) die Einstein-Gleichungen im Vakuum: 1 Rμν − R gμν + gμν = 0 2
372
13 Physikalische Gesetze in der Raumzeit, Einstein-Gleichungen
Allgemeiner Energie-Impuls-Tensor In Abschn. 5.5 haben wir in (5.53) den kanonischen Energie-Impuls-Tensor im MinkowskiRaum definiert, den wir mit dem Kovarianzprinzip (siehe Abschn. 13.1) durch T μν =
∂L ∂ ν φ − g μν L ∂ ∂μ φ
(13.50)
verallgemeinern können. In Bemerkung 5.1 haben wir gesehen, dass es bei dieser Definition eine Eichfreiheit gibt, die dazu genutzt werden kann, den Energie-Impuls-Tensor symmetrisch zu machen. Wir wollen hier einen anderen Weg gehen, der schon durch die Konstruktion die Symmetrie von T μν sicherstellt. Im letzten Abschnitt haben wir die Einstein-Gleichungen im Vakuum abgeleitet, weil wir nur den gravitativen Teil der Wirkung betrachtet haben. Wenn wir die vollen EinsteinGleichungen erhalten wollen, müssen wir die Materie und mögliche zusätzliche Felder mit in ein Wirkungsfunktional S M = d x 4 − det g L M mit einem geeigneten Lorentz-Skalar L M aufnehmen. Dabei soll L M alle nichtgravitativen Wirkungen enthalten, wie z. B. B • S M = −m A ds für ein Teilchen mit Masse m, vergleiche (11.71), oder 1 4√ d x − det g Fμν F μν für das elektromagnetische Feld ohne äußere Quel• SM = − 4 len, siehe (6.1). Wir variieren S M bezüglich g μν und erhalten wieder mit partieller Integration und dem Satz von Gauß √ √ − det g L M ∂ − det g L M ∂ g μν 4 ∂ μν μν δg + δS M = d x δ ∂g ∂ g μν ∂xρ ∂ ρ ∂x ⎧ ⎛ ⎞⎫ ⎪ ⎪ √ √ ⎪ ⎪ ⎨ − det g L M ∂ − det g L M ⎟⎬ μν ∂ ⎜ 4 ∂ ⎜ ⎟ μν ⎠ δg . − ρ⎝ = dx ⎪ ⎪ ∂g ∂ g μν ∂x ⎪ ⎪ ⎩ ⎭ ∂ ∂xρ Nun definieren wir den allgemeinen Energie-Impuls-Tensor durch ⎧ ⎞⎫ ⎛ ⎪ ⎪ √ √ ⎪ ⎪ ⎨ ∂ − det g L ∂ − det g L M ⎟⎬ 2 ∂ ⎜ M ⎟ ⎜ μν ⎠ Tμν := √ − ρ⎝ ⎪ ∂g ∂ g μν ∂x − det g ⎪ ⎪ ⎪ ⎩ ⎭ ∂ ∂xρ
(13.51)
13.6
Ableitung der Einstein-Gleichungen mit dem Lagrange-Formalismus
373
und stellen fest, dass er „automatisch“symmetrisch ist. Für die Variation ergibt sich damit 1 d x 4 − det g Tμν δg μν . δS M = 2 Beispiel 13.2
Wir vergleichen die beiden Energie-Impuls-Tensoren für den Fall des skalaren KleinGordon-Feldes φ aus Beispiel 5.3 mit der Lagrange-Dichte 1 1 L φ, ∂μ φ = g μν ∂μ φ (∂ν φ) − m 2 φ 2 . 2 2 Den kanonischen Energie-Impuls-Tensor haben wir in (5.55) berechnet: T μν =
1 μ ν 2 ∂ φ ∂ φ − g μν ∂ ρ φ ∂ρ φ + g μν m 2 φ 2 2
(13.52)
Dieses Ergebnis vergleichen wir mit (13.51). Da weder die Determinante der Metrik noch die Lagrange-Dichte von den Ableitungen der Metrik abhängt, entfällt der zweite Term in (13.51), und es ergibt sich mit (13.42) √ ∂ − det g ∂L 2 2 ∂ Tμν = √ − det g L = 2 μν + √ L ∂g ∂ g μν − det g ∂ g μν − det g 1 ∂L ∂L 2 = 2 μν + √ L − − det g gμν = 2 μν − gμν L ∂g 2 ∂g − det g ρ 1 2 ∂μ φ (∂ν φ) − gμν ∂ φ ∂ρ φ + gμν m 2 φ 2 , = 2 also eine Übereinstimmung mit (13.52).
Die allgemeine Wirkung S definieren wir jetzt als Summe aller gravitativen und nichtgravitativen Wirkungen durch 1 1 d x 4 − det g (R − 2 + L M ) , S := − (SG + S M ) = − 16π G 16π G wobei die Konstante −1/16π G dafür sorgt, dass wir die vollen Einstein-Gleichungen erhalten. Für die Variation folgt 1 1 1 ! 4 dx − det g Rμν − R gμν + gμν + Tμν δg μν = 0, δS = − 16π G Ω 2 2 woraus
1 R gμν + gμν = 8π G Tμν , 2 also die Einstein-Gleichungen folgen. Rμν −
Die Schwarzschild-Lösung
14
In diesem Kapitel wollen wir erste Lösungen der Einstein-Gleichungen finden. Dabei versuchen wir, zu gegebenem Energie-Impuls-Tensor, also zu vorgegebenen Quellen, die passende Metrik, d. h. die zehn unbekannten Funktionen gμν zu finden. Nun bestehen der Ricci-Tensor und auch der Krümmungsskalar R aus einer nichtlinearen Kombination der gμν und deren Ableitungen. Dabei meint nichtlinear, dass in der Definition der Tensoren auf der linken Seite der Einstein-Gleichungen z. B. auch Produkte der gμν und deren Ableitungen vorkommen können. Zum Beispiel enthält der Ricci-Tensor nach (12.13): Rμν =
g ρσ ∂μ ∂ρ gνσ − ∂ρ ∂σ gμν − ∂μ ∂ν gρσ + ∂ν ∂σ gμρ 2
(14.1)
selbst im lokalen Inertialsystem Produkte von g ρσ und zweiten Ableitungen der Metrik. Für solche nichtlinearen (Differenzial-)Gleichungen gibt es keine geschlossene Lösungstheorie und auch kein Standardverfahren, mit dem man (spezielle) Lösungen der EinsteinGleichungen ableiten könnte. Um trotzdem zu Lösungen zu kommen, geht man in einer solchen Situation oftmals so vor, dass man versucht, für bestimmte Spezialfälle Lösungen zu finden (wie wir es oben für den Newton’schen Grenzfall schon getan haben) und aus diesen speziellen Lösungen Kenntnisse für allgemeinere zu gewinnen. Wir wollen im Folgenden unterstellen, dass die Gravitationsfelder statisch (zeitunabhängig) und isotrop (kugelsymmetrisch) sind, was z. B. für die Gravitationsfelder von Sonne und Erde annähernd gilt.
14.1
Äußere Schwarzschild-Metrik
Viele Anwendungen der Allgemeinen Relativitätstheorie beziehen sich auf physikalische Phänomene in unserem Sonnensystem. Für die Untersuchung dieser Effekte wollen wir von der langsamen (v c) Eigendrehung und der Abplattung an den Nord- und Südpolen der Sonne und der Planeten absehen, gehen also davon aus, dass eine statische, kugelsymmetri© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_14
375
376
14 Die Schwarzschild-Lösung
sche (sphärische, isotrope) und räumlich begrenzte Massenverteilung M vorliegt. Wir wollen in diesem Kapitel zunächst physikalische Phänomene außerhalb dieser Massenverteilung untersuchen, die gravitativen Effekte im Innern des Sterns bleiben erst einmal außen vor. Aufgrund der räumlich begrenzten Massenverteilung erwarten wir, dass wir mit wachsender Entfernung r von diesem Zentralkörper ein immer schwächer werdendes Gravitationsfeld antreffen, sodass asymptotisch, d. h. für r → ∞, die Minkowski-Raumzeit unterstellt werden kann, was man auch asymptotische Flachheit nennt. Wir suchen also statische kugelsymmetrische Lösungen (d. h. Metriken) für die EinsteinGleichungen im Vakuum (13.25): Rμν = 0, mit denen wir gravitative Phänomene in unserem Sonnensystem untersuchen wollen. Um solche Metriken zu finden, gibt es grundsätzlich zwei verschiedene Vorgehensweisen: 1. Der kovariante Ansatz besteht darin, die Symmetrien einer statischen, kugelsymmetrischen Mannigfaltigkeit genauer zu spezifizieren und dann daraus die allgemeine Form einer statischen, kugelsymmetrischen Metrik abzuleiten. Dazu wird im Allgemeinen die Existenz von vier Killing-Vektoren unterstellt, von denen einer zeitartig ist und eine spezielle Orthogonalitätsbedingung erfüllt, während die restlichen drei raumartig sind und eine Untergruppe bilden, die isomorph zu der Gruppe S O (3) ist. Details findet man z. B. in [20] oder etwas ausführlicher in [24]. Wir werden in Abschn. 14.6 einige weitere Ausführungen dazu machen. 2. Ein koordinatenbasierter Ansatz, der etwas anschaulicher ist, besteht darin, ein spezielles Koordinatensystem, das die unterstellten raumzeitlichen Symmetrien erfüllt, auszusuchen und damit eine Lösung der Vakuumgleichungen zu berechnen. Auf den ersten Blick sieht die erste Vorgehensweise konzeptionell ausgereifter aus, wir wollen hier allerdings nach der zweiten verfahren, da diese rechnerisch einfacher ist und trotzdem im Ergebnis genau die gleiche allgemeine Lösung für die unterstellten Symmetrien der Raumzeit liefert. Wenn wir die gesuchte Metrik gefunden haben, werden wir nachweisen, dass diese vier linear unabhängige Killing-Vektoren hat, die die Anforderungen aus (1.) erfüllen. Die zweite Vorgehensweise ist auch deswegen erlaubt, weil die Einstein’sche Theorie invariant unter Koordinatentransformationen ist. Man kann immer problemadäquate Koordinatensysteme aussuchen, die die Rechnungen so einfach wie möglich machen. Koordinatensysteme für statische sphärische Raumzeiten Beispiel 14.1
Wir schauen uns zunächst nochmals das Linienelement im Minkowski-Raum in Kugelkoordinaten (1.34) an: ds 2 = −dt 2 + dr 2 + r 2 dϑ 2 + r 2 sin2 ϑ dϕ 2
14.1
Äußere Schwarzschild-Metrik
377
Man sieht, dass die Fläche mit konstanten r und t einer Zweisphäre mit Radius r , d. h. einer zweidimensionalen Kugeloberfläche, entspricht. Das Linienelement einer solchen Sphäre ergibt sich mit dt = dr = 0 zu dl 2 = r 2 dϑ 2 + sin2 ϑ dϕ 2 =: r 2 d2 ,
(14.2)
wodurch das Flächenelement d definiert wird, vgl. auch (11.62). Der Umfang der Zweisphäre beträgt 2πr und die Fläche 4πr 2 , d. h. 2π -mal der Wurzel aus dem Koeffizienten r 2 vor d2 bzw. 4π -mal dem Koeffizienten vor d2 . Umgekehrt beschreibt das Linienelement (14.2) mit einem von ϑ und ϕ unabhängigen r 2 die innere Geometrie einer Zweisphäre. Wir wollen nun herausarbeiten, wie sich die oben angenommenen Zeit- und Raumsymmetrien auf die Komponenten der Metrik ds 2 = gμν d x μ d x ν auswirken, wobei wir die Koordinaten der Mannigfaltigkeit ebenfalls mit t, r , ϑ, ϕ (Schwarzschild-Koordinaten) bezeichnen. Es wird aber schnell klar werden, dass es nicht die Kugelkoordinaten eines Minkowski-Raumes sind. Die verlangte statische Symmetrie berücksichtigen wir, indem wir zum einen die gμν als zeitunabhängig wählen, d. h., die gμν hängen nicht von der Koordinate t ab. Zum anderen soll die Geometrie unabhängig von der Zeitumkehr t → −t sein, was bedeutet, dass die gemischten Terme dt dr , dt dϑ, dt dϕ in ds 2 , die (ein) dt enthalten, wegfallen: gtr = gtϑ = gtϕ = 0 Die Kugelsymmetrie erfüllen wir dadurch, dass wir unterstellen, dass jeder Punkt der Mannigfaltigkeit auf einer Zweifläche mit dem Linienelement C (r ) r 2 dϑ 2 + sin2 ϑ dϕ 2 = C (r ) r 2 d2 liegt. Die angenommene Kugelsymmetrie besagt einerseits, dass die Komponenten der Metrik nur von der Radialkomponente r und nicht von einer speziellen Richtung ϑ, ϕ abhängen. Andererseits soll keine Raumrichtung ausgezeichnet sein, d. h., wir müssen dϑ → −dϑ, dϕ → −dϕ ändern können, ohne dass sich die Form der Metrik ändert. Somit entfallen alle gemischten Terme, die dϑ oder dϕ beinhalten: gr ϑ = gr ϕ = gϑϕ = 0 Wir erhalten dann als einen Ansatz für das Linienelement der gesuchten Metrik den Ausdruck ds 2 = −A (r ) dt 2 + B (r ) dr 2 + C (r ) r 2 dΩ 2
(14.3)
378
14 Die Schwarzschild-Lösung
mit den drei Funktionen A (r ) , B (r ) , C (r ) ≥ 0. Durch die Ausnutzung der vorgegebenen Symmetrien haben wir unser Problem, die zehn unbekannten Komponenten der gesuchten Metrik zu finden, schon erheblich reduziert. Wir können aber noch mehr erreichen, indem wir eine neue radiale Koordinate einführen. Dazu setzen wir √ r¯ 2 = C (r ) r 2 ⇒ r¯ = C r und erhalten mit der Produktregel √ r dc d r¯ = C 1+ , dr 2C dr woraus 1
r dc dr = 1+ C 2C dr 2
−2
d r¯ 2
folgt. Damit definieren wir die Größen B¯ und A¯ durch B dr 2 = und
B C
1+
r dc 2C dr
−2
d r¯ 2 = B¯ d r¯ 2
¯ r ). A(r ) = A(¯
Der Effekt dieser Redefinition besteht darin, dass die Funktion C durch 1 ersetzt werden kann. Wir schreiben der Einfachheit halber wieder r statt r¯ und erhalten schließlich für die Metrik ds 2 = −A (r ) dt 2 + B (r ) dr 2 + r 2 d2 . Dies ist ein allgemeiner Ansatz für eine statische sphärische Metrik, der Standardform genannt wird. Bemerkung 14.1 1. Bei konstantem t und r , d. h. dt = dr = 0 ist ds 2 = r 2 d2 und generiert die Geometrie einer Zweisphäre. 2. Da im Allgemeinen B (r ) = 1 ist, können wir die Koordinate r nicht wie im R3 als radiale Distanz zwischen einem Nullpunkt und den Punkten auf der Sphäre interpretieren. Zumal eine statische sphärische Mannigfaltigkeit gar keinen Nullpunkt haben muss, wie Abb. 14.1 zeigt. Die Koordinate r hat allerdings die geometrische Bedeutung, dass die Fläche der Zweisphäre 4πr 2 beträgt (siehe Abschn. 14.3 weiter unten).
14.1
Äußere Schwarzschild-Metrik
379
Abb. 14.1 Sphärische symmetrische Mannigfaltigkeit
Lösung der Einstein-Gleichungen für eine statisch kugelsymmetrische Metrik Wir wollen die im letzten Abschnitt eingeführten Funktionen A (r ) und B (r ) konkret berechnen, indem wir die Standardmetrik in die Einstein-Gleichungen fürs Vakuum einsetzen. Vergleichen wir die Standardform mit der Minkowski-Metrik in Kugelkoordinaten und unterstellen, dass in großer Entfernung vom Zentralkörper der Raum flach wird, so muss für die beiden Komponenten der Metrik A (r ) , B (r ) → 1 (r → ∞) gelten. Damit dies gewährleistet wird und die folgenden Rechnungen einfacher werden, setzen wir A (r ) = e2a(r ) , B (r ) = e2b(r ) (14.4) mit zwei unbekannten Funktionen a(r ) und b(r ), die a(r ), b(r ) → 0 (r → ∞)
(14.5)
erfüllen. Die Standardform der Metrik ergibt sich nun zu ds 2 = −e2a(r ) dt 2 + e2b(r ) dr 2 + r 2 dϑ 2 + r 2 sin2 ϑ dϕ 2 .
(14.6)
Die linke Seite der Vakuumfeldgleichungen (13.25) besteht aus dem Ricci-Tensor. Um diesen zu berechnen, gibt es grundsätzlich zwei verschiedene Methoden (siehe Beispiel 12.6): 1. Tensormethode: Man berechnet mit (11.47) die Christoffel-Symbole, daraus und aus deren Ableitungen den Riemann’schen Tensor und dann durch Kontraktion den RicciTensor. Diese Rechnung ist gradlinig, aber langwierig, und man braucht schon viele Seiten, um alle benötigten Terme auszurechnen und aufzuschreiben. Diese Vorgehensweise wird beispielsweise in [6] ausführlich und mit fast allen Detailrechnungen dargestellt.
380
14 Die Schwarzschild-Lösung
2. Differenzialformenmethode: Ein anderer, etwas anspruchsvollerer, aber kürzerer Weg besteht darin, die Krümmungsformen auszurechnen und damit die Komponenten des Ricci-Tensors zu bestimmen. Diesen Weg wollen wir hier beschreiten. Wie in Abschn. 12.5 bezeichnen wir die nichtholonomen Basisvektoren mit eα , die dazu dualen Einsformen allerdings mit e˜ α , α = t, r , ϑ, ϕ, um Verwechslungen mit den Exponentialfunktionen ea(r ) und eb(r ) zu vermeiden. Aus der Standardform der Metrik (14.6) lesen wir die Basiseinsformen: e˜ t = ea(r ) dt, e˜ r = eb(r ) dr , e˜ ϑ = r dϑ, e˜ ϕ = r sin ϑ dϕ ab. Die Metrik (14.6) lässt sich mit (12.25) dann in der Form g = ds 2 = ηαβ e˜ α ⊗ e˜ β
(14.7)
schreiben, wobei ηαβ wieder die Minkowski-Metrik in kartesischen Koordinaten bezeichne. Cartan’sche Ableitungen Als Erstes berechnen wir die Cartan’schen Ableitungen (siehe Definition 10.5) der Basida (r ) seinsformen, und es ergibt sich mit der Schreibweise a (r ) := dr d e˜ t = a (r ) ea(r ) dr ∧ dt = a (r ) e−b(r ) e˜ r ∧ e˜ t = −a (r ) e−b(r ) e˜ t ∧ e˜ r d e˜ r = b (r ) eb(r ) dr ∧ dr = 0 1 1 d e˜ ϑ = dr ∧ dϑ = e−b(r ) e˜ r ∧ e˜ ϑ = − e−b(r ) e˜ ϑ ∧ e˜ r r r d e˜ ϕ = sin ϑ dr ∧ dϕ + r cos ϑ dϑ ∧ dϕ 1 1 = e−b(r ) e˜ r ∧ e˜ ϕ + cot ϑ e˜ ϑ ∧ e˜ ϕ . r r
(14.8)
Zusammenhangsformen Um die Zusammenhangsformen zu ermitteln, benutzen wir die erste Cartan’sche Strukturgleichung (12.46): d e˜ α = −ωαβ ∧ e˜ β und erhalten mit den Symmetrieeigenschaften (12.42) der Zusammenhangsformen: • α=t : ωt r = a (r ) e−b(r ) e˜ t = ωr t ϕ
ωt ϑ = ωϑt = ωt ϕ = ω t = 0 • α = r : Wegen d e˜r = 0 bestimmen wir die Zusammenhangsformen, die r als einen Index haben, durch die drei anderen Formen.
14.1
Äußere Schwarzschild-Metrik
• α=ϑ : ωϑr
381
1 −b(r ) ϑ 1 e˜ = e−b(r ) e˜ ϑ = −ωr ϑ =− − e r r
• α=ϕ: 1 −b(r ) ϕ e e˜ = −ωr ϕ r 1 = cot ϑ e˜ ϕ = −ωϑϕ r
ωϕr = ω
ϕ ϑ
Krümmungsformen Mit der zweiten Cartan’schen Strukturgleichung (12.47): R αβ = dωαβ + ωαγ ∧ ω
γ β
lassen sich die Krümmungsformen ausrechnen: •
γ R t r = dωt r + ωt γ ∧ ω r = d a e−b e˜ t = d a ea−b dt =0
2 = a e dr ∧ dt + a ea−b dr ∧ dt − a b ea−b dr ∧ dt
2 = a
+ a − a b ea−b e−b e˜ r ∧ e−a e˜ t
2 = −e−2b a
+ a − a b e˜ t ∧ e˜ r
a−b
Aufgabe 14.1 Zeigen Sie, dass die anderen Krümmungsformen folgende Werte annehmen:
1 R t ϑ = − a e−2b e˜ t ∧ e˜ ϑ r 1 R t ϕ = − a e−2b e˜ t ∧ e˜ ϕ r 1 R r ϑ = b e−2b e˜ r ∧ e˜ ϑ r 1 r R ϕ = b e−2b e˜ r ∧ e˜ ϕ r 1
ϑ R ϕ = 2 1 − e−2b e˜ ϑ ∧ e˜ ϕ r Lösung Es gilt
(14.9)
382
14 Die Schwarzschild-Lösung
• R t ϑ = dωt ϑ +ωt γ ∧ ω
γ ϑ
= ω t r ∧ ωr ϑ
=0
−b
=ae
1 1 e˜ t ∧ − e−b e˜ ϑ = − a e−2b e˜ t ∧ e˜ ϑ , r r
• R t ϕ = dωt ϕ +ωt γ ∧ ωγϕ = ωt r ∧ ωr ϕ =0
1 1 = a e−b e˜ t ∧ − e−b e˜ ϕ = − a e−2b e˜ t ∧ e˜ ϕ , r r • R
r
ϑ
= dω
r
ϑ
+ω
r
γ γ ∧ω ϑ
1 = d − e−b e˜ ϑ r
ϕ
+ ωr ϕ ∧ ω ϑ =0
1 1 e˜ ϑ = d − e−b r dϑ = b e−b dr ∧ dϑ = b e−b e−b e˜ r ∧ r r 1 = b e−2b e˜ r ∧ e˜ ϑ , r • R
r
ϕ
= dω
r
ϕ
+ω
r
γ γ ∧ω ϕ
1 −b ϕ + ωr ϑ ∧ ωϑϕ = d − e e˜ r
=0
1 = b e−2b e˜ r ∧ e˜ ϕ , r •
1 R ϑϕ = dωϑϕ + ωϑγ ∧ ωγϕ = d − cot ϑ e˜ ϕ + ωϑr ∧ ωr ϕ r 1 1 1 = d − cot ϑ r sin ϑ dϕ + e−b e˜ ϑ ∧ − e−b e˜ ϕ . r r r 1 −2b ϑ e˜ ∧ e˜ ϕ = d (− cos ϑ dϕ) − 2 e r 1 1 1 ϑ ∧ e˜ e˜ ϕ − 2 e−2b e˜ ϑ ∧ e˜ ϕ = sin ϑ r r sin ϑ r 1
= 2 1 − e−2b e˜ ϑ ∧ e˜ ϕ . r
14.1
Äußere Schwarzschild-Metrik
383
Ricci-Tensor Die Komponenten des Ricci-Tensors kann man mit (12.45): Rβγ = R αβ eα , eγ direkt aus den Krümmungszweiformen berechnen: • ϕ Rtt = R r t (er , et ) + R ϑt (eϑ , et ) + R t eϕ , et
2 1 = −e−2b a
+ a − a b e˜ t ∧ e˜ r (er , et ) − a e−2b e˜ t ∧ e˜ ϑ (eϑ , et ) r 1 −2b t ϕ − ae e˜ ∧ e˜ eϕ , et r
1 2 1 = e−2b a
+ a − a b + a e−2b + a e−2b r r
2a 2 = e−2b a
+ a − a b + r • Genauso, aber etwas kürzer die anderen Komponenten: Rrr = R t r (et , er ) + R ϑr (eϑ , er ) + R ϕr eϕ , er 2 2b
= e−2b −a
− a + a b + r ϕ t r Rϑϑ = R ϑ (et , eϑ ) + R ϑ (er , eϑ ) + R ϑ eϕ , eϑ 1 1 1 1 = e−2b − a + b − 2 + 2 r r r r Rϕϕ = R t ϕ et , eϕ + R r ϕ er , eϕ + R ϑϕ eϑ , eϕ 1 1
1 1 −2b − a + b − 2 + 2 = Rϑϑ =e r r r r Krümmungsskalar und Einstein-Tensor Wir berechnen noch den Krümmungsskalar und den Einstein-Tensor. Es gilt
R = −Rtt + Rrr + Rϑϑ + Rϕϕ
2 a − b
e2b − 1 −2b
−2 a + a − a b − 4 +2 =e r r2
(14.10)
(14.11)
384
14 Die Schwarzschild-Lösung
sowie R
ηtt G tt = Rtt − 2
2 2 a − b
2a
e2b − 1 = e−2b a
+ a − a b + + − a
+ a − a b − 2 + r r r2
2b 1 1 . − = 2 − e−2b r r2 r
Aufgabe 14.2 Zeigen Sie, dass sich die übrigen von null verschiedenen Komponenten des EinsteinTensors zu 1 1 2a
G rr = − 2 + e−2b 2 + r r r a − b
2 = G ϕϕ (14.12) G ϑϑ = e−2b a
+ a − a b + r
berechnen. Lösung Es gilt R
G rr = Rrr − ηrr 2
2 2 a − b
e2b − 1 2b
− − a
+ a − a b − 2 + = e−2b −a
− a + a b + 2 r r r
2a 1 1 + = − 2 + e−2b r r2 r R
ηϑϑ
2 a − b
e2b − 1 1 1 1 1 + = 2 + e−2b − a + b − 2 − − a
+ a − a b − 2 r r r r r r2
2 a −b = G ϕϕ . = e−2b a
+ a − a b + r
G ϑϑ = Rϑϑ −
2
Schwarzschild-Lösung Alle Komponenten des Ricci-Tensors müssen (einzeln) verschwinden, d. h., es gilt insbesondere 2 a + b
0 = Rtt + Rrr = e−2b ⇒ a + b = 0 ⇒ a + b = 0, (14.13) r
14.1
Äußere Schwarzschild-Metrik
385
da wegen der asymptotischen Flachheit der Metrik (14.5) keine Integrationskonstante eingefügt werden darf. Wir setzen dieses Ergebnis in Rϕϕ ein und erhalten
1 1 2b 0 = e−2b − 2 + 2 ⇔ 1 − 2b r e−2b = 1 r r r d −2b =1 re ⇒ dr ⇒ r e−2b = r − 2m mit der (noch beliebigen) Integrationskonstanten −2m. Insgesamt erhalten wir e−2b(r ) = e2a(r ) = 1 −
2m . r
(14.14)
Wir erhalten also mit unserem Ansatz (14.4) 2m gtt = − 1 − r 2m −1 grr = 1 − . r Nun wissen wir, dass nach Gl. (13.12) mit dem Newton’schen Gravitationspotenzial φ=−
GM r
im Newton’schen Grenzfall gtt = −(1 + 2φ) gilt, d. h., wir können die Integrationskonstante als m = G M bestimmen, wobei M die Gesamtmasse des betrachteten Zentralkörpers bezeichnet, und erhalten für die gesuchte Metrik 2G M 1 2 dr 2 + r 2 dϑ 2 + sin2 ϑ dϕ 2 . (14.15) dt 2 + g = ds = − 1 − 2G M r 1− r Dies ist die berühmte (äußere) Schwarzschild-Lösung, benannt nach dem deutschen Astronomen Karl Schwarzschild, der diese Metrik schon 1916 gefunden hat. Sie ist unter den angenommenen Symmetrien exakt und keine Annäherung. Wie verlangt, nähert sich die Schwarzschild-Lösung mit r → ∞ der Minkowski-Metrik. Wir schreiben die Schwarzschild-Metrik manchmal auch in der etwas vereinfachten Form 2m 2m −1 2 2 2 dt + 1 − dr + r 2 dΩ 2 , (14.16) ds = − 1 − r r
386
14 Die Schwarzschild-Lösung
wobei m als gravitativer Massenradius bezeichnet wird. Die Newton’sche Gravitationskonstante G hat in natürlichen Einheiten (c = 1) die Dimension dim G = M −1 L (M Masse, L Länge, siehe Tab. A.1), woraus dim m = M −1 LM = L folgt, womit auch die Bezeichnung von m gerechtfertigt ist. Die Schwarzschild-Metrik enthält nur eine einzige Integrationskonstante, nämlich die Masse M, d. h., die Metrik ist außerhalb des kugelsymmetrischen Körpers unabhängig von der Zusammensetzung dieses Körpers. Wenn wir in den nächsten Abschnitten Untersuchungen anstellen, die sich auf Phänomene außerhalb eines Sterns beziehen, so müssen wir also nichts über die inneren Eigenschaften des Sterns wissen.
14.2
Der Riemann-Tensor der (äußeren) Schwarzschild-Raumzeit
Für spätere Zwecke wollen wir den Riemann’schen Krümmungstensor der äußeren Schwarzschild-Metrik konkret ausrechnen. Dazu lesen wir die Komponenten des RiemannTensors mit (12.38) und den Krümmungsformen des letzten Abschnitts ab. Mit (14.9) folgt 1 t 1 R e˜ t ∧ e˜ r + R trr t e˜ r ∧ e˜ t = R tr tr e˜ t ∧ e˜ r 2 r tr
2 2 = −e−2b a
+ a − a b e˜ t ∧ e˜ r .
Rt r =
(14.17)
Aufgabe 14.3 Leiten Sie aus (14.17) her, dass
Rtr tr = −
2G M r3
gilt. Lösung Mit (14.13) und (14.14) folgt
2 2 2G M
. a + 2 a
R tr tr = −e−2b a
+ a − a b = − 1 − r Nun ist e
2a
1 2G M 2G M ⇒ a = ln 1 − , =1− r 2 r
(14.18)
14.2
Der Riemann-Tensor der (äußeren) Schwarzschild-Raumzeit
387
und wir erhalten 2 2G M −2 G 2 M 2 2 a = 2 1− r r4 −2 2 2 2G M 2G M −1 2G M G M a
= −2 1 − − 1 − . r r4 r r3 Einsetzen in (14.18) führt zu R tr tr =
2G M 2G M ⇒ Rtr tr = − 3 . r3 r
Eine völlig analoge Rechnung führt zu GM r3 GM =− 3 r
Rtϑtϑ = Rtϕtϕ = Rr ϑr ϑ = Rr ϕr ϕ Rϑϕϑϕ =
2G M . r3
(14.19)
Alle anderen Komponenten verschwinden, bis auf diejenigen, die aus den obigen durch die Symmetrien des Riemann-Tensors hervorgehen. Wir rechnen noch das Quadrat des Riemann-Tensors aus: Rμνρσ R μνρσ = 4 Rtr tr R tr tr + Rtϑtϑ R tϑtϑ + Rtϕtϕ R tϕtϕ + Rrϑrϑ R rϑrϑ + Rrϕrϕ R rϕrϕ + Rϑϕϑϕ R ϑϕϑϕ =
48 G 2 M 2 , r6
(14.20)
wobei der Faktor 4 aus den Symmetrien des Riemann-Tensors resultiert und die kontravarianten Komponenten identisch mit den kovarianten sind, da wir uns in nichtholonomen Koordinaten gμν = ημν bewegen. Die Größe 48G 2 M 2 /r 6 ist durch die Konstruktion ein Skalar, also koordinatenunabhängig und wird Kretschmann-Skalar genannt. Sie wird uns bei der Untersuchung von Metriksingularitäten später wieder begegnen. Bemerkung 14.2 Wer eine Lizenz des mathematisch-naturwissenschaftlichen Programmpaketes Mathematica besitzt, kann sich die (mühsame) manuelle Berechnung des Skalars R μνρσ Rμνρσ ersparen, indem er z. B. das Mathematica-Paket „General Relativity, Einstein & All That (GREAT)“ einsetzt. Dieses bietet für eine beliebige eingebbare Metrik vorgefertigte Funktionen für die Christoffel-Symbole, den Riemann-, Ricci- und Einstein-Tensor,
388
14 Die Schwarzschild-Lösung
den Krümmungsskalar und die Quadrate R μν Rμν sowie R μνρσ Rμνρσ . Das GREAT-Paket kann man sich im Wolfram-Archiv unter http://library.wolfram.com/infocenter/MathSource/ 4781/ herunterladen.
14.3
Physikalische Interpretation der (äußeren) Schwarzschild-Lösung
Die Schwarzschild-Metrik kennzeichnet Ereignisse in der Raumzeit durch die Koordinaten t, r , ϑ, ϕ, die so aussehen wie die sphärischen Koordinaten für die flache Raumzeit (1.34). Um herauszufinden, welche physikalische Bedeutung diese Koordinaten haben, müssen wir die Metrik untersuchen, denn nur sie gibt Aufschluss darüber, wie Abstände bzw. Zeitintervalle physikalisch gemessen werden können.Wir fangen mit den einfachsten an. Die Kugelkoordinaten Die Polarkoordinaten ϑ und ϕ haben ihre normale Bedeutung wie im R3 und auch ihren normalen Definitionsbereich. Die Zeitkoordinate Wir betrachten eine Uhr in Ruhe an einer festen Position r , d. h. dr = dϑ = dϕ = 0, und berechnen die Eigenzeit eines Beobachters an dieser Position. In Gl. (11.70) hatten wir die Eigenzeit zwischen zwei Ereignissen hergeleitet und den Ausdruck λ2 dxμ dxν τ= dλ −gμν dλ dλ λ1 erhalten. Setzen wir für gμν die Schwarzschild-Metrik ein, so ergibt sich mit den obigen Annahmen t2 2m 2m = 1− t < t. dt 1 − τ = r r t1 Die Eigenzeit τ der Uhr stimmt für einen solchen Beobachter bis auf einen konstanten Faktor mit der Koordinatenzeit t überein, d. h., wir können Ereignisse in der Raumzeit durchaus mit der Koordinatenzeit eines stationären Beobachters statt mit dessen Eigenzeit ausstatten. Der Definitionsbereich von t ist uneingeschränkt: t ∈ R. Die letzte Gleichung besagt auch, dass eine in Ruhe befindliche Uhr weniger Zeit als die Koordinatenzeit misst und dass dieser Unterschied umso größer ist, je kleiner r wird. Wir hatten in Abschn. 7.3 ja schon gesehen, dass Uhren in einem Gravitationsfeld langsamer
14.3
Physikalische Interpretation der (äußeren) Schwarzschild-Lösung
389
gehen. Wir sehen auch, dass an der Stelle r = 2m = 2G M etwas Interessantes passiert. Das schauen wir uns etwas genauer an. Die radiale Koordinate 1. Die Metrik ist nur im Vakuum gültig. Hat ein Stern einen Radius r0 , dann gilt die Metrik nur für r > r0 . Der Definitionsbereich für r ist also (zunächst) das Intervall (r0 , ∞). 2. An (14.16) lesen wir ab, dass die rr -Komponente der Schwarzschild-Metrik gegen unendlich geht, wenn wir uns dem sogenannten Schwarzschild-Radius rs := 2G M = 2m
(14.21)
nähern. Deswegen schränken wir den Definitionsbereich von r weiter auf rs < r < ∞ ein. Für die meisten praktischen Anwendungen bedeutet das allerdings keine Verkleinerung des Definitionsbereiches von r , da der Radius eines physikalischen Objektes fast immer (sehr viel) größer als der Schwarzschild-Radius ist. Zum Beispiel gilt für ein Proton, die Erde und die Sonne: M Pr oton ≈ 10−24 g
⇒
rs ≈ 2,5 · 10−52 cm r0 ≈ 10−13 cm
M Er de ≈ 6 · 1027 g
⇒
rs ≈ 0,9 cm r0 ≈ 6000 km
M Sonne ≈ 2 · 10 g
⇒
rs ≈ 3 km r0 ≈ 7 · 105 km,
33
(14.22)
siehe auch Tab. A.4. Es gibt jedoch kompaktere Objekte im Universum, deren Radius sich dem Schwarzschild-Radius annähert. Zum Beispiel können sogenannte Neutronensterne einen Radius von rs ≈ 0,3 r0 haben, und es ist eine interessante Frage (die wir später detailliert behandeln), was mit einem Objekt passiert, dessen Größe kleiner als der Schwarzschild-Radius ist. 3. Wir haben weiter oben schon erwähnt, dass die radiale Koordinate r als „Flächenradius“ interpretiert werden kann. Auch wenn r nicht den radialen Abstand misst, beträgt bei konstantem r die Fläche 4πr 2 . Um diese Abweichung von der euklidischen Geometrie auch quantitativ einschätzen zu können, schauen wir uns für dt = dϑ = dϕ = 0 die Eigenlänge des radialen Abstandes d R etwas genauer an. Es gilt 1 2m − /2 dR = 1 − dr > dr . r Der radiale Abstand zwischen konzentrischen Kugeln mit Fläche 4πr 2 und Fläche 4π (r + dr )2 ist d R > dr und damit größer als im flachen Raum, siehe Abb. 14.2. In der Projektion werden die konzentrischen Kugeln als Kreise mit den Radien r und r + dr dargestellt, die Krümmung wird durch die gestrichelten Linien visualisiert. Der Abstand zwischen d R und dr wird größer, je tiefer man in den „Rachen“ gelangt, d. h., je mehr man sich dem Schwarzschild-Radius nähert.
390
14 Die Schwarzschild-Lösung
Abb. 14.2 Konzentrische Kugeln in Schwarzschild-Raumzeit
Für r → ∞ gilt d R → dr , d. h., der dreidimensionale Raum ist asymptotisch flach. Wir betrachten einen Stab mit den Anfangs- und Endpunkten r E > r A , der radial im Gravitationsfeld liegt, und berechnen seine Länge L L=
rE
rA
1 2m − /2 dr 1 − . r
Um das Integral näherungsweise zu bestimmen, schätzen wir den Integranden mit der Taylor-Entwicklung in erster Ordnung ab und unterstellen, dass die Koordinate r sehr groß gegenüber 2m ist. Dann gilt 1 2m − /2 m 1 2m 1− =1+ ≈1+ r 2 r r sowie
m dr 1 + r rA = [r + m ln r ]rr EA rE > rE − r A. = r E − r A + m ln rA
L≈
rE
Wir sehen, dass die Korrekturen zur euklidischen Geometrie mit dem (halben) Schwarzschild-Radius einhergehen. Ist der Stab weit vom Schwarzschild-Radius 2m entfernt und damit das Verhältnis r E /r A ≈ 1, so sind die Korrekturen vernachlässigbar und man kann mit den normalen Koordinatendifferenzen arbeiten.
14.4
Isotrope Schwarzschild-Koordinaten
Wir wollen uns noch etwas tiefer mit der Raumzeit rund um den Schwarzschild-Radius r = 2m beschäftigen und bringen die Schwarzschild-Metrik durch eine Koordinatentransformation in die sogenannte isotrope Form. Diese soll für eine feste Koordinatenzeit
14.4
Isotrope Schwarzschild-Koordinaten
391
t = const. so nahe wie möglich an den dreidimensionalen Raum angepasst sein. Genauer versuchen wir, die Metrik in der Form ds 2 = A (r ) dt 2 + B (r ) dσ 2
(14.23)
zu schreiben, wobei dσ 2 das Linienelement des dreidimensionalen euklidischen Raums bezeichne, d. h. dσ 2 = d x 2 + dy 2 + dz 2 in kartesischen Koordinaten bzw. dσ 2 = dr 2 + r 2 dϑ 2 + r 2 sin ϑ dϕ 2 in Kugelkoordinaten. In dieser Form ist der räumliche Teil der Metrik (14.23) bei t = const. konform zur Metrik (d. h. ein Vielfaches der Metrik, siehe auch Definition 11.6) des euklidischen Raums, und somit sind insbesondere die Winkel zwischen Vektoren und die Längenverhältnisse die gleichen. Wir betrachten eine Koordinatentransformation, bei der die Koordinaten t, ϑ, ϕ unverändert bleiben und r durch eine andere radiale Variable ρ = ρ (r ) ersetzt werden soll, sodass die Metrik die Form 2m ds 2 = 1 − dt 2 + C (ρ)2 dρ 2 + ρ 2 dϑ 2 + sin ϑ dϕ 2 (14.24) r annimmt. Durch Vergleich mit der Schwarzschild-Metrik (14.16) finden wir, dass die Fak toren vor dem Term dϑ 2 + sin ϑ dϕ 2 in beiden Metriken übereinstimmen müssen, was zu r 2 = C 2ρ2 (14.25) führt.
Aufgabe 14.4 Zeigen Sie, dass durch Vergleich der radialen Elemente von (14.24) und (14.16) die Beziehung m 2 (m + 2ρ)2 r= =ρ 1+ . (14.26) 4ρ 2ρ
folgt. Lösung Wir setzen die radialen Elemente der beiden Metriken gleich und erhalten 2m −1 2 1− dr = C 2 dρ 2 . r
392
14 Die Schwarzschild-Lösung
Mit (14.25) und der letzten Gleichung können wir die Funktion C eliminieren, und es ergibt sich dr dρ =± . √ 2 ρ r − 2mr Wir fordern, dass mit r → ∞ auch ρ → ∞ gelten soll, dass also das positive Vorzeichen gewählt werden muss, und erhalten dr dρ , = √ ρ r 2 − 2mr also eine Differenzialgleichung mit getrennten Variablen. Integration auf beiden Seiten führt zu
√ √ 2 ln r − 2m + r = ln ρ + c, woraus ec ρ =
√ √ 2 r − 2m + r
folgt. Wir wählen die Integrationskonstante c = ln 4 und erhalten ρ= bzw. nach r aufgelöst: r=
1
r − m + r 2 − 2mr , 2 m 2 (m + 2ρ)2 =ρ 1+ 4ρ 2ρ
Mit (14.25) ergibt sich
m 4 C2 = 1 + 2ρ
und durch Einsetzen
m 2 1− 1 − 2m 2ρ = . r m 2 1+ 2ρ
Insgesamt erhalten wir die isotrope Schwarzschild-Metrik:
m 1− 2ρ
2
m 4 2 2 dt + 1 + dρ + ρ 2 dϑ 2 + ρ 2 sin2 ϑ dϕ 2 2 2ρ m 1+ 2ρ
ds 2 = −
14.5
Birkhoff’sches Theorem
1−
m 2ρ
393
2
m = − 2 dt + 1 + 2ρ m 1+ 2ρ
4
2
d x 2 + dy 2 + dz 2 ,
(14.27)
wobei die Koordinaten x, y, z, durch x = ρ sin ϑ cos ϕ y = ρ sin ϑ sin ϕ z = ρ cos ϑ
(14.28)
definiert sind. Aus (14.27) können wir die Beziehung zwischen der Eigenlänge und der Koordinatendistanz ablesen: m 2 x Eigen = 1 + x 2ρ Des Weiteren folgt mit (14.26):
m , 2 und die Komponenten der isotropen Schwarzschild-Metrik nehmen bei r = 2m endliche Werte an. Bei der Interpretation der isotropen Metrik muss beachtet werden, dass der Gültigkeitsbereich 2m < r < ∞ für die Schwarzschild-Metrik durch die isotrope radiale Koordinate ρ zweimal abgedeckt wird. Denn es gilt mit (14.26) r = 2m ⇔ ρ =
ρ → 0 ⇒ r → ∞ und ρ → ∞ ⇒ r → ∞. Die isotrope Metrik scheint daher zwei asymptotisch flache Bereiche zu beschreiben, die am Schwarzschild-Radius aufeinandertreffen. Und tatsächlich werden wir später bei der Untersuchung von Schwarzen Löchern sehen, dass diese zwei Regionen wieder ins Spiel kommen.
14.5
Birkhoff’sches Theorem
Wir betrachten nun ein etwas generelleres Problem und unterstellen, dass das Gravitationsfeld zwar kugelsymmetrisch, aber zeitabhängig ist und auch die Einstein-Gleichungen im Vakuum erfüllt. Ein Beispiel ist das äußere Feld eines radial pulsierenden Sterns, dessen Rotationen mit der Kugelsymmetrie verträglich sind. Die allgemeine Form einer solchen Raumzeitmetrik kann auf die Gestalt ds 2 = −A (r , t) dt 2 + B (r , t) dr 2 + C (r , t) r 2 dΩ 2
(14.29)
394
14 Die Schwarzschild-Lösung
gebracht werden, was man z. B. bei [26] oder [20] nachlesen kann. Im Unterschied zu unserem obigen Ansatz (14.3) sind die Funktionen A, B, C jetzt auch von der Zeitkoordinate t abhängig. Mit genau den gleichen Redefinitionen und Umformungen wie bei der Herleitung der Schwarzschild-Metrik können wir (14.29) auch als ds 2 = −e2a(r ,t) dt 2 + e2b(r ,t) dr 2 + r 2 dϑ 2 + r 2 sin2 ϑ dϕ 2
(14.30)
schreiben. Um die Funktionen a (r , t) und b (r , t) zu bestimmen, gehen wir genauso vor wie bei der Herleitung der statischen Lösung, lassen aber die ein oder andere Detailrechnung aus, da die Rechenschritte völlig analog durchzuführen sind. Die Basiseinsformen ergeben sich direkt aus (14.30): e˜ t = ea(r ,t) dt, e˜ r = eb(r ,t) dr , e˜ ϑ = r dϑ, e˜ ϕ = r sin ϑ dϕ, woraus die Cartan’schen Ableitungen mit der Schreibweise b˙ (r , t) :=
∂b (r , t) folgen: ∂t
d e˜ t = −a (r , t) e−b(r ,t) e˜ t ∧ e˜ r d e˜ r = b˙ (r , t) e−a(r ,t) e˜ t ∧ e˜ r 1 d e˜ ϑ = e−b(r ,t) e˜ r ∧ e˜ ϑ r 1 1 d e˜ ϕ = e−b(r ,t) e˜ r ∧ e˜ ϕ + cot ϑ e˜ ϑ ∧ e˜ ϕ r r Neu im Vergleich zur äußeren Schwarzschild-Metrik ist hier nur d e˜ r , das in (14.8) gleich null war. Die nichtverschwindenden Zusammenhangskomponenten sind: ωt r = a (r , t) e−b(r ,t) e˜ t + b˙ (r , t) e−a(r ,t) e˜ r = ωr t 1 ωϑr = e−b(r ,t) e˜ ϑ = −ωr ϑ r 1 ϕ ω r = e−b(r ,t) e˜ ϕ = −ωr ϕ r 1 ϕ ω ϑ = cot ϑ e˜ ϕ = −ωϑϕ, r auch hier gibt es nur bei ωt r einen Unterschied. Für die Krümmungsform R r t ergibt sich
2 R r t = −e−2b a
+ a − a b + e−2a b¨ + b˙ 2 − a˙ b˙ e˜ t ∧ e˜ r . (14.31)
Aufgabe 14.5 Rechnen Sie (14.31) detailliert aus.
14.5
Birkhoff’sches Theorem
395
Lösung Es gilt
γ ˙ −a e˜ r = d a ea−b dt + be ˙ b−a dr R r t = dωr t + ωr γ ∧ ω t = d a e−b e˜ t + be =0
¨ b−a + b˙ b˙ − a˙ eb−a dt ∧ dr = a
ea−b + a a − b ea−b dr ∧ dt + be
2
= ea−b a
+ a − a b e−b e˜ r ∧ e−a e˜ t + eb−a b¨ + b˙ 2 − a˙ b˙ e−a e˜ t ∧ e−b e˜ r
2 = −e−2b a
+ a − a b + e−2a b¨ + b˙ 2 − a˙ b˙ e˜ t ∧ e˜ r .
Die Krümmungsformen R r ϑ , R r ϕ und R ϑϕ sind die gleichen wie bei der SchwarzschildMetrik, die übrigen ergeben sich zu 1 1 −2b t e e˜ ∧ e˜ ϑ − b˙ e−(a+b) e˜ r ∧ e˜ ϑ r r 1
1 −2b t ϕ = −a e e˜ ∧ e˜ − b˙ e−(a+b) e˜ r ∧ e˜ ϕ . r r
R t ϑ = −a
Rt ϕ
Wir bezeichnen die Komponenten des Ricci-Tensors für die äußere Schwarzschild-Metrik (S) (B) mit Rαβ , die für die geänderte Metrik (14.30) mit Rαβ . Dann gilt (B)
Rtt
(S)
Rtt
(S) = Rtt − 2e−2a b¨ + b˙ 2 − a˙ b˙ mit 2 2a
= e−2b a
+ a − a b + r
sowie (B) (S) Rrr = Rrr + e−2a b¨ + b˙ 2 − a˙ b˙ mit 2 2b
(S) = −e−2b a
+ a − a b − Rrr r und (B)
(S)
(B) (S) Rϑϑ = Rϑϑ , Rϕϕ = Rϕϕ mit 1 1 1 1 (S) (S) = e−2b − a + b − 2 + 2 Rϑϑ = Rϕϕ r r r r
und zusätzlich (B)
Rtr =
2b˙ r
e−(a+b) .
396
14 Die Schwarzschild-Lösung (S)
Diese letzte Komponente ist neu, denn Rtr war gleich null. Für den Einstein-Tensor ergibt sich analog: 1 1 2b
(B) (S) (14.32) G tt = G tt = 2 − e−2b 2 − r r r 1 2a
1 (B) (S) G rr = G rr = − 2 + e−2b 2 + r r r (B) (S) (B) −2a ¨ 2 ˙ ˙ = G −e b + b − a˙ b = G G ϑϑ
(B)
ϑϑ
G tr =
2b˙ r
ϕˆ ϕˆ
e−(a+b)
(14.33)
Da alle Komponenten des Einstein-Tensors verschwinden müssen, folgt aus (14.33) (B)
G tr =
2b˙ r
e−(a+b) = 0 ⇒ b˙ = 0 ⇒ b (r , t) = b (r ) ,
die Funktion b hängt also nicht von der Zeit ab. Mit (14.32) ergibt sich
2b 1 1 2m − 2 + 2 ⇒ e−2b(r ) = 1 − . 0 = e−2b r r r r Ebenso folgt 0=
(B) G tt
+
(B) G rr
=e
−2b
2 a + b
⇒ a + b = 0 ⇒ a (r , t) = −b (r ) + f (t) r
mit einer (stetig differenzierbaren) Funktion f , die nur von der Zeit abhängt. Die allgemeine kugelsymmetrische Metrik (14.30) wird mit diesen Ergebnissen zu ds = −e 2
2 f (t)
2m 2m −1 2 2 1− dt + 1 − dr + r 2 dϑ 2 + r 2 sin2 ϑ dϕ 2 . r r
Wir führen durch t =
dt e f (t)
eine neue Zeitvariable ein und erhalten die übliche Form der Schwarzschild-Metrik. Wir haben damit den folgenden Satz bewiesen. Satz 14.1. Birkhoff’sches Theorem Eine kugelsymmetrische Lösung der EinsteinGleichungen im Vakuum ist für r > rs , d. h. außerhalb des Schwarzschild-Radius, immer statisch. Wir haben auch gezeigt, dass eine kugelsymmetrische Vakuumlösung durch Koordinatentransformationen immer auf die Form der Schwarzschild-Metrik gebracht werden kann.
14.6
Die Killing-Vektoren der Schwarzschild-Metrik
397
In diesem Sinn ist die Schwarzschild-Lösung die einzige kugelsymmetrische Lösung der Einstein-Gleichungen im Vakuum. Das Birkhoff’sche Theorem ist auch deshalb ein unerwartetes Resultat, weil in der Newton’schen Theorie Kugelsymmetrie nichts mit Zeitabhängigkeit zu tun hat. Insbesondere folgt aus Satz 14.1, dass, wenn ein kugelsymmetrischer Stern seine Größe ändert, dabei aber kugelsymmetrisch bleibt, keine Störungen in den umgebenen Raum ausgesendet werden. Ein pulsierender kugelsymmetrischer Stern kann damit keine Gravitationswellen emittieren, was wir später noch genauer untersuchen werden.
14.6
Die Killing-Vektoren der Schwarzschild-Metrik
Wenn wir auf die Schwarzschild-Metrik (14.16) 2m 2m −1 2 2 2 dt + 1 − dr + r 2 dϑ 2 + sin2 ϑ dϕ 2 ds = − 1 − r r schauen, so stellen wir sofort fest, dass die Komponenten der Metrik nicht von den Koordinaten t und ϕ abhängen. Das heißt nach Beispiel 12.7, dass X 0 = ∂t , X 3 = ∂ϕ
(14.34)
Killing-Vektoren sind. Um die restlichen zwei Killing-Vektoren zu finden, ist es hilfreich, auf die isotropen Koordinaten (14.28) x = ρ sin ϑ cos ϕ, y = ρ sin ϑ sin ϕ, z = ρ cos ϑ zu wechseln. In Beispiel 12.10 haben wir gezeigt, dass sich in diesem Koordinatensystem X 3 durch X 3 = ∂ϕ = −y∂ x + x∂ y ausdrücken lässt. Da die isotropen Koordinaten x, y, z in der isotropen SchwarzschildMetrik (14.27):
m 2 1− m 4 2 2ρ 2 2 d x + dy 2 + dz 2 ds = − 2 dt + 1 + 2ρ m 1+ 2ρ völlig gleichberechtigt genutzt werden, muss es demnach auch die Killing-Vektoren X 1 = −z∂ y + y∂z, X 2 = z∂ x − x∂z,
398
14 Die Schwarzschild-Lösung
siehe Beispiel 12.10, geben. In diesem Beispiel haben wir auch gezeigt, dass die KillingVektoren in Kugelkoordinaten die Form X 1 = sin ϕ ∂ϑ + cot ϑ cos ϕ ∂ϕ X 2 = cos ϕ ∂ϑ − cot ϑ sin ϕ ∂ϕ annehmen. In Schwarzschild-Koordinaten haben wir damit die folgenden vier KillingVektoren der Schwarzschild-Metrik gefunden: X 0 = (1, 0, 0, 0) (zeitartig) X 1 = (0, 0, sin ϕ, cot ϑ cos ϕ) (raumartig) X 2 = (0, 0, cos ϕ, − cot ϑ sin ϕ) (raumartig) X 3 = (0, 0, 0, 1) (raumartig)
(14.35)
Die Vektoren X 1 , X 2 und X 3 sind nach Beispiel 12.10 genau die Killing-Vektoren der Zweisphäre im euklidischen Raum bzw. die Killing-Vektoren im dreidimensionalen Raum, die die Rotationsinvarianz generieren. Kugelsymmetrie koordinatenfrei Wir haben bislang eine kugelsymmetrische Raumzeit durch Wahl eines Koordinatensystems und durch spezifische Eigenschaften einer Metrik charakterisiert, wir können eine solche Struktur aber auch koordinatenfrei definieren (siehe [21, 24]). Definition 14.1 Eine Raumzeit heißt kugelsymmetrisch genau dann, wenn sie drei linear unabhängige raumartige Killing-Vektorfelder R, S, T besitzt, deren Orbits (Menge der Punkte, die durch Transformationen mit den Killing-Vektoren generiert werden) Zweisphären sind und die die folgenden Gleichungen erfüllen: [R, S] = T , [S, T ] = R, [T , R] = S
(14.36)
Beispiel 14.2
Für die raumartigen Killing-Vektoren der Schwarzschild-Metrik setzen wir R = X 2 , S = X 1 , T = X 3 und berechnen mit (8.25) in isotropen Koordinaten beispielhaft den Kommutator
14.6
Die Killing-Vektoren der Schwarzschild-Metrik
⎛
399
⎞
⎛
⎞
⎟ ⎜ [R, S] = ⎝z ∂x (−z) −x∂z (−z)⎠ ∂ y − ⎝−z ∂ y (z) +y∂z (z)⎠ ∂x ⎛
=0
⎞
⎛
=0
⎞
⎟ ⎜ + ⎝z ∂x (y) −x ∂z (y)⎠ ∂z − ⎝−z ∂ y (−x) +y ∂z (−x)⎠ ∂z =0
=0
=0
=0
= x∂ y − y∂ x = X 3 = T . Genauso erhält man die anderen beiden Kommutatorgleichungen (14.36), und damit ist (nochmals) gezeigt, dass die Schwarzschild-Raumzeit kugelsymmetrisch ist. Wenn eine Raumzeit ein zeitartiges Killing-Vektorfeld besitzt, so nennt man sie stationär. In diesem Sinne ist die Schwarzschild-Raumzeit also stationär. Die Stationarität ist eine schwächere Eigenschaft als die Statik, so kann eine stationäre Metrik auch gemischte Komponenten dtd x i haben, d. h., die Symmetrie unter Zeitumkehr t → −t muss nicht gelten. Nun gibt es aber die Aussage, dass jede kugelsymmetrische, stationäre Metrik schon statisch ist; den Beweis findet man z. B. in [20]. Insofern reicht für die kugelsymmetrische Schwarzschild-Metrik ein zeitartiges Killing-Vektorfeld aus, um auch statisch zu sein (was wir aber auch aus dem Theorem von Birkhoff schon wissen).
Klassische Tests der Allgemeinen Relativitätstheorie
15
In diesem Kapitel untersuchen wir die zeitartigen und lichtartigen Geodäten in der Schwarzschild-Raumzeit und schauen uns die „klassischen“ Tests der Allgemeinen Relativitätstheorie an, d. h. die Periheldrehung des Merkurs, die Lichtablenkung an der Sonne und die gravitative Rotverschiebung. Zunächst werfen wir einen Blick auf das Kepler-Problem in der Newton’schen Gravitationstheorie, d. h. auf die Bewegung eines Testteilchens im Gravitationsfeld eines massiven Körpers.
15.1
Kepler-Bewegung in der Newton’schen Gravitationstheorie
Wir betrachten die Sonne und die Planeten als kugelsymmetrische Massen und wollen die Umlaufbahnen der Planeten um die Sonne berechnen, ohne die Einflüsse der übrigen Planeten zu berücksichtigen. Es wird sich herausstellen, dass wir unter diesen Annahmen eine exakte und vollständige Lösung der Bewegungsgleichungen bekommen, die sich über die Jahrhunderte als eine gute Approximation an die tatsächlichen Verhältnisse bewährt hat. Wir nehmen an, dass sich ein Testteilchen mit Masse m unter dem Einfluss der Newton’schen Gravitationskraft (7.1) F = m r¨ = −m
GM
· r = −m
GM
· rˆ (15.1) r2 bewegt. Um die folgenden Ausdrücke zu vereinfachen, setzen wir die Masse des Testteilchens auf m = 1, d. h., wir berechnen alle folgenden Größen jeweils pro Masseneinheit. Die Gravitationskraft ist eine Zentralkraft, d. h. eine Kraft, die auf den Ursprung zu oder von ihm weg gerichtet ist. Für Zentralkräfte ist der Drehimpuls r3
l := r × r˙
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_15
401
402
15 Klassische Tests der Allgemeinen Relativitätstheorie
zeitlich erhalten, denn es gilt d l ˙ ˙ = r × r + r × r¨ = 0, dt =0
=0
da r¨ nach (15.1) parallel zu r ist. Der Drehimpuls l (t) steht zu jedem Zeitpunkt senkrecht auf den Orts- und Geschwindigkeitsvektoren r(t) und r˙ (t), ändert aber seine Richtung im Zeitablauf nicht, d. h., die Bewegung verläuft in einer festen Ebene, die wir als (x, y)Ebene ansehen wollen. Wir benutzen für die Herleitung der möglichen Bahnen des Teilchens π zeitabhängige Kugelkoordinaten mit ϑ = und erhalten: 2 ⎞ ⎞ ⎛ ⎛ r (t) cos ϕ (t) r (t) sin π2 cos ϕ (t) r (t) = ⎝ r (t) sin π sin ϕ (t) ⎠ = ⎝ r (t) sin ϕ (t) ⎠ 2
cos π2
0
Für die Komponenten des Drehimpulses folgt dann lx = 0 ly = 0
⎞⎞ ⎞ ⎛ ⎛⎛ r˙ cos ϕ − r ϕ˙ sin ϕ r cos ϕ
l z = r × r˙ = ⎝⎝ r sin ϕ ⎠ × ⎝ r˙ sin ϕ + r ϕ˙ cos ϕ ⎠⎠ = r 2 ϕ˙ = l, z 0 0 z
wobei l = l konstant ist. Damit ergibt sich ϕ˙ =
l . r2
(15.2)
Wir wollen den Newton’schen Energiesatz E = E kin + E pot =
1 ˙2 r + U (r ) = const. 2
(15.3)
mit der potenziellen Energie GM r (wie in (7.5)) für unsere weiteren Berechnungen benutzen. U (r ) = −
Aufgabe 15.1 Zeigen Sie die Gültigkeit des Energiesatzes, indem Sie die Bewegungsgleichung (7.4):
r¨ = −∇U (r ) skalar mit r˙ multiplizieren.
15.1
Kepler-Bewegung in der Newton’schen Gravitationstheorie
403
Lösung Es gilt d r˙ · r¨ = −r˙ · ∇U (r ) ⇔ dt Das heißt
1 ˙2 r 2
dU (r ) d =− ⇔ dt dt
1 ˙2 r + U (r ) = 0. 2
1 ˙2 r + U (r ) = const. = E. 2
In Polarkoordinaten gilt r˙ 2 = (˙r sin ϕ − r ϕ˙ cos ϕ)2 + (˙r cos ϕ + r ϕ˙ sin ϕ)2 = r˙ 2 + r 2 ϕ˙ 2 , sodass wir den Energiesatz mit (15.2) als GM 1 2 r˙ + r 2 ϕ˙ 2 − 2 r 1 2 1 l2 GM = r˙ + − 2 2 r2 r = E kin + Ue f f (r )
E=
(15.4)
schreiben können, wobei wir das effektive Potenzial durch Ue f f :=
1 l2 GM − 2 r2 r
definieren. Durch Umstellung erhalten wir die Bewegungsgleichung r˙ 2 = 2E − 2Ue f f = 2E −
l2 2G M . + 2 r r
(15.5)
Die Bewegungsgleichung ist durch die Umformung zu einer gewöhnlichen Differenzialgleichung mit nur einer Variablen r geworden. Wir können einige Aussagen über mögliche Trajektorien des Testteilchens machen, wenn wir uns Abb. 15.1 genauer anschauen. Es sind der Funktionsgraph des effektiven Potenzials Ue f f mit l = M = G = 1 sowie drei Gesamtenergieniveaus E A , E B , E D eingezeichnet. Dort, wo das Energieniveau mit dem effektiven Potenzial zusammenfällt, ist die kinetische Energie E kin gleich null (˙r = 0). Ansonsten bildet die Summe aus E kin und Ue f f das Gesamtenergieniveau, wie bei E D verdeutlicht. Die gestrichelten Linien sind die Trajektorien in radialer Richtung. • Das Energieniveau E A ist so gewählt, dass es mit dem Minimum A von Ue f f zusammenfällt. Dort ist r˙ = 0, d. h., der Radius der Teilchenbahn bleibt konstant, das Teilchen
404
15 Klassische Tests der Allgemeinen Relativitätstheorie
Abb. 15.1 Effektives Potenzial bei Newton
bewegt sich auf einer Kreisbahn. Die Bahnkurve ist stabil, d. h., kleine Änderungen der Energie verursachen nur kleine Änderungen an der Teilchenbahn. • Im Energieniveau E B ist r˙ in den Punkten B und C gleich null. Diese Punkte sind „Wendepunkte“: Erreicht ein Teilchen, das mit einem Radius zwischen B und C startet, den maximalen Radius in C, so bewegt es sich wieder „in Richtung“ B, wo es den minimalen Radius annimmt, usw. Die Teilchenbahn ist dann eine Ellipse. • Ist die Gesamtenergie wie in E D größer als null, so können wir die Teilchenbahn folgendermaßen interpretieren: Wenn das Teilchen aus dem Unendlichen kommt, kann es sich dem massiven Objekt nur bis zum Punkt D nähern, wird dort gestreut und verschwindet wieder „Richtung unendlich“. Die möglichen Bahnen sind Hyperbeln oder Parabeln, wie wir anschließend zeigen werden.
Aufgabe 15.2 Zeigen Sie, dass mit der Substitution u = 1/r die Bewegungsgleichung (15.5) zu d 2u GM +u = 2 (15.6) 2 dϕ l
umgeschrieben werden kann und dass die allgemeine Lösung der Bewegungsgleichung durch GM u (ϕ) = 2 + C cos (ϕ − ϕ0 ) (15.7) l mit den beiden Integrationskonstanten C und ϕ0 gegeben ist.
15.1
Kepler-Bewegung in der Newton’schen Gravitationstheorie
405
Lösung Um die möglichen Teilchenbahnen genauer zu bestimmen, formen wir den Energiesatz (15.4) etwas um und erhalten mit (15.2)
1 2 dϕ 2 G M + r − 2 dt r
2
2 GM 1 dr dϕ 1 l = + r2 4 − 2 dϕ dt 2 r r
2 2 2 1 l 1 dr GM l + = . − 2 dϕ r4 2 r2 r
1 E= 2
dr dt
2
Nun substituieren wir die Variable r durch u = d du = dr dr
1 , beachten r
1 du dr 1 dr du 1 =− 2 ⇒ = =− 2 , r r dϕ dr dϕ r dϕ
und es ergibt sich l2 E= 2
du dϕ
2 +
(15.8)
l2 2 u − G Mu. 2
Wir differenzieren nach ϕ und erhalten 0 = l2
du du du d 2 u − GM . + l 2u dϕ dϕ 2 dϕ dϕ
Diese Differenzialgleichung wird offensichtlich durch u= und die Teilchenbahn ist ein Kreis. Ist
(15.9)
du = 0 gelöst, d. h. dϕ
1 = const, r
du = 0, so können wir (15.9) dadurch dividieren dϕ
und wir erhalten das Ergebnis GM d 2u +u = 2 , dϕ 2 l also eine inhomogene lineare Differenzialgleichung zweiter Ordnung. Eine spezielle Lösung ist GM u= 2 , l und die allgemeine homogene Lösung ist u = C cos (ϕ − ϕ0 )
(15.10)
406
15 Klassische Tests der Allgemeinen Relativitätstheorie
mit den zwei Integrationskonstanten C, ϕ0 . Wir erhalten daraus die allgemeinen Lösungen u (ϕ) =
GM + C cos (ϕ − ϕ0 ) . l2
Mit ε := Cl 2 / (G M) sowie Rücksubstitution r = 1/u erhalten wir aus (15.7) r (ϕ) =
p (1 + ε cos (ϕ − ϕ0 ))
(15.11)
l2 und der numerischen Exzentrizität ε. Diese Kurven mit dem Halbparameter p := GM beschreiben Kegelschnitte, und zwar Kreise für ε = 0, Ellipsen für 0 < ε < 1, Parabeln für ε = 1 und Hyperbeln für ε > 1, wie z. B. in [6] ausführlich dargestellt wird. Zweikörperproblem Die Bewegung eines Testteilchens im Gravitationsfeld eines massiven Körpers wird Einkörperproblem genannt. In der Newton’schen Mechanik kann das sogenannte Zweikörperproblem zweier Punktmassen, die sich infolge ihrer gegenseitigen gravitativen Anziehung bewegen, auf ein Einkörperproblem reduziert werden. Wir nehmen an, dass sich zwei Himmelskörper (z. B. Sonne und Planet) mit Massen m 1 und m 2 an den Orten r1 und r2 befinden. Dann gilt mit dem Gravitationsgesetz m 1 r¨ 1 = −
Gm 1 m 2 r1 − r2 r2
=−
Gm 1 m 2 r
r r2 r Gm 1 m 2 r Gm 1 m 2 r2 − r1 = m 2 r¨ 2 = − 2 r r r2 r
(15.12)
mit r = r1 − r2 und r = | r |. Addition der beiden Gleichungen ergibt m 1 r¨ 1 + m 2 r¨ 2 = 0. Wir definieren die Schwerpunktskoordinaten durch rS = (siehe Abb. 15.2), dann folgt
1 (m 1 r1 + m 2 r2 ) m1 + m2 r¨ S = 0.
(15.13)
(15.14)
Wir wollen für die folgenden Rechnungen und Darstellungen der Einfachheit halber annehmen, dass der Schwerpunkt im Ursprung liegt, also rS = 0. Damit kann man umgekehrt die Ortsvektoren r1 und r2 auch durch
15.1
Kepler-Bewegung in der Newton’schen Gravitationstheorie
407
Abb. 15.2 Schwerpunkt S
r1 =
m2 m1 r, r2 = − r m1 + m2 m1 + m2
(15.15)
ausdrücken. Definiert man die reduzierte Masse μ durch μ :=
m1 m2 , m1 + m2
(15.16)
so erhält man durch Einsetzen von (15.15) in (15.12) das Gravitationsgesetz μr¨ = −
Gm 1 m 2 r r2
r
.
(15.17)
Mit diesen Ergebnissen können wir das Verhalten des Systems beschreiben. Aus Gl. (15.14) ergibt sich, dass sich der Schwerpunkt gradlinig gleichförmig bewegt oder in Ruhe bleibt. Gl. (15.17) können wir so interpretieren, dass auf ein fiktives Teilchen der Masse μ die Gravitationskraft Gm 1 m 2 r Gμ (m 1 + m 2 ) r − =− 2 r r r2 r wirkt. Durch die Transformation auf Schwerpunktskoordinaten haben wir also das Zweikörperproblem (15.12) auf eine einfache Bewegungsgleichung für den Schwerpunkt und auf ein Einkörperproblem zurückgeführt. Wir wollen die Bahnen des fiktiven Teilchens, das sich um ein Gravitationszentrum mit Masse m 1 + m 2 im Ursprung bewegt, in die wirklichen Koordinaten der beiden Körper zurück übersetzen. Nach Gl. (15.15) gilt r1 =
m2 m1 r, r2 = − r, m1 + m2 m1 + m2
d. h., die beiden Körper durchlaufen die Bahnen m2 r (ϕ) m1 + m2 m1 r (ϕ) . r2 (ϕ) = − m1 + m2 r1 (ϕ) =
408
15 Klassische Tests der Allgemeinen Relativitätstheorie
Abb. 15.3 Umlaufbahnen zweier Körper mit m 1 : m 2 = 1 : 10
Ist die Umlaufbahn r (ϕ) des fiktiven Teilchens eine Ellipse, so sind die Umlaufbahnen der beiden Körper ebenfalls Ellipsen, wobei der Umlaufsinn um den gemeinsamen Schwerpunkt entgegengesetzt ist. Abb. 15.3 zeigt ein Beispiel der Umlaufbahnen der beiden Körper, wobei das Verhältnis der Massen m 1 : m 2 = 1 : 10 beträgt. Kepler ist bei seinen Gesetzen davon ausgegangen, dass die Sonne unbewegt in einem der Brennpunkte der Ellipsenbahn steht. Die Sonne bewegt sich aber tatsächlich ebenfalls auf einer der Planetenbahn gegenläufigen Ellipsenbahn, wobei der Schwerpunkt von Sonne und Planet, der sich innerhalb der Sonne befindet, in einem der gemeinsamen Brennpunkte der Ellipse liegt. Von daher ist die Aussage des ersten Kepler’schen Gesetzes nur annähernd richtig.
15.2
Geodäten in der Schwarzschild-Raumzeit
Wir wollen das Einkörperproblem in einer Raumzeit mit der Schwarzschild-Metrik
2G M 2G M −1 2 2 2 dt + 1 − dr + r 2 dϑ 2 + sin2 ϑ dϕ 2 ds = − 1 − r r untersuchen, d. h., wir unterstellen, dass der massive Zentralkörper ein kugelsymmetrisches Gravitationsfeld erzeugt. Kräftefreie Teilchen bewegen sich in einem Gravitationsfeld entlang Geodäten, d. h., wir müssen die Geodätengleichung (11.59): ν ρ d2xμ μ dx dx =0 + νρ dλ2 dλ dλ
15.2
Geodäten in der Schwarzschild-Raumzeit
409
für die Schwarzschild-Raumzeit lösen. Um keine Verwechslung mit der SchwarzschildKoordinate t zu erzeugen, bezeichnet der Buchstabe λ den Kurvenparameter von γ = x μ (λ). Da wir bei der Herleitung der Schwarzschild-Metrik den Krümmungstensor mit dem Cartan’schen Kalkül (und nicht über die Christoffel-Symbole) berechnet haben, bedeutet das insbesondere, zunächst die Christoffel-Symbole berechnen zu müssen und dann zu versuchen, das System aus den vier gekoppelten Differenzialgleichungen zu lösen. Wir wollen uns diese umfangreiche Rechnung ersparen (die man aber tatsächlich durchführen kann, wie man in [6] auf mehreren Seiten nachlesen kann) und ähnlich wie beim KeplerProblem in Abschn. 15.1 Erhaltungsgrößen zum Einsatz bringen. Als Erstes fragen wir uns, ob die kräftefreie Bewegung eines Teilchens in der Schwarzschild-Raumzeit ebenfalls in einer Ebene verläuft. Wir können aufgrund der Rotationssymmetrie das Koordinatensystem so legen, dass der Anfangspunkt auf dem Äquator und der anfängliche Tangentialvektor in der Äquatorebene liegt, d. h. ϑ (0) = π/2, ϑ˙ (0) = 0. Die Frage, ob dann die Geodäte immer in dieser Ebene bleibt, können wir qualitativ dadurch positiv beantworten, dass wir wieder die Rotationssymmetrie (oder auch die „Achsensymmetrie“ der Schwarzschild-Metrik ϑ → π − ϑ, siehe [20]) ins Spiel bringen. Es gibt aber auch eine rechnerische Begründung, für die wir uns die spezielle Form der Geodätengleichung (11.75): 1 ∂ gμν μ ν d gρμ x˙ μ − x˙ x˙ = 0 dτ 2 ∂xρ anschauen und für ρ = ϑ weiter ausrechnen. Es gilt d dτ d = dτ
0=
1 ∂ gϕϕ gϑϑ ϑ˙ − ϕ˙ ϕ˙ 2 ∂ϑ 2 r ϑ˙ − r 2 sin ϑ cos ϑ ϕ˙ 2 .
(15.18)
Zunächst bemerken wir, dass ϑ = π/2 eine Lösung dieser Differenzialgleichung ist. Diffe¨ renziert man die Gl. (15.18) noch einmal, so folgt ϑ(0) = 0, und setzt man diesen Prozess fort, so sind alle höheren Ableitungen der Funktion ϑ an der Stelle 0 ebenfalls gleich null. Wenn aber eine solche Situation vorliegt, dann besagt der Satz von Taylor, dass ϑ(λ) = π/2 ˙ für alle λ gilt , d. h., ϑ ist eine konstante Funktion, also ist auch ϑ(λ) = 0 für alle λ. Das bedeutet, dass die gesamte Bahnkurve in der Äquatorebene liegt. Wir erhalten also das gleiche Ergebnis wie in der Newton’schen Gravitation. Aus Abschn. 14.6 wissen wir, dass die Schwarzschild-Metrik vier Killing-Vektoren besitzt, drei für die Kugelsymmetrie und eine für die Symmetrie unter Zeitverschiebungen. Wir wissen auch, dass nach (12.60) jeder Killing-Vektor X = X μ ∂μ die Erhaltungsgröße U μ Xμ =
dxμ X μ = const. dλ
410
15 Klassische Tests der Allgemeinen Relativitätstheorie
generiert. Die hier benötigten Killing-Vektoren der Schwarzschild-Metrik sind mit (14.35) μ
X t = X t = (∂t )μ = (1, 0, 0, 0) μ X ϕ = X ϕμ = ∂ϕ = (0, 0, 0, 1) . Mit den beiden anderen Killing-Vektoren X r und X ϑ kann man ebenfalls die planare Bewegung einer Geodäte in der Schwarzschild-Raumzeit begründen, siehe [21]. Um die Erhaltungsgrößen zu bekommen, müssen wir die Indizes runterziehen:
2G M ν , 0, 0, 0 (X t )μ = gμν X t = − 1 − r X ϕ μ = gμν X ϕν = 0, 0, 0, r 2 sin2 ϑ = 0, 0, 0, r 2 , da wir ϑ = π/2 gesetzt haben. Wir definieren die Erhaltungsgrößen durch
2G M dt dxμ E:=− (X t )μ = 1 − dλ r dλ dxμ dϕ L:= Xϕ μ = r 2 . dλ dλ
(15.19)
Im Fall einer zeitartigen Geodäte (Masse des Teilchens m > 0, Kurvenparameter λ = τ ) und bei großen Abständen vom Zentralkörper (r → ∞) reduziert sich die Größe E auf die speziell relativistische Formel für die Gesamtenergie pro Masseneinheit eines Teilchens. Diese ist nämlich nach (3.4) in der Speziellen Relativitätstheorie gleich mγ dt =γ = . m dτ Wir können die Größe E für eine zeitartige Geodäte als Gesamtenergie (inklusive der gravitativen potenziellen Energie) pro Masseneinheit interpretieren, so wie sie von einem Beobachter in Ruhe „im Unendlichen“ wahrgenommen wird. Diese Energie muss der Beobachter aufwenden, um ein Teilchen mit Masse m = 1 in die betrachtete Umlaufbahn zu bringen. Ähnlich lässt sich im Fall einer zeitartigen Geodäte die Größe L als Drehimpuls pro Masseneinheit interpretieren. In der Newton’schen Gravitationstheorie beschreibt die Gl. (15.2) das zweite Kepler’sche Gesetz, nämlich dass ein Teilchen auf einer Umlaufbahn in gleichen Zeitintervallen gleiche Flächen überstreicht. Diese Interpretation können wir allerdings nicht eins zu eins übertragen, da die räumliche Geometrie der Schwarzschild-Raumzeit nicht euklidisch ist. Trotzdem ist es erstaunlich, dass die Gleichung für L formal identisch mit der für l ist. Wenn wir uns die beiden Gl. (15.19) anschauen, so enthalten diese Ableitungen der Zeitund Winkelkoordinate, aber keine Ableitungen der radialen Komponente, daher brauchen wir noch eine dritte Erhaltungsgröße. Wir definieren diese durch
15.2
Geodäten in der Schwarzschild-Raumzeit
:= −gμν
411
dxμ dxν . dλ dλ
(15.20)
Für die kovariante Ableitung dieser Gleichung nach γ˙ (λ) = d x ρ /dλ erhalten wir mit (11.55)
∇ dxμ dxν ∇
=− gμν dλ dλ dλ dλ ⎛ ⎞ ⎞ ⎛ =− = 0,
ν⎟ ⎜ ∇ dxμ ⎟ dxν ∇ dxμ dxν dxμ ⎜ ⎟ ⎜ ∇ dx ⎟ gμν − gμν ⎜ − g μν ⎝ dλ dλ ⎠ dλ dλ ⎝dλdλ⎠ dλ dλ dλ =0
=0
=0
also ist eine Konstante. Wir schreiben die Gl. (15.20) aus:
2 2 2G M dϕ dt 2G M −1 dr 2
= 1− − 1− − r2 , r dλ r dλ dλ da dϑ/dλ = 0 wegen ϑ = π/2. Nun setzen wir die Gl. (15.19) ein, und es ergibt sich
2G M −1 2G M −1 dr 2 L 2
= E2 1 − − 1− − 2 r r dλ r und daraus durch Umstellen 1 1 2 E = 2 2
dr dλ
2 +
GM L2 1 G M L2
−
+ 2 − . 2 r 2r r3
(15.21)
Wir definieren auch hier ein effektives Potenzial durch Ve f f (r ) :=
GM L2 G M L2 1
−
+ 2 − 2 r 2r r3
und erhalten 1 1 E˜ := E 2 = 2 2
dr dλ
(15.22)
2 + Ve f f (r ) ,
also eine ganz ähnliche Gleichung wie der Energiesatz im Newton’schen Fall (15.4). Der hauptsächliche Unterschied der beiden Bewegungsgleichungen besteht in dem Term −G M L 2 /r 3 , der in der Schwarzschild-Raumzeit (neben der Konstante /2) zusätzlich auftritt und für kleine r die Bewegung dominiert. Als Nächstes bestimmen wir den Wert der konstanten Funktion , indem wir zwei Fälle unterscheiden. Für eine zeitartige Geodäte können wir als Parametrisierung die Eigenzeit nehmen und erhalten mit (11.72):
= −gμν
dxμ dxν =1 dτ dτ
412
15 Klassische Tests der Allgemeinen Relativitätstheorie
Für eine lichtartige Geodäte gilt gμν d x μ d x ν = 0, woraus = 0 folgt. Es gelten also folgende Bewegungsgleichungen:
dr dτ dr dλ
2 = E2 − 1 + 2 = E2 −
L2 2G M 2G M L 2 − 2 + (zeitartig, massives Teilchen) r r r3
L2 2G M L 2 + (lichtartig, masseloses Teilchen) r2 r3
(15.23)
Wir ermitteln zunächst die Extrema des effektiven Potenzials, also Punkte, wo Kreisbewegungen stattfinden können, und setzen deshalb die Ableitung des effektiven Potenzials (15.22) gleich null: !
0=
GM L2 3G M L 2 ! − 3 + ⇔ 0 = G Mr 2 − L 2 r + 3G M L 2 2 r r r4
(15.24)
Wenn wir den relativistischen Zusatzterm 3G M L 2 ausblenden, so folgt r=
L2 ,
G M
was im massiven Fall ( = 1) für eine kreisförmige Umlaufbahn genau dem Newton’schen Ergebnis entspricht, wenn wir in Gl. (15.11) ε = 0 setzen. Im Fall = 0 gibt es bei Newton keine kreisförmigen Umlaufbahnen. Masselose Teilchen bewegen sich in der Newton’schen Gravitation auf geraden Linien, da auf sie keine Gravitationskraft wirkt. Die Nullstelle der Gl. (15.24) in der Schwarzschild-Raumzeit ist im masselosen Fall r = 3G M, was wir uns in Abb. 15.4 anschauen wollen. Abb. 15.4 Masseloses effektives Potenzial in Schwarzschild-Raumzeit
15.2
Geodäten in der Schwarzschild-Raumzeit
413
Es sind der Funktionsgraph des masselosen effektiven Potenzials Ve f f mit M = G = 1, L = 8, = 0 sowie zwei Gesamtenergieniveaus E˜ A und E˜ B eingezeichnet. Die Nullstelle von Ve f f ist der Schwarzschild-Radius 2G M. Ve f f wird negativ, wenn r kleiner als der Schwarzschild-Radius ist; mit diesem Phänomen werden wir uns bei der Behandlung von Schwarzen Löchern noch näher beschäftigen. Die gestrichelte Linie ist wieder die Trajektorie in radialer Richtung. • Das Energieniveau E˜ A ist so gewählt, dass es mit dem Maximum A von Ve f f zusammenfällt. Dort ist dr /dλ = 0, d. h., der Radius der Lichtbahn bleibt konstant, das Lichtteilchen bewegt sich auf einer Kreisbahn. Die Bahnkurve ist instabil, d. h., kleine Änderungen der Energie verursachen entweder ein Entweichen ins Unendliche oder ein Fallen auf den Schwarzschild-Radius zu. • Im Energieniveau E˜ B ist dr /dλ in B gleich null. Dieser Punkt ist ein „Wendepunkt“: Kommt der Lichtstrahl aus dem Unendlichen, dann wird er bei B gestreut und entweicht dann wieder ins Unendliche. Dieser Fall erinnert an die hyper- bzw. parabolischen Bahnen massiver Teilchen in der Newton’schen Gravitation. Zusammengefasst haben wir zwei wesentliche Abweichungen von der Newton’schen Gravitation entdeckt. Das Licht kann sich auf einer (instabilen) Kreisbahn um den massiven Körper bewegen, und seine Bahn wird bei bestimmten Energieniveaus, d. h. bei bestimmten Frequenzen, von dem massiven Körper abgelenkt, was wir im Folgenden noch genauer untersuchen werden. Wir wenden uns jetzt dem massiven Fall ( = 1) der zeitartigen Bewegung zu und finden für die Nullstellen von (15.24): L 2 ± L 2 1 − 12 G 2 M 2 /L 2 r± = (15.25) 2G M Wir schauen uns den Verlauf von Ve f f in Abb. 15.5 an.
Abb. 15.5 Massives effektives Potenzial in Schwarzschild-Raumzeit
414
15 Klassische Tests der Allgemeinen Relativitätstheorie
Es sind der Funktionsgraph des massiven effektiven Potenzials Ve f f mit M = G = 1, L = 5, = 1 sowie drei Gesamtenergieniveaus E˜ A , E˜ B , E˜ E eingezeichnet. Die gestrichelten Linien stellen die Trajektorien in radialer Richtung dar. • Die Energieniveaus E˜ A , E˜ B sind so gewählt, dass sie mit dem Minimum A bei r+ bzw. mit dem Maximum B bei r− von Ve f f zusammenfallen. Dort ist dr /dλ = 0, d. h., die Radien der Teilchenbahnen bleiben konstant, das Teilchen bewegt sich auf Kreisbahnen. Die Bahnkurve bei A ist stabil, die bei B ist instabil. • Zwischen den Energieniveaus E˜ A und E˜ B ist eine Trajektorie eingezeichnet, die wie in der Newton’schen Gravitation eine elliptische Umlaufbahn darstellt. Hier pendelt der Radius der Umlaufbahn zwischen den Radien bei C und D. • Im Energieniveau E˜ E ist erneut ein Ablenkungsfall dargestellt. Kommt das Teilchen aus dem Unendlichen, dann wird es bei E gestreut und entweicht dann wieder ins Unendliche. Dieser Fall erinnert wieder an die hyper- bzw. parabolischen Bahnen massiver Teilchen in der Newton’schen Gravitation. Die beiden Extrema fallen zusammen, wenn der Drehimpuls den Wert √ L = 12 G M annimmt, der Radius ist dann √
r = 6G M.
Es gibt also für L < 12G M keine Kreisbahnen mehr, was in Abb. 15.6 nochmals verdeutlicht wird. Es sind zwei Funktionsgraphen des massiven effektiven Potenzials Ve f f mit M = G = 1, L 2 = 12 bzw. L 2 = 9, = 1 sowie das Gesamtenergieniveau E˜ A für das Minimum der gepunkteten Kurve bei r = 6G M = 6 eingezeichnet. Auch dieses Phänomen ist in der Newton’schen Physik nicht vorhanden, dort gibt es (außerhalb des Radius des massiven Körpers) stets mögliche Kreisbahnen, egal wie groß der Drehimpuls l ist. Aber schauen wir uns einmal an, bei welchen massiven Objekten die SchwarzschildGrenze r = 6G M für die Existenz einer kreisförmigen Umlaufbahn unterschritten wird. Dazu modifizieren wir die (14.22) und beachten, dass r0 den Radius des massiven Körpers bezeichnet und dass 6G M = 3rs gilt:
15.2
Geodäten in der Schwarzschild-Raumzeit
415
Abb. 15.6 Effektives Potenzial, L 2 < 12M 2 G 2
M Er de ≈ 6 × 1027 g ⇒ 6G M ≈ 3 cm r0 ≈ 6000 km M Sonne ≈ 2 × 1033 g ⇒ 6G M ≈ 9 km r0 ≈ 7 × 105 km Mweisser Z werg ≈ 2 × 1033 g ⇒ 6G M ≈ 9 km r0 ≈ 100 km M N eutr onenster n ≈ 2 × 1033 g ⇒ 6G M ≈ 9 km ≈ r0 ≈ 10 km,
(15.26)
wobei wir bei den letzten beiden Einträgen für den weißen Zwerg und den Neutronenstern jeweils Sonnenmasse unterstellt haben. Wir lesen ab, dass die Schwarzschild-Grenze 6G M selbst bei den dichtesten Sternen im Universum innerhalb des Sterns (bzw. bei Neutronensternen eventuell knapp außerhalb) liegt. Da bei einem Schwarzen Loch die Masse in einem Punkt konzentriert ist, ist r0 = 0 und somit ein Schwarzes Loch wahrscheinlich das einzige Objekt, an dem man testen könnte, ob es wirklich keine kreisförmigen (geodätischen!) Umlaufbahnen innerhalb des dreifachen Schwarzschild-Radius gibt. Teilchenbahnen in der Schwarzschild-Raumzeit Um die geodätischen Teilchenbahnen in der Schwarzschild-Raumzeit detaillierter zu untersuchen, gehen wir ganz ähnlich vor wie bei der Herleitung der Umlaufbahnen in der Newton’schen Gravitation.
Aufgabe 15.3 Zeigen Sie, dass mit der Substitution u = 1/r die Bewegungsgleichung (15.21) zu
416
15 Klassische Tests der Allgemeinen Relativitätstheorie
du du du d 2 u du + L 2u − 3G M L 2 u 2 − GM 2 dϕ dϕ dϕ dϕ dϕ
0 = L2
(15.27)
umgeschrieben werden kann. Lösung Wir starten mit der Bewegungsgleichung für ein massives Teilchen (15.21) 1 1 2 E = 2 2
2 +
L2 1 GM G M L2 − + 2− 2 r 2r r3
dr dϕ 2 1 G M L2 G M L2 + 2− + − dϕ dλ 2 r 2r r3
2 2 L2 1 dr 1 GM G M L2 L − + = + − , 2 dϕ r4 2 r 2r 2 r3 =
1 2
dr dλ
wobei wir in der letzten Gl. (15.19) benutzt haben. Wie im Newton’schen Fall setzen wir u := 1/r und erhalten mit (15.8): 1 dr du =− 2 , dϕ r dϕ was wir in die Bewegungsgleichung einsetzen: L2 1 2 E = 2 2
du dϕ
2 +
L2 2 1 − G Mu + u − G M L 2u3 2 2
Wir differenzieren nach ϕ und erhalten 0 = L2
du du du d 2 u du + L 2u − 3G M L 2 u 2 . − GM 2 dϕ dϕ dϕ dϕ dϕ
Diese Differenzialgleichung wird offensichtlich durch u= und die Teilchenbahn ist ein Kreis. Ist
du = 0 gelöst, d. h. dϕ
1 = const., r du = 0, so können wir (15.27) dividieren und dϕ
erhalten das Ergebnis GM d 2u + u = 2 + 3G Mu 2 , dϕ 2 L
(15.28)
15.3
Die Periheldrehung des Merkurs
417
also eine Gleichung, die sich vom Newton-Fall (15.6) nur durch den zusätzlichen Term 3G Mu 2 auf der rechten Seite unterscheidet. Mit beinahe identischer Herleitung ergibt sich die Bewegungsgleichung für ein Lichtteilchen zu d 2u + u = 3G Mu 2 . dϕ 2
15.3
(15.29)
Die Periheldrehung des Merkurs
Wir haben in den Berechnungen des Abschnittes 15.1 unterstellt, dass wir es mit einem System zu tun haben, das nur aus einem Planeten und der Sonne besteht. Diese Annahme stimmt in der Realität nicht. Insbesondere die Gravitationskräfte der Planeten untereinander bewirken, dass die Planetenbahnen (kleine) Abweichungen von Ellipsen aufweisen. Aber auch andere Effekte wie z. B. die Eigenrotation (und damit verbundene Abplattung) der Sonne tragen mit dazu bei, dass es zu Abweichungen von geschlossenen Ellipsenbahnen kommt. Nach jedem Umlauf ist die Linie vom Zentrum zum sonnennächsten Punkt, dem Perihel der Bahn, ein wenig gedreht (Abb. 15.7). Diese Periheldrehung ist für den Merkur am größten und von der Größenordnung einer Bogensekunde pro Umlauf; sie wird zu etwa 90% durch die anderen Planeten und zu 10% durch andere Effekte verursacht. Schon im 19. Jahrhundert hat man festgestellt, dass zwischen den beobachteten Werten der Periheldrehung des Merkurs und den aus der Newton’schen Gravitationstheorie errechneten eine (kleine) Differenz in Höhe von ca. 43 Bogensekunden pro Jahrhundert besteht, die man sich nicht erklären konnte. Wir werden in diesem
Abb. 15.7 Periheldrehung des Merkurs
418
15 Klassische Tests der Allgemeinen Relativitätstheorie
Abschnitt zeigen, dass die Allgemeine Relativitätstheorie genau diese Differenz zwischen der Rechnung innerhalb der Newton’schen Theorie und der astronomischen Beobachtung erklärt. Wir gehen von der elliptischen Newton’schen Bewegungsgleichung (15.11) u 0 (ϕ) =
GM 1 + ε cos ϕ 1 = 2 (1 + ε cos ϕ) = r0 (ϕ) p L
(15.30)
aus, bei der wir die Integrationskonstante ϕ0 auf null gesetzt haben. Das heißt, wir legen das Koordinatensystem so, dass das Perihel bei ϕ = 0 angenommen wird, dort ist r (ϕ) minimal. Die Größe ε ist die (numerische) Exzentrizität der Ellipsenbahn und hängt mit dem Halbparameter p über die Beziehung p = a(1 − ε 2 ) zusammen (siehe [27]), wobei a die große Halbachse der Ellipsenbahn bezeichnet. Bei der Bewegungsgleichung in der Schwarzschild-Raumzeit (15.28): GM d 2u + u = 2 + 3G Mu 2 dϕ 2 L
(15.31)
ist der Zusatzterm 3G Mu 2 in unserem Planetensystem ein kleiner Störterm. Für den Planeten Merkur schätzen wir dies ab, indem wir die ungestörte Newton’sche Lösung u 0 in den Zusatzterm einsetzen. Es ergibt sich dann mit rs (Sonne) = 2G M ≈ 3 km, a ≈ 5,8 · 107 km, ε ≈ 0, 21 (siehe [28]) für die relative Größe der beiden Terme auf der rechten Seite von Gl. (15.31) 3G Mu 20 2. T er m 3G M (1 + ε cos ϕ)2 = = 1. T er m G M/L 2 G M/L 2 p 2 3G M 3G M 3G M (1 + ε cos ϕ)2 ≈ = p p a(1 − ε 2 ) 9/2 = ≈ 8 · 10−8 . 7 5,8 · 10 (1 − 0, 0441)
=
(15.32)
Wir definieren die (kleine) Konstante δ durch δ :=
3G M 3 G2 M 2 = ≈ 8 · 10−8 p L2
(15.33)
und schreiben die Gl. (15.31) etwas um: GM d 2u +u = 2 +δ 2 dϕ L
L 2u2 GM
(15.34)
15.3
Die Periheldrehung des Merkurs
419
Da δ klein ist, kann man die Änderungen der Kepler-Bahnen durch Störungsrechnung bestimmen. Wir nehmen an, dass die Gl. (15.34) eine Lösung u(ϕ) der Form u(ϕ) = u 0 (ϕ) + δu 1 (ϕ) + O δ 2 hat. Diesen Ansatz setzen wir in die Gl. (15.34) ein: GM L 2 u 20 d 2u1 d 2u0 + O δ2 = 0 + u0 − 2 + δ + u1 − 2 2 dϕ L dϕ GM
(15.35)
Wenn wir die Koeffizienten der verschiedenen Potenzen von δ null setzen, erhalten wir in nullter Ordnung die Newton’sche Lösung u 0 (15.30).
Aufgabe 15.4 Zeigen Sie, dass aus (15.35) in erster Ordnung die Gleichung
GM d 2u1 + u1 = 2 dϕ 2 L
ε2 ε2 1+ + 2ε cos ϕ + cos 2ϕ 2 2
(15.36)
resultiert. Lösung Es gilt:
L 2 u 20 L 2 1 + ε cos ϕ 2 GM d 2u1 = + u = = 2 (1 + ε cos ϕ)2 1 2 dϕ GM GM p L GM = 2 1 + 2ε cos ϕ + ε2 cos2 ϕ L GM 1 + cos 2ϕ = 2 1 + 2ε cos ϕ + ε2 L 2
2 ε ε2 GM 1+ + 2ε cos ϕ + cos 2ϕ = 2 L 2 2 Für die drei Terme auf der rechten Seite von (15.36) müssen wir jeweils spezielle Lösungen finden und diese anschließend addieren. Wir wollen den bei inhomogenen linearen Differenzialgleichungen häufig benutzen Ansatz vom Typ der rechten Seite verwenden, d. h., wir verwenden als Lösungsansatz eine Funktion, die vom gleichen Typ ist wie die auf der rechten Seite von (15.36).
420
15 Klassische Tests der Allgemeinen Relativitätstheorie
• Der erste Term ist eine Konstante, also wählen wir als Ansatz eine konstante Funktion (1) u 1 (ϕ) = A. Einsetzen in die Gl. (15.36) führt zu (1)
u 1 (ϕ) = A =
GM L2
1+
ε2 2
.
• Für den zweiten Term (G M 2ε cos ϕ) /L 2 käme als einfachster Ansatz B cos (ϕ) infrage, wenn nicht nach (15.10) die Kosinusfunktion selbst schon eine Lösung der homogenen Differenzialgleichung wäre. In einem solchen Fall arbeitet man häufig mit einer Graderweiterung, d. h., man multipliziert den einfachsten Ansatz mit einem (einfachen) Polynom (in ϕ). Wir schauen uns den Ansatz (2)
u 1 (ϕ) = Bϕ sin ϕ an und berechnen d 2 (ϕ sin ϕ) + ϕ sin ϕ = cos ϕ + cos ϕ − ϕ sin ϕ + ϕ sin ϕ = 2 cos ϕ, dϕ 2 d. h., wir erhalten die Lösung (2)
u 1 (ϕ) =
G Mε ϕ sin ϕ. L2
• Beim dritten Term machen wir den Ansatz u (3) 1 (ϕ) = B cos 2ϕ und berechnen d 2 (cos 2ϕ) + cos 2ϕ = −3 cos 2ϕ, dϕ 2 d. h., die Lösung ist (3)
u 1 (ϕ) = −
G Mε 2 cos 2ϕ. 6 L2
Zusammengefasst erhalten wir als allgemeine Lösung von (15.34) in erster Ordnung in δ
GM 1 1 − cos 2ϕ . u = u 0 + δ 2 1 + εϕ sin ϕ + ε2 L 2 6 Die wichtigste Korrektur zu u 0 liegt in dem Term mit ϕ sin ϕ, da er bei jedem Umlauf anwächst. Wir vernachlässigen die beiden anderen Korrekturen und erhalten u (ϕ) ≈
GM (1 + ε (cos ϕ + δϕ sin ϕ)) . L2
Da δ eine kleine Größe ist, können wir den Term cos ϕ + δ ϕ · sin ϕ durch das Differenzial abschätzen. Es gilt dann in erster Ordnung in δ
15.4
Lichtablenkung in der Schwarzschild-Raumzeit
421
cos (ϕ − δϕ) ≈ cos ϕ − sin(ϕ)(ϕ − δϕ − ϕ) = cos ϕ + δϕ sin(ϕ) und damit
GM (1 + ε cos (ϕ (1 − δ))) . L2 Damit ist die Bahn des Merkurs nur näherungsweise eine Ellipse. Sie ist zwar weiterhin periodisch, hat aber nicht mehr die Periode 2π , sondern u (ϕ) ≈
2π ≈ 2π (1 + δ) . 1−δ Der Merkur befindet sich im Perihel, wenn u =
1 maximal wird, d. h., wenn r
cos [ϕ (1 − δ)] = 1 ist, also bei ϕ = 0,
2π 4π , , . . . ≈ 0, 2π (1 + δ) , 4π (1 + δ) , . . . 1−δ 1−δ
d. h., die Abweichung ϕ gegenüber der Periode 2π beträgt mit (15.33) pro Umlauf ϕ = 2π δ = 2π · 8 · 10−8 = 5,0265 · 10−7 rad = 0,10368 . Der Merkur hat eine Umlaufzeit von etwa 88 Erdtagen. Im Laufe eines Jahrhunderts (auf der Erde) wandert sein Perihel daher um den Betrag ϕ ·
100 · 365 = 43 . 88
Die tatsächlich beobachtete Periheldrehung des Merkurs ist erheblich größer, sie beträgt ca. 574 Bogensekunden pro Jahrhundert. Astronomische Berechnungen, die den Einfluss der anderen Planeten und andere Ursachen auf die ursprüngliche Kepler-Ellipse des Merkurs berücksichtigen, ergeben allerdings nur einen Teilbetrag von etwa 531 . Der beobachtete Differenzbetrag von ∼43 wird also durch die Allgemeine Relativitätstheorie schlüssig erklärt.
15.4
Lichtablenkung in der Schwarzschild-Raumzeit
Neben der Periheldrehung ist die Ablenkung eines Lichtstrahls durch die Sonne der zweite klassische Test der Allgemeinen Relativitätstheorie. Wir gehen von der Bewegungsgleichung für Licht (15.29) in der Schwarzschild-Raumzeit aus:
422
15 Klassische Tests der Allgemeinen Relativitätstheorie
d 2u + u = 3G Mu 2 dϕ 2
(15.37)
In dieser Gleichung ist der Term auf der rechten Seite im Fall der Streuung von Licht an der Sonne sehr klein. Denn vergleicht man 3G M u 2 mit u bei einem Lichtstrahl, der die Sonne 1 an ihrem Rand streift, dann gilt mit dem Sonnenradius R = 696.000 km und mit u = r 3G M u 2 3G M 3rs 3 · 2,95km = ≤ = ≈ 6,4 · 10−6 . u r 2R 2 · 696000km Ohne den Term auf der rechten Seite von (15.37) ergibt sich die Newton’sche Bewegungsgleichung für Licht d 2u0 + u 0 = 0, dϕ 2 deren allgemeine Lösung u 0 (ϕ) = c1 sin ϕ + c2 cos ϕ ist. Legt man das Koordinatensystem so, dass u (π/2) = 1/r0 ist, so folgt 1/r0 = u(π/2) = c1 sin(π/2) + c2 cos(π/2) = c1 , also c1 =
1 und c2 = 0, d. h., die Lösung für die homogene Gleichung ist r0 u(ϕ) =
1 1 = sin ϕ. r (ϕ) r0
Umstellen ergibt r0 = r sin ϕ = y, d. h., die homogene Lösung ist die Gerade y = r0 . Abb. 15.8 verdeutlicht unsere Aufgabenstellung.
Abb. 15.8 Lichtablenkung an der Sonne in der Schwarzschild-Raumzeit
15.4
Lichtablenkung in der Schwarzschild-Raumzeit
423
Die Sonne liegt im Koordinatenursprung. Die Newton’sche Lösung ist die waagerechte gestrichelte Linie, die durch den Punkt (0, r0 ) geht, wobei r0 der sonnennächste Punkt auf der Bahn des Lichtteilchens ist. Wenn wir die Lösung von (15.37) gefunden haben, so können wir auch den Winkel ϕ∞ , der von der durchgezogenen Linie (im Unendlichen) und der Geraden y = r0 gebildet wird, bestimmen. Um diesen Winkel wird der Lichtstrahl durch die Sonne nach rechts unten abgelenkt. Um die Lösung zu erhalten, wenden wir wieder die Methode der Störungsrechnung an. Dazu definieren wir ähnlich wie im letzten Abschnitt die (kleine) Konstante δ durch δ :=
3G M ≈ 6,4 · 10−6 r0
und schreiben die Gl. (15.37) etwas um: d 2u + u = δ r0 u 2 dϕ 2
(15.38)
Wir nehmen an, dass die Gl. (15.38) eine Lösung u(ϕ) der Form u(ϕ) = u 0 (ϕ) + δu 1 (ϕ) + O δ 2 mit u 0 =
sin ϕ hat. Diesen Ansatz setzen wir in die Gl. (15.38) ein: r0
2 d 2u0 d u1 2 + u0 + δ + u 1 − r0 u 0 + O δ 2 = 0 dϕ 2 dϕ 2
Wenn wir die Koeffizienten der verschiedenen Potenzen von δ null setzen, erhalten wir in nullter Ordnung die Newton’sche Lösung und in erster Ordnung die Gleichung d 2u1 + u 1 = r0 dϕ 2
sin ϕ r0
2 =
1 (1 − cos 2ϕ) . 2r0
(15.39)
Aufgabe 15.5 Zeigen Sie, dass die Differenzialgleichung (15.39) mit einem Lösungsansatz vom Typ der rechten Seite durch
cos 2ϕ 1 u1 = 1+ 2r0 3
gelöst wird. Lösung Wir setzen u 1 = A + B cos 2ϕ und erhalten
424
15 Klassische Tests der Allgemeinen Relativitätstheorie
1 2r0 1 1 1 , −4B cos 2ϕ + B cos 2ϕ = − cos 2ϕ ⇒ B = 2r0 2r0 3 A=
also u1 =
1 2r0
cos 2ϕ 1+ . 3
Die gesamte Lösung ist damit näherungsweise gleich sin ϕ 3G M u(ϕ) = u 0 (ϕ) + δu 1 ϕ = + r0 2r02
1+
cos 2ϕ
3
.
Mit dieser Lösung kann man die Ablenkung eines aus dem Unendlichen kommenden Lichtstrahls an der Sonne berechnen. Ohne Störung würde die Lichtbahn gradlinig verlaufen. Mit r → ∞, d. h., ϕ → 0 (siehe Abb. 15.8), ist sin ϕ ≈ ϕ und cos(2ϕ) ≈ 1 sowie u ≈ 0 (da ϕ 3G M und klein sind), und somit gilt 2r02 3G M 4 ϕ ≈ 0, + r0 2r02 3 woraus ϕ∞ ≈ −
2G M r0
folgt. Die gesamte Lichtablenkung zwischen −∞ und ∞ beträgt damit ϕ = 2 |ϕ∞ | ≈
4G M . r0
Wenn wir die Lichtablenkung am Rand der Sonne berechnen wollen, so setzen wir für r0 den Sonnenradius R ein und erhalten ϕ Sonne =
2 · 2,95 4G M = rad = 1,75 . R 696.000
Dieser Wert ist doppelt so groß wie der in Abschn. 7.4 von der Newton’schen Gravitationstheorie vorhergesagte und beseitigt somit die Diskrepanz zwischen den gemessenen Werten und der Newton’schen Prognose. Wenn man die Beugung des Lichts auf der Erde messen will, so benötigt man Lichtquellen, die sich aus Sicht der Erde nahe am Sonnenrand befinden. Sterne, die das erfüllen, sieht man allerdings wegen der Helligkeit der Sonne tagsüber nicht. Nur während einer Sonnenfinsternis gelingt das. Misst man während einer Sonnenfinsternis ihre Position bezogen
15.5
Gravitative Rotverschiebung in der Schwarzschild-Raumzeit
425
Abb. 15.9 Lichtablenkung bei Sonnenfinsternis
auf den Hintergrund von anderen Sternen, so erscheint diese gegenüber der, die man nachts misst, verschoben. Die Sterne erscheinen während einer Sonnenfinsternis weiter entfernt von der Sonne und damit weiter voneinander entfernt als in einer üblichen Nacht. Das wird in Abb. 15.9 nochmals illustriert. Diese Vorhersage der Allgemeinen Relativitätstheorie wurde erstmals 1919 verifiziert, als zwei unterschiedliche Expeditionen während einer Sonnenfinsternis Lichtbeugungen von ca. 1,98 bzw. 1,61 feststellten. Diese faktische Übereinstimmung mit den Vorhersagen der Allgemeinen Relativitätstheorie machte Einstein auf einen Schlag weltberühmt. Auch Messungen in den Folgejahren haben den theoretischen Wert der Lichtablenkung bestätigt; für eine ausführliche Diskussion der Experimente siehe [29].
15.5
Gravitative Rotverschiebung in der Schwarzschild-Raumzeit
Der dritte klassische Test ist die gravitative Rotverschiebung. Die Komponenten der Schwarzschild-Metrik ⎞ ⎛ −1 2G M 2G M , 1− , r 2 , r 2 sin2 ϑ ⎠ gμν = diag ⎝− 1 − r r
426
15 Klassische Tests der Allgemeinen Relativitätstheorie
sind zeitlich konstant, d. h. unabhängig von der Koordinatenzeit t. Damit ist die Zeit gemeint, die auf der Uhr eines als weit entfernt unterstellten Beobachters angezeigt wird. Die Eigenzeit τ eines sich im Gravitationsfeld befindlichen Beobachters ist die Zeit, die der Beobachter selbst auf seiner eigenen Uhr misst, und errechnet sich nach der Formel (11.71) durch −dτ 2 = ds 2 = gμν d x μ d x ν , woraus
dτ =
−gμν d x μ d x ν
(15.40)
folgt. Wenn wir die Eigenzeit zwischen zwei infinitesimalen Ereignissen, die jeweils an einem festen Raumpunkt r stattfinden, messen wollen, so sind d x = dϑ = dϕ = 0, und wir erhalten
dτ = −gtt dt 2 =
1−
2G M r
dt.
Da die Wurzel kleiner als 1 ist, folgt also dτ < dt, was mit der gleichen Argumentation wie in Abschn. 7.3 bedeutet, dass Uhren und damit die Zeit in einem Schwarzschild-Feld langsamer verlaufen. Das gleiche Ergebnis haben wir in Abschn. 13.3 für ein schwaches, statisches Gravitationsfeld hergeleitet. Dort war gtt = −(1 + 2φ), was mit φ=−
GM r
im Newton’schen Grenzfall ebenfalls zu dτ =
1−
2G M r
dt
führt. Um die nach Abschn. 7.3 erwartete Rotverschiebung von Licht in der SchwarzschildRaumzeit zu berechnen, müssen wir die Zeitunterschiede an zwei verschiedenen Punkten im Gravitationsfeld vergleichen. Dazu stellen wir uns vor, dass wir an einer Stelle r1 Licht einer bestimmten Frequenz f 1 aussenden, das an einer zweiten Stelle r2 > r1 mit einer dort gemessenen Frequenz f 2 empfangen wird. In Abb. 15.10 sind die Emissionen von zwei aufeinander folgenden Lichtwellen dargestellt. Die gestrichelten Linien kann man als Wellenberge der beiden Lichtwellen interpretieren. Als Koordinatenzeitintervall t1 definieren wir die Zeitspanne zwischen dem Aussenden zweier aufeinanderfolgender Wellenberge. Wegen der Zeitunabhängigkeit der Schwarzschild-Metrik folgt, dass beide Wellenberge die gleiche Zeit brauchen, um von r1
15.5
Gravitative Rotverschiebung in der Schwarzschild-Raumzeit
427
Abb. 15.10 Emission von Lichtwellen in der Schwarzschild-Raumzeit
nach r2 zu kommen. Das heißt, das Zeitintervall für den Empfang bei r2 ist ebenfalls t1 groß, also t1 = t1(2) − t1(1) = t2 = t2(2) − t2(1) .
Aufgabe 15.6 Zeigen Sie, dass das Verhältnis der beiden Frequenzen an den Orten r1 und r2 2G M 1− r1 f2 (15.41) = f1 2G M 1− r2
beträgt. Lösung Für den Beobachter am Ort r1 folgt (2) τ1 =
t1
dt
(1)
t1
und analog
τ2 =
2G M 1− r1
2G M 1− r2
=
2G M 1− r1
t2 =
2G M 1− r2
t1
t1 .
Wenn wir annehmen, dass am Ort r1 n Signale pro Eigenzeitintervall emittiert und am Ort r2 ebenfalls n Signale pro Eigenzeitintervall empfangen werden, so ergeben sich die
428
15 Klassische Tests der Allgemeinen Relativitätstheorie
Frequenzen f1 =
n n , f2 = τ1 τ2
und damit
2G M 1− r1
f2 = f1
2G M 1− r2
.
Wir schätzen Zähler und Nenner jeweils mit dem Differenzial ab. Für den Zähler folgt 2G M GM 1− ≈1− r1 r1 und für den Nenner 1
1− also
≈1+
2G M
GM r2
,
r2
GM 1 GM 1 f2 ≈ 1− − 1+ ≈ 1 − GM , f1 r1 r2 r1 r2
wobei wir den quadratischen Term
G2 M 2 r2 r1
(15.42)
vernachlässigt haben. Da
r1 < r2 ⇔
1 1 > r1 r2
ist, folgt f2 < 1 ⇔ f1 > f2 , f1 d. h., der Beobachter am Ort r2 empfängt das Licht rotverschoben. Wir wollen die Rotverschiebung im System Sonne-Erde konkret ausrechnen und betrachten ein Photon, das von der Sonnenoberfläche r1 = 6,96 · 108 m mit einer Frequenz f 1 ausgesandt wird. Da die Entfernung Sonne-Erde r2 = 1,5 · 1011 m beträgt und somit r2 r1 ist, folgt mit (15.42) 1 f2 ≈ 1 − GM . f1 r1 Nun ist der Schwarzschild-Radius der Sonne 2G M = 2950 m groß, und wir erhalten
15.5
Gravitative Rotverschiebung in der Schwarzschild-Raumzeit
429
GM 1475 f2 ≈1− =1− = 1 − 2,12 · 10−6 . f1 r1 6,96 · 108 Bezeichnet f = f 2 − f 1 die Differenz zwischen den beiden Frequenzen, so folgt für die relative Frequenzänderung f = −2,12 · 10−6 . f Das ist die aus der Schwarzschild-Metrik folgende Vorhersage für die Rotverschiebung des Sonnenlichts. Der Effekt ist ziemlich klein, und seine Bestimmung wird durch die Relativgeschwindigkeit zwischen Erde und Sonne, durch die thermische Bewegung der Atome und die Konvektionsströme in der Sonnenatmosphäre erschwert. Dennoch konnte in Experimenten eine gute Übereinstimmung der gemessenen Werte mit den theoretischen Vorhersagen in der Größenordnung f ex p = f theor · (1,01 ± 0, 06) nachgewiesen werden; für eine ausführliche Beschreibung der Experimente siehe [29]. Bewegte Uhren und das Global Positioning System (GPS) Bislang haben wir die Zeitunterschiede zwischen ruhenden Uhren in einem Gravitationsfeld betrachtet. Für bewegte Uhren ergibt sich die Relation zwischen der Eigen- und Koordinatenzeit ebenso aus (15.40) dτ = −gμν d x μ d x ν , wobei die Relativgeschwindigkeiten der Uhren berücksichtigt werden müssen. Als Beispiel nehmen wir eine Uhr, die auf der Erdoberfläche ruht, und eine weitere, die die Erde in einem Satelliten umkreist. Vergleicht man beide Uhren, so erkennt man zwei gegenläufige Effekte. Zum einen geht die Uhr im Satelliten schneller, da das Gravitationsfeld der Erde dort schwächer ist. Zum anderen geht sie langsamer, weil der Satellit sich relativ zur Erde bewegt. Moderne Satellitensysteme wie z. B. das Global Positioning System müssen beide Effekte berücksichtigen. Wir wollen (allerdings unter deutlich vereinfachten Annahmen, siehe den Artikel „Das GPS“ in [62]) die Gesamtzeitunterschiede für einen fiktiven Satelliten näherungsweise berechnen. Dazu nehmen wir zunächst an, dass die Erde ein momentanes Inertialsystem ist, d. h., die Bahngeschwindigkeit der Erde um die Sonne und auch die Drehung der Erde wird vernachlässigt. Der Satellit inklusive Uhr möge sich in einer Höhe von ca. 20.000 km und mit einer Geschwindigkeit v = 3,87 km/s relativ zur Uhr auf der Erde bewegen. Um die Zeitunterschiede aufgrund der Relativbewegung der Uhren zu berechnen, di benutzen wir Minkowski-Koordinaten, setzen also gμν = ημν , dann folgt mit = vi dt
μ ν dx dx dt 2 = 1 − δi j v i v j dt dτ = −gμν d x μ d x ν = −ημν dt dt
430
15 Klassische Tests der Allgemeinen Relativitätstheorie
=
1 − v 2 dt,
also die bekannte Formel der Zeitdilatation in der SRT. Wir setzen die Zahlen ein und erhalten in SI-Einheiten für den relativen Zeitunterschied pro Sekunde v2 1 − dt − dt dτ − dt v2 c2 = = 1 − 2 − 1 = −8,3 · 10−11 . dt dt c Dieser negative Zeitunterschied summiert sich in einem Tag auf ca. 7 Mikrosekunden −7 · 10−6 . Für die Berechnung des gravitativen Effekts nutzen wir die oben hergeleitete Formel 2G M dt dτ = 1 − r und berechnen wieder in SI-Einheiten die Eigenzeit für die Uhr an der Erdoberfläche mit dem Erdradius r E = 6,378 · 106 m, der Erdmasse M E = 5,97 · 1024 kg und der Gravitationskonstanten G = 6,67 · 10−11 m 3 kg −1 s −2 2G M E 2 · 6,67 · 10−11 · 5,97 · 1024 dτ Er de = 1 − 2 dt = 1 − dt. 2 c rE 3 · 108 6,378 · 106 Für den Satelliten gilt entsprechend 2G M E dt 1− 2 c (r E + 20.000.000) 2 · 6,67 · 10−11 · 5,97 · 1024 dt. = 1 − 2 3 · 108 (6,378 + 20) 106
dτ Satellit =
Für die relative Differenz der beiden Uhren pro Sekunde folgt daraus dτ Satellit − dτ Er de ≈ 52,7 · 10−11 , dτ Er de und pro Tag ergibt sich eine positive Abweichung von etwa 45 Mikrosekunden. Berücksichtigt man beide Effekte, so laufen die Uhren in den Satelliten pro Tag um ca. 38 Mikrosekunden schneller. Da die Satelliten mit präzisen Atomuhren ausgestattet sind, können diese kleinen Zeitdifferenzen gemessen und korrigiert werden. Diese Korrektur ist notwendig, da sonst die Genauigkeit der Positionsangabe (10 m) nicht mehr gewährleistet werden kann.
Gravitationswellen
16
In diesem Kapitel stellen wir dar, dass sich schnell verändernde relativistische Massen die Quellen von Verwerfungen der Raumzeit sein können. Diese Verwerfungen werden Gravitationswellen genannt und breiten sich ähnlich wie elektromagnetische Wellen mit Lichtgeschwindigkeit aus. Es gibt viele wichtige Quellen für Gravitationswellen im Universum, z. B. binäre Sternensysteme, Supernovaexplosionen, Kollaps eines Schwarzen Loches sowie der Urknall selbst. Wir nehmen an, dass ein Beobachter, der Gravitationswellen messen will, weit entfernt von deren Quelle und das Gravitationsfeld um ihn herum schwach, aber nicht stationär ist.
16.1
Einstein-Gleichungen für schwache Gravitationsfelder
In den Abschn. 13.3 und 13.5 haben wir den Newton’schen Grenzfall der EinsteinGleichungen behandelt und dort unterstellt, dass das Gravitationsfeld nicht nur schwach, sondern auch statisch sein soll, und dass sich die Teilchen langsam bewegen. Hier soll das Gravitationsfeld ebenfalls schwach sein, allerdings darf sich das Gravitationsfeld zeitlich verändern, und es gibt keine Einschränkungen für die Bewegung der Teilchen. Bei einem schwachen Gravitationsfeld ist die Raumzeit „beinahe flach“, d. h., sie ist definiert durch eine Lorentz-Mannigfaltigkeit, in der Koordinaten existieren, sodass die Metrikkomponenten die Form gμν = ημν + h μν , h μν 1 (16.1) haben, wobei h μν eine Störfunktion bezeichne, deren Ableitungen auch klein sein mögen, siehe Abschn. 13.3. Wir stellen zwei grundsätzliche Typen von Koordinatentransformationen vor, die die Form der Metrik (16.1) unverändert lassen.
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_16
431
432
16 Gravitationswellen
1. Hintergrund-Lorentz-Transformationen Für schwache Gravitationsfelder wird eine Hintergrund-Lorentz-Transformation durch
x μ = μμ x μ definiert, wobei ν μ eine (konstante) Lorentz-Matrix (1.36) wie in der Speziellen Relativitätstheorie darstellt. Natürlich befinden wir uns nicht in der SRT, d. h., die HintergrundLorentz-Transformationen bilden nur eine Klasse aller möglichen Transformationen. Wenn wir die Metrik transformieren, so erhalten wir μ μ
gμ ν =
ν ν gμν =
μ μ
μ μ
ν ν ημν +
ν ν h μν .
Nun ist ν μ eine Lorentz-Matrix, d. h., es gilt mit (1.35) μ μ
ν ν ημν = ημ ν ,
und es ergibt sich gμ ν = ημ ν + h μ ν mit
μ μ
h μ ν =
ν ν h μν .
Unter einer Hintergrund-Lorentz-Transformation transformiert sich h μν wie ein LorentzTensor, was aber die allgemeine Tensoreigenschaft von h μν (d. h. Invarianz unter beliebigen Koordinatentransformationen) nicht garantiert. Wir können demnach ein schwaches Gravitationsfeld als eine flache Raumzeit mit einem Lorentz-invarianten symmetrischen „Tensor“ h μν interpretieren. Dann werden alle physikalischen Felder wie z. B. der Riemann-Tensor durch Terme von h μν definiert und sehen wie Felder in einer flachen Raumzeit aus. Eine solche Betrachtungsweise erleichtert viele der folgenden Berechnungen, darf aber nicht dazu führen, dass wir vergessen, dass die reale Raumzeit gekrümmt ist. 2. Eichtransformationen Wir betrachten die Koordinatentransformation x μ → x˜ μ := x μ + ξ μ
(16.2)
mit einer Funktion ξ μ , die von den Koordinaten x α abhängen darf und wie h μν die Bedingung ∂ν ξ μ 1 erfüllt. Wie in der Elektrodynamik (siehe (5.22)) nennt man (16.2) eine Eichtransformation. Für die Transformationsmatrix folgt dann ∂ (x μ + ξ μ ) ∂ x˜ μ = = δνμ + ∂ν ξ μ . ν ∂x ∂xν
16.1
Einstein-Gleichungen für schwache Gravitationsfelder
433
Aufgabe 16.1 Zeigen Sie, dass für die Umkehrmatrix in linearer Näherung
∂xμ = δνμ − ∂ν ξ μ ∂ x˜ ν gilt. Lösung Zur Berechnung der Inversen benutzen wir eine ähnliche Vorgehensweise wie in (13.26) und berechnen in linearer Ordnung in ∂ν ξ μ
δρμ − ∂ρ ξ μ
δνρ + ∂ν ξ ρ = δρμ δνρ + δρμ ∂ν ξ ρ − δνρ ∂ρ ξ μ − ∂ρ ξ μ ∂ν ξ ρ = δνμ + ∂ν ξ μ − ∂ν ξ μ = δνμ ,
≈0
woraus für die Umkehrmatrix in linearer Näherung ∂xμ = δνμ − ∂ν ξ μ ∂ x˜ ν
folgt. Für die transformierte Metrik folgt ebenfalls in linearer Näherung g˜ μν =
∂xρ ∂xσ g = δμρ − ∂μ ξ ρ δνσ − ∂ν ξ σ gρσ μ ∂ x˜ ν ρσ ∂ x ˜ ⎞ ⎛
⎟ ⎜ = ⎝δμρ δνσ − δμρ ∂ν ξ σ − δνσ ∂μ ξ ρ + ∂μ ξ ρ ∂ν ξ σ ⎠ gρσ σ
ρ
≈0
= gμν − ∂ν ξ gμσ − ∂μ ξ gρν . Wir setzen jetzt (16.1) in die letzte Gleichung ein und erhalten mit h μν 1 und |∂ν ξ μ | 1: ⎞ ⎛ ⎞ ⎛ ⎟ ⎜ ⎟ ⎜ g˜ μν = ημν + h μν − ⎝∂ν ξ σ ημσ + ∂ν ξ σ h μσ ⎠ − ⎝∂μ ξ ρ ηρν + ∂μ ξ ρ h ρν ⎠ ≈0
≈0
= ημν + h μν − ∂ν ξμ − ∂μ ξν mit ξμ = ημσ ξ σ . Wir redefinieren h μν → h˜ μν = h μν − ∂ν ξμ − ∂μ ξν ,
(16.3)
434
16 Gravitationswellen
dann gilt weiterhin h˜ μν 1, d. h., wir befinden uns nach der Transformation wieder in einem schwachen Gravitationsfeld. Einstein-Gleichungen Die Christoffel-Symbole nehmen mit (11.47) in einem schwachen Gravitationsfeld in linearer Näherung die einfache Form τ μλ =
1 τν η ∂λ h μν + ∂μ h λν − ∂ν h μλ 2
(16.4)
an, da die partiellen Ableitungen von ημν verschwinden und die Produkte der Störfunktionen h μν entfallen. Wir wollen den Riemann-Tensor in einem schwachen Gravitationsfeld berechnen und können dazu die Formel (12.14) benutzen, da die Produkte der ChristoffelSymbole in (12.9): μ
μ
μ
μ τ μ τ R ρνλ = ∂ν λρ − ∂λ νρ + λρ ντ − νρ λτ
in linearer Näherung verschwinden. Mit Formel (12.14) folgt dann Rμρνλ =
1 ∂ρ ∂ν h λμ + ∂μ ∂λ h ρν − ∂μ ∂ν h ρλ − ∂ρ ∂λ h νμ . 2
Das gleiche Ergebnis erhalten wir auch, wenn wir h μν durch h μν −∂ν ξμ −∂μ ξν ersetzen, da sich nach dem Satz von Schwarz alle gemischten Ableitungen der ξμ gegenseitig aufheben. Wir definieren einige Größen durch h μν := ημρ h ρν , h μν := ηνρ h μρ , h := h μμ und können damit den ebenfalls eichinvarianten Ricci-Tensor, den wir schon in (13.29) hergeleitet haben, folgendermaßen darstellen: ηλσ ∂λ ∂μ h νσ + ∂ν ∂σ h μλ − ∂λ ∂σ h μν − ∂ν ∂μ h λσ 2 1 σ = ∂ ∂μ h νσ + ∂ν ∂ λ h μλ − ∂λ ∂ λ h μν − ∂ν ∂μ h 2 1 = ∂μ ∂ λ h νλ + ∂ν ∂ λ h μλ − h μν − ∂ν ∂μ h σ ↔λ 2
Rμν =
(16.5)
mit dem D’Alembert-Operator = ∂μ ∂ μ , siehe (5.11). Der Krümmungsskalar in linearer Ordnung ergibt sich daraus zu 1 μν η ∂μ ∂ λ h νλ + ∂ν ∂ λ h μλ − h μν − ∂ν ∂μ h 2 1 ν λ = ∂ ∂ h νλ + ∂ μ ∂ λ h μλ − h μμ − ∂ν ∂ ν h 2 = ∂ μ ∂ λ h μλ − h,
R=
(16.6)
16.1
Einstein-Gleichungen für schwache Gravitationsfelder
435
und wir erhalten für den Einstein-Tensor 1 ∂μ ∂ λ h νλ + ∂ν ∂ λ h μλ − h μν − ∂ν ∂μ h − ημν ∂ ρ ∂ λ h ρλ + ημν h , 2 (16.7) also einen etwas unübersichtlichen Ausdruck. Diesen wollen wir vereinfachen, indem wir neue Variablen durch 1 (16.8) Hμν := h μν − ημν h 2 definieren. Diese erfüllen G μν =
H := ημν Hμν = ημν h μν −
1 μν 4 η ημν h = h − h = −h 2 2
sowie
1 ημν H (16.9) 2 und werden deshalb auch inverse Spur (im Englischen: trace reverse) von h μν genannt. h μν = Hμν −
Aufgabe 16.2 Zeigen Sie, dass sich durch Einsetzen von (16.9) in (16.5) der Ricci-Tensor, der Krümmungsskalar und der Einstein-Tensor als 1 1 λ λ ∂μ ∂ Hνλ + ∂ν ∂ Hμλ − Hμν + ημν H , Rμν = 2 2 1 R = ∂ μ ∂ λ Hμλ + H 2 1 ∂μ ∂ λ Hνλ + ∂ν ∂ λ Hμλ − Hμν + ημν ∂ ρ ∂ σ Hρσ (16.10) G μν = 2
schreiben lassen. Lösung Wir setzen (16.9) in (16.5) ein und erhalten für den Ricci-Tensor 1 2 1 = 2 1 = 2
Rμν =
∂μ ∂ λ h νλ + ∂ν ∂ λ h μλ − h μν − ∂ν ∂μ h 1 1 1 ∂μ ∂ λ Hνλ − ηνλ H + ∂ν ∂ λ Hμλ − ημλ H − Hμν − ημν H + ∂ν ∂μ H 2 2 2 1 ∂μ ∂ λ Hνλ + ∂ν ∂ λ Hμλ − Hμν + ημν H , 2
da sich in der vorletzten Zeile der zweite, vierte und letzte Term aufheben. Für den Krümmungsskalar ergibt sich daraus
436
16 Gravitationswellen
1 μν 1 λ λ ∂μ ∂ Hνλ + ∂ν ∂ Hμλ − Hμν + ημν H R= η 2 2 1 4 ν λ μ λ = ∂ ∂ Hνλ + ∂ ∂ Hμλ − H + H 2 2 1 = ∂ μ ∂ λ Hμλ + H , 2 und der Einstein-Tensor ist dann G μν =
1 ∂μ ∂ λ Hνλ + ∂ν ∂ λ Hμλ − Hμν + ημν ∂ ρ ∂ σ Hρσ . 2
Der Einstein-Tensor hat sich etwas vereinfacht, ist aber immer noch komplex. Die zu (16.10) korrespondierenden Einstein-Gleichungen ergeben sich zu Hμν − ∂μ ∂ λ Hνλ − ∂ν ∂ λ Hμλ − ημν ∂ ρ ∂ σ Hρσ = −16π GTμν .
(16.11)
Die linke Seite von (16.11) enthält drei Summanden, die jeweils einen Term der Form ∂ λ Hμλ beinhalten, und vereinfacht sich beträchtlich, wenn wir verlangen, dass ∂ λ Hμλ = 0
(16.12)
gilt. Das sind vier Gleichungen, und wir werden sehen, dass wir die vier freien Eichfunktionen ξ μ so wählen können, dass (16.12) erfüllt wird. Die Eichung (16.12) nennt man in Analogie zur Elektrodynamik (5.13) Lorenz-Eichung, aber auch die Bezeichnungen Einstein- oder de-Donder-Eichung sind üblich.
Aufgabe 16.3 Zeigen Sie mit (16.8) und der Eichtransformation (16.3), dass sich Hμν gemäß
Hμν → H˜ μν = Hμν − ∂ν ξμ − ∂μ ξν + ημν ∂ ρ ξρ transformiert. Lösung Es gilt: 1 1 Hμν → H˜ μν = h˜ μν − ημν h˜ = h μν − ∂ν ξμ − ∂μ ξν − ημν ηρσ h˜ ρσ 2 2 1 ρσ = h μν − ∂ν ξμ − ∂μ ξν − ημν η h ρσ − ∂σ ξρ − ∂ρ ξσ 2
(16.13)
16.2
Ausbreitung von Gravitationswellen
437
1 1 ημν h − ∂ν ξμ − ∂μ ξν + ημν ∂ ρ ξρ + ∂ σ ξσ 2 2 − ∂ν ξμ − ∂μ ξν + ημν ∂ ρ ξρ
= h μν − = Hμν
Wir berechnen die Divergenz und erhalten ∂ ν H˜ μν = ∂ ν Hμν − ∂ ν ∂ν ξμ − ∂μ ∂ ν ξν + ημν ∂ ν ∂ ρ ξρ = ∂ ν Hμν − ∂ ν ∂ν ξμ − ∂μ ∂ ν ξν + ∂μ ∂ ρ ξρ = ∂ ν Hμν − ∂ ν ∂ν ξμ . Wenn wir also wollen, dass ∂ ν H˜ μν = 0 gilt, so müssen die Eichfunktionen ξμ durch die Gleichung ξμ = ∂ ν ∂ν ξμ = ∂ ν Hμν (16.14) bestimmt werden. Die Gl. (16.14) stellt ein System von vier inhomogenen Wellengleichungen dar, deren Lösungen schon bei schwachen Voraussetzungen an die Störfunktion auf der rechten Seite existieren, siehe z. B. [36]. Die Eichfunktionen ξμ sind nicht eindeutig; wir können ganz analog zur Elektrodynamik, siehe (5.22), beliebige Funktionen χμ , die χμ = 0
(16.15)
erfüllen, dazu addieren, und es gilt dann ξμ + χμ = ∂ ν Hμν , die Lorenz-Eichung bleibt also erhalten. In der Lorenz-Eichung ∂ ν Hμν = 0 vereinfachen sich die Einstein-Gleichungen zu Hμν = −16π GTμν .
(16.16)
Sie werden dann lineare (wegen der Linearität in Hμν ) oder schwache Einstein-Gleichungen genannt.
16.2
Ausbreitung von Gravitationswellen
Wir betrachten in diesem Abschnitt Gravitationswellen, die sich frei durch den leeren Raum ausbreiten, untersuchen hier aber nicht, ob oder wie die Gravitationswellen durch Veränderungen eines Objektes in einem gravitativen Feld generiert werden. Unser Vorgehen unterstellt, dass wir ein schwaches Gravitationsfeld vorliegen haben und uns weit entfernt von Quellen befinden, wo der Energie-Impuls-Tensor verschwindet, d. h., wir lösen die linearen Einstein-Gleichungen im Vakuum:
438
16 Gravitationswellen
Hμν
∂ 2 = − 2 + ∇ Hμν = 0 ∂t
(16.17)
Ansatz mit ebener Welle Für diese homogene Wellengleichung wählen wir den üblichen Lösungsansatz einer ebenen Welle (siehe z. B. [1]): Hμν (t, x, y, z) = Aμν e
ikρ x ρ
= Aμν e
x −ωt i k·
,
(16.18)
wobei Aμν konstante Tensorkomponenten und kρ = −ω, k x , k y , k z die konstanten Komponenten einer Einsform sind. Solch eine ebene Welle bewegt sich mit Phasengeschwindig keit v = ω/ k in Richtung von k (in physikalischen Anwendungen beschränkt man sich natürlich auf den Realteil von (16.18)). Die allgemeine Lösung von (16.17) ist eine Superposition von Wellen der Form (16.18) mit unterschiedlichen Werten von ω, unterschiedlichen Ausbreitungsrichtungen k und unterschiedlichen Amplituden Aμν , siehe z. B. [20]. Mit der linearen Einstein-Gleichung (16.17) ergibt sich ρ ρ ρ 0 = Hμν = ηαβ ∂β ∂α Aμν eikρ x = ηαβ ∂β ikα Aμν eikρ x = −Aμν ηαβ kα kβ eikρ x , woraus
ηαβ kα kβ = k α kα = 0
folgt. Aus der Lorenz-Eichung (16.12) erhalten wir ρ ρ 0 = ∂ ν Aμν eikρ x = ik ν Aμν eikρ x ⇒ k ν Aμν = 0 sowie mit der Symmetrie von Hμν
Aμν = Aνμ .
(16.19)
(16.20)
(16.21)
Aus Gl. (16.19) folgt 0 = k α kα = ηαβ kα kβ = (−ω)2 ηtt + k x2 η x x + k 2y η yy + k z2 η zz 2 ⇒ ω2 = k ⇒ v = ω/ k = 1, d. h., eine ebene Gravitationswelle bewegt sich wie eine elektromagnetische Welle mit Lichtgeschwindigkeit (v = c = 1). Spurfreie-Transversale-Eichung Wir nutzen nun die Freiheit, dass wir die Lorenz-Eichung um eine weitere Eichfunktion χμ := Bμ eikρ x
ρ
16.2
Ausbreitung von Gravitationswellen
439
additiv erweitern können, wobei die kρ wie in (16.18) und die Bμ konstant gewählt werden. Die Voraussetzung (16.15) ist mit (16.19) wegen ρ
∂ α ∂α χμ = −k α kα Bμ eikρ x = 0 erfüllt. Wir definieren
ρ H˜ μν = A˜ μν eikρ x ,
dann folgt mit (16.13): Hμν → H˜ μν = Hμν − ∂ν χμ − ∂μ χν + ημν ∂ ρ χρ ρ
ρ
ρ
= Aμν eikρ x − ∂ν Bμ eikρ x − ∂μ Bν eikρ x + ημν ∂ α Bα eikρ x = Aμν eikρ
xρ
− ikν Bμ eikρ
xρ
− ikμ Bν eikρ
xρ
ρ
+ iημν k α Bα eikρ x
ρ
Wenn wir die Terme mit der Exponentialfunktion ausklammern, erhalten wir A˜ μν = Aμν − ikν Bμ − ikμ Bν + iημν k α Bα .
(16.22)
Aufgabe 16.4 Zeigen Sie, dass A˜ μν ebenfalls die Orthogonalitätsrelation (16.20)
k ν A˜ μν = 0
(16.23)
erfüllt. Lösung Es gilt k ν A˜ μν = k ν Aμν −i k ν kν Bμ − ik ν kμ Bν + iημν k ν k α Bα =0
ν
=0
= −ikμ k Bν + ikμ k α Bα = 0. Die Komponenten Bμ sind beliebig wählbar, und wir wollen sie spezifizieren, um neben (16.23) weitere Restriktionen für A˜ μν zu erhalten. Es folgt aus (16.22): μν ˜ μ μν μν μν α A˜ μ μ = η Aμν = Aμ − iη kν Bμ − iη kμ Bν + iη ημν k Bα μ ν α = Aμ μ − ik Bμ − ik Bν + 4ik Bα μ = Aμ μ + 2ik Bμ
Wir wählen k μ Bμ =
i μ A 2 μ
440
16 Gravitationswellen
und erhalten die Restriktion
A˜ μ μ = 0.
(16.24)
Sei nun U = U ν eine konstante Vierergeschwindigkeit, d. h. ein konstanter zeitartiger Einheitsvektor, dann definieren wir als weitere Bedingungen A˜ μν U ν = 0.
(16.25)
Auf den ersten Blick sieht es so aus, als ob diese Festlegung vier (für jeden Wert von μ) Freiheitsgrade benötigt, es gilt aber ganz analog zu (16.23), dass für jede Wahl von Bμ die Beziehung k μ A˜ μν U ν = 0 gilt, d. h., es werden nur drei Freiheitsgrade benötigt. Wir schreiben ab hier die transformierten Größen wieder ohne die Tilde˜. Die beiden Bedingungen (16.24) und (16.25) nennt man Spurfreie-Transversale (ST)-Eichung, und es gilt nach (16.9) ST ST h μν = Hμν −
wegen
1 ST ημν H ST = Hμν 2
(16.26)
μ ikρ x ρ H ST = H ST = Aμ = 0, μ e μ =0
d. h., in der ST-Eichung gibt es keinen Unterschied zwischen den Störfunktionen h μν und den Inverse-Spur-Funktionen Hμν . Wir wollen jetzt zeigen, dass in der ST-Eichung für die Komponenten Aμν von den ursprünglichen zehn (wegen der Symmetrie) nur noch zwei Freiheitsgrade übrig bleiben. Dazu wählen wir in (16.25) den Vektor U = et = (1, 0, 0, 0) und erhalten Aμν U ν = Aμt = Atμ = 0.
(16.27)
In diesem Koordinatensystem seien die Achsen so orientiert, dass sich die Welle in zRichtung ausbreitet, d. h. k ν = (ω, 0, 0, ω), (16.28) woraus in der Lorenz-Eichung nach (16.20) 0 = k ν Aμν = ω Aμt +ω Aμz ⇒ Aμz = A zμ = 0 =0
folgt. Insgesamt sind also nur A x x , A yy , und A× := A x y = A yx von null verschieden. Aus der Spurfreiheit von Aμν (16.24) folgt noch
16.3
Beobachtung von Gravitationswellen
441
A x x = −A yy =: A+ , sodass sich Aμν in folgender Matrixform darstellen lässt: ⎛
0 ⎜0 Aμν = ⎜ ⎝0 0
0 0 A+ A× A× −A+ 0 0
⎛ ⎞ 00 0 ⎜ ⎟ 01 0⎟ = A+ ⎜ ⎝0 0 0⎠ 00 0
0 0 −1 0
⎞ ⎛ 0 00 ⎟ ⎜ 0⎟ 00 + A× ⎜ ⎝0 1 0⎠ 0 00
0 1 0 0
⎞ 0 0⎟ ⎟ 0⎠ 0
(16.29)
mit den beiden voneinander unabhängigen Konstanten A+ und A× . Eine ebene Gravitationswelle in der ST-Eichung besteht also aus einer Linearkombination zweier unterschiedlicher Lösungen, die Polarisationen der Welle (in Analogie zu den zwei linearen Polarisationen bei elektromagnetischen Wellen) genannt werden. Den Teil, der proportional zu A+ ist, nennt man + Polarisation, den zweiten × Polarisation. Eine völlig analoge Überlegung führt zu ⎛
0 ⎜0 Aμν = ⎜ ⎝0 0
0 0 0 0
⎞ 0 0 0 0 ⎟ ⎟ A+ A× ⎠ A× −A+
(16.30)
für eine Welle, die sich in x-Richtung ausbreitet.
16.3
Beobachtung von Gravitationswellen
Wenn ein Wellenpaket sich in z-Richtung ausbreitet, so können wir alle ebenen Wellen so ausrichten, dass sie die Form (16.29) annehmen, d. h., jede Welle hat nur die zwei unabST ST ST hängigen HxST x = h x x und Hx y = h x y Komponenten. Wir betrachten ein Teilchen, das in einer sonst wellenfreien Region von einer Gravitationswelle getroffen wird, und wählen ein Koordinatensystem, in dem das Teilchen ruht, und die zu diesem Koordinatensystem korrespondierende ST-Eichung. Der Vektor U aus (16.25) bezeichne die Vierergeschwindigkeit im Ruhesystem des Teilchens U = (1, 0, 0, 0). Für ein frei fallendes Teilchen gilt die Geodätengleichung (11.59), und es folgt mit (16.4): 0=
1 dU μ dU μ dU μ μ μ ST ST + νρ + tt = + ημν ∂t h tν U νU ρ = + ∂t h tν − ∂ν h ttST , dτ dτ dτ 2 =0
ST verschwinden. Beim Durchgang der Welle ist die Viererbeschleunigung des Teilda alle h tμ chens gleich null, d. h., das Teilchen bleibt weiterhin in Ruhe, als ob die Gravitationswelle keinerlei Einfluss auf das Teilchen gehabt hätte. Wir müssen aber vorsichtig mit einer solchen
442
16 Gravitationswellen
Interpretation sein, da wir ja ein mitbewegtes Koordinatensystem gewählt haben, das die Koordinaten des Teilchens unverändert lässt. Das Ergebnis hat also keine geometrisch invariante Bedeutung. Um eine bessere Einschätzung der Effekte einer Gravitationswelle zu erhalten, betrachten wir bei t = 0 zwei räumlich infinitesimal getrennte Teilchen, eines im Ursprung und das andere bei x = L ∗ , y = z = 0. Dann folgt für die Distanz L (t) zwischen diesen Teilchen
L∗
L (t) =
dx
√
1 + h xSTx (t, x = 0) (t, x = 0) .
gx x = L ∗
0
1 ≈ L ∗ 1 + h xSTx 2
(16.31)
Wir definieren die Längenänderung δL durch δL := L (t) − L ∗ und erhalten aus (16.31) für die relative Längenänderung δL 1 = h xSTx (t, x = 0), ∗ L 2
(16.32)
siehe auch [31]. Die Störfunktion h xSTx ist zeitabhängig, d. h., der invariante Eigenabstand der Teilchen ändert sich mit der Zeit. Um das genauer zu untersuchen, schauen wir uns zunächst an, wie eine + polarisierte Gravitationswelle auf eine Menge von ringförmig in der (x, y)-Ebene angeordneten Teilchen wirkt. Wir setzen mit (16.28) ⎛
ST h μν
0 ⎜0 =⎜ ⎝0 0
⎞ 0 0 0 A+ 0 0 ⎟ ⎟ sin (ω (z − t)), 0 −A+ 0 ⎠ 0 0 0
d. h., wir betrachten nur den Realteil der Störfunktion h μν in z-Richtung. Da wir den Teilchenring in der (x, y)-Ebene verankert haben, setzen wir z = 0, und die Störfunktion vereinfacht sich zu ⎞ ⎛ 0 0 0 0 ⎜ 0 A+ 0 0 ⎟ ST ⎟ =⎜ h μν ⎝ 0 0 −A+ 0 ⎠ sin (−ωt). 0 0
0
0
Das räumliche Linienelement des schwachen Gravitationsfeldes ergibt sich daraus mit (16.1) und wegen z = 0 zu: ds 2 = (1 + A+ sin (−ωt)) d x 2 + (1 − A+ sin (−ωt)) dy 2
(16.33)
16.3
Beobachtung von Gravitationswellen
443
Die Abstände zwischen einem Teilchen im Mittelpunkt des Ringes und den Teilchen auf dem Ring ändern sich im Zeitablauf gemäß der Metrik (16.33). Um diese zu berechnen, führen wir ein neues Koordinatensystem ein: A+ A+ A+ sin (−ωt) x = 1 + sin ωt x, Y := 1 − sin ωt y X := 1 − 2 2 2 Dann folgt in erster Ordnung in A+ ⎛ ⎛
⎞⎞
⎜ ⎜ A2+ ⎟⎟ 2 2 2 ⎜ ⎟⎟ d X2 = ⎜ sin ωt + 1 + A + ⎝ ⎝ 4 sin ωt ⎠⎠ d x = (1 + A+ sin ωt) d x ⎛
⎛
≈0
⎞⎞
⎜ ⎜ A2+ ⎟⎟ 2 2 2 ⎜ ⎟⎟ dY 2 = ⎜ sin ωt + 1 − A + ⎝ ⎝ 4 sin ωt ⎠⎠ dy = (1 − A+ sin ωt) dy , ≈0
also ist das räumliche Linienelement (16.33) in erster Ordnung das der euklidischen (X , Y )Ebene: ds 2 = d X 2 + dY 2 Abb. 16.1 veranschaulicht das zeitliche Verhalten der Positionen der acht Teilchen auf dem Ring, der senkrecht zur Ausbreitungsrichtung der Gravitationswelle steht. Das allgemeine Muster ist eine Ellipse, deren Achsen periodisch in der Zeit oszillieren. Im ersten Viertel einer Periode wird der Ring kontinuierlich in Y -Richtung gequetscht und in X -Richtung auseinandergezogen. Im zweiten Viertel breitet sich die Y -Richtung aus und die X -Richtung zieht sich zusammen, bis wieder der Ring entsteht. Ein Viertel weiter geht es umgekehrt: Die Y -Richtung wird auseinandergezogen, die X -Richtung gequetscht. Und schließlich entsteht im letzten Viertel wieder die Ringform, und alles geht von vorne los.
Abb. 16.1 Verformung beim Durchgang einer + Gravitationswelle
444
16 Gravitationswellen
Ein solches Muster ist charakteristisch für alle Gravitationswellen und kann als Erkennungsmerkmal einer solchen Welle genutzt werden. Wir behandeln jetzt den Fall einer × polarisierten Welle, d. h., wir setzen ⎛
ST h μν
0 ⎜0 =⎜ ⎝0 0
0 0 A× 0
0 A× 0 0
⎞ 0 0⎟ ⎟ sin (−ωt) 0⎠ 0
und erhalten für das räumliche Linienelement ds 2 = d x 2 + 2 A× sin (−ωt) d x d y + dy 2 .
(16.34)
Um zu sehen, welche Bewegungen der Teilchen auf dem Ring von einer solchen Gravitationswelle ausgelöst werden, ist es am einfachsten, die Achsen um 45◦ in der Ebene zu drehen. Die neuen Koordinaten sind dann: 1 x˜ = x cos 45◦ + y sin 45◦ = √ (x + y) 2 1 y˜ = −x sin 45◦ + y cos 45◦ = √ (−x + y), 2 und es folgt d x˜ 2 + d y˜ 2 = d x 2 + dy 2 , d x˜ 2 − d y˜ 2 = 2d x d y. Damit wird das Linienelement (16.34) zu ds 2 = d x˜ 2 + d y˜ 2 + A× sin (ω (z − t)) d x˜ 2 − d y˜ 2 = (1 + A+ sin (−ωt)) d x˜ 2 + (1 − A+ sin (−ωt)) d y˜ 2 , und wir erhalten wieder die Metrik (16.33). Die korrespondierende Abb. 16.2 zeigt ein analoges zeitliches Verhalten der acht Teilchen auf den Ring, die Ellipsen sind allerdings um 45◦ gedreht. Typische Amplituden von astrophysikalischen Quellen Eine Großzahl astrophysikalischer Quellen produziert Gravitationswellen mit einer Amplitude von A+ oder A× in einer (auf der Erde gemessenen) Größenordnung zwischen 10−18 und 10−22 m, wie wir später noch genauer sehen werden. Das heißt, dass freie Teilchen, die einen Abstand von R = 106 m = 1000 km voneinander haben, mit Amplituden der Größenordnung von 10−14 m (was ungefähr der Größe von zehn Atomkernen entspricht) vor und zurück oszillieren, wenn sie von einer Gravitationswelle mit Amplitude A+/× ≈ 10−20 getroffen werden. Das ist der Hauptgrund, warum die Detektion von Gravitationswellen
16.4
Erzeugung von Gravitationswellen
445
Abb. 16.2 Verformung beim Durchgang einer × Gravitationswelle
auf der Erde so schwierig ist. Die Auslenkungen in den Abb. 16.1 und 16.2 sind also stark überzeichnet. Wir werden uns in Abschn. 16.6 noch ausführlicher mit dem Nachweis von Gravitationswellen beschäftigen.
16.4
Erzeugung von Gravitationswellen
Wir unterstellen nun die Anwesenheit von Quellen, die durch den Energie-Impuls-Tensor Tμν = 0 charakterisiert werden, und wollen die zehn unabhängigen inhomogenen linearen Einstein-Gleichungen (16.16) Hμν = −16π GTμν näher untersuchen. Dazu verwenden wir die allgemeinen Lösungsformeln für die inhomogene Wellengleichung der Elektrodynamik (5.15) und erhalten in analoger Weise 1 3 Tμν tr , x 3 Tμν tr , x d x Hμν (t, x) = 16π G = 4G d x , (16.35) | | 4π x − x | x − x | wobei tr = t − x − x wieder die retardierte Zeit bezeichne. Im Folgenden betrachten wir einige Spezialfälle. Große-Distanz-Approximation Wenn wir uns weit entfernt von dem Quellgebiet und unterstellen, befinden dass die Aus dehnung der Quelle klein ist, gilt r := | x | x =: r , und wir können x − x durch r und somit (16.35) durch 1 d 3 x Tμν t − r , x (16.36) Hμν (t, x) −→ 4G r →∞ r
446
16 Gravitationswellen
annähern, siehe Abb. 16.3. Das Symbol −→ repräsentiert in diesem Kapitel die Aussage, r →∞ dass der nachfolgende Term in einem großen Abstand r zur Quelle zu berechnen ist; der Pfeil symbolisiert also keinen mathematischen Grenzwert. Wir unterstellen noch, dass ein schwaches Gravitationsfeld vorliegt und sich die Quellen nur langsam (im Vergleich zur Lichtgeschwindigkeit) bewegen. Der Energie-Impuls-Tensor wird dann durch die (Ruhe-)Massendichte ρ dominiert: T μν = ρU μ U ν , siehe [31], und erfüllt das Erhaltungsgesetz des flachen Raums: ∂ν T μν = 0
(16.37)
∂t ∂t T tt = −∂t ∂i T ti = −∂i ∂t T ti .
(16.38)
Für μ = 0 und i = 1, 2, 3 folgt daraus
Wenn wir in (16.37) μ = k setzen, ergibt sich ∂t T kt + ∂i T ki = 0 und daraus wegen ∂k ∂i T ki = −∂k ∂t T kt und (16.38) die Beziehung ∂t ∂t T tt = ∂k ∂i T ki .
(16.39)
Aufgabe 16.5 Zeigen Sie, dass mit zweimaliger partieller Integration aus (16.39)
d 3 x T mn = folgt.
Abb. 16.3 Große-Distanz-Approximation
1 ∂2 2 ∂t 2
d 3 x T tt x m x n
(16.40)
16.4
Erzeugung von Gravitationswellen
447
Lösung Wir multiplizieren die Gl. (16.39) mit x m x n und integrieren die rechte Seite partiell über den ganzen Raum d 3 x ∂k ∂i T ki x m x n = ∂i T ki x m x n − d 3 x ∂i T ki ∂k x m x n + x m ∂k x n 3 ki = − d x ∂i T δkm x n + δkn x m , da der Oberflächenterm für > Quellgebiet verschwindet. Nochmalige partielle Integration führt zu d 3 x ∂k ∂i T ki x m x n = d 3 x T ki δkm ∂i x n + δkn ∂i x m = d 3 x T ki δkm δin + δkn δim = d 3 x T mn + T nm = 2 d 3 x T mn . In unserem nichtrelativistischen Grenzfall ist T tt durch die Massendichte ρ bestimmt, und das Integral auf der rechten Seite von (16.40) definiert den sogenannten (symmetrischen) Quadrupolmoment-Tensor I mn (t) der Energiedichte ρ durch (16.41) I mn (t) := d 3 x ρ (t, x) x m x n , vergleiche diese Definition mit (5.19) in der Elektrodynamik. Aus (16.41) und (16.36) erhalten wir für die räumlichen Komponenten von H μν H mn (t, x) −→
r →∞
2G ¨ mn I (t − r ) , r
(16.42)
wobei ein Punkt eine Ableitung nach der Zeit t darstellt. Gravitative Strahlung eines Doppelsternsystems Wir wollen das Quadrupolmoment für den Fall eines binären Sternsystems konkret ausrechnen und betrachten zwei (Neutronen-)Sterne mit ungefähr der gleichen Masse M, die sich auf einer Kreisbahn mit Radius R um ihren Massenschwerpunkt bewegen, siehe Abb. 16.4. Wir unterstellen, dass sich die Sterne langsam genug bewegen, dass ihre (gleichgroße) Geschwindigkeit v nichtrelativistisch ist, und dass sie weit genug voneinander entfernt sind, sodass die Newton’sche Gravitationstheorie geeignet ist, um ihre Bewegungen zu beschreiben. Nach dem zweiten Newton’schen Gesetz gilt für die Zentripetalbeschleunigung eines Sterns, siehe [6],
448
16 Gravitationswellen
Abb. 16.4 Doppelsternsystem
GM (2R)2
=
v 2 v2 GM =R = Rω2 ⇒ ω2 = R R 4R 3
(16.43)
mit der Orbitfrequenz ω. Die letzte Gleichung erinnert an das dritte Kepler’sche Gesetz, siehe [6]. Zur Zeit t mögen sich die beiden Sterne an den Positionen (x, y, z) = (R cos ωt, R sin ωt, 0) und
(x, y, z) = (−R cos ωt, −R sin ωt, 0)
befinden. Für die Quadrupolmomente folgt dann I mn = 2M x m (t) x n (t) , d. h., I x x = 2M R 2 cos2 ωt = M R 2 (1 + cos 2ωt) I x y = I yx = 2M R 2 sin ωt cos ωt = M R 2 (sin 2ωt) I yy = 2M R 2 sin2 ωt = M R 2 (1 − cos 2ωt) I x z = I yz = I zz = 0. Nach zweimaligem Ableiten nach der Zeit erhalten wir für die zweiten zeitlichen Ableitungen der Quadrupolmomente ⎞ cos (2ωt) sin (2ωt) 0 I¨ i j (t) = −4ω2 M R 2 ⎝ sin (2ωt) − cos (2ωt) 0 ⎠ 0 0 0 ⎛
(16.44)
und daraus mit (16.42) ⎛ cos (2ω (t − r )) sin (2ω (t − r )) 2 ω2 8G M R mn ⎝ H (t, x) −→ − sin (2ω (t − r )) − cos (2ω (t − r )) r →∞ r 0 0
⎞ 0 0⎠. 0
(16.45)
16.4
Erzeugung von Gravitationswellen
449
Die Frequenz der emittierten Strahlung ist doppelt so groß wie die Orbitfrequenz, was auch zu erwarten war, da nach einer halben Periode die beiden (gleichen) Massen vertauscht werden und damit erneut die Ausgangssituation entsteht. Für die Polarisationsamplituden ergibt sich aus (16.45) mit (16.43): 8G Mω2 2 8G Mω2 (G M)2/3 8G M A+ = A× = R = = 2/3 4/3 r r 4 ω r
G Mω 4
2/3 ,
(16.46)
d. h., je schneller sich die Sterne umeinander drehen, umso größer werden die Amplituden. Wir sehen, dass sich die Störfunktionen ⎛ μν
HST (t, x) = H μν (t, x) −→ − r →∞
8G M R 2 ω2 r
⎞ 0 0 0 0 ⎜ 0 cos (2ω (t − r )) sin (2ω (t − r )) 0 ⎟ ⎜ ⎟ ⎝ 0 sin (2ω (t − r )) − cos (2ω (t − r )) 0 ⎠ 0 0 0 0 (16.47)
schon in der ST-Eichung (16.29) befinden, d. h., die H μν in (16.47) beschreiben eine Wellenausbreitung in z-Richtung senkrecht zur Umlaufebene der beiden Sterne. Die Welle besteht aus einer gleichgewichteten Linearkombination der beiden linearen Polarisationen in (16.29).
Aufgabe 16.6 Zeigen Sie, dass für die Wellenausbreitung in x-Richtung
⎛
0 2 2 ⎜ 4G M R ω ⎜ 0 μν HST (t, x) −→ ⎝0 r →∞ r 0
⎞ 0 0 0 ⎟ 0 0 0 ⎟ (16.48) ⎠ 0 cos (2ω (t − r )) 0 0 0 − cos (2ω (t − r ))
gilt. Lösung Durch (16.47) wird keine Wellenausbreitung in x-Richtung beschrieben, da sie nicht von der Form (16.30) ist. Speziell müsste H xx = H xy = 0 gelten, wodurch nur H yy übrig bliebe und die Matrix (16.47) zwar weiterhin transversal, aber nicht spurlos wäre. Wir können aber einen kleinen „Trick“ benutzen, indem wir uns zunutze machen, dass man jede Matrix ab M= cd
450
16 Gravitationswellen
in eine spurfreie und vollspurige Matrix zerlegen kann: ⎛ ⎞ ⎛ ⎞ a−d a+d b 0 ⎟ ⎜ ⎟ ⎜ 2 M =⎝ 2 a−d ⎠+⎝ a+d ⎠ c − 0 2 2
(16.49)
Damit folgt
− cos (2ω (t − r )) 0 0 0
⎞ cos (2ω (t − r )) 0 ⎟ ⎜− 2 =⎝ cos (2ω (t − r )) ⎠ 0 2 ⎞ ⎛ cos (2ω (t − r )) 0 − ⎟ ⎜ 2 +⎝ cos (2ω (t − r )) ⎠. 0 − 2 ⎛
Da in der ST-Eichung nur der spurfreie Anteil zum Gravitationsfeld beiträgt, erhalten wir damit für die Wellenausbreitung in x-Richtung ⎛
0 2 ω2 ⎜ 4G M R μν ⎜0 HST (t, x) −→ ⎝0 r →∞ r 0
⎞ 0 0 0 ⎟ 0 0 0 ⎟. ⎠ 0 cos (2ω (t − r )) 0 0 0 − cos (2ω (t − r ))
Die Welle in x-Richtung besitzt also nur die + Polarisation und hat eine nur halb so große Amplitude im Vergleich zur Ausbreitung in z-Richtung.
16.5
Gravitationswellenenergie
In Abschn. 16.3 haben wir gesehen, dass eine vorbeiziehende Gravitationswelle einen Ring von Teilchen dazu bringt, sich relativ zueinander zu bewegen. Das bedeutet, dass die Teilchen kinetische Energie von der Gravitationswelle erhalten. Die Gravitationswelle muss also Energie von ihrer Quelle bis zu den Teilchen transportieren. In diesem Abschnitt wollen wir herausfinden, wie man die von einer Gravitationswelle getragene Energie konkret berechnen kann. Dazu müssen wir mehr über gravitative Energie wissen. Gravitative Energie in der Allgemeinen Relativitätstheorie Die Beschreibung der Energie, die in einem Gravitationsfeld gespeichert ist, ist keine triviale Angelegenheit. Wir beschränken uns hier auf einige grundlegende Aussagen, eine tiefere und detaillierte Behandlung findet man in weiterführenden Texten, z. B. in [17] oder in [20].
16.5
Gravitationswellenenergie
451
In den Einstein-Gleichungen beschreibt der Energie-Impuls-Tensor Tμν die Massen- und Energiedichte aller äußeren Quellen G μν = 8π GTμν , die Energie des Gravitationsfelds selbst ist darin nicht enthalten. Diese ist im Einstein-Tensor G μν verborgen. Die Nichtlinearität von G μν ermöglicht es, dass die gravitative Feldenergie selbst als Quelle für das Feld wirkt. In Abschn. 13.2 haben wir die Divergenzfreiheit des Energie-Impuls-Tensors (13.10): ∇μ T μν = 0 (16.50) mit dem Kovarianzprinzip gezeigt, d. h., im lokalen Inertialsystem gilt ∂μ T μν = 0, und nur dort kann man von der Erhaltung der Energie und des Impulses sprechen. In einer allgemeinen gekrümmten Raumzeit kann die Gleichung (16.50) nicht über einen endlichen Teilbereich integriert werden, um (mithilfe des Gauß’schen Satzes) erhaltende Größen zu generieren, siehe [20]. Der hauptsächliche Grund dafür liegt darin, dass die für die Erhaltung von Energie und Impuls benötigten Translationsymmetrien für die Zeit und den Raum nur in einer flachen Raumzeit vorhanden sind. Das bedeutet, dass wir keinen Tensor finden können, der die gravitative Energiedichte in einem Ereignis der Raumzeit darstellt. Denn gäbe es einen solchen, so wäre er in einem lokalen Koordinatensystem in diesem Ereignis null. Und wenn er null in diesem Koordinatensystem ist, dann ist er null in allen Koordinatensystemen. Wir können also keinen Ort identifizieren, wo das Gravitationsfeld gravitative Energie besitzt, denn ob das Feld gravitative Energie besitzt, hängt vom gewählten Koordinatensystem ab. Ein Ausweg besteht darin, einen sogenannten effektiven μν Energie-Impuls-Pseudotensor Te f f zu finden, der als Beitrag des Gravitationsfeldes zum Energie-Impuls-Tensors interpretiert werden kann und die Bedingung μν
∂μ Te f f = 0 auch in einer gekrümmten Raumzeit erfüllt und somit durch Integration Erhaltungsgrößen liefert, siehe [25] oder [28]. Wir wollen aber hier diese allgemeine Diskussion nicht weiter verfolgen und uns wieder dem schwachen Gravitationsfeld zuwenden, in dem man die beschriebenen Probleme umschiffen kann. Gravitative Energie im schwachen Gravitationsfeld In einem schwachen Gravitationsfeld ist die Raumzeit im Grenzfall r → ∞ annähernd flach, und Energie und Impuls sind annähernd erhalten. In diesem Grenzfall können wir einen „Trick“ anwenden, der es erlaubt, die Energie einer Gravitationswelle zu berechnen. Die linearen Einstein-Gleichungen in der Lorenz-Eichung lauten nach (16.16):
452
16 Gravitationswellen
− 2G (1) μν = Hμν = −16π GTμν ,
(16.51)
(1)
wobei G μν den Einstein-Tensor G μν in erster Ordnung der Störfunktionen h μν bezeichnet und Hμν nach (16.8) wieder durch Hμν = h μν −
1 ημν h 2
definiert ist. Die Gl. (16.51) sagt nichts über den Verstärkungseffekt der gravitativen Energie aus, da wir die Rückkopplung des Gravitationsfeldes durch die Linearisierung des EinsteinTensors ausgeschlossen haben. Um gravitative Energieeffekte mit zu berücksichtigen, müssen wir die Feldgleichungen (mindestens) um die zweite Ordnung in den Störfunktionen erweitern: (2) (2) −2G (1) μν − 2G μν = Hμν − 2G μν = −16π GTμν Damit haben wir zumindest den führenden Term des Rückkopplungseffektes abgedeckt. In unserem Gravitationswellenmodell nehmen wir an, dass die Gravitation komplett durch den Tensor Hμν , der in einer flachen Raumzeit definiert ist, beschrieben wird, d. h., wir erhalten GW (2) (16.52) Hμν = −16π GTμν + 2G μν = −16π G Tμν + Tμν mit GW Tμν =−
(2)
G μν . 8π G
(16.53)
In Gl. (16.52) kreiert der nichtgravitative Energie-Impuls-Tensor Tμν zusammen mit dem GW das Gravitationsfeld. Da H Tensor Tμν μν die Lorenz-Eichung erfüllt, gilt auch μν ∂μ T μν + TGW = 0, was die Erhaltung der Summe von Massen- und gravitativer Energie (bzw. der entsprechenden Impulse) zumindest in der flachen Hintergrundraumzeit ausdrückt. Wir interpretieren GW als Energie-Impuls-Tensor des Gravitationsfeldes. Wie im letzten Abschnitt disalso Tμν GW lokal keine Bedeutung, wird aber zu einer tensorähnlichen Größe, wenn kutiert hat Tμν wir den Mittelwert über mehrere Wellenlängen der Gravitationswelle bilden (siehe [21] oder GW genauer [38]). Diese Mittelwertoperation notiert man mit spitzen Klammern, sodass Tμν durch (2) G μν GW Tμν =− 8π G definiert wird. Energiefluss im Doppelsternsystem Wir nehmen wie in Abschn. 16.4 an, dass zwei Sterne in der (x, y)-Ebene umeinander kreisen, und wollen die Energieflüsse aus diesem System für die z- und x-Ausbreitungsrichtungen
16.5
Gravitationswellenenergie
453
bestimmen. Dazu berechnen wir die gravitative Energiedichte TttGW mithilfe der EinsteinGleichungen 1 (2) (16.54) Rtt − gtt R(2) = 8π GTttGW 2 mit der Metrik (16.1) gμν = ημν + h μν . In den nachfolgenden Rechnungen lassen wir die (2) Kennzeichnung bei den vorkommenden Größen der Lesbarkeithalber weg und schreiben die Störfunktionen mit kleinen Buchstaben, d. h. Hμν = h μν , was wir ja in der ST-Eichung tun dürfen, siehe (16.26). Wir betrachten zunächst die Wellenausbreitung in z-Richtung. Für die Christoffel-Symbole folgt aus (16.4) und (16.47) μ
tt =
1 μν η (∂t h tν + ∂t h νt − ∂ν h tt ) = 0 2 ⎛ ⎞
1 1 iν ⎝ 1 ∂t h iν + ∂i h tν − ∂ν h ti ⎠ = ηiν ∂t h iν = ∂t h ii η 2 2 2 =0 =0 ⎛ ⎞ 1 iν ⎝ 1 1 = η ∂σ h tν +∂t h σ ν − ∂ν h σ t ⎠ = ηiν ∂t h σ ν = ∂t h σ i 2 2 2
tii =
σi t
⎛ tiσ =
=0
=0
⎞
1 σρ ⎜ ⎟ 1 η ⎝∂i h tρ +∂t h iρ − ∂ρ h ti ⎠ = ησρ ∂ t h iρ , 2 2 =0
=0
wobei in der zweiten Gleichung der Index i jeweils die Werte x, y, z annehmen kann, es findet dort keine Summation über i statt! Damit berechnen wir die erste relevante Komponente des Riemann’schen Tensors mit der Formel (12.3) μ
μ
μ
μ σ σ R ρνλ = ∂ν ρλ − ∂λ ρν + σμν ρλ − σ λ ρν
ausführlich: R xt xt = ∂x ttx −∂t txx + σx x ttσ −σx t tσx =0
=0
Analog erhalten wir
−
1 ∂t h σ x 2
1 σρ η ∂t h xρ 2 2 1 1 1 ∂t h x y = − ∂t (∂t h x x ) − (∂t h x x )2 − 2 4 4
= −∂t
1 ∂t h x x 2
454
16 Gravitationswellen
1 2 1 2 1 ∂t ∂t h yy − ∂t h yy − ∂t h x y 2 4 4 2 1 1 1 ∂t (∂t h x x ) − (∂t h x x )2 − ∂t h x y = h x x =−h yy 2 4 4 y
R t yt = −
R zt zt =R tttt = 0. Der Ricci-Tensor ergibt sich daraus zu y
Rtt = R xt xt + R t yt = −
2 1 (∂t h x x )2 + ∂t h x y . 2
Analog findet man Rx x = R yy = Rzz = −Rtt und damit für den Krümmungsskalar 2 R = ημν Rμν = −Rtt + Rx x + R yy + Rzz = 2 (∂t h x x )2 + ∂t h x y . Einsetzen in die Einstein-Gleichungen (16.54) führt zu folgender Energiedichte: 2 1 1 1 Rtt − gtt R = TttGW = (∂t h x x )2 + ∂t h x y 8π G 2 16π G Nun gilt ∂t h i j ∂t h i j = ∂t h i j ηik η jl ∂t h kl 2 2 2 = (∂t h x x )2 + ∂t h x y + ∂t h yy + ∂t h yx 2 = 2 (∂t h x x )2 + ∂t h x y , woraus schließlich für die Energiedichte TttGW =
1 ∂t h i j ∂t h i j 32π G
(16.55)
folgt, wobei wir wieder die Mittelwertbildung berücksichtigt haben. Der gravitative Energiefluss f GW durch eine Fläche, die senkrecht zur Ausbreitungsrichtung liegt, ist die Energie, die in einer Zeiteinheit eine Flächeneinheit durchquert. Da die Welle sich mit Lichtgeschwindigkeit c = 1 bewegt, ist der Energiefluss das Gleiche wie die Energie in einem Zylinder mit Einheitslänge und Einheitsgrundfläche, d. h., der Energiefluss ist das Gleiche wie die Energiedichte: 1 f GW = (16.56) ∂t h i j ∂t h i j 32π G
16.5
Gravitationswellenenergie
455
Wir setzen die Störfunktionen aus (16.47) ein und erhalten für den Energiefluss in z-Richtung 2 1 (∂t h x x )2 + ∂t h x y 16π G 2 1 8G M R 2 ω2 = (−2ω sin (2ω (t − r )))2 + (2ω cos (2ω (t − r )))2 16π G r 16G M 2 R 4 ω6 2 sin (2ω (t − r )) + cos2 (2ω (t − r )) = 2 πr 16G M 2 R 4 ω6 = . πr 2
f zGW =
Um den Energiefluss in x-Richtung zu berechnen, setzen wir die Störfunktionen aus (16.48) in die Formel (16.56) ein: 2 1 ∂t h yy + (∂t h zz )2 16π G 2 1 4G M R 2 ω2 = (−2ω sin (2ω (t − r )))2 16π G r 4G M 2 R 4 ω6 2 sin (2ω (t − r )) = 2 πr 2G M 2 R 4 ω6 = , πr 2
f xGW =
da die Mittelung von sin2 (2ω (t − r )) über beliebige Frequenzen ω gleich 1/2 ist. Wir sehen - ähnlich wie bei den Amplituden in Abschn. 16.4 -, dass der Energiefluss in x-Richtung achtmal geringer als der in z-Richtung ist. Abgestrahlte Energie In diesem Abschnitt wollen wir die gesamte Energie berechnen, die ein Doppelsternsystem durch Abstrahlung verliert. Da wir gesehen haben, dass der Energiefluss nicht isotrop, sondern in unterschiedlichen Richtungen unterschiedlich groß ist, müssen wir die Vorgehensweise des letzten Abschnitts verallgemeinern. Wir verlangen, dass die Störfunktionen h i j (und damit nach (16.42) auch die Ii j ) in der ST-Eichung vorliegen. In (16.47) haben wir gesehen, dass die h i j , die die Emissionen in z-Richtung beschreiben, schon in der ST-Form sind, die Emissionen in x-Richtung mussten wir allerdings „händisch“ in die ST-Eichung bringen, siehe (16.48). Da wir in der Folge über alle Richtungen integrieren wollen, müssen wir sicherstellen, dass die Störfunktionen (bzw. die Quadrupolmomente) bei der Integration ihre ST-Form beibehalten. Dazu machen wir das Quadrupolmoment zunächst spurfrei, indem wir das sogenannte reduzierte Quadrupolmoment durch 1 1 k 3 m n 2 (16.57) Ii j := Ii j − ηi j Ik = d x ρ (t, x) x x − ηi j r 3 3
456
16 Gravitationswellen
einführen, was formgleich der Definition des elektromagnetischen Quadrupolmoments (5.19) entspricht. Dann gilt nämlich 1 1 j j ij ij k Ii j − ηi j Ik = I j − 3 Ikk = 0. I j = η Ii j = η 3 3 Im weiteren Verlauf wollen wir immer mit dem spurfreien reduzierten Quadrupolmoment anstelle des normalen Quadrupolmoments rechnen. Für eine Welle der Form (16.48) in z-Richtung gilt 1 h x x − h yy = 2 1 h yy − h x x = = 2 2G ¨ Ix y = = hxy = r
h xSTx = h ST yy h xSTy wegen
2G 1 ¨ I x x − I¨yy = r 2 2G 1 ¨ I yy − I¨x x = r 2 2G ¨ 2G ¨ ST Ix y =: I r r xy
2G r 2G r
1 ¨ Ix x − I¨ yy =: 2 1 ¨ I yy − I¨ x x =: 2
2G r 2G r
I¨ xST x ST I¨ yy
(16.58)
I¨x x − I¨yy = I¨ x x − I¨ yy ,
da der zusätzliche Term in (16.57) sich bei der Differenzbildung aufhebt, und wegen
I¨ i j = I¨i j für i = j. In (16.58) haben wir somit definiert, was wir unter der ST-Form des reduzierten Quadrupolmoments einer Welle in z-Richtung verstehen wollen. Wellenausbreitung in beliebiger Richtung Wenn wir die spurfreien transversalen Komponenten einer Welle in beliebiger Richtung, die durch einen dreidimensionalen Einheitsvektor n gekennzeichnet ist, berechnen wollen, so gehen wir folgendermaßen vor. Zunächst projizieren wir die Welle in die Ebene senkrecht zu n, d. h., wir machen sie transversal und anschließend spurfrei. Wir gehen von einer Welle der Form (16.18): ρ Hμν (t, x, y, z) = Aμν eikρ x aus. In der ST-Eichung sind die Zeitkomponenten von Aμν nach (16.27) für alle Richtungen gleich null: Aμt = Atμ = 0, d. h., wir müssen uns wieder nur um die räumlichen Komponenten Ai j kümmern. Um die Projektion senkrecht zu n = n i durchzuführen, benutzen wir einige Ergebnisse aus der Linearen Algebra, siehe z. B. [5]. Wir definieren eine lineare Abbildung P : R3 → R3 , die durch die 3 × 3-Matrix j j Pm = ηm − n j n m (16.59)
16.5
Gravitationswellenenergie
457
dargestellt wird, und zeigen zunächst, dass P die Projektionseigenschaft P ◦ P = P hat. Da n ein Einheitsvektor ist, folgt j j j i j i i Pi Pmi = ηi − n j n i ηm − n i n m = ηi ηm − ηi n i n m − ηm n j ni + n j ni ni nm =1
=
j ηm
− n nm − n nm + n nm = j
j
j
j ηm
− n nm = j
j Pm ,
(16.60)
also P ◦ P = P. Ist v ein beliebiger dreidimensionaler Vektor, so liegt der Vektor j
j
v⊥ := P v = v⊥ = Pm v m in der Ebene senkrecht zu n. Denn es gilt
⎞
⎛
⎟ ⎜ j j n · v⊥ = n j Pm v m = n j ηm − n j n m v m = ⎝n m − n j n j n m ⎠ v m = 0, =1
d. h., v⊥ ist die Projektion von v auf die Ebene senkrecht zu n. Beispiel 16.1
Wir überprüfen noch, ob auch der obige Spezialfall der Wellenausbreitung in z-Richtung in dieser Verallgemeinerung enthalten ist, und betrachten n = (0, 0, 1). Dann gilt 1 f ur ¨ j =m=z n j nm = 0 sonst und damit
j
Pm woraus
⎞ ⎞ ⎛ ⎞ ⎛ 100 000 100 = ⎝ 0 1 0 ⎠ − ⎝ 0 0 0 ⎠ = ⎝ 0 1 0 ⎠, 000 001 001 ⎛
⎞⎛ x ⎞ ⎛ x ⎞ v 100 v v⊥ → ⎝ 0 1 0 ⎠ ⎝ v y ⎠ = ⎝ v y ⎠, 000 vz 0 ⎛
also die Projektion von v auf die (x, y)-Ebene folgt.
Wir die Projektion jetzt für die Matrix Ai j durchführen und definieren die Matrix wollen Ai⊥j durch Ai⊥j = Pik P jm Akm , d. h., wir wenden den Projektionsoperator für jeden Index von Akm an. Dann gilt
458
16 Gravitationswellen
Ai⊥j n j = ηik − n k n i ηmj − n m n j Akm n j ⎛ ⎞ ⎜ ⎟ = ηik − n k n i ⎝n m − n m n j n j ⎠ Akm = 0 =1
und analog Ai⊥j n i = 0. Die Matrix Ai⊥j ist also transversal zu n, aber noch nicht spurfrei:
A⊥
i i
= ηi j Ai⊥j = ηi j Pik P jm Akm = Pik P mi Akm = P km Akm ,
wobei wir zuletzt (16.60) benutzt haben. Um Ai⊥j spurfrei zu machen, definieren wir AiST j
:=
Ai⊥j
1 − Pi j P km Akm = 2
Pik
1 − Pi j P km 2
P jm
Akm .
(16.61)
Aufgabe 16.7
spurfrei ist. Zeigen Sie, dass AiST j
Lösung Es gilt: A
ST
i i
1 =η =η − Pi j P km 2 1 i km k mi Akm = Pi P − Pi P 2 ⎛ ⎞ ⎞ ⎛ ij
AiST j
ij
Pik
P jm
Akm
1⎜ ⎟ ⎟ ⎜ = ⎝ P km − ⎝ ηii − n i n i ⎠ P km ⎠ Akm 2 =3
=1
=0 Als Beispiel schauen wir uns wieder die Wellenausbreitung in z-Richtung an. Beispiel 16.2
Sei wieder n = (0, 0, 1), dann folgt mit Beispiel 16.1
j
Pm
⎞ 100 = ⎝0 1 0⎠ 000 ⎛
16.5
Gravitationswellenenergie
459
und daraus ⎛
1 Ai⊥j = ⎝ 0 0 ⎛ 1 = ⎝0 0
⎞⎛ Ax x 00 1 0 ⎠ ⎝ A yx 00 A zx ⎞⎛ Ax x 00 1 0 ⎠ ⎝ A yx 00 A zx
⎞ ⎞⎛ 100 Ax y Ax z A yy A yz ⎠ ⎝ 0 1 0 ⎠ 000 A zy A zz ⎞ ⎞ ⎛ Ax x Ax y 0 Ax y 0 A yy 0 ⎠ = ⎝ A yx A yy 0 ⎠, 0 0 0 A zy 0
woran man nochmals sieht, dass beide Projektionsmatrizen erforderlich sind, um die A z j und Ai z zu null zu machen. Die spurfreie transversale Matrix errechnet sich durch (16.61): ⎞ ⎞ ⎛ 100 Ax y 0 1 A yy 0 ⎠ − ⎝ 0 1 0 ⎠ P km Akm 2 000 0 0 ⎞ ⎞ ⎛ 100 Ax y 0 1 A yy 0 ⎠ − ⎝ 0 1 0 ⎠ A x x + A yy 2 000 0 0 1 A x x + A yy − Ax y 2 1 A yx A x x + A yy A yy − 2 0 0 ⎞ ⎛ 1 A − A 0 A yy xy ⎟ ⎜ 2 xx ⎜ ⎟ 1 , =⎜ A yx A yy − A x x 0 ⎟ ⎠ ⎝ 2 0 0 0 ⎛
AiST j
Ax x ⎝ = A yx 0 ⎛ Ax x = ⎝ A yx 0 ⎛ ⎜ Ax x ⎜ =⎜ ⎝
und wir erhalten genau das erwartete Ergebnis (16.58).
⎞ 0⎟ ⎟ 0⎟ ⎠ 0
Als Gesamtergebnis ergibt sich die Verallgemeinerung von (16.58) für eine beliebige Richtung n h iST j =
mit
IiST j =
Pik P jm −
2G ¨ST 2G ¨ ST Ii j = I r r ij
1 Pi j P km Ikm , und Pik = ηik − n k n i . 2
(16.62)
(16.63)
460
16 Gravitationswellen
Energiefluss einer Gravitationswelle Zunächst stellen wir fest, dass wir die Energiedichte (16.55) mit (16.42) durch die dritte Ableitung des reduzierten Quadrupolmoments ausdrücken können: 1 4G 2 ¨ ST ¨ i j 1 ij ∂t Ii j ∂t I ST ∂t h iST j ∂t h ST = 32π G 32π G r 2 G ... ST ... i j G ... ST ... i j = = I I I I ST . i j ST 8πr 2 8πr 2 i j
TttGW =
Mit (16.56) folgt für den Energiefluss in Richtung n ebenso f nGW =
G ... ST ... i j I I ST . 8πr 2 i j
(16.64)
Aufgabe 16.8 ij Zeigen Sie, dass sich der Term IiST j I ST durch ij
ij i j m IiST j I ST = Ii j I − 2n n Iim I j +
1 i j k m n n n n Ii j Ikm 2
(16.65)
darstellen lässt. Lösung ij Wir berechnen mithilfe von (16.63) den Term IiST j I ST , wobei wir mehrfach die Projektionseigenschaft (16.60) sowie die Identität P jm P i j = P m j P ji nutzen: 1 1 j Pik P jm − Pi j P km Ikm Pli Pn − P i j Pln I ln 2 2 1 j j Pik P jm Pli Pn Ikm I ln − Pi j P km Pli Pn Ikm I ln 2 1 k m ij 1 P P P Pln Ikm I ln + Pi j P km P i j Pln Ikm I ln 2 i j 4 1 Plk Pnm Ikm I ln − Pln P km Ikm I ln + P km Pln Ikm I ln ηi j − n i n j ηi j − n i n j 4 1 k m ln km ln Pl Pn Ikm I − Pln P Ikm I + P km Pln Ikm I ln (3 − 1 − 1 + 1) 4 1 k m ln km ln Pl Pn Ikm I − Pln P Ikm I 2
ij
IiST j I ST = = − = = =
Wir setzen die Definition von P (16.59) ein, beachten, dass das reduzierte Quadrupolmoment spurfrei ist, d. h., ηi j Ii j = 0, und erhalten
16.5
Gravitationswellenenergie
461
1 ij k k m m ln km − n k n m I ln IiST km I j I ST = ηl − n n l ηn − n n n Ikm I − 2 (ηln − n l n n ) η = Ikm I km − 2n k nl Ikm I lm + n k nl n m n n Ikm I ln ⎛
⎞
1⎜ ⎟ − ⎝ηln I ln ηkm Ikm − ηln I ln n k n m Ikm − ηkm Ikm nl n n I ln + nl n n n k n m Ikm I ln ⎠ 2
=0 =0 =0 =0 1 k km k lm m = Ikm I − 2n nl Ikm I + n nl n n n Ikm I ln
2
1 i j k m = Ii j I i j − 2n i n j Iim I m j + 2 n n n n Ii j Ikm ,
wobei wir in der letzen Zeile die Indizes umbenannt und ein wenig „Indexgymnastik“ betrieben haben. Mit einer zur Aufgabe 16.8 analogen Rechnung können wir den Energiefluss (16.64) durch ... I i j ausdrücken: f nGW =
G ... ... i j i j ... ... m i j k m ... ... 2 − 4n n + n n n n I I I I I I ij im j i j km . 16πr 2
(16.66)
Abgestrahlte Gesamtenergie Wir wollen die von einer Quelle abgestrahlte Gesamtenergie berechnen, indem wir zuerst die pro Zeiteinheit abgestrahlte Energie durch ein (differenzielles) Oberflächenelement d A einer die Quelle umfassenden Kugel mit Radius r in Richtung eines Einheitsvektors n ermitteln und dann über die ganze Kugel integrieren. Dafür setzen wir d A = r 2 sin ϑ dϑ dϕ, n = (sin ϑ cos ϕ, sin ϑ sin ϕ, cos ϑ). Die Energie, die pro Zeiteinheit durch das Oberflächenelement abgestrahlt wird, ist f nGW d A, sodass die abgestrahlte Gesamtenergie pro Zeiteinheit, die zu einem gleichgroßen Energieverlust der Quellenenergie E führt, durch π 2π ... ... Gr 2 ij ST dϑ sin ϑ dϕ I i j I ST 8πr 2 0 0 π 2π ... ... ... ... ... ... G dϑ sin ϑ dϕ 2 I i j I i j − 4n i n j I im I jm + n i n j n k n m I i j I km = 16π 0 0 ... berechnet werden kann. Da die Komponenten I i j nach (16.57) nur von der Quelle, aber nicht von der Richtung n des Beobachters relativ zur Quelle abhängen, erhalten wir −
dE = dt
−
d A f nGW =
2π 2π G ... ... i j π dE G ... ... m π = dϑ sin ϑ dϕ − dϑ sin ϑ dϕ n i n j Iij I I im I j dt 8π 4π 0 0 0 0 2π G ... ... π + dϑ sin ϑ dϕ n i n j n k n m . (16.67) I i j I km 16π 0 0
462
16 Gravitationswellen
Wir berechnen die drei Integrale einzeln. Erstes Integral Das erste Integral ergibt 2π G ... ... i j π G ... ... i j dϑ sin ϑ dϕ = Iij I Iij I . 8π 2 0 0 =4π
Zweites Integral
Aufgabe 16.9 Zeigen Sie, dass sich für das zweite Integral
2π G ... ... m π G ... ... m dϑ sin ϑ dϕ n i n j = I im I j I im I j 4π 3 0 0 ergibt. Lösung Für das zweite Integral betrachten wir zunächst den Fall i = j und erhalten
π
2π
dϑ sin ϑ
0
π
dϕ n x n y =
0
0 π
= 0
π
dϑ sin ϑ
0
2π
π
dϑ sin ϑ
0
Des Weiteren folgt
0
2π
dϕ sin ϕ cos ϕ
0
sin2 ϕ sin ϑ dϑ 2
π
dϕ n x n z =
dϑ sin2 ϑ cos ϑ
=0 0
π
dϕ n y n z = 0
2π
0
0 2π
2π
3
0
0
dϑ sin3 ϑ
dϑ sin2 ϑ cos ϑ 0
dϕ cos ϕ = 0 =0
2π
dϕ sin ϕ = 0. =0
16.5
Gravitationswellenenergie
π
dϑ sin ϑ
0
2π
463
π
dϕ n x n x =
0
dϑ sin3 ϑ
0
2π
dϕ cos2 ϕ
0
2π 1 1 dϕ (1 + cos 2ϕ) (3 sin ϑ − sin 3ϑ) 4 2 0 0 ⎛ ⎞ 2π ⎜ ⎟ 1 6 11 π+ + dϕ cos 2ϕ ⎟ = [cos 3ϑ]π0 ⎜ ⎝ ⎠ 4 43 2 0 =
π
dϑ
=
=0
6 1 4π − π= . 4 6 3
Ähnlich zeigt man
π
2π
dϑ sin ϑ
0
π
dϕ n n = y y
0
dϑ sin ϑ
0
2π
dϕ n z n z =
0
4π 3
und erhält zusammengefasst
π
dϑ sin ϑ
0
2π
dϕ n i n j =
0
4π i j η . 3
Für das zweite Integral ergibt sich damit 2π G ... ... m 4π i j G ... ... m G ... ... m π η = dϑ sin ϑ dϕ n i n j = I im I j I im I j I im I j . 4π 4π 3 3 0 0 Drittes Integral
Aufgabe 16.10 Zeigen Sie, dass sich das dritte Integral zu
G ... ... I i j I km 16π
π 0
dϑ sin ϑ 0
2π
dϕ n i n j n k n m =
G ... ... i j Iij I 30
berechnet. Lösung Für die Berechnung des dritten Integrals betrachten wir im Term n i n j n k n m zunächst nur die Kombinationen, in denen ein Index einmal bzw. dreimal vorkommt, und achten dort nur auf die Integrale über ϕ. In Tab. 16.1 werden die jeweiligen Fälle, die zu integrierenden ϕ-Terme sowie deren Stammfunktionen, die man bei Bedarf in [27] nachschlagen kann, dargestellt. Man sieht, dass alle Integrale von 0 bis 2π über die in Tab. 16.1 aufgeführten ϕ-Terme verschwinden. Es bleiben also nur die Terme mit zwei unterschiedlichen Paaren n i n i n k n k (und
464
16 Gravitationswellen
Tab. 16.1 Stammfunktionen der ϕ-Terme Fall i, j, k, m
ϕ-Term
Stammfunktion
x, y, y, z
cos ϕ sin2 ϕ
1 sin3 ϕ 3
x, y, z, z
cos ϕ sin ϕ
1 sin2 ϕ 2
y, x, x, z
sin ϕ cos2 ϕ
−
1 cos3 ϕ 3
x, x, x, y
cos3 ϕ sin ϕ
−
1 cos4 ϕ 4
x, x, x, z
cos3 ϕ
sin ϕ −
y, y, y, x
sin3 ϕ cos ϕ
1 sin4 ϕ 4
y, y, y, z
sin3 ϕ
cos ϕ +
z, z, z, x
cos ϕ
sin ϕ
z, z, z, y
sin ϕ
− cos ϕ
1 sin3 ϕ 3
1 cos3 ϕ 3
deren Permutationen) sowie die Viererterme n i n i n i n i übrig. Da die Orientierung unseres Koordinatensystems beliebig ist, erwarten wir, dass die Integrale für n x n x n y n y , n x n x n z n z und n y n y n z n z (sowie deren Permutationen) gleich sind. Ebenso sollten die Integrale über n x n x n x n x , n y n y n y n y und n z n z n z n z gleich sein. Konkret berechnen wir (wieder mit den Stammfunktionen aus [27]) π 2π π 2π dϑ sin ϑ dϕ n x n x n y n y = dϑ sin5 ϑ dϕ cos2 ϕ sin2 φ 0
sowie π 0
0
dϑ sin ϑ 0
0
0
sin4 ϑ cos ϑ = − + 5 sin 4ϕ 2π ϕ − 8 32 0 2 2π 4 2− = = 5 3 8
2π
dϕ n x n x n x n x = 0
π
dϑ sin5 ϑ 0
π 4 1 − cos ϑ + cos3 ϑ 5 3 0
2π
4π 15
dϕ cos4 ϕ
π sin4 ϑ cos ϑ 4 1 = − + − cos ϑ + cos3 ϑ 5 5 3 0
16.5
Gravitationswellenenergie
465
3ϕ sin 2ϕ sin 4ϕ + + 8 4 32 2 6π 4π 4 2− = . = 5 3 8 5
2π 0
Zusammengefasst erhalten wir 0
π
dϑ sin ϑ
2π
dϕ n i n j n k n m =
0
4π i j km η η + ηik η jm + ηim η jk , 15
wobei der Klammerausdruck auf der rechten Seite sicherstellt, • dass alle drei Summanden 1 sind, wenn alle vier Indizes übereinstimmen, • dass genau ein Summand 1 ist, wenn je zwei Indizes, aber nicht alle übereinstimmen, • dass in den sonstigen Fällen alle Summanden verschwinden. Für das dritte Integral ergibt sich damit 2π G ... ... i j km G ... ... π ik jm im jk dϑ sin ϑ dϕ n i n j n k n m = I i j I km I i j I km η η + η η + η η 16π 60 0 0 G ... i ... k ... k ... j ... m ... j = I i I k +I j I k + I j I m 60 =0
G = 60 G = 30
=0
... ... ... ... jm jk I jk I + I jm I ... ... ij . Iij I
Quadrupolformel Für die abgestrahlte Gesamtenergie pro Zeiteinheit L GW , die man auch Gravitationswellenleuchtkraft bzw. Luminosität nennt, ergibt sich mit den obigen Ergebnissen π 2π ... ... ... ... ... ... G dE = L GW = − dϑ sin ϑ dϕ 2 I i j I i j − 4n i n j I im I jm + n i n j n k n m I i j I km dt 16π 0 0 G G ... ... i j G ... ... i j G − + = . (16.68) = Iij I Iij I 2 3 30 5
Das ist Einsteins berühmte Quadrupolformel für die abgestrahlte Energie einer Gravitationswelle, die er schon 1916 und verbessert 1918 aus seiner Gravitationstheorie abgeleitet hat, siehe [40], [45]. Bemerkung 16.1 Einen Beitrag eines Dipolmoments zur Leuchtkraft gibt es bei den Gravitationswellen im Unterschied zu den elektromagnetischen Wellen nicht. Ein zum elek-
466
16 Gravitationswellen
tromagnetischen Dipolmoment (5.18) analoges Massen-Dipolmoment für n Punktteilchen mit Masse m i an den Orten xi wird durch n
d =
m i xi i=1
definiert. Dessen zeitliche Ableitung ist der Gesamtimpuls p des Systems n
d˙ =
m i x˙ i = p,
i=1
und wegen der Impulserhaltung verschwindet die zweite Ableitung des Dipolmoments d¨ =
n
m i x¨ i = p˙ = 0,
i=1
d. h., es gibt keine Dipolstrahlung in der Gravitationsphysik. Für das oben betrachtete Doppelsternsystem ergibt sich mit (16.44) ⎛ ⎛ ⎛ ⎞⎞ ⎞ cos (2ωt) sin (2ωt) 0 sin (2ωt) − cos (2ωt) 0 ... d ⎝ −4ω2 M R 2 ⎝ sin (2ωt) − cos (2ωt) 0 ⎠⎠ = 8ω3 M R 2 ⎝ − cos (2ωt) − sin (2ωt) 0 ⎠ Iij = dt 0 0 0 0 0 0
(16.69) und daraus ... ... ij = 64ω6 M 2 R 4 2 sin2 (2ωt) + 2 cos2 (2ωt) = 128ω6 M 2 R 4 . Iij I Wir benutzen das Kepler’sche Gesetz (16.43): ω2 =
GM (G M)1/3 ⇒ R = 4R 3 41/3 ω2/3
und erhalten mit (16.68) für die Leuchtkraft des Doppelsternsystems L GW = −
128G 6 2 4 dE 2 = ω M R = dt 5 5G
GM R
5 =
2 (2G Mω)10/3 . 5G
(16.70)
Diese ist umso stärker, je kleiner der Abstand (= 2R) der beiden Sterne bzw. je größer die Umlauffrequenz ω ist. Wir wollen noch die Formel (16.70) in SI-Einheiten aufschreiben und dazu den zur Masse M proportionalen Schwarzschild-Radius (14.21) Rs =
2G M c2
16.5
Gravitationswellenenergie
467
sowie den Abstand D = 2R der beiden Sterne benutzen. Dann folgt 2 dE = L GW = − dt 5Gc5
5 5 2 c 5 Rs 5 GM 5 Rs Rs 52 = ≈ · 10 Watt = · 1059 erg/s. R 5G D D D
(16.71)
Für die Abstrahlungsleistung kommt es also auf das Verhältnis des Schwarzschild-Radius zum Abstand der Sterne an. Wir wollen an zwei Beispielen die möglichen Größenordnungen der Abstrahlung erläutern. Beispiel 16.3
1. Als erstes Beispiel berechnen wir die Gravitationswellenleuchtkraft der Erde beim Umkreisen der Sonne. Dazu müssen wir die Formel (16.70) auf den Fall unterschiedlicher Massen M1 und M2 erweitern. In [38] findet man eine ausführliche Herleitung, die ganz ähnlich wie die obige verläuft und als Ergebnis L GW =
32 G 6 (M1 M2 )2 ω D4 5 c5 (M1 + M2 )2
(16.72)
liefert. Sind die beiden Massen gleich M1 = M2 = M, so folgt aus (16.72) L GW =
32G 6 M 4 128G 6 2 4 ω M R , ω (2R)4 = 2 5 5 5c (2 M)
also der Spezialfall (16.70). Das Kepler-Gesetz ist dann D3 =
G (M1 + M2 ) , ω2
(16.73)
und wir erhalten aus (16.72) mit (16.73) L GW =
32 G 4 (M1 + M2 ) (M1 M2 )2 32 G 7/3 (M1 M2 )2 = ω10/3 . 5 c5 5 c5 (M1 + M2 )2/3 D5
(16.74)
Wir setzen für die physikalischen Größen folgende Zahlenwerte (in SI-Einheiten) an, vergleiche auch die Tab. A.3 sowie A.4: Damit ergibt sich L GW
2 32 G 4 M + M E M M E 32 = 5 5 c5 5 D 30 2 · 10 1,44 · 10110 2 1 ≈ 41 10 2,4 · 1042 7,6 · 1055 ≈ 200 Watt,
468
16 Gravitationswellen
also eine sehr bescheidene Zahl. Daher dauert es auch theoretisch sehr lange (nämlich viel länger als das Universum existiert), bis die Erde aufgrund des Energieverlustes durch Gravitationswellenabstrahlung in die Sonne stürzen würde. Ein richtiger Trost ist das aber auch nicht, da vor diesem Ereignis die Sonne schon seit Milliarden von Jahren ausgebrannt sein wird. 2. In diesem Beispiel wollen wir die Leuchtkraft für zwei Neutronensterne mit je 1,4 Sonnenmassen zahlenmäßig abschätzen. Der Schwarzschild-Radius eines solchen Sterns beträgt nach Tab. 16.2 Rs =
2G M 2 · 6,7 · 1,4 · 2 · 1030 = ≈ 4 km, c2 9 · 1016 · 1011
was nach (14.22) etwa einem Drittel seines Radius entspricht. Wir nehmen zunächst an, dass sich die Neutronensterne im Abstand einer Astronomischen Einheit umkreisen, und erhalten mit (16.71) L GW ≈
4 · 103 1,5 · 1011
5 · 1052 ≈ 1,35 · 1014 Watt.
Das ist schon eine stattliche Zahl, die etwa 6000-mal der Leistung des zur Zeit größten Kraftwerkes der Welt (Drei-Schluchten-Damm in China) entspricht. Bedenkt man aber, dass die elektromagnetische Abstrahlungsleistung der Sonne etwa 4 · 1026 Watt beträgt, so ist die gravitative Abstrahlung der Neutronensterne im astronomischen Maßstab eher gering. Die Abstrahlungsleistung des Doppelsternsystems erhöht sich allerdings beträchtlich, wenn sich der Abstand zwischen beiden verringert. So erhalten wir eine Abstrahlungsleistung in Höhe von L GW ≈
4 · 103 5 · 108
5 · 1052 ≈ 3,37 · 1026 Watt,
d. h. in der Größenordnung der Sonne, wenn sich die Neutronensterne in einem Abstand von 500.000 km umkreisen. Wenn wir noch unterstellen, dass der Abstand des Doppelsternsystems zur Erde (nur) ca. 40 Lichtjahre beträgt (wie z. B. das Dop-
Tab. 16.2 Physikalische Größen Physikalische Größe
Symbol Zahlenwert
Masse der Sonne
M
2 · 1030 kg
Masse der Erde
ME
6 · 1024 kg
Newton’sche Gravitationskonstante
G
6,7·10−11 m 3 kg −1 s −2
Lichtgeschwindigkeit
c
3 · 108 m s −1
Mittlere Entfernung Erde - Sonne („Astronomische Einheit“) D
1,5 · 1011 m
16.6
Nachweis von Gravitationswellen
469
pelsternsystem i Boo), dann ergibt sich für die Größe der Gravitationswellenamplitude mit M 2 ≈ 8 · 1060 , G 2 = 45/1022 , r = 40 Lj = 3,8 · 1017 , R = 2,5 · 108 , c4 = 81 · 1032 nach Formel (16.46) in SI-Einheiten A+/× =
2G 2 M 2 ≈ 9,4 · 10−20 , c4 r R
also eine ähnliche Größenordnung wie am Ende des Abschn. 16.3 dargestellt. Der größte Abstrahlungseffekt ergibt sich, wenn die beiden Neutronensterne kurz vor ihrer Verschmelzung stehen, d. h., wenn ihr Abstand gerade ihrem Durchmesser entspricht: 5 4 · 103 L GW ≈ · 1052 ≈ 1,29 · 1048 Watt 24 · 103 Das ist eine unvorstellbar große Zahl, die der Luminosität von mehr als 1021 Sonnen entspricht. Tatsächlich wurde sogar eine etwas größere Leuchtkraft, die allerdings nur Sekundenbruchteile andauerte, im September 2015 bei der Verschmelzung zweier Schwarzer Löcher beobachtet, was wir in Abschn. 16.6 detaillierter beschreiben werden.
16.6
Nachweis von Gravitationswellen
Für den Nachweis von Gravitationswellen gibt es im Wesentlichen zwei, allerdings grundlegend unterschiedliche, methodische Ansätze. Der eine besteht darin, die Folgen des durch die Gravitationswellenabstrahlung eintretenden Energieverlustes eines Systems zu messen, ohne die abgestrahlten Gravitationswellen selbst (auf der Erde) zu detektieren. Diese Methode nennt man indirekten Nachweis von Gravitationswellen. Das Aufspüren von Gravitationswellen mit Messgeräten auf der Erde (zukünftig wohl auch im Weltall), was zum ersten Mal im September 2015 gelang, nennt man direkten Nachweis von Gravitationswellen. Wir behandeln zunächst einige Ergebnisse, die die indirekte Methode geliefert hat. Indirekter Nachweis von Gravitationswellen Eine Folge des Energieverlustes durch Gravitationswellen ist die zeitliche Veränderung der Umlaufperiode eines Doppelsternsystems. Wenn man durch konkrete Messungen feststellt, dass diese gerade so groß ist wie die theoretische Vorhersage des Energieverlustes durch Gravitationswellen, und wenn man ausschließen kann, dass es andere beeinflussende Effekte gibt, so kann man von einem indirekten Nachweis von Gravitationswellen sprechen.
470
16 Gravitationswellen
Um die zeitliche Änderung der Bahndaten konkret ausrechnen zu können, wollen wir der Einfachheit halber wieder annehmen, dass die beiden Sterne im Binärsystem gleichgroße Massen M haben und sich auf einer Kreisbahn mit Radius R umeinander bewegen. Diese Annahmen sind zwar nicht sehr realistisch, da die Massen in der Regel unterschiedlich sind und die Umlaufbewegungen auf elliptischen Bahnen stattfinden, geben allerdings die wesentlichen Ideen gut wieder. In unserer Newton’schen Approximation beträgt die Gesamtenergie E des Doppelsternsystems E = E kin + E pot =
1 G M2 G M2 2Mv 2 − = Mω2 R 2 − 2 2R 2R
mit der Umlauffrequenz ω = v/R. Mit dem Kepler-Gesetz (16.43): ω2 =
GM (G M)1/3 ⇒ R = 4R 3 41/3 ω2/3
(16.75)
erhalten wir daraus E = M R2
G M2 G M 2 41/3 ω2/3 G M2 M (G Mω)2/3 GM = − = − − = − . 4R 3 2R 4R 42/3 4 (G M)1/3
(16.76)
Die beiden Sterne im Binärsystem haben also weder einen konstanten Abstand noch eine konstante Umlauffrequenz. Wegen der Gravitationswellenenergieabstrahlung verringert sich vielmehr der Abstand im Zeitablauf, und die Umlauffrequenz erhöht sich. Das bedeutet, dass die obigen Rechnungen nicht ganz richtig sind. So haben wir beispielsweise in (16.69) die Zeitabhängigkeit von R und ω ignoriert. Ist aber - wie in unseren Beispielen - die pro Umlauf entzogene Energie sehr viel kleiner als die Gesamtenergie, so werden sich die Bahnparameter (Abstand, Periode usw.) so wenig verändern, dass wir deren Zeitableitungen ignorieren können. Wir schreiben die zeitlichen Ableitungen wieder mit einem Punkt und erhalten mit (16.76) G M2 ˙ R E˙ R˙ 2 = 4R 2 = − E R GM − 4R
(16.77)
sowie mit (16.43) und der Umlaufperiode T = 2π/ω: (G M)1/3 ˙ 2 1/3 5/3 ω˙ 2 2 ω˙ R =− − = − 4 ω 1/3 = R 3 (G M) 3ω 3 1/3 2/3 4 ω
2π T 2 T˙ = − 2 T˙ . 2π 3T T
(16.78)
16.6
Nachweis von Gravitationswellen
471
Da wir davon ausgehen, dass der Energieverlust ausschließlich eine Folge der Abstrahlung von Gravitationswellen ist, können wir (16.71) benutzen, und es ergibt sich aus (16.77): E˙ = E
−
GM 5 2 8 R˙ 8 G3 M 3 GM 3 R 5Gc5 ˙ =− ⇒R=− 5 = 5 R4 R R 5c 5c G M2 − 4R
(16.79)
Diese Differenzialgleichung wird mit der Anfangsbedingung R (0) = R0 durch
1 dt R˙ R 3 = R 4 = − 4
dt
1/4 8 32 3 3 ⇒ R = const. − t M) M) (t) (G (G 5c5 5c5
mit R (0) = const.1/4 ⇒ const. = R04 gelöst. Wir definieren noch te :=
5c5 R04
(16.80)
32 (G M)3
und erhalten als Lösung von (16.79) R (t) = R0
t 1− te
1/4 ,
(16.81)
d. h., bei t = te ist R (t) = 0, te ist also die Zeit, die bis zur Kollision der beiden Sterne vergeht. Analog ergibt sich mit dem Kepler-Gesetz für die Periode T : R=
(G M)1/3 (G M)1/3 T 2/3 = 41/3 ω2/3 41/3 (2π )2/3
und wegen 5/3 3 E˙ 12 G 3 M 3 12 (G M)3 44/3 (2π )8/3 24 T˙ 8/3 (2G M) =− =− 5 = − = − (2π ) T 2E R4 T 8/3 5c 5c5 (G M)4/3 T 8/3 5c5
die folgende Differenzialgleichung für T : 24 1 T˙ = − 5 (2π )8/3 (2G M)5/3 5/3 5c T
(16.82)
Die Lösung ist analog zu oben
64 T (t) = const. − 5 (2π )8/3 (2G M)5/3 t 5c
3/8
472
16 Gravitationswellen
und lässt sich mit der Anfangsbedingung T (0) = T0 sowie mit 8/3
te =
5c5 T0
(16.83)
64 (2π )8/3 (2G M)5/3
als
T (t) = T0
t 1− te
3/8 (16.84)
schreiben, wobei te wieder die Zerfallszeit des Systems ist, dieses Mal ausgedrückt durch T statt R. Der Hulse-Taylor-Pulsar Das Paradebeispiel für einen indirekten Nachweis von Gravitationswellen liefert das Doppelsternsystem PSR B1913+16, das aus zwei sich umkreisenden Neutronensternen besteht, von denen einer ein Pulsar (d. h. ein Stern, der sehr regelmäßige wiederkehrende elektromagnetische Signale abgibt) und der andere für uns unsichtbar ist. Ein solches Doppelsternsystem (auch Binärpulsar genannt) wurde erstmals 1974 von den Astronomen Joseph Taylor und Russell Hulse entdeckt, und statt astronomisch korrekt PSR B1913+16 wird es auch einfach Hulse-Taylor-Pulsar genannt. Dieser Binärpulsar emittiert Gravitationswellen in einer solchen Stärke, dass sich seine Bahnparameter über einen Zeitraum von mittlerweile mehr als 40 Jahren merklich verändert haben. Die genauen astronomischen Daten des HulseTaylor-Pulsars (Stand: 2016) sind nach [39]: • • • • • •
Entfernung zur Erde: 6,9 kpc ≈ 22,500 Lichtjahre, Pulsperiode, d. h. mittlere Drehzeit des Pulsars: 59 ms, Masse des Pulsars: 1,44 Sonnenmassen, m p = 1,44 M , Masse des unsichtbaren Begleiters („companion“): m c = 1,39 M , Umlaufzeit der beiden Sterne: T = 7 h 45 min, Da die Umlaufbahn stark von einer Kreisbahn abweicht (die Exzentrizität der Ellipsenbahn, siehe (15.11), ist ε = 0,62), beträgt der Abstand der Neutronensterne im Peria stron (sternnächster Punkt) 1,1 Sonnenradien R = 696,342 km und im Apastron (sternfernster Punkt) 4,8 Sonnenradien.
Wir rechnen mit (16.82) die Periodenänderung für den Fall M = 1,44 M und T = 7,75 h aus und erhalten mit c5 = 2,4 · 1042 , (2π )8/3 = 134,4, M 5/3 = 5,8 · 1050 , G 5/3 =
23,8 , T 5/3 = 2,6 · 107 1055/3
für die Veränderung von T pro Sekunde: 24 1 T˙ = − 5 (2π )8/3 (2G M)5/3 5/3 ≈ −2,3 · 10−13 5c T
16.6
Nachweis von Gravitationswellen
473
Dieser Wert ist nur eine grobe Schätzung, da wir bei der Herleitung von (16.82) gleiche Massen und einen Kreis als Umlaufbahn angenommen haben. Die Massengleichheit ist fast erfüllt, die Kreisbahnhypothese aber nicht. Der mit der „richtigen“ Formel 192π G T˙ = − 5c5
5/3
T 2π
−5/3
73 2 4 1 + 24 ε + 37 m pmc 96 ε 7/2 1/3 2 1−ε m p + mc
(16.85)
(siehe [39]) berechnete Wert beträgt T˙ = −2,4025 · 10−12
(16.86)
und stimmt zu 0,2 % mit den gemessenen Werten überein. Ist die Umlaufbahn ein Kreis, d. h., die Exzentrizität ist ε = 0, und sind die Massen gleich, so ergibt sich aus (16.85) sofort die Differenzialgleichung (16.82). Die Abnahme der Umlaufzeiten in (16.86) beläuft sich auf 75 Millionstel Sekunde pro Jahr. In Abb. 16.5 ist die kumulierte Verkleinerung der Bahnperiode von 1975 bis 2013 für den Hulse-Taylor-Pulsar dargestellt, der Unterschied in diesen 38 Jahren beträgt mehr als
Abb. 16.5 Abnahme der Umlaufzeit im Hulse-Taylor-Pulsarsystem. (Quelle: [41])
474
16 Gravitationswellen
eine Minute. Die durchgezogene Linie, die die Vorhersage der Allgemeinen Relativitätstheorie wiedergibt, ist keine gerade Linie, sondern fällt immer steiler ab, was nochmals den Verstärkungseffekt der Abstrahlungsleistung von Gravitationswellen bei Abnahme der Umlaufzeiten dokumentiert. Für diesen ersten indirekten Nachweis von Gravitationswellen und die damit verbundene Bestätigung der Allgemeinen Relativitätstheorie erhielten die Entdecker des Binärpulsars PRS B1913+16, Hulse und Taylor, den Nobelpreis des Jahres 1993. Direkter Nachweis von Gravitationswellen In Abschn. 16.3 haben wir gesehen, dass sich physikalische Abstände in der Ebene senkrecht zur Ausbreitungsrichtung von Gravitationswellen periodisch ändern. Die relative Längenänderung beträgt nach (16.32) und (16.46) δL 1 G2 M 2 R2 ≈ h= 4 = s , L 2 c rR 4r R
(16.87)
wobei h die Amplitude der Gravitationswelle und Rs wieder den Schwarzschild-Radius bezeichne. In (16.45) haben wir gezeigt, dass die Frequenz f GW einer Gravitationswelle das Doppelte der Umlauffrequenz eines Doppelsternsystems ist, d. h., mit (16.43) folgt 1/2
f GW =
2ω c Rs (G M)1/2 = = . 3/2 2π 2π R π (2R)3/2
Resonanzdetektoren Die Suche nach Gravitationswellen hat eine lange Geschichte, die in den 1960er-Jahren mit den Experimenten von Joseph Weber an einem von ihm entwickelten zylinderförmigen Resonanzdetektor (auch Weber-Zylinder genannt) begonnen hat. Trifft eine Gravitationswelle einen solchen Zylinder, so wird er in Schwingungen versetzt. Diese wiederum lassen sich mit piezoelektrischen Messgeräten in elektrische Impulse umwandeln und nachweisen. Die Messgenauigkeit der modernen Resonanzdetektoren liegt bei einer relativen Längenänderung von etwa 10−18 bis 10−19 , siehe [57]. Beispiel 16.4
Um ein Gefühl für eine solche Größenordnung zu bekommen, berechnen wir die relative Längenänderung für den Hulse-Taylor-Pulsar, wobei wir allerdings unterstellen, dass • die Massen der beiden Sterne gleich sind, M = m p = m c = 1,4M , • sie auf einer Kreisbahn mit Radius R = 109 m umeinander kreisen, • sie von der Erde einen Abstand von r = 25,000 Lj = 2,1 · 1020 m haben
16.6
Nachweis von Gravitationswellen
475
• und auf der Erde die freien Testteilchen L = 103 m voneinander entfernt angebracht sind. Dann ergibt sich 1 G2 M 2 δL ≈ h≈ 4 ≈ 2, 1 · 10−23 . L 2 c rR Da die Länge von Resonanzdetektoren 1 − 2 m beträgt, benötigt also ein Detektor für den Nachweis einer solchen Gravitationswelle eine Empfindlichkeit von 10−23 m, d. h. eine, die um mehrere Zehnerpotenzen besser sein muss als die oben genannte Messgenauigkeit. Für den Nachweis von Gravitationswellen mit einem Weber-Zylinder benötigt man außerordentlich starke Gravitationsquellen. Beispiel 16.5
Wir betrachten die Verschmelzung von zwei (fiktiven) Schwarzen Löchern mit jeweils zehn Sonnenmassen in unserer Milchstraße. Dazu nehmen wir an, dass die beiden Schwarzen Löcher einen Abstand haben, der dem Zehnfachen ihres Schwarzschild-Radius entspricht, und dass sie r = 25,000 Lj von der Erde entfernt sind. Dann folgt mit (16.87) 2 1,5 · 104 Rs2 δL ≈ = = 1,8 · 10−18 . L 4r R 4 · 2,1 · 1020 · 1,5 · 105 Damit wäre die Verschmelzung zweier nicht allzu weit entfernter Schwarzer Löcher grundsätzlich mit einem Weber-Zylinder messbar. Interferometer Da aber solche Ereignisse extrem selten sind und es auch noch andere Schwierigkeiten (wie z. B. die Unterdrückung von akustischem und thermischem Rauschen) mit dem Resonanzdetektor gab, hat man in den 1970er-Jahren angefangen, als Gravitationswellendetektoren sogenannte Laserinterferometer (siehe Abb. 16.6) zu bauen. Die Abbildung zeigt ein (stark vereinfachtes) Interferometer, so wie es das Projekt LIGO (Laser Interferometer Gravitational-Wave Observatory) zum Nachweis von Gravitationswellen einsetzt. Der grundsätzliche experimentelle Aufbau von Interferometern ist schon seit dem 19. Jahrhundert bekannt (man denke an das berühmte Michelson-Morley-Experiment zum Nachweis des Äthers, siehe z. B. [1]). Das LIGO-Interferometer beruht auf dem Wirkungsprinzip, dass Laserlicht an einem Strahlteiler in zwei Teilstrahlen aufgeteilt wird, die sich senkrecht zueinander in Vakuumröhren der Länge L auf zwei frei bewegliche „Spiegel 2“ zu bewegen, dort reflektiert und auf ebenfalls frei bewegliche halbdurchlässige „Spiegel 1“ treffen, an denen sie reflektiert und wieder zu Spiegel 2 gelenkt werden. Dieser
476
16 Gravitationswellen
Abb. 16.6 Laserinterferometer
Prozessschritt wird ungefähr 280-mal wiederholt, was in Abb. 16.6 durch die fetten „Lichtstrahlen“ zwischen den beiden Spiegeln 1 und 2 dargestellt wird. Durch diese wesentliche Erweiterung gegenüber einem normalen Michelson-Interferometer wird die Armlänge L auf 1120 km vergrößert, siehe [42]. Im nächsten Schritt werden die Teilstrahlen zum Strahlteiler zurückgeführt, dort überlagert und gemeinsam zur Messung ihrer Interferenz in den Photodetektor gelenkt. Wenn eine Gravitationswelle auf die Interferometerarme trifft, so werden die Abstände zwischen den Spiegeln 1 und 2 in der einen Richtung verlängert und in der anderen gestaucht und dann umgekehrt, so wie wir es in Abschn. 16.3 beschrieben haben. Dadurch verändert sich das Interferenzmuster (die beiden Teilstrahlen sind nicht mehr „in Phase“) in typischer Weise, und die Gravitationswelle kann mit dem Photodetektor identifiziert werden. Neben der Verlängerung der Arme, der Verfeinerung der optischen Geräte sowie der Erhöhung der Laserleistung stand für das LIGO-Projekt auch die Dämpfung des auf der Erde vorhandenen Rauschens ganz oben auf der Tagesordnung. Zum Nachweis von Gravitationswellen müssen bei Messung der Auslenkungen der Spiegel andere mögliche Schwingungsquellen ausgeschlossen werden. Es gibt viele Rauschquellen, die bei verschiedenen Frequenzen unterschiedliche Auswirkungen haben. Unterhalb von 10 Hz dominieren die seismischen Schwingungen. Gravitationswellen mit solchen Frequenzen können von LIGO
16.6
Nachweis von Gravitationswellen
477
nicht entdeckt werden. Am anderen Ende im Kilohertzbereich ist das sogenannte Quantenrauschen der limitierende Faktor. Die besten Resultate erzielt LIGO bei Gravitationswellen mit Frequenzen im Bereich zwischen 100 und 1000 Hz, siehe [39]. Das LIGO-Interferometer hat in den über 25 Jahren seines Bestehens durch ständige Verbesserungen eine Sensitivität von etwa 10−19 m erreicht und ist damit in der Lage, Gravitationswellen mit Amplituden bis 10−23 m und Frequenzen im Bereich 50 − 1500 Hz zu detektieren. Beispiel 16.6
Wir rechnen für die Beispiele 16.4 und 16.5 die jeweiligen Frequenzen der emittierten Gravitationswellen aus. 1. Für den Hulse-Taylor-Pulsar gilt momentan 1/2
f GW =
c Rs
π (2R)3/2
1/2 3 · 108 · 4 · 103 1,9 · 1010 = ≈ = 6,9 · 10−5 s −1 , 3/2 13 9 8,9 · 3, 1 · 10 π 2 · 10
damit liegen die Frequenzen außerhalb des LIGO-Bandes. Erst wenn die beiden Neutronensterne kurz vor dem Zusammenstoß stehen und ihr Abstand etwa ihrem Schwarzschild-Radius entspricht (z. B. R = 3 · 104 m), beträgt die Frequenz der ausgesandten Gravitationswellen 1/2
f GW =
c Rs
π (2R)3/2
=
1/2 3 · 108 · 4 · 103 1,9 · 1010 = 4,1 · 102 s −1 . 3/2 ≈ 6 4 8,9 · 5,2 · 10 π 2 · 3 · 10
Die Verschmelzung der beiden Neutronensterne kann also (theoretisch) durch das LIGO-Interferometer gemessen werden, allerdings müssen die Forscher bis zu diesem Ereignis noch ca. 300 Mio. Jahre warten, siehe [39]. 2. Im Beispiel 16.5 über die Verschmelzung zweier (fiktiver) Schwarzer Löcher beträgt die Frequenz der emittierten Gravitationswellen mit den obigen Beispieldaten: 1/2
f GW =
c Rs
π (2R)3/2
1/2 3 · 108 · 1, 5 · 104 3,7 · 1010 = ≈ = 72 s −1 , 3/2 16,3 · 3, 1 · 107 π 3 · 105
d. h., die bei der Verschmelzung ausgesandten Gravitationswellen könnten mit dem LIGO-Interferometer gemessen werden.
478
16 Gravitationswellen
GW150914 Am 14. September 2015 wurde zum ersten Mal eine Gravitationswelle auf der Erde gemessen. Die 4 km langen Arme der beiden LIGO-Detektoren, die baugleich in den USA in Hanford und Livingston stehen, wurden von einer Gravitationswelle getroffen und dabei nur um den tausendstel Teil eines Protonradius ≈ 10−18 m ausgelenkt. Dieses Ereignis trägt den Namen GW150914 und wurde nach monatelangen sorgfältigen Prüfungen durch etliche der rund tausend am LIGO-Projekt beteiligten Wissenschaftler am 11. Februar 2016 verkündet. Das Signal wurde von den beiden LIGO-Detektoren in einem zeitlichen Abstand von 6,9 ms registriert, was genau die Zeit ist, die das Licht braucht, um die Entfernung zwischen den beiden Laboren zurückzulegen. Damit wurde auch erstmals gemessen, dass Gravitationswellen sich - wie von der Theorie vorhergesagt - mit Lichtgeschwindigkeit ausbreiten. Abb. 16.7, die aus der Erstveröffentlichung des LIGO-Projekts [43] stammt, veranschaulicht verschiedene mit den Detektoren gemessene Eigenschaften des Gravitationswellensignals. Im oberen Drittel der Abbildung sehen wir links das in Hanford gemessene Signal. Im rechten oberen Kasten ist die Aufzeichnung aus Livingston dunkel eingetragen; das um 6, 9 ms verschobene Hanford-Signal ist dort hell unterlegt ebenfalls dargestellt, sodass
Abb. 16.7 GW150914. (Quelle [43])
16.6
Nachweis von Gravitationswellen
479
man deutlich sehen kann, dass der Verlauf beider Signale in etwa übereinstimmt. Lokale terrestrische Auslöser können damit so gut wie ausgeschlossen werden. Horizontal ist die Zeit in Sekunden aufgetragen. Wir sehen, dass das ganze Ereignis nur 0,2 s lang gedauert hat. δL An der vertikalen Achse steht im oberen Bereich die relative Längenänderung (englisch: L strain) in Einheiten von 10−21 . Wenn wir für die Armlänge L = 4 · 103 m einsetzen, dann folgt δL 10−18 ∼ = 10−21 , L 103 sodass diese vertikale Skalierung Sinn bekommt. In den beiden darunter liegenden Kästchen sind die Signale eingetragen, die aus einer theoretischen numerischen Kalkulation stammen, die wegen der Stärke der gravitativen Effekte auf den vollen (und nicht auf den linearen) Einstein-Gleichungen aufsetzt. Darunter sieht man die Differenz der gemessenen und der theoretisch numerischen Signale. Ganz unten kann man (etwas verschwommen) die Frequenzentwicklung an den hellen Streifen ablesen, die Frequenzen wachsen von 35 Hz bis auf 150 Hz und fallen bei ca. 0,42 s rapide ab. Das deutet auf ein System von zwei Objekten hin, die immer enger und damit schneller einander umkreisen und dann verschmelzen. Wenn wir den Zeitablauf etwas genauer betrachten, so können wir drei Phasen unterscheiden, siehe auch [43]: 1. Inspiral: Frequenzen und Amplituden nehmen zu, d. h., die beiden Objekte nähern sich an. 2. Merging: Die Amplitude wird maximal und chaotisch, d. h., die beiden Objekte stoßen zusammen und verschmelzen. 3. Ringdown: Amplituden und Frequenzen fallen rapide ab und verschwinden dann ganz. Das neugeformte Objekt emittiert nur geringe und schließlich keine Gravitationswellen mehr. Ein solches Signal wird auch Chirp („Gezwitscher“) genannt, was in der Technik eine ansteigende Frequenz bedeutet. Da in der Inspiralphase bei einem Chirp-Signal die (noch kleinen) Frequenzen anwachsen, können aus diesem Frequenzverhalten die Massen M1 und M2 im Binärsystem berechnet werden, indem man die sogenannte Chirp-Masse MChir p =
(M1 M2 )3/5 (M1 + M2 )1/5
als Funktion der Frequenz und deren zeitlicher Ableitung ausdrückt: MChir p
c3 = G
!
5 f˙GW 11/3
96π 8/3 f GW
"3/5 ,
(16.88)
480
16 Gravitationswellen
siehe [43]. Den Beweis führen wir hier nicht, man beachte aber die Ähnlichkeit von (16.88) mit der Differenzialgleichung für die Periode T (16.82) im Spezialfall gleicher Massen. Für das Ereignis GW150914 liegt die Chirp-Masse bei ca. 30 Sonnenmassen. Mit folgender Überlegung können wir die Gesamtmasse M1 + M2 der beiden Objekte abschätzen. Es gilt 0 ≤ (M1 − M2 )2 ⇔ 4M1 M2 ≤ (M1 + M2 )2 ⇔ ⇒
(4M1 M2 )3/5 (M1 + M2 )6/5
≤1⇔
(M1 M2 )3/5 (M1 + M2 )1/5
4M1 M2
(M1 + M2 )2 M1 + M2 ≤ , 26/5
≤1
woraus M1 + M2 ≥ 26/5 MChir p ≈ 70M
(16.89)
folgt. Unterstellen wir gleiche Massen M1 = M2 = 35M , so liegt der SchwarzschildRadius eines Objektes bei 2G M1 Rs = ≈ 105 km. c2 Wenn zwei Objekte mit der Umlauffrequenz von ω = 2π · 75 Hz (die Hälfte des Maximums der Gravitationswellenfrequenz) einander umkreisen, gilt für Abstand D der beiden Objekte auf einer (kreisförmigen) Umlaufbahn mit dem Kepler-Gesetz (16.75) 1/3 6,7 · 35 · 2 · 1030 (G M)1/3 D = 2R = 2 1/3 2/3 ≈ 2 ≈ 350 km. 4 ω 4 · 39,5 · 5625 · 1011 Die beiden Objekte müssen also sehr kompakt sein, d. h., einen Radius in der Größenordnung ihres Schwarzschild-Radius haben. Es kommen daher nur Neutronensterne oder Schwarze Löcher infrage. • Neutronensterne haben eine Massenobergrenze von ca. drei Sonnenmassen, damit scheidet ein Binärsystem mit Neutronensternen aus. • Ausschließen kann man auch ein Doppelsternsystem bestehend aus einem Neutronenstern und einem Schwarzen Loch, da wegen der großen Masse des Schwarzen Lochs die Umlauffrequenz geringer ausgefallen wäre (siehe [43]). • Man hat also am 14.09.2015 die Verschmelzung zweier Schwarzer Löcher beobachtet und aus den gemessenen Daten die Massen M1 = 29 M und M2 = 36 M durch numerische Kalkulation der vollen Einstein-Gleichungen ermittelt. Deren Summe liegt bei 65 Sonnenmassen, d. h., wir haben oben in (16.89) die (in der linearen Näherung berechnete) Gesamtmasse überschätzt. Das neu entstandene Objekt ist ein rotierendes Schwarzes Loch mit einem Kerr-Parameter a = 0,67 (siehe (21.18) in Kap. 21) und hat eine Masse von 62 Sonnenmassen, d. h., in nur 0,2 s wurde die Energie von drei Sonnenmassen in Form von Gravitationswellen abgestrahlt! Die dabei erreichte Leuchtkraft liegt nach (16.71) bei unvorstellbaren
16.6
Nachweis von Gravitationswellen
L GW ≈
Rs D
481
5 · 1052 Watt ≈ 2, 4 · 1049 Watt,
also ein noch höherer Wert als bei der Verschmelzung zweier (fiktiver) Neutronensterne in Beispiel 16.3. Erstaunlich ist auch, dass die Verschmelzung der beiden Schwarzen Löcher sich in 1, 3 Mrd. Lichtjahren Entfernung von uns ereignete, d. h., die Gravitationswelle hat 1,3 Mrd. Jahre gebraucht, um zu uns zu gelangen. Neuere Entdeckungen und Ausblick Im Zeitraum von September 2015 bis August 2017 wurden neben dem Ereignis GW150914 zehn weitere Verschmelzungen von Binärsystemen aufgezeichnet. Von diesen insgesamt elf Ereignissen sind zehn Verschmelzungen von Schwarzen Löchern. Im Ereignis GW170817 wurde erstmals die Vereinigung zweier Neutronensterne beobachtet, siehe [44]. Neben dem weiteren Ausbau der bestehenden Detektoren werden zukünftig weitere hinzukommen. Wir führen hier nur einige beispielhaft auf, eine ausführliche Beschreibung der momentanen Planungen findet man in [39]. • Die LIGO-Kooperationsgemeinschaft besteht neben den beiden Observatorien in den USA aus den Interferometern Geo600 in Deutschland sowie Virgo in Italien (seit August 2017). Hinzugekommen ist Anfang 2020 der japanische Gravitationswellendetektor KAGRA, und in Planung befindet sich der Bau eines Detektors LIGO-India in Indien (geplanter Start 2024). Mit dieser weltweiten Verteilung werden die Messungen zuverlässiger, und man kann bei Gravitationswellen viel genauer ihren Ort der Entstehung im Universum bestimmen. • Das Laser Interferometer Space Antenna (LISA) ist ein von der ESA geplanter Gravitationswellendetektor im All. Dabei sollen drei Satelliten ein Dreieck mit jeweils 2,5 Mio. km Seitenlänge bilden. LISA wird wegen des Fehlens von seismischen Störungen in der Lage sein, Gravitationswellen mit Frequenzen zwischen 0,001 und 1 Hz zu messen. Damit können zum Beispiel zwei sich umkreisende supermassenreiche Schwarze Löcher aufgespürt werden (geplanter Start 2034).
Teil IV Gravitationskollaps und Schwarze Löcher
In diesem Teil beschreiben wir zunächst die grundsätzlichen Mechanismen, die zu einem durch die Gravitation bedingten Kollaps eines Sterns führen können. Wir leiten die innere Schwarzschild-Lösung für kugelsymmetrische stationäre Sterne her und berechnen mit ihr den Druck und die Dichte im Sterneninneren. Die resultierende Tolman-Oppenheimer- Volkoff-Gleichung beschreibt das relativistische hydrostatische Gleichgewicht im Inneren eines Sterns. Unterschreitet der Radius eines kollabierenden Sternes den Schwarzschild-Radius, so spricht man von einem Schwarzen Loch. Wir leiten mithilfe der äußeren SchwarzschildMetrik einige Eigenschaften von nichtrotierenden Schwarzen Löchern ab und führen Eddington-Finkelstein- und Kruskal-Koordinaten ein, um auch physikalische Aussagen über den Bereich innerhalb des Schwarzschild-Radius machen zu können. Neben den Raumzeitdarstellungen zur Visualisierung Schwarzer Löcher entwickeln wir zum einen Einbettungsdiagramme, die einen zweidimensionalen Ausschnitt der Raumzeit in einen flachen dreidimensionalen Raum abbilden, und zum anderen die Penrose- Diagramme, die auf dem Prozess der konformen Kompaktifizierung basieren und mit denen man insbesondere auch das Verhalten von relativistischen Objekten im Unendlichen optisch darstellen kann. Wir erhalten die Reissner-Nordström-Metrik zur Beschreibung geladener Schwarzer Löcher, indem wir die Einstein-Maxwell-Gleichungen mit dem Energie-Impuls-Tensor der Elektrodynamik lösen. Die Reissner-Nordström-Metrik ist eine Erweiterung der äußeren Schwarzschild-Metrik und wie diese asymptotisch flach. Wir untersuchen die Horizontstrukturen für drei verschiedene Energiekonstellationen und erhalten für den Fall, dass die Gesamtenergie größer als die elektromagnetische Energie ist, drei unterschiedliche Raumzeitbereiche, in denen die Reissner-Nordström-Metrik regulär ist. Wie im Fall der Schwarzschild-Metrik führen wir Eddington-Finkelstein-Koordinaten ein und stellen die Reissner-Nordström-Raumzeit durch ein Penrose-Diagramm dar. Dabei wird deutlich, dass die benutzte Mathematik das Durchqueren eines Teilchens durch ein Wurmloch zwischen zwei Universen erlaubt.
484
Teil IV Gravitationskollaps und Schwarze Löcher
Wir leiten die 1963 gefundene Kerr-Metrik, die ungeladene rotierende Schwarze Löcher beschreibt, mithilfe von Nulltetraden und einer komplexwertigen Transformation der Eddington-Finkelstein-Koordinaten der Schwarzschild-Metrik her. Die BoyerLindquist-Koordinaten bieten für die Untersuchung der wichtigsten Eigenschaften der Kerr-Lösung die gebräuchlichste Form. Die Kerr-Lösung führt zur SchwarzschildLösung, wenn der Drehimpuls des Schwarzen Loches null ist. Die Kerr-Lösung ist stationär (aber nicht statisch) und rotationssymmetrisch sowie asymptotisch flach. Die intrinsische Singularität der Kerr-Metrik hat im Gegensatz zu der der SchwarzschildMetrik (r = 0) eine Ringstruktur. Wie bei der Reissner-Nordström-Lösung gibt es in den wichtigsten Fällen drei Raumzeitbereiche, in denen die Kerr-Metrik regulär ist. Und auch in der Kerr- Raumzeit kann ein Teilchen theoretisch Paralleluniversen erreichen. Wir berechnen, dass ein Teilchen in der Ergosphäre (außerhalb des Ereignishorizonts) durch die Rotation des Schwarzen Loches mitgerissen wird und nicht in Ruhe verharren kann. Mit dem Penrose- Prozess zeigen wir auf, dass wir aus der Ergosphäre eines rotierenden Schwarzen Loches Energie gewinnen können.
Gravitationskollaps und die innere Schwarzschild-Metrik
17
In diesem Kapitel gehen wir über die Anwendung der Allgemeinen Relativitätstheorie außerhalb unserer Sonne hinaus und wollen die Gleichungen zur Berechnung des Druckes und der Dichte von Materie im Inneren eines Sterns aufstellen. Wie Sterne (theoretisch) überhaupt entstehen können und welche Entwicklungsstufen durchlaufen werden, können wir in diesem Buch nicht detailliert beschreiben. Wir beschränken uns deshalb auf eine überblicksartige Darstellung von speziellen Entwicklungsmodellen von Sternen. Wir wollen unter einem Stern eine Materieansammlung verstehen, die durch ihre eigene Gravitation zusammengehalten wird. Diese Gravitationskraft tendiert dazu, den Stern immer weiter zu komprimieren. Der Stern kann das Zusammenfallen nur so lange verhindern, wie seine Materie dem Gravitationsdruck widerstehen kann. Wenn wir auch Planeten als Sterne betrachten, so gelingt das der Erde, weil die Atome im Inneren entsprechend viel Gegendruck aufbauen können. Bei Sternen, die etwa die Masse unserer Sonne haben, reicht die Atomstruktur nicht mehr aus, um der Gravitation zu widerstehen. Hier wird der benötigte Materiedruck durch Kernfusionen verschiedenster Art hergestellt. Ist das Fusionsmaterial verbraucht, kühlt sich der Stern durch Abstrahlung ab, und die durch die Fusionen entstandenen Atome wie z. B. Helium oder Eisen schaffen es nicht, dem Gravitationsdruck standzuhalten. Sie werden quasi „zerquetscht“, und es entsteht für Sterne in der Größenordnung unserer Sonne ein Elektronengas, dessen sog. Fermi-Druck („Entartungsdruck“) der Gravitation entgegenwirkt. Der Fermi-Druck hat seine Ursache im Pauli-Prinzip, das verbietet, dass zwei Fermionen (z. B. Protonen, Elektronen oder Neutronen) einen identischen Quantenzustand annehmen können. Daher würde eine weitere Kompression bedeuten, dass sich Fermionen in höhere Energiezustände begeben müssten, sodass weitere Fermionen in das betrachtete Volumen eintreten und so die Dichte erhöhen könnten. Sterne, die durch den Fermi-Druck einen Gleichgewichtszustand erreicht haben, nennt man Weiße Zwerge. Weiße Zwerge haben also ungefähr die Masse unserer Sonne M ≈ M und einen Radius, der etwa 6000 km beträgt, also beinahe dem Erdradius entspricht.
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_17
485
486
17 Gravitationskollaps und die innere Schwarzschild-Metrik
Ist die Masse des Sterns größer als die unserer Sonne (die theoretische obere Schranke beträgt (nur!) ca. 1, 4 M und heißt nach ihrem Entdecker Chandrasekhar-Grenzmasse), so kann der Fermi-Druck der Gravitation nicht standhalten. Durch die weitere Kontraktion können Elektronen und Protonen in Neutronen umgewandelt werden, und wieder kann der Fermi-Druck der Neutronen in ein Gleichgewicht mit dem Gravitationsdruck kommen. Sterne mit dieser Eigenschaft nennt man Neutronensterne. Ein (fiktiver) Neutronenstern mit Sonnenmasse hat nur noch einen Radius r von etwa 10 km, d. h., der Radius ist nicht allzu weit von dem Schwarzschild-Radius entfernt (r ≈ 3 rs ). Doch die Umwandlung in Neutronensterne ist bei noch größeren Massen der Sterne (auch hier gibt es eine Abschätzung der Grenzmasse, nämlich der Bereich von 1, 3 bis 3, 2 Sonnenmassen, die sog. TolmanOppenheimer-Volkoff-Grenze) nicht die einzige Möglichkeit. Ist die Masse größer als die Grenzmasse, so kontrahieren auch Neutronensterne weiter und werden schließlich zu Schwarzen Löchern.
17.1
Einführendes Beispiel: Innere Lösung in der Elektrodynamik
Wir starten mit einem bekannten analogen Beispiel einer inneren Lösung aus der Elektrodynamik im dreidimensionalen euklidischen Raum und schauen uns die Lösung der Maxwell’schen Gl. (5.2) ∇ · E = ρ (17.1) an, wobei E den elektrischen Feldstärkevektor und ρ die Ladungsdichte in einem kugelförmigen Körper Vges mit Radius R bezeichnen. Die äußere Lösung erhalten wir mithilfe des Gauß’schen Gesetzes (siehe z. B. [1]) 1 Eout (r ) = Q ges 2 rˆ , r > R, r wobei Q ges die Gesamtladung der Kugel ist. Das äußere Feld hängt also nicht von der speziellen Ladungsverteilung innerhalb der Kugel ab, es ist das gleiche wie bei einer Ladungsverteilung, bei der alle Ladungen im Zentrum konzentriert sind. Wenn wir uns in das Innere der Kugel begeben und die Maxwell-Gleichung (17.1) lösen wollen, so müssen wir Kenntnisse über die Ladungsdichte ρ haben. Wir wollen hier einen einfachen Spezialfall behandeln und unterstellen, dass die Kugel gleichmäßig geladen ist, d. h., dass die Ladungsdichte konstant ist: ρ∗ r ≤ R ρ (r ) = 0 r>R
17.1
Einführendes Beispiel: Innere Lösung in der Elektrodynamik
487
Dann folgt für die Gesamtladung Q ges =
dr ρ (r ) = Vges
4 π R 3 ρ∗ 3
bzw.
3 Q ges . 4π R 3 Nun integrieren wir beide Seiten von Gl. (17.1) und erhalten d x 3 ∇ · Ein = d x 3 ρ∗ , ρ∗ =
V (r )
V (r )
(17.2)
(17.3)
wobei V (r ) die Teilkugel mit Radius r bezeichnet, siehe Abb. 17.1. Die linke Seite rechnen wir mit dem Gauß’schen Satz (10.42) weiter aus: 3 d x ∇ · E in = da Ein , E in · d a = V (r )
∂ V (r )
∂ V (r )
da wegen der Kugelsymmetrie die Feldstärke Ein genauso nach außen zeigt wie das Flä chenelement d a . Da E in auf der Oberfläche der Teilkugel konstant ist, ergibt sich für die linke Seite von (17.3) 3 d x ∇ · E in = da Ein = Ein 4πr 2 . V (r )
∂ V (r )
Für die rechte Seite erhalten wir mit (17.2) 4 r3 d x 3 ρ∗ = πr 3 ρ∗ = Q ges 3 3 R V (r ) und insgesamt die innere Lösung: Ein (r ) =
Abb. 17.1 Gleichmäßig geladene Kugel
Q ges r rˆ 4π R 3
488
17 Gravitationskollaps und die innere Schwarzschild-Metrik
Wenn wir die innere mit der äußeren Lösung vergleichen, so stellen wir fest: 1. Die beiden Lösungen stimmen für r = R überein. 2. Die innere Lösung hat ein komplett anderes Verhalten als die äußere: Die innere wächst linear mit wachsendem r , die äußere fällt mit wachsendem r quadratisch ab.
17.2
Innere Schwarzschild-Metrik
Wir gehen bei unseren Betrachtungen davon aus, dass der zu untersuchende Stern kugelsymmetrisch und statisch ist. In Abschn. 14.1 haben wir für einen solchen Fall die Standardform der Metrik hergeleitet: ds 2 = −e2a(r ) dt 2 + e2b(r ) dr 2 + r 2 dϑ 2 + r 2 sin2 ϑ dϕ 2
(17.4)
Die beiden unbekannten Funktionen a(r ) und b(r ) können allerdings nicht auf die gleiche Art wie im oben genannten Abschnitt berechnet werden, da wir uns nun in das Innere eines Sterns begeben wollen. Um dafür die Feldgleichungen aufzustellen, benötigen wir den Energie-Impuls-Tensor für die Sternenmaterie, von der wir unterstellen wollen, dass sie als ideales Fluid vorliegt. Nach Gl. (13.8) lautet der Energie-Impuls-Tensor für ein solches Fluid T μν = (ρ + p) U μ U ν + p g μν bzw. Tμν = (ρ + p) Uμ Uν + p gμν .
(17.5)
Da wir statische Sterne untersuchen, ist das Fluid zeitlich konstant. Das bedeutet, dass Dichte und Druck zeitlich unabhängig sind, wegen der Kugelsymmetrie nur von der Koordinate r abhängen p = p (r ) , ρ = ρ (r ) und dass das Fluid keine Geschwindigkeit besitzt, d. h., die räumlichen Koordinaten der Eigengeschwindigkeit U des Fluids sind gleich null: U = U t , 0, 0, 0 Wir wollen die Funktionen a(r ) und b(r ) mithilfe der Einstein-Gleichungen bestimmen und dazu das Ergebnis (14.12) nutzen. Da wir dort die Komponenten des Einstein-Tensors in nichtholonomen Koordinaten berechnet haben, müssen wir den Energie-Impuls-Tensor ebenfalls in dieser Basis darstellen. In der nichtholonomen Basis gilt aber nach (14.7) g = ds 2 = ηαβ eα ⊗ eβ . Der Energie-Impuls-Tensor im Ruhesystem des Fluids vereinfacht sich also zu dem in Kap. 6 für die Spezielle Relativitätstheorie (6.12) hergeleiteten:
17.2
Innere Schwarzschild-Metrik
489
⎛
ρ ⎜0 Tαβ = ⎜ ⎝0 0
0 p 0 0
0 0 p 0
⎞ 0 0⎟ ⎟ 0⎠ p
(17.6)
Aus (14.12) folgt, dass es drei unabhängige Einstein-Gleichungen gibt: 1. Die tt-Gleichung: 1 − e−2b r2
2. Die rr -Gleichung: 1 − 2 + e−2b r
1 2b − r2 r
2a 1 + r2 r
= 8π Gρ
(17.7)
= 8π Gp
(17.8)
3. Die ϑϑ-Gleichung:
2 a − b = 8π Gp e−2b a + a − a b + r
(17.9)
Die ϕϕ-Gleichung liefert keinen zusätzlichen Beitrag, da sie identisch mit der ϑϑ-Gleichung ist. Die tt-Gleichung Wir formen die Gl. (17.7) etwas um: −8π Gρ = e
−2b
1 2b 1 − 2 − r2 r r
⇔ 1 − 8π Gρr 2 = −r e−2b 2b + e−2b = Integration ergibt re
−2b
= r − 8π G
r
d −2b re dr
dr r 2 ρ r + C
0
mit einer Integrationskonstanten C, die aber gleich null ist, was man einsieht, wenn r = 0 in die Gleichung eingesetzt wird. Damit erhalten wir 8π G r 2 2Gm (r ) (17.10) dr r ρ r = 1 − e−2b = 1 − r r 0
mit m (r ) := 4π
r
dr r 2 ρ r .
(17.11)
0
Wir haben die Funktion m (r ) schon suggestiv so geschrieben, dass der Term e−2b wie bei der externen Schwarzschild-Lösung aussieht. Dort war m (r ) die konstante
490
17 Gravitationskollaps und die innere Schwarzschild-Metrik
Schwarzschild-Masse M des Sterns, und tatsächlich wollen wir ja, dass die interne und externe Schwarzschild-Metrik an der Oberfläche des Sterns übereinstimmen, d. h., dass R dr r 2 ρ (r ) M = m (R) = 4π 0
gilt, wobei R den Radius des Sterns bezeichnet. Trotzdem müssen wir bei der Interpretation von m (r ) als „Masse des Sterninneren bis zum Radius r“ vorsichtig sein. Denn wenn wir uns den räumlichen Teil der Metrik (17.4): gi j d x i d x j = e2b dr 2 + r 2 dϑ 2 + r 2 sin2 ϑ dϕ 2 anschauen, so ergibt sich das Volumenelement zu det gi j d 3 x = eb r 2 sin ϑ dr dϑ dϕ. Die wirkliche integrierte Massen- bzw. Energiedichte ist also M˜ =
R
0
π
dr
dϑ 0
Die Differenz
2π
dϕ eb(r )r 2 ρ (r ) sin ϑ = 4π
0
R
dr
0
r 2 ρ (r )
2Gm (r ) 1− r
.
E B = M˜ − M > 0
kann man als Bindungsenergie interpretieren, die durch die gegenseitige gravitative Anziehung der Fluidelemente entsteht, siehe [20, 21]. Die rr -Gleichung Wir formen die Gl. (17.8) mithilfe von (17.10) um und erhalten
2Gm (r ) 2a 1 1 = 8π Gp. + − 2 + 1− r r r2 r Auflösen nach a ergibt a =
4π Gr 3 p + Gm (r ) . r (r − 2Gm (r ))
(17.12)
Bestimmungsgleichung für p (r ) Um zu einer Bestimmungsgleichung für den Druck p (r ) zu kommen, benutzen wir wegen der komplizierten Rechnungen nicht die ϑϑ-Gleichung (17.9), sondern die Divergenzfreiheit des Energie-Impuls-Tensors. Dass dadurch keine Informationen verloren gehen, d. h., dass beide möglichen Wege gleichwertig sind, kann man in [20] nachlesen.
17.2
Innere Schwarzschild-Metrik
491
Da wir einige frühere Ergebnisse nutzen wollen, transformieren wir zunächst die Komponenten des Energie-Impuls-Tensors in die Koordinatenbasis. Die Basistransformations μ matrix α ergibt sich mit (12.24) und (17.4) zu μ α = diag e−a , e−b , r −1 , (r sin ϑ)−1 , und wir erhalten ⎛
e2a ρ 0 −1 α −1 β ⎜ 0 e2b p Tμν = μ ν Tαβ = ⎜ ⎝ 0 0 0 0
⎞ 0 0 ⎟ 0 0 ⎟ 2 ⎠ r p 0 2 2 0 r sin ϑ p
sowie für die Eigengeschwindigkeit im Ruhesystem des Fluids μ −a U = μ α (1, 0, 0, 0) = (e , 0, 0, 0). Für die weitere Berechnung nutzen wir die Formel (13.44): √ 1 μ μν ∂ν −g, =√ −g woraus mit (11.37) für einen beliebigen (2, 0)-Tensor S μν μ
ν ∇μ S μν = ∂μ S μν + λμ S λν + λμ S μλ √ 1 ν ∂λ −g S λν + λμ = ∂μ S μν + √ S μλ −g √ 1 ν ∂λ −g S λν + λμ = √ S μλ −g
(17.13)
folgt. Für den (divergenzfreien) Energie-Impuls-Tensor (17.5) gilt 0 = ∇μ T μν = ∇μ pg μν + ∇μ (ρ + p) U μ U ν . Wir wenden (17.13) auf den zweiten Summanden der rechten Seite an und erhalten mit ∇μ g μν = 0: √ 1 ∂μ −g (ρ + p) U μ U ν 0 = ∇μ T μν = ∂μ p g μν + √ −g ν + λμ (ρ + p) U μ U λ
(17.14)
492
17 Gravitationskollaps und die innere Schwarzschild-Metrik
Aufgabe 17.1 Zeigen Sie, dass aus (17.14) die Gleichung
√ ∂λ p = − ∂λ ln −gtt (ρ + p)
(17.15)
folgt. Lösung Da U i = 0 für i = r , ϑ, ϕ gilt, bleibt im zweiten Summanden von (17.14) nur die Ableitung nach der Zeit übrig. Da aber alle Terme in der Klammer im zweiten Term zeitunabhängig sind, verschwindet der zweite Term komplett, und es ergibt sich nach Multiplikation mit gλν μ 2 ∂μ p δλ = − ttν gλν (ρ + p) U t .
Nun gilt wegen der Zeitunabhängigkeit der Metrik mit der Formel (11.47): 1 ttν = − g σ ν ∂σ gtt , 2 2 und wir erhalten mit U t = − (gtt )−1 1 1 ∂λ p = − g σ ν gλν (∂σ gtt ) (ρ + p) gtt−1 = − (∂λ gtt ) (ρ + p) gtt−1 . 2 2 Ähnlich wie in (13.43) folgt ∂λ ln und damit
√ 1 1 1 −gtt = − √ ∂λ gtt = ∂λ gtt √ −gtt 2 −gtt 2gtt √ ∂λ p = − ∂λ ln −gtt (ρ + p) .
Wir setzen in (17.15) gtt = −e2a ein, und es ergibt sich ∂λ p = − (∂λ a) (ρ + p) . Für λ = r und p = ∂r p erhalten wir daraus die wichtige „Ersatzgleichung“ für die ϑϑGleichung (17.9) p = −a (ρ + p) . (17.16) Die Gl. (17.15) ist wegen der Zeitunabhängigkeit der Größen für λ = t erfüllt. Für die Raumkoordinate λ = r hat sie große Ähnlichkeit mit der nichtrelativistischen Gleichung für das hydrostatische Gleichgewicht, nur dass hier statt der Massendichte die Summe
17.3
Innere Schwarzschild-Metrik für nichtkomprimierbare Fluide
ρ + p und statt des Newton’schen Gravitationspotenzials die Größe ln siehe [61].
493
√
−gtt erscheint,
Tolman-Oppenheimer-Volkoff-(TOV)-Gleichung Wir wollen die Gl. (17.16) benutzen, um die Abhängigkeit von a in Gl. (17.12) zu eliminieren, und erhalten (ρ + p) 4π Gr 3 p + Gm (r ) dp =− . (17.17) dr r (r − 2Gm (r )) Dies ist die Tolman-Oppenheimer-Volkoff-(TOV)-Gleichung, die das relativistische hydrostatische Gleichgewicht beschreibt. Da nach Gl. (17.11) m (r ) durch die Massendichte ρ bestimmt wird, setzt die TOV-Gleichung den Druck p (r ) und die Dichte ρ (r ) in Beziehung. Zustandsgleichung Um unser Problem komplett zu lösen, d. h., die vier unbekannten Funktionen a (r ) , b (r ) , ρ (r ) , p (r ) festzulegen, brauchen wir neben (17.11), (17.16) und (17.17) noch eine vierte Bestimmungsgleichung, eine sogenannte Zustandsgleichung. Eine solche beschreibt den Druck als eine Funktion der Dichte, der Entropie und der chemischen Zusammensetzung, siehe [25]. Unterstellt man, dass die Entropie und chemische Zusammensetzung im Inneren des Sterns konstant sind, so kann man den Druck als eine Funktion auffassen, die explizit nur von der Dichte abhängt: p (r ) = p (ρ (r )) (17.18) und somit auch nur implizit von der Koordinate r . Ein Beispiel ist die sogenannte polytrope Zustandsgleichung der Form p = K ργ mit dem polytropen Exponenten γ und einer Konstanten K . Mit den vier Bestimmungsgleichungen und geeigneten Anfangsbedingungen für m und ρ kann man grundsätzlich alle unbekannten Funktionen ermitteln. Die Lösungen können aber für vorgegebene Zustandsgleichungen oft nur mit großer Mühe gefunden oder müssen mit numerischen Verfahren angenähert werden. Wir wollen im Weiteren ein einfaches Beispiel durchrechnen.
17.3
Innere Schwarzschild-Metrik für nichtkomprimierbare Fluide
Wir nehmen an, dass das Fluid nichtkomprimierbar ist, d. h. eine konstante Dichte ρ∗ besitzt: ρ∗ r ≤ R , ρ (r ) = 0 r>R
494
17 Gravitationskollaps und die innere Schwarzschild-Metrik
wobei R wieder den Radius des Sterns bezeichne. Diese Gleichung ersetzt die explizite Zustandsgleichung (17.18), p (r ) kann durch die TOV-Gleichung ermittelt werden, wie wir weiter unten in (17.22) zeigen werden. Die getroffene Annahme konstanter Dichte trifft zwar nicht auf unsere Sonne zu, ist aber bei Neutronensternen annähernd erfüllt, sodass dieses Beispiel neben dem pädagogischen Wert der Einübung der Methoden auch einen physikalischen Zweck erfüllt. Die Funktion m (r ) können wir sofort durch Integration von (17.11) berechnen: ⎧ 4 3 ⎪ ⎪ πr ρ∗ r≤R ⎪ ⎨3 m (r ) = , (17.19) ⎪ ⎪ 4 ⎪ ⎩ π R3ρ = M r > R ∗ 3 wobei M die Schwarzschild-Masse des Sterns bezeichne. Daraus können wir mit (17.10) die rr -Komponente der Metrik weiter ausrechnen:
grr = e
2b
2Gm (r ) = 1− r
−1
8 Gπr 2 ρ∗ = 1− 3
−1
2G Mr 2 = 1− R3
−1
Wenn wir (17.19) in die TOV-Gleichung (17.17) einsetzen, ergibt sich für r ≤ R 2 (ρ + p) p + ρ∗ 4π Gr ∗ dp 3 . =− p = dr (r − 2Gm (r ))
(17.20)
Aufgabe 17.2 Zeigen Sie, dass sich die Gl. (17.20) in
1 p + ρ∗ 2 −2 ρ∗ = C 1 − Ar p+ 3 umschreiben lässt, wobei C eine Integrationskonstante ist und A durch A=
8π Gρ∗ 2G M = 3 R3
definiert wird. Lösung Die spezielle TOV-Gleichung (17.20) lässt sich umschreiben in
4π Gr p =− ρ∗ 1 − Ar 2 p+ (ρ∗ + p) 3
(17.21)
17.3
Innere Schwarzschild-Metrik für nichtkomprimierbare Fluide
495
mit
8π Gρ∗ . 3 Wir integrieren beide Seiten und erhalten (mit Partialbruchzerlegung) für die linke Seite p dp = dr ρ∗ ρ∗ p+ p+ (ρ∗ + p) (ρ∗ + p) 3 3 3 3 1 1 − = dp ρ ∗ 2ρ∗ p + 2ρ∗ (ρ∗ + p) 3
3 p + ρ∗ =− + const. ln 2ρ∗ p + ρ3∗ A :=
Für die rechte Seite ergibt sich
4π Gr 4π G dr − = ln 1 − Ar 2 + const. 2 1 − Ar 2A Wir fassen die beiden Integrationskonstanten zusammen und erhalten schließlich aus der Gl. (17.20) als Ergebnis
4π Gρ∗ p + ρ∗ =− ln 1 − Ar 2 + const. ln ρ∗ p+ 3 3A Nun ist A= damit folgt
ln
p + ρ∗ p + ρ3∗
2G M 8π Gρ∗ = , 3 R3
=−
1 ln 1 − Ar 2 + const. 2
Wir potenzieren und erhalten 1 p + ρ∗ 2 −2 . ρ∗ = C 1 − Ar p+ 3 Da am Sternenrand der Druck null ist, d. h. p(R) = 0, bestimmt sich die Konstante C durch 1 p(R) + ρ∗ 2 −2 ⇐⇒ C = 3 1 − A R 2 . ρ∗ = C 1 − A R p(R) + 3 Die Gl. (17.21) lösen wir nach p auf und erhalten
496
17 Gravitationskollaps und die innere Schwarzschild-Metrik
p=
−ρ∗ 1 −
1−
C 3
− 1 Ar 2 2
− 1 1 − C 1 − Ar 2 2
.
Wir setzen noch die Konstanten A und C ein und erhalten für den Druck p (r ): √ √ 1 − Ar 2 − 1 − A R 2 p (r ) = ρ∗ √ √ 3 1 − A R 2 − 1 − Ar 2 √ 1 − 2G Mr 2 /R 3 − 1 − 2G M/R = ρ∗ √ 3 1 − 2G M/R − 1 − 2G Mr 2 /R 3
(17.22)
Innere Schwarzschild-Metrik Um die Metrik vollständig zu bestimmen, berechnen wir noch gtt mithilfe der Differenzialgleichung (17.16), die wir etwas umschreiben: −a =
p (ρ∗ + p)
Integration auf beiden Seiten führt zu − a + const. = ln (ρ∗ + p) ⇒ Be−a = ρ∗ + p
(17.23)
mit einer Integrationskonstanten B.
Aufgabe 17.3 Zeigen Sie, dass sich die Integrationskonstante B zu
B = ρ∗
2G M 1− R
1/2
bestimmen lässt. Lösung Da die innere und äußere Schwarzschild-Metrik auf dem Rand des Sterns übereinstimmen sollen, muss 2G M e2a(R) = 1 − R erfüllt sein. Das bedeutet mit (17.23) e
a(R)
1 1
2G M /2 B 2G M /2 ! = = 1− ⇒ B = ρ∗ 1 − . ρ∗ + p (R) R R =0
17.3
Innere Schwarzschild-Metrik für nichtkomprimierbare Fluide
497
Wir setzen (17.22) und B in (17.23) und erhalten für r ≤ R √
1 2G M /2 −a(r ) 1 − 2G Mr 2 /R 3 − 1 − 2G M/R e = ρ∗ 1 + √ ρ∗ 1 − R 3 1 − 2G M/R − 1 − 2G Mr 2 /R 3 √ 2 1 − 2G M/R = ρ∗ √ , 3 1 − 2G M/R − 1 − 2G Mr 2 /R 3 also e
a(r )
1 √ 2G M /2 3 1 − 2G M/R − 1 − 2G Mr 2 /R 3 = 1− √ R 2 1 − 2G M/R 1 2G M 2G Mr 2 3 − 1− 1− . = 2 R 2 R3
Mit diesen Ergebnissen können wir das Linienelement (17.4) für das Innere des Sterns aufschreiben: ⎛ ⎞2 2 1 3 2G M 2G Mr ⎠ dt 2 ds 2 = − ⎝ − 1− 1− 2 R 2 R3 −1 2G Mr 2 + 1− dr 2 + r 2 dϑ 2 + r 2 sin2 ϑ dϕ 2 R3
(17.24)
mit r ≤ R. Diese Metrik nennt man innere Schwarzschild-Metrik, auch sie wurde 1916 von dem deutschen Astronomen Karl Schwarzschild gefunden. Wir stellen fest, dass für r = R die innere mit der äußeren Schwarzschild-Metrik übereinstimmt. Wir berechnen den Wert 2G M/R für die Sonne. Der Sonnenradius beträgt R = 6,69 · 108 m (siehe Tab. A.4), und der Schwarzschild-Radius der Sonne ist rs = 2M G ≈ 2,95 · 103 m, also folgt 2G M 2,95 · 103 ≈ = 4,4 · 10−6 , R 6,69 · 108 d. h.
2G M 1, R
und auch die innere Schwarzschild-Metrik (genauso wie die äußere) weicht zumindest in der Nähe des Sonnenrandes nicht sehr von der Minkowski-Metrik ab.
498
17.4
17 Gravitationskollaps und die innere Schwarzschild-Metrik
Physikalische Interpretation der inneren Lösung
Nichtrelativistischer Grenzfall An der TOV-Gleichung für eine konstante Massendichte ρ∗ (17.20): 2 (ρ + p) p + ρ∗ 4π Gr ∗ dp 3 =− dr (r − 2Gm (r )) kann man ablesen, dass eine höhere Dichte ρ∗ zu einem stärken Abfall des Druckes führt, was den Gravitationskollaps des Sterns begünstigt. Das ist auch intuitiv zu erwarten gewesen. Was allerdings erstaunt, ist die Tatsache, dass auch eine Erhöhung des Druckes p den Kollaps befördert. Das ist wieder ein wichtiger Unterschied zwischen der allgemeinen Relativitätstheorie, in der der Druck die Gravitation erhöht, während in der Newton’schen Theorie der Druck nicht nur keinen verstärkenden Effekt auf die Gravitation hat, sondern oftmals dafür sorgt, dass ein Kollaps verhindert wird, was wir jetzt an einem einfachen Beispiel plausibel machen wollen. Dazu betrachten wir im dreidimensionalen euklidischen Raum in Abb. 17.2
Abb. 17.2 Gleichgewicht zwischen Druck und Schwerkraft
17.4
Physikalische Interpretation der inneren Lösung
499
einen kugelförmigen Stern mit Dichte ρ (r ) und darin eine Schale mit Dicke dr , die um die Länge r von Zentrum entfernt liegen möge. Ein (kleiner) Ausschnitt der Kugelschale mit Fläche A und Dicke dr hat die Masse ρ Adr und erfährt eine (Newton’sche) Gravitationskraft d FG der Größe d FG = −
G M(r ) ρ (r ) Adr , r2
wobei M(r ) die Masse des Sterns vom Zentrum bis zur Kugelschale bezeichnet. Damit der kugelförmige Stern nicht kollabiert, muss diese auf das Zentrum gerichtete Kraft durch die Druckdifferenz d p = p (r + dr ) − p (r ) aufgehoben werden, d. h., es muss d FG = Ad p gelten. Es ergibt sich also als Gleichgewichtsbedingung dp G M (r ) =− ρ (r ) . dr r2
(17.25)
Diese Gleichung wird Emden’sche Gleichung genannt und reduziert sich im Fall konstanter Dichte ρ∗ wegen 3M (r ) 4 M (r ) = πρ∗ r 3 ⇒ ρ∗ = 3 4πr 3 auf 4π G 2 dp =− ρ∗ r . (17.26) dr 3 Wenn wir noch einmal auf die TOV-Gleichung für konstante Dichte (17.20) schauen und den nichtrelativistischen Fall, d. h. r 2M G und ρ∗ p, betrachten, so reduziert sich die Gleichung auf 2 p + ρ∗ (ρ + p) 2 ρ∗ ρ 4π Gr 4π Gr ∗ ∗ 4π G 2 dp 3 3 =− ≈− =− ρ∗ r , dr r − 2M (r ) G r 3 d. h., die Tolman-Oppenheimer-Volkoff-Gleichung geht im nichtrelativistischen Grenzfall in die Emden’sche Gleichung über. Wenn wir die Emden’sche Gl. (17.26) integrieren, so ergibt sich
r r 4π G 2 2π G 2 2 ρ∗ r = − ρ∗ r , d p = p (r ) − p (0) = dr − 3 3 0 0 also p (r ) = p (0) −
2π G 2 2 ρ∗ r , 3
500
17 Gravitationskollaps und die innere Schwarzschild-Metrik
wobei die Integrationskonstante p (0) = p0 der Druck im Zentrum des Sterns ist. Der Druck ist also im Zentrum des Sterns am größten und nimmt mit wachsendem r ab. Da für r = R (Sternradius) der Druck p (R) null werden muss, ergibt sich p0 = und damit p (r ) =
2π G 2 2 ρ∗ R 3
2π G 2 2 ρ∗ R − r 2 3
(17.27)
4πρ∗ 3 R G 2 2M G rs 2π G p0 3 ρ∗ R 2 = = = , = ρ∗ 3 4R 4R 4R
bzw.
wobei rs den Schwarzschild-Radius des Sterns bezeichnet. Das Sterngleichgewicht ist also im nichtrelativistischen Fall und bei konstanter Dichte ρ∗ durch ein bestimmtes Verhältnis von Schwarzschild-Radius zu Radius des Sterns bestimmt. Bei „normalen“ Sternen wie unserer Sonne hält der kinetische Druck der Temperaturbewegung der Gasmoleküle der Gravitation die Waage. Dieses Gas betrachten wir als ideal, sodass sich der Druck aus dem idealen Gasgesetz N kB T p= V bestimmen lässt. Dabei bezeichnet N die Anzahl der Teilchen im Volumen V , T die Temperatur und k B die sogenannte Boltzmann-Konstante, siehe Tab. A.3. Beachtet man, dass sich die Masse M als Summe der Masse m aller Einzelteilchen M = Nm errechnen lässt und dass für die Dichte ρ∗ = gilt, so erhält man p= Die Größe
Nm M = V V k B ρ∗ T . m
kB T ist für unsere Sonne sehr klein: m kB T p ≈ 10−6 , = ρ∗ M
sodass folgt p kB T rs ≈ ≈ 10−6 . ≈ 4R ρ∗ m
17.4
Physikalische Interpretation der inneren Lösung
501
Beachtet man noch, dass der Schwarzschild-Radius der Sonne ungefähr rs ≈ 2,95 · 103 m groß ist, so kann man den Radius R der Sonne durch die obige Gleichgewichtsbedingung abschätzen 2,95 9 R≈ 10 m ≈ 737,500 km, 4 was dem tatsächlichen Radius der Sonne von ca. 669,000 km nahekommt. Relativistische Sterne Wir verlassen nun den nichtrelativistischen Grenzfall und schreiben die Gleichung für p (r ) (17.22) mit dem Schwarzschild-Radius um: √ 1 − rs r 2 /R 3 − 1 − rs /R p (r ) = ρ∗ √ , r≤R (17.28) 3 1 − rs /R − 1 − rs r 2 /R 3 Aus dieser Gleichung leiten wir einige Resultate für relativistische Sterne, d. h. Sterne mit starkem Gravitationsfeld, ab. Zunächst gilt √ −2r rs /R 3 1 − rs /R p = √ 2 ≤ 0, 1 − rs r 2 /R 3 3 1 − rs /R − 1 − rs r 2 /R 3 d. h., p ist wie im nichtrelativistischen Fall monoton fallend, der Druck ist im Sternzentrum am größten. Abb. 17.3 zeigt einige Druckverläufe und enthält auch einen Vergleich mit dem nichtrelativistischen Grenzfall (17.27), der sich mit dem Schwarzschild-Radius als p(r ) =
2π G 2 2 rs 2 ρ∗ R − r 2 = ρ∗ R − r2 3 3 4R
schreiben lässt. Wenn sich der Radius des Sterns R dem Schwarzschild-Radius nähert, nehmen die relativistischen Effekte zu. Für den Druck p0 im Sternenzentrum folgt aus Gl. (17.28) rs 1− 1− R . p0 = p(0) = ρ∗ rs 3 1− −1 R
Aufgabe 17.4
9 Zeigen Sie, dass der Gravitationsdruck im Zentrum für R → rs über alle Grenzen 8 wächst.
502
17 Gravitationskollaps und die innere Schwarzschild-Metrik
Abb. 17.3 Relativer Druckverlauf bei konstanter Dichte
Lösung 9 Der maximale Gravitationsdruck im Zentrum wächst für R → rs über alle Grenzen, da 8 für den Nenner gilt ! rs 8 3! "1 − 9 − 1 = 3 1 − 9 − 1 = 0, rs 8 also 9 p0 → ∞ f ur ¨ R → rs . 8 Wenn der Gravitationsdruck im Zentrum divergiert, dann ist kein Gleichgewicht mit dem Materiedruck mehr möglich, d. h., der Stern kollabiert. Ein Sternengleichgewicht setzt also R>
9 4 9 rs = G M ⇔ M < R 8 4 9G
voraus. Da der Schwarzschild-Radius rs = 2M G ist, bedeutet diese Stabilitätsbedingung, dass die Masse M bei gegebenem Sternenradius eine obere Grenze nicht überschreiten darf, bzw. wenn die Masse gegeben ist, darf der Radius nicht zu klein werden. Im nichtrelati-
17.4
Physikalische Interpretation der inneren Lösung
503
vistischen Fall und für inkompressible Materie (ρ = const.) ist - wie oben gezeigt - der maximale Druck 2π G 2 2 ρ R , p0 = 3 also immer endlich. Lässt man allerdings die Annahme der Inkompressibilität weg, so kann sich auch hier eine Instabilität ergeben, die z. B. für Weiße Zwerge zu einer Massenobergrenze führt. Die Instabilität für 9 R → rs 8 ist dagegen von grundsätzlicher Natur, da sie durch die relativistischen Effekte in der TOVGleichung verursacht wird. Wir haben oben schon ausgeführt, dass hohe Drücke unabhängig von der Art der Materie zu einem selbstverstärkenden Anstieg des Druckes zum Zentrum hin führen. Die Einstein’schen Feldgleichungen haben damit zu dem Ergebnis geführt, dass der zentrale Gravitationsdruck eines Sterns mit konstanter Massendichte divergiert, wenn sich der Radius des Sterns dem Schwarzschild-Radius nähert. Tatsächlich können auch bestimmte Sterne ohne konstante Massendichte nicht existieren, wenn M>
4 R 9G
ist, wie man bei [20], wo schwächere Anforderungen an die Sternenmaterie gestellt werden, nachlesen kann.
Schwarze Löcher in der Schwarzschild-Raumzeit
18
In diesem Kapitel wenden wir uns dem zweiten möglichen Endzustand der Entwicklung eines nichtrotierenden kugelsymmetrischen Sterns zu, nämlich dem andauernden Gravitationskollaps. Der Radius r eines solchen kollabierenden Sternes mit Masse M wird immer kleiner und damit irgendwann den Schwarzschild-Radius rs = 2G M unterschreiten. Ein solches Objekt bezeichnen wir als Schwarzes Loch. Im letzten Kapitel haben wir gesehen, dass es für nichtrotierende Sterne eine Massenobergrenze für ein mögliches Sternengleichgewicht durch den der Gravitation entgegenwirkenden Fermi-Druck gibt. Da die Massenobergrenze nur wenige Sonnenmassen beträgt und es viele Sterne gibt, die wesentlich mehr Masse als unsere Sonne aufweisen, ist es wahrscheinlich, dass einige einen andauernden Gravitationskollaps erleiden und zu Schwarzen Löchern werden. Wir unterstellen hier den Idealfall, dass der kollabierende Stern und die Raumzeit außerhalb kugelsymmetrisch sind. Das Theorem von Birkhoff (14.1) besagt, dass dann die Raumzeit außerhalb des kollabierenden Sterns die äußere Schwarzschild-Raumzeit ist. Wir müssen uns in den folgenden Untersuchungen auch mit dem Bereich r ≤ rs beschäftigen, was uns unmittelbar zu der Frage führt, wie wir mit Raumzeitpunkten umgehen sollen, an denen die Komponenten einer Metrik singulär werden.
18.1
Singularitäten
Wenn die (holonomen) Komponenten einer Metrik bei bestimmten Werten der Koordinaten nicht definiert sind bzw. die Metrik ausartet, so können zwei mögliche Fälle vorliegen: 1. Die Geometrie der Raumzeit ist singulär. 2. Die Geometrie der Raumzeit ist nicht singulär, aber die gewählten Koordinaten überdecken nur einen Teil der Raumzeitmannigfaltigkeit.
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_18
505
506
18 Schwarze Löcher in der Schwarzschild-Raumzeit
Beispiel 18.1
Die äußere Schwarzschild-Metrik 2G M 2G M −1 2 2 2 dt + 1 − dr + r 2 dϑ 2 + sin2 ϑ dϕ 2 ds = − 1 − r r
(18.1)
hat bei den Werten r = 0 und r = 2G M Singularitäten und überdeckt nicht die Achsen ϑ = 0, π , da dort die Metrik ausartet und nicht mehr vom Rang 4 ist. Im Allgemeinen ist es nicht leicht zu entscheiden, welcher der beiden Fälle vorliegt. Und das auch deswegen, da es nicht einfach ist, die Singularität einer Raumzeit überhaupt zu definieren, siehe [20] für eine ausführliche Diskussion. Wir wollen hier ein einfaches Kriterium für den ersten Fall benutzen und unter einer Raumzeitsingularität (auch intrinsische Singularität genannt) diejenigen Stellen verstehen, an denen die Krümmung unendlich wird. Die Krümmung wird durch den Riemann’schen Tensor beschrieben, und dessen Komponenten wiederum sind von der Wahl der Koordinaten abhängig. Allerdings können wir aus dem Riemann-Tensor skalare Größen konstruieren, und da Skalare koordinatenunabhängig sind, sind sie geeignet, um Unendlichkeiten aufzuspüren. Der einfachste Skalar ist der Krümmungsskalar R = g μν Rμν , wobei Rμν die Komponenten des Ricci-Tensors bezeichnen. Aber auch Skalare höherer Ordnung bieten sich an, z. B. μν
R μν Rμν , R μνρσ Rμνρσ , Rμνρσ R ρσ λτ Rλτ
usw.
Falls mindestens einer der Skalare gegen unendlich geht, wenn wir uns einer (endlichen) Stelle annähern, so betrachten wir diesen Punkt als intrinsische Singularität der Raumzeit. Wir haben also eine hinreichende Bedingung für singuläre Stellen gefunden, notwendig ist sie allerdings nicht, d. h., selbst wenn alle Skalare (in [25] kann man nachlesen, wie viele es geben kann) an einer Stelle endlich sind, so heißt das noch nicht, dass die Stelle nichtsingulär ist. Die einzige Möglichkeit, an einem Punkt, an der die Metrik singulär wird, die NichtSingularität der Raumzeit zu beweisen, besteht darin, ein neues Koordinatensystem zu finden, in dem die Metrik an der betreffenden Stelle gutartig bleibt. Eine solche Stelle nennen wir Koordinatensingularität. Koordinatensingularitäten treten also nur bei „schlecht gewählten“Koordinaten auf und lassen sich durch „bessere“Koordinaten beheben. Beispiel 18.2
1. Die Stellen r = 2G M sowie ϑ = 0, π der äußeren Schwarzschild-Metrik sind Koordinatensingularitäten, da sie durch Benutzung der isotropen Schwarzschild-Metrik (14.27):
18.2
Einige Eigenschaften Schwarzer Löcher
1−
m 2ρ
507
2
m ds = − 2 dt + 1 + 2ρ m 1+ 2ρ 2
2
4
d x 2 + dy 2 + dz 2
behoben werden können. Dass die Schwarzschild-Raumzeit bei r = 2G M keine Raumzeit-Singularität besitzt, können wir auch dadurch plausibilisieren, dass die nicht-verschwindenden Komponenten des Riemann-Tensors nach (14.19) von der Form GM Rμνρσ ∼ 3 r sind, d. h., für den Riemann-Tensor ist r = 2G M eine „ganz normale“RaumzeitFläche. 2. Die Stelle r = 0 ist eine echte Raumzeitsingularität, da dort der Kretschmann-Skalar (14.20): 48G 2 M 2 Rμνρσ R μνρσ = r6 unendlich wird. Die Raumzeitsingularität bei r = 0 kann mit den „einfacheren“Skalaren R oder R μν Rμν wegen Rμν = 0 nicht bewiesen werden!
18.2
Einige Eigenschaften Schwarzer Löcher
Im vorhergehenden Abschnitt haben wir gezeigt, dass die Schwarzschild-Metrik bei dem Schwarzschild-Radius r = 2G M nur eine Koordinatensingularität hat. Trotzdem hat der Schwarzschild-Radius eine besondere physikalische Bedeutung, die wir im Folgenden etwas genauer in Augenschein nehmen wollen. Nach Newton sind Schwarze Löcher schwarz Wenn wir in der Newton’schen Theorie wissen wollen, wie groß die Fluchtgeschwindigkeit v F sein muss, damit ein Teilchen der Masse m die Gravitation eines sphärischen Körpers mit Radius R und Masse M überwinden kann, so gehen wir von der Energiegleichung 0 = E kin + E pot =
aus und erhalten
1 GM m mv 2 − 2 R
2G M . R Unterstellt man, dass Licht aus Teilchen (Photonen) besteht, die sich mit Lichtgeschwindigkeit c bewegen und der Newton’schen Gravitationskraft unterliegen, so folgt, dass das Licht von einem Körper entweichen kann, wenn vF ≥
508
18 Schwarze Löcher in der Schwarzschild-Raumzeit
c2 ≥
2G M R
gilt, bzw. umgekehrt, dass das Licht nicht entweichen kann, wenn R≤
2G M = rs (in SI-Einheiten) c2
gilt. Diese Überlegung wurde schon Ende des 18. Jahrhunderts von Naturforschern angestellt, die solche Körper als dunkle Sterne bzw. dunkle Objekte bezeichneten. Wir werden weiter unten sehen, dass auch in der Allgemeinen Relativitätstheorie aus einem Schwarzen Loch kein Photon nach außen dringen kann (dieses gilt allerdings nur, wenn man Quanteneffekte wie die sogenannte Hawking-Strahlung (siehe (21.42)) außer Acht lässt). Massendichte von Schwarzen Löchern Unterstellt man, dass eine kugelförmige, homogene Materieansammlung M dabei ist, ein Schwarzes Loch zu bilden, so kann man etwas über dessen Massendichte ρ am Schwarzschild-Radius aussagen. Das Volumen der Materieansammlung ist dann V =
4πrs3 4π (2G M)3 32π G 3 M 3 = = , 3 3 3
und für die Dichte folgt daraus ρ=
M 3 = , V 32π G 3 M 2
d. h., die Materiedichte, die man braucht, um ein Schwarzes Loch zu bilden, ist umgekehrt proportional zum Quadrat der Masse der Materieansammlung. Objekte, die nur eine geringe Masse besitzen, müssen also eine hohe Massendichte besitzen, um ein Schwarzes Loch zu bilden, und umgekehrt reicht eine geringe Massendichte aus, wenn die Masse der Materieansammlung genügend groß ist. Wir wollen uns die letzte Gleichung etwas näher anschauen und einige Berechnungen damit anstellen. Zunächst stellen wir die Dichte ρ in SI-Einheiten dar: M 3M 3c6 7,3 · 1079 ρ= = = kg m −3 3 = 3 2 V 32π G M M2 GM 32π c2 Diese Größe allein ist schwer zu interpretieren, deshalb setzen wir sie in Bezug zur Masse der Sonne M ≈ 1,99 · 1030 kg und erhalten 3c6 = 1,84 · 1019 ρ= 32π G 3 M 2
M M
2
kg m −3 .
18.2
Einige Eigenschaften Schwarzer Löcher
509
Nun wissen wir, dass die typische Massendichte in einem Atomkern etwa 2 · 1017 kgm −3 beträgt und diese Dichte auch in einem Neutronenstern vorherrscht. Die oben berechnete Dichte für ein Schwarzes Loch mit Sonnenmasse liegt also ca. 100-mal höher als die Atomkerndichte, und das ist der Grund dafür, dass wir keine Schwarzen Löcher mit Sonnenmasse im Universum erwarten können. Schwarze Löcher mit einer Masse, die 10-mal der Sonnenmasse entspricht, haben etwa Atomkerndichte, und so ist es keine Überraschung, dass die Schwarzen Löcher, die man in Doppelsternsystemen beobachtet, typischerweise diese Größe haben. Die (vermuteten) riesigen Schwarzen Löcher in Galaxiezentren können mit sehr geringen Massendichten entstehen. Unterstellt man bei solchen Schwarzen Löchern eine Masse, die eine Milliarde größer als die unserer Sonne ist, so entsteht ein solches Schwarzes Loch mit einer Massendichte von ca. 40 kgm −3 , die deutlich geringer als die Dichte von Wasser (1000 kg m −3 ) ist. Rotverschiebung am Schwarzschild-Radius In den folgenden Abschnitten unterstellen wir die Existenz eines Schwarzen Loches und nehmen die äußere Schwarzschild-Lösung (18.1) her, um den Bereich außerhalb des Schwarzen Lochs zu untersuchen. Da der Radius des Schwarzen Loches R kleiner als der SchwarzschildRadius ist, bedeutet das, dass wir uns auch in die Region R < r ≤ 2G M = 2m begeben müssen. Schaut man sich gtt bei r = 2G M an, so gilt gtt = 0. Dieser Wert ist mathematisch in Ordnung, führt aber dazu, dass auf der Fläche r = 2G M die Rotverschiebung unendlich wird.
Aufgabe 18.1 Zeigen Sie, dass für r → 2G M die Rotverschiebung über alle Grenzen wächst.
Lösung Wir schauen uns nochmals die Gleichung der Rotverschiebung im äußeren SchwarzschildFeld (15.41): 2G M 1− r1 f2 (18.2) = f1 2G M 1− r2 an, wobei r1 ein Ort „im Unendlichen“, d. h. weit entfernt vom Schwarzschild-Radius sein (r1 → ∞) und r2 sich dem Schwarzschild-Radius nähern möge. Dann folgt für den Zähler
510
18 Schwarze Löcher in der Schwarzschild-Raumzeit
1− und für den Nenner
r1
≈1
1−
also insgesamt
2G M
2G M r2
→ 0 f ur ¨ r2 → 2G M,
2G M 1− r1
f2 = f1
2G M 1− r2
¨ r2 → 2G M. → ∞ f ur
Nähert sich ein Objekt dem Schwarzschild-Radius von außen, so werden Signale, die das Objekt versendet, von einem weit entfernten Beobachter zunehmend rotverschoben wahrgenommen, bis schließlich gar kein Lichtsignal mehr beobachtet werden kann. Wir wollen das noch etwas genauer untersuchen und betrachten im Folgenden zunächst Objekte, die in der Schwarzschild-Raumzeit radial in ein Schwarzes Loch fallen.
18.3
Radialer Fall in der Schwarzschild-Raumzeit
Koordinatenzeit eines radial einfallenden Teilchens In diesem Abschnitt folgen wir [6]. Wir betrachten ein Teilchen, das zum Zeitpunkt t = 0 aus einer Entfernung r = R 2G M mit Anfangsgeschwindigkeit dr =0 dt t=0 radial auf ein Schwarzes Loch zu fällt, wie in Abb. 18.1 gezeigt. Abb. 18.1 Radialer Fall eines Teilchens in ein Schwarzes Loch
18.3
Radialer Fall in der Schwarzschild-Raumzeit
511
Dabei meint radial, dass sich die Winkel ϑ und ϕ nicht ändern, dass also gilt: dϑ = dϕ = 0 Die Zeit t wird auf einer Uhr im „Unendlichen” abgelesen, ist also die Koordinatenzeit eines weit entfernten Beobachters. Damit ergibt sich das Linienelement der Schwarzschild-Metrik zu 2G M 1 2 dr 2 . ds = − 1 − dt 2 + (18.3) 2G M r 1− r Mit (11.71): ds 2 = −dτ 2 folgt daraus
1−
2G M
r
2
dt dτ
1 2G M 1− r
−
dr dτ
2 = 1.
Wir wenden die Kettenregel an und erhalten ⎡ ⎤ 2 2 2G M 1 dr ⎥ dt ⎢ − = 1. ⎣ 1− 2G M dt ⎦ dτ r 1− r Mit der Anfangsbedingung
dr dt
(18.4)
(18.5)
=0 t=0
ergibt sich daraus ⎡
2G M ⎢ ⎣ 1− r
woraus
− r =R
1 2G M 1− r
⎤
2 2G M dr dt 2 ⎥ dt = 1 − = 1, ⎦ dt t=0 dτ r =R R dτ r =R
dt dτ
2
r =R
=
R
1/2
R − 2m
folgt. Nach der Geodätengleichung (15.19) gilt für alle r > 2G M 2G M dt 1− = E = const., r dτ also insbesondere auch für r = R, woraus
512
18 Schwarze Löcher in der Schwarzschild-Raumzeit
2G M E = 1− R
R R − 2G M
1/2
=
R − 2G M
1/2
R
folgt. Also gilt 1/2 R − 2G M 2G M −1 r dt = 1− E= . dτ r r − 2G M R
Aufgabe 18.2 Zeigen Sie, dass aus den Gl. (18.5) und (18.6) die Beziehung R − 2G M r 3/2 dr dt = − 2G M (r − 2G M) (R − r )1/2
(18.6)
(18.7)
folgt. Lösung Die Gl. (18.6) setzen wir in Gl. (18.5) ein und erhalten ⎡ ⎤ 2 R 1 r − 2G M 2 dr ⎥ ⎢ r − 2G M − , = ⎣ ⎦ r − 2G M dt r r R − 2G M r woraus
dr dt
2 = = = =
R r − 2G M r − 2G M r − 2G M r − 2G M 2 + − r r R − 2G M r r 2 R r − 2G M r − 2G M −1 − r r R − 2G M r − 2G M 2 Rr − 2RG M − Rr + 2r G M − r r (R − 2G M) 2 r − 2G M 2G M (R − r ) r r (R − 2G M)
folgt. Daraus ergibt sich weiter 2G M (R − r ) dr r − 2G M =± . dt r r (R − 2G M) Wir müssen das Minuszeichen vor dem Term auf der rechten Seite wählen, da wir einen Fall in das Schwarze Loch betrachten, d. h., mit wachsendem t wird r immer kleiner. Damit erhalten wir
18.3
Radialer Fall in der Schwarzschild-Raumzeit
dr =− dt
und daraus dt = −
2G M R − 2G M
R − 2G M 2G M
513
(r − 2G M) (R − r )1/2 r 3/2
r 3/2 (r − 2G M) (R − r )1/2
(18.8)
dr .
Integration von (18.7) auf beiden Seiten ergibt t =−
R − 2G M 2G M
r
dr
R
3/2 r (r − 2G M) (R − r )1/2
.
Das ist die Koordinatenzeit t, die das Teilchen aus Sicht eines entfernten Beobachters braucht, um vom Ausgangspunkt r = R bis zu einem beliebigen Punkt r zu gelangen. Der Integrand strebt gegen unendlich, wenn r → 2G M geht. Um das genauer zu untersuchen, setzen wir r = 2G M + ε mit einem kleinen ε > 0. Dann folgt R − 2G M r −2G M (2G M + ε)3/2 t=− dε 2G M ε (R − 2G M − ε)1/2 R−G M R − 2G M r −2G M (2G M)3/2 ≈− dε 2G M ε (R − 2G M)1/2 R−2G M r −2G M r − 2G M 1 . = −2G M dε = −2G M ln ε R − 2G M R−2G M Wir exponieren diese Gleichung, und es folgt r − 2G M = (R − 2G M) e(−t/2G M) . Der Term auf der rechten Seite ist wegen R > 2G M immer positiv und konvergiert gegen null, wenn t → ∞ geht. Also ist der Term auf der linken Seite für jeden Zeitpunkt t größer als null. Mit anderen Worten: Aus Sicht des entfernten Beobachters fällt das Teilchen zwar auf das Schwarze Loch zu und nähert sich im Laufe der Zeit dem Schwarzschild-Radius immer mehr, erreicht ihn aber niemals, geschweige denn: überschreitet ihn. Wir können diese Schlussfolgerung auf ein Teilchen, das auf der Oberfläche eines kollabierenden Sterns sitzt, in folgender Weise übertragen: Aus Sicht eines entfernten Beobachters kollabiert der Stern, bis sein Radius den Schwarzschild-Radius erreicht; in dessen Nähe scheint er immer langsamer zu schrumpfen und schließlich zum Stillstand zu kommen; der ferne Beobachter sieht also niemals, dass der Stern zu einem Schwarzen Loch kollabiert.
514
18 Schwarze Löcher in der Schwarzschild-Raumzeit
Eigenzeit eines radial einfallenden Teilchens Was sieht denn ein mit dem Teilchen fallender Beobachter auf seiner eigenen Uhr? Dazu berechnen wir die Eigenzeit des Teilchens, die es braucht, um den Schwarzschild-Radius zu erreichen. Es gilt mit den Gl. (18.6) und (18.7) dr dr dt = dτ dt dτ
1/2 R − 2G M 2G M (r − 2G M) (R − r )1/2 r =− R − 2G M r 3/2 r − 2G M R 1/2 1/2 2G M (R − r ) 2G M R − r =− =− , Rr R r
woraus
R dτ = − 2G M
−1/2 R −1 dr r
(18.9)
folgt.
Aufgabe 18.3 Zeigen Sie, dass sich die Eigenzeit τ mit (18.9) zu R 3 τ= r /R 1 − r /R + arccos r /R 2G M
(18.10)
berechnen lässt. Lösung Wir integrieren (18.9) und erhalten auf der linken Seite τ . Auf der rechten Seite substituieren r
wir ρ = , und es ergibt sich R √ r r /R r /R ρ R R 1 R R3
=− . − dr dρ dρ √ =− 2G M R 2G M 1 2G M 1 1 1−ρ R − 1 −1 ρ r
Wir substituieren jetzt ρ = u2
18.3
Radialer Fall in der Schwarzschild-Raumzeit
515
und erhalten damit für das Integral auf der rechten Seite √ r /R √r /R ρ u 2u R3 R3 − dρ √ du √ =− 2G M 1 2G M 1 1−ρ 1 − u2 √ r /R u2 R3 = −2 du √ . 2G M 1 1 − u2 Schließlich substituieren wir noch u = cos v und erhalten für das rechte Integral: √r /R arccos(√r /R ) u2 cos2 v (− sin v) R3 R3 du √ = −2 dv −2 2G M 1 2G M 0 sin v 1 − u2 √ arccos( r /R ) R3 =2 dv cos2 v. 2G M 0 √ R3 arccos( r /R ) = [cos v sin v + v]0 2G M R 3 = r /R 1 − r /R + arccos r /R 2G M Also folgt insgesamt für die gesuchte Eigenzeit R 3 r /R 1 − r /R + arccos r /R , τ= 2G M was für alle r ≤ R ein wohldefinierter Ausdruck ist.
Die Stelle r = 2G M ist also für das Teilchen problemlos in endlicher Zeit zu erreichen; mehr noch: Setzt man r = 0, so folgt für die Eigenzeit τ0 bis zum „Aufschlag” π R3 R3 τ0 = arccos (0) = , 2G M 2 2G M also ebenfalls eine endliche Eigenzeitspanne. Beispiel 18.3
Ein Fall in ein Schwarzes Loch mit Sonnenmasse (rs = 2G M ≈ 3 km) aus einer Distanz von R = 15.000 km dauert nur 5,6 s.
516
18 Schwarze Löcher in der Schwarzschild-Raumzeit
Zusammengefasst sieht also ein entfernter Beobachter ein Teilchen auf den SchwarzschildRadius zu fallen, aber er sieht niemals, dass das Teilchen diesen erreicht. Aus diesem Grunde wird der Ort (die Fläche) r = 2G M auch Ereignishorizont genannt (weiter unten in Abschn. 19.3 werden wir einen Ereignishorizont nochmals „ordentlich“mit Mitteln der Geometrie definieren). Misst das Teilchen allerdings seine eigene Zeit, so erreicht es nach endlicher Zeit den Horizont, durchquert diesen und fällt in ebenfalls endlicher Zeit in das Schwarze Loch. Der Horizont hat für das fallende Teilchen überhaupt keine physikalische Bedeutung. Das ist ein weiterer wichtiger Hinweis darauf, dass die Singularität der Schwarzschild-Metrik bei r = 2G M doch „nur” eine Koordinatensingularität ist, die man durch geschickte Wahl eines anderen Koordinatensystems umgehen kann. Radial einfallender Lichtstrahl Wir betrachten nunmehr einen Lichtstrahl, der radial auf das Schwarze Loch zu läuft. Dabei gehen wir wieder von dem Linienelement der Schwarzschild-Metrik (18.1) aus. Wegen der radialen Bewegung sind dϑ = dϕ = 0, und für Licht gilt ds 2 = 0, d. h., wir erhalten 2G M 1 dr 2 dt 2 + 0=− 1− 2G M r 1− r und daraus
dt 2G M −1 =± 1− . dr r
(18.11)
Ist der Abstand r groß und weit entfernt vom Horizont 2G M, so nähert sich der Term auf der rechten Seite immer mehr ±1 an. Wenn wir dann die Gl. (18.11) integrieren, erhalten wir t = ±r + const., also genau das, was wir für einen Lichtstrahl im Minkowski-Raum erwarten. Andererseits wird dt/dr immer größer (bei +) bzw. kleiner (bei −), falls r → 2G M. Da dt/dr die Steigung des Lichtkegels bestimmt, bedeutet das, dass die Lichtkegel immer schmaler werden, wenn man sich dem Schwarzschild-Radius nähert. Das wird in Abb. 18.2 illustriert. Am Ereignishorizont r = 2G M ist der Lichtkegel zu einer Geraden ausgeartet. Da die Zukunftslichtkegel die kausale Struktur einer Raumzeit beschreiben, d. h., Informationen liefern, in welcher Raumzeitregion sich zukünftig Teilchen oder Lichtstrahlen bewegen können, suggeriert der Schwarzschild-Lichtkegel, dass Teilchen und Lichtstrahlen am Schwarzschild-Radius auf ewig stillstehen müssen, was – wie wir ja schon gezeigt haben – nicht richtig ist. Wir integrieren Gl. (18.11) und erhalten mit einer geeigneten Integrationskonstanten t = ± (r + 2G M ln |r − 2G M|) + const.
(18.12)
18.3
Radialer Fall in der Schwarzschild-Raumzeit
517
Abb. 18.2 Zukunftslichtkegel in Schwarzschild-Koordinaten
Abb. 18.3 Lichtstrahlen in der Schwarzschild-Raumzeit
Das Pluszeichen steht dabei für Lichtstrahlen, die sich vom Schwarzen Loch entfernen, das Minuszeichen für Lichtstrahlen, die in das Schwarze Loch hineinfallen. Abb. 18.3 demonstriert den Verlauf der Lichtstrahlen, wobei 2G M = 2,95 gesetzt wurde.
518
18 Schwarze Löcher in der Schwarzschild-Raumzeit
In Abb. 18.3 sieht man zunächst die Singularität bei r = 2G M (gepunktete vertikale Linie). Alle drei einfallenden Lichtstrahlen (durchgezogene Linien auf der rechten Seite) aus der Region r > 2G M können diese Grenze niemals erreichen. Unterstellt man aber, dass die einfallenden Lichtstrahlen die Singularität überwunden haben (durchgezogene Linien auf der linken Seite), so scheinen sich Zeit und Raum umzukehren bzw. die Zeit rückwärts zu laufen, denn die Lichtstrahlen landen in rückwärts laufender, aber endlicher Zeit im Schwarzen Loch (Achse r = 0). Da wir schon gezeigt haben, dass radial einfallende Testteilchen (und damit auch Lichtstrahlen) den Horizont r = 2G M in endlicher Eigenzeit erreichen, ist Abb. 18.3 irreführend bei der Beschreibung dessen, was bei dem Überqueren des Horizonts und im Gebiet r < 2G M passiert. Hierzu werden wir in den nächsten Abschnitten „bessere“ Koordinatensysteme betrachten. Bei den austretenden Lichtstrahlen (drei gestrichelte Linien) ist die rechte Seite wieder klar, sie entfernen sich mit fortlaufender Zeit immer mehr vom Schwarzschild-Radius. Man beachte auch die (abnehmenden) Krümmungen der Lichtstrahlen! Unterstellt man auf der linken Seite, dass die gestrichelten Lichtstrahlen sich vom Schwarzen Loch entfernen, so passiert etwas Ähnliches wie mit den anderen: Sie nähern sich – ebenfalls in rückwärts laufender Zeit – dem Schwarzschild-Radius, können ihn aber nicht überwinden. Das Licht kann dem Schwarzen Loch nicht entkommen. In Abb. 18.3 sind auf der rechten Seite noch drei Zukunfts-Lichtkegel eingezeichnet, die von jeweils einem einlaufenden und auslaufenden Lichtstrahl gebildet werden. Man sieht noch einmal, dass sich die Lichtkegel verengen, je näher sie dem Schwarzschild-Radius kommen. Auf der linken Seite ist ebenfalls ein Zukunfts-Lichtkegel eingezeichnet. Man sieht, dass er jetzt raumartig liegt und einem Teilchen oder einem Lichtstrahl keine andere Wahl lässt, als in das Schwarze Loch zu fallen. Das Phänomen, dass sich Raum und Zeit beim Übergang von r > 2G M zu r < 2G M quasi umdrehen, kann man auch direkt an der Schwarzschild-Metrik 2G M 1 2 dr 2 + r 2 dϑ 2 + sin2 ϑ dϕ 2 ds = − 1 − dt 2 + 2G M r 1− r ablesen. Denn innerhalb des Schwarzschild-Horizonts (r < 2G M) ist gtt = − 1 −
2G M
> 0,
r
grr = 1 −
2G M
−1 < 0.
r
Außerhalb (r > 2G M) jedoch gilt gtt = − 1 −
2G M r
< 0,
grr = 1 −
2G M r
−1 > 0.
Schauen wir auf die Geometrie innerhalb des Schwarzschild-Radius, aber nahe bei r = 2G M und definieren dazu die Größe ε = 2G M − r , so folgt für das Linienelement
18.4
Eddington-Finkelstein-Koordinaten
ds 2 = −
r − 2G M 2G M − ε
dt 2 −
519
2G M − ε 2 dr + (2G M − ε)2 dϑ 2 + sin2 ϑ dϕ 2 . ε
Da ε > 0 für r < 2G M ist, gilt also für eine Kurve mit t, θ, ϕ = const. ds 2 < 0, sie ist zeitartig, d. h., ε und damit auch r sind zu zeitartigen Koordinaten geworden, während t raumartig geworden ist. Ein auf das Schwarze Loch zu fallendes massives Teilchen bewegt sich auf einer zeitartigen Weltlinie, es muss dazu ständig den Abstand r verändern, und zwar verringern. Das heißt, ist das Teilchen innerhalb des Schwarzschild-Radius angekommen, wird es unausweichlich in das Schwarze Loch (r = 0) fallen. Was aber passiert, wenn das Teilchen innerhalb des Schwarzschild-Radius versucht, ein Signal nach außen zu senden? Dieses Photon muss sich, egal in welche Richtung es losgeschickt wurde, aus Sicht des Teilchens ebenfalls vorwärts in der „Zeit” bewegen, aber innerhalb des SchwarzschildRadius zeigt die Koordinate r die Zeit an, und r wird immer kleiner. Das Photon kann nicht entweichen. Nichts kann mehr entweichen, wenn es einmal innerhalb des SchwarzschildRadius angekommen ist. Mehr noch, alles wird auf die echte Singularität bei r = 0 zu fallen, da r = 0 die Zukunft jeder zeit- oder lichtartigen Weltlinie innerhalb r = 2G M ist. Ein licht- oder zeitartiges Teilchen innerhalb r < 2G M kann nicht an einer festen Stelle r verweilen, so wie ein Teilchen außerhalb des Horizonts nicht in einer konstanten Zeit t verweilen kann. Hat ein Teilchen einmal den Horizont überschritten, so kann es von außerhalb nicht mehr beobachtet werden. Die Schwarzschild-Koordinaten sind daher unbrauchbar, um mit ihnen die Physik innerhalb des Schwarzschild-Radius zu beschreiben – sie beschreiben nur die aus der Ferne beobachtete Bewegung!
18.4
Eddington-Finkelstein-Koordinaten
Wir wollen nun Koordinaten definieren, die die Koordinatensingularität der SchwarzschildMetrik bei r = 2G M beheben. Die neuen Koordinaten sollen so gewählt werden, dass die einlaufenden Lichtstrahlen gerade Linien werden. Die einlaufenden Lichtstrahlen werden nach Gl. (18.12) durch t = −r − 2G M ln |r − 2G M| + const. dargestellt. Wir definieren eine neue Zeitkoordinate v, die auch avancierte Zeitkoordinate genannt wird, durch v := t + r + 2G M ln |r − 2G M| , (18.13) dann folgt
520
18 Schwarze Löcher in der Schwarzschild-Raumzeit
⎛ ⎜ dv = dt + ⎝
⎞ 1 ⎟ dr . 2G M ⎠ 1− r
(18.14)
Zeigen Sie die Gültigkeit von (18.14).
Aufgabe 18.4
Lösung Aus (18.13) folgt für r > 2G M dr 2G M dr 2G M dv dr =1+ + =1+ 1+ dt dt r − 2G M dt r − 2G M dt und für r < 2G M
dv dr −2G M dr −2G M dr =1+ + =1+ 1+ , dt dt 2G M − r dt 2G M − r dt ⎛
also in beiden Fällen
⎜ dv = dt + ⎝
⎞ 1 ⎟ dr . 2G M ⎠ 1− r
Wir setzen (18.14) in die Schwarzschild-Metrik ein und erhalten
2G M ds = − 1 − r
1 dr 2 + r 2 dϑ 2 + sin2 ϑ dϕ 2 2G M 1− r ⎞2
dt 2 +
2
⎛
⎟ 1 1 dr ⎟ dr 2 + r 2 dϑ 2 + sin2 ϑ dϕ 2 + ⎠ 2G M 2G M 1− 1− r r 2G M dv 2 + 2 dv dr + r 2 dϑ 2 + sin2 ϑ dϕ 2 . = − 1− (18.15) r = − 1−
2G M ⎜ ⎜dv − ⎝ r
Dieses Linienelement nennt man Schwarzschild-Metrik in (avancierten) EddingtonFinkelstein-Koordinaten. Bemerkung 18.1 1. Die Eddington-Finkelstein-Lösung ist für 0 < r < ∞, also insbesondere bei r = 2G M regulär. Damit ist nochmals gezeigt, dass der Ereignishorizont nur eine Koordinaten-
18.4
Eddington-Finkelstein-Koordinaten
521
singularität der Schwarzschild-Koordinaten ist. Die Eddington-Finkelstein-Koordinaten bezeichnet man auch als analytische Fortsetzung der Schwarzschild-Koordinaten. 2. Die Metrik ist nicht diagonal und wegen des gemischten Terms dv dr nicht invariant, wenn man die avancierte Zeit umkehrt (v → −v). 3. Für r → ∞ erhält man aus (18.14) dv = dt + dr und damit aus der Eddington-Finkelstein-Metrik wieder die Minkowski-Metrik. 4. Die Raumzeit-Singularität für r → 0 bleibt erhalten. 5. Statt der avancierten Zeitkoordinate v kann man auch die retardierte Zeitkoordinate u = t − r − 2G M ln |r − 2G M|
(18.16)
einführen. Dadurch werden dann die auslaufenden Lichtstrahlen zu Geraden. Wir betrachten wieder einen radial auf das Schwarze Loch zu laufenden Lichtstrahl, d. h. dϑ = dϕ = 0 sowie ds 2 = 0, und erhalten 2G M dv 2 + 2 dv dr = 0. (18.17) − 1− r Bei den Lösungen unterscheiden wir drei Fälle: 1. Für alle r gilt: dv = 0 ⇒ v = const. = t + r + 2G M ln |r − 2G M| , d. h., wenn t wächst, muss r kleiner werden. Diese Lösung beschreibt also einlaufende radiale Lichtstrahlen. 2. Ist dv = 0, so folgt aus (18.17):
2G M dv = 2 1 − r Ist r > 2G M, dann gilt
−1 dr
(18.18)
2G M −1 dv =2 1− > 0, dr r
d. h., wir erhalten auslaufende radiale Lichtstrahlen. Ist r < 2G M, dann ergeben sich einlaufende radiale Lichtstrahlen.
522
18 Schwarze Löcher in der Schwarzschild-Raumzeit
3. dr = 0 und zugleich r = 2G M, d. h., der Lichtstrahl verharrt auf dem Ereignishorizont, die Lösung ist stationär. Mit diesen Informationen können wir die Zukunfts-Lichtkegel der Eddington-FinkelsteinKoordinaten grafisch veranschaulichen. Im Eddington-Finkelstein-Koordinatensystem bleiben die Lichtkegel bei r = 2G M regulär, es gibt keine Probleme bei der Nachverfolgung der licht- oder zeitartigen Bewegungen durch den Horizont. Abb. 18.4 spiegelt die obigen drei Lösungsvarianten wider. Entlang der Geraden v = const. laufen die Lichtstrahlen gemäß (1.) ein. Im Bereich r > 2G M gibt es gemäß (2.) auch auslaufende Lichtstrahlen. Am Ereignishorizont gibt es einlaufende und gemäß (3.) auch stationäre Lichtstrahlen. Im Bereich r < 2G M wird die Steigung der oberen Begrenzung des Lichtkegels gemäß (2.) negativ, sodass alle zukunftsgerichteten Bewegungen in der Singularität r = 0 enden, d. h., hat man einmal den Ereignishorizont überschritten, gibt es keine Möglichkeit der Rückkehr in den Bereich r > 2G M. Wenn wir die Gl. (18.18) lösen, so ergibt sich v = 2 (r + 2G M ln |r − 2G M|) + const.
(18.19)
Wir wollen wie bei den Schwarzschild-Koordinaten noch ein Raum-Zeit-Diagramm der möglichen Verläufe der Lichtstrahlen erstellen und definieren dazu eine neue Zeitkoordinate t¯ := v − r . Mit dieser Koordinate folgt aus dv = 0: t¯ = −r + const.,
Abb. 18.4 Zukunfts-Lichtkegel in Eddington-Finkelstein-Koordinaten
18.4
Eddington-Finkelstein-Koordinaten
523
Abb. 18.5 Lichtstrahlen in avancierten Eddington-Finkelstein-Koordinaten
d. h., die einfallenden Lichtstrahlen liegen auf Geraden mit der Steigung −45◦ , und mit Gl. (18.19) folgt t¯ = r + 4G M ln |r − 2G M| + const. Damit ergibt sich das t¯, r -Raumzeitdiagramm 18.5. Man sieht wieder den Schwarzschild-Radius bei r = 2G M (gepunktete Linie). Einfallende (durchgezogene) Lichtstrahlen sind Geraden. Im Bereich r > 2G M austretende (gestrichelte) Lichtstrahlen entfernen sich vom Schwarzschild-Radius und krümmen sich mit r → ∞ immer mehr, bis sie schließlich (im Unendlichen) die Steigung +45◦ annehmen und damit mit den einfallenden Lichtstrahlen die Minkowski-Lichtkegel bilden. Lichtstrahlen, die in dem Bereich r < 2G M entstehen (gekrümmt gestrichelt), können diese Region nicht verlassen, sie fallen in das Schwarze Loch. In Abb. 18.5 sind drei Zukunfts-Lichtkegel eingezeichnet, diese werden, wenn sie auf das Schwarze Loch zu fallen, enger und kippen um 45◦ nach links. Die Fläche r = 2G M wirkt wie eine Einwegmembrane: Licht von außerhalb kann sie durchqueren, Licht von innerhalb allerdings nicht. Eddington-Finkelstein-Koordinaten mit retardierter Zeitkoordinate Wenn wir als Zeitkoordinate den retardierten Zeitparameter (18.16) u = t − r − 2G M ln |r − 2G M| verwenden, so ergibt sich analog zu (18.14)
524
18 Schwarze Löcher in der Schwarzschild-Raumzeit
⎞
⎛ ⎜ du = dt − ⎝
sowie für das Linienelement ds = − 1 − 2
2G M r
1 ⎟ dr 2G M ⎠ 1− r
(18.20)
du 2 − 2 du dr + r 2 dϑ 2 + sin2 ϑ dϕ 2 .
Für einen radial auf das Schwarze Loch zu laufenden Lichtstrahl erhalten wir 2G M du 2 − 2 du dr = 0. − 1− r
(18.21)
Bei den Lösungen unterscheiden wir wieder drei Fälle: 1. Für alle r gilt: du = 0 ⇒ u = const. = t − r − 2G M ln |r − 2G M| , d. h., wenn t wächst, muss auch r größer werden. Diese Lösung beschreibt also auslaufende radiale Lichtstrahlen. 2. Ist du = 0, so folgt aus (18.21): 2G M −1 du = −2 1 − dr r Ist r > 2G M, dann gilt
(18.22)
2G M −1 du = −2 1 − < 0, dr r
d. h., wir erhalten einlaufende radiale Lichtstrahlen. Ist r < 2G M, dann ergeben sich auslaufende radiale Lichtstrahlen. 3. dr = 0 und zugleich r = 2G M, d. h., der Lichtstrahl verharrt auf dem Ereignishorizont, die Lösung ist stationär. Wenn wir die Gl. (18.18) lösen, so ergibt sich analog zu (18.19) u = −2 (r + 2G M ln |r − 2G M|) + const. Wir definieren eine neue Zeitkoordinate t˜ durch t˜ := u + r , dann folgt aus du = 0:
(18.23)
18.5
Kruskal-Koordinaten
525
Abb. 18.6 Lichtstrahlen in retardierten Eddington-Finkelstein-Koordinaten
t˜ = r + const., d. h., die ausfallenden Lichtstrahlen liegen auf Geraden mit der Steigung +45◦ , und aus Gl. (18.23) wird t˜ = −r − 4G M ln |r − 2G M| + const. Damit ergibt sich das t˜, r -Raumzeitdiagramm 18.6. Die Situation hat sich also umgekehrt: Lichtstrahlen innerhalb des Schwarzschild-Radius können durch die Fläche bei r = 2G M nach außen gelangen, aber nicht umgekehrt. Auch Teilchen, die sich außerhalb des Schwarzschild-Radius befinden, können diesen nicht durchqueren. Die Singularität r = 0 ist weder durch Licht noch durch Materie erreichbar. Ein solches Objekt wird Weißes Loch genannt, es ist sozusagen ein zeitlich umgekehrtes Schwarzes Loch. Es ist ziemlich wahrscheinlich, dass Schwarze Löcher existieren, aber unwahrscheinlich, dass es Weiße Löcher gibt. Die Einstein-Gleichungen sind zwar invariant unter der dargestellten Zeitumkehr, die Natur scheint aber davon keinen Gebrauch zu machen.
18.5
Kruskal-Koordinaten
Durch die Einführung der Eddington-Finkelstein-Koordinaten haben wir ein besseres Verständnis über die Schwarzschild-Lösung erhalten. Es gibt allerdings eine Weiterentwicklung dieses Ansatzes, durch die sowohl die avancierten als auch die retardierten EddingtonFinkelstein-Koordinaten zusammengefasst werden. Wenn wir die Koordinate r ∗ durch r ∗ := r + 2G M ln |r − 2G M|
526
18 Schwarze Löcher in der Schwarzschild-Raumzeit
definieren, so ergibt sich mit (18.13) und (18.16) v = t + r ∗, u = t − r ∗ ⇒ r ∗ =
v−u . 2
(18.24)
Die Koordinate r ∗ wird wegen r ∗ → −∞ für r → 2G M nach dem Achilles-SchildkrötenParadoxon auch Schildkrötenkoordinate (engl. tortoise coordinate) genannt. In einem (r ∗ , t)-Koordinatensystem erfüllen ein- und ausgehende Lichtstrahlen die Gleichungen v = const. und u = const.; v und u nennt man deswegen auch Nullkoordinaten. Abb. 18.7 zeigt, dass in der (r ∗ , t) – Ebene die Lichtkegel konstant bleiben, d. h., sie verengen oder drehen sich nicht mehr.
Aufgabe 18.5 Zeigen Sie, dass sich die Schwarzschild-Metrik in Nullkoordinaten durch 2G M du dv + r 2 dϑ 2 + sin2 ϑ dϕ 2 ds 2 = − 1 − r
(18.25)
darstellen lässt, wobei r > 2G M jetzt eine Funktion von u und v ist, die implizit durch (18.24) definiert wird. Lösung Es gilt mit (18.20) und (18.14)
Abb. 18.7 Lichtstrahlen in (r ∗ , t)-Koordinaten
18.5
Kruskal-Koordinaten ⎛
⎛
⎜ ⎜ du dv = ⎝dt − ⎝
woraus
527 ⎞
⎞⎛
⎛
⎞
⎞
1 2G M −2 2 1 ⎟ ⎟⎜ ⎜ ⎟ ⎟ 2 dr , dr dt + ⎝ dr = dt − 1 − 2G M ⎠ ⎠ ⎝ 2G M ⎠ ⎠ r 1− 1− r r
2G M 2G M 2G M −1 2 1− du dv = 1 − dt 2 − 1 − dr r r r
folgt, d. h., die Schwarzschild-Metrik lässt sich in Nullkoordinaten ausdrücken: ds = − 1 − 2
2G M
dt + 1 − 2
2G M
−1
dr 2 + r 2 dϑ 2 + sin2 ϑ dϕ 2
r r 2G M = − 1− du dv + r 2 dϑ 2 + sin2 ϑ dϕ 2 r
Das Linienelement (18.25) hat immer noch den Nachteil, dass der Koeffizient vor du dv bei r = 2G M null wird. Den können wir aber beheben, wenn wir mit (18.24) folgendermaßen umformen: 2G M 1 1− = eln(r −2G M) r r 1 = e1/2G M(−r +r +2G M ln(r −2G M)) r 1 1 ∗ = e1/2G M (−r +r ) = e1/2G M(−r +(v−u)/2) r r 1 = e−r /2G M e(v−u)/4G M r Wir definieren noch u : = −e−u/4G M ⇒ du = v : = ev/4G M ⇒ dv =
1 e−u/4G M du 4G M
1 ev/4G M dv 4G M
(18.26)
und erhalten aus (18.25) ds 2 = −
16G 2 M 2 −r /2G M
e du dv + r 2 dϑ 2 + sin2 ϑ dϕ 2 . r
(18.27)
Dieses Linienelement hat keine Singularität bei r = 2G M (d. h. bei u = 0 oder v = 0) mehr, und wir können die Schwarzschild-Lösung auf alle Werte von u und v ausdehnen, die mit r > 0 verträglich sind.
528
18 Schwarze Löcher in der Schwarzschild-Raumzeit
Kruskal-Szekeres-Koordinaten Die Koordinaten u und v sind nach Konstruktion ebenfalls Nullkoordinaten, und die Metrik (18.27) enthält den gemischten Term du dv , den wir gern loswerden wollen. Daher nehmen wir noch eine weitere Koordinatentransformation vor. Wir definieren für r > 2G M: 1 v/4G M 1
R:= v − u = e + e−u/4G M 2 2 1 v/4G M 1
(18.28) v + u = e − e−u/4G M T := 2 2 Das sind die sogenannten Kruskal-Szekeres-Koordinaten, die von Kruskal und unabhängig davon von Szekeres 1960 gefunden wurden. Wir wollen sie ab jetzt kurz KruskalKoordinaten nennen. In Schwarzschild-Koordinaten t, r ausgedrückt, ergibt sich mit (18.13) und (18.16) durch Ersetzen von v und u 1 (t+r +2G M ln|r −2G M|)/4G M e + e−(t−r −2G M ln|r −2G M|)/4G M 2 1 t/4G M e + e−t/4G M = er /4G M (r − 2G M)1/2 2 t r /4G M 1/2 =e (r − 2G M) cosh 4G M
R=
sowie analog T = er /4G M (r − 2G M)1/2 sinh
t 4G M
.
Die Radialkoordinate r ist dann eine Funktion von T und R , für welche man folgende implizite Darstellung findet: ⎡
⎤ ⎥ ⎢ t t ⎢ ⎥ − sinh2 R 2 − T 2 = er /2G M (r − 2G M) ⎢cosh2 ⎥ = er /2G M (r − 2G M) ⎣ 4G M 4G M ⎦ ! =1
(18.29)
Für die Zeitkoordinaten t folgt die Beziehung t = 4G M tanh
Aufgabe 18.6 Zeigen Sie, dass sich Koordinaten (18.26) durch
die
−1
T . R
Schwarzschild-Metrik
(18.30)
in
Kruskal-
18.5
Kruskal-Koordinaten
ds 2 = −
16G 2 M 2 r
529
e−r /2G M dT 2 − d R 2 + r 2 dϑ 2 + sin2 ϑ dϕ 2
(18.31)
darstellen lässt. Lösung Wir wollen das Linienelement der Schwarzschild-Metrik durch die Kruskal-Koordinaten ausdrücken und berechnen dazu zunächst d R und dT . Es gilt 1/2 1 dR t r /4G M (r − 2G M) −1/2 =e + (r − 2G M) cosh dr 4G M 2 4G M √ t 2G M 1 r /4G M cosh e r − 2G M + √ = 4G M 4G M r − 2G M r 1 t er /4G M √ cosh = 4G M 4G M r − 2G M sowie
√ 1 t dR r /4G M = e . r − 2G M sinh dt 4G M 4G M
Kürzt man den Term
und
r 1 =: a er /4G M √ 4G M r − 2G M √ 1 er /4G M r − 2G M =: b 4G M
ab, so erhält man d R = a cosh und genauso
dT = a sinh
t 4G M
t 4G M
dr + b sinh
dr + b cosh
t 4G M
t 4G M
dt dt.
Daraus folgt d R 2 − dT 2 = a 2 dr 2 − b2 dt 2 1 1 r2 r /2G M dr 2 − = e er /2G M (r − 2G M) dt 2 2 2 16G M r − 2G M 16G 2 M 2 ⎛ ⎞ 1 r 2G M ⎜ ⎟ dt 2 ⎠ . dr 2 − 1 − = er /2G M ⎝ 2G M 16G 2 M 2 r 1− r
530
18 Schwarze Löcher in der Schwarzschild-Raumzeit
Bei der Herleitung der Formel (18.31) haben wir vorausgesetzt, dass r > 2G M ist. Den Fall r < 2G M behandelt man analog, indem man die Kruskal-Koordinaten durch t r /4G M 1/2 R=e (2G M − r ) sinh 4G M t r /4G M 1/2 T =e (18.32) (2G M − r ) cosh 4G M definiert und durch eine ähnliche Rechnung das gleiche Linienelement (18.31) erhält. Für die inversen Transformationen folgt im Fall r < 2G M dann analog zu (18.29) und (18.30): R 2 − T 2 = er /2G M (r − 2G M) −1 R t = 4G M tanh T
(18.33) (18.34)
Das Kruskal-Linienelement enthält ebenfalls keinen Term mehr, der auf eine Besonderheit bei r = 2G M hinweist. Natürlich bleibt die echte Singularität bei r = 0 erhalten. Das Kruskal-Diagramm Wenn wir uns wieder auf radiale Lichtstrahlen (dϑ = dϕ = 0) beschränken, so erhalten wir 0=
16G 2 M 2 r
e−r /2G M dT 2 − d R 2 ,
d. h. T = ±R + const., also wie bei den Nullkoordinaten werden auch hier die Lichtstrahlen durch gerade Linien mit Steigung ±45◦ in der (R, T )-Ebene abgebildet. Wir schauen uns nochmals die Beziehungen zwischen den Kruskal- und den Schwarzschild-Koordinaten an. Aus (18.29) R 2 − T 2 = er /2G M (r − 2G M) ergeben sich folgende Aussagen: 1. r = 2G M ist äquivalent zu T = ±R. 2. Für festes r erhalten wir die Hyperbelschar R 2 − T 2 = const. 3. Für festes t = const. definiert die Gl. (18.30)
(18.35)
18.5
Kruskal-Koordinaten
531
t T = tanh R 4G M eine Schar von Geraden durch den Ursprung, für t = 0 ergibt sich die Gerade T = 0, also die R-Achse. Für t → ±∞ konvergiert der Tangens hyperbolicus gegen ±1, d. h., t → ±∞ repräsentiert nach (18.35) die gleiche Fläche wie r = 2G M. Die Kruskal-Koordinaten können jeden Wert annehmen, solange sie nicht die Singularität bei r = 0 treffen. Der erlaubte Bereich ist also nach (18.33): −∞ < R −2G M 2
(18.36)
Bemerkung 18.2 Man kann zeigen (siehe z. B. [24]), dass die Kruskal-Koordinaten eine maximale Erweiterung der Schwarzschild-Metrik repräsentieren. Damit ist gemeint, dass jede (affin) parametrisierte Geodäte (siehe Satz 11.3) entweder bis zu unendlichen Parameterwerten fortgesetzt werden kann oder bei einem bestimmten endlichen Parameterwert in der Singularität r = 0 endet. Etwas umgangssprachlicher formuliert bedeutet maximale Erweiterung, dass in den Kruskal-Koordinaten die meiste Information über die Schwarzschild-Raumzeit steckt. Mit den Relationen (18.36) können wir in Abb. 18.8 das sogenannte Kruskal-Diagramm entwerfen. In Abb. 18.8 ist 2G M =1 unterstellt. Das Kruskal-Diagramm hat vier Sektoren, die mit I, II, III und IV gekennzeichnet sind. • Die Region I stellt den Raum außerhalb des Schwarzschild-Radius dar (r > 2G M), dort sind die Schwarzschild-Koordinaten wohldefiniert. In Abb. 18.8 wird die Region I von den beiden rechten Winkelhalbierenden (r = 2G M, t = ±∞) bzw. (T = ±R, R > 0) begrenzt. • Die Zeitkoordinate t ist für t = 0 die R-Achse, andere Zeitwerte befinden sich auf Geraden durch den Nullpunkt, die zwischen der R-Achse und den Winkelhalbierenden liegen (in Abb. 18.8 nicht dargestellt). Die Winkelhalbierenden selbst repräsentieren die (maximalen) Zeitwerte t = ±∞. • Alle gestrichelten Hyperbeln charakterisieren Ereignisse mit r = const. Für r > 2G M liegen diese in den Sektoren I und IV, für r < 2G M in den Sektoren II und III. • Die beiden schattierten Bereiche liegen außerhalb des Definitionsbereichs der beiden Kruskal-Koordinaten (18.36). Physikalische Interpretation der Kruskal-Lösung Wir wollen das Kruskal-Diagramm physikalisch interpretieren und uns dazu insbesondere der eingezeichneten Zukunfts-Lichtkegel bedienen.
532
18 Schwarze Löcher in der Schwarzschild-Raumzeit
Abb. 18.8 Kruskal-Diagramm der Schwarzschild-Raumzeit
• In der Region I findet man den „Normalfall“: Der Lichtkegel startet bei t = 0, und ein Teilchen kann sich dem Horizont r = 2G M nähern oder auch nicht. • Im Sektor II sind zwei Lichtkegel eingezeichnet. Einer sitzt auf dem Horizont, und man sieht, dass es wie bei den Eddington-Finkelstein-Koordinaten für Lichtstrahlen die Möglichkeit gibt, für immer auf dem Horizont zu verweilen. Der andere Lichtkegel in der Region II endet unausweichlich in der Singularität r = 0. Wenn wir uns einen Lichtstrahl vorstellen, der aus Region I startet (also parallel zu und oberhalb der Linie T = −R), so kann dieser nur die Region II erreichen, nicht aber die Regionen III und IV. Die Region II ist demnach das Schwarze Loch, das Ereignis r = 0 dort wird auch Zukunftssingularität genannt. • Da alle Zukunftslichtkegel dieselbe Gestalt haben, gilt das auch für Lichtkegel in der Region III. Unsere Welt I kann die Region III nicht beeinflussen, aber sie könnte von dort beeinflusst werden, wenn ausgehende Lichtstrahlen oder zeitartige Objekte von III nach I gelangen. Die Region III hat ebenfalls eine Singularität, aber nichts kann dort hineinfallen, da die Zeit rückwärts laufen müsste, die Region III ist also ein Weißes Loch mit einer Vergangsheitssingularität bei r = 0.
18.5
Kruskal-Koordinaten
533
• Der ebenfalls asymptotisch flache Sektor IV ist völlig getrennt von uns (vergleiche auch die Anmerkung zu den isotropen Schwarzschild-Koordinaten am Ende des Abschn. 14.4). Ein Beobachter in Region I kann nicht mit einem Beobachter in Region IV kommunizieren. Ein Lichtsignal, das von Region I in Richtung Region IV geschickt wird, wird ins Schwarze Loch fallen und von der Singularität „verschluckt“werden. Eine einzige theoretische Möglichkeit einer „Kommunikation“besteht darin, dass z. B. ein Zwillingspaar aus der Region III sich trennt und ein Zwilling in die Region I reist und der andere in die Region IV. Beide entschließen sich dann, in das Schwarze Loch II zu fallen. Dort könnten sie sich (für eine ganz kurze Zeit, wie wir gezeigt haben) wieder treffen und gemeinsam in die Singularität fallen. • Wenn wir uns nochmals vor Augen halten, dass ein andauernd kollabierender kugelsymmetrischer Körper immer ein Schwarzes Loch (Region II) generiert und sich außerhalb des Horizonts ausschließlich die Region I ausweitet, so bleibt bis heute die Frage unbeantwortet, ob die Regionen III und IV, die – wie gezeigt – theoretisch aus der SchwarzschildMetrik abgeleitet werden können, tatsächlich physikalisch existieren.
Diagramme, Flächen und Horizonte
19
Neben den in den letzten Abschnitten häufig genutzten Raumzeitdiagrammen wollen wir in diesem Kapitel zwei weitere Diagrammtypen vorstellen, mit denen man Phänomene der Allgemeinen Relativitätstheorie visualisieren kann.
19.1
Einbettungsdiagramme und Wurmlöcher
Um sich ein Bild von der inneren Geometrie einer gekrümmten zweidimensionalen Fläche machen zu können, ist es häufig zweckmäßig, sich die Fläche als Einbettung im (flachen) R3 anzuschauen, wie wir es für die Zweisphäre und für die kugelsymmetrische Mannigfaltigkeit in Abb. 14.1 in früheren Kapiteln schon getan haben. Für eine solche Einbettung der kompletten vierdimensionalen Schwarzschild-Raumzeit bräuchte man schon einen mindestens sechsdimensionalen flachen Raum (siehe [17]), also etwas, was noch unanschaulicher als die Raumzeit selbst ist. Manchmal ist es allerdings möglich, einen zweidimensionalen Ausschnitt einer vierdimensionalen Geometrie in einen dreidimensionalen flachen Raum einzubetten und so etwas mehr z. B. über das Krümmungsverhalten zu lernen. Wir demonstrieren die Vorgehensweise an einem (einfachen) Beispiel, was man ausführlich behandelt in [30] und etwas knapper bei [31] findet. Später werden wir dann auch Einbettungsdiagramme in der Schwarzschild-Raumzeit untersuchen. Beispiel 19.1
Wir betrachten die Metrik ds 2 = −dt 2 + dr 2 + r 2 + b2 dϑ 2 + sin2 ϑ dϕ 2 ,
(19.1)
wobei b ∈ R>0 eine Konstante ist. Die Metrik (19.1) hat große Ähnlichkeiten mit der Minkowski-Metrik in Kugelkoordinaten (1.34): © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_19
535
536
19 Diagramme, Flächen und Horizonte
• Sie ist unabhängig von der Zeitkoordinate t, d. h., sie ist stationär. Da sie keine gemischten Terme wie z. B. dt dr enthält, ist sie sogar statisch. • Sie ist kugelsymmetrisch, da die Fläche bei konstantem t und r die Geometrie einer Kugel hat. • Sie ist asymptotisch flach, für r → ∞ nähert sie sich der Minkowski-Metrik. • Sie hat keine Singularitäten: t ∈ (−∞, ∞) , r ∈ [0, ∞) , ϑ ∈ [0, π ] , ϕ ∈ [0, 2π ) Aber, da b = 0 ist, ist die Raumzeit nicht flach, sondern gekrümmt, wie wir jetzt zeigen wollen. In einer statischen Raumzeit hat ein dreidimensionaler räumlicher Ausschnitt zu jeder Zeit die gleiche Geometrie, wir setzen daher t = const. und erhalten die dreidimensionale Metrik ds 2 = dr 2 + r 2 + b2 dϑ 2 + sin2 ϑ dϕ 2 . Weiterhin hat zu jeder Zeit der Raum eine Kugelsymmetrie, sodass ein bestimmter Schnitt durch den Ursprung r = 0, der den Raum symmetrisch in zwei Hälften teilt, genau die gleiche zweidimensionale Geometrie hat wie jeder andere Schnitt durch den Ursprung, d. h., wir können den Schnitt so wählen, dass wir die „äquatoriale“ Fläche ϑ = π/2 herausschneiden. Der entstandene zweidimensionale Flächenausschnitt hat damit die Metrik ds 2 = dr 2 + r 2 + b2 dϕ 2 , (19.2) und diesen wollen wir durch Einbettung in den R3 visualisieren. Der Flächenausschnitt ist rotationssymmetrisch, da ϕ → ϕ + const. die Metrik (19.2) nicht ändert. Von daher sollte sich der Flächenausschnitt als achsensymmetrische Fläche im R3 darstellen lassen, d. h., dafür geeignete Koordinaten sind die Zylinderkoordinaten im R3 , die wir zur Unterscheidung der Ausgangskoordinaten (r , ϕ) mit (ρ, ψ, z) bezeichnen wollen. Die Metrik des flachen dreidimensionalen Raums in diesen Koordinaten ist ds 2 = dρ 2 + ρ 2 dψ 2 + dz 2 .
(19.3)
Eine (gekrümmte) Fläche im flachen Raum kann durch eine Höhenfunktion z (r , ϕ) visualisiert werden. Wir suchen also eine Funktion z (r , ϕ), die die gleiche Geometrie wie (19.2) besitzt. Außerdem müssen wir die Koordinaten (ρ, ψ) mit den Ausgangskoordinaten (r , ϕ) in Beziehung setzen, d. h., wir müssen drei Funktionen z = z (r , ϕ) , ρ = ρ (r , ϕ) , ψ = ψ (r , ϕ) finden. Da wir Achsensymmetrie voraussetzen, können wir vereinfachen: Wir setzen ψ = ϕ und wählen die Funktionen z und ρ unabhängig von ϕ z = z (r ) , ρ = ρ (r ) ,
ψ = ϕ.
19.1
Einbettungsdiagramme und Wurmlöcher
537
Für die Differenziale/Einsformen folgt daraus dz =
dz dρ dr , dρ = dr , dr dr
und die Metrik (19.3) können wir als 2 dz 2 dρ 2 ds = + dr 2 + ρ 2 dϕ 2 dr dr
(19.4)
schreiben. Durch Vergleich von (19.4) mit (19.2) ergibt sich sofort ρ 2 = r 2 + b2 ⇒ ρ =
r dρ =√ r 2 + b2 (ρ ≥ 0) ⇒ dr r 2 + b2
sowie
dz dr
2
+
dρ dr
2
dz r2 1 =± 1− 2 =1⇒ = ±b . dr r + b2 r 2 + b2
Die letzte Gleichung ist eine Differenzialgleichung für z (r ), die durch Integration (siehe z. B. [27]) gelöst werden kann: r , z (r ) = ±b sinh−1 b wobei wir die Integrationskonstante so gewählt haben, dass z (0) = 0 gilt. Damit folgt auch ⎞ ⎛ 2 ρ − 1⎠ . z (ρ) = ±b sinh−1 ⎝ b2 Wir erhalten also zwei Lösungen, die zwei unterschiedliche, aber verbundene Raumzeiten charakterisieren, wie Abb. 19.1 zeigt. Die dargestellte Fläche hat zwei asymptotisch flache Regionen, für z → +∞ bzw. z → −∞, die durch einen „Hals“ mit Umfang 2π b bei z = 0 verbunden sind. Eine solche Geometrie nennt man auch Wurmlochgeometrie. In der Science-Fiktion-Literatur verbindet ein Wurmloch oftmals zwei unterschiedliche „Universen“, manchmal auch zwei weit auseinander liegende Orte im gleichen Universum, und man könnte denken, dass unsere nichtsinguläre Raumzeit bei genügend „dickem Hals“ ein Durchqueren des Wurmlochs z. B. von einer Rakete erlauben müsste. Leider gibt es einen Haken bei der von uns beispielhaft untersuchten Raumzeit. Die Metrik (19.1) ist zwar eine Lösung der Einstein-Gleichungen, verlangt aber, dass es Massen mit negativer Energiedichte geben muss (für eine ausführliche Begründung siehe [30]). Nun sind aber die Energiedichten
538
19 Diagramme, Flächen und Horizonte
Abb. 19.1 Zweidimensionaler Flächenschnitt, eingebettet im R3
aller klassischen Felder (Quantenfluktuationen und negative Vakuumenergie bleiben hier außen vor) positiv. Damit ist unsere Beispielraumzeit unphysikalisch und nur fiktiv. Schwarzschild-Wurmlöcher und Einstein-Rosen-Brücke Wir wenden uns nun wieder der Schwarzschild-Raumzeit zu und wollen ein analoges Einbettungsdiagramm generieren. Da die Schwarzschild-Metrik statisch und kugelsymmetrisch ist, setzen wir wie im Beispiel 19.1 t = 0 sowie ϑ = π/2 und erhalten mit (18.1) für das zweidimensionale Flächenelement die Metrik 2G M −1 2 2 ds = 1 − dr + r 2 dϕ 2 . (19.5) r
Aufgabe 19.1 Zeigen Sie, dass sich bei Benutzung von Zylinderkoordinaten im Vergleich mit (19.5) für die z-Koordinate √ √ z (r ) = ±2 2G M r − 2G M
ergibt.
19.1
Einbettungsdiagramme und Wurmlöcher
539
Lösung Für den flachen dreidimensionalen Raum verwenden wir wieder die Zylinderkoordinaten (ρ, ϑ, z) und die Metrik (19.3) 2 dz 2 dρ 2 + ds = dr 2 + ρ 2 dϕ 2 . dr dr Durch Vergleich ergibt sich
ρ =r ⇒
sowie
dz dr
2
+
dρ dr
2
dρ dr
2G M = 1− r
2
−1
=1
dz 2G M =± . ⇒ dr r − 2G M
Wir integrieren und erhalten z (r ) = ±2
√
2G M
√ r − 2G M,
wobei die Integrationskonstante so gewählt ist, dass z = 0 für r = 2G M gilt. Damit können wir in Abb. 19.2 das Einbettungsdiagramm erstellen. Das Diagramm (auch Flamm’sches Paraboloid genannt) hat große Ähnlichkeit mit dem Beispieldiagramm und stellt ebenfalls eine Wurmlochgeometrie dar. Diese wird Schwarzschild-Wurmloch oder auch Einstein-Rosen-Brücke genannt. Für die Interpretation und den Vergleich mit dem Kruskal-Diagramm in Abb. 18.8 muss man sich das Diagramm um 90◦ nach rechts gedreht vorstellen. Dann sieht es zunächst so aus, als ob man das Wurmloch von der Region I (Kruskal-Koordinate R > 0) durch den „Ring“ r = 2G M (ist eigentlich eine Kugel, da wir ja eine Raumdimension unterdrückt haben) in die Region IV (R < 0) durchqueren könnte. Aber hier sagt unsere Analyse aus dem letzten Abschnitt, dass man unweigerlich in die Singularität r = 0 fällt, wenn man den Ereignishorizont r = 2G M erreicht hat. Ein Durchqueren des Wurmlochs ist also auch in diesem Fall unmöglich. Es gibt auch noch das Argument, dass ein in den Regionen I und IV raumartiges Wurmloch zu einer zeitartigen Untermannigfaltigkeit in den Regionen II und III wird, d. h., das Wurmloch ist nicht statisch. Mit fortschreitender Zeit wird der Radius r immer kleiner und verschwindet bei r = 0, d. h., das Wurmloch selbst existiert nur eine sehr kurze Zeitspanne, sodass kein Teilchen und kein Lichtstrahl es durchqueren kann (eine ausführliche Darstellung dieses Phänomens findet man z. B. in [17] oder [30]).
540
19 Diagramme, Flächen und Horizonte
Abb. 19.2 Schwarzschild-Wurmloch, Einstein-Rosen-Brücke
19.2
Penrose-Diagramme
Ein Raumzeitdiagramm wie das Kruskal-Diagramm in Abb. 18.8 ist für eine lokale Analyse der Schwarzschild-Raumzeit gut geeignet, liefert allerdings keine Hinweise darauf, wie sich die Raumzeit insgesamt darstellt, insbesondere wenn die Koordinaten gegen unendlich streben. Hier hilft der Prozess der konformen Kompaktifizierung, der eine weitere Form der Visualisierung ermöglicht, die man Penrose-Diagramm nennt (nach dem englischen Mathematiker und Physiker Roger Penrose, geb. 1931). Dabei bedeutet konforme Kompaktifizierung, dass man eine Transformation durchführt, die die kausale Struktur der Ausgangsmetrik erhält (konform) und die gesamte (unendliche) Raumzeit auf einen endlichen Bereich (kompakt) abbildet. Konforme Transformationen verändern die Ausgangsmetrik gμν durch Multiplikation mit einem konformen Faktor ω, siehe auch Definition 11.6: g˜ μν = ω2 gμν , wobei ω eine nicht verschwindende Funktion ist, die von den Punkten der Raumzeit abhängen kann. Lichtartige Kurven werden durch konforme Transformationen nicht verändert:
19.2
Penrose-Diagramme
541
gμν
dxμ dxv dxμ dxv = 0 ⇔ g˜ μν = 0, dλ dλ dλ dλ
d. h. insbesondere, dass die Öffnungswinkel der Lichtkegel invariant unter konformen Transformationen sind und damit die kausale Struktur erhalten bleibt. Wir wollen das Konzept des Penrose-Diagramms am Beispiel der Minkowski-Raumzeit erläutern. Penrose-Diagramme für die Minkowski-Raumzeit Beispiel 19.2
Die Minkowski-Metrik in Kugelkoordinaten t, r , ϑ, ϕ lautet nach (1.33) ds 2 = −dt 2 + dr 2 + r 2 dϑ 2 + r 2 sin2 ϑ dϕ 2 , und der Öffnungswinkel der Lichtkegel beträgt 45◦ . Die Wertebereiche der Koordinaten t, r sind −∞ < t < ∞, 0 ≤ r < ∞. Wir definieren die Nullkoordinaten u, v durch u = t − r, v = t + r ⇒ r =
v−u 2
mit den Wertebereichen −∞ < u < ∞, −∞ < v < ∞, u ≤ v und du dv = dt 2 − dr 2 . Die Minkowski-Metrik in Nullkoordinaten ist somit ds 2 = −du dv +
1 (v − u)2 dϑ 2 + sin2 ϑ dϕ 2 . 4
(19.6)
Unser Ziel, den Koordinatenbereich auf endliche Intervalle einzuschränken, erreichen wir durch die Transformation U := arctan u, V := arctan v mit −
(19.7)
π π π π < U < , − < V < , U ≤ V. 2 2 2 2
Aufgabe 19.2 Zeigen Sie, dass sich durch die Transformation (19.7) die MinkowskiMetrik als
542
19 Diagramme, Flächen und Horizonte
ds 2 =
1 −4 dU d V + sin2 (V − U ) dϑ 2 + sin2 ϑ dϕ 2 4 cos2 U cos2 V
(19.8)
darstellen lässt. Lösung Es folgt mit (19.7) du dv =
1 dU d V cos2 U cos2 V
sowie (v − u)2 = (tan V − tan U )2 = =
1 (sin V cos U − cos V sin U )2 cos2 V
cos2 U
1 sin2 (V − U ) . cos2 V
cos2 U
Die Metrik (19.6) wird mit den neuen Koordinaten zu ds 2 =
1 4 cos2 U
cos2
V
−4 dU d V + sin2 (V − U ) dϑ 2 + sin2 ϑ dϕ 2 .
Die Minkowski-Metrik in Nullkoordinaten (19.6) wird also zu einer mit einem konformen Faktor umskalierten Metrik. Zuletzt transformieren wir die Variablen U , V durch T := V + U , R := V − U mit den Wertebereichen −π < T + R 2G M eingezeichneten Zukunfts-Lichtkegel, dessen Öffnungswinkel wieder 45◦ groß ist, erkennt man, dass die auswärts laufenden Lichtstrahlen bei J + und die einwärts laufenden Lichtstrahlen in der Zukunftssingularität r = 0 enden. Aus Gl. (19.13) lesen wir ab, dass die Singularität r = 0 durch T = ±
Abb. 19.6 Penrose-Diagramm der Kruskal-Lösung
19.3
19.3
Dreidimensionale Flächen
549
Dreidimensionale Flächen
Nullflächen und Ereignishorizonte In diesem Abschnitt wollen wir einen Ereignishorizont als eine spezielle dreidimensionale Fläche in der Raumzeit charakterisieren und eine einfache Methode entwickeln, wie man bei den folgenden, komplizierteren Raumzeiten Ereignishorizonte aufspüren kann. So wie es im dreidimensionalen Raum zweidimensionale Flächen gibt, gibt es in der vierdimensionalen Raumzeit dreidimensionale Teilmengen, die (Hyper-)Flächen genannt werden, wobei wir das „Hyper“ meistens weglassen. Ist f : M → R eine differenzierbare Funktion, so wird durch die Menge aller Punkte x 0 , x 1 , x 2 , x 3 , die die Gleichung f x μ = f x 0, x 1, x 2, x 3 = 0 erfüllen, eine Fläche definiert. Den Normalenvektor n in einem Punkt p ∈ erhält man durch ∂f n = n μ = g μν ν . ∂x Er steht senkrecht auf allen Vektoren in T p ⊂ T p M (siehe [21]). • Ist n zeitartig n μ n μ < 0 , so nennt man raumartig. • Ist n raumartig n μ n μ > 0 , so nennt man zeitartig. • Ist n lichtartig n μ n μ = 0 , so nennt man Nullfläche. Beispiel 19.3
Wir zeigen, dass in der Minkowski-Raumzeit der Zukunfts-Lichtkegel eine Nullfläche ist. Dazu betrachten wir die Minkowski-Metrik ds 2 = −dt 2 + d x 2 + dy 2 + dz 2 und definieren die interessierende Fläche durch x = t, also f (t, x, y, z) = −t + x = 0. Die Komponenten des Gradienten sind dann n μ = (−1, 1, 0, 0) , woraus
n μ n μ = ημν n μ n ν = η00 + η11 = −1 + 1 = 0
folgt. Die Fläche x = t ist also eine Nullfläche. Sie wird von den drei Tangentialvektoren n = (1, 1, 0, 0) , k → (0, 0, 1, 0) , l → (0, 0, 0, 1)
550
19 Diagramme, Flächen und Horizonte
Abb. 19.7 Lichtkegel als Nullfläche
mit
ημν n μ n ν = 0, ημν k μ k ν = 1, ημν l μl ν = 1
aufgespannt. Der Vektor n ist lichtartig, die beiden anderen sind raumartig. Ferner gilt ημν n μ k ν = 0, ημν n μl ν = 0, ημν k μl ν = 0, d. h., die Vektoren sind orthogonal zueinander. Bemerkenswert ist, dass der Normalenvektor n sowohl tangential zur Nullfläche liegt, als auch senkrecht zu ihr (und damit zu sich selbst) ist. Abb. 19.7 zeigt die Weltlinie eines Beobachters, die von einem Lichtkegel erreicht wurde. Hat die Weltlinie einmal den Lichtkegel gekreuzt, gibt es für den Beobachter keine Möglichkeit mehr, den Lichtkegel wieder zu verlassen. Der Lichtkegel wirkt – ganz ähnlich wie der Ereignishorizont in der Schwarzschild-Raumzeit - wie eine Einwegmembrane. Die Fläche r = 2G M in der Schwarzschild-Raumzeit Wir wollen nun die Fläche r = 2G M in der Schwarzschild-Raumzeit untersuchen. Sie wird durch f (t, r , ϑ, ϕ) = r − 2G M = 0 definiert. Die Komponenten des Gradienten sind n μ = (0, 1, 0, 0) . Um n μ zu berechnen, betrachten wir die Eddington-Finkelstein-Metrik (18.15)
19.3
Dreidimensionale Flächen
⎛
gμν
mit der Inversen
− (1 − 2G M/r ) ⎜ 1 =⎜ ⎝ 0 0
⎞ 1 0 0 ⎟ 0 0 0 ⎟ 2 ⎠ 0 0r 2 2 0 0 r sin ϑ
⎞ 0 1 0 0 ⎟ ⎜ 1 1 − 2G M/r 0 0 ⎟, =⎜ 2 ⎠ ⎝0 0 0 1/r 2 2 0 0 0 1/ r sin ϑ ⎛
g μν
dann folgt
551
n μ n μ = g μν n μ n ν = grr = 1 − 2G M/r = 0
für r = 2G M, d. h., die Fläche f = r − 2G M = 0 ist eine Nullfläche. Sie breitet sich aber nicht wie die Nullfläche im Beispiel 19.3 bis ins räumlich Unendliche aus, sondern beschreibt für eine konstante Zeit v = const. eine abgeschlossene zweidimensionale Sphäre mit dem Flächeninhalt 4π (2G M)2 . Die einseitige Passierbarkeit der Nullfläche bedeutet für die Schwarzschild-Raumzeit, dass Teilchen und Lichtstrahlen von außen in den Bereich r < 2G M eindringen, diesen aber nicht wieder verlassen können. Die Nullfläche beschreibt also den Ereignishorizont des Schwarzen Lochs der Schwarzschild-Raumzeit. Wenn wir uns nochmals die Komponente grr anschauen, so ist diese für r > 2G M positiv, d. h., die Koordinate r ist dort raumartig. Für r < 2G M ist grr negativ, und r ist zeitartig. Die Nullfläche grr = 0 bildet also einen Ereignishorizont, wenn der Gradient der die Fläche definierenden Funktion f die Einsform d f = (0, 1, 0, 0) ist. Flächen unendlicher Rotverschiebung Eine Fläche unendlicher Rotverschiebung wird durch gtt = 0 definiert. Wir wollen zeigen, dass in der Schwarzschild-Raumzeit die Fläche r = 2G M nicht nur den Ereignishorizont definiert, sondern auch eine Fläche unendlicher Rotverschiebung ist. Wir schauen uns nochmals die Gleichung der Rotverschiebung im äußeren Schwarzschild-Feld (18.2) an und definieren den Rotverschiebungsfaktor z durch √ f2 −gtt (r1 ) −1 z= −1= √ f1 −gtt (r2 ) mit gtt (r ) = − (1 − 2G M/r ). Für Licht, das bei r ausgesendet und im Unendlichen empfangen wird (gtt (r1 ) = 1), gilt dann
552
19 Diagramme, Flächen und Horizonte
1
z =
1−
2G M r
−1=
r − 1 → ∞ f ur ¨ r → 2G M, r − 2G M
d. h., die Fläche r = 2G M ist eine Fläche unendlicher Rotverschiebung. Wir werden in den folgenden Kapiteln sehen, dass in anderen Raumzeiten die Ereignishorizonte und die Flächen unendlicher Rotverschiebung nicht zusammenfallen müssen.
20
Geladene Schwarze Löcher
Die Schwarzschild-Lösung ist eine sehr wichtige exakte Lösung der Einstein-Gleichungen im Vakuum. Wir erwarten aber, dass reale astrophysikalische Objekte, die zu einem Schwarzen Loch kollabieren, evtl. geladen sein bzw. rotieren können. In diesem und in Kap. 21 verallgemeinern wir die Schwarzschild-Lösung in beide Richtungen.
20.1
Die Reissner-Nordström-Lösung
Zunächst betrachten wir eine statische, asymptotisch flache, kugelsymmetrische Lösung der Einstein-Gleichungen bei Anwesenheit eines elektromagnetischen Feldes, das durch eine Punktladung im Ursprung r = 0 der Schwarzschild-Koordinaten generiert wird. Das elektromagnetische Feld ist damit ebenfalls statisch und kugelsymmetrisch. Das heißt, die Komponenten des elektromagnetischen Feldstärketensors (5.21) in Kugelkoordinaten reduzieren sich auf ⎞ ⎛ 0 E (r ) 0 Er Eϑ Eϕ ⎜ −E r 0 B ϕ −B ϑ ⎟ ⎜ −E (r ) 0 ⎟=⎜ =⎜ ⎝ −E ϑ −B ϕ 0 Br ⎠ ⎝ 0 0 −E ϕ B ϑ −B r 0 0 0 ⎛
F μν
0 0 0 0
⎞ 0 0⎟ ⎟ 0⎠ 0
(20.1)
mit einer noch zu bestimmenden Funktion E (r ), die nur von der Koordinate r abhängt. Für die weiteren Berechnungen greifen wir wieder auf die Standardform der Metrik für statische kugelsymmetrische Raumzeiten (14.6): ds 2 = −e2a(r ) dt 2 + e2b(r ) dr 2 + r 2 dϑ 2 + r 2 sin2 ϑ dϕ 2
© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_20
(20.2)
553
554
20 Geladene Schwarze Löcher
zurück. Wie in Abschn. 17.2 bei der Herleitung der inneren Schwarzschild-Metrik wollen wir die Funktionen a(r ) und b(r ) mithilfe der Einstein-Maxwell-Gleichungen G μν = R μν −
1 μν g R = 8π G T μν 2
bestimmen, wobei T μν der Energie-Impuls-Tensor des elektromagnetischen Feldes ist, und dazu einige Ergebnisse aus Abschn. 14.1 nutzen. Da wir dort die Komponenten des EinsteinTensors in nichtholonomen Koordinaten berechnet haben, müssen wir den Energie-ImpulsTensor ebenfalls in dieser Basis darstellen. In der nichtholonomen Basis gilt nach (14.7) g = ds 2 = ηαβ eα ⊗ eβ . Nach Formel (6.4) lauten die Komponenten des Energie-Impuls-Tensors in quellfreien Gebieten des elektromagnetischen Feldes im Minkowski-Raum 1 1 F μσ F νσ − ημν Fαβ F αβ , T μν = 4π 4 wobei wir zur Vereinfachung der folgenden Rechnungen die Konstante haben. In unserem Fall ergibt sich mit (5.23)
1 hinzugefügt 4π
Fαβ F αβ = Ftr F tr + Fr t F r t = −2E 2 sowie F tr F tr = F tr ητ r F tτ = F tr ηrr F tr = E 2 F r t F rt = F r t ητ t F r t = F r t ηtt F r t = −E 2 ,
(20.3)
alle anderen Kombinationen F μσ F νσ verschwinden.
Aufgabe 20.1 Berechnen Sie die Komponenten des Energie-Impuls-Tensors und setzen Sie diese mit dem Ergebnis 1 2b 1 −2b = G E2 − (20.4) G tt = 2 − e r r2 r 1 2a 1 G rr = − 2 + e−2b 2 + = −G E 2 r r r
in die Einstein-Gl. (14.12) ein.
20.1
Die Reissner-Nordström-Lösung
555
Lösung Für die Komponenten des Energie-Impuls-Tensors folgt mit (20.3) 1 E2 1 1 E2 T tt = F tr F tr − ηtt Fαβ F αβ = E2 − = 4π 4 4π 2 8π 2 1 E2 1 1 E F r t F rt − ηrr Fαβ F αβ = −E 2 + =− = −T tt T rr = 4π 4 4π 2 8π E2 1 ϑϑ 1 ϑϑ αβ = − η Fαβ F = T ϕϕ . T = 4π 4 8π Dieses Ergebnis setzen wir in die rechte Seite der Einstein-Gleichungen ein und erhalten E2 1 2b 1 G tt = 2 − e−2b 2 − = 8π G = G E2 r r r 8π 1 2a 1 = −G E 2 . G rr = − 2 + e−2b 2 + r r r Addition der beiden Gl. (20.4) führt wie bei der Ableitung der Schwarzschild-Metrik (14.13) zu a + b = 0 ⇒ a + b = 0, da wegen der angenommenen asymptotischen Flachheit der Raumzeit keine Integrationskonstante eingefügt werden darf. Wir wollen nun die unbekannte Funktion E (r ) mithilfe der Maxwell-Gleichungen (13.5) ∇ν F μν = J μ
(20.5)
bestimmen. In unserem Fall ist J μ = 0, da wir nur eine Punktladung im Ursprung unterstellt haben. Die linke Seite von (20.5) ist für μ = t ν t ν ∇ν F tν = ∂ν F tν + F tρ ρν + F ρν ρν = ∂ν F tν + F tρ ρν , t da sich bei der Summation der antisymmetrische Term F ρν und der symmetrische Term ρν tr r t aufheben. Da die einzigen nicht verschwindenden Komponenten F = −F sind, erhalten wir ∇ν F tν = ∂r F tr + F tr rνν = ∂r E + E rνν . (20.6)
Aufgabe 20.2
Zeigen Sie, dass aus (20.6) die Beziehung ∇ν F tν = ∂r E +
folgt.
2E r
(20.7)
556
20 Geladene Schwarze Löcher
Lösung Für die Christoffel-Symbole ergibt sich mit obiger Metrik (20.2) und mit (11.47) ⎛ ⎞ 1 1
rt t = g tt ⎝∂t gr t +∂r gtt − ∂t gr t ⎠ = − e−2a −2a e2a = a
2 2 =0
r
rr
=0
1 1 = grr (∂r grr + ∂r grr − ∂r grr ) = e−2b 2b e2b = b 2 ⎛ ⎞2 1 ϑϑ ⎝ 1 1 1 g ∂ϑ gr ϑ +∂r gϑϑ − ∂ϑ gr ϑ ⎠ = (2r ) =
2 2 r2 r =0 =0 ⎛ ⎞ 1 1 1 ⎜ ⎟ 1 2r sin2 ϑ = . = g ϕϕ ⎝∂ϕ gr ϕ +∂r gϕϕ − ∂ϕ gr ϕ ⎠ =
2 2 r 2 sin2 ϑ r
rϑϑ =
rϕϕ
=0
=0
Wegen a + b = 0 heben sich die ersten beiden Terme bei der Summation auf, und es bleibt ∇ν F tν = ∂r E +
2E . r
Aus (20.7), (20.5) und J μ = 0 ergibt sich 0 = ∂r E +
2E d 2 ⇒ 0 = r 2 ∂r E + 2Er = r E r dr
und daraus
Q r2 mit einer Integrationskonstanten Q. Wenn wir die Integrationskonstante Q als Punktladung im Ursprung interpretieren, erhalten wir für E (r ) genau das klassische Coulomb’sche Feld. Wir setzen E (r ) in die Gl. (20.4) ein, multiplizieren diese mit r 2 und erhalten G Q2 G Q2 G Q2 C e−2b 1 − 2b r = 1 − 2 ⇔ r e−2b = 1 − 2 ⇒ e−2b = e2a = 1 + + 2 r r r r mit der Integrationskonstanten C, die wir wie in der Schwarzschild-Lösung als E (r ) =
C = −2G M definieren. Die Metrik (20.2) für eine Raumzeit mit einer Punktladung im Ursprung konkretisiert sich damit zu
20.2
Grundlegende Eigenschaften der Reissner-Nordström-Lösung
ds 2 = −
G Q2 2G M + 2 1− r r
dt 2 +
G Q2 2G M + 2 1− r r
−1
557
dr 2 + r 2 dϑ 2 + sin ϑ dϕ 2 .
(20.8) Sie wird nach ihren Erfindern Reissner-Nordström-Metrik (RN-Metrik) genannt.
20.2
Grundlegende Eigenschaften der Reissner-Nordström-Lösung
Wir stellen als Erstes fest, dass die RN-Metrik für Q = 0 in die Schwarzschild-Metrik übergeht und sich wie diese für r → ∞ der Minkowski-Metrik annähert, also asymptotisch flach ist. Sie besitzt eine Raumzeit-Singularität bei r = 0, was man beispielsweise wie in Abschn. 18.1 dadurch zeigen kann, dass der Skalar Rμνρσ R μνρσ für r → 0 über alle Grenzen wächst. Wie bei der äußeren Schwarzschild-Lösung können wir auch hier darauf verzichten zu verlangen, dass die Raumzeit statisch ist, denn es gibt ein Analogon zum Birkhoff-Theorem 14.1, das besagt, dass jede kugelsymmetrische Lösung der Einstein-Maxwell-Gleichungen notwendigerweise statisch ist, siehe [17]. Ereignishorizonte Wir wollen nun die Ereignishorizontstruktur der Reissner-Nordström-Metrik untersuchen und dazu zunächst diejenigen Stellen finden, bei denen (r ) := 1 − null wird, also
!
2G M G Q2 + 2 r r
(r ) = 0 ⇒ r± = G M ±
G2 M 2 − G Q2.
für G M 2 ≥ Q 2 . Die korrespondierenden Flächen definieren wir durch f ± = r − r± = 0 mit den Gradienten (n ± )μ = (0, 1, 0, 0) . Da für die Reissner-Nordström-Metrik grr = (r ) gilt, folgt nach Abschn. 19.3, dass die beiden Flächen r = r± Ereignishorizonte sind. Abb. 20.1 zeigt die drei möglichen Fälle, die wir der Reihe nach betrachten wollen.
558
20 Geladene Schwarze Löcher
Abb. 20.1 Reissner-Nordström-Horizonte
1. Fall G M 2 < Q 2 In diesem Fall ist (r ) > 0 für alle r > 0, und die Metrik ist regulär in den Koordinaten (t, r , ϑ, ϕ). Die Koordinate t ist überall zeitartig, r ist überall raumartig. Es gibt um die Singularität herum keinen Horizont, ein Beobachter kann sich der Singularität beliebig annähern und dann wieder entfernen. Eine solche Stelle in der Raumzeit nennt man nackte Singularität. Das Penrose-Diagramm für diesen Fall sieht demnach genauso aus wie für die Minkowski-Raumzeit, nur ist jetzt bei r = 0 eine Singularität, wie Abb. 20.2 zeigt. In der physikalischen Interpretation bedeutet die Bedingung G M 2 < Q 2 grob gesprochen, dass die Gesamtenergie (linke Seite) kleiner als der Beitrag der Energie durch das elektromagnetische Feld (rechte Seite) ist, d. h., die Masse müsste negativ sein. Von daher wird diese Lösung als „unphysikalisch“ eingestuft. 2. Fall G M 2 = Q 2 Bei diesem Fall, den man auch maximale RN-Lösung nennt, hat (r ) nur eine Nullstelle bei r = G M. Die Metrik (20.8) nimmt die Form GM 2 2 G M −2 2 ds 2 = − 1 − dt + 1 − dr + r 2 dϑ 2 + sin ϑ dϕ 2 r r an. 3. Fall G M 2 > Q 2 Dieser Fall ist realistischer als die beiden ersten, die Gesamtenergie ist größer als die des elektromagnetischen Feldes. Schaut man sich Abb. 20.1 genauer an, so wird in diesem Fall die Raumzeit in drei Gebiete eingeteilt, in denen die Metrik regulär ist:
20.3
Eddington-Finkelstein-Koordinaten der Reissner-Nordström-Lösung
559
Abb. 20.2 Penrose-Diagramm für die RN-Lösung mit G M 2 < Q2
I : r+ < r < ∞, I I : r− < r < r+ , I I I : 0 < r < r− In den Gebieten I und I I I ist (r ) positiv, die Koordinaten t bzw. r sind dort zeit- bzw. raumartig, kehren aber im Gebiet I I ihren Charakter um. Weitere Details dieses Falles folgen in den nächsten Abschnitten.
20.3
Eddington-Finkelstein-Koordinaten der Reissner-Nordström-Lösung
Wir wollen zeigen, dass im Fall G M 2 > Q 2 an den Stellen r+ und r− , wo die Metrik singulär wird, nur Koordinatensingularitäten vorliegen und gehen ähnlich vor wie bei der Herleitung der Eddington-Finkelstein-Koordinaten der Schwarzschild-Raumzeit in Abschn. 18.4. Zunächst bemerken wir, dass 2 2 r− r+ r2 1 1 1 − (20.9) = =1+ (r ) r+ − r− r − r+ r+ − r− r − r− (r − r+ ) (r − r− )
560
20 Geladene Schwarze Löcher
gilt, und definieren eine neue Koordinate r ∗ durch dr ∗ =
dr dr . = (r ) G Q2 2G M + 2 1− r r
Durch Integration von (20.9) erhalten wir r∗ = r +
2 2 r+ r− ln |r − r+ | − ln |r − r− | . r+ − r− r+ − r−
(20.10)
Wie in (18.13) definieren wir die avancierte Zeitkoordinate durch v := t + r ∗ , woraus
2 dr 2 2dv dr dt 2 = dv − dr ∗ = dv 2 − + (r ) (r )2
folgt. Damit wird die RN-Metrik (20.8) in Eddington-Finkelstein-Koordinaten (v, r , ϑ, ϕ) zu ds 2 = − (r ) dv 2 + 2dv dr + r 2 dϑ 2 + sin ϑ dϕ 2 (20.11) (vergleiche mit der Schwarzschild-Metrik in Eddington-Finkelstein-Koordinaten in (18.15)). In diesen Koordinaten hat die Metrik nur noch bei r = 0 eine echte Singularität, d. h., bei r = r± liegen nur Koordinatensingularitäten vor. Wir betrachten einen radial auf das Schwarze Loch zu laufenden Lichtstrahl, d. h., dϑ = dϕ = 0 sowie ds 2 = 0 und erhalten analog zu (18.19) für dv = 0 2 2 r+ r− 2 dr ⇒ v = 2 r + ln |r − r+ | − ln |r − r− | + const. dv = (r ) r+ − r− r+ − r− (20.12) Wir wollen wie bei den Eddington-Finkelstein-Koordinaten der Schwarzschild-Raumzeit noch ein Raum-Zeit-Diagramm der möglichen Verläufe der Lichtstrahlen erstellen und definieren dazu eine neue Zeitkoordinate t¯ := v − r . Mit dieser Koordinate folgt aus dv = 0: t¯ = −r + const.,
20.3
Eddington-Finkelstein-Koordinaten der Reissner-Nordström-Lösung
561
d. h., die einfallenden Lichtstrahlen liegen auf Geraden mit der Steigung −45◦ und mit Gl. (20.12) folgt 2 2 2r− 2r+ ln |r − r+ | − ln |r − r− | + const. r+ − r− r+ − r− Damit ergibt sich das t¯, r -Raumzeitdiagramm in Abb. 20.3. Durch die zwei unterschiedlichen Nullstellen r± (gepunktete Linien) wird die Raumzeit in die drei Gebiete I , I I , I I I aufgeteilt, bei r = 0 (Linie mit Strich-Punkte) liegt die Raumzeit-Singularität, die hier anders als bei der Schwarzschild-Lösung zeitartig ist. Wenn ein Beobachter aus dem asymptotisch flachen Gebiet I radial auf das Schwarze Loch zu fällt, so ist die Fläche r+ wie 2G M in der Schwarzschild-Metrik. Dort wechselt die Koordinate r ihren Charakter, sie wird von einer raumartigen zu einer zeitartigen Koordinate. Die Lichtkegel in der Region I I sind geneigt. Der Beobachter (und auch jeder Lichtstrahl) bewegt sich notwendigerweise in Richtung abnehmendes r . Die Fläche r+ verhält sich also wie eine Einwegmembrane, sie ist ein Ereignishorizont. Ein zweiter Beobachter im Gebiet I sieht das gleiche Phänomen wie bei einem ungeladenen Schwarzen Loch; der fallende Beobachter scheint bei Annäherung an r+ immer langsamer zu fallen und immer mehr rotverschoben zu sein. Die Nullfläche r = r+ ist also auch eine Fläche unendlicher Rotverschiebung.
t¯ = r +
Abb. 20.3 Lichtstrahlen in Eddington-Finkel-Koordinaten in der RN-Lösung
562
20 Geladene Schwarze Löcher
Aber der unausweichliche Fall von r+ gegen null dauert nur bis zum Erreichen von r− , wo r wieder zu einer raumartigen Koordinate wird und die Bewegung Richtung Singularität aufgehalten werden kann, wie auch die Lichtkegel im Gebiet I I I zeigen. Der Beobachter muss also nicht unbedingt in die Singularität fallen. Man kann sogar zeigen, dass neutrale Teilchen einen minimalen Abstand zu r = 0 halten müssen, sie können die Singularität gar nicht erreichen (die Details findet man z. B. in [32]). Aus Abb. 20.3 wird deutlich, dass ein Teilchen im Gebiet I I I die Fläche r = r− nicht kreuzen, sondern nur asymptotisch erreichen kann. Wie in Abb. 18.3 bei der SchwarzschildMetrik ist diese Darstellung irreführend, da ein Teilchen die Fläche r = r− in endlicher Eigenzeit erreichen kann (siehe [32]). Das ist ein Hinweis darauf, dass die durch das Linienelement (20.11) beschriebene Mannigfaltigkeit durch andere Koordinaten eventuell erweitert werden kann. Maximale Erweiterung der Reissner-Nordström-Lösung Im Fall G M 2 > Q 2 nimmt die radiale Koordinate r ∗ nach (20.10) in den Gebieten I und I I die Werte −∞ < r ∗ < ∞ f ur ¨ r+ < r < ∞ −∞ < r ∗ < ∞ f ur ¨ r− < r < r+ an. Wie in (18.24) definieren wir neue Nullkoordinaten u := t − r ∗ , v := t + r ∗ , dann folgt 1 1 (dv + du) , dr = (r ) dr ∗ = (r ) (dv − du) , 2 2 und die Metrik (20.8) wird zu G Q2 2G M 2 du dv + r 2 dϑ 2 + sin ϑ dϕ 2 . + 2 ds = − 1 − r r dt =
20.4
(20.13)
Penrose-Diagramme für die Reissner-Nordström-Lösung
Fall G M 2 > Q 2 Wir wollen ein Penrose-Diagramm für die RN-Lösung erstellen und dazu neue Koordinaten U , V einführen. Dafür definieren wir zunächst zwei Konstanten: α := Wir setzen
r2 r+ − r− (> 0) , β := − (< 1) 2 2 2r+ r+
20.4
Penrose-Diagramme für die Reissner-Nordström-Lösung
563
∗ tan U : = −e−αu = −e−α (t−r ) = −e−αt eαr |r − r+ |1/2 |r − r− |−β/2 ∗ (20.14) tan V : = eαv = eα (t+r ) = eαt eαr |r − r+ |1/2 |r − r− |−β/2 .
Zeigen Sie, dass sich mit (20.14) die RN-Lösung als 2G M G Q2 4 1 2 ds = 2 1 − + 2 dU d V + r 2 dϑ 2 + sin ϑ dϕ 2 α r r sin 2U sin 2V (20.15) schreiben lässt.
Aufgabe 20.3
Lösung Es folgt mit (20.14) u=−
1 1 −1 1 ln (− tan U ) ⇒ du = − dU α α − tan U cos2 U 1 1 dU =− α sin U cos U 2 1 =− dU α sin 2U
sowie analog v=
2 1 1 ln (tan V ) ⇒ dv = dV . α α sin 2V
Einsetzen in (20.13) führt zu 2G M G Q2 4 1 2 ds = 2 1 − + 2 dU d V + r 2 dϑ 2 + sin ϑ dϕ 2 . α r r sin 2U sin 2V Die Koordinate r ist implizit als Funktion von U , V durch tan U tan V = −e2αr |r − r+ | |r − r− |−β
(20.16)
gegeben. Das Linienelement (20.15) ist das Analogon für die Kruskal-Lösung und stellt die maximale Erweiterung der RN-Lösung für den Fall G M 2 > Q 2 dar. Das zugehörige Penrose-Diagramm in Abb. 20.4 ist kompliziert, aber überaus instruktiv. Unser Universum bis zum Horizont r+ ist in Abb. 20.4 mit I1 bezeichnet. An dem dort eingezeichneten Zukunfts-Lichtkegel können wir ablesen, dass wir – genauso wie in der Krukal-Lösung – das „Paralleluniversum“ I2 nicht erreichen können. Lichtstrahlen und zeitartige Testteilchen können entweder die zukünftigen Unendlichkeiten J + , i + erreichen oder den Horizont bei r = r+ durchqueren und in den Bereich I I gelangen. Von dort geht es nur Richtung r = r− weiter, wobei Abb. 20.4 zeigt, dass man die Wahl hat, in das zu I1 gehörige (rechte) Gebiet I I I oder in das zu I2 gehörige (linke) Gebiet I I I zu reisen.
564
20 Geladene Schwarze Löcher
Abb. 20.4 Penrose-Diagramm für den Fall G M 2 > Q 2
Die Abbildung zeigt auch, dass man, wenn man einmal den Horizont r = r+ überschritten hat, nicht mehr in das Gebiet I1 zurückkehren kann. Im Gebiet I I I hat man wiederum die Wahl, in die (zeitartige) Singularität bei r = 0 oder räumlich zurück (zeitlich natürlich vorwärts, also nach oben) in das Gebiet I I zu fliegen. In diesem Gebiet hat man erneut eine (eingeschränkte) Wahlmöglichkeit: Man wird zwar zwangsläufig in ein Paralleluniversum gelangen, kann aber zwischen I3 und I4 wählen. In diesem Sinn verhält der Bereich I I wie das Weiße Loch in der Kruskal-Lösung. Ist man in einem dieser Universen angekommen,
20.4
Penrose-Diagramme für die Reissner-Nordström-Lösung
565
so kann man die ganze Prozedur wiederholen mit der Folge, dass die RN-Lösung unendlich viele asymptotisch flache Universen zulässt. In Abb. 20.4 ist die Reise eines Beobachters von unserem Universum I1 bis zum Paralleluniversum I3 durch eine gepunktete Linie eingezeichnet. In diesem Fall erlaubt also die Mathematik das Durchqueren eines Wurmlochs zwischen zwei Universen. Ob eine solche Reise tatsächlich real möglich ist, darüber ist das letzte Wort noch nicht gesprochen. Denn alle bislang beobachteten astrophysikalischen Objekte sind elektromagnetisch neutral, also nicht geladen, was wohl auch der Grund dafür ist, dass die Reissner-Nordström-Lösung in manchen Monografien nicht behandelt wird (siehe z. B. [28], [31]). Es soll nicht verschwiegen werden, dass wir uns die Sache etwas leichter gemacht haben, als sie tatsächlich ist. Denn die Metrik (20.15) hat bei r = r− eine Koordinatensingularität, da in der Formel (20.16) der Ausdruck |r − r− | mit einer negativen Potenz auftaucht. Es ist also erforderlich, ein neues Koordinatensystem einzuführen, das diese Koordinatensingularität behebt, und die Mannigfaltigkeit dann aus diesen beiden Koordinatensystemen „zusammenzukleben“. Das wollen wir hier aber nicht weiter vertiefen, sondern verweisen für weitere Details auf [26]. Fall G M 2 = Q 2 Wir können ganz ähnlich wie im Fall zuvor eine neue radiale Koordinate r ∗ durch dr ∗ =
r2 dr = dr (r ) (r − G M)2
definieren und erhalten durch Integration r ∗ = r + 2G M ln |r − G M| −
G2 M 2 . r − GM
Damit lassen sich die Eddington-Finkelstein-Koordinaten generieren und daraus die KruskalKoordinaten. Die Detailrechnungen dazu überspringen wir hier und schauen uns gleich das zugehörige Penrose-Diagramm in Abb. 20.5 an. Die Fläche r = G M bildet wieder einen Ereignishorizont, bei dem allerdings die Koordinate r nicht zeitartig wird, sondern raumartig bleibt. Die Raumzeit-Singularität bei r = 0 ist wie in den anderen Fällen zeitartig, d. h., ein Beobachter aus unserem Universum I1 kann einen Fall in die Singularität vermeiden und wieder durch den Horizont ein Paralleluniversum I2 erreichen und die Prozedur fortsetzen, d. h., auch in diesem Fall gibt es unendlich viele asymptotisch flache Paralleluniversen.
566 Abb. 20.5 Penrose-Diagramm für die maximale RN-Lösung
20 Geladene Schwarze Löcher
Rotierende Schwarze Löcher
21
In diesem Kapitel werden wir die sogenannte Kerr-Lösung, die 1963 von dem neuseeländischen Physiker Roy Kerr gefunden wurde, herleiten und diskutieren. Sie beschreibt das (äußere) Gravitationsfeld einer rotierenden Masse und ist zugleich eine Verallgemeinerung der (äußeren) Schwarzschild-Lösung. Im Gegensatz zur Schwarzschild-Lösung gibt es jedoch (noch) keine reguläre innere Lösung, die an die (äußere) Kerr-Lösung angekoppelt werden kann. Man kann also nicht sagen, dass die Kerr-Lösung von einer Materieverteilung erzeugt wird. Die Kerr-Lösung charakterisiert vielmehr den Endzustand eines Schwarzen Lochs, das durch den Gravitationskollaps einer rotierenden Masse, z. B. eines ehemaligen Neutronensterns, entstanden ist. Da die meisten astrophysikalischen Körper rotieren, aber elektromagnetisch neutral sind, beschränken wir uns in diesem Kapitel auf ungeladene rotierende Objekte.
21.1
Die Kerr-Lösung
Um einen ersten Eindruck von einer möglichen Lösung zu erhalten und einige Unterschiede zur Schwarzschild-Metrik 2G M 1 dr 2 + r 2 dϑ 2 + sin2 ϑ dϕ 2 dt 2 + ds 2 = − 1 − 2G M r 1− r herauszufinden, vergleichen wir einen statischen kugelsymmetrischen Körper mit einem rotierenden und schauen uns dazu Abb. 21.1 an. Der rotierende Körper auf der rechten Seite der Abbildung drehe sich mit einem konstanten Drehimpuls J um eine (feste) Rotationsachse. Wir können „durch Hinschauen“ vermuten, dass es einige Unterschiede zwischen der Kerr- und der Schwarzschild-Lösung geben wird. © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2021 M. Ruhrländer, Allgemeine Relativitätstheorie Schritt für Schritt, https://doi.org/10.1007/978-3-662-62083-0_21
567
568
21 Rotierende Schwarze Löcher
Abb. 21.1 Vergleich einer Kugel mit einem rotierenden Körper
• Da sich bei Zeitumkehr die Rotationsrichtung ebenfalls umkehrt, sollte die gesuchte Lösung zwar noch stationär, aber nicht mehr statisch sein. Wir erwarten also, dass die Komponenten der Kerr-Metrik zeitunabhängig sind (Stationarität), dass es aber auch gemischte Terme dt d x i in der Metrik gibt, die die Zeitumkehrsymmetrie (Statik) aufheben. • Die Schwarzschild-Metrik hat ϑ- und ϕ-Abhängigkeiten nur in Bezug auf die Einheitskugel. Man kann also dort die ϑ- oder ϕ-Koordinaten ändern, ohne dass sich die Geometrie ändert. Bei einem rotierenden Körper bleibt die Kugelsymmetrie nicht erhalten. Wenn wir die Rotationsachse in die Verbindung von Nordpol (NP) und Südpol (SP) legen, so wird die Kugel zu einem (abgeplatteten) Rotationsellipsoid „gequetscht“. Erhalten bleibt dabei die Achsensymmetrie um die Rotationsachse, d. h., die Metrikkomponenten sollten vom Azimutwinkel ϕ unabhängig sein. Die ϑ-Symmetrie ist aber gebrochen, da z. B. der Abstand Nordpol-Mittelpunkt (ϑ = 0) kleiner ist als der Abstand Mittelpunkt-Äquator (ϑ = π/2). Wir vermuten also, dass neben der ϕϕ-Komponente der Metrik (wie bei der Schwarzschild-Lösung) weitere Komponenten explizit von der Koordinate ϑ abhängen. Das direkte Auffinden der Kerr-Lösung aus den Einstein’schen Vakuumgleichungen erweist sich als ziemlich aufwendig (siehe z. B. [23, 32]). Wir wollen hier stattdessen die KerrLösung mithilfe von geschickt gewählten Koordinatentransformationen aus der Schwarzschild-Lösung generieren. Dazu müssen wir uns etwas näher mit Nulltetraden beschäftigen.
21.2
Nulltetraden
Eine Nulltetrade ist eine spezielle Basis im Tangentialraum T p M einer LorentzMannigfaltigkeit (M, g), die aus Nullvektoren besteht. Diese wollen wir im Folgenden konstruieren. Nach (11.76) existiert in jedem Punkt p ∈ M eine orthonormale Basis E = (e0 , e1 , e2 , e3 ) von T p M, d. h.
21.2
Nulltetraden
569
g eα , eβ = ηαβ = diag (−1, 1, 1, 1) . Die Basis E nennt man auch eine Tetrade und die Metrik ηαβ eine Tetradenmetrik. Wie im Abschn. 12.5 über Zusammenhangs- und Krümmungsformen wählen wir als Indizes für die Tetradenvektoren und -metriken griechische Buchstaben aus dem Anfang des Alphabets. Sind eα = eαμ ∂μ die Komponentendarstellungen der Tetradenvektoren, so können wir die Tetradenmatrix ηαβ auch durch ηαβ = gμν eαμ eβν (21.1) α die Komponenten der zu e dualen Einsform eα , so gilt darstellen. Sind eμ α
eαμ eνα = δνμ , und die Umkehrung von (21.1) ergibt sich zu α β gμν = ηαβ eμ eν .
(21.2)
Man kann also die Weltmetrik gμν mithilfe einer Tetradenmetrik darstellen. Wir definieren zwei neue Vektoren l, n durch 1 1 l := √ (e0 + e1 ) , n := √ (e0 − e1 ) . 2 2
Aufgabe 21.1
Zeigen Sie, dass g (l, l) = g (n, n) = 0 g (l, n) = g (n, l) = −1
gilt. Lösung Es gilt ⎛ ⎞ 1⎝ 1 g (e0 , e0 ) + g (e0 , e1 ) + g (e1 , e0 ) +g (e1 , e1 )⎠ = (−1 + 1) = 0 g (l, l) =
2 2 =0
=0
und ebenso g (n, n) = 0. Die beiden Vektoren l, n sind also lichtartig. Ferner gilt
570
21 Rotierende Schwarze Löcher
⎛ g (l, n) =
⎞
1⎝ g (e0 , e0 ) − g (e0 , e1 ) − g (e1 , e0 ) −g (e1 , e1 )⎠ = −1 = g (n, l) .
2 =0
=0
Um die zwei anderen raumartigen Vektoren e2 , e3 zu lichtartigen zu kombinieren, müssen wir die komplexen Zahlen zu Hilfe nehmen und definieren zwei komplex-konjugierte Vektoren durch 1 1 m := √ (e2 + ie3 ) , m := √ (e2 − ie3 ) 2 2 mit i 2 = −1.
Aufgabe 21.2
Zeigen Sie, dass g (m, m) = g (m, m) = 0 g (m, m) = g (m, m) = 1 g (l, m) = g (l, m) = g (n, m) = g (n, m) = 0
(21.3)
gilt. Lösung Es folgt ⎛ ⎞ 1⎝ 1 g (m, m) = g (e2 , e2 ) + i g (e2 , e3 ) +i g (e3 , e2 ) +i 2 g (e3 , e3 )⎠ = (1 − 1) = 0
2 2 =0
=0
und analog g (m, m) = 0 sowie
⎛ ⎞ 1⎝ g (e2 , e2 ) − i g (e2 , e3 ) +i g (e3 , e2 ) −i 2 g (e1 , e1 )⎠ = 1 = g (m, m) g (m, m) =
2 =0 =0 ⎛ ⎞ 1 g (l, m) = ⎝g (e0 , e2 ) +i g (e0 , e3 ) + g (e1 , e2 ) +i g (e1 , e3 )⎠ 2 =0
=0
=0
= g (l, m) = g (n, m) = g (n, m) = 0.
=0
21.3
Die Kerr-Metrik in Kerr-Eddington-Koordinaten
571
In der Koordinatenschreibweise lassen sich die Ergebnisse (21.3) durch 0 = lα l α = n α n α = m α m α = m¯ α m¯ α α
−1 = lα n = −m α m¯
(21.4)
α
0 = lα m α = lα m¯ α = n α m α = n α m¯ α darstellen. Die Komponenten von g in der Basis h α := (l, n, m, m), die man Nulltetrade nennt, können in der Nulltetradenmetrik ⎛ ⎞ 0 −1 0 0 ⎜ −1 0 0 0 ⎟ ⎟ gαβ := ⎜ (21.5) ⎝ 0 0 0 1⎠ 0
0 10
zusammengefasst werden. Die Weltmetrik lässt sich nach (21.2) durch die Nulltetradenmetrik ausdrücken: gμν = gαβ h αμ h βν = −lμ n ν − n μ lν + m μ m¯ ν + m¯ μ m ν
(21.6)
Die inverse Matrix lautet entsprechend g μν = −l μ n ν − n μl ν + m μ m¯ ν + m¯ μ m ν .
21.3
(21.7)
Die Kerr-Metrik in Kerr-Eddington-Koordinaten
Wir betrachten jetzt die Schwarzschild-Metrik in avancierten Eddington-FinkelsteinKoordinaten (v, r , ϑ, ϕ), siehe (18.5), ⎛ ⎞ 2G M 1 0 0 ⎜− 1 − r ⎟ ⎜ ⎟ ⎜ ⎟ gμν = ⎜ ⎟ 1 0 0 0 ⎜ ⎟ 2 ⎝ ⎠ 0 0r 0 2 2 0 0 0 r sin ϑ mit der inversen Metrik
572
21 Rotierende Schwarze Löcher
⎛
g μν
0
1 0 ⎜ 2G M ⎜ 0 ⎜1 1 − ⎜ r =⎜ ⎜ 1 ⎜0 0 ⎜ 2 r ⎝ 0 0 0
0 0 0 1 r 2 sin2 ϑ
⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
(21.8)
und wollen eine möglichst einfache Nulltetrade finden. Aufgrund der Form der inversen Matrix (21.8) wählen wir den Ansatz l = l 0 , l 1 , 0, 0 , n = n 0 , n 1 , 0, 0 , m = 0, 0, m 2 , m 3 , m = 0, 0, m¯ 2 , m¯ 3 und erhalten mit (21.7) die Bestimmungsgleichungen 0 = g 00 = −2l 0 n 0 1 = g 01 = −l 0 n 1 − l 1 n 0 1−
2G M r
= g 11 = −2l 1 n 1 .
Wir setzen l 0 = 0, n 0 = −1 und erhalten
2G M 1 1− l = 1, n = − 2 r 1
1
sowie ganz ähnlich 1 1 = g 22 = 2m 2 m¯ 2 ⇒ m 2 = m¯ 2 = √ 2 r 2r −i i 1 = g 33 = 2m 3 m¯ 3 ⇒ m 3 = √ , m¯ 3 = √ . 2 2 r sin ϑ 2 r sin ϑ 2 r sin ϑ Zusammengefasst ergibt sich l = ∂r = (0, 1, 0, 0) 2G M 2G M 1 1 n = −∂v − 1− ∂r = −1, − 1− , 0, 0 2 r 2 r 1 1 i −i ∂ϑ − m= √ ∂ϕ = 0, 0, √ , √ sin ϑ 2r 2r 2 r sin ϑ 1 1 i i ∂ϑ + . ∂ϕ = 0, 0, √ , √ m= √ sin ϑ 2r 2r 2 r sin ϑ
(21.9)
Diese vier Vektoren bilden eine Nulltetrade, wie man mit (21.4) überprüft. Nun wenden wir einen „Trick“ an, der von Newman und Janis eingeführt wurde, siehe [33]. Wir erlauben,
21.3
Die Kerr-Metrik in Kerr-Eddington-Koordinaten
573
dass die Koordinate r komplexe Werte annimmt, und ersetzen die Tetrade (21.9) durch l = ∂r = (0, 1, 0, 0) 1 1 1 n = −∂v − 1 − GM + ∂r 2 r r¯ 1 i ∂ϑ − ∂ϕ m= √ sin ϑ 2 r¯ 1 i ∂ϑ + ∂ϕ . m= √ sin ϑ 2r
(21.10)
Man beachte, dass l, n weiterhin real und m, m weiterhin komplex-konjugiert sind. Als Nächstes machen wir eine Koordinatentransformation v → v = v + ia cos ϑ, r → r = r + ia cos ϑ, ϑ → ϑ = ϑ, ϕ → ϕ = ϕ (21.11) und erhalten mit der Transformationsformel (8.21): V
μ
=
∂xμ
∂xμ
Vμ
die von null verschiedenen Komponenten der transformierten Tetrade: l = (0, 1, 0, 0) r 1 n = −1, − + G M , 0, 0 2 r 2 + a 2 cos2 ϑ −ia sin ϑ −ia sin ϑ 1 i m = √ , √ , √ , √ 2 r + ia cos ϑ 2 r + ia cos ϑ 2 r + ia cos ϑ 2 r + ia cos ϑ sin ϑ ia sin ϑ ia sin ϑ 1 i m = √ .(21.12) , √ , √ , √ 2 r − ia cos ϑ 2 r − ia cos ϑ 2 r − ia cos ϑ 2 r − ia cos ϑ sin ϑ
Aufgabe 21.3
Zeigen Sie die Gültigkeit von (21.12).
Lösung Es gilt:
l1 =
∂r ∂v
=0 2
l0 +
∂r ∂r
=1
l0 = l = l3 = 0
l1 +
∂r
∂r 3 2 l l = l1 = 1 + ∂ϑ ∂ϕ =0
=0
574
21 Rotierende Schwarze Löcher
und genauso
n0 =
∂v ∂v ∂r
n 0 = n 0 = −1
1 GM 1 1 n = n =n =− + + ∂r 2 2 r r¯ 1 1 1 GM =− + + 2 2 r − ia cos ϑ r + ia cos ϑ r 1 = − + GM 2 r 2 + a 2 cos2 ϑ 1
1
1
n2 = n3 = 0 sowie
m0 =
m1 =
∂ϑ ∂r ∂ϑ
m2 =
−ia sin ϑ −ia sin ϑ =√ √ 2 r¯ 2 (r + ia cos ϑ)
m2 =
−ia sin ϑ −ia sin ϑ =√ √ 2 r¯ 2 (r + ia cos ϑ)
∂ϑ
1 1 m2 = √ =√ ∂ϑ 2 r¯ 2 (r + ia cos ϑ) ∂ϕ 3 −i −i m =√ = =√ ∂ϕ 2 r¯ sin ϑ 2 (r + ia cos ϑ) sin ϑ
m2 = m3
∂v
und letztlich ia sin ϑ m¯ 0 = m¯ 1 = √ 2 (r − ia cos ϑ) 1 i , m¯ 3 = √ m¯ 2 = √ 2 (r − ia cos ϑ) 2 (r − ia cos ϑ) sin ϑ Wir lassen jetzt die Striche bei den Koordinaten und Komponenten wieder weg und berechnen die Komponenten der inversen Weltmetrik mit (21.7). Ein Beispiel dazu ist −ia sin ϑ ia sin ϑ g 00 = −2l 0 n 0 + 2m 0 m¯ 0 = 2 √ √ 2 (r + ia cos ϑ) 2 (r − ia cos ϑ) 2 2 2 2 a sin ϑ a sin ϑ = 2 = , r + a 2 cos2 ϑ ρ2 wodurch die Größe
21.3
Die Kerr-Metrik in Kerr-Eddington-Koordinaten
ρ 2 := r 2 + a 2 cos2 ϑ
575
(21.13)
definiert wird. Die anderen von null verschiedenen Komponenten sind r 2 + a2 a = g 10 , g 03 = 2 = g 30 , ρ2 ρ r 2 + a 2 − 2G Mr a = , g 13 = 2 = g 31 , 2 ρ ρ 1 1 33 = 2, g = 2 2 . ρ ρ sin ϑ
g 01 = g 11 g 22
(21.14)
Aufgabe 21.4 Zeigen Sie die Gültigkeit von (21.14), indem Sie die Detailrechnungen durchführen.
Lösung Es gilt:
g 01 = g 10 = −l 0 n 1 − l 1 n 0 + m 0 m¯ 1 + m 1 m¯ 0 −ia sin ϑ ia sin ϑ = 1+2 √ √ 2 (r + ia cos ϑ) 2 (r − ia cos ϑ) a 2 sin2 ϑ r 2 + a2 = = 1+ 2 2 2 ρ2 r + a cos ϑ g 03 = g 30 = −l 0 n 3 − l 3 n 0 + m 0 m¯ 3 + m 3 m¯ 0 −ia sin ϑ i a =2√ = 2 √ ρ 2 r + ia cos ϑ 2 r − ia cos ϑ sin ϑ g 11 = −2l 1 n 1 + 2m 1 m¯ 1 2G Mr −ia sin ϑ ia sin ϑ +2 √ = − −1 + √ ρ2 2 r + ia cos ϑ 2 r − ia cos ϑ =
r 2 + a 2 − 2G Mr ρ2
g 13 = g 31 = −l 1 n 3 − l 3 n 1 + m 1 m¯ 3 + m 3 m¯ 1 −ia sin ϑ i a =2√ = 2 √ ρ 2 r + ia cos ϑ 2 r − ia cos ϑ sin ϑ 1 1 1 g 22 = −2l 2 n 2 + 2m 2 m¯ 2 = 2 √ √ = 2 ρ 2 r + ia cos ϑ 2 r − ia cos ϑ −i i 1 g 33 = −2l 3 n 3 + 2m 3 m¯ 3 = 2 √ = √ ρ 2 sin2 ϑ 2 r + ia cos ϑ sin ϑ 2 r − ia cos ϑ sin ϑ
576
21 Rotierende Schwarze Löcher
Zusammengefasst erhalten wir ⎛ 2 2 a sin ϑ r 2 + a2 ⎜ ρ2 ρ2 ⎜ ⎜ ⎜ ⎜ r 2 + a 2 r 2 + a 2 − 2G Mr ⎜ g μν = ⎜ ⎜ ρ2 ρ2 ⎜ ⎜ 0 0 ⎜ ⎜ ⎝ a a ρ2 ρ2
0
a ρ2
0
a ρ2
1 ρ2 0
0 1 ρ 2 sin2 ϑ
⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟. ⎟ ⎟ ⎟ ⎟ ⎟ ⎠
Die kovariante Form der Metrik erhalten wir durch Inversion: ⎞ ⎛ 2G Mra sin2 ϑ 2G Mr 1 0 − − 1 − ⎟ ⎜ ρ2 ρ2 ⎟ ⎜ 2ϑ ⎟ ⎜ 1 0 0 −a sin ⎟ ⎜ gμν = ⎜ 2 ⎟ 0 0 ρ 0 ⎜ ⎟ 4 2 ⎠ ⎝ 2G Mra sin2 ϑ 2 2ϑ 0 2 sin2 ϑ + 2G Mra sin ϑ − −a sin + a r ρ2 ρ2 Das zugehörige Linienelement ist 2G Mr 4G Mra sin2 ϑ dv 2 + 2dv dr − ds 2 = − 1 − dv dϕ − 2a sin2 ϑ dr dϕ 2 ρ ρ2 2 2 2G Mra 2 sin4 ϑ 2 2 2 dϕ 2 . + ρ dϑ + r + a sin ϑ + (21.15) ρ2 Es handelt sich dabei um die sogenannte Kerr-Metrik in Kerr-Eddington-Koordinaten (v, r , ϑ, ϕ). Wir sehen sofort, dass sich für a = 0 die Schwarzschild-Metrik in avancierten Eddington-Finkelstein-Koordinaten (18.5) ergibt.
21.4
Die Kerr-Metrik in Boyer-Lindquist-Koordinaten
Wir wollen die Kerr-Metrik (21.15) durch eine weitere Koordinaten-Transformation auf eine Gestalt bringen, die der Schwarzschild-Metrik in Schwarzschild-Koordinaten ähnelt. Dazu setzen wir r 2 + a2 dr r2 dr dϕ → dϕ := dϕ − dv → dt := dv −
21.4
Die Kerr-Metrik in Boyer-Lindquist-Koordinaten
577
mit = r 2 + a 2 − 2G Mr , wobei r und ϑ unverändert bleiben. Nach einigen einfachen, aber langwierigen Umformungen erhalten wir die Kerr-Metrik in Boyer-LindquistKoordinaten (t, r , ϑ, ϕ), siehe [34]: 2G Mr 4G Mra sin2 ϑ ρ2 2 dt 2 − dr dt dϕ + ds 2 = − 1 − 2 2 ρ ρ 2 2 2G Mra 2 sin4 ϑ 2 2 2 dϕ 2 , + ρ dϑ + r + a sin ϑ + (21.16) ρ2 wobei wir die Striche an den Koordinaten t, ϕ wieder weggelassen haben.
Aufgabe 21.5 Berechnen Sie beispielhaft die g13 – Komponente der Kerr-Metrik in Boyer-Lindquist-Koordinaten.
Lösung Wir stellen zunächst die Kerr-Eddington-Komponenten in den neuen Koordinaten t , ϕ dar: 1.
2G Mr − 1− ρ2
2G Mr dv 2 = − 1 − ρ2
⎛ ⎜ 2 ⎝dt +
2. 2dv dr = 2dt dr +
2 r 2 + a2
dt dr +
2 r 2 + a2 2
⎞ ⎟ dr 2 ⎠
2 r 2 + a2 dr 2
3. 4G Mra 4G Mra r 2 + a2 a r 2 + a2 a 2 2 2 − sin ϑ dv dϕ = − sin ϑ dt dϕ + dr dϕ + dt dr + dr ρ2 ρ2
a −2a sin2 ϑ dr dϕ = −2a sin2 ϑ dr dϕ + dr 2
4. 5.
2 2G Mra 2 4 ϑ dϕ 2 = 2 + a 2 sin2 ϑ + 2G Mra sin4 ϑ dϕ 2 sin r r 2 + a 2 sin2 ϑ + ρ2 ρ2 2G Mra 2 4 ϑ 2a dr dϕ + r 2 + a 2 sin2 ϑ + sin ρ2 2 2G Mra a2 + r 2 + a 2 sin2 ϑ + sin4 ϑ dr 2 2 ρ 2
578
21 Rotierende Schwarze Löcher
Nun sammeln wir alle Terme mit dr dϕ ein: −
2 2 2 4G Mra 2 ϑ r + a − 2a sin2 ϑ + r 2 + a 2 sin2 ϑ 2a + 2G Mra sin4 ϑ 2a sin ρ2 ρ2 2 2a sin ϑ −2G Mr 3 − 2G Mra 2 − ρ 2 + ρ 2 r 2 + a 2 + 2G Mra 2 sin2 ϑ 2 ρ 2a sin2 ϑ −2G Mr 3 − 2G Mra 2 1 − sin2 ϑ − ρ 2 + ρ 2 r 2 + a 2 2 ρ 2a sin2 ϑ 2 + a 2 cos2 ϑ − ρ 2 + ρ 2 r 2 + a 2 −2G Mr r ρ2 2a sin2 ϑ 2 − ρ 2 r 2 + a 2 − 2G Mr + ρ 2 r 2 + a 2 −2G Mr ρ ρ2
Analog berechnet man die anderen Komponenten.
= = = = =0
Durch Umformung des letzten Terms in (21.16) ergibt sich die äquivalente Darstellung 2G Mr 4G Mra sin2 ϑ ρ2 2 dt 2 − dr dt dϕ + ds 2 = − 1 − 2 2 ρ ρ sin2 ϑ 2 2 2 2 2 r + ρ 2 dϑ 2 + + a − a sin ϑ dϕ 2 . (21.17) ρ2 Grundlegende Eigenschaften der Kerr-Lösung Zunächst wollen wir überprüfen, ob die Kerr-Metrik (21.16) die am Anfang des Kapitels vermuteten Eigenschaften hat. • Wir sehen, dass die Komponenten keine t- und auch keine ϕ-Abhängigkeiten aufweisen, die Metrik ist also stationär und axialsymmetrisch. • Sie hat eine nichtverschwindende dt dϕ – Koordinate, d. h., eine Zeitumkehrsymmetrie ist nicht vorhanden. Wenn wir allerdings gleichzeitig die Zeit- und Azimutwinkelkoordinate umkehren t → −t, ϕ → −ϕ, so erhalten wir eine Invarianz. Das deutet darauf hin, dass die Kerr-Metrik die Geometrie einer sich drehenden Quelle beschreibt: Vorwärts in der Zeit mit positivem Drehsinn ist äquivalent zu rückwärts in der Zeit mit negativem Drehsinn. • Das Linienelement (21.16) ist auch invariant unter t → −t, a → −a, was vermuten lässt, dass a eine Drehrichtung spezifiziert. Tatsächlich definiert man a als Drehimpuls pro Masseneinheit der Quelle, d. h.,
21.4
Die Kerr-Metrik in Boyer-Lindquist-Koordinaten
a :=
J , M
579
(21.18)
siehe z. B. [17] oder auch [21, 28]. • Alle Komponenten hängen (über die Größe ρ 2 ) von der Koordinate ϑ ab. • Setzt man in (21.16) a = 0, so ergibt sich 2G Mr r2 ds 2 = − 1 − dt 2 + 2 dr 2 + r 2 dϑ 2 + r 2 sin2 ϑ dϕ 2 , 2 r r − 2G Mr d. h. die Schwarzschild-Metrik in Schwarzschild-Koordinaten. • Für große r erhalten wir aus (21.16) bei festen M, a ⎛ ⎞ 2G Mra sin2 ϑ 2G Mr 0 0 − ⎜ − 1 − ρ2 ⎟ ρ2 ⎜ ⎟ 2 ⎜ ⎟ ρ ⎜ ⎟ 0 0 0 ⎜ ⎟ gμν = ⎜ ⎟ 2 ⎜ ⎟ 0 0 0 ρ ⎜ ⎟ 4 2 ⎝ 2G Mra sin2 ϑ 2 2 2G Mra sin ϑ ⎠ 2 − 0 0 r + a sin ϑ + ρ2 ρ2 ⎛ ⎞ 2 2G Ma sin ϑ 2G M 0 0 − ⎜− 1 − r ⎟ r ⎜ ⎟ −1 ⎜ ⎟ 2G M ⎜ ⎟ 0 0 0 1− ⎟, ≈⎜ r ⎜ ⎟ ⎜ ⎟ 2 0 0 0 r ⎜ ⎟ ⎝ ⎠ 2 2G Ma sin ϑ − 0 0 r 2 sin2 ϑ r und damit konvergiert die Kerr-Metrik gegen die Minkowski-Metrik gμν → ημν für r → ∞. Die Kerr-Geometrie ist also ebenfalls asymptotisch flach. • Für M → 0 (bei festem a) ergibt sich für das Linienelement (21.16) r 2 + a 2 cos2 ϑ 2 2 dr + r + a 2 cos2 ϑ dϑ 2 + r 2 + a 2 sin2 ϑ dϕ 2 , r 2 + a2 (21.19) das die Minkowski-Raumzeit beschreibt. Der räumliche Anteil wird durch sogenannte ellipsoidische Koordinaten dargestellt, die man benutzt, um Punkte auf (abgeplatteten) Rotationsellipsoiden zu identifizieren. Die dreidimensionalen kartesischen Koordinaten (x, y, z) stehen mit den ellipsoidischen Koordinaten durch ds 2 = −dt 2 +
580
21 Rotierende Schwarze Löcher
r 2 + a 2 sin ϑ cos ϕ y = r 2 + a 2 sin ϑ sin ϕ
x=
z = r cos ϑ in Beziehung. Kerr-Newman-Metrik Durch Umformung von (21.16) findet man eine weitere äquivalente Darstellung der KerrMetrik: 2 ρ 2 2 2 sin2 ϑ 2 2 2 2 dr ϑ dϕ + + ρ dϑ + dt − a sin r + a 2 dϕ − a dt 2 2 ρ ρ (21.20) Wenn wir die Definition von auf ds 2 = −
= r 2 + a 2 − 2G M + G Q 2 erweitern, das ρ 2 aber gegenüber (21.13) unverändert lassen, so erhalten wir als Verallgemeinerung der Kerr-Metrik die sogenannte Kerr-Newman-Lösung (21.20), die eine rotierende Masse mit elektrischer Ladung Q beschreibt. Diese wollen wir hier aber nicht weiter verfolgen.
21.5
Singularitäten und Horizonte
Die Kerr-Metrik (21.16) ist bei ρ = 0 sowie bei = 0 singulär, was wir der Reihe nach näher beleuchten wollen. Die Singularität bei ρ = 0 Die Berechnung der Riemann’schen Invariante R μνρσ Rμνρσ ergibt, dass die Metrik bei ρ = 0 eine Raumzeit-Singularität hat, siehe z. B. [21, 24]. Aus ρ 2 = r 2 + a 2 cos2 ϑ = 0, folgt sofort r = 0 und ϑ =
π . 2
21.5
Singularitäten und Horizonte
581
Anders als im Schwarzschild-Fall reicht also hier die Bedingung r = 0 nicht allein aus, um eine Singularität zu beschreiben. Um das besser zu verstehen, schauen wir uns die Kerr-Metrik (21.16) für r = 0 ⇒ dr = 0 an: ds 2 r =0 = −dt 2 + (a cos dϑ)2 + (a sin ϑ)2 dϕ 2 (21.21) Wir definieren eine neue radiale Koordinate durch r¯ := a sin ϑ, dann wird (21.21) zu
ds 2 r =0 = −dt 2 + d r¯ 2 + r¯ 2 dϕ 2 .
(21.22)
Da ϑ Werte zwischen 0 und π annimmt, gilt r¯ ∈ [0, a]. Im Gegensatz zur (eindimensionalen) Schwarzschild-Singularität bei r = 0, beschreibt (21.22) einen Vollzylinder mit Radius a um r = 0, wie Abb. 21.2 zeigt. Bei ϑ = π/2 ist r¯ = a und somit ist die intrinsische Singularität bei r = 0, ϑ = π/2 der Zylindermantel, der in Abb. 21.2 für t = 0 fett als Ring angedeutet ist. Die Singularität liegt also auf dem Ring, d. h., die Kerr-Geometrie lässt zu, dass man durch das Innere des Rings hindurch kommen kann, ohne – wie bei der Schwarzschild-Raumzeit – in die Singularität fallen zu müssen. Wohin man bei einem solchen Fall durch den Ring kommt, werden wir weiter unten in Abb. 21.3 durch ein entsprechendes Penrose-Diagramm erläutern.
Abb. 21.2 Intrinsische Ringsingularität der Kerr-Metrik
582
21 Rotierende Schwarze Löcher
Die Singularität bei = 0 Die Singularität der Kerr-Metrik in Boyer-Lindquist-Koordinaten (21.16) bei = 0 ist (nur) eine Koordinatensingularität, wie wir an der Kerr-Metrik in Kerr-Eddington-Koordinaten (21.15) direkt ablesen können, da sich dort bei = 0 keine Auffälligkeiten zeigen. Ereignishorizonte Analog zur Reissner-Nordström-Lösung können wir die Ereignishorizonte der Kerr-Metrik mit den Nullstellen von grr = 2 ρ aufspüren: !
= r 2 + a 2 − 2G Mr = 0 ⇒ r± = G M ±
G 2 M 2 − a2
für a ≤ G M. Die Ereignishorizonte sind also durch die Nullflächen r = r± gegeben. Wir wollen die Eigenschaften der Raumzeit an den Horizonten untersuchen und dazu einige Fälle unterscheiden, die mit der Größe des Drehimpulses a zusammenhängen. 1. Fall: a = 0 Dann gilt r+ = 2G M sowie r− = 0, und wir erhalten wiederum den Schwarzschild-Fall. 2. Fall: a 2 > G 2 M 2 Es gibt keine Horizonte, die ringförmige Singularität ist nackt. Dieser Fall gilt wie bei der Reissner-Nordstöm-Lösung als „unphysikalisch“. 3. Fall: a 2 = G 2 M 2 Der Fall wird wieder extremale Kerr-Lösung genannt. Die beiden Ereignishorizonte verschmelzen zu einem bei r = G M. Die r -Koordinate bleibt immer raumartig, d. h., selbst bei überschreiten der Grenze r = G M besteht ganz analog wie in Reissner-NordströmRaumzeit für einen Beobachter jederzeit die Möglichkeit umzukehren und den Fall in die Singularität zu vermeiden. Man könnte also die Frage stellen, ob die Nullfläche r = G M dann überhaupt einen Horizont beschreibt. Wir werden weiter unten in Abb. 21.3 mithilfe des Penrose-Diagramms zeigen, dass r = G M als Einwegmembrane interpretiert werden kann, da man wie bei der Reissner-Nordström-Lösung nach Überschreiten der Nullfläche zwar nicht in die Singularität fallen muss, aber bei der Umkehr in ein anderes Universum gelangt.
21.5
Singularitäten und Horizonte
583
4. Fall: a 2 < G 2 M 2 Dieser Fall ist der physikalisch wichtigste und damit interessanteste. Wie bei der ReissnerNordström-Lösung ist die Kerr-Metrik in drei Regionen I : r+ < r < ∞, I I : r− < r < r+ , I I I : 0 < r < r− regulär. In den Regionen I und I I I ist die Koordinate r raumartig, d. h., ein Teilchen oder Lichtstrahl kann sich dort in beliebige Richtungen bewegen. In der Region I I ist r zeitartig, dort wird ein Teilchen, das von I bzw. I I I hineingelangt, gezwungen, den Horizont r− bzw. r+ zu durchqueren. Penrose-Diagramme Wir wollen die Raumzeitstruktur der Kerr-Lösung etwas genauer untersuchen und dazu die zu den obigen vier Fällen korrespondierenden Penrose-Diagramme erstellen. Da es eine große Ähnlichkeit mit den Diagrammen der Reissner-Nordström-Lösung gibt, verzichten wir hier auf die Herleitung der maximalen Erweiterungen der Kerr-Metrik (die Details findet man z. B. in [24]) und wenden uns gleich den Abbildungen zu. Die ersten drei Fälle sind schnell abgehandelt. Der Schwarzschild-Fall a = 0 wird durch das Penrose-Diagramm für die Kruskal-Lösung 19.6 dargestellt. Für die nackte Singularität im Fall a 2 > G 2 M 2 ist das Penrose-Diagramm identisch mit dem für den Fall G M 2 < Q 2 bei der Reissner-Nordström-Lösung 20.2. Ebenso stimmen die Penrose-Diagramme für die extremen Lösungen überein. Für den extremen Kerr-Fall a 2 = G 2 M 2 gilt also das PenroseDiagramm in Abb. 20.5. Im vierten Fall a 2 < G 2 M 2 müssen wir eine Fallunterscheidung machen, da eine Singularität nur bei r = 0 und zugleich ϑ = π/2 vorliegen kann. 1. Fall: ϑ = π/2 Auch hier können wir auf die Reissner-Nordström-Lösung zurückgreifen. Das PenroseDiagramm in Abb. 20.4 und die dazu gehörigen Erläuterungen übertragen sich eins zu eins auf diesen Fall der Kerr-Lösung. 2. Fall: ϑ = π/2 In diesem Fall gibt es keine Singularitäten. Er beschreibt auch das Verhalten, wenn man durch die Ringsingularität fällt. Das Penrose-Diagramm in Abb. 21.3 zeigt die Details. Wie im 1. Fall ist es für einen Beobachter möglich, vom Universum I1 in das Universum I4 zu reisen. In diesem 2. Fall kommt aber hinzu, dass die Fläche r = 0 keine Singularität darstellt, und somit kann der Beobachter in der Region I I I durch den Ring hindurch fliegen, und er landet in einem anderen asymptotisch flachen Universum I3 .
584
Abb. 21.3 Kerr-Raumzeit für ϑ = π/2
21 Rotierende Schwarze Löcher
21.6
21.6
Die Ergosphäre
585
Die Ergosphäre
In diesem und den nächsten Abschnitten unterstellen wir immer a 2 < G 2 M 2 , wenn nicht explizit etwas anderes gesagt wird. Flächen unendlicher Rotverschiebung Wir schauen uns die Flächen unendlicher Rotverschiebung an, d. h., nach Abschn. 19.3 berechnen wir die Nullstellen von gtt = 1 −
2G Mr r 2 + a 2 cos2 ϑ − 2G Mr = ρ2 ρ2
und erhalten die gesuchten Flächen durch r = r S± = G M ±
G 2 M 2 − a 2 cos2 ϑ.
(21.23)
Für a = 0 reduziert sich S+ auf r = 2G M und S− auf r = 0, also auf den SchwarzschildFall. Ansonsten √ besitzt S+ am äquator einen Radius von 2G M und an den Polen einen Radius von G M + G 2 M 2 − a 2 . Das heißt, nur an den Polen stimmt S+ mit dem Ereignishorizont r = r+ überein, ansonsten ist der Ereignishorizont r = r+ komplett in S+ enthalten. Das Gebiet zwischen diesen beiden Flächen nennt man Ergosphäre. Umgekehrt liegt die Fläche S− komplett innerhalb des Ereignishorizontes r = r− . Abb. 21.4 zeigt schematisch die ineinander geschachtelten Regionen der Kerr-Raumzeit und die gestrichelte Ringsingularität in der Mitte. Die Flächen S+ und r = r+ berühren sich nur am Nord- und Südpol. Wir wollen die Eigenschaften der Ergosphäre, die es in der Schwarzschild-Raumzeit ja nicht gibt (dort stimmen r S+ und r+ überein), näher untersuchen und betrachten ein ruhendes Teilchen innerhalb der Ergosphäre. Dann gilt dr = dθ = dϕ = 0, und aus (21.16) folgt 2G Mr dt 2 . (21.24) ds 2 = − 1 − ρ2 Innerhalb der Ergosphäre ist r+ < r < r S+ , und mit (21.23) ergibt sich r − GM
0 führt. Die Bewegung eines realen Teilchens ist aber stets zeitartig, d. h., es muss immer ds 2 < 0 gelten. Damit haben wir gezeigt, dass ein Teilchen in der Ergosphäre nicht in Ruhe verharren kann, sondern seine Position im Raum ändern muss. Eine mögliche Erklärung dieses Phänomens vermuten wir darin, dass das Teilchen, obwohl es sich außerhalb des äußeren Ereignishorizonts befindet, trotzdem durch die Rotation des
586
21 Rotierende Schwarze Löcher
Abb. 21.4 Horizonte und Ergosphäre der Kerr-Lösung
Schwarzen Loches irgendwie „mitgezogen“ wird. Um das genauer zu untersuchen, nehmen wir an, dass sich ein Teilchen bei festem r und ϑ, aber variablem ϕ bewegt. Die Rotation des Schwarzen Lochs möge in positiver Richtung verlaufen, d. h., a > 0. Die Komponenten U μ der Vierergeschwindigkeit U des Teilchens ergeben sich dann zu t dϕ dt dt μ ϕ , 0, 0, = U = U , 0, 0, U = (21.25) (1, 0, 0, Ω) dτ dτ dτ mit der Winkelgeschwindigkeit Ω=
dϕ dϕ dt Uϕ / = , = t U dτ dτ dt
(21.26)
wie sie ein entfernter Beobachter wahrnimmt. Nun ist U zeitartig, d. h., es gilt 2 2 gμν U μ U ν = gtt U t + 2gtϕ U t U ϕ + gϕϕ U ϕ < 0, woraus mit (21.26) die Ungleichung Ω2 + 2
gtϕ gtt Ω+ 0, da gtϕ < 0 wegen a > 0 gϕϕ
(21.27)
21.6
Die Ergosphäre
587
und erhalten als Lösungen der zu (21.27) korrespondierenden Gleichung gtt 0, Ω+ = ω + ω2 − gϕϕ
(21.28)
da außerhalb der Ergosphäre gtt < 0 ist. Die Winkelgeschwindigkeit Ω liegt also wegen (21.27) im Bereich Ω− < Ω < Ω+ . Ein entfernter Beobachter kann also sehen, dass ein Teilchen außerhalb der Ergosphäre entgegen oder mit der Drehrichtung des Schwarzen Lochs rotiert. Nähert sich das Teilchen der Fläche unendlicher Rotverschiebung, so folgt gtt → 0 ⇒ Ω− → 0, Ω+ → 2ω, und das Teilchen kann nicht mehr gegenrotieren. Ist es masselos, so kann es auf der Fläche S+ verharren, ansonsten gilt 0 < Ω < Ωmax . Aus diesem Grund wird S+ auch als stationäre Grenzfläche bezeichnet. Innerhalb der Ergosphäre ist gtt > 0 und damit Ω > 0, sodass das Teilchen dort die gleiche Drehrichtung wie das Schwarze Loch hat und deshalb nicht in Ruhe verharren kann. Killing-Vektoren und Erhaltungssätze Die Kerr-Metrik (21.16) ist unabhängig von den Koordinaten t und ϕ, daher sind analog zum Schwarzschild-Fall die beiden Vektoren (14.34) X t = ∂t = (1, 0, 0, 0) , X ϕ = ∂ϕ = (0, 0, 0, 1)
(21.29)
Killing-Vektoren. Mit dem Impulsvektor P = mU → m
dϕ dt , 0, 0, dτ dτ
,
wobei m die Masse des Teilchens bezeichne, und dem Erhaltungssatz (12.60) erhalten wir, dass sich die Größen
dt dϕ μ + gtϕ E := −g (X t , P) = −m gμν X t U ν = −m gtν U ν = −m gtt (21.30) dτ dτ dt dϕ μ + gϕϕ L := g X ϕ , P = m gμν X ϕ U ν = m gϕν U ν = m gϕt (21.31) dτ dτ
entlang einer Geodäte nicht ändern. Da für r → ∞ die Komponente gϕt verschwindet, gtt sich immer mehr −1 und gϕϕ sich immer mehr r 2 sin2 ϑ annähert, können wir E als
588
21 Rotierende Schwarze Löcher
relativistische Energie im Unendlichen und L als die z-Komponente des Drehimpulses im Unendlichen interpretieren. Bemerkung 21.1 Ein identisches Ergebnis erhalten wir, wenn wir die Geodätengleichungen (17.75) d 1 dxμ dxμ dxν gρμ − ∂ρ gμν =0 dτ dτ 2 dτ dτ für die Koordinaten t und ϕ ausrechnen: d d dxμ dt dϕ gtμ +0= gtt + gtϕ 0= dτ dτ dτ dτ dτ μ d d dx dt dϕ 0= gϕμ +0= gϕt + gϕϕ , dτ dτ dτ dτ dτ wegen ∂t gμν = ∂ϕ gμν = 0. Integration der letzten beiden Gleichungen führt zu (21.30) und (21.31). Winkelgeschwindigkeiten und Frame-Dragging Wir nehmen nun an, dass ein Teilchen aus großer Entfernung mit Drehimpuls null (L = 0) entlang ϑ = const. frei auf das Schwarze Loch zu fällt, dann gilt mit (21.16) dt dϕ 0 = gϕt + gϕϕ dτ dτ 2 2 2G Mra 2 sin4 ϑ dϕ 2G Mra sin2 dt 2 + r + a sin ϑ + . = − ρ2 dτ ρ2 dτ Die Winkelgeschwindigkeit ist damit gtϕ dϕ dϕ dt 2G Mra = / = 2 =− =ω 2 2 2 2 dt dτ dτ gϕϕ r + a ρ + 2G Mra sin ϑ und wir sehen, dass Teilchen ohne Drehimpuls durchaus eine nicht verschwindende Winkelgeschwindigkeit haben können. Das ist ein Beispiel dafür, dass – anschaulich gesagt – die rotierende Masse ein frei fallendes Teilchen um sich herum wie eine zähe Flüssigkeit mitzieht. Das Phänomen, wie eine rotierende Masse ein Inertialsystem beeinflusst, wird Frame-Dragging genannt (siehe z. B. [35]). Wenn sich das Teilchen weiter auf den Ereignishorizont zu bewegt, dann nähern sich Ω− und Ω+ immer mehr einem gemeinsamen Wert an. Dieser Wert ist nach (21.28) erreicht, wenn gtϕ 2 gtt gtt 2 0 = ω2 − = − − ⇒ gtϕ − gtt gϕϕ = 0 gϕϕ gϕϕ gϕϕ gilt.
21.6
Die Ergosphäre
Aufgabe 21.6
589
Zeigen Sie, dass 2 gtϕ − gtt gϕϕ = sin2 ϑ
(21.32)
gilt. Lösung Wir berechnen mit der Kerr-Metrik (21.16) und mit ρ 2 = r 2 + a 2 cos2 ϑ: 2G Mr 2G Mra 2 sin4 ϑ 2 2 2 r + a sin ϑ + −1 + ρ ρ2 ρ2 2 4 4G 2 M 2 r 2 a 2 sin4 ϑ 2 2 sin2 ϑ + 2G Mra sin ϑ + r + a ρ4 ρ2 2 2 2 2G Mr r + a sin ϑ 4G 2 M 2 r 2 a 2 sin4 ϑ − ρ2 ρ4 ⎫ ⎧ 2 2 ⎨ 2G Mr a sin ϑ − r 2 − a 2 ⎬ r 2 + a2 + sin2 ϑ ⎩ ⎭ ρ2 ⎫ ⎧ ⎨ r 2 + a 2 cos2 ϑ ⎬ r 2 + a 2 − 2G Mr sin2 ϑ ⎩ ⎭ ρ2 r 2 + a 2 − 2G Mr sin2 ϑ = sin2 ϑ
4G 2 M 2 r 2 a 2 sin4 ϑ 2 −g g gtϕ − tt ϕϕ = 4 = − =
= =
Aus (21.32) folgt 2 gtϕ − gtt gϕϕ = 0 ⇔ = 0,
d. h., am Ereignishorizont r = r+ nehmen die Winkelgeschwindigkeiten den gleichen Wert Ω H = Ω− = Ω+ an. Man nennt Ω H deswegen auch Winkelgeschwindigkeit des Schwarzen Lochs. Ω H nimmt mit 2 2 2 = G M + G 2 M 2 − a 2 ⇒ r+ + a 2 = 2G Mr+ r+
(21.33)
und a = J /M folgenden Wert an:
ΩH = 2M
G2 M 2
J √ + G4 M 4 − G2 J 2
(21.34)
Die Winkelgeschwindigkeit kann man also durch die beiden charakterisierenden Parameter M und J der Kerr-Metrik ausdrücken.
590
21 Rotierende Schwarze Löcher
Aufgabe 21.7 Zeigen Sie die Gültigkeit von (21.34).
Lösung Es gilt: 2 2G Mr+ a sin2 ϑ/ρ+ gtϕ (r+ ) = 2 gϕϕ (r+ ) 2G Mr+ a 2 sin4 ϑ r+ + a 2 sin2 ϑ + 2 ρ+ a 2G Mr+ a = 2 = 2 + 2G Mr a 2 sin2 ϑ 2 sin2 ϑ 2G Mr+ ρ+ ρ + a + + a a = = 2 2G Mr+ r+ + a 2 cos2 ϑ + a 2 sin2 ϑ J J = = √ 2G M 2 r+ 2G M 2 G M + G 2 M 2 − a 2
ΩH = −
=
J √ 2M G 2 M 2 + G 4 M 4 − G 2 J 2
2 = ρ 2 (r ). mit ρ+ +
21.7
Der Penrose-Prozess
Energieextraktion Außerhalb der Ergosphäre ist der Killing-Vektor X t zeitartig, denn r 2 + a 2 cos2 ϑ − 2G Mr 2G Mr μ = − gμν X t X tν = gtt = − 1 − < 0, ρ2 ρ2 da r > r S+ . Auf S+ ist X t lichtartig und für r < r S+ raumartig. Innerhalb der Ergosphäre kann sich der Charakter der in (21.30) definierten Größe E = −g (X t , P) von Energie zu Impuls, der wiederum positiv oder negativ sein kann, verändern. Damit kann ein Teilchen, das in der Ergosphäre entsteht und verweilt oder ins Schwarze Loch fällt, negative Energie besitzen, was für ein Teilchen außerhalb der Ergosphäre nicht möglich ist. Diese Überlegung führt zu der Erkenntnis, dass es grundsätzlich möglich ist, Energie aus einem rotierenden Schwarzen Loch zu gewinnen. Die im Folgenden beschriebene Methode der Energiegewinnung nennt man Penrose-Prozess. Wir betrachten ein Teilchen, das sich aus dem Unendlichen frei fallend dem Schwarzen Loch nähert. Seine Energie (im Unendlichen) ist nach (21.30)
21.7
Der Penrose-Prozess
591
Abb. 21.5 Penrose-Prozess
E 1 = −g (X t , P) > 0 und eine Erhaltungsgröße. Es tritt in die Ergosphäre ein und zerfällt in zwei Teilchen, wobei Teilchen 2 mit E 2 < 0 in der Ergosphäre bleibt (oder ins Schwarze Loch fällt) und Teilchen 3 mit E 3 > 0 die Ergosphäre verlässt und ins Unendliche entweicht, was in Abb. 21.5 skizziert wird. Die Energieerhaltung am Ort des Zerfalls führt wegen E 2 < 0 zu E1 = E2 + E3 ⇒ E3 = E1 − E2 > E1. Wir haben also aus dem Schwarzen Loch (genauer aus der Ergosphäre) mehr Energie rausgeholt als reingesteckt, was auch bedeutet, dass das Schwarze Loch Masse verloren hat. Drehimpulsverlust Durch den Penrose-Prozess wird dem rotierenden Schwarzen Loch auch Drehimpuls entzogen. Die Vierergeschwindigkeit U eines Teilchens in der Ergosphäre ist zeitartig und lässt sich mit (21.25) und den Killing-Vektoren X t und X ϕ nach (21.29) als U = U 0 Xt + ΩH Xϕ schreiben. Da nach Bemerkung 12.7 die Killing-Vektoren eine Lie-Algebra bilden, ist die Kombination X˜ := X t + Ω H X ϕ
592
21 Rotierende Schwarze Löcher
ebenfalls ein (zeitartiger) Killing-Vektor mit −g X˜ , P > 0, d. h., mit (21.30) und (21.31) folgt −g (X t , P) − Ω H g X ϕ , P = E − Ω H L > 0. Da Ω H > 0 ist, erhalten wir die Ungleichung L