293 97 2MB
German Pages 508 [511] Year 2010
Theoretische Physik kompakt für das Lehramt Von Prof. Dr. Karl Schilcher
Oldenbourg Verlag München
Karl Schilcher ist Professor für Theoretische Physik an der Universität Mainz. Seine umfangreiche Lehrtätigkeit führte ihn auch an die University of California in Los Angeles und an die University of Pennsylvania in Philadelphia. In den letzten Jahren widmete er sich besonders der Ausbildung der Lehramt-Studierenden in theoretischer Physik. Sein Forschungsgebiet ist die phänomenologische Elementarteilchenphysik.
Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über abrufbar.
© 2010 Oldenbourg Wissenschaftsverlag GmbH Rosenheimer Straße 145, D-81671 München Telefon: (089) 45051-0 oldenbourg.de Das Werk einschließlich aller Abbildungen ist urheberrechtlich geschützt. Jede Verwertung außerhalb der Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlages unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Bearbeitung in elektronischen Systemen. Lektorat: Kathrin Mönch Herstellung: Anna Grosser Coverentwurf: Kochan & Partner, München Gedruckt auf säure- und chlorfreiem Papier Gesamtherstellung: Grafik + Druck GmbH, München ISBN 978-3-486-58886-6 eISBN 978-3-486-70930-8
Vorwort und Einführung Vorwort In diesem Buch wird versucht, den Kern der Theoretischen Physik so knapp darzustellen, dass die Themen etwa den Stoff einer zweisemestrigen Vorlesung für das Lehramt an höheren Schulen bilden oder den Lehrern und Lehrerinnen, die bereits an höheren Schulen unterrichten, vom Umfang her als Lesestoff zugemutet werden können. Die knappe Darstellung hat gegenüber den mehrbändigen Werken den Vorteil, dass die tiefen Zusammenhänge zwischen den einzelnen Gebieten leichter erfasst werden können. Bei der Auswahl der Themen werden daher die vielen Interrelationen, sowohl physikalischer als auch mathematischer Art, die zwischen den verschiedenen, traditionell als autonom behandelten, Zweigen der theoretischen Physik bestehen, betont. Die Stoffauswahl und die Darstellung sind drauf ausgerichtet, die erkenntnistheoretische und kulturelle Bedeutung der Theoretischen Physik zu vermitteln. Es wird deutlich, dass die Mechanik Newtons, Lagranges und Hamiltons, die Vereinheitlichung von der elektrischen und magnetischen Wechselwirkungen durch Maxwell, die spezielle und allgemeine Relativitätstheorie Einsteins und die Quantenmechanik und Quantenfeldtheorie Heisenbergs, Schrödingers, Diracs und Feynmans ein einheitliches zusammenhängendes gedankliches Gebäude bilden, das in der Lage zu sein scheint, die Gesamtheit der physikalische Phänomene zu erklären. Es soll bewusst gemacht werden, dass diese Theorien zu den größten Kulturleistungen der letzten Jahrhunderte gehören. Erst eine präzise mathematische Beschreibung erlaubt es, die engen Zusammenhänge zwischen unterschiedlichen Zweigen der Physik wirklich deutlich zu machen. Wichtige Beispiele für solche Zusammenhänge, die in die Theorievorlesung Eingang finden sollten, sind die Folgenden: • Das Prinzip der kleinsten Wirkung in der Mechanik, in der Elektrodynamik, in spezieller und allgemeiner Relativitätstheorie und, in modifizierter Form, in der Feynmanschen Formulierung der Quantentheorie. • Die formale Ähnlichkeit der Quantenmechanik im Heisenberg-Bild und der Hamiltonschen Mechanik. • Symmetrien und Erhaltungssätze in der klassischen und in der Quantenphysik. • Die Bedeutung der Kovarianz physikalischer Gesetze in Hinsicht auf Galilei-, Lorentzund allgemeine Koordinatentransformationen.
VI
Vorwort und Einführung
Neben der Betonung der übergreifenden Prinzipien, sollen die wichtigsten und tiefsinnigsten Ergebnisse der neueren theoretischen Physik dargestellt werden. Hierzu gehören in der Elektrodynamik die Wellenlösungen und Strahlungsprobleme, in der Quantentheorie die Trennung von Zustand und Observablen, Spin und allgemeine ZweiZustandssysteme, Kohärenz und Dekohärenz, Verschränkung und die Bellschen Ungleichungen, Dichteoperatoren und Grundlagen der statistischen Physik. Viele elementare Teilgebiete der Physik wurden in dieses Buch nicht aufgenommen, da sie zur Genüge in den Vorlesungen Experimentalphysik und Moderne Physik behandelt werden. Dazu gehören das Kepler-Problem, kleine Schwingungen, die eindimensionale SchrödingerGleichung und die klassische Thermodynamik. Andere wichtige Teilgebiete, die nach meiner Meinung nicht essentiell für das Gesamtbild der theoretischen Physik sind, wie dynamische Systeme oder die klassische statistische Physik, werden nicht behandelt. Die statistische Physik erscheint im Rahmen der Quantenmechanik. Das Studium der Physik sollte vom Konkreten zum Abstrakten erfolgen. In dem Sinne baut dieses Lehrbuch auf den modernen Grundvorlesungen Physik und den mathematischen Begleitkursen, wie sie über vier Semester an den deutschen Universitäten angeboten werden, auf. Wenn man die übergeordneten Zusammenhänge erkennen will, die unsere Welt auf so wunderbare Weise beschreiben, dann ist eine gewisse mathematische Abstraktion unvermeidlich. Dadurch wird die theoretische Physik zunächst schwerer verständlich als ein mehr phänomenologisch ausgerichteter Zugang. Nach Überwindung der ersten Hürden, erweckt die theoretische Physik jedoch eine ungeheure Faszination, weil sie deutlich macht, dass das Universum nicht willkürlich, sondern nach logischen und verständlichen Regeln funktioniert, die unserem Verstand zugänglich sind. Da Physiklehrer und Lehrerinnen nicht unbedingt Mathematik als zweites Fach studieren oder studiert haben, werden in diesem Buch die verwendeten mathematischen Methoden anschaulich und auf die behandelten physikalischen Themen hin orientiert behandelt. Obwohl die unvermeidliche Mathematik über den Stoff, der an Schulen vermittelt wird, hinaus geht, ist es für die Lehrenden von großer Bedeutung das faszinierende mathematische Gebäude, das der Physik zugrunde liegt, als theoretischen Überbau stets vor Augen zu haben. Die Begeisterung für die Ästhetik der mathematischen Erfassung physikalischer Phänomene soll bei den angehenden Lehrern und Lehrerinnen geweckt werden. Richard Feynman sagte einmal, dass Physik verstehen, Mathematik verstehen bedeute. Wenn versucht wird, ein möglichst einheitliches Bild der Physik zu präsentieren, so steht in der klassischen Mechanik die Lagrangesche und Hamiltonsche Formulierung zunächst im Vordergrund. In diesem Zusammenhang muss die Variationsrechnung eingeführt werden. Der Formalismus der nicht-relativistischen Mechanik sollte daneben auch stark an der später behandelten Quantenmechanik orientiert sein. Eine sinnvolle Behandlung der Quantenmechanik kommt aber ohne eine Beherrschung der Vektorund Matrizenrechnung nicht aus. Um eine frühe Vertrautheit mit den nötigen Techniken zu erreichen, werden Drehungen, Lorentz-Transformationen und Symmetrien im Detail und vieleicht etwas formaler als notwendig in der Mechanik behandelt. Der Übergang zu komplexen endlichdimensionalen oder abzählbar unendlich dimensionalen komplexen
Vorwort und Einführung
VII
Vektorräumen und zum Dirac-Formalismus in der Quantenmechanik kann auf dieser Basis ohne Schwierigkeiten erfolgen. Mathematischen Ableitungen, die in den Standardlehrbüchern oft als Übungsaufgaben dienen, werden nach Möglichkeit im Detail ausgeführt, um zu vermeiden, dass sich die Leser und Leserinnen den Kopf über rechnerische Spitzfindigkeiten zerbrechen und so den Blick für die großen Zusammenhänge verlieren. Die Lösung partieller Differentialgleichungen auch mittels Green-Funktionen wird ansatzweise behandelt. Die erworbenen Fähigkeiten und Kenntnisse in theoretischer Physik lassen sich wegen des unvermeidlichen mathematischen Niveaus meistens leider nicht direkt in den Unterricht an Gymnasien einbringen. Dennoch bilden sie die Grundvoraussetzung für einen kompetenten Physikunterricht, für das Lesen wissenschaftlicher Zeitschriften und für das Ziel der ständigen Weiterbildung der Physiklehrer und Lehrerinnen.
Einführung Der Realitätsbegriff, wie wir ihn durch unsere Sinne und täglichen Erfahrungen zu kennen glauben, wird durch die teilweise nur noch mathemetischen fassbaren, neueren physikalischen Theorien ernsthaft in Frage gestellt. Aus der täglichen, mit der Kindheit beginnenden Erfahrung kennen wir die Wirkung von Kräften auf feste Körper, Flüssigkeiten oder Gase. Wenn wir davon sprechen, dass wir die klassische Physik „verstehen“, dann meinen wir damit, dass wir eine Eins-zu-eins-Beziehung zwischen den Messgrößen und unseren Sinneseindrücken, Tastsinn, Augen und Gehöhr herstellen können. Unsere Sinne unterscheiden dabei streng zwischen Ortskoordinaten und der absolut vorgegebenen Zeit. Der unseren Sinnen direkt zugängliche Bereich der Physik ist die klassische Mechanik, die die Dynamik von Massenpunkten, auch Teilchen genannt, bei kleinen Geschwindigkeiten behandelt. Die Mechanik ist eine in sich vollständig konsistente Theorie, einschließlich der Interpretation experimenteller Daten. Es existieren mehrere äquivalente mathematische Formulierungen der Mechanik, die Newtonsche, die Lagrangesche und die Hamiltonsche. Von besonderem Interesse sind die beiden letzteren, die den Kern der analytischen Mechanik bilden. Die analytische Mechanik geht zurück auf Leibniz, der den Newtonschen Impuls durch die kinetische Energie und die Newtonsche Kraft durch die Arbeit der Kraft ersetzen wollte. Bewegung beinhaltet stets eine Richtung. Es ist daher erstaunlich, dass ein Skalar die Bewegung, auch komplizierter Systeme, festlegen soll – allerdings auf der Basis eines Variationsprinzips nicht von Gleichungen. Die genaue Formulierung des Variationsprinzips geht auf Lagrange und Hamilton zurück. Es besagt, dass die Wirkung für die tatsächlich durchlaufenden Bahnen der Massenpunkte eines mechanischen Systems ein Extremum (gewöhnlich ein Minimum) annimmt, wobei die Wirkung durch das Zeitintegral über die Lagrange-Funktion, d.h. die Differenz von kinetischer und potentieller Energie, gegeben ist. Ein offensichtlicher Vorteil des Prinzips der kleinsten Wirkung ist, dass es sich auf kein bestimmtes Koordinatensystem bezieht, so dass sich Koordinatentransformationen einfach durchführen lassen. Die dabei erkennbaren Symmetrien der LagrangeFunktion führen direkt auf Erhaltungssätze. Die fundamentale Bedeutung des Prinzips der kleinsten Wirkung zeigt sich darin, dass es auch in den anderen großen Gebieten der Physik, wie der speziellen und der allgemeinen Relativitätstheorie, der Elektrodyna-
VIII
Vorwort und Einführung
mik und der Quantenfeldtheorie, Anwendung findet, in etwas abgewandelter Form auch in der Feynmanschen Quantenmechanik. Eine Legendre-Transformation führt die Lagrangesche Mechanik in die Hamiltonsche Mechanik über. Der Hamilton-Formalsimus bildet die Grundlage für die sogenannte kanonische Quantisierung. Es wurde von Dirac entdeckt, dass man den Zusammenhang zwischen Mechanik und Quantenmechanik am einfachsten dadurch herstellt, dass man die Poisson-Klammern der Hamiltonschen Mechanik mit entsprechenden Kommutatoren der Heisenbergschen Quantenmechanik in Beziehung setzt. Gegen Ende des neunzehnten Jahrhunderts gelang es James Clerk Maxwell und Heinrich Hertz die elektrischen und magnetischen Wechselwirkungen in einer Theorie zu vereinigen. Sie konnten zeigen, dass die Gleichungen elektromagnetische Wellen als Lösung erlauben, wobei Licht einen kleinen Frequenzbereich in deren Spektrum darstellt. Die elektromagnetischen Wellen werden von beschleunigten Ladungen abgestrahlt. Dieses Zusammenführen der elektrischen, magnetischen und optischen Phänomene in eine einzige Theorie stellte eine neue transzendentale Erweiterung des damaligen Weltbildes dar. Zum Ende des neunzehnten Jahrhunderts war die physikalische Welt also im Wesentlichen zweigeteilt. Zum einem gab es die diskreten Massenpunkte, beschrieben durch die Mechanik Newtons, Lagranges und Hamiltons. Zum zweiten existierten die kontinuierlichen elektromagnetischen Felder der Maxwell-Theorie. Mit diesen beiden gegensätzlichen Bildern ließen sich die bekannten physikalischen Phänomene mit großer Genauigkeit beschreiben. Zu nennen seien hier die Thermodynamik, die elektromagnetischen Wellen und die Bewegung von Punktladungen im elektromagnetischen Feld. Auf diesem geschlossenen zweigeteilten Weltbild lagen gegen Ende des Jahrhunderts allerdings zwei Schatten, die sich beide auf die elektromagnetische Strahlung bezogen: das Null-Ergebnis des Michelson-Morley-Versuches und die Ultraviolett-Kathastrophe in der Rayley-Jeans-Analyse der Hohlraumstrahlung. Aus dem Michelson-Morley-Experiment folgt, dass die Lichtgeschwindigkeit in allen Inertialsystemen die gleiche sein muss. Diese Tatsache, zusammen mit der Forderung, dass die Naturgesetze in allen Inertialsystemen die selbe Form haben müssen, bildete die Grundlage für Einsteins Relativitätstheorie. Eine Konsequenz der Relativitätstheorie ist, dass die klassischen Konzepte von Raum und Zeit keine absolute Bedeutung haben und Effekte wie Zeitdilatation und Längenkontraktion, die mit der Geschwindigkeit anwachsen, auftreten. Die Relativitätstheorie steht somit im klaren Widerspruch zur Newtonschen Mechanik. Die klassische Mechanik lässt sich nur sehr beschränkt relativistisch verallgemeinern, sobald mehrere wechselwirkende Teilchen involviert sind. Das liegt daran, dass in der Relativitätstheorie die Kraft auf ein gegebenes Teilchen von der Position der anderen Teilchen zu einer früheren Position abhängt. Das von einem Teilchen generierte Kraftfeld hängt von dessen Bewegung ab. Das Feld muss in der Relativitätstheorie als eigenständige dynamische Größe betrachtet werden. Die Wechselwirkung findet instantan nur zwischen unmittelbar benachbarten Punkten statt, man spricht von Nahewirkung. Ortskoordinaten und Zeit sind gleichberechtigte Parameter, die Zeit hat keine absolute Bedeutung mehr, und damit kann man die Relativitätstheorie im alltäglichen Sinne nicht mehr „verstehen“. Wir verstehen die Relativitätstheorie jedoch in dem Sinne, dass sie logisch widerspruchsfrei und die Vorhersagen dieser zunächst mathematischen Theorie die physikalische Phänomene mit ungeahnter
Vorwort und Einführung
IX
Präzession beschreiben. Die klassische Mechanik samt ihren Begrifflichkeiten folgt aus der Relativitätstheorie im Limes kleiner Geschwindigkeiten. Bei der Hohlraumstrahlung sollte im thermischen Gleichgewicht jede Fourier-Mode mit gleicher Wahrscheinlichkeit auftreten. Da die Zahl der Moden in einem Hohlraum mit dem Quadrat der Frequenz zunimmt, müsste man einen stetigen Anstieg der abgestrahlten Energie mit der Frequenz beobachten. Stattdessen wurde bei hohen Frequenzen ein Abfall gemessen. Zur Erklärung sah sich Max Planck „in einem Akt der Verzweiflung“ gezwungen anzunehmen, dass die Energien der Oszillatoren der Wand des Hohlraums nur diskrete Werte, d.h. Vielfache des Planckschen Wirkungsquantums h, annehmen können. Einstein übernahm und erweiterte diese Idee 1905 in seiner Erklärung des photoelektrischen Effektes. Er postulierte, dass die Energie in einem Lichtstrahl nicht gleichmäßig wie in einer klassischen elektromagnetischen Welle verteilt, sondern in kleien Paketen, die er mit Lichtquanten bezeichnet, konzentriert ist. Jedes Lichtquant trägt die Energie E = hν = hc/λ und einen Impuls p = hν/c, wo ν die Frequenz, λ die Wellenlänge der Strahlung und c die Lichtgeschwindigkeit ist. Der Zusammenhang zwischen Impuls p~ und Wellenvektor ~k lautet p~ = (h/2π)~k. Die Quantenhypothese bildete die Grundlage der 1925–26 durch Heisenberg und Schrödinger formulierten Quantenmechanik. Eine der Aussagen der Theorie war, dass Ort und Impuls eines Teilchens prinzipiell nicht mehr beliebig genau gleichzeitig gemessen werden können. Damit hat der klassische Begriff des Teilchens, mit dem wir untrennbar die Bewegung auf einer wohldefinierten Bahn und einem wohldefinierten Impuls verbinden, strenggenommen seine Anwendungsberechtigung verloren. Die Quantentheorie sagt auch voraus, dass, je nach experimentellen Gegebenheiten, ein Elektron Teilchen- oder Welleneigenschaften zeigen kann. Die erste Begegnung mit der Quantenmechanik löst im Allgemeinen Verwunderung und Erstaunen aus. Ortskoordinaten und Impulse werden durch Differentialoperatoren dargestellt, die Dynamik durch die Schrödinger-Gleichung beschrieben, Teilchen durch komplexe Wellen, Messungen durch Wahrscheinlichkeiten. Die Begriffe der Quantenmechanik verlangen offensichtlich nach Erklärungen. Nach der populären Kopenhagener Interpretation hat die Wellenfunktion nur eine epistemologische Bedeutung, d.h. sie protokolliert unsere Kenntnis der Welt. Sie sagt nichts darüber aus, wie die Welt ist, sondern was wir über die Welt sagen können. Um einen Vergleich von J.A. Wheeler zu gebrauchen: Die Schrödingersche Wellenfunktion verhält sich zur physikalischen Welt wie der Wetterbericht zum Wetter. Die Postulate der Quantenmechanik sind Rechenregeln, um Wahrscheinlichkeiten für die Ergebnisse von Experimenten an identisch präparierten Systemen (Ensemles) vorherzusagen. Diese Vorhersagen stimmen ausnahmslos (fast genau) mit den Experimenten überein. Vom pragmatischen oder positivistischen Standpunkt kann man sich mit dieser Situation zufrieden geben. Viele Lehrbücher betonen daher den technischen Aspekt der Quantenmechanik ohne tiefer in die konzeptionellen Probleme einzugehen. Dabei entsteht leicht der falsche Eindruck, dass die konzeptionellen Probleme der Quantenmechanik gelöst, bzw. nur philosophischer Art sind. Als Beispiel mag das Konzept Welle-Teilchen-Dualismus dienen. Die Begriffe Welle und Teilchen schließen sich gegenseitig aus und es müsste erklärt werden, warum Elektronen manchmal wie lokalisierbare Teilchen aussehen und warum
X
Vorwort und Einführung
sie sich z.B. im Jöhnsonschen Doppelspaltexperiment 1 wie Wellen verhalten und Interferenzen zeigen. Die mystische Welle-Teilchen-Dualität kehrt dieses Problem unter den Teppich und schließt jede realistische Interpretation der Quantenmechanik aus. Ein weiteres Problem der Kopenhagener Regeln ist, dass der Messprozess klassisch behandelt werden muss, was zu dem mysteriösen Kollaps der Wellenfunktion führt. In den letzten Jahren wurden bei der Lösung dieses Problems durch die Theorie der Dekohärenz wesentliche Fortschritte erzielt. In diesem Lehrbuch werden die Probleme der Interpretation der Quantenmechanik diskutiert, ohne sich auf eine der vielen, oft mit religiösen Eifer vorgetragenen Interpretationen einzulassen. Die Axiome der Quantenmechanik erscheinen kompliziert und ad hoc, wenn man sie mit denen der elementaren klassischen Mechanik, d.h. mit den Newtonschen Gleichungen vergleicht. Umso erstaunlicher ist Diracs Beobachtung, dass die Quantenmechanik auf Grundlagen basiert, die der Hamiltonschen Formulierung der Mechanik eindeutig und im Detail entsprechen. Dies beruht darauf, dass die klassischen Begriffe der HamiltonTheorie, d.h. kanonische Koordinaten, Impulse und Poisson-Klammern, vollständige Entsprechungen in der Quantenmechanik besitzen. Dagegen ist der Zusammenhang zwischen der Lagrangeschen Formulierung der Mechanik und den Begriffen Koordinaten und Geschwindigkeiten in der Quantentheorie nicht so offensichtlich. Die Lösung dieses Problems wurde erst 1942 von Feynman gefunden. Statt der Operatoren und Zustandsvektoren basiert die Feynmansche Quantenmechanik auf Pfadintegralen. Hierbei muss über alle klassischen Trajektorien zwischen zwei Punkten in Phasenraum gewichtet und summiert werden. Die Trajektorien reduzieren sich auf die klassische Bahn, wenn die klassische Wirkung viel größer als das Plancksche Quantum wird. Dies ist eine Folge des Prinzips der stationären Phase. Schon 1926, kurz nach der Formulierung der Quantenmechanik, zeigten Born, Heisenberg und Jordan, dass auch das elektromagnetische Feld nach den kanonischen Regeln quantisiert werden kann. Sie zeigten, dass die Fourierkoeffizienten der Feldoperatoren sich als Erzeugungs- und Vernichtungsoperatoren von Photonen interpretieren lassen. Die Existenz von Photonen ist eine unabdingbare Folge der Quantisierung des elektromagnetischen Feldes. In den folgenden Jahren, entdeckte Dirac eine relativistisch invariante Version der Schrödinger-Gleichung für Elektronen und Positronen. Parallel dazu kam die Idee auf, dass alle Elementarteilchen durch Quantenfelder und eine relativistisch invariante Quantenfeldtheorie beschrieben werden. Die Quantenfelder füllen das ganze Universum aus und die Teilchen sind Bündel von Energie und Impuls. Im Vergleich zum alten Teilchen-Welle-Dualismus liefert die Quantenfeldtheorie ein einheitliches Bild der Natur. Die alte Zweiteilung Teilchen und Welle ist aufgehoben. Leider fehlt bis heute eine Quantenfeldtheorie der Gravitation. Im gegebenen Rahmen kann in diesem Buch nur auf die wesentlichen Aspekte der Quantenfeldtheorie eingegangen werden. Da die Beiträge der starken und schwachen Wechselwirkung auf der atomaren Skala sehr klein sind, kann man sich auf die Quantenelektrodynamik (QED), die die Wechselwirkung von Photonen und Elektronen beschreibt und beispielhaft für alle Quantenfeldtheorien ist, beschränken. Die Vorhersagen der störungstheoretischen QED 1
Claus Jönsson, Elektroneninterferenzen an mehreren künstlich hergestellten Feinspalten; Zeitschrift für Physik 161 (1961), 454
Vorwort und Einführung
XI
stimmen mit schier unglaublicher Genauigkeit mit den experimentellen Daten überein. Wenn man die QED also als grundlegende Theorie akzeptiert, muss man zeigen können, wie sich die klassische Elektrodynamik und die nicht-relativistische Quantenmechanik aus der QED als bestimmte Grenzfälle ergeben. Das Gesamtbild der Physik lässt sich schön in einem Diagram darstellen, in dem die eine Achse von dem Planckschen Wirkungsquantum und die andere Achse von der reziproken Lichtgeschwindigkeit gebildet wird. Ergänzt man dieses Diagramm durch eine dritte Dimension, die durch die Gravitationskonstante G gebildet wird, so erhält man für die Klassifizierung physikalischer Theorien das cGh Schema des von Stalin 1938 ermordeten theoretischen Physikers Matvei Petrovich Bronstein.
Danksagung: Das Buch beruht auf der Vorlesung „Theoretische Physik für das Lehramt“, die ich über eine Reihe von Jahren an der Universität Mainz gehalten habe. Daher gilt mein erster Dank den Mitarbeitern, die wesentlich zum Konzept, und der großen Zahl von Studierenden, die durch konstruktive Kritik zur Optimierung des Manuskripts beigetragen haben. Ich möchte auch meinen Kollegen danken, die ich oft in Diskussionen über Inhalte der Vorlesung verwickelt habe. Schließlich möchte ich meiner Frau Regina für ihre Unterstützung und ihre Geduld danken, die sie besonders in der Zeit, als das Buch fertiggestellt wurde, aufbringen musste.
Inhaltsverzeichnis Vorwort und Einführung
V
1 Newtonsche Mechanik 1.1 Kinematik . . . . . . . . . . . . . . . . 1.2 Der reelle Vektorraum Rn . . . . . . . 1.3 Euklidische Struktur . . . . . . . . . . 1.4 Bewegung eines Massenpunktes . . . . 1.5 Newtonsche Gesetze . . . . . . . . . . 1.6 Arbeit und Energie . . . . . . . . . . . 1.7 Zweikörpersystem . . . . . . . . . . . . 1.8 Systeme von mehreren Massenpunkten
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
1 1 1 2 4 5 6 8 10
2 Prinzipien der Mechanik 2.1 Einführung . . . . . . . . . . . . . . . . 2.2 Zwangsbedingungen . . . . . . . . . . . 2.3 Das Prinzip der virtuellen Arbeit . . . . 2.4 Statik (Systeme im Gleichgewicht) . . . 2.5 Das d’Alembertsche Prinzip (Dynamik) 2.6 Variation einer Funktion . . . . . . . . . 2.7 Das Hamiltonsche Prinzip . . . . . . . . 2.8 Anhang: Das totale Differential . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
15 15 17 18 19 21 23 24 26
3 Die Lagrangeschen Bewegungsgleichungen 3.1 Die Lagrangeschen Gleichungen . . . . . . . . . . . . . . . . . . 3.2 Forminvarianz der Lagrangeschen Gleichungen . . . . . . . . . . 3.3 Beispiele . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4 Verallgemeinerte Potentiale . . . . . . . . . . . . . . . . . . . . 3.5 Lagrangesche Gleichungen und allgemeine Zwangsbedingungen
. . . . .
. . . . .
. . . . .
. . . . .
29 29 31 32 35 37
4 Symmetrien und Erhaltungssätze 4.1 Verallgemeinerte Impulse . . . . 4.2 Zyklische Koordinaten . . . . . 4.3 Noether-Theorem . . . . . . . . 4.4 Impulserhaltung . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
41 41 42 44 45
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
XIV 4.5 4.6
Inhaltsverzeichnis Drehimpulserhaltung . . . . . . . . . . . . . . . . . . . . . . . . . . . . Hamilton-Funktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5 Hamiltonsche Mechanik 5.1 Legendre-Transformation . . . . . . . . . . . . . . . 5.2 Die Hamiltonschen Gleichungen . . . . . . . . . . . 5.3 Der Phasenraum . . . . . . . . . . . . . . . . . . . 5.4 Das Prinzip der kleinsten Wirkung im Phasenraum 5.5 Liouvillesches Theorem . . . . . . . . . . . . . . . . 5.6 Die Poissonschen Klammern . . . . . . . . . . . . .
. . . . . .
. . . . . .
6 Kanonische Transformationen 6.1 Punkt- und kanonische Transformationen . . . . . . . 6.2 Kanonische Transformationen und Poisson-Klammern 6.3 Infinitesimale kanonische Transformationen . . . . . . 6.4 Hamilton-Jacobi-Gleichung . . . . . . . . . . . . . . . 7 Drehungen 7.1 Drehmatrix . . . . . . . . . 7.2 Infinitesimale Drehungen . . 7.3 Drehgruppe . . . . . . . . . 7.4 Drehungen und Observable 7.5 Tensoren . . . . . . . . . . . 7.6 Tensoralgebra . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
46 47
. . . . . .
49 49 51 54 55 56 58
. . . .
61 61 65 67 69
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
71 71 73 75 78 79 82
8 Rotierende Koordinatensysteme 8.1 Ein Beispiel . . . . . . . . . . . . . . . . . . . . . . . . . 8.2 Winkelgeschwindigkeit . . . . . . . . . . . . . . . . . . . 8.3 Geschwindigkeit im rotierenden Koordinatensystem . . . 8.4 Bewegungsgleichung im rotierenden Koordinatensystem 8.5 Das Foucaultsche Pendel . . . . . . . . . . . . . . . . . . 8.6 Euler-Winkel . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
85 85 86 89 90 92 93
9 Dynamik starrer Körper 9.1 Starre Körper . . . . . . . . . . . . 9.2 Trägheitstensor . . . . . . . . . . . 9.3 Die Eulerschen Kreiselgleichungen . 9.4 Der kräftefreie Kreisel . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
97 . 97 . 98 . 101 . 103
10 Relativitätstheorie 10.1 Postulate . . . . . . . . . . . . . . . . 10.2 Einfache Lorentz-Transformation . . . 10.3 Intervalle, 4-Abstände . . . . . . . . . 10.4 Transformation der Geschwindigkeiten 10.5 4-Vektoren . . . . . . . . . . . . . . . . 10.6 Homogene Lorentz-Transformation . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . .
107 107 108 110 112 113 113
Inhaltsverzeichnis 10.7 10.8 10.9 10.10 10.11 10.12
XV
Infinitesimale Lorentz-Transformationen . . . . . . 4-Tensoren . . . . . . . . . . . . . . . . . . . . . . . Kovarianz der Naturgesetze . . . . . . . . . . . . . Lorentzkovariante Kinematik eines Massenpunktes Kovariantes Wirkungsprinzip . . . . . . . . . . . . Streuung von Teilchen . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
116 120 122 123 125 128
11 Maxwell-Gleichungen 11.1 Relativistische Dynamik . . . . . . . . . ~ und B ~ 11.2 Transformationsverhalten von E 11.3 Der elektromagnetische Feldtensor . . . 11.4 4-Potentiale . . . . . . . . . . . . . . . . 11.5 Homogene Maxwell-Gleichungen . . . . 11.6 Die inhomogenen Maxwell-Gleichungen . 11.7 Eichtransformationen . . . . . . . . . . . 11.8 Differentialgleichungen für die Potentiale 11.9 Poyntingsches Theorem . . . . . . . . . 11.10 Das Ohmschen Gesetz . . . . . . . . . . 11.11 Lagrangesche Formulierung . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
. . . . . . . . . . .
131 131 135 136 138 138 139 141 141 142 144 146
12 Elektrostatik 12.1 Das elektrostatische Feld . . . . . . . . . 12.2 Das Coulombsche Gesetz . . . . . . . . . 12.3 Die Green-Funktion . . . . . . . . . . . . 12.4 Multipolentwicklung in der Elektrostatik
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
149 149 150 154 155
13 Der Energie-Impuls-Tensor 13.1 Der Energie-Impuls-Tensor des elektromagnetischen Feldes 13.2 Stromdichte von bewegten Punktladungen . . . . . . . . . 13.3 Energie-Impuls-Tensor eines geladenen Teilchens . . . . . 13.4 Drehimpulserhaltung . . . . . . . . . . . . . . . . . . . . . 13.5 Noether-Theorem für Felder . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
159 159 161 163 165 166
14 Elektromagnetische Strahlung 14.1 Green-Funktionen, Retardierte Potentiale . . . 14.2 Multipolentwicklung der retardierten Potentiale 14.3 Elektrische Dipolstrahlung E1 . . . . . . . . . . 14.4 Lineare Antennen . . . . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
169 169 173 176 180
15 Strahlung einer bewegten Punktladung 15.1 Liénard-Wiechertsche Potentiale . . . 15.2 Liénard-Wiechert-Felder . . . . . . . . 15.3 Strahlung im Ruhsystem (zur Zeit τ0 ) 15.4 Allgemeinere Beispiele . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
185 186 189 192 194
. . . .
. . . .
. . . .
. . . .
. . . .
XVI
Inhaltsverzeichnis
16 Maxwell-Gleichungen in Materie 197 16.1 Mittelung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197 16.2 Mikroskopisches Modell . . . . . . . . . . . . . . . . . . . . . . . . . . 199 17 Ebene Elektromagnetische Wellen 17.1 Die Wellengleichung . . . . . . . 17.2 Polarisation . . . . . . . . . . . . 17.3 Brechung und Reflexion . . . . . 17.4 Die Fresnelschen Formeln . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
207 207 210 212 214
18 Allgemeine Relativitätstheorie 18.1 Gravitation in der klassischen Mechanik . 18.2 Allgemeine Koordinatentransformationen . 18.3 Die kovariante Ableitung . . . . . . . . . . 18.4 Der Krümmungstensor . . . . . . . . . . . 18.5 Geodäten . . . . . . . . . . . . . . . . . . 18.6 Die Einstein-Gleichungen . . . . . . . . . 18.7 Die Schwarzschild-Lösung . . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
219 219 220 225 227 230 231 237
19 Komplexe Vektorräume 19.1 Vektoren . . . . . . . . . . . . . . . . . . . . . . . . . 19.2 Der komplexe Vektorraum CN . . . . . . . . . . . . 19.3 Skalarprodukt . . . . . . . . . . . . . . . . . . . . . . 19.4 Basis . . . . . . . . . . . . . . . . . . . . . . . . . . . 19.5 Lineare Operatoren . . . . . . . . . . . . . . . . . . . 19.6 Inverser Operator . . . . . . . . . . . . . . . . . . . . 19.7 Der adjungierte Operator . . . . . . . . . . . . . . . 19.8 Unitäre Operatoren . . . . . . . . . . . . . . . . . . . 19.9 Eigenwerte und Eigenvektoren . . . . . . . . . . . . . 19.10 Erwartungswert . . . . . . . . . . . . . . . . . . . . . 19.11 Operatoridentitäten . . . . . . . . . . . . . . . . . . 19.12 Die Spur eines Operators . . . . . . . . . . . . . . . . 19.13 Produktraum . . . . . . . . . . . . . . . . . . . . . . 19.14 Der Hilbertsche Funktionenraum L2 . . . . . . . . . 19.15 Vollständigkeit in L2 . . . . . . . . . . . . . . . . . . 19.16 Konvergenz . . . . . . . . . . . . . . . . . . . . . . . 19.17 Lineare Operatoren im Hilbertschen Funktionenraum 19.18 Nicht-Normierbare Basen . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . .
245 245 246 246 249 250 252 252 254 254 257 257 258 259 260 261 262 263 264
20 Grundlagen der Quantenmechanik 20.1 Zustände und Observable in der klassischen Mechanik 20.2 Postulate der Quantenmechanik . . . . . . . . . . . . . 20.3 Dynamik . . . . . . . . . . . . . . . . . . . . . . . . . . 20.4 Heisenberg-Bild . . . . . . . . . . . . . . . . . . . . . . 20.5 Schrödinger-Bild . . . . . . . . . . . . . . . . . . . . . 20.6 Energie-Eigenzustände . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
267 267 268 274 276 276 279
. . . .
. . . .
. . . .
. . . .
Inhaltsverzeichnis 21 Quantentheorie des Spins 21.1 Das Stern-Gerlach Experiment . . . . . 21.2 Der zweidimensionale Zustandsraum C2 21.3 Spin-Operatoren . . . . . . . . . . . . . 21.4 Spinpräzession . . . . . . . . . . . . . . 21.5 Allgemeinere Zwei-Zustandssysteme . . . 21.6 Photonen . . . . . . . . . . . . . . . . .
XVII
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
283 284 286 288 294 298 301
22 Quanteninformation und Verschränkung 305 22.1 Qubits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 22.2 Verschränkung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306 22.3 Die Bellsche Ungleichung . . . . . . . . . . . . . . . . . . . . . . . . . . 308 23 Der harmonische Oszillator 315 23.1 Energieeigenwerte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315 23.2 Zeitliche Entwicklung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322 23.3 Kohärente Zustände . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324 24 Orts24.1 24.2 24.3 24.4 24.5 24.6 24.7 24.8
und Impulsdarstellung Der Ortsoperator . . . . . . . . . . . . . . . . . . . . . . . . Translationen und der Impulsoperator . . . . . . . . . . . . Der Hamilton-Differentialoperator . . . . . . . . . . . . . . . Beispiel: Der harmonische Oszillator . . . . . . . . . . . . . Beispiel: Bahndrehimpuls . . . . . . . . . . . . . . . . . . . Beispiel: Starrer Rotator . . . . . . . . . . . . . . . . . . . . Impulsraum . . . . . . . . . . . . . . . . . . . . . . . . . . . Anhang: Polynommethode für den Harmonischen Oszillator
25 Der Dichteoperator 25.1 Der Dichteoperator für reine Zustände . . . . . . 25.2 Der Dichte-Operator für statistische Gemische . . 25.3 Dichtematrix für Spin- 12 -Systeme . . . . . . . . . 25.4 Eigenschaften der allgemeinen Dichtematrix . . . 25.5 Die Dichtematrix in der Ortsdarstellung . . . . . 25.6 Zeitliche Entwicklung eines gemischten Ensembles 25.7 Dichte-Operator für Teilsysteme . . . . . . . . . . 25.8 Von Neumansches Messpostulat . . . . . . . . . . 25.9 Dekohärenz . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
329 329 332 335 337 339 340 342 343
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
347 347 349 351 354 355 356 357 359 361
26 Die Feynmansche Quantenmechanik 363 26.1 Der Propagator . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363 27 Symmetrien in der Quantenmechanik 369 27.1 Das Wignersche Theorem . . . . . . . . . . . . . . . . . . . . . . . . . 369 27.2 Unitäre Transformationen . . . . . . . . . . . . . . . . . . . . . . . . . 370 27.3 Symmetrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372
XVIII 27.4 27.5 27.6 27.7 27.8 27.9 27.10 27.11
Inhaltsverzeichnis Drehungen in der klassischen Mechanik . Drehungen in der Quantenmechanik . . Observable und Drehungen . . . . . . . Drehimpuls-Vertauschungsrelationen . . Endliche Drehungen . . . . . . . . . . . Darstellungen von Spin- 12 -Systemen . . . Neutronen-Interferenz . . . . . . . . . . Drehinvarianz und Drehimpulserhaltung
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
374 376 376 378 379 380 382 384
28 Eigenwertproblem von Drehimpulsoperatoren 28.1 Drehimpuls-Eigenvektoren . . . . . . . . . . . 28.2 Leiteroperatoren . . . . . . . . . . . . . . . . 28.3 Eigenwerte von J 2 und Jz . . . . . . . . . . . 28.4 Bestimmung des Normierungsfaktors . . . . . 28.5 Matrixdarstellung des Drehoperators . . . . . 28.6 Drehmatrix und Euler-Winkel . . . . . . . . . 28.7 Entartungen . . . . . . . . . . . . . . . . . . . 28.8 Ganzzahlige und Halbzahlige j . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
385 385 386 387 388 389 390 391 392
29 Addition von Drehimpulsen 29.1 Produktraum . . . . . . . . . 29.2 Spin-Bahn-Kopplung . . . . . 29.3 Clebsch-Gordan-Koeffizienten 29.4 Zwei Spin- 12 -Systeme . . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
393 393 394 397 399
30 Bahndrehimpuls in der Ortsdarstellung 30.1 Bahndrehimpuls . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30.2 Drehimpuls-Eigenfunktionen . . . . . . . . . . . . . . . . . . . . . . . . 30.3 Bestimmung der Ylm (θ, φ) . . . . . . . . . . . . . . . . . . . . . . . . .
403 403 407 409
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . . . . . .
. . . .
. . . . . . . .
. . . .
. . . .
31 Das Wasserstoffatom 411 31.1 Zentralpotentiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 411 31.2 Das Wasserstoff-Atom . . . . . . . . . . . . . . . . . . . . . . . . . . . 413 32 Diskrete Symmetrien 417 32.1 Raumspiegelungen, Parität . . . . . . . . . . . . . . . . . . . . . . . . 417 32.2 Zeitumkehr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 422 33 Zeitunabhängige Störungstheorie 429 33.1 Nicht-Entarteter Fall . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429 33.2 Entartung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 432 34 Feinstruktur des Wasserstoffatoms 34.1 Spin-Bahn-Kopplung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34.2 Relativistische Korrektur . . . . . . . . . . . . . . . . . . . . . . . . . . 34.3 Darwin-Term . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
435 436 438 439
Inhaltsverzeichnis
XIX
35 Identische Teilchen 443 35.1 Permutationssymmetrie . . . . . . . . . . . . . . . . . . . . . . . . . . 443 35.2 Das Heliumatom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445 36 Quanten-Statistische Mechanik 36.1 Einführung . . . . . . . . . . . . . . . . . . . 36.2 Entropie . . . . . . . . . . . . . . . . . . . . . 36.3 Stationäre Ensembles . . . . . . . . . . . . . . 36.4 Systeme von nicht-wechselwirkenden Teilchen
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
451 451 453 455 462
37 Quantenfelder 469 37.1 Felder und Teilchen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 469 37.2 Quantisierung von Feldern . . . . . . . . . . . . . . . . . . . . . . . . . 471 37.3 Beobachtbarkeit, Realität und Vollständigkeit in der Quantentheorie . 482 Literatur Index
485 487
Kapitel 1
Newtonsche Mechanik 1.1
Kinematik
Das griechische Wort κινημα bedeutet Bewegung. In der modernen Physik bedeutet Kinematik die mathematische Beschreibung der zeitlichen Entwicklung der Raumpunkte, die ein physikalisches System einnimmt. Eine solche Beschreibung verlangt einen passenden mathematischen Rahmen von Raum und Zeit. In die klassische Mechanik gehen Annahmen über Raum und Zeit ein, die oft nicht explizit angegeben werden, da sie völlig unserer Intuition entsprechen und wir sie als selbstverständlich ansehen. Dazu gehört, dass der Raum dreidimensional und die Zeit eindimensional ist. Das Zeitintervall und der räumliche Abstand zwischen zwei Ereignissen sind für alle Beobachter gleich. Außerdem wird angenommen, dass Massenpunkte existieren, die sich auf wohldefinierten Bahnen bewegen. In späteren Kapiteln wird gezeigt, dass diese Annahmen bei großen Geschwindigkeiten und kleinen Abständen nicht zutreffen. Als realistisches Modell für den physikalischen Raum der Mechanik dient der dreidimensionale Euklidische Vektorraum.
1.2
Der reelle Vektorraum Rn
Eine einfache aber allgemeine Definition eines reellen Vektorraums lautet: Ein Vektorraum ist eine Menge von Objekten (Vektoren), die addiert werden und auf lineare Art mit reellen Zahlen multipliziert werden können, und die abgeschlossen ist unter diesen Operationen. Jeder Vektorraum hat einen Ursprung, d.h. einen Nullvektor. Der einfachste Vektorraum ist der Raum Rn , der gebildet wird durch die Menge aller geordneten n-Tupel (x1 , x2 , . . . , xn ) von reellen Zahlen. Für den Ortsraum der Mechanik ist n = 1, 2, 3. Wir schreiben für ein Element aus Rn x = (x1 , x2 , . . . , xn ). Die Zahlen xk werden als Komponenten des Vektors bezeichnet. Die folgenden Operationen sind in Rn definiert:
2
Kapitel 1. Newtonsche Mechanik
a) (assoziative und kommutative) Addition, x + y = (x1 + y1 , x2 + y2 , . . . , xn + yn ) b) Multiplikation mit einer reellen Zahl (Skalar), a x = (ax1 , ax2 , . . . , axn ). Rn ist abgeschlossen unter diesen Operationen, x, y ∈ Rn =⇒ z = x + y ∈ Rn , a x ∈ Rn , (Superpositionsprinzip). Es existiert ein Null-Vektor 0 = (0, 0, ...0) mit der Eigenschaft 0 + x = x. Zu jedem Element in x aus Rn existiert ein negatives Element (−x) in dem Sinne, dass (−x) + x = 0. R ist der Prototyp eines n-dimensionalen reellen Vektorraumes. Jeder n-dimensionale reelle Vektorraum ist isomorph zum Rn . n
Ein Grund, weshalb man manchmal lieber mit allgemeinen Vektorräumen (anstatt mit Rn ) arbeitet, ist, dass es oft von Vorteil ist koordinatenfrei zu arbeiten (d.h. nicht in einer festen Basis).
1.3
Euklidische Struktur
Die Euklidische Geometrie behandelt Entfernungen zwischen Punkten und Winkel zwischen Linien oder Vektoren. Zu diesem Zweck erhält der Vektorraum Rn zusätzliche Struktur. Ein Euklidischer Raum ist ein reeller Vektorraum Rn in dem zusätzlich ein Skalarprodukt definiert ist. Skalarprodukt: Das Skalarprodukt zwischen zwei Vektoren x, y∈ Rn ist definiert durch x∙y =
n X i=1
xi y i = x 1 y 1 + x 2 y 2 + ∙ ∙ ∙ + x n yn .
Das Ergebnis ist stets eine reelle Zahl. Zwei Vektoren x, y heißen orthogonal, d.h. stehen senkrecht aufeinander, wenn x ∙ y = 0.
Da das Skalarprodukt von x mit sich selbst stets nicht-negativ ist, können wir die „Länge“ oder den Betrag eines Vektors x definieren als v u n uX √ |x| = x ∙ x = t (xi )2 . i=1
1.3 Euklidische Struktur
3
Diese Längenfunktion erfüllt die Eigenschaften einer Norm und wird als Euklidische Norm bezeichnet. Das Skalarprodukt induziert also eine Norm in Rn Der Winkel θ (0 ≤ θ ≤ π) zwischen x und y ist definiert durch cos θ =
x∙y . |x| |y|
In drei Dimensionen kann man auch ein Vektor- oder Kreuzprodukt x × y definieren: x × y ist ein Vektor mit Betrag |x × y| = |x||y| sin θ und Richtung senkrecht zu x und y. Man kann die Norm verwenden, um eine Metrik (oder Abstandsfunktion) auf Rn zu definieren, v u n uX d(x, y) = |x − y| = t (xi − yi )2 . i=1
Diese Abstandsfunktion heißt Euklidische Metrik. Sie erfüllt die Axiome des Pythagoras, z.B. die Dreiecksungleichung d(x, y) ≤ d(x, z) + d(z, y).
Der reelle Vektorraum Rn mit Euklidischer Struktur heißt Euklidischer Raum und wird mit En bezeichnet. Die Euklidische Struktur macht En zu einem normierten Vektorraum, einem metrischen Raum und einem Hilbert-Raum. Es ist offensichtlich, dass man einen beliebigen Vektor x = (x1 , x2 , . . . , xn ) aus En als Superposition schreiben kann n X x= xi ei , i=1
mit
e1 = (1, 0, . . . , 0), e2 = (0, 1, . . . , 0), ....en = (0, 0, . . . , 1)
Man sagt, die Vektoren e1 , ...en spannen den Raum auf. Definition: Eine Basis ist eine Menge von linear unabhängigen orthonormierten Vektoren, die den Raum aufspannen. Die Vektoren e1 , ...en bilden also eine Basis in En . Sie erfüllen die Orthonormalitätsrelation ei ∙ ej = δij
wo δij das Kronecker-Deltasymbol ist, 1 δij = 0
für i = j für i = 6 j
4
Kapitel 1. Newtonsche Mechanik
Die Zahl n der Basisvektoren heißt Dimension von En . Es gibt viele Möglichkeiten für die Wahl der Basis. Jede Wahl definiert ein Koordinatensystem. Der Epsilon-Tensor: Das dreidimensionale Vektor- oder Kreuzprodukt kann auch in Komponenten geschrieben werden: 3 X (a × b)i = εijk aj bk ≡ εijk aj bk , j,k=1
wo wir die Einsteinsche Summenkonvention eingeführt haben, dass über doppelt vorkommende Indizes zu summieren ist. Der total antisymetrische Levy-Cività-Tensor ist definiert als +1 falls (i, j, k) eine gerade Permutationen von (1, 2, 3) ist −1 falls (i, j, k) eine ungerade Permutationen von (1, 2, 3) ist εijk = 0 sonst Für den Epsilon-Tensor gelten die nützlichen Identitäten: εijk εklm = δil δjm − δim δjl
und
εilk εjlk = 2δij .
Mit Hilfe dieser Formeln lassen sich alle Formeln der Vektorrechnung, wie a × (b × c) = b(a ∙ c) − c(a ∙ b), und der Vektoranalysis leicht ableiten.
1.4
Bewegung eines Massenpunktes
Die Position eines einzelnen Massenpunktes (oder Teilchens) wird durch einen Punkt x im dreidimensionalen Ortsraum, den wir mit dem E3 identifizieren, festgelegt. Diese Position kann sich mit der Zeit ändern, der Massenpunkt bewegt sich dann entlang einer Bahnkurve x(t) mit Geschwindigkeit x(t) ˙ und Beschleunigung x ¨(t). Notation: Die Position eines Massenpunktes zur Zeit t wird durch den Ortvektor x(t) beschrieben1 . In einem kartesischen Koordinatensystem verwenden wir für die Komponenten des Ortsvektors die äquivalenten Notationen (x(t), y(t), z(t)),
(x1 (t), x2 (t), x3 (t))
oder xi (t), i = 1, 2, 3 .
− Üblich ist auch die Schreibweise → x (t) für x(t). Die Ortsvektoren bilden den dreidimensionalen Vektorraum E3 mit dem Skalarprodukt: x∙ y = und der Norm 1
3 X i=1
xi yi = kxkkyk cos θ mit θ = ](x, y)
|x| = r Abstand vom Ursprung O
Um die Notation später bei der Relativitätstheorie und der Feldtheorie nicht ändern zu müssen, vermeiden wir das auch gebräuchliche r(t) für x(t).
1.5 Newtonsche Gesetze
5
Für die Geschwindigkeit schreiben wir entsprechend v(t) = x(t) ˙ ≡
dx(t) dxi , vi (t) = x˙ i = dt dt
und für die Beschleunigung a(t) = x ¨(t) ≡
d2 xi d2 x(t) , ai (t) = x ¨i = . 2 dt dt2
Zu einer gegebenen Zeit t wird ein Massenpunkt physikalisch charakterisiert durch seine Koordinaten x(t) und seine Masse m. Diese 4 Zahlen bestimmen aber noch nicht den Bewegungszustand des Massenpunktes, d.h. sie genügen noch nicht, den Ortsvektor des Massenpunktes zu einer zukünftigen Zeit vorherzusagen. Man würde denken, dass man zur Berechnung der Bewegung die Anfangsparameter sagen wir zur Zeit t = 0, d.h. die Position, x(0), die Geschwindigkeit x(0) ˙ (bzw. den Impuls p(0) ≡ m x(0)) ˙ und höhere Ableitungen angeben muss. Es stellt sich erstaunlicherweise heraus, dass die Dynamik der klassischen Mechanik, d.h. die Bewegungsgleichungen so beschaffen sind, dass der Bewegungszustand eines klassischen Massenpunktes eindeutig durch einen Punkt im 6-dimensionalen Phasenraum (x, p) festgelegt wird, wobei die zeitliche Entwicklung durch eine wohldefinierte eindeutige Trajektorie (x(t), p(t)) in diesem Phasenraum beschrieben wird.
1.5
Newtonsche Gesetze
Der traditionelle Ausgangspunkt der Mechanik sind die Newtonschen Bewegungsgleichungen: 1. Ein Massenpunkt verharrt im Zustand der Ruhe oder der geradlinig gleichförmiger Bewegung (v = konst.), solange keine Kraft auf ihn wirkt. 2. Wirkt auf einen Massenpunkt eine äußere Kraft F , so erfährt der Massenpunkt eine Beschleunigung x ¨, die sich bestimmt aus F =mx ¨, oder, mit der Definition des Impulses p ≡ mx, ˙ F = p˙ =
dp . dt
3. „actio est reactio“. Die Kraft eines Massenpunkt A auf ein Massenpunkt B ist ungekehrt gleich der Kraft des Massenpunkts B auf den Massenpunkt A. Die Begriffe Masse und Kraft sind in den Newtonschen Gleichungen nicht wirklich definiert. Hier sei angenommen, dass Masse und Kraft extern gegeben sind. Kraft und Impuls sind Vektoren, d.h. sie sind durch Betrag und Richtung festgelegt.
6
Kapitel 1. Newtonsche Mechanik
Inertialsystem: Gesetze 1. und 2. machen nur Sinn, wenn man angibt, in welchem Bezugssystem sie gelten. Newton nahm an, dass ein absoluter Raum existiert, in dem ein kräftefreier Massenpunkt sich mit konstanter Geschwindigkeit bewegt. Ein solches Inertialsystem wird durch das erste Gesetz definiert. Das zweite Gesetz gilt dann nur in den durch das erste Gesetz definierten Inertialsystemen. Der Fixsternhimmel ist in guter Näherung ein Inertialsystem. Ein festes Bezugssystem auf der Erde ist, wegen der beschleunigten Bewegung um die Sonne und der Erdrotation, weniger gut. Hat man ein Inertialsystem gefunden, dann gibt es unendlich viele andere, die sich relativ zu diesem mit konstanter Geschwindigkeit bewegen. Galilei-Transformationen: Die Newtonschen Gesetze sind kovariant, d.h. haben die gleiche Form unter folgenden Transformationen, • • • •
Translationen im Raum: x → x+a, wo a ein konstanter Vektor ist Translationen in der Zeit: t → t + c Rotation um einen konstanten Winkel: x → Rx Translationen im Raum mit konstanter Geschwindigkeit v 0 : x → x+v 0 t
Die Transformationen können auch kombiniert werden. Zur Demonstration betrachten wir die Bahn x(t) eines Massenpunktes in einem Inertialsystem K. In einem anderen Inertialsystem K 0 , das sich relativ zu K mit Geschwindigkeit v0 bewegt und dessen Ursprung sich zur Zeit t = 0 (vom System K aus gesehen) in x = x0 befindet, ist die Bahn x0 (t) = x(t) − v 0 ∙ t − x0 ,
t0 = t.
Diese Formeln heißen eigentliche Galilei-Transformation. Die Geschwindigkeit des Massenpunktes in K 0 ist d x0 (t) d x(t) = − v0. dt dt D.h. wir erhalten das übliche Gesetz für die Addition der Geschwindigkeiten v = v0 + v0 . Die Beschleunigung wird x ¨= x ¨0 , d.h. das Kraftgesetz bleibt gleich. Galileisches Relativitätsprinzip: Die Naturgesetze haben in allen Inertialsystemen die gleiche Form. Die Zeit ist in der Newtonschen Mechanik absolut in dem Sinne, dass Ereignisse, die gleichzeitig (bzw. vorher, nachher) in einem Inertialsystem sind, auch in allen anderen Koordinatensystemen gleichzeitig (bzw. vorher, nachher) bleiben.
1.6
Arbeit und Energie
Im Allgemeinen hängt die Kraft auf einen Massenpunkte vom Ort und der Zeit ab, man spricht von einem Kraftfeld F = F (x, t).
1.6 Arbeit und Energie
7
Sei F = F (x) nicht explizit zeitabhängig. Unter einer räumlich konstanten Kraft bewegt sich der Massenpunkt auf einer Geraden. Die geleistete Arbeit ist elementar definiert durch Arbeit = Kraf t ∙ W eg.
Wenn die Kraft auf den Massenpunkt von dessen Position abhängt, muss diese Definition präzisiert werden.
Abbildung 1.1: Die Bahn eines Massenpunktes
Die Arbeit, die von der Kraft F (x) geleistet wird, wenn sie den Massenpunkt von x1 = x(t1 ) nach x2 = x(t2 ) bewegt, ist anschaulich gegeben durch (s. Abb.1) das Integral längs der Bahn x(t Z 2) W12 ≡ F (x(t)) ∙ d x . x(t1 )
Für infinitesimal kleine Wege dx kann F (x) konstant angenommen werden und man hat wieder Kraf t ∙ W eg. Das Wegintegral kann mit Hilfe des 2. Newtonschen Gesetzes wie folgt umgeschrieben werden: W12 =
x(t Z 2)
F ( x(t)) ∙ d x =
x(t1 )
=
Z
2
(m
1
Zt2
t1
dv ) ∙ ( vdt) = m dt
F ( x(t)) ∙ Z
2 1
d x(t) dt dt
d 1 ( v ∙ v)dt dt 2
1 = m( v 22 − v 21 ) = T2 − T1 , 2 mit der Definition: T ≡ Damit gilt
1 mv 2 2
(1.1)
kinetische Energie.
¨ Arbeit = Anderung der kinetischen Energie .
Ein Vektorfeld heißt konservativ, wenn es nicht explizit zeitabhängig ist und das Wegintegral zwischen zwei Punkten x1 und x2 unabhängig vom Weg ist (s. Abb. 2).
8
Kapitel 1. Newtonsche Mechanik
Abbildung 1.2: Zwei mögliche Bahnen eines Massenpunktes
Für ein konservatives Vektorfeld verschwindet das Integral über einen geschlossenen Weg I F ∙d x=0 . Ein Vektorfeld ist genau dann konservativ, wenn es ein skalares Feld V (x) gibt mit F ( x) = − ∇V (x)
d.h.
Fi = −
∂ V, ∂xi
i = 1, 2, 3 .
Beweis (siehe z.B. Hohnerkamp 1993): Für solche Kräfte wird die Arbeit: W12 =
Z
2 1
F ∙d x=− =−
Z
Z
2
∇V ∙ d x = −
1 2
1
Z
2 1
∂V ∂V ∂V dx + dy + dz ∂x ∂y ∂z
(1.1)
dV = V1 − V2 = T2 − T1 ,
wo V1 ≡ V ( x(t1 )) etc. Damit gilt T1 + V 1 = T 2 + V2 . V heißt potentielle Energie und E = T + V Gesamtenergie. Energieerhaltung: Für konservative Kräfte ist die Gesamtenergie E = T + V erhalten (d.h. zeitlich konstant).
1.7
Zweikörpersystem
Wir betrachten den Fall zweier Massenpunkte a und b, zwischen denen eine Kraft wirkt. Die Bewegungsgleichung lautet in Abwesenheit von äußeren Kräften ma x ¨a = F ab ,
mb x ¨b = F ba ,
(1.2)
1.7 Zweikörpersystem
9
wo F ab = F ab (xa , xb ) die Kraft auf das Massenpunkt a durch den Massenpunkt b ist und F ba die Kraft auf b durch a. Nach dem dritten Newtonschen Gesetz ist F ba = −F ab .
(1.3)
Die Kräfte zwischen a und b mögen nur vom Abstand abhängen und in Richtung der Verbindungsgeraden wirken F ab (xa , xb ) = (xa − xb )f (|xa − xb |).
(1.4)
Die Gln. (1.2) sind zwei gekoppelte Differentialgleichungen 2. Ordnung. Um sie zu lösen, müssen sie entkoppelt werden. Dies lässt sich durch Einführung von Relativ- und Schwerpunktkoordinaten erreichen. Die Koordinate des Schwerpunkts des Systems ist definiert durch m a x a + m b xb . xCM = ma + m b Aus Gl. (1.2) und (1.3) folgt x ¨CM =
¨ a + mb x ¨b ma x F ab + F ba = =0. m a + mb ma + m b
(1.5)
D.h. der Schwerpunkt bewegt sich in Abwesenheit äußerer Kräfte wie ein kräftefreier Massenpunkt, unabhängig von der Kraft zwischen a und b. Da die Impulse der Massenpunkte durch pb = mb x˙ b pa = ma x˙ a , gegeben sind, folgt aus Gl. (1.5), dass der Gesamtimpuls P = p a + pb erhalten, d.h. zeitlich konstant ist, P˙ = 0. Wenn wir Relativkoordinaten x = (xa − xb ) und eine reduzierte Masse μ=
ma m b ma + m b
einführen, dann lautet die Bewegungsgleichung μ¨ x = xf (|x|) . Beweis: x ¨a =
F ab , ma
x ¨b =
F ba F ab =− mb mb
Wir bilden die Differenz 1 1 ma + mb + )F ab = ( )F ab ma mb ma mb 1 1 = (xa − xb )f (|xa − xb |) = xf (|x|). μ μ
¨b = ( x ¨a − x
(1.6)
10
Kapitel 1. Newtonsche Mechanik
Gl. (1.6) ist eine gewöhnliche Differentialgleichung 2. Ordnung in der Variablen x. Sie entspricht der Bewegungsgleichung eines Massenpunktes mit der Koordinate x und der Masse μ bei gegebener Kraft und lässt sich mit den gleichen Methoden lösen. Spezielle Fälle: a) ma = mb = m , dann ist μ = m/2. b) mb → ∞, dann ist μ = ma . Der Körper a bewegt sich um den ruhenden Körper b, da im Limes mb → ∞ der Schwerpunkt mit xb identisch ist. Die Bewegungsgleichungen für mechanische Systeme von drei und mehr Körpern können nicht mehr exakt gelöst werden. Es können nur Erhaltungssätze abgeleitet werden. In der Astronomie gibt es aber störungstheoretische Verfahren, die es z.B. erlauben, die Planetenbahnen beliebig genau zu berechen.
1.8
Systeme von mehreren Massenpunkten
Ausgedehnte mechanische Systeme lassen sich als Systeme von N Massenpunkten auffassen. Zur Festlegung der Lage eines solchen Systems müssen die N Ortsvektoren der Massenpunkte gegeben sein. Wir verwenden folgende Notation: N
Zahl der Massenpunkte
mn
Massen der Massenpunkte, n = 1...N
xn
Ortsvektor des Massenpunktes n
x˙ n
Geschwindigkeit des Massenpunkts n
Fn
äußere Kraft auf den Massenpunkt n
F nn0
Kraft auf den Massenpunkt n durch den Massenpunkt n0
Die Newtonschen Gleichungen ergeben ein System von gekoppelten Differentialgleichungen mn x ¨n = F n +
N X
F nn0 .
n0 =1 n0 6=n
Summiert man über alle Massenpunkte, so erhält man X n
mn x ¨n =
N X
Fn +
N X
F nn0 .
n,n0 =1 n0 6=n
n
Aus dem 3. Newtonschen Gesetz folgt F nn0 = −F n0 n
=⇒
N X
n,n0 n6=n0
F nn0 = 0.
(1.7)
1.8 Systeme von mehreren Massenpunkten
11
Damit reduzieren sich die Newtonschen Bewegungsgleichungen auf F =
N X
mn x ¨n ,
(1.8)
n=1
wo F ≡
PN
n=1
F n die äußere Gesamtkraft ist.
Schwerpunkt: P Für ein System von Massenpunkten der Gesamtmasse M = n mn definiert man den Schwerpunkt oder Massenmittelpunkt xCM (CM steht für centre of mass ) durch P 1 X n mn x n xCM = mn x n = P , (1.9) M n n mn oder
M xCM =
X
m n xn .
(1.10)
n
Dann gilt wegen Gl. (1.8) und dem 2. Newtonschen Gesetz X mn x ¨n = F . Mx ¨CM =
(1.11)
n
Schwerpunktsatz: Der Schwerpunkt eines Systems von Massenpunkten bewegt sich wie ein einzelner Massenpunkt der Masse M unter einer äußeren Gesamtkraft F . Anmerkung:RFür eine kontinuierliche Massenverteilung der Dichte %(x) und Gesamtmasse M = %( x)d3 x definiert man den Schwerpunkt durch R Z x%(x)d3 x 1 3 x%(x)d x = R . xCM ≡ M %(x)d3 x Gesamtimpuls: Wir definieren den Gesamtimpuls eines Systems von Massenpunkten durch X X P ≡ pn = mn x˙ n . n
n
Dann ist die zeitliche Änderung des Gesamtimpulses wegen Gl. (1.11) gleich der äußeren Gesamtkraft: X mn x ¨n = M x ¨CM = F P˙ = n
(1.11)
Impulssatz: Verschwindet die äußere Gesamtkraft, so ist der Gesamtimpuls erhalten (zeitlich konstant). Wenn die Summe der äußeren Kräfte verschwindet, dann gilt wie für den kräftefreien Massenpunkt P t. Mx ¨CM (t) = 0 oder xCM (t) = xCM (0) + M
12
Kapitel 1. Newtonsche Mechanik
Drehimpuls: Für ein einzelnes Massenpunkt definiert man den Drehimpuls um den Ursprung zu einer Zeit t: L(t) ≡ x(t) × p(t) = m x(t) × x(t) ˙ Die zeitliche Änderung des Drehimpulses ist dann ˙ ¨] = x × F ≡ N(t) , L(t) = m[ x˙ × x˙ + x × x | {z } =0
wo x × F ≡ N(t) als Drehmoment bezeichnet wird. Das Drehmoment N bewirkt eine Änderung des Drehimpulses, wie F eine Änderung des Impulses bewirkt. Für ein System von N Massenpunkten definiert man den Gesamtdrehimpuls um den Ursprung durch: N N X X L(t) ≡ Ln (t) = xn × p n n=1
n=1
Dann erhält man für die zeitliche Änderung des Gesamtdrehimpulses: ˙ = L
N X
n=1
xn × F n +
N X
n,n0 n6=n0
xn × F nn0 ,
mit den äußeren Kräften F n und den inneren Kräften F nn0 . Den zweiten Term kann man umschreiben in X
n,n0
xn × F nn0 =
1X 1X ( xn × F nn0 + xn0 × F n0 n ) = ( xn − xn0 ) × F nn0 , 2 2 0 0 n,n
n,n
P P da n,n0 xn × F nn0 = n,n0 xn0 × F n0 n (Umbenennung der Summationsindizes) und F nn0 = − F n0 n . Für Zentralkräfte ist F nn0 parallel zu ( xn − xn0 ), d.h. entlang der Verbindungslinie der Massenpunkte und ( xn − xn0 ) × F nn0 = 0 . Damit wird N N X X ~ . ~˙ = ~n ≡ N xn × F n = L N n=1
n=1
Für Zentralkräfte ist die Änderung des Gesamtdrehimpulses also allein durch das äußere Gesamtdrehmoment gegeben. Drehimpulssatz: Ist das Gesamtdrehmoment für ein System von Massenpunkten unter dem Einfluss von Zentralkräften gleich Null (abgeschlossenes System), so ist der Gesamtdrehimpuls des Systems erhalten.
1.8 Systeme von mehreren Massenpunkten
13
Energie eines Systems von Massenpunkten: Wir nehmen jetzt an, dass sich sowohl äußere als auch innere Kräfte in einem System von Massenpunkten durch zeitunabhängige Potentiale darstellen lassen, F n = −∇(n) Vn (x) äußere Kraft auf den Massenpunkt n F nn0 = −∇(n) Vnn0 (x, x0 ) Kraft auf den Massenpunkt n durch den Massenpunkt n0 . wo der Gradient ∇(n) = ∂x∂n , ∂y∂n , ∂z∂n auf die Koordinaten x des Massenpunkts n wirkt. Wir multiplizieren die Bewegungsgleichung Gl. (1.7) des Massenpunkts n mit x˙ n N X x˙ n mn x ¨n = x˙ n F n + x˙ n F nn0 . n0 =1 n0 6=n
Da
d dt V
(x(t)) =
dx d dt dx V
(x(t)) = −xF ˙ , erhalten wir N d d X d 1 Vnn0 . ( mn x˙ 2n ) = − Vn − dt 2 dt dt n0 =1 n0 6=n
Wir summieren jetzt über die N vollständigen Differentiale N N N X d X1 1 X Vn + Vnn0 ] = 0 . [ mn x˙ 2n + dt n 2 2 n0 ,n n
(1.12)
n0 6=n
Da der Ausdruck in der eckigen Klammer die Gesamtenergie ist, E=
N X 1 n
2
mn x˙ 2n +
N X n
Vn +
N 1 X Vnn0 , 2 n0 ,n
(1.13)
n0 6=n
folgt aus Gl. (1.12) der Energiesatz. Energiesatz: Sind die Potentiale eines Systems von Massenpunkten nicht explizit zeitabhängig, so bleibt die Gesamtenergie erhalten (zeitlich konstant). Anmerkung: Der Faktor 12 in letzten Term der Gl. (1.13) rührt daher, dass über die Indizes doppelt gezählt wird, z.B. für N = 2, 1 2
2 X
n0 =1,n=1 n0 6=n
Vnn0 =
1 [V12 + V21 ] = V12 , 2
da nach den 3. Newtonschen Gesetz V12 = V21 (bis auf eine irrelevante Konstante). Dies sieht man wie folgt F12 = −∇12 V12 = −F21 = −(−∇21 V21 ) = −(∇12 V21 ) → V12 = V21 .
14
Kapitel 1. Newtonsche Mechanik
Die potentielle Energie des Massenpunktepaares (1, 2) ist nur V12 . Das ist die Energie, die frei wird, wenn man die Massenpunkte nach ∞ gehen lässt. Wir haben die Erhaltungssätze für Energie, Impuls und Drehimpuls aus den Newtonschen Gleichungen abgeleitet. Wir werden später sehen, dass die Erhaltungssätze auf sehr allgemeinen Eigenschaften von Raum und Zeit beruhen. Die Erhaltungssätze haben aber auch praktischen Nutzen, sie liefern oft wichtige Informationen über die Dynamik von Systemen, deren vollständige Lösung zu kompliziert oder unmöglich ist.
Kapitel 2
Prinzipien der Mechanik 2.1
Einführung
Die in die Newtonsche Mechanik eingehenden messbaren physikalischen Größen oder Observable sind die Vektoren Kraft und Impuls. Dagegen postulierte Leibniz, dass sich die Mechanik aus einer skalaren Funktion, der vis viva oder lebendigen Kraft, ableiten lässt. Leibniz ersetzt den Newtonschen Impuls durch die kinetische Energie und die Newtonsche Kraft durch die Arbeit der Kraft. Bewegung beinhaltet stets eine Richtung. Es ist daher erstaunlich, dass ein Skalar die Bewegung, auch komplizierter Systeme, festlegen soll – allerdings auf der Basis eines Variationsprinzips nicht von Gleichungen. Leibniz gilt als Begründer der analytischen Mechanik, wenn auch über die genaue Formulierung des Prinzips lange gestritten wurde. Das zugehörige Prinzip wurde zuerst von Euler und Lagrange richtig formuliert. Wir betrachten zunächst die Bewegung eines Massepunktes bei Erhaltung der Energie T + V = E = konstant. Ein Massenpunkt befinde sich zur Zeit t1 am Punkt P1 und bewege sich mit gegebener (ortsabhängiger) Geschwindigkeit v und kinetischer Energie T = 12 mv 2 . Zur Zeit t2 befinde er sich am Punkt P2 (s. Abb. 2.1). Jeder Pfad von P1 nach P2 scheint möglich, solange nur v so bestimmt wird, dass die Gesamtenergie konstant ist. Um den „richtigen“ Pfad zu bestimmen, betrachten Euler und Lagrange das Zeitintegral der kinetischen Energie T über einen beliebigen Pfad von P1 nach P2 , Z t2 S= T dt , t1
das mit Wirkung bezeichnet wird. Die Wirkung wird für die gedachten Pfade im Allgemeinen verschieden sein.
Euler-Lagrangesches Prinzip der kleinsten Wirkung: Die vom Massenpunkt wirklich durchlaufene Trajektorie ist die mit der kleinsten Wirkung (Variationsprinzip).
16
Kapitel 2. Prinzipien der Mechanik
Abbildung 2.1: Mögliche Bahnen für die Bewegung eines Masasenpunktes vom Punkt P1 zum Punkt P2 .
Dieses Prinzip kann für eine beliebige Zahl von Teilchen und beliebig komplizierte mechanische Systeme verallgemeinert werden. Oft ist die Arbeit nicht nur eine Funktion des Ortes, sondern auch eine Funktion der Zeit. Dann ist die Energie E nicht erhalten. Man betrachtet alle Pfade, die in einem vorgegebenen Zeitintervall (t2 − t1 ) von einem (Raum-Zeit-) Punkt (P1 , t1 ) zu einem zweiten Punkt (P2 , t2 ) führen, d.h. die in der gegebenen Zeit t2 − t1 von P1 nach P2 führen. (Dies kann man beim Euler-Lagrange-Prinzip nicht verlangen, da die Enegieerhaltung die möglichen Bahnen einschränkt). Die Zeit, die das Teilchen auf den gedachten Pfaden von P1 nach P2 braucht, unterscheidet sich von der Zeit auf der wirklichen Bahn. Jetzt definiert man die Wirkung durch Z t2 dt(T − V ). S= t1
Die skalare Größe L ≡ T − V wird als Lagrange-Funktion bezeichnet. Hamiltonsches Prinzip: Die Wirkung nimmt für die wirklich angenommene Bahn ein Extremum (meist ein Minimum) an. Vorteile der Variationsformulierung: • Zwangsbedingungen können einfach eingebaut werden. • Der Übergang zur speziellen Relativitätstheorie, allgemeinen Relativitätstheorie und Quantenmechanik ist einfach. Die Relativitätstheorie verlangt, dass die Naturgesetze auf „kovariante“ Art, d.h. unabhängig von einem gegebenen Koordinatensystem, formuliert werden. Die Methoden der Variationsformulierung erfüllen automatisch diese Forderung, da sie auf Skalaren basieren. Das Variationsprinzip bleibt gültig, nur die Wirkung muss so geändert werden, dass sie invariant ist. • Die grundlegende Theorie der Elementarteilchen ist eine Feldtheorie. Der LagrangeFormalismus lässt sich auch hier anwenden. • Die Lagrangesche Mechanik folgt direkt aus der Feynmanschen Formulierung der Quantenmechanik mittels Pfadintegralen, wenn man das Plancksche Wirkungsquantum nach Null gehen lässt.
2.2 Zwangsbedingungen
2.2
17
Zwangsbedingungen
Zwangsbedingungen sind Bedingungen, die die Bewegung eines mechanischen Systems einschränken. Wir betrachten im Folgenden nur holonome Zwangsbedingungen, d.h. Bedingungen, die durch m unabhängige Gleichungen der Form fα (x1 , x2 , ...xN ; t) = 0, α = 1...m
(2.1)
gegeben sind, wo x1 , x2 , ...xN die Koordinaten der N Massenpunkte sind. Man unterscheidet zusätzlich, ob die Zwangsbedingungen zeitunabhängig (skleronom ) oder explizit zeitabhängig (rheonom) sind. Beispiele für nicht-holonome Zwangsbedingungen sind solche, die neben den Koordinaten auch Geschwindigkeiten enthalten oder in der Form von Ungleichungen gegeben sind. Typische Beispiele sind für holonome Zwangsbedingungen sind: a) Bei einem starrern Körper sind Abstände zwischen den Massenpunkten fest, d.h. es gilt die Zwangsbedingung | xm (t) − xn (t)| = konstant. b) Beim ebene Pendel findet die Bewegung nur auf einem Kreissegment statt. Zwangskräfte: Zwangskräfte sind die Kräfte, die die Massenpunkte auf der Bahn halten. Bei Problemen mit Zwangsbedingungen sind die Koordinaten nicht mehr unabhängig und die Zwangskräfte meist nicht explizit gegeben. Gesucht ist daher eine Formulierung der Mechanik, in der keine Zwangskräfte und nur unabhängige Koordinaten vorkommen. Generalisierte (verallgemeinerte) Koordinaten: Bei Systemen mit m holonomen Zwangsbedingungen kann man mit Hilfe der Gl. (2.1) m der Koordinaten eliminieren. Es werden, statt der 3N kartesischen Koordinaten, n = 3N − m unabhängige Koordinaten eingeführt, die die Konfiguration des mechanischen Systems eindeutig bestimmen. Man spricht von n Freiheitsgraden. Für ein N-Teilchensystem lautet der Zusammenhang zwischen den kartesischen und den generalisierten Koordinaten x1 = x1 (q1 , q2 , ....qn ; t) ..... xN = xN (q1 , q2 , ....qn ; t).
(2.2)
Die mögliche Zeitabhängigkeit erlaubt auch den Übergang auf bewegte Koordinatensysteme. Beispiele: a) Die Bewegung auf einer Kugeloberfläche wird beschrieben durch die Zwangsbedingung x2 +y 2 +z 2 = a2 . Hier wählt man als generalisierte Koordinaten die Polarwinkel q1 = θ, q2 = ϕ.
18
Kapitel 2. Prinzipien der Mechanik
b) Die Bewegung zweier fest verbundener Massenpunkte mit Koordinaten x1 und x2 (eine Hantel oder ein zweiatomiges Molekül) wird bestimmt durch die Zwangsbedingung (x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 = a2 .
D.h. nur 5 der 6 Koordinaten sind unabhängig. Wegen der Symmetrie der Hantel ist es nicht sinnvoll eine der 6 kartesischen Koordinaten zu eliminieren. Besser wäre es, die 3 kartesischen Koordinaten des Schwerpunktes und 2 Winkel, die die Orientierung der Achse im Raum beschreiben, zu verwenden. c) Bei einem starren Körper mit mehr als drei Massenpunkten wird die Lage durch 6 verallgemeinerte Koordinaten festgelegt, die drei Koordinaten des Schwerpunktes und drei Winkel, die die Orientierung des Körpers im Raum festlegen.
Konfigurationsraum: Die verallgemeinerten Koordinaten {q1 , q2 , ....qn } spannen einen n = 3N − m dimensionalen (kartesischen) Raum auf, der Konfigurationsraum genannt wird. Ein dynamisches System beschreibt eine Kurve q1 (t), q2 (t), ....qn (t) in diesem abstrakten Raum. Ein Punkt in diesem Raum charakterisiert einen möglichen Zustand (Konfiguration) des Systems. Zu einer gegebenen Zeit t wird das im Allgemeinen komplizierte mechanische System durch einen einzigen Punkt im Konfigurationsraum beschrieben. Anmerkung: Die Punkte im Konfigurationsraum bilden im Allgemeinen keinen Vektor, da die einzelnen Koordinaten verschiedene Dimension haben können (z.B. r, φ) und sich nicht addieren lassen.
2.3
Das Prinzip der virtuellen Arbeit
Virtuelle Verrückung: Eine virtuelle Verrückung ist eine infinitesimale Koordinatenänderung δxi , die instantan erfolgt (nur in Gedanken möglich) und die Zwangsbedingungen respektiert. Die Zahl der möglichen unabhängigen Verrückungen ist gleich der Zahl der Freiheitsgrade. Man beachte, dass die virtuellen Verrückungen von der Zeit t abhängen, δxi = δxi (t), was man sich veranschaulichen kann, wenn man beispielsweise die Bewegung eines Massenpunktes auf einer Kreisbahn betrachtet. Prinzip der virtuellen Arbeit der Zwangskräfte: Sei Z i die Zwangskraft auf den Massenpunkt i. Wir nehmen an, dass die virtuelle Arbeit der Zwangskräfte verschwindet, N X i=1
Z i ∙ δxi = 0 ,
(2.3)
Es handelt sich hier um ein (plausibles) Postulat, das sich nicht ableiten lässt. Dieses Prinzip sollte für statische und dynamische (d.h. nicht-statische) Systeme gelten, da die Verrückungen δxi mit den Zwangsbedingungen verträglich, d.h. senkrecht zu den Zwangskräften sein müssen. Aus Gl. (2.3) folgt nicht, dass die einzelnen Summanden gleich Null sein müssen, da die δxi nicht von einander unabhängig sind. Sie spannen
2.4 Statik (Systeme im Gleichgewicht)
19
nicht den ganzen 3N-dimensionalen Raum auf, sondern bei m Zwangsbedingungen nur einen n = 3N − m dimensionalen Unterraum, den Konfigurationsraum.
2.4
Statik (Systeme im Gleichgewicht)
Statik d.h. Gleichgewicht in der Newtonschen Mechanik bedeutet, dass die Gesamtkraft auf jeden Massenpunkt verschwindet, F total = F i + Z i = 0, für alle i = 1 bis N . i
(2.4)
Dabei sind Z i die im Allgemeinen unbekannten Zwangskräfte und F i die applizierten Kräfte. Damit lässt sich das Prinzip der virtuellen Arbeit auch wie folgt schreiben: Prinzip der virtuellen Arbeit: δW =
N X i=1
F i ∙ δxi = 0 ,
(2.5)
wo die δxi verträglich mit den Zwangsbedingungen sein müssen. Ein mechanisches System von N Massenpunkten befindet sich also genau dann im Gleichgewicht, wenn die virtuelle Arbeit der applizierten Kräfte (d.h. ohne die Zwangskräfte) verschwindet. Für ein System mit Zwangsbedingungen folgt daraus wieder nicht, dass F i = 0, da die δxi nicht unabhängig sind. Gl. (2.5) besagt einzig, dass F i senkrecht auf dem Unterraum, der durch die δxi aufgespannt wird, steht. Das Problem, dass die Summanden in Gl. (2.5) nicht einzeln gleich Null gesetzt werden dürfen, kann man umgehen, indem man zu geeigneten generalisierten Koordinaten übergeht. Für m holonome Zwangsbedingungen gilt xi = xi (q1 , ....qn ; t)
i = 1...N, n = 3N − m.
(2.6)
Damit werden die virtuellen Verrückungen δxi =
n X ∂xi j=1
∂qj
i = 1...N,
δqj
(2.7)
(δt tritt nicht auf, da t = konst. für virtuelle Verrückungen). Einsetzen in 2.5 ergibt δW =
N n X X j=1 i=1
Fi ∙
∂xi δqj = 0. ∂qj
(2.8)
Da die δqj jetzt unabhängig sind, kann man die einzelnen Terme gleich Null setzen F˜j ≡
N X i=1
Fi ∙
∂xi =0 ∂qj
j = 1...n.
(2.9)
Die F˜j heißen verallgemeinerte Kräfte. Im Allgemeinen haben sie nicht die Dimension einer Kraft, genau wie die qj nicht die Dimension einer Länge besitzen müssen.
20
Kapitel 2. Prinzipien der Mechanik
Bemerkung: das Prinzip der virtuellen Arbeit ist allgemeiner als das verwandte III. Newtonsche Gesetz, es kann nicht daraus abgeleitet werden. Mit Hilfe dieses Prinzips lassen sich die Gleichgewichtslagen beliebig komplizierter mechanischer Systeme berechnen. Konservative Kräfte sind dadurch definiert, dass sich die Kräfte als Gradient einer zeitunabhängigen skalaren Funktion (Potential) schreiben lassen F i (x) = − ∇i V (x),
i = 1...N ,
(2.10)
wo F i (x) für F i (x1 ... xN ) steht.
Für holonome Zwangsbedingungen kann man aus Gl. (2.9) die verallgemeinerte Kraft direkt berechnen, N X ∂xi ∂V (q) F˜j = −(∇i V (x)) ∙ =− ∂q ∂qj j i=1
∂V (q) F˜j = − , j = 1...n (2.11) ∂qj ohne den Umweg über die virtuelle Arbeit. Die Gleichgewichtsbedingung δW = 0 bedeutet für konservative Kräfte, dass das Potential V (q) ein Extremum hat, ein Minimum, wenn das Gleichgewicht stabil sein soll. Beispiel: Ein Stab AC ist im Punkt A drehbar gelagert (Scharnier). Im Punkt B wirke die nach unten gerichtete Kraft P , die durch eine, in C senkrecht nach oben angreifende Kraft Q im Gleichgewicht gehalten wird. Gesucht seien die virtuellen Verrückungen und die Gleichgewichtsbedingung für P und Q, die aus dem Prinzip der virtuellen Arbeit folgen. Es gibt einen unabhängigen Freiheitsgrad, den Drehwinkel α. Wir entnehmen der Abbildung, dass die Zwangsbedingung y = δαx ist. Wählen wir y als verallgemeinerte Koordinate, so ergibt sich für die virtuellen Verrückungen δy1 ' a tan(δα), δy2 ' (a + b) tan(δα),
wo a = AB, b = BC. Das Prinzip der virtuellen Arbeit lautet dann a −P δy1 + Qδy2 = 0 ⇒ Q = P. a+b
Abbildung 2.2: Ein am Punkt A gelagerter Stab
2.5 Das d’Alembertsche Prinzip (Dynamik)
2.5
21
Das d’Alembertsche Prinzip (Dynamik)
D’Alembert gelang es mit einem einfachen, aber genialen Trick das Prinzip der virtuellen Arbeit auf die Dynamik zu übertragen. Ausgangspunkt sind die Newtonschen Bewegungsgleichungen, die besagen, dass die Beschleunigung der Massenpunkte durch die Gesamtkraft F total verursacht wird, = F i + Z i = mi ai , für alle i = 1 bis N , F total i
(2.12)
wo Z i die Zwangskräfte sind. Das Prinzip der virtuellen Arbeit (in der ersten Form), das PN nur die Zwangskräfte involviert, ist nach Gl. (2.3) durch i=1 Z i ∙ δxi = 0 gegeben. Dieses Prinzip sollte auch für dynamische (d.h. nicht-statische) Systeme gelten, da Verrückungen instantan erfolgen und die δxi mit den Zwangsbedingungen verträglich sein, d.h. senkrecht zu den Zwangskräften stehen müssen. Setzt man aus Gl. (2.12) für PN Z i ein, dann lautet das Prinzip i=1 ( F i − mi ai ) ∙ δxi = 0 für jede gegebene Zeit t. Also genauer N X [ F i (t) − mi ai (t)] ∙ δxi = 0. (2.13) i=1
Die meist unbekannten Zwangskräfte scheinen im Prinzip der virtuellen Arbeit nicht mehr auf. Man kann −mi ai als Trägheitskraft auffassen. Die applizierte Kraft F i (t) wirkt meist nur auf einige Punkte, während die Trägheitskraft auf alle Massenpunkte wirkt, die beschleunigt werden. Mit Gl. (2.13) hat man praktisch die Dynamik auf die Statik zurückgeführt. Dies war nur möglich, weil die virtuellen Verrückungen instantan erfolgen, d.h. zu einer definitiven Zeit. Die zeitliche Entwicklung macht sich erst bemerkbar, wenn man das Prinzip verwendet, um die Bewegungsgleichungen eines mechanischen Systems aufzustellen und diese anschließend löst. Dazu muss man wieder zu unabhängigen generalisierten Koordinaten übergehen. Beispiel: Bewegung eines Massenpunktes in einem Kreiskegel. Der Kreiskegel habe einen Öffnungswinkel α. Zur Ableitung der Bewegungsgleichung verwenden wir das D’Alembertsche Prinzip, (−mgez − m¨ x) ∙ δx = 0 , oder
..
..
..
m[xδx + yδy + (z + g)δz] = 0 .
(2.14)
Die virtuellen Verrückungen δx, δy, δz sind nicht unabhängig. Sie müssen im Einklang mit den Zwangsbedingungen stehen. Wir wählen zunächst dem Problem angepasste Koordinaten. Dies sind hier Zylinderkoordinaten ρ, z, ϕ, (x, y, z) = (ρ cos ϕ, ρ sin ϕ, z). In diesen Koordinaten lautet die Zwangsbedingung: tan α =
ρ z
oder
z = ρ cot α .
22
Kapitel 2. Prinzipien der Mechanik
Abbildung 2.3: Bewegung auf einem Kreiskegel
Nur zwei Koordinaten sind also unabhängig, z.B. ρ, ϕ, d.h. wir wählen als generalisierte Koordinaten q1 = ρ, q2 = ϕ . Damit werden die virtuellen Verrückungen δx = δρ cos ϕ − ρ sin ϕδϕ δy = δρ sin ϕ + ρ cos ϕδϕ δz = δρ cot α
( α fest ).
Einsetzen in Gl. (2.14) ergibt . .
..
.
.2
[2ρϕ + ρϕ]ρδϕ + [(tan α + cot α)ρ − ρϕ tan α + g] cot α δρ = 0. Die beiden Ausdrücke in den eckigen Klammern sind separat gleich Null, da δρ und δϕ unabhängig sind. Wir erhalten also als Bewegungsgleichungen zwei gekoppelte Differentialgleichungen zweiter Ordnung. Auf deren Lösung soll hier nicht eingegangen werden. Rechnerische Details: (x, y, z) = (ρ cos ϕ, ρ sin ϕ, ρ cot α) (x, ˙ y, ˙ z) ˙ = (ρ˙ cos ϕ − ρ sin ϕϕ, ˙ ρ˙ sin ϕ + ρ cos ϕϕ, ˙ ρ˙ cot α)
¨ (¨ x, y¨, z¨) = (¨ ρ cos ϕ − 2ρ˙ sin ϕϕ˙ − ρ cos ϕϕ˙ 2 − ρ sin ϕϕ,
ρ¨ sin ϕ + 2ρ˙ cos ϕϕ˙ − ρ sin ϕϕ˙ 2 + ρ cos ϕϕ, ¨ ρ¨ cot α)
Anmerkung: Wenn die Zwangskräfte auch noch gefragt sind, so kann man zu ihrer Berechnung die Newtonschen Gleichungen verwenden, Z i = mi ai − F i , für alle i = 1 bis N .
2.6 Variation einer Funktion
2.6
23
Variation einer Funktion
Die Variation einer Funktion q(t) ist definiert durch: q(t) → q(t) + δq(t) ,
(2.15)
wo δq(t) die infinitesimale Änderung der Funktion am Punkt t ist. Die unabhängige Variable t nimmt am Variationsprozess nicht teil. Die Variation δq(t) entspricht den oben eingeführten virtuellen Verrückungen. (Man betrachte zum Vergleich die gewöhnliche Ableitung: dq = q(t + dt) − q(t), die die infinitesimale Änderung einer gegebenen Funktion q(t) bei einer Änderung t → t + dt der unabhängigen Variablen ist). Wir schreiben explizit q(t, α) = q(t, 0) + αη(t) ,
(2.16)
wo η(t) eine beliebige Funktion ist, und α ein kleiner Parameter, der nach Null geht, und q(t, 0) = q(t). Dann ist die Variation definiert durch δq ≡ q(t, α) − q(t, 0) = αη(t) . Die Ableitung nach der Zeit wird entsprechend δ q˙ ≡ q(t, ˙ α) − q(t, ˙ 0) = =α
dη dq(t, 0) dq(t, 0) +α − dt dt dt
dη d = δq . dt dt
Variation und Differentiation vertauschen somit. Als Nächstes betrachten wir das Integral über eine Funktion F (q, q; ˙ t): I[q] =
Z
t2
F (q, q; ˙ t)dt .
t1
Man bezeichnet die Zahl I[q], die davon abhängt, über welche Funktion q(t) integriert wird, als Funktional. Die Variation des Funktionals I[q] ist definiert als δI[q] ≡ δ = = =
Z
Z
t2
t1 t2
t1 Z t2 t1 Z t2
F (q, q; ˙ t)dt = I[q(α)] − I[q(0)]
F (q(t, α), q(t, ˙ α); t)dt −
Z
t2
F (q(t), q(t); ˙ t)dt
t1
[F (q(t, α), q(t, ˙ α); t) − F (q(t), q(t); ˙ t)]dt δF (q, q; ˙ t)dt .
t1
Es vertauschen also auch Variation und Integration.
24
2.7
Kapitel 2. Prinzipien der Mechanik
Das Hamiltonsche Prinzip
Ausgangspunkt ist eine Anfangskonfiguration x(t1 ) eines Systems von N Massenpunkten und eine Endkonfiguration x(t2 ), wo x(t) für (x1 (t), x2 (t), ...xN (t)) steht. Wir betrachten eine beliebige Trajektorie x(t), die Angangs- und Endpunkt verbindet. Dann ist die Wirkung definiert durch S[x] =
Z
t2
L(x, x; ˙ t) dt.
t1
Das Hamiltonsche Prinzip lautet: δ
Z
t2
L(x, x; ˙ t) dt = 0 .
(2.17)
t1
Das Hamiltonsche Prinzip besagt also, dass die Wirkung stationär ist und heißt daher auch Prinzip der stationären (kleinsten) Wirkung. Während sich die Newtonschen Gleichungen oder das D’Alembertsche Prinzip auf die einzelnen Massenpunkte für jeden einzelnen Zeitpunkt bezieht, bezieht sich das Hamiltonsche Prinzip auf das ganze System und auf die gesamte Zeit der Bewegung. Wir wollen jetzt das Hamiltonsche Prinzip aus dem D’Alembertsche Prinzip ableiten. Die virtuellen Verrückungen δxi im D’Alembertsche Prinzip müssen im Einklang mit den Zwangsbedingungen erfolgen und sind daher nicht unabhängig. Das D’Alembertsche Prinzip ist eine Aussage über eine Differentialform, die selbst für konservative Kräfte nicht als totales Differential geschrieben werden kann. Es lässt sich nicht aus einer einzigen skalaren Funktion ableiten. Die virtuelle Arbeit der Trägheitskraft muss immer für jedes Teilchen separat berechnet werden. Hamilton zeigte als Erster, dass man ein totales Differential erhält, wenn man über die Zeit integriert. Damit wird aus dem D’Alembertschen Prinzip 0=
Z
N t2 X
t1
i=1
(F i − mi ai ) ∙ δxi dt .
(2.18)
Für konservative applizierte Kräfte, F i = −∇i V (x1 , ....xN ; t) (wir erlauben hier auch eine explizite Zeitabhängigkeit), kann der erste Term der rechten Seite geschrieben werden als Z
N t2 X
t1
i=1
F i ∙ δxi dt = − =−
Z
Z
N t2 X
t1
t2 t1
i=1
∇i V (x1 , ....xN ; t) ∙ δxi dt
δV dt = −δ
Z
t2
V dt . t1
(2.19)
2.7 Das Hamiltonsche Prinzip
25
Der zweite Term in Gl. (2.18) kann partiell integriert werden, Z t2 Z t2 dv i mai ∙ δxi dt = m ∙ δxi dt dt t1 t1 Z t1 Z t2 d d = m v i ∙ δxi dt [(mv i ∙ δxi )] dt − dt t1 dt t1 Z t2 t mv i ∙ δ v i dt = [(mv i ∙ δxi )]t21 − t1
t
= [(mv i ∙ δ xi )]t21 −
Z
t
= [(mv i ∙ δxi )]t21 − δ
1 mδ(v i ∙ v i ) dt 2
t2
t1
Z
t2 t1
1 mv 2 dt 2 i
Wir erhalten also für Gl. (2.19) 0=δ
Z
N t2 X
t1
i=1
1 mv 2 dt − δ 2 i
Z
t2
V dt −
t1
N X i=1
t
[(mv i ∙ δxi )]t21 . .
Als Nächstes definieren wir die Lagrange-Funktion L(xi , x˙ i ; t) durch L=T −V mit T =
N X 1 i=1
2
(2.20)
mvi2 .
Die Funktion L, definiert als Überschuss der kinetischen über der potentiellen Energie, stellt eine der fundamentalsten Größen der theoretischen Physik dar. Mit dieser Definition ergibt sich aus dem D’Alembertschen Prinzip 0=δ
Z
t2 t1
L dt −
N X i=1
t
[(mv i ∙ δxi )]t21 .
Bis hierher waren die virtuellen Verrückungen δxi im Einklang mit den Zwangsbedingungen, aber ansonsten beliebig. Wir verlangen jetzt, dass sie an den Grenzen t1 und t2 verschwinden, δxi (t1 ) = δxi (t2 ) = 0. Wir halten also Anfangs- und Endpunkt der Teilchenbahnen fest. Dann erhalten wir das Hamiltonsche Prinzip Gl. (2.17). Das Hamiltonsche Prinzip wurde hier für konservativen Kräfte, die auch zeitabhängig sein können, abgeleitet. Die unterschiedlichen benachbarten Bahnkurven, unter denen die mit der kleinsten Wirkung gesucht wird, müssen mit den Zwangsbedingungen verträglich sein. Mögliche Zwangsbedingungen erscheinen aber nicht explizit und müssen
26
Kapitel 2. Prinzipien der Mechanik
zusätzlich gefordert werden. Holonome Zwangsbedingungen können allerdings direkt eingebaut werden, sofern sich die verallgemeinerten Koordinaten angeben lassen. Der Übergang zu verallgemeinerten Koordinaten ist nur eine Koordinatentransformation, unter der das Hamiltonsche Prinzip gleich bleibt, da L ein Skalar ist und die Koordinaten in der Forderung der stationären Wirkung nicht explizit vorkommen. In anderen Worten, bei der Berechnung des Minimums der Wirkung spielt es keine Rolle, in welchem Koordinatensystem wir die Wirkung berechnen. Für m holonome Zwangsbedingungen und n = 3N − m unabhängige generalisierte Koordinaten qj ( x1 , .... xN ; t) lautet dann das Hamiltonsche Prinzip δ
Z
t2
L(q1 , ....qn ; q˙1 , ....q˙n ; t)dt = 0 ,
(2.21)
t1
wobei die Anfangspunkte qj (t1 ) und Endpunkte qj (t2 ) festgehalten werden.
2.8
Anhang: Das totale Differential
Gegeben sei die Differentialform u(x, y)dx + v(x, y)dy. Wenn dieser Ausdruck das totale Differential einer Funktion f (x, y) sein soll, dann muss gelten ∂f ∂f df = dx + dy, ∂x ∂y mit
∂f = u(x, y), ∂x
∂f = v(x, y). ∂y
Es folgt daraus die notwendige (und für einfach zusammenhängende Gebiete auch hinreichende) Bedingung ∂v ∂u = ∂y ∂x Beispiel:
u(x, y)dx + v(x, y)dy = (x2 + 2xy)dx + (y 4 + λx2 )dy
(2.22)
∂u ∂v = 2x, = 2λx. ∂y ∂x D.h. Gl. (2.22) ist nur für λ = 1 ein totales Differential. In drei Dimensionen lauten die Bedingungen dafür, dass u(x, y, z)dx + v(x, y, z)dy + w(x, y, z)dz ein totales Differential ist: ∂v ∂u ∂w ∂v ∂w ∂u = , = , = . ∂y ∂x ∂z ∂x ∂z ∂y
(2.23)
2.8 Anhang: Das totale Differential
27
Bedeutung: Sei f (x) eine skalare Funktion, dann ist df = F ∙ dx mit F = ∇f ein totales Differential. D.h. das Linienintegral Zx1 Zx1 F ∙ dx = df = f (x1 ) − f (x0 )
x0
x0
ist unabhängig vom Weg. Ist umgekehrt das Kurvenintegral vom Weg unabhängig, dann definiert es eine skalare Funktion Zx F ∙ dx , f (x) = x0
so dass F = ∇f.
Für ein einfach zusammenhängendes Gebiet sind folgende Aussagen äquivalent: Zx1 F ∙ dx
x0
wegunabhängig
⇐⇒ ⇐⇒
F ∙ dx totales Differential F = ∇f ⇐⇒ ∇×F = 0
Die Bedingungen Gl. (2.23) entsprechen der Forderung, dass ∇×F = 0.
Kapitel 3
Die Lagrangeschen Bewegungsgleichungen 3.1
Die Lagrangeschen Gleichungen
Wir betrachten zunächst ein mechanisches System mit nur einem Freiheitsgrad, L = L(q, q, ˙ t). Nach dem Hamiltonschen Prinzip nimmt das Wirkungsfunktional bei festgehaltenen Endpunkten δq(t1 ) = δq(t2 ) = 0 auf der real angenommenen Teilchenbahn ein Minimum (genauer ein Extremum) an, Z t2 Z t2 L(q, q, ˙ t)dt = δL(q, q, ˙ t)dt = 0 . (3.1) δS[q] = δ t1
t1
Die Variation der Bahn q(t) war definiert durch:
q(t) → q(t) + δq(t) ,
wo δq(t) die infinitesimale Änderung der Funktion am Punkt t ist. Wir schreiben wieder explizit q(t, α) = q(t, 0) + αη(t) , wo η(t) eine beliebige Funktion ist, α ein kleiner Parameter, der nach Null geht, und q(t, 0) = q(t). Für die Bestimmung von δS brauchen wir daher die Variation der Lagrangefunktion. Dazu führen wir eine Taylor-Entwicklung aus, δL(q, q, ˙ t) = L(q + αη, q˙ + αη; ˙ t) − L(q, q; ˙ t) ∂L ∂L = α( η+ η) ˙ + O(α2 ) . ∂q ∂ q˙
(3.2)
Da α → 0, vernachlässigen wir Terme O(α2 ). Zur Erinnerung, die Taylor-Entwicklung für 2 Variablen lautet: ∂ ∂ f (x + ε, y + σ) = f (x, y) + ε f (x, y) + σ f (x, y) + O(ε2 , εσ, σ 2 ) ∂x ∂y
30
Kapitel 3. Die Lagrangeschen Bewegungsgleichungen
Wir können jetzt die Variation der Wirkung ausrechnen. Sei q(t) die Funktion, die S zu einem Minimum macht. Die Wirkung für die Scharen der benachbarten Teilchenbahnen lautet: Z S(α) =
t2
L(q(t, α), q(t, ˙ α); t)dt
t1
Für die Variation der Wirkung erhalten wir dann mit Gl. (3.2) Z t2 Z t2 ∂L ∂L δS = δ Ldt = α ( η+ η)dt. ˙ ∂q ∂ q˙ t1 t1
Eine partielle Integration des 2. Terms der rechten Seite ergibt t Z t2 Z t2 ∂L d ∂L ∂L 2 [ ( η]dt ˙ =− )ηdt + η . dt ∂ q˙ ∂ q˙ t1 t1 ∂ q˙ t1
(3.3)
Bei festgehaltenen q(t1 ) und q(t2 ), ist η(t1 ) = η(t2 ) = 0, so dass der letzte Term verschwindet. Damit geht das Hamiltonsche Prinzip über in Z t2 ∂L d ∂L δS = α [ − ]ηdt = 0. dt ∂ q˙ t1 ∂q Da η(t) eine beliebige Funktion ist, muss gelten d ∂L ∂L − =0. ∂q dt ∂ q˙
(3.4)
Dies ist die Lagrangesche Gleichung, in der Mathematik auch Euler-LagrangeGleichung genannt. Für Systeme mit holonomen Zwangsbedingungen lautet das Hamiltonsche Prinzip in unabhängigen generalisierten Koordinaten Z t2 L(q1 , ....qn ; q˙1 , ....q˙n ; t)dt = 0 . δ t1
Die Ableitung der Lagrangeschen Gleichungen kann in diesem Fall wie oben erfolgen, da die qi unabhängig variiert werden können. Für ein System von N Teilchen und m Zwangsbedingungen erhält man: ∂L d ∂L − = 0, i = 1...n , ∂qi dt ∂ q˙i
(3.5)
wo n = 3N − m ist. Die Lagrangeschen Gleichungen, die aus dem Hamiltonschen Prinzip der kleinsten Wirkung folgen, bilden ein System von n gekoppelten Differentialgleichungen. Zusammenhang mit der Newtonschen Bewegungsgleichung: Betrachte die Lagrangefunktion eines Systems von Massenpunkten ohne Zwangsbedingungen N X 1 ma x˙ 2a − V (x1 , ....xN ; t) . L= 2 a=1
3.2 Forminvarianz der Lagrangeschen Gleichungen
31
Die Lagrangeschen Bewegungsgleichungen lauten ∂L d ∂L = , dt ∂ x˙ a ∂xa oder ma
d ∂V = −∇a V, x˙ a = − dt ∂xa
(3.6)
mit der Notation: ∂ ∂ ∂ ∂ =∇=( , , ) ∂x ∂x ∂y ∂z ∂ ∂ ∂ ∂ =( , , ). ∂ x˙ ∂ x˙ ∂ y˙ ∂ z˙
Gradient
Da die Kraft durch F a = −∇a V gegeben ist, sind die Gleichungen (3.6) identisch mit den Newtonschen Bewegungsgleichungen. Nachdem wir die Äquivalenz mit der Newtonschen Mechanik gezeigt haben, können wir das Hamiltonsche Prinzip auch als Ausgangspunkt der klassischen Mechanik auffassen. Für die Lösung eines bestimmten mechanischen Problems müssen wir, statt der Kräfte, nur die Lagrangefunktion angeben.
3.2
Forminvarianz der Lagrangeschen Gleichungen
Die Lagrangefunktion L = L(q, p; t) führt mit Hilfe des Hamiltonschen Prinzips der kleinsten Wirkung Z t2 L(q(t), q(t); ˙ t)dt = 0 δ t1
auf die Bewegungsgleichung
∂L d ∂L − =0. ∂q dt ∂ q˙
(3.7)
Es ist anschaulich klar, dass das Problem der Minimierung eines Wegintegrals zwischen zwei festen Punkten unabhängig von der Wahl eines Koordinatensystems ist. Explizit können wir dies zeigen, wenn wir folgende Punkttransformationen zwischen zwei Systemen von generalisierten Koordinaten betrachten: qi → Qi = Qi (q, t)
(3.8)
Diese Abbildungen sollen umkehrbar und stetig differenzierbar sein (Diffeomorphismen), qi = qi (Q, t) . Sie beschreiben z.B. den Übergang von kartesischen auf krummlinige Koordinaten, oder von einem Inertialsystem auf Nicht-Inertialsysteme (z.B. rotierende Koordinatensysteme). Unter dieser Ersetzung ändert sich die Lagrangefunktion in ˉ ˙ t) ≡ L(q(Q; t), q(Q; L(Q, Q; ˙ t); t) ,
32
Kapitel 3. Die Lagrangeschen Bewegungsgleichungen
mit
n
q˙i (Q; t) =
∂qi (Q, t) X ˙ ∂qi Qj . + ∂t ∂Qj j=1
Wenn die Wirkung ein Extremum haben soll, Z t2 ˉ δ L(q(Q; t), q(Q; ˙ t); t)dt = 0 , t1
dann ergeben sich in den neuen Koordinaten Lagragesche Gleichungen, ˉ ˙ t) ˉ ˙ t) d ∂ L(Q, Q; ∂ L(Q, Q; − =0, ˙ ∂Qi dt ∂ Qi
(3.9)
die genauso aussehen wie die ursprünglichen. Unter solchen Transformationen sind die Lagrangeschen Gleichungen also forminvariant. Die sich aus Gl. (3.9) ergebenden expliziten Bewegungsgleichungen haben dagegen im Allgemeinen verschiedene Form. Die Lagrangeschen Gleichungen stellen das erste Beispiel eines Invarianzprinzips dar, das in der Mathematik und Physik seit dem 19. Jahrhundert eine fundamentale Rolle spielt. Die Lagrangefunktion eines gegeben physikalischen Systems ist nicht eindeutig. Um das zu sehen, betrachten wir eine Lagrangefunktion L0 mit L0 = L +
d f (q, t) . dt
(3.10)
Dann wird S0 = = und
Z
Z
t2 t1 t2 t1
L0 dt =
Z
t2 t1
(L +
d f )dt dt
Ldt + f (q(t), t)|tt21
δS 0 = δS + δf (q, t)|tt21 = δS + f 0 (q, t)δq|tt21 = δS ,
für δq(t1 ) = δq(t2 ) = 0. Die Wirkung S 0 führt also auf dasselbe Hamilton-Prinzip wie S, d.h. auch auf dieselben Bewegungsgleichungen. Ändert sich die Lagrange-Funktion nur um eine totale Zeitableitung einer Ortsfunktion, so bleiben die Lagrangeschen Bewegungsgleichungen ungeändert. Man bezeichnet eine solche Transformation auch als mechanische Eichtransformation.
3.3
Beispiele
Beispiel 1: Zentralkraft in zwei Dimensionen Die Bewegung eines Massenpunktes unter einer Zentralkraft wird durch die LagrangeFunktion 1 L = mx˙ 2 − V (r) mit r = |x| 2
3.3 Beispiele
33
beschrieben. Diese Lagrange-Funktion ist drehinvariant, da sich die Länge oder der Betrag eines Vektors bei einer Drehung nicht ändert. Es ist daher günstig, in ebenen Polarkoordinaten zu rechnen: x = r cos θ, y = r sin θ,
x˙ = r˙ cos θ − r sin θθ˙
y˙ = r˙ sin θ + r cos θθ˙
Damit lautet die Lagrange-Funktion 1 mx˙ 2 − V (r) 2 i 1 h ˙ 2 − V (r) ˙ 2 + (r˙ sin θ + r cos θθ) = m (r˙ cos θ − r sin θθ) 2 i 1 h = m r˙ 2 + r2 θ˙2 − V (r) . 2
L=
Für die 2 Freiheitsgrade erhalten wir zwei Lagrangesche Gleichungen ∂L d ∂L = dt ∂ r˙ ∂r d ∂L ∂L = dt ∂ θ˙ ∂θ
→ →
d d (mr) ˙ = mrθ˙2 − V (r) dt dr d ˙ = 0. (mr 2 θ) dt
Der Drehimpuls l ≡ mr 2 θ˙ ist also zeitlich konstant. Dies folgt aus der Tatsache, dass die Lagrange-Funktion für Zentralkräfte nicht vom Polarwinkel abhängt. Aus der 1. Lagrange-Gleichung erhalten wir dann m¨ r=
l2 d − V (r). mr 3 dr
2
l Der Beitrag mr 3 stammt aus der kinetischen Energie T , er kann als eine fiktive abstoßende Kraft oder Zentrifugalkraft aufgefasst werden. Die verallgemeinerten Kräfte sind gegeben durch:
∂V =0 F˜θ = − ∂θ ∂V F˜r = − . ∂r Beispiel 2: Perle auf einer Helix Eine Perle kann sich ohne Reibung auf einem dünnen Draht in der Form einer Helix bewegen. Dabei wirkt auf die Perle eine Zentralkraft, die proportional zum Abstand vom Ursprung ist. Die Perle kann als Massenpunkt angesehen werden. Die Definition der Koordinaten ist aus der Abbildung ersichtlich. Auf Grund der Symmetrie des Problems wählen wir zylinderische Koordinaten, x = ρ cos φ,
y = ρ sin φ,
z=z .
(3.11)
34
Kapitel 3. Die Lagrangeschen Bewegungsgleichungen
Abbildung 3.1: Perle auf einer Helix
Die Gleichung der Helix lautet dann: ρ = b, z = aφ . Dies sind zwei holonome Zwangsbedingungen, d.h. nur eine Koordinate ist unabhängig. Als unabhängige generalisierte Koordinate wählen wir φ (oder z). Aus Gl. (3.11) folgt durch Ableitung nach der Zeit x˙ = ρ˙ cos φ − ρφ˙ sin φ = −bφ˙ sin φ y˙ = ρ˙ sin φ + ρφ˙ cos φ = bφ˙ cos φ z˙ = aφ˙ . Damit ergibt sich für die kinetische Energie T =
1 1 m(x˙ 2 + y˙ 2 + z˙ 2 ) = m(b2 φ˙ 2 + a2 φ˙ 2 ) . 2 2
(3.12)
Auf die Perle wirkt die Zentralkraft Fr = −
∂V = −kr . ∂r
(3.13)
Die zugehörige potentielle Energie ist V =
1 1 1 k(r2 ) = k(ρ2 + z 2 ) = k(b2 + a2 φ2 ) . 2 2 2
(3.14)
Der konstante Term 12 kb2 trägt zur Bewegungsgleichung nichts bei und kann weggelassen werden. Damit wird die Lagrange-Funktion L=T −V =
1 1 m(b2 φ˙ 2 + a2 φ˙ 2 ) − ka2 φ2 . 2 2
Für die Lagrangeschen Gleichungen brauchen wir ∂L = −ka2 φ ∂φ
und
∂L = m(b2 + a2 )φ˙ . ∂ φ˙
(3.15)
3.4 Verallgemeinerte Potentiale
35
Einsetzen in die Lagrangeschen Gleichungen ergibt, ∂L d d ∂L = 0 ⇒ ka2 φ + m(b2 + a2 )φ˙ , − ∂φ dt ∂ φ˙ dt oder φ¨ = −
ka2 φ. m(a2 + b2 )
Dies ist die Differentialgleichung eines harmonischen Oszillators. Man sieht unmittelbar, dass die Lösung gegeben ist durch s ka2 . φ(t) = A cos ωt + B sin ωt, ω= m(a2 + b2 ) Die Lösung stellt eine harmonische Schwingung in der Winkelvariablen φ dar. Die Amplituden A und B hängen nur von den Anfangsbedingungen ab. Alternativ hätten wir auch z als unabhängige Variable verwenden können. Dann hätten wir die Differentialgleichung ka2 z z¨ = − m(a2 + b2 ) erhalten. Dies ist die Gleichung einer harmonischen Schwingung in der Variablen z(t).
3.4
Verallgemeinerte Potentiale
Bei der Ableitung des Hamiltoschen Prinzips aus dem D’Alembertschen Prinzip im vorigen Kapitel hatten wir angenommen, dass die Kräfte sich aus einem skalaren Potential ableiten lassen, ∂ Fi (x, t) = − V (x, t) , (3.16) ∂xi wobei das Potential von den Koordinaten und der Zeit, aber nicht von den Geschwindigkeiten abhängen durfte. Der Formalismus lässt sich jedoch auf eine eingeschränkte Klasse von geschwindigkeitsabhängigen Kräften, die in der Physik eine wichtige Rolle spielen, erweitern. Wenn sich die Kräfte aus zeit- und geschwindigkeitsabhängigen Potentialen wie folgt ableiten lassen, ˙ t) = − Fi (x, x,
∂ d ∂ V (x, x, ˙ t) + V (x, x,t) ˙ , ∂xi dt ∂ x˙ i
(3.17)
dann führt dies, abgesehen von Oberflächentermen, die ohne Auswirkung auf die Bewegungsgleichungen bleiben, auf dasselbe Hamiltonsche Prinzip. Beweis (für eine Dimension): Um zu zeigen, dass Gl. (3.17) auf dieselben LagrangeGleichungen führt, betrachten wir den Beitrag zur Wirkung (vgl. die Ableitung der Lagrangeschen Gleichungen aus dem D’Alembertschen Prinzip in Kapitel 2)
36
Kapitel 3. Die Lagrangeschen Bewegungsgleichungen Z
t2 t1
∂ d ∂ F δx dt = − V (x, x, ˙ t) + V (x, x,t) ˙ ∙ δx dt ∂x dt ∂ x˙ t1 Z t2 ∂V d ∂V ∂V = − δx + δx − δ x˙ dt. ∂x dt ∂ x˙ ∂ x˙ t1 Z
t2
Die totale Zeitableitung hat keine Auswirkungen auf die Bewegung. Mit δV (x, x) ˙ = ∂V ∂V δx + δ x ˙ wird ∂x ∂ x˙ Z t2 Z t2 Z t2 F δx dt = − δV dt = −δ V dt . t1
t1
t1
Zusammen mit dem kinetischen Term erhalten wir somit auch in diesem Fall dasselbe Hamiltonsche Prinzip. Ein wichtiges Beispiel ist die, später noch im Detail zu behandelnde Lorentz-Kraft der Elektrodynamik, die die Kraft auf eine Punktladung angibt, die sich mit Geschwindigkeit v in einem elektromagnetischen Feld bewegt. Ausgedrückt durch das skalare Potential Φ(x) und das Vektor-Potential A(x) lautet die Lorentz-Kraft ∂ 1 ∂ ∂ Φ − x˙ j Aj − Ai , (3.18) Fi = − ∂xi c ∂xi ∂xj wo c die Lichtgeschwindigkeit ist. Wir haben hier die Einsteinsche Summenkonvention verwendet, d.h. über doppelt vorkommende Indizes wird summiert. Die Lorentz-Kraft lässt sich mit Hilfe der Formel (3.17) aus dem Potential 1 V (x, x, ˙ t) ≡ e(Φ − A∙v) c
(3.19)
ableiten. Beweis: ∂ + Fi = − ∂xi ∂ =− Φ− ∂xi
d ∂ 1 1 d 1 ∂ ∂ Φ(x) − Aj (x)x˙ j = − Φ − x˙ j Aj − Ai dt ∂ x˙ i c ∂xi c ∂xi c dt 1 1 ∂ 1 ∂ ∂ ∂ ∂ Aj − x˙ j Ai = − Φ − x˙ j Aj − Ai x˙ j c ∂xi c ∂xj ∂xi c ∂xi ∂xj
Das elektrische Feld E und das Magnetfeld B hängen mit den Potentialen über E = −∇Φ − ∂A ∂t und B = ∇ × A zusammen. Damit lässt sich die Lorenz-Kraft in die bekannte Form bringen v F = e(E + × B) . (3.20) c Dies sieht man wie folgt: [v × (∇ × A)]i = εijk vj (∇ × A)k = εijk εklm vj ∇l Am = (δil δjm − δim δjl )vj ∇l Am = vm ∇i Am − (vl ∇l )Ai = vm (∇i Am − ∇m Ai ) . Man kann im Hamilton-Prinzip geschwindigkeitsabhängige Potentiale zulassen, vorausgesetzt die zugehörigen Kräfte leisten keine Arbeit (hier ist B⊥v).
3.5 Lagrangesche Gleichungen und allgemeine Zwangsbedingungen
3.5
37
Lagrangesche Gleichungen und allgemeine Zwangsbedingungen
Zusammen mit den Lagrangeschen Gleichungen entwickelte Lagrange auch eine geniale Methode, Zwangsbedingungen zu berücksichtigen, die auch angewendet werden kann, wenn die Zwangsbedingungen so kompliziert sind, dass sich die überflüssigen Freiheitsgrade nicht explizit eliminieren lassen. Beispiel: Minimiere f (x, y) unter der Zwangsbedingung g(x, y) = konst. Die Funktion f (x, y) nimmt ein Extremum an, wenn df = f,x dx + f,y dy = 0 ,
(3.21)
∂f wo f,x ≡ ∂f ∂x , f,y ≡ ∂y . Wenn dx und dy unabhängig sind, dann bedeutet dies f,x = f,y = 0. Hier sind dx und dy jedoch durch die Nebenbedingung eingeschränkt,
dg = g,x dx + g,y dy = 0 .
(3.22)
Gleichungen (3.21) und (3.22) sind nur konsistent, wenn f,x f,y = = λ konst. , g,x g,y oder,
f,x − λg,x = 0;
(3.23)
f,y − λg,y = 0 .
Dies sind genau die Gleichungen, die man erhalten hätte, wenn man f − λg ohne Nebenbedingung minimiert hätte. Der Parameter λ heißt Lagrangescher Multiplikator. Wir wenden diese Methode auf das Variationsprinzip an. Für ein System von N Teilchen lautet das Hamiltonsche Prinzip Z t2 L(x1 ....xN , x˙ 1 ....x˙ N ; t) dt = 0 . δ t1
Es gilt, wie wir gesehen haben, allgemein, d.h. auch wenn die Koordinaten xi wegen der Existenz von Zwangsbedingungen nicht unabhängig sind. Allerdings lassen sich die zu erwartenden 3N Lagrangeschen Gleichungen nicht wie oben beschrieben herleiten, da die δxi nicht mehr unabhängig sind. Die Methode der Lagrangeschen Multiplikatoren lässt sich vorteilhaft anwenden, wenn es schwierig ist, die xi auf unabhängige generalisierte Koordinaten zu reduzieren oder wenn die Zwangskräfte gesucht sind. Gegeben seien m Zwangsbedingungen gs (x1 ....xN ; t) = 0 ,
s = 1...m ,
die von den Koordinaten abhängen, aber nicht von den Geschwindigkeiten. Wir folgen dem Lagrangeschen Rezept und führen eine neue Lagrange-Funktion ein L→L+
m X s=1
λs gs (x1 ....xN ; t),
(3.24)
38
Kapitel 3. Die Lagrangeschen Bewegungsgleichungen
die ohne Zwangsbedingungen variiert wird, als ob die xi unabhängig wären. Dann werden die λs so bestimmt, dass die Nebenbedingungen erfüllt werden. Die Lagrangeschen Gleichungen gehen über in m
X ∂g d ∂L ∂L − + λs = 0, i = 1...N , ∂xi dt ∂ x˙ i s=1 ∂xi
(3.25)
wo λs Lagrangesche Multiplikatoren sind. Die sind 3N Gleichungen für 3N + m Unbekannten, 3N Koordinaten und m Multiplikatoren. Die m Zwangsbedingungen liefern die nötigen zusätzlichen Gleichungen. Beispiel: Wir betrachten noch einmal die Perle auf einer Helix unter einer Zentralkraft, die proportional zum Abstand vom Ursprung ist. In Zylinderkoordinaten q1 = ρ, q2 = φ, q3 = z , lauteten die Zwangsbedingungen ρ = b, z = aφ
g1 = (ρ − b) = 0
g2 = (z − aφ) = 0.
Für die Lagrangeschen Gleichungen (3.25) benötigen wir ∂g1 = 1, ∂ρ ∂g2 = 0, ∂ρ
∂g1 ∂g1 = 0, =0 ∂φ ∂z ∂g2 ∂g2 = −a, = 1. ∂φ ∂z
Die Lagrange-Funktion ist gegeben durch L=
2 X 1 1 λs gs (ρ, φ, z) . m(ρ˙ 2 + ρ2 φ˙ 2 + z˙ 2 ) − k(ρ2 + z 2 ) + 2 2 s=1
(3.26)
Daraus ergeben sich die Lagrangeschen Gleichungen m¨ ρ − mρφ˙ 2 + kρ = λ1
ρ: φ:
∂g1 ∂g2 + λ2 = λ1 ∂ρ ∂ρ
d ˙ = λ1 ∂g1 + λ2 ∂g2 = −aλ2 (mρ2 φ) dt ∂φ ∂φ
∂g1 ∂g2 + λ2 = λ2 . ∂z ∂z Daneben müssen die Zwangsbedingungen erfüllt sein, z:
m¨ z + kz = λ1
g1 : g2 :
(3.27) (3.28) (3.29)
ρ=b
(3.30)
z = φa .
(3.31)
3.5 Lagrangesche Gleichungen und allgemeine Zwangsbedingungen
39
Setze Gl. (3.30) und (3.31) in Gl. (3.28) ein, so erhalten wir: mb2 d z˙ (mb2 ) = −aλ2 → λ2 = − 2 z¨ . dt a a Dieses Ergebnis eingesetzt in Gl. (3.29) ergibt m¨ z + kz = −
ka2 mb2 z ¨ → z ¨ = − z. a2 m(a2 + b2 )
Dies ist die selbe Gleichung einer harmonischen Schwingung, die wir oben abgeleitet haben Physikalische Interpretation der Lagrangeschen Multiplikatoren: Gegeben sei ein mechanisches System von N Massenpunkten, das durch die Koordinaten x1 ... xN und durch eine Zwangsbedingung g(x1 ... xN ) = 0 charakterisiert ist. Wir betrachten zunächst nur den statischen Fall L = −V . Dann verlangt die Multiplikator-Methode, dass δV − λδg = 0 oder δ(V − λg) = 0 ist. Man kann λg auffassen als potentielle Energie, die zu den Zwangskräften gehört. Wir schreiben VZ = −λg und berechnen die Kraft durch Gradientenbildung Z i (x) = − ∇i VZ (x), i = 1...N = λ∇i g + g∇i λ . Der zweite Term verschwindet wegen der Zwangsbedingung. Damit ist die Zwangskraft oder Reaktionskraft auf den i-ten Massenpunkt Z i (x) = λ∇i g . Wir sehen, dass man die Zwangskraft aus dem λ-Term erhält. Das gilt nicht nur im Gleichgewicht, sondern auch für bewegte Systeme. Bemerkung: Die Methode der Lagrangeschen Multiplikatoren lässt sich auch anwenden, wenn die Zwangsbedingungen von den Geschwindigkeiten abhängen gs (x1 ....xN ; x˙ 1 ....x˙ N ; t) = 0 ,
s = 1...m ,
solange die zusätzlichen Zwangskräfte keine Arbeit entlang den virtuellen Verrückungen verrichten. Dies ist bei Rollbewegung ohne Schlupf der Fall.
40
Kapitel 3. Die Lagrangeschen Bewegungsgleichungen
Beispiel: Ein Fass der Masse M und Radius R rollt ohne Schlupf eine um einen Winkel α geneigte schiefe Ebene hinunter. Mit den verallgemeinerte Koordinaten x, θ lautet die Zwangsbedingung: dx = Rdθ → x˙ = Rθ˙ . (3.32)
Abbildung 3.2: Rollendes Fass
Die potentielle Energie durch die Erdanziehung ist V = M gx sin α . Berechnen wir die kinetische Energie eines massiven Ringes und integrieren dann über den Radius des Ringes, so erhalten wir für die kinetische Energie des Fasses T =
3 M R2 θ˙2 . 4
Die Variation der Lagrangefunktion lautet δL = δT − δV + λ(δx − Rδθ) 3 ¨ − M g sin αδx + λ(δx − Rδθ) . = M R2 θδθ 2 Da δθ und δx unabhängige Variationen sind, erhalten wir die Bewegungsgleichungen −M g sin α + λ = 0 3 M R2 θ¨ − λR = 0 . 2 Diese Gleichungen können integriert werden, um θ(t) zu bestimmen. Anschließend bestimmen wir x(t) mit Hilfe von Gl. (3.32).
Kapitel 4
Symmetrien und Erhaltungssätze 4.1
Verallgemeinerte Impulse
Für ein freies Teilchen lautet die Lagrange-Funktion L=
1 m x∙ ˙ x˙ 2
p = m x˙
⇒
oder pi =
∂L . ∂ x˙ i
Für generalisierte Koordinaten {qi } definiert man entsprechend pi ≡
∂L ∂ q˙i
(4.1)
und bezeichnet pi ≡ ∂∂L q˙i als den verallgemeinerten Impuls, auch als den zu qi kanonisch konjugierten oder kurz kanonischen Impuls. Der kanonische Impuls unterscheidet sich im Allgemeinen vom gewöhnlichen Impuls, wie man an den folgenden Beispielen sieht. a) Ebenes Pendel: Geeignete generalisierte Koordinaten sind hier die Polarkoordinaten r und φ mit x = l sin φ und y = l cos φ, wo l die Länge des Pendels ist. In diesen Koordinaten lautet die Lagrangefunktion L=
1 2 ˙2 ml φ + mgl cos φ . 2
Der zugehörige kanonische Impuls ergibt sich zu pφ = und ist somit hier der Drehimpuls.
∂L = ml2 φ˙ ∂ φ˙
42
Kapitel 4. Symmetrien und Erhaltungssätze
Abbildung 4.1: Ebenes Pendel
b) Für ein Teilchen im (geschwindigkeitsabhängigen) elektromagnetischen Potential V ( x, x,t) ˙ = e(Φ − 1c A ∙ x) ˙ ist der kanonische Impuls gegeben durch: e p = mx˙ + A c
4.2
(4.2)
Zyklische Koordinaten
Koordinaten qi , die in der Lagrangefunktion nicht vorkommen, heißen zyklisch, d.h. für sie gilt ∂L =0. (4.3) ∂qi Für solche zyklischen Variablen können die Lagrangeschen Gleichungen ∂L d ∂L − = 0, ∂qi dt ∂ q˙i |{z}
i = 1...n
=0
sofort integriert werden,
∂L = pj = konst . ∂ q˙j
(4.4)
Der zu einer zyklischen Koordinate gehörende kanonische Impuls ist also erhalten (zeitlich konstant). Zyklische Koordinaten lassen sich aus den Lagrangeschen Gleichungen eliminieren. Wir diskutieren den Fall einer einzigen zyklischen Koordinate, und zwar der n-ten: ∂L = cn (4.5) ∂ q˙n Lösen wir diese Gleichung nach q˙n auf, dann ist q˙n = f (q1, ...., qn−1 ; q˙1, ...., q˙n−1 , cn ; t) .
(4.6)
Wo immer q˙n in der Lagrangeschen Gleichungen auftaucht, ersetzen wir es entsprechend Gl. (4.6). Die Integration der Lagrangeschen Gleichungen involviert dann nur noch die nicht-zyklischen Variablen.
4.2 Zyklische Koordinaten
43
Beispiel: Wir untersuchen noch einmal das aus Kapitel 2 bekannte Beispiel eines Massenpunktes auf einem Kreiskegel unter dem Einfluss der Schwerkraft. Die Spitze des Kegels liege im Ursprung und die Achse des Kegels liege entlang der z-Achse. Der Öffnungswinkel α ist fest vorgegeben und keine dynamische Variable. Statt der kartesischen Koordinaten x, y, z verwendet man besser die dem Problem angepassten Zylinderkoordinaten ρ, φ.α, die wie folgt definiert sind (x, y, z) = ρ(cos ϕ, sin ϕ, cot α).
(4.7)
In diesen Koordinaten lautet die Geschwindigkeit (x, ˙ y, ˙ z) ˙ = ρ(cos ˙ ϕ, sin ϕ, cot α) + ρ(−ϕ˙ sin ϕ, ϕ˙ cos ϕ, 0) und die Lagrangefunktion m 2 [x˙ + y˙ 2 + z˙ 2 ] − mgz 2 m = [(1 + cot2 α)ρ˙ 2 + ρ2 ϕ˙ 2 ] − mgρ cot α . 2
L=
(4.8)
Leitet man ohne nachzudenken die Bewegungsgleichungen aus L ab, so erhält man die zwei gekoppelten Differentialgleichungen 2. Ordnung aus Kapitel 2, die schwer zu lösen sind. Aus Gl. (4.8) entnehmen wir aber, dass der Winkel ϕ zyklisch ist, und dass somit der zugehörige kanonische Impuls pϕ =
∂L = mρ2 ϕ˙ = konst. ∂ ϕ˙
(4.9)
erhalten ist. Der kanonische Inpuls pϕ entspricht hier dem physikalischen Drehimpuls. Wir lösen Gl. (4.9) nach ϕ˙ auf, pϕ ϕ˙ = , mρ2 und setzen diesen Ausdruck in L ein, mit dem Ergebnis L=
p2ϕ m [(1 + cot2 α)ρ˙ 2 + 2 2 ] − mgρ cot α. 2 m ρ
Die Lagrangesche Gleichung liefert nun ρ:
−mρ(
pϕ 2 ) − mg cot α − m(1 + cot2 α)¨ ρ=0. mρ2
Aus dieser gewöhnlichen Differentialgleichung 2. Ordnung für ρ(t) lässt sich bei gegebenen Anfangsbedingungen die Funktion ρ(t) berechnen. Setzen wir ρ(t) wieder in die Gl. (4.9) ein, so erhalten wir ϕ(t) durch einfache Integration, Z pϕ dt ϕ(t) = . (4.10) m ρ2 (t) An diesem Beispiel wird der Vorteil der Lagrangeschen Mechanik deutlich, wenn es gelingt, zyklische Variablen zu identifizieren. Die Berechnung von ρ(t) wird noch einfacher, wenn man zusätzlich die Energieerhaltung verwendet.
44
4.3
Kapitel 4. Symmetrien und Erhaltungssätze
Noether-Theorem
Es besteht ein enger Zusammenhang zwischen der Existenz von Erhaltungsgrößen und Symmetrien, d.h. Transformationen, die die Lagrange-Funktion nicht ändern, also invariant lassen. Wir schreiben abgekürzt q(t) für die verallgemeinerten Koordinaten {q1 (t), .....qn (t)} mit n = 3N − m für ein Systems von N Massenpunkten und m Zwangsbedingungen. Die Koordinaten werden einer Transformation unterzogen, (4.11)
q(t) −→ q(t, α) ,
die durch einen Parameter α charakterisiert ist und stetig aus der Einheit hervorgeht, mit q(t, α = 0) = q(t). Die Lagrangefunktion L sei invariant unter der Transformation, d.h. sie habe denselben Wert für alle Bahnen q(t, α), die durch die Transformation aus einer Bahn q(t) hervorgehen, L(q(t, α), q(t, ˙ α); t) = L(q(t), q(t); ˙ t)
(numerisch).
(4.12)
Dies gilt speziell für die physikalisch angenommenen Bahnen, d.h. Bahnen mit der stationären Wirkung. D.h. aus Z δS = δ L(q(t), q(t); ˙ t) = 0
folgt auch, dass
δSα = δ
Z
L(q(t, α), q(t, ˙ α); t) = 0.
Die Lösung sind jeweils die Lagrangeschen Gleichungen. Wir betrachten die Gl. (4.12). Da die rechte Seite nicht von α abhängt, hängt auch die linke Seite nicht von α ab. d L(q(t, α), q(t, ˙ α); t) = 0 (4.13) dα Wir beschränken uns der Einfachheit halber auf infinitesimale Transformationen α ' 0, da endliche Transformationen aus infinitesimalen aufgebaut werden können. Nach der Kettenregel gilt n
0= =
dL X ∂L dqi ∂L dq˙i ( = + ) dα ∂q dα ∂ q˙i dα i i=1
n n X ∂L d ∂L dqi d X ∂L dqi ( − ) + . ∂qi dt ∂ q˙i dα dt i=1 ∂ q˙i dα i=1
Für qi , die Lösungen der Bewegungsgleichungen sind, folgt somit n d X ∂L dq = 0. dt ∂ q˙ dα i=1
(4.14)
α=0
Noether-Theorem (Emmy Noether 1918): Ist eine Lagrange-Funktion invariant unter einer (kontinuierlichen, stetig differenzierbaren) Koordinatentranformation, die stetig aus der Einheit hervorgeht qi (t) −→ qi (t, α)
i = 1....n
qi (t, α)|α=0 = qi (t) ,
(4.15)
4.4 Impulserhaltung
45
und löst qi (t) die Bewegungsgleichungen, so ist n X ∂L dqi I(q, q) ˙ ≡ ∂ q˙i dα i=1
(4.16) α=0
eine (zeitliche) Konstante der Bewegung, die auch als Erhaltungsgröße oder Integral der Bewegung bezeichnet wird. Wenn die Tranformation, unter der L invariant ist, mehrere Parameter αs , s = 1, 2, 3, ... enthält, so gehört zu jedem Parameter αs eine Erhaltungsgröße n X ∂L dqi Is (q, q) ˙ ≡ . (4.17) ∂ q˙i dαs i=1
alle αs =0
Aus den Symmetrien der Lagrangefunktion folgen also physikalische Erhaltungssätze. Das Theorem gilt auch, wenn die Lagrange-Funktion sich unter der Transformation nur um eine totale Zeitableitung ändert.
4.4
Impulserhaltung
Die Lagrange-Funktion L eines Systems von N Massenpunkten sei invariant unter Translationen der kartesischen Koordinaten (Homogenität des Raumes), xi (t) −→ xi (t, α) = xi (t) + αe , i = 1...N
(4.18)
wo e ein fester, beliebig gerichteter Einheitsvektor ist. D.h. alle Punkte des Raumes werden um dieselbe Strecke verschoben. Die Lagrange-Funktion L ist invariant, wenn N
L=
1X mi x˙ 2i − V (xi − xj ) , 2 i=1
(4.19)
d.h. wenn das Potential V nur von den Koordinatendifferenzen abhängt. Dann lautet die zugehörige Erhaltungsgröße: N X ∂L dxj I= ∂ x˙ j dα j=1 α=0
=
N X j=1
mj x˙ j ∙ e = P ∙ e ,
P P mj x˙ j der Gesamtimpuls des Systems und P ∙ e die Komponente von wo P = pj = P in Richtung e ist. Da e ein beliebig gerichteter Vektor war, ist der Gesamtimpuls erhalten. Impulssatz: Wenn die Lagrange-Funktion eines Systems von Massenpunkten invariant unter Translationen ist, dann ist der Gesamtimpuls (alle 3 Komponenten) erhalten.
46
4.5
Kapitel 4. Symmetrien und Erhaltungssätze
Drehimpulserhaltung
Die Lagrange-Funktion L eines Systems von Massenpunkten sei invariant unter Rotationen (Isotropie des Raumes), d.h. V = V (|xi −xj |) hänge nur von den relativen Abständen ab. Wir betrachten zunächst den einfachen Fall eines einzelnen Massenpunktes und eine Drehung des Koordinatensystems um die z-Achse um den Winkel ϑ. Bei dieser passiven Rotation, drehen wir das Koordinatensystem und halten den Massenpunkt im Raum fest. Aus der Zeichnung sehen wir, wie die Koordinaten (x, y, z) des Massenpunktes P im ursprünglichen System mit seinen Koordinaten (x0 , y 0 , z 0 ) im gedrehten System zusammenhängen. Es gilt: x0 = AP + OB = x cos ϑ + y sin ϑ y 0 = CB − CA = −x sin ϑ + y cos ϑ | {z } CB
z0 = z .
Abbildung 4.2: Drehung um die z-Achse
Die Notation von Gl. (4.15) übersetzt sich in x0 ≡ x(t, ϑ). Die Lagrange-Funktion L = 12 mx˙ 2 − V (x2 ) ist offensichtlich invariant unter dieser Transformation. Mit ∂x0 |ϑ=0 = (−x sin ϑ + y cos ϑ)ϑ=0 = y ∂ϑ 0 ∂y |ϑ=0 = (−x cos ϑ − y sin ϑ)ϑ=0 = −x ∂ϑ ∂z 0 |ϑ=0 = 0 ∂ϑ finden wir für das Integral der Bewegung ∂L ∂x ∂L ∂x ∂L ∂y |ϑ=0 = + ∂ x˙ ∂ϑ ∂ x˙ ∂ϑ ∂ y˙ ∂ϑ = mxy ˙ − myx ˙ = px y − py x = −lz
I=
4.6 Hamilton-Funktion
47
und damit die Erhaltung der z-Komponente des Drehimpulses l = [x × p]. Da die z-Achse in beliebige Richtung gelegt werden kann, ist bei Drehinvarianz der Lagrangefunktion L = T − V (x2 ) jede Komponente des Drehimpulses eines Massenpunktes erhalten. Die Verallgemeinerung dieses Erhaltungssatzes auf N Massenpunkte lautet: Drehimpulssatz: Wenn für ein System von N Massenpunkten die Kräfte nur von deren Abständen abhängen, dann ist der Gesamtdrehimpuls erhalten (jede Komponente).
4.6
Hamilton-Funktion
Man bezeichnet die Größe H≡
n X i=1
q˙i
∂L −L ∂ q˙i
(4.20)
als Hamilton-Funktion. Diese Funktion ist von besonderem Interesse, weil sie unter ziemlich allgemeinen Bedingungen erhalten ist. Wir betrachten ein mechanisches System mit holonomen Zwangsbedingungen und Lagrangefunktion L = L(q, q; ˙ t). Dann ist n
dL X ∂L dq˙i ∂L dqi ∂L ( = + )+ dt ∂ q ˙ dt ∂q dt ∂t i i i=1 =
n X ∂L d ∂L ∂L ( q¨i + ( )q˙i ) + , ∂ q ˙ dt ∂ q ˙ ∂t i i i=1
wo wir die Lagrangeschen Gleichungen verwendet haben. Für die Hamilton-Funktion gilt n X ∂L d ∂L dH dL q¨i + q˙i − = . dt ∂ q˙i dt ∂ q˙i dt i=1
Der Vergleich zeigt
∂L dH =− . (4.21) dt ∂t Die Hamilton-Funktion ist genau dann erhalten, d.h. eine Konstante der Bewegung, wenn L nicht explizit von der Zeit abhängt, d.h. invariant ist unter Zeittranslationen. (Homogenität der Zeit). PN Wir zeigen jetzt, dass für L = 12 i=1 mi x˙ 2i + V (x1 , ...xN ) und 3N − n zeitunabhängige (skleronome) holonome Zwangsbedingungen die Hamilton-Funktion die erhaltene Gesamtenergie des Systems darstellt, H = T + V . Holonome Zwangsbedingungen bedeutet, dass sich die unabhängigen verallgemeinerten Koordinaten qj , j = 1...n aus xi =xi (qj ) bestimmen lassen. Damit ist die kinetische Energie eine quadratische Form in den generalisierten Geschwindigkeiten, T =
N N n X 1X 1X ∂xi 2 mi x˙ 2i = mi ( q˙j ) : 2 i=1 2 i=1 ∂qj j=1
(4.22)
48
Kapitel 4. Symmetrien und Erhaltungssätze
Wenn V nicht explizit von der Zeit abhängt, V = V (q), folgt daraus H=
n X i=1
n
q˙i
X ∂T ∂L −L= q˙i −L ∂ q˙i ∂ q˙i i=1
= 2T − (T − V ) = T + V.
(4.23)
Rechnerisches Detail: n N n n N n X X X ∂T ∂ 1 X ∂xi 2 X 1 X ∂xi q˙k = q˙k mi ( q˙j ) = q˙k mi 2 q˙j δjk ∂ q˙k ∂ q˙k 2 i=1 ∂q 2 ∂q j j j=1 i=1 j=1 k=1 k=1 k=1 ! n N X X ∂xi q˙k mi q˙k = 2T = ∂qk i=1 n X
k=1
Bemerkung: In der Lagrangeschen Mechanik ist H eine Funktion von q, q˙ und t, H = H(q, q; ˙ t). In der später zu besprechenden Hamiltonschen Mechanik wird H als Funktion von q, p und t aufgefasst.
Kapitel 5
Hamiltonsche Mechanik 5.1
Legendre-Transformation
Gegeben sei eine Funktion F (x, y) von 2 Variablen. Wir bezeichnen x als passive Variable und y als aktive Variable. Die Bedeutung dieser Bezeichnungen wird gleich klar. Wir wollen bei unverändertem x die Variable y auf die unabhängige Variable z=
∂F ∂y
(5.1)
transformieren. Da F (x, y) und F (x, y + c) dasselbe z ergeben, ist die Rücktransformation nicht eindeutig. Um eine Transformation zu erhalten, die sich invertieren lässt, transformieren wir nicht nur die Variable sondern auch die Funktion F → G wie folgt: Leg[F (x, y)] = G(x, z) = y(z)z − F (x, y(z))
mit z =
∂F ∂y
→ y = y(z)
(5.2)
Dabei wird y durch z mit Hilfe der Gleichung z = ∂F ∂y ausgedrückt. Dies ist stets möglich, wenn die Determinante der Hessematrix der 2. Ableitungen ungleich Null ist, 2 ∂2F ∂ F ∂x2 ∂x∂y det 6= 0 . ∂2F ∂2F ∂y∂x
∂y 2
Die Funktion G hängt jetzt nur von x und z ab. Die Variable x bleibt unangetastet, daher die Bezeichnung passive Variable. Wichtig ist, dass man aus der Kenntnis der Legendre-Transformierten G(x, z) die ursprüngliche Funktion F (x, y) wieder zurückerhalten kann. Die inverse Transformation lautet Leg[G(x, z)] = F (x, y) = z(y)y − G(x, z(y)), ∂G → z = z(y) . mit y(z) = ∂z
(5.3)
50
Kapitel 5. Hamiltonsche Mechanik
Denn: H(x, y) = Leg[G(x, z)] = zy − G(x, z(y)) = zy − (yz − F (x, y)) = F (x, y) Die Transformation ist also vollkommen symmetrisch. Die Legendre-Tranformation ist ihre eigene Inverse, Leg[Leg[F (x, y)]] = F (x, y) . Das „alte“ und das „neue“ System sind absolut äquivalent. Für die passiven Variablen gelten die Beziehungen ∂F (x, y) ∂G(x, z(y)) =− . (5.4) ∂x ∂x Beispiel: Sei F (x, y) = (1 + x2 )y 2 . Die Legendre-Transformation lautet G(x, z) =
∂F z2 wo z = . 4(1 + x2 ) ∂y
Beweis: z ∂F = 2y(1 + x2 ); ⇒ y = ∂y 2(1 + x2 ) 2 z z G(x, z) = yz − F (x, y(z)) = − (1 + x2 )[ ]2 2 2(1 + x ) 2(1 + x2 ) z2 = 4(1 + x2 ) z(y) =
Sei jetzt G(x, z) gegeben. Dann berechnet sich daraus F (x, y) wie folgt y(z) =
∂G 2z = ∂z 4(1 + x2 )
⇒ z(y) = 2y(1 + x2 )
F (x, y) = z(y)y − G(x, z(y)) = 2y 2 (1 + x2 ) −
[2y(1 + x2 )]2 4(1 + x2 )
= 2y 2 (1 + x2 ) − y 2 (1 + x2 ) = y 2 (1 + x2 ) Zusammenfassung: Die Legendre-Transformation transformiert eine gegebene Funktion von gegebenen Variablen in eine neue Funktion von neuen Variablen. Die neuen und die alten Variablen hängen über eine Punkttransformation zusammen. Die Transformation ist symmetrisch: Dieselbe Transformation, die vom alten zum neuen System führt, führt auch vom neuen zum alten. Die Verallgemeinerung auf mehr Variable ist problemlos möglich (siehe unten). Die Legendre-Tranformation findet in verschiedenen Gebieten der Physik Anwendung, z.B. in der Statistischen Physik, in der Quantenfeldtheorie und beim Übergang von der Lagrangeschen zur Hamiltonschen Mechanik.
5.2 Die Hamiltonschen Gleichungen
5.2
51
Die Hamiltonschen Gleichungen
Die Hamiltonschen Gleichungen folgen aus den Lagrangeschen Gleichungen nach Anwendung einer Legendre-Transformation auf die Lagrange-Funktion. Wir betrachten zunächst ein mechanisches System mit einem Freiheitsgrad, das beschrieben wird durch die Lagrange-Funktion L = L(q, q; ˙ t) . Wir fassen die q˙ als Variable auf, die unabhängig von den q sind, und wählen q˙
aktive Variable,
passive Variable .
q, t
Die Legendre-Transformation wird in 3 Schritten durchgeführt: 1. Wir führen die neue Variable ein: p=
∂L , ∂ q˙
die wir kanonischen Impulse nennen. 2. Wir invertieren diese Relation, d.h. lösen sie nach q˙ auf: q˙ = q(p) ˙ 3. Wir führen eine Legendre transformierte Funktion H(q, p; t) ein, H(q, p; t) = pq(p) ˙ − L(q, q(p); ˙ t) ,
(5.5)
die wir Hamilton-Funktion nennen. Funktion Variable
Altes System Lagrangefunktion L Geschwindigkeiten
Neues System Hamilton-Funktion H kanonische Impulse
Bemerkung: Wir hatten im Kapitel 4 die Hamilton-Funktion auch in der Lagrangeschen Mechanik über die Definition H(q, q, ˙ t) ≡ q∂L/∂ ˙ q˙ −L eingeführt. Wenn wir im Rahmen der Hamiltonschen Mechanik von der Hamilton-Funktion sprechen, wird diese immer als Funktion von q, p, t aufgefasst. Die zusätzlichen Gleichungen der passiven Variablen lauten nach Gl. (5.4)
Da wir aus Kapitel 4 wissen, dass
∂H ∂L =− ∂q ∂q
(5.6)
∂L ∂H =− . ∂t ∂t
(5.7)
dH dt
= − ∂L ∂t , folgt
dH ∂H = . dt ∂t
(5.8)
52
Kapitel 5. Hamiltonsche Mechanik
Es gilt somit folgendes duales Schema: L(q, q, ˙ t)
H(q, p, t)
p=
∂L → q˙ = q(p) ˙ ∂ q˙ H = pq(p) ˙ − L(q, q(p); ˙ t)
q˙ =
H = H(q, p; t)
L = L(q, q; ˙ t)
∂H → p = p(q) ˙ ∂p L = p(q) ˙ q˙ − H(q, p(q), ˙ t)
Als Nächstes untersuchen wir die Transformation der Lagrange-Gleichung d ∂L ∂L − =0. ∂q dt ∂ q˙ Da p =
∂L ∂ q˙
(5.9)
ist, geht diese Gleichung über in d ∂L − p=0. ∂q dt
D.h. die Lagrange-Gleichung geht über in p˙ =
∂L . ∂q
Andererseits ist q passive Variable und daher gilt mit Gl. (5.6) p˙ =
∂H ∂L =− . ∂q ∂q
Wir fassen die Ergebnisse zusammen: p˙ = −
∂H dH ∂L ∂H ; q˙ = ; und =− ∂q ∂p dt ∂t
(5.10)
Dies sind die Hamiltonschen kanonischen Gleichungen. Hängt L nicht explizit von der Zeit ab, so sind dies zwei gekoppelte Differentialgleichungen erster Ordnung. Dabei sind die q(t) und p(t) die zwei unbekannten Funktionen. Für jede davon wird eine Anfangsbedingung benötigt, q(0) und p(0). Die ursprüngliche Lagrangesche Gleichungen bilden dagegen eine Differentialgleichung zweiter Ordnung für die eine Unbekannte q(t). Man braucht hier zwei Anfangsbedingungen q(0) und q(0). ˙ Beispiel: Der Harmonische Oszillator
m 2 k 2 x˙ − x 2 2 Aus der Lagrange-Funktion bestimmt sich der kanonischer Impuls, L=
p=
∂L p = mx˙ → x˙ = ∂ x˙ m
5.2 Die Hamiltonschen Gleichungen
53
und die Hamilton-Funktion, H = px˙ − L =
1 p2 1 p2 k k p2 − + x2 = + x2 . m 2m 2 2m 2
Das hätte man erraten können, da hier H = T + V . Die Hamiltonschen Gleichungen ergeben x˙ =
∂H p = , ∂p m
p˙ = −
∂H = −kx ∂x
Hooksches Gesetz
Aus der 1. Gleichung folgt p˙ = m¨ x
→
m¨ x = −kx
wie erwartet. Verallgemeinerung auf n Freiheitsgrade: Betrachte ein mechanisches N -Teilchen-System mit m Zwangsbedingungen und n generalisierten Koordinaten, das beschrieben wird durch die Lagrange-Funktion L = L(q1 , . . . , qn ; q˙1 , . . . , q˙n ; t),
n = 3N − m.
Wir fassen die q˙i als unabhängige Variable auf und wählen q˙1 .....q˙n als aktive Variable und q1 .....qn , t als passive Variable. Die Legendre-Transformation erfolgt wieder in 3 Schritten: 1. Wir führen „neue Variable“ ein: pi =
∂L ∂ q˙i
→ q˙i = q˙i (p)
(5.11)
die wir kanonische Impulse nennen. 2. Wir definieren die Hamilton-Funktion über eine Legendre-Transformation: H=
n X i=1
pi q˙i − L
(5.12)
3. Wir drücken die neue Funktion H durch die neuen Variablen pi aus, indem wir die pi mit (5.11) als Funktion der q˙i berechnen, invertieren und in Gl. (5.12) einsetzen, H = H(q1 , . . . , qn ; p1 , . . . , pn ; t) . Die zusätzlichen Gleichungen der passiven Variablen lauten ∂H ∂L =− ∂qi ∂qi ∂L ∂H =− . ∂t ∂t
(i = 1...n)
(5.13)
54
Kapitel 5. Hamiltonsche Mechanik
Wenden wir die Legendre-Transformation auf die Lagrangeschen Gleichungen an, so erhalten wir die Hamiltonschen kanonischen Gleichungen: p˙ i = −
∂H , ∂qi
q˙i =
∂H , ∂pi
∂H ∂L dH ∂L =− und =− . ∂t ∂t dt ∂t
(5.14)
Dies sind 2n Bewegungsgleichungen 1. Ordnung. Dabei sind die qi und pi die 2n Unbekannten; für jede davon wird je eine Anfangsbedingung benötigt, qi (0) und pi (0). Im Vergleich dazu bilden die Lagrangeschen Gleichungen n Differentialgleichungen 2. Ordnung für n Unbekannte qi (t). Man braucht hier aber je 2 Anfangsbedingungen qi (0) und q˙i (0).
5.3
Der Phasenraum
Es liegt nahe, die Variablen qi und pi , i = 1, . . . , n einen 2n-dimensionalen (q, p) Raum aufspannen zu lassen, dem Phasenraum. Dieser Raum hat eigentlich keine metrische Struktur, aber es ist üblich, die qi und pi in einen 2n-dimensionalen Euklidischen Raum abzubilden. Die Bewegung eines Systems kann von jedem Punkt des Phasenraums ausgehen. Wenn aber ein Punkt der Bahn im Phasenraum vorgegeben ist, dann ist die Bewegung eindeutig festgelegt (Differentialgleichungen 1. Ordnung). Das Bild wird noch klarer, wenn man die Zeit als weitere Dimension dazunimmt. Man spricht dann vom (2n + 1)-dimensionalen Zustandsraum. Die Gesamtheit der Lösungen der Hamiltonschen Gleichungen wird durch eine unendliche Mannigfaltigkeit von Kurven dargestellt, die den (2n + 1)-dimensionalen Raum ausfüllen, aber sich niemals kreuzen (da die Tangente an jedem Punkt eines Orbits durch die Hamiltonschen Gleichungen eindeutig gegeben ist).
5.4 Das Prinzip der kleinsten Wirkung im Phasenraum
5.4
55
Das Prinzip der kleinsten Wirkung im Phasenraum
Rt Das Prinzip der kleinsten Wirkung δ t12 L(q, q)dt ˙ = 0 lautet nach der LegendreTransformation in den Variablen q und p δ
Z
t2 t1
(pq˙ − H(q, p)) dt = 0 .
(5.15)
Auf der Trajektorie (q(t), p(t)) durch den Phasenraum werden q(t) und p(t) unabhängig voneinander variiert. Die Anfangs- und Endpunkte werden bei der Variation der Bahn festgehalten. Die beiden Formulierungen des Prinzips der kleinsten Wirkung sind nicht identisch. In der Lagrangeschen Mechanik wird nur die Bahn q(t) variiert, der Impuls berechnet sich aus p = ∂L/∂ q. ˙ In der Hamiltonschen Mechanik wir auch noch der Impuls p(t) variiert. Nur auf der tatsächlich angenommenen Teilchenbahn sind die Impulse und das Wirkungsintegral in beiden Formulierungen gleich. Aus Gl. (5.15) folgt 0 = δS =
=
Z
t2 t1
Z
t2 t1
∂H ∂H (δpq˙ + p δ q˙ − δq − δp)dt |{z} ∂q ∂p d dt δq
∂H δp(q˙ − )dt + ∂p
Z
t2
t1
d (pδq)dt − dt
Z
t2
t1
δq(p˙ +
∂H )dt . ∂q
(5.16)
Die Variationen δq und δp sind beliebig, außer, dass sie an den Endpunkten verschwinden sollen, δq(t1 ) = δq(t2 ) = δp(t1 ) = δp(t2 ) = 0 . Das 2. Integral verschwindet, da Z
t2 t1
d t (pδq)dt = (pδq)|t21 = 0 . dt
Wir erhalten also die Hamiltonschen Gleichungen aus dem Prinzip der kleinsten Wirkung, wenn wir δq und δp unabhängig variieren, da dann die jeweiligen Koeffizienten ∂H verschwinden müssen, (q˙ − ∂H ∂p ) = 0 und (p˙ + ∂q ). Bemerkungen: a) In der Lagrangeschen Mechanik ist p = p(q, q, ˙ t) und δp =
∂p ∂p ∂p d ∂p δq + δ q˙ = δq + δq . ∂q ∂ q˙ ∂q ∂ q˙ dt
D.h. δp ist keine unabhängige Variation. Beim Hamiltonschen Prinzip im Phasenraum vergisst man zunächst den Zusammenhang p = p(q, q, ˙ t) bzw. das Inverse q˙ = q(q, ˙ p, t) und behandelt q(t) und p(t) als unabhängige unbekannte Funktionen.
56
Kapitel 5. Hamiltonsche Mechanik Der Zusammenhang gilt nur für das Extremum, d.h. er folgt aus der HamiltonGleichung q˙ =
∂ ∂H = (pq˙ − L) ∂p ∂p
= q˙ + (p −
∂L ∂ q˙ ) ∂ q˙ ∂p
⇒ p=
∂L ∂ q˙
b) Streng genommen muss man bei der Ableitung der Hamiltonschen Gleichungen aus dem Wirkungsprinzip nur fordern dass δq(t1 ) = δq(t2 ) = 0. Die kanonischen Impulse können an den an den Randpunkten frei variieren. Energiesatz und kanonische Gleichungen: Sei H nicht explizit zeitabhängig H = H(q1 , . . . , qn ; p1 , . . . , pn ) . Dann gilt
dH ∂H = =0 dt (5.8) ∂t → H = konst. = E .
Das System bleibt also stets auf der „Energiefläche“ H = E. Nur wenn T quadratisch in q˙ und V unabhängig von q˙ ist, folgt aus Gl. (5.12), dass H = T + V ist. Für die relativistische Mechanik gilt beides nicht, trotzdem ist die durch Gl. (5.12) definierte Hamilton-Funktion zeitlich konstant. Zyklische Variable: Wenn in H = H(q1 , . . . , qn ; p1 , . . . , pn ) eine verallgemeinerte Koordinate, sagen wir qk , nicht vorkommt, dann ist der zugehörige kanonische Impuls pk erhalten (zeitlich konstant), da p˙ i = − ∂H ∂qi .
5.5
Liouvillesches Theorem
Ein klassischer Zustand wird durch einen Punkt (q1 , ...qn , p1 , ...pn ) im Phasenraum beschrieben. Für ein makroskopisches System von O(1024 ) Massenpunkten (Atome, Moleküle) kann man aber keine exakte Lösung der Bewegungsgleichungen finden, da man die Anfangsbedingungen für die einzelnen Atome nicht kennt. Ein gegebenes makroskopisches System ist kompatibel mit vielen mikroskopischen Systemen. In der Statistischen Mechanik geht man von einer großen Zahl von makroskopisch äquivalenten mechanischen Systemen aus, die sich nur durch die Wahl der Anfangsbedingungen unterscheiden. Diese Menge von Systemen wird als Gibbsches Ensemble oder (klassischer) statistischer Zustand bezeichnet. Jedes mikroskopische System entspricht einem Punkt in dem gemeinsamen Phasenraum, der sich mit der Zeit durch den Phasenraum entsprechend den Hamiltonschen Gleichungen bewegt. Die Punkte des Ensembles nehmen im Phasenraum zu einer bestimmten Zeit ein bestimmtes Volumen V ein. Wenn sich die Phasenraumpunkte bewegen, ändert sich das mitschwimmende Volumen. Das Liouvillesche Theorem besagt nun: Wenn die Dynamik durch die Hamiltonschen Gleichungen
5.5 Liouvillesches Theorem
57
Abbildung 5.1
beschrieben wird, dann ändert sich im Allgemeinen die Form des Volumens, die Größe des Volumens bleibt aber zeitlich konstant. Beweis: Die Geschwindigkeit im Phasenraum ist: v=(
dq1 dqn dp1 dpn , ... , , ... ). dt dt dt dt
Zu jedem Zeitpunkt t ist die zeitliche Änderung des Volumens V gleich dem Integral der Normalkomponente der Geschwindigkeit der Massenpunkte an der Oberfläche des Volumens. Dieses Oberflächenintegral ist nach dem Gaußschen Satz gleich dem Volumenintegral über die Divergenz der Geschwindigkeiten ! Z X n ∂ dqi ∂ dpi dV dq1 ...dqn dp1 ...dpn . = + dt ∂qi dt ∂pi dt i=1
Setzen wir jetzt die Hamiltonschen Gleichungen ein, so verschwindet das Integral ! Z X n ∂2H dV ∂2H dq1 ...dqn dp1 ...dp = 0 . (5.17) = − dt ∂qi ∂pi ∂pi ∂q1 i=1
Die statistischen Eigenschaften des Ensembles zu einer gegebenen Zeit t werden durch die Dichte der Punkte im Phasenraum ρ(q1 , . . . , qn , p1 , . . . , pn ; t) beschrieben (Einheiten: Punkte pro Volumenseinheit). Die Wahrscheinlichkeit, einen statistischen Zustand im Intervall dq1 ...dqn dp1 ...dp zu finden, ist ρdq1 ...dqn dp1 ...dp. Da jeder Punkt des Ensembles eine unterschiedliche Kopie des mikroskopischen Systems darstellt, ist die Zahl dieser Punkte erhalten und ρ erfüllt eine Kontinuitätsgleichung ∂ρ + div(ρv) = 0 ∂t oder
∂ρ + ρ(∇ ∙ v) + (v ∙ ∇)ρ = 0 . ∂t Wenn die Hamiltonschen Gleichungen gelten, ist ∇ ∙ v = 0 und für die Dichte der Punkte im Phasenraum gilt ∂ρ + (v ∙ ∇)ρ = 0 . ∂t Dies ist die lokale Form des Louivillschen Theorems.
58
5.6
Kapitel 5. Hamiltonsche Mechanik
Die Poissonschen Klammern
Die Poisson-Klammer für zwei beliebige Funktionen A = A(qi , pi , t) und B = B(qi , pi , t) der kanonischen Koordinaten qi und kanonischen Impulse pi ist definiert durch {A, B} ≡
X ∂A ∂B ∂A ∂B ( − ). ∂q ∂p ∂p i i i ∂qi i
(5.18)
Die Poisson-Klammer erfüllt offensichtlich folgende Beziehungen: {F, G} = −{G, F } {F, c} = 0
{(F1 + F2 ), G} = {F1 , G} + {F2 , G}
{F1 F2 , G} = F1 {F2 , G} + F2 {F1 , G}
Durch direktes Einsetzen zeigt man, dass die Poisson-Klammern die Jacobi-Identität erfüllen, {A, {B, C}} + {B, {C, A}} + {C, {A, B}} = 0 . (5.19)
Zu den kanonischen Koordinaten und Impulsen gehören die fundamentalen Klammern : {qi , qk } = {pi , pk } = 0
{qi , pk } = δik . Beweis der letzten Relation: {qi , pk } =
n X ∂qi ∂pk ∂qi ∂pk ( − ) = δik ∂qj ∂pj ∂pj ∂qj j=1 |{z} |{z} |{z} |{z} δik
=0
δkj
=0
Wir betrachten die zeitliche Entwicklung einer beliebigen Funktion F (qi , pi , t) der Koordinaten und Impulse. Unter F kann man sich eine physikalische Messgröße oder Observable vorstellen. Dann gilt d ∂F ∂F X ∂F ( q˙i + p˙ i ) F = + |{z} dt ∂t ∂qi ∂pi |{z} i ∂H ∂pi
∂H − ∂q
i
∂F X ∂F ∂H ∂F ∂H = ( − ). + ∂t ∂qi ∂pi ∂pi ∂qi i
D.h. die zeitliche Entwicklung einer Observablen F (qi , pi , t) wird durch die Gleichung d ∂F F = + {F, H} . dt ∂t beschrieben.
(5.20)
5.6 Die Poissonschen Klammern
59
Beispiele: a) Ein Spezialfall sind die kanonischen Koordinaten und Impulse selbst. Mit Hilfe der Poisson-Klammern lassen sich die Hamiltonschen Gleichungen schreiben als dqi = {qi , H} , dt
dpi = {pi , H}. dt
b) F ist eine Erhaltungsgröße oder Bewegungsintegral, wenn
dF dt
= 0 oder
∂F = −{F, H}. ∂t
(5.21)
Hängt die Erhaltungsgröße nicht explizit von t ab, so gilt {F, H} = 0. c) Das Luivillesche Theorem lässt sich mit Poisson-Klammern schreiben: ∂ρ = −{ρ, H}, ∂t
(5.22)
da n X dpi ∂ dqi ∂ + dt ∂qi dt ∂pi i=1 ! n X ∂H ∂ ∂H ∂ − ρ. ∂p ∂q ∂qi ∂pi i i i=1
∂ρ ~ = ∂ρ + + (~v ∙ ∇)ρ 0= ∂t ∂t =
∂ρ + ∂t
!
ρ=0
Poissonsches Theorem: Sind F und G zwei Erhaltungsgrößen, dann ist auch die Poisson-Klammer {F, G} eine Erhaltungsgröße. Beweis (für den Fall, dass F und G nicht explizit von der Zeit abhängen): Wir setzen in der Jacobi-Identität (5.19) A = F , B = G, C = H: {H, {F, G}} + {F, {G, H}} + {G, {H, F }} = 0 . | {z } | {z } =0
=0
Das bedeutet, dass {H, {F, G}} = 0 ist, woraus die Behauptung folgt. Das Poissonsche Theorem kann erneut angewendet werden, z.B. auf F und {F, G}. Die Anwendung liefert nicht unendlich viele neue Bewegungsintegrale. Es gibt maximal 2n−1 Bewegungsintegrale für n Freiheitsgrade. Das Verfahren bricht ab, wenn {F, G} = c (konstant) oder {F, G} eine Funktion von F und G ist.
60
Kapitel 5. Hamiltonsche Mechanik
Bedeutung der Hamiltonschen Mechanik: Die Hamiltonschen Gleichungen eignen sich meist nicht zur leichteren Berechnung von physikalischen Problemen der Mechanik. Diese werden besser mit dem LagrangeFormalismus gelöst. Der Hamilton-Formalismus eignet sich dagegen besonders für formale Untersuchungen. Er ist der Ausgangspunkt für die statistische Mechanik und erlaubt den Zusammenhang zwischen Quantenmechanik und Mechanik herzustellen, Quantenmechanik im Heisenbergbild −→ Hamiltonsche Mechanik }→0
Der Zusammengang wird über die Poissonschen Klammern und den Kommutator der Observablen (Operatoren) hergestellt {∙, ∙} Zum Beispiel gilt,
1 [∙, ∙]QM . i~
←−
}→0
[Qi , Pj ] = ı~δij
−→ {qi , pk } = δik
}→0
wobei Qi und Pj die Orts- und Impulsoperatoren der Quantenmechanik sind. Wenn AH eine beliebige Observable im Heisenberg-Bild ist, gilt in Analogie zu Gl. (5.20): ∂AH 1 dAH = [AH , H] + . dt ı~ ∂t Der Zusammenhang mit der Quantenmechanik sei hier nur kursorisch erwähnt. Er wird später ausführlich in den Kapiteln zur Quantentheorie besprochen.
Kapitel 6
Kanonische Transformationen 6.1
Punkt- und kanonische Transformationen
Lagrangesche Mechanik: Die Lagrangeschen Bewegungsgleichungen sind invariant unter beliebigen Punkttransformationen qi −→ Qi = Qi (qj , t) . Hamiltonsche Mechanik: Auch die Hamiltonschen Gleichungen behalten unter diesen Punkttransformationen ihre Form bei, da sie aus den Lagrangeschen Gleichungen abgeleitet werden können. Die Hamiltonschen Gleichungen lassen aber, neben den Punkttransformationen auch Transformationen in den kanonischen Impulsen zu, qi −→ Qi = Qi (p, q, t) pi −→ Pi = Pi (p, q, t) .
(6.1) (6.2)
Dies ist ein Vorteil der Hamiltonschen Formulierung. Die Transformationen sind jetzt allerdings nicht mehr beliebig, wenn sie dieselben Hamilton-Gleichungen ergeben sollen. Wenn die neuen Koordinaten und Impulse die Hamiltonschen Gleichungen erfüllen, dann heißen die Transformationen kanonische Transformationen. D.h. nach der Transformation soll gelten: ∂K ˙ ∂K Q˙ i = , Pi = − , ∂Pi ∂Qi wo K = K(Q, P, t) die transformierte Hamilton-Funktion ist. Wir werden gleich sehen, dass K(Q, P, t) nicht unbedingt identisch sein muss mit H(q(Q, P, t), p(Q, P, t), t). Wenn q, p und Q, P kanonische Koordinaten sein sollen, so müssen sie jeweils das Hamiltonsche Prinzip erfüllen, d.h. Z t2 X ( pi q˙i − H(q, p, t))dt = 0 (6.3) δ t1
i
62
Kapitel 6. Kanonische Transformationen
und δ
Z
t2
(
t1
X i
Pi Q˙ i − K(Q, P, t))dt = 0.
(6.4)
Die gleichzeitige Gültigkeit von (5.7) und (5.8) bedeutet nicht unbedingt, dass die Integranden gleich sind, sondern, dass sie sich höchstens um eine totale Zeitableitung unterscheiden, " !# X X d ˙ (6.5) pi q˙i − H − Pi Qi − K = F , dt i i wo F = F (q, p, Q, P, t) eine beliebige Funktion der alten und neuen Koordinaten ist, die erzeugende Funktion genannt wird. Wegen (6.1), (6.2) sind aber nur die Hälfte der Variablen q, p, Q, P linear unabhängig. Es gibt folgende Möglichkeiten: F1 (q, Q, t), F2 (q, P, t), F3 (p, Q, t), F4 (p, P, t) Es hängt vom Problem ab, welches F benutzt werden sollte. Wir werden sehen, dass die Transformationsgleichungen durch F vollständig festgelegt sind, daher der Name erzeugende Funktion. Betrachtet man die Abhängigkeit der Fi von den Variablen, so sieht man, dass aus einer erzeugenden Funktion, sagen wir F1 , die anderen durch sukzessive Anwendung von Legendre-Transformationen folgen. F1 , ...F4 stellen dieselbe kanonische Transformation dar. Wir betrachten die einzelnen Fälle. • Möglichkeit 1
F = F1 (q, Q, t)
Dann ergibt Gl. (6.5) X
pi q˙i − H −
X
d Pi Q˙ i + K = F1 (q, Q, t) dt X ∂F1 ∂F1 ˙ ∂F1 Qi + = q˙i + . ∂q ∂Q ∂t i i i
Da die Koordinaten qi , Qi hier als unabhängig angesehen werden, gilt pi =
∂F1 , ∂qi
Pi = −
∂F1 , ∂Qi
Beispiel 1: F1 (q, Q, t) =
K=H+
X
∂F1 . ∂t
qj Qj
j
Daraus folgt nun für pj und Pj pj = F
∂F1 = Qj ∂qj
und
Pj = −
∂F1 = −qj . ∂Qj
1 D.h. (q, p) −→ (Q = p, P = −q). Koordinate und Impuls werden vertauscht, sie verlieren ihre ursprüngliche Bedeutung.
6.1 Punkt- und kanonische Transformationen Beispiel 2:
63
F1 = cq 2 cot Q p
=
P
=
∂F1 = 2cq cot Q ∂q ∂F1 cq 2 − = ∂Q sin2 Q
(6.6) (6.7)
Diese beiden Gleichungen müssen nach q und p als Funktionen von P und Q aufgelöst werden. Aus (6.7) folgt r P sin Q. (6.8) q= c Nun setzen wir (6.8) in (6.6) ein und erhalten: √ p = 2 cP cos Q Damit lässt sich die neue Hamilton-Funktion schon berechnen. Betrachte den harmonischen Oszillator: mω 2 2 p2 + q H= 2m 2 Mit c = 12 mω und
∂F1 ∂t
= 0 folgt nun: K = H(q(P, Q), p(P, Q)) = ωP cos2 Q + ωP sin2 Q = ωP ≡ E = konst.
Die Hamilton-Funktion K ist zyklisch in Q, und der konjugierte Impuls P ist deshalb eine Konstante. E P = = konst. oder E = ωP = konst. ω E = konst. folgt auch daraus, dass numerisch K = H ist und hier ∂H dH = {H, H} + =0. dt ∂t Außerdem ist Q˙ =
∂H ∂P
=ω
Q = ωt + Q0 . Daraus folgt mit (6.8): r 2E sin(ωt + α) q= mω 2
→
Dabei ist α = Q0 durch die Anfangsbedingung gegeben. Es handelt sich hierbei also um eine harmonische Schwingung. Das Problem lässt sich natürlich auch elementar lösen. Es demonstriert aber, wie man durch geeignete kanonische Transformationen alle Koordinaten zyklisch machen kann. Die neuen Impulse sind dann sämtlich konstant (Integrale der Bewegung). Dies ist die Grundlage der Hamilton-Jacobi Theorie.
64
Kapitel 6. Kanonische Transformationen
• Möglichkeit II
F = F2 (q, P, t)
Der Übergang von q, Q nach q, P als unabhängige Variable entspricht einer LegendreTransformation, P d.h. es liegt nahe, F2 mit Hilfe von F1 zu definieren, F1 (q, Q, t) = F2 (q, P, t) − i Pi Qi , oder X Pi Q i F2 (q, P, t) = F1 (q, Q, t) + X d d Pi Qi ) = F2 (q, P, t). (F1 + dt dt i
i
Für die linke Seite ergibt sich mit Gl. (6.5) X X X X d Pi Q i ) = pi q˙i − H − Pi Q˙ i + K + (P˙ i Qi + Pi Q˙ i ) (F1 + dt i i i i X X = pi q˙i − H + K + P˙ i Qi i
i
und entsprechend für die rechte Seite
∂F2 ∂F2 ˙ ∂F2 d q˙i + F2 (q, P, t) = . Pi + dt ∂qi ∂Pi ∂t Jetzt sind q, P und t die unabhängigen Variablen, pi =
∂F2 , ∂qi
Qi =
∂F2 , ∂Pi
K=H+
∂F2 . ∂t
(6.9)
Bemerkung: Der Zusammenhang K(Q, P, t) = H(q(Q, P ), p(Q, P ), t) +
∂Fi (q(Q, P ), p(Q, P ), t) ∂t
(6.10)
gilt für alle Fi , i = 1, . . . , 4. Beispiel 1: F2 =
X
(6.11)
q j Pj
j
pi =
∂F2 = Pi , ∂qi
Qi =
∂F2 = qi ∂Pi
Dies ist die Einheitstransformation. Beispiel 2: F2 (q, P, t) =
s X
fj (q, t)Pj
j=1
−→
Qj =
∂F2 = fj (q, t) ∂Pj
(6.12)
6.2 Kanonische Transformationen und Poisson-Klammern
65
Dies entspricht der bekannten Punkttransformation im Konfigurationsraum. Die kanonischen Impulse sind auch von der Transformation betroffen. Man erhält sie durch Auflösung folgender Gleichung nach den Pi = Pi (pj , qj ). s
pj = Durch Auflösen erhält man
X ∂fi ∂F2 = Pi ∂qj ∂qj i=1
Pi = Pi (pj , qj )
• Möglichkeit III F = F3 (p, Q, t) Eine neue Legendre-Transformation F1 (q, Q, t) = Goldstein 2006): qi = −
∂F3 , ∂pi
Pi = −
Beispiel: F3 = − Dies ist (ebenso wie F2 = und K = H. • Möglichkeit IV
P
∂F3 , ∂Qi
X
P
qi pi + F3 (p, Q, t) liefert (siehe
K=H+
∂F3 ∂t
pj Qj
j
qj Pj ) die Identitätstransformation mit qi = Qi , Pi = pi
Die 4. Möglichkeit F = F4 (p, P, t) erreicht man über die Legendre-Transformation F4 (p, P, t) = F3 (p, Q, t) + P Q. Auf die gleiche Art wie oben findet man qj = −
6.2
∂F4 ∂F4 , Qj = . ∂pj ∂Pj
Kanonische Transformationen und Poisson-Klammern
Theorem: Die Poisson-Klammer ist invariant unter kanonischen Transformationen: {F, G}P,Q = {F, G}p,q Beweis: Die Indizes i, j seien unterdrückt. Aus der Definition der Poisson-Klammer folgt unmittelbar {Q, P }P,Q = {q, p}p,q = 1 .
66
Kapitel 6. Kanonische Transformationen
Wir betrachten die transformierten Funktionen F (q(Q, P ), p(Q, P )) und G(q(Q, P ), (Q, P )) . Nach der Kettenregel gilt ∂F ∂G ∂F ∂G − ∂q ∂p ∂p ∂q ∂F ∂Q ∂F ∂P ∂G ∂P ∂G ∂Q = + + ∂Q ∂q ∂P ∂q ∂P ∂p ∂Q ∂p ∂G ∂Q ∂G ∂P ∂F ∂P ∂F ∂P . − + + ∂P ∂p ∂P ∂p ∂Q ∂q ∂P ∂q
{F, G}q,p =
Betrachte z.B. den Beitrag ∂F ∂Q ∂G ∂P ∂F ∂P ∂G ∂Q − ∂Q ∂q ∂P ∂p ∂P ∂p ∂Q ∂q =
∂F ∂Q ∂P ∂G ∂F ∂P ∂Q ∂G − ∂Q ∂q ∂p ∂P ∂P ∂p ∂q ∂Q
=
∂G ∂F {Q, P } . ∂Q ∂P
Auf diese Weise erhält man {F, G}q,p =
oder
∂F ∂G ∂F ∂G {Q, Q} + {Q, P } ∂Q ∂Q ∂Q ∂P
+
∂F ∂G ∂F ∂G {P, Q} + {P, P } ∂P ∂Q ∂P ∂P
=
∂F ∂G ∂F ∂G − ∂Q ∂P ∂P ∂Q
{F, G}q,p = {F, G}Q,P .
(6.13)
{Qi (q, p, t), Pk (q, p, t)}pq = {Qi , Pk }P Q = δik
(6.14)
Eine Anwendung der Formel Gl. (6.13) ist
Die Bedingung
{Qi (q, p, t), Pk (q, p, t)}pq = δik
ist notwendig und hinreichend für eine kanonische Transformation. Damit können wir feststellen, ob eine Transformation kanonisch ist, ohne die erzeugende Funktion F zu kennen.
6.3 Infinitesimale kanonische Transformationen
6.3
67
Infinitesimale kanonische Transformationen Qi = qi + δqi Pi = pi + δpi
(6.15) (6.16)
Die Transformation unterscheidet sich auch nur infinitesimal von der Einheitstransformation, F2 (q, P, t) = qi Pi + εG(q, P, t)
ε1.
Die Funktion ∂F2 (q, P, t) ∂ε
G(q, P, t) =
heißt infinitesimale Erzeugende der Transformation (F war die Erzeugende der endlichen Transformation). Wir unterdrücken im Folgenden die t-Abhängigkeit. Nach Gl. (6.12) gilt pi =
∂F2 ∂G(q, P ) = Pi + ε ∂qi ∂qi
→
δpi = −ε
∂G(q, P ) ∂qi
und Qi =
∂F2 ∂G(q, P ) = qi + ε ∂Pi ∂Pi
→
δqi = ε
∂G . ∂Pi
Da ∂G(q, p + δp) ∂G(q, p) ∂G(q, p + δp) ∂G(q, p) = + O(δpi ) und + O(δpi ), = ∂qi ∂qi ∂(pi + δpi ) ∂pi können wir auch schreiben δpi = −ε
∂G(q, p) , ∂qi
δqi = ε
∂G(q, p) . ∂pi
Die infinitesimalen kanonischen Transformationen lassen sich durch Poisson-Klammern ausdrücken, ∂G(q, p) = {G, pi }, ∂qi
∂G(q, p) = −{G, qi } . ∂pi
Beweis: {G, pi } = und analog für {G, qi }.
∂G ∂pi ∂G ∂pi ∂G − = δik ∂qk ∂pk ∂pk ∂qk ∂qk
68
Kapitel 6. Kanonische Transformationen
Wie ändert sich nun eine skalare Funktion unter der infinitesimalen Transformation (6.15), (6.16)? U (q, p) −→ U (Q, P )
gleiche funktionale Abhängigkeit, nur q, p → Q, P δU = U (q + δq, p + δp) − U (q, p) ∂U ∂U = δq + δp ∂q ∂p ∂U ∂G ∂U ∂G − ], = ε[ ∂q ∂p ∂p ∂q
oder
δU = ε{U, G} .
(6.17)
Sei speziell U = H, die Hamilton-Funktion. Wir hatten gezeigt, dass G eine Erhaltungsgröße ist, wenn {G, H} = 0 ist. D.h. Infinitesimale Erzeugende, die die HamiltonFunktion invariant lassen, sind Erhaltungsgrößen. Man kann alle Erhaltungsgrößen oder Bewegungsintegrale aus den Symmetrien der Hamilton-Funktion ablesen. Beispiele für infinitesimale Erzeugende: 1. Der Impuls: Betrachte Translationen in den kartesischen Koordinaten ~x eines einzelnen Teilchens um einen konstanten Vektor ε~e, ~x → ~x + ε~e,
δ~ p=0.
e ∙ p~, d.h. G ist die Komponente des Impulses in Richtung Da δ~x = ε ∂G ∂~ p folgt G = ~ ~e der Translation. Die Verallgemeinerung für ein N -Teilchensystem lautet ~xi → ~xi + ε~ei , G = ~e ∙ P~ ,
δ~ pi = 0 P~ =
N X
p~i
(i = 1...N ). (Gesamtimpuls)
i=1
Eine skalare Observable transformiert sich unter Translationen entsprechend Gl. (6.17) δU = ~ε ∙ {U, P~ } Der Impuls ist die infinitesimale Erzeugende der Translationen eines Systems. 2. Drehimpuls: Betrachte Drehungen um die z-Achse: x0i = cos θxi + sin θyi yi0 = − sin θxi + cos θyi .
Der Index i = 1...N , der die Teichen numeriert, sei im Folgenden unterdrückt. Für infinitesimale Winkel δθ erhält man x0 = x + δθy y 0 = −δθx + y
→ δx = δθy → δy = −δθx .
6.4 Hamilton-Jacobi-Gleichung
69
Der Impuls p ist ein Vektor, d.h. er transformiert sich unter Drehungen wie der Ortsvektor p0x = px + δθpy p0y = −δθpx + py
→ δpx = δθpy → δpy = −δθpx
∂G ∂G Es war δqi = ε ∂p , δpi = −ε ∂q mit G = G(q, p). Wir vermuten, dass G mit der i i z-Komponente des Drehimpulses zusammenhängt und versuchen den Ansatz
G = −[x × p]z = −(xpy − ypx ) . Damit erhält man ∂G = δθy; ∂px ∂G δpx = −δθ = δθpy ; ∂x δx = δθ
∂G = −δθx ∂py ∂G δpy = −δθ = −δθx ∂y
δy = δθ
Bei einer Drehung um die z-Achse ist also die Erzeugende G = −Lz . Analog behandelt man Drehungen um die x- und y-Achsen. Der Drehimpuls ist die infinitesimale Erzeugende der Drehungen eines mechanischen Systems. 3. Hamilton-Funktion: Es sei G = H(q, p) und ε = dt ein kleines Zeitintervall. Dann gilt ∂G ∂pi ∂G δpi = −ε ∂qi δqi = ε
∂H = q˙i dt ∂pi ∂H → δpi = −dt = p˙ i dt. ∂qi → δqi = dt
Diese Transformation erzeugt (q(t), p(t)) −→ (q(t + dt), p(t + dt)) = (q(t) + q(t)dt, ˙ p(t) + p(t)dt) ˙ . Die Hamilton-Funktion ist die Erzeugende der zeitlichen Entwicklung eines Systems. Die Betrachtung der zeitlichen Entwicklung eines System als eine Folge von kanonischen Transformationen erweist sich als fruchtbar in der höheren analytischen Mechanik.
6.4
Hamilton-Jacobi-Gleichung
Gesucht ist eine kanonische Transformation vom Typ F2 (q, p), für die die transformierte Hamilton-Funktion gleich 0 ist. Dann ergibt Gl. (6.10) 0 = K(Q, P, t) = H(q(Q, P ), p(Q, P ), t) +
∂F2 (q(Q, P ), p(Q, P ), t) . ∂t
(6.18)
70
Kapitel 6. Kanonische Transformationen
Daraus folgten (Gl. (6.9)) die Beziehungen pi =
∂F2 , ∂qi
Qi =
∂F2 , ∂Pi
K=H+
∂F2 . ∂t
Wegen
dPi dQi = {Qi , K} , = {Pi , K} dt dt alle P und Q konstant. Die zeitliche Entwicklung muss also in der kanonischen Transformation stecken. In der Hamilton-Jacobi-Theorie bezeichnet man dieses spezielle F2 (q, p, t) mit S(q, p, t). Damit ergibt Gl. (6.18) die Hamilton-Jacobi-Gleichung H(q1 , ...qn ,
∂S ∂S ∂S ..., )+ = 0. ∂q1 ∂qn ∂t
Dies ist eine nicht-lineare partielle Differentialgleichung erster Ordnung, in der im All∂S und ∂S gemeinen alle partiellen Ableitungen ∂q ∂t auftreten. i
Kapitel 7
Drehungen Drehungen spielen in der gesamten Physik eine nicht zu unterschätzende Rolle. Dies hat seinen Ursprung in der Isotropie des Raumes und der daraus folgenden Drehimpulserhaltung. Beispiele aus der klassischen Mechanik sind die Planetenbewegung, rotierende Koordinatensysteme und der starre Körper. In der Elektrodynamik basiert die Multipolentwicklung auf der sphärischen Symmetrie des Feldes einer Punktladung. Eine noch größere Rolle spielen Drehungen in der Quantentheorie. Hier werden die Drehungen durch die Drehimpulsoperatoren erzeugt. Die Drehimpulsanalyse in der Quantenmechanik ist wesentlich für die Interpretation von Streuexperimenten und für das Verständnis der Spektroskopie der Atome und Moleküle. Da die Elementarteilchen punktförmig sein sollen, müssen die zugehörigen Quantenfelder Darstellungen der Drehgruppe bilden. Sie können einen Eigendrehimpuls oder Spin aufweisen, der kein Äquivalent in der klassischen Mechanik hat. Für ein gründliches Verständnis der Drehungen ist ein gewisser Formalismus unumgänglich, den wir an dieser Stelle einführen wollen.
7.1
Drehmatrix
Wir betrachten in diesem Kapitel die festen Rotationen eines kartesischen Koordinatensystems K in ein anderes kartesisches Koordinatensystem K 0 . Dabei wird ein gegebener Komponentenvektor x in einen anderen Komponentenvektor x0 übergeführt. Wegen der Linearität des Raumes ist diese Operation linear. Wenn wir lineare Operatoren auf einem Euklidischen Vektorraum betrachten wollen, so ist es vorteilhaft, die Vektoren nicht als Zeilen- sondern als Spaltenvektoren zu schreiben. Dann wirken die Operatoren nach den üblichen Regeln der Matrizenrechnung auf die Spaltenvektoren. Wir ordnen also die Komponenten des Ortsvektors eines Massenpunktes in einem gegebenen Koordinatensystem K als Spaltenvektor (3 × 1-Matrix) an und schreiben x1 x ≡ x2 = (x1 , x2 , x3 )T , x3
72
Kapitel 7. Drehungen
mit x1 = x, x2 = y, x3 = z. Wenn es der Verdeutlichung dient, schreiben wir manchmal auch ~x für x. Als einfaches Beispiel betrachten wir eine Drehung des Koordinatensystems um einen Winkel θ um die z-Achse. Sei K das ursprüngliche Koordinatensystem und K 0 das gedrehte Koordinatensystem. Der Zusammenhang zwischen den Koordinaten war: x0 = x cos θ + y sin θ y 0 = −x sin θ + y cos θ z0 = z , oder umgekehrt x = x0 cos θ − y 0 sin θ y = x0 sin θ + y 0 cos θ z = z0.
In Matrixform lautet die Drehung um einen Winkel θ3 um die z-Achse, bzw. um den Einheitsvektor e3 um einen Winkel θ3 x0 = M (e3 , θ3 )x mit
cos θ3 M (e3 , θ3 ) = − sin θ3 0
sin θ3 cos θ3 0
0 0 . 1
(7.1)
Analog erhält man für Drehungen um die y-Achse (Einheitsvektor e2 ) und x-Achse (Einheitsvektor e1 ) cos θ2 0 − sin θ2 1 0 M (e2 , θ2 ) = 0 (7.2) sin θ2 0 cos θ2 1 0 0 sin θ1 . M (e1 , θ1 ) = 0 cos θ1 (7.3) 0 − sin θ1 cos θ1 In Komponentenschreibweise lauten die Drehungen x0i =
3 X
Mik xk .
(7.4)
k=1
Im Folgenden verwenden wir wieder die Einsteinsche Summenkonvention, d.h. über doppelt vorkommende Indizes wird summiert. Dann schreibt sich Gl. (7.4) einfach x0i = Mik xk . Die Gleichung bedeutet, dass die Matrix M auf die Komponenten des Vektors im System K wirkt, um die Komponenten des selben Vektors im System K 0 zu erzeugen.
7.2 Infinitesimale Drehungen
73
Richtungskosinus: Der gegebene Vektor a kann in beiden Koordinatensystemen ausgedrückt werden: a = x1 e1 + x2 e2 + x3 e3 = x01 e01 + x02 e02 + x03 e03 Wegen der Orthonormalität der Einheitsvektoren, folgt x01 = x1 (e1 ∙ e01 ) + x2 (e2 ∙ e01 ) + x3 (e3 ∙ e01 ) etc. Wenn wir Richtungskosinusse definieren, ei ∙ e0k = cos(ei , e0k ) = cos θik , i, k = 1, 2, 3 , dann sind die Matrixelemente Mik durch die Richtungskosinusse gegeben, Mik = cos(e0i , ek ) . Eine allgemeine Drehung wird charakterisiert durch eine Drehachse n und einen Drehwinkel φ. Sie lässt sich aus drei unabhängigen Drehungen um die kartesischen Achsen erzeugen, zwei Drehungen (z.B. der z-Achse) um die Drehachse zu erreichen und eine weitere für den Drehwinkel um diese Achse. Es gibt verschiedene Vorschriften, die drei Drehungen vorzunehmen (s. Euler-Winkel im folgenden Kapitel).
7.2
Infinitesimale Drehungen
Für sehr kleine Drehwinkel können wir Beiträge O(θi2 ) vernachlässigen und erhalten 0 1 0 M (e3 , θ3 ) = 1 + θ3 −1 0 0 ≡ 1+θ3 X3 0 0 0 0 0 −1 M (e2 , θ2 ) = 1 + θ2 0 0 0 ≡ 1+θ2 X2 1 0 0 0 0 0 M (e1 , θ1 ) = 1 + θ1 0 0 1 ≡ 1+θ1 X1 ´0 −1 0 mit 3 × 3-Matrizen 0 0 0 0 0 X1 = 0 0 1 , X2 = 0 0 ´0 −1 0 1 0
−1 0 1 0 0 , X3 = −1 0 0 . 0 0 0 0
(7.5)
Die antisymmetrischen Matrizen Xi heißen infinitesimale Erzeugende der Drehungen. Die Erzeugenden der infinitesimalen Drehungen lassen sich in Komponenten schreiben als: (Xi )jk = εijk (7.6)
74
Kapitel 7. Drehungen
Die antisymmetrischen Matrizen Xi spannen einen dreidimensionalen Vektorraum auf, jede antisymmetrische 3 × 3-Matrix lässt sich als Linearkombination der Xi schreiben. Bedingungen an die Matrix M : Die Länge eines Vektors ändert sich nicht unter Drehungen, x0j x0j = xj xj
(x02 = x2 ) ,
oder Mji xi Mjk xk = xj xj . Daraus folgen die Bedingungen an die Drehmatrix Mji Mjk = δik ,
(7.7)
M T M = 1 und M M T = 1
(7.8)
oder in Matrixnotation d.h. M ist eine orthogonale Matrix. Gl. (7.7 ) ist symmetrisch in i und k. Damit ergeben sich 6 Bedingungen (3 diagonale und 3 nicht-diagonale, z.B. Mj1 Mj2 = 0), d.h. M hat nur 9 − 6 = 3 unabhängige Parameter. Von den 9 Einträgen der Matrix M sind nur 3 unabhängig. Aus detM T M = detM T detM = (detM )2 = det1 = 1 folgt det M = ±1. Für eigentliche Drehungen, die stetig aus der Einheit hervorgehen gilt det M = +1. Transformationen mit det M = −1 involvieren Drehungen plus Spiegelungen.
Abbildung 7.1: Nicht-vertauschende Drehungen
7.3 Drehgruppe
75
Zwei aufeinanderfolgende Drehungen vertauschen im Allgemeinen nicht. Wenn wir eine Streichholzschachtel zuerst um 900 um die x-Achse drehen und dann um 90◦ um die yAchse, dann erhalten wir etwas anderes als bei Drehungen in umgekehrter Reihenfolge. Bemerkung: Wenn man das Koordinatensystem dreht, spricht man von einer passiven Drehung. Alternativ kann man auch den physikalischen Apparat drehen und die Koordinatenachsen festhalten, dann spricht man von einer aktiven Drehung. Offensichtlich unterscheiden sich die jeweiligen Drehwinkel um ein Vorzeichen. Im Rahmen der Mechanik verwenden wir die passive Betrachtung.
7.3
Drehgruppe
Die Drehmatrizen M bilden eine Gruppe, die Drehgruppe O(3) bzw. SO(3) det M = +1, d.h.
für
1. Das Produkt zweier orthogonalen Matrizen ist wieder orthogonal, (M1 M2 )(M1 M2 )T = M1 M2 M2T M1T = 1 . Zwei aufeinander folgende Drehungen R1 und R2 , die beschrieben werden durch die Koordinatentransformationen x0 = M2 M 1 x , sind äquivalent einer einzigen Drehung x0 = M3 x mit M3 ≡ M2 M1 orthogonal. 2. Assoziativität: M1 (M2 M3 ) = (M1 M2 )M3 (gilt allgemein für Matrizenmultiplikation) 3. Identität: (physikalisch: keine Drehung) M1 = M = M Die 3 × 3 Einheitsmatrix 1 ist eine orthogonale Matrix. 4. Inverses: (physikalisch: Drehung im ungekehrten Sinne) M M −1 = M −1 M = 1 , da M −1 = M T eine orthogonale Matrix ist. Exponentielle Schreibweise: Eine orthogonale Matrix mit det M = +1 kann in der Form geschrieben werden M = eA , wo A antisymmetrisch ist und die Exponentialfunktion einer Matrix A definiert ist durch die Reihenentwicklung eA ≡ 1 + A +
1 1 AA + AAA + ∙ ∙ ∙ 2! 3!
76
Kapitel 7. Drehungen
Die Antisymmetrie zeigt man unmittelbar, T
M M T = eA eA = 1 → AT = −A . Bemerkung: Im Allgemeinen gilt für zwei n × n-Matrizen nicht, dass eA eB = e(A+B) . Wenn der Kommutator [A, B] = c eine Zahl ist, gilt die Campell-Baker-HausdorffFormel 1 eA eB = e(A+B+ 2 [A,B]) . Wir brauchen 3 Parameter zur Beschreibung der daher in der Form schreiben: 0 a12 0 A = −a12 −a13 −a23 Es folgt, dass
Matrix A (oder M ). Sie lässt sich a13 a23 0
SpA = detA = 0 .
(7.9)
(7.10)
Wir hatten argumentiert, dass jede antisymmetrische 3 × 3-Matrix eine Linearkombination der Basismatrizen X1 , X2, X3 aus Gl. (7.5) ist. D.h. 0 0 0 0 0 −1 0 1 0 (7.11) A(~b) = b1 0 0 1 + b2 0 0 0 + b3 −1 0 0 , 0 −1 0 1 0 0 0 0 0
oder
Aik = εike be .
(7.12)
~ der DrehWir zeigen jetzt, dass die Richtung von ~b die Drehachse ~n ist und, dass |b| ~ winkel ist. D.h. b = φ~n und ~ , A = φ~n∙X wo wir die Xi in Vektornotation geschrieben haben. • ~b ist Eigenvektor von A zum Eigenwert 0 Aik bk = εike be bk = 0 • ~b ist Eigenvektor von M zum Eigenwert 1 1 M~b = (1 + A + AA + ∙ ∙ ∙ )~b = ~b. 2 Die Drehmatrix M ändert ~b nicht, d.h. ~b ist die Drehachse. • |~b| ist der Drehwinkel. Beweis für eine Drehung um die z-Achse: Aik = εik3 b3
7.3 Drehgruppe
77
Wenn wir b3 = φ setzen, dann ist A in Matrixschreibweise gegeben durch 0 1 0 A = εφ mit ε = −1 0 0 0 0 0
Es gilt (im 2 × 2 Unterraum) 0 1 0 1 −1 = ε2 = −1 0 −1 0 0 oder allgemein
ε2n = (−1)n 1,
0 −1
ε3 = −ε
= −1,
ε2n+1 = (−1)n ε .
Damit wird 1 2 1 A + A3 + ∙ ∙ ∙ 2! 3! 1 1 = 1 + εφ − 1φ2 − εφ3 + ∙ ∙ ∙ 2! 3! 1 1 1 1 = 1(1 − φ2 + φ4 + ..) + ε(φ − φ3 + φ5 + ..) 2! 4! 3! 5! = 1 cos φ + ε sin φ.
eA = 1 + A +
Da 1 cos φ + ε sin φ =
cos φ − sin φ
sin φ cos φ
,
folgt durch Vergleich mit Gl. (7.1), dass φ gleich dem Drehwinkel ist. Die gesamte Information zu den Drehungen im R3 steckt in den Erzeugenden Xi , die auch als Basismatrizen der Drehungen aufgefasst werden können. Die Erzeugende bilden die Lie-Algebra der Drehgruppe und erfüllen die Vertauschungsrelationen [Xi , Xk ] = −εikl Xl . Die gleichen Vertauschungsrelationen gelten in der Quantenmechanik, bis auf Faktoren i und ~. Beispiel: 0 0 0
[X1 , X2 ] 0 0 0 0 0 1 0 0 −1 0 1 0
−1 0 0 0 − 0 0 0 1 0
−1 0 0 0 0 −1 0 0 0 0 1 = 1 0 0 0 0 −1 0 0 0 0
Wir betrachten infinitesimale Drehungen um einen Winkel δφ und Achse ~n: M =1+A ~ = 1 + δφ~n∙X.
78
Kapitel 7. Drehungen
Im Gegensatz zu endlichen Drehungen vertauschen infinitesimale Drehungen, ~ ~ ~ ~ M1 M2 − M2 M1 = (1 + δφ1~n1 ∙X)(1 + δφ2~n2 ∙X)−(1 + δφ2~n2 ∙X)(1 + δφ1~n1 ∙X) ~ + δφ2~n2 ∙X ~ − (1 + δφ1~n1 ∙X ~ + δφ2~n2 ∙X)+O ~ (δφ)2 = 1 + δφ1~n1 ∙X = 0 + O (δφ)2 .
Eine endliche Drehung um eine Achse ~n kann als unendliche Folge von infinitesimalen Drehungen aufgefasst werden, N φ ~ ~ = eφ~n∙X . M (~nφ) = lim 1 + ~n∙X N →∞ N
7.4
Drehungen und Observable
Betrachte eine physikalische Größe F (x), die an einem Punkt P in einem Koordinatensystem K durch eine einzige Zahl bestimmt ist z.B. die Dichte. Dann muss offenbar der in K 0 beobachtete Wert F 0 (P ) gleich sein mit F (P ).
Abbildung 7.2: Skalare Dichte bei Drehung des Koordinatensystems
Sei x die Koordinate des Punktes P in K und x0 die Koordinate von P in K 0 . Da sich x und x0 unter der Drehung des Koordinatensystems auf denselben Punkt P beziehen, gilt F 0 (P ) = F (P ) oder F 0 (x0 ) ≡ F (x(x0 )) = F (x) ,
wo F (x(x0 )) im Allgemeinen eine andere Funktion ist. Die Gleichheit F (x) = F 0 (x0 ) gilt nur numerisch. Man bezeichnet eine Funktion F (x), für die unter einer Drehung F (x) = F 0 (x0 ) gilt, als Skalar. Wenn zusätzlich gilt F 0 (x0 ) = F (x0 )
oder
F 0 (x) = F (x)
(dieselbe Funktion), dann ist F (x) eine Invariante. Beispiel: Drehung um die z-Achse, x = x0 cos θ − y 0 sin θ,
y = x0 sin θ + y 0 cos θ
7.5 Tensoren
79
Sei
F (x) = x + y .
Dann ist F 0 (x0 ) = F (x(x0 )) = (x0 cos θ − y 0 sin θ) + (x0 sin θ + y 0 cos θ) = x0 (cos θ + sin θ) + y 0 (cos θ − sin θ) 6= x0 + y 0 . D.h. F (x) = x + y ist ein Skalar, aber nicht invariant. Sei
F (x) = x2 + y 2 .
Dann folgt F 0 (x0 ) = F (x(x0 )) = (x0 cos θ − y 0 sin θ)2 + (x0 sin θ + y 0 cos θ)2 = x02 + y 02 = F (x0 )
invariant.
Der Betrag des Vektors x ändert sich nicht unter Drehungen, er ist ein invarianter Skalar.
7.5
Tensoren
Als Nächstes betrachten wir eine physikalische Größe, die n Komponenten in K hat, (F1 (x) , F2 (x) , ∙ ∙ ∙ Fn (x)) . Im gedrehten System K 0 finden wir für die n Komponenten (F10 (x0 ) , F20 (x0 ) , ∙ ∙ ∙ Fn0 (x0 )) . Ein Beispiel mit n = 3 wäre das elektrisches Feld E (x). Da der Raum linear und homogen sein soll, hängen die F 0 mit den F über eine lineare homogene Transformation zusammen n X Tik Fk (x) Fi0 (x0 ) = k=1
Die n×n Matrizen T hängen nur von den drei Drehwinkeln ab, die K und K 0 verbinden.
Wir betrachten jetzt zwei aufeinanderfolgende Drehungen R2 R1 , die K1 → K2 → K3 transformieren. Diese sind äquivalent einer einzigen Drehung R3 von K1 → K3 . Daher müssen wir verlangen, dass T (R2 ) T (R1 ) = T (R3 )
Matrizenmultiplikation .
Wäre T (R2 ) T (R1 ) 6= T (R3 ), so würden wir für die physikalische Größe F jeweils verschiedene Ergebnisse erhalten, wenn wir K1 direkt in K3 drehen oder in zwei Schritten. Man sagt, die Tik (R), i, k = 1, 2...n bilden eine n-dimensionale Darstellung der Drehgruppe O (3).
80
Kapitel 7. Drehungen
Skalare: n = 1 F 0 (x0 ) = F (x) ,
T =1
Da R2 R1 = R3 sein muss, ist 1 die einzige eindimensionale Darstellung. Vektoren: n = 3 Jede Größe Ai (x) mit 3 Komponenten, die sich unter Drehungen so transformiert wie die Koordinaten, heißt Vektor, A0i (x0 ) = Mik (α, β, γ) Ak (x) ,
i, k = 1, 2, 3 .
In diesem Fall sind T = M die Drehmatrizen selbst, α, β, γ die unabhängigen Drehwinkel. Vektoren heißen auch Tensoren 1. Stufe. Beispiel: E (x) =
e x |x|3
Coulombsches Gesetz
E (x) ist das elektrische Feld am Punkt x, das von einer Ladung e am Ursprung herrührt. E (x) transformiert sich unter Drehungen offensichtlich wie der Ortsvektor x. Tensoren 2. Stufe: Andere Darstellungen können gefunden werden, indem man direkte Produkte von Vektoren bildet, z.B. ~⊗B ~ : A
Ai Bk ,
i, k = 1, 2, 3
direktes Produkt, Dyade.
Die entsprechenden 9 Größen, die ein Beobachter in K 0 , feststellt, sind: A0i Bk0 = Mil Mkm Al Bm Jede Größe Fik mit 9 Komponenten, die sich unter Drehungen transformiert wie 0 Fik = Mil Mkm Flm
heißt Tensor 2. Stufe. In Matrixnotation lautet das Tranformationsverhalten F0 = MFMT . R Ein Beispiel ist der Trägheitstensor Iik = d3 xρ (x) δik r2 − xi xk .
Wir zeigen jetzt, dass M ⊗ M eine Darstellung der Drehgruppe bildet, d. h. dass für R2 R1 = R3 gilt: (M2 ⊗ M2 ) (M1 ⊗ M1 ) = (M2 M1 ) ⊗ (M2 M1 ) = (M3 ⊗ M3 ) ,
wo das direkte Produkt zweier Matrizen definiert ist durch A ⊗ B : Aik Blm .
7.5 Tensoren
81 M
M
Beweis: Wir betrachten zwei Transformationen F →1 F 0 →2 F 00 in Komponentenschreibweise, 00 2 2 1 1 = Mil2 Mkj Flj0 = Mil2 Mkj Mlm Mjn Fmn Fik
= (M2 M1 )im (M2 M1 )kn Fmn = (M3 )im (M3 )kn Fmn . Die Darstellung M ⊗ M ist jedoch reduzibel, d.h. es gibt bestimmte Mengen von Elementen, die sich unter Drehungen nur ineinander transformieren. Im Folgenden wollen wir die irreduziblen Anteile der Darstellung M ⊗ M bestimmen. Jeder Tensor lässt sich in einen symmetrischen und in einen antisymmetrischen Teil aufspalten, Fik =
1 1 (Fik + Fki ) + (Fik − Fki ) . 2 2
Diese Aufspaltung hat invariante Bedeutung (siehe unten). Ein symmetrischer Tensor 2. Stufe hat 6 unabhängige Komponenten ⊗ ⊗ ⊗ ⊗ ⊗ . ⊗ Ein antisymmetrischer Tensor hat 3 unabhängige Komponenten 0 ⊗ ⊗ 0 ⊗ Aik = εikl Bl . 0
Man schreibt
M ×M =
(3) 0
0 (6)
.
Die Zahl in den Klammern gibt die Dimension der Untermatrix an. Die entsprechenden Elemente von Fih transformieren sich nur untereinander [(× × ×) (× × × × ××)] . Der 6-dimensionale Teil kann noch einmal in einen eindimensionalen und einen 5-dimensionalen Teil ausreduziert werden, da die Spur Fii invariant ist. Man schreibt (1) (3) M ×M = (5) oder
M × M = 1 ⊕ 3 ⊕ 5.
Analog kann man Tensoren höherer Stufe konstruieren. Für einen Tensor n-ter Stufe gilt Fk0 1 ∙∙∙kn (x0 ) = Mk1 i1 ∙ ∙ ∙ Mkn in Fi1 ∙∙∙in (x) .
82
Kapitel 7. Drehungen
Beispiel: Ai Bl Cj (Tensor 3. Stufe, wenn Ai , Bl , Cj Vektoren sind) Man kann zeigen, dass die irreduziblen Darstellungen der Drehgruppe ungerade Dimension haben. Zusammenfassung: Jede Observable mit n Komponenten muss sich unter Drehungen wie eine n-dimensionale Darstellung von O (3) transformieren.
7.6
Tensoralgebra
Folgende Operationen mit Tensoren sind erlaubt 1) Addition von Tensoren der gleichen Stufe : Seien Fkl... , und Gkl... Tensoren der Stufe n, dann ist Tkl ≡ αFkl... + βGkl . . . ein Tensor der Stufe n. 2) Direktes Produkt : Sei Fkl... ein Tensor der Stufe n und Gij... ein Tensor der Stufe m, dann ist Fkl . . . Gij ∙ ∙ ∙ = Hkl...ij... ein Tensor der Stufe n + m. 3) Verjüngung : Wir addieren alle Komponenten mit gleichen Indizes in einem Paar, z.B. 3 3 X X Fklm = Fklk = Fklk = F1l1 + F2l2 + F3l3 . Gl = k=m=1
k=1
Auf diese Weise wird die Stufe des Tensors um zwei reduziert. 4) Symmetrisierung : Jeder Tensor kann in einen symmetrischen und in einen antisymmetrischen Teil bezüglich jedes Indexpaares aufgespalten werden, z.B. Fikl =
1 1 (Fikl + Flki ) + (Fikl − Flki ) {z } 2| {z } 2| symm. in i,l
antisym. in i,l
Ein völlig symmetrischer Tensor wird konstruiert, indem man die Summe aller möglicher Permutationen von Indizes bildet, z.B. Fikl + Fkli + Flik + Fkil + Flki + Filk Wenn man die geraden Permutationen mit + und die ungeraden mit − nimmt, erhält man einen völlig antisymmetrischen Tensor. Die Regeln 1–4 haben absolute Bedeutung, d.h. sie gelten in K und K 0 , wo K und K 0 über eine Drehung zusammenhängen, z.B. 0 Gl = Fklk → G0l = Fklk
7.6 Tensoralgebra
83
Beweis: G0l = Mls Gs = Mls Fksk = Mls δik Fisk = Mls Mmi Mmk Fisk = Mls Mmi Mnk δnm Fisk 0 0 = δnm Fmln = Fmlm Invariante Tensoren: Es gibt keinen Vektor, der in jedem Koordinatensystem die gleichen Komponenten hat, aber es gibt Tensoren höherer Stufe mit diesen Eigenschaften. Ein Beispiel ist die Einheitsmatrix δik in K, 1 0 0 δik = 0 1 0 . 0 0 1
In K 0 ist dann
0 δik = Mil Mkm δlm = Mil Mkl = Mil M T
lk
= δik
d.h. δik hat den gleichen Wert in allen Koordinatensystemen, die durch Drehungen auseinander hervorgehen. Ein invarianter Tensor 3. Ranges ist der total antisymmetrische Epsilon-Tensor. Unter Drehungen transformiert er sich wie folgt: ε0kms = Mkl Mmn Mst εlnt Für beliebige 3 × 3 Matrizen gilt Ail Ajm Akn εlmn = εijk det A . Es folgt, dass εijk invariant ist unter den eigentlichen Drehungen mit det M = 1, ε0kms = det M εkms = εkms . Erlaubt man auch Spiegelungen, dann ist εijk kein Tensor, da det M = −1. Ein Tensor mit dem Transformationsgesetz A0ij... = Mik Mjl . . . Akl... det M heißt Pseudotensor. Beispiele sind A ∙ (B × C) = Ai εijk Bj Ck (B × C)i = εijk Bj Ck
Pseudoskalar Pseudovektor.
Ableitungen: Ist ein Tensor eine Funktion der Koordinaten (Tensorfeld ), so kann Differenzieren zu den erlaubten Operationen genommen werden. Differenziert man jede Komponente
84
Kapitel 7. Drehungen
eines Tensors nach x1 , x2 und x3 , so erhält man einen Tensor mit einem um 1 erhöhten Rang ∂Fik . . . ≡ ∂m Fik... = Gmik... ∂xm Wir beweisen dieses Ergebnis für ein Skalarfeld F (x): Die Ableitung relativ zu einem System K ist ∂F ∂F ∂F ∂F d.h. ( , , ). ∂xi ∂x ∂y ∂z In einem um einen festen Winkel gedrehten System K 0 ist der Skalar gegeben durch ∂F 0 (x0 ) F 0 (x0 ) mit Ableitungen ∂x0 . Wir müssen beweisen, dass i
∂F ∂F 0 ? = Mik . ∂x0i ∂xk Die Definition eines Skalars war: F 0 (x0 ) = F (x(x0 ))
( = F (x)
numerisch )
0
∂F ∂xk ∂F = ∂x0i ∂xk ∂x0i Aus x0 = M x folgt x = M T x0 und somit ∂xk ∂ ∂ T 0 = (M T x0 )k = (Mkl xl ) = Mlk δil = Mik ∂x0i ∂x0i ∂x0i ∂F 0 ∂F ∂F = Mik = Mik . 0 ∂xi ∂xk ∂xk ∂i F = ∂F/∂xi transformiert sich also wie ein Vektor. →
Nützliche Regel: Gilt Al Bl = A0l Bl0 und ist Al ein Vektor, so ist Bl auch ein Vektor. Bilden wir z.B. die totalen Ableitungen eines Skalars F 0 (x0 ) = F (x) , ∂F 0 0 ∂F dx = dxi , ∂x0i i ∂xi dann folgt, dass
∂F ∂xi
ein Vektor ist.
Naturgesetze: Da der Raum isotrop ist, müssen Naturgesetze kovariant in Bezug auf Drehungen sein d.h. sie müssen sich als absolute Beziehungen (Regeln 1-4) zwischen Tensoren schreiben lassen F (A, Ai , Aij , ∙ ∙ ∙ ) = 0
Ein solches Gesetz hat dann dieselbe Form in allen Systemen, die über eine Drehung zusammenhängen. Beispiel: Das 2. Newtonsches Gesetz
F − m¨ x=0
ist die Summe von zwei Vektoren (Regel 1).
Kapitel 8
Rotierende Koordinatensysteme Im vorigen Kapitel hatten wir den mathematischen Formalismus entwickelt, der die Koordinaten zweier Inertialsysteme verbindet, die relativ zueinander um einen festen Winkel gedreht sind. Jetzt betrachten wir den Fall, dass sich der Drehwinkel des zweiten Systems zeitlich ändert. Damit ist das zweite System kein Inertialsystem mehr. Ein wichtiges Beispiel sind mechanische Systeme auf der Erde, wenn man die Rotation der Erde mit berücksichtigt. In solchen Fällen möchte man wissen, wie sich die Bewegungsgleichungen beim Übergang in das Nicht-Inertialsystem ändern.
8.1
Ein Beispiel
Eine Ameise läuft auf einem Plattenteller, der sich mit konstanter Winkelgeschwindigkeit ω entgegen dem Uhrzeigersinn um die z-Achse dreht. Wir unterscheiden das raumfeste Koordinatensystem K (Inertialsystem) und das rotierende Koordinatensystem K 0 auf dem Teller. Die Koordinaten der Ameise in beiden Systemen hängen wie folgt zusammen x = x0 cos θ − y 0 sin θ, y = x0 sin θ + y 0 cos θ mit θ = ωt. Für die Geschwindigkeit der Ameise in den jeweiligen Systemen finden wir durch Ableitung nach der Zeit vx = vx0 cos θ − vy0 sin θ − ω(x0 sin θ + y 0 cos θ)
vy = vy0 cos θ + vx0 sin θ + ω(x0 cos θ − y 0 sin θ) .
~v 0 ist die Geschwindigkeit der Ameise, wie sie ein Beobachter auf dem Plattenteller messen würde. Für die kinetische Energie findet man 1 1 m~v 2 = m ~v 02 + 2ω(vy0 x0 − vx0 y 0 ) + ω 2 r02 , 2 2
86
Kapitel 8. Rotierende Koordinatensysteme 0
wo r02 = ~x 2 . Dieses Beispiel ist besonders einfach, da die Drehachse fest ist. Wir wollen im Folgenden auch den allgemeineren Fall betrachten, dass sich die Richtung und der Betrag der Winkelgeschwindigkeit mit der Zeit ändern können.
8.2
Winkelgeschwindigkeit
Ein Koordinatensystem K 0 rotiere relativ zu einem Inertialsystem K mit Winkelgeschwindigkeit ω(t), die in Betrag und Richtung von der Zeit t abhängen kann. Die Ortskoordinaten in den beiden Systemen hängen zu jeder gegebenen Zeit zusammen über x0i (t) = Mik (t)xk (t) . Zu einer festen Zeit t ist M (t) orthogonal: MT M = MMT = 1 . Dann gilt d (M T M ) = M˙ T M + M T M˙ = 0 dt d (M M T ) = M M˙ T + M˙ M T = 0 dt Wir definieren Matrizen W (t) und W 0 (t) durch W ≡ M T M˙ = −M˙ T M = −W T W 0 ≡ M˙ M T = −M M˙ T = −W 0T
(8.1)
d.h. W und W 0 sind antisymmetrisch und hängen zusammen über W 0 = M˙ M T = M M T M˙ M T = MWMT . Die Matrix W transformiert sich daher wie ein Tensor unter Drehungen, d.h. ist W eine Matrix im Inertialsystem, dann ist W 0 diese Matrix im rotierenden System. Eine antisymmetrische 3 × 3-Matrix besitzt 3 unabhängige Elemente. Die allgemeine Form der antisymmetrischen Matrix W ist daher Wik (t) = εike ωe (t) . Explizit
0 W = −ω3 ω2
ω3 0 −ω1
−ω2 ω1 . 0
Wir vermuten, das ω die Winkelgeschwindigkeit ist. Man ist versucht für M (t) wieder anzusetzen M (t) = eA(t)
(8.2)
8.2 Winkelgeschwindigkeit
87
mit A antisymmetrisch, Aik = εike be (t) wo bl der Drehwinkel ist. Für zeitlich veränderliche Drehachsen und endliche Drehwinkel gibt es aber keinen Vektor, der den Drehwinkel darstellt. Dies sieht man daran, dass sich endliche Drehungen nicht vertauschen, d.h. die Eigenschaft ϕ ~1 + ϕ ~2 = ϕ ~2 + ϕ ~ 1 nicht erfüllen. Wie wir gesehen haben, vertauschen jedoch infinitesimale Drehungen. Daher ist die Winkelgeschwindigkeit ωi = dbi (t)/dt ein wohldefinierter Vektor. Für infinitesimale Drehungen gilt Mik ' (1 + A)ik = δik + εikl bl + O(b2 ) . Damit wird Beweis:
Wik = εikl ωl ,
oder in Matrixnotation: W = εω .
(8.3)
Wik = (M T M˙ )ik = (δij − εijl bl )εjkm b˙ m = εikl b˙ l + O(b)
Der Vektor ω in Gl. (8.2) ist demnach die Winkelgeschwindigkeit im raumfesten Inertialsystem K. Für die Matrix W 0 im rotierenden System erhält man auf dieselbe Weise das Ergebnis Wij0 = εijr ωr0 (t) mit
oder W 0 = εω 0 .
ωk0 ≡ Mkl ωl
(8.4)
Beweis der Gl. (8.4): Wij0 = (M W M T )ij = Mik Wkl Mjl = Mik (εklm ωm (t))Mjl = Mik Mjl (εklm ωm (t)) T Mrm )ωm (t)) = Mik Mjl (εklt (M T M )tm ωm (t)) = Mik Mjl (εklt Mtr 0 = (Mik Mjl Mrt εklt )Mrm ωm (t) = εijr Mrm ωm (t) = ε0ijr ωr0 (t)
Die Winkelgeschwindigkeit ω transformiert sich demnach wie ein Vektor. Sie wird durch ihre kartesischen Koordinaten ω = (ω1 , ω2 , ω3 )T im Inertialsystems K dargestellt, während ω 0 = (ω10 , ω20 , ω30 )T die Koordinaten der Winkelgeschwindigkeit in der instantanen Basis des rotierenden Systems K 0 sind, d.h. ω 0 = M ω. Speziell gilt ω 0 = ω, wenn die Drehachse fest ist, d.h. ω =konst. Dies ist anschaulich klar, da die Drehachse in beiden Systemen übereinstimmt und der Betrag der beiden Vektoren gleich ist. Beispiel: Drehung des Koordinatensystems um die z-Achse um einen Winkel ϕ = ωt. Die Matrix M ist hier cos ωt sin ωt 0 M = − sin ωt cos ωt 0 0 0 1
und
− sin ωt M˙ = ω − cos ωt 0
cos ωt − sin ωt 0
0 0 0
88
Kapitel 8. Rotierende Koordinatensysteme
Abbildung 8.1: Drehung um die z-Achse
Für die Matrix W = M T M˙ erhalten wir T cos ωt sin ωt 0 − sin ωt cos ωt 0 M T M˙ = ω − sin ωt cos ωt 0 − cos ωt − sin ωt 0 0 0 1 0 0 0 2 0 1 0 0 cos2 tω + sin tω 0 = ω − cos2 tω − sin2 tω 0 0 = ω −1 0 0 , 0 0 0 0 0 0 oder
Wik = εik3 ω3
mit ω3 = ω .
Im System K wird 0
cos ωt ω 0 = M ω = − sin ωt 0
sin ωt cos ωt 0
0 0 0 0 0 ω = 0 ω = ω. 1 1 1
In diesem Beispiel ist die Achse fest und ω = ω 0 . Da die Lage der z-Achse beliebig ist, gilt dieses Ergebnis für alle festen Drehachsen. Wenn W oder W 0 auf Vektoren wirken, können wir auch schreiben W → −ω× , da
W 0 → −ω 0 ×
,
(W x) ˙ i = Wik vk = εike ωe vk = −[ω × v]i
und ebenso für (W 0 x˙ 0 )i .
(8.5)
8.3 Geschwindigkeit im rotierenden Koordinatensystem
8.3
89
Geschwindigkeit im rotierenden Koordinatensystem
Wir betrachten einen Massenpunkt, der sich im rotierenden System K 0 mit Geschwin0 digkeit x˙ 0 = dx dt bewegt, z.B. eine Ameise auf einem rotierenden Plattenteller. Sei v = x˙ = dx dt die Geschwindigkeit der Ameise im raumfesten System K. Die Ortskoordinaten in den beiden Systemen hängen zusammen über x=M T x0 . Damit wird x˙ = M T x˙ 0 + M˙ T x0 = M T (x˙ 0 + M M˙ T x0 ) = M T (x˙ 0 − W 0 x0 ) , oder, mit Gl. (8.5),
x˙ = M T (x˙ 0 + [ω 0 × x0 ]) .
(8.6)
M x˙ = (x˙ 0 + [ω 0 × x0 ]) .
(8.7)
Da M T M = M M T = 1 kann man Gl. (8.6) auch in der Form schreiben
M x˙ ist die Geschwindigkeit des Massenpunktes im Inertialsystem K, entwickelt in den Basisvektoren des Nicht-Inertialsystems K 0 . Sie unterscheidet sich von der Geschwindigkeit v 0 = x˙ 0 des Massenpunktes, die in K 0 gemessen wird. Bildet man das Quadrat der Geschwindigkeit M x, ˙ dann hebt sich die Drehmatrix M weg, da M M T = 1 ist, x˙ 2 = (x˙ 0 + [ω 0 × x0 ])2 .
(8.8)
Zusammenfassung der Notation: x x =M x dx v= dt 0 dx v0 = dt ω0 = M ω 0
Koordinate des Massenpunktes im System K (Inertialsystem) Koordinate des Massenpunktes im System K 0 (Nicht-Inertialsystem) Geschwindigkeit des Massenpunktes im System K Geschwindigkeit des Massenpunktes im System K 0 , aber i.A. ist v 0 6= M v Winkelgeschwindigkeit in der Basis des Systems K 0
90
Kapitel 8. Rotierende Koordinatensysteme
8.4
Bewegungsgleichung im rotierenden Koordinatensystem
Wir betrachten ein Teilchen in einem Zentralfeld im Inertialsystem K. Die LagrangeFunktion sei 1 L = mx˙ 2 − V (r) mit r = |x|. 2 Im rotierenden System K 0 sind die potentielle und kinetische Energie gegeben durch: V (r) = V (r0 ) T =
(r0 = r)
1 1 mx˙ ∙ x˙ = m(x˙ 0 + [ω 0 × x0 ])2 . 2 (8.8) 2
In den Koordinaten des rotierenden Systems K 0 lautet die Lagrangefunktion somit L=
1 m{x˙ 02 + 2x˙ 0 ∙ [ω 0 × x0 ] + [ω 0 × x0 ]2 } − V (r0 ) . 2
Der Term 2x˙ 0 ∙ [ω 0 × x0 ] entspricht einem geschwindigkeitsabhängigen Potential. Wir hatten gesehen, dass man im Hamilton-Prinzip geschwindigkeitsabhängige Potentiale zulassen kann, vorrausgesetzt die zugehörigen Kräfte leisten keine Arbeit, was hier der Fall ist. Mit x˙ 0 ∙ [ω 0 × x0 ] = x0 ∙ [x˙ 0 × ω 0 ] erhalten wir aus der Euler-Lagrange-Gleichung im rotierenden System K 0 ∂L d ∂L − =0 0 dt ∂ x˙ i ∂x0i die Bewegungsgleichung m{¨ x0 + [ω 0 × x˙ 0 ] + [ω˙ 0 × x0 ] − [x˙ 0 × ω 0 ] − [[ω 0 × x0 ] × ω 0 ]} + ∇0 V (r0 ) = 0 .
(8.9)
Rechnerisches Detail: d d [ω 0 × x0 ]2 = 0 εklm ωl0 x0m εkrs ωr0 x0s 0 dxi dxi = εklm ωl0 δmi εkrs ωr0 x0s + εklm ωl0 x0m ωr0 εkrs δsi = εkli ωl0 [ω 0 × x0 ]k + [ω 0 × x0 ]k ωr0 εkri = 2[[ω 0 × x0 ] × ω 0 ].
Es folgt schließlich die Bewegungsgleichung im rotierenden System: m¨ x0 = −2m[ω 0 × x˙ 0 ] + m[[ω 0 × x0 ] × ω 0 ] − [ω˙ 0 × x0 ] − ∇0 V (r0 ).
(8.10)
Im Vergleich zur Bewegungsgleichung m¨ x = −∇V (r) im Inertialsystem K, treten in K 0 folgende Extraterme auf
8.4 Bewegungsgleichung im rotierenden Koordinatensystem Coriolis-Kraft:
F 0C = −2m[ω 0 × x˙ 0 ]
Zentrifugalkraft:
F 0Z = −m[ω 0 × [ω 0 × x0 ]]
91
F 0E = −[ω˙ 0 × x0 ]
Euler-Kraft:
Es handelt sich hierbei um sogenannte Scheinkräfte, d.h. um Kräfte, die bei Übergang ins Inertialsystem K verschwinden. Für einen Beobachter im rotierenden System erscheint es, als ob Kräfte auf den Massenpunkt wirken. Bemerkungen: a) Für eine feste Drehachse ist ω = ω 0 . b) Auch die Ableitung der Winkelgeschwindigkeit transformiert sich wie ein einfacher Vektor, ˙ ω˙ 0 =M ω. Dies sieht man wie folgt:
ω˙ 0 = M˙ ω+M ω˙
Der erste Term verschwindet, da M˙ ω = M M T M˙ ω = M W ω = −M [ω × ω] = 0 (8.5)
c) Die Coriolis-Kraft wirkt senkrecht zur Geschwindigkeit und Drehachse. Sie trägt nicht zum Energieintegral (Wirkung) bei, da sie senkrecht zur Bewegungsrichtung ist, F 0C ∙ x˙ 0 = 0. Ihr Betrag ist 0 F C = −2m[ω 0 × x˙ 0 ] = 2mω 0 x˙ 0 sin θ, (8.11) wo θ der Winkel zwischen ω 0 und x˙ 0 ist.
Beispiel: Passatwinde (Coriolis-Kraft auf der Erdoberfläche)
Abbildung 8.2: Rotierende Erde
Die Erde dreht sich im Uhrzeigersinn (von West nach Ost). Am Äquator steigt die Luft wegen der Sonneneinstrahlung auf, es bildet sich ein Tiefdruckgebiet, was auf
92
Kapitel 8. Rotierende Koordinatensysteme
der nördlichen Halbkugel zu Nord→ Süd-Winden führt, die nach Ost abgelenkt (nach „rechts“) werden. Der Winkel θ in Gl. (8.11) ist die geographische Breite. Die CoriolisKraft ist am Pol maximal und verschwindet am Äquator. Der Effekt ist auch für Raketen wichtig. Da diese Ablenkung beobachtet wird, schließen wir auch ohne Bezug auf die Fixsterne, dass die Erde kein Inertialsystem ist. Die Zentrifugalkraft ist ⊥ zu ω und hat den Absolutwert m|[ω 0 × [ω 0 ×x0 ]]| = mω|[ω 0 × x0 ]| = mω 2 |x0 | sin θ , wo wir verwendet haben, dass [ω 0 × x0 ]⊥ω 0 und dass ω = |ω| = |ω 0 | = ω 0 ist. Die Zentrifugalkraft ändert die Beschleunigung durch die Gravitation (nur 0,3 %).
8.5
Das Foucaultsche Pendel
Die Corioliskraft bewirkt eine Drehung der Schwingungsebene eines Pendels. Wir betrachten nur kleine Schwingungen. Alle Koordinaten beziehen sich auf das mit konstanter Winkelgeschwindigkeit ω rotierende Koordinatensystem der Erde ( 0 weggelassen). V = −mgl cos ϕ ' mgl da ϕ '
ρ l
ρ2 ϕ2 − 1 ' mg , 2 2l
. Aus der Figur lesen wir ab x − x0 = ρ
→ x˙ = ρ˙
Abbildung 8.3: Foucaultsches Pendel
Wir drücken L durch die Koordinaten x0 und ρ aus: L= =
m 2 {x˙ + 2x˙ ∙ [ω × x] + [ω × x]2 } − V (x) 2 mgρ2 m 2 {ρ˙ + 2ρ˙ ∙ [ω × (ρ + x0 )] + [ω × (ρ + x0 )]2 } − . 2 2l
Der Term ρ˙ ∙ [ω × x0 ] hat keinen Einfluss auf die Bewegungsgleichungen, da er eine tod ∂L 2 tale Zeitableitung darstellt (oder. dt ∂ ρ˙ = 0 für diesen Term). Die Terme ∼ ω können
8.6 Euler-Winkel
93
vernachlässigt werden, da die Schwingungsfrequenz viel höher ist als die Rotationsfrequenz ρ˙ ωρ.
D.h. der Zentrifugalterm kann vernachlässigt werden. Wir spalten ω auf in eine Komponente k und eine ⊥ zur Tangentialebene, d.h. k und ⊥ zu ρ ω⊥ ∙ ρ = 0 L=
ωk × ρ = 0
ω = ωk + ω⊥
m 2 g {ρ˙ + 2ρ˙ ∙ [ω ⊥ × ρ] − ρ2 }. | {z } 2 e
(8.12)
6=0
Dies sieht nach einer Drehung mit Winkelgeschwindigkeit ω ⊥ aus. Wir lassen daher ρ um x0 mit Winkelgeschwindigkeit ω ⊥ im Uhrzeigersinn rotieren (umgekehrt zur Erdrotationsrichtung) sin ω⊥ t cos ω⊥ t ρ0 = M −1 ρ = M T ρ M= − sin ω⊥ t cos ω⊥ t. (Das Pendel schwingt in der horizontalen Tangentialebene). Dann erhält man durch Vergleich mit Gl. (8.8) g m (8.13) L = {ρ˙ 02 − ρ02 } + O(ω 2 ) 2 e Gl. (8.13) ist die Lagrangefunktion eines harmonischen Oszillators mit Frequenz r 1 g ν= , 2π l der in diesem System nicht rotiert. Im System der Erde dreht sich dann die Schwingungsebene im Uhrzeigersinn mit der Frequenz ω⊥ = ω cos θ. Am Pol ist ω⊥ = ω und am Äquator ist ω⊥ = 0. Numerisch ist ω klein, ω = 7.2 × 10−5 sec−1 . Die Periode der Rotation der Schwingungsebene ist T=(1 Tag)/cos θ. Dies entspricht T=1.3 Tage in Paris.
8.6
Euler-Winkel
Eine beliebige räumliche Drehung wird durch die drei Parameter der orthogonalen Drehmatrix M beschrieben. Diese drei Parameter hängen mit drei Winkeln zusammen, die durch drei aufeinander folgende Drehungen festgelegt werden. Wir wollen den Zusammenhang zwischen M und den Drehwinkeln bestimmen. Die beiden Systeme K und K 0 sollen am Anfang übereinander liegen (K 0 = K). Dann drehen wir das System K 0 in drei Schritten, so dass es am Ende eine beliebige Richtung relativ zum festen System K hat. Eine allgemeine Drehung um eine beliebige Achse kann durch 3 aufeinanderfolgende Drehungen aufgebaut werden: 1. M1 (ϕ): Drehung von K 0 um die z-Achse um den Winkel ϕ(0 ≤ ϕ ≤ 2π), ei → e0i , cos ϕ sin ϕ 0 M1 (ϕ) = − sin ϕ cos ϕ 0 . 0 0 1
94
Kapitel 8. Rotierende Koordinatensysteme Dann ist e0iA = Aei .
Abbildung 8.4: Drehung um die z-Achse
2. M2 (θ): Drehung um die neue x-Achse (e01 ) um den Winkel θ, e0i → e00i , 1 0 0 sin θ . M2 (θ) = 0 cos θ 0 − sin θ cos θ Dann ist
e00iBA = M2 (θ)M1 (ϕ)ei
Abbildung 8.5: Drehung um die x0 -Achse
3. M3 (ψ) Drehung um die neueste z-Achse (e003 ) um den cos ψ sin ψ M3 (ψ) = − sin ψ cos ψ 0 0 Dann ist
Winkel ψ, ei00 → ei000 0 0 1
e000 i = M3 (ψ)M2 (θ)M1 (ϕ)ei
8.6 Euler-Winkel
95
Abbildung 8.6: Drehung um die neue z -Achse
Multipliziert man diese Drehmatrizen in der angezeigten Reihenfolge, so erhält man die gesamte Drehmatrix M = M3 M2 M1 mit
cos ψ cos ϕ − cos θ sin ψ sin ϕ M = − cos ϕ sin ψ − cos θ cos ψ sin ϕ sin θ sin ϕ
cos ψ sin ϕ + cos θ cos ϕ sin ψ − sin ψ sin ϕ + cos θ cos ψ cos ϕ − sin θ cos ϕ
sin θ sin ψ sin θ cos ψ cos θ (8.14)
Dies ist der Zusammenhang zwischen den Euler-Winkeln und der Drehmatrix. Entsprechend hängt auch die antisymmetrische Matrix W , die die Winkelgeschwindigkeit parametrisiert, mit der zeitlichen Änderung der Euler-Winkel zusammen. Zur Berechnung der Winkelgeschwindigkeit W und W 0 benötigen wir M˙ und M T , ∂ ∂ ∂ M + ψ˙ M + θ˙ M . M˙ = ϕ˙ ∂ϕ ∂ψ ∂θ Sei X =
∂ ∂ϕ M,
Y =
∂ ∂ψ M,
Z=
∂ ∂θ M .
Dann finden wir:
− cos ψ sin ϕ − cos θ cos ϕ sin ψ X = sin ψ sin ϕ − cos θ cos ψ cos ϕ sin θ cos ϕ
− cos ϕ sin ψ − cos θ cos ψ sin ϕ Y = − cos ψ cos ϕ + cos θ sin ψ sin ϕ 0
sin θ sin ψ sin ϕ Z = sin θ cos ψ sin ϕ cos θ sin ϕ
cos ψ cos ϕ − cos θ sin ψ sin ϕ − cos ϕ sin ψ − cos θ cos ψ sin ϕ sin θ sin ϕ
− sin ψ sin ϕ + cos θ cos ψ cos ϕ − cos ψ sin ϕ − cos θ cos ϕ sin ψ 0
− sin θ cos ϕ sin ψ − sin θ cos ψ cos ϕ − cos θ cos ϕ
cos θ sin ψ cos θ cos ψ . − sin θ
0 0 0
sin θ cos ψ − sin θ sin ψ 0
96
Kapitel 8. Rotierende Koordinatensysteme
In W ≡ M T M˙ = −M˙ T M bestimmen wir als Erstes den Koeffizient von ϕ: ˙ 0 cos θ − sin θ cos ψ T 0 sin θ sin ψ ∗ X) = ϕ˙ − cos θ ϕ(M ˙ sin θ cos ψ − sin θ sin ψ 0. Analog verfährt man mit den anderen Ableitungen. Als Ergebnis erhalten wir aus W = εω den Zusammenhang zwischen Winkelgeschwindigkeit und den Euler-Winkeln im Inertialsystem K ˙ θ cos ϕ + ψ˙ sin θ sin ϕ ω = θ˙ sin ϕ − ψ˙ sin θ cos ϕ ϕ˙ + ψ˙ cos θ
und in den rotierten Koordinatensystem K 0 , ˙ θ cos ψ + ϕ˙ sin θ sin ψ ω 0 ≡ M ω= −θ˙ sin ψ + ϕ˙ sin θ cos ψ . ψ˙ + ϕ˙ cos θ
Kapitel 9
Dynamik starrer Körper 9.1
Starre Körper
Ein starrer Körper ist ein System von Massenpunkten unter der Nebenbedingung |xα (t) − xβ (t)| = |x0α (t) − x0β (t)| ∀α, β ,
(9.1)
wo α, β die Massenpunkte nummerieren und xα (t) deren kartesischen Koordinaten sind. Die allgemeinsten Bewegungen, die den Abstand invariant lassen, sind Verschiebungen und Drehungen des gesamten Systems. Zusätzlich zu den im letzten Kapitel behandelten reinen Drehungen, müssen wir jetzt auch noch Translationen zulassen. Wir betrachten ein raumfestes Inertialsystem K und ein körperfestes Koordinatensystem K 0 (im Allgemeinen kein Inertialsystem), das fest mit dem starren Körper verbunden ist. Die Koordinaten in den beiden Systemen hängen zusammen über xα (t) = M T (t)x0α + d(t)
∀α .
(9.2)
Dabei ist d(t): M: xα (t): x0α :
der Ursprung des körperfesten Systems im raumfesten System, eine Drehung (orthogonale 3 × 3-Matrix mit det M = +1), Koordinaten eines Massepunktes α des Körpers im raumfesten System K, dasselbe im körperfesten System K 0 . x0α ist per Definition fest (hängt nicht von t ab)
Die Bedingung (9.1) ist offensichtlich invariant unter der Transformation Gl. (9.2). Jede Bewegung eines starren Körpers setzt sich (in K) zusammen aus einer Translation und einer Drehung um den Ursprung. Wir wiederholen einige Formeln für die Drehungen aus Kapitel 8. Eine Drehung wird durch eine orthogonale Matrix M (t) und die Winkelgeschwindigkeit ω durch eine an-
98
Kapitel 9. Dynamik starrer Körper
tisymmetrische Matrix W = εω beschrieben mit W ≡ M T M˙ = −M˙ T M = −W T W 0 ≡ M˙ M T = −M M˙ T = −W 0T und
W xα (t) = −ω × xα ,
W 0 x0α (t) = −ω 0 × x0α .
(9.3)
Da x˙ 0α = 0 laut Definition des körperfesten Systems ist, erhält man aus Gl. (9.2) für die Geschwindigkeit 0 ˙ . x˙ α (t) = M˙ T (t)x α (t) + d(t) Mit W = −M˙ T M wird
0 ˙ x˙ α = M˙ T (t)M M T x α (t) + d(t)
˙ = −W (xα (t) − d(t)) + d(t) ˙ , = −W M T x α (t) + d(t) 0
wo im letzten Schritt Gl. (9.2) verwendet wurde. Da W aα (t) = −ω × aα für jeden Vektor a, erhalten wir ˙ = [ω × (xα (t) − d(t))]. x˙ α (t) − d(t)
(9.4)
In Gl. (9.4) gehen nur die Koordinaten relativ zum Ursprung (Ursprung des körperfesten Systems im raumfesten System) ein.
9.2
Trägheitstensor
Wir wollen die kinetische Energie für einen starren Körper berechnen. Die Formel vereinfacht sich, wenn wir den Ursprung d(t) in den Schwerpunkt des Körpers legen. Der Schwerpunkt d eines Systems von Massenpunkten, jeweils mit Massen mα ist definiert durch X X mα xα = md mα = m , α
oder
α
X α
mα (xα − d) = 0.
(9.5)
Dabei ist mα die Masse des Massenpunktes α und m die Gesamtmasse des starren Körpers. Somit lässt sich die kinetische Energie (im raumfesten System K) schreiben als 1X 1X 2 ˙ mα (x˙ α )2 = mα {[ω × (xα − d)] + d(t)} T = 2 α 2 α 1X ˙ + d(t) ˙ 2} = mα {[ω × (xα − d)]2 + 2[ω × (xα − d)]d(t) 2 α =
1 ˙2 1 md + ωi Iik ωk 2 2
9.2 Trägheitstensor
99
wo Iik ≡
X α
α mα (δik x2α − xα i xk )
(9.6)
der Trägheitstensor (relativ zum Schwerpunkt) ist . Beweis: Der zweite Term verschwindet wegen der Bedingung (9.5). Der erste Term wird 1X mα [ω × (xα − d)]2 2 α 1X = mα [ω × (xα − d)]{[ω × xα ] − [ω × d] } | {z } 2 α →0 mit (9.5)
1X mα {[ω × xα ][ω × xα ] − d∙[ω × xα ]} = 2 α 1 1X = mα [ω × xα ] ∙ [ω × xα ] − md ∙ [ω × d] 2 (9.5) 2 α X X 1 1 mα [ω × xα ][ω × xα ] = mα [ω 2 x2α − (ω ∙ xα )(ω ∙ xα )] , = 2 α 2 α
wo wir die Vektoridentität [a × b] ∙ [c × d] = (a ∙ c)(b ∙ d) − (a ∙ d)(b ∙ c) verwendet haben. Für eine stetige Massenverteilung ρ(x) eines starren Körpers vom Volumen V geht die Formel für den Trägheitstensor über in Z Iik = d3 xρ(x)(x2 δik − xi xk ) . V
Der Trägheitstensor Ijl (im Inertialsystem K) ist zeitabhängig und hängt von der Massenverteilung des starren Körpers ab (und natürlich von der Wahl des Ursprungs). Legt man also den Ursprung des körperfesten Systems in den Schwerpunkt, so spaltet die kinetische Energie in zwei Teile auf, T = TRot + TT r , einen der von der Rotation stammt TRot =
1 ωi Iik ωk 2
und einen, der von der Translation stammt TT r =
1 ˙2 md 2
und so aussieht, als wäre die gesamte Masse im Schwerpunkt konzentriert. Mit ω = ωn , wo n ein Einheitsvektor in Richtung ω ist, wird die Rotationsenergie TRot =
1 1 ωni Tik nk ω = Iω 2 2 2
mit
I ≡ ni Tik nk .
100
Kapitel 9. Dynamik starrer Körper
Der Skalar I wird als Trägheitsmoment bezeichnet. Das Trägheitsmoment hängt von der Lage und der Richtung der Drehachse ab. Zum Abschluss dieses Abschnittes seien ohne Beweis zwei bekannte Sätze angeführt: a) Das Trägheitsmoment eines Körpers der Masse m bezüglich einer beliebig gegebenen Achse ist gleich dem Trägheitsmoment bezüglich einer parallelen Achse durch den Schwerpunkt plus dem Trägheitsmoment eines gedachten Massenpunktes der Masse m im Schwerpunkt des Körpers bezüglich der gegebenen Drehachse (Steinerscher Satz ). b) Die Winkelgeschwindigkeit ist für alle körperfesten Koordinatensysteme gleich. Drehimpuls eines starren Körpers: Der Drehimpuls eines Systems von Massenpunkten im raumfesten System K ist definiert als X X [xα × pα ] = mα [xα × x˙ α ] . L= α
α
Wir legen wieder den Ursprung d(t) in den Schwerpunkt des Körpers ( ˙ aus Gl. (9.4) wird 0). Mit x˙ α (t) = [ω × (xα (t) − d(t))] + d(t) L=
X α
=
X α
˙ mα [xα × d(t)] +
X α
α
mα (xα −d) =
mα [xα × [ω × (xα − d)]]
˙ mα [(x − d + d) × d(t)] + α
P
X α
mα [(xα − d) × [ω × (xα − d)]] .
Der erste Term proportional zu (xα − d) verschwindet wieder wegen Gl. (9.5). Damit ist L die Summe aus dem Drehimpuls der Gesamtmasse m im Schwerpunkt (CM) plus dem Drehimpuls der Rotation L = LCM + LRot , wo ˙ LCM = md × d, X LRot = mα [(xα − d) × [ω × (xα − d)]] α
=
X α
mα [xα × [ω × xα ]] + m [d × [ω × d]] .
(9.7)
Für den Impuls des starren Körpers ergibt sich wie zu erwarten: X X α Pi = mα mα [d˙ + ω × (xα − d)] α x = α
α
= md˙ .
Dies sieht wieder so aus, als wäre die gesamte Masse im Schwerpunkt konzentriert.
9.3 Die Eulerschen Kreiselgleichungen
101
Trägheitstensor im körperfesten System: In der Praxis ist es besser, mit dem Trägheitstensor im körperfesten System zu arbeiten, da er hier zeitlich konstant ist und sich somit leichter berechnen lässt. Da Iik ein Tensor ist, hat man im körperfesten System K 0 , I 0 = M IM T , mit 0 ≡ Iik
Beweis für den Term Aik =
X α
0α 0α mα (δik x02 α − xi xk ) .
α xα i xk :
α T α α 0α 0α A0ik = Mij xα j xm Mmk = Mij xj Mkm xm = xi xk .
Der Trägheitstensor ist symmetrisch und positiv definit – er lässt sich durch eine orthogonale Transformation O (feste Drehung des körperfesten Systems) diagonalisieren (Hauptachsentransformation ). Das neue System ist weiterhin körperfest. Wir nehmen daher o.B.d.A. an, dass der Trägheitstensor in K 0 diagonal ist, 0 I1 . I20 I0 = I30
Im kräftefreien Fall folgt aus der Bedingung T = konst.
I10 ω102 + I20 ω202 + I30 ω302 = konst.. Da die Ii0 konstant sind, erfolgt die Bewegung im ω 0 -Raum auf dem Trägheitsellipsoid.
9.3
Die Eulerschen Kreiselgleichungen
Wir betrachten einen Kreisel, d.h. einen starren Körper, der um einen festen Punkt rotiert. Dann legen wir den Ursprung der beiden Systeme (raumfest und körperfest) in diesen Punkt (und nicht in den Schwerpunkt), so dass d(t) = d0 (t) = 0. Gleichung (9.4) vereinfacht sich zu x˙ α = [ω × xα ]
Damit erhält man für die kinetische Energie des Kreisels T = =
1X 1X mα x˙ α2 = mα [ω × xα ]2 2 α 2 α 1 ωi Iik ωk . 2
Der Drehimpuls des Kreisels aus Gl. (9.7) vereinacht sich zu L=
X α
mα [xα × [ω × xα ]]
oder Li =
∂T = Iie ωe . ∂ωi
102
Kapitel 9. Dynamik starrer Körper
Beweis: Der Drehimpuls (relativ zum festen 0 - Punkt) ist: X X α ˙α Li = mα εijk xα mα εijk εkes xα j xk = j ωe xs α
=
X α
=
X α
α
α mα (δil δjs − δis δjl )xα j ωe xs α α α mα (δie xα j xj − xi ∙ xe )ωe
= Iie ωe = ∂T /∂ωi . Drehmoment: Das Drehmoment ist definiert als die zeitliche Änderung des Drehimpulses: ˙ + I ω˙ , ˙ Iω N (t) = L= Bisher hatten wir die Observablen im raumfesten System betrachtet. Die Observablen T, L, I lassen sich einfach auf das körperfeste System K 0 umrechnen, da sie Tensoren sind. Da 1 0 T 0 = ωi0 Iik ωk0 (Skalar) 2 L0 = M L, ω 0 = M ω I = M IM 0
erhalten wir
L0 =
X α
0 Iik =
X
T
(Vektor)
(Tensor) ,
mα [x0α × [ω 0 × x0α ]] ,
0α 0α mα (δik x02 α + xi xk ) ;
L0i =
α
∂T 0 0 = Iie ωe0 . ∂ω 0 i
Wir wiederholen noch einmal, dass ω = (ω1 , ω2 , ω3 )T die Winkelgeschwindigkeit im Inertialsystem K ist und ω 0 = M ω = (ω10 , ω20 , ω30 )T die selbe Winkelgeschwindigkeit in der Basis K 0 . Nur wenn die Richtung von ω sich nicht ändert oder ω konstant ist, gilt ω 0 = ω. Um Bewegungsgleichungen zu erhalten, berechnen wir das Drehmoment im körperfesten System. Aus L0 = M L folgt ˙ 0 = M˙ L + M N =M˙ M T M L + M N = W 0 L0 + M N 0 . L Wo W = M T M˙ und N 0 ≡ M N . Da W 0 v0 = −ω 0 × v0 für beliebige Vektoren v0 , erhalten wir ˙ 0 + ω 0 × L0 = N 0 . L In Komponenten lautet diese Gleichung
L˙ 0i + εikl ωk0 L0l = Ni0 .
(9.8)
9.4 Der kräftefreie Kreisel
103
Wir suchen eine Gleichung, die statt des Drehimpulses, den konstanten Trägheitstensor enthält, und ersetzen daher L0i durch 0 ωk0 , L0i = Iik
wo I 0 der im körperfesten System gebildete Trägheitstensor ist. Dann folgt aus Gl. (9.8) 0 ˙0 0 0 ωk + εike ωk0 Ilj ωj = Ni0 . Iik
Im Hauptachsensystem von I 0 gilt daher Ii0 ω˙i0 + εike ωk0 Il0 ωl0 = Ni0 oder
I10 ω˙10 − (I20 − I30 )ω20 ω30 = N10
und zyklisch. Dies sind die nicht-linearen Eulerschen Kreiselgleichungen. Sie beschreiben die zeitliche Änderung der instantanen Drehachse im körperfesten Koordinatensystem. Gegeben sind das äußere Drehmoment Ni0 und der (konstante) Trägheitstensor I 0 im körperfesten System. Daneben muss noch die Position des körperfesten Koordinatensystems relativ zum raumfesten bestimmt werden (siehe Lehrbücher der Literaturliste). Die Eulerschen Gleichungen können gelöst werden, a) für beliebige Trägheitstensoren wenn die Drehmomente verschwinden N = N 0 = 0. b) für den symmetrischen Kreisel.
9.4
Der kräftefreie Kreisel
Für den kräftefreien Kreisel ist das Drehmoment N = 0, der Gesamtimpuls erhalten, und der Schwerpunkt bewegt sich gleichförmig. Wir können daher den Ursprung des raumfesten Koordinatensystems in den Schwerpunkt legen. Drehimpuls L und kinetische Energie T sind erhalten. Die Winkelgeschwindigkeit ω ist jedoch nicht konstant. Im allgemeinen Fall dreht sich die durch L und ω aufgespannte Ebene um L (Präzession). Außerdem ändert sich beim nicht-symmetrischen Kreisel der Winkel zwischen L und ω (Nutation). Schließlich dreht sich der Körper instantan um ω. Beispiel: Ein Kinderkreisel, bei dem der Unterstützungspunkt im Schwerpunkt liegt. Dann erzeugt die Gravitation kein Drehmoment. a) Sphärischer Kreisel:
I10 = I20 = I30 = I 0
Dann lauten die Euler-Gleichungen ω˙ i0 = 0, i = 1, 2, 3,
ωi0 = konst.
Somit ist L0 (= I 0 ω 0 ) konstant und parallel zu ω 0 (= ω). Wenn ein solcher Körper um irgendeine Achse in Rotation versetzt wird, dann bleibt diese Bewegung unverändert erhalten.
104
Kapitel 9. Dynamik starrer Körper
b) Symmetrischer Kreisel: zwei Hauptträgheitsmomente sind gleich, z.B. I10 = I20 . Sei I30 > I10 angenommen. Damit lautet die eine Euler-Gleichung I30 ω˙30 = (I10 − I20 )ω10 ω20 = 0 . Lösung:
ω30 = konst.
Die Konstante ω30 ist eine der Anfangsbedingungen. Damit führen die beiden anderen Euler-Gleichungen I10 ω˙10 = (I20 − I30 )ω20 ω30 = 0,
I20 ω˙20 = (I30 − I10 )ω30 ω10 = 0 ,
zu ω˙10 + Ωω20 = 0 ω˙20 − Ωω10 = 0 , mit Ω≡
(9.9) (9.10)
I30 − I10 0 ω3 (konstant) . I10
Einsetzen von (9.9) in (9.10) ergibt die Gleichung eines harmonischen Oszillators ω ¨ 10 = −Ω2 ω10 mit Lösung ω10 = A cos Ωt ω20 = A sin Ωt . p Die Konstante A = ω102 + ω202 muss durch die Anfangsbedingungen (Energie und Drehimpuls) bestimmt werden. Eine mögliche Phase wurde so gewählt, dass ω20 = 0 für t = 0, wo t = 0 der Zeitpunkt der Beobachtung ist. Die Bedingung ω30 = konst. bedeutet für einen Beobachter im körperfesten System, dass ω 0 um die z 0 -Achse (die Symmetrieachse) mit konstanter Frequenz Ω präzediert. A und ω 0 z lassen sich aus den Erhaltungsgrößen bestimmen: T = T0 = L0 = I 0 ω 0 ,
1 0 0 0 ωIω 2
→
|L0 | = konst, →
T0 =
1 0 2 1 0 I A + I3 2 1 2
2
2
L0 = I102 A2 + I 0 3 ω302
Aus diesen beiden Gleichungen lassen sich A und ωz0 bestimmen. Die Richtung von ω 0 überstreicht einen Kegel mit Halbwinkel θP bei der Drehung um die z 0 -Achse (im körperfesten System K 0 ), wo q A tan θP = 0 A = ω102 + ω202 ω3
9.4 Der kräftefreie Kreisel
105
als Körperkegel bezeichnet wird. Zusätzlich zur Präzession rotiert K 0 (und somit ω~0 ) im raumfesten System K mit Winkelgeschwindigkeit ω um die Achse L (L ist konstant, da N = 0). Dabei überstreicht ω wieder einen Kegel, den Raumkegel mit konstantem Halbwinkel θR (keine Nutation beim symmetrischen Kreisel) und cos θR =
ω∙L ωIω 2T = = . ω|L| ω|L| ω|L|
Die Rotation der Erde ist in guter Näherung kräftefrei, da die Drehmomente von den anderen Himmelskörpern klein sind. Die Erde ist an den Polen etwas abgeflacht: I 3 − I1 1 ' I1 300
(I1 ≈ I2 )
1 ωz 300 2π ωz ' ω = ( 1 Umdrehung pro Tag) T ag Ω=
D.h. die Periode der Präzession ' 300 Tage (um die Polachse). Die experimentelle Periode der Präzession ist ' 427 Tage und die Amplitude A ' 4m.
Kapitel 10
Relativitätstheorie 10.1
Postulate
Die spezielle Relativitätstheorie Einsteins lässt sich aus zwei Postulaten ableiten. 1. Kovarianz der Naturgesetze 2. Konstanz der Lichtgeschwindigkeit c Zu 1: Ein Inertialsystem ist ein Bezugssystem, in dem sich ein Körper, der keinen äußeren Kräften unterliegt, mit konstanter Geschwindigkeit bewegt. Wenn sich zwei Bezugssysteme geradlinig und gleichförmig zueinander bewegen, und eines davon ein Inertialsystem ist, dann ist auch das andere ein Inertialsystem. Die Naturgesetze haben in allen Inertialsystemen dieselbe Form. Dieses Postulat bildete auch schon die Grundlage der Newtonschen Mechanik. Zu 2: Die Lichtgeschwindigkeit in vacuo ist in allen Inertialsystemen gleich. Das 2. Postulat widerspricht unseren täglichen Erfahrungen bei Geschwindigkeiten, die viel kleiner als c sind. Bis ins späte neunzehnte Jahrhundert glaubte man daher, dass sich Licht in einem hypothetischen Äther wie Schall durch die Luft ausbreitet. Zum Nachweis des Äthers führten Michelson und Morley im Jahr 1879 ein Interferenzexperiment durch, in dem die Änderungen der Geschwindigkeit des Lichts gemessen werden sollte, die auftreten sollten, wenn die Erde im Laufe des Jahres die Bewegungsrichtung ihrer Bahn um die Sonne ändert. Zur allgemeinen Überraschung war die Lichtgeschwindigkeit in allen Richtungen die gleiche.
108
10.2
Kapitel 10. Relativitätstheorie
Einfache Lorentz-Transformation
In der Relativitätstheorie spielt der Begriff des Ereignisses eine wichtige Rolle. Ein Ereignis ist definiert durch Ort und Zeit an dem es stattfindet (Lichtblitz). Sei (t, ~x) : ein Ereignis in einem Inertialsystem K. (t0 , ~x 0 ) : dasselbe Ereignis in einem zweiten Inertialsystem K 0 . Wir betrachten zunächst den Fall einer Raumdimension. Einstein argumentierte, dass wegen der Homogenität der Raum-Zeit ein linearer Zusammenhang zwischen den Koordinaten (t, x) und (t0 , x0 ) eines Ereignisses bestehen muss, x = αx0 + βt0 t = γx0 + δt0 ,
(10.1)
wenn K 0 sich relativ zu K in x-Richtung mit Geschwindigkeit v bewegt. Wir werden sehen, dass t = t0 (d.h. γ = 0, δ = 1) nicht mit der Konstanz der Lichtgeschwindigkeit vereinbar ist. Die Konstanten α, β , γ, δ lassen sich aus den obigen zwei Postulaten bestimmen. Um die Übersichtlichkeit zu bewahren, setzen wir in der Ableitung c = 1, d.h. wir messen wir alle Geschwindigkeiten in Einheiten der Lichtgeschwindigkeit. Aus Postulat 2) folgt
x = t → x 0 = t0
(Da wir c = 1 gesetzt haben, ist x = t ein Signal, das sich mit Lichtgeschwindigkeit ausbreitet), oder →α+β =γ+δ . (10.2) Licht kann sich auch in umgekehrter Richtung ausbreiten: x = −t → x0 = −t0 oder
(10.3)
→α−β =δ−γ .
Zusammen ergeben Gl. (10.2) und Gl. (10.3):
α = δ, β = γ . Als Nächstes betrachten wir einen in K 0 festen Punkt x0 . Dieser bewegt sich von K aus gesehen mit Geschwindigkeit v. Da x0 fest angenommen wurde (dx0 = 0), gilt β dx =v= dt δ
oder β = vδ.
(10.4)
Mit (10.4) reduziert sich die Transformation (10.1) auf x = k (x0 + vt0 ) t = k (vx0 + t0 ) wo k noch unbestimmt ist.
(10.5)
10.2 Einfache Lorentz-Transformation
109
Wir können die Transformation (10.5) umkehren x0 =
1 (x − vt) k 1 − v2
t0 =
1 (−vx + t) k 1 − v2
Nebenrechnung:
(10.6)
1 x − vt 1 = k[x0 + vt0 − v(vx0 + t0 )] k 1 − v2 k(1 − v 2 ) 1 = k[x0 − v 2 x0 ] = x0 k(1 − v 2 ) Da K und K 0 völlig äquivalent sind, kann man die Diskussion von K 0 beginnen und v → −v ersetzen (in (10.5)) x0 = k (x − vt) t0 = k (−vx + t) . Der Vergleich mit Gl. (10.6) ergibt →
1 =k k (1 − v 2 )
1 . 1 − v2 Damit haben wir die Lorentz-Transformation aus den Postulaten abgeleitet. Führen wir die Lichtgeschwindigkeit auf der Basis von Dimensionsüberlegungen wieder ein, so lautet die Lorentz-Transformation → k=√
x0 + vt0 x= p , 1 − v 2 /c2 t0 + cv2 x0 t= p , 1 − v 2 /c2
x0 = p
x − vt
1 − v 2 /c2
(10.7)
y = y0 z = z0 .
t − cv2 x t0 = p 1 − v 2 /c2
Wir setzen y = y 0 , z = z 0 , da wir annehmen, dass eine Bewegung in x-Richtung keinen Einfluss auf die y- und z-Koordinaten hat. Üblich sind folgende Abkürzungen: v ≡β, c
1
q
1 − (v/c)
2
≡γ .
Für v c erhält man aus Gl. (10.7) die Galilei-Transformation.
110
10.3
Kapitel 10. Relativitätstheorie
Intervalle, 4-Abstände
Sei (ta , ~xa ) ein Ereignis und (tb , ~xb ) ein zweites Ereignis, beide in einem Inertialsystem K. Der Abstand oder das Intervall zwischen zwei Ereignissen a und b ist definiert durch 2 2 s2ab = c2 (tb − ta ) − (~xb − ~xa ) . (10.8)
Die Notation ist trügerisch, da s2ab positiv oder negativ sein kann. Man kann (ct, ~x ) als 4-dimensionalen Vektor auffassen. Beachte das Minus-Zeichen in Gl. (10.8) im Vergleich zum 3-dimensionalen Abstand, man spricht von einer pseudoeuklidischen Geometrie. Mit Hilfe der Lorentz-Transformation (10.7) zeigt man die Invarianz des Intervalls, sab = s0ab , wo
2
2
2 0 0 s02 x0b − ~x0a ) . ab = c (tb − ta ) − (~
Der 4-Abstand zwischen zwei Ereignissen ist in allen Inertialsystemen gleich. Dieses Ergebnis kann auch als Ausgangspunkt der Relativitätstheorie gewählt werden. Relativitätsprinzip: Physikalische Gesetze sind kovariant bezüglich Translationen in allen 4-Koordinaten (Homogenität der Raum-Zeit) und homogenen linearen Transformationen der RaumZeit-Koordinaten, die 4-Abstände invariant lassen (Isotropie der Raum-Zeit). Einfache Anwendungen: a) Zeitdilatation Als repräsentatives Beispiel betrachten wir die Erzeugung und den Zerfall eines πMesons, das sich im Laborsystem (L) mit konstanter Geschwindigkeit ~v bewegt. Dann bewegt sich auch das Ruhsystem (R) relativ zum Laborsystem mit Geschwindigkeit ~v . Wir betrachten Erzeugung und Zerfall des π-Mesons jeweils im Labor und im Ruhsystem. Im Laborsystem L sind die Raum-Zeit-Koordinaten der beiden Ereignisse gegeben durch: a) die Erzeugung des π-Mesons in ~xa zur Zeit ta , b) den Zerfall des π-Mesons in x~b zur Zeit tb . Damit ist die Lebensdauer τL des π im Laborsystem L τ L = tb − ta . Das Quadrat der Wegstrecke, die das π-Meson (das sich in L mit Geschwindigkeit v bewegt) zurücklegt, bevor es zerfällt ist 2
(~xb − ~xa ) = v 2 τL2 . Wir beschreiben jetzt die selben beiden Ereignisse im Ruhsystem R des π-Mesons. In diesem System geschehen die beiden Ereignisse am selben Punkt ~x0b = ~x0a . Damit wird
10.3 Intervalle, 4-Abstände
111
die Lebensdauer τ des π-Mesons (in R).
τ = t0b − t0a
Wenn man in der Elementarteilchenphysik von der Lebensdauer eines Teilchens spricht, dann meint man stets die Lebensdauer im Ruhsystem. Experimentell findet man τπ± = (2.6033 ± 0.0005) × 10−8 sec. Die Invarianz des Intervalls bedeutet: 2
2
2
c2 (tb − ta ) − (~xb − ~xa ) = c2 (t0b − t0a ) − (~x0b − ~x0a ) oder
τ
→ τL = p
2
→
c2 τL2 − v 2 τL2 = c2 τ 2 ,
.
1 − v 2 /c2
D.h. die Lebensdauer im Laborsystem ist größer als im Ruhsystem. Das Teilchen lebt länger im bewegten System, die Zeit läuft langsamer, man spricht von Zeitdilatation. Diese Vorhersage der Relativitätstheorie ist experimentell millionenfach verifiziert. b) Längenkontraktion Betrachte einen in einem Inertialsystem K parallel zur x-Achse ausgerichteten, ruhenden Maßstab der Länge Δx = x(2) − x(1) zu einer Zeit t. Sei K 0 ein relativ zu K bewegtes Inertialsystem. Die Lorentz-Transformation, die beide Systeme verbindet lautet: x0(1) + vt0 x(1) = p 1 − v 2 /c2
Für die Länge Δx folgt also
x0(2) + vt0 x(2) = p . 1 − v 2 /c2
oder
Δx = p
Δx0
1 − v 2 /c2
Δx0 =
,
p 1 − v 2 /c2 Δx ,
wo Δx0 = x0(2) − x0(1) die Länge des Maßstabes in K 0 ist. Der Maßstab im bewegten System ist also kürzer, man spricht von Längenkontraktion. Lorentz-Transformation in beliebiger Richtung: Um die Lorentz-Transformation in beliebiger Richtung zu erhalten, betrachtet man die Komponenten des Ortsvektors parallel und senkrecht zu ~v , und nimmt an, dass nur die Komponente parallel zu ~v durch die Lorentz-Transformation beeinflusst wird. Dann erhält man ~v 1 ~x 0 mit β~ = , γ = q t = γ t0 + β~ c 2 1 − (v/c) (γ − 1) ~ ~ 0. ~x = ~x0 + β ∙ ~x 0 β~ + γ βct 2 β
112
Kapitel 10. Relativitätstheorie
Notation: Im Rahmen der relativistischen Physik verwenden wir der Klarheit halber das Symbol ~x (statt x) für einen Vektor in R3 .
10.4
Transformation der Geschwindigkeiten
Ein Inertialsystem K 0 bewege sich wie vorher relativ zu K mit Geschwindigkeit ~v = v~ex . Sei ~u die Geschwindigkeit eines Teilchens in K. Dann bestehen folgende Zusammenhänge: dx dy dz ux = (in K) uy = uz = dt dt dt u0x =
dx0 dt0
(in K 0 )
dx0 + vdt0 dx = p 1 − v 2 /c2
u0y =
dy 0 dt0
dy = dy0
u0z =
dz 0 dt0
dz = dz 0
dt0 + cv2 dx0 dt = p 1 − v 2 /c2
Um das Transformationsverhalten der Geschwindigkeiten zu erhalten, teilt man den ersten Ausdruck durch den letzten usw., mit dem Ergebnis dx u0 + v dx0 + vdt0 = x vu0 = 0 v 0 dt dt + c2 dx 1 + c2x p u0y 1 − v 2 /c2 dy dy 0 uy = = 0 v 0 = dt + dx dt 1 + cv2 u0x √ c22 2 ux =
(10.9)
1−v /c
p u0z 1 − v 2 /c2 dz dz 0 uz = . = 0 v 0 = dt + dx dt 1 + cv2 u0x √ c22 2 1−v /c
Für v c ergibt sich, wie erwartet ux = u0x + v, u0y = uy ,
uz = u0z .
Die Gleichungen (10.9) liefern auch das Additionsgesetz der Geschwindigkeiten. Für ein Teilchen, das sich parallel zur x-Achse bewegt (ux = u, uy = 0, uz = 0) lautet das Additionsgesetz: u0 + v u= 0 . 1 + uc2v Wir sehen aus diesem Ergebnis, dass u < c, wenn u0 < c ist. Die Geschwindigkeit kann in keinem Inertialsystem größer als die Lichtgeschwindigkeit sein. Für die Umkehrtransformation setzt man v → −v.
10.5 4-Vektoren
10.5
113
4-Vektoren
Ein Ereignis wird charakterisiert durch die Raumkoordinaten (xi , : i = 1 − 3) und die Zeit t. Man kann die vier Größen zusammenfassen und folgende Notation einführen xμ , μ = 0, 1, 2, 3 , wo
x0 = ct,
x1,2,3 = x, y, z .
Konvention: Raum-Zeitindizes (0–3) werden mit griechische Buchstaben bezeichnet, Raumindizes (1-3) mit lateinische Buchstaben (oder ~x). Beachte: alle Indizes stehen oben. Die Koordinate eines Ereignisses kann als 4-Vektor betrachtet werden, wenn wir darunter die Differenz zum Ereignis (0, ~0) verstehen. Die „ Länge“ dieses 4-Vektors ist definiert durch x2 ≡ x02 − ~x 2 = c2 t2 − ~x 2 . Die Länge eines Vektors definiert den metrischen Tensor x2 =
3 X 3 X
gμν xμ xν
(10.10)
μ=0 ν=0
(gμν ) =
1
−1
−1
−1
Die Minkowski-Metrik gμν ist pseudoeuklidisch, d.h. nicht positiv definit. Für eine kompakte Schreibweise führen wir auch hier die Einsteinsche Summationskonvention ein: Über doppelt vorkommende, jeweils oben und unten stehende Indizes wird summiert. Damit schreibt sich (10.10) einfach als x2 = gμν xμ xν . An dieser Stelle ist es noch Definitionssache, ob Indizes oben oder unten stehen.
10.6
Homogene Lorentz-Transformation
Ausgehend von der Invarianz des 4-Intevalls sollen jetzt die allgemeinen Eigenschaften der Lorentz-Transformationen untersucht werden. Wir werden sehen, dass neben den speziellen Lorentz-Transformationen oder „Boosts“ auch Drehungen erlaubt sind. Sei Λμ ν die Transformation, die die Koordinaten xμ eines Inertialsystems K mit den Koμ ordinaten x0 eines dazu gleichförmig bewegten und um einen festen Winkel gedrehten Bezugssystems K 0 verbindet, μ x0 = Λ μ ν x ν . Wir wollen die allgemeine Form der Lorentz-Transformation aus der Forderung der 2 Invarianz des Intervalls x2 ableiten. Aus x2 = x0 folgt gμ ν Λμ α Λν β = g α β .
(10.11)
114
Kapitel 10. Relativitätstheorie
Beweis: 2
μ
ν
x 0 = g μ ν x 0 x0 = g μ ν Λμ ρ Λ ν σ x ρ x σ . 2
Wenn x0 = x2 = gρ σ xρ xσ sein soll, dann muss gelten gσρ = gμ ν Λμ ρ Λν σ ,
(10.12)
ΛT gΛ = g .
(10.13)
oder in Matrixnotation mit der Definition [ΛT ]ρ μ ≡ Λμ ρ . Gl. (10.13) ist offensichtlich die Verallgemeinerung der Bedingung M T M = 1 für die Drehmatrizen. Wir bilden die Determinante von (10.13), det ΛT det Λ = 1
(det g = −1) ,
d.h. det Λ =
+1 . −1
Eine zweite Bedingung erhalten wir, wenn wir speziell α = β = 0 in (10.11) setzen: g μ ν Λμ 0 Λν 0 = g 0 0
(Λ00 )2 −
→
Daraus folgt (Λ00 )2 ≥ 1
oder
X
(Λi 0 )2 = 1.
i
Λ00 ≥ 1 . Λ00 ≤ −1
Zwischen den Transformationen mit Λ00 ≥ 1 und Λ00 ≤ −1 besteht eine Lücke von mindestens 2, die nicht durch stetige Schritte überwunden werden kann. Die Transformationen mit Λ00 ≤ −1 beinhalten Zeitumkehr. Besonders interessant sind die eigentlichen Lorentz-Transformationen, d.h. die LorentzTransformationen, die stetig aus der Einheit hervorgehen, det Λ = +1
und
Λ00 ≥ 1 .
Wir meinen im Folgenden stets eigentliche Lorentz-Transformationen, wenn wir von Lorentz-Transformationen sprechen. Die eigentlichen Lorentz-Transformationen bilden die Gruppe SO(1,3). Wichtigste Eigenschaft ist, dass zwei aufeinanderfolgende LorentzTransformationen wieder eine Lorentz-Transformation bilden: x00μ = Λ0
μ 0γ γx
= Λ0
μ
γ γΛ σ
?
xσ = Λ00
μ σ σx .
Der Beweis erfolgt direkt unter Verwendung von Gl. (10.11).
10.6 Homogene Lorentz-Transformation Minkowski-Raum: Ein 4-dimensionaler Raum mit Metrik 1 gμν =
115
−1
−1
−1
heißt Minkowski-Raum.
Kontravarianter 4-Vektor: Jedes 4-komponentige Objekt ν μ , das sich unter Lorentz-Transformationen wie die Koordinaten xμ transformiert, heißt kontravarianter 4-Vektor. Skalarprodukt: Das Skalarprodukt zweier 4-Vektoren ist definiert durch u ∙ v ≡ gμν uμ v ν = u0 v 0 − ui ∙ v i = u0 v 0 − ~u ∙ ~v . Das so definierte Skalarprodukt ist lorentzinvariant, da 0
u0 ∙ v 0 = gμσ u σ v 0μ = gμσ Λσ α Λμ β uα v β
=
Gl. (10.11)
gαβ uα v β = u ∙ v .
Kontravariante und kovariante Komponenten eines Vektors: Die kontravarianten Komponenten eines 4-Vektors v μ waren definiert durch v μ = v 0 , ~v . Sie transformieren sich unter Lorentz-Transformationen wie v μ → v μ0 = Λμ ν v ν
(10.14)
Alternativ kann man denselben Vektor v auch durch seine kovarianten Komponenten beschreiben, die definiert sind durch → vμ = v 0 , −~v . vμ ≡ gμν v ν oder umgekehrt
v μ = g μν vν mit g μν = gμν =
1 −1
−1
−1
.
Die 4 × 4-Einheitsmatrix bezeichnen wir mit δ μ σ . Offensichtlich gilt: g μν gνσ = δ μ σ .
Für die Zeitkomponenten sind kontravariante und kovariante Komponenten gleich v0 = v 0 , die Raumkomponenten unterscheiden sich durch ein Vorzeichen vi = −v i . Mit Hilfe dieser Unterscheidung lässt sich das Skalarprodukt einfacher schreiben, u ∙ v = uμ v μ = uμ v μ .
116
Kapitel 10. Relativitätstheorie
Beweis:
uμ v μ = (u0 v 0 + ui v i ) = (u0 v 0 − ~u~v ) = (u0 v0 − ~u~v ).
Eine alternative Formel für das Transformationsverhalten eines kovarianten 4-Vektors lautet ν vμ → v 0 μ = vν Λ−1 . (10.15) μ Zur Gewöhnung an die Notation wollen wir diese Beziehung beweisen. Es gilt σ λ v 0 μ = gμλ v 0 = gμλ Λλβ v β = vσ Λ−1 μ
Die letzte Gleichheit folgt aus der Definitionsgleichung gμ λ Λλ β Λμ σ = gβσ Multiplikation mit (Λ−1 )σ ρ , gμ λ Λλ β [Λμ σ (Λ−1 )σ ρ ] = gβσ Λ−1 Dabei haben wir verwendet, dass ΛΛ−1 = 1,
σ
ρ
durch
.
oder Λμ σ (Λ−1 )σ ρ = δ μ ρ ,
wo δ μ ρ die 4-diomensionale Einheitsmatrix ist. Damit wird gμ λ Λλ β = gβσ Λ−1 gμ λ Λλ β v β = gβσ Λ−1 Der 4-Gradient ∂μ ≡
∂ ∂xμ
∂μ → ∂ 0 μ ≡ Man beachte: ∂μ =
σ
μ
σ
μ
v β = Λ−1
σ
μ
vσ .
ist ein natürlicher kovarianter 4-Vektor, da
λ ∂ ∂xλ ∂ = = Λ−1 μ ∂x0 ∂x0 μ ∂xλ
∂ 1 ∂ ~ =( , ∇), ∂xμ c ∂t
∂μ =
μ
λ ∂ = ∂λ Λ−1 ∂xλ
μ
.
∂ 1 ∂ ~ . =( , −∇) ∂xμ c ∂t
Parameter der Lorentz-Transformation: Die Lorentz-Transformation Λ hat 4 × 4 = 16 Elemente. Die definierende Gleichung (10.11), gμ ν Λμ α Λν β = gα β , ergibt 10 Bedingungen (4+3+2+1, wegen der Symmetrie in α, β). Damit verbleiben 6 unabhängige Elemente oder Parameter, 3 Parameter beschreiben die relative Orientierung der Raum-Koordinatenachsen, 3 Parameter be− schreiben die Relativgeschwindigkeit → v der Systeme.
10.7
Infinitesimale Lorentz-Transformationen
Die eigentlichen Lorentz-Transformationen lassen sich aus infinitesimalen Transformationen mit Hilfe der Erzeugenden aufbauen. In Analogie zu den Drehungen machen wir dazu den Ansatz: Λ = eL , wo L eine 4 × 4 Matrix ist.
10.7 Infinitesimale Lorentz-Transformationen
117
Für Transponierte gilt 1 1 T T da ΛT = (1 + L+ LL + ...) = (1 + L + LT LT +...) 2 2
T T ΛT = eL = eL ,
und für die Determinante
det Λ = det eL = eSpL .
Beweis der letzten Beziehung: Nach Diagonalisierung wird L = diag[L1 , L2 , L3 , L4 ] und damit det eL = eL1 eL2 eL3 eL4 = eL1 +L2 +L3 +L4 = eSpL . Da für die eigentlichen Lorentz-Transformationen det Λ = 1 ist, folgt dass die Spur von L verschwindet Sp L = 0 .
Wir wollen jetzt zeigen, dass gL antisymmetrisch ist. Aus der Definitionsgleichung ΛT gΛ = g folgt durch Multiplikation von links mit g −1 und von rechts mit Λ−1 : (g −1 = g, g 2 = 1) Λ−1 = g −1 ΛT g = gΛT g 1 = g(1 + LT + LT LT + ....)g 2! T 1 = 1 + gLT g + gLT ggLT g + .... = egΛ g . 2! Andererseits ist Λ−1 = e−L = (1 − L+
1 LL + ...) . 2!
(10.16)
(10.17)
Ein Vergleich von Gl. (10.17) mit Gl. (10.16) ergibt gLT g = −L
→
T
(gL) = − (gL) .
Wenn man beachtet, dass g = [1, −1, −1, −1] und dass L (wie Λ) sechs Parameter aufweisen muss, ergibt sich daraus die folgende allgemeine Form: L0 1 L 0 2 L0 3 0 L0 Boosts 0 L1 2 L1 3 μ 1 = L ν = 0 L 2 −L1 2 0 L2 3 Boosts 3 × 3 Drehungen 0 1 2 L 3 −L 3 −L 3 0 Beweis: Mit
0 a L= b c
a 0 −d −e
b d 0 −f
c e f 0
und
1 0 g= 0 0
0 −1 0 0
0 0 0 0 −1 0 0 −1
118
Kapitel 10. Relativitätstheorie
ergibt die direkte Matrixmultiplikation 0 −a gL = −b −c
a 0 d e
Es ist üblich, jedem der 6 Parameter von 0 0 0 0 0 S2 = S1 = 0 0 1 0 −1 0 0 1 0 0 0 1 0 K2 = K1 = 0 1 0 0 0
L eine Fundamentalmatrix zuzuordnen, 0 0 0 −1 0 1 0 S3 = 0 0 0 −1 0 0 1 0 0 0 0 0 0 1 0 0 0 0 1 K3 = 0 . 0 0 0 1
b −d 0 f
D.h. gL ist antisymmetrisch.
c −e . −f 0
Sie sind die infinitesimalen Erzeugenden der Lorentz-Transformation: S, ∙ ∙ ∙ Drehungen, K, ∙ ∙ ∙ Boosts. Die Erzeugenden für reine Drehungen waren (Si )kl = εikl . Für die Quadrate gilt: 0 0 0 0 −1 −1 2 2 2 S1 = S2 = S3 = −1 0 −1 −1 −1 0 1 1 1 1 0 0 2 2 2 K2 = K3 = . K1 = 0 1 0 0 0 1
Jede Potenz der Si oder Ki ist daher bis auf Faktoren ±1 gleich der Matrix selbst oder ihr Quadrat, z.B. Si3 = −Si . Mit Hilfe der Basismatrizen läßt sich L und damit Λ schreiben als: ~ − ξ~ ∙ K ~ L = −θ~ ∙ S ~ ~ ~ ~
Λ = e−θ∙S−ξ∙K ,
wo θ~ und ξ~ konstante räumliche 3-Vektoren sind, die 6 Parameter der LorentzTransformationen.
10.7 Infinitesimale Lorentz-Transformationen
119
Zusammenhang mit früheren Ergebnissen für Λ: Wir betrachten den einfachen Fall θ~ = 0 und ξ~ = ξ~e1 = ξ(1.0.0)T . Dann ist L = −ξ K1 und Λ = eL = e−ξ K1 = 1 − K12 − K1 sinhξ + K12 coshξ . 3
5
In den Beweis gehen die Relationen K13 = K1 , sinh x = x + x3 ! + x5 ! + ∙ ∙ ∙ , cosh x = 2 4 1 + x2 ! + x4 ! + ∙ ∙ ∙ ein. Setzen wir ein 0 1 1 1 0 1 , K1 = K12 = 0 0 0 0 so erhalten wir
cosh ξ − sinh ξ Λ= 0 0
− sinh ξ cosh ξ 0 0
Da x0μ = Λμ ν xν , mit xν = (ct, x, y, z)T , folgt c t0 = c t cosh ξ − x sinh ξ x0 = x cosh ξ − c t sinh ξ,
0 0 0 0 . 1 0 0 1
y 0 = y,
z0 = z
Ein Vergleich mit den oben abgeleiteten Formeln (10.7) für die Lorentz-Transformation liefert: 1 cosh ξ = γ = p 1 − ν 2 /c2 ν/c sinh ξ = β γ = p 1 − ν 2 /c2 ν tanh ξ = β = c D.h. γ −γβ 0 0 −γβ γ 0 0 Λ= 0 0 1 0 0 0 0 1
Dies entspricht einem Boost in Richtung x1 -Achse. Für einen (drehungsfreien) Boost in beliebiger Richtung ist der Boostvektor ξ~ gegeben durch β~ ξ~ = arctan β β
~ν mit β~ = , β = β~ . c
Analog erhält man für ξ = 0 und θ~ = θ ~e 3 1 0 0 cos θ Λ= 0 − sin θ 0 0
0 sin θ cos θ 0
0 0 , 0 1
120
Kapitel 10. Relativitätstheorie
was einer Drehung der Raumkoordinaten um die z-Achse gegen den Uhrzeigersinn entspricht. Die sechs Matrizen Si , Ki sind eine Darstellung des infinitesimalen Erzeugenden der Lorentz-Gruppe. Sie genügen den Vertauschungsrelationen: [Si , Sj ] = εijk Sk
(10.18)
[Si , Kj ] = εijk Kk
(10.19)
[Ki , Kj ] = −εijk Sk
(10.20)
Anmerkungen zu diesen Vertauschungsrelationen: (10.18): sind Drehimpulsvertauschungsrelationen (10.19): K verhält sich unter Drehungen wie ein Vektor (10.20): Boosts vertauschen nicht
10.8
4-Tensoren
Wenn wir verlangen, dass die Naturgesetze kovariant bezüglich Lorentz-Transformationen sind, d.h. in allen Inertialsystemen die selbe Form haben, dann müssen wir allen physikalischen Größen 4-Tensoren zuordnen. Wir unterscheiden folgende Möglichkeiten: 4-Skalar: eine einkomponentige Größe, die invariant unter Lorentz-Transformationen ist. Kotravarianter 4-Vektor: Eine 4-komponentige Größe, die sich unter Lorentz-Transformationen transformiert wie A0μ = Λμ ν Aν Kovarianter 4-Vektor: Eine 4-komponentige Größe, die sich unter Lorentz-Transformationen transformiert wie ν A0 μ = Aν Λ−1 μ ν ν = Λμ Aν wo Λμ ν ≡ Λ−1 μ Kontravarianter Tensor 2. Ranges: Eine 4 × 4-komponentige Größe, die sich unter Lorentz-Transformationen transformiert wie F 0μα = Λμ ν Λα β F νβ Kovarianter Tensor 2. Ranges: Eine 4 × 4-komponentige Größe, die sich unter Lorentz-Transformationen transformiert wie 0 = Λμ ν Λα β Fνβ Fμα
10.8 4-Tensoren
121
Gemischter Tensor 2. Ranges: Eine 4 × 4-komponentige Größe, die sich unter Lorentz-Transformationen transformiert wie Fμ0 α = Λμ ν Λα β Fν β Analog werden Tensoren höheren Ranges definiert. Bemerkung: Λμ ν und Λμ ν sind 4 × 4 Matrizen, aber keine Tensoren. Tensoroperationen: 1. 2. 3. 4.
Addition von Tensoren der gleichen Stufe Direktes Produkt Verjüngung (Anti)Symmetrisierung
Die Regeln 1 bis 4 für 4-Tensoren gelten mit folgenden Einschränkungen: Addition ist nur zwischen Tensoren der gleichen Art definiert, z.B. ist Aσ + B σ sinnlos. Verjüngung darf nur bezüglich eines kovarianten und eines kontravarianten Indexes erfolgen z.B. Skalar xμ x μ = s 2 (aber xμ xμ = x20 + ~x 2 ist nicht invariant und daher keine erlaubte Operation). (Anti-)Symmetrisierung ist nur hinsichtlich der selben Art von Indizes definiert, z.B. Aμ B ν + Bμ Aν ist ein gemischter Tensor 2. Ranges, weder symmetrisch noch antisymmetrisch. Invariante 4-Tensoren: Die Tensoren gμν , g μν , δ μ ν haben in allen Inertialsystemen die selbe Form. Beispiel: 0 = Λμ ν Λα β gνβ gμα
=
(10.11)
gμν
In Analogie zum 3-dimensionalen ε-Tensor kann man auch einen 4-dimensionalen vollständig antisymmetrischen ε-Tensor definieren, εμνστ
mit εμνστ = 1 für gerade Permutationen von 0123 = −1 für ungerade Permutationen von 0123 = 0 sonst,
der invariant unter eigentlichen Lorentz-Transformationen ist, Λμ α Λν β Λσ γ Λτ δ εαβγδ = εμνστ . Strenggenommen ist εμνστ ein Pseudotensor, er wechselt sein Vorzeichen unter Spiegelungen.
122
10.9
Kapitel 10. Relativitätstheorie
Kovarianz der Naturgesetze
Naturgesetze müssen lorentzkovariant sein, d.h. sie müssen sich als absolute Beziehungen (Regeln 1-4) zwischen Tensoren schreiben lassen, F (A, Aμ , Aμν , ∙ ∙ ∙ ) = 0 . Ein solches Gesetz hat dann in jedem Inertialsystem dieselbe Form . Beispiel 1: ∂μ T μν = 0 im Inertialsystem K σ ∂μ0 T 0μν = ∂σ Λ−1 μ Λμ α Λν β T αβ
= ∂σ δ σα Λν β T αβ = ∂α Λν β T αβ = Λν β ∂α T αβ = 0 .
Beispiel 2: Die Maxwell-Gleichungen in vacuo für lauten: ~ ∙E ~ = 4πρ ∇ ~ ∙B ~ =0 ∇
~ und das Magnetfeld B ~ das elektrische Feld E ~ ×E ~ = − 1 ∂ B~ ∇ c ∂t ~ ×B ~ = 4π ~j + ∇ c
~ 1 ∂E c ∂t
.
Die Lorentz-Kovarianz ist nicht offensichtlich. Führt man jedoch 4-Potentiale ein über ~ =∇ ~ ×A ~ B
~ ~ = −∇Φ ~ − 1 ∂A E c ∂t
und der Lorenz-Bedingung, ~ ∙A ~+ 0=∇
1 ∂φ , c ∂t
so lauten die Maxwell-Gleichungen: ∂ ∂ 1 ∂ 2 Φ (~x, t) Φ (~ x , t) − = −4π% (~x, t) ∂xi ∂xi c2 ∂t2 1 ∂ 2 Ak (~x, t) 4π ∂ ∂ Ak (~x, t) − 2 = − jk (~x, t) i i 2 ∂x ∂x c ∂t c ~ ~j seien die Raumkomponenten eines 4-Vektors, Wir nehmen folgende Zuordnung vor: A, Φ, % seien die Zeitkomponenten eines 4-Vektors, d.h. ~ Aμ = (Φ, A), j μ = c%, ~j . Dann lassen sich die Maxwell-Gleichungen manifest kovariant schreiben: 2 4π μ ∂ μ ν 2 ~ j −∇ Aμ = − . A ≡ ∂ν ∂ Aμ = |{z} ∂x20 c |{z} | {z } V ektor V ektor Skalar
10.10 Lorentzkovariante Kinematik eines Massenpunktes
123
Auch die Kontinuitätsgleichung und die Lorenz-Bedingungen lassen sich kovariant ausdrücken, ∂% μ ~~ ∂t + ∇j = 0 −→ ∂ jμ = 0 ~A ~+ ∇
1 ∂φ c ∂t
=0
−→
∂ μ Aμ = 0 .
~ und B ~ Die Kovarianz der gesamten Maxwell-Gleichungen ist somit bewiesen, da wir E μ in jedem Inertialsystem aus A ausrechnen können. Die Transformationseigenschaften ~ und B ~ selbst werden wir in Kapitel 11 untersuchen. von E Beispiel 2: Die Newtonsche Bewegungsgleichung lautet in 4-dimensionaler Schreibweise: d d i x − Fi = 0 mc2 |{z} dx0 dx0 | {z } V ektor T ensor
d.h. sie ist nicht kovariant.
10.10
Lorentzkovariante Kinematik eines Massenpunktes
Wir betrachten zwei Punkte Pa und Pb auf der Raum-Zeitkurve (Weltlinie) eines Teilchens. Wir hatten gesehen, dass das Intervall von zwei Ereignissen 2 2 s2ab = x0a − x0b − (~xa − ~xb ) ≡ (Δx0 )2 − (Δ~x)2
invariant ist. Für die graphische Darstellung betrachtet man meist nur eine Raumdimension und trägt x0 gegen x auf. Wir betrachten zunächst die Ausbreitung von Licht. Ein Lichtpuls (Photon) bewegt sich auf dem Lichtkegel x0 = x. In einer Raumdimension und für benachbarte Raum-Zeitpunkte ist Δx0 = cΔt = Δx
→
v=
Δx =c Δt
Abbildung 10.1: Raum-Zeitdiagramm
124
Kapitel 10. Relativitätstheorie
Δx Für ein massives Teilchen, das sich mit v < c bewegt, ist Δx < 1 und damit (Δs)2 > 0. 0 Da das Intervall invariant ist, muss dies in jedem Inertialsystem gelten. Das Teilchen bewegt sich stets im Inneren des instantanen Vorwärtslichtkegels. Der Tangente an jedem Punkt der Bahn ist stets < 45◦ . Durch eine geeignete Lorentz-Transformation kann 2 man stets erreichen, dass s2ab = x0a − x0b . Das Intervall zwischen zwei Punkten auf der Bahn heißt daher zeitartig. Das Gebiet außerhalb des Lichtkegels ist dadurch charakterisiert, dass (Δs)2 < 0. Durch eine geeignete Lorentz-Transformation kann man 2 stets erreichen, dass s2ab = − (~xa − ~xb ) . Das Intervall zwischen zwei solchen Ereignissen heißt daher raumartig. Einen beliebigen 4-Vektor aμ bezeichnet man als raumartig, lichtartig, zeitartig je nachdem ob a2 < 0, a2 = 0, oder a2 > 0.
Die Eigenzeit: Wir beobachten von einem Inertialsystem K aus eine Uhr (z.B. in einer Rakete), die sich mit variabler Geschwindigkeit ~u(t) (im Allgemeinen ist. ~u(t) 6= konst.) bewegt. Die auf dieser Uhr gemessene Zeit heißt Eigenzeit. Betrachten wir einen infinitesimalen Zeitabschnitt dt (in K), dann kann in diesem Zeitabschnitt die Geschwindigkeit der Uhr als √ konstant angenommen werden. In diesem Zeitintervall legt die Uhr (in K) die Strecke d~x2 zurück. Frage: Welches Zeitintervall zeigt die bewegte Uhr dann an? Die Uhr ruht im mit ihr verbundenen Koordinatensystem, d.h. dx0 = dy 0 = dz 0 = 0. Wegen der Invarianz des Intervalls gilt ds2 = c2 dt2 − d~x2 = c2 dt02 . Daraus folgt 1√ 2 dt = ds = dt c 0
s
1 1− 2 c
Wir definieren dτ ≡ dt
p
d~x dt
2
1 − ~u2 /c2 .
= dt
r
1−
~u2 . c2 (10.21)
Das infinitesimale Zeitintervall dτ , das auf einer bewegten Uhr gemessen wird, heißt Eigenzeitdifferential. Das Eigenzeitdifferential dτ (= ds/c) ist lorentzinvariant, dτ =
1p μ dx dxμ . c
(10.22)
Um die integrierte Eigenzeit τ (das Eigenzeitintervall) zu finden, muss ~u (t) bekannt sein, Z t2 r ~u2 (t) τ 2 − τ1 = dt 1 − 2 . c t1 Da offensichtlich
τ 2 − τ1 ≤ t 2 − t1 ,
folgt, dass im Inertialsystem K eine bewegte Uhr langsamer geht als eine ruhende Uhr. Wir können eine Uhr mit einer Rakete in den Weltraum und wieder zurück schicken.
10.11 Kovariantes Wirkungsprinzip
125
Wenn die Rakete wieder am Ausgangspunkt angelangt ist, können wir einen Zeitvergleich durchführen und finden τ2 − τ1 < t2 − t1 . Dies steht nicht im Widerspruch zum Relativitätsprinzip, da das Ruhsystem der Uhr (die Rakete) wegen der nötigen Beschleunigungen kein Inertialsystem ist (Zwillingsparadox). Die Eigenzeit dient oft als lorentzinvariante Parametrisierung für die Weltlinie eines Teilchens, xμ = xμ (τ ) . Mit Hilfe der Eigenzeit können wir die 4-Geschwindigkeit uμ definieren: uμ =
dxμ ≡ x˙ μ . dτ
In der Relativitätstheorie bedeutet der Punkt über einem 4-Vektor stets die Ableitung nach der Eigenzeit. In Komponenten lautet die 4-Geschwindigkeit, dt d~x 1 μ =p (c, ~u) , u = c , dτ dτ 1 − ~u2 /c2
x wo ~u = d~ dt die Geschwindigkeit des Teilchens im Inertialsystem K ist. Für kleine Geschwindigkeiten geht uμ −→ (c, ~u). Die Norm von uμ ist konstant |~ u|→0
u2 = u μ u μ =
1 c2 − ~u2 = c2 2 2 (1 − ~u /c )
konst.!
obwohl uμ selbst von der Zeit abhängen kann. Die 4-Geschwindigkeit uμ hat nicht mehr die einfache Bedeutung der zeitlichen Änderung des Positionsvektors (außer für |~v | c) da d~x sich auf das System K bezieht, während sich dτ auf das Ruhsystem des Teilchens bezieht. Die 4-Geschwindigkeit ist ein zeitartiger Vektor, u2 = c2 > 0 (in jedem Koordinatensystem). Man kann ein Koordinatensystem finden, in dem ~u = 0 ist (Ruhsystem), aber es ist stets u0 > 0. Im Ruhsystem ist u0 = c. Man verwendet uμ für eine kovariante Formulierung der Mechanik, da die gewöhnliche Geschwindigkeit kein einfaches Transformationsverhalten hat.
10.11
Kovariantes Wirkungsprinzip
Mit Hilfe der Eigenzeit kann man eine kovariante Wirkung definieren, S=
Zτ2
L(xμ , x˙ μ ; τ )dτ .
τ1
Dabei ist τ die Eigenzeit für die wirkliche Bahn (sie ist nicht die Eigenzeit für die benachbarten Bahnen, sie parametrisiert nur diese Bahnen). Kovariantes Hamilton-Prinzip: Die Wirkung nimmt für die physikalische Weltlinie ein Extremum an. Wir halten bei der Variation die Endpunkte τ1 und τ2 fest (sie sind lorentzinvariant).
126
Kapitel 10. Relativitätstheorie
Abbildung 10.2: Weltlinien in zwei Raum-Zeitdimensionen
Das Prinzip der stationären Wirkung δS = 0 ergibt d ∂L ∂L − =0. (10.23) dτ ∂ x˙ μ ∂xμ Nicht-relativistisch war L ein Skalar bezüglich Drehungen und Translationen (z.B. L = 1 d~ x 2 ). Relativistisch muss L nun lorentzinvariant sein. Ein Ansatz wäre: 2 m dt p L = −mc x˙ μ x˙ μ . (10.24)
Für kleine Geschwindigkeiten erhält man (bis auf eine unwesentliche Konstante) die nicht-relativistische Wirkung Z Z Z r μ p 1 dx dxμ 2 x˙ μ x˙ μ dτ = −mc dτ L = −mc dτ c dτ dτ Z Z Z 1p μ dτ 2 2 2 dx dxμ = −mc dt dτ = −mc = −mc c dt (10.22) r Z Z ~u2 1 = −mc2 1 − 2 dt ' −mc2 + m~u2 dt. c 2
Bemerkung: x˙ μ x˙ μ = c2 darf in L nicht eingesetzt werden. Diese Bedingung gilt nur entlang der wirklichen Weltlinie des Teilchens, aber nicht auf den Konkurrenzscharen. Aus Gl. (10.23) und (10.24) folgt die Bewegungsgleichung: d m x˙ μ = 0 dτ
oder
m¨ xμ = 0
Beweis: ∂L ∂ p α = −mc x˙ x˙ α ∂ x˙ μ ∂ x˙ μ 1 1 ∂ αβ = −mc √ σ g x˙ β x˙ α 2 x˙ x˙ σ ∂ x˙ μ 1 1 = −mc √ σ g αβ (δβμ x˙ α + x˙ β δαμ ) = −mx˙ μ . 2 x˙ x˙ σ
(10.25)
10.11 Kovariantes Wirkungsprinzip
127
In der Bewegungsgleichung selbst kann x˙ σ x˙ σ = 1 gesetzt werden. Die Gleichung (10.25) kann man integrieren, um die kovariante Bahnkurve zu erhalten, xμ (τ ) = xμ (0) + τ x˙ μ (0) . Das Teilchen bewegt sich mit konstanter 4-Geschwindigkeit x˙ μ (τ ) = x˙ μ (0). Im nichtrelativistischen Limes erhält man eine gleichförmige Bewegung, wie es sein muss, 1
~x (τ ) = ~x (0) + τ ~x˙ (0) = ~x (0) + τ p τ=
Z
t
dt
0
0
r
1−
1 − ~u2 /c2 !
~u ' ~x (0) + ~ut
~u2 (t0 ) 't . c2
Analog zur nicht-relativistischen Mechanik definiert man den 4-Impuls, pμ ≡ Für L = −mc
p x˙ μ x˙ μ wird
m d~x p , p dt 1 − β2 1 − β2 mc
p = mx˙ = μ
−∂L . ∂ x˙ μ
μ
Der Impuls pμ ist ein 4-Vektor mit
!
.
p2 = m2 c2 . Die 0-Komponente von pμ ist die relativistische Energie E ≡ p0 c. Für |~u| c wird diese p0 = p
1 1 ~u2 mc2 1 + + ∙ ∙ ∙ c 2 c2 1 − ~u2 /c2 1 1 E 2 2 = mc + m~u + ∙ ∙ ∙ = . c 2 c mc
'
Der erste Term ist eine Konstante mc2 = Ruhenergie = Masse ∙ c2 .
Im Ruhsystem eines Teilchens ist p0 = mc2 . Dies ist die berühmte Einsteinsche Formel E = mc2 . Die Raumkomponente von pμ ist der relativistische 3-Impuls p~, der nur im nicht-relativistischen Limes in den gewöhnlichen Impuls übergeht, m~u
p~ = p
1−
'
~u2 /c2 |~u|c
m~u = m
d~x . dt
128
Kapitel 10. Relativitätstheorie
Abbildung 10.3: Elastische Streuung
Wir können daher schreiben pμ =
E , p~ . c
E und p~ sind wegen p2 = m2 c2 voneinander abhängig, p E2 ~2 = m2 c2 → E = p~2 c2 + m2 c4 . − p c2 In der Newtonschen Mechanik bildeten Energie und Impuls zwei unabhängige Größen. In der relativistischen Mechanik bilden sie die Komponenten eines 4-Vektors. Manchmal definiert man auch eine „bewegte Masse“ m ˜ durch m ˜ ≡
m p~ =q ~u 1−
~ u2 c2
−→ ∞
|~ u|→c
Wir verstehen unter Masse stets die (lorentzinvariante) Ruhmasse m, d.h. in Einheiten mit c = 1 ist die Masse m definiert als die Energie im Ruhsystem.
10.12
Streuung von Teilchen
Betrachte die Streuung von n Teilchen mit Geschwindigkeiten ~v (α) , α = 1, ... n. Wir beschränken uns auf eine Betrachtung der dynamischen Variablen außerhalb des RaumZeitgebietes, auf dem eine Wechselwirkung stattfindet. • 1. Elastische Streuung Für ein isoliertes n-Teilchensystem gilt nicht-relativistisch die Erhaltung von Energie und Impuls: n n X 1 (α) (α) 2 X 1 (α) (α) 2 m ~vein = m ~vaus 2 2 α=1 α=1 n X
(α)
m(α)~v ein =
α=1
n X
(α) m(α)~v aus
(10.26) (10.27)
α=1
Wir vermuten, dass Gl. (10.26) und Gl. (10.27) der nicht-relativistische Limes der 4-Vektor-Relation ist, n n X X (α)μ pein = p(α)μ aus . α=1
α=1
10.12 Streuung von Teilchen
129
Diese Gleichung bedeutet die Erhaltung des relativistischen Gesamt-4-Impulses. In Komponenten: X
(α)
Eein =
α
X
X
(p0 =
E (α) aus
α
(α) p~ ein
=
α
X
E = γ m c) Energieerhaltung c
(~ p = γ m ~v )
p~ (α) aus
3-Impulserhaltung
α
Wenn wir entwickeln
mc 2
E= p
1 − ~v 2 /c2
=
2 mc |{z}
+
Ruhenergie
so können wir
1 m ~v 2 + ∙ ∙ ∙ 2 | {z }
,
relat.kinetische Energie T
T = E − mc 2
mit der relativistische kinetische Energie identifizieren. Für elastische Stöße ist m(α) konstant und es folgt X (α) X T ein = T (α) (10.28) aus . α
α
Für ν c gilt T ≈ 12 m ~v 2 . Damit liefert Gl. (10.28) die nicht-relativistische Energieerhaltung. Wir haben die 4-Impulserhaltung nicht wirklich abgeleitet (folgt aus der 4-Translationsinvarianz). In der Hochenergiephysik wurden Millionen von Messungen durchgeführt, die die 4-Impulserhaltung bestätigen.
• 2. Inelastische Streuung Bei inelastischen Stößen ist nicht-relativistisch der Impuls und die Gesamtmasse erhalten aber nicht die Energie: n X
0
m
(α)
(α) ~v ein
=
α=1
n X
m0(α)~v (α) aus
3-Impulserhaltung
m0(α)
Skalar
α=1 n X
α=1
0
m
(α)
=
n X
α=1
Abbildung 10.4: Inelastische Streuung
130
Kapitel 10. Relativitätstheorie
Relativistisch gilt immer noch die 4-Impulserhaltung, n X
0
(α)μ
pein =
α=1
n X
p (α)μ aus ,
α=1
wenn auch die Gesamtmasse nicht erhalten sein muss. Speziell gilt für die Komponenten μ=0: n X
α=1
μ = 1, 2, 3 : n X
α=1
0
n X m(α) c2 m0(α) c2 r r = 2 2 (α) (α) α=1 1 − ~v ein /c 1 − ~v aus /c
Energieerhaltung
0
n (α) (α) X m(α)~v ein m0(α)~v aus r r = 2 2 (α) (α) α=1 1 − ~v ein /c 1 − ~v aus /c
3-Impulserhaltung
Für v c und m(α) = m0(α) erhält man die nichtrelativistischen Gleichungen. Die Energieerhaltung kann in der Form geschrieben werden n X
α=1
m
c +T
(α) 2
(α) ein
=
n0 X
α=1
m0(α) c2 + T
(α) aus
d.h. wenn Masse in einer Reaktion verloren geht (erzeugt wird) muss sie als kinetische Energie wieder auftauchen (verschwinden).
Kapitel 11
Maxwell-Gleichungen 11.1
Relativistische Dynamik
In der nichtrelativistischen Mechanik wird die Dynamik eines Systems von Massenpunkten durch eine Lagrangefunktion beschrieben, die nur von den Koordinaten und Geschwindigkeiten der Teilchen zu einer Zeit t abhängt. Das Potential ist bei nichtrelativistischen Systemen von N Massenpunkten durch die Position der einzelnem Massenpunkte zu dieser Zeit festgelegt, V (~x1 (t), ..., ~xN (t), t) . Die Wechselwirkung (Kraft) breitet sich mit unendlicher Geschwindigkeit aus. Für ein System von Massenpunkten lassen sich die Kräfte zwischen den einzelnen Teilchen aus dem Potential ableiten. Man führt zur Beschreibung der Bewegung die Gesamtmasse, den Gesamtimpuls und den Gesamtdrehimpuls ein. Besonders einfach lässt sich ein starrer Körper beschreiben, bei dem die relative Lage der Teilchen fest ist. Der mechanische Zustand eines starren Körpers ist durch 3 Raumkoordinaten und 3 Geschwindigkeiten eindeutig festgelegt. All diese Konzepte können nicht in die relativistische Dynamik wechselwirkender Teilchen übernommen werden. Die Kraft auf ein relativistisches Teilchen zu einer Zeit t wird nicht durch die Lage der anderen Teilchen zu dieser Zeit festgelegt (das wäre eine instantane Fernwirkung), sondern durch die Lage der anderen Teilchen zu einer früheren (retardierten) Zeit, da sich die Wechselwirkung nur mit endlicher Geschwindigkeit ausbreitet. Die Definition des Gesamtimpulses ist bei Anwesenheit von Kräften im Allgemeinen nicht mehr möglich, da man nicht mehr koordinatenunabhängig definieren kann, wann die Impulse zu addieren sind. Eine Ausnahme bildet ein isoliertes System von punktförmig wechselwirkenden Punktteilchen, wenn wir annehmen, dass der 4-Impuls bei jeder Kollision erhalten ist (relativistisches Billardspiel). Auch ein starrer Körper kann in der Relativitätstheorie nicht existieren, da er bei einem Anstoßen an einem Punkt seine Form verlieren würde, es sei denn es gäbe eine instan-
132
Kapitel 11. Maxwell-Gleichungen
tane Fernwirkung. Ein relativistisches Objekt, dessen Zustand durch 3 Koordinaten und 3 Geschwindigkeiten festgelegt sein soll, kann in der relativistischen Dynamik nur wirklich punktförmig sein. Als Folge der endlichen Geschwindigkeit der Wirkung, muss das Kraftfeld als selbständige dynamische Variable betrachtet werden. Man muss zusätzlich zu den Teilchenfreiheitsgraden die unendlich vielen Freiheitsgrade des Feldes einführen. Wir werden uns zunächst auf den Fall eines einzelnen Teilchens beschränken, das sich in einem äußeren Feld bewegt. Ein äußeres Feld rührt von Quellen im Unendlichen her. Das Teilchen produziert selbst ein Feld, das so klein sein soll, dass die Quellen im Unendlichen nicht beeinflusst werden. Es handelt sich also um ein Probeteilchen. Die relativistische physikalische Kraft: Betrachte ein Teilchen, das sich in einem Inertialsystem K mit Geschwindigkeit ~u (t) ≡ d~ x dt bewegt. Die physikalische Kraft ist definiert als die zeitliche Änderung des Impulses im System K, d~ p , (11.1) F~ ≡ dt wo p~ die Raumkomponenten des 4-Impulses pμ = (p0 , p~) sind, mit p0 = γu mc,
p~ = γu m~u,
1 γu = p . 1 − ~u2 /c2
(11.2)
Beispiel: Auf eine Punktladung q, die sich zur Zeit t am Ort ~x in einem elektromagnetischen ~ B ~ befindet, wirkt die Lorentz-Kraft : Feld E, ~ (~x, t) + 1 ~u (t) × B ~ (~x, t) F~ (~x, t) = q E (11.3) c Experimente zeigen, dass diese Formel für alle u < c gilt. Obwohl die physikalische Kraft über den 4-Impuls definiert ist, hat sie kein einfaches Verhalten unter LorentzTransformationen. Deshalb sucht man manchmal eine kovariante Definition der Kraft. Minkowski-Kraft: Ein Teilchen bewege sich in einem Inertialsystem K mit Geschwindigkeit ~u (t). Statt der Zeit t verwenden wir die Eigenzeit τ als kovariante Parametrisierung der Bewegung. Mit Hilfe des 4-Impulses lässt sich eine relativistische Kraft, die Minkowski-Kraft f μ , definieren, dxμ dpμ dxμ μ μ μ f ≡ dt = γu dτ, x˙ ≡ = m¨ x = γu dτ dτ dt d d = (γu mc, γu m~u) = γu (γu mc, γu m~u), dτ dt
11.1 Relativistische Dynamik
133
wobei der Punkt über einer Größe in der relativistischen Theorie die Ableitung nach der Eigenzeit bedeutet. Die Raumkomponente der Minkowski-Kraft f~ hängt mit der physikalischen Kraft F~ = d~p zusammen über dt
d~ p d~ p =γ = γ F~ . f~ = dτ dt Was ist die Bedeutung der 0-Komponente der relativistischen Kraft? Da p2 = m2 c2 eine Konstante ist, folgt 0=
d μ p pμ = 2pμ fμ = 2(p0 f 0 − p~ ∙ f~) dτ
oder f0 =
p~ ∙ f~ γu m~u ∙ f~ 1 = = ~u ∙ f~ . p0 γu mc c
Ausgedrückt durch die physikalische Kraft, Gl. (11.2), wird f0 =
γ ~u ∙ F~ . c
Dabei ist ~u ∙ F~ die Arbeit pro Zeiteinheit ist, die von der Kraft geleistet wird. Das gilt für beliebige ~u (u < c). Diese Ausdrücke erhalten erst Inhalt, wenn man die Kraft angeben kann. Beispiele wären die Federkraft zwischen zwei Teilchen, die Gravitationskraft oder die elektromagnetische Lorentz-Kraft. Transformationsverhalten der physikalischen Kraft: Wir hatten oben gesehen, dass die physikalische Kraft auf ein Teilchen, das sich in einem Inertialsystem K mit Geschwindigkeit ~u bewegt, die Beziehungen d~ p , F~ = dt
dp0 1 = ~u ∙ F~ dt c
(11.4)
erfüllt. Wir betrachten ein zweites Inertialsystem K 0 , das sich relativ zu K mit konstanter Geschwindigkeit ~v = v~ex bewegt. Das obige Argument gilt auch im System K 0 d~ p0 F~ 0 = 0 , dt
dp00 1 = ~u 0 ∙ F~ 0 dt 0 c
wo ~u 0 (t) die Geschwindigkeit des Teilchens in K 0 ist. Der Zusammenhang ist gegeben durch dt0 d 0 dpx v v 0 d 0 p + = γ px + p00 = γ p Fx = dt dt c dt dt0 x c 0 p mit γ = 1/1 1 − ~v 2 /c2 konstant. Aus v ∙ x0 t = γ t0 + 2 (~v = v~ex ) c folgt
v v dx0 dt = γ 1 + 2 u0x = γ 1 + 0 2 0 dt c dt c
134
Kapitel 11. Maxwell-Gleichungen
Damit wird Fx =
1 1+
vu0x c2
= Fx0 +
h
Fx0 +
vu0y /c2 1+
vu0x c2
v ~0 ~ 0 i u ∙F c2
Fy0 +
vu0z /c2
1+
vu0x c2
Fz0 .
(11.5)
Auf die gleiche Weise finden wir Fy = Fz =
dpy 1 dt0 dp0y = = dt dt dt0 γ 1+
1
γ 1+
vu0x c2
vu0x c2
Fz0 .
Fy0
Mit Hilfe der Formeln für die Lorentz-Transformation der Geschwindigkeit, u0x =
ux − v uy uz , u0z = , , u0y = 1 − ucx2v γ 1 − ucx2v γ 1 − ucx2v
lassen sich diese Formeln umschreiben in vuy vuz Fx = Fx0 + γ 2 Fy0 + γ 2 Fz0 c c vux 0 Fy = γ 1 − 2 Fy c vux 0 F z = γ 1 − 2 Fz . c
(11.6) (11.7) (11.8)
Beweis z.B. der Formel (11.6): Wir betrachten zunächst den Ausdruck vu0x v ux − v 1+ 2 =1+ 2 c c 1 − vux /c2 2
− vc2 + 1 − 1 1 − vux /c2 1 1 − v 2 /c2 1 = = 2 . 1 − vux /c2 γ 1 − vux /c2
=1+
vux c2
Damit wird v vux 0 uy 2 )Fy ux v γ (1 − 2 c γ 1 − c2 c2 v vu uz γ 2 (1 − 2x )Fz0 + 2 c γ 1 − ucx2v c vu vu y z = Fx0 + γ 2 Fy0 + γ 2 Fz0 c c
Fx = Fx0 +
Aus den Formeln (11.6)-(11.8) folgt: Wenn eine Kraft in einem Inertialsystem K 0 nur von ~x0 abhängt, F~ 0 = F~ 0 (~x0 ), dann hängt sie in allen anderen Inertialsystemen von ~x
~ und B ~ 11.2 Transformationsverhalten von E
135
und ~u ab. Man muss also davon ausgehen, dass im Allgemeinen die physikalische Kraft in einem Inertialsystem von der Geschwindigkeit ~u (t) des Teilchens abhängt. Es liegt ~ und B ~ zu schreiben, nahe, die physikalische Kraft F als Summe von zwei Termen A mit Fx0 0 ~ ≡ γFy0 ~ ≡ − v γFz0 , A und B c v 0 0 γFz c γFy wo wir Fi0 auffassen als Funktion der Koordinaten x = (~x, t) des ursprünglichen Systems, Fi0 = Fi0 (x0 (x)). Damit lassen sich (11.6), (11.7), (11.8) schreiben als ~u ~ ~ F~ (x) = A(x) + × B(x), c
(11.9)
~ ein polarer und B ~ ein axialer Vektor ist. Jede Kraft, die relativistisch definiert wo A werden kann, muss von dieser Form sein. Beispiele wären die Lorentz-Kraft, Scheinkräfte in rotierenden Koordinatensystemen und die Gravitation. Anmerkung: Die Definition der Kraft erhält erst Inhalt, wenn sie mit anderen experi~=E ~ in Gl. (11.9), so mentellen Größen in Verbindung gesetzt wird. Setzen wir z.B. A ~ ~ können wir E mit dem elektrischen und B mit dem magnetischen Feld identifizieren und erhalten die Lorentz-Kraft, die auf ein Teilchen der Ladung q im elektrischen und ~ und B ~ rein mechanisch definiert. Da die Formagnetischen Feld wirkt. Damit werden E ~ und B ~ die selben, die im System K meln für alle Geschwindigkeiten ~u gelten, sind E in einem echten Experiment durch langsame (nicht-relativistische) Teilchen gemessen werden. Diese Annahme muss natürlich durch das Experiment verifiziert werden.
11.2
~ und B ~ Transformationsverhalten von E
Betrachte ein Koordinatensystem K und ein zweites Inertialsystem K 0 , das sich relativ zu K mit Geschwindigkeit ~v = v ~ex bewegt. Die Kraft auf ein Teilchen in den jeweiligen Systemen ist ~ + ~u × B ~ F~ = q E in K c 0 ~ 0 + ~u × B ~0 in K 0 . F~ 0 = q E c Aus dem Transformationsverhalten von F~ und ~u lässt sich das Transformationsverhal~ und B ~ ableiten. Man findet ten von E v v Ex = Ex0 , Ey = γ Ey0 + Bz0 , Ez = γ Ez0 − By0 (11.10) c c v v (11.11) Bx = Bx0 , Bz = γ Bz0 + Ey0 , By = γ By0 − Ez0 . c c
Beweis: Gl. (11.7) lautet für Fy :
vux Fy = γ 1 − 2 Fy0 c
136
Kapitel 11. Maxwell-Gleichungen
~ und B ~ oder, ausgedrückt durch E Ey +
1 vux 0 1 Ey + (u0z Bx0 − u0x Bz0 ) . (uz Bx − ux Bz ) = γ 1 − 2 c c c
Die Geschwindigkeiten in K und K 0 hängen zusammen über u0x =
ux − v , 1 − vux /c2
u0z =
Damit wird Ey +
uz . x γ 1 − vu c2
1 vux 1 (uz Bx − ux Bz ) = γ 1 − 2 Ey0 + uz Bx0 − (ux − v) γBz0 . c c c
Diese Relation muss für beliebige ux , uz gelten, d.h. die Koeffizienten von 1, ux , uz müssen gleich sein. Ein Koeffizientenvergleich liefert: v 1 : Ey = γ Ey0 + Bz0 (11.12) c v ux : Bz = γ Bz0 + Ey0 c uz : Bx = Bx0 . Die restlichen Gleichungen in (11.10) und (11.11) erhält man, wenn man die Gleichun~ ↔E ~ 0, gen (11.6) und (11.8) betrachtet. Die Umkehrtransformation erhält man durch E 0 ~ ↔B ~ und v → −v, oder durch Auflösen der 6 Gleichungen. Die TransformationsforB ~ und B ~ lassen sich bequem zusammenfassen, wenn man in Komponenten meln von E senkrecht (⊥) und parallel (k) zu ~v aufspaltet, 0 ~ ⊥ + ~v × B ~0 = E ~k ~⊥ ~⊥ E =γ E (11.13) E k c ~0 = γ B ~ ⊥ + ~v × E ~0 = B ~k . ~ B B (11.14) ⊥ ⊥ k c Für
v c
1 reduzieren sich diese Ausdrücke auf ~0 = E ~ + ~v × B ~ E c
~ + ~v × E ~0 = B ~ . B c
(11.15)
Ein reines elektrisches Feld in einem System erscheint als ein elektrisches und ein ma~ und B ~ bilden eine physikalische gnetisches Feld in einem anderen Inertialsystem. E ~ und B ~ erEinheit, das elektromagnetische Feld. Im Transformationsverhalten von E kennt man allerdings die Lorentz-Transformation nicht direkt wieder.
11.3
Der elektromagnetische Feldtensor
~ und B ~ aus 6 unabhängigen Komponenten bestehen, liegt es nahe anzusetzen, dass Da E ~ und B ~ die Komponenten des antisymmetrischen 4-Tensors, des elektromagnetischen E
11.3 Der elektromagnetische Feldtensor Feldtensors bilden, F μν
0 Ex ≡ Ey Ez
−Ex 0 Bz −By
137
−Ey −Bz 0 Bx
−Ez By . −Bx 0
(11.16)
F μν transformiert sich unter Lorentz-Transformationen wie ein Tensor 2. Stufe: F
0
μν
(x0 ) = Λμ σ Λν τ F στ (x) = Λμ σ F στ (x)Λν τ
oder
F 0 = ΛF ΛT .
Beweis (Computeralgebra empfehlenswert): γ −γβ 0 0 0 −Ex −Ey −Ez γ −γβ 0 −γβ Ex γ 0 0 0 −B B −γβ γ 0 z y 0 0 1 0 Ey B z 0 −Bx 0 0 1 0 0 0 1 Ez −By Bx 0 0 0 0 2 2 2 0 −γ Ex + β γ Ex −γEy + βγBz −γEz − βγBy γ 2 Ex − β 2 γ 2 E x 0 −γBz + βγEy γBy + βγEz = γEy − βγBz γBz − βγEy 0 −Bx γEz + βγBy −γBy − βγEz Bx 0
T 0 0 0 1
Wenn man beachtet, dass γ 2 − β 2 γ 2 = γ 2 (1 − β 2 ) = 1 ist, dann ergibt sich das obige ~ und B. ~ Auch die Lorentz-Kraft lässt sich durch F μν Transformationsverhalten von E ausdrücken, f β = qF βσ uσ , (11.17)
wo uβ die 4-Geschwindigkeit ist. Sie war durch die Ableitung des Ortsvektors nach der μ x 2 2 Eigenzeit definiert (uμ = xdτ = (γu c, γu ~u) mit ~u = d~ dt und u = c ) und hängt mit dem 4-Impuls eines Teilchens zusammen über pα = muα . Beweis der Relation (11.17) für die Raumkomponente: 1 u0 uj f i = q F iσ uσ = qF i0 − qF ij . c c c Wenn wir verwenden, dass F i0 = E i finden wir
und
F ij = −εijk B k ,
uj = −uj = −γuj
uj ) c ~u ~ ~ ~ f = γu E + × B . c
f i = qγu (E i − εijk B k oder
Da fi definiert war als fi = γu Fi , ist dies genau die Formel für die Lorentz-Kraft.
138
11.4
Kapitel 11. Maxwell-Gleichungen
4-Potentiale
Wir nehmen an (oder schließen aus dem Experiment), dass sich die statischen Felder ~ und B ~ aus Potentialen ableiten lassen, E ~ x) = −∇Φ(~ ~ x), E(~
~ x) = ∇ ~ × A(~ ~ x) . B(~
(11.18)
Dann liegt es nahe anzunehmen, dass sich auch die zeitabhängigen Felder aus Potentia~ x, t) die vier Komponenten len ableiten lassen. Dazu setzen wir an, dass Φ(~x, t) und A(~ eines 4-Vektors bilden, ~ Aμ (x) = (Φ(x), A(x)),
(x = (x0 , ~x)) .
Ausgedrückt durch die Potentiale lautet dann der Feldtensor F μν = ∂ μ Aν − ∂ ν Aμ .
(11.19)
~ und B ~ bedeutet diese Identifikation In der üblichen Notation mit den Feldern E ~ ~ = −∇φ ~ − 1 ∂A , E c ∂t
~ =∇ ~ × A. ~ B
(11.20)
Beweis für das elektrische Feld: E i = F i0 = ∂ i A0 − ∂ 0 Ai ~ oder, da ∂ μ = (∂ 0 , −∇),
1 ∂ ~ ~ = −∇Φ(x) ~ E − A(x) c ∂t
und für das Magnetfeld: −Bz = F 12 = ∂ 1 A2 − ∂ 2 A1 = −∂x Ay + ∂y Ax ~ × A) ~ z = −(∇ und analog für die anderen Komponenten von B i . Die Definitionen (11.20) gelten in jedem Intertialsystem. Wenn die Annahme der Existenz der Potentiale in der Natur realisiert ist, dann hat sich die Zahl der Freiheitsgrade von 6 auf 4 reduziert.
11.5
Homogene Maxwell-Gleichungen
Aus der Existenz der Potentiale folgen die homogenen Maxwell-Gleichungen : ~ ~ ×E ~ = − 1 ∂B , ∇ c ∂t
~ ∙B ~ =0. ∇
Beweis: ~ ~ − 1 ∂A −∇φ c ∂t ~ ∙B ~ =∇ ~ ∙ ∇ ~ ×A ~ = 0. ∇
~ ×E ~ =∇ ~ × ∇
!
=−
~ 1 ∂B c ∂t
11.6 Die inhomogenen Maxwell-Gleichungen
139
Die homogenen Maxwell-Gleichungen können mit Hilfe des Feldtensors kovariant geschrieben werden, ∂σ F μν + ∂ν F σμ + ∂μ F νσ = 0 oder kompakter
∂μ F˜ μν = 0
wo Fe μν der duale Feldtensor ist,
1 Fe μν = εμναβ Fαβ . 2
Beweis: Da das Produkt eines antisymmetrischen Tensors mit einem symmetrische Tensor verschwindet, gilt εμναβ ∂μ ∂a Aβ = 0 und εμναβ ∂μ ∂β Aα = 0 . Wir hatten gezeigt, dass die homogenen Maxwell-Gleichungen aus der Existenz der Potentiale folgen. Umgekehrt gilt auch, wenn die homogenen Maxwell-Gleichungen gelten, so existieren die Potentiale ~ ∙B ~ =0 ∇
−→
~ =∇ ~ ×A ~ B
~+1 ∂B ~+1 ~ = rot E ~ = rotE ~ + 1 ∂ rotA 0 = rotE c ∂t c ∂t c ~+ →E
1 c
~ ∂A ∂t
!
~ ∂A ~ = −∇φ. ∂t
Obwohl die Formeln ursprünglich in der Elektrodynamik abgeleitet wurden, sind sie allgemeine Formeln der relativistischen Mechanik, für den Fall, dass solche Potentiale existieren.
11.6
Die inhomogenen Maxwell-Gleichungen
Ein Vektor wird eindeutig durch seine Rotation und Divergenz festgelegt. Wir definieren also eine Ladungsdichte ρ (~x, t) und eine Stromdichte ~j (~x, t) (3-Vektor) durch ~ ∙E ~ = 4πρ ∇
~ ~ ×B ~ = 4π ~j + ∂ E . ∇ c ∂t
(11.21) (11.22) ~
Die zweite Definition scheint willkürlich. Der Maxwellsche Verschiebungsstrom ∂∂tE muss eingeführt werden, damit die Stromerhaltung gilt. Aus diesen Definitionen folgt die Kovarianz der inhomogenen Maxwell-Gleichungen, wenn man ρ und ~j zu einem 4Vektor, den 4-Strom, zusammenfasst, j μ ≡ cρ, ~j . (11.23)
140
Kapitel 11. Maxwell-Gleichungen
Der Faktor 4π Gl. (11.21) ist Konvention. Dann kann Gl. (11.21) geschrieben werden als 4π ν ∂μ F μν (x) = (11.24) j (x) c wo F μν der elektromagnetische Feldtensor aus Gl. (11.16) ist. Diese Gleichung fasst die inhomogenen Maxwell-Gleichugen (11.21) und (11.21) kompakt zusammen. Z.B. für ν = 0 gilt 4π 0 ~ ∙E ~ = 4πρ . ∂0 F 00 + ∂i F io = j oder 0 + ∇ c Kontinuitätsgleichung: Aus (11.21) folgt auch die Kontinuitätsgleichung: ! ~ ∂E ∂ ~ ~ ~ ∂ ~ ∙ ∇ ~ ×B ~ − 4π~j =∇ ∇∙E =∇∙ (4πρ) = ∂t ∂t ∂t ~ ∙ ~j + ∂ ρ = 0 → ∇ ∂t oder, kovariant
∂μ j μ = 0 .
Zusammenfassung: Die Elektrodynamik von Feldern, Ladungen und Strömen wird durch die folgenden Gleichungen beschrieben: Maxwellgleichungen : ~ ∙E ~ = 4πρ, ∇ ~ ∙B ~ = 0, ∇ Kontinuitätsgleichung : Lorentz-Kraft :
~ ~ ×E ~ + 1 ∂B = 0 ∇ c ∂t ~ ~ ×B ~ = 4π~j + 1 ∂ E ∇ c ∂t
~ ∙ ~j + ∂ ρ = 0 ∇ ∂t d~ p ~v ~ ~ ~ F = =q E+ ×B dt c
Für eine kontinuierliche Ladungs- und Stromverteilung lautet die Verallgemeinerung der Lorentz-Kraft 1 ~ ~ F~ (x) = ρ(x)E(x) + ~j(x) × B(x) c ~ und B ~ dieselDie Gleichungen sind in Gaußschen Einheiten geschrieben, in denen E be Dimension haben. Diese Gleichungen erhält man aus den Maxwell-Gleichungen in SI-Einheiten indem man ε0 durch 1/4π und μ0 durch 4π ersetzt. Gaußsche Einheiten ~ und B ~ eine physieignen sich für theoretische Behandlungen, da sie betonen, dass E kalische Einheit bilden. Für eine besonders ausführliche Diskussion der Einheiten der Elektrodynamik siehe Scheck 2006, Band 3.
11.7 Eichtransformationen
11.7
141
Eichtransformationen
Die Transformation des Vektorpotentials, ~ (~x, t) + ∇Λ ~ (~x, t) , ~ (~x, t) → A ~ 0 (~x, t) = A A
(11.25)
~ Das elektrische Feld E ~ ändert sich jedoch, führt auf dasselbe B. ~ −1 ∂ A ~ + ∇Λ ~ ~ →E ~ 0 = −∇φ E c ∂t ~ ~ φ + 1 ∂Λ − 1 ∂ A . = −∇ c ∂t c ∂t Transformiert man aber gleichzeitig das skalare Potential,
1 ∂Λ (~x, t) , (11.26) c ∂t ~ und B ~ und damit alle messbaren Efso bleiben in der Maxwellschen Elektrodynamik E fekte gleich. Diese Transformation der Potentiale heißt Eichtransformation. Kovariant geschrieben lauten die Eichtransformationen: φ (~x, t) → φ0 (~x, t) = φ (~x, t) −
Aμ (~x, t) → Aμ (~x, t) − ∂ μ Λ (~x, t) . ~ und φ stellen. Je nach Wegen der Eichfreiheit kann man noch eine Bedingung an A Anwendung werden verschiedene Möglichkeiten gewählt. Beispiele sind: Die kovariante Lorenz-Eichung mit der Bedingung ∂ μ Aμ = 0 und die Coulomb-Eichung
11.8
~ + 1 ∂φ = 0 oder ∇ ∙ A c ∂t ~=0. ∇∙A
Differentialgleichungen für die Potentiale
~ und B ~ durch die Potentiale, dann erhält man aus ∇∙ ~ E ~ = 4πρ Ersetzt man die Felder E ∇2 φ + ~ ×B ~− und aus ∇
~ 1 ∂E c ∂t
=
4π c
1 ∂ ~ ~ ∇ ∙ A = −4πρ c ∂t
(11.27)
~j
2~ ~ + 1 grad ∂φ + 1 ∂ A = 4π ~j . rot rot A c ∂t c2 ∂t2 c 2~ ~ ~ Mit der Identität rot rot A = grad divA − ∇ A geht diese Gleichung über in 2~ ~ − 1 ∂ A − grad divA ~ + 1 ∂φ = − 4π ~j . ∇2 A c2 ∂t2 c ∂t c
(11.28)
Die beiden Gleichungen (11.27) und (11.28) bilden vier gekoppelte Differentialgleichungen zweiter Ordnung. Wir betrachten sie speziell in zwei Eichungen.
142
Kapitel 11. Maxwell-Gleichungen
~ ∙A ~+ a) In der Lorenz-Eichung ∇ peln die vier Gleichungen
1 ∂φ c ∂t
=0
und kartesischen Koordinaten entkop-
1 ∂ 1 ∂φ = −4πρ c ∂t c ∂t 2~ ~ − 1 ∂ A = − 4π ~j ∇2 A c2 ∂t2 c
∇2 φ −
oder kovariant
1 ∂2 ∇ − 2 2 c ∂t 2
Aμ (x) = −
4π μ j (x) , c
(11.29)
mit j μ = ρ, 1c ~j . Jede Komponente von Aμ erfüllt eine inhomogene Wellengleichung. Die Kovarianz der Maxwellgleichungen für die Potentiale ist manifest, da ∇2 −
1 ∂2 = −∂μ ∂ μ ≡ c2 ∂t2
ein invarianter Skalar ist. ~ ∙A ~ = 0) entkoppelt nur die erste Gleichung (11.27 ), b) In der Coulomb-Eichung ( ∇ ~2 φ (~x, t) = −4πρ (~x, t) . ∇ Diese Gleichung sieht aus wie die Poisson-Gleichung der Elektrostatik. Die Coulomb-Eichung ist auch nützlich in der Magnetostatik. Wenn das Vektorpotential zeitunabhängig ist, geht (11.28) über in ~ (~x) = ∇2 A
11.9
4π ~ j (~x) . c
Poyntingsches Theorem
~ bzw. E, ~ Multiplizieren wir die beiden homogenen Maxwellgleichungen mit B ~ 1 ∂B ~ ~ ×E ~ = −∇ ∙B c ∂t ~ 1 ∂E ~ ×B ~ − 4π ~j ∙ E ~ , =∇ c ∂t c dann erhalten wir 1 c
~ ~ ~ ∙ ∂B + E ~ ∙ ∂E B ∂t ∂t
!
=−
4π ~ ~ ~ ~ −E ~ rot B ~ j ∙ E − B ∙ rot E c | {z } ~ (E× ~ B ~) ∇∙
oder
1 ∂ ~2 4π ~ −∇ ~ ∙ E ~ ×B ~ . E + B~2 = − ~j ∙ E 2c ∂t c
11.9 Poyntingsches Theorem
143
~ ×B ~ im letzten Term heißt Poynting-Vektor, Der Faktor E ~ ×B ~ . ~≡ c E S 4π Die physikalische Bedeutung dieses Vektors wird noch klar werden. Poyntingsches Theorem: →
∂ 1 ~2 ~ −∇ ~ ∙S ~ . E + B~2 = −~j ∙ E ∂t 8π
Um dieses Theorem zu interpretieren, integrieren wir über ein festes Volumen V mit Rand ∂V , verwenden den Gaußschen Satz für den letzten Term und erhalten: Z I Z d 3 1 3 ~ ~ 2 2 ~ ∙ d~a . ~ ~ S (11.30) j ∙ Ed x − d x E +B =− dt V 8π V ∂V
Das Oberflächenintegral verschwindet für V → ∞. R ~ 3 x: Bedeutung des Terms ~j ∙ Ed
~ B. ~ Die LorentzWir betrachten eine Punktladung q im elektromagnetischen Feld E, Kraft auf ein Teilchen der Ladung q, die sich zur Zeit t am Ort ~x befindet ist ~ (~x, t) . ~ (~x, t) + 1 ~v (t) × B F~ (~x, t) = q E c
Bei einer Verschiebung um d~x leistet das Feld an der Punktladung die Arbeit ~ ∙ d~x . dW mech = F~ ∙ d~x = q E i h x ~ senkrecht auf d~x steht. Die Arbeit × B Das Magnetfeld leistet keine Arbeit, da d~ dt pro Zeiteinheit ist entsprechend gegeben durch: dW (mech) ~ (~x, t) ∙ ~v (t) . = qE dt Wenn sich mehrere Ladungen im Feld bewegen, muss über die einzelnen Ladungen qi summiert werden X dW (mech) ~ (~xi , t) ∙ ~vi (t) . qi E = dt i Im Kontinuumslimes geht qi~vi in den Strom über,
qi~vi (t) → ~j(~x, t) . Damit wird
dW (mech.) = dt
Z
V
~ (~x, t) . d3 x ~j (~x, t) ∙ E
144
Kapitel 11. Maxwell-Gleichungen
Diese Arbeit wird vom Feld an den Ladungsträgern verrichtet und führt zu einer Änderung der kinetischen Energie der Ladungen, d.h. zu Wärme. Für das integrierte Poynting-Theorem (11.30) ergibt sich somit d dt
Z
1 ~2 mech. ~ 2 d x (t) = 0 . E +B +W 8π Raum 3
Wenn wir davon ausgehen, dass die Gesamtenergie erhalten ist, so können wir den Term Z 1 F eld (t) = d3 x E~2 + B~2 (11.31) W 8π V
als Feldenergie im Volumen V , und den Integranden wF eld (~x, t) =
1 ~2 ~ 2 (~x, t) E (~x, t) + B 8π
als Energiedichte interpretieren. Dies gilt speziell auch für statische Felder. Wir betrachten noch einmal ein festes endliches Volumen V . Im betrachteten Zeitintervall möge keines der geladenen Teilchen das Volumen V verlassen. Dann ist I Z d ~ ∙ d~a . d3 x w F eld (~x, t) + W mech = − S dt V ∂V {z } | zeitl. Änderung der Gesamtenergie
H ~ a ist also der Energiefluss des elektromagnetischen Feldes Das Oberflächenintegral S∙d~ (von innen nach aussen)
11.10
Das Ohmschen Gesetz
Das Ohmsche Gesetz besagt, dass der Strom proportional zum elektrischen Feld ist ~ , ~j = σ E wo σ die Leitfähigkeit ist. Wir wollen zeigen, wie diese Form des Gesetzes mit der üblichen Form I = V /R zusammenhängt. Dazu betrachten wir einen dünnen Draht und ersetzen ~j (x) d3 x → Id~l , wo I der konventionelle Strom ist. Für einen geraden Draht der Länge L zwischen den Punkten A und B in z-Richtung sind zum Beispiel Strom und Leitfähigkeit gegeben durch L → − j (~x) = I(0, 0, δ(x)δ(y)), σ = δ(x)δ(y) , R
11.10 Das Ohmschen Gesetz
145
Abbildung 11.1: Strom in einem dünnen Draht
mit A ≤ z ≤ B. Dabei ist R der Widerstand. Wir setzen diese Ausdrücke ins Ohmsche Gesetz ein, Z Z L d3 x σ (~x) Ez (~x) = d3 x δ (x) δ (y) Ez (~x) R ZB ZB L L dφ = dz ∙ Ez (0, 0, z) = dz − R R dz A
A
L L A = φ − φB = V R R
und
Z
jz (~x) d x = I 3
Z
d x δ (x) δ (y) = I 3
ZB
dz = I ∙ L.
A
Wir erhalten also das Ohmsche Gesetz in der bekannten Form I = V /R. Anmerkung: Die Diracsche Deltafunktion (besser Distribution) ist definiert durch Zb a
δ(x − x0 )f (x) = f (x0 ) =0
für a < x0 < b
(11.32)
sonst
für genügend glatte f (x). Zur heuristischen Veranschaulichung kann das Riemannsche Integral dienen. Das Intervall [a, b] wird in N Segmente der Breite b−a , mit N → ∞ N
Δx = aufgeteilt. Dann gilt für glatte f (x) Zb a
D.h.
δ(x − x0 )f (x) = lim
N →∞
X
Δx[δij /Δx]f (xi ) = f (xj ).
i
X δij . Δx→0 Δx i
δ(x) = lim
146
Kapitel 11. Maxwell-Gleichungen
Eine andere Darstellung ist 1 δ(x) = 2π
Z∞
e±ikx .
−∞
Aus der Definition (11.32) lassen sich eine Reihe von Eigenschaften der Deltafunktion ableiten. Beispiele sind 1 δ(x) a X 1 b) δ(g(x)) = dg(xi ) δ(x) , i dx wo xi die Nullstellen von g(x) sind. δ(ax) =
a)
Diese Formeln haben nur Sinn, wenn mit einer glatten Funktion multipliziert und integriert wird. Ein Beispiel für die Herleitung dieser Formeln und deren Bedeutung wäre Z∞
−∞
1 δ(ax)f (x)dx = a
Z∞
−∞
1 1 δ(ax)f ( ax)d(ax) = a a
Z∞
−∞
1 1 δ(x)f ( x)dx = f (0) . a a
Eine weitere Distribution ist die sogenannte Theta- oder Stufenfunktion 0 für x < x0 θ(x − x0 ) = 1...für x > x0 Sie erfüllt die Beziehung d θ(x − x0 ) = δ(x − x0 ) . dx
11.11
Lagrangesche Formulierung
Als Erstes wollen wir die Bewegungsgleichung eines geladenen Probeteilchens im äußeren Feld aus dem kovarianten Hamilton-Prinzip δS = δ
Zτ2
L(xμ , x˙ μ ; τ )dτ = 0
τ1
ableiten. L muss lorentzinvariant sein, um die Kovarianz p der Bewegungsgleichungen zu gewährleisten. Neben dem kinetischen Term Lkin = −mc x˙ μ x˙ μ brauchen wir einen invarianten Term, der das Potential involviert. Die einfachste Möglichkeit ist ein skalares Potential Φ(x), wo x für x0 , x1 , x2 , x3 steht. Damit wird die Wirkung S=−
Zτ2 h
τ1
mc
p
x˙ μ x˙ μ + k
p
i x˙ μ x˙ μ Φ(x) dτ,
11.11 Lagrangesche Formulierung
147
wo k die Stärke der Kopplung parametrisiert. Das skalare Potential ist damit äquivalent einer Änderung der Masse. Physikalisch interessanter sind 4-Vektor-Potentiale Aμ (x), deren Komponenten Funktionen des Ortes und der Zeit sind. Die einfachste Invariante wäre dxμ Aμ . Dann lautet die Wirkung Zτ2 p q dxμ μ S=− mc x˙ μ x˙ μ + (11.33) A (x) dτ c dτ τ1
mit x = x(τ ). Den Parameter q nennen wir Ladung, er charakterisiert die Stärke der Kopplung. Die Wirkung ist über die Weltlinie des Teilchens zu nehmen. Die LagrangeGleichungen ∂L d ∂L − =0 dτ ∂ x˙ ν ∂xν legen die Teilchenbahn fest. Sie liefern # " q d ν q dxμ ∂Aμ (x) d x˙ ν p + (x) − = 0. mc A dτ c dτ c dτ ∂xν x˙ μ x˙ μ
Jetzt kann man
p x˙ μ x˙ μ = c setzen. Mit der Kettenregel dxμ ∂Aν (x) d ν A (x) = dτ dτ ∂xμ
erhält man
q ν μ (∂ A − ∂ μ Aν )x˙ μ . c Die Bewegungsgleichung eines geladenen Teilchens im äußeren Feld lautet also m¨ xν =
m¨ xμ =
q μν F x˙ ν , c
(11.34)
wo F μν ≡ ∂ μ Aν − ∂ ν Aμ
der antisymmetrische Feldtensor ist. Diese Ergebnis ist konsistent mit der oben abgeleiteten Formel für die kovariante Mikowski-Kraft Gl. (11.17). Feldgleichungen: Wir müssen eine lorentzinvariante Lagrangefunktion aufstellen, die die Felder involviert. Dabei sind die Felder jetzt die dynamischen Variablen und xμ = (ct, x1 , x2 , x3 ) nur Parameter, die den Ort und die Zeit festlegen, wo das Feld gemessen wird. Das Integral über R die Zeit im Wirkungsintegral wird ersetzt durch ein Integral über die Raum-Zeit d4 x. Dieses Integrationsmaß ist lorentzinvariant. Um lineare Feldgleichungen zu erhalten, müssen die Felder quadratisch in der Wirkung auftreten. Der einfachste Ansatz ist Z 1 d4 xF μν Fμν (11.35) S=− 16π
148
Kapitel 11. Maxwell-Gleichungen
Setzt man aus Gl. (11.16) die explizite Form für F μν ein, dann ergibt sich die dreidimensionale Form Z Z 1 ~2 . ~2 − B dt d3 x E S= 8π
Daneben soll noch eine lorentzinvariante Wechselwirkung mit einem äußeren Strom jμ hinzugefügt werden. Der einfachste Ansatz für die Wirkung ist dann Z Z Z 1 1 d4 xF μν Fμν − 2 (11.36) d4 xjμ Aμ = d4 xL(Aμ , j ν ) S=− 16πc c mit der Lagrange-Funktion L=−
1 1 (∂ μ Aν − ∂ ν Aμ )(∂μ Aν − ∂ν Aμ ) − 2 jμ Aμ . 16πc c
(11.37)
Zur Ableitung der Maxwell-Gleichungen müssen wir die Felder variieren. Aus dem Hamiltonschen Prinzip δS = 0 folgen die Lagrangeschen Gleichungen in Analogie zur Dynamik eines Massenpunktes ∂μ
∂L ∂L − =0. ∂ ν Aμ ∂Aν
Für die Lagrange-Funktion Gl. (11.37) folgt −
1 1 ∂μ (∂ μ Aν − ∂ ν Aμ ) + j ν = 0 . 4π c
Dies ist gerade die inhomogene Maxwell-Gleichung für die Potentiale. In der LorenzEichung (∂μ Aμ = 0) lautet die Gleichung z.B. ∂ μ ∂ μ Aν =
4π ν j . c
Kapitel 12
Elektrostatik 12.1
Das elektrostatische Feld
Im statischen Limes vereinfachen sich die Maxwell-Gleichungen und Lösungen stark. Man sieht sofort, dass für das statische elektrische Feld gilt ~ ∙E ~ (~x) = 4πρ (~x) ∇
(12.1)
~ ×E ~ (~x) = 0 . ∇
(12.2) ~ ~ Da ∇ × E (~x) = 0 ist, folgt, dass das elektrische Feld sich aus einem skalaren Potential ableitet ~ (~x) = −∇φ ~ (~x) . E (12.3)
Setzt man dies in Gl. (12.1) ein, so erhält man die Poisson-Gleichung, ∇2 φ (~x) = −4πρ (~x)
(12.4)
In Gebieten wo es keine Ladungen gibt, erfüllt das Potential die Laplace-Gleichung, ∇2 φ (~x) = 0 .
Aus der Laplace-Gleichung folgt unmittelbar, dass die zweiten partiellen Ableitungen des Potentials nicht alle das gleiche Vorzeichen haben können, d.h. das Potential kann kein Maximum oder Minimum besitzen. Wir integrieren Gl. (12.1) über ein (einfach zusammenhängendes) Raumgebiet V Z Z ~ ∙E ~ (~x) = 4π d3 xρ (~x) . d3 x ∇ V
V
Wenn wir jetzt den Gaußschen Satz anwenden, erhalten wir das Gaußsche Gesetz I ~ (~x) da = Q, ~n ∙ E (12.5) S
150
Kapitel 12. Elektrostatik
wo Q die Ladung im Inneren des Volumen V ist Z Q = d3 xρ (~x) , V
S die Oberfläche des Volumens V und ~n ein nach außen gerichteter Einheitsvektor senkrecht zur Fläche S ist. Bemerkungen: a) Wenn ρ (~x) vorgegeben und ganz im Inneren von S lokalisiert ist, dann kann man ~ (~x) auf der linken Seite von Gl. (12.5) die Fläche beliebig wählen. Der Fluß ~n ∙ E durch eine beliebige Fläche ist derselbe wie der Fluss durch eine Kugelfläche, als ob wirklich etwas fließt. b) Die Ladungsdichte für eine Punktladung q, die am Punkt ~xa lokalisiert ist, lautet ρ(~x) = qδ 3 (~x − ~xa ) . Für ein System von n Punktladungen qi lauten das Gaußsche Gesetz I m X ~ (~x) da = 4π ~n ∙ E qi ,
(12.6)
i=1
S
wo m ≤ n die Zahl der Punkladungen innerhalb der Fläche S ist. c) Das Gaußsche Gesetz kann bei symmetrischen Ladungsverteilungen angewendet ~ (~x) auf Grund von Symmetrieüberlegunwerden, wenn man die Richtung von E ~ (~x) gegeben ist und Q berechnet werden soll. gen erraten kann oder, wenn E
12.2
Das Coulombsche Gesetz
Als einfache Anwendung des Gaußschen Gesetzes betrachten wir das elektrische Feld einer Punktlandung q im Ursprung. Aus Symmetriegründen muss das elektrische Feld an jedem Messpunkt (Aufpunkt) radial auswärts oder einwärts gerichtet sein und nur von r = |~x| abhängen. Wir betrachten in Gl. (12.5) einen Kugelfläche mit Radius r. Der Fluss durch diese Fläche ist 4πr 2 E. Damit ergibt sich für das Feld E=
q r2
oder
~ (~x) = q ~x . E |~x|3
Dies ist das Coulombsche Gesetz. Wenn sich die Ladung, statt im Ursprung, im Punkt ~x0 befindet, dann ist das Feld am Aufpunkt ~x gegeben durch 0 ~ (~x) = q ~x − ~x . E 0 |~x − ~x |3
(12.7)
Für ein System von n Punktladungen qi lautet das Coulombsche Gesetz: ~ (~x) = E
n X i=1
qi
~x − ~xi |~x − ~xi |3
(12.8)
12.2 Das Coulombsche Gesetz
151
Kraft zwischen zwei Punktladungen: Die Kraft auf eine Punktladung qim äußeren Feld war allgemein gegeben durch die ~ v ~ ~ ~ Lorentz-Kraft F = q E + c × B . Im statischen Fall, wo die Ladungen sich nicht bewegen, ist also ~ F~ = q E. Mit Gl. (12.7) erhält man dann die Kraft zwischen zwei Punktladungen q1 bei ~x1 und q2 bei ~x2 . Die Kraft auf Ladung 1 durch Ladung 2 ist ~x1 − ~x2 1 ~1 = −q1 q2 ∇ . F~1 = q1 q2 3 |~x1 − ~x2 | |~x1 − ~x2 | Analog ist die Kraft auf Ladung 2 durch Ladung 1 ~x2 − ~x1 1 ~2 = −q1 q2 ∇ F~2 = q1 q2 |~x1 − ~x2 |3 |~x1 − ~x2 |
(= −F~1 ) .
D.h. die Kraft ist der Gradient eines Skalars, der potentiellen Energie U (~x1 − ~x2 ) = q1 q2
1 . |~x1 − ~x2 |
Die potentielle Energie U ist nur bis auf eine Konstante bestimmt. Superpositionsprinzip: Betrachte ein System von N Punktladungen. Die Kraft auf die Ladung 1 durch die restlichen N − 1 Ladungen ist die Superposition der einzelnen Kräfte F~1 = q1
N X i=2
qi
~x1 − ~xi ~ 1 U (~x1 , (~x2 , ...~xN )) , = −∇ |~x1 − ~xi |3
wo U (~x1 , (~x2 , ...~xN )) = q1
N X i=2
qi
1 |~x1 − ~xi |
mit festen (~x2 , ...~xN ). Wir können zu dieser potententiellen Energie noch eine Konstante addieren, d.h. eine Größe, die unabhängig von ~x1 ist. Aus gleich ersichtlichen Gründen addieren wir N qi qj 1 X . 2 i,j=2 |~xi − ~xj | i6=j
Damit wird die potentielle Energie N 1 X qi q j U (~x1 , (~x2 , ...~xN )) = . 2 i,j=1 |~xi − ~xj | i6=j
(12.9)
152
Kapitel 12. Elektrostatik
Es ist klar, dass wir dasselbe Ergebnis für die potentielle Energie erhalten hätten, wenn wir mit einem Teilchen k (statt 1) gearbeitet hätten. D.h. aus U (~x1 , ~x2 , ...~xN ) bestimmt sich die Kraft auf eine beliebige der N Punktladungen zu N X 1 ~k ~ k U (~x1 , ~x2 , ...~xN ) = − 1 F~k = −∇ qi qj ∇ 2 i,j=1 |~xi − ~xj | i6=j
= qk
N X j=1 j6=k
qj
~xk − ~xj . |~xk − ~xj |3
Die potentielle Energie U (~x1 , ~x2 , ...~xN ) =
N 1 X q i qj 2 i,j=1 |~xi − ~xj |
(12.10)
i6=j
stellt die Arbeit dar, die notwendig war, um die gegebene Ladungskonfiguration aufzubauen, d.h. um die Ladungen aus ∞ auf ihren Platz zu bringen. Dies sieht man daran, dass U = 0 ist, wenn sich alle Ladungen im unendlichen Abstand voneinander befinden. Energiesatz: Die Bewegungsgleichung für die k-te Ladung lautet mk
d~vk ~ k U (~x1 , ~x2 , ...~xN ), = F~k = −∇ dt
wo ~vk die Geschwindigkeit der Ladung k ist. Wir multiplizieren mit ~vk und summieren über k, X X d 1 2 ~ k U ) d~x = − d U (~x1 , ~x2 , ...~xN ) . (∇ m~vk = − dt 2 dt dt k
Da T =
P1 k
vk2 2 m~
k
die kinetische Energie des Systems ist, folgt, dass die Gesamtenergie
T + U erhalten ist, d (T + U ) = 0 . dt
Wir schließen wieder, dass U (~x1 , ~x2 , ...~xN ) die potentielle Energie des Systems ist. Für eine stetige Ladungsverteilung lautet das Coulombsche Gesetz Z 0 ~ x) = d3 x0 ρ(~x0 ) ~x − ~x . E(~ 0 |~x − ~x |3 Probe: für Punktladungen bei ~xi gilt ρ(~x) =
X i
qi δ 3 (~x − ~xi )
(12.11)
12.2 Das Coulombsche Gesetz und ~ x) = E(~
X i
qi
Z
153
d3 x0 δ 3 (~x0 − ~xi )
X ~x − ~x0 ~x − ~xi = qi , 0 3 |~x − ~x | |~ x − ~xi |3 i
~ × E(~ ~ x) = 0 ist. Das wie Gl. (12.8). Mit Hilfe von (12.11) verifiziert man direkt, dass ∇ elektrische Feld ist endlich überall dort, wo ρ(~x) endlich ist, d.h. obige Formel (12.11) gilt auch im Inneren einer stetigen Ladungsverteilung. Die Formel kann verwendet werden, wenn ρ(~x) im ganzen Raum gegeben ist und das elektrische Feld berechnet werden soll. Gleichung (12.11) lässt sich für das Potential schreiben Z 1 . Φ(~x) = d3 x0 ρ(~x0 ) |~x − ~x0 | Die Verallgemeinerung der Formel (12.10) für die potentielle Energie lautet Z Z 1 ρ(~x)ρ(~x0 ) d3 xd3 x0 . W = 2 |~x − ~x0 |
(12.12)
(12.13)
Hier erscheint W als Energie, die in den Ladungen bzw. in der Ladungsverteilung steckt. Man kann W auch als Energie interpretieren, die im elektrischen Feld steckt. Dazu setzen wir Gl. (12.12) in Gl. (12.13) ein Z 1 d3 xρ(~x)Φ(~x) W = 2 Z 1 =− d3 x(∇2 Φ(~x))Φ(~x) 8π Z 1 ~ x) ∙ ∇Φ(~ ~ x) , d3 x∇Φ(~ = 8π oder W =
1 8π
Z
~ x)|2 . d3 x|E(~
(12.14)
Dieses Ergebnis stimmt mit dem elektrischen Anteil der Feldenergie der relativistischen Formel aus dem letzten Kapitel überein. Man nennt w(x) =
1 ~ |E(~x)|2 8π
die Energiedichte. Anmerkung zur partiellen Integration: Sei f (~x) = g(~x) = 0 auf dem Rand eines Volumens V . Dann ist Z Z ~ (~x))g(~x) = − d3 xf (~x)(∇g(~ ~ x)) , d3 x(∇f V
da nach dem Gaußschen Satz
V
R
V
~ (~x)g(~x)) = 0. d3 x∇(f
154
Kapitel 12. Elektrostatik
Anwendung: Mit Hilfe von W kann man die Kraft zwischen geladenen Körpern erhalten, wenn man die Änderung unter kleinen virtuellen Verrückungen betrachtet, z.B. Fx = −
12.3
ΔW . Δx
Die Green-Funktion
Eine Green-Funktion ist die Lösung einer linearen inhomogenen Differentialgleichung für eine δ-funktionsartige Inhomogenität. In unserem Fall ist dies die Lösung der Poisson-Gleichung (12.4) für eine Punktquelle mit Ladung q = 1, ∇2x G (~x, ~x0 ) = −4πδ 3 (~x − ~x0 ) , wobei mögliche Randbedingungen, außer der, dass im Unendlichen die Felder verschwinden sollen, außer Acht gelassen werden. Der Aufpunkt sei ~x und die Position der Ladung ~x0 . Die Green-Funktion ist nicht eindeutig, da man zu ihr noch eine Lösung der homogenen Differentialgleichung addieren kann. Wir kennen eine Green-Funktion der Poisson-Gleichung schon, es ist das Coulomb-Potential G (~x, ~x0 ) =
1 . |~x − ~x0 |
(12.15)
Kennt man die Green-Funktion, so erhält man die Lösung für eine beliebige Ladungsverteilung durch lineare Superposition Z (12.16) φ (~x) = d3 x0 G (~x, ~x0 ) ρ (~x0 ) . Beweis: ∇2x φ (~x) = =
Z
Z
d3 x0 ∇2x G (~x, ~x0 ) ρ (~x0 ) d3 x0 (−4πδ 3 (~x − ~x0 ))ρ (~x0 ) = −4πρ (~x) .
Diese Lösung (12.16) ist nur nützlich, wenn die Ladungsverteilung ρ (~x) explizit vorgegeben ist. In vielen Fällen ist aber die Ladungsverteilung nicht überall bekannt, z.B. an der Grenzfläche eines metallischen Leiters, wo das Potential konstant sein muss. Man kann mit Hilfe der Green-Funktion auch solche Randwertprobleme lösen. Dabei macht man sich die oben erwähnte Mehrdeutigkeit zunutze und addiert Lösungen der homogenen Gleichung um die Randbedingungen zu erfüllen.
12.4 Multipolentwicklung in der Elektrostatik
12.4
155
Multipolentwicklung in der Elektrostatik
Elektrischer Dipol: Zwei Punktladungen −q und +q befinden sich auf einer Linie mit dem Nullpunkt an den Positionen −~a/2 und +~a/2. Wir lassen |~a| → 0 und q → ∞, so dass q~a = p~ endlich bleibt. Der Vektor p~ heißt Dipolmoment. Dann wird das Potential 1 1 − φ (~x) = a→0 lim q |~x − ~a/2| |~x + ~a/2| q→∞ 1 1 = a→0 lim q 1 − 1 (r2 − ~x ∙ ~a + a2 /4) 2 (r2 + ~x ∙ ~a + a2 /4) 2 q→∞ = a→0 lim q q→∞
~x ∙ ~a r3
(mit r = |~x|)
Oder
p~ ∙ ~x für einen Dipol am Ursprung. r3 Die Ladungsdichte eines Dipols am Ursprung ist φ (~x) =
~ 3 (~x) , p ∙ ∇δ ρdip (~x) = −~ denn Z
Z 1 1 0 d3 x 0 ) φ (~ x ) = −p ρ (~ x ∇0 δ 3 (~x0 ) d3 x0 i 0 |~x − ~x | |~x − ~x0 | i Z 1 3 0 0 = pi d x ∇ i δ 3 (~x0 ) |~x − ~x0 | ! Z 0 ) p~ ∙ ~x −(x − x i = pi d 3 x0 δ 3 (~x0 ) = 3 . 3 0 r |~x − ~x |
φ (~x) =
Dann gilt in Analogie zu q =
da −pi
Z
R
d3 xρ (~x): Z p~ = d3 x ~xρdip (~x) ,
d x xk ∇i δ (~x) = pi 3
3
Z
d3 x (∇i xk )δ 3 (~x) = pk . | {z } =δik
Das elektrische Feld eines Dipols: Wir betrachten das elektrische Feld eines Dipols im Ursprung: ~ dip (x) = −∇Φ(~ ~ x) = − ∇ ~ p~ ∙ ~x E r3 Eidip = −pk ∇i
pi xk 3xi = − 3 + pk x x 5 . 3 r r r
156
Kapitel 12. Elektrostatik
D.h.
~ dip (x) = 1 3 p~ ∙ ~x ~x − p~ E r3 r3
(r 6= 0) .
Im Folgenden wollen wir eine Ladungsverteilung betrachten, die in einem Gebiet lokalisiert ist, das definiert ist durch ρ (~x) = 0 für r = |~x| > a . Wenn keine Randbedingungen vorgegeben sind, berechnet sich das Potential aus Z 1 φ (~x) = d3 x0 ρ (~x0 ) . |~x − ~x0 | Für einen Beobachtungspunkt ~x, der außerhalb der Ladunsverteilung gelegen ist (|~x| > |~x0 | > a), kann man entwickeln 1 1 1 ∂ 1 ∂ ∂ 1 = − x0i + x0 x0 + .... |~x − ~x0 | |~x| ∂xi |~x| 2! i k ∂xi ∂xk |~x|
(12.17)
Anmerkung: Die gewöhnliche Taylor-Entwicklung f (x + a) = f (x) + a
df (x) 1 d2 f (x) + .... + dx 2! dx2
lautet in 3 Dimensionen f (~x + ~a) = f (~x) + ai
∂ ∂ ∂ 1 f (~x) + ai ak f (~x) + .... ∂xi 2! ∂xi ∂xk
Eine kompakte Schreibweise für die Taylor-Entwicklung ist: d
f (x + a) = ea dx f (x) =
∞ X an dn f (x) . n! dxn n=0
d
D.h. ea dx ist der Translationsoperator. Analog gilt für Vektoren ~
f (~x + ~a) = e~a∙∇ f (~x) . ~ der Impulsoperator und exp[−i~a ∙ P~ /~] der In der Quantenmechanik ist P~ = −i~∇ Translationsoperator. Wir benötigen in Gl. (12.17) ∂ 1 1 1 xi ∂ 1 = − 3 2xi = − 3 = ∂xi |~x| ∂xi (xl xl ) 12 2r r ∂ ∂ 1 3xi xk δik ∂ xi − 3 =− 3 + . = ∂xi ∂xk |~x| ∂xk r r r5
12.4 Multipolentwicklung in der Elektrostatik
157
Damit erhalten wir für |~x| |~x0 | die Entwicklung für das elektrostatische Potential: Z Z xi 1 d3 x0 ρ (~x0 ) + 3 φ (~x) = d3 x0 x0i ρ (~x0 ) r r Z 1 3xi xk − r2 δik + d3 x0 x0i x0k ρ (~x0 ) + .... . 2 r5 Da
Sp(3xi xk − r2 δik ) = (3xi xk − r2 δik )δik = 0 ,
können wir auch schreiben Z Z xi 1 d3 x0 ρ (~x0 ) + 3 φ (~x) = d3 x0 x0i ρ (~x0 ) r r Z 1 xi xk + d3 x0 (3x0i x0k − r02 δik )ρ (~x0 ) + .... . 2 r5 Die ersten beiden Terme involvieren die Ladung und das Dipolmoment. Der dritte Term enthält den Quadrupoltensor Qij , der definiert ist durch Z d3 x0 (3x0i x0k − r02 δik )ρ (~x0 ) = Qij . Damit lautet die Multipolentwicklung des elektrostatischen Potentials: φ (~x) =
p~ ∙ ~x 1 xi xk q Qij + .... + 3 + r r 2 r5
Ist eine lokalisierte Ladungsverteilung vorgegeben und ist man an dem Feld außerhalb der Ladungsverteilung interessiert, dann verwendet man vorteilhaft die schnell konvergierende Multipolentwicklung.
Kapitel 13
Der Energie-Impuls-Tensor 13.1
Der Energie-Impuls-Tensor des elektromagnetischen Feldes
Zur Vereinfachung der Notation setzen wir in diesem Kapitel c = 1, d.h. wir messen alle Geschwindigkeiten in Einheiten der Lichtgeschwindigkeit. Der elektromagnetische Feldtensor war definiert durch 0 −Ex −Ey −Ez Ex 0 −Bz By . F μν ≡ E y Bz 0 −Bx Ez −By Bx 0
Wir wissen aus Kapitel 11, dass der Zusammenhang zwischen Feldenergiedichte 1 ~2 ~ 2 (x) w (x) = E (x) + B 8π und Energiefluss durch das Poyntingsche Theorem ∂ ~ −∇ ~ ∙S ~ w = −~j ∙ E ∂t ~ der Poynting-Vektor ist, gegeben ist, wo S ~ ×B ~ . ~= 1 E S 4π
~ repräsentiert die Energie, die vom Feld an die Ladungs- und StromverDer Term −~j ∙ E teilung abgegeben wird. Die Formeln lassen sich mit Hilfe des Energie-Impuls-Tensors kovariant zusammenfassen. Wir definieren den Energie-Impuls-Tensor des elektromagnetischen Feldes durch 1 1 F μα Fα ν + g μν F αβ Fαβ , (13.1) Tfμν = 4π 4
160
Kapitel 13. Der Energie-Impuls-Tensor
wo der Index f für „Feld“ steht. Der Energie-Impuls-Tensor ist symmetrisch und seine Spur verschwindet, 1 1 Sp Tf = Tfμ μ = F μα Fαμ + g μ μ F αβ Fαβ = 0 , 4π 4 da Fαμ = −Fμα und g μ μ = 4. Setzt man für F αβ explizit die elektrischen und magnetischen Felder ein, so erhält man für die einzelnen Elemente 1 ~ 2 ~ 2 Tf00 = E + B = w Energiedichte des Feldes 8π 1 ~ ~ i Poynting-Vektor (Energiefluss) ~ i = (S) Tf0i = ( E × B) 4π −1 1 ~2 + B ~ 2) . Tfij = Ei Ej + Bi Bj − δij (E 4π 2 Beweis z.B. für die erste Zeile zweite Spalte von Tfμν : 1 0k 1 1 F 0 α F α 1 + g 01 F αβ Fαβ = F Fk 1 Tf01 = 4π 4 4π 1 = E1 F 11 + E2 F 21 + E3 F 31 4π 1 1 ~ ~ 1. = [E2 B3 + E3 (−B2 )] = ( E × B) 4π 4π
Man bezeichnet Tfij als den Maxwellschen Spannungstensor, der die Kraft pro Flächeneinheit auf die Oberfläche einer Ladungs- und Stromverteilung angibt (siehe unten), −Tfij nj ist der pro Flächeneinheit abströmende Impulsfluss. Beispiel: Wir betrachten eine ebene elektromagnetische Welle, die sich in x-Richtung ausbreitet und normal auf eine ideal absorbierende Fläche auffällt. Sei ~ ~k = k~e1 , ~n = k , E ~ = B~e3 , E 2 = B 2 ~ = E~e2 , B k Dann ist −T ij nj = −T ij (~e1 )j = Ti1 =
−1 1 Ei E1 + Bi B1 − δi1 (E 2 + B 2 ) 4π 2
1 (da E1 = B1 = 0). δi1 (E 2 + B 2 ) 8π 1 2 ~ = |B| ~ = E (~e1 )i (da |E| 4π = Energiedichte × Einheitsvektor in Ausbreitungsrichtung.
=
Integrieren wir über eine Flächeneinheit und mitteln wir über t, so erhalten wir die mittlere Kraft pro Flächeneinheit, den Strahlungsdruck, 1 2 D ~ E E = S . Strahlungsdruck = 4π
13.2 Stromdichte von bewegten Punktladungen
161
Der Strahlungsdruck manifestiert sich z.B. dadurch, dass der Schweif eines Kometen von der Sonne weg abgelenkt wird. Erhaltungsgrößen: Theorem: Sei j μ ein erhaltener Vektor ∂μ j μ = 0. Dann ist die Ladung Z Q = d3 xj 0 (x)
erhalten und eine Lorentz-Invariante. Beweis:
Z
Z
Z
d Q, dt wo wir den Gaußschen Satz verwendet und angenommen haben, dass der Strom nur in einem endlichen Gebiet ungleich Null ist. R Das Theorem gilt auch für einen erhaltenen Tensor T μν mit ∂μ T μν = 0. Dann ist d3 xT 0ν ein 4-Vektor und zeitlich konstant. Wir wollen wissen, unter welchen Bedingungen der Energie-Impuls-Tensor erhalten ist. Dazu berechnen wir 1 1 μν αβ μν νσ μα (13.2) ∂μ g F Fασ + g F Fαβ ∂ μ Tf = 4π 4 1 νσ = g (∂μ F μα )Fασ + Y ν 4π 0=
d x∂μ j = 3
μ
~ ∙ ~j) = ∂0 d x(∂0 j − ∇ 3
0
d3 xj 0 =
1 mit Y ν = 4π (g νσ F μα ∂μ Fασ + 12 g μν F αβ ∂μ Fαβ ). Durch Umbenennen der Summationsindizes im ersten Term (σ → μ, μ → β) erhalten wir 1 μν αβ 1 −∂β Fαμ + ∂μ Fαβ g F Yν = 4π 2 1 μν αβ 1 = −∂β Fαμ − ∂α Fμβ − ∂μ Fβα g F 4π 2 = 0 (homogene Maxwell-Gleichung)
Mit der inhomogenen Maxwell-Gleichung ∂μ F μα = −4πj μ und Gl. (13.2)erhält man ∂μ Tfμν = −g να Fασ j σ = −F νσ jσ .
(13.3)
In Gebieten, wo die Quellen verschwinden, ist der Energie-Impuls-Tensor also erhalten. Das elektromagnetische Feld besitzt die Erhaltungsgrößen Energie und Impuls wie ein Materieteilchen, hat aber keine Masse.
13.2
Stromdichte von bewegten Punktladungen
Neben dem Energie-Impuls-Tensor des Feldes muss man noch den der Quellen betrachten. Die 4-Stromdichte für eine Punktladung, die sich auf einer Bahn ~z(t) bewegt, ist
162
Kapitel 13. Der Energie-Impuls-Tensor
gegeben durch d j μ (x) = ρ (x) , ~j (x) = qδ 3 (~x − ~z(t)) (1, ~z(t)) dt 1 μ 3 = qδ (~x − ~z (τ0 )) z˙ (τ0 ) (dt = γdτ ), γ
(13.4) (13.5)
μ
wo dτ = dt/γ das Eigenzeitintervall, z˙ μ ≡ dz dτ die 4-Geschwindigkeit der Punktladung q d und 1/γ = 1 − dt ~z(t) ist. Die Bahn z μ (τ ) ist dabei als bekannt vorausgesetzt und τ0
ist die Lösung der Gleichung x0 = z 0 (τ0 ). Wir wollen uns überzeugen, dass j μ (x) in Gl. (13.5) wirklich einem Strom entspricht. Die Ladung ist z.B. Z 1 Q = d3 xj 0 (x) = qδ 3 (~x − ~z (τ0 )) z˙ 0 (τ0 ) = q. γ
Für eine Verteilung von N nicht-wechselwirkenden Punktladungen (d.h. Punktladungen die relativ weit voneinander entfernt sind, und auf die äußeren Kräfte wirken) mit μ (τ ) ist der 4-Strom die Summe der einzelnen Beiträge, gegebenen Bahnen z(n) j μ (x) =
N X
1 μ 0 qn δ 3 (~x − ~z(n) (t)) z˙(n) (τ(n) ), γ n=1
(13.6)
μ 0 0 0 wo τ(n) sich für jedes x0 und gegebener Bahn z(n) (τ ) bestimmt aus x0 = z(n) (τ(n) ). Wir untersuchen im Folgenden nur ein einzelnes Teilchen, die Summe kann, wenn nötig, einfach dazugenommen werden.
In manifest kovarianter Notation lautet der Strom j (x) = q μ
Z∞
−∞
dτ δ 4 (x − z (τ )) z˙ μ (τ ) .
(13.7)
Dies ist ein Linienintegral entlang der Weltlinie der Punktladung. Beweis der Gl. (13.7): j (x) = j μ
μ
=q
x , ~x = q
Z∞
−∞
0
Z∞
−∞
dτ δ 4 (x − z (τ )) z˙ μ (τ )
dx0 δ (x0 − z0 (τ )) δ 3 (~x − ~z (τ )) z˙ μ (τ ) γ
1 = qδ 3 (~x − ~z (τ0 )) z˙ μ (τ0 ) , γ wo sich τ0 für jedes x0 und gegebener Bahn z μ (τ ) aus der Nullstelle des Arguments der Deltafunktion δ (x0 − z0 (τ )) bestimmt, d.h. aus der Gleichung x0 = z 0 (τ0 ).
13.3 Energie-Impuls-Tensor eines geladenen Teilchens
13.3
163
Energie-Impuls-Tensor eines geladenen Teilchens
Der Energie-Impuls-Tensor eines Teilchens auf der vorgegebenen Bahn z μ (τ ) ist definiert durch 1 (13.8) Tpμν (x) ≡ mz˙ μ (τ ) z˙ ν (τ ) δ 3 (~x − ~z(τ0 )) , γ wo der Index p für Partikel steht und τ0 wieder die Lösung der Gleichung x0 = z 0 (τ0 ) ist. Die Komponenten von Tpαβ bedeuten im Einzelnen: a) Tp00 (x) ist die Energiedichte des Teilchens (Ruhenergie m plus relativistische kinetische Energie) dz 0 Tp00 (x) = mγδ 3 (~x − ~z(τ0 )) ( = γ). dτ Die Energie des Teilchens ist E=
Z
d3 xTp00 (x) = mγ .
b) Tp0i (x) ist die relativistische Impulsdichte Tp0i (x) = pi (x) = m
dz i 3 δ (~x − ~z(τ0 )) . dτ
Der relativistische 3-Impuls des Teilchen ist pi =
Z
d3 xTp0i (x) = m
dz i . dτ
Auf die Bedeutung der Raumkomponenten Tpij gehen wir später ein. In manifest kovarianter Notation lautet der Energie-Impuls-Tensor Z Tpμν (x) = m dτ z˙ μ (τ ) z˙ ν (τ ) δ 4 (x − z(τ )) . Der Beweis erfolgt auf gleiche Weise, wie der für Gl. (13.7). Für eine Summe von N nichtwechselwirkenden Teilchen wird Tpμν (x)
=m
N Z X i=1
μ ν (τ ) z˙(i) (τ ) δ 4 (x − z(i) (τ )) . dτ z˙(i)
Die 4-Divergenz des Energie-Impuls-Tensors: Zur Abkürzung definieren wir 1 dxα . μ ≡ m δ 3 (~x − ~z(τ )) und uα ≡ γ dτ
(13.9)
164
Kapitel 13. Der Energie-Impuls-Tensor
Dann ergibt sich für die Divergenz von Tpαβ ∂α Tpαβ = ∂α μuα uβ
= uβ ∂α [μuα ] + μuα ∂α uβ .
Da die Teilchen nicht wechselwirken, gilt die Erhaltung der Massen und der erste Term α dxα 3 x − ~x(t)) den Massenstrom verschwindet. Dies ist der Fall, da μuα = μ dx dτ = m dt δ (~ μ dx μ 3 bildet (in Analogie zum Ladungsstrom j = q dt δ (~x − ~x(t))). Wie die Erhaltung der Ladung der elektromagnetischen Stromerhaltung ∂μ j μ = 0 entspricht, so bedeutet die Erhaltung der Masse das Verschwinden der 4-Divergenz des Massenstromes. Wir erhalten also dxα ∂uβ dx0 ∂uβ duβ = μ = μ dτ ∂xα dτ ∂x0 dτ β μ du , = m m dτ
∂α Tpαβ = μ
(13.10) (13.11)
da u nur von t bzw. τ abhängt und nicht von ~x. Einsetzen für μ ergibt ∂α Tpαβ =
1 3 duβ δ (~x − ~z(t))m . γ dτ
Wir verwenden jetzt die Bewegungsgleichung für Ladungen im Feld m ∂α Tpαβ = Oder, mit Gleichung (13.5)
duβ = qF βσ uσ dτ
(13.12)
1 3 δ (~x − ~z(t))qF βσ uσ . γ
∂α Tpαβ = F βσ jσ .
(13.13)
Punkt-Teilchen im elektromagnetischen Feld: Man beachte, dass der Energie-Impuls-Tensor Gl. (13.9) ein System von nichtwechselwirkenden Punktteilchen darstellt. Wenn die Teilchen z.B. mit dem elektromagnetischen Feld wechselwirken, dann können Energie und Impuls zwischen Teilchen und Feld ausgetauscht werden, Der Energie-Impuls-Tensor ist nur erhalten, wenn der Beitrag der Felder mitgenommen wird. Wir beschränken uns auf ein System, das aus einem elektromagnetischen Feld und einzelnen geladenen Teilchen, deren Wechselwirkung untereinander vernachlässigt werden kann, besteht. Der Energie-Impuls-Tensor für ein Teilchen im elektromagnetischen Feld ist einfach die Summe der beiden Tensoren. T αβ = (Tfαβ + Tpαβ ). Da nach Gl. (13.3) ∂α Tfαν = −F να jα und nach Gl. (13.13) ∂α Tpαν = F να jα ist, haben wir gezeigt, dass ∂α (Tfαβ + Tpαβ ) = 0 .
13.4 Drehimpulserhaltung
165
Diese Gleichung bedeutet, dass die Summe der Energien und Impulse von Feld und Teilchen erhalten bleiben. Aus dem Tensor T μν können wir den global erhaltenen 4Vektor Z P ν = d3 xT ν0 (x) mit ∂ν P ν = 0 bilden.
Die Raumkomponente von ∂α T αβ ist ∂α T αi = 0 = ∂0 T 0i + ∂j T ji . Wir integrieren über ein (endliches) Volumen V Z Z d d3 xT 0i (x) + d3 x∇j T ji . 0= dt V
V
Dann erhalten wir mit dem Gaußschen Satz Z I d 3 0i d xT (x) = − d3 xT ji daj . dt V
∂V
Die linke Seite dieser Gleichung ist die zeitliche Änderung des Impulses im Gebiet V H und die rechte Seite − d3 xT ji daj ist daher die Impulsmenge, die pro Zeiteinheit das ∂V
Volumen V verlässt. T ji ist also der Impulsstromdichte-Tensor, d.h. der Impuls pro Zeiteinheit und Flächeneinheit, der die Fläche ⊥ zu ~ek verlässt.
13.4
Drehimpulserhaltung
Da der Energie-Impuls-Tensor der Maxwellschen Felder und der Teilchen symmetrisch ist, können wir eine weitere Erhaltungsgröße angeben. Dazu definieren wir den Tensor 3. Ranges M μνλ = (xν T μλ − xλ T μν ). Dieser ist erhalten bezüglich des Index μ,
∂μ M μνλ = 0 , da
∂μ M μνλ = (δμν T μλ − δμλ T μν ) = (T νλ − T λν ) = 0 .
Beachte, dass die Symmetrie wesentlich ist. Diese Forderung ist für andere Feldtheorien als die Elektrodynamik nicht unbedingt trival. Es gibt 6 globale Erhaltungsgrößen Z Z μν 3 0μν L = d xM = d3 x(xμ T 0ν − xν T 0μ ). Die Raumkomponenten Ljk definieren den Drehimpuls Z 1 ijk jk 1 ijk i L = ε L = ε d3 x(xj T 0k − xk T 0j ) . 2 2
166
Kapitel 13. Der Energie-Impuls-Tensor i
3 Für den mechanischen Drehimpuls eines Teilchen mit Tp0i = pi = m dx x −~z(t)) fällt dτ δ (~ das Integral wegen der δ-Funktion weg und es wird:
Li =
1 ijk j k ε (x p − xk pj ) . 2
Die Komponenten L0i sind L0i =
Z
d3 x(x0 T 0i − xi T 00 )
= P i x0 − P 0 xiCE , wo P0 =
Z
d3 xT 00
Pi =
Z
d3 xT 0i
die erhaltene Gesamtenergie,
der erhaltene Gesamtimpuls, und xiCE
R 3 00 i d xT x = R 3 00 d xT
das Energiezentrum ist. Für ein relativistisches System gilt also 0=
dxiCE dL0i = Pi − P0 0 dx dx0
oder
Pi dxiCE = = konst. dx0 P0 Das Zentrum der Energie bewegt sich also mit konstanter Geschwindigkeit. Keines der anderen Theoreme der klassischen Mechanik über die Bewegung des Schwerpunkts gilt in der relativistischen Mechanik.
13.5
Noether-Theorem für Felder
Die Existenz des Energie-Impuls-Tensors hängt über das Noether-Theorem mit der Invarianz der Lagrangefunktion unter Translationen zusammen. Wir wollen das NoetherTheorem für Felder der Einfachheit halber am Beispiel eines skalaren Feldes Φ(x) studieren. Eine Lagrangefunktion L = L(Φ(x), ∂μ Φ(x)) geht unter einer infinitesimalen Transformation Φ(x) → Φ0 (x) = Φ(x) + δΦ(x)
13.5 Noether-Theorem für Felder über in
167
L → L + δL
mit
∂L ∂L δΦ + δ(∂μ Φ) ∂Φ ∂(∂μ Φ) ∂L ∂L ∂L δΦ + ∂μ + ∂μ δΦ = ∂Φ ∂(∂μ Φ) ∂(∂μ Φ) ∂L δΦ , = ∂μ ∂(∂μ Φ)
δL =
wo wir im letzten Schritt die Lagrangesche Bewegungsgleichung ∂L ∂L =0 + ∂μ ∂Φ ∂(∂μ Φ) eingesetzt haben. Ist δL = 0, dann ist der „Strom“ Jμ = erhalten, d.h. ∂μ J = ∂μ μ
∂L δΦ ∂(∂μ Φ) ∂L δΦ ∂(∂μ Φ)
(13.14)
= 0.
Noether-Theorem: Zu jeder Invarianz der Lagrange-Funktion gehört ein Erhaltungssatz. Manchmal ist die Lagrange-Funktion nicht invariant, sondern ändert sich um eine 4Divergenz ∂L δL = ∂μ δΦ + ∂μ F μ , ∂(∂μ Φ) R die keine Auswirkung auf die Wirkung d4 xL und damit auf die Bewegungsgleichungen ˆ = L − ∂μ F μ , dann ist L ˆ manifest invariant und das hat. Man modifiziert L → L ˆ Theorem kann auf L angewendet werden. Wir betrachten speziell die Translationen xμ → x0μ = xμ + aμ . Dann geht Φ(x) → Φ(x0 ) = Φ(x + a) = Φ(x) + aν ∂ν Φ(x)
→ δΦ = aν ∂ν Φ(x).
Dies ist eine Situation, wo die Lagrange-Funktion nicht manifest invariant ist, sondern übergeht in L → L0 = L + aμ ∂ μ L .
ˆ = L − aμ ∂μ L Dann ergibt das Noether-Theorem für L ∂L ˆ = −aμ ∂μ L + ∂μ δL aν ∂ν Φ(x) = 0 ∂(∂μ Φ)
168
Kapitel 13. Der Energie-Impuls-Tensor
Dieses Ergebis kann man schreiben als ∂ μ Tμν = 0
(13.15)
mit dem Energie-Impuls-Tensor Tμν = −gμν L +
∂L ∂ν Φ(x) . ∂(∂μ Φ)
(13.16)
Aus (13.15) folgt, durch räumliche Integration R R R 0 = d3 x∂ μ Tμν = d3 x ∂ 0 T0ν + ∂ i T0i = d3 x∂ 0 T0ν , wenn T0i in ∞ genügend schnell verschwindet.
Da Translationen in der Zeit die Energie und Translationen in den Ortskoordinaten den Impuls erzeugen, identifizieren wir R Pν = d3 xT0ν = −g0ν L +
∂L ∂ν Φ(x) ∂(∂0 Φ)
(13.17)
mit dem erhaltenen 4-Impuls des Feldes. Ganz analog, aber mit etwas mehr Aufwand, bestimmt man den Energie-Impuls-Tensor des elektromagnetischen Feldes in Übereinstimmung mit Gl. (13.1).
Kapitel 14
Elektromagnetische Strahlung 14.1
Green-Funktionen, Retardierte Potentiale
Die elektromagnetischen Potentiale erfüllen in der Lorenz-Eichung die inhomogene Wellengleichung 1 ∂2 4π 2 (14.1) ∇ − 2 2 Aμ (~x, t) = − j μ (~x, t) c ∂t c ~ mit Aμ = (φ, A), j μ ≡ (cρ, ~j). Die Potentiale hängen mit den elektrischen und ma~ =∇ ~ ×A ~ zusammen. Wenn Randbedin~ = −∇φ ~ − 1 ∂ A~ , B gnetischen Feldern über E c ∂t gungen im Unendlichen vorgegeben sind, kann die Lösung der inhomogenen Gleichung mit Hilfe der Green-Funktion erfolgen. Die Green-Funktion ist definiert als Lösung der Differentialgleichung für eine Punktquelle, 1 ∂2 4π 2 ∇x − 2 2 G (~x, t; ~x0 , t0 ) = − δ 3 (~x − ~x0 ) δ (t − t0 ) . c ∂t c Wegen der Linearität der Wellengleichung kann die eigentliche Lösung der Wellengleichung als Superposition von Lösungen für Punktquellen geschrieben werden, Z Aμ (~x, t) = d3 x0 dt0 G (~x, t; ~x0 , t0 ) j μ (~x0 , t0 ) . Beweis durch Einsetzen in die Wellengleichung: Z 1 ∂2 1 ∂2 2 μ 3 0 0 2 ∇ − 2 2 A (~x, t) = d x dt ∇ − 2 2 G (~x, t; ~x0 , t0 ) j μ (~x0 , t0 ) c ∂t c ∂t Z 4π = d3 x0 dt0 [− δ 3 (~x − ~x0 ) δ (t − t0 )] j μ (~x0 , t0 ) c 4π μ = − j (~x, t) c
170
Kapitel 14. Elektromagnetische Strahlung
Aus der Invarianz bezüglich Translationen in x und t folgt G (~x, t; ~x0 , t0 ) = G (~x − ~x0 , t − t0 ) . D.h. wir brauchen nur die Green-Funktion G (~x, t) ≡ G (~x, t; ~x0 = 0, t0 = 0) für eine Quelle im Ursprung zu betrachten. Berechnung der Green-Funktion: In den hier verwendeten kartesischen Koordinaten zerfällt die Wellengleichung in vier entkoppelte Differentialgleichungen für Aμ (~x, t). Wir betrachten die Gleichung 1 ∂2 2 ∇ − 2 2 ψ (~x, t) = −4πf (~x, t) , c ∂t wo ψ (~x, t) eine der 4 Komponenten cAμ (~x, t) ist. Eine Fouriertransformation in der Zeitvariablen ergibt Z ψ (~x, t) = dω ψ˜ (~x, ω) e−iωt (14.2) Z 1 (14.3) dω f˜ (~x, ω) eiωt . f (~x, t) = 2π Damit geht die Wellengleichung über in ∇2 + k 2 ψ˜ (~x, ω) = −4π f˜ (~x, ω)
mit
k=
ω . c
Dies ist die Helmholzsche Gleichung. Die zugehörige Green-Funktion ist Gk (~x, ~x0 ) = Beweis: Zu zeigen ist, dass ∇2 + k 2 mit r = |~x| ist. In der Formel
1 |~x − ~x0 |
0
e±ik|~x−~x | .
e±ikr = −4π δ 3 (~x) . r
∂2 f ∙ g = f 00 g + g 00 f + 2f 0 g 0 ∂r 2 setzen wir f = 1/r , g = e±ikr und erhalten 2 ∂ e±ikr 2 ∂ e±ikr = ∇2 + r ∂r 2 r ∂r r 2 2 2 ∂ ±ikr ∂ ∂ 1 1 ∂2 ∂ 1 ∂ ±ikr = e±ikr + + + 2 + [ ]e e ∂r 2 r ∂r r r ∂r 2 r ∂r ∂r r ∂r 2 1 1 ∂ ±ikr = e±ikr ∇2 + e r r ∂r 2 e±ikr = −4π δ 3 (~x) − k 2 , r
14.1 Green-Funktionen, Retardierte Potentiale
171
wo wir verwendet haben, dass ∇2
1 = −4π δ 3 (~x) . r
Diese Relation lässt sich wie folgt plausibel erklären: Sei r 6= 0, dann gilt ∇
21
r
=
2 ∂ ∂2 + ∂r 2 r ∂r
Für r = 0 ist ∇2
1 = r
2 −1 1 2 3+ × 2 r r r
= 0.
1 =∞, r
da Z
~ ∙∇ ~ 1 d3 x = ∇ r
Kugel V
Z
∂V
=
Z
∂V
~1 ∇ r
1 − 2 r
∙ d~a
~n ∙ d~a =
Z
1 − 2 r
r2 dΩ = −4π .
Die Lösung der inhomogenen Helmholzgleichung lautet somit Z ˜ ψ (~x, ω) = d3 x0 Gk (~x, ~x0 ) f˜ (~x0 , ω) .
Diesen Ausdruck für ψ˜ (~x, ω) setzen wir in Gl. (14.2) ein: Z Z Z ψ (~x, t) = dω ψ˜ (~x, ω) e−iωt = dω d3 x0 Gk (~x, ~x0 ) f˜ (~x0 , ω) e−iωt Z
0 Z ω e±ik|~x−~x | −iωt 1 0 iωt0 0 0 = d x dt e f (~ x , t ) k = e dω |~x − ~x0 | 2π c Z Z Z |~ x−~ x0 | 0 1 1 iω t −t ± c dt0 f (~x0 , t0 ) dω e = d3 x0 |~x − ~x0 | 2π Z Z 1 |~x − ~x0 | 3 0 0 0 0 0 dt f (~x , t ) δ t − t ± = d x |~x − ~x0 | c Z 0 1 |~x − ~x | = d3 x 0 . f ~x0 , t ∓ |~x − ~x0 | c
3 0
Z
Beide Vorzeichen sind mathematisch möglich. Kausalität: Der Effekt am Punkt ~x zur Zeit t muss von der Quelle zu einem früheren Zeitpunkt ausgegangen sein, d.h. nur das obere Vorzeichen ist sinnvoll (t > t0 ). Man bezeichnet t0 ≡ t −
|~x − ~x0 | c
172
Kapitel 14. Elektromagnetische Strahlung 0
x| als retardierte Zeit, da t − t0 = |~x−~ die Zeit ist, die das Licht braucht, um von ~x0 c nach ~x zu gelangen. Gehen wir zurück zu Gl. (14.1), so erhalten wir entsprechend die retardierten Potentiale, |~x−~x0 | μ 0 Z j ~x , t − c 1 Aμ (~x, t) = d3 x0 (14.4) c |~x − ~x0 |
oder
Aμ (~x, t) =
1 c
Z
d3 x0 dt0 j μ (~x0 , t0 )
|~x−~x0 | δ t0 − t + c |~x − ~x0 |
θ (t − t0 ) .
(14.5)
Aus dem Vergleich dieser Gleichung mit Gl. (14.1) kann man die Green-Funktion der Wellengleichung ablesen |~x−~x0 | 0 δ t −t+ c Gret (~x − ~x0 , t − t0 ) = θ (t − t0 ) . |~x − ~x0 |
Man kann Gret auch manifest lorentzinvariant schreiben: Gret (x) = 2δ(x2 )θ(x0 ) ,
(14.6)
mit x ≡ (x0 , ~x), x2 ≡ x20 − ~x2 . Die Stufenfunktion θ(x0 ) ist invariant, da es keine Lorentz-Transformation gibt, die Zukunft in Vergangenheit transformiert. Beweis der Formel (14.6): Mit ∂ 02 2 = |2x0 |x0 =±|~x| ∂x0 x − ~x 0 x =±|~ x|
wird
2 2 Gret (x) = 2δ x0 − |~x| θ x0 =2
Nullstellen: x0 = ± |~x|
1 [δ x0 − |~x| + δ x0 + |~x| ]θ (x0 ) , 2 |~x| | {z } ⇒0
wo wir die Formel
δ(f (x)) =
X
Nullstellen xi
verwendet haben. Also ist Gret (x) =
δ(x − xi ) |f 0 (xi )|
1 δ(x0 − |~x|) . |~x|
(14.7)
Die retardierte Green-Funktion erfüllt die Kausalitätsbedingung Gret (~x − ~x0 , t − t0 ) = 0 für t < t0 (eine Störung breitet sich auf dem Vorwärtslichtkegel aus). Man kann Gret auch direkt mittels 4-dimensionaler Fouriertransformation und Integration im Komplexen berechnen.
14.2 Multipolentwicklung der retardierten Potentiale
14.2
173
Multipolentwicklung der retardierten Potentiale
Die Lösung Gl. (14.4) eignet sich meist nur für numerische Auswertung. Oft interessiert man sich aber nur für das Feld außerhalb (r > r 0 ) einer räumlich lokalisierten 4Stromverteilung. Dann kann man die retardierten Potentiale über die folgende TaylorEntwickung berechnen, 1 1 1 ∂ 1 ∂ ∂ 1 = − x0i + x0 x0 + ... . |~x − ~x0 | |~x| ∂xi |~x| 2! i k ∂xi ∂xk |~x| (für |~x0 | < |~x|)
(14.8)
Wenn wir verwenden, dass 1 xi ∂ 1 1 ∂ 1 =− 2xi = − 3 , = ∂xi |~x| ∂xi (xl xl ) 12 2 (xl xl ) 32 r dann erhalten wir für |~x| |~x0 | und ~x = ~n ∙ r 1 ~n ∙ ~x0 1 = + 2 + ∙∙∙ . 0 | ~x − ~x | r r Damit wird Ai (~x, t) =
1 rc
Z
j i (~x0 , t0 ) d3 x0 +
nk r2 c
Z
x0k j i (~x0 , t0 ) + ∙ ∙ ∙ ,
(14.9)
wo t0 die retardierte Zeit ist, t0 = t −
| ~x − ~x0 | r ~n ∙ ~x0 =t− + +0 c c | {z c}
x02 r
.
(14.10)
Zur Vereinfachung der Integration würden wir gerne t0 = t − rc setzen. Der zweite Term in Gl. (14.10) ist aber selbst für r r0 nicht immer klein gegen den ersten, sondern nur, wenn die relative Retardierung klein genug ist, d.h. wenn sich die Ladungsträger nicht zu schnell bewegen. Der Strom ~j (~x0 , t0 ) darf sich in der Zeit ~n ∙ ~x0 /c nicht wesentlich ändern. Sei T die Periode der Schwingungen der Ladungsträger, λ die zugehörige Wellenlänge und a die Ausdehnung der Quelle, dann muss ~n ∙ ~x0 a ' T c c
=
λ c
oder λ a sein. D.h. die Wellenlänge muss viel größer als die Ausdehnung der Quelle sein. Die Geschwindigkeit der Ladungsträger ist v ∼ a/T , d.h. eine äquivalente Bedingung ist v c. Dies sei im Folgenden stets vorausgesetzt, dann können wir t0 = t − rc setzen. Das Verhältnis λ/r kann beliebig sein.
174
Kapitel 14. Elektromagnetische Strahlung
Abbildung 14.1: Lokalisierte Stromdichte
Wir formen den ersten Term des Vektorpotentials um: (1) Ai
1 (~x, t) = rc
Z
r d3 x0 ji ~x0 , t − c
1 = rc
Z
{ r z }| (∇0k x0i ) d3 x0 jk ~x0 , t − c
(= 0 in der Magnetostatik)
δik
Z −1 0 0 r 0 3 0 xi d x ∇k jk ~x , t − rc c Z r 0 3 0 ∂ 0 1 xd x ρ ~x , t − = rc ∂t c i =
D.h.
wo
(partielle Integration) (Kontinuitätsgleichung) .
~ (1) (~x, t) = 1 ∂ p~ t − r , A cr ∂t c Z r p~ t − ≡ d3 x0 ~x0 ρ (~x0 , t − r/c) c
das elektrische Dipolmoment der Ladungsverteilung zur retardierten Zeit t0 = t − rc ist. Für den 2. Term erhält man nach einigen ähnlichen Manipulationen: ~ (2) (~x, t) = − 1 ∂ ~ni ∂ Qij t − A 2c ∂t ∂xj 3r wo Qij (t) =
Z
r c
m ~ t− 1~ + ∇ × c r
3xi xj − r2 δij ρ (~x, t) d3 x
das elektrischesQuadrupolmoment und
1 m ~ (t) = 2c
Z
d3 x ~x × ~j (~x, t)
r c
,
14.2 Multipolentwicklung der retardierten Potentiale
175
das magnetisches Dipolmoment ist. Analog erhält man für das skalare Potential Z 1 0 ~ 2 r 1 0 3 0 0 ~ ~x ∙ ∇ + ∙ ∙ ∙ ρ ~x , t − φ (~x, t) = d x 1 − ~x ∙ ∇ + 2 r c Z Z 0 r 0 ρ ~ x , t − ~ x 1 r c ~ ∙ = d3 x0 ρ ~x0 , t − −∇ d3 x0 + ∙ ∙ ∙ . r c r Der erste Term wird
q t − rc , φ (~x, t) = r R wo q t − rc = ρ ~x, t − rc d3 x die Ladung des Systems zur Zeit t − rc ist. Da die gesamte Ladung des Systems im Allgemeinen zeitliche konstant ist, lassen wir diesen Term bei der Betrachtung zeitabhängiger Felder weg. (0)
Der zweite Term, φ
(1)
"
~ ∙ p~ t − (~x, t) = −∇ r
r c
#
,
wird wieder durch das elektrische Dipolmoment bestimmt. Abschätzung der einzelnen Terme: Der Ursprung liege im Gebiet wo j und ρ 6= 0 sind. Sei dort |~x0 | < a.
~ (r, t) A φ (r, t)
(i)
a ≈ r
~ (r, t) A φ (r, t)
(i−1)
,
d.h. für r a brauche ich nur die führenden Terme zu betrachten, d.h. den elektrischen ~ = −∇φ ~ − ~ (1) und φ(1) . Wir betrachten die Beiträge zum elektrischen Feld E Dipol A ~ 1 ∂A c ∂t . Das skalare Potential ergibt p~ t − rc (1) ~ ~ ~ )| |∇φ | = |∇(∇ ∙ r 1~ ~ r ' | ∇( ∇ ∙ p~(t − ))| r c 1 1 ∂2 = |~ p| , r c2 ∂t2 wo wir verwendet haben, dass ∂ ∂ f (x − t) = − f (x − t) . ∂x ∂t Für das Vektorpotential wird ~ (1) 1 ∂A 1 ∂ 2 p~ | |= | 2 |, c ∂t c ∂t rc ~ bei. Die elektrischen Did.h. Vektor- und skalares Potential tragen gleich stark zu E polterme (E 1) dominieren in der Multipolentwicklung.
176
14.3
Kapitel 14. Elektromagnetische Strahlung
Elektrische Dipolstrahlung E1
Betrachte einen schwingenden Dipol mit periodischer Zeitabhängigkeit, p~ (t) = p~0 e−iωt . Die Maxwell-Gleichungen sind linear. Wenn man komplexe Lösungen betrachtet, so lösen sowohl der Realteil als auch der Imaginärteil die Gleichungen. Bei periodischen Größen ist die komplexe Formulierung günstig, da es leichter ist mit Exponentialfunktionen zu arbeiten als mit sin und cos. Am Ende der Rechnung muss man zu physikalischen Größen zurückkehren. Konventionellerweise wählt man den Realteil. Das physikalische Dipolmoment ist Re p~ (t). Das Vektorpotential ist in diesem Fall: ~ (1) = 1 ∂ p~0 e−iω(t− rc ) A rc ∂t r iω = − p~0 e−iω(t− c ) rc ω eikr p~ (t) mit k = . = −ik r c Das zugehörige Magnetfeld wird ikr (1) (1) ~ ~e ~ ~ B = ∇ × A = −ik ∇ × p~ (t) . r Wir verwenden, dass ∂ 1 ∂ f (r) = f ((xk xk )1/2 ) = f 0 ((xk xk )1/2 ) (xk xk )−1/2 2xi ∂xi ∂xi 2 oder
~ (r) = ~x ∂ f (r) = ~n ∂ f (r) , ∇f r ∂r ∂r wo ~n der Einheitsvektor in Richtung ~x ist. Damit wird ~ (1) = k 2 (~n × p~ (t)) e B
ikr
r
(1 −
1 ). ikr
~ ist transversal (⊥ zu ~x) ∀t. Für sehr große r wird Das Magnetfeld B ~ (1) = ik~n × A ~ (1) B ~ können wir über φ(1) (~x, t) und A ~ (1) , oder aus B ~ (1) mit den Das elektrische Feld E Maxwell-Gleichungen ~ ~ ~ ×B ~ = 1 ∂ E = −i ω E ∇ c ∂t c berechnen. Wir finden
fu ¨r
~ ×B ~ . ~ = i∇ E k
~ ∝ e−iωt E
14.3 Elektrische Dipolstrahlung E1
177
Die Berechnung der Rotation ergibt: 1 i eikr 1− pn Ei = εike ∇k Be = ikεike ∇k εemn xm k r ikr eikr ∂ eikr 1 1 = ikεike εemn δkm 1− + x m nk 1− pn . r ikr ∂r r ikr
Wenn wir verwenden, dass
∇k xm = δkm ,
∇k f (r) = nk f 0 (r),
nk =
xk , r
finden wir für das elektrische Feld → − (1) eikr = k 2 (~n × p~) × ~n E r 1 ik − − + [3~n(~n ∙ → p)−→ p ]( 3 − 2 )eikr . r r
(14.11)
~ ⊥ ~x, d.h. Das elektrische Feld ist nur für große r senkrecht zur Ausbreitungsrichtung, E für r k1 oder r λ. Das Verhältnis λr war beliebig, aber a λ (und r a) musste stets für die Dipol-Approximation gefordert werden. Für kleine λ, d.h. r λ = 2π k (Wellenlänge) ist der 1/r3 Term dominant. Beweis des Ergebnisses (14.11): eikr 1 i pn εike ∇k Be = ikεike ∇k εemn xm 2 1 − k r ikr 1 1 eikr ∂ eikr = ikεike εemn δkm 2 1 − pn + ik (δim δkn − δim δkm ) xm pn nk 1 − r ikr ∂r r2 ikr ikr ikr e e 1 1 2 3 = ik (−2δin ) 2 1 − pn + ik (xi pk − xk pi ) nk 2 ik − − + 2 r ikr r r r r ik | {z } eikr 1 1 2 3 eikr pi + ik ni (p ∙ n) − pi n2 ik − − + 2 = ik (−2) 2 1 − r ikr r r r r ik ikr ikr ikr e e 2 e 3 3 = k 2 [(~n × p~) × ~n]i + ni (p ∙ n) 2 −3ik + + pi 2 −2ik + + 3ik − r r r r r r ikr ikr ikr 1 e 1 e e + ni (p ∙ n) 2 3 −ik + + pi 2 ik − = k 2 [(~n × p~) × ~n]i r r r r r
Ei =
Die Ergebnisse vereinfachen sich für große und kleine r. 1. Fernzone: Sei r λ, dann wird: ~ = k 2 (~n × p~ (t)) e B ~ =B ~ × ~n, E
ikr
r
~ ⊥B ~ ⊥ ~x. d.h. E
178
Kapitel 14. Elektromagnetische Strahlung
Setzt man die Zeitabhängigkeit p~ (t) = p~0 e−iωt ein, so ist ~ = k 2 (~n × p~0 ) 1 ei(kr−ωt) . B r ~ ⊥ E. ~ Die Phase Dies ist eine auslaufende Kugelwelle, d.h. ~k = k~n und ~k ⊥ B ~ ϕ = kr − ωt (= k ∙ ~x − ωt) hat auf allen Punkten einer Kugel r = konst. denselben Wert.
Abbildung 14.2: Auslaufende Kugelwelle
2. Nahzone: Für r λ , kr 1 eikr ∼ 1 (aber immer noch r r0 ' a) erhalten wir: ~ = ik (~n × p~) 1 B transversal r2 ~ = [3~n (~n ∙ p~) − p~] 1 longitudinal + transversal E r3 ~ verhält sich in der Nahzone wie ein statischer elektrischer Dipol (bis auf d.h. E Oszillation in t, p~ = p~0 e−iωt ). Das Magnetfeld ist viel kleiner als das elektrische, ~ , da ikr 1. ~ = ikr ~n × p~ E B r3
Abgestrahlte Leistung H ~ ∙ d~a, Der Energiefluss des elektromagnetischen Feldes (von innen nach aussen) war S
wobei der physikalische Poynting-Vektor gegeben ist durch ~ phys. ~ phys. × B ~ (~x, t) = c E S 4π c 1 ~ (~x, t) × Re B ~ (~x, t) = Re E (Re z = (z + z ∗ )) . 4π 2 Von praktischem Interesse ist die zeitlich gemittelte Poynting-Vektor D
ZT E 1 ~ (~x, t) ~ dtS S (~x, t) = T
wo T =
∂V
2π die Periode ist. ω
0
~ (~x, t) = B ~ (~x) e−iωt ist der zeitlich ~ (~x, t) = E ~ (~x) e−iωt und B Für periodische Felder E gemittelte Poynting- Vektor gegeben ist durch o D E n ~ (~x, t) = c Re E ~ (~x) × B ~ ∗ (~x) . S 8π
14.3 Elektrische Dipolstrahlung E1
179
Da das Ergebnis plausibel erscheint, ersparen wir uns hier den Beweis. Für eine Kugelfläche vom Radius R in der Strahlungszone berechnet sich die abgestrahlte Leistung damit aus: Z c ~ ×B ~ ∗ ∙ d~a Re E P = 8π Z c ~ ×B ~ ∗ ∙ ~nR2 dΩ . = E 8π Die Abgestrahlte Leistung pro Raumwinkeleinheit ist gegeben durch c dP ~ ×B ~ ∗ ∙ ~nR2 . = Re E dΩ 8π ~ =B ~ × ~n und damit wird In der Strahlungszone ist E c dP ~ × ~n × B ~ ∗ ∙ ~nR2 B = dΩ 8π 2 c ~ ~ ∙ ~n = 0) . = ~n B (B ∙ ~nR2 8π
~ = k 2 (~n × p~0 ) ei(kr−ωt) folgt Mit B r 2 ei(kr−ωt) ∙ e−i(kr−ωt) ~ B = k 4 (~n × p~0 ) ∙ (~n × p~0 ) | {z } R2 k4 k4 2 2 2 |~ n × p ~ | = p sin θ , 0 R2 R2 0 wo θ der Winkel zwischen ~x und p~0 ist.Damit wird =
dP c 4 2 2 = k p0 sin ϑ . dΩ 8π Die Strahlung ist stark gerichtet und senkrecht zu p~0 . Die Winkelverteilung ist typisch für einen Dipol.Die gesamte abgestrahlte Leistung ist Z Z dP dP P = dΩ = sin θdθdϕ dΩ dΩ Zπ Z2π 4 ck 4 da sin3 θdθ = , dϕ = 2π | p~0 |2 , P = 3 3 0
Abbildung 14.3: Dipol
0
Abbildung 14.4: Dipolstrahlung
180
Kapitel 14. Elektromagnetische Strahlung
Da k = ωc , steigt die abgestrahlte Leistung wie ω 4 an, d.h. mit der vierten Potenz der Frequenz. Licht, das unser Auge nicht direkt von der Sonne erreicht, stammt von der Abstrahlung von Molekülen in der Atmosphäre, die die Strahlung unmittelbar vorher absorbiert hatten. Dies ist die Ursache der Frequenzabhängigkeit der Streuung von Licht in der Atmosphäre, d.h. für das Blau des Himmels.
14.4
Lineare Antennen
Wesentliche Annahme für die Multipolentwicklung war, dass die Dimension d der Quelle viel kleiner sein musste als die Wellenlänge λ der Strahlung. Dies führt dazu, dass die zugeführte Energie hauptsächlich in Wärme umgewandelt wird und nur wenig als elektromagnetische Feldenergie abgestrahlt wird. Für eine effektive Abstrahlung muss man d ' λ wählen. Dann spricht man von einer Antenne.
Abbildung 14.5: Lineare Antenne
Als Beispiel betrachten wir eine Antenne, die aus zwei dünnen Drähten, jeweils Länge d 2 besteht, mit einer kleinen Lücke dazwischen. An die Drähte wird ein oszillierender Strom angelegt. Für ein System, das sinusartig schwingt, ist ~j (~x, t) = ~j (~x) e−iωt mit vorgegebenen j μ (~x). Ein realistisches Beispiel ist eine stehende Welle in der Antenne ~j (~x) = I0 sin( kd − k|z|)δ(x)δ(y)~ez , (14.12) 2 wo k = ωc . Da die Dimesion der Antenne vergleichbar mit der Wellenlänge ist, ist die Multipolentwicklung nicht anwendbar. Wir müssen die Integration in der Formel für das Vektorpotential explizit ausführen. Bei sinusartiger Zeitabhängigkeit ergibt sich für das Vektorpotential ~ (~x, t) = A(~ ~ x)e−iωt , (14.13) A mit ~ x) = 1 A(~ c und der Wellenzahl k =
ω c.
Z
ik|~ x−~ x0 |
~j(~x0 ) e d3 x0 |~x − ~x0 |
(14.14)
14.4 Lineare Antennen
181
Beweis: Wie am Kapitelanfang diskutiert, geht die Wellengleichung 4π 1 ∂2 ~ (~x, t) = − ~j (~x, t) ∇2 − 2 2 A c ∂t c ~ (~x) = A(~ ~ x)e−iωt über in die Helmholz-Gleichung für die A ~ (~x) = − 4π ~j (~x) , ∇2 + k 2 A c
k=
ω . c
Für die Helmholz-Gleichung hatten wir die retardierte Green-Funktion bestimmt: Gk (~x, ~x0 ) =
0 1 eik|~x−~x | . 0 |~x − ~x |
Damit folgt Gl. (14.14). Es genügt das 3-Vektorpotential zu betrachten, da sich daraus die Felder berechnen lassen. Das magnetische Feld ist gegeben aus ~ (~x, t) = ∇ ~ ×A ~ (~x, t) B ~ außerhalb der Quellen aus der 4. Maxwell-Gleichung , ∇ ~ ×B ~ = und das elektrische E ~ 1 ∂E ω ~ ~ c ∂t = −i c E (für j = 0), ~ ×B ~ . ~ = i∇ E k Wir betrachten die Taylor-Entwicklung für |~x − ~x0 | etwas genauer: " # 0 02 0 2 ~ n ∙~ x 1 ~ n ∙~ x r |~x − ~x0 | = r 1 − + .... + 2− r 2r 2 r = r − ~n∙~x0 +
r02 sin2 θ, 2r
(14.15)
wo ~x = ~nr und θ der Winkel zwischen ~x und ~x0 ist. Für |~x| |~x0 |, d.h. r d, kann man im Nenner von Gl. (14.14) problemlos |~x −~x0 | ' r setzen. Die Exponentialfunktion in Gl. (14.14) dagegen oszilliert sehr schnell. Der Phasenfaktor ist empfindlich auf Änderungen der Phase k|~x − ~x0 |. D.h. der 3. Term in (14.15) ist nur vernachlässigbar, wenn die zugehörige Phasenverschiebung deutlich kleiner als 2π ist. k
r02 sin2 θ 2π 2r
oder
r02 sin2 θ λ 2r
(λ =
2π ) k
Da 2r0 sin θ ≤ d ist, lautet die Bedingung: ( d2 )2 λ 2r
oder
r
d2 . 8λ
Dies ist die Fraunhofer-Bedingung . Ist sie erfüllt, so kann man die Phase durch eine lineare Funktion ersetzen, |~x − ~x0 | ' r − ~n ∙ ~x0 = r − r0 cos θ .
182
Kapitel 14. Elektromagnetische Strahlung
Damit wird
oder
ikr ~ x) = 1 e A(~ c r
Z
~j(~x0 )e−ikr0 cos θ d3 x0
i(kr−ωt) ~ x, t) = 1 e A(~ c r
Z
~j(~x0 )e−ikr0 cos θ d3 x0 .
~ (r) = ~n ∂ f (r) Dies ist eine auslaufende Kugelwelle mit Wellenvektor ~k = k~n. Da ∇f ∂r (= ik~nf (r) für Kugelwellen), erhalten wir in der Strahlungszone: 1 ~ ~ ~ ~ B = ∇ × A = ik~n × A +O( 2 ) r 1 i~ ~ ~ ~ +O( 2 ) . E = ∇ × B = −~n × B k r ~ ⊥ E. ~ Dies ist wieder eine auslaufende Kugelwelle mit ~k = k~n und ~k ⊥ B Rechnerisches Detail:: ~ = i∇ ~ ~ ×B ~ = i ~n × ∂ B ~ = i ~n × (ik)B. E k k ∂r k Im obigen Beispiel (14.12) liegt die Antenne in der z-Achse und wir erhalten: d
ikr ~ x) = I 0 e A(~ c r
Z2
sin(
0 kd − k|z 0 |)e−ikz cos θ dz 0 ~ez 2
−d 2 d
I0 eikr R2 kd = sin( − kz 0 ) c r 0 2 i h 0 0 × e−ikz cos θ + eikz cos θ dz 0 ~ez . | {z } cos(kz 0 cos θ)
Das Integral lässt sich elementar berechnen mit dem Ergebnis " # kd kd ikr cos θ) − cos cos( I e 0 2 2 ~ x) = A(~ ~ez . c kr sin2 θ ~ x) nur eine Komponente in z-Richtung besitzt, ist |~n × A| ~ = Az sin θ und das Da A(~ Magnetfeld in der Fernzone wird ~ = kAz sin θ . |B| ~ × (B ~ × C) ~ = B( ~ A ~ ∙ C) ~ − C( ~ A ~ ∙ B) ~ berechnet sich der zeitlich Mit Hilfe der Formel A gemittelte Poynting-Vektor zu D E o n ~ = c Re E ∗ (~x) × B ~ (~x) = c |B| ~ 2~n . S 8π 8π
14.4 Lineare Antennen
183
Damit wird die zeitgemittelte abgestrahlte Leistung pro Raumwinkeleinheit D E dP ~ ∙~n = r2 S dΩ " #2 kd I02 cos( kd 2 cos θ) − cos 2 = . 4πc sin θ
Von besonderem Interesse ist der Fall, wo die Antennenlänge ein ganzzahliges Vielfaches der Wellenlänge der Schwingung ist d = mλ =
2mπ , k
m = 1, 2, ...
Für m = 1 ( kd 2 = π) erhält man dann z.B. für die gesamte abgestrahlte Leistung P =
Rπ cos(π cos θ) + 1 2 I02 sin θdθ. 2π 4πc 0 sin θ
Das Integral kann numerisch ausgeführt werden,
Rπ cos(π cos θ) + 1 2 sin θdθ = 3.318 . sin θ 0
Bei gegebenem Strom wird viel mehr Leistung abgestrahlt als im Fall der Dipolantenne mit d λ.
Kapitel 15
Strahlung einer bewegten Punktladung In diesem Kapitel setzen wir wieder c = 1, um die Notation übersichtlich zu halten. D.h. wir messen alle Geschwindigkeiten in Einheiten der Lichtgeschwindigkeit. Die Bahn (Weltlinie) z μ (τ ) einer Punktladung sei durch die Eigenzeit parametrisiert und im Folgenden vorgegeben. Die 4-Geschwindigkeit des Teilchens ist gegeben durch dz μ dz μ dt d~z μ =γ = , = γ 1, β~ , z˙ ≡ dτ dτ dτ dt
d wo ∙ für dτ steht. Im Folgenden werden wir ausnützen, dass die Normierung z˙ μ z˙μ = 1 (= 2 ~ c ) zeitlich konstant ist, auch wenn die Geschwindigkeit nicht konstant ist, β~ = β(t) und γ = γ(t).
Sei xμ ein variabler Raum-Zeit-Vektor. Wir lassen wieder bei 4-Vektoren, wenn dies nicht missverständlich ist, den Index weg, x ≡ x0 , ~x .
Der 4-Strom für ein geladenes Teilchen, das sich auf der Bahn z μ (τ ) bewegt war gegeben durch d j μ (x) = ρ (x) , ~j (x) = qδ 3 (~x − ~z(t)) (1, ~z(t)) dt 1 μ 3 = qδ (~x − ~z (τ0 )) z˙ (τ0 ) γ Z∞ =q dτ δ 4 (x − z (τ )) z˙ μ (τ ) , −∞
wo τ0 sich für jedes x0 und gegebener Bahn z μ (τ ) aus x0 = z 0 (τ0 ) bestimmt.
186
Kapitel 15. Strahlung einer bewegten Punktladung
Abbildung 15.1: Weltlinie eines Teilchens
15.1
Liénard-Wiechertsche Potentiale
Die Maxwell-Gleichungen für die 4-Potentiale lauten, Aμ = 4πj μ
mit = ∂μ ∂ μ = ∂02 − ∂~ 2 .
Die Lösung kann mittels Green-Funktion erfolgen, die definiert ist als Lösung der Gleichung Gret (x, x0 ) = 4πδ 4 (x − x0 )
mit Kausalitätsbedingung Gret (x, x0 ) = 0 für t < t0 (d.h. eine Störung breitet sich auf dem Vorwärtslichtkegel aus). Dann ist Z μ A (x) = d4 x0 Gret (x, x0 ) j μ (x0 ) (15.1) Aus der Translationsinvarianz für Randbedingung im Unendlichen folgt Gret (x, x0 ) = Gret (x − x0 ) = Gret (~x − ~x0 , t − t0 ) . Es genügt die Green-Funktion Gret (x) zu berechnen. Für eine Punktquelle bei x = 0 war 1 Gret (x) = δ |~x| − x0 = 2δ x2 θ x0 . |~x| Wir setzen j μ (x) und Gret (x) in Gl. (15.1) ein und erhalten: Z μ A (x) = d4 x0 Gret (x − x0 ) j μ (x0 ) Z = q d4 x0 dτ δ 4 (x0 − z (τ )) z˙ μ (τ ) Gret (x − x0 ) =q
Z∞
−∞ Z∞
=q
−∞
dτ Gret (x − z (τ )) z˙ μ (τ ) 2 dτ 2δ (x − z (τ )) z˙ μ (τ ) .
15.1 Liénard-Wiechertsche Potentiale
187
Mit
δ (x − z (τ ))
2
# " d (x − z (τ ))2 −1 = δ (τ − τ0 ) dτ
τ =τ0
δ (τ − τ0 ) = , |2(x − z (τ ))μ z˙ μ |τ =τ0
wo τ0 die Nullstelle der δ-Funktion ist, können wir die Integration über τ ausführen und erhalten: z˙ μ (τ0 ) Aμ (x) = q . (15.2) |z˙ (τ0 ) ∙ (x − z (τ0 ))|
Dies sind die Liénard-Wiechertsche Potentiale in kovarianter Form. Wir müssen die Bedeutung von τ0 in dieser Formel erklären. Dazu betrachten wir die Green-Funktion Gret (x − z (τ )) =
1 δ |~x − ~z (τ ) | − x0 − z 0 (τ ) . |~x − ~z (τ ) |
Die Nullstelle der Deltafunktion ist bei x0 − z 0 (τ0 ) = |~x − ~z (τ0 ) | oder z 0 (τ0 ) = x0 − |~x − ~z (τ0 ) | .
(15.3)
D.h. z 0 (τ0 ) ist die retardierte Zeit (c=1). Für jedes xμ = (x0 , ~x) und vorgegebenes z μ (τ ) muss τ0 aus (15.3) berechnet werden, d.h. z(τ0 ) ist der Schnittpunkt der Weltlinie z(τ ) mit dem unteren Lichtkegel des Punktes x = (x0 , ~x), der definiert ist durch h i 2 2 δ (x − z (τ0 )) ⇒ (x − z (τ0 )) = 0 .
Wegen der Definition von τ0 muss man bei späteren Differentiationen nach x immer beachten, dass x in τ0 implizit enthalten ist. Wir schreiben kompakt q z˙ μ μ , (15.4) A (x) = (z, ˙ x − z) τ =τ0 d.h. z = z (τ0 ) und z˙ = z˙ (τ0 ).
Wir können dieses Ergebnis in eine nicht-kovariante Form umschreiben. Dazu definieren wir x0 − z 0 (τ0 ) = |~x − ~z (τ0 ) | ≡ R
mit
~ ≡ ~x − ~z (τ0 ) . R
Ersetzen wir z˙ μ = γ 1, β~ im Nenner von Gl. (15.4), so erhalten wir (z, ˙ x − z) = z˙ 0 x0 − z 0 − ~z˙ ∙ (~x − ~z) ~ = γR − γ β~ ∙ R
188
Kapitel 15. Strahlung einer bewegten Punktladung
Abbildung 15.2: Die retardierte Zeit einer bewegten Punkladung
(alles bei τ = τ0 ), oder
(z, ˙ x − z) = γR 1 − β~ ∙ ~n ,
~ = R~n und ~n ein Einheitsvektor in Richtung R ~ = ~x − ~z (τ0 ) ist. Es folgt wo R q Φ(~x, t) = ~ 1 − β ∙ ~n R ret q β~ ~ x, t) = . A(~ ~ 1 − β ∙ ~n R
(15.5)
ret
[ ]ret bedeutet, dass der Ausdruck an der retardierten Zeit z 0 (τ0 ) = x0 −R zu nehmen ist. Spezialfälle: 1. Teilchen in Ruhe: Sei z (τ ) = (τ, 0, 0, 0) , dann wird und
und
z˙ = (1, 0, 0, 0)
(z, ˙ x − z) |τ =τ0 = x0 − z 0 τ 0 = |~x − ~z (τ0 ) | = |~x| q z˙ μ (z, ˙ x − z) τ =τ0 q = (1, 0, 0, 0) |~x|
Aμ (x) =
Das 4-Potential hängt nicht von τ0 ab.
Coulomb Potential, wie erwartet .
15.2 Liénard-Wiechert-Felder
189
2. Gleichförmig bewegtes Teilchen: Sei z (t) = (t, vt, 0, 0)
mit v konstant
oder z (τ ) = (γτ, γvτ, 0, 0)
mit γ = √
1 konstant. 1 − v2
(15.6)
Die Geschwindigkeit ~v des geladenen Teilchens zeigt in x-Richtung. Wir erhalten aus Gl. (15.6) z˙ μ (τ ) = (γ, γv, 0, 0)
(z, ˙ x − z) = γ x0 − z 0 − v x1 − z 1 {z } | ~ v ∙(~ x−~ z)
Berechnung von τ0 :
(x0 − z 0 (τ 0 ))2 = (~x − ~z (τ0 ))2 (x0 − γτ 0 )2 = (~x − γτ0~v )2
Dies ist eine quadratische Gleichung für τ0 , wo x0 , ~x, ~v gegeben sind. Damit wird Aμ (x) =
q (1, v, 0, 0) ||~x − ~z (τ0 ) | − ~v ∙ (~x − ~z (τ0 )) |
Wir hätten eine Lorentz-Transformation auf Fall 1 anwenden können.
15.2
Liénard-Wiechert-Felder
Wir gehen aus von Aμ (x) = q
z˙ μ (τ0 ) . (z˙ (τ0 ) , x − z (τ0 ))
Dann berechnet sich der elektromagnetische Feldtensor aus Fμν = ∂μ Aν − ∂ν Aμ . Beim Differenzieren muss man beachten, dass x in τ0 impliziert enthalten ist, τ0 = τ0 (x). Wir betrachten den Term ∂ ∂τ ∂z (τ ) 2 ∂ μ Aν = A = z ˙ , z ˙ = 1 ν ∂xμ ∂xμ ∂xμ ∂τ0 z¨ν ∂x ∂τ ∂τ z˙ν μ 0 0 z , x − z) . −q =q + z˙μ − |{z} z˙ 2 2 (¨ (z, ˙ x − z) ∂xμ ∂xμ (z, ˙ x − z) =1
190
Kapitel 15. Strahlung einer bewegten Punktladung
Der symmetrische Term proportional zu z˙ν z˙μ trägt zu Fμν nicht bei. Die Berechnung von ∂τ0 /∂xν erfolgt mit Hilfe der Lichtkegelbedingung 0=
∂ 2 (x − z (τ0 )) {z } ∂xν |
=0 wegen δ−F n.
∂τ0 = 2 (xα − zα (τ0 )) δνα − z˙ α (τ0 ) ν ∂x = 2 (x − z (τ0 ))ν − 2 (x − z (τ0 )) ∙ z˙ (τ0 ) (x − z (τ0 ))ν ∂τ0 = . ∂xν (z˙ (τ0 ) , x − z (τ0 ))
⇒ Damit wird Fμν =
q (x − z)μ
(z, ˙ x − z)
3
∂τ0 ∂xν
{(z, ˙ x − z) z¨ν − (¨ z , x − z) z˙ν − z˙ν }τ =τ − (μ ↔ ν) . 0
Der Feldtensor zerfällt in zwei Teile, einer der von der Beschleunigung abhängt und einer der von der Geschwindigkeit abhängt. (¨ z)
(z) ˙
Fμν = Fμν + Fμν 1 Strahlungsfeld oder asymptotisches Feld, r (z) ˙ 1 F ∼ 2 . r (¨ z)
F ∼
(¨ z)
Für große r überwiegt F , nur dieses Feld transportiert Energie nach ∞. Aus dem berechneten Fμν liest man die elektromagnetischen Felder ab, E i = −F 0i . Mit
z˙ μ = γ 1, β~ ,
1 − β~ 2
.
z¨ = γ 0, β~ μ
und Gl. (15.5)
1
γ=q
,
γ˙ = −
∙
1 1 2β~ ∙ β~ , 2 (1 − β~ 2 )3/2
+ γ˙ 1, β~
. ∙ ~ = γ 0, β~ + (−γ 3 (β~ ∙ β)) 1, β~ ,
(z, ˙ x − z) = γR 1 − β~ ∙ ~n , x0 − z 0 = |~x − ~z| = R
~n =
~ R R
15.2 Liénard-Wiechert-Felder
191
erhalten wir
~ (~x) = q E
~n − β~
γ 2 1 − β~ ∙ ~n ~ = ~n × E ~ B ,
3
R2
ret
n o ˙ ~ ~ ~n × ~n − β × β +q 3 1 − β~ ∙ ~n R
ret
ret
~ ˙ wo β~ = ~v (t) die gewöhnliche Geschwindigkeit und β~ ≡ ddtβ die gewöhnliche Beschleunigung sind. Die Geschwindigkeitsfelder ∼ β~ sind im wesentlichem statisch und fallen ˙ wie 1/R2 . Die Beschleunigungsfelder proportional zu β~ sind typische Strahlungsfelder, 1 ~ ⊥B ~ ⊥ ~n , ∼ . Sie transportieren Energie nach ∞. d.h. E R
Der Energie-Impulstensor des elektromagnetischen Feldes war: 1 1 F μα Fα ν + g μν F αβ Fαβ T μν ≡ 4π 4 mit F μν
0 Ex = Ey Ez
−Ex 0 Bz −By
−Ey −Bz 0 Bx
Einsetzen für F μν ergibt die einzelnen Elemente
−Ez By −Bx 0
1 ~ 2 ~ 2 E + B = w (x) 8π 1 ~ ~ = 1S ~ = E×B 4π c −1 1 ~ 2 ~ 2 = Ei Ej + Bi Bj − δij E +B 4π 2
T 00 = T 0i T ij
T ij ... Maxwellscher Spannungstensor gibt die Kraft pro Flächeneinheit auf die (¨ z)
Oberfläche einer Ladungsverteilung an. Einsetzen für Fμν ∝ F μν für r → ∞, ergibt nach längerer Rechnung " 2 # (¨ z) q 2 (x − z)μ (x − z)ν 2 (¨ z , x − z) T μν (x) = − z¨ + . (15.7) 4 4π (z, ˙ x − z) (z, ˙ x − z) ret
Beweis der Gleichung (15.7): 2
Wir verwenden z˙ 2 = 1 ⇒ (z, ˙ z¨) = 0, (x − z) = 0 in ( ) (¨ z) (x − z)μ F μν = q ˙ x − z) z¨ν − (¨ z , x − z) z˙ν ] − μ ↔ ν . 3 [(z, (z, ˙ x − z)
192
Kapitel 15. Strahlung einer bewegten Punktladung
Setze aα = q Dann ist
(x − z)α
(z, ˙ x − z)
(b − c)β = (z, ˙ x − z) z¨β − (¨ z , x − z) z˙β .
3,
β
α
Fαβ F αβ = [aα (b − c)β − aβ (b − c)α ][aα (b − c) − aβ (b − c) ] 2
aα aα ∝ (x − z) = 0
a ∙ (b − c) ∝ (z, ˙ x − z) (¨ z , x − z) − (¨ z , x − z) (z, ˙ x − z) = 0 ⇒
Fαβ F αβ = 0 α
Fμα F αν = [aμ (b − c)α − aα (b − c)μ ] [aα (b − c)ν − aν (b − c) ] = −aμ aν (b − c)
2
2
(b − c) ∝ [(z, ˙ x − z) z¨ − (¨ z , x − z) z] ˙ ∙ [(z, ˙ x − z) z¨ − (¨ z , x − z) z] ˙ 2
2
z , x − z) |{z} z˙ 2 + (¨ z ∙ z) ˙ × (∙ ∙ ∙ ) = (z, ˙ x − z) z¨2 + (¨ | {z } =1
(b ∙ c ∝ z¨ ∙ z˙ = 0
15.3
wegen
=0
z˙ 2 = 1)
Strahlung im Ruhsystem (zur Zeit τ0 )
¨ Zur Zeit τ0 sei die Geschwindigkeit der Ladung gleich 0, aber die Beschleunigung ~z 6= 0. Wir können den Ursprung so wählen, dass z μ τ 0 = (0, 0, 0, 0) ist, d.h. wir betrachten die Strahlung, die von einem Teilchen stammt, das sich zur Zeit t = 0 bei ~x = 0 befindet. Die 4-Geschwindigkeit ist dann z˙ μ τ 0 = (1, 0, 0, 0) , → − da z˙ = 0 im Ruhsystem ist und z˙ 2 = 1. Aus z˙ 2 = 1 folgt (z, ˙ z¨) = 0
(aber im Allgemeinen ist ~z¨ = 6 0 ).
⇒ z¨0 = 0
Die Lichtkegelbedingung ergibt 2
2
2
0 = (x − z (τ0 )) = x0 − z 0 (τ0 ) − ~x − ~z (τ0 ) | {z } | {z } =0
→ x0 − z 0 (τ0 ) = r
Damit wird
(z, ˙ x − z) = x0 − z 0 = r
=0
(r = |~x|)
(z˙ = (1, 0, 00)) ,
15.3 Strahlung im Ruhsystem (zur Zeit τ0 )
193
und wir erhalten für die Feld-Energiedichte " 2 # q 2 (x − z)0 (x − z)0 2 (¨ z , x − z) T 00 (x) = − z¨ + 4 4π (z, ˙ x − z) (z, ˙ x − z) ret !2 0 0 0 2 2 ¨ z¨ x − z − ~z ∙ ~x −q r 2 = z¨ + 4 4π r r2 −q 2 1 02 = z¨ −|~z¨|2 + |~z¨|2 cos2 θ 4π r2 |{z} =0 # " q 2 |~z¨|2 sin2 θ = >0. 4π r2
(¨ z)
Die abgestrahlte Energiedichte ist identisch mit der eines strahlenden Dipols, dessen Achse in Richtung der Beschleunigung ausgerichtet ist. In der Bewegungsrichtung wird nichts abgestrahlt.Eine analoge Rechnung ergibt für den Poynting-Vektor 1 ~ q 2 | ~z¨ |2 xi sin2 θ. (S)i = T0i = c 4π r3
(15.8)
Diese Aussagen gelten nur in diesem speziellen Koordinatensystem, dem instantanen Ruhsystem (das sich mit t ändert), d.h. sie sind brauchbar für sehr langsame Teilchen.
Abbildung 15.3: system
Strahlungsintesität einer beschleunigten Ladung im instantanen Ruh-
Die abgestrahlte Energie pro Zeiteinheit (Leistung), d.h. die Energie pro Zeiteinheit durch eine Kugelfläche mit Zentrum an der retardierten Position ~x (τ0 ) ist gegeben durch Z Z ~x − ~ ∙→ ~ ∙ d ~a = r2 S n d Ω wo ~n = . P = S r Kugel
Die abgestrahlte Leistung pro Raumwinkeleinheit ist dann 2 dP ~ ∙ ~n = e |~z¨|2 sin2 θ . = r2 S dΩ 4π
194
Kapitel 15. Strahlung einer bewegten Punktladung
Damit wird P = =
Z
Z2π Z1 q 2 | ~z¨ |2 dP 2 dφ d(cos θ) sin dΩ = | {z θ} dΩ 4π −1
0
2e | ~z¨ | . 3 2
2
1−cos2 θ
Dies ist die Lamorsche Formel für die abgestrahlte Leistung einer beschleunigten Ladung. Wenn die Geschwindigkeiten nicht in Einheiten der Lichtgeschwindigkeit gemessen werden, erhält die Lamorsche Formel einen Faktor c13 .
15.4 Sei
Allgemeinere Beispiele z˙ μ (τ0 ) = (γ, 0, 0, γv)
ν = ν (t)
z˙ 2 = 1
Zur Zeit τ0 ist ~ν in z-Richtung, zu einer späteren Zeit kann die Richtung anders sein (z.B. wenn die Beschleunigung z¨ in x-Richtung erfolgt). Da z˙ 2 = 1, gilt wieder (z, ˙ z¨) = 0 zu erfüllen. Wähle wieder o.B.d.A. z (τ0 ) = (0, 0, 0, 0), d.h. wir betrachten die Strahlung, die von einem Teilchen stammt, das sich zur Zeit t = 0 bei ~x = 0 befand und sich in z-Richtung bewegte. Die Lichtkegelbedingung ergibt 2 2 2
0 = (x − z (τ0 )) = x0 − z 0 (τ0 ) − ~x − ~z (τ0 ) | {z } | {z } =0
→ x =r
=0
(r = |~x|)
0
Betrachte 2 exemplarische Möglichkeiten (z, ˙ z¨) = 0 zu erfüllen: → − → − 1. z˙ (τ0 ) = (γ, 0, 0, γv) , z¨ = a(0, 1, 0, 0) , z¨ ⊥ z˙ Synchrotronstrahlung → − → − 2. z¨ = a(v, 0, 0, 1) , z¨ k z˙ Linearbeschleuniger
1. Synchrotronstrahlung: Bei einer Kreisbahn ist die Beschleunigung senkrecht zur Geschwindigkeit. Wir wählen z (τ0 ) = (0, 0, 0, 0) , x = (x0 , ~x) mit x0 = r z˙ (τ0 ) = (γ, 0, 0, γv) z¨ (τ0 ) = a (0, 1, 0, 0) , Dann ist (z, ˙ z) = (¨ z , z) = 0, (z, ˙ z¨) = 0, (z, ˙ x − z) |τ0 = (z, ˙ x) |τ0
= γ x 0 − x3 ν = γ (r − νr cos θ)
(x0 = r) (Polarkoordinaten)
15.4 Allgemeinere Beispiele und Damit wird
195
(¨ z , x − z) |τ0 = (¨ z , x) = ax1 = ar sin θ cos ϕ, z¨2 = −a2 . z¨ T00
" 2 # −q 2 (x − z)0 (x − z)0 2 (¨ z , x − z) = z¨ + 4 4π (z, ˙ x − z) (z, ˙ x − z) ret ( ) 2 2 2 2 2 q 1 sin θ cos ϕ r a = 1− 2 . 4π [γ (r − νr cos θ)]4 γ (1 − ν cos θ)2
Da γ12 = (1 − v 2 ) für v → 1 sehr klein ist, erhalten wir für große Geschwindigkeiten ein starkes Vorwärtsmaximum (θ = 0, v → 1).
Abbildung 15.4: Synchrotronstrahlung
2. Linearbeschleuniger: Dieser Fall entspricht einer Lorentz-Transformation der oben besprochenen Strahlung im Ruhsystem auf ein schnell bewegtes System. Man erhält ein gespaltenes Vorwärtsmaximum.
Abbildung 15.5: Strahlung einer linear beschleunigten Punktladung
Kapitel 16
Maxwell-Gleichungen in Materie 16.1
Mittelung
Die Maxwell-Gleichungen sind universell gültig. In einer typischen makroskopischen Messung kommt eine Messsonde von einer Dimension ΔV ∼ (10−2 )3 cm3 zur Anwendung. In diesem Volumen befinden sich ∼ 1018±3 Ladungen (e− , p+ ). Es technisch unmöglich und physikalisch völlig uninteressant, die Maxwell-Gleichungen in einer solchen Situation exakt zu lösen. Stattdessen ist es sinnvoll, über das Volumen der Messsonde zu mitteln und nur gemittelte Felder und Quellen zu betrachten. Die Ladungen im Messvolumen bewegen sich sehr rasch. Eine räumliche Mittelung würde aber zu jedem Zeitpunkt dasselbe Ergebnis liefern. Wenn sich die Moleküle relativ zur Lichtgeschwindigkeit sehr langsam bewegen, was in den meisten Situationen der Fall ist, braucht man die Zeitabhängigkeit nicht in die Mittelung einzubeziehen. Damit vernachlässigt man die sehr kleinen Strahlungs- und Induktionsverluste. Wir betrachten Materie, die aus Elementen besteht (Atome, Moleküle), deren Gesamtladung verschwindet. Mögliche Überschussladungen können sich bewegen und bilden dann einen Strom. ~ x, t), B(~ ~ x, t), ρ(~x, t), ~j(~x, t) die mikroskopischen Felder und Quellen sind, dann Wenn E(~ lauten die mikroskopischen Maxwell-Gleichungen ~ ∙ E(~ ~ x, t) = 4πρ(~x, t), ∇ ~ ∙ B(~ ~ x, t) = 0, ∇
~ x, t) = 0 ~ × E(~ ~ x, t) + 1 ∂ B(~ ∇ c ∂t ~ × B(~ ~ x, t) − 1 ∂ E(~ ~ x, t) = 4π ~j(~x, t) . ∇ c ∂t c
Da die Zeitabhängigkeit nicht in die Mittelung eingeht, unterdrücken wir sie der Einfachheit halber oft im Folgenden. Die räumliche Mittelung einer Funktion F (~x) kann
198
Kapitel 16. Maxwell-Gleichungen in Materie
wie folgt durchgeführt werden: hF (~x)i =
Z
d3 xf (~x − ~x0 )F (~x0 ) ,
(16.1)
wo f (~x − ~x0 ) eine Testfunktion sein soll, die um ~x0 = ~x konzentriert ist, beziehungsweise f (~x0 ) um ~x0 = 0. Für die Anwendung hier werden folgende Eigenschaften der Testfunktion f (~x) verlangt: f (~x) = f (|~x|) Z
f (~x) ≥ 0
d3 x f (~x) = 1 f (~x) 6= 0
Normierung nur für |~x| < 10−6 cm3
Beispiele: f (~x) =
3 4πR3
(Größe der Messsonde)
rR
0
Diese Testfunktion ist ungünstig, sie führt zu „Zittern“. Besser wäre eine GaussVerteilung f (~x) = (πR)
−3 2
r2
e − R2
Die Testfunktion f (~x) sollte beliebig oft differenzierbar sein. Die Mittelung ist unabhängig von der Form der Testfunktion, so lange das Gebiet in dem f (~x) 6= 0 und das Gebiet indem f (~x) abfällt viel größer ist als die atomare Dimension (damit die TaylorReihe konvergiert, siehe unten). Wir erstzen in der Definition der Mittelung Gl. (16.1) ~x0 → ~x0 + ~x und erhalten Z hF (~x)i = d3 x0 f (~x0 )F (~x + ~x0 ) . Jetzt ist f (~x0 ) um ~x0 = 0 zentriert. Die Mittelung vertauscht mit der Ableitung, D E D E D E ~ hF (~x)i = ∇F ~ (~x) , ~ × F~ (~x) = ∇ ~ × F~ (~x) . ∇ ∇ Beweis der ersten Relation: D E Z ~ (~x) = d3 x0 f (~x0 )∇ ~ x+x0 F (~x + ~x0 ) ∇F Z ~ x F (~x + ~x0 ) = ∇ ~ hF (~x)i . = d3 x0 f (~x0 )∇
Dann lauten die gemittelten Maxwell-Gleichungen: D E D E D E ~ ∙ E(~ ~ x, t) = 4π hρ(~x, t)i , ~ × E(~ ~ x, t) + 1 ∂ B(~ ~ x, t) = 0 ∇ ∇ c ∂t D E D D E 1 ∂ D E E ~ ∙ B(~ ~ x, t) = 0, ~ × B(~ ~ x, t) − ~ x, t) = 4π ~j(~x, t) ∇ ∇ E(~ c ∂t c
16.2 Mikroskopisches Modell
199
D E Die gemittelten Dichten hρ(~x, t)i und ~j(~x, t) hängen von den Feldern ab und müssen mit einem atomistischen Modell der Materie berechnet werden. Die Mittellung müsste über quantenmechanische Ensembles erfolgen, wir beschränken uns auf ein einfaches Modell.
16.2
Mikroskopisches Modell
Ladungsdichte: Die Materie besteht aus freien Ladungen ρf rei (~x) (Elektronen, Ionen), auch Überschussladungen genannt, und Ladungen ρmol (~x), die an die Moleküle gebunden sind, d.h. (e− , p+ ). Die mikroskopische Ladungsdichte ist also ρ(~x) = ρf rei (~x) + ρmol (~x) . Die Ladungsdichte der freien Ladungen ist gegeben durch X qk δ 3 (~x − ~x(k) ) , ρf rei (~x) = k
wo sich die Summe über k über alle freien Ladungen mit Koordinaten ~x(k) im Messvolumen ΔV erstreckt. Die molekulare Ladungsdichte ist ρmol (~x) =
N X
ρn (~x) , mit
ρn (~x) =
n=1
X j
(n)
qj
(n)
δ 3 (~x − ~xj ) ,
wo sich die Summe über j über alle Elektronen und Protonen im Molekül n erstreckt und die Summe über n über alle N Moleküle im Messvolumen ΔV geht . Wir mitteln zunächst über die Ladungsdichte des Moleküls n und summieren dann über alle Moleküle im Messvolumen ΔV .
Abbildung 16.1: Molekül im Dielektrikum (n)
Sei ~x(n) ein beliebiger aber fester Punkt im Molekül n und ~xj Ladung j im Molekül n. Der Differenzvektor (n)
~xj
(n) Δ~xj (n)
= ~x(n) + Δ~xj
die Koordinate der
ist definiert durch .
200
Kapitel 16. Maxwell-Gleichungen in Materie
Dann ergibt sich für die molekulare Ladung: Z hρn (~x)i = d3 x0 f (~x0 )ρn (~x + ~x0 ) X (n) Z (n) qj d3 x0 f (~x0 )δ 3 (~x − ~xj + ~x0 ) = j
=
X
(n)
j
=
X j
=
X j
(n)
qj f (~xj
− ~x) =
(n)
X j
(n)
(n)
qj f (~x − ~xj ) , da
f (~x) = f (|~x|)
(n)
qj f (~x − ~x(n) − Δ~xj ) (n)
(n)
qj [f (~x − ~x(n) ) − Δ~xj
~ (~x − ~x(n) ) + ...]. ∙ ∇f
Es ist qn =
X
(n)
Ladung des Moleküls; qn = 0, da das Molekül neutral ist,
qj ,
j
p~n =
X
(n)
(n)
qj Δ~xj
Dipolmoment des Moleküls n
j
und damit ~ (~x − ~x(n) ) + ... . hρn (~x)i = −~ pn ∙ ∇f Dieses Ergebnis lässt sich anders schreiben: D E ~ ∙ p~n δ 3 (~x − ~x(n) ) + ... hρn (~x)i = −∇
(16.2)
(16.3)
Beweis:
D
Z E p~n δ 3 (~x − ~x(n) ) = p~n d3 x0 f (~x0 )δ 3 (~x − ~x(n) + ~x0 ) = p~n f (~x(n) − ~x) = p~n f (~x − ~x(n) )
Die Taylor-Entwicklung ist fast überall in ΔV erlaubt, außer in dem vernachlässigbaren Bereich, wo ~x direkt im Molekül liegt. Jetzt können wir über alle Moleküle im Messvolumen ΔV summieren, hρmol (~x)i =
*
N X
ρn (~x)
n=1
+
=
N X
n=1
hρn (~x)i .
Die PN Mittelung ist linear und vertauscht daher mit der Summation. Setzen wir für x)i aus Gl. (16.3) ein so erhalten wir n=1 hρn (~ ~ ∙ hρmol (~x)i = −∇
XD n
E p~n δ 3 (~x − ~x(n) ) + ... .
16.2 Mikroskopisches Modell
201
Dazu kommt noch die Mittelung über die freien Ladungen in ΔV , * + X qk δ 3 (~x − ~x(k) ) . hρf rei (~x)i = k
Damit erhalten wir schließlich + * E XD X ~ ∙ qk δ 3 (~x − ~x(k) ) − ∇ p~n ∙ δ 3 (~x − ~x(n) ) , hρ(~x)i = wo die Summe
X
(16.4)
n
k
sich über alle freien Ladungen in ΔV und die Summe
X
sich über
n
k
alle Moleküle in ΔV erstreckt.
Der erste Term ist die makroskopische freie oder Überschussladungsdichte hρf rei (~x)i und der zweite Term ist die Divergenz der Polarisation oder mittleren Dipoldichte, E D E XD p~n ∙ δ 3 (~x − ~x(n) ) . P~ (~x) ≡ n
Wenn wir die Zeitabhängigkeit wieder mitnehmen, lautet Gl. (16.4) dann: D E ~ ∙ P~ (~x, t) . hρ(~x, t)i = hρf rei (~x, t)i − ∇
(16.5)
Damit erhalten wir für die 1. makroskopische Maxwell-Gleichung: D E h D Ei ~ ∙ E(~ ~ x, t) = 4π hρf rei (~x, t)i − ∇ ~ ∙ P~ (~x, t) ∇
oder
~ ∙ ∇
hD
E D Ei ~ x, t) + 4π P~ (~x, t) = 4π hρf rei (~x, t)i . E(~
Die makroskopische Stromdichte: Für die mikroskopische Stromdichte gilt: ~j(~x, t) = ~jf rei (~x) + ~jmol (~x) mit ~jf rei (~x) =
X k
~jmol (~x) =
qk~vk δ 3 (~x − ~x(k) )
XX n
j
(n) (n)
qj ~vj
(n)
δ 3 (~x − ~xj )
Die Summe über k erstreckt sich über alle freien Ladungen qk , die sich im Messvolumen ΔV mit Geschwindigkeit ~vk bewegen. Bei der molekularen Stromdichte erstreckt sich die Summe über j über alle Elektronen und Protonen im Molekül n. Die Summe über n geht über alle N Moleküle im Messvolumen ΔV . Wenn wir mitteln, wird E D E D E D ~j(~x, t) = ~jf rei (~x) + ~jmol (~x) .
202
Kapitel 16. Maxwell-Gleichungen in Materie
Eine ähnliche Rechnung (siehe z.B. Honerkamp 1993) wie für die Ladung führt zu E E D D ~ ~ × m ~jmol (~x) = ∂ P (~x) + c∇ ~ (n) δ(~x − ~x(n) ) + ... , ∂t
wo
m ~ (n) =
. (n) 1 X (n) (n) qj (Δ~xj × Δ~xj ) 2c j
das magnetische Moment der Stromverteilung im Molekül n ist. Die über das Messvolumen ΔV gemittelte Dipoldichte bezeichnet man als Magnetisierung, D E ~ (~x, t) = Pm ~ (n) δ(~x − ~x(n) ) (~x, t) . M n
Damit werden
D E D E ∂ P~ (~x, t) D E ~ × M ~ (~x, t) + ... ~jmol (~x) = + c∇ ∂t D E E ∂ P~ (~x, t) D E D E D ~ × M ~ (~x, t) + ... ~j(~x, t) = ~jf rei (~x, t) + + c∇ ∂t Die 4. Maxwellgleichung geht über in " # D E 1 ∂ D E ∂hP~ (~x, t)i E 4π D ~ ~ x, t) − ~ x, t) = ~ × hM ~ (~x, t)i + .. , ~jf rei (~x) + ∇× B(~ E(~ + c∇ c ∂t c ∂t oder ~ × ∇
hD
E hD D E D Ei E D Ei ~ x, t) + 4π P~ (~x, t) = 4π ~jf rei (~x) . ~ x, t) − 4π M ~ (~x, t) − 1 ∂ E(~ B(~ c ∂t c
Es liegt nahe, folgende Definitionen einzuführen.
Die dielektrische Verschiebung: D E D E D E ~ ≡ E ~ + 4π P~ D
und das magnetische H-Feld: D E D E D E ~ ≡ B(~ ~ x) − 4π M ~ . H
Dann lauten die makroskopischen Maxwell-Gleichungen: D E D E D E ~ = 0, ∇ ~ ∙ D ~ = 4π hρf rei i ~ × E ~ +1∂ B ∇ c ∂t D E D E D E ~ ∙ B ~ = 0, ~ × H ~ = 4π ~jf rei + ∇ ∇ c
1 ∂ c ∂t
D E ~ D
(16.6)
Die gemittelten Felder sind per Definition die makroskopischen Felder. Wir können im Folgenden auch die hi-Klammern der Mittelung weglassen, wenn wir vereinbaren, dass
16.2 Mikroskopisches Modell
203
wir von nun an nur noch über gemittelte Felder sprechen. Der Konvention folgend, lassen wir auch den Index f rei weg. Historisch bedingt wird das H-Feld oft als magne~ tische Feldstärke bezeichnet. Diese irreführende Notation wollen wir vermeiden, da B ~ ~ das fundamentale Feld ist. Die Überschussladungen sind die Quellen des D-Feldes. D ~ + 4π P~ . ist auch nur eine Hilfsgröße, eine Abkürzung für E Wir schreiben die makroskopischen Maxwell-Gleichungen noch einmal mit der neuen Konvention auf: ~ = 0, ~ ×E ~+1∂B ∇ c ∂t ~ ~ ∇ ∙ B = 0,
~ ∙D ~ = 4πρ ∇ ~ ~ = 4π ~j + ∇×H c
1 ∂ ~ c ∂t D
(16.7)
~ und E ~ und H ~ Um Gl. (16.7) zu lösen, braucht man den Zusammenhang zwischen D ~ ~ und B. Da P das gemittelte induzierte Dipolmoment der Moleküle ist, gilt, außer für ~ = 0. Man kann also für kleine Felder (relativ zu den Elektrete, dass P~ = 0 für E intermolekularen Feldern von ∼ 109 V /cm) P~ in eine Potenzreihe entwickeln, Pi = aik Ek + bikj Ek Ej + ... Für die üblichen Felder ist der zweite und höhere Terme vernachlässigbar. Für isotrope Substanzen ist aik = χe δik oder ~ , P~ = χe E wo χe als elektrische Suszeptibilität bezeichnet wird. Daneben definiert man eine weitere Materialgröße, die Dielektrizitätskonstante ε = 1 + 4πχe . ~ ≡E ~ + 4π P~ die einfache Beziehung Dann erhält man für D ~ = εE. ~ D Im Allgemeinen ist ε = ε(~x). Für homogene Medien ist ε konstant. Dann lautet die 1. Maxwell-Gleichung: ~ ∙E ~ = 4πρ ε∇ (16.8)
Für ε = konst. erhalten wir eine Gleichung wie im Vakuum, nur ρ → ρ/ε. Typische Werte der Dielektrizitätskonstanten sind Luft: ε = 1.00054 Wasser: ε = 80 Glas: ε = 5 − 10 ~ und B ~ Analog gilt für kleine Magnetfelder eine lineare Beziehung zwischen H ~ = 1 B, ~ H μ
204
Kapitel 16. Maxwell-Gleichungen in Materie
wo μ die Permeabilität ist. Für gewöhnliche Substanzen ist μ nur wenig von 1 verschieden. Für Ferromagnete ist μ ∼ 10 − 103 . Grenzbedingungen: Wir betrachten die Grenzfläche zwischen zwei dielektrischen oder magnetischen Medien. Um die Stetigkeitsbedingungen für die Normalkomponenten abzuleiten, wenden wir den Gaußschen Satz auf eine gedachte winzige flache Dose an, die parallel zur Grenzfläche liegt. Dann gilt: Z Z 3 ~ ~ ~ ∙ d~a = 0 (da ρ = 0) ∇ ∙ Dd x = D V
∂V
oder
~ 1 ∙ ~n = 0. ~2 − D D
Wir haben angenommen, dass keine Oberflächenladungen vorhanden sind.
Abbildung 16.2: Normalkomponenten an einer Grenzfläche
~ ∙B ~ =0 Analog folgt aus ∇
~2 − B ~ 1 ∙ ~n = 0. B
~ und B ~ sind stetig an der Grenzfläche: Die Normalkomponenten von D ~ ⊥ ist stetig ~ ⊥ ist stetig, B D Um die Grenzbedingungen für die Tangentialkomponenten der Felder abzuleiten, wenden wir den Stokesschen Satz auf ein kleines Rechteck, dessen Breite gegen Null geht und das senkrecht zur Grenzfläche steht, an: Z Z ~ ×H ~ ∙ d~a = H ~ ∙ d~s = H1t − H2t ×L¨ ange ∇ C
[F l¨ ache]
= Differenz der Tangentialkomponenten × Länge Z ∂ ~ 1 ∂ ~ = D ∙ d~a = 0 da D nicht singulär ist. c ∂t ∂t C
Dabei haben wir vorausgesetzt, dass keine Oberflächenströme vorhanden sind. Analog ~ ×E ~ = − 1 ∂ B, ~ dass erhält man aus ∇ c ∂t Z ~ ∙ d~s = E1t − E2t ×L¨ ange = 0. E C
16.2 Mikroskopisches Modell
205
Abbildung 16.3: Rechteckkurve senkrecht zur Grenzfläche
~ und H ~ sind also stetig an der Grenzfläche: Die Tangentialkomponenten von E Hk ist stetig, Ek ist stetig Oft genügen ein oder zwei dieser Bedingungen, die anderen bringen nichts Neues.
Kapitel 17
Ebene Elektromagnetische Wellen 17.1
Die Wellengleichung
In Abwesenheit von Quellen erlauben die Maxwellgleichungen Wellenlösungen für ~ (~x, t) und B ~ (~x, t) und damit Energietransport. Sei ρ = 0 und ~j = 0, dann lauE ten die Maxwellgleichungen für ein nichtleitendes Medium mit räumlich und zeitlich konstanter Dielektrizitätskonstante ε und magnetischer Permeabilität μ ~ ∙E ~ =0 ∇ ~ ∙B ~ =0 ∇ ~ ~ ×E ~ + 1 ∂B = 0 ∇ c ∂t ~ ~ ×B ~ − με ∂ E = 0 . ∇ c ∂t
(17.1) (17.2) (17.3) (17.4)
Um diese Differentialgleichungen zu entkoppeln, leiten wir die Gleichung (17.4) nach der Zeit ab 2~ 1 ∂ ~ 1 ∂ ~ − με ∂ E = 0 . (17.4) : ∇×B c ∂t c ∂t c2 ∂t2 Mit Gl. (17.3) folgt 2~ ~ × ∇ ~ ×E ~ − με ∂ E = 0 . −∇ 2 c ∂t2 ~ × ∇ ~ ×E ~ = ∇ ~ ∇ ~ ∙E ~ − ∇2 E ~ und die Gleichung (17.1) Wenn wir die Formel ∇ verwenden, dann erhalten wir die Wellengleichung 1 ∂2 ~ ∇2 − 2 2 E =0, v ∂t
(17.5)
208
Kapitel 17. Ebene Elektromagnetische Wellen
wo
c v≡ √ . με
~ (~x, t) die Wellengleichung Auf analoge Weise finden wir, dass auch das Magnetfeld B erfüllt, − 1 ∂2 → 2 ∇ − 2 2 B =0. (17.6) v ∂t Es wird sich zeigen, das v die Ausbreitungsgeschwindigkeit der Welle (Lichtgeschwindigkeit) im Medium ist. Lösungsansatz: Es liegt nahe für die Lösungen ebene, monochromatische Wellen anzusetzen, ~ (~x, t) = E ~ 0 ei(~k∙~x−ωt) E ~ (~x, t) = B ~0 e B
(17.7)
k∙~ x−ωt) , i(~
dabei ist ω die Kreisfrequenz und ~k der Wellenvektor. Einsetzen des Lösungsansatzes in die Wellengleichung ergibt die Bedingung ~k 2 = ω 2 /v 2 , oder k = |~k| =
ω √ ω = με . v c
(17.8)
Man bezeichnet den Faktor in der Exponentialfunktion ϕ ≡ ~k ∙ ~x − ωt
(17.9)
als Phase. Punkte konstanter Phase (Wellenfront) bewegen sich mit Geschwindigkeit v = ωk = √cμε in Richtung ~k. Sei z.B. ~k = k~ex dann sind die Punkte konstanter Phase bestimmt durch kx = ωt + konst. dx ω ⇒ = dt k
Punkt mit konstanter Phase
Die Flächen konstanter Phase sind Ebenen senkrecht zu ~k (klar für ~k in x-Richtung), daher die Bezeichnung „ebene Welle“. Bemerkungen: a) Die Wellengleichung ist linear in den Feldern, d.h. auch Superpositionen von ebenen ~ 2 (~x, t) Lösungen der Wellen~ 1 (~x, t) und E Wellen lösen die Gleichung. Sind z.B. E ~ ~ gleichung, dann auch E1 (~x, t) + E2 (~x, t). b) Die Dielektrizitätskonstante ε und damit die Phasengeschwindigkeit hängt im Allgemeinen von der Frequenz ab. Monochromatische Wellen sind unendlich ausgedehnt. Wellenpakete, d.h. endliche Wellenzüge erhält man durch Überlagerung von ebenen Wellen verschiedener Frequenz. Die Frequenzabhängigkeit von v führt zu einem Zerfließen, Dispersion genannt, des Wellenpakets.
17.1 Die Wellengleichung
209
c) Die Wellenlösungen sind in komplexer Form geschrieben. Da der Differentialoperator ~ ∗ die Wellengleichungen und damit auch Real~ ∗ und B reell ist, erfüllen auch E und Imaginärteil der Felder. Gemessen werden nur reelle Felder. Die Einführung von komplexen Feldern dient nur der mathematischen Vereinfachung. Dies muss man unterscheiden von den Wellenfunktionen der Quantenmechanik, die originär komplex sind. Physikalische Felder werden konventionellerweise mit dem Realteil der Felder verbunden, z.B. ~ . ~ phys = Re E E Der Ansatz ebener monochromatischer Wellen, Gl. (17.7), mit den Bedingungen (17.8) und (17.9) erfüllt zwar die Wellengleichung. Das ist aber noch nicht hinreichend, da aus den vollen Maxwellgleichungen noch zusätzliche Bedingungen folgen. Um diese abzuleiten, benötigen wir die Zeitableitung der ebenen Wellen, ~ ∂E ~ , = −iω E ∂t und die Raumableitung ∇ l Ei =
∂ ~ E0 ei(kj xj −ωt) = E0i ikj δlj ei(k∙~x−ωt) = ikl Ei . ∂xl i
Damit gilt ~ ∙E ~ = i~k ∙ E ~ ∇ ~ ×E ~ = i~k × E ~ ∇
~ (analog für B).
Aus den Maxwell-Gleichungen ergeben sich die Bedingungen ~ ∙E ~ (~x, t) = 0 ⇒ ~k ∙ E ~ =0 ∇ ~ ~ = ωB ~ ~ ×E ~ = − 1 ∂ B ⇒ ~k × E ∇ c ∂t c ~ ∙B ~ = 0 ⇒ ~k ∙ B ~ =0 ∇ ~ ~ = − με ω E ~ . ~ ×B ~ = + με ∂ E ⇒ ~k × B ∇ c ∂t c
(17.10) (17.11) (17.12) (17.13)
Diese Bedingungen bedeuten, dass a) b) c)
~k, E, ~ und B ~ jeweils senkrecht aufeinander stehen, ~ und B ~ relativ zueinander in Phase sind (wegen (17.11)oder(17.13)), E der Poynting-Vektor (Energietransport) → − c ~ ~ S = E×H 4π
in Richtung ~k zeigt, → − ~ d) die Amplituden E und B im konstanten Verhältnis zueinander stehen(17.11), − ~ ω ω ~ → (k = ). B = k E c v
210 D.h.
Kapitel 17. Ebene Elektromagnetische Wellen c c ~ ~ , oder B0 = E0 . B = E v v
Das Verhältnis von Lichtgeschwindigkeit im Vakuum zu der im Medium, n=
c √ = με , v
heißt Brechungsindex, weil, wie wir sehen werden, es die Stärke der Brechung beim Übergang der Welle von einem Medium zum anderen bestimmt.
Abbildung 17.1: Elektromagnetische Welle
Energietransport einer elektromagnetischen Welle: Die übertragene Energie einer komplexen Welle ist bestimmt durch dem PoyntingVektor ~ × (Re H) ~ . ~ = c (Re E) S 4π Meist beobachtet man nur über die Zeit t gemittelte Felder. Dann gilt für den zeitlich gemittelten Poynting-Vektor → − 1 c ~ ~∗ . hS i = E×H 2 4π
17.2
Polarisation
Die fundamentale Lösung der Wellengleichung ist eine linear polarisierte Welle ~ = ~εE0 ei(~k∙~x−ωt) , E ~ ist und E0 komplex sein kann (dann ist E ~ immer wo ~ε ein Einheitsvektor in Richtung E noch Lösung der Wellengleichung) E0 = |E0 | eiϕ . Dies führt zu einer Phasenverschiebung ~ = ~ε |E0 | ei(~k∙~x−ωt+ϕ) . E
17.2 Polarisation
211
~ schwingt stets in einer Richtung in der Ebene senkrecht zu ~k. Für einen allgemeinen E Polarisationszustand benötigt man zwei linear unabhängige linear polarisierte Wellen, ~ 1 = ~ε1 E1 ei(~k∙~x−ωt) E ~ 2 = ~ε2 E2 ei(~k∙~x−ωt) E o.B.d.A. ~ε1 ∙ ~ε2 = 0 E1 und E2 können komplex und relativ zueinander phasenverschoben sein. Die allgemeine Lösung lautet dann ~ (~x, t) = (~ε1 E1 + ~ε2 E2 ) ei(~k∙~x−ωt) . E Wir betrachten verschiedene Möglichkeiten: a) Lineare Polarisation: E1 und E2 haben dieselbe Phase. b) Zirkularpolarisation: E1 und E2 haben den selben Betrag, sind aber um 90◦ phasenverschoben: ~ (~x, t) = E0 (~ε1 ± i~ε2 ) ei(~k~x−ωt) E E0 kann reell angenommen werden. Wir wählen ein Koordinatensystem, so dass ~ε1 in x-Richtung, ~ε2 in y-Richtung und ~k in z-Richtung liegen. Das physikalische Feld ist gegeben durch: Re Ex (~x, t) = E0 cos (kz − ωt) Re Ey (~x, t) = ∓ E0 sin (kz − ωt) ~ mit Frequenz ω. Es gibt zwei Für einen festen Punkt ~x (z.B. ~x = 0) dreht sich E Möglichkeiten linkshändige Polarisation, positive Helizität ~ε1 + i ~ε2 ~ε1 − i ~ε2 rechtshändige Polarisation, negative Helizität (Blick auf entgegenkommende Welle) ~ Ephys. ist konstant für einen festen Punkt ~x:
2 ~ 2 2 Ephys. = (Re Ex ) + (Re Ey )
= E02 cos2 (kz − ωt) + E0 sin2 (kz − ωt)
= E02
c) Ist E1 6= E2 und die Phase beliebig, dann erhält man elliptische Polarisation .
212
17.3
Kapitel 17. Ebene Elektromagnetische Wellen
Brechung und Reflexion
In diesem Abschnitt wollen wir das Verhalten von elektromagnetischen Wellen bei Übergang von einem Dielektrikum zu einem anderen, die durch eine ebene Grenzfläche getrennt sind, betrachten. Dabei sind folgende, im Kapitel 13 abgeleitete, Grenzbedingungen von Bedeutung: ~ ⊥ sind stetig ~ ⊥ und B D ~ k und E ~ k sind stetig H
Abbildung 17.2: Reflexion und Brechung an einer Grenzfläche
Die (x, y)-Ebene (z = 0) sei die Grenzfläche, und die (x, z)-Ebene (y = 0) die Einfallsebene, in der ~k1 liegt. Die Grenzbedingungen können nur erfüllt werden, wenn auch alle anderen Wellenvektoren in der Einfallsebene liegen: ~ ein = E ~ 1 ei(k1z z+k1x x−ωt) ~ 1 ei(~k1 ~x−ωt) = E E ~ 1 ei(k1 cos θ1 z+k1 sin θ1 x−ωt) =E ~ aus = E ~ 2 ei(k2 cos θ2 z+k2 sin θ2 x−ωt) E Es stellt sich heraus, dass man mit diesen beiden Wellen noch nicht die Grenzbedingungen erfüllen kann. Man braucht noch eine reflektierte Welle ~ 0 ei(−k10 cos θ10 z+k10 ~ ref l. = E E 1
sin θ10 x−ωt)
.
Für den Wellenvektor muss k10 = k1 sein, da k = ωv . Wir müssen für alle Wellen dieselbe Frequenz ansetzen, da es sonst unmöglich wäre die Grenzbedingungen für alle t zu erfüllen. Es ist auch intuitiv einsichtig, dass Wellen beim Übergang von einem Medium in ein anderes im Gleichklang schwingen. ~ k folgt für z = 0: Aus der Stetigkeit von E Exein + Exref l = Exaus ∀ x, t ~ 2 ei(k2 sin θ2 x−ωt) . ~ 1 ei(k1 sin θ1 x−ωt) + E ~ 10 ei(k1 sin θ10 x−ωt) = E E x
x
x
17.3 Brechung und Reflexion
213
Da die Grenzbedingungen bei z = 0 für alle x, t erfüllt sein müssen, folgt, dass die xund t-Abhängigkeit bei z = 0 für alle Felder gleich sein muss, d.h. dass die Phasen gleich sein müssen, k1 sin θ1 = k1 sin θ10 = k2 sin θ2 . Es folgt das Reflexionsgesetz : Der Einfallswinkel ist gleich dem Ausfallwinkel, θ1 = θ10 . Die Bedingung k1 sin θ1 = k2 sin θ2 ergibt sin θ1 / sin θ2 = k2 /k1 = (ω/v2 ) / (ω/v1 ) =
v1 . v2
Dies ist das Brechungsgesetz von Snellius, n2 sin θ1 = , sin θ2 n1 wo
ni =
√
εi μi =
c , vi
i = 1, 2
der Brechungsindex (>1) ist. Für n1 > n2 kann es passieren, dass sin θ2 =
n1 sin θ1 > 1. n2
Der Einfallwinkel θ1 für θ2 = π/2 heißt Grenzwinkel. Er ist definiert durch sin θ1 =
Für
n1 n2
n2 n1
(für sin θ2 = 1).
> 1 ist sin θ2 > 1 reell und cos θ2 = k2 cos θ2 = k2
Dann ist die gebrochene Welle
q
p 1 − sin2 θ2 rein imaginär. Wir schreiben
1 − sin2 θ2 = ik2
q
sin2 θ2 − 1 ≡ iγ .
~ 2 ei(k2 sin θ2 x−ωt) e−γz ~ aus = E E ~ 2 ei(k2 (n2 /n1 )x−ωt) e−γz =E in z-Richtung exponentiell gedämpft. Es existiert jedoch eine Oberflächenwelle in xRichtung. Es gilt: Poynting-Vektor|ein = Poynting-Vektor|ref l. ~ ~0 (s.u. Fresnelsche Formeln) E1 = E 1
d.h. die gesamte Energie wird reflektiert. Die Totalreflexion findet z.B. Anwendung bei Glasfaserkabeln.
214
17.4
Kapitel 17. Ebene Elektromagnetische Wellen
Die Fresnelschen Formeln
Die Fresnelschen Gleichungen sind Bedingungen an die Amplituden, die aus der Stetigkeit von Ek und Hk folgen. Die (x, z)-Ebene sei wieder die Einfallsebene, in der alle ~ki liegen und die z = 0 Ebene sei die Grenzfläche. Eine ebene elektromagnetische Welle hat zwei unabhängige Polarisationszustände. Daher betrachten wir zwei Fälle: a) ~ 1 ⊥ zur Einfallsebene E ~ 1 k zur Einfallsebene) (B
b)
~ 1 ⊥ zur Einfallsebene B ~ 1 k zur Einfallsebene) (E ~ 1 senkrecht zur Einfallsebene: Fall a) Sei E
Abbildung 17.3: Fall a): Reflektierte und gebrochene Welle. Alle elektrischen Felder zeigen ~ in die Papierebene (⊕ bedeutet Pfeilende des Vektors E)
~ tangential bezüglich der Grenzfläche sind, d.h. Wir machen den Ansatz, dass alle E ~ Ek = E = E. Da die Phasen gleich sind, bedeutet die Stetigkeit von Ek , dass E1 + E10 = E2 .
(17.14)
Die Stetigkeit von Hk liefert − H1 cos θ1 + H10 cos θ1 = − H2 cos θ2 , q oder, da für ebene Wellen H = με E, r
ε1 (E1 − E10 ) cos θ1 = μ1
r
ε2 E2 cos θ2 . μ2
(17.15)
17.4 Die Fresnelschen Formeln
215
Mit Hilfe der zwei Gleichungen (17.14) und (17.15) kann man E10 und E2 durch E1 ausdrücken. Das Ergebnis sind die 1. Fresnelschen Formeln,
wo
E10 =
a cos θ1 − cos θ2 E1 a cos θ1 + cos θ2
(17.16)
E2 =
2a cos θ1 E1 , a cos θ1 + cos θ2
(17.17)
p
ε1 /μ1
a= p
Anmerkungen:
ε2 /μ2
=
μ2 n1 μ1 n 2
(n =
√
με) .
~ 0 das Vorzeichen relativ zu E ~ 1 . Man sagt E ~ 0 ist um 1. Für cos θ2 > a cos θ1 ändert E 1 1 ◦ iπ π(= 180 ) phasenverschoben (e = −1). θ2 2. Für optische Frequenzen ist μ1 ' μ2 ' 1 und a = nn12 = sin sin θ1 . Dann wird E10 =
sin θ2 cos θ1 − sin θ1 cos θ2 − sin (θ1 − θ2 ) E1 = E1 sin θ2 cos θ1 + sin θ1 cos θ2 sin (θ1 + θ2 )
(17.18)
2 sin θ1 cos θ1 E1 sin (θ1 + θ2 )
(17.19)
E2 =
~ 1 senkrecht zur Einfallebene: Fall b) Sei H
Abbildung 17.4: Fall b): Reflektierte und gebrochene Welle. Alle magnetischen Felder zeigen ~ aus der Papierebene heraus ( bedeutet Pfeilspitze des Vektors H)
Fall b) braucht nicht explizit gelöst zu werden,wegen der Invarianz der Maxwellgleichungen (17.1)- (17.4) unter der Ersetzung ~ → H, ~ E
~ → −E, ~ H
ε ↔ μ,
(n → n) .
216
Kapitel 17. Ebene Elektromagnetische Wellen
Mit dieser Substitution gehen die Gln. (17.16) und (17.17) über in H10 =
b cos θ1 − cosθ2 H1 b cos θ1 + cosθ2
H2 =
2b cos θ1 H1 b cos θ1 + cos2
mit
p μ1 /ε1 μ 1 n2 b≡ p = . μ2 n1 μ2 /ε2 q ε 0 Für ebene Wellen war H = μ E. Man kann damit wieder E1 und E2 durch E1
ausdrücken und erhält die 2. Fresnelschen Formeln, E10 =
b cos θ1 − cosθ2 E1 b cos θ1 + cosθ2
(17.20)
E2 =
2 cos θ1 E1 . b cos θ1 + cos2
(17.21)
Rechnerische Details: H 2 = ∙ ∙ ∙ H1
→
r
ε2 E2 = ∙ ∙ ∙ μ2
r
ε1 E1 → E2 = ∙ ∙ ∙ μ1
s
ε1 /μ1 E1 . ε2 /μ2 | {z } = 1b
Für optische Frequenzen ist μ1 ≈ μ2 ≈ 1. Damit vereinfachen sich die Ergebnisse, b = n2 /n1 =
sin θ1 sin θ2
(Snellius)
und die Gleichungen (17.20) und (17.21) gehen über in E10 = = E2 =
sin θ1 cos θ1 − sin θ2 cos θ2 E1 sin θ1 cos θ1 + sin θ2 cos θ2 tan (θ1 − θ2 ) E1 , tan (θ1 + θ2 ) 2 cos θ1 sin θ2 E1 . sin (θ1 + θ2 ) cos (θ1 − θ2 )
Interessant ist der Spezialfall wo θ1 +θ2 = 900 . Dann ist tan(θ1 +θ2 ) = ∞ , d.h. die Am~ parallel zur Einfallsebene plitude für die reflektierte Welle mit der Polarisation von E verschwindet. Für diesen sogenannten Brewser-Winkel gilt n2 sin θ2 n1 n2 n2 = sin (90 − θ1 ) = cos θ1 , n1 n1
sin θ1 =
17.4 Die Fresnelschen Formeln oder
tan θ1 =
217
n2 n1
Brewster-Winkel.
Beispiel: Für Licht, das über die Luft auf eine Wasserfläche fällt, ist nn21 = 1.5 oder θ1 ' 56◦ . Fällt unpolarisiertes Licht unter diesem Winkel ein, so ist das reflektierte Licht vollständig senkrecht zur Einfallsebene polarisiert, da nur E⊥ zur reflektierten Welle beiträgt.
Kapitel 18
Allgemeine Relativitätstheorie 18.1
Gravitation in der klassischen Mechanik
Die Newtonsche Bewegungsgleichung eines Körpers im Gravitationsfeld der Erde lautet mt
d2 ~x GM = −ms 3 ~x , dt2 r
wo G = 6.674 × 10−11 m3 kg −1 sec−2
die Gravitationskonstante, ms die schwere Masse der Gravitation des Körpers, mt seine träge Masse und M die schwere Masse der Erde ist (GM ≡ g = 9.81m/ sec2 ). Die Newtonsche Theorie ist im Prinzip völlig konsistent für mt 6= ms . Experimentell findet man aber, dass ms = mt = m, und die Bewegungsgleichung reduziert sich auf d2 ~x g = − 3 ~x . 2 dt r Die Bewegung der Körper im Gravitationsfeld hängt nicht von ihren Massen ab. Man spricht von der Geometrisierung der Gravitation. Alle Körper bewegen sich im Gravitationsfeld auf die gleiche Weise. Diese Eigenschaft des Gravitationsfeldes führt zu einer Analogie zwischen der Bewegung eines Körpers im Gravitationsfeld und der des Körpers in einem beschleunigten Bezugssystem in Abwesenheit von Gravitation. In einen gleichmäßig beschleunigten Bezugssystem mit 1 x0 = x + gt2 2 lautet die Bewegungsgleichung für ein freies Teilchen d2 x0 =g . dt2
220
Kapitel 18. Allgemeine Relativitätstheorie
Ein gleichmäßig beschleunigtes Bezugssystem ist also einem konstanten homogenen äußeren Gravitationsfeld in einem Inertialsystem äquivalent. Ein ungleichmäßig geradlinig beschleunigtes Bezugssystem entspricht einem homogenen aber variablen äußeren Feld. Nicht alle beschleunigten Inertialsysteme entsprechen einem Gravitationsfeld. Ein von einem massiven Körper erzeugtes Feld verschwindet im Unendlichen, während die Scheinkräfte der beschleunigten Systeme im Unendlichen anwachsen (Zentrifugalkräfte in einem rotierenden System) oder konstant sind. Einsteinsches Äquivalenzprinzip: In genügend kleinen (infinitesimalen) Raum-Zeitgebieten in einem Gravitationsfeld kann man ein lokales (frei fallendes) Inertialsystem finden, in dem sich die physikalischen Gesetze auf diejenigen der Speziellen Relativitätstheorie reduzieren; lokal ist die Gravitation nicht beobachtbar. Der Effekt der Gravitation kann lokal (d.h. in einem kleinen Raum-Zeitintervall) eliminiert werden, wenn man ihn von einem gleichmäßig beschleunigten Bezugssystem aus betrachtet. Einsteins geniale Erkenntnis war, dass im Gegensatz zu anderen Kräften die Gravitation eine Manifestation der Krümmung der Raum-Zeit ist. Wir können also etwas über die Gravitation lernen, wenn wir die Transformationen von einem kartesischen Inertialsystem auf krummlinige oder beschleunigte Koordinatensysteme betrachten.
18.2
Allgemeine Koordinatentransformationen
Bisher hatten wir bei der Einführung von Tensoren bezüglich Drehungen oder LorentzTransformationen ausschließlich kartesische Koordinaten verwendet. Wenn wir über Gravitation sprechen, dann legt das Äquivalentsprinzip nahe, auch allgemeine beschleunigte oder krummlinige Koordinatensysteme zu betrachten. Wir gehen aus von den kartesischen Koordinaten eines Ereignisse xμ = (x0 , x1 , x2 , x3 ) und unterziehen sie einer allgemeine Koordinatentransformation x0μ = f μ (x0 , x1 , x2 , x3 ) , wo f μ beliebige reelle differenzierbare Funktionen sind mit Jacobi-Determinante 0μ ∂x ∂xν 6= 0 .
Wenn f μ eine nicht-lineare Transformation ist, dann bleibt das Intervall s2 keine quadratische Form, wohl aber das infinitesimale Intervall ds2 . Für kartesische Koordinaten ist ds2 = dxμ dxν ημν ,
(18.1)
18.2 Allgemeine Koordinatentransformationen wo ημν = diag[1, −1, −1, −1] der Euklidische metrische Tensor ist. Mit dxμ = erhalten wir die quadratische Form ∂xμ ∂xν ημν dx0α dx0β ∂x0α ∂x0β = gαβ (x0 )dx0α dx0β ,
ds2 =
221 ∂xμ 0ν ∂x0ν dx
(18.2)
wo
∂xμ ∂xν ημν . ∂x0α ∂x0β Offensichtlich kann gαβ (x) als symmetrisch in α und β angenommen werden. gαβ (x0 ) =
(18.3)
Als Beispiel betrachten wir ein gleichförmig rotierendes Koordinatensystem, x = x0 cos ωt0 − y 0 sin ωt0 y = x0 sin ωt0 + y 0 cos ωt0 z = z0 t = t0 Dann ist ds2 = dt2 − dx2 − dy 2 − dz 2
= dt02 [1 − ω 2 (x02 + y 02 )] − dx02 − dy 02 − dz 02 + 2ωy 0 dx0 dt0 − 2ωx0 dy 0 dt0 .
Dies ist nicht mehr eine Summe von Quadraten der Koordinatendifferentiale, sondern eine quadratische Form. Der zugehörige metrische Tensor ist 2ωy 0 0 0 1 − ω 2 (x02 + y 02 ) 2ωy 0 −1 −2ωx0 0 gμν = 0 0 −2ωx −1 0 0 0 0 −1
Rechnerische Details:
x = x0 cos ωt0 − y 0 sin ωt0 dx = dx0 cos ωt0 − x0 ω sin ωt0 dt0 − dy 0 sin ωt0 − y 0 ω cos ωt0 dt0 ,
(dx)2 = (dx0 )2 cos2 ωt0 + (dt0 )2 (x0 ω)2 sin2 ωt0 + (dy 0 )2 sin2 ωt0 + (dt0 )2 (y 0 ω)2 cos2 ωt0 − 2(dx0 cos ωt0 × x0 ω sin ωt0 dt0 ) − 2(dx0 cos ωt0 × dy 0 sin ωt0 ) − 2(dx0 cos ωt0 × y 0 ω cos ωt0 dt0 ) + 2(x0 ω sin ωtdt0 × dy 0 sin ωt0 ) + 2(x0 ω sin ωt0 dt0 × y 0 ω cos ωt0 dt0 ) + 2(dy 0 sin ωt0 × y 0 ω cos ωt0 dt0 ) dy = dx0 cos ωt0 − y 0 ω sin ωtdt0 = dx(x0 → y 0 , y 0 → −x0 ) (dx)2 + (dy)2 = (dx0 )2 + (dy 0 )2 + (dt0 )2 [(x0 ω)2 + (y 0 ω)2 ] − 2dx0 dt0 (y 0 ω) + 2dy 0 dt0 (x0 ω).
222
Kapitel 18. Allgemeine Relativitätstheorie
Die gμν (x) heißen Raum-Zeit-Metrik . Sie charakterisieren die Eigenschaften des zugehörigen beschleunigten Bezugssystems. Oben wurde argumentiert, dass NichtInertialsysteme gewissen Gravitationsfeldern äquivalent sind, d.h. die Gravitationsfelder hängen mit der Metrik gμν (x) zusammen. Jedes Gravitationsfeld stellt nichts anderes dar, als eine Änderung der Raum-Zeit-Metrik. Was passiert, wenn wir ein krummliniges Koordinatensystem auf ein anders transformieren? x0μ = x0μ (x) oder xμ = xμ (x0 ) (Umkehrfunktion) Dann ist dx0μ = und
∂x0μ ν dx , ∂xν
(18.4)
∂xμ 0ν dx . ∂x0ν ∂x0μ ∂xα ν = δμ → ∂xα ∂x0ν dxμ =
(18.5)
Früher hatten wir die Kovarianz unter Lorentz-Transformationen betrachtet und dazu Lorentz-Tensoren eingeführt. Jetzt erweitern wir die Klasse der Transformationen und betrachten die allgemeine Kovarianz. D.h. wir untersuchen Objekte die sich unter allgemeinen Transformationen wie Tensoren transformieren. Wir beginnen mit der Definition eines Vektors unter allgemeinen Transformationen. Jedes Objekt Aμ (x), das sich wie die Differentiale dxμ transformiert A0μ (x0 ) =
∂x0μ ν A (x) ∂xν
und Aμ (x) =
∂xμ 0ν 0 A (x ), ∂x0ν
heißt kontravarianter Vektor. Ein wichtiges Beispiel ist der Tangentenvektor x˙ μ (τ ) an eine Kurve xμ (τ ), wo τ ein invarianter Parameter ist, wie z.B. die Eigenzeit für die Teilchenbahn. Der Tangentenvektor transformiert sich wie x˙ μ → x˙ 0μ =
∂x0μ ν x˙ . ∂xν
Wir zeigen jetzt, dass dieses Transformationsverhalten konsistent ist. Wenn A0μ =
∂x0μ ν A ∂xν
und
A00α =
∂x00α 0β A , ∂x0β
dann ist
∂x00α 0β ∂x00α ∂x0β ν ∂x00α ν A = A = A , ∂x0β ∂x0β ∂xν ∂xν wo wir die Kettenregel verwendet haben. A00α =
Kontravariante Tensoren höheren Ranges transformieren sich wie äußere Produkte von Vektoren, z.B. ∂x0μ ∂x0μ αβ T 0μν = T . ∂xα ∂xβ
18.2 Allgemeine Koordinatentransformationen
223
Beachte, dass xμ kein kontravarianter Vektor ist, nur dxμ . Nur für lineare Transformationen transformiert sich xμ wie dxμ , z.B. Lorentz-Transformationen x0μ = Lμ ν xν ,
∂x0μ = Lμ ν ∂xν
für Lμ ν = konst. ,
d.h. xμ transformiert sich wie dxμ . Wenn Lμ ν von x abhängen würde, dann würden noch Ableitungen von Lμ ν dazu kommen. Ein kovarianter Vektor ist ein Objekt Bμ mit 4 Komponenten, dass sich wie folgt transformiert: ∂xν Bν . Bμ0 = ∂x0μ Entsprechend lassen sich kovariante und gemischte Tensoren höheren Ranges definieren. Beispiel: Da δs2 invariant ist, ist gαβ ein symmetrischer Tensor zweiten Ranges, 0 (x0 ) = gμν
∂xa ∂xβ gαβ (x) . ∂x0μ ∂x0ν
Beweis: 0 ds2 = gαβ (x)dxα dxβ = gμν (x0 )dx0μ dx0ν
= gαβ (x)
∂xa ∂xβ 0μ 0ν dx dx ∂x0μ ∂x0ν
(oder umgekehrt, wenn gαβ ein Tensor ist, dann ist ds2 ein Skalar). Tensor-Gleichungen gelten in allen Koordinatensystemen. Ist z.B. V μ = 0 in einem System, dann ist auch in einem anderen System V 0μ =
∂x0μ ν V =0. ∂xν
Ein Skalarfeld unter einer allgemeinen Transformationen x ⇐⇒ x0 ; x = x(x0 ) ist definiert durch
φ(x) = φ0 (x0 (x)) = φ(x(x0 )) .
Die Form der Skalarfeldes kann in zwei Koordinatensystemen verschieden sein. Beispiel: Für φ(x, y) = x2 + y 2 in kartesischen Koordinaten wird φ0 (x0 ) = r2 +0 × θ in Polarkoordinaten. φ(x, y) = φ0 (r, θ) numerisch, aber φ0 ist eine andere Funktion als φ. Die Einheit δνμ ist ein gemischter Tensor, da δν0μ =
∂x0μ ∂xβ α δ = δνμ , ∂xα ∂x0ν β
224
Kapitel 18. Allgemeine Relativitätstheorie
wo wir verwendet haben, dass
∂x0μ ∂xα = δνμ . ∂xα ∂x0ν
(18.6)
Mit Hilfe von gαβ kann man Indizes nach unten ziehen, z.B. Vα = gαβ V β ist ein kovarianter Vektor Der metrische Tensor hat eine kontravariante Form, die definiert ist durch g ασ gσβ = δβα . Die Determinante von gαβ ist auch interessant. Für Lorentz-Transformationen ist sie invariant, nicht aber für allgemeine Transformationen. Wir definieren det gαβ ≡ −g.
(18.7)
Für den kontravarianten metrischen Tensor gilt: 1 det g μν = − , g da
(18.8)
det g αβ det gμν = det(g ασ gσν ) = det δνα = 1 .
Bei einer allgemeinen Transformation erhält man μ ∂x ∂xν 0 g 0 = − det gαβ . = − det g μν ∂x0α ∂x0β Wenn wir verwenden, dass det(AB) = det A det B erhalten wir daraus μ 2 ∂x g 0 = det g ∂x0α oder
μ p ∂x √ 0 g = det g. ∂x0α
∂xμ ist die Jacobi-Determinante der Transformation. Ein Objekt, das Der Faktor det ∂x 0α √ sich wie g transformiert, heißt skalare Dichte vom Gewicht −1. Das Volumenselement √ ist eine weitere Größe, die sich wie g transformiert, μ ∂x 4 0 1 2 3 d x = dx dx dx dx = det d4 x0 : ∂x0α √ Wir können ein invariantes Volumenselement gd4 x definieren, da μ p ∂x √ 4 √ gd x = g det d4 x 0 = g 0 d 4 x 0 . 0α ∂x Entsprechend können wir auch eine invariante δ-Funktion definieren: 1 1 √ δ 4 (x − y) = √ 0 δ 4 (x0 − y 0 ) g g
18.3 Die kovariante Ableitung
225
Bisher hatten wir die allgemeinen Koordinaten durch Transformation aus kartesischen erhalten, d.h. umgekehrt lassen sich diese Koordinaten auf kartesische zurückführen. Es gibt aber auch Räume wo es nicht möglich ist ein globales kartesisches Koordinatensystem einzuführen. Ein Beispiel wäre der zweidimensionale Raum der Oberfläche einer Kugel, z.B. der Erdoberfläche. Dennoch ist auch hier ds2 eine quadratische Form der allgemeinen Koordinaten, ds2 = R2 (dϕ2 + cos2 ϕdθ 2 ) , wo ϕ die geografische Länge und θ die Breite ist. Wenn in einem Raum ein quadratisches infinitesimales Intervall ds2 definiert ist, ds2 = gμν (x)dxμ dxν und invariant ist, dann sprechen wir von einem Riemannschen Raum. Aus der Invarianz von ds2 folgt auch für den Riemannsche Räume die Gl. (18.3), d.h., dass gμν ein Tensor ist. An jedem festen Punkt x, d.h. lokal, kann gμν (x) auf die Form ημν gebracht werden. Wenn die Signatur [1, −1, −1, −1] ist, sprechen wir von einem Pseudo-Riemannschen Raum. Falls gμν durch eine allgemeine Koordinatentransformation im gesamten Raum auf die Form ημν gebracht werden kann, so spricht man von einem flachen Raum. Eine Mannigfaltigkeit ist ein im Allgemeinen gekrümmter Raum, der in der (infinitesimalen) Umgebung jedes Punktes wie ein flacher Raum aussieht. Eine Mannigfaltigkeit muss überall die selbe Dimension haben.
18.3
Die kovariante Ableitung
Eine weitere Größe die sich nicht wie ein Tensor transformiert, ist die partielle Ableitung ∂μ ≡ ∂/∂xμ . Wirkt ∂μ auf einen Skalar φ(x), so erhält man einen Vektor. Aus der Kettenregel folgt, dass ∂μ φ sich wie ein Vektor transformiert, ∂σ0 φ0 =
∂φ0 ∂φ ∂xα ∂xα = = ∂α φ . 0σ α 0σ ∂x ∂x ∂x ∂x0σ
Wenn ∂μ auf einen Vektor Vβ wirkt, dann ist ∂α Vβ aber kein Tensor. Wenn V μ ein Vektor ist, mit dem Transformationsverhalten V 0μ (x0 ) =
∂x0μ ν V (x) , ∂xν
dann erhalten wir 0μ ∂xσ ∂ ∂x Vτ ∂x0β ∂xσ ∂xτ ∂xσ ∂ 2 x0μ ∂xσ ∂x0μ ∂ V τ + V τ 0β σ τ . = 0β τ σ ∂x ∂x ∂x ∂x ∂x ∂x 0
(∂β V μ ) → (∂β V μ ) = ∂β0 V 0μ =
(18.9)
Für lineare Transformationen, wie die Lorentz-Transformationen, verschwindet der zweite Term und ∂β V μ ist ein Tensor. Für allgemeine Transformationen verletzt der
226
Kapitel 18. Allgemeine Relativitätstheorie
zweite Term das gewünschte Transformationsverhalten. Daher definieren wir eine kovariante Ableitung Dβ V μ = ∂β V μ + Γμβτ V τ , (18.10) wo Γμβτ eine Menge von Zahlen ist, die Christoffel-Symbole genannt werden. Wenn wir verlangen, dass sich die Γμαβ so transformieren, dass sich der unerwünschte Term in Gl. (18.9) weghebt,
Γμαβ
0
0
∂x0μ ∂xσ ∂xτ ν ∂xν ∂xσ ∂ 2 x μ = Γ − , στ ∂xν ∂x0α ∂x0β ∂x0α ∂x0β ∂xσ ∂xν
(18.11)
dann transformiert sich Dβ V μ wie ein Tensor. Das selbe Argument kann man auch für die kovariante Ableitung eines kovarianten Vektors anwenden mit dem Ergebnis D β V μ = ∂ β V μ − Γα βμ Vα .
(18.12)
Dβ T μν = ∂β T μν + Γμβa T αν + Γνaβ T μα
(18.13)
D.h., +Γ geht einfach über in −Γ. Für kovariante Ableitung von Tensoren höheren Grades benötigt man einen Term mit einem Faktor +Γ für jeden oberen Index und einen Term mit einem Faktor −Γ für jeden unteren Index, z.B. und
D β T μ ν = ∂β T μ
ν
μ + Γμaβ T αν − Γα βν T α .
(18.14)
Die Christoffel-Symbole lassen sich durch die Metrik ausdrücken, Γα μν =
1 ασ g (∂μ gνσ + ∂ν gσμ − ∂σ gμν ). 2
(18.15)
Man kann zeigen, dass sich die so definierten Symbole wie in Gl. (18.11) verlangt transformieren. Offensichtlich sind die Christoffel-Symbole symmetrisch in den beiden μ α unteren Indizes, Γα μν = Γνμ . Das Christoffel-Symbol Γαβ ist aber kein Tensor, da es sich wie in Gl. (18.11) angegeben transformiert. Für die Wirkung der kovarianten Ableitung auf die Metrik erhalten wir mit Hilfe von Gl. (18.13) und Gl. (18.15) das einfache Ergebnis Dμ gαβ = 0,
Dμ g αβ = 0
Viele der lorentzkovarianten Gleichungen, die im Minkowswki-Raum gelten, gelten auch im gekrümmten Raum, wenn wir die Ableitungen durch kovariante Ableitungen ersetzen. So gehen die Maxwell-Gleichungen für den elektromagnetischen Feldtensor, ∂μ F μν (x) =
4π ν j (x) c
∂σ F μν + ∂ν F σμ + ∂μ F νσ = 0 , über in
4π ν j (x) c σμ + Dν F + Dμ F νσ = 0 .
Dμ F μν (x) = Dσ F μν
18.4 Der Krümmungstensor
227
Ein lorentzinvarianter Ausdruck wird invariant unter allgemeinen Koordinatentransformationen, wenn man alle Ableitungen durch kovariante Ableitungen und in allen √ Integralen d4 x durch d4 x g ersetzt. Hat man eine Metrik gegeben, dann berechnet man am besten als Erstes die Christoffel-Symbole um kovariante Ableitungen zur Verfügung zu haben.
18.4
Der Krümmungstensor
In einem gekrümmten Raum kann man global niemals kartesische Koordinaten verwenden, da diese nur flache Räume beschreiben. Die oben entwickelte Maschinerie für krummlinige Koordinaten lässt sich aber auch für gekrümmte Riemannsche Räume verwenden, da im Formalismus nirgends die genaue Form des metrischen Tensors einging. Gegeben sei die Metrik gμν (x) 6= konstant. Dann ist die Frage, gibt es eine allgemeine Koordinatentransformation, x0μ = x0μ (x) mit
∂x0α ∂x0β μν g (x) ∀x ? ∂xμ ∂xν Wenn eine solche Transformation existiert, ist der Raum flach. η αβ =
(18.16)
Beispiele: a) Polarkoordinaten
x0 = t, x1 = r, x2 = θ, x3 = ϕ (ds)2 = dt2 − dr 2 − r2 dθ 2 − r2 sin2 θdϕ = gμν dxμ dxν
mit
gμν =
1 −1
−r
2
−r2 sin2 θ
.
Das sieht krumm aus. Die obige Transformation ist uns aber zufällig bekannt, x00 = x0 , x01 = r sin θ cos ϕ, x02 = r sin θ sin ϕ, x03 = r cos θ . Damit wird
(ds)2 = dx0μ dx0ν ημν ,
d.h. der Raum ist flach. b) Die 2-dimensionale Kugel S2 (Erdoberfläche) mit den Variablen θ und ϕ, wo θ die geographische Breite und ϕ die geographische Länge ist, mit 0 ≤ θ ≤ π, 0 ≤ ϕ ≤ 2π. Das invariante Intervall ist wieder eine quadratische Form (ds)2 = R2 [(dθ)2 + sin2 θ(dϕ)2 ]
228
Kapitel 18. Allgemeine Relativitätstheorie
oder gik = R2
1 sin2 θ
.
Der metrische Tensor kann durch keine Koordinatentransformation, die für die ganze Kugel definiert ist, auf die Form g=
1
1
gebracht werden. Wir suchen ein Kriterium um bei gegebenen gμν (x) zu entscheiden, ob der Raum flach ist (Pseudo-Euklidisch) oder nicht. Die Information über die Krümmung eines Raumes steckt offensichtlich im metrischen Tensor gμν (x), aber es ist nicht klar, wie man diese Information extrahieren kann. Sie steckt nicht direkt in den Chritoffel-Symbolen Γμαβ , da diese schon im flachen Raum in einigen Koordinatensystemen gleich Null und in anderen ungleich Null sein können (Γ ist kein Tensor). Die Information über die Krümmung steckt, wie wir sehen werden, in einem 4-komponentigen Tensor, dem Riemannschen Krümmungstensor, der wie folgt definiert ist Rτ μαβ = −∂β Γτμα + ∂α Γτμβ,α + Γσμβ Γτσα − Γσμα Γσσβ (das Gesamtvorzeichen ist Konvention). Man kann nachprüfen, dass Rτ μαβ ein echter Tensor ist, obwohl die einzelnen Elemente es nicht sind. Der Riemann-Tensor besitzt die wesentliche Eigenschaft, die man von einer Definition der Krümmung verlangen muss: Alle Komponenten von Rτ μαβ verschwinden, wenn der Raum flach ist, d.h. wenn es ein globales Koordinatensystem gibt in dem die Metrik überall konstant ist. Als Beispiel betrachten wir die kovariante Ableitung eines Vektorfeldes, die gegeben war durch Dν Aμ = ∂ν Aμ + Γμνα Aα
und
Dβ Bμ = ∂β Bμ − Γα μβ Bα .
Dν Aμ ist ein Tensor für den nach Gl. (18.13) und (18.14) gilt Dλ (Dν Aμ ) = ∂λ (Dν Aμ ) + Γμλσ (Dν Aσ ) − Γτλν (Dτ Aμ ) Der Ausdruck ist, bis auf den letzten Term, nicht symmetrisch in ν und λ, d.h. zwei kovariante Ableitungen vertauschen nicht. Es gilt Dλ (Dν Aμ ) − Dν (Dλ Aμ ) ≡ Rμ ανλ Aα mit Rτ μαβ = −∂β Γτμα + ∂α Γτμβ,α + Γσμβ Γτσα − Γσμα Γσσβ dem Riemannschen Krümmungstensor.
(18.17)
18.4 Der Krümmungstensor
229
Beweis der Gl. (18.17): Dλ (Dν Aμ ) − Dν (Dλ Aμ ) = ∂λ (∂ν Aμ + Γμνσ Aσ ) + Γμλσ (∂ν Aσ + Γσντ Aτ ) − ∂ν (∂λ Aμ + Γμλσ Aσ ) − Γμνσ (∂λ Aσ + Γσλτ Aτ ) = (∂λ Γμνσ + Γμλσ ∂ν − ∂ν Γμλσ − Γμνσ ∂λ )Aσ + (Γμλσ Γσντ − Γμνσ Γσλτ )Aτ = [(∂λ Γμνσ ) − (∂ν Γμλσ )] Aσ + (Γμλσ Γσντ − Γμνσ Γσλτ )Aτ = Rμσνλ Aσ
Der Riemann-Tensor hat 44 = 256 Komponenten. Auf Grund von Symmetrierelationen sind davon aber nur 20 linear unabhängig. Die Symmetrierelationen schreiben sich am einfachsten, wenn man alle Indizes nach unten zieht. Für Rμναβ = gμλ Rλναβ gilt Rμναβ = −Rμνβα = −Rνμαβ Rμναβ = Rαβμν
(18.18) (18.19)
Rμναβ + Rμαβν + Rμβνα = 0.
(18.20)
Die Beweise dieser Relationen seien hier nicht angeführt. Wenn man den Krümmungstensor Rλανβ über Indizes kontrahiert, dann erhält man die folgenden Tensoren: Ricci-Tensor:
Rαβ = Rλαλβ
Der Ricci-Tensor ist auf Grund der Relationen (18.19) symmetrisch Rαβ = Rβα , es gilt die Bianchi-Identität 1 Dα Rαβ − gαβ R = 0 . 2 Ricci-Skalar:
R = Rλλ = g μν Rμν
Einstein-Tensor:
1 Gμν = Rμν − gμν R 2 Die Divergenz des Einstein-Tensors verschwindet wegen der Biachi-Identität Dμ Gμν = 0 .
230
18.5
Kapitel 18. Allgemeine Relativitätstheorie
Geodäten
Neben der Krümmung sind die Geodäten in einem gekrümmten Raum von besonderem Interesse. Eine Geodäte ist die Kurve, für die die Länge ein Extremum bildet. Um diese zu bestimmen, betrachten wir die Intervalllänge entlang einer vorgegebenen Bahnkurve xμ (τ ), wo τ ein invarianter Parameter ist, der auf der Extremalkurve gleich der Eigenzeit ist. Die infinitesimale Intervalllänge entlang der Kurve xμ (τ ) ist q ds = |gμν x˙ μ x˙ ν |dτ und die gesamte Länge der Kurve ist Z Z q S = ds = |gμν x˙ μ x˙ ν |dτ .
Eine Geodäte ist die Kurve, für die S ein Extremum annimmt (informell: die kürzeste R Entfernung zwischen zwei Punkten). Wir können ebensogut verlangen, dass ds2 = R gμν x˙ μ x˙ ν dτ auf der Geodäte ein Extremum annimmt. Das Extremum der Länge Z 1 2 dτ gμν (x(τ )) x˙ μ (τ )x˙ ν (τ ) S = 2m bei Variation der Bahn xμ (τ ) wird durch die Euler-Lagrange-Gleichungen d dxν 2 gμν (x(τ )) − (∂μ gνσ ) x˙ σ (τ )x˙ ν (τ ) = 0 dτ dτ bestimmt. Wir formen diese Formel etwas um: 1 d 2 xν − (∂μ gνσ ) x˙ σ x˙ ν dτ 2 2 d2 xν 1 = (∂σ gμν − ∂μ gνσ )x˙ σ x˙ ν + gμν 2 dτ 2 1 d2 xν = (∂σ gμν + ∂ν gμσ − ∂μ gνσ )x˙ σ x˙ ν + gμν =0. 2 dτ 2
0 = (∂σ gμν x˙ σ x˙ ν ) + gμν
Wenn wir mit g ρμ multiplizieren erhalten wir 1 d2 x ν =0. g ρμ (gμν,σ + gμσ,ν − gνσ,μ )x˙ σ x˙ ν + gμν 2 dτ 2
(18.21)
Der erste Term lässt sich durch die Christoffel-Symbole Γμαβ =
1 μν g (∂β gνα + ∂α gβν − ∂ν gαβ ) 2
ausdrücken. Damit wird Gl. (18.21): Γρσν x˙ σ x˙ ν +
d2 x ρ =0. dτ 2
(18.22)
Dies ist die Gleichung einer Geodäte im gekrümmten Raum. Diese entspricht der Geraden als kürzester Verbindung zweier Punkte im R3 .
18.6 Die Einstein-Gleichungen
231
Die physikalische Bedeutung der Geodäten liegt, wie wir sehen werden, darin, dass sich in der Allgemeinen Relativitätstheorie Massenpunkte im Gravitationsfeld auf Geodäten bewegen. Diese Geodäten sind zeitartig für massive Teilchen (ds2 > 0) oder lichtartig für masselose Teilchen. In der Newtonschen Mechanik bewegt sich ein Teilchen entlang einer Geraden, so lange keine Kraft wirkt. Eine der möglichen Kräfte ist die Schwerkraft. In der Allgemeinen Relativitätstheorie wird die Schwerkraft durch die Krümmung der Raum-Zeit dargestellt, nicht durch eine explizite Kraft. Die Teilchen bewegen sich entlang Geodäten, so lange keine Kraft wirkt. Die Schwerkraft zählt nicht als Kraft. Wenn explizite Kräfte wirken, muss man auf der rechten Seite von Gl. (18.22) noch diese Kräfte setzen. Dann bewegen sich die Teilchen allerdings nicht mehr auf Geodäten. In diesem Fall entspricht die modifizierte Geodätengleichung gerade der Newtonschen Bewegunsgleichung m~a = F~ .
18.6
Die Einstein-Gleichungen
Nach dieser mathematischen Vorbereitung wollen wir zur Physik zurückkehren. Wir ersetzen das Einsteinsche Äquivalenzprinzip durch das verwandte Prinzip der Allgemeinem Kovarianz: Eine physikalische Gleichung gilt in einem allgemeinen Gravitationsfeld, wenn sie allgemein kovariant ist, und wenn sie in Abwesenheit der Gravitation (gμν = ημν , Γμαβ = 0) lorentzkovariant ist. Wir suchen Gleichungen, die den Zusammenhang zwischen Materie, Energie und der Raumzeit herstellen. Im Falle der Gravitation sind dies die berühmten EinsteinGleichungen 1 Rμν − Rgμν = 8πGTμν , 2 wo G die Gravitationskonstante ist. Der Energie-Impulstensor Tμν setzt sich zusammen aus Energie und Impuls der Materie und der anderen Felder. Er bildet die Quelle des Gravitationsfeldes. Die linke Seite der Gleichung misst die Krümmung der Raumzeit und die rechte Seite die darin enthaltenen Energie und Impuls. Um die Einstein-Gleichungen herzuleiten, machen wir die Annahme, dass die Dynamik des metrischen Tensorfeldes, wie die Dynamik aller anderen Observablen, durch ein Wirkungsprinzip beschrieben werden kann. In diesem Zusammenhang ist es nützlich die Schwerkraft in Analogie zur Elektrodynamik zu betrachten. Wir hatten die Elektrodynamik einer Punktladung aus dem lorentzinvarianten Wirkungsfunktional S=
Z
d4 xημν
Z
1 dxμ dxν e dτ δ 4 (x − x(τ )) m − 2 dτ dτ c
Z
dτ
dxμ 1 Aμ (x(τ )) − dτ 4c
Z
d4 xFμν F μν
(18.23) abgeleitet. In Analogie dazu machen wir jetzt für die Gravitation von N Teilchen den einfachsten Ansatz, der invariant unter allemeinen Koordinatentransformationen dxμ ist. Dazu müssen wir Skalare aus gμν und dτn bilden. Für den symmetrischen Tensor gμν (x) ist die einfachste nicht-triviale Invariante der Ricci-Skalar R(x) = g μν Rμν .
232
Kapitel 18. Allgemeine Relativitätstheorie
Damit setzen wir an, S=
Z
Z Z N X 1 dxμ dxν 1 √ d4 x gμν (x) mn dτn δ 4 (x − x(τn )) n n + d4 x g(−2Λ + R(x)) . 2 dτ dτ 2κ n=1
Λ ist die sogenannte kosmologische Konstante und κ charakterisiert die Stärke der Kopplung zwischen Geometrie (dem Gravitationsfeld) und Materie, die mit der New√ tonschen Konstante zusammenhängt. Wir haben verwendet, dass gd4 x und √1g δ 4 (x − y) invariant unter allgemeinen Koordinatentransformationen sind. Der zweite Term heißt Hilbert-Wirkung. Wir gehen weiter vor wie in der Elektrodynamik. Wenn wir bei gegebenem Gravitationsfeld gμν (x) die Teilchenbahnen x(τn ) variieren, erhalten wir Bewegungsgleichungen für die Massenpunkte. Um die Feldgleichungen abzuleiten, halten wir die Teilchenbahnen fest und variieren den das Feld gμν (x). Das Ergebnis sind die Einstein-Gleichungen, 1 Rμν − ( R − Λ)g μν = κT μν . 2
(18.24)
Dies sind nicht-lineare Gleichungen für das Tensorfeld g μν (x). Der Energie-Impulstensor XZ dxμ dxν 1 δ 4 (x − x(τn )) n n (18.25) dτn mn p T μν = dτ dτ g(x) n bildet die Quelle der Gravitation. Er unterscheidet sich nur um die invariante δFunktion von dem Energie-Impulstensor im Minkowski-Raum. Wegen des Faktors p 1/ g(x) steckt die Gravitation auch im mechanischen Energie-Impulstensor. Ableitung der Bewegungsgleichung: Wir betrachten die Bahn eines Massenpunktes (Testteilchen) bei gegebenem äußeren Gravitationsfeld. Dann ergibt sich für den relevanten Term der Wirkung (18.23) Z 1 S= dτ gμν (x(τ )) x˙ μ (τ )x˙ ν (τ ) . 2m
Das Extremum der Wirkung unter Variation der Bahn xμ (τ ) liefert die Euler-LagrangeGleichungen d dxν 1 gμν (x(τ )) − gνσ,μ x˙ σ (τ )x˙ ν (τ ) = 0. dτ dτ 2 Wir formen diesen Ausdruck etwas um:
1 d 2 xν − gνσ,μ x˙ σ x˙ ν = 0 2 dτ 2 d2 xν 1 σ ν (gμν,σ − gνσ,μ )x˙ x˙ + gμν =0 2 dτ 2 d 2 xν 1 = 0. (gμν,σ + gμσ,ν − gνσ,μ )x˙ σ x˙ ν + gμν 2 dτ 2 gμν,σ x˙ σ x˙ ν + gμν
18.6 Die Einstein-Gleichungen
233
Wenn wir mit g ρμ multiplizieren erhalten wir d2 x ν 1 =0. g ρμ (gμν,σ + gμσ,ν − gνσ,μ )x˙ σ x˙ ν + gμν 2 dτ 2 Mit Hilfe der Christoffel-Symbole Γμαβ = 12 g μν (gνα,β + gβν,α − gαβ,ν ) wird diese Gleichung d2 xρ =0. (18.26) Γρσν x˙ σ x˙ ν + dτ 2 Dies ist auch die Gleichung (18.22) einer Geodäte im gekrümmten Raum. In der Allgemeinen Relativitätstheorie bewegen sich Testteilchen also auf Geodäten. Ableitung der Feldgleichungen: Wir betrachten kleine Variationen in der Metrik. Dann gilt für den Feldanteil der Wirkung Z 1 √ δSGrav. = (18.27) δ d4 x g(−2Λ + R(x)) 2κ Z 1 √ √ d4 x [(δ g)(−2Λ + R(x)) + g (δg μν Rμν + g μν δRμν )] . (18.28) = 2κ Wir diskutieren die einzelnen Beiträge. a) Wir zeigen zunächst, dass gμν δg να = −g μν δgνα . Beweis: Für gμν → gμν + δgμν und g να → (g να − δg να ) gilt (gμν + δgμν )(g να − δg να ) = δμα + O(δ 2 ). √ b) Berechnung von δ( g): Wir verwenden Formeln (18.7) und(18.8) det gαβ ≡ −g, Damit wird
1 det g μν = − . g
g + δg = − det(gμν + δgμν ) 1 (g + δg) = det(g στ ) det(gμν + δgμν ) g = det(g στ (gτ ν + δgτ ν )) = det(δνσ + g στ δgτ ν ) = 1 + g στ δgτ σ + ... .
D.h.
δg = gg στ δgτ σ
234
Kapitel 18. Allgemeine Relativitätstheorie
und 1 1 1 √ μν √ gg δgμν . δ( g) = √ δg = 2 g 2 c) Wir müssen zeigen, dass δΓ(g) = Γ(g + δg) − Γ(g) ein Tensor ist. Die ChristoffelSymbole selbst sind wegen des inhomogenen zweiten Terms in Gl. (18.11), die das Transformationsverhalten der Christoffel-Symbole unter allgemeinen Koordinatentransformationen beschreibt, keine Tensoren. Dieser Term ist aber unabhängig von der Metrik gμν . Daher transformiert sich δΓ(g) = Γ(g + δg) − Γ(g) bei Variation der Metrik wie ein Tensor. d) g μν δRμν ist eine totale Ableitung. Beweis: Wir berechnen diesen Ausdruck an einem festen Punkt in einem lokalgeodätischen Koordinatensystem. Für diesen Punkt sind alle Γλ μν = 0. Damit wird g μν δRμν = g μν [∂λ (δΓλ μν ) − ∂ν (δΓλ μλ )]
= g μν ∂λ (δΓλ μν ) − g μλ ∂λ (δΓν μν )
= ∂λ [g μν δΓλ μν − g μλ δΓν μν ] ≡ ∂λ wλ , wo wir verwendet haben, dass in einem lokal-geodätischem System ∂λ g μν = 0. Da wλ wegen b) ein Vektor ist, können wir das Ergebnis auf ein allgemeines System verallgemeinern, g μν δRμν = Dλ wλ . Nach dem Gaußschen Satz trägt dieser Term nur ein Oberflächenintegral zu δSGrav. im Unendlichen bei, der keinen Einfluss auf die Feldgleichungen hat. Damit wird
Z 1 1 √ μν δSGrav. = d4 x[(−2Λ + R(x)) gg δgμν 2κ 2 √ + gδg μν Rμν ]
oder (δg μν = −δgμν ) δSGrav.
1 = 2κ
Z
1 μν μν d x g (− R(x) + Λ)g − R δgμν . 2 4
√
Die Variation der Teilchen-Wirkung bei gegebenen Teilchenbahnen x(τn ) ist Z Z X 1 dxμ dxν δSP art. = d4 x δgμν (x) mn dτn δ 4 (x − x(τn )) n n . 2 dτ dτ n
Das Wirkungsprinzip besagt
δSGrav. + δSP art. = 0 ,
18.6 Die Einstein-Gleichungen
235
d.h.
1 Rμν − ( R(x) + Λ)g μν = κT μν , (18.29) 2 wo T μν der Energie-Impulstensor Gl. (18.25) ist. Wenn wir kontrahieren und Λ = 0 setzen, erhalten wir R = −κT . Damit lässt sich Gl. (18.24) schreiben als
1 Rμν = κ(Tμν − T gμν ) . 2
(18.30)
Es bleibt zu zeigen, dass diese Gleichung für schwache, zeitunabhängige Felder und langsame Teilchen die Newtonsche Gravitation liefert. In diesem Limes ist die Ruhenergie T 00 sehr viel größer als die anderen Terme in T μν . Wir beschränken uns daher auf die μ = 0, ν = 0 Komponente der Gl. (18.30). Für schwache Felder ist g00 = 1 + h00 ,
g 00 = 1 − h00 .
Die Spur des Energie-Impulstensors ist in niedrigster Ordnung T = g 00 T00 = T00 . Damit wird Gl. (18.30)
1 κT00 . 2 Diese Gleichung verbindet Ableitungen der Metrik mit der Energiedichte. Um den expliziten Ausdruck zu erhalten, benötigen wir R00 = Rλ 0λ0 . Da R0 000 = 0, benötigen wir nur Ri 0i0 . Dazu betrachten wir R00 =
Ri
0j0
= ∂j Γi00 − ∂0 Γij0 + Γijλ Γλ00 − Γi0λ Γλj0 .
Der zweite Term ist eine Zeitableitung, die für statische Felder verschwindet. Da Γμαβ = 0 für die flache Metrik ημν , ist Γ linear in der Störung hμν der Metrik. Damit tragen die letzten beiden Terme in erster Ordnung nicht bei und es bleibt Ri
0j0
= ∂j Γi00 .
Damit wird R00 = Ri 0i0 = ∂i Γi00 1 iλ = ∂i g (∂0 gλ0 + ∂0 g0λ − ∂λ g00 ) 2 1 iλ = ∂i η (∂0 gλ0 + ∂0 g0λ − ∂λ g00 ) + ... 2 1 ij ~ = − η ∂i ∂j g00 (∂i → ∇) 2 1 = ∇2 h00 (∇2 = −η ij ∂i ∂j ). 2
236
Kapitel 18. Allgemeine Relativitätstheorie
Im Newtonschen Limes ergeben die Einsteingleichungen (18.30), also 1 2 ∇ h00 = κT00 . 2 Dabei ist T00 (x) = ρ(x) die Ruhenergiedichte, d.h. die Massendichte. Dieses Ergebnis ist zu vergleichen mit der Poisson-Gleichung für das Gravitationspotential ∇2 Φ(~x) = 4πGρ(~x). D.h. wir identifizieren κ = 4πG,
Φ=
1 GM h00 = 2 r
(18.31)
Die vollen Feldgleichungen Gl. (18.24) sind nicht-lineare Differentialgleichungen für die 10 unabhängigen Komponenten der Metrik gμν (x). So einfach sie aussehen, so schwierig sind sie zu lösen. Der Ricci-Skalar und der Ricci-Tensor involvieren Ableitungen und Produkte von Christoffel-Symbolen, die selber die inverse Metrik und Ableitungen der Metrik enthalten. Auch der Energie-Impulstensor involviert die Metrik: Die Gleichungen sind nicht-linear, so dass man zwei Lösungen nicht zu einer dritten superponieren kann. Selbst im Vakuum, wo sich die Einstein-Gleichungen auf Rμν = 0 reduzieren, sind die Gleichungen sehr schwierig zu lösen. Meist macht man vereinfachende Annahmen, z.B. dass die Metrik gewisse Symmetrien besitzt. Die Kosmologische Konstante: Als Einstein seine Allgemeine Relativitätstheorie auf das Universum anwendete, glaubte er, dass das Universum statisch wäre. Da Materie und Energie zur Gravitation beitragen, bewirken sie den Kollaps des Universums. Dies war physikalisch unakzeptabel. Daher führte Einstein seine kosmologische Konstante ein, als Gegengewicht zur Anziehung der Gravitation. Als Edwin Hubble später entdeckte, dass die Galaxien sich von uns wegbewegen, d.h. dass das Universum expandiert, verbannte man Λ wieder aus den kosmologischen Theorien. Einstein bezeichnete die kosmologische Konstante als seine „größte Eselei“. Man kann die kosmologische Konstante Λ mit in den Energie-Impulstensor ziehen. Dann lauten die Einstein-Gleichungen 1 Rμν − Rg μν = κT μν + Λg μν . 2 Λ stellt so etwas wie eine Nullpunktsenergie und einen Nullpunktimpuls des Vakuums dar (vergl. die Nullpunktsenergie des harmonischen Oszillators in der Quantenmechanik). Erst seit kurzem gibt es Anzeichen dafür, dass Λ sehr klein aber > 0 ist. Die kosmologische Konstante entspricht einem negativen Druck, der zur Energiedichte des Vakuums gehört, und der eine Beschleunigung in der Expansion des Universums verursacht. Den Grund warum eine kosmologische Konstante einem negativen Druck
18.7 Die Schwarzschild-Lösung
237
entspricht, sieht man schon in der klassischen Thermodynamik. Wenn sich ein Gas in einem mit einem Kolben versehenen Behälter ausdehnt, dann verrichtet es eine Arbeit pdV , wo p der Druck und dV die (positive) Volumensänderung ist. D.h. die Energie des Gases nimmt ab. Die Energie in einem Behälter mit Vakuumenergie nimmt aber zu, wenn sich das Volumen vergrößert (dV > 0). Daher ist p negativ. Die kosmologische Konstante wäre eine mögliche Quelle der dunklen Energie. Diese stellt eine konstante Energiedichte dar, die das ganze Universum ausfüllt, und die für die Erklärung der beobachteten beschleunigten Expansion des Universums herangezogen werden kann. Dunkle Energie wird gebraucht, wenn man die Geometrie des Raumes mit der gesamten Masse (einschließlich dunkler Materie) des Universums vergleicht. Die Ergebnisse des WMAP-Satelliten der Mikrowellen-Hintergrund-Strahlung zeigen, dass das Universum fast flach ist. Um ein flaches Universum zu erhalten, bedarf es eines kritischen Verhältnis von Masse zu Energie. Die Gesamtmaterie (einschließlich dunkler Materie), die sich aus der Mikrowellen-Hintergrund-Strahlung bestimmt, liefert nur etwa 30% der nötigen Energie. Die WMAP Daten sind konsistent mit 74% dunkle Energie, 22% dunkle Materie und 4% gewöhnliche Materie.
18.7
Die Schwarzschild-Lösung
Wir suchen das Gravitationsfeld (Kraft auf ein Probeteilchen) im Außenraum eines sphärisch symmetrischen Körpers und nehmen an dass die Metrik auch sphärisch symmetrisch ist. Für große Abstände sollte die Metrik die Minkowski-Form annehmen, d.h. (in Polarkoordinaten) dτ 2 = dt2 − dr 2 − r2 (dθ 2 + sin2 θdφ2 ) Für r → ∞ haben t, r, θ, φ die übliche Bedeutung. Weiters nehmen wir an, dass die Komponenten des metrischen Tensors nicht von t abhängen. Dann beobachtet man im Gebiet r → ∞ ein statisches Schwerefeld. Für endliche r lautet dann die Metrik (c = 1) dτ 2 = A(r)dt2 − B(r)dr 2 − r2 (dθ 2 + sin2 θdφ2 ). mit
A(r) → 1, r→∞
(18.32)
B(r) → 1. r→∞
Der Winkelanteil hätte auch noch mit einer Funktion C(r) mit C(r → ∞) = 1 multipliziert werden können. Diese lässt sich aber durch eine neue Wahl der radialen Variablen r → C(r)r wegtransformieren. Man beachte, dass die Variablen t, r, θ, φ nur für r → ∞ die übliche Bedeutung haben. Aus Gl. (18.32) lesen wir dem metrischen Tensor ab gμν = [A(r), −B(r), −r2 , −r2 sin2 θ]diag. . Der nächste Schritt ist die Lösung der Einstein-Gleichungen Rμν = 0 . Dazu ist es notwendig zunächst die Christoffel-Symbole Γμαβ =
1 μν g (gνα,β + gβν,α − gαβ,ν ) 2
238
Kapitel 18. Allgemeine Relativitätstheorie
und anschließend den Krümmungstensor Rτ μαβ = −Γτμα,β + Γτμβ,α + Γσμβ Γτσα − Γσμα Γτσβ zu bestimmen. Dieser wird dann zum Ricci-Tensor kontrahiert Rαβ = Rλαλβ = −Γλαλ,β + Γλβα,λ + Γσαβ Γλσλ − Γσαλ Γλσβ .
(18.33)
Wir verwenden die Indizes (0, 1, 1, 3) für (t, r, θ, φ). Die Christoffel-Symbole lassen sich hier etwas einfacher aus der Bewegungsgleichung Γρσν x˙ σ x˙ ν + bestimmen, indem man die trachtet. Die Wirkung Z 1 S= 2m Z 1 = 2m Z 1 ≡ 2m
d2 xρ =0 dτ 2
Lagrange-Gleichungen für die Schwarzschild-Metrik be-
dτ gμν (x(τ )) x˙ μ (τ )x˙ ν (τ ) dτ [A(r)t˙2 − B(r)r˙ 2 − r2 (θ˙2 + sin2 θφ˙ 2 ] dτ F (τ )
führt auf die Lagrange-Gleichung ∂F d ∂F = . dτ ∂ x˙ μ ∂xμ Für μ = 0 ergibt sich
d ˙ =0 (2At) dτ 1 ∂A ¨ t+ r˙ t˙ = 0. A ∂r
oder
Um die Γ0μν = Γ0νμ zu bestimmen, symmetrisieren wir die Gleichung 1 1 ∂A ˙ ˙ (r˙ t + tr) ˙ = 0. t¨ + 2 A ∂r Der Vergleich mit (18.34) zeigt, dass alle Γ0μν verschwinden, außer A0 dA Γ010 = Γ001 = . , A0 ≡ 2A dr Für μ = 1, (r) erhalten wir r¨ +
0
(18.34)
0
A ˙2 r r B 2 t − θ˙2 − sin2 θφ˙ 2 = 0 . r˙ + 2B 2B B B
18.7 Die Schwarzschild-Lösung
239
D.h. alle Γ1μν verschwinden außer Γ100 =
A0 B0 , Γ111 = , 2B 2B
Γ122 =
−r , B
Γ133 =
−r sin2 θ . B
Analog finden wir für μ = 2 und μ = 3 1 , Γ233 = − sin θ cos θ r 1 = cot θ, Γ313 = . r
Γ221 = Γ212 = Γ323 = Γ332
Um die Rμν aus Gl. (18.33) zu bestimmen, benötigen wir noch die Kontraktion 1 √ √ Γμμβ = √ ∂β g = ∂β ln g . g Für die Metrik Gl. (18.32) gilt g = − det gαβ = −[A × (−B) × (−r2 ) × (−r2 sin2 θ)] , oder
√
√ g = r2 sin θ AB .
Damit wird 1 ∂ ln[A(r)B(r)r4 sin θ] 2 ∂r 1 ∂ = [ln A(r) + ln B(r) + ln r4 ] 2 ∂r B0 2 A0 + + . = 2A 2A r
Γμμ1 =
Jetzt lassen sich die Rμν aus Gl. (18.33) direkt berechnen. Das Ergebnis für die freien Einstein-Gleichungen Rμν = 0 für die tt und rr Komponenten lautet: −1 A0 B 0 A02 2A0 R00 = A00 − =0 − + 2B 2B 2A r −1 A0 B 0 A02 2AB 0 00 −A + =0. + + R11 = 2A 2B 2A rB Diese beiden Gleichungen lassen sich kombinieren: 0 = R00 + R11 = 0 =
2 (A0 B + AB 0 ) rB
oder
2 (AB)0 = 0 . rB D.h. AB = konst. Da für r → ∞ gilt A → 1, B → 1, erhalten wir B=
1 . A
(18.35)
240
Kapitel 18. Allgemeine Relativitätstheorie
Für die θθ-Komponenten ergibt sich R22
r 0 ∂ 2 r = − + cot2 θ + cot θ + ∂θ B B B
Mit Gl. (18.35) und
∂ ∂θ
2 (AB)0 + r 2AB
=0.
cot θ = − cot2 θ − 1 wird daraus r 0 B
=1.
(18.36)
Bei der Integration dieser Gleichung tritt eine Integrationskonstante auf, die, wie sich gleich herausstellen wird, gleich 2M G ist. Die Lösung der Gl. (18.36) lautet: r = r − 2M G B oder B=
2M G 1− r
−1
und A =
2M G 1− r
−1
.
Damit wird das Schwarzschild-Linienelement −1 2GM 2GM 2 2 dr 2 − r2 (dθ 2 + sin2 θdφ2 ) dt − 1 − dτ = 1 − r r rS 2 rS −1 2 = 1− dt − 1 − dr − r2 (dθ 2 + sin2 θdφ2 ), r r wo 2GM rS ≡ 2GM oder rS ≡ für c 6= 1 [c2 ]
(18.37)
der Schwarzschild-Radius ist. Die anderen Gleichungen von Rμν = 0 liefern nichts neues, sie sind wegen der Symmetrie und wegen der Bianchi-Identität (D μ Rμν = 0) nicht linear unabhängig. Wir hatten oben die willkürliche Integrationskonstante M G eingeführt. Die Bedeutung erkennt man an 2M G = 1 + 2ΦGrav. (~x), g00 → 1 − r→∞ r d.h. M ist die Masse des zentralen Körpers und G die Gravitationskonstante. Bemerkung: Die Masse des Testteilchens ist m = 1, d.h. M muss 1 sein (in Einheiten der Masse des Testteilchens). Diese Metrik hat offenbar ein Problem, wenn der Radius gleich dem Schwarzschildradius wird 2GM r = rS = . [c2 ] Bei den meisten Körpern liegt der Schwarzschild-Radius im Inneren, wo die Lösung nicht mehr anwendbar ist. So ist z.B. rS = 0.89cm für die Erde und rS = 2.95km für die Sonne. Es folgt aber nicht, dass im Inneren der Erde ein schwarzes Loch vom Radius 0.89 cm existiert.
18.7 Die Schwarzschild-Lösung
241
Definition: Ein massives sphärisch symmetrisches Objekt, dessen Radius kleiner als rS ist, heißt schwarzes Loch. Die Zeit in der Nähe eines massiven Objektes: Wir betrachten einen Beobachter, dessen Raumkoordinaten (r, θ, φ) festgehalten werden. Für einen solchen Beobachter lautet das Zeitintervall rS 1/2 dt . dτ = 1 − r
Für alle Beobachter mit den gleichen r erscheint ein gegebenes Ereignis gleichzeitig, d.h. zur selben Zeit t. Die Raumzeit lässt sich daher in zweidimensionale Kugelschalen einteilen, die jeweils ihre eigene wohldefinierte Zeit haben. Das Zeitintervall zwischen zwei, auf einer Kugelschale gleichzeitigen Ereignissen erscheint für Beobachter, die sich bei verschiedenen r befinden, aber verschieden.
Entfernungen in der Nähe eines massiven Objektes: Innerhalb einer Zeitschale t = konst. werden Entfernungen durch den Raumanteil des Linienelementes bestimmt, rS −1 2 dr − r2 (dθ 2 + sin2 θdφ2 ) . dl2 = 1 − r
Wir wollen jetzt zeigen, dass diese Metrik zu einem Nicht-Euklidischen Raum gehört. Dies wäre z.B. der Fall, wenn der Umfang eines Kreises nicht 2πR wäre. Wir betrachten einen konzentrischen Kreis in der Äquator-Ebene θ = π/2 mit fester radialer Koordinate r. Der Umfang ist L(r) =
Z
dl dφ = dφ
Z2π
r sin
π dφ = 2πr . 2
0
Der „Radius“ r kann aber nicht bestimmt werden, da die Formel Gl. (18.37) nur im Außenraum des Körpers gilt. Wir können aber zwei Kreise mit Radien r1 und r2 betrachten. Im Schwarzschild-Raum ist die Differenz der Umfänge der beiden Kreise 2π(r1 −r2 ). Der Abstand für r > rS wird Zr2
r1
dl dr = dr
Zr2
r1
1 dr > r2 − r1 , (1 − rS /r)1/2
d.h. der Raum ist gekrümmt. Planetenbahnen: Die Ablenkung der Bahn des Merkurs im Gravitationsfeld der Sonne war eines der ersten Tests der Allgemeine Relativitätstheorie. Wir bestimmen die Planetenbahn wieder mit dem Variationsprinzip Z 1 δ dτ gμν (x(τ )) x˙ μ (τ )x˙ ν (τ ) = 0. δS = 2m
242
Kapitel 18. Allgemeine Relativitätstheorie
Speziell für die Schwarzschild-Metrik ist Z rS −1 2 rS ˙2 1 t − 1− r˙ − r2 (θ˙2 + sin2 θφ˙ 2 . δ dτ 1 − δS = 2m r r
Daraus folgen die Lagrange-Gleichungen, θ: φ: t:
d 2˙ (r θ) = r2 sin θ cos θφ˙ 2 dτ d 2 2 ˙ (r sin θφ) = 0 dτ rs ˙i d h 1− t =0. dτ r
(18.38) (18.39) (18.40)
Statt die Lagrange-Gleichung für r¨ abzuleiten, ist es bequemer die Metrik Gl. (18.37) durch dτ 2 zu teilen, rS −1 2 rS ˙2 t − 1− r˙ − r2 (θ˙2 + sin2 θφ˙ 2 ). 1= 1− r r
(18.41)
Wir betrachten die Planetenbewegung in der Äquatorialebene und wählen als Anfangsbedingung π θ = , θ˙ = 0. 2 Diese Bedingung gilt wegen Gl. (18.38) für alle τ . Die Gln. (18.39) und (18.40) führen auf folgende Erhaltungsgrößen
Damit folgt aus Gl. (18.41): 1=
r2 φ˙ ≡ l = konst. rS ˙ t ≡ K = konst. 1− r
2M G 1− r
−1
2M G K − 1− r 2
(18.42) (18.43)
−1
r˙ 2 −
l2 r2
(18.44)
oder
1 2 MG M Gl2 (K 2 − 1) l2 = r˙ − + 2− . (18.45) 2 r 2r r3 2 Diese Gleichung hat genau die Form des Energiesatzes für ein Teilchen der Masse m = 1 in einem effektiven Potential Vef f (r) = −
MG M Gl2 l2 , + 2− r 2r r3
wobei E = (K 2 −1)/2. Die Allgemeine Relativitätstheorie liefert nur einen Zusatzterm 2 − MrGl zum klassischen effektiven Potential. Der Drehimpulssatz (18.42) stimmt sogar 3 d d fast mit dem der klassischen Gravitation überein, d.h. bis auf die Ersetzung dt → dτ , wo Gl. (18.43) den Zusammenhang zwischen t und τ liefert.
18.7 Die Schwarzschild-Lösung
243
Wie im Keplerproblem ist es günstig r als Funktion von φ zu betrachten, statt als Funktion von τ . Man findet, dass die Bahnen Ellipsen mit langsam präzisierenden Perihel sind. Für die Perihelverschiebung des Merkur lautet die Vorhersage 43.03 Bogensekunden pro Jahrhundert, ein Wert der innerhalb von 1% mit dem Experiment übereinstimmt. Beachte, dass in der obigen Analyse die Planeten als Testteilchen betrachtet werden.
Kapitel 19
Komplexe Vektorräume 19.1
Vektoren
Die mathematischen Basisbausteine der Quantenmechanik sind komplexe Vektoren, komplexe Skalarprodukte und lineare Transformationen zwischen Vektoren. Wir führen den nötigen Formalismus am Beispiel endlichdimensionaler oder abzählbar unendlichdimensionaler Vektorräumen ein. Diese spielen in der Quantenmechanik eine besondere Rolle. Es treten dort aber auch Vektorräume nicht-abzählbarer Dimension auf, die wir nur in Hinblick auf Anwendungen ohne Anspruch auf mathematische Strenge abhandeln wollen. Ein Vektorraum ist einen Menge von Elementen (Vektoren), für die (assoziative und kommutative) Addition und Multiplikation mit einem Skalar (reelle oder komplexe Zahl) definiert sind und die abgeschlossen ist unter diesen Operationen. Ein Vektor ist also ein Objekt, das mit einem Skalar (reelle oder komplexe Zahl) multipliziert werden kann und das zu anderern Objekten der selben Art addiert werden kann. In der elementaren Vektoranalysis des R3 wird der Vektorraum durch die Menge aller möglichen T Spaltenvektoren ~a = (a1 , a2 , a3 ) gebildet, wo die ai die reelen Zahlen durchlaufen. Da drei reelle Zahlen genügen, um einen Vektor eindeutig zu bestimmen, ist dieser Vektorraum dreidimensional (3D). Man kann auch Zeilenvektoren (a1 , a2 , a3 ) betrachten. Die Menge aller Zeilenvektoren bilden den Dualraum. Der Raum ist zu unterscheiden, da man Zeilenvektoren nicht zu Spaltenvektoren addieren kann. Wenn wir uns an die Regeln der Matrizenrechnung halten, dann können wir das Skalarprodukt auch folgendermaßen schreiben b1 T ~a ∙ ~b = [~a] ~b = (a1 , a2 , a3 ) b1 = a1 b1 + a2 b2 + a3 b3 . b3 Diese Formalisierung ist für reelle Vektorräume nicht unbedingt erforderlich. Sie ist aber in komplexen Vektorräumen, die in der Quantenmechanik zur Anwendung kommen, sehr hilfreich.
246
19.2
Kapitel 19. Komplexe Vektorräume
Der komplexe Vektorraum CN
Wir verallgemeinern die Analyse des R3 auf N -dimensionale Vektoren und erlauben komplexe Komponenten. Den zugehörigen Vektorraum bezeichnen wir mit CN . Der Vektorraum CN ist der Raum der N geordneten komplexen Zahlen a1 , a2 , ...aN . Wir folgen Dirac und verwenden die Notation a1 a2 |ai = ... , ai ∈ C, i = 1.2, ...n , aN wo ai die komplexen Komponenten der Vektoren sind. Die Notation ist etwas ungewöhnlich. Der Vektorpfeil (~a) wir durch eine pfeilähnliche Klammer |i ersetzt. Addition und Multiplikation mit einem Skalar sind wie im R3 definiert, a1 b1 αa1 .. + .. , α |ai = .. α ∈ C , |ai + |bi = . . . aN
bN
αaN
nur dass α jetzt eine komplexe Zahl ist. Dirac bezeichnet |ai als Ket-Vektor.
Zeilenvektoren werden wie folgt definiert †
ha| = |ai =
a∗1
a∗2
...
a∗N
.
(19.1)
Man beachte, dass der Vektor transponiert wird und die Einträge komplex-konjugiert werden. Nach Dirac bezeichnen wir die Zeilenvektoren Bra-Vektoren. Die Zeilenvekto˜N. ren bilden einen neuen Vektorraum, den Dualraum C
19.3
Skalarprodukt
Gegeben seien zwei Vektoren |ai,|bi ∈ CN , dann definieren wir das Skalarprodukt durch (|ai , |bi) =
N X
a∗k bk ,
k=1
oder in der Bra-Ket-Notation:
ha| |bi = ha|bi =
a∗1
a∗2
...
a∗N
b1 N b2 X = a∗k bk . ... k=1 bN
Dies entspricht den Regeln der Matrizenmultiplikation, wenn wir ha| als eine 1 × N Matrix und |bi als eine M × 1-Matrix auffassen. Das Skalaprodukt besitzt folgenden
19.3 Skalarprodukt
247
Eigenschaften: ∗
ha|bi = hb|ai ha|αbi = α ha|bi , hαa|bi = α∗ ha|bi ha|ai ≥ 0 (= 0 nur für |ai = |0i) .
(19.2)
Zwei Vektoren |ai und |bi sind orthogonal zueinander, wenn ha|bi = 0 . Ein Skalarprodukt oder inneres Produkt ha|bi kann nur gebildet werden, wenn |ai und |bi Elemente des selben Vektorraumes sind. Das Skalarprodukt induziert eine Norm || |ai ||2 = ha|ai = |a1 |2 + |a2 |2 + ... + |aN |2 ≥ 0 . Bemerkung: Um eine positive Norm zu erhalten, geht in die Definition der dualen Vektoren in Gl. (19.1) die komplexe Konjugation ein. Schwarzsche Ungleichung: Für beliebige |ai und |bi aus CN gilt | ha|bi |2 ≤ || |ai ||2 || |bi ||2 .
(19.3)
Wegen der Bedeutung der Ungleichung in der Quantenmechanik sei hier der Beweis skizziert. Beweis: Für jede komplexe Zahl α = u + iv gilt 0 ≤ ha + αb|a + αbi = ha|ai + α ha|bi + α∗ hb|ai + αα∗ hb|bi
(19.4)
= ha|ai + 2u Re ha|bi − 2v Im ha|bi + (u + v ) hb|bi ≡ f (u, v) . 2
2
Für die schärfste Ungleichung müssen wir f (u, v) minimieren. Wir setzen also ∂f (u, v) = 2 Re ha|bi + 2u hb|bi ∂u ∂f (u, v) 0= = −2 Im ha|bi + 2v hb|bi . ∂v 0=
Die Lösung dieser Gleichungen ist Re ha|bi − i Im ha|bi hb|bi Re hb|ai + i Im hb|ai hb|ai =− =− . hb|bi hb|bi
αmin = umin + ivmin = −
248
Kapitel 19. Komplexe Vektorräume
Die zweiten Ableitungen von ∂f (u, v) sind offensichtlich positiv, so dass es sich bei f (umin , vmin ) wirklich um ein Minimum handelt. Einsetzen in Gl. (19.4) ergibt 0 ≤ ha|ai + α ha|bi + α∗ hb|ai + αα∗ hb|bi = ha|ai + (− hb|ai ha|bi − ha|bi hb|ai + hb|ai ha|bi)/ hb|bi = ha|ai −
hb|ai ha|bi . hb|bi
Daraus folgt Gl. (19.3). Auch in einen allgemeinen (abstrakten) komplexen Vektorraum kann man ein Skalarprodukt definieren, indem man die Eigenschaften Gl. (19.2) des Skalarprodukts als Axiome einführt. Äußeres Produkt: Neben dem Skalarprodukt kann man auch ein äußeres Produkt definieren. Sei |ai ∈ CN (eine N × 1-Matrix) und |bi ∈ CM (eine M × 1-Matrix), dann ist |bi ha| ist eine M × N Matrix, (|bi ha|)mn = bm a∗n . Hier muss nicht unbedingt M = N sein. In obigem Beispiel ist für M = 2, N = 3 b1 a∗1 b1 a∗2 b1 a∗3 |bi ha| = . b2 a∗1 b2 a∗2 b2 a∗3 Da |bi ha| eine M × N -Matrix ist, kann man sie auf Vektoren |ci der Dimension N wirken (der Dimension von |ai) lassen (von rechts mit |ci multiplizieren). Das Ergebnis der Operation ist |bi ha| |ci = |bi (ha| |ci) = (ha| |ci) |bi = ha|ci |bi .
(19.5)
Erläuterung: Mit den Regeln der Matrizenrechnung wird N X
n=1
(|bi ha|)mn cn =
N X
bm a∗n cn
n=1
= bm
N X
n=1
a∗n cn = ha|ci bm = Skalar × bm .
|bi hakci ist also parallel zu |bi für alle Vektoren |ci. Das äußere Produkt |bi ha| projiziert in die Richtung von |bi. Man bezeichnet die Matrix |bi ha| in diesem Zusammenhang auch als Operator. Funktionen können als Vektoren aufgefasst werden, da αf (t) und f (t) + g(t) wohl definiert und wieder Funktionen sind. Funktionsräume sind oft unendlichdimensional. Die Definition des Skalarproduktes kann auf Funktionen ausgedehnt werden, indem man die Summen durch Integrale ersetzt. Als Beispiel betrachten wir die Funktionen
19.4 Basis
249
einer Variablen fi (x) und fj (x), die wir mit fi und fj bezeichnen, wenn wir sie als Vektoren auffassen wollen. Dann definieren wir Z ∞ dxfi∗ (x)fj (x) (19.6) hfi |fj i ≡ −∞ Z ∞ ||fi ||2 = dx|fj (x)|2 . (19.7) −∞
Man vergleiche ha|bi =
N X
k=1
a∗k bk ,
hfi |fj i ≡
Z
∞ −∞
dxfi∗ (x)fj (x) .
Der diskrete Index k wird durch die kontinuierliche Variable x ersetzt. Der Raum aller Funktionen f (x) mit ||f ||2 < ∞ ist ein unendlichdimensionaler Vektorraum, dessen Elemente (eindimensionale) Funktionen sind. Ein Vektorraum mit einer (endlichen) Norm heißt normierter Vektorraum oder, mit einigen technischen Annahmen, Banach-Raum. Ist in einem Banach-Raum auch ein Skalarprodukt definiert, so spricht man von einem Hilbert-Raum. Der durch Gl. (19.6) definierte Hilbertraum wird mit L2 (R) bezeichnet. Dabei steht L2 für den Raum der quadratisch integrierbaren Funktionen und R zeigt an, dass die Integration über die reelle Achse, −∞ < x < ∞, erfolgt. Die Verallgemeinerung auf Funktionen in 3D lautet Z ∞ Z ∞ ∗ dxdydzfi (x, y, z)fj (x, y, z) = d3 xfi∗ (~x)fj (~x) hfi |fj i ≡ −∞ −∞ Z ∞ 2 ||fj || = d3 x|fj (~x)|2 . −∞
19.4
Basis
Eine Menge von orthogonalen und normierten Vektoren {|un i ∈ CN , n = 1..N } , mit hun |um i = δmn bildet eine (orthonormierte) Basis in einem N -dimensionalen Vektorraum CN , wenn jeder Vektor |f i aus CN als Summe (Superposition) dieser Vektoren geschrieben werden kann N X |f i = αn |un i . (19.8) n=1
Die komplexen Entwicklungskoeffizienten heißen Komponenten von |f i bezüglich der Basis {|un i} und sind durch αn = hun |f i (19.9)
gegeben (Beweis: Multipliziere Gl. (19.8) von links mit hum |).
250
Kapitel 19. Komplexe Vektorräume
Beispiel: In C2 bilden die Vektoren |v1 i =
1 0
und |v2 i =
0 1
eine Basis. Die Basisvektoren sind nicht eindeutig, eine andere Wahl für C2 wäre 1 1 1 1 und |v2 i = √ . |v1 i = √ 1 −1 2 2 Vollständigkeitsrelation: Für einen beliebigen Vektor |f i gilt also |f i =
N X
n=1
αn |un i =
N X
n=1
hun |f i |un i =
N X
n=1
|un i hun |f i ,
wo wir ha|ci |bi = |bi ha| |ci (Gl. (19.5)) verwendet haben. Zur Erinnerung: ha|ci ist eine komplexe Zahl, |bi ha| ist ein Operator (Matrix). Da die Basis vollständig ist, muss N X
n=1
|un i hun | = 1
sein, wo 1 der Einheitsoperator ist. Dies ist die in der Quantenmechanik häufig verwendete Vollständigkeitsrelation. Existiert in einem Hilbert-Raum eine endlich- oder abzählbar unendlichdimensionale Basis so heißt der Hilbertraum separabel. In der Quantenmechanik werden wir es mit separablen Hilbert-Räumen zu tun haben.
19.5
Lineare Operatoren
Ein Operator A wirkt auf einen Vektor |f i aus einem Vektorraum U und macht aus diesen einen Vektor |gi, der im Allgemeinen in einem anderen Vektorraum V liegen kann |gi = A |f i . Die Mathematiker schreiben
A : U→V . U ist der Definitionsbereich und V der Wertebereich oder Bildbereich des Operators A. Wir beschränken uns zunächst auf den, in der Quantenmechanik meist gegebenen Fall, dass A auf den gesamten Hilbertraum abbildet, d.h. V = U. Für lineare Operatoren gilt A(α |f1 i + β |f2 i) = αA |f1 i + β |f2 i
19.5 Lineare Operatoren
251
für alle |f1 i, |f2 i aus U und α, β aus C. Operatoren können addiert und mit komplexen Zahlen multipliziert werden (A + B) |f i = A |f i + B |f i
(αA) |f i = α(A |f i) ≡ αA |f i .
Ein Produkt von Operatoren ist wie folgt definiert: (AB) |f i = A(B |f i ) ≡ AB |f i . Man beachte, dass dieses Produkt im Allgemeinen nicht kommutativ ist, AB 6= BA. Matrixdarstellung: Wegen der Linearität ist der Effekt eines Operators auf einen Vektor durch seine Wirkung auf die Basisvektoren festgelegt. In unserem endlich oder abzählbar unendlich dimensionalen Vektorraum CN können Operatoren durch Matrizen dargestellt werden. Sei {|un i} eine ortonormale Basis in CN . Dann kann ein beliebigen Vektor |f i ∈ CN in der Basis {|un i} entwickelt werden X aj |uj i . (19.10) |f i = j
Ein Operator A bilde einen Vektor |f i ∈ CN auf einen Vektor |gi ∈ CM ab. Wenn {|vm i} eine Basis im Bildraum CM ist, dann erhält man A |f i = =
N X
n=1 N X
n=1
=
Aan |un i = an
M X
m=1
N X M X
n=1 m=1
Es ist also A |f i =
N X M X
n=1 m=1
Amn an |um i mit
X n
an A |un i
|vm i hvm | A |un i
hvm | A |un i an |vm i .
Amn ≡ hvm |A|un i
Matrixelement
Während der Operator A basisunabhängig definiert ist, hängt das Matrixelement Anm von der gewählten Basis ab. Akl ist das Matrixelement des Operators A bezüglich der Basen {|un i} und {|vm i}. In der Quantenmechanik hat man es meist mit Operatoren zu tun, die auf den ganzen Raum abbilden A : CN → CN . Dann gilt A |f i =
N X
m,n=1
Amn an |um i mit
Amn ≡ hum |A|un i .
In einer gegebenen Basis, kann man einen Operator, der einem Vektor |f i in |ui = A |f i überführt, durch seine Wirkung auf die Komponenten definieren. Sind ak die
252
Kapitel 19. Komplexe Vektorräume
Komponenten des Ausgangsvektors |f i = P Vektors |gi = bk |uk i, dann gilt
P k
ak |uk i und bk die Komponenten des neuen
k
|gi = A |f i =
X k
bk |uk i
bzw. A |f i =
X k,l
Akl al |uk i .
Somit gilt für die Komponenten ak → bk = (Aa)k =
X
Akl al .
l
Dies ist gerade die Regel für die Multiplikation einer Matrix mit einem Spaltenvektor. Für das Produkt zweier Operatoren gilt die Regel für die Multiplikation von Matrizen (AB)ik = hui |AB|uk i X hui |A |un i hun | B|uk i = n
=
X
Ain Bnk .
n
Ein Operator lässt sich auch in der Form schreiben A=
N X i,k
Aik |ui i huk | .
(19.11)
Zum Beweis multipliziert man beide Seiten mit hul | .... |um i. Ein linearer Operator, der Funktionen aus L2 (R3 ) auf Funktionen aus L2 (R3 ) abbildet, ist von der Form Z g(~x) = d3 x0 A(~x, ~x0 )f (~x0 ).
19.6
Inverser Operator
Gibt es zu einem Operator A einen Operator B, so dass BA = AB = I, dann ist B das Inverse von A und wir schreiben B = A−1 . Nicht jeder Operator hat ein Inverses.
19.7
Der adjungierte Operator
Hermitesche Konjugation: Ein Operator A sei definiert durch seine Wirkung auf die Kets |f i ∈ CN A : |f i → |gi = A |f i
19.7 Der adjungierte Operator
253
mit |gi ∈ CM . Der duale Vektor (Bra) zu |f i ist hf | , der zu |gi ist hg|. Dann gibt es einen Operator, der hg| in hf | überführt, den wir mit A† bezeichnen, A† : hg| → hf | = hg| A† . In Hinblick auf die Regeln der Matrizenmultiplikation schreiben wir den Operator A† rechts vom Bra-Vektor. Der Operator A† heißt Adjungierte oder Hermitesch Konjugierte von A. Wichtige Relation:
∗ hg|A|f i = f |A† |g
(19.12)
˜ M , dann gilt für Beweis: Wenn |f i ∈ CN , |αi = A |f i ∈ CM und hα| = hf | A† ∈ C M beliebige |Φi ∈ C
∗ ∗ hα|Φi = hΦ|α i = hΦ|A|f i = f |A† |Φ . Wir beschränken uns auf den Fall, dass Definitions- und Wertebereich des Operators A gleich sind. Dann ist A |f i wieder ein Ket im Hilbert-Raum CM . In einer gegebenen Basis {|un i} sind |f i = hf | =
X n
X n
fn |un i ,
|gi =
fn∗ hun | ,
hg| =
X m
X m
gm |um i ∗ gm hum | .
Für die Matrixelemente gilt hg|A|f i = =
X n,m
X
∗ gm fn hum | A |un i ∗ gm fn Amn
n,m
mit Amn = hum | A |un i
und
g|A† |f
=
X n,m
=
X
∗ gm fn hum | A† |un i = ∗ gm fn
n,m
∗
hun | A |um i =
X
∗ gm fn A†mn
n,m
X
∗ gm fn A∗nm .
n,m
Die Matrixelemente von A† und A hängen über Hermitische Konjugation von Matrizen zusammen A†mn = A∗nm . Beispiel: A=
1 3
i i
→ A† =
1 3 −i −i
.
254
Kapitel 19. Komplexe Vektorräume
Für Produkte von Operatoren gilt offensichtlich (AB)† = B † A† . Hermitesche Operatoren: Ein Operator A heißt Hermitesch, wenn A = A† . Ein Operator kann nur Hermitesch sein, wenn Definitions- und Wertebereich von A† und A gleich sind (wir nehmen an, der ganze Vektorraum). Für einen Hermiteschen Operator lautet die Relation Gl. (19.2) hg|A|f i∗ = hf |A|gi. Die Matrixelemente eines Hemitesche Operators A erfüllen Amn = A∗nm . Dies ist die Verallgemeinerung von symmetrischen Operatoren. Ein Operator heißt Anti-Hermitesch, wenn Amn = −A∗nm .
19.8
Unitäre Operatoren
Ein unitärer Operator U erfüllt U † = U −1
oder
U U † = U †U = 1 .
Dies ist die Verallgemeinerung orthogonaler Operatoren auf komplexe Vektorräume. Unitäre Operatoren treten bei der Transformation von Ket-Vektoren in der Quantenmechanik, wie Drehungen, Translationen in Ort und Zeit auf. Skalarprodukte sind invariant unter unitären Transformationen. Betrachte dazu die Transformation E ψ → ψ˜ = U |ψi , |χ i → |χi ˜ = U |χi .
Dann wird
D
˜χ ψ| ˜
E
= ψ|U † U |χ = hψ|χi .
Die Definition eines Skalarproduktes erhält Inhalt, wenn es mit einer Invarianz in Verbindung gebracht wird (z.B. das Skalarprodukt in R3 mit der Drehinvarianz).
19.9
Eigenwerte und Eigenvektoren
Wir betrachten speziell Abbildungen (Operatoren) von CN auf CN , die durch N × N Matrizen dargestellt werden. Wenn die Anwendung eines Operators A auf einen Vektor |ai bis auf einen skalaren Faktor λ wieder den selben Vektor ergibt, A |ai = λ |ai ,
19.9 Eigenwerte und Eigenvektoren
255
dann wird dieser Vektor als Eigenvektor und der Faktor λ als Eigenwert bezeichnet. Eigenvektoren sind nur bis auf einen multiplikativen Faktor definiert. Für einen endlichdimensionalen Vektorraum lautet die notwendige Bedingung für einen Eigenvektor det(A − λI) = 0 .
In einem komplexen Vektorraum der Dimension d hat diese Gleichung d komplexe Lösungen für λ. Die Eigenwerte für verschiedene Eigenvektoren können gleich sein, man spricht dann von Entartung. Für endlichdimensionale Vektorräume nennt man die Menge der Eigenwerte das Spektrum. Operatoren auf endlichdimensionalen Vektorräumen haben ein diskretes Spektrum. In diesem Fall kann man die Eigenvektoren normieren.
Hermitesche Operatoren auf N -dimensionalen Hilbert-Räumen haben besonders angenehme Eigenschaften: 1. Sie besitzen N unabhängige Eigenvektoren und Eigenwerte A |an i = an |an i . 2. Die Eigenwerte sind reell. 3. Die Eigenvektoren sind orthonormal han |am i = δmn . 4. Die Eigenvektoren bilden eine Basis im Definitionsbereich von A, d.h. jeder Vektor |f i aus dem Definitionsbereich von A kann als Superposition der Eigenvektoren geschrieben werden, |f i =
N X
n=1
αn |an i
mit αn = han |f i .
5. Die Wirkung PN von A auf einen beliebigen Vektor ist damit einfach zu berechnen A |f i = n=1 an |an i . Für N → ∞ gelten diese Aussagen nur für kompakte Hermitesche Operatoren, siehe Mathematik.
Spektraltheorem: Die Spektralzerlegung drückt einen Operator A durch seine Eigenvektoren {|aj i} aus. Mit A |ak i = ak |ak i lautet die Spektralzerlegung A=
N X
a k Pk ,
(19.13)
k=1
wo Pk der Projektionsoperator auf den Unterraum ist, der durch die entarteten Eigenvektoren |ak,i i , i = 1...d(k) aufgespannt wird und dessen Dimension der Entartungsgrad d(k) der Eigenwerte ak ist, d(k)
Pk =
X i=1
Pk,i
mit Pk,i = |ak,i i hak,i | ,
(19.14)
256
Kapitel 19. Komplexe Vektorräume
wo d(k) der Entartungsgrad des Eigenwertes ak,i ist. Die Projektionsoperatoren erfüllen P † = P, P 2 = P,
Pk Pl = δkl Pk .
Wenn der Eigenwert nicht entartet ist, dann gilt Pk = |ak i hak | oder
A=
X k
ak |ak i hak | .
(19.15)
Die Matrixdarstellung Aik ist in dieser Basis diagonal, X hai |ak |ak i hak | |aj i = δij aj . Aij = k
Ein linearer Operator A heißt normal, wenn AA† = A† A. Beispiele für normale Operatoren sind die Hermiteschen und die unitären Operatoren. Normale Operatoren lassen sich diagonalisieren und besitzen eine Spektralzerlegung. Bemerkung: Die obigen Formeln gelten auch für N = ∞ solange A ein beschränkter Hermitischer Operator ist. Für unbeschränkte Operatoren in unendlichdimensionalen Hilberträumen müssen der Begriff Hermitesch und das Spektraltheorem modifiziert werden (siehe Mathematik). Funktionen von Operatoren: Das Spektraltheorem erlaubt Funktionen von Operatoren zu definieren X X f (ak )Pk = f (ak ) |ak i hak | . f (A) = k=1
(19.16)
k=1
Wenn f (x) in eine Potenzreihe entwickelt werden kann, f (x) =
∞ X
cn xn ,
n=0
dann definieren wir f (A) =
∞ X
c n An .
n=0
Als Beispiel betrachten wir die Funktion exp(iA), wo A ein Hermitescher Operator A mit reellen Eigenwerten an und Eigenvektoren |an i ist. Dann gilt nach Gl. (19.16) X U = exp(iA) = eiak |ak i hak | . (19.17) k=0
Hermitesche Konjugation ergibt X U† = e−iak |ak i hak | = exp(−iA) . k=0
19.10 Erwartungswert
257
D.h. U ist ein unitärer Operator. Man kann zeigen, dass jeder unitäre Operator in der Form (19.17) geschrieben werden kann. Ableitung eines Operators nach einem Parameter: Betrachtet man Operatoren, die von einem Parameter t abhängen, z.B. A(t) = exp(−iHt), so defiert man die Ableitung wie für gewöhnliche Funktionen dA(t) A(t + ε) − A(t) = lim . ε→0 dt ε Bei der Produktregel muss man aber auf die Reihenfolge der Operatoren achten, dA(t) dB(t) d(AB) = B(t) + A(t) . dt dt dt
19.10
Erwartungswert
Der Erwartungswert eines Operators A bzgl. eines Kets |ψi ist definiert als hAi ≡ hψ|A|ψ i . Der Ket-Vektor |ψi kann in der Eigenbasis {|an i} von A mit A |an i = an |an i entwickelt werden X bn |an i . |ψi = n
Dann wird
hAi =
X n,m
han |b∗n Abm |am i =
X n
an |bn |2 .
Der Erwartungswert ist invariant unter unitären Transformationen |Ψi → U |Ψi ,
A → U AU −1
mit
U † U = U U † = 1.
Beachte, dass |Ψi und A transformiert wurden. Da in der Quantenmechanik nur Erwartungswerte eindeutigen Messgrößen entsprechen, folgt, dass die Quantenmechanik nur bis auf unitäre Transformationen festgelegt ist. Dem entspricht klassisch, dass ich mein gegebenes System (Gerät und Koordinatensystem) als Ganzes rotiere.
19.11
Operatoridentitäten
Wir setzen voraus, dass alle Operatoren auf denselben Hilbert-Raum wirken. Kommutator: Der Kommutator zweier Operatoren ist definiert als [A, B] = AB − BA . Aus der Definition folgt [AB, C] = A[B, C] + [A, C]B,
(19.18)
258
Kapitel 19. Komplexe Vektorräume
die Jacobi-Identität [A, [B, C]] + [B, [C, A]] + [C, [A, B]] = 0
(19.19)
und die Baker-Campbell-Hausdorff-Formel eA Be−A = B + [A, B] +
1 [A, [A, B]] + .... 2!
(19.20)
Spezialfälle: 1. [A, B] vertauscht mit A und B (man sagt, [A, B] ist eine c-Zahl). Dann gilt eA Be−A = B + [A, B]
(19.21)
und die verwandte Identität 1
eA eB = e(A+B)+ 2 [A,B] .
(19.22)
2. [A, B] = αB. Dann ergibt Gl. (19.20) eA Be−A = ea B
(19.23)
Theorem: Zwei vertauschende Hermitesche Operatoren besitzen gemeinsame Eigenvektoren, d.h. sie können gleichzeitig diagonalisiert werden.
19.12
Die Spur eines Operators
Die Spur eines Operators (Matrix) in einem N -dimensionalen Hilbert-Raum ist definiert als die Summe der Diagonalelemente, N X
SpA =
m=1
hum |A|um i ,
für jede orthonormale Basis {|ui i}. Wählt man für die {|ui i} die Eigenvektoren von A, dann ist die Spur gerade die Summen der Eigenwerte von A. Für eine beliebige Matrix Aik ist die Spur gegeben durch die Summe der Diagonalelemente. Eigenschaften der Spur: Sp(AB) = Sp(BA) Sp(ABC) = Sp(CAB) = Sp(BCA)
(zyklisch)
Sp(U AU ) = Sp(A) für U unitär Sp |αi hβ| = hβ|αi . †
Beweis der letzten Formel: Sei {|ui i} eine Basis. Dann gilt X Sp |αi hβ| = hui |αi hβ|ui i i
=
X i
hβ|ui i hui |αi = hβ|αi .
19.13 Produktraum
19.13
259
Produktraum
Gegeben seien zwei Hilbert-Räume V und W mit den zugehörigen Basiszuständen {|vi i} = {|v1 i , |v2 i , ... |vn i} und {|wj i} = {|w1 i , |w2 i , ... |wm i}. Dann kann man aus diesen beiden Räumen einen Produktraum V ⊗ W mit der Dimension n × m bilden. Dieser ist definiert als der Raum, der durch die Basisvektoren {|vi i ⊗ |wj i} aufgespannt wird. Damit ist ein allgemeiner Zustand im Produktraum gegeben durch das Tensorprodukt X cij |vi i ⊗ |wj i . |Φi = i,j
Beispiel: V = C2 und W = C3
|Φi = |ai ⊗ |bi =
a1 a2
b1 ⊗ b2 = b3
b1 a 1 b1 a1 b2 a 1 b2 b3 = a 1 b 3 a2 b1 b1 a 2 b2 a 2 b 2 b3 a2 b3
Oft lässt man das ⊗ weg, dann muss man aber beachten, dass |vi i und |wj i Vektoren in verschiedenen Hilbert-Räumen sind. Noch kürzer, aber undurchsichtiger, ist die Notation |vi i ⊗ |wj i → |vi , wj i. Das Tensorprodukt ist linear bezüglich der Multiplikation mit einer komplexen Zahl i h [α |ψiV ] ⊗ |φiW = α |ψiV ⊗ |φi(W) .
Das induzierte Skalarprodukt ist
(hv| ⊗ hw|)(|v 0 i ⊗ |w0 i) = hv, w|v 0 , w 0 i = hv|v 0 iV ∙ hw|w0 iW . Man kann zeigen, dass der so definierte Produktraum wieder ein Hilbert-Raum ist. Operatoren: Gegeben seien zwei Operatoren A : V → V und B : W → W. Dann kann ein äußeres Produkt der beiden Operatoren, d.h. einen Operator A ⊗ B, der auf V ⊗ W wirkt, definieren durch A ⊗ B(|ΨiV ⊗ |ΦiW ) = (A |ΨiV ) ⊗ (B |ΦiW ) , wobei wir, wo nötig, den Raum angeben, auf den die Operatoren wirken. Notation: (A(V) ⊗ B(W) ) |v, wi ≡ AB |v, wi (A(V) ⊗ 1) |v, wi = |Av, wi ≡ A |v, wi . Beispiel: A⊗B =
x y a a b x y u v ⊗ = c d u v x y c u v
x y u v = x y d u v b
ax ay au av cx cy cu cv
bx by bu bv dx dy du dv
260
Kapitel 19. Komplexe Vektorräume
Oft führt man auch eine Summe ein, A + B ≡ A(V) ⊗ 1(W) + 1(V) ⊗ B(W) . Zwei Operatoren, die in verschiedenen Räumen wirken, vertauschen A(V) ⊗ B(W) = B(W) ⊗ A(V) . Eigenvektoren im Produktraum: Wir betrachten zunächst den Hilbert-Raum V. Sei ai der Eigenwert und |ai i der Eigenvektor des Operators A(V ) , A |ai i = ai |ai i . Dann ist auch |ai , bi Eigenvektor von A (genauer, von A ⊗ 1) in V ⊗ W, A |ai , bi = ai |ai , bi
für beliebige |bi ∈ W.
Seien |bj i die Eigenvektoren von B im Hilbert-Raum W, dann ist auch |a, bj i Eigenvektor von B (genauer, von 1 ⊗ B) in V ⊗ W, B |a, bj i = bj |a, bj i
für beliebige |ai ∈ V .
Es folgt, dass |ai , bj i gemeinsame Eigenvektoren von A und B sind.
19.14
Der Hilbertsche Funktionenraum L2
Die Elemente von L2 sind die komplexwertigen Funktionen f (x), g(x), ..., die auf einem Intervall [a, b] quadratisch (Lebesque) integrierbar sind, d.h. Zb a
2
dx |f (x)| < ∞
mit dem Skalarprodukt hf |gi =
Z
b
dx f ∗ (x)g(x)
a ∗
= hg|f i . Die Intervallgrenzen können auch ∞ sein. Wir betrachten eine abzählbare Menge von Funktionen ui (x) ∈ L2 ,
i = 1, 2, ....∞.
Die Menge ist orthonormiert, wenn ∗
hui |uk i ≡
Z
dx u∗i (x)uk (x) = δik .
19.15 Vollständigkeit in L2
261
Diese Menge bildet eine Basis, wenn jede Funktion f (x) ∈ L2 eindeutig in den ui entwickelt werden kann, X fi ui (x) . (19.24) f (x) = i
Beispiel: Wenn man die Menge der Polynome PN = a0 1 + a1 x + a2 x2 + ..an xN , N = 0, 1, 2...∞ über dem Intervall (−1, +1) orthonormiert, dann erhält man die Legendre-Polynome. In einer solchen Basis kann man von Komponenten der Funktion sprechen, X fl huk |ul i = fk huk |f i = l
=
X
fl
l
Z
dx u∗k (x)ul (x) =
X
fl δkl
l
fk = huk |f i =
Z
!
dx u∗i (x)f (x).
Wie im Endlichdimensionalen wird eine Funktion durch ihre Komponenten dargestellt. Auch das Skalarprodukt lässt sich durch die Komponenten ausdrücken, * + X X hf |gi = fk uk gl ul k l X X = fk∗ gl huk |ul i = fk∗ gk . k,l
19.15
k
Vollständigkeit in L2
Wenn die {ui (x)} eine Basis bilden, dann gilt f (x) =
X
fi ui (x) =
i
= =
X Z
Z
Diese Gleichung ist erfüllt für X i
i
X i
hui |f i ui (x)
dx0 u∗i (x0 )f (x0 ) ui (x)
dx f (x ) 0
0
"
X
u∗i (x0 )ui (x)
i
u∗i (x0 )ui (x) = δ(x0 − x).
Dies ist die Vollständigkeitsrelation.
#
.
262
19.16
Kapitel 19. Komplexe Vektorräume
Konvergenz
Mit Hilfe der Methode der kleinsten Quadrate können wir eine beliebige stetige Funktion f (x) durch eine Funktion fN (x) aus einem N-dimensionalen Funktionenraum approximieren. Man minimiert Z 2 ΔN = hf − fN |f − fN i = dx |f − fN | . Dann nimmt ΔN ein Minimum an für fN (x) =
N X
fk uk (x)
k=1
mit Es gilt auch
fk = huk |f i . N X
hf |f i ≥
k=1
|fk |2 .
Wir gehen jetzt über zum abzählbar-unendlichdimensionalen Funktionen-Raum. Wenn lim ΔN = 0,
N →∞
dann sagt man, dass fN (x) gegen f (x) konvergiert und, dass hf |f i =
∞ X
k=1
|fk |2 .
(19.25)
Beispiel: Betrachte die Menge aller komplexwertigen quadratintegrierbaren Funktionen auf dem Intervall x ∈ [0, 1], die an den Endpunkten verschwinden. Sie bildet offensichtlich einen komplexen Vektorraum. Wir identifizieren |f i mit f (x). Mit dem Skalarprodukt hf |gi =
Z1
dxf ∗ (x)g(x)
0
kann man zeigen, dass die Vektoren einen Hilbert-Raum bilden. Die Fourier-Analyse liefert eine Basis √ un (x) = 2 sin(nπx) . Ein Ergebnis der Fourier-Theorie ist, dass jede quadratintegrierbare Funktion, die am Rand verschwindet, in eine Fourier-Reihe entwickelt werden kann, g(x) =
∞ X
n=1
αn un (x)
19.17 Lineare Operatoren im Hilbertschen Funktionenraum mit
263
αn = hun |gi .
Die Norm des Vektors |gi ist gegeben durch | |gi | =
19.17
∞ X
n=1
|αn |2 .
Lineare Operatoren im Hilbertschen Funktionenraum
Ein Operator A macht aus einer Funktion f (x) eine andere Funktion g(x) g = Af.
(19.26)
A ist ein linearer Operator, wenn A(f1 + f2 ) = Af1 + Af2 ;
A(cf ) = cAf.
Beispiele für lineare Operatoren sind g(x) = ( oder g(x) =
d d2 +a + b)f (x) dx2 dx Z
A(x, x0 )f (x0 )dx0 .
(19.27)
Wir können die Zerlegung nach Basisfunktionen {uk (x)}, f (x) =
N X
fk uk (x), g(x) =
k=1
N X
gl ul (x) ,
l=1
in Gl. (19.27) einsetzen und erhalten X l
gl ul (x) =
XZ
fk A(x, x0 )uk (x0 )dx0 .
k
Multiplikation mit ui (x) und Integration über x liefert XZ X Z gl dxui (x)ul (x) = dxdx0 ui (x)A(x, x0 )uk (x0 )fk l
oder
k
gi =
X
Aik fk
k
mit Aik = (ui , Auk ) =
Z
dxdx0 ui (x)A(x, x0 )uk (x0 ) .
(19.28)
264
Kapitel 19. Komplexe Vektorräume
Wir haben also die Operator-Gleichung g = Af ersetzt durch eine Matrix-Gleichung (19.28). Die Matrix ist im Allgemeinen unendlichdimensional. Bemerkung: Im unendlichdimensionalen Fall gibt es lineare Operatoren, die nicht auf dem ganzen Hilbert-Raum definiert sind. Ein Beispiel wäre der lineare Operator Af =
∂f , ∂x
im oben beschriebenen Hilbertschen Funktionenraum L2 . Es gibt viele quadratintegrierbare Funktionen (z.B. Stufenfunktionen), die nicht differenzierbar sind. Der Definitionsbereich dieses Operators sind nur solche quadratintegrablen Funktionen, deren Ableitung auch quadratintegrabel ist. Das Definitionsbereichs- und Wertebereichsproblem kompliziert die Behandlung linearer Operatoren auch in der Quantenmechanik beträchtlich. Wir werden dieses Problem soweit möglich ausblenden.
19.18
Nicht-Normierbare Basen
Die oben eingeführten Basen bestehen aus quadratintegrierbaren Funktionen. Oft ist es bequem auch Basen zu betrachten, die nicht zu L2 gehören. Als Beispiel diskutieren wir die Fourier-Transformation einer Funktion f (x) ∈ L2 , d.h. die Entwicklung 1 f (x) = √ 2π 1 f˜(p) = √ 2π
+∞ Z dpf˜(p)eipx
(19.29)
−∞
+∞ Z dxf (x)e−ipx .
−∞
Wir können
1 vp (x) = √ eipx 2π als Basisfunktionen auffassen. Dann lautet Gl. (19.29): +∞ Z dpf˜(p)vp (x) f (x) = −∞
mit
+∞ Z f˜(p) = hvp |f i = dxvp∗ (x)f (x) . −∞
Die f˜(p) sind die Komponenten der Funktion f (x). Die Funktion f (x) ist laut Voraussetzung aus L2 . Wegen des Parsevalschen Theorems Z Z hf |f i = dx|f (x)|2 = dp|f˜(p)|2
ist damit auch f˜(p) aus L2 .
19.18 Nicht-Normierbare Basen
265
Die Basisfunktionen selbst sind nicht normierbar, Z +∞ Z +∞ 1 dx|vp (x)|2 = dx = ∞. 2π −∞ −∞ Sie gehören daher nicht zu den Vektoren des Hilbertraumes. Man bezeichnet sie manchmal als fiktive oder uneigentliche Vektoren. Die Vollständigkeitsrelation gilt jedoch, Z Z 0 1 dpvp (x0 )vp (x) = dpeip(x−x ) = δ(x − x0 ) . 2π Wir wollen auch noch das Skalarprodukt hvp |vp0 i betrachten, um zu sehen, ob so etwas wie Orthogonalität existiert: Z Z 0 1 hvp |vp0 i = dxvp∗ (x)vp0 (x) = dxe−i(p−p )x = δ(p − p0 ) . 2π Dies ist die Verallgemeinerung des Kroneckerschen Deltasymbols für diskrete Indizes auf kontinuierliche Indizes. Anmerkungen: a) Die Basisvektoren eines Hermiteschen Operators, einschließlich der uneigentlichen, bilden ein vollständiges Basissystem. Die kontinuierlichen Basen sind beim Rechnen nützlich, man darf aber nicht vergessen, dass physikalische Zustände quadratintegrierbare Vektoren (Funktionen) sein müssen. b) Die Deltafunktion kann als Basis aufgefasst werden, da Z f (x) = dx0 f (x0 )δ(x − x0 ) .
Kapitel 20
Grundlagen der Quantenmechanik Die Quantentheorie ist ein mathematisches Abbild der physikalischen Welt. Man muss definieren, durch welche mathematischen Objekte physikalische Zustände, der Messprozess, Observable und Dynamik dargestellt werden. Wenn möglich, sollte sich der mathematische Formalismus anhand einiger Experimente auch begründen lassen. Dies wird z. B. in den Vorlesungen von J. Schwinger (J. Schwinger 2003) durch eine eingehende Untersuchung selektiver Messungen an Stern-Gerlach-Experimenten versucht. Eine solche Analyse ist allerdings umfangreich und technisch. Wir folgen daher den umgekehrten Weg, formulieren Postulate und zeigen dann, dass sie die teilweise erstaunlichen Ergebnisse der Quanten-Experimente erklären.
20.1
Zustände und Observable in der klassischen Mechanik
In der klassischen Mechanik wird der Zustand eines Systems von Massenpunkten durch einen einzigen Punkt (q, p) im 2N -dimensionalen Phasenraum bestimmt, wo N die Zahl der Freiheitsgrade des Systems ist. Dieser kann in einen Euklidischen Vektorraum mit Komponenten (q1 , ...qN, p1 , ...pN ) abgebildet werden. Für einen Massenpunkt ist der Phasenraum 6-dimensional und besteht aus den Vektoren (~x, p~). Für einen starren Körper besteht der 12-dimensionale Phasenraum aus den Vektoren ~ wo α, β, γ die Euler-Winkel, L ~ der Drehimpuls und ~xCM , p~CM (~xCM , α, β, γ, p~CM , L), die Schwerpunkt-Koordinaten bzw. Impulse sind. Man kann auch für Felder einen klassischen Phasenraum definieren, der jetzt aber ∞-dimensional ist und aus den Feldern und ihren kanonisch konjugierten Impulsen besteht. Ist ein Punkt im Phasenraum gegeben, so ist die weitere zeitliche Entwicklung eindeutig festgelegt (Differentialgleichungen 1. Ordnung). Der Zustandsvektor des Systems wird durch einen Punkt im Phasenraum charakterisiert. Die physikalischen Messgrößen, oder Observable, sind Funktionen
268
Kapitel 20. Grundlagen der Quantenmechanik
F (qi , pi ), die zu jeder festen Zeit t einen wohldefinierten reellen Wert annehmen, der eindeutig und beliebig genau bestimmt ist, wenn man qi (t) und pi (t) kennt. Beispiele für eine Observable bilden die potentielle Energie V (q1, ....qN ) und die Hamilton-Funktion H=
N X p2i + V (q1 , ....qN ) 2mi i=1
als Summe von kinetischer und potentieller Energie. Die Komponenten der Zustandsvektoren qi und pi sind selbst Observable. Es besteht also im Prinzip kein Unterschied zwischen Zustand und Observable.
20.2
Postulate der Quantenmechanik
Der fundamentale Unterschied zur klassischen Mechanik ist, dass wir in der Quantenmechanik zwischen Zustand und Observable unterscheiden müssen. 1. Postulat: Zu jedem Zeitpunkt wird der Zustand eines quantenmechanischen Systems durch einen komplexen Vektor im Hilbert-Raum der Zustände beschrieben. In der klassischen Mechanik traten nur reelle Vektoren und Matrizen auf (wenn wir auch manchmal aus rechentechnischen Gründen komplexe Größen einführten). In der Quantenmechanik ist ein Zustand ein komplexer Vektor |Ψi in einem vollständigen, komplexen Vektorraum mit Skalarprodukt (Hilbert-Raum). Die Identifizierung eines Zustandes mit einem Vektor im Hilbertraum bedeutet, dass auch die Superposition von zwei Zuständen einen möglichen Zustand des Systems darstellt. Diese Postulat hat weitreichende Konsequenzen. Ist z.B. |Ψ1 i der Zustand eines Teilchens am Punkt ~x1 und |Ψ2 i der Zustand des selben Teilchens am Punkt ~x2 , dann ist auch die Superposition des Teilchens an verschiedenen Punkten ein möglicher Zustand. Dieses Postulat wird durch viele Experimente, z.B. das Doppelspalt-Experiment mit Elektronen, bestätigt. Ein Zustand, der durch einen Vektor im Hilbert-Raum beschrieben werden kann, heißt reiner Zustand. Zwei Zustände |Ψi und eia |Ψi beschreiben dasselbe physikalische System. Die relative Phase zwischen zwei Zuständen ist jedoch signifikant. Wir identifizieren a |Ψ1 i + b |Ψ2 i mit eiα (a |Ψ1 i + b |Ψ2 i) aber nicht mit a |Ψ1 i + eiα b |Ψ2 i. Diese Aussage folgt erst aus den Postulaten 2-4, sei aber hier schon erwähnt. Der Einfachheit halber nehmen wir zunächst an, dass der Vektorraum N -dimensional oder abzählbar unendlichdimensional ist. 2. Postulat: Jede Observable eines physikalischen Systems entspricht einem Hermiteschen Operator, der auf die Zustandsvektoren wirkt. Eine Observable ist eine Eigenschaft eines physikalischen Systems, die gemessen werden kann. Die Eigenzustände eines Hermitischen Operators A bilden eine vollständige orthonormale Basis. Ein Hermitescher Operator A besitzt eine Spektraldarstellung.
20.2 Postulate der Quantenmechanik
269
3. Postulat: Eine einzelne Messung einer Observablen A liefert einen der möglichen Eigenwerte des Operators. Einem Messprozess für eine bestimmte Observable an einem System |Ψi entspricht die Anwendung des zugehörigen Operators A auf den physikalischen Zustandsvektor |Ψi. Das Messergebnis sollte reell sein. Dies ist der Fall, da die Eigenwerte eines Hermiteschen Operators reell sind. Die Folgerungen des 3. Postulats für Operatoren mit diskretem Spektrum sind gravierend. So liefert eine Messung der Energieniveaus des Wassestoffatoms nur diskrete Werte. Dies ist der Ursprung der Bezeichnung „Quantum“. Wenn die Observable ein kontinuierliches Spektrum aufweist, wie Ort und Impuls, dann ist das 3. Postulat nicht so überraschend. Die Eigenwerte einer Observablen A werden mit gewissen Wahrscheinlichkeiten gemessen. Diese werden durch das 4. Postulat und die Bornsche Regel bestimmt. 4. Postulat (Nicht-entarteter Eigenwert): Die Wahrscheinlichkeit bei einer Messung einer Observablen A an einem Zustand |Ψi den (nicht-entarteten) Eigenwert an zu finden, ist gegeben durch 2
w(an ) = |han |Ψi| , d.h. durch das Quadrat des Skalarproduktes von |Ψi mit dem Eigenzustand |an i von A. • Die komplexen Zahlen han |Ψi heißen Wahrscheinlichkeitsamplituden. • Die Zustände werden als normiert vorausgesetzt, hΨ|Ψi = 1 ham |an i = δmn Für Observable mit kontinuierlichem Spektrum ersetzt man δmn durch die Diracsche δ-Funktion, z.B. δ(x − x0 ) für den Ortsoperator. • Wenn das System vor der Messung in einem Eigenzustand ist, dann ist die Wahrscheinlichkeit diesen Eigenwert zu messen gleich 1. Im Allgemeinen ist ein System nicht in einem Eigenzustand. Ein generischer Zustand kann aber als Superposition der Eigenzustände von A dargestellt werden (Vollständigkeit), X |Ψi = cl |al i . l
Wenn wir annehmen, dass der Eigenwert an nicht entartet ist, dann ist die Wahrscheinlichkeit den Wert an zu messen X 2 w(an ) = |han |Ψi| = | han | cl |al i |2 =|
X l
l
cl δnl | = |cn | . 2
2
270
Kapitel 20. Grundlagen der Quantenmechanik
Wir hatten verlangt, dass die physikalische Zustände normiert sein sollen, X 2 |cn | = 1 . hΨ|Ψi = 1 → n
Die Wahrscheinlichkeit irgendeinen Wert zu messen ist gleich eins.
4. Postulat (allgemeiner Fall): Die Wahrscheinlichkeit bei einer Messung einer Observablen A an einem Zustand |Ψi den möglicherweise entarteten Eigenwert ak zu finden, ist gegeben durch w(ak ) = |Pk |Ψi|
2
= hΨ|Pk |Ψi ,
wo Pk der Projektionsoperator auf den Unterraum ist, der durch die entarteten Eigenvektoren |ak,i i , i = 1....d(ki ) aufgespannt wird und d(ki ) der Entartunsgrad des Eigenwertes ak ist. Sei z.B. der Zustand |ak i 2-fach entartet. Wir wählen eine orthogonale Basis |ak,1 i,|ak,2 i im Eigenraum, mit Eigenwerten ak,1 = ak,2 = ak . Dann ist 2
2
w(ak ) = |hak,1 |Ψi| + |hak,2 |Ψi| = hΨ| |ak,1 i hak,1 | |Ψi + hΨ| |ak,2 i hak,2 | |Ψi = hΨ|Pk |Ψi
die Wahrscheinlichkeit den Eigenwert ak zu messen, wo Pk der Projektionsoperator Pk = | |ak,1 i hak,1 | + | |ak,2 i hak,2 | ist (Pk2 = Pk ). Im allgemeineren Fall, wenn der Eigenwert ak d(k)-fach entartet ist, gilt d(k)
Pk =
X i=1
Pk,i
mit Pk,i = |ak,i i hak,i | .
(20.1)
Eine Entartung der Zustände bildet nicht etwa die seltene Ausnahme in Quantensystemen, sondern kommt durchaus häufig vor, z.B. bei den Energie-Eigenzuständen des Wasserstoffatoms. Eine etwas andere Formulierung des 4. Postulats ist die Bornsche Regel. Bornsche Regel: Die Wahrscheinlichkeit, ein im Zustand |Ψi präpariertes System im Zustand |Φi zu finden, ist gleich dem Betragsquadrat des Skalarprodukts hΦ|Ψi, w|Ψi→|Φi = | hΦ|Ψi |2 .
(20.2)
Das 4. Postulat ist nicht unbedingt ein unabhängiges Postulat, da es aus der HilbertRaum Struktur (1. Postulat) folgt, wenn man plausible Annahmen über Wahrscheinlichkeiten macht. Die ist die Aussage eines von Gleason 1957 bewiesenen wichtigen Theorems1 . 1
Gleason, A.M., Journal of Mathematics and Mechanics 6 (1957), 885
20.2 Postulate der Quantenmechanik
271
Erwartungswert: Nach den Regeln der Wahrscheinlichkeitsrechnung können wir den Mittelwert oder den Erwartungswert der Observablen A bestimmen. Wenn |cn |2 die Wahrscheinlichkeit ist, für die Observable A der Wert an zu messen, dann ist der Erwartungswert (Mittelwert) von A gegeben durch X an |cn |2 . hAi = n
Wir zeigen jetzt, dass der Erwartungswert von A in einem System |Ψi = gegeben ist durch
hAi = hΨ|A|Ψi .
Beweis: hΨ|A|Ψi = =
X k,l
X k,l
=
X k
P l
cl |al i
(20.3)
c∗k cl hak |A|al i c∗k cl al hak |al i = 2
ak |ck | =
X
X
c∗k cl ak δkl
k,l
ak w(ak ) .
(20.4)
k
Der Erwartungswert hΨ|A|Ψi der Observablen A im Zustand |Ψi ist der Mittelwert über eine große Zahl von Messungen. Zur Berechnung des Erwartungswertes brauchen wir also weder Eigenvektoren noch Eigenwerte. Dafür erhalten wir aber auch keine Information über mögliche Messwerte und deren Wahrscheinlichkeiten. 5. Postulat (Nicht-entarteter Eigenwert): Unmittebar nach einer Messung der Observablen A an einem Zustand |Ψi , die den nicht-entarteten Eigenwert an ergeben hat, befindet sich das System in normierten Eigenzustand |an i. Man spricht von der Reduktion oder dem Kollaps des Zustandes. Nach einer Einzelmessung der Observablen A, die das Ergebnis an lieferte, befindet sich das System plötzlich im Zustand |Ψi = |an i. Die Interpretation des 5. Postulats ist umstritten. Die Frage stellt sich, wie genau und wann der Kollaps passiert. Bei der ersten Messung ist das Ergebnis unbestimmt. Wird die Messung unmittelbar darauf wiederholt, so ist das Ergebnis nicht mehr statistisch verteilt, das zweite Ergebnis ist mit Sicherheit gleich an . Es sei angemerkt, dass die Messung |Ψi durch |an i ersetzt und nicht durch 2 |han |Ψi| |an i. Die Reduktion des Zustandes ändert die Normierung nicht. Im Falle von entarteten Eigenzuständen lautet das 5. Postulat 5. Postulat (Allgemeiner Fall): Unmittelbar nach einer Messung der Observablen A an einem Zustand |Ψi , die den möglicherweise entarteten Eigenwert ak ergeben hat, befindet sich das System im normierten Eigenzustand Pn |Ψi , hΨ|Pn |Ψi wo Pn in Gl. (20.1) gegeben ist.
272
Kapitel 20. Grundlagen der Quantenmechanik
Die Folgerungen aus diesen Vorschriften sind dramatisch. Wenn eine Observable A an P einem generischen Zustand |Ψi = ck |ak i gemessen wird, dann hat diese Observable vor der Messung keinen wohldefinierten scharfen Wert, sondern nur einen Mittelwert (den Erwartungswert), den man erhält, wenn man die Messung vielfach an identisch präparierten Systemen wiederholt. Eine einzelne Messung liefert einen der möglichen 2 Eigenwerte aj , und zwar mit Wahrscheinlichkeit |cj | . Diese eingeschränkte Beobachtbarkeit ist eine fundamentale Eigenschaft unserer Welt, die durch unzählige Experimente bestätigt wurde. Reines Ensemble: Um den Erwartungswert zu bestimmen müssen wir eine große Zahl von Experimenten an identisch präparierten quantenmechanischen Systemen (identische Zustände) ausführen. Diese Kollektion von identisch präparierten Systemen nennt man reines Ensemble. Zum Schluss betrachten wir den Grenzwert N → ∞. Der einfachere Fall besteht, wenn abzählbar unendlich viele Eigenwerte existieren. In diesem Fall können die obigen Überlegungen einfach übernommen werden. Wenn sich unter den Observablen Operatoren mit kontinuierlichem Spektrum befinden, wie z.B. der Impulsoperator, dann ist die Mathematik komplizierter. Wir identifizieren zunächst Observable mit Matrizen (Heisenberg 1925). Unbestimmtheitsrelationen: Eine Observable A wird an einem Zustand |Ψi gemessen. Wir definieren das Schwankungsquadrat oder die Dispersion durch
2 (ΔA)2 = A2 − hAi
= (A − hAi)2 , wo hAi ≡ hΨ|A|Ψi der Erwartungswert (Mittelwert) der Observablen A ist.
Für Hermitesche Operatoren gilt die Heisenbergsche Unbestimmtheits- oder Unschärferelation, 1 ΔAΔB ≥ | h[A, B]i | . (20.5) 2 Die Heisenbergsche Unbestimmtheitsrelation besagt, dass zwei nicht-vertauschende Observable nicht gleichzeitig scharf gemessen werden können. Es gibt keine gemeinsamen Eigenzustände. Beweis: In der Schwarzschen Ungleichung | hΦ|Ψi |2 ≤ | hΦ|Φi || hΨ|Ψi | setzen wir Dann ist
|Φi ⇒ (A − hAi) |Ψi ;
|Ψi ⇒ (B − hBi) |Ψi .
| hΦ|Φi | ⇒ | hΨ| (A − hAi)(A − hAi) |Ψi | = (ΔA)2
| hΨ|Ψi | ⇒ | hΨ| (B − hBi)(B − hBi) |Ψi | = (ΔB)2 .
(20.6)
20.2 Postulate der Quantenmechanik
273
Mit Gl. (20.6) erhalten wir (ΔA)2 (ΔB)2 ≥ | hΨ| (A − hAi)|(B − hBi) |Ψi |2 . Für ein Produkt zweier Hermitescher Operatoren gilt die allgemeine Zerlegung in einen Hermiteschen und einen Anti-Hermiteschen Anteil F ∙G= da
1 1 [F, G]+ + [F, G] , 2 2
†
Damit wird
[F G ± GF ] = [G† F † ± F † G† ] = ± [F G ± GF ] . | hΨ|(A − hAi)(B − hBi |Ψi |2 2 1 1 = Ψ| [(A − hAi), (B − hBi]+ |Ψ + hΨ|[A, B]|Ψi . 2 2
Der erste Term ist reell, der zweite rein imaginär. Da |a + ib|2 = a2 + b2 erhalten wir 1 1 (ΔA)2 (ΔB)2 ≥ | hΨ| [(A − hAi), (B − hBi)]+ |Ψi |2 + | hΨ|[A, B]|Ψi |2 2 2 1 2 ≥ | hΨ|[A, B]|Ψi | . 2 Aus der Unschärferelation folgt: • Zwei Observable können gleichzeitig scharf gemessen werden, wenn sie vertauschen. Die Bedingung ist auch hinreichend. Die hier abgeleitete Unbestimmtheitsrelation ist eine intrinsische Eigenschaft der Quantentheorie, sie hat nichts damit zu tun, dass die Messung der einen Observablen eine Störung des Systems verursacht, die sich auf die anschließende Messung der zweiten, nicht-kompatiblen, Observablen auswirkt. Wie kann man überhaupt gleichzeitig den Erwartungswert zweier nicht vertauschender Observable an einem Quantensystem messen? Wir gehen aus von einem Ensemble, d.h. von einer sehr großen Zahl gleich präparierter Systeme, die alle im Zustand |Ψi sind. Dann teilen wir das Ensemble in zwei Hälften. An der einen messen wir die Observable A, an der anderen die Observable B und berechnen die zugehörigen Schwankungsquadrate. Diese erfüllen dann die Heisenbergsche Unbestimmtheitsrelation Gl. (20.5). Manche Autoren beziehen die Unbestimmtheitsrelation auf ein einzelnes System. „Gleichzeitige“ Messung zweier Observabler (z.B. Ort und Impuls) bedeutet dann, dass eine Observable unmittelbar nach der anderen an diesem einen System gemessen wird. Anschließend werden diese Messungen sehr oft wiederholt. Die Messung der ersten Observablen führt auf eine Unschärfe, die sich bei der anschließenden Messung der zweiten Observablen zusätzlich auswirkt. Eine genaue Analyse zeigt, dass dann der Faktor 12 in der Unbestimmtheitsrelation durch 1 ersetzt wird.
274
Kapitel 20. Grundlagen der Quantenmechanik
Vertauschende Observable: Meist wird ein physikalisches System durch mehrere Observable A, B, C, .... (Ort, Energie, Impuls, Drehimpuls, Spin,..) beschrieben. Wenn zwei Operatoren A, B vertauschen, [A, B] = 0, dann können beide Observable gleichzeitig gemessen werden, d.h. es gibt gemeinsame Eigenzustände. Genauer: Wenn zwei Operatoren vertauschen, dann kann man aus den jeweiligen Eigenvektoren einen Produktraum konstruieren, in dem dann gemeinsame Eigenvektoren, z.B. Eigenvektoren von A⊗B oder A⊗1+1⊗B existieren. Die beiden Operatoren sind kompatibel. 6. Postulat: Der Zustandsraum eines zusammengesetzten Systems (z.B. von zwei oder mehr Elektronen) ist das Tensorprodukt der einzelnen Zustandsräume. Wenn eine Komponente im Zustand |Ψ1 i und die zweite im Zustand |Ψ2 i ist, dann ist ein möglicher Zustand des zusammengesetzten Systems |Ψ1 i ⊗ |Ψ2 i. Nicht alle Vektoren im Produktraum können als Tensorprodukt von Zuständen der Einzelsysteme beschrieben werden. Dies wird im später verdeutlicht.
20.3
Dynamik
Eine klassische dynamische Observable (Messgröße) kann implizit oder explizit von der Zeit abhängen. Die implizite Abhängigkeit steckt in den Variablen q(t) und p(t). Eine explizite Zeitabhängigkeit entsteht, wenn auf das System eine äußere zeitabhängige ~ Kraft wirkt, z.B. wenn sich ein Teilchen in einem äußeren Magnetfeld B(t) bewegt. Wir betrachten zunächst nur Systeme mit ausschließlich impliziter Zeitabhängigkeit. In der klassischen Hamiltonschen Mechanik eines Systems von Teilchen mit 2s Freiheitsgraden und dem Phasenraum (q = q1 , q2 , ...qs ; p = p1 , p2 , ...ps ) erfüllt eine Observable F (q, p) die Bewegungsgleichung dF = {F, H}, dt
(20.7)
wo H die Hamilton-Funktion ist und {, } die Poisson-Klammer, die definiert ist durch {F, G} =
s X ∂F ∂G ∂G ∂F − . ∂qi ∂pi ∂qi ∂pi i=1
Speziell gilt für die fundamentale Klammer: {qi , pk } = δik . 6. Postulat: In der Quantenmechanik ersetzt man die Poisson-Klammer durch den Kommutator entsprechend der Diracschen Quantisierungsvorschrift , {F, G} →
1 [F, G] , i}
(20.8)
20.3 Dynamik
275
wo } eine Konstante mit der Dimension einer Wirkung ist, die experimentell bestimmt werden muss, } = 1.054 571 68(18) × 10−34 Joule sek
Plancksches Wirkungsquantum
Die imaginäre Einheit i muss eingeführt werden, damit man man die klassische Mechanik als Grenzfall der Quantenmechanik erhält (siehe unten). Die fundamentale Poisson-Klammer geht über in [Qi , Pk ] = i}δik , oder in eine Dimension
[Q, P ] = i} .
Später werden wir sehen, dass wir Q und P als Differentialoperatoren darstellen können. Ort und Impuls vertauschen nicht, es gibt also keine gemeinsamen Eigenzustände. Die Drehimpuls-Poisson- Klammer {Lx , Ly } = Lz
geht in der Quantenmechanik über in
[Lx , Ly ] = i}Lz . Ehrenfest-Theorem: Die klassische Mechanik folgt aus der Quantenmechanik und nicht umgekehrt. Dieser Übergang ergibt sich präzise auf folgende Weise: Im Limes } → 0 gehen die Erwartungswerte der Operatoren in die klassischen Observablen über. Diese Aussage gilt natürlich nicht für Observable, wie den Spin des Elektrons, für die kein klassisches Äquivalent existiert. Die Bewegungsgleichung der Quantenmechanik muss daher für die Erwartungswerte die Form haben d 1 hF i = h[F, H]i dt i} und bei expliziter Zeitabhängigkeit
(20.9)
∂ 1 d hF i = hF i + h[F, H]i . (20.10) dt ∂t i} Im Limes } → 0 erfüllen die Mittelwerte der Quantenmechanik die Bewegungsgleichungen der klassischen Hamiltonschen Mechanik. Dies ist das Ehrenfest-Theorem. Die Formulierung: „Die Erwartungswerte der Quantenmechanik gehorchen den klassischen Gesetzen der Mechanik“ ist in dieser allgemeinen Form nicht ganz richtig!. Da nur die Erwartungswerte echte Messgrößen sind, folgt, dass Zustände und Operatoren nur bis auf unitäre Transformationen |Ψi → |Ψ0 i = U |Ψi
eindeutig festgelegt sind, da
und F → F 0 = U F U †
mit U † = U −1
hΨ0 |F 0 |Ψ0 i = Ψ|U † U F U † U |Ψ = hΨ|F |Ψi .
Die Ausgangsformel Gl. (20.10) lässt sich auf verschiedene Weise (Bilder) realisieren:
276
20.4
Kapitel 20. Grundlagen der Quantenmechanik
Heisenberg-Bild
Die Zustände sind zeitunabhängig, die Zeitabhängigkeit steckt nur in den Operatoren, d.h. sie erfüllen die Heisenbergsche Bewegungsgleichung dF (t) ∂ 1 = F (t) + [F (t), H] , dt ∂t i}
d |Ψi = 0. dt
(20.11)
Dies ist die einfachste Möglichkeit die Grundgleichung (20.10) zu erfüllen, ist also eine hinreichende Bedingung. Wenn der Hamilton-Operator nicht explizit von der Zeit abhängt, gilt ∂ dH(t) = H =0. dt ∂t Damit lautet die Lösung der Heisenbergschen Gleichung F (t) = U −1 (t)F (0)U (t),
(20.12)
wo U (t) der Zeitentwicklungsoperator ist, 1 −1 −1 U (t) = exp Ht , U (t) = exp Ht . i} i} Offensichtlich ist U (t) unitär, U U † = U † U = 1. Beweis: Folgende Ableitungen werden benötigt, dU (t) 1 1 = HU (t) = U (t)H, dt i} i} −1 dU −1 (t) −1 = HU (t) , dt i} wo wir verwendet haben, dass U nur eine Funktion von H ist und daher mit H vertauscht. Damit wird d d U −1 (t)F (0)U (t) F (t) = dt dt 1 = −HU −1 (t)F (0)U (t) + U −1 (t)F (0)U (t)H i} 1 [F (t), H] . = i}
20.5
(20.13)
Schrödinger-Bild
Setzen wir die Lösung Gl. (20.12) in die Grundgleichung (20.10) ein, so erhalten wir d
1
Ψ|U −1 (t)F (0)U (t)|Ψ = Ψ|[U (t)−1 F (0)U (t), H]|Ψ dt i} 1
= Ψ|U (t)−1 [F (0), H]U (t)|Ψ , i}
20.5 Schrödinger-Bild
277
wo wir wieder verwenden haben, dass [H, U ] = 0 ist. Wir können diese Gleichung auch schreiben als 1 d hΨ, t|F (0)|Ψ, ti = hΨ, t|[F (0), H]|Ψ, ti , dt i} wo wir jetzt die Zeitabhängigkeit in die Zustände geschoben haben, 1
|Ψ(t)i ≡ U (t) |Ψi = e i} Ht |Ψ(0)i . Diese Zustände erfüllen offensichtlich die Differentialgleichung 1 d |Ψ(t)i = H |Ψ(t)i . dt i} Dies ist die (basisunabhängige) Schrödinger-Gleichung. Sie ist der Ausgangspunkt für die meisten quantenmechanischen Rechnungen. Manchmal verwenden wir zur Klarheit die Notation: (H für Heisenberg) (S für Schrödinger)
|Ψ(0)i = |Ψi = |ΨiH |Ψ(t)i = |Ψ(t)iS
AH (t) = U † (t)AH (0)U (t) AS = AH (0),
( AS (t) = U (t)AH (t)U † (t))
(beachte HH = HS ≡ H) Im Schrödinger-Bild sind die Operatoren zeitunabhängig, die Zeitabhängigkeit steckt nur in den Zuständen. Wenn H nicht explizit von der Zeit abhängt, lautet die Lösung der Schrödinger-Gleichung 1 |Ψ(t)iS = e i} Ht |Ψ(0)iS
D.h. die zeitliche Änderung eines physikalischen Zustands erfolgt auf vollkommen deterministische Weise. Der Hamilton-Operator erzeugt die zeitliche Entwicklung der Zustände. Seine Eigenzustände spielen daher eine privilegierte Rolle. Zusammenfassung: d |ΨiH = 0 dt
dAH (t) 1 = [AH (t), H] dt i}
AH (t) = U † (t)AH (0)U (t) i}
mit U (t) = exp
d d |Ψ(t)iS = H |Ψ(t)iS AS = 0 dt dt 1 |Ψ(t)iS = e i} Ht |Ψ(0)iS . |Ψ(t)iS ≡ U (t) |ΨiH , AS = AH (0),
|ΨiH = |Ψ(0)iS
1 Ht i}
( AS (t) = U (t)AH (t)U † (t))
278
Kapitel 20. Grundlagen der Quantenmechanik
Für praktische Rechnungen erweist sich das Schrödinger-Bild, für theoretische Überlegungen oft das Heisenberg-Bild als günstiger. Wir sehen z.B. anhand von Gl. (20.13) sofort, dass hAi zeitunabhängig ist, wenn [A, H] = 0. Im Heisenberg-Bild ist die Analogie mit der klassischen Mechanik deutlicher und die Quantisierung von Feldern einfacher. Es ist klar, dass noch andere Bilder existieren, bei denen die Zeitabhängigkeit sowohl in den Zuständen als auch in den Operatoren steckt. Wenn der Hamilton-Operator in der Form geschrieben werden kann, dass H = H 0 + H1 , wo die Lösung der Heisenbergschen Bewegungsgleichung für H0 bekannt ist und H1 eine kleine Störung darstellt, dann arbeitet man vorteilhaft im Wechselwirkungsbild. Im Wechselwirkungsbild schiebt man die mit H0 verbundende Zeitabhängigkeit in die Operatoren und die mit H1 verbundene Zeitabhängigkeit in die Zustände. Dieses Bild eignet sich für die zeitabhängige Störungstheorie. Basiszustände: Betrachte die Eigenzustände einer Observablen A zur Zeit t = 0, A |al i = al |al i . Im Schrödinger-Bild ist A zeitunabhängig. Die Basisvektoren, als Lösung der Eigenwertgleichung müssen daher auch zeitunabhängig sein, |al iS = |al i . Die Basisvektoren verhalten sich also umgekehrt wie die Zustandsvektoren. Ein Schrödinger-Zustand lässt sich dann in Basisvektoren entwickeln |Ψ(t)iS =
X l
cl (t) |al i ,
wobei die Zeitabhängigkeit jetzt in den Entwicklungskoeffizienten steckt. Im Heisenberg-Bild ist die Situation umgekehrt, die Basisvektoren sind zeitabhängig |al , tiH ≡ U † (t) |al , 0iH = U † (t) |al i . D.h, die Basisvektoren entwickeln sich mit U † (t). Beweis, dass die so definierten |al , tiH Eigenzustände von AH (t) sind: AH (t) |al , tiH = AH (t)U † (t) |al i = U † (t)AH (0)U (t)U † (t) |al i
= U † (t)AH (0) |al i = U † (t)A |al i = al U † (t) |al i ,
da AH (0) = AS = A ist.
20.6 Energie-Eigenzustände
20.6
279
Energie-Eigenzustände
Wir nehmen wieder an, dass H nicht explizit von der Zeit abhängt und arbeiten im Schrödinger-Bild (den Index S lassen wir weg). Wir betrachten einen physikalischen Zustand |Ψ(t)i, der zur einer Zeit t0 ein Energie-Eigenzustand ist und wählen o.B.d.A. t0 = 0 , H |Ψ(0)i = E |Ψ(0)i .
Zur Zeit t befindet sich das System im Zustand 1
1
|Ψ(t)i = e i} Ht |Ψ(0)i = e i} Et |Ψ(0)i .
D.h. mit fortschreitender Zeit bleibt ein Energie-Eigenzustand ein Energie-Eigenzustand, 1
1
H |Ψ(t)i = He i} Et |Ψ(0)i = Ee i} Et |Ψ(0)i = E |Ψ(t)i . i
|Ψ(t)i ändert sich mit der Zeit nur um einen Phasenfaktor e− } Et , auf den es aber bei Messgrößen nicht ankommt. Solche Zustände bezeichnet man daher auch als stationäre Zustände. Sie sind die einzigen Zustände im Hilbertraum, die in ihrer zeitlichen Entwicklung keine Deformation erfahren. Sie eignen sich zur Beschreibung von Quantensystemen zwischen Störungen wie z.B. Messungen. Die Erwartungswerte beliebiger Observabler zwischen stationären Zuständen sind zeitlich konstant, 1
1
hΨ(t)| A |Ψ(t)i = hΨ(0)| e− i} Et Ae i} Et |Ψ(0)i = hΨ(0)| A |Ψ(0)i .
Dies gilt aber nicht für Überlagerungen von stationären Zuständen.
Entwicklung in Energie-Eigenzuständen: Wir nehmen wieder an, dass die Hamilton-Funktion H nicht explizit von der Zeit abhängt und, dass das Spektrum von H diskret ist. Die Eigenwertgleichung von H lautet H |En i = En |En i . (20.14) Dies ist die zeitunabhängige Schrödinger-Gleichung. Da H nicht von der Zeit abhängt, hängen auch die Eigenwerte En und die Eigenvektoren |En i nicht von der Zeit ab. Die Eigenvektoren bilden eine Basis, d.h. wir können einen beliebigen Zustand in Energieeigenzuständen entwickeln X |Ψ(t)i = cn (t) |En i , n
wo die Entwicklungskoeffizienten
cn (t) = hEn |Ψ(t)i
offensichtlich von t abhängen. Die Zeitabhängigkeit des Zustandes ist durch die zeitabhängige Schrödinger-Gleichung gegeben d |Ψ(t)i = H |Ψ(t)i dt X d X i} cn (t) |En i = En cn (t) |En i dt n n i}
280
Kapitel 20. Grundlagen der Quantenmechanik
oder, wenn wir von links mit hEm | multiplizieren, 1 d cm (t) = Em cm (t). dt i} Die Lösung dieser Differentialgleichung lautet
1 cn (t) = cn (0) exp En t . i} Damit wird |Ψ(t)i =
X
cn (0) exp
n
1 En t |En i . i}
(20.15)
Erwartungswert eines Operators B zwischen Superpositionen von EnergieEigenzuständen: Zur Zeit t=0 sei ein Zusstand durch folgende Überlagerung gegeben X |Ψ(0)i = cn (0) |En i . n
Wir betrachten die zeitliche Entwicklung des Erwartungswertes eines Operators B in diesem Zustand hBi = hΨ(t)| B |Ψ(t)i . Setzen wir Gl. (20.15) ein, so erhalten wir X 1 e i} (En −Em )t c∗m (0)cn (0) hEm | B |En i . hBi = m,n
Die Matrixelemente hEm | B |En i sind zeitlich konstant. Man erhält eine Summe von Termen, die mit Frequenz ωmn ≡
Em − En }
(Bohrsche Bedingung)
oszillieren. Die Bohrschen Frequenzen sind unabhängig vom Operator B. Für ein Atom oszillieren daher die Mittelwerte aller Observablen (elektrische Dipolmomente, . . . ) mit den Frequenzen ωmn . Es liegt nahe zu vermuten, dass Strahlung nur mit diesen Frequenzen absorbiert oder emittiert werden kann. Bemerkung: Im Allgemeinen braucht es für die eindeutige Bestimmung eines quantenmechanischen Systems neben H weitere Observable. Diese müssen kompatibel sein, sie müssen gleichzeitig mit H messbar sein, d.h. mit H vertauschen. Wir betrachten den Fall einer weiteren Observable A, die mit dem Hamilton-Operator vertauscht [A, H] = 0. Dann gibt es gemeinsame Eigenkets H |En ; ai i = En |En ; ai i ,
A |En ; ai i = ai |En ; ai i
20.6 Energie-Eigenzustände
281
nach denen wir einen beliebigen Zustand entwickeln können, X cn,i (t) |En ; ai i . |Ψ(t)i = n,i
Das Argument geht weiter genau wie oben, mit dem Ergebnis X 1 |Ψ(t)i = cn,i (0) exp En |En ; ai i . i} n,i Konstante der Bewegung: In der Quantenmechanik ist eine Konstante der Bewegung eine nicht explizit zeitabhängige Observable, die mit H vertauscht, ∂A = 0 und ∂t Dann folgt aus Gl. (20.10), d.h. aus
d dt
hAi =
[A, H] = 0. 1 i}
h[A, H]i, dass
d hΨ(t)| A |Ψ(t)i = 0 dt für beliebige Zustände |Ψ(t)i. Der Mittelwert von A ist also zeitlich konstant. Bemerkungen: 1. Die Schrödinger-Gleichung ist linear in der Zeitableitung, während die Newtonschen Bewegungsgleichungen quadratisch sind. 2. Die zeitliche Entwicklung eines Zustandes, die durch die Schrödinger-Gleichung gegeben ist, ist absolut deterministisch. Ist |Ψ(0)i gegeben, so lässt sich |Ψ(t)i zu einer späteren Zeit eindeutig berechnen. 3. Dagegen ist die Messung probabilistisch. Die Theorie macht keine definiten Vorhersagen über das Ergebnis einer Messung, nur Wahrscheinlichkeitsaussagen. 4. Wenn H = H(t) zeitabhängig wird, lässt sich das quantenmechanische Problem im Allgemeinen nur störungstheoretisch lösen. Dazu muss angenommen werden, dass H = H0 + H1 (t) mit konstantem H0 und H1 (t) H0 ist. Die klassische Mechanik ist ein in sich selbst völlig konsistenter abstrakter Formalismus. Die Quantenmechanik lässt sich jedoch auf keine Weise aus den Newtonschen Gleichungen ableiten. Die umgekehrte Situation ist der Fall, die Quantenmechanik im Heisenberg-Bild gleicht formal der Hamiltonschen Mechanik und führt für die Erwartungswerte von Observablen im Limes } → 0 auf die klassische Mechanik. Oft kann man allerdings die Quantenbeschreibung eines Systems aus der klassischen Hamiltonschen Formulierung erraten. In diesem Fall spricht man von kanonischer Quantisierung. Die kanonische Quantisierung generiert aber nicht die gesamte Quantenmechanik. Nicht alle quantenmechanische Observable, wie z.B. der Spin oder Konzepte wie das PauliPrinzip, haben ein klassisches Analogon. Die ganze Quantenmechanik lässt sich aus dem Experiment oder aus der übergeordneten Quantenfeldtheorie ableiten. Die kanonische Quantisierung dient als nützlicher Ausgangspunkt für die vollständige Formulierung.
282
Kapitel 20. Grundlagen der Quantenmechanik
Die oben aufgestellten Postulate erlauben unterschiedliche Interpretationen. Die populäre Kopenhagener Interpretation besagt, dass jede Messung einer Observablen unmittelbar zu einem Kollaps des Zustandes in einen der Eigenvektoren der Observablen, die in der Superposition aufscheinen, führt. Über die Ergebnisse können nur Wahrscheinlichkeitsaussagen gemacht werden. Die zeitliche Entwicklung der Zustände erfolgt dagegen vollkommen derterministisch. Wie dieser Kollaps des Zustandes passiert und woher die Bornschen Regeln kommen, werden nicht erklärt. Der Beobachter und die Messung werden klassisch behandelt. Dies ist sicher falsch. Der Beobachter, Messapparat und das ganze Universum folgen den selben quantenmechanischen Gesetzen. Die Kopenhagener Regeln funktionieren offensichtlich, daher müssen wir sie akzeptieren. Es bleibt aber das Problem, diese Regeln zu erklären. Es ist nicht einfach zu verstehen, wie ein Zustand gleichzeitig einer deterministischen Dynamik gehorcht, dann aber in einem ungenau definierten Messprozess einen probabilistischen Kollaps in einen der Eigenzustände erfährt. In der Kopenhagener Interpretation repräsentiert der Zustandsvektor unsere Kenntnis des betrachteten physikalischen Systems, er selbst besitzt keine physikalische Realität. Hätte der Zustandsvektor eine echte ontologische Bedeutung, so müsste es möglich sein den unbekannten Zustand eines einzelnen Quantensystems durch eine Reihe von Messungen zu bestimmen. Bei einer Messung findet man aber nur eines von vielen möglichen Ergebnissen. Dabei wird die ursprüngliche Zustand zerstört, er kollabiert. Weitere Messungen sagen nichts über den ursprünglichen Zustandsvektor aus. Niels Bohr war der Meinung, es sei nicht Aufgabe der Physik herauszufinden wie die Welt ist, sondern wie wir sie beschreiben können. Wäre dies allerdings die Einstellung von Galilei und Kopernikus gewesen, so würden wir vielleicht noch heute an das Ptolemäische Weltbild glauben. Neuere Entwicklungen legen nahe, dass das mysteriöse Phänomen des Kollapses des Zustandes durch die Theorie der Dekohärenz, die später kurz behandelt wird, erklärt werden kann.
Kapitel 21
Quantentheorie des Spins Im letzten Kapitel haben wir den kinematischen und dynamische Rahmen der Quantenmechanik aufgestellt, der viel allgemeiner als die elementare Wellenmechanik ist. Die Folgerungen werden aber erst klar, wenn wir physikalische Anwendungen betrachten. Wir untersuchen die Postulate der Quantenmechanik zuerst an ZweiZustandssystemen, d.h. Systemen, für die nur zwei Zustände von Bedeutung sind. Der zugehörige Hilbert-Raum ist so einfach, dass alle physikalischen Anwendungen analytisch berechnet werden können. Trotz dieser Einfachheit sind die quantenmechanische Effekte in Zwei-Zustandssystemen besonders deutlich ausgeprägt. Es ist nicht verwunderlich, dass viele aktuelle theoretische und experimentelle Untersuchungen, wie z.B. auf den Gebieten Kryptographie und Quantencomputer auf Zwei-Zustandssystemen basieren. Der Spin-Zustand eines Elektrons bildet einen typischen Repräsentanten für ein Zwei-Zustandssystem. Im Gegensatz zur klassischen Mechanik und zur Elektrodynamik lassen sich die allgemeinen Gesetze der Quantenmechanik induktiv aus einem einzigen Typ von Experiment ableiten. Die zuerst von Stern und Gerlach 1922 durchgeführten Experimente betreffen die magnetischen Eigenschaften eines Atomstrahles. Ein Magnetfeld induziert eine Magnetisierung in paramagnetischen Substanzen. Diese entsteht dadurch, dass die Magnetmomente der einzelnen Atome durch das Magnetfeld ausgerichtet werden, wobei die thermische Bewegung der Ausrichtung entgegen wirkt. Eine Messung der induzierten Magnetisierung stellt also einen indirekte Messung des atomaren Magnetmoments dar. Wir wollen hier nur zeigen, dass der abstrakt im vorigen Kapitel eingeführte Formalismus alle Einzelheiten der Stern-Gerlach Experimente beschreibt, das der Formalismus also hinreichend ist. Für die Notwendigkeit verweisen wir auf die Quantenmechanik Vorlesung von J. Schwinger (J. Schwinger, 2003) und Arbeiten von J.S. Bell.
284
21.1
Kapitel 21. Quantentheorie des Spins
Das Stern-Gerlach Experiment
Die Abbildung 1 zeigt schematisch den Aufbau des Stern-Gerlach (S-G-)Experiments. Ein Strahl von Silberatomen mit fest vorgegebener Energie wird in einem Ofen erzeugt, durchläuft ein stark inhomogenes Magnetfeld in y-Richtung und trifft auf eine Wand. Das Atom ist neutal (keine Lorentz-Kraft), hat aber ein Magnetmoment, das allein vom Eigendrehimpuls (Spin) des äußersten 5s-Elektrons herrührt (Kernspin vernachlässigt). Die restlichen 46 Elektronen im Silberatom haben keinen Netto-Drehimpuls und tragen daher nicht zum Magnetmoment des Atoms bei. ~ zeige in z-Richtung. Dann wirkt auf das Atom eine Der Gradient des Magnetfeldes B Kraft ∂Bz ~ μ ∙ B), ~ F~ = ∇(~ F z = μz . ∂z Das Magnetmoment ist proportional zum Spin ~s des Atoms (Elektrons), μ ~=
e ~s , mc
e mit dem gyromagnetischen Faktor mc . Für einen klassischen Drehimpuls wäre μ ~ = e ~ 2mc L, d.h. das quantenmechanische Magnetmoment für den Spin des Elektrons ist um einen Faktor 2 größer als erwartet (g-Faktor). Dieser Faktor folgt aus der DiracGleichung für Fermionen.
Anmerkung: Der g-Faktor ist nicht genau 2. Neue Experimente liefern 1 (g − 2) = 1.15965218 × 10−3 2 in Übereinstimmung mit der theoretischen Vorhersage der Quantenelektrodynamik.
Abbildung 21.1: Stern-Gerlach-Experiment
21.1 Das Stern-Gerlach Experiment
285
Der Strahl wird in z-Richtung aufgespalten. Die magnetischen Momente der einlaufenden Silberatome sind, wegen der hohen Temperatur, gleichmäßig über alle Richtungen verteilt. Da der einlaufende Strahl somit unpolarisiert ist, würde man, nachdem das Experiment eine Weile gelaufen ist, auf der Wand eine gleichmäßige Verteilung zwischen dem Maximal- und Minimalwert −mz und +mz erwarten. Experimentell beobachtet man aber, dass der Strahl nur auf zwei Punkte fällt. Es ist als ob die Elektronen in dem Ofen schon die Richtung des Magnetfeldes erahnt und sich entsprechend in z-Richtung ausgerichtet haben, was natürlich Unsinn ist. D.h. die z-Komponenten des magnetischen Moments eines Elektrons und damit auch des Spins nehmen nur zwei Werte an, die man ↑ und ↓ oder (sz +) und (sz −) bezeichnet. Die gemessenen numerischen Werte sind 1 1 sz = } und sz = − } , 2 2 wo } das Plancksche Wirkungsquantum ist. Für einen unpolarisierten Atomstrahl erwarten wir, dass die beiden Möglichkeiten mit gleicher Wahrscheinlichkeit auftreten, was auch beobachtet wird. Die Observable Sz ist also quantisiert, ihr Spektrum umfasst nur zwei Werte (Eigenwerte) + 12 } und − 12 }. Bemerkung: In der Elementarteilchenphysik werden meist sogenannte natürliche Einheiten mit } = 1 verwendet. Dann ist die z-Komponente des Elektronspins ± 12 (in Einheiten von }) und man sagt, das Elektron habe Spin 12 . Es gibt auch andere Elementarteilchen mit Spin 12 , wie Proton, Neutron, Quarks,.... Diese Teilchen werden, wegen ihrer von Fermi entdeckten und noch zu besprechenden statistischen Eigenschaften, als Fermionen bezeichnet. cos2 θ2 -Regel: Wir decken jetzt einen Strahl, sagen wir den unteren, durch einen Blende ab. Auf diese Weise erhalten wir einen Strahl, der nur aus Silberatomen mit Spin ↑ besteht. Dies lässt sich verifizieren indem wir diesen Strahl durch einen weiteren zweiten S-GApparat schicken und feststellen, dass alle Atome auf einen einzigen Punkt nach oben abgelenkt werden. Oft bezeichnet man der ersten S-G-Apparat als Polarisator, den zweiten als Analysator. Drehen wir (für den erzeugten ↑-Strahl) jetzt den Analysator um einen Winkel θ um die y-Achse, dann misst der Analysator den Spin in Richtung ~n = sin θ~ex + cos θ~ez . Der Strahl wird wieder auf zwei Punkte abgebilder. Zählt man jeweils die Atome, die nach ↑ bzw. ↓ abgelenkt werden, so findet man θ θ N↑ = N cos2 , N↓ = N sin2 , 2 2 wobei N die Gesamtzahl der Atome im Strahl, der auf den Analysator fällt, ist. Da die Zahl der Atome im Strahl als groß angenommen wurde, können wir von zugehörigen Wahrscheinlichkeiten sprechen, θ θ w(↑) = cos2 , w(↓) = sin2 . 2 2
286
Kapitel 21. Quantentheorie des Spins
w(↑) ist die Wahrscheinlichkeit, das ein einzelnes Atom (Elektron) nach oben abgelenkt wird (cos2 θ2 -Regel). Dreht man den Polarisator um 90◦ um die y-Achse, so dass das Magnetfeld in x-Richtung zeigt, dann findet man, dass der Strahl in zwei gleich wahrscheinliche Komponenten in x-Richtung aufspaltet, mit sx =
1 } 2
und
1 sx = − } . 2
Diese experimentellen Beobachtungen müssen theoretisch beschrieben werden.
21.2
Der zweidimensionale Zustandsraum C2
Wir wollen den zweidimensionalen Zustandsraum in etwas mehr Detail besprechen, da er den Rahmen für die Spinphysik bildet. Der Hilbert-Raum C2 wird von zwei Basisvektoren |1i und |2i aufgespannt, die orthonormal und vollständig sein sollen, hi|ki = δik ,
2 X i=1
|ii hi| = 1.
Die Standard Basis im Hilbertraum C2 wird durch die Vektoren 1 0 . |1i = und |2i = 0 1
(21.1)
definiert. Die Observablen sind Hermiteschen Operatoren in diesem Hilbert-Raum, d.h. Hermitesche 2 × 2-Matrizen. Die Operatoren in C2 bilden selbst einen Vektorraum, in dem es eine Basis von Operatoren gibt. Eine spezielle Wahl der Operatorbasis sind die Pauli-Matrizen: 0 1 0 −i 1 0 1 0 , σy = , σz = (21.2) 1= , σx = 1 0 i 0 0 −1 0 1 Eine beliebige 2 × 2-Matrix A mit 4 unabhängigen Elementen lässt sich offensichtlich als Linearkombination dieser 4 Matrizen schreiben, ~ ∙ ~σ A = α0 1 + α mit α ~ ∙ ~σ =
3 X
αk σk
k=1
und σ1 ≡ σx , etc. Für Hermitesche Matrizen A sind die Koeffizienten αi reell. Die Eigenwerte aller drei Pauli-Matrizen sind ±1. Man zeigt durch direktes Nachrechnen, dass folgende Relationen erfüllt sind: σi2 = 1 [σi , σj ] = 2iεijk σk [σi , σj ]+ = 2δij σi σj = δij 1 + iεijk σk .
(21.3) (21.4) (21.5) (21.6)
21.2 Der zweidimensionale Zustandsraum C2
287
Durch Exponenzierung erhält man unitäre Matrizen mit besonders einfachen Eigenschaften. Wir definieren M ≡ ei~α∙~σ = 1 + i~ α ∙ ~σ +
i2 i2 (~ α ∙ ~σ )2 + (~ α ∙ ~σ )3 + ... . 2! 3!
Mit Hilfe der Relation (21.5) zeigt man, dass (~ α ∙ ~σ )2 =
X
ai a k σi σk =
i,k
X i,k
X 1 ai ak (σi σk + σk σi ) = ai ak δik . 2 i,k
D.h. (~ α ∙ ~σ )2 = α2
mit α = |~ α|,
(~ α ∙ ~σ )3 = (~ α ∙ ~σ )α2 .
Damit lässt sich die Reihe aufsummieren, M = 1 cos α + i
α ~ ∙ ~σ sin α . α
(21.7)
Man kann auch abstrakte Operatoren Σi definieren, deren Matrixelemente in der PauliBasis Gl. (21.1) gleich den Matrizen σi sind. Den Operator Σz findet man mit Hilfe der Spektralzerlegung. Für einen beliebigen Hermiteschen Operator A lautet die Spektralzerlegung: 2 X A= ak |ak i hak | , k=1
wo ak die Eigenwerte und |ak i die Eigenvektoren sind. Für den Operator Σz mit Eigenwerten ±1 und Eigenvektoren |1i und |2i gilt entsprechend Σz = |1i h1| − |2i h2| .
(21.8)
Die Matrixelemente von Σz in der Basis Gl. (21.1) kann man sofort hinschreiben, 1 0 hi|Σz |ji ⇒ = σz , 0 −1 z.B. h1|Σz |2i = h1|[|1i h1| − |2i h2|]|2i = h1| |1i h1| |2i − h1| |2i h2| |2i = 0 . Die Basis Gl. (21.1) bildet also die Eigenvektoren von Σz , Σz |1i = (|1i h1| − |2i h2|) |1i = |1i Σz |2i = (|1i h1| − |2i h2|) |2i = − |2i . Die Spektralzerlegung der anderen Σi -Operatoren kann man erraten, wenn man beachtet, dass deren Matrixelemente in der Pauli-Basis gleich den σi sein müssen,
288
Kapitel 21. Quantentheorie des Spins
Σy = i(− |1i h2| + |2i h1|)
⇒
Σx = |1i h2| + |2i h1|
⇒
0 i
−i 0
0 −i i 0
= σy ,
= σy ,
(21.9) (21.10)
z.B. h1|Σy |2i = h1|[−i |1i h2| + i |2i h1|]|2i = −i h1| |1i h2| |2i = −i.
21.3
Spin-Operatoren
Da wir im Stern-Gerlach-Experiment genau zwei Messergebnisse (Eigenwerte nach den Axiomen der Quantenmechanik) beobachten, assoziieren wir einen beliebigen Spinzustand zu einen gegebenen Zeit mit einem zwei-komponentigen komplexen Zustandsvektor, den wir auch Spinor nennen. Die Observablen, hier der Spin des Elektrons, müssen Hermitesche Operatoren sein, und da bieten sich die Pauli-Operatoren an. Da die gemessenen Eigenwerte ± }2 sind, definieren wir Si ≡
} Σi . 2
Außerdem ersetzen wir |1i → |Sz ; +i ,
|2i → |Sz ; −i .
Die verwendete Notation lautet, zusammengefasst: Operator (Observable):
Sz
Eigenwerte:
sz
Eigenzustände:
|Sz ; +i, |Sz ; −i } Sz |Sz ; ±i = ± |Sz ; ±i 2
Eigenwert-Gleichung:
Der Kürze halber schreiben wir meist |Sz ; ±i ≡ |±i , d.h. wenn nichts dabei steht, dann sei der Spin immer in z-Richtung analysiert. Diese Vektoren bilden ein vollständiges Orthogonalsystem (im zweidimensionalen HilbertRaum): h+|+i = h−|−i = 1; h+|−i = 0 |+i h+| + |−i h−| = 1
Vollständigkeit
Ein allgemeiner normierter Spinor (physikalischer Zustand) ist von der Form |Ψi = α |+i + β |−i
mit |α|2 + |β|2 = 1.
21.3 Spin-Operatoren
289
Wir können die abstrakten Dirac-Vektoren |±i durch Spaltenvektoren in der PauliBasis darstellen: 1 0 . . |+i = ; |−i = . 0 1 . (Das Symbol = soll die Gleichheit in einer speziellen Basis bedeuten). Für einem allgemeinen Vektor gilt entsprechend α 1 0 . |Ψi = = α +β . β 0 1 Der Operator Sz wird dargestellt durch die Matrix . } 1 0 . Sz = 2 0 −1 Projektionsoperatoren: Der Projektionsoperator auf die Spinrichtung + 12 } ist definiert durch P+ = |+i h+| , denn
P+ [α |+i + β |−i] = α |+i .
Analog projiziert P− = |−i h−| auf Spin − 12 }. Es gilt offensichtlich P+ + P− = 1. Wichtig sind auch die folgenden Operatoren: S+ = |+i h−| ,
S− = |−i h+| ,
Man bezeichnet S± als Leiteroperatoren, da sie folgende Relationen erfüllen: S+ |−i = |+i h−| |−i = |+i S+ |+i = |+i h−| |+i = 0
S+ erhöht den Spin um 1} bis zum Maximalwert, aber nicht weiter. S− erniedrigt den Spin um 1} bis zum Minimalwert, aber nicht weiter. Diese Technik wird aber erst für höhere Drehimpulse interessant. Die Spinoperatoren erfüllen wegen Gl. (21.4) die Vertauschungsrelation [Si , Sj ] = i}εijk Sk Diese Vertauschungsrelationen sind identisch mit denen, die aus der Diracschen Quantisierungsvorschrift für Drehimpulsoperatoren folgen, {Li , Lj } = εijk Lk
→ [Li , Lj ] = i}εijk Lk .
Wir können daher den Spin als Eigendrehimpuls interpretieren. Es sei jetzt ein Richtungsvektor ~n in räumlichen Polarkoordinaten gegeben ~n = sin θ cos φ~ex + sin θ sin φ~ey + cos θ~ez .
(21.11)
290
Kapitel 21. Quantentheorie des Spins
Wir nehmen an, dass sich der Spin-Operator unter Drehungen wie ein klassischer Vektor ~ ∙ ~n seine Komponente in Richtung ~n, verhält. Dann ist S(~n) = S S(~n) = sin θ cos φSx + sin θ sin φSy + cos θSz . Im Paulischen Zwei-Komponenten-Formalismus wird 0 1 0 −i 1 0 . } S(~n) = sin θ cos φ + sin θ sin φ + cos θ 1 0 i 0 0 −1 2 cos θ sin θ(cos φ − i sin φ) . } . = − cos θ 2 sin θ(cos φ + i sin φ) oder
. } S(~n) = 2
cos θ sin θeiφ
sin θe−iφ − cos θ
.
(21.12)
Wir haben Gl. (21.12) unter verschiedenen plausiblen Annahmen hergeleitet. Wir postulieren also: Wird in einem Experiment die Komponente des Spins eines Spin -1/2- Teilchens in Richtung ~n gemessen, so ist die entsprechende quantenmechanische Spinobservable durch den Operator S(~n) aus Gl. (21.12) gegeben. Man kann zeigen, dass die Eigenwerte von S(~n) wieder ±}/2 sind und dass die zugehörigen Eigenvektoren gegeben sind durch cos θ2 sin θ2 , e− (~n) = , (21.13) e+ (~n) = sin θ2 eiφ − cos θ2 eiφ modulo Gesamtphasenfaktor. Es ist leicht zu überprüfen, dass e± (~n) wirklich die Eigenvektoren von S(~n) zum Eigenwert ± }2 sind, z.B. } cos θ sin θe−iφ cos θ2 sin θ2 eiφ 2 sin θeiφ − cos θ } } cos 12θ cos θ cos 12 θ + sin θ sin 12 θ e−iφeiφ = = , sin 12 θ eiφ sin θ cos 12 θ eiφ − cos θ sin 12 θ eiφ 2 2
wo wir verwendet haben, dass cos(a − b) = cos a cos b + sin a sin b und sin(a − b) = cos b sin a − cos a sin b. Der Erwartungswert des Spins im Zustand |Ψi ist nach den Axiomen der Quantenmechanik X hS(~n)i = hΨ| S(~n) |Ψi = ak w(ak ) k
} } = w(+) − w(−) . 2 2
Bemerkung: In vielen quantenmechanischen Rechnungen braucht man die Eigenzustände um Wahrscheinlichkeiten auszurechnen. In Zwei-Zustandssystemen kann man jedoch
21.3 Spin-Operatoren
291
die Wahrscheinlichkeiten einfach aus den Erwartungswerten berechnen, was man wie folgt sieht: w(+) + w(−) = 1 2 w(+) − w(−) = hS(~n)i } oder w(±) =
1 2
1±
2 hS(~n)i . }
(21.14)
Die Erwartungswerte sind einfacher zu berechnen und zu messen, man braucht weder Eigenzustände noch Eigenwerte. In der Dirac-Notation schreiben sich die Eigenvektoren von S(~n) entsprechend Gl. (21.13) als θ θ (21.15) |S(~n), +i = cos |+i + sin eiφ |−i 2 2 θ θ |S(~n), −i = sin |+i − cos eiφ |−i , 2 2 mit |±i ≡ |Sz , ±i. Von Interesse sind folgende Spezialfälle: a)
θ = 0, cos θ2 = 1, sin θ2 = 0, ~n = ~ez |Sz , ±i = |±i
b)
θ = π/2, cos θ2 =
√1 , 2
sin θ2 =
√1 ; 2
φ = 0, ~n = ~ex
1 |Sx , ±i = √ [|+i ± |−i] 2 c)
θ = π/2, cos θ2 =
√1 , 2
sin θ2 =
√1 ; 2
(21.16)
(21.17)
φ = π/2, e±iφ = ±i, ~n = ~ey
1 |Sy , ±i = √ [|+i ± i |−i] 2
(21.18)
θ θ |S(~n), +i = cos |+i + sin eiφ |−i 2 2
(21.19)
Der allgemeine Spin-Vektor
stellt einen Zustand mit Spin + }2 in Richtung ~n(θ, φ) oder einen Zustand mit Spin − }2 in Richtung −~n(θ, φ) dar. Dagegen bildet θ θ |S(~n), −i = sin |+i − cos eiφ |−i 2 2
292
Kapitel 21. Quantentheorie des Spins
einen Zustand mit Spin − }2 in Richtung ~n(θ, φ) oder einen Zustand mit Spin Richtung −~n(θ, φ).
} 2
in
Operator-Darstellung des Spins: Wenn wir die Matrixelemente des Spinoperators kennen, so können wir mit Hilfe der Formel X smk |am i hak | (21.20) S= m,k
aus Kapitel 20 die basisunabhängige Operator-Darstellung finden,
S(~n) = s++ (|+i h+|) + s+− (|+i h−|) + s−+ (|−i h+|) + s−− (|−i h−|) . Der Vergleich mit Gl. (21.12) liefert S(~n) =
} {cos θ |+i h+| + sin θe−iφ |+i h−| + sin θeiφ |−i h+| − cos θ |−i h−|} (21.21) 2
Spezialfälle: a)
θ = 0, cos θ = 1 Sz =
b)
(21.22)
θ = π/2, cos θ = 0, sin θ = 1; φ = 0 Sx =
c)
} {|+i h+| − |−i h−|} 2
} {|+i h−| + |−i h+|} 2
(21.23)
θ = π/2, cos θ = 0, sin θ = 1; φ = π/2, e−iφ = −i, eiφ = i Sy =
} {−i |+i h−| + i |−i h+|} 2
(21.24)
Diese Ergebnisse stimmen mit den vorherigen aus Gln. (21.8),(21.9) und (21.10) wie erwartet überein. Mit diesem Rüstzeug sind wir in der Lage, alle statischen SpinProbleme zu behandeln. Beispiel 1: Ein Stern-Gerlach-Polarisator produziert Elektronen, die in y-Richtung fliegen und in der +z-Richtung polarisiert sind, d.h. den Zustand |+i. Das Elektron fliegt durch einen zweiten Stern-Gerlach-Apparat, den Analysator, der den Spin S(~n) in Richtung eines Einheitsvektors ~n = sin θ~ex + cos θ~ez , misst, der senkrecht zur y-Achse steht, d.h. in der (x, z)-Ebene (φ = 0). Es ergeben sich folgende Fragen: a) Was ist die Wahrscheinlichkeit, dass der Analysator Spin +1/2~ (in Richtung ~n) misst? ( cos2 θ2 Regel) b) Was ist der Erwartungswert des Spins?
21.3 Spin-Operatoren
293
Wir wollen diese Fragen im Folgenden beantworten. Allgemein galt, wenn ein Zustand |Ψi nach Basisvektoren, die Eigenkets eines Operators A sind, entwickelt wird, X ck |ak i , |Ψi = k
dann ist die Wahrscheinlichkeit bei einer anschließenden Messung der Observablen A, den Wert aj zu messen gegeben durch w(aj ) = |cj |2 = | haj | |Ψi |2 .
Wir müssen also hier den Zustand
|Ψi = |+i ,
nach Eigenvektoren der Observablen S(~n)
|+i = c+ |S(~n), +i + c− |S(~n), −i
(21.25)
entwickeln. Gesucht ist der Koeffizient c+ , er lässt sich mit Hilfe der Gl. (21.15) (|S(~n), +i = cos θ2 |+i + sin θ2 |−i) bestimmen, indem wir die Orthogonalität der |S(~n), ±i ausnützen und Gl. (21.25) von links mit hS(~n), +| multiplizieren. Das Ergebnis ist θ c+ = hS(~n), +|+i = cos 2 Die Wahrscheinlichkeit in Richtung ~n der Spin +1/2 zu messen ist also durch die cos2 θ2 -Regel θ w(+) = |c+ |2 = cos2 , 2 gegeben, die auch experimentell gefunden wurde. Den Erwartungswert oder Mittelwert des Spins für den Zustand |+i hS(~n)i = h+|S(~n)|+i
berechnet man mit Hilfe von Gl. (21.21) für φ = 0, S(~n)φ=0 =
} {cos θ |+i h+| + sin θ |+i h−| + sin θ |−i h+| − cos θ |−i h−|} . 2
Damit wird Speziell gilt
h+|S(~n)|+i =
} cos θ 2
} , h+|Sx |+i = 0 2 Wie erwähnt, lassen sich die Wahrscheinlichkeiten für Zwei-Zustandssysteme auch einfach aus dem Erwartungswert berechnen. Nach Gl. (21.14) 2 1 1 ± hS(~n)i w(±) = 2 } 2} 1 1 1± = cos θ = {1 ± cos θ} 2 }2 2 θ θ w(+) = cos2 , w(−) = sin2 . 2 2 h+|Sz |+i =
294
Kapitel 21. Quantentheorie des Spins
Beispiel 2: Wir betrachten den Zustand 1 |Ψi = √ {|+i + |−i} . 2 Wenn wir an diesem Zustand den Spin in z-Richtung messen, so finden wir }2 oder − }2 , jeweils mit Wahrscheinlichkeit 12 . Was passiert, wenn wir den Spin in x-Richtung messen? a) für klassische Wahrscheinlichkeiten würden wir argumentieren, dass wir zwei Zustände |±i haben, die jeweils die Ergebnisse ± }2 mit Wahrscheinlichkeit 12 liefern. Wir finden also z.B. + }2 mit Wahrscheinlichkeit 12 . b) In der Quantenmechanik ist obiger Zustand |Ψi = |Sx , +i, nur anders geschrieben (entwickelt in den Eigenvektoren von Sz ). Wir finden also + }2 mit Wahrscheinlichkeit 1. Dieser Unterschied ist ein typisches Beispiel für Quanteninterferenz. Beispiel 3: Der Operator
S 2 ≡ Sx2 + Sy2 + Sz2
vertauscht mit allen Komponenten des Spinoperators, [S 2 , Si ] = 0, wie man durch direktes Nachrechnen sieht. Dies ist eine Konsequenz der Drehinvarianz von S 2 und gilt für alle Drehimpulsoperatoren (siehe unten). Für Spin 12 ist S 2 wegen Gl. (21.3) sogar proportional zur Einheitsmatrix S2 =
3 2 } 1. 4
Bemerkung: Der obige Formalismus ist nicht nur für den Spin, sondern für alle Systeme anwendbar, die nur zwei Zustände besitzen, oder für die nur zwei Zustände interessieren, weil die anderen nur durch viel höhere Energien erreicht werden können. Ein solches Beispiel wäre das Ammoniak-Molekül, N H3 , bei dem sich das Stickstoffatom entweder oberhalb (+) oder unterhalb (−) der Ebene, die durch die 3 Wasserstoffatome gebildet wird, befindet. Die Energie, die für den Übergang (+) ←→ (−) benötigt wird, ist viel kleiner als die anderer Anregungen.
21.4
Spinpräzession
Ein Spin-1/2-System mit Ladung e (e < 0 für Elektronen), Masse m und magnetischem Moment e ~ μ ~= S mc ~ Klassisch präzessiert der Bahndrehimbefindet sich in einem homogenen Magnetfeld B. puls des Teilchens um das Magnetfeld. Wir untersuchen den rein quantenmechanischen
21.4 Spinpräzession
295
Fall des Spin-1/2-Systems. Das System wird durch die Hamilton-Funktion H=−
e ~ ~ S∙B mc
beschrieben. Das Magnetfeld sei homogen, konstant und in z-Richtung ~ = B~ez . B Dann ist die Hamilton-Funktion gegeben durch H = ωSz ,
wo
ω≡
|e| B. mc
Da H proportional zu Sz ist, sind die Sz Eigenzustände |±i (≡ |Sz , ±i) auch EnergieEigenzustände, H |±i = E± |±i , ωSz |±i = E± |±i . Da Sz |±i = ± }2 |±i, folgt für die Energie-Eigenwerte 1 E± = ± }ω . 2 D.h.
1 H |±i = ± }ω |±i . 2
(21.26)
Beachte, dass ω die Dimension s−1 (Frequenz) hat. Die Matrixelemente von H in dieser Basis lauten 1 h±|H|±i = ± }ω, h±|H|∓i = 0 . 2 Die zeitliche Entwicklung des Systems wird nach den Postulaten der Quantenmechanik durch den unitären Operator 1 1 ω . U (t) = e i} Ht = e i} ωSz t = e−i 2 σ3 t
beschrieben. Die Formel (21.7), ei~α∙~σ = 1 cos α + i
α ~ ∙ ~σ sin α α
ω ω mit α ~ = − ~e3 , α = , 2 2
ergibt dann U (t) = 1 cos α + iσ3 sin α.
(21.27)
Sei |Ψ(0)i ein beliebiger Zustandsvektor zur Zeit t = 0. Dieser Zustand kann als Superposition der festen Basisvektoren |±i geschrieben werden |Ψ(0)i = a+ |+i + a− |−i
mit
|a+ |2 + |a− |2 = 1.
296
Kapitel 21. Quantentheorie des Spins
Wir betrachten die zeitliche Entwicklung im Schrödinger-Bild. Wie in Kapitel 2 diskutiert, sind die Energie-Eigenzustände stationär, nicht aber deren Überlagerungen. Zu einer späteren Zeit ist der Zustand gegeben durch 1
1
|Ψ(t)i = a+ e i} Ht |+i + a− e i} Ht |−i ω
ω
= a+ e−i 2 t |+i + a− ei 2 t |−i .
In der Pauli-Darstellung wird der Zustand ω ω 1 0 . + a− e i 2 t |Ψ(t)i = a+ e−i 2 t 0 1 −i ω t a+ e 2 ω = . a− e i 2 t
(21.28)
(21.29)
Beispiel: Zur Zeit t = 0 sei das System im Zustand |Ψ(0)i = |Sx , +i, d.h. in einem Zustand mit Spin nach oben in x-Richtung, dem Eigenzustand |Sx , +i von Sx . Um die zeitliche Entwicklung zu berechnen, sollte man in einer Basis arbeiten, in der H diagonal ist, hier also in der Standard-Basis {|±i}. Diese Basis lautet 1 |Ψ(0)i = |Sx , +i = √ {|+i + |−i} , 2 √ d.h. a+ = a− = 1/ 2. Zu einer späteren Zeit t befindet sich das System im Zustand ω ω 1 |Ψ(t)i = √ {e−i 2 t |+i + ei 2 t |−i} . 2
(21.30)
Damit wird die Wahrscheinlichkeit, dass sich das System zur Zeit t noch in |Sx , +i befindet (d.h. wieder Spin nach oben gemessen wird) 2
w(+, t) = |hΨ(t)|Sx , +i| =
ω 2 1 −i ω t ωt e 2 + ei 2 t = cos2 ( ) . 4 2
Auf analoge Weise finden wir für die Wahrscheinlichkeit, den Wert − 12 ~ zu messen w(−, t) = sin2 (
ωt ). 2
~ = Obwohl der Spin ursprünglich ↑ in x-Richtung zeigt, verursacht das Magnetfeld B B~ez , dass zu einer späteren Zeit eine nicht-verschwindende Komponente ↓ in x-Richtung gemessen wird. Der Erwartungswert von Sx ist in diesem Beispiel: hSx i = hΨ(t)|Sx |Ψ(t)i } = √ hΨ(t)| {|+i h−| + |−i h+|} |Ψ(t)i , 2
21.4 Spinpräzession
297
wo |Ψ(t)i in Gl. (21.30) gegeben ist. Unter Verwendung der Orthonormalität der |±i erhält man mit Gl. (21.30) } (21.31) hSx i = cos ωt , 2 d.h. der Erwartungswert von Sx oszilliert mit Frequenz ω. Eine analoge Rechnung liefert den Erwartungswert von Sy und Sz hSy i =
} sin ωt , 2
hSz i = 0 .
(21.32)
Damit gilt
}2 : 4 Der Spin-Erwartungswert präzessiert also mit Frequenz ω um die z-Achse. 2
2
hSx i + hSy i =
Bemerkung: Des Zustandsvektor Gl. (21.29) braucht zweimal so lange wie der Erwartungswert um wieder den Ausgangswert zu erreichen. So lange wir nur ein einzelnes Teilchen betrachten kann man diese mathematische Eigenschaft des Zustandsvektors nicht sehen, sie macht sich erst in Interferenzexperimenten bemerkbar. Spin-Erwartungswerte für einen allgemeinen Anfangzustand: Sei |Ψ(0)i = a |+i + b |−i mit |a|2 + |b|2 = 1. Wir hatten in Gl. (21.19) gesehen, dass man o.B.d.A. a = cos
θ 2
und
θ b = sin eiφ 2
(21.33)
setzen kann. Dann stellt |Ψ(0)i einen Zustand mit Spin + }2 in Richtung ~n(θ, φ) oder einen Zustand mit Spin − }2 in Richtung −~n(θ, φ) dar. Zur Zeit t = 0 sind die Erwartungswerte des Spins : } ∗ [a h+| + b∗ h−|] [|+i h−| + |−i h+|] [a |+i + b |−i] 2 } = [a∗ b + b∗ a] 2
hSx it=0 =
} ∗ [a h+| + b∗ h−|] [−i |+i h−| + i |−i h+|] [a |+i + b |−i] 2 } = [−ia∗ b + ib∗ a] 2
hSy it=0 =
} ∗ [a h+| + b∗ h−|] [|+i h+| − |−i h−|] [a |+i + b |−i] 2 } 2 |a| − |b|2 . = 2
hSz it=0 =
Bemerkung: a∗ b + b∗ a und −ia∗ b + ib∗ a sind reell, wenn |a|2 + |b|2 = 1 ist.
298
Kapitel 21. Quantentheorie des Spins
Für t 6= 0 erhält man mit Gl. (21.33) hSx it = hSx i0 cos ωt − hSy i0 sin ωt hSy it = hSy i0 cos ωt + hSx i0 sin ωt hSz it = hSz i0 .
(21.34)
Dies sind die Gleichungen eines klassischen Vektors, der mit Winkelfrequenz ω um die z-Achse rotiert. Diese Ergebnisse bilden den Mittelwert über sehr viele Messungen oder für einen Strahl von Spin- 12 -Teilchen. Sie sind den klassischen Ergebnisse sehr ähnlich. Zu beachten ist aber, dass in der Quantentheorie für einzelne Messungen in einer gegebenen Richtung immer nur die Werte ± }2 gefunden werden.
21.5
Allgemeinere Zwei-Zustandssysteme
Wir nehmen an, die Hamilton-Funktion eines Zwei-Zustandssystems sei von der Form H = E0 (|+i h+| + |−i h−|) + A(|(+i h−| + |−i h+|} , wo E0 und A reelle Zahlen sind. Diese Form der Hamilton-Funktion kommt relativ oft vor. Ein Beispiel wäre ein Spin- 12 -System im |z, ±i Zustand, das sich in einem Magnetfeld in x-Richtung befindet. Dann lautet H = E0 1 − Aσx . Ein weiteres Beispiel ist das Ammoniak Molekül. Die drei H -Atome im N H3 -Molekül bilden ein gleichseitiges Dreieck. Das N -Atom befindet sich oberhalb oder unterhalb des Dreiecks, wo „oben“ oder „unten“ willkürlich definiert sind. Wenn x der Abstand zwischen dem Dreieck und dem N -Molekül ist, dann besitzt das Potential zwei Minima, d.h. wenn sich die drei H-Atome jeweils unterhalb und oberhalb vom N -Atom befinden. Die Minima sind durch einen kleinen Potentialberg getrennt. Wir bezeichnen die beiden Zustände mit |+i und |−i. Wir nehmen zunächst an, das die N Atome nicht von einem Minimum zum anderen gelangen (tunneln) können. Da die beiden Konfigurationen Spiegelbilder voneinander sind, erwarten wir, dass sie dieselben Energien haben, d.h. dass H0 = E0 1 und
H0 |+i = E0 |+i ,
H0 |−i = E0 |−i .
Quantenmechanisch kann das N -Atom durch dem Potentialberg tunneln. Dies führt zu einer kleinen Mischung der beiden Zustände. Wir setzen daher für den HamiltonOperator an 1 0 0 A . . H = H0 + H 0 mit H0 = , H0 = − 0 1 A 0 E0 −A . = E0 1 − σ x A , H= −A E0
21.5 Allgemeinere Zwei-Zustandssysteme
299
wo wir A > 0 reell annehmen. Es ist für das N -Atom gleich wahrscheinlich von oben nach unten zu tunneln, wie von unten nach oben. Um die stationären Zustände des Moleküls zu finden, müssen wir H diagonalisieren. Die Eigenzustände sind offensichtlich die früher bestimmten Eigenzustände von σx , 1 1 . 1 √ √ [|+i − |−i] = , |1i = 2 2 −1 1 1 . 1 |2i = √ [|+i + |−i] = √ , 2 2 1 z.B.
E0 −A
−A E0
1 −1
Die zugehörigen Eigenwerte sind (E0 + A)
=
E0 + A −A − E0
zu |1i ,
= (E0 + A)
(E0 − A)
1 −1
.
zu |2i .
Die Energieeigenzustände |1i und |2i sind antisymmetrisch bzw. symmetrisch unter Austausch |+i ↔ |−i, d.h. Spiegelung an der H3 -Ebene. Die ursprüngliche Entartung wird durch die Mischung A aufgehoben. Der antisymmetrische Zustand liegt oberhalb des symmetrischen Zustands. Typische Fälle: Zur Zeit t = 0 sei das Molekül im Zustand 1 |Ψ(0)i = |+i = √ [|1i + |2i], 2 d.h. das N -Atom liegt über den drei H-Atomen. Wir haben |Ψ(0)i durch die EnergieEigenzustände ausgedrückt, da die zeitliche Entwicklung durch H erzeugt wird. Zu einer späteren Zeit t wird der Zustand damit 1 1 |Ψ(t)i = e i} Ht √ [|1i + |2i] 2 1 1 1 (E0 +A)t |1i + e i} (E0 −A)t |2i = √ e i} 2 1 1 1 E0 t 1 At e i} |1i + e− i} At |2i = √ e i} 2 1 1 1 1 1 1 = √ e i} E0 t e i} At √ [|+i − |−i] + e− i} At √ [|+i + |−i] 2 2 2 1 1 1 = e i} E0 t cos At |+i + i sin At |−i] . } }
Das Molekül oszilliert also periodisch zwischen den beiden Zuständen |+i (oben) und |−i (unten). Das N -Atom schwingt damit von einer Seite der H3 -Ebene zur anderen. Die gemessene Frequenz für N H3 ist etwa 24000 MHz, was einer Wellenlänge im Mikrowellenbereich von ca. 1cm entspricht. Zu dieser Inversionsfrequenz gibt es keine klassische Entsprechung, da sie vom Tunneleffekt herrührt. Ein Molekül, dass sich anfangs in einem Energie-Eigenzustand befand, oszilliert natürlich nicht.
300
Kapitel 21. Quantentheorie des Spins
Neutrale Kaonen: ˉ 0 sind Quark-Antiquark Bindungszustände, Die pseudoskalaren Mesonen K 0 und K 0 0 ˉ Ihnen wir eine additive Quantenzahl zugeordnet, die Stranˉ ∼ ds. K ∼ dˉ s und K geness, die in der starken und elektromagnetischen Wechselwirkung erhalten ist, nicht K 0 mit Strangenaber in der schwachen Wechselwirkung. Die zugehörigen Zustände 0 ˉ mit Strangeness S = −1 bilden die sogenannte Strangeness- oder ess S = 1 und K Starke-Wechselwirkungsbasis. Die Kaonen werden über die starken oder elektromagneˉ 0 oder e+ e− → Φ(1020) → K 0 K ˉ 0 ). erzeugt (z.B. pˉ p → K 0K tische 0 Wechselwirkungen ˉ sind Eigenzustände der starken und elektromagnetischen Wechselwir K 0 und K kung H0 . Im Ruhsystem der Teilchen ist H0 K 0 = mc2 K 0 0 0 ˉ = mc2 K ˉ H0 K
mit mc2 = 497.65 M eV (Masse ist die Energie im Ruhsystem). Beide Massen sind auf Grund des CP T -Theorems (C: Ladungsaustausch, P : Paritätsumkehr, T : Zeitumkehr) gleich. Bei dem anschließenden Zerfall über die schwache Wechselwirkung wird ˉ 0 keine wohldefierte Lebensdauer. Exdie Strangeness verletzt. Daher haben K 0 und K perimentell stellt sich heraus, dass die Eigenzustände der schwachen Wechselwirkung in guter Näherung Eigenzustände von CP sind. Unter CP transformieren sich 0 0 ˉ , CP K ˉ = − K 0 . CP K 0 = − K Die Linearkombinationen
0 0 ˉ K1 = √1 K 0 − K 2 0 0 ˉ K2 = √1 K 0 + K 2
sind dann jeweils Eigenzustände zu CP = 1 und CP = −1. Wir ignorieren hier die kleine CP -Verletzung ∼ 10−3 in der schwachen Wechselwirkung und identifizieren die CP - Eigenzustände mit den Eigenzuständen der schwachen Wechselwirkung. Der Zu stand K10 kann wegen CP in 2 Pionen zerfallen. Wegen des großen Phasenraums, der den 2 Pionen kurz und man bezeichnet K10 0 zur Verfügung steht, ist die 0Lebensdauer auch als KS , wo S für „short“ steht. K 2 kann wegen CP nur in 3 Pionen zerfallen und lebt daher länger, man bezeichnet K20 auch als KL0 , wo L für „long“ steht. In der Pauli-Darstellung schreiben wir 0 . 0 . KL = 0 K S = 1 , . 0 1 Wir betrachten einen Strahl neutraler Kaonen im Vakuum, wo sie zerfallen können. In der KS KL -Basis ist der Hamilton-Operator H diagonal. Da die Kaonen zerfallen, sind die Wahrscheinlichkeiten nicht mehr erhalten (es sei denn die Pionen im Endzustand werden mitberücksichtigt) und H ist nicht mehr Hermitesch. Der Zeitentwicklungsope-
21.6 Photonen
301
rator lautet dann in der KS KL -Basis 1 exp i} Et − U (t) =
t 2τS
0
exp
1 i} Et
−
t 2τL
0 ,
0 ist. Die schwachen Wechselwirkungen wo τS,L die Lebensdauer (Halbwertszeit) der KS,L verursachen auch eine kleine Massendifferenz (→ Energiedifferenz) der KS0 und KL0 , die wir hier vernachlässigen.
Beispiel: Zur Zeit t = 0 sei ein reiner K 0 Strahl produziert worden 1 1 |Ψ(0)i = K 0 = √ [|KS i + |KL i] = √ 2 2
1 1
.
Die Kaonen zerfallen mit der Zeit,
1 1 |Ψ(t)i = U (t) |Ψ(0)i = √ exp[ Et] i} 2
−t exp( 2τ ) S −t exp( 2τL )
.
Das Quadrat des Zustandsvektors hΨ(t)|Ψ(t)i =
1 −t/τS + e−t/τL ] [e 2
gibt an, wie der Strahl zerfällt. Da τL /τs ≈ 500 besteht deren Strahl schon nach kurzer Zeit nur noch aus KL0 Mesonen.
21.6
Photonen
In Abwesenheit von Quellen führen die Maxwell-Gleichungen auf die Wellengleichung ~ x, t) und B(~ ~ x, t), für E(~ ~ x, t) 1 ∂2 E(~ = 0, ∇2 − 2 2 ~ c ∂t B(~x, t) ~ x, t) und B(~ ~ x, t) senkrecht zueinander und senkrecht zur Ausbreitungsrichtung wo E(~ ~ nur x- und ystehen. Wenn die Ausbreitung in z-Richtung erfolgt, dann hat E ~ ~ ~ Komponenten und B = ~ez × E. Die allgemeine Lösung der Wellengleichung für E lautet in diesem Fall 0 Ex ~ x, t) = Ex (~x, t)~ex + Ey (~x, t)~ey = Ey0 ei(kz−ωt) , E(~ 0 wo ω die Frequenz und ~k = k~ez der Wellenvektor mit k =| ~k |= Ex0 und Ey0 sind komplex, Ex0 = Ex0 eiϕx , Ey0 = Ey0 eiϕy
ω c
ist. Die Amplituden
302
Kapitel 21. Quantentheorie des Spins
mit Phasen ϕx,y . Die physikalischen Felder sind definiert als die Realteile: Exphys (~x, t) = Re Ex (~x, t) = Ex0 cos(kz − ωt + ϕx ) Eyphys (~x, t) = Re Ey (~x, t) = Ey0 cos(kz − ωt + ϕy ) .
Die Energiedichte des elektromagnetischen Feldes ist gegeben durch: 2 2 2 1 1 F eld ~ ~ (~x, t) ~ W = (~x, t) = Re E Re E (~x, t) + Re B (~x, t) 8π 4π
Multipliziert mit der Lichtgeschwindigkeit bestimmt W F eld (~x, t) die Intensität, d.h. den Energiefluss in z-Richtung. Sinnvollerweise mittelt man über die Zeit, mit dem Ergebnis 1 w(~ ˉ x) = |Ex0 |2 + |Ey0 |2 . 8π 2π R 1 dx cos x = 12 . Dabei wurde verwendet, dass 2π 0
0 charakterisiert die Polarisation der elektromagnetischen Der Vektor Welle. Typische Beispiele sind Ex0
Ey0
a) lineare Polarisation in x-Richtung für Ey0 = 0 b) rechtshändige zirkulare Polarisation für Ey0 = iEx0 . Wir betrachten zunächst den Fall a). Eine einlaufende unpolarisierte Welle der Intensität Iein passiert einen Polarisator der nur in x-Richtung polarisiertes Licht durchlässt. Dann Intensität Iaus der auslaufenden Welle gegeben durch Iaus =
|Ex0 |2 Iein . + |Ey0 |2
|Ex0 |2
Wir schicken jetzt den in x-Richtung polarisierten Strahl durch einen zweiten identischen Polarisator, der um einen Winkel θ um die z-Achse gedreht ist. Dieser Polarisator lässt nur Wellen durch, die in Richtung ~e0x polarisiert sind. Da das elektrische Feld ein ~ wie der Ortsvektor. Da in unserem Vektor unter Drehungen ist, transformiert sich E Fall Ey = 0 ist, ergibt sich 0 Ex cos θ sin θ 0 Ex cos θEx Ey0 = − sin θ cos θ 0 0 = . − sin θEx 0 0 1 0 Ez0
Nur Ex0 passiert den 2. Polarisator. Daher ist das Verhältnis der Intensitäten I vor und I 0 nach dem x0 -Polarisator I0 = cos2 θ . I Wir können diese Experimente wiederholen und die Intensität der einfallenden Welle immer weiter reduzieren, bis man an genügend empfindlichen Detektoren nur noch diskrete Signale beobacht. Im Grenzfall (fast) verschwindender Intensität sieht es so
21.6 Photonen
303
aus, als bestehe Licht aus unteilbaren Quanten der Energie E = }ω, den Photonen. Oft werden die Experimente so interpretiert, dass die Photonen in den Polarisatoren manchmal absorbiert und manchmal durchgelassen werden. Die Wahrscheinlichkeit, dass ein Photon den zweiten Polarisator passiert, ist damit gleich cos2 θ (nicht cos2 θ2 wie im Fall Spin 12 ). Ein Photon mit wohldefinierter Polarisation in x- bzw. y-Richtung, das sich in zRichtung bewegt, lässt sich durch den Zustand 1 0 |xi = 0 und |yi = 1 0 0 beschreiben. Dann ist
|Ψi =
Ey0 Ex0 |xi + |yi |Ex0 |2 + |Ey0 |2 |Ex0 |2 + |Ey0 |2
ein Zustand mit normierter Intensität und beliebiger Polarisation. Die Vorfaktoren geben jeweils die Wahrscheinlichkeit an, Polarisation in x- bzw. y-Richtung zu messen. Unter Drehungen transformieren sich diese Zustände |xi , |yi wie ein zweidimensionaler cos θ sin θ Vektor. Die Drehmatrix hat die Eigenvektoren − sin θ cos θ 1 1 1 i und |Li = √ |Ri = √ 2 i 2 1 mit Eigenwerten eiθ und e−iθ . Diese Vektoren beschreiben rechtshändige und linkshändige Polarisation. Bemerkung: Im Gegensatz zu Elektronen, sind die Photonen masselos und bewegen sich stets mit Lichtgeschwindigkeit. Sie sind Objekte der relativistische Quantenfeldtheorie und haben eigentlich in der nicht-relativistischen Quantenmechanik nichts zu suchen. Die elektrische und magnetische Wechselwirkung kann nicht-relativistisch nur zwischen geladenen massiven Teilchen, wie Elektronen oder Protonen, und äußeren Feldern erfolgen. Ironischerweise wurde die Existenz von Lichtquanten von Einstein, der später der Quantenmechanik sehr reserviert gegenüber stand, zur Erklärung des Photoeffektes postuliert. Die stimulierte Emission kann aber ebenso gut im Rahmen der semiklassischen Approximation beschrieben werden, wo massive Teilchen in der Quantenmechanik und das elektromagnetische Feld in der Maxwellschen Theorie betrachtet werden. Nur die spontane Emission verlangt nach der Quantenelektrodynamik. Zusammenfassung: Alle die hier behandelten Experimente mit Spin- 12 -Teichen und Photonen lassen sich durch komplexe Vektoren und Hermitesche Operatoren zusammen mit den Postulaten der Quantenmechanik beschreiben. Die mathematische Grundstruktur der Quantentheorie ist der komplexe Vektorraum, im Gegensatz zum reellen Vektorraum der klassischen Mechanik.
Kapitel 22
Quanteninformation und Verschränkung 22.1
Qubits
Grundstein der klassischen Informationstheorie ist das Bit (Abkürzung für „binary digit“), das die Werte 0 oder 1 annehmen kann. In einem Computer werden die beiden Werte z.B. durch einen Kondensator, der entweder ungeladen oder geladen sein kann, realisiert. Die genaue Zahl der Elektronen auf dem Kondensator spielt dabei keine Rolle, ein Kondensator mit 108 Elektronen und ein Kondensator mit 109 Elektronen stellen beide den Wert 1 dar. Es gibt keinen Wert zwischen den beiden Bits und keine Superposition. Die Situation ändert sich, wenn wir einzelne Elektronen oder andere quantenmechanische Zwei-Zustandssysteme betrachten. Die entsprechende quantenmechanische Einheit der Information heißt Quantenbit oder kurz Qubit. Es beschreibt das einfachste Quantensystem, das auf zwei Zuständen basiert. Der kleinste nicht-triviale Hilbert-Raum C2 ist zweidimensional. Wir bezeichnen die zugehörige orthonormale Basis mit {|0i , |1i}. Dabei könnte z.B. |0i der Grundzustand und |1i der angeregte Zustand eines H-Atoms sein, wenn wir die höheren Zustände vernachlässigen. Wenn die Messwerte nur +1 und −1 (× }2 ) sein können, wie z.B. bei den einfachsten SpinSystemen, verwendet man stattdessen die Notation {|+i , |−i}. Die Standardbasis für C2 ist 1 0 |0i = , |1i = . 0 1
Das wichtigste Beispiel für einen zweidimensionalen Hilbert-Raum ist der Spinzustand eines Teilchens mit Spin 1/2, das wir im vorigen Kapitel ausführlich behandelt haben. Der wesentliche Unterschied zu den klassischen Bits ist, dass wir jetzt Superpositionen bilden können. Neben den Möglichkeiten „ 0“ und „1“, die durch die Zustände |0i und |1i realisiert werden, gibt es auch kohärente Superpositionen zwischen den beiden Werten, |Ψi = a |0i + b |1i
mit |a2 | + |b2 | = 1 .
306
Kapitel 22. Quanteninformation und Verschränkung
Wir können also in einem einzigen Quantenbit 2 Werte a und b darstellen. Bei einer Messung finden wir entweder |0i (mit Wahrscheinlichkeit |a2 |) oder |1i (mit Wahrscheinlichkeit |b2 |). Die Messung ändert den Zustand unwiderruflich in |0i oder |1i, je nachdem was gefunden wurde. Die komplexen Zahlen a, b enthalten mehr Information als nur die Wahrscheinlichkeiten. Die relative Phase hat auch physikalische Bedeutung. Der Vorteil gegenüber klassischen Bits wird noch deutlicher, wenn man Mehrzustandsysteme betrachtet. Eine kohärente Superposition von 3 Zuständen hat z.B. die Form |Ψi = a1 |0, 0, 0i + a2 |0, 0, 1i + a3 |0, 1, 0i + a4 |1, 0, 0i + a5 |0, 1, 1i + a6 |1, 0, 1i + a7 |1, 1, 0i + a8 |1, 1, 1i . Dieser Zustand kann 8 unterschiedliche Binärzahlen darstellen. Allgemein kann eine Superposition von n Qubits in 2n unterschiedlichen Quantenzuständen existieren, von denen jeder eine Binärzahl darstellt. Mit Hilfe einen unitären Transformation kann man dann 2n Binärzahlen gleichzeitig verarbeiten. Damit könnten Parallelrechnungen auf einen Quanten-Computer exponentiell schneller als auf einen klassischen Computer ausgeführt werden.
22.2
Verschränkung
Viele unerwartete Effekte der Quantentheorie beruhen auf den Superpositionsprinzip. Im Gegensatz zur klassischen Superposition von Wellen, gibt es in der Quantentheorie auch Superpositionen in Produkträumen. Als einfaches Beispiel betrachten wir den Produktraum V × W mit V = C2 und W =C2 . Die möglichen Zustände sind |−, −i , |−, +i , |+, −i , |+, +i, wo |−, −i in abgekürzter Notation für |−iV ⊗ |−iW usw. steht. Einige Zustände sind besonders einfach, z.B. 1 1 [|−, −i + |−, +i + |+, −i + |+, +i] = {|−i (|+i + |−i) + |+i ((|+i + |−i)} 2 2 1 1 = √ (|+i + |−i) ⊗ √ (|+i + |−i) . 2 2 Diese sogenannten Produktzustände stellen ein einzelnes Tensorprodukt zwischen zwei Vektoren, jeweils einer in V und einer in W, dar. Eine Messung am ersten System ergibt mit gleicher Wahrscheinlichkeit |+i oder |−i. Eine anschließende Messung am zweiten System bleibt davon unbeeinflusst und ergibt wieder mit gleicher Wahrscheinlichkeit |+i oder |−i. Es gibt aber auch Zustände, die nicht in ein einfaches Tensorprodukt reduziert werden können. Solche Zustände werden als verschränkt bezeichnet. Ein Beispiel: zwei Fermionen a und b im Zustand |Ψiab = [α |+ia |+ib + β |−ia |−ib ]
mit α2 + β 2 = 1 ,
(22.1)
wo das erste Fermion |±ia ∈ V = C2(a) und das zweite Fermion |±ib ∈ W = C2(b) ist. In diesem Zustand sind Fermion a und b korreliert im folgenden Sinne: Wenn wir den Spin von Fermion a messen, dann projizieren wir auf die Basis {|+ia , |−ia }. Mit
22.2 Verschränkung
307
Wahrscheinlichkeit |α|2 wird ↑ gemessen und das System befindet sich anschließend im Zustand |Ψiab = |+ia |+ib . Wenn wir also ↑ am Fermion a gemessen haben, liegt das Ergebnis einer anschließenden Messung des Spins am Fermion b fest (mit Wahrscheinlichkeit 1).
Wenn wir alternativ bei der ursprünglichen Messung des Spins von Fermion a den Wert ↓ gefunden haben (mit Wahrscheinlichkeit |β|2 ), dann befindet sich das System anschließend im Zustand |Ψiab = |−ia |−ib und wir messen am Fermion b mit Gewissheit im Zustand ↓. Die Messergebnisse sind korreliert. Diesen Sachverhalt bezeichnet man als Verschränkung, engl. entanglement. Gl. (22.1) ist ein Beispiel für ein maximal verschränktes Zwei-Zustandssystem. Die beiden Zustände können dabei über riesige Entfernungen getrennt sein. Dieses sogenannte Einstein-Podolsky-Rosen-Paradox steht nur scheinbar im Widerspruch zu Relativitätstheorie, da durch Verschränkung keine Information mit Überlichtgeschwindigkeit übertragen werden kann.
Die Situation kann bis hier her auch klassisch erklärt werden, in dem man annimmt, dass es mit Wahrscheinlichkeiten |α|2 bzw. |β|2 in diesem System zwei Typen von Elektronenpaaren gibt, eines mit z-Komponenten des Spins ↑↑ und eines mit zKomponenten des Spins ↓↓. Die Quantentheorie ist jedoch komplizierter. Dies wird √ besonders deutlich, wenn man α = −β = 1/ 2 setzt. Dann ist 1 |Ψiab = √ [|Sz +ia |Sz +ib − |Sz −ia |Sz −ib ] . 2
(22.2)
Dieser Zustand ist invariant unter Drehung der Basis. Ausgedrückt durch die Eigenzustände von Sx , 1 |Sx ±i = √ [|Sz +i ± |Sz −i] , 2 lautet er
1 |Ψiab = √ [|Sx +ia |Sx +ib − |Sx −ia |Sx −ib ] 2
(22.3)
und analog für die Basis |Sy ±i (und |S~n ±i). Die Zustände auf der rechten Seite von Gl. (22.2) und Gl. (22.3) sehen sehr verschieden aus, stellen aber dasselbe System |Ψiab dar und sind völlig legale Superpositionen. Die Zustände, aus denen das System |Ψiab aufgebaut ist, sind nicht unbekannt, sondern sie sind nicht definiert, bevor nicht eine Messung des Spins in einer bestimmten Richtung vorgenommen wird. Theorien mit versteckten Variablen (hidden variables): Einstein hat darauf bestanden, dass mit jeder Observablen ein „ Element der Realität “ verbunden sei, d.h. dass eine Observable in einem System schon vor der Messung einen wohldefinierten Wert besitzt. Die Idee, dass die Physik vollständig durch Wahrscheinlichkeitsaussagen über mögliche Ergebnisse von Observablen beschrieben wird, konnte Einstein nicht akzeptieren. Die wahren Zustände wären nicht verschränkt, und jeder
308
Kapitel 22. Quanteninformation und Verschränkung
Zustand wäre eindeutig bei der Erzeugung festgelegt (nicht erst nach der Messung). In unserem 2. Beispiel wäre das Zwei-Teilchensystem schon bei der Erzeugung entweder |−, −i oder |+, +i, jeweils mit Wahrscheinlichkeit 1/2. Die Theorie ist unvollständig und wir sind nur noch nicht in der Lage um zwischen den zwei Zuständen zu unterscheiden. Diese Annahme führt auf die Bellschen Ungleichungen, die durch das Experiment widerlegt sind.
22.3
Die Bellsche Ungleichung
Bei einfachen Experimenten vom Stern-Gerlach-Typ unterscheiden sich die beiden Interpretationen der Quantenmechanik noch nicht. John Bell 1 hat 1964 entdeckt, dass sich eine Theorie mit versteckten Variablen von der konventionellen Quantenmechanik unterscheidet, wenn man den Spin von zwei verschränkten Teilchen in zwei unterschiedlichen Richtungen misst. Wir wollen dies an dem Beispiel des Spinzustandes zweier Elektronen demonstrieren. Wir nehmen an, dass folgender Zustand experimentell präpariert wurde 1 |Ψi = √ (|↑i ⊗ |↓i − |↓i ⊗ |↑i) , 2 wo |↑i ein in z-Richtung polarisiertes Elektron darstellt. Wir betrachten die Observable cos θ sin θe−iφ . A = (~σ ∙ ~na ) = , sin θeiφ − cos θ die die Messung des Spins des einen Teilchens in Richtung ~na darstellt, wo ~na = sin θ cos φ~ex + sin θ sin φ~ey + cos θ~ez , und die Observable
mit
. B = (~σ ∙ ~nb ) =
cos α sin αeβ
sin θe−iβ − cos α
(22.4)
~nb = sin α cos β~ex + sin α sin β~ey + cos α~ez
(22.5)
die Messung des Spins des anderen Teilchens in der Richtung ~nb darstellt. Beide Messungen ergeben, dass die Spins nur parallel oder antiparallel zu ~na bzw. ~nb sein können. Es gibt jeweils nur zwei Messwerte, nämlich ± }2 . Wir wiederholen die Messung N -mal. Bei der i-ten Messung des Spins in Richtung ~na (~nb ) ordnen wir dem Ergebnis + }2 den Wert a(i) = 1 (b(i) = 1) und dem Ergebnis − }2 den Wert a(i) = −1(b(i) = −1) zu. Die experimentelle Korrelation zwischen den beiden Messungen berechnet sich dann aus N 1 X a(i)b(i). N →∞ N i=1
C(~na , ~nb ) = lim
(22.6)
Für zwei Observable, die jeweils verschwindenden Erwartungswert haben, ist die Korrelation gleich dem Erwartungswert des Produktes der beiden Observablen. C(~na , ~nb ) = hABi . 1
J.S. Bell, On the Einstein Podolsky Rosen Paradox. Physics 1, 195 (1964)
22.3 Die Bellsche Ungleichung
309
a) In der konventionellen Quantenmechanik ist die Korrelation durch den Erwartungswert 1 hΨ|(~σ ∙ ~na )(~σ ∙ ~nb )|Ψi = (h↑| ⊗ h↓| − h↓| ⊗ h↑|)|(~σ ∙ ~na ) ⊗ (~σ ∙ ~nb )(|↑i ⊗ |↓i − |↓i ⊗ |↑i) 2 gegeben. Die Berechnung ergibt C(~na , ~nb ) = hΨ|(~σ ∙ ~na )(~σ ∙ ~nb )|Ψi = −(~na ∙ ~nb ).
(22.7)
C(~na , ~nb ) = hΨ|(~σ ∙ ~na )(~σ ∙ ~nb )|Ψi = − cos(θa − θb ),
(22.8)
Wenn ~na und ~nb in einer Ebene liegen, reduziert sich das Ergebnis auf
wo θa und θb die üblichen Polarwinkel sind. Die einzelnen Rechenschritte seien hier ausgeführt, um zu zeigen, wie man mit Tensorprodukten umgeht. Das Tensorprodukt von linearen Operatoren ist wie folgt definiert A ⊗ B(|ΨiA ⊗ |ΦiB ) = (A |ΨiA ) ⊗ (B |ΦiB ) .
Damit wird
(~σ ∙ ~na )(~σ ∙ ~nb )(|↑↓i − |↓↑i)
= (~σ ∙ ~na ) |↑a i ⊗ (~σ ∙ ~nb ) |↓b i − (~σ ∙ ~na ) |↓a i ⊗ (~σ ∙ ~nb ) |↑b i .
Für die einzelnen Terme erhält man cos θ cos θ sin θe−iφ 1 = (~σ ∙ ~na ) |↑a i = 0 (sin θ) eiφ sin θeiφ − cos θ cos α sin θe−iβ 0 (sin θ) e−iβ = (~σ ∙ ~nb ) |↓b i = 1 − cos α sin αeβ − cos α −iφ cos θ sin θe 0 (sin θ) e−iφ = (~σ ∙ ~na ) |↓a i = 1 − cos θ sin θeiφ − cos θ cos α cos α sin θe−iβ 1 . = (~σ ∙ ~nb ) |↑b i = 0 (sin α) eiβ sin αeiβ − cos α
Das Tensorprodukt zwischen zwei Vektoren ist wie b1 a 1 b2 a1 b1 ⊗ = a2 b2 b1 a2 b2 Damit werden
(~σ ∙ ~na ) |↑a i ⊗ (~σ ∙ ~nb ) |↓b i =
=
folgt definiert a 1 b1 a1 b2 = a2 b1 . a2 b2
cos θ (sin θ) eiφ
(sin α) e−iβ − cos α −iβ cos θ (sin θ) e − cos θ cos α , iφ (sin θ) e (sin θ) e−iβ − (sin θ) eiφ cos α ⊗
310
Kapitel 22. Quanteninformation und Verschränkung
(~σ ∙ ~na ) |↓a i ⊗ (~σ ∙ ~nb ) |↑b i =
=
und
cos α ⊗ (sin α) eiβ (sin θ) e−iφ cos α (sin θ) e−iφ (sin α) eiβ − cos θ cos α − cos θ (sin α) eiβ
(sin θ) e−iφ − cos θ
(~σ ∙ ~na ) |↑a i ⊗ (~σ ∙ ~nb ) |↓b i − (~σ ∙ ~na ) |↓a i ⊗ (~σ ∙ ~nb ) |↑b i cos θ sin θe−iβ sin θe−iφ cos α −iφ − cos θ cos α sin αeiβ − sin θe = iφ −iβ sin θe sin αe − cos θ cos α − sin θeiφ cos α − cos θ sin αeiβ (cos θ sin θ) e−iβ − (cos α sin θ) e−iφ − cos θ cos α − (sin θ sin α) eiβ e−iφ = cos θ cos α + (sin θ sin α) e−iβ eiφ . (cos θ sin α) eiβ − (cos α sin θ) eiφ √ = 2(~σ ∙ ~na )(~σ ∙ ~nb ) |Ψi
Für die Bra-Vektoren ist
(h↑↓| − h↓↑|) = (h↑| ⊗ h↓| − h↓| ⊗ h↑|) = 1 0 ⊗ 0 1 − 0 1 ⊗ 1 = 1∗0 1∗1 0∗0 0∗1 − 0∗1 0∗0 1∗1 1∗0 √ = 0 1 −1 0 = 2 hΨ| .
0
Das Skalarprodukt hΨ|(~σ ∙ ~na )(~σ ∙ ~nb )|Ψi wird damit: (cos θ sin θ) e−iβ − (cos α sin θ) e−iφ − cos θ cos α − (sin θ sin α) eiβ e−iφ 1 0 1 −1 0 cos θ cos α + (sin θ sin α) e−iβ eiφ 2 (cos θ sin α) eiβ − (cos α sin θ) eiφ 1 = −2 cos θ cos α − (sin θ sin α) e−iβ eiφ − (sin θ sin α) eiβ e−iφ 2 i 1h = −2 cos θ cos α − (sin θ sin α) ei(φ−β) + e−i(φ−β) 2 1 = [−2 cos θ cos α − 2 (sin θ sin α) cos(φ − β)] . 2 Andererseits ist das Skalarprodukt der zwei Einheitsvektoren auf der rechten Seite von Gl. (22.8) in Polarkoordinaten gegeben durch (~na ∙ ~nb ) = (sin θ cos φ~ex + sin θ sin φ~ey + cos θ~ez )(sin α cos β~ex + sin α sin β~ey + cos α~ez = (sin θ cos φ sin α cos β + sin θ sin φ sin α sin β + cos α cos θ = sin θ sin α cos(β − φ) + cos α cos θ.
Damit ist Gl. (22.8) bewiesen.
22.3 Die Bellsche Ungleichung
311
b) In Theorien mit versteckten Variablen hat eine Messung des Spins des Teilchens 1 keinen Einfluss auf die Messung des Spins des Teilchens 2. Damit sind die kombinierten Wahrscheinlichkeiten einfach durch die Produkte der Wahrscheinlichkeiten für das Ergebnis ai einer Messung in Richtung ~na mit der Wahrscheinlichkeit eines Ergebnisses bi der Messung in Richtung ~nb gegeben. Wenn die kombinierten Wahrscheinlichkeiten für 4 Messungen von A, A0 , B, B 0 existieren und die Bedingungen X P (ai , a0j , bk, b0l ) = 1 P (ai , a0j , bk, b0l ) ≥ 0, i,j,k,l
erfüllen, dann gelten die Bellschen Ungleichungen | hAB 0 i + hB 0 A0 i + hA0 Bi − hABi | ≤ 2.
(22.9)
Beweis der Bellschen Ungleichungen: Wir nehmen an, dass sich die Korrelationen aus den Wahrscheinlichkeiten ableiten lassen, X X hABi = a i bk P (ai , a0j , bk, b0l ) (22.10) i,k
hAB i = 0
hA Bi = 0
hA B i = 0
0
X
j,l
a i bl
i,k
X
P (ai , a0j , bk, b0l )
j,l
a0j bk
i,k
X
X
X
P (ai , a0j , bk, b0l )
j,l
a0j b0l
i,k
X
P (ai , a0j , bk, b0l ) .
j,l
Für alle Zahlen a, a0 , b, b0 ∈ [−1, 1] gilt |a(b0 − b) + a0 (b0 + b)| ≤ |a(b0 − b)| + |a0 (b0 + b)| = |a||(b0 − b)| + |a0 ||(b0 + b)| ≤ |(b0 − b)| + |(b0 + b)| ≤ 2. Wenn wir über Größen, die ≤ 2 sind, mitteln, dann gilt die Schranke auch für das Mittel X P (ai , a0j , bk, b0l ) |[ai (b0l − bk ) + a0j (b0l + bi )]| ≤ 2 . i,j,k,l
Der Absolutwert des Mittels ist aber gleich dem Mittel des Absolutwertes, X | P (ai , a0j , bk, b0l ) [ai (b0l − bk ) + a0j (b0l + bi )]| ≤ 2 . i,j,k,l
Verwendet man diese Ergebnisse zusammen mit den Gleichungen (22.10) in der Bellschen Ungleichung (22.9), so sieht man direkt, dass die Ungleichung erfüllt ist. Das quantenmechanische Ergebnis widerspricht dieser Ungleichung für die meisten Winkel. In der Quantenmechanik gilt: | hAB 0 i + hB 0 A0 i + hA0 Bi − hABi | = |(~na ∙ ~nb0 ) + (~na0 ∙ ~nb0 ) + (~na0 ∙ ~nb ) − (~na ∙ ~nb )|
312
Kapitel 22. Quanteninformation und Verschränkung
Der Einfachheit halber nehmen wir an, dass in Gl. (22.4) und (22.5) die Richtungsvektoren ~na , ~nb , ~na0 , ~nb0 alle in einer Ebene liegen (φ = 0), dann ist (~na ∙~nb ) = − cos(θa −θb ) etc. Wir setzen θa = 0, , φa = 0; θ a0 =
π , , φa0 = 0; 6
π , φb = 0 3 π θ b0 = , , φ b0 = 0 : 6
θb =
Dann wird mit ~n = sin θ cos φ~ex + sin θ sin φ~ey + cos θ~ez (~na ∙ ~nb ) = − cos(θa − θb ) = − cos π3 = −0.5 (~na ∙ ~nb0 ) = − cos(θa − θb0 ) = − cos π6 = −0.866 025 4 (~na0 ∙ ~nb ) = − cos(θa0 − θb )= − cos π6 − π3 = −0.866 025 4 (~na0 ∙ ~nb0 ) = − cos(θa0 − θb0 )= − cos π6 − π6 = −1.0 Da
|(~na ∙ ~nb0 ) + (~na0 ∙ ~nb0 ) + (~na0 ∙ ~nb ) − (~na ∙ ~nb )| = 2. 232 050 8 > 2 ,
sind die Bellschen Ungleichungen in der Quantenmechanik verletzt. Experimentell wurde gezeigt, dass die Bellschen Ungleichungen tatsächlich verletzt sind. Damit scheiden Theorien mit versteckten Variablen aus. Neben den Ungleichungen wurden später auch Gleichungen gefunden, 2 mit deren Hilfe man auch experimentell zeigen kann, dass es keine verborgenen Variablen (hidden variables) gibt. Wir wollen hier das besonders einfache Argument von Hardy wiedergeben. Wir verwenden für die Eigenzustände von σz die Notation: 1 0 1 0 . |↑i = , |↓i = , Eigenzustände von σz = 0 −1 0 1 Entsprechend schreiben wir für die Eigenzustände von σx : |↑i + |↓i 1 1 √ √ , Eigenzustand von σx = = |↑x i = 1 2 2 |↑i − |↓i 1 1 √ , Eigenzustand von σx = = |↓x i = √ −1 2 2
0 1
1 0
0 1
1 0
, Eigenwert + 1 , Eigenwert − 1
und für die Eigenzustände von σy : |↑i + i |↓i 1 1 0 1 √ |↑y i = √ , Eigenzustand von σy = = , Eigenwert + 1 i 1 0 2 2 1 |↑i − i |↓i 1 0 −1 √ , Eigenzustand von σy = = , Eigenwert − 1. |↑y i = √ −i i 0 2 2 2
D.M. Greenberger, M. Horne, A. Shimony, and A. Zeilinger, Am. J. Phys. 1131 58 (1990), L. Hardy, Phys. Rev. Lett. 71, 1665 (1993).
22.3 Die Bellsche Ungleichung
313
Hardy betrachtet folgenden Zustand |Ψ1 i =
|↓i |↓i + |↑i |↓i + |↓i |↑i √ . 3
(22.11)
Man sieht direkt, dass dieser Zustand auch in anderer Form geschrieben werden kann √ 2 |↓i |↑x i + |↑i |↓i √ |Ψ2 i = (22.12) 3 √ 2 |↑x i |↓i + |↓i |↑i √ . (22.13) |Ψ3 i = 3 Beweis z.B. von Gl. (22.12): |↓i |↓i + |↑i |↓i.
√
2 |↓i |↑x i + |↑i |↓i =
√
√ 2 |↓i |↑i+|↓i + |↑i |↓i = |↓i |↑i + 2
Aus diesen Ausdrücken schließt man: (i) |Ψ1 i : Mindestens ein Teilchen ist im Zustand |↓i. (ii) |Ψ2 i : Wenn das erste Teilchen im Zustand |↓i ist, dann ist das zweite Teilchen im Zustand |↑x i. (iii) |Ψ3 i : Wenn das zweite Teilchen im Zustand |↓i ist, dann ist das erste Teilchen im Zustand |↑x i. Mit der klassischen Logik folgt dann, dass nicht beide Teilchen im Zustand |↑x i sein können. Dieses Ergebnis folgt zwangsläufig, wenn eine Observable in einem System schon vor der Messung einen wohldefinierten Wert besitzt. In der Quantenmechanik ist die Wahrscheinlichkeitsamplitude, dass beide Teilchen im Zustand |↑x i sind, gegeben durch das Skalarprodukt h↓x | h↓x | |Ψ1 i = h↓x | h↓x | |Ψ2 i = h↓x | h↓x | |Ψ3 i √ 1 = h↓x | h↓x | ( 2 |↓i |↑x i + |↑i |↓i) √ 3 1 = 0 + h↓x | h↓x | |↑i |↓i √ 3 1 = [(h↑| − h↓|)(h↑| − h↓|)] |↑i |↓i √ 2 3 1 1 = [− h↑| h↓|)] |↑i |↓i √ = − √ 6= 0 . 2 3 2 3 Hier ist also die Wahrscheinlichkeit, dass beide Teilchen im Zustand h↓x | sind, ungleich Null! In der heute akzeptierten Interpretation der Quantenmechanik beziehen sich die Ergebnisse (i)-(iii) nur auf die Ergebnisse der Messung. Der Zustandsvektor selbst ist kein „Element der Realität“.
Kapitel 23
Der harmonische Oszillator Der harmonische Oszillator spielt eine wichtige Rolle in der Quantentheorie. In der Nähe eines stabilen Gleichgewichts lässt sich fast jede Kraft durch eine harmonische Kraft approximieren. Sie beschreibt so verschiedene Phänomene, wie molekulare Schwingungen und Modelle für die Kernkraft. Besonders wichtig ist die Darstellung des freien elektromagnetischen und anderer Quantenfelder als unendliche Summe von harmonischen Oszillatoren. Der harmonische Oszillator lässt sich in der Quantenmechanik exakt lösen und eignet sich daher bestens, die Prinzipien und teilweise unerwarteten Konsequenzen des Formalismus zu illustrieren.
23.1
Energieeigenwerte
Da der Hamilton-Operator eines n-dimensionalen Oszillators sich als eine Summe von n vertauschenden Operatoren schreiben lässt, können wir uns auf den eindimensionalen Fall beschränken. Wir ersetzen in der klassischen Hamilton-Funktion die kanonischen Variablen q und p durch die entsprechenden Hermiteschen Operatoren und erhalten den Hamilton-Operator der Quantenmechanik, H=
P2 1 + kQ2 , 2m 2
(23.1)
wobei k die Federkonstante ist. Wir wollen die Energieeigenwerte und Eigenvektoren, d.h. die stationären Zustände mit einer basisunabhängigen algebraischen Methode, die auf Dirac zurückgeht, bestimmen. Dazu führen wir folgende Linearkombinationen von Operatoren ein r P mω A= (Q + i ) (23.2) 2} mω r mω P (Q − i ), A† = 2} mω
316
Kapitel 23. Der harmonische Oszillator
wo ω≡
r
k . m
Die Operatoren A und A† sind nicht Hermitesch. Die inversen Relationen lauten r } (23.3) (A + A† ) Q= 2mω r 1 }mω P = (A − A† ) . i 2 Aus dem kanonischen Kommutator [Q, P ] = i} folgt [A, A† ] = 1 .
(23.4)
Die sieht man sofort, wenn man schreibt [A, A ] = Hamilton-Operator findet man †
1 2 [(A
− A ), (A + A )]. Für den †
1 H = }ω(A† A + ) . 2
†
(23.5)
Man beachte, dass die Masse im Hamilton-Operator nicht mehr explizit aufscheint. Das Spektrum wird nur noch von ω abhängen. Man erhält die Eigenwerte von H also aus den Eigenwerten des Operators N = A† A . Der Operator N heißt, aus Gründen die gleich ersichtlich werden, Besetzungszahloperator. Aus der Vertauschungsrelationen Gl. (23.4) folgt [N, A† ] = A† [N, A] = −A .
(23.6) (23.7)
Beweis: Wir verwenden die Identität [AB, C] = A[B, C] + [A, C]B, [A† A, A† ] = A† [A, A† ] + [A† , A† ]A = A† . =1
=0
Die zweite Gleichung (23.7) erhält man durch Hermitesche Konjugation. Diese Vertauschungsrelationen sind typisch für sog. Leiteropatoren (siehe unten). Wir berechnen jetzt die Eigenwerte λ von N und die zugehörigen (normierten) Eigenvektoren |λi. Sie erfüllen die Eigenwertgleichung N |λi = λ |λi . Wir zeigen zunächst:
23.1 Energieeigenwerte
317
1. Die Eigenwerte von N sind ≥ 0. Beweis: hλ| N |λi = hλ| λ |λi = λ
= hλ| A† A |λi = hα| |αi ≥ 0
mit |αi ≡ A |λi
und hα| = (|αi)† = (A |λi)† = hλ| A† .
Die Eigenwerte E von H sind daher nach unten beschränkt, E ≥ 12 ~ω. 2. Wenn λ ein Eigenwert ist, dann auch (λ − 1). Beweis: N A |λi = (AN + [N, A]) |λi = A(N − 1) |λi | {z } =−A
= A(λ − 1) |λi = (λ − 1)A |λi .
D.h. N A |λi = (λ − 1) A |λi . | {z } | {z }
A |λi ist daher Eigenzustand von N zum Eigenwert (λ − 1), A |λi ≡ |λ − 1i . Der neue Eigenzustand ist noch nicht normiert. Man bezeichnet den Operator A auch als Absteige- oder Vernichtungsoperator. 3. Wenn λ eine positive ganze Zahl ist, λ = 0, 1, 2, .., dann erreicht man durch wiederholte Anwendung des Operators A irgendwann den Eigenwert λ = 0 mit zugehörigem Eigenvektor |0i ≡ |λ = 0i , den Grundzustand. Wenn dies der Fall ist, dann muss wegen λ ≥ 0 gelten A |0i = |nulli . |{z} | {z } Grundzustand
Beweis:
Nullvektor
λ = 0|A† A|λ = 0 = 0
D.h. Der Vektor A |λ = 0i ist der Nullvektor |nulli. Weitere Anwendung des Absteigeoperators A ergibt immer wieder 0, A |nulli = 0 |nulli , d.h. die Folge An |λi bricht ab. Wenn λ keine positive ganze Zahl ist, dann bricht die Folge An |λi nie ab und man erhält unweigerlich negative λ, wenn man den AbsteigeOperator A genügend oft anwendet. Es folgt, dass λ eine positive ganze Zahl sein muss. 4. Wenn |λi ein Eigenvektor von N ist, dann ist auch A† |λi ein Eigenvektor, und zwar zum Eigenwert λ + 1.
318
Kapitel 23. Der harmonische Oszillator
Beweis: N A† |λi = (A† N + [N, A† ]) |λi = A† (N + 1) |λi | {z } =A†
= A (λ + 1) |λi = (λ + 1)A† |λi . †
D.h. A† |λi ist Eigenvektor von N zum Eigenwert (λ + 1), |λ + 1i ≡ A† |λi (bis auf die Normierung). Man bezeichnet den Operator A† auch als Aufsteige- oder Erzeugungsoperator. Man kann zeigen, dass es zu jedem Eigenwert nur einen Eigenvektor gibt, die Eigenwerte sind nicht entartet (s. C. Cohen-Tannoudji, B. Diu und F. Laloë, 1997). Wir schreiben n für λ, mit n = 0, 1, 2, ... Die Eigenwerte sind nach oben nicht beschränkt, d.h. wir haben es mit einem (abzählbar) unendlich-dimensionalen Hilbert-Raum zu tun. Die Eigenvektoren von N sind auch Eigenvektoren von H, da H = }ω(N + 12 ), 1 1 H |ni = }ω(N + ) |ni = }ω(n + ) |ni . 2 2
(23.8)
Die Eigenwerte von H sind also gegeben durch 1 En = (n + )}ω; 2
n = 0, 1, 2, ... .
Der kleinste Eigenwert ist
1 }ω 6= 0 . 2 Diese Grundzustandsenergie ist, im Gegensatzt zum klassischen Oszillator, ungleich Null. Die Eigenwerte En bilden die möglichen Messwerte, sie sind diskret d.h. quantisiert. E0 =
Anmerkung zur Normierung: Die mit den Erzeugungsoperator generierten Zustände sind noch nicht normiert |ni ' (A† )n |0i . Wir bestimmen jetzt die normierten Zustände. Sei h0|0i = 1 . Dann ist
h1|1i = 0|AA† |0 = h0| [A, A† ] |0i = h0|0i = 1 | {z }
da A|0i=0
† h2|2i = 0|AAA A |0 = h0| {A[A, A† ]A† + AA† AA |{z} } |0i = 2. †
†
→[A,A† ]
23.1 Energieeigenwerte
319
Mit vollständiger Induktion zeigt man, dass die normierten Zuständen durch (A† )n |0i |ni = √ n!
(23.9)
gegeben sind. Dies sind die Eigenzustände von H, d.h. die stationären Zustände. Aus Gl. (23.9) folgt √ Erzeugungsoperator. (23.10) A† |ni = n + 1 |n + 1i Analog
A |ni =
Beweis der Gl. (23.10): A† |ni =
√
n |n − 1i
Vernichtungsoperator.
(23.11)
√ √ (A† )n+1 (A† )n+1 √ |0i = n + 1 |n + 1i |0i = n + 1 p n! (n + 1)!
Die Operatoren Q und P wirken wie folgt auf die Energieeigenkets: r } Q |ni = (A† + A) |ni 2mω r √ } √ = n + 1 |n + 1i + n |n − 1i 2mω
(23.12)
und
r
m}ω † (A − A) |ni 2 r √ m}ω √ =i n + 1 |n + 1i − n |n − 1i 2
P |ni = i
(23.13)
Die Energieeigenzustände {|ni} sind weder Eigenzustände des Ortsoperators noch des Impulsoperators. Matrixdarstellungen der Operatoren: Die Matrixdarstellung des Hamilton-Operators, 1 1 Hmn = hm|H|ni = m|}ω(N + )|n = (n + )}ωδmn , 2 2 hat folgende diagonale Form
Hmn
1 1 0 = }ω 2 0 ...
0 3 0 ...
0 0 5 ...
Die zugehörigen orthonormierten Eigenvektoren sind
... ... . ... ...
|0i = (1, 0, 0, ...), |1i = (0, 1, 0, ...), |2i = (0, 0, 1, ...), ....
(23.14)
320
Kapitel 23. Der harmonische Oszillator
mit
hm|ni = δmn .
Sie bilden eine Basis im Hilbert-Raum. Mit Hilfe der Gleichungen (23.10) -(23.13) bestimmt man die Matrixdarstellungen der anderen Operatoren √ Amn = hm|A|ni = nδm,n−1
√ A†mn = m|A† |n = n + 1δm,n+1
Pmn
r
√ } √ n + 1δm,n+1 + nδm,n−1 2mω r √ m}ω √ = hm|P |ni = i n + 1δm,n+1 − nδm,n−1 . 2
Qmn = hm|Q|ni =
(23.15) (23.16)
Die Diagonalelemente der Matrizen Amn , A†mn , Qmn , Pmn verschwinden alle. Damit gilt hn|Q|ni = hn|P |ni = 0. (23.17)
Die Mittelwerte des Orts- und des Impulsoperators zwischen den stationären Zuständen des harmonischen Oszillators verschwinden. Dies gilt nicht für Überlagerungen von stationären Zuständen. Die expliziten Darstellungen (der Einfachheit halber unterscheiden wir in der Notation nicht zwischen Operator und Matrixdarstellung, wenn dies nicht zu Missverständnissen Anlass gibt) sind √ 0 1 √0 0 ... 0 2 √0 ... 0 A= 0 3 ... 0 0 ... ... ... ... ... 0 0 0 ... √0 1 0 0 0 ... √ A† = 0 2 √0 0 ... 0 0 3.. 0 ... und √ 1 √0 0 √0 } 2 √0 1 √0 Q= 2 √0 3 2mω 0 3 0 0 0 √ 0 r √ √0 − 1 }mω 1 0 − 2 √ P =i 2 0 2 0 √ 0 0 3 r
... ... ... ...
... ... . − 3 ... 0 ... 0 0 √
P und Q sind Hermitesch, aber nicht diagonal in der Energie-Basis. Die EnergieEigenzustände sind nicht Eigenzustände des Impulses und des Ortes.
23.1 Energieeigenwerte
321
Unbestimmtheitsrelation: Weder der Ortsoperator Q noch der Impulsoperator P vertauschen mit dem HamiltonOperator. Da die Spektren von Q und P alle reellen Zahlen einschließen, können Ort und Impuls bei einem stationären Zustand jeden Wert annehmen. Wir wollen in diesem Zusammenhang den Mittelwert und das Schwankungsquadrat von Q und P berechnen. Da Qmn und Pmn keine Diagonalelemente besitzen (Gln. (23.15), (23.16)) gilt hQi = hP i = 0 .
Aus Gl. (23.14) folgern wir
hHi =
P2 2m
+
k 2 Q 2
.
In geeigneten Einheiten ist H symmetrisch unter dem Austausch von P und Q. Daher erwarten wir 2
P 1 1 1 1 = hHi = }ω(N + ) → P 2 = m}ω(N + ) 2m 2 2 2 2
}ω 1 1 1 1 k 2 Q = hHi = }ω(N + ) → Q2 = (N + ) . 2 2 2 2 m 2
Dies kann man auch explizit nachrechnen. Die Unschärfen von Q und P für einen harmonischen Oszillator in einem Energieeigenzustand erfüllen somit 1 ΔQΔP = (n + )} . 2 Die Heisenbergsche Unbestimmtheitsrelation
(23.18)
1 } | h[Q, P ]i | = 2 2 ist erfüllt. Der Grundzustand besitzt das minimale Schwankungsquadrat, das mit der Heisenbergschen Unbestimmtheitsrelation konsistent ist. ΔQΔP ≥
Es ist interessant den Kommutator [P, Q] für obige Matrixdarstellung explizit auszurechnen. Für die Matrizen √ √ 1 √0 0 0 0 0 0 √0 √0 − 1 √ 1 0 1 2 √0 0 − 2 0 0 √ √ √0 1 1 P =√ 0 Q= √ 0 2 √0 3 √0 2 0 − 3 0 √ √ 2 0 2 0 3 √0 4 3 − 4 0 0 √0 4 0 4 0 0 0 0 0 0 0 berechnet sich der Kommutator zu
(Q ∗ P ) − (P ∗ Q) =
Für n → ∞ erhält man die Einheitsmatrix.
1 0 0 0 0
0 1 0 0 0
0 0 1 0 0
0 0 0 1 0
0 0 0 0 −4
.
322
23.2
Kapitel 23. Der harmonische Oszillator
Zeitliche Entwicklung
Wir hatten gesehen, dass die Mittelwerte des Orts- und des Impulsoperators zwischen den stationären Zuständen verschwinden. Um Oszillationen zu erhalten, müssen wir Überlagerungen von stationären Zuständen, sogenannte Wellenpakete, betrachten. Zur Zeit t = 0 sei der Zustand eines harmonischen Oszillators als eine Überlagerungen von stationären Zuständen, ∞ X |Ψ(0)i = cn (0) |ni , n=0
gegeben. Wenn wir die zeitliche Entwicklung im Schrödinger-Bild betrachten, so gilt zur Zeit t ∞ X cn (t) |ni . |Ψ(t)i = n=0
Der Zustand |Ψ(t)i erfüllt die Schrödinger-Gleichung i}
d |Ψ(t)i = H |Ψ(t)i . dt
In Kapitel 19 hatten wir gesehen, dass damit der Erwartungswert einer Observablen A zu einer Zeit t gegeben ist durch hΨ(t)|A|Ψ(t)i = wo
∞ X m,n
ωmn = die Bohrschen Frequenzen sind und
eiωmn t c∗m (0)cn (0)Amn , Em − En }
Amn = hm|A|ni . Für den harmonischen Oszillator ist Em − En 1 1 = (m + )ω − (n + )ω } 2 2 = (m − n)ω .
ωmn =
Als Beispiel betrachten wir die zeitliche Entwicklung der Erwartungswerte des Ortes und des Impulses. Da die Matrixelemente Qmn und Pmn des harmonischen Oszillators nur für m = n ± 1 ungleich 0 sind, gilt m − n = ±1 und eiωmn t = cos ωt ± sin ωt. Damit tragen zu den Mittelwerten nur sinusartige Schwingungen mit Frequenz ω bei. Es ist interessant die Zeitabhängigkeit auch im Heisenberg-Bild zu betrachten. In diesem Bild hängen die Operatoren von der Zeit ab, während die Zustände zeitunabhängig sind. Die Zeitabhängigkeit des Vernichtungsoperators A(t) mit A(0) = A ist im Heisenberg-Bild gegeben durch, 1 1 A(t) = exp − Ht A(0) exp Ht . (23.19) i} i}
23.2 Zeitliche Entwicklung
323
Um diesen Ausdruck zu vereinfachen benötigen wir die Baker-Hausdorff-Operatoridentität: 1 eA Be−A = B + [A, B] + [A, [A, B]] + ... (23.20) 2! In Gl. (23.19) und Gl. (23.20) wird der folgende Kommutator benötigt [
i 1 −1 Ht, A]t = [ }ωt(N + ), A] = [iωtN, A] . i} } 2
Da [N, A] = −A ist, folgt
−1 [Ht, A] = −iωtA . i} Wir können also die Identität (23.20) verwenden und erhalten A(t) = e−iωt A(0) .
(23.21)
(23.22)
Damit wird r
} (A(t) + A† (t)) 2mω r } = [A(0)e−iωt + A† (0)eiωt ] 2mω r } = cos ωt[A(0) + A† (0)] − i sin ωt[A(0) − A† (0)] 2mω 1 sin ωt , = Q(0) cos ωt + P (0) mω
Q(t) =
da P (0) = operator
1 i
q
}mω 2 (A(0)
− A† (0)). Auf die gleiche Weise erhalten wir für den Impuls-
P (t) = P (0) cos ωt − mωQ(0) sin ωt .
Im Heisenberg-Bild gleicht die Zeitabhängigkeit der Operatoren P (t) und Q(t) der der klassischen Bewegung des harmonischen Oszillators. Diese Übereinstimmung kann aber trügerisch sein, da nur die Erwartungswerte der Operatoren gemessen werden, 1 hP i (0) sin ωt mω hP i (t) = hP i (0) cos ωt − mω hQi (0) sin ωtm.
hQi (t) = hQi (0) cos ωt +
Da per Definition Q(0)H = QS und P (0)H = PS , gilt für die Mittelwerte des Ortes und des Impulses im Fall stationärer Zustände wegen (23.17) hQi (t) = hP i (t) = 0
(für stationäre Zustände).
Wir sehen wieder, dass Oszillationen nur für Überlagerungen von Energieeigenzuständen auftreten. In elementaren Darstellungen der Quantenmechanik wird oft behauptet, dass man im Grenzfall großer Quantenzahlen den klassischen Limes erhält. Die gilt nicht für einzelne
324
Kapitel 23. Der harmonische Oszillator
Energieeigenzustände. Ein einzelner Energieeigenzustand ist ein stationärer Zustand, für den die Mittelwerte aller Observablen zeitlich konstant sind, auch für n → ∞. Das Schwankungsquadrat der Ortsobservablen z.B. wächst mit n (siehe Gl. (23.18). Ein Teilchen in einem Energieeigenzustand im Oszillatorpotential ist weit davon entfernt lokalisiert zu sein. Statt der Energieeigenzustände kann man sogenannte kohärente Zustände einführen, die sich eher wie klassische Teilchen verhalten.
23.3
Kohärente Zustände
Neben der Basis der Energie-Eigenzustände ist auch noch die Basis von Interessen, die durch die Eigenvektoren der Operators A definiert ist, A |αi = α |αi ,
(23.23)
wo α eine komplexe Zahl ist α = |α|eiφ (A ist nicht Hermitesch). Die |αi können als eine unendliche Summe von Energie-Eigenvektoren oder Besetzungszahl-Eigenvektoren geschrieben werden ∞ X αn √ |ni = exp(αA† ) |0i . |αi = (23.24) n! n=0 Die letzte Gleichheit folgt wegen exp(αA† ) |0i = =
∞ ∞ X X (αA† )n (α)n (A† )n √ √ |0i |0i = n! n! n! n=0 n=0 ∞ X αn (A† )n √ |ni , da |ni = √ |0i . n! n! n=0
Wir wollen zeigen, dass |αi ein Eigenzustand des Vernichtungsoperators A ist, d.h. A |αi = α |αi. Dazu verwenden wir die Gl. (23.24) und Gl. (23.11), A |αi = A
∞ ∞ X X αn αn √ √ |ni = √ n |n − 1i . (23.11) n! n! n=0 n=1
Der Term mit n = 0 verschwindet wegen A |0i = 0. Damit wird A |αi =
∞ X
n=1
αn
p
= α |αi
(n − 1)!
|n − 1i =
0 ∞ X αn +1 0 √ |n i n0 ! n0 =0
mit n0 = n − 1
Analog findet man für den kohärenten Bra hα| = h0| e(α
∗
A)
mit hα| A† = hα| α∗ .
(23.25)
23.3 Kohärente Zustände
325
Beachte: A wirkt nur auf Kets, A† nur auf Bras, da A nicht Hermitesch ist. Der Zustand mit α = 0 ist gleich dem eindeutigen Grundzustand |0i mit n = 0 des harmonischen Oszillators in der Energie-Basis. Die Zustände sind noch nicht normiert, sondern sie erfüllen ∗ hα|αi = eα α . Beweis: Wenn [A, B] eine c-Zahl ist, dann gelten die Baker-Hausdorf-Identitäten 1
1
eA eB = e(A+B+ 2 [A,B]) und eB eA = e(A+B− 2 [A,B]) , oder eA eB = eB eA e[A,B] . Mit A → α∗ A, B → αA† , [A, B] → α∗ α folgt eα
∗
A αA†
e
†
= eαA eα
∗
A (α∗ a)
e
.
Damit erhalten wir hα|αi = h0| exp(α∗ A) exp(αA† ) |0i
= h0| exp(αA† ) exp(α∗ A) |0i e(α
∗
a)
= h0| exp(αα∗ ) exp(α∗ α) |0i e−(α
∗
= eα
a)
∗
α ∗
= eα α ,
da h0| exp(αα∗ ) = h0| und exp(α∗ α) |0i = |0i. Um auf 1 normierte kohärente Zustände zu erhalten, definieren wir ∞ α∗ α X αn α∗ α √ |ni = exp − exp(αA† ) |0i . |αi = exp − 2 2 n! n=0 Als Beispiel berechnen wir die Schwankung (Dispersion) ΔN des BesetzungszahlOperators in einem kohärenten Zustand. Da A |αi = α |αi und hα| A† = hα| α∗ , ist der Erwartungswert der Besetzungszahl N = A† A gegeben durch
hα|N |αi = α|A† A|α = α∗ α = |α|2 und entsprechend
α|N 2 |α = α|(A† A)(A† A)|α = α∗ α α|AA† |α
= α∗ α α|A† A + [A, A† ]|α = (α∗ α)2 + α∗ α.
Damit wird
(ΔN )2 = α|N 2 |α − (hα|N |αi)2 = α∗ α = hα|N |αi .
326
Kapitel 23. Der harmonische Oszillator
D.h. die Anregungen bilden eine Poisson-Verteilung um ihren Mittelwert hN i = |α|2 . Für den Erwartungswert der Energie erhalten wir 1 hα|H|αi = }ω α A† A + α 2 1 . = }ω α∗ α + 2 Die kohärenten Zustände wurden ursprünglich 1926 von Schrödinger eingeführt, weil sie dem klassischen Oszillator am nächsten kommen. Das sieht man z.B. an der Schwankung von Ort und Impuls r r 1 }mω } † (A + A ), P = (A − A† ). Q= 2mω i 2 Für die Erwartungswerte erhält man mit Gl. (23.23) und (23.25) r r r }
} 2} † ∗ hα|Q|αi = α|(A + A )|α = (α + α ) = Re α 2mω 2mω mω r r √ 1 }mω 1 }mω
α|(A − A† )|α = (α − α∗ ) = 2}mω Im α . hα|P |αi = i 2 i 2
(23.26) (23.27)
Analog findet man
} } (α + α∗ )2 + 1 = (2 Re α)2 + 1 2mω 2mω }mω
}mω 1 − (α − α∗ )2 = 1 + (2 Im α)2 . α|P 2 |α = 2 2
α|Q2 |α =
Damit ergibt sich für die Schwankungsquadrate
} 2mω
}mω 2 . (ΔPα )2 = P 2 α − hP iα = 2
2 (ΔQα )2 = Q2 α − hQiα = Beachte:
a) ΔQα und ΔPα sind unabhängig von α. b) Die Schwankung hat für alle α den minimalen, von der Heisenbergschen Unbestimmtheitsrelation erlaubten Wert ΔQα ΔPα =
} . 2
Die kohärenten Zustände bilden also die beste Annäherung an einen klassischen Zustand, für den ΔQ = ΔP = 0 ist. Wenn die Amplitude (|α|) eines kohärenten Zustandes vergrößert wird, bleibt das Quantenrauschen (Dispersion, Schwankung) konstant }/2
23.3 Kohärente Zustände
327
und wird somit immer unwichtiger. Im Limes |α| → ∞ erhält man eine klassische Oszillation. Da der Grundzustand (das Vakuum) |0i gerade der kohärente Zustand mit α = 0 ist, haben alle kohärenten Zustände die selbe Dispersion wie das Vakuum. Man kann das Quantenrauschen eines kohärenten Zustandes als Vakuumfluktuation interpretieren. Zeitliche Entwicklung der kohärenten Zustände: Im Heisenberg-Bild hat der Operator A die einfache periodische Zeitabhängigkeit A(t) = A(0)e−iωt (siehe Gl. (23.22)). Damit ergibt sich für den Erwartungswert von Q(t) r r }
}
† hα|Q(t)|αi = α|(A(t) + A (t))|α = α|(A(0)e−iωt + A† (0)eiωt )|α 2mω 2mω r r } } = αe−iωt + α∗ eiωt = |α| e−iωt+iφ + eiωt−iφ 2mω 2mω r 2} = |α| cos(ωt − φ). mω Dies ist eine Schwingung mit Frequenz ω und wohldefinierter Phase φ. Analog findet man für den Erwartungswert des Impulses √ hα|P (t)|αi = 2}mω|α| sin(−ωt + φ). Anmerkung: In der Quantenoptik wird allgemein angesetzt, dass der Output eines idealen Single-Mode-Lasers weit oberhalb der Schwelle durch solch einen kohärenten Zustand beschrieben wird.
Kapitel 24
Orts- und Impulsdarstellung In der Quantenmechanik gibt es Hermitesche Operatoren (Observable), die ein kontinuierliches Spektrum besitzen. Beispiele sind der Ortsoperator und der Impulsoperator, die in einem unbeschränkten räumlichen Gebiet definiert sind. Als konkretes Beispiel betrachten wir zunächst den Ortsoperator in einer Dimension.
24.1
Der Ortsoperator
Da wir die Position x eines Teilchens messen können, muss es einen Ortsoperator X geben, zu dem die Eigenzuständen |xi und Eigenwertgleichung X |xi = x |xi gehören, mit dem kontinuierlichen Spektrum −∞ ≤ x ≤ +∞ . Streng genommen kann |xi kein Element des Hilbert-Raumes sein. Wir folgen Dirac und rechnen mit den Zuständen |xi als seien sie Hilbert-Vektoren, wobei die Orthogonalitätsrelation jetzt lautet hx|x0 i = δ(x − x0 ) . Wir betrachten also die Diracsche Deltafunktion als Kontinuumslimes des KroneckerDeltas δij . Diese pragmatische Vorgehensweise kann mathematisch streng begründet werden. Die Eigenzustände des Ortsoperators sind nicht auf 1 normierbar. Wenn wir sagen ein Teilchen befindet sich im Zustand |x0 i, dann meinen wir, dass der Zustand bei x = x0 ein so scharfes Maximum hat, so dass wir hx|x0 i durch die δ-Funktion δ(x − x0 ) approximieren können.
330
Kapitel 24. Orts- und Impulsdarstellung
Auch für Hermitesche Operatoren mit kontinuierlichem Spektrum gilt ein Spektraltheorem. Dieses lässt sich als Vollständigkeitsrelation schreiben, Z∞
−∞
dx |xi hx| = I,
wobei wir angenommen haben, dass sich das Spektrum des Ortsoperators über die gesamten reellen Zahlen erstreckt. Ein physikalischer Zustand kann in der Basis {|xi} entwickelt werden, Z |Ψi =
dx |xi hx|Ψi
hx|Ψi ist die Komponente von |Ψi in der Ortsdarstellung, d.h. in der Basis {|xi}. In Analogie zum diskreten Fall postulieren wir, dass für einen physikalischen Zustand |Ψi w(x ∈ [a, b]) =
Zb a
dx |hx|Ψi|
2
die Wahrscheinlichkeit ist, die Observable X mit Werten im endlichen Intervall [a, b] zu messen. Die Wahrscheinlichkeitsamplitude Ψ(x) ≡ hx|Ψi heißt Wellenfunktion und ist eine komplexwertige Funktion der reelen Variablen x. Interpretation: 2 2 Die Größe |hx|Ψi| stellt eine Wahrscheinlichkeitsdichte dar, d.h. |hx|Ψi| dx ist die Wahrscheinlichkeit, das Teilchen im Intervall (x, x + dx) zu finden. Die Wellenfunktion des Ortseigenvektors ist Ψx0 (x) ≡ hx|x0 i = δ(x − x0 ) . Mit Hilfe der Vollständigkeitsrelation kann man das Skalarprodukt zwischen zwei physikalischen Zuständen |Ψ1 i, |Ψ2 i umschreiben Z hΨ2 |Ψ1 i = dx hΨ2 |xi hx| Ψ1 i Z = dxΨ∗2 (x)Ψ1 (x) . Speziell gilt für die Normierung eines physikalischen Zustandes Z Z hΨ|Ψi = dxΨ∗ (x)Ψ(x) = dx|Ψ(x)|2 .
24.1 Der Ortsoperator
331
Matrixelement eines Operators in der Ortsdarstellung: Das Matrixelement eines beliebigen Operators A mit Eigenzuständen |ai i und Eigenwerten ai in der Ortsdarstellung ist X hx |ai i hai |A|ak i hak | x0 i = hx|A|x0 i = i,k
=
X k
=
X
ak hx |ak i hak | x0 i ak ak (x)a∗k (x0 ) .
k
Die Funktionen
ak (x) ≡ hx|ak i
heißen Eigenfunktionen des Operators A. Die Wirkung eines Operators auf einen Vektor, A |f i = |gi ,
kann als Integralgleichung geschrieben werden Z dx0 hx|A|x0 i hx0 |f i = hx|gi oder wo
Z
dx0 A(x, x0 )f (x0 ) = g(x),
A(x, x0 ) = hx|A|x0 i ,
f (x0 ) = hx0 |f i ,
(24.1)
g(x) = hx|gi .
Umgekehrt kann auch die Wellenfunktion hx|Ψi nach den Eigenfunktionen {ak (x)} eines Operators A entwickelt werden: X hx|an i han |Ψi Ψ(x) = hx|Ψi = n
oder
Ψ(x) =
X n
cn an (x),
mit
an (x) ≡ hx|an i ,
cn = han |Ψi .
Matrixelemente zwischen beliebigen Zuständen: Einen Operator wird in der Ortsdarstellung durch eine Matrix mit kontinuierlichen Indizes dargestellt: Z hΨ2 |A|Ψ1 i = dxdx0 hΨ2 |xi hx|A|x0 i hx0 |Ψ1 i Z = dxdx0 Ψ∗2 (x) hx|A|x0 i Ψ1 (x0 ) Z = dxdx0 Ψ∗2 (x)A(x, x0 )Ψ1 (x0 )
332
Kapitel 24. Orts- und Impulsdarstellung
Um das Matrixelement auszurechnen, benötigen wir A(x, x0 ) ≡ hx|A|x0 i , eine Funktion von zwei Variablen. Einfach wird es, wenn A eine Funktion des Ortsoperators ist, z.B. für A = X wird hx|X|x0 i = x0 hx|x0 i = xδ(x − x0 ) .
(24.2)
hx|f (X)|x0 i = f (x0 ) hx|x0 i = f (x)δ(x − x0 ) .
(24.3)
Allgemein gilt Wir sagen, dieses Matrixelement ist diagonal.
Wirkung des Operators f (X) auf einen beliebigen Zustand |Ψi: Z f (X) |Ψi = dxf (X) |xi hx| |Ψi Z = dx |xi f (x)Ψ(x) . Damit erhält man für die Matrixelemente hx| f (X) |Ψi = f (x)Ψ(x) und hΨ2 | f (X) |Ψ1 i =
Z
dxΨ∗2 (x)f (x)Ψ1 (x) .
(24.4)
(24.5)
Verallgemeinerung auf drei Dimensionen: Für die Ortskoordinate gibt es drei vertauschende Operatoren X, Y, Z. Wir bezeichnen ihre verallgemeinerten Eigenvektoren mit |x, y, zi oder |~xi. Die zugehörigen Wellenfunktionen sind jetzt Funktionen von 3 Variablen Ψ(x, y, z) ≡ hx, y, z|Ψi . Bemerkung: Eine quadratintegrable Wellenfunktion Ψ(x) bleibt nicht unbedingt quadratintegrabel, wenn sie mit dem Argument x multipliziert wird.
24.2
Translationen und der Impulsoperator
In der klassischen Mechanik war der Impuls die Erzeugende der Translationen. Wir wollen sehen, wie sich das in die Quantenmechanik übersetzt. Dazu definieren wir den Translationsoperator. Der Translationsoperator Dξ verschiebt die Koordinate eines Ortseigenzustandes (d.h. den Wert den wir bei einer Messung der Observablen X finden) um eine konstante Distanz ξ, Dξ |xi = |x + ξi .
24.2 Translationen und der Impulsoperator
333
Man beachte, dass wir den Zustand (das physikalische System) transformieren und nicht das Koordinatensystem. In der Quantenmechanik werden wir stets diese aktiven Transformationen verwenden. Für zwei aufeinander folgende Translationen gilt Dη Dξ |xi = |x + ξ + ηi und
n
(Dξ ) |xi = |x + nξi = Dnξ |xi .
(24.6)
Da die verschobenen Vektoren wieder orthonormal sein sollen, muss Dξ ein unitärer Operator sein, d.h. Dξ = eiA(ξ) , mit A Hermitesch. Wegen (24.6) gilt nA(ξ) = A(nξ) für n ganzzahlig. Wenn A stetig sein soll, dann muss diese Relation nicht nur für ganzzahlige sondern auch für reelle n gelten, d.h. A(ξ) muss proportional zu ξ sein A ' ξP
oder
1
D ≡ e i} ξP .
(24.7)
P heißt die Erzeugende der Translation. Der Faktor } wurde eingeführt, um den Operator später mit dem Impulsoperator identifizieren zu können. Wir untersuchen die Wirkung des Translationsoperators auf einen beliebigen Zustand R |Ψi = dx |xi Ψ(x): Z∞
Dξ |Ψi = Dξ =
−∞ Z∞
−∞
dx |xi hx|Ψi =
hx|Dξ |Ψi =
Z
dx |x + ξi hx|Ψi
−∞ Z∞
dx |xi hx − ξ|Ψi =
und
Z∞
−∞
dx |xi Ψ(x − ξ)
dx0 hx|x0 i Ψ(x0 − ξ) = Ψ(x − ξ) .
(24.8)
(24.9)
D.h. ein Zustand mit Wellenfunktion Ψ(x) transformiert sich in einen Zustand mit Wellenfunktion Ψ(x − ξ). Die Wahrscheinlichkeitsverteilung der Ortsoperators wird zu positiven x hin verschoben |Ψ(x)|2 → |Ψ(x − ξ)|2 .
Andererseits ist auch
D E 1 hx|Dξ |Ψi = x|e i} ξP |Ψ Z 1 ξP |x0 hx0 |Ψi = dx0 x| exp i} Z 1 = dx0 x| exp ξP |x0 Ψ(x0 ) . i}
(24.10)
334
Kapitel 24. Orts- und Impulsdarstellung
Die Taylor-Entwicklung Funktion Ψ(x − ξ) in Gl. (24.9) kann in exponentieller Form geschrieben werden, X (−1)n d n −d n Ψ(x) . (24.11) ξ hx|Dξ |Ψi = Ψ(x − ξ) = Ψ(x) = exp ξ n! dx dx
Wir vermuten daher, dass der Operator P mit dem Ableitungsoperator in Beziehung steht. Wenn wir die linearen Terme in Gl. (24.10) und Gl. (24.11) vergleichen, so identifizieren wir d hx|P |x0 i = −i} δ(x − x0 ) . (24.12) dx Beweis: Z Z 1 1 d dx0 x| ξP |x0 Ψ(x0 ) = dx0 − i} δ(x − x0 )ξ Ψ(x0 ) i} i} dx −d = ξ Ψ(x) . dx
Analog erhält man für die höheren Potenzen: n d n 0 δ(x − x0 ). hx|P |x i = −i} dx
(24.13)
Für jede Funktion f (P ), die in eine Potenzreihe entwickelt werden kann, gilt dann d 0 hx|f (P )|x i = f −i} (24.14) δ(x − x0 ) . dx
Daraus leitet man ab, dass
hx|f (P )|Ψi = f Beweis:
d −i} dx
Ψ(x) .
(24.15)
Z
dx0 hx| f (P ) |x0 i hx0 | |Ψi Z d 0 δ(x − x0 )Ψ(x0 ) = dx f −i} dx d = f −i} Ψ(x). dx
hx| f (P ) |Ψi =
Für das Matrixelement zwischen zwei physikalischen Zuständen gilt Z d hΨ2 | f (P ) |Ψ1 i = dxΨ∗2 (x)f −i} Ψ1 (x) . dx Beweis:
hΨ2 | f (P ) |Ψ1 i =
Z
dx hΨ2 | |xi hx| f (P ) |Ψ1 i Z d = dxΨ∗2 (x)f −i} Ψ1 (x) . dx
(24.16)
24.3 Der Hamilton-Differentialoperator
335
Der Operator P kann mit dem Impuls identifiziert werden. Dazu betrachten wir den fundamentalen Kommutator [X, P ] = i}1 (24.17) hx|[X, P ]|x0 i = i} hx|x0 i = i}δ(x − x0 ) = (x − x0 ) hx|P |x0 i . D.h. ein Impulsoperator sollte die Gleichung (x − x0 ) hx|P |x0 i = i}δ(x − x0 )
(24.18)
erfüllen. Ein Vergleich dieses Ergebnis mit Gl. (24.12) und der Formel x
d δ(x) = −δ(x) dx
(Beweis durch partielle Integration) zeigt, dass die Erzeugende P diese Beziehung (Gl. (24.18)) erfüllt. Die wichtigsten Formeln, die den Impulsoperator betreffen, lauten in der Ortsdarstellung zusammengefasst: d hx|P |x0 i = −i} δ(x − x0 ) (24.19) dx d δ(x − x0 ) (24.20) hx|f (P )|x0 i = f −i} dx d hx| f (P ) |Ψi = f −i} Ψ(x) (24.21) dx Z d Ψ1 (x) . (24.22) hΨ2 |f (P )|Ψ1 i = dxΨ∗2 (x)f −i} dx
24.3
Der Hamilton-Differentialoperator
Wir wollen zeigen, dass die Schrödinger-Gleichung, H |Ψi = E |Ψi , in der Ortsdarstellung als partielle Differentialgleichung geschrieben werden kann. Der Hamilton-Operator sei von der Form H=
P2 + V (X) . 2m
Dann erhält man für das Matrixelement in der Ortsdarstellung mit Gl. (24.20) 1
x|P 2 |x0 + hx|V (X)|x0 i 2m 2 d 1 −i} = δ(x − x0 ) + V (x)δ(x − x0 ) . 2m dx
hx|H|x0 i =
336
Kapitel 24. Orts- und Impulsdarstellung
Oder
−}2 d2 δ(x0 − x) + V (x)δ(x0 − x) . 2m dx02 Mit Hilfe von Gl. (24.21) finden wir 2 1 d hx|H|Ψi = Ψ(x) + V (x)Ψ(x) −i} 2m dx hx|H|x0 i =
hx|H|Ψi =
−}2 d2 + V (x) Ψ(x) 2m dx2
(24.23)
≡ H(x)Ψ(x) , wo H(x) =
−}2 d2 + V (x) 2m dx2
der Schrödingersche Hamilton-Differentialoperator ist (man verwendet üblicherweise denselben Buchstaben für den Differentialoperator wie für den abstrakten HamiltonOperator). In der sogenannten Wellenmechanik arbeitet man mit diesem DifferentialOperator. Wir betrachten die Eigenwertgleichung H |Ψi = E |Ψi in der Ortsdarstellung hx| H |Ψi = E hx|Ψi m,
oder mit Gl. (24.23),
−}2 d2 + V (x) Ψ(x) = EΨ(x) . 2m dx2
(24.24)
Dies ist die zeitunabhängige Schrödingersche Differentialgleichung, H(x)Ψ(x) = EΨ(x) . Die zeitabhängige Schrödingergleichung ∂ |Ψ(t)i = H |Ψ(t)i ∂t lautet entsprechend in der Ortsdarstellung i}
i} wo
∂ Ψ(x, t) = H(x)Ψ(x, t), ∂t
Ψ(x, t) = hx|Ψ(t)i
und
H(x)Ψ(x, t) = hx|H|Ψ(t)i .
Die Verallgemeinerung auf drei Dimensionen erhält man einfach mit der Ersetzung Z Z δ(.....) → δ 3 (.....) dx → d3 x, i}
d ~ → i}∇. dx
24.4 Beispiel: Der harmonische Oszillator
24.4
337
Beispiel: Der harmonische Oszillator
Der Hamilton-Operator war H=
mω 2 2 P2 + X . 2m 2
In Kapitel 22 hatten wir dieses Problem in der Energie-Basis {|ni} gelöst H |ni = En |ni 1 mit En = (n + )}ω; 2
n = 0, 1, 2, ...
Dazu führten wir die Erzeugungs- und Vernichtungsoperatoren ein, r P mω A† = (X − i ) 2} mω r P mω (X + i ). A= 2} mω
Der Grundzustand |0i war definiert durch A |0i =
|nulli
Nullvektor
.
(24.25)
In der Ortsdarstellung lautet diese Gleichung hx|A|0i = 0 , oder P )|0 0 = x|(X + i mω } d Ψ0 (x) , = x+ mω dx
wo Ψ0 (x) ≡ hx|0i die Grundzustand-Wellenfunktion ist. Zur Vereinfachung der Notation führen wir die dimensionslose Variable r mω u= x } ein. Dann lautet die Differentialgleichung d Ψ0 (u) = 0 , u+ du oder
1+2
d du2
Ψ0 (u) = 0 .
338
Kapitel 24. Orts- und Impulsdarstellung
Die allgemeine Lösung ist damit 1 2 Ψ0 (u) = c exp − u . 2
Die Konstante c wird (bis auf eine Phase) durch die Normierung festgelegt c=
mω 14 π}
.
Anmerkung: Man sieht, dass der Grundzustand (abgesehen von einer Phase) nicht entartet ist. Dann lässt sich zeigen, dass auch alle anderen Energieeigenzustände des harmonischen Operators nicht entartet sind. Wenn man die Grundzustandswellenfunktion hat, kann man alle anderen Wellenfunktionen mit der Formel (A† )n |0i |ni = √ n! erzeugen: 1 (A† )n |0i = √ hx| Ψn (x) = hx|ni = hx| √ n! n! n 1 d Ψ0 (u). =√ u− du 2n n!
r
P mω (X − i ) 2} mω
n
|0i
Einsetzen für Ψ0 (u) ergibt 1 mω 14 Ψn (x) = √ 2n n! π}
d u− du
n
1 exp − u2 2
mit u =
r
mω x. }
Beginnend mit Ψ0 (x) erzeugt man auf diese Weise die Hermiteschen Polynome Hn (u) mit H0 (u) = 1, H1 (u) = 2u, H2 (u) = −2 + 4u2 H3 (u) = −12u + 8u2 ; usw.
Die Hermiteschen Polynome sind normierbare Lösungen der Differentialgleichung
d2 d + 2n Hn (x) = 0 . − 2x dx2 dx
Sie erfüllen die gewichtete Orthogonalitätsrelation Z
∞ −∞
2
dxe−x Hn (x)Hm (x) =
√
π2n n!δnm .
(24.26)
24.5 Beispiel: Bahndrehimpuls
24.5
339
Beispiel: Bahndrehimpuls
Dem Drehimpuls der klassischen Mechanik entspricht in der Quantenmechanik der Bahndrehimpulsoperator. Den Zusatz „Bahn“ verwenden wir, da es in der Quantenmechanik auch Drehimpulse gibt, wie den Spin, die kein klassisches Äquivalent haben. Der Bahndrehimpulsoperator ist definiert durch Li = εijk Xi Pk . Man zeigt mit Hilfe der fundamentalen Kommutators, Gl. (24.17), dass [Li , Lj ] = i}εijk Lk . Die drei Komponenten des Bahndrehimpulses sind also nicht kompatibel. Dies führt, im Gegensatz zum Impuls, zu besonderen quantenmechanischen Effekten. Betrachten wir z.B. die z-Komponente des Bahndrehimpulses in Polarkoordinaten in Verbindung mit einem allgemeinen Zustand |Ψi in der Ortsdarstellung Ψ(~x) = h~x |Ψi . Wir verwenden die, auf drei Dimensionen verallgemeinerten Formeln Gl. (24.19), (24.20) und (24.22) für den Impuls- und den Ortsoperator, h~x|~x0 i = δ 3 (~x − ~x0 ) ~ |Ψi = ~x h~x |Ψi = ~xΨ(~x) h~x| X
~ h~x |Ψi = −i~∇Ψ(~ ~ x) h~x| P~ |Ψi = −i~∇ ~ 3 (~x − ~x0 ) , h~x| P~ |~x0 i = −i~∇δ
in der Berechnung von h~x|(Xi Pk )|Ψi =
Z
d3 x0 h~x|Xi |~x0 i h~x0 | Pk |Ψi Z = xi d3 x0 h~x |~x0 i h~x0 | Pk |Ψi Z = xi d3 x0 δ 3 (~x − ~x0 ) h~x0 | Pk |Ψi
= xi h~x| Pk |Ψi = xi (−i~∇k ) h~x |Ψi .
Damit wird die z-Komponente des Bahndrehimpuls-Operators in der Ortsdarstellung D E ~ × P~ )z |Ψ (24.27) h~x| Lz |Ψi = ~x|(X ~ z h~x |Ψi = −i~(~x × ∇) ∂ ∂ = −i~(x − y ) h~x |Ψi . ∂y ∂x
340
Kapitel 24. Orts- und Impulsdarstellung
In räumliche Polarkoordinaten, x = r sin θ cos φ y = r sin θ sin φ z = r cos θ , gilt x
∂ ∂ ∂ −y = ∂y ∂x ∂φ
und die Gleichung (24.27) lautet h~x| Lz |Ψi = −i~
∂ h~x |Ψi . ∂φ
(24.28)
Verwendet man die Wellenfunktion in Polarkoordinaten, Ψ(r, θ, φ) = h~x |Ψi mit |~xi = |r, θ, φi, so findet man ∂ Lz Ψ(r, θ, φ) ≡ −i~ Ψ(r, θ, φ) , (24.29) ∂φ wo Ψ(r, θ, φ) = hr, θ, φ|Ψi
Lz (r, θ, φ)Ψ(r, θ, φ) ≡ hr, θ, φ|Lz |Ψi . ∂ bezeichnet hier wieder nicht den abstrakten, basisunabhängigen OpeLz = −i~ ∂φ rator im Hilbert-Raum, sondern den Differentialoperator, d.h. den Operator in der Ortsdarstellung. Diese Mehrdeutigkeit ist in der Quantenmechanik üblich. Aus dem Zusammenhang ist aber stets klar was gemeint ist. Die Gl. (24.29) ist mathematisch analog zu Gl. (24.15) für den Impuls. Der Drehimpuls wird in einem späteren Kapitel ausführlich behandelt.
24.6
Beispiel: Starrer Rotator
Betrachte ein Teilchen, das sich auf einer Kreisbahn vom Radius 1 bewegt. Die Position des Teilchens wird durch den Winkel x bestimmt. Der Hilbert-Raum ist der Raum der quadratintegrierbaren Funktionen mit Periode 2π auf dem Intervall [−π, π], Zπ
−π
dx |Ψ(x)|2 < ∞ ,
und Skalarprodukt hΦ|Ψi = Betrachte den Operator
Zπ
dx Φ∗ (x)Ψ(x) .
−π
|Ψi → L |Ψi ,
24.6 Beispiel: Starrer Rotator
341
der definiert ist durch hΦ|L|Ψi =
Zπ
−π
d dx Φ∗ (x) −i} Ψ(x) dx
oder L(x)Ψ(x) ≡
d −i dx
Ψ(x) .
Der Operator ist proportional zum Drehimpuls. Mit Hilfe von partieller Integration zeigt man, dass L Hermitesch ist, d ∗ π dx i Φ (x) Ψ(x) + [Φ∗ (x)(−i)Ψ(x)]−π hΦ|L|Ψi = dx −π π ∗ Z d = dx Ψ∗ (x) −i Φ(x) dx Zπ
−π
∗
= hΨ|L|Φi .
Die Randwerte tragen nicht bei, da Φ∗ (−π)Ψ(−π) = Φ∗ (π)Ψ(π) wegen der Periodizitätsbedingung. Die Eigenwertgleichung für L lautet −i}
d Φ(x) = mΦ(x) . dx
Die Eigenfunktionen des Operators sind offensichtlich 1 em (x) = √ eimx . 2π Die Eigenwerte m von L sind die ganzen Zahlen m = 0, ±1, ±2, ... . Dies folgt aus der Periodizität, eim(x+2π) = eimx für m = 0, ±1, ±2, ... Die Eigenfunktionen bilden eine orthonormale Basis im oben definierten Hilbert-Raum. Jedes Element des Hilbert-Raumes kann geschrieben werden als X Ψ(x) = αn en (x) n
mit 1 αn = hen |Ψi = √ 2π
Zπ
dx einx Ψ(x)
−π
(Fourier-Transformation). Wenn wir x mit dem Polarwinkel φ identifizieren, so ist L proportional zum Drehimpulsoperator Lz . Die Eigenwerte von Lz sind also diskret, im Gegensatz zum Impulsoperator.
342
24.7
Kapitel 24. Orts- und Impulsdarstellung
Impulsraum
Die Eigenkets des Impuls-Operators bilden eine Basis P |pi = p |pi
mit Orthogonalität und Vollständigkeit
hp|p0 i = δ(p − p0 ),
Z
dp |pi hp| = 1 .
Damit können wir zu einem beliebigen Ket |Ψi eine Impulsraum Wellenfunktion definieren: hp|Ψi ≡ Ψ(p). Der Zusammenhang zwischen Ψ(x) und Ψ(p) lautet: Z Ψ(x) = hx|Ψi = dp hx|pi hp|Ψi Z = dp hx|pi Ψ(p)
Beachte den Missbrauch der Notation: Ψ(x) und Ψ(p) sind verschiedene Funktionen ihrer Argumente. Um den Zusammenhang zwischen der Wellenfunktion im Ortsraum und der im Impulsraum herzustellen, müssen wir die Übergangskoeffizienten hx|pi berechnen. Dazu betrachten wir: Z hx|P |pi = p hx|pi = dx0 hx|P |x0 i hx0 |pi Z d = dx0 (−i} )δ(x − x0 ) hx0 |pi dx Z d dx0 δ(x − x0 ) hx0 |pi = −i} dx d hx|pi . = −i} dx
D.h. die Übergangskoeffizienten erfüllen die Differentialgleichung −i}
d hx|pi = p hx|pi dx
mit Lösung
i 1 e } px . 2π} Die Konstante ist durch die Normierung festgelegt:
hx|pi = √
hp0 |pi = δ(p − p0 ) Z = dx hp0 |xi hx|pi Z i 0 i 1 dxe− } p x e } px = 2π} 1 = 2π}δ(p − p0 ) . 2π}
24.8 Anhang: Polynommethode für den Harmonischen Oszillator
343
Zusammenhang der Wellenfunktionen: Aus Z Ψ(x) = dp hx|pi Ψ(p) folgt
1 Ψ(x) = √ 2π}
und aus Ψ(p) = folgt
Z
Z
i
dpe } px Ψ(p),
dx hp|xi hx|Ψi =
Ψ(x) = √
1 2π}
wie bei der Fourier-Transformation.
Z
Z
dx hp|xi Ψ(x)
i
dpe− } px Ψ(p),
Bei der Verallgemeinerung auf drei Dimensionen ersetzt man: √
1 1 → √ , 2π} ( 2π})3 i
dp → d3 p,
i
e } px → e } p~∙~x .
24.8
Anhang: Polynommethode für den Harmonischen Oszillator
Die Schrödinger-Gleichung
−}2 d2 + V (x) Ψ(x) = EΨ(x) 2m dx2
wird für den harmonischen Oszillator d2 2m 1 − 2 + 2 (E − mω 2 x2 ) Ψ(x) = 0. dx } 2 Wir führen dimensionslose Größen ein η=
2E ; }ω
ξ=
r
mω x. }
Damit lautet die Schrödinger-Gleichung d2 φ(ξ) + (η − ξ 2 )φ(ξ) = 0. dξ 2 Wir verlangen, dass φ(ξ) quadratintegrierbar ist, φ(ξ) ∈ L2 , d.h. φ(ξ)
→
ξ→±∞
0
hinreichend schnell.
(24.30)
344
Kapitel 24. Orts- und Impulsdarstellung
Gl. (24.30) wird asymptotisch
d2 2 − ξ φ(ξ) = 0 dξ 2
mit Lösung φ ∼ e±ξ
da
2
/2
,
2 2 d2 φ(ξ) = (ξ 2 ± 1)e±ξ /2 ∼ ξ 2 e±ξ /2 . 2 dξ
Physikalisch sinnvoll ist nur die Lösung φ− . Wir versuchen daher den Ansatz: φ(ξ) = u(ξ)e−ξ in Gl. (24.30) und erhalten
2
/2
d d2 − 2ξ + (η − 1) u(ξ) = 0. dξ 2 dξ
(24.31)
Die ist eine Differentialgleichung 2. Ordnung mit polynomialen Koeffizienten. Es liegt nahe einen Potenzreihenansatz zu versuchen, u(ξ) =
∞ X
αν ξ ν .
ν=0
Gl. (24.31) ist invariant unter ξ → −ξ, d.h. die Lösung u(ξ) (und damit auch φ(ξ)) ist entweder gerade oder ungerade u+ (ξ) =
0,2,4,.. X
αν ξ
ν
oder
ν
u− (ξ) =
0,1,3,.. X
αν ξ ν ,
ν
es gilt ξ
X d ναν ξ ν u(ξ) = dξ ν
X d2 u(ξ) = ν(v − 1)αν ξ ν−2 . dξ 2 ν Damit wird Gl. (24.31) X ν(v − 1)αν ξ ν−2 − 2ναν ξ ν + (η − 1)αν ξ ν = 0 ν
für alle ξ. Ein Koeffizientenvergleich liefert αμ+2=
2μ + 1 − η αμ . (μ + 2)(μ + 1)
(24.32)
24.8 Anhang: Polynommethode für den Harmonischen Oszillator
345
Dies ist eine Rekursionsrelation. Bei Vorgabe von α0 und α1 lassen sich die weiteren Koeffizienten von u± berechnen. Wenn η = 3, 7, 11, ... ist, dann bricht die ungerade Reihe ab. Wenn η = 1, 5, 9, ... ist, dann bricht die gerade Reihe ab. Wir nehmen zunächst an, die Reihe bricht nicht ab. Dann gilt für große μ αμ+2 2 ∼ . αμ μ Das bedeutet
2
u+ (ξ) ∼ e+ξ .
(24.33)
Beweis: 2
Somit ist
∞ X
X x2μ 1 ν = ν x μ! ( )! μ=1,2,3,.. ν=0,2,4,.. 2 X 1 = βν xν mit βν = ν . ( 2 )! ν=0,2,4,..
ex =
βν+2 = βν
ν 2
1 2 ∼ für ν → ∞ . +1 ν
Das asymptotische Verhalten Gl. (24.33) bedeutet also, dass φ+ (ξ) = e−ξ
2
/2
u+ (ξ) ∈ / L2
Dasselbe gilt für die ungerade Lösung φ− (ξ). Aus der Normierbarkeit der Lösung folgt also, dass die Reihe abbrechen muss, d.h. dass η eine ganze Zahl ist. Die Abbruchbedingung ist 2μ + 1 − η = 0, oder η = 2μ + 1 . Da μ der Summationsindex war und η =
2E }ω
folgt
1 En = }ω(n + ) . 2 Die Eigenfunktionen lassen sich mit der Rekursionsrelation Gl. (24.32) erzeugen. Man unterscheidet: a) η = 1, 5, 9, .. , dann bricht die gerade Reihe ab, die Koeffizienten der ungeraden Reihe müssen alle 0 gesetzt werden. Die Lösung ist gerade. b) η = 3, 7, 11, ..., dann bricht die ungerade Reihe ab, die Koeffizienten der geraden Reihe müssen alle 0 gesetzt werden. Die Lösung ist ungerade.
346
Kapitel 24. Orts- und Impulsdarstellung
Beispiel: Gerade Wellenfunktionen: η = 1 : α0 6= 0, α2 = α4 = ... = 0
u+ (ξ) = α0 ;
η = 5 : α0 6= 0,
φ0 (ξ) = α0 e−ξ
2
/2
α2 = −2, α4 = ... = 0 α0
u+ (ξ) = α0 (1 − 2ξ 2 );
φ2 (ξ) = α0 (1 − 2ξ 2 )e−ξ
2
α2 1−9 = = −4, α0 2 4+1−9 −4 4 α2 = (−4)α0 = α0 α4 = (2 + 2)(2 + 1) 12 3 α6 = α8 = ... = 0 4 u+ (ξ) = α0 (1 − 4ξ 2 + ξ 4 ); 3 2 4 2 φ4 (ξ) = α0 (1 − 4ξ + ξ 4 )e−ξ /2 3 η = 9 : α0 6= 0,
Ein Vergleich mit den Hermiteschen Polynomen H0 (ξ) = 1,
H2 (ξ) = −2 + 4ξ 2 ,
H4 = 12 − 48ξ 2 + 16ξ 4 .
und deren Normierung (Gl.24.26)) erlaubt die Berechnung von α0.
/2
Kapitel 25
Der Dichteoperator 25.1
Der Dichteoperator für reine Zustände
Bisher hatten wir Systeme betrachtet, die durch einen einzigen Zustandsvektor, der auch eine Superposition sein konnte, beschrieben werden. Solche Zustände werden als reine Zustände bezeichnet. Wir wollen jetzt einen weiteren Formalismus einführen, der die beobachtbaren Ergebnisse der Quantenmechanik der reinen Zustände reproduziert, der sich aber auch auf Systeme übertragen lässt, deren Zustand nur ungenau bekannt ist. Sei A eine Observable, |Ψi ein reiner Zustand und {|un i} eine diskrete Basis mit P |un i hun | = 1 (die Erweiterung auf kontinuierliche Basen erfolgt später). Dann lässt sich der Zustand zu einer festen Zeit t in der Basis entwickeln. X X cn |un i mit cn = hun |Ψi und |cn |2 = 1 . |Ψi = n
n
Der Erwartungswert der Observablen war gegeben durch X hΨ|un i hun |A|um i hum |Ψi hAi = hΨ|A|Ψi = =
X m,n
=
X m,n
m,n
hum |Ψi hΨ|un i hun |A|um i cm c∗n hun |A|um i .
Den Operator ρ = |Ψi hΨ|
(25.1)
bezeichnet man als Dichteoperator. Dann sind cm c∗n die Matrixelemente des Operators |Ψi hΨ| in der Basis {|un i}, cm c∗n = hum | |Ψi hΨ| |un i .
348
Kapitel 25. Der Dichteoperator
Der Dichteoperator wird in einer gegebenen Basis {|un i} durch die Dichtematrix dargestellt, (25.2) ρmn = hum |ρ|un i = cm c∗n . Wir zeigen jetzt, dass man für ein quantenmechanisches System statt des Zustandes |Ψi auch den Dichte-Operator ρ vorgeben kann, d.h. dass alle messbaren Größen sich aus ρ bestimmen lassen. a) Erwartungswert von A: hAi = hΨ|A|Ψi = =
X m,n
X m,n
cm c∗n hun |A|um i
hum |ρ|un i hun |A|um i =
= Sp{ρA}
X m
(25.3) hum |ρA|um i (25.4)
b) Wahrscheinlichkeit einen der möglichen nicht entarteten Eigenwerte an eines Operators A mit Eigenzuständen |an i zu messen: w(an ) = | han |Ψi |2
= hΨ |an i han | Ψi (nicht summiert) = hΨ|Pn |Ψi = hPn i ,
wo Pn = |an i han | der Projektor auf den Eigenvektor |an i des Operators A ist. Mit Gl. (25.3) gilt dann w(an ) = Sp{ρPn } . Eigenschaften des Dichte-Operators für reine Zustände: ρ† = ρ Sp{ρ} = 1
(25.5) (25.6)
ρ2 = ρ
(25.7)
Sp{ρ} = 1
(25.8)
2
Dies sieht man wie folgt: (25.5): ρ = ρ† folgt unmittelbar aus der Definition ρmn = cm c∗n . (25.6): Sp{ρ} =
X n
ρnn =
X n
|cn |2 = 1
(25.6): ρ2 = |Ψi hΨ| |Ψi hΨ| = |Ψi hΨ| = ρ
25.2 Der Dichte-Operator für statistische Gemische
349
Die letzten beiden Relationen (25.6) und (25.6) gelten nur für reine Zustände. Die Zustände |Ψi und eiθ |Ψi ergeben den gleichen Dichte-Operator. Diese Mehrdeutigkeit der konventionellen Quantentheorie verschwindet. Andererseits kann man einem gegebenen Dichteoperator nicht mehr eindeutig mit einem Zustand in Verbindung setzen, da |Ψi und U |Ψi , mit U unitär, auf die selbe Dichtematrix führen. Man könnte meinen, der Dichteoperator wäre schlecht definiert, da er zwischen verschiedenen experimentellen Realisierungen nicht unterscheidet. Dies ist aber nicht der Fall, da all die unterschiedlichen Realisierungen zu den selben experimentellen Konsequenzen führen.
25.2
Der Dichte-Operator für statistische Gemische
In der Praxis ist der Zustand eines Systems oft nicht genau bekannt. Neben der quantenmechanischen Unbestimmtheit gibt es also auch noch eine klassische statistische Unbestimmtheit. Einen solchen Zustand bezeichnet man als statistisches Gemisch. Beispiele für unvollständig bekannte Systeme oder statistische Gemische sind: a) Unpolarisiertes Licht, alle Polarisationszustände sind gleich wahrscheinlich. b) Ein System im thermischen Gleichgewicht ist bei der Temperatur T mit Wahrscheinlichkeit e−En /kT in einem Zustand der Energie En . c) Systeme mit entarteten Eigenwerten. d) Beobachtung nur eines Teils eines größeren Quantensystems. Um den Zusammenhang zwischen einem quantenmechanischen Gemisch und dem Dichteoperator-Formalismus zu erklären, untersuchen wir ein Experiment mit einem Strahl von n Zwei-Zustandssystemen, z.B. Elektronen, die nicht miteinander wechselwirken sollen. Sei ai der Wert einer Observablen A, der am i-ten Mitglied des Strahles gemessen wird. Dann ist n 1X hAi = lim ai n→∞ n i=1 der gemessene Mittelwert der Observablen A. Die unvollständige Information über ein quantenmechanisches System lässt sich wie folgt in den Formalismus einbauen: Ein System mit n möglichen Zuständen ist entweder im Zustand |Ψ1 i und zwar mit Wahrscheinlichkeit p1 , oder im Zustand |Ψ2 i mit Wahrscheinlichkeit p2 , usw. Offensichtlich gilt für n mögliche Zustände p1 + p2 + ...pn =
n X
pk = 1.
k=1
Wir bezeichnen diese klassischen statistischen Wahrscheinlichkeiten mit pi . In dem Teilchenstrahl ist jedes einzelne Teilchen in einem reine Zustand |Ψi i. Bei n (n → ∞) Teilchen im Strahl, sind ni = pi n Teilchen im reinen Zustand |Ψi i. Der Erwartungswert einer Observablen A für jeden dieser reinen Zustände ist gegeben durch hAii = hΨi | A |Ψi i = Sp{A |Ψi i hΨi |} = Sp{Aρi } .
(25.9)
350
Kapitel 25. Der Dichteoperator
Bei einer Messung tritt der Zustand ni -mal, d.h. mit Wahrscheinlichkeit pi = ni /n auf. Der gemessene experimentelle Mittelwert ist somit gegeben durch hAi =
n X i=1
pi hAii =
n X i=1
pi Sp{Aρi } .
Man muss in dieser Formel n verschiedene Erwartungswerte ausrechnen, was sehr umständlich sein kann. Wir formen den Ausdruck daher etwas um, hAi =
n X i=1
pi Sp{A |Ψi i hΨi |} = Sp{A
n X i=1
pi |Ψi i hΨi |} .
Wenn wir den Dichte-Operator für das Ensemble einführen ρ≡ dann gilt wie im reinen Fall
n X i=1
pi {|Ψi i hΨi |},
(25.10)
hAi = Sp{ρA} .
Bemerkungen: a) Man darf ein statistisches Gemisch nicht mit einer Superposition von reinen Zuständen verwechseln. Sei z.B. X |Ψi = cn |an i n
ein reiner Zustand, wo |an i Eigenzustände des Operators A sind. Dann ist wi = |ci |2 nicht die Wahrscheinlichkeit, dass sich das System im Zustand |ai i befindet, sondern die Wahrscheinlichkeit, dass man bei einer Messung der Observablen A den Eigenwert ai misst. b) Wahrscheinlichkeiten treten auf zwei Stufen auf. Einmal in der Anfangsinformation pi über den Gemisch-Zustand, und zum anderen durch die quantenmechanischen Postulate der Messung. Die beiden Konzepte der Wahrscheinlichkeit lassen sich nicht in die übliche Quantenmechanik einbauen, sondern verlangen nach der Formulierung der Theorie durch Dichte-Operatoren. c) Die Formel hAi = Sp{ρA} ist äußerst nützlich. Da die Spur unabhängig von der Darstellung ist, kann Sp{ρA} in jeder Basis ausgerechnet werden.
Wie berechnet man bei einem Gemisch die Wahrscheinlichkeit W (ak ), dass eine Messung der Observablen A den Wert ak ergibt? Für ein System im reinen Zustand |Ψn i war wn (ak ) = hΨn |Pk |Ψn i mit Pk = |ak i hak | die Wahrscheinlichkeit den Eigenwert ak zu messen, wo Pk die Projektion auf den relevanten Eigenraum des Operators A war. Um diese Wahrscheinlichkeit für ein Gemisch zu erhalten, bilden wir X pn wn (ak ) = Sp{ρPk }. W (ak ) = n
25.3 Dichtematrix für Spin- 12 -Systeme
351
Aus der Dichtematrix erhält man alle möglichen Aussagen über ein physikalisches System. Zwei gemischte Zustände sind identisch, wenn sie durch die selbe Dichtematrix beschrieben werden. Da hAi = Sp{ρA} für beliebige Observable A ist, ist es konsistent zu behaupten, dass ρ ein Ensemble von Zuständen mit vorgegebenen Wahrscheinlichkeiten beschreibt. Bei statistischen Mischungen ist der Dichteoperator-Formalismus unumgänglich. Für Gemische gilt im Gegensatz zu den Axiomen der Quantenmechanik aus Kapitel 2, dass • der Zustand eines Systems nicht mehr durch einen einzelnen Hilbert-Vektor (Strahl) beschrieben wird (es gibt keinen mittleren Zustand für ein Gemisch), • Messungen nicht mehr orthogonale Projektionen sind, • die zeitliche Entwicklung nicht durch einen unitären Operator erzeugt wird.
Über ein Gemisch lässt sich folgende Aussage machen: Das System befindet sich mit Wahrscheinlichkeit pi im reinen Zustand |Ψi i. Man muss die pi und die möglichen Zustände |Ψi i vorher kennen, eine typische Aufgabe der Quantenstatistik. Statt durch Vektoren im Hilbert-Raum, wird ein statistisches Gemisch in den Erwartungswerten formuliert.
25.3
Dichtematrix für Spin- 12 -Systeme
Als einfaches Beispiel betrachten wir die Dichtematrix in der Pauli-Basis, 1 0 . . |Sz , +i ≡ |+i = , |Sz , −i ≡ |−i = . 0 1
Wir beschränken uns zunächst auf reine Zustände. Jeder reine Zustand hat die Form 1 1 . a |+i + b |+i = a +b (25.11) 0 0
mit
|a|2 + |b|2 = 1.
Nach Gl. (25.2) war die Dichtematrix für einen reinen Zustand |Ψi = durch ρmn = cm c∗n . Im Fall des Spin 12 Systems wird damit aa∗ ab∗ ρ= . ba∗ bb∗
P
n cn
|ni gegeben
Beispiele: a) Ein vollständig polarisierter Strahl mit sz = +1, d.h. a = 1, b = 0 liefert 1 0 ρ= . 0 0 Alternative Rechnung über Dichteoperator ρ = |+i h+|
→ ρ11 = h+|ρ|+i = 1, ρ12 = h+|ρ|−i = 0, usw.
352
Kapitel 25. Der Dichteoperator
b) Ein vollständig polarisierter Strahl mit sz = −1, d.h. a = 0, b = 1, ergibt 0 0 ρ= . 0 1 c) Ein vollständig polarisierter Strahl mit sx ± und Zustand √1 , b = ± √1 liefert 2 2 1 1 ±1 . ρ= ±1 1 2
√1 2
[|+i ± |−i], d.h. a =
d) Ein vollständig polarisierter Strahl mit Spin (+) in beliebiger Richtung ~n, mit ~n = sin θ cos φ~ex + sin θ sin φ~ey + cos θ~ez , und zugehörigem Zustand |~ni =
cos θ2 sin θ2 eiφ
.
wo θ und φ die üblichen Polarwinkel sind, entspricht a = cos θ2 , b = sin θ2 eiφ . Damit wird die Dichtematrix cos2 θ2 cos θ2 sin θ2 e−iφ . ρ= cos θ2 sin θ2 eiφ sin2 θ2 Man zeigt durch direkte Rechnung, dass Spρ = 1, ρ2 = ρ . e) Ein unpolarisierter Strahl kann betrachtet werden als 50% sz + plus 50% sz −, 1 1 1 0 0 0 + ρ= 0 0 0 1 2 2 1 0 2 = . 0 12 Der gleiche Strahl kann ebenso aufgefasst werden als als 50% sx + plus 50% sx −, 11 11 1 1 1 −1 ρ= + 1 1 −1 1 22 22 1 0 2 = . 0 12 Man sieht an diesem Beispiel, dass die Dichtematrix für ein völlig unkorreliertes System proportional zur Einheitsmatrix ist, unabhängig von der Wahl der Basis. f) Ein teilweise polarisierter Strahl mit 90% sz + und 10% sx +, 1 1 1 0 0.95 0.05 2 2 ρ = 0.9 = + 0.1 . 1 1 0 0 0.05 0.05 2 2
25.3 Dichtematrix für Spin- 12 -Systeme
353
Wir wollen am System f) untersuchen, was eine Messung des Spins für Ergebnisse liefert. Wird er Spin in x-Richtung analysiert, so findet man für den Mittelwert } 0.95 0.05 0 1 hSx i = Sp(ρSx ) = Sp 0.05 0.05 1 0 2 ~ 0.05 0.95 = 0.05}. = Sp 0.05 0.05 2 Für den Mittelwert einer Messung des Spins in z-Richtung findet man } 0.95 0.05 1 0 hSz i = Sp(ρSz ) = Sp 0.05 0.05 0 −1 2 ~ 0.95 −0.05 = 0.45} = Sp 0.05 −0.05 2 und eine Messung des Spins in y-Richtung liefert 0.95 0.05 0 hSy i = Sp(ρSy ) = Sp 0.05 0.05 i ~ 0.05i −0.95i =0. = Sp 0.05i −0.05i 2
−i 0
} 2
Die explizite Form von ρmn hängt natürlich von der gewählten Basis ab. Bei den obigen Beispielen war dies die Pauli-Basis, in der Sz diagonal ist. Die Zerlegung der Dichtematrix eines Gemisches in reine Zustände ist nicht eindeutig. Sei z.B. die Dichtematrix eines Gemisches von Elektronen gegeben durch 3 1 4 4 ρ= . 1 1 4
4
Diese Dichtematrix kann geschrieben werden als 1 1 1 0 2 2 ρ= + , 1 1 0 0 2 2 was einer Mischung von 50% der Elektronen im Zustand |Sx , +i und 50% in |Sz , +i entspricht. Oder man schreibt √ √ ! √ ! √ 2+1 2−1 1 1 √ √ √ √ 2+1 2 − 1 2 2 2 2 2 2 2 2 √ √ √ ρ= + √ . 2−1 2+1 1 −1 √ √ √ √ 2 2 2 2 2 2 2 2 2 2 2 2 √
√ = 85.4 % Elektronen mit Spin unter einem Winkel von Dies ist eine Mischung von 22+1 2 ◦ 45 gegen die positive x-Achse und 45◦ gegen die positive z-Achse (in der xz-Ebene) √ 2−1 und 2√2 = 14.6 % in entgegengesetzter Richtung.
Für einen generischen Spin- 12 -Zustand definiert man die Polarisation P~ = h~σ i = Sp(ρ~σ ).
354
Kapitel 25. Der Dichteoperator
Ein reiner Zustand mit gegebener Spinrichtung hat P = |P~ | = 1 (z.B. für den Zustand |+i ist in der Pauli-Basis ist hσx i = 0, hσy i = 0, hσz i = 1). Für einen gemischten Zustand mit Zufallsorientierung ist P~ = 0. Bei einen Spin- 12 -System kann man allein aus der Polarisation die Dichtematrix bestimmen, ρ=
1 (1 + P~ ∙ ~σ ) . 2
Beweis: Verwende Spσi = 0, Spσi σk = 2δik , Spρ = 1, Sp1 = 2. Die Diskussion kann auch mit Operatoren geführt werden. Ein Strahl, der aus 50% |+i ≡ |Sz +i und 50% |−i = |Sz −i besteht, kann als völlig unpolarisiert aufgefasst werden. Er wird durch den Dichteoperator ρ=
1 [|+i h+| + |−i h−| ] 2
beschrieben. Ein unpolarisierter Strahl kann aber auch als aus 50% |Sx +i = √12 (|+i + |−i) und 50% |Sx −i = √12 (|+i − |−i) bestehend aufgefasst werden. Dann lautet der Dichteoperator 1 [|Sx +i hSx +| + |Sx −i hSx −|] 2 1 = [(|+i + |−i)(h+| + h−|) + (|+i − |−i)(h+| − h−|)] 4 1 = [|+i h+| + |−i h−| ]. 2
ρ=
Man kann also eine gegebene Dichtematrix auf viele Weisen erhalten. Zwei Beschreibungen, die auf den selben Dichte-Operator führen, führen aber zu den selben Vorhersagen für alle möglichen Messungen.
25.4
Eigenschaften der allgemeinen Dichtematrix
Die Dichtematrix war definiert durch ρ=
N X
n=1
pn |Ψn i hΨn | .
Da die Koeffizienten pk reell sind, ist ρ Hermitesch. Da ρ Hermitesch ist, kann man stets eine orthonormale Basis {|ui i} finden, in der die Matrix ρik diagonal mit reellen Eigenwerten ist, X ρ= pi |ui i hui | i
ρlm =
X i
pi hul | |ui i hui | |um i = pl δlm .
25.5 Die Dichtematrix in der Ortsdarstellung
355
Auch für den allgemeinen Fall gilt Spρ = 1 . Beweis:
Spρ =
X
pn Spρn ,
n
wo
ρn = |Ψn i hΨn | .
Wie oben gezeigt, ist Spρn = 1 (wegen Sp |αi hβ| = hβ|αi) und damit X Spρ = pk = 1. k
Dagegen ist im allgemeinen Fall
ρ2 6= ρ .
Beweis: ρ2 =
X n
=
X n,m
=
X n
pn |Ψn i hΨn |
X m
pm |Ψm i hΨm |
pn pm |Ψn i hΨn | |Ψm i hΨm | p2n |Ψn i hΨn | .
Dies P ist nur gleich ρ, wenn eines der pn gleich 1 ist. Die anderen sind dann wegen pk = 1 gleich 0, d.h. wir haben einen reinen Zustand. Wir erhalten durch Spurbildung " # X 2 2 pn |Ψn i hΨn | Spρ = Sp =
X n
da Spρn = Sp |Ψn i hΨn | = 1. Es folgt
n
p2n Spρn
=
X
p2n ,
n
Spρ2 ≤ 1 , (25.12) P 2 P da aus n pn = 1 und pn ≥ 0 folgt, dass n pn ≤ 1. Das Gleichheitszeichen gilt für einen reinen Zustand. Mit Hilfe von Gl. (25.12) kann man feststellen, ob eine Dichtematrix ein Gemisch oder einen reinen Zustand darstellt. Dieses Kriterium ist invariant unter unitären Transformationen, d.h. basisunabhängig.
25.5
Die Dichtematrix in der Ortsdarstellung
Die Mittelung einer Observablen A über ein gemischtes Ensemble war X hAi = pn hΨn |A|Ψn i . n
356
Kapitel 25. Der Dichteoperator
Wir verwenden die Vollständigkeit in der Ortsdarstellung Z Z X hAi = dx dx0 pn hΨn |xi hx|A|x0 i hx0 |Ψn i =
Z
dx
n
Z
X
dx0
pn Ψ∗n (x)A(x, x0 )Ψn (x0 ) ,
n
wo Ψn (x0 ) = hx0 |Ψn i
und A(x, x0 ) = hx|A|x0 i .
Ein allgemeiner Zustand wird nicht mehr durch eine einzelne Wellenfunktion beschrieben, sondern durch ein gewichtetes Gemisch von Wellenfunktionen Ψ1 (x), Ψ2 (x) . . . ΨN (x). Der Dichteoperator ist wieder definiert durch ρ≡
X n
pn |Ψn i hΨn |
und die Dichtematrix durch ρ(x0 , x) = hx0 |ρ|xi = Damit wird hAi =
Z
dx
Z
X
pn Ψn (x0 )Ψ∗n (x) .
n
dx0 A(x, x0 )ρ(x0 , x) .
Mit der Definition der Spur einer kontinuierlichen Matrix, Z SpM = dx hx|M |xi , lässt sich der Erwartungswert wieder durch eine Spur ausdrücken Z Z hAi = dx dx0 hx|A|x0 i hx0 |ρ|xi = Sp[ρA] .
25.6
Zeitliche Entwicklung eines gemischten Ensembles
Wir arbeiten im Schrödinger-Bild, in dem die Zeitabhängigkeit in den Zuständen steckt. Zu einer Zeit t sei die Dichtematrix X pk |Ψk (t)i hΨk (t)| . ρ(t) = k
Wir setzen voraus, dass das Ensemble nicht gestört wird, und dass die einzelnen Zustände, z.B. die Elektronen in einem Strahl, nicht durch den Hamilton-Operator gekoppelt sind. Dann bleiben die statistischen Wahrscheinlichkeiten pi konstant. Wir nehmen
25.7 Dichte-Operator für Teilsysteme
357
weiter an, das der Hamilton-Operator (im Gegensatz zu den Zuständen) bekannt ist. Die zeitliche Entwicklung der Zustände war im Schrödinger-Bild gegeben durch 1
|Ψk (t)i = e i} Ht |Ψk (0)i . Damit wird ρ(t) =
X k
1
−1
pk e i} Ht |Ψk (0)i hΨk (0)| e i} Ht
1
−1
= e i} Ht ρ(0)e i} Ht . Die Ableitung nach der Zeit ergibt i~
∂ ρ(t) = − [ρ(t), H(t)] . ∂t
(25.13)
Diese Gleichung heißt Von-Neumann-Gleichung. Bis auf das Minuszeichen, sieht sie aus wie die Heisenbergsche Bewegungsgleichung für Operatoren im Heisenberg-Bild. Im Gegensatz zu ρ ist der Operator ρ2 zeitunabhängig. Das bedeutet, dass sich ein reiner Zustand (ρ2 = ρ) niemals in ein Gemisch verwandeln kann (und umgekehrt), wenn die zeitliche Entwicklung durch die Schrödinger-Gleichung, d.h. unitäre Zeitentwicklung, beschrieben wird. Beweis: Das System sei zur Zeit t = t0 ein reines Ensemble, ρ2 (t0 ) = ρ(t0 ). Dann wird 1
−1
1
−1
1
−1
1
−1
ρ2 (t) = e i} Ht ρ(t0 )e i} Ht e i} Ht ρ(t0 )e i} Ht = e i} Ht ρ2 (t0 )e i} Ht = e i} Ht ρ(t0 )e i} Ht = ρ(t). Zur Zeit t gilt also immer noch ρ2 (t) = ρ(t), wie für ein reines Ensemble. Für die Spur der Dichtematrix ergibt sich 1
−1
Spρn (t) = Spe i} Ht ρn (0)e i} Ht = Spρn (0) . Spρn (t) ist also zeitlich konstant, und damit auch die Spur einer Funktion f (ρ).
25.7
Dichte-Operator für Teilsysteme
Bisher haben wir den Formalismus des Dichte-Operators nur für ungenau präparierte Systeme eingeführt. Man kann diesen Formalismus auch verwenden, wenn dass betrachtete Quantensystem Teil eines größeren, einer Messung nicht zugänglichen Systems ist. Selbst wenn das Gesamtsystem ein reiner Zustand ist, verhält sich das Teilsystem wie ein Gemisch und muss durch einen Dichte-Operator beschrieben werden. Die Axiome aus Kapitel 2 charakterisieren das Quantenverhalten eines abgeschlossenen Systems, streng genommen des ganzen Universums. In der Praxis interessieren wir uns oft für sogenannte offene Systeme, die einen kleinen Bereich des Gesamtsystems bilden. Will man die Quantenmechanik auf ein offenes System anwenden, so muss man es zunächst
358
Kapitel 25. Der Dichteoperator
unter Hinzunahme der Umgebung abschließen. Die Schrödinger-Gleichung gilt dann für das Gesamtsystem, d i} |Ψ(t)i = H |Ψ(t)i , dt wo H der Hamilton-Operator des Gesamtsystems ist, der sich zusammensetzt aus dem Hamilton-Operator des Teilsystems, dem der Umgebung und der Wechselwirkung zwischen Umgebung und Teilsystem. Wurde das Teilsystem ursprünglich in einem reinen Zustand präpariert, so formiert sich durch die Wechselwirkung mit der Umgebung sehr schnell ein verschränkter Zustand des Gesamtsystems. Eine Messung an dem offenen Teilsystem zeigt nur noch die Eigenschaften eines Gemisches. Um die Situation zu verstehen, betrachten wir das einfachste System von zwei nicht-wechselwirkenden Spin- 12 -Teilchen, von denen nur eines beobachtet wird. Wir bezeichnen die beiden Fermionen mit a und b. Wenn die Teilchen ein Gesamtsystem bilden, dann ist der Zustand ein Vektor im Produktraum. Der Hilbertraum des Zwei-Teilchensystems ist Ha ⊗ Hb , wo Ha = C2 und Hb = C2 die Hilberträume der Einzelsysteme sind. Die zugehörigen orthonormalen Basen für die beiden Teilchen seien {|+ia , |−ia } und {|+ib , |−ib }. Als Beispiel betrachten wir folgenden (reinen) Zwei-Fermionenzustand |Ψiab = [α |+ia |+ib + β |−ia |−ib ]
mit α2 + β 2 = 1 .
(25.14)
Die zugehörige Dichtematrix ist ρab = |α|2 (|+ia |+ib + α β(|−ia |−ib ∗
a
h+| b h+|) + αβ ∗ (|+ia |+ib
h+| b h+|) + |β| (|−ia |−ib
a
2
a
a
h−| b h−|)
h−| b h−|) .
In diesem Zustand sind Fermion a und b korreliert im folgenden Sinne: Wenn wir den Spin von Fermion a messen, dann projizieren wir auf die Basis {|+ia , |−ia }. Mit Wahrscheinlichkeit |α|2 wird ↑ gemessen und das System befindet sich anschließend im Zustand |Ψiab = |+ia |+ib . Wenn wir also ↑ am Fermion a gemessen haben, liegt das Ergebnis einer Messung des Spins am Fermion b fest (mit Wahrscheinlichkeit 1). Wenn wir alternativ bei der ursprünglichen Messung des Spins von Fermion a den Wert ↓ gefunden haben (mit Wahrscheinlichkeit |β|2 ), dann befindet sich das System anschließend im Zustand |Ψiab = |−ia |−ib und wir messen am Fermion b mit Gewissheit ↓. Die Messergebnisse sind korreliert. Diesen Sachverhalt bezeichnet man als Verschränkung. Wir interessieren uns für die Situation, wo nur der Spin des Fermions a gemessen wird, der Spin des Fermions b aber unbeobachtet bleibt (weil es z.B. experimentell nicht zugänglich ist). Eine Observable A, die nur auf das Fermion a wirkt, kann man schreiben als A = Aa ⊗ 1 b ,
25.8 Von Neumansches Messpostulat
359
wo Aa nur auf den Raum {|+ia , |−ia } wirkt und 1b der Einheitsoperator im Raum {|+ib , |−ib } ist. Der Erwartungswert des Operators im Zustand |Ψi aus Gl. (25.14) ist hΨ| A |Ψi = (α∗ = |α|
2
a a
h+|
b
h+| + β ∗
a
h−|
h+| Aa |+ia + |β|
2
a
b
h−|) (Aa ⊗ 1b ) (α |+ia |+ib + β |−ia |−ib )
h−| Aa |−ia ,
wo wir die Orthogonalität der |±ib verwendet haben. Wir erhalten also hAi = Sp [Aρa ]a , wo
ρa = |α|2 (|+ia
a
h+|) + |β|2 (|−ia
a
h−|)
und die Spur über das System a zu nehmen ist. Obwohl sich das Gesamtsystem in einem reinen Zustand befindet, beschreibt die reduzierte Dichtematrix ρa ein Gemisch, in dem der Zustand |+ia mit Wahrscheinlichkeit |α|2 und der Zustand |−ia mit Wahrscheinlichkeit |β|2 auftritt. Man erhält also den reduzierten Dichteoperator, d.h. den Dichteoperator für ein Subsystem a indem man in der Dichtematrix des Gesamtsystems ab die Spur über das Subsystem b bildet , ρa = Sp[|Ψiab hΨ|ab ]b . Der Erwartungswert einer beliebigen Observablen A im Subsystem a ist P hAi = Sp [Aρa ]a = pa a hΨ| A |Ψia . a
Wir haben an obigem Beispiel gesehen, dass Freiheitsgrade, die für den Beobachter nicht zugängig sind, Quantenkorrelationen zum Verschwinden bringen. Die Verschränkung eines Quantensystems mit den externen Freiheitsgraden, d.h. mit der Umgebung, stellt eine solche Situation dar. Makroskopische Systeme können praktisch nie von der Umgebung isoliert werden mit der sie verschränkt sind. Ist man nur an den Eigenschaften des offenen Systems, d.h. des Systems ohne Umgebung, interessiert, so muss man über die Umgebungsfreiheitsgrade mitteln. Daher treten keine Kohärenzen auf. Bei einer Messung werden quantenmechanische Zustände und Korrelationen mit ihren probabilistischen Inhalten in klassische eindeutige Ergebnisse konvertiert.
25.8
Von Neumansches Messpostulat
Während in der Kopenhagener Interpretation die quantenmechanischen Zustände und der klassische Messapparat völlig voneinander getrennt sind, wird in der von Neumannschen Version des Messprozesses in der Quantenmechanik auch der Messapparat quantentheoretisch behandelt. Wir betrachten als Modellbeispiel ein Quantensystem |ΨiS =
n X i
ci |si iS ,
(25.15)
wobei |si iS die Eigenzustände eines Operators S sind, der gemessen werden soll. Der Einfachheit halber nehmen wir an, dass der Operator S ein nicht-entartetes diskretes
360
Kapitel 25. Der Dichteoperator
Spektrum besitzt. Den zugehörigen Hilbert-Raum bezeichnen wir mit HS . Bei einer Messung erfolgt eine Wechselwirkung des Zustandes |ΨiS mit dem Detektor, der durch einen Quantenzustand n X |ΦiD = aj |dj iD j
in einem Hilbert-Raum HD beschieben wird. Jeder Zeigerstellung wird durch einen Vektor |dj iD dargestellt. Um eine eindeutige Zuordnung des Zeigers mit der Eigenwerten der Observablen S herzustellen, nehmen wir an, dass die Dimension von HD gleich der von HS ist. In einem ersten Schritt werden Quantensystem und Detektor D als abgeschlossenes System behandelt und die Wechselwirkung mit der Umgebung vernachlässigt. Vor der Wechselwirkung ist der Zustand System plus Detektor durch das äußere Produkt |ΨiS |ΦiD ≡ |ΨiS ⊗ |ΦiD
gegeben. Der unitäre Zeitentwicklungsoperator U (tf , ti ) für das wechselwirkende System (S + D) erstrecke sich über ein Zeitintervall [ti , tf ]. Sei der Anfangszustand des zu messenden Systems |ΨiS zunächst gegeben durch |si iS . Der Anfangszustand System plus Detektor geht mit der unitären Zeitentwicklung im Laufe der Messung über in den Zustand |si iS |di iD , n X aj |di iD = |si iS |di iD . U (tf − ti ) |ΨiS |ΦiD = U (tf − ti ) |si iS j
Für den allgemeinen Zustand |ΨiS =
U (tf − ti )
n X i
ci |si iS
n X j
n P i
ci |si iS lautet diese Beziehung
aj |di iD =
n X i
ci |si iS |di iD ≡ |ΨiK .
(25.16)
|ΨiK ist eine kohärente Superposition des makroskopischen Systems S + D. Der korrelierte Zustandsvektor |ΨiK garantiert, dass das System im Zustand |si iS ist wenn das Messinstrument |di iD anzeigt. Von Neumann postuliert, dass es anschließend zu einem instantanen, nicht-unitären Kollaps des Zustandsvektors kommt, der den kohärenten Zustand |ΨiK in ein passendes Gemisch überführt. Bei einem Zwei-Zustandssystem z.B. wäre |ΨiK = [c1 |+iS |+iD + c2 |−iS |−iD ]
mit |c1 |2 + |c2 |2 = 1 .
Eine Messung führt dazu, dass der zugehörige Dichteoperator ρc = |ΨK i hΨK | = c1 c∗1 |+iS h+|S |+iD h+|D + c1 c∗2 |+iS h−|S |+iD h−|D + c∗1 c2 |−iS h−|S |+iD h+|D + c2 c∗2 |−iS h−|S |−iD h−|D c1 c∗1 c1 c∗2 . = c2 c∗1 c2 c∗2
25.9 Dekohärenz
361
instantan durch einen unbekannten, nicht-unitären Prozess in den reduzierten DichteOperator eines Gemisches, 0 aa∗ . ρ = |c1 |2 |+i h+| + |c2 |2 |−i h−| = (25.17) 0 bb∗ übergeht. Das von Neumannsche Messmodell bildet den Ausgangspunkt der modernen Theorie der Dekohärenz.
25.9
Dekohärenz
Zur Erklärung des von Neumannschen Messmechanismus, benötigen wir neben dem System S, dem Detektor D auch noch die Umgebung U . Der Anfangszustand der Umgebung sei |uiU . Dann ist der Zustand vor einer Wechselwirkung zwischen dem System |ΨiK (Gl. (25.16)) und der Umgebung gegeben durch ! n X ci |si iS |di iD |uiU . |Ψi = |ΨiK |uiU = i
Die Wechselwirkung mit der Umgebung führt zu dem verschränken Gesamtzustand S+D+U n X |Ψif = ci |si iS |di iD |ui iU i
mit zugehörigem Dichteoperator X ρSDU = c∗i ck (|sk i hsi |)(|dk i hdi |)(|uk i hui |). i,k
Da die Umgebung nicht beobachtet wird, geht der reduzierte Dichteoperator in die Messung ein, X ρSD = Sp [ρSDU ]U = c∗i ck (|sk i hsi |)(|dk i hdi |)hui |uk i , | {z } i,k
mit dem Ergebnis
ρSD =
X i
=δik
c∗i ci (|si i hsi |)(|di i hdi |).
Die entspricht genau dem in Gl. (25.17) gegebenen kollabierten Zustand. Die durch die Umgebung verursachte Dekohärenz liefert den dynamischen Mechanismus für die Reduktion des Zustandsvektors. Es muss betont werden, dass die Dekohärenz nicht durch Dämpfung oder Dissipation verursacht wird, sondern durch die Verschränkung mit der Umgebung. Die Zeitskala der Dissipation ist sehr viel größer als die der Verschränkung. Wenn man also Interferenzmuster beobachten will, bedarf es spezieller Techniken, um reine Zustände zu erzeugen, die nicht mit der Umgebung verschränkt sind. In anspruchsvollen Experimenten ließen sich Quanteninterferenzen auch für andere massive
362
Kapitel 25. Der Dichteoperator
Teilchen, wie Neutronen oder sogar für das C60 Molekül, zeigen. Die Kohärenz wird bei größer werdenden Objekten schnell durch die unkontrollierbare Wechselwirkung mit der Umgebung, die zur Verschränkung und einem sehr komplizierten Zustand führt, zerstört. Die Dekohärenz löst vermutlich auch das bekannte Schrödingersche Katzenparadox. Schrödinger wies darauf hin, dass im Rahmen der Quantenmechanik für eine Katze Zustände der Form 1 |Katzei = √ [|toti + |lebendigi] 2 prinzipiell möglich sind. Da Katzen niemals beobachtet wurden, die halb tot, halb lebendig waren, ließ Schrödinger an der Quantenmechanik zweifeln. Der makroskopische Quantenzustand |Katzei existiert im Prinzip, aber er kann in der Praxis nicht beobachtet werden, da er extrem instabil ist. Die Verschränkung mit der Umgebung erfolgt fast instantan. In letzter Zeit hat man makroskopische Quantenzustände, sogenannte Schrödingersche Katzenzustände, aus Lichtwellen erzeugt, an denen sich demonstrieren ließ, wie sich die reinen Zustände sukzessive durch Einfluss der Umgebung in Gemische verwandeln. In der Kopenhagener Interpretation gelten die in Kapitel 2 aufgelisteten Postulate der Quantenmechanik allein für das Quantensystem, der Beobachter und der Messprozess werden klassisch behandelt. Dies führt zu dem mysteriösen Kollaps des Superpositionszustandes in einen der Eigenzustände der Messobservablen. Diese Vorstellung ist sicherlich falsch. Beobachter und Messapparatur folgen denselben quantenmechanischen Regeln wie das zu untersuchende, vergleichsweise einfache Teilsystem. Die Theorie der Dekohärenz liefert auch für die kontrovers diskutierte Interpretation des Messprozesses in der Quantenmechanik neue Anstöße. Die Dekohärenz hat für ein, aus Quantenzustand und Messapparat bestehendes, Gesamtsystem die selbe Wirkung wie der Kollaps des Zustandes. Dekohärenz kann allerdings nicht erklären, warum bei einer Messung nur einer der möglichen Eigenwerte, und das mit einer bestimmten Wahrscheinlichkeit, gefunden wird. Das eigentliche Problem der Quantenmechanik besteht darin, den Zusammenhang zwischen dem probabilistischen Messprozess und der deterministischen zeitlichen Entwicklung der Zustände zu verstehen. Es muss aber betont werden, dass die Problematik nur die Interpretation des Messprozesses betrifft. Vom pragmatischen Standpunkt funktionieren die probabilistischen Bornschen Regeln der Quantenmechanik für isolierte Quantensysteme hervorragend.
Kapitel 26
Die Feynmansche Quantenmechanik Angeregt durch eine Fußnote Dirac’s, entwickelte Feynman eine Formulierung der Quantenmechanik, die auf Pfadintegralen und nicht auf Vektoren und Operatoren im Hilbert-Raum basiert. Wir diskutieren diese Formulierung der Quantenmechanik, da sie auf eine interessante Weise den Zusammenhang zwischen Quantenmechanik und klassischer Mechanik deutlich macht. Sie stellt eine Verbindung zwischen quantendynamischen Übergangsamplituden und den Trajektorien der klassischen Dynamik her. Außerdem findet die Pfadintegralmethode verbreitet Anwendung in der Quantisierung von Feldern und in der statistischen Mechanik.
26.1
Der Propagator
Wir betrachten ein quantenmechanisches System mit einem Freiheitsgrad und verallgemeinerter Koordinate q und Impuls p. Die Eigenzustände des Ortsoperators Q sind im Heisenberg- und Schrödinger-Bild jeweils QH (t) |q, tiH = q |q, tiH
Heisenberg-Bild
QS |qiS = q |qiS
Schrödinger-Bild
Im Schrödinger-Bild sind die physikalischen Zustände zeitabhängig, aber die Eigenzustände des zeitunabhängigen Ortsoperators (Basis) zeitunabhängig. Im Heisenberg-Bild ist es umgekehrt, die Operatoren und die zugehörigen Basiszustände sind zeitabhängig, die physikalischen Zustände aber zeitunabhängig. Um die Notation zu vereinfachen schreiben wir |q, tiH ≡ |q, ti und |qiS ≡ |qi . Der Zeitentwicklungsoperator
i
U (t) = e− ~ Ht
364
Kapitel 26. Die Feynmansche Quantenmechanik
liefert den Zusammenhang zwischen den beiden Bilder (siehe Kapitel 19), Damit wird
|...iS ≡ U (t) |...iH
bzw. |...iH ≡ U † (t) |...iS . i
|q, ti = U † (t) |qi = U † (t) |q, 0i = e ~ Ht |q, 0i .
Für das Matrixelement des Zeitentwicklungsoperators in der Ortsdarstellung erhält man D E i U (qf , tf ; qi , ti ) = hqf |U (tf − ti )|qi i = qf |e− ~ H(tf −ti ) |qi = hqf , tf |qi , ti i . (26.1)
Nach der Bornschen Regel stellt U (qf , tf ; qi , ti ) die Wahrscheinlichkeitsamplitude dafür dar, dass ein Teilchen, das sich zur Anfangszeit ti am Punkt qi befand, sich zur Zeit tf am Punkt qf befindet, d.h. zum Punkt q propagiert. Man bezeichnet den Zeitentwicklungsoperator daher auch als Green-Funktion oder Propagator. Der Propagator beschreibt in der Ortsdarstellung die zeitliche Entwicklung der Wellenfunktion: 1
oder
Ψ(qf , tf ) = hq| |Ψ, tf i = hqf | e i} H(tf −ti ) |Ψ, ti i Z 0 1 = dqi hqf | e i} H(t−t ) |qi i hqi | |Ψ, ti i Ψ(q, t) =
Z
dx0 U (q, t; q 0 , t0 )Ψ(qi , t0 ) .
Zur Demonstration betrachten wir den Fall eines bei q0 lokalisierten Teilchens Dann ist
Ψ(q, t0 ) = δ(qi − q0 ) . Ψ(q, t) = U (q, t; q0 , t0 ) .
Man sieht explizit, dass der Zeitentwicklungsoperator in der Ortsdarstellung die Wahrscheinlichkeitsamplitude dafür ist, dass ein Teilchen, das sich zur Anfangszeit t0 am Punkt q0 befindet, sich zur Zeit t am Punkt q befindet. Wir zeigen jetzt, dass sich die Green-Funktion hqf , tf |qi , ti i durch ein Pfadintegral darstellen lässt. Dazu teilen wir das Zeitintervall tf − ti in n + 1 Subintervalle
tf − ti n+1 auf, wobei wir am Schluss n → ∞ gehen lassen. Dann wird D E i hqf , tf |qi , ti i = qf |e− ~ H(tf −ti ) |qi D E i = qf |e− ~ H(n+1)Δt |qi ((n + 1)Δt = tf − ti ) n+1 i = qf | e− ~ HΔt |qi Z Z D ED E i i = dq1 .... dqn qf |e− ~ HΔt |qn qn |e− ~ HΔt |qn−1 × ... D ED E i i × q2 |e− ~ HΔt |q1 q1 |e− ~ HΔt |qi . (26.2) Δt =
26.1 Der Propagator
365
Wir betrachten einen einzelnen Term und setzen einen vollständigen Satz von Impulseigenfunktionen ein, D E Z i i qk+1 |e− ~ H(P,Q)Δt |qk = dpk hqk+1 |pk i hpk | e− ~ H(P,Q)Δt |qk i . (Die Integrationsvariablen müssen in jedem Term anders bezeichnet werden, daher pk ). Im Hamilton-Operator seien in Produkten von P und Q die Q rechts von den P angeordnet. Dann gilt E Z D i i qk+1 |e− ~ H(P,Q)Δt |qk = dpk hqk+1 |pk i hpk |qk i e− ~ H(pk ,pk )Δt . Wir hatten gezeigt, dass das Überlappmatrixelement durch hq|pi = √
i 1 e ~ pq 2π~
gegeben ist. Damit erhalten wir D
Z E i i i i 1 qk+1 |e− ~ HΔt |qk = dpk e ~ pk qk+1 e− ~ pk qk e− ~ H(pk ,qk )Δt 2π~ Z i i 1 = dpk e ~ pk (qk+1 −qk ) e− ~ H(pk ,qk )Δt . 2π~
Wir verwenden dieses Ergebnis in Gl. (26.2), hqf , tf |qi , ti i = × × ×
Z
Z
Z
Z
dq1 ....dqn
1 2π~
n+1
i
i
dpn e ~ pn (qf −qn ) e− ~ H(pn ,qn )Δt × ... i
i
i
i
dp1 e ~ p1 (q2 −q1 ) e− ~ H(p1 ,q1 )Δt dp0 e ~ p0 (q1 −qi ) e− ~ H(p0 ,qi )Δt
und erhalten mit q0 = qi , qn+1 = qf , Z R dp0 dp1 dpn hqf , tf |qi , ti i = dq1 ...dqn ... 2π~ 2π~ 2π~ n X (qk+1 − qk ) i exp Δt [pk − H(pk , qk )] . ~ Δt
(26.3)
k=0
Wir betrachten den Limes n → ∞ und Δt → 0 mit (n + 1) Δt = tf − ti fest. Da Δt → 0, setzen wir (qk+1 − qk ) ' q˙ . Δt
366
Kapitel 26. Die Feynmansche Quantenmechanik
Für die Produkte von Integralen führen wir eine kompakte Notation ein, n Y R
k=1
dqk
Z n Y R dpj .... ≡ [dq(t)][dp(t)].... 2π~ j=0
(n → ∞),
und erhalten hqf , tf |qi , ti i =
Z
[dq(t)][dp(t)] Z i tf dt [pq˙ − H(p, q)] × exp ~ ti
(26.4)
mit q(ti ) = qi und q(tf ) = qf . Diese Formel setzt die Quantenamplitude hqf , tf |qi , ti i mit einem sogenannten Pfadintegral über die klassischen Phasenraum-Variablen (p, q) in Verbindung. Man muss über alle Phasenraum-Trajektorien summieren, die zur Zeit ti durch den Punkt qi und zur Zeit tf durch den Punkt qf gehen. Jede Funktion q(t) und p(t) definiert einen Pfad im Phasenraum. Das Integral in Gl. (26.4) erstreckt sich über alle Funktionen, man spricht auch von einem Funktionalintegral. Die Darstellung wird noch transparenter, wenn die Hamilton-Funktion die einfache Form besitzt p2 H= + V (q) . 2m Dann kann man die p-Integration analytisch ausführen. Dazu benötigt man die Gaußschen Integrale Z ∞ √ a 2 1 dye− 2 y = 2π(a)− 2 (a > 0) −∞ Z ∞ a 2 dyye− 2 y = 0 −∞ Z ∞ Z ∞ √ a 2 a 2 3 d dyy 2 e− 2 y = −2 dye− 2 y = 2π(a)− 2 . da −∞ −∞ Beweis der ersten Formel: Z ∞ 2 Z −a y2 2 dye = −∞
=
Z
∞ −∞ ∞
dxdye
−∞ 1 R∞
= 2π =
dye
20
2π . a
2 −a 2y
dr 2 e
Z
∞
a
dxe− 2 x
−∞
2 2 −a 2 (x +y )
=
R∞ 2π R a 2 rdr dφe− 2 r 0
2 −a 2r
2
0
1 −2 h − a r2 i∞ = 2π e 2 2 a 0
Die Formeln gelten auch für komplexe a, solange Re a > 0.
26.1 Der Propagator
367
Wir betrachten einen der Terme in Gl. (26.3): Z ∞ p2 i dp exp Δt pq˙ − ~ 2m −∞ 2π~ Z ∞ h i 1 i dp 2 − (p − qm) ˙ exp Δt = + q˙2 m2 ~ 2m −∞ 2π~ Z ∞ 2 mq˙ 1 2 i dp i −p Δt exp Δt = exp ~ 2 ~ 2m −∞ 2π~ r mq˙2 i m . exp Δt = i2π~Δt ~ 2 Die pk -Integrationen also pliefern n nur einen konstanten, möglicherweise unendlichen Fakm tor limn→∞, Δt→0 . Als Ergebnis erhalten wir die Feynmansche Formel, i2π~Δt Z hqf , tf |qi , ti i = (const) [dq(t)] Z tf h i m 2 i dt , q˙ − V (q) × exp ~ ti 2
oder
hqf , tf |qi , ti i = (konst.)
Z
[dq(t)] exp
Z tf i dtL(q, q) ˙ . ~ ti
Abbildung 26.1: Feynmansches Pfadintegral
Wir haben damit die Quantenamplitude durch eine Summe über klassische Trajektorien vom Anfangspunkt qi zur Zeit ti zum Endpunkt qf und Zeit tf ausgedrückt. Der Phasenfaktor ist die klassische Wirkung in Einheiten von }. Die Idee, dass jede Trajektorie mit der Wirkung in Verbindung gebracht wird, kommt auch in der klassischen Mechanik in der Form des Hamiltonschen Prinzips vor. Neu ist, dass die Wirkung in Einheiten von } gemessen wird. Als einfache Illustration der Feynmanschen Formel kann das Doppelspaltexperiment für Elektronen dienen. Das Elektron ist nicht durch den einen Spalt oder den anderen Spalt auf den Schirm gelangt, sonder durch beide, d.h. über beide Pfade. In der Pfadintegralformulierung erhalten wir einen expliziten Ausdruck für die Übergangsamplitude. Dieser Zugang ist daher besonders für Streuprobleme geeignet, weniger für gebundene Zustände.
368
Kapitel 26. Die Feynmansche Quantenmechanik
In der klassische Mechanik besagt das Hamiltonsche Prinzip, dass der Pfad angenommen wird, der die Wirkung minimiert Z tf δ dtLklass. (q(t), q(t)) ˙ =0. ti
Dagegen tragen in der Quantenmechanik alle Pfade bei. Es gibt keine einzelne Trajektorie q(t) sondern unendlich viele Trajektorien. Für jeden Pfad berechnet man die klassische Wirkung Z S=
t
L(q, q)dt ˙
(26.5)
t0
und definiert die Green-Funktion durch
U (qf , tf ; qi , ti ) ≡
X
i
e ~ S.
alle P f ade
Der Begriff des Teilchens, den man normalerweise mit einem eindeutigen Pfad in Verbindung bringt, macht also in den Quantenmechanik strenggenommen keinen Sinn. Stattdessen erkennt man den wellenartigen Charakter der Quantendynamik. Eine klassische Welle kann aufgefasst werden als ein Strom von Teilchen, die sich im rechten Winkel zu Wellenfront bewegen. Im Limes ~ → 0 sollte man des klassische Ergebnis erhalten. Wenn ~ → 0, dann oszilliert die Exponentialfunktion immer stärker. Die Beiträge der benachbarten Pfade i heben sich größtenteils weg, da sich für ~ → 0 die Phasen von e ~ S eines bestimmten Pfades und eines benachbarten Pfades sehr stark unterscheiden. Eine Ausnahme bildet der Pfad mit stationärer Phase δS(ti , tf ) = 0. In der Nähe dieses Pfades ändert sich die Phase nicht, selbst für ~ → 0. Die benachbarten Phasen interferieren konstruktiv. Im Limes für ~ → 0 erhält man also einen einzigen Pfad, d.h. eine Trajektorie, und zwar die klassische. Man erhält die klassische Mechanik, wenn die Wirkung, die zum klassischen Pfad gehört, sehr viel größer ist als ~ (wie z.B. für einen Billard-Ball).
Kapitel 27
Symmetrien in der Quantenmechanik 27.1
Das Wignersche Theorem
Wir betrachten eine, auf dem ganzen Hilbert-Raum definierte, Transformation T , die einen quantenmechanischen Zustand |Ψi in einen anderen Zustand |Ψ0 i überführt. |Ψi → |Ψ0 i = T |Ψi .
Man spricht von einer aktiven Transformation, da der Zustand, d.h. das physikalische System, transformiert wird und nicht das Koordinatensystem. Von besonderen Interesse sind Transformationen, wenn die alten und die neuen Zustände auf die gleichen experimentellen Ergebnisse führen. Symmetrietransformationen: Eine Transformation, die auf die Zustandsvektoren wirkt, heißt Symmetrietransformation, wenn sie beobachtbare Größen unverändert lässt. Eine Symmetrie in der Quantenmechanik ist demnach eine Abbildung von Vektoren im Hilbert-Raum, |Ψi → |Ψ0 i = T |Ψi und |Φi → |Φ0 i = T |Φi, die den Betrag von Skalarprodukten invariant lässt, | hΦ|Ψi | = | hΦ0 |Ψ0 i |
für alle |Ψi und |Φi .
Den Observablen entsprechen Hermitesche Operatoren A mit reellen Eigenwerten ai und Eigenvektoren |ai i. Da A in der Eigenbasis gegeben ist durch X ai |ai i hai | , A= i
0
folgt, dass die Observable sich unter |ai i = T |ai i transformiert wie X A0 = ai T |ai i hai | T † , oder A0 = T AT † . i
370
Kapitel 27. Symmetrien in der Quantenmechanik
Unitären Transformationen, die das Skalarprodukt selbst invariant lassen, bilden offensichtlich Symmetrietransformationen. Die Klasse von Transformationen, die den Betrag des Skalarproduktes invariant lassen, geht aber über die unitären Transformationen, hinaus. Eugene Wigner hat in einem bemerkenswerten Theorem gezeigt, dass es für Transformationen, die den Betrag des Skalarproduktes invariant lassen, nur zwei Möglichkeiten gibt. Wignersches Theorem: Eine eindeutige Abbildung eines Hilbert-Raumes auf sich selbst, die | hΨ|Φi |2 invariant lässt, ist entweder unitär oder anti-unitär (Beweis: siehe z.B. Gottfried (2003)). hΨ0 |Φ0 i = hΨ|Φi ,
unitär
∗
hΨ0 |Φ0 i = hΨ|Φi ,
anti-unitär
Wir beschränken uns zunächst auf Symmetrietransformationen, die stetig aus der Einheit hervorgehen, so dass nur die unitäre Option in Frage kommt. Anti-unitäre Transformationen treten in der Quantentheorie nur bei Zeitumkehr auf.
27.2
Unitäre Transformationen
Eine Transformation U ist unitär, wenn U U † = U †U = 1 . Wir hatten gesehen, dass eine unitäre Tranformation den Übergang von einer orthonormalen Basis zu einer anderen beschreibt. Im Folgenden wollen wir die physikalischen Auswirkungen einer solchen Transformation genauer untersuchen. Die Eigenwertgleichung A |ai = a |ai
einer Observablen A bedeutet, dass eine Messung von A den Wert a ergibt, wenn sich das System im Zustand |ai befindet. Multiplikation mit U ergibt U A |ai = aU |ai
oder Sei Dann gilt
U AU † U |ai = aU |ai 0
|ai = U |ai
und A0 = U AU † . 0
0
A0 |ai = a |ai .
D.h. eine Messung der Observablen in der transformierten Basis liefert den selben Wert a. Der Erwartungswert einer Messung (Mittelwert) von A in einem allgemeinen System |Ψi ist gleich dem Erwartunswert von A0 in System |Ψ0 i,
hΨ0 |A0 |Ψ0 i = Ψ|U † U AU † U |Ψ = hΨ|A|Ψi . Dies gilt für alle |Ψi.
27.2 Unitäre Transformationen
371
Auch die quantenmechanischen Vertauschungsrelationen sind offensichtlich invariant unter unitären Transformationen, [A, B] = [A0 , B 0 ] . Die Dynamik wird durch den Hamilton-Operator bestimmt. Die Bewegungsgleichungen im Heisenberg-Bild, dA i} = [A, H] , (27.1) dt sind invariant unter konstanten unitären Transformationen, i}
dA0 = [A0 , H 0 ], wo A0 = U AU † und H 0 = U HU. dt
Wenn die unitäre Transformation U von der Zeit abhängt, ändert sich die transformierte Bewegungsgleichung in dA0 = [A0 , K], i} dt wo der neue Hamilton-Operator gegeben ist durch K = H 0 − i}
dU † U . dt
Beweis: i}
dA0 d = i} U AU † dt dt dA † dU † dU † † † = i} , U U AU + U U + U A(U U ) dt dt dt
wo wir Faktoren U U † = U † U = 1 eingefügt haben. Da U U † = 1 folgt dU † dU † U +U =0. dt dt Damit wird
dA0 dU † 0 0 dU † i} = i} U A −A U + U [A, H] U † , dt dt dt 0 dU † = −i} A , U + [A0 , H 0 ] . dt
Die unitären Transformationen der Quantenmechanik lassen die Heisenbergsche Bewegungsgleichungen invariant und entsprechen damit den kanonischen Transformationen der klassischen Physik, die die Hamiltonschen Gleichungen invariant lassen. Jede unitäre Transformation kann man schreiben als U = e−iG , wo G Hermitesch und damit eine Observable ist.
372
Kapitel 27. Symmetrien in der Quantenmechanik
Die unitären Symmetrietransformationen eines physikalischen Systems bilden eine Gruppe, die Symmetriegruppe, da zwei aufeinander folgende unitäre Transformationen U1 U2 wieder eine unitäre Transformation ergeben und ein Einselement und die inverse Transformation definiert sind. Eine kontinuierliche Symmetriegruppe ist eine Menge von Symmetrietransformationen, die von einem Parameter abhängen, und die sich nach dem Parameter differenzieren lassen. In diesem Fall kann man sich auf Transformationen beschränken, die sich nur infinitesimal von der Einheit unterscheiden, U = e−iδαG ' 1 − iδαG . Eine Observable A transformiert sich dann in A0 = U AU † = (1 − iδαG)A(1 + iδαG)
= A + iδα[A, G] + O[(δα)2 ] ,
oder
δA = i[A, G] , wo δA = A0 − A . δα G heißt die Erzeugende der Transformation. Die endliche Transformation erhält man durch Iteration i2 (27.2) e−iG Ae+iG = A + i[A, G] + [[A, G]G] + ... . 2! Dies ist die Baker-Hausdorff-Formel.
27.3
Symmetrie
Nicht jede Symmetrietransformation eines quantenmechanischen Systems ist wirklich eine Symmetrie im physikalischen Sinne. Wir müssen zusätzlich verlangen, dass die Symmetrie unter der Dynamik, d. h. der zeitlichen Entwicklung erhalten bleibt. Nur dann führt eine Symmetrie auf Erhaltungsgrößen. Es ist wichtig, diese zu identifizieren, um quantenmechanische Probleme effizient zu formulieren und zu lösen. Soweit hatte der Begriff Symmetrietransformation nichts mit der Dynamik zu tun, sie bezog sich auf eine feste Zeit, z.B. t = 0. Die Symmetrietransformation führt einen Zustand in einen anderen über |Ψ0 , t = 0i = U |Ψ, t = 0i . Die zeitliche Entwicklung eines Zustandes ist im Schrödinger-Bild gegeben durch |Ψ, ti = e
−i } Ht
|Ψ, 0i .
Wenn wir verlangen, dass die Symmetrie die dynamische Evolution respektiert, sollte es keine Rolle spielen, ob wir das System zuerst transformieren und dann die zeitliche Entwicklung durchführen, oder das Ganze in umgekehrter Reihenfolge ausführen, Ue
−i } Ht
=e
−i } Ht
U .
(27.3)
27.3 Symmetrie
373
Anders geschrieben Ue
−i } Ht
U† = e
−i } Ht
.
Daraus folgt mit Hilfe der Baker-Hausdorff-Formel Gl. (27.2), dass H 0 = U † HU = H
oder [H, U ] = 0 .
(27.4)
Eine Symmetrie, die für alle Zeiten gelten soll, wird durch eine unitäre Transformation beschrieben, die den Hamilton-Operator invariant lässt. Setzen wir die infinitesimale Form U ≈ 1 − }i δαG in Gl. (27.4) ein, dann finden wir, dass auch G mit H vertauscht, [G, H] = 0 . (27.5) Wenn wir Zeit t = 0 einen Eigenzustand von G mit Eigenwert g betrachten, G |g, 0i = g |g, 0i , dessen zeitliche Entwicklung durch die Schrödinger-Gleichung beschrieben wird, d.h. |g, ti = e
−i } Ht
|g, 0i ,
dann bleibt dieser ein Eigenzustand von G zum Eigenwert g, G |g, ti = g |g, ti , für alle t. Da die Operatoren im Schrödinger-Bild zeitunabhängig sind, folgt, dass auch die Erwartungswerte des Operators G zeitunabhängig sind. Beweis: Sei |Ψ, ti = |Ψ, ti = e
−i } Ht
|Ψ, 0i = e
Da ci und gi zeitunabhängig sind, gilt
−i } Ht
X i
ci |gi , 0i =
X i
ci |gi , ti .
d X ∗ d hΨ|G|Ψi = ci ck hgi , t|G|gk , ti dt dt i,k
d X ∗ d X ∗ ci ck gk hgi , t|gk , ti = c ci gi = 0 . = dt dt i i i,k
Wir erhalten zusammenfassend das wichtige Ergebnis: Jeder kontinuierlichen Symmetrietransformation, die den Hamilton-Operator invariant lässt, entspricht ein Erhaltungssatz, und umgekehrt. Der Erwartungswert der zugehörigen Erzeugenden ist zeitunabhängig. Die Symmetrie des Hamilton-Operators bedeutet, dass die Transformation Energieeigenvektoren auf Energieeigenvektoren zum selben Eigenwert abbildet: H |Ei = E |Ei
→ HU |Ei = EU |Ei .
374
Kapitel 27. Symmetrien in der Quantenmechanik
Wenn |Ei und U |Ei linear unabhängig sind, dann führt die Symmetrie auf eine Entartung der Eigenwerte. In Kapitel 23 hatten wir bereits diskutiert, wie die Symmetrietransformationen der Translationen auf den Impuls-Operator führen. Entsprechend hat der Drehimpuls die geometrische Bedeutung, dass er die Erzeugende der Drehungen ist. Wegen ihrer Wichtigkeit wollen wir die Drehungen im Folgenden im Detail analysieren.
27.4
Drehungen in der klassischen Mechanik
Die Symmetrie unter Drehungen und ihre Erzeugende, der Drehimpuls, ist wahrscheinlich die wichtigste Symmetrie in der Quantenmechanik. Die Bedeutung des Drehimpulses beruht darauf, dass er oft erhalten ist und damit für dir Charakterisierung von dreidimensionalen Zuständen verwendet werden kann. In Kapitel 23 haben wir den Bahndrehimpuls schon eingeführt. In der Quantenmechanik gibt es aber auch Manifestationen des Drehimpulses, die keine klassische Entsprechung haben, wie z.B. der Spin des Elektrons. Im Folgenden wollen wir daher die Theorie des quantenmechanischen Drehimpulses allgemein über den Begriff der Darstellung von Drehungen formulieren. Wenn wir in der Quantenmechanik die Eigenschaften der unitären Transformationen der Drehungen bestimmen wollen, dann hilft es, sich noch einmal die wichtigsten Eigenschaften von Drehungen in der klassischen Mechanik vor Augen zu führen. Dabei interessieren besonders Relationen, die nach dem Korrespondenzprinzip auch von den quantenmechanischen Erwartungswerten erfüllt sein sollten. Im physikalischen dreidimensionalen Ortsraum stellen Drehungen Transformationen dar, die die Richtung von Vektoren aber nicht deren Länge ändern. Der klassische Ortsvektor transformiert sich unter aktiven Drehungen, d.h. Drehung des Vektors (Apparatur) bei festen Koordinatenachsen, wie ~x0 = R~x
oder x0i = Rik xk ;
(i, k = 1, 2, 3).
Wir verwenden das Symbol R sowohl für die Transformation des Vektors ~x als auch für die 3 × 3-Matrix, die auf den Spaltenvektor xi in kartesischen Koordinaten wirkt. (Beachte: Im der klassischen Mechanik hatten wir passive Drehungen betrachtet, d.h. Drehungen des Koordinatensystems, mit Drehmatrix M = R> ). Aus der Invarianz der Länge zweier Vektoren ~x und ~y und deren relativer Orientierung folgt die Invarianz des Skalarprodukts (~x ∙ ~y = |~x||~y | cos(~x, ~y )). Das bedeutet, dass die 3 × 3-Matrizen R orthogonal sind, ∀~x, ~y ∈ E3 :
(Rx)T (Ry) = xT y ⇐⇒ RT R = 1 ,
wo 1 die 3 × 3 Einheitsmatrix ist. Die Drehungen bilden eine Gruppe, da zwei aufeinander folgende Drehungen offensichtlich wieder eine Drehung ergeben und ein Einselement und die inverse Drehung definiert sind. Wir betrachten hier nur Drehungen, die stetig aus der Einheit hervorgehen, d.h. wir schließen Spiegelungen aus.
27.4 Drehungen in der klassischen Mechanik
375
Die Drehungen hängen stetig von einem Parameter ab, dem Drehwinkel. Als Beispiel betrachten wir die Drehung um einen Winkel φ um die z-Achse, cos φ − sin φ 0 Rz (φ) = sin φ cos φ 0 . 0 0 1 Für infinitesimale Drehwinkel O(ε3 ). Dann wird 1 −ε Rz (ε) ' ε 1 0 0
ε kann man entwickeln, cos ε = 1 + O(ε2 ), sin ε = ε + 0 1 0 = 0 1 0
0 1 0
0 0 1 0 0 − ε −1 0 0 . 1 0 0 0
Wir definieren die Erzeugende für infinitesimale Drehungen um die z-Achse durch Rz (ε) = 1 − εIz , wo
0 1 0 Iz = −1 0 0 . 0 0 0
Der Name Erzeugende rührt daher, dass man endliche Drehungen durch sukzessive infinitesimale Drehungen mittels der Formel lim (1 −
n→∞
φ n Iz ) = e−Iz φ n
aufbauen kann. Analog erhält man für Drehungen um die anderen Koordinatenachsen Ri (ε) = 1 − ε(i) Ii , mit
0 0 Iy = 0 0 1 0
i = x, y .
−1 0 0 , Ix = 0 0 0
0 0 0 1 . −1 0
Dies sind die Erzeugenden für Drehungen um die x und y-Achse. In der üblichen Konvention (x → 1, y → 2, z → 3) ist dann (Ii )kl = εikl . Durch explizites Nachrechnen beweist man die Vertauschungsrelationen [Ii , Ik ] = −εikl Il .
(27.6)
Anmerkung: Man muss den hier gebrauchten Begriff der infinitesimalen Erzeugenden unterscheiden von den Erzeugenden der infinitesimalen kanonischen Transformationen.
376
27.5
Kapitel 27. Symmetrien in der Quantenmechanik
Drehungen in der Quantenmechanik
Gegeben sei eine orthogonale Matrix R die ein klassisches physikalisches System im R3 dreht, während die Koordinatenachsen festgehalten werden. Wird ein quantenmechanisches System |Ψi entsprechend gedreht, so erhält man ein neues System, d.h. einen neuen Zustandsvektor |Ψ0 i = D(R) |Ψi, wo D(R) ein linearer Operator im HilbertRaum der Zustände ist. Beispiel: Wir drehen den üblichen Stern-Gerlach-Magneten um eine Winkel θ um die y-Achse, d.h. um die Ausbreitungsrichtung. Anmerkung: R ist eine 3 × 3-Matrix, während die Dimension N der Matrixdarstellung von D(R) vom jeweiligen Zustandsraum abhängt, z.B. N = 2 für das Spin-1/2-System und N = ∞ für den harmonischen Oszillator. Bei einer Drehung kann man auch die Operatoren (Observablen) drehen. Als Beispiel mag das Stern-Gerlach-Experiment dienen. Drehen wir den Präparationsmagneten, dann drehen wir den Zustand. Drehen wir den Analysator, dann drehen wir den Operator. Sei A eine Observable, dann ist A0 = DAD † die gedrehte Observable. Euklidisches Relativitätsprinzip: Lage und Orientierung eines physikalischen Systems im ansonsten leeren Raum haben keine absolute Bedeutung, da der Raum homogen und isotrop ist. Das bedeutet für die Quantenmechanik, dass alle Wahrscheinlichkeiten gegenüber Drehungen (und Translationen) invariant sind. D.h. | hΨ0 |Φ0 i |2 = | hΨ|Φi |2 ,
wo |Ψ0 i = D(R) |Ψi und |Φ0 i = D(R) |Φi.
Da Drehungen stetig aus der Einheit hervorgehen, muss D(R) unitär sein. Für eine Drehung um einen Winkel φ um die i-Achse (i = 1, 2, 3) schreiben wir i
D(i) (φ) = e− } Ji φ mit Ji Hermitesch. Die Erzeugende Ji der Drehungen um die Achse i ist definiert durch D(i) (δφ) = 1 −
i δφJi . }
Ji heißt quantenmechanischer Drehimpuls. Der Zusammenhang mit dem klassischen Drehimpuls wird gleich klar.
27.6
Observable und Drehungen
Zur Demonstration betrachten wir wieder das Stern-Gerlach-Experiment. Der Analysator (Observable) sei festgehalten, der Polarisator (Zustand) kann gedreht werden, |Ψi → |Ψ0 i = D(R) |Ψi .
27.6 Observable und Drehungen
377
Dabei ändern sich die Erwartungswerte einer Observablen A,
hΨ|A|Ψi → hΨ0 |A|Ψ0 i = Ψ|D† AD|Ψ .
Eine Messung einer Observablen kann entweder denselben Wert ergeben (z.B. J 2 ) oder einen anderen Wert (z.B. Jz ). Wir fragen uns: Wie transformiert sich eine Observable unter Drehungen? Skalar: Eine Observable S ist ein Skalar oder invariant, wenn S 0 = D † SD = S
oder
[S, D] = 0 .
D.h. eine drehinvariante Observable vertauscht mit allen Drehoperatoren. Sehr oft ist der Hamilton-Operator drehinvariant. Dann gilt [H, D] = 0
oder
[H, Ji ] = 0
für alle i = 1, 2, 3 .
Für drehinvariante Hamilton-Operatoren ist der Drehimpuls erhalten. Vektoroperator: ~ Da sich der Ortsvektor der klassischen Wie transformiert sich der Ortsoperator X? Mechanik unter Drehungen transformiert wie xi → x0i = Rik xk , erwarten wir, dass für die quantenmechanischen Operatoren Xi → Xi0 = D † Xi D gilt. Dabei ändern sich die Erwartungswerte,
hΨ|Xi |Ψi → Ψ|D † Xi D|Ψ .
Um den klassischen Limes für die Erwartungswerte zu erhalten, verlangen wir andererseits, dass bei einer Drehung X hΨ|Xi |Ψi → Rik hΨ|Xk |Ψi . k
Dann muss für den gedrehten Ortsoperator gelten X Rik Xk . D † (R)Xi D(R) =
(27.7)
Für einen Vektoroperator Ai gilt daher per Definition X D † (R)Ai D(R) = Rik Ak .
(27.8)
k
k
~ transformiert, heißt Ein Operator, der sich unter Drehungen wie der Ortsoperator X Vektoroperator.
378
Kapitel 27. Symmetrien in der Quantenmechanik
Operator-Darstellungen der Drehgruppe Definition: Eine Operator-Darstellung einer Gruppe ist eine Abbildung der Gruppenelemente auf Operatoren, die die Produkteigenschaft erhält. Wir betrachten zwei aufeinander folgende Drehungen. Diese entsprechen einer einzigen Drehung R1 R2 = R3 . Die D(R) bilden eine Operatordarstellung der Drehgruppe, wenn D(R1 )D(R2 ) = D(R1 R2 ) = D(R3 ). In der Quantenmechanik genügt es, wenn diese Beziehung bis auf eine Phase gilt. Bei der Konstruktion von Darstellungen der Drehgruppe können wir in der Quantenmechanik nur verlangen, dass D(R1 )D(R2 ) |Ψi = eiα D(R3 ) |Ψi für alle |Ψi , wo α von R1 und R2 abhängen kann. Man spricht von einer projektiven Darstellung. Mit einigem Aufwand kann man zeigen, dass nur die Möglichkeiten α = 0, π betrachtet werden müssen. Für den Bahndrehimpuls ist α = 0 und für den Spin 12 ist α = π. Zur Illustration betrachten wir das Verhalten des Vektoroperators bei zwei aufeinander folgenden Drehungen mit R1 R2 = R3 . Für die einzelnen Drehungen gilt quantenmechanisch D † (R1 )Xk D(R1 ) = (R1 )kj Xj ,
D † (R2 )Xi D(R2 ) = (R2 )il Xl .
Dann wird D † (R3 )Xi D(R3 ) = D† (R2 )D † (R1 )Xi D(R1 )D(R2 ) = D† (R2 )(R1 )ij Xj D(R2 ) = (R1 )ij (R2 )jl Xl = (R3 )il Xl .
27.7
Drehimpuls-Vertauschungsrelationen
Für Drehungen um eine feste Achse ~n werden die unitären Operatoren D(R~n ) durch einen einzigen Parameter, den Drehwinkel, parametrisiert. Für infinitesimale Drehungen D(Ri ) um eine Koordinatenachse ~ei (i = 1, 2, 3) um den Winkel δθi gilt D(δθi ) = 1 −
i Ji δθi . ~
Wir identifizieren den Hermiteschen Operator J~ mit dem Drehimpuls (Bahndrehimpuls oder Spin). Der Faktor } wurde eingeführt, damit Ji die Dimension eines Drehimpulses hat. Wenn die D(R) eine Darstellung der Drehgruppe bilden sollen, müssen die D(R) die gleichen algebraischen Relationen erfüllen wie die 3 × 3-Drehmatrizen R. Für infinitesimale Drehungen war Ri (δθi ) = 1 − δθi Ii
mit (Ii )kl = εikl .
27.8 Endliche Drehungen
379
Dann müssen speziell die ~i Ji die gleichen Vertauschungsrelationen erfüllen, wie die klassischen Erzeugenden der infinitesimalen Drehungen Ii Gl. (27.6) [Ii , Ik ] = −εikl Il oder
i i i → [ Ji , Jk ] = −εikl Jl , ~ ~ ~
[Ji , Jk ] = i~εikl Jl .
Die Vertauschungsregeln können auch auf andere Weise abgeleitet werden: ~ =X ~ × P~ mit [Xi , Pj ] = i~δij . a) Aus der Definition L b) Aus der Poisson-Klammer {Li , Lk } = εikl Ll und der Diracschen Quantisierungs1 [ , .]. vorschrift {, } → i~ Die letzten beiden Ableitungen gelten nur für den Bahndrehimpuls und nicht für den Spin. Vertauschungsrelation für Vektoroperatoren: Der Ortsoperator transformiert sich unter Drehungen wie (27.7) D † (Ri )Xk D(Ri ) = (Ri )kj Xj . Wir betrachten die linke und rechte Seite dieser Gleichung i i Ji δθi )Xk (1 − Ji δθi ) ~ ~ i = Xk − δθi [Xk , Ji ] ~
l.S. = (1 +
r.S. = (1 − δθi Ii )kl Xl
= Xk − δθi (Ii )kl Xl .
Da (Ii )kl = εikl , folgt
[Xi , Jk ] = i~εikl Xl
(27.9)
Jeder Vektoroperator erfüllt wegen Gl. (27.8) die gleichen Vertauschungsrelationen mit J~ wie Xj .
27.8
Endliche Drehungen
Eine infinitesimale Drehung um eine Achse ~n wird beschrieben durch den Drehoperator D(~n, δφ) = 1 −
i~ J ∙ ~nδφ . ~
Eine endliche Drehung um die Achse ~n kann durch aufeinanderfolgende infinitesimale Drehungen um diese Achse aufgebaut werden. Wir unterteilen den Drehwinkel in N Elemente Δφ, φ = N Δφ
380
Kapitel 27. Symmetrien in der Quantenmechanik
Dann ist
i φ D(~n, φ) = lim 1 − J~ ∙ ~n N →∞ ~ N i~ = exp − J ∙ ~n . ~
N
(27.10)
Euler-Winkel: Eine beliebige Drehung kann in drei Schritten durchgeführt werden, R(α, β, γ) = R(z) (α)R(y) (β)R(z) (γ) . Die Koordinatenachsen werden festgehalten. Die Euler-Winkel in der Quantenmechanik sind anders definiert als die in der Mechanik! Da die Drehoperatoren eine Darstellung bilden, muss gelten D(α, β, γ) = D(z) (α)D (y) (β)D(z) (γ) .
27.9
Darstellungen von Spin- 12 -Systemen
Die „definierende“ Darstellung (R) der Gruppe ist dreidimensional, aber die einfachste nicht-triviale Operatordarstellung ist zweidimensional und ist gegeben durch i~ 1 D(~n, φ) = exp − S (27.11) ∙ ~nφ = exp −i ~n ∙ ~σ φ , ~ 2 mit
~ = 1 }~σ . S 2 Die Si bilden eine Darstellung der Drehgruppe, da [Si , Sk ] = i~εikl Sl , was aus der früher gezeigten Relation der Pauli-Matrizen [σi , σk ] = 2iεikl σl ~ gleich ± 1 } sind, bezeichnen wir diese Darstellung als folgt. Da die Eigenwerte von S 2 1 Spin 2 Darstellung. Durch Entwicklung der Exponentialfunktion in Gl. (27.11) und Verwendung von (~n ∙ ~σ )2 = 1 erhält man das erstaunliche einfache Ergebnis 1
D(~n, φ) = e−i 2 ~n∙~σφ = cos
φ φ 1 − i sin ~n ∙ ~σ . 2 2
(27.12)
Dies ist auch die Form der allgemeinsten unitären 2 × 2-Matrix mit Determinante 1. Eine allgemeine unitäre Transformation eines Zwei-Zustandssystems (Qbit) kann man sich damit auch als Drehung eines Spins vorstellen. An der Formel (27.12) erkennt man die Mehrdeutigkeit der Darstellung: D(~n, φ = 2π) = −1 .
(27.13)
27.9 Darstellungen von Spin- 12 -Systemen
381
Solche doppelwertigen Darstellungen heißen Spinor-Darstellungen. Wir übersetzen jetzt einige Ergebnisse aus Kapitel 20 in der Sprache der Drehmatrizen. Für eine beliebige Drehachse ~n, die in Polarkoordinaten durch ~n = (sin θ cos φ, sin θ sin φ, cos θ) gegeben ist, ergibt in der Pauli-Darstellung cos θ ~n ∙ ~σ = eiφ sin θ
e−iφ sin θ − cos θ
.
Der zugehörige Eigenvektor zu Eigenwert 1 berechnet sich zu ! φ e−i 2 cos θ2 |(θ, φ), +i = . φ ei 2 sin θ2 Dies ist der Eigenvektor für den Spin in Richtung ~n, ~ ∙ ~n |(θ, φ), +i = } |(θ, φ), +i . S 2 Wir zeigen jetzt, das die Drehung der Erwartungswerte, der Drehung eines klassischen Vektors entspricht. Dazu betrachten wir den Erwartungswert von Sx für einen Zustand |αi:
hα|Sx |αi → R hα|Sx |αiR = α|Dz† (φ)Sx Dz (φ)|α .
Unter der Drehung transformiert sich Sx in
Sx → Dz† (φ)Sx Dz (φ) = Sx cos φ − Sy sin φ .
(27.14)
Beweis: Verwende die Basis {|±i} mit Sz |±i = ± ~2 |±i. Dann ist i i ~ Dz† (φ)Sx Dz (φ) = e ~ Sz φ {|+i h−| + |−i h+|}e− ~ Sz φ 2 o φ φ φ ~ n iφ = e 2 |+i h−| ei 2 + e−i 2 |−i h+| e−i 2 2 ~ iφ e |+i h−| + e−iφ |−i h+| = 2 ~ ~ = (|+i h−| + |−i h+|) cos φ + i (|+i h−| − |−i h+|) sin φ 2 2 = Sx cos φ − Sy sin φ.
Wir bilden in Gl. (27.14) Erwartungswerte hSx iα ≡ hα|Sx |αi, hSx iα →
R
hα|Sx |αiR = hSx iα cos φ − hSy iα sin φ .
(27.15)
Auf analoge Weise findet man hSy iα → hSz iα →
hα|Sx |αiR = hSx iα sin φ + hSy iα cos φ R hα|Sz |αiR = hSz iα . R
(27.16) (27.17)
382
Kapitel 27. Symmetrien in der Quantenmechanik
Wenn also ein Drehoperator auf einen Spin-Zustand wirkt, dann drehen sich die Er~ wie die Komponenten eines klassischen Vektors wartungswerte von S X hSi i → Rik hSk i , (27.18) k
wo Rik die üblichen Drehmatrizen sind. Z.B. für eine Drehung um die z-Achse ist cos φ − sin φ 0 R = sin φ cos φ 0 . 0 0 1 Das Ergebnis (27.18) gilt für alle Drehimpulse Ji , Bahndrehimpuls oder Spin, X Rik hJk i . hJi i → k
Bei einer Drehung um 360◦ geht wegen Gl. (27.13) |αiRz (2π) = − |αi
(e±iπ = −1).
Dieses (−) ist der Grund warum Spin-1/2-Teilchen in der klassischen Mechanik nicht auftreten können. Das (−) verschwindet, wenn man Erwartungswerte bildet, kann aber in Interferenz-Experimenten beobachtet werden.
27.10
Neutronen-Interferenz
Spin-Präzession: Wir wiederholen einige Ergebnisse aus Kapitel 20. Für ein Spin-1/2-Teilchen im Magnetfeld ist die Hamilton-Funktion ~ . H = −~ μ∙B Das Magnetmoment μ ~ ist gegeben durch μ ~ =g
e ~ S, 2mc
wo g das gyromagnetische Verhältnis ist mit g = 2 für Elektronen. Zeigt das Magnetfeld in die negative z-Richtung, dann ist H = ωSz , wo
eB 2mc die Lamor-Frequenz und m die Masse des Teilchens ist. Der Zeitentwicklungsoperator zu dieser Hamilton-Funktion war ω=g
i
i
U (t) = e− ~ Ht = e− ~ Sz ωt .
27.10 Neutronen-Interferenz
383
Dann ist die Zeitabhängigkeit eines Zustandes gegeben durch i
|Ψ(t)i = U (t) |Ψ(0)i = e− ~ Sz ωt |Ψ(0)i . Man kann U (t) auch als einen Drehoperator zum Drehwinkel φ = ωt auffassen. Das (−)-Zeichen bei Drehungen um 360◦ für Spin-1/2-Teilchen lässt sich durch Interferenz nachweisen. Interferometrie für Neutronen: Ein mono-energetischer, in z-Richtung polarisierter Neutronenstrahl wird durch einen perfekten Siliziumkristall in zwei Teile kohärent aufgespalten. Die beiden Teilstrahlen können über mehrere Zentimeter auseinandergeführt und dann wieder zusammengeführt werden. Strahl 1 bleibt unbeeinflusst und Strahl 2 geht durch ein Magnetfeld B. Dadurch erfährt er eine Phasenverschiebung um e−iωT , wo T die Zeit im Magnetfeld und ω die Lamor-Frequenz für Neutronen ist, ω = 1.91
eB . mn c
Ausgedrückt durch den Impuls p der Neutronen und die Länge L des Magneten ist T =
mL , p
wobei angenommen ist, dass das Magnetfeld so schwach ist, dass es den Impuls des Neutrons nicht ändert. Der Strahl im Interferenzgebiet setzt sich aus den beiden Teilstrahlen aus den Strahlwegen 1 und 2 zusammen: |Ψi = |Ψ1 i + |Ψ2 i Strahl 1:
Strahl 2
1 0
φ . 1 |Ψ2 (φ)i = e−i 2 2
1 0
. 1 |Ψ1 (0)i = 2
mit φ=
−1.91e T . 2mn c
Man erhält dann |Ψ2 (2π)i = − |Ψ2 (0)i , |Ψ2 (4π)i = |Ψ2 (0)i .
384
Kapitel 27. Symmetrien in der Quantenmechanik
Die Intensität im Interferenzgebiet ist 2
I(φ) = ||Ψ1 (0)i + |Ψ2 (φ)i| 2 1 1 −i φ 2 = 1+e 0 2 2 1 φ = e−i 2 + 1 4 2 1 φ φ −i φ2 . = (1 + cos ) + 1 = 1 + 1 + 2 cos e 2 2 2
Für φ = 2π ist I(2π) = 0. Das Experiment kann auch mit einer großen Zahl von einzelnen Neutronen ausgeführt werden, die als |Sz , +i-Zustände präpariert werden. Das Interferenzmuster wurden 1975 von Rauch et al. beobachtet 1 .
27.11
Drehinvarianz und Drehimpulserhaltung
Wir betrachten die infinitesimale Drehung eines Zustandes |Ψi |Ψ0 i = D(R) |Ψi = (1 −
i~ J ∙ ~nδφ) |Ψi . ~
Ein Zustand ist drehinvariant, wenn |Ψi = |Ψ0 i = (1 − oder Hinreichend ist schon, dass
Ji |Ψi = 0 ,
i~ J ∙ ~nδφ) |Ψi , ~ für alle i .
J 2 |Ψi = 0 ,
da J 2 ein positiv-definiter Operator ist. Diese Bedingungen sind z.B. für s-WellenZustände erfüllt, die nur von r abhängen. Ein Operator A ist drehinvariant, wenn D† (R)AD(R) = A , d.h. wenn er mit den Drehoperatoren vertauscht, [A, D(R)] = 0
oder
[A, Ji ] = 0,
d.h. wenn A mit allen Komponenten des Drehimpulses vertauscht. Insbesondere gilt, wenn der Hamilton-Operator drehinvariant ist, d.h.wenn [H, Ji ] = 0 ist, dass der Drehimpuls eine Erhaltungsgröße bildet.
1
Rauch et al., Phys. Letters 54A,425 (1975)
Kapitel 28
Eigenwertproblem von Drehimpulsoperatoren 28.1
Drehimpuls-Eigenvektoren
Auf der Basis der fundamentalen Vertauschungsrelationen des Drehimpulses [Ji , Jk ] = i[~]εikl Jl
(28.1)
wollen wir die Struktur der Eigenvektoren und Eigenwerte der Drehimpulsoperatoren bestimmen. Um den Formalismus etwas zu vereinfachen, setzen wir in diesem Kapitel ~ = 1, d.h. wir messen alle Drehimpulse in Einheiten von ~. Die Operatoren Ji müssen ~ =X ~ × P~ entsprechen, sie können nicht unbedingt dem klassische Bahndrehimpuls L auch für den Spin oder Isospin stehen. Wir untersuchen daher das Eigenwertproblem Gl. (28.1) ganz allgemein. Da die Operatoren Ji , nicht vertauschen, müssen wir uns bei der Konstruktion der Eigenvektoren zunächst auf eine Komponente festlegen, konventionell ist dies die z-Komponente Jz . Das Quadrat des Drehimpulses, definiert durch J 2 = Jx2 + Jy2 + Jz2 , ist ein positiv-definiter Operator, der mit jeder Komponente von J~ vertauscht, [J 2 , Ji ] = 0 . Der einfache Beweis erfolgt mit Hilfe von Gl. (28.1). D.h. J 2 ist ein Skalar, wie man erwarten würde. Man kann also gemeinsame Eigenvektoren von J 2 und Jz finden. Wir bezeichnen die Eigenwerte von Jz mit m und die von J 2 mit λ, d.h. Jz |λ, mi = m |λ, mi
J 2 |λ, mi = λ |λ, mi .
386
Kapitel 28. Eigenwertproblem von Drehimpulsoperatoren
Theorem: Die Eigenwerte m und λ erfüllen λ ≥ m2 .
Beweis: J 2 − Jz2 = Jx2 + Jy2 ist ein positiv definiter Hermitescher Operator. Dessen Erwartungswerte sind ≥ 0, hλ, m| J 2 − Jz2 |λ, mi = hλ, m| λ − m2 |λ, mi ≥ 0
→ λ ≥ m2 .
Für gegebenes λ ist damit m nach oben und unten beschränkt.
28.2
Leiteroperatoren
Wenn wir einen Eigenvektor kennen, so lassen sich mit Hilfe von Leiteroperatoren andere Eigenvektoren finden. Wir definieren folgende Nicht-Hermitesche Operatoren: J+ = Jx + iJy J− = Jx − iJy . Diese erfüllen typische Vertauschungsrelationen für Leiteroperatoren, [Jz , J+ ] = J+
(28.2)
[Jz , J− ] = −J− . Weiters gilt [J+ , J− ] = 2Jz
(28.3)
[J , J± ] = 0. 2
Der einfache Beweis erfolgt mit Hilfe von Gl. (28.1). Wie zeigen jetzt, dass J± den Eigenwert m von Jz um 1 erhöht, bzw. erniedrigt. Dazu betrachten wir Jz J± |λ, mi = {[Jz , J± ] + J± Jz } |λ, mi = {±J± + mJ± } |λ, mi , oder
Jz {J± |λ, mi} = (m ± 1){J± |λ, mi} .
D.h. J± |λ, mi ist Eigenvektor von Jz zum Eigenwert (m ± 1). Da [J 2 , J± ] = 0 ist, bleibt λ ungeändert, J 2 {J± |λ, mi} = J± J 2 |λ, mi = λ{J± |λ, mi} . D.h. J± |λ, mi ist Eigenvektor von J 2 zum Eigenwert λ. Allerdings ist der Vektor J± |λ, mi im Allgemeinen noch nicht normiert. Wir setzen daher J± |λ, mi = C± (λ, m) |λ, m ± 1i , wo C± eine später zu bestimmende Normierungskonstante ist.
28.3 Eigenwerte von J 2 und Jz
28.3
387
Eigenwerte von J 2 und Jz
Für einen gegebenen Wert von λ ist m nach oben beschränkt (da λ ≥ m2 ). Wir bezeichnen den größten Wert von m mit j, mmax ≡ j . Die Anwendung von Aufstiegsoperatoren darf dann keinen neuen Zustandsvektor ergeben, J+ |λ, ji = 0 . Wir verwenden jetzt eine nützliche Identität:
J± J∓ = J 2 − Jz2 ± Jz .
(28.4)
Beweis: J− J+ = (Jx − iJy )(Jx + iJy ) = Jx2 + Jy2 − i(Jy Jx − Jx Jy ) = J 2 − Jz2 − Jz ,
da [Jx , Jy ] = iJz . Damit wird J− J+ |λ, ji = 0
= (J 2 − Jz2 − Jz ) |λ, ji
= (λ − j 2 − j) |λ, ji = 0
und es folgt λ = j(j + 1).
(28.5)
Der Eigenwert m ist auch nach unten beschränkt (da λ ≥ m2 ).Wir bezeichnen den kleinsten Wert von m mit j 0 , mmin ≡ j 0 .
Eine analoge Überlegung wie oben ergibt J+ J− |λ, j 0 i = 0
= (J 2 − Jz2 + Jz ) |λ, j 0 i
= (λ − j 02 + j 0 ) |λ, j 0 i = 0 und es folgt λ = j 0 (j 0 − 1) .
(28.6)
Die beiden Gleichungen (28.5) und (28.6) sind nur konsistent, wenn j 0 = −j . Die zweite Lösung j 0 = j + 1 widerspricht der Annahme, dass j = mmax der größte Wert von m ist.
388
Kapitel 28. Eigenwertproblem von Drehimpulsoperatoren
Da der Eigenwert m eine obere und untere Schranke hat, muss der Übergang |λ, ji → |λ, −ji durch eine endliche Zahl von Anwendungen von J− erfolgen. Es folgt somit, dass j + (−j 0 ) = 2j = n eine positive ganze Zahl sein muss. D.h. 1 3 j = 0, , 1, , 2, ... 2 2 Die Drehimpulse können ganzzahlig oder halbzahlig sein. Ersteres gilt für den Bahndrehimpuls und ganzzahligen Spin (Eigendrehimpuls), letzteres ausschließlich für den halbzahligen Spin. Für gegebene j gibt es 2j + 1 Eigenwerte m, und zwar −j, −j + 1, −j + 2, ...., ...., j − 1, j .
Wenn wir die Bezeichnung anpassen, |λ, mi → |j, mi, lauten die Eigenwertgleichungen Jz |j, mi = m |j, mi
J 2 |j, mi = j(j + 1) |j, mi
28.4
(−j ≤m≤j ) 3 1 ( j = 0, , 1, , 2, ....) . 2 2
Bestimmung des Normierungsfaktors
Zum Schluss wollen wir den Normierungsfaktor der Drehimpuls-Eigenzustände bestimmen. Diesen erhält man aus J± |j, mi = C± (j, m) |j, m ± 1i .
Wenn |j, mi als normiert vorausgesetzt ist, dann muss der Faktor C+ (j, m) so bestimmt werden, dass auch |j, m + 1i normiert ist. Es muss also gelten |C+ (j, m)|2 = |J+ |j, mi |2 = hj, m| J− J+ |j, mi = hj, m| J 2 − Jz2 − Jz |j, mi = j(j + 1) − m(m + 1).
Auf die gleiche Weise findet man
|C− (j, m)|2 = j(j + 1) − m(m − 1).
Wir haben C± bis auf einen unwichtigen Phasenfaktor bestimmt, der üblicherweise gleich 1 gesetzt wird. Man erhält also für die Wirkung der Leiteroperatoren p J+ |j, mi = j(j + 1) − m(m + 1) |j, m + 1i und ganz analog
Natürlich gilt
J− |j, mi =
p
j(j + 1) − m(m − 1) |j, m − 1i .
J+ |j, m = ji = 0,
J− |j, m = −ji = 0 .
Damit ergibt sich für die Matrixelemente der Leiteroperatoren p hj 0 , m0 | J± |j, mi = j(j + 1) − m(m ± 1)δjj 0 δm±1,m0 .
(28.7)
28.5 Matrixdarstellung des Drehoperators
28.5
389
Matrixdarstellung des Drehoperators
Eine Drehung wird bestimmt durch die Drehachse ~n und den Drehwinkel φ. In der Quantenmechanik wird die Darstellung einer Drehung durch den Drehoperator bzw. seine Matrixelemente festgelegt. Wir untersuchen jetzt die Matrixelemente des Drehoperators in einer gegebenen Basis. Sie haben die einfachste Form, wenn wir eine Basis wählen, in der eine Komponente des Drehimpulses diagonal ist, üblicherweise Jz . Wählen wir gleichzeitige Eigenzustände von J 2 , d.h. die oben beschriebene Basis {|j, mi}, so zerfällt die Matrix-Darstellung von D(R) in eine Zahl von Blöcken jeweils mit festem j. Dies sieht man wie folgt: Die Drehoperatoren ~
D(R) = e−iJ.~nφ lassen, wegen [J 2 , Ji ] = 0, den Eigenwert von J 2 unverändert , J 2 D(R) |j, mi = D(R)J 2 |j, mi {z } |
= j(j + 1) D(R) |j, mi . {z } |
Der Hilbert-Raum zerfällt also in eine Anzahl von (2j +1)-dimensionalen Unterräumen, die invariant unter Drehungen sind. Wir betrachten nur Matrixelemente zum selben j. Eine beliebige Drehung wird im Unterraum mit festem j durch die Matrix (j)
~
Dm0 m = hj, m0 | e−iJ.~nφ |j, mi
(28.8)
dargestellt, die Wigner-Funktion heißt. Die (2j + 1)(2j + 1)-Matrix Dm0 m bildet eine (2j + 1)-dimensionale irreduzible Darstellung des Operators D(R). Irreduzibel soll bedeuten, dass man durch Drehung nicht aus der Darstellung heraus kommt. Die irreduziblen Darstellungen zu festen j bilden selbst eine Gruppe. Die wichtigste Eigenschaft dieser Gruppe ist: X (j) (j) (j) Dm00 m0 (R1 )Dm0 m (R2 ) = Dm00 m (R1 R2 ) .
(28.9)
m0
Beweis: Da die Operatoren D(R) eine Darstellung bilden, muss, wie oben diskutiert, gelten D(R1 )D(R2 ) = D(R1 R2 ). Wir bilden Matrixelemente und verwenden die Vollständigkeit im Unterraum mit festem j X hj, m00 | D(R1 ) |j, m0 i hj, m0 | D(R2 ) |j, mi m0
= hj, m00 | D(R1 R2 ) |j, mi .
Dies ist die Gl. (28.9).
390
Kapitel 28. Eigenwertproblem von Drehimpulsoperatoren
Physikalische Bedeutung der Drehmatrix: Wir drehen den Zustand |j, mi → D(R) |j, mi .
Der neue Zustand enthält in der Regel eine Summe von Zuständen zu verschiedenen m, X D(R) |j, mi = cm0 |j, m0 i . m0
zu bestimmen, multiplizieren wir die linke Seite mit dem EinheitsoperaUm die cm0 P (j) 0 0 die (2j + 1)-dimensionale Einheitsmatrix im tor, 1(j) = m0 |j, m i hj, m |, wo 1 Unterraum für feste j ist, X D(R) |j, mi = |j, m0 i hj, m0 |D(R)|j, mi m0
=
X m0
(j)
Dm0 m (R) |j, m0 i .
Daraus folgt (j)
cm0 = Dm0 m (R).
2 (j) Dm0 m (R) ist daher die Wahrscheinlichkeit nach einer Drehung des Zustandes |j, mi den Eigenwert m0 zu messen.
Die Berechnung der Drehmatrizen mit Hilfe von Gl. (28.8) ist im allgemeinen Fall kompliziert, da J~∙~n alle Drehimpulskomponenten enthält, die |j, mi aber nur Eigenzustände von Jz sind. Einfach sind Drehungen um die z-Achse, für die (j)
Dm0 m (θ) = hj, m0 | e−iJz θ |j, mi = e−imθ δm0 ,m .
28.6
Drehmatrix und Euler-Winkel
Der Drehoperator lautete mit den Euler-Winkeln D(α, β, γ) = Dz (α)Dy (β)Dz (γ) . Die Euler-Winkel werden in der Quantenmechanik so definiert, dass die Drehmatrix einfach wird (j)
Dm0 m (α, β, γ) = hj, m0 | e−iJz α e−iJy β e−iJz γ |j, mi 0
= e−im α hj, m0 | e−iJy β |j, mi e−imγ .
Die Drehungen um die z-Achsen sind bei dieser Wahl der Euler-Winkel trivial. Die interessanten Matrixelemente werden mit dm0 m bezeichnet, (j)
dm0 m (β) ≡ hj, m0 | e−Jy β |j, mi .
28.7 Entartungen Beispiel: Spin
391
1 2
Die Basisvektoren sind j = 12 , m = ± 12 , oder in der Pauli-Darstellung Der Drehoperator e−Jy β lautet in der Pauli-Darstellung: σ2 . = e−i 2 β . e−iJy β
1 0
0 , . 1
M atrix−Darstellung
Durch Entwicklung der Exponentialfunktion hatten wir das Ergebnis abgeleitet: φ φ ~σ ∙ ~n φ = 1 cos − i~σ ∙ ~n sin . exp i 2 2 2 Für ~n = ~ey erhalten wir speziell σ β 1 0 0 −i 22 β e = cos − i 0 1 i 2 D.h. d
( 12 )
=
und 1
D( 2 ) (α, β, γ) = =
α
0
e−i 2 0
e
−i α+γ 2
iα 2
cos β2 sin β2
cos β2 e i α−γ e 2 sin β2
Bemerkung: D
( 12 )
−i 0
(2π, 0, 0) =
β sin = 2
− sin β2 cos β2
cos β2 sin β2
cos β2 sin β2
− sin β2 cos β2
−e sin β2 −i α+γ 2 e cos β2
!
.
0 −1
.
−i α−γ 2
−1 0
− sin β2 cos β2
γ
e−i 2 0
0
e
i γ2
.
D.h. die Darstellung ist doppeldeutig. Wegen der Phasenambiguität der Quantenmechanik ist dagegen nichts einzuwenden, so lange in der Reduktion der Drehmatrix ausschließlich doppelwertige Darstellungen auftreten, was bei halbzahligen Drehimpulsen der Fall ist.
28.7
Entartungen
Wenn H drehinvariant ist, dann vertauschen J 2 , Jz , H jeweils miteinander. Diese 3 Operatoren bilden für viele physikalische Systeme einen vollständigen Satz von vertauschenden Operatoren. D.h. die {|E, j, mi} bilden in diesem Fall eine Basis im gesamten physikalischen Hilbertraum. Wenn die Hamilton-Funktion drehinvariant ist, dann vertauschen die Erzeugenden der Drehung mit dem Hamilton-Operator, [H, Ji ] = 0. Nach den allgemeinen Überlegungen zu Symmetrien aus Kapitel 26 bedeutet das: Alle Vektoren, die man aus einem Energie-Eigenvektor durch Drehung erhalten kann, sind Eigenvektoren von H zum selben Energie-Eigenwert. D.h. für festes j sind die Energie-Eigenwerte für alle m gleich.
392
Kapitel 28. Eigenwertproblem von Drehimpulsoperatoren
Für jedes Ej existieren 2j + 1 entartete Eigenwerte Ej,m . Die Eigenvektoren für festes j spannen einen irreduziblen, d.h. gegen Drehungen invarianten Unterraum auf. Die Drehinvarianz manifestiert sich also in einer 2j + 1fachen Entartung der EnergieEigenwerte. Energie-Eigenwerte für verschiedene j sind nicht entartet.
28.8
Ganzzahlige und Halbzahlige j
Wir betrachten die endliche Drehung um einen Winkel φ um eine Achse ~n, n o ~ D(R) = exp −i~n ∙ Jφ .
Zu diesem Operator existiert eine unendliche Zahl von äquivalenten Operatoren n o ~ + 2πk) D(k) (R) = exp −i~n ∙ J(φ k = 0, ±1, ±2, ... n o n o ~ exp −i~n ∙ J2πk ~ = exp −i~n ∙ Jφ . Hat diese Mehrdeutigkeit eine physikalische Bedeutung?
Der Einfachheit halber wählen wir ~n entlang der z-Achse. Es gilt e−iJz 2πk |j, mi = e−im2πk |j, mi
= (−1)2km |j, mi .
Der Phasenfaktor (−1)2km muss (für gegebenes k) für alle Vektoren |j, mi des HilbertRaumes gleich sein (dann sind die Skalarprodukte invariant). Für ganzzahlige Drehimpulse ist der Phasenfaktor gleich +1, für halbzahlige Drehimpulse gleich −1. Bei einer Drehung um 2π müssen sich alle Zustände eines Systems gleich transformieren, entweder oder
|j, mi → |j, mi |j, mi → − |j, mi .
Es folgt, dass m (und damit j) entweder ganzzahlig oder halbzahlig ist. Im Rahmen der gewöhnlichen Quantenmechanik gibt es keine Superposition ganzzahliger und halbzahliger Drehimpulse. In anderen Worten, das Matrixelement einer Observablen zwischen einem Zustand mit ganzzahligem j und einem Zustand mit halbzahligen j verschwindet. Eine solche Regel wird mit Superauswahlregel oder engl. super selection rule bezeichnet. Die Superauswahlregel kann natürlich nicht voraussagen welche Möglichkeit von der Natur realisiert wird. Ein Zustand in der klassischen Mechanik darf sein Vorzeichen bei einer Drehung nicht ändern. Wegen des Diracschen Korrespondenzprinzips, {Li , Lj } →
i [Li , Lj ] , ~
~→0
kann der Bahndrehimpuls nur ganzzahlige Werte annehmen. Der Spin kann, da es kein klassisches Äquivalent gibt, ganzzahlig oder halbzahlig sein.
Kapitel 29
Addition von Drehimpulsen Im vorigen Kapitel haben wir den Drehimpuls eines einzelnen Teilchens betrachtet. Quantensysteme bestehen aber oft aus mehreren Teilchen, wobei jedes einen Drehimpuls haben kann. Ein Beispiel wäre, die beiden Spins eines Zwei-Elektronen-Systems. Sogar ein einzelnes Teilchen kann mehrere Drehimpulse haben. Ein Elektron in einem Zentralpotential besitzt einen inneren Drehimpuls oder Spin und einen Bahndrehimpuls. Wir suchen eine mathematische Beschreibung, die es erlaubt mehrere Drehimpulse zu kombinieren, vulgo zu addieren. Zur Vereinfachung der Notation setzen wir wieder } = 1, d.h. Drehimpulse werden in Einheiten von } gemessen.
29.1
Produktraum
Wir gehen noch einmal kurz auf das in Kapitel 18 behandelte Problem der Zusammenfassung zweier unterschiedliche physikalischer Systeme, d.h. zweier unterschiedlicher Mengen von dynamischen Variablen, die in zwei unterschiedlichen Vektorräumen beschrieben werden, ein. Die Zustandsvektoren des Gesamtsystems sind dann Vektoren im direkten Produktraum der ursprünglich getrennten Vektorräume. Beispiel: Bahnbewegung und Spin (innerer Freiheitsgrad) Wir betrachten ein Spin-1/2-Teilchen im Ortsraum. Die Zustände seien {|~xi}
{|±i}
Ortseigenkets Spineigenkets.
Der Produktrum ist definiert durch die Basisvektoren |~xi ⊗ |±i ≡ |~xi |±i ≡ |~x, ±i . Jeder Operator in H1 = {|~xi} vertauscht mit jedem Operator in H2 = {|±i}.
394
Kapitel 29. Addition von Drehimpulsen
Wir betrachten als Beispiel die Drehungen. Eine Drehung wirkt auf jedes einzelne System und ist daher gegeben durch (~ = 1) D(R) = D Bahn (R) ⊗ D Spin (R) ~
~
= e−iL∙~nφ ⊗ e−iS∙~nφ ~
~
= e−i[L∙~n⊗1+1⊗S∙~n]φ .
Der Beweis folgt direkt aus der Identität 1
eA eB = e(A+B)+ 2 [A,B] . Wir schreiben
~
D(R) = e−iJ∙~nφ , wo oder kurz
~ ⊗1+1⊗S ~ J~ = L ~ + S. ~ J~ = L
J~ heißt Gesamtdrehimpuls des kombinierten Systems. Man spricht von der Addition der Drehimpulse.
29.2
Spin-Bahn-Kopplung
Warum brauchen wir eigentlich die Addition von Drehimpulsen? Dazu betrachten wir das Beispiel der Spin-Bahn-Kopplung. Der Hamilton-Operator für ein Elektron im Coulomb-Potential ist P~ 2 + V (R) H0 = 2m 2 ~ Für diesen Hamilton-Operator ist der Bahndrehimmit V (R) = − eR und R = |X|. ~ erhalten, da H0 invariant ist unter Rotationen um eine beliebige Achse. Für puls L ein Elektron im Wasserstoff-Atom ist H0 aber nicht alles. Es gibt noch eine weitere Wechselwirkung, da das Elektron einen Spin besitzt. Anschaulich gesehen rotiert das Elektron um den Kern. Für das Elektron sieht es so aus, als rotiere der Kern um das Elektron. Auf das Elektron wirkt dann neben dem elektrischen Feld auch ein magnetisches Feld, das bei der Lorentz-Transformation ins Ruhsystem des Elektrons entsteht. Klassische Abschätzung: Das e− bewegt sich im Coulomb-Potential Vc (~x) = e/r des ruhenden Kerns ~ = −∇V ~ c (~x) = −∇ ~ e = e ~x . E r r3 Im Ruhsystem I 0 des e− (in dem der Kern um das e− kreist) beobachtet man ein elektromagnetisches Feld. Für vc 1 ist ~0 = E ~ + ~v × B ~ E c
~ − ~v × E ~0 = B ~ B c
(29.1)
29.2 Spin-Bahn-Kopplung
395
~ = 0 im Ruhsystem des Kerns. Das Elektron sieht also ein Magnetfeld mit B ~ = − e ~v × ~x = e ~l, ~ 0 = − ~v × E B c cr 3 mcr 3 wo m die Masse des Elektrons ist. In der Quantentheorie ersetzen wir die Observablen durch die entsprechenden Operatoren, e ~ L. mcR3
~0 = B
Für einen Kreisstrom lautet die Wechselwirkung mit dem Magnetmoment μ ~ des e− , ~0 HLS = −~ μ∙B
mit μ ~=
e ~ S. mc
Damit wird der Hamilton-Operator der Spin-Bahn-Kopplung HLS =
1 e2 ~ ~ 1 L ∙ S 3, 2 m2 c 2 R
wobei sich der Faktor 1/2 erst aus der Dirac-Theorie ergibt. Die Ableitung ist heuristisch, weil wir in Gl. (29.1) die Lorentz-Transformation für Inertialsysteme angenommen hatten (bessere Ableitung in Jackson 2002, ganz richtig in der Dirac-Theorie). Der gesamte Hamilton-Operator ist dann H=
e2 e2 1 ~ ~ P2 − − L ∙ S. 2m R 2mc2 R3
(29.2)
~ und S ~ in zwei verschiedenen Man muss wieder beachten, dass die beiden Operatoren L ~ wirkt auf den zweidimensionalen Spin-Raum und L ~ auf den Hilbert-Räumen wirken. S abzählbaren Hilbert-Raum des Bahndrehimpulses des Elektrons, ~ ∙S ~≡ L
3 X i=1
L i ⊗ Si .
~ ∙ S-Term ~ Der zusätzliche L ist nicht mehr invariant unter separaten Drehungen des Spins und des Bahndrehimpulses, d.h. es gibt keine gemeinsamen Eigenvektoren von ~ und S ~ zusammen H, Lz und Sz . Der Hamilton-Operator H ist aber invariant, wenn L ~ ⊗1+1⊗S ~≡L ~ + S. ~ gedreht werden. Eine solche Drehung wird erzeugt durch J~ = L Für die Hamilton-Operator der Form (29.2) sucht man gemeinsame Eigenvektoren der ~ ∙S ~ (Skalar bzgl. Drehungen) mit J 2 und Energie und des Gesamt-Drehimpulses, da L Jz vertauscht, ~ ∙ S), ~ J3 ] = [L(1) S (2) , L(1) + S (2) ] [(L 3 3 i i (1)
(1)
(2)
= [Li , L3 ]Si (1)
(2)
= iεi3l Ll Si
(1)
(2)
(2)
+ Li [Si , S3 ] (1)
(2)
+ Li iεi3l Sl
=0.
Die beiden Terme heben sich weg, da (1)
(2)
Li εi3l Sl
(1)
(2)
= Ll εl3i Si
(1)
(2)
= −Ll εi3l Si
.
396
Kapitel 29. Addition von Drehimpulsen
~ ∙S ~ nicht mit Lz und Sz . Da L2 und S 2 Skalare sind, vertauschen Dagegen vertauscht L 2 auch sie mit mit J und Jz , [J 2 , L2 ] = [J 2 , S 2 ] = [Jz , L2 ] = [Jz , S 2 ] = 0 . Man kann also gemeinsame Eigenvektoren zu J 2 , Jz , L2 , S 2 (= 12 1) finden. Das Problem besteht darin, die Eigenvektoren von J 2 , Jz , L2 , S 2 durch die Eigenvektoren von L2 , Lz und von S 2 , Sz , die eine Basis im Produktraum bilden, auszudrücken. Dabei wird angenommen, dass die Eigenwerte l und s = 12 fest vorgegeben sind. Wir betrachten im weiteren gleich den allgemeinen Fall der Addition zweier Drehimpulse J~(1) und J~(2) zu einem Gesamtdrehimpuls. Sei J~ = J~(1) ⊗ 1(2) + 1(1) ⊗ J~(2) , kurz
J~ = J~(1) + J~(2) .
Jede Komponente von J~(1) vertauscht mit jeder Komponente von J~(2) , da sie in verschiedenen Hilbert-Räumen wirken. Daraus folgt, dass auch J~ die üblichen Drehimpulsvertauschungsrelationen erfüllt [Ji , Jk ] = iεikl Jl .
(29.3)
Damit vertauscht J 2 mit Jz und es gibt gemeinsame Eigenvektoren mit Eigenwerten j(j + 1) bzw. m, wo j ≥ |m|. Die Eigenwerte j sind, wie bei jedem Drehimpuls, ganzoder halbzahlig. man kann wieder Leiteroperatoren definieren J± = Jx ± iJy , die die üblichen Vertauschungsrelationen erfüllen: [Jz , J± ] = ±J± ,
[J+ , J− ] = 2Jz ,
[J 2 , J± ] = 0 .
~ Da J~2 , J~(1)2 und J~(2)2 Skalare sind, vertauschen sie mit allen Komponenten von J, [Ji , J 2 ] = [Ji , J (1)2 ] = [Ji , J (2)2 ] = [J 2 , J (1)2 ] = [J 2 , J (2)2 ] = 0 . (1) (2) (1) (2) Aber J 2 vertauscht nicht mit Jz und Jz , da J~(1) ∙ J~(2) nicht mit Jz oder Jz vertauscht. Man kann also gemeinsame Eigenvektoren von J, m, J (1)2 , J (2)2 finden, die wir durch die zugehörigen Quantenzahlen kennzeichnen:
|j1 , j2, j, mi . Das Problem bei der Addition zweier Drehimpulse besteht darin, die Eigenvektoren (1) (2) von J, Jz , J (1)2 , J (2)2 durch die Eigenvektoren von J (1)2 , Jz und von J (2)2 , Jz auszudrücken, die eine Basis im Produktraum bilden. Dabei wird angenommen, dass die Eigenwerte j1 und j2 fest vorgegeben sind. Wir schreiben |j1 m1 i |j2 m2 i ≡ |j1 j2 m1 m2 i . Die Zahl dieser Vektoren ist (2j1 + 1)(2j2 + 1). Sie sind keine Eigenvektoren von J 2 .
29.3 Clebsch-Gordan-Koeffizienten
397
Die |j1 m1 i |j2 m2 i für festes j1 und j2 bilden eine Basis im Unterraum |m1 | ≤ j1 , |m2 | ≤ j2 , X |j1 j2 ; m1 m2 i hj1 j2 ; m1 m2 | = 1 . m 1 m2
Bei festen j1 und j2 bilden auch die Zustände {|j1 j2; jmi eine alternative Basis im Produktraum. Da, wie wir gleich argumentieren werden, |j1 − j2 | ≤ j ≤ j1 + j2 und m ≤ |j| kann man zeigen, dass die Zahl dieser Vektoren wieder (2j1 + 1)(2j2 + 1) ist. Als Eigenvektoren eines Hermiteschen Operators sind sie orthogonal
0 0 0 0 j1 j2; j m j1 j2; jmi = δj10 j1 δj20 j2 δj 0 j δm0 m . Da j1 und j2 fest vorgegeben sind, schreibt man nur
hj1 j2; j 0 m0 | j1 j2; jmi = δj 0 j δm0 m . Die Vollständigkeitsrelation lautet in der (j, m)-Basis X j,m
29.3
|j1 j2 ; jmi hj1 j2 ; jm| = 1 .
(29.4)
Clebsch-Gordan-Koeffizienten
Die gekoppelten Vektoren |j1 , j2, j, mi und die ungekoppelten Vektoren |j1 j2 m1 m2 i spannen jeweils den Unterraum für feste j1 und j2 auf. Man kann daher die Tranformation aufschreiben, die die beiden Sätze von Eigenvektoren verbindet |j1 j2 ; jmi =
X
m1 m2
|j1 j2 ; m1 m2 i hj1 j2 ; m1 m2 |j1 j2 ; jmi .
(29.5)
Die Transformationskoeffizienten hj1 j2 m1 m2 |j1 j2 jmi werden Clebsch-Gordan-Koeffizienten genannt. Sie sind bis auf eine Gesamtphase festgelegt. Da j1 und j2 die maximalen Werte von m1 und m2 sind und vorgegeben sind, schreiben wir für die Clebsch-GordanKoeffizienten auch einfach hj1, j2 ; m1, m2 |j1 j2 jmi ≡ hj1 j2 ; m1 m2 |jmi . Um die gekoppelten und ungekoppelten Vektoren besser auseinander zu halten, schreiben wir die j1 und j2 bei den ungekoppelten Kets mit auf. Die Vollständigkeitsrelationen im Unterraum mit festen j1 , j2 ergeben P
j,m
hj1 j2 ; m01 m02 |jmi hjm|j1 j2 ; m1 m2 i = δm01 m1 δm02 m2
P
m1 ,m2
hj 0 m0 |j1 j2; m1 m2 i hj1 j2; m1 m2 |jmi = δj 0 j δm0 m .
(29.6) (29.7)
398
Kapitel 29. Addition von Drehimpulsen
Die Clebsch-Gordan-Koeffizienten erfüllen eine Reihe von Symmetrierelationen, viele sind gleich Null. Speziell ist hj1 j2 m1 m2 |jmi 6= 0 Beweis:
nur für
m = m1 + m2 .
(29.8)
(Jz − Jz(1) − Jz(2) ) |jmi = 0.
Wir multiplizieren von links mit hj1 j2 ; m1 m2 | Dann ist
hj1 j2 ; m1 m2 | (Jz − Jz(1) − Jz(2) ) |jmi = 0 oder
(m − m1 − m2 ) hj1 j2 m1 m2 |jmi = 0 .
Wenn der Clebsch-Gordan-Koeffizient 6= 0 sein soll, muss also m = m1 + m2 sein. Da die j die Maximalwerte der m sind, folgt aus mmax = m1 max + m2 max , jmax = j1 + j2 . Mit wesentlich mehr Aufwand bestimmt man auch den minimalen möglichen Wert von j, jmin = |j1 − j2 | .
Für jeden gekoppelten Zustand |jmi gibt es genau einen ungekoppelten Zustand. Dies sieht man z.B. aus der mathematischen Identität j1P +j2
(2j + 1) = (2j1 + 1)(2j2 + 1) .
j=|j1 −j2 |
Die Sätze der gekoppelten und der ungekoppelten Zustände bilden jeweils eine Basis. Wir fassen zusammen: a) Die Clebsch-Gordan-Koeffizienten hj1 j2 m1 m2 |jmi sind nur 6= 0 für j = j1 + j2 , j1 + j2 − 1, ...|j1 − j2 | und m = m1 + m2 . b) Die Clebsch-Gordan-Koeffizienten werden konventionell reell gewählt. c) Der Clebsch-Gordan-Koeffizient hj1 j2 m1 m2 |jji mit maximalem m wird positiv gewählt. Die Vorzeichen der weiteren Koeffizienten liegen dann fest, sie können positiv oder negativ sein. d) Es gibt genau (2j + 1) unabhängige Kets (d.h. Werte von m) zu jedem Wert von j. Oft sagt man statt a) etwas unpräzise, die drei Drehimpuls-Quantenzahlen erfüllen die Dreiecksungleichung |j1 − j2 | ≤ j ≤ j1 + j2 . Die Dreieckdungleichung gilt trivialerweise im elementaren Vektormodell des Drehimpulses.
Die Clebsch-Gordan-Koeffizienten können auf verschiedene Art berechnet werden. Am einfachsten sieht man in Tabellen nach. Wegen unterschiedlichen Phasenkonventionen
29.4 Zwei Spin- 12 -Systeme
399
macht man dann aber leicht Fehler. Man kann den Übergang von der ungekoppelten Basis zur gekoppelten auch als Eigenwertproblem für den Operator J 2 auffassen. Effizienter ist es die Koeffizienten rekursiv zu berechnen. Da der Gesamtdrehimpuls die Drehimpulsvertauschungsrelation Gl. (29.3) erfüllt, können wir die gesamte, im vorigen Kapitel entwickelte, Drehimpulsmaschinerie anwenden. Dabei gehen wir in zwei Schritten vor: 1. Schritt: Ausgangspunkt ist der Zustand |j, mi mit maximalem j = j1 + j2 und maximalem m = j. Durch wiederholte Anwendung der Beziehung p J− |j, mi = j(j + 1) − m(m − 1) |j, m − 1i p = (j + m)(j − m + 1) |j, m − 1i (29.9) produzieren wir die 2j + 1 Zustände |j, ji , |j, j − 1i , ... |j, −ji.
2. Schritt: Wir identifizieren den Zustand |j − 1, j − 1i und wenden wiederholt den Operator J− an, bis wir den Zustand |j − 1, −(j − 1)i erreicht haben usw. Wir wollen die Methode am Beispiel der Kopplung zweier Spin- 12 -Systeme demonstrieren.
29.4
Zwei Spin- 12 -Systeme
Der Gesamtspin-Operator ist durch die Spinoperatoren der einzelnen Spin- 12 -Teilchen gegeben, ~=S ~1 + S ~2 . S Der Hilbert-Raum H1 ⊗ H2 ist 4-dimensional mit Basis s1 = 1 , m 1 = ± 1 s 2 = 1 , m 2 = ± 1 . 2 2 2 2
Die Eigenwerte s1,2 = 12 sind fest vorgegeben, wir schreiben sie im Folgenden nicht mehr hin und verwenden die Kurzbezeichnung {|±±i} für die Basisvektoren in H1 und H2 . Dann lauten die Eigenwertgleichungen S1z |+±i =
1 1 1 1 |+±i , S1z |−±i = − |−±i , S2z |±+i = |±+i , S2z |±−i = − |±−i . 2 2 2 2
Die Eigenwerte von S1z , S2z sind damit ± 12 und die von Sz = S1z + S2z gleich 1, 0. Die möglichen Eigenwerte von S 2 sind durch s(s + 1) mit s = 1, 0 gegeben, da |s1 − s2 | ≤ s ≤ s1 + s2 . Die jeweiligen Leiteroperatoren S− = Sx − iSy und anlog fürS1− und S2− hängen zusammen über S− = S1− + S2− . Erster Schritt: Der größte Wert des Gesamtdrehimpulses ist s = 1. Der zugehörige Zustand in der Produktbasis ist |s = 1, m = 1i = |++i .
400
Kapitel 29. Addition von Drehimpulsen
Wir bestimmen jetzt den Zustand |s = 1, m = 0i : p S− |s = 1, m = 1i = s(s + 1) − m(m − 1) |s = 1, m = 0i √ = 2 |s = 1, m = 0i . D.h. 1 |s = 1, m = 0i = √ S− |s = 1, m = 1i 2 1 (1) (2) = √ (S− + S− ) |++i 2 1 1 = √ |−+i + √ |+−i . 2 2 Als Nächstes bestimmen wir den Zustand |s = 1, m = −1i in dem wir noch einmal mit S− multiplizieren, p √ S− |s = 1, m = 0i = s(s + 1) − m(m − 1) |s = 1, m = 0i = 2 |s = 1, m = −1i .
Oder, ausgedrückt durch die ungekoppelte Basis,
1 |s = 1, m = −1i = √ S− |s = 1, m = 0i 2 1 1 1 (1) (2) = √ (S− + S− ) √ |−+i + √ |+−i 2 2 2 1 = (0 + |−−i + |−−i + 0) = |−−i . 2 Jetzt fehlt nur noch der Zustand mit Gesamtdrehimpuls s = 0. Der Zustand |s = 0, m = 0i muss orthogonal zu den Zuständen |s = 1, m = 1i, |s = 1, m = 0i, |s = 1, m = −1i sein. Wie man direkt sieht, erfüllt 1 |s = 0, m = 0i = √ (|+−i − |−+i) 2 diese Bedingung. Als Ergebnis erhalten wir: a) ein Triplett mit s = 1 und m = (1, 0, −1) |1, 1i = |+i |+i 1 |1, 0i = √ (|+i |−i + |−i |+i) 2 |1, −1i = |−i |−i . b) ein Singulett mit s = 0, m = 0 1 |0, 0i = √ (|+i |−i − |−i |+i) . 2
29.4 Zwei Spin- 12 -Systeme
401
Spin-Bahn-Kopplung: Hier ist j2 = s = 12 fest und j1 = l beliebig vorgegeben, aber dann festgehalten. Die zugehörigen Clebsch-Gordan-Koeffizienten werden oft gebraucht und lassen sich leicht explizit berechnen, da j für alle l nur zwei Werte annehmen kann j = l ± 1/2. Für die ungekoppelten Zustände wählen wir die Bezeichnungen j1 = l,
m 1 = ml , m1 max = l 1 1 1 j2 = s = , m2 = ms = ± , m2 max = 2 2 2 und für die gekoppelten j = l ± 1/2, m = ml + m2
oder ml = m − m2 = m ± 1/2 .
Es gibt somit vier nicht-verschwindende Clebsch-Gordan-Koeffizienten: j = l ± 12 , m2 = + 12 : 1 1 1 1 l, ; ml = m − , j = l ± , m = ± 2 2 2 2
j = l ± 12 , m2 = − 12 :
1 1 1 1 l, ; ml = m + , − j = l ± , m = 2 2 2 2
Den Beweis findet man z.B. in Gottfried 2003.
s
l±m+ 2l + 1
1 2
s
l∓m+ 2l + 1
1 2
(29.10)
(29.11)
Kapitel 30
Bahndrehimpuls in der Ortsdarstellung 30.1
Bahndrehimpuls
In diesem Kapitel nehmen wir die Faktoren } wieder mit. Wir betrachten einen allgemeinen Zustand |Ψi in der Ortsdarstellung Ψ(~x) ≡ h~x|Ψi . Für den Impuls und den Ortsoperator gelten die in Kapitel 5 abgeleiteten Formeln ~ |Ψi = ~x h~x|Ψi = ~xΨ(~x) h~x| X ~ h~x|Ψi = −i}∇Ψ(~ ~ x) h~x| P~ |Ψi = −i}∇ ~ x − ~x0 ) . h~x| P~ |~x0 i = −i}∇δ(~ Durch Einschieben eines vollständigen Satzes von Ortseigenfunktionen leitet man weiter folgende Formeln ab: h~x| Xi Pj |Ψi = xi (−i}∇j ) h~x|Ψi = xi (−i}∇j )Ψ(~x) ,
(30.1)
~ 2 Ψ(~x) , h~x| X 2 P 2 |Ψi = x2 (−i}∇)
(30.2)
~ ∙ P~ )(X ~ ∙ P~ ) |Ψi = xi (−i}∇i )xk (−i}∇k )Ψ(~x) . h~x| (X
(30.3)
404
Kapitel 30. Bahndrehimpuls in der Ortsdarstellung
Beweis z.B. der Formel (30.3): h~x|Xi Pi Xk Pk |Ψi =
Z
d3 x0 h~x|Xi Pi |~x0 i h~x0 | Xk Pk |Ψi Z 0 = xi d3 x0 xk h~x |Pi |~x0 i h~x0 | Pk |Ψi Z = xi d3 x0 x0k h~x0 | Pk |Ψi (−i}∇i δ(~x − ~x0 )) Z = xi (−i}∇i ) d3 x0 x0k h~x0 | Pk |Ψi δ(~x − ~x0 ) = xi (−i}∇i )xk (−i}∇k )Ψ(~x) .
Als erste Anwendung berechnen wir die z-Komponente des Drehimpuls-Operators in der Ortsdarstellung D E ~ × P~ )z |Ψ h~x| Lz |Ψi = ~x|(X (30.4) ~ z Ψ(~x) = −i}(~x × ∇) ∂ ∂ = −i}(x − y )Ψ(~x) . ∂y ∂x
In räumlichen Polarkoordinaten, x = r sin θ cos φ y = r sin θ sin φ z = r cos θ , lautet Gl. (30.4) h~x| Lz |Ψi = −i} da in Polarkoordinaten x
∂ Ψ(~x) , ∂φ
(30.5)
∂ ∂ ∂ −y = . ∂y ∂x ∂φ
Verwendet man die Wellenfunktion Ψ(~x) = h~x|Ψi, so definiert man Lz (φ)Ψ(~x) ≡ −i}
∂ Ψ(~x) , ∂φ
(30.6)
wo Lz (φ) nicht der abstrakte koordinatenfreie Operator im Hilbert-Raum, sondern der Differentialoperator ist (Achtung: ein Buchstabe für zwei verschiedene Dinge). Auf analoge Weise erhält man für L± = Lx ± iLy , ∂ ∂ ±iφ h~x| L± |Ψi = −i}e ±i Ψ(~x) . (30.7) − cot θ ∂θ ∂φ Entsprechend definieren wir wieder einen Differentialoperator ∂ ∂ L± (θ, φ) ≡ −i}e±iφ ±i . − cot θ ∂θ ∂φ
30.1 Bahndrehimpuls
405
Für L2 findet man, wie gleich gezeigt wird 1 ∂ 1 ∂2 ∂ h~x| L2 |Ψi = −}2 + (sin θ ) Ψ(~x) sin θ ∂θ ∂θ sin2 θ ∂φ2
(30.8)
und definiert entsprechend L (θ, φ) ≡ −} 2
2
1 ∂ 1 ∂2 ∂ + (sin θ ) sin θ ∂θ ∂θ sin2 θ ∂φ2
(30.9)
.
Wenn |Ψi = |Ψilm ein Drehimpuls-Eigenzustand ist und Ψlm (~x) ≡ h~x|Ψilm die Drehimpulseigenfunktionen, dann gilt ∂ Ψ(~x)lm = }mΨ(~x)lm , ∂φ 1 ∂ 1 ∂2 ∂ 2 −} + (sin θ ) Ψ(~x)lm = }2 l(l + 1)Ψ(~x)lm , sin θ ∂θ ∂θ sin2 θ ∂φ2 ∂ ∂ ±iφ ±i Ψ(~x)lm = Ψ(~x)lm±1 . − cot θ − i}e ∂θ ∂φ − i}
(30.10) (30.11) (30.12)
Beweis der Formel (30.8): Es ist zu beachten, dass X und P nicht vertauschen. ~ × P~ ) ∙ (X ~ × P~ ) = εijk εilm Xj Pk Xl Pm L2 = ( X = (δjl δkm − δjm δkl )Xj Pk Xl Pm = Xj Pk X j P k − X j Pk Xk Pj
Wir verwenden die kanonischen Vertauschungsregeln [Xi , Pj ] = i}δij , [Xi , Xj ] = 0, [Pi , Pj ] = 0. 1. Term Xj Pk Xj Pk = Xj Xj Pk Pk − Xj [Xj , Pk ]Pk ~ ∙ P~ ) = X 2 P 2 − i}(X 2. Term Xj Pk Xk Pj = {Pk Xj + [Xj, Pk ]}Xk Pj = Pk Xk Xj Pj + i}δjk Xk Pj = {Xk Pk − [Xk , Pk ]}Xj Pj + i}δjk Xk Pj ~ ∙ P~ )(X ~ ∙ P~ ) − i}δkk Xj Pj + i}δjk Xk Pj = (X ~ ∙ P~ )(X ~ ∙ P~ ) − 2i}(X ~ ∙ P~ ) = (X
406
Kapitel 30. Bahndrehimpuls in der Ortsdarstellung
Beide Terme zusammen ergeben ~ ∙ P~ )(X ~ ∙ P~ ) + i}(X ~ ∙ P~ ). L2 = X 2 P 2 − ( X
(30.13)
Wir bestimmen die einzelnen Beiträge in der Ortsdarstellung mit Hilfe der Formeln (30.1)-(30.3) ~ ∙ P~ ) |Ψi = i}xi (−i}∇i )Ψ(~x) i} h~x| (X ∂ = }2 r Ψ(~x) , ∂r da
~ = r~n ∙ ∇ ~ = r ∂ mit r = |~x|. xi ∇i = ~x ∙ ∇ ∂r 2
h~x| X 2 P 2 |Ψi = r2 ([−i}] ∇2 Ψ(~x)) und ~ ∙ P~ )(X ~ ∙ P~ ) |Ψi = xi (−i}∇i )xj (−i}∇j )Ψ(~x) h~x| (X ∂ ∂ = −}2 r r Ψ(~x) ∂r ∂r 2 ∂ ∂ 2 2 = −} r +r Ψ(~x). ∂r 2 ∂r Der Differentialoperator L2 lautet daher L2 = } 2 r 2
2 ∂ ∂2 + − ∇2 ∂r 2 r ∂r
.
(30.14)
Der Laplace-Operator ∇2 ist in Polarkoordinaten gegeben durch ∇2 =
(
∂2 2 ∂ 1 ∂ 1 ∂2 1 ∂ + + ) + (sin θ ) . ∂r 2 r ∂r r2 sin2 θ ∂φ2 sin θ ∂θ ∂θ
Setzt man diesen Ausdruck in Gl. (30.14) ein, so heben sich die ersten beiden Terme weg und man erhält für den Differentialoperator L2 : L (θ, φ) = −} 2
2
1 ∂ 1 ∂2 ∂ 2 ∂φ2 + sin θ ∂θ (sin θ ∂θ ) sin θ
.
D.h. der Operator L2 entspricht, bis auf einen Faktor −}2 , gerade dem Winkelanteil des Laplace-Operators. Entsprechend erhält man für den Laplace-Operator ∇2 =
(
1 L2 (θ, φ) ∂2 2 ∂ )− 2 + 2 ∂r r ∂r } r2
=
1 ∂2 1 L2 (θ, φ) r− 2 2 r ∂r } r2
.
30.2 Drehimpuls-Eigenfunktionen
407
In der Ortsdarstellung lässt sich der Hamilton-Operator für ein Teilchen der Masse M in der Form schreiben 2 P ~ |Ψi h~x| H |Ψi = h~x| + V (X) (30.15) 2M 1 = (−}2 )∇2 + V (~x) Ψ(~x) 2M 2 1 L2 (θ, φ) −} 1 ∂ 2 r − + V (~ x ) Ψ(~x) = 2M r ∂r 2 }2 r2 2 −} 1 ∂ 2 L2 (θ, φ) = r + + V (~ x ) Ψ(~x). 2M r ∂r 2 2M r 2 Wenn wir definieren h~x| H |Ψi ≡ H(~x)Ψ(~x), dann ist der Hamilton-Operator als Differentialoperator darstellbar, 2 L2 (θ, φ) −} 1 ∂ 2 r + + V (~ x ) . (30.16) H(~x) = 2M r ∂r 2 2M r 2
30.2
Drehimpuls-Eigenfunktionen
Wir nehmen jetzt an, dass das Potential drehinvariant ist, V = V (r). Dann vertauscht ~ und L2 und die zugehörigen Eigenwerte sind E und l, m. Wir können gemeinH mit L same Eigenvektoren |Ψi = |Elmi finden, die im Ortsraum die Form haben h~x |Elmi = hr, θ, φ |Elmi ≡ ΨElm (r, θ, φ) . Dann lautet die Schrödinger-Gleichung 2 L2 (θ, φ) −} 1 ∂ 2 r + + V (r) ΨElm (r, θ, φ) = EΨElm (r, θ, φ) . 2M r ∂r 2 2M r 2 Wir machen den Ansatz ΨElm (r, θ, φ) = fElm (r)Ylm (θ, φ) .
(30.17)
Die Ylm (θ, φ) heißen Kugelfunktionen oder Kugelflächenfunktionen. Die ΨElm (r, θ, φ) sind Eigenfunktionen der Differentialoperatoren H, Lz , L2 , HΨElm = EΨElm Lz ΨElm = }mΨElm
(30.18) (30.19)
L2 ΨElm = }2 l(l + 1)ΨElm .
(30.20)
Für die Leiteroperatoren folgt aus p L± |l, mi = } l(l + 1) − m(m ± 1) |l, m ± 1i
und [H, L± ] = 0, dass für die Energieeigenfunktionen gilt p L± |E, l, mi = } l(l + 1) − m(m ± 1) |E, l, m ± 1i .
408
Kapitel 30. Bahndrehimpuls in der Ortsdarstellung
Multipliziert man von links mit hr, θ, φ|, so sieht man, dass für die Differentialoperatoren L± (θ, φ), die auf die Wellenfunktionen wirken, gilt L± (θ, φ)ΨElm (r, θ, φ) = }
p
l(l + 1) − m(m ± 1)ΨElm±1 (r, θ, φ) .
(30.21)
Der radiale Anteil fElm (r) hängt nicht von m ab: ΨElm (r, θ, φ) = fEl (r)Ylm (θ, φ) . Beweis: Da L± ein Differential-Operator in θ und φ ist, gilt L± (θ, φ)ΨElm = fElm (r)L± (θ, φ)Ylm (θ, φ) . Andererseits folgt aus Gl. (30.21), dass L± (θ, φ)ΨElm = } =}
p p
l(l + 1) − m(m ± 1)ΨElm±1
l(l + 1) − m(m ± 1)fElm±1 (r)Ylm±1 (θ, φ) .
Die beiden Gleichungen sind nur konsistent, wenn fElm±1 (r) = fElm (r)
für alle m, r ,
d.h., wenn fnlm unabhängig von m ist, und wenn p L± Ylm (θ, φ) = } l(l + 1) − m(m ± 1)Ylm±1 (θ, φ).
Mit dem Produktansatz (30.17) hebt sich fEl (r) in Gln. (30.10) bis (30.12) weg und wir erhalten Lz Ylm (θ, φ) = }mYlm (θ, φ) , L2 Ylm (θ, φ) = }2 l(l + 1)Ylm (θ, φ) , p L± Ylm (θ, φ) = } l(l + 1) − m(m ± 1)Ylm±1 (θ, φ) ,
wo Lz und L2 jetzt die Differentialoperatoren sind: Lz = −i}
∂ ∂φ
1 ∂ 1 ∂2 ∂ L = −} 2 ∂φ2 + sin θ ∂θ sin θ ∂θ sin θ ∂ ∂ ±iφ L± = −i}e ±i . − cot θ ∂θ ∂φ 2
2
Normierung: Das Volumenelement lautet in Polarkoordinaten d3 x = r2 dr sin θdθdφ ,
30.3 Bestimmung der Ylm (θ, φ)
409
wo sin θdθdφ das Raumwinkelelement ist. Wir normieren jeweils f (r) und Ylm (θ, φ) getrennt Z 2π Z π 0 ∗ dφ sin θdθYlm (θ, φ)Ylm (θ, φ) = δm0 m δl0 l 0 0
0
Z
∞
r2 dr|fEl (r)|2 = 1.
0
Dann ist auch ΨElm (r, θ, φ) normiert. Vollständigkeit: Die Vollständigkeit der Eigenfunktionen für den Winkelanteil bedeutet hier, dass jede (quadratintegrable) Funktion von θ und φ in Kugelfunktionen entwickelt werden kann, f (θ, φ) =
∞ X l X
cl,m Ylm (θ, φ) .
l=0 m=−l
Wir schreiben oft kurz (θ, φ) ≡ Ω, Dann ist cl,m =
dΩ ≡ sin θdθdφ = d cos θdφ . Z
dΩYlm∗ (Ω)f (Ω) .
D.h. die Ylm bilden eine orthonormale Basis in HΩ , dem Hilbert-Raum der quadratintegriebaren Funktionen von θ und φ. Die Vollständigkeitsrelation lautet in kompakter Schreibweise l ∞ X X
l=0 m=−l
Ylm∗ (Ω0 )Ylm (Ω) = δ(Ω − Ω0 ) ≡
1 δ(θ − θ0 )δ(φ − φ0 ). sin θ
Ebenso bilden die fnl (r) eine Basis im entsprechenden Hilbert-Raum.
30.3
Bestimmung der Ylm (θ, φ)
φ-Abängigkeit: Sie bestimmt sich aus der Eigenwertgleichung (30.19). Da sich f (r) weghebt erfüllen die Ylm die Differentialgleichung −i
∂ m Y (θ, φ) = mYlm (θ, φ) ∂φ l
mit Lösung (Produktansatz) Ylm (θ, φ) = eimφ Rlm (θ).
410
Kapitel 30. Bahndrehimpuls in der Ortsdarstellung
θ-Abhängigkeit: Wir gehen aus von mmax = l
L+ |l, li = 0
oder im der Ortsdarstellung −i}e
iφ
∂ ∂ i − cot θ ∂θ ∂φ
Yll (θ, φ) = 0.
Die Lösung dieser Gleichung ist Yll (θ, φ) = cl eilφ sinl θ , wie man direkt zeigt. Der Faktor cl folgt aus der Normierung. In der üblichen Phasenkonvention ist r (−1)l (2l + 1)(2l)! . cl = 2l l! 4π
Die Kugelfunktionen mit m < l erhält man durch sukzessive Anwendung von L− p ∂ ∂ Ylm (θ, φ) = } l(l + 1) − m(m − 1)Ylm−1 θ. −i}e−iφ −i − cot θ ∂θ ∂φ Ergebnis für m ≥ 0: (siehe z.B. Gottfried (2003)) s 2l + 1 (l + m)! imφ (−1)l m Yl (θ, φ) = e 2l l! 4π (l − m)! ×
dl−m 1 (sin θ)2l . sinm θ d(cos θ)l−m
Für m < 0 kann man die Beziehung verwenden Yl−m (θ, φ) = (−1)m Ylm∗ (θ, φ) . Für m = 0 sind die Kugelfunktionen proportional zu den Legendre-Polynomen r (2l + 1) 0 Yl (θ, φ) = Pl (cos θ). 4π Beispiele: l=0: l=1
l=2
Y00 Y11 =
q
3
q8π
=
r
1 4π
sin θeiφ
3 Y10 = 4π cos θ q 15 sin2 θe2iφ Y22 = 14 2π q 15 Y21 = − 8π sin θ cos θeiφ q 5 3 Y20 = 4π ( 2 cos2 θ − 12 )
(30.22)
Kapitel 31
Das Wasserstoffatom 31.1
Zentralpotentiale
Wir betrachten Zentralpotentiale, d.h. Potentiale, die nur von r = |~x| abgängen. Beispiele sind: konstantes Potential
V (r) = k
Coulomb-Potential
V (r) = −
Oszillator-Potential
V (r) =
e2 r
1 mω 2 r2 . 2
Zentralpotentiale sind invariant unter Drehungen. Daher vertauschen H, L2 , Lz , und es gibt gemeinsame Eigenzustände. Die Eigenwert-Gleichung lautet dann H |E, l, mi = E |E, l, mi .
Die Eigenvektoren für verschiedene m gehen durch Drehungen ineinander über, d.h. E ist unabhängig von m, jeder Energiewert ist (2l+1)-fach entartet. Wir nehmen an dieser Stelle noch nicht an, dass die Eigenwerte E von H diskret sind. In der Ortsdarstellung gehen die Eigenvektoren über in h~x|E, l, mi ≡ ΨE,l,m (~x).
Für die Lösungen für feste l, m setzen wir an
u(r) m Y (θ, φ) , (31.1) r l wo der Faktor 1/r zur Vereinfachung späterer Ergebnisse dient, und die l und EAbhängigkeit von u(r) unterdrückt ist. Der Hamilton-Operator im Ortsraum wurde im letzten Kapitel abgeleitet ΨE,l,m (~x) =
H=
1 −~2 1 ∂ 2 r+ L2 + V (r) . 2μ r ∂r 2 2μr 2
(31.2)
412
Kapitel 31. Das Wasserstoffatom
Wir müssen also folgendes System von Eigenwert-Gleichungen lösen: HΨE,l,m (~x) = EΨE,l,m (~x)
(31.3)
L ΨE,l,m (~x) = ~ l(l + 1)ΨE,l,m (~x) Lz ΨE,l,m (~x) = ~mΨE,l,m (~x) .
(31.4) (31.5)
2
2
Mit dem Ansatz (31.1) geht die die Schrödinger-Gleichung über in
~2 l(l + 1) u(r) m u(r) m −~2 1 ∂ 2 r+ + V (r) Yl (θ, φ) = E Y (θ, φ) . 2 2 2μ r ∂r 2μr r r l
Die radiale Wellenfunktion erfüllt somit die Gleichung 2 2 −~ d ~2 l(l + 1) + + V (r) u(r) = Eu(r) . 2μ dr 2 2μr 2
(31.6)
Diese Gleichung entspricht einer eindimensionalen Schrödinger-Gleichung mit einem effektiven Potential ~2 l(l + 1) . Vef f (r) = V (r) + 2μr 2 Der zusätzliche Term ist stets ≥ 0. Sein negativer Gradient ergibt eine abstoßende Zentrifugalkraft, die mit zunehmenden l immer stärker wird. Obwohl Gl. (31.6) wie eine eindimensionale Schrödinger-Gleichung aussieht, sind die Randbedingungen ganz anders, da stets r ≥ 0 ist. Wenn ΨE,l,m (~x) überall endlich sein soll, dann muss u(r = 0) = 0
(31.7)
sein. Für l 6= 0 und kleine r überwiegt bei nicht-singulären Potentialen das Zentrifugalpotential. D.h. d2 u(r) l(l + 1) − u(r) = 0 für r → 0 . (31.8) dr 2 r2 Dies ist eine Differentialgleichung vom Eulerschen Typ. Der Ansatz u = rα ergibt in Gl. (31.8) α(α − 1) = l(l + 1) . Daraus folgt α=l+1
oder
α = −l
und u = c1 rl+1 + c2 r−l . r→0
Wegen der Normierbarkeitsbedingung Gl. (31.7) muss c2 = 0 sein.
31.2 Das Wasserstoff-Atom
413
Wenn das Potential für große r genügend schnell verschwindet, dann reduziert sich die Schrödinger-Gleichung auf −~2 d2 u(r) = Eu(r) 2μ dr 2
für
r→∞.
Die allgemeine Lösung dieser Differentialgleichung ist offensichtlich r −2μE −κr κr + b2 e mit κ ≡ . u = b1 e r→∞ ~2 Die Notation berücksichtigt, dass für gebundene Zustände die Energien negativ sind. Die Lösung ist nur normierbar, wenn b2 = 0 ist. Diese Forderung, zusammen mit der Forderung u(r = 0) = 0, ist, wie wir sehen werden, nur für bestimmte diskrete EnergieEigenwerte erfüllbar. Die (2l + 1)-fach entarteten Eigenfunktionen sind somit von der Form uEl (r) X m m Cl Yl (θ, φ) . ΨEl (~x) = r m
31.2
Das Wasserstoff-Atom
Wir betrachten ein Elektron der Masse μ im Feld eines unendlich schwer angenommenen Wassestoffkerns (Protons). Mit dem Coulomb-Potential V (r) = −
e2 r
lautet die radiale Schrödinger-Gleichung 2 2 ~2 l(l + 1) e2 −~ d + − u(r) = Eu(r) . 2μ dr 2 2μr 2 r Wenn wir mit
2μ ~2
multiplizieren, geht die Differentialgleichung über in
−
d2 l(l + 1) 2μ e2 2μ + − u(r) = 2 Eu(r) . dr 2 r2 ~2 r ~
Wir führen folgende Abkürzungen ein −2μE , κ2 > 0 (betrachte nur gebundene Zustände) 2 ~ r μe2 −μ e2 , → κγ = 2 . γ= 2E ~ ~
κ2 =
Damit wird die Gleichung d2 l(l + 1) 2γκ 2 − 2+ u(r) = 0. + κ − dr r2 r
414
Kapitel 31. Das Wasserstoffatom
Da u(r → 0) ' rl+1 und u(r → ∞) ' e−κr versuchen wir den Ansatz u(r) = rl+1 e−κr f (r). Nach einer weiteren Variablentransformation ρ = 2κr erhält man für f (ρ) die konfluente hypergeometrische Gleichung 2 d d − (l + 1 − γ) f (ρ) = 0. ρ 2 + (2l + 2 − ρ) dρ dρ Die Standardform dieser Gleichung lautet z
dw d2 w + (b − z) − aw = 0 , dz 2 dz
(31.9)
so dass wir identifizieren a=l+1−γ
und
b = 2l + 2, z = ρ .
Eine Lösung der Gl. (31.9) ist die hypergeometrische Funktion, a a(a + 1) z 2 (a)n z n F (a, b, z) = 1 + z + + ..... + ... , b b(b + 1) 2! (b)n n! wo
(31.10)
(a)n = a(a + 1)(a + 2)....(a + n − 1) .
Der Beweis erfolgt durch Einsetzen in die Differentialgleichung. Asymptotisch geht (a)n → 1, (b)n n→∞ d.h. F (a, b, z) divergiert für große z wie die Exponetialfunktion. Es gibt noch eine zweite Lösung, die aber für z → ∞ noch mehr divergiert, so dass wir uns auf F (a, b, z) beschränken können. Da u(r) ∼ e−κr
aber
F (a, b, z) ∼ e+κr ,
erhält man keine normierbare Lösung, es sei denn die Reihe (31.10) bricht ab. Dies ist der Fall, wenn mit nr = 0, 1, 2, ... . a = −nr
Setzen wir für a ein, so lautet diese Eigenwertbedingung l + 1 − γ = −nr .
Gehen wir wieder zurück zu den ursprünglichen Energievariablen (γ = erhalten wir μe4 En = − 2 2 , 2~ n
q
−μ e2 2E ~ ),
so
31.2 Das Wasserstoff-Atom wo
415
n ≡ nr + l + 1
(nr = 0, 1, 2, ...)
die Hauptquantenzahl ist. Im Wasserstoffatom sind für die Energien der Bindungszustände nur diskrete Werte erlaubt, d.h. die Energien sind quantisiert. Die Hauptquantenzahl n kann alle positiven ganzzahligen Werte 6= 0 annehmen, n = 1, 2, ... . Zum Energieeigenwert En gehört die Eigenfunktion Ψnlm (~x) = cr l e−κr F (l + 1 − n, 2l + 1; 2γr)Ylm (θ, φ) .
Bei gegebenen n kann l die Werte l = 0, 1, 2, ...(n − 1) annehmen, da n − l − 1 = nr ≥ 0, d.h. n − 1 ≥ l, sein muss. Zu jedem l gehören noch einmal (2l + 1) verschiedene Werte der Quantenzahl m. Zu jeder Energie En (d.h. zu einem n) gehören also n−1 X
(2l + 1) = n2
(31.11)
l=0
verschiedene Eigenfunktionen. Jeder Energie-Eigenwert En ist n2 -fach entartet. Beweis der Formel (31.11) durch Induktion: n X
(2l + 1) = 2n + 1 +
l=0
n−1 X
(2l + 1)
l=0 2
= 2n + 1 + n = (n + 1)2 .
Beispiele für den Radialteil der Wellenfunktionen sind: K-Schale (n = 1) 1s :
ϕ10 = 2
32
1 a0
32
r
e − a0
L-Schale (n = 2) ϕ20 =
2s : 2p : wo
ϕ21 =
1 2a0 1 2a0
32
(2 −
r − ar )e 0 a0
1 r − ar √ e 0, 3 a0
Ψnlm (~x) = ϕnl (r)Ylm (θ, φ)
und a0 =
~2 e2
Bohrscher Radius.
Bedeutung des Bohrschen Radius: Betrachte ein Elektron im Grundzustand. Die zugehörige Aufenthaltswahrscheinlichkeitsdichte ist 2 3 2 r 1 − d3 W (r) = r2 dr 2 e a0 . a0
416
Kapitel 31. Das Wasserstoffatom
Deren Maximum liegt bei r = a0 , wegen d 2 −2 ar 0 = 0 r e dr r r2 (2r − 2 )e−2 a0 = 0 a0
→
r = a0 .
Oft schreibt man auch
1 1 En = − μc2 α2 2 , 2 n wo α die Feinstrukturkonstante ist, α=
(31.12)
e2 1 ' . ~c 137
Aus (31.12) folgt, dass En μc2 .
D.h. die nicht-relativistische Näherung ist berechtigt. Für schwere wasserstoffähnliche Atome, für die e → Ze übergeht, wo Z die Kernladungszahl ist, ist diese Näherung weniger gut. In der spektroskopischen Notation ist es üblich die BahndrehimpulsQuantenzahlen mit den Buchstaben s, p, d, ... zu bezeichnen, n(l = 0, l = 1, l = 2; ...) ⇒ n(s, p, d, f, g, ...). So bezeichnet z.B. 3s einen Wasserstoff-Eigenzustand mit Hauptquantenzahl 3 und Drehinpuls 0. Die sogenannte magnetische Quantenzahl m wird nicht angegeben.
Kapitel 32
Diskrete Symmetrien Bisher haben wir kontinuierliche Symmetrien, Translationen und Drehungen diskutiert. In der Quantenmechanik gibt es auch diskrete Symmetrien, die in der makroskopischen Physik kaum eine Rolle spielen. Zu diesen gehören die Parität, mit der wir eine Quantenzahl verbinden können, und die Zeitumkehr, die zu Phasenbeziehungen zwischen Matrixelementen führt.
32.1
Raumspiegelungen, Parität
Bei einer Spiegelung an der (y, z)-Ebene geht x → −x, y → y, z → z, d.h. ein rechtshändiges Koordinatensystem geht in ein linkshändiges über. Dagegen stellt die Transformation x → x, y → −y, z → −z
eine 180◦ Drehung um die x-Achse mit Determinante +1 dar. Unter einer Raumspiegelung oder Inversion wollen wir die Kombination der beiden Transformationen verstehen, x → −x, y → −y, z → −z . Wieder geht ein rechtshändiges Koordinatensystem in ein linkshändiges über. In Matrixnotation lautet die Inversion I: −1 0 0 0 , I2 = 1 . xi = Iik xk mit I = 0 −1 0 0 −1
Die Raumspiegelungen bilden eine Gruppe mit nur zwei Elementen. I ist eine orthogonale Matrix, aber det I = −1.
418
Kapitel 32. Diskrete Symmetrien
D.h. I ist keine Drehung. Da I ∼ 1 ist, folgt, dass I mit den Drehmatrizen R vertauscht, [I, R] = 0 .
(32.1)
Spiegelungen vertauschen mit Drehungen. Wenn wir Spiegelungen und Drehungen durch unitäre Operatoren im Hilbert-Raum darstellen wollen, müssen die Operatoren die obigen algebraischen Relationen erfüllen. Wir wollen jetzt untersuchen, wie sich in der Quantenmechanik ein Zustand unter Raumspiegelungen verhält (aktive Betrachtungsweise). Sei |Ψi ein Zustand und |Ψ0 i der reflektierte Zustand mit |Ψ0 i = Π |Ψi , wo Π der Paritätsoperator ist. Nach den früheren Überlegungen kann Π entweder unitär oder antiunitär sein. Man kann zeigen [s. Gottfried (2003)], dass die unitäre Option realisiert ist. Wir definieren den Paritätsoperator durch seine Wirkung auf die Ortseigenkets eines einzelnen spinlosen Teilchens Π |~xi = |−~xi .
(32.2)
Wenden wir Π ein zweites Mal an, so erhalten wir den ursprünglichen Zustand zurück ΠΠ |~xi = Π |−~xi = |~xi . D.h. Π2 = 1. Damit wird Π nicht nur unitär sondern auch Hermitesch Π†
=
unit¨ ar
Π−1 2= Π . Π =1
D.h. Π ist eine Observable und die (reellen) Eigenwerte können nur ±1 sein. Diese Eigenwerte heißen Parität des Zustandes. Für das Transformatinsverhalten des Ortsoperators erhalten wir: ~ † = −X ~ . ΠXΠ (32.3) Beweis:
~ |~xi = ~xΠ |~xi ΠX l. S.: r. S.:
~ −1 Π |~xi = ΠXΠ ~ −1 |−~xi ΠXΠ ~ |−~xi , (da X ~ |−~xi = −~x |−~xi .) ~xΠ |~xi = ~x |−~xi = −X
Da Π unitär sein soll, folgt daraus ~ † = −X ~ ~ −1 = ΠXΠ ΠXΠ oder ~ = −ΠX ~ . XΠ
32.1 Raumspiegelungen, Parität
419
~ und Π anti-vertauschen, es gibt keine gemeinsamen EigenvekD.h. die Operatoren X ~ zum Eigenwert −~x, toren. Der Vektor Π |~xi ist Eigenzustand von X ~ |~xi = −ΠX ~ |~xi = −~xΠ |~xi , XΠ in Einklang mit Gl. (32.2). D.h. Π |~xi = |−~xi, bis auf einen möglichen Phasenfaktor, der üblicherweise gleich 1 gesetzt wird. Die Eigenvektoren von Π, |~xi ± |−~xi , besitzen gerade bzw. ungerade Parität. Sie entsprechen in der Ortsdarstellung den geraden und ungeraden Wellenfunktionen Ψ(~x) ± Ψ(−~x) . ~ unter Spiegelungen: Verhalten des Bahndrehimpulses L Wenn Π eine unitäre Operatordarstellung der Spiegelung sein soll, dann folgt aus Gl. (32.1), dass [D(R), Π] = 0 oder [D(R), Π] = 0 , wo D(R) der Drehoperator ist. Wir postulieren, dass diese Relation auch für den Spin ~ und damit für den Gesamtdrehimpuls J~ = L ~ +S ~ gilt. S Verhalten des Impulsoperators unter Spiegelungen: ~ =X ~ × P~ folgt, für den Impulsoperator Aus der Beziehung L Π† P~ Π = −P~
oder P~ Π = −ΠP~
gelten muss. Damit gilt für die Impuls-Eigenvektoren Π |~ pi = |−~ pi . Wir betrachten als Beispiel die Impulswellenfunktion i 1 exp ~x ∙ p~ . h~x|~ pi = } (2π})3/2
(32.4)
Dann ist h~x|Π|~ pi = h−~x|~ pi = = h~x| − p~i . D.h.
Π |~ pi = |−~ pi
i 1 exp − ~ x ∙ p ~ } (2π})3/2
und
Π† P~ Π = −P~ .
Dies ist das physikalisch zu erwartende Ergebnis. Unter einer Raumspiegelung dreht der Impuls sein Vorzeichen um, da der Impuls proportional zur Geschwindigkeit ist. Da [P~ , Π] 6= 0 ist, gibt es wieder keine gemeinsamen Eigenvektoren. Vektoren, die unter Spiegelungen ihr Vorzeichen wechseln heißen polare Vektoren.
420
Kapitel 32. Diskrete Symmetrien
Stationäre Zustände unter Parität: Wir betrachten jetzt Systeme, deren Hamilton-Operator invariant unter der Paritätsoperation sind, d.h. [H, Π] = 0. Es gibt also gemeinsame Eigenvektoren. Ist der Hamilton-Operator paritätsinvariant, so besitzen die nicht-entarteten Eigenvektoren (stationären Zustände) eine eindeutige Parität. Dies sieht man wie folgt. Sei |Ei ein Eigenvektor von H, H |Ei = E |Ei . Dann gilt HΠ |Ei = ΠH |Ei = EΠ |Ei . Π |Ei ist also ein Eigenvektor zum selben Eigenwert. Da dieser Eigenwert nicht-entartet sein soll, muss Π |Ei = α |Ei sein, wo α eine komplexe Zahl ist. |Ei ist also ein Eigenvektor von Π. Bei entarteten Zuständen kann man stets Linearkombinationen mit definierter Parität wählen. Wenn der Hamilton-Operator invariant unter Spiegelungen ist, ΠHΠ−1 = H
oder
[Π, H] = 0 ,
dann ist Π eine Erhaltungsgröße und der Paritätsoperator kann als Element des vollständigen Satzes von Operatoren gewählt werden. Somit ist die Parität π = ±1 (Eigenwert von Π) ein Element des vollständigen Satzes von Quantenzahlen. Ist H dre~ Π] = 0 gemeinsame Eigenvektoren von H, J 2 , Jz , Π. hinvariant, dann gibt es wegen [J, ~ Aus [J, Π] = 0 folgt auch, dass alle Zustände mit |j, mi mit festem j die gleiche Parität haben, da sie durch Anwendung von J± auseinander hervorgehen. Der Paritätsoperator in der Ortsdarstellung: In der Ortsdarstellung erhält man für die Matrixelemente des Paritätsoperators: h~x|Π|~x0 i = h~x| − ~x0 i = δ(~x + ~x0 ) . Für einen beliebigen Zustand |Ψi ist die Wellenfunktion Ψ(~x) definiert durch Z Z 3 |Ψi = d x |~xi h~x|Ψi = d3 xΨ(~x) |~xi . Damit wird h~x|Π|Ψi = =
Z
Z
d3 x0 h~x|Π|~x0 i h~x0 |Ψi d3 x0 δ(~x + ~x0 )Ψ(~x0 ) = Ψ(−~x) .
Wir definieren einen Paritätsoperator, der auf die Wellenfunktion wirkt durch ΠΨ(~x) = Ψ(−~x) .
32.1 Raumspiegelungen, Parität
421
Da der Bahndrehimpuls mit Π vertauscht und gemeinsame Eigenfunktionen existieren, ist das Verhalten der Bahndrehimpuls-Eigenvektoren von besondere Bedeutung. Betrachten wir z.B. ein Teichen im Zentralpotential mit Wellenfunktion h~x|n, l, mi = Ψnlm (~x) = fnl (r)Ylm (θ, φ) in Polarkoordinaten (x = r sin θ cos φ, y = r sin θ sin φ, z = r cos θ). Die Transformation ΠΨnlm (~x) = Ψnlm (−~x) bedeutet r→r θ →π−θ
φ→φ+π
d.h. d.h.
cos θ → − cos θ
e−imφ → (−1)m e−imφ .
Da für die Kugelfunktionen die Beziehung gilt Ylm (π − θ, φ + π) = (−1)l Ylm (θ, φ) , folgt
oder
h~x|Π|n, l, mi = (−1)l h~x|n, l, mi Ψnlm (−~x) = (−1)l Ψnlm (~x) .
Die Parität eines Ein-Teilchen-Drehimpuls-Eigenzustands ist also (−1)l . Daneben haben Elementarteilchen auch noch eine innere Parität. Auswahlregeln: Viele Operatoren haben wohldefiniertes Verhalten unter der Paritätstransformation gerade . ungerade
ΠAΠ−1 = ±A
Für solche Operatoren gelten folgende Auswahlregeln: a) Das Matrixelement eines geraden Operators (bzgl. Parität) verschwindet, wenn die Zustände unterschiedliche Parität haben. b) Das Matrixelement eines ungeraden Operators (bzgl. Parität) verschwindet, wenn die Zustände gleiche Parität haben. Beweis: |ai und |bi seien zwei Paritätseigenzustände Π |ai = πa |ai , mit πa,b = ±1 .
Π |bi = πb |bi
Wir betrachten einen Operator K mit der Eigenschaft Π† KΠ = εK Dann ist
mit
ε = ±1 .
ha|K|bi = a|Π−1 ΠKΠ−1 Π|b = πa πb ε ha|K|bi .
422
Kapitel 32. Diskrete Symmetrien
Beispiel: Sei πa = πb und ε = −1. Dann ist nach Gl. (32.3) ha|K|bi = − ha|K|bi = 0. Diese Auswahlregel gilt speziell für den Ortsoperator zwischen nicht-entarteten EnergieEigenzuständen D E ~ nlm|X|nlm =0.
Dieses Ergebnis bedeutet z.B., dass nicht-entartete Energie-Eigenzustände kein elektrisches Dipolmoment haben.
Bemerkung: Da Zustände gerader Parität sich signifikant von solchen mit ungerader Parität unterscheiden, haben Zustände unterschiedlicher Parität im Allgemeinen nicht die selbe Energie. Das Wasserstoffatom ist ein Beispiel für eine zufällige Entartung. Hier sind die Energie-Eigenzustände mit n = 2, 3, 4... entartet und enthalten Komponenten mit unterschiedlichen l und damit unterschiedlicher Parität. Die Entartung bezüglich m hat keinen Einfluss auf die Parität der Zustände.
32.2
Zeitumkehr
Beispiele: Wenn ~x(t) eine Lösung der Newtonsche Bewegungsgleichung m¨ xi = −∇i V (~x) ist, dann ist auch die Umkehr der Bewegung ~x(−t) eine Lösung. Dieses Ergebnis heißt nicht, dass die Zeit rückwärts läuft! Bewegt sich ein Teilchen entlang der positiven xAchse mit Geschwindigkeit v, dann ist auch eine Bewegung mit der gleichen Geschwindigkeit in umgekehrter Richtung, d.h. entlang der negativen x-Achse eine mögliche Lösung der Bewegungsgleichung, d.h. Zeitumkehr=Bewegungsumkehr . Als Nächstes betrachten wir die Schrödinger-Gleichung ∂ ~2 2 i~ Ψ(~x, t) = − ∇ + V (~x) Ψ(~x, t) . ∂t 2m
(32.5)
Wenn Ψ(~x, t) eine Lösung ist, dann ist Ψ(~x, −t) keine Lösung, da die Zeitableitung nur in erster Ordnung vorkommt. Dagegen ist Ψ∗ (~x, −t) Lösung: Um das zu sehen nehmen wir die komplex konjugierte Gleichung(32.5) ~2 2 ∂ ∇ + V (~x) Ψ∗ (~x, t). −i~ Ψ∗ (~x, t) = − ∂t 2m Diese Gleichung wird mit t → −t i~
∂ ∗ Ψ (~x, −t) = ∂t
−
~2 2 ∇ + V (~x) Ψ∗ (~x, −t). 2m
32.2 Zeitumkehr
423
D.h. Ψ∗ (~x, −t) erfüllt die selbe Gleichung wie Ψ(~x, t). Zeitumkehr hat also etwas mit komplexer Konjugation zu tun. Zur Erinnerung: Eine Symmetrieoperation |Ψi → |Ψ0 i = Θ |Ψi , |Φi → |Φ0 i = Θ |Φi , die Wahrscheinlichkeiten invariant lässt 2
2
|hΨ|Φi| = |hΨ0 |Φ0 i| , kann unitär oder anti-unitär sein. Für anti-unitäre Operationen gilt: Θ{c1 |Ψi + c2 |Φi} = c∗1 Θ |Ψi + c∗2 Θ |Φi (antilinear) und
∗
hΨ0 |Φ0 i = hΦ|Ψi = hΦ|Ψi .
(32.6) (32.7)
Um konsistente Rechenregeln zu erhalten, sollte eine komplexe Zahl immer auf die linke Seite des Vektors gezogen werden, Θ |Ψi c = Θc |Ψi = c∗ Θ |Ψi . Das oben diskutierten Verhalten der Schrödinger-Gleichung legt nahe, dass der Zeitumkehr-Operator ein solcher anti-unitärer Operator ist. Definition: Wir erwarten, dass Zeitumkehr den Impuls umdreht, Θ |~ pi = |−~ pi . Dann folgt für das Transformationsverhalten des Impulsoperators unter Zeitumkehr ΘP~ Θ−1 = −P~
oder ΘP~ = −ΘP~ .
(32.8)
Beweis: ΘP~ |~ pi = Θ~ p |~ pi = p~Θ |~ pi = p~ |−~ pi = −P~ |−~ pi , ( da P~ |−~ pi = −~ p |−~ pi ) −1 −1 pi = ΘP~ Θ |−~ pi . ΘP~ |~ pi = ΘP~ Θ Θ |~ Gl. (32.8) folgt aus dem Vergleich der beiden Ergebnisse. Für ein freies Teilchen ist H = P 2 /2m, d.h. [H, Θ] = 0 . Wir hatten gefordert, dass Θ, im Gegensatz zu Π anti-unitär ist Θ(α |Ψi) = α∗ Θ |Ψi . Dann folgt für die Ortseigenzustände: Θ |~xi = |~xi .
424
Kapitel 32. Diskrete Symmetrien
Beweis: R R pi h~ p|~xi = Θ d3 p h~ p|~xi |~ pi Θ |~xi = Θ d3 p |~ R 3 R 3 ∗ = d p(h~ p|~xi) |−~ pi = d p h−~ p|~xi |−~ pi R 3 R 3 = d p |−~ pi h−~ p|~xi = d p |~ pi h~ p|~xi = |~xi , i 1 x ∙ p~ verwendet haben. wo wir h~x|~ pi = (2π}) 3/2 exp } ~
Der Zeitumkehr-Operator Θ lässt die Raumkoordinaten unverändert, dreht aber die Geschwindigkeiten um. Wir erhalten daher folgendes Transformationsverhalten für die Operatoren ~ −1 = X ~ ΘXΘ ΘP~ Θ−1 = −P~ ~ ~ −1 = −L. ΘLΘ Damit erfüllen die Erwartungswerte die klassischen Beziehungen. Wir postulieren, dass die letzte Relation auch für Spin-Operatoren gelten soll.
Regel: Der Zeitumkehroperator Θ wirkt nur auf Kets (nach rechts). Wir brauchen Θ† nicht zu definieren. Die Dirac-Notation darf nur für lineare Operatoren verwendet werden. Phasenbeziehung: Da Θ kein unitärer Operator ist, folgt aus der Tatsache dass H mit Θ vertauscht nicht, dass Θ eine Erhaltungsgröße ist. Es folgen aber nicht-triviale Phasenbeziehungen. Diese werden im Folgenden beschrieben. Sei |αi → |α0 i = Θ |αi , |βi → |β 0 i = Θ |βi . Dann gilt für einen beliebigen linearen Operator A folgende Identität:
hα|A|βi = β 0 |ΘA† Θ−1 |α0 .
Beweis: Der Beweis ist nicht so offensichtlich, da Θ nur nach rechts wirkt. Der Vektor |γi ≡ (A† |βi)
wird im dualen Raum
hγ| = (hβ| A) .
Symmetrie unter Zeitumkehr bedeutet hγ|αi = hα0 |γ 0 i. Dann folgt hβ|A|αi = hγ|αi
=
Gl. (32.7)
hα0 |γ 0 i
= hα0 |Θ|γi = α0 |ΘA† |β
= α0 |ΘA† Θ−1 Θ|β = α0 |ΘA† Θ−1 |β 0 .
32.2 Zeitumkehr
425
Für Hermitesche Operatoren A = A† gilt speziell
hβ|A|αi = α0 |ΘAΘ−1 |β 0 .
(32.9)
Viele Operatoren haben wohldefiniertes Verhalten unter Zeitumkehr gerade ΘAΘ−1 = ±A , ungerade z.B.
~ ~ −1 = X ΘXΘ ΘP~ Θ−1 = −P~ .
Dann führt die Identität Gl. (32.9) auf nicht-triviale Phasenbedingungen
hβ|A|αi = α0 |ΘAΘ−1 |β 0 = ± hα0 |A|β 0 i ∗
= ± hβ 0 |A|α0 i .
Für die (stets reellen) Erwartungswerte Hermitescher Operatoren bedeutet dies: hα|A|αi = ± hα0 |A|α0 i . Aus der Relation folgt z.B.
ΘP~ Θ−1 = −P~ D
E D E α|P~ |α = − α0 |P~ |α0 ,
wo |α0 i die Zustände mit umgekehrter Bewegungsrichtung sind. Die Erwartungswerte entsprechen also den klassischen Ergebnissen Zeitumkehr im Ortsraum (spinlose Teilchen): Wir entwickeln einen beliebigen Zustand nach Ortsraum-Eigenfunktionen Z Z |Ψi = d3 x |~xi h~x|Ψi = d3 xΨ(~x) |~xi . (Wegen der Regel Gl. (32.1) müssen wir die Wellenfunktion vor den Zustand schreiben). Bei Zeitumkehr geht der Zustand über in Z Z 3 Θ |Ψi = d xΘΨ(~x) |~xi = d3 xΨ∗ (~x) |~xi , oder Ψ(~x) → Ψ∗ (~x) .
Wir definieren einen Zeitumkehr-Operator, der auf die Wellenfunktion wirkt durch ΘΨ(~x) = Ψ∗ (~x) .
426
Kapitel 32. Diskrete Symmetrien
Als Beispiel betrachten wir ein Teilchen in einem Drehimpuls-Eigenzustand. In unserer Phasenkonvention wurde der radiale Teil der Wellenfunktion reell gewählt. Für den winkelabhängigen Teil der Wellenfunktion gilt dann Ylm (θ, φ) → Ylm∗ (θ, φ) = (−1)m Yl−m (θ, φ) Θ
und damit wird Wir wenden Θ zweimal an:
Θ |l, mi = (−1)m |l, −mi .
Θ2 |l, mi = (−1)2m |l, mi = (−1)2l |l, mi = |l, mi . Die Verallgemeinerung für ganzzahlige und halbzahlige Drehimpulse lautet Θ2 |j, mi = (−1)2m |j, mi = (−1)2j |j, mi (wenn j ganzzahlig (halbzahlig) ist, dann ist es auch m). Es gilt also Θ2 = 1 Θ = −1 2
für ganzzahlige Drehimpulse
(32.10)
für halbzahlige Drehimpulse .
Im Allgemeinen braucht es zur vollständigen Beschreibung eines Systems mehr Observable als den Drehimpuls, z.B. die radiale Variable. Die Wirkung auf solche Systeme kann unter Umständen komplizierter sein als oben beschrieben. Als Beispiel betrachten wir das Elektron im Wasserstoffatom, das durch den Gesamtdrehimpuls und die Energie beschrieben werden kann. Wenn der Hamilton-Operator zeitumkehrinvariant ist, dann wird ein gegebener Energieeigenvektor durch Θ auf einen anderen mit der selben Energie abgebildet. Man überprüft leicht, dass Θ2 ein linearer Operator und mit dem zeitumkehrinvarianten Hamilton-Operator vertauscht. Für Energieeigenzustände, die gleichzeitig Drehimpulseigenzustände sind gilt wieder Gl. (32.10). Kramers-Entartung: Die Eigenschaft, dass Zustände mit halbzahligen Drehimpulsen das Vorzeichen unter Θ2 wechseln, manifestiert sich in der Kramers-Entartung. Betrachte einen zeitumkehrinvarianten Hamilton-Operator. Die Eigenvektoren |Ei und die zeitumgekehrten Θ |Ei sind Eigenvektoren zum selben Eigenwert E. Wenn die beiden Vektoren linear unabhängig sind, dann ist der Eigenwert entartet. Dies ist der Fall für halbzahlige Drehimpulse. Beweis: Sei |Ei nicht-entartet, dann sind |Ei und Θ |Ei der selbe Zustand, Θ |Ei = eiα |Ei
→ Θ2 |Ei = |Ei .
Dies widerspricht der Tatsache, dass Θ2 das Vorzeichen eines Zustandes mit halbzahligem Spin ändert. Stationäre Zustände für halbzahlige Drehimpulse eines zeitumkehrinvarianten Systems müssen also jeweils paarweise entartet sein.
32.2 Zeitumkehr
427
Satz: Ist ein Hamilton-Operator invariant unter Zeitumkehr, so können die nicht-entarteten Energie-Eigenfunktionen reell gewählt werden. Beweis: Es gibt zwei Möglichkeiten:
HΘ |ni = ΘH |ni = En Θ |ni .
a) |ni und Θ |ni sind verschiedene Zustände, dann sind die zugehörigen Energien entartet b) Es gibt keine Entartung und |ni und Θ |ni sind bis auf einen Phasenfaktor der selbe Zustand, Θ |ni = eiα |ni . Für die Wellenfunktion war Ψn (~x) = h~x|ni
Ψ∗n (~x) = h~x|Θ|ni = eiα Ψn (~x).
Ψ∗n (~x) und Ψn (~x) können sich daher höchstens um einen irrelevanten konstanten Phasenfaktor unterscheiden. Man kann also Ψn (~x) = Ψ∗n (~x) wählen. Beim Wasserstoffatom geht das nur für die l = 0 Zustände, da alle anderen entartet sind. Beim harmonischen Oszillator sind alle Energie-Eigenzustände nichtentartet, d.h. die Wellenfunktionen können alle reell gewählt werden.
Kapitel 33
Zeitunabhängige Störungstheorie 33.1
Nicht-Entarteter Fall
Oft kann man den Hamilton-Operator in der Form schreiben H = H0 + λH1 , wobei das Eigenwertproblem für H0 gelöst und der schwierige E Teil λH1 klein ist, d.h. (0) (0) von H0 seien bekannt, λ 1. Die Eigenwerte En und die Eigenfunktionen Ψn E E (0) (0) H0 Ψ(0) = E , Ψ n n n
n = 0, 1, 2, ... .
Gesucht sind die diskreten Eigenzustände (Bindungszustände) |Ψn i und Eigenwerte En von H, H |Ψn i = En |Ψn i . Wir beschränken uns in der Ableitung auf die führender Ordnung in λ. Dazu entwickeln wir Eigenwerte und Eigenvektoren in eine Potenzreihe in λ En = En(0) + λEn(1) + λ2 En(2) + .... E E (1) + λ |Ψn i = Ψ(0) Ψn + ... . n
Die Konvergenz der Störungsreihe muss jeweils geprüft werden. Aus den Normierungsbedingungen E D E D (0) (1) (1) hΨn |Ψn i = Ψ(0) = Ψ = ... = 1 |Ψ |Ψ n n n n
430
Kapitel 33. Zeitunabhängige Störungstheorie
folgt i h E Ei D (1) (0) (1) + λ Ψ(0) + λ Ψ Ψ Ψ n n n n hD E D E D E i (0) (0) (0) (1) (0) = Ψn |Ψn + λ Ψn |Ψn + λ Ψ(1) + ... = 1 . n |Ψn
hΨn |Ψn i =
hD
Ein Vergleich der Koeffizienten von λ1 liefert D E D E (0) (1) Ψ(1) = Ψ(0) =0, n |Ψn n |Ψn
(33.1)
d.h. die Zustände nullter Ordnung und erster Ordnung in der Störungstheorie sind orthogonal zueinander. (1) : Bestimmung von En Die Schrödinger-Gleichung ergibt in O(λ) h E Ei h E Ei (0) (1) (1) (0) (1) + λ = (E + λE ) + λ . (H0 + λH1 ) Ψ(0) Ψ Ψ Ψ n n n n n n
Ein Vergleich der Koeffizienten von λ liefert E E E E (1) (1) (0) (0) (1) H1 Ψ(0) + H = E + E . Ψ Ψ Ψ 0 n n n n n n
Wir multiplizieren Gl. (33.2) von links mit
D
(33.2)
(0) Ψn , verwenden Gl. (33.1) und erhalten
D E (0) |H |Ψ . En(1) = Ψ(0) 1 n n
(33.3)
D.h. wir brauchen zur Berechnung der Energieverschiebung in erster Ordnung nur die ungestörten Zustände. Da die ungestörten Erwartungswerte von H1 in vielen Anwendungen verschwinden, ist auch noch die nächste Approximation von Bedeutung. Das Ergebnis sei hier ohne Beweis angeführt, D E (0) (0) X | Ψn |H1 |Ψm |2 En(2) = . (33.4) (0) (0) En − E m m6=n Man kann zeigen, dass die Korrektur 2. Ordnung immer negativ ist. E (1) Für die Korrektur zum Zustandsvektor findet man Ψn E X (1) Ψn =
m6=n
D
(0)
(0)
Ψn |H1 |Ψm (0)
(0)
En − Em
E
E (0) Ψn .
(33.5)
n Eo (0) Beweis: Die Ψn bilden ein vollständiges Orthonormalsystem. D.h. der Vektor E n Eo (0) (1) kann in der Basis Ψn entwickelt werden Ψn E E D E X (1) (0) (1) cm Ψ(0) mit c = Ψ |Ψ . Ψn = m m m n m6=n
33.1 Nicht-Entarteter Fall
431
E (1) Der Fall m = n braucht nicht betrachtet zu werden, da Ψn nach Gl. (33.1) keine E (0) Komponente in Richtung Ψn besitzt. Wir multiplizieren jetzt Gl. (33.2) von links D (0) mit Ψm und erhalten oder
D
D
E E D E D E (0) (1) (0) (0) (1) Ψ(0) + H0 Ψ(1) = Ψ(0) + Ψ(0) ) m H1 Ψn n m En Ψn m En Ψn
E D E D E D E (0) (0) (1) (0) (1) + Em Ψ(0) = En(1) Ψ(0) + En(0) Ψ(0) . Ψ(0) m |H1 |Ψn m |Ψn m |Ψn m |Ψn | {z } =0, da m6=n
Damit wird
D
E D E (0) (0) (1) = (En(0) − Em ) Ψ(0) Ψ(0) m |H1 |Ψn m |Ψn E X D (0) (0) = (Em − En(0) ) cr Ψ(0) |Ψ , m r {z } r6=n | δmr
oder
→ cm =
D
(0)
(0)
Ψm |H1 |Ψn (0)
(0)
E n − Em
E
.
Der Faktor λ wurde eingeführt um die Ordnungen der Störungstheorie explizit zu sehen. Im Folgenden lassen wir diesen Faktor weg und schreiben nur H 0 +H E =H E 1 mit (0) (0) (0) (1) (0) (0) 6= Ψn ,d.h. H1 H0 , En = En + En + ..., usw. Wenn Em = En für Ψm 0 bei Entartung, muss die Störungstheorie modifiziert werden. Beispiel: Harmonischer Oszillator im elektrischen Feld Ein eindimensionaler harmonischer Oszillator in einem konstanten elektrischen Feld E wird beschrieben durch den Hamilton-Operator H = H0 + H 1 mit H0 =
P2 1 + kX 2 2μ 2
und H1 = −qEX .
Die Eigenzustände |ni von H0 mit zugehörigen Eigenwerten En(0)
1 = (n + )}ω, n = 0, 1, 2, .. , ω = 2
s
k μ
sind alle nicht entartet, so dass die Störungstheorie direkt anwendbar ist. DaEwir nur (0) die die Zustände in 0-Ordnung benötigen, schreiben wir kompakt |ni ≡ Ψn .
432
Kapitel 33. Zeitunabhängige Störungstheorie
Der Ortsoperator X ist ungerade und H0 invariant unter Parität. Damit verschwindet die Korrektur 1. Ordnung, hn|H1 |ni = 0. Für die Korrektur 2. Ordnung verwenden wir das Ergebnis aus Kapitel 21 "r # r m m+1 1 hm|X|ni = δn,m−1 + δn,m+1 a 2 2
mit a =
p μω }
.
Wir betrachten als Beispiel die Korrektur 2. Ordnung zur Grundzustandsenergie. Dafür benötigen wir allein das Matrixelement qE −qE h0|X|ni = − √ δn,1 . 2a Mit Gl. (33.4) wird (2)
E0
=
q2 E 2 P q2 E 2 δn,1 1 = 2 2 (0) (0) (0) 2a n6=0 E − En 2a E − E (0) 0
0
1
q2 E 2 1 q2 E 2 = . = − 2a2 −}ω 2μω 2
33.2
Entartung
Bei Entartung müssen wir dafür sorgen, dass in Gl. (33.5) die Nicht-Diagonalelemente im jeweiligen Entartungsraum verschwinden, D E (0) Ψ(0) |H |Ψ =0 für m 6= n , 1 m n (0)
(0)
da En = Em im Entartungsraum. Dazu verwenden wir die Tatsache, dass der ungestörte Hamilton-Operator im Entartungsraum proportional zur Einheitsmatrix ist, E D (0) = Er0 δrs (im Entartungsraum). Ψ(0) r |H0 |Ψs
Wenn wir im Entartungsraum unitäre Transformationen durchführen, dann bleiben die Matrixelemente von H0 invariant. Diese Freiheit lässt sich benützen, um auch H1 dort zu diagonalisieren. Wir suchen also in einer Basis von H0 , in der H1 in den Entartungsräumen diagonal ist. In dieser Basis ist D E (0) , En(1) = Ψ(0) n |H1 |Ψn
wie vorher.
Anmerkung: Man muss nur in endlich-dimensionalen Unterräumen diagonalisieren, während man zur Lösung des vollen Problems im Allgemeinen eine unendlichdimensionale Matrix diagonalisieren müsste.
33.2 Entartung
433
Auswahlregel: Das Problem lässt sich vereinfachen, wenn es einen Operator A gibt, der sowohl mit H0 als auch mit H vertauscht, d.h. [A, H0 ] = [A, H1 ] = 0 . Wenn |..ai die gemeinsamen Eigenvektoren von A, H0 und H sind, dann gilt oder
A |..ai = a |..ai ,
h..a0 |[H1 , A]|..ai = (a − a0 ) h..a0 |H1 |..ai = 0 h..a0 |H1 |..ai 6= 0
nur für
a = a0 .
(33.6)
Auswahlregel: Gibt es einen Operator A, der sowohl mit H0 als auch mit H1 vertauscht, dann braucht man im Entartungsraum, in dem diagonalisiert werden muss, nur diejenigen Eigenvektoren mitzunehmen, die zum selben Eigenwert von A gehören. Beispiel: Der lineare Stark-Effekt Wir demonstrieren die entartete Störungstheorie am linearen Stark-Effekt für ein ~ = E~ez befindet. Der HamiltonWasserstoff-Atom, das sich in einem elektrischen Feld E Operator ist P2 e2 H= − + eEZ , 2m R wo Z die z-Komponente des Ortsoperators ist. Der letzte Term kann als kleine Störung betrachtet werden, da die typischen atomaren Felder (∼ 1010 V /m) wesentlich stärker ~ Als Eigenzustände von H0 = P 2 − e2 können die Zustände sind als das äußeres Feld E. 2m R |n, l, mi aus Kapitel 29 gewählt werden. Hier ist die oben diskutierte Situation gegeben, dass sowohl H0 als auch das gesamte H mit Lz vertauschen, da Xi ein Vektoroperator ist, [Li , Xk ] = i}εikl Xl → [Lz , Z] = 0 .
Wir brauchen daher im Entartungsraum nur Zustände mit gleichem m zu betrachten. Wir betrachten als Beispiel die entarteten 2s- und 2p-Zustände. Von den entarteten Eigenzuständen |2, 0, 0i , |2, 1, 0i , |2, 1, 1i , |2, 1, −1i
besitzen nur zwei das selbe m, |2, 0, 0i und |2, 1, 0i. Für die anderen zwei Zustände |2, 1, 1i und |2, 1, −1i verschwinden alle Matrixelemente mit der Störung H1 = eEZ. Wir müssen also die 2 × 2-Matrix eE h2, 0, 0|Z|2, 0, 0i eE h2, 0, 0|Z|2, 1, 0i M= eE h2, 1, 0|Z|2, 0, 0i eE h2, 1, 0|Z|2, 1, 0i diagonalisieren. Die Matrixelemente für m = 0 sind reell, die Diagonalelemente h2, 0, 0|Z|2, 0, 0i und h2, 1, 0|Z|2, 1, 0i verschwinden wegen Parität, siehe Kapitel 30. Die Matrix M ist damit von der Form 0 a M= a 0
434
Kapitel 33. Zeitunabhängige Störungstheorie
mit a = E h2, 0, 0|Z|2, 1, 0i. Die zugehörigen Eigenvektoren und Eigenwerte sind: 1 −1 ↔ a, und ↔ −a . 1 1 Für die Eigenwerte von M erhält man also ΔE = ±eE h2, 0, 0|Z|2, 1, 0i . Man braucht daher nur ein Matrixelement zu berechnen. Zu diesem Zweck benötigen wir die ungestörten Eigenfunktionen des Wassestoff-Atoms aus Kapitel 30, 2s : 2p :
ϕ200 =
Y00 (θ, φ)
ϕ210 =
Y10 (θ, φ)
1 2a0 1 2a0
32 32
(2 −
r − 2ar )e 0 a0
r − 2ar e 0, a0
wo Y00 (θ, φ) = √14π , Y10 (θ, φ) = √14π cos θ und a0 der Bohrsche Radius ist, a0 = 0.529 × 10−8 cm. Damit wird Z h2, 0, 0|Z|2, 1, 0i = d3 xd3 x0 h2, 0, 0 |~xi h~x| Z |~x0 i h~x0 | 2, 1, 0i Z
= d3 xd3 x0 2, 0, 0 |~xi zδ 3 (~x − ~x0 ) h~x0 | 2, 1, 0
~2 me2
=
3 Z ∞ Z 1 Z 2π 1 r2 dr d(cos θ) dφ 2a0 0 0 0 r r r × r cos θ (2 − )e− a0 cos θ a0 a0 = −3a0 . =
1 4π
Der lineare Stark-Effekt spaltet also die entarteten m = 0 Niveaus in zwei Komponenten auf mit ΔE = ±3a0 eE .
Die zugehörigen Eigenfunktionen sind
1 √ (ϕ200 ∓ ϕ210 ) . 2
Kapitel 34
Feinstruktur des Wasserstoffatoms Wir hatten das Eigenwertproblem des Wasserstoffatoms unter Vernachlässigung des Elektronspins und anderer kleiner Störungen gelöst. Der Hamilton-Operator H0 =
~ R = X
P2 e2 − , 2me R
führte auf die Energieeigenwerte En0 = −
α 2 me c2 2n2
(n = 1, 2, 3, ....)
mit n = nr + l + 1, nr = 0, 1, 2, ... und α=
1 e2 ' }c 137
Feinstrukturkonstante
Jeder Energie-Eigenwert En0 ist n2 -fach entartet. Die nicht-entartete Grundzustandsenergie war E00 = −13.60eV und der Bohrsche Radius
a0 =
~2 . me e2
Die Störung besteht aus drei Termen, der Spin-Bahn-Kopplung, einer relativistischen Korrektur und dem Darwin-Term, H1 = HLS + Hkin + HD , die im Folgenden besprochen werden.
436
34.1
Kapitel 34. Feinstruktur des Wasserstoffatoms
Spin-Bahn-Kopplung
~ Im Wasserstoffatom bewegt sich das Elektron mit Spin-Magnetmoment μ ~ = mee c S im elektrischen Feld Wir hatten in Kapitel 27 gesehen, dass dies zu einer Spin-BahnWechselwirkung führt mit 1 e2 ~ ~ 1 HLS = L∙S 3 . 2 m2e c2 R Dies ist eine kleine Störung, wie folgende Abschätzung der Größenordnungen zeigt: HLS ' H0
1 2me c
2
e2 ~2 /r3
(E0 )
'
~ 2me c
2
e2 /a30
(α2 me c2 /2)
'
~ me cao
2
= α2
Daher stammt der Name „Feinstrukturkonstante“. Wir haben r abgeschätzt durch den Bohrschen Radius a0 = ~2 /me e2 . Die Quantenelektrodynamik (QED) zeigt, dass alle weiteren Korrekturen (relativistischen Korrekturen und der Darwin-Term) auch um den zusätzlichen Faktor α unterdrückt sind. Um die Energieeigenwerte zu bestimmen, verwenden wir die Störungstheorie in erster Ordnung, wobei aber die n2 -fache Entartung zu beachten ist. Das Problem wird vereinfacht, wenn wir einen oder mehrere Operatoren finden können, die mit H0 und HLS vertauschen. Wir hatten in Kapitel 27 gesehen, dass man zwei verschiedene Sätze von kompatiblen (vertauschenden) Observablen wählen kann, nämlich {Ho , L2 , Lz , Sz , (S 2 )} oder {H0 , L2 , J 2 , Jz , (S 2 )}, wo ~ +S ~ J~ = L der Gesamtdrehimpuls ist. Zu diesen Observablen gehören 2 äquivalente Sätze von Basiszuständen {|n, l, lz , (s), sz i} und {|n, l, j, jz , (s)i}. Der Eigenwert s = 1/2} von S 2 ist fest und muss nicht explizit geschrieben werden. Es ist vorteilhaft, den zweiten Satz von Operatoren zu verwenden, da H0 + HLS zwar mit ~ ∙S ~ = Lx Lx + L y L y + L2 , S 2 , aber nicht mit Sz oder Lz vertauscht (wegen des Terms L 2 2 2 2 ~ ∙ S) ~ und Jz (da L ~ ∙S ~ invariant unter Lz Lz ) dafür aber mit J (wegen J = L + S + 2L Drehungen des Gesamtsystems, Bahndrehimpuls und Spin ist). Die adäquate Basis, in der H0 und HLS diagonal sind, ist damit {|n, l, j, m, si} = {|nli |, |j, m, si}, wo wir jz = m gesetzt haben. Ausgedrückt durch Wellenfunktionen lautet die Basis h~x|{|nli |j, m, si} = hr, θ, φ|{|nli |j, m, si} = ϕnl (r)Ylm (θ, φ). Der Eigenwert j des Gesamtdrehimpulses J 2 kann nur die Werte j = l ±1/2 annehmen.
34.1 Spin-Bahn-Kopplung
437
Im letzten Kapitel hatten wir folgende Auswahlregel für die entartete Störungstheorie für H = H0 + H1 abgeleitet: Gibt es einen Operator der sowohl mit H0 als auch mit H vertauscht, d.h. [A, H0 ] = [A, H1 ] = 0 , und sind |..ai die gemeinsamen Eigenvektoren von A, H0 und H bzw. H1 , A |..ai = a |..ai , dann gilt
h..a0 |H1 |..ai 6= 0
a = a0 .
nur für
(34.1)
Aus der Auswahlregel folgt, dass man im Entartungsraum, in dem diagonalisiert werden muss, nur diejenigen Eigenvektoren mitnehmen muss, die zum selben Eigenwert von A gehören. Das bedeutet hier, dass wir nur Eigenvektoren mit gleichen l, j und m betrachten müssen. D.h. in der Produktbasis ist H im Entartungsraum schon diagonal. In dieser Basis lautet das Diagonalelement von H0 : hl, j, m, s| H0 |l, j, m, si = En0 mit
α 2 me c2 (n = 1, 2, 3, ...) 2n2 Für die Spin-Bahn-Kopplung benötigen wir die Matrixelemente En0 = −
~ ∙S ~ 1 |n, l, j, m, si . hn, l, j, m, s| L R3 ~ ∙S ~ und 1/R3 vertauschen, können wir beide Beiträge getrennt betrachten. Der Da L ~ ∙ S-Term ~ L berechnet sich zu ~ ∙S ~ |n, l, j, m, si hn, l, j, m, s| L 1 = hn, l, j, m, s| (J 2 − L2 − S 2 ) |n, l, j, m, si 2 1 2 = ~ {j(j + 1) − l(l + 1) − s(s + 1)} | {z } 2 =
3/4
l 2 2~ − 12 (l
+ 1)~
2
für für
j = l + 12 j = l − 12
Die nicht-diagonalen Matrixelemente verschwinden entsprechend der obigen Auswahlregel. Ein Niveau mit gegebenen l , welches für H0 entartet war, spaltet also in zwei Komponenten mit j = l + 12 und j = l − 12 auf. Für l = 0 sind offensichtlich alle ~ ∙S ~ gleich Null. Matrixelemente von L Wir brauchen noch den radialen Anteil für l 6= 0, hn, l, j, m, s|
1 1 |n, l, j, m, si = hnl| 3 |nli = R3 R
Z
∞ 0
r2 drϕ∗nl (r)
1 ϕnl (r). r3
(34.2)
438
Kapitel 34. Feinstruktur des Wasserstoffatoms
Die radialen Wellenfunktionen waren gegeben durch hr|nli = ϕnl (r). Anmerkung: Die Normierung der radialen Wellenfunktionen ist Z ∞ r2 drϕnl (r)ϕ∗n0 l0 (r) = δnn0 δll0 0
und die Vollständigkeit ∞ n−1 P P
n=1 l=0
Beweis der Gl. (34.2): hnl|
1 |nli = R3 = =
Z
∞
Z0 ∞
Z
0
0
∞
ϕ∗nl (r)ϕnl (r0 ) =
r2 dr 2
r dr
Z
∞
Z0 ∞ 0
1 δ(r − r0 ). r2
r02 dr 0 hnl|ri hr| r02 dr 0 hnl|ri
r2 drϕ∗nl (r)
1 0 0 |r i hr |nli R3
1 2 r δ(r − r0 ) hr0 |nli r3
1 ϕnl (r). r3
Das Integral in (34.2) kann analytisch berechnet werden Z ∞ 1 1 1 . r2 drϕ∗nl (r) 3 ϕnl (r) = 3 3 r a0 n (l + 1)(l + 12 )l 0
(34.3)
Wenn wir die Ergebnisse für den radialen und den Winkelanteil zusammenfassen, erhalten wir 1 1 j = l + 12 l+1 hHLS inlj = En0 α2 1 −l j = l − 12 n(2l + 1)
Die Zustände mit gleichem l und j = l + 1/2 sind entartet, ebenso wie die Zustände mit gleichem l und j = l − 1/2.
34.2
Relativistische Korrektur
Klassisch erhält man für die relativistische Korrektur der kinetischen Energie: s p p~2 c2 − me c 2 Ekin = (me c2 )2 + p~2 c2 − me c2 = me c2 1 + (me c2 )2 √ p~2 1 p~4 1 1 2 = − + ... 1 + ε = 1 + ε − ε + ... 2me 8 m3e c2 2 8 2 p~2 p~2 1 1 = − + ... 2me 2 2me me c 2
34.3 Darwin-Term
439
Damit setzen wir für die erste relativistische Korrektur Hkin = −
1 P~ 4 . 8 m3e c2
Eine Abschätzung der Größenordnung ergibt: H0 E0 P~ 2 Hkin ' 2 2 ' = ' α2 . H0 me c me c 2 me c 2 Auch Hkin ist in der Darstellung {|n, l, j, m, (si} bei festem n diagonal. Es gilt P~ 4 1 = 8m3e c2 2me c2
P~ 2 2me
!2
1 = 2me c2
e2 H0 − R
2
.
Wir benötigen die diagonalen Matrixelemente 2 1 e2 0 hnljm| Hkin |nljmi = − hnl| En − |nli . me c2 R Mit den Integralen 1 1 , |nli = R a0 n2 1 1 hnl| 2 |nli = 2 3 R a0 n (l + 12 ) hnl|
2
und En0 = −α2 m2ne c2 , a0 =
}2 me e2 ,
hHkin inlj
34.3
α=
e2 }c
finden wir 1 0 21 = −En α n l+
1 2
3 − 4n
.
Darwin-Term
Berücksichtigt man die Ausdehnung des Elektrons über eine Compton-Wellenlänge λ/2π = ~/me c (Lokalisierbarkeit des Elektrons, Zitterbewegung), dann spürt es nicht nur das Potential am Ort ~x, sondern auch in der Umgebung 1 V (~x + δ~x) = V (~x) + δxi ∂i V (~x) + δxi δxk ∂i ∂k V (~x) + ... 2 Da die zeitlichen Bahnschwankungen zufällig sind, ist keine Richtung ausgezeichnet, d.h. _______ δxi = 0; δxi δxk = δik δl2 , wo δl eine typische Länge ist. Aus der relativistischen Quantentheorie folgt 2 ~ δl2 = . 2me c
440
Kapitel 34. Feinstruktur des Wasserstoffatoms
Damit wird
1 V (~x + δ~x) = V (~x) + δl2 ∇2 V (~x). 2
Da
1 1 = −4πδ 3 (~x) = −4π 2 δ(r)δ(cos θ)δ(φ) , r r gilt für das Coulomb-Potential ∇2
V (~x + δ~x) = − oder
e2 4π 1 − δl2 e2 2 δ(r)δ(cos θ)δ(φ), r 2 r
~2 4π 1 HD = − e2 2 2 2 δ(r)δ(cos θ)δ(φ). 8 me c r
Damit wird Z ∞ 1 δ(r)δ(cos θ)δ(φ) ~2 r2 drd(cos θ)dφϕ∗nl (r) ϕnl (r) hnl| HD |nli = − e2 2 2 4π 8 me c r2 0 e2 ~2 2 = 4π |ϕnl (0)| δl0 , 2 m2e c2 da nur s-Wellen im Ursprung nicht verschwinden. Setzen wir jetzt ein für die Wellenfunktion, Grundzustandsenergie und Feinstruktur-Konstante s ~2 ~ 1 mit a = = ϕn,l=0 (0) = 0 3 3 2 n πa0 me e αme c und En0 = −α2 so erhalten wir
me c 2 e2 , α= , 2 2n }c
1 1 ~2 hnl| HD |nli = δl0 (~cα) 2 2 4π 3 3 8 me c n πa0 1 1 α3 m3e c3 ~2 = δl0 (~cα) 2 2 4 3 8 me c n ~3 2 4 me c α 1 = δl0 = −δl0 En0 α2 : 2n3 n Fassen wir alle Korrekturen der Ordnung α2 zusammen, so finden wir: a) für l 6= 0:
1 1 2 j = l + 12 l+1 + × − 1 −l j = l − 12 2l + 1 (2l + 1) ( 1 −2(l+1)+1 1 1 1 ) = 2l+1 ( −(2l+1) 2l+1 ( l+1 l+1 ) = − l+1 = − j+ 12 = 1 −2l−1 1 ) = 2l+1 ( −(2l+1) ) = − 1l = − j+1 1 2l+1 ( l l 2
.
34.3 Darwin-Term
441
Damit wird die Feinstruktur in Ordnung α2 für l 6= 0 1 3 1 Enlj = −En0 1 + α2 ( − ) n j + 12 4n
(34.4)
für beide Fälle j = l ± 12 . Die Korrekturen in O(α2 ) heben die Entartung der Eigenzustände partiell auf, so dass Zustände mit unterschiedlichem Gesamtdrehimpuls j auch unterschiedliche Energien aufweisen. Die Bindungsenergien werden abgesenkt. b) Für l = 0 tragen nur Hkin und HD bei 1 1 3 3 0 21 0 21 −En0 α2 − α α − E 1 − = −E n n n 12 4n n n 4n Wenn man setzt
1 , 1→ j + 12 j= 1 2
dann gilt die Formel (34.4) auch für l = 0. Wir diskutieren die Formel (34.4) anhand der n = 2 Niveaus. In der spektroskopischen Notation nlj ersetzt man l = (0, 1, 2, 3; ...) durch die Symbole (s, p, d, f, ...). Wir betrachten speziell die Aufspaltung des n = 2 Energieniveaus. H0 : Die zwei 2s1/2 , die zwei 2p1/2 und die drei 2p3/2 Zustände sind alle entartet. H0 + HSB + Hkin : Die Feinstruktur bricht die Entartung der 2p3/2 Zustände relativ zu den 2s 12 und 2p 12 Zuständen. Die Entartung der 2s1/2 und 2p1/2 Zustände bleibt bestehen. Explizit ergibt sich für die n = 2 Aufspaltung: 3 1 1 0 21 E2lj = −E2 α − 2 j + 12 8
mit E20 = −α2
me c2 8
oder 5 me c 2 α 4 128 5 =− me c 2 α 4 128 1 =− me c 2 α 4 . 128
1 1 =− E2,l=0,j= 1 = E2s 1 2
2
1 1 E2,l=1,j= 1 = E2p 1 2
2
1 1 E2,l=1,j= 3 = E2p 3 2
2
Die l-Abhängigkeit der Aufspaltung hebt sich für das Coulomb-Potential zufällig heraus, wenn man die LS-Kopplung zusammen mit der relativistischen Korrektur berücksichtigt. Die Entartung der 2s 12 und 2p 32 Zustände bleibt bestehen. Diese Entartung wird erst durch die Lamb-Shift der Quantenelektrodynamik aufgehoben. Daneben besteht natürlich noch immer die 2j + 1-fache Richtungsentartung bzgl. m = jz .
442
Kapitel 34. Feinstruktur des Wasserstoffatoms
Abbildung 34.1
Bemerkung: Einschließlich der 2. Ordnung hatten wir für die Energieverschiebung D E (0) D E X | Ψ(0) |2 n |H1 |Ψm (0) |H |Ψ + . ΔEn = Ψ(0) 1 m m 0 En0 − Em m6=n
In der Summe tragen nur Zustände bei, die in verschiedenen Entartungsräumen liegen. Der Beitrag der nicht-diagonalen Terme ist aber von der Ordnung α6 me c2 und damit sehr klein.
Kapitel 35
Identische Teilchen 35.1
Permutationssymmetrie
In der klassischen Mechanik sind identische Massenpunkte prinzipiell unterscheidbar, da sie sich auf eindeutigen Trajektorien bewegen. Dies ist in der Quantenmechanik nicht mehr der Fall. Wir betrachten einen quantenmechanischen Zustand von N Teilchen, die sich in Ihren physikalischen Eigenschaften, wie Masse, Spin, Ladung etc. nicht unterscheiden. Nach den Postulaten der Quantenmechanik ist der Zustandsraum eines zusammengesetzten Systems (z.B. von zwei oder mehr Elektronen) das Tensorprodukt der einzelnen Zustandsräume. Wenn z.B. eine Komponente eines Zweiteilchensystems durch den Zustand |a1 i und die zweite durch den Zustand |a2 i beschrieben wird, dann ist der Zustand des zusammengesetzten Systems |a1 i ⊗ |a2 i. Dabei sollen a1,2 die Gesamtheit aller messbaren Quantenzahlen darstellen. Wenn beide Einzelsysteme im selben Zustand sind, d.h. a1 = a2 , dann ist der Gesamtzustand symmetrisch unter Teilchenaustausch und dann kann man die beiden Teilchen nicht mehr unterscheiden. In der Quantenmechanik sind Teilchen mit dem gleichen vollständigen Satz von Quantenzahlen wahrhaft ununterscheidbar. Die Tatsache, dass die Teilchen identisch sind, bedeutet, dass alle Observablen symmetrisch unter Teilchenaustausch sein müssen. Wenn wir z.B. gleichzeitig Raum- und Spinkoordinaten zweier Elektronen austauschen, dann gibt es keine physikalische Möglichkeit diese Änderung zu erkennen. Diese Symmetrie unter Teilchenaustausch muss im Formalismus der Quantenmechanik aufscheinen. Wir betrachten zunächst ein System von zwei Teilchen und führen einen Permutationsoperator P12 ein, der die Quantenzahlen des Teichens 1 mit denen des Teilchens 2 vertauscht, P12 |a1 i1 |a2 i2 = |a2 i1 |a1 i2 ,
wo ai einen Satz aus den vollständigen Eigenwerten charakterisiert (z .B. a1 = n1 , l1 , m1 für Wasserstoffeigenzustände). Der Index am Ket bezeichnet das Teilchen. Wenn die Teilchen identisch sind, dann muss der Hamilton-Operator symmetrisch unter der Ver-
444
Kapitel 35. Identische Teilchen
tauschung (1 ↔ 2) sein. Ein Beispiel wäre der Hamilton-Operator des Heliumatoms bei Vernachlässigung der Spinwechselwirkungen 2 1 e2 2e2 2e H= + + . P12 + P22 − 2m R1 R2 R12 Der Hamilton-Operator vertauscht mit dem Permutationsoperator, [P12 , H] = 0 , d.h. der Permutation entspricht eine Erhaltungsgröße. Ein symmetrischer Zweiteilchenzustand bleibt symmetrisch für alle Zeiten. Das gleiche gilt für einen antisymmetrischen Zustand. Außerdem vertauscht P12 mit dem Gesamtimpuls und dem Gesamtbahndrehimpuls, [P12 , P~ ] = 0 ~ =0 [P12 , L]
P~ = P~1 + P~2 ~ =L ~1 + L ~2 . L
Wegen der Ununterscheidbarkeit, soll der Operator P12 die Wahrscheinlichkeiten nicht ändern, d.h., P12 ist unitär: † P12 P12 = 1
Offensichtlich gilt
2 P12 =1
† −1 oder P12 = P12 .
−1 oder oder P12 = P12 .
† = P12 und seine EigenDamit ist der Permutationsoperator P12 auch Hermitesch P12 werte sind reell und gleich ±1.
Beweis: Wir betrachten die Eigenfunktion |Ψi und die Eigenwerte λ von P12 . Dann gilt P12 |Ψi = λ |Ψi
2 und P12 |Ψi = λ2 |Ψi .
2 Andererseits gilt, wegen P12 =1 2 P12 |Ψi = 1 |Ψi = |Ψi .
Da P12 Hernmitesch ist, muss λ reell sein, und damit ist λ = ±1. Die Eigenvektoren zum Eigenwert λ = 1 heißen symmetrisch, die zu λ = −1 heißen antisymmetrisch. Für die betrachteten Zwei-Teilchensysteme lassen sich zwei linear unabhängige Zustände bilden, die symmetrisch bzw. antisymmetrisch sind 1 |a1 a2 i± = √ [|a1 i1 |a2 i2 ± |a2 i1 |a1 i2 ] 2 mit
P12 |a1 a2 i± = ± |a1 a2 i± .
(35.1)
Für 3 und mehr Teilchen gibt es neben vollständig symmetrischen oder antisymmetrischen Zuständen noch weitere Kombinationen mit komplizierterem Verhalten unter
35.2 Das Heliumatom
445
Permutationen. In Mehrteilchensystemen sind nur Zustände erlaubt die entweder symmetrisch oder antisymmetrisch bezüglich der Vertauschung jedes Teilchenpaars sind. Spin-Statistik-Theorem: Ein wichtiges Theorem der Quantenfeldtheorie besagt, dass ein System von identischen Teilchen symmetrisch für ganzzahlige Spins (Bose-Einstein-Statistik) und antisymmetrisch für halbzahligen Spins (Fermi-Statistik) ist. Da die Quantenmechanik den Niederenergielimes der Quantenfeldtheorie darstellt, kann das Spin-Statistik-Theorem mit zu den Axiomen der Quantenmechanik gezählt werden. Für Elektronen und andere Fermionen folgt speziell das Pauli-Prinzip. Pauli-Prinzip: Zwei identische Fermionen können nicht im selben Quantenzustand sein (wie direkt aus Gl. (35.1) ersichtlich ist).
35.2
Das Heliumatom
Wenn wir die Spin-Bahn- und Spin-Spin-Wechselwirkung der beiden Elektronen in einem Heliumatom vernachlässigen, dann ist der Hamilton-Operator gegeben durch H = H1 + H2 + H 0 mit H1 =
P~12 2e2 − ; ~ 1| 2m |X
H2 =
P~22 2e2 − , ~ 2| 2m |X
H0 =
e2 ~1 − X ~ 2| |X
.
~ i und P~i , i = 1, 2, jeweils die Orts- und Impulsoperatoren der beiden Dabei sind X 0 Elektronen. Wenn wir zusätzlich den letzten Term H , der die Abstoßung zwischen den beiden Elektronen darstellt, vernachlässigen, dann ist die Wellenfunktion gleich dem Produkt von zwei Wasserstoff-Wellenfunktionen jeweils mit der Ladungszahl 2. Unter der Annahme, dass H 0 eine kleine Störung ist lässt sich die Störungstheorie für H = H1 + H2 + H 0 anwenden. Dabei spielt die Fermi-Statistik der Elektronen eine wichtige Rolle. Der Hamilton-Operator ist unabhängig von den Spins der Teilchen. Damit vertauschen die beiden Spinoperatoren mit H ~i , H] = 0, [S
i = 1, 2 .
Die symmetrisierten Zustände können dann als (äußeres) Produkt von Raum und SpinZuständen gewählt werden. Wir definieren zwei Permutationsoperatoren P12 tauscht die Teilchen aus (die Position, nicht die Spins) S12 tauscht nur die beiden Spins aus und einen Gesamtspinoperator ~=S ~1 + S ~2 . S
446
Kapitel 35. Identische Teilchen
Der Operator S12 vertauscht nicht mit den den einzelnen Spinoperatoren S1z , S2z . Da der Spin in H nicht vorkommt, ist auch ~ = 0, [H, S]
~i ] = 0 [H, S
i = 1, 2 .
Nachdem wir die Spin-Bahn- und Spin-Spin-Wechselwirkungen vernachlässigt haben, tritt der Spinteil in den Zustandsvektoren nur als Etikett auf, welches die Symmetrie bzw. Antisymmetrie des jeweiligen Bahnteils angibt. Wir betrachten zunächst die Spinsymmetrie. Wir hatten in Kapitel 28 die Eigenzustände des Gesamtspins von zwei Elektronen bestimmt. Es gibt a) ein Triplett mit s = 1 und sz = (1, 0, −1) |11i = |+i |+i 1 |10i = √ (|+i |−i + |−i |+i) 2 |1, −1i = |−i |−i b) ein Singulett mit s = 0, sz = 0 1 |00i = √ (|+i |−i − |−i |+i) . 2 Dies sind offensichtlich auch die symmetrischen bzw. antisymmetrischen Eigenzustände von S12 . Als Nächstes betrachten wir die Symmetrie der Ortswellenfunktionen. H ist invariant, wenn die beiden Elektronen gemeinsam gedreht werden, d .h. ~ =0 [H, L] aber
wo
~ i ] 6= 0 [H, L
~2 ~ =L ~1 + L L i = 1, 2 .
Als Ortsbasis verwenden wir die Energieeigenzustände |n, l, mi bzw. die Energieeigenfunktionen Φnlm (~x2 ) = h~x|n, l, mi. Die mit der Fermi-Statistik kompatiblen HeliumWellenfunktionen sind von der Form Singulett-Spinwellenfunktionen × symmetrische Bahnwellenfunktion oder Triplett-Spinwellenfunktion × antisymmetrische Bahnwellenfunktion. Ein Elektron ist stets im Grundzustand, da sonst die Ionisierungsenergie überschritten wird. Somit sind die Helium-Wellenfunktionen gegeben durch n 1 Φ(~x1 , ~x2 ) = √ {Φ100 (~x1 )Φnlm (~x2 ) ± Φ100 (~x2 )Φnlm (~x1 )} × Spin-Singulett Spin-Triplett 2
35.2 Das Heliumatom
447
Grundzustand: Die Raumwellenfunktion für den Grundzustand (1s)2 ist notwendigerweise symmetrisch, da beide Elektronen n = 0, l = 0 haben und damit ein antisymmetrisches Spin-Singulett bilden müssen. Wir vernachlässigen zunächst die Wechselwirkung H 0 , 8 r1 + r 2 Φ100 (~x1 )Φ100 (~x2 )χsing. = exp −2 χsing. , (35.2) πa30 a0 wo a0 der Bohrsche Radius war, a0 =
}2 , me2
und χsing. der Spin-Singulett Eigenvektor 1 1 0 0 1 χsing. = √ − . 0 1 1 0 2 In dieser Näherung ist H = H1 + H 2 ,
H0 = 0 2 −e E = E1 + E2 = 2 × 4 ' 1.3Eexp 2a0
Eine bessere Näherung erhält man in der Störungstheorie 1. Ordnung mit Gl. (35.2) als ungestörte Wellenfunktion R e2 e2 ΔE(1s)2 = = d3 x1 d3 x2 |Ψ100 (x1 )|2 |Ψ100 (x2 )|2 |~x1 − ~x2 | (1s)2 |~x1 − ~x2 | 6 R e −4(r1 + r2 ) 2 = d3 x1 d3 x2 2 6 exp . π a0 a0 |~x1 − ~x2 | Die Inintegration kann ausgeführt werden mit den Formeln
l X rl 4π X m∗ 1 < Yl (Ω1 )Ylm (Ω2 ), = l+1 2l + 1 |~x1 − ~x2 | r> l
m=−l
wo r< (r> ) der Kleinere (Größere) von r1 und r2 ist, und Z 0 dΩYlm∗ (Ω)Ylm (Ω) = δll0 δmm0 . 0 Speziell gilt:
Z
dΩYlm∗ (Ω)1
= =
Z
√
√ dΩYlm∗ (Ω) 4πY00 (Ω) 4πδl0 δm0 .
Damit ergibt die Winkelintegration Z Z √ 2 m∗ dΩ1 Yl (Ω1 ) dΩ2 Ylm (Ω2 ) = 4πδl0 δm0 .
448
Kapitel 35. Identische Teilchen
Außerdem ist die radiale Integration für l = 0 auszuführen. Man muss zwischen r1 > r2 und r1 < r2 unterscheiden, R∞ 2 Rr1 1 −4(r1 + r2 ) r1 dr1 r22 dr2 exp r1 a0 0 0 # R∞ 2 R∞ 2 1 −4(r1 + r2 ) + r1 dr1 r2 dr2 exp r2 a0 r1 0 5 5 a0 = , 128 2 R 2 −x R x e dx = −2e−x − 2xe−x − wo wir die Integrale xe−x dx = −e−x − xe−x und 2 −x x e verwendet haben. Damit ergibt sich für die Energieverschiebung ΔE(1s)2 =
5 e2 5 = 13.6eV = 34eV . 2 2a0 2
Das Ergebnis für die gesamte Grundzustandsenergie, 5 e2 = 74.8eV , E(1s)2 = −8 + 2 2a0 stimmt recht gut mit dem experimentellen Wert exp E(1s 2 ) = 78.8eV
überein. Angeregte Zustände: Sie sind interessant vom Standpunkt der identischen Teilchen. Wir betrachten wieder nur (1s)1 (nl)2 Zustände. Die Bindungsenergie ist E = E100 + Enlm + ΔE. Wir berechnen ΔE wieder in der Störungstheorie * + e2 =D±A ~ ~ 2 X 1 − X mit dem direkten Integral
R D = d3 x1 d3 x2 |Ψ100 (x1 )|2 |Ψnlm (x2 )|2
e2 |~x1 − ~x2 |
und dem Austauschterm
R A = d3 x1 d3 x2 Ψ100 (x1 )Ψnlm (x2 )Ψ∗100 (x2 )Ψ∗nlm (x1 )
e2 . |~x1 − ~x2 |
35.2 Das Heliumatom
449
D + A ist symmetrisch und muss daher mit der antisymmetrischen Spinfunktion (Singulett) multipliziert werden. D − A ist antisymmetrisch und muss daher mit der symmetrischen Spin-Funktion (Triplett) multipliziert werden. Der Spin-Singulett Zustand liegt stets höher in Energie, weil die Raumwellenfunktion symmetrisch ist, die Elektronen daher näher zusammen kommen und die elektrische Abstoßung stärker ist. Die Spin-Singulett Zustände heißen Para-Helium und die Spin-Triplett Zustände OrthoHelium. Bemerkungen: a) Der ursprüngliche Hamilton-Operator war spinunabhängig! Die Aufspaltung der Niveaus ist eine Folge des Pauli-Prinzips. b) Der Austauschterm verschwindet für große Abstände (große l) zwischen den Elektronen.
Kapitel 36
Quanten-Statistische Mechanik 36.1
Einführung
Ziel der Statistischen Mechanik ist es, ein makroskopisches System vieler Teilchen ohne Kenntnis der mikroskopischen Details durch eine geringe Zahl von makroskopischen Zustandsgrößen, wie Druck, Temperatur oder Magnetisierung zu beschreiben. Da ein solches System aus einer großen Zahl von Atomen oder Molekülen, besteht, sollte es im Prinzip auch möglich sein, das System durch seinen quantenmechanischen Zustand, den Mikrozustand, zu beschreiben. Allerdings ändert sich ein Mikrozustand sehr schnell mit der Zeit, etwa 1035 mal pro Sekunde, ohne dass sich der beobachtete Makrozustand ändert. Viele Mikrozustände entsprechen dem selben Makrozustand. Da die Atome oder Moleküle eines makroskopischen Systems identische Teilchen darstellen, spielt auch die Symmetrie unter Teilchenaustausch eine wesentliche Rolle. Man muss die Statistische Mechanik also korrekterweise im Rahmen der Quantentheorie formulieren. Die Theorie wird dadurch auch in mancher Hinsicht etwas einfacher, da Wahrscheinlichkeiten einen inhärenten Bestandteil der Quantenmechanik bilden. In der statistischen Quantenmechanik ist der genaue quantenmechanische Mikrozustand unbekannt. Es gibt viele Zustände, die mit den makroskopischen Vorgaben, wie z.B. einer vorgegebenen mittleren Energie der Teilchen, konsistent sind. Hier interessiert die statistische Verteilung aller möglichen Mikrozustände, die mit makroskopischen Bedingungen, konsistent, d.h. für das System zugänglich sind. Zur mathematischen Beschreibung statistischer Systeme führte J.W. Gibbs den Begriff des Ensembles ein. Ein Ensemble besteht aus der Gesamtheit der N (möglicherweise unendlich vielen) zugänglichen (reinen) Mikrozustände |Ψ1 i , |Ψ2 i , |Ψ3 i ..., |ΨN i des Systems, die alle gleichzeitig betrachtet werden. Ein Ensemble besteht also aus sehr vielen Systemen, die mikroskopisch verschieden aber makroskopisch gleich sind. Ein solches Ensemble von äquivalenten Quantenzuständen ist eindeutig durch Zahlen n1 , n2 , n3 , ..., die angeben, wie oft die zugehörige Mikro-
452
Kapitel 36. Quanten-Statistische Mechanik
zustände |Ψ1 i , |Ψ2 i , |Ψ3 i ..., |ΨN i vorkommen, festgelegt. Jeder Mikrozustand |Ψi i ist ein Vielteilchen-Zustand, der für nicht-wechselwirkende Teilchen als Superposition von Tensorprodukten von Einteilchen-Zuständen geschrieben werden kann. Ein Ensemble von N äquivalenten Quantenzuständen stellt ein quantenmechnanisches Gemisch dar, das durch den abstrakten und basisunabhängigen Dichteoperator ρ=
N P
i=1
p(i) |Ψi i hΨi |
(36.1)
beschrieben wird, d.h. durch die inkohärente Mischung von orthonormierten Mikrozuständen. Dabei ist p(i) die Wahrscheinlichkeit, dass ein Mikrozustand |Ψi i in der Verteilung anzutreffen ist. Die Dichtematrix ist das Matrixelement von ρ in einer gegebenen Basis {|φk i}, N P p(i) hφj | |Ψi i hΨi | |φk i . ρjk = i=1
Wir beschränken uns auf Systeme im Gleichgewicht, d.h. auf stationäre Zustände. Zu jedem Zeitpunkt ist das makroskopische System in einem wohldefinierten, durch eine Dichtematrix beschrieben Gemisch-Quantenzustand. Ein makroskopisches Experiment bedingt eine zeitliche Mittelung. Wir nehmen an, dass im Laufe der Zeit alle prinzipiell möglichen Quantenzustände auch wirklich eingenommen werden. In einem System im Gleichgewicht ist es möglich, die im Experiment vollzogene zeitliche Mittelung durch eine Ensemblemittelung zu ersetzen (Ergodenhypothese). Die Aufgabe der statistischen Mechanik besteht darin, die wahrscheinlichste Verteilung der Mikrozustände in einem Makrosystem zu finden und anschließend für diese Verteilung die Besetzungszahlen der einzelnen Zustände zu bestimmen. Wiederholung der wichtigsten Eigenschaften der Dichtematrix: Aus der Forderung, dass Wahrscheinlichkeiten reell, positiv und normiert sein müssen, folgt für den Dichteoperator, dass ρ† = ρ,
Sp{ρ} = 1
(36.2)
mit positiv-semi-definiten Eigenwerten. Die zeitliche Entwicklung des Dichteoperators wird durch die von-Neumann-Gleichung i~
∂ ρ(t) = − [ρ(t), H(t)] ∂t
(36.3)
beschrieben. Der Mittelwert einer Observablen A ist gegeben durch [A] = Sp{ρA}.
(36.4)
Eine eckige Klammer soll den Mittelwert über ein Ensemble bezeichnen. Wenn man nur an Mittelwerten interessiert ist, dann ist es von Vorteil in einer Basis {|φi i} zu arbeiten, in der die Dichtematrix ρ diagonal ist, X ρ= λi |φi i hφi | mit ρik = λi δik , (36.5) i
36.2 Entropie
453
wo λi die Eigenwerte der Dichtematrix sind. Sie repräsentieren die relativen Wahrscheinlichkeiten der Basiszustände |φi i. Da ρ hermitesch ist, existiert eine solche Basis. Für ein makroskopisches System ist allerdings nicht einmal die Dichtematrix bekannt. Stattdessen kennt man nur ein paar makroskopische Parameter. Diese können in verschiedener Weise gegeben sein: a) Äußere, exakt vorgegeben Parameter, wie z.B. das Volumen und die Form eines Körpers. Diese Vorgaben bestimmen den Hilbert-Raum des Systems. Ein Beispiel wäre ein System von nicht-wechselwirkenden Teilchen (ideales Gas) in einem kubischen Kasten der Seitenlänge a und unendlich hohen Potentialwänden. Wenn der Ursprung in einer der Ecken liegt, dann wird der Hilbert-Raum aufgespannt durch die Eigenfunktionen r 8 πnx x πny y πnz z Ψ n x ny nz = sin sin sin , ni = 1, 2, 3, ... a3 a a a mit Eigenwerten
π 2 }2 2 (n + n2y + n2z ) . (36.6) 2ma2 x Das Volumen V = a3 und die Form des Behälters sind in diesem Beispiel fest vorgegeben. Enx n y n z =
b) Andere Parameter des makroskopischen Systems sind nur als Mittelwerte, d. h. als Erwartungswerte gewisser makroskopischer Observablen Ga vorgegeben, [Ga ] = ga ,
a = 1, ...m .
Ein Beispiel wäre die mittlere Energie eines Systems, das sich im Kontakt mit einem Wärmebad befindet, d.h. eines Teilsystems, das mit dem Gesamtsystem in Wechselwirkung steht und Energie austauscht. Ein makroskopisches System befindet sich im Gleichgewicht, wenn die Dichtematrix stationär ist, d.h. die Wahrscheinlichkeiten für die zugänglichen Mikrosysteme zeitunabhängig sind. Entartung: In einer Basis in der ρij diagonal ist, gibt N ρii an, wie oft ein gewisser Eigenzustand im System zu finden ist, d. h. die Anzahl der linear unabhängigen Zustände zu einem gegebenen Eigenwert. In anderen Worten ρii ist die Wahrscheinlichkeit p(i), dass der Eigenwert im Gemisch zu finden ist.
36.2
Entropie
Für eine gegebene Dichtematrix ρ ist die Entropie durch S = −Sp(ρ ln ρ)
(36.7)
definiert, wobei S noch mit einer Konstanten k multipliziert sein kann. Die Entropie ist ein Maß für die Unordnung, d.h. für den Informationsgehalt der Dichtematrix. Da
454
Kapitel 36. Quanten-Statistische Mechanik
die Spur unabhängig von der Basis ist, berechnet man S am besten in der Basis {|φi i}, in der ρ diagonal ist, P P S = − ρii ln ρii = − λi ln λi . i
i
Für reine Zustände ist S = 0, da eines der λi gleich 1 ist und alle anderen verschwinden. Da 0 ≤ λi ≤ 1 folgt S ≥ 0. Für die Zufallsverteilung, mit λi = n1 für alle i, erhält man, n X 1 1 1 1 S=− = ln n, (36.8) ln = −n × ln n n n n α=1
wo n die Zahl der möglichen Quantenzustände ist und ρ die Dimension n × n besitzt. Man kann zeigen, dass dies eine obere Schranke für S darstellt. Wir finden also die Entsprechung S=0 S = ln n
maximale Information (reiner Zustand) geringste Information (Zufallsverteilung)
S ist ein Maß für die Unbestimmtheit einer Verteilung. Die Form (36.7) folgt eindeutig aus folgenden plausiblen Forderungen 1 : 1. Die Funktion S(p1 , p2 , ...pn ) ist stetig in den pk 2. Falls alle pk gleich sind, ist S( n1 , n1 , ... n1 ) eine monoton wachsende Funktion in n. 3. Wenn man die Zustände zu Teilmengen zusammenfasst, so ändert sich die Unbestimmtheit nicht. Die gesamte Unbestimmtheit ist gleich der Unbestimmtheit der Teilmengen, plus den Unbestimmtheiten innerhalb der Teilmengen nach folgender Regel (für 2 Teilmengen) (1)
(1)
(2)
S(p1 , ...pn ) = S(w1 , w2 ) + w1 S(p1 , ...pk ) + w2 S(pk+1 , ...p(2) n ) mit den jeweiligen Wahrscheinlichkeiten w 1 = p1 + . . . + pk ;
w2 = pk+1 + . . . + pN ;
(1)
pi
=
pi ; w1
(2)
pi
=
pi . w2
Als Beispiel betrachten wir die Dichtematrix für zwei unabhängige Systeme, die auf Hilbert-Räumen H1 und H2 definiert sind. Wir wollen zeigen, dass die Entropie des Gesamtsystems die Summe der beiden Einzelentropien ist. In diesem Fall ist ρ = ρ1 ⊗ρ2 auf H1 ⊗ H2 die Dichtematrix der beiden Einzelsysteme. Dann gilt S(ρ) = −Sp(ρ ln ρ) = −Sp ((ρ1 ⊗ ρ2 ) ln(ρ1 ⊗ ρ2 )) = −Sp ((ρ1 ⊗ ρ2 )(ln ρ1 ⊗ 1 + 1 ⊗ ln ρ2 )) = − [Sp(ρ1 ln ρ1 )]H1 [Spρ2 ]H2 − [Spρ1 ]H1 [Sp(ρ2 ln ρ2 )]H2 . Da Sp(ρ1 ) = Sp(ρ2 ) = 1, erhalten wir S(ρ) = S(ρ1 ) + S(ρ2 ) . Dieses Ergebnis bedeutet, dass die Entropie additiv ist. 1
E. T. Jaynes, „Papers on Probability Theory, Statistics, and Statistical Physics“, R.D. Rosenkrantz (Ed.), Reidel, Dordrecht, 1983.
36.3 Stationäre Ensembles
36.3
455
Stationäre Ensembles
Für ein stationäres Ensemble erwarten wir (wegen Gl. (36.3)), dass ∂ρ =0 ∂t
[ρ, H] = 0 ,
oder
(36.9)
wo H die Hamilton-Operator des Systems ist. Ein System, das eine stationäre Dichtematrix besitzt, befindet sich im Gleichgewicht. Da die Operatoren ρ und H vertauschen, können sie gleichzeitig diagonalisiert werden. Dies ist der Fall, wenn ρ irgendeine Funktion von H ist, ρ = ρ(H). Man kann für die Kets in Gl. (36.5) also Energie-Eigenkets wählen, die mit |ii bezeichnet seien, und die definiert sind durch H |ii = Ei |ii , H = Dann ist die Dichtematrix auch diagonal ρ=
P i
P i
Ei |ii hi| .
ρ(Ei ) |ii hi| .
Dabei ist ρ(Ei ) die Wahrscheinlichkeit mit der der Zustand |ii mit Energie Ei im Ensemble vertreten ist. Die Dichtematrix ρ ist diagonal mit den Diagonalelementen ρii = ρ(Ei ). Jedes Matrixelement ρii gehört zu einem Eigenket mit Energie Ei . Wenn es mehrere Zustände zu der selben Energie gibt, dann wird postuliert, dass jeder dieser entarteten Zustände die gleiche Wahrscheinlichkeit hat. Es gibt verschiedene Typen solcher stationären Ensembles, die sich jeweils durch die Wahl von ρ(Ei ) unterscheiden. Wir wollen einige dieser Ensembles genauer betrachten. 1. Zufallsensemble: Bei Anwendungen in der statistischen Mechanik führt man bei der Definition der Entropie noch einen konstanten Faktor k ein, S = −kSp(ρ ln ρ) ,
(36.10)
dessen Bedeutung später klar wird. Beim Zufallsensemble sind alle Energiezustände gleich wahrscheinlich. Alternativ wird ein Zufallsensemble durch die Forderung definiert, dass die Entropie maximal sein soll, ohne weitere physikalische Nebenbedingungen. D.h. δS = 0 =⇒ −δSp[ρ ln ρ] = 0
mit der Normierungsbedingung
Spρ = 1 .
(36.11)
Da ρ in der Energiebasis diagonal ist, gilt für die Variation δS bei ρ → ρ + δρ δS = kδ
P j
=k
P j
[ρjj ln ρjj ] = k
P
[δρjj ln ρjj + ρjj δ ln ρjj ]
j
[δρjj ln ρjj + δρjj ] = k
P kj
δρjj [ln ρjj + 1].
456
Kapitel 36. Quanten-Statistische Mechanik
Die Variationen müssen die Bedingung Gl. (36.11) erfüllen. Das lässt sich mit der Methode der Lagrangeschen Multiplikatoren erreichen. Man variiert δ
P
[ρjj ln ρjj + λρjj ] = 0
j
ohne Nebenbedingungen. Dann gilt P
δρjj [ln ρjj + 1 + λ] = 0.
j
Dies Bedingung kann für beliebige δρ nur erfüllt werden, wenn ln ρjj + 1 + λ = 0 oder ρjj = exp[−1 − λ] = const. (unabhängig von j) Der Parameter λ wird mit Hilfe der Nebenbedingung Spρ = 1 bestimmt Spρ =
n P
ρjj = nρjj = 1.
j=1
Ergebnis ρjj =
1 n
oder
ρ=
1 1, n
genau wie oben für die Zufallsverteilung. Wir haben die Zufallsverteilung also durch die Forderung abgeleitet, dass die Entropie maximal sein soll, wenn keine physikalischen Nebenbedingungen bestehen. 2. Das mikrokanonische Ensemble: Das ist definiert durch die Forderung, dass die Entropie maximal sein soll unter der Nebenbedingung, dass für alle Elemente des Ensembles die Energie im Intervall [E, E + Δ] mit Δ E liegt, d.h. dass ρii 6= 0 nur für die Ei , die in diesem Intervall liegen. Man erhält dieselben Gleichungen wie im Beispiel 1, bloß dass jetzt die Summen nur über den erlaubten Energiebereich laufen. Es folgt also, dass alle Energieeigenwerte mit der selben Wahrscheinlichkeit p(Ei ) auftreten, ρ=
P i
p(Ei ) |ii hi| mit p(Ei ) =
λ für E < Ei < E + Δ 0 sonst.
Die Konstante λ wird so gewählt, dass Spρ = 1. Damit wird P P0 p(Ei ) |ii hi| |ii hi| λ i = mit E < Ei < E + Δ ρ= 0 Sp [p(Ei ) |ii hi|] λSp [|ii hi|] P0 P0 |ii hi| = 1. mit Ω(E) = Sp0 |ii hi| = Ω(E)
.
36.3 Stationäre Ensembles
457
P0
und Sp0 bedeutet dass nur solche Indizes zu nehmen sind, für die E < Ei < E + Δ. Dann ist Ω(E) = Sp0 |ii hi| die Zahl der Mikrozustände im Ensemble die im Intervall E < Ei < E + Δ liegen. Die Entropie eines solchen Systems wird S(E) = −kSp(ρ ln ρ) = k ln Ω(E) ,
(36.12)
wo wir das Ergebnis (36.8) verwenden konnten, da alle Zustände mit gleicher Wahrscheinlichkeit auftreten. Die Formel (36.12) ist dieselbe, wie die Boltzmannsche Formel in der klassischen statistischen Mechanik. Der Hamilton-Operator und damit die Entropie hängen auch noch von äußeren Variablen ab, wie dem Volumen V des Systems und die Zahl N der Teilchen des Systems ab, S = S(E, N, V ) bzw. E = E(S, V, N ). Thermodynamik: Man erhält die Thermodynamik aus (36.12) wenn man den Grenzwert N → ∞ bildet, 1 1 ˆ E, ˆ V ), 1 E → E, ˆ S(E, V, N ) → S( V → Vˆ N N N
(und dieser Grenzwert existiert). Die aus der Entropie S(E, N, V ) abgeleitete Thermodynamik ist genau die gleiche, wie im klassischen Fall. Die Temperatur ist definiert durch ∂ ln Ω ∂S 1 = −k , = T ∂E N,V ∂E N,V die innere Energie durch der Druck durch
U (S, V, N ) ≡ E(S, V, N ) , P =−
∂U ∂V
und das chemische Potential durch μ=
∂U . ∂N
Das chemische Potential stellt die Energieerhöhung des Systems bei Zuführung eines weiteren Teilchens dar. Mit diesen Definitionen gilt für das Differential dU (S, V, N ) = T dS − P dV + μdN. Mit dieser Formel lassen sich obige Definitionen begründen. Das mikrokanonische Ensemble eignet sich dazu, die thermodynamischen Definitionen zu motivieren, aber ist für Anwendungen weniger geeignet. 3. Kanonisches Ensemble: Wir betrachten den Fall, dass das statistische System mit einem großen thermischen Reservoir, dessen Temperatur T konstant gehalten wird, in Wechselwirkung steht. Ein Energieaustausch zwischen dem System und dem Reservoir sei erlaubt unter der Bedingung, dass die mittlere Energie des Systems einen vorher festgelegten Wert annimmt. Diese gemittelte Energie ist durch die Temperatur T bestimmt. Ein kanonisches Ensemble ist definiert durch die Bedingung, dass die Energie des Ensembles im Mittel
458
Kapitel 36. Quanten-Statistische Mechanik
gegeben ist, während die anderen makroskopischen Größen, wie Volumen oder Teilchenzahl fest vorgegeben sind. Sei U = [H] die mittlere Energie des Ensembles, die sogenannte innere Energie, U = Sp{ρH}. Wir suchen die Dichtematrix ρ, die die Entropie S bei festgehaltenem U , d.h. unter der Nebenbedingung n X
Sp{ρH} = U = konst. und
ρii = 1
(36.13)
i=1
maximiert. Nach Lagrange maximiert man das Funktional S˜ = −Sp[ρ ln ρ + βρH + ξρ]) =−
N X
ρii [ln ρii + βEi + ξ]
i=1
ohne Nebenbedingungen, wo β und ξ Lagrangesche Multiplikatoren sind. Zur Vereinfachung der späteren Ergebnisse schreiben wir ξ = −(1 + ln A). Die Extremalbedingung ergibt dann n X δ S˜ = δρii [(ln ρii + 1) + βEi − (ln A + 1)] = 0. i=1
Für beliebige Variationen ist dies nur möglich, wenn
[ln ρii + βEi − ln A] = 0 oder
ρii = A exp(−βEi ).
(36.14)
Die Konstante A wird durch die Nebenbedingung Spρ = 1 festgelegt mit dem Ergebnis exp(−βEi ) exp(−βEi ) ρii = P = , n Z exp(−βEj )
(36.15)
j=1
wo
Z=
n P
exp(−βEj )
(36.16)
j=1
die kanonische Zustandssumme ist. Die Konstante β bestimmt sich aus der Nebenbedingung [H] = U = konstant. In einem kanonischen Ensemble gibt ρii direkt die relative Besetzungszahl für einen Energieeigenzustand zur Energie Ei an. Bei entarteten Energieeigenwerten ist über die Zustände mit derselben Energie zu summieren. Mit diesem Ergebnis lässt sich der Ensemble-Mittelwert einer Observablen Q berechnen,
[A] = Sp(ρQ) =
n P
Qi exp(−βEi )
i=1
Z
,
36.3 Stationäre Ensembles
459
wo Qk die Matrixelemnte von Q in der Energie-Basis sind. Für die inneren Energie, d.h. den Mittelwert der Energie erhält man z.B.
U = [H] =
n P
Ei e−βEi
i=1 n P
i=1
e−βEi
=−
n X ∂ ∂ e−βEi ) = − (ln Z). (ln ∂β ∂β i=1
(36.17)
Der Parameter β dient dazu, die Konstanz der mittleren Energie sicherzustellen. Wir werden sehen, dass β mit der inversen Temperatur identifiziert werden kann, β≡
1 . kT
(36.18)
Für die Entropie erhält man S = −kSp (ρ ln ρ) = −k = −k
n X exp(−βEi )
n X exp(−βEi ) i=1
Z
i=1
Z
(−βEi ) − ln Z
= k ln Z + kβU = k ln Z +
1 U. T
[ln exp(−βEi ) − ln Z]
(36.19)
Um die Verbindung mit der Thermodynamik herzustellen definieren wir die freie Energie F ≡ U − T S = −kT ln Z. (36.20)
Die innere Energie ist eine Funktion der Entropie, des Volumens und der Teilchenzahl U = U (S, V, N ). Die Thermodynamikgröße F hängt dagegen ab von Temperatur, Volumen und Teilchenzahl F = F (T, V, N ). Da T konstant ist, hat die freie Energie F ein Minimum, wenn die Entropie Z ein Maximum hat. Die freie Energie ist die Legendre-Transformation bezüglich der aktiven Variablen S F (T, V, N ) = (U (S, V, N ) − T S)|S=S(T,V,N ) , wo T =
∂U ∂S V,N
(36.21)
die neue Variable ist und S(T, V, N ) aus dieser Gleichung berechnet wird. Auf diese Weise haben wir die Entropie-Variable S gegen die, in der Themodynamik verwendete Temperatur-Variable eingetaucht. Die Umkehrtransformation lautet U (S, V, N ) = (F (T, V, N ) − T S)|T =T (S,V,N ) ∂F Bedingungen ∂V =
∂U ∂V ;
∂F ∂T V,N . Die passiven Variablen V und N erfüllen die ∂F ∂U ∂U ∂U = ∂N ∂N . Wenn wir ∂V mit dem Druck und ∂N mit dem
mit der aktiven Variablen S =
460
Kapitel 36. Quanten-Statistische Mechanik
chemischen Potential identifizieren, dann können wir alle thermodynamischen Größen aus F (T, V, N ) berechnen, ∂F ∂F ∂F , P = − , μ = − . (36.22) S=− ∂T V,N ∂V T,N ∂N T,v
Wir wollen jetzt zeigen, dass die Temperaturdefinitionen T = ∂U ∂S V,N und β = äquivalent sind. Dazu betrachten wir Gl. (36.20) und Gl. (36.17)
1 kT
∂ ∂β ∂ ∂F = (−kT ln Z) = −k ln Z + kT ln Z ∂T ∂T ∂T ∂β −1 U = −k ln Z − kT U = −k ln Z − = −S kT 2 T
wie oben in Gl. (36.22). Ensemble von harmonischen Oszillatoren Die Konstante β hängt über die mittlere Energie [H] mit der Temperatur des Wärmebades zusammen. Wir wollen dies am Beispiel eines kanonischen Ensembles, dessen Elemente jeweils aus einzelnen eindimensionalen harmonischen Oszillatoren bestehen, demonstrieren. Der Hilbert-Raum wird durch die Eigenvektoren {|ji} des HamiltonOperators 1 P2 + mω 2 X 2 H= 2m 2 mit Energie-Eigenwerten 1 Ej = ( + j)}ω, 2
j = 0, 1, ...∞
gebildet (s. Kapitel 23). Die Zustandssumme für dieses System berechnet sich zu Z = Sp exp(−βH) =
∞ P
exp(−βEj )
j=0
=
∞ 1 }ω P n exp[−β(j + )}ω] = exp[−β ] (exp[−β}ω]) . 2 2 j=0 j=0 ∞ P
Der zweite Faktor ist eine geometrische Reihe, die aufsummiert werden kann Z=
exp(−β }ω 1 2 ) = . 1 − exp(−β}ω) exp(β }ω ) − exp(−β }ω 2 2 )
Die gemittelte Energie ist nach Gl. (36.17) }ω ∂ }ω exp(β }ω 2 ) + exp(−β 2 ) (ln Z) = }ω ∂β 2 exp(β }ω 2 ) − exp(−β 2 ) }ω }ω = coth(β ) . 2 2
U = [H] = −
(36.23)
36.3 Stationäre Ensembles
461
Um den klassischen Limes zu untersuchen, entwickeln wir für kleine } [H] =
1 }ω + (β}ω)2 + ... , β}ω 12
wo wir die Taylor-Entwicklung, coth(β
}ω 2 1 )= + β}ω + O β 2 , 2 β}ω 6
verwendet haben. Für } → 0 wird also
[H] =
1 . β
Wir definieren die Temperatur T als mittlere Energie des kanonischen Ensembles im klassischen Limes, d.h. 1 β= , kT wo k die Boltzmann-Konstante ist (k = 1.380658 × 10−23 Joule/Kelvin), die von den gewählten Einheiten abhängt und experimentell bestimmt werden muss. Diese Zuordnung gilt für allgemeine kanonische Ensembles nicht-wechselwirkender Teilchen. Die Rechnung lässt sich auf N harmonische Oszillatoren mit demselben ω, die nicht miteinander wechselwirken, verallgemeinern. Der Vielteilchen-Hamilton-Operator ist dann der einer Summe von unabhängigen einfachen harmonischen Oszillatoren. Die Eigenvektoren |n1 , n2 , ...nN i und Eigenwerte N2 + n1 + ... + nN werden durch die Besetzungszahlen nj ∈ N repräsentiert. Die zugehörige Zustandssumme ist 1 1 1 exp[−β(n1 + )}ω] exp[−β(n2 + )}ω]... exp[−β(nN + )}ω] 2 2 2 n1 =0n2 =0 nN =0 ∞ P ∞ ∞ P N P n ... exp[−β(n1 + n2 + ... + nN )}ω] = [Z(1)] = exp(−β ) 2 n1 =0n2 =0 nN =0
Z(N ) =
∞ ∞ P P
...
∞ P
Die mittlere Energie des Ensembles wird
U (N ) = [U (1)] U = [E] = −
N
∂ }ω }ω (ln Z) = N U (1) = N coth(β ). ∂β 2 2
(36.24)
3. Großkanonisches Ensemble: Oft ist neben der Energie auch die Teilchenzahl eines Ensembles nicht genau, sondern nur im Mittel bekannt. Dies ist bei einem Gas der Fall, das mit einem sehr großen Reservoir Energie und Teilchen austauschen kann. Die Teilchenzahl eines Ensembles wird dargestellt durch einen Operator N mit Eigenwerten N = 0, 1, 2, .... Bei nichtrelativistischen Energien ist die Teilchenzahl konstant. Der Operator N vertauscht daher mit dem Hamilton-Operator [N , H] = 0 :
462
Kapitel 36. Quanten-Statistische Mechanik
Die Dichtematrix kann somit gleichzeitig diagonal in N und H gewählt werden. Wir maximieren wieder die Entropie δS = δ(Spρ ln ρ) = 0 unter den Nebenbedingungen SpHρ = [E],
SpN ρ = [N ],
Spρ = 1.
Dann erhalten wir wie oben P δρkk [ln ρkk + βEk + μnk − ln A)] = 0 k
mit Lösung
ρkk = A exp(−βEk − μnk ),
(36.25)
wo β, μ, A = 1/Z Konstante sind, die durch die Nebenbedingungen zu bestimmen sind. Die Konstante A = 1/Z wird durch die Nebenbedingung Spρ = 1 festgelegt, i X h e−(βEk −μnk ) , (36.26) Z = Sp e−(βEk −μnk ) = wobei
P
{nk }
{nk }
bedeutet, dass über alle Mengen {nk } zu summieren ist, die Σ[nk ] = [N ]
erfüllen (z.B. für Bosonen nimmt jedes nk die Werte 0, 1, 2, ...an). ρkk =
exp(−λEk − μnk ) Z
Ein durch eine Dichtematrix der Form Gl. (36.25) gegebenes Ensemble heißt großkanonisch. Mit diesem Ergebnis lässt sich wieder der Ensemble-Mittelwert einer Observablen A berechnen, n P Aik exp(−λEk − μnk ) [A] = sp(ρA) = i=k , (36.27) Z wo Aik die Matrixelemente von A in der Energie-Basis sind. Die Wahl des Ensembletyps (mikrokanonisch, kanonisch, großkanonisch) scheint zum Teil willkürlich. Es kann aber gezeigt werden, dass im thermodynamischen Limes alle drei Beschreibungen die gleichen Ergebnisse liefern.
36.4
Systeme von nicht-wechselwirkenden Teilchen
Im Gegensatz zur klassischen Mechanik sind identische Teilchen in der Quantenphysik absolut ununterscheidbar. Der Hamilton-Operator muss daher invariant unter dem Austausch von je zwei identischen Teilchen sein. Aus der Symmetrie der HamiltonFunktion folgt, dass die Zustände bzw. Wellenfunktionen entweder symmetrisch oder antisymmetrisch unter Teilchenaustausch sein müssen, d. h. Bose- oder Fermistatistik erfüllen müssen. Wir betrachten den Fall eines idealen Quantengases, das aus N
36.4 Systeme von nicht-wechselwirkenden Teilchen
463
(N → ∞) identischen Bosonen oder Fermionen besteht, deren gegenseitige Wechselwirkung vernachlässigt werden kann. Der Vielteilchen-Hamilton-Operator besteht dann aus einer Summe von N gleichen Einteilchen-Hamilton-Operatoren H = H1 + H2 + ...HN . Als Beispiel kann das oben diskutierte System von N unabhängigen harmonischen Oszillatoren dienen. Zu jedem Einteilchen-Hamilton-Operator Hα gehören die Eigenvektoren |ii mit i = 1, 2, ..∞ und Eigenwerte Ei Hα |ii = Ei |ii
für alle α = 1, 2, ...N .
Der Vielteilchen-Hilbert-Raum in dem die Mikrozustände leben ist dann das direkte Produkt der Einteilchen-Hilbert-Räume. Wir verwenden einen Index (σ) um einen bestimmten Mikrozustand zu bezeichnen. Die Eigenvektoren Ψ(σ) ± = E (σ) (σ) (σ) bestehen aus normierten, vollständig symmetrisierten (|...i+ ) n0 , n1 , ...n∞ ±
bzw. antisymmetrisierten (|...i− ) Tensorprodukten von Eigenzuständen von Hα mit (σ)
(σ)
(σ)
n Faktoren |1i,... ni Faktoren |ii , .... Die Eigenvektoren |0i, n1 Faktoren E 0 (σ) (σ) (σ) (σ) Ψ = n0 , n1 , ...n∞ von H sind durch einen Satz von Besetzungszahlen ± (σ)
(σ)
(σ)
±
σ = {n0 , n1 , ...n∞ } eindeutig charakterisiert. Man spricht von der BesetzungszahlDarstellung in Bezug auf den Hamilton-Operator H. Es gilt E E ∞ P P (σ) (σ) H Ψ(σ) = E (σ) Ψ(σ) , E (σ) = nk Ek , N (σ) = nk . (36.28) ±
Dabei ist
(σ) ni
±
k=1
k
E (σ) (σ) (σ) die Zahl der Teilchen in n0 , n1 , ...n∞ , die sich im Ein-Teilchen±
Zustand |ii befinden. Die gesamte Teilchenzahl des mit (σ) bezeichneten Mikrosytems P (σ) (σ) ist N (σ) = nk . Für Fermionen können die ni nur die Werte 0 und 1 annehmen, für Bosonen sind alle Werte zwischen 0 und ∞ erlaubt. Die Permutationssymmetrie führt (wie beim Helium-Atom) auch im einfachen System eines freien Quantengases zu dramatischen Effekten. Diese lassen sich am einfachsten im Rahmen des großkanonischen Ensembles untersuchen. Bei der Berechnung der großkanonischen Zustandssumme wird P (σ) zuerst für feste Teilchenzahl N (σ) = nk über alle zugänglichen Zustände und dann k
über alle Teilchenzahlen N (σ) = 0, 1, ...∞ summiert, ∞ P Q P (σ) 0 Z= exp[−βni (Ei − μ)] . N (σ) =0 σ
P0
i
bedeutet, dass über alle Sätze von Besetzungszahlen {n(σ) } mit Gesamtteilchenzahl P (σ) N (σ) = nk zu summieren ist. Die Summe über alle N (σ) hat zur Konsequenz, dass σ
k
(σ)
diese Einschränkung bei der Summe über {nσ } wegfällt und über alle ni unabhängig summiert werden kann. Wir können daher den Index (σ) auch weglassen, ∞Q P exp[−βni (Ei − μ)]. (36.29) Z= ni i
Für Bosonen gehen die Summen über ni von 0 bis ∞, für Fermionen nur von 0 bis 1.
464
Kapitel 36. Quanten-Statistische Mechanik
a) Bose-System: Die Wellenfunktionen eines Quantengases von Bosonen sind symmetrisch unter Permutationen, d.h. sie bleiben gleich. Ein stationärer Mikrozustand wird vollständig durch die Besetzungszahlen ni beschrieben. Die Zahl der Teilchen N in einem solchen Zustand ist nicht exakt, sondern nur im Mittel vorgegeben. In der großkanonische Zustandssumme können Summation und Produkt vertauscht werden Z=
∞Q P ni i
exp[−βni (Ei − μ)] =
∞ QP
i ni =0
exp [−βni Ei − μni ] .
Für die Besetzungszahlen gibt es keine Einschränkungen, so dass die Summe über nk von Null bis unendlich reicht. Jeder Zustand kann mit 1, 2, 3, ... Bosonen besetzt sein. Die Summe bildet eine geometrische Reihe und kann aufsummiert werden Q
Z=
i
1 . exp [−βEi − μ] − 1
(36.30)
Dies sieht man wie folgt (mit fi = −βEi − μ): Q i
Q Q 1 = 1 + exp fi + (exp fi )2 + ... = [1 + exp fi + 2 exp fi + ...] 1 − exp fi i i ∞ QP exp [ni fi ] . = i ni =0
Die Zustandssumme ist gleich dem Produkt der einzelnen großkanonischen Zustandssummen. Aus Gl. (36.30) folgt: ln Z =
P i
ln
1 . exp [−βEi − μ] − 1
(36.31)
Die mittleren Besetzungszahlen berechnet sich nach Gl. (36.27) zu ∞ ∞ 1 X X ...ni e−β(n1 E1 −μn1 ) e−β(n2 E2 −μn2 ) ...e−β(ni Ei −μni ) ... Z n =0 n =0 1 2 ∞ ∞ ∞ X 1 X X 1 ∂Z = ...ni exp − β(nj Ej − μnj ) = Z n =0 n =0 Z ∂βEi j
[ni ] =
1
2
∂ ln Z 1 =− = . ∂βEi exp [βEi + μ] − 1
Die Konstante μ entspricht im thermodynamischen Limes dem chemischen Potential. Sie berechnet sich aus der Bedingung [N ] =
P i
[ni ] =
P i
1 . exp [βEi + μ] − 1
(36.32)
36.4 Systeme von nicht-wechselwirkenden Teilchen
465
b) Fermi-System: Die Besetzungszahlen können wegen des Pauli-Prinzips nur 0 und 1 sein. Analog zum Bose-System finden wir ∞ 1 1 X P P .... exp −β (nj Ej − μnj ) . (36.33) Z= n1 =0n2 =0
j
Die Zustandssumme lässt sich, ähnlich wie für Bosonen, in die Form Q Z = [1 + exp(−βEi − μ)] i
bringen. Die mittlere Besetzungszahl im Zustand |ii ist ∞ 1 1 X P 1 P ....ni exp −β (nj Ej − μnj ) . [ni ] = Z n1 =0n1 =2 j =−
∂ ln Z 1 = . ∂(βEi ) exp [βEi + μ] + 1
Die Konstante μ berechnet sich wie bei den Bosonen aus der Bedingung X [ni ] = [N ] Die mittlere Zahl der Teilchen mit Energie Ei ist für beide Statistiken von der gleichen Form 1 ∂ ln Z = (36.34) [ni ] = − ∂(βEi ) exp [βEi + μ] + mit = +1, −1 für Bose- und Fermistatistik respektive. Es sei erwähnt, dass für unterscheidbare Teilchen, wie klassische Massenpunkte, die Boltzmann-Statistik gilt. Sie gilt auch approximativ, für Gase von Molekülen mit hohem Spin, die durch ihre Spinorientierung unterschieden werden können. In diesem Fall ist in Formel (36.34) = 0 zu setzen. Das Plancksche Strahlungsgesetz: Als Beispiel betrachten wir ein ideales Gas von masselosen Bosonen in einem kubischen Kasten mit Volumen V = L3 und periodischen Randbedingungen. Die Wellenlösungen für die einzelnen Moden sind gegeben durch φk (~x, t) = √ mit
1 ~ e−i(ωk t−k∙~x) 2ωk
~k = 2π ~n, ωk = |~k| ≡ k; ni = 1, 2, ... L c Diese Formel gilt nicht-relativistisch z.B. für Phononen, wo c die Schallgeschwindigkeit ist, und relativistisch z.B. für Photonen, wo c die Lichtgeschwindigkeit ist. Wir behandeln im Folgenden nur die Photonen. Der Hamilton-Operator der freien Photonen folgt
466
Kapitel 36. Quanten-Statistische Mechanik
aus der Quantenelektrodynamik (s. nächstes Kapitel). Er ist gegeben durch die Summe der Hamilton-Operatoren der einzelnen Moden X X Ek A~† A~k,λ = Ek N~k,λ , (36.35) H= k,λ
~ k,λ
wo
~ k,λ
N~k,λ = A~† A~k,λ k,λ
der Teilchenzahl-Operator zum Wellenvektor ~k und zur Polarisation λ ist. Der Hamilton-Operator sieht aus wie der von einem System von unendlich vielen Oszillatoren (bis auf die fehlende Nullpunktsenergie). Jeder Wellenzahl und jeder Polarisation entspricht ein Oszillator. Die Energie der Photonen hängt mit der Frequenz über E = }ω zusammen und der Impuls des Photons mit dem Wellenzahlvektor über p~ = }~k. Der Hilbert-Raum der Mikrozustände ist der Produktraum der einzelnen Moden, so dass die Zustandssumme gegeben ist durch Q Z = Zk . k
Wir betrachten den Logarithmus von Z ln Z =
∞ X ∞ X ∞ X
ln Znx ,ny ,nz .
nx =1 ny =1 nz =1
Für makroskopische Systeme geht L → ∞ und die ~k-Intervalle sind so klein, dass wir annehmen können, sie seien kontinuierlich verteilt mit dni = L π dki . Dann wird ln Z =
R∞ R∞ L3 R∞ dkx dky dkz ln Z(k). 3 π 0 0 0
Wenn die Zustandssumme, wie meist der Fall, nur von |~k| abhängt, kann man über den gesamten Raum integrieren ln Z = V
R d3 k R 4πk 2 dk 1 R∞ ω 2 dω ln Z(k) = V ln Z(k) = V 3 2 ln Z(ω) . 3 3 (2π) (2π) c 0 (2π)2
Mit der großkanonischen Zustandssumme aus Gl. (36.31) wird ln Z = V
1 R ω 2 dω −1 2 ln [1 − exp(−β(}ω − μ))] . c3 (2π)2
Für die Phasenraumintegrale der gemittelten Teilchenzahl N und der gemittelter Energie erhält man aus Gl. (36.34) ∂ ln Z 1 1 R ω 2 dω =V 3 2 2 ∂μ c (2π) exp(β(}ω − μ)) − 1 ∂ ln Z ω 1 R ω 2 dω [E] = − =V 3 2 . 2 ∂β c (2π) exp(β(}ω − μ)) − 1
[N ] = T
36.4 Systeme von nicht-wechselwirkenden Teilchen
467
Bosonen, die keine erhaltene Ladung besitzen, wie Photonen oder Phononen, können erzeugt und vernichtet werden. Damit können die Besetzungszahlen ni = 0, 1, 2, ... jeweilsPunabhängig voneinander alle Werte zwischen 0 und ∞ annehmen. Die Bedingung [ni ] = [N ] kann nicht mehr gestellt werden und das chemische Potential μ ist gleich Null. Außerdem ist zu beachten, dass Photonen in zwei Polarisationszuständen (z.B. links- und rechtshändige Polarisation) vorkommen, so dass die obigen Formeln noch mit einem Faktor 2 multipliziert werden müssen. Damit erhalten wir für die mittlere Zahl der Photonen pro Volumeneinheit im Frequenzintervall ω bis ω + dω dnω =
1 1 ω 2 dω c3 π 2 exp(β}ω − 1)
und für die Energiedichte deω = }ωdnω =
1 ω 2 dω 1 . 3 2 c π exp(β}ω − 1)
Dies ist das Plancksche Strahlungsgesetz für die Energiedichte als Funktion der Frequenz für Hohlraumstrahlung im thermischen Gleichgewicht.
Kapitel 37
Quantenfelder 37.1
Felder und Teilchen
In der klassischen Physik besteht eine fundamentale Gegensätzlichkeit (Dichotomie) zwischen Teilchen als Massenpunkt und dem elektromagnetischen Feld. Der Feldbegriff beinhaltet eine kontinuierliche Beschreibung, während der Teilchenbegriff das diskrete, irreduzible Quantum von Masse und Energie darstellt. Daraus folgt, dass die Phänomene der klassischen Physik in zwei getrennte Bereiche zerfallen, die Wellenphänomene der Felder und die Newtonsche Mechanik der Massenpunkte. Wenn auch durch die Variationsformulierung von Euler, Lagrange und Hamilton eine gewisse Vereinheitlichung des mathematischen Formalismus erreicht wurde, bleiben Feld und Teilchen in der klassischen Physik komplementär und inkommensurabel. Diese fundamentale Dichotomie manifestiert sich auch in der Quantenmechanik. Das Elektron ist ein Teilchen, das durch die Schrödinger-Gleichung beschrieben wird und das elektromagnetische Feld ist ein Feld, wenn es sich auch manchmal wie ein Teilchen (Photon) verhält. Es ist eine interessante Beobachtung, dass Photonen in elementaren Büchern über Quantenmechanik eine prominente Rolle einnehmen, während sie in den fortgeschrittenen Büchern kaum vorkommen. Der Grund ist, dass sich die masselosen Photonen mit Lichtgeschwindigkeit bewegen. Es existiert keine Wellenfunktion für Photonen. Historisch gesehen geht der Begriff des Lichtquants oder Photons zurück auf die Erklärung des Planckschen Strahlungsgesetzes durch Einstein. Planck hatte erkannt, dass sich die Daten der Hohlraumstrahlung erklären ließen, wenn die Quellen der Strahlung unabhängige Oszillatoren der Energie }ω wären. Er nahm an, dass die Energiequanten nicht von den Eigenschaften der Strahlung selbst, sondern von den intrinsischen Eigenschaften der Moleküle, die Strahlung nur in diskreten Quanten absorbieren oder abstrahlen können, herrühren. Planck postulierte nur die Quantisierung der Energien der molekularen Oszillatoren in der Wand des Hohlraums. Dagegen setzte Einstein die Lichtquanten-Hypothese. In seiner Nobelpreisarbeit von 1905, zeigte Einstein, dass die Hohlraumstrahlung in ihren thermodynamischen Eigenschaften aus unabhängigen Energiequanten zu bestehen scheint. Gleichzeitig lieferte Einstein
470
Kapitel 37. Quantenfelder
mit Hilfe der postulierten Photonen eine Erklärung des Photoeffekts. Erst mehr als zwanzig Jahre später mit der Geburt der Quantenmechanik konnte eine quantitative Analyse dieser Effekte durchgeführt werden. Es stellte sich allerdings heraus, dass dazu gar keine Photonen benötigt wurden. Es genügt die semiklassische Näherung, in der massive Teilchen im Rahmen der Quantenmechanik und das elektromagnetische Feld in der Maxwell-Theorie behandelt werden. Im Rahmen dieser Theorie ließ sich auch der photoelektrische Effekt 1 und die Compton-Streuung semiklassisch behandeln. Einzig die spontane Emission von Licht blieb rätselhaft. Im Rahmen der üblichen Quantenmechanik wird ein Atom, das sich in einem angeregten Zustand befindet, für immer in diesem Zustand bleiben, da dieser Zustand stationär ist. Um das Phänomen der spontanen Emission zu verstehen, muss man zu einer vollständigen Beschreibung der Wechselwirkung der Atome mit der elektromagnetischen Strahlung gelangen, die auch die Quantisierung des notwendigerweise relativistischen Strahlungsfeldes beinhaltet. Die Existenz von Photonen folgt notwendigerweise erst aus der Quantisierung der Maxwell-Theorie. Für die Väter der Quantenmechanik lag es nahe, den Formalismus der kanonische Quantisierung auch auf Felder anzuwenden. Schon 1926, in einer der ersten Arbeiten zur Quantenmechanik, präsentierten Born, Heisenberg und Jordan 2 die Quantentheorie des elektromagnetischen Feldes. Der Einfachheit halber vernachlässigten sie den Spin des Feldes und betrachteten nur eine Zeit- und eine Raumdimension, eine Näherung, die die wichtigsten Ergebnisse nicht berührt. Mit Hilfe der kanonischen Vertauschungsrelationen interpretierten diese Autoren die Fourier-Koeffizienten des Feldes als Erzeugungs- und Vernichtungsoperatoren von Photonen. Wenig später, beginnend mit dem Jahr 1928, entwickelte Dirac die Theorie der Quantisierung des massiven Spin-1/2-Feldes, das Elektronen und Positronen zugeordnet werden kann. Lange Zeit glaubte man, dass Dirac eine relativistische Verallgemeinerung der Schrödinger-Gleichung gefunden hätte, die ein einzelnes Elektron beschreibt. Die Welt war immer noch zweigeteilt. Sie bestand auf der einen Seite aus massiven Teilchen wie die Elektronen, Protonen und Pi-Mesonen, und auf der anderen Seite aus dem elektromagnetischen Feld. Heute wissen wir, dass in einem weiten Gültigkeitsbereich alle Elementarteilchen, seien sie massiv oder masselos, durch Quantenfelder beschrieben werden. Quantenfelder bilden die Grundstrukturen des Universums. Teilchen werden durch Eigenzustände von Energie, Impuls und Drehimpuls des Quantenfeldes definiert. Diese „Teilchen“ unterscheiden sich in ihren Eigenschaften wesentlich von klassischen Massepunkten: Sie können erzeugt und vernichtet werden, sie sind ununterscheidbar, sie sind nicht streng lokalisierbar und manifestieren sich im Messprozess. Wir wollen im folgenden Abschnitt die Quantisierung eines Skalarfeldes behandeln, das beispielsweise die Pi-Mesonen und das Higgs-Boson beschreibt. Der Formalismus kann auch als Modell für die Quantisierung des elektromagnetischen Feldes dienen, wenn die Masse des Feldes Null gesetzt wird. Damit geht allerdings jegliche Information über die Polarisation und den Spin verloren. 1 2
G. Wentzel, Z.Physik 41(1927), 828 M. Born, W. Heisenberg, und P. Jordan, Z. f. Physik 35 (1926), 557
37.2 Quantisierung von Feldern
37.2
471
Quantisierung von Feldern
Wir betrachten zunächst ein klassisches, freies, reelles Skalarfeld φ(x) mit x = xμ = (x0 , ~x), dessen lorentzinvariante Lagrangedichte gegeben ist durch L(φ, ∂ μ φΦ) =
1 1 ∂μ φ(x)∂ μ φ(x) − κ2 φ(x)2 . 2 2
(37.1)
Das Wirkungsintegral über die vierdimensionale Raum-Zeit ist definiert als Z S(Ω) = d4 xL(φ, ∂ μ φ) . Ω
Der Parameter κ mit der Dimension Länge −1 hängt, wie wir sehen werden, in der quantisierten Theorie mit der Masse m des Quantenfeldes zusammen über m = κc/}. Die Größe λ = 1/κ wird als Compton-Wellenlänge bezeichnet. Eine Wechselwirkung des Feldes φ mit sich selbst oder mit anderen Feldern sei vernachlässigt. Wenn man φ(x) als klassisches Feld betrachtet, dann folgen aus dem Variationsprinzip δS = 0 die Euler-Lagrange-Gleichungen, ∂L ∂L − ∂μ =0, ∂(∂μ φ) ∂φ oder
(∂μ ∂ μ + κ2 )φ(x) = 0 .
(37.2)
Dies ist die Klein-Gordon-Gleichung für ein klassisches Skalarfeld. Eine beliebige reelle Lösung dieser Gleichung kann in ein Fourier-Integral nach ebenen Wellen entwickelt werden Z h i d3 k ~k)e−ikx + a∗ (~k)eikx φ(x) = a( (37.3) (2π)3 2ωk mit q kx = ωk x0 − ~k ∙ ~x und ωk = ~k 2 + m2 > 0 .
Das Integrationsmaß ist lorentzinvariant, da
d3 k d4 k = 2πδ(k 2 − m2 )θ(k 0 ) . (2π)3 2ωk (2π)4 Für das kanonisch konjugierte Impulsfeld erhält man aus Gl. (37.1) ∂L = ∂0 φ(x) ∂(∂ 0 φ) Z i h d3 k iω a(~k)e−ikx − a∗ (~k)eikx . = 3 (2π) 2ωk
Π(x) =
(37.4)
Wir wissen aus Kapitel 12, dass mit der Lagrangefunktion L ein Energie-Impuls-Tensor Tμν und, auf Grund der Translationsinvarianz, ein erhaltener 4-Impuls verbunden ist, R R ∂L pν = d3 xT0ν = d3 x −g0ν L + ∂ν φ(x) . (37.5) ∂(∂0 φ)
472
Kapitel 37. Quantenfelder
Speziell ist die erhaltene Energie R
H = d xT00 3
R
p = − d xT 3
∂L = d x −g00 L + ∂0 φ(x) ∂(∂0 φ)
und der erhaltene 3-Impuls i
R
0i
3
R
∂L = d x − ∂ i φ(x) ∂(∂0 φ) 3
.
(37.6)
(37.7)
Für eine relativistische Quantisierung muss das Feld selbst als Operator definiert werden. Der Feldoperator Φ(x) ist die eigentliche dynamische Variable, die Komponenten des 4-Vektors xμ sind in der relativistischen Theorie nur Parameter, wie die Zeit in der Quantenmechanik. Ein Ortsoperator kann nicht definiert werden. Wie in der Literatur zur Quantenfeldtheorie üblich, setzen wir im Folgenden } = 1, c = 1 , d.h. wir messen alle Energien in Einheiten von } und Geschwindigkeiten in Einheiten von c. Die Quantisierung erfolgt mit Hilfe des Diracschen Zusammenhangs zwischen Poisson-Klammern und Vertauschungsrelationen von Operatoren. Quantisierung: Um die Quantisierungsvorschrift zu motivieren, schließen wir zunächst das System in einen großen Kubus V ein. Die Lagrange-Funktion L sei definiert als das räumliche Integral über die Lagrangedichte L, Z ˙ d3 xL(Φ(x), ∂μ Φ(x)) L[Φ(x), Φ(x)] ≡ V Z 1 1 d3 x ∂μ Φ(x)∂ μ Φ(x) − m2 Φ2 . (37.8) = 2 2 V Für die Quantisierung teilen wir V in ein Gitter von N kleinen Kuben vom Volumen τ mit V = N τ . Das Feld in einer kleinen Zelle ist in guter Näherung konstant, Φ(~xi , t) = Φi (t). Wir setzen Qi (t) ≡ τ Φi (t). Damit wird die Lagrangefunktion Z Z 1 1 L= d3 xΦ˙ 2 − d3 x[ (∇Φ)2 + m2 Φ2 ] 2 V 2 V ⇒
N 1 X Q˙ 2i − ... 2 i=1 τ
37.2 Quantisierung von Feldern
473
wo ... Terme sind, die nicht von Q˙ i abhängen. Aus L berechnen sich die kanonischen Impulse zu ∂L Q˙ i = = Φ˙ i (t) ≡ Π(~xi , t). Pi (t) = ˙ τ ∂ Qi Entsprechend lässt sich die Hamilton-Funktion definieren, H=
N X i=1
Pi Q˙ i − L =
N X i=1
τ P i Pi − L .
Wenn das Volumenelement τ → 0 geht, wird Z 1 1 ~ x, t))2 + m2 Φ2 ]. H= d3 x[ Π2 (~x, t) + (∇Φ(~ 2 2 V
(37.9)
Die Quantisierungsvorschrift [Pi (t), Qj (t)] = −iδij
(= −i}δij in den Standardeinheiten)
(37.10)
geht dann über in
δij τ und im Limes τ → 0 erhält man den gleichzeitigen Kommutator für die Feldoperatoren [Π(~xi , t), Φ(~xj , t)] = −i
[Π(~x, t), Φ(~x0 , t)] = −iδ 3 (~x − ~x0 ). Da gilt auch
(37.11)
[Qi (t), Qj (t)] = 0 und [Pi (t), Pj (t)] = 0 [Φ(~x, t), Φ(~x0 , t)] = 0 und [Π(~x, t), Π(~x0 , t)] = 0.
Die Heisenbergsche Bewegungsgleichung ˙ x, t) [H, Φ(~x, t)] = −iΦ(~
(37.12)
liefert mit (37.9) und (37.11) wie erwartet ˙ x, t). Π(~x, t) = Φ(~ Fourier-Entwicklung: Im endlichen Volumen V = L3 und periodischen Randbedingungen kann man den Feldoperator in eine Fourier-Reihe, d.h. nach Normalmoden entwickeln i Xh Φ(x) = A~k f~k (x) + A~† f~k∗ (x) (37.13) k
~ k
Π(x) = −iωk
Xh ~ k
i A~k f~k (x) − A~† f~k∗ (x) , k
474
Kapitel 37. Quantenfelder
wo die f~k (x) Lösungen der Klein-Gordon-Gleichung sind f~k (x) = √ mit
~k = 2π ~n, L
1 ~ e−i(ωk t−k∙~x) 2ωk V
q ni = 0, ±1, ±2, ..., ωk = ~k 2 + m2 .
(37.14)
(In einer Basis des Hilbert-Raumes können die Operatoren Φ(~x, t) und Π(~x, t) als Matrizen dargestellt werden; jedes Matrixelement ist eine gewöhnliche Funktion von ~x und t, die nach p Lösungen der Klein-Gordon-Gleichung entwickelt werden kann). Die Definition ωk = ~k 2 + m2 wird als Dispersionsrelation bezeichnet. Man kann diese Entwicklung in den Hamilton-Operator Gl. (37.2) einsetzen und erhält H=
i 1X h ωk A~k A~† + A~† A~k . k k 2 ~ k
Der Hamilton-Operator sieht aus wie der eines Systems von (unendlich vielen) unabhängigen harmonischen Oszillatoren mit Frequenz ωk . Jeder Mode des Feldes entspricht ein Oszillator. Bei der Quantisierung gehen wir daher so vor wie bei den harmonischen Oszillatoren. Die Dynamik jeder einzelnen Mode gleicht formal der eines harmonischen Oszillators mit Amplitude und konjugiertem Impuls h i Q~k = A~k + A~† , k
i −i h P~k = √ A~k − A~† . k 2
Aus den kanonischen Vertauschungsrelationen für Q und P folgen dann diejenigen für A~k und A~† k h i A~k , A~† 0 = δ~k~k0 = δk1 k10 δk2 k20 δk3 k30 . (37.15) k
Mit Hilfe dieser Vertauschungsrelationen lässt sich der Hamilton-Operator in der Form schreiben X † 1 H= ωk A~ A~k + . k 2 ~ k
Aus den Vertauschungsrelationen Gl. (37.15) und den Definitionen der Feldoperatoren Gl. (37.13) erhält man für den gleichzeitigen Kommutator r
i h i ω k 0 XX h ~ ~0 0 ~ ~0 0 − Ak , A†k0 e−i(k∙~x−k ∙~x ) + A†k , Ak0 ei(k∙~x−k ∙~x ) ωk k k0 r X X i ωk 0 −i(~ k∙~ x−~ k0 ∙~ x0 ) i(~ k∙~ x−~ k0 ∙~ x0 ) −e = δ − e 0 ~ ~ kk 2L3 ωk k k0 X 1 0 ~ = −i e−.ik∙(~x−~x ) = −iδ 3 (~x − ~x0 ) , 3 L
i [Φ(x, t), Π(x , t), ] = 2L3 0
k
37.2 Quantisierung von Feldern
475
wie erwartet. Die gleichzeitigen Vertauschungsrelationen gelten auch, wenn die Lagrange-Funktion einen Wechselwirkungsterm enthält, wenn man im Wechselwirkungsbild arbeitet. Es ist wahrhaft erstaunlich, dass die Vertauschungsrelationen des harmonischen Oszillators uns ein vollständiges Bild des Hilbert-Raumes der Zustände des Quantenfeldes Φ(x, t) geben. Die Vertauschungsrelationen (37.15) besagen, dass wir mit jeder der (unendlich vielen) unabhängigen Wellenmoden k des Quantensystems einen harmonischen Oszillator verbinden können, das seinerseits durch unendlich viele Energieeigenwerte Ek = ωk (nk + 12 ), nk = 0, 1, 2, ... beschrieben wird. Der Fock-Raum: Um die Notation übersichtlich zu halten, betrachten wir in diesem Abschnitt nur eine Raumdimension. Die Hamilton-Funktion Gl. (37.9) für ein freies Skalarfeld kann nach partieller Integration in die Form gebracht werden: Z 1 dx[Π2 (x, t) + ∇2 Φ(x, t) + m2 Φ(x, t)] . H= 2 L −L 2