197 55 6MB
German Pages 546 [548] Year 2018
Hugo Reinhardt Quantenmechanik 1 De Gruyter Studium
Weitere empfehlenswerte Titel Moderne Physik Von Kosmologie über Quantenmechanik zur Festkörperphysik Jan Peter Gehrke, Patrick Köberle, 2017 ISBN 978-3-11-052622-6, e-ISBN (PDF) 978-3-11-052623-3, e-ISBN (EPUB) 978-3-11-052633-2 Experimentalphysik Band 5: Quanten, Atome, Kerne, Teilchen Wolfgang Pfeiler, 2017 ISBN 978-3-11-044559-6, e-ISBN (PDF) 978-3-11-044571-8, e-ISBN (EPUB) 978-3-11-044603-6 Quantenchemie Eine Einführung Michael Springborg, 2017 ISBN 978-3-11-050079-0, e-ISBN (PDF) 978-3-11-050080-6, e-ISBN (EPUB) 978-3-11-049813-4 Elementary Particle Theory Volume 1: Quantum Mechanics Eugene Stefanovich, 2018 ISBN 978-3-11-049088-6, e-ISBN (PDF) 978-3-11-049213-2, e-ISBN (EPUB) 978-3-11-049103-6 Space – Time – Matter Analytic and Geometric Structures Jochen Brüning, Matthias Staudacher, 2018 ISBN 978-3-11-045135-1, e-ISBN 978-3-11-045215-0
Hugo Reinhardt
Quantenmechanik 1
| Pfadintegralformulierung und Operatorformalismus 2. Auflage
Author Prof. Dr. Hugo Reinhardt Eberhard-Karls-Universität Inst. für theoretische Physik Auf der Morgenstelle 14 72076 Tübingen
ISBN 978-3-11-058595-7 e-ISBN (PDF) 978-3-11-058602-2 e-ISBN (EPUB) 978-3-11-058647-3 Library of Congress Control Number: 2018952440 Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2019 Walter de Gruyter GmbH, Berlin/Boston Einbandabbildung: Studio-Pro / DigitalVision Vectors / Getty Images Satz: le-tex publishing services GmbH, Leipzig Druck und Bindung: CPI books GmbH, Leck www.degruyter.com
| Meiner Mutter
Vorwort zur 2. Auflage Die zweite Auflage wurde an vielen Stellen überarbeitet. Das ursprünglich einleitende Kapitel mit den historischen Experimenten zum Nachweis der Quantennatur der Ma terie wurde aus dem Band 1 entfernt. Diese Experimente zeigen zwar das Versagen der klassischen Mechanik im atomaren Bereich, sind aber für ein erstes Verständnis der Quantenmechanik nicht notwendig. Sie sind jetzt im Band 2 eingearbeitet, da sie sich dort thematisch besser einfügen und sich der Leser bereits die theoretischen Grundla gen zum Verständnis dieser Experimente erworben hat. Im letzten Kapitel (Geladenes Teilchen im elektromagnetischen Feld) wurde ein neuer Abschnitt zur Rolle des Eich potenzials in der Quantenmechanik aufgenommen. Druckfehler, die sich in die erste Auflage eingeschlichen hatten, wurden ebenfalls korrigiert. Das Layout wurde komplett überarbeitet und an die neuen Vorgaben des Verlages angepasst. Wichtige Gleichungen sind eingerahmt, wichtige Aussagen farbig hinter legt und bei besonderer Bedeutung zusätzlich mit dem Icon versehen. Beweise sind durch ein , Kommentare durch ein gekennzeichnet. Tübingen, im Mai 2018 Hugo Reinhardt
https://doi.org/10.1515/9783110586022-201
Vorwort zur 1. Auflage Das Buch gibt eine moderne Einführung in die Quantentheorie. Ausgehend vom Ex periment werden die Grundlagen der Quantentheorie mittels des Feynman’schen Funktionalintegral-Zuganges entwickelt. Aus dem fundamentalen Prinzip der Quan tenmechanik, dem Prinzip der interferierenden Alternativen, wird die SchrödingerGleichung „abgeleitet“. Daran anschließend wird die mehr traditionelle Operatorfor mulierung der Quantenmechanik entwickelt, wobei von Zeit zu Zeit immer wieder auf den Funktionalintegral-Zugang zurückgegriffen wird, um dessen Eleganz und Vorzüge zu demonstrieren. Der konzeptionelle Vorteil dieses Zuganges besteht darin, dass die Grundgleichung der Quantentheorie, die Schrödinger-Gleichung, nicht „vom Himmel fällt“, sondern sich zwangsläufig aus dem Prinzip der interferierenden Alternativen ergibt. Der Funktionalintegral-Zugang hat jedoch nicht nur konzeptionelle Vorteile, er erleichtert auch gleichzeitig den späteren Einstieg in die Quantenfeldtheorie, wo er unumgänglich ist. Neben dem traditionellen Stoff, der üblicherweise in einen QuantenmechanikKurs eingeht, gibt das Buch, insbesondere der Band 2, bereits eine Einführung in Ba siskonzepte der Quantenfeldtheorie wie z. B. die Methode der zweiten Quantisierung. Darüber hinaus sind einige modernere Entwicklungen in dieses Buch eingeschlos sen, die üblicherweise noch nicht Gegenstand von Lehrbüchern sind wie z. B. der Zusammenhang zwischen Spin und Geometrie oder die sogenannte Berry-Phase, die den Bohm-Aharanov-Effekt in einen allgemeineren Kontext stellt und gleichzeitig das quantenmechanische Analogon der Wess-Zumino-Witten-Wirkung aus der Quanten feldtheorie repräsentiert. Die entsprechenden Kapitel sind mit einem Stern (*) verse hen und können bei einer ersten Berührung mit der Quantenmechanik übergangen werden. Sie sind für das Verständnis der übrigen Kapitel nicht erforderlich, gewähren jedoch einen tieferen Einblick in die Wesenszüge der Quantentheorie. Das vorliegende Buch ist aus Vorlesungen entstanden, die der Autor an der TU Dresden und vor allem an der Universität Tübingen gehalten hat. Das Buch wurde zu nächst als Vorlesungsskript an die Zuhörer der Vorlesung ausgegeben. Die vielfältigen Rückfragen, Anregungen und Kommentare seitens der Studenten haben kontinuier lich zur Vervollständigung und Verbesserung des Skriptes beigetragen. Schließlich hat ihre positive Resonanz mich ermutigt, das Skript als Buch zu veröffentlichen. Allen Studenten, die mit ihren Anregungen und konstruktiver Kritik zur Verbesse rung dieses Buches beigetragen haben, sei an dieser Stelle gedankt, auch wenn es unmöglich ist, sie alle namentlich zu erwähnen. Unerwähnt bleiben sollen allerdings nicht Herr Stefan Haag, der große Teile des Skriptes aus der Sicht eines Studenten auf Verständlichkeit gelesen hat und zur Vereinheitlichung der Notation beigetragen hat, Herr Dr. Davide Campagnari, der einen großen Teil der Abbildungen angefer tigt hat, sowie meine Sekretärin, Frau Ingrid Estiry, die in mühevoller Kleinarbeit das LATEX-Manuskript inklusive Abbildungen erstellt hat. Ihnen sei allen herzlich für https://doi.org/10.1515/9783110586022-202
VIII | Vorwort zur 1. Auflage
ihre Mühen und ihr Engagement gedankt. Mein ganz besonderer Dank gilt Herrn Priv.-Doz. Dr. Markus Quandt, der das gesamte Manuskript im Endstadium gelesen hat und zahlreiche wertvolle Hinweise bzw. Verbesserungsvorschläge gegeben hat. Schließlich danke ich dem Verlag für die angenehme Zusammenarbeit. Tübingen, im März 2012 Hugo Reinhardt
Inhalt Vorwort zur 2. Auflage | VI Vorwort zur 1. Auflage | VII 1 1.1 1.2 1.3 1.4
Teilchen-Welle-Dualismus | 1 Klassische Teilchen | 1 Wasserwellen | 2 Lichtwellen | 3 Elektronen | 5
2 2.1 2.2 2.3
Der Einfluss der Messung | 8 Experiment zur Bestimmung des vom Elektron passierten Spalts | 8 Die Problematik des Messprozesses in der Quantenmechanik | 10 Alternativen und Unschärferelation | 12
3 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8
Die Wahrscheinlichkeitsamplitude | 16 Die Struktur der Wahrscheinlichkeitsamplitude | 16 Der Zerlegungssatz | 20 Vergleich mit der klassischen Mechanik | 24 Die explizite Form der Übergangsamplitude | 25 Phasenraumdarstellung des Propagators | 30 Der Propagator eines freien Teilchens | 32 Energiedarstellung des Propagators | 35 Der Propagator einer Punktmasse in drei Dimensionen | 36
4 4.1 4.2 4.3 4.4 4.5 4.6 4.7
Die Wellenfunktion | 38 Wellenfunktion und Übergangsamplitude | 38 Die Wellenfunktion des freien Teilchens | 40 Wellenpakete | 43 Materiewellen | 46 Erwartungswerte und Unschärfe | 49 Der Impulsraum | 51 Messgrößen als Operatoren | 54
5 5.1 5.2 5.3
Der klassische Grenzfall | 57 Die stationäre Phasenapproximation | 57 Asymptotische Darstellung der δ-Funktion | 62 Der klassische Grenzwert des Propagators | 64
X | Inhalt
5.4 5.5 5.6 6 6.1 6.1.1 6.1.2 6.2 6.2.1 6.2.2
Die Bohr-Sommerfeld’sche Quantisierungsbedingung | 70 Die Wellenfunktion im klassisch verbotenen Bereich | 76 Beweis der Poisson-Formel | 78 Unendlich große Potenzialsprünge | 81 Die unendlich hohe Potenzialkante | 81 Der Propagator bei Anwesenheit einer unendlich hohen Potenzialwand | 82 Interpretation des Propagators: die Spiegelladungsmethode | 86 Der unendlich hohe Potenzialtopf | 89 Bestimmung des Propagators mittels der Spiegelladungsmethode | 89 Physikalische Interpretation des Propagators: Energieeigenzustände | 94
7 7.1 7.2 7.3 7.3.1 7.3.2 7.3.3 7.3.4 7.4 7.5 7.6 7.6.1 7.6.2 7.6.3
Die Schrödinger-Gleichung | 96 Die zeitabhängige Schrödinger-Gleichung | 96 Stationäre Lösungen der Schrödinger-Gleichung | 101 Das Ehrenfest-Theorem | 102 Die Zeitentwicklung von Erwartungswerten | 102 Beispiele | 104 Analogie zur klassischen Mechanik | 106 Der quantenmechanische Virialsatz | 108 Die Schrödinger-Gleichung als Euler-Lagrange-Gleichung | 110 Die Kontinuitätsgleichung: Teilchendichte und Stromdichte | 112 Grenzflächenverhalten der Wellenfunktion | 115 Motivation von Potenzialsprüngen | 116 Verhalten der Wellenfunktion an Potenzialsprüngen | 117 Grenzflächenverhalten der Wellenfunktion in drei Dimensionen | 121
8 8.1
Die eindimensionale stationäre Schrödinger-Gleichung | 127 Qualitative Diskussion der Wellenfunktion: gebundene Zustände | 127 Die Wellenfunktion in Abhängigkeit von der Energie | 131 Strenge Eigenschaften der eindimensionalen Schrödinger-Gleichung | 133 Symmetrische Potenziale: die Parität | 138 Der unendlich hohe Potenzialtopf | 139 Das δ-Potenzial | 144
8.2 8.3 8.4 8.5 8.6
Inhalt | XI
9.4.3 9.4.4 9.4.5 9.5 9.6
Eindimensionale Streuprobleme | 147 Streuung an einer Potenzialstufe | 147 Streuzustände | 148 Transmission und Reflexion | 152 Teilchenenergie unterhalb der Potenzialschwelle | 155 Streuung am Potenzialtopf | 159 Streuzustände | 160 Resonanzen | 163 Gebundene Zustände im endlichen Potenzialtopf | 165 Transmissionskoeffizienten für gebundene Zustände | 165 Die gebundenen Zustände des endlichen Potenzialtopfes | 166 Die Potenzialbarriere | 171 Quantentunnelung durch die Potenzialbarriere | 173 Interpretation der Quantentunnelung mittels der Unschärferelation | 175 Große Potenzialbarrieren | 176 Kontinuierliche Potenzialberge | 177 Allgemeine Form des Transmissionskoeffizienten | 179 Pfadintegralberechnung des Transmissionskoeffizienten | 181 Feldemission von Elektronen | 184
10 10.1 10.2 10.3 10.4 10.5 10.6 10.7
Mathematische Grundlagen der Quantenmechanik | 189 Der Hilbert-Raum | 190 Operatoren im Hilbert-Raum | 199 Matrixdarstellung linearer Operatoren | 206 Die Dirac-Notation | 208 Eigenschaften hermitescher Operatoren | 215 Projektionsoperatoren | 221 Das Tensorprodukt | 223
11 11.1 11.2 11.3 11.4 11.5
Axiomatische Quantenmechanik | 226 Grundpostulate der Quantenmechanik | 227 Verträglichkeit von Observablen | 230 Präparation eines Quantensystems | 234 Allgemeine Unschärferelation | 235 Minimum der Unschärfe | 238
12 12.1 12.2 12.3 12.4
Der harmonische Oszillator | 240 Pfadintegralbehandlung des harmonischen Oszillators | 241 Der Quantenoszillator | 247 Algebraische Diagonalisierung des Hamilton-Operators | 248 Der Besetzungszahloperator | 250
9 9.1 9.1.1 9.1.2 9.1.3 9.2 9.2.1 9.2.2 9.3 9.3.1 9.3.2 9.4 9.4.1 9.4.2
XII | Inhalt
12.5 12.6 12.7 12.8 12.9 12.10 12.11 13 13.1 13.2 13.3 13.4 13.4.1 13.4.2 13.4.3 13.4.4 14 14.1 14.2 14.3
Das Spektrum des harmonischen Oszillators | 253 Unschärferelation | 255 Besetzungszahldarstellung | 256 Ortsdarstellung der Energieeigenfunktionen: Die Hermite-Polynome | 257 Der dreidimensionale harmonische Oszillator | 262 Das unendlich schwere Teilchen | 265 Kohärente Zustände | 267 Periodische Potenziale: das Bändermodell des Festkörpers | 273 Der Translationsoperator | 274 Das Bloch’sche Theorem | 275 Qualitative Beschreibung der Energiebänder | 278 Strenge quantenmechanische Behandlung des periodischen Potenzials | 283 Periodische Randbedingungen | 283 Bestimmung der Energieeigenzustände | 284 Energiebänder | 286 Metalle, Isolatoren und Halbleiter | 290 Drehimpuls und Spin (Heuristische Behandlung) | 293 Einführung | 293 Geometrische Interpretation von Drehimpuls und Spin | 297 Physikalische Konsequenzen des geometrischen Bildes vom Drehimpuls | 301
15 Der Drehimpuls | 303 15.1 Einführung | 303 15.2 Die Eigenwerte des Drehimpulses | 307 15.3 Geometrische Interpretation des Drehimpulses | 313 15.4 Matrixdarstellung | 315 15.5 Die Eigenfunktionen des Drehimpulses im Ortsraum | 318 15.5.1 Der Drehimpulsoperator in Kugelkoordinaten | 319 15.5.2 Konstruktion der Drehimpulseigenfunktionen | 321 15.6 Zusammenhang mit den Legendre-Funktionen | 327 15.7 Vektoraddition von Drehimpulsen | 329 15.8 Explizite Konstruktion der gekoppelten Drehimpulseigenzustände | 332 16 16.1 16.2
Axialsymmetrische Potenziale | 335 Die kinetische Energie in Zylinderkoordinaten | 335 Die Schrödinger-Gleichung für axialsymmetrische Potenziale | 336
Inhalt |
16.3 16.4 16.5 16.5.1 16.5.2
XIII
Die Zylinderfunktionen | 338 Die zylindrische Box | 342 Der zweidimensionale rotationssymmetrische Oszillator | 343 Algebraische Diagonalisierung des Hamilton-Operators | 344 Analytische Lösung der Schrödinger-Gleichung | 346
17 Kugelsymmetrische Potenziale (Zentralpotenziale) | 352 17.1 Die kinetische Energie in Kugelkoordinaten | 352 17.2 Kugelsymmetrische Potenziale | 355 17.3 Bindungszustände: Grenzverhalten der Radialfunktion | 357 17.4 Radialwellenfunktion des freien Teilchens | 359 17.4.1 Die sphärischen Bessel-Funktionen | 360 17.4.2 Entwicklung der ebenen Wellen nach Kugelfunktionen | 367 17.4.3 Kugelwellen | 369 17.5 Die sphärische Box | 370 17.6 Der dreidimensionale isotrope harmonische Oszillator | 373 17.6.1 Lösung der Radialgleichung | 374 17.6.2 Energiespektrum | 377 17.6.3 Wellenfunktionen | 379 18 18.1 18.2 18.3 18.4 18.5 18.6 18.6.1 18.6.2 18.7 18.7.1 18.7.2
Das Wasserstoffatom | 382 Das Zweikörperproblem: Separation in Schwerpunktsund Relativbewegung | 383 Qualitative Beschreibung | 385 Lösung der Schrödinger-Gleichung | 388 Spektrum des Wasserstoffatoms | 391 Die Wellenfunktionen | 394 Algebraische Bestimmung des Wasserstoffspektrums | 398 Der Runge-Lenz-Vektor | 398 Verallgemeinerte Drehimpulsalgebra und Energieeigenwerte | 402 Warum das Coulomb-Problem exakt lösbar ist | 407 Einbettung des ℝ3 in den vierdimensionalen Raum | 407 Transformation der Schrödinger-Gleichung | 411
19 Algebraischer Zugang zur Quantenmechanik | 416 19.1 Bestimmung des Spektrums | 416 19.2 Beziehung zur Schrödinger-Gleichung | 423 19.3 Algebraische Lösung der Schrödinger-Gleichung | 428 19.3.1 Der harmonische Oszillator | 429 19.3.2 Reflexionsfreie Potenziale | 430 19.4 Algebraische Bestimmung des Wasserstoffspektrums | 432
XIV | Inhalt
20 20.1 20.2 20.3
Störungstheorie | 436 Stationäre Störungstheorie | 437 Störungstheorie für zwei dicht benachbarte Niveaus | 441 Anwendung der Störungstheorie: Grundzustandsenergie des Heliumatoms | 444
21 Das Ritz’sche Variationsverfahren | 448 21.1 Variationsverfahren zur Berechnung der Energieeigenzustände | 448 21.2 Beispiele zum Ritz’schen Variationsverfahren | 451 21.2.1 Der harmonische Oszillator | 451 21.2.2 Der Grundzustand des Wasserstoffatoms | 454 21.2.3 Variationsabschätzung der Helium-Grundzustandsenergie | 455 21.3 Allgemeines Variationsprinzip | 458 22 22.1 22.2 22.2.1 22.2.2 22.3 22.3.1 22.4 22.4.1 22.4.2 22.4.3 22.5 22.6
Geladenes Teilchen im elektromagnetischen Feld | 462 Klassische Ladungen im äußeren elektromagnetischen Feld | 462 Quantenmechanische Ladungen im äußeren elektromagnetischen Feld | 466 Hamilton-Operator der Punktladung | 467 Eichinvarianz | 470 Ladung im homogenen Magnetfeld | 471 Der Zeeman-Effekt | 474 Die Landau-Niveaus | 476 Eichinvariante Diagonalisierung des Hamiltonian | 477 Diagonalisierung des Hamiltonian in der Coulomb-Eichung | 479 Ausdehnung und Besetzung der Landau-Niveaus | 485 Zur Rolle des Eichpotenzials in der Quantenmechanik | 487 Ableitung des Hamilton-Operators einer Punktladung | 490
A A.1 A.2 A.3 A.4
Die Dirac’sche δ-Funktion | 495 Definition und Realisierungen | 495 Eigenschaften | 497 Ableitung, Stammfunktion und Hauptwert | 501 Mehrdimensionale δ-Funktion | 504
B
Gauß-Integrale | 505
C C.1 C.2 C.3 C.4
Funktionen von Operatoren | 509 Definition | 509 Variation | 510 Nützliche Operatoridentitäten | 512 Die Green’sche Funktion des Laplace-Operators im ℝn | 514
Inhalt | XV
D D.1 D.2 D.3
Basiselemente der Variationsrechnung | 518 Definition von Funktionalen und ihren Variationsableitungen | 518 Regeln der Variationsableitung | 522 Funktional über einen Hilbert-Raum | 524
Stichwortverzeichnis | 527
1 Teilchen-Welle-Dualismus Ende des 19. und Anfang des 20. Jahrhunderts wurde eine Reihe von qualitativ neu en Experimenten durchgeführt, deren Ergebnisse sich nicht mehr im Rahmen der bis dahin bekannten klassischen Physik erklären ließen. Die Analyse dieser Experimente zeigte, dass Licht und Elektronen sich in gewissen Experimenten wie Wellen, in ande ren wie Teilchen verhalten. Dieser im Rahmen der klassischen Physik bestehende Wi derspruch wurde 1926/27 durch die Quantenmechanik aufgelöst. Diese neue Theorie zeigte, dass in Experimenten im atomaren Bereich prinzipiell nicht alle aus der klas sischen Physik bekannten Größen gleichzeitig exakt bestimmbar bzw. vorhersagbar sind, sondern dass nur Wahrscheinlichkeitsaussagen möglich sind. Darüber hinaus zeigte es sich, dass Wahrscheinlichkeiten in der Quantenmechanik anders summiert werden müssen als in der klassischen Mechanik. Die Gesetze der Quantenmechanik gehen jedoch in die der klassischen Physik über, wenn die betrachteten Objekte ma kroskopische Größe erlangen. Als Geburtsstunde der Quantenmechanik wird i. A. die Entdeckung der Planck’schen Strahlungsformel im Jahre 1900 angesehen. Im Folgenden wollen wir einige Experimente analysieren, die den wesentlichen Unterschied zwischen Teilchen und Wellen verdeutlichen.
1.1 Klassische Teilchen Mit einer Schrotflinte schießen wir auf eine Wand mit zwei Spalten, die wir mit 1 und 2 bezeichnen. Hinter der Wand befindet sich ein Absorber, der die durch die Spalte geflogenen Schrotkugeln auffängt. Auf dem Absorber tragen wir die x-Achse auf und teilen diese in Intervalle der Länge δx ein, welche wir mit dem Index i durchnumme rieren (Abb. 1.1). Wiederholen wir den Versuch genügend oft, so finden wir, dass die Kugeln mit einer gewissen Wahrscheinlichkeit w(x i ) im Intervall [x i , x i + δx] auftreffen. Schließen wir einen der beiden Spalte, z. B. Spalt 2, so finden wir die Wahrscheinlich keit w1 (x i ). Da die Spalte nicht infinitesimal klein sind, kommt es zur Streuung der x
x
x w1 (x)
1
δx
2
Abb. 1.1: Doppelspaltexperiment mit Schrotkugeln.
https://doi.org/10.1515/9783110586022-001
w2 (x)
w12 (x)
2 | 1 Teilchen-Welle-Dualismus Schrotkugeln an den Spalträndern, und die Wahrscheinlichkeitsverteilungen w k (x) haben nicht die Form einer scharfen Spitze. Experimentell finden wir vor, was mit unserer Alltagserfahrung übereinstimmt: Die Gesamtwahrscheinlichkeit w12 (x) setzt sich aus der Summe der Wahrscheinlichkeiten w1 (x) und w2 (x) zusammen und die Kugeln sind entweder durch Spalt 1 oder Spalt 2 zum Ort x gelangt. Wir erhalten damit die Beziehung w12 (x) = w1 (x) + w2 (x) , (1.1) welche ausdrückt, dass es keinerlei Interferenz zwischen den durch Spalt 1 bzw. Spalt 2 gelaufenen Kugeln gibt. Wir betrachten nun einen analogen Versuch mit Wasserwellen.
1.2 Wasserwellen Ein periodisch in eine Wasseroberfläche eintauchender Stift erzeugt kreisförmige Was serwellen, welche auf eine Wand mit zwei Spalten treffen (Abb. 1.2). An einem dahinter befindlichen reflexionsfreien Absorber messen wir die Intensität der Wellenbewegung am Punkt x, indem wir dort die Intensität, das zeitgemittelte Quadrat der Auslenkung A(x, t), bestimmen: T
I(x) =
1 ∫ dt A2 (x, t) . T
(1.2)
0
Nach dem Huygens’schen Prinzip sind die Punkte einer Wellenfront Ausgangspunkt von Elementarwellen, die sich zu einer Gesamtwelle überlagern. Sind die Spalte klein genug, können wir sie in der Bildebene idealisiert als punktförmig ansehen, und jeder Spalt ist dann Ausgangspunkt einer neuen Kreiswelle. Schließen wir einen der beiden Spalte, so erhalten wir eine Intensitätsverteilung, welche dieselbe Form besitzt wie die Wahrscheinlichkeitsverteilung im Falle der Schrotkugeln, wenn einer der beiden Spalte geschlossen ist. Sind beide Spalte jedoch geöffnet, erhalten wir bei den Wasser
x I1 (x)
I2 (x)
Abb. 1.2: Doppelspaltexperiment mit Wasserwellen.
I
1.3 Lichtwellen | 3
wellen eine Intensitätsverteilung, die völlig verschieden ist von der Wahrscheinlich keitsverteilung der Schrotkugeln. Es treten jetzt die für Wellen typischen Interferenz erscheinungen in der Intensitätsverteilung auf, und insbesondere gilt: I(x) ≠ I1 (x) + I2 (x) . Das ist auch anschaulich klar. Denn es addieren sich ja die Auslenkungen, A(x, t) = A1 (x, t) + A2 (x, t) , und nicht die Intensitäten. Für die Gesamtintensität benötigen wir nach (1.2) das Qua drat der Auslenkung: A2 (x, t) = A21 (x, t) + A22 (x, t) + 2A1 (x, t)A2 (x, t) ≠ A21 (x, t) + A22 (x, t) .
1.3 Lichtwellen Dasselbe Experiment lässt sich mit Lichtwellen wiederholen. Die Lichtquelle sei ge nügend weit von der Wand mit den beiden Spalten entfernt, sodass die Wellenfront des Lichtes beim Erreichen der Wand als eben angenommen werden kann. Hinter der Wand stellen wir einen Bildschirm auf, welcher den Absorber des vorherigen Experi mentes ersetzt. Eine genauere Auswertung der Experimente lässt sich erreichen, wenn der Bildschirm durch einen Detektor mit Fotozellen ersetzt wird. Decken wir einen der beiden Spalte ab, so erhalten wir eine Intensitätsverteilung, welche von der, die man für klassische korpuskulare Teilchen erwartet, nur durch Beugungseffekte ab weicht. Lässt man das Licht durch beide Spalte laufen, findet man dieselben Interfe renzeffekte wie bei den Wasserwellen. Dies ist auch nicht verwunderlich, da wir aus der Elektrodynamik wissen, dass Licht elektromagnetische Wellen eines bestimmten Wellenlängenbereiches verkörpert. In diesen Wellen stehen das elektrische und das magnetische Feld senkrecht aufeinander und beide wiederum senkrecht auf der Aus breitungsrichtung, welche durch den Wellenvektor k repräsentiert wird (Abb. 1.3): k∼E×B. Elektromagnetische Wellen sind spezielle Lösungen der Maxwell-Gleichungen im la dungsfreien Raum. Wegen der Linearität der Maxwell-Gleichungen werden die elek tromagnetischen Felder zweier Wellen nach dem Superpositionsprinzip addiert. E(1) und E(2) mögen die elektrischen Anteile der elektromagnetischen Wellen be zeichnen, deren Quelle im Spalt 1 bzw. 2 liegt. Das Gesamtfeld ergibt sich dann zu: E(x, t) = E (1) (x, t) + E(2) (x, t) .
(1.3)
Der Einfachheit halber setzen wir voraus, dass das Licht monochromatisch ist, d. h., eine feste Frequenz ω besitzt. Für eine solche Welle hat das elektrische Feld die Gestalt E(x, t) = Re {E0 (x)e−iωt } = Re {E0 (x)} cos(ωt) + Im {E 0 (x)} sin(ωt) ,
(1.4)
4 | 1 Teilchen-Welle-Dualismus
E
B E⊥B k
E, B ⊥ k
Abb. 1.3: Illustration einer elektromagnetischen Welle.
wobei E0 (x) eine komplexe, periodische Ortsfunktion ist. Analog sind die beiden aus Spalt 1 bzw. Spalt 2 herauslaufenden Wellen durch (1)
(2)
E (1) (x, t) = Re {E0 (x)e−iωt } , E (2) (x, t) = Re {E0 (x)e−iωt } gegeben, und das Gesamtfeld (1.3) ergibt sich zu: (1)
(2)
E(x, t) = Re {(E0 (x) + E0 (x)) e−iωt } . Die Energiestromdichte des elektromagnetischen Feldes ist (im Heavyside-LorentzMaßsystem mit c = 1) durch s = |E × B| (1.5) gegeben. Für elektromagnetische Wellen im Vakuum gilt außerdem, dass das elektri sche und magnetische Feld den gleichen Betrag besitzen: |E| = |B| . Daher reduziert sich die Energiestromdichte (1.5) auf: s(x, t) = E2 (x, t) . Benutzt man für die elektromagnetischen Wellen die Darstellung (1.4) mit komplexer Amplitude E0 , so ist die Energiestromdichte durch s(x, t) = [Re {E0 (x)}]2 cos2 (ωt) + [Im {E0 (x)}]2 sin2 (ωt) + 2Re {E 0 (x)} Im {E0 (x)} sin(ωt) cos(ωt) gegeben. Die Intensität einer Welle ist definiert als die über eine Periode T gemittelte Energiestromdichte: T
I(x) =
1 ∫ dt s(x, t) , T 0
T=
2π . ω
1.4 Elektronen |
5
Diese Definition ist konsistent mit der oben benutzten Definition der Intensität einer Wasserwelle, wenn man berücksichtigt, dass |E| = |B| die Amplitude der elektroma gnetischen Welle ist. Benutzt man 2π
2π
0
0
1 1 1 ∫ dφ sin2 φ = ∫ dφ cos2 φ = , 2π 2π 2
2π
∫ dφ sin φ cos φ = 0 , 0
so erhält man durch Ausführung der Mittelung über die Zeit für die Intensität einer elektromagnetischen Welle: 1 [(Re {E 0 (x)})2 + (Im {E0 (x)})2 ] 2 1 1 = E∗0 (x) ⋅ E0 (x) = |E0 (x)|2 . 2 2
I(x) =
Berechnen wir hieraus nun die Intensität zweier überlagerter monochromatischer Wellen mit derselben Frequenz ω, so erhalten wir: 2 1 (1) (2) E 0 (x) + E 0 (x) 2 ∗ 1 (1) (2) (1) (2) = (E0 (x) + E0 (x)) ⋅ (E 0 (x) + E 0 (x)) 2 1 (1) 2 (2) 2 (1)∗ (2) (1) (2)∗ = [E 0 (x) + E0 (x) + E0 (x) E0 (x) + E0 (x) ⋅ E0 (x)] 2
I12 (x) =
= I1 (x) + I2 (x) + ∆I(x) . Wir sehen, dass die Intensität der beiden überlagerten Wellen nicht gleich der Summe der Intensitäten der beiden einzelnen Wellen ist, sondern sich um einen Interferenz term ∆I(x) von der Summe unterscheidet. Das Doppelspaltexperiment mit Lichtwellen zeigt das, was wir auch schon bei den Wasserwellen festgestellt haben: Bei Wellen dürfen nicht die Intensitäten, sondern müssen die Wellenamplituden überlagert wer den. Die Wellenintensität entspricht der Wahrscheinlichkeit, dass wir ein von null verschiedenes elektromagnetisches Feld in der Welle antreffen. Analog entspricht die Wellenamplitude der Wahrscheinlichkeitsamplitude. Dies bedeutet: Die Interferenzen entstehen durch Überlagerungen der phasenbehafteten Wahr scheinlichkeitsamplituden, nicht durch Addition von positiv-definiten Wahr scheinlichkeiten.
1.4 Elektronen Im vorangegangenen Experiment ersetzen wir die Lichtstrahlen durch Elektronen strahlen. Ein Elektronenstrahl bestimmter Energie trifft auf eine Wand mit zwei Spal ten. Auf einem dahinter befindlichen Absorber stellen wir mit einem Zählrohr fest, ob
6 | 1 Teilchen-Welle-Dualismus im Intervall [x i , x i + δx] ein Elektron auftrifft oder nicht. Da die Elektronen korpusku lare Teilchen sind, würde man erwarten, dass man ähnliche Messergebnisse wie bei den Schrotkugeln findet, d. h. eine Wahrscheinlichkeitsverteilung, die keine Interfe renz zeigt. Experimentell findet man jedoch folgenden Sachverhalt: 1.
2.
3.
Die Elektronen kommen als einheitliche, identische „Partikel“ (Korpuskel) an, was durch Ansprechen des Detektors angezeigt wird. Diese Ereignisse kön nen wir während einer Zeiteinheit abzählen und daraus die Wahrscheinlichkeit w(x i ) für das Auftreffen eines Elektrons im Intervall [x i , x i + δx] bestimmen. Schließen wir einen der beiden Spalte, so finden wir eine Wahrscheinlichkeits verteilung wie bei den klassischen Schrotkugeln. Die Elektronen verhalten sich also wie Teilchen. Sind jedoch beide Spalte geöffnet, finden wir ein Interferenzbild wie bei Wellen vor. Die Gesamtwahrscheinlichkeit setzt sich also nicht additiv aus den Teil wahrscheinlichkeiten zusammen: w(x i ) ≠ w1 (x i ) + w2 (x i ) .
Zusammenfassend können wir feststellen: Die Elektronen verhalten sich – je nach ex perimenteller Situation – zum einen wie Teilchen, zum anderen wie Wellen. Diese Tatsache wird als Teilchen-Welle-Dualismus bezeichnet. Das Doppelspaltexperiment wurde mit Elektronen zuerst im Jahre 1961 von Claus Jönssen unter Anleitung seines Doktorvaters Gottfried Möllenstedt in Tübingen durch geführt. Es ist eines der wichtigsten (und schönsten¹) Experimente zum Nachweis der Wellennatur von Materieteilchen und damit eines der fundamentalen Experimente zur Bestätigung der physikalischen Grundlagen der Quantentheorie. In dem Experiment gelang es Jönssen, die Elektronenquelle schwach genug zu wählen, sodass die Elektronen einzeln (zeitlich nacheinander) registriert wurden. Da mit wurde gezeigt, dass die Interferenzerscheinung nicht durch das gleichzeitige Zu sammenspiel mehrerer Elektronen, sondern durch einzelne Elektronen hervorgerufen wird. Aufgrund des Interferenzverhaltens der Elektronen können wir schließen, dass sich die Elektronen ähnlich wie elektromagnetische Wellen durch eine Wahrschein lichkeitsamplitude K beschreiben lassen müssen. Die Wahrscheinlichkeit ergibt sich dann auch hier aus der Wahrscheinlichkeitsamplitude durch Bildung des Absolut betrages: w = |K|2 .
1 In einer Umfrage der „Physics World“ im Jahre 2002 wurde dieses Experiment als eines der zehn „schönsten physikalischen Experimente aller Zeiten“ ausgewählt.
1.4 Elektronen |
7
Bezeichnen wir mit K1 die Wahrscheinlichkeitsamplitude dafür, dass das Elektron durch Spalt 1 läuft, und entsprechend die Amplitude, dass das Elektron durch Spalt 2 läuft, mit K2 , so ist die Gesamtwahrscheinlichkeitsamplitude durch K = K1 + K2 gegeben. Hierbei haben wir vorausgesetzt, dass – wie bei den elektromagnetischen Wellen – das Superpositionsprinzip für Wahrscheinlichkeitsamplituden gilt. Die ses Prinzip wird wie gezeigt durch das Experiment bestätigt. Aus der Gültigkeit des Superpositionsprinzips folgt bereits, dass die Gleichung, welche K beschreibt, line ar in K sein muss. Für die Gesamtwahrscheinlichkeit |K|2 erhalten wir wieder ein ähnliches Ergebnis wie bei den elektromagnetischen Wellen.
2 Der Einfluss der Messung Das Doppelspaltexperiment mit Elektronen lässt sich offenbar nicht im Rahmen der klassischen Physik erklären. Die beobachteten Interferenzerscheinungen sind nicht kompatibel mit der Annahme, dass ein bestimmtes Elektron entweder nur durch Spalt 1 oder nur durch Spalt 2 läuft. Denn ginge ein Elektron z. B. nur durch Spalt 1 – woher wüsste es, dass Spalt 2 auch geöffnet ist und dass es Interferenzfiguren erzeugen muss? Das Doppelspaltexperiment bestimmt zudem gar nicht, durch welchen Spalt das Elektron geht. Wir können jedoch ein Experiment durchführen, das feststellt, durch welchen Spalt das Elektron fliegt.
2.1 Experiment zur Bestimmung des vom Elektron passierten Spalts Das Licht einer starken Lichtquelle, z. B. Röntgenstrahlen, wird von Elektronen ge streut (Compton-Effekt). Diesen Effekt können wir benutzen, um festzustellen, durch welchen Spalt das Elektron geht, indem wir eine solche Lichtquelle hinter die Wand zwischen die beiden Spalte setzen (Abb. 2.1). Die Lichtquelle sei so aufgebaut, dass das Licht in vertikaler Richtung (nach oben bzw. unten) parallel zum Schirm ausgesandt wird. Fliegt ein Elektron durch einen Spalt, so wird das Licht am vorbeifliegenden Elektron gestreut. x
w1 (x)
x
w12 (x)
e−-Quelle
w2 (x)
Lichtquelle Abb. 2.1: Doppelspaltexperiment mit Elektronen: Bestimmung des Spalts, durch den das Elektron läuft.
https://doi.org/10.1515/9783110586022-002
2.1 Experiment zur Bestimmung des vom Elektron passierten Spalts | 9
Ist die Elektronenquelle schwach genug, so können wir für jedes einzelne Elek tron, das vom Zähler registriert wird, experimentell durch den beobachteten Lichtblitz nachweisen, durch welchen Spalt es gekommen ist. Registrieren wir alle Elektronen, welche auf den Schirm gefallen sind und bei denen der Lichtblitz hinter Spalt 1 erfolg te, so erhalten wir die Verteilung w1 (Abb. 2.1). Diese Verteilung erhält man unabhän gig davon, ob Spalt 2 geschlossen oder geöffnet ist. Das oben beschriebene Experiment wurde erstmals 1995 von Chapman durchgeführt. Wir können in diesem Experiment eindeutig feststellen, durch welchen Spalt das Elektron geflogen ist. Für jedes Elektron, das auf dem Schirm auftrifft, beobachten wir einen Lichtblitz entweder hinter Spalt 1 oder hinter Spalt 2. Da wir für jedes Elektron eindeutig feststellen, durch welchen Spalt es gekom men ist, finden wir zwei disjunkte Verteilungen w1 und w2 vor. Ein Elektron gehört entweder zu w1 , wenn es durch Spalt 1 gekommen ist, oder zu w2 , wenn es durch Spalt 2 gekommen ist, niemals aber zu beiden Verteilungen zugleich. Damit muss die Gesamtelektronenverteilung die Summe von w1 und w2 sein: w12 = w1 + w2 = |K1 |2 + |K2 |2 . Diese Verteilung zeigt natürlich keine Interferenz. Schalten wir nun das Licht aus, beobachten wir wieder die ursprüngliche Interfe renzkurve w = |K1 + K2 |2 . Das Ergebnis hängt also davon ab, ob wir beobachten, durch welchen Spalt das Elek tron geht. Durch die Lichtquelle (den Messapparat) wird das Messergebnis offenbar verändert. Das Licht muss folglich die Elektronen in ihrer Bahn stören, d. h., mit ih nen wechselwirken. In der Tat wissen wir bereits aus der klassischen Elektrodynamik, dass das elektromagnetische Feld der Lichtwellen auf die Elektronen eine Kraft F aus übt (Lorentz-Kraft): F = q(E + v × B) . Durch den Stoß mit dem Lichtquant wird das Elektron in seiner Bahn verändert und kann auch an Stellen der Interferenzminima auf den Schirm treffen. Das obige Experi ment zeigt: Wenn wir durch Beobachtung des Zustandes bzw. des Ortes des Teilchens dessen Bewegung von der Quelle zum Schirm beeinflussen, bevor sie abgeschlossen ist, dann stören wir die Interferenz. Können wir die Störung der Elektronen durch die Lichtquelle (das Messgerät) nicht ausschalten? Man könnte eine schwächere Lichtquelle, d. h. eine Lichtquelle mit niedrigerer Intensität, benutzen, um die Interferenz nicht zu sehr zu stören. Da aber das Licht aus kleinsten Teilchen, den Photonen, besteht und sich die Streuung des Lichtes durch die Streuung der einzelnen Photonen vollzieht, sieht man die gestreuten Lichtblitze von gleicher Stärke, nur nicht mehr so oft. Bei geringer Intensität der Licht quelle treffen dann auch Elektronen auf den Detektor, ohne dass Licht vorher an ihnen gestreut wurde, d. h., ohne dass festgestellt wurde, ob sie durch Spalt 1 oder Spalt 2
10 | 2 Der Einfluss der Messung
gekommen sind. Diese Ereignisse liefern wieder eine Verteilung von der Form w mit Interferenzstrukturen. Die absolute Größe dieser Verteilung ist aber etwas geringer als die von w, da die Elektronen, welche durch das Licht gestreut wurden, von dieser Ver teilung ausgeschlossen sind. Letztere liefern hingegen wieder eine Verteilung ohne In terferenzerscheinungen. Die Gesamtverteilung aller Elektronen weist natürlich einen Interferenzcharakter auf. Die Interferenzstrukturen sind jedoch weniger ausgeprägt, da nicht alle Elektronen an der Interferenz teilnehmen. Die Interferenzstrukturen werden durch die über Compton-Streuung beobachteten Elektronen ausgewaschen. Das Ergebnis ist also nachvollziehbar: Haben wir das Elektron gesehen, haben wir es bei der Interferenz gestört. Je stärker die Lichtquelle ist, desto mehr Elektronen werden am Licht gestreut, und es wird somit festgestellt, durch welchen Spalt sie lau fen. Entsprechend wird die Wahrscheinlichkeitsverteilung immer mehr der von w12 ähneln. Umgekehrt trifft bei einer schwachen Lichtquelle die Mehrheit der Elektronen auf den Schirm, ohne gestreut zu werden, und führt deshalb zur Interferenz, d. h., liefert eine Verteilung der Form w. Ein alternativer Versuch, die Störung der Elektronen durch das Licht zu verrin gern, wäre, nicht die Intensität des Lichtes, sondern den Impuls bzw. die Frequenz der Photonen zu verringern. Dies entspricht einer Vergrößerung der Wellenlänge. Auch dies ist nicht beliebig möglich, da eine Lichtquelle, welche Licht der Wellenlänge λ emittiert, sich im Raum nicht mit einer Ungenauigkeit kleiner als λ lokalisieren lässt. Dies wird ersichtlich, wenn man sich vorstellt, dass die Lichtwelle durch einen Wel lenresonator erzeugt wird. Dieser muss mindestens λ/2 „beherbergen“ können. Wird also die Wellenlänge des Lichtes zu groß, so können wir nicht mehr feststellen, ob das gestreute Licht von einem Elektron hinter Spalt 1 oder hinter Spalt 2 resultiert. Zusammenfassend können wir feststellen: Jeder Messprozess, dessen Ziel es ist zu bestimmen, durch welchen Spalt das Elek tron geht, wird zwangsläufig das Elektron genügend stark stören, sodass die Inter ferenz zerstört wird und die Verteilung w in w12 = w1 + w2 übergeht. Das Doppelspaltexperiment zeigt in sehr anschaulicher Weise die Problematik des Messprozesses in der Quantenmechanik.
2.2 Die Problematik des Messprozesses in der Quantenmechanik Der Messprozess beinhaltet eine Wechselwirkung des zu messenden Systems mit der Messapparatur. In der klassischen Physik sind die Messobjekte makroskopische Syste me, und die Messapparatur kann so konstruiert werden, dass das zu messende System durch den Messprozess, d. h. durch die Wechselwirkung mit dem Messgerät, nicht we sentlich beeinflusst oder verändert wird. Beispielsweise verändert eine Längenmes
2.2 Die Problematik des Messprozesses in der Quantenmechanik |
11
sung eines makroskopischen Gegenstandes nicht dessen physikalischen Zustand. In klassischen Systemen besitzen die Observablen eine gewisse absolute Bedeutung: Die physikalischen Größen nehmen einen bestimmten Wert an, unabhängig davon, ob wir ihn messen oder nicht. Die Messung atomarer Systeme erfolgt ebenfalls mit makroskopischen Appa raturen. Wir können nur über makroskopische Geräte mit dem Mikrokosmos kom munizieren, da wir selbst makroskopische Dimensionen besitzen. Im Messprozess findet deshalb eine Wechselwirkung des zu messenden atomaren Systems mit dem makroskopischen Messapparat statt. Im Ergebnis der Messung entsteht eine für uns wahrnehmbare (makroskopische) Anzeige, also eine Änderung eines makroskopi schen Parameters. Spricht man also von dem Wert einer physikalischen Größe, so schließt dies immer einen Messprozess ein, der uns diesen Wert in Form einer makro skopischen Anzeige vermitteln kann. Dieser makroskopische Prozess kann (wegen der notwendigen Wechselwirkung im Messprozess) nicht ohne Rückwirkung auf das zu messende mikroskopische System sein und muss Letzteres beeinflussen bzw. ver ändern. Dadurch besitzen nur diejenigen physikalischen Größen einen bestimmten Wert, welche wir gerade messen, während wir den übrigen physikalischen Größen i. A. keinen bestimmten Wert zuordnen können, da diese durch den Messprozess teilweise auf unkontrollierbare Weise gestört werden. Dieser Zusammenhang zwi schen Messprozess und Messergebnis bzw. die hier zutage tretenden Grenzen der Messbarkeit im atomaren Bereich wurden zuerst von W. Heisenberg erkannt und als Unschärfeprinzip¹ bezeichnet. Dieses Prinzip beinhaltet: In einem Prozess, in dem es mehrere Alternativen gibt, führt die Bestimmung der Alternative, die realisiert ist, zur Auslöschung der Interferenz zwischen den Alternativen. Wir unterscheiden zwei Arten von Alternativen: 1. Exklusive bzw. sich ausschließende Alternativen: Spalt 1 oder Spalt 2 bilden Exklusivalternativen, wenn entweder einer der beiden Spalte geschlossen ist, oder ein Messapparat eindeutig bestimmt, durch welchen Spalt das Elektron geht. 2. Interferierende Alternativen: Spalt 1 und Spalt 2 bilden interferierende Alternativen, wenn erstens beide Spal te geöffnet sind und zweitens kein Versuch unternommen wird, zu bestimmen, durch welchen Spalt das Elektron geht.
1 In der klassischen Physik ist die Trajektorie (Bahn) eines Teilchens experimentell bestimmbar. Da mit lassen sich Ort und Impuls des Teilchens gleichzeitig messen. In der Quantenmechanik hingegen können Ort und Impuls eines Teilchens nicht gleichzeitig beliebig genau gemessen werden, wie wir im Folgenden noch explizit sehen werden.
12 | 2 Der Einfluss der Messung
Jede Alternative i ist mit einer gewissen Wahrscheinlichkeit w i = |K i |2 realisiert und wird durch eine Wahrscheinlichkeitsamplitude K i beschrieben. Für interferierende Alternativen ist die Gesamtwahrscheinlichkeitsamplitude K durch die Summe der Amplituden der einzelnen Alternativen K i gegeben: K = ∑ Ki .
(2.1)
i
Dies kann als das Grundpostulat der Quantentheorie bezeichnet werden. Aus ihm las sen sich die Gesetze der Quantentheorie ableiten, was in den nachfolgenden Kapiteln durchgeführt wird.
2.3 Alternativen und Unschärferelation Wenn das Elektron durch einen der beiden Spalte geht, wird es i. A. an dem Spalt gestreut, und die vertikale Komponente seines Impulses wird dabei verändert. Die se Impulsänderung ∆p ist für ein Elektron, das durch Spalt 1 geht, verschieden von der Impulsänderung, die ein Teilchen am Spalt 2 erfährt. Zur Messung dieser Impuls änderung bringen wir die Wand mit den beiden Spalten so an, dass sie in vertikaler Richtung (reibungslos) beweglich ist (Abb. 2.2). x
e−-Quelle
p
p
A
B
Δp
x
anstatt
C
Abb. 2.2: Doppelspaltexperiment mit Elektronen und beweglichem Doppelspalt.
Wegen der Impulserhaltung kann die Änderung der vertikalen Komponente des Elek tronenimpulses beim Durchgang durch einen der Spalte nur durch eine betragsmä ßig gleich große, entgegengesetzt gerichtete Impulsänderung der Wand kompensiert werden. Ein Elektron, das durch Spalt 2 läuft, wird nach oben abgelenkt, und folglich muss die Wand sich geringfügig nach unten bewegen. Umgekehrt wird ein Elektron,
2.3 Alternativen und Unschärferelation | 13
das durch Spalt 1 geht, nach unten reflektiert, und die Wand muss sich folglich nach oben bewegen. Eine eindeutige Bestimmung des Spalts, durch welchen das Elektron geht, verlangt hier eine Messung des Impulses der Wand mit einer Genauigkeit von mindestens ∆p = |∆p|. Nehmen wir nun an, die Messapparatur ist so eingerichtet, dass sie diese Genau igkeit erlaubt. Wir hätten dann eine eindeutige Bestimmung des Spalts, durch wel chen das Elektron läuft, und sollten, wenn das obige Resultat universell gültig ist, die für klassische Teilchen charakteristische Wahrscheinlichkeitsverteilung w12 aus Glei chung (1.1) ohne Interferenzstrukturen bekommen (Abb. 2.2). Wie kommt hier diese Wahrscheinlichkeitsverteilung zustande? Um die Wahrscheinlichkeitsverteilung auf dem Schirm C (Detektor) präzise ange ben zu können, müssen wir die vertikale Position des Spalts in B genau kennen. Wir müssen daher nicht nur den Impuls, sondern auch die Position der Wand B genau be stimmen. Wenn die Interferenzfigur w gemessen werden soll, muss die Position der Wand B genauer als d/2 bestimmt werden, wobei d der Abstand zweier Interferenz maxima ist. Falls die vertikale Position von B nicht mit dieser Genauigkeit bekannt ist, sondern nur mit einer Genauigkeit ∆x > 2d , so kann auch ein Punkt auf der Elektro nenverteilung auf C nicht mit größerer Genauigkeit als ∆x > d/2 angegeben werden, da der Schirm C an der Wand B kalibriert werden muss. Deshalb muss der Wert der Verteilung w(x) an einem bestimmten Punkt x über alle Werte von Punkten innerhalb einer Entfernung ∆x > d/2 von x gemittelt werden. Die Interferenzstrukturen werden dabei offensichtlich ausgelöscht, und es entsteht die klassische Verteilung w12 . Man könnte versuchen, Kenntnis über die genaue Position des Detektors (Bild schirm) C relativ zur Wand B mit den beiden Spalten zu bekommen, indem man den Detektor starr mit der Wand verbindet. Da der Detektor aber ein makroskopisches Messgerät ist, besitzt er eine makroskopische Masse, die sehr groß im Vergleich zur Elektronenmasse ist. Als Folge würde das Gesamtsystem Wand–Detektor durch die Ablenkung des Elektrons einen vernachlässigbar kleinen, experimentell nicht regis trierbaren Rückstoß erhalten, und wir könnten nicht mehr feststellen, durch welchen Spalt das Elektron geflogen ist. Gleichgültig, welche raffinierten experimentellen Anordnungen man sich aus denkt, um den Spalt, durch den das Elektron geht, zu bestimmen, ohne die Interferen zen zu zerstören – man wird immer an der makroskopischen Größe der Messapparatur scheitern. Versuchen wir nun eine quantitative Beschreibung dieses Resultates zu finden. Interferenzphänomene sind bekanntlich an Wellen gebunden. Deshalb können wir statt Elektronen auch Lichtquellen in dem Experiment benutzen, wie wir es früher be reits gemacht haben. Wir können deshalb unsere Kenntnisse aus der Optik zur quan titativen Beschreibung des Experimentes benutzen. Aus der Optik wissen wir, dass Interferenzmaxima dann auftreten, wenn die beiden interferierenden Lichtstrahlen Wegstrecken zurücklegen, welche sich um ein ganzzahliges Vielfaches der Wellenlän
14 | 2 Der Einfluss der Messung
ge λ voneinander unterscheiden (siehe Abb. 2.3). Da die Wegstrecken Q1 A und Q2 A gleich lang sind, tritt in A stets ein Interferenzmaximum auf. Das benachbarte Inter ferenzmaximum soll in B auftreten. Dazu muss die Strecke Q2 B um λ größer sein als die Strecke Q1 B: !
Q2 B − Q1 B = λ .
(2.2)
Aus dem Pythagoras-Satz folgt für diese Strecken Q1 B = √ l2 + (
2 a a d 2 − d) = l√1 + ( − ) 2 2l l
Q2 B = √ l2 + (
2 a a d 2 + d) = l√1 + ( + ) . 2 2l l
Für d ≪ l und a ≪ l können wir die Wurzeln entwickeln. In führender Ordnung liefert dies 1 a d 2 Q1 B ≃ l [1 + ( − ) + ⋅ ⋅ ⋅ ] 2 2l l Q2 B ≃ l [1 +
1 a d 2 ( + ) + ⋅⋅⋅] 2 2l l
und somit Q2 B − Q1 B ≃
ad . l
p
Q1
α1
Δp1
B
a
d A
C Q2
Δp2 α2 p
l
Abb. 2.3: Geometrie zur Auswertung des Doppelspaltexperimentes mit beweglichem Doppelspalt. Die Positionen der beiden Spalte, Q 1 und Q 2 , liegen spiegelsymmetrisch zur Achse durch A, siehe Text.
2.3 Alternativen und Unschärferelation
| 15
Vergleich mit (2.2) liefert die Beziehung d λ ≃ . l a
(2.3)
Aus der Abb. 2.3 ist außerdem ersichtlich, dass folgende Beziehungen gelten |∆p 1 | = tan α 1 = |p| |∆p 2 | = tan α 2 = |p|
a 2 a 2
−d , l +d . l
Für die Gesamtimpulsunschärfe ∆p = |∆p 1 | + |∆p 2 | erhalten wir folglich (p = |p|)
∆p a = . p l
(2.4)
Da in dem (in Abb. 2.2 gezeigten) Experiment keine Interferenzformen auftreten, muss die Ungewissheit ∆x in der Messung der vertikalen Position der Wand B größer als d/2 sein, d. h., mit (2.3) bzw. (2.4) ∆x ≥
d λ p =l =λ . 2 2a 2∆p
(2.5)
Beachten wir, dass für Photonen der Impuls p mit der Wellenzahl k = 2π/λ über p = ℏk = ℏ
2π λ
verknüpft ist, so finden wir aus (2.5) die Beziehung ∆x ⋅ ∆p > h/2 ,
(2.6)
die zuerst von W. Heisenberg gefunden wurde und als Heisenberg’sche Unschärferela tion bezeichnet wird.² Diese Beziehung werden wir später noch in allgemeinerer Form streng beweisen. Bisher gibt es keine experimentellen Hinweise auf eine Verletzung dieser Beziehung. Wie wir später sehen werden, wird diese Unschärferelation auch von der formalen Quantentheorie gefordert.
2 Streng genommen steht in der Heisenberg’schen Unschärferelation ℏ = h/2π statt h. Der Unter schied ist durch unsere Näherungen entstanden.
3 Die Wahrscheinlichkeitsamplitude Vom physikalischen Standpunkt aus sind die zwei Wege, welche das Elektron ent weder durch Spalt 1 oder Spalt 2 beschreiten kann, unabhängige Alternativen. Den noch ist die Gesamtwahrscheinlichkeit über beide Alternativen nicht die Summe der Einzelwahrscheinlichkeiten. Ähnlich wie bei dem elektrischen Feld von inter ferierenden Lichtwellen müssen wir die Wahrscheinlichkeit als Quadrat einer Wahr scheinlichkeitsamplitude berechnen und daher die Wahrscheinlichkeitsamplituden von interferierenden Prozessen zur Gesamtwahrscheinlichkeitsamplitude addieren. Wenn wir ein Ereignis oder einen Prozess vor seinem Abschluss durch eine Mes sung eines Zustandes des Teilchens, z. B. des Ortes des Elektrons, unterbrechen, so stören wir die Konstruktion der Gesamtamplitude. Wenn wir z. B. ein Teilchen in ei nem bestimmten Zustand beobachten, dann schließen wir die Möglichkeit aus, dass es sich in irgendeinem anderen Zustand befindet. Die Amplituden der ausgeschlos senen Zustände können dann nicht länger zur Gesamtamplitude beitragen und müs sen deshalb bei der Berechnung der Gesamtamplitude ausgeschlossen werden. Wenn wir z. B. mithilfe eines Messgerätes bestimmen, dass das Elektron durch Spalt 1 geht, dann ist die Wahrscheinlichkeitsamplitude dafür, dass das Elektron am Punkt x auf dem Schirm auftritt, gerade K1 , und die Amplitude K2 für den Durchgang durch den Spalt 2 kann nicht zur Gesamtamplitude beitragen. Dabei ist es unwichtig, ob wir tat sächlich das Ergebnis der Messung aufzeichnen oder zur Kenntnis nehmen. Solange nur die Messapparatur in Betrieb ist, könnten wir, falls wir wollten, das Ergebnis der Messung erfahren. Allein das Betreiben der Messapparatur ist ausreichend, um das System zu stören und die Wahrscheinlichkeitsamplitude zu verändern.
3.1 Die Struktur der Wahrscheinlichkeitsamplitude Die Wahrscheinlichkeitsamplitude (bzw. kurz Amplitude) für ein Ereignis ist die Sum me aller Amplituden für die möglichen alternativen Wege, durch welche das Ereig nis realisiert werden kann (2.1). Bei einem physikalischen Prozess gibt es i. A. sehr viele Alternativen. Dies erkennen wir sofort, wenn wir mehrere Wände mit mehreren Löchern zwischen Quelle und Detektor aufstellen. Verschiedene Wege sind für das Elektron möglich, und zu jeder dieser Alternativen gehört eine andere Amplitude. Das Ergebnis eines Experimentes, in dem all diese Löcher offen sind, entsteht durch Addi tion der Amplituden sämtlicher möglicher alternativer Wege (Abb. 3.1). Wir können mehr und mehr Löcher in die vorhandenen Wände bohren, bis sie schließlich nur noch aus „Löchern“ bestehen (Abb. 3.2). Die Summe über alle Alter nativen wird dann ein mehrfaches Integral, für jede Wand eine Integration über die vertikale Koordinate, welche die alternativen Höhen beschreibt, in denen das Elektron
https://doi.org/10.1515/9783110586022-003
3.1 Die Struktur der Wahrscheinlichkeitsamplitude | 17
Abb. 3.1: Interferierende Alternativen bei mehreren Wänden mit mehreren Löchern.
xb
xc
xd
xe
y
b
c
d
e
Abb. 3.2: Interferierende Alternativen bei völliger Entfernung der Wände an den Positionen yb , yc , yd .
die „Wand“ passiert: K(x e ) = ∫ dx b ∫ dx c ∫ dx d K(x e , x d , x c , x b ) . Wir können diese Prozedur fortsetzen und mehr und mehr Wände zwischen Quelle und Detektor setzen und immer mehr Löcher in die Wände bohren, bis nichts mehr von den Wänden übrig bleibt. Während dieses Prozesses verfeinern wir ständig den Weg der Elektronen, bis wir schließlich zu unendlich vielen Trajektorien x(y) der Elek tronen kommen, wobei x die Höhe des Elektrons über der Entfernung y von der Quelle angibt (Abb. 3.3). Während dieser Verfeinerung behalten wir das Konzept der Summa tion über unabhängige Alternativen (Superpositionsprinzip) bei, sodass wir schließ lich zur Summe über alle möglichen Trajektorien der Elektronen kommen: K = ∑ K[Wege x(y)] = ∑ K[x(y)] . {x(y)}
(3.1)
18 | 3 Die Wahrscheinlichkeitsamplitude
x
y
Abb. 3.3: Mögliche Wege, auf denen das Elektron von der Quelle zum Detektor gelangen kann.
Anstatt die Bahnen des Teilchens durch die vertikale Koordinate x als Funktion der horizontalen Koordinate y anzugeben, können wir die Teilchentrajektorie auch durch einen Parameter, z. B. durch die Zeit t, parametrisieren: x(t), y(t). Analog kennzeich nen wir eine Trajektorie im dreidimensionalen Raum durch einen Vektor r(t) = (x(t), y(t), z(t)) oder x(t) = (x1 (t), x2 (t), x3 (t)) . In der obigen Ableitung der Wahrscheinlichkeitsamplitude haben wir die verschie denen Alternativen der Teilchen durch Trajektorien beschrieben. Eine Trajektorie beinhaltet aber eine eindeutige Festlegung des Ortes als Funktion der Zeit x(t), und ̇ ̇ existiert. Ort und Impuls des Teilchens damit des Impulses p(t) = m x(t), sofern x(t) sind deshalb auf einer einzelnen Trajektorie scharf. Dies widerspricht jedoch nicht der Unschärferelation (2.6), da diese sich auf die Gesamtheit der interferierenden Al ternativen bezieht. Die als interferierende Alternativen erhaltenen Trajektorien x(t) müssen nicht der klassischen Bewegungsgleichung genügen und können deshalb beliebig „gezackt“ sein. Bisher haben wir immer die Wahrscheinlichkeitsamplitude für das Ereignis be trachtet, dass ein Teilchen von einer Quelle im Koordinatenursprung ausgeht und (xb , tb )
x(t) (xa , ta )
0 Abb. 3.4: Teilchentrajektorie x(t) von Ereignis (x a , t a ) zu Ereignis (x b , t b ).
3.1 Die Struktur der Wahrscheinlichkeitsamplitude | 19
nach einer Zeit t mit einem Detektor an einem bestimmten Ort gemessen wird. Ganz allgemein können wir nach der Wahrscheinlichkeitsamplitude für den Übergang ei nes Teilchens von einem Punkt x a zum Zeitpunkt t a zu einem anderen Punkt x b zum Zeitpunkt t b fragen (Abb. 3.4). Die möglichen Teilchentrajektorien x(t) müssen dann offenbar den Randbedingungen x(t a ) = x a ,
x(t b ) = x b
(3.2)
genügen. Da diese Amplitude die Wahrscheinlichkeit für den Übergang des Teilchens von einem Punkt im Raum zu einem anderen beschreibt, wird sie auch als Übergangs amplitude bezeichnet. Die Wahrscheinlichkeitsamplitude für eine einzelne Trajektorie x(t) schreiben wir als: K[x(t)](x b , t b ; x a , t a ) . Die Gesamtübergangsamplitude für den Übergang von (x a , t a ) nach (x b , t b ) erhält man dann nach (3.1), indem man über die Amplituden aller Trajektorien x(t) sum miert, die den entsprechenden Randbedingungen (3.2) genügen: K(x b , t b ; x a , t a ) =
∑
K[x(t)](x b , t b ; x a , t a ) .
(3.3)
Trajektorien x(t) x(t a )=x a , x(t b )=x b
Zur Vereinfachung der Notation führen wir folgende Bezeichnungen ein: a := (x a , t a ) ,
b := (x b , t b )
sowie ∑ := {x(t)}
∑
.
Trajektorien x(t) x(t a )=x a , x(t b )=x b
Gleichung (3.3) für die Übergangsamplitude schreibt sich dann in der kompakten Form K(b, a) = ∑ K[x(t)](b, a) . {x(t)}
Für eine eindimensionale Bewegung sind die Trajektorien, welche zur gesamten Über gangsamplitude beitragen und den entsprechenden Randbedingungen genügen, in Abb. 3.5 illustriert.
20 | 3 Die Wahrscheinlichkeitsamplitude
x
xb
xa
ta
tb
t
Abb. 3.5: Trajektorien der eindimensionalen Bewegung bei fest vorgegebenen Anfangs- und Endpunkten.
3.2 Der Zerlegungssatz Im Folgenden wollen wir die Übergangsamplitude K(b, a) explizit berechnen. Der Ein fachheit halber betrachten wir zunächst nur eindimensionale Bewegungen. Wir in teressieren uns für die Übergangsamplitude des Prozesses, in dem das Teilchen sich zum Zeitpunkt t a am Ort x a befindet und nach der Zeit t b − t a den Ort x b erreicht. Wir betrachten nun einen Zwischenzeitpunkt t c (Abb. 3.6). An einem solchen inter mediären Zeitpunkt kann das Teilchen alle möglichen Koordinatenwerte x(t c ) anneh men. Zu jedem Koordinatenwert x(t c ) = x c gehören alternative Wege, auf denen das Teilchen von (x a , t a ) nach (x b , t b ) gelangen kann. Nach dem Superpositionsprinzip, welches bekanntlich das Grundprinzip der gesamten Quantenmechanik ist, müssen die Amplituden über alle alternativen Wege bzw. Ereignisse summiert werden. Im vor x
xb
xc xa
ta
tc
tb
t
Abb. 3.6: Trajektorien, die zu einem Zwischenzeitpunkt t c durch einen festen Punkt x c laufen.
3.2 Der Zerlegungssatz
| 21
liegenden Fall bedeutet dies, dass über den intermediären Ort x c des Teilchens zum Zeitpunkt t = t c zu integrieren ist. Die Gesamtübergangsamplitude erhalten wir dem zufolge, indem wir zunächst die Amplitude vom Ausgangspunkt a zum intermediären Punkt c ≡ (x c , t c ) betrachten und diese mit der Wahrscheinlichkeitsamplitude für den Übergang des Teilchens aus dem intermediären Punkt c in den Endpunkt b multipli zieren und nach dem Superpositionsprinzip über alle intermediären Koordinaten x c integrieren, d. h.: K(b, a) = ∫ dx c K(b, c)K(c, a) .
(3.4)
Diese Beziehung wird als Zerlegungssatz bezeichnet und stellt eine Integralgleichung für die Übergangsamplitude dar. Der Zerlegungssatz ist sozusagen das Huygens’sche Prinzip der Quantenmecha nik. In der klassischen Optik kann jeder Punkt einer Wellenfront als Ausgangspunkt einer neuen Kugelwelle betrachtet werden. Damit ist die Wellenfront in einzelne Teil wellen aufspaltbar, deren Summe bzw. Integral wieder die ursprüngliche Welle ergibt. Genauso wird hier die Übergangsamplitude an einem intermediären Zeitpunkt in Teil übergangsamplituden aufgespalten. Der Zerlegungssatz (3.4) ist eine nicht lineare Beziehung für die Übergangs amplitude K: Auf der rechten Seite steht ein Produkt von zwei Amplituden, während auf der linken Seite nur eine steht. Diese Gleichung legt deshalb die Normierung der Amplitude K fest. In der Tat ersetzen wir im Zerlegungssatz K durch αK (α = const.), so erhalten wir: ∞
2
αK(b, a) = α ∫ dx c K(b, c)K(c, a) . −∞
Dieser Ausdruck stimmt nur für α = 1 mit dem Zerlegungssatz überein. Der Zerle gungssatz legt jedoch nicht nur die Normierung fest: Führen wir in der Gleichung des Zerlegungssatzes den Grenzübergang t c → t b durch, so finden wir: ∞
∫ dx c ( lim K(x b , t b ; x c , t c )) K(x c , t b ; x a , t a ) = K(x b , t b ; x a , t a ) . −∞
t c →t b
Der Limes t c → t b lässt sich im zweiten Faktor problemlos nehmen, führt jedoch auf eine „gleichzeitige“ Amplitude im ersten Faktor, die möglicherweise singulär ist, wes halb wir den Limes hier noch nicht vollzogen haben. Diese Beziehung muss für belie bige äußere Koordinaten x a und x b gelten. Sie kann deshalb nur erfüllt sein, wenn für eine beliebige Funktion f(x) gilt: ∞
∫ dx c lim K(x b , t b ; x c , t c )f(x c ) = f(x b ) . −∞
t c →t b
22 | 3 Die Wahrscheinlichkeitsamplitude
Dies ist aber gerade die Definition der δ-Funktion (siehe Anhang A). ∞
∫ dx c δ(x b − x c )f(x c ) = f(x b ) . −∞
Folglich ist die Übergangsamplitude für gleiche Zeitargumente identisch mit der δ-Funktion im Ortsraum: lim K(x b , t b ; x c , t c ) ≡ δ(x b − x c ) .
t c →t b
(3.5)
Integrieren wir diese Gleichung über die Endkoordinate x = x b des Teilchens, so er ∞ halten wir mit t b = t, t c = t − ε, x c = x und ∫−∞ dx δ(x − x ) = 1: ∞
lim ∫ dx K(x, t; x , t − ε) = 1 .
ε→0
−∞
Diese Beziehung, welche die Normierung der Amplitude festlegt, hat eine anschauli che physikalische Bedeutung und beinhaltet die Erhaltung der Materie bzw. der Wahr scheinlichkeit: Ein Teilchen, das sich zur Zeit t−ε am Ort x befand, muss sich zur Zeit t irgendwo im Raum befinden. Wenn wir die Wahrscheinlichkeitsamplitude für diesen Übergang über alle Endkoordinaten summieren bzw. integrieren, müssen wir wieder den Wert 1 finden, da sich das Teilchen irgendwo befinden muss. Wir können nun fortfahren, den Zerlegungssatz (3.4) auf die Teilamplituden für die Bewegung von a nach c und von c nach b anzuwenden, indem wir das Zeitintervall [t a , t c ] und [t c , t b ] weiter in kleinere Zeitintervalle [t a , t d ]∪[t d , t c ] bzw. [t c , t e ]∪[t e , t b ] unterteilen (Abb. 3.7). Nach dem Superpositionsprinzip muss sich die Gesamtampli tude wieder durch Summation der Amplituden der alternativen Ereignisse gewinnen lassen, d. h., es muss die Beziehung gelten: K(b, a) = ∫ dx d ∫ dx c ∫ dx e K(b, e)K(e, c)K(c, d)K(d, a) .
x
xk
xb
xa
ta
tk
t tb
Abb. 3.7: Zerlegung einer Trajektorie in (infinitesimal) kleine Zeitintervalle.
3.2 Der Zerlegungssatz
|
23
Diese sukzessive Zerlegung der Zeitintervalle können wir fortsetzen, bis wir das gesamte Zeitintervall [t a , t b ] in N (→ ∞) infinitesimal kleine Intervalle der Länge ε (→ 0) zerlegt haben: t b − t a = Nε , t0 = t a
t k = t0 + kε
tN = tb ,
x0 = x a
xk
xN = xb ,
k = (x k , t k ) . Nach dem Superpositionsprinzip ergibt sich die Gesamtamplitude wieder durch Mul tiplikation aller Teilamplituden für die infinitesimalen Intervalle und anschließender Integration über die Koordinaten des Teilchens zu den intermediären Zeiten. Die Ge samtamplitude lässt sich also schreiben als: N−1
K(b, a) = ∫ K(N, N − 1) ∏ dx k K(k, k − 1) .
(3.6)
k=1
Interpretieren wir nun die intermediären Koordinaten x k als Teilchenkoordinaten auf einer Trajektorie x(t), d. h., x k ≡ x(t k ) , (3.7) und nehmen den Limes N → ∞, so erzeugt die Integration über die intermediären Koordinaten x k gerade die Summation über alle Trajektorien x(t), und wir erhalten für die Gesamtamplitude das bereits früher intuitiv aus dem Experiment gefundene Resultat K(b, a) = ∑ K[x(t)](b, a) . {x(t)}
Die Gesamtamplitude lässt sich wiederum als Summe über die Amplituden aller mög lichen Teilchentrajektorien schreiben, welche den vorgegebenen Anfangs- und End bedingungen x(t a ) = x a bzw. x(t b ) = x b genügen (Abb. 3.5). Ferner finden wir aus (3.6), dass die Wahrscheinlichkeitsamplitude für eine einzelne Trajektorie x(t) durch das Produkt der Amplituden für die infinitesimalen Zeitintervalle ε = t k − t k−1 gegeben ist: N
K[x](b, a) = ∏ K(k, k − 1) .
(3.8)
k=1
Dieses intuitiv klare Ergebnis ist in Einklang mit der Wahrscheinlichkeitstheorie, wenn man beachtet, dass eine einzelne Trajektorie x(t) aus einer Folge von sich ein ander bedingenden Ereignissen der Evolution auf den infinitesimalen Zeitabschnitten t k − t k−1 von x k−1 nach x k besteht. Die Wahrscheinlichkeit einer Folge von sich einan der bedingenden Ereignissen ist bekanntlich durch das Produkt der Wahrscheinlich keiten der einzelnen Teilereignisse gegeben. Dasselbe Multiplikationsgesetz gilt hier für die Wahrscheinlichkeitsamplituden.
24 | 3 Die Wahrscheinlichkeitsamplitude
3.3 Vergleich mit der klassischen Mechanik Die quantenmechanische Übergangsamplitude K(x b , t b ; x a , t a ) erhalten wir, indem wir die Wahrscheinlichkeitsamplitude aller möglichen Trajektorien x(t) summieren, welche den Randbedingungen x(t a ) = x a und x(t b ) = x b genügen (Abb. 3.5). Die Be tonung liegt hier auf alle möglichen Trajektorien. Diese Trajektorien können ein be liebiges Zeitverhalten besitzen. Sie können beliebig zackig sein, müssen jedoch stetig sein und dürfen wegen der Kausalität nur eine Bewegung in positiver Zeitrichtung be schreiben. Vergleichen wir diese Situation mit der klassischen Mechanik. Hier bewegt sich ein Teilchen nur entlang der Trajektorie minimaler Wirkung. Die Wirkung ist durch tb
̇ S[x] = ∫ dt L(x(t), x(t), t)
(3.9)
ta
gegeben, wobei die Lagrange-Funktion für die Bewegung eines (Punkt-)Teilchens der Masse m in einem Potenzial V(x) die Form L(x, x)̇ =
m 2 ẋ − V(x) 2
(3.10)
besitzt. An dieser Form der Lagrange-Funktion kann man schon erkennen, dass die klassische Trajektorie nicht „zackig“, sondern relativ glatt sein wird. Ein Knick in der Trajektorie würde bedeuten, dass ẋ (unendlich) groß und damit S ebenfalls sehr groß wäre. Die klassische Trajektorie ist jedoch die mit minimalem S. Extremieren wir die Wirkung (siehe Gleichung (D.13)), δS[x] ! =0, δx(t) unter den vorgegebenen Randbedingungen x(t a ) = x a ,
x(t b ) = x b ,
so erhalten wir die bekannte Euler-Lagrange-Gleichung ∂L d ∂L − =0. ∂x dt ∂ ẋ
(3.11)
Für eine Lagrange-Funktion der Form (3.10) erhalten wir aus der Euler-Lagrange-Glei chung die Newton’sche Bewegungsgleichung m ẍ = −
∂V(x) . ∂x
3.4 Die explizite Form der Übergangsamplitude |
25
Multiplizieren wir die Newton-Gleichung mit der Geschwindigkeit x,̇ m ẍ ẋ = −ẋ
∂V(x) , ∂x
so finden wir die Energieerhaltung d m 2 d ( ẋ + V(x)) = E=0. dt 2 dt Die Energieerhaltung ist also eine Konsequenz der Stationarität der Wirkung. In der Quantenmechanik tragen beliebige Trajektorien zur Übergangsamplitude bei. Diese Trajektorien extremieren i. A. die Wirkung nicht, und folglich bleibt die (klassische) Energie entlang dieser Trajektorien nicht erhalten. Wir werden später je doch sehen, dass die Energie zumindest im Mittel erhalten bleibt. Zusammenfassend können wir als Unterschied zwischen klassischer und Quantenmechanik festhalten: In der klassischen Mechanik erfolgt die Bewegung (bei vorgegebenen Randbedin gungen) auf einer Trajektorie extremaler (gewöhnlich minimaler) Wirkung, entlang der die (klassische) Energie erhalten bleibt. Demgegenüber erfolgt die Bewegung in der Quantenmechanik auf allen möglichen Trajektorien, die den vorgegebenen Randbedingungen genügen. Entlang dieser Trajektorien ist die Energie i. A. nicht erhalten.
3.4 Die explizite Form der Übergangsamplitude Damit die Überlagerung der Amplituden der einzelnen Trajektorien zu Interferenz phänomenen führen kann, müssen diese vorzeichenbehaftet bzw. komplex sein. Wir müssen deshalb erwarten, dass die Übergangsamplitude der quantenmechanischen Teilchen i. A. eine komplexe Zahl sein wird. Dies gilt sowohl für die Amplitude einer Trajektorie x(t) des gesamten Zeitintervalls, K[x](b, a) = A[x](b, a)e iϕ[x](b,a) , als auch für die Teilamplitude eines infinitesimalen Zeitintervalls: K(k, k − 1) = A(k, k − 1)e iϕ(k,k−1) . In den obigen Gleichungen bezeichnen jeweils A = |K| den Betrag und ϕ die (reel le) Phase der Amplitude. Aus Gleichung (3.8) folgt, dass die folgenden Beziehungen gelten müssen: N
N
A[x](b, a) = ∏ A(k, k − 1) ,
ϕ[x](b, a) = ∑ ϕ(k, k − 1) .
k=1
k=1
26 | 3 Die Wahrscheinlichkeitsamplitude
Die letzte Gleichung bedeutet insbesondere, dass die Phase der Amplitude eine addi tive Größe ist und sich aus der Summe der Phasen der einzelnen Teilabschnitte der Trajektorien zusammensetzt. Die bisher unbekannte Phase der Amplitude einer Tra jektorie muss also eine additive Größe sein, welche die Trajektorie des Teilchens cha rakterisiert. Die einzige additive Größe¹ dieser Art, die wir aus der klassischen Physik kennen, ist die Wirkungsfunktion tb
S[x](b, a) ≡ S[x] (x b , t b ; x a , t a ) = ∫ dt L(x, x,̇ t) , ta
̇ die sich unter Benutzung der Definition des Riemann-Integrals (L(x(t), x(t), t) ≡ L(t)), tb
N
∫ dt L(t) = lim ε ∑ L(t k ) ε→0
ta
(3.12)
k=1
und der Ableitung ̇ k ) = lim x(t
ε→0
x(t k ) − x(t k−1 ) x k − x k−1 = lim ε→0 ε ε
(3.13)
schreiben lässt als: N
S[x](a, b) = lim ∑ S(k, k − 1) , ε→0
(3.14)
k=1
wobei
x k − x k−1 (3.15) , tk ) ϵ die Wirkung des infinitesimalen Teilabschnittes (k, k − 1) der Trajektorie x(t) ist. Die Wirkung einer Trajektorie ist demnach gleich der Summe der Wirkungen der Teilab schnitte der Trajektorie, und wir erwarten deshalb, dass die Phase ϕ der Amplitude mit der Wirkung verknüpft ist.² Wegen der Additivität beider Größen muss ein Zu sammenhang zwischen ihnen linear sein. Da außerdem die Phase dimensionslos sein muss, schreiben wir sie in der Form ̇ k ), t k ) = ϵL (x k , S(k, k − 1) := ϵL (x(t k ), x(t
ϕ(k, k − 1) =
1 S(k, k − 1) + ϕ0 , ℏ
1 Die Länge des Weges wäre natürlich auch eine additive Größe. Diese spielt jedoch keine besondere Rolle in der klassischen Mechanik. In der relativistischen Physik jedoch ist die Wirkung einer Punkt masse bis auf einen Proportionalitätsfaktor gerade durch die Länge des Weges im vierdimensionalen Minkowski-Raum gegeben. 2 Diese Wahl erscheint hier vielleicht etwas willkürlich. Man könnte ja auch beliebige neue additive Größen definieren. Aber wir werden später sehen, dass allein mit der Annahme, dass die Wirkung die gesuchte additive Größe ist, sich die Schrödinger-Gleichung „ableiten“ lässt. Zum anderen wird die Phase eindeutig als die Wirkung identifiziert, wenn wir fordern, dass für makroskopische Objekte, d. h. für Objekte mit einer großen Wirkung, die Quantenmechanik in die bekannte klassische Mechanik übergeht, wie wir in Kapitel 5 explizit zeigen werden.
3.4 Die explizite Form der Übergangsamplitude |
27
wobei ϕ0 eine dimensionslose Konstante ist, die wir weiter unten bestimmen werden. Ferner ist ℏ eine Konstante von der Dimension der Wirkung. Ihr numerischer Wert lässt sich nur aus dem Experiment bestimmen. Man findet ℏ = 1,0546⋅10−34 Js. Diese Größe wird als Planck’sches Wirkungsquantum ℏ bezeichnet. Damit nimmt die Amplitude für einen infinitesimalen Zeitabschnitt der Trajektorie folgende Gestalt an: i K(k, k − 1) = A(k, k − 1)e iϕ0 exp [ S(k, k − 1)] . ℏ
(3.16)
Für die Amplitude (3.8) der gesamten Trajektorie x(t) erhalten wir mit (3.14): i ̃ K[x](b, a) = A(b, a)e ℏ S[x](b,a) ,
wobei
̃ A(b, a) = A(b, a)e iNϕ0
komplex ist. Im Folgenden zeigen wir, dass mit Kenntnis der Phase der Amplitude ihr Betrag durch den in Abschnitt 3.2 erhaltene Zerlegungssatz eindeutig bestimmt ist. Dazu neh men wir in der Übergangsamplitude für ein infinitesimales Zeitintervall (3.16) K(k, k − 1) ≡ K (x k , t k ; x k−1 , t k − ϵ) den gleichzeitigen Limes ϵ → 0. Mit (3.5) liefert das 1
lim K(k, k − 1) = lim [A(k, k − 1)e iϕ0 e ℏ S(k,k−1) ] = δ (x k − x k−1 ) ,
ϵ→0
ϵ→0
(3.17)
wobei die Wirkung für ein infinitesimales Zeitintervall S(k, k − 1) in Gleichung (3.15) gegeben ist. Nehmen wir an, dass die Lagrange-Funktion die übliche Form ̇ L(x(t), x(t)) =
m 2 ẋ (t) − V(x(t)) 2
besitzt, so finden wir für diese Größe S(k, k − 1) ≡ S (x k , t k ; x k−1 , t k − ϵ) = ϵ [
m x k − x k−1 2 ( ) − V(x k )] . 2 ϵ
Setzen wir diesen Ausdruck in (3.17) ein, so erhalten wir lim K(x k , t k ; x k−1 , t k − ε)
ε→0
m x k − x k−1 2 i = lim A(x k , t k ; x k−1 , t k − ε)e iϕ0 exp [ ε ( ( ) − V(x k ))] ε→0 ℏ 2 ε = δ(x k − x k−1 ) . Für ε → 0 divergiert der kinetische Term im Exponenten wie 1/ε, während der Poten zialterm gegen null geht. Damit reduziert sich obige Beziehung auf: lim A(x k , t k ; x k−1 , t k − ε)e iϕ0 exp [
ε→0
i m (x k − x k−1 )2 ] = δ(x k − x k−1 ) . ℏ 2ε
(3.18)
28 | 3 Die Wahrscheinlichkeitsamplitude
Benutzen wir die Darstellung der δ-Funktion, λ λ δ(x) = lim √ exp (i x2 ) , 2 λ→∞ i2π
(3.19)
welche in Abschnitt 5.2 bewiesen wird, mit λ = m/εℏ und x = x k − x k−1 , so erhalten wir m i m exp ( (x k − x k−1 )2 ) . δ(x k − x k−1 ) = lim √ ε→0 i2πℏε ℏ 2ε Der Vergleich mit Gleichung (3.18) zeigt, dass der Vorfaktor der Übergangsamplitude für infinitesimale Zeiten ε → 0 durch A(x k , t; x k−1 , t − ε)e iϕ0 = √
m i2πℏε
gegeben ist. Somit ergibt sich die Übergangsamplitude für ein infinitesimal kleines Zeitintervall (3.16) zu:³ K(k, k − 1) = √
m i m x k − x k−1 2 exp [ ε ( ( ) − V(x k ))] . i2πℏε ℏ 2 ε
(3.20)
Für kleine, aber endliche ε liefert Gleichung (3.20) eine „ausgeschmierte“ δ-Funktion der Breite ε. Dementsprechend ist die Übergangsamplitude K(x, t; x , t − ε) für kleine (endliche) Zeitintervalle ε nur für Trajektorien zwischen nahe beieinanderliegenden Orten x und x wesentlich von null verschieden. Gleichung (3.20) setzen wir jetzt in den Ausdruck (3.6) für die Gesamtübergangs amplitude K(b, a) des endlichen Zeitintervalls [t a , t b ] ein. Bei der Zerlegung des endli chen Zeitintervalls in kleine Zeitintervalle hatten wir vorausgesetzt, dass die Intervall länge ε infinitesimal klein ist. Wir müssen daher noch den Limes ε → 0 bzw. N → ∞ nehmen und erhalten schließlich für die Gesamtamplitude: K(b, a) = lim ∫ dx N−1 . . . dx1 ε→0 ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ (N→∞)
Summation (Integration) über alle Wege N
m i N m x k − x k−1 2 (√ ) exp [ ε ∑ ( ( ) − V(x k ))] . i2πℏε ℏ k=1 2 ε ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟
(3.21)
Gewicht eines Weges
3 Der aufmerksame Leser mag sich hier fragen, weshalb wir den Potenzialterm ϵV(k) im Exponen ten von K(k, k − 1) beibehalten, da er im später zu verwendenden Limes ϵ → 0 verschwindet. Der Grund ist, dass es im Ausdruck (3.8) für die Gesamtamplitude für ein endliches Zeitintervall K(b, a) unendlich viele solcher Terme gibt, die sich im Limes ϵ → 0 zum Riemann-Integral N
tb
lim ϵ ∑ V(x k ) = ∫ dtV(x(t))
ϵ→o
k=1
ta
aufsummieren und den Potenzialanteil der Wirkung ergeben.
3.4 Die explizite Form der Übergangsamplitude | 29
Für ε → 0 geht die Anzahl der Zeitintervalle N gegen unendlich. Im Exponenten können wir diesen Grenzübergang explizit ausführen und erhalten nach Gleichun gen (3.12) und (3.13) die klassische Wirkung (3.9) tb
S[x](b, a) = ∫ dt (
m 2 ẋ − V(x)) 2
ta
zurück. Ferner ist es bequem, den Ausdruck N
lim dx N−1 . . . dx1 (√
ε→0 (N→∞)
m ) =: Dx(t) i2πℏε
(3.22)
als funktionales Integrationsmaß (im Unterschied zum Riemann’schen Integrations maß) zu definieren. Der Ausdruck für die Übergangsamplitude (3.21) nimmt dann fol gende Form an, x(t b )=x b
K(b, a) =
∫
i
Dx(t) e ℏ S[x](b,a) ,
(3.23)
x(t a )=x a
die als Funktionalintegral bezeichnet wird. Das Funktionalintegral ist hier eine kom pakte Schreibweise für die Summation über alle Trajektorien und wird deshalb häu fig als Pfadintegral bezeichnet.⁴ Im Gegensatz zum gewöhnlichen Riemann-Integral wird hier nicht über eine Variable summiert, sondern über alle Funktionen x(t), die den vorgegebenen Randbedingungen x(t a ) = x a und x(t b ) = x b genügen. Das Funk tionalintegral ist damit ein unendlichdimensionales Riemann-Integral. Wir können es jedoch stets auf ein vieldimensionales Riemann-Integral zurückführen, indem wir das Zeitintervall diskretisieren, d. h. in infinitesimale Zeitintervalle unterteilen, was uns auf den Ausdruck (3.21) für die Übergangsamplitude zurückführt. Diese Darstel lung des Funktionalintegrals erlaubt uns insbesondere eine explizite Berechnung der Übergangsamplitude. In einigen Fällen lassen sich diese Integrale explizit ausführen, so z. B. für ein freies Teilchen, bei dem das Potenzial verschwindet. Für andere, kom pliziertere Fälle werden wir effizientere Methoden kennenlernen, die Übergangsam plitude zu bestimmen, ohne das Funktionalintegral explizit berechnen zu müssen. Da die Übergangsamplitude die Ausbreitung des quantenmechanischen Teilchens von ei nem Ort x a zum Zeitpunkt t a zu einem anderen Ort x b zur Zeit t b beschreibt, wird diese Übergangsamplitude auch als Ausbreitungsfunktion oder Propagator bezeichnet.
4 Die Pfadintegralformulierung der Quantenmechanik geht auf P. Dirac zurück. Sie wurde von R. Feynman vervollständigt und auf die Quantenfeldtheorie angewandt.
30 | 3 Die Wahrscheinlichkeitsamplitude
3.5 Phasenraumdarstellung des Propagators Die klassische Mechanik kann entweder im Lagrange-Formalismus oder im kanoni schen bzw. Hamilton-Formalismus formuliert werden. Die Wirkung ist im HamiltonFormalismus durch die Gleichung S[p, x] = ∫ dt (p ẋ − H(p, x))
(3.24)
definiert. Hierbei ist H(p, x) =
p2 + V(x) 2m
die klassische Hamilton-Funktion. Im Hamilton-Formalismus haben wir anstatt Koordinate und Geschwindigkeit nun Koordinate und Impuls als unabhängige Va riablen,⁵ welche gemeinsam den Phasenraum aufspannen. Extremieren wir die ka nonische Form der Wirkung (3.24) bezüglich der unabhängigen Variablen p und x, so erhalten wir die Hamilton’schen Bewegungsgleichungen ṗ = −
∂V , ∂x
ẋ =
p . m
Diese beiden Gleichungen sind offenbar der Euler-Lagrange-Gleichung bzw. der New ton’schen Bewegungsgleichung äquivalent. Auch der quantenmechanische Propagator lässt sich entweder im Lagrange- oder Hamilton-Formalismus darstellen. Im Folgenden transformieren wir die oben abgelei tete Lagrange-Form des quantenmechanischen Propagators in die kanonische Form. Dazu benutzen wir die Identität √
m i m exp ( (x k − x k−1 )2 ) i2πℏε ℏ 2ε ∞
= ∫ −∞
2 dp k i p i exp (− ε k + p k (x k − x k−1 )) . 2πℏ ℏ 2m ℏ
(3.25)
Diese Identität ergibt sich sofort, wenn man auf der rechten Seite das Quadrat vervoll ständigt und das entstehende Gauß-Integral⁶ ausführt.
5 Der Übergang von dem Lagrange-Formalismus zum Hamilton-Formalismus erfolgt durch eine Le gendre-Transformation von den Geschwindigkeiten ẋ zu den Impulsen p als unabhängige Variable. 6 Streng genommen handelt es sich hier um ein Gauß-Integral mit imaginären Exponenten, welches auch als Fresnel-Integral bezeichnet wird. Durch analytische Fortsetzung lässt es sich offenbar in ein gewöhnliches Gauß-Integral (mit reellen Exponenten) überführen, siehe Anhang (B. Wir werden das Fresnel-Integral explizit in Abschnitt 5.1 berechnen und damit die Identität (3.25) reproduzieren, siehe Gleichung (5.4).
3.5 Phasenraumdarstellung des Propagators
| 31
Setzen wir diese Beziehung in Gleichung (3.21) ein, so erhalten wir für den Propa gator: dp N dp N−1 dx N−1 dp1 dx1 ... 2πℏ 2πℏ 2πℏ N p2 x k − x k−1 i × exp [ ε ∑ (p k − ( k + V(x k )))] . ℏ k=1 ε 2m
K(b, a) = lim ∫ ε→0
(3.26)
Im Limes ε → 0 geht der Ausdruck im Exponenten in die kanonische Form der klassi schen Wirkung S[p, x] (3.24) über. Definieren wir das Integrationsmaß des unendlich dimensionalen Riemann-Integrals über Koordinaten und Impulse wieder als Funktio nalintegrationsmaß,
dp N N−1 dp k dx k lim ∫ ∫∏ =: ∫ Dp(t) ε→0 2πℏ k=1 2πℏ
x(t b )=x b
∫
Dx(t) ,
x(t a )=x a
so erhalten wir für die Phasenraumdarstellung des quantenmechanischen Propa gators: x(t b )=x b
K(b, a) = ∫ Dp(t)
∫
i
Dx(t) e ℏ S[p,x](b,a) .
x(t a )=x a
Diese Darstellung besagt, dass wir den quantenmechanischen Propagator erhalten, i indem wir über alle Trajektorien des Phasenraumes mit dem Gewicht e ℏ S[p,x] der klassischen Wirkung summieren, wobei S[p, x] die kanonische Form (3.24) der klassi schen Wirkung ist. In Analogie zur Darstellung des quantenmechanischen Propaga i tors im Ortsraum (3.3) können wir deshalb e ℏ S[p,x] als die Wahrscheinlichkeitsampli tude zur Phasenraumtrajektorie x(t), p(t) bezeichnen. Die Gesamtübergangsamplitu de K(b, a) ergibt sich wieder durch Summation der Wahrscheinlichkeitsamplituden sämtlicher interferierender Alternativen, d. h. sämtlicher Phasenraumtrajektorien, die den Randbedingungen (3.2) genügen: x(t b )=x b
K(b, a) = ∫ Dp(t)
∫ x(t a )=x a
Dx(t) K[p(t), x(t)] ,
i
K[p(t), x(t)] = e ℏ S[p,x] .
32 | 3 Die Wahrscheinlichkeitsamplitude
1.
2.
In der Phasenraumdarstellung des Propagators (3.26) trägt jeder Freiheitsgrad, welcher durch jeweils eine Koordinate und einen Impuls charakterisiert ist, zum Integrationsmaß einen Faktor 1/2πℏ bei. Die physikalische Interpretation dieses Faktors wird später gegeben. In der Funktionalintegral-Darstellung des Propagators wird über den Endimpuls p N ≡ p(t N ) der Phasenraumtrajektorie, nicht aber über die Endkoordinate x N integriert. Diese Koordinate wird durch die äußere Randbedingung x N = x b vorgegeben. Der äußere Impuls, d. h. der Endimpuls lässt sich jedoch nicht gleichzeitig mit der Endposition des Teilchens vorgeben, sondern es wird bei vorgegebenem Ort über den Impuls integriert, d. h., der Impuls des Teilchens am Ende der Trajektorie, wo der Ort fest vorgegeben ist, ist völlig unbestimmt. Dies ist in Übereinstimmung mit der Unschärferelation (2.6): ∆x → 0
⇒
∆p → ∞ .
3.6 Der Propagator eines freien Teilchens Im Folgenden wollen wir den quantenmechanischen Propagator für ein freies Teil chen (V(x) = 0) in der Phasenraumdarstellung explizit berechnen. Die HamiltonFunktion besitzt hier die einfache Gestalt p2 . 2m Setzen wir diese Form in die Phasenraumdarstellung des Propagators ein, so erhalten wir: H(p, x) =
K(b, a) = ∫
p2 x k − x k−1 dp N N−1 dp k dx k i N exp [ ε ∑ (p k − k )] . ∫∏ 2πℏ k=1 2πℏ ℏ k=1 ε 2m
Die Impulsintegrale sind Gauß-Integrale und könnten im Prinzip unmittelbar ausge führt werden. Dies würde uns auf die Lagrange-Darstellung des Propagators führen. Es ist jedoch einfacher, zuerst die Integrale über die Ortsvariablen auszuführen. Dazu sortieren wir zunächst die Exponenten nach den Ortskoordinaten x k . Integrieren wir nun z. B. über x1 , so erhalten wir die Fourier-Darstellung der δ-Funktion:⁷ ∞
∞
∫ dx1 e ℏ x1 (p1 −p2 ) = ℏ ∫ dz e iz(p1−p2 ) = 2πℏδ(p1 − p2 ) . i
−∞
−∞
Anschließende Integration über p1 liefert: ∞
∫ −∞
p2 dp1 i p2 i i 2πℏδ(p1 − p2 ) exp (− ε 1 − x0 p1 ) = exp [− (ε 2 + p2 x0 )] . 2πℏ ℏ 2m ℏ ℏ 2m
7 Bei Anwesenheit eines Potenzials lässt sich die Integration über den Ort i. A. nicht in geschlossener Form durchführen. Ausnahmen sind Potenziale der Gestalt V(x) = a2 x 2 + a1 x + a0 mit beliebigen reellen Koeffizienten a2 , a1 , a0 . Jedoch führt in diesem Fall die Integration über den Ort nicht zur Impulserhaltung. (Im ortsabhängigen Potenzial sind die Impulse natürlich nicht erhalten.)
3.6 Der Propagator eines freien Teilchens | 33
Führen wir jetzt die Integration über x2 aus, erhalten wir: ∞
∫ dx2 e ℏ x2 (p2 −p3 ) = 2πℏδ(p2 − p3 ) . i
−∞
Aufgrund der entstehenden δ-Funktion lässt sich nun das Integral über den Impuls p2 in trivialer Weise ausführen. Wir erhalten: ∞
∫ −∞
p2 dp2 i i 2πℏδ(p2 − p3 ) exp (− 2ε 2 − x0 p2 ) 2πℏ ℏ 2m ℏ
p2 i = exp [− (2ε 3 + x0 p3 )] . ℏ 2m Dieses Spiel der sukzessiven Ausintegration von Ort- und Impulsvariable lässt sich fortführen, bis zum Schluss nur noch das Integral über den Endimpuls des Teilchens übrig bleibt: ∞
K(b, a) = ∫ −∞
p2 dp N i i exp (− Nε N + p N (x N − x0 )) . 2πℏ ℏ 2m ℏ
Beachten wir, dass x0 = x a und x N = x b , und bezeichnen die verbleibende Impulsva riable mit p, so erhalten wir für den Propagator schließlich die Darstellung ∞
K(x b , t b ; x a , t a ) = ∫ −∞
dp p2 i i exp (− (t b − t a ) + p(x b − x a )) . 2πℏ ℏ 2m ℏ
(3.27)
Die obige Ableitung des quantenmechanischen Propagators des freien Teilchens zeigt: Durch Integration über die intermediären Koordinaten x i = x(t i ) des Teilchens (d. h. durch die Summation über alle Trajektorien im Ortsraum) hat das freie Teilchen ei nen wohldefinierten, intermediären Impuls p i erhalten, der in der Zeitentwicklung erhalten bleibt. Die Gesamtübergangsamplitude setzt sich aus den Beiträgen von al len beliebigen (zeitlich erhaltenen) Impulsen zusammen. In der Tat zeigt (3.27), dass der Propagator durch eine Überlagerung von ebenen Wellen mit der Wellenzahl k=
p , ℏ
−∞ < k < ∞
(3.28)
und der Frequenz ω=
E , ℏ
E=
p2 2m
(3.29)
gegeben ist. Während Anfangs- und Endkoordinate der Trajektorien, die zur Über gangsamplitude beitragen, fixiert sind, ist der erhaltene Impuls völlig unbestimmt. Dies ist in Übereinstimmung mit der Heisenberg’schen Unschärfebeziehung: Geben
34 | 3 Die Wahrscheinlichkeitsamplitude
wir Anfangs- und Endkoordinaten des Ortes vor, so ist der Ort exakt bekannt, d. h., die Unschärfe verschwindet: ∆x = 0. Demzufolge muss der Impuls absolut unscharf sein. Dies drückt sich durch die Integration über die Impulse, d. h. durch die Summa tion über die Trajektorien mit allen möglichen Impulsen aus. Formal ist (3.27) ein gewöhnliches Fourier-Integral: ∞
K (x b , t b ; x a t a ) = ∫ −∞
dp i p(x b −x a ) K (t b , t a ; p) . eℏ 2πℏ
Hierbei ist K (t b , t a ; p) = exp (−
(3.30)
i p2 (t b − t a )) ℏ 2m
offenbar die Wahrscheinlichkeitsamplitude für die Ausbreitung des Teilchens wäh rend der Zeit t b − t a mit konstantem Impuls p. Das in (3.27) verbleibende Impulsintegral lässt sich natürlich ausführen. Wir er halten dann die Lagrange-Darstellung des Propagators: K(x b , t b ; x a , t a ) = √
m i m (x b − x a )2 ) exp ( i2πℏ(t b − t a ) ℏ 2 tb − ta
(3.31)
i
≡ A(t b − t a )e ℏ S(b,a) . Der Exponent ist wieder durch die klassische Wirkung S(b, a) =
m (x b − x a )2 m 2 = v (t b − t a ) , 2 tb − ta 2
v=
xb − xa tb − ta
gegeben, welche die Propagation des freien Teilchens mit konstanter Geschwindig keit v beschreibt. Drücken wir diese Wirkung in der kanonischen Form ̄ b − ta ) , ̄ b − x a ) − E(t S(b, a) = p(x
p̄ = mv ,
p̄ 2 Ē = 2m
nach (3.24) aus, so erhalten wir für den Propagator des freien Teilchens: K(x b , t b ; x a , t a ) = √
m i ̄ i ̄ b − x a ) − E(t exp ( p(x b − t a )) . i2πℏ(t b − t a ) ℏ ℏ
(3.32)
Vergleichen wir diese Darstellung mit (3.27), so stellen wir folgenden Unterschied fest: Während in (3.27) die quantenmechanische Amplitude durch Superposition der i Amplituden e ℏ S aller möglichen Trajektorien zu den vorgegebenen Randpunkten gegeben ist, die sich in den Impulsen p unterscheiden, wird in (3.32) dieselbe Ampli tude allein durch den Beitrag der stationären Trajektorie p̄ = mv, welche die Wirkung minimiert, gegeben. Anstatt des Integrals über p, d. h. der Summation über alle Tra jektorien mit p = const. (ebenen Wellen), haben wir hier jedoch einen Vorfaktor
3.7 Energiedarstellung des Propagators
| 35
√m/(2iπℏ(t b − t a )), der offenbar den Effekt der Summation über die verschiedenen p-Trajektorien und damit die Quanteneffekte enthalten muss.⁸ Dies wird besonders deutlich, wenn man beachtet, dass für das Gauß-Integral über p die stationäre Pha senapproximation (siehe Abschnitt 5.1) exakt ist. Die stationäre Trajektorie, die den Exponenten von (3.27) bezüglich p extremiert, ist in der Tat die klassische Trajektorie p̄ = mv, v = (x b −x a )/(t b −t a ), und das Integral über die Impulsfluktuationen p = p− p̄ liefert gerade den Vorfaktor in (3.32). Die Darstellung (3.32) zeigt, dass der quantenme chanische Propagator des freien Teilchens durch eine ebene Welle mit zeitabhängiger Amplitude gegeben ist. Letztere beschreibt den Effekt der Quantenfluktuationen des Teilchens um die klassische Trajektorie. Lassen wir im Propagator (3.31) die Endzeit gegen die Anfangszeit streben und beachten, dass K nur von der Zeitdifferenz abhängt, so finden wir mit (5.13): lim K(x b , t b ; x a , t a ) = lim K(x b , ε; x a , 0) = δ(x b − x a ) .
t b →t a
ε→0
Dieses Ergebnis hatten wir bereits früher für den Propagator eines Teilchens in einem beliebigen Potenzial gefunden (siehe Gleichung (3.5)). Abschließend bemerken wir noch, dass der Propagator des freien Teilchens (3.31) korrekt normiert ist: ∞
∫ dx b K(x b t b ; x a t a ) = 1 . −∞
3.7 Energiedarstellung des Propagators Die oben in den Abschnitten 3.1, 3.2, 3.3, 3.4 angestellten Überlegungen zur Übergangs amplitude gelten für beliebige zeitabhängige Potenziale. Im vorliegenden Abschnitt wollen wir uns auf Potenziale beschränken, die nicht von der Zeit abhängen. Für zeit unabhängige Potenziale bleibt die Energie eines klassischen Teilchens erhalten. We gen der Homogenität der Zeit darf für solche Potenziale der Propagator K(x, t; x , t ) nur von der Zeitdifferenz t − t abhängen. Der quantenmechanische Propagator K(x, t; x , t ) beschreibt die Ausbreitung des Teilchens von (x , t ) nach (x, t). Wie wir früher gesehen hatten, erfolgt diese Aus breitung auf allen möglichen Trajektorien zwischen den vorgegebenen Randpunkten. Diese Trajektorien haben eine beliebig komplizierte Gestalt und bei der Bewegung des Teilchens auf einer solchen Trajektorie bleibt deshalb die Energie i. A. nicht er halten, sodass das quantenmechanische Teilchen (selbst im zeitunabhängigen Poten zial) während seiner Zeitevolution keine scharfe Energie besitzt. Wir können jedoch
8 Es ist eine Besonderheit des freien Teilchens, dass alle Quanteneffekte in einem Vorfaktor enthalten sind. Dies ist i. A. nicht der Fall!
36 | 3 Die Wahrscheinlichkeitsamplitude
den vollen Propagator mittels Fourier-Transformation nach Komponenten mit schar fer Energie entwickeln (analog zur Fourier-Zerlegung des Propagators des freien Teil chens (3.30) in Komponenten mit scharfem Impuls): ∞
K(x, t; x , t ) = ∫ −∞
dE − i E(t−t ) e ℏ K(x, x ; E) . 2πℏ
Der Propagator zur festen Energie E ist dann durch die inverse Fourier-Transformation ∞
K(x, x ; E) = ∫ dT e ℏ ET K(x, t; x , t ) i
(3.33)
−∞
mit T = t − t gegeben. Setzen wir hier auf der rechten Seite den Propagator des freien Teilchens (3.27) ein und benutzen die Fourier-Darstellung der δ-Funktion (A.17), so erhalten wir für den freien Propagator mit fester Energie ∞
K(x, x ; E) = ∫ dp e ℏ p(x−x ) δ (E − i
−∞
p2 ) . 2m
(3.34)
Dieser Propagator gibt die Wahrscheinlichkeitsamplitude für die Ausbreitung des frei en Teilchens mit Energie E von x nach x an. Zum Integral tragen nur solche Impulse p = ±√2mE
(3.35)
bei, für welche das klassische Teilchen die vorgegebene Energie E besitzt. Unter Be nutzung von (A.11) und (A.14) finden wir nach Ausführen des Integrals K(x, x ; E) = √
i√ i√ 2m (e ℏ 2mE(x−x ) + e− ℏ 2mE(x−x ) ) E
Dies ist eine Überlagerung von ebenen Wellen mit den bei vorgegebener Energie E klassisch erlaubten Impulsen (3.35).
3.8 Der Propagator einer Punktmasse in drei Dimensionen Die obigen Betrachtungen lassen sich unmittelbar auf die Bewegung eines Teilchens in mehreren Dimensionen verallgemeinern. Hierzu sind lediglich die Koordinaten und Impulse durch die entsprechenden Vektoren zu ersetzen: x→x,
p→p.
Mit der angepassten Notation a = (x a , t a )
b = (x b , t b )
3.8 Der Propagator einer Punktmasse in drei Dimensionen | 37
findet man für den quantenmechanischen Propagator einer Punktmasse m im ℝ3 x(t b )=x b
K(b, a) =
∫
i
Dx(t)e ℏ S[x](b,a) ,
(3.36)
x(t a )=x a
wobei das Pfadintegral über sämtliche Trajektorien x(t) summiert, die den Randbe dingungen x(t a ) = x a , x(t b ) = x b genügen und S[x](b, x) die klassische Wirkung dieser Trajektorien ist. Zerlegen wir das Zeitintervall t b − t a wieder in infinitesimale Abschnitte ε und definieren t k = t a + kε , so ist mit⁹ d3 x k (vgl. (3.22))
x k = x(t k ) ,
= d(x k )1 d(x k )2 d(x k )3 das funktionale Integrationsmaß durch
Dx(t) := lim d3 x N−1 . . . d3 x1 ( ε→0 (N→∞)
3N/2 m ) i2πℏε
gegeben. Für ein freies Teilchen lässt sich das Funktionalintegral (3.36) analog zum ein dimensionalen Fall in geschlossener Form ausführen und man erhält (vgl. Gleichun gen (3.27) und (3.31)) ∞
K(b, a) = ∫ −∞
= (√
d3 p i p2 i exp [− (t b − t a ) + p(x b − x a )] 3 ℏ 2m ℏ (2πℏ) 3 m i m (x b − x a )2 ] , ) exp [ i2πℏ(t a − t a ) ℏ 2 tb − ta
wobei wir im letzten Ausdruck die Integrationen über die kartesischen Impulskompo ∞ ∞ ∞ ∞ nenten ∫−∞ d3 p = ∫−∞ dp1 ∫−∞ dp2 ∫−∞ dp3 ausgeführt haben.
9 (x k )1 , (x k )2 , (x k )3 bezeichnen die kartesischen Koordinaten des Vektors x k .
4 Die Wellenfunktion 4.1 Wellenfunktion und Übergangsamplitude Der bisher betrachtete quantenmechanische Propagator (d. h. die Übergangsampli tude) K(b, a) = K(x b , t b ; x a , t a ) gibt die Wahrscheinlichkeitsamplitude für das Ereignis an, dass sich ein Teilchen, welches sich zum Zeitpunkt t = t a am Ort x = x a befand, nach dem Zeitintervall t b − t a am Ort x = x b befindet. Dementsprechend ist |K(x b , t b ; x a , t a )|2 die Wahrscheinlichkeit, ein Teilchen zur Zeit t = t b am Ort x = x b anzutreffen, falls es zur Zeit t = t a am Ort x = x a registriert wurde. Im Sinne der Wahrscheinlichkeitstheo rie ist dies eine sogenannte bedingte Wahrscheinlichkeit: |K(b, a)|2 ist die Wahrschein lichkeit dafür, dass das Ereignis b = (x b , t b ) eintritt, falls das Ereignis a = (x a , t a ) eingetreten ist. Im atomaren Bereich lassen sich jedoch in einem Experiment i. A. nicht die bedingten Wahrscheinlichkeiten |K(b, a)|2 bestimmen, sondern nur die unbeding ten (echten) Wahrscheinlichkeiten, ein Teilchen zu einem bestimmten Zeitpunkt t = t b am Ort x = x b zu finden. Diese unbedingte Wahrscheinlichkeit wollen wir mit w(x b , t b ) bezeichnen und die zugehörige Wahrscheinlichkeitsamplitude mit ψ(x b , t b ), sodass gilt: w(x b , t b ) = |ψ(x b , t b )|2 . (4.1) Die unbedingte Wahrscheinlichkeit w(x b , t b ) wird auch als Aufenthaltswahrschein lichkeit bezeichnet, da sie die Wahrscheinlichkeit angibt, ein Teilchen zum Zeitpunkt t = t b am Ort x = x b zu registrieren. Da sich das betrachtete Teilchen irgendwo im Raum aufhält, muss die Aufenthaltswahrscheinlichkeit zu einem beliebigen Zeit punkt t offensichtlich der Normierungsbedingung ∞
∫ dx w(x, t) = 1
(4.2)
−∞
genügen. Drücken wir hier die Aufenthaltswahrscheinlichkeit w(x, t) nach (4.1) durch ihre Wahrscheinlichkeitsamplitude ψ(x, t) aus, so lautet die Normierungsbedin gung (4.2): ∞
∞
∫ dx |ψ(x, t)| = ∫ dx ψ∗ (x, t)ψ(x, t) = 1 . 2
−∞
−∞
Wir wollen jetzt untersuchen, wie sich die Aufenthaltswahrscheinlichkeit w(x, t) bzw. ihre Amplitude ψ(x, t) im Verlaufe der Zeit verändert. Dazu nehmen wir an, wir hätten https://doi.org/10.1515/9783110586022-004
4.1 Wellenfunktion und Übergangsamplitude |
39
zum Zeitpunkt t = t0 eine Ortsmessung des Teilchens durchgeführt und das Teilchen am Ort x = x0 registriert. Zu einem späteren Zeitpunkt t a > t0 besitzt das Teilchen keinen scharf bestimmten Ort mehr, denn eine Ortsmessung zum Zeitpunkt t = t a würde uns die Verteilung der Aufenthaltswahrscheinlichkeit w(x a , t a ) = |K(x a , t a ; x0 , t0 )|2
(4.3)
liefern. In diesem Fall stimmt die Wahrscheinlichkeitsamplitude ψ(x a , t a ) mit der Übergangsamplitude K(x a , t a ; x0 , t0 ) überein, wie ein Vergleich von (4.1) und (4.3) zeigt: ψ(x a , t a ) ≡ K(x a , t a ; x0 , t0 ) . (4.4) Messen wir den Ort des Teilchens nicht zur Zeit t = t a , sondern erst zu einer späteren Zeit t = t b > t a , so gilt analog zu (4.4): ψ(x b , t b ) = K(x b , t b ; x0 , t0 ) .
(4.5)
Die in Gleichung (4.3) und (4.5) auftretenden Übergangsamplituden K(x a , t a ; x0 , t0 ) und K(x b , t b ; x0 , t0 ) sind über den Zerlegungssatz (3.4) miteinander verbunden: K(x b , t b ; x0 , t0 ) = ∫ dx a K(x b , t b ; x a , t a )K(x a , t a ; x0 , t0 ) . Hieraus erhalten wir mit Gleichungen (4.4) und (4.5) eine analoge Beziehung für die Wahrscheinlichkeitsamplitude ψ(x, t): ψ(x b , t b ) = ∫ dx a K(x b , t b ; x a , t a )ψ(x a , t a ) .
(4.6)
Dies ist das gesuchte Evolutionsgesetz für die Wahrscheinlichkeitsamplitude ψ(x, t). Es besitzt eine sehr anschauliche Interpretation: Die Wahrscheinlichkeitsamplitude ψ(x b , t b ) zu einem Zeitpunkt t b ergibt sich aus der Amplitude ψ(x a , t a ) eines frühe ren Zeitpunktes t a < t b , indem wir entsprechend dem Superpositionsprinzip die Über gangsamplitude K(b, a) mit dem Gewicht ψ(x a , t a ) über alle Anfangskoordinaten x a summieren bzw. integrieren, siehe Abb. 4.1. Die Größe ψ(x b , t b ) enthält keinerlei Referenz mehr zum Anfangszeitpunkt t a oder zur Anfangskoordinate x a , wohl aber noch Information darüber. Sie wird na türlich durch die Anfangsverteilung ψ(x a , t a ) und damit durch die Vorgeschichte mitbestimmt. Die Wahrscheinlichkeitsamplitude ψ(x b , t b ) wird als Wellenfunktion bezeichnet, da sich ihre Evolutionsgleichung (4.6) in eine Wellengleichung umwan deln lässt, wie wir später noch sehen werden.
40 | 4 Die Wellenfunktion xb
xa
K
ψ(xa , ta )
ta
Re ψ(xb , tb )
tb
Abb. 4.1: Illustration des Evolutionsgesetzes (4.6) für die Wellenfunktion (4.15) für ein freies Teilchen und ein Zeitintervall (t b − t a ) ℏ / m a2 = 3.
4.2 Die Wellenfunktion des freien Teilchens Ist die Wellenfunktion für einen beliebigen Zeitpunkt t0 bekannt, also ψ(x, t = t0 ) = ψ0 (x) ,
(4.7)
so lässt sich aus Gleichung (4.6) und der Kenntnis der expliziten Form des Propaga tors (3.27) die Wellenfunktion des freien Teilchens für einen beliebigen späteren Zeit punkt gewinnen. Einsetzen von (3.27) und (4.7) in (4.6) liefert: ∞
ψ(x, t) = ∫ −∞
∞
i dp i i p2 exp ( px − t) ∫ dx e− ℏ px ψ0 (x ) . 2πℏ ℏ ℏ 2m
−∞
Hierbei haben wir der Einfachheit halber die Anfangszeit t0 = 0 gesetzt. Das Ortsinte gral liefert gerade die Fourier-Transformierte der Anfangswellenfunktion ∞
ψ0 (p) ≡ ∫ dx e− ℏ px ψ0 (x ) , i
(4.8)
−∞
sodass
∞
ψ(x, t) = ∫ −∞
dp i p2 exp [ (px − t)] ψ0 (p) . 2πℏ ℏ 2m
Wir betrachten nun einige Beispiele für die Anfangsverteilung der Teilchen.
(4.9)
4.2 Die Wellenfunktion des freien Teilchens | 41
1.
Zum Zeitpunkt t = 0 habe die Wellenfunktion die Form einer ebenen Welle mit Impuls p0 : i (4.10) ψ p0 (x) = e ℏ p0 x . Setzen wir diesen Ausdruck in (4.8) ein, so finden wir für die Fourier-Transfor mierte eine δ-Funktion im Impulsraum: ψ p0 (p) = 2πℏδ(p − p0 ) . Für die zeitabhängige Wellenfunktion (4.9) erhalten wir dann offenbar wieder eine ebene Welle mit Impuls p0 : i p20 i t) . ψ p0 (x, t) = exp ( p0 x − ℏ ℏ 2m
(4.11)
Dies zeigt, dass eine ebene Welle auch in der Zeitentwicklung eine ebene Welle bleibt, was auch anschaulich völlig klar ist: Eine Teilchenverteilung, die be reits gleichmäßig über den gesamten Raum verteilt ist, kann sich nicht noch weiter ausbreiten. Ohne Einfluss eines lokalisierten Potenzials, d. h. einer äu ßeren Kraft, kann sie sich auch nicht im Raum lokalisieren. Für das sogenannte Überlappungsintegral zweier Wellenfunktionen (4.11) mit Impulsen p1 und p2 finden wir: ∞
∫ dx ψ∗p1 (x, t)ψ p2 (x, t) = 2πℏδ(p1 − p2 ) .
(4.12)
−∞
2.
Lassen wir hier p1 gegen p2 gehen, so stellen wir fest, dass das Normierungs integral (4.12) für die Wellenfunktion (4.11) divergiert (→ 2πℏδ(0)). Die Wel lenfunktion (4.10) kann also kein einzelnes Teilchen beschreiben. Eine ebene Welle mit einer von null verschiedenen Amplitude kann deshalb nur ein En semble von (unendlich vielen) freien Teilchen mit demselben Impuls beschrei ben. Die Wellenfunktion sei zum Zeitpunkt t0 = 0 im Ortsraum am Punkt x = x0 lokalisiert und durch (4.13) ψ x0 (x) = δ(x − x0 ) gegeben. Die Fourier-Transformation der δ-Funktion liefert: ψ x0 (p) = e− ℏ px0 . i
Setzen wir dieses Ergebnis in Gleichung (4.9) ein, so erhalten wir: ∞
ψ x0 (x, t) = ∫ −∞
i dp i i p2 exp ( px − t) e− ℏ px0 . 2πℏ ℏ ℏ 2m
42 | 4 Die Wellenfunktion
Die Ausführung des Impulsintegrals liefert den bereits früher gewonnenen Ausdruck für die Übergangsamplitude eines freien Teilchens (3.31), das sich zum Zeitpunkt t = 0 am Ort x0 befand: ψ x0 (x, t) = √
m i m (x − x0 )2 exp ( ) . i2πℏt ℏ2 t
(4.14)
Mit der Beziehung (5.13) zeigt man leicht, dass diese Wellenfunktion für t → 0 die Anfangsbedingung (4.13) erfüllt: lim ψ x0 (x, t) = δ(x − x0 ) . t→0
Für t > 0 beschreibt diese Wellenfunktion offenbar eine in der Zeit zerfließende δ-förmige Verteilung, siehe Abb. 4.2. Wir beobachten hier, dass ein im Ort lokalisiertes Teilchen sich in der Quanten mechanik mit wachsender Zeit mehr und mehr im Raum ausbreitet, was durch das Zerfließen der Wellenfunktion zum Ausdruck kommt. Berechnen wir das Überlappungsintegral zweier Wellenfunktionen (4.14), welche zum Zeitpunkt t = 0 an den Orten x1 und x2 lokalisiert sind, so finden wir: ∞
∫ dx
∞
ψ∗x1 (x)ψ x2 (x)
−∞
m i m i m x22 − x21 = ∫ dx exp ( x(x1 − x2 )) exp ( ) 2πℏt ℏ t ℏ2 t −∞
= δ(x1 − x2 ) exp (
i m x22 − x21 ) = δ(x1 − x2 ) . ℏ2 t
Für x1 → x2 finden wir für das Normierungsintegral δ(0) → ∞. Die Wellen funktionen (4.14) sind also nicht normierbar. Auch die δ-Funktion kann also kein einzelnes Teilchen beschreiben.
Re ψx0 (x, t)
t x0 Abb. 4.2: Realteil der Wellenfunktion (4.14) für verschiedene Zeiten.
4.3 Wellenpakete | 43
4.3 Wellenpakete Die beiden oben betrachteten Wellenfunktionen stellen mathematische Idealisierun gen dar, die in der Natur nicht realisierbar sind. Die ebene Welle (4.10) besitzt einen scharfen Impuls p0 und muss deshalb nach dem Unschärfeprinzip eine unendlich große Ortsunschärfe besitzen (die ebene Welle ist im ganzen Raum ausgebreitet). Um gekehrt besitzt die im Ortsraum lokalisierte δ-Funktion einen scharfen Ort (∆x = 0) und demzufolge eine unendlich große Impulsunschärfe (∆p → ∞). In der Tat tra gen zur δ-Funktion sämtliche Fourier-Komponenten (Impulse) bei. Ein in der Natur realisiertes Teilchen wird hingegen sowohl eine endliche Orts- als auch Impulsun schärfe besitzen, in Einklang mit der Unschärferelation (∆p ∆x ≳ ℏ/2), die wir in Ab schnitt 11.4 noch streng ableiten werden. Betrachten wir deshalb nun eine im Ort lokalisierte Wellenfunktion mit einer end lichen Ortsunschärfe. Dazu „verschmieren“ wir die δ-Funktion etwas, was uns auf eine Gauß-Verteilung 1 1 (x − x0 )2 (4.15) exp (− ) 2 a2 √a√π führt, wobei der Vorfaktor so gewählt wurde, dass diese Funktion auf 1 normiert ist. Diese Funktion ist ebenfalls bei x = x0 lokalisiert, besitzt jedoch eine endliche Brei te a, die wir als Ortsunschärfe interpretieren können. Im Limes a → 0 geht sie in √δ(x − x0 ) über. Die Wellenfunktion (4.15) beschreibt ein am Ort x0 mit einer Unschär fe ∆x ∼ a lokalisiertes Teilchen. Um ein sich bewegendes Teilchen zu erhalten, multi plizieren wir die Funktion (4.15) noch mit einer ebenen Welle: ψ0 (x) =
1 √a√π
exp (−
i 1 (x − x0 )2 ) e ℏ p0 x . 2 2 a
(4.16)
Bestimmen wir auch für diese Anfangswellenfunktion ihre zeitliche Entwicklung. Da zu berechnen wir zunächst wieder ihre Fourier-Transformierte (4.8): ψ0 (p) =
1
∞
∫ dx : e− ℏ x(p−p0) exp (− i
√a√π −∞
1 (x − x0 )2 ) . 2 a2
Das hier auftretende Ortsintegral ist ein gewöhnliches Gauß-Integral, welches wir durch Vervollständigung des Quadrates berechnen: ψ0 (p) =
1 √a√π
∞
e
− ℏi (p−p 0 )x 0
∫ dx e− ℏ (x−x0)(p−p0) exp (− i
−∞
= √2a√ πe− ℏ (p−p0)x0 exp (− i
1 (p − p0 )2 ) . 2 (ℏ/a)2
(x − x0 )2 ) 2a2 (4.17)
Die Fourier-Transformierte ψ0 (p) enthält zwar wieder eine ebene Welle im Impuls raum, diese ist jedoch mit einer Gauß-Verteilung der Breite ℏ/a gewichtet, die große
44 | 4 Die Wellenfunktion Abweichungen |p − p0 | ≫ ℏ/a des Impulses p vom mittleren Impuls p0 stark unter drückt. Die Breite der Impulsverteilung repräsentiert offenbar die Impulsunschärfe. Man beachte hierbei jedoch, dass die Breiten der Wellenfunktionen ψ sich von den Breiten der Wahrscheinlichkeitsverteilungen |ψ|2 um einen Faktor √2 unterscheiden. In der Tat besitzt die Wahrscheinlichkeitsverteilung im Ortsraum |ψ0 (x)|2 =
1 (x − x0 )2 exp (− ) a2 a√π
die Breite ∆x = a/√2, während die Wellenfunktion ψ0 (x) aus (4.16) selbst die Breite a besitzt. In analoger Weise besitzt die Wahrscheinlichkeitsverteilung im Impulsraum |ψ0 (p)|2 = 2a√ π exp (−
(p − p0 )2 ) (ℏ/a)2
die Breite ∆p = ℏ/a√2. Die Unschärfe bezieht sich auf die Wahrscheinlichkeitsvertei lungen, sodass ℏ a ℏ ∆p ∆x = = a √2 √2 2 gilt. Setzen wir die Fourier-Transformierte ψ0 (p) aus (4.17) in Gleichung (4.9) ein, so erhalten wir: ∞
ψ(x, t) = √2a√ π ∫ −∞
i dp i px i p2 1 (p − p0 )2 e ℏ exp (− t) e− ℏ (p−p0)x0 exp (− ) . 2πℏ ℏ 2m 2 (ℏ/a)2
(4.18) Solche Überlagerungen von ebenen Wellen mit Gauß’scher Gewichtsfunktion wer den als Gauß’sche Wellenpakete bezeichnet. Das verbleibende Gauß-Integral über dem Impuls lässt sich am einfachsten durch Verschiebung der Integrationsvariablen p → p − p0 = p berechnen. Dies liefert eine „ebene Welle“ i
ψ(x, t) = A x0 ,p0 (x, t)e ℏ p0 x exp (−
i p20 t) ℏ 2m
(4.19)
mit einer orts- und zeitabhängigen „Amplitude“, siehe Abb. 4.3, ∞
2
dp ℏt p0 1 p p A x0 ,p0 (x, t) =√2a√ π ∫ exp [− ( ) (a2 +i )] exp [i ((x−x0 ) − t) ] 2πℏ 2 ℏ m ℏ m −∞
= √2a√ π [2π (a2 + i
tℏ −1/2 1 [(x − x0 ) − p0 t/m]2 exp (− ) . )] m 2 a2 + i(tℏ/m)
Für die Aufenthaltswahrscheinlichkeitsdichte des Teilchens mit dieser Wellenfunkti on erhalten wir mit (α, u, v-reell) α α exp ( (u − iv)) ) = exp ( 2 u + iv u + v2 2 α α 2u) ) = exp ( 2 ⇒ exp ( u + iv u + v2
4.3 Wellenpakete |
45
ReΨ(x, t = fest)
x
x0
Abb. 4.3: Realteil des Gauß’schen Wellenpaketes (4.19). Die einhüllende gestrichelte Kurve gibt den Realteil von ±A x0 ,p0 (x, t) an.
eine Gauß-Verteilung, w(x, t) = |ψ(x, t)|2 =
2a√π 2π (a4 + (tℏ/m)2 )
1/2
exp (−
1 [(x − x0 ) − (p0 /m)t]2 ) , (4.20) 2 b 2 (t)
deren Breite b(t), b 2 (t) =
1 2 tℏ 2 [a + ( ) ] , 2 ma
(4.21)
mit der Zeit anwächst. Die Wellenfunktion beschreibt deshalb eine zerfließende GaußVerteilung, deren Schwerpunkt sich auf der Trajektorie eines freien klassischen Teil chens gemäß p0 t x0 + m mit der Geschwindigkeit p0 /m ausbreitet. Die Breite b(t) (4.21) der Gauß-Verteilung (4.20) schreiben wir in der Form b(t) = b 0 √1 + (
2
tℏ ) , 2mb 20
(4.22)
wobei b 0 = a/√2 die Breite zum Zeitpunkt t = 0 bezeichnet. Die Zeit t d , nach der sich die Breite verdoppelt hat (d. h. b(t d ) = 2b 0 ), ist nach (4.22) durch 2
1+(
td ℏ ! ) =4 2mb 20
⇒
t d = √3
2mb 20 ℏ
gegeben. Für ein Elektron mit einer Anfangsbreite b 0 = 0,5𝔸 = 0,5 ⋅ 10−10 m beträgt diese Zeit etwa t d ≃ 10−18 s, während für ein klassisches Teilchen der Masse m = 1 g mit b 0 = 1 mm diese etwa t d ≃ 1018 Jahre beträgt.
46 | 4 Die Wellenfunktion
4.4 Materiewellen Allgemein versteht man unter Wellenpaketen Überlagerungen von ebenen (stationä ren) Wellen e ikx , k = p/ℏ mit beliebiger Amplitude A(k) und Frequenz ω(k): ∞
ψ(x, t) = ∫ −∞
dk A(k )e ik x−iω(k )t . 2π
(4.23)
In vielen Fällen wie z. B. beim Gauß’schen Wellenpaket ist die Amplitude A(k ) nur in einer kleinen Umgebung einer mittleren Wellenzahl k wesentlich von null verschie den, während die Frequenz ω(k ) eine i. A. monoton steigende Funktion der Wellen zahl k ist, siehe Abb. 4.4. Zum Integral (4.23) trägt dann nur ein kleines Intervall um k wesentlich bei, und die Frequenzverteilung kann durch die (Taylor-)Entwicklung ω(k ) = ω(k) +
dω(k ) (k − k) dk k =k
ersetzt werden. Das Wellenpaket (4.23) lässt sich dann in Form einer ebenen Welle ψ(x, t) = A k (x, t)e ikx−iω(k)t
(4.24)
mit orts- und zeitabhängiger Amplitude (k̄ := k − k) ∞
dω(k) t)] A k (x, t) = ∫ d k̄ A(k + k)̄ exp [i k̄ (x − dk
(4.25)
−∞
schreiben.¹ Die Wellenfronten der Trägerwelle e i(kx−ω(k)t) = e ik(x−
ω(k) k
t)
,
definiert durch e ik(x−
ω(k) k
t)
= const.
⇒
x−
ω(k) t = const. , k
breiten sich mit der Phasengeschwindigkeit
vph =
ω(k) k
1 Für das durch Gleichungen (4.9) und (4.16) definierte Gauß’sche Wellenpaket (4.18) ist nach Glei chung (4.19) die Darstellung (4.24) exakt. Für dieses Wellenpaket ist ω(k) = ℏk2 /2m und die Amplitu de A(k) ist durch ψ0 (p = ℏk) (4.17) gegeben.
4.4 Materiewellen | 47
A(k )
ω(k )
k k Abb. 4.4: Typische Amplitudenfunktion A(k ) und Frequenzfunktion ω(k ) eines Wellenpaketes (4.23).
aus. Für die Fronten konstanter Amplituden, definiert durch A(x, t) = const. , gilt nach (4.25) dω(k) t = const. dk Sie breiten sich deshalb mit der Gruppengeschwindigkeit x−
vg =
dω dk
(4.26)
aus. Für die modulierte Welle (4.24) ist die Aufenthaltswahrscheinlichkeit ω(x, t) = |ψ(x, t)|2 = |A k (x, t)|2 allein durch die Amplitude gegeben, die sich mit der Gruppengeschwindigkeit aus breitet. Materieteilchen breiten sich deshalb stets mit der Gruppengeschwindigkeit aus, während mit der Phasengeschwindigkeit keine Ausbreitung von physikalischer Information verknüpft ist. Für ein Teilchen ist die Frequenz ω(k) durch seine Energie und die Wellenzahl k durch seinen Impuls gegeben (siehe Gleichungen (3.28) und (3.29)): E = ℏω(k) , sodass vph = gilt.
E , p
p = ℏk ,
vg =
∂E ∂p
48 | 4 Die Wellenfunktion
Ein nicht relativistisches freies Teilchen besitzt die (kinetische) Energie E=
p2 2m
(4.27)
und somit die Phasengeschwindigkeit v ph =
p , 2m
während seine Gruppengeschwindigkeit vg =
p m
beträgt. Das durch das Wellenpaket beschriebene, im Ort und Impuls lokalisierte Teil chen breitet sich demnach mit der Gruppengeschwindigkeit vg = p/m aus. Für das nicht relativistische Teilchen ist die Gruppengeschwindigkeit doppelt so groß wie die Phasengeschwindigkeit.² Ein relativistisches Teilchen besitzt die Energie E = c√(mc)2 + p2 und eine Phasengeschwindigkeit (4.4) v ph = c√1 + (
mc 2 ) ≥c. p
Dies ist kein Widerspruch zur Relativitätstheorie, da sich das Teilchen mit der Grup pengeschwindigkeit (4.4) p ≤c (4.28) vg = c √(mc)2 + p2 ausbreitet, die für ein masseloses Teilchen m = 0 mit der Lichtgeschwindigkeit c zu sammenfällt, für massive Teilchen jedoch stets kleiner als c ist. Sowohl für die nicht relativistische, als auch für die relativistische Punktmasse fällt die Gruppengeschwindigkeit vg mit der klassischen Geschwindigkeit v zusam men. Für das nicht relativistische Teilchen ist dies offensichtlich, da p/m = v. Ein relativistisches Teilchen, welches sich mit der Geschwindigkeit v bewegt, besitzt den Impuls bzw. die Energie p=
mv √1 −
v2 c2
,
E=
mc2 √1 −
v2 c2
.
Hieraus ergibt sich für die Gruppengeschwindigkeit (4.28) vg = c2 pE unmittelbar vg = v.
2 Dies gilt natürlich insbesondere für das in Abb. 4.3 dargestellte Gauß’sche Wellenpaket. Demnach breitet sich die einhüllende gestrichelte Kurve mit der Gruppengeschwindigkeit vg = p0 /m aus, wäh rend sich die rasch oszillierende Trägerwelle mit der Phasengeschwindigkeit vph = p0 /2m fortbewegt.
4.5 Erwartungswerte und Unschärfe |
49
4.5 Erwartungswerte und Unschärfe Die Wellenfunktion ψ(x, t) ist die Wahrscheinlichkeitsamplitude dafür, dass das Teil chen sich zur Zeit t am Ort x aufhält. (Sie wurde als spezielle Übergangsamplitude K(x, t; x0 , t0 ) definiert, bei welcher der Anfangszustand (x0 , t0 ) des Teilchens als irrelevante Information unberücksichtigt bleibt.) Demzufolge ist die Größe w(x, t) = |ψ(x, t)|2 = ψ∗ (x, t)ψ(x, t)
(4.29)
die Wahrscheinlichkeitsdichte bzw. Aufenthaltswahrscheinlichkeitsdichte im Ortsraum. Die Wahrscheinlichkeit, ein Teilchen im Intervall dx um x zu finden, ist dann durch dW x = w(x, t) dx gegeben (Abb. 4.5). w(x )
dx x
x Abb. 4.5: Wahrscheinlichkeitsdichte im Ortsraum.
Die Gesamtaufenthaltswahrscheinlichkeit (d. h. die Wahrscheinlichkeit, das Teilchen irgendwo im Ortsraum anzutreffen) erhalten wir, indem wir über alle infinitesimalen Wahrscheinlichkeiten dW summieren, also über den gesamten Ortsraum integrieren: ∞
∫ dW x = ∫ dx |ψ(x, t)|2 = 1 . −∞
Diese Wahrscheinlichkeit muss 1 sein, da das Teilchen sich irgendwo im Ortsraum aufhalten muss. Obige Bedingung legt die Normierung der Wellenfunktion ψ(x, t) fest. Für die Dimension der Wellenfunktion können wir in einer Raumdimension folgern: D=1 :
[ψ] =
1 . √[Länge]
50 | 4 Die Wellenfunktion
In drei Raumdimensionen ist die Wellenfunktion eine Funktion des Ortsvektors x : ψ = ψ(x, t). Dementsprechend ist die Wahrscheinlichkeit dafür, dass das Teilchen sich in einem Raumelement d3 x um den Vektor x aufhält, durch dW x = w(x, t) d3 x = |ψ(x, t)|2 d3 x gegeben. Die Normierungsbedingung der Wellenfunktion lautet dann ∫ d3 x |ψ(x, t)|2 = 1 , und wir finden für die Dimension der Wellenfunktion: D=3 :
[ψ] =
1 [Länge]3/2
.
Die Wellenfunktion als Aufenthaltswahrscheinlichkeitsamplitude drückt aus, dass in der Quantenmechanik i. A. der Ort eines Teilchens nicht exakt bekannt ist, sondern wir nur die Wahrscheinlichkeit dafür angeben können, dass das Teilchen sich an ei nem bestimmten Ort x aufhält. Wir können jedoch den Mittelwert angeben, den wir nach einer (unendlichen) Serie von Ortsmessungen erhalten würden, wenn das Teil chen jeweils vor der Ortsmessung so präpariert war, dass es die Aufenthaltswahr scheinlichkeit w(x a , t) = |ψ(x a , t)|2 besaß. Dieser Wert ist durch ⟨x⟩ = ∫ d3 x w(x, t)x = ∫ d3 x ψ∗ (x, t)xψ(x, t)
(4.30)
gegeben und wird als Erwartungswert bezeichnet. Der Erwartungswert lässt sich je doch nicht nur für den Ort des Teilchens berechnen, sondern in analoger Weise für jede beliebige Observable A(x), die eine Funktion des Ortes ist: ⟨A(x)⟩ = ∫ d3 x w(x, t)A(x) = ∫ d3 x ψ∗ (x, t)A(x)ψ(x, t) .
(4.31)
Gelegentlich werden wir ⟨A⟩ψ statt ⟨A⟩ schreiben um anzugeben, mit welchem Zu stand ψ der Erwartungswert gebildet wird. Betrachten wir als Spezialfall A(x) = 1 , so erhalten wir die Normierung der Wellenfunktion: ⟨1⟩ = ∫ d 3 x w(x, t)1 = ∫ d3 x ψ∗ (x, t)1ψ(x, t) .
4.6 Der Impulsraum |
51
Von Interesse ist nicht nur der Erwartungswert (Mittelwert), sondern auch, wie wahr scheinlich Abweichungen von diesem Erwartungswert sind, d. h., wie gut die Wahr scheinlichkeitsverteilung w(x, t) um den Erwartungswert lokalisiert ist. Eine charak teristische Größe hierfür ist die mittlere quadratische Abweichung bzw. das mittlere Schwankungsquadrat (∆A)2 := ⟨[A(x) − ⟨A(x)⟩]2 ⟩ = ∫ d3 x w(x, t) [A(x) − ⟨A(x)⟩]2 ≥ 0 , das in der Statistik als Varianz bezeichnet wird. Diese Größe ist offenbar positiv definit. Elementare Rechnung liefert: ⟨[A(x) − ⟨A(x)⟩]2 ⟩ = ⟨A2 (x) − 2A(x)⟨A(x)⟩ + (⟨A(x)⟩)2 ⟩ = ⟨A2 (x)⟩ − 2⟨A(x)⟩⟨A(x)⟩ + (⟨A(x)⟩)2 = ⟨A2 (x)⟩ − (⟨A(x)⟩)2 ≥ 0 . Die Wurzel aus dieser Größe, (∆A) = √⟨[A(x) − ⟨A(x)⟩]2 ⟩ = √⟨A2 (x)⟩ − (⟨A(x)⟩)2 , bezeichnet man als Unschärfe oder in der Statistik als Standardabweichung der Varia ble A(x) von ihrem Erwartungswert ⟨A⟩. Sie charakterisiert die Breite der Wahrschein lichkeitsverteilung. Zur Illustration betrachten wir eine auf 1 normierte (zeitunabhängige) Wellen funktion in einer Raumdimension: ψ(x) = (
1/4 1 (x − x0 )2 ) exp (− ) . 2πa2 4a2
Eine einfache Rechnung zeigt: ⟨x⟩ = x0 ,
(∆x) = a .
4.6 Der Impulsraum Wie bereits in Abschnitt 4.3 bemerkt, besitzt eine beliebige Wellenfunktion i. A. keinen wohldefinierten Impuls. Wir können jedoch jede Wellenfunktion mittels Fourier-Zerle gung nach ebenen Wellen entwickeln, die bekanntlich einen wohldefinierten Impuls besitzen: i d3 p ψ(x, t) = ∫ e ℏ p⋅x ψ(p, t) . (4.32) (2πℏ)3 Die Fourier-Koeffizienten ψ(p, t) sind durch die inverse Fourier-Transformation de finiert: i ψ(p, t) = ∫ d 3 x e− ℏ p⋅x ψ(x, t) . (4.33)
52 | 4 Die Wellenfunktion
Sie geben das Gewicht an, mit dem eine bestimmte ebene Welle mit Impuls p in der Wellenfunktion ψ(x, t) enthalten ist. Unter Benutzung von
∫ d3 x e ℏ x⋅(p−p ) = 2πℏδ(p − p ) i
erhalten wir das Parseval-Theorem der Fourier-Transformation: ∫ d3 x |ψ(x, t)|2 = ∫
d3 p |ψ(p, t)|2 . (2πℏ)3
Die Fourier-Transformierte ψ(p, t) hat deshalb im Impulsraum dieselbe Normierung wie die Wellenfunktion im Ortsraum. Wir können daher 1 w(p, t) ≡ |ψ(p, t)|2 (2πℏ)3 in Analogie zu (4.29) als die Aufenthaltswahrscheinlichkeitsdichte des Teilchens im Impulsraum interpretieren und ψ(p, t) als die Wellenfunktion im Impulsraum bezeich nen. Dementsprechend gibt dW p = w(p, t) d3 p = |ψ(p, t)|2
d3 p (2πℏ)3
die Wahrscheinlichkeit an, dass das Teilchen einen Impuls aus dem Volumenele ment d3 p besitzt, welches bei p lokalisiert ist (siehe Abb. 4.6). Analog zur Definition des Erwartungswertes des Ortes im Ortsraum (4.30) können wir den Erwartungswert des Impulses definieren: ⟨p⟩ = ∫ d3 p w(p, t)p = ∫
d3 p ψ∗ (p, t)pψ(p, t) . (2πℏ)3
(4.34)
Setzen wir hier die Definition der Fourier-Transformierten der Wellenfunktion ψ(p, t) (4.33) ein, so erhalten wir: ⟨p⟩ = ∫
i i d3 p ∫ d3 x e ℏ p⋅x ψ∗ (x, t)p ∫ d3 y e− ℏ p⋅y ψ(y, t) . (2πℏ)3
p3
d3 p
p p2
p1
Abb. 4.6: Illustration des Volumenelementes d 3 p im Impulsraum.
4.6 Der Impulsraum | 53
Um das Impulsintegral ausführen zu können, benutzen wir: i
pe ℏ p⋅x =
i ℏ ∇x e ℏ p⋅x . i
Dies liefert ℏ d3 p i p⋅(x−y) ⟨p⟩ = ∫ d3 x ψ∗ (x, t) ∫ d3 y ψ(y, t) ∇x ∫ eℏ i (2πℏ)3 ℏ = ∫ d3 x ψ∗ (x, t) ∇ x ∫ d3 y ψ(y, t)δ(x − y) . i Wegen der δ-Funktion lässt sich das Integral ∫ d3 y in trivialer Weise ausführen, und wir erhalten für den Erwartungswert des Impulses im Ortsraum: ℏ ⟨p⟩ = ∫ d3 x ψ∗ (x, t) ( ∇x ) ψ(x, t) . i Wir haben damit den Erwartungswert des Impulses in die oben durch (4.31) angegebe ne allgemeine Form des Erwartungswertes einer Observablen in der Ortsdarstellung gebracht. Aus diesem Grunde müssen wir den Differenzialoperator p̂ =
ℏ ∇x i
(4.35)
als den Impulsoperator in der Ortsdarstellung interpretieren. Beim Übergang in den Impulsraum durch Fourier-Transformation geht dieser Operator in die Impulsvariable p über. Dementsprechend müssen wir p als die Im pulsdarstellung des Impulsoperators bezeichnen: p̂ ≡ p . In analoger Weise ist x̂ ≡ x die Ortsdarstellung des Ortsoperators. Wir haben oben durch Einsetzen der inversen Fourier-Transformierten (4.33) in (4.34) die Darstellung des Impulsoperators im Ortsraum (4.35) gefunden. In ähnli cher Weise können wir (4.32) in (4.30) einsetzen und finden für die Impulsraumdar stellung des Ortes: x̂ = iℏ∇ p . Der Ort ist im Impulsraum durch einen analogen Differenzialoperator gegeben wie der Impuls im Ortsraum.
54 | 4 Die Wellenfunktion
4.7 Messgrößen als Operatoren Wir haben im vorherigen Abschnitt am Beispiel von Ort und Impuls gesehen, dass die aus der klassischen Mechanik bekannten physikalisch messbaren Größen (Obser vablen) in der Quantenmechanik durch Operatoren repräsentiert werden, die auf die Wellenfunktion wirken: x → x̂ , p → p̂ . Dasselbe gilt für andere Observablen A(x) (wie z. B. die potenzielle Energie) oder A(p) (wie z. B. die kinetische Energie): A(x) → A(x)̂ ,
A(p) → A(p)̂ .
So erhalten wir beispielsweise für den Operator T̂ der kinetischen Energie im Orts raum: 2 p̂ ℏ2 ℏ2 2 T̂ = =− ∇ =− ∆, 2m 2m 2m während das Potenzial im Ortsraum die aus der klassischen Mechanik bekannte Funk tion des Ortes ist: V̂ = V(x)̂ = V(x) . Probleme bekommen wir bei Observablen, die vom Produkt p ⋅ x abhängen. Während in der klassischen Mechanik die Reihenfolge von p und x keine Rolle spielt, muss man diese in der Quantenmechanik beachten. Als Beispiel betrachten wir die Observable A(p, x) = px. Schauen wir uns im Ortsraum die Wirkung zweier möglicher zugehöriger Operatoren auf eine „Testfunktion“ f(x) an: ℏ d ℏ ℏ d (xf(x)) = f(x) + x f(x) , i dx i i dx ℏ d ̂ x̂ pf(x) =x f(x) . i dx
̂ p̂ xf(x) =
Es ist also für f(x) ≠ 0:
ℏ f(x) ≠ 0 . i Man sagt, die zwei Größen vertauschen nicht miteinander bzw. kommutieren nicht. Allgemein nennt man ̂ (p̂ x̂ − x̂ p)f(x) =
[A,̂ B]̂ := Â B̂ − B̂ Â
(4.36)
den Kommutator von  und B.̂ Für p̂ und x̂ haben wir oben gefunden: ̂ [p,̂ x]f(x) =
ℏ f(x) . i
Diese Gleichung lässt sich unabhängig von der Testfunktion f(x) als Operatoridentität schreiben: ℏ [p,̂ x]̂ = 1̂ , (4.37) i
4.7 Messgrößen als Operatoren
|
55
wobei 1̂ der Einheitsoperator ist, dessen Wirkung durch ̂ 1f(x) = f(x) definiert ist. Im Folgenden werden wir jedoch den Einheitsoperator, wenn er multipli kativ auftritt, weglassen. Es ist leicht einzusehen, dass die Verallgemeinerung von (4.37) auf drei Dimen sionen [p̂ k , x̂ l ] =
ℏ δ kl i
(4.38)
lautet, da die verschiedenen Raumrichtungen natürlich unabhängig voneinander sind. Als Ergebnis der Wirkung eines Operators auf eine Wellenfunktion wird diese i. A. verändert. Die Wirkung des Operators einer physikalischen Observablen auf einen Zu stand ist der mathematische Ausdruck für die Messung der entsprechenden Obser vablen an dem durch die Wellenfunktion beschriebenen System. Wie wir bereits bei der Diskussion des Doppelspaltexperimentes in Abschnitt 2.2 feststellten, wird bei der Messung eines quantenmechanischen Systems dessen Zustand i. A. durch den Mess prozess verändert. Zustände, welche sich bei Messung einer Observablen A nicht ändern, werden als Eigenzustände von A bezeichnet und sind durch die Eigenfunktionen f a (x) des Opera tors gegeben: Af̂ a (x) = af a (x) . (4.39) a heißt Eigenwert von A.̂ Ähnlich wie eine Matrix durch ihre Eigenwerte und Eigenvek toren bestimmt ist, kann ein Operator durch seine Eigenwerte und Eigenfunktionen charakterisiert werden. Wir werden später sehen, dass sich Operatoren durch (i. A. unendlichdimensionale) Matrizen darstellen lassen. Als Beispiel wollen wir wieder den Orts- bzw. Impulsoperator im Ortsraum be trachten: 1.
Impulsoperator: Die Eigenwertgleichung lautet: ̂ p (x) = pφ p (x) . pφ
(4.40)
i
2.
Lösung ist offenbar die ebene Welle φ p (x) = e ℏ px . Ortsoperator: Die Eigenwertgleichung lautet: xξ̂ x (x) = x ξ x (x) . Wegen x̂ = x ist die Lösung die δ-Funktion ξ x (x) = δ(x − x ).
(4.41)
56 | 4 Die Wellenfunktion
Die Eigenfunktionen von Ort- und Impulsoperator sind offensichtlich nicht normier bar. Wir werden später sehen, wie solche „uneigentlichen“ Eigenfunktionen zu inter pretieren sind. Der quantenmechanische Messprozess in der Operatorsprache wird ausführlicher in Kapitel 11 diskutiert. Die Eigenwertgleichung (4.39) legt die Eigenfunktion nur bis auf eine komplexe konstante Amplitude fest, deren Betrag gewöhnlich durch Normierung fixiert wird. Außerdem ist zu bemerken, dass eine konstante Phase e iα , α = const. der Wellen funktion ψ bei der Bildung des Erwartungswertes (4.31) (und damit auch aus der Auf enthaltswahrscheinlichkeit w(x, t) = |ψ(x, t)|2 ) herausfällt. Die Wellenfunktionen sind also nur bis auf eine willkürliche konstante Phase be stimmt, die keinerlei Einfluss auf physikalische, d. h. messbare Größen besitzt.
Abschließend sollen noch einige Eigenschaften des Kommutators (4.36) angegeben werden, welche unmittelbar aus seiner Definition folgen. Offenbar ist diese Größe antisymmetrisch: [A,̂ B]̂ = −[B,̂ A]̂ . Der Kommutator hat ähnliche Eigenschaften wie ein Differenzialoperator. So ist er linear, d. h., es gilt für beliebige, komplexwertige Zahlen β, γ: [A,̂ β B̂ + γ C]̂ = β[A,̂ B]̂ + γ[A,̂ C]̂ . Ferner gelten die „Produktregel“ [A,̂ B̂ C]̂ = [A,̂ B]̂ Ĉ + B[̂ A,̂ C]̂ ,
[Â B,̂ C]̂ = A[̂ B,̂ C]̂ + [A,̂ C]̂ B̂
und die Jacobi-Identität ̂ + [B,̂ [C,̂ A]] ̂ + [C,̂ [A,̂ B]] ̂ = 0̂ . [A,̂ [B,̂ C]]
(4.42)
5 Der klassische Grenzfall Durch die Entdeckung der Quantenmechanik wurde die klassische Mechanik nicht falsifiziert, sondern nur in ihrem Gültigkeitsbereich eingeschränkt. Im Folgenden zei gen wir, dass für Systeme mit einer sehr großen Wirkung S im Limes ℏ/S → 0 die Quantenmechanik in die klassische Mechanik übergeht. Bewegungen, die mit einer sehr großen, aber endlichen Wirkung S ≫ ℏ verlaufen, werden als semiklassisch oder quasiklassisch bezeichnet. Um den Limes ℏ → 0 im Funktionalintegral durchführen zu können, wird im nächsten Abschnitt erst eine genäherte Methode zur Berechnung von Integralen rasch oszillierender Funktionen vorgestellt.
5.1 Die stationäre Phasenapproximation Im Folgenden wollen wir eine Methode zur genäherten Berechnung von einer Klas se von Integralen kennenlernen, die häufig in der Quantenmechanik auftreten, aber auch für andere Gebiete der Physik relevant sind. Wir entwickeln diese Methode hier für eindimensionale Integrale; sie lässt sich jedoch unmittelbar auf mehrdimensiona le Integrale verallgemeinern. Wir betrachten das Integral y2
F(λ) = ∫ dy g(y)e iλf(y) ,
(5.1)
y1
wobei y eine reelle Variable und λ ein reeller Parameter sind. Ferner sei g eine glatte, langsam veränderliche Funktion. Wir wollen dieses Integral für den Grenzfall λ → ∞ berechnen. Wegen e iλf(y) = cos(λf(y)) + i sin(λf(y)) stellt der Integrand für λ → ∞ eine rasch oszillierende Funktion dar. Deshalb liefern benachbarte y-Werte Beiträge zum Integral mit zufällig verteilten Vorzeichen und lö schen sich somit i. A. aus. Eine Ausnahme bilden die y-Werte in der Nähe eines statio nären Punktes des Exponenten. (Stationäre Punkte sind Extrema der Funktion f(y), siehe Abb. 5.1.) Der Grund dafür ist, dass in der Nähe eines extremalen Punktes die Funktion sich in erster Ordnung nicht ändert und somit benachbarte Punkte kohä rente Beiträge (d. h. Beiträge mit demselben Vorzeichen) zum Integral liefern. Nehmen wir an, die Funktion f(y) habe innerhalb des Integrationsintervalls (y1 , y2 ) eine Extremstelle bei y = a, d. h.: df =0. dy y=a https://doi.org/10.1515/9783110586022-005
(5.2)
58 | 5 Der klassische Grenzfall
f (y)
cos(λf (y)) a
λ=5
λ = 10
λ = 15
Abb. 5.1: Illustration der Phasenauslöschungen fern und der kohärenten Beiträge nahe des stationären Punktes y = a.
Wir können dann die Funktion in der Umgebung der Extremstelle in eine Taylor-Reihe entwickeln, 1 f(y) = f(a) + f (a)(y − a)2 + ⋅ ⋅ ⋅ , 2 wobei der lineare Term wegen (5.2) fehlt. Ähnlich können wir auch die Funktion g(y) entwickeln: g(y) = g(a) + g (a)(y − a) + ⋅ ⋅ ⋅ . (5.3) Da nur y-Werte in der Nähe des stationären Punktes a zum Integral beitragen, können wir die Taylor-Entwicklungen jeweils nach dem ersten nicht trivialen Term abbrechen. Aus demselben Grund können wir die Integrationsgrenzen y1,2 nach ±∞ verlegen: ∞
y2
∫ dy
→
∫ dy . −∞
y1
Setzen wir die obigen Taylor-Entwicklungen in (5.1) ein und verschieben die Integra tionsvariable um den stationären Punkt (z = y − a), so finden wir: ∞
F(λ) = ∫ dz (g(a) + g (a)z + ⋅ ⋅ ⋅ ) exp [iλ (f(a) + −∞
1 f (a)z2 + ⋅ ⋅ ⋅ )] . 2
Der erste Summand führt auf ein sogenanntes Fresnel-Integral, welches wir nach Re gularisierung durch ein Dämpfungsglied λ → λ + iε, ε → 0, ∞
∞
−∞
−∞
f (a) 2 f (a) 2 z ) = lim ∫ dz exp (i(λ + iε) z ) =: I , ∫ dz exp (iλ ε→0 2 2
5.1 Die stationäre Phasenapproximation
|
59
auf ein Gauß-Integral (mit komplexem Koeffizienten im Exponenten) zurückführen können:¹ ∞
1 I = lim ∫ dz exp (− (ε − iλ)f (a)z2 ) ε→0 2 −∞
= lim √ ε→0
2π i2π = √ . (ε − iλ)f (a) λf (a)
(5.4)
Der zweite Summand führt auf ein Integral der Form ∞
∫ dz ze iλf
(a)z2
=0,
−∞
das aus Symmetriegründen verschwindet. Damit erhalten wir im Grenzfall λ → ∞ den folgenden Ausdruck für das ursprüngliche Integral (5.1): y2
∫ dyg(y) e iλf(y) ≃ g(a)e iλf(a)√ y1
i2π , λf (a)
λ→∞.
(5.5)
Je größer λf (a), desto kleiner ist der Betrag des Integrals F(λ). Dieses Ergebnis ist anschaulich klar: Je größer die „Krümmung“ f (a), desto enger ist die Extremstelle (Abb. 5.1). Desto kleiner ist also auch der y-Bereich um y = a, in dem es nicht zur Phasenauslöschung kommt und der somit einen von null verschiedenen Beitrag zum Integral liefert. Eine Vergrößerung von λ schränkt diesen Bereich ebenfalls ein, da mit größerem λ die Phasenauslöschung zunimmt. Der Ausdruck vor der Wurzel ist gerade der Integrand, genommen am stationären Punkt (Extremum). Die Wurzel entsteht von der Integration über die unmittelbare Um gebung des Extremums. Sie kann oftmals für qualitative Überlegungen vernachlässigt werden, sodass y2
∫ dy g(y)e iλf(y) ∼ g(a)e iλf(a) ,
λ→∞.
(5.6)
y1
Dieser Näherungsausdruck ist allein durch das Extremum bestimmt. Falls die Funk tion g(y) am stationären Phasenpunkt y = a eine Nullstelle besitzt, muss die TaylorEntwicklung (5.3) bis zur zweiten Ordnung durchgeführt werden. Besitzt die Funktion f(y) im Exponenten innerhalb der Integrationsgrenzen meh rere Extremalstellen, d. h. f (a n ) = 0 für a n ∈ (y1 , y2 ), n = 1, 2, 3, . . . , dann erhalten
1 Wir setzen hier f (a) > 0 voraus. Im umgekehrten Fall wird λ → λ − iϵ ersetzt. Das Ergebnis (5.4) gilt sowohl für f (a) > 0 als auch f (a) < 0.
60 | 5 Der klassische Grenzfall
wir kohärente Beiträge von den Umgebungen der einzelnen Extremstellen a n , und die Verallgemeinerung der Beziehung (5.5) lautet: y2
∫ dy g(y)e iλf(y) ≃ ∑ e iλf(a n) √ n
y1
i2π g(a n ) , λf (a n )
λ→∞.
(5.7)
Diese Näherungsmethode der stationären Phase lässt sich unmittelbar auf mehrdi mensionale Integrale bzw. Funktionalintegrale verallgemeinern. Wir betrachten das mehrdimensionale Integral n
F(λ) = ∫ ∏ dx k g(x1 , x2 , . . . , x n ) exp [iλf(x1 , x2 , . . . , x n )] ,
(5.8)
M k=1
wobei M ein Gebiet im n-dimensionalen euklidischen Raum ℝn ist, der durch die Koordinaten x i , i = 1, 2, . . . , n aufgespannt wird, M ⊂ ℝn . Der Einfachheit halber setzen wir voraus, dass die Funktion f(x1 , x2 , . . . , x n ) in M nur eine einzige isolierte Extremstelle bei x i = a i besitzt, d. h., es gelte ∂f =0, ∂x i x k =a i
det [
∂2 f ] ≠ 0 ∂x i ∂x j x k =a k
und ∂f/∂x i ≠ 0 für alle
(x1 , x2 , . . . , x n ) ≠ (a n , a2 , . . . , a n ) .
Für λ → ∞ trägt zum Integral (5.8) nur die unmittelbare Umgebung der Extremstel le x k = a k bei, sodass wir die Integration über den ganzen n-dimensionalen Raum ausdehnen können, M → ℝn . Ferner können wir wie im eindimensionalen Fall die Funktion vor dem Exponenten g(x1 , x2 , . . . , x n ) durch ihren Wert an der Extrem stelle g(a i , a2 , . . . , a n ) ersetzen und die Funktion f(x1 , x2 , . . . , x n ) bis zur zweiten Ordnung in eine Taylor-Reihe entwickeln: f(x1 , x2 , . . . , x n ) = f(a1 , a2 , . . . , a n ) +
∂2 f 1 n ∑ (x i − a i )(x j − a j ) + ⋅ ⋅ ⋅ . 2 i,j=1 ∂x i ∂x j x k =a k
Die reguläre symmetrische Matrix (∂2 f/∂x i ∂x j )|x k =a k lässt sich mittels einer ortho gonalen Transformation O diagonalisieren, ∂2 f = (O T )ik μ k O kj , ∂x i ∂x j x k =a k wobei μ k ihren Eigenwert bezeichnet. Nach der Variablentransformation z k = O ki (x i − a i )
(5.9)
5.1 Die stationäre Phasenapproximation
|
61
finden wir F(λ) ≃ g(a1 , a2 , . . . , a n )e
if(a 1 ,a 2 ,...,p n )
λ→∞
∞
n
λ
k=1
wobei wir
n
2
∏ ( ∫ dz k e i 2 μ k z k ) , −∞
n
∏ dx i = ∏ dz k i=1
k=1
benutzt haben, was aus Gleichung (5.9) mit det O = 1 folgt. Nach Ausführen der verbleibenden Fresnel-Integrale finden wir mit n
∏ μ k = det ( k=1
∂2 f ) ∂x i ∂x j x k =a k
(5.10)
schließlich n
∫ ∏ dx i g(x1 , x2 , . . . , x n )e iλf(x1,x2 ,...,x n ) M i=1
≃ g(a1 , a2 , . . . , a n )e
iλf(a 1 ,a 2 ,...,a n )
λ→∞
n −1/2 2πi ∂2 f (√ )] . ) [det ( λ ∂x i ∂x j x k =a2
(5.11) Dies ist die direkte Verallgemeinerung von Gleichung (5.5) auf n Dimensionen. Die stationäre Phasenapproximation für mehrdimensionale Integrale (5.11) lässt sie auch unmittelbar auf Funktionalintegrale verallgemeinern: G[x] und F[x] sei en Funktionale der Funktionen x(t), die den Randbedingungen x(t a ) = x a und x(t b ) = x b genügen, und x(t b )=x b
∫
Dx(t)
x(t a )=x a
bezeichnet die zugehörige funktionale Integration über die Klasse dieser Funktio nen. Dann gilt x(t b )=x b
∫ x(t a )=x a
̃ iλF[x]̃ [Det ( Dx(t)G[x]e iλF[x] ≃ G[x]e λ→∞
−1/2
δ2 F[x] ) ] δx(t)δx(t ) x=x̃
,
̃ wobei x(t) den stationären „Punkt“ des Funktionals F[x] bezeichnet, d. h., die ̃ ist ein Extremum des Funktionals F[x]: Funktion x(t) δF[x] =0. δx(t) x=x̃
62 | 5 Der klassische Grenzfall
Die Funktionaldeterminante Det K des Kerns K = δ2 F[x]/δx(t)δx(t ) lässt sich ana log zu Gleichung (5.10) über seine Eigenwerte berechnen. In vielen praktischen Fäl len reicht es jedoch aus, die Beziehung 1 (Det K)−1/2 = exp (− Tr log K) 2
(5.12)
zu benutzen und den Exponenten störungstheoretisch zu berechnen. Hierbei ist Tr K = ∫ dtK(t, t ) die funkionale Spur des Kerns K(t, t ). Der Beweis von Glei chung (5.12) erfolgt wie bei Matrizen durch Diagonalisierung des symmetrischen Kerns K. ̃ Besitzt das Funktional F[x] mehrere stationäre „Punkte“ x(t), ist über diese (wie in Gleichung (5.7)) zu summieren.
5.2 Asymptotische Darstellung der δ-Funktion Mittels der stationären Phasenapproximation lässt sich sehr einfach die folgende Dar stellung der δ-Funktion λ i(λ/2)x2 δ(x) = lim √ e λ→∞ i2π
(5.13)
beweisen, die bereits in Gleichung (3.19) benutzt wurde. Der Limes ist hier im Sinne der Distributionen als „schwacher Grenzwert“ zu verstehen. Bekanntlich ist die δ-Funktion durch folgende Beziehungen definiert: ∞
∫ dx δ(x − x0 ) = 1 ,
(5.14)
−∞
bzw.
∞
∫ dx δ(x − x0 )f(x) = f(x0 ) ,
(5.15)
−∞
wobei die Beziehung (5.14) aus (5.15) für f(x) = 1 folgt. Die Funktion F(λ, x) = √
λ i(λ/2)x2 e i2π
erfüllt offenbar die Normierungsbedingung (5.14) für jedes λ, denn es gilt ∞
∫ dx F(λ, x) = √ −∞
∞
λ 2 λ √ i2π ∫ dx e i(λ/2)x = √ =1, i2π i2π λ −∞
wobei wir das Fresnel-Integral (5.4) benutzt haben.
(5.16)
5.2 Asymptotische Darstellung der δ-Funktion
| 63
Abb. 5.2: Grafische Darstellung von Re{exp(iλx 2 /2)} = cos(λx 2 /2) für verschiedene Werte des Parameters λ = 4, 8, 16, 32. In der Abbildung wächst λ von oben nach unten.
Die Beziehung (5.15) lässt sich ebenso schnell beweisen, wenn man beachtet, dass F(λ, x) für λ → ∞ eine rasch oszillierende Funktion von x darstellt, siehe Abb. 5.2, sodass sich das Integral ∞
lim ∫ dx F(λ, x − x0 )f(x)
λ→∞
−∞
mittels der Methode der stationären Phase berechnen lässt. Die Phase von F(λ, x − x0 ) ist stationär bei x = x0 , sodass wir ∞
λ 2 ∫ dx f(x)e i(λ/2)(x−x0) lim √ λ→∞ i2π −∞
∞
2 λ = f(x0 ) lim √ ∫ dx e i(λ/2)(x−x0) = f(x0 ) λ→∞ i2π
−∞
erhalten, wobei wir (5.16) benutzt haben. Man beachte, dass im vorliegenden Fall keine Taylor-Entwicklung der Phase (Exponenten) vorgenommen werden musste, da diese bereits quadratisch in der Integrationsvariable ist. Ferner sei betont, dass die stationäre Phasenapproximation im Limes λ → ∞ exakt wird, sodass Gleichung (5.13) eine exakte Darstellung der δ-Funktion ist.
64 | 5 Der klassische Grenzfall
5.3 Der klassische Grenzwert des Propagators Aus der Funktionalintegral-Darstellung (3.23) ist zu erkennen, dass zum quantenme chanischen Propagator zunächst alle Trajektorien beitragen. Die Größe des Beitrages einer Trajektorie x(t) wird durch ihre klassische Wirkung S[x] festgelegt. Für makro skopische Systeme ist die klassische Wirkung (auf makroskopischen Zeitskalen) aber sehr groß im Vergleich zur atomaren Wirkungseinheit ℏ: S[x] ≫ ℏ . Die Phase der Übergangsamplitude (Propagator) ist dann sehr groß im Verhältnis zu 1: S[x] ≫1. ℏ Somit ist der Integrand des Funktionalintegrals eine rasch oszillierende Funktion der Trajektorie: i
K = ∫ Dx(t) e ℏ S[x] = ∫ Dx(t) [cos (
S[x] S[x] ) + i sin ( )] . ℏ ℏ
(5.17)
Ändern wir nun die Trajektorie x(t) um einen kleinen Beitrag δx(t) (siehe Abb. 5.3), der klein auf der makroskopischen Skala ist, aber dennoch makroskopische Dimensio nen besitzen muss (damit wir diese Änderung der Trajektorie wahrnehmen können), so ändert sich auch die Wirkung um einen kleinen, aber dennoch makroskopischen Beitrag: S[x] → S[x + δx] = S[x] + δS , δS ∼ δx . (5.18) Diese makroskopische Änderung der Wirkung ist jedoch groß gegenüber ℏ: δS ≫ ℏ
⇒
δS ≫1. ℏ
x
xb
δx(t)
x ˜(t)
δx(t)
xa
t ta
tb
Abb. 5.3: Änderung δx(t) der Trajektorie x(t) bei festgehaltenen Randpunkten, ausgehend von der ̃ klassischen Trajektorie x(t).
5.3 Der klassische Grenzwert des Propagators
| 65
Eine kleine makroskopische Änderung in der Trajektorie wird deshalb zu enorm gro ßen Änderungen in der Phase S[x]/ℏ führen. Der Integrand des Funktionalintegrals wird deshalb bei der Änderung von x, siehe Gleichung (5.18), sehr viele Oszillationen durchlaufen. Die benachbarten Trajektorien werden daher i. A. Beiträge mit zufällig verteilten Vorzeichen zur Übergangsamplitude liefern, sodass diese sich gegenseitig auslöschen und kein Gesamtbeitrag übrig bleibt (siehe die in Abschnitt 5.1 gegebene Ableitung der stationären Phasenapproximation). Wir brauchen somit solche Tra jektorien, die sich von ihren benachbarten Trajektorien in einer makroskopischen Änderung der Wirkung unterscheiden, nicht zu berücksichtigen. Eine Ausnahme ̃ bilden die klassischen Trajektorien x(t), welche die Wirkung extremieren: δS[x] =0. δx(t) x=x(t) ̃
(5.19)
In der Nähe eines Extremums ändert sich die Wirkung in erster Ordnung nicht, wie aus ihrer (funktionalen) Taylor-Entwicklung (D.24) ersichtlich ist: S[x̃ + δx] = S[x]̃ +
1 δ2 S[x] δx(t ) + ⋅ ⋅ ⋅ . ∫ dt dt δx(t) 2 δx(t) δx(t ) x=x̃
̃ Trajektorien, benachbart zur klassischen Trajektorie x(t), geben deshalb Beiträge mit annähernd gleicher Phase, die sich kohärent überlagern. Somit liefern nur Tra jektorien in der Nähe der klassischen Trajektorie einen wesentlichen Beitrag zum Funktionalintegral, und im Limes ℏ/S[x] → 0 brauchen wir nur die klassischen Tra ̃ jektorien x(t) zu berücksichtigen. Auf diese Art gehen die klassischen Gesetze im Grenzfall ℏ → 0 aus den quantenmechanischen Gesetzen hervor.² Für Systeme mit makroskopischen Wirkungen S[x] ≫ ℏ können wir offenbar das Funktionalintegral der Übergangsamplitude in der stationären Phasenapproximation berechnen, die im Grenzfall ℏ → 0 exakt wird. In der Näherung unterster Ordnung, siehe Gleichung (5.6), finden wir dann aus (5.17) ̃ K(b, a) ∼ e ℏ S[x](b,a) , i
(5.20)
̃ die klassische Trajektorie ist, die durch (5.19) definiert ist. Die Variation der wobei x(t) Wirkung δS/δx(t) = 0 bei festgehaltenen Randpunkten der Trajektorie (d. h. δx(t a ) = δx(t b ) = 0) liefert bekanntlich die Euler-Lagrange-Gleichung ∂L d ∂L − =0, ∂x dt ∂ ẋ 2 Den Grenzfall ℏ/S[x] → 0 werden wir wie in der Literatur üblich der Einfachheit halber als ℏ → 0 bezeichnen. Gemeint ist aber stets, dass die Wirkung S[x] sehr groß gegenüber ℏ wird, was aus ma ̃ die Wirkung S[x] thematischer Sicht dem Limes ℏ → 0 entspricht. Da die klassische Trajektorie x(t) minimiert, genügt es, S[ x]̃ ≫ ℏ für die Anwendbarkeit der semiklassischen Näherung zu fordern.
66 | 5 Der klassische Grenzfall
die sich für die Bewegung einer Punktmasse m im Potenzial V(x) auf die Newton’sche Bewegungsgleichung m ẍ = −V (x) reduziert. Im klassischen Grenzfall S[x] ≫ ℏ ist ̃ bestimmt, der Propagator K(b, a) deshalb allein durch die klassische Trajektorie x(t) welche der klassischen (Newton’schen) Bewegungsgleichung zusammen mit den vor gegebenen Randbedingungen x(t a ) = x a , x(t b ) = x b genügt. Dasselbe Ergebnis er hält man auch, wenn man die explizite Definition des Funktionalintegrals (3.22), (3.23) benutzt: Das Funktionalintegral des Propagators K(b, a) ist als N-dimensionales Vielfach integral über die intermediären Koordinaten der Teilchentrajektorien definiert (N → ∞, ε → 0): N
N−1
K(b, a) = ∫ ∏ dx k (√ k=1
m i N m x k − x k−1 2 ) exp [ ε ∑ ( ( ) − V(x k ))] . i2πℏε ℏ k=1 2 ε
Für ℏ → 0 sind die Integranden sämtlich rapide oszillierende Funktionen dieser Koordinaten, und wir können diese Integrale deshalb in der stationären Phasen approximation auswerten. Ein einzelnes Integral hat die Gestalt √
m i x k+1 − x k 2 m x k − x k−1 2 ∫ dx k exp { ε [ (( ) +( ) ) − V(x k )]} . 2πℏiε ℏ 2 ε ε
Die relevanten x k -abhängigen Terme im Exponenten lauten: m ε [ 2 (x2k − x k (x k+1 + x k−1 )) − V(x k )] =: f(x k ) , ε sodass die relevanten Integrale im Funktionalintegral die Form i m 1 ∫ dx k e ℏ f(x k ) F( ) = √ ℏ i2πℏε haben. Für 1/ℏ → ∞ können wir diese Integrale mittels der stationären Phasenap proximation berechnen. Die stationären Phasenpunkte df(x k )/dx k = 0 liefern:
m
x k+1 − 2x k + x k−1 dV(x k ) + =0. dx k ε2
(5.21)
Beachten wir, dass x k+1 − 2x k + x k−1 1 x k+1 − x k x k − x k−1 ̈ k) = lim ( − ) ≡ x(t lim ε→0 ε→0 ε ε ε ε2 die diskretisierte Form der zweiten Ableitung darstellt, so erkennen wir, dass die stationäre Phasenbedingung (5.21) gerade die Newton’sche Bewegungsgleichung liefert (t k → t): ∂V(x) ̈ =− m x(t) . ∂x Für ℏ → 0 (d. h. im Geltungsbereich der stationären Phasenapproximation) kom men also die dominierenden Beiträge zum Funktionalintegral in der Tat von den klassischen Trajektorien, welche die Newton’sche Bewegungsgleichung erfüllen und den Randbedingungen x(t a ) = x a , x(t b ) = x b genügen.
5.3 Der klassische Grenzwert des Propagators
| 67
Wegen (4.5) erhalten wir aus (5.20) auch für die Wellenfunktion im Limes ℏ → 0 ̃ , ψ(x b , t b ) ∼ e ℏ S[x](b,a) i
ℏ→0.
Für die Wellenfunktion ψ(x b , t b ) ist dabei a ≡ (x a , t a ) ein irrelevanter, bis auf die Kausalität (t a < t b ) beliebig wählbarer Anfangspunkt. Um Aufschluss über die Form der Wellenfunktionen zu erhalten, genügt es deshalb, die Wirkung als Funktion der Endkoordinate b ≡ (x b , t b ) = (x, t) zu untersuchen: ̃ a ,t a ) . ψ(x, t) ∼ e ℏ S[x](x,t;x i
(5.22)
Für kleine Änderungen der Endkoordinate und Endzeit, (x, t) → (x + δx, t + δt) , können wir die Wirkung nach den Änderungen der Raum- und Zeitkoordinate entwi ckeln und erhalten: ̃ ̃ S[x](x + δx, t + δt; x a , t a ) = S[x](x, t; x a , t a ) +
̃ ̃ ∂S[x](x, t; x a , t a ) ∂S[x](x, t; x a , t a ) δx + δt + ⋅ ⋅ ⋅ . ∂x ∂t
Beachten wir, dass die Ableitung der Wirkung nach der Endkoordinate den Impuls am Ende der klassischen Trajektorie, d. h. zur Zeit t liefert (siehe Abb. 5.4(a)), ̃ ∂S[x](x, t; x a , t a ) = p(x, t) , ∂x und weiterhin nach der Hamilton-Jacobi’schen Differenzialgleichung ̃ ∂S[x](x, t; x a , t a ) = −H(p, x) ∂t
(5.23)
die Ableitung der Wirkung nach der Zeit (siehe Abb. 5.4(b)) die auf der klassischen Tra jektorie erhaltene Energie H(p, x) = E des Teilchens liefert, so finden wir schließlich für die Wellenfunktion (5.22): i i ψ(x + δx, t + δt) = ψ(x, t) exp ( p(x)δx − E δt) . ℏ ℏ
(5.24)
Die Wellenfunktion eines quasiklassischen Teilchens (für das S[x] ≫ ℏ gilt) verhält sich also für kleine Änderungen der Argumente von Ort und Zeit wie eine fortschrei tende ebene Welle, deren Wellenzahl k durch den klassischen Impuls und deren Fre quenz ω durch die klassische Energie gegeben sind: k=
p , ℏ
ω=
E . ℏ
Dasselbe Verhalten hatten wir bereits für die Wellenfunktion des freien Teilchens gefunden.
68 | 5 Der klassische Grenzfall x
x
x
δx
δt
x
xa
xa
t ta (a)
t ta (b)
t
Abb. 5.4: Änderung der klassischen Trajektorie eines Teilchens (a) bei Variation der Endkoordi nate x → x + δx und festgehaltener Endzeit t und (b) bei Variation der Endzeit t → t + δt und festgehaltener Endkoordinate x.
Die Wellennatur der Teilchenpropagation im semiklassischen Bereich (S[x] ≫ ℏ) tritt besonders klar hervor, wenn man die kanonische (Hamilton-)Form der Wirkung tb
S[p, x] = ∫ dt (p ẋ − H(p, x))
(5.25)
ta
benutzt, wobei p2 + V(x) 2m die klassische Hamilton-Funktion ist. Für konservative Systeme ist die HamiltonFunktion der klassischen Trajektorie, d. h. der Trajektorie, die den kanonischen Be wegungsgleichungen p ∂V , ẋ = ṗ = − ∂x m genügt, gleich der klassischen Energie (H(p, x) = E), die längs der klassischen Tra jektorie erhalten bleibt. Damit können wir die Wirkung der klassischen Trajektorie mit ̇ ∫ dt x(t)p(x(t)) = ∫ dx p(x) schreiben als: H(p, x) =
xb
̃ S[x](b, a) = ∫ dx p(x) − E(t b − t a ) . xa
Und die Wellenfunktion (5.22) nimmt im klassischen Grenzfall die Gestalt x
i ψ(x, t) = C(x0 , t0 ) exp [ ( ∫ dx p(x ) − Et)] ℏ x0 [ ]
(5.26)
an, wobei wir die irrelevante Abhängigkeit von der Anfangszeit t0 = t a bzw. der An fangskoordinate x0 = x a durch die Konstante C ausgedrückt haben.
5.3 Der klassische Grenzwert des Propagators
| 69
Betrachten wir nun die Wellenfunktion für eine kleine Änderung der Koordinate x → x + δx bzw. der Zeit t → t + δt, so finden wir unmittelbar das bereits in (5.24) gefundene Ergebnis. Für eine klassische konservative Bewegung (E = const.) ist der Impuls auf der klassischen Trajektorie durch den Energiesatz gegeben: p(x) = √2m(E − V(x)) .
(5.27)
Für ein konstantes Potenzial verschwindet die Kraft und der Impuls bleibt erhalten. Die Wellenfunktion nimmt dann für V < E die Gestalt einer ebenen Welle an. Für eine klassische Bewegung im nicht trivialen, d. h. ortsabhängigen Potenzial V(x) ist dagegen der lineare Impuls nicht erhalten, sondern ebenfalls ortsabhängig, wie aus Gleichung (5.27) ersichtlich ist. Die Wellenfunktion (5.26) repräsentiert dann nur lokal eine ebene Welle, i ψ(x + ∆x, t) = ψ(x, t)e ℏ p(x) ∆x , kann jedoch für größere Änderungen des Ortes infolge der Ortsabhängigkeit p(x) we sentlich von der ebenen Welle abweichen. Die Wellenfunktion im klassischen Grenzfall (5.26) faktorisiert in einen zeit- und ortsabhängigen Teil: ψ(x, t) = e− ℏ Et φ(x) , i
(5.28)
wobei Letzterer durch x
i φ(x) = C(x0 , t0 ) exp ( ∫ dx p(x )) ℏ x0
gegeben ist. Da für x = x0 das Integral im Exponenten verschwindet, gilt offenbar x
i φ(x) = φ(x0 ) exp ( ∫ dx p(x )) . ℏ
(5.29)
x0
Die Faktorisierung (5.28) ist, wie wir später sehen werden, nicht auf den klassischen Grenzfall beschränkt, sondern gilt allgemein für sogenannte stationäre Prozesse, bei denen die Lagrange- bzw. Hamilton-Funktion nicht explizit von der Zeit abhängt. φ(x) wird die stationäre Wellenfunktion genannt. Für stationäre Prozesse ist die Auf enthaltswahrscheinlichkeit zeitunabhängig: w(x, t) = |ψ(x, t)|2 = |φ(x)|2 . Die oben durchgeführte Auswertung des Funktionalintegrals (5.17) für die Wellenfunk tion mittels der stationären Phasenapproximation wird als quasiklassische oder semi klassische Näherung bezeichnet.³ 3 Streng genommen sollte man unterscheiden zwischen quasiklassisch und semiklassisch: Wird die stationäre Phasenapproximation nur in nullter Ordnung durchgeführt, d. h., das Funktionalintegral
70 | 5 Der klassische Grenzfall
5.4 Die Bohr-Sommerfeld’sche Quantisierungsbedingung Wir betrachten ein Teilchen mit Masse m in einem anziehenden (zeitunabhängigen) Potenzial V(x). Die klassische Wirkung des Teilchens sei hinreichend groß (S[x] ≫ ℏ), sodass die semiklassische Näherung anwendbar ist. Die klassische Bewegung verläuft zwischen den Umkehrpunkten, die durch die Beziehung V(x) = E definiert sind, und ist deshalb periodisch. Wir interessieren uns hier für den Propagator zur festen Energie K(x b , x a ; E) (3.33). Benutzen wir für K(x b , t b ; x a , t a ) die semiklassische Näherung (5.20), so erhalten wir ∞ i
K(x b , x a ; E) = ∫ dTe ℏ ET K(x b , T; x a , 0) −∞ ∞
i i ̃ ≃ ∫ dT exp [ ET + S(x b , x a ; T)] , ℏ ℏ
(5.30)
−∞
wobei wir zur Abkürzung der Notation ̃ b , x a ; T) = S[x](x ̃ b , T; x a , 0) S(x gesetzt haben. Für eine semiklassisch verlaufende Bewegung (S ̃ ≫ ℏ) können wir auch das Integral über die Zeit T in der stationären Phasenapproximation berechnen. Der Exponent in Gleichung (5.30) wird stationär bezüglich der Zeit T für E+
̃ b , x a ; T) ∂ S(x =0. ∂T
(5.31)
Nach der Hamilton-Jacobi’schen Differenzialgleichung (5.23) ist aber −
̃ b , x a ; T) ∂ S(x = H[T] ∂T
̃ besitzt, die in gerade die Energie, die das Teilchen auf der klassischen Trajektorie x(t) der Zeit T von x a nach x b läuft. Damit lautet die stationäre Phasenbedingung (5.31) E = H[T] .
(5.32)
Für vorgegebene Energie E wählt diese Bedingung die Zeitdauer T, die das Teilchen ̃ von x a nach x b benötigt, so aus, dass die zugehörige erhaltene auf der Trajektorie x(t)
̃ durch seinen Integranden am stationären Punkt (klassische Trajektorie x(t)) ersetzt, wie wir das oben getan haben, so sollte man dies als quasiklassische Näherung bezeichnen, während der Begriff semi klassische Näherung für die volle stationäre Phasenapproximation vorbehalten sein sollte, in der auch ̃ mit einge das Gauß’sche Funktionalintegral über die Fluktuationen um die Klasse Trajektorie x(t) schlossen wird. Wir werden jedoch dem allgemeinen Sprachgebrauch folgend beide Termini als Syn onyme betrachten.
5.4 Die Bohr-Sommerfeld’sche Quantisierungsbedingung
| 71
Energie H[T] mit der von außen vorgegebenen Energie E übereinstimmt. Benutzen wir die kanonische Form der Wirkung (5.25), so erhalten wir für die Phase des Inte granden (5.30) am stationären Punkt den Ausdruck T
T
̃ b , x a ; T) = TH + ∫ dt (p ẋ − H) = ∫ dt p ẋ . W(T) := TE + S(x 0
(5.33)
0
Hierbei ist p = p(x(t)) (5.27) der Impuls des Teilchens auf der klassischen Trajekto rie x(t). Die (zeitlich erhaltene) klassische Energie H[T] ist eindeutig durch die Zeit ̃ von x a nach dauer T festgelegt, die das Teilchen zum Durchlaufen der Trajektorie x(t) x b benötigt. Die Umkehrung gilt jedoch nicht: Unter den klassischen Trajektorien, die für eine vorgegebene Energie E von x a nach x b laufen, gibt es eine, die auf direktem (kürzestem) Weg von x a nach x b läuft, sowie weitere Trajektorien, die erst über einen oder beide Umkehrpunkte den Punkt x b erreichen. Darüber hinaus gibt es noch Trajektorien, die von x a beginnend erst nach n zusätzlichen (geschlossenen) Umläufen den Ort x b erreichen. Um die Situation zu vereinfachen, betrachten wir den Fall⁴ x b = x a . Es tragen dann nur solche Trajektorien bei, die wieder zum Ausgangspunkt zurückkehren. Neben der trivialen „Trajektorie“, bei der das Teilchen einfach am Ort x a verharrt, gibt es dann noch die Trajektorien, auf denen das Teilchen n geschlossene Umläufe vollzieht, um von x a nach x a zu kom men. In einem anziehenden Potenzial kann sich ein klassisches Teilchen mit einer Energie E, die größer als das Potenzialminimum ist, nur während der Zeitdauer T = 0 an einem Ort x a aufhalten. Ist τ die Zeit, die das Teilchen mit der Energie E für einen geschlossenen Umlauf benötigt, so benötigt das Teilchen für n geschlossene Umläufe die Zeitperiode T n = nτ . Hierbei gehört n = 0 zu der trivialen „Trajektorie“. Man beachte, dass n beliebige ganz zahlige Werte annehmen kann. (Negative n entsprechen Umläufe des Teilchens auf der durch die Energie E fixierten Trajektorie in negativer Zeitrichtung.) Da all diese Tra jektorien zu verschiedenen n dieselbe Energie besitzen, erfüllen sie alle die stationäre Phasenbedingung (5.32) und liefern somit stationäre Punkte, die in der stationären Phasenapproximation berücksichtigt werden müssen. (Wir erinnern daran, dass in der stationären Phasenapproximation über die Beiträge von allen stationären Punk ten zu summieren ist.) Deshalb erhalten wir für den Propagator (5.30) in der untersten Ordnung stationärer Phasenapproximation ∞
K(x a , x a ; E) ≃ ∑ e ℏ W(T n ) . i
(5.34)
n=−∞
4 Den allgemeinen Fall x b ≠ x a werden wir explizit in Abschnitt 6.2 für den unendlich hohen Poten zialtopf behandeln.
72 | 5 Der klassische Grenzfall Für die zugehörigen stationären Phasen W(T n ) (5.33) finden wir mit den Randbedin gungen x(0) = x a und x(T n ) = x a Tn
nτ
̇ = ∫ dt p(t)x(t) ̇ = n ∮ dx p(x) , W(T n ) = ∫ dt p(t)x(t) 0
(5.35)
0
wobei
τ
̇ ∮ dx p(x) = ∫ dt x(t)p(x(t))
(5.36)
0
der Beitrag von einem vollen Umlauf im Potenzial (z. B. von x a nach x a ) bei vorgege bener Energie E ist. Einsetzen von (5.35) in (5.34) liefert ∞ i K(x a , x a ; E) = ∑ exp [n ∮ dx p] . ℏ n=−∞
Die verbleibende Summe können wir mithilfe der Poisson-Formel, ∞
∞
n=−∞
n=−∞
∑ e inx = 2π ∑ δ(2πn − x) , die in Abschnitt 5.6 bewiesen wird, umformen zu ∞
K(x a , x a ; E) = ∑ 2πℏ δ(2πℏn − ∮ dx p) . n=−∞
Dieser Propagator ist nur für solche Energien von null verschieden, für welche die folgende Beziehung gilt: !
∮ dx p(x) = 2πℏn ,
n∈ℤ.
(5.37)
Dies ist die Bohr-Sommerfeld’sche Quantisierungsbedingung. Das Wirkungsintegral auf der linken Seite stellt die Fläche dar, welche die klassische Trajektorie im Phasenraum einschließt. Physikalisch beinhaltet deshalb die obige Bedingung für eine quasiklas sisch verlaufende Bewegung (S[x] ≫ ℏ): Aus dem Kontinuum von periodischen klassischen Trajektorien führen nur solche auf Quantenzustände, bei denen die eingeschlossene Phasenraumfläche ein Viel faches von 2πℏ ist (siehe Abb. 5.5(b)). Setzen wir nun für p(x) den Energiesatz (5.27) ein, so lautet die Quantisierungsbedin gung: ∮ dx √2m(E − V(x)) = 2πℏn .
5.4 Die Bohr-Sommerfeld’sche Quantisierungsbedingung
| 73
E
V (x)
E3 E2 E1
x (a)
p n=3 n=2
2π}
n=1
x
(b) Abb. 5.5: (a) Die quantisierten Energien eines Teilchens im anziehenden Potenzial V(x) in semi klassischer Näherung. (b) Die zu den quantisierten Energien gehörigen Phasenraumtrajektorien: Die von den Phasenraumtrajektorien benachbarter Quantenzustände eingeschlossenen Flächen unterscheiden sich um eine Fläche 2πℏ.
Für ein gegebenes n ist diese Bedingung nur für eine diskrete Energie E ≡ En erfüllt. Die Energie eines quantenmechanischen Teilchens, welches in einem Poten zial V(x) eingeschlossen ist, kann also nicht kontinuierlich variieren (wie in der klas sischen Mechanik), sondern nur diskrete, d. h., quantisierte Werte annehmen (siehe Abb. 5.5(a)). Die Energien, für welche die Quantisierungsbedingung erfüllt ist, wer den als Quanten(energie)zustände bzw. stationäre Quantenzustände des Teilchens be zeichnet. Benachbarte Quantenzustände unterscheiden sich durch eine Fläche von 2πℏ im Phasenraum. N Zustände besetzen damit ein Phasenraumvolumen von 2πℏN. Die Bohr-Sommerfeld’sche Quantisierungsbedingung (5.37) garantiert auch, dass nach einem Umlauf des Teilchens auf der geschlossenen (periodischen) Trajektorie die stationäre Wellenfunktion φ(x) aus (5.28) ihren ursprünglichen Wert wieder erlangt. Bei der Ableitung der Bohr-Sommerfeld’schen Quantisierungsbedingung hatten wir vorausgesetzt, dass die Wirkung groß gegenüber ℏ ist. Deshalb kann diese Bezie hung nur für große n eine quantitativ gute Beschreibung liefern. Bei der praktischen
74 | 5 Der klassische Grenzfall
Anwendung dieser Beziehung zeigt sich jedoch, dass sie auch in vielen Fällen für klei ne n eine sehr brauchbare qualitative Beschreibung liefert. Im klassischen Grenzfall S[x]/ℏ → ∞ (d. h. n → ∞) wird der Abstand zwischen zwei benachbarten Phasenraumtrajektorien beliebig klein, und wir erhalten die kon tinuierliche Mannigfaltigkeit von periodischen klassischen Trajektorien. Als einfaches illustratives Beispiel betrachten wir einen rechteckigen Potenzial topf (siehe Abb. 5.6). Für E < V0 findet die entsprechende klassische Bewegung nur innerhalb des Potenzialtopfes mit konstantem Impuls statt, und die Potenzialwände bei x = ±a sind die Umkehrpunkte der Bewegung, in denen der Impuls sein Vorzei chen wechselt: p = ±√2mE . Im vorliegenden Fall ist der Impuls also stückweise konstant, und wir erhalten für das Wirkungsintegral (5.36) ∮ dx p = |p|2L , wobei L = 2a die Breite des Potenzialtopfes und somit 2L die Länge der klassischen Trajektorie sind, siehe Abb. 5.6. Die Quantisierungsbedingung (5.37) liefert dann: |p| =
2πℏ nπℏ n= =: p n . 2L L
(5.38)
V (x)
V0
x (a)
−a
a p
√
2mE x
√ − 2mE (b)
a
a
Abb. 5.6: (a) Rechteckiger Potenzialtopf; (b) Phasenraumtrajektorie eines Teilchens im Potenzialtopf.
5.4 Die Bohr-Sommerfeld’sche Quantisierungsbedingung
n=3
n=5
| 75
n=8
Abb. 5.7: Illustration der de Broglie’schen Quantisierungsbedingung.
Die Impulse eines quantenmechanischen Teilchens im Potenzialtopf sind also quan tisiert, genau wie die Energien En =
p2n 1 nπℏ 2 = ( ) . 2m 2m L
(5.39)
Für einen konstanten Impuls |p| stellt die stationäre Wellenfunktion φ(x) (5.28) eine ebene Welle der Form φ(x) ∼ e ±i|p|x/ℏ dar. Die Wellenlängen λn =
2π 2πℏ 2L = = kn pn n
sind nach der Quantisierungsbedingung (5.38) so beschaffen, dass gerade ein Vielfa ches der Wellenlänge auf die periodische (geschlossene) Trajektorie passt (Abb. 5.7), d. h.: 2L = nλ n . Dies ist die de Broglie-Quantisierungsbedingung, die offenbar eine Folge der BohrSommerfeld’schen Quantisierungsbedingung ist. Für den rechteckigen Potenzialtopf bedeutet sie offenbar, dass für einen stationären Quantenzustand ein Vielfaches der halben Wellenlänge in den Potenzialtopf passen muss (siehe Abb. 5.8). n=3
n=2
n=1
Abb. 5.8: Wellenfunktionen der stationären Zustände im eindimensionalen Potenzialtopf in semiklassischer Näherung.
76 | 5 Der klassische Grenzfall
Nach der de Broglie’schen Quantisierungsbedingung sind die stationären Bahnen durch stehende Wellen gegeben. Dies ist physikalisch sofort einsichtig. Nicht stehen de Teilchenwellen würden sich durch destruktive Interferenz nach einigen Umläufen auslöschen. Die de Broglie’sche Bedingung scheint damit auch das konzeptionelle Problem der Energieabstrahlung der Elektronen im Bohr’schen Atommodell zu klären: Ein auf einer geschlossenen Bahn umlaufendes Elektron ist eine beschleunigte La dung und muss nach den Gesetzen der klassischen Elektrodynamik Energie abstrah len, kann also keinen stationären Zustand bilden. Demgegenüber kann eine stehende Welle auch in der klassischen Elektrodynamik strahlungsfrei existieren. Im Falle eines unendlich hohen Potenzialtopfes besitzen die stehenden Wellen Knoten an den Potenzialwänden, wie später eine strenge quantenmechanische Be handlung zeigen wird. Bemerkenswert ist, dass die semiklassische Quantisierungs bedingung für den rechteckigen Potenzialtopf, solange die Energie E < V0 ist, kei ne Information über die Höhe V0 des Potenzialtopfes enthält. Dies ist eine (inkorrek te) Besonderheit der hier benutzten semiklassischen Näherung. Wie wir später sehen werden, hängt die exakte Energie des quantisierten Zustandes von V0 ab, und der semiklassische Ausdruck (5.39) wird nur im Grenzfall V0 → ∞ exakt. Hieraus kön nen wir schließen, dass die semiklassische Näherung gut für Energien E, die sehr viel kleiner als V0 sind, ist, aber ungenau wird, wenn E in die Nähe der Potenzialkante V0 kommt. Für E > V0 ist die klassische Bewegung nicht mehr gebunden. Das Phasenraum integral ∮ dx p(x) divergiert dann: Schon mit einer infinitesimalen Änderung von E bzw. von {√2m(E − V0 ) , |p| = { √2mE , {
|x| > a |x| ≤ a
lässt sich das Phasenraumvolumen ∮ dx p(x) um 2πℏ vergrößern und somit die BohrSommerfeld’sche Quantisierungsbedingung erfüllen. Für E > V0 können daher E und p beliebige kontinuierliche Werte annehmen, und die Zustände sind nicht quantisiert.
5.5 Die Wellenfunktion im klassisch verbotenen Bereich Der quasiklassische Ausdruck für die Wellenfunktion (5.26) wurde unter der alleinigen Voraussetzung abgeleitet, dass S[x]̃ ≫ ℏ. In diesem Limes tragen zur Wellenfunk tion (bzw. Übergangsamplitude) nur Trajektorien bei, welche die Wirkung extremie ren. Aus mathematischer Sicht müssen diese Extrema nicht notwendigerweise zu klas sisch realisierten Trajektorien gehören, sondern können auch im klassisch verbotenen Energiebereich E < V(x)
5.5 Die Wellenfunktion im klassisch verbotenen Bereich | 77
V (x)
E
x
x0
Abb. 5.9: Potenzial mit klassisch verbotenem Bereich x > x0 .
liegen. Bei der Ableitung von (5.26) wurden insbesondere keine Voraussetzungen über den Wertebereich von x gemacht. Dieser Ausdruck sollte deshalb auch im klassisch verbotenen Bereich gelten (Abb. 5.9). In diesem Bereich wird der Impuls rein imaginär: p(x) = ±i|p(x)| = ±i√2m(V(x) − E) . Prinzipiell können aus mathematischer Sicht beide Wurzeln auftreten: p(x) = ±i|p(x)|. Eine der beiden Wurzeln würde jedoch zu einer exponentiell anwachsenden Aufent haltswahrscheinlichkeit des Teilchens unterhalb des Potenzials, d. h. im klassisch verbotenen Bereich, führen, was aus physikalischer Sicht auszuschließen ist, da im klassischen Limes S/ℏ → ∞ das Teilchen sich nicht im klassisch verbotenen Gebiet aufhalten darf. Deshalb ist das Vorzeichen stets so zu wählen, dass die Wellenfunk tion im klassisch verbotenen Gebiet exponentiell abklingt. Bezeichnen wir mit x0 den klassischen Umkehrpunkt, bei dem V(x0 ) = E bzw. p(x0 ) = 0, so finden wir aus Gleichung (5.29) für die stationäre Wellenfunktion im klassischen verbotenen Bereich x > x0 mit V(x) > E (siehe Abb. 5.9): x
φ(x) = φ(x0 ) exp (− ∫ dx |p(x )|) ,
|p(x)| = √2m(V(x) − E) .
(5.40)
x0
Dasselbe Verhalten finden wir damit für die Aufenthaltswahrscheinlichkeit: x
|φ(x)| = |φ(x0 )| exp (−2 ∫ dx |p(x )|) , 2
2
x > x0 .
x0
Während für ein klassisches Teilchen mit der Energie E der Potenzialbereich E < V(x) streng verboten ist, kann ein quantenmechanisches Teilchen mit einer gewissen Wahrscheinlichkeit in dieses klassisch verbotene Gebiet eindringen. Diese Wahr scheinlichkeit bzw. die Wellenfunktion fällt jedoch exponentiell mit der Eindringtiefe ab. Für die Wellenfunktion eines quasiklassischen Teilchens (d. h. mit einer Wirkung S[x] ≫ ℏ) in einem Potenzialtopf erhalten wir damit das in Abb. 5.10 skizzierte Ver halten: Im klassisch erlaubten Gebiet E > V(x) oszilliert die Wellenfunktion mit der „lokalen Wellenzahl“ k(x) = p(x)/ℏ und fällt im klassisch verbotenen Gebiet E < V(x) exponentiell mit der Eindringtiefe ab.
78 | 5 Der klassische Grenzfall
V (x) E
[Reϕ(x)]2
x
Abb. 5.10: Illustration der stationären Wellenfunktion φ(x) eines Teilchens im Potenzial V(x) in semi klassischer Näherung (5.28). Im klassisch erlaubten Bereich E > V(x) verhält sich die Wellenfunktion lokal wie eine ebene Welle, während sie im klassisch verbotenen Gebiet exponentiell abklingt.
5.6 Beweis der Poisson-Formel Zur Ableitung der Bohr-Sommerfeld’schen Quantisierungsbedingung (5.37) benutzten wir die Poisson-Formel ∞
∞
n=−∞
k=−∞
∑ e inx = 2π ∑ δ(x − 2πk) ,
(5.41)
waren deren Beweis jedoch schuldig geblieben. Wir wollen ihn nun nachholen: Wir nehmen zunächst x > 0 an. Zur Berechnung der auf der linken Seite stehenden Summe über die ganzen Zahlen drücken wir diese durch ein Konturintegral (geschlossenes Kurvenintegral) in der komplexen Ebene aus (ε > 0): ∞
∑ e inx = lim ∮ dz e izx g ε (z) , n=−∞
ε→0
C
wobei g ε (z) =
(5.42)
1 e−i2π(z−iε)
1− und die Integrationskontur C in Abb. 5.11 dargestellt ist. Zum Beweis von (5.42) ver wenden wir, dass die Funktion g ε (z) Pole bei z = z n ≡ n + iε besitzt, wobei n eine ganze Zahl ist. Die zugehörigen Residuen sind: Res g ε (z)|z=z n =
1 . 2πi
Benutzt man den Residuensatz ∮ dz f(z) = 2πi ∑ Res f(z)|z=z k k
5.6 Beweis der Poisson-Formel
| 79
Im{z}
C 1 + i
2 + i Re{z}
−2
−1
2
1
0
Abb. 5.11: Illustration des geschlossenen Integrationsweges C für x > 0.
und beachtet Res (e izx g(z)|z=z k ) = e iz k x Res g(z)|z=z k , so produziert das Integral auf der rechten Seite von (5.42) gerade die Summe auf der linken Seite, wenn wir ε → 0 gehen lassen. (Die Einführung von ε war nötig, damit keine Singularitäten auf der Integrationskontur liegen, was Voraussetzung für Anwen dung des Residuensatzes ist.) Jetzt erinnern wir uns, dass wir uns auf x > 0 beschränkt hatten. Dann ist die Funktion e izx für Im(z) > 0 eine in der oberen komplexen Halbebene reguläre Funk tion, die für |z| → ∞ exponentiell abklingt. In diesem Gebiet ist auch die Funktion g ε=0 (z) regulär und klingt für |z| → ∞ exponentiell ab. Wir können deshalb den obe ren Teil der Integrationskontur in der komplexen Ebene verschieben zu einem im Un endlichen verlaufenden Halbkreis. Das Integral über diesen Halbkreis verschwindet, da die Funktion dort überall verschwindet. Zum Integral trägt deshalb nur der Inte grationsweg entlang der reellen Achse von −∞ bis +∞ bei, und wir erhalten: ∞
∞
∑ e
inx
= lim ∫ dze izx g ε (z) . ε→0
n=−∞
−∞
Die Funktion g ε (z) lässt sich als unendliche geometrische Reihe darstellen: g ε (z) =
1 1−
e−i2π(z−iε)
∞
= ∑ e−i(z−iε)2πk . k=0
Setzen wir diese Darstellung in das obige Integral ein und benutzen die Fourier-Dar stellung der δ-Funktion (A.17), so finden wir im Limes ε → 0: ∞
∑ e n=−∞
∞ inx
∞
∞
k=0
k=0
= ∫ dz ∑ e iz(x−2πk) = 2π ∑ δ(x − 2πk) . −∞
(5.43)
80 | 5 Der klassische Grenzfall Da für x > 0 und k < 0 δ(x − 2πk) = δ(x + 2π|k|) = 0 , können wir auf der rechten Seite von (5.43) die Summation über k bis nach −∞ erstre cken, ohne dabei den Wert der Summe zu verändern. Damit erhalten wir das gesuchte Ergebnis (5.41) für den Fall x > 0. In analoger Weise beweist man die Poisson-Formel für den Fall x < 0. Für x = 0 divergieren beide Seiten von Gleichung (5.41). Die Poisson-Formel (5.41) lässt sich anschaulich wie folgt erklären: Wird auf der linken Seite die Sum mation über n durch eine Integration über reelle n ersetzt, entsteht bekanntlich die δ-Funktion (sie he (A.17)): ∞
∫ dne inx = 2πδ(x) . −∞
Durch die Beschränkung von n auf ganze Zahlen wird exp(inx) zu einer periodischen Funktion e in(x+2πk) = e inx . Die auf der rechten Seite von Gleichung (5.41) stehende Summe ∞
∑ δ(x − 2πk) k=−∞
liefert aber gerade die periodische Verallgemeinerung der δ-Funktion δ(x).
6 Unendlich große Potenzialsprünge* 6.1 Die unendlich hohe Potenzialkante Bisher haben wir eine strenge quantenmechanische Behandlung nur für das freie Teil chen durchgeführt. Im Folgenden soll als erstes nicht triviales Beispiel die Bewegung eines quantenmechanischen Teilchens bei Anwesenheit einer unendlich hohen Po tenzialkante betrachtet werden, die sich bei x = 0 befindet und in das Gebiet negativer x-Werte erstreckt. Die Behandlung der unendlich hohen Potenzialkante ist Vorausset zung für den später zu behandelnden unendlich tiefen Potenzialtopf. Die Potenzialkante ist durch {∞ , V(x) = { 0, {
x≤0 x>0
definiert. Die unendlich hohe Potenzialkante ist eine mathematische Idealisierung, die in der Natur nicht existiert. Wir können dieses Potenzial nur als Grenzfall eines sich sehr rapide ändernden Potenzials betrachten, das schnell gegen eine Konstante V0 strebt (Abb. 6.1). Vb (x)
V0
b lim Vb (x) = V (x)
b→0
E x 0 x ¯ Abb. 6.1: Die unendlich scharfe Potenzialkante als Grenzwert eines sich rasch ändernden Potenzials.
* Dieses Kapitel ist für das Verständnis der übrigen Kapitel nicht erforderlich und kann deshalb beim ersten Lesen übersprungen werden. https://doi.org/10.1515/9783110586022-006
82 | 6 Unendlich große Potenzialsprünge
6.1.1 Der Propagator bei Anwesenheit einer unendlich hohen Potenzialwand Wir betrachten zunächst die Wellenfunktion bei einem endlichen Potenzialsprung. Wir setzen voraus, dass der asymptotische Wert V0 des Potenzials für x → −∞ sehr groß gegenüber der Energie E des Teilchens ist. Trotzdem soll diese Energie groß ge nug sein, dass eine semiklassische Behandlung möglich wird. In Abschnitt 5.3 (vgl. Gleichung (5.26)) fanden wir in der semiklassischen Nähe rung für die Ortsabhängigkeit des Propagators: x
i K(x, t; x , t ) ∼ exp ( ∫ dy p(y)) , ℏ
(6.1)
x
mit p(x) = √2m(E − V(x)). Wir betrachten jetzt einen Weg, der von einem Ort x im klassisch erlaubten Bereich über den klassischen Umkehrpunkt x̄ (bei welchem p(x)̄ = 0) hinaus in das klassisch verbotene Gebiet x < x̄ führt, siehe Abb. 6.1. Nach Gleichung (6.1) können wir wegen x
x̄
x
∫ dy p(y) = ∫ dy p(y) + ∫ dy p(y) x̄
x
x
den Propagator in der Form x
i K(x, t; x , t ) ∼ exp ( ∫ dy p(y)) K(x,̄ t; x , t ) ℏ
x̄
schreiben. Im klassisch verbotenen Gebiet x < x̄ (mit V(x) > E) ist p(x) = ±i|p(x)| , und wir finden: x 1 K(x, t; x , t ) ∼ exp (− ∫ dy √2m(V(y) − E)) K(x,̄ t; x , t ) . ℏ x̄ Unter der Voraussetzung einer sehr hohen und steilen Potenzialkante, V0 ≫ E ,
b→0,
x̄ → 0 ,
können wir die Energie gegenüber dem Potenzial im Ausdruck für den Impuls ver nachlässigen, V(y) − E ≃ V0 , und finden für die Wellenfunktion im klassisch verbotenen Gebiet: 1 ψ(x, t) ∼ K(x, t; x , t ) ∼ exp (− √2mV0 |x|) K(0, t; x , t ) . ℏ
6.1 Die unendlich hohe Potenzialkante
| 83
Für eine unendlich hohe Potenzialstufe V0 → ∞ verschwindet damit der Propaga tor bzw. die Wellenfunktion im klassisch verbotenen Gebiet. K(x, t; x , t ) = 0 } , ψ(x, t) = 0
x ≤ 0 , V0 → ∞ .
(6.2)
Durch die unendlich hohe Potenzialwand wird die Bewegung des Teilchens auf das Gebiet x > 0 eingeschränkt. Deshalb nimmt der Zerlegungssatz (3.4) hier die Gestalt ∞
K(b, a) = ∫ dx c K(b, c)K(c, a)
(6.3)
0
an, wobei betont sei, dass sich die Integration über die intermediäre Koordinate x c hier nur über das (klassisch) erlaubte Gebiet x c > 0 erstreckt. Bezeichnen wir den gleichzeitigen Limes des Propagators mit¹ lim K(x b , t b ; x c , t c ) =: f(x b , x c )
t c →t b
und nehmen im Zerlegungssatz (6.3) den Limes t a → t c → t b , so erhalten wir: ∞
f(x b , x a ) = ∫ dx c f(x b , x c )f(x c , x a ) . 0
Diese Gleichung besitzt die Lösung f(x b , x a ) = δ(x b − x a ) ∓ δ(x b + x a ) ,
(6.4)
wovon man sich leicht überzeugt, wenn man die Beziehung ∞
f(x b , x a ) = ∫ dx c [δ(x b − x c ) ∓ δ(x b + x c )]f(x c , x a ) 0
{∓f(−x b , x a ) , ={ f(x , x ) , { b a
xb < 0 xb > 0
benutzt und beachtet, dass für die in (6.4) definierte Funktion ∓f(−x b , x a ) = f(x b , x a ) gilt. Da der Propagator bei Anwesenheit der unendlich hohen Potenzialkante bei x = 0 verschwinden muss, kommt nur das obere Vorzeichen infrage, und wir erhalten damit die asymptotische Form lim K(x b , t b ; x c , t c ) = δ(x b − x c ) − δ(x b + x c ) .
t c →t b
(6.5)
1 Wegen der Homogenität der Zeit kann der Propagator K(b, a) bei Abwesenheit (explizit) zeitabhän giger Kräfte bzw. Potenziale nur von der Zeitdifferenz t b − t a abhängen, und sein gleichzeitiger Limes muss zeitunabhängig sein.
84 | 6 Unendlich große Potenzialsprünge
Wie für eine nicht eingeschränkte Bewegung könnten wir aus dem Zerlegungssatz und der Annahme, dass die Phase des Propagators durch die klassische Wirkung gegeben ist, die explizite Form des Propagators bei Anwesenheit der Potenzialwand bestim men. Im vorliegenden Falle empfiehlt es sich jedoch, einen einfacheren heuristischen Weg zu beschreiten. Das Teilchen kann sich rechts der Wand (d. h. für x > 0) frei bewegen. Es liegt also nahe, von der Lösung für das freie Teilchen auszugehen und dort die Randbedin gung (6.2) einzuarbeiten. Der Propagator des freien Teilchens ohne Wand ist in der kanonischen Formulie rung durch den Ausdruck (3.27) ∞
K0 (x, t; x , t ) = ∫ −∞
dp i p(x−x) i p2 eℏ (t − t )) exp (− 2πℏ ℏ 2m
(6.6)
gegeben. Zerlegen wir hier die ortsabhängige Exponentialfunktion in Real- und Ima ginärteil, i px px e ℏ px = cos ( ) + i sin ( ) , ℏ ℏ so nimmt der Propagator folgende Gestalt an: ∞
K0 (x, t; x , t ) = ∫ −∞
dp px px px px [cos ( ) cos ( ) + sin ( ) sin ( )] 2πℏ ℏ ℏ ℏ ℏ
⋅ exp (−
i p2 (t − t )) . ℏ 2m
Hierbei wurde benutzt, dass die gemischten Terme der Form sin(px/ℏ) cos(px /ℏ) aus Symmetriegründen nichts zum Integral beitragen. Wie wir oben gesehen haben, muss bei Anwesenheit der unendlich hohen Potenzialwand die Übergangsamplitude K bei x = 0 verschwinden. Deshalb können nur die Sinuswellen zum Propagator beitragen, der dann offenbar die Gestalt ∞
K(x, t; x , t ) = C ∫ −∞
dp px px i p2 sin ( ) sin ( ) exp (− (t − t )) 2πℏ ℏ ℏ ℏ 2m
(6.7)
besitzen muss. Hierbei ist C eine Normierungskonstante, die eingeführt wurde, da sich durch Weglassen der geraden Kosinuswellen die Normierung des Propagators ändert. Die Normierungskonstante lässt sich aus dem bereits bekannten gleichzeitigen Limes lim K(x, t; x , t )
t →t
bestimmen (siehe Gleichung (6.5)). Bevor wir diesen Limes betrachten, empfiehlt es sich, die Darstellung (6.7) noch etwas umzuformen. Die Sinusfunktionen stellen wir wieder durch Exponentialfunktionen dar, sin (
i i px 1 )= (e ℏ px − e− ℏ px ) , ℏ 2i
6.1 Die unendlich hohe Potenzialkante
| 85
und erhalten: ∞
i i i i dp C K(x, t; x , t ) = − ∫ (e ℏ px − e− ℏ px ) (e ℏ px − e− ℏ px ) 4 2πℏ
−∞
⋅ exp (−
i p2 (t − t )) ℏ 2m
∞
=
i i i i dp C ∫ (e ℏ p(x−x ) + e− ℏ p(x−x ) − e ℏ p(x+x ) − e− ℏ p(x+x ) ) 4 2πℏ
−∞
⋅ exp (−
i p2 (t − t )) ℏ 2m
∞
=
i i dp i p2 C (t − t )) , ∫ (e ℏ p(x−x ) − e ℏ p(x+x ) ) exp (− 2 2πℏ ℏ 2m
(6.8)
−∞
wobei wir im letzten Schritt im zweiten und vierten Term die Integrationsvariable p zu −p umbenannt haben. Nehmen wir hier den gleichzeitigen Limes t → t, so erhalten wir: C lim K(x, t; x , t ) = [δ(x − x ) − δ(x + x )] , 2 t →t wobei die Fourier-Darstellung der δ-Funktion (A.17) benutzt wurde. Für C = 2 repro duziert dieser Ausdruck das korrekte Ergebnis (6.5). Damit finden wir für den Propagator bei Anwesenheit der Potenzialwand: ∞
K(x, t; x , t ) = 2 ∫ −∞
dp px i p2 px exp (− (t − t )) sin ( ) sin ( ) 2πℏ ℏ 2m ℏ ℏ
(6.9)
oder aus (6.8) mit C = 2: ∞
K(x, t; x , t ) = ∫ −∞
i i dp i p2 exp (− (t − t )) (e ℏ p(x−x ) − e ℏ p(x+x ) ) 2πℏ ℏ 2m
= K0 (x, t; x , t ) − K0 (x, t; −x , t ) .
(6.10)
Wir können also den Propagator K bei Anwesenheit der Wand durch den des freien Teilchens, K0 (6.6) ausdrücken. In dieser Form ist es offensichtlich, dass K(x, t; x , t ) der Randbedingung (6.5) genügt, da lim K0 (x, t; x , t ) = δ(x − x )
t →t
gilt, siehe Gleichung (3.5).
86 | 6 Unendlich große Potenzialsprünge
6.1.2 Interpretation des Propagators: die Spiegelladungsmethode Die Darstellung (6.10) besitzt eine sehr anschauliche Interpretation: Der Propagator bei Anwesenheit der Wand lässt sich interpretieren, als sei zum Zeitpunkt t neben dem tatsächlich am Ort x vorhandenem Teilchen noch ein weiteres Teilchen, spiegel bildlich zum ersten Teilchen, am Ort −x , mit der entgegengesetzten Phase e iπ = −1 installiert worden, siehe Abb. 6.2(a). Durch die Interferenz der freien Übergangsam plituden vom ursprünglichen Teilchen bei x und von dem bei −x induzierten Spie gelteilchen entsteht die exakte Übergangsamplitude bei Anwesenheit der unendlich hohen Potenzialwand. Das hier erhaltene Ergebnis besitzt ein klassisches Analogon in der Elektrostatik (siehe Abb. 6.3): Befindet sich eine Punktladung Q vor einer unendlich ausgedehn ten, ideal leitenden Metallplatte, so entsteht ein elektrisches Feld, das genau die Ge stalt besitzt, als ob sich hinter der ideal leitenden Metallplatte, spiegelbildlich zur ursprünglichen Ladung, eine entgegengesetzte Ladung −Q, die sogenannte Spiegel ladung, befände. Die tatsächliche Ladung induziert auf der Metallplatte Oberflächen
(x, t)
t p t
(−x , t )
(x , t )
−x
x
(a)
t
(−x, t)
x
(x, t) p
t
(x , t ) x
−x (b)
x
0
Abb. 6.2: Geometrische Interpretation des quantenmechanischen Propagators bei Anwesenheit einer unendlich hohen Potenzialbarriere bei x = 0 mittels eines Spiegelteilchens. Die eingezeichne ten Strecken repräsentieren jeweils die freie Propagation vom Anfangs- zum Endpunkt der Strecke. In Abb. (a) wurde die Anfangs-, in Abb. (b) die Endkoordinate des Teilchens gespiegelt. Die gestri chelten Linien entstehen durch Zurückklappen der Spiegelteilchentrajektorien in den klassisch erlaubten Bereich.
6.1 Die unendlich hohe Potenzialkante
−Q
Q>0
−x
x
|
87
E=0 Abb. 6.3: Das zur unendlich hohen Potenzialwand analoge Randwertproblem aus der Elektrostatik: Punktladung vor unendlich ausgedehnter ebener Metallplatte, siehe Text.
ladungen, die dasselbe Feld erzeugen wie die fiktive Spiegelladung.² Diese Methode der Spiegelladung, bei der die Oberflächenladung der Metallplatte durch induzierte Spiegelladungen imitiert wird, hat sich in der Elektrostatik als äußerst bequem erwie sen. Derselben Methode können wir uns offenbar auch hier bedienen, um Randwert probleme in der Quantenmechanik zu lösen. Da der freie Propagator K0 (x, t; x t ) = √
m i m (x − x )2 exp ( ) i2πℏ(t − t ) ℏ 2 2(t − t )
(6.11)
nur von |x − x | abhängt, gilt K0 (x, t; −x , t ) = K0 (−x, t; x , t ) , und wir können (6.10) in äquivalenter Form schreiben: K(x, t; x , t ) = K0 (x, t; x , t ) − K0 (−x, t; x , t ) .
(6.12)
Durch diese Umformung haben wir das Spiegelteilchen vom Anfang der Bewegung (−x , t ) (siehe Abb. 6.2(a)) zum Ende der Bewegung (−x, t) (siehe Abb. 6.2(b)) verla gert.
2 Dieses Phänomen besitzt folgende mikroskopische Erklärung: In der ideal leitenden Metallplatte sind die elektrischen Ladungsträger (Elektronen) frei beweglich. Wird die Metallplatte in ein äußeres elektrisches Feld gebracht, z. B. indem Ladungen in die Nähe der Platte gebracht werden, so verschiebt das äußere Feld die Elektronen der Metallplatte relativ zu den positiv geladenen Atomrümpfen. Durch diese Ladungstrennung entstehen Influenzladungen, die ein Gegenfeld aufbauen, welches das äuße re Feld kompensiert. Dadurch kann kein elektrisches Feld in einen idealen Leiter eindringen, und die elektrischen Feldlinien müssen stets senkrecht auf der Leiteroberfläche stehen. Im vorliegenden Bei spiel induziert die Ladung vor der Metallplatte Ladungen auf der Metalloberfläche, die dasselbe Feld erzeugen, wie die fiktive Spiegelladung hinter der Metallplatte, siehe Abb. 6.3.
88 | 6 Unendlich große Potenzialsprünge
Der volle quantenmechanische Propagator eines freien Teilchens (6.11) lässt sich eindeutig durch die (geradlinige) klassische Trajektorie charakterisieren, die von (x , t ) nach (x, t) läuft. (Genauer gesagt hängt K(x, t; x t ) nur von der Länge L = |x − x | dieser Trajektorie und der Zeitdauer T = t − t ab, die das Teilchen zum Durchlaufen dieser Trajektorie benötigt.) Der Propagator bei Anwesenheit der unendlich hohen Potenzialwand lässt sich dann wie folgt interpretieren: Der direkte Term K0 (x, t; x , t ) beschreibt die freie Evo lution des Teilchens von x → x, so als ob überhaupt keine Potenzialwand vorhan den wäre. Der Spiegelterm K0 (−x, t; x , t ) entspricht der Propagation von x zum Ort des Spiegelteilchens −x. Spiegeln wir den hinter der Wand gelegenen Teil dieser Tra jektorie an der Potenzialwand, so erhalten wir die in Abb. 6.2(b) gestrichelt darge stellte Trajektorie, die am Ort x des tatsächlichen Teilchens endet. Diese Spiegelung ändert weder die Länge der Trajektorie L = |x − x | noch die Zeitdauer T = |t − t | und somit auch nicht den zugehörigen freien Propagator K0 . Mit der gespiegelten Trajek torie (x , p, x) ist somit der gleiche Propagator wie mit der ursprünglichen Trajekto rie des Spiegelteilchens, (x , p, −x), verbunden. Deshalb können wir den Spiegelterm K0 (−x, t; x , t ) auch interpretieren als die freie Ausbreitung des Teilchens von x bis zur Potenzialwand, wo es elastisch reflektiert wird und sich anschließend wieder frei bis zum Endpunkt x ausbreitet. Das negative Vorzeichen von K0 (−x, t; x , t ) in (6.12) lässt sich dann als Konsequenz des Phasensprungs π (e iπ = −1) erklären, der bei einer Reflexion am festen Ende auftritt. Andererseits wissen wir, dass sich der volle quantenmechanische Propagator K0 (x, t; x , t ) durch Summation über sämtliche (i. A. klassisch nicht erlaubte) Trajek torien ergibt, die in der vorgegebenen Zeit t − t zwischen den Randpunkten x und x verlaufen. Durch die Anwesenheit des freien Propagators zum gespiegelten Teilchen, K0 (−x, t; x , t ), gibt es zu jeder zum freien Propagator K0 (x, t; x , t ) beitragenden ̄ Trajektorie x(t), die von x ausgeht, auf die Potenzialwand trifft und am Punkt x en ̄̄ det, eine zugehörige Trajektorie x(t), die bis zur Potenzialwand denselben Verlauf ̄ weiterläuft und somit am gespiegelten nimmt, dann aber spiegelsymmetrisch zu x(t) ̄ Punkt −x endet (siehe Abb. 6.4). Es ist aber für jede Trajektorie x(t), die „unterwegs“ die Potenzialwand trifft, ̄̄ ̄ K0 [x](−x, t; x , t ) = K0 [x](x, t; x , t ) , ̄ da die Amplitude K0 [x](x, t; x , t ) einer einzelnen (nicht notwendig klassisch erlaub ̄ allein durch die klassische Wirkung S[x]̄ bestimmt ist und diese ten) Trajektorie x(t) für tatsächliche und gespiegelte Trajektorien dieselbe ist. Da die Übergangsamplitude ̄̄ nach (6.12) von der der ursprünglichen Trajektorie der gespiegelten Trajektorie x(t) abgezogen wird, löschen sich die Beiträge beider Trajektorien zur Gesamtübergangs amplitude K aus. Der gespiegelte Propagator bewirkt also, dass jede Trajektorie, die auf die Wand trifft, keinen Beitrag zur Übergangsamplitude liefert. Die Potenzialwand wirkt damit auf die Trajektorien wie ein „Quantenfilter“, der alle auffallenden Tra jektorien verschluckt, ähnlich wie ein schwarzer Körper alle auffallenden Strah
6.2 Der unendlich hohe Potenzialtopf
| 89
t
x ¯(t)
¯(t) x
−x
x
x
Abb. 6.4: Auslöschung von Trajektorien, die auf die Wand treffen.
len verschluckt. Diese Feststellung ist äquivalent zu unserer Beobachtung, dass zu dem Propagator bei Anwesenheit der Wand nur die Sinuswellen beitragen (siehe Gleichung (6.9)), während die Kosinuswellen, welche eine endliche Aufenthalts wahrscheinlichkeit des Teilchens an der Potenzialwand liefern würden, nicht in den Propagator eingehen.
6.2 Der unendlich hohe Potenzialtopf In Abschnitt 5.4 haben wir den eindimensionalen Potenzialtopf für eine semiklas sisch verlaufende Bewegung untersucht. Die Bohr-Sommerfeld’sche Quantisierungs bedingung führte dabei auf quantisierte Energien, bei denen sich das Teilchen im Potenzialtopf aufhält. Im Folgenden wollen wir eine strenge quantenmechanische Be handlung des Potenzialtopfes durchführen, ohne auf die semiklassische Näherung zurückzugreifen. Dabei werden wir uns der Einfachheit halber auf einen unendlich hohen Potenzialtopf beschränken. Das Potenzial ist deshalb durch {0 , V(x) = { ∞, {
0 t0 eindeutig durch eine Anfangsverteilung ψ(x, t0 ) bestimmt ist. 2. Da die Gleichung linear in der Wellenfunktion ist, gilt das Superpositionsprin zip: Jede Linearkombination von Lösungen ist wieder eine Lösung der Schrö dinger-Gleichung. Dies bedeutet insbesondere, dass Interferenzeffekte analog zur Optik auftreten.³ Die Linearität bzw. Gültigkeit des Superpositionsprinzips ist nicht verwunder lich, da wir den Zerlegungssatz aus dem Superpositionsprinzip gewonnen hat ten und die Schrödinger-Gleichung unter Benutzung des Zerlegungssatzes ab geleitet wurde. 3. Die Gleichung ist homogen, d. h., sie enthält keinen Term, der unabhängig von der Wellenfunktion ist. Aufgrund dieser Eigenschaft bleibt die Wahrscheinlich keit (Normierung) ∫ d3 x |ψ(x, t)|2 = ∫ d3 x w(x, t) = const. während der Zeitentwicklung erhalten, wie wir später noch explizit zeigen wer den. Aus der Ableitung der Schrödinger-Gleichung wird klar, dass nicht nur die Wellen funktion, sondern auch die Übergangsamplitude K(x, t; x , t ) für t ≥ t der Schrödin ger-Gleichung genügt: [iℏ∂ t − H(x, t)]K(x, t; x , t ) = 0 ,
t ≥ t .
(7.9)
Ferner erfüllt der Propagator die Anfangsbedingung (3.5) lim K(x, t; x , t ) = δ(x − x ) .
t→t
(7.10)
Gleichungen (7.9) und (7.10) definieren ein Anfangswertproblem, welches eine eindeu tige Lösung besitzt. Diese Lösung ist durch die Funktionalintegral-Darstellung (3.23) des Propagators gegeben.⁴
3 Auch in der Optik folgen die Interferenzeffekte aus der Linearität der Maxwell-Gleichungen. 4 Aus mathematischer Sicht repräsentiert die Größe G (x, t; x , t ) = K (x, t; x, t ) Θ (t − t )
100 | 7 Die Schrödinger-Gleichung
Die Berechnung des Propagators ist damit äquivalent zur Lösung der SchrödingerGleichung. Kennen wir in der Tat den Propagator und eine Wahrscheinlichkeitsvertei lung zu einem Anfangszeitpunkt t = t0 , ψ(x, t0 ) = ψ0 (x), so können wir unmittelbar die Wellenfunktion ψ(x, t) zu einem beliebigen späteren Zeitpunkt angeben (siehe Ab schnitt 4.1): ψ(x, t) = ∫ dx0 K(x, t; x0 , t0 )ψ(x0 , t0 ) . Im Allgemeinen ist jedoch der exakte quantenmechanische Propagator nicht bekannt, und man wird die Schrödinger-Gleichung direkt für die Wellenfunktion ψ statt für den Propagator K lösen, da die Lösung einer Differenzialgleichung i. A. einfacher als die Berechnung eines Funktionalintegrals ist.⁵ Wir werden später jedoch sehen, dass auch aus Kenntnis der Wellenfunktion der Propagator gewonnen werden kann. Für den unendlich hohen Potenzialtopf haben wir diesen Zusammenhang bereits in Glei chung (6.19) kennengelernt. Es sei darauf hingewiesen, dass die Schrödinger-Gleichung eine Differenzialglei chung ist, zu deren Lösung Anfangs- bzw. Randbedingungen benötigt werden, die im Propagator bereits enthalten sind. Für das freie Teilchen haben wir K bereits explizit berechnet und kennen somit die Lösung der Schrödinger-Gleichung. Benutzt man die explizite Form von K (3.27), ∞
K(x, t; x , t ) = ∫ −∞ ∞
≡ ∫ −∞
dp i i p2 exp ( p(x − x ) − (t − t )) 2πℏ ℏ ℏ 2m dp ψ p (x − x , t − t ) , 2πℏ
so lässt sich leicht nachprüfen, dass K in der Tat die Schrödinger-Gleichung erfüllt. Da Letztere linear ist, genügt es, dies für eine einzelne Fourier-Komponente i i p2 t) ψ p (x, t) = exp ( px − ℏ ℏ 2m zu zeigen. Dass ψ p (x, t) der Schrödinger-Gleichung für ein freies Teilchen der Masse m genügt, ist leicht zu verifizieren.
die Green’sche Funktion der Schrödinger-Gleichung (7.9), welche der Beziehung [iℏ∂ t − H(x, t)] G(x, t; x , t ) = δ(t − t ) genügt. 5 In der Quantenfeldtheorie, wo die Schrödinger-Gleichung zur Funktionalgleichung wird, erweist sich jedoch die numerische Berechnung des Funktionalintegrals gewöhnlich als einfacher als die Lö sung der entsprechenden Schrödinger-Gleichung.
7.2 Stationäre Lösungen der Schrödinger-Gleichung
| 101
7.2 Stationäre Lösungen der Schrödinger-Gleichung Unsere bisherigen Betrachtungen über die Zeitevolution quantenmechanischer Sys teme gelten allgemein für beliebige zeitabhängige Hamilton-Operatoren, also insbe sondere für beliebige zeitabhängige Potenziale. Im Folgenden wollen wir uns nun auf zeitunabhängige Hamilton-Operatoren beschränken. Falls der Hamilton-Operator H nicht explizit von der Zeit abhängt, lässt sich die Schrödinger-Gleichung durch Sepa ration der Zeit- und Ortsvariablen lösen. Dazu schreiben wir die Wellenfunktion als: ψ(x, t) = f(t)φ(x) . Einsetzen dieses Ansatzes in die Schrödinger-Gleichung (7.8) liefert nach Division durch f(t)φ(x): 1 ∂f(t) 1 iℏ = H(x)φ(x) . f(t) ∂t φ(x) Da die linke Seite dieser Gleichung nur von t, die rechte hingegen nur von x abhän gen, die Gleichung aber für alle Orte und Zeiten gültig ist, müssen beide Seiten gleich einer Konstanten sein, die wir mit E bezeichnen. Für die zeitabhängige Funktion f(t) erhalten wir dann die Differenzialgleichung ∂f(t) = Ef(t) , ∂t deren Lösung durch Separation der Variablen mit iℏ
f(t) = f(0)e − ℏ Et i
gegeben ist. Für den ortsabhängigen Teil erhalten wir entsprechend die Beziehung H(x) φ(x) = Eφ(x) .
(7.11)
Diese Gleichung stellt ein Eigenwertproblem für den Hamilton-Operator H dar: φ(x) muss eine Eigenfunktion des Hamilton-Operators zum Eigenwert E sein. Da H der Operator der Energie ist, müssen wir E als die Energie des Teilchens im Zustand φ(x) interpretieren. Gleichung (7.11) wird als stationäre (zeitunabhängige) SchrödingerGleichung bezeichnet. Wählen wir die Integrationskonstante⁶ f(0) = 1, so lautet die Lösung der Schrödinger-Gleichung für zeitunabhängiges H: ψ(x, t) = e− ℏ Et φ(x) . i
Solche Lösungen werden als stationäre Zustände bezeichnet, da die zugehörigen Wahrscheinlichkeitsdichten |ψ(x, t)|2 = |φ(x)|2 unabhängig von der Zeit sind. 6 Alle konstanten Faktoren können in φ(x) berücksichtigt werden.
102 | 7 Die Schrödinger-Gleichung
7.3 Das Ehrenfest-Theorem In der klassischen Mechanik sind die physikalisch beobachtbaren Größen Funk tionen von Ort und Impuls, d. h. Phasenraumfunktionen A(p, x). Im Prinzip stellt jede Phasenraumfunktion eine physikalisch messbare Größe dar. Wie wir jedoch bei der expliziten Behandlung des Impulses kennengelernt hatten, werden in der Quantenmechanik physikalische beobachtbare Größen nicht durch einfache Pha senraumfunktionen gegeben, sondern i. A. durch Operatoren repräsentiert. Für den Impuls hatten wir z. B. den Differenzialoperator p = ℏi ∇ gefunden. Ferner hatten wir gesehen, dass für die Messung einer physikalischen Observablen A eines Systems im Zustand ψ(x) i. A. keine absoluten Vorhersagen des Messergebnisses A i gemacht werden können. Wir können lediglich den Erwartungswert ⟨A⟩ = ∫ d3 x ψ∗ (x)A(x)ψ(x) angeben, der den mittleren Wert repräsentiert, der sich nach einer großen Anzahl N von Messungen (nach dem „Gesetz der großen Zahlen“ für N → ∞) einstellt, wenn das System jeweils vor der Messung im Zustand ψ(x) präpariert wurde: ⟨A⟩ =
1 N ∑ Ai , N i=1
N →∞.
Im Folgenden wollen wir die zeitliche Veränderung eines solchen Erwartungswertes untersuchen.
7.3.1 Die Zeitentwicklung von Erwartungswerten Wir betrachten den Erwartungswert einer beliebigen physikalischen Observable A(x, t), welche explizit von der Zeit abhängen kann, im Zustand ψ(x, t): ⟨A⟩ = ∫ d 3 x ψ∗ (x, t) A(x, t) ψ(x, t) .
(7.12)
Dieser wird sich im Laufe der Zeit verändern, da i. A. sowohl der Operator A als auch die Wellenfunktion ψ zeitabhängig sind. Für die zeitliche Änderung finden wir durch Differenziation nach der Zeit mit Anwendung der Produktregel: ∂⟨A⟩ ∂A(x, t) ∂ψ∗ (x, t) = ∫ d3 x (ψ∗ (x, t) ψ(x, t) + A(x, t)ψ(x, t) ∂t ∂t ∂t ∂ψ(x, t) ) . + ψ∗ (x, t)A(x, t) ∂t
(7.13)
Die letzten beiden Terme können wir in eine kompaktere Form bringen: Die Zeitablei tung der Wellenfunktion formen wir mithilfe der Schrödinger-Gleichung und ihrem
7.3 Das Ehrenfest-Theorem |
103
komplex konjugierten ℏ2 ∂ψ = Hψ = − ∆ψ + Vψ , ∂t 2m ∂ψ∗ ∂ψ ∗ ℏ2 −iℏ = (iℏ ∆ψ∗ + Vψ∗ ) = (Hψ)∗ = − ∂t ∂t 2m iℏ
(7.14) (7.15)
um, wobei wir voraussetzen, dass das Potenzial V reell ist. Zweimalige partielle Inte gration des dabei entstehenden Terms mit ∆ψ∗ liefert: ∫ d3 x (∆ψ∗ )Aψ = ∫ d3 x ∇ ⋅ [(∇ψ∗ )Aψ] − ∫ d3 x (∇ψ∗ ) ⋅ ∇(Aψ) = ∫ d3 x ∇ ⋅ [(∇ψ∗ )Aψ] − ∫ d3 x ∇ ⋅ [ψ∗ ∇(Aψ)] + ∫ d3 x ψ∗ ∆(Aψ) = ∫ d3 x ∇ ⋅ C1 − ∫ d3 x ∇ ⋅ C2 + ∫ d3 x ψ∗ ∆(Aψ) ,
(7.16)
wobei wir C1 (x, t) = (∇ψ∗ (x, t))A(x, t)ψ(x, t) , ∗
C 2 (x, t) = ψ (x, t)∇(A(x, t)ψ(x, t))
(7.17) (7.18)
gesetzt haben. Die in (7.16) auftretenden totalen Ableitungen können mithilfe des Gauß’schen Satzes in Oberflächenintegrale umgewandelt werden: ∫ d3 x ∇ ⋅ C k (x, t) = ∫ df x ⋅ C k (x, t) , V
k = 1, 2 .
(7.19)
∂V
Damit der Erwartungswert (7.12) existiert, muss der Integrand für |x| → ∞ schneller als ∼ |x|−3 abfallen. Die Vektorfelder C1 (x, t), C2 (x, t) enthalten gegenüber dem Inte granden von (7.12) eine zusätzliche Ableitung, was für |x| → ∞ auf eine zusätzliche 1/|x|-Abhängigkeit führt. Damit fallen die in Gleichungen (7.17) und (7.18) definierten Vektorfelder C k (x, t) (k = 1, 2) für |x| → ∞ schneller als |x|−2 ab, und die Oberflä chenintegrale (7.19) in (7.16) verschwinden, da sich die Integration über den gesamten dreidimensionalen Raum erstreckt und folglich die Oberflächenintegrale bei |x| → ∞ zu nehmen sind. Wir finden deshalb: ∫ d3 x (∆ψ∗ (x, t))A(x, t)ψ(x, t) = ∫ d 3 x ψ∗ (x, t)∆(A(x , t)ψ(x, t)) .
(7.20)
Setzen wir (7.20) unter Berücksichtigung von (7.14) und (7.15) in (7.13) ein, so erhalten wir: ∂A ∂⟨A⟩ = ∫ d3 x ψ∗ ψ ∂t ∂t ℏ2 ℏ2 i ∆ + V) A − A (− ∆ + V)] ψ . + ∫ d3 x ψ∗ [(− ℏ 2m 2m
104 | 7 Die Schrödinger-Gleichung
Diese Beziehung können wir auf folgende kompakte Form bringen: ∂⟨A⟩ ∂A i =⟨ ⟩ + ⟨[H, A]⟩ . ∂t ∂t ℏ
(7.21)
Neben einer expliziten Zeitabhängigkeit des Operators A verursacht auch sein Kom mutator mit dem Hamilton-Operator eine zeitliche Änderung seines Erwartungswer tes. Für Observablen A, die nicht explizit von der Zeit abhängen (∂A/∂t = 0), ist damit der Kommutator [H, A] die einzige Quelle der zeitlichen Änderung des Erwartungs wertes. Der Hamilton-Operator wird deshalb auch als Generator der Zeitevolution bezeichnet. Für zeitunabhängige Observablen A, die mit dem Hamilton-Operator kommutieren, ∂A = 0 , [H, A] = 0 , ∂t bleibt offenbar der Erwartungswert ⟨A⟩ während der zeitlichen Entwicklung des Sys tems konstant. Eine physikalische Observable A, für die ∂⟨A⟩ =0 ∂t gilt, wird Erhaltungsgröße genannt.
7.3.2 Beispiele Im Folgenden betrachten wir die zeitliche Entwicklung der Erwartungswerte einiger relevanter Observablen. 1.
Erhaltung der Norm: Der einfachste Operator ist durch den Einheitsoperator gegeben: A ≡ 1̂ . Die zugehörige Observable ist die Gesamtwahrscheinlichkeit oder Normierung. Ihr Erwartungswert ist die Norm der Wellenfunktion: ⟨1⟩̂ = ∫d3 x ψ∗ (x, t)1ψ(x, t) . Da der Einheitsoperator 1̂ zeitunabhängig ist und außerdem mit allen Opera toren kommutiert, muss die Norm offenbar erhalten bleiben: ∂⟨1⟩̂ =0. ∂t
(7.22)
7.3 Das Ehrenfest-Theorem | 105
2.
Erhaltung der Energie: Wir setzen A≡H und betrachten die Zeitentwicklung des Erwartungswertes des HamiltonOperators, welcher die Energie des Systems darstellt. Da der HamiltonOperator mit sich selbst kommutiert, bleibt die Energie dann erhalten, wenn der Hamilton-Operator nicht explizit von der Zeit abhängt: ∂H =0 ∂t
3.
⇒
∂⟨H⟩ =0. ∂t
Der Erwartungswert des Impulses: Wir identifizieren jetzt den Operator A mit dem Impulsoperator: A≡p=
ℏ ∇. i
Für den Kommutator des Impulses mit dem Hamilton-Operator finden wir: [H, p] = [
p2 ℏ + V(x), p] = [V(x), p] = − ∇V(x) . 2m i
Dies liefert für den Erwartungswert des Impulses: ∂⟨p⟩ = −⟨∇V(x)⟩ ≡ ⟨F(x)⟩ . ∂t
4.
(7.23)
Der Erwartungswert des Impulses bleibt erhalten, falls der Erwartungswert der Kraft F(x) = −∇V(x) verschwindet. Der Erwartungswert des Ortes: Wir identifizieren jetzt den Operator A mit dem Ort x: A≡x. Der relevante Kommutator lautet: [H, x] = [
1 1 p2 , x] = (p k [p k , x] + [p k , x]p k ) , [p k p k , x] = 2m 2m 2m
wobei Summation über gleiche Indizes (Einstein’sche Summenkonvention) vorausgesetzt und die Beziehung (4.42) benutzt wurden. Benutzen wir den Kommutator (4.38) [p k , x l ] = −iℏδ kl , so finden wir:
1ℏ p. m i Einsetzen dieser Beziehung in die Gleichung für den Erwartungswert liefert: [H, x] =
∂⟨x⟩ 1 = ⟨p⟩ . ∂t m
(7.24)
106 | 7 Die Schrödinger-Gleichung
Die Gleichungen (7.23) und (7.24) sind den kanonischen Bewegungsgleichungen sehr ähnlich. Sie unterscheiden sich von den Letzteren nur durch die Bildung des Erwartungswertes. In der Quantenmechanik werden also die klassischen kanoni schen Bewegungsgleichungen im Mittel erfüllt. Dies ist die Aussage des sogenannten Ehrenfest-Theorems. Dies bedeutet jedoch nicht, dass diese Bewegungsgleichungen für die Erwartungswerte erfüllt sind. Damit dies der Fall wäre, müsste es möglich sein, den Erwartungswert der Kraft ⟨F(x)⟩ durch die Kraft am Erwartungswert des Ortes, F(⟨x⟩), zu ersetzen. Dass dies i. A. nicht erlaubt ist, zeigt eine Entwicklung der Kraft F(x) um den Erwartungswert von x: F(x) = F(⟨x⟩) + ∇i F(⟨x⟩)(x i − ⟨x i ⟩) +
1 ∇i ∇j F(⟨x⟩)(x i − ⟨x i ⟩)(x j − ⟨x j ⟩) + ⋅ ⋅ ⋅ . 2
Für den Erwartungswert der Kraft erhalten wir mit ⟨x i − ⟨x i ⟩⟩ = ⟨x i ⟩ − ⟨x i ⟩ = 0 die Beziehung ⟨F(x)⟩ = F(⟨x⟩) +
1 [∇i ∇j F(⟨x⟩)] ⟨(x i − ⟨x i ⟩)(x j − ⟨x j ⟩)⟩ + ⋅ ⋅ ⋅ . 2
Wir können offenbar nur dann den Erwartungswert der Kraft durch die Kraft am Er wartungswert des Ortes ersetzen, wenn die zweiten und höheren Ableitungen der Kraft oder die zweiten und höheren Momente des Ortes verschwinden. Dies ist nur der Fall für die Bewegung des freien Teilchens (V(x) = 0), für eine konstante Kraft (V(x) ∼ x) und für den harmonischen Oszillator (V(x) ∼ x 2 ). Für ein freies Teilchen verschwindet die Kraft, und aus (7.23) folgt, dass der Erwartungswert des Impulses erhalten bleibt.
7.3.3 Analogie zur klassischen Mechanik Die Evolutionsgleichung des Erwartungswertes einer Observablen (7.21) hat eine sehr ähnliche Form wie die entsprechende Gleichung in der klassischen Mechanik. Dort werden Observablen durch Phasenraumfunktionen A(p, x, t) der verallgemeinerten Koordinaten x und Impulse p beschrieben. Für ihre zeitliche Evolution gilt:⁷ d ∂A(p, x, t) A(p, x, t) = + {A(p, x, t) , H(p, x, t)} , dt ∂t
(7.25)
7 Wir benutzen hier das Symbol d/dt für die totale Zeitableitung, die neben der expliziten Zeitabhän gigkeit (die durch den Operator ∂/∂t erfasst wird) noch die implizite Zeitabhängigkeit aufgrund der zeitlichen Änderung der klassischen Koordinaten x(t) und Impulse p(t) berücksichtigt. Wir weisen in diesem Zusammenhang darauf hin, dass in der Quantenmechanik die oben eingeführten Operatoren der Koordinaten x̂ und Impulse p̂ nicht zeitabhängig sind.
7.3 Das Ehrenfest-Theorem |
107
wobei die geschweifte Klammer die Poisson-Klammer
{A, B} :=
∂A ∂B ∂B ∂A − ∂x ∂p ∂x ∂p
bezeichnet und H die klassische Hamilton-Funktion ist. Der Vergleich von (7.21) und (7.25) zeigt, dass in der klassischen Mechanik der Kommutator durch die Poisson-Klammer ersetzt ist: 1 [H, A] → {H, A} . iℏ Diese Korrespondenz kann nur dann gelten, wenn im klassischen Grenzfall ℏ → 0 der Kommutator [H, A] von der Ordnung ℏ und außerdem rein imaginär ist. Die Poisson-Klammer { , } definiert eine mathematische Abbildung zwischen zwei Phasenraumfunktionen A und B, { , } : A, B → {A, B} , welche eine sehr ähnliche Struktur besitzt wie die Abbildung, die durch den Kommu tator zwischen zwei Operatoren vermittelt wird: [ , ] : A, B → [A, B] . Dies wird durch Tab. 7.1 verdeutlicht. Tab. 7.1: Vergleich von Poisson-Klammer- und Kommutator-Algebra. Poisson-Klammer-Algebra
Kommutator-Algebra
Antisymmetrie
{A, B} = −{B, A}
[A, B] = −[B, A]
Trivialität
{A, const.} = 0 {f(A), A} = 0
[A, const.] = 0 [f(A), A] = 0
Linearität
{A, B + C} = {A, B} + {A, C}
[A, B + C] = [A, B] + [A, C]
Distributivität
{A, BC} = B{A, C} + {A, B}C
[A, BC] = B[A, C] + [A, B]C
Jacobi-Identität
{A, {B, C}} + {B, {C, A}} + {C{A, B}} = 0
[A, [B, C]]+[B, [C, A]]+[C, [A, B]] = 0
Beispiele
{x i , p j } = δ ij {x i , x j } = {p i , p j } = 0
[x i , p j ] = iℏδ ij [x i , x j ] = [p i , p j ] = 0
108 | 7 Die Schrödinger-Gleichung
7.3.4 Der quantenmechanische Virialsatz In der klassischen Mechanik lässt sich eine einfache Beziehung zwischen dem Wert des Potenzials entlang einer klassischen Trajektorie und der kinetischen Energie an geben, wenn das Potenzial eine homogene Funktion⁸ der Koordinaten ist. Sie wird als Virialsatz bezeichnet. Dieser Satz besitzt ein quantenmechanisches Analogon, das wir im Folgenden kurz behandeln wollen. Wir setzen voraus, dass der Hamilton-Operator die übliche Form p2 H= + V(x) = T + V(x) 2m besitzt, und bilden den Kommutator mit dem Operator x ⋅ p. Unter Ausnutzung des Distributivgesetzes [A, BC] = [A, B]C + B[A, C] liefert dies [H, x ⋅ p] = [H, x] ⋅ p + x ⋅ [H, p] = −iℏ (
p2 − x ⋅ ∇V(x)) . m
(7.26)
Wir bilden den Erwartungswert dieser Gleichung in einem Eigenzustand φ(x) des Hamilton-Operators: Hφ(x) = Eφ(x) . (7.27) Für den Erwartungswert der linken Seite der obigen Gleichung ⟨[H, x ⋅ p]⟩φ = ⟨H(x ⋅ p)⟩φ − ⟨(x ⋅ p)H⟩φ finden wir im zweiten Term unter Ausnutzung der Eigenwertgleichung (7.27): ⟨(x ⋅ p)H⟩φ = E⟨x ⋅ p⟩φ .
(7.28)
Im ersten Term finden wir nach zweimaliger partieller Integration und unter Beach tung, dass die dabei auftretenden Randterme verschwinden: ⟨H(x ⋅ p)⟩φ = ∫ d3 xφ∗ (x) (− = ∫ d3 x [(−
ℏ2 ⃗ ⃗ ∇ ⋅ ∇ + V(x)) x ⋅ p φ(x) 2m
ℏ2 ⃗ ⃗ ∇ ⋅ ∇ + V(x)) φ∗ (x)] x ⋅ p φ(x) 2m ∗
= ∫ d3 x [−
ℏ2 ⃗ (∇⃗ ⋅ ∇φ(x)) + V(x)φ(x)] x ⋅ p φ(x) 2m ∗
= ∫ d3 x [H(x)φ(x)] x ⋅ p φ(x) .
8 Eine Funktion heißt homogen vom Grad α, wenn bei proportionaler Änderung aller Variablen um den Faktor c sich der Funktionswert um den Faktor c α ändert: f(cx1 , . . . , cx n ) = c α f(x 1 , . . . , x n ) .
7.3 Das Ehrenfest-Theorem | 109
Benutzen wir auch hier die Schrödinger-Gleichung (7.27) und beachten, dass die Energie E reell ist, so erhalten wir schließlich ⟨H(x ⋅ p)⟩φ = E⟨x ⋅ p⟩φ und mit (7.28) ⟨[H, x ⋅ p]⟩φ = 0 . Der Erwartungswert der rechten Seite der Gleichung (7.26) liefert damit: 1 2 ⟨p ⟩φ = ⟨x ⋅ ∇V(x)⟩φ m
(7.29)
Diese Gleichung ist das quantenmechanische Analogon des Virialsatzes. Für Poten ziale, die homogene Funktionen vom Grade α sind, gilt ⃗ x ⋅ ∇V(x) = αV(x) , sodass der quantenmechanische Virialsatz (7.29) die Gestalt 1 2 ⟨p ⟩φ = α⟨V(x)⟩φ m
(7.30)
annimmt. Zur Illustration wenden wir diesen Satz auf den harmonischen Oszillator und das Coulomb-Potenzial an: Das harmonische Oszillatorpotenzial V(x) =
1 mω2 x2 2
ist eine homogene Funktion vom Grade α = 2, da x ⋅ ∇(x 2 ) = 2x 2 und somit x ⋅ ∇V(x) = 2V(x). Für α = 2 liefert (7.30) ⟨T⟩φ = ⟨V⟩φ . Das Coulomb-Potenzial V(x) =
(7.31)
α |x|
ist eine homogene Funktion vom Grade α = −1, da x ⋅ ∇(1/|x|) = −1/|x| und somit x ⋅ ∇V(x) = −V(x). Der Virialsatz (7.30) liefert deshalb 1 ⟨T⟩φ = − ⟨V⟩φ . 2
(7.32)
Zwischen den Erwartungswerten von kinetischer Energie und Potenzial besteht da mit derselbe Zusammenhang wie zwischen der kinetischen und potenziellen Energie entlang einer klassischen Trajektorie. Man beachte, dass das Virialtheorem (7.29) und damit die Beziehungen (7.31), (7.32) nur für exakte Energieeigenzustände des Hamilton-Operators gelten, da zur Ableitung von (7.29) die Eigenwertgleichung (7.27) benutzt wurde.
110 | 7 Die Schrödinger-Gleichung
7.4 Die Schrödinger-Gleichung als Euler-Lagrange-Gleichung* Die Wellenfunktion ψ(x, t) definiert ein klassisches, zeitabhängiges Feld ähnlich wie die elektromagnetischen Felder in der klassischen Elektrodynamik. Die den MaxwellGleichungen entsprechende Feldgleichung für ψ(x, t) ist die Schrödinger-Gleichung. Im Gegensatz zu den elektromagnetischen Feldern ist das Schrödinger-Feld ψ(x, t) jedoch komplex. Wir werden jetzt zeigen, dass sich auch die Schrödinger-Gleichung, ähnlich wie die Maxwell-Gleichungen, mittels des Prinzips der minimalen Wirkung aus einem Wirkungsfunktional als Euler-Lagrange-Gleichung gewinnen lässt. Differenzialgleichungen lassen sich oftmals numerisch einfacher über ein äquiva lentes Variationsproblem lösen. Auch die Schrödinger-Gleichung lässt sich als Lösung eines Variationsproblems gewinnen, und zwar durch Variation (siehe Anhang (D) der Wirkung S[ψ, ψ∗ ] = ∫ dt ∫ d3 x ψ∗ (x, t)[iℏ∂ t − H(x, t)]ψ(x, t) =: ∫ dt ∫ d3 x L(x, t) .
(7.33)
Diese Wirkung definiert ein Funktional des komplexen Feldes (Wellenfunktion) ψ(x, t). Statt Real- und Imaginärteil des Feldes können wir auch ψ(x, t) und ψ∗ (x, t) als unabhängige Felder betrachten. Wir betrachten die Wirkung (7.33) unter einer beliebigen Änderung der Wellen funktion ψ → ψ + δψ. Für infinitesimale δψ ist die Änderung der Wirkung durch δS[ψ, ψ∗ ] = S [ψ + δψ, ψ∗ + δψ∗ ] − S[ψ, ψ∗ ] = ∫ dt ∫ d3 x (
δS δS δψ(x, t) + δψ∗ (x, t)) δψ(x, t) δψ∗ (x, t)
gegeben. Aus der expliziten Form der Wirkung (7.33) finden wir unmittelbar: δS = (i∂ t − H) ψ , δψ∗
δS = (−i∂ t − H) ψ∗ . δψ
(7.34)
Am stationären Punkt (Extremum) müssen die ersten Ableitungen (7.34) verschwin den, und wir erhalten die Schrödinger-Gleichung (und ihr Adjungiertes).
* Dieser Abschnitt ist für das Verständnis der übrigen Abschnitte nicht erforderlich und kann deshalb beim ersten Lesen übersprungen werden.
7.4 Die Schrödinger-Gleichung als Euler-Lagrange-Gleichung | 111
Wir können uns leicht davon überzeugen, dass die Schrödinger-Gleichung tatsäch lich die gewöhnliche Euler-Lagrange-Gleichung (siehe Abschnitt 3.3) des komple xen Feldes ψ(x, t) zur Wirkung (7.33) ist: Für ein Teilchen im Potenzial V(x, t) lautet die in Gleichung (7.33) definierte La grange-Funktion ∫ d3 x L = ∫ d3 x (ψ∗ iℏ∂ t ψ −
ℏ2 (∇ψ∗ ) ∇ψ − Vψ∗ ψ) , 2m
wobei wir im zweiten Term eine partielle Integration durchgeführt haben und wie üblich vorausgesetzt haben, dass der dabei entstehende Oberflächenterm ver schwindet. Betrachten wir – wie in der nicht relativistischen Physik üblich – L als Funktion von ψ und ∂ t ψ (und entsprechend von ψ∗ und ∂ t ψ∗ ), so lauten die Euler-Lagrange-Gleichungen des nicht relativistischen komplexen Feldes ψ(x): ∂L ∂L − ∂t =0 , ∂ψ ∂(∂ t ψ)
∂L ∂L =0. − ∂t ∂ψ∗ ∂(∂ t ψ∗ )
(7.35)
In diesem Fall müssen wir bei der Variation nach den Feldern auch die räumlichen Gradienten ∇ψ bzw. ∇ψ∗ berücksichtigen. Mit ∂L ℏ2 = iℏ∂ t ψ − (−∆)ψ − Vψ = (iℏ∂ t − H)ψ , ∗ ∂ψ 2m
∂L =0 ∂∂ t ψ∗
erhalten wir aus der zweiten Gleichung in (7.35) unmittelbar die SchrödingerGleichung: −ℏ2 ∆ + V(x, t)) ψ(x, t) . iℏ∂ t ψ(x, t) = ( 2m Die erste Gleichung in (7.35) liefert das komplex Konjugierte der SchrödingerGleichung: −ℏ2 ∆ + V(x, t)) ψ∗ (x, t) . −iℏ∂ t ψ∗ (x, t) = ( 2m Betrachten wir alternativ – wie in der relativistischen Feldtheorie üblich – L als Funktion von ψ, ∂ t ψ und ∇ψ, so lauten die Euler-Lagrange-Gleichungen: ∂L ∂L ∂L − ∂t − ∇i =0, ∂ψ ∂(∂ t ψ) ∂(∇i ψ) ∂L ∂L ∂L =0. − ∂t − ∇i ∂ψ∗ ∂(∂ t ψ∗ ) ∂(∇i ψ∗ )
(7.36)
In diesem Fall dürfen die Gradiententerme nur in den Ableitungen ∂L/∂(∇i ψ) und ∂L/∂(∇i ψ∗ ), nicht jedoch bei ∂L/∂ψ und ∂L/∂ψ∗ berücksichtigt werden. Die Euler-Lagrange-Gleichungen (7.36) liefern natürlich auch in diesem Fall die be kannte Schrödinger-Gleichung.
112 | 7 Die Schrödinger-Gleichung
In der Elektrodynamik gelingt es, aus den Bewegungsgleichungen des Feldes, den Maxwell-Gleichungen, eine Bilanzgleichung für die elektrische Ladung (bzw. die lokale Erhaltung dieser) abzuleiten. Eine ähnliche Bilanzgleichung wollen wir in Ab schnitt 7.5 aus der Schrödinger-Gleichung für die Teilchenzahl des Schrödinger-Feldes gewinnen.
7.5 Die Kontinuitätsgleichung: Teilchendichte und Stromdichte In der klassischen Mechanik besitzt ein punktförmiges Teilchen am Orte x die Dich teverteilung ρ x (x) = δ(x − x ) = δ(x1 − x1 )δ(x2 − x2 )δ(x3 − x3 ) .
(7.37)
In der Quantenmechanik entspricht diese Größe einem Operator, welchen wir aus der klassischen Observablen erhalten, indem wir die x-Koordinate durch den Operator des Ortes x̂ ersetzen. Dies liefert den Dichteoperator: ρ̂ x (x)̂ = δ(x̂ − x ) .
(7.38)
In der Ortsdarstellung ist jedoch der Operator x̂ identisch mit der klassischen Koor dinate x, sodass der quantenmechanische Operator (7.38) sich auf die klassische Grö ße (7.37) reduziert. Für den Erwartungswert dieses Operators in einem Zustand ψ(x, t) finden wir: ̂ t ρ(x , t) ≡ ⟨ρ̂ x (x)⟩ = ∫ d3 x ψ∗ (x, t)ρ̂ x (x)ψ(x, t) = ∫ d3 x ψ∗ (x, t)δ(x − x )ψ(x, t) = ψ∗ (x , t)ψ(x , t) = w(x , t) .
(7.39)
In der Quantenmechanik fällt also die Teilchendichte ρ(x, t) mit der Wahrscheinlich keitsdichte w(x, t) zusammen. Für die zeitliche Änderung des Erwartungswertes des Dichteoperators (7.38) er halten wir aus der allgemeinen Beziehung (7.21): ∂ρ(x , t) ∂⟨ρ̂ x ⟩t i = = ⟨[H, ρ̂ x ]⟩t . ∂t ∂t ℏ
(7.40)
Hierbei haben wir benutzt, dass der Dichteoperator (7.38) nicht explizit von der Zeit abhängt, falls x zeitunabhängig ist, was wir voraussetzen. Der Dichteoperator (7.38) als Funktion der Ortsvariablen kommutiert mit dem Po tenzial, sodass der Kommutator auf der rechten Seite von (7.40) sich auf den Kommu tator mit der kinetischen Energie reduziert: [H, ρ̂ x ] = [
2 p̂ 1 , ρ̂ x ] = (p[p, ρ̂ x (x)] + [p, ρ̂ x (x)]p) , 2m 2m
7.5 Die Kontinuitätsgleichung: Teilchendichte und Stromdichte
| 113
wobei (mit ∇ ≡ ∇x ) [p, ρ̂ x (x)] =
ℏ ℏ ∇δ(x − x ) = − ∇ δ(x − x ) . i i
Setzen wir dieses Ergebnis in Gleichung (7.40) ein, so erhalten wir: ∂ρ(x , t) 1 =− ∇ ⋅ ∫ d3 x ψ∗ (x, t) [pδ(x − x ) + δ(x − x )p] ψ(x, t) . ∂t 2m
(7.41)
Zu beachten ist hier, dass der Impulsoperator p = ℏi ∇ auf alle rechts von ihm ste henden Funktionen wirkt. Im ersten Term auf der rechten Seite von (7.41) führen wir deshalb zunächst eine partielle Integration durch und benutzen den Gauß’schen In tegralsatz: ∫ d3 x ψ∗ (x, t)pδ(x − x )ψ(x, t) ℏ ∫ d3 x ∇ [ψ∗ (x, t)δ(x − x )ψ(x, t)] − ∫ d3 x (pψ∗ (x, t))δ(x − x )ψ(x, t) i ℏ = ∮ df x ψ∗ (x, t)δ(x − x )ψ(x, t) − ∫ d3 x (pψ∗ (x, t))δ(x − x )ψ(x, t) . i =
Das Oberflächenintegral erstreckt sich über den Rand des dreidimensionalen Raumes, auf welchem der Integrand verschwindet. Für endliche x und |x| → ∞ verschwin det der Integrand aufgrund der δ-Funktion, während für |x | → ∞ nur die Punkte |x| → ∞ beitragen, für welche die Wellenfunktion verschwindet. Damit erhalten wir: ∂ρ(x , t) 1 =− ∇ ⋅∫ d3 x [−(pψ∗ (x, t))δ(x − x )ψ(x, t) + ψ∗ (x, t)δ(x − x )pψ(x, t)] . ∂t 2m Das verbleibende Integral lässt sich wegen der δ-Funktion elementar ausführen: ∂ρ(x , t) 1 =− ∇ ⋅ [− (pψ∗ (x , t)) ψ(x , t) + ψ∗ (x , t)pψ(x , t)] . ∂t 2m Diese Beziehung lässt sich in Form einer Kontinuitätsgleichung schreiben, ∂ρ(x, t) + ∇ ⋅ j(x, t) = 0 , ∂t
(7.42)
wenn wir j(x, t) :=
1 p p [ψ∗ (x, t) ψ(x, t) − ψ(x, t) ψ∗ (x, t)] 2 m m
(7.43)
als die Stromdichte der Materie bzw. des Schrödinger’schen Materiefeldes interpre tieren. Da die Dichte ρ(x, t) die Aufenthaltswahrscheinlichkeit repräsentiert, müssen wir j(x, t) als die Stromdichte der Wahrscheinlichkeit interpretieren. Zur Unterstützung
114 | 7 Die Schrödinger-Gleichung
dieser Interpretation formen wir den Ausdruck (7.43) unter Benutzung der Produktre gel der Differenziation um zu: j(x, t) = ψ∗ (x, t)
ℏ p ψ(x, t) − ∇ρ(x, t) . m 2mi
(7.44)
Der erste Term hat die typische Form einer Stromdichte.⁹ Der zweite Term garantiert, dass Gradienten in der Wahrscheinlichkeitsdichte nicht notwendigerweise zu einem Teilchenstrom führen. Besitzt das Teilchen eine elektrische Ladung, so erhält man seine elektrische La dungs- bzw. Stromdichte, indem man seine Aufenthaltswahrscheinlichkeit (7.39) bzw. die zugehörige Stromdichte (7.43) mit seiner Ladung multipliziert. 1.
2.
Die Stromdichte (7.43) verschwindet für reelle Wellenfunktionen. Die Strömung der Aufenthalts wahrscheinlichkeit eines Teilchens erfordert offenbar ein komplexes Schrödinger-Feld. Selbst für Wellenfunktionen der Form ψ(x, t) = f(t)φ(x) mit komplexem f(t) aber reellem φ(x) verschwindet die Stromdichte. Integrieren wir die Kontinuitätsgleichung (7.42) über ein Volumen V mit Oberfläche S(V) und be nutzen den Gauß’schen Satz, so erhalten wir: ∂ ∫ d 3 x ρ(x, t) + ∮ df x ⋅ j(x, t) = 0 . ∂t V
(7.45)
S(V)
Beachten wir, dass die Stromstärke durch eine Fläche F durch I F (t) = ∫ df x ⋅ j(x, t) F
gegeben ist, so erkennen wir, dass das Oberflächenintegral in (7.45) den Wahrscheinlichkeits strom durch die Oberfläche S(V) aus dem Volumen V darstellt. Lassen wir das Volumen V → ∞ gehen, so muss dieser Strom für normierbare Wellenfunktionen offenbar verschwinden: ∮ df x ⋅ j(x, t) → 0 ,
V →∞.
S(V)
Wir erhalten dann aus Gleichung (7.45): ∂ ∂ ∫ d 3 x ρ(x, t) = ∫ d 3 x ψ ∗ (x, t)ψ(x, t) = 0 . ∂t ∂t Diese Gleichung beschreibt die Erhaltung der Norm während der zeitlichen Entwicklung des quan tenmechanischenSystemsundstimmtmitdembereitsfrühergewonnenenErgebnis(7.22)überein. Die Erhaltung der Norm, die durch Mittelung der Kontinuitätsgleichung über den gesamten Raum erfolgt, entspricht der globalen Teilchenzahlerhaltung in der nicht relativistischen Quantenme chanik, d. h., ein Teilchen, das irgendwo im Raum ist, muss für alle Zeiten irgendwo existieren. Demgegenüber beschreibt die Kontinuitätsgleichung die lokale Erhaltung der Teilchenzahl bzw. der Materie: Wenn sich in einem infinitesimal kleinen Gebiet die Materiedichte zeitlich ändert, so kann dies nur durch Zufluss aus bzw. Wegfluss in die Umgebung erfolgen.
9 Dieser Term hat die gleiche Struktur wie die Stromdichte in der klassischen Mechanik j(x, t) = ρ(x, t)v = ρ(x, t)p/m, wobei ρ die klassische Teilchendichte ist.
7.6 Grenzflächenverhalten der Wellenfunktion |
3.
115
Die Kontinuitätsgleichung ist zwar eine unmittelbare Folge der Schrödinger-Gleichung. Sie ist je doch nicht mehr äquivalent zu dieser. Durch die Mittelung (d. h. Bildung des Erwartungswertes) entsteht ein Informationsverlust. Sie enthält nur noch die zeitliche Entwicklung der Teilchen dichte. Insbesondere haben wir beobachtet, dass das Potenzial aus der Kontinuitätsgleichung herausfällt. Die Kontinuitätsgleichung beschreibt also nur generelle Eigenschaften des Schrö dinger’schen Materiefeldes, die nicht von den Details der Bewegung abhängen, welche durch das Potenzial bestimmt wird. Die durch diese Gleichung beschriebene Materieerhaltung ist da mit unabhängig von der Anwesenheit eines Potenzials gültig.
Integrieren wir die Stromdichte (7.44) über den gesamten Raum und benutzen den Gauß’schen Satz für das Integral über den zweiten Term, so finden wir: ∫ d3 x j(x, t) =
1 ℏ ∫ d3 x ψ∗ (x, t)pψ(x, t) − ∮ df x ρ(x, t) . m 2mi V
(7.46)
S(V)
Das hier entstehende Oberflächenintegral über S(V) muss jedoch für V → ∞ ver schwinden, wenn die Wellenfunktion ψ normierbar sein soll. In der Tat verlangt die Normierbarkeit der Wellenfunktion: ∫ d 3 x ψ∗ (x, t)ψ(x, t) < ∞ . Dies impliziert für das asymptotische Verhalten der Wellenfunktion für |x| → ∞: |ψ(x, t)|2 ∼
1 , |x|3+ε
|x| → ∞ ,
ε >0.
Hieraus folgt für das Oberflächenintegral für V → ∞ mit |df x | = |x|2 dΩ (dΩ ist das Raumwinkelelement): 2 ∮ df |ψ(x, t)|2 < ∮ |df | |ψ(x, t)|2 ∼ ∮ dΩ |x| → 0 , x x |x|3
|x| → ∞ .
Damit ist für normierbare Wellenfunktionen der Gesamtstrom (7.46) durch den Erwar tungswert der Geschwindigkeit ∫ d3 x j(x, t) =
1 ⟨p⟩t m
gegeben.
7.6 Grenzflächenverhalten der Wellenfunktion Ähnlich wie die elektromagnetischen Felder an den Grenzflächen zwischen ver schiedenen Medien gewissen Grenzflächenbedingungen genügen, erfüllt auch die Wellenfunktion an den Grenzflächen zwischen verschiedenen Potenzialgebieten ge wisse Stetigkeitsbedingungen, die wir im Abschnitt 7.6.2 ableiten.
116 | 7 Die Schrödinger-Gleichung
7.6.1 Motivation von Potenzialsprüngen Wir betrachten die Bewegung eines Elektrons in einem Festkörper. Die potenzielle En ergie V(x) ist durch das skalare Potenzial Φ(x) des elektrischen Feldes gegeben: V(x) = qΦ(x) , wobei q die Ladung des Elektrons bezeichnet. Der Festkörper soll aus zwei verschiede nen, aneinandergrenzenden Dielektrika bestehen. Für verschwindendes elektrisches Feld E = −∇Φ(x) müssen das skalare Potenzial Φ(x) und damit die potenzielle Ener gie im Inneren der Dielektrika konstant sein. Der konstante Potenzialwert wird jedoch in den verschiedenen Dielektrika i. A. verschieden sein. Beim Übergang von einem Medium zum anderen nimmt die Konzentration des einen Stoffes kontinuierlich ab und die des anderen entsprechend kontinuierlich zu, sodass sich das Potenzial stetig über eine Grenzschicht der Breite b vom Potenzial wert des einen Mediums auf den des anderen Mediums ändert (siehe Abb. 7.1(a)). Den detaillierten Potenzialverlauf in der Grenzschicht kennen wir jedoch i. A. nicht, und es wäre äußerst schwierig, bei der Beschreibung eines Elektrons in einem solchen Fest körper den genauen Potenzialverlauf explizit zu berücksichtigen. V (x)
V2 V1 x (a)
b
V (x) b→0 V2 V1 x (b)
a
Abb. 7.1: (a) Potenzialverlauf im Übergangsgebiet zwischen zwei verschiedenen Dielektrika. Das Po tenzial ändert sich stetig in einer Grenzschicht der Breite b von seinem Wert in Medium 1 auf seinen Wert in Medium 2. (b) Zugehörige mathematische Idealisierung, bei der die Breite der Grenzschicht b → 0 geht und somit die Grenzschicht zur Grenzfläche (bei x = a) schrumpft.
7.6 Grenzflächenverhalten der Wellenfunktion | 117
Die theoretische Beschreibung lässt sich wesentlich vereinfachen, wenn die Wel lenlänge des Elektrons groß gegenüber der Ausdehnung b der Grenzschicht ist. In die sem Fall können wir die Breite der Grenzschicht b gegen null gehen lassen, b → 0. Bei dieser mathematischen Idealisierung wird aus der Grenzschicht eine Grenzfläche (siehe Abb. 7.1(b)). Das idealisierte Potenzial besitzt dann an der Grenzfläche einen Sprung, falls die Potenzialwerte der beiden Dielektrika verschieden sind. Wir betonen jedoch, dass die Unstetigkeiten allein durch die mathematische Idealisierung entste hen, die tatsächlichen physikalischen Felder hingegen stetig sind. Wir interessieren uns hier für das Verhalten der Wellenfunktion an einem sol chen Potenzialsprung. In dem realistischen, stetigen Potenzial ist die Wellenfunktion sicherlich stetig. Durch die mathematische Idealisierung der Ersetzung der Grenz schicht durch eine Grenzfläche könnte die Wellenfunktion jedoch ähnlich wie das Po tenzial einen Sprung erfahren. Die Wellenfunktion ist prinzipiell als Lösung der Schrödinger-Gleichung definiert. Da diese eine partielle Differenzialgleichung ist, können wir sie jedoch nicht unmittel bar für unstetige Potenziale V(x) lösen. Wir können jedoch die Schrödinger-Gleichung für das realistische, stetige Potenzial lösen und erhalten dann eine Wellenfunktion ψ b (x, t), welche von der Breite b der Grenzschicht abhängt. In der nun bekannten Wel lenfunktion ψ b (x, t) können wir dann die Breite der Grenzschicht gegen null gehen lassen, b → 0. Die dabei entstehende Wellenfunktion ψ b=0 (x, t) wird dann (ähnlich wie das Potenzial V b=0 (x)) möglicherweise einen Sprung oder Knick besitzen (d. h., an der Grenzfläche nicht stetig oder nicht differenzierbar sein), sie wird aber auf je den Fall beschränkt bleiben: |ψ(x, t)| < ∞ . Eine unbeschränkte Wellenfunktion ließe sich auch nicht als Wahrscheinlichkeits amplitude interpretieren. Der Einfachheit halber betrachten wir im Folgenden eine zeitunabhängige Grenz schicht (was der realistischen Situation entspricht). Die Zeitabhängigkeit der Wellen funktion ist dann für die nachfolgenden Überlegungen irrelevant, sodass wir uns auf die stationäre Schrödinger-Gleichung beschränken können. Die stationäre Wellen funktion φ(x) muss natürlich ebenfalls beschränkt sein: |φ(x)| < ∞ .
7.6.2 Verhalten der Wellenfunktion an Potenzialsprüngen Wir wollen jetzt untersuchen, wie sich die Wellenfunktion an Potenzialsprüngen ver hält. Dabei beschränken wir uns zunächst auf eine eindimensionale Potenzialbewe gung, da hier bereits alle wesentlichen Eigenschaften der Wellenfunktionen zutage treten, diese aber einfacher zu behandeln ist als der dreidimensionale Fall, der in Ab schnitt 7.6.3 betrachtet wird.
118 | 7 Die Schrödinger-Gleichung
Wir beginnen mit der Betrachtung einer endlichen Potenzialstufe, die wir ohne Einschränkung der Allgemeinheit in der Form V(x) = V0 Θ(x − a)
(7.47)
wählen können. Beim Auftreten von Potenzialsprüngen würde man zunächst er warten, dass auch die Wellenfunktion möglicherweise Sprungstellen besitzt. Hierzu bemerken wir jedoch Folgendes: Eine stetige Funktion φ(x) besitzt nicht notwendi gerweise eine stetige Ableitung φ (x). Umgekehrt gilt jedoch: Besitzt eine Funktion φ(x) eine stetige Ableitung, dann ist sie selbst stetig, wie man sofort aus der Integral darstellung x
φ(x) = ∫ dyφ (y) + φ(x0 )
(7.48)
x0
erkennt. Bei der Anwesenheit von Potenzialstufen in V(x) können wir deshalb davon ausgehen, dass diese in der Schrödinger-Gleichung φ (x) =
2m (V(x) − E) φ(x) ℏ2
(7.49)
zu Stufen in φ (x) führen. φ (x) wird deshalb eine stückweise stetige Funktion mit endlichen Sprüngen sein, die natürlich integrierbar ist und auf eine stetige erste Ab leitung x
φ (x) = ∫ dyφ (y) + φ (x0 )
(7.50)
x0
führt. Dies tritt unmittelbar zutage, wenn wir die Schrödinger-Gleichung (7.49) über ein infinitesimales Intervall der Länge 2ε integrieren, welches die Sprungstelle x = a des Potenzials (7.47) enthält: a+ε
2m φ (a + ε) − φ (a − ε) = 2 ∫ dx (V(x) − E) φ(x) . ℏ
a−ε
Für beschränkte Wellenfunktionen |φ(x)| < ∞ verschwindet im Limes ε → 0 das Integral proportional zur Energie E, und wir erhalten a+ε
2m lim [φ (a + ε) − φ (a − ε)] = 2 lim ∫ dx V(x)φ(x) . ε→0 ℏ ε→0
(7.51)
a−ε
Ist außerdem V(x) beschränkt, |V(x)| < ∞ (was auch für endliche Potenzialsprünge gilt), so verschwindet auch das verbleibende Integral, und wir erhalten die Stetigkeit der Ableitung lim φ (a + ε) = lim φ (a − ε) . ε→0
ε→0
7.6 Grenzflächenverhalten der Wellenfunktion |
119
Für stetiges φ (x) finden wir dann aber aus Gleichung (7.48) auch eine stetige Wellen funktion φ(x). Damit gelangen wir zu dem wichtigen Ergebnis: Für beschränkte Potenziale und damit insbesondere an endlichen Potenzialstufen sind die Wellenfunktion φ(x) und ihre erste Ableitung φ (x) stetig. An einer endlichen Sprungstelle x = a des Potenzials gelten deshalb die Anschluss bedingungen φ1 = φ2 ,
(7.52)
φ1
(7.53)
=
φ2
,
wobei φ1 = lim φ(a − ε) , ε→0
φ2 = lim φ(a + ε) ε→0
die Wellenfunktion links bzw. rechts von der Sprungstelle x = a bezeichnet. Falls φ(x) an der Sprungstelle x = a des Potenzials nicht verschwindet, lassen sich die beiden Bedingungen (7.52), (7.53) zur Stetigkeit der logarithmischen Ableitung zusammenfassen: (ln φ1 ) = (ln φ2 ) . Aus dieser Beziehung fallen die Normierungskonstanten heraus. Man überzeugt sich leicht, dass für unendlich große Potenzialsprünge (7.47) V0 →∞ die Stetigkeitsbedingung an die Wellenfunktion (7.52) erhalten bleibt, während die Stetigkeit der Ableitung (7.53) nicht mehr gilt: Für einen unendlich großen Potenzi alsprung müssen wir davon ausgehen, dass φ (x) ebenfalls einen unendlich großen Sprung besitzt. In diesem Fall können wir aus Gleichungen (7.50) bzw. (7.51) nicht mehr auf die Stetigkeit von φ (x) schließen.¹⁰ Aus diesen Überlegungen können wir schluss
10 Dies wird klar, wenn man sich an die Definition des Riemann-Integrals erinnert: x
F(x) = ∫ dx f(x ) = lim ε ∑ f(x k ) , ε→0
x0
k
wobei wir x − x0 = N ⋅ ε ,
x k = x 0 + kε
gesetzt haben. Für endliche Funktionswerte f(x k ) gilt lim εf(x k ) = 0 ,
ε→0
(7.54)
was die Stetigkeit der Stammfunktion F(x) selbst bei endlichen Sprüngen der Funktion f(x) garantiert. An Stellen x k = a, an denen die Funktion einen unendlich großen Sprung besitzt, ist ihr Funktions wert f(x k ) notwendigerweise unendlich, und die Bedingung (7.54) ist verletzt, was zu einem endlichen Sprung der Stammfunktion F(x) bei x k = a führt.
120 | 7 Die Schrödinger-Gleichung
folgern, dass an einem unendlich großen Potenzialsprung die Ableitung der Wellen funktion φ (x) nicht stetig sein wird, sondern einen endlichen Sprung besitzt. Es folgt dann aber nach wie vor aus Gleichung (7.48), dass die Wellenfunktion φ(x) selbst an der unendlichen Sprungstelle des Potenzials stetig ist. Wie wir bereits in Abschnitt 6.1 (siehe Gleichung (6.2)) gezeigt haben, muss die Wellenfunktion in (ausgedehnten) Gebieten V unendlich hoher Potenziale verschwin den: φ(x) = 0 für x ∈ V mit V(x) = ∞ . Dies ist auch unmittelbar aus der Schrödinger-Gleichung (7.49) zu erkennen: Für end liche Energien E und unendlich großes Potenzial in einem ausgedehnten Gebiet ist φ(x) = 0 die einzig mögliche Lösung. Dies folgt auch bereits aus dem semiklassischen Ausdruck (5.40) für die Wellenfunktion im klassisch verbotenen Gebiet. Die Schrödinger-Gleichung erlaubt jedoch nicht verschwindende Lösungen φ(x), falls das Potenzial nur an isolierten Punkten singulär ist. Der Prototyp eines solchen Potenzials lässt sich durch die δ-Funktion darstellen: V(x) = Cδ(x − a) .
(7.55)
Setzen wir dieses Potenzial in die Schrödinger-Gleichung ein, φ (x) =
2m (Cδ(x − a) − E) φ(x) , ℏ2
so können wir wie oben bei den unendlichen Potenzialsprüngen argumentieren, dass die δ-förmige Singularität nur durch φ (x) kompensiert werden kann. Ist aber für x≃a φ (x) ∼ δ(x − a) , so muss nach Gleichung (7.50) die Ableitung der Wellenfunktion φ (x) bei x = a einen endlichen Sprung besitzen, und aus Gleichung (7.48) folgt dann, dass die Wellenfunk tion φ(x) selbst bei x = a stetig ist: lim φ(a − ε) = lim φ(a + ε) .
ε→0
ε→0
(7.56)
Setzen wir das Potenzial (7.55) in Gleichung (7.51) ein, so erhalten wir für den Sprung der Ableitung der Wellenfunktion: lim [φ (a + ε) − φ (a − ε)] =
ε→0
2m Cφ(a) . ℏ2
(7.57)
Gleichung (7.56) und (7.57) sind die Anschlussbedingungen an die Wellenfunktion am Ort der δ-förmigen Singularität im Potenzial. Während die Wellenfunktion selbst stetig ist, besitzt ihre Ableitung an der Singularität des Potenzials einen Sprung, der durch die Stärke des Potenzials und den Wert der Wellenfunktion an der Sprungstelle gege ben ist.
7.6 Grenzflächenverhalten der Wellenfunktion |
121
7.6.3 Grenzflächenverhalten der Wellenfunktion in drei Dimensionen* Die obigen Überlegungen zum Verhalten der Wellenfunktion an Sprungstellen des Potenzials lassen sich unmittelbar auf drei Dimensionen verallgemeinern. Hierbei ist jedoch zu beachten, dass die Potenzialsprünge an Grenzflächen ausgedehnter dreidimensionaler Gebiete auftreten. Für realistische Probleme werden die Grenzflä chen die Oberflächen endlicher Volumina sein. Um das Verhalten der Wellenfunktion an diesen Grenzflächen zu bestimmen, bedienen wir uns ähnlicher Techniken, wie wir sie bereits aus der Elektrodynamik kennen. Dazu schreiben wir die SchrödingerGleichung, die eine Differenzialgleichung zweiter Ordnung bezüglich des Ortes ist, in ein System aus zwei Differenzialgleichungen erster Ordnung um. Der Gradient der Wellenfunktion A = ∇φ
(7.58)
definiert ein rotationsfreies Vektorfeld A(x): ∇ × A(x) = 0 .
(7.59)
Die Divergenz dieses Vektorfeldes ist durch die (stationäre) Schrödinger-Gleichung ge geben, 2m ∇ ⋅ A(x) = ∆φ(x) = 2 (V(x) − E)φ(x) =: g(x) , (7.60) ℏ wobei E wie üblich den Energieeigenwert bezeichnet. Nach dem Zerlegungssatz¹¹ ist das Vektorfeld A(x) damit eindeutig bestimmt. In Abb. 7.2(a) ist das Verhalten die ses Vektorfeldes in der Grenzschicht illustriert. In dem realistischen, stetigen Poten zial V(x) ändert sich dieses Vektorfeld stetig in der Grenzschicht. Kontrahieren wir die Grenzschicht jetzt zu einer Grenzfläche, so können (analog zum eindimensiona len Fall) an der entstehenden Grenzfläche S das Potenzial Sprünge und das Vektorfeld A(x) Unstetigkeitsstellen aufweisen (Abb. 7.2(b)). Die Rotation von A(x) verschwindet im gesamten Raum unabhängig vom Potenzi al. Wir betrachten eine beliebige Fläche S im ℝ3 und integrieren Gleichung (7.59) über eine Stokes’sche Fläche F, ein kleines Rechteck, das die Fläche S senkrecht schneidet (siehe Abb. 7.3). Unter Benutzung des Stokes’schen Integralsatzes ∫ df ⋅ (∇ × A) = ∫ dx ⋅ A(x ) F
∂F
finden wir: ∮ dx ⋅ A(x ) = t ⋅ [A (x +
b b ̂ − A (x − n)] ̂ +U =0, n) 2 2
(7.61)
∂F
* Dieser Abschnitt ist für das Verständnis der übrigen Abschnitte nicht erforderlich und kann deshalb beim ersten Lesen übersprungen werden. 11 Der Zerlegungssatz besagt, dass jedes Vektorfeld A eindeutig durch seine Quellen ∇ ⋅ A und Wirbel ∇ × A bestimmt ist.
122 | 7 Die Schrödinger-Gleichung
S
2
2
1
1
b
(a)
(b)
b→0
Abb. 7.2: (a) Stetiges Verhalten eines physikalischen Vektorfeldes in einer Grenzschicht. (b) Dassel be Vektorfeld nach der mathematischen Idealisierung b → 0, in der die Grenzschicht durch eine Grenzfläche S ersetzt wurde. An der Grenzfläche weist das Vektorfeld i. A. Unstetigkeitsstellen auf.
S ˆ n
2
tˆ
b
1
Abb. 7.3: Stokes’sche Fläche (Rechteck) im Grenzgebiet zweier Medien. Der Normalen vektor n̂ der Grenzfläche S liegt in der Sto kes’schen Fläche. t ̂ bezeichnet einen Tangen tialvektor der Fläche S, der ebenfalls in der Stokes’schen Fläche liegt.
t
wobei x den Mittelpunkt der Stokes’schen Fläche bezeichnet, der voraussetzungsge mäß in der Grenzschicht S liegt. Ferner sind |t| = t die Breite der Stokes’schen Fläche und t ̂ ein Tangentialvektor der betrachteten Fläche S, der in der Stokes’schen Fläche liegt, siehe Abb. 7.3. Wir haben hierbei verwendet, dass für genügend kleine t die Än derung von A(x) parallel zur Fläche S vernachlässigt werden kann. Ferner ist U ∼ b der Beitrag von den beiden Wegabschnitten parallel zu n.̂ Im Limes b → 0 verschwin det U, und wir erhalten aus (7.61) die Stetigkeit der Tangentialkomponenten t ̂ ⋅ A2 = t ̂ ⋅ A1 , wobei wir A1/2 = lim A (x ∓ b→0
(7.62)
b ̂ n) 2
gesetzt haben. Gleichung (7.62) lässt sich mit (7.58) auch in der Form n̂ × ∇φ2 = n̂ × ∇φ1 mit φ1/2 = lim φ (x ∓ b→0
b ̂ n) 2
(7.63)
7.6 Grenzflächenverhalten der Wellenfunktion | 123
S ˆ n
2
b ΔF 1
Abb. 7.4: Gauß’sches Kästchen (Zylinder) in der Grenzschicht zwischen den beiden Medien.
schreiben. Damit sind die Tangentialkomponenten von ∇φ(x) beim Durchgang durch beliebige Flächen stetig unabhängig vom Verhalten des Potenzials. Um das Verhalten der Komponenten A(x) = ∇φ normal zu einer Fläche S zu be stimmen, integrieren wir die Gleichung (7.60) für die Divergenz von A(x) über ein kleines Volumen ∆V, das die Grenzfläche einschließt (Gauß’sches Kästchen), siehe Abb. 7.4: ∫ d3 x ∇ ⋅ A(x) = ∫ d3 x g(x) . ∆V
∆V
Zweckmäßigkeitshalber wählen wir dieses Volumen in der Form eines Zylinders, des sen Zylinderachse senkrecht auf der Grenzfläche steht (Abb. 7.4). Wir legen den Zylin der so in die Fläche, dass die untere Hälfte des Zylinders im Gebiet 1, die obere Hälfte in Gebiet 2 liegen. Die Zylinderachse wird damit durch die Grenzflächennormale n̂ im Zylindermittelpunkt festgelegt. Benutzen wir den Gauß’schen Satz, so erhalten wir: ∮ df x ⋅ A(x) = ∫ d3 x g(x) . ∂(∆V)
(7.64)
∆V
Wählen wir das Gauß’sche Kästchen klein genug, so können wir die Änderung des Vektorfeldes A(x) und seiner Divergenz g(x) über die Stirnflächen ∆F des Zylinders vernachlässigen. (Beide Größen können sich jedoch drastisch beim Durchgang durch die Fläche S ändern, falls das Potenzial auf der Fläche S Sprünge aufweist oder singu lär ist.) Unter dieser Voraussetzung erhalten wir für das Volumenintegral b/2
∫ d x g(x) = ∆F ∫ dl g(x + l n)̂ 3
∆V
(7.65)
−b/2
bzw. für das Oberflächenintegral ∮ df x ⋅ A(x) = n̂ ⋅ [A (x + ∂(∆V)
b b ̂ − A (x − n)] ̂ ∆F + M , n) 2 2
(7.66)
124 | 7 Die Schrödinger-Gleichung wobei n̂ der Normalenvektor der Grenzfläche ist, der auf der Zylinderachse liegt und von Gebiet 1 nach Gebiet 2 zeigt, siehe Abb. 7.4. Ferner bezeichnet M den Beitrag vom Zylindermantel zum Oberflächenintegral. Dieser Beitrag muss offensichtlich propor tional zur Höhe des Zylinders b sein (M ∼ b). M enthält nur die Tangentialkompo nente von A(x), die, wie oben gezeigt, beim Durchqueren einer beliebigen Fläche ste tig bleibt, siehe Gleichung (7.62). Deshalb verschwindet im Limes b → 0 der Beitrag von der Mantelfläche: lim M = 0 . b→0
Setzen wir (7.66) und (7.65) in Gleichung (7.64) ein, so finden wir nach Grenzwertbil dung b → 0 für die Normalkomponente des Vektorfeldes n̂ ⋅ A an der Grenzschicht die Beziehung b/2
b/2
n̂ ⋅ (A 2 (x) − A1 (x)) = lim ∫ dl g(x + l n)̂ ≡ lim ∫ dl ∇ ⋅ A(x + l n)̂ . b→0
b→0
−b/2
(7.67)
−b/2
Setzen wir hier für die Divergenz von A den expliziten Wert ein, der durch die Schrö dinger-Gleichung (7.60) gegeben ist, so erhalten wir schließlich: b/2
n̂ ⋅ (A 2 (x) − A1 (x)) =
2m lim ∫ dl (V(x + l n)̂ − E)φ(x + l n)̂ . ℏ2 b→0 −b/2
Im Limes b → 0 verschwindet der Term proportional zur Energie E. Beachten wir, dass nach (7.58) ∂φ n̂ ⋅ A = ∂n die Richtungsableitung der Wellenfunktion entlang der Flächennormalen n̂ ist, so er halten wir schließlich die Grenzflächenbedingung b/2
∂φ2 ∂φ1 2m ̂ − = 2 lim ∫ dl V(x + l n)φ(x + l n)̂ , ∂n ∂n ℏ b→0
(7.68)
−b/2
wobei φ1 und φ2 die Wellenfunktionen an der Fläche S im Gebiet 1 bzw. 2 bezeichnen, siehe Gleichung (7.63). Gleichung (7.68) ist die dreidimensionale Verallgemeinerung der eindimensionalen Anschlussbedingung (7.51). Für ein nicht singuläres Potenzial verschwindet das Integral auf der rechten Seite von (7.68) im Limes b → 0, und wir finden: ∂φ2 ∂φ1 = . ∂n ∂n
(7.69)
Dies ist insbesondere der Fall, wenn das Potenzial auf der Fläche S nur endliche Sprünge besitzt. Damit ist die Richtungsableitung der Wellenfunktion (in Richtung
7.6 Grenzflächenverhalten der Wellenfunktion | 125
der Flächennormalen) an den Flächen endlicher Potenzialsprünge stetig. Die Bedin gung (7.69) ist das dreidimensionale Analogon der Stetigkeitsbedingung (7.53). Zusammen mit der oben gezeigten Stetigkeit der Tangentialkomponente von ∇φ folgt, dass ∇φ(x) in Gebieten nicht singulärer Potenziale und damit insbesondere auf Flächen endlicher Potenzialsprünge stetig ist. Wie im eindimensionalen Fall folgt aus der Stetigkeit von ∇φ(x) auch die Stetigkeit von φ(x): φ1 = φ2 .
(7.70)
Falls die Wellenfunktion an der Grenzfläche nicht verschwindet, lassen sich beide Be dingungen (7.70) und (7.69) wieder zur Stetigkeit der logarithmischen Ableitung zu sammenfassen: ∂ ln φ2 ∂ ln φ1 = . ∂n ∂n Damit das Integral auf der rechten Seite von (7.68) einen von null verschiedenen Wert ergibt, muss das Potenzial im Integrationsgebiet singulär werden. Dies ist offensicht lich der Fall für unendlich große Potenzialsprünge auf der Grenzschicht. An unend lich großen Potenzialsprüngen ist deshalb die Richtungsableitung der Wellenfunktion nicht stetig. Wie im eindimensionalen Fall ist aus der Schrödinger-Gleichung (7.60) ersichtlich, dass in ausgedehnten Gebieten V, in denen das Potenzial unendlich groß wird, die Wellenfunktion verschwinden muss: φ(x) = 0 für x ∈ V
mit V(x) = ∞ .
Dies gilt jedoch nicht, wenn das Potenzial nur isolierte singuläre Stellen besitzt oder singulär auf einer zwei- oder eindimensionalen Untermannigfaltigkeit des ℝ3 ist. Ist das Potenzial z. B. singulär auf einer Fläche S und hat dort eine δ-förmige Singularität, V(x) = f(x ⊥ )δ(l) , wobei x⊥ die Koordinaten der Fläche S sind und l die Koordinate entlang der Flächen normalen ist und den Wert l = 0 auf S annimmt, so finden wir aus (7.68): ∂φ2 ∂φ1 2m − = f(x ⊥ )φ(x ⊥ , l = 0) . ∂n ∂n ℏ Die Normalkomponente des Vektorfeldes ∇φ kann demnach an einer Fläche zwischen zwei Gebieten einen Sprung aufweisen, falls V(x) dort genügend stark divergiert. Wie im eindimensionalen Fall bleibt die Wellenfunktion φ(x) stetig selbst bei endlichen Sprüngen von ∇φ(x). Die obigen Betrachtungen eines Vektorfeldes an einer Grenzschicht gelten allge mein für beliebige Vektorfelder. Abschließend wollen wir sie auf die Teilchenstrom dichte anwenden. Für praktische Anwendungen der Quantenmechanik ist es äußerst interessant zu wissen, wie sich ein Teilchenstrom an einer Grenzfläche verhält, an der sich das Potenzial abrupt ändert.
126 | 7 Die Schrödinger-Gleichung
Die Teilchenstromdichte j(x, t) (7.43) definiert ein Vektorfeld, dessen Divergenz durch die Kontinuitätsgleichung (7.42) ∂ρ +∇⋅j =0 ∂t gegeben ist, wobei ρ(x, t) = |ψ(x, t)|2 die Aufenthaltswahrscheinlichkeitsdichte ist. Nach Vergleich mit (7.60) finden wir aus (7.67) für die Änderung der Teilchenstrom dichte an der Grenzfläche: b/2
n̂ ⋅ (j 2 (x) − j 1 (x)) = − lim ∫ dl b→0
−b/2
∂ ρ(x + l n)̂ . ∂t
Im hier betrachteten stationären Fall ist |ψ(x, t)|2 = |φ(x)|2 , sodass ∂ρ/∂t = 0, und wir erhalten: n̂ ⋅ j 2 (x) = n̂ ⋅ j 1 (x) . Damit bleibt die Normalkomponente des Teilchenstroms beim Durchgang durch eine Grenzschicht selbst bei unstetigem Potenzial bzw. singulären Potenzialsprüngen er halten.
8 Die eindimensionale stationäre Schrödinger-Gleichung Im Folgenden werden wir zunächst einige allgemeine Eigenschaften der Wellenfunkti on diskutieren, die sich unmittelbar aus der mathematischen Struktur der stationären Schrödinger-Gleichung als Differenzialgleichung zweiter Ordnung ergeben und unab hängigvondenDetailsdesPotenzialssind.ZurIllustrationdieserEigenschaftenwirddie Schrödinger-Gleichung am Ende dieses Kapitels für zwei Potenziale, den unendlich ho henPotenzialtopfunddasδ-Potenzial,explizitgelöst.DabeiwerdendieinAbschnitt7.6.2 abgeleiteten Stetigkeitsbedingungen an die Wellenfunktion zum Tragen kommen.
8.1 Qualitative Diskussion der Wellenfunktion: gebundene Zustände Wir betrachten ein Teilchen mit der Masse m, das sich in einem Potenzial V(x) bewe gen soll. Die zugehörige Schrödinger-Gleichung lautet: (−
ℏ2 d2 + V(x)) φ(x) = Eφ(x) 2m dx2
(8.1)
bzw. nach Multiplikation mit −2m/ℏ2 : φ (x) =
2m (V(x) − E)φ(x) . ℏ2
Für eine feste Energie E ist die Krümmung der Wellenfunktion |φ (x)| offenbar durch die Stärke des Potenzials gegeben. Je größer die Differenz |V(x) − E|, desto größer die Krümmung. Das Potenzial habe die in Abb. 8.1 dargestellte, recht allgemeine Form. Das Poten zial besitzt ein Minimum und wird für x → ±∞ asymptotisch flach, d. h., strebt gegen endliche Grenzwerte V∓∞ .
V−∞
V∞
V (x)
E
x Abb. 8.1: Asymptotisch konstantes Potenzial. Gebundene Zustände existieren nur unterhalb der gestrichelten Linie (E < V −∞ ). https://doi.org/10.1515/9783110586022-008
128 | 8 Die eindimensionale stationäre Schrödinger-Gleichung
Führen wir in der stationären Schrödinger-Gleichung (8.1) wieder die (hier orts abhängige!) Wellenzahl k(x) ein über p = ℏk und T=
ℏ2 k 2 p2 = =E−V , 2m 2m
d. h. k2 (x) =
2m (E − V(x)) , ℏ2
so nimmt diese die Gestalt φ (x) = −k 2 (x)φ(x) an. Bezüglich der Energie können wir drei verschiedene Potenzialgebiete unter scheiden: 1. E > V(x) klassisch erlaubtes Gebiet, 2. E = V(x) Umkehrpunkte der klassischen Bewegung, 3. E < V(x) klassisch verbotenes Gebiet. Im Folgenden wollen wir die jeweiligen Gebiete separat betrachten. 1.
Klassisch erlaubtes Gebiet: In diesem Gebiet haben wir: E > V(x) ,
T >0,
k2 > 0 .
Die Wellenzahl ist in diesem Gebiet rein reell. Wegen φ (x) = −k 2 (x)φ(x)
2.
haben φ und φ entgegengesetztes Vorzeichen. Für positive φ ist φ negativ, und die Wellenfunktion ist konkav. Umgekehrt ist für negative φ die zweite Ab leitung φ positiv, und die Wellenfunktion φ ist konvex. Damit ist die Wellen funktion φ(x) in diesem Gebiet stets zur x-Achse hingekrümmt, siehe Abb. 8.2. Schneidet die Wellenfunktion die x-Achse, d. h., hat sie eine Nullstelle, so ist dies wegen φ = 0 stets ein Wendepunkt von φ(x). Damit kann die Wellen funktion in diesem Gebiet nur ein oszillierendes Verhalten besitzen. Umkehrpunkte der klassischen Bewegung: Für die Umkehrpunkte gilt: E = V(x) ,
T =0,
k=0.
Hier verschwindet die zweite Ableitung der Wellenfunktion (φ = 0). An den klassischen Umkehrpunkten besitzt deshalb die Wellenfunktion stets Wende punkte (siehe Abb. 8.2).
8.1 Qualitative Diskussion der Wellenfunktion: gebundene Zustände | 129
V (x)
E
x ϕ(x)
x
Abb. 8.2: Das Verhalten der Wellenfunktion in den verschiedenen Potenzialgebieten in Abhängigkeit vom Wert der Wellenfunktion.
130 | 8 Die eindimensionale stationäre Schrödinger-Gleichung
3.
Klassisch verbotenes Gebiet: In diesem Bereich haben wir: E < V(x) ,
T 0 .
φ und φ haben deshalb in diesem Gebiet gleiches Vorzeichen und zeigen das in Abb. 8.2 dargestellte qualitative Verhalten. Die Wellenfunktion ist hier stets von der x-Achse weggekrümmt, sie kann daher kein oszillierendes Ver halten zeigen, sondern nur exponentiell anwachsen oder exponentiell abklin gen. Auch in diesem Bereich sind Nullstellen der Wellenfunktion gleichzeitig Wendepunkte. Betrachten wir nun die Konsequenzen dieser Analyse für die möglichen Energie eigenzustände. Wir beginnen mit dem Energiebereich unterhalb des Potenzialmini mums Vmin . Für diese Energien E < Vmin befindet sich die gesamte x-Achse im klas sisch verbotenen Bereich. Die Wellenfunktion steigt deshalb für |x| → ∞ exponentiell an (da sie in diesem Gebiet von der x-Achse weggekrümmt ist), und folglich gibt es keine normierbaren Lösungen der Schrödinger-Gleichung in diesem Energiegebiet. Wir betrachten jetzt die Energien zwischen dem Potenzialminimum und der un teren Potenzialkante: Vmin < E < V−∞ . (8.2) Für diese Energien ist ein klassisches Teilchen in diesem Potenzial gebunden, es führt eine periodische Bewegung zwischen den Umkehrpunkten aus, kann aber die Poten zialmulde ohne äußere Einwirkungen nicht verlassen. Wir erwarten, dass es ähnli che gebundene Zustände für ein quantenmechanisches Teilchen in diesem Energie bereich gibt. In der Quantenmechanik besitzt ein Teilchen i. A. keinen wohldefinierten Ort, und wir können nur die Wahrscheinlichkeit w(x) dx = |φ(x)|2 dx angeben, mit der sich das Teilchen in einem Intervall dx um den Ort x aufhält. Wir können deshalb in der Quantenmechanik ein an ein Raumgebiet gebundenes Teilchen nur durch eine in diesem Gebiet lokalisierte Wahrscheinlichkeitsverteilung, d. h. durch eine lokalisier te Wellenfunktion, charakterisieren. Da die Gesamtwahrscheinlichkeit das Teilchen irgendwo im Raum anzutreffen eins sein muss, ∞
∞ !
∫ dx w(x) = ∫ dx |φ(x)|2 = 1 , −∞
−∞
können gebundene Teilchen nur durch normierbare Wellenfunktionen, ∞
∫ dx |φ(x)|2 < ∞ , −∞
8.2 Die Wellenfunktion in Abhängigkeit von der Energie
| 131
beschrieben werden. Lösungen der stationären Schrödinger-Gleichung, welche ein im Raum lokalisiertes Teilchen beschreiben und folglich normierbar sind, werden als ge bundene Zustände bezeichnet. Betrachten wir die Lösung der Schrödinger-Gleichung im Energiebereich (8.2), so finden wir, dass nicht für jede Energie normierbare Lösungen möglich sind (Abb. 8.3). Eine normierbare Wellenfunktion muss asymptotisch exponentiell abfallen, d. h., sich an die x-Achse anschmiegen. Damit dies eintritt, muss die Wellenfunktion am klassi schen Umkehrpunkt eine ganz bestimmte Krümmung aufweisen. Ist die Krümmung zu schwach (Abb. 8.3), wächst die Wellenfunktion im klassisch verbotenen Bereich ex ponentiell an und ist daher nicht normierbar. Ist umgekehrt die Krümmung zu stark, kreuzt die Wellenfunktion im klassisch verbotenen Bereich die x-Achse und wächst mit negativem Vorzeichen wieder exponentiell an und ist damit ebenfalls nicht nor mierbar. Nur bei einer ganz bestimmten Krümmung fällt die Wellenfunktion exponen tiell für x → ∞ ab und ist normierbar. Sie führt dann auf einen gebundenen quanten mechanischen Zustand. E > V (x)
E < V (x) nicht normierbar
normierbar
nicht normierbar
Abb. 8.3: Normierbarkeit der Wellenfunktion.
8.2 Die Wellenfunktion in Abhängigkeit von der Energie Im Folgenden bezeichnen wir die klassischen Umkehrpunkte mit x1 und x2 , d. h., es gilt: V(x1,2 ) = E , wobei x2 > x1 ist. Wir nehmen an, dass die stationäre Schrödinger-Gleichung mit der korrekten Asymptotik im klassisch verbotenen Gebiet x1 > x → −∞ gelöst wurde, φ(x) ∼ e κx ,
x → −∞ ,
κ=
1 √2m(V−∞ − E) , ℏ
und untersuchen, wie sich die Wellenfunktion im klassisch verbotenen Gebiet für x2 < x → ∞ verhält. Wir betrachten zunächst eine Energie E , die nur geringfügig über dem Potenzialminimum liegt, siehe Abb. 8.4. Der klassisch erlaubte Bereich ist dann sehr klein und reicht nicht aus zur Ausbildung eines oszillierenden Verhaltens
132 | 8 Die eindimensionale stationäre Schrödinger-Gleichung
der Wellenfunktion. In der Abb. 8.4(a) ist dieser Bereich so klein, dass nicht einmal eine halbe Wellenlänge im klassisch erlaubten Gebiet Platz findet. Die Krümmung der Wellenfunktion im klassisch erlaubten Bereich ist so gering, dass nach dem Wende punkt die Wellenfunktion konvex wird und für große x exponentiell anwächst. Eine solche Wellenfunktion ist nicht normierbar, und es kann sich kein stationärer Zustand mit normierbarer Wellenfunktion, d. h. mit endlicher lokalisierter Aufenthaltswahr scheinlichkeit, ausbilden (Abb. 8.4(a)). Vergrößern wir nun die Energie E, so nimmt die Krümmung der Wellenfunktion im klassisch erlaubten Bereich zu. Bei einer bestimmten Energie E = E0 ist die konkave Krümmung von φ(x) ausreichend, um für x > x2 ein korrektes exponentielles Abfallen der Wellenfunktion für x → ∞ zu gewährleisten. Wir erhalten dann eine normierbare Wellenfunktion, folglich einen stationären Quantenzustand (Abb. 8.4(b)). Bei einer weiteren Steigerung der Energie vergrößert sich der erlaubte klassische Bereich und gleichzeitig nimmt die Wellenzahl zu. Die Wellenfunktion wird deshalb mehr und mehr gekrümmt und beginnt schließlich zu oszillieren, d. h., es entsteht eine erste Nullstelle der Wellenfunktion (Abb. 8.4(c)). Die Krümmung der Wellenfunk tion reicht jedoch noch nicht aus, um die korrekte Asymptotik für x → ∞ zu erzeu gen. Erst bei einer weiteren Vergrößerung der Energie auf E = E1 ist die Krümmung groß genug, sodass die Wellenfunktion normierbar wird und sich ein stationärer Zu stand ausbildet. Dieser Zustand ist der erste angeregte Zustand. Er besitzt einen Kno ten (Abb. 8.4(d)). Auf diese Weise können wir fortfahren und die Energie ständig vergrößern, dabei nimmt die Krümmung im klassisch erlaubten Bereich ständig zu. Die Wellenfunktion entwickelt dann im klassisch erlaubten Bereich einen zweiten Knoten, und bei einer bestimmten Energie E = E2 wird dieser Zustand normierbar und damit zu einem loka lisierten gebundenen Zustand. Wir können dieses Verfahren offenbar fortführen, bis die Energie die Potenzialkante V−∞ erreicht. Wir stellen fest, dass normierbare Wellenfunktionen nur bei ganz bestimmten dis kreten Energien auftreten. Diese diskreten Energien sind die Eigenwerte des HamiltonOperators und die zugehörigen Wellenfunktionen seine normierbaren Eigenfunktion en.DiesebeschreibenoffenbarimOrtlokalisierteAufenthaltswahrscheinlichkeitenund damit gebundene Teilchen und werden folglich als gebundene Zustände bezeichnet. Unsere obigen qualitativen Überlegungen haben auch gezeigt, dass die Wellen funktion des Grundzustandes keinen Knoten hat, die des ersten angeregten Zustan des besitzt einen Knoten, die des zweiten einen zweiten Knoten usw. Diese qualitativ gefundenen Ergebnisse sind offenbar eine Folge der mathematischen Struktur der Schrödinger-Gleichung und sollen im Folgenden streng bewiesen werden.
8.3 Strenge Eigenschaften der eindimensionalen Schrödinger-Gleichung
|
133
V (x) E1 E ϕ(x)
E
E0 bei E zu geringe Krümmung
x x1
(a)
x2
ϕ(x) bei E0 stationärer Zustand
x x1
(b)
x2
ϕ(x) bei E zu starke Krümmung
x (c)
ϕ(x)
x1
x2
bei E1 erster angeregter Zustand x (d)
x1
Knoten
x2
Abb. 8.4: Wellenfunktion für unterschiedliche Energien.
8.3 Strenge Eigenschaften der eindimensionalen Schrödinger-Gleichung Aus der Tatsache, dass die stationäre Schrödinger-Gleichung eine lineare Differenzi algleichung zweiter Ordnung ist, folgen bereits einige sehr weitreichende Aussagen
134 | 8 Die eindimensionale stationäre Schrödinger-Gleichung
über die Eigenschaften der Wellenfunktionen. Dazu wollen wir zunächst einige Ergeb nisse der Theorie der Differenzialgleichungen benutzen. Der Einfachheit halber setzen wir im Folgenden voraus, dass das Potenzial V(x) nur endliche Unstetigkeitssprünge aufweist. φ1 und φ2 seien zwei stationäre Lösungen der Schrödinger-Gleichung zu Energi en E1 und E2 . Dann gilt: 2 φ 1 (x) + k 1 (x)φ 1 (x) = 0 2 φ 2 (x) + k 2 (x)φ 2 (x) = 0 ,
wobei
2m (E1/2 − V(x)) . ℏ2 Multiplizieren wir die erste Gleichung mit φ2 , die zweite mit φ1 und bilden die Diffe renz, so erhalten wir: k 21/2 (x) =
2 2 φ 2 φ 1 − φ 1 φ 2 = (k 1 − k 2 )φ 1 φ 2 2m = 2 (E1 − E2 )φ1 φ2 . ℏ
(8.3)
Den Ausdruck auf der linken Seite dieser Gleichung formen wir um zu: φ 2 φ 1 − φ 1 φ 2 = φ 2 φ 1 + φ 2 φ 1 − (φ 1 φ 2 + φ 2 φ 1 )
=
d (φ φ1 − φ1 φ2 ) . dx 2
(8.4)
Er stellt ein totales Differenzial der Größe φ1 (x) W(φ1 , φ2 ; x) = φ1 (x)
φ2 (x) φ2 (x)
(8.5)
dar, das als Wronskian bzw. Wronski-Determinante der (homogenen) Differenzial gleichung zweiter Ordnung bezeichnet wird. Durch Integration von (8.3) über x von x bis x und Benutzung von (8.4) und der Definition des Wronskian erhalten wir: x
2m W(φ1 , φ2 ; x ) − W(φ1 , φ2 , x ) = 2 (E1 − E2 ) ∫ dx φ1 (x)φ2 (x) . ℏ
(8.6)
x
Mittels dieser Beziehung können wir einige allgemeine Eigenschaften der Lösungen der stationären Schrödinger-Gleichung angeben, die allein aus ihrer mathematischen Struktur folgen: 1.
Die Zustände des diskreten Spektrums der eindimensionalen Schrödinger-Glei chung sind sämtlich nicht entartet, d. h., zu einem festen E gibt es immer nur eine linear unabhängige Eigenfunktion φ(x).
8.3 Strenge Eigenschaften der eindimensionalen Schrödinger-Gleichung
|
135
Wir führen den Beweisx indirekt. Seien φ 1 und φ 2 zwei verschiedene, linear unabhängige Lösungen¹ der stationären Schrödinger-Gleichung zur selben Energie E. Aus (8.6) folgt, dass ihr Wronskian eine von x unabhängige Konstante ist. Da φ 1 und φ 2 normierbare Lösungen der stationären SchrödingerGleichung sein sollen, müssen sie für |x| → ∞ asymptotisch verschwinden, φ 1 (x), φ 2 (x) → 0. Damit verschwindet der Wronskian für alle x: W(φ 1 , φ 2 ; x) = 0 . Aus der Definition des Wronskians folgt dann die Beziehung φ 1 φ 2 − =0 φ1 φ2
⇒
d d ln φ 1 − ln φ 2 = 0 , dx dx
die sich zu
d φ1 ln ( )=0 dx φ2 umformen lässt. Integrieren wir diese Gleichung, so finden wir: ln (
φ1 ) = const. ≡ ln C φ2
bzw. φ 1 = Cφ 2 . Die beiden Wellenfunktionen sind also linear abhängig und stellen somit bis auf eine Normierung dieselbe Eigenfunktion dar. Dies steht im Widerspruch zu unserer Annahme, dass φ 1 und φ 2 zwei verschiedene, d. h. linear unabhängige, Funktionen sind. Damit ist die Behauptung bewiesen.²
2.
Knotensatz in einer Dimension: Die Wellenfunktion des n-ten angeregten Zustan des hat genau n Knoten.
Dieser Sachverhalt ist unmittelbar aus den vorangegangenen qualitativen Diskussionen klar. Zum Be weis nehmen wir an, dass φ n (x) und φ m (x) reelle Eigenfunktionen mit Eigenwerten E n > E m sind. Ferner seien x und x zwei benachbarte Nullstellen von φ m (x), d. h.: φ m (x ) = φ m (x ) = 0 . Dann hat φ m (x) für alle x ∈ Abb. 8.5):
(x , x )
(8.7)
ein und dasselbe Vorzeichen, und für die Ableitungen gilt (siehe φ m (x )φ m (x ) < 0 .
Ohne Beschränkung der Allgemeinheit (o. B. d. A.) können wir annehmen, dass: φ m (x) > 0 ,
x ∈ (x , x ) .
(8.8)
1 Zwei Funktionen φ 1 (x) und φ 2 (x) sind genau dann linear unabhängig, wenn die Gleichung C 1 φ 1 (x) + C 2 φ 2 (x) = 0 mit beliebigen x nur die Lösung C 1 = C 2 = 0 besitzt. 2 Wir haben oben gesehen, dass aus W(φ 1 , φ 2 ; x) = 0 die lineare Abhängigkeit φ 2 ∼ φ 2 folgt. Auch die Umkehrung dieser Aussage ist offensichtlich. Damit gilt: Der Wronskian verschwindet genau dann nicht, W(φ 1 , φ 2 ; x) ≠ 0, wenn die beiden Funktionen φ 1 und φ 2 linear unabhängig sind.
136 | 8 Die eindimensionale stationäre Schrödinger-Gleichung
ϕm (x) x x
x
Abb. 8.5: Wellenfunktion zwischen zwei benachbarten Nullstellen.
Für die Ableitungen gilt dann: φ m (x ) > 0 ,
φ m (x ) < 0 .
(8.9)
Wegen (8.7) und (8.8), (8.9) gilt:
W(φ n , φ m ; x)|xx = φ n (x)φ m (x)|xx = φ n (x )φ m (x ) − φ n (x )φ m (x ) = − (φ n (x )|φ m (x )| + φ n (x )|φ m (x )|) . Einsetzen dieses Ausdruckes in (8.6) liefert: x
− (φ n (x )|φ m (x )| + φ n (x )|φ m (x )|) =
2m (E n − E m ) ∫ dx φ n (x)φ m (x) . ℏ2
(8.10)
x
Nach Gleichung (8.8) ist φ m (x) > 0 für alle x ∈ (x , x ). Falls φ n (x) ebenfalls im Intervall (x , x ) keine Nullstellen besitzt, so hat φ n (x) ein und dasselbe Vorzeichen für alle x ∈ (x , x ). Die rechte Seite der obigen Gleichung (8.10) hat dann für E n > E m dasselbe Vorzeichen wie φ n (x), während die linke Seite das entgegengesetzte Vorzeichen besitzt. Dies ist ein Widerspruch, der sich nur beseitigen lässt, wenn φ n (x) im Intervall zwischen x und x das Vorzeichen mindestens einmal ändert, d. h., φ n muss mindestens einen Knoten in (x , x ) besitzen. Ferner wissen wir, dass die normierbaren Eigenfunktionen φ n (x) und φ m (x) für x → ∞ gegen null gehen müssen. Die m Knoten von φ m (x) unterteilen die x-Achse in m + 1 Abschnitte, in denen die Wellenfunktion φ m (x) das Vorzeichen nicht ändert. Nach dem oben bewiesenen Satz muss in je dem dieser Abschnitte φ n (x) mindestens eine Nullstelle besitzen. Damit hat φ n (x) mindestens m + 1 Knoten. Wählen wir n := m + 1 und benutzen die Methode der vollständigen Induktion, so ist der Knoten satz bewiesen, vorausgesetzt wir können noch zeigen:
3.
Die Wellenfunktion des Grundzustandes besitzt keine Knoten.
Dieser Satz ist ebenfalls unmittelbar klar aus den oben gegebenen qualitativen Betrachtungen, sie he Abschnitt 8.2, und gilt auch in mehr als einer Dimension. Er beinhaltet, dass die Wellenfunktion
8.3 Strenge Eigenschaften der eindimensionalen Schrödinger-Gleichung
| 137
für kein endliches x verschwindet, d. h., keine Knoten besitzt. Die Wellenfunktion besitzt deshalb im gesamten Raum ein und dasselbe Vorzeichen.
4.
Die Grundzustandswellenfunktion φ0 ist auch in mehr als einer Dimension nicht entartet.
Den Beweis führen wir wieder indirekt. Nehmen wir an, es existieren zwei entartete Grundzustands (1) (2) wellenfunktionen φ 0 und φ 0 . Beide dürfen dann keine Knoten besitzen. Nach dem Superpositions prinzip ist dann (3) (1) (2) φ0 = C1 φ0 + C2 φ0 ebenfalls Lösung der stationären Schrödinger-Gleichung zur selben Energie und sollte als Grundzu standswellenfunktion knotenfrei sein. Durch geeignete Wahl der Koeffizienten C 1 und C 2 kann man (3) jedoch erreichen, dass φ 0 in einem beliebigem Punkt einen Knoten besitzt. Dies ist ein Widerspruch zur Annahme, der sich nur dadurch auflösen lässt, dass der Grundzustand nicht entartet ist.
5.
Verläuft die Bewegung in einem durch eine unendlich hohe Potenzialbarriere räumlich begrenzten Gebiet (siehe z. B. den unendlich hohen Potenzialtopf), so muss auf dem Rand dieses Gebietes die Wellenfunktion für alle Zustände ver schwinden, d. h., φ n (x) = 0 für alle n.
Dies wurde bereits in den Abschnitten 6.1 und 7.6.2 gezeigt. 6.
Bei Vergrößerung des räumlichen Gebietes, in welchem die Bewegung verlaufen kann, werden alle Energieniveaus abgesenkt.
Diese Aussage lässt sich streng mithilfe des Variationsprinzips (siehe Kapitel 21) zeigen, da die An zahl der Zustände mit wachsender Ausdehnung des Gebietes zunimmt. Diese Aussage ist auch bereits aus dem Beispiel des unendlich hohen Potenzialkastens bekannt, siehe die Abschnitte 6.2 und 8.5. Dort hatten wir gefunden, dass die Energie proportional zu 1/L 2 ist, während der Impuls proportio nal zu 1/L ist. Allgemein folgt aus der Unschärfebeziehung, dass mit wachsender Ausdehnung des Kastens die Impulsunschärfe und damit die Energie abnehmen und somit mehr Zustände mit Ener gien unterhalb einer Schwelle in den Kasten passen. Dasselbe Ergebnis erhält man bereits in einer semiklassischen Analyse.
138 | 8 Die eindimensionale stationäre Schrödinger-Gleichung
8.4 Symmetrische Potenziale: die Parität Im Folgenden wollen wir Potenziale betrachten, die symmetrisch bezüglich Raum spiegelung sind: V(−x) = V(x) . Für solche Potenziale ist der Hamilton-Operator H(x) = −
ℏ2 d 2 + V(x) 2m dx2
ebenfalls invariant unter Raumspiegelung x → (−x): H(−x) = H(x) . Wegen der Spiegelsymmetrie von H darf sich bei der Raumspiegelung x → (−x) die Wellenfunktion höchstens um einen (nicht beobachtbaren) konstanten Phasenfaktor ändern. Um dies zu zeigen, unterwerfen wir die stationäre Schrödinger-Gleichung H(x)φ(x) = Eφ(x)
(8.11)
der Raumspiegelung x → (−x) und erhalten: H(−x)φ(−x) = Eφ(−x) . Wegen der Spiegelsymmetrie von H folgt hieraus: H(x)φ(−x) = Eφ(−x) . Vergleichen wir diesen Ausdruck mit (8.11) und beachten, dass die Wellenfunktionen für eine eindimensionale Potenzialbewegung nicht entartet sind, so finden wir, dass φ(−x) und φ(x) sich höchstens um einen konstanten Faktor C unterscheiden dürfen: φ(−x) = Cφ(x) . Zweimalige Anwendung dieser Beziehung führt auf: φ(x) = Cφ(−x) = C2 φ(x) , woraus folgt: C2 = 1
⇒
C = ±1 .
Damit finden wir, dass für symmetrische Potenziale die Wellenfunktionen gerade oder ungerade Funktionen sind: φ(−x) = ±φ(x) . Wie wir oben allgemein gezeigt haben, sind die stationären (gebundenen) Zustände des eindimensionalen Hamilton-Operators niemals entartet, der Grundzustand be sitzt keinen Knoten (d. h., die Grundzustandswellenfunktion hat keine Nullstelle),
8.5 Der unendlich hohe Potenzialtopf
| 139
und die Wellenfunktion des n-ten angeregten Zustandes besitzt n Nullstellen. Für symmetrische Potenziale folgt hieraus, dass die Grundzustandswellenfunktion eine symmetrische Funktion des Ortes und die Wellenfunktionen der angeregten Zustände alternierend ungerade und gerade Funktionen des Ortes sind. Für spätere Betrachtungen führen wir den Operator der Raumspiegelung Π ein, der offenbar durch Πφ(x) := φ(−x) definiert ist und als Paritätsoperator bezeichnet wird. Die zugehörige Eigenwertglei chung lautet: Πφ(x) = πφ(x) , wobei π den Eigenwert des Paritätsoperators bezeichnet. Zweimalige Anwendung des Paritätsoperators auf die Wellenfunktion liefert: Π 2 φ(x) = Πφ(−x) = φ(x) ,
(8.12)
woraus wir mit Π 2 φ(x) = π 2 φ(x) schließen können, dass die Eigenwerte des Paritätsoperators Π, kurz als Parität be zeichnet, durch π = ±1 gegeben sind. Dieses Ergebnis folgt unmittelbar aus (8.12), wonach das Quadrat des Paritätsoperators offenbar gleich dem Einheitsoperator ist: Π 2 = 1̂ . Der Paritätsoperator lässt sich natürlich unmittelbar auf drei Dimensionen verallge meinern: Πφ(x) = φ(−x) . Sein Eigenwert, die Parität, nimmt offensichtlich auch hier die Werte π = ±1 an.
8.5 Der unendlich hohe Potenzialtopf Im atomaren Bereich gibt es viele Beispiele, in denen die Teilchen auf einen Raum be schränkt sind, sich aber innerhalb dieses Raumes frei bewegen können. Hierbei sind vor allem die Elektronen in Metallen oder die Nukleonen innerhalb des Atomkerns zu nennen. Die Teilchen werden durch die Wirkung einer Kraft auf ein räumliches Ge biet eingeschränkt. Diese Kraft lässt sich i. A. durch den Gradienten eines Potenzials darstellen.
140 | 8 Die eindimensionale stationäre Schrödinger-Gleichung
idealer Isolator
Draht Abb. 8.6: Dünner Draht zwischen zwei Isolatorplatten.
In vielen praktischen Problemen ist für ein zu untersuchendes Phänomen nur die Bewegung der Teilchen in einer einzigen Dimension relevant. Ein typisches Beispiel hierfür sind die Elektronen in einem sehr dünnen Draht, der zwischen zwei idealen Isolatorplatten eingespannt ist (Abb. 8.6). Können wir den Querschnitt des Drahtes gegenüber seiner Länge vernachlässigen, wird das Problem eindimensional. Im idealen Leiter können sich die Leitungselektronen frei bewegen. Das Poten zial muss folglich im Leiterinneren konstant sein, und wir können den Wert dieses Potenzials willkürlich auf null setzen. Da die Elektronen nicht in die Isolatorplatten eindringen können, müssen diese für die Elektronen eine unendlich hohe Potenzial wand darstellen (Abb. 8.7).³ Legen wir den dünnen Draht der Länge L parallel zur x-Achse und symmetrisch zum Koordinatenursprung, so hat das Potenzial der Elektronen in diesem Leiter die Gestalt {0 , |x| < L/2 V(x) = { . ∞ , |x| ≥ L/2 { Für dieses Potenzial haben wir bereits in Abschnitt 6.2 den vollen quantenmechani schen Propagator und damit die Wellenfunktionen sämtlicher Energieeigenzustände aus dem Funktionalintegral bestimmt. Im Folgenden wollen wir diese Energieeigen zustände durch Lösen der Schrödinger-Gleichung gewinnen. Da dieses Potenzial zeitunabhängig ist, genügt es, die stationäre SchrödingerGleichung Hφ = Eφ mit dem Hamilton-Operator H=
p2 + V(x) 2m
für eine endliche Energie E zu lösen. Für |x| ≥ L/2 ist die rechte Seite der stationären Schrödinger-Gleichung für je de normierbare Wellenfunktion und jede endliche Energie E endlich. Die linke Seite
3 Bei tiefen Temperaturen können die Elektronen den Drahtnicht verlassen, und die Enden des Drahtes repräsentieren bereits eine unendlich hohe Potenzialwand. Die Isolatorplatten können dann entfallen.
8.5 Der unendlich hohe Potenzialtopf
|
141
V (x)
unendlich hohe Potentialwand
x −L/2
+L/2
Abb. 8.7: Idealisiertes Potenzial der Elektronen im dünnen Leiter: der unendlich hohe Potenzialtopf.
kann wegen V0 → ∞ nur endlich bleiben, wenn die Wellenfunktion in diesem Bereich verschwindet. Damit erhalten wir: φ(x) = 0 ,
|x| ≥
L . 2
Für |x| < L/2 reduziert sich die Schrödinger-Gleichung mit V = 0 auf die Differenzial gleichung ℏ2 d2 − φ(x) = Eφ(x) . (8.13) 2m dx2 Da die Wellenfunktion selbst bei unendlich großen Potenzialsprüngen stetig ist (siehe Abschnitt 7.6), muss φ(x) den Randbedingungen L L φ (− ) = φ ( ) = 0 2 2
(8.14)
genügen. Zur Lösung der Differenzialgleichung (8.13) führen wir die Wellenzahl k = p/ℏ, 2mE k2 = 2 , (8.15) ℏ des sich für |x| < L/2 frei bewegenden Teilchens ein. Damit nimmt die SchrödingerGleichung (8.13) die Gestalt φ (x) + k 2 φ(x) = 0 an. Dies ist die aus der Mechanik bekannte Gleichung eines harmonischen Oszilla tors. Die allgemeine Lösung dieser linearen Differenzialgleichung zweiter Ordnung mit konstanten Koeffizienten hat die Form φ(x) = A cos(kx) + B sin(kx) , wobei die Koeffizienten A und B durch die Randbedingungen (8.14) bestimmt sind. Diese führen auf das folgende System von linearen Gleichungen für die Koeffizienten A
142 | 8 Die eindimensionale stationäre Schrödinger-Gleichung
und B:
L L A cos (k ) + B sin (k ) = 0 , 2 2 L L A cos (k ) − B sin (k ) = 0 . 2 2
Durch Addition und Subtraktion der beiden Gleichungen erhalten wir: L A cos (k ) = 0 , 2
L B sin (k ) = 0 . 2
Dieses System hat zwei Lösungen: B=0,
k
π L =n , 2 2
n = 1, 3, 5, . . . ,
A=0,
k
π L =n , 2 2
n = 0, 2, 4, . . . .
Für alle Lösungen muss also kL = nπ ,
n = 0, 1, 2, . . .
gelten. Diese Bedingung beinhaltet, dass die Wellenzahl nur diskrete Werte kn =
nπ L
(8.16)
annehmen kann. Damit lauten die Lösungen: φ n (x) = A cos(k n x) ,
n = 1, 3, 5, . . . ,
φ n (x) = B sin(k n x) ,
n = 0, 2, 4, . . . .
Physikalisch beinhaltet die Quantisierungsbedingung (8.16), dass ein Vielfaches der halben Wellenlänge λ/2 = π/k gerade in die Box passt: n
λ =L. 2
Dies ist aber gerade die de Broglie-Quantisierungsbedingung, die wir bereits in Abschnitt 5.4 aus der Bohr-Sommerfeld’schen Quantisierungsbedingung abgeleitet hatten. Im vorliegenden Fall resultiert diese Quantisierungsbedingung aus der Rand bedingung (8.14) an die Wellenfunktion. Die Energieeigenwerte können damit ebenfalls nur die diskreten Werte
En =
ℏ2 k 2n ℏ2 π2 2 ℏ2 nπ 2 n = ( ) = 2m 2m L 2mL2
(8.17)
8.5 Der unendlich hohe Potenzialtopf
| 143
annehmen. Fordern wir noch, dass die zugehörigen Eigenfunktionen von H korrekt auf 1 normiert sind, L/2 !
∫ dx |φ n (x)|2 = 1 , −L/2
so finden wir für die normierten Wellenfunktionen: 2 nπx cos ( ) , L L 2 nπx φ n (x) = √ sin ( ) , L L φ n (x) = √
n = 1, 3, 5, . . . ,
(8.18)
n = 2, 4, 6, . . . ,
(8.19)
wobei die Normierungsbedingung die Lösung mit n = 0 ausschließt. Im Zustand φ n=0 (x) ≡ 0 verschwindet die Aufenthaltswahrscheinlichkeit des Teilchens überall, d. h., es existiert in diesem Zustand nicht. Die Energieeigenzustände (8.18), (8.19) hatten wir bereits in (6.20) aus dem Propagator gefunden.
1.
2.
3.
4.
Der Zustand n = 0 mit der Energie E = 0 ist schon wegen der Unschärferelation verboten. Da das Teilchen sich im Inneren der Box frei bewegt, besitzt es einen festen Impuls, der in diesem Falle verschwindet (p = 0). Hieraus folgt, dass auch die Impulsunschärfe in diesem Zustand ver schwindet (∆p = 0). Nach der Unschärferelation (2.6) muss dann aber die Ortsunschärfe ∆x un endlich groß werden, was aber für das Teilchen in der Box nicht möglich ist, da die Ortsunschärfe in diesem Fall nicht größer als die Breite der Box sein kann (∆x ≤ L). Die Eigenfunktionen mit ungeradem bzw. geradem n sind symmetrisch bzw. antisymmetrisch be züglich der Raumspiegelung x → (−x), wie wir dies aufgrund unserer in Abschnitt 8.4 gegebenen allgemeinen Überlegungen für symmetrische Potenziale erwarten. Ferner besitzt die Wellenfunk tion des n-ten angeregten Zustandes φ n+1 (x) gerade n Nullstellen (für |x| < L/2) in Übereinstim mung mit dem Knotensatz. Aus der Abb. 8.8 ist ersichtlich: Die ungeraden Wellenfunktionen liefern (bis auf Normierung) die Gesamtheit der Zustände im Potenzialtopf der halben Breite. Die normierten Eigenzustände im Potenzialtopf {0 , 0 n1 . Fällt eine Lichtwelle von links senkrecht auf die Grenz fläche (Potenzialschwelle) vom optisch dünneren zum optisch dichteren Medium, so wird ein Teil des Lichtes an der Grenzfläche reflektiert, während der Rest des Lichtes seinen Weg durch das optisch dichtere Medium mit einer kleineren Geschwindigkeit c2 = c1 n1 /n2 fortsetzt.¹ (Da das Licht senkrecht auf die Grenzfläche fällt, erfolgt keine Ablenkung.) Wir sollten ein ähnliches Phänomen auch bei der Bewegung eines quan tenmechanischen Teilchens beobachten, da dieses bekanntlich Wellencharakter be sitzt. Betrachten wir eine von links in das Gebiet 1 einfallende ebene Materiewelle, so wird diese durch den Potenzialsprung gestört. Ist die Energie der Welle E > V0 , so sollte genau wie im Falle des Lichtes ein Teil der Welle am Potenzialsprung reflektiert werden, während der restliche Teil mit veränderter, dem neuen Potenzial angepass ter Wellenlänge nach rechts weiterlaufen sollte. Dieses aufgrund der Analogie mit den Lichtwellen zu erwartende Verhalten sollte aus der Schrödinger-Gleichung folgen.
9.1.1 Streuzustände Wir legen den Potenzialsprung in x = 0 und betrachten zunächst die stationäre Schrö dinger-Gleichung in den beiden Gebieten konstanten Potenzials x < 0 und x > 0 ge trennt. Nach Einführung der Wellenzahl lautet die Schrödinger-Gleichung in diesen beiden Gebieten: d2 φ1 = −k 21 φ1 , dx2 d2 φ2 = −k 22 φ2 , dx2
1√ 2mE , ℏ 1 k 2 = √2m(E − V0 ) , ℏ k1 =
x0.
Die fundamentalen Lösungen dieser Schwingungsgleichungen sind durch ebene Wel len φ1,2 (x) = e±ik1,2 x gegeben. Dementsprechend setzen wir die allgemeine Lösung in der Form an, φ1 (x) = Ae ik1 x + Be−ik1 x , φ2 (x) = Ce
ik2 x
+ De
−ik2 x
,
x0,
wobei A, B, C und D komplexe Konstanten sind. Ohne Beschränkung der Allgemein heit können wir die Amplitude der einfallenden Welle² A = 1 wählen. Da wir uns auf
1 Wir haben hier den aus der Elektrodynamik bekannten Zusammenhang zwischen der Lichtge schwindigkeit c in und dem Brechnungsindex n eines Mediums c ∼ 1/n benutzt. 2 Die Interpretation von exp[ (±)ikx] als nach rechts (links) laufende Welle basiert auf ihrem Impuls p = ±ℏk, erfordert aber streng genommen die Restoration des zeitabhängigen Teils der Wellenfunk
9.1 Streuung an einer Potenzialstufe |
149
V (x) eik1 x Ceik2 x Be−ik1 x
V0
x x=0 Abb. 9.2: Illustration der verschiedenen Bestandteile der Wellenfunktion bei der Streuung an der Potenzialstufe.
eine von links einlaufende ebene Teilchenwelle beschränkt haben und voraussetzen, dass das Potenzial für x > 0 konstant ist, gibt es keinen Mechanismus, der eine im rechten Raum nach links laufende Welle erzeugen könnte (vgl. wieder das analoge Experiment mit Lichtwellen). Deshalb können wir D = 0 setzen. Dann lautet die Wel lenfunktion (siehe Abb. 9.2): φ1 (x) = e ik1 x + Be−ik1 x
,
x0.
ik2 x
(9.3)
Die Wellenfunktionen im linken und rechten Gebiet, φ1 und φ2 , sind jedoch nicht unabhängig voneinander, sondern müssen, wie wir früher aus allgemeinen Überle gungen gefunden hatten, gewisse Stetigkeitsbedingungen bzw. Grenzflächenbedin gungen erfüllen. Wie in Abschnitt 7.6 gezeigt wurde, muss die Wellenfunktion an Potenzialsprüngen immer stetig sein. In unserem Fall muss deshalb gelten: φ1 (0) = φ2 (0) .
(9.4)
Setzen wir weiterhin voraus, dass der Potenzialsprung endlich ist (V0 < ∞), so muss auch die erste Ableitung der Wellenfunktion an dem Potenzialsprung stetig sein: φ1 (0) = φ2 (0) .
(9.5)
Setzen wir die explizite Form der Wellenfunktion (9.3) in die beiden Grenzflächenbe dingungen (9.4) und (9.5) ein, so erhalten wir: 1+B = C,
k 1 (1 − B) = k 2 C .
(9.6)
tion e −iω(k)t , womit die Welle exp[ (±)ikx] eine positive (negative) Phasengeschwindigkeit (±)ω(k)/k erhält. Weiterhin erfordert die Beschreibung eines realistischen Streuexperimentes die Benutzung von Wellenpaketen statt ebenen Wellen, siehe Abschnitt 4.3. Wegen des Superpositionsprinzips nimmt aber jede einzelne Welle des Wellenpaketes unabhängig von den übrigen Wellen am Streuprozess teil. Dies rechtfertigt die stationäre Betrachtungsweise des Streuexperimentes.
150 | 9 Eindimensionale Streuprobleme
Dies ist ein inhomogenes Gleichungssystem für die beiden unbekannten Koeffizien ten B und C, das sich in trivialer Weise auflösen lässt: B=
k1 − k2 , k1 + k2
C=
2k 1 . k1 + k2
(9.7)
Setzen wir hier die expliziten Ausdrücke (9.2) für die Wellenzahlen k 1 und k 2 ein, er halten wir: 1 − √1 − V0 /E 2 B= , C= . (9.8) √ √ 1 + 1 − V0 /E 1 + 1 − V0 /E Für gegebenes Potenzial V0 sind diese Koeffizienten allein eine Funktion der Ener gie E. Bei Streuung an einer positiven Potenzialstufe V0 > 0 (siehe Abb. 9.3(a)) und E > V0 sind diese Koeffizienten reell und positiv. Durchlaufende und reflektierte Wel len besitzen damit am Potenzialsprung dieselbe Phase wie die einlaufende Welle (deren Amplitude wir o. B. d. A. auf A = 1 gesetzt hatten). Bei der Streuung an einer negativen Potenzialstufe V0 < 0 (siehe Abb. 9.3(b)) und E > 0 sind die Koeffizienten B, C ebenfalls reell, jedoch während C > 0 ist B < 0. In diesem Fall ist am Potenzial sprung V0 < 0 die reflektierte Welle um e iπ = −1 phasenverschoben gegenüber der einfallenden Welle, während die durchgehende Welle in Phase mit der einlaufenden Welle ist. Wir kommen damit zu folgendem Ergebnis: Bei der Streuung von Teilchen an einer Potenzialstufe (mit Teilchenenergien oberhalb der Potenzialstufe) ist die durchlaufen de Welle stets in Phase mit der einfallenden Welle, während die reflektierte Welle bei einer positiven Potenzialstufe in Phase mit der einlaufenden Welle, bei einer negati ven Potenzialstufe um e iπ = −1 phasenverschoben gegenüber der einlaufenden Welle ist. Die physikalische Bedeutung der Koeffizienten B und C wird offensichtlich, wenn wir die Wahrscheinlichkeitsstromdichten in den beiden Gebieten konstanten Poten zials berechnen. Die Stromdichte ist durch (7.43) 1 (φ∗ (x)pφ(x) − φ(x)pφ∗ (x)) 2m ℏ (φ∗ (x)∇φ(x) − φ(x)∇φ∗ (x)) = 2mi ℏ = Im{φ∗ (x)∇φ(x))} m
j(x) =
gegeben. Sie ist offensichtlich stets reell. Eine ebene (eindimensionale) Welle φ(x) = Ae ikx liefert die Stromdichte j=
ℏk 2 |A| . m
9.1 Streuung an einer Potenzialstufe
| 151
Streuung an Potentialstufe: V0 > 0
Re ϕein Re ϕrefl Re ϕtrans
V0 > 0 x (a) Streuung an Potentialstufe: V0 < 0
Re ϕein Re ϕrefl Re ϕtrans
x (b)
V0 < 0
Abb. 9.3: Verhalten des Realteils der Wellenfunktion an einer (a) positiven (V 0 > 0) bzw. (b) nega tiven (V 0 < 0) Potenzialstufe. Wegen der Stetigkeit der Wellenfunktion am Potenzialsprung ist dort die Summe der (vorzeichenbehafteten) Amplituden von einlaufender und reflektierter Welle gleich der Amplitude der durchgehenden Welle.
Demzufolge erhalten wir für die einfallende Welle φ(x) = e ik1 x bzw. die reflektierte Welle φ(x) = Be−ik1 x die Stromdichten jein =
ℏk 1 , m
jrefl = −
ℏk 1 2 |B| . m
Sie besitzen entgegengesetzte Vorzeichen. Die einfallenden Teilchen fließen in posi tive, die reflektierten in negative x-Richtung. Folglich erhalten wir für die Teilchen
152 | 9 Eindimensionale Streuprobleme stromdichte im Gebiet 1 (x < 0): j1 =
ℏk 1 (1 − |B|2 ) = jein + jrefl = |jein | − |jrefl | . m
(9.9)
Sie setzt sich aus der einfallenden und reflektierten Teilchenstromdichte zusammen.³ Letztere wird auch als Reflexionsstrom(dichte) bezeichnet. In analoger Weise finden wir für den Teilchenstrom im Gebiet 2 (x > 0), wo φ2 (x) = Ce ik2 x : j2 =
ℏk 2 2 |C| = jtrans . m
(9.10)
Dieser Strom repräsentiert den Anteil der von links einfallenden Teilchen, welcher durch den Potenzialsprung zwar gestört wird, aber seine Bewegung nach rechts fort setzt. Er wird als Transmissionsstrom bezeichnet.
9.1.2 Transmission und Reflexion Zur Charakterisierung des reflektierten und durchgehenden Teilchenstroms führen wir den Reflexionskoeffizienten⁴ R=
−jrefl = |B|2 jein
und den Transmissionskoeffizienten T=
jtrans k 2 2 = |C| jein k1
(9.11)
ein. Setzen wir hier die expliziten Werte von B und C (9.7) ein, so finden wir: R=
(k 1 − k 2 )2 , (k 1 + k 2 )2
T=
4k 1 k 2 . (k 1 + k 2 )2
(9.12)
Diese Koeffizienten erfüllen offenbar die Beziehung R+T =1.
(9.13)
Diese Identität drückt die Teilchenzahlerhaltung an der Potenzialstufe aus. In der Tat können wir die Stromdichten im linken und rechten Gebiet, Gleichungen (9.9) und (9.10), mittels der Reflexions- und Transmissionskoeffizienten schreiben als: j1 =
ℏk 1 (1 − R) , m
j2 =
ℏk 1 T. m
3 Der Interferenzterm zwischen einfallender und reflektierter Welle fällt bei der Berechnung der Stromdichte j 1 heraus. 4 Man beachte, dass j refl negativ ist.
9.1 Streuung an einer Potenzialstufe | 153
Mit der Identität (9.13) folgt dann: j1 = j2 , und mit Gleichungen (9.9), (9.10) ergibt sich hieraus: jein = |jrefl | + jtrans . Diese Gleichung besagt, dass die einfallende Stromdichte gleich der Summe der re flektierten Stromdichte und der durchgehenden Stromdichte ist. Die Erhaltung des Teilchenflusses in beliebigen Potenzialen hatten wir bereits früher in Abschnitt 7.6 all gemein bewiesen. Sie war eine Folge der Schrödinger-Gleichung. Ein von links auf die Potenzialstufe auftreffendes Teilchen wird also mit der Wahr scheinlichkeit R an dem Potenzialsprung reflektiert. Klassisch hingegen gäbe es kei ne Reflexion an dem Potenzialsprung, solange die Energie E größer als V0 ist. Das Teilchen würde sich einfach mit kleinerer Geschwindigkeit rechts von der Potenzial schwelle weiterbewegen. Diese Reflexion ist ein typisches Wellenphänomen analog zur Reflexion von Licht an Grenzflächen zwischen zwei Medien mit unterschiedlichen Brechungsindizes. Im Limes E → ∞, also E ≫ V0 , sollten der Einfluss des Potenzials und damit die Reflexion verschwinden. In der Tat erhalten wir für E → ∞ (d. h. k 2 → k 1 ) aus (9.12) R = 0 und reproduzieren das klassische Resultat. Da hier eine unendlich scharfe Po tenzialkante vorliegt, wird der klassische Grenzfall erst für unendlich große Energi en bzw. Wellenzahlen (k → ∞), d. h. für verschwindende Wellenlängen (λ → 0), erreicht. Der Grund hierfür ist, dass bei Fourier-Zerlegung der scharfen Potenzialstu fe (9.1) (Θ-Funktion) unendlich hohe Wellenzahlen wesentlich beitragen. (Ihre Fou rier-Transformierte fällt nur mit 1/k ab, siehe Anhang (A.3.) Für eine kontinuierliche Potenzialschwelle der Breite b (siehe Abb. 9.1) laufen Teil chen mit Wellenzahlen k ≫ 1/b (d. h. λ ≪ b) praktisch vollständig durch die Schwel le, d. h., sie werden nicht mehr reflektiert und verhalten sich wie klassische Teilchen. Lassen wir die Breite der Potenzialschwelle gegen null gehen (b → 0), so finden wir aus dieser Beziehung wieder, dass erst für k → ∞ das Teilchen die endliche Potenzi alstufe nicht mehr spürt. Es ist sehr aufschlussreich, den Reflexionskoeffizienten und den Transmissions koeffizienten als Funktion der Energie E > V0 zu betrachten. Hierzu wählen wir die Variable k2 √ V0 = 1− , E > V0 . k1 E T und R als Funktion dieser Variablen k2 /k 1 (siehe Gleichung (9.12)), R=(
1 − k 2 /k 1 2 ) , 1 + k 2 /k 1
T=4
k 2 /k 1 (1 + k 2 /k 1 )2
,
sind in Abb. 9.4 dargestellt. Dieses Bild ähnelt sehr den Kurven für Reflexions- und Transmissionskoeffizienten des Lichtes beim Übergang von Luft (V = 0) in ein optisch dichteres Medium wie Glas (V = V0 > 0).
154 | 9 Eindimensionale Streuprobleme
1
T
0.8 0.6 0.4 R
0.2 0
0 E = V0
0.2
0.4
0.6
0.8
k2 /k1
1 E→∞
Abb. 9.4: Transmissions- und Reflexionskoeffizient.
Schließlich wollen wir die Aufenthaltswahrscheinlichkeit in den beiden Raum gebieten berechnen. Für das linke Raumgebiet erhalten wir aus (9.3) (da B (9.8) reell ist): |φ1 (x)|2 = 1 + B2 + 2B cos(2k 1 x) , während wir im rechten Raumgebiet |φ2 (x)|2 = |C|2 = const. finden. Beachten wir Beziehung (9.6) C = B + 1, so können wir die Aufenthaltswahr scheinlichkeit im linken Gebiet durch die im rechten ausdrücken (B > 0): |φ2 (x)|2 = B2 + 2B + 1 , |φ1 (x)|2 = |φ2 (x)|2 − 2B(1 − cos(2k 1 x)) .
|ϕ(x)|2
|C|2
0
x
V0 > 0 x
Abb. 9.5: Aufenthaltswahrscheinlichkeit als Funkti on des Ortes für die eindimensionale Streuung an einer Potenzialstufe für E > V 0 .
9.1 Streuung an einer Potenzialstufe
| 155
Während die Aufenthaltswahrscheinlichkeit im rechten Gebiet konstant ist, ist sie links des Potenzialsprungs eine oszillierende Funktion, siehe Abb. 9.5. Dieses Oszil lieren kommt durch Interferenz der einfallenden und der reflektierten Welle zustan de. Bemerkenswert ist, dass durch die Oszillation die Aufenthaltswahrscheinlichkeit links der Potenzialstufe geringer ist als im Gebiet des von null verschiedenen Poten zials. Im rechten Gebiet fließen zwar weniger Teilchen, sie fließen aber langsamer als im linken Gebiet (k 2 < k 1 ⇒ v2 < v1 ) und alle in dieselbe Richtung. Somit ist die Wahrscheinlichkeit, ein (langsameres) Teilchen rechts anzutreffen, größer als dieje nige, ein schnell fließendes Teilchen links zu finden.
9.1.3 Teilchenenergie unterhalb der Potenzialschwelle Wir wollen jetzt ein von links einfallendes Teilchen mit einer Energie E < V0 betrach ten. Die Lösung der Schrödinger-Gleichung im Gebiet 1 bleibt dabei offensichtlich un verändert. Im Gebiet 2 wird jedoch die Wellenzahl jetzt rein imaginär: k 2 = iκ ,
κ=
1 √2m(V0 − E) . ℏ
(9.14)
Die Lösung in diesem Gebiet klingt deshalb exponentiell ab: φ2 (x) = Ce−κx . Bezeichnen wir im Gebiet 1 die Wellenzahl mit k 1 = k, so nehmen Reflexions- und Transmissionsamplituden die Gestalt an: B=
k − iκ , k + iκ
C=
2k . k + iκ
Hieraus folgt wegen |k − iκ| = |k + iκ|: B = e−i2 arctan(κ/k)
(9.15)
und somit R = |B|2 = 1 , wie wir es vom klassischen Standpunkt aus auch erwarten würden. Der einfallende Teilchenstrom wird damit vollständig reflektiert (Totalreflexion). Wegen C ≠ 0 dringen die Teilchen zwar bis zu einer Tiefe d ∼ 1/κ in die Potenzialstufe ein, es findet aber kein Teilchenfluss nach rechts statt: Da die Ortsabhängigkeit der Wellenfunktion φ2 in diesem Gebiet rein reell ist, verschwindet der zugehörige Teilchenstrom j2 (x) und damit der Transmissionskoeffizient: j2 (x) = 0 ,
T =0.
Die gesamte Wellenfunktion φ(x) ist in Abb. 9.6 dargestellt.
156 | 9 Eindimensionale Streuprobleme
Streuung an Potentialkante: E = 0.2 V0
↔
Streuung an Potentialkante: E = 0.2V0 ↔ κ/k = 2
κ/k = 2
Reϕ(x) Imϕ(x)
Re ϕ(x) Im ϕ(x) x
Streuung an Potentialkante: E = 0.5V0 ↔ κ/k = 1.4 Re ϕ(x) Im ϕ(x) x
Streuung an Potentialkante: E = 0.8V0 ↔ κ/k = 0.5 Re ϕ(x) Im ϕ(x)
x
Streuung an Potentialkante: E = 0.95V0 ↔ κ/k = 0.23 Reϕ(x) Imϕ(x)
x
Abb. 9.6: Real- und Imaginärteil der Wellenfunktion für die Streuung an der eindimensionalen Potenzialstufe mit 0 < E < V 0 .
9.1 Streuung an einer Potenzialstufe |
157
Wir betrachten den Koeffizienten der reflektierten Welle B als Funktion der Poten zialhöhe V0 . Mit κ √ V0 = −1 k E erhalten wir aus (9.15): B = exp (−i2 arctan √
V0 − 1) . E
Im Allgemeinen ist B komplex, und die reflektierte Welle ist somit gegenüber der ein laufenden Welle phasenverschoben. Für eine Energie an der Potenzialschwelle (E = V0 ) folgt B = 1, und die reflektierte Welle ist in Phase mit der einfallenden Welle. Die Wellenfunktion in Gebiet 1 ist dann: φ1 (x) = 2 cos(kx) .
Streuung an Potentialkante: E = V0 ↔ κ = 0
ϕ(x) x
Abb. 9.7: Die Wellenfunktion für die Streuung an einer Potenzialkante für E = V 0 .
Für E = V0 ist wegen κ = 0 (9.14) die Wellenfunktion im Gebiet 2 eine Konstante (sie klingt also nicht exponentiell ab, siehe Abb. 9.7), und der Teilchenstrom verschwindet wie für E < V0 . (Erst für E > V0 fließen Teilchen durch das Gebiet 2.) Für V0 /E → ∞, insbesondere im Grenzfall einer unendlich hohen Potenzialschwelle (V0 → ∞), fin den wir mit arctan(∞) = π/2 für die Amplituden der reflektierten und durchgehenden Welle B = −1 und C = 0. Die reflektierte Welle ist also um die Phase π gegenüber der einlaufenden verschoben. In diesem Limes nehmen die Wellenfunktionen folgende Gestalt an: φ1 (x) = 2i sin(kx) , φ2 (x) = 0 . Dieses Verhalten hatten wir bereits früher für die Wellenfunktion an einer unendlich hohen Potenzialkante bzw. in einem unendlich hohen Potenzialkasten gefunden. Die Wellenfunktion im klassisch erlaubten Energiebereich hat die Form einer stehenden Welle, die einen Knoten am Potenzialsprung besitzt und im Gebiet des unendlich gro ßen Potenzials verschwindet (Abb. 9.8). Der unendlich große Potenzialsprung wirkt also auf die Materiewellen wie ein festes Ende einer schwingenden Saite.
158 | 9 Eindimensionale Streuprobleme
ϕ1 (x)
x
0
Abb. 9.8: Die Wellenfunktion am unendlich hohen Potenzialsprung.
Betrachten wir schließlich Transmissions- und Reflexionskoeffizienten für ein endliches V0 über den gesamten Energiebereich von E = 0 bis E = ∞, so finden wir das in Abb. 9.9 dargestellte Verhalten. Die obigen Betrachtungen bleiben natürlich alle richtig für eine Potenzialstufe mit V0 < 0, für welche die Wellenfunktion in Abb. 9.3(b) gezeigt wurde. Durch Kombinie ren der beiden Potenzialstufen mit V0 > 0 und V0 < 0 lassen sich beliebig komplizier te (stückweise konstante) Potenzialformen konstruieren, insbesondere der rechtecki ge (endliche) Potenzialtopf und der rechteckige Potenzialwall, die wir im Folgenden untersuchen wollen. Die Untersuchung dieser mathematischen Idealisierungen erlau ben bereits ein qualitatives Verständnis des quantenmechanischen Streuprozesses. Die oben bei der Teilchenstreuung an der Potenzialstufe (Abb. 9.3) beobachte ten Phänomene sind wohlbekannt von der Ausbreitung von Lichtwellen, was auf grund des Wellencharakters der Teilchen in der Quantentheorie nicht überraschen sollte. Der Potenzialsprung entspricht in der Optik einer abrupten Änderung des Bre chungsindex. Der positive Potenzialsprung (V0 > 0) entspricht dem Übergang vom optisch dünneren Medium zum optisch dichteren, entsprechend der negative Poten zialsprung (V0 < 0) dem Übergang vom optisch dichteren zum optisch dünneren Me dium. Der Fall E > V0 > 0 entspricht in der Optik der Situation, in welcher beide Medien reelle Brechungsindizes besitzen. Der abrupte Anstieg des Brechungsindex 1
R
T
0.8 0.6 0.4 0.2 0
0
0.5
1
1.5
2 2.5 ε = E/V0
3
3.5
4
Abb. 9.9: Reflexions- und Transmissionsko effizienten als Funktion der Energie für die Streuung an einer endlichen Potenzialstufe der Höhe V 0 .
9.2 Streuung am Potenzialtopf
| 159
ruft hier bei x = 0 eine teilweise Reflexion des von links einfallenden Lichtes hervor. Für V0 > E > 0 ändert sich der Brechungsindex bei x = 0 abrupt von einem reellen Wert (im Gebiet x < 0) in einen imaginären Wert (im Gebiet x > 0), und es findet eine Totalreflexion des Lichtes bei x = 0 statt.
9.2 Streuung am Potenzialtopf Im Folgenden betrachten wir die Bewegung eines quantenmechanischen Teilchens in dem in Abb. 9.10 dargestellten rechteckigen Potenzialtopf: {−V0 , V(x) = { 0, {
|x| < a |x| ≥ a
.
(9.16)
Für E > 0 würde ein klassisches Teilchen, das von links in das Potenzialgebiet ein läuft, lediglich durch den Potenzialsprung seine kinetische Energie vergrößern, mit größerer Geschwindigkeit über dem Potenzial entlanglaufen und schließlich für x > a mit seiner ursprünglichen Geschwindigkeit seine Bewegung fortsetzen. Aus der Untersuchung der Streuung eines Teilchens an der Potenzialstufe wissen wir jedoch bereits, dass an den beiden Potenzialsprüngen jeweils ein Teil der einlau fenden Welle reflektiert wird. Dies impliziert, dass auch ein Teil der bei x = a reflek tierten Welle bei x = −a wieder in zwei Teile aufgespalten wird. Wir haben es deshalb mit einem komplizierten Vielfachstreumechanismus zu tun, der sich in interessanten Interferenzeffekten äußern sollte. Für E < 0 ist das Teilchen im Potenzialtopf eingefan gen, und es wird bei gewissen Energien zur Ausbildung von gebundenen Zuständen kommen, die wir in Abschnitt 9.3 untersuchen werden. Re ϕ(x) Im ϕ(x)
−a
a
x
x
−V0 Abb. 9.10: Streuung am endlichen Potenzialtopf. Neben dem Potenzial sind Real- und Imaginärteil der Wellenfunktion (9.18) für eine positive Energie gezeigt.
160 | 9 Eindimensionale Streuprobleme
9.2.1 Streuzustände Die allgemeine Lösung der stationären Schrödinger-Gleichung für ein Teilchen im Potenzialtopf (9.16) können wir wieder aus den bekannten Lösungen in den Gebie ten konstanten Potenzials konstruieren, indem wir die Wellenfunktion der Teilgebiete und ihre erste Ableitung an den Sprungstellen des Potenzials stetig fortsetzen. Führen wir wieder die Wellenzahlen k1 =
1√ 2mE , ℏ
k2 =
1 √2m(E + V0 ) ℏ
(9.17)
ein, so hat die Wellenfunktion die Gestalt Ae ik1 x + Be−ik1 x , { { { φ(x) = {Fe ik2 x + Ge−ik2 x , { { ik1 x + De −ik1 x , {Ce
x < −a |x| < a .
(9.18)
x>a
Hierbei sind die in der Wellenfunktion auftretenden Konstanten A, B, . . . durch die Anschlussbedingungen der Wellenfunktionen an den Potenzialsprüngen bestimmt. Die Anschlussbedingungen bei x = −a lauten: Ae−ik1 a + Be ik1 a = Fe−ik2 a + Ge ik2 a , ik 1 (Ae−ik1 a − Be ik1 a ) = ik 2 (Fe−ik2 a − Ge ik2 a ) . Diese Stetigkeitsbedingungen für die Wellenfunktion und ihre erste Ableitung stellen ein lineares, homogenes Gleichungssystem für die Koeffizienten dar. Führen wir die Matrix e−ikx e ikx E(k, x) = ( ikx ) ke −ke−ikx ein, so lässt sich dieses Gleichungssystem schreiben als: A F E(k 1 , −a) ( ) = E(k 2 , −a) ( ) . B G
(9.19)
Die Determinante und das Inverse der Koeffizientenmatrix E sind durch det E(k, x) = −2k , E−1 (k, x) =
1 e−ikx ( 2 e ikx
1 −ikx ke ) − 1k e ikx
gegeben. Die Matrix E ist also regulär für alle nicht verschwindenden Wellenzahlen k. Wir können deshalb Gleichung (9.19) schreiben als: F A ( ) = M(k 1 , k 2 , −a) ( ) , G B
(9.20)
9.2 Streuung am Potenzialtopf
| 161
wobei die hier auftretende Matrix M durch M(k 1 , k 2 , x) := E−1 (k 1 , x)E(k 2 , x)
(9.21)
definiert ist. Ähnlich zur oben abgeleiteten Gleichung (9.19) erhalten wir aus den An schlussbedingungen der Wellenfunktion bei x = a die Beziehung F C E(k 2 , a) ( ) = E(k 1 , a) ( ) , G D die wir wieder umformen zu: C C F ( ) = E(k 2 , a)−1 E(k 1 , a) ( ) ≡ M(k 2 , k 1 , a) ( ) . D D G
(9.22)
Durch Einsetzen dieser Beziehung in die Anschlussbedingungen bei x = −a, Glei chung (9.20), können wir die Koeffizienten F und G eliminieren und erhalten: C A ( ) = M(k 1 , k 2 , −a)M(k 2 , k 1 , +a) ( ) . D B
(9.23)
Die explizite Rechnung zeigt, dass die Matrix M (9.21) durch (1 + kk21 ) e−i(k1 −k2 )x 1 M(k 1 , k 2 , x) = ( 2 (1 − kk21 ) e i(k1 +k2 )x
(1 − (1 +
k2 −i(k1 +k2 )x k1 ) e k2 i(k1 −k2 )x k1 ) e
)
(9.24)
gegeben ist. Für das homogene Gleichungssystem (9.23) erhalten wir dann die expli zite Form C − 2i β sin(2k 2 a) [cos(2k 2 a) − 2i α sin(2k 2 a)] e i2k1 a A ( )=( )( ). i i −i2k a 1 B [cos(2k 2 a) + 2 α sin(2k 2 a)] e D 2 β sin(2k 2 a) (9.25) Hierbei haben wir folgende Abkürzungen eingeführt: α=
k 2 k 1 k 22 + k 21 + = , k1 k2 k1 k2
β=
k 2 k 1 k 22 − k 21 − = . k1 k2 k1 k2
(9.26)
Der Einfachheit halber nehmen wir nun an, dass die Teilchen von links in das Poten zialgebiet einlaufen sollen, dann können wir wieder D = 0 setzen. Das obige Glei chungssystem (9.25) vereinfacht sich dann zu: A = C (cos(2k 2 a) −
i α sin(2k2 a)) e i2k1 a , 2
i B = C β sin(2k 2 a) . 2
(9.27)
Damit ist die Wellenfunktion (9.18) bis auf eine Normierungskonstante C bekannt, sie he Abb. 9.10.
162 | 9 Eindimensionale Streuprobleme
Berechnen wir wieder die Stromdichte von einfallender, reflektierter und durch gehender Welle, so finden wir: ℏk 1 2 |A| , m ℏk 1 2 |B| , jrefl (x) = − m ℏk 1 2 jtrans (x) = |C| . m jein (x) =
Den bereits früher eingeführten Transmissionskoeffizienten können wir dann sofort aus (9.27) ablesen und erhalten: −1 j 2 α 2 trans C T = = = (1 + [( ) − 1] sin2 (2k 2 a)) = (1 + χ)−1 , jein A 2
(9.28)
wobei die hier definierte Größe χ unter Benutzung von (9.26) als χ=
(k 21 − k 22 )2 4k 21 k 22
β 2 sin2 (2k 2 a) = ( ) sin2 (2k 2 a) 2
(9.29)
geschrieben werden kann. Für E > 0 sind k 1 und k 2 reell und damit χ ≥ 0. Der Trans missionskoeffizient ist deshalb beschränkt (0 ≤ T ≤ 1). Den Reflexionskoeffizienten j B 2 refl R = = jein A formen wir um zu:
Aus (9.27) finden wir:
B 2 C 2 B 2 R = = T . C A C
(9.30)
B 2 β 2 = ( ) sin2 (2k 2 a) = χ , C 2
wobei wir die Definition (9.29) von χ benutzt haben. Mit (9.28) erhalten wir für den Reflexionskoeffizienten (9.30): χ R= . 1+χ Offenbar gilt: R+T =1. Diese Gleichung drückt wieder die Erhaltung des Teilchenstroms beim Durchlaufen des Potenzialgebietes aus.
9.2 Streuung am Potenzialtopf
| 163
9.2.2 Resonanzen Der explizite Ausdruck des Transmissionskoeffizienten (9.28) mit χ gegeben durch Gleichung (9.29), 2
k 2 − k 22 T = [1 + ( 1 ) sin2 (2k 2 a)] 2k 1 k 2
−1
,
(9.31)
zeigt, dass dieser eine oszillierende Funktion von k 2 und damit von der Energie E ist. In Abb. 9.11 ist T als Funktion der dimensionslosen Energie ε = E/V0 für verschiedene Stärken des Potenzials a γ = √2m|V0 | (9.32) ℏ dargestellt. In diesen dimensionslosen Variablen nimmt der Transmissionskoeffizient die Gestalt −1
T = [1 +
sin2 (2γ√ε + 1) ] 4ε(ε + 1)
(9.33)
an. Für schwache Potenziale γ ≪ 1 ändert sich das Argument der Sinusfunktion erst über große Energiebereiche, und die Oszillationen werden aufgrund des dämpfenden Vorfaktors [4ε(ε + 1)]−1 ausgewaschen. Für genügend starke Potenziale (γ ≫ 1) hin gegen zeigt T als Funktion von ε ausgeprägte Oszillationen.
T
1
1
0.8
0.8
0.6
T
0.4
0.4
γ=1
0.2 0
0.6 γ=8
0.2 0
1
2
3
4
0
5
0
1
2
ε
T
1
1
0.8
0.8
0.6
T
0.4
4
5
4
5
0.6 0.4
γ = 16
0.2 0
3 ε
γ = 32
0.2 0
1
2
3 ε
4
5
0
0
1
2
3 ε
Abb. 9.11: Der Transmissionskoeffizient in Abhängigkeit von der (dimensionslosen) Energie ε = E/V 0 für verschiedene Potenzialstärken γ.
164 | 9 Eindimensionale Streuprobleme Aus Gleichung (9.31) ist ersichtlich, dass für gewisse Energien E = E(R) , für die 2k 2 a = nπ ,
n∈ℤ
gilt, der Transmissionskoeffizient sein Maximum T = 1 annimmt. Drücken wir diese Bedingung durch die Wellenlänge λ aus, so finden wir für die Lage der Maxima T = 1 die Bedingung λ 2π n = 2a , λ = . (9.34) 2 k2 Der Transmissionskoeffizient wird also 1, wenn ein Vielfaches der halben Wellenlän ge gleich der Breite des Potenzialtopfes L = 2a ist. Die Energieeigenzustände, bei denen der Transmissionskoeffizient ein Maximum besitzt, werden als Resonanzen be zeichnet. Bei diesen Resonanzen verschwindet die Reflexion, und das Potenzial wird absolut durchlässig für das quantenmechanische Teilchen (T = 1). Anschaulich lässt sich das Auftreten der Resonanzen wie folgt verstehen. Die von links einlaufende ebene Welle wird am Potenzialsprung bei x = −a in ei ne weiterlaufende und eine reflektierte Welle aufgeteilt. Die weiterlaufende Welle wird am zweiten Potenzialsprung bei x = +a ebenfalls aufgespalten in eine weiterlaufende Welle, die Transmissionswelle, und eine reflektierte Welle. Das Auftreten der Resonan zen basiert auf einer destruktiven Interferenz zwischen der direkt bei x = −a reflektier ten Welle (Be −ik1 x ) und der bei x = +a reflektierten Welle (Ge−ik2 x ). Bei x = −a unter scheidet sich die dort direkt reflektierte Welle von der von x = +a zurückkommenden Welle durch die Wegdifferenz 2 ⋅ 2a um eine Phase 2 ⋅ 2ak 2 . Diese ist für die durch Gleichung (9.34) definierte Resonanz aber gerade 2πn. Außerdem unterscheiden sich diese beiden Wellen noch um eine Phase π, da die am negativen Potenzialsprung bei x = −a reflektierte Welle gegenüber der einlaufenden Welle um e iπ = −1 phasenver schoben ist, während die an der positiven Potenzialstufe bei x = +a reflektierte Welle in Phase mit der einfallenden Welle ist (siehe Kapitel 9.1). Damit besitzen die direkt (bei x = −a) reflektierte Welle und die von x = +a zurückkommende Welle bei den Resonanzenergien E(R) gerade einen Gesamtphasenunterschied von (2n + 1)π und lö schen sich somit aus. Diese destruktive Interferenz der reflektierten Wellen führt auf eine völlige Transparenz des Potenzials und ist somit verantwortlich für die Ausbil dung der Resonanzen mit T = 1. Ein analoges Phänomen wird bei Lichtwellen beobachtet, und zwar beim FabryPerot-Interferometer. Dieses besteht aus zwei sich gegenüberstehenden parallelen, halbdurchlässigen Spiegeln (Abb. 9.12) mit T ≪ 1. Licht, welches senkrecht auf einen der beiden Spiegel trifft, wird vollständig durch den Spiegel durchgelassen (T = 1), wenn der Abstand der beiden Spiegel ein Vielfaches der halben Wellenlänge des Lichtes beträgt. Dieses Phänomen tritt selbst bei Spiegeln mit Reflexivität R = 1 auf. Denn je größer die Reflexivität ist, desto größer ist auch die Zahl der interferierenden Strahlen.
9.3 Gebundene Zustände im endlichen Potenzialtopf
1
1
1
2
1
2
2
3
2
| 165
3
d = nλ/2
3
3
Abb. 9.12: Illustration der Lichtwege beim Fabry-Perot-Interferometer.
Aus dem Energiesatz im Gebiet |x| < a, E + V0 =
ℏ2 k 22 , 2m
(R)
und (9.34) folgt, dass die Energien E n , bei denen Resonanz auftritt, gerade durch die Eigenenergien des Potenzialtopfes der Breite 2a mit unendlich hohen Wänden gege ben sind: (R)
E n = −V0 +
1 nπℏ 2 ( ) . 2m 2a
9.3 Gebundene Zustände im endlichen Potenzialtopf 9.3.1 Transmissionskoeffizienten für gebundene Zustände Unsere bisherige mathematische Behandlung der Streuung an einem Potenzialtopf war sehr allgemein gehalten und nicht auf positive E > 0 beschränkt. Wir können deshalb untersuchen, wie sich der Transmissionskoeffizient verhält, wenn wir Ener gien im Potenzialtopf −V0 < E < 0 betrachten. In diesem Bereich kann der Transmissionskoeffizient, wie er eingeführt wurde – als das Verhältnis von durchgehendem Strom zum einfallenden Strom – kei ne direkte physikalische Bedeutung besitzen, da für Energien E < 0 kein Teilchen fluss stattfindet. Nichtsdestotrotz macht es Sinn, die analytischen Eigenschaften des Transmissionskoeffizienten in diesem Energiebereich zu untersuchen. Für Energien im Bereich −V0 < E < 0 bleibt die Wellenzahl k 2 reell, während die Wellenzahl k 1 rein imaginär wird: 1 k 1 = √2mE = iκ . (9.35) ℏ
166 | 9 Eindimensionale Streuprobleme
Setzen wir den Transmissionskoeffizienten (9.31) zu rein imaginären k 1 -Werten fort, so finden wir: −1 2 κ 2 + k 22 2 ) sin (2k 2 a)] . T = [1 − ( 2κk 2 Der Transmissionskoeffizient hat offenbar Pole, falls κ 2 + k 22 sin(2k 2 a) = ±1 2κk 2
(9.36)
erfüllt ist. Wie wir im Folgenden zeigen werden, wird diese Bedingung gerade an den Energien der gebundenen stationären Zustände im Potenzialtopf erfüllt. In Abb. 9.13 ist der Transmissionskoeffizient als Funktion der dimensionslosen Energie ε = E/V0 für ein Potenzial der Stärke (9.32) γ = 2 dargestellt. Das Potenzial besitzt für −V0 < E < 0 gebundene Zustände, bei denen der Transmissionskoeffizient divergiert. ε1
ε2
2 1.5 1 0.5 T
0 −0.5
γ=2
−1 −1.5 −2 −1 −0.5
0
0.5
1 ε
1.5
2
2.5
3
Abb. 9.13: Der Transmissionskoeffizient als Funktion der (dimensionslosen) Energie ε = E/V 0 bei Anwesenheit von gebundenen Zuständen. In der Abbildung sind zwei gebun dene Zustände bei den Energien ε1 und ε2 vorhanden.
9.3.2 Die gebundenen Zustände des endlichen Potenzialtopfes Zur Bestimmung der Energieeigenzustände des endlichen Potenzialtopfes können wir auf unsere früheren, die Wellenfunktion betreffenden Überlegungen zurückgreifen. Die Form der Wellenfunktion und die Anschlussbedingungen an den beiden Potenzi alsprüngen bei x = ±a bleiben richtig, wenn wir die Wellenzahl k 1 für |x| > a gemäß Gleichung (9.35) zu rein imaginären Werten fortsetzen. Die allgemeine Form der Wel lenfunktionen war in Gleichung (9.18) gegeben. Aus den Anschlussbedingungen an die Wellenfunktion und ihre erste Ableitung hatten wir die Beziehungen (9.27) A = C (cos(2k 2 a) − i B = Ci
β sin(2k 2 a) 2
α sin(2k 2 a)) e i2k1 a , 2
(9.37) (9.38)
9.3 Gebundene Zustände im endlichen Potenzialtopf
| 167
gewonnen, wobei die hier auftretenden Größen α und β für k 1 = iκ durch (9.26) α=
k2 κ k2 k1 + = −i ( − ) , k1 k2 κ k2
β=
k2 k1 k2 κ − = −i ( + ) k1 k2 κ k2
(9.39)
gegeben sind. Für gebundene Zustände E < 0 muss die Wellenfunktion für |x| → ∞ exponenti ell abklingen. Mit der analytischen Fortsetzung der Wellenzahl k 1 (Gleichung (9.35)) wird aus der früher für E > 0 einfallenden Welle Ae ik1 x eine für x → −∞ exponentiell ansteigende Funktion, während reflektierte „Welle“ Be κx und durchgehende „Welle“ Ce−κx für x → −∞ bzw. x → ∞ exponentiell abklingen. Da die Wellenfunktion ei nes gebundenen Zustandes normierbar sein muss, muss offenbar der Koeffizient A für gebundene Zustände verschwinden. Für A = 0 (und C ≠ 0) divergiert aber der Transmissionskoeffizient (9.28). Setzen wir A = 0 in Gleichung (9.37), so finden wir die Bedingung α cos(2k2 a) = i sin(2k 2 a) . (9.40) 2 In Kürze werden wir sehen, dass jede Lösung dieser Gleichung auch tatsächlich die Polbedingung (9.36) erfüllt. Die Polbedingung (9.36) ist etwas weniger restriktiv als Gleichung (9.40), da sie im Gegensatz zu (9.40) auch unphysikalische Lösungen zu den Energien der Bindungszustände besitzt, die auf exponentiell anwachsende (d. h. nicht normierbare) Wellenfunktionen führen (siehe Gleichung (9.44)). Bei der Diskussion der allgemeinen Eigenschaft der Schrödinger-Gleichung hat ten wir u. a. festgestellt, dass für symmetrische Potenziale (siehe Abschnitt 8.4) V(−x) = V(x) die Wellenfunktion entweder gerade oder ungerade sein muss: φ(−x) = ±φ(x) . Aus dem früher angegebenen Ausdruck (9.18) für die Wellenfunktion mit A = D = 0 ist ersichtlich, dass diese nur dann gerade bzw. ungerade sein kann, wenn B = ±C gilt. Setzen wir diese Bedingung in Gleichung (9.38) ein, so finden wir: i
β sin(2k 2 a) = ±1 . 2
(9.41)
Mit dem expliziten Wert von β (9.39) ist dies gerade die Polbedingung (9.36) des Trans missionskoeffizienten. Das positive (negative) Vorzeichen in der Polbedingung gehört deshalb zu den Zuständen positiver (negativer) Parität. Wie wir gerade gezeigt haben, ist die Polbedingung (9.36) bzw. (9.41) wegen B = ±C äquivalent zur Anschlussbedingung (9.38). Ferner haben wir oben gesehen, dass die
168 | 9 Eindimensionale Streuprobleme zweite Anschlussbedingung (9.37) sich für gebundene Zustände (A = 0) auf Glei chung (9.40) reduziert. Zur Bestimmung der Energieniveaus im endlichen Potenzial topf haben wir deshalb (neben der Polbedingung) noch Gleichung (9.40) zu lösen. Dazu benutzen wir die Additionstheoreme der Winkelfunktionen sin(2x) = 2 sin x cos x ,
cos(2x) = cos2 x − sin2 x
und schreiben diese Gleichung als: cos2 (k 2 a) − sin2 (k 2 a) = iα sin(k 2 a) cos(k 2 a) . Dividieren wir diese Gleichung durch sin(k 2 a) cos(k 2 a), so erhält sie die Gestalt κ 1 k2 − tan(k 2 a) = iα = − , tan(k 2 a) κ k2 wobei wir für α den expliziten Wert (9.39) eingesetzt haben. Diese Gleichung besitzt zwei Lösungen (genauer: Lösungsäste bzw. Dispersionsbeziehungen): κ , k2 k2 tan(k 2 a) = − . κ
tan(k 2 a) =
(9.42) (9.43)
Man überzeugt sich leicht, dass jede Lösung dieser Gleichung auch der Polbedin gung (9.36) genügt. Dazu formen wir Letztere um zu: (
κ k2 + ) sin k 2 a cos k 2 a = ±(sin2 k 2 a + cos2 k 2 a) k2 κ k2 1 κ + = ± (tan k 2 a + ) . ⇒ k2 κ tan k 2 a
Diese Gleichung hat offensichtlich die Lösungen tan(k 2 a) = ±
κ , k2
tan(k 2 a) = ±
k2 , κ
(9.44)
welche insbesondere die obigen Lösungen (9.42), (9.43) der Gleichung (9.40) (A = 0) beinhalten. Die beiden übrigen Lösungen folgen aus (9.42) und (9.43) durch die Erset zung κ → (−κ) und sind unphysikalisch, da sie auf nicht normierbare Wellenfunktio nen führen. Damit haben wir gezeigt: Der Transmissionskoeffizient besitzt Pole bei den Energien der gebundenen Zu stände. Dies ist eine allgemeine Eigenschaft, die nicht auf den rechteckigen Potenzialtopf be schränkt ist.
9.3 Gebundene Zustände im endlichen Potenzialtopf
169
|
Wie oben gezeigt, gehört das positive (negative) Vorzeichen in der Polbedin gung (9.36) bzw. in den Gleichungen (9.44) zu den Zuständen positiver (negativer) Parität. Damit liefern die Lösungen von Gleichungen (9.42) bzw. (9.43) Zustände mit positiver bzw. negativer Parität. Die Bestimmungsgleichungen (9.42) und (9.43) für die gebundenen Zustände sind transzendente Gleichungen, die sich nicht analytisch lösen lassen. Zur grafischen Lö sung dieser beiden Gleichungen führen wir die dimensionslosen Größen ξ : = k2 a ,
η : = κa
(9.45)
ein. Benutzen wir die Definition der Wellenzahlen, so finden wir, dass die Größe ξ 2 + η 2 = a2 (
2m 2m 2m|V0 |a2 (V − |E|) + |E|) = = γ2 0 ℏ2 ℏ2 ℏ2
(9.46)
unabhängig von der Energie ist und mit der dimensionslosen Potenzialstärke γ2 (9.32) zusammenfällt. Aus diesem Grunde formen wir die beiden Dispersionsbezie hungen (9.42) und (9.43) wie folgt um: Gleichung (9.42) lautet in den Variablen (9.45): tan ξ =
η ξ
bzw.
ξ sin ξ = η cos ξ .
(9.47)
Quadrieren dieser Gleichung liefert mit sin2 ξ = 1 − cos2 ξ : ξ 2 (1 − cos2 ξ) = η2 cos2 ξ und mit dem Ausdruck (9.46) für γ2 ξ 2 = γ2 cos2 ξ , woraus wir für den ersten Lösungsast die Bedingung ± cos ξ =
ξ γ
(9.48)
erhalten. Durch das obige Quadrieren der Gleichung geht Information über das Vorzei chen verloren. Aus der ursprünglichen (unquadrierten) Gleichung (9.47) folgt wegen ξ, η > 0: tan ξ > 0 , (9.49) was wir als zusätzliche Bedingung an die Lösungen von (9.48) stellen müssen. Die Lösungen der Gleichung (9.48), die der Nebenbedingung (9.49) genügen, definieren als Lösungen von (9.42) die Energien der positiven Paritätszustände. In ähnlicher Weise formen wir die Gleichung (9.43) um zu: ± sin ξ =
ξ , γ
tan ξ < 0 .
(9.50)
Die Lösungen dieser Gleichung definieren die Energien der negativen Paritätszustän de. Die grafische Lösung von Gleichung (9.48) und (9.50) ist in der Abb. 9.14 dargestellt.
170 | 9 Eindimensionale Streuprobleme
cos ξ
sin ξ
•
− cos ξ
◦
− sin ξ
◦
•
ξ/γ
◦
•
ξ
Abb. 9.14: Grafische Lösung der Dispersionsbeziehungen (9.48), (9.50). Die durch einen fetten Punkt bzw. einen Kreis markierten Schnittpunkte gehören zu den stationären Lösungen positiver Parität (9.48) bzw. negativer Parität (9.50). Man beachte, dass nicht sämtliche Schnittpunkte der für Lösungen erforderlichen Nebenbedingung tan ξ ≷ 0 genügen.
Es gibt immer mindestens einen gebundenen Zustand mit positiver Parität. Je größer γ ist, desto stärker ist das Potenzial und desto mehr gebundene Zustände gibt es. Für V0 → ∞, d. h. γ → ∞, fällt die Gerade ξ/γ mit der ξ -Achse zusammen, die die Funk tionen ± cos ξ und ± sin ξ an ihren Nullstellen (n + 12 )π bzw. nπ schneidet. Die diesen Nullstellen entsprechenden Energien (ℏk 2 )2 (ℏξ)2 = 2m 2ma2 sind gerade die Eigenenergien (8.17) des Potenzialtopfes der Breite L = 2a mit unend lich hohen Potenzialwänden, was natürlich zu erwarten war. Für spätere Betrachtungen wollen wir schließlich noch untersuchen, für welche Potenzialstärken γ (9.32) der rechteckige Potenzialtopf einen (quasi)„gebundenen“ Zustand mit der Energie E = 0 besitzt. Für E → −0 lauten die Wellenzahlen (9.17), (9.35): √2mV0 k2 = , κ=0. ℏ Ferner gilt dann: ak 2 = γ , d. h. ξ = γ und die Bestimmungsgleichungen (9.42) bzw. (9.43) für die gebundenen Zustände po sitiver bzw. negativer Parität reduzieren sich auf: tan γ = 0
bzw.
tan γ = −∞ .
Folglich treten „Bindungszustände“ bei der Energie E = 0 mit positiver Parität für γ = nπ und mit negativer Parität für γ = (2n + 1)
(9.51) π 2
(9.52)
9.4 Die Potenzialbarriere
| 171
auf. Da γ ≥ 0 (siehe Gleichung (9.32)), folgt n ≥ 0. Für n = 0 in (9.51) verschwindet das Potenzial (γ = 0), und der Zustand mit E = 0 ist der Beginn des positiven Ener giekontinuums von ungebundenen Zuständen mit E ≥ 0. Der durch Gleichung (9.52) mit n = 0 gegebene E = 0-Zustand negativer Parität ist der erste angeregte Zustand des betreffenden Potenzials (der Stärke γ = π/2). Für γ = π/2 schneidet die Gerade ξ/γ in Abb. 9.14 die Kurve sin ξ bei ξ = π/2. Wie aus dieser Abbildung ersichtlich, gibt es dann noch einen tiefer liegenden gebundenen Zustand positiver Parität mit E < 0, der dem Schnittpunkt der Geraden ξ/(π/2) mit der Kurve cos ξ entspricht und folglich durch die Lösung der Gleichung 2 cos ξ = ξ π gegeben ist. Der Grundzustand eines spiegelsymmetrischen Potenzials besitzt immer positive Parität. Falls Gleichung (9.52) für n > 0 erfüllt ist, so gibt es neben dem quasigebunde nen Zustand E = 0 noch (2n + 1) gebundene Zustände, von denen (n + 1) Zustände positive und n Zustände negative Parität besitzen. (Die positiven und negativen Pa ritätszustände treten in alternierender Folge auf.) Dies ist unmittelbar aus Abb. 9.14 ersichtlich, wenn man beachtet, dass die Gerade ξ ξ ≡ γ (2n + 1) π2
(9.53)
die Funktion sin ξ für gerades n bzw. die Funktion − sin ξ für ungerades n bei ξ = (2n + 1)π/2 schneidet und somit für diesen ξ -Wert Gleichung (9.50) erfüllt ist. Die Gerade (9.53) besitzt dann noch (n + 1) Schnittpunkte mit den Funktionen ± cos ξ bzw. n Schnittpunkte mit den Funktionen ± sin ξ bei ξ < (2n + 1)π/2, die zu den gebundenen Zuständen positiver bzw. negativer Parität gehören.
9.4 Die Potenzialbarriere Unsere bisherigen Betrachtungen in diesem Kapitel waren so allgemein gehalten, dass sie auch für negative V0 gelten. Ersetzen wir im Potenzial (9.16) V0 durch (−V0 ), V0 > 0, so geht der Potenzialtopf in eine Potenzialbarriere über. Alle oben abgeleiteten Resultate, insbesondere die Ausdrücke für Transmissions- und Refle xionskoeffizienten, bleiben dabei gültig. Durch die Ersetzung V0 → (−V0 ) wird aus der Wellenzahl k 2 (9.17): 1 k 2 = √2m(E − V0 ) , ℏ während sich die Wellenzahl im Gebiet verschwindenden Potenzials k 1 natürlich nicht ändert. Mit dieser Ersetzung von k 2 bleibt der Ausdruck (9.31) für den Transmis sionskoeffizienten gültig. In den dimensionslosen Variablen ε=
E , V0
γ=
a √2mV0 ℏ
(9.54)
172 | 9 Eindimensionale Streuprobleme
lautet er (vgl. Gleichung (9.33)) −1
T = [1 +
sin2 2γ√ε − 1 ] 4ε(ε − 1)
.
(9.55)
Für E > V0 ist k 2 reell, und wir werden nichts prinzipiell Neues gegenüber der oben be handelten Streuung am Potenzialtopf erhalten: Eine von links einfallende Welle wird an den beiden Potenzialsprüngen bei x = ∓a in jeweils eine durchgehende und ei ne reflektierte Welle aufgespalten, siehe Abb. 9.15. Das Transmissionsverhalten wird wieder durch das Interferenzverhalten von der bei x = −a und x = +a reflektierten Welle bestimmt. Wenn die Potenzialbreite ein Vielfaches der halben Wellenlänge λ/2 ist, kommt es wieder zur Ausbildung von Resonanzen, bei denen das Potenzial völlig durchlässig wird (T = 1). Die Resonanzen treten wieder bei den Energieeigenwerten des unendlich hohen Potenzialtopfes (über V0 > 0 aufgetragen) auf: (R)
E n = V0 +
1 nπℏ 2 ( ) . 2m 2a
Reϕ(x) Imϕ(x)
V0
−a
a
x
|ϕ(x)|2
V0
−a
a
x
Abb. 9.15: Real- und Imaginärteil (oben) und Betragsquadrat (unten) der Wellen funktion bei Streuung an einer recht eckigen Potenzialbarriere mit Energie E > V0 .
9.4 Die Potenzialbarriere
| 173
9.4.1 Quantentunnelung durch die Potenzialbarriere Ein qualitativ neues Quantenphänomen tritt für 0 < E < V0 auf. In diesem Energiebe reich wird der Wellenvektor k 2 rein imaginär: k 2 = iκ ,
κ=
1 √2m(V0 − E) . ℏ
Ein klassisches Teilchen würde für E < V0 an der Potenzialbarriere vollständig reflek tiert werden. Bei der quantenmechanischen Behandlung der Potenzialstufe haben wir jedoch schon beobachtet, dass die Wellenfunktion im klassisch verbotenen Bereich des Potenzials nicht verschwindet, sondern exponentiell abklingt. Ein quantenme chanisches Teilchen kann also bis zu einer gewissen Tiefe d in die Barriere eindringen; diese Tiefe ist aufgrund der Unschärferelation durch d∼
1 ℏ = κ √2m(V0 − E)
gegeben. Ist die Potenzialbarriere schmaler als die Eindringtiefe d des Teilchens, 2a < d, so müssen wir erwarten, dass das Teilchen zumindest mit einer gewissen Wahrscheinlichkeit die Potenzialbarriere durchdringen kann, dass es also die Poten zialbarriere durchtunnelt. Da für E < V0 die Wellenzahl k 2 rein imaginär ist, muss die Wellenfunktion im Bereich der Barriere exponentiell abklingen oder ansteigen (Abb. 9.16, siehe auch Ab V0 Reϕ(x) Imϕ(x)
x
|ϕ(x)|2
V0
x
Abb. 9.16: (oben) Real- und Imaginärteil der Wel lenfunktion bei Streuung an einer rechteckigen Potenzialbarriere mit Energie E < V 0 . (unten) Auf enthaltswahrscheinlichkeit für einen von links auf die rechteckige Potenzialbarriere treffenden Teil chenstrom. Der konstante Tunnelstrom rechts von der Barriere ist exponentiell klein und damit in der maßstabsgetreuen Abbildung nicht sichtbar.
174 | 9 Eindimensionale Streuprobleme schnitt 9.2.2). Ersetzen wir k 2 = iκ im Ausdruck für den Transmissionskoeffizien ten (9.31) und berücksichtigen sin(ix) = i sinh x , so finden wir: 2
k1 2 + κ2 T = [1 + ( ) sinh2 (2κa)] 2k 1 κ
−1
.
(9.56)
Drücken wir wieder T durch die dimensionslosen Variablen ε, γ (9.54) aus. Für ε < 1 erhalten wir aus (9.55) −1
T = [1 +
sinh2 2γ√1 − ε ] 4ε(1 − ε)
.
(9.57)
Da der Transmissionskoeffizient auch für E < V0 (ε < 1) von null verschieden ist, findet eine klassisch nicht erlaubte Transmission statt, die als Quantentunnelung oder Tunneleffekt bezeichnet wird. Abb. 9.17 zeigt den Transmissionskoeffizienten als Funktion der dimensionslo sen Energie ε = E/V0 für zwei verschiedene Potenzialstärken. Man beachte, dass der Transmissionskoeffizient beim Übergang vom klassisch verbotenen (E < V0 ) zum klassisch erlaubten (E > V0 ) Bereich stetig ist. Offenbar ist T ≤ 1, wobei T = 1 (für ε < 1) nur bei verschwindender Potenzialbar riere (γ → 0) erreicht wird (siehe (9.57)). Für γ ≠ 0 erreicht der Transmissionskoeffizi ent der Tunnelung sein Maximum für ε → 1, d. h. für E → V0 . Wegen sinh x =1 x→0 x lim
erhalten wir: T (E = V0 ) = [1 + γ2 ]−1 . 1
1
0.8
0.8
T R
0.6 0.4
0.6
γ=1
0.4
0.2 0
T R γ=2
0.2 0
1
2
3 ε
4
5
0
0
1
2
3
4
ε
Abb. 9.17: Transmissions- und Reflexionskoeffizient für die rechteckige Potenzialbarriere der Hö he V 0 und Breite 2a als Funktion der (dimensionslosen) Energie ε = E/V 0 für verschiedene Stärken des Potenzials γ = a√2mV 0 /ℏ.
5
9.4 Die Potenzialbarriere
| 175
Das Teilchen durchtunnelt die Potenzialbarriere. Dieser Tunneleffekt ist ein typischer Welleneffekt, der bei korpuskularen Teilchen nicht auftreten kann und ein Analogon bei den Lichtwellen besitzt, die frustrierte innere Totalreflexion: Ein Lichtstrahl fällt senkrecht auf eine Prismenkathete, sodass er an der Innen fläche der Hypothenuse total reflektiert wird (Abb. 9.18(a)). Aus der Elektrodynamik wissen wir jedoch, dass das elektromagnetische Feld der Lichtwelle außerhalb des Prismas nicht identisch null ist, sondern exponentiell abklingt. Die Eindringtiefe die ses Feldes in das Vakuum (bzw. in die Luft) ist etwa von der Ordnung der Wellenlänge λ des Lichtes. Wenn ein zweites Prisma in einem kleinen Abstand d vom ersten Prisma entfernt angebracht wird, so ist das elektrische Feld am zweiten Prisma noch nicht auf null abgeklungen, sondern besitzt eine endliche Amplitude, mit der sich die Wel le dann im zweiten Prisma ausbreitet (Abb. 9.18(b)). Auf diese Weise erfolgt partielle Transmission des Lichtes durch den Spalt zwischen den Prismen, obwohl aufgrund der Strahlgeometrie totale Reflexion erfolgen sollte. Diese Erscheinung wird als frus trierte (oder behinderte) innere Totalreflexion bezeichnet. Für d < λ kann die Welle fast ungehindert den Luftspalt passieren.
(a)
(b)
d
Abb. 9.18: (a) Totale innere Reflexion in einem Prisma, (b) frustrierte innere Totalreflexion für λ < d.
9.4.2 Interpretation der Quantentunnelung mittels der Unschärferelation Anschaulich lässt sich das Durchtunneln des Teilchens durch die Barriere wie folgt verstehen: Neben der Unschärferelation zwischen Ort und Impuls, ∆x ∆p ≳ ℏ (siehe Gleichung (2.6)), gibt es eine ähnliche Unschärferelation zwischen Zeit und Energie, ∆t ∆E ≳ ℏ, wie wir in Abschnitt 11.4 streng zeigen werden. Danach treten Fluktua tionen in der Energie eines Teilchens von der Größe ∆E in Zeitskalen der Ordnung ∆t ≃ ℏ/∆E auf. Eine genügend starke Fluktuation in der Energie mit E+∆E > V0 erlaubt dem Teilchen, die Barriere zu überqueren, vorausgesetzt das Zeitintervall ∆t ist groß genug, sodass das Teilchen die Barriere in dieser Zeit überfliegen kann. Deshalb darf die Barriere nicht zu breit sein, damit substanzielle Tunnelung auftreten kann. Wäh rend also die Breite der Barriere eine genügend lange Zeitperiode ∆t verlangt, erfordert die Höhe der Barriere eine genügend große Energiefluktuation ∆E, damit das Teilchen die Barriere überwinden kann. Wegen des Unschärfeprinzips können aber ∆E und ∆t nicht beliebig groß gewählt werden. Entscheidend für die Tunnelwahrscheinlichkeit ist damit das Produkt aus Breite und Höhe der Barriere.
176 | 9 Eindimensionale Streuprobleme
Die Tunnelung des Teilchens durch die Barriere muss mit einem Teilchenstrom verbunden sein. Nach Gleichung (9.18) ist die Wellenfunktion unterhalb der Barriere durch einen exponentiell ansteigenden und einen exponentiell abfallenden Ast ge geben. Damit ein Teilchenfluss durch die Barriere strömt, muss die Ortsabhängigkeit der Wellenfunktion komplex sein. Für D = 0 (kein von rechts eintreffendes Teilchen) erhält man aus Gleichung (9.22) mit Gleichung (9.24) nach elementarer Rechnung für die Wellenfunktion im Gebiet der Barriere (k 2 = iκ): φ2 (x) =
1 ik1 a k1 k1 [(1 − i ) e κ(a−x) + (1 + i ) e−κ(a−x)] . Ce 2 κ κ
(9.58)
Die Wellenfunktion ist in der Tat wesentlich komplex, und zwar gerade durch die An wesenheit des exponentiell ansteigenden Terms (∼ e κx ). Wäre dieser exponentiell an steigende Teil nicht vorhanden, so enthielte die Wellenfunktion nur eine irrelevante komplexe Konstante, und die Stromdichte würde verschwinden. Für die früher be trachtete Potenzialstufe mussten wir den exponentiell ansteigenden Zweig ausschlie ßen, da dieser zur Divergenz der Wellenfunktion für x → ∞ führte. Die Potenzialbar riere hat hingegen eine endliche Breite, sodass der exponentiell ansteigende Ast nicht zur Divergenz führen kann. Der exponentiell ansteigende Ast ist hier erforderlich, da mit die beiden vorgegebenen Randbedingungen an die Wellenfunktion und ihre erste Ableitung erfüllt werden können. Die Randbedingungen aber garantieren gerade, wie wir bei ihrer Herleitung gesehen haben, dass der Teilchenstrom an dem Potenzial sprung erhalten bleibt. In der Tat überprüft man leicht mit den oben gegebenen Aus drücken, dass der von der Wellenfunktion φ2 (Gleichung (9.58)) unterhalb der Barriere beschriebene Teilchenstrom derselbe ist wie der Strom rechts von der Barriere. Der oben behandelte Tunneleffekt ist die Ursache für eine Reihe von interessanten Phänomenen wie den radioaktiven α-Zerfall oder die Kernspaltung. Auch die Ausbil dung von Energiebändern der Elektronen im Festkörper, die in Kapitel 13 behandelt wird, beruht auf dem Tunneleffekt. Ferner stellt der Tunneleffekt die Grundlage für eine Reihe wichtiger technologischer Anwendungen dar wie z. B. der feldinduzierten Emission von Elektronen aus Metallen, welche in der Elektronenmikroskopie benutzt wird.
9.4.3 Große Potenzialbarrieren In vielen praktischen Anwendungen sind die Potenzialbarrieren groß, sodass die Transmission klein ist. Für genügend breite Barrieren ist die charakteristische Wel lenlänge λ sehr klein gegenüber der Breite der Barriere, d. h. aκ ≫ 1. Wir können dann die „1“ im Ausdruck für den Transmissionskoeffizienten (9.56) gegenüber dem Term ∼ sinh2 (κa) vernachlässigen. Ferner brauchen wir für aκ ≫ 1 nur den positiven Exponenten der sinh-Funktion zu behalten, d. h. sinh x ≃ e x /2. Der Ausdruck für den
9.4 Die Potenzialbarriere
| 177
Transmissionskoeffizienten reduziert sich dann auf: 2
T = 4(
2k 1 κ ) e−4κa . k 21 + κ 2
Drücken wir hier wieder die Wellenzahlen k 1 und κ durch die Energie E und Höhe der Potenzialbarriere V0 aus, so erhalten wir: T=4
4E(V0 − E) a exp (−4 √2m(V0 − E)) . 2 ℏ V0
Ziehen wir den Vorfaktor mit in den Exponenten, 16E(V0 − E) a T = exp [−4 √2m(V0 − E) + ln ( )] , ℏ V02 so erkennen wir, dass dieser für hohe Potenziale, d. h. große V0 , klein gegenüber dem ersten Term ist und deshalb in vielen Anwendungen vernachlässigt werden kann. Für genügend hohe und breite Potenziale finden wir also für den Transmissionskoeffizi enten: ̄ a 2|p|L T = exp (−4√2m(V0 − E) ) ≡ exp (− ) . (9.59) ℏ ℏ Dabei ist L = 2a die Breite der rechteckigen Potenzialbarriere und p̄ der zu imaginären Werten fortgesetzte „klassische“ Impuls: p = i p̄ ,
p̄ = ±√2m(V0 − E) .
9.4.4 Kontinuierliche Potenzialberge In realistischen Anwendungen des Tunneleffektes hat man es i. A. nicht mit einer stu fenförmigen Potenzialbarriere, sondern mit glatten Potenzialformen zu tun. Wir kön nen diese jedoch stets durch eine Summe von rechteckigen Potenzialstufen beliebig genau approximieren, in derselben Weise wie man ein Riemann-Integral numerisch auswertet (Abb. 9.19). Die Gesamttunnelwahrscheinlichkeit lässt sich dann genähert durch Multiplika tion der Tunnelwahrscheinlichkeiten für den Durchgang durch die infinitesimalen Po tenzialstufen berechnen, vorausgesetzt, die einzelnen Tunnelwahrscheinlichkeiten sind hinreichend klein, sodass wenig Reflexion der durchtunnelnden Welle im Inne ren des Potenzials erfolgt. In der Tat lässt sich von der expliziten Form der Wellen funktion im Tunnelgebiet (9.58) ablesen, dass die vorwärts- und rückwärtslaufenden Wellen einen Amplitudenfaktor e κa bzw. e−κa enthalten. Damit ist die Amplitude der reflektierten Welle gegenüber der Amplitude der durchgehenden Welle exponentiell unterdrückt, und wir können die Reflexion vernachlässigen. Multiplikation der Tun
178 | 9 Eindimensionale Streuprobleme V (x)
E
x −V (x) xa
xb x
−E
Abb. 9.19: (a) Approximation eines kontinuierlichen Potenzials durch eine Folge von diskreten Potenzialbarrieren. (b) Umgeklapptes Potenzial (−V(x)), in welchem das ursprünglich in V(x) für die Energie E klassisch verbotene Gebiet zum klassisch erlaubten Gebiet für ein Teilchen mit der Energie (−E) wird.
nelwahrscheinlichkeiten der N infinitesimalen Barrieren mit Breite ε liefert: N
N
T ≃ ∏ T i (ε) = ∏ exp (− i=1
i=1
2ε √2m(V(x i ) − E)) ℏ
N
2ε √2m(V(x i ) − E)) . ℏ i=1
= exp (− ∑
Wir haben hier das Symbol „≃“ anstatt „=“ benutzt um darauf hinzuweisen, dass dieser Ausdruck aufgrund der Vernachlässigung der Reflexion nur genähert gilt. Im Limes N → ∞ (ε → 0) wird aus dem Exponenten ein Riemann-Integral über die Tra jektorie des Teilchens im umgeklappten Potenzial: xb
xb
xa
xa
2 2 ̄ T ≃ exp (− ∫ dx √2m(V(x) − E)) ≡ exp (− ∫ dx |p(x)|) . ℏ ℏ
(9.60)
Hierbei ist ̄ p(x) = ±√2m(V(x) − E)
(9.61)
̄ der zu imaginären Werten fortgesetzte „klassische“ Impuls (p(x) = i p(x)). Ferner be zeichnen x a und x b (x b > x a ) die klassischen Umkehrpunkte eines Teilchens, das sich mit der Energie (−E) im umgeklappten Potenzial (−V(x)) bewegt (siehe Abb. 9.19(b)). ̄ Interpretieren wir ±p(x) (9.61) als den vorzeichenbehafteten Impuls der klassi schen Bewegung in diesem umgeklappten Potenzial, so können wir den Exponenten in (9.60) als Phasenraumintegral entlang der zugehörigen geschlossenen Trajektorie
9.4 Die Potenzialbarriere |
179
schreiben, xb
̄ ̄ = ∮ dx p(x) , 2 ∫ dx |p(x)| xa
und erhalten für den Transmissionskoeffizienten einer kontinuierlichen Potenzialbar riere: 1 ̄ T ≃ exp (− ∮ dx p(x)) . ℏ
(9.62)
Der Transmissionskoeffizient ist damit durch das Phasenraumintegral für eine „klas sische“ Bewegung unterhalb der Potenzialbarriere gegeben.⁵ Wir betonen hier jedoch, dass in der klassischen Mechanik eine solche Bewegung nicht stattfinden kann. Wie wir später sehen werden, lässt sich dieses Resultat durch semiklassische Betrachtungsweisen mathematisch strenger begründen. Die Formel (9.60) wurde un ter Benutzung des genäherten Ausdruckes (9.59) für den Transmissionskoeffizienten abgeleitet. Dieser genäherte Ausdruck galt jedoch nur für Wellenlängen, die klein gegenüber der Breite der Potenzialbarriere sind (λ ≪ a). Sehr breite Potenzialbar rieren wiederum implizieren eine kleine Tunnelwahrscheinlichkeit, was gerade die Voraussetzung für die Ableitung der Formel (9.60) war. Schließlich bedeutet eine kleine Wellenlänge eine große Wellenzahl k = 2π/λ und Teilchen mit großen Wel lenzahlen verhalten sich quasiklassisch. Wir erwarten deshalb, dass der Ausdruck für die Tunnelwahrscheinlichkeit (9.60) für eine quasiklassische Bewegung gültig ist, was wir im Folgenden zeigen.
9.4.5 Allgemeine Form des Transmissionskoeffizienten Bei unseren früheren Überlegungen hatten wir den Transmissionskoeffizienten für einen rechteckigen Potenzialtopf(-barriere) eingeführt als das Verhältnis von (durch das Potenzialgebiet) durchgehendem Teilchenstrom jtrans zum (in das Potenzialge biet) einfallenden Teilchenstrom jein (siehe Gleichung (9.11)): T=
jtrans . jein
Vor und nach dem Potenzialgebiet bewegen sich die Teilchen frei. Für eine freie Be wegung mit Wellenzahl k hat die Wellenfunktion die Gestalt φ(x) = Ae ikx , und der zugehörige Teilchenstrom lautet: j(x) = ℏk|A|2 .
(9.63)
5 Diese Bewegung lässt sich auch als eine „klassisch erlaubte“ Bewegung im umgeklappten Potenzial (−V(x)) interpretieren.
180 | 9 Eindimensionale Streuprobleme Hierbei ist |A|2 die Aufenthaltswahrscheinlichkeit. Für den Transmissionskoeffizien ten finden wir aus (9.63): |Atrans |2 , (9.64) T= |Aein |2 wobei Aein bzw. Atrans die Amplituden der einfallenden bzw. durchgehenden Welle sind. (Die Teilchen besitzen vor und nach Durchlaufen des Potenzialgebietes diesel be Wellenzahl und somit dieselbe Energie.) Der Transmissionskoeffizient (9.64) ist of fenbar das Verhältnis der Aufenthaltswahrscheinlichkeiten der Teilchen vor und nach dem Durchlaufen des Potenzialgebietes. Allgemein ist die Aufenthaltswahrscheinlich keit eines Teilchens am Ort x für eine stationäre Bewegung, d. h. bei konstanter En ergie, durch das Betragsquadrat der stationären Wellenfunktion |φ(x)|2 gegeben. In Analogie zu (9.64) können wir deshalb den Transmissionskoeffizienten für das Durch laufen eines beliebigen Potenzialgebietes von x a nach x b durch ein Teilchen mit der Energie E durch φ(x ) 2 b T = (9.65) φ(x a ) definieren. Hierbei ist φ(x) die Lösung der stationären Schrödinger-Gleichung zur vor gegebenen Energie E. Um analytische Aussagen über den Transmissionskoeffizienten (9.65) für beliebi ge Potenziale zu gewinnen, benutzen wir für die stationäre Wellenfunktion die quasi klassische Näherung (5.28) x
i φ(x) = φ(x0 ) exp ( ∫ dx p(x )) . ℏ x0
Hierbei ist p(x) = √2m(E − V(x)) der Impuls entlang der klassischen Trajektorie mit Energie E, die zwischen den Koor dinaten x0 und x verläuft. Nach Gleichung (9.65) erhalten wir die Tunnelwahrschein lichkeit eines Teilchens mit gegebener Energie E durch eine Potenzialbarriere, wenn wir für x a und x b die durch V(x a,b ) = E definierten klassischen Umkehrpunkte setzen, Abb. 9.20. Die „klassische Trajektorie“, welche die beiden Umkehrpunkte x a und x b ver bindet, verläuft im klassisch verbotenen Bereich unterhalb der Potenzialbarriere (E < V(x)), wo der Impuls rein imaginär ist: p = i p̄ ,
̄ p(x) = √2m(V(x) − E) .
Für die Wellenfunktion erhalten wir deshalb (x b > x a ): xb
1 ̄ φ(x b ) = φ(x a ) exp (− ∫ dx p(x)) ℏ xa
9.5 Pfadintegralberechnung des Transmissionskoeffizienten
| 181
V (x)
E x xb
xa
Abb. 9.20: Durchtunneln der Potenzialbarriere bei konstanter Energie E zwischen den klassischen Umkehrpunkten x a und x b .
und damit für die Tunnelwahrscheinlichkeit (9.65): xb
T = exp (−
1 2 ̄ ̄ , ≡ exp (− ∮ dx p(x)) ∫ dx p(x)) ℏ ℏ
(9.66)
xa
wobei ∮ dx das Linienintegral entlang der geschlossenen „klassischen“ Trajektorie unterhalb der Potenzialbarriere bezeichnet. Diesen Ausdruck hatten wir auf alterna tive Weise bereits in Gleichung (9.62) gefunden.
9.5 Pfadintegralberechnung des Transmissionskoeffizienten* Wie soeben gezeigt, repräsentiert der Transmissionskoeffizient die Wahrscheinlich keit für den Durchgang des Teilchens durch das Potenzialgebiet. Wir hatten früher ei nen allgemeinen Ausdruck für die Wahrscheinlichkeitsamplitude für einen beliebigen Übergang eines Teilchens von einem Ort x a zum Zeitpunkt t a zu einem anderen Ort x b zum Zeitpunkt t b abgeleitet. Diese Wahrscheinlichkeitsamplitude war durch die Sum i mation mit dem Gewicht e ℏ S[x] über alle Trajektorien x(t), die zum Zeitpunkt t a am Ort x a beginnen und zum Zeitpunkt t b > t a am Ort x b enden, gegeben, wobei S[x] die klas sische Wirkung der Trajektorie x(t) ist. Die Summation über alle Trajektorien wurde mittels eines Pfadintegrals ausgeführt und die Amplitude war durch x(t b )=x b
K(x b , t b ; x a , t a ) =
∫
Dx(t) e ℏ S[x](x b ,t b ;x a ,t a ) i
(9.67)
x(t a )=x a
gegeben. Wir hatten bereits früher gefunden, dass diese Wahrscheinlichkeitsampli tude oder Übergangsamplitude nur von der Zeitdifferenz t b − t a abhängt, falls das * Dieser Abschnitt ist für das Verständnis der übrigen Abschnitte nicht erforderlich und kann deshalb beim ersten Lesen übersprungen werden.
182 | 9 Eindimensionale Streuprobleme Potenzial V(x) nicht explizit zeitabhängig ist: K(x b , t b ; x a , t a ) = K(x b , t b − t a ; x a , 0). Aus diesem allgemeinen Ausdruck für die Wahrscheinlichkeitsamplitude sollte es jetzt sehr einfach sein, die Wahrscheinlichkeit für den Durchgang des Teilchens durch eine Potenzialbarriere (Tunnelwahrscheinlichkeit) zu berechnen. Dazu brauchen wir nur x a und x b als die klassischen Umkehrpunkte des Teilchens zu wählen, bei denen V(x) = E ist. Die Wegintegraldarstellung der Übergangsamplitude i. A. und insbeson dere der Tunnelamplitude (9.67) zeigt auch, dass in der Summe über alle Trajektorien stets auch solche darunter sind, deren Energie größer als die Potenzialbarriere ist. Hieraus ist ersichtlich, dass ein quantenmechanisches Teilchen eine Potenzialbarrie re mit einer endlichen Wahrscheinlichkeit überqueren kann. Die Größe K(x b , τ; x a , 0) stellt die Wahrscheinlichkeitsamplitude für den Über gang des Teilchens von x a nach x b während einer Zeit τ dar. Zur Berechnung des Transmissionskoeffizienten interessieren wir uns jedoch nicht für die Wahrschein lichkeit, die Barriere in einer vorgegebenen Zeit τ zu durchtunneln, sondern für die Tunnelwahrscheinlichkeit bei vorgegebener Energie E. Wir benötigen also die Wahr scheinlichkeitsamplitude für den Übergang von x a nach x b mit fester Energie E. Diese Wahrscheinlichkeitsamplitude haben wir bereits in Gleichung (3.33) eingeführt. Sie ergibt sich durch Fourier-Transformation bezüglich der Zeit ∞ i
K(x b , x a ; E) = ∫ dτ e ℏ Eτ K(x b , τ; x y , 0) .
(9.68)
−∞
Wir haben oben große Potenzialbarrieren betrachtet. Für solche Potenziale wird auch die klassische Wirkung sehr groß werden, d. h., die Bewegung verläuft semiklassisch: S[x] ≫ ℏ . Wie wir bereits früher gesehen haben, können wir in diesem Fall das Funktionalinte gral mittels der Methode der stationären Phase berechnen. In einfachster Näherung ist dann die Wahrscheinlichkeitsamplitude durch (5.20) ̃ b ,x a ;τ) , K(x b , τ; x a , 0) ≃ e ℏ S[x](x i
̃ b , x a ; τ) := S[x](x ̃ b , τ; x a , 0) S[x](x
(9.69)
gegeben, wobei x̃ die klassische Trajektorie für die Bewegung zwischen den Umkehr punkten x a und x b für vorgegebene Zeit τ ist. Wir erhalten die Übergangsamplitude zur vorgegebenen Energie, indem wir die semiklassische Näherung (9.69) in den Aus druck (9.68) einsetzen und über alle Zeiten τ integrieren. Auch die Wirkung am statio nären Punkt wird sehr groß gegenüber ℏ sein, sodass wir auch dieses Integral mittels der Methode der stationären Phasenapproximation ausführen können. Die Phase des τ-Integrals (bis auf einen Faktor 1/ℏ),
wird stationär für:
̃ b , x a ; τ) + Eτ , W(τ) = S[x](x
(9.70)
̃ b , x a ; τ) dW ∂S[x](x = +E =0. dτ ∂τ
(9.71)
9.5 Pfadintegralberechnung des Transmissionskoeffizienten
| 183
Die Ableitung der Wirkung einer klassischen Trajektorie nach der Zeit (Periode) τ, die das Teilchen zum Durchlaufen der klassischen Trajektorie zwischen festen Anfangsund Endkoordinaten x a und x b benötigt, ist nach der Hamilton-Jacobi’schen Differen zialgleichung (5.23) ̃ b , x a ; τ) ∂S[x](x = −H[τ](p, x) ∂τ gleich der negativen klassischen Energie H[τ], die entlang der klassischen Trajektorie erhalten bleibt. Damit lautet die stationäre Phasenbedingung (9.71): E = H[τ](p, x) .
(9.72)
Die stationäre Phasenbedingung im τ-Integral „pickt“ damit aus allen möglichen klas sischen Trajektorien (d. h. mit allen möglichen Perioden τ), die zwischen x a und x b verlaufen, diejenige heraus, für welche die zugehörige klassische Energie H[τ](p, x) gerade mit der von außen vorgegebenen Energie E übereinstimmt. Die Periode τ der so herausgepickten klassischen Trajektorie ist somit durch die von außen vorgegebene Energie E bestimmt: τ = τ(E) . In unterster Ordnung stationärer Phasenapproximation erhalten wir damit für die Wahrscheinlichkeitsamplitude (9.68) i
K(x b , x a ; E) ≃ e ℏ W(E) , wobei W(E) die Phase (9.70) am stationären Punkt (9.72) ist.⁶ ̃ b , x a ; τ) + H[τ](p.̃ x)τ)| ̃ W(E) = (S[x](x τ=τ(E) .
(9.73)
̃ die Hamilton-Form, Benutzen wir für die Wirkung der klassischen Trajektorie x(t) τ
̃ b , x a ; τ) = ∫ dt (p̃ ẋ̃ − H(p,̃ x)) ̃ , S[x](x 0
so finden wir τ(E)
xb
̇̃ = ∫ dx p(x) ̃ x(t) ̃ . W(E) = ∫ dt p(t) xa
0
Damit erhalten wir für die Wahrscheinlichkeitsamplitude, dass das Teilchen mit vor gegebener Energie E von x a nach x b läuft: xb
i ̃ . K(x b , x a ; E) ≃ exp ( ∫ dx p(x)) ℏ xa
6 Aus mathematischer Sicht ist die Phase (9.73) gerade die Legendre-Transformation der klassischen ̃ a , x b ; τ) bezüglich der Zeit τ, die das Teilchen entlang der klassischen Trajektorie x(t) ̃ Wirkung S[ x](x von x a nach x b benötigt, zur (erhaltenen) Energie E = H[τ], welche das Teilchen auf dieser Trajektorie besitzt.
184 | 9 Eindimensionale Streuprobleme
Die hier auftretende Größe ̃ p(x) = √2m(E − V(x)) ist der klassische Impuls, der für eine Bewegung unterhalb des Potenzialberges (E < V(x)) rein imaginär wird: ̄ p(x) = √2m(V(x) − E) .
̃ ̄ p(x) = i p(x) ,
Damit erhalten wir schließlich für die gesuchte Wahrscheinlichkeitsamplitude: xb
1 ̄ K(x b , x a ; E) ≃ exp (− ∫ dx p(x)) , ℏ xa
wobei die x a,b nach wie vor die durch V(x a,b ) = E definierten klassischen Umkehr punkte eines Teilchens mit Masse m und Energie E im Potenzial V(x) sind. Aus dieser Wahrscheinlichkeitsamplitude erhalten wir wie gewöhnlich die Wahrscheinlichkeit selbst, die hier den Transmissionskoeffizienten repräsentiert, durch Bildung des Be tragsquadrates: xa
2 ̄ T = |K(x b , x a , E)| ≃ exp (− ∫ dx p(x)) . ℏ 2
(9.74)
xb
Dieser Ausdruck stimmt mit dem früher gewonnenen Ergebnis (9.66) 1 ̄ T ≃ exp (− ∮ dx p(x)) ℏ überein. Die obige Pfadintegralableitung dieses Ergebnisses zeigt, dass dieser Aus druck für T nur für eine semiklassisch verlaufende Bewegung gültig ist, d. h. für große Potenzialbarrieren, bei denen die Wirkung groß gegenüber ℏ ist. Bei der früheren Ab leitung kam die semiklassische Näherung dadurch ins Spiel, dass wir beim Durchgang durch die Potenzialbarriere nur den durchlaufenden Teil der Wellenfunktion berück sichtigt haben, während wir den reflektierten Teil völlig vernachlässigten. Wie jedoch die Unterteilung des Potenzialberges in infinitesimal kleine rechteckige Potenzialbar rieren gezeigt hat, findet bei einem kontinuierlichen Potenzial eine Aufspaltung der Welle in einen durchgehenden und einen reflektierten Teil an jedem beliebigen Ort statt, an dem das Potenzial nicht konstant ist. Die an verschiedenen Orten reflektier ten Wellen überlagern sich und führen zu Interferenzerscheinungen, die wir in der semiklassischen Näherung vernachlässigt haben.
9.6 Feldemission von Elektronen Als illustratives Beispiel für den Tunneleffekt wollen wir die Feldemission der Elek tronen aus einer Metalloberfläche betrachten. Durch die elektrostatische Wechselwir kung mit den positiv geladenen Atomkernen können die Elektronen i. A. bei Zimmer temperatur den Festkörper nicht verlassen. In elektrischen Leitern wie Metallen sind
9.6 Feldemission von Elektronen
| 185
V (x)
V0
W εF
x (a)
e− (b)
x
Abb. 9.21: Qualitative Form des Elektronenpotenzials im Festkörper: (a) bei Abwesenheit, (b) bei Anwesenheit eines von außen angelegten elektrischen Feldes. In (b) können die Elektronen e − die Potenzialbarriere durchtunneln.
die Elektronen jedoch im Inneren frei beweglich, und das Potenzial kann in guter Nä herung innerhalb des Festkörpers als konstant betrachtet werden, während es an der Oberfläche eine Potenzialbarriere enthalten muss, um die Elektronen ins Innere des Festkörpers zu binden. Das Potenzial der Elektronen im Festkörper hat deshalb qua litativ das in Abb. 9.21(a) dargestellte Verhalten. Der Einfachheit halber können wir annehmen, dass der Festkörper den Halbraum x < 0 des ℝ3 ausfüllt, d. h., in y-, z- und negativer x-Richtung unendlich ausgedehnt ist und seine Oberfläche durch x = 0 (y-z-Ebene) gegeben ist. Das Elektronenpotenzial hat dann die Form einer Potenzialstufe: {0 , V(x) = { V , { 0
x0
.
Die stationären Zustände der Elektronen in diesem Potenzial sind deshalb ebene Wel len in y- und z-Richtung und stehende Wellen in x-Richtung. Nach dem sogenannten Pauli-Prinzip, welches in Band 2 hergeleitet wird, besetzen die Elektronen (bei Tem peratur null) sukzessive alle stationären Zustände jeweils einfach bis zu einer maxi malen Energie ε F , die als Fermi-Energie oder Fermi-Kante bezeichnet wird. Die Diffe renz dieser Energie zur Höhe der Potenzialbarriere V0 ist die Energie, welche nötig ist um ein Elektron aus der Metalloberfläche herauszuschlagen, und wird als Austrittsar beit W bezeichnet. Damit das Elektron die Metalloberfläche verlassen kann, muss es durch Energiezufuhr angeregt werden. Dies kann einmal geschehen, indem das Me
186 | 9 Eindimensionale Streuprobleme
E
Abb. 9.22: Schematische Darstellung der Versuchsanordnung zur Feldemission von Elektronen.
tall aufgeheizt wird. Die Elektronen erhalten dann eine zusätzliche kinetische Energie, und mit einer gewissen Wahrscheinlichkeit ist diese Energie größer als die Austrittsar beit, sodass statistisch die Elektronen das Metall verlassen können. Zur thermischen Emission der Elektronen muss der Festkörper auf sehr hohe Temperaturen aufgeheizt werden. Bei Zimmertemperaturen ist die thermische Emission vernachlässigbar. Für kleine Temperaturen kann man die Elektronen aus dem Metall schlagen durch Anle gen eines äußeren elektrischen Feldes, das zur Metalloberfläche hin gerichtet ist. Aus der Elektrodynamik wissen wir, dass das elektrische Feld in einem idealen Leiter ver schwindet, E = 0. Deshalb müssen die Feldlinien senkrecht auf der Metalloberfläche stehen. Der Einfachheit halber nehmen wir an, dass ein konstantes äußeres elektri sches Feld vorliegt. Dieses lässt sich z. B. ähnlich wie in einem Plattenkondensator erzeugen. Wir schließen die Metalloberfläche an den negativen Pol einer Spannungs quelle und bringen in einem gewissen Abstand zur Metalloberfläche eine Metallplatte parallel zur Oberfläche des Festkörpers an und schließen sie an den positiven Pol (sie he Abb. 9.22). Die Feldlinien laufen dann von der zweiten Metallplatte senkrecht zur Metalloberfläche. Das elektrische Feld hat damit die Gestalt E = −|E|e x ≡ E x e x . Das elektrostatische Feld lässt sich durch ein elektrisches Potenzial Φ(x) erzeugen: E(x) = −∇Φ(x) . Integrieren wir diese Gleichung über den Ort, so finden wir für das zugehörige Poten zial: x x dΦ(x ) = − ∫ dx E x (x ) = x|E| − x0 |E| . Φ(x) − Φ(x0 ) = ∫ dx dx x0
x0
Der Einfachheit halber legen wir den Nullpunkt des elektrostatischen Potenzials bei x = 0 fest: Φ(x = 0) = 0 ⇒ Φ(x0 ) = x0 |E| . Das Potenzial nimmt damit die Gestalt Φ(x) = x|E|
9.6 Feldemission von Elektronen | 187
an. Eine Ladung q = −e besitzt im elektrostatischen Potenzial Φ(x) die potenzielle Energie U(x) = qΦ(x) = −eΦ(x) , e > 0 , die wir zum Potenzial des Festkörpers hinzuaddieren müssen. Damit lautet das Poten zial der Elektronen im Festkörper bei Anwesenheit des äußeren Feldes: V(x) = V0 − xe|E| .
(9.75)
Dieses Potenzial ist in Abb. 9.21(b) dargestellt. Durch Anlegen des äußeren Feldes wird die (im Gebiet x > 0) unendlich ausgedehnte Potenzialstufe abgesenkt, und die Elek tronen werden von dem Äußeren der Metalloberfläche nur durch eine endliche Poten zialbarriere getrennt. Diese können sie durchtunneln. Für ein Elektron mit der Ener gie E ist die Breite der Barriere x̄ durch den klassischen Umkehrpunkt ̄ E = V(x)̄ = V0 − xe|E| gegeben, d. h. x̄ =
(9.76)
V0 − E W = , e|E| e|E|
(9.77)
wobei W = V0 − E wiederum die Austrittsarbeit für ein Elektron der Energie E ist. Setzen wir die explizite Form des Potenzials V(x) (9.75) und der Energie des Elektrons E (9.76) in den Ausdruck für den Transmissionskoeffizienten (9.74) ein, so finden wir: x̄
x̄
0
0
2 2 ̄ T = exp (− ∫ dx √2m(V(x) − E)) = exp (− ∫ dx √2m(V(x) − V(x))) ℏ ℏ x̄
2 2 2 = exp (− ∫ dx √2m(x̄ − x)e|E|) = exp (− √2me|E| x̄ 3/2 ) . ℏ ℏ 3 0
Nach Einsetzen von (9.77) erhalten wir für den Transmissionskoeffizienten: T = exp (−
4 √2m W 3/2 ) . 3 eℏ |E|
(9.78)
Die Tunnelwahrscheinlichkeit der Elektronen durch die Barriere ist umso kleiner, je größer die erforderliche Austrittsarbeit W ist. Setzt man für die Naturkonstanten e, m und ℏ ihre numerischen Werte ein, so findet man für die Tunnelwahrscheinlichkeit: T = exp (−6,83 ⋅ 109 (
W 3/2 V/m ) ) . eV |E|
Die Austrittsarbeit beträgt in typischen Metallen 2–6 eV. Um eine Tunnelwahrschein lichkeit von der Ordnung 1 zu erhalten, benötigen wir dafür eine elektrische Feldstärke |E| ≃ 1010 V/m .
188 | 9 Eindimensionale Streuprobleme
Feldstärken dieser Größenordnung lassen sich i. A. nur sehr schwer mit planaren Leiterplatten erreichen. Man kann diese großen Feldstärken jedoch sehr einfach in der Nähe von Metallspitzen erzeugen, wo aufgrund der großen Krümmung die Dichte der Feldlinien sehr groß und das Feld damit sehr stark werden. Ferner sei bemerkt, dass die Tunnelwahrscheinlichkeit i. A. wegen Oberflächeneffekten größer ist, als Gleichung (9.78) besagt: An nicht planaren Metalloberflächen ist die elektrische Feld stärke lokal wesentlich größer als der als konstant angenommene mittlere Wert. Die durch das äußere Feld induzierte Tunnelung der Elektronen aus der Metall oberfläche ist die Grundlage für die Feldemissionsmikroskopie bzw. Tunnelrastermi kroskopie. Bei diesen Verfahren gelingt es, ein vergrößertes Bild der Metalloberfläche zu erreichen und Feinheiten bzw. Unregelmäßigkeiten auf der Oberfläche sichtbar zu machen. Ein weiteres Anwendungsbeispiel der Tunnelung eines Teilchens durch eine Bar riere stellt der radioaktive α-Zerfall dar. Ein α-Teilchen (Heliumkern) im Kern spürt zum einen die abstoßende langreichweitige Coulomb-Wechselwirkung mit dem Rest des Atomkerns, zum anderen die attraktive kurzreichweitige starke Wechselwirkung, auf welche wir hier nicht näher eingehen wollen. Das Gesamtpotenzial hat qualitativ die in Abb. 9.23 dargestellte Gestalt. Durch Wechselspiel von Coulomb- und Kernkräf ten kommt es zur Ausbildung einer Barriere, die das α-Teilchen mit einer gewissen Wahrscheinlichkeit durchtunneln kann. Ein ähnliches Potenzial liegt bei der Kern spaltung schwerer Atomkerne vor. V (r)
E
R
r
Abb. 9.23: Qualitativer Verlauf des Potenzials eines α-Teilchens in einem bezüglich α-Zerfall instabi len Atomkern. R ist der Kernradius. Wegen der kurzen Reichweite der Kernkräfte ist das Potenzial im Außenraum allein durch das Coulomb-Potenzial der Protonen des Atomkerns gegeben.
10 Mathematische Grundlagen der Quantenmechanik In der klassischen Mechanik lässt sich jede physikalische Größe (Observable) als Funk tion der (verallgemeinerten) Orts- und Impulsvariablen schreiben. Eine physikalische Observable stellt hier somit eine Phasenraumfunktion A(x, p) dar. Ferner legt ein Punkt (x, p) im Phasenraum eindeutig den Zustand eines klassischen Systems fest. Einen klassischen Zustand können wir also durch einen Punkt im Phasenraum Π = (x, p) , definieren. Die zeitliche Entwicklung des Phasenraumpunktes wird dann durch die kanonischen Bewegungsgleichungen ẋ =
∂H , ∂p
ṗ = −
∂H ∂x
beschrieben. Dies sind Differenzialgleichungen erster Ordnung, die bei gegebenen An fangsbedingungen für x und p, d. h. für einen gegebenen Anfangszustand Π(t = t0 ), den späteren Zustand Π(t > t0 ) eindeutig festlegen. In der Quantenmechanik hatten wir hingegen gefunden, dass Ort und Impuls nicht gleichzeitig scharf messbar sind. Wir hatten auch bereits festgestellt, dass die Unschärfe eines Messergebnisses durch die Einwirkung des Messapparates auf das zu messende Objekt hervorgerufen wird. Der Messprozess zur Bestimmung einer Ob servablen verändert i. A. den Zustand des Systems (was wir ausführlicher in Kapitel 11 besprechen werden).¹ Die zugehörige Änderung der Wellenfunktion kann nur durch die Wirkung eines Operators erreicht werden. Folglich müssen in der Quantenme chanik Observablen durch Operatoren repräsentiert werden. Dies haben wir bereits explizit für den Impuls und die Energie gefunden. Eine besondere Rolle spielen die Zustände ψ, die durch den Messprozess (bis auf Normierung) nicht verändert werden, d. h., bei Wirkung des Messoperators A auf den Zustand ψ wird dieser bis auf einen numerischen Faktor a reproduziert: Aψ = aψ . Solche Zustände ψ heißen Eigenzustände des Messoperators A. Die zugehörige Obser vable hat dann einen wohldefinierten Wert, den Eigenwert a des Operators A. Wie derholung der Messung liefert denselben Wert. Die quantenmechanische Vorhersage der Messung besitzt dann nicht mehr Wahrscheinlichkeitscharakter, sondern liefert
1 In der klassischen Mechanik ist der Einfluss der Messapparatur auf das zu messende Objekt ver nachlässigbar. https://doi.org/10.1515/9783110586022-010
190 | 10 Mathematische Grundlagen der Quantenmechanik
einen determinierten Wert. Im Allgemeinen lassen sich jedoch nur für einige Obser vablen gleichzeitig scharfe Messwerte angeben. Für die übrigen sind nur Wahrschein lichkeitsaussagen möglich; für eine zu der gemessenen Observablen konjugierte Ob servable, wie zum Ort der Impuls, werden wir eine unendliche Unschärfe erhalten. Wir definieren deshalb einen (reinen) quantenmechanischen Zustand als einen maximalen Satz von verträglichen Messwerten, d. h. von gleichzeitig messbaren Eigenschaften des quantenmechanischen Systems. Die quantenmechanischen Zustände, insbeson dere ihre Veränderung infolge eines Messprozesses werden ausführlicher in Kapitel 11 besprochen. Bei der Untersuchung der Erwartungswerte von physikalisch messbaren Größen haben wir festgestellt, dass sich sowohl die Wellenfunktion als auch die zu den phy sikalischen Observablen gehörenden Operatoren als Funktionen entweder des Ortes oder des Impulses ausdrücken lassen. Dies hatten wir als Orts- bzw. Impulsraumdar stellung bezeichnet. Ausgehend von dieser Feststellung können wir vermuten, dass ei ne allgemeine Darstellung und abstrakte Formulierung der Quantenmechanik möglich ist, in der Orts- und Impulsraum nur zwei konkrete Realisierungen der Darstellungen sind. Eine solche abstrakte Formulierung gelingt mittels der Theorie des Hilbert-Rau mes. Ein Hilbert-Raum ist ein spezieller komplexer Vektorraum, dessen Elemente (Vek toren) Funktionen sind und der deshalb auch als Funktionenraum bezeichnet wird. Jedes quantenmechanische System wird durch einen Hilbert-Raum beschrieben, und die Wellenfunktionen sind Vektoren dieses Hilbert-Raumes. Wie wir früher auch bereits gesehen haben, besitzen physikalische Observablen wie Ort und Impuls in verschiedenen Darstellungen unterschiedliche Operatorrealisie rungen. Der Ortsoperator ist trivial im Ortsraum, wo er durch die Ortskoordinate gege ben ist; er wird aber im Impulsraum zum Differenzialoperator. Je nach physikalischer Fragestellung ist es deshalb zweckmäßig, diese oder jene Darstellung zu benutzen, und eine allgemeine Darstellungstheorie der Quantenmechanik scheint daher sinn voll. Diese soll im Folgenden entwickelt werden.
10.1 Der Hilbert-Raum Die Theorie des Hilbert-Raumes bildet das mathematische Gerüst für die Quanten theorie. Sie erlaubt eine darstellungsunabhängige Formulierung der Quantenmecha nik. Jedes Quantensystem wird durch einen Hilbert-Raum beschrieben. Die Wellen funktionen (Zustände) sind Elemente (Vektoren) des Hilbert-Raumes. Physikalische Observablen werden durch Operatoren auf dem Hilbert-Raum repräsentiert, die auf die Wellenfunktionen (Zustände) wirken. Im Folgenden werden die wesentlichen Ei genschaften des Hilbert-Raumes zusammengestellt, die für die Quantenmechanik re levant sind.
10.1 Der Hilbert-Raum |
191
Hilbert-Raum Eine Menge von abstrakten Elementen φ, ψ, χ, . . . nennt man einen Hilbert-Raum ℍ, wenn folgende Axiome gelten: 1. ℍ ist ein linearer Raum, 2. ℍ ist ein unitärer Raum, 3. ℍ ist vollständig. Im Folgenden sollen diese Begriffe näher erläutert werden. 1. ℍ ist ein linearer Raum, d. h. ein komplexer Vektorraum: Auf ℍ sind die Operationen der Vektoraddition und der Multiplikation mit komple xen Zahlen definiert, und diese Operationen genügen den gewöhnlichen Regeln der Vektoralgebra: φ, ψ ∈ ℍ , –
c1 , c2 ∈ ℂ
⇒
c1 φ + c2 ψ ∈ ℍ .
Diese beiden Verknüpfungen sind i)
kommutativ:
ii)
assoziativ: bzw. transitiv:
iii)
distributiv:
φ+ψ=ψ+φ
} } } } } φ + (ψ + χ) = (φ + ψ) + χ } } } } c1 (c2 φ) = (c1 c2 )φ } } } } c(φ + ψ) = cφ + cψ } } } } } (c1 + c2 )φ = c1 φ + c2 φ }
∀φ, ψ, χ ∈ ℍ , ∀c, c1 , c2 ∈ ℂ .
–
Unter Multiplikation mit dem Einselement von ℂ wird jeder Vektor aus ℍ re produziert: 1φ = φ , ∀ φ ∈ ℍ .
–
Ferner existiert ein neutrales Element o ∈ ℍ, der Nullvektor, mit der Eigen schaft: φ + o = φ , ∀φ ∈ ℍ.
–
Zu jedem Element φ ∈ ℍ existiert ein inverses Element −φ ∈ ℍ, sodass gilt: φ + (−φ) = o ,
∀φ ∈ ℍ .
192 | 10 Mathematische Grundlagen der Quantenmechanik
Aus diesen Axiomen ergeben sich unmittelbar folgende Eigenschaften: co = o } } } 0φ = o } } } (−1)φ = −φ}
∀φ ∈ ℍ , ∀c ∈ ℂ .
Eine Menge von Elementen φ1 , φ2 , . . . , φ n ∈ ℍ heißt linear unabhängig, falls die Beziehung n
∑ ci φi = 0 i=1
mit c i ∈ ℂ sich nur mit den Koeffizienten c i = 0 (für alle i = 1, 2, . . . , n) erfüllen lässt. Anderenfalls heißen die Elemente φ i linear abhängig. Die maximale Anzahl von linear unabhängigen Elementen in ℍ bezeichnet man als die Dimension von ℍ (vgl. mit dem dreidimensionalen Vektorraum ℝ3 ). In der Quantenmechanik haben wir es meistens mit (abzählbar) unendlichdimensionalen Hilbert-Räumen zu tun. 2. ℍ ist ein unitärer Raum, d. h. ein linearer Raum mit einem Skalarprodukt: Ein Skalarprodukt oder inneres Produkt ist eine Abbildung ℍ × ℍ → ℂ, die jedem Paar von Elementen φ, ψ ∈ ℍ eine komplexe Zahl (φ, ψ) ∈ ℂ zuordnet, wobei die folgenden Eigenschaften erfüllt sein müssen: Hermitizität
: (φ, ψ) = (ψ, φ)∗ ,
Linearität im zweiten
:
(φ, aψ) = a(φ, ψ) ,
iii)
Argument
:
(φ, ψ + χ) = (φ, ψ) + (φ, χ) ,
iv)
positive Definitheit
:
(φ, φ) > 0 und (φ, φ) = 0
i) ii)
{
⇐⇒
φ=o.
Aus i) und ii) bzw. aus i) und iii) folgt unmittelbar: (cφ, ψ) = c∗ (φ, ψ) (φ + ψ, χ) = (φ, χ) + (ψ, χ)
}
∀φ, ψ, χ ∈ ℍ , ∀c ∈ ℂ .
Damit ist das Skalarprodukt antilinear im ersten Argument. Man nennt ein Skalarpro dukt daher auch eine Sesquilinearform bzw. eine Bilinearform im Fall reeller Vektor räume. Des Weiteren impliziert i), dass: (φ, φ) ∈ ℝ . Da 0 φ = o in jedem Vektorraum, folgt weiterhin aus ii): (φ, o) = 0 .
10.1 Der Hilbert-Raum | 193
Das eben eingeführte Skalarprodukt ist eine direkte Verallgemeinerung des aus der linearen Algebra bekannten (euklidischen) Skalarproduktes zwischen zwei Vektoren a und b eines reellen Vektorrau mes (z. B. des ℝn ), n
(a, b) ≡ a ⋅ b = ∑ a i b i , i
auf einen komplexen Vektorraum. Mittels des Skalarproduktes können wir bekanntlich die Länge oder die Norm von Vektoren im ℝn definieren, ‖a‖ ≡ |a| = √ a ⋅ a , die hier auch als Betrag bezeichnet wird. Ferner definiert die Norm auch den Abstand zweier Vektoren im ℝn als |a − b| .
Analog hierzu induziert das Skalarprodukt auf natürliche Weise eine Norm für Ele mente φ ∈ ℍ, ‖φ‖ := √(φ, φ) .
(10.1)
Nach Regel iv) für Skalarprodukte ist das Argument der Wurzel niemals negativ. Mit hilfe der Norm lässt sich der Abstand zweier Elemente φ, ψ ∈ ℍ definieren als: ‖φ − ψ‖ . Diese Definition erfüllt die Rechenregeln einer Metrik und macht ℍ somit zum topo logischen Raum. Ein Vektor φ ∈ ℍ heißt normiert oder Einheitsvektor, wenn gilt: ‖φ‖ = 1 . Zwei Vektoren φ, ψ ∈ ℍ heißen orthogonal, wenn ihr Skalarprodukt verschwindet, (φ, ψ) = 0 . Man schreibt in diesem Fall auch φ ⊥ ψ. Für das Skalarprodukt zweier Vektoren φ, ψ ∈ ℍ gilt die Schwarz’sche Ungleichung |(φ, ψ)| ≤ ‖φ‖ ‖ψ‖ .
(10.2)
Gleichheit gilt genau dann, wenn φ und ψ linear abhängig (parallel) sind, d. h. ψ = c φ mit c ∈ ℂ. Im ℝ3 gilt bekanntlich für das Skalarprodukt zweier Vektoren a und b die Beziehung a ⋅ b = |a| |b| cos γ , wobei γ der zwischen den beiden Vektoren aufgespannte Winkel ist. Mit | cos γ| ≤ 1 folgt hieraus unmittelbar die Schwarz’sche Ungleichung.
194 | 10 Mathematische Grundlagen der Quantenmechanik Beweis der Schwarz’schen Ungleichung Gleichung (10.2) ist offenbar erfüllt für φ = o, da (o, ψ) = 0 und ‖o‖ = 0. Für φ ≠ o zerlegen wir ψ in einen Anteil parallel zu φ und einen Anteil orthogonal zu φ: ψ = cφ + χ ,
(φ, χ) = 0 .
(10.3)
Es folgt: (φ, ψ) = (φ, cφ + χ) = c(φ, φ) + (φ, χ) = c(φ, φ) , und damit finden wir für den Entwicklungskoeffizienten die bereits aus der linearen Algebra bekannte Beziehung (φ, ψ) c= . (10.4) (φ, φ) Berechnen wir die Norm von ψ, so erhalten wir mit Gleichung (10.3): (ψ, ψ) = (c φ + χ, c φ + χ) = (c φ + χ, c φ) + (c φ + χ, χ) = (c φ, c φ) + (χ, c φ) + (c φ, χ) + (χ, χ) = c ∗ c (φ, φ) + (χ, χ) ≥ |c|2 (φ, φ) , wobei das Gleichheitszeichen nur für χ = o gilt. Setzen wir für c den expliziten Wert aus (10.4) ein, erhalten wir: |(φ, ψ)|2 ≤ (φ, φ) (ψ, ψ) oder nach Ziehen der Wurzel die zu beweisende Beziehung (10.2). Das Gleichheitszeichen gilt offenbar nur, wenn ψ = cφ, d. h., ψ und φ linear abhängig sind.
Aus der Schwarz’schen Ungleichung folgt die Dreiecksungleichung ‖φ + ψ‖ ≤ ‖φ‖ + ‖ψ‖ ,
(10.5)
wie sich leicht zeigen lässt: ‖φ + ψ‖2
=
(φ + ψ, φ + ψ)
=
(φ, φ) + (ψ, ψ) + (φ, ψ) + (ψ, φ)
=
‖φ‖2 + ‖ψ‖2 + 2Re{(φ, ψ)}
≤
‖φ‖2 + ‖ψ‖2 + 2|(φ, ψ)|
(10.2)
≤
‖φ‖2 + ‖ψ‖2 + 2‖φ‖ ‖ψ‖
=
(‖φ‖ + ‖ψ‖)2 .
Ähnlich beweist man die sogenannte Dreiecksregel nach unten: ‖φ‖ − ‖ψ‖ ≤ ‖φ + ψ‖ . Aus der Dreiecksungleichung folgt unmittelbar für drei Vektoren φ1 , φ2 , φ3 ∈ ℍ: ‖φ1 − φ3 ‖ ≤ ‖φ1 − φ2 ‖ + ‖φ2 − φ3 ‖ .
10.1 Der Hilbert-Raum | 195
Die Dreiecksungleichung gilt also auch für die Abstände, sodass die Abstandsfunktion tatsächlich eine Metrik definiert. Zum Beweis setzen wir ‖φ1 − φ3 ‖ = ‖(φ1 − φ2 ) + (φ2 − φ3 )‖ in die Dreiecksungleichung (10.5) ein. Wir haben oben gesehen, dass das Skalarprodukt auf natürliche Weise eine Norm in ℍ induziert. In unitären Räumen gilt allerdings auch die Umkehrung, d. h., das Skalarprodukt kann durch die Norm mithilfe der sogenannten Polarisationsgleichung ausgedrückt werden:² (φ, ψ) =
1 {‖φ + ψ‖2 − ‖φ − ψ‖2 + i ‖i φ + ψ‖2 − i ‖i φ − ψ‖2 } . 4
(10.6)
Man könnte vermuten, dass durch diese Gleichung in jedem normierten Raum ein Skalarprodukt defi niert werden könnte, d. h., dass Norm und Skalarprodukt äquivalente Begriffe sind. Diese Vermutung ist jedoch falsch, denn die durch die rechte Seite von Gleichung (10.6) definierte Abbildung erfüllt i. A. nicht die Axiome eines Skalarproduktes. Offenbar haben Normen, die aus einem Skalarprodukt abgeleitet sind, zusätzliche Eigenschaften. So gilt etwa in einem unitären Raum die Parallelogramm gleichung: ‖φ + ψ‖2 + ‖φ − ψ‖2 = 2‖φ‖2 + 2‖ψ‖2 . (10.7) Diese Relation gilt für allgemeine Normen nicht. Umgekehrt kann man zeigen, dass in einem normier ten Raum, dessen Norm Gleichung (10.7) erfüllt, mittels Gleichung (10.6) tatsächlich ein Skalarprodukt definiert und der normierte Raum somit unitarisiert werden kann.
3. ℍ ist ein vollständiger Raum: Grundlage der Analysis in Hilbert-Räumen ist der Begriff des Grenzwertes einer Folge von Vektoren, der wie üblich über die Metrik bzw. Norm definiert wird: – Eine Folge {φ n } in ℍ konvergiert gegen φ ∈ ℍ, falls lim ‖φ n − φ‖ = 0 .
n→∞
Dieses Kriterium erfordert allerdings eine Information, die nicht in der Folge selbst enthalten ist, nämlich die Kenntnis des potenziellen Grenzwertes φ. Eine grenzwert freie Definition von Konvergenz geht davon aus, dass sich die Folgeglieder in konver genten Folgen asymptotisch immer ähnlicher werden: – Eine Folge {φ n } heißt daher in sich konvergent oder Cauchy-Folge, falls zu jedem ε > 0 ein N(ε) ∈ ℕ existiert, sodass ‖φ n − φ m ‖ < ε ,
∀ n, m > N(ε)
gilt.
2 Man überzeugt sich leicht, dass für die über das Skalarprodukt definierte Norm (10.1) diese Glei chung identisch erfüllt ist.
196 | 10 Mathematische Grundlagen der Quantenmechanik
Jede konvergente Folge ist auch eine Cauchy-Folge, allerdings gilt die Umkehrung i. A. nicht, wie das Beispiel (1 + 1/n)n im Raum ℚ der rationalen Zahlen zeigt: 1 n ) = e ∉ ℚ . n→∞ n Es gibt also Folgen rationaler Zahlen, die in sich konvergent sind, aber deren Grenz wert nicht in ℚ selbst liegt; in diesem Sinne ist ℚ nicht vollständig. Umgekehrt wird ein Raum wie die reellen Zahlen ℝ, in dem jede Cauchy-Folge einen Grenzwert hat, als vollständig bezeichnet: lim (1 +
–
Ein Hilbert-Raum ℍ ist vollständig, d. h., jede Cauchy-Folge {φ n } in ℍ konver giert gegen ein Element φ ∈ ℍ. Mit anderen Worten: Falls eine Folge {φ n } von Elementen aus ℍ der Bedingung ‖φ n − φ m ‖ → 0 für m, n → ∞ genügt, so existiert ein Element φ ∈ ℍ mit: ‖φ n − φ‖ → 0 .
Aus der Vollständigkeit lässt sich die Existenz einer Basis folgern, die hier wie folgt definiert ist: –
Eine Folge von paarweise orthogonalen Vektoren {φ1 , φ2 , φ3 , . . . } in ℍ heißt Hilbert-Basis (oder einfach Basis), wenn in ℍ nur der Nullvektor orthogonal zu allen Folgenmitgliedern ist: (φ i , ψ) = 0 ,
∀i ∈ ℕ
⇒
ψ=o.
Eine Hilbert-Basis besteht somit stets aus linear unabhängigen Vektoren, ist aber nicht maximal im algebraischen Sinne, da nicht alle Vektoren aus ℍ als endliche Linearkom binationen der Basiselemente (d. h. Linearkombinationen endlich vieler Basiselemen te) darstellbar sein müssen. Die Mächtigkeit (d. h. die Anzahl der Basisvektoren) jeder (Hilbert-)Basis in ℍ ist gleich und entspricht der oben algebraisch definierten Dimen sion von ℍ. In der Quantentheorie werden wir es meistens mit unendlichdimensiona len Hilbert-Räumen zu tun haben. Hilbert-Basen werden auch vollständige Orthogonalsysteme genannt. Der Begriff der Vollständigkeit bedeutet hier, dass jedes Element ψ ∈ ℍ nach der Basis zerlegt werden kann: ψ = ∑ ψi φi , ψi ∈ ℂ , (10.8) i
wobei höchstens abzählbar viele Koeffizienten ψ i ≠ 0 sind. Jedes Element ψ ∈ ℍ wird vollständig durch seine Entwicklungskoeffizienten ψ i ∈ ℂ bezüglich einer voll
10.1 Der Hilbert-Raum |
197
ständigen Basis {φ i } bestimmt. In Anlehnung an die lineare Algebra bezeichnen wir ein Element ψ ∈ ℍ als Hilbert-Vektor und die Entwicklungskoeffizienten ψ i als seine Koordinaten bezüglich der Basisvektoren {φ i }. Entfernt man einige Elemente aus einer vollständigen Basis eines unendlichdi mensionalen Hilbert-Raumes, so verbleiben i. A. immer noch unendlich viele Basis elemente, aber die Restmenge muss nicht mehr vollständig sein. Beispiel: Der Raum der über dem Intervall −1 ≤ x ≤ 1 stetigen Funktionen mit dem Skalarprodukt 1
(φ, ψ) = ∫ dx φ ∗ (x)ψ(x) −1
ist ein Hilbert-Raum; eine vollständige Basis ist durch die Funktionen φ 2n (x) = cos(nπx) , φ 2n−1 (x) = sin(nπx) ,
n = 0, 1, 2, . . . , n = 1, 2, 3, . . .
gegeben. Jede auf [−1, 1] stetige Funktion φ lässt sich nach dieser Basis entwickeln. Entfernt man z. B. die Sinusfunktionen φ 2n+1 , so bleiben immer noch abzählbar unendlich viele Basiselemen te φ 2n übrig, die Restmenge ist jedoch nicht mehr vollständig, da sich die ungeraden Funktionen φ(−x) = −φ(x) nicht durch die geraden Kosinusfunktionen ausdrücken lassen.
Entwicklung nach einem vollständigen orthonormierten System Die Elemente einer Hilbert-Basis {φ i } können o. B. d. A. als orthonormiert ange nommen werden, (φ i , φ k ) = δ ik , (10.9) da sich jede Menge linear unabhängiger Vektoren mittels des Gram-Schmidt’schen Verfahrens orthonormieren lässt. Eine normierte Hilbert-Basis wird als vollständiges Orthonormalsystem (VONS) bezeichnet. In einem solchen VONS nehmen die Koordi naten ψ i des Hilbert-Vektors ψ eine besonders einfache Gestalt an. Bilden wir das Ska larprodukt des Basisvektors φ k mit ψ (10.8) und benutzen die Orthonormierungsbe dingung (10.9), so finden wir: (φ k , ψ) = (φ k , ∑ ψ i φ i ) = ∑ ψ i (φ k , φ i ) = ∑ ψ i δ ki = ψ k . i
i
i
Die Koordinaten sind deshalb durch ψ k = (φ k , ψ)
(10.10)
gegeben, und der Hilbert-Vektor ψ besitzt die Zerlegung ψ = ∑(φ k , ψ)φ k .
(10.11)
k
Aufgrund der Vollständigkeit des Hilbert-Raumes handelt es sich hierbei um eine kon vergente Reihe, d. h., höchstens abzählbar viele Koordinaten (10.10) sind von null ver schieden, und es gilt ∑i |ψ i |2 < ∞. Genauer gilt für jedes Orthonormalsystem (ONS)
198 | 10 Mathematische Grundlagen der Quantenmechanik
die Bessel’sche Ungleichung ∑ |ψ k |2 = ∑ |(φ k , ψ)|2 ≤ ‖ψ‖2 k
∀ψ ∈ ℍ .
(10.12)
k
Das ONS ist vollständig (also eine Hilbert-Basis), wenn in (10.12) das Gleichheitszei chen steht, d. h., wenn die Parseval’sche Gleichung gilt, ‖ψ‖2 = ∑ |(φ k , ψ)|2
∀ψ ∈ ℍ .
k
Wir betrachten das Skalarprodukt (ϕ, ψ) zweier Elemente ϕ, ψ ∈ ℍ, die wir nach einem VONS {φ i } entwickeln. Neben Gleichungen (10.8) und Gleichung (10.10) für ψ haben wir die analoge Beziehung ϕ i = (ϕ, φ i ) .
ϕ = ∑ ϕi φi , i
Unter Ausnutzung der Eigenschaften des Skalarproduktes haben wir (ϕ, ψ) ≡ (∑i ϕ i φ i , ∑j ψ j φ j ) = ∑ ϕ∗i ψ j (φ i , φ j ) .
(10.13)
i,j
Mit der Orthonormierung (10.9) der Basis {φ i } finden wir schließlich (ϕ, ψ) = ∑ ϕ∗i ψ j ,
(10.14)
i
womit das Skalarprodukt vollständig durch die Koordinaten ausgedrückt ist. Eine ana loge Beziehung kennen wir bereits aus der linearen Algebra für das Skalarprodukt in komplexen Vektorräumen. Für die Quantenmechanik ist besonders relevant der Hilbert-Raum 𝕃2 der quadrat integrablen Funktionen, für welche ∞
∫ dx |φ(x)|2 < ∞ −∞
gilt. Für diesen Raum ist das Skalarprodukt durch ∞
(φ, ψ) := ∫ dx φ∗ (x)ψ(x)
(10.15)
−∞
definiert, wobei das Integral im Lebesgue’schen Sinn zu verstehen ist und fast überall gleiche Funktionen zu identifizieren sind. Man überprüft leicht, dass alle in der De finition des Hilbert-Raumes spezifizierten Bedingungen an das Skalarprodukt durch obige Definition erfüllt werden. In der Quantenmechanik wird dieses Skalarprodukt für zwei (verschiedene) Wellenfunktionen auch als Überlappungsintegral bezeichnet.
10.2 Operatoren im Hilbert-Raum
| 199
In der Quantenmechanik fordert man gewöhnlich noch zusätzlich, dass ein Hilbert-Raum ℍ se parabel ist, d. h., ℍ besitzt eine abzählbar dichte Teilmenge B = {φ n }. Dies bedeutet, dass die Teilmenge B jedem Hilbert-Vektor φ ∈ ℍ beliebig nahekommt: Zu jedem ε > 0 existiert ein φ n ∈ B, sodass ‖φ n − φ‖ < ε. In separablen Hilbert-Räumen hat jede Basis eine abzählba re Anzahl von Elementen. Zusammen mit der Tatsache, dass Hilbert-Räume gleicher Dimension isomorph sind, folgt also, dass es bis auf Isomorphie nur zwei Hilbert-Räume mit unendlicher Dimension gibt: (i) separable Hilbert-Räume mit abzählbar unendlicher Dimension und (ii) nicht separable Hilbert-Räume mit nicht abzählbar unendlicher Dimension. 2. Etwas allgemeiner als der Hilbert-Raum ist der sogenannte Banach-Raum 𝔹, also ein vollstän diger normierter Raum. Die einzige Änderung gegenüber einem Hilbert-Raum besteht darin, dass die Norm nicht von einem Skalarprodukt stammen muss, d. h., die Parallelogrammglei chung (10.7) muss im Banach-Raum nicht gelten und kein Skalarprodukt muss definiert sein. Das Axiom 2) des Hilbert-Raumes (ℍ ist ein unitärer Raum) wird dann durch die schwächere Forderung 2 ) ersetzt: 2 . 𝔹 ist ein normierter Raum, d. h., jedem Element φ ∈ 𝔹 ist eine nicht negative reelle Zahl ‖φ‖, seine Norm, zugeordnet, sodass gilt:
1.
i) ii) iii)
‖φ + ψ‖ ≤ ‖φ‖ + ‖ψ‖} } } ‖cφ‖ = |c| ‖φ‖ } } } ‖φ‖ = 0 ⇒ φ = o }
∀ φ, ψ ∈ 𝔹 , ∀c ∈ ℂ.
Jeder Hilbert-Raum ist ein Banach-Raum, aber die Umkehrung gilt nicht. Ein Beispiel für einen Banach-Raum ist der Raum der p-integrierbaren Funktionen 𝕃p=2̸ : ∞
∫ dx |φ(x)|p < ∞ . −∞
10.2 Operatoren im Hilbert-Raum Wir haben bereits früher festgestellt, dass physikalische Observablen wie z. B. der Im puls in der Quantenmechanik durch Operatoren dargestellt werden. Aus theoretischer Sicht entspricht die Messung einer physikalischen Observablen an einem durch die Wellenfunktion ψ beschriebenen System der Wirkung des zugehörigen Operators auf die Wellenfunktion. So wie eine Messung den Zustand eines quantenmechanischen Systems verändert, wird auch die Wirkung des Operators auf die Wellenfunktion die se verändern. Wir wollen jetzt diese Operatoren etwas genauer aus mathematischer Sicht untersuchen. Da die Theorie linearer Operatoren auf Hilbert-Räumen recht um fangreich ist, sollen an dieser Stelle nur die wichtigsten Resultate ohne Beweis zusam mengestellt werden.
200 | 10 Mathematische Grundlagen der Quantenmechanik
Operator Unter einem Operator A versteht man eine Abbildungsvorschrift, die jedem Ele ment φ aus einer Teilmenge D A ⊆ ℍ eines Raumes ℍ, dem Definitionsbereich, eindeutig ein Element ψ aus einer Teilmenge W A ⊆ 𝕂 eines zweiten Raumes 𝕂, dem Wertebereich, zuordnet: A : DA → WA ,
φ → ψ = Aφ .
Hierbei wird ℍ als Definitionsraum und 𝕂 als Werteraum bezeichnet. Zwei Operatoren A1 und A2 sind identisch, A1 = A2 , wenn sie denselben Definiti onsbereich besitzen und A1 φ = A2 φ für alle φ ∈ D A 1 = D A 2 gilt. Für Summen von Operatoren gilt das Distributivgesetz: (A1 + A2 )φ = A1 φ + A2 φ
∀φ ∈ D A 1 ∩ D A 2 .
Außerdem wirken sie transitiv: (A1 A2 )φ = A1 (A2 φ)
∀φ ∈ D A 2 ,
W A2 ⊆ D A1 .
Das Kommutativgesetz gilt bei Operatoren i. A. nicht, wie wir früher bereits gefunden haben. Sofern W A ⊆ D A kann man Operatorpotenzen A n bilden, und die Operatormul tiplikation ist stets assoziativ, A(BC) = (AB)C ≡ ABC auf D ABC . Oft werden der Defini tionsraum ℍ und der Werteraum 𝕂 identisch sein; man spricht dann von Operatoren in ℍ. Andererseits gibt es auch wichtige Operatoren bei denen ℍ ein Funktionenraum und 𝕂 der Raum der reellen oder komplexen Zahlen sind; solche Operatoren ℍ → 𝕂 nennt man Funktionale (siehe Anhang (D). Spezielle Operatoren in jedem Raum ℍ sind der Null- und der Einsoperator: Nulloperator: Einsoperator:
0̂ φ = o } 1̂ φ = φ
∀φ ∈ ℍ .
Für die Quantenmechanik sind i. A. nur die linearen Operatoren relevant. Linearer Operator Ein Operator A heißt linear, wenn sein Definitionsbereich D A ein linearer Teilraum von ℍ ist und er außerdem additiv und homogen ist, d. h., es gilt: additiv: homogen:
A(φ1 + φ2 ) = Aφ1 + Aφ2 Acφ = cAφ
}
∀φ, φ1 , φ2 ∈ D A , ∀c ∈ ℂ .
Ein linearer Operator ist z. B. der Impulsoperator p̂ =
ℏ d , i dx
(10.16)
10.2 Operatoren im Hilbert-Raum
| 201
denn für ihn gilt:
ℏ ̂ 1 + pφ ̂ 2, (φ + φ2 ) = pφ i 1 ℏ ℏ ̂ ̂ . pcφ = (cφ) = c φ = c pφ i i Ein Beispiel für einen nicht linearen Operator wird durch die (punktweise) Beziehung ̂ 1 + φ2 ) = p(φ
Aφ(x) := φ(x)2 definiert. Adjungierter Operator Der lineare Operator A† mit Definitionsbereich D A † heißt zu A adjungiert, wenn für alle φ ∈ D A und ψ ∈ D A † gilt: (A† ψ, φ) = (ψ, Aφ) .
(10.17)
Die Definition des zu A adjungierten Operators A† ist damit an die Definition eines Skalarproduktes gebunden. Aus (10.17) und der Eigenschaft i) des Skalarproduktes folgt (ψ, Aφ)∗ = (φ, A† ψ) . (10.18) Für das Produkt zweier Operatoren A, B finden wir wegen (ψ, ABφ) = (A† ψ, Bφ) = (B† A† ψ, φ) und (ψ, ABφ) = ((AB)† ψ, φ) die Beziehung (AB)† = B† A† ,
(10.19)
die bereits aus der linearen Algebra für Matrizen bekannt ist. Sind c eine komplexe Zahl und A ein Operator, so folgt aus (10.18) (cA)† = c∗ A† . Hermitescher (selbstadjungierter) Operator Ein linearer Operator A heißt hermitesch oder selbstadjungiert, wenn A† = A. Dies impliziert D A = D A † = ℍ, und es gilt: Aφ = A† φ
∀φ ∈ ℍ .
Aus Gleichung (10.17) folgt, dass für hermitesche Operatoren A offenbar (Aψ, φ) = (ψ, Aφ) gilt.
∀φ, ψ ∈ ℍ
202 | 10 Mathematische Grundlagen der Quantenmechanik
Ein Beispiel für einen hermiteschen Operator ist der Impulsoperator (10.16). Inverser Operator Der zu einem Operator A auf D A inverse Operator A−1 ist durch den Definitionsbe reich D A −1 = W A und die Operationsvorschrift A−1 (Aφ) = φ
∀φ ∈ D A
definiert, die wir als Operatorgleichung A−1 A = AA−1 = 1̂
(10.20)
schreiben können. Die Existenz eines Inversen ist i. A. nicht garantiert. Falls jedoch A−1 existiert, so ist W A −1 = D A , und es gilt (A−1 )−1 = A . Ist A linear, so gilt dies auch für A−1 . Für lineare Operatoren kann man die Existenz des inversen Operators einfach am Kern ablesen. Kern Der Kern eines Operators A , ker(A), ist durch die Menge aller Vektoren φ ∈ D A definiert, die durch A annihiliert werden: ker(A) := {φ ∈ D A | Aφ = o} . Ein linearer Operator ist genau dann invertierbar, wenn sein Kern verschwin det: A − invertierbar ⇐⇒ ker(A) = {o} .
Existiert zu zwei Operatoren A auf D A und B auf D B der jeweils inverse Operator, und ist ferner AB erklärt, so besitzt auch AB ein Inverses mit (AB)−1 = B−1 A−1 . Ferner zeigt man leicht aus ihren Definitionen, dass die Operation der hermiteschen Konjugation mit der Inversion vertauscht werden kann, sofern A überall definiert und invertierbar ist, und auch A† auf ganz ℍ definiert ist: (A−1 )† = (A† )−1 . In der Tat gilt per Definition (10.20) für alle φ, ψ ∈ ℍ: (ψ, A−1 Aφ) = (ψ, φ) .
(10.21)
10.2 Operatoren im Hilbert-Raum |
203
Zweifache Benutzung von (10.17) liefert: (A† (A−1 )† ψ, φ) = (ψ, φ) . Diese Gleichung kann nur dann für sämtliche φ und ψ aus ℍ gelten, wenn A† (A−1 )† = 1̂ , woraus (10.21) folgt. Ferner folgt aus (10.21) unmittelbar, dass der inverse Operator A−1 hermitesch ist, falls der Operator A selbst hermitesch ist. Unitärer Operator Ein linearer Operator U auf einem Hilbert-Raum ℍ heißt unitär, falls er 1. überall definiert ist, D U = ℍ, 2. surjektiv ist, W U = ℍ, 3. Längen und Winkel erhält, d. h., (Uψ, Uφ) = (ψ, φ)
∀φ, ψ ∈ ℍ .
(10.22)
Hat U nur die Eigenschaften 1) und 3), so heißt U eine Isometrie. Für ψ = φ folgt aus (10.22) ‖Uφ‖ = ‖φ‖
∀φ ∈ ℍ .
(10.23)
Unter Benutzung der Definition des adjungierten Operators erhalten wir aus (10.22) (ψ, U † Uφ) = (ψ, φ) und, da diese Beziehung für alle φ, ψ ∈ ℍ gilt, die Operatoridentität³ U†U = 1 . Ein unitärer Operator ist damit invertierbar und sein Inverses ist durch sein Adjungier tes gegeben: U −1 = U † . Mit (U † )† = U erhalten wir aus der letzten Beziehung, dass U −1 ebenfalls unitär ist: (U −1 )† = U .
3 Speziell für unitäre Operatoren gilt auch UU † = 𝟙, während für Isometrien nur UU † ⊆ 𝟙 gilt; UU † ist hier der Projektor auf den Bildraum W U von U.
204 | 10 Mathematische Grundlagen der Quantenmechanik
Beschränkter Operator und Operatornorm Ein Operator A auf D A ⊆ ℍ heißt beschränkt, wenn es eine Zahl r ∈ ℝ gibt, so dass ‖Aφ‖ ≤ r ‖φ‖ für alle φ ∈ D A . Die kleinste der Zahlen r heißt Norm des Operators A, ‖A‖ ≡ sup
φ∈D A
‖Aφ‖ . ‖φ‖
Ein Operator ist beschränkt, wenn er eine endliche Norm besitzt. Falls die Operatornorm existiert, ist sie offenbar reell und positiv. Der Nulloperator 0̂ : φ → o (und nur dieser) hat Norm 0. Ferner folgt aus der Dreiecksungleichung in ℍ unmittelbar ‖A + B‖ ≤ ‖A‖ + ‖B‖ ,
‖cA‖ = |c| ‖A‖
für
c∈ℂ,
sofern die genannten Operatoren existieren. Somit gelten also in der Tat die üblichen Rechenregeln für eine Norm. Beispiele für beschränkte Operatoren sind: 1. Unitäre Operatoren sind beschränkt, da sie die Norm ‖U‖ = 1
2.
(10.24)
besitzen, wie unmittelbar aus (10.23) folgt. Im ℝn mit der üblichen euklidischen Norm hat eine Matrix A ik die Norm ‖A‖2 = ∑ik |A ik |2 < ∞ und ist damit automatisch beschränkt.
In der Quantenmechanik sind besonders die linearen Operatoren von besonderem In teresse. Für diese gilt: –
–
Sind A und B linear beschränkt (also linear, auf ganz ℍ definiert und dort be schränkt), so gilt dies auch für (A + B), cA sowie für das Produkt AB. Auch n allgemeinere Potenzreihen von A sind bildbar, z. B. exp(cA) = ∑n cn! A n . Ist A linear beschränkt und ‖A‖ < 1, so existiert auch (1̂ − A)−1 , ist linear be schränkt, und es gilt ∞
(1̂ − A)−1 = 1 + A + A2 + ⋅ ⋅ ⋅ = ∑ A n , n=0
wobei die Reihe im Sinne der Operatornorm konvergiert.
10.2 Operatoren im Hilbert-Raum | 205
Gleichzeitig weisen wir schon jetzt darauf hin, dass die meisten in der Quantenmecha nik auftretenden physikalischen (d. h. linearen und hermiteschen) Operatoren nicht beschränkt sind. Insbesondere werden wir in Abschnitt 11.4 zeigen (Satz von Wie landt und Wintner): Es gibt kein Paar linear beschränkter Operatoren A, B, die die kanonische Vertau schungsrelation [A, B] = c 1̂ mit beliebigem komplexen c ≠ 0 erfüllen. Diese Vertauschungsrelation lässt sich damit auch nicht mit endlichdimensionalen Matrizen (die immer beschränkt sind) erfüllen, d. h., man ist in der Quantenmechanik auf unendlichdimensionale Hilbert-Räume angewiesen. Stetiger Operator Ein Operator A auf D A ⊆ ℍ heißt stetig an der Stelle φ ∈ D A , falls für jede gegen φ (in der Norm) konvergente Folge {φ n } ⊆ D A gilt: lim Aφ n = A lim φ n .
n→∞
n→∞
Für lineare Operatoren ist Beschränktheit äquivalent zur Stetigkeit, d. h., die stetigen linearen Operatoren (und nur diese) haben endliche Norm. In Abschnitt 11.4 werden wir sehen, dass physikalische Observablen i. A. unbeschränkt und daher auch nicht stetig sind. Eigenwerte von Operatoren Von besonderem Interesse sind in der Quantenmechanik die Vektoren, die bei Anwen dung eines linearen Operators A bis auf eine komplexe Zahl a reproduziert werden, Aφ = aφ ,
φ ≠ o ,
(10.25)
d. h., A führt den Vektor φ in einen parallelen Vektor über. Solche Vektoren heißen Eigenvektoren oder Eigenfunktionen von A und a heißt der Eigenwert von A. Die Ge samtheit der Eigenwerte {a(A)} wird als das Spektrum von A bezeichnet. Genauer gesagt bilden die Eigenwerte von A das sogenannte Punktspektrum, während zum gesamten Spektrum auch kontinuierliche Bereiche von ℂ gehören können, die als kontinuierliches bzw. Stre ckenspektrum bezeichnet werden. Für a aus dem kontinuierlichen Spektrum gibt es keinen zugehö rigen Eigenvektor φ ∈ ℍ, der im Hilbert-Raum liegt. Die Eigenwertgleichung (10.25) kann jedoch in einem schwächeren Sinn mit φ aus dem größeren Raum der Distributionen erfüllt werden (siehe An hang (A). Man nennt φ dann Eigendistribution. Beispiele für Eigendistributionen sind die ebenen Wel len des Impulsoperators oder die δ-Funktionen für den Ortsoperator, siehe Gleichungen (4.40), (4.41).
206 | 10 Mathematische Grundlagen der Quantenmechanik
Gehören zu einem Eigenwert a mehrere linear unabhängige Eigenfunktionen, so heißt der Eigenwert entartet: Aφ i = aφ i , i = 1, . . . N . Die maximale Anzahl N der linear unabhängigen Eigenfunktionen zum selben Eigen wert wird als Entartungsgrad bezeichnet. Jede Linearkombination der entarteten Ei genfunktionen ist wieder ein Eigenzustand zum selben Eigenwert. Die Gesamtheit der linear unabhängigen Eigenzustände spannt einen Unterraum von D A ⊆ ℍ, den Eigen raum von a auf, dessen Dimension der Entartungsgrad ist. Als Beispiel wollen wir einen unitären Operator U näher betrachten. Eine kleine Rechnung zeigt, dass die dazugehörigen Eigenwerte u durch eine komplexe Phase e iϕ gegeben sind, deren Betrag also identisch 1 ist. In der Tat, ist u ∈ ℂ ein Eigenwert von U zum Eigenvektor φ, Uφ = uφ , so gilt nach der Definition des unitären Operators (10.22) !
(Uφ, Uφ) = (uφ, uφ) = |u|2 (φ, φ) = (φ, φ) . Wegen φ ≠ o ist auch (φ, φ) > 0, und es folgt |u|2 = 1 , womit die Behauptung gezeigt ist.
10.3 Matrixdarstellung linearer Operatoren Es sei {φ k } ein vollständiges Orthonormalsystem im Hilbert-Raum ℍ. Wie wir oben bereits gesehen haben, können wir jeden Vektor ψ ∈ ℍ nach dieser Basis zerlegen (siehe Gleichung (10.11)): ψ = ∑ ψk φk ,
ψ k = (φ k , ψ) ,
(10.26)
k
wobei ψ k ∈ ℂ die Entwicklungskoeffizienten von ψ nach den Basisfunktionen φ k sind. Diese Koeffizienten ψ k charakterisieren eindeutig den Vektor ψ in ℍ ähnlich wie die Koordinaten eines Vektors im ℝ3 bezüglich eines Basissystems eindeutig diesen Vek tor bestimmen. Deshalb werden die ψ k als Koordinaten oder Komponenten von ψ be züglich der Basis φ k bezeichnet. Wir betrachten nun einen linearen Operator A in ℍ. Es gilt: Aψ = ϕ (10.27) für ein ϕ ∈ ℍ. Wir können auch ϕ nach dem vollständig orthonormierten System zerlegen: ϕ = ∑ ϕ k φ k , ϕ k = (φ k , ϕ) . (10.28) k
10.3 Matrixdarstellung linearer Operatoren
| 207
Setzen wir die Entwicklung (10.26) und (10.28) in die Operatorgleichung (10.27) ein, so finden wir:⁴ (10.29) ∑ ψ k Aφ k = ∑ ϕ k φ k . k
k
Bilden wir nun das Skalarprodukt von (10.29) mit φ i und benutzen die Orthonormali tät der Basisvektoren, so finden wir die Matrixgleichung ∑(φ i , Aφ k )ψ k = ϕ i . k
Die Matrixelemente A ik ≡ (φ i , Aφ k ) definieren die Matrixdarstellung des linearen (beschränkten) Operators A in der vollständigen orthonormierten Basis {φ k }. Auf diese Weise haben wir die Operator gleichung (10.27) auf ein (unendlichdimensionales) algebraisches Gleichungssystem ∑ A ik ψ k = ϕ i k
reduziert, das natürlich der ursprünglichen Operatorgleichung (10.27) völlig äquiva lent ist: ϕ1 ψ1 A11 A12 . . . ) (ψ2 ) = (ϕ2 ) . (A21 A22 .. .. .. .. . . . . Diese Matrixdarstellung demonstriert sehr anschaulich, dass der Hilbert-Raum ein Vektorraum ist. Die Matrix A ik hat i. A. unendlich viele Einträge, von denen aber nur abzählbar viele von null verschieden sind (in separablen Hilbert-Räumen ist das au tomatisch der Fall). Darüber hinaus müssen die Matrixelemente mit zunehmendem Index „klein“ werden, um die Konvergenz der Matrixdarstellung zu gewährleisten, ‖A‖ = ∑ ∑ |A ik |2 < ∞ . i
k
Ansonsten hat die Matrix A ik dieselben Eigenschaften wie der Operator A bezüglich Hermitizität, Unitarität etc. Ist A z. B. ein hermitescher Operator, so ist die Matrix A ik ebenfalls hermitesch, A∗ik = A ki ,
4 In dieser Gleichung haben wir die Summation mit der A-Operation vertauscht. Dies setzt natür lich die Linearität von A voraus, in unendlichdimensionalen Hilbert-Räumen aber zusätzlich die Beschränktheit von A, da der Limes k → ∞ mit der A-Operation vertauscht werden muss. Somit gilt (10.29) und die daraus folgende Matrixdarstellung streng genommen nur für lineare beschränkte Operatoren A.
208 | 10 Mathematische Grundlagen der Quantenmechanik
wovon man sich leicht überzeugt: A∗ik = (φ i , Aφ k )∗ = (Aφ k , φ i ) = (φ k , A† φ i ) = (φ k , Aφ i ) = A ki . Bilden die Eigenvektoren eines Operators A, Aφ i = a i φ i , eine vollständige orthonormierte Basis, dann ist die zugehörige Matrix A ik diagonal und durch seine Eigenwerte a i gegeben: A ik = a i δ ik . Wie aus der linearen Algebra bekannt, sind hermitesche Matrizen diagonalisierbar. Beschränkte hermitesche Operatoren sind deshalb ebenfalls diagonalisierbar. Die Spur Sp A eines Operators A ist durch die Spur der zugehörigen Matrixdarstel lung A ik definiert, d. h., es gilt: Sp A := ∑ A ii = ∑(φ i , Aφ i ) , i
i
sofern diese Reihe existiert. Man sagt in diesem Fall, dass A zur Spurklasse gehört. Wie für Matrizen ist die Spur eines Operators unabhängig von der benutzten Basis und für diagonalisierbare Spurklasseoperatoren durch die Summe seiner Eigenwerte gegeben: Sp A = ∑ a i . i
10.4 Die Dirac-Notation Es ist oft zweckmäßiger, aber auch übersichtlicher und eleganter, eine Theorie unab hängig vom Basissystem zu formulieren. Dies ist wohlbekannt aus der linearen Alge bra und der klassischen Mechanik. Zum Beispiel ist ein Vektor x = x i e i im ℝ3 un abhängig vom Koordinatensystem, nur seine Koordinaten (Komponenten entlang der Basisvektoren) x i = x ⋅ e i hängen von der Wahl des Koordinatensystems (also der Basisvektoren e i ) ab. Beim Übergang von einem Koordinatensystem zu einem neuen Bezugssystem {e i } → {ei } (z. B. durch Drehung der Basisvektoren) ändern sich i. A. die Koordinaten von x : xi = ei ⋅x ≠ x i , der Vektor x bleibt hingegen unverändert. Ähnlich ist es zweckmäßig, im Hilbert-Raum eine Darstellung zu benutzen, die unabhängig von der verwendeten Basis ist. Im ℝ3 fassen wir die Koordinaten x i eines Vektors x in einer orthonormalen Basis {e i } gewöhnlich zu einem Spaltenvektor zusammen. Zum Beispiel haben wir in einer kartesischen Basis: x1 x = ( x2 ) , x3
1 e1 = (0) , 0
0 e2 = (1) , 0
0 e3 = (0) . 1
10.4 Die Dirac-Notation
|
209
Ähnlich können wir die Koordinaten ψ i , ϕ i von Elementen ψ, ϕ des Hilbert-Raumes zu Spaltenvektoren ψ1
(φ1 , ψ)
ϕ1
(ψ2 ) = ((φ2 , ψ)) , .. .. . .
(φ1 , ϕ)
(ϕ2 ) = ((φ2 , ϕ)) .. .. . .
zusammenfassen und diese als Vektoren im Hilbert-Raum unabhängig von ihren Ko ordinaten betrachten. Im Unterschied zur linearen Algebra bezeichnen wir diese Vek toren nicht mit einem Pfeil (bzw. fett), sondern benutzen die von P. Dirac eingeführte Notation ψ1 ψ → (ψ2 ) = |ψ⟩ , .. .
(10.30)
die andeutet, dass ein Vektor ψ ∈ ℍ auf der rechten Seite eines Skalarproduktes ein gesetzt werden kann. Aus den Eigenschaften des Skalarproduktes (φ i , αψ) = α(φ i , ψ) ,
(φ i , ψ + ϕ) = (φ i , ψ) + (φ i , ϕ)
folgt: Summen von Zustandsvektoren |ψ⟩, |ϕ⟩ und Multiplikationen mit komplexen Zahlen α, β lassen sich dann wie in der linearen Algebra schreiben als: |αψ + βϕ⟩ = α|ψ⟩ + β|ϕ⟩ . Ebenfalls wie in der linearen Algebra führen wir den zu |ψ⟩ adjungierten oder dualen Vektor ⟨ψ| ein: ψ∗ → (ψ∗1 , ψ∗2 , . . . ) = ⟨ψ| .
(10.31)
Da nach den Regeln der Vektoralgebra †
ψ1 (ψ2 ) = (ψ∗1 , ψ∗2 , . . . ) , .. . folgt aus (10.30) und (10.31)
†
(|ψ⟩) = ⟨ψ| .
(10.32)
{⟨ψ|} ist der zu ℍ duale Raum ℍ∗ . Man beachte: Wäh
Der Raum der dualen Vektoren rend der Vektor |ψ⟩ in der Basis {φ i } die Koordinaten (φ i , ψ) = ψ i besitzt, hat der zugehörige duale Vektor ⟨ψ| die Koordinaten (ψ, φ i ) = (φ i , ψ)∗ = ψ∗i . Aus der Eigen schaft des Skalarproduktes (cψ, φ) = c∗ (ψ, φ)
∀c ∈ ℂ
210 | 10 Mathematische Grundlagen der Quantenmechanik
folgt, dass im dualen Raum Multiplikation mit komplexen Zahlen auf ⟨cψ| = c∗ ⟨ψ|
∀c ∈ ℂ
führt. Der duale Raum ist damit ein konjugiert linearer (oder antilinearer oder semili nearer) Raum, für den gilt: ⟨αϕ + βψ| = α ∗ ⟨ϕ| + β ∗ ⟨ψ| . Aus der oben angegebenen Definition des (zum linearen Operator A) adjungierten Operators A† folgt, dass dieser eine lineare Abbildung im dualen Raum ℍ∗ vermit telt, ⟨ϕ| → ⟨A† ϕ| , ähnlich wie A eine lineare Abbildung im ℍ definiert. Wie in der linearen Algebra können wir das Skalarprodukt eines dualen Vektors ⟨ϕ| mit einem Vektor |ψ⟩ einführen, das wir mit ⟨ϕ| |ψ⟩ oder einfach mit ⟨ϕ|ψ⟩ be zeichnen wollen:
⟨ϕ|ψ⟩ =
ψ1 ∗ ∗ (ϕ1 , ϕ2 , . . . ) (ψ2 ) .. .
= ϕ∗1 ψ1 + ϕ∗2 ψ2 + ⋅ ⋅ ⋅ = ∑ ϕ∗i ψ i .
(10.33)
i
Über das Skalarprodukt ⟨ϕ|ψ⟩ definiert jedes Element des dualen Vektorraumes ⟨ϕ| ∈ ℍ∗ ein line ar stetiges Funktional F ϕ , das jedem Vektor ψ ∈ ℍ eine komplexe Zahl ⟨ϕ|ψ⟩, das Skalarprodukt, zuordnet: F ϕ [ψ] = ⟨ϕ|ψ⟩ . (10.34) Diese Funktionale sind in der Tat linear, F ϕ [c 1 ψ 1 + c 2 ψ 2 ] = c 1 F ϕ [ψ 1 ] + c 2 F ϕ [ψ 2 ] , was unmittelbar aus der Definition des Skalarproduktes folgt. Umgekehrt kann jedes linear stetige Funktional F[ψ] in der Form (10.34) mit einem eindeutig be stimmten Vektor ϕ ∈ ℍ dargestellt werden (Riesz’scher Darstellungssatz). Es gibt somit eine bijektive Abbildung zwischen den Vektoren |ψ⟩ ∈ ℍ und den linear stetigen Funktionalen über ℍ, repräsentiert durch duale Vektoren ⟨ϕ| ∈ ℍ∗ . Ein Hilbert-Raum ist demnach selbstdual, ℍ = ℍ∗ .
Der Vergleich von Gleichungen (10.33) und (10.14) zeigt: ⟨ϕ|ψ⟩ = (ϕ, ψ) , d. h., das in Gleichung (10.33) definierte Skalarprodukt ⟨ϕ|ψ⟩ ist gleich dem oben be reits eingeführten gewöhnlichen Skalarprodukt im Hilbert-Raum (ϕ, ψ). Damit gilt insbesondere ⟨ϕ|ψ⟩∗ = ⟨ψ|ϕ⟩ . (10.35)
10.4 Die Dirac-Notation
|
211
Speziell für die Koordinaten oder Komponenten des Vektors ψ haben wir in dieser Notation: ψ i = (φ i , ψ) = ⟨φ i |ψ⟩ , und die Orthonormalität des Basissystems schreibt sich als: (φ i , φ k ) = ⟨φ i |φ k ⟩ = δ ik . Für die Zustände eines Funktionensatzes {φ i }, welche durch einen Index unterschie den werden, werden wir oftmals die abgekürzte Notation |φ i ⟩ → |i⟩ benutzen. In dieser Notation lauten die letzten beiden Beziehungen: ψ i = ⟨i|ψ⟩ ,
⟨i|k⟩ = δ ik .
Bezugnehmend auf das englische Wort „bracket“ für „Klammer“ wird die Notation ⟨ψ|ϕ⟩ nach Dirac als bra-c-ket-Darstellung bezeichnet, genauer: ⟨ψ|
bra-Vektor ∈ ℍ∗ ,
|ϕ⟩ ket-Vektor ∈ ℍ .
Im Folgenden wollen wir das Skalarprodukt zwischen einem Vektor ψ und einem Ei genzustand des Ortsoperators x̂ berechnen. Es sei ξ x die Eigenfunktion zum Eigen wert x des Ortsoperators, xξ̂ x = x ξ x , die in der Ortsdarstellung durch ξ x (x) = δ(x − x )
(10.36)
gegeben ist. In der bracket-Notation bezeichnen wir den „Eigenvektor“ (bzw. die Ei gendistribution) des Ortsoperators x̂ zum Eigenwert x mit |ξ x ⟩ ≡ |x⟩, d. h.: ̂ x|x⟩ = x|x⟩ . Berechnen wir das Skalarprodukt des Eigenvektors |x⟩ von x̂ zum Eigenwert x mit ei nem beliebigen Vektor |ψ⟩, so finden wir: ⟨x|ψ⟩ = (ξ x , ψ) = ∫dx ξ x∗ (x )ψ(x ) = ∫dx δ(x − x )ψ(x ) = ψ(x) . Die Wellenfunktion ψ(x) ist also durch das Skalarprodukt des Vektors ψ ∈ ℍ mit dem Ortseigenvektor zum Eigenwert x gegeben: ψ(x) = ⟨x|ψ⟩ .
212 | 10 Mathematische Grundlagen der Quantenmechanik
Wegen (10.35) gilt folglich auch ψ∗ (x) = ⟨ψ|x⟩ . Speziell die Basisfunktionen φ k (x) können wir in dieser Notation schreiben als: φ k (x) = ⟨x|φ k ⟩ = ⟨x|k⟩ .
(10.37)
Die Dirac-Notation macht aber auch deutlich, dass die Verwendung quadratinte grabler Funktionen im Ortsraum nur eine von vielen möglichen Darstellungen des (abstrakten) Zustandes |φ⟩ eines Quantensystems ist. Da letztlich alle Hilbert-Räume gleicher Dimension äquivalent sind, kann man hier eine beliebige Wahl treffen. Geht man z. B. von einer vollständigen Eigenbasis {φ i (x)} eines selbstadjungierten Opera tors A (siehe Abschnitt 10.5) aus (und unterscheidet in der Notation Aφ i (x) = a i φ i (x) nicht zwischen Punktspektrum und kontinuierlichem Spektrum), so kann ein belie biger Zustand ψ(x) äquivalent in der A-Darstellung ausgedrückt werden, ψ(x) → ψ(i) ≡ ⟨i | ψ⟩ ≡ ⟨φ i |ψ⟩ = ∫ dx φ∗i (x) ψ(x) = ∫ dx⟨i | x⟩⟨x | ψ⟩ .
(10.38)
Die ψ(i) sind aber gerade die in (10.26) eingeführten Koordinaten ψ i = (φ i , ψ) von ψ in der Basis {φ i }. Im Falle der Impulsdarstellung ψ(p) reduziert sich der Basiswech sel (10.38) auf die übliche Fourier-Transformation. In der bracket-Notation ist die Wirkung eines Operators A auf einen Vektor ψ (in basisunabhängiger Form) offenbar durch A|ψ⟩ = |Aψ⟩
(10.39)
gegeben. Hieraus folgt, dass die Matrixelemente eines Operators sich schreiben lassen als: A ik ≡ (φ i , Aφ k ) = ⟨φ i |Aφ k ⟩ =: ⟨φ i |A|φ k ⟩ ≡ ⟨i|A|k⟩ . Die Beziehung (10.17) lautet in der bracket-Notation ⟨A† ψ|φ⟩ = ⟨ψ|Aφ⟩ ≡ ⟨ψ|A|φ⟩ . Bilden wir das konjugiert Komplexe dieser Beziehung und beachten, dass ⟨φ|ψ⟩∗ = ⟨ψ|φ⟩, so folgt ⟨φ|A† ψ⟩ ≡ ⟨φ|A† |ψ⟩ = ⟨Aφ|ψ⟩ . Da nach (10.32)
†
⟨Aφ| = (|Aφ⟩) ≡ (A|φ⟩)†
(10.40)
10.4 Die Dirac-Notation
| 213
und ψ-beliebig, finden wir aus (10.40) (A|φ⟩)† = ⟨φ|A† .
(10.41)
Multiplizieren wir diese Gleichung skalar mit |ψ⟩ und beachten, dass nach Glei chung (10.32) |ψ⟩ = (⟨ψ|)† und ferner ⟨ψ|A|φ⟩† = ⟨ψ|A|φ⟩∗ , so erhalten wir ⟨ψ|A|φ⟩∗ = ⟨φ|A† |ψ⟩ .
(10.42)
Diese Beziehung ist natürlich eine unmittelbare Konsequenz aus der Definition (10.17) des adjungierten Operators ⟨ψ|A|φ⟩∗ ≡ ⟨ψ|Aφ⟩∗ = ⟨Aφ|ψ⟩ = ⟨φ|A† ψ⟩ ≡ ⟨φ|A† |ψ⟩ . Mit (10.39) lautet die Eigenwertgleichung (10.25) in der Dirac-Notation A|φ⟩ = a|φ⟩ .
(10.43)
Bilden wir das hermitesch Adjungierte dieser Gleichung, so folgt mit (10.32) und (10.41) ⟨φ|A † = ⟨φ|a∗ .
(10.44)
In der Dirac-Notation lautet die Koordinatendarstellung (10.13) des Skalarproduktes: ⟨ϕ|ψ⟩ = ∑⟨ϕ|φ i ⟩⟨φ i |ψ⟩ ≡ ∑⟨ϕ|i⟩⟨i|ψ⟩ . i
Beachten wir, dass
i
̂ ⟨ϕ|ψ⟩ ≡ ⟨ϕ|1|ψ⟩ ,
so erhalten wir: ̂ ⟨ϕ|1|ψ⟩ = ∑⟨ϕ|i⟩⟨i|ψ⟩ = ⟨ϕ| (∑ |i⟩⟨i|) |ψ⟩ . i
i
Da diese Beziehung für beliebige ψ, ϕ ∈ ℍ gilt, muss sie auch als Operatoridentität gelten: 1̂ = ∑ |i⟩⟨i| .
(10.45)
i
Dies ist die Vollständigkeitsrelation in der Dirac-Notation. Der Einsoperator 1̂ ist dem nach durch die Summe der Projektoren P i = |i⟩⟨i| (siehe Abschnitt 10.6) auf den eindi mensionalen Unterraum jedes Hilbert-Basisvektors |i⟩ gegeben (und i. A. auch durch ein Integral über den kontinuierlichen Teil des Spektrums).
214 | 10 Mathematische Grundlagen der Quantenmechanik
Das Produkt |φ⟩⟨ψ| aus einem ket- |φ⟩ und einem bra-Vektor ⟨ψ| wird als dyadisches Produkt bezeichnet. Das dyadische Produkt ist ein Operator im Hilbert-Raum mit der Eigenschaft (|φ⟩⟨ψ|)† = |ψ⟩⟨φ| , die aus (10.19) und (10.32) folgt. Für φ = ψ repräsentiert das dyadische Produkt |φ⟩⟨ψ| einen hermiteschen Operator, für ψ ≠ φ einen nicht hermiteschen. Für seine Spur gilt: Sp(|φ⟩⟨ψ|) = ⟨ψ|φ⟩ .
(10.46)
Letztere Beziehung beweist man durch Einsetzen eines vollständigen Basissystems (10.45): ̂ Sp(|φ⟩⟨ψ|) = ∑⟨i|φ⟩⟨ψ|i⟩ = ∑⟨ψ|i⟩⟨i|φ⟩ = ⟨ψ|(∑ |i⟩⟨i|)|φ⟩ = ⟨ψ|1|φ⟩ = ⟨ψ|φ⟩ . i
i
i
̂ Die Matrixelemente des 1-Operators in der Ortsdarstellung sind durch ̂ ⟩ = ⟨x |x ⟩ = (ξ x , ξ x ) = ∫dx δ(x − x )δ(x − x ) = δ(x − x ) ⟨x |1|x gegeben. In der Dirac-Notation erhalten wir deshalb für die δ-Funktion (siehe An hang (A) die Darstellung ⟨x|x ⟩ = δ(x − x ) .
(10.47)
Setzen wir jetzt für den Einheitsoperator die Vollständigkeitsrelation (10.45) ein, so erhalten wir mit (10.37): ̂ ⟩ = ∑⟨x|i⟩⟨i|x ⟩ = ∑ φ i (x)φ∗ (x ) . ⟨x|x ⟩ = ⟨x|1|x i i
i
Damit lautet die Vollständigkeitsrelation in der Koordinatendarstellung: ∑ φ i (x)φ∗i (x ) = δ(x − x ) . i
Die Dirac’sche Notation versteckt viele Subtilitäten der zugrunde liegenden HilbertRaum-Theorie, macht aber andererseits den Umgang mit Zuständen und Operatoren sehr intuitiv und bequem. Sie ist in der physikalischen Literatur heute die Standard notation der Quantenmechanik.
10.5 Eigenschaften hermitescher Operatoren
| 215
10.5 Eigenschaften hermitescher Operatoren Für die Quantenmechanik sind die linearen hermiteschen Operatoren von besonderer Bedeutung, da alle physikalischen Observablen durch solche Operatoren repräsen tiert werden.⁵ Wir wollen deshalb einige Eigenschaften von hermiteschen Operato ren untersuchen. Insbesondere sollen die wichtigsten Spektraleigenschaften hermi tescher Operatoren angegeben werden. 1.
Erwartungswerte hermitescher Operatoren sind reell. In der Tat, für φ, ψ ∈ D A = D A † folgt aus Gleichung (10.42) wegen A = A† : ⟨ψ|A|φ⟩∗ = ⟨φ|A|ψ⟩ . Setzen wir hierin ψ = φ, so erhalten wir das gewünschte Resultat ⟨φ|A|φ⟩∗ = ⟨φ|A|φ⟩ .
2.
Eigenwerte hermitescher Operatoren sind reell. Die Eigenwerte a eines Operators A können wir schreiben als: a=
3.
⟨φ|A|φ⟩ , ⟨φ|φ⟩
wobei φ die zugehörige Eigenfunktion ist. Da Zähler und Nenner reell sind, muss auch a reell sein. Für normierte Eigenfunktionen ist der Erwartungswert offensichtlich gleich dem Eigenwert. Eigenzustände hermitescher Operatoren sind orthogonal. Per Definition haben wir: A|φ i ⟩ = a i |φ i ⟩ und somit: ⟨φ k |A|φ i ⟩ = a i ⟨φ k |φ i ⟩ . Da außerdem A hermitesch ist und folglich seine Eigenwerte reell sind, gilt nach (10.44) auch: ⟨φ k |A|φ i ⟩ = a k ⟨φ k |φ i ⟩ . Ziehen wir die letzten beiden Gleichungen voneinander ab, so finden wir: 0 = (a k − a i )⟨φ k |φ i ⟩ , woraus für a i ≠ a k die Behauptung ⟨φ k |φ i ⟩ = 0 folgt.
5 Allerdings werden die physikalischen Observablen gewöhnlich durch nicht beschränkte und daher auch nicht stetige Operatoren beschrieben. Wegen des Satzes von Hellinger und Toeplitz können diese Operatoren deshalb nicht auf dem gesamten Hilbert-Raum definiert sein.
216 | 10 Mathematische Grundlagen der Quantenmechanik
Der Beweis gilt nur für je zwei verschiedene Eigenwerte. Innerhalb eines Eigenraumes (d. h. im Unterraum der zu einem entarteten Eigenwert gehörenden linear unabhängigen Eigenfunk tionen) können wir jedoch die Eigenfunktionen orthogonalisieren.
4.
Die Eigenzustände eines hermiteschen Operators bilden eine vollständige or thogonale Basis (VONS) für den Definitionsbereich dieses Operators im HilbertRaum.⁶ Auf den Beweis soll hier verzichtet werden, da Vollständigkeit nicht sehr ein fach zu zeigen ist.
Multiplizieren wir einen beliebigen Operator A von rechts und links mit dem Eins operator (10.45), so erhalten wir: ̂ 1̂ = (∑ |i⟩⟨i|) A (∑ |k⟩⟨k|) A = 1A i
k
= ∑ ∑ |i⟩⟨i|A|k⟩⟨k| . i
k
Wir nehmen nun an, dass A hermitesch ist und der Einfachheit halber ein reines Punktspektrum (diskretes Spektrum) besitzen möge. Folglich können wir die Eigen vektoren von A als Basis wählen, d. h.: A|i⟩ = a i |i⟩ . Benutzen wir die Orthonormiertheit der Basis, ⟨i|k⟩ = δ ik , so erhalten wir: A = ∑ |i⟩a i ⟨i| .
(10.48)
i
Dies ist die sogenannte Spektraldarstellung des Operators A. Sie drückt A durch seine Eigenwerte a i und Eigenfunktionen |i⟩ aus. Die Gesamtheit der Eigenwerte {a i } von A wird bekanntlich als das Spektrum von A bezeichnet, wobei die Summe über die Projektoren |i⟩⟨i| in (10.48) i. A. auch ein Integral über den kontinuierlichen Teil des Spektrums enthalten kann. Die Vollständigkeitsrelation (10.45) ist offenbar die Spek traldarstellung des Einheitsoperators. Aus der Spektraldarstellung (10.48) erhalten wir für die Matrixelemente eines be liebigen Operators A in der Ortsdarstellung: ⟨x|A|x ⟩ = ∑⟨x|i⟩a i ⟨i|x ⟩ = ∑ φ i (x)a i φ∗i (x ) . i
i
6 Neben dem diskreten (Punkt-)Spektrum muss (falls vorhanden) auch der kontinuierliche Teil des Spektrums berücksichtigt werden.
10.5 Eigenschaften hermitescher Operatoren
| 217
Wie bereits oben bemerkt, die Eigenwerte a i eines Operators A müssen nicht notwen digerweise nur diskrete Werte annehmen, sondern können auch kontinuierlich über ein Intervall verteilt sein. In diesem Fall ist der „Index“ i, den wir oben zur Numme rierung der Eigenwerte eingeführt haben, eine kontinuierliche Variable, und statt der Summation über i haben wir dann eine Integration über i: ∑
→
i
∫ . i
Um Operatoren mit diskretem und kontinuierlichem Spektrum gemeinsam behandeln zu können, führt man das Symbol ∑ ∫
(10.49)
i
ein, das, je nachdem ob i eine diskrete oder kontinuierliche Variable ist, Summation oder Integration über i bedeutet. Ein Beispiel für einen Operator mit einem kontinuierlichen Spektrum ist der Im puls eines freien Teilchens, dessen Eigenfunktionen (in der Ortsdarstellung) i φ p (x) = ⟨x|p⟩ wir bereits als die ebenen Wellen φ p (x) = e ℏ px identifiziert hatten. Die Fourier-Zerlegung der δ-Funktion ∞
dp i p(x−x) eℏ 2πℏ
δ(x − x ) = ∫ −∞
besitzt in der Dirac’schen bracket-Notation (10.47) die Form ∞
⟨x|x ⟩ = ∫ −∞
dp ⟨x|p⟩⟨p|x ⟩ 2πℏ
(10.50)
mit ⟨p|x⟩ = ⟨x|p⟩∗ = φ∗p (x) ,
i
⟨x|p⟩ = φ p (x) = e ℏ px , den Impulseigenfunktionen im Ortsraum:
ℏ d . (10.51) i dx Wir haben hier, wie allgemein üblich, den Faktor 1/2πℏ mit in das Integrationsmaß einbezogen. (Ansonsten würden die ebenen Wellen ⟨x|p⟩, ⟨p|x⟩ einen zusätzlichen Normierungsfaktor 1/√2πℏ enthalten.) Dieser Faktor tritt dann auch in der Normie rung der Impulseigenzustände auf: ̂ p|p⟩ = p|p⟩ ,
p̂ =
∞
⟨p|p ⟩ ≡ (φ p , φ p ) = ∫ dx φ∗p (x)φ p (x) −∞ ∞
∞
= ∫ dx ⟨p|x⟩⟨x|p ⟩ = ∫ dx e− ℏ x(p−p ) i
−∞
= 2πℏδ(p − p ) .
−∞
(10.52)
218 | 10 Mathematische Grundlagen der Quantenmechanik ̂ ⟩ den Einheitsoperator in der Impulsdarstel Aus (10.50) lesen wir mit ⟨x|x ⟩ ≡ ⟨x|1|x lung ab: ∞
dp 1̂ = ∫ |p⟩⟨p| . 2πℏ
(10.53)
−∞
̂ ⟩ aus (10.52) die Ortsdarstellung des In analoger Weise lesen wir mit ⟨p|p ⟩ ≡ ⟨p|1|p Einheitsoperators ab: ∞
1̂ = ∫ dx |x⟩⟨x| .
(10.54)
−∞
Mit der Beziehung (10.53) und der Eigenwertgleichung (10.51) erhalten wir die Spek traldarstellung des Impulsoperators: ∞
p̂ = ∫ −∞
dp |p⟩p⟨p| . 2πℏ
Hieraus ergibt sich für dessen Matrixelemente in der Ortsdarstellung: ∞
̂ ⟩= ∫ ⟨x|p|x −∞
dp ⟨x|p⟩p⟨p|x ⟩ . 2πℏ
Drücken wir hier die Impulsvariable p als Ableitung der ebenen Welle ⟨x|p⟩ nach dem Ort aus, ℏ d i px ̂ , e ℏ = p⟨x|p⟩ p⟨x|p⟩ = i dx und benutzen (10.50), so erhalten wir schließlich für die Matrixelemente des Impuls operators in der Ortsdarstellung: ̂ ⟩ = p⟨x|x ̂ ⟨x|p|x ⟩=
ℏ d δ(x − x ) . i dx
(10.55)
Man beachte, dass die Differenziation bezüglich dem linken Argument zu nehmen ist. Für die Wirkung des Impulsoperators p̂ auf einem beliebigen Zustandsvektor |φ⟩ fin den wir mit (10.54) das bekannte Resultat ∞
̂ ̂ ̂ ̂ ⟩⟨x |φ⟩ ⟨x|pφ⟩ = ⟨x|p|φ⟩ = ⟨x|p̂ 1|φ⟩ = ∫ dx ⟨x|p|x −∞ ∞
= ∫ dx −∞
∞
ℏ d ℏ d ∫ dx δ(x − x )φ(x ) ( δ(x − x )) φ(x ) ≡ i dx i dx
ℏ d ̂ φ(x) = pφ(x) . = i dx
−∞
10.5 Eigenschaften hermitescher Operatoren
| 219
Schließlich betrachten wir noch die Matrixelemente eines Potenzials V(x) in der Orts darstellung. Unter Benutzung der Eigenfunktionen des Ortsoperators (10.36) erhalten wir: ⟨x|V|x ⟩ ≡ ⟨x|Vx ⟩ ≡ ⟨ξ x |Vξ x ⟩ = (ξ x , Vξ x ) ∞
= ∫ dx ξ x∗ (x )V(x )ξ x (x ) −∞ ∞
= ∫ dx δ(x − x)V(x )δ(x − x ) −∞
= V(x)δ(x − x ) .
(10.56)
Orts- und Impulseigenfunktionen sind streng genommen keine Elemente des Hilbert-Raumes 𝕃2 , son dern Eigendistributionen, vgl. Abschnitt 10.2. Elemente des Hilbert-Raumes 𝕃2 lassen sich jedoch durch Überlagerungen von Orts- bzw. Impulseigenfunktionen formen. So bilden z. B. die Ortsfunk tionen (x − x i )2 1 1/4 ⟨x|x i ⟩a = ( ) exp (− ) , πa 2a welche Gauß’sche Wellenpakete darstellen, ∞
⟨x|x i ⟩a = ∫ −∞
i dp a exp (− 2 p 2 ) e ℏ p(x−xi ) , 2πℏ 2ℏ
normierte Zustände des Hilbert-Raumes 𝕃2 , a ⟨x i |x i ⟩a
=1,
die sich im Limes a → 0 auf die Wurzel der Ortseigenfunktionen reduzieren: lim (⟨x|x i ⟩a )2 = δ(x − x i ) .
a→0
Abschließend wollen wir noch eine wichtige Eigenschaft von hermiteschen Operato ren zeigen: 5.
Zwei hermitesche Operatoren A, B sind genau dann vertauschbar [A, B] = 0, wenn jede Eigenfunktion von A auch Eigenfunktion von B ist und umgekehrt, d. h., ein vollständiges orthogonales System von gemeinsamen Eigenfunktio nen von A und B existiert.
Dieser Satz gilt auch für Funktionen f(A) und g(B) von hermiteschen Operatoren A und B, siehe Anhang (C.1. Der Beweis ist in beide Richtungen zu führen, wobei wir der Einfachheit halber davon ausgehen, dass A und B ein rein diskretes Spektrum besitzen und auf ganz ℍ definiert sind:
220 | 10 Mathematische Grundlagen der Quantenmechanik
1.
Wir nehmen an, dass A und B gemeinsame Eigenfunktionen besitzen: A|ϕ n ⟩ = a n |ϕ n ⟩ ,
B|ϕ n ⟩ = b n |ϕ n ⟩ .
Wirken wir von links auf diese beiden Gleichungen mit B bzw. A, so erhalten wir: BA|ϕ n ⟩ = a n B|ϕ n ⟩ = a n b n |ϕ n ⟩ , AB|ϕ n ⟩ = b n A|ϕ n ⟩ = b n a n |ϕ n ⟩ . Subtraktion dieser beiden Gleichungen voneinander liefert: [A, B]|ϕ n ⟩ = o . Da die ϕ n Eigenfunktionen eines hermiteschen Operators sind, bilden sie ein vollständiges Funk tionensystem, nach dem wir eine beliebige Funktion ψ entwickeln können. Damit gilt für beliebi ge ψ ∈ ℍ: [A, B]|ψ⟩ = o , was [A, B] = 0̂ impliziert. 2.
Wir setzen jetzt voraus, dass A und B kommutieren, AB = BA ,
(10.57)
und die ϕ n Eigenfunktionen von A sind: A|ϕ n ⟩ = a n |ϕ n ⟩ . Wenden wir den Operator B auf diese Eigenwertgleichung an, BA|ϕ n ⟩ = a n B|ϕ n ⟩ , erhalten wir mit Gleichung (10.57): A(B|ϕ n ⟩) = a n (B|ϕ n ⟩) .
(10.58)
Wir erkennen, dass B|ϕ n ⟩ ebenfalls Eigenvektor von A zum Eigenwert a n ist. Wir setzen zunächst voraus, dass die Eigenwerte von A nicht entartet sind. Dann müssen Bϕ n und ϕ n denselben Eigenvektor von A repräsentieren, d. h., Bϕ n und ϕ n dürfen sich nur um eine komplexe Zahl b n unterscheiden: B|ϕ n ⟩ = b n |ϕ n ⟩ . Damit ist aber ϕ n auch Eigenvektor von B mit Eigenwert b n und der Satz ist bewiesen. Sind die Eigenwerte von A entartet, d. h., es existieren mehrere ϕ ni , i = 1, . . . , N n , zum selben Eigenwert a n , A|ϕ ni ⟩ = a n |ϕ ni ⟩ , i = 1, . . . N n , so können wir die ϕ ni dennoch als linear unabhängig annehmen. Anderenfalls wäre der Entar tungsgrad kleiner als N n . Wir können deshalb die linear unabhängigen Eigenfunktionen ortho normieren: ⟨ϕ ni |ϕ nk ⟩ = δ ik . Das Analogon der obigen Gleichung (10.58) lautet jetzt: AB|ϕ ni ⟩ = a n B|ϕ ni ⟩ .
10.6 Projektionsoperatoren
| 221
Aus dieser Gleichung folgt, dass die Zustände B|ϕ ni ⟩ vollständig im Unterraum der ϕ ni liegen müssen, d. h., der Operator B führt nicht aus dem Eigenraum des Eigenwertes a n heraus. Somit gilt die Zerlegung (n) B|ϕ nk ⟩ = ∑ |ϕ ni ⟩⟨ϕ ni |B|ϕ nk ⟩ =: ∑ |ϕ ni ⟩B ik . i
i
(n) Die hierbei auftretenden Entwicklungskoeffizienten B ik sind die Matrixelemente von (n) † raum von a n . Wegen B = B ist B ik eine hermitesche Matrix, (n)∗
B ik
B im Eigen
(n)
= B ki ,
die wir folglich diagonalisieren können: (n) (n,α)
B ik χ k
(n,α)
= b n,α χ i
.
Hierbei unterscheidet der Index α = 1, 2, . . . , N n die verschiedenen Eigenwerte b n,α zu einem festem n. Die Funktionen (n,α) |χ (n,α) ⟩ = ∑ χ i |ϕ ni ⟩ i
sind dann Eigenfunktionen sowohl von A (zum Eigenwert a n ) als auch von B (zum Eigenwert b n,α ). Falls die Eigenwerte b n,α nicht entartet sind, sind die |χ (n,α) ⟩ zu verschiedenem α automatisch orthogonal. Anderenfalls sind sie zumindest linear unabhängig und können orthogonalisiert wer den. Damit ist der Satz bewiesen.
Der hier angegebene Beweis setzt nicht voraus, dass die beiden Operatoren A und B tatsächlich hermitesch, sondern lediglich diagonalisierbar sind. Eine beliebige Funk tion f(A) eines hermiteschen Operators A = A† ist offenbar ebenfalls diagonalisierbar, auch wenn f(A) i. A. nicht hermitesch sein wird. Dies folgt aus der Definition von f(A) durch seine Taylor-Entwicklung (siehe Anhang (C.1). Eine Eigenfunktion von A zum Eigenwert a ist auch Eigenfunktion von f(A) zum Eigenwert f(a). Deshalb gilt der obige Satz auch für zwei Funktionen f(A) und g(B) von hermiteschen Operatoren A und B.
10.6 Projektionsoperatoren Bei einer reduzierten Beschreibung eines quantenmechanischen Systems in einem Unterraum ℙ ∈ ℍ ist es oft zweckmäßig, Projektionsoperatoren zu benutzen. Projekti onsoperatoren sind durch die Bedingung P2 = P
(10.59)
definiert. Solche Operatoren heißen auch idempotent. Man sieht leicht, dass Projek tionsoperatoren nur die Eigenwerte 0 und 1 besitzen können. In der Tat, wenden wir den Projektionsoperator P auf die Eigenwertgleichung P|φ⟩ = λ|φ⟩
222 | 10 Mathematische Grundlagen der Quantenmechanik
an, so erhalten wir: P2 |φ⟩ = λ2 |φ⟩ und mit (10.59): P2 |φ⟩ = P|φ⟩ = λ|φ⟩ . Subtraktion der beiden Gleichungen liefert (da φ ≠ o): λ2 − λ = λ(λ − 1) = 0 , was λ = 0, 1 impliziert. Ist der Projektionsoperator P außerdem selbstadjungiert (hermitesch) P† = P, so wird er als Orthogonalprojektor bezeichnet. Im Folgenden werden wir uns auf Ortho gonalprojektoren beschränken, sie der Einfachheit halber aber häufig nur Projektoren nennen. Ein Orthogonalprojektor projiziert jeden Vektor φ ∈ ℍ in seinen Wertebereich W P = {Pφ, φ ∈ ℍ} und gestattet, jeden Vektor in einen Teil φ‖ ∈ W P und einen zu W P senkrechten Teil φ⊥ zu zerlegen: φ = Pφ + (φ − Pψ) ≡ φ‖ + φ⊥ . Aus der Definition der Projektoren ergeben sich unmittelbar folgende Eigenschaften: – Das Produkt zweier Projektoren P1 P2 ist genau dann ein Projektor, falls [P1 , P2 ] = 0. In diesem Fall projiziert P1 P2 die Vektoren φ ∈ ℍ auf den Durch schnitt der Bildräume, W P1 ∩ W P2 , und P1 P2 = 0 impliziert, dass W P1 ⊥ W P2 . – Die Summe P1 + P2 ist genau dann ein Projektor, falls P1 P2 = P2 P1 = 0. Ein häufig auftretendes Beispiel eines Orthogonalprojektors ist das dyadische Produkt eines normierten Vektors φ mit sich selbst: P φ := |φ⟩⟨φ| ,
‖φ‖2 = ⟨φ|φ⟩ = 1 .
Dieser Operator projiziert einen beliebigen Zustand ψ auf die Richtung des Vektors φ: P φ ψ = |φ⟩⟨φ|ψ⟩ = ⟨φ|ψ⟩|φ⟩ . Einen Projektionsoperator erhält man auch, wenn man in der Spektraldarstellung des Einheitsoperators die Summation über das vollständige Funktionensystem auf ein Teilsystem einschränkt:
P = ∑ |i⟩⟨i| = ∑ P i , i
P i = |i⟩⟨i| ,
i
wobei der Strich am Summationszeichen die eingeschränkte Summation bezeichnet. Die einzelnen Summanden P i sind natürlich selbst auch Projektionsoperatoren. Die Spur dieses Projektors (vgl. (10.46))
Sp P = ∑ Sp(|i⟩⟨i|) = ∑ ⟨i|i⟩ = ∑ 1 =: d i
i
i
liefert die Dimension d des Unterraumes, der durch das Teilsystem {|i⟩} aufgespannt wird.
10.7 Das Tensorprodukt |
223
10.7 Das Tensorprodukt Der Produkt-Hilbert-Raum Für die quantenmechanische Beschreibung von zusammengesetzten Systemen, ins besondere von Vielteilchensystemen wird das Tensorprodukt von Hilbert-Räumen be nötigt, das im Folgenden definiert wird. ℍ1 und ℍ2 seien zwei Hilbert-Räume mit jeweils vollständigem Orthonormalsys tem (VONS), {φ i∈I } bzw. {η k∈K }. Aus den Basisvektoren φ i und η k bilden wir formal alle Paare⁷ ψ l ≡ φ i ⊗ η k := (φ i , η k ) (10.60) mit l = (i, k) ∈ Λ = I × K , wobei Λ das kartesische Produkt der beiden Indexmengen I und K ist. Das Symbol „⊗“ definiert hier eine formale Verknüpfung von zwei Elementen φ i und η k aus verschie denen Räumen ℍ1 und ℍ2 zu einem Paar (φ i , η k ) =: φ i ⊗ η k , die als Tensorprodukt bezeichnet wird. Für das Tensorprodukt sind folgende Rechenregeln vereinbart: (φ + φ ) ⊗ η = φ ⊗ η + φ ⊗ η φ ⊗ (η + η ) = φ ⊗ η + φ ⊗ η
(10.61)
cφ ⊗ η = c(φ ⊗ η) = φ ⊗ cη ,
c∈ℂ.
Die Vektorpaare (10.60) bilden die Basis für den (Tensor-)Produktraum ℍ1 ⊗ ℍ2 , der wie folgt definiert ist: Die Gesamtheit der Linearkombinationen ψ = ∑ c l ψ l = ∑ ∑ c(k,i) φ i ⊗ η k , l∈Λ
c l = c(k,i) ∈ ℂ ,
(10.62)
i∈I k∈K
mit höchsten abzählbar vielen c l bzw. c(k,i) von null verschieden, bildet einen linearen Raum, der durch das Skalarprodukt (ψ, ψ ) = ∑ c∗l c l
(10.63)
l∈Λ
unitär wird und den Produkt-Hilbert-Raum ℍ = ℍ1 ⊗ ℍ2 = {ψ = ∑ c(k,i) φ i ⊗ η k , i,k
mit ∑ |c(k,i)|2 < ∞}
(10.64)
i,k
7 Das Symbol ( , ) steht hier nicht für das Skalarprodukt, sondern für Paare von Elementen aus zwei verschiedenen Mengen.
224 | 10 Mathematische Grundlagen der Quantenmechanik
definiert. Die Dimension des Produktraumes ergibt sich offenbar als das Produkt der Dimensionen der einzelnen Faktoren.⁸ Das oben in Gleichung (10.63) definierte Skalarprodukt des Tensorproduktrau mes ℍ (10.64) ergibt sich zwangsläufig, wenn das Skalarprodukt für die Tensorpro dukte durch (φ ⊗ η, φ ⊗ η ) = (φ, φ )1 (η, η )2 , definiert wird, wobei ( , )1 und ( zeichnen. In diesem Fall gilt
,
φ, φ ∈ ℍ1 ,
η, η ∈ ℍ2
)2 die Skalarprodukte in ℍ1 bzw. ℍ2 be
(φ i ⊗ η k , φ i ⊗ η k ) = (φ i , φ i )1 (η k η k )2 = δ ii δ kk , und das oben eingeführte Skalarprodukt (10.63) in ℍ folgt zwangsläufig aus der Zer legung (10.62). Als Beispiel wählen wir ℍ1 = ℍ2 = 𝕃2 (ℝ) , den Raum der über ℝ quadratintegrablen Funktionen. In diesem Fall erhalten wir für den Produktraum (10.64) 𝕃2 (ℝ) ⊗ 𝕃2 (ℝ) = 𝕃2 (ℝ2 ) , die über ℝ2 quadratintegrablen Funktionen von zwei reellen Variablen f(x1 , x2 ), mit (x1 , x2 ) ∈ ℝ2 , da diese sich durch Linearkombinationen der Form f(x1 , x2 ) = ∑ a ik φ i (x1 )η k (x2 ) i,k
darstellen lassen, wobei φ i (x1 ) ∈ ℍ1 und η k (x2 ) ∈ ℍ2 die über ℝ quadratintegrablen Funktionen sind.
Operatoren auf Produkt-Hilbert-Räumen Wir betrachten zwei Operatoren A und B, die in verschiedenen Hilbert-Räumen ℍ A bzw. ℍ B definiert sind. Wir können die Operatoren A und B zu Operatoren in dem Produkt-Hilbert-Raum ℍA ⊗ ℍB (10.65)
8 Das Tensorprodukt ist streng zu unterscheiden vom sogenannten direkten Produkt (auch direkte Summe genannt) ℍ = ⨁ ℍi , also der Menge der (Linearkombinationen von) Tupel mit Komponenten aus ℍi , versehen mit komponentenweisen Vektorraumoperationen und dem Skalarprodukt (φ, ψ) = ∑(φ i , ψ i ) ,
φ i , ψ i ∈ ℍi .
i
Die Dimension von ⨁ ℍi ist die Summe der Einzeldimensionen der ℍi . Man mache sich besonders den Unterschied zwischen ℝ ⊕ ℝ ⊕ ℝ ≃ ℝ3 und ℝ ⊗ ℝ ⊗ ℝ ≃ ℝ klar.
10.7 Das Tensorprodukt |
225
erheben, indem wir sie tensoriell mit dem Einheitsoperator des jeweiligen anderen Raumes multiplizieren: A → A ⊗ 1̂ B ,
B → 1̂ A ⊗ B ,
wobei 1̂ A bzw. 1̂ B die Einheitsoperatoren in ℍ A bzw. ℍ B sind. Da die Operatoren auf der rechten Seite der Pfeile im selben Hilbert-Raum definiert sind, können sie auf ge wöhnliche Weise addiert werden. Für die in unterschiedlichen Hilbert-Räumen defi nierten Operatoren A und B definieren wir deshalb ihre Summe durch A + B := A ⊗ 1̂ B + 1̂ A ⊗ B .
(10.66)
In Übereinklang mit den oben angegebenen Rechenregeln für das Tensorprodukt de finieren wir die Wirkung von Operatoren A und B in den Hilbert-Räumen ℍA bzw. ℍ B für das Tensorprodukt der Zustände dieser Räume φ A ∈ ℍ A und φ B ∈ ℍ B durch (A ⊗ B) (|φ A ⟩ ⊗ |φ B ⟩) := A|φ A ⟩ ⊗ B|φ B ⟩ .
(10.67)
Nun seien |φ a ⟩ und |φ b ⟩ Eigenfunktionen der Operatoren A und B: A|φ a ⟩ = a|φ a ⟩ ,
|φ a ⟩ ∈ ℍ A
B|φ b ⟩ = b|φ b ⟩ ,
|φ b ⟩ ∈ ℍB .
Es ist dann leicht zu sehen, dass das Tensorprodukt |φ a ⟩ ⊗ |φ b ⟩ Eigenfunktion der Operatorsumme A + B (10.66), die im Produkt-Hilbert-Raum (10.65) definiert ist, mit dem Eigenwert a + b ist, wie man leicht unter Anwendung der Re geln (10.67) und (10.61) zeigt: (A + B)|φ a ⟩ ⊗ |φ b ⟩ = (A ⊗ 1̂ B + 1̂ A ⊗ B) |φ a ⟩ ⊗ |φ b ⟩ = A|φ a ⟩ ⊗ 1̂ B |φ b ⟩ + 1̂ A |φ a ⟩ ⊗ B|φ b ⟩ = a|φ a ⟩ ⊗ |φ b ⟩ + |φ a ⟩ ⊗ b|φ b ⟩ =(a + b)|φ a ⟩ ⊗ |φ b ⟩ .
(10.68)
Zur Vereinfachung der Notation werden wir, falls Verwechslung ausgeschlossen ist, das Symbol für das Tensorprodukt „⊗“ gewöhnlich weglassen. Die Eigenwertglei chung (10.68) lautet dann in dieser vereinfachten Schreibweise (A + B)|φ a ⟩|φ b ⟩ = (a + b)|φ a ⟩|φ b ⟩ .
11 Axiomatische Quantenmechanik Bei der Entwicklung der Quantenmechanik sind wir vom Experiment ausgegan gen. Interferenzerscheinungen beim Doppelspaltexperiment deuten auf den Wellen charakter von quantenmechanischen Teilchen hin. Eine detailliertere Analyse dieses Experimentes zeigte, dass im atomaren Bereich ein Teilchen sich nicht nur auf der klassischen Trajektorie bewegen kann, welche die Wirkung minimiert, sondern auf allen möglichen Trajektorien. Die verschiedenen Trajektorien stellen Alternativen für das Teilchen dar. Wir hatten gesehen, dass ein quantenmechanisches Teilchen von allen möglichen Alternativen Gebrauch macht. Aufgrund der Wellennatur des quantenmechanischen Teilchens hatten wir geschlossen, dass ein quantenmechani scher Prozess durch eine Wahrscheinlichkeitsamplitude charakterisiert wird und dass wegen des bei Wellen realisierten Superpositionsprinzips die Gesamtwahrscheinlich keitsamplitude durch die Summe der Wahr scheinlichkeitsamplituden der einzelnen Trajektorien gegeben sein muss: K(b, a) = ∑ K[x(t)](b, a) . {x(t)}
Durch konsequente Weiterentwicklung bzw. Verfeinerung des Doppelspaltexperimen tes hatten wir ein Additionstheorem für die Wahrscheinlichkeitsamplituden gefun den, den sogenannten Zerlegungssatz: K(b, a) = ∫ dx c K(b, c)K(c, a) . Wir hatten gesehen, dass die Phase der Amplitude eine additive Funktion der Trajek torie sein muss. Durch Identifizierung dieser additiven Funktion mit der klassischen Wirkung S[x], i K[x](b, a) ∼ e ℏ S[x](b,a) , gelang es uns dann, aus dem Additionstheorem für Amplituden die zeitabhängige Schrödinger-Gleichung abzuleiten: iℏ
∂ψ = Hψ . ∂t
Zu diesem intuitiven Zugang zur Quantenmechanik, der ausgehend vom Experiment nur wenig Annahmen erfordert, gibt es einen alternativen axiomatischen Zugang, der von einigen Grundpostulaten der Quantenmechanik ausgeht. In diesem axio matischen Zugang wird kein Versuch unternommen, das zentrale Evolutionsgesetz der Quantenmechanik, die Schrödinger-Gleichung, unter möglichst wenigen Voraus setzungen abzuleiten, sondern sie wird als das Evolutionsgesetz postuliert. Auch die Grundpostulate der axiomatischen Quantenmechanik basieren natürlich auf un seren experimentellen Erfahrungen. Jedoch wird in diesem Zugang nicht deutlich, https://doi.org/10.1515/9783110586022-011
11.1 Grundpostulate der Quantenmechanik |
227
an welcher Stelle welche experimentellen Informationen benutzt werden. Aus die sem Grunde ist der von uns beschrittene intuitive Weg sicherlich transparenter und anschaulicher und ermöglicht einfacher den konzeptionellen Einstieg in die Quanten mechanik. Nachdem wir die charakteristischen Züge der Quantenmechanik bereits kennengelernt haben, erscheinen uns die Grundpostulate der Quantenmechanik sehr plausibel, und sie sollen deshalb im Folgenden nur kurz abgehandelt werden.
11.1 Grundpostulate der Quantenmechanik Der axiomatische Zugang zur Quantenmechanik lässt sich in folgenden Postulaten zusammenfassen: 1.
Die Zustände eines quantenmechanischen Systems können eindeutig den Strahlen eines Hilbert-Raumes zugeordnet werden.
Unter einem Strahl versteht man die Gesamtheit der nicht verschwindenden Vielfa chen eines Elementes des Hilbert-Raumes. Ein Strahl ist offenbar der kleinste Unter raum des Hilbert-Raumes. Die Zuordnung von quantenmechanischen Zuständen den Strahlen des HilbertRaumes impliziert, dass ein Hilbert-Vektor und ein beliebiges komplexes Vielfaches von ihm denselben quantenmechanischen Zustand beschreiben. Die Normierung des Vektors im Hilbert-Raum ist damit irrelevant für die zu beschreibende Physik und kann demzufolge beliebig gewählt werden. Es reicht deshalb aus, sich auf einen ge eigneten, z. B. auf 1 normierten Vektor des Strahles zu beschränken und diesen mit dem Zustand schlechthin zu identifizieren. In diesem Sinne werden die quantenme chanischen Zustände durch Vektoren des Hilbert-Raumes repräsentiert. 2. 3.
Die physikalischen Observablen (messbare Größen) entsprechen linearen her miteschen Operatoren, die im Hilbert-Raum der Zustandsvektoren wirken. Bei einer (Ideal-)Messung der Observablen A findet man einen Eigenwert a i (A). Bei einer solchen Messung geht das System in den zu a i gehörigen Eigenzu stand |a i ⟩ von A über.
Dieses Axiom drückt insbesondere den Einfluss des Messapparates auf das zu messen de Objekt aus. Zur Illustration dieses Axioms nehmen wir an, dass das System sich im Zustand |ψ⟩ befindet. Wenden wir den Operator A auf diesen Zustand an und benut
228 | 11 Axiomatische Quantenmechanik
zen die Spektraldarstellung¹ (10.48), A|ψ⟩ = ∑ |a i ⟩a i ⟨a i |ψ⟩ , i
so sehen wir, dass die Messapparatur (der Operator A) eine Zerlegung des Zustandes |ψ⟩ in Komponenten entlang der Eigenzustände |a i ⟩ von A bewirkt. Bei der eigentli chen Messung der Observablen A wird aus dieser Spektralzerlegung eine Komponente |a k ⟩, d. h., eine Eigenfunktion von A herausgefiltert, und die Messung liefert als Ergeb nis den zugehörigen Eigenwert a k . Bei der Messung kommt es also zu einer Zustands reduktion („Kollaps der Wellenfunktion“). Aus der Gesamtheit der Alternativen, die durch die einzelnen Eigenzustände |a i ⟩ von A gegeben sind und in der Wellenfunk tion |ψ⟩ ursprünglich, d. h. vor der Messung, enthalten waren, wird durch die Mes sung eine einzige Komponente |a k ⟩, ein Eigenzustand von A, herausprojiziert (siehe Abb. 11.1): A|ψ⟩ → a k |a k ⟩⟨a k |ψ⟩ ∼ |a k ⟩ , (11.1) was der Wirkung des Projektors P k = |a k ⟩⟨a k | auf die Wellenfunktion entspricht: |ψ⟩
→
P k |ψ⟩ = |a k ⟩⟨a k |ψ⟩ ∼ |a k ⟩ .
(11.2)
Damit verliert der Zustand durch den Messprozess einen Großteil seiner komplexen Struktur. Dieses Ergebnis hatten wir bereits beim Doppelspaltexperiment gesehen. Solange wir nicht den Spalt bestimmen, durch den das Teilchen hindurchläuft, d. h. A
a1 a2 |ψ
|ak ak
Abb. 11.1: Schematische Darstellung eines quantenmechanischen Messprozesses.
1 Der Einfachheit halber setzen wir hier voraus, dass A nur ein diskretes Spektrum besitzt.
11.1 Grundpostulate der Quantenmechanik | 229
seinen Ort bestimmen, zeigt das Teilchen Interferenz, wenn man das Experiment nur oft genug durchführt. Es muss also prinzipiell beide Spalten benutzen. Stellen wir je doch durch das Experiment fest, durch welchen Spalt es gelaufen ist, nehmen wir dem Teilchen die Möglichkeit, auch durch den anderen Spalt zu gehen, und schränken da mit seinen Zustand ein. Hat der Zustand des Teilchens vorher die Alternative Spalt 1 und Spalt 2 enthalten, so ist der Zustand des Teilchens nach der Messung auf eine der beiden Möglichkeiten beschränkt. Diese Zustandsreduktion ist eine der konzeptionel len Hauptprobleme der Quantenmechanik und ist bis heute nicht in aller Konsequenz verstanden. 4.
Wird ein System im Zustand |ψ⟩ einer Messung der Observablen A unterworfen, so ist die Wahrscheinlichkeit, dass der Wert a i gemessen wird, d. h., das System sich nach der Messung im zugehörigen Eigenzustand |a i ⟩ befindet, durch w i = |⟨a i |ψ⟩|2 ,
⟨a i |a i ⟩ = 1 ,
⟨ψ|ψ⟩ = 1
(11.3)
gegeben. Hierbei ist vorausgesetzt, dass die Wellenfunktionen |a i ⟩ und |ψ⟩ kor rekt auf 1 normiert sind. Diese Aussage ist äquivalent der alternativen Formu lierung: Wird die Messung von A an einem im Zustand |ψ⟩ präparierten System genü gend oft wiederholt, so ist der Mittelwert von A 1 N ∑ aik Ā = lim N→∞ N k=1 (a i k bezeichnet den Eigenwert der k-ten Messung) durch den Erwartungswert von A im Zustand |ψ⟩ gegeben: ⟨A⟩ = ⟨ψ|A|ψ⟩ = Ā . In der Tat, benutzen wir die Spektraldarstellung (10.47) von A, A = ∑ |a i ⟩a i ⟨a i | , i
so erhalten wir für den Erwartungswert ⟨A⟩ = ∑⟨ψ|a i ⟩a i ⟨a i |ψ⟩ = ∑ a i |⟨a i |ψ⟩|2 = ∑ w i a i , i
i
i
der durch die Wahrscheinlichkeiten w i (11.3) festgelegt wird. Letztere lassen sich auch durch die Norm des Vektors (11.2) ausdrücken, der als Ergebnis (der Zustandsredukti on) des Messprozesses entsteht: w i = ‖P i |ψ⟩‖2 = ‖ |a i ⟩⟨a i |ψ⟩‖2 .
(11.4)
230 | 11 Axiomatische Quantenmechanik
Dieses Postulat beinhaltet, dass die Quantenmechanik i. A. (ähnlich wie die statis tische Mechanik) nur Wahrscheinlichkeitsaussagen gestattet: Falls sich ein System nicht in einem Eigenzustand der zu messenden Observablen A befindet, kann die Messung prinzipiell jeden Eigenwert von A liefern. Die Quantenmechanik gestattet es lediglich, die Wahrscheinlichkeit anzugeben, mit der ein einzelner Messwert, d. h. ein Eigenwert a i , gemessen wird. In der klassischen Mechanik hingegen lässt sich bei Kenntnis der Anfangsbedingung eines Systems aus den Bewegungsgleichungen der Messwert einer physikalischen Größe zu einem beliebigen späteren Zeitpunkt exakt vorhersagen. In diesem Sinne bezeichnet man die Quantenmechanik oft als nicht de terministische Theorie, da das Ergebnis einer Messung a priori nicht vorhersagbar ist. Wir sagen deshalb auch, dass die physikalischen Größen i. A. unscharf sind, d. h. eine Unschärfe besitzen, welche die mittlere Schwankung der Wahrscheinlichkeitsvertei lung einer Observablen um ihren Erwartungswert angibt. 5.
Die zeitliche Evolution der Wahrscheinlichkeitsamplitude (Wellenfunktion) ψ ist durch die Schrödinger-Gleichung gegeben: iℏ
∂ψ = Hψ . ∂t
11.2 Verträglichkeit von Observablen Durch die Wechselwirkung der Messapparatur mit dem zu messenden Objekt wird der Zustand des zu messenden Systems beeinflusst bzw. verändert. Wie wir oben gesehen haben, kommt es zu einer Zustandsreduktion. Befindet sich das System in einem Ei genzustand einer Observablen A und führen wir anschließend eine Messung einer an deren Observablen B durch, so wird i. A. der Eigenzustand von A zerstört. Die beiden Observablen A und B sind dann nicht gleichzeitig messbar, sie sind nicht miteinander verträglich. Führen wir zuerst die Messung von B und anschließend die Messung von A durch, so treten die Messergebnisse mit einer anderen Wahrscheinlichkeit auf als bei umgekehrter Messreihenfolge. Die beiden zugehörigen Operatoren sind offenbar nicht vertauschbar, [A, B] ≠ 0.̂ Als Beispiel betrachten wir ein freies Teilchen, das sich in einem Zustand ψ(x) befinden soll. Dieser Zustand kann z. B. ein Wellenpaket repräsentieren. Führen wir eine Ortsmessung des Teilchens durch, so geht der Zustand |ψ⟩ in einen Eigenzustand des Ortes |x0 ⟩ über: |ψ⟩ → |x0 ⟩ . Der als Resultat der Ortsmessung entstehende Ortseigenzustand ∞
⟨x|x0 ⟩ = δ(x − x0 ) = ∫ −∞
dp i p(x−x0) eℏ 2πℏ
11.2 Verträglichkeit von Observablen
| 231
ist eine Superposition von ebenen Wellen, in der jede Welle mit gleichem Gewicht vor kommt. Der entstehende Zustand ist damit völlig unscharf im Impuls. Führen wir jetzt anschließend eine Impulsmessung durch, so projiziert die Messapparatur aus dieser Überlagerung von ebenen Wellen eine einzelne Welle mit Impuls p0 heraus: ∞
|x0 ⟩ = ∫ −∞
dp |p⟩⟨p|x0 ⟩ 2πℏ
→
|p0 ⟩ ,
p ∈ (−∞, ∞)
→
p0 .
Der Ortseigenzustand |x0 ⟩ geht dabei in einen Impulseigenzustand |p0 ⟩, (ebene Welle) i
⟨x|p0 ⟩ = e ℏ p0 x über, der über den gesamten Ortsraum ausgebreitet ist und somit völlig unscharf im Ort ist. Durch die vorherige Ortsmessung wird der anschließend zu messende Impuls völlig unbestimmt. Die Impulsmessung ihrerseits macht den Ort unscharf. Ort und Impuls sind damit nicht verträglich, d. h. nicht gleichzeitig scharf messbar. Anderer seits ist eine Impulseigenfunktion für das freie Teilchen auch gleichzeitig Eigenfunkti on der Energie bzw. des Hamilton-Operators. Folglich wird durch die Impulsmessung das Ergebnis einer nachfolgenden Energiemessung völlig vorhersagbar. Energie und Impuls sind deshalb für das freie Teilchen miteinander verträglich. Wir können die Messung einer Observablen A in der Quantenmechanik schema tisch wie folgt darstellen (siehe Abb. 11.1): |ψ⟩ → A|ψ⟩ = ∑ |a i ⟩a i ⟨a i |ψ⟩ → |a k ⟩ . i
Für zwei aufeinanderfolgende Messungen nicht kompatibler Observablen erhalten wir dann folgendes Schema (siehe Abb. 11.2): |ψ⟩ → A|ψ⟩ → |a k ⟩ → B|a k ⟩ → |b i ⟩ , A
A|ψ |ψ
B
B|ak
a1
ak
|b i ⟩ ≁ |a k ⟩ .
b1 |bi
|ak bi
Abb. 11.2: Schematische Darstellung der nacheinander durchgeführten Messungen zweier unverträglicher Observablen.
232 | 11 Axiomatische Quantenmechanik Messung von A führt das System aus dem Zustand |ψ⟩ in einen Eigenzustand |a k ⟩ über. Durch anschließende Messung der Observablen B wird dieser Eigenzustand zer stört und wiederum nur die Komponente des ket-Vektors |a k ⟩ parallel zum Vektor |b i ⟩ herausprojiziert, d. h.: B|b i ⟩ = b i |b i ⟩ . Damit haben A und B keine gemeinsamen Eigenfunktionen, und wie wir oben gese hen haben, können sie deshalb nicht kommutieren, [A, B] ≠ 0.̂ Für zwei aufeinanderfolgende Messungen kompatibler Observablen A und B er halten wir dagegen folgendes Schema (siehe Abb. 11.3): |ψ⟩ → A|ψ⟩ → |a k ⟩ → B|a k ⟩ = b k |a k ⟩ . Nachdem die Messung von A das System aus dem Zustand ψ in den Zustand |a k ⟩ über führt hat, verändert die nachfolgende Messung der Observablen B (d. h. die Wirkung von B auf |a k ⟩) höchstens die Länge des Vektors |a k ⟩, zerstört aber nicht mehr seine Zu sammensetzung bzw. verändert nicht seine Richtung im Hilbert-Raum.² Dies bedeutet, dass der Eigenvektor von A ebenfalls Eigenvektor zur Observablen B ist. Das Ergebnis der Messung von A und B hängt hier nicht von der Reihenfolge der Messungen ab, und die beiden zugehörigen Operatoren müssen miteinander kommutieren, [A, B] = 0.̂ In der Tat müssen A und B kommutieren, da sie dieselben Eigenfunktionen besitzen, was wir im Abschnitt 10.5 allgemein für hermitesche Operatoren gezeigt haben. Abschließend illustrieren wir noch die Messung nicht kompatibler Observablen anhand eines einfachen Beispiels. Dazu betrachten wir ein quantenmechanisches System, dessen Hilbert-Raum durch den ℝ2 gegeben ist. Da die Eigenvektoren ei nes hermiteschen Operators eine vollständige orthogonale Basis bilden, wird jeder B
A
A|ψ
a1 a2
|ψ
ak
|ak
B|ak
bk
|ak
Abb. 11.3: Schematische Darstellung der nacheinander durchgeführten Messungen zweier verträglicher Observablen.
2 Wir erinnern in diesem Zusammenhang daran, dass nach Postulat 1 quantenmechanische Zustände Strahlen, d. h., Richtungen im Hilbert-Raum zugeordnet sind, sodass die Länge des Zustandsvektors irrelevant ist.
11.2 Verträglichkeit von Observablen
| 233
hermitesche Operator dieses Hilbert-Raumes durch ein orthonormiertes Zweibein charakterisiert, dessen Basisvektoren die normierten Eigenvektoren des betrachte ten Operators sind. In Abb. 11.4 sind die Eigenvektoren |a i=1,2 ⟩ und |b i=1,2⟩ zweier Operatoren A und B angegeben, wobei a i=1,2 und b i=1,2 die Eigenwerte von A und B bezeichnen, d. h., es gilt: A|a i ⟩ = a i |a i ⟩ ,
B|b i ⟩ = b i |b i ⟩ ,
i = 1, 2 .
Das betrachtete System befinde sich in einem Zustand |ψ⟩. Bei einer Messung der Ob servablen A wurde der Eigenwert a1 erhalten. Das System befindet sich dann nach dieser Messung im Zustand |a1 ⟩. Anschließende Messung von B soll den Eigenwert b2 liefern. Dabei geht das System in den Zustand |b 2 ⟩ über: |ψ⟩
A
→
B
|a1 ⟩
→
|b 2 ⟩ .
(11.5)
Führen wir die Messungen in umgekehrter Reihenfolge durch und erhalten dabei die selben Messwerte b 2 und a1 , so haben wir: |ψ⟩
B
→
A
|b 2 ⟩
→
|a1 ⟩ .
(11.6)
Die beiden Messfolgen (11.5) und (11.6), obwohl sie dieselben Messwerte von A und B liefern, bringen das System nicht nur in unterschiedliche Endzustände, sondern sind auch mit verschiedener Wahrscheinlichkeit realisiert. Die Wahrscheinlichkeit bei der Messung von A und nachfolgender Messung von B die Messwerte a1 und b 2 zu |a2 |b2 B2 |ψ P2 |b2 b2 |a1 a1 |ψ
O
P1
|a1
A1
|a1 a1 |b2 b2 |ψ |b1 Abb. 11.4: Illustration der Messung zweier nicht kompatibler Operatoren für ein System, dessen Hilbert-Raum durch den ℝ2 gegeben ist.
234 | 11 Axiomatische Quantenmechanik
erhalten (Messfolge (11.5)) ist (siehe (11.4)): w(a1 , b 2 ) = ‖ |b 2 ⟩⟨b 2 |a1 ⟩⟨a1 |ψ⟩‖2 = |⟨a1 |ψ⟩|2 |⟨b 2 |a1 ⟩|2 = |OA1 |2 |OP2 |2 , während die Wahrscheinlichkeit für die Messfolge (11.6) w(b 2 , a1 ) = ‖ |a1 ⟩⟨a1 |b 2 ⟩⟨b 2 |ψ⟩‖2 = |⟨b 2 |ψ⟩|2 |⟨a1 |b 2 ⟩|2 = |OB2 |2 |OP1 |2 beträgt. Zwar gilt: |OP2 | ≡ |⟨b 2 |a1 ⟩| = |⟨a1 |b 2 ⟩| ≡ |OP1 | , jedoch ist i. A.: |OA1 | ≡ |⟨a1 |ψ⟩| ≠ |⟨b 2 |ψ⟩| ≡ |OB2 | .
11.3 Präparation eines Quantensystems Da als Resultat einer Messung immer ein Eigenwert der gemessenen Observablen erhalten wird und das quantenmechanische System dabei in den zugehörigen Eigen zustand dieser Observablen übergeht, impliziert die Präparation eines quantenme chanischen Systems immer einen Messprozess, und der Zustand, in welchem ein Sys tem präpariert wird, ist durch den in der Messung erhaltenen Eigenwert spezifiziert. Die vollständige Spezifikation eines Zustandes erfordert gewöhnlich die Messung mehrerer (kommutierender) Observablen, und erst durch die Messung eines maxi malen Satzes von kommutierenden Observablen ist das quantenmechanische System eindeutig präpariert und sein Zustand eindeutig durch die gemessenen Eigenwerte spezifiziert. Dies legt die folgenden Definitionen nahe: 1.
Vollständiger Satz kommutierender Observablen: Eine Menge von kommutierenden Observablen A1 , . . . , A n mit [A k , A l ] = 0̂ ,
für alle k, l = 1, . . . , n
heißt vollständiger Satz, wenn es genau ein System von gemeinsamen Eigen zuständen |a1 . . . a n ⟩, A k |a1 . . . a k . . . a n ⟩ = a k |a1 . . . a k . . . a n ⟩ , gibt. Dies bedeutet, dass nicht zwei gemeinsame Eigenfunktionen existieren, für welche die Eigenwerte a i sämtlicher Observablen A i entartet sind. Die Eigenwerte eines vollständigen Satzes von kommutierenden Observablen beinhalten die maximale Information über das betrachtete System. Jeder wei tere Operator B, der mit sämtlichen A k kommutiert, lässt sich vollständig durch die A k ausdrücken.
11.4 Allgemeine Unschärferelation
| 235
Für ein Punktteilchen bilden die drei Komponenten des Ortsoperators x̂ i oder die drei Komponenten des Impulsoperators p̂ i einen vollständigen Satz kommutierender Ob servablen. 2.
Quantenmechanischer Zustand: Ein quantenmechanischer Zustand |ψ⟩ ist durch die Eigenwerte a, b, c, . . . eines vollständigen Satzes von kommutieren den (d. h. gleichzeitig messbaren) Observablen A, B, C, . . . spezifiziert: |ψ⟩ = |abc . . . ⟩ . Er wird also durch die Eigenwerte einer maximalen Anzahl von gleichzeitig messbaren Observablen festgelegt.
11.4 Allgemeine Unschärferelation Wie wir oben festgestellt haben, entscheidet der Kommutator zweier Operatoren dar über, ob die beiden entsprechenden Observablen miteinander verträglich sind oder nicht. Der Kommutator sollte deshalb auch die Unschärfe dieser beiden Observablen festlegen, was wir im Folgenden explizit zeigen wollen. Wir betrachten dazu zwei her mitesche Operatoren A, B und subtrahieren jeweils zweckmäßigerweise ihre Mittel werte: A = A − ⟨A⟩ , B = B − ⟨B⟩ . Die verschobenen Operatoren sind offenbar auch hermitesch. Mit ihnen erhalten wir für das mittlere Schwankungsquadrat im Zustand |ψ⟩: (∆A)2 = ⟨ψ|(A − ⟨A⟩)2 |ψ⟩ = ⟨ψ|(A )2 |ψ⟩ . Benutzen wir die Hermitizität der Operatoren A und B , so können wir die mittleren Schwankungsquadrate als (∆A)2 = ⟨ψ|A A |ψ⟩ = ⟨A ψ|A ψ⟩ = ‖A ψ‖2 , (∆B)2 = ‖B ψ‖2 schreiben. Mithilfe der Schwarz’schen Ungleichung (10.2) finden wir deshalb für das Produkt der Schwankungsquadrate: (∆A)2 (∆B)2 ≥ |⟨A ψ|B ψ⟩|2 = |⟨ψ|A B |ψ⟩|2 .
(11.7)
Das Operatorprodukt AB zerlegen wir jetzt in einen symmetrischen und einen anti symmetrischen Anteil mittels der Beziehung AB =
1 1 {A, B} + [A, B] , 2 2
(11.8)
236 | 11 Axiomatische Quantenmechanik
wobei {A, B} := AB + BA den Antikommutator (nicht wie bisher die Poisson-Klammer!) bezeichnet. Für hermi tesche Operatoren A und B ist wegen (AB)† = B† A† der Antikommutator hermitesch, während der Kommutator antihermitesch ist: {A, B}† = {A, B} ,
[A, B]† = −[A, B] .
Demzufolge ist der Erwartungswert des Antikommutators reell, während der des Kommutators rein imaginär ist. Die letzte Eigenschaft folgt aus der Tatsache, dass ein antihermitescher Operator sich schreiben lässt als das Produkt von i und einem hermiteschen Operator. Gleichung (11.8) zerlegt damit den Erwartungswert von AB in Real- und Imaginärteil: ⟨ψ|AB|ψ⟩ =
1 ⟨ψ|{A, B} + [A, B]|ψ⟩ ≡ Re{⟨ψ|AB|ψ⟩} + iIm{⟨ψ|AB|ψ⟩} . 2
Nach Bildung des Betragsquadrates finden wir deshalb: |⟨ψ|AB|ψ⟩|2 =
1 1 |⟨ψ|{A, B}|ψ⟩|2 + |⟨ψ|[A, B]|ψ⟩|2 . 4 4
Vernachlässigen wir hier den positiv definiten Beitrag vom Antikommutator, |⟨ψ|AB|ψ⟩|2 ≥
1 |⟨ψ|[A, B]|ψ⟩|2 , 4
(11.9)
und setzen diese Relation mit der Ersetzung A → A , B → B in Gleichung (11.7) ein, so erhalten wir: 1 ∆A ∆B ≥ |⟨ψ|[A , B ]|ψ 2 und mit [A , B ] = [A, B] schließlich den gesuchten Zusammenhang ∆A ∆B ≥
1 |⟨ψ|[A, B]|ψ⟩| . 2
(11.10)
Diese Gleichung drückt die Unschärfe zweier beliebiger Observablen durch den Kom mutator der beiden zugehörigen hermiteschen Operatoren aus. Es sei betont, dass die se allgemeine Unschärferelation allein eine Folge der Schwarz’schen Ungleichung ist und somit durch die der Quantenmechanik zugrunde liegende Hilbert-Raum-Struktur bestimmt ist. Setzen wir als Beispiel für A und B den Orts- und Impulsoperator ein, A = xi ,
B = pk ,
welche der Kommutationsbeziehung [x i , p k ] = iℏδ ik
(11.11)
11.4 Allgemeine Unschärferelation | 237
genügen, so erhalten wir die bekannte Unschärferelation ∆x i ∆p k ≥
ℏ δ ik . 2
(11.12)
Eine ähnliche Unschärferelation existiert auch zwischen der Zeit und der Energie. Beachten wir, dass nach der Schrödinger-Gleichung der Operator der Energie in der „Zeitdarstellung“ durch H = iℏ∂ t gegeben ist, und wählen wir in (11.10) A=t,
B = iℏ∂ t ,
so finden wir mit E = ⟨H⟩ = ⟨iℏ∂ t ⟩: ∆t ∆E ≥
1 ℏ. 2
(11.13)
Die Größe der Unschärfe hängt nach Gleichung (11.10) nicht nur von dem Kommuta tor, sondern auch von der expliziten Form der Wellenfunktion ab. Für spezielle Wellen funktionen kann die rechte Seite von Gleichung (11.10) verschwinden. Dies ist offenbar dann der Fall, wenn die Wellenfunktion |ψ⟩ Eigenfunktion zu einer der beiden Opera toren ist. In der Tat, ist |ψ⟩ Eigenfunktion einer der beiden hermiteschen Operatoren A, B, z. B. A|ψ⟩ = a|ψ⟩ ⇒ ⟨ψ|A = ⟨ψ|a , so verschwindet die rechte Seite von Gleichung (11.10): ⟨ψ|[A, B]|ψ⟩ = ⟨ψ|(AB − BA)|ψ⟩ = ⟨ψ|aB − Ba|ψ⟩ = 0 .
(11.14)
Die linke Seite von Gleichung (11.10) verschwindet ebenfalls, da in diesem Fall ⟨A⟩ = ⟨ψ|A|ψ⟩ = a ,
(A − ⟨A⟩)|ψ⟩ = o
und folglich ∆A = 0 ist. Als Beispiel führen wir die stationären Zustände (7.11) an, die als Eigenzustände des Hamilton-Operators eine scharfe Energie und damit eine verschwindende Energieunschärfe, ∆E = 0, besitzen. Aus (11.13) folgt, dass diese Zu stände unendlich lange leben, ∆t = ∞. Ferner kann der Kommutator z. B. nur in einem Unterraum des gesamten HilbertRaumes verschwinden. In diesem Unterraum besitzen dann A und B gemeinsame Ei genfunktionen und die Unschärfe verschwindet in diesen Eigenzuständen. In den obigen Betrachtungen wurde implizit stets vorausgesetzt, dass die betrach tete Wellenfunktion |ψ⟩ normierbar ist, denn für nicht normierbare Wellenfunktionen existieren die Erwartungswerte ⟨A⟩, ⟨B⟩ und damit die Unschärfen ∆A, ∆B nicht. Aus der allgemeinen Unschärferelation (11.10) lässt sich unmittelbar der folgende Satz be weisen:
238 | 11 Axiomatische Quantenmechanik
Zwei hermitesche Operatoren A, B, deren Kommutator [A, B] = c1̂ ≠ 0̂
(11.15)
eine nicht verschwindende (i. A. komplexe) Konstante c ist, besitzen keine normier baren Eigenfunktionen.
Wir führen den Beweis indirekt: Aus (11.15) folgt für jede normierbare Funktion |ψ⟩ ≠ o und damit auch für normierbare Eigenfunktionen von A oder B: |⟨ψ|[A, B]|ψ⟩| = |c|⟨ψ|ψ⟩ = |c|‖ψ‖2 > 0 . Diese Beziehung steht aber im Widerspruch zu Gleichung (11.14) und zur Unschärferelation (11.10), da die Unschärfe ∆A einer Observablen A in jedem ihrer (normierbaren) Eigenzustände verschwindet (∆A = 0).
Die Beziehung (11.15) lässt sich insbesondere nicht durch endlichdimensionale hermi tesche Matrizen realisieren, da diese zwangsläufig normierbare Eigenvektoren besit zen. Damit ist der Hilbert-Raum der Quantenmechanik notwendigerweise unendlich dimensional. Der Satz (11.15) angewandt auf die Zeit (A = t) und die Energie (B = it∂ t ) impliziert, dass es keine über ℝ normierbaren Eigenfunktionen von t bzw. iℏ∂ t gibt. Diese Eigenfunktionen sind zeitabhängig i
und durch δ(t − t 0 ) bzw. e − ℏ Et gegeben und offensichtlich nicht normierbar. Der Satz (11.15) bedeu tet jedoch nicht, dass es keine normierbaren (zeitunabhängigen, d. h. stationäre) Eigenzustände des Hamilton-Operators H gibt, die bekanntlich als gebundene Zustände bezeichnet werden. Die Bezie hung H = iℏ∂ t gilt nur im Raum der zeitabhängigen Wellenfunktionen ψ(x, t), nicht jedoch für die zeitunabhängigen stationären Wellenfunktionen φ(x), da ∂ t φ(x) = 0.
11.5 Minimum der Unschärfe Abschließend wollen wir untersuchen, für welche Zustände die Unschärfe zweier Ope ratoren minimal wird. In der Schwarz’schen Ungleichung (11.7) gilt das Gleichheits zeichen, wenn die beiden Hilbert-Vektoren A |ψ⟩ und B |ψ⟩ zueinander proportional sind, d. h., B |ψ⟩ = αA |ψ⟩ , (11.16) wobei α eine i. A. komplexe Zahl ist. In Gleichung (11.9) gilt das Gleichheitszeichen, wenn der Erwartungswert des Antikommutators verschwindet: ⟨ψ|{A , B }|ψ⟩ = 0 .
(11.17)
11.5 Minimum der Unschärfe |
239
Somit wird die Unschärfe minimal, wenn die beiden Bedingungen (11.16) und (11.17) erfüllt sind. Setzen wir (11.16) in (11.17) ein, so erhalten wir mit ⟨ψ|{A , B }|ψ⟩ = ⟨ψ|A B + B A |ψ⟩ = ⟨ψ|A B |ψ⟩ + ⟨ψ|A B |ψ⟩∗ 2
2
und ⟨ψ|A |ψ⟩∗ = ⟨ψ|A |ψ⟩ die Bedingung 2
(α + α ∗ ) ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ ⟨ψ|A |ψ⟩ = 0 , ≥0
die sich nur erfüllen lässt, wenn entweder 1. die Unschärfe verschwindet (was i. A. nicht der Fall ist), 2
(∆A)2 = ⟨ψ|A |ψ⟩ = 0 ,
2.
oder der Proportionalitätsfaktor α rein imaginär ist, α = −α ∗ ,
α = iμ ,
μ∈ℝ.
Im 2. Fall muss für Zustände minimaler Unschärfe der Operatoren A und B die Wel lenfunktion deshalb der Bedingung B |ψ⟩ = iμA |ψ⟩ ,
μ∈ℝ
genügen. Betrachten wir als Beispiel wieder den Orts- und Impulsoperator (11.11), so finden wir aus dieser Bedingung die Differenzialgleichung (
ℏ d − ⟨p⟩) ψ = iμ(x − ⟨x⟩)ψ . i dx
Man überzeugt sich leicht, dass diese Gleichung durch das Gauß’sche Wellenpaket μ i ψ(x) = c exp ( ⟨p⟩x) exp (− (x − ⟨x⟩)2 ) ℏ 2ℏ gelöst wird. Für ein freies Teilchen zerfließt zwar das Wellenpaket, d. h., das Teilchen verteilt sich mehr über den gesamten Raum, das Produkt der Unschärfe ∆x ∆p bleibt jedoch während der Zeitevolution konstant. Bei Anwesenheit eines äußeren Potenzi als nimmt hingegen die Unschärfe ∆x ∆p während der Zeitevolution zu. Das Wellen paket zerfließt dann schneller als für eine freie Bewegung. Eine Ausnahme bildet der harmonische Oszillator, wo ebenfalls Zustände minimaler Unschärfe existieren, die sogenannten kohärenten Zustände, die wir bei der Behandlung des harmonischen Os zillators in Abschnitt 12.11 besprechen werden.
12 Der harmonische Oszillator Bei vielen Anwendungen in der Quantenmechanik haben wir es mit Potenzialen zu tun, die nach unten beschränkt sind und ein Minimum besitzen, das einer stabilen Gleichgewichtslage entspricht. Als typisches Beispiel sei hier das Potenzial eines zweiatomigen Moleküls erwähnt, das in Abb. 12.1 dargestellt ist. Da die Atome in den Molekülen gebunden sind, muss das Potenzial prinzipiell anziehend sein. Für kleine Abstände muss es jedoch abstoßend sein, da die Atome in den Molekülen einen von null verschiedenen mittleren Abstand einnehmen. Ferner muss es für große Abstände asymptotisch verschwinden, da die Moleküle dissoziieren können. E
harmonisches Potential
Morse-Potential 2 V (x) = V0 1 − e−x/a
r Abb. 12.1: Potenzielle Energie eines zweiatomigen Moleküls als Funktion des Atomabstandes (Morse-Potenzial) und deren führende Taylor-Entwicklung (Oszillatorpotenzial).
Für Energien in der Nähe des Minimums, dV(x) =0, dx x=x0 können wir das Potenzial um die Gleichgewichtslage x0 in eine Taylor-Reihe entwi ckeln, 1 d2 V(x) (x − x0 )2 + ⋅ ⋅ ⋅ , V(x) = V(x0 ) + 2 dx2 x=x0 wobei der Term linear in der Auslenkung verschwindet. Für Energien in der Nähe des Potenzialminimums können wir die Entwicklung nach dem zweiten Glied abbrechen und erhalten das Potenzial eines harmonischen Oszillators: 1 (12.1) V(x) = mω2 x2 , V (x0 ) = mω2 , 2 wobei wir den Koordinatenursprung in das Potenzialminimum verlegt haben (x − x0 → x) und die zweite Ableitung durch die Masse des Teilchens m und die klassische Oszillatorfrequenz ω ausgedrückt haben. https://doi.org/10.1515/9783110586022-012
12.1 Pfadintegralbehandlung des harmonischen Oszillators
|
241
Der harmonische Oszillator besitzt große Bedeutung nicht nur in der klassischen Physik, sondern auch in der Quantenmechanik, da sich viele realistische Potenzia le im atomaren Bereich bei kleinen Energien, d. h. in der Nähe des Grundzustandes, sehr gut durch ein quadratisches Potenzial approximieren lassen. Als Beispiel sei hier die Gitterschwingung der Atome um ihre Gleichgewichtslage in einem Festkörper ge nannt. Darüber hinaus gibt es viele Probleme, die entweder direkt auf das Potenzi al eines Oszillators führen wie z. B. der elektrische Schwingkreis, oder Probleme, die sich durch geeignete Koordinatentransformation auf einen harmonischen Oszillator reduzieren lassen. Hierzu gehört die Bewegung von geladenen Teilchen im CoulombPotenzial (siehe Abschnitt 18.6) oder in einer Ebene senkrecht zu einem konstanten Magnetfeld (siehe Abschnitt 22.4). Die große Bedeutung des harmonischen Oszillators resultiert vor allem daraus, dass für ihn sowohl die klassische Bewegungsgleichung als auch die SchrödingerGleichung exakt lösbar sind. Das wird auch im Pfadintegralformalismus deutlich. Das zugehörige Funktionalintegral hat hier die Form eines Gauß-Integrals und lässt sich somit analytisch ausführen.
12.1 Pfadintegralbehandlung des harmonischen Oszillators* Im Folgenden wollen wir zunächst den harmonischen Oszillator im Rahmen des Pfad integralzuganges behandeln. Die klassische Lagrange-Funktion des harmonischen Oszillators lautet: m m L(x, x)̇ = ẋ 2 − ω2 x2 . 2 2 Da die zugehörige klassische Wirkung tb
S[x](t b , t a ) = ∫ dt L(x, x)̇ ta
ein quadratisches Funktional der Trajektorien x(t) ist, lässt sich das Funktionalinte gral für die Übergangsamplitude x(t b )=x b
K(x b , t b ; x a , t a ) =
∫
Dx(t) e ℏ S[x](t b ,t a ) i
(12.2)
x(t a )=x a
exakt ausführen. Das Pfadintegral erstreckt sich hier über alle Trajektorien, die den Randbedingungen x(t a ) = x a , x(t b ) = x b (12.3)
* Dieser Abschnitt ist für das Verständnis der übrigen Abschnitte nicht erforderlich und kann deshalb beim ersten Lesen übersprungen werden.
242 | 12 Der harmonische Oszillator
genügen. Diese Randbedingungen lassen sich am einfachsten berücksichtigen, wenn ̃ be wir einen beliebigen Pfad x(t) als Fluktuation um die klassische Trajektorie x(t) trachten, welche die Wirkung extremiert, δS[x] =0, (12.4) δx(t) x=x(t) ̃ und den Randbedingungen (12.3) genügt. Einen beliebigen Pfad x(t), der den gefor derten Randbedingungen (12.3) genügt, können wir dann in der Form ̃ + y(t) x(t) = x(t)
(12.5)
schreiben, wobei die Fluktuationen y(t) den Randbedingungen y(t a ) = y(t b ) = 0
(12.6)
genügen. Wir können jetzt die Wirkung einer beliebigen Trajektorie x(t) nach Potenzen der Fluktuationen y(t) entwickeln: b b δ2 S[x] δS[x] 1 y(t) + ∫ dt ∫ dt y(t)y(t ) . (12.7) S[x] = S[x]̃ + ∫ dt δx(t) x=x(t) 2 δx(t)δx(t ) x=x(t) ̃ ̃ t t t
tb
t
t
a
a
a
Die Entwicklung bricht nach dem zweiten Glied ab, da für den harmonischen Oszil lator die klassische Wirkung S[x] ein quadratisches Funktional der Trajektorie ist. Ferner verschwindet der Term linear in den Fluktuationen y(t), da die klassische Tra ̃ die Wirkung extremiert, Gleichung (12.4). Unter Berücksichtigung von jektorie x(t) (siehe Anhang D) ̇ ) δ x(t d δx(t ) δx(t ) = , = δ(t − t ) δx(t) dt δx(t) δx(t) finden wir für die erste Variationsableitung: tb
m 2 δ δS[x] ∫ dt ≡ (ẋ (t ) − ω2 x2 (t )) δx(t) δx(t) 2 ta
tb
=
̇ ) m δ x(t δx(t ) ̇ ) ∫ dt (2x(t − ω2 2x(t ) ) 2 δx(t) δx(t) ta
tb
̇ ) = m ∫ dt (x(t ta
d δ(t − t ) − ω2 x(t )δ(t − t )) dt
̈ + ω2 x(t)) , = −m (x(t)
(12.8)
was mit (12.4) die klassische Bewegungsgleichung des harmonischen Oszillators lie fert. Durch erneute Variationsableitung dieser Gleichung finden wir: δ2 S[x] d2 = −m ( + ω2 ) δ(t − t ) . (12.9) δx(t)δx(t ) x=x(t) dt2 ̃
12.1 Pfadintegralbehandlung des harmonischen Oszillators
|
243
̃ (um die wir ent Dieser Ausdruck ist unabhängig von der betrachteten Trajektorie x(t) wickeln), was wieder eine Besonderheit des harmonischen Oszillators ist. Mit (12.9) erhalten wir für den letzten Term in (12.7) nach partieller Integration und unter Aus nutzung der Randbedingung (12.6): tb
tb
ta
ta
tb
1 δ2 S[x]̃ m d2 ∫ dt ∫ dt y(t) ∫ dt y(t) (− 2 − ω2 ) y(t) y(t ) = 2 δx(t)δx(t ) 2 dt ta
m 2 = ∫ dt (ẏ 2 (t) − ω2 y(t)) ≡ S[y] . 2
(12.10)
Damit vereinfacht sich (12.7) zu: S[x] = S[x]̃ + S[y] . Diesen Ausdruck setzen wir in das Funktionalintegral für die Übergangsamplitu de (12.2) ein, wobei wir nach (12.5) die Integration jetzt über die Fluktuationen um die klassische Trajektorie y(t) ausführen: y(t b )=0
K(x b , t b ; x a , t a ) = e
i ̃ ℏ S[ x]
≡e
i S[ x]̃ ℏ
∫
Dy(t) e ℏ S[y](t b ,t a ) i
y(t a )=0
K(0, t b ; 0, t a ) .
(12.11)
Der Vorteil dieser Darstellung ist, dass die gesamte Abhängigkeit der Übergangsam plitude von den äußeren Koordinaten x a , x b vollständig in der klassischen Trajektorie ̃ enthalten ist, die die ursprünglichen Randbedingungen (12.3) erfüllt, während die x(t) Integration über Trajektorien y(t) erstreckt wird, deren Randbedingungen (12.6) unab hängig von den äußeren Koordinaten x a , x b sind. Die Darstellung (12.11) erhalten wir unmittelbar, wenn wir das ursprüngliche Funktionalintegral (12.2) in der stationären Phasenapproximation berechnen, die im vorliegenden Fall exakt ist, siehe Gleichun gen (12.7) und (12.10). Die allgemeine Lösung der Schwingungsgleichung (12.4), (12.8), ̈ + ω2 x(t) = 0 x(t) lautet: ̃ = A sin(ωt) + B cos(ωt) . x(t) Die hier auftretenden Koeffizienten A und B bestimmen wir so, dass diese Lösung den Randbedingungen (12.3) genügt. Dies liefert: ̃ = x(t)
1 [(x b cos(ωt a ) − x a cos(ωt b )) sin(ωt) sin[ω(t b − t a )] + (x a sin(ωt b ) − x b sin ωt a ) cos(ωt)] .
(12.12)
244 | 12 Der harmonische Oszillator ̃ (12.12) finden wir nach elementaren Für die Wirkung der klassischen Trajektorie x(t) Rechnungen (Ausführung des Zeitintegrals und Benutzung der Additionstheoreme der Winkelfunktionen): S[x]̃ =
mω [(x2a + x2b ) cos(ωT) − 2x a x b ] , 2 sin(ωT)
(12.13)
wobei wir T = t b − t a gesetzt haben. Wegen der Homogenität der Zeit kann die Über gangsamplitude K(x b , t b ; x a , t a ) nur von der Zeitdifferenz T = t b − t a abhängen. Da die klassische Wirkung ebenfalls nur von T abhängt, muss dasselbe offenbar auch für das verbleibende Funktionalintegral über die fluktuierenden Trajektorien y(t b )=0
K(T) = K(0, t b ; 0, t a ) =
∫ y(t a )=0
tb
i m d2 Dy(t) exp ( ∫ dt y(t) (− 2 − ω2 ) y(t)) (12.14) ℏ2 dt ta
gelten. Wir können deshalb ohne Beschränkung der Allgemeinheit t a = 0 setzen. Der Operator d2 − 2 − ω2 dt im Exponenten ist hermitesch¹ bezüglich des Skalarproduktes T
(x, y) = ∫ dt x∗ (t)y(t) 0
im Raum der Funktionen {y(t)}, welche den Randbedingungen der fluktuierenden Tra jektorien y(T) = y(0) = 0 genügen. In diesem Raum sind seine Eigenfunktionen (−
d2 − ω2 ) y n (t) = λ n y n (t) dt2
(12.15)
durch 2 nπt sin ( ) , n = 1, 2, 3, . . . T T gegeben. Sie bilden ein vollständiges Orthonormalsystem: y n (t) = √
(12.16)
T
(y n , y m ) ≡ ∫ dt y n (t)y m (t) = δ nm .
(12.17)
0
Die zugehörigen Eigenwerte lauten: λn =
n2 π 2 − ω2 . T2
(12.18)
1 Bis auf einen numerischen Faktor ist dieser Operator das zeitliche Analogon des Hamilton-Operators eines Teilchens in einer Dimension in einem konstanten Potenzial.
12.1 Pfadintegralbehandlung des harmonischen Oszillators
|
245
Wir zerlegen die fluktuierenden Trajektorien y(t) nach den Eigenfunktionen y n (t): ∞
y(t) = ∑ a n y n (t) .
(12.19)
n=1
Jede beliebige Funktion y(t) lässt sich durch geeignete Wahl der a n erzeugen. Deshalb können wir das Funktionalintegral über die Trajektorien y(t) als ein Vielfachintegral über die Entwicklungskoeffizienten a n ausdrücken: y(T)=0
∞
∞
∞
∫ Dy(t) = J ∫ ∏ da n ≡ J ∏ ∫ da n . n=1
y(0)=0
n=1 −∞
Der hier auftretende Jacobian J(T), den wir weiter unten bestimmen werden, hängt nur von der Zeit T, nicht aber von der Oszillatorfrequenz ω ab, da die Eigenfunktio nen y n (t) (12.16), nach denen wir in (12.19) entwickeln, ebenfalls diese Eigenschaften besitzen. (Man beachte, dass die Trajektorien y(t) und damit die linke Seite von (12.19) unabhängig von ω sind!) Setzen wir die Entwicklung (12.19) in die Wirkung (12.10) ein, so finden wir unter Benutzung von (12.15) und (12.17): S[y] =
m ∞ ∑ λ k a2k . 2 k=1
Für das Funktionalintegral (12.14) erhalten wir dann ein unendlich dimensionales Gauß-Integral: y(T)=0
K(T) =
∞
i
∫ Dy(t) e ℏ S[y] = J ∫ ( ∏ da n ) exp ( n=1
y(0)=0 ∞
∞
n=1 ∞
k=1
= J ∫ ( ∏ da n ) ∏ exp ( ∞
= J ∏ ∫ da n exp ( n=1 −∞
i m ∞ ∑ λ k a2k ) ℏ 2 k=1
i m λ k a2k ) ℏ2
∞ i2πℏ i m . λ n a2n ) = J ∏ √ ℏ2 mλ n n=1
(12.20)
Den Jacobian J(T) bestimmen wir durch Vergleich mit dem Propagator des freien Teil chens, für welches wir die Amplitude bereits kennen, siehe Gleichung (3.31): K0 (T) = √
m . i2πℏT
(12.21)
Für das freie Teilchen gilt ω = 0, und die zugehörigen Eigenwerte (12.18) lauten: λ0n =
n2 π 2 . T2
246 | 12 Der harmonische Oszillator
Daher finden wir für das Verhältnis der Amplituden aus (12.20): −1/2
∞ λn K(T) = ∏( 0) K0 (T) n=1 λ n
−1/2
∞
= ∏ (1 − n=1
ω2 T 2 ) n2 π 2
=(
sin ω −1/2 . ) ωT
(12.22)
Hierbei haben wir die Produktdarstellung des Sinus ∞
sin x = x ∏ (1 − ( n=1
x 2 ) ) nπ
benutzt. Mit (12.21) finden wir aus (12.22) die gesuchte Amplitude: K(T) = √
mω . i2πℏ sin(ωT)
Setzen wir dieses Ergebnis sowie den Ausdruck für die klassische Wirkung (12.13) in Gleichung (12.11) ein, so erhalten wir für die Übergangsamplitude des harmonischen Oszillators: K(x b , T; x a , 0) =√
mω i mω exp ( [(x2a + x2b ) cos(ωT) − 2x a x b ]) . i2πℏ sin(ωT) ℏ 2 sin(ωT)
(12.23)
Wir begnügen uns hier der Einfachheit halber damit, die Eigenenergien des Quanten oszillators zu finden (d. h., wir verzichten auf die Bestimmung der Eigenfunktionen). Dazu ist die Abhängigkeit der Übergangsamplitude von den äußeren Koordinaten x a , x b nicht erforderlich. (Diese benötigt man jedoch für die Bestimmung der Wellen funktion, siehe Abschnitt 6.2.2.) Es ist deshalb ausreichend, die Gesamtwahrschein lichkeitsamplitude zu betrachten, das Teilchen nach einer Zeit T wieder am selben Ort zu finden, an dem es sich zum Zeitpunkt t = 0 befand. Diese ist durch die Spur der Übergangsamplitude ∞
Z(T) := Sp K(T) = ∫ dx K(x, T; x, 0)
(12.24)
−∞
gegeben. Denn: K(x, T; x, 0) ist die Wahrscheinlichkeitsamplitude, das Teilchen zur Zeit t = T am Ort x zu finden, wenn es sich zur Zeit t = 0 am selben Ort x befand. Durch Summation (Integration) über alle Orte x finden wir die Gesamtamplitude Sp(K(T)). Einsetzen von (12.23) in (12.24) führt auf ein gewöhnliches Fresnel-Integral vom Typ (B.11): ∞
mω i mω ∫ dx exp [− Z(T) = √ (1 − cos(ωT)) x2 ] i2πℏ sin(ωT) ℏ sin(ωT) −∞
=√
mω 2πℏ sin(ωT) 1 √ . = i2πℏ sin(ωT) i2mω(1 − cos(ωT)) i√2(1 − cos(ωT))
12.2 Der Quantenoszillator
| 247
Unter Verwendung der trigonometrischen Beziehung x 1 − cos x = 2 sin2 ( ) 2 erhalten wir Z(T) =
∞ 1 e−iωT/2 1 = ∑ exp [−iω (n + ) T] , = 2i sin(ωT/2) 1 − e−iωT n=0 2
(12.25)
wobei wir im letzten Ausdruck die Summenformel für die geometrische Reihe benutzt haben. Im Abschnitt 6.2.2 sahen wir, dass die Fourier-Transformierte der Übergangsam plitude bezüglich der Zeit bei den exakten Eigenenergien des Teilchens singulär ist (genauer: δ-förmige Singularitäten besitzt), siehe Gleichung (6.18). Die Fourier-Trans formation von Gleichung (12.25) liefert: ∞
Z(E) = ∫ dT e −∞
i ℏ ET
∞
∞
i 1 Z(T) = ∑ ∫ dT exp [ T (E − ℏω (n + ))] ℏ 2 n=0 −∞
∞
= 2πℏ ∑ δ [E − ℏω (n + n=0
1 )] . 2
Dieser Ausdruck ist bei den Energien E n = ℏω (n +
1 ) 2
(12.26)
singulär. In den folgenden Abschnitten werden wir diese Energien als die Eigenenergi en des harmonischen Oszillators durch Lösen der stationären Schrödinger-Gleichung finden.
12.2 Der Quantenoszillator Der Hamilton-Operator eines Teilchens der Masse m im Potenzial des harmonischen Oszillators lautet: H=
p2 1 + mω2 x2 . 2m 2
(12.27)
Da das Potenzial für |x| → ∞ unbegrenzt anwächst, V(|x| → ∞) → ∞ , gibt es nur gebundene Zustände. Im Folgenden sollen die Energien und die Wellen funktionen dieser gebundenen Zustände durch Lösen der stationären SchrödingerGleichung Hφ n (x) = E n φ n (x)
248 | 12 Der harmonische Oszillator
gefunden werden. Dies erfordert das Auffinden der Eigenwerte eines Differenzialope rators zweiter Ordnung, (−
1 ℏ2 d2 + mω2 x2 )φ n (x) = E n φ n (x) , 2m dx2 2
was der Diagonalisierung einer unendlich dimensionalen Matrix äquivalent ist. Für das Oszillatorpotenzial lässt sich jedoch diese Diagonalisierung exakt (analytisch) mittels Operatortransformationen durchführen. Dazu führen wir zunächst dimensi onslose Größen ein und schreiben den Hamilton-Operator als: H = ℏω H̄ ,
d2 x2 1 H̄ = (−x20 2 + 2 ) , 2 dx x0
(12.28)
wobei x0 = √
ℏ mω
(12.29)
die charakteristische Länge des Oszillators ist, die auch als Oszillatorlänge bezeichnet wird. Beziehen wir Ort und Impuls auf diese charakteristische Länge, so können wir dimensionslose Normalkoordinaten einführen, Q=
x , x0
P=
d p 1 d 1 = x0 = x0 , i dQ i dx ℏ
(12.30)
welche der Kommutationsbeziehung [Q, P] = i genügen. In den Normalkoordinaten nimmt der dimensionslose Hamilton-Operator H̄ (12.28) die Gestalt 1 (12.31) H̄ = (P2 + Q2 ) 2 an.
12.3 Algebraische Diagonalisierung des Hamilton-Operators Falls P und Q klassische (kommutierende) Größen wären, könnten wir H̄ mittels der linearen Transformation 1 Z= (Q + iP) (12.32) √2 auf Diagonalform bringen:
H̄ = Z ∗ Z .
(12.33)
Aber auch in der Quantenmechanik, wo Q und P nicht vertauschbare Operatoren sind, lässt sich der reduzierte Hamilton-Operator (12.31) auf eine ähnliche Diagonalform
12.3 Algebraische Diagonalisierung des Hamilton-Operators
|
249
wie (12.33) bringen. Dazu benötigen wir offenbar analog zu (12.32) eine lineare Trans formation, die den Operator Q mit dem Operator P mischt. Wir führen deshalb den Operator a = αQ + βP (12.34) ein, wobei α und β zunächst beliebige komplexe Zahlen sind. Da Q und P hermitesch sind, lautet offenbar der hermitesch adjungierte Operator: a† = α ∗ Q + β ∗ P .
(12.35)
Die Transformation von den Koordinaten und Impulsen auf die nicht hermiteschen Operatoren a, a† schreiben wir zweckmäßigerweise in Matrixform: (
α α∗
Q β a ) ( ) = ( †) . β∗ P a
(12.36)
Durch Invertieren der Koeffizientenmatrix können wir Koordinaten und Impulse durch die Operatoren a, a† ausdrücken: 1 β∗ Q ( ( )= αβ ∗ − α ∗ β −α ∗ P
−β a ) ( †) . α a
Für die im Hamilton-Operator (12.31) auftretenden Ausdrücke Q2 , P2 finden wir dann: 1 [β ∗2 a2 − |β|2 (aa† + a† a) + β 2 (a† )2 ] , (αβ ∗ − α ∗ β)2 1 P2 = [(α ∗ )2 a2 − |α|2 (aa† + a† a) + α 2 (a† )2 ] . (αβ ∗ − α ∗ β)2
Q2 =
Die Koeffizienten α, β in der linearen Transformation (12.34) waren bisher völlig be liebig. Wir werden sie jetzt so wählen, dass die Terme a2 und (a† )2 aus dem Hamil ton-Operator H̄ (12.31) verschwinden, da wir ja eine Form ähnlich zu (12.33) erreichen wollen. Dies liefert die Bedingung α2 + β2 = 0
⇒
β = ±iα .
Diese Bedingung erlaubt uns immer noch, einen der beiden Koeffizienten α oder β beliebig zu wählen. Wir benutzen diese Freiheit, um den Kommutator [a, a† ] = [αQ + βP, α ∗ Q + β ∗ P] = (αβ ∗ − βα ∗ )i = ±2|α|2 in eine möglichst einfache Form zu bringen. Durch geeignete Wahl von α können wir offenbar erreichen, dass der Kommutator 1̂ wird: [a, a† ] = 1̂ .
(12.37)
250 | 12 Der harmonische Oszillator
Diese Bedingung lässt sich erfüllen durch die Wahl α=
1 , √2
β=
i , √2
(12.38)
womit die Koeffizienten α, β dieselben Werte wie im klassischen Fall (12.32) besitzen. Für diese Parameterwerte erhalten wir aus (12.34) und (12.35): 1 (Q + iP) , √2 1 (Q − iP) . a† = √2 a=
(12.39) (12.40)
Ferner wird mit (12.38) die Determinante der Koeffizientenmatrix der linearen Trans formation (12.36): αβ ∗ − α ∗ β = −i , und der reduzierte Hamilton-Operator (12.31) nimmt die Gestalt 1 H̄ = (aa† + a† a) 2 an. Benutzen wir den Kommutator (12.37), so erhalten wir für den ursprünglichen Ha milton-Operator (12.28): H = ℏω (a† a +
1 ). 2
(12.41)
Damit ist es gelungen, den Hamilton-Operator auf eine ähnliche Normalform zu brin gen wie die klassische Hamilton-Funktion des harmonischen Oszillators (12.33).
12.4 Der Besetzungszahloperator Die Eigenwerte von H werden offenbar vollständig durch die Eigenwerte des hermi teschen Operators n̂ = a† a , n̂ † = n̂ bestimmt, dessen Eigenwerte nach Abschnitt 10.5 reell sind: ̂ n|n⟩ = n|n⟩ .
(12.42)
Wir wollen jetzt zeigen, dass seine Eigenwerte nicht negativ sind (d. h., n̂ ist positiv semidefinit): n≥0.
12.4 Der Besetzungszahloperator |
251
Dazu schreiben wir den Eigenwert n als Erwartungswert (wir setzen hier korrekte Nor mierung ⟨n|n⟩ = 1 voraus): ̂ n = ⟨n|n|n⟩ = ⟨n|a† a|n⟩ = ‖a|n⟩‖2 ≥ 0 .
(12.43)
Damit ist n durch das Quadrat der Norm des Zustandes a|n⟩ gegeben und ist folglich nicht negativ. Da die Norm nur für den Nullvektor des Hilbert-Raumes verschwindet, finden wir: Falls ein Eigenwert n = 0 existiert, so wird der zugehörige Eigenzustand |0⟩ durch den Operator a vernichtet: n=0
⇒
a|0⟩ = o .
(12.44)
Man bezeichnet |0⟩ als den Vakuumzustand des Operators a. Für die weiteren Betrachtungen berechnen wir unter Verwendung von (4.42) die Kommutatoren [n,̂ a] = [a† a, a] = [a† , a]a = −a , †
†
†
†
†
†
[n,̂ a ] = [a a, a ] = a [a, a ] = a .
(12.45) (12.46)
Unter Benutzung dieser Beziehungen lässt sich leicht die folgende Behauptung be weisen: Ist |n⟩ Eigenfunktion von n̂ mit Eigenwert n, so sind auch a† |n⟩ und a|n⟩ Ei genfunktionen von n,̂ jedoch zu den Eigenwerten n + 1 bzw. n − 1. In der Tat, benutzen wir die Kommutationsbeziehung (12.46), so finden wir: ̂ † |n⟩ = ([n,̂ a† ] + a† n)|n⟩ ̂ ̂ na = (a† + a† n)|n⟩ † ̂ † ̂ = a (n + 1)|n⟩ = (n + 1)a |n⟩ . Verlangen wir, dass die Zustände |n⟩ normiert sind, so gilt offenbar die Beziehung (+)
a† |n⟩ = C n |n + 1⟩ ,
(12.47)
(+)
wobei C n eine noch zu bestimmende Normierungskonstante ist. In analoger Weise finden wir durch Benutzung von (12.45): ̂ ̂ na|n⟩ = ([n,̂ a] + a n)|n⟩ ̂ = (−a + a n)|n⟩ = (n − 1)a|n⟩ , woraus wir mit Berücksichtigung der Normierung (−)
a|n⟩ = C n |n − 1⟩
(12.48)
finden. Die Operatoren a† , a erhöhen bzw. erniedrigen offenbar die Eigenwerte n von n̂ um 1. Sie erlauben uns damit, aus einer gegebenen Eigenfunktion |n⟩ alle anderen Eigenfunktionen von n̂ und damit vom Hamilton-Operator H zu erzeugen. Sie werden deshalb als Leiter- oder Stufenoperatoren bezeichnet. Genauer bezeichnet man a† als
252 | 12 Der harmonische Oszillator
Erzeugungsoperator und a als Vernichtungsoperator, was im nächsten Abschnitt be gründet wird. (±) Wir bestimmen die Normierungskoeffizienten C n . Unter Benutzung von (12.47) und (12.48) finden wir: ⟨n + 1|n + 1⟩ = = =
1 (+) |C n |2
1 (+) |C n |2
n+1
(+) |C n |2
⟨n|aa† |n⟩ ̂ ⟨n|([a, a† ] + n)|n⟩ !
=1
bzw. ⟨n − 1|n − 1⟩ = = =
1 (−) |C n |2
1 (−) |C n |2
n (−)
|C n |2
⟨n|a† a|n⟩ ̂ ⟨n|n|n⟩ !
=1. (±)
Damit können wir die unbekannten Koeffizienten C n aus (12.47) und (12.48): a† |n⟩ = √n + 1|n + 1⟩ , a|n⟩ = √ n|n − 1⟩ .
eliminieren und erhalten
(12.49) (12.50)
Oben in Gleichung (12.44) hatten wir gefunden: Falls der Operator n̂ den Eigenwert 0 besitzt, muss der dazugehörige Eigenzustand |n = 0⟩ durch den Operator a vernich tet werden, siehe Gleichung (12.44). Wir konnten jedoch noch nicht folgern, dass solch ein Eigenvektor in der Tat existiert. Die Existenz des Eigenwertes 0 von n̂ wird durch (12.50) bewiesen: Falls die n keine ganzen Zahlen sind, führt nach (12.50) die wiederholte Anwen dung des Vernichtungsoperators a schließlich auf einen Zustand |n⟩ mit negativem n, was im Widerspruch zu Gleichung (12.43) steht. Nur wenn ein Zustand |nmin ⟩ mit a|nmin ⟩ = o erreicht wird, bricht die durch die Rekursionsformel (12.50) definierte Folge ab und n wird nicht negativ. Dieser Zustand |nmin ⟩ ist aber nach (12.44) der Va kuumzustand |0⟩ und der minimale Wert von n ist durch nmin = 0 gegeben. Damit sind die Eigenwerte n nicht negative ganze Zahlen. Das Spektrum von n̂ ist jedoch nicht nach oben beschränkt. Wir führen den Be weis indirekt. Wir nehmen an, es existiere ein maximaler Eigenwert nmax von n.̂ Aus
12.5 Das Spektrum des harmonischen Oszillators
| 253
Gleichung (12.49) folgt, dass der zugehörige Eigenvektor durch den Operator a† ver nichtet werden muss: a† |nmax ⟩ = o . Hieraus erhalten wir jedoch einen Widerspruch: ̂ max ⟩ = nmax + 1 . 0 = ⟨nmax |aa† |nmax ⟩ = ⟨nmax |(n̂ + 1)|n Deshalb war die Annahme der Existenz eines maximalen Eigenwertes von n falsch. Zusammenfassend haben wir damit gezeigt, dass die Eigenwerte von n̂ durch die na türlichen Zahlen n ≥ 0 gegeben sind. Aus Gründen, die im nächsten Abschnitt klar werden, wird n̂ als Besetzungszahloperator bezeichnet. Durch wiederholte Anwendung des Operators a† auf den Vakuumzustand |0⟩ kön nen wir alle Eigenzustände des Operators n̂ erzeugen. Zweckmäßigerweise nehmen wir an, dass der Vakuumzustand korrekt normiert ist: ⟨0|0⟩ = 1 . Aus Gleichung (12.49) finden wir dann, dass die normierten Eigenzustände von n̂ durch |n⟩ =
1 (a† )n |0⟩ √n!
(12.51)
gegeben sind. Als Eigenvektoren des hermiteschen Operators n̂ = a† a sind die Zustände |n⟩ zu verschiedenen n orthogonal. Mit obiger Normierung gilt deshalb: ⟨n|m⟩ = δ nm , was sich auch direkt mithilfe der Darstellung (12.51) beweisen lässt.
12.5 Das Spektrum des harmonischen Oszillators Aus der Kenntnis des Spektrums des Operators n̂ erhalten wir sofort das Eigenwert spektrum des Hamilton-Operators des harmonischen Oszillators (12.41). Die Eigen energien lauten offenbar: E n = ℏω (n +
1 ) , 2
n = 0, 1, 2, . . . .
(12.52)
Diese Eigenenergien hatten wir bereits in (12.26) aus der Spur des Propagators gefun den, den wir über die Pfadintegraldarstellung berechnet hatten.
254 | 12 Der harmonische Oszillator V (x) ϕ(x) n=4 n=3 n=2 n=1 n=0 x Abb. 12.2: Spektrum des harmonischen Oszillators sowie zugehörige Wellenfunktionen.
Das gesamte Spektrum des harmonischen Oszillators ist diskret und (wie für jede eindimensionale, gebundene Bewegung) nicht entartet. Für die Energie des Grundzu standes, die sogenannte Nullpunktsenergie, erhalten wir: E0 =
1 ℏω . 2
(12.53)
Sie ist nicht durch das Potenzialminimum gegeben (wie im klassischen Fall), sondern das Teilchen besitzt im Grundzustand eine von null verschiedene Bewegungsenergie. Wäre das Teilchen im Potenzialminimum in Ruhe, so würde es die Unschärferelation verletzen. Das Spektrum des harmonischen Oszillators (12.52) ist äquidistant: Der Abstand zwischen benachbarten Energieniveaus ist immer ℏω: E n+1 − E n = ℏω , siehe Abb. 12.2. Die benachbarten Zustände unterscheiden sich jeweils um ein Schwin gungsquant ℏω. Die Zahl der Schwingungsquanten in einem Zustand |n⟩ wird offenbar durch die Zahl n gegeben, die deshalb auch als Besetzungszahl bezeichnet wird. Dem entsprechend wird der Operator n̂ als Besetzungszahloperator bezeichnet. Der Hamil ton-Operator des harmonischen Oszillators beschreibt damit ein System von identi schen, d. h. nicht unterscheidbaren Schwingungsquanten, die auch als Vibronen oder (im Kontext der Festkörperphysik) als Phononen bezeichnet werden und die eine En ergie ℏω besitzen. Der n-te angeregte Zustand ist aus n Schwingungsquanten aufge baut. Die Anzahl der Schwingungsquanten kann sich durch Anregung oder Abregung des Oszillators verändern. Die Anregung des Oszillators geschieht offenbar durch den Operator a† , der ein Phonon erzeugt, während die Abregung durch den Operator a er folgt, der ein Phonon vernichtet. Dieser Umstand rechtfertigt die früher eingeführten Bezeichnungen Erzeugungs- und Vernichtungsoperatoren.
12.6 Unschärferelation |
255
12.6 Unschärferelation Oben haben wir die exakten Eigenzustände |n⟩ des Besetzungszahloperators n̂ bzw. des Hamilton-Operators H gefunden. Diese Zustände besitzen eine scharfe Phononen zahl und damit eine scharfe Energie. Sie sind jedoch unscharf im Ort und im Impuls. Im Folgenden wollen wir die Orts- und Impulsunschärfe in den Oszillatoreigenzustän den |n⟩ berechnen. Da das Potenzial symmetrisch bezüglich Raumspiegelung ist, er warten wir, dass die Erwartungswerte von x und p in den Oszillatoreigenzuständen verschwinden: ̂ ̂ ⟨n|x|n⟩ = 0 , ⟨n|p|n⟩ =0. Dies lässt sich leicht überprüfen, wenn wir Ort und Impuls durch Inversion von (12.39), (12.40) und Benutzung von (12.30) durch die Erzeugungs- und Vernichtungsoperato ren darstellen:
x̂ =
x0 (a + a† ) , √2
p̂ =
iℏ x0 √2
(a† − a) .
(12.54)
Beachten wir die Eigenschaften (12.49) und (12.50) der Erzeugungs- und Vernichtungs operatoren, so finden wir unmittelbar: ̂ ⟨n|x|n⟩ = = ̂ ⟨n|p|n⟩ =
x0 (⟨n|a|n⟩ + ⟨n|a† |n⟩) √2 x0 ⟨n|n + 1⟩ √n + 1) = 0 , ( ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ ⟨n|n − 1⟩ √n + ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ √2 =0 =0 iℏ x 0 √2
(⟨n|a† |n⟩ − ⟨n|a|n⟩) = 0 .
Mit der Darstellung (12.54) lassen sich auch die Schwankungsquadrate unmittelbar berechnen. Für die Ortsunschärfe finden wir: x20 ⟨n| (a2 + aa† + a† a + (a† )2 ) |n⟩ 2 x2 x2 = 0 ⟨n|(aa† + a† a)|n⟩ = 0 ⟨n|2n̂ + 1|n⟩ 2 2 1 2 = x0 (n + ) 2
(∆x)2n = ⟨n|x̂ 2 |n⟩ =
(12.55)
und in analoger Weise für die Impulsunschärfe: (∆p)2n = ⟨n|p2 |n⟩ = =
−ℏ2 ⟨n| ((a† ))2 − aa† − a† a + (a)2 ) |n⟩ 2x20
1 ℏ2 (n + ) . 2 2 x0
(12.56)
256 | 12 Der harmonische Oszillator
Damit erhalten wir für die Ort-Impuls-Unschärfe: (∆x)n (∆p)n = ℏ (n +
1 ) . 2
(12.57)
Die Unschärfe ist minimal im Grundzustand n = 0, wo sie den Wert (∆x)0 (∆p)0 =
ℏ 2
annimmt. Nach der allgemeinen Bedingung, die wir aus der Schwarz’schen Unglei chung gewonnen hatten (11.10), stellt dieser Wert aber gerade das absolute Minimum für die Ort-Impuls-Unschärfe dar. Die Unschärfe wächst mit zunehmender Phononen zahl n; jedes Phonon bringt eine zusätzliche Unschärfe ℏ in den Zustand.
12.7 Besetzungszahldarstellung Unter Benutzung der Beziehungen (12.49) und (12.50) können wir die Matrixele mente der Erzeugungs- und Vernichtungsoperatoren in den Eigenzuständen |n⟩ des Besetzungszahloperators berechnen. Aus (12.49) und (12.50) finden wir für i, k = 0, 1, 2, . . . : a ik = ⟨i|a|k⟩ = ⟨i|√ k|k − 1⟩ = √k δ i,k−1 = √i + 1δ i,k−1 , a†ik = ⟨i|a† |k⟩ = ⟨i|√k + 1|k + 1⟩ = √k + 1 δ i,k+1 = √i δ i,k+1 . Damit besitzen die Erzeugungs- und Vernichtungsoperatoren in dieser Basis die Ma trixdarstellung 0 0 a = (0 .. . 0 √1 ( a† = ( 0 0 .. ( .
√1 0 0 .. . 0 0 √2 0 .. .
0 √2 0 .. . 0 0 0 √3
0 0 √3
... ... ..
) ,
.
... ... . . .) ) . ..
.
(12.58)
)
(12.59)
12.8 Ortsdarstellung der Energieeigenfunktionen: Die Hermite-Polynome
| 257
Benutzen wir die Beziehungen (12.54), so können wir auch die Matrixdarstellung des Orts- und Impulsoperators angeben: √1
0 √1 1 ℏ (0 x̂ = x0 (a + a† ) = √ ( 2mω √2 0 .. ( .
0 √2 0 .. .
0 √1 ℏmω ( 0 ℏ 1 † p̂ = i (a − a) = i√ ( x0 2 2 0 .. ( .
−√1 0 √2 0 .. .
0 √2 0 √3 .. .
0 0 √3 0
0 √ − 2 0 √3 .. .
... ... . . .) ) , ..
0 0 −√3 0
.
) ... ... . . .) ) . ..
.
)
Ganz allgemein sind die Operatoren im Hilbert-Raum der Eigenzustände des Oszilla tors durch unendlich dimensionale Matrizen realisiert.
12.8 Ortsdarstellung der Energieeigenfunktionen: Die Hermite-Polynome Wir haben oben die Eigenzustände des harmonischen Oszillators auf rein algebraische Art gefunden, ohne explizit die Differenzialgleichung zu lösen, welche die Schrödin ger-Gleichung im Ortsraum darstellt. Dies gelang durch analytische Diagonalisierung des Hamilton-Operators. Dazu haben wir Linearkombinationen von Orts- und Impuls operator gebildet, was auf die Erzeugungs- und Vernichtungsoperatoren führte. Diese haben die angenehme Eigenschaft, dass sie erlauben, aus einem einzigen Zustand al le übrigen Eigenzustände zu gewinnen. Darüber hinaus haben ihre Matrixelemente in der Basis {|n⟩} eine sehr einfache Gestalt. Die algebraische Methode ist jedoch nicht auf das Auffinden der Energieeigen werte beschränkt. Auch die Erwartungswerte von beliebigen Observablen können rein algebraisch für den harmonischen Oszillator berechnet werden. Betrachten wir z. B. eine beliebige Observable A im Ortsraum. Im Allgemeinen wird die Observable nicht nur eine Ortsabhängigkeit, sondern auch eine Impulsabhängigkeit besitzen, A(x, p), und damit Differenzialoperatoren bezüglich des Ortes enthalten. Unter Benutzung der Beziehung (12.54) können wir jedoch Ort und Impuls durch Erzeugungs- und Vernich tungsoperatoren ausdrücken. Jede Observable wird damit eine Funktion der Erzeu gungs- und Vernichtungsoperatoren: A(x, p) = A(∼ (a + a† ), ∼ i(a† − a)) .
258 | 12 Der harmonische Oszillator Ferner stellen die Eigenfunktionen des Besetzungszahloperators, |n⟩, ein vollstän diges orthonormales System dar, nach dem wir jede beliebige Wellenfunktion entwi ckeln können. Damit gelingt es, beliebige Matrixelemente einer beliebigen Observa blen durch die Matrixelemente der Erzeugungs- und Vernichtungsoperatoren in der Eigenbasis von n̂ auszudrücken. Wir benötigen deshalb niemals eine explizite Dar stellung der Besetzungszahleigenfunktionen |n⟩, z. B. die Ortsdarstellung. Nichtsdes totrotz ist es instruktiv, die Eigenfunktionen des harmonischen Oszillators in der Orts darstellung zu betrachten. Die Ortsdarstellung der Oszillatorwellenfunktion ist durch φ n (x) = ⟨x|n⟩ definiert. Der Grundzustand des harmonischen Oszillators wird durch den Operator a vernichtet, siehe Gleichung (12.44). Schreiben wir diese Gleichung in der dimensions losen Q-Darstellung (Q = x/x0 ), 0 = ⟨Q|a|0⟩ , und fügen die 1̂ in der Q-Darstellung 1̂ = ∫ dQ |Q ⟩⟨Q | ein, so erhalten wir: 0 = ⟨Q|a|0⟩ = ∫ dQ ⟨Q|a|Q ⟩⟨Q |0⟩ .
(12.60)
Unter Benutzung der Darstellung (12.39) von a finden wir für sein Matrixelement in der Q-Darstellung: ⟨Q|a|Q ⟩ =
1 ̂ ⟩ + i⟨Q|P|Q ̂ ⟩) . (⟨Q|Q|Q √2
Das Matrixelement des Ortsoperators Q̂ in der Ortsdarstellung erhalten wir wegen ̂ Q|Q⟩ = Q|Q⟩ und (siehe Gleichung (10.47)) ⟨Q|Q ⟩ = δ(Q − Q ) trivialerweise zu:
̂ ⟩ = Qδ(Q − Q ) . ⟨Q|Q|Q
Für das Matrixelement des Impulsoperators² P̂ (12.30) finden wir analog zu Glei chung (10.55): ̂ ⟩ = 1 d δ(Q − Q ) . ⟨Q|P|Q i dQ 2 Man beachte, dass der Operator P̂ (12.30) kein ℏ enthält.
12.8 Ortsdarstellung der Energieeigenfunktionen: Die Hermite-Polynome |
259
Setzen wir diese Ausdrücke in Gleichung (12.60) ein, so finden wir nach Ausführen der Q -Integration mit ⟨Q|0⟩ ≡ φ0 (Q): 0 = ⟨Q|a|0⟩ = a(Q)φ0 (Q) , wobei
1 1 d (Q + iP) = ) (Q + dQ √2 √2 der Vernichtungsoperator (12.39) in der Ortsdarstellung (12.30) ist. Die Bedingung an den Grundzustand (Vakuum) liefert damit die lineare Differenzialgleichung a(Q) =
a(Q)φ0 (Q) =
d 1 ) φ0 (Q) = 0 , (Q + dQ √2
(12.61)
deren Lösung durch 1 φ0 (Q) = C exp (− Q2 ) 2 gegeben ist. Gehen wir von der dimensionslosen Normalkoordinate Q zur Ortsvaria blen x über, so lautet die Wellenfunktion des Grundzustandes: 1 x 2 φ0 (x) = C exp [− ( ) ] . 2 x0
(12.62)
Die Konstante C wird durch die Normierung bestimmt: ∞
∞
!
1 = ‖φ0 ‖2 = ∫ dx φ∗0 (x)φ0 (x) = |C|2 ∫ dx exp [− ( −∞ ∞
−∞
x 2 ) ] x0
= |C|2 x0 ∫ dQ e−Q = |C|2 x0 √π 2
−∞
⇒
C=√
1 mω 1/4 =( . ) ℏπ √πx0
(12.63)
Damit lautet die normierte Wellenfunktion des Grundzustandes: φ0 (x) = (
mω 1/4 1 x 2 ) exp [− ( ) ] . πℏ 2 x0
(12.64)
Sie stellt eine bei x = 0 lokalisierte Gauß-Funktion dar, deren Breite durch die cha rakteristische Länge x0 gegeben ist. Eine Wellenfunktion dieser Gestalt haben wir na türlich intuitiv erwartet, da die Wellenfunktion des Grundzustandes keinen Knoten besitzen kann. In ähnlicher Weise können wir auch die Ortsdarstellung aller angereg ten Zustände bestimmen. Dazu brauchen wir nur die explizite Darstellung der Eigen funktionen |n⟩ in der Ortsdarstellung aufzuschreiben: φ n (Q) = ⟨Q|n⟩ =
1 1 ⟨Q|(a† )n |0⟩ = (a† (Q))n φ0 (Q) . √n! √n!
(12.65)
260 | 12 Der harmonische Oszillator
Mit (12.40) a† (Q) =
1 d ) (Q − dQ √2
erhalten wir: φ n (Q) =
1 √2n n!
(Q −
d n mω 1/4 − 1 Q2 ) ( ) e 2 . dQ πℏ
Als Funktion der Normalkoordinate Q lauten damit die korrekt normierten Wellen funktionen der angeregten Zustände des harmonischen Oszillators: 1 2 mω 1/4 1 e− 2 Q H n (Q) ) n πℏ √2 n! 1 mω 1/4 h n (Q) . ) h n (Q) = ≡( ℏ √x0
φ n (Q) = (
(12.66)
Hierbei sind h n (Q) die Hermite-Funktionen und 1
2
H n (Q) = e 2 Q (Q −
d n − 1 Q2 ) e 2 dQ
(12.67)
die Hermite-Polynome. H n (Q) stellt ein Polynom n-ten Grades in Q dar, das die Sym metrie H n (−Q) = (−1)n H n (Q) besitzt. Diese Beziehung garantiert, dass die Wellenfunktionen des harmonischen Os zillators entweder symmetrisch oder antisymmetrisch sind, was, wie wir früher bereits in Abschnitt 8.4 gesehen haben, eine Konsequenz der Spiegelsymmetrie des Potenzi als (V(−x) = V(x)) ist. Für die Oszillatorwellenfunktion ist die Parität deshalb durch π n = (−1)n gegeben. Die in Gleichung (12.67) angegebene Darstellung der Hermite-Polynome ist nicht die Standarddarstel lung n 2 d 2 H n (Q) = (−1)n e Q e −Q . (12.68) dQ n Man kann jedoch leicht unter Benutzung der Beziehung (
n 1 d 1 d 1 d 1 d 1 d f(x)) = (f ) (f ) . . . (f ) f f(x) dx f dx f dx f dx f dx
=
1 dn f(x) f(x) dx n
(12.69)
12.8 Ortsdarstellung der Energieeigenfunktionen: Die Hermite-Polynome
|
261
zeigen, dass die beiden Darstellungen (12.67) und (12.68) äquivalent sind: H n (Q) = (−1)n e Q
2
d n −Q2 e dQ n
= (−1)n (e 2 Q e 2 Q
1
1
2
1
1
2
2
2
= (−1)n e 2 Q (e 2 Q
(12.69)
=
(−1)n (e Q
2
d −Q2 n ) e dQ
d − 1 Q2 − 1 Q2 n e 2 e 2 ) dQ d − 1 Q2 n − 1 Q2 e 2 ) e 2 dQ
n 1 2 1 2 1 2 1 2 d 1 2 d = (−1)n e 2 Q {e 2 Q ([ , e − 2 Q ] +e − 2 Q )} e − 2 Q dQ dQ ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ 1 2
− Q =−Qe 2 1
2
= (−1)n e 2 Q ( 1
2
= e 2 Q (Q −
n 1 2 d − Q) e − 2 Q dQ
d n − 1 Q2 ) e 2 . dQ
Da die Eigenfunktionen des hermiteschen Besetzungszahloperators n̂ orthogonal sind und wir außerdem diese Zustände korrekt normiert hatten, muss dies auch für diese Zustände in der Ortsdarstellung gelten. Hieraus folgt für die Hermite-Polynome die Orthonormalitätsbeziehung ∞
∫ dQ e−Q H n (Q)H m (Q) = √π2n n!δ nm . 2
−∞
Zur einfacheren Berechnung der Hermite-Polynome leiten wir noch eine Rekursions formel ab. Dazu schreiben wir die Beziehungen (12.49) und (12.50) in der Ortsdarstel lung auf: 1 d a† (Q)φ n (Q) = ) φ n (Q) = √n + 1φ n+1 (Q) , (Q − dQ √2 (12.70) 1 d ) φ n (Q) = √nφ n−1 (Q) . a(Q)φ n (Q) = (Q + dQ √2 Addieren wir beide Gleichungen, so erhalten wir: √2Qφ n (Q) = √n + 1φ n+1 (Q) + √nφ n−1 (Q) . Dies liefert für die Hermite-Polynome mit Gleichung (12.67) die Rekursionsbeziehung 2QH n (Q) = H n+1 (Q) + 2nH n−1 (Q) . Die ersten Hermite-Polynome lauten: H0 (Q) = 1 , H1 (Q) = 2Q , H2 (Q) = (2Q)2 − 2 , H3 (Q) = (2Q)3 − 6(2Q) .
(12.71)
262 | 12 Der harmonische Oszillator
Subtrahieren wir die beiden Gleichungen in (12.70) voneinander, so erhalten wir die Beziehung d φ n (Q) = √2nφ n−1 (Q) − Qφ n (Q) . dQ Drücken wir hier φ n (Q) durch die Hermite-Polynome (12.66) aus, erhalten wir für die Ableitung der Hermite-Polynome: d H n (Q) = 2nH n−1 (Q) . dQ
(12.72)
Differenzieren wir diese Gleichung nach Q und benutzen die Rekursionsbeziehung (12.71) sowie den obigen Ausdruck für die Ableitung der Hermite-Polynome, d2 H n (Q) dQ2
d (2nH n−1 (Q)) dQ (12.71) d (2QH n (Q) − H n+1 (Q)) = dQ d d = 2H n (Q) + 2Q H n (Q) − H n+1 (Q) dQ dQ d (12.72) = 2H n (Q) + 2Q H n (Q) − 2(n + 1)H n (Q) , dQ =
so erhalten wir die hermitesche Differenzialgleichung (
d2 d + 2n) H n (Q) = 0 . − 2Q 2 dQ dQ
12.9 Der dreidimensionale harmonische Oszillator Wie wir bei der Behandlung der eindimensionalen Potenzialprobleme gesehen ha ben, lässt sich ein nach unten beschränktes Potenzial mit Potenzialminimum in der Nähe des Minimums für niedrige Energien stets durch ein Oszillatorpotenzial appro ximieren. Dies bleibt auch gültig in drei Dimensionen, wobei jedoch i. A. das Oszil latorpotenzial in verschiedenen Richtungen verschieden gekrümmt sein kann. Die allgemeinste Form des dreidimensionalen Potenzials in der Nähe des Minimums hat deshalb die Gestalt V(x1 , x2 , x3 ) =
1 1 1 a1 x21 + a2 x22 + a3 x23 + b 12 x1 x2 + b 23 x2 x3 + b 31 x3 x1 . 2 2 2
Durch lineare Koordinatentransformation lässt sich die quadratische Form in den kar tesischen Koordinaten diagonalisieren. In den resultierenden Normalkoordinaten hat dann das Potenzial die Gestalt V(x) =
1 3 2 2 m∑ω x . 2 i=1 i i
12.9 Der dreidimensionale harmonische Oszillator
| 263
Bei diesem Potenzial wirkt in den drei unabhängigen Normalrichtungen jeweils ein harmonisches Potenzial, jedoch mit unterschiedlicher Krümmung. Dieses Potenzial definiert den dreidimensionalen anisotropen harmonischen Oszillator. Der zugehörige Hamilton-Operator 3 p2 H= + V(x) = ∑ H i (x i ) 2m i=1 zerfällt in eine Summe von harmonischen Oszillatoren bezüglich der drei Normalko ordinaten: p2 1 H i (x i ) = i + mω2i x2i . 2m 2 Da die Oszillatoren verschiedener Normalkoordinaten unabhängig sind, kommutie ren die zugehörigen Hamilton-Operatoren, [H i , H j ] = 0̂ , und wir können die stationäre Schrödinger-Gleichung Hφ(x) = Eφ(x) durch den Produktansatz³ φ(x) ≡ φ(x1 , x2 , x3 ) = φ1 (x1 )φ2 (x2 )φ3 (x3 )
(12.73)
lösen. Setzen wir diesen Ansatz in die Schrödinger-Gleichung ein und dividieren durch die Wellenfunktion, so erhalten wir: 1 1 1 H1 φ1 (x1 ) + H2 φ2 (x2 ) + H3 φ3 (x3 ) = E . φ1 (x1 ) φ2 (x2 ) φ3 (x3 ) Da die rechte Seite dieser Gleichung eine Konstante, die Energie E ist und jeder ein zelne Term nur von jeweils einer anderen Variable (Normalkoordinate) x1 abhängt, kann diese Gleichung nur erfüllt sein, wenn jeder einzelne Term für sich konstant, d. h. gleich einer Konstanten E i , ist. Die Schrödinger-Gleichung reduziert sich somit auf drei unabhängige Schrödinger-Gleichungen: H1 φ1 (x1 ) = E1 φ1 (x1 ) , H2 φ2 (x2 ) = E2 φ2 (x2 ) , H3 φ3 (x3 ) = E3 φ3 (x3 ) , und die Gesamtenergie ist durch E = E1 + E2 + E3
3 Streng genommen handelt es sich hier um ein Tensorprodukt φ 1 (x 1 ) ⊗ φ 2 (x 2 ) ⊗ φ 3 (x 3 ), siehe Ab schnitt 10.7.
264 | 12 Der harmonische Oszillator
gegeben. Damit ist es uns mit dem Produktansatz (12.73) gelungen, den dreidimensio nalen Oszillator in drei eindimensionale Oszillatoren zu separieren. Der Produktan satz wird deshalb in diesem Zusammenhang auch als Separationsansatz bezeichnet. Mit ihm lässt sich offenbar immer dann eine Separation des Eigenwertproblems errei chen, wenn der betrachtete Operator aus einer Summe von (untereinander kommu tierenden) Operatoren besteht, die in verschiedenen Hilbert-Räumen wirken. Da jeder einzelne Hamilton-Operator H i einen eindimensionalen harmonischen Oszillator darstellt, lauten nach Abschnitt 12.5 die Energieeigenwerte: E i = ℏω i (n i +
1 ) , 2
und die Wellenfunktionen φ n i (x i ) = ⟨x i |n i ⟩ sind durch die hermiteschen Funktionen (12.66) gegeben. Für den dreidimensionalen stationären Zustand lautet deshalb die Gesamtenergie: 3
E = ∑ ℏω i (n i + i=1
1 ) , 2
und die Wellenfunktion ist durch φ(x) = φ n1 (x1 )φ n2 (x2 )φ n3 (x3 ) gegeben.
Der isotrope harmonische Oszillator Im Folgenden wollen wir den wichtigen Spezialfall untersuchen, für den das Oszilla torpotenzial in allen drei Richtungen dieselbe Krümmung besitzt: ω1 = ω2 = ω3 = ω . Dieser Oszillator wird als isotroper harmonischer Oszillator bezeichnet. Die Energie eigenwerte sind dann durch 3 E n = ℏω (n + ) (12.74) 2 gegeben, wobei n = n1 + n2 + n3 (12.75) die Gesamtzahl der Oszillatorschwingungsquanten ist. Das Spektrum der drei Oszilla toren ist entartet, da sich das gleiche n durch verschiedene Kombinationen von n1 , n2 und n3 realisieren lässt. Im Folgenden wollen wir den Entartungsgrad g n eines Ener gieniveaus E n berechnen. Dieser ist offenbar durch n
n
n
g n = ∑ ∑ ∑ δ n,n1 +n2 +n3 n1 =0 n2 =0 n3 =0
12.10 Das unendlich schwere Teilchen | 265
gegeben, wobei das Kronecker-Symbol die Bedingung (12.75) berücksichtigt. Diese Be dingung erlaubt es uns, sofort eine der drei Summationen trivial auszuführen. Wir wählen hierzu die Summation über n3 . Wegen n3 = n − (n1 + n2 ) ≥ 0 ist für festes n und n1 die Quantenzahl n2 auf die Werte n2 ≤ n − n1 eingeschränkt, und wir erhalten n
n
n
n−n1
g n = ∑ ∑ Θ(n − n1 − n2 ) = ∑ ∑ 1 . n1 =0 n2 =0
n1 =0 n2 =0
Die verbleibenden Summen lassen sich trivial ausführen. Mit n−n1
∑ 1 = n − n1 + 1
n2 =0
finden wir n
n
n
g n = ∑ (n − n1 + 1) = (n + 1) ∑ 1 − ∑ n1 = (n + 1)2 − n1 =0
n1 =0
n1 =0
n(n + 1) 2
1 n+2 n = (n + 1) (n + 1 − ) = (n + 1)(n + 2) = ( ). 2 2 2 Der isotrope harmonische Oszillator lässt sich offensichtlich aufgrund seiner sphä rischen Symmetrie auch bequem in sphärischen Koordinaten lösen, was wir in Ab schnitt 17.6 tun werden.
12.10 Das unendlich schwere Teilchen* Die Beschreibung eines quantenmechanischen Teilchens in einem äußeren Potenzial vereinfacht sich drastisch, wenn das betrachtete Teilchen sehr massiv ist. Im Grenzfall m → ∞ können wir in der Schrödinger-Gleichung (
p2 + V(x)) φ(x) = Eφ(x) 2m
für endliche Impulse p = ℏk bzw. Wellenzahlen k die kinetische Energie gegenüber der potenziellen Energie vernachlässigen, p2 ≪ V(x) , 2m
* Dieser Abschnitt ist für das Verständnis der übrigen Abschnitte nicht erforderlich und kann deshalb beim ersten Lesen übersprungen werden.
266 | 12 Der harmonische Oszillator
und erhalten: V(x)φ(x) = Eφ(x) . Da das Potenzial nur eine Funktion der Ortsvariablen ist, sind die Eigenfunktionen φ(x) durch Eigenfunktionen des Ortes (4.41) gegeben: φ(x) = ξ x (x) ,
xξ̂ x (x) = x ξ x (x) ,
ξ x (x) = δ(x − x ) .
(12.76)
Für die Energie erhalten wir dann: E ≡ E x = V(x ) . Der Zustand kleinster Energie (Grundzustand) ist durch das Potenzialminimum rea lisiert. Im Grundzustand sitzt also das unendlich schwere Teilchen im Potenzialmi nimum. Es verhält sich deshalb wie ein klassisches Teilchen. Da es am Potenzial minimum lokalisiert ist, besitzt es eine unendlich große Impulsunschärfe. Für das unendlich massive Teilchen ist eine unendliche Unschärfe im Impuls nicht tragisch, da sein Impuls wegen der unendlich großen Masse für jede noch so kleine endliche Geschwindigkeit den Wert unendlich erreicht. Zur Illustration dieses Sachverhaltes wollen wir ein Teilchen der Masse m → ∞ in einem Oszillatorpotenzial κ V(x) = x2 (12.77) 2 betrachten. Bei endlicher „Federkonstante“ κ verschwinden im Limes m → ∞ sowohl die Oszillatorfrequenz (12.1), κ ω=√ →0, m als auch die Oszillatorlänge (12.29): x0 = √
ℏ ℏ =√ →0. mω √mκ
Aus Gleichungen (12.55) und (12.56) folgt hieraus für die Orts- und Impulsunschärfe: ∆x n ∼ x0 → 0 ,
∆p n ∼
1 →∞. x0
Wie erwartet besitzt das unendlich schwere Teilchen einen scharfen Ort und einen völlig unbestimmten Impuls. Für ω → 0 kollabiert das gesamte Spektrum des harmo nischen Oszillators (für endliche n) E n = ℏω (n + zu einem einzigen Energiezustand E=0,
1 ) 2
12.11 Kohärente Zustände | 267
und das unendlich schwere Teilchen muss sich folglich im Potenzialminimum V(x = 0) = 0 aufhalten. (Man beachte, dass das Potenzial (12.77) unabhängig von ω und unabhän gig von der Masse m ist und somit bei festem κ = mω2 für ω → 0 bzw. m → ∞ nicht verschwindet.) In der Tat finden wir für die Grundzustandswellenfunktion (12.64) im Limes x0 → 0 unter Benutzung von (A.7): φ0 (x) = √δ(x) . Diese beschreibt offenbar ein bei x = 0 lokalisiertes Teilchen.
12.11 Kohärente Zustände Im Folgenden fragen wir nach den Eigenzuständen der Vernichtungs- bzw. Erzeu gungsoperatoren, die für a durch a|Z⟩ = Z|Z⟩
(12.78)
definiert sind. Da a† ≠ a, werden die Eigenwerte Z i. A. komplex sein. Da der Ver nichtungsoperator die Anzahl der Phononen um 1 verringert, können die Oszillator eigenzustände |n⟩ keine Eigenzustände von a sein. Dies ist auch bereits klar aus der Matrixdarstellung der Erzeugungs- bzw. Vernichtungsoperatoren (12.59) und (12.58). Die Eigenzustände des Besetzungszahloperators |n⟩ stellen jedoch eine vollständige Basis dar, nach denen wir die Eigenfunktionen von a entwickeln können: ∞
|Z⟩ = ∑ C n |n⟩ .
(12.79)
n=0
Wenden wir auf diesen Zustand den Vernichtungsoperator an, so finden wir unter Berücksichtigung der Wirkung dieses Operators auf die Oszillatoreigenzustände |n⟩, Gleichung (12.50): ∞
a|Z⟩ = ∑ C n a|n⟩ n=0 ∞
= ∑ C n √n|n − 1⟩ n=1 ∞
= ∑ C k+1 √k + 1|k⟩ , k=0 !
∞
= Z|Z⟩ ≡ Z ∑ C k |k⟩ k=0
k = n−1.
268 | 12 Der harmonische Oszillator
Hieraus erhalten wir für die Entwicklungskoeffizienten C k die Rekursionsbeziehung C k+1 =
Z Ck , √k + 1
deren Lösung durch Zk (12.80) C0 √k! gegeben ist, wobei C0 prinzipiell von Z abhängen kann und durch die Normierung festgelegt ist. Benutzen wir die explizite Darstellung (12.51) der Oszillatoreigenfunktionen |n⟩ durch die Erzeugungsoperatoren a† , so erhalten wir für die Eigenzustände |Z⟩ von a: Ck =
∞
|Z⟩ = C0 (Z) ∑ k=0
∞ Zk Zk † k |k⟩ = C0 (Z) ∑ (a ) |0⟩ . k! √k! k=0
(12.81)
Die hier auftretende Summe ist aber nichts weiter als die Taylor-Entwicklung der Ex ponentialfunktion. Deshalb können wir diesen Zustand schreiben als: †
|Z⟩ = C0 (Z)e Za |0⟩ .
(12.82)
Da dieser Zustand |Z⟩ eine kohärente (für reelle Z phasengleiche) Überlagerung aller Oszillatoreigenzustände ist (siehe Gleichung (12.81)), wird er als kohärenter Zustand bezeichnet. In den obigen Betrachtungen haben wir keinerlei Einschränkungen an den Eigen wert Z gemacht. Deshalb kann Z eine beliebige komplexe Zahl sein. Nehmen wir das Adjungierte der Gleichung (12.78), so erhalten wir die Eigenwert gleichung des Erzeugungsoperators: ⟨Z|a† = ⟨Z|Z ∗ .
(12.83)
Dementsprechend finden wir durch Adjungieren der Gleichung (12.82) den dualen ko härenten Zustand ∗ ⟨Z| = ⟨0|e Z a C∗0 (Z) . Die kohärenten Zustände zu verschiedenen Z sind nicht orthogonal, sie bilden jedoch eine vollständige, genauer gesagt, „übervollständige“ Basis.⁴ In der Tat, berechnen wir das Überlappungsintegral zweier kohärenter Zustände, so finden wir: ∞
∞
(Z ∗ )n Zm ⟨n|m⟩ √m! n=0 m=0 √ n!
⟨Z |Z⟩ = C∗0 (Z )C0 (Z) ∑ ∑ ∞
∗ (Z ∗ Z)n = C∗0 (Z )C0 (Z)e Z Z . n! n=0
= C∗0 (Z )C0 (Z) ∑
4 Das heißt, die |Z⟩ mit Z ∈ ℂ enthalten mehr Zustände als für eine vollständige Basis erforderlich sind.
12.11 Kohärente Zustände | 269
Den bisher noch unbestimmten Koeffizienten C0 können wir jetzt so wählen, dass die kohärenten Zustände auf 1 normiert sind, was C0 (Z) = e− 2 |Z| 1
2
(12.84)
impliziert. Die normierten kohärenten Zustände (12.82) lauten dann: †
|Z⟩ = e− 2 |Z| e Za |0⟩ ⟨Z|Z⟩ = 1 . 1
2
(12.85)
Alternativ lassen sich die normierten kohärenten Zustände |Z⟩ (12.85) in der Form |Z⟩ = e Za
† −Z ∗ a
|0⟩
(12.86)
darstellen. Um die Äquivalenz von (12.86) zu (12.85) zu zeigen, benutzen wir die Glauber-Formel (C.19) und erhalten 1 ∗ † ∗ † † ∗ e Za −Z a = e Za e − 2 Z Z[a,a ] e Z a . (12.87) Wegen a|0⟩ = 0 gilt eZ
∗a
|0⟩ = |0⟩ ,
und mit [a, a† ] = 1 erhalten wir dann aus (12.87) e Za
† −Z ∗ a
1
2
†
|0⟩ = e − 2 |Z| e Za |0⟩ .
Der Zustand |Z = 0⟩ ist offenbar durch den Grundzustand des Oszillators gegeben: |Z = 0⟩ = |n = 0⟩ . Mit (12.84) und (12.80) finden wir aus (12.79) die Zerlegung ∞
Zk |k⟩ . √ k=0 k!
|Z⟩ = e − 2 |Z| ∑ 1
2
(12.88)
Da die kohärenten Zustände vollständig sind, erlauben sie eine Darstellung des Ein heitsoperators (Vollständigkeitsrelation), dZ ∗ dZ 1̂ = ∫ |Z⟩⟨Z| , 2πi die wir gleich beweisen werden.
(12.89)
270 | 12 Der harmonische Oszillator
In der Polarkoordinatendarstellung Z = re iφ ist das Integrationsmaß
∂(Z ∗ , Z) ) dr dφ ∂(r, φ) mit der Jacobi-Matrix der Variablentransformation (r, φ) → (Z ∗ , Z), dZ ∗ dZ = det (
∂(Z ∗ , Z) e −iφ =( ∂(r, φ) −ire −iφ bzw. ihrer Determinante det durch
e iφ ) , ire iφ
∂(Z ∗ , Z) = 2ir ∂(r, φ)
r dr dφ dZ ∗ dZ = 2πi π
gegeben. Zum Beweis der Vollständigkeitsrelation (12.89) benutzen wir für die kohärenten Zustände die Darstellung (12.88) dZ ∗ dZ 1̂ = ∫ |Z⟩⟨Z| 2πi dZ ∗ dZ −|Z|2 Zn Z ∗m =∫ ∑ e |n⟩⟨m| 2πi √ √ n! m! n,m = ∑ n,m
∞
2π
2 dφ i(n−m)φ e |n⟩⟨m| ∫ dr 2rr n+m e −r ∫ 2π √ n!m! 0 ⏟⏟0⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟
1
δ nm ∞
=∑ n
1 |n⟩⟨n| ∫ dx x n e −x , n!
x = r2 .
0
Das hier verbleibende Integral lässt sich elementar berechnen: ∞
∞
dn = n! . ∫ dx x n e −x = (−1)n [ n ∫ dx e −αx ] dα 0 0 [ ]α=1 Mit diesem Ergebnis reduziert sich die Vollständigkeitsrelation der kohärenten Zustände (12.89) auf die der Eigenzustände des harmonischen Oszillators: 1̂ = ∑ |n⟩⟨n| . n
Wir können damit jeden beliebigen Zustand nach den kohärenten Zuständen ent wickeln bzw. in den kohärenten Zuständen darstellen. Aus (12.88) finden wir mit ⟨n|k⟩ = δ nk die Oszillatoreigenfunktionen in der Darstellung der kohärenten Zu stände: ⟨n|Z⟩ =
Z n − 1 |Z|2 e 2 √n!
⇒
⟨Z|n⟩ =
(Z ∗ )n − 1 |Z|2 e 2 . √n!
(12.90)
12.11 Kohärente Zustände | 271
Oftmals ist es zweckmäßig, mit den unnormierten kohärenten Zuständen ̃ = e Za† |0⟩ , |Z⟩
∗ ⟨Z|̃ = ⟨0|e aZ
(12.91)
zu arbeiten und die notwendige Normierungskonstante in das Integrationsmaß ein zuschließen: dZ ∗ dZ −|Z|2 ̃ ̃ e |Z⟩⟨Z| . 1̂ = ∫ 2πi ̃ gilt wegen (12.85): Für die Zustände |Z⟩ ̃ = e Z ∗ Z . ⟨Z̃ |Z⟩ In diesen Zuständen besitzen die Erzeugungs- und Vernichtungsoperatoren a† , a eine sehr einfache Darstellung: ̃ = Z|Z⟩ ̃ , a|Z⟩
̃ = a† |Z⟩
∂ ̃ |Z⟩ , ∂Z
wobei die zweite Beziehung aus (12.91) folgt. Zum Abschluss berechnen wir noch die Orts- und Impulsunschärfe in den kohä renten Zuständen. Für die Erwartungswerte finden wir durch Benutzung der Darstel lung (12.54) von Ort und Impuls durch Erzeugungs- und Vernichtungsoperatoren und der Tatsache, dass die kohärenten Zustände Eigenzustände der Erzeugungs- und Ver nichtungsoperatoren sind (siehe Gleichungen (12.78) und (12.83)): ̂ ⟨Z|x|Z⟩ = = = ̂ ⟨Z|p|Z⟩ = =
x0 ⟨Z|(a + a† )|Z⟩ √2 x0 ⟨Z|(Z + Z ∗ )|Z⟩ √2 x0 (Z + Z ∗ ) = √2x0 Re{Z} , √2 ℏ 1 ⟨Z|(a − a† )|Z⟩ i x 0 √2 ℏ 1 ℏ√2 (Z − Z ∗ ) = Im{Z} . i x 0 √2 x0
Ähnlich berechnen wir die Ortsunschärfe: 2 ̂ |Z⟩ (∆x)2 = ⟨Z|(x̂ − ⟨Z|x|Z⟩)
̂ = ⟨Z|x̂ 2 |Z⟩ − (⟨Z|x|Z⟩) =
2
x20 [⟨Z| ((a† )2 + aa† + a† a + (a)2 ) |Z⟩ − (Z + Z ∗ )2 ] . 2
272 | 12 Der harmonische Oszillator Wegen aa† = [a, a† ] + a† a = 1 + a† a und Gleichungen (12.78) und (12.83) finden wir schließlich: x2 x2 (∆x)2 = 0 [(Z + Z ∗ )2 + 1 − (Z + Z ∗ )2 ] = 0 . 2 2 Für die Impulsunschärfe erhält man analog: (∆p)2 =
ℏ2 . 2x20
Damit finden wir für die Unschärferelation von Ort und Impuls: ℏ . 2 Dies zeigt, dass die kohärenten Zustände die Unschärfe minimieren (vgl. Gleichun gen (11.12) und (12.57)). In einem beliebigen kohärenten Zustand |Z⟩ erreicht die Ortsund Impulsunschärfe ihr absolutes Minimum. Diese Tatsache macht die kohärenten Zustände sehr attraktiv, und zwar besonders dann, wenn es um die Beschreibung von semiklassisch verlaufenden Bewegungen⁵ geht bzw. wenn man sich eine klassische Vorstellung über eine quantenmechanische Bewegung machen will. So erhält man z. B. beim harmonischen Oszillator für die Matrixelemente des Hamilton-Operators in den kohärenten Zuständen: 1 ⟨Z |H|Z⟩ = ℏω⟨Z | (a† a + ) |Z⟩ 2 1 ∗ = ℏω (Z Z + ) ⟨Z |Z⟩ , 2 ∆x ∆p =
was dem klassischen Fall (12.33) sehr ähnlich ist. Für Z ≠ Z sind diese Matrixelemente i. A. komplex, jedoch ist der Erwartungswert ⟨Z|H|Z⟩ = ℏω (|Z|2 +
1 ) 2
natürlich reell und darüber hinaus positiv. Für |Z|2 = n erhalten wir die exakten Ener gieeigenwerte des harmonischen Oszillators. Schließlich sei noch erwähnt, dass die Wahrscheinlichkeit w n (|Z|2 ) = |⟨n|Z⟩|2 , mit der ein Oszillatorzustand |n⟩ in |Z⟩ enthalten ist, nach (12.90) gerade durch die Poisson-Verteilung gegeben ist: (|Z|2 )n −|Z|2 e . n! Die kohärenten Zustände sind explizit bei den Lasern realisiert und besitzen deshalb große Bedeutung in der Theorie des Lasers. Durch ihre Eigenschaft, Eigenfunktionen der Erzeugungs- bzw. Vernichtungs operatoren zu sein, lassen sich die kohärenten Zustände auch sehr vorteilhaft zur Beschreibung von Systemen aus identischen Teilchen bzw. von Quantenfeldern be nutzen, siehe Band 2. w n (|Z|2 ) =
5 Auf einer klassischen Bahn sind natürlich Ort und Impuls scharf.
13 Periodische Potenziale: das Bändermodell des Festkörpers In kristallinen Festkörpern besitzen die Atome eine reguläre periodische Anordnung. Sie formen ein sogenanntes Gitter (Abb. 13.1). In vielen Substanzen haben wir es mit einem strengen regulären Gitter zu tun, in dem benachbarte Atome exakt denselben Abstand besitzen, der als Gitterabstand bezeichnet wird. Das von den positiv gelade nen Atomkernen bzw. Ionen erzeugte Coulomb-Potenzial der Elektronen hat dann die in Abb. 13.2(a) dargestellte Form.
Abb. 13.1: Reguläre periodische Anordnung der Atome im kristallinen Festkörper.
Wenn die Gitterabstände der Atome hinreichend klein sind, überlappen die elek trostatischen Potenziale der Atomkerne stark, und die Elektronen können die Poten zialbarrieren zwischen benachbarten Atomen durchtunneln. Die Elektronen werden dann nicht mehr streng an einem einzelnen Gitterplatz (Atom) gebunden sein, son dern können sich mehr oder weniger im gesamten Festkörper ausbreiten. Ein makroskopischer Körper enthält größenordnungsmäßig 1023 Atome. Seine Längenabmessungen sind groß gegenüber den atomaren Abständen. Die überwiegen de Zahl der Atome im Inneren des Festkörpers wird nichts von der Oberfläche spüren. Oberflächeneffekte sollten deshalb unwesentlich für die Volumeneigenschaften des Festkörpers sein und sollen daher im Folgenden ignoriert werden. Dazu können wir einfach annehmen, dass der Festkörper unendlich ausgedehnt ist. Für ein unendlich ausgedehntes Gitter kehren wir in den Ausgangszustand zurück, wenn wir uns um einen Gitterabstand a weiterbewegen, und das Potenzial ist dann streng periodisch: V(x + a) = V(x) .
https://doi.org/10.1515/9783110586022-013
(13.1)
274 | 13 Periodische Potentiale V (x)
(a) b
(b)
−2a
−a
0
2a
a
x
Abb. 13.2: (a) Periodisches Coulomb-Potenzial der Elektronen in einem streng regulären Gitter. Die gestrichelten Linien repräsentieren die Coulomb-Potenziale der einzelnen Atome, die sich zum durchgezogenen periodischen Gesamtpotenzial überlagern. (b) Vereinfachtes periodisches Potenzial.
13.1 Der Translationsoperator Im Folgenden untersuchen wir die Form der Wellenfunktion in einem periodischen Potenzial. Die genaue Form des Potenzials ist dabei zunächst irrelevant, wir setzen lediglich voraus, dass es die Periodizitätsbedingung (13.1) erfüllt. Dazu führen wir zu nächst den Translationsoperator T z ein, der das Argument einer Ortsfunktion um den Betrag z verschiebt: (T z φ)(x) = φ(x + z) . Dieser Operator hat in der x- bzw. Ortsdarstellung die explizite Form T z = exp (z
d ) . dx
Zum Beweis entwickeln wir den Exponenten in eine Reihe: ∞
zn dn . n! dx n n=0
Tz = ∑
Wenden wir diese Reihenentwicklung auf eine beliebige Funktion φ(x) an, so finden wir, dass der Translationsoperator gerade die Taylor-Entwicklung der Funktion φ(x + z) an der Stelle x liefert: ∞
z n d n φ(x) = φ(x + z) . n! dx n n=0
(T z φ) (x) = ∑
(13.2)
13.2 Das Bloch’sche Theorem | 275
Den in (13.2) definierten Translationsoperator können wir auch durch den Impulsope rator ausdrücken: i
Tz = ez ℏ p ,
p=
ℏ d . i dx
In dieser Form ist der Translationsoperator unabhängig von der gewählten Darstel lung. Da der Impulsoperator hermitesch ist, ist der Translationsoperator unitär: T †z = T −1 z . Ferner gilt offenbar T −1 z = T −z . Der Translationsoperator kommutiert mit der kinetischen Energie, da er nur eine Funktion des Impulsoperators ist: [T z ,
p2 ] = 0̂ . 2m
Da das Potenzial periodisch ist mit Periode a, kommutiert es mit dem speziellen Trans lationsoperator T z=a . Denn es gilt für beliebige Funktionen φ(x): (T a Vφ) (x) = V(x + a)φ(x + a) = V(x)φ(x + a) = V(x) (T a φ) (x) = (VT a φ) (x) und somit
[T a , V] = 0̂ .
Also kommutiert der Translationsoperator T a mit dem Hamilton-Operator: [T a , H] = 0̂ ,
T a HT −1 a = H .
T a und H haben deshalb gemeinsame Eigenfunktionen (siehe Abschnitt 10.5).
13.2 Das Bloch’sche Theorem ̂ müssen seine Eigenwerte λ k die Form Da T a ein unitärer Operator ist (T †a T a = 1), λ k = e iν k (a) mit reellen ν k (a) besitzen. Die ν k (a) sind offensichtlich nur bis auf ein Vielfaches von 2π definiert und werden als Floquet-Indizes bezeichnet. Offenbar ist jede periodische
276 | 13 Periodische Potentiale
Funktion u(x) mit der Periode a Eigenfunktion des Translationsoperators T a zum Ei genwert 1 (ν k (a) = 0 mod 2πn, n ∈ ℕ): (T a u) (x) = u(x + a) = u(x) .
(13.3)
Da der Translationsoperator nur eine Funktion des Impulsoperators ist, sind darüber hinaus auch alle Impulseigenfunktionen gleichzeitig Eigenfunktionen zu T a , T a e ikx = e ik(x+a) = e ika e ikx ,
(13.4)
wobei die Floquet-Indizes durch ν k (a) = ka gegeben sind. Kombinieren wir (13.3) und (13.4), so erhalten wir Eigenfunktionen des Translationsoperators der Gestalt φ k (x) = e ikx u k (x) ,
u k (x + a) = u k (x) .
(13.5)
Solche Funktionen heißen Bloch-Wellen. Sie besitzen offenbar die Eigenschaft, dass sie periodisch bis auf eine Phase sind: φ k (x + a) = e iν k (a) φ k (x) .
(13.6)
Da T a mit H kommutiert, müssen die Bloch-Wellen auch Eigenfunktionen des Ha milton-Operators sein. Es lässt sich nun zeigen, dass die Bloch-Welle die allgemeins te Form der Wellenfunktion in einem streng periodischen Potenzial ist. Dies ist die Aussage des Bloch’schen Theorems, welches wir weiter unten für einen Spezialfall be weisen werden. Die Bloch-Wellen (13.5) sind keine Impulseigenzustände, wenn u k (x) nicht konstant ist. Die Größen p = ℏk werden deshalb als Quasiimpulse bezeich net.¹ Der Impuls eines Elektrons in einem periodischen Gitter ist natürlich nicht kon stant wegen der Ortsabhängigkeit des Gitterpotenzials. Nichtsdestotrotz sind die Ei genfunktionen der Elektronen aufgrund der periodischen Struktur des Gitters durch einen konstanten Impulswert, den Quasiimpuls, ℏk = ℏν k (a)/a charakterisiert. Die ser Quasiimpuls ist offenbar nur modulo einem Vielfachen von 2πℏ/a bestimmt. Auch sind die Bloch-Wellen φ k (x) für beliebige k i. A. nicht periodisch in der Gitterkonstan ten, d. h. φ k (x + a) ≠ φ k (x), siehe Gleichung (13.6).
1 Da in der Fachliteratur häufig Einheiten benutzt werden, in denen ℏ = 1 gilt, hat es sich eingebür gert, auch die zugehörigen Wellenzahlen k als Quasi-„Impulse“ zu bezeichnen.
13.2 Das Bloch’sche Theorem | 277
2 1
N
1
N
=⇒
Abb. 13.3: Kreisförmige Atomkette, die durch Verbinden der Enden einer linearen periodischen Kette entsteht.
Beweis des Bloch’schen Theorems: Wir betrachten eine lineare Atomkette aus N identischen Gitterpunkten mit Gitterabstand a, die wir zu einem Ring der Länge Na verbinden (siehe Abb. 13.3), um strenge Periodizität V(x + na) = V(x) ,
n − ganzzahlig ,
d. h. keine Randeffekte, zu haben, siehe hierzu auch Abschnitt 13.4.1. Der Einfachheit halber setzen wir auch voraus, dass die Wellenfunktion nicht entartet ist. Wegen der Symmetrie des Ringes kann sich dann die Wellenfunktion bei Verschiebung ihres Argumentes um die Gitterkonstante a nur um eine konstante Phase C ändern: φ(x + a) = Cφ(x) . (13.7) Laufen wir einmal um den gesamten Ring φ(x + Na) = C N φ(x) ,
(13.8)
kehren wir zur Ausgangsposition x zurück, und da die Wellenfunktion einen eindeutigen Wert besitzen muss, gilt φ(x + Na) = φ(x) . (13.9) Vergleich von (13.8) und (13.9) zeigt CN = 1 , d. h., C ist eine der N Wurzeln der Eins: C = ei
2π N
n
,
n = 0, 1, 2, . . . N − 1 .
Einsetzen dieses Ausdruckes in (13.7) liefert das Bloch’sche Theorem (13.6) für die betrachtete Atom kette.
Die Gesamtheit der Translationsoperatoren T x (mit beliebigem Argument x) bildet eine Gruppe, die sogenannte Translationsgruppe. Man überprüft leicht, dass alle Gruppenaxiome erfüllt sind: T a T b = T a+b , T a T a−1 = T a T−a = T a−a = T0 = 1̂ . Da die Translationsoperatoren zu verschiedenen Argumenten kommutieren, T a T b = T b T a = T a+b , bilden sie eine abelsche Gruppe, und zwar die U(1)-Gruppe (genauer gesagt, die „Überlagerungsgrup pe“ der U(1)-Gruppe, welche ℝ ist). Das Bloch’sche Theorem folgt dann unmittelbar aus der Darstel lungstheorie der Gruppen; e ikx ist die Darstellung der U(1)-Gruppe bzw. deren Überlagerungsgruppe.
278 | 13 Periodische Potentiale
13.3 Qualitative Beschreibung der Energiebänder* Die prinzipiellen Eigenschaften der Elektronen in einem Festkörper werden durch die periodische Struktur des Potenzials bestimmt. Zur Beschreibung der Elektronenzu stände in periodischen Potenzialen ersetzen wir das periodische Coulomb-Potenzial durch das in Abb. 13.2(b) dargestellte vereinfachte periodische Potenzial. Wir nehmen zunächst an, dass die Potenzialwände unendlich hoch sind, halten aber ihre Breite b endlich. Dann verschwindet die quantenmechanische Tunnelung, und die Eigenzu stände des Hamilton-Operators sind in den einzelnen Potenzialmulden lokalisiert, siehe Abb. 13.4. Im Folgenden bezeichnen wir mit |n⟩ den (lokalisierten) Grundzu stand in der n-ten Potenzialmulde, die durch (n −
1 1 b b ) a + < x < (n + ) a − 2 2 2 2
definiert ist. Der Zustand erfüllt dann die stationäre Schrödinger-Gleichung H|n⟩ = E0 |n⟩ . Diese lokalisierten Zustände sind jedoch noch keine Eigenzustände zum Translations operator. Auch wenn für unendlich hohe Potenzialwände die Elektronen ihren Git terplatz nicht verlassen können, so sind die lokalisierten Zustände |n⟩ dennoch kei ne Eigenzustände (des Hamilton-Operators) des translationsinvarianten Festkörpers, V (x)
b
| -1
|0
|1
|2 E0 x
−a
0
a
2a
Abb. 13.4: Illustration der lokalisierten Zustände |n⟩ im vereinfachten periodischen Potenzial. Die schraffierten Gebiete repräsentieren unendlich hohe Potenzialwände der Breite b.
* Dieser Abschnitt ist für das Verständnis der übrigen Abschnitte nicht erforderlich und kann deshalb beim ersten Lesen übersprungen werden.
13.3 Qualitative Beschreibung der Energiebänder | 279
die – wie wir oben gesehen hatten – dem Bloch’schen Theorem genügen, unabhängig von der spezifischen Form des Potenzials. In der Tat, wegen T a φ(x) = (T a φ) (x) = φ(x + a) , was wir in der Bracket-Notation als ⟨x|T a |φ⟩ = ⟨x + a|φ⟩
(13.10)
schreiben können, finden wir: ⟨x|T a |n⟩ = ⟨x + a|n⟩ = ⟨x|n − 1⟩ , wobei das letzte Gleichheitszeichen aus der Periodizität des Potenzials folgt. Damit haben wir: T a |n⟩ = |n − 1⟩ .
(13.11)
Wie erwartet transformiert der Translationsoperator T a die lokalisierten Zustände |n⟩ in die der benachbarten Mulde, |n − 1⟩. Wegen T a† = T a−1 gilt:
⟨x|T a |φ⟩ = ⟨T a† x|φ⟩ = ⟨T a−1 x|φ⟩ ,
was mit (13.10) auf ⟨T a−1 x|φ⟩ = ⟨x + a|φ⟩ führt für beliebige φ. Damit bekommen wir: ⟨T a−1 x| = ⟨x + a| . Wegen
(13.12)
⟨T a−1 x| = ⟨T a† x| = ⟨x|T a
erhalten wir aus (13.12) nach Bildung des Adjungierten: T a−1 |x⟩ = |x + a⟩ .
Auch wenn hier die quantenmechanische Tunnelung (wegen der als unendlich hoch vorausgesetzten Potenzialwände) verschwindet, so können wir doch die Zustände mit korrekter Symmetrie ähnlich wie beim Doppelwallpotenzial² durch Überlagerung der in einzelnen Mulden lokalisierten Zustände konstruieren. Allgemein gelangt man von lokalisierten zu periodischen Funktionen durch diskrete Fourier-Transformationen,
2 Beim bezüglich des Koordinatenursprungs symmetrischen Doppelwallpotenzial sind die Zustände korrekter Symmetrie selbst bei unendlich hoher Barriere durch die Eigenzustände des Paritätsopera tors gegeben.
280 | 13 Periodische Potentiale
bei denen man nur über alle möglichen Vielfachen einer Grundfrequenz summiert. Die gesuchten Bloch-Wellen setzen wir deshalb in der Form ∞
|Θ⟩ = ∑ e inΘ |n⟩
(13.13)
n=−∞
an, wobei Θ ein reeller Parameter ist, der offenbar auf das Intervall −π ≤ Θ ≤ π beschränkt werden kann. Wenden wir den Translationsoperator auf diesen Zustand an, benutzen dabei (13.11), ∞
∞
n=−∞
n=−∞
T a |Θ⟩ = ∑ e inΘ T a |n⟩ = ∑ e inΘ |n − 1⟩ , und führen eine Umbenennung der Summationsvariable durch (n − 1 → n), so finden wir, dass die so konstruierten Zustände in der Tat Eigenzustände des Translationsope rators sind: ∞
T a |Θ⟩ = ∑ e i(n+1)Θ |n⟩ = e iΘ |Θ⟩ . n=−∞
Projizieren wir diese Gleichung mittels (13.10) in die Ortsdarstellung, ⟨x + a|Θ⟩ = e iΘ ⟨x|Θ⟩ , so sehen wir, dass die Zustände ⟨x|θ⟩ (13.13) dem Bloch’schen Theorem (13.6) genügen und dass Θ gerade den zugehörigen Floquet-Index repräsentiert: Θ = ν k (a) . Der so konstruierte Eigenzustand |Θ⟩ des Translationsoperators ist offenbar auch Ei genzustand zum Hamilton-Operator mit der Energie E0 , da er aus einer Superposition von orthogonalen Eigenzuständen von H zur Energie E0 aufgebaut ist. Für unendlich hohe Potenzialwände sind die Zustände |n⟩ streng in den einzelnen Potenzialmulden lokalisiert und reichen nicht in benachbarte Potenzialmulden.³ Sie besitzen daher keinen Überlapp und sind deshalb orthogonal, ⟨n|m⟩ = δ nm . Im realistischen Fall sind die Potenzialberge jedoch nicht unendlich hoch. Für endliche Potenzialbarrieren können die Elektronen mit gewisser Wahrscheinlichkeit die Barrieren durchtunneln und sich von Gitterplatz zu Gitterplatz bewegen. Die loka lisierten Wellenfunktionen reichen dann in die benachbarten Potenzialmulden hin ein, und Wellenfunktionen benachbarter Potenzialmulden (d. h., die in benachbarten
3 Für unendlich hohe Potenzialbarrieren ist die lokalisierte Wellenfunktion |n⟩ auf die n-te Potenzial mulde beschränkt und besitzt Knoten an den unendlich hohen Potenzialwänden (siehe Abschnitt 8.5).
13.3 Qualitative Beschreibung der Energiebänder |
281
Potenzialmulden lokalisiert sind) sind nicht mehr streng orthogonal und können des halb keine strengen Eigenfunktionen des Hamilton-Operators mehr sein. Wir können jedoch auch in diesem Fall lokalisierte Funktionen mit der Eigenschaft T a |n⟩ = |n − 1⟩ konstruieren. Wegen der Translationsinvarianz sind die Diagonalelemente von H in der lokalisierten Basis alle gleich, ⟨n|H|n⟩ = E0 , unabhängig von dem Gitterplatz n. Für genügend hohe, aber endliche Potenzialber ge reichen die Schwänze der Wellenfunktionen wesentlich nur in die unmittelbar be nachbarten Potenzialmulden, sodass Wellenfunktionen, die in weit entfernt gelege nen Mulden lokalisiert sind, praktisch orthogonal sind und die entsprechenden Nicht diagonalelemente des Hamilton-Operators verschwinden. Im Extremfall können wir uns bei den Außerdiagonalelementen von H auf diejenigen beschränken, die zu den an benachbarten Gitterplätzen lokalisierten Zuständen gehören: E0 , { { { ⟨n |H|n⟩ = {−∆ , { { {0 ,
n = n n = n ± 1 .
(13.14)
sonst
Wegen der Translationsinvarianz sind die Matrixelemente ∆ unabhängig vom Gitter platz n. Der Einfachheit halber haben wir hier vorausgesetzt, dass das Matrixelement reell ist. Das Vorzeichen von ∆ kann willkürlich gewählt werden und hat keinen Ein fluss auf die resultierenden Energieeigenwerte, wie wir unten sehen werden. Der obige Ansatz für die Matrixelemente des Hamilton-Operators wird in der Festkörperphysik als tight-binding-Approximation bezeichnet. Mit (13.14) erhalten wir bei Anwendung des Hamilton-Operators auf den Zustand |n⟩: H|n⟩ = ∑ |n ⟩⟨n |H|n⟩ = −∆|n − 1⟩ + E0 |n⟩ − ∆|n + 1⟩ .
(13.15)
n
Wie erwartet, sind die Zustände |n⟩ nicht mehr Eigenzustände des Hamilton-Opera tors. Natürlich sind sie auch nicht Eigenzustände des Translationsoperators, siehe Gleichung (13.11). Wie wir oben im Falle der unendlich hohen Potenzialwände gesehen haben, sind die Eigenzustände des Translationsoperators durch die Linearkombina tion |Θ⟩ (13.13) der lokalisierten Zustände gegeben. Wir versuchen deshalb, die Eigen zustände des Hamilton-Operators aus diesen Zuständen zu konstruieren, die bereits die richtige Symmetrie besitzen. Wenden wir den Hamilton-Operator unter Benutzung
282 | 13 Periodische Potentiale
von (13.15) auf diese Zustände an, so finden wir ∞
∞
H|Θ⟩ = H ∑ e inΘ |n⟩ = ∑ e inΘ H|n⟩ n=−∞ ∞ inΘ
= ∑ e
n=−∞
[−∆|n − 1⟩ + E0 |n⟩ − ∆|n + 1⟩]
n=−∞ ∞
∞
∞
n=−∞
n=−∞
= E0 ∑ e inΘ |n⟩ − ∆ ∑ e inΘ |n + 1⟩ − ∆ ∑ e inΘ |n − 1⟩ n=−∞ ∞
= E0 |Θ⟩ − ∆ ∑ (e inΘ−iΘ + e inΘ+iΘ ) |n⟩ n=−∞ −iΘ
= E0 |Θ⟩ − ∆ (e
+ e iΘ ) |Θ⟩
= (E0 − 2∆ cos Θ)|Θ⟩ . Die Zustände |Θ⟩ (13.13) sind damit bereits Eigenzustände des durch Gleichung (13.14) definierten Hamilton-Operators zu der Energie E Θ = E0 − 2∆ cos Θ .
(13.16)
Für ∆ ≠ 0 hängt diese vom Floquet-Index Θ ab. Wir erhalten damit eine kontinuier liche Verteilung von Energieeigenwerten, die durch den Floquet-Index Θ charakteri siert werden: Wenn Θ seinen Definitionsbereich von −π bis +π durchläuft, laufen die Energieeigenwerte von E0 − 2∆ bis E0 + 2∆, siehe Abb. 13.5. Die ursprünglich vor handene Entartung in der Energie der lokalisierten Zustände |n⟩ ist bei von null ver schiedenen Kopplungsmatrixelementen, ∆ ≠ 0, zwischen benachbarten Zuständen aufgehoben. Das Bündel der Energieeigenwerte von E0 − 2∆ bis E0 + 2∆ wird als Ener EΘ E0 + 2Δ
E0
E0 − 2Δ −π
−π/2
0
π /2
π
Θ Abb. 13.5: Die Energie E Θ als Funktion des Floquet-Index Θ für das durch Gleichung (13.16) definierte Energieband.
13.4 Strenge quantenmechanische Behandlung des periodischen Potenzials
| 283
gieband bezeichnet.⁴ Die Ausbildung von Energiebändern ist typisch in periodischen Potenzialen, wie wir im folgenden Abschnitt bei der strengen quantenmechanischen Behandlung eines periodischen Potenzials sehen werden. In Festkörpern mit einer pe riodischen Gitterstruktur wie den Metallen verschmelzen die Elektronenniveaus der isolierten Atome in der Tat zu Energiebändern, die sich experimentell nachweisen las sen. Die oben durchgeführten Überlegungen für den Grundzustand der isolierten Po tenziale lassen sich natürlich auch für angeregte Zustände wiederholen.
13.4 Strenge quantenmechanische Behandlung des periodischen Potenzials 13.4.1 Periodische Randbedingungen Für ein unendlich ausgedehntes Gitter ist die Wellenfunktion (Bloch-Welle) nicht normierbar. Was wir brauchen, ist eine endliche Atomkette ohne Rand, wie sie eine kreisförmige Atomkette darstellen würde (Abb. 13.3). In einer solchen kreisförmigen Kette aus N Atomen kehren wir nach N Gitterabständen wieder zum Ausgangspunkt zurück. Die zugehörige Wellenfunktion ist deshalb streng periodisch: φ(x + Na) = φ(x) .
(13.17)
Die kreisförmige Atomkette ist mathematisch äquivalent zu einer linearen Atomkette mit periodischen Randbedingungen. Während diese periodische Randbedingung bei einer kreisförmigen Kette automatisch erfüllt ist, muss sie bei der linearen Kette als Zu satzbedingung gefordert werden, wenn diese zur kreisförmigen Kette äquivalent sein soll. In der Tat, durch die periodischen Randbedingungen werden die Endpunkte der zunächst linearen Atomkette identifiziert, und die lineare Kette wird topologisch äqui valent zum Kreis. In der Mathematik bezeichnet man dies als Kompaktifizierung. Aus der nicht kompakten linearen Atomkette mit zwei offenen Enden, die den Rand (bzw. die „Oberfläche“) der Kette bilden, wird ein kompakter (randloser) Kreis.⁵
4 Dasselbe Energieband erhält man natürlich auch, wenn man ∆ in (13.16) durch (−∆) ersetzt. Ledig lich die Zuordnung der Energien zu den Θ-Werten ändert sich, die jedoch keine physikalische Bedeu tung besitzt. 5 Auf ähnliche Weise lässt sich auch ein (endliches) zweidimensionales Gitter (Rechteck) durch peri odische Randbedingungen zu einem Torus kompaktifizieren. Die Kompaktifizierung spielt eine sehr große Rolle in der modernen theoretischen Physik, insbesondere in der Teilchenphysik (z. B. bei der Beschreibung von Baryonen als topologischen Solitonen) und in den String-Theorien.
284 | 13 Periodische Potentiale
Durch die periodischen Randbedingungen sind die Oberflächeneffekte vollständig eliminiert. Dies wird offensichtlich, wenn wir das Potenzial im Inneren des Festkörpers (der Atomkette) als konstant annehmen. Während mit festen Randbedingungen an der Oberfläche sich nur stehende Wellen ausbil den können, da diese an der Oberfläche exponentiell abklingen müssen, besitzt die Schrödinger-Glei chung mit periodischen Randbedingungen fortschreitende Wellen als Lösungen. Die stehenden Wel len sind zwar Überlagerungen aus zwei in entgegengesetzte Richtungen laufenden Wellen, jedoch mit gleicher Amplitude. In dieser Hinsicht sind die periodischen Randbedingungen weniger restriktiv als die tatsächlichen Oberflächenbedingungen. Zur Untersuchung von Volumeneigenschaften des Fest körpers sollte jedoch die Benutzung der periodischen Randbedingungen gerechtfertigt sein, da der Einfluss der Oberfläche hier unwesentlich sein sollte. Aus mathematischer Sicht ist die Benutzung von periodischen Randbedingungen gerechtfertigt, da die fortschreitenden Wellen genau wie die ste henden Wellen ein vollständiges Funktionensystem bilden. Für eine fortschreitende Welle φ(x) = e ikx in einem Festkörper bzw. in einer Atomkette der Länge L = Na reduziert sich die periodische Randbedingung (13.17) an die Wellenfunktion auf die Bedingung e ikL = 1 , welche die möglichen k-Werte auf k=
2πl , L
l = 0, ±1, ±2, . . .
(13.18)
einschränkt. Aufgrund der periodischen Randbedingung können sich nur solche Wellen ausbilden, bei denen ein Vielfaches der Wellenlänge λ = 2π/k gerade in den Festkörper passt, L = lλ. Es sei je doch betont, dass die so konstruierten Bloch-Wellen i. A. nur periodisch in der Länge des Festkörpers, jedoch nicht periodisch in der Gitterkonstanten a sind. Für einen unendlich ausgedehnten Festkörper, L → ∞, sind die Wellenzahlen k (13.18) quasikontinuierlich verteilt. Wir werden im Folgenden L immer als sehr groß voraussetzen und k oftmals als kontinuierliche Variable betrachten.
13.4.2 Bestimmung der Energieeigenzustände Qualitativ lässt sich das Verhalten der Elektronen in einem vereinfachten Potenzial verstehen, für das wir das in Abb. 13.2(b) dargestellte periodische Rechteckpotenzi al (Kronig-Penney-Potenzial) benutzen können. Selbst eine weitere Reduzierung der rechteckigen Potenzialberge auf δ-Funktionen führt zum qualitativ gleichen Verhalten der Elektronen. Beschränken wir uns auf eine eindimensionale Atomkette, so besitzt das Potenzial der Elektronen dann die Gestalt ∞
V(x) = C ∑ δ(x − na) .
(13.19)
n=−∞
Wir wissen bereits, wie eine rechteckige Potenzialbarriere oder ein δ-Potenzial zu be handeln sind: An Potenzialsprüngen müssen die Wellenfunktion und ihre Ableitung den in Abschnitt 7.6 abgeleiteten Grenzflächenbedingungen genügen, welche die Wel lenfunktion, d. h. die Lösung der stationären Schrödinger-Gleichung, festlegen. Unse re bisherigen Lösungsmethoden sind prinzipiell auch auf den Fall mehrerer Potenzial sprünge anwendbar. Im vorliegenden Fall haben wir es jedoch mit N (bzw. unendlich
13.4 Strenge quantenmechanische Behandlung des periodischen Potenzials
| 285
vielen) solcher Potenzialsprünge zu tun, die auf N (bzw. unendlich viele) Grenzflä chenbedingungen führen. Wir brauchen aber nicht all diese Grenzflächenbedingun gen explizit zu lösen, sondern können vorteilhaft die periodische Struktur ausnutzen. Im Folgenden wollen wir die stationäre Schrödinger-Gleichung streng für das pe riodische Potenzial (13.19) lösen. In den Intervallen na < x < (n + 1)a verschwindet das Potenzial, und die Lösungen der Schrödinger-Gleichung sind durch ebene Wellen φ(x) = A n e iq(x−na) + B n e−iq(x−na) (13.20) gegeben, wobei die Wellenzahl q durch q=√
2m E ℏ2
(13.21)
festgelegt ist. Zweckmäßigerweise haben wir hier die konstanten Phasen e∓iqna aus den Konstanten A n bzw. B n gezogen, was keine Einschränkung darstellt. Die Wellen funktion muss außerdem dem Bloch’schen Theorem genügen und folglich durch eine Quasiwellenzahl k charakterisiert sein: φ k (x + na) = e ikna φ k (x) .
(13.22)
Für 0 < x < a liefert das Bloch’sche Theorem (13.22) mit dem obigen Ansatz (13.20) für die Wellenfunktionen: (A n e iqx + B n e−iqx ) = e ikna (A0 e iqx + B0 e−iqx ) . Da e±iqx linear unabhängige Funktionen sind, folgt: A n = e ikna A0 ,
B n = e ikna B0 .
(13.23)
Somit sind jeweils nur ein A n und ein B n , z. B. A0 und B0 , unbekannt, während al le übrigen Koeffizienten durch diese über das Bloch’sche Theorem bestimmt sind. Die noch verbleibenden unbekannten Koeffizienten A0 und B0 bestimmen wir aus der An schlussbedingung an die Wellenfunktion bei x = a. Stetigkeit der Wellenfunktion ver langt: !
φ k (x = a + 0) ≡ A1 + B1 = φ k (x = a − 0) ≡ A0 e iqa + B0 e−iqa , bzw. mit (13.23): A0 e iqa + B0 e−iqa = e ika (A0 + B0 ) , während die Sprungbedingung an die erste Ableitung (siehe Gleichung (8.25)) !
φk (x = a + 0) = φk (x = a − 0) +
2m Cφ k (x = a) ℏ2
(13.24)
286 | 13 Periodische Potentiale
auf iq(A1 − B1 )
(13.23)
=
iqe ika (A0 − B0 )
2m ika Ce (A0 + B0 ) (13.25) ℏ2 führt. Die beiden Bedingungen (13.24) und (13.25) stellen ein homogenes Gleichungs system für die beiden noch unbekannten Koeffizienten A0 und B0 dar: !
=
(
iq (A0 e iqa − B0 e−iqa ) +
e iqa − e ika 2m ika e iqa − e ika + iqℏ 2 Ce
e−iqa − e ika A0 0 )=( ) . ika ) ( −(e−iqa − e ika ) + ℏ2m Ce B0 0 2 iq
Damit dieses homogene Gleichungssystem eine nicht triviale Lösung besitzt, muss die Koeffizientendeterminante verschwinden: Dies liefert die Bedingung 2m 2e ika (2 cos(ka) − 2 cos(qa) − 2 C sin(qa)) = 0 ℏ q bzw. die Dispersionsbeziehung⁶ mC (13.26) cos(ka) = cos(qa) + 2 sin(qa) , ℏ q welche einen Zusammenhang zwischen dem Floquet-Index ν k = ka bzw. der Quasi wellenzahl k und der durch die Energie definierten Wellenzahl q (13.21) herstellt.
13.4.3 Energiebänder Für gegebene Quasiwellenzahl k kann die Dispersionsbeziehung offenbar nur Lösun gen für solche Energien E = ℏ2 q2 /2m besitzen, für welche die rechte Seite von Glei chung (13.26) den Betrag 1 nicht übersteigt (Abb. 13.6). Dies unterteilt die Energieachse in erlaubte Energiebänder und verbotene Energiezonen. Eine verbotene Energiezone beginnt stets bei: qa = nπ , n = 1, 2, 3, . . . , da hier sin(qa) = 0. Damit liegt die obere Bandkante (auch als Bandenkopf bezeich net) unabhängig von der Stärke des Potenzials bei der Energie ℏ2 q 2 nπℏ 2 1 ℏ2 π2 2 n . =( ) = 2m a 2m 2ma2 Die Energiebänder können deshalb durch den Bandindex n charakterisiert werden. Wir schreiben deshalb die Energieeigenwerte als E=
E n (k) =
ℏ2 2 q (k) , 2m n
wobei q n (k) die Lösung der Dispersionsbeziehung (13.26) des n-ten Bandes ist. 6 Unter einer Dispersionsbeziehung versteht man allgemein eine Beziehung zwischen Energie und Impuls (bzw. Wellenzahl).
13.4 Strenge quantenmechanische Behandlung des periodischen Potenzials
|
287
cos(x) + A sin(x)/x erlaubte Energiebänder
+1 x −1
π
2π
3π
4π
5π
verbotene Energiezonen Abb. 13.6: Energiebänder (schraffiert) im Kronig-Penney-Potenzial (13.19).
An den Bandenköpfen gilt offenbar cos(ka) = cos(qa) und somit k=q±l
2π , a
l∈ℤ,
und wir können hier q n (k) = k wählen. Die Quasiimpulse ℏk stimmen dann mit dem wahren Impuls ℏq n (k) überein, und die Bloch-Welle wird eine gewöhnliche Welle.⁷ Die grafische Lösung der Dispersionsbeziehung ist in Abb. 13.7 für die skalierte En ergie ε n (k) = q2n (k) dargestellt. Die dick ausgezogenen Kurven stellen die erlaubten Energiebänder ε n (k) dar. Zwischen aufeinanderfolgenden Energiebändern existieren verbotene Energiezonen. Zum Vergleich ist auch die Dispersionsbeziehung der frei en Elektronen ε(k) = k 2 dargestellt (gestrichelte Linie). Das unterste Energieband hat genau die Form, die wir bereits in Abschnitt 13.3, Abb. 13.5 gefunden haben. Wie bereits oben erwähnt, sind die Quasiimpulse bzw. die Quasiwellenzahlen k nur bis auf ein Vielfaches von 2π/a definiert und können deshalb auf die Gebiete (2l − 1)
π π ≤ k ≤ (2l + 1) a a
(mit festem l) beschränkt werden, die als (l + 1)-te Brillouin-Zone bezeichnet werden. Beschränken wir uns auf die erste Brillouin-Zone (l = 0), so nehmen die in Abb. 13.7 7 Man beachte: Falls der Quasiimpuls ℏk mit dem tatsächlichen Impuls zusammenfällt, so muss nach dem Bloch’schen Theorem (13.5) ̂ k (x) = ℏ (k + pφ die periodische Funktion u k (x) konstant sein.
1 u k (x) ! ) φ k (x) = ℏkφ k (x) i u k (x)
288 | 13 Periodische Potentiale 9 8
qn2 (k)a2 /π 2
7 6 5 4 3 2 1 0 −3π/a
−2π/a
−π/a
k
π /a
2π /a
3π/a
Abb. 13.7: Grafische Lösung der Dispersionsbeziehung (13.26). Aufgetragen sind die skalierten Ener gien q 2n (k) in Einheiten von (π/a)2 . Die voll ausgezogenen Kurven sind die erlaubten Energiebänder, die gestrichelte Kurve gibt die zugehörigen Energien q 2n (k) = k2 der freien Elektronen an.
dargestellten Energiebänder die in Abb. 13.8 dargestellte Form an. Die hier dargestellten Energiebänder resultieren aus den Energiebändern der Abb. 13.7, indem letztere Band kurven um ein Vielfaches von 2π/a in die erste Brillouin-Zone verschoben werden. 9 8 n=3
7
qn2 (k)a2 /π 2
6 5 4 n=2
3 2 1 0
n=1 −π/a
k
π /a
Abb. 13.8: Grafische Lösung der Dispersionsbeziehung (13.26) bei Beschränkung des Quasiimpulses auf die erste Brillouin-Zone, vgl. Abb. 13.7.
13.4 Strenge quantenmechanische Behandlung des periodischen Potenzials
| 289
Wir haben oben den Quasi-„Impuls“ k als kontinuierliche Variable betrachtet. Wie wir jedoch am Ende von Abschnitt 13.4.1 festgestellt haben, schränkt die periodische Randbedingung (13.17) eine Wellen zahl k auf die diskreten Werte (13.18) ein. Beschränken wir uns auf die erste Brillouin-Zone bzw. auf das Intervall 0 < k ≤ 2π/a , so sind diese Werte durch k=
2π , L
2
2π , L
3
2π , L
...
N
2π 2π = , L a
L = Na
gegeben. Die Gesamtheit der möglichen k-Werte ist somit gleich der Anzahl der Atome (Potenzialmul den) N: Jedes Atom trägt genau einen unabhängigen k-Wert zu einem Energieband bei. Elektronen sind bekanntlich Fermionen, die dem Pauli-Prinzip gehorchen. Berücksichtigt man ihren Spin s = 1/2, was 2s + 1 = 2 unabhängige Spinorientierungen (Spineigenzustände) beinhaltet (siehe Abschnitt 15.2), so passen in jedes Energieband gerade 2N Elektronenzustände.
Für das Auftreten von Energielücken ist der zweite Term auf der rechten Seite der Di spersionsbeziehung (13.26), maC cos k̄ = cos q̄ + 2 sin q̄ , ℏ q̄ verantwortlich, die wir hier zweckmäßigerweise in den dimensionslosen Variablen k̄ = ka und q̄ = qa aufgeschrieben haben. Mit zunehmender Wechselwirkungsstär ke C sowie mit zunehmendem Gitterabstand a, d. h. mit wachsendem aC, werden die Energielücken größer. Der Beginn einer Lücke bleibt jedoch fest. Dies ist völlig ver ständlich: Wird die Wechselwirkung stärker, vergrößert sie die Potenzialbarriere, die Tunnelwahrscheinlichkeit nimmt ab, und die Elektronen werden stärker lokalisiert bzw. weniger beweglich. Derselbe Effekt tritt ein, wenn der Gitterabstand wächst. Mit wachsendem Gitterabstand werden die Energieniveaus abgesenkt, und die Elektro nen sehen somit eine höhere Potenzialbarriere. Damit nimmt ihre Tunnelfähigkeit ab. Für aC → ∞ schrumpfen die Energiebänder zu diskreten (entarteten) Niveaus zusam men, die an den Bandenköpfen nπ q= a liegen. Alle N Energien E n (k) eines Bandes n sind dann gleich der Energie des Band kopfes, ℏ2 π2 2 En = n , 2ma2 die dann mit den Energieniveaus der isolierten Atome übereinstimmt. Abbildung 13.9 zeigt auch, dass bei festem aC die Energiebänder mit wachsendem n immer breiter werden. Dies ist verständlich: Mit wachsendem n nimmt die Energie der Elektronen und damit ihr Tunnelvermögen zu. Sie spüren dann weniger den Effekt des störenden
290 | 13 Periodische Potentiale 9 8
qn2 (k) a2/π 2
7 6 5 4 3 2 1 0
0
20
40
60 aCm/¯h2
80
100
Abb. 13.9: Die Energiebänder (dunkle Gebiete) als Funktion des Stärkeparameters aC.
Potenzials und verhalten sich mehr wie freie Teilchen. Tatsächlich nimmt der Poten zialterm in der Dispersionsbeziehung (13.26) mit wachsendem q ab. Für C → 0 ver schwindet das Potenzial, und die Dispersionsbeziehung reduziert sich auf: cos(ka) = cos(qa) . Die Quasiwellenzahlen k gehen dann in die tatsächlichen Wellenzahlen q des freien Teilchens über.
13.4.4 Metalle, Isolatoren und Halbleiter Da die Elektronen Fermionen sind, die dem Pauli-Prinzip unterliegen, kann ein (Einteilchen-)Zustand jeweils nur mit einem Elektron besetzt werden. Wegen des Spins der Elektronen, der die beiden Werte s = ± 12 ℏ annehmen kann, ist jeder BlochZustand zweifach entartet und kann folglich mit zwei Elektronen besetzt werden. Im Grundzustand eines Festkörpers werden deshalb die untersten Energieniveaus sukzessiv bis zu einer maximalen Einteilchenenergie, der Fermi-Energie ϵ F , mit zwei⁸ Elektronen besetzt. ϵ F ist durch die Gesamtzahl der Elektronen in den Atomen des Festkörpers festgelegt. Das bei T = 0 höchste besetzte Energieband wird als Valenz band bezeichnet. Die Besetzung der Energiebänder durch die Elektronen legt die elektrischen Eigenschaften des Festkörpers fest.
8 Bei einer ungeraden Elektronenzahl ist natürlich das höchste besetzte Niveau nur mit einem Elek tron besetzt.
13.4 Strenge quantenmechanische Behandlung des periodischen Potenzials
| 291
π a
k t
− πa
–
–
–
Abb. 13.10: Das Verhalten des Quasiimpul ses als Funktion der Zeit bei Anlegen eines äußeren elektrischen Feldes.
Isolatoren: In einem vollständig gefüllten Energieband gibt es zu jedem Teilchen mit Qua siimpuls ℏk ein Teilchen mit Quasiimpuls (−ℏk), sodass kein Nettoteilchenfluss stattfindet. Sind alle Energiebänder entweder vollständig besetzt oder voll kommen leer, haben wir es mit einem Isolator zu tun, siehe Abb. 13.11(a). An legen eines äußeren elektrischen Feldes führt dann zu keinem Ladungstrans port, d. h. zu keinem elektrischen Strom. In der Tat, wenn das Energieband gefüllt ist und eine genügend große Lücke zum nächsten (unbesetzten) Band besteht, lässt sich der Impuls der Kristallelektronen nicht ändern: Unter dem Einfluss eines äußeren elektrischen Feldes, das eine Kraft auf die Elektronen ausübt, wächst der Quasiimpuls der Elektronen an, bis er den Rand der Brill ouin-Zone erreicht und dort umklappt und an den entgegengesetzten Zonen rand kommt (Abb. 13.10). Das Umklappen des Quasiimpulses am Zonenrand verändert den Quasiimpuls um 2π/a, was keinen Einfluss auf die Wellenfunk tion hat. Die einzelnen k-Zustände können zwar durch das äußere Feld inein ander umtransformiert werden, es entsteht aber kein Nettoladungsfluss. Da die Quasiimpulse auf die erste Brillouin-Zone beschränkt werden können, läuft ein am rechten Rand (π/a) die Brillouin-Zone verlassender Wellenvektor am linken Ende (−π/a) wieder in die Brillouin-Zone hinein, d. h., der Quasiimpuls klappt bei Erreichen der oberen Kante der Brillouin-Zone um und springt von π/a in (−π/a) über. Metalle: In Metallen ist das letzte besetzte Energieband nur teilweise besetzt. Bei Anle gen eines äußeren elektrischen Feldes können deshalb die Elektronen in hö here Impulszustände angeregt werden, und Ladungstransport wird möglich. Das nur teilweise gefüllte Band wird deshalb als Leitungsband bezeichnet. Die energetisch tiefer liegenden besetzten Bänder tragen genau wie beim Isolator nichts zum Ladungstransport bei, siehe Abb. 13.11(b). Halbleiter: Halbleiter besitzen eine ähnliche Bandstruktur wie die Isolatoren, der Abstand zwischen benachbarten Energiebändern, d. h. die Breite der verbotenen Ener
292 | 13 Periodische Potentiale
giezonen, ist jedoch wesentlich kleiner als bei den Isolatoren. Während in ei nem guten Isolator wie Diamant der Abstand zwischen dem letzten gefüllten und dem ersten unbesetzten Energieband etwa 6 eV beträgt, haben die ent sprechenden verbotenen Energiezonen in den Halbleitern wie Silizium oder Germanium nur eine Breite von 1,11 eV bzw. 0,72 eV. Bei der Temperatur T = 0 sind bei den Halbleitern alle Energiebänder entweder vollständig gefüllt oder vollständig leer, genau wie bei den Isolatoren. Bei Zimmertemperatur hinge gen sind aufgrund der thermischen Energie Elektronen aus dem letzten (bei T = 0 vollständig gefüllten) Band in das nächsthöhere angeregt. Dieses ist dann teilweise durch Elektronen besetzt, die bei Anlegen eines äußeren elek trischen Feldes zu Ladungstransport führen können, genau wie im Falle der Metalle. Im Halbleiter sind jedoch weniger Elektronen im Leitungsband als in den Metallen. Deshalb leiten Halbleiter den Strom schlechter als Metalle. Bei einigen Halbleitern bzw. Leitern treten auch Bandüberlapps auf, sodass Elek tronen durch Tunnelung aus dem Valenzband in das Leitungsband gelangen können.
E(k)
E(k)
F F
(a)
0
π a
k
(b)
0
π a
k
Abb. 13.11: Bänderstruktur von (a) Isolatoren und (b) Metallen. Die schraffierten Bereiche zeigen die besetzten Energiezustände.
14 Drehimpuls und Spin (Heuristische Behandlung)* 14.1 Einführung In Abschnitt 8.5 haben wir die eindimensionale Bewegung einer Punktmasse in einem unendlich hohen Potenzialtopf {0 , V(x) = { ∞, {
|x| < a |x| ≥ a
betrachtet, was in idealisierter Form die Bewegung eines Elektrons in einem sehr dün nen Draht zwischen zwei idealen Isolatorplatten beschreibt (Abb. 8.6 und 8.7). Letzte re können bei tiefen Temperaturen entfallen, da die Elektronen den Draht dann nicht verlassen können. Innerhalb des Potenzialtopfes bewegt sich das Teilchen frei, d. h., seine Wellenfunktion ist durch Linearkombinationen der ebenen Wellen e ±ikx gege ben. An den unendlich hohen Potenzialwänden muss die Wellenfunktion verschwin den. Dies lieferte die Randbedingungen φ(±a) = 0 .
(14.1)
Diese Randbedingungen, die sich nur durch stehende Wellen erfüllen lassen, stellen eine Quantisierungsbedingung an die Impulse bzw. die Wellenzahlen k dar. Sie er laubt nur solche stehenden Wellen als Lösung der Schrödinger-Gleichung, für welche ein Vielfaches der halben Wellenlänge λ/2 = π/k in den Potenzialtopf passt, in Über einstimmung mit der de Broglie’schen Quantisierungsbedingung n
λ =L, 2
kn =
nπ , L
n = 1, 2, 3, . . . .
(14.2)
Die entsprechenden stationären Lösungen der Schrödinger-Gleichung sind dann durch nπ nπ 2 1 nπ cos ( x) = √ (e i L x + e−i L x ) , L L 2L nπ nπ 2 nπ 1 1 φ n (x) = √ sin ( x) = √ (e i L x − e−i L x ) , L L i 2L
φ n (x) = √
n ungerade , (14.3) n gerade
gegeben und besitzen die Energien En =
p2n nπℏ 2 1 =( ) , 2M L 2M
(14.4)
* Dieses Kapitel ist für das Verständnis der übrigen Kapitel nicht erforderlich und kann deshalb beim ersten Lesen übersprungen werden. https://doi.org/10.1515/9783110586022-014
294 | 14 Drehimpuls und Spin (Heuristische Behandlung)
x = a = −a −a
−a
a
a
Abb. 14.1: Kompaktifizierung des eindimensionalen Potenzialtopfes mit unendlich hohen Wänden (gerader, unendlich dünner Draht) zu einem Kreis.
wobei M die Masse des Teilchens im Potenzialtopf bezeichnet. Die Energieeigenwer te sollten sich nicht verändern, wenn wir den eindimensionalen Potenzialtopf (d. h. die Schiene bzw. den dünnen Draht) verbiegen und seine Länge L dabei konstant hal ten. Wir können ihn insbesondere zu einem Kreis verformen, indem wir die Anfangsund Endpunkte des potenzialfreien Raumes x = ±a identifizieren, dabei aber die Randbedingungen (14.1) aufrecht erhalten. Die vorher zwischen den unendlich hohen Potenzialwänden eingespannte, gerade eindimensionale Schiene des Teilchens wird dann zu einem Kreis „kompaktifiziert“, wobei die Potenzialwände verschwinden, sie he Abb. 14.1. Wir führen die Kompaktifizierung so durch, dass die Länge der Schiene 2a nicht verändert wird, d. h., der Umfang des Kreises (mit Radius R) ist gleich der Breite des Potenzialtopfes: L = 2a = 2πR . Nach der Kompaktifizierung erfolgt die Bewegung auf einer Kreisbahn mit der Rand bedingung (14.1), die den gesamten Effekt der vorher vorhandenen Potenzialwände enthält. Die Energieeigenwerte und Wellenfunktionen bleiben bei der Kompaktifi zierung unverändert, vorausgesetzt, die Quantisierungsbedingung (14.2) wird nicht verändert. Dazu muss lediglich die Randbedingung an die Wellenfunktion (14.1), d. h. das Verschwinden der Wellenfunktion an den beiden miteinander identifizier ten Punkten x = ±a, garantiert werden. Die quantenmechanische Bewegung in einem eindimensionalen, rechteckigen Potenzialtopf mit unendlich hohen Wänden ist damit äquivalent mit der Bewegung auf einem Kreis mit der Randbedingung, dass die Wellenfunktion an einem (beliebigen) Punkt verschwindet. Aufrechterhalten dieser Randbedingung würde jedoch einen Punkt (x = ±a) auf dem Kreis gegenüber den an deren Punkten auszeichnen, was wenig sinnvoll ist, da alle Punkte des Kreises gleich berechtigt sein sollten. Wir können jedoch dieselbe Quantisierungsbedingung (14.2) der Wellenzahl, d. h. dieselben Energieeigenwerte, aufrechterhalten, wenn wir statt der Randbedingung (14.1) periodische bzw. antiperiodische Randbedingungen an die
14.1 Einführung |
295
Wellenfunktion stellen: φ n (x + L) = ±φ n (x) ,
L = 2a = 2πR .
(14.5)
Die Lösungen der eindimensionalen Schrödinger-Gleichung haben bei Abwesenheit eines Potenzials die Form e±ikx . Wenn wir beide Vorzeichen¹ im Exponenten zulassen, müssen wir die Wellenzahl k auf k ≥ 0 einschränken, um Doppelberücksichtigung der Zustände zu vermeiden. Für die in positive x-Richtung fortschreitende Welle e ikx mit k ≥ 0 fordert die Randbedingung (14.5): e ikL = ±1 , wobei das positive Vorzeichen für die periodische, das negative für die antiperiodische Randbedingung gelten (analog für e−ikx ). Hieraus erhalten wir für die Wellenzahlen die Quantisierungsbedingung kn =
nπ , L
{2l , n={ 2l + 1 , {
periodische Randbedingungen antiperiodische Randbedingungen
,
l = 0, 1, 2, . . . ,
(14.6) die tatsächlich mit der Quantisierungsbedingung (14.2) für die Wellenzahlen im un endlich hohen Potenzialkasten übereinstimmt. (Für die in negative x-Richtung fort schreitende Welle e−ikx liefert die Randbedingung (14.5) dieselbe Quantisierungsbe dingung (14.6).) Damit erhalten wir auch dieselben Energieeigenwerte En =
(k n ℏ)2 2M
(14.7)
wie im unendlich hohen Potenzialkasten (14.4). Die Wellenfunktionen, d. h. die Eigen funktionen des Hamilton-Operators H0 = −
ℏ2 d2 , 2M dx2
sind jetzt jedoch keine stehenden Wellen (14.3) mehr, sondern fortschreitende Wellen: 1 nπ (±) φ n (x) = √ e±i L x , L
n ≥0,
(14.8)
wobei der Vorfaktor √1/L durch die Normierung L (±)
∫ dx |φ n (x)|2 = 1 0
1 Die beiden Vorzeichen in exp(±ikx) sind natürlich nicht mit den beiden Vorzeichen in (14.5) korre liert.
296 | 14 Drehimpuls und Spin (Heuristische Behandlung) (+)
(−)
bestimmt ist. Da φ n (x) und φ n (x) zum selben Energieeigenwert gehören, sind die (+) (−) Energieeigenzustände (außer dem Grundzustand n = 0, φ n=0 = φ n=0 = 1/√L) zwei fach entartet. Der Zustand mit konstanter Wellenfunktion und Energie E0 = 0, der der Grundzustand des Teilchens auf dem Kreis ist, existiert nicht im Potenzialtopf, da ei ne konstante Wellenfunktion wegen der Randbedingung (14.1) überall verschwindet und deshalb nicht normierbar ist. Ein Teilchen auf einer Kreisbahn (mit Radius R) besitzt aber keinen linearen Im puls, sondern nur einen Drehimpuls, den wir hier mit J bezeichnen. Seine Energie ist bei Abwesenheit eines Potenzials deshalb allein durch die Rotationsenergie E=
J2 2MR2
gegeben. Identifizieren wir diese Rotationsenergie mit der oben gewonnenen Energie der stationären Zustände (14.4) bzw. (14.7), J2 nπℏ 2 1 nℏ 2 1 nπℏ 2 1 = = = , ( ( ) ) ) ( L 2M 2πR 2M 2 2MR2 2MR2 so finden wir, dass der Drehimpuls die quantisierten Werte J = mℏ ,
m=±
n 2
(14.9)
annimmt. Für die periodischen Wellenfunktionen, für die n gerade ist, erhalten wir für den Drehimpuls ganzzahlige Vielfache von ℏ, m = 0, ±1, ±2, . . . , während für die antiperiodischen Wellenfunktionen, für welche n ungerade ist, der Drehimpuls halbzahlige Vielfache von ℏ annimmt: 1 3 5 m = ± ,± ,± ,... . 2 2 2 Der Drehimpuls ist damit quantisiert. Ausgedrückt durch die Drehimpulsquantenzahl m (14.9) lautet die de Broglie’sche Quantisierungsbedingung (14.2): |m|λ = L .
(14.10)
Die Drehimpulsquantenzahl gibt damit an, wie viel Wellenlängen λ auf den Kreisum fang L = 2πR „passen“. Für die Beschreibung der Bewegung des Teilchens auf dem Kreis ist es zweckmä ßig, die lineare Längenkoordinate x ∈ [0, L] durch die Winkelvariable ϕ = 2π
x , L
ϕ ∈ [0, 2π]
zu ersetzen. Ausgedrückt durch den Winkel ϕ lauten die Wellenfunktionen (14.8) mit L = 2πR: 1 n 2π ϕ (±) (14.11) φ n (x = L ) = √ e±i 2 ϕ =: √ φ ± n (ϕ) , 2 2π L L
14.2 Geometrische Interpretation von Drehimpuls und Spin
| 297
wobei die hier eingeführte Funktion φ m (ϕ) =
1 imϕ e √2π
(14.12)
über dem Winkelbereich [0, 2π] normiert ist, 2π
∫ dϕ φ ∗m (ϕ)φ m (ϕ) = δ mm . 0
Ansonsten ist die Funktion φ̄ (±) 2n (x) natürlich völlig äquivalent zur ursprünglichen En (±)
ergieeigenfunktion φ n (x), da sie sich nur um einen konstanten Normierungsfaktor √2π/L von den Letzteren unterscheiden. In der Quantenmechanik werden Observablen durch hermitesche Operatoren re präsentiert, die im Hilbert-Raum der Wellenfunktionen wirken. Die oben erhaltenen diskreten Werte des Drehimpulses J = mℏ müssen wir deshalb als Eigenwerte des Drehimpulsoperators J ̂ interpretieren, genauer der Komponente des Drehimpulsope rators, die senkrecht auf der Ebene des Kreises steht. Damit die Energieeigenfunktio (±) nen φ n (ϕ) (14.11) die Drehimpulseigenwerte ℏm = ±ℏn/2 liefern, d. h. ̂ (ϕ) = ℏmφ (ϕ) , Jφ m m muss der Drehimpulsoperator die Koordinatendarstellung Ĵ =
ℏ ∂ i ∂ϕ
besitzen. Im Abschnitt 15.5 werden wir diese Darstellung aus allgemeinen Überlegun gen ableiten.
14.2 Geometrische Interpretation von Drehimpuls und Spin Im Folgenden soll eine anschauliche geometrische Interpretation von ganzzahligem und halbzahligem Drehimpuls gegeben werden. Dazu schreiben wir die Wellenfunk tion (14.12) in der Form 1 iχ m (ϕ) φ̄ m (ϕ) = , e √2π wobei wir hier die Phase der Wellenfunktion χ m (ϕ) = mϕ ∈ [0, 2πm] eingeführt haben. Die Phase χ m (ϕ) vermittelt eine Abbildung ϕ → mϕ. Wir betrach ten diese Abbildung zunächst für ganzzahlige Drehimpulse m. Für ganzzahlige Drehimpulse m ist die Wellenfunktion (14.12) periodisch und ein (ganzzahliges) Vielfaches der Wellenlänge λ = 2π/k n=2|m| = L/|m| passt gerade auf die
298 | 14 Drehimpuls und Spin (Heuristische Behandlung)
(+)
Im{ϕ2 (x)} =
1 L
sin
2π L x
L = 2πR
x = φR
(a)
χ1 (φ)
2π φ
(b)
2π
χ1 (φ)
φ (c)
Abb. 14.2: Der Drehimpulseigenzustand m = 1: (a) Imaginärteil der Wellenfunktion (14.3) φ n=2m (x = Rϕ). (b) Phase χ m=1 (ϕ) der Wellenfunktion. (c) Illustration der Abbildung des Winkels ϕ auf die Phase χ m=1 (ϕ).
Kreisbahn der Länge L = 2πR, in Übereinstimmung mit der de Broglie’schen Quan tisierungsbedingung (14.10). Für m = 1 z. B. ist die Phase χ1 (ϕ) der Wellenfunktion durch den Winkel ϕ selbst gegeben: χ 1 (ϕ) = ϕ. Die zugehörige Wellenfunktion ist in Abb. 14.2 (a) dargestellt. In diesem Fall hat genau eine Wellenlänge auf dem Kreisum fang L = 2πR Platz. Durchlaufen wir hier den Definitionsbereich des Winkels ϕ von 0 bis 2π, so durchläuft offensichtlich auch die Phase der Wellenfunktion χ 1 (ϕ) = ϕ den gesamten Wertebereich. Veranschaulichen wir die Wertbereiche ϕ ∈ [0, 2π] bzw. χ 1 ∈ [0, 2π] durch eine gestrichelte bzw. durchgezogene geschlossene Schleife (de formierbaren Kreis), so windet sich der (durchgezogene) χ-Kreis bei der Abbildung χ 1 (ϕ) = ϕ gerade einmal um den (gestrichelten) ϕ-Kreis (siehe Abb. 14.2(b)). Für halbzahlige Drehimpulse m ist die zugehörige Wellenfunktion (14.8) bzw. (14.12) antiperiodisch, φ̄ m (ϕ = 2π) = −φ̄ m (ϕ = 0) , und die Quantisierungsbedingung (14.10) besagt, dass jetzt nur noch ein ungerades Vielfaches der halben Wellenlänge auf den Kreisumfang L = 2πR passt. Betrachten wir z. B. den Zustand mit m = 1/2, so beträgt die Wellenlänge λ = 2L = 4πR, und auf dem Kreisumfang L = 2πR hat jetzt nur noch eine halbe Wellenlänge
14.2 Geometrische Interpretation von Drehimpuls und Spin |
(+)
Im{ϕ1 (x)} =
1 L
sin
299
π Lx
4πR
x = φR
2πR
(a)
χ 1 (φ) 2
2π π
(a)
φ
2π
4π
χ 1 (φ) 2
φ (b)
Abb. 14.3: Der Drehimpulseigenzustand m = 1/2: (a) Imaginärteil der Wellenfunktion (14.3) φ n=2m (x = Rϕ). (b) Phase χ m=1/2 (ϕ) der Wellenfunktion. (c) Illustration der Abbildung des Winkels ϕ auf die Phase χ m=1/2 (ϕ).
Platz (Abb. 14.3(a)). Die Phase der Wellenfunktion ist jetzt durch χ 12 (ϕ) =
1 ϕ 2
gegeben. Aus der Abbildung ist ersichtlich, dass für den Drehimpuls m = 1/2 beim einmaligen Umlaufen der Kreisbahn ϕ = 0, . . . , 2π die Ortskoordinate x = ϕR nur die halbe Wellenlänge durchläuft. Erst nach zweimaligem Umlauf der Kreisbahn wird die ganze Wellenlänge der fortschreitenden Welle durchlaufen. Dieser Sachverhalt ist in Abb. 14.3(c) illustriert, wo die Wertebereiche [0, 2π] von ϕ bzw. χ wieder durch gestrichelte bzw. durchgezogene geschlossene (deformierbare) Schleifen dargestellt sind. In der Tat, wandern wir in Abb. 14.3(b) einmal durch den Definitionsbereich des Drehwinkels ϕ, so durchlaufen wir erst den halben Wertebereich der Phase χ der Wel lenfunktion, was der halben Wellenlänge in der Ortskoordinate x = ϕR entspricht, siehe Abb. 14.3(a). Erst nach zweimaligem Umlaufen des ϕ-Kreises wird der gesamte Wertebereich 2π der Phase χ(ϕ) durchlaufen. Folglich ist bei der Abbildung χ 1/2 (ϕ) = (1/2)ϕ die χ-Schleife zweimal um die ϕ-Schleife „gewickelt“, Abb. 14.3(c). Die Teil chenwelle e iχ1/2(ϕ) ist damit zweimal um die Kreisbahn im Ortsraum (ϕ-Schleife) „ge wickelt“. Ein Teilchen mit Drehimpuls (in Einheiten von ℏ) m = 1/2 muss deshalb zweimal auf der Kreisbahn umlaufen, bevor es wieder in seinen Ausgangszustand zu
300 | 14 Drehimpuls und Spin (Heuristische Behandlung) rückkehrt.² Nach einem Umlauf ϕ → ϕ + 2π hat die Wellenfunktion (14.12) gerade ihr Vorzeichen gewechselt: φ̄ m= 2l+1 (ϕ + 2π) = −φ̄ m= 2l+1 (ϕ) . 2
2
Damit ist diese Wellenfunktion eine zweideutige Funktion des Ortes des Teilchens: Das Teilchen mit Drehimpuls ℏm = ℏ/2 kann sich folglich (beim selben Winkel ϕ, d. h. am selben Ort) gleichzeitig in zwei verschiedenen „Zuständen“ befinden (siehe Abb. 14.4). Dies ist nicht akzeptabel, da die Wellenfunktion als Wahrscheinlichkeitsamplitude eine eindeutige Funktion des Ortes sein sollte.
Abb. 14.4: Illustration der Zweideutigkeit der Phase der Spin-16/2-Welle.
Wie aus der Mathematik bekannt, lassen sich mehrdeutige Funktionen eindeutig machen, indem man Riemann’sche Flächen bzw. Blätter einführt. Um die Wellenfunk tion des Teilchens mit Drehimpuls m = 1/2 eindeutig zu machen, müssen wir deshalb zwei Riemann’sche Blätter einführen, eines für den Winkelbereich ϕ ∈ (0, 2π) und ei nes für den Bereich ϕ ∈ [2π, 4π]. Teilchen mit Drehimpuls ℏ/2 müssen deshalb durch zweikomponentige Objekte, sogenannte Spinoren ψ=(
ψ1 ) ψ2
beschrieben werden. Jede Komponente dieses Spinors beschreibt dabei ein Rie mann’sches Blatt der m = 1/2-Welle. Wir werden die Spinoren explizit in Kapitel 28, Band 2 behandeln. Der halbzahlige Drehimpuls wird als Spin bezeichnet, woraus der Name Spinor abgeleitet ist. Allgemein versteht man unter einem Spin s einen sogenannten inneren Drehimpuls ℏs, dessen Eigenfunktionen (2s + 1)-komponentige (Wellen-)Funktionen sind. Das Wort „innere“ deutet darauf hin, dass die zugehörigen (Drehimpuls- oder) Spinoperatoren in einem abstrakten (inneren) Vektorraum definiert sind, siehe Kapitel 15.
2 Die Bahnkurve eines Teilchens mit Drehimpuls m = 1/2 lässt sich geometrisch durch ein MöbiusBand veranschaulichen: Nach Durchlaufen der gesamten Länge des Möbius-Bandes, d.h. nach Durch laufen eines Winkels 2π, landet man auf der entgegengesetzten Seite des Startpunktes. Zu diesem kehrt man erst nach Durchlaufen eines Winkels von 4π zurück.
14.3 Physikalische Konsequenzen des geometrischen Bildes vom Drehimpuls |
301
14.3 Physikalische Konsequenzen des geometrischen Bildes vom Drehimpuls Ein quantenmechanisches Teilchen, das durch eine Wellenfunktion φ(x) beschrieben wird, besitzt eine Stromdichte (7.43) 1 ̂ ̂ ∗ (x)) . − φ(x)pφ (14.13) (φ∗ (x)pφ(x) 2M Besitzt das Teilchen eine elektrische Ladung q, so ist mit der fortschreitenden Wel le ein Ladungstransport verbunden, und die zugehörige elektrische Stromdichte ist durch j e = qj gegeben. Die „Stromdichte“ einer eindimensionalen Bewegung, die nach Gleichung (14.13) mit einer eindimensionalen Wellenfunktion φ(x) berechnet wird, repräsentiert im dreidimensionalen Raum eine Stromstärke. Davon überzeugt man sich leicht, wenn man beachtet, dass die eindimensionale Wellenfunktion die Dimension Länge−1/2 besitzt, während die dreidimensionale Wellenfunktion die Di mension Länge−3/2 besitzt. Deshalb ist mit der eindimensionalen fortschreitenden Wellenbewegung im dreidimensionalen Raum die Stromstärke j(x) =
I = qj
(14.14)
verbunden. Die Bewegung des geladenen quantenmechanischen Teilchens auf der Kreisbahn stellt somit eine geschlossene Stromschleife mit der Stromstärke I dar. Aus der klassischen Elektrodynamik wissen wir, dass eine geschlossene Stromschleife C ein magnetisches Moment μ = I ∫ df M
besitzt, wobei die Integration über eine von C = ∂M eingeschlossene Fläche M erfolgt. Liegt die Stromschleife in einer Ebene, so reduziert sich dieser Ausdruck auf |μ| = I|M| , wobei |M| die von der Stromschleife eingeschlossene Fläche (genauer: ihr Flächen inhalt) ist. Setzen wir die Wellenfunktion für die Bewegung auf der Kreisbahn, φ n (x) (14.8), in den Ausdruck für die Stromdichte (14.13) ein, so finden wir für den elektri schen Strom (14.14): pn 1 q nπℏ I=q . = M L M L2 Beachten wir, dass die kreisförmige Stromschleife eine Fläche |M| = πR2 einschließt, so erhalten wir für das magnetische Moment (mit L = 2πR): q n l , l ≡ ℏ|m| , |m| = . |μ n | = 2M 2 Dies ist der aus der klassischen Elektrodynamik bekannte Ausdruck für das magne tische Moment einer Punktladung q mit Drehimpuls l. Dieser Zusammenhang zwi schen magnetischem Moment und Drehimpuls ist im atomaren Bereich für Teilchen mit ganzzahligem Drehimpuls m auch experimentell bestätigt.
302 | 14 Drehimpuls und Spin (Heuristische Behandlung)
Unsere obige Berechnung des magnetischen Momentes kann jedoch nicht richtig sein für einen halbzahligen Drehimpuls, wenn unsere geometrische Interpretation des Drehimpulses richtig ist. Bei ganzzahligem Drehimpuls, z. B. Drehimpuls m = 1, passt gerade die Teilchenwelle auf die Kreisbahn. Die Teilchenwelle ist einmal um die Kreis bahn „gewickelt“: Die mit der Teilchenwelle verbundene rotierende Punktladung re präsentiert eine geschlossene Stromschleife, eine stromdurchflossene Spule mit einer Windung. Für den Spin 1/2 hingegen ist die Teilchenwelle zweimal um die Kreisbahn „gewickelt“, und wir haben es mit einer Spule mit zwei Windungen zu tun. Da das Teilchen die Kreisbahn gleichzeitig auf zwei Ebenen (Riemann’schen Blättern) durch läuft, fließt der doppelte Strom, und entsprechend muss das magnetische Moment den doppelten Wert annehmen. Damit erhalten wir für das magnetische Moment ei nes geladenen Teilchens mit Spin m = 1/2 |μ| = 2
q l, 2M
l = ℏ|m| ,
|m| =
1 . 2
(14.15)
Ein Teilchen mit Spin 1/2 hat damit pro Drehimpulseinheit ein doppelt so großes ma gnetisches Moment wie ein Teilchen mit ganzzahligem Drehimpuls. Dieser Umstand, der sich zwangsläufig aus unserer geometrischen Interpretation des Drehimpulses er gab, wird in der Tat experimentell bestätigt. Der oben gewonnene Ausdruck (14.15) für das magnetische Moment folgt auch unmittelbar aus der Dirac-Gleichung, der re lativistischen Verallgemeinerung der Schrödinger-Gleichung für ein Teilchen mit Spin s = (1/2)ℏ, siehe Abschnitt 28.9, Band 2.
15 Der Drehimpuls 15.1 Einführung Aus der klassischen Mechanik wissen wir, dass der Drehimpuls eine große Rolle für die Bewegung eines Teilchens im dreidimensionalen Raum spielt. Wegen der Isotro pie des Raumes ist der Drehimpuls isolierter Systeme eine Erhaltungsgröße ähnlich wie Energie und Impuls (Energie- bzw. Impulserhaltung folgen aus der Homogenität von Zeit bzw. Raum). Die Energie ist für alle Arten von Problemen wichtig, während der lineare Impuls i. A. nur für Streuprobleme relevant ist. Bei der Untersuchung von gebundenen Systemen wie z. B. Atomen, Molekülen oder Atomkernen ist hingegen der Drehimpuls von großer Bedeutung. In der klassischen Mechanik ist der Drehimpuls einer Punktmasse durch L=x×p definiert, wobei x den Ortsvektor und p den Impuls bezeichnen. Im Gegensatz zum (li nearen) Impuls hängt der Drehimpuls explizit von der Wahl des Koordinatensystems ab und ändert deshalb seinen Wert bei Koordinatentransformationen. In der klassi schen Mechanik wird die zeitliche Änderung des Impulses durch das zweite New ton’sche Gesetz dp =F dt beschrieben. Da der Impuls p = m ẋ parallel zur Geschwindigkeit ẋ ist und somit ẋ × p = 0, erhalten wir für die zeitliche Änderung des Drehimpulses: dL d = (x × p) = ⏟⏟⏟⏟⏟⏟⏟⏟⏟ ẋ × p +x × ṗ = x × F =: M , dt dt =0 wobei M das Drehmoment ist. Der Drehimpuls bleibt also erhalten, wenn die Kraft parallel zum Ortsvektor ist: dL =0, F ‖x. dt In der Quantenmechanik werden bekanntlich physikalische Observablen durch linea re hermitesche Operatoren beschrieben. Unsere bisherige Erfahrung lässt uns erwar ten, dass wir den quantenmechanischen Drehimpulsoperator aus dem Ausdruck für den klassischen Drehimpuls erhalten, wenn wir im Letzteren x und p durch die ent sprechenden Operatoren ersetzen. Dann lautet der Drehimpulsoperator:¹ ℏ L̂ = x̂ × p̂ = x̂ × ∇ . i
1 Im Folgenden wird meist für Operatoren einfach A statt  geschrieben. https://doi.org/10.1515/9783110586022-015
(15.1)
304 | 15 Der Drehimpuls
Diese Definition wird bestätigt, wenn man den Drehimpulsoperator als Generator der Drehungen für die Wellenfunktion definiert (siehe Band 2). Wir bemerken, dass bei der direkten Ersetzung von Ort und Impuls durch die ent sprechenden quantenmechanischen Operatoren kein Ordnungsproblem zwischen x und p auftritt, da unterschiedliche Komponenten von Ort und Impuls kommutieren, [x i , p j ] = 0̂ ,
i ≠ j ,
und wegen des Kreuzproduktes niemals Produkte aus denselben Orts- und Impuls komponenten auftreten. Aus Bequemlichkeitsgründen werden wir im Folgenden die kartesischen Ein heitsvektoren wahlweise mit (e1 , e2 , e 3 ) oder (e x , e y , e z ) und die zugehörigen karte sischen Koordinaten eines Vektors A dementsprechend mit (A1 , A2 , A3 ) bzw. (A x , A y , A z ) bezeichnen: A = A1 e1 + A2 e 2 + A3 e3 ≡ A x e x + A y e y + A z e z .
(15.2)
Für den Ortsvektor haben wir x = x1 e1 + x2 e2 + x3 e3 ≡ xe x + ye y + ze z .
(15.3)
Zerlegen wir den Drehimpuls nach den orthonormierten Einheitsvektoren² e i (e i ⋅ e j = δ ij ), L = Li ei , so lassen sich seine Komponenten L i = L ⋅ e i auch als Spatprodukt schreiben: (e i )1 L i = e i ⋅ (x × p) = det(e i , x, p) = (e 1 )2 (e i )3
x1 x2 x3
p1 p2 . p3
Mit (e i ) k = δ ik lesen wir aus dieser Darstellung für die einzelnen Drehimpulskomponenten ab: ℏ ∂ ∂ (y − z ) = Lx , i ∂z ∂y ℏ ∂ ∂ − x ) = Ly , L2 = x3 p1 − x1 p3 = zp x − xp z = (z i ∂x ∂z ℏ ∂ ∂ − y ) = Lz . L3 = x1 p2 − x2 p1 = xp y − yp x = (x i ∂y ∂x L1 = x2 p3 − x3 p2 = yp z − zp y =
2 Über wiederholte Indizes wird summiert (Einstein’sche Summenkonvention).
(15.4)
15.1 Einführung |
305
Führen wir den totalen antisymmetrischen Tensor dritter Stufe (Levi-Civita-Tensor) im ℝ3 durch 1, (i, j, k) gerade Permutation von (1,2,3) { { { (15.5) ϵ ijk = {−1 , (i, j, k) ungerade Permutation von (1,2,3) { { sonst {0 , ein, so können wir die Komponenten des Drehimpulsoperators in kompakter Form als L i = ϵ ijk x j p k =
ℏ ϵ ijk x j ∇k i
(15.6)
schreiben. In dieser Darstellung erhalten wir für den Kommutator zweier Drehimpuls komponenten: [L i , L j ] = ϵ ikl ϵ jmn [x k p l , x m p n ] . (15.7) Den hier auf der rechten Seite erscheinenden Kommutator werten wir unter Benut zung der Rechenregeln (4.42) für Kommutatoren aus und erhalten mit der Kommuta tionsbeziehung zwischen Ort und Impuls, [x i , p j ] = iℏδ ij : [x k p l , x m p n ] = x k [p l , x m ]p n + x m [x k , p n ]p l = iℏ(−δ lm x k p n + δ kn x m p l ) . Setzen wir dieses Ergebnis in Gleichung (15.7) ein und benutzen die zyklische Eigen schaft des ϵ-Tensors, so finden wir: [L i , L j ] = iℏϵ ikl ϵ jmn (−δ lm x k p n + δ kn x m p l ) = iℏ (−ϵ ikl ϵ jln x k p n + ϵ ikl ϵ jmk x m p l ) = iℏ (ϵ ikl ϵ jnl x k p n − ϵ ilk ϵ jmk x m p l ) = iℏ (ϵ ikl ϵ jnl − ϵ jkl ϵ inl ) x k p n . (Im letzten Term wurden Summationsindizes umbenannt.) Benutzen wir schließlich noch die Vollständigkeitsbeziehung der ϵ-Tensoren, ϵ ikm ϵ jlm = δ ij δ kl − δ il δ kj ,
(15.8)
so erhalten wir für den Kommutator zweier Drehimpulskomponenten: [L i , L j ] = iℏ(δ ij δ kn − δ in δ kj ) − (δ ij δ kn − δ jn δ ki )]x k p n = iℏ[x i p j − x j p i ] . Kontrahieren wir diese Beziehung mit dem antisymmetrischen ϵ-Tensor (Multiplika tion mit ϵ und Summation über alle wiederholten Indizes) und benutzen die Definiti on (15.6) des Drehimpulses, so erhalten wir: ϵ kij [L i , L j ] = iℏϵ kij (x i p j − x j p i ) = 2iℏL k .
(15.9)
Nochmalige Kontraktion mit dem ϵ-Tensor und Benutzung der Vollständigkeitsrelati on (15.8) liefert: [L i , L j ] = iℏϵ ijk L k .
(15.10)
306 | 15 Der Drehimpuls
Diese Relation definiert eine sogenannte SU(2)-Lie-Algebra, d. h., die Drehimpulsope ratoren sind die Generatoren einer SU(2)-Gruppe. Sie müssen sich deshalb durch Dar stellungen der SU(2)-Gruppe realisieren lassen, wie wir im Späteren noch explizit se hen werden. In ähnlicher Weise berechnet man die Kommutatoren des Drehimpulses mit dem Orts- und dem Impulsoperator: [L i , x j ] = iℏϵ ijk x k ,
(15.11)
[L i , p j ] = iℏϵ ijk p k .
(15.12)
Diese Beziehungen sind intuitiv sofort klar, da ein Kommutator mit x i ein p i vernichtet und umgekehrt. Setzen wir in diesen Beziehungen i = j, so folgt [L i , x i ] = 0 ,
[L i , p i ] = 0 .
Summieren wir schließlich über den verbleibenden Index, so finden wir L⋅x = x⋅L,
L⋅p= p⋅L.
(15.13)
Aus der Definition des Drehimpulses (15.1) folgt aber x ⋅ L = x ⋅ (x × L) = (x × x) ⋅ L = 0 L ⋅ p = (x × p) ⋅ p = x ⋅ (p × p) = 0 ,
(15.14)
wobei wir [p i , p j ] = 0 und [x i , x j ] = 0 benutzt haben. Der Drehimpulsoperator ist damit orthogonal zum Orts- und Impulsoperator. In vektorieller Notation lautet Gleichung (15.9) L × L = iℏL . Dies zeigt, dass das Kreuzprodukt eines vektoriellen Operators mit sich selbst nicht notwendigerwei se verschwindet. Die oben angegebenen Beziehungen (15.10), (15.11) und (15.12) sind Spezialfälle der allgemeinen Kommutationsbeziehung eines vektoriellen Operators V k mit dem Drehimpulsoperator [L k , V l ] = iℏε klm V m ,
(15.15)
die in Abschnitt (26.6) bewiesen wird.
Die oben erhaltene Kommutationsbeziehung für die Drehimpulse (15.10) zeigt, dass im Gegensatz zur klassischen Mechanik, wo sämtliche Komponenten des Drehim pulses gleichzeitig messbar sind, in der Quantenmechanik kein Zustand (außer dem trivialen Zustand, in welchem L i = 0)̂ gleichzeitig Eigenzustand von mehreren Dreh impulskomponenten sein kann. Die Wellenfunktion eines Zustandes kann also nur
15.2 Die Eigenwerte des Drehimpulses | 307
Eigenfunktion einer einzelnen Drehimpulskomponente sein, die wir im Folgenden als L z = L3 wählen. Die beiden übrigen Drehimpulskomponenten sind dann unscharf. In der Tat, aus der allgemeinen Beziehung für die Unschärferelation zwischen belie bigen Operatoren (Gleichung (11.10)) folgt mit Gleichung (15.10) für unterschiedliche i, j, k (für welche ϵ ijk ≠ 0): ℏ ∆L i ∆L j ≥ |⟨L k ⟩| . 2 Die einzelnen Drehimpulskomponenten kommutieren jedoch mit dem Quadrat des Drehimpulsoperators L 2 = (L i e i ) ⋅ (L j e j ) = L i L j e i ⋅ e j = L i L j δ ij = L i L i , wie eine elementare Rechnung zeigt: [L i , L 2 ] = [L i , L j L j ] = L j [L i , L j ] + [L i , L j ]L j = iℏϵ ijk (L j L k + L k L j ) ≡ iℏϵ ijk {L j , L k } = 0̂ . Das letzte Gleichheitszeichen gilt aus Symmetriegründen: Der Ausdruck in der Klam mer, der den Antikommutator definiert, ist symmetrisch bezüglich Vertauschen der Indizes j und k, während der ϵ-Tensor antisymmetrisch bezüglich Vertauschen zweier Indizes ist. Damit besitzen L 2 und eine feste Komponente des Drehimpulses, die wir i. A. als L z wählen werden, gemeinsame Eigenfunktionen. Bei Drehimpulserhaltung, was nach Gleichung (7.21) gleichbedeutend mit [H, L i ] = 0̂ ,
i = 1, 2, 3 ⇒ [H, L ] = [H, L i L i ] = 0̂ 2
ist, lassen sich deshalb die Energieeigenzustände nach den Eigenwerten von L 2 und L z klassifizieren, die wir im Folgenden bestimmen wollen. Dabei werden wir finden, dass diese Eigenwerte allein durch die Drehimpulsalgebra (15.10) bereits eindeutig festgelegt sind.
15.2 Die Eigenwerte des Drehimpulses Bei der Behandlung der eindimensionalen Bewegung auf einer Kreisbahn (Abschnitt 14.1) hatten wir gefunden, dass der zugehörige Drehimpuls, der senkrecht auf der Ebene der Kreisbahn steht, quantisiert ist und seine Eigenwerte durch ein Vielfaches von ℏ/2 gegeben sind. Legen wir die Kreisbahn in die xy-Ebene, so ist der zugehörige Drehimpuls L z . Damit kennen wir im Prinzip bereits die Eigenwerte einer einzelnen Drehimpulskomponente. Dieses Ergebnis beruhte auf geometrischen Über legungen, bei denen wir die durch unendlich hohe Potenzialwände eingeschränkte
308 | 15 Der Drehimpuls
eindimensionale Bewegung zu einer Kreisbahn kompaktifizierten. Wir wollen jetzt dieses Ergebnis ohne Bezugnahme auf geometrische Vorstellungen rein abstrakt aus den Kommutationsbeziehungen zwischen den Drehimpulskomponenten (15.10), d. h. aus der SU(2)-Algebra, ableiten. Da der Drehimpulsoperator den Impulsoperator li near enthält, erwarten wir, dass die Eigenwerte des Drehimpulses proportional zu ℏ sind, was auch die vorangegangenen geometrischen Überlegungen in Kapitel 14 gezeigt haben. Wir schreiben deshalb die Eigenwertgleichungen von L z und L 2 in der Form L z |lm⟩ = ℏm|lm⟩ , (15.16) L 2 |lm⟩ = ℏ2 λ l |lm⟩ , wobei wir einen Index l zur Unterscheidung der verschiedenen Eigenwerte ℏ2 λ l und Eigenvektoren von L 2 eingeführt haben, deren explizite Form wir noch nicht kennen. Im Eigenwert ℏm von L z kann m zum gegenwärtigen Zeitpunkt noch eine beliebige reelle Zahl sein, die prinzipiell auch von l bzw. λ l abhängen kann. Da der Operator L 2 positiv semidefinit ist, können seine Eigenwerte nicht negativ werden. Darüber hinaus kann eine einzelne Drehimpulskomponente nicht den Betrag des gesamten Drehim pulses übersteigen. Deshalb haben wir für die Eigenwerte die Nebenbedingung λl ≥ 0 ,
m2 ≤ λ l .
(15.17)
Die Eigenwertgleichungen lassen sich rein algebraisch aus den Kommutationsbezie hungen für die Drehimpulskomponenten L i (15.10) finden, ähnlich wie wir beim har monischen Oszillator das Spektrum auf rein algebraische Weise gefunden haben (Ab schnitt 12.5). Beim harmonischen Oszillator gelang es uns, den Hamilton-Operator durch lineare algebraische Operatortransformationen zu diagonalisieren. Der Hamil ton-Operator war durch das Quadrat von Impuls und Koordinate gegeben: 1 H̄ = (Q2 + P2 ) . 2 Wir konnten diese quadratische Form durch Einführen der Leiteroperatoren a=
1 (Q + iP) , √2
a† =
1 (Q − iP) √2
auf Diagonalform, 1 H̄ = a† a + , 2 bringen. Das Auffinden der Eigenwerte von L 2 = (L2x + L2y ) + L2z stellt ein ähnliches Pro blem dar. Es verlangt die Diagonalisierung der quadratischen Form L 2 − L2z = L2x + L2y der beiden nicht vertauschenden Operatoren L x und L y . Dazu gehen wir ähnlich wie beim harmonischen Oszillator vor und führen wieder Leiteroperatoren durch die Be ziehung L± = L x ± iL y ,
(L± )† = L∓
(15.18)
15.2 Die Eigenwerte des Drehimpulses | 309
ein. Die beiden Leiteroperatoren L+ und L− sind zueinander adjungiert. Da jede Kom ponente des Drehimpulses mit dem Quadrat des Gesamtdrehimpulses kommutiert, finden wir sofort: [L 2 , L± ] = 0̂ .
(15.19)
Unter Benutzung der Kommutationsbeziehungen für die Drehimpulskomponen ten (15.10) lassen sich durch explizite Rechnung die folgenden Relationen beweisen: [L z , L± ] = ±ℏL±
(15.20)
[L+ , L− ] = 2ℏL z .
(15.21)
Wegen Gleichung (15.19) müssen auch die Zustände L± |lm⟩ Eigenzustände von L 2 mit demselben Eigenwert λ l sein: L 2 (L± |lm⟩) = L± L 2 |lm⟩ = ℏ2 λ l L± |lm⟩ . Andererseits folgt aus Gleichung (15.20): L z (L± |lm⟩) = (L± L z + [L z , L± ])|lm⟩ = ℏ(m ± 1)L± |lm⟩ , sodass die Operatoren L± die Quantenzahl von L z um eine Einheit von ℏ erhöhen bzw. erniedrigen, was die Bezeichnung Leiter- oder Stufenoperatoren rechtfertigt. Damit ha ben wir gefunden, dass bis auf Normierung die Zustände L± |lm⟩ mit den Zuständen |l m±1⟩ zusammenfallen, d. h., (±)
L± |lm⟩ = C l m±1 |l m±1⟩ ,
(15.22)
wobei C l m±1 eine noch zu bestimmende Konstante ist, die von der Norm der Zustände |lm⟩ abhängt. Zweckmäßigerweise wählen wir ⟨lm|lm⟩ = 1 .
(15.23)
Auf diese Weise können wir mittels der Leiteroperatoren aus einer einzigen Eigenfunk tion von L2 und L z alle Eigenfunktionen von L z zum selben Eigenwert λ l von L 2 kon struieren. Dieses Verfahren muss irgendwann abbrechen, da die Eigenwerte von L2z stets kleiner oder gleich den Eigenwerten von L 2 sind, siehe Gleichung (15.17). Für die Norm des Zustandes L± |lm⟩ erhalten wir mit (15.22): (±) 2 ⟨l m±1|l m±1⟩ C l m±1 ‖L± |lm⟩‖2 = ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ =1
oder unter Benutzung von (L± )† = L∓ ! (±) 2 ||L± |lm⟩||2 = ⟨lm|L∓ L± |lm⟩ = C lm±1 .
(15.24)
310 | 15 Der Drehimpuls
Elementare Rechnung unter Benutzung der Kommutationsbeziehung (15.10) zeigt, dass: L∓ L± = L2 − L2z ∓ ℏL z . Mit dieser Beziehung finden wir für die Norm (15.24): (±) 2 2 2 2 C l m±1 = ℏ (λ l − m ∓ m) = ℏ [λ l − m(m ± 1)] ≥ 0 .
(15.25)
Da die Norm eines Vektors nicht negativ ist, erhalten wir die Bedingungen λ l ≥ m2 ± m = m(m ± 1) ,
(15.26)
die beide sowohl für positive als auch für negative m gelten müssen, da wir bisher nichts über das Vorzeichen von m vorausgesetzt haben. Diese Bedingung liefert damit eine noch stärkere Einschränkung an die Eigenwerte m als die oben intuitiv gefundene Beziehung (15.17). Da m nach oben beschränkt ist, muss es einen maximalen Wert mmax =: l geben,³ für den gilt: L+ |lmmax ⟩ = L+ |l l⟩ = o . (15.27) Anderenfalls würde nach (15.22) wiederholte Anwendung von L± auf |lm⟩ Eigenwer te m liefern, welche die Bedingung (15.26) verletzen. Da die Norm des Nullvektors ver schwindet, erhalten wir aus Gleichung (15.25) mit m = l, dass die Eigenwerte von L 2 durch λ l = l(l + 1) (15.28) gegeben sind. Setzen wir diesen Ausdruck für λ l in den Normierungskoeffizienten Gleichung (15.25) ein und wählen diesen reell und positiv, so nimmt Gleichung (15.22) die Gestalt L± |lm⟩ = ℏ√l(l + 1) − m(m ± 1) |l m±1⟩ = ℏ√(l ± m + 1)(l ∓ m) |l m±1⟩
(15.29)
an. Dieser Ausdruck zeigt, dass der minimale Wert von m, für den die Leiter nach un ten abbricht (L− |lmmin ⟩ = o), durch mmin = −l gegeben ist:⁴ L− |l, −l⟩ = o .
3 l hatte ja bis jetzt noch keine Bedeutung. Die Wahl l = m max bedeutet, dass wir die Eigenwerte von L2 , λ l durch den maximalen Eigenwert von L z charakterisieren, was sicherlich sinnvoll ist, da L2z ≤ L2 . 4 Um Verwirrungen zu vermeiden, schreiben wir die Drehimpulseigenvektoren oftmals als |l, m⟩ statt |lm⟩.
15.2 Die Eigenwerte des Drehimpulses | 311
Nach Gleichung (15.29) können wir durch wiederholte Anwendung des Operators L+ auf den Zustand |l, −l⟩ zum Zustand |l l⟩ gelangen. Es muss deshalb eine natürliche Zahl n geben, sodass (L+ )n |l, −l⟩ ∼ |l, −l + n⟩ = |l, l⟩ (15.30) gilt. Dies impliziert die Bedingung −l + n = l , woraus
n , n = 0, 1, 2, . . . 2 folgt. Damit haben wir gezeigt, dass die Eigenwerte des Quadrates des Drehimpuls operators die in Gleichung (15.28) angegebene Gestalt λ l = l(l + 1) besitzen mit einer ganzen oder halbganzzahligen nicht negativen Zahl l: l=
l = 0, 1, 2, . . . , 1 3 5 l = , , ,... . 2 2 2 Ferner haben wir gezeigt, dass die Quantenzahl m der z-Komponente des Drehimpul ses die (2l + 1) Werte m = −l, −l + 1, . . . , l (15.31) annimmt. Die Zahlen l und m werden als Drehimpulsquantenzahlen bezeichnet. Häu fig wird m auch als magnetische Quantenzahl bezeichnet, aus Gründen, die bei der Behandlung einer Ladung im Magnetfeld (siehe Abschnitt 22.3) nachvollziehbar wer den. Für einen festen Gesamtdrehimpuls⁵ l gibt es damit (2l + 1) Zustände, die sich in der Quantenzahl m, der Projektion des Drehimpulses auf die z-Achse, unterscheiden. Mit (15.28) erhalten wir für die Eigenwertgleichungen (15.16) des Drehimpulses: 1 3 , 1, , . . . , 2 2 m = −l, −l + 1, . . . , l .
L 2 |lm⟩ = ℏ2 l(l + 1)|lm⟩ , L z |lm⟩ = ℏm|lm⟩ ,
l = 0,
(15.32)
Aus Gleichung (15.29) erhält man nach dem Prinzip (15.30) für die normierten Dreh impulseigenfunktionen die Darstellungen |lm⟩ = √
(l + m)! 1 l−m (L− )l−m |l l⟩ , ( ) (2l)!(l − m)! ℏ
(l − m)! 1 l+m ( ) (L+ )l+m |l, −l⟩ . |lm⟩ = √ (2l)!(l + m)! ℏ
5 Statt Drehimpulsquantenzahl l sagt man oft einfach Drehimpuls l.
(15.33)
312 | 15 Der Drehimpuls Damit haben wir sämtliche Eigenwerte von L 2 und L z allein aus den Kommutations beziehungen der Drehimpulsoperatoren gewonnen, ohne explizit die entsprechenden Eigenwertgleichungen zu lösen. Die Eigenwerte sind damit eine Folge der Lie-Alge bra (15.10), welche die Komponenten des Drehimpulsoperators erfüllen. Diese Algebra wird deshalb auch als Drehimpulsalgebra bezeichnet. Sie erzeugt die Symmetriegrup pen SU(2) bzw. SO(3). Letztere ist die Gruppe der Drehungen in drei Dimensionen. Die SU(2)-Gruppe ist die Gruppe der zweidimensionalen unitären und unimodularen Ma trizen, d. h. Matrizen mit den Eigenschaften U † = U −1 ,
det(U) = 1 .
Die Gruppenmannigfaltigkeit von SU(2) enthält zwei nicht zusammenhängende SO(3)-Gruppenmannigfaltigkeiten. Die SU(2) ist damit die Einhüllende der SO(3)Gruppe.⁶ Die Operatoren L i , die der Lie-Algebra (15.10) genügen, werden als die Erzeuger der Lie-Algebra bezeichnet. Zu jedem festen l definieren die Matrixelemente der Er zeuger L i in der Basis (15.33) ⟨lm|L i |lm ⟩ eine sogenannte irreduzible Darstellung der Lie-Algebra, wie später noch ausführli cher besprochen wird (siehe Abschnitt 15.4). Für die Erzeuger der SO(3)-Gruppe kann die Drehimpulsquantenzahl l nur ganzzahlige Werte annehmen: l = 0, 1, 2, . . . . Demgegenüber nimmt die Drehimpulsquantenzahl l für die Erzeuger der SU(2)-Gruppe sowohl ganzzahlige als auch halbzahlige Werte an: l = 0,
1 3 , 1, , 2, . . . . 2 2
Es sei nochmals betont, dass die oben gewonnenen Ergebnisse, insbesondere die Ei genwerte, allein eine Konsequenz der Vertauschungsrelationen (15.10) der Drehim pulsoperatoren, d. h. der SU(2)-Algebra, sind und somit sowohl für ganzzahlige als auch für halbzahlige Drehimpulse l gelten. Dabei wurde niemals explizit die Reali sierung der Drehimpulsoperatoren durch Differenzialoperatoren im dreidimensiona len Raum benutzt (siehe Gleichung (15.4)). Wir werden in Abschnitt 15.5 sehen, dass sich durch diese Differenzialoperatoren nur Darstellungen der Drehimpulsalgebra mit ganzzahligem Drehimpuls realisieren lassen.⁷ Für den Drehimpuls, der die Rotationen
6 Die beiden Gruppen sind über die Beziehung SO(3) = SU(2)/Z(2) verknüpft, wobei Z(2) die diskrete Gruppe {1, −1} bezeichnet. 7 Halbzahlige Drehimpulse würden auf Wellenfunktionen führen, die nicht überall im ℝ3 eindeutig definiert sind.
15.3 Geometrische Interpretation des Drehimpulses |
313
in unserem dreidimensionalen Raum erzeugt (oftmals als Bahndrehimpuls bezeich net), scheiden damit die halbzahligen Werte von l und m aus. Halbzahlige Drehim pulse lassen sich nur in einem inneren (abstrakten) Raum, dem Spinraum, realisieren. Dies hatten wir bereits in Kapitel 14 bei der geometrischen Betrachtung der Bewegung auf einem Kreis beobachtet, wo die auf dem Kreis fortschreitende Welle mit Drehim puls ℏ/2 doppelt um die Kreisbahn gewickelt werden musste und dadurch die Wel lenfunktion zweikomponentig gewählt werden musste. Der halbzahlige Drehimpuls ist folglich mit einer Art inneren Rotation verbunden, die als Spin bezeichnet wird.
15.3 Geometrische Interpretation des Drehimpulses Wir haben oben aus den Kommutationsbeziehungen gefolgert, dass der Betrag des Drehimpulses die Eigenwerte |L| = ℏ√l(l + 1) ,
l = 0, 1, 2, . . .
und die z-Komponente des Drehimpulses die Eigenwerte L z = mℏ ,
m = −l, −l + 1, . . . , l − 1, l
annehmen können. Die Kenntnis von l allein sagt noch nichts über die Richtung von L aus. Selbst wenn wir m und l beide kennen, ist die Richtung des Drehimpulses L noch nicht im Raum fixiert, sondern die möglichen Drehimpulsvektoren L spannen den Mantel eines Kegels mit Scheitelpunkt im Ursprung auf (Drehimpulskegel, siehe Abb. 15.1(a)). Zu jedem verschiedenen m-Wert gehört ein anderer Kegel. Bei gegebenem Betrag und z-Komponente des Drehimpulses ist die Projektion des Drehimpulses auf die x- und y-Achse unbestimmt, in Übereinstimmung mit den Kom mutationsbeziehungen, die nur erlauben, den Betrag von L und eine Komponente zu fixieren. Haben wir z. B. den Betrag des Drehimpulses und die z-Komponente gemes sen, so kann das Ergebnis einer nachfolgenden Messung der x- oder y-Richtung des Drehimpulses nicht vorhergesagt werden, da wir keine Information über den Polar winkel des Drehimpulsvektors besitzen. Die Tatsache, dass der Drehimpulsvektor in der Quantenmechanik zu einem gegebenen Eigenwert l von L 2 bezüglich der Quanti sierungsachse (hier z-Achse) (2l + 1) verschiedene Richtungen annehmen kann (siehe Abb. 15.1(b)), wird als Raumquantisierung bezeichnet. Auf den ersten Blick erscheint dieses Ergebnis zu bedeuten, dass der Drehimpuls vektor nur ganz bestimmte Richtungen im Raum annehmen kann. Das wäre ein Wider spruch zur Isotropie des Raumes. Dieses Ergebnis ist umso mehr verwunderlich, als die Wahl unseres Koordinatensystems und damit die Wahl der z-Achse völlig willkür lich waren. Dieses Bild erscheint zunächst paradox; wir müssen hier jedoch beachten, dass ein Eigenwert nur als Ergebnis eines Messprozesses gewonnen werden kann. Je der Messapparat, der eine Drehimpulskomponente misst, muss aber zwangsläufig ei ne Richtung im Raum auszeichnen, sodass letztendlich durch den Messprozess bzw.
314 | 15 Der Drehimpuls
z
3} 2} 1}
L
0
Lz
−1} −2}
Ly
y
−3}
Lx
x Abb. 15.1: Geometrische Interpretation des Drehimpulses. (a) Drehimpulskegel, (b) Raumquantisierung des Drehimpulses für l = 3.
die Messapparatur die Raumquantisierung vorgenommen wird und damit nicht das quantenmechanische System, sondern die Messapparatur die Isotropie zerstört. Ganz gleich welche Orientierung der Messapparat zur Bestimmung der Projektion des Dreh impulses vornimmt, das Messergebnis lautet immer mℏ, wobei m in Einerschritten alle Werte von −l bis +l durchläuft. Führen wir nach einer Messung der z-Komponente des Drehimpulses eine Messung der x- oder y-Komponente durch, so ist das Ergebnis völlig unbestimmt. Die einzige Gewissheit, die wir haben, ist, dass wir wieder einen Eigenwert mℏ erhalten. Die Wahrscheinlichkeit, mit der wir einen der Eigenwerte mℏ messen, ist jedoch nicht willkürlich. So gilt für die Summe der Erwartungswerte von L2x und L2y : ⟨lm|L2x + L2y |lm⟩ = ⟨lm|L 2 − L2z |lm⟩ = ℏ2 [l(l + 1) − m 2 ] . Aus Symmetriegründen muss der Erwartungswert von L2x in einem Eigenzustand von L2 und L z derselbe sein wie der von L2y , siehe Abb. 15.1(a). Damit erhalten wir für den Erwartungswert: ⟨lm|L2x |lm⟩ = ⟨lm|L2y |lm⟩ =
1 2 ℏ [l(l + 1) − m 2 ] . 2
(15.34)
Aus Symmetriegründen ist auch bereits klar, dass der Erwartungswert von L x und L y in einem Eigenzustand von L z verschwinden muss (schließlich rotiert der Dreh impulsvektor um die z-Achse). Dies kann man auch explizit zeigen, wenn man die Drehimpulsoperatoren L x und L y durch die Leiteroperatoren (15.18) ausdrückt: Lx =
1 (L+ + L− ) , 2
Ly =
1 (L+ − L− ) . 2i
(15.35)
15.4 Matrixdarstellung
| 315
Man findet: 1 ⟨lm|L+ + L− |lm⟩ = ∼ ⟨lm|l m+1⟩+ ∼ ⟨lm|l m−1⟩ = 0 , 2 1 ⟨lm|L y |lm⟩ = ⟨lm|L+ − L− |lm⟩ = 0 , 2i ⟨lm|L x |lm⟩ =
wobei die Tilde „∼“ für irrelevante Zahlenfaktoren steht. Für die Unschärfe des Drehimpulses in x- und y-Richtung in einem Eigenzustand |lm⟩ finden wir damit aus (15.34): ℏ √l(l + 1) − m 2 (∆L x )lm = (∆L y )lm = √2 bzw. für deren Produkt: (∆L x )lm (∆L y )lm =
ℏ2 [l(l + 1) − m 2 ] . 2
(15.36)
Die Unschärfe ist maximal, wenn die z-Komponente des Drehimpulses verschwindet (m = 0), während sie minimal wird, wenn L z seinen betragsmäßig maximalen Wert hat (m = ±l). Dies ist auch unmittelbar aus Abb. 15.1 ersichtlich. Gleichung (15.36) ist auch in Übereinstimmung mit der Unschärferelation (11.10): (∆L x )lm (∆L y )lm ≥
1 ℏ ℏ2 |⟨lm|[L x , L y ]|lm⟩| = |⟨lm|L z |lm⟩| = |m| , 2 2 2
da l(l + 1) − m 2 ≥ |m|(|m| + 1) − |m|2 = |m| .
15.4 Matrixdarstellung Wir haben oben die Eigenfunktionen des Drehimpulsoperators aus den Kommu tationsbeziehungen der Drehimpulskomponenten, d. h. aus der Drehimpulsalge bra (15.10), gewonnen, ohne auf die explizite Gestalt der Drehimpulsoperatoren (als Differenzialoperatoren im Ortsraum) zurückzugreifen. Da diese Zustände |lm⟩ Eigen funktionen zu den hermiteschen Operatoren L2 , L z sind, bilden sie ein vollständiges orthogonales System, und mit unserer gewählten Normierung (15.23) gilt deshalb ⟨lm|l m ⟩ = δ ll δ mm . Wir können jetzt die Matrixelemente beliebiger Komponenten des Drehimpulsopera tors in dieser Basis berechnen. Die Gesamtheit dieser Matrixelemente ist äquivalent zum Operator selbst und definiert die Matrixdarstellung des Operators, wie wir bei der Behandlung des Hilbert-Raumes gesehen hatten (siehe Abschnitt 10.2). Im Folgenden wollen wir die Matrixdarstellung der Komponenten des Drehimpulsoperators explizit angeben: (L i )lm,l m := ⟨lm|L i |l m ⟩ .
316 | 15 Der Drehimpuls Da die Zustände |lm⟩ Eigenzustände von L z sind, ist die Matrix dieses Operators dia gonal: ⟨lm|L z |l m ⟩ = δ ll δ mm ℏm . (15.37) Die Matrixelemente der x- und y-Komponente berechnen wir zweckmäßigerweise aus den Matrixelementen der Leiteroperatoren L± . Unter Benutzung der Beziehung (15.29) finden wir für diese: ⟨l m |L± |lm⟩ = δ l l δ m ,m±1 ℏ√l(l + 1) − m(m ± 1) .
(15.38)
Hieraus ergeben sich die Matrixelemente der Operatoren L x und L y aus den Beziehun gen (15.35). Sie sind offenbar ebenfalls diagonal in der Quantenzahl l: ⟨lm|L i |l m ⟩ = δ ll ⟨lm|L i |lm ⟩ .
(15.39)
Die Matrizen der Drehimpulskomponenten sind deshalb blockdiagonal. Zu jedem Drehimpuls l gehört ein Block auf der Hauptdiagonalen der Matrix. Ordnen wir diese Blöcke nach wachsendem Drehimpuls l, so hat die Matrix die Gestalt (0)
(L i )lm,l m
0
Li 0 =( 0 .. .
(1/2) Li
0 .. .
0 0 (1) Li
... ... ..
) .
(15.40)
.
(l)
Jeder dieser Blöcke L i ist eine (2l + 1)-dimensionale Matrix bezüglich der magneti schen Quantenzahl m: (l) (L i ) := ⟨lm|L i |lm ⟩ . mm
Diese Blockmatrizen ordnen wir nach fallenden magnetischen Quantenzahlen an: (l)
(L i ) (l)
(l)
Li
(l)
l,l
(L ) ( i l−1,l =( .. . (l)
(
(L i )
−l,l
(L i ) (l)
(L i )
l,l−1
l−1,l−1
.. .
...
−l,l−1
(l)
(L i ) (l)
(L i )
l,−l
l−1,−l )
) .
.
.. .
...
(L i )
..
(l)
(L i )
...
(15.41)
(l)
−l,−l
)
(l)
Die Blockmatrizen L i sind die irreduziblen Darstellungen⁸ der Generatoren der Dreh gruppe SU(2). Im Folgenden wollen wir die irreduziblen Darstellungen für die unters ten Drehimpulse explizit angeben.
8 „Irreduzibel“ bedeutet hier, dass es in dem durch die (2l + 1) Zustände |lm⟩ aufgespannten Vek torraum keinen Unterraum gibt, der unter der Wirkung der Drehimpulsoperatoren L i invariant bleibt, siehe Anhang E, Band 2
15.4 Matrixdarstellung
| 317
Für l = 0 ist die Matrix (15.41) eindimensional und verschwindet offenbar, siehe Gleichungen (15.37), (15.38): (0)
Li
=0.
Interessanter ist der Fall l = 1/2. Die Matrix von L z ist (wie für alle l) diagonal in der Basis |lm⟩ und nach (15.37) durch (1/2)
Lz
=
ℏ 1 ( 2 0
0 ) −1
(15.42)
gegeben. Aus Gleichung (15.38) finden wir für die Matrizen von L+ , L− : (1/2)
L+
0 0
1 ) , 0
L−
ℏ 0 ( 2 1
1 ) , 0
Ly
= ℏ(
(1/2)
= ℏ(
(1/2)
=
0 1
0 ) . 0
Hieraus erhalten wir mit (15.35): (1/2)
Lx
=
ℏ 0 ( 2 i
−i ) . 0
(15.43)
Zweckmäßigerweise definieren wir: (1/2)
Li
=
ℏ σi , 2
wobei die σ i die Pauli-Matrizen sind, die nach Gleichungen (15.42) und (15.43) durch 0 σx = ( 1
1 ) , 0
0 σy = ( i
−i ) , 0
σz = (
1 0
0 ) −1
(15.44)
gegeben sind. Aus den Kommutationsbeziehungen für die Drehimpulskomponenten folgt, dass sie den Vertauschungsregeln [σ i , σ j ] = 2iϵ ijk σ k genügen. Außerdem erfüllen sie die Antikommutationsbeziehungen {σ i , σ j } = 2δ ij . Die Pauli-Matrizen sind offenbar (bis auf einen Faktor ℏ/2) die Realisierung der Dreh impulsoperatoren für ein Teilchen mit Spin 1/2.
318 | 15 Der Drehimpuls
Zusammen mit der zweidimensionalen Einheitsmatrix σ0 = (
1 0
0 ) 1
bilden die Pauli-Matrizen eine vollständige Basis für die zweidimensionalen hermiteschen Matrizen, was sich in der Vollständigkeitsrelation 3
∑ (σ i )ab (σ i )cd = 2δ ad δ bc i=0
äußert. Wegen (σ 0 )ab = δ ab erhalten wir hieraus für die Pauli-Matrizen: 3
∑ (σ i )ab (σ i )cd = 2δ ad δ bc − δ ab δ cd .
(15.45)
i=1
In analoger Weise berechnet man aus Gleichungen (15.37) und (15.38) die Matrixdar stellungen der Drehimpulsoperatoren für höhere Drehimpulse l > 1/2. Für l = 1 findet man: (1)
Lx =
0 ℏ (1 √2 0
1 0 1
0 1) , 0
(1)
Ly =
0 ℏ (i √2 0
1 2 (L (1) ) = 2ℏ2 (0 0
−i 0 i 0 1 0
0 −i) , 0
1 (1) L z = ℏ (0 0
0 0 0
0 0) , −1
0 0) . 1
(15.46) Man beachte, dass in der verwendeten Basis der Drehimpulseigenzustände |lm⟩ die Matrixdarstellung von L z nach Gleichung (15.37) stets diagonal ist, siehe Gleichun gen (15.44) und (15.46). Wir empfehlen dem Leser als Übungsaufgabe, die Matrixdarstellung einiger Dreh impulsoperatoren mit l > 1 zu berechnen.
15.5 Die Eigenfunktionen des Drehimpulses im Ortsraum Die bisherigen Untersuchungen des Eigenwertproblems für den Drehimpuls basier ten allein auf den Vertauschungsrelationen der Komponenten des Drehimpulsopera tors, d. h. auf der Lie-Algebra (15.10). Dabei brauchten wir die Eigenfunktionen des Drehimpulsoperators L 2 , L z niemals explizit zu berechnen. Die Eigenwerte waren al lein durch die Algebra bestimmt. Auch die Matrixelemente der Drehimpulsoperatoren konnten wir allein mithilfe der Lie-Algebra berechnen. Wir wollen jetzt die Eigenfunk tionen des Drehimpulsoperators im Ortsraum explizit konstruieren. Wir werden dabei finden, dass für die Bewegung eines Teilchens im Ortsraum nur ganzzahlige Drehim pulsquantenzahlen realisiert sind.
15.5 Die Eigenfunktionen des Drehimpulses im Ortsraum
| 319
15.5.1 Der Drehimpulsoperator in Kugelkoordinaten Zur Konstruktion der Wellenfunktionen benutzen wir die der Drehbewegung ange passten Kugelkoordinaten (auch sphärische Koordinaten oder dreidimensionale Polar koordinaten genannt) (Abb. 15.2), x = r sin ϑ cos φ , y = r sin ϑ sin φ ,
(15.47)
z = r cos ϑ , die auf die Wertebereiche 0≤r 0
(16.52)
0
die Euler’sche Gammafunktion ist, welche für ganzzahlige Argumente z = n > 0 durch Γ(n) = (n − 1)!
(16.53)
gegeben ist. Die Radialfunktionen (16.49) lassen sich durch die zugeordneten Legendre-Funk tionen L αn (t) ausdrücken, die die Potenzentwicklung besitzen n
L αn (t) = ∑ a l (α)t l l=0
mit a l (α) =
(n + α)! (−1)l . l! (n − l)!(l + α)!
Vergleich mit (16.50) zeigt den Zusammenhang c2l a l (α = |m|) , = a0 (α = |m|) c0
(16.54)
16.5 Der zweidimensionale rotationssymmetrische Oszillator
| 351
sodass wir für die Radialfunktion den Ausdruck u |m|,n (x) =
1 1 2 |m| c0 x|m|+ 2 e− 2 x L n (x2 ) a0 (|m|)
(16.55)
erhalten, wobei nach (16.54) a0 (|m|) =
(n + |m|)! n + |m| =( ) n!|m|! n
und c0 in (16.51) definiert ist. Da m ganzzahlig ist, haben wir c0 = [πρ 0 |m|!]−1/2 , wobei ρ 0 die Oszillatorlänge (16.27) ist. Für die Radialwellenfunktion (16.55) finden wir damit u n,|m|(x) = √
1 |m|! n! 2 |m| x|m|+ 2 e−x /2 L n (x2 ) . πρ 0 (n + |m|)!
(16.56)
Aus (16.48) erhalten wir für die quantisierten Energien des zweidimensionalen har monischen Oszillators (siehe Gleichung (16.37)): E|m|,n = ℏω(|m| + 2n + 1) .
(16.57)
Diese Energieeigenwerte bestehen aus drei Anteilen: – Grundzustandsenergie (Nullpunktsenergie) E0,0 = ℏω, – Energie der Rotationsanregung E|m|,n=0 = |m|ℏω, – Energie der radialen Schwingungen E|m|=0,n = 2nℏω. Vergleich von (16.57) mit dem früher gewonnenen Ausdruck (16.33) für die Energieei genwerte offenbart den Zusammenhang der Quantenzahlen n+ + n− = |m| + 2n .
(16.58)
Zusammen mit (16.34) finden wir daher folgende Beziehungen zwischen den Quan tenzahlen n± und n, m: i)
m>0
n+ = n + |m| ,
n− = n
ii)
m
1 2
abklingen muss. Außerdem muss, falls V(r) keine δ-förmige Singularität am Ursprung besitzt, die radiale Wellenfunktion am Ursprung verschwinden, u l (r = 0) = 0 , da sonst wegen (siehe Gleichungen (C.22), (C.29)) 1 (∆ ) u l (0) = −4πδ(x)u l (0) r
(17.14)
sich die Schrödinger-Gleichung (17.13) nicht erfüllen ließe. (Der singuläre Term (17.14) könnte durch keinen anderen Term kompensiert werden!)
17.3 Bindungszustände: Grenzverhalten der Radialfunktion Für die eindimensionale Schrödinger-Gleichung hatten wir allgemeine Aussagen über die Existenz von gebundenen Zuständen angeben können, ohne dabei auf die detail lierte Form des Potenzials zurückgreifen zu müssen. Die Existenz von gebundenen Zu ständen setzte jedoch eine ausreichende anziehende Stärke des Potenzials voraus. Da sich für ein radialsymmetrisches Potenzial die Schrödinger-Gleichung ebenfalls auf eine eindimensionale Schrödinger-Gleichung im Radius r reduziert, lassen sich die im eindimensionalen Fall gewonnenen Ergebnisse auf den dreidimensionalen Fall sofort übertragen.
358 | 17 Kugelsymmetrische Potentiale Die radiale Bewegung ist per Definition von r auf das Gebiet r > 0 beschränkt. Da außerdem u l (r = 0) = 0, können wir die Einschränkung der eindimensionalen Bewegung auf das Gebiet x = r > 0 durch eine unendlich hohe Potenzialwand bei x = 0 erreichen. (An der unendlich hohen Potenzialwand muss die Wellenfunkti on verschwinden, siehe Abschnitt 6.1). Damit ist die radiale Schrödinger-Gleichung ̃l (r) äquivalent zu einer eindimensionalen Schrödin mit dem effektiven Potenzial V ger-Gleichung in der Variablen x mit dem Potenzial ̃l (r = x) , {V V l (x) = { ∞, {
x>0 x≤0
.
(17.15)
Da die Radialfunktion u l (x) bei x = 0 einen Knoten besitzt, folgt aus Symmetriegrün den, dass der Grundzustand dieses Potenzials gerade durch den ersten angeregten Zustand des spiegelsymmetrischen Potenzials ̃l (|x|) V l (x) := V ̃l (r) muss deshalb eine Mindeststärke aufweisen, damit gegeben ist. Das Potenzial V das Potenzial V l (x) einen angeregten (gebundenen) Zustand besitzt und somit ein ̃l (r) existiert. Falls das Potenzial V(r) Bindungszustand im ursprünglichen Potenzial V keinen gebundenen Zustand mit l = 0 besitzt, so hat es erst recht keine gebundenen Zustände für nicht verschwindende Drehimpulse, da das Zentrifugalpotenzial V l (r) (17.11) abstoßend ist. Bei den praktischen Anwendungen haben wir es oft mit Potenzialen zu tun, die nicht stärker singulär sind als: a |V(r)| ≤ β , r → 0 , r mit β < 2. Für kleine r dominiert dann in der Radialgleichung das Zentrifugalpotenzial V l (r) (17.11) über dem eigentlichen Potenzial V(r) und dem konstanten Eigenwert E l . Für r → 0 reduziert sich damit die Radialgleichung (17.13) auf: d2 l(l + 1) u l (r) = u l (r) , dr2 r2
r→0.
(17.16)
Dies ist eine Euler’sche Differenzialgleichung, welche sich durch den Potenzansatz u l (r) = Cr α
(17.17)
lösen lässt. Einsetzen dieses Ansatzes in die Differenzialgleichung liefert die beiden Lösungen α = −l , α = l + 1 . (17.18) Wie wir oben gesehen haben, muss die Radialfunktion u l (r) für r → 0 regulär sein. Deshalb ist ihre asymptotische Form für r → 0 durch u l (r) ∼ r l+1 ,
r→0
(17.19)
17.4 Radialwellenfunktion des freien Teilchens | 359
gegeben. Diese Abhängigkeit zeigt, dass die Wahrscheinlichkeitsdichte in der Tat am Ursprung für l > 0 verschwindet, wie wir bereits oben qualitativ aus der Form des Zentrifugalpotenzials geschlossen hatten. Die meisten interessierenden Potenziale wie z. B. das Coulomb-Potenzial oder das Kernpotenzial der Nukleonen gehen für r → ∞ asymptotisch gegen einen konstanten Wert, den wir willkürlich null setzen können. Für r → ∞ können wir deshalb das effektive Potenzial in der radialen Schrödinger-Gleichung vernachlässigen und erhal ten: d2 2mE l u l (r) = − 2 u l (r) , r → ∞ . dr2 ℏ Für gebundene Zustände ist E l < 0, sodass −
2mE l =: κ 2 > 0 ℏ2
gilt und die obige Differenzialgleichung die Lösung u l (r) = Ae−κr + Be κr ,
r→∞
(17.20)
hat. Wegen der geforderten Normierbarkeit kann nur die exponentiell abfallende Funktion auf gebundene Zustände führen, was B = 0 impliziert. Für Potenziale, die asymptotisch für r → ∞ nicht verschwinden oder sogar über alle Grenzen wachsen, wie das des harmonischen Oszillators, müssen die Wellenfunk tionen der gebundenen Zustände für r → ∞ offenbar noch stärker als e −κr abfallen. Das asymptotische Verhalten der Radialfunktion u l (r) für r → 0 und r → ∞ ist damit unabhängig von den Details des Potenzials V(r). Diese bestimmen jedoch die Wellenfunktion bei endlichem r und damit die Energieeigenwerte.
17.4 Radialwellenfunktion des freien Teilchens Für ein freies Teilchen, d. h. für verschwindendes Potenzial V(r), reduziert sich der Hamilton-Operator auf die kinetische Energie:
H=
1 L2 (p2r + 2 ) 2m r
Wir kennen die Lösung des freien Teilchens bereits in kartesischen Koordinaten, in welchen die Wellenfunktionen durch ebene Wellen bzw. Superpositionen von ebe nen Wellen (Wellenpaketen) gegeben sind. Diese ebenen Wellen besitzen jedoch keine sphärische Symmetrie. Im Folgenden interessieren wir uns für Lösungen der Schrö dinger-Gleichung H|φ lm ⟩ = E|φ lm ⟩
360 | 17 Kugelsymmetrische Potentiale
für das freie Teilchen, in denen die sphärische Symmetrie manifest ist. Zunächst ist klar, dass alle allgemeinen Aussagen, die wir oben über die Lösungen der Schrödin ger-Gleichung in einem zentralsymmetrischen Potenzial gewonnen haben, gültig blei ben, wenn das Potenzial verschwindet. Aus diesem Grunde können wir auch für das freie Teilchen den bereits früher eingeführten Separationsansatz (17.12) φ lm (r, ϑ, φ) = R l (r)Y lm (ϑ, φ) ,
R l (r) =
u l (r) r
benutzen. Die bereits früher angegebene Radialgleichung (17.13) reduziert sich dann für verschwindendes Potenzial auf:
bzw.
ℏ l(l + 1) d2 ] u l (r) = E l u l (r) [− 2 + 2m dr r2
(17.21)
ℏ2 l(l + 1) 1 d2 r+ ] R l (r) = E l R l (r) . [− 2m r dr2 r2
(17.22)
Für ein freies Teilchen ist die Energie im Wesentlichen durch den Betrag des Impulses gegeben. Zur Charakterisierung der Energie führen wir deshalb wieder eine Wellen zahl k ein: ℏ2 k 2 El = 2m Dividieren wir die Radialgleichung (17.22) durch ℏ2 /2m und führen außerdem die di mensionslose Variable x = kr ein und setzen x R l ( ) = f l (x) , k so nimmt diese die Gestalt [
d2 2 d l(l + 1) + ] f l (x) = 0 +1− 2 x dx dx x2
(17.23)
an. Dies ist die sphärische Bessel’sche Differenzialgleichung, deren Lösungen durch die sphärischen Bessel-Funktionen j l (x) bzw. durch die sphärischen Neumann-Funktionen n l (x) gegeben sind, die wir jetzt explizit bestimmen wollen.
17.4.1 Die sphärischen Bessel-Funktionen Die Radialgleichung (17.21) für die Funktion u l (r) ist offenbar einfacher als die Glei chung (17.22) für die Funktion R l (r) = u l (r)/r. Dasselbe gilt natürlich auch für die Bes sel’sche Differenzialgleichung (17.23), die sich mit dem Ansatz f l (x) =
v l (x) x
(17.24)
17.4 Radialwellenfunktion des freien Teilchens | 361
auf [
l(l + 1) d2 +1− ] v l (x) = 0 dx2 x2
(17.25)
reduziert. Für l = 0 vereinfacht sich diese Gleichung zu v 0 (x) = −v 0 (x) ,
(17.26)
deren beiden Fundamentallösungen als (1)
(2)
v0 = sin x ,
v0 = − cos x
(17.27)
gewählt werden können. Damit kennen wir die beiden Fundamentallösungen der Bes sel’schen Differenzialgleichung für l = 0: (1)
f0 (x) =
sin x , x
(2)
f0 (x) = −
cos x . x
(17.28)
Zur Bestimmung der Lösungen mit l > 0 setzen wir f l (x) = x l g l (x)
(17.29)
in die Bessel’sche Differenzialgleichung (17.23) ein, womit diese sich auf [
l+1 d d2 +2 + 1] g l (x) = 0 x dx dx2
(17.30)
reduziert. Differenziation dieser Gleichung nach x liefert [
d3 l + 1 d2 l+1 d + 2 + (1 − 2 2 ) ] g l (x) = 0 . x dx2 dx dx3 x
Setzen wir hier
d g l (x) = xh l (x) , dx so reduziert sich diese Gleichung auf [
l+2 d d2 +2 + 1] h l (x) = 0 . x dx dx2
Vergleich dieser Gleichung mit (17.30) zeigt den linearen Zusammenhang h l (x) ∼ g l+1 (x) . Mit (17.31) finden wir hieraus die Beziehung g l+1 (x) ∼ die sich zu g l (x) ∼ (
1 d g l (x) , x dx
1 d l ) g0 (x) x dx
(17.31)
362 | 17 Kugelsymmetrische Potentiale
iterieren lässt. Mit (17.29) finden wir daher für die Lösungen der Bessel’schen Differen zialgleichung die Beziehung f l (x) ∼ x l (
1 d l ) f0 (x) . x dx
Setzen wir hier für f0 (x) die beiden Fundamentallösungen (17.28) ein, so erhalten wir für beliebige l zwei Fundamentallösungen der Bessel’schen Differenzialgleichungen, die wir in der Form j l (x) = (−x)l (
1 d l sin x ) , x dx x
n l (x) = −(−x)l (
1 d l cos x ) , x dx x
(17.32)
wählen können und die als sphärische Bessel-Funktionen j l (x) bzw. sphärische Neu mann-Funktionen n l (x) bezeichnet werden. Diese Funktionen bilden ein vollständiges System für Funktionen der Radialkoordinate, siehe Gleichungen (17.44), (17.53). Offen bar besitzen sie die Symmetrie: j l (−x) = (−1)l j l (x), n l (−x) = −(−1)l n l (x) . Für die untersten Drehimpulse l = 0, 1, 2 lauten diese Funktionen explizit: sin x , x sin x cos x , j1 (x) = 2 − x x 3 1 3 j2 (x) = ( 3 − ) sin x − 2 cos x, x x x j0 (x) =
cos x x cos x sin x n1 (x) = − 2 − x x 3 1 3 n2 (x) = − ( 3 − ) cos x − 2 sin x . x x x
n0 (x) = −
(17.33) Sie sind in Abb. 17.2 dargestellt. Im Folgenden sollen einige Eigenschaften dieser Funk tionen angegeben werden. Wir beginnen mit dem asymptotischen Verhalten dieser Funktionen für kleine und große Argumente. Das qualitative asymptotische Verhalten der Lösungen der sphärischen Bes sel’schen Differenzialgleichung lässt sich mit (17.24) unmittelbar aus (17.25) ablesen, wenn man beachtet, dass für x → 0 die 1 und für x → ∞ der Zentrifugalterm l(l+1)/x2 vernachlässigbar sind. Für x → 0 reduziert sich Gleichung (17.25) auf die Euler’sche Differenzialgleichung (17.16), deren Fundamentallösungen wir bereits kennen, siehe Gleichungen (17.17), (17.18). Mit (17.24) finden wir deshalb für die Lösungen der sphä rischen Bessel’schen Differenzialgleichung das folgende asymptotische Verhalten für x → 0: (1) (2) f l (x) ∼ x l , f l (x) ∼ x−(l+1) . (17.34)
17.4 Radialwellenfunktion des freien Teilchens |
0.4
1 j0 (x) j1 (x) j2 (x)
0.8 0.6
0.2 0
0.4
−0.2
0.2
−0.4
0
−0.6
−0.2
−0.8
(a)
363
0
2
4
6
8
10
12
14
(b)
n0(x) n1(x) n2(x) 0
2
4
6
8
10
12
14
Abb. 17.2: (a) Die sphärischen Bessel-Funktionen j l (x) und (b) die sphärischen Neumann-Funktionen n l (x) für die Indizes (Drehimpulsquantenzahlen) l = 0, 1, 2.
Für x → ∞ wird die Differenzialgleichung (17.25) unabhängig von l und reduziert sich auf die Gleichung (17.26) für l = 0, deren Fundamentallösungen in (17.27) gegeben sind: Folglich erhalten wir für x → ∞ das asymptotische Verhalten (1)
f l (c) ∼
sin(x + const.) , x
(2)
f l (x) ∼
cos(x + const) . x
(17.35)
Die sphärischen Bessel- bzw. Neumann-Funktionen (17.32) besitzen das asymptotische Verhalten (17.34) und (17.35) der Funktionen f (1) (x) bzw. f (2) (x), wie wir nachfolgend explizit zeigen werden. Dabei werden wir gleichzeitig die in Gleichungen (17.34), (17.35) noch offenen Konstanten bestimmen.² Für x → ∞ brauchen wir in der Darstellung (17.32) nur die Ableitungen der Win kelfunktionen zu berücksichtigen. Wegen d π sin x = cos x = − sin (x − ) dx 2 finden wir
sin (x − l 2 ) 1 d l sin x . ) → (−1)l x→∞ x dx x x l+1 π
( Analog folgt wegen
π d cos x = − sin x = − cos (x − ) dx 2 die asymptotische Beziehung (
cos (x − l 2π ) 1 d l cos x . ) → (−1)l x→∞ x dx x x l+1
2 Wir erinnern in diesem Zusammenhang daran, dass die Lösungen der homogenen Differenzialglei chung (17.23) nur bis auf eine reelle multiplikative Konstante bestimmt sind. (Jede Linearkombination von Lösungen ist wieder eine Lösung.) Die sphärischen Bessel- und Neumann-Funktionen (17.32) sind spezielle Fundamentallösungen mit fixierten Normierungskonstanten.
364 | 17 Kugelsymmetrische Potentiale Damit finden wir aus (17.32) das asymptotische Verhalten für x → ∞ j l (x) ≃
π 1 sin (x − l ) , x 2
n l (x) ≃ −
π 1 cos (x − l ) . x 2
(17.36)
Um das Verhalten von j l (x) und η l (x) für kleine x zu bestimmen, setzen wir die Rei henentwicklungen der Sinus- bzw. Kosinusfunktionen ∞ sin x x2n = ∑ (−1)n x (2n + 1)! n=0
(17.37)
∞ x2n−1 cos x = ∑ (−1)n x (2n)! n=0
in Gleichung (17.32) ein. Mit (
1 d l−1 1 d l 2n ) x =( ) 2n x2(n−1) x dx x dx {2l n! x2(n−l) , = { (n−l)! 0, {
finden wir (
n≥l n 0 gilt (
1 d l−1 1 d l 2n−1 ) x ) (2n − 1)x2n−3 =( x dx x dx = (2n − 1)(2n − 3) . . . (2(n − l) + 1) x2(n−l)−1 .
(17.40)
17.4 Radialwellenfunktion des freien Teilchens |
365
Für n ≤ l führt dieser Ausdruck auf negative Potenzen von x und bricht nicht wie im Fall der geraden Potenzen (17.38) ab. Mit (17.40) finden wir aus (17.37) (
∞ (−1)n 1 d l cos x ) = ∑ (2n − 1)(2n − 3) . . . (2(n − l) + 1)x 2(n−l)−1 , x dx x (2n)! n=0
wobei für x → 0 der Term mit n = 0 dominiert: (
1 d l cos x ) → (−)l (2l − 1)!!x−(2l+1) . x→0 x dx x
(17.41)
Mit (17.39) und (17.41) erhalten wir aus (17.32) die asymptotische Darstellung für x → 0:
j l (x) ≃
xl , (2l + 1)!!
n l (x) ≃ −
(2l − 1)!! , x l+1
(17.42)
wobei der Ausdruck für n l (x) nur für l > 0 gilt. Für l = 0 und x → 0 folgt unmittelbar aus (17.32) n0 (x) ≃ −1/x. Wir erkennen, dass die sphärischen Bessel-Funktionen j l (x) regulär am Ursprung sind und dort wie x l verschwinden, während die sphärischen Neumann-Funktionen n l (x) für x → 0 singulär sind. Das Verhalten der sphärischen Bessel-Funktionen für x = 0 stimmt also genau mit dem oben gefundenen Verhalten der Radialfunktion u l (r)/r (17.19) überein.³ Für die Wellenfunktionen des freien Teil chens finden wir dann offenbar die Darstellung ⟨x|klm⟩ ≡ φ klm (r, ϑ, φ) = Cj l (kr)Y lm (ϑ, φ) .
(17.43)
Nachfolgend geben wir noch einige gemeinsame Eigenschaften der sphärischen Bes sel- und Neumann-Funktionen an, die wir im Folgenden kollektiv als f l (x) bezeichnen, d. h. f l (x) ∈ {j l (x), n l (x)} . Die Funktionen besitzen die Rekursionsbeziehung f l−1 (x) + f l+1 (x) = (2l + 1)
f l (x) . x
Ferner lässt sich die Ableitung durch die Funktionen mit benachbartem Index ausdrü cken: d lf l−1 (x) − (l + 1)f l+1 (x) = (2l + 1) f l (x) . dx
3 Dies ist natürlich nicht verwunderlich, da (17.19) unter der Voraussetzung abgeleitet wurde, dass für r → 0 das Radialpotenzial V(r) weniger singulär als das Zentrifugalpotenzial V l (r) und somit vernachlässigbar ist.
366 | 17 Kugelsymmetrische Potentiale
Die sphärischen Bessel- und Neumann-Funktionen besitzen das erzeugende Funktio nal ∞ l s 1 cos √x2 − 2xs = ∑ j l−1 (x) , x l! l=0 ∞ l s 1 sin √x2 − 2xs = ∑ n l−1 (x) , x l! l=0
wobei j−1 (x) =
cos x , x
n−1 (x) =
sin x x
definiert wurde. Da die sphärischen Neumann-Funktionen für kleine x divergent sind, lassen sie sich mit Ausnahme der Neumann-Funktion für den Index l = 0 nicht bezüglich des radialen Integrationsmaßes normieren. Für die sphärischen Bessel-Funktionen haben wir hingegen die Orthogonalitätsbeziehung: ∞
∫ dr r2 j l (kr)j l (k r) = 0
π δ(k − k ) . 2k 2
(17.44)
Die sphärischen Bessel- und Neumann-Funktionen lassen sich zu den komplexen Hankel-Funktionen erster und zweiter Art zusammenfassen: (±)
h l (x) = j l (x) ± in l (x) Die explizite Form der ersten drei Hankel-Funktionen erster Art erhalten wir aus den Darstellungen der Bessel- und Neumann-Funktionen: e ix , ix ix i e (+) (1 + ) , h1 (x) = − x x ix e 3i 3 (+) h2 (x) = i (1 + − 2) . x x x (+)
h0 (x) =
Diese Funktionen besitzen dann nach (17.36) offenbar für x → ∞ das asymptotische Verhalten e±i(x−lπ/2) (±) h l (x) ≃ . (17.45) ±ix (±)
Die j l (x), n l (x) und h l (x) sind die sphärischen Analoga der Funktionen sin x, cos x und e±ix über eine Raumdimension ℝ.
17.4 Radialwellenfunktion des freien Teilchens |
367
Die sphärischen Bessel- und Neumann-Funktionen stehen in direktem Zusam menhang mit den in Abschnitt 16.3 behandelten gewöhnlichen Bessel- und NeumannFunktionen J l (x), N l (x), j l (x) = √
π J l+1/2 (x) , 2x
n l (x) = √
π N l+1/2 (x) , 2x
wovon man sich leicht durch Einsetzen dieser Beziehungen in die sphärische Bes sel’sche Differenzialgleichung (17.23) bzw. (17.25) überzeugt, die dann zur gewöhnli chen Bessel’schen Differenzialgleichung (16.13) für die J ν (x) bzw. N ν (x) wird.
17.4.2 Entwicklung der ebenen Wellen nach Kugelfunktionen In Gleichung (17.43) haben wir die Wellenfunktion des freien Teilchens in sphärischen Koordinaten gefunden. Andererseits wissen wir, dass für das freie Teilchen die Lösun gen der stationären Schrödinger-Gleichung durch ebene Wellen φ k (x) ∼ e±ik⋅x gegeben sind. Diese besitzen jedoch eine ausgezeichnete Richtung k. Da beide Arten von Lösungen eine vollständige Basis darstellen, muss es deshalb einen linearen Zu sammenhang zwischen den ebenen Wellen und den sphärischen Lösungen geben: ∞
l
e ik⋅x = ∑ ∑ C lm (k)j l (kr)Y lm (x)̂ .
(17.46)
l=0 m=−l
Wir werden jetzt zeigen, dass die Entwicklungskoeffizienten durch ∗ (k)̂ C lm (k) = 4πi l Y lm
gegeben sind. Der Einfachheit halber legen wir den Vektor k zunächst parallel zur z-Achse, sodass k ⋅ x = kr cos ϑ
(17.47)
und ϑ der Polarwinkel von x sind. Die linke Seite der Gleichung (17.46) ist dann unabhängig vom Azi mutwinkel φ. Dasselbe muss für die rechte Seite gelten. Daher können nur die Kugelfunktionen mit m = 0 beitragen, die nach Gleichung (15.71) durch die Legendre-Polynome gegeben sind, und wir erhalten ∞
e ikr cos ϑ = ∑ C lm=0 (ke z )j l (kr)Y l0 (ϑ, φ) l=0
=
1 ∞ ∑ √(2l + 1)C lm=0 (ke z )j l (kr)P l (cos ϑ) . √4π l=0
(17.48)
Multiplikation dieser Beziehung mit einem Legendre-Polynom und Benutzung der Orthogonalitätsre lation 1
∫ dzP l (z)P l (z) = −1
2δ ll 2l + 1
368 | 17 Kugelsymmetrische Potentiale
liefert 1
C lm=0 (ke z )j l (kr) =
1 √4π(2l + 1) ∫ dzP l (z)e ikrz . 2
(17.49)
−1
Da die C lm (k) unabhängig von r sind, genügt es, diese Gleichung für kleine r zu betrachten. Für kr → 0 können wir die asymptotische Form (17.42) der sphärischen Bessel-Funktion benutzen und ferner exp(ikrz) in eine Taylor-Reihe entwickeln: 1
1
∞
∫ dze ikrz P l (z) = ∑ n=0
−1
(ikr)n ∫ dzz n P l (z) . n! −1
(kr)n
Da die Potenzen zu verschiedenen n linear unabhängige Funktionen sind, kann von der TaylorEntwicklung für kr → 0 wegen j l (kr) ∼ (kr)l nur der Term mit n = l zur Gleichung (17.49) beitragen, und wir erhalten 1
C lm=0 (ke z )
1 il 1 ∫ dzz l P l (z) . = √4π(2l + 1) (2l + 1)!! 2 l!
(17.50)
−1
Da die P l (z) gewöhnliche Polynome (vom Grade l) sind, lässt sich das verbleibende Integral elementar berechnen, z. B. durch Benutzung der Darstellung k
P l (z) = ∑ (−1)n n=0
(2l − 2n)!z l−2n (l − n)!(l − 2n)!n!2l
mit {l/2 , k={ (l − 1)/2 , {
Man findet
l − gerade l − ungerade
1
∫ dzz l P l (z) = 2 −1
.
l! . (2l + 1)!!
Damit erhalten wir aus (17.50) C lm=0 (ke z ) = i l √4π(2l + 1)
(17.51)
und nach Einsetzen in (17.48) ∞
e ikr cos ϑ = ∑ i l (2l + 1)j l (kr)P l (cos ϑ) .
(17.52)
l=0
Mit (17.51) finden wir aus (17.49) als Nebenprodukt die Integraldarstellung der sphärischen BesselFunktion 1
j l (x) = (−i)l
1 ∫ dze ixz P l (z) . 2 −1
Für eine beliebige Richtung von k bleibt (17.47) und somit (17.52) gültig, wenn wir ϑ mit dem Winkel zwischen k und x identifizieren. Unter Benutzung des Additionstheorems für die Kugelfunktionen, P l (cos ϑ) =
l 4π ∗ ̂ lm ( x)̂ , ∑ Y lm ( k)Y 2l + 1 m=−l
erhalten wir schließlich aus (17.52) die gewünschte Beziehung:
∞
l
l=0
m=−l
∗ ̂ lm (x)̂ . e ikx = 4π ∑ i l j l (kr) ∑ Y lm (k)Y
17.4 Radialwellenfunktion des freien Teilchens | 369
Mithilfe von dieser Beziehung findet man aus der Fourier-Darstellung der δ-Funktion nach Integration über die Richtung k̂ von k unter Benutzung der Orthogonalitätsrela tion (15.67) die Vollständigkeitsrelation ∞
2 ∞ l ∗ δ(x − x ) = ∑ ∑ Y lm (x̂ )Y lm (x)̂ ∫ dk k 2 j l (kr)j l (kr ) . π l=0 m=−l
(17.53)
0
Benutzen wir hier die Vollständigkeitsrelation (15.67) der Kugelfunktionen und die Orthogonalitätsbeziehung (17.44) der sphärischen Bessel-Funktionen, so erhalten wir die Darstellung der δ-Funktion in Kugelkoordinaten: δ(x − x ) =
δ(r − r ) δ(ϑ − ϑ ) δ(φ − φ ) . sin ϑ r2
(17.54)
17.4.3 Kugelwellen Im Folgenden wollen wir etwas genauer die Zustände mit Drehimpuls l = 0 untersu chen. Für l = 0 ist die Winkelfunktion eine Konstante (Y00 (ϑ, φ) = 1/√4π). Bis auf Normierung ist deshalb die Wellenfunktion des freien Teilchens mit Drehimpuls null allein durch die Bessel-Funktion j0 gegeben: φ k00 (r, ϑ, φ) = C j0 (kr) = C
sin(kr) 1 e ikr e−ikr = C − ( ) . kr 2ki r r
Diese Funktion stellt gerade eine Überlagerung einer auslaufenden und einer einfal lenden Kugelwelle dar: (±)
φ k (r) =
e±ikr . r
Berechnen wir den Teilchenfluss in dem Zustand dieser Kugelwellen, so finden wir in der Tat: ∗ ∗ 1 (±) (±) (±) (±) [(φ k (r)) pφ k (r) − φ k (r)p (φ k (r)) ] 2m ∗ ℏ (±) (±) = Im {(φ k (r)) ∇φ k } m ℏk x̂ x̂ =± = ±v 2 , 2 m r r
j(±) (x) =
wobei v=
(17.55)
p ℏk = m m (±)
die Geschwindigkeit des durch die Kugelwelle φ k (r) beschriebenen Teilchens ist.
370 | 17 Kugelsymmetrische Potentiale
Der Fluss ist durch die Geschwindigkeit gegeben und zeigt in radiale Richtung, wie erwartet, für die auslaufende Welle nach außen, für die einlaufende Welle nach innen. Die Bessel-Funktion j0 (kr), die durch Überlagerung der einlaufenden und aus laufenden Welle entsteht, beschreibt dann eine stehende Kugelwelle, in der kein Teil chenfluss erfolgt: j = j (+) + j (−) = 0 . Ferner zeigt Gleichung (17.55), dass die Stromdichte j (±) (r) mit 1/r2 abfällt. Der zuge hörige Gesamtteilchenstrom durch eine Kugelschale S2 (R) mit Radius R, I (±) = ∫ df x ⋅ j (±) (x = R x)̂ ,
(17.56)
S2 (R)
ist dann unabhängig vom Radius R der Kugel. In der Tat, mit df x = R2 x̂ dΩ (dΩ – Differenzial des Raumwinkels) liefert Einsetzen von (17.55) in Gleichung (17.56): I (±) = ∫ dΩ R2 x̂ ⋅ j (±) (x = R x)̂ = ± ∫ dΩ R2 S2
v = ±4πv . R2
S2
17.5 Die sphärische Box Als illustratives Beispiel wollen wir im Folgenden die stationären Zustände eines Teil chens in einer sphärisch symmetrischen Potenzialbox mit unendlich hohen Potenzi alwänden {0 , r 0. Die Randbedingung an die Radialfunktion u l (r = 0) = 0 ist äquivalent zu einer unendlich hohen Potenzialwand bei r = 0 (siehe Gleichung (17.15)), sodass für die sphärische Box die Radialgleichung für l = 0 sich in der Tat auf die Schrödinger-Gleichung des eindimensionalen Potenzialtopfes mit unendlich hohen Wänden reduziert. Wir können diese Analogie auch noch weitertreiben und die Nullstelle der Radi alfunktion u l (r) bei r = 0 als Knoten der Wellenfunktion in dem eindimensionalen Potenzialtopf der Breite 2R {0 , V(x) = { ∞, {
|x| < R |x| ≥ R
(17.62)
interpretieren, siehe Abb. 17.4. Die Eigenzustände negativer Parität im Potenzialtopf (17.62), deren Wellenfunktionen bekanntlich ungerade sind und deshalb bei x = 0 einen Knoten besitzen (siehe Abschnitt 8.5), liefern gerade die Gesamtheit der statio nären Zustände im sphärischen Potenzialtopf (17.57) mit Radius R. Die obigen Überlegungen lassen sich leicht für eine sphärische Box mit endlich ho hen Potenzialwänden erweitern. Unter Benutzung der Analogie zwischen der Radial gleichung für Zustände mit l = 0 und dem entsprechenden eindimensionalen Problem können wir sofort schlussfolgern: Die l = 0 Energieeigenwerte eines Teilchens in einer sphärischen Box vom Radius R mit endlich hohen Potenzialwänden sind dieselben wie die der ungeraden Zustände (negativer Parität) des entsprechenden eindimensio nalen Potenzialtopfes mit doppelter Breite 2R (Abb. 17.4). Insbesondere können wir aus den Betrachtungen von Abschnitt 9.3.2 schließen, dass in einem sphärisch sym
4 Für n = 0 ist die Quantisierungsbedingung (17.61) wegen j 0 (0) = 1 nicht erfüllt. Ein Zustand mit k n = 0 in einer endlichen Box würde auch die Unschärferelation verletzen. 5 Im Normierungskoeffizienten C n0 (17.60) benutzen wir |j 1 (k n R)| = |j 1 (nπ)| = 1/nπ, siehe Glei chung (17.33).
17.6 Der dreidimensionale isotrope harmonische Oszillator
V (r)
0
|
373
V (x)
r R
x
−R
R
Abb. 17.4: Korrespondenz zwischen den Energieeigenwerten eines Teilchens in einer sphärisch symmetrischen Potenzialbox mit endlich hohen Wänden mit Radius R und den ungeraden Zuständen eines Teilchens in einer eindimensionalen Potenzialbox der Breite 2R und mit derselben Wandhöhe. Diese Korrespondenz gilt auch für unendlich hohe Potenzialwände, siehe Text.
metrischen Potenzialtopf {−V0 , r < R V(r) = { 0, r>R { quasi-„gebundene“ l = 0 Zustände mit Energie E = 0 für Potenzialstärken γ=
R √2mV0 ℏ
(17.63)
existieren, welche der Bedingung (9.52) γ = (2n + 1)
π , 2
n = 0, 1, 2, . . .
genügen. Für n > 0 gibt es neben dem quasigebundenen Zustand bei E = 0 noch n gebundene Zustände (mit E < 0). Für Potenziale der Stärke (2n − 1)
π π < γ < (2n + 1) 2 2
(17.64)
existieren dann genau n Bindungszustände mit Drehimpuls l = 0.
17.6 Der dreidimensionale isotrope harmonische Oszillator In Abschnitt 12.9 haben wir bereits den dreidimensionalen harmonischen Oszillator in kartesischen Koordinaten behandelt. Der Gesamt-Hamilton-Operator zerfiel in ei ne Summe von drei eindimensionalen harmonischen Oszillatoren für die drei kar tesischen Richtungen. Wir konnten deshalb die Schrödinger-Gleichung durch einen Separationsansatz lösen. Die Gesamtwellenfunktion ergab sich aus dem Produkt der Wellenfunktionen der drei unabhängigen Oszillatorkoordinaten. Für den isotropen
374 | 17 Kugelsymmetrische Potentiale
harmonischen Oszillator, bei dem die Oszillatorfrequenzen in allen drei kartesischen Richtungen übereinstimmen, hängt das Potenzial nur vom Radius r = |x| ab: V(r) =
m 2 2 ω r . 2
Dies ist ein Zentralpotenzial und kann folglich mit den in Abschnitt 17.2 besprochenen allgemeinen Methoden behandelt werden, was wir im Folgenden tun wollen. Dabei wird interessant sein, wie sich die Drehimpulserhaltung in den früher angegebenen Wellenfunktionen des Separationsansatzes in kartesischen Koordinaten manifestiert.
17.6.1 Lösung der Radialgleichung Mit dem für Zentralpotenziale üblichen Ansatz für die Wellenfunktion (17.12) reduziert sich die Schrödinger-Gleichung einer Punktmasse m im isotropen Oszillatorpotenzial auf die Radialgleichung (17.13) [−
ℏ2 d m 2 2 ℏ2 l(1 + 1) + ] u l (r) = E l u l (r) . ω r + 2m dr2 2 2mr2
(17.65)
Zur Vereinfachung dieser Gleichung drücken wir sie durch die dimensionslose Koor dinate r ℏ ρ= , r0 = √ (17.66) r0 mω aus, wobei r0 die bereits in Abschnitt 12.2 eingeführte Oszillatorlänge ist, und definie ren: 2m 2 ϵ l = 2 E l r20 = El . (17.67) ℏω ℏ Setzen wir u l (r) = χ l (ρ) , (17.68) so vereinfacht sich die Radialgleichung (17.65) zu: [
d2 l(l + 1) − ρ2 − + ϵ l ] χ l (ρ) = 0 . dρ 2 ρ2
(17.69)
Für große Radien ρ → ∞ ist das Zentrifugalpotenzial vernachlässigbar, und diese Gleichung reduziert sich auf die Schrödinger-Gleichung des eindimensionalen har monischen Oszillators [
d2 − ρ 2 + ϵ l ] χ l (ρ) = 0 , dρ 2
ρ→∞,
deren Lösungen durch die Hermite-Funktionen gegeben sind, die sämtlich die GaußFunktion 2 ∼ e−ρ /2
17.6 Der dreidimensionale isotrope harmonische Oszillator
|
375
enthalten. Deshalb setzen wir die Radialfunktion in der Form χ l (ρ) = e−ρ
2
/2
η l (ρ)
(17.70)
an. Einsetzen in Gleichung (17.69) liefert die Differenzialgleichung für die noch zu be stimmende Funktion η l (ρ) [
d2 d l(l + 1) − 2ρ + ϵ l ] η l (ρ) = 0 . −1− 2 dρ dρ ρ2
(17.71)
Man beachte, dass durch den Ansatz (17.70) der Oszillatorterm ∼ ρ 2 aus der Radial gleichung eliminiert wurde. Aus Abschnitt 17.3 wissen wir bereits, dass für Zentralpotenziale V(r), welche für r → 0 weniger als 1/r2 singulär sind, das Verhalten der Wellenfunktion für kleine r allein durch das Zentrifugalpotenzial bestimmt wird, weshalb sich die Radialfunktion χ l (ρ) wie χ l (ρ) ∼ ρ l+1 , ρ → 0 verhält, siehe Gleichung (17.19). Deshalb setzen wir den noch zu bestimmenden Teil η l (ρ) der Radialfunktion (17.70) in Form der folgenden Potenzreihe ∞
η l (ρ) = ρ l+1 ∑ c k ρ k
(17.72)
k=0
an. Einsetzen dieses Ansatzes in Gleichung (17.71) liefert die Gleichung ∑ {[(k + l + 1) (k + l) − l(l + 1)] ρ k+l−1 + (ϵ l − [2(k + l + 1) + 1]) ρ k+l+1} c k = 0 , k=0
(17.73) die wir durch Koeffizientenvergleich der unabhängigen Potenzen von ρ lösen können: Um die Koeffizienten c k zu bestimmen, ist es zweckmäßig, den Summationsindex im ersten Term in der geschweiften Klammer in Gleichung (17.73) um zwei Einheiten zu verschieben, k − 2 → k, sodass wir in beiden Terme dieselbe Potenz von ρ vorliegen haben: ∞
0 = ∑ [(k + 2 + l + 1) (k + 2 + l) − l(l + 1)] c k+2 ρ k+l+1 k=−2 ∞
+ ∑ (ϵ l − [2(k + l + 1) + 1]) c k ρ k+l+1 . k=0
Zu den beiden untersten Potenzen in ρ tragen nur die ersten Terme mit k = −2 bzw. −1 bei. Der Koeffizient vor der niedrigsten Potenz ρ l−1 verschwindet identisch, c =0, [(k + 2 + l + 1)(k + 2 + l) − l(l + 1)] k=−2 0 sodass c0 durch die Gleichung (17.73) nicht eingeschränkt ist. Koeffizientenvergleich der nächstniedrigsten Potenz ρ l liefert die Bedingung [(l + 2)(l + 1) − l(l + 1)] c 1 = 0 .
376 | 17 Kugelsymmetrische Potentiale Da die Drehimpulsquantenzahl l ≥ 0 und somit der Ausdruck in der eckigen Klammer stets von null verschieden ist, fordert diese Bedingung: c1 = 0 .
(17.74)
Koeffizientenvergleich der Terme mit k ≥ 0 liefert die Rekursionsbeziehung c k+2 =
2(k + l) + 3 − ϵ l ck . (k + l + 3)(k + l + 2) − l(l + 1)
(17.75)
Wegen (17.74) verschwinden sämtliche Koeffizienten zu ungeraden k = 2ν + 1, c2ν+1 = 0 , während sich sämtliche Koeffizienten mit geradem k = 2ν durch den Koeffizienten c0 ausdrücken lassen. Für große k reduziert sich die Rekursionsbeziehung (17.75) auf: c k+2 ≃
2 ck , k
k →∞.
Die Entwicklungskoeffizienten c k=2ν besitzen deshalb asymptotisch die Gestalt c2ν+2 ≃ const.
1 , ν!
ν→∞.
(17.76)
Folglich nähert sich die Funktion η l (ρ) (17.72) für ρ → ∞ asymptotisch der Funktion⁶ ∞
η l (ρ) ≃ const. ⋅ ρ l+1+2 ∑ ν=0
ρ 2ν 2 = const. ⋅ ρ l+1+2 e ρ , ν!
ρ→∞
an. Dies würde auf eine nicht normierbare Radialfunktion χ l (ρ) (17.70) führen. Ge bundene Zustände können deshalb nur auftreten, wenn die Potenzreihenentwicklung (17.72) nach einer endlichen Anzahl von Gliedern abbricht, d. h., es muss ein k = 2ν existieren, sodass der Zähler in der Rekursionsbeziehung (17.75) verschwindet und da mit der Koeffizient c2ν+2 und alle höheren Koeffizienten verschwinden. Dies ist genau für ϵ l = 4ν + 2l + 3 (17.77) erfüllt.
6 Für große ρ sind die niedrigen Potenzen der Taylor-Entwicklung, d. h. die Terme c ν ρ ν mit kleinem ν, irrelevant. Deshalb können wir aus der Kenntnis der Terme mit großem ν auf das asymptotische Verhalten der Funktion bei großen Argumenten ρ schließen.
17.6 Der dreidimensionale isotrope harmonische Oszillator
|
377
17.6.2 Energiespektrum Für gegebene l und ν definiert Gleichung (17.77) die Energie des zugehörigen gebun denen Zustandes. Nach Gleichung (17.67) sind die Energieeigenwerte E l ≡ E νl des iso tropen harmonischen Oszillators deshalb durch E νl = ℏω (2ν + l +
3 ) 2
(17.78)
gegeben, wobei wie oben gezeigt ν eine nicht negative ganze Zahl ist: ν = 0, 1, 2, . . . . Die Eigenenergien (17.78) hängen nur von der Kombination n = 2ν + l ab, die als Hauptquantenzahl bezeichnet wird. Die Eigenenergien E n = ℏω (n +
3 ) 2
sind deshalb für n > 1 entartet. Vergleich mit Gleichungen (12.74), (12.75) zeigt, dass die Hauptquantenzahl n die Gesamtzahl der Schwingungsquanten des harmonischen Oszillators angibt, n = n1 + n2 + n3 , wobei n i die Zahl der Schwingungsquanten in Richtung der kartesischen Koordina te x i ist. Die Drehimpulsquantenzahl l kann wie üblich alle nicht negativen ganzen Werte annehmen. Die Werte l = 0, 1, 2, 3, . . . bezeichnet man mit den Buchstaben s, p, d, f, . . . . Vor diesen Buchstaben schreibt man den um 1 vergrößerten Wert der Quantenzahl ν. Für die ersten fünf Hauptquantenzahlen sind die so bezeichneten Zu stände in der Tab. 17.1 angegeben. Tab. 17.1: Die untersten Energieeigenwerte des isotropen harmonischen Oszillators. n
E n /ℏω
(ν + 1)l
0 1 2 3 4
3/2 5/2 7/2 9/2 11/2
1s 1p 2s, 1d 2p, 1f 3s, 2d, 1g
378 | 17 Kugelsymmetrische Potentiale
n
4
3s 2p
3 2
2s
1g 1f
1d 1p
1 0
2d
1s
0
1
2
3
4
l
Abb. 17.5: Energieniveaus des isotropen harmonischen Oszillators (siehe auch Tab. 17.1).
Abbildung (17.5 zeigt das Spektrum des isotropen harmonischen Oszillators in Ab hängigkeit vom Drehimpuls l. Man beachte, dass die Zustände mit einer geraden (un geraden) Hauptquantenzahl n einen geraden (ungeraden) Drehimpuls l besitzen. Ent sprechend der Eigenschaften der Kugelfunktionen unter Raumspiegelung Y lm (−x)̂ = (−1)l Y lm (x)̂ besitzen deshalb die Zustände mit gerader (ungerader) Hauptquantenzahl n positive (negative) Parität. Jeder Drehimpulseigenzustand mit Quantenzahl l ist bekanntlich (2l + 1)− fach entartet. Dies ist die gewöhnliche Entartung aufgrund der Rotationsinvarianz des Zen tralpotenzials. Beim harmonischen Oszillator gibt es darüber hinaus eine zufällige Entartung, die darin besteht, dass Zustände mit verschiedenem Drehimpuls diesel be Energie besitzen, da die Energie nur von der Hauptquantenzahl n (17.76) abhängt. Der Gesamtentartungsgrad eines Energieniveaus mit Hauptquantenzahl n ergibt sich deshalb durch g n = ∑(2l + 1) , l
wobei l über die erlaubten Drehimpulsquantenzahlen läuft. Für gerade n nimmt dieser die Werte l = 0, 2, . . . , n
17.6 Der dreidimensionale isotrope harmonische Oszillator
| 379
und für ungerade n die Werte l = 1, 3, . . . , n an. In beiden Fällen erhalten wir nach Ausführung der Summation⁷ über l = 2i für gerade n n/2
n/2
n/2
∑ (4i + 1) = 4 ∑ i + ∑ 1 = 4 i=0
i=0
i=0
n 1n n ( + 1) + ( + 1) 22 2 2
1 = (n + 1)(n + 2) 2 bzw. über l = 2i + 1 für ungerade n (n−1)/2
∑ (4i + 3) =
i=0
1 (n + 1)(n + 2) 2
den Entartungsgrad gn =
1 (n + 1)(n + 2) . 2
Dieser Entartungsgrad wurde bereits in Abschnitt 12.9 bei der Behandlung des isotro pen harmonischen Oszillators in kartesischen Koordinaten gefunden.
17.6.3 Wellenfunktionen Mit den über die Rekursionsbeziehung (17.75) bestimmten Koeffizienten c k , die für ein festes ν für alle k ≥ 2ν + 2 verschwinden, bildet die in (17.72) definierte Potenzreihe eine sogenannte konfluente hypergeometrische Reihe, die mit ν
∑ c2q ρ 2q = c0 F(−ν, l + 3/2, ρ 2 ) q=0
bezeichnet wird. Die Quantenzahl ν gibt dabei den Grad des Polynoms F in der Varia ble ρ 2 an. Damit erhalten wir für die Gesamtwellenfunktion des isotropen harmonischen Os zillators u νl (r) φ νlm (r, ϑ, φ) = Y lm (ϑ, φ) , r
7 Wir benutzen hier die bekannte Formel k
∑i= i=0
1 k(k + 1) . 2
380 | 17 Kugelsymmetrische Potentiale wobei die Radialfunktion u νl (r) (17.68), (17.70), (17.72) durch u νl (r) = χ νl (ρ) = Nνl ρ l+1 e−ρ
2
/2
F(−ν, l + 3/2, ρ 2 )
als Funktion des dimensionslosen Radius ρ = r√ mω/ℏ (17.66) gegeben ist. Hierbei bezeichnet Nνl einen Normierungsfaktor, der den bisher noch unbestimmten Koeffi zienten c0 festlegt. Abschließend gehen wir noch explizit die normierten Eigenfunktionen für die un tersten Oszillatorzustände an. Der Grundzustand n = 0 ist nicht entartet und besitzt die normierte Wellenfunktion φ ν=0,l=0,m=0(x) = (
1 r 2 1 3/4 ) exp [− ( ) ] . πr0 2 r0
Dies ist dieselbe Wellenfunktion, die für den Grundzustand durch Separation der kar tesischen Koordinaten in Abschnitt 12.9 gefunden wurde: φ ν=0,l=0,m=0(x) = φ n1 =0 (x1 ) ⋅ φ n2 =0 (x2 ) ⋅ φ n3 =0 (x3 ) . Der erste angeregte Zustand trägt die Quantenzahlen ν = 0, l = 1 und besitzt nur die übliche Entartung in der Projektion des Drehimpulses m = 0, ±1 aufgrund der Rotati onssymmetrie des isotropen Oszillators. Seine normierten Wellenfunktionen lauten: φ ν=0,l=1,m(x) = √
8 r 1 r 2 1 exp [− ( ) ] Y lm (ϑ, φ) , 3/2 3 π1/4 r r0 2 r0
m = 0, ±1 .
0
Unter Berücksichtigung der expliziten Form der Kugelfunktionen rY 10 (ϑ, φ) = √
3 x3 , 4π
r 3 (Y1,−1 (ϑ, φ) − Y1,1 (ϑ, φ)) = √ x1 , 4π √2 r 3 (Y1,−1 (ϑ, φ) + Y1,1 (ϑ, φ)) = −i√ x2 4π √2 und des ersten Hermite-Polynoms H1 (x) = 2x findet man den folgenden Zusammenhang zwischen den Eigenfunktionen in der sphä rischen und kartesischen Basis (12.66): φ ν=0,l=1,m=0(x) = φ n1 =0 (x1 ) ⋅ φ n2 =0 (x2 ) ⋅ φ n3 =1 (x3 ) , 1 [φ ν=0,l=1,m=−1(x) − φ ν=0,l=1,m=1(x)] = φ n1 =1 (x1 ) ⋅ φ n2 =0 (x2 ) ⋅ φ n3 =0 (x3 ) , √2 i [φ ν=0,l=1,m=−1(x) + φ ν=0,l=1,m=1(x)] = φ n1 =0 (x1 ) ⋅ φ n2 =1 (x2 ) ⋅ φ n3 =0 (x3 ) . √2
17.6 Der dreidimensionale isotrope harmonische Oszillator
| 381
Auf ähnliche Weise lassen sich die Zusammenhänge zwischen den Wellenfunktionen in der sphärischen und kartesischen Basis für die höheren Hauptquantenzahlen an geben. Abschließend geben wir die exakte Wellenfunktion für die Hauptquantenzahl n = 2 an, zu der die Zustände mit den Quantenzahlen ν=1,
l=0
ν=0,
l=2
beitragen. Hier tritt zum ersten Mal die zufällige Entartung bezüglich der Drehimpuls quantenzahl auf. Die zugehörigen Wellenfunktionen lauten: φ ν=1,l=0,m=0(x) = √
3 2 r 2 1 r 2 1 (1 − ( ) ) exp [− ( ) ] , 3/2 2 π3/4 r 3 r0 2 r0 0
φ ν=0,l=2,m(x) = √
16 r 2 1 1 r 2 ( ) exp [− ( ) ] Y2m (ϑ, φ) , 3/2 15 π3/4 r r0 2 r0 0
m = 0, ±1, ±2 .
18 Das Wasserstoffatom Einer der Haupterfolge der Quantenmechanik war die Erklärung der Atomspektren. Im Folgenden wollen wir das einfachste Atom, das Wasserstoffatom, behandeln. Be kanntlich besteht das Wasserstoffatom aus einem Proton, dem einfachsten Atomkern, und einem Elektron, die über das Coulomb-Potenzial V(|x 1 − x 2 |) =
q1 q2 4π|x1 − x2 |
(18.1)
miteinander wechselwirken. Hierbei bezeichnen q1 , q2 und x 1 , x 2 die Ladungen und Koordinaten von Elektron bzw. Proton. Da das Proton ungefähr 2000-mal schwerer als das Elektron ist, m e c2 ≃ 0,5 MeV , m p c2 ≃ 103 MeV , können wir das Proton in guter Näherung als ruhend annehmen. Klassisch be wegt sich das Elektron dann im Coulomb-Feld des Protons wie die Planeten im Gravitationsfeld der Sonne. Die Elektronenbahnen sind dann Kepler-Ellipsen, in deren Brennpunkt das Proton liegt. Auf den Kepler-Bahnen erfährt das Elektron ei ne Beschleunigung (hauptsächlich Radialbeschleunigung). Nach den Gesetzen der klassischen Elektrodynamik müsste daher das Elektron elektromagnetische Wellen abstrahlen. Durch diese Wellenabstrahlung verlöre es kinetische Energie, es würde also abgebremst und müsste schließlich ins Kraftzentrum, d. h. auf das Proton, fallen. Experimentell beobachtet man jedoch eine endliche Ausdehnung der Atome, die etwa zehntausendmal größer als die Ausdehnung der Atomkerne ist. Die Elektronen müs sen sich deshalb in stationären Zuständen strahlungsfrei um den Atomkern bewegen (Abb. 18.1), wie dies im Rahmen der Quantenmechanik möglich ist. Die Erklärung des Atombaues sowie der damit zusammenhängenden chemischen Bindung war einer der großen Erfolge der Quantenmechanik. Das Wasserstoffatom stellt ein typisches quantenmechanisches Zweiteilchenpro blem dar, das wir im Folgenden von einem etwas allgemeineren Standpunkt aus be trachten wollen.
e− p+ Abb. 18.1: Das Wasserstoffatom.
https://doi.org/10.1515/9783110586022-018
18.1 Das Zweikörperproblem: Separation in Schwerpunkts- und Relativbewegung |
383
18.1 Das Zweikörperproblem: Separation in Schwerpunktsund Relativbewegung In vielen praktischen Anwendungen der stationären Schrödinger-Gleichung haben wir es nicht mit der Bewegung eines punktförmigen Teilchens in einem äußeren raum festen Potenzial zu tun, sondern mit der Wechselwirkung von verschiedenen Teilchen. Im einfachsten Fall besteht das physikalische System aus zwei wechselwirkenden Teil chen. Beispiele hierfür sind das Wasserstoffatom oder das Deuteron, ein Atomkern bestehend aus einem Proton und einem Neutron. Die Wechselwirkung zwischen den Teilchen lässt sich i. A. durch ein Wechselwir kungspotenzial V(x 1 , x2 ) beschreiben. Wegen der Homogenität des Raumes kann die ses Potenzial nur von dem Abstand der beiden wechselwirkenden Teilchen abhängen: V(x 1 , x 2 ) = V(x 1 − x 2 ) . Ein solches Potenzial ist translationsinvariant. Wir wollen im Folgenden das Zweiteil chensystem in allgemeiner Form betrachten. Wir nehmen an, dass zwei Teilchen mit Masse m1 und m2 und Koordinaten x1 und x2 über ein translationsinvariantes Poten zial wechselwirken. Der Hamiltonian des Systems ist dann durch p 21 p2 + 2 + V(x 1 − x 2 ) , 2m1 2m2
H12 (x 1 , x 2 ) =
p1 =
ℏ ∇x , i 1
p2 =
ℏ ∇x i 2
gegeben. Da das Potenzial nur von der Koordinatendifferenz der beiden Teilchen ab hängt, empfiehlt es sich, wie in der klassischen Mechanik Schwerpunkts- und Relativ koordinaten X und x einzuführen (Abb. 18.2): X=
m1 x 1 + m2 x 2 , m1 + m2
x = x1 − x2 .
(18.2)
m2 x = x1 − x2 m1 x2
X x1 Abb. 18.2: Definition von Relativ- und Schwerpunktskoordinaten für das Zweiteilchensystem.
384 | 18 Das Wasserstoffatom
Analog zur klassischen Mechanik führen wir auch Gesamtimpuls (Schwerpunkts impuls) P und Impuls der Relativbewegung p ein: P = p1 + p2 ,
p=
m2 p 1 − m1 p2 . m1 + m2
Elementare Differenzialrechnung zeigt, dass die Impulsoperatoren von Schwerpunktsund Relativbewegung durch die Ableitungen nach der Schwerpunktskoordinate bzw. der Relativkoordinate gegeben sind: P=
ℏ ∇X , i
p=
ℏ ∇x . i
Da die einzelnen Komponenten des Impulsoperators miteinander kommutieren, lie fert die Transformation der kinetischen Energie in Schwerpunkts- und Relativimpulse dasselbe Ergebnis wie in der klassischen Mechanik: p 21 p2 P2 p2 + 2 = + , 2m1 2m2 2M 2m wobei M und m die Gesamtmasse und die reduzierte Masse sind: M = m1 + m2 ,
1 1 1 + , = m m1 m2
m=
m1 m2 . m1 + m2
Der Hamilton-Operator des wechselwirkenden Zweiteilchensystems nimmt dann die Gestalt P2 p2 P2 H12 (x 1 , x 2 ) ≡ H̄ 12 (X, x) = + + V(x) =: + H(x) 2M 2m 2M an. Damit haben wir eine Entkopplung der Bewegung des Schwerpunktes von der Re lativbewegung erreicht und die Schrödinger-Gleichung ̄ ̄ H̄ 12 (X, x)φ(X, x) x) = E12 φ(X,
(18.3)
lässt sich durch Separationsansatz lösen. Da das Potenzial nicht von X abhängt, führt der Schwerpunkt eine freie Bewegung aus, die bekanntlich durch eine ebene Welle beschrieben wird. Die Wellenfunktion hat deshalb die Gestalt ̄ φ(X, x) = e iK⋅X φ(x) . Mit diesem Separationsansatz reduziert sich die Schrödinger-Gleichung des wechsel wirkenden Zweiteilchensystems (18.3) auf die (Einteilchen-)Schrödinger-Gleichung für die reduzierte Bewegung: H(x)φ(x) ≡ (
p2 + V(x)) φ(x) = Eφ(x) . 2m
(18.4)
18.2 Qualitative Beschreibung |
385
Hierin ist
ℏ2 K 2 2M die Energie der Relativbewegung. Damit haben wir das Zweikörperproblem auf ein Einteilchenproblem für die reduzierte Bewegung zurückgeführt. Dies ist offenbar im mer möglich, wenn das Wechselwirkungspotenzial nur vom Abstand der beiden wech selwirkenden Teilchen abhängt. Nach Auffinden der Eigenwerte E des reduzierten Hamilton-Operators H(x) (18.4) erhalten wir die Gesamtenergie des Systems zu: E = E12 −
E12 = E +
ℏ2 K 2 . 2M
In vielen praktischen Anwendungen ist eines der beiden Teilchen sehr viel schwe rer als das andere wie z. B. beim Wasserstoffatom. Ist z. B. m1 sehr klein gegenüber m2 , so liegt der Schwerpunkt sehr dicht bei x2 , und das zweite Teilchen stellt in gu ter Näherung den Massenschwerpunkt dar, während die Relativbewegung durch die Bewegung des leichten Teilchens gegeben ist. Wir haben dann: M ≃ m2 ,
m ≃ m1
X ≃ x2 ,
x ≃ x1 .
bzw. Diese Näherung vernachlässigt den Einfluss der Bewegung des leichten Teilchens auf die Bewegung des schweren Teilchens, d. h. den Rückstoß, den das schwere Teilchen durch das leichte erfährt. Das schwere Teilchen wird als ruhend betrachtet, was nur für ein unendlich schweres Teilchen korrekt ist, wie in Abschnitt 12.10 gezeigt wurde. Wie wir dort gesehen hatten, werden im Limes m2 → ∞ die Freiheitsgrade des schweren Teilchens eingefroren (die Wellenfunktion wird Eigenzustand des Ortes). Die Relativ bewegung reduziert sich dann auf die Bewegung des leichten Teilchens im Potenzial, dessen Kraftzentrum am Ort des schweren Teilchens liegt.
18.2 Qualitative Beschreibung Wie in Abschnitt 18.1 beschrieben, können wir das Wasserstoffproblem durch Einfüh rung von Schwerpunkts- und Relativkoordinaten (18.2) auf ein (Einteilchen-)Poten zialproblem reduzieren. Da die Masse des Protons etwa zweitausendmal größer als die Masse des Elektrons ist, wird der Schwerpunkt des Atoms sehr nahe am Proton liegen, und die reduzierte Masse fällt praktisch mit der Elektronenmasse zusammen. Elektron und Proton wechselwirken über das Coulomb-Potenzial (18.1). Setzen wir für q1 und q2 die Elektron- und Protonladungen ein, q p = e, q e = −e, wobei e = 1,602 ⋅ 10−19 C die Elementarladung ist, so lautet der Hamilton-Operator für die
386 | 18 Das Wasserstoffatom
Relativbewegung: e2 p2 − , 2m 4π|x|
H=
1 1 1 + . = m me mp
Eine grobe Abschätzung der Ausdehnung des Atoms bzw. der Bindungsenergie des Elektrons lässt sich bereits ohne explizites Lösen der Schrödinger-Gleichung allein aufgrund der Unschärferelation angeben. Da die Bewegung des Elektrons innerhalb des Atoms erfolgt, muss die Unschärfe im Ort von der Größenordnung des Atomradi us r0 sein: ∆x ≃ r0 . Aus der Unschärferelation (11.12) folgt dann für die Impulsunschärfe: ∆p ≃
ℏ ℏ = . ∆x r0
Legen wir den Atomkern in den Koordinatenursprung, so müssen aufgrund der Sym metrie die Erwartungswerte von Ort und Impuls verschwinden: ⟨x⟩ = 0 ,
⟨p⟩ = 0 .
Die Schwankungsquadrate von Ort und Impuls sind damit identisch mit den Erwar tungswerten von x 2 und p2 : (∆x)2 = ⟨x 2 ⟩ ,
(∆p)2 = ⟨p 2 ⟩ .
Den Erwartungswert der Energie können wir dann grob abschätzen durch: e2 ⟨p 2 ⟩ − 2m 4π√⟨x 2 ⟩ 2 e2 ℏ − = E(r0 ) . = 2mr20 4πr0
⟨H⟩ ≃
(18.5)
Im Grundzustand muss diese Energie minimal werden. Differenziation der Energie E(r0 ) nach dem Radius r0 liefert die Extremalbedingung ℏ2 mr30
=
e2 . 4πr20
(18.6)
Die Lösung dieser Gleichung r0 = a definiert den Bohr’schen Atomradius a=
4πℏ2 ≃ 0,5 ⋅ 10−10 m = 0,5 Å , me2
(18.7)
der die charakteristische Längeneinheit im atomaren Bereich darstellt. Die Energie bei diesem Radius liefert eine grobe Abschätzung für die Bindungsenergie des Elektrons
18.2 Qualitative Beschreibung | 387
im Wasserstoffatom. Für die Energie (18.5) am stationären Punkt r0 = a erhalten wir mit (18.6): 1 e2 ℏ2 =− E(a) = − . 2 2 4πa 2ma Setzen wir hier für den Bohr’schen Atomradius den Ausdruck (18.7) ein, so finden wir 2
e2 1 ) =: −R . E(a) = − mc2 ( 2 4πℏc
(18.8)
Die Größe R ist die Rydberg-Konstante: R=
1 2 2 mc α ≃ 13,6 eV . 2
(18.9)
Hierin bezeichnet mc2 die Ruheenergie des Elektrons und α=
1 e2 ≃ 4πℏc 137
ist die Sommerfeld’sche Feinstrukturkonstante. Der hier gewonnene Ausdruck (18.8) für die Energie des Elektrons stimmt mit der exakten Energie des Elektrons im Grund zustand überein, wie wir später sehen werden. Die quantenmechanische Behandlung der Bewegung eines geladenen Teilchens im Coulomb-Potenzial ist jedoch nicht nur relevant für das Wasserstoffatom. Es gibt darüber hinaus eine ganze Reihe von wasserstoffähnlichen Problemen. Hierzu ge hören Atome, die bis auf ein einziges Elektron ionisiert sind, z. B. He+ , Li++ , Be+++ usw. Der einzige Unterschied zum Wasserstoffatom besteht darin, dass die Ladung des Protons e durch die Ladung des entsprechenden Atomkerns Ze ersetzt ist, wobei Z die Protonenzahl bezeichnet. Auch die Atome der Alkalimetalle lassen sich in erster Näherung auf ein dem Wasserstoffatom ähnliches Problem reduzieren. Diese Atome besitzen nur ein einziges Elektron in der äußersten Elektronenschale. Dieses soge nannte Valenzorbital¹ hat einen sehr viel größeren effektiven Radius als die inneren abgeschlossenen Elektronenschalen. Wir können deshalb in erster Ordnung die Aus dehnung des Atomrumpfes, der durch den Atomkern und die abgesättigten Elektro nenschalen gegeben ist (und damit einfach positiv geladen ist), vernachlässigen und diesen als eine Punktladung, d. h. wie ein sehr schweres Proton, betrachten. Die Be rechnung der Alkaliatome reduziert sich dann auf das Wasserstoffproblem. In der Tat werden die chemischen Eigenschaften der Alkalimetalle nahezu ausschließlich von dem Valenzelektron bestimmt. Bei der Erklärung der chemischen Eigenschaften kön nen wir deshalb von den Elektronen auf den abgeschlossenen Schalen abstrahieren.
1 Unter Orbital versteht man prinzipiell den quantenmechanischen Zustand des Elektrons im Atom, hat dabei aber immer die räumliche Ausdehnung der dazugehörigen Wahrscheinlichkeitsdichte im Hinterkopf.
388 | 18 Das Wasserstoffatom
18.3 Lösung der Schrödinger-Gleichung Nach den qualitativen Vorbetrachtungen zum Wasserstoffatom wollen wir jetzt die relevante Schrödinger-Gleichung für ein geladenes Teilchen im Coulomb-Potenzial explizit lösen. Für eine Punktmasse m mit Ladung q1 = −e, die sich im CoulombPotenzial (18.1) befindet, welches durch eine zweite, am Koordinatenursprung ruhen de Punktladung q2 = Ze erzeugt wird, lautet die Schrödinger-Gleichung: (
p2 Ze2 − ) φ(x) = Eφ(x) . 2m 4π|x|
(18.10)
Da das Coulomb-Potenzial nur vom Radius abhängt, können wir die Ergebnisse der in Abschnitt 17.2 durchgeführten allgemeinen Betrachtungen der Schrödinger-Glei chung im Zentralpotenzial übernehmen. Die Wellenfunktionen sind damit Eigenfunk tionen zum Drehimpulsoperator und besitzen die Produktform (17.12). Die Radialglei chung (17.13) lautet für das Coulomb-Potenzial: [−
ℏ2 l(l + 1) Ze2 ℏ2 d2 ] u l (r) = E l u l (r) . + − 2 2m dr 4πr 2mr2
(18.11)
Zur Lösung dieser Gleichung ist es zweckmäßig, sie durch die Energie zu dividieren und Letztere dabei durch die (für positive Energien imaginäre) Wellenzahl κ , − El =
ℏ2 κ 2 , 2m
(18.12)
auszudrücken. (Für gebundene Zustände ist die Energie negativ und κ folglich reell.) Dies liefert 1 d2 l(l + 1) 1 Ze2 2m [− 2 2 + 2 2 − 2 + 1] u l (r) = 0 . κ dr κ r κ 4πr ℏ2 Diese Form suggeriert, die dimensionslose Variable ρ = κr einzuführen, in der die Radialgleichung die Gestalt [
l(l + 1) β d2 − + − 1] χ l (ρ) = 0 2 ρ dρ ρ2
(18.13)
annimmt, wobei wir u l (r) =: χ l (κr) ≡ χ l (ρ) gesetzt haben und die Abkürzung β=
1 2m Ze2 κ ℏ2 4π
(18.14)
18.3 Lösung der Schrödinger-Gleichung
|
389
eingeführt haben. Mit der Definition des Bohr’schen Atomradius (18.7) finden wir β = 2Z
1 . κa
(18.15)
Diese Größe ist offenbar dimensionslos, hängt aber über κ von der Energie E l (18.12) ab. In Abschnitt 17.3 haben wir bereits allgemein für Zentralpotenziale, die für r → 0 nicht stärker als ∼ 1/r2 divergieren und für r → ∞ gegen eine Konstante streben, die asymptotische Form der Radialfunktion für r → 0, Gleichung (17.19), und r → ∞, Gleichung (17.20), gefunden: χ l (ρ) ∼ ρ l+1 , χ l (ρ) ∼ e
−ρ
ρ→0, ρ→∞.
,
Unter Berücksichtigung dieses asymptotischen Verhaltens suchen wir die allgemeine Lösung in der Form χ l (ρ) = ρ l+1 e−ρ L(ρ) , (18.16) wobei L(ρ) eine noch zu bestimmende Funktion ist, die jedoch einfacher als χ l (ρ) sein sollte. Setzen wir diesen Ansatz in die Differenzialgleichung (18.13) ein, so nimmt diese folgende Gestalt an:² [ρ
d d2 + 2(l + 1 − ρ) + β − 2(l + 1)] L(ρ) = 0 . dρ dρ 2
2 Hierbei ist es zweckmäßig, die Ableitung von (18.16) in der Form χ l (ρ) = (
l+1 L (ρ) −1+ ) χ l (ρ) ρ L(ρ)
(18.17)
zu schreiben. Differenziation von (18.17) liefert χ l (ρ) = (−
2
l + 1 L (ρ) l+1 L (ρ) L (ρ) + −( −1+ ) ) χ l (ρ) + ( ) χ l (ρ) . 2 L(ρ) L(ρ) ρ L(ρ) ρ
Benutzen wir hier für χl (ρ) den Ausdruck (18.17), so erhalten wir χ l (ρ) = [−
2
2
l + 1 L (ρ) l+1 L (ρ) L (ρ) + −( −1+ ) +( ) ] χ l (ρ) . L(ρ) L(ρ) ρ L(ρ) ρ2
Elementare Algebra liefert schließlich χ l (ρ) = [
L (ρ) l(l + 1) l + 1 − ρ L (ρ) l+1 +1+ +2 −2 ] χ l (ρ) . L(ρ) ρ L(ρ) ρ ρ2
Beim Einsetzen dieses Ausdruckes in (18.13) heben sich die ersten beiden Terme in der eckigen Klam mer weg. Diese beiden Terme dominieren aber in der Differenzialgleichung (18.13) für ρ → 0 bzw. ρ → ∞. Das Herausfallen dieser Terme ist eine Folge des Ansatzes (18.16).
390 | 18 Das Wasserstoffatom
Die verbleibende Differenzialgleichung lässt sich durch einen Potenzreihenansatz ∞
L(ρ) = ∑ c k ρ k
(18.18)
k=0
lösen, womit diese sich auf die Gleichung ∞
∞
∞
k=2
k=1
k=0
∑ k(k − 1)c k ρ k−1 + 2(l + 1 − ρ) ∑ kc k ρ k−1 + [β − 2(l + 1)] ∑ c k ρ k = 0 reduziert. Zweckmäßigerweise verschieben wir die Summationsindizes so, dass die unabhängige Variable ρ in allen Termen in derselben Potenz auftritt. Dies liefert: ∞
∞
∞
∞
k=1
k=0
k=1
k=0
∑ k(k + 1)c k+1 ρ k + 2(l + 1) ∑ (k + 1)c k+1 ρ k − 2 ∑ kc k ρ k + [β − 2(l + 1)] ∑ c k ρ k = 0 . (18.19) Da die einzelnen Potenzen von ρ linear unabhängig sind, müssen die Koeffizienten von jeder einzelnen Potenz getrennt verschwinden. Für k ≥ 1 liefert der Koeffizienten vergleich: k(k + 1)c k+1 + 2(l + 2)(k + 1)c k+1 − 2kc k + [β − 2(l + 1)] c k = 0 , was auf die Rekursionsbeziehung c k+1 2(k + l + 1) − β = ck (k + 1)(k + 2l + 2)
(18.20)
führt. Man überzeugt sich leicht, dass diese Beziehung auch für k = 0 gilt. (Für k = 0 verschwinden die Summanden der ersten und dritten Summe in (18.19), sodass wir die Summation auch von k = 0 beginnen können.) Damit gilt diese Beziehung für alle k. Für k → ∞ reduziert sich die Rekursionsbeziehung (18.20) auf: c k+1 2 , ∼ ck k+1
k→∞.
Damit haben die Entwicklungskoeffizienten c k für große k die asymptotische Form ck ∼
2k , k!
k→∞.
Für ρ → ∞ sind nur die Entwicklungskoeffizienten c k mit k → ∞ relevant, siehe Gleichung (18.18). Die Funktion L(ρ) (18.18) hat deshalb für große ρ die asymptotische Form ∞ ∞ 2k k ρ = e2ρ , ρ → ∞ . L(ρ) = ∑ c k ρ k ∼ ∑ k! k=0 k=0
18.4 Spektrum des Wasserstoffatoms
| 391
Dies impliziert, dass die Radialfunktion χ l (ρ) (18.16) für große ρ exponentiell an wächst: χ(ρ) = ρ l+1 e−ρ L(ρ) ∼ ρ l+1 e ρ → ∞ , ρ → ∞ . Dies würde jedoch zu keiner normierbaren Wellenfunktion und damit zu keinem gebundenen Zustand führen. Um eine normierbare Wellenfunktion zu erhalten, muss deshalb die Potenzreihenentwicklung (18.18) bei einem bestimmten maximalen k = k max abbrechen, d. h., es muss gelten c kmax +1 = 0. Aus der Rekursionsbezie hung (18.20) folgt, dass dies genau dann der Fall ist, wenn !
β = 2(k max + l + 1) =: 2n
(18.21)
gilt. Dazu muss die energieabhängige Größe β (18.15) gleich dem Doppelten einer na türlichen Zahl n sein, die als Hauptquantenzahl bezeichnet wird. Diese muss wegen k max ≥ 0 offenbar die Bedingung n ≥ l+1
(18.22)
erfüllen.
18.4 Spektrum des Wasserstoffatoms Die Abbruchbedingung (18.21) stellt eine Quantisierungsbedingung an die energieab hängige Größe β (18.15) und damit an die Energie dar, β(E = E n ) = 2n , die nur für diskrete Energien E n erfüllt wird. Setzen wir für β den expliziten Aus druck (18.14), (18.12) ein, so finden wir, dass die diskreten Energien, die zu normier baren Wellenfunktionen gehören, durch 2
En = −
1 Z2 m Ze2 1 Z2 ( ) 2 = − mc2 α 2 2 = −R 2 2 4πℏ 2 n n n
(18.23)
gegeben sind, siehe Abb. 18.3. Hierbei haben wir wieder die Definition der RydbergKonstanten (18.9) benutzt. Bemerkenswert ist, dass die Energie nicht von der Drehim pulsquantenzahl l, sondern nur von der Hauptquantenzahl n abhängt. Dies ist eine Besonderheit des Coulomb-Potenzials und wird als zufällige Entartung bezeichnet, de ren Ursache in Abschnitt 18.6 geklärt wird. Im Allgemeinen hängen die Energieeigen werte eines zentralsymmetrischen Potenzials auch von der Drehimpulsquantenzahl l ab. Darüber hinaus besitzt jeder Zustand mit festem n und l noch die für rotationssym metrische Potenziale allgemein gültige (2l + 1)-fache Entartung in der magnetischen
392 | 18 Das Wasserstoffatom
0
n=4 n=3
−2 n=2
V (r)[eV ]
−4 −6 −8 −10 −12
n=1
−14 0
0.5
1
r[nm]
1.5
2
2.5
Abb. 18.3: Die untersten Bindungszustände im Coulomb-Potenzial des Wasserstoffkerns.
Quantenzahl m = −l, −l + 1, . . . , l. Damit ist der Gesamtentartungsgrad eines Ener gieniveaus durch n−1
∑ (2l + 1) = n2 l=0
gegeben. Schließt man noch den Spin s = 1/2 der Elektronen ein, der in 2s + 1 = 2 verschiedenen Zuständen vorliegen kann, so beträgt die Gesamtentartung 2n2 . Für das Wasserstoffatom Z = 1 ist das Spektrum der niedrigsten gebundenen Zustände schematisch in Abb. 18.4 dargestellt.
n 6 5 4 3
l
s
p
d
f
g
0
1
2
3
4
2 1 Abb. 18.4: Schematische Darstellung des Elektronenspektrums des Wasserstoffatoms. Die Zustände mit den Drehimpulsquantenzahlen l = 0, 1, 2, 3, 4, . . . wurden historisch mit den Buchstaben s, p, d, f, g, . . . bezeichnet.
18.4 Spektrum des Wasserstoffatoms
| 393
E n2 }ω
E n1
Abb. 18.5: Abregung des Atoms unter Emission eines Photons.
Für n → ∞ nähert sich die Energie (18.23) der gebundenen Zustände der Ionisa tionsschwelle E = 0. Für E > 0 sind die Elektronen nicht mehr gebunden, und die Eigenfunktionen sind durch (Kugel-)Wellen bzw. Wellenpakete gegeben. Durch äußere elektromagnetische Felder können die Elektronen der Atome auf hö here Bahnen angeregt werden. Die angeregten Elektronen regen sich anschließend wie der durchAbgabevonelektromagnetischer Strahlungab. Beim Übergangvoneinem Zu stand E n2 in einen Zustand mit der Energie E n1 < E n2 beträgt die abgestrahlte Energie ∆E = E n2 − E n1 = Z 2 R (
1 1 − 2) . 2 n1 n2
Diese abgestrahlte Energie ist dann gleich der Energie ℏω des bei dem Übergang ab gestrahlten Photons, siehe Abb. 18.5. Die Übergänge der Elektronen in bestimmte gebundene Zustände werden zu Seri en zusammengefasst. Die Übergänge in den Grundzustand n1 = 1 werden als LymanSerie, die in den ersten angeregten Zustand n1 = 2 als Balmer-Serie und die in den zweiten angeregten Zustand n1 = 3 als Paschen-Serie bezeichnet, siehe Abb. 18.6.
(n → ∞) 0 n= 4 n= 3
P aschen
n= 2 Balmer
n= 1 Lymann
Abb. 18.6: Spektralserien des Wasserstoffspektrums.
394 | 18 Das Wasserstoffatom Die Energie, die benötigt wird, um das Elektron aus dem Grundzustand (n = 1) zur Energie E = 0 anzuregen, wird als Ionisationsarbeit bezeichnet: E I = (E = 0 − E n=1 ) = R ≃ 13,6 eV . Da bei der Anregung bzw. Abregung die Elektronen von einem Drehimpulseigenzu stand in einen anderen Drehimpulseigenzustand springen, muss die dabei absorbier te bzw. emittierte Strahlung ebenfalls einen wohldefinierten Drehimpuls besitzen. Es zeigt sich, dass Übergänge mit ∆l = ±1 bevorzugt sind, da die zugehörige Strahlung eine Dipolstrahlung ist, die, wie wir aus der Elektrodynamik wissen, bei der Multipol entwicklung als dominante Strahlung auftritt.
18.5 Die Wellenfunktionen Wir haben oben die Radialfunktionen für die gebundenen Zustände in Form einer endlichen Potenzreihe gefunden. Der Entwicklungskoeffizient c0 ist durch die Nor mierungsbedingung festgelegt. Alle weiteren Entwicklungskoeffizienten c k>0 können dann aus der Rekursionsbeziehung (18.20) bestimmt werden. Die damit erhaltenen Radialfunktionen lassen sich durch die sogenannten zugeordneten Laguerre-Funktio nen ausdrücken. Wir wollen das Ergebnis ohne Beweis angeben. Die (einfachen) Laguerre-Polynome lassen sich mittels der Rodrigues-Formel L p (ξ) = e ξ
d p −ξ p (e ξ ) dξ p
darstellen. L p (ξ) ist offensichtlich ein Polynom p-ten Grades. Die Laguerre-Polynome unterster Ordnung lauten: L0 (x) = 1 , L1 (x) = −x + 1 , L2 (x) = x2 − 4x + 2 , L3 (x) = −x3 + 9x2 − 18x + 6 , L4 (x) = x4 − 16x3 + 72x2 − 96x + 24 . Offenbar gilt L k (x = 0) = k! und L k (x → ∞) = (−1)k x k .
18.5 Die Wellenfunktionen | 395
Die zugeordneten Laguerre-Polynome, auch Laguerre-Funktionen genannt, sind durch die Gleichung³ dq q L p (ξ) = L p (ξ) dξ q definiert. Sie stellen Polynome vom Grad p − q dar und repräsentieren eine spezielle konfluente hypergeometrische Reihe. Sie genügen der Orthogonalitätsbedingung: ∞
q
∫ dx x q+1 e−x L p (x)L p (x) = q
0
(2p − q + 1)(p!)3 δ pp δ qq . (p − q)!
(18.24)
Für die Radialfunktionen im Coulomb-Potenzial erhalten wir dann: 1/2
R nl (r) =
(n − l − 1)!(2κ)3 u nl (r) =[ ] r 2n ((n + l)!)3
(2κr)l e−κr L2l+1 n+l (2κr) .
(18.25)
Mit der oben angegebenen Orthogonalitätsbeziehung (18.24) zeigt man leicht, dass diese Radialfunktionen in der Tat die korrekte Normierung besitzen. Die Gesamtwel lenfunktion der Elektronen im Coulomb-Potenzial ist dann durch φ nlm (x) = R nl (r)Y lm (x)̂ gegeben. Im Folgenden wollen wir die Wellenfunktionen der Zustände mit maximalem Drehimpuls l = n − 1 bei gegebener Hauptquantenzahl n etwas genauer betrachten. Für diese Zustände gilt nach (18.21) offenbar k max = 0. Die Polynome L(ρ) sind dann durch eine Konstante gegeben. Die Radialfunktionen nehmen deshalb eine sehr ein fache Gestalt für diese Quantenzahlen an. Drücken wir die Radialfunktion durch den ursprünglichen Radius r aus, so nimmt diese die Gestalt R n,l=n−1(r) = C nl r l e−κr
(18.26)
an. Diese Funktionen sind qualitativ für die ersten Hauptquantenzahlen n = 1, 2, 3 in Abb. 18.7 dargestellt. Für den Grundzustand n = 1 gibt es nur den Zustand mit (maximalem) Drehimpuls l = 0. Für diesen Zustand ist die Radialfunktion durch eine exponentiell abklingende Funktion gegeben. Entsprechend hält sich das Teilchen do minant in der Nähe des Koordinatenursprungs auf. Mit steigender Hauptquantenzahl
3 Wir benutzen hier die in der Quantenmechanik übliche Definition der (zugeordneten) LaguerrePolynome, die sich leicht von der in der mathematischen Literatur verwendeten L n (x) = unterscheidet.
e x d n −x n (e x ) , n! dx n
L kn (x) = (−1)k
dk L n+k (x) dx k
396 | 18 Das Wasserstoffatom
Rn,l=n−1/κ3/2
2 n= 1 n= 2 n= 3
1.5 1 0.5 0
0
1
2
κr
3
4
5
Abb. 18.7: Die Radialfunktionen R nl (r) der Eigenzustände mit maximalem Drehimpuls l = n − 1 für gegebene Hauptquantenzahl n = 1, 2, 3.
sind die Zustände mit maximalem Drehimpuls l = n − 1 mehr und mehr lokalisiert, wobei der Ort der Lokalisierung zu immer größerem r wandert, wie wir am Ende dieses Abschnittes noch explizit sehen werden. Mit der üblichen Normierung ∞
∫ dr r2 |R nl (r)|2 = 1 0
und unter Benutzung der Beziehung (B.1) ∞
∫ dx x n e−x = n! 0
finden wir für den Normierungskoeffizienten in der Radialfunktion (18.26): C nl = √
(2κ)2l+3 . (2l + 2)!
Abschließend betrachten wir noch einmal die Wellenfunktion des Grundzustandes (n = 1, l = 0). Für diesen Zustand reduziert sich der oben angegebene Ausdruck für die Radialfunktion auf: R10 (r) = √4κ 3 e−κr . Beachten wir außerdem, dass die Kugelfunktion Y lm für verschwindenden Drehim puls durch die Konstante 1 Y00 (x)̂ = = const. √4π gegeben ist, so lautet die normierte Wellenfunktion des Grundzustandes: φ n=1,l=0,m=0(x) = √
κ 3 −κr e . π
18.5 Die Wellenfunktionen | 397
Für die Energie des Grundzustandes erhalten wir aus (18.23): E1 = −Z 2 R . Mit dem Ausdruck (18.8) für R reduziert sich die zugehörige Wellenzahl (18.12) κ auf κ(E1 ) =
Z , a
wobei a der Bohr’sche Atomradius (18.7) ist. Dieses Ergebnis zeigt, dass für die ge bundenen Zustände die zugehörige Wellenlänge λ ∼ 1/κ durch den Bohr’schen Atom radius gegeben ist. Ferner zeigt dieser Ausdruck auch, dass mit wachsender Kernla dungszahl Z diese Wellenlänge und damit die effektive Ausdehnung des Atoms immer kleiner wird. Dies ist verständlich, da mit wachsendem Z das Elektron mehr und mehr an den Atomkern gebunden wird. Führen wir den reduzierten Bohr’schen Atomradius ein, ā =
a , Z
so nimmt die Wellenfunktion des Grundzustandes schließlich die Gestalt
φ100 (r) = √
1 −r/ā e π ā 3
(18.27)
an. Diese Darstellung zeigt explizit, dass ā die Ausdehnung des Grundzustandes ist. Die oben bereits anhand der Wellenfunktion festgestellte zunehmende Lokalisie rung der Zustände mit maximalem Drehimpuls l = n − 1 bei wachsendem n zeigt sich auch an der Ortsunschärfe. Für beliebige Quantenzahlen lässt sich aus (18.25) un ter Ausnutzung der Differenzialgleichung der Laguerre-Polynome nach längerer Rech nung folgende Rekursionsbeziehung für die Erwartungswerte ∞
⟨r k ⟩nl = ⟨nlm|r k |nlm⟩ = ∫ drr2+k (R nl (r))2 0
ableiten: k k+1 k ⟨r ⟩nl − (2k + 1) ā ⟨r k−1 ⟩nl + [(2l + 1)2 − k 2 ] ā 2 ⟨r k−2 ⟩nl = 0 , 4 n2 wobei k + 2l + 1 > 0. Setzt man hier nacheinander k = 0, 1, 2, so erhält man 1 ̄ 2 an 1 2 ̄ ⟨r⟩nl = a(3n − l(l + 1)) 2 n2 2 ⟨r2 ⟩nl = ā [5n2 − 3l(l + 1) + 1] . 2
⟨r−1 ⟩nl =
398 | 18 Das Wasserstoffatom Speziell für die Eigenzustände mit maximalem Drehimpuls l = n − 1 reduzieren sich diese Ausdrücke auf: 1 ̄ (n + ) , ⟨r⟩n,l=n−1 = an 2 1 2 2 2 ⟨r ⟩n,l=n−1 = ā n (n + 1) (n + ) . 2 Hieraus finden wir für die radiale Unschärfe: ̄ √ ∆r n,n−1 = √⟨r2 ⟩n,n−1 − (⟨r⟩n,n−1 ) = an 2
1 1 (n + ) . 2 2
Für die relative radiale Schwankung erhalten wir damit: ∆r 1 . = ⟨r⟩ n,l=n−1 √2n + 1 Im Limes n → ∞ geht die radiale Schwankung gegen null, und die Elektronenorbita le werden gut lokalisierte Objekte, für die das Konzept einer klassischen Bahn einen Sinn ergibt. Dieses Resultat ist in Übereinstimmung mit unseren Betrachtungen zur semiklassischen Näherung bzw. mit dem klassischen Korrespondenzprinzip.
18.6 Algebraische Bestimmung des Wasserstoffspektrums Bei der Lösung der stationären Schrödinger-Gleichung für das Coulomb-Potenzial ha ben wir eine zusätzliche Entartung der Energieeigenzustände festgestellt. Obwohl das effektive Potenzial drehimpulsabhängig ist, sind die resultierenden Energieeigenwer te unabhängig vom Drehimpuls. Diese zufällige Entartung des Wasserstoffspektrums ist eine Konsequenz einer verborgenen Symmetrie des Wasserstoff-Hamiltonians. Zur Auffindung dieser Symmetrie betrachten wir zunächst die klassische Bewegung eines geladenen Teilchens im Coulomb-Feld.
18.6.1 Der Runge-Lenz-Vektor Für ein beliebiges Zentralpotenzial liegen wegen der Drehimpulserhaltung die klassi schen Trajektorien in einer Ebene. Sie bilden jedoch i. A. keine geschlossene Trajekto rie, sondern die Bahnen lassen sich als nicht geschlossene, sich „drehende Ellipsen“ charakterisieren, die eine sogenannte Rosettenbahn bilden. Das Coulomb-Potenzial bildet wie das Gravitationspotenzial eine Ausnahme: Die klassischen Teilchenbahnen sind hier geschlossene Ellipsen, in deren einem Brennpunkt das Kraftzentrum liegt (siehe Abb. 18.8) und deren Hauptachsen fest im Raum stehen. Dies ist eine Folge der Erhaltung des sogenannten Runge-Lenz-Vektors M=
1 p × L − ᾱ x̂ , m
(18.28)
18.6 Algebraische Bestimmung des Wasserstoffspektrums
| 399
x
b M
χ ϕ e
x
a
Abb. 18.8: Klassische Bahn (Kepler-Ellipse) einer Punktladung im Coulomb-Feld und Runge-LenzVektor M. Die Exzentrizität ist durch ε = e/a gegeben, wobei a die Länge der großen Halbachse und e der Abstand des Brennpunktes vom Mittelpunkt der Ellipse sind.
wobei wir die Abkürzung Ze2 = ℏcZα 4π verwendet haben. Aus der Definition dieses Vektors ist zunächst klar, dass er senk recht auf dem Drehimpuls L = x × p steht: ᾱ =
L⋅M =0.
(18.29)
Durch elementare Rechnungen lässt sich leicht zeigen, dass für die Bewegung im Cou lomb-Potenzial ᾱ Ze2 =− (18.30) V(r) = − 4πr r der Vektor M erhalten bleibt: Da L̇ = 0 haben wir 1 Ṁ = ṗ × L − ᾱ ẋ̂ . m
(18.31)
Aus der klassischen Bewegungsgleichung ṗ = −∇V(r) erhalten wir mit ∇
1 1 = − 2 x̂ r r
für das Coulomb-Potenzial (18.30) ṗ = − und somit
ᾱ Ze2 x̂ = − 2 x̂ 2 4πr r
1 ̇̂ . Ṁ = −ᾱ ( 2 x̂ × L + x) mr
Beachten wir, dass x̂ × L = x̂ × (x × p) = m x̂ × (x × x)̇ = mr x̂ × (x̂ × x)̇
(18.32)
400 | 18 Das Wasserstoffatom
und ẋ = so folgt
d (r x)̂ = r ̇x̂ + r ẋ̂ , dt
̇̂ = −mr2 ẋ̂ , x̂ × L = mr2 x̂ × (x̂ × x)
wobei wir im letzten Schritt
(18.33)
x̂ ⋅ ẋ̂ = 0
2 x̂ = 1 ,
benutzt haben. (Die zweite dieser beiden Beziehungen folgt durch Ableitung der ers ten.) Einsetzen von (18.33) in (18.31) liefert Ṁ = 0. Wegen (18.29) liegt M in der Bewegungsebene der klassischen Ladung. Um seine genaue Lage zu erkennen, multiplizieren wir M skalar mit dem Ortsvektor: 1 ̄ ⋅ x̂ x ⋅ (p × L) − αx m 1 1 = (x × p) ⋅ L − αr̄ = L 2 − αr̄ . m m
x⋅M =
(18.34)
Bezeichnen wir den Winkel zwischen x und M mit χ, x ⋅ M = r|M| cos χ , so folgt r (1 +
|M| L2 cos χ) = , ᾱ m ᾱ
wobei die rechte Seite aufgrund der Drehimpulserhaltung eine Konstante ist. Setzen wir hier χ=π−φ, so erhalten wir die Gleichung einer Ellipse r (1 − ε cos φ) = mit Exzentrizität ε=
L2 = const. m ᾱ
|M| . ᾱ
Diese Ellipse ist die Bahnkurve der klassischen Punktladung im Coulomb-Feld bei ge gebenem Drehimpuls L, wenn wir φ mit dem gewöhnlichen Azimutwinkel des Orts vektors x identifizieren, siehe Abb. 18.8. Damit ist die Lage des Runge-Lenz-Vektors bekannt: Er liegt auf der negativen großen Halbachse, siehe Abb. 18.8. (Man beach te, dass das Kraftzentrum, das sich in einem der Brennpunkte der Ellipse befindet, als Koordinatenursprung gewählt wurde.) Unter Benutzung von (18.34) erhalten wir durch elementare Rechnung für das Quadrat dieses Vektors M (18.28): M2 =
2H 2 L + ᾱ 2 , m
(18.35)
18.6 Algebraische Bestimmung des Wasserstoffspektrums
|
401
wobei H die klassische Hamilton-Funktion H=
ᾱ p2 p2 + V(r) = − 2m 2m r
ist. Aus dieser Darstellung ist bereits explizit ersichtlich, dass M 2 erhalten sein muss, da im Coulomb-Potenzial sowohl der Drehimpuls L als auch die Energie H erhalten sind. Die klassischen Betrachtungen legen nahe, dass auch in der Quantenmechanik der oben eingeführte Runge-Lenz-Vektor erhalten bleibt. Hierzu ist jedoch zunächst zu bemerken, dass aufgrund der Tatsache, dass p × L ≠ −L × p ist, das direkte Analo gon des Runge-Lenz Vektors keinen hermiteschen Operator bilden würde. Einen her miteschen Operator erhält man, wenn man die antisymmetrische Kombination
M=
1 (p × L − L × p) − ᾱ x̂ 2m
(18.36)
wählt. Wie in der klassischen Mechanik ist dieser Operator orthogonal zum Drehim pulsoperator L ⋅ M = M ⋅ L = 0̂ . (18.37) Dies ist offensichtlich für den letzten Term in Gleichung (18.36), da L senkrecht auf dem Ortsoperator x steht, siehe Gleichungen (15.14), (15.13). Dass L auch senkrecht auf dem Ausdruck in der Klammer steht, lässt sich leicht unter Ausnutzung der Kom mutationsbeziehung (15.10), (15.12) zeigen: L ⋅ (p × L − L × p) = ε klm L k (p l L m − L l p m ) = ε klm L k (p l L m + L m p l ) = ε klm L k ([p l , L m ] + 2L m p l ) = ε klm (L k iℏε lmn p n + [L k , L m ]p l ) = 2iℏL ⋅ p + iℏε klm ε kmn L n p l = 2iℏ (L ⋅ p − L ⋅ p) = 0 . Man zeigt auch leicht durch explizites Ausrechnen, dass der Operator M mit dem Ha milton-Operator eines Teilchens im Coulomb-Potenzial ᾱ p2 − 2m r
(18.38)
[M, H] = 0̂ .
(18.39)
H= kommutiert:
402 | 18 Das Wasserstoffatom
Dazu stellen wir den Runge-Lenz-Operator zunächst in der alternativen Form M=
i [p, L 2 ] − ᾱ x̂ 2mℏ
(18.40)
dar, die sich unter Benutzung der Kommutationsbeziehung (15.12) unmittelbar auf den Ausdruck (18.36) reduziert. Beachten wir, dass für ein Zentralpotenzial [L 2 , H] = 0, so haben wir i [[p, L 2 ] , H] − ᾱ [x,̂ H] 2mℏ i = [pL2 − L 2 p, H] − ᾱ [x,̂ H] 2mℏ i ([p, H] L2 − L 2 [p, H]) − ᾱ [ x,̂ H] = 2mℏ ᾱ 1 ([(∇ ) , L 2 ] + [x,̂ p 2 ]) . =− 2m r
[M, H] =
Mit (18.32) erhalten wir schließlich L2 ᾱ [ x,̂ p 2 − 2 ] 2m r ᾱ [x,̂ p2r ] = 0 , =− 2m
[M, H] = −
wobei wir Gleichung (17.6) benutzt haben. Der letzte Kommutator verschwindet, da x̂ nur von den Winkeln, p r (17.5) aber nur vom Radius abhängt. Da M nicht explizit von der Zeit abhängt, drückt Gleichung (18.39) die quantenme chanische Erhaltung des Runge-Lenz-Operators im Coulomb-Potenzial aus. Für das Quadrat dieses Vektors erhalten wir hier: M2 =
2H 2 (L + ℏ2 ) + ᾱ 2 . m
(18.41)
Dieser Ausdruck unterscheidet sich von dem entsprechenden klassischen Ausdruck (18.35) durch einen zusätzlichen Term der Ordnung ℏ2 , der offensichtlich mit dem Nichtkommutieren von p und L zusammenhängt. Gleichung (18.41) zeigt, dass ein Eigenzustand vom Hamilton-Operator H, der hier wegen des Zentralpotenzials auch gleichzeitig Eigenfunktion zum Drehimpuls L2 ist, ebenfalls Eigenfunktion von M 2 ist.
18.6.2 Verallgemeinerte Drehimpulsalgebra und Energieeigenwerte Wie jeder vektorielle Operator besitzt der Runge-Lenz-Vektor mit dem Drehimpulsope rator die Kommutationsbeziehung (15.15) [L i , M j ] = iℏϵ ijk M k .
(18.42)
18.6 Algebraische Bestimmung des Wasserstoffspektrums
| 403
Diese Beziehung lässt sich natürlich auch direkt beweisen, ohne auf Gleichung (15.15) zurückzugrei fen. Da sie linear in M ist, genügt es, die Kommutatoren der einzelnen Terme in M (18.36) mit L k zu berechnen. Wir begnügen uns hier mit dem expliziten Beweis der Beziehung [L k , (p × L)l ] = iℏϵ klm (p × L)m , die natürlich auch ein Spezialfall von Gleichung (15.15) ist. Elementare Rechnungen liefern [L k , (p × L)l ] = ϵ lmn [L k , p m L n ] = ϵ lmn (p m [L k , L n ] + [L k , p m ]L n ) = ϵ lmn (p m iℏϵ knr L r + iℏϵ kmr p r L n ) , wobei wir im letzten Schritt Gleichungen (15.10) und (15.12) benutzt haben. Unter Ausnutzung der Ei genschaften des ε-Tensors, ε klr ε mnr = δ km δ ln − δ kn δ lm , finden wir schließlich [L k , (p × L)l ] = iℏ (−δ lk δ mr + δ lr δ mk ) p m L r + iℏ (δ lk δ nr − δ lr δ nk ) p r L n = iℏϵ kls ε mrs p m L r = iℏε kls (p × L)s , wobei sich die unterstrichenen Terme aufgehoben haben.
Ähnlich wie beim Drehimpulsoperator L k sind auch nicht alle Komponenten des Runge-Lenz-Vektors M k gleichzeitig scharf messbar. Dies folgt aus der Kommutati onsbeziehung 2H [M i , M j ] = iℏϵ ijk (− (18.43) ) Lk , m die sich unmittelbar aus der Definition von M (18.36) oder (18.40) ergibt. Hierbei ist H der quantenmechanische Hamilton-Operator (18.38) mit dem Coulomb-Potenzial. Da M i und L i mit dem Hamilton-Operator kommutieren, führen sie einen Eigenzu stand von H in einen Eigenzustand zur selben Energie über, d. h., M i und L i bilden den Unterraum der Eigenzustände von H zum Eigenwert E auf sich ab. (Mit anderen Wor ten: Falls |φ⟩ Eigenfunktion von H zum Eigenwert E ist, so sind auch M i |φ⟩ und L i |φ⟩ Eigenfunktion von H zum selben Eigenwert E). Wir können uns deshalb im Folgenden auf den Hilbert-Raum beschränken, der zu einem festen Eigenwert E von H gehört. In diesem Hilbert-Raum können wir H auf der rechten Seite von Gleichung (18.43) durch diesen Energieeigenwert E ersetzen. Die sechs Operatoren L i , M i (i = 1, 2, 3) bilden dann eine geschlossene Algebra, die durch die Gleichungen (18.43), (18.42) und (15.10) definiert ist. Diese Algebra lässt sich in die Standardform bringen, wenn wir die ums kalierten Generatoren m M = M √− 2E
404 | 18 Das Wasserstoffatom verwenden. (Man beachte, dass für gebundene Zustände E < 0 gilt!) Zusammen mit dem Drehimpulsoperator erfüllen diese dann die Kommutationsbeziehungen [M i , M j ] = iℏϵ ijk L k , [L i , M j ]
=
iℏϵ ijk M k
,
[L i , L j ] = iℏϵ ijk L k .
(18.44) (18.45) (18.46)
Diese Kommutationsbeziehungen definieren die Lie-Algebra der Gruppe O(4) bzw. SO(4). Diese Algebra lässt sich noch vereinfachen, wenn wir anstatt der Operatoren L i und M i ihre Summe bzw. Differenz I=
1 (L + M ) , 2
K=
1 (L − M ) 2
(18.47)
einführen. Es ist klar, dass auch diese so definierten Operatoren I und K eine geschlos sene Algebra bilden. In der Tat finden wir: [I i , I j ] = iℏϵ ijk I k , [K i , K j ] = iℏϵ ijk K k , [I i , K j ] = 0̂ . Die Operatoren I i und K i besitzen dieselben Kommutationsbeziehungen wie die Kom ponenten des Drehimpulsoperators. Da außerdem die I i mit den K j kommutieren, bilden sie zwei unabhängige Drehimpulsalgebren. Auf diese Weise haben wir die LieAlgebra der SO(4)-Gruppe in zwei unabhängige SO(3)- bzw. SU(2)-Algebren zurück geführt.⁴ Die Drehimpulsoperatoren generieren die diagonale SO(3)-Untergruppe der SO(4)-Gruppe, die wir als SO(3)diagonal bezeichnen. Die Operatoren M i hingegen erzeu gen keine abgeschlossene Gruppe, was an ihren Kommutationsbeziehungen (18.44) ersichtlich ist.⁵ Was sich hinter diesen gruppentheoretischen Aussagen verbirgt, wer den wir im Detail noch erfahren. Da M und L mit H kommutieren, ist klar, dass die so eingeführten Operato ren (18.47) I und K ebenfalls mit dem Hamilton-Operator kommutieren müssen.
4 Dies ist Ausdruck der Tatsache, dass die SO(4)-Gruppe in einem direkten Produkt von zwei SU(2)-Gruppen enthalten ist. Es gilt der Zusammenhang SO(4) ≃ (SU(2) × SU(2))/Z(2) , wobei Z(2) die diskrete Gruppe aus den beiden Elementen {1,̂ −1} ist. 5 Sie erzeugen den sogenannten Coset SO(4)/SO(3)diagonal .
18.6 Algebraische Bestimmung des Wasserstoffspektrums
| 405
Demzufolge liefern das Quadrat dieser Operatoren und eine Projektion gute Quanten zahlen. Da diese Operatoren die Drehimpulsalgebra erfüllen, kennen wir bereits ihre Eigenwerte: Wir erinnern hier daran, dass die Eigenwerte des Drehimpulses allein Konsequenz der Drehimpulsvertauschungsrelationen (18.46), d. h. der SU(2)-Algebra, waren. Für die Eigenwerte der Operatoren I 2 und K 2 haben wir deshalb: I 2 : ℏ2 i(i + 1) , K 2 : ℏ2 k(k + 1) ,
1 , 1, . . . , 2 1 k = 0, , 1, . . . . 2 i = 0,
Diese Größen bleiben offensichtlich bei der Bewegung im Coulomb-Potenzial erhal ten. Wir bezeichnen deshalb diese Operatoren als verallgemeinerte Drehimpulsopera toren. Wenn die Quadrate von I und K, I2 =
1 (L + M )2 , 4
K2 =
1 (L − M )2 , 4
erhalten bleiben, dann müssen auch deren Summe bzw. Differenz, 1 2 (L + M 2 ) , 2 C = I 2 − K 2 = L ⋅ M , C = I2 + K2 =
(18.48)
unabhängig erhalten sein, die als Casimir-Operatoren bezeichnet werden. (Man be achte, dass wegen (18.45) L ⋅ M = M ⋅ L gilt.) Wie wir oben gesehen hatten (siehe Gleichung (18.37)), steht der Runge-Lenz Vektor M stets senkrecht auf dem Drehim pulsvektor L. Damit gilt auch: L ⋅ M = 0̂ , und der Casimir-Operator C verschwindet identisch im Coulomb-Potenzial. Die Be wegung im Coulomb-Potenzial erfasst deshalb nur den Teil der SO(4)-Gruppe, für den I2 = K2
(18.49)
gilt. In diesem Teil der SO(4)-Gruppe hat der Casimir-Operator C (18.48) dann wegen i = k die Eigenwerte (18.50) C : 2ℏ2 k(k + 1) . Setzen wir in den Ausdruck für C (18.48) den Ausdruck für das Quadrat des RungeLenz-Vektors (18.41) ein, so erhalten wir: C=
1 2 1 m 2 (L + M 2 ) = (L 2 − M ) 2 2 2E 1 m 2 ℏ2 m 2 = (L 2 − L2 − ℏ2 − ᾱ ) = − − ᾱ . 2 2E 2 4E
(18.51)
406 | 18 Das Wasserstoffatom
Identifizieren wir diesen Ausdruck mit dem Eigenwert des Casimir-Operators (18.50), −
ℏ2 ℏ2 1 m 2 ᾱ = C + = 2ℏ2 k(k + 1) + = ℏ2 (2k 2 + 2k + ) 4E 2 2 2 ℏ2 (2k + 1)2 , = 2
so erhalten wir für die Energie des gebundenen Zustandes den Ausdruck E=−
m 2 ᾱ 4
1 ℏ2 2 (2k
+ 1)2
.
Dieser Ausdruck lässt sich in die Form α2 Z 2 1 E = − mc2 2 (2k + 1)2
(18.9)
=
−
Z2 R (2k + 1)2
bringen, welche mit dem früher gewonnenen Ergebnis (18.23) übereinstimmt, falls wir setzen: n = 2k + 1 . (18.52) In der Tat liefert diese Beziehung bei gegebenen (verallgemeinerten) Drehimpuls quantenzahlen k = 0, 1/2, 1, 3/2, . . . die korrekten Hauptquantenzahlen n = 1, 2, 3, 4, . . . . Man überzeugt sich leicht, dass auch die gewöhnlichen Drehimpulsquan tenzahlen richtig reproduziert werden. Dazu bemerken wir, dass nach den obigen algebraischen Beziehungen (18.47) der Drehimpulsoperator L sich durch die verallge meinerten Drehimpulse I und K ausdrücken lässt: L=I+K. Diese Gleichung stellt die vektorielle Addition zweier (verallgemeinerter) Drehimpulse zum Gesamtbahndrehimpuls L dar. Nach den Gesetzen der Vektoraddition muss die Quantenzahl l des Gesamtdrehimpulses L der Dreiecksrelation (15.76) |i − k| ≤ l ≤ i + k genügen. Für i = k (siehe Gleichung (18.49)) reduziert diese sich auf: 0 ≤ l ≤ 2k . Mit dem Wertebereich für die Quantenzahl k eines Drehimpulses, der auch halbzah lige Werte annehmen kann, finden wir für die Drehimpulsquantenzahl l die korrek ten (ganzzahligen) Werte. Drücken wir in der letzten Beziehung die verallgemeinerte Drehimpulsquantenzahl k mittels der Beziehung (18.52) durch die Hauptquantenzahl n aus, so finden wir für l den Wertebereich 0≤ l ≤ n−1,
18.7 Warum das Coulomb-Problem exakt lösbar ist
| 407
was mit dem früheren Ergebnis (18.22) übereinstimmt. Damit ist es uns auf rein al gebraische Art gelungen, das Wasserstoffspektrum zu bestimmen. Dieser Weg wurde ursprünglich von W. Pauli beschritten, der unabhängig von E. Schrödinger auf diese Art die Eigenzustände und Eigenwerte des Wasserstoffatoms bestimmt hat. Bei der obigen Bestimmung der Energieeigenwerte haben wir außerdem gesehen, dass bei der Berechnung des relevanten Casimir-Operators C der Drehimpulsoperator L 2 herausfällt, siehe Gleichung (18.51), was dann zu der zusätzlichen Entartung der Energieeigenwerte in der Drehimpulsquantenzahl führt.
18.7 Warum das Coulomb-Problem exakt lösbar ist: Äquivalenz zum vierdimensionalen harmonischen Oszillator Der aufmerksame Leser wird sich fragen, wieso die Schrödinger-Gleichung für das Coulomb-Potenzial exakt lösbar ist. Denn wie wir im Kapitel 7 gesehen haben, ist das Lösen der Schrödinger-Gleichung äquivalent zur Berechnung des Funktionalintegrals für die Übergangsamplitude. Es lassen sich jedoch nur Gauß’sche Funktionalintegrale exakt (analytisch) berechnen. Für exakt lösbare Probleme ist das Potenzial deshalb höchstens ein quadratisches Polynom der Koordinaten. Durch geeignete Koordinaten transformationen lässt sich das Coulomb-Problem auf das eines vierdimensionalen harmonischen Oszillators überführen, wie wir nachfolgend anhand der SchrödingerGleichung zeigen werden.
18.7.1 Einbettung des ℝ3 in den vierdimensionalen Raum Um die Äquivalenz des Coulomb-Problems in ℝ3 mit einem vierdimensionalen har monischen Oszillator zu zeigen, stellen wir zunächst die kartesischen Koordinaten x i=1,2,3 in der Form x i = z† σ i z
(18.53)
dar, wobei σ i=1,2,3 die Pauli-Matrizen (15.44) und z1 z=( ), z2
z† = (z∗1 , z∗2 )
zweikomponentige komplexe Spinoren sind, deren Komponenten wir durch vier reelle Variablen u μ=1,2,3,4 parametrisieren: z1 = u 1 + iu 2 ,
z2 = u 3 + iu 4 .
408 | 18 Das Wasserstoffatom Die vier reellen Koordinaten −∞ < u μ < ∞ spannen offenbar einen vierdimensiona len Raum auf, der wegen der Beziehung (18.53) unseren gewöhnlichen ℝ3 als Unter raum enthält. Benutzt man die Vollständigkeit der Pauli-Matrizen (15.45), 3
∑ (σ i )ab (σ i )cd = 2δ ad δ bc − δ ab δ cd , i=1
so findet man aus (18.53) durch Berechnung von r2 = x 2 für den Radius 4
r = z† z = ∑ (u μ )2 =: u 2 .
(18.54)
μ=1
Mit der Parametrisierung
z 1 = √r cos(θ/2)e −iφ/2 e iα z 2 = √r sin(θ/2)e iφ/2 e iα
(18.55)
liefert Gleichung (18.53) die Darstellung der kartesischen Koordinate x i in den üblichen sphärischen Koordinaten (r, θ, φ): x1 = r sin θ cos φ x2 = sin θ sin φ x3 = r cos θ . Der Winkel α ∈ [0, 2π] fällt offensichtlich heraus.
Mit der expliziten Form der Pauli-Matrizen (15.44) finden wir aus (18.53): x1 = 2 (u 1 u 3 + u 2 u 4 ) x2 = 2 (u 1 u 4 − u 2 u 3 ) x3 = u 21 + u 22 − u 23 − u 24 . Bilden wir das Differenzial dx i = ∑ μ
∂x i du μ , ∂u μ
(18.56)
so erhalten wir hieraus u3 dx1 (dx2 ) = 2 ( u 4 dx3 u1
u4 −u 3 u2
u1 −u 2 −u 3
du 1 u2 du 2 ). u1 ) ( du 3 −u 4 du 4
(18.57)
Die Abbildung u μ → x i (u) ist nicht umkehrbar, da ein Punkt x ∈ ℝ3 eine ganze Kurve im vierdimensionalen Parameterraum repräsentiert, der durch die Koordinaten {u μ } aufgespannt wird. Um den Laplace-Operator ∆ = ∑3i=1 ∂2 /∂x2i durch Ableitungen nach den neuen Koordinaten u μ auszudrücken, benötigen wir jedoch die Invertierung der
18.7 Warum das Coulomb-Problem exakt lösbar ist
| 409
Gleichung (18.56). Um die Transformation u μ → x i (u) invertierbar zu machen, führen wir eine fiktive vierte Dimension ein, deren kartesische Koordinate wir mit x4 bezeich nen. Wir wählen diese Koordinate bzw. ihr Differenzial so, dass die auf vier Dimensio nen erweiterte Gleichung (18.56) invertierbar ist, d. h., wir fordern eine Beziehung dx i = ∑ μ
∂x i ! du μ = 2 ∑ Q iμ du μ , i = 1, 2, 3, 4 , ∂u μ μ
(18.58)
sodass die 4 × 4-Matrix Q iμ invertierbar ist. Der Faktor 2 wurde in Analogie zu Gleichung (18.57) gewählt. Die ersten drei Zeilen dieser Matrix sind bereits in Glei chung (18.57) definiert. Die vierte Zeile, die zu der fiktiven Dimension gehört, ergän zen wir so, dass diese orthogonal zu den drei bereits vorhandenen Zeilenvektoren ist. Dies führt auf⁶ u3 u4 u1 u2 u 4 −u 3 −u 2 u 1 Q iμ = ( ) (18.59) u 1 u 2 −u 3 −u 4 u 2 −u 1 u 4 −u 3 und garantiert, dass diese Matrix für u 2 ≠ 0 nicht singulär ist. In der Tat findet man durch Matrixmultiplikation die Beziehung Q T Q = u 2 1̂ , wobei 1̂ die vierdimensionale Einheitsmatrix ist. Hieraus erhalten wir Q T = u 2 Q−1 ≡ rQ−1
(18.60)
und damit für ihre Determinante det Q = √det Q det Q T = √det QQ T = (u 2 )2 = r2 . (Gleichung (18.60) zeigt, dass die Matrix Q/√u 2 orthogonal ist.) In dem fiktiven vierdimensionalen euklidischen Raum können wir Gleichung (18.58) invertieren und erhalten du μ = bzw.
1 ∑(Q−1 )μi dx i 2 i
∂u μ 1 −1 1 1 = (Q )μi = (Q T )μi = Q iμ , ∂x i 2 2u 2 2u 2
(18.61)
6 Man beachte, dass in jeder Spalte und jeder Zeile von Q iμ jede Koordinate u 1 , u 2 , u 3 , u 4 genau ein mal auftritt. Dies legt die Verteilung der u μ in der vierten Zeile bereits bis auf ihr Vorzeichen fest. Die Vorzeichen der u μ in der vierten Zeile ergeben sich aus der Orthogonalität zu den drei übrigen Zeilen. Die Transformation x i → ∑μ Q iμ u μ mit Q iμ (18.59) stammt ursprünglich aus der Astronomie und wird dort als Kustaanheimo-Stiefel-Transformation bezeichnet.
410 | 18 Das Wasserstoffatom
wobei wir Gleichung (18.60) benutzt haben. Damit können wir die Ableitungen nach den kartesischen Koordinaten x i durch die nach den Parametern u μ ausdrücken. Wegen ∂u μ ∂ ∂ =∑ (18.62) ∂x i μ ∂x i ∂u μ erhalten wir mit (18.61) ∂ 1 ∂ = ∑ Q iμ . ∂x i 2u 2 μ ∂u μ
(18.63)
Hieraus finden wir für den vierdimensionalen Laplace-Operator 4
∂ ∂ ∂x i ∂x i i=1
∆(4) = ∑
(18.64)
die Darstellung 4
1 ∂ 1 ∂ ∑ Q iμ ∑ Q iν 2 2 ∂u ∂u 2u 2u μ ν μ ν i=1
∆(4) = ∑ =
∂ ∂ 1 ∑ ∑ Q iμ (Q−1 )νi , ∂u μ ∂u ν 4u 2 i μ
(18.65)
wobei wir im letzten Schritt Q iν = (Q T )νi = u 2 (Q−1 )νi benutzt haben, siehe Glei chung (18.60). Man beachte, dass die Matrix Q (18.59) von den u μ abhängt und wir deshalb den Ableitungsoperator ∂/∂u μ a priori nicht an Q−1 vorbeiziehen können; vielmehr gilt ∂ ∂ ∂ ∂ ∂ ∂ (Q−1 )νi =[ (Q−1 )νi ] + (Q−1 )νi , ∂u μ ∂u ν ∂u μ ∂u ν ∂u ν ∂u ν
(18.66)
wobei im ersten Term auf der rechten Seite ∂/∂u μ nur noch auf Q−1 wirkt. Einsetzen von (18.66) in (18.65) liefert ∆(4) =
4 4 ∂ ∂ ∂ 1 ∂ 1 −1 ∑ ∑ [ (Q ) ] Q + ∑ ∑ (Q−1 )νi Q iμ νi iμ 2 2 ∂u ν 4u μ,ν ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ ∂u μ ∂u ν 4u μ,ν i=1 ∂u μ i=1 δ νμ
=−
4 ∂ ∂ 1 ∂ ∂ 1 ∑ ∑ (Q−1 )νi ∑ [ Q iμ ] + ∑ , 2 ∂u μ ∂u ν 4u 2 μ ∂u μ ∂u μ 4u ν i=1 μ
wobei wir im ersten Term (∂Q−1 )Q = −Q−1 ∂Q benutzt haben. Aus der expliziten Form der Matrix Q (18.59) findet man unmittelbar ∑ μ
∂ Q iμ = 0 . ∂u μ
Damit erhalten wir schließlich ∆(4) =
∂2 1 ∑ 2 . 2 4u μ ∂u μ
(18.67)
18.7 Warum das Coulomb-Problem exakt lösbar ist
| 411
18.7.2 Transformation der Schrödinger-Gleichung Wir schreiben die Schrödinger-Gleichung (18.10) des Coulomb-Problems in der Form (−
ℏ2 Ze2 ∆ − E) φ(x) = φ(x) . 2m 4πr
(18.68)
Wir können hier den dreidimensionalen Laplace-Operator ∆ = ∑3i=1 ∂2 /∂x2i durch den vierdimensionalen Operator ∆(4) (18.64) ersetzen, wenn wir uns auf solche Wellen funktionen beschränken, die nicht von der fiktiven kartesischen Koordinate x4 ab hängen, d. h., der Randbedingung ∂ φ(x1 , x2 , x3 , x4 ) = 0 ∂x4
(18.69)
genügen. Einsetzen des Ausdruckes (18.67) für ∆ in die Schrödinger-Gleichung (18.68) liefert nach Multiplikation von links mit r = u 2 (18.54) (−
Ze2 ℏ2 4 ∂2 ϕ(u) , ∑ − Eu 2 ) ϕ(u) = 2 8m μ=1 ∂u μ 4π
(18.70)
wobei wir ϕ(u) ≡ ϕ(u 1 , u 2 , u 3 , u 4 ) = φ(x(u), x4 (u)) gesetzt haben. Mit (18.62) bzw. (18.63) lautet dann die Randbedingung (18.69) ∑ μ
∂u μ ∂ ϕ(u) = 0 ∂x4 u μ
bzw. ∑ Q4μ μ
∂ ϕ(u)=0 ∂u μ
(18.71)
oder mit der expliziten Form der Matrix Q (18.59) (u 2
∂ ∂ ∂ ∂ − u1 + u4 − u3 ) ϕ(u) = 0 . ∂u 1 ∂u 2 ∂u 3 ∂u 4
(18.72)
Nach Einführung der verallgemeinerten Drehimpulsoperatoren L μν = u μ p ν − u ν p μ ,
pμ =
ℏ ∂ i ∂u μ
(18.73)
können wir die Nebenbedingung (18.72) in der Form Lϕ(u) = 0
(18.74)
L = L12 + L34 .
(18.75)
schreiben mit
412 | 18 Das Wasserstoffatom
1.
2.
Im dreidimensionalen Unterraum u μ=1,2,3 sind die verallgemeinerten Drehimpulse L μν (18.73) mit den gewöhnlichen Drehimpulsen L μ über L μν = ε μνλ L λ verknüpft. Dieser Zusammenhang gilt je doch nur in drei Dimensionen, wo sich jeder Ebene eindeutig eine Koordinatenachse zuordnen lässt. Allgemein (in beliebigen Dimensionen) ist eine Drehung nicht mit einer Koordinatenachse, sondern mit einer Bewegung in einer Ebene verknüpft und muss folglich durch zwei Koordina tenachsen charakterisiert werden. Es existieren deshalb so viele unabhängige Drehungen wie es Koordinatenpaare gibt. In der Parametrisierung (18.55) findet man für den Drehimpuls L (18.75) die Darstellung L=
ℏ ∂ i ∂α
und somit aus (18.63) ∂ 1 ∂ =− . ∂x4 2r ∂α
Mit den Substitutionen M = 4m ,
−E =
1 Mω2 , 2
E=
Ze2 4π
(18.76)
geht Gleichung (18.70) in die Schrödinger-Gleichung des vierdimensionalen harmoni schen Oszillators in den Variablen u μ über: (−
ℏ2 4 ∂2 1 ∑ + Mω2 u 2 ) ϕ(u) = Eϕ(u) . 2 2M μ=1 ∂u μ 2
(18.77)
Die quantisierten (Pseudo-)Energien des vierdimensionalen harmonischen Oszilla tors (18.77) sind durch EN = ℏω(N + 2) (18.78) gegeben, wobei 4
N = ∑ nμ
(18.79)
μ=1
und n μ die Quantenzahlen der vier unabhängigen eindimensionalen harmonischen Oszillatoren in den μ-Richtungen des u μ -Parameterraumes sind und 2ℏω = 4ℏω/2 ihre Grundzustandsenergie ist. Die Gleichung (18.77) ist äquivalent zur Schrödinger-Gleichung des ursprüngli chen Coulomb-Problems (18.68), wenn man sich auf solche Oszillatorwellenfunktio nen beschränkt, die nicht von der fiktiven kartesischen Koordinate x4 = x4 (u 1 , u 2 , u 3 , u 4 ) abhängen, d. h. auf solche Wellenfunktionen, die der Nebenbedingung (18.71) bzw. (18.74) genügen. Der Hamilton-Operator in (18.77) beschreibt vier unabhängige harmonische Os zillatoren, die zu den vier kartesischen Koordinaten u μ=1,2,3,4 gehören. Durch die Randbedingung (18.74) an die Wellenfunktion sind die Oszillatoren 1, 2 mit den Os zillatoren 3, 4 gekoppelt. Um diese Randbedingung aufzulösen, führen wir zunächst
18.7 Warum das Coulomb-Problem exakt lösbar ist
| 413
die für den harmonischen Oszillator üblichen Erzeugungs- und Vernichtungsopera toren (12.39) durch pμ 1 uμ + iu 0 ) ( aμ = u ℏ √2 0 ein, wobei u0 = √
ℏ Mω
die Oszillatorlänge ist. Der Hamilton-Operator in (18.77) H=−
∂2 1 ℏ2 ∑ 2 + Mω2 u 2 2M μ ∂u μ 2
erlangt dann die bereits aus einer Dimension bekannte Form (vgl. (12.41)) 4
H = ℏω ( ∑ a†μ a μ + 2) .
(18.80)
μ=1
Seine Eigenfunktionen |n⟩ ≡ |n1 , n2 , n3 , n4 ⟩ sind die der Besetzungszahloperatoren n̂ μ = a†μ a μ ,
n̂ μ |n⟩ = n μ |n⟩ ,
n μ = 0, 1, 2, . . . ,
deren Ortsdarstellung die oben eingeführten Wellenfunktionen ϕ(u) = ⟨u|n⟩ ,
⟨u| ≡ ⟨u 1 , u 2 , u 3 , u 4 |
sind. Um die Bedingung (18.74) an die Wellenfunktionen aufzulösen, empfiehlt es sich in eine Basis zu gehen, in der die Drehimpulsoperatoren L12 , L34 diagonal sind. Wie in Abschnitt 16.5.1 für einen zweidimensionalen harmonischen Oszillator gezeigt wurde, gelingt dies durch Einführung der Operatoren (16.29) b± =
1 (a1 ∓ ia2 ) . √2
In dieser Basis nimmt der Drehimpulsoperator L12 die Gestalt (16.31) L12 = ℏ ( n̂ + − n̂ − )
(18.81)
an, wobei n̂ ± = b †± b ± die zugehörigen Besetzungszahloperatoren sind. Führen wir analoge Operatoren für die Oszillatoren in der 3- und 4-Richtung ein, B± =
1 (a3 ∓ ia4 ) , √2
414 | 18 Das Wasserstoffatom
so gilt analog zu (18.81) mit
L34 = ℏ(N̂ + − N̂ − )
(18.82)
N̂ ± = B†± B± .
Der Oszillator-Hamilton-Operator (18.80) lautet in der neuen Basis H = ℏω ( n̂ + + n̂ − + N̂ + + N̂ − + 2) . Seine Eigenfunktion können wir offensichtlich in der durch n̂ ± |n+ , n− , N+ , N− ⟩ = n± |n+ , n− , N+ , N− ⟩ N̂ ± |n+ , n− , N+ , N− ⟩ = N± |n+ , n− , N+ , N− ⟩ definierten Besetzungszahldarstellung (vgl. Gleichung (12.42)) wählen. Für die Ge samtoszillatorquantenzahl N (18.79) finden wir dann N = n+ + n− + N+ + N− ,
(18.83)
während sich die Bedingung (18.74) an die Wellenfunktion, L|n+ , n− , N+ , N− ⟩ = 0, mit (18.81) und (18.82) auf n+ − n− + N + − N − = 0 reduziert. Damit sind nur drei der vier Oszillatoren unabhängig. Mit dieser Beziehung ergibt sich die Gesamtoszillatorquantenzahl (18.83) zu N = 2(n+ + N+ ) , womit diese geradzahlig ist. Setzen wir deshalb N = 2(n − 1) ,
n = 1, 2, 3, . . . ,
(18.84)
so erhalten wir für die quantisierten Energien (18.78) En = 2ℏωn .
(18.85)
Nach Gleichung (18.76) müssen die den Coulomb-Wellenfunktionen entsprechenden Oszillatormoden n sämtlich die Pseudoenergie En =
Ze2 4π
besitzen. Da der Ausdruck auf der rechten Seite konstant ist, verlangt dies zusammen mit Gleichung (18.85), dass die durch Gleichung (18.76) definierte Oszillatorfrequenz ω für jede Mode n verschieden ist,⁷ d. h. ω = ω n , und die diskreten Werte ωn =
1 Ze2 2nℏ 4π
7 Dies ist nicht verwunderlich, da ω2 (bis auf einen konstanten Faktor) als Energieeigenwert (−E) der Ladung definiert ist, siehe Gleichung (18.76).
18.7 Warum das Coulomb-Problem exakt lösbar ist
| 415
annimmt. Einsetzen in Gleichung (18.76) liefert für die quantisierten Energien des Coulomb-Problems E n = −2mω2n 2
= −2m (
1 2 Ze2 ) ( ) 4π 2nℏ 2
Z2 1 e2 = − mc2 ( ) 2 2 4πc n = −R
Z2 , n2
wobei R die Rydberg-Konstante (18.8) und n (18.84) die Hauptquantenzahl sind. Dies sind die exakten Eigenenergien (18.23) des Coulomb-Problems. Auch die klassische Wirkung für eine Punktladung im Coulomb-Potenzial nimmt in den Variablen u μ die Form des vierdimensionalen harmonischen Oszillators an, und das zugehörige Funktionalintegral kann exakt ausgeführt werden.
19 Algebraischer Zugang zur Quantenmechanik* In Kapitel 12 hatten wir das Spektrum des Hamilton-Operators des harmonischen Oszillators auf rein algebraische Weise gefunden, ohne dabei die (stationäre) Schrö dinger-Gleichung, die eine Differenzialgleichung zweiter Ordnung bezüglich des Ortes ist, explizit lösen zu müssen. Lediglich zur Bestimmung der Grundzustandswellen funktion müssten wir eine Differenzialgleichung (12.61) erster Ordnung lösen. Die Wellenfunktionen der angeregten Zustände ergaben sich dann durch wiederholte Anwendung des Erzeugungsoperators auf die Grundzustandswellenfunktion, siehe Gleichung (12.65). In diesem Kapitel wollen wir die beim harmonischen Oszillator kennengelernte algebraische Methode verallgemeinern und auf beliebige HamiltonOperatoren ausdehnen, deren Spektrum nach unten beschränkt ist. (Diese Voraus setzung ist für die Hamilton-Operatoren sämtlicher physikalischer Systeme erfüllt.) Wir werden eine allgemeine Methode¹ entwickeln, die es erlaubt, die Eigenwerte und Eigenvektoren eines beliebigen hermiteschen Operators zu bestimmen, der nach un ten beschränkt ist und einen minimalen Eigenwert besitzt. (Für Operatoren, die nach oben beschränkt sind, können wir dasselbe Verfahren auf den negativen Operator anwenden.) Unser Vorgehen benutzt ausschließlich Methoden der Operatoralgebra und verlangt wie beim harmonischen Oszillator keine explizite Lösung der Schrödin ger-Gleichung.
19.1 Bestimmung des Spektrums Um möglichst einfache Verhältnisse zu haben nehmen wir zunächst an, dass der zu untersuchende Operator h selbstadjungiert-kompakt ist, also überall definiert mit ei nem (nach oben und unten beschränkten) reinen Punktspektrum {λ1 , λ2 , λ3 , . . . }. Aus der folgenden Ableitung geht allerdings hervor, dass das Verfahren in analoger Weise auf alle beschränkten oder sogar halbbeschränkten selbstadjungierten Ope ratoren ausdehnbar ist, sofern ein niedrigster Eigenwert existiert (was wir voraus setzen). Wir werden daher im Folgenden den Begriff hermitesch als Oberbegriff für selbstadjungiert-kompakt bzw. selbstadjungiert-(semi)beschränkt verwenden. Das zu entwickelnde Verfahren lässt sich in mehrere Schritte unterteilen:
* Dieses Kapitel ist für das Verständnis der übrigen Kapitel nicht erforderlich und kann deshalb beim ersten Lesen übersprungen werden. 1 Diese Methode findet auch Anwendung in den sogenannten supersymmetrischen (SUSY-)Theorien, die als mögliche Erweiterungen des Standardmodells der Elementarteilchen untersucht werden. https://doi.org/10.1515/9783110586022-019
19.1 Bestimmung des Spektrums | 417
Schritt 1: Wir beginnen zunächst mit dem Grundzustand, den wir auf folgende Weise charakte risieren können:² Falls es zu einem hermiteschen Operator h einen beschränkten Operator a und eine reelle Zahl λ gibt mit h = a† a + λ , ker a ≠ {o} ,
(19.1) (19.2)
dann ist λ der kleinste Eigenwert von h. Entscheidend ist hierbei, dass der Operator a i. A. weder selbstadjungiert noch ein deutig sein wird, aber bereits eine Realisierung von (19.1) genügt, um λ als niedrigsten Eigenwert zu identifizieren. Zum Beweis bemerken wir, dass a† a = h−λ den kleinsten Eigenwert λ1 −λ hat, wobei λ1 den kleinsten Eigenwert von h bezeichnet. Da a† a andererseits wegen ⟨ϕ | a† a | ϕ⟩ = ‖a ϕ‖2 ≥ 0 nicht negativ ist, folgt λ1 − λ ≥ 0. Somit folgt aus (19.1), dass λ eine untere Schranke für den niedrigsten Eigenwert von h ist λ ≤ λ1 . (19.3) Wäre jetzt λ < λ1 , so wären alle Eigenwerte von h − λ echt positiv, mithin h − λ = a† a > 0, im Widerspruch zu (19.2). Somit sichert (19.2) zusammen mit (19.3), dass λ = λ1 .
Schritt 2: Wir nehmen nun an, dass für h eine Darstellung der Form (19.1) existiert. Dann ist durch h2 = aa† + λ (19.4) ein neuer hermitescher Operator definiert, der dasselbe Spektrum wie h besitzt, even tuell mit Ausnahme des Grundzustandes mit Eigenwert λ = λ1 . Dies wird ersichtlich, wenn man das Spektrum von a† a mit dem von aa† vergleicht: Ist |φ⟩ Eigenvektor von a† a mit Eigenwert μ, so gilt a† a|φ⟩ = μ |φ⟩ und somit aa† a|φ⟩ = μ a|φ⟩. Ist |ξ⟩ ≡ a|φ⟩ ≠ o, so gilt also aa† |ξ⟩ = μ|ξ⟩, d. h., μ ist auch Eigenwert von aa† . Falls jedoch |ξ⟩ = a|φ⟩ = o ist, d. h., falls a† a eine Nullmode hat, so trifft dieses Argument
2 Hier und im Folgenden bezeichnet {o} den Unterraum des Hilbert-Raumes, der nur aus dem neutra len Element, dem Nullvektor o besteht. In diesem Zusammenhang erinnern wir an die Definition des Kerns eines Operators. Der Kern eines Operators A ist durch die Menge aller Vektoren gegeben, die der Operator auf den Nullvektor o abbildet, d. h., φ ∈ ker A falls Aφ = o.
418 | 19 Algebraischer Zugang nicht zu. In diesem Fall kann aa† ebenfalls eine Nullmode haben, muss es aber nicht. Damit ist jeder Eigenwert des Operators a† a auch Eigenwert des Operators aa† , mit Ausnahme eventueller Nullmoden. Das Spektrum von h und h2 ist in Abb. 19.1 illustriert. Um zu überprüfen, ob λ = λ1 wirklich ein Eigenwert von h2 ist, genügt es nach (19.4) offenbar, den Kern von a† an zuschauen: {λ kleinster Eigenwert von h2 = { λ { 2
falls ker a† ≠ {o} falls ker a† = {o} ,
(19.5)
wobei λ2 den zweitkleinsten Eigenwert von h bezeichnet. Wendet man nun Schritt 1 auf den neuen Operator h2 (19.4) an, so gilt: Falls h2 in der Form h2 = a†2 a2 + μ ker a2 ≠ {o} mit einem beschränkten Operator a2 und reellem μ dargestellt werden kann, dann ist {λ μ = kleinster Eigenwert von h2 = { λ { 2
falls ker a† ≠ {o} falls ker a† = {o} .
Fordert man also in Schritt 1 zusätzlich ker a† = {o}, so wird im Schritt 2 garantiert der nächstgrößere Eigenwert μ = λ2 von h gefunden. h = h1
λ3
h2
λ3
λ2
λ2
λ1
λ1
Abb. 19.1: Das Spektrum der ersten beiden Operatoren in der Sequenz (19.6).
19.1 Bestimmung des Spektrums |
419
Schritt 3: Das Verfahren kann nun ausgehend von h1 ≡ h , a1 ≡ a , a†1 ≡ a† , λ1 ≡ λ , λ2 ≡ μ iteriert werden: h1 ≡ a†1 a1 + λ1
→
h2 ≡ a1 a†1 + λ1
→
h3 ≡ a2 a†2 + λ2
= a†2 a2 + λ2
= a†3 a3 + λ3
ker a1 ≠ {o} ker
a†1
ker a2 ≠ {o}
ker a3 ≠ {o}
= {o}
ker
a†2
→ ...
!
!
ker a†3 = {o}
= {o}
(19.6) Damit erhalten wir folgendes Iterationsschema: Nehmen wir an, wir haben einen Ope rator h j = a†j a j + λ j
(19.7)
gefunden mit ker a†j = {o} .
ker a j ≠ {o} ,
(19.8)
Dann definieren wir einen neuen Operator h j+1 = a j a†j + λ j ,
(19.9)
h j+1 = a†j+1 a j+1 + λ j+1
(19.10)
den wir in die Form (19.7) bringen, was neue Operatoren a j+1 , a†j+1 und einen neuen Eigenwert λ j+1 liefert, wobei wir wieder fordern (siehe Gleichung (19.8)), dass ker a†j+1 = {o} .
ker a j+1 ≠ {o}
(19.11)
Offensichtlich gelten die Beziehungen: h j+1 a j = a j h j h j a†j
=
a†j h j+1
(19.12) .
Wie oben gezeigt, sind die so erhaltenen Zahlen λ j der Größe nach geordnet, λ j+1 ≥ λ j .
(19.13)
420 | 19 Algebraischer Zugang
In jedem Schritt sichert die Nebenbedingung (19.8) an den Kern von a j , dass die Zahl λ j wirklich der gesuchte Eigenwert ist (und nicht nur eine untere Schranke). Die zweite Nebenbedingung an den Kern von a†j stellt sicher, dass im nächsten Schritt ein neu er Eigenwert λ i gefunden wird. Auf diese Weise wird das gesamte (Punkt-)Spektrum des Operators h durchlaufen. Falls ein höchster Eigenwert existiert, so bricht das Ver fahren ab, weil im darauffolgenden Schritt keine Darstellung der Form (19.10), (19.11) möglich ist. Der Vorteil des Verfahrens (19.6) liegt auf der Hand: Statt sämtliche Lösungen der Schrödinger-Gleichung zu berechnen, muss man in (19.6) sukzessive den Kern von a j bestimmen (eine Differenzialgleichung erster Ordnung, wie wir im Abschnitt 19.2 se hen werden), was i. A. sehr viel leichter ist. Die Eigenfunktionen von h werden durch die Nebenbedingung (19.8) automatisch mit bestimmt, wie wir gleich zeigen werden. Wie wir im Folgenden sehen werden, kommt man oft sogar ganz ohne Lösung einer Differenzialgleichung aus, wenn aus dem Ansatz für die a i bereits klar ist, dass die Nebenbedingungen für die Kerne erfüllt sind. In diesem Fall kann das Spektrum tat sächlich vollständig algebraisch bestimmt werden. Wir werden jetzt ganz allgemein zeigen, dass die λ j die Eigenwerte des ursprüng lichen Operators h = h1 sind und dabei eine Darstellung der zugehörigen Eigenfunk tionen gewinnen. Dazu bemerken wir zunächst, dass die Zustände |ϕ j ⟩, die durch die Operatoren a j vernichtet werden (d. h., Elemente von ker a j sind), a j |ϕ j ⟩ = o ,
(19.14)
offenbar Eigenvektoren der Operatoren h j zum Eigenwert λ j sind: h j |ϕ j ⟩ = λ j |ϕ j ⟩ .
(19.15)
Es ist jetzt leicht zu zeigen, dass die Zustände |φ j ⟩ = a†1 a†2 . . . a†j−1 |ϕ j ⟩
|φ1 ⟩ = |ϕ1 ⟩
(19.16)
Eigenvektoren des ursprünglichen Operators h ≡ h1 zum Eigenwert λ j sind: h|φ j ⟩ = λ j |φ j ⟩ .
(19.17)
19.1 Bestimmung des Spektrums | 421
In der Tat liefert wiederholte Benutzung der Beziehung (19.13): h|φ j ⟩ = h1 a†1 a†2 . . . a†j−1 |ϕ j ⟩ = a†1 h2 a†2 . . . a†j−1 |ϕ j ⟩ .. . = a†1 a†2 . . . a†j−1 h j |ϕ j ⟩ = λ j |φ j ⟩ , wobei wir im letzten Schritt die Beziehung (19.15) benutzt haben. Die Beziehung (19.16) lässt sich invertieren zu |ϕ j ⟩ = a j−1 . . . a2 a1 |φ j ⟩ .
(19.18)
In der Tat zeigt man durch wiederholte Anwendung von (19.12), dass die Zustän de (19.18) der Eigenwertgleichung (19.15) genügen: h j |ϕ j ⟩ ≡ h j a j−1 . . . a2 a1 |φ j ⟩ = a j−1 h j−1 a j−2 . . . a2 a1 |φ j ⟩ .. . = a j−1 . . . a2 a1 h1 |φ j ⟩ = λ j |ϕ j ⟩ , wobei wir im letzten Schritt (19.17) benutzt haben. Mit (19.7) gilt deshalb a†j a j |ϕ j ⟩ = o . Da nach (19.8) der Kern von a†j verschwindet, folgt, dass die Zustände (19.18) in der Tat Gleichung (19.14) genügen. Wir haben oben gesehen, dass die reellen Zahlen λ j Eigenwerte des betrachteten hermiteschen Operators h sind. Wir wollen jetzt der Frage nachgehen, ob diese Zahlen λ j bereits das gesamte Spektrum dieses Operators liefern. Dazu betrachten wir einen beliebigen Eigenvektor |φ⟩ von h zum Eigenwert λ: h|φ⟩ = λ|φ⟩ . Wir betonen, dass λ nicht notwendigerweise mit einer der oben eingeführten reellen Zahlen λ j übereinstimmen muss, die wir bereits als Eigenwerte des Operators h iden tifiziert haben. Wir definieren die Folge von Vektoren (n = 1, 2, 3, . . . ) |ϕ(n) ⟩ = a n−1 |ϕ(n−1) ⟩ ,
|ϕ(1) ⟩ ≡ |φ⟩ ,
(19.19)
422 | 19 Algebraischer Zugang
welche die explizite Darstellung |ϕ(n) ⟩ = a n−1 . . . a2 a1 |φ⟩ besitzen. Unter Benutzung von Gleichung (19.12) zeigt man, dass die Zustände |ϕ(n) ⟩ Eigenfunktionen der Operatoren h n zum Eigenwert λ sind: h n |ϕ(n) ⟩ = a n−1 h n−1 |ϕ(n−1) ⟩ = a n−1 . . . a1 h1 |φ⟩ = λ|ϕ(n) ⟩ .
(19.20)
Aus der Definition der Zustände |ϕ(n) ⟩ (19.19) und der Definition der Operatoren h n (19.7) und unter der Benutzung von Gleichung (19.20) folgt: ⟨ϕ(n) |ϕ(n) ⟩ = ⟨ϕ(n−1) |a†n−1 a n−1 |ϕ(n−1) ⟩ = ⟨ϕ(n−1) | (h n−1 − λ n−1 ) |ϕ(n−1) ⟩ = (λ − λ n−1 ) ⟨ϕ(n−1) |ϕ(n−1) ⟩ .
(19.21)
Sukzessive Anwendung dieser Relation liefert: ⟨ϕ(n+1) |ϕ(n+1) ⟩ = (λ − λ n )(λ − λ n−1 ) . . . (λ − λ1 )⟨φ|φ⟩ . Da die Norm eines Vektors nicht negativ werden kann und voraussetzungsgemäß |φ⟩ ≠ o, folgt: (λ − λ n )(λ − λ n−1 ) . . . (λ − λ1 ) ≥ 0 . (19.22) Diese Bedingung muss für sämtliche n = 1, 2, 3, . . . gelten, zu denen es Operato ren h n (19.7), (19.9) gibt. Sämtliche Bedingungen (19.22) sind aber nur dann erfüllt, wenn der Eigenwert λ mit einer der reellen Zahlen λ j übereinstimmt, wovon man sich leicht überzeugt: Die λ j sind per Konstruktion nach wachsendem Wert angeordnet. Falls ein k existiert, sodass λ k < λ < λ k+1 , so ist die Bedingung (19.22) für n = k + 1 nicht erfüllt. Damit gilt: Falls die Folge der Eigenwerte λ j nach oben unbeschränkt ist, können die Bedingungen (19.22) nur erfüllt sein, wenn der Eigenwert λ mit einem der λ j übereinstimmt. In diesem Fall liefern die λ j das komplette Eigenwertspektrum des Operators h. Falls der Satz der reellen Zahlen (Eigenwerte) λ j nach oben beschränkt ist, mit einer oberen Schranke λmax , so kann nach Gleichung (19.22) der Eigenwert λ ebenfalls einen der diskreten Eigenwerte λ j annehmen. Darüber hinaus kann der Eigenwert λ aber auch unbeschränkt jeden Wert annehmen, der nicht kleiner als die obere Schranke λmax ist. In diesem Fall besitzt das Spektrum des Operators h einen kontinuierlichen Anteil, der an der oberen Schranke λmax beginnt. Falls λ mit einem der Eigenwerte λ k übereinstimmt, d. h., für ein festes k gilt λ = λ k , so folgt aus Gleichung (19.21): |ϕ(k+1) ⟩ = o , womit nach (19.19) auch sämtliche |ϕ(n) ⟩ mit n > k + 1 verschwinden.
19.2 Beziehung zur Schrödinger-Gleichung
| 423
Das oben beschriebene Verfahren zur Lösung des Eigenwertproblems eines her miteschen Operators h wird besonders einfach, wenn der Kommutator [a, a† ] = c eine c-Zahl ist. Diese muss reell sein, da für eine beliebige, normierte Funktion |ϕ⟩ gilt: c = ⟨ϕ|c|ϕ⟩ = ⟨ϕ|[a, a† ]|ϕ⟩ = ‖a† |ϕ⟩‖2 − ‖a|ϕ⟩‖2 . In diesem Fall unterscheidet sich h2 = aa† + λ1 = [a, a† ] + a† a + λ1 = [a, a† ] + h1 von h1 nur durch die Konstante [a, a† ] = c, die in den Eigenwert λ2 absorbiert werden kann, h2 = a† a + λ2 λ2 = λ1 + [a, a† ] = λ1 + c , und wir können a2 = a ≡ a1 wählen. Damit wird das ganze Verfahren trivial. Es existiert dann nur ein einziger un abhängiger Operator aj = a , und das resultierende Spektrum λ j = λ1 + (j − 1)c ist äquidistant λ j+1 − λ j = c . Dies ist beim harmonischen Oszillator der Fall, siehe Abschnitt 19.3.1. In den Abschnitten 19.3 und 19.4 werden wir die Methode (19.6) zur algebraischen Bestimmung der Spektren von reflexionsfreien Potenzialen bzw. des Spektrums des Wasserstoffatoms benutzen. Doch zuvor noch einige formale Betrachtungen.
19.2 Beziehung zur Schrödinger-Gleichung Im Folgenden wenden wir die im letzten Abschnitt entwickelte Methode auf den Ha milton-Operator eines Teilchens in einer Raumdimension in einem Potenzial V(x) an: H=
p2 + V(x) . 2m
(19.23)
424 | 19 Algebraischer Zugang
In den nachfolgenden Betrachtungen geht es nicht darum, Eigenwerte und Eigenfunk tionen von H für ein gegebenes Potenzial zu finden, sondern wir wollen ganz allge mein zeigen, dass für beliebige Potenziale diese Methode äquivalent zur Lösung der Schrödinger-Gleichung ist. Aus Bequemlichkeitsgründen setzen wir h := 2mH = p2 + 2mV(x)
(19.24)
und suchen also im ersten Schritt für h eine Darstellung der Art (19.1). Die Gestalt des Operators h = h1 legt nahe, den Operator a = a1 in Gleichung (19.1) in der Form a1 = p + if1 (x) mit reellem f1 (x) zu wählen, sodass a†1 = p − if1 (x) . Offensichtlich gilt a†1 a1 = p2 + i[p, f1 ] + f12 = p2 + ℏf1 + f12 a1 a†1 = p2 − i[p, f1 ] + f12 = p2 − ℏf1 + f12 .
(19.25)
Aus der ersten Beziehung folgt h ≡ a†1 a1 + λ1 = p2 + ℏf1 + f12 + λ1 .
(19.26)
Vergleich mit Gleichung (19.24) liefert für das Potenzial die Darstellung³ 2mV(x) = ℏf1 (x) + f12 (x) + λ1 .
(19.27)
Betrachten wir zunächst die Nebenbedingung (19.2). Der Kern von a1 ist nicht leer, sofern es eine nicht triviale Lösung ϕ1 (x) der Gleichung a1 ϕ1 = [p + if1 (x)] ϕ1 (x) = gibt. Hieraus folgt f1 (x) = ℏ
ℏ [ϕ1 (x) − ℏ−1 f1 (x) ϕ1 (x)] = 0 i
ϕ1 (x) d =ℏ ln ϕ1 (x) ϕ1 (x) dx
und damit a1 = p + iℏ
ϕ1 (x) . ϕ1 (x)
(19.28)
(19.29)
(19.30)
3 In den SUSY-Theorien wird f1 (x) als Superpotenzial bezeichnet. Wir werden diesen Begriff hier über nehmen.
19.2 Beziehung zur Schrödinger-Gleichung
| 425
Die Funktion ϕ1 (x) ist zunächst noch unbestimmt: Für jede Wahl von ϕ1 hat a1 einen nicht verschwindenden Kern, da ϕ1 (x) selbst im Kern liegt. Um ϕ1 (x) zu bestimmen setzen wir nun den Ausdruck (19.29) in die Darstellung (19.26) ein. Dies ergibt 2
h = p2 + ℏ2 = p2 + ℏ2
ϕ (x) d ϕ1 (x) + ℏ2 ( 1 ) + λ1 dx ϕ1 (x) ϕ1 (x) ϕ ! 1 (x) + λ1 = p2 + 2mV(x) , ϕ1 (x)
woraus unmittelbar 2mV(x) = ℏ2
ϕ 1 (x) + λ1 ϕ1 (x)
bzw.
λ1 ℏ2 ϕ1 (x) + V(x)ϕ1 (x) = E1 ϕ1 (x) , E1 ≡ (19.31) 2m 2m folgt. Dies ist nichts anderes als die gewöhnliche Schrödinger-Gleichung für die Be wegung des Teilchens mit Masse m im Potenzial V(x). Da wir nun eine konkrete Dar stellung von h in der Form (19.1), (19.2) besitzen, muss nach unseren Überlegungen im vorigen Abschnitt λ1 der kleinste Eigenwert von h sein, also E1 der kleinste Eigen wert von H und somit ϕ1 (x) die Grundzustandswellenfunktion. Dass ϕ1 die Schrö dinger-Gleichung erfüllt, ist natürlich eine Konsequenz der Identität (19.28) a1 ϕ1 = o und (19.1). Wie aus der allgemeinen Beziehung (19.16) ersichtlich ist, stimmt die Eigenfunk tion φ1 zum untersten Eigenwert λ1 (siehe (19.17)) mit der Funktion ϕ1 überein, die durch den Operator a1 vernichtet wird (siehe Gleichungen (19.14) und (19.28)), d. h. φ1 = ϕ1 . Dies ist eine Besonderheit des untersten Eigenwertes. Es ist instruktiv, auch den nächsten Schritt des Verfahrens (19.6) auszuarbeiten. Wir suchen hierzu nach einem Operator a2 und einer reellen Zahl λ2 , sodass die Dar stellung −
h2 ≡ a1 a†1 + λ1 = [p + if1 (x)] [p − if1 (x)] + λ1 = a†2 a2 + λ2 !
ker a2 ≠ {o} ,
ker a†2 = {o}
(19.32) (19.33)
mit f1 = ℏ ϕ1 /ϕ1 (siehe Gleichung (19.29)) gilt, wobei ϕ1 (x) = φ1 (x) die Grundzu standswellenfunktion aus dem vorigen Schritt ist. Dies führt aber nur dann zu ei nem neuen Eigenwert λ2 > λ1 , wenn die Bedingung ker a†1 = {o} erfüllt ist, siehe Gleichung (19.5). Mit der expliziten Form (19.30) zeigt man leicht, dass die Gleichung a†1 ξ(x) = o auf ϕ (x) ξ(x) = 0 ξ (x) + 1 ϕ1 (x) führt. Diese Differenzialgleichung lässt sich zu d ln (ξ(x)ϕ1 (x)) = 0 dx
426 | 19 Algebraischer Zugang umschreiben und ist damit elementar zu integrieren und ergibt ξ(x) ∼ 1/ϕ1 (x). Da aber die Grundzustandswellenfunktion ϕ1 (x) quadratintegrabel war, kann dies we gen der falschen Asymptotik bei |x| → ∞ nicht für ξ(x) gelten. Somit hat die Glei chung a† ξ = o keine quadratintegrablen Lösungen, und der Kern von a†1 ist in der Tat leer.⁴ Dies schließt auch die triviale Lösung a2 = p − if1 (x) = a†1 (mit λ2 = λ1 ) in der Darstellung (19.32) aus, da ansonsten ker a2 = ker a†1 = {o}, im Widerspruch zu (19.33). Um den zweiten Schritt im Verfahren (19.6) (siehe Gleichung (19.32)) explizit aus zuführen, versuchen wir wie beim Grundzustand (vgl. (19.30)) einen Ansatz a2 = p + iℏ
ϕ2 (x) , ϕ2 (x)
(19.34)
wobei die Funktion ϕ2 (x) noch unbestimmt ist. Wiederum sichert dieser Ansatz, dass a2 ϕ2 = 0, d. h., ϕ2 liegt im Kern von a2 . Wir wollen nun untersuchen, ob mit die sem Ansatz auch die Darstellung (19.32) möglich ist. Sollte dies der Fall sein, so wird ϕ2 (x) ein Eigenzustand von h2 zum Eigenwert λ2 sein. Dies bedeutet jedoch nicht, dass ϕ2 (x) auch Eigenzustand des ursprünglichen Hamilton-Operators h sein muss, da die Operatoren h und h2 zwar bis auf den Grundzustand dasselbe Spektrum (siehe Gleichung (19.15) und (19.17)), jedoch verschiedene Eigenfunktionen haben. Genauer folgt aus (19.16) bzw. (19.18) der Zusammenhang φ2 = a†1 ϕ2 bzw. ϕ2 = a1 φ2 , wobei φ2 jetzt der Eigenvektor von h zum Eigenwert λ2 ist. Mit (19.30) und ϕ1 (x) = φ1 (x) folgt für ϕ2 (x) = a1 φ2 (x) ϕ2 (x) = =
φ (x) ℏ ℏ φ2 (x)φ1 (x) − φ1 (x)φ2 (x) (φ2 (x) − 1 φ2 (x)) = i φ1 (x) i φ1 (x) ℏ d φ2 (x) ℏ 1 W(φ1 , φ2 ; x) = φ2 (x) ln , i φ1 (x) i dx φ1 (x)
(19.35)
wobei W(φ1 , φ2 ; x) = φ1 φ2 − φ1 φ2
(19.36)
der in Gleichung (8.5) eingeführte Wronskian ist. Ebenso folgt a1 a†1 + λ1 = p2 + ℏ2 [−
2
φ φ (x) 1 (x) + 2 ( 1 ) ] + λ1 . φ1 (x) φ1 (x)
(19.37)
Andererseits finden wir aus (19.34) a†2 a2 + λ2 = p2 + ℏ2
ϕ 2 (x) + λ2 . ϕ2 (x)
(19.38)
4 Hier erkennt man auch, dass die Methode (19.6) nur für echte Eigenwerte (d. h. gebundene Zustände) funktionieren kann. Außerhalb des Hilbert-Raumes der quadratintegrablen Funktionen ist der Kern von a†1 natürlich nicht leer, und unser gesamtes Verfahren bricht ab.
19.2 Beziehung zur Schrödinger-Gleichung
| 427
Die beiden Ausdrücke (19.37) und (19.38) müssen nach (19.32) gleich sein, d. h., es muss gelten (φ (x))2 ϕ (x) λ1 − λ2 φ 2 (x) − 1 . = +2 1 2 ϕ2 (x) φ1 (x) ℏ (φ1 (x))2 Mittels Gleichung (19.35) können wir hier ϕ2 (x) durch die Funktionen φ1 (x) und φ2 (x) ausdrücken, was auf die Bedingung W (x) W (x) φ1 (x) λ1 − λ2 −2 = W(x) W(x) φ1 (x) ℏ2
(19.39)
führt. Hierbei haben wir die Abkürzung W(x) = W(φ1 , φ2 ; x) benutzt. Wir wissen be reits, dass φ1 (x) = ϕ1 (x) die Grundzustandswellenfunktion ist, d. h. der SchrödingerGleichung (19.31) 2m λ1 − φ (19.40) 1 (x) + 2 V(x)φ 1 (x) = 2 φ 1 (x) ℏ ℏ zum kleinsten Eigenwert λ1 genügt. Es ist dann leicht zu sehen, dass die Bedin gung (19.39) gerade dann erfüllt ist, wenn φ2 (x) der Schrödinger-Gleichung zum Eigenwert λ2 2m λ2 − φ (19.41) 2 (x) + 2 V(x)φ 2 (x) = 2 φ 2 (x) ℏ ℏ genügt. In der Tat, multiplizieren wir (19.40) mit φ2 (x) und (19.41) mit φ1 (x) und zie hen die resultierenden Gleichungen voneinander ab, so finden wir − (φ 1 φ2 − φ2 φ1 ) =
λ1 − λ2 φ1 φ2 . ℏ2
Die linke Seite liefert die Ableitung des Wronskians (19.36) W (φ1 , φ2 ; x) = φ 2 (x)φ 1 (x) − φ 1 (x)φ 2 (x) ,
d. h., es gilt
λ1 − λ2 φ1 φ2 . ℏ2 Hieraus erhalten wir für die zweite Ableitung W (φ1 , φ2 ; x) =
W (φ1 , φ2 ; x) =
λ1 − λ2 (φ1 φ2 + φ1 φ2 ) . ℏ2
(19.42)
(19.43)
Einsetzen der Ausdrücke für W (19.36), W (19.42) und W (19.43) in (19.39) zeigt, dass diese Bedingung für die Lösungen der Schrödinger-Gleichung φ1 (x), φ2 (x) erfüllt ist. Die weitere Iteration des Verfahrens (19.6) verläuft völlig analog. Damit haben wir gezeigt, dass die in Abschnitt 19.1 entwickelte algebraische Methode zur Bestimmung der Eigenwerte und Eigenfunktionen eines hermiteschen Operators angewandt auf den Hamilton-Operator in der Tat äquivalent zur Lösung der Schrödinger-Gleichung ist. Dies hatten wir natürlich erwartet.
428 | 19 Algebraischer Zugang
19.3 Algebraische Lösung der Schrödinger-Gleichung Die im Abschnitt 19.1 entwickelte allgemeine Methode zur Bestimmung des Spektrums eines hermiteschen Operators wollen wir jetzt benutzen, um die Wellenfunktionen und Energieeigenwerte für konkrete Potenziale zu bestimmen. Wie in Abschnitt 19.2 gezeigt, lässt sich der Hamilton-Operator H (19.23) einer Po tenzialbewegung stets in der Form⁵ h = 2mH = a† a + λ schreiben, wobei a = p + if(x) ,
a† = p − if(x)
(19.44)
mit
d ln ϕ(x) . (19.45) dx Hierbei ist ϕ(x) die Grundzustandswellenfunktion des ursprünglichen Hamilton-Ope rators H, die der Bedingung aϕ(x) = 0 f(x) = ℏ
genügt. Ferner ist λ der kleinste Eigenwert von h, und das Potenzial besitzt die Dar stellung (19.27) d 2mV(x) = ℏ f(x) + f 2 (x) + λ . (19.46) dx Der aufmerksame Leser mag jetzt einwenden, dass die Grundzustandswellenfunkti on ϕ(x) erst bestimmt werden soll und a priori nicht bekannt ist. Das ist korrekt und wir werden im Abschnitt 19.4 sehen, wie für das Coulomb-Potenzial die Operatoren a j , a†j explizit aus der Form des Hamilton-Operators gefunden werden können (ohne die Grundzustandswellenfunktionen zu kennen) und sich die Eigenwerte λ j sowie die Eigenfunktionen φ j von h (19.17) dann über die Beziehungen (19.14), (19.15) und (19.16) bestimmen lassen. Obwohl es das primäre Anliegen des in Abschnitt 19.1 beschriebe nen Verfahrens ist, die Eigenwerte und Eigenfunktionen des Hamilton-Operators zu bestimmen, lässt sich dieses Verfahren offenbar auch sehr bequem in umgekehrter Richtung benutzen: Wir starten mit einer Funktion ϕ(x), die die Eigenschaften einer Grundzustandswellenfunktion besitzt (normierbar und keine Knoten), und bestim men über Gleichungen (19.45), (19.46) das zugehörige Potenzial. Auf diese Weise kön nen wir Potenziale konstruieren, für welche die Schrödinger-Gleichung eine exakte Lösung (zumindest für den Grundzustand) besitzt. Wir illustrieren dieses inverse Ver fahren unten an zwei Beispielen. Alternativ könnte man auch gleich mit der Vorgabe des Superpotenzials f(x) begin nen und aus diesem direkt mittels (19.46) das tatsächliche Potenzial V(x) bestimmen.
5 Wir lassen in diesem Abschnitt den Index „1“ weg, sofern dies nicht zu Verwirrungen führt, d. h., ϕ ≡ ϕ 1 , a ≡ a1 , λ ≡ λ 1 etc.
19.3 Algebraische Lösung der Schrödinger-Gleichung
|
429
Nach Gleichung (19.45) ergibt sich dann die Grundzustandswellenfunktion ϕ(x) bei bekannten f(x) zu x
1 ϕ(x) = C exp ( ∫ dx f(x )) . ℏ Hierbei ist jedoch zu beachten, dass auch f(x) nicht beliebig gewählt werden kann, da ϕ(x) normierbar sein muss.
19.3.1 Der harmonische Oszillator Eine normierbare (Wellen-)Funktion ohne Knoten ist die Gauß-Funktion 1 x 2 ϕ(x) = C exp [− ( ) ] , 2 x0 wobei x0 ein beliebiger Parameter von der Dimension einer Länge ist und C durch die Normierung von ϕ(x) festgelegt ist. Mit der Gauß-Funktion erhalten wir für das Superpotenzial (19.45) x (19.47) f(x) = −ℏ 2 x0 und somit für das Potenzial V(x) =
ℏ2
x2 − 4
2mx0
ℏ2 λ . + 2 2m 2mx0
(19.48)
Wir können dieses Potenzial in die übliche Form des harmonischen Oszillatorpoten zials m V(x) = ω2 x2 (19.49) 2 überführen, wenn wir den Parameter x0 so wählen, dass ℏ2 2mx40
=
m 2 ω 2
(19.50)
gilt, und außerdem fordern, dass die Konstante λ (der kleinste Eigenwert von h) den Wert λ ℏ2 (19.51) = 2m 2mx20 annimmt. Gleichung (19.50) identifiziert den bisher freien Parameter x0 mit der Oszil latorlänge (12.29) ℏ . (19.52) mω Mit diesem Wert für x0 erhalten wir aus (19.51) für den untersten Eigenwert des Hamil ton-Operators mit dem Oszillatorpotenzial (19.49) x0 = √
λ 1 = ℏω . 2m 2 Dies ist die Grundzustandsenergie des harmonischen Oszillators.
(19.53)
430 | 19 Algebraischer Zugang
Ein Potenzial ist in der klassischen Mechanik bekanntlich nur bis auf eine additive Konstante definiert, die aus der Newton’schen Bewegungsgleichung herausfällt. In der Quantenmechanik verschiebt die Addition einer Konstanten zum Potenzial sämtliche Energieeigenwerte (insbesondere die Grundzu standsenergie), lässt jedoch die Anregungsenergien unverändert. Durch die Identifizierung des Po tenzials (19.48) mit dem üblichen Oszillatorpotenzial (19.49) ist die Grundzustandsenergie λ/2m auf den Wert (19.51) bzw. (19.53) festgelegt. Prinzipiell könnten wir das Potenzial auch stets so wählen, dass die Grundzustandsenergie verschwindet, d. h., λ = 0. In diesem Fall folgt aus (19.48) mit (19.50) bzw. (19.52) m 1 V(x) = ω 2 x 2 − ℏω . 2 2
Mit dem expliziten Ausdruck (19.47) für das Superpotenzial f(x) erhalten wir aus Glei chung (19.44): x ℏ 1 x0 a = p − i 2 x = −i ( + i p) . ℏ √mℏω x0 x0 Bis auf eine multiplikative Konstante ist dies der Vernichtungsoperator (12.39) der Os zillatorquanten. Dieser Zusammenhang ist nicht sehr überraschend, da a die Grund zustandswellenfunktion ϕ vernichtet, aϕ = 0. Wie am Ende von Abschnitt 19.1 beschrieben, ist im vorliegenden Fall die Fortset zung des Verfahrens zur Bestimmung der angeregten Zustände trivial, da [a, a† ] = 2i
ℏ ℏ2 [p, x] = 2 2 = 2mℏω 2 x0 x0
eine c-Zahl ist.
19.3.2 Reflexionsfreie Potenziale Wir wählen jetzt eine Grundzustandswellenfunktion in der Form ϕ(x) =
C cosh
x x0
,
(19.54)
wobei wie im vorigen Beispiel C eine Normierungskonstante und x0 ein freier Para meter mit Dimension einer Länge sind. Mit ∞
∫ −∞
dx cosh2 x
= tanh x|∞ −∞ = 2
liefert Normierung auf 1 C=
1 . √2x0
Aus (19.54) erhalten wir für das Superpotenzial (19.45) f(x) = −
ℏ x tanh , x0 x0
f (x) = −
1 ℏ 2 x0 cosh2
x x0
.
(19.55)
19.3 Algebraische Lösung der Schrödinger-Gleichung
|
431
Einsetzen dieser Ausdrücke in Gleichung (19.46) liefert mit 1 − tanh2 x = 1/ cosh2 x das Potenzial 1 ℏ2 , (19.56) V(x) = −2 2mx0 cosh2 x x0
vorausgesetzt wir wählen die Grundzustandsenergie als E≡
ℏ2 λ =− . 2m 2mx20
(19.57)
Wie im Abschnitt 19.1 gezeigt, ergeben sich die Energien der angeregten Zustände aus den Eigenwerten von h2 = aa† + λ . Nach Gleichung (19.25) gehört zu dem Hamilton-Operator h2 /2m das Potenzial V2 (x) mit 2mV2 (x) = −ℏf + f 2 + λ , (19.58) das sich gegenüber dem Potenzial V(x) (19.56) (siehe auch (19.46)) im Vorzeichen des ersten Terms unterscheidet. Einsetzen von (19.55) in (19.58) liefert mit (19.57) V2 (x) = 0 . Damit ist der zu h2 gehörige Hamilton-Operator der des freien Teilchens H2 ≡
1 p2 h2 = , 2m 2m
dessen Eigenfunktionen die ebenen Wellen sind, H2 ϕ2k (x) = E2k ϕ2k (x) ,
ϕ2k (x) = e ikx ,
E2k =
(ℏk)2 . 2m
Nach Gleichung (19.16) ergeben sich die zu den Energien E2k gehörigen Eigenfunk tionen φ2k (x) vom Hamilton-Operator H = h/2m mit dem ursprünglichen Potenzi al (19.56) zu φ2k (x) = a† ϕ2k (x) H1 φ2k = E2k φ2k . Einsetzen der expliziten Form von a† (19.44) mit f(x) (19.55) liefert φ2k (x) = (ℏk − i
ℏ x tanh ) e ikx . x0 x0
Dies sind die exakten Streuzustände im Potenzial V(x) (19.56). Bemerkenswert ist, dass diese Zustände keine reflektierten Wellen e−ikx enthalten. Potenziale mit dieser Eigenschaft werden als reflexionsfrei bezeichnet. Wie oben gezeigt, besitzt das Potenzial (19.56) einen gebundenen Zustand (19.54) mit der Energie (19.57) E < 0 und ein Kontinuum von Streuzuständen mit Energien
432 | 19 Algebraischer Zugang E2k ≥ 0. Mit dem hier beschriebenen Verfahren lassen sich weitere reflexionsfreie Po tenziale finden. Verallgemeinern wir den Ansatz (19.54) zu ϕ(n) (x) =
C , cosh n xx0
so finden wir aus Gleichung (19.45) und (19.46) das Potenzial 2mV (n) (x) =
ℏ2 n(n + 1) [n2 − ]+λ. 2 x0 cosh2 xx0
Wählen wir die Grundzustandsenergie als E≡
λ ℏ2 2 n , =− 2m 2mx20
so erhalten wir das Potenzial V(x) = −
ℏ2 n(n + 1) . 2mx20 cosh2 xx 0
Dieses Potenzial ist ebenfalls reflexionsfrei und besitzt genau n Bindungszustände, die sich mit dem oben beschriebenen Verfahren finden lassen.
19.4 Algebraische Bestimmung des Wasserstoffspektrums Im Folgenden wenden wir die in Abschnitt 19.1 entwickelte allgemeine algebraische Methode zur Diagonalisierung des Hamilton-Operators des Wasserstoffatoms an. Der Hamilton-Operator für die radiale Bewegung des Elektrons im Zustand mit Drehim puls l lautet nach Multiplikation mit dem Faktor 2m (siehe Gleichungen (17.8) . . . (17.12) und (18.11)): mZe 2 ℏ2 l(l + 1) γ , (19.59) h ≡ 2mH = p2r + −2 , γ = 2 r 4π r wobei ℏ d 1 ℏ1 d r= ( + ) pr = i r dr i dr r der radiale Impuls ist. Um die Eigenwerte des linearen Operators h (19.59) zu finden, schreiben wir ihn in der Form (19.1) mit der Nebenbedingung (19.2). Die explizite Ge stalt von h legt für die Operatoren a j den Ansatz a j = p r + i (α j +
βj ) r
(19.60)
19.4 Algebraische Bestimmung des Wasserstoffspektrums
| 433
nahe, wobei α j und β j noch zu bestimmende reelle Zahlen sind. Elementare Rechnun gen liefern dann unter Benutzung von [r, p r ] = iℏ: βj 2 1 ) + iβ j [p r , ] r r 1 1 2 2 = p r + α j + 2α j β j + β j (β j − ℏ) 2 r r
a†j a j = p2r + (α j +
(19.61)
und βj 2 1 ) − iβ j [p r , ] r r 1 1 2 2 = p r + α j + 2α j β j + β j (β j + ℏ) 2 . r r
a j a†j = p2r + (α j +
(19.62)
Für die Nebenbedingungen im Verfahren (19.6) benötigen wir noch den Kern von a j bzw. a†j . Die Bedingung a j ϕ j = 0 führt auf ℏ ϕj (r) = α j ϕ j (r) +
β−ℏ ϕ j (r) r
mit der Lösung βj
ϕ j (r) ∼ r ℏ −1 ⋅ exp (
αj r) . ℏ
(19.63)
Damit die Gesamtwellenfunktion quadratintegrabel ist, muss die radiale Wellenfunk tion ϕ j (r) (19.63) für r → ∞ exponentiell abfallend und bei r = 0 regulär sein. Dies erfordert αj < 0 , βj ≥ ℏ . (19.64) Diese beiden Bedingungen garantieren also, dass die Gleichung a j ϕ j = 0 eine normierbare Lösung (19.63) besitzt und somit der Kern von a j nicht leer ist. Falls ker a j ≠ {o}, ist aber automatisch ker a†j = {o}, da die Konjugation a j → a†j die Vor zeichen von α j und β j ändert, siehe Gleichung (19.60). Somit reduzieren sich alle Nebenbedingungen im Verfahren (19.6) auf die einfachen Ungleichungen (19.64). Nach diesen Vorüberlegungen beginnen wir mit dem Grundzustand des Wasser stoffatoms. Nach Definition (19.1) und der expliziten Form von h (19.59) gilt: a†1 a1 + λ1 = p2r − 2
γ l(l + 1)ℏ2 + . r r2
Setzen wir hier Gleichung (19.61) ein, so liefert der Koeffizientenvergleich der Potenzen von r: r0 :
λ1 + α 21 = 0 ,
r
−1
:
α 1 β 1 = −γ ,
r
−2
:
β 1 (β 1 − ℏ) = l(l + 1)ℏ .
(19.65) (19.66) 2
434 | 19 Algebraischer Zugang
Die letzte Gleichung allein bestimmt bereits den unbekannten Koeffizienten β 1 . Die übrigen Unbekannten α1 und λ1 folgen dann aus (19.66) und (19.65). Es ergeben sich die zwei Lösungen γ , lℏ
i)
β 1 = −lℏ ,
α1 =
ii)
β 1 = (l + 1)ℏ ,
α1 = −
λ1 = −
γ , (l + 1)ℏ
λ1 = −
γ2 l2 ℏ2
,
γ2 . (l + 1)2 ℏ2
(19.67)
Die erste Lösung widerspricht der Nebenbedingung (19.64), während Lösung ii) alle Bedingungen erfüllt. Da wir somit eine konkrete Darstellung (19.1) von h gefunden haben, muss λ1 aus Lösung ii) der kleinste Eigenwert von h sein. Die zugehörige Ei genfunktion ergibt sich aus (19.63) durch Einsetzen der Koeffizienten aus Lösung ii): ϕ1 (r) ∼ r l ⋅ exp (−
γ r) . (l + 1) ℏ2
Nach dem Grundzustand betrachten wir nun die allgemeine Induktion j → j + 1 im Verfahren (19.6), d. h., wir gehen davon aus, dass für h j bereits die Darstellung h j = a†j a j + λ j mit der Nebenbedingung (19.64) gefunden wurde. Im nächsten Schritt ist dann der Operator a j+1 aus h j+1 ≡ a j a†j + λ j = a†j+1 a j+1 + λ j+1 !
(19.68)
zu bestimmen. Setzen wir die expliziten Ausdrücke für a†j+1 a j+1 (19.61) und a j a†j (19.62) ein und vergleichen wieder die Koeffizienten der verschiedenen Potenzen von r, so finden wir die Beziehungen λ j+1 + α 2j+1 = λ j + α 2j , α j+1 β j+1 = α j β j ,
(19.69)
β j+1 (β j+1 − ℏ) = β j (β j + ℏ) . Die ersten beiden Gleichungen lassen sich durch wiederholte Anwendung auf die An fangswerte (19.65), (19.66) reduzieren: λ j + α 2j = λ1 + α 21 = 0 , α j β j = α 1 β 1 = −γ .
(19.70) (19.71)
Die Gleichung (19.69) besitzt die beiden Lösungen i)
β j+1 = −β j ,
ii)
β j+1 = β j + ℏ .
Lösung i) verletzt die Nebenbedingung (19.64) β j ≥ ℏ, die für jedes j erfüllt sein muss, und kommt deshalb nicht in Betracht. Lösung ii) liefert mit dem Anfangswert (19.67) für β 1 und mit (19.70) und (19.71): ii)
β j = (l + j)ℏ , α j = −
γ γ2 . , λj = − (l + j)ℏ (l + j)2 ℏ2
(19.72)
19.4 Algebraische Bestimmung des Wasserstoffspektrums
| 435
Alle Nebenbedingungen (19.64) sind somit erfüllt, und wir haben eine konkrete Dar stellung von h j+1 entsprechend (19.68) gefunden, d. h., λ j+1 ist der (in aufsteigender Reihenfolge) nächste Eigenwert von h. Mit der letzten Beziehung aus (19.72) sind die diskreten Energieeigenwerte des Wasserstoffspektrums, d. h. des radialen Hamilton-Operators H = h/(2m) (19.59), durch 2
1 1 γ2 m Ze2 Z2 = − = −R ≡ En λj = − ( ) 2m 2 4πℏ 2m(l + j)2 ℏ2 (l + j)2 n2
(19.73)
gegeben, wobei R die Rydberg-Konstante⁶ (18.9) ist und wir die Abkürzung n=l+j
(19.74)
eingeführt haben. Da l die nicht negative Bahndrehimpulsquantenzahl (l = 0, 1, 2, . . .) und j eine positive ganze Zahl (j = 1, 2, 3, . . . ) sind, nimmt die Quantenzahl (19.74) die Werte n = 1, 2, 3, . . . an. Dies sind gerade die Werte der bereits in Abschnitt 18.3 eingeführten Hauptquan tenzahl, und Gleichung (19.73) liefert somit das exakte diskrete Spektrum des Wasser stoffatoms (siehe Gleichung (18.23)). Da dieses nach oben durch die Energie E = 0 beschränkt ist, existiert, wie in Abschnitt 18.3 festgestellt, ein Kontinuum von Zustän den E > 0, in denen das Elektron nicht mehr an den Atomkern gebunden ist. Die Eigenfunktionen ϕ j (r) von h j (siehe Gleichung (19.15)) folgen wiederum aus (19.63) durch Einsetzen der Koeffizienten α j und β j aus der Lösung (19.72) ϕ lj (r) ∼ r l+j−1 ⋅ exp (−
γ r) . (l + j) ℏ2
Hieraus erhalten wir nach Gleichung (19.16) die Eigenfunktion von h (19.59), d. h. die radiale Wellenfunktion des j-ten gebundenen Zustandes im Drehimpulskanal l zu φ(r)lj = a†1 a†2 . . . a†j−1 ϕ(r)lj . Da die a†j bereits bekannt sind (siehe Gleichungen (19.60) und (19.72)), lassen sich die Radialfunktionen φ lj (r) unmittelbar berechnen. Dies führt auf die bekannten Radial funktionen des diskreten Spektrums des Wasserstoffatoms.
6 Im Lorentz-Heavyside-Maßsystem mit c = 1.
20 Störungstheorie Nur die wenigsten realistischen quantenmechanischen Probleme sind exakt lösbar wie z. B. der harmonische Oszillator oder das Wasserstoffatom. In den meisten Fällen, wo eine strenge Lösung nicht möglich ist, ist man auf Näherungsverfahren angewiesen. Mit der fortschreitenden Entwicklung der Computertechnik gewinnen numerische Lösungen immer mehr an Bedeutung. Auch wenn es gelingt, ein Problem numerisch mit sehr hoher Genauigkeit zu lösen, ist die erhaltene Lösung oft physikalisch wenig transparent, und ein analytisches Verständnis des Problems, sei es auch nur nähe rungsweise, wäre oft der numerischen Lösung vorzuziehen. In einigen Fällen, wo die Bewegung annähernd klassisch verläuft, ist eine semi klassische – und damit vereinfachte – Beschreibung möglich. Die semiklassische Be schreibung ist vor allem dann angebracht, wenn die Wellenlänge des betrachteten Teilchens klein im Verhältnis zur charakteristischen Längenskala der Trajektorie ist. (Für Wellenlängen, die klein sind im Verhältnis zur Ausdehnung der Trajektorie, sind die Quantenzustände gut lokalisiert, und das Konzept einer klassischen Trajektorie ist sinnvoll.) Die semiklassische Beschreibung ist deshalb vor allem für große Quanten zahlen sinnvoll. Aber auch selbst die semiklassische Beschreibung lässt sich in den meisten realistischen Fällen, wo man es mit einer dreidimensionalen Bewegung zu tun hat, nicht streng durchführen, d. h., die zugrunde liegenden klassischen Bewe gungsgleichungen sind nicht analytisch integrabel. Oftmals lässt sich ein gegebenes Problem jedoch durch starke Vereinfachung auf ein exakt lösbares Problem zurückführen, und die Lösung des vereinfachten Problems liefert bereits qualitative Aussagen über das kompliziertere Problem. Leider kann je doch eine solche Vereinfachung des Problems auch wesentliche Eigenschaften elimi nieren, selbst wenn die vernachlässigten Terme im Hamilton-Operator klein gegen über dem vereinfachten Hamilton-Operator H0 sind. Die vernachlässigten Terme des Hamilton-Operators werden als Störung bezeichnet. Diese können allerdings, wenn sie z. B. eine Symmetrie des ungestörten Hamilton-Operators H0 brechen, sehr drasti sche Konsequenzen für das Eigenwertspektrum besitzen. In solchen Fällen ist es wün schenswert, den Effekt dieser Störung zumindest genähert zu berücksichtigen, da sie auf qualitativ neue Phänomene führen kann. Im Folgenden wollen wir eine allgemeine Methode entwickeln, die es erlaubt, systematisch (die durch die Störung hervorgeru fenen) Korrekturen zum ungestörten Problem zu berechnen. Diese Methode wird als Störungstheorie bezeichnet. Zur Entwicklung der Störungstheorie setzen wir voraus, dass sich der HamiltonOperator des zu untersuchenden Systems aufspalten lässt in ein exakt lösbares Pro blem, was durch einen Hamilton-Operator H0 beschrieben wird, und eine „kleine“ Störung H1 : H = H0 + H1 ,
https://doi.org/10.1515/9783110586022-020
20.1 Stationäre Störungstheorie
|
437
wobei wir später sehen werden, was in diesem Kontext „klein“ bedeutet. Im Folgen den wollen wir uns zunächst auf die stationäre Störungstheorie beschränken, deren Ziel es ist, die stationären Zustände eines gestörten Systems zu bestimmen. In vielen Fällen bezeichnet H0 den Hamilton-Operator eines abgeschlossenen Systems, dessen Lösung bekannt ist, und H1 bezeichnet eine von außen angelegte Störung. Durch die von außen angelegte Störung, z. B. in Form eines äußeren elektromagnetischen Fel des, kann das durch H0 beschriebene System Übergänge zwischen einzelnen statio nären Zuständen von H0 ausführen, deren Wahrscheinlichkeit sich berechnen lässt, sofern die exakte Wellenfunktion des Systems bekannt ist. In den meisten Fällen ist jedoch das von außen angelegte Feld klein gegenüber dem Hamilton-Operator des ge schlossenen Systems, und die Übergangswahrscheinlichkeit lässt sich sehr vorteilhaft in Störungstheorie berechnen. Dies ist insbesondere der Fall bei Problemen wie den elektromagnetischen Übergängen in einem Atomkern. Die Energieniveaus des Atom kerns werden durch die starke Wechselwirkung bestimmt, während die Übergänge zwischen ihnen durch ein elektromagnetisches Feld induziert werden, das sehr viel schwächer ist als die starke Wechselwirkung.
20.1 Stationäre Störungstheorie Zur Berechnung der stationären Zustände eines Systems in Störungstheorie setzen wir voraus, dass die Lösungen des ungestörten Problems bekannt sind: (0)
H0 |n⟩ = E n |n⟩ .
(20.1)
Aus didaktischen Gründen ziehen wir aus der Störung explizit einen kleinen Parame ter λ heraus und schreiben diese als: H1 = λV , also H(λ) = H0 + λV . Man beachte, dass der Störoperator V nicht notwendigerweise ein Potenzial sein muss. Gesucht sind die stationären Zustände des gestörten Problems H(λ)|φ n (λ)⟩ = E n (λ)|φ n (λ)⟩ . Für λ → 0 gehen die gestörten Eigenwerte und Eigenfunktionen offenbar in die unge störten über: (0) E n (λ = 0) = E n , (0)
|φ n (λ = 0)⟩ = |φ n ⟩ := |n⟩ . Die störungstheoretische Berechnung der Energieeigenzustände ist vor allem für den diskreten Teil des Spektrums (d. h. für gebundene Zustände) relevant, da die einzel nen Zustände des kontinuierlichen Teils des Spektrums ohnehin experimentell nicht
438 | 20 Störungstheorie
aufgelöst werden können.¹ Aus diesem Grunde beschränken wir uns im Folgenden auf Zustände des diskreten Spektrums, welches der Einfachheit halber zunächst nicht entartet sein soll. Den Fall der Entartung werden wir in Abschnitt 20.2 separat behan deln. Für kleine Störungen können wir die Lösung des Eigenwertproblems sicherlich in Form einer Entwicklung nach Potenzen der Störung suchen: (0)
(1)
(2)
(3)
E n (λ) = E n + λE n + λ2 E n + λ3 E n + . . . , (0)
(1)
(2)
(3)
|φ n (λ)⟩ = |φ n ⟩ + λ|φ n ⟩ + λ2 |φ n ⟩ + λ3 |φ n ⟩ + . . . .
(20.2)
Wenn wir nur endlich viele Terme dieser Reihenentwicklung einschließen, erhalten wir offenbar Näherungsausdrücke, die umso besser sind, je schneller die Störreihe konvergiert. Das Ziel der Störungstheorie ist die Bestimmung der Entwicklungskoeffi zienten in der Störreihe. Dazu setzen wir die Störentwicklungen für Energieeigenwert und -eigenfunktion in die Schrödinger-Gleichung ein. Dies liefert: (0)
(1)
(2)
(3)
(H0 + λV)(|φ n ⟩ + λ|φ n ⟩ + λ2 |φ n ⟩ + λ3 |φ n ⟩ + ⋅ ⋅ ⋅ ) (0)
(1)
(2)
(3)
(0)
(1)
(2)
(3)
= (E n + λE n + λ2 E n + λ3 E n + ⋅ ⋅ ⋅ )(|φ n ⟩ + λ|φ n ⟩ + λ2 |φ n ⟩ + λ3 |φ n ⟩ + ⋅ ⋅ ⋅ ) . Da die verschiedenen Potenzen λ n linear unabhängige Funktionen sind, kann die obi ge Gleichung nur richtig sein, wenn sie für jede einzelne Potenz von λ unabhängig er füllt ist. Vergleichen wir die Koeffizienten der einzelnen Potenzen von λ, so finden wir für die ersten Terme: (0)
(0)
(0)
(1)
(1)
(0)
(0)
(2)
(1)
(1)
(2)
(0)
(0)
(3)
(1)
(2)
(2)
(1)
λ0 :
(H0 − E n ) |φ n ⟩ = o ,
λ1 :
(H0 − E n ) |φ n ⟩ = (E n − V) |φ n ⟩ ,
λ2 :
(H0 − E n ) |φ n ⟩ = (E n − V) |φ n ⟩ + E n |φ n ⟩ ,
λ3 :
(H0 − E n ) |φ n ⟩ = (E n − V) |φ n ⟩ + E n |φ n ⟩ + E n |φ n ⟩ .
(20.3) (3)
(0)
Die Terme der Ordnung λ0 reproduzieren natürlich das ungestörte Problem. Aus den obigen Gleichungen lassen sich unmittelbar zwei allgemeine Aussagen gewinnen: 1.
(k)
Zu jedem der |φ n ⟩ auf den linken Seiten der obigen Gleichungen können wir (0) ein beliebiges Vielfaches der ungestörten Wellenfunktion |φ n ⟩ addieren, ohne den Wert der linken Seite zu verändern. Dies bedeutet, dass durch die obigen (k) Gleichungen (20.3) die Zustände |φ n ⟩ nur bis auf ein Vielfaches der ungestör (0) ten Wellenfunktion |φ n ⟩ bestimmt sind. Diese Freiheit können wir ausnutzen,
1 Für solche Streuzustände sind andere Größen wie z. B. die Zustandsdichte relevant.
20.1 Stationäre Störungstheorie
(k>0)
um die |φ n
| 439
(0)
⟩ orthogonal zu den |φ n ⟩ = |n⟩ zu wählen:² (k)
⟨n|φ n ⟩ = 0 ,
k>0.
(20.4)
Es ist zweckmäßig, die ungestörte Wellenfunktion als normiert vorauszuset zen: ⟨n|n⟩ = 1 . (20.5) Die ungestörten Wellenfunktionen |n⟩ als Eigenfunktionen des hermiteschen Operators H0 bilden mit dieser Normierung ein vollständiges Orthonormal system: ∑ |n⟩⟨n| = 1̂ , ⟨n|m⟩ = δ nm . n
Falls die Störreihe konvergiert, ist die gestörte Wellenfunktion φ n (λ) sicherlich nicht orthogonal zur ungestörten |n⟩, da die gestörte für λ → 0 stetig in die ungestörte übergeht, d. h., i. A. wird deshalb ⟨n|φ n (λ)⟩ ≠ 0 gelten. In der Tat finden wir durch Multiplikation von (20.2) mit ⟨n| unter Beachtung von (20.4) und (20.5) für die gestörte Wellenfunktion ⟨n|φ n (λ)⟩ = 1 .
2.
Für die diskreten Eigenwerte kann die aus der Störreihe gewonnene Wellen funktion |φ n (λ)⟩ im Nachhinein auf 1 normiert werden. Das Skalarprodukt der linken Seite der Gleichungen (20.3) mit der ungestör (0) ten Eigenfunktion ⟨φ n | = ⟨n| verschwindet wegen (20.1). Folglich muss auch das Skalarprodukt der rechten Seite mit ⟨n| verschwinden. Hieraus erhalten wir mit (20.4) und (20.5): (k) (k−1) E n = ⟨n|V|φ n ⟩ . (20.6) Damit verlangt die Berechnung der Energie zu einer Ordnung k > 0 nur die Berechnung der Wellenfunktion zur nächstniedrigeren Ordnung k − 1. Da die ungestörten Zustände |m⟩ ein vollständiges Orthonormalsystem bilden, (k) (0) können wir die Korrekturen der Wellenfunktion |φ n ⟩ nach den |φ m ⟩ = |m⟩ entwickeln: (k) (k) |φ n ⟩ = ∑ |m⟩⟨m|φ n ⟩ . (20.7) m=n ̸
Der Zustand |m = n⟩ tritt wegen der Bedingung (20.4) in dieser Entwicklung nicht auf.
(k)
2 Dies ist sofort einzusehen, denn falls ⟨n|φ n ⟩ ≠ 0, so erfüllt der Zustand (k)
(k)
| φ̄ n ⟩ = |φ n ⟩ + α|n⟩ (k)
(k)
die Bedingung ⟨n|φ̄ n ⟩ = 0, wenn α = −⟨n|φ n ⟩/⟨n|n⟩ gewählt wird.
440 | 20 Störungstheorie
Im Folgenden berechnen wir die führenden Korrekturen zur Energie und Wellenfunk tion. Aus Gleichung (20.6) folgt unmittelbar für k = 1 (1)
E n = ⟨n|V|n⟩ .
(20.8)
In der ersten Ordnung Störungstheorie ist damit die Korrektur zur Energie durch den Erwartungswert der Störung in den ungestörten Zuständen gegeben. Von diesem ein fachen Resultat wird sehr oft Gebrauch gemacht. Zur Bestimmung der Korrekturen erster Ordnung zur Wellenfunktion projizieren wir die Gleichung der Ordnung λ1 auf die ungestörten Zustände |m⟩, d. h., wir multi (0) plizieren von links mit ⟨φ m | = ⟨m|: (0)
(0)
(1)
(1)
(E m − E n ) ⟨m|φ n ⟩ = E n ⟨m|n⟩ − ⟨m|V|n⟩ .
(20.9)
Wählen wir hier m = n, so erhalten wir wieder das bereits oben gefundene Ergeb nis (20.8). Wählen wir in (20.9) m ≠ n, so erhalten wir wegen ⟨m|n⟩ = 0: ⟨m|V|n⟩ (1) . ⟨m|φ n ⟩ = (0) (0) En − Em Damit finden wir aus (20.7) für die Korrektur der Wellenfunktion in der ersten Ordnung Störungstheorie (1)
|φ n ⟩ = ∑ |m⟩ m=n ̸
⟨m|V|n⟩ (0)
(0)
En − Em
.
(20.10)
Analog lassen sich die Korrekturen höherer Ordnung sukzessiv bestimmen. Die Kor rektur zweiter Ordnung zur Energie ist nach (20.6) durch (2)
(1)
E n = ⟨n|V|φ n ⟩ (1)
gegeben. Setzen wir für die |φ n ⟩ den oben gefundenen Wert (20.10) ein, so erhalten wir schließlich für die Energiekorrekturen in zweiter Ordnung Störungstheorie: (2)
En = ∑
m=n ̸
|⟨n|V|m⟩|2 (0)
(0)
En − Em
.
(20.11)
Für den Grundzustand |n = 0⟩ ist die Korrektur zweiter Ordnung stets negativ. Bei ver gleichbaren Matrixelementen der Störung liefern benachbarte Energieniveaus wegen der Kleinheit der Energienenner offenbar die dominanten Beiträge zur Summe (20.11). Die Energiekorrektur zweiter Ordnung wird sehr groß, wenn zwei dicht benachbarte ungestörte Energieniveaus vorliegen. Dies signalisiert den Zusammenbruch der obi gen Störungstheorie bei Entartung. Den Parameter λ hatten wir oben formal nur eingeführt, um in der Störreihe die Ordnung der einzelnen Terme bezüglich der Störung leichter identifizieren zu können. Im Folgenden werden wir wieder λ = 1 setzen. Die oben dargelegte Störentwicklung wird als Rayleigh-Schrödinger-Störungstheorie bezeichnet.
20.2 Störungstheorie für zwei dicht benachbarte Niveaus
| 441
20.2 Störungstheorie für zwei dicht benachbarte Niveaus Wie aus dem Ausdruck (20.11) für die Korrektur der Energie in zweiter Ordnung bereits ersichtlich ist, bricht die Störreihe zusammen, wenn zwei oder mehrere ungestörte Niveaus sehr dicht beieinanderliegen, also insbesondere bei Entartung. Im Folgenden wollen wir exemplarisch den Fall zweier dicht benachbarter Niveaus behandeln, die auch streng entartet sein dürfen. Den Hamilton-Operator zerlegen wir wieder in einen einfach behandelbaren Ope rator H0 und in eine Störung H = H0 + V . (0)
Wir bezeichnen die beiden dicht benachbarten Eigenzustände von H0 mit |φ1 ⟩ und (0) (0) (0) (0) |φ2 ⟩. Die zugehörigen Energien seien E1 und E2 . Die übrigen Eigenwerte E n=1,2 ̸ sollen weit genug von diesen entfernt liegen, sodass sie nicht zu kleinen Energienen nern führen können. Des Weiteren nehmen wir an, dass das Matrixelement der Stö rung zwischen den beiden dicht benachbarten Zuständen (0)
(0)
∆ := ⟨φ1 |V|φ2 ⟩ nicht verschwindet, ∆ ≠ 0. (0)
(0)
(0)
(0)
Falls ⟨φ 1 |V|φ 2 ⟩ = 0, so treten die „gefährlichen“ Terme mit dem kleinen Energienenner E 1 − E 2 in der Störreihe (siehe z. B. (20.11)) nicht auf, und die gewöhnliche Störungstheorie ist anwendbar. Man sagt in diesem Fall auch, dass die beiden dicht benachbarten Zustände durch die Störung nicht gemischt werden. Im Fall der Entartung wird diese dann durch die Störung nicht aufgehoben. Im all gemeinen Fall, d. h. ∆ ≠ 0, wird jedoch die Störung die (Nahezu-)Entartung aufheben. Dabei kann es auch zu Überschneidungen verschiedener Energieniveaus kommen (siehe Abb. 20.1).
Wir interessieren uns für das Schicksal der beiden dicht benachbarten, ungestör ten Zustände, wenn die Störung eingeschaltet wird. Da zum einen die übrigen weit entfernten Niveaus (wegen ihrer großen Energienenner, siehe Gleichungen (20.10), (20.11)) keinen großen Einfluss ausüben können, zum anderen aber die Störungstheo rie für die beiden dicht benachbarten Niveaus versagt, werden wir die Störung im
(0)
E2
(0)
E1
λ
Abb. 20.1: Aufspaltung der ungestörten Energieniveaus durch die Störung.
442 | 20 Störungstheorie
Unterraum der beiden dicht benachbarten Zustände exakt diagonalisieren. Für die gestörte Wellenfunktion machen wir deshalb den Ansatz (0)
(0)
|φ⟩ = a|φ1 ⟩ + b|φ2 ⟩ . Setzen wir diesen Ansatz in die stationäre Schrödinger-Gleichung H|φ⟩ = E|φ⟩ ein und multiplizieren die Gleichung von links nacheinander mit den beiden unge (0) (0) störten bra-Eigenvektoren ⟨φ1 |, ⟨φ2 |, so reduziert sich die stationäre SchrödingerGleichung auf das folgende zweidimensionale Eigenwertproblem: (
H11 − E H21
H12 0 a )( ) = ( ) . 0 b H22 − E
(20.12)
(0)
Hierbei haben wir die Orthonormiertheit der |φ i=1,2 ⟩ benutzt und die Matrixelemente des Hamilton-Operators als {E(0) + V ii , (0) (0) H ij := ⟨φ i |H|φ j ⟩ = ⟨i|H|j⟩ = { i V , { ij
i=j i ≠ j
mit V ij = ⟨i|V|j⟩ geschrieben. Mit den Abkürzungen ϵ i = H ii ,
∗ ∆ = V12 = V21
führt die Lösbarkeitsbedingung des homogenen Gleichungssystems (20.12) auf die Sä kulargleichung ∆ ϵ1 − E ∗ = 0 , ∆ ϵ2 − E welche eine quadratische Gleichung für die Energieeigenwerte ist, deren beide Lösun gen durch E± =
ϵ1 + ϵ2 √ ϵ1 − ϵ2 2 ± ( ) + |∆|2 2 2
(20.13)
gegeben sind. Die oben durch Diagonalisierung gewonnenen Ausdrücke für die Energie sind auch im Falle dicht benachbarter Niveaus bzw. im Falle der Entartung gültig, wenn die gewöhnliche Störungstheorie versagt.
20.2 Störungstheorie für zwei dicht benachbarte Niveaus
E
E+
| 443
1
|Δ|
1 +2 2
δ
−|Δ|
E−
2
Abb. 20.2: Aufspaltung der dicht benachbarten Niveaus durch die Störung. Die durchgezogenen Kurven sind die exakten Energieniveaus E ± , die gestrichelten Linien zeigen die Erwartungswerte ϵ1/2 des vollen Hamilton-Operators H in den ungestörten Zuständen. (Die ϵ i=1,2 sind gerade die Energien in erster Ordnung Störungstheorie.)
In Abb. 20.2 sind die exakten (gestörten) Energieniveaus E± und die Erwartungs werte des vollen Hamilton-Operators H in den ungestörten Zuständen, ϵ1/2 , als Funk tion von δ = ϵ1 − ϵ2 aufgetragen. Man beachte den Zusammenhang E± (∆ = 0) =
ϵ1 + ϵ2 δ ± = ϵ1/2 . 2 2
Während sich die Energien ϵ1/2 im Entartungspunkt δ = 0 kreuzen, besteht zwischen den gestörten Energieniveaus E± eine endliche Energielücke. Man spricht in diesem Zusammenhang von einer Niveauabstoßung der gestörten Zustände. Der oben behandelte Fall zweier dicht benachbarter Niveaus lässt sich direkt auf den Fall mehrerer dicht benachbarter Niveaus verallgemeinern. Im Falle mehrerer sol cher Niveaus muss der Hamilton-Operator in dem Hilbert-Raum, der von diesen Zu ständen aufgespannt wird, diagonalisiert werden. In praktischen Anwendungen der Störungstheorie bei Entartung empfiehlt es sich, die Diagonalelemente der Störung mit in den ungestörten Hamilton-Operator einzubeziehen, d. h., der Hamilton-Operator H = H0 + V wird umgeordnet zu: H = H0 + V , wobei
H0 = H0 + ∑ |k⟩⟨k|V|k⟩⟨k| k
V = V − ∑ |k⟩⟨k|V|k⟩⟨k| . k
444 | 20 Störungstheorie
In der Tat gilt dann: ⟨k|V |k⟩ = 0 , und die Eigenwerte von H0 sind durch (0)
En = E n + ⟨n|V|n⟩ (0)
mit den Eigenwerten E i von H0 verknüpft. Abschließend zeigen wir noch, wie aus der oben angegebenen exakten Behand lung zweier benachbarter Niveaus die im vorigen Abschnitt besprochene gewöhnliche Störentwicklung (Rayleigh-Schrödinger-Störungstheorie) hervorgeht, wenn die Ener giedifferenz der beiden benachbarten Zustände groß im Vergleich zum Matrixelement der Störung zwischen diesen beiden Zuständen ist: ϵ1 − ϵ2 ≫ |∆| . 2 In der Tat, entwickeln wir das oben erhaltene Ergebnis (20.13) für die beiden Energie eigenwerte nach Potenzen von ∆/(ϵ1 − ϵ2 ), so erhalten wir in unterster nicht trivialer Ordnung: E± =
2 ϵ1 + ϵ2 ϵ1 − ϵ2 1 2 ) |∆|2 + ⋅ ⋅ ⋅ ] ± [1 + ( 2 2 2 ϵ1 − ϵ2
= ϵ1/2 ±
|∆|2 . ϵ1 − ϵ2
Setzen wir hier die explizite Form der Diagonalelemente ϵ1/2 des Hamilton-Operators ein, so nehmen die gestörten Energieeigenwerte folgende Gestalt an: (0)
(0)
(0)
(0)
|V12 |2
(0)
E+ = E1 + ⟨φ1 |V|φ1 ⟩ +
(0) E1
|V21 |2
(0)
E− = E2 + ⟨φ2 |V|φ2 ⟩ +
(0)
+ V11 − (E2 + V22 )
(0)
(0)
E2 + V22 − (E1 + V11 )
, .
Beschränken wir uns auf Terme bis einschließlich zweiter Ordnung in der Störung V, so können wir in den Energienennern die Störung gegenüber den ungestörten Ener gien vernachlässigen, und die obigen Ausdrücke gehen in das Resultat der Störungs theorie zweiter Ordnung über, siehe Gleichungen (20.8), (20.11).
20.3 Anwendung der Störungstheorie: Grundzustandsenergie des Heliumatoms Als illustratives Anwendungsbeispiel der stationären Störungstheorie wollen wir im Folgenden die Grundzustandsenergie des Heliumatoms oder allgemein von (Z − 2)fach ionisierten Atomen berechnen. Solche Atome bestehen aus einem Z-fach positiv geladenen Atomkern und zwei negativ geladenen Elektronen (Abb. 20.3).
20.3 Anwendung der Störungstheorie: Grundzustandsenergie des Heliumatoms
| 445
Da die Wechselwirkung zwischen Elektronen und Atomkern anziehend, die zwischen den beiden Elektronen jedoch abstoßend ist, halten sich die Elektronen näher am Atomkern als beieinander auf. Da außerdem die elektrische Ladung des Atomkerns eZ ≥ 2e (betragsmäßig) größer als die eines Elektrons ist, sollte die Wechselwirkung zwischen den beiden Elektronen wesentlich kleiner sein als die zwischen Elektronen und Atomkern. Folglich sollte die Elektron-Elektron-Wechselwirkung in Störungstheo rie behandelbar sein. Da der Atomkern sehr viel schwerer als die Elektronen ist, können wir den Atom kern als unendlich schwer, d. h. als ruhend, annehmen und damit seine kinetische Energie vernachlässigen. Legen wir den Atomkern in den Koordinatenursprung und bezeichnen die Koordinaten der beiden Elektronen mit x 1 und x2 , so ist der Hamil ton-Operator der heliumähnlichen Ionen durch H(x 1 , x 2 ) = H0 (x 1 ) + H0 (x 2 ) + V c (x 1 , x 2 )
(20.14)
gegeben. Hierbei bezeichnet H0 (x) =
p2 Ze2 − 2m 4π|x|
(20.15)
den Hamilton-Operator für die Bewegung eines einzelnen Elektrons im Feld des (un endlich schweren) Atomkerns, dessen Spektrum wir im Zusammenhang mit der Be handlung des Wasserstoffatoms exakt berechnet haben. Ferner ist V c (x 1 , x2 ) =
e2 4π|x1 − x2 |
die Coulomb-Wechselwirkung zwischen den beiden Elektronen. Ohne diese Wechsel wirkung hätten wir ein exakt lösbares Problem zweier unabhängiger Teilchen. Wir wählen deshalb den ungestörten Hamilton-Operator als H0 (x 1 , x 2 ) = H0 (x 1 ) + H0 (x 2 )
(20.16)
und die Coulomb-Wechselwirkung zwischen den Elektronen als Störung: H1 (x 1 , x 2 ) = V c (x 1 , x 2 ) . Das ungestörte Zweiteilchenproblem (0)
(0)
(0)
H0 (x 1 , x2 )φ n1 n2 (x 1 , x2 ) = E n1 n2 φ n1 n2 (x 1 , x2 ) lässt sich durch den Separationsansatz (0)
φ n1 n2 (x 1 , x2 ) = φ n1 (x 1 )φ n2 (x 2 ) exakt lösen, was auf die Energieeigenwerte (0)
E n1 n2 = E n1 + E n2 e−
p n n p
e− Abb. 20.3: Schematische Darstellung des He-Atoms.
(20.17)
446 | 20 Störungstheorie führt. Hierbei sind φ n (x) und E n die Wellenfunktion bzw. der Energieeigenwert des ungestörten Einteilchenproblems, d. h. des Wasserstoffatoms, jedoch mit Z > 1: H0 (x)φ n (x) = E n φ n (x) . Im Folgenden interessieren wir uns für die Grundzustandsenergie des heliumähnli chen Atoms. Wir nehmen dazu an, dass die ungestörten Elektronen die beiden im Spin entarteten Zustände niedrigster Energie besetzen, für die n = 1 und l = n − 1 = 0 gilt.³ Die Grundzustandswellenfunktion des wasserstoffähnlichen Atoms ist durch (18.27) φ n=1,l=0,m=0(x) =
1 r exp (− ) , ā √π ā 3
ā =
a Z
gegeben, wobei a der Bohr’sche Atomradius (18.7) ist. Die zugehörige Energie lautet (siehe Gleichung (18.23)): E n=1 = −Z 2 R . Hierbei bezeichnet R die Rydberg-Konstante (18.9). Für die ungestörte Energie des Zweiteilchensystems erhalten wir damit: (0)
E n1 =1,n2 =1 = 2E n=1 = −2Z 2 R , und die ungestörte Wellenfunktion nimmt die explizite Gestalt φ(0) (x 1 , x 2 ) = φ100 (x 1 )φ100 (x 2 ) =
1 r1 + r2 exp (− ) ā π ā 3
(20.18)
an. Setzen wir diese Wellenfunktion in den Ausdruck für die Korrektur zur Energie in erster Ordnung Störungstheorie (20.8) ein, so erhalten wir: E(1) = ⟨φ(0) |H1 |φ(0) ⟩ = ∫ d3 x1 ∫ d3 x2
ρ(x 1 )ρ(x 2 ) = ∫ d3 x1 ρ(x 1 )U(x 1 ) , 4π|x 1 − x 2 |
(20.19)
wobei
e 2r exp (− ) = ρ(r) ā π ā 3 die quantenmechanische Ladungsverteilung eines Elektrons im Grundzustand des wasserstoffähnlichen Atoms ist und U(x) das mittlere Feld ist, dass eines der beiden Elektronen für das andere (aufgrund ihrer Coulomb-Wechselwirkung) erzeugt. Da die Ladungsdichte ρ(r) nur vom Radius abhängt, empfiehlt es sich, zur Be rechnung der Integrale in (20.19) sphärische Koordinaten zu benutzen. Wir erhalten dann: ∞ ∞ 1 E(1) = ∫ dr1 r21 ρ(r1 ) ∫ dr2 r22 ρ(r2 ) ∫ dΩ1 ∫ dΩ2 . 4π|x1 − x2 | ρ(x) = −e|φ100 (x)|2 = −
0
0
S2
S2
Zur Berechnung der beiden Integrale über die Raumwinkel Ω1 und Ω2 verwenden wir
3 Die Spinentartung wird allerdings durch die Störung aufgehoben, wie im Band 2 im Rahmen der Vielteilchentheorie noch genauer untersucht wird. Dort wird gezeigt, dass der Produktansatz (20.17) in der Tat den Grundzustand (Parahelium) liefert.
20.3 Anwendung der Störungstheorie: Grundzustandsenergie des Heliumatoms
|
447
Tab. 20.1: Die Grundzustandsenergien der ersten (Z − 2)-fach ionisierten Atome in erster Ordnung Störungstheorie. Sämtliche Energien sind in eV angegeben. Z
E (0)
E (1)
E (0) + E (1)
He
2
−108
34
−74,8
Li+
3
−243,5
50,5
−193
−197,1
Be++
4
−433
67,5
−365,5
−370,0
E exp −78,98
die aus der klassischen Elektrodynamik bekannte Multipolentwicklung ∞ l r 2l + 1 m=−l
wobei r< = min{r1 , r2 } und r> = max{r1 , r2 }. Benutzen wir (Y00 (Ω) = 1/√4π) ∗ (Ω)Y lm (Ω) = δ l0 δ m0 √4π , ∫ dΩ Y lm (Ω) = √4π ∫ dΩ Y00 S2
S2
so erhalten wir für das Integral über die Raumwinkel: ∫ dΩ1 ∫ dΩ2 S2
S2
1 4π|x1 − x2 |
=
4π . r>
Die verbleibenden Radialintegrale lassen sich elementar auswerten, und wir erhalten für die Korrektur zur Grundzustandsenergie: e2 φ(0) ⟩ = 5 ZR . (20.20) E(1) ≡ ⟨φ(0) 4 4π|x1 − x2 | Die Gesamtenergie des Grundzustandes beträgt damit in erster Ordnung Störungs theorie: 5 E = E(0) + E(1) = − (2Z 2 − Z) R . 4 In Tab. 20.1 sind die aus der Störungstheorie gewonnenen numerischen Werte für die Grundzustandsenergie der Z − 2-fach ionisierten Atome zusammen mit den experi mentellen Energien für die Kernladungszahlen Z = 2, 3, 4 angegeben. Man erkennt, dass die Störungstheorie mit wachsendem Z immer besser wird: 5 |E(1) | = ≤ 0.3 , |E(0) | 8Z
Z≥2.
Dies entspricht unseren einleitenden qualitativen Betrachtungen, wonach mit wach sendem Z die Wechselwirkung der Elektronen mit dem Atomkern immer mehr die Wechselwirkung der Elektronen untereinander dominiert.
21 Das Ritz’sche Variationsverfahren Die im vorangegangenen Kapitel behandelte Störungstheorie verlangt die Aufspal tung des betrachteten Systems in ein einfach zu behandelndes Modellsystem, dessen Lösung bekannt sein muss, und eine Störung, die gewöhnlich zu einer Mischung der Eigenzustände des Modellsystems führt. In vielen Fällen ist es jedoch nicht offensicht lich bzw. nicht leicht, ein einfaches Modellsystem zu finden, das eine gute Anfangs näherung zum betrachteten System darstellt. Wir wollen deshalb im Folgenden eine alternative Methode angeben, die es erlaubt, genähert Eigenenergien und Eigenfunk tionen des Hamilton-Operators eines beliebigen Systems zu berechnen.
21.1 Variationsverfahren zur Berechnung der Energieeigenzustände Wir setzen voraus, dass das Spektrum des Hamilton-Operators diskret und nach un ten beschränkt ist. Dann existiert ein minimaler endlicher Eigenwert E0 von H, die Grundzustandsenergie, und der Grundzustand ist energetisch stabil. Sei ψ eine belie bige Wellenfunktion, d. h. eine beliebige Funktion des Hilbert-Raumes von H (nicht notwendigerweise eine Eigenfunktion von H), die wir der Einfachheit halber auf 1 normiert voraussetzen: ⟨ψ|ψ⟩ = 1 . Dann gilt die folgende Beziehung: E0 ≤ ⟨ψ|H|ψ⟩ ,
(21.1)
die sich sehr einfach beweisen lässt. Zum Beweis beachten wir, dass die Eigenfunk tionen |φ n ⟩ des (hermiteschen) Hamilton-Operators, H|φ n ⟩ = E n |φ n ⟩ ,
(21.2)
bei geeigneter Normierung ein vollständiges Orthonormalsystem ⟨φ n |φ m ⟩ = δ nm bilden. Wir können deshalb ψ nach diesen Eigenzuständen entwickeln, |ψ⟩ = ∑ c n |φ n ⟩ ,
(21.3)
n
wobei die Entwicklungskoeffizienten c n aufgrund der Normierung von ψ der Bedin gung ⟨ψ|ψ⟩ = ∑ |c n |2 = 1 (21.4) n https://doi.org/10.1515/9783110586022-021
21.1 Variationsverfahren zur Berechnung der Energieeigenzustände | 449
genügen. Unter Benutzung der Gleichungen (21.2) bis (21.4) erhalten wir für den Er wartungswert des Hamilton-Operators im Zustand ψ: ⟨ψ|H|ψ⟩ = ∑ c∗n c m ⟨φ n |H|φ m ⟩ n,m
= ∑ c∗n c m E m ⟨φ n |φ m ⟩ n,m
= ∑ |c n |2 E n ≥ E0 ∑ |c n |2 = E0 . n
n
Das Gleichheitszeichen gilt offenbar nur dann, wenn |ψ⟩ = |φ0 ⟩, sodass von der Ent wicklung (21.3) nur der Term mit n = 0 überlebt. Damit haben wir gezeigt, dass sich die Grundzustandsenergie als Minimum von ⟨ψ|H|ψ⟩ bei Variation der normierten Wel lenfunktion ψ ergibt: E0 = min⟨ψ|H|ψ⟩ ,
⟨ψ|ψ⟩ = 1 .
(21.5)
Diese Gleichung lässt sich zur genäherten Berechnung der Grundzustandsenergie be nutzen. Dazu wählt man eine Testfunktion ψ(α, β, . . . ), die üblicherweise von einigen Parametern α, β, . . . abhängt, und berechnet mit ihr den Erwartungswert des Hamil ton-Operators ⟨ψ(α, β, . . . )|H|ψ(α, β, . . . )⟩ =: E(α, β, . . . ) . Die so definierte Energie E(α, β, . . . ) wird minimal für ∂E =0, ∂α
∂E =0, ∂β
... .
Die Lösung dieser Gleichungen, die wir mit α0 , β 0 , . . . bezeichnen, liefert uns aus der Klasse der Testfunktionen ψ(α, β, . . . ) die beste Näherung ψ(α 0 , β 0 , . . . ) zur exak ten Wellenfunktion des Grundzustandes. Die minimale Energie E(α0 , β 0 , . . . ) liefert nach (21.1) eine obere Schranke für die Energie des Grundzustandes. Das oben beschriebene Verfahren zur genäherten Berechnung der Grundzu standsenergie wird als Ritz’sches Variationsverfahren bezeichnet. Es besitzt eine sehr große praktische Bedeutung für die genäherte Bestimmung der Grundzustandsen ergie komplexer quantenmechanischer Systeme. Der Vorteil dieser Methode besteht darin, dass man zunächst mit einfachen Wellenfunktionen beginnen kann und an schließend die Klasse der Testfunktionen erweitert, indem z. B. zusätzliche Parameter eingebaut oder Linearkombinationen von mehreren Testfunktionen ψ = ∑ a i ψ i (α i , β i , . . . ) i
benutzt werden, wobei die Entwicklungskoeffizienten a i ebenfalls als Variationspa rameter betrachtet werden. Verkleinert sich die Energie durch Erweiterung der Test funktionen, so wurde eine bessere Näherungslösung gefunden. Durch Erweiterung
450 | 21 Das Ritz’sche Variationsverfahren
der Testfunktionen kann sich die Energie nur verkleinern und somit die erhaltene Nä herungslösung nur verbessert werden und damit die obere Schranke der Energie nur verringert werden. Es gibt kein allgemeines Verfahren, geeignete Testwellenfunktio nen zu finden, sondern die Wahl der Testfunktion erfolgt in der Praxis nach einge hender qualitativer Analyse des vorliegenden Hamilton-Operators unter Beachtung seiner Symmetrien. Je größer der Raum der Testfunktionen gewählt wird, desto besser ist die erhal tene Näherung, desto aufwendiger ist allerdings auch das Variationsverfahren. Wird der gesamte Hilbert-Raum bei der Variation zugelassen (siehe Abschnitt 21.3), so lie fert das Variationsprinzip die exakte Wellenfunktion. Das Variationsprinzip lässt sich deshalb auch zur exakten Lösung der Schrödinger-Gleichung benutzen. Der HilbertRaum eines quantenmechanischen Systems ist i. A. bekannt, z. B. der Raum der über ℝ quadratisch integrierbaren Funktionen. Wir wählen eine beliebige vollständige orthonormierte Basis in diesem Hilbert-Raum {ϕ n }, ⟨ϕ n |ϕ m ⟩ = δ nm und entwickeln die Wellenfunktion nach dieser Basis: |ψ⟩ = ∑ c n |ϕ n ⟩ .
(21.6)
n
Variation der Energie ⟨ψ|H|ψ⟩ = ∑ c∗n c m ⟨ϕ n |H|ϕ m ⟩ n,m
nach den Entwicklungskoeffizienten c n unter der Nebenbedingung ⟨ψ|ψ⟩ = ∑ |c n |2 = 1 liefert wegen der Vollständigkeit der Basis {ϕ n } das absolute Minimum der Energie und damit die exakte Wellenfunktion und Energie des Grundzustandes. Dieses Ver fahren kann zur numerischen Lösung der Schrödinger-Gleichung benutzt werden, wo bei die Summe in (21.6) natürlich auf eine endliche Anzahl von Termen eingeschränkt werden muss. Diese kann jedoch sukzessiv vergrößert werden, um die Genauigkeit der numerischen Lösung zu erhöhen. Das Ritz’sche Variationsverfahren kann auch zur Bestimmung der angeregten Zu stände benutzt werden. Sei ψ0 die (exakte oder über das Variationsprinzip bestimmte genäherte) Grundzustandswellenfunktion. Die Energie E1 des ersten angeregten Zu standes lässt sich dann aus dem Variationsproblem E1 = min⟨ψ1 |H|ψ1 ⟩ mit den Nebenbedingungen ⟨ψ1 |ψ1 ⟩ = 1 ,
⟨ψ1 |ψ0 ⟩ = 0
bestimmen. Der Beweis erfolgt völlig analog zum Beweis des Variationsprinzips für die Grundzustandsenergie. Wir werden später den Beweis in allgemeiner Form für be liebige Eigenzustände des Hamilton-Operators erbringen. In analoger Weise lässt sich
21.2 Beispiele zum Ritz’schen Variationsverfahren | 451
der zweite angeregte Zustand aus dem Variationsprinzip E2 = min⟨ψ2 |H|ψ2 ⟩ mit den Nebenbedingungen ⟨ψ2 |ψ2 ⟩ = 1 ,
⟨ψ2 |ψ0 ⟩ = 0 ,
⟨ψ2 |ψ1 ⟩ = 0
bestimmen. Obwohl sich das hier beschriebene Verfahren prinzipiell zu höheren angeregten Zuständen fortsetzen lässt, ist in der Praxis das Variationsverfahren auf die Berech nung des Grundzustandes und der untersten angeregten Zustände begrenzt, da der Fehler in der n-ten Wellenfunktion sich über die Orthogonalitätsbedingungen auf die (n + 1)-te Wellenfunktion überträgt und somit die Fehler mit wachsendem n größer werden.
21.2 Beispiele zum Ritz’schen Variationsverfahren Im Folgenden soll das Ritz’sche Variationsverfahren anhand einiger Beispiele illus triert werden.
21.2.1 Der harmonische Oszillator Grundzustand und erster angeregter Zustand des harmonischen Oszillators sollen über das Variationsprinzip bestimmt werden. Der Hamilton-Operator des harmoni schen Oszillators (12.27) lautet: ℏ2 d2 1 + mω2 x2 . (21.7) 2m dx2 2 Wegen der Normierbarkeit müssen die Wellenfunktionen für x → ±∞ verschwinden. Ferner wissen wir, dass die Wellenfunktion des Grundzustandes keine Knoten besitzt (siehe Abschnitt 8.3). Wir wählen deshalb als Testfunktion für den Grundzustand den folgenden Ansatz: α (21.8) ψ0 (x; α) = A exp (− x2 ) . 2 Hierbei ist α der Variationsparameter, während die Amplitude A durch die Normie rung (bis auf eine irrelevante komplexe Phase) auf H=−
α 1/4 A=( ) π festgelegt ist, siehe Gleichung (12.63). Berechnung des Erwartungswertes des Hamil ton-Operators (21.7) für die Testwellenfunktion (21.8) liefert: E0 (α) = ⟨ψ0 (α)|H|ψ0 (α)⟩ =
1 ℏ2 α mω2 ( + ) . 4 m α
(21.9)
452 | 21 Das Ritz’sche Variationsverfahren −1/2
Diese Energie wird minimal, E0 (α 0 ) = 0, für α 0 = mω/ℏ. Man beachte, dass x0 = α 0 gerade die Oszillatorlänge (12.29) ist. Mit diesem Wert des Variationsparameters erhal ten wir aus (21.9) die exakte Grundzustandsenergie (12.53) E0 (α 0 ) =
1 ℏω 2
und aus (21.8) die exakte Grundzustandswellenfunktion (12.62) ψ0 (x; α 0 ) = (
mω 1/4 1 mω 2 ) exp (− x ) . πℏ 2 ℏ
Das exakte Ergebnis wurde hier erhalten, da die Klasse unserer Testfunktionen (21.8) die exakte Wellenfunktion mit enthält. Das Variationsprinzip (21.5) hat den Variati onsparameter α so festgelegt, dass die Testfunktion (21.8) zur exakten Wellenfunktion wird. Als Nächstes wollen wir den ersten angeregten Zustand des harmonischen Os zillators über das Ritz’sche Variationsprinzip bestimmen. Bei der Wahl der Testfunk tionen beachten wir, dass der erste angeregte Zustand orthogonal zum Grundzu stand (21.8) sein muss. Wegen der Symmetrie des Potenzials muss dieser Zustand außerdem eine ungerade Funktion von x sein. Die einfachste Testfunktion, die diese Eigenschaft besitzt, lautet β ψ1 (x; β) = Bx exp (− x2 ) . 2 Hierbei ist β der Variationsparameter, während B durch die Normierung (bis auf eine irrelevante komplexe Phase) auf 1/4
B=(
4β 3 ) π
festgelegt ist. Der Erwartungswert des Hamilton-Operators in diesem Zustand ist durch 3 ℏ2 β mω2 E1 (β) = ⟨ψ1 (β)|H|ψ1 (β)⟩ = ( + ) 4 m β gegeben. Minimierung der Energie bezüglich des Variationsparameters, E1 (β 0 ) = 0, liefert β 0 = mω/ℏ, womit wir wieder die exakte Energie des ersten angeregten Zustan des 3 E1 (β 0 ) = ℏω 2 und dessen Wellenfunktion ψ1 (x; β 0 ) = ( erhalten.
2 1/2 mω 3/4 1 mω 2 ) ( ) x exp (− x ) ℏ 2 ℏ √π
21.2 Beispiele zum Ritz’schen Variationsverfahren | 453
Das Variationsprinzip hat hier die exakten Wellenfunktionen geliefert, da diese in den Ansätzen für die Testwellenfunktionen enthalten sind. Für komplexere Systeme wird man i. A. keinen praktikablen Variationsansatz finden, der die exakte Wellen funktion mit enthält. Es ist sehr illustrativ, die Variationsrechnung mit einer Klasse von Testfunktionen durchzuführen, welche die exakte Wellenfunktion nicht enthält: Als Variationsansatz wählen wir die Funktion A . ψ0 (x; α) = √cosh(αx) Sie besitzt die geforderten Eigenschaften einer Grundzustandswellenfunktion in ei nem symmetrischen Potenzial, d. h., sie ist symmetrisch, ψ0 (−x; α) = ψ0 (x; α), und besitzt keinen Knoten. Mit ∞
∫ 0
∞ π dy = arctan(sinh y) = 0 cosh y 2
erhalten wir für die Normierungskonstante: α . π Für die Ableitung der Wellenfunktion finden wir: |A|2 =
α sinh(αx) . ψ0 (x; α) = − A 2 cosh3/2 (αx) Unter Benutzung von ∞
∫ dy 0
sinh2 y cosh3 y
= [−
sinh y 2 cosh2 y
∞
+
1 π arctan(sinh y)] = 2 4 0
finden wir für die kinetische Energie durch partielle Integration: ∞
⟨ψ0 (α)|T|ψ0 (α)⟩ =
ℏ2 ℏ2 α 2 2 ∫ dx (ψ0 (x; α)) = . 2m 2m 8 −∞
Mit
∞
∫ dy
y2 π3 = cosh y 8
0
erhalten wir für die potenzielle Energie: ⟨ψ0 (α)|V|ψ0 (α)⟩ =
m 2 π2 . ω 2 4α 2
Für die Gesamtenergie ergibt sich dann: E0 (α) = ⟨ψ0 (α)|H|ψ0 (α)⟩ = =
ℏω ℏ α 2 mω π2 ) ( + 2 mω 8 ℏ 4α 2 α2 ℏω π2 (x20 + 2 ) , 2 8 4x0 α 2
454 | 21 Das Ritz’sche Variationsverfahren
wobei wir die Definition der Oszillatorlänge x0 (12.29) benutzt haben. Das Minimum der Energie, E0 (α 0 ) = 0, wird für π√2 α20 = 2 x0 angenommen, und die minimale Energie beträgt: E0 (α 0 ) =
1 π ℏω √2 . 2 4
Die relative Abweichung von der exakten Grundzustandsenergie (12.53) E0 = ℏω/2 beträgt etwa 11 %, ∆E π √ 2 − 1 ≃ 0,11 , = E 4 was in Anbetracht der Tatsache, dass unsere Wellenfunktion die falsche Asymptotik 2 (e−αx/2 statt e−αx ) und nur einen einzigen Variationsparameter besitzt, sehr erstaun lich ist.
21.2.2 Der Grundzustand des Wasserstoffatoms Als nächstes Beispiel betrachten wir den Grundzustand des Wasserstoffatoms. In einem kugelsymmetrischen Potenzial besitzen die Eigenfunktionen des HamiltonOperators einen guten Drehimpuls.¹ Im Grundzustand verschwindet der Drehimpuls, und die Grundzustandswellenfunktion darf folglich nicht von den Winkelvariablen, d. h. nur vom Radius, abhängen. Ferner muss die Wellenfunktion für r → ∞ wegen der Normierbarkeit verschwinden. Da die Wellenfunktion des Grundzustandes keinen Knoten besitzt, ist es naheliegend, die Testfunktion in der Form ψ0 (r; r0 ) = Ae−r/r0 ,
r = |x|
(21.10)
zu wählen, wobei r0 wieder der Variationsparameter ist, der die Dimension einer Län ge besitzt und offenbar die Ausdehnung des Atoms charakterisiert. Die Amplitude A ist durch die Normierung auf 1 |A|2 = 3 πr0 festgelegt. Mit ψ0 (r; r0 ) = −
1 ψ(r; r0 ) r0
1 Wir benutzen hier den in der Fachwelt üblichen Sprachgebrauch: Eine Wellenfunktion besitzt einen guten Drehimpuls, falls sie Eigenfunktion zum Drehimpulsoperator ist.
21.2 Beispiele zum Ritz’schen Variationsverfahren |
455
finden wir für die kinetische Energie nach partieller Integration:² ℏ2 ℏ2 ∫ d3 x |∇ψ0 (r; r0 )|2 = ∫ d3 x |ψ0 (r; r0 )|2 2m 2m ℏ2 1 2 ℏ2 = . ( ) ∫ d3 x |ψ0 (r; r0 )|2 = 2m r0 2mr20
⟨ψ0 (r0 )|T|ψ0 (r0 )⟩ =
Ähnlich einfach ist die Berechnung der potenziellen Energie (mit einer Substitution s = r/r0 ): ⟨ψ0 (r0 )|V|ψ0 (r0 )⟩ = −
e2 1 ∫ d3 x |ψ0 (r; r0 )|2 4π |x| ∞
e2 = − 4π ∫ dr r|ψ0 (r; r0 )|2 4π 0
=−
e2 4π
∞
4π|A|2 r20
∫ ds se−2s 0
=−
e2 4πr0
.
Damit erhalten wir für die Energie im Zustand (21.10): E0 (r0 ) = ⟨ψ0 (r0 )|H|ψ0 (r0 )⟩ =
ℏ2 e2 − . 2mr20 4πr0
(21.11)
Dies ist genau der Ausdruck, den wir im Abschnitt 18.2 durch Abschätzung der Ener gie mittels der Unschärferelation erhalten hatten, wobei r0 ≃ ∆x die Ortsunschärfe repräsentierte. Wie dort gezeigt, liefert Minimierung der Energie (21.11) für den Varia tionsparameter r0 den Bohr’schen Atomradius a (18.7), für welchen E0 (r0 = a) die exakte Energie und (21.10) die exakte Wellenfunktion des Grundzustandes sind. Auch hier wurde der exakte Grundzustand erhalten, da dessen Wellenfunktion im Variati onsansatz (21.10) enthalten ist.
21.2.3 Variationsabschätzung der Helium-Grundzustandsenergie Die in Abschnitt 20.3 durchgeführte Berechnung der Grundzustandsenergie des Heli umatoms in erster Ordnung Störungstheorie liefert den Erwartungswert des GesamtHamilton-Operators in der ungestörten Wellenfunktion. Eine bessere Abschätzung kann man erhalten, wenn man die Größe Z in der ungestörten Wellenfunktion (je doch nicht im Hamilton-Operator H!) als Variationsparameter betrachtet, den wir
2 Der dabei auftretende Oberflächenterm verschwindet wieder wegen der Normierbarkeit der Wellen funktion.
456 | 21 Das Ritz’sche Variationsverfahren als Z̃ bezeichnen wollen. Dadurch vergrößern wir effektiv den Raum unserer Test funktionen, und wie in Abschnitt 21.1 diskutiert liefert das Variationsprinzip dann i. A. eine bessere (niemals aber schlechtere) Abschätzung der Grundzustandsenergie. Aus physikalischer Sicht können wir durch Variation von Z̃ die Abschirmung des Cou lomb-Potenzials des Atomkerns berücksichtigen: Ein Elektron sieht ein Potenzial mit einer effektiven Kernladungszahl Z̃ < Z wegen der Abschirmung des Kernpotenzials durch die negativ geladene Wolke der übrigen Elektronen der Hülle. Wir erwarten deshalb, dass sich aus der Variationsrechnung für Helium ein Wert Z̃ < 2 ergibt. Wir führen die Rechnung zunächst wieder allgemein für Z − 2-fach ionisierte Ato me durch. Ersetzen wir in (20.18) Z durch Z,̃ so lautet unsere Variationsfunktion: ̃ = φ̃ 100 (x 1 )φ̃ 100 (x 2 ) , ⟨x 1 , x 2 |φ0 (Z)⟩ wobei φ̃ 100 (x) =
1 r exp (− ) , ã √π ã 3
ã =
(21.12)
a Z̃
die Grundzustandswellenfunktion des Wasserstoffatoms mit der Ersetzung a → ã ist. Man beachte, dass |φ̃ 100 ⟩ für Z̃ ≠ Z keine Eigenfunktion zu H0 (20.15), H0 (x) = wohl aber zu
ist:
p2 Ze2 − , 2m 4π|x|
(21.13)
̃ 2 Ze p2 − H̃ 0 (x) = 2m 4π|x| H̃ 0 |φ̃ 100 ⟩ = Ẽ 1 |φ̃ 100 ⟩ ,
Ẽ 1 = −R Z̃ 2 ,
(21.14)
wobei wir Gleichung (18.23) benutzt haben. Wir schreiben deshalb den gegebenen Ha milton-Operator H0 (21.13) in der Form e2 H0 (x) = H̃ 0 (x) − (Z − Z)̃ 4π|x| und erhalten: 2 e φ̃ 100 ⟩ . ⟨φ̃ 100 |H0 |φ̃ 100 ⟩ = Ẽ 1 − (Z − Z)̃ ⟨ φ̃ 100 4π|x|
(21.15)
Elementare Rechnung liefert: 1 1 Z̃ ⟨φ̃ 100 φ̃ 100 ⟩ = = |x| ã a bzw.
2 e2 e ̃ , φ̃ 100 ⟩ = Z̃ ⟨φ̃ 100 = 2ZR 4πa 4π|x|
(21.16)
21.2 Beispiele zum Ritz’schen Variationsverfahren | 457
wobei wir die Beziehungen (18.6), (18.8) ℏ2 e2 = = 2R 4πa ma2 benutzt haben. Einsetzen von (21.14) und (21.16) in (21.15) liefert ̃ . ⟨φ̃ 100 |H0 |φ̃ 100 ⟩ = (Z̃ 2 − 2Z Z)R
(21.17)
Aus (21.16) können wir schließen, dass der erste und zweite Term in (21.17) von der kinetischen Energie bzw. dem Potenzial stammen, d. h., es gilt: 2 p φ̃ 100 ⟩ = Z̃ 2 R . ⟨φ̃ 100 2m Die Produktwellenfunktion (21.12) liefert für jedes der Teilchen denselben Beitrag zum ungestörten Hamilton-Operator H0 (x 1 , x 2 ) (20.16): ̃ ̃ ̃2 ̃ ⟨φ0 (Z)|(H 0 (x 1 ) + H0 (x 2 ))|φ 0 (Z)⟩ = 2(Z − 2Z Z)R . Das Matrixelement der Zweiteilchenwechselwirkung (die unabhängig von Z ist) wurde bereits in Gleichung (20.20) berechnet und liefert: e2 5 ̃ φ (Z)⟩ ⟨φ0 (Z)̃ = ZR . 0 ̃ 4 4π|x1 − x2 | Damit erhalten wir für die Gesamtenergie (20.14) im Zustand (21.12): ̃ ̃ ̃2 ̃ 5 ̃ E0 (Z)̃ = ⟨φ0 (Z)|H|φ 0 (Z)⟩ = (2 Z − 4Z Z + Z) R . 4
(21.18)
̃ Z̃ = 0 liefert: Minimierung dieser Energie bezüglich Z,̃ ∂E0 (Z)/∂ 5 . Z̃ = Z − 16 In der Tat finden wir wie aufgrund der teilweisen Abschirmung des Atomkerns durch das jeweilige andere Elektron erwartet einen kleineren Wert für die effektive Kernla dungszahl Z̃ als die eigentliche Kernladungszahl Z. Für die Energie des Grundzustan des des Z − 2-fach ionisierten Atoms finden wir dann aus (21.18): E0 (Z)̃ =
Z̃ 2 − 2Z Z̃ + 58 Z̃ Z 2 − 2Z 2 + 58 Z
E0 (Z) ,
wobei E0 (Z) der in Gleichung (21.18) definierte Ausdruck für Z̃ = Z ist. Setzen wir hier die Werte Z = 2 und Z̃ = 27/16 für das Heliumatom ein und benutzen E0 (Z = 2) = −74,8 eV aus Tab. 20.1, so erhalten wir für dessen Grundzustandsenergie: E0 (Z)̃ ≃ −77,5 eV . Dieser Wert liegt wesentlich dichter an der experimentellen Energie von −78,98 eV als der in Abschnitt 20.3 gefundene störungstheoretische Wert von E0 ≃ −74,8 eV.
458 | 21 Das Ritz’sche Variationsverfahren
21.3 Allgemeines Variationsprinzip Wir wollen jetzt die Variationsmethode von einem allgemeineren Standpunkt aus be trachten. Im Folgenden werden wir zeigen, dass jeder Zustand ψ, für den der Erwar tungswert ⟨ψ|A|ψ⟩ eines hermiteschen Operators A extremal³ wird, Eigenzustand von A ist. Mit anderen Worten, das Variationsprinzip ⟨ψ|A|ψ⟩ → extr
(21.19)
⟨ψ|ψ⟩ = 1
(21.20)
mit der Nebenbedingung liefert bei uneingeschränkter Variation der Funktion ψ eine Eigenfunktion des her miteschen Operators A. Uneingeschränkte Variation bedeutet hier, dass die Variation des Zustandes ψ über den gesamten Hilbert-Raum des betrachteten Systems mit der Observablen A erfolgt. Von der Nebenbedingung (21.20) können wir uns befreien, wenn wir den Erwar tungswert als ⟨ψ|A|ψ⟩ ⟨A⟩ ψ = (21.21) ⟨ψ|ψ⟩ schreiben. Der Erwartungswert ⟨A⟩ψ ist ein Funktional der Wellenfunktion ψ und wird extremal für solche ψ, für welche die erste Variation verschwindet: δ⟨A⟩ψ = 0 . Analog zu den Regeln der Differenziation von Funktionen erhalten wir für die erste Variation (siehe Anhang (D): 1 δ⟨ψ|ψ⟩ δ⟨ψ|A|ψ⟩ − ⟨ψ|A|ψ⟩ ⟨ψ|ψ⟩ (⟨ψ|ψ⟩)2 1 = [δ⟨ψ|A|ψ⟩ − ⟨A⟩ψ δ⟨ψ|ψ⟩] ⟨ψ|ψ⟩ 1 = [⟨δψ|(A − ⟨A⟩ψ )|ψ⟩ + ⟨ψ|(A − ⟨A⟩ψ )|δψ⟩] . ⟨ψ|ψ⟩
δ⟨A⟩ψ =
Dieser Ausdruck verschwindet nur dann, wenn ⟨δψ|(A − ⟨A⟩ψ )|ψ⟩ + ⟨ψ|(A − ⟨A⟩ψ )|δψ⟩ = 0 .
(21.22)
Diese Gleichung muss für beliebige |δψ⟩ und ⟨δψ| erfüllt sein, damit ⟨A⟩ψ extremal wird. Ähnlich wie bei komplexen Zahlen z = x + iy statt Real- und Imaginärteil, x und y, auch z und z∗ als unabhängige Variablen betrachtet werden können, können wir
3 Die in diesem Abschnitt betrachteten Extrema sind i. A. nur lokale Extrema.
21.3 Allgemeines Variationsprinzip | 459
hier auch |δψ⟩ und ⟨δψ| als unabhängige Variationen betrachten. Gleichung (21.22) ist folglich nur dann erfüllt, wenn sowohl (A − ⟨A⟩ψ ) |ψ⟩ = o
(21.23)
⟨ψ| (A − ⟨A⟩ψ ) = o
(21.24)
als auch gelten. Da A als Observable ein hermitescher Operator ist und folglich seine Erwar tungswerte reell sind, ist die zweite Gleichung (21.24) lediglich das Adjungierte der ersten Gleichung (21.23). Diese ist aber nichts anderes als die Eigenwertgleichung des Operators A. Damit erhalten wir das wichtige Ergebnis: Jeder Zustand |ψ⟩, der den Erwartungswert ⟨A⟩ψ (21.21) eines hermiteschen Opera tors A extremiert, δ⟨A⟩ψ = 0 , ist Eigenzustand von A. Die Eigenwerte von A sind die Extremalwerte von ⟨A⟩ψ . Wählen wir hier A als Hamilton-Operator H, so folgt aus dem obigen Ergebnis, dass die uneingeschränkte Variation der quantenmechanischen Energie ⟨H⟩ψ → extr die stationäre Schrödinger-Gleichung H|ψ⟩ = E|ψ⟩ liefert, und die Energieeigenwerte E sind durch die Extrema des Funktionals ⟨H⟩ψ ge geben. Damit haben wir gezeigt, dass das Variationsprinzip auch zur Bestimmung der angeregten Zustände benutzt werden kann. Die obige Ableitung zeigt auch, dass wir bei der Variation der Energie keine zu sätzlichen Bedingungen (außer Normierbarkeit) an die Wellenfunktionen der ange regten Zustände stellen müssen, um diese aus dem Variationsprinzip ⟨H⟩ψ → extr zu erhalten. Die Nebenbedingungen, welche wir in Abschnitt 21.1 an die angeregten Zustände gestellt haben (Orthogonalität zu den energetisch niedrigeren Zuständen), vereinfachen aber die praktische Durchführung des Variationsprinzips. Ohne diese Nebenbedingungen sind die angeregten Zustände lediglich Extrema von ⟨H⟩ψ . Durch diese Nebenbedingungen wird der Variationsraum (Hilbert-Raum) so eingeschränkt, dass die ursprünglichen Extrema zu absoluten Minima werden. Absolute Minima las sen sich numerisch aber viel leichter bestimmen als Extremstellen.
460 | 21 Das Ritz’sche Variationsverfahren
Zur Illustration dieses Sachverhaltes betrachten wir die Funktion f(x, y) =
1 2 (x − y2 ) , 2
die wegen ∂f =x, ∂x
∂f = −y ∂y
bei x = y = 0 ein Extremum besitzt, welches wegen ∂2 f =1, ∂x2
∂2 f =0, ∂x∂y
∂2 f = −1 ∂y2
ein Sattelpunkt ist. Schränken wir den Definitionsbereich dieser Funktion, d. h. die xy-Ebene, durch die Nebenbedingung y=0 auf die x-Achse ein,
1 2 x , 2 so wird aus dem Sattel ein absolutes Minimum. f(x, y = 0) =
Die Nebenbedingung ⟨ψ|ψ⟩ = 1 lässt sich bei der Variation (21.19) auch mithilfe eines sogenannten Lagrange-Multiplikators berücksichtigen. Bezeichnen wir diesen mit a, so ist das durch Gleichung (21.19) und (21.20) definierte Variationsproblem äquivalent zu ⟨ψ|A|ψ⟩ − a⟨ψ|ψ⟩ → extr . Uneingeschränkte Variationen der Wellenfunktionen liefert jetzt sofort die Eigenwert gleichung A|ψ⟩ = a|ψ⟩ (und ihr Adjungiertes), und der Lagrange-Multiplikator a wird zum Eigenwert des Operators A. Abschließend wollen wir zeigen, dass in der Tat |δψ⟩ und ⟨δψ| als unabhängige Variationen betrachtet werden können. Dazu beachten wir, dass Gleichung (21.22) für beliebige infinitesimale Variationen (Änderungen) δψ gelten muss. Gleichung (21.22) muss deshalb auch gelten, wenn wir δψ durch αδψ = δ(αψ) ersetzen, was für α ∈ ℂ mit |α| < ∞ ebenfalls eine infinitesimale Variation ist. Wählen wir α = i, so liefert die Ersetzung |δψ⟩ → |δ(iψ)⟩ ,
⟨δψ| → ⟨δ(iψ)|
21.3 Allgemeines Variationsprinzip | 461
in (21.22) die Bedingung ⟨δ(iψ)|(A − ⟨A⟩ψ )|ψ⟩ + ⟨ψ|(A − ⟨A⟩ψ )|δ(iψ)⟩ = 0 . Beachten wir, dass |δ(iψ)⟩ = i|δψ⟩ ,
⟨δ(iψ)| = −i⟨δψ| ,
so folgt schließlich: −i⟨δψ| (A − ⟨A⟩ψ ) |ψ⟩ + i⟨ψ| (A − ⟨A⟩ψ ) |δψ⟩ = 0 . Multiplizieren wir diese Gleichung mit i und addieren bzw. subtrahieren das Ergebnis von Gleichung (21.22), so erhalten wir ⟨δψ|(A − ⟨A⟩ψ )|ψ⟩ = 0 bzw. ⟨ψ|(A − ⟨A⟩ψ )|δψ⟩ = 0 , was gerade die beiden Gleichungen (21.23) und (21.24) liefert. Dies zeigt, dass in der Tat |δψ⟩ und ⟨δψ| als unabhängige Variationen zu betrachten sind.
22 Geladenes Teilchen im elektromagnetischen Feld In diesem Kapitel wollen wir untersuchen, wie sich elektrisch geladene Teilchen (Punktladungen), die den Gesetzen der Quantenmechanik gehorchen, in einem äuße ren elektromagnetischen Feld verhalten. Das elektromagnetische Feld selbst werden wir dabei als klassisches Feld voraussetzen. Im Folgenden fassen wir zunächst kurz die wesentlichen Punkte der Beschreibung von klassischen Ladungen im elektroma gnetischen Feld zusammen.
22.1 Klassische Ladungen im äußeren elektromagnetischen Feld Wie in der klassischen Elektrodynamik üblich, drücken wir das elektromagnetische Feld durch die entsprechenden Potenziale aus. Die Quellfreiheit des Magnetfeldes B(x, t), ∇⋅B =0, erlaubt, dieses als Rotation eines Vektorfeldes (Vektorpotenzial) A(x, t) darzustellen: B =∇×A.
(22.1)
Mit diesem Potenzialansatz nimmt das Faraday’sche Induktionsgesetz¹ ∇×E =− die Gestalt ∇ × (E +
∂B ∂t
∂A )=0 ∂t
an. Das hier auftretende, wirbelfreie Feld E + ∂ t A lässt sich folglich als Gradient eines skalaren Potenzials −Φ(x, t) schreiben, und wir erhalten für das elektrische Feld die Potenzialdarstellung E = −∇Φ −
∂A . ∂t
(22.2)
1 Wir benutzen hier das Lorentz-Heavyside-Maßsystem mit c = 1, d. h., wir messen die Zeit durch die Länge, die das Licht in dieser Zeit zurücklegt. Die Geschwindigkeit ist dann dimensionslos. Energie und Masse besitzen dann ebenfalls dieselbe Einheit. Darüber hinaus kann man durch geeignete Wahl der Energie bzw. Masseneinheit noch ℏ = 1 setzen, sodass nur noch eine Einheit in der Quantenme chanik (z. B. die Energieeinheit) auftritt. Masse, Energie, inverse Länge und inverse Zeit besitzen dann alle dieselbe Einheit. Wir werden hier jedoch nicht ℏ auf 1 setzen. https://doi.org/10.1515/9783110586022-022
463
22.1 Klassische Ladungen im äußeren elektromagnetischen Feld |
Diese Darstellung der Felder durch die Potenziale ist bekanntlich nicht eindeutig, da die elektromagnetischen Felder invariant bleiben unter den Eichtransformationen der Potenziale: A(x, t) → A (x, t) = A(x, t) + ∇Λ(x, t) , (22.3) ∂ Φ(x, t) → Φ (x, t) = Φ(x, t) − Λ(x, t) . ∂t Diese Eichinvarianz lässt sich vorteilhaft ausnutzen, um die Potenziale möglichst ein fach zu wählen. Wir werden später davon Gebrauch machen. In einer relativistisch ko varianten Schreibweise lassen sich skalares Potenzial und Vektorpotenzial zu einem Viererpotenzial A μ = (A0 , A i=1,2,3 ) = (Φ, A) zusammenfassen. Analog hierzu werden Ladungs- und Stromverteilung, ρ und j, zu einem Viererstrom j μ = (j0 , j i=1,2,3 ) = (ρ, j) zusammengefasst. Für eine Ladungs- bzw. Stromverteilung in einem äußeren elektro magnetischen Feld beträgt die klassische Wechselwirkungsenergie: 3
W(t) = ∫ d3 x j μ (x, t)A μ (x, t) = ∫ d3 x (j0 (x, t)A0 (x, t) − ∑ j i (x, t)A i (x, t)) i=1 3
= ∫ d x [ρ(x, t)Φ(x, t) − j(x, t) ⋅ A(x, t)] ,
(22.4)
wobei A μ (x, t) das Eichpotenzial des äußeren elektromagnetischen Feldes ist.² Im Folgenden betrachten wir eine Punktladung q der Masse³ M, die sich auf einer Trajektorie x(t) bewegt. Die Punktladung besitzt eine Ladungsverteilung (Ladungs dichte) ρ(x , t) = qδ(x − x(t)) . Falls ihre Geschwindigkeit von null verschieden ist, erzeugt sie eine Stromdichte j(x , t) = ρ(x , t)v(x , t) ̇ . = qδ(x − x(t))x(t)
2 Es sei betont, dass dieses Potenzial A μ (x, t) hier eine von außen vorgegebene Funktion des Ortes (und der Zeit) ist und nicht durch die betrachteten Ladungen bzw. Ströme j μ (x, t) hervorgerufen wird. Diese werden deshalb auch als Testladungen oder Testströme bezeichnet, und es wird vorausgesetzt, dass ihre Rückwirkung auf das Feld vernachlässigt werden kann. 3 Zur Unterscheidung von der magnetischen Quantenzahl m bezeichnen wir in diesem Kapitel die Masse der Punktladung mit M.
464 | 22 Geladenes Teilchen im elektromagnetischen Feld
Setzen wir diese Ausdrücke für Ladungs- und Stromdichte in die Wechselwirkungsen ergie (22.4) ein, so nimmt diese die Gestalt ̇ ⋅ A(x(t), t) W(t) = qΦ(x(t), t) − q x(t) an. Diese Wechselwirkungsenergie geht wie eine potenzielle Energie in die klassische Lagrange-Funktion ein, die deshalb durch L = L0 − W gegeben ist, wobei M 2 ẋ − V(x) 2 die Lagrange-Funktion der (nicht relativistischen) Punktladung bei Abwesenheit des äußeren elektromagnetischen Feldes ist. Die Lagrange-Funktion der Punktmasse im äußeren elektromagnetischen Feld hat deshalb (bei Abwesenheit sonstiger äußerer Potenziale) die Form L0 =
L(x, x,̇ t) =
M 2 ẋ + q ẋ ⋅ A(x, t) − qΦ(x, t) , 2
(22.5)
wobei x = x(t) die Teilchenkoordinate bezeichnet. Unter der Eichtransformation (22.3) ändert sich diese Lagrange-Funktion ̇ L(x) →L(x) + q x∇Λ(x, t) + q = L(x) + q
∂ Λ(x, t) ∂t
d Λ(x(t), t) dt
nur um eine totale zeitliche Ableitung, die keinen Einfluss auf die klassische Bewe gungsgleichung hat. Die zugehörige klassische Wirkung tb
S[x](b, y) = ∫ dtL(x, x,̇ t)
(22.6)
ta
ändert sich unter der Eichtransformation (22.3) um eine Konstante S[x](b, a) → S[x](b, a) + q [Λ (x(t b ), t a ) − Λ (x(t a ), t a )] ,
(22.7)
die wegen den üblichen Randbedingungen (festgehaltene Ränder der Trajektorie x(t a ) = x a = const. x(t b ) = x b = const.) nicht zur Variation beiträgt. Die Lagrange-Funktion (22.5) liefert den kanonischen Impuls p=
∂L = M ẋ + qA . ∂ ẋ
(22.8)
22.1 Klassische Ladungen im äußeren elektromagnetischen Feld |
465
Bei Anwesenheit eines Magnetfeldes fällt damit der kanonische Impuls nicht mit dem kinetischen Impuls M ẋ zusammen. Für die Euler-Lagrange-Gleichung d ∂L ∂L − =0 dt ∂ ẋ ∂x erhalten wir mit
d ∂L = M ẍ + q[∂ t A + (ẋ ⋅ ∇)A] , dt ∂ ẋ ∂L = ∇L = q ẋ k ∇A k − q∇Φ ∂x
und den Definitionen (22.1) und (22.2) des B- und E-Feldes die bekannte Bewegungs gleichung einer nicht relativistischen Punktladung im elektromagnetischen Feld ̈ = q [E(x(t), t) + x(t) ̇ × B(x(t), t)] , M x(t)
(22.9)
wobei der Ausdruck auf der rechten Seite als Lorentz-Kraft bezeichnet wird. Für die klassische Hamilton-Funktion H(p, x, t) = p ⋅ ẋ − L(x, x,̇ t) erhalten wir bei Anwesenheit des äußeren elektromagnetischen Feldes unter Verwen dung von (22.8): H(p, x, t) = (M ẋ + qA) ⋅ ẋ − (
M 2 ̇ − qΦ) ẋ + q xA 2
=
M 2 ẋ + qΦ 2
=
(p − qA(x, t))2 + qΦ(x, t) . 2M
(22.10)
Die Hamilton-Funktion ist auch hier durch die Summe von kinetischer und potenzi eller Energie gegeben; sie besitzt jedoch nicht die Standardform, da der kinetische Impuls M ẋ nicht mit dem kanonischen Impuls p zusammenfällt. Diese Tatsache wird sich auch in dem quantenmechanischen Ausdruck der kinetischen Energie nieder schlagen, wie wir im Folgenden sehen werden. Man beachte, dass das Vektorpotenzial nicht in die potenzielle Energie, sondern in die kinetische Energie eingeht. Damit gehen elektrisches und magnetisches Feld in die Hamilton-Funktion in unsymmetrischer Form ein, obwohl wir wissen, dass durch Lorentz-Transformation elektrische und magnetische Felder ineinander überführt werden können. Die unsymmetrische Behandlung von elektrischem und magneti schem Feld in der Hamilton-Funktion (22.10) ist offenbar eine Konsequenz der nicht relativistischen Beschreibung der Teilchendynamik, die wir hier benutzen.
466 | 22 Geladenes Teilchen im elektromagnetischen Feld
22.2 Quantenmechanische Ladungen im äußeren elektromagnetischen Feld In der Quantenmechanik müssen die Ladungen genau wie die ungeladenen Teilchen durch Wellenfunktionen beschrieben werden, die wegen des der Quantenmechanik zugrunde liegenden Superpositionsprinzips linearen Evolutionsgleichungen genügen müssen. Für ungeladene Teilchen war die Evolutionsgleichung durch die zeitabhän gige Schrödinger-Gleichung gegeben. Wir erwarten, dass diese auch für elektrische Ladungen gültig bleibt. Ferner erwarten wir aufgrund der Analogie zwischen der Ha milton’schen (kanonischen) Formulierung der klassischen Mechanik und der Quan tenmechanik, dass der Hamilton-Operator einer Ladung im elektromagnetischen Feld aus der klassischen Hamilton-Funktion (22.10) hervorgeht, wenn wir den klassischen kanonischen Impuls durch den quantenmechanischen Impulsoperator p = ℏi ∇ erset zen, d. h., wir erwarten, dass der Hamilton-Operator durch H=
(p − qA)2 + qΦ 2M
gegeben ist. Dieses Vorgehen ist jedoch nicht eindeutig, da p und A nicht kommu tieren. Verschiedene quantenmechanische Hamilton-Operatoren, die sich durch die Reihenfolge von p und A unterscheiden, z. B. ?
(p − qA)2 = p2 − q(p ⋅ A + A ⋅ p) + q2 A2 ?
= p2 − 2qp ⋅ A + q2 A 2 ?
= p2 − 2qA ⋅ p + q2 A 2 ,
(22.11)
führen auf dieselbe klassische Hamilton-Funktion.⁴ Um die korrekte Form des Hamil ton-Operators einer Ladung im elektromagnetischen Feld zu erhalten, erinnern wir uns zunächst an die Ableitung der Schrödinger-Gleichung für ungeladene Teilchen. In Kapitel 3 hatten wir durch Analyse des Doppelspaltexperimentes und dessen sukzessiver Verfeinerung gefunden, dass die quantenmechanische Übergangsampli i tude K(x b , t b ; x a , t a ) durch Summation der Phasen e ℏ S[x] von allen möglichen Trajek torien x(t), welche den Randbedingungen x(t a ) = x a , x(t b ) = x b genügen, erhalten wird. Diese Summation führt auf das Pfadintegral x(t b )=x b
K(x b , t b ; x a , t a ) ≡ K(b, a) =
∫
i
Dx(t) e ℏ S[x](b,a) .
(22.12)
x(t a )=x a
Die durch das Pfadintegral erzeugte und durch das Experiment suggerierte Summa i tion über alle interferierenden Alternativen mit dem Gewicht e ℏ S[x] war unser fun 4 Eine Ausnahme bildet die Coulomb-Eichung ∇ ⋅ A = 0, in der offenbar p ⋅ A = A ⋅ p und somit sämtliche rechten Seiten von Gleichung (22.11) übereinstimmen.
22.2 Quantenmechanische Ladungen im äußeren elektromagnetischen Feld |
467
damentales Grundpostulat der Quantenmechanik, aus der sich die gesamte Quan tentheorie ableiten ließ. Mit diesem Grundpostulat folgen die quantenmechanischen Grundgesetze allein aus Kenntnis der klassischen Wirkung. Insbesondere hatten wir in Kapitel 7 aus der Pfadintegraldarstellung der Übergangsamplitude die Schrödin ger-Gleichung für ein spinloses Teilchen (Punktmasse) abgeleitet und dabei den zu gehörigen Hamilton-Operator gefunden, der den quantenmechanischen Operator der Energieobservablen repräsentiert. Wir wollen jetzt ein elektrisch geladenes Teilchen mit der Ladung q in einem elektromagnetischen Feld betrachten und für dieses in bewährter Manier aus der Pfadintegraldarstellung der quantenmechanischen Über gangsamplitude die zugehörige Evolutionsgleichung für die Wellenfunktion ableiten. Aufgrund des Superpositionsprinzips, d. h. der unabhängigen Summation über alle alternativen Wege, erwarten wir wieder eine lineare Evolutionsgleichung vom Typ der zeitabhängigen Schrödinger-Gleichung iℏ
∂ ψ(x, t) = H(x, t)ψ(x, t) . ∂t
Die Frage ist nur, wie der zugehörige Hamilton-Operator bei Anwesenheit eines äuße ren elektromagnetischen Feldes aussieht, insbesondere welche der Operatorordnun gen (22.11) im Hamilton-Operator realisiert ist.
22.2.1 Hamilton-Operator der Punktladung Die in Abschnitt 7.1 durchgeführte Ableitung der Schrödinger-Gleichung können wir unmittelbar wiederholen für die Übergangsamplitude einer Ladung in einem äußeren elektromagnetischen Feld, welche durch die Gleichungen (22.5), (22.6), (22.12) defi niert ist. Die Möglichkeit verschiedener Operatorordnungen (22.11) spiegelt sich dabei in einer Subtilität der zeitdiskretisierten Pfadintegraldefinitionen wider: Je nachdem, wie wir das Wirkungsintegral bei der Diskretisierung der Zeit t b −t a = Nϵ als RiemannSumme darstellen, tb
̇ t k ) = lim ϵ ∑ L (x∗k , ẋ ∗k , t k ) , S(b, a) = ∫ dtL(x(t), x(t), ϵ→0
ta
k
mit x∗k ∈ [x k−1 , x k ] ,
x k = x(t k ) ,
t k = t a + kϵ ,
(22.13)
erhalten wir unterschiedliche Darstellungen der Übergangsamplitude für infinitesi mal benachbarte Zeiten (siehe Gleichung (3.20)), K(k, k − 1) = A(ε) exp [iεL (x ∗k , x ∗k , t k )] , k ≡ (x k , t k ) , und hieraus unterschiedliche Operatorordnungen (22.11) im Hamilton-Operator. Ur sache für das Auftreten dieser Subtilität ist der geschwindigkeitsabhängige Potenzial
468 | 22 Geladenes Teilchen im elektromagnetischen Feld
term (der zweite Term auf der rechten Seite von Gleichung (22.5)) ̇ t) = ∑(x k − x k−1 )A(x ∗k , t k ) . ∫ dt x(t)A(x(t), k
Für diesen Term liefern Riemann-Obersumme (x ∗k = x k ) und Untersumme (x ∗k = x k−1 ) für die dominant beitragenden Pfade Unterschiede von der Ordnung 1, wovon man sich leicht überzeugt: Schreiben wir x k im Argument von A als x k − x k−1 + x k−1 und entwickeln bis zu den Termen linear in x k − x k−1 , so finden wir für die Differenz zwi schen (Riemann-)Ober- und Untersumme: ∆ := ∑ (x k − x k−1 ) ⋅ A (x k , t k ) − ∑ (x k − x k−1 ) A (x k−1 , t k ) k
k
= ∑ (x k − x k−1 ) i (x k − x k−1 ) j ∇j A i (x k−1 , t k ) . k
Beachten wir, dass für die dominanten Wege im Pfadintegral (siehe Kapitel 7 und Ab schnitt 22.6) (x k − x k−1 )i (x k − x k−1 )j ∼ εδ ij , so erhalten wir für diese Wege⁵ ∆ = ε ∑ ∇ ⋅ A (x k−1 , t k ) = ∫ dt∇ ⋅ A = O(1) . k
Die Unbestimmtheit in der Wahl der Riemann-Summe bei der Zeitdiskretisierung ver schwindet, wenn man fordert, dass auch die zeitdiskretisierte Amplitude das korrekte Verhalten unter Eichtransformationen (22.3) besitzt, welches nach Gleichungen (22.7) und (22.12) durch K(a, b) → e iqΛ(x b ,t b ) K(b, a)e−iqΛ(x a ,t a ) gegeben ist. Dies verlangt für die Wirkung (22.5), (22.6), wie eine sorgfältige Analyse zeigt, die sogenannte Mittelpunktsvorschrift, bei der wir die Koordinate x ∗k (22.13) in die Mitte ihres Definitionsbereiches [x k−1 , x k ] legen:⁶ x∗k =
1 (x k + x k−1 ) . 2
(22.14)
Dies liefert S(k, k − 1) = S (x k , t k ; x k−1 , t k−1 ) x k + x k−1 x k + x k−1 m , t k ) − qϕ ( , tk ) , = (x k − x k−1 )2 + q (x k − x k−1 ) ⋅ A ( 2ε 2 2 5 Man beachte, dass der Unterschied ∆ zwischen Ober- und Untersumme in der Coulomb-Eichung ∇ ⋅ A = 0 verschwindet. 6 Wählt man eine andere Form der Lagrange-Funktion, die sich von (22.5) durch eine totale zeitliche Ableitung unterscheidet, so sind andere Diskretisierungsvorschriften als (22.14) erforderlich, um das korrekte Verhalten der zeitdiskretisierten Amplitude unter Eichtransformationen zu gewährleisten. In jedem Fall legt die Forderung nach dem korrekten Verhalten der zeitdiskretisierten Amplitude unter Eichtransformation die Diskretisierungsvorschrift fest und führt stets auf dasselbe Ergebnis (22.15).
22.2 Quantenmechanische Ladungen im äußeren elektromagnetischen Feld | 469
wobei in führender Ordnung A(
1 x k + x k−1 , t k ) = (A(x k , t k ) + A(x k−1 , t k−1 )) 2 2
gesetzt werden kann. Die expliziten Rechnungen sind in Abschnitt 22.6 durchgeführt. Wir finden dann wieder die zeitabhängige Schrödinger-Gleichung mit dem HamiltonOperator H=
(p − qA(x, t))2 + V(x, t) + qΦ(x, t) , 2M
(22.15)
der formal dieselbe Gestalt wie die klassische Hamilton-Funktion (22.10) besitzt. In (22.15) ist jedoch p der Impulsoperator. Damit erweist sich der erste Ausdruck in (22.11) als die korrekte quantenmechanische Operatorordnung. Vergleich mit dem Ausdruck für den klassischen kanonischen Impuls bei Anwe senheit eines Magnetfeldes, Gleichung (22.8), zeigt, dass die Größe (p −qA) gerade das quantenmechanische Analogon des kinetischen Impulses m ẋ ist. Mit dieser Interpre tation ist auch bei Anwesenheit eines Magnetfeldes die kinetische Energie durch das Quadrat des kinetischen Impulses gegeben. Das Vektorpotenzial erscheint nur, wenn wir den kinetischen Impuls durch den kanonischen Impuls ausdrücken, der in der Quantenmechanik durch die Ableitung nach dem Ort realisiert ist, p = ℏi ∇. Bei An wesenheit eines Magnetfeldes fallen also auch in der Quantentheorie kinetischer und kanonischer Impuls nicht mehr zusammen. Wir betrachten hier das elektromagnetische Feld als ein von außen angelegtes makroskopisches klas sisches Feld, das eine Funktion des Ortes und der Zeit ist, jedoch selbst nicht quantisiert ist. Streng genommen ist im Mikrokosmos das elektromagnetische Feld ebenfalls quantisiert. Dies ist jedoch Gegenstand der Quantenfeldtheorie, die über den Rahmen dieses Buches hinausgeht. Um die quantenmechanische Übergangsamplitude eines geladenen Teilchens in einem elektro magnetischen Quantenfeld zu erhalten, müssen wir lediglich in den Exponenten des Pfadintegrals auch die Wirkung des elektromagnetischen Feldes einschließen, die durch die klassische LagrangeFunktion 1 Lem = ∫ d 3 x (E2 (x, t) − B2 (x, t)) 2 definiert ist, und zusätzlich über alle unabhängigen Feldkonfigurationen des elektromagnetischen Feldes summieren, in Übereinstimmung mit unserem Grundpostulat der Quantenmechanik, der Sum mation über alle (interferierenden) Alternativen.
470 | 22 Geladenes Teilchen im elektromagnetischen Feld
22.2.2 Eichinvarianz Da in den Hamilton-Operator nicht die elektromagnetischen Felder, sondern die Po tenziale selbst eingehen, bleibt dieser unter der oben betrachteten Eichtransformati on (22.3) nicht invariant, sondern transformiert sich wie: (p − qA )2 + V + qΦ 2M (p − qA − q∇Λ)2 ∂Λ = + V + qΦ − q . 2M ∂t
H → H =
Man überzeugt sich jedoch leicht, dass die Lösung der zugehörigen Schrödinger-Glei chung ∂ iℏ ψ (x, t) = H (x, t)ψ (x, t) ∂t mit der ursprünglichen Wellenfunktion ψ(x, t) über q ψ (x, t) = exp (i Λ(x, t)) ψ(x, t) ℏ zusammenhängt. Damit erhält die Wellenfunktion unter Eichtransformationen nur ei ne zusätzliche (orts- und zeitabhängige) Phase, die jedoch keine Auswirkungen auf die Erwartungswerte physikalischer Observablen hat. Erwartungswerte von physika lischen Observablen müssen eichinvariant sein. So ist z. B. der kanonische Impuls p = ℏi ∇ bei Anwesenheit eines elektromagnetischen Feldes i. A. keine physikalische Observable, da ⟨ψ |p|ψ ⟩ = ⟨ψ|p|ψ⟩ + q∇Λ. Der kinetische Impuls M ẋ hingegen, der bei Anwesenheit eines Magnetfeldes durch (p − qA) gegeben ist, ist zwar selbst nicht eichinvariant, sein Erwartungswert mit der obigen Transformation der Wellenfunk tion ist jedoch eichinvariant. Dasselbe gilt für den Hamilton-Operator. Die Eichab hängigkeit der Wellenfunktion hat damit i. A. keine physikalische Bedeutung. Eine Ausnahme bilden magnetische Felder in topologisch nicht einfach zusammenhän genden⁷ Räumen, bei denen nicht nur das Magnetfeld selbst, sondern auch das Vek torpotenzial reale Bedeutung erlangt. Ein Beispiel hierfür ist der sogenannte BohmAharonov-Effekt, den wir später noch behandeln werden (siehe Kapitel 29, Band 2). Die Eichfreiheit lässt sich vorteilhaft ausnutzen, um den Hamilton-Operator in eine möglichst einfache Gestalt zu bringen. Das Quadrat des kinetischen Impulses lautet explizit: (p − qA)2 = p 2 − q(p ⋅ A + A ⋅ p) + q2 A 2 = p 2 − q(2A ⋅ p + [p, A]) + q2 A2 , wobei [p, A] =
ℏ (∇ ⋅ A) . i
7 Ein Raum ist einfach zusammenhängend, wenn man jeden geschlossenen Weg in diesem Raum auf einen Punkt zusammenziehen kann.
22.3 Ladung im homogenen Magnetfeld | 471
Diesen Term können wir zum Verschwinden bringen, wenn wir die Coulomb-Eichung ∇⋅A =0 benutzen. In dieser Eichung nimmt der Hamilton-Operator dann die Gestalt q q2 2 p2 − A⋅p+ A + qΦ + V 2M M 2M q q2 2 = H0 − A ⋅ p + A M 2M
H=
(22.16)
an, wobei H0 der Hamilton-Operator bei Abwesenheit des magnetischen Feldes ist. (H0 enthält jedoch die Wechselwirkung der Ladung mit dem elektrischen Feld, qΦ(x, t), die durch ein gewöhnliches Potenzial gegeben ist.) Für statische Probleme ist die Coulomb-Eichung i. A. sehr vorteilhaft. Sie liefert automatisch den eichin varianten (transversalen) Teil des Vektorpotenzials A und wird deshalb auch als physikalische Eichung bezeichnet. Zur physikalischen Interpretation der beiden Vektorpotenzialterme (22.16) be trachten wir zunächst einen wichtigen Spezialfall: ein homogenes Magnetfeld.
22.3 Ladung im homogenen Magnetfeld Für ein räumlich konstantes (homogenes) Magnetfeld B = const. lässt sich das Vek torpotenzial in Coulomb-Eichung in der symmetrischen Form A=
1 B×x 2
(22.17)
wählen. In der Tat zeigt man leicht, dass die Divergenz dieses Potenzials verschwin det: 1 1 ∇ ⋅ A = ∇ ⋅ (B × x) = − B ⋅ (∇ × x) = 0 . ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ 2 2 =0 Bilden wir die Rotation von A (22.17), so wird der konstante Vektor B reproduziert: 1 1 ∇ × (B × x) = [B(∇ ⋅ x) − (B ⋅ ∇) ⋅ x] 2 2 1 = (3B − B) = B . 2
∇×A =
Mit der obigen Form des Vektorpotenzials haben wir: A⋅p=
1 1 1 (B × x) ⋅ p = B ⋅ (x × p) = B ⋅ L , 2 2 2
472 | 22 Geladenes Teilchen im elektromagnetischen Feld wobei die Definition des Drehimpulses L = x × p benutzt wurde. Für das Quadrat des Vektorpotenzials finden wir: A2 =
1 1 (B × x)2 = [B2 x2 − (B ⋅ x)2 ] . 4 4
Zerlegen wir den Ortsvektor in eine Projektion entlang des konstanten Magnetfeldes und einen dazu senkrecht stehenden Anteil, x = x‖ B̂ + x⊥ ,
B B̂ = , |B|
so folgt B2 2 x , 4 ⊥ und der Hamilton-Operator (22.16) einer Ladung im konstanten Magnetfeld B nimmt schließlich die Gestalt A2 =
H = H0 −
q q2 B 2 2 B⋅L+ x 2M 8M ⊥
(22.18)
an. Der Term proportional zu B⋅L versucht, den Drehimpuls L des geladenen Teilchens (für q > 0) parallel zum Magnetfeld B auszurichten. Falls die Elektronen (q = −e < 0) der Atome einen von null verschiedenen Drehimpuls L ≠ 0 besitzen, richten sie des halb ihren Drehimpuls antiparallel und damit ihr magnetisches Moment⁸ μl =
q L 2M
parallel zu B aus. Diese Ausrichtung der magnetischen Momente in einem äußeren Magnetfeld ist die Ursache für den Paramagnetismus. Der letzte Term in (22.18) stellt in der Ebene senkrecht zum Magnetfeld ein zweidi mensionales, rotationssymmetrisches, harmonisches Oszillatorpotenzial dar. Dieser Term bewirkt, dass ein klassisches geladenes Teilchen geschlossene, d. h., periodi sche Bewegungen in der Ebene senkrecht zum Magnetfeld B ausführt. Dabei wird das Teilchen i. A. einen von null verschiedenen Drehimpuls L erhalten, der parallel oder antiparallel zum Magnetfeld gerichtet ist. Somit induziert dieser Term einen Drehim
8 Für den „inneren“ Drehimpuls (Spin) S der Elektronen beträgt das magnetische Moment μs = g
q S, 2M
(22.19)
wobei der zusätzliche Landé-Faktor g ≃ 2 aus der relativistischen Behandlung des Elektrons resultiert und sich zwangsläufig aus der nicht relativistischen Reduktion der Dirac-Gleichung ergibt, siehe Ab schnitt 28.9, Band 2. Wir hatten bereits in Kapitel 14 eine geometrische Erklärung für den zusätzlichen Faktor g = 2 im magnetischen Moment eines Spins gegenüber dem des Bahndrehimpulses gegeben.
22.3 Ladung im homogenen Magnetfeld |
473
puls und damit ein magnetisches Moment. Diese induzierten magnetischen Momen te sind antiparallel zum äußeren Magnetfeld gerichtet⁹ und sind die Ursache für den Diamagnetismus. Falls die Elektronen eines Atoms einen von null verschiedenen Drehimpuls be sitzen und damit Paramagnetismus aufweisen, ist dieser stets wesentlich größer als der immer induzierte Diamagnetismus, wie eine einfache Abschätzung zeigt. Dazu be trachten wir ein Elektron der Ladung q = −e. Der Drehimpuls ist von der Ordnung ℏ, wir setzen deshalb: ⟨B ⋅ L⟩ ≃ Bℏ . Die räumliche Ausdehnung der Teilchentrajektorie in der Ebene senkrecht zum Ma gnetfeld können wir durch den Bohr’schen Atomradius a abschätzen: ⟨x 2⊥ ⟩ ≃ a2 . Dann finden wir für das Verhältnis der Erwartungswerte der beiden Terme für Elektro nen (q = −e, M = m e ): q2 2 2 2 2 e2 ⟨ B x⊥ ⟩ 8M eB 2 B 8m e B a = a ≃ 1,1 ⋅ 10−6 , ≃ q e 4ℏ T Bℏ ⟨− 2M B ⋅ L⟩ 2m e wobei das Magnetfeld in Tesla angegeben ist. Im Labor lassen sich etwa Magnetfelder bis zu einer Stärke von 10 T erreichen. Für solche Felder spielt offenbar der A2 -Term keine Rolle gegenüber dem Term linear in A. An der Oberfläche von Neutronensternen, wo die Magnetfelder die Größenordnung B ≃ 108 T erreichen können, kann jedoch der A 2 -Term wichtig werden. Schließlich vergleichen wir noch die Stärke des paramagnetischen Terms für q = −e, M = m e mit der Coulomb-Energie in einem Atom. Aus der qualitativen Be handlung des Wasserstoffatoms (siehe Abschnitt 18.2) wissen wir, dass wir diese genähert durch e2 e2 ⟩≃ ⟨ 4πr 4πa ausdrücken können. Für das Verhältnis von magnetischer zu elektrischer Energie fin den wir deshalb e |⟨ 2m B ⋅ L⟩| 4πaℏ B e B ≃ 2 ⋅ 10−6 . ≃ e2 2m e e T ⟨ ⟩ 4πr
Für im Labor erreichbare Magnetfelder ist die Änderung der Energieniveaus der Elek tronen im Atom damit klein. Dennoch werden die Atomspektren durch ein äußeres Magnetfeld qualitativ sehr wesentlich verändert, wie wir im nächsten Abschnitt se hen werden. 9 Nach dem allgemeinen Prinzip von Le Chatelier, was sich hier in der Lenz’schen Regel manifestiert, ist das damit verbundene induzierte Magnetfeld Bind dem von außen angelegten B-Feld entgegenge richtet. Da (in Dipolnäherung) Bind ∼ μind , ist das induzierte magnetische Moment μind antiparallel zu B.
474 | 22 Geladenes Teilchen im elektromagnetischen Feld
22.3.1 Der Zeeman-Effekt Im Folgenden wollen wir die Änderung der Energieniveaus der Atome in einem schwachen äußeren (homogenen) Magnetfeld B untersuchen. Der Einfachheit hal ber beschränken wir uns auf das Wasserstoffatom. Aufgrund der obigen Abschätzung können wir für schwache B-Felder den B 2 -Term im Hamilton-Operator (22.18) ver nachlässigen, e B⋅L, H = H0 + 2m e wobei H0 der Hamilton-Operator der Elektronen im ungestörten Atom, d. h., im Cou lomb-Potenzial ist. Ferner haben wir wieder q = −e und M = m e für die Ladung und Masse der Elektronen gesetzt. Der Einfachheit halber legen wir das konstante Magnet feld in Richtung der z-Achse: B = Be z . Die Eigenwerte und Eigenfunktionen des ungestörten Hamilton-Operators H0 sind die des Wasserstoffproblems, die wir in analytischer Form kennen (siehe Abschnitt 18.3). Diese Eigenfunktionen sind gleichzeitig auch Eigenfunktionen zur z-Komponente des Drehimpulses. Deshalb ist der gesamte Hamilton-Operator H in dieser Basis diagonal: H|nlm⟩ = (−
R eB + ℏm) |nlm⟩ ≡ E nm |nlm⟩ . n2 2m e
Die Energieeigenwerte sind deshalb durch E nm = −
R + ℏω L m n2
gegeben, wobei eB (22.20) 2m e die Larmor-Frequenz ist, die mit dem Bohr’schen Magneton μ B wie folgt verknüpft ist:¹⁰ ωL =
ℏω L =
eℏ B = μB B , 2m e
μB =
eℏ . 2m e
Die Größe ℏω L gibt die Energieeinheit an, um die das Elektronenniveau im äuße ren Magnetfeld pro Einheit der Drehimpulsprojektion verschoben wird. Ein äußeres Magnetfeld hebt also die (2l + 1)-fache Entartung eines Drehimpulseigenzustandes auf. Ein Zustand mit Drehimpuls l wird in (2l + 1) äquidistante Niveaus aufgespalten (Abb. 22.1). 10 Gewöhnlich wird der Landé-Faktor g ≃ 2 mit in die Larmor-Frequenz einbezogen: ωL = g
eB . 2m e
Da wir hier keine Spins betrachten, werden wir die Definition (22.20) benutzen, die für einen reinen Bahndrehimpuls (für welchen g = 1) sinnvoll ist.
22.3 Ladung im homogenen Magnetfeld |
l=2
2 1 0 −1 −2
l=1
1 0 −1
l=0
B=0
B = 0
475
0 m
Abb. 22.1: Aufhebung der Drehimpulsentartung durch ein äußeres konstantes Magnetfeld B, dessen Richtung als Quantisierungsachse gewählt wurde.
Die Aufspaltung der Atomniveaus im Magnetfeld wird als Zeeman-Effekt bezeich net. Wird diese Niveauaufspaltung allein durch den (in Einheiten von ℏ) ganzzahligen Bahndrehimpuls hervorgerufen, d. h., die Niveaus spalten sich in eine ungerade Zahl von (2l + 1) Niveaus auf, so spricht man vom normalen Zeeman-Effekt. Die tatsäch lichen Verhältnisse in einem Atom sind jedoch i. A. sehr viel komplizierter aufgrund des inneren Drehimpulses S, dem Spin, der Elektronen. Dies gilt insbesondere für das Wasserstoffatom. Der halbzahlige Spin der Elektronen s = 1/2 koppelt mit dem ganz zahligen Bahndrehimpuls l zu einem halbzahligen Gesamtdrehimpuls j: J = L + S , J2 :
ℏ2 j(j + 1) ,
j=
1 3 5 , , ,... . 2 2 2
Im Magnetfeld spalten dann die Elektronenniveaus mit halbzahligem Gesamtspin in die gerade Anzahl von (2j + 1) Niveaus auf. Dies wird als anomaler Zeeman-Effekt be zeichnet. Der anomale Zeeman-Effekt war einer der ersten Hinweise auf die Existenz des Elektronenspins. Ein weiterer experimenteller Hinweis auf die Existenz des Elektronenspins war das Stern-Gerlach-Experiment, das erstmals im Jahre 1921 von Otto Stern und Walter Gerlach durchgeführt wurde, die 1943 dafür mit dem Nobelpreis geehrt wurden. In diesem Experiment wird ein aus Silber- oder Kupferatomen bestehender Atomstrahl durch ein inhomogenes Magnetfeld geschickt, das senkrecht zur Strahlrichtung ge richtet ist. Dabei wird der Strahl in zwei Teilstrahlen aufgespalten. Die Atome in den beiden Teilstrahlen unterscheiden sich in ihrer Energie gerade um 2ℏω L . Entspre chend dem Zeeman-Effekt deutet die zweifache Aufspaltung auf einen „Drehimpuls“ l = 1/2 hin, dessen magnetisches Moment aber l = 1 entspricht, also doppelt so groß ist wie für einen „normalen“ Drehimpuls von l = 1/2. Diese experimentelle Beobach tung wurde durch Einführung des Landé-Faktors g ≃ 2 in das magnetische Moment μ⃗
476 | 22 Geladenes Teilchen im elektromagnetischen Feld
eines Teilchens mit Spin s berücksichtigt: μ=
gq s. 2M
Sowohl der Spin als auch der Landé-Faktor ergeben sich zwangsläufig in einer relati vistischen Behandlung der Elektronen, siehe Kapitel 28, Band 2.
22.4 Die Landau-Niveaus Im Folgenden wollen wir die Bewegung geladener Teilchen wie z. B. Elektronen in ei nem homogenen Magnetfeld B = const. etwas genauer behandeln. Wir werden dabei nicht voraussetzen, dass das Magnetfeld schwach ist. Dieses Problem ist von großem praktischem Interesse für die Atom- und Festkörperphysik. Aus der klassischen Physik wissen wir, dass auf eine bewegte Ladung q in einem Magnetfeld B die Lorentz-Kraft (siehe Gleichung (22.9) mit E = 0) F = q(v × B)
(22.21)
wirkt. Diese Kraft steht senkrecht sowohl auf der Geschwindigkeit v der Ladung als auch auf dem Magnetfeld. Sie beeinflusst deshalb die Bewegung parallel zum Magnet feld nicht. Deshalb ist der lineare Impuls in dieser Richtung erhalten: p ⋅ B = const. In der Ebene senkrecht zum Magnetfeld hat diese Kraft die Form einer Coriolis-Kraft,¹¹ die das Teilchen auf eine Kreisbahn zwingt. Für p ⋅ B = 0 erfolgt deshalb die klassische Bewegung auf kreisförmigen Bahnen in einer Ebene senkrecht zum Magnetfeld. Für p ⋅ B ≠ 0 führen die Ladungen hingegen eine „Schraubenbewegung“ aus (Abb. 22.2). B
Abb. 22.2: Klassische Trajektorie einer Punktladung in einem homogenen Magnetfeld B.
11 Die Lorentz-Kraft (22.21) hat exakt die Form einer Coriolis-Kraft F C = 2M(v × ω), wobei das Ma gnetfeld B die Rolle der Winkelgeschwindigkeit ω übernimmt, ω̂ = B, q̂ =2M.
22.4 Die Landau-Niveaus |
477
22.4.1 Eichinvariante Diagonalisierung des Hamiltonian Wie wir in Abschnitt 22.2 gezeigt haben, werden die Ladungen in einem Magnetfeld durch den Hamilton-Operator (22.15) H=
π2 (p − qA)2 = 2M 2M
(22.22)
beschrieben, wobei π = p − qA den kinetischen Impuls bezeichnet. Der Hamilton-Operator (22.22) ist offenbar positiv (semi)definit, sodass seine Eigenwerte nicht negativ sind. Die Komponenten des kinetischen Impulses erfüllen die Kommutationsbezie hung [π i , π j ] = [p i − qA i , p j − qAj] = −q([p i , A j ] + [A i , p j ]) = iℏq(∇i A j − ∇j A i ) . Multiplizieren wir diese Gleichung mit dem vollständig antisymmetrischen Tensor dritter Stufe ϵ kij (15.5), so erhalten wir: ϵ kij [π i , π j ] = iℏq2ϵ kij ∇i A j = 2iℏq(∇ × A)k = 2iℏqB k , wobei wir die Definition des Magnetfeldes B als Rotation des Vektorpotenzials A be nutzt haben. Nochmalige Multiplikation mit ϵ kmn und Summation über den Index k liefert mit ϵ kmn ϵ kij = δ mi δ nj − δ mj δ ni und ϵ kmn = ϵ mnk schließlich die Beziehung [π m , π n ] = iℏqϵ mnk B k . Für ein konstantes Magnetfeld ist der Kommutator eine Zahl (multipliziert mit dem Einheitsoperator) – also ein kommutierendes Objekt, gewöhnlich als c-Zahl bezeich net. Legen wir wieder das Magnetfeld entlang der z-Achse, B = Be z ,
B = const. ,
so ist der einzige nicht verschwindende Kommutator durch [π x , π y ] = iℏqB gegeben, während
[π x , π z ] = 0̂ = [π y , π z ] .
(22.23)
Den gesamten Hamilton-Operator spalten wir deshalb zweckmäßigerweise auf in die kinetische Energie entlang der z-Achse und einen Hamilton-Operator H⊥ , der die Be wegung in der Ebene senkrecht zum Magnetfeld beschreibt: H = H⊥ + H‖ ,
478 | 22 Geladenes Teilchen im elektromagnetischen Feld
wobei H⊥ =
1 (π2 + π2y ) , 2M x
und wegen (22.23)
H‖ =
π2z 2M
[H⊥ , H‖ ] = 0̂
gilt. Aufgrund der letzten Beziehung lassen sich H⊥ und H‖ gleichzeitig diagonali sieren (d. h., besitzen gemeinsame Eigenfunktionen), und wir können die Eigenwerte von H⊥ und H‖ getrennt bestimmen. Der Hamilton-Operator H⊥ ist durch die Summe zweier quadratischer Operatoren gegeben, deren Kommutator eine c-Zahl, d. h., kein Operator mehr ist. Er hat deshalb die Form eines eindimensionalen harmonischen Oszillators, p2 1 + Mω2 x2 , [x, p] = iℏ , 2M 2 wobei je nach Vorzeichen von qB die Operatoren π x und π y der Koordinate x bzw. dem Impuls p entsprechen: H=
πx ↔ x ,
πy ↔ p ,
qB > 0
πy ↔ x ,
πx ↔ p ,
qB < 0 .
Wie der Hamilton-Operator des eindimensionalen harmonischen Oszillators ist des halb H⊥ analytisch diagonalisierbar. Dazu führen wir den Vernichtungsoperator a= bzw. a=
1 (π x + iπ y ) , √2ℏ|qB|
qB > 0
1
(π y + iπ x ) , qB < 0 √2ℏ|qB| ein. Den Vorfaktor haben wir bereits so gewählt, dass a mit dem zugehörigen Erzeu gungsoperator a† die Vertauschungsrelation [a, a† ] = 1̂ erfüllt. Ausgedrückt durch die Erzeugungs- und Vernichtungsoperatoren nimmt H⊥ die bereits vom harmonischen Oszillator her bekannte Form (12.41) H⊥ = ℏω c (a† a +
1 ) 2
an, wobei
|qB| (22.24) M die sogenannte Zyklotronfrequenz ist. (Für q = −e und M = m e gilt ω c = 2ω L , siehe Gleichung (22.20).) Dementsprechend sind die Eigenwerte von H⊥ durch ωc =
E⊥n = ℏω c (n +
1 ) 2
(22.25)
gegeben, wobei n = 0, 1, 2, . . . die Eigenwerte des Besetzungszahloperators n̂ = a† a sind. Die zugehörigen quantisierten Zustände des geladenen Teilchens werden als
22.4 Die Landau-Niveaus | 479
Landau-Niveaus bezeichnet. Wir betonen, dass wir oben die Eigenenergien (22.25) der Landau-Niveaus gefunden haben, ohne die Eichung zu fixieren. Insbesondere haben wir nicht die Coulomb-Eichbedingung benutzt. Wir können deshalb jede alternative zweckmäßige Eichung wählen. Die Energieeigenwerte als physikalisch messbare Grö ßen sind natürlich eichinvariant. Die E⊥n (22.25) sind die Energieeigenwerte des eindi mensionalen harmonischen Oszillators, obwohl H⊥ die Bewegung der Ladung in der (zweidimensionalen) Ebene senkrecht zum B-Feld beschreibt. Deshalb müssen die Ei genwerte E⊥n bezüglich der zweiten Dimension und damit unendlichfach entartet sein. Die Entartung der E⊥n tritt explizit zutage, wenn man die Eigenfunktionen von H⊥ be stimmt. (Dies kann analog zum eindimensionalen harmonischen Oszillator erfolgen, siehe Abschnitt 12.8.) Dabei stellt man fest, dass jedes Landau-Niveau bezüglich eines frei wählbaren linearen Impulses in der Ebene senkrecht zum Magnetfeld entartet ist, vorausgesetzt die Bewegung in dieser Ebene ist nicht durch andere äußere Potenziale oder Randbedingungen eingeschränkt (siehe die Bemerkung am Ende dieses Kapi tels). Wir werden die Entartung der E⊥n explizit im nächsten Abschnitt zutage fördern.
22.4.2 Diagonalisierung des Hamiltonian in der Coulomb-Eichung Um die Wellenfunktion explizit zu bestimmen, müssen wir eine konkrete Eichung wählen, da die Wellenfunktionen im Gegensatz zu den Energieeigenwerten eichab hängig sind, siehe Abschnitt 22.2. Wir wählen wieder die Coulomb-Eichung ∇ ⋅ A = 0 mit der symmetrischen Form (22.17) des Vektorpotenzials. Nach Gleichung (22.17) ver schwindet für ein konstantes, entlang der z-Achse gerichtetes B-Feld das Eichpoten zial in z-Richtung, A z = 0. Mit der (vektoriellen) Larmor-Frequenz qB ωL = (22.26) 2M nimmt der Hamilton-Operator (22.18) der Ladung im konstanten Magnetfeld B dann die Gestalt p2 1 H= − ω L ⋅ L + Mω2L x 2⊥ = H‖ + H⊥ 2M 2 an. Er zerfällt in einen Term, der die freie Bewegung parallel zum Magnetfeld, p2‖
B , p ‖ = (p ⋅ B)̂ B̂ , B̂ = , 2M |B| und einen Teil, der die Bewegung in einer Ebene senkrecht zum Magnetfeld be schreibt: H‖ =
H⊥ =
p2⊥ 1 − ω L ⋅ L + Mω2L x 2⊥ , 2M 2
(22.27)
wobei p⊥ = p − p ‖ . Die freie Bewegung entlang des Magnetfeldes lässt sich wieder mittels des Separationsansatzes p‖ φ(x ‖ , x ⊥ ) = e ik‖ ⋅x‖ ϕ(x ⊥ ) , k ‖ = ℏ
480 | 22 Geladenes Teilchen im elektromagnetischen Feld
von der Bewegung in der Ebene senkrecht zum Magnetfeld entkoppeln. Wir können uns deshalb im Folgenden auf diese Bewegung beschränken und betrachten daher die transversale Schrödinger-Gleichung H⊥ (x ⊥ )ϕ(x ⊥ ) = E⊥ ϕ(x ⊥ ) . Bevor wir das volle Problem lösen, betrachten wir zunächst zwei Grenzfälle: 1.
Schwaches Magnetfeld: In diesem Fall können wir den Term quadratisch in ω L vernachlässigen, und der verbleibende Hamilton-Operator H⊥ =
p2⊥ − ωL ⋅ L 2M
(22.28)
beschreibt die freie Bewegung in einem um die Achse des B-Feldes rotierenden System. Der Term ω L ⋅ L repräsentiert die Coriolis-Wechselwirkung im rotieren den Bezugssystem. Wegen [p 2⊥ , ω L ⋅ L] = 0 können wir die Wellenfunktionen der freien Bewegung in der Ebene senkrecht zum B-Feld als Eigenfunktionen vom Drehimpuls ω L ⋅ L parallel zum B-Feld (ω L ∼ B) wählen. Diese Funktionen sind dann gleichzei tig Eigenfunktionen von H⊥ . Sie wurden bereits in Abschnitt 16.4 gefunden. In Zylinderkoordinaten (ρ, φ, z) mit der z-Achse parallel zu B lauten die Eigen funktionen von H⊥ (22.28): ϕ km (x ⊥ ) = J m (kρ)e imφ ,
ρ = |x⊥ | ,
x ⊥ = (ρ, φ) ,
wobei J m (kρ) die gewöhnlichen Bessel-Funktionen bezeichnet, welche die zweidimensionalen Radialfunktionen des freien Teilchens in zwei Dimensio nen repräsentieren, siehe Gleichung (16.11). Die zugehörigen Energieeigenwer te von H⊥ lauten: E⊥km =
2.
(ℏk)2 − ℏω L m , 2M
ω L = |ω L | .
Hierin ist k die Wellenzahl der konzentrischen (axialsymmetrischen) Welle und m bezeichnet die Projektion des Drehimpulses parallel zum Magnetfeld. Starkes Magnetfeld: In diesem Fall kann der Term linear in B ∼ ω L vernachlässigt werden, und wir erhalten den Hamilton-Operator des zweidimensionalen rotationssymme trischen harmonischen Oszillators, H⊥ =
p2⊥ 1 + Mω2L x2⊥ , 2M 2
dessen Energieeigenwerte und Eigenfunktionen bekannt sind (siehe Ab schnitt 16.5).
22.4 Die Landau-Niveaus |
481
Für die vollständige Lösung des Problems empfiehlt es sich wieder, die z-Achse in Richtung von ω L (22.26) zu legen: ωL = ωL ez ,
ωL =
|qB| 1 = ωc . 2m 2
Der Hamilton-Operator(22.27) nimmt dann die Gestalt H⊥ = H0 − ω L L z
(22.29)
an, wobei
1 1 (22.30) (p2 + p2y ) + Mω2L (x2 + y2 ) 2M x 2 der Hamilton-Operator des zweidimensionalen rotationssymmetrischen harmoni schen Oszillators ist. Dieser wurde bereits in Abschnitt 16.5 behandelt. Durch alge braische Diagonalisierung von H0 hatten wir folgendes Spektrum (16.33) gefunden: H0 =
E0 (n+ , n− ) = ℏω L (n+ + n− + 1) , wobei n± = 0, 1, 2, . . . die Besetzungszahlen der rechts- und linkszirkularen Schwin gungsquanten sind. Die zugehörigen Eigenzustände von H0 besitzen den Drehimpuls ℏm parallel zum B-Feld (genauer gesagt in Richtung von qB) mit m = n+ − n− .
(22.31)
Die Energieeigenwerte von H⊥ (22.29) sind deshalb durch E⊥ = ℏω L (n+ + n− + 1) − ℏω L (n+ − n− ) = ℏω L (2n− + 1) 1 1 = 2ℏω L (n− + ) = ℏω c (n− + ) 2 2
(22.32)
gegeben. Sie sind unabhängig von der Besetzungszahl n+ und sind damit in der Quan tenzahl n+ entartet. Mit 2ω L = ω c ist E⊥ (22.32) exakt der im vorherigen Abschnitt auf eichinvariante Weise gefundene Ausdruck (22.25). Die obige Ableitung in CoulombEichung hat den Entartungsgrad dieser Energieniveaus explizit zutage gebracht. Wie aus (22.31) ersichtlich, gehören für festes n− die Zustände mit verschiedenen n+ zu verschiedenen Werten des Drehimpulses parallel zum Magnetfeld. Die Eigenzu stände zu fester Oszillatorquantenzahl n− und damit mit fester Energie können jeden beliebigen Wert der Drehimpulskomponente L z annehmen und sind damit unendlich fach entartet. Die explizite Lösung der Schrödinger-Gleichung zu H0 (22.30) in Zylinderkoordi naten (siehe Abschnitt 16.5) liefert die Wellenfunktion φ n,m (ρ, φ) = e imφ
χ n,|m|(ρ) , √ρ
482 | 22 Geladenes Teilchen im elektromagnetischen Feld wobei die Radialwellenfunktion χ n,|m|(ρ) durch Gleichungen (16.38) und (16.56) defi niert ist. Hierbei sind n = 0, 1, 2, . . . die Anzahl der Knoten der Radialwellenfunktion und ℏm der Eigenwert von L z . Da φ n,m (ρ, φ) Eigenfunktion von H0 und L z ist, ist sie gleichzeitig Eigenfunktion von H⊥ (22.29). Die Quantenzahlen n und m sind mit den zirkularen Oszillatorquantenzahlen n± = 0, 1, 2, . . . über die Beziehung (16.58) n+ + n− = 2n + |m|
(22.33)
verknüpft. Mit (22.31) finden wir deshalb für die Energieeigenwerte (22.32) der La dung q im homogenen Magnetfeld B mit qB parallel zur z-Achse den alternativen Aus druck¹² E⊥ = ℏω L (2n + |m| − m + 1) = ℏω c (n +
|m| − m 1 + ) . 2 2
(22.34)
Für m > 0 ist dieser Ausdruck unabhängig von m, und die Entartung der Energie bezüglich des Drehimpulses ist manifest: E⊥ = ℏω c (n +
1 ) , 2
m>0.
(22.35)
Für m < 0 lauten die Eigenenergien (22.34) E⊥ = ℏω c (n + |m| +
1 ) , 2
m 0 und m < 0 denselben Entartungsgrad; beide sind in der Quantenzahl n+ entartet. Durch das äußere Magnetfeld wird die rechts-links-zirkulare Symmetrie des Os zillators (22.30) gebrochen. Für ein konstantes Magnetfeld B, für welches qB in die negative z-Richtung zeigt, besitzt der zweite Term in H⊥ (22.29) das entgegengesetzte Vorzeichen, H⊥ = H0 + ω L L z , und die zugehörigen Energieeigenwerte E⊥ = ℏω L (2n + |m| + m + 1) = ℏω L (2n+ + 1) = ℏω c (n+ +
1 ) 2
12 Die Quantenzahl n hat offensichtlich hier nicht notwendigerweise dieselbe Bedeutung wie im vo rigen Abschnitt in Gleichung (22.25), obwohl sie denselben Wertebereich durchläuft. Nur für m > 0 stimmen beide Quantenzahlen überein, vgl. (22.25) und (22.35) und beachte, dass ω c = 2ω L . Für m < 0 enthält die Oszillatorquantenzahl n, Gleichung (22.25), neben der radialen Quantenzahl n noch |m|, vgl. (22.25) und (22.36).
22.4 Die Landau-Niveaus | 483
sind unabhängig von n− . Im Vergleich zu (22.31) (wo qB in positive z-Richtung zeigt) ist die Rolle von n+ und n− vertauscht. Der Entartungsgrad des Landau-Niveaus ist natürlich in beiden Fällen der gleiche und unabhängig von der Richtung des B-Feldes. Die Tatsache, dass die Energieeigenzustände (22.34) für m > 0 unabhängig vom Wert des Drehimpulses L z sind, lässt sich anschaulich wie folgt erklären. Den Hamil ton-Operator (22.29), der die Bewegung senkrecht zum Magnetfeld beschreibt, kön nen wir interpretieren als den Hamilton-Operator eines zweidimensionalen rotations symmetrischen harmonischen Oszillators in einem rotierenden Bezugssystem. Wie in Band 2 explizit gezeigt wird, tritt im (mit der Frequenz Ω) rotierenden Bezugssystem ein zusätzlicher Trägheitsterm ∆H = −Ω ⋅ L auf, der das quantenmechanische Analogon der klassischen Coriolis-Kraft ist. Der Term −ω L ⋅L in (22.29) repräsentiert also die im rotierenden Bezugssystem auftretende Coriolis-Wechselwirkung. Das Besondere im vorliegenden Fall ist, dass die Oszillator frequenz mit der Drehfrequenz übereinstimmt. Die Bewegung eines zweidimensiona len rotationssymmetrischen Oszillators mit Frequenz ω L lässt sich zerlegen in eine Kreisbewegung mit der Drehfrequenz ω L und eine Schwingung in radialer Richtung (siehe (22.33)). In einem mit derselben Frequenz ω L rotierenden Bezugssystem führt der Oszillator nur noch die radialen Schwingungen aus, während seine (im Labor system auftretende) Kreisbewegung nicht mehr beobachtbar ist. Der im rotierenden Bezugssystem auftretende Coriolis-Term −ω L ⋅ L kompensiert gerade den Rotationsan teil des Oszillators (siehe Gleichung (22.34)), und es überlebt nur der radiale Schwin gungsanteil, siehe Gleichung (22.35). Für ein konstantes Magnetfeld bestimmt die Coulomb-Eichung das Vektorpotenzial jedoch noch nicht eindeutig. Im vorliegenden Fall nimmt die Wellenfunktion eine besonders einfache Form an, wenn wir statt des oben benutzten Vektorpotenzials¹³ (22.17) 1 1 A = B (xe y − ye x ) = Bρe φ 2 2 die asymmetrische Form A = Bxe y (22.37) benutzen. Man überzeugt sich leicht, dass auch dieses Potenzial der CoulombEichung genügt und ein konstantes Magnetfeld entlang der z-Achse liefert. In die ser Eichung hängt der zugehörige Hamilton-Operator H=
(p y − qBx)2 p2 p2x + + z 2M 2M 2M
13 Wir benutzen hier die üblichen Zylinderkoordinaten (ρ, φ, z) (16.1).
484 | 22 Geladenes Teilchen im elektromagnetischen Feld
nicht von den Koordinaten y und z ab. Deshalb sind die linearen Impulse entlang dieser beiden Richtungen erhalten,¹⁴ und für die Wellenfunktion können wir den Separationsansatz φ(x, y, z) = e i(k y y+k z z) χ(x) (22.38) machen. Für die Bewegung in x-Richtung erhält man dann einen harmonischen Oszillator (ℏk y − qBx)2 ℏk y 2 p2 p2x M + ) χ(x) ≡ ( x + ω2c (x − ) ) χ(x) =: H⊥ (x)χ(x) 2M 2M 2M 2 qB (22.39) mit Frequenz ω c (22.24), dessen Nullpunkt (Potenzialminimum) bei der Koordina te ℏk y py = (22.40) xc = qB qB liegt und damit von dem linearen Impuls in y-Richtung abhängt. Die zu diesem Oszillator gehörige Oszillatorlänge (12.29) (
l=√
ℏ ℏ ≡√ Mω c |qB|
(22.41)
wird als magnetische Länge bezeichnet. Für ein Magnetfeld der Stärke B = 1 T be trägt l ≈ 0,6 ⋅ 10−9 m, was in etwa das zehnfache des Bohr’schen Atomradius ist. Die Lösung des verschobenen linearen harmonischen Oszillators (22.39) H⊥ (x)χ(x) = E⊥ χ(x) führt wieder auf die bereits oben gefundenen Energieeigenwerte E⊥n = ℏω c (n +
1 ) , 2
(22.42)
und die zugehörigen Wellenfunktionen χ n (x) sind durch bei der Koordinate x c (22.40) lokalisierte Oszillatorfunktionen gegeben: χ n (x) = ⟨x − x c |n⟩ . Mit wachsendem p y sind diese Zustände bei größerem x lokalisiert. Die Gesamt energie eines Elektrons mit Wellenzahlen k y und k z ergibt sich zu E = E⊥n +
(ℏk z )2 2M
14 In der klassischen Mechanik ist nur der Impuls parallel zum B-Feld erhalten. Die zusätzliche Er haltung von p y ist hier eine Folge der speziellen Eichung. Man beachte jedoch, dass p y der kanonische Impuls und nicht der kinetische Impuls m ẏ ist. Letzterer ist in der Quantenmechanik (für B ≠ 0) eben falls nicht erhalten.
22.4 Die Landau-Niveaus | 485
und ist unabhängig von der Wellenzahl k y und somit unendlichfach entartet. Diese Entartung ist eine allgemeine Eigenschaft des Landau-Niveaus. Je nach Wahl der Eichung zeigt sich der Entartungsgrad jedoch in unterschiedlichen Quantenzahlen. Hätten wir statt Gleichung (22.37) die asymmetrische Eichung A = −Bye x gewählt, wäre der lineare Impuls in x-Richtung p x = ℏk x erhalten, die Energieei genwerte jedoch in p x entartet. Die obigen Betrachtungen zeigen, dass die explizite Form der Wellenfunktion sehr wohl von der gewählten Eichung abhängt, jedoch die zugehörigen Energieeigenwerte unabhängig von der Wahl der Eichung sind.
22.4.3 Ausdehnung und Besetzung der Landau-Niveaus Wir betrachten eine rechteckige Metallplatte, deren Dicke L z sehr klein gegenüber ih ren beiden anderen linearen Abmessungen L x und L y sein soll, siehe Abb. 22.3. Da die Elektronen ohne äußere Zwänge das Metall nicht verlassen können, stellt die Metall oberfläche eine unendlich hohe Potenzialwand dar, auf der die Wellenfunktion ver schwinden muss. Wie wir in Abschnitt 8.5 gesehen haben, sind die Wellenzahlen in einem solchen Potenzial quantisiert, siehe Gleichung (8.16). Falls die Metallplatte sehr dünn ist, L z ≤ L x , L y , befinden sich sämtliche Elektronen im Zustand minimaler Wel B
Lz
Ly
Lx
(a)
Ly
Lx (b)
2πl2 Ly
Abb. 22.3: (a) Rechteckige Metallplatte der Abmessungen L x × L y × L z im äußeren Magnetfeld B, welches senkrecht auf der Metallplatte steht. (b) Illustration der Lage der Landau-Orbits. Die Linien geben die x-Position des Zentrums der Landau-Orbits zu einem festen p y an. Jedes dieser Orbits „besetzt“ die Fläche
2πl2 Ly
⋅ L y = 2πl2 .
486 | 22 Geladenes Teilchen im elektromagnetischen Feld
lenzahl k z , die nach Gleichung (8.16) durch (k z )min = π/L z gegeben ist. Die Zustände mit größeren k z sind durch eine sehr große Energielücke (πℏ/L z )2 /2M vom Zustand (k z )min getrennt und können deshalb außer Acht gelassen werden. Wir können die Metallplatte dann idealisiert als zweidimensionale Fläche be trachten, die wir in die x-y-Ebene legen. Ferner soll L y ≪ L x → ∞ gelten, sodass Randeffekte in x-Richtung vernachlässigt werden können. In y-Richtung wählen wir der Einfachheit halber periodische Randbedingungen φ(x, y + L y , z) = φ(x, y, z) ,
(22.43)
sodass die Wellenzahlen k y quantisiert sind: ky = ±
2π ny , Ly
n y = 0, 1, 2, . . . .
(22.44)
Die Platte befinde sich in einem konstanten Magnetfeld B = Be z , welches senkrecht auf der Platte steht. Die Elektronen werden dann bei Wahl (22.37) des Eichpotenzials durch den Hamilton-Operator H⊥ (22.39) beschrieben und besitzen die Energieeigen werte E⊥n (22.42), die unabhängig von k y sind. Ihre Energieeigenzustände (LandauOrbits) sind an den Orten (22.40) x c = l2 k y lokalisiert. Hierbei gibt die magnetische Länge l (22.41) die Ausdehnung der LandauOrbits (in der Ebene senkrecht zum Magnetfeld) an. Die x-Positionen (Zentren) der Landau-Orbits benachbarter k y (22.44) unterscheiden sich um ∆x c = l2
2π , Ly
(22.45)
siehe Abb. 22.3(b). Für das hier benutzte Eichpotenzial (22.37) sind die Landau-Zustän de (22.38) ebene Wellen in der y-Koordinate und somit über die gesamte y-Achse ausgebreitet. Aufgrund der periodischen Randbedingungen (22.43) genügt es jedoch, diese Zustände auf dem Intervall L y , der Breite der Metallplatte, zu betrachten. Aus Gleichung (22.45) folgt dann, dass jeder der Landau-Zustände (mit festem k y ) auf der Metallplatte eine Fläche 2π ∆x c L y = l2 L y = 2πl2 Ly einnimmt, die unabhängig von den geometrischen Abmessungen der Metallplatte ist. (Bei gegebener Ladung q hängt l (22.41) allein von der Stärke B = |B| des Magnetfeldes ab. Je stärker das Magnetfeld ist, desto kleiner ist die magnetische Länge l, umso mehr sind die Landau-Zustände lokalisiert.) Auf einer rechteckigen Metallplatte der Fläche L x L y befinden sich folglich Lx Ly |qB| = Lx Ly 2 2πℏ 2πl k y -Zustände in einem Landau-Niveau der Energie E⊥n . NB =
(22.46)
22.5 Zur Rolle des Eichpotenzials in der Quantenmechanik |
487
Der obige Ausdruck besitzt eine sehr anschauliche Bedeutung: L x L y B ist der Magnetfluss durch die Metallplatte. Dieser ist gleich der Zahl N B der Elektronenzustände in einem Landau-Niveau multipli ziert mit dem elementaren Flussquantum 2πℏ/e, wobei q = −e < 0 die Ladung eines Elektrons ist.
Nach (22.46) ist nB =
NB 1 |qB| = = 2 L x L y 2πl 2πℏ
die Zahl der Zustände (in einem Landau-Niveau) pro Fläche auf der Metallplatte. Mit anderen Worten: n B ist der Entartungsgrad pro Fläche der Landau-Niveaus auf einer Metallplatte, die sich in einem Magnetfeld der Stärke B befindet, welches senkrecht auf der Metallplatte steht. Dieser Entartungsgrad ist unabhängig von der Energie E⊥n des Landau-Niveaus, d. h. für alle Landau-Niveaus derselbe. Aufgrund der Entartung der Landau-Niveaus E⊥n (22.42) in k y kann jedes dieser Niveaus mehrfach mit Elektro nen besetzt werden. Bezeichnen wir mit N e die Zahl der Elektronen in der Metallplatte, so ist Ne ne = Lx Ly deren Flächendichte. Somit ist ν=
Ne ne = nB NB
die Zahl der besetzten Zustände in einem Landau-Niveau. ν wird als Füllfaktor bezeich net. Beim sogenannten ganzzahligem Quanten-Hall-Effekt ist ν eine ganze Zahl.
22.5 Zur Rolle des Eichpotenzials in der Quantenmechanik Die klassische Bewegungsgleichung einer Punktladung (22.9) hängt nur von den elek tromagnetischen Feldern, nicht jedoch von den Eichpotenzialen ab. Die Bewegungs gleichung ist somit eichinvariant. Andererseits gehen in den Hamilton-Operator ei ner Punktladung, Gleichung (22.15), explizit die Potenziale Φ, A ein. Folglich hängen der Hamilton-Operator und damit die Wellenfunktion explizit von der gewählten Ei chung ab; physikalische Observablen wie die Energieeigenwerte sind jedoch eichun abhängig. Wir werden jetzt anhand eines einfachen Modellsystems zeigen, dass in der Quantentheorie die Eichpotenziale tatsächlich eine gewisse eigenständige Bedeutung erhalten, aber dennoch ihr Effekt auf physikalische Größen nur von den eichinvarian ten Feldern abhängt. Wir betrachten eine Ladung q, die in ihrer Bewegung auf eine Kreisbahn mit Radi us R eingeschränkt ist, z. B. ein Elektron in einem sehr dünnen Metallring (geschlos sene Drahtschleife; der Querschnitt des Drahtes sei vernachlässigbar). Auf der Sym metrieachse des Metallringes befinde sich eine sehr lange Spule mit Radius r0 , siehe Abb. 22.4, durch die ein stationärer Strom I fließt. Für eine sehr lange Spule ist das Ma gnetfeld in ihrem Inneren homogen B = const ≠ 0, während es außerhalb der Spule
488 | 22 Geladenes Teilchen im elektromagnetischen Feld
B
I
Abb. 22.4: Dünner Metallring auf sehr langer Spule.
verschwindet. Aufgrund des Stokes’schen Gesetzes ∮ dxA(x) = ∫ dΣ ⋅ B(x) =: ϕ
(22.47)
Σ
C=∂Σ
kann jedoch für ϕ ≠ 0 das Vektorpotenzial A(x) im Außenbereich der Spule nicht überall verschwinden. Wir wählen die Spulenachse als z-Achse und legen den Me tallring in die x-y-Ebene. In den üblichen Zylinderkoordinaten (ρ, φ, z) können wir im Außenraum der Spule ρ > r0 aufgrund der vorliegenden axialen Symmetrie das Vektorpotenzial in der Form A(ρ, φ, z) = A(ρ)e φ ansetzen, wobei e φ der Einheitsvektor in Richtung des Azimutwinkels φ ist. Ein Po tenzial dieser Form erfüllt bereits die Coulomb-Eichung ∇A = 0. Aus (22.47) findet man dann für das Vektorpotenzial im Außenraum der Spule A(ρ, φ) =
ϕ eφ , 2πρ
ρ > r0 ,
(22.48)
wobei ϕ der magnetische Fluss (22.47) ist. Der Hamilton-Operator der Punktladung q mit Masse M im äußeren Magnetfeld ist durch Gleichung (22.22) gegeben: (p − qA)2 . 2M In Zylinderkoordinaten lautet der ∇-Operator H=
∇ = eρ
∂ 1 ∂ ∂ + eφ + ez . ∂ρ ρ ∂φ ∂z
Auf der Kreisbahn ρ = R, z = 0 reduziert dieser sich auf ∇ = eφ
1 ∂ . R ∂φ
(22.49)
22.5 Zur Rolle des Eichpotenzials in der Quantenmechanik | 489
Damit finden wir für den Impulsoperator der Punktmasse auf dem Kreisring p = eφ
1 Lz , R
Lz =
ℏ ∂ . i ∂φ
Einsetzen dieses Ausdruckes und der Gleichung (22.48) in den Hamilton-Opera tor (22.49) liefert 1 qϕ 2 H= − [e (L )] . φ z 2π 2MR2 Da ∂ φ e φ = −e ρ und e ρ ⋅ e φ = 0, finden wir für den Hamilton-Operator der Elektronen im Metallring mit Radius R, durch den der Magnetfluss ϕ strömt, H=
qϕ 2 1 (L − ) . z 2π 2MR2
Da ϕ eine Konstante ist, sind die Eigenfunktionen von H gerade die von L z , d. h. bis auf einen Normierungsfaktor exp(imφ), und die zugehörigen Energieeigenwerte lauten: E=
ℏ2 qϕ 2 (m − ) . 2 2πℏ 2MR
(22.50)
Die quantisierten Energien hängen von dem magnetischen Fluss ϕ im Inneren der Spule ab, obwohl das B-Feld am Ort des Teilchens verschwindet. Wie oben gezeigt, verschwindet jedoch im Aufenthaltsgebiet des Teilchens für ϕ ≠ 0 das Vektorpo tenzial nicht überall. Das quantenmechanische Teilchen spürt offenbar das Vektor potenzial, wie dies auch aus der Schrödinger-Gleichung ersichtlich ist. In diesem Sinne kommt in der Quantentheorie dem Vektorpotenzial selbst (und nicht nur den Feldstärken E und B) eine gewisse physikalische Bedeutung zu. Dennoch hängen die physikalischen Eigenschaften der Ladung wie ihre Energieeigenwerte nicht vom Vektorpotenzial selbst, sondern nur von dem eichinvarianten magnetischen Fluss ab. Für verschwindendes Magnetfeld ϕ = 0 reduziert sich Gleichung (22.50) auf die Energie eines Teilchens mit Drehimpuls L z = ℏm, das auf einen Kreis mit Radius R eingeschränkt ist: (ℏm)2 E= . 2MR2 Der magnetische Fluss ϕ ≠ 0 hebt die Entartung der Energieniveaus im Vorzeichen der Drehimpulsprojektion m auf, die bei Abwesenheit des Magnetfeldes vorliegt. Die se Konsequenz des B-Feldes hatten wir auch schon bei den Landau-Niveaus (22.34) gefunden.
490 | 22 Geladenes Teilchen im elektromagnetischen Feld
22.6 Ableitung des Hamilton-Operators einer Punktladung Um die Form des Hamilton-Operators bei Anwesenheit eines elektromagnetischen Fel des zu finden wiederholen wir die in Kapitel 7 gegebene Ableitung der SchrödingerGleichung für die Lagrange-Funktion (22.5). Diese Lagrange-Funktion besitzt die Stan dardform der Lagrange-Funktion einer Punktmasse im Potenzial ̇ V(x, x,̇ t) = qA0 (x, t) − q ẋ A(x, t) . Zu beachten ist hier allerdings, dass das Potenzial über die äußeren elektromagne tischen Potenziale explizit zeitabhängig sein kann und darüber hinaus von der Ge schwindigkeit abhängt. Wir gehen von dem dreidimensionalen Analogon von Gleichung (7.2) aus, 2
ψ(x, t + ε) = [
3/2 i m x − x x + x m , t))] ψ(x , t) , ] ∫ d3 x exp [ ( ( ) − εV ( 2πℏiε ℏ 2 ε 2
(22.51) wobei wir die expliziten (dreidimensionalen) Ausdrücke für K (7.3) und A (7.4) einge setzt haben und die sogenannte Mittelpunkt-Form der Diskretisierung des RiemannIntegrals der Wirkung t+ε
∫ dt L(x(t )) = εL (
x(t + ε) + x(t) x + x ) = εL ( ) 2 2
(22.52)
t
gewählt haben.¹⁵ Beachten wir, dass nach der Substitution x = x + η die Geschwindigkeit durch (ε → 0) ̇ = x(t)
η x(t + ε) − x(t) x − x = =− ε ε ε
gegeben ist, so erhalten wir aus Gleichung (22.51): 3
ψ(x, t + ε) = [
2 iqε η m 2 m η ] exp [− A0 (x + , t)] ] ∫ d3 η exp [− 2πℏiε 2ℏiε ℏ 2
exp [−
η iq η ⋅ A (x + , t)] ψ(x + η, t) . ℏ 2
(22.53)
15 Wie in Abschnitt 22.2.1 erläutert, ist die Mittelpunktsvorschrift aus Gründen der Eichinvarianz er forderlich.
22.6 Ableitung des Hamilton-Operators einer Punktladung | 491
Wegen 3
∫ d3 η exp [−
m 2 2πℏiε 2 η ]=[ ] ∼ O(ε3/2 ) 2ℏiε m
(22.54)
3
∫ d3 ηη i η j exp [−
2πℏiε 2 iℏε m 2 η ]=[ δ ij ∼ O(ε5/2 ) ] 2ℏiε m m
(22.55)
sind die η i wie im eindimensionalen Fall von der Ordnung √ε. Da wir eine Differenzi algleichung erster Ordnung in der Zeit suchen, müssen wir deshalb bis zur Ordnung O(η2 ) entwickeln. Für die Wellenfunktion liefert das 1 (22.56) η i η j ∂ i ∂ j ψ(x, t) + ⋅ ⋅ ⋅ . 2 Der Term mit dem temporären Vektorpotenzial A0 ist ein gewöhnliches geschwindig keitsunabhängiges Potenzial. Der entsprechende Exponent in Gleichung (22.53) ist be reits von der Ordnung ε, und wir können die Fluktuation η i im Argument von A0 (x, t) vernachlässigen. Der Exponent mit dem Vektorpotenzial A ist wegen der Anwesenheit von η i in führender Ordnung √ε, und wir müssen deshalb auch das Vektorpotenzial selbst nach Potenzen von η i entwickeln. Bis einschließlich Terme der Ordnung η2 er halten wir iq η exp [− η i A i (x + , t)] ℏ 2 2 η η q2 iq = 1 − η i A i (x + , t) − 2 [η i A i (x + , t)] + ⋅ ⋅ ⋅ ℏ 2 2 2ℏ 1 q2 iq 2 = 1 − η i [A i (x, t) + η j ∂ j A i (x, t) + ⋅ ⋅ ⋅ ] − 2 [η i A i (x, t) + ⋅ ⋅ ⋅ ] + ⋅ ⋅ ⋅ ℏ 2 2ℏ iq q2 iq (22.57) η i η j ∂ j A i (x, t) − 2 η i η j A i (x, t)A j (x, t) + ⋅ ⋅ ⋅ . = 1 − η i A i (x, t) − ℏ 2ℏ 2ℏ Einsetzen von Gleichung (22.56) und (22.57) in Gleichung (22.53) liefert ψ(x + η, t) = ψ(x, t) + η i ∂ i ψ(x, t) +
ψ(x, t + ε) = ψ(x, t) + ε∂ t ψ(x, t) + ⋅ ⋅ ⋅ 3
2 m 2 qε m ] ∫ d3 η exp [− η ] [1 + A0 (x, t) + ⋅ ⋅ ⋅ ] 2πℏiε 2iεℏ iℏ 1 q2 iq η i η j (iq∂ j A i (x, t) + A i (x, t)A j (x, t))] × [1 − η i A i (x, t) − ℏ 2ℏ ℏ 1 × [ψ(x, t) + η i ∂ i ψ(x, t) + η i η j ∂ i ∂ j ψ(x, t) + ⋅ ⋅ ⋅ ] 2
=[
3
=[
2 qε m 2 m η ] { [1 + A0 (x, t)] + O(η) ] ∫ d3 η exp [− 2πℏiε 2iεℏ iℏ
+ ηi ηj[ − −
1 q2 1 (iq∂ j A i (x, t) + A i (x, t)A j (x, t)) + ∂ i ∂ j 2ℏ ℏ 2
iq A i (x, t)∂ j ] + O(η3 )}ψ(x, t) . ℏ
492 | 22 Geladenes Teilchen im elektromagnetischen Feld
Berücksichtigen wir, dass wegen ∫ d3 η η k exp [−
m 2 η ]=0 2πiε
die Terme linear in η verschwinden und benutzen (22.54) und (22.55), so erhalten wir ψ(x, t) + ε∂ t ψ(x, t) + ⋅ ⋅ ⋅ = ψ(x, t) + ε[ +
qA0 i q2 2 − (iq(∇⃗ ⋅ A(x, t)) + A (x, t)) + iℏ 2m ℏ
iℏ ⃗ 2 q ∇ + A(x, t) ⋅ ∇]ψ(x, t) + ⋅ ⋅ ⋅ . 2m m
Diese Gleichung ist trivialerweise für die Terme der Ordnung ε0 = 1 erfüllt. Die Terme der Ordnung ε liefern die Beziehung iℏ∂ t ψ(x, t) = [qA0 (x, t) −
ℏ2 2 ℏq ℏ q2 2 ∇ − A(x, t) ⋅ ∇ + (iq(∇ ⋅ A) + A (x, t))] ψ(x, t) . 2m im 2m ℏ
Beachten wir schließlich 2A ⋅ ∇ + (∇ ⋅ A) = A ⋅ ∇ + ∇ ⋅ A , so erhalten wir die zeitabhängige Schrödinger-Gleichung in der Form iℏ∂ t ψ(x, t) = [
2 1 ℏ ( ∇ − qA(x, t)) + qA0 (x, t)] ψ(x, t) , 2m i
aus welcher wir den Hamilton-Operator der Punktladung im äußeren elektromagne tischen Feld 1 H= (p − qA(x, t))2 + qA0 (x, t) 2m ablesen. Es ist wichtig zu betonen, dass die hier erhaltene Form des Hamilton-Operators, d. h. die relative Anordnung von Laplace-Operator ∇ und Vektorpotenzial A, eine Fol ge der gewählten Diskretisierung für den geschwindigkeitsabhängigen Potenzialterm V(
x + x x(t + ε) + x(t) , t) = V ( , t) 2 2
des Riemann-Integrals der Wirkung (22.52) ist. Wie in Abschnitt 22.2.1 diskutiert, gewährleistet diese Mittelpunktsvorschrift, dass die zeitdiskretisierte Amplitude das korrekte Verhalten unter Eichtransformationen besitzt und daher zu bevorzugen ist. Andere Diskretisierungsformen wie z. B. V(x) oder V(x ) führen auf Hamilton-Ope ratoren, in denen die Impulsoperatoren p relativ zum Vektorpotenzial A in anderer Reihenfolge angeordnet sind.
| Anhang
A Die Dirac’sche δ-Funktion A.1 Definition und Realisierungen Die Dirac’sche δ-Funktion δ(x) einer reellen Variablen x ist eine sogenannte „verall gemeinerte Funktion“ (Distribution), die überall außer bei x = 0 verschwindet, wo sie singulär ist: {0 , x ≠ 0 . δ(x) = { ∞, x=0 { Sie ist definiert über folgende Beziehung: ∞
∫ dx f(x)δ(x) = f(0) .
(A.1)
−∞
Hierbei ist f(x) eine bei x = 0 stetige Funktion, die in diesem Zusammenhang als Test funktion bezeichnet wird.¹ Für f(x) = 1 ergibt sich aus (A.1): ∞
∫ dx δ(x) = 1 . −∞
Diese Beziehung zeigt, dass die δ-Funktion δ(x) die Dimension von x−1 besitzt. Da die δ-Funktion nur bei x = 0 von null verschieden ist, kann der Integrationsbereich in den obigen Integralen auf ein kleines endliches Intervall der Umgebung des Nullpunktes [−a, a] beschränkt werden: a
∫ dx f(x)δ(x) = f(0) . −a
Ersetzen wir in (A.1) die Funktion f(x) durch die Funktion F(x) = f(x + x ) und ver schieben die Integrationsvariable, so erhalten wir die Beziehung ∞
∫ dx f(x) δ(x − x ) = f(x ) .
(A.2)
−∞
Die δ-Funktion δ(x − x ) ist damit das Analogon des Kronecker-Symbols δ x,x für kon tinuierliche Variablen x. Das diskrete Analogon von (A.2) lautet: ∑ f x δ x,x = f x .
(A.3)
x
1 Im Folgenden werden wir stets stillschweigend voraussetzen, dass die Testfunktion f(x) entspre chende Eigenschaften besitzt, sodass die auftretenden Integrale existieren. Dies schließt oftmals ne ben Stetigkeit auch Differenzierbarkeit sowie genügend schnelles Verschwinden für |x| → ∞ ein. https://doi.org/10.1515/9783110586022-023
496 | A Die Dirac’sche δ-Funktion
In der Quantenmechanik, wo oft ein Wechsel von diskreten zu kontinuierlichen Va riablen vorgenommen wird, ist es zweckmäßig, eine einheitliche Notation für diskre te und kontinuierliche Variablen zu benutzen. Wir werden deshalb vereinbaren, dass δ(x, x ) für eine diskrete Variable x das Kronecker-Symbol δ x,x und für eine kontinu ierliche Variable die δ-Funktion δ(x − x ) bezeichnet: {δ x,x , δ(x, x ) := { δ(x − x ) , {
x diskret x kontinuierlich .
(A.4)
Ferner vereinbaren wir, dass das bereits früher in Gleichung (10.49) eingeführte Sym bol ∑ ∫ x
für eine diskrete Variable x die Summation ∑x und für eine kontinuierliche Variable die Integration ∫ dx repräsentiert. Die beiden Gleichungen (A.2) und (A.3) lassen sich dann zusammenfassen zu: ∑ ∫ f(x)δ(x, x ) = f(x ) . x
Die δ-Funktion δ(x) lässt sich als Limes von regulären Funktionen δ ε (x) realisieren: δ(x) = lim δ ε (x) . ε→0
(A.5)
Dieser Limes ist jedoch nicht punktweise sondern im Sinne der Distributionen zu ver stehen, d. h., ∞
lim [ ∫ dxf(x)δ ε (x − x )] = f(x ) ε→0 [−∞ ] für jede Testfunktion f(x). Explizite Darstellungen dieser regulären Funktionen sind (siehe Abb. A.1) die Lorentz-Kurve 1 ε , π x2 + ε2
(A.6)
x2 1 exp (− 12 2 ) , ε ε√2π
(A.7)
δ ε (x) = die Gauß-Kurve δ ε (x) =
das Quadrat der sphärischen Bessel-Funktion nullter Ordnung
δ ε (x) =
1 sin(x/ε) 2 ( ) πε x/ε
(A.8)
A.2 Eigenschaften | 497
√
1 2π ε
(a)
1 πε
(b) (c)
−8ε
−4ε
0
8ε
4ε
Abb. A.1: Realisierungen der δ-Funktion durch (a) die Lorentz-Funktion (A.6), (b) die Gauß-Funktion (A.7) und (c) das Quadrat der sphärischen Bessel-Funktion (A.8).
oder die Rechteckfunktion {1/ε , δ ε (x) = { 0, {
|x| < ε/2 |x| >
ε 2
.
(A.9)
Schließlich sei auch die in Abschnitt 5.2 bewiesene komplexe Darstellung der δ-Funk tion δ ε (x) = √
1 ix2/2ε e 2πiε
erwähnt.
A.2 Eigenschaften Ersetzen wir in der Definitionsgleichung (A.1) die Funktion f(x) durch das Produkt zweier Funktionen g(x)f(x), so erhalten wir: ∞
∞
∫ dx g(x)f(x)δ(x) = g(0)f(0) = g(0) ∫ dx f(x)δ(x) . −∞
−∞
498 | A Die Dirac’sche δ-Funktion
Hieraus lesen wir die Beziehung g(x)δ(x) = g(0)δ(x) ab. Für g(x) = x ergibt sich: xδ(x) = 0 . Wir betrachten das Integral (a ≠ 0) ∞
a∞
|a|∞
−∞
−a∞
−|a|∞
1 y y 1 ∫ dx f(x)δ(ax) = ∫ dy f ( ) δ(y) = ∫ dy f ( ) δ(y) a a |a| a ∞
=
1 1 y f(0) . ∫ dy f ( ) δ(y) = |a| a |a|
(A.10)
−∞
Hierbei haben wir eine Umskalierung der Integrationsvariablen vorgenommen und die Definition der δ-Funktion (A.1) benutzt. Vergleich mit (A.1) liefert die Beziehung δ(ax) =
1 δ(x) . |a|
(A.11)
Setzen wir in (A.11) a = −1, so zeigt sich, dass δ(x) eine gerade Funktion ist: δ(−x) = δ(x) , was auch aus den expliziten Darstellungen (A.6)–(A.9) ersichtlich ist. Betrachten wir die δ-Funktion einer stetigen Funktion g(x). Wir setzen voraus, dass g(x) nur einfache Nullstellen besitzt: g(x k ) = 0 , Zum Integral
g (x k ) ≠ 0 .
∞
I = ∫ dx f(x)δ(g(x))
(A.12)
−∞
tragen offenbar nur infinitesimal kleine Intervalle in der Umgebung der Nullstellen x k von g(x) bei. In diesen Intervallen können wir die Funktion g(x) in eine Taylor-Reihe um die Nullstelle entwickeln und die Entwicklung nach der ersten Ordnung abbre chen, g(x) = g (x k )(x − x k ) + . . . , x ∈ [x k − ε, x k + ε] ,
A.2 Eigenschaften
| 499
und erhalten für das Integral (A.12): x k +ε
I = ∑ ∫ dx f(x)δ (g (x k )(x − x k )) . k x k −ε
Unter Verwendung von (A.11) ergibt sich: I=∑ k
1 |g (x
k )|
f(x k ) .
Vergleich mit (A.12) liefert folglich die Beziehung δ(g(x)) = ∑ k
1 |g (x
k )|
δ(x − x k ) .
(A.13)
Ein häufig auftretender Spezialfall von Gleichung (A.13) ist: δ(x2 − a2 ) = δ((x − a)(x + a)) =
1 [δ(x − a) + δ(x + a)] . 2|a|
(A.14)
Die Fourier-Zerlegung einer Funktion f(x) ist durch ∞
f(x) = ∫ −∞
dk ikx ̃ e f (k) 2π
(A.15)
definiert, wobei ihre Fourier-Transformierte f ̃(k) durch ∞
f ̃(k) = ∫ dx e−ikx f(x )
(A.16)
−∞
gegeben ist. Setzen wir (A.16) in (A.15) ein, so erhalten wir die Beziehung ∞
∞
f(x) = ∫ dx f(x ) ∫ −∞
−∞
dk ik(x−x) e . 2π
Vergleich mit Gleichung (A.2) liefert die Fourier-Darstellung der δ-Funktion: ∞
δ(x − x ) = ∫ −∞
dk ik(x−x) . e 2π
(A.17)
500 | A Die Dirac’sche δ-Funktion
Diese Darstellung ergibt sich auch unmittelbar durch Fourier-Zerlegung der regulären Funktion δ ε (x) (A.7), ∞
δ ε (x) = ∫ −∞
dk ikx ε2 e exp (− k 2 ) , 2π 2
und anschließender Bildung des Grenzwertes ε → 0. Der Konvergenz erzeugende Fak 2 2 tor e−ε k /2 unterdrückt bzw. „dämpft“ die Oszillation mit großer Wellenzahl k und wird deshalb oft als Dämpfungsglied bezeichnet. (Man beachte in diesem Zusammen hang die Bemerkung nach Gleichung (A.5)). Zerlegen wir in (A.17) den Integranden in Real- und Imaginärteil, so erhalten wir wegen ∞
L
−∞
−L
dk dk ∫ sin(kx) := lim ∫ sin(kx) = 0 L→∞ 2π 2π
die Darstellung ∞
δ(x) = ∫ −∞
L
dk dk cos(kx) := lim ∫ cos(kx) , 2π L→∞ 2π −L
die explizit zeigt, dass δ(x) eine gerade Funktion ist. Die Fourier-Darstellung ist analog zur Zerlegung nach einem vollständigen Satz von orthonormierten Funktionen: ⟨k|k ⟩ = δ(k, k ) ,
φ k (x) = ⟨x|k⟩ ,
f(x) = ⟨x|f⟩ = ∑ ∫ φ k (x)f k , ∫⟨x|k⟩⟨k|f⟩ = ∑ k
(A.18)
k
wobei die Entwicklungskoeffizienten f k mit der ursprünglichen Funktion über die in verse Transformation ∞
∞
f k = ⟨k|f⟩ = ∫ dx ⟨k|x⟩⟨x|f⟩ = ∫ dx φ∗k (x)f(x) −∞
(A.19)
−∞
zusammenhängen. Einsetzen von (A.19) in (A.18) und Vergleich mit (A.2) liefert die Spektraldarstellung der δ−Funktion: δ(x − x ) = ∑ ∫⟨x|k⟩⟨k|x ⟩ = ∑ ∫ φ k (x)φ∗k (x ) . k
k
Unter Benutzung der Spektraldarstellung des Einheitsoperators 1̂ = ∑ ∫ |k⟩⟨k| k
(A.20)
A.3 Ableitung, Stammfunktion und Hauptwert | 501
erhalten wir hieraus: ̂ ⟩ = ⟨x|x ⟩ . δ(x − x ) ≡ δ(x, x ) = ⟨x|1|x Die δ-Funktion kann somit als Matrixelement des Einheitsoperators betrachtet wer den, was wieder die Analogie zum Kronecker-Symbol zeigt.
A.3 Ableitung, Stammfunktion und Hauptwert Für die Ableitung der δ-Funktion δ (x) erhalten wir nach partieller Integration ∞
∫ dx f(x)δ (x − x0 ) = [f(x)δ(x − x0 )] −∞
x=∞ x=−∞
∞
− ∫ dx f (x)δ(x − x0 ) −∞
= −f (x0 ) . Der Randterm verschwindet hier, da die δ-Funktion an den Integrationsgrenzen ver schwindet. Für die n-te Ableitung der δ-Funktion δ(n) (x) zeigt man durch n-malige partielle Integration: ∞
∫ dx f(x)δ(n) (x − x0 ) = (−1)n f (n) (x0 ) .
(A.21)
−∞
Die Stammfunktion der δ-Funktion x
Θ(x) = ∫ dy δ(y) −∞
verschwindet offenbar für x < 0 und ist wegen ε
lim ∫ dx δ(x) = 1
ε→0
−ε
gleich 1 für x > 0. Sie ist damit durch die Heavyside-Funktion {1 , Θ(x) := { 0, {
x>0 x 0 können wir den Integrationsweg in der oberen komplexen k-Halbebene schließen, ∞
∫ dk ≡
∫
dk
→
∮
dk ,
−∞
da in diesem Fall der Zähler in (A.23) exponentiell gedämpft ist und somit der Integrand auf dem Halb kreis mit Radius |k| → ∞ verschwindet. Der Pol bei k = iε wird dann vom Integrationsweg eingeschlossen, und der Residuensatz liefert: Θ(x > 0) = lim
ε→0
∮
dk e ikx 2πi k − iε
= lim (e ikx k=iε ) = lim e −εx = 1 . ε→0
ε→0
Für x < 0 können wir den Integrationsweg in der unteren Halbebene schließen: ∞
∫ dk
→
∮
dk .
−∞
Der Pol bei k = iε wird jetzt nicht vom Integrationsweg eingeschlossen, und der Residuensatz liefert: Θ(x < 0) = 0 . Damit ist die Fourier-Darstellung (A.23) bewiesen.
A.3 Ableitung, Stammfunktion und Hauptwert |
503
Wir betrachten eine Funktion f(x), die über einem Intervall (a, b) definiert ist und au ßer im Punkte x = c ∈ (a, b) stetig ist, für x → c jedoch nicht beschränkt bleibt. Falls die Integrale c−ε
b
∫ dx f(x) , a
∫ dx f(x) c+ε
für ε → 0 nicht einzeln existieren, ihre Summe aber gegen einen endlichen Grenzwert strebt, so bezeichnet man diesen als den Hauptwert des Integrals, der durch ein großes P gekennzeichnet wird: b
b
c−ε
b
P ∫ dx f(x) ≡ ∫ dx Pf(x) := lim [ ∫ dx f(x) + ∫ dx f(x)] . ε→0 a a c+ε [a ] Beim Hauptwert des Integrals wird also das Integral über ein infinitesimales Intervall, in dessen Mitte sich die Singularität befindet, c+ε
lim ∫ dxf(x) ,
ε→0
c−ε
ausgeschlossen. Wir betrachten nun eine Funktion der Gestalt f(x) = g(x)/x, wobei g(x) eine im ge samten Integrationsgebiet stetige Funktion sein soll. Der Hauptwert bezieht sich dann nur auf die singuläre Funktion 1/x. Da a
a
x lim ∫ dx g(x) 2 = g(0) lim ∫ dx ε→0 ε→0 x + ε2 −a
−a
1 2
d ln (x2 + ε2 ) = 0 dx
(A.24)
für beliebiges a und insbesondere für a = ε, können wir den Hauptwert von 1/x durch P
x 1 = lim x ε→0 x2 + ε2
(A.25)
definieren. Partialbruchzerlegung des Ausdruckes auf der rechten Seite liefert die al ternative Darstellung 1 1 1 + (A.26) P = lim 21 [ ] . x ε→0 x + iε x − iε Wegen 1 ε x ∓i 2 = 2 2 x ± iε x + ε x + ε2 und unter Benutzung der Definition der δ-Funktion als Grenzwert von (A.6) finden wir hieraus die Beziehung lim
ε→0
1 1 = P ∓ iπδ(x) . x ± iε x
(A.27)
504 | A Die Dirac’sche δ-Funktion
Nach Gleichungen (A.25) und (A.24) gilt für beliebig reelles a: a
P∫ −a
a
dx 1 ≡ ∫ dx P = 0 . x x −a
Aus Gleichung (A.26) und (A.23) finden wir die Beziehung ∞
∫ −∞
dk ikx 1 e P = 2πi k
1 2
[Θ(x) − Θ(−x)] .
A.4 Mehrdimensionale δ-Funktion Die δ-Funktion von Vektoren in mehrdimensionalen Räumen ist durch das Pro dukt der δ-Funktionen in den einzelnen kartesischen Koordinaten definiert. Für die δ-Funktion von Vektoren x = (x1 , x2 , x3 ) im gewöhnlichen dreidimensionalen Orts raum haben wir: 3
δ(x − x ) = ∏ δ(x i − xi ) . i=1
Durch Koordinatentransformation des Ausdruckes auf der rechten Seite und un ter Berücksichtigung der oben angegebenen Eigenschaften der eindimensionalen δ-Funktion lässt sich die dreidimensionale δ-Funktion auch in anderen Koordinaten angeben. In Kugelkoordinaten x = (r, ϑ, φ) findet man (17.54): δ(x − x ) =
δ(r − r ) δ(cos ϑ − cos ϑ )δ(φ − φ ) , r2
wobei nach Gleichung (A.13) δ(cos ϑ − cos ϑ ) =
1 δ(ϑ − ϑ ) | sin ϑ|
gilt. Wegen 0 ≤ ϑ ≤ π gilt hier außerdem | sin ϑ| = sin ϑ.
B Gauß-Integrale Unter Gauß-Integralen versteht man allgemein Integrale, bei denen der Integrand durch eine Exponentialfunktion gegeben ist und die Integrationsvariable höchs tens quadratisch im Exponenten auftritt. Gauß-Integrale mit ungeraden Potenzen (n-ganzzahlig, n ≥ 0) ∞
∫ dxx2n+1 e−λx = 2
1 2
0
n! λ n+1
lassen sich durch Variablensubstitution x2 → x auf die elementaren Integrale ∞
n! λ n+1
∫ dxx n e−λx = 0
(B.1)
zurückführen.¹ Dieser Trick führt jedoch nicht zum Erfolg bei Integralen von GaußFunktionen multipliziert mit geraden Potenzen der Integrationsvariable. Der Prototyp eines solchen Gauß-Integrals ist ∞
I = ∫ dx e− 2 x . a
2
−∞
Da das Integral offenbar positiv ist, verlieren wir keine Informationen, wenn wir das Quadrat dieses Integrals betrachten: ∞
∞
I = ∫ dx e 2
−∞ ∞
− a2 x 2
∫ dy e− 2 y a
−∞ ∞
= ∫ dx ∫ dy e− 2 ( x a
−∞
2
2
+y2 )
−∞
= ∫ dx dy e− 2 (x a
2
+y2 )
.
(B.2)
ℝ2
Dieser Ausdruck lässt sich sehr leicht durch Einführung von Polarkoordinaten x = r cos φ ,
y = r sin φ
berechnen. Beachten wir, dass x2 + y2 = r2 und dass das Flächenelement in Polarko ordinaten durch dxdy = rdrdφ gegeben ist, so erhalten wir aus (B.2) ∞
2π
I 2 = ∫ drr ∫ dφ e− 2 r . a 2
0
0
1 Die Integrale mit n > 0 lassen sich durch n-malige Differenziation nach λ aus dem Integral mit n = 0 gewinnen. https://doi.org/10.1515/9783110586022-024
506 | B Gauß-Integrale
Das Integral über den Winkel φ ist trivial, da der Integrand von diesem nicht abhängt, und liefert den Faktor 2π. Das verbleibende Integral über den Radius r lässt sich durch die Substitution z = (1/2)r2 elementar berechnen: ∞
I = 2π ∫ dz e−az = 2
2π . a
(B.3)
0
Nehmen wir aus dieser Gleichung die positive Wurzel, so erhalten wir die Beziehung ∞
∫ −∞
dx − a x2 1 e 2 = . √2π √a
(B.4)
Gauß-Integrale, bei denen im Exponenten die Integrationsvariable auch linear auf tritt, ∞ dx − a x2 +bx ∫ , (B.5) e 2 √2π −∞
lassen sich durch quadratische Ergänzung im Exponenten a 2 b 2 b2 a x − bx = (x − ) − 2 2 a 2a und anschließender Verschiebung der Integrationsvariable x−
b = x → x a
auf das ursprüngliche Gauß-Integral (B.4) zurückführen, und man erhält ∞
∫ −∞
dx − a x2 +bx 1 b2 e 2a . = e 2 √2π √a
(B.6)
Durch Differenziation dieser Beziehung nach b lassen sich die Ausdrücke für die Inte grale über Gauß-Funktionen multipliziert mit beliebigen ganzzahligen positiven Po tenzen gewinnen. Differenziation von (B.6) nach b liefert ∞
∫ −∞
a 2 b2 dx b x e− 2 x +bx = 3/2 e 2a . √2π a
(B.7)
Setzen wir hier b = 0, so folgt ∞
∫ −∞
a 2 dx x e− 2 x = 0 , √2π
(B.8)
B Gauß-Integrale | 507
was aus Symmetriegründen sofort einsichtig ist, da der Integrand eine ungerade Funktion ist. Ableiten von (B.7) nach b liefert ∞
∫ −∞
b2 dx 2 − a x2 +bx 1 b2 = 3/2 (1 + ) e 2a . x e 2 a √2π a
(B.9)
Durch analytische Fortsetzung a → −ia =
a , i
b → ib
(B.10)
erhalten wir aus (B.6) das Fresnel-Integral (siehe auch Gleichung (5.4)) ∞
∫ −∞
dx i a x2 +ibx 1 −i b2 e 2 = e 2a . √2πi √a
(B.11)
Die analytische Fortsetzung (B.10) lässt sich analog in den Gleichungen (B.8) und (B.9) durchführen. Dies liefert ∞
∫ −∞ ∞
∫ −∞
a 2 dx x ei 2 x = 0 √2π
b2 dx 2 i a x2 +ibx 1 b2 = (1 − i ) e−i 2a . x e 2 3/2 a √2π (−ia)
Die eindimensionalen Gauß- bzw. Fresnel-Integrale, (B.3) bzw. (B.11), lassen sich un mittelbar auf mehrdimensionale Integrale (d. h. auf Integrale über mehrdimensiona le Räume) verallgemeinern. Für ein Gauß-Integral über den Raum ℝn , dessen (reelle) kartesische Koordinaten x k , k = 1, 2, . . . , n sind, gilt
n n dx m exp [− 12 ∑ x k a kl x l + ∑ b k x k ] m=1 √2π k=1 ] [ k,l=1 n
∫∏
n
= (det(a))−1/2 exp [ 12 ∑ b k (a−1 )kl b l ] , ] [ k,l=1
(B.12)
wobei a kl = a lk eine symmetrische Matrix ist, deren Eigenwerte positiven Realteil be sitzen. Ferner bezeichnet a−1 das Inverse und det(a) die Determinante dieser Matrix. Der Beweis der Beziehung (B.12) erfolgt durch Diagonalisierung der symmetrischen Matrix a kl , wobei (B.12) sich auf n Integrale der Form (B.6) reduziert. Die oben betrachteten Gauß-Integrale lassen sich unmittelbar auf komplexe Va riablen z = x + iy verallgemeinern: I=∫
dz∗ dz exp [−az∗ z + (ζ ∗ z + z∗ ζ)] , 2πi
(B.13)
508 | B Gauß-Integrale wobei ζ = α + iβ ebenfalls eine komplexe Zahl ist. Die Integration erstreckt sich hier über Real- und Imaginärteil. Mit der Jacobi-Determinante zur Variablentransformati on (x, y) → (z∗ , z), ∂(z∗ , z) 1 1 ∂(x, y) = −i i = 2i , finden wir
∂(z∗ , z) dz∗ dz = dxdy = 2idxdy . ∂(x, y)
(B.14)
Drücken wir in (B.13) die komplexen Variablen durch ihre Real- und Imaginärteile aus, erhalten wir unter Verwendung von (B.14) ∞
I= ∫ −∞ ∞
= ∫ −∞
∞
dx dy exp [−a(x2 + y2 ) + 2αx + 2βy] ∫ √π √π −∞
∞
dx −ax2 +2αx dy −ay2+2βy e e ∫ . √π √π −∞
Dies sind zwei gewöhnliche reelle Gauß-Integrale über den Real- bzw. Imaginärteil, die sich mittels Gleichung (B.6) berechnen lassen. Drücken wir das Resultat wieder durch die komplexe Variable ζ = α + iβ aus, finden wir ∫
dz∗ dz 1 1 exp [−az∗ z + (ζ ∗ z + z∗ ζ)] = exp [ ζ ∗ ζ ] . 2πi a a
(B.15)
Dieses Ergebnis lässt sich unmittelbar auf mehrdimensionale komplexe Gauß-Integra le verallgemeinern. Für die Integration über den Raum ℂn mit komplexen Koordinaten z k = x k + iy k , k = 1, z, . . . , n findet man
n
∫∏ m=1
n n dz∗k dz k exp [− ∑ z∗k A kl z l + ∑ (ζ k∗ z k + z∗k ζ k )] 2πi k=1 ] [ k,l=1 n
=(det A)−1 exp [ ∑ ζ k∗ (A−1 )kl ζ l ] . ] [k,l=1
(B.16)
Hierbei ist A eine hermitesche Matrix und die ζ k sind komplexe Variablen. Durch Dia gonalisierung von A lässt sich dieses Integral auf ein Produkt von n eindimensionalen komplexen Gauß-Integralen (B.15) zurückführen.
C Funktionen von Operatoren C.1 Definition Funktionen von Operatoren können wir prinzipiell durch ihre Taylor-Reihen ∞
f(A) = ∑ n=0
1 (n) f (0)A n = f(0) + f (0)A + 12 f (0)A2 + . . . n!
(C.1)
definieren. Die hierbei auftretenden Potenzen eines Operators A sind durch wieder holte Anwendung des Operators wohldefiniert, vorausgesetzt, der Wertebereich von A ist im Definitionsbereich von A enthalten. Dies ist offenbar in trivialer Weise erfüllt, wenn A auf dem gesamten Hilbert-Raum definiert ist, was jedoch nicht notwendig ist. Damit sind sämtliche Operationen einer Funktion von Operatoren auf die entspre chenden Operationen der Operatoren selbst zurückgeführt. Hat die Reihenentwick lung der betrachteten Funktion f(x) einen Konvergenzradius r < ∞, so ist die Konver genz von (C.1) für alle beschränkten Operatoren A mit ‖A‖ < r gesichert. Für hermitesche Operatoren A† = A lässt sich die Taylor-Reihe (C.1) explizit auf summieren. Dazu beachten wir, dass ihre Eigenfunktionen A|n⟩ = a n |n⟩
(C.2)
eine vollständige orthogonale Basis des entsprechenden Hilbert-Raumes und des halb, bei geeigneter Normierung, ein Orthonormalsystem ⟨n|m⟩ = δ(n, m)
(C.3)
bilden. Es gilt dann die Spektraldarstellung des Operators (10.48): A=∑ ∫ |n⟩a n ⟨n| . n
Setzen wir diese für die Potenzen von A in der Taylor-Entwicklung (C.1) ein, so erhalten wir unter Benutzung der Orthonormalität (C.3) nach Aufsummation der Taylor-Reihe f(A) = ∑ ∫ |n⟩f(a n )⟨n| . n
Damit lässt sich jede Funktion eines hermiteschen Operators durch die entsprechende Funktion seiner Eigenwerte ausdrücken. Falls zwei Operatoren A und B miteinander kommutieren, [A, B] = 0,̂ so gilt dies auch für Funktionen dieser Operatoren f(A) und g(B): [f(A), g(B)] = 0̂ . https://doi.org/10.1515/9783110586022-025
(C.4)
510 | C Funktionen von Operatoren
Der Beweis folgt unmittelbar aus der Taylor-Entwicklung der Operatorfunktionen. Des Weiteren folgt aus (C.4) für hermitesche Operatoren A, B mit [A, B] = 0, dass f(A) und g(B) gemeinsame Eigenfunktionen besitzen, selbst dann, wenn f(A) oder g(B) oder beide keine hermiteschen Operatoren sind. Der Beweis ergibt sich aus den in Abschnitt 10.5 angegebenen Eigenschaften von hermiteschen Operatoren und TaylorEntwicklung der Operatorfunktionen.
C.2 Variation Wir interessieren uns für die Variation oder Ableitung einer Operatorfunktion f(A). Im Allgemeinen wird die Variation eines Operators δA nicht mit dem Operator kommu tieren: [δA, A] ≠ 0 . In diesen Fällen ist zu beachten, dass δf(A) ≠ f (A) δA ≠ δA f (A) . Um die Variation einer Funktion solcher Operatoren zu finden, müssen wir dann auf ihre Taylor-Entwicklung (C.1) zurückgreifen. Wir betrachten die Variation oder das Dif ferenzial einer Operatorfunktion. Aus ihrer Taylor-Entwicklung folgt durch Anwen dung der Produktregel δf(A) = f (0) δA + 12 f (0)(A δA + δA A) + . . . . Für beliebige Operatorfunktionen f(A) lässt sich die entstehende Reihe i. A. nicht wie der geschlossen aufsummieren. In einigen Fällen ist dies jedoch möglich bzw. lassen sich die Variationen δf(A) durch Parameterintegrale in geschlossener Form ausdrü cken. Wichtige Beispiele hierfür sind: 1. Die Exponentialfunktion f(x) = e x : 1
δ (e A ) = ∫ dλ e λA δA e(1−λ)A .
(C.5)
0
Diese Beziehung lässt sich unmittelbar durch Taylor-Entwicklung der Exponenten auf beiden Seiten der Gleichungen beweisen. Falls [δA, A] = 0,̂ vereinfacht sich die Beziehung (C.5) zu: δ (e A ) = δA e A = e A δA . 2.
Der Logarithmus f(x) = ln x: ∞
δ(ln A) = ∫ dλ(λ + A)−1 δA(λ + A)−1 0
(C.6)
C.2 Variation | 511
Zum Beweis dieser Beziehung betrachten wir zunächst das Integral Λ
∫ 0
dλ Λ = ln(λ + A)0 = ln(Λ + A) − ln A , λ+A
wobei λ eine reelle Variable ist. Im Limes Λ → ∞ geht der erste Term gegen eine vom Operator A unabhängige divergente Konstante, die jedoch bei der Differen ziation wegfällt. Deshalb gilt die folgende Beziehung: ∞
δ(ln A) = −δ ∫ 0
dλ . λ+A
(C.7)
Den Integranden in Gleichung (C.7) entwickeln wir in eine Taylor-Reihe 1 1 1 1 A A 2 = = [1 − + ( ) + . . . ] . λ + A λ 1 + A/λ λ λ λ Anwendung der Produktregel liefert 1 λ+A A A A A 2 A A 2 1 = − 2 [δA − (δA + δA) + (δA ( ) + δA + ( ) δA) − . . . ] λ λ λ λ λ λ λ δ
=−
A A 2 A 2 A 1 − + + − . . . δA − [1 ( ( ) ) −...] ] [1 λ λ λ λ λ2
=−
A −1 A −1 1 (1 + δA (1 + ) ) λ λ λ2
= − (λ + A)−1 δA (λ + A)−1 . Einsetzen dieses Ergebnisses in Gleichung (C.7) liefert die gewünschte Bezie hung (C.6). Die obigen Beziehungen (C.5) und (C.6) basieren nur auf der Produktregel und blei ben deshalb auch richtig, wenn wir statt der Variation δA das Differenzial dA oder die Ableitung nach einer Variablen bilden, von denen der Operator A abhängt. Der Opera tor A hänge parametrisch von einer Variablen x ab, A = A(x). In diesem Fall erhalten wir nach „Division“ von Gleichung (C.5) und (C.6) durch dx die Beziehungen 1
d A(x) dA(x) (1−λ)A(x) = ∫ dλ e λA(x) , e e dx dx
(C.8)
0 ∞
d dA(x) ln A(x) = ∫ dλ (λ + A(x))−1 (λ + A(x))−1 . dx dx 0
(C.9)
512 | C Funktionen von Operatoren
Man beachte: Bei den obigen Beziehungen (C.5) und (C.6) bzw. (C.8) und (C.9) haben wir lediglich von der Produktregel (Leibniz-Regel) Gebrauch gemacht. Diese Regel gilt auch für Kommutatoren. Deshalb bleiben die obigen Beziehungen auch richtig, wenn wir statt des Differenzials den Kommutator mit einem zweiten Operator B bilden: 1
[B, e ] = ∫ dλ e λA [B, A]e(1−λ)A . A
(C.10)
0 ∞
[B, ln A] = ∫ dλ (λ + A)−1 [B, A](λ + A)−1 . 0
Durch Variablensubstitution (1 − λ) → λ lassen sich die zu Gleichungen (C.8) und (C.10) äquivalenten Beziehungen 1
d A(x) dA(x) λA(x) e e = ∫ dλ e(1−λ)A(x) , dx dx 0
(C.11)
1
[B, e A ] = ∫ dλ e(1−λ)A [B, A]e λA 0
gewinnen, bei denen im Exponenten die Positionen von λ und (1 − λ) vertauscht sind.
C.3 Nützliche Operatoridentitäten Häufig treten Funktionen von Summen von zwei oder mehr Operatoren, f(A + B + . . . ) ,
(C.12)
auf, die nicht miteinander kommutieren. Gesucht ist die Wirkung des Ausdruckes (C.12) auf die Eigenfunktionen eines der Operatoren, z. B. A. Ohne Beschränkung der Allgemeinheit genügt es, Funktionen von zwei nicht kommutierenden Operatoren zu betrachten. Ferner können wir voraussetzen, dass diese Funktionen eine Fourierbzw. Laplace-Darstellung f(A + B) = ∫ dτ e τ(A+B) f ̃(τ) besitzen, wobei τ reell für die Laplace- bzw. rein imaginär für die Fourier-Transforma tion ist. Es genügt damit, Exponentialfunktionen E(τ) = e τ(A+B)
(C.13)
C.3 Nützliche Operatoridentitäten
| 513
zu betrachten. Für die Anwendung dieses Ausdruckes auf Eigenfunktionen von A ist es zweckmäßig, diese Operatorfunktion in der Form E(τ) = e τB K(τ)e τA
(C.14)
zu schreiben, wobei K(τ) den gesamten Effekt der Nichtkommutativität von A und B enthält. Falls die beiden Operatoren miteinander kommutieren, [A, B] = 0,̂ folgt offensichtlich K(τ) = 1.̂ Zur Bestimmung von K(τ) leiten wir zunächst eine Differenzialgleichung für diese Größe ab. Differenziation von Gleichung (C.13) und (C.14) nach τ liefert: (A + B)E(τ) = BE(τ) + e τB K (τ)e τA + E(τ)A , wobei sich der Term BE(τ) aufhebt. Multiplikation dieser Gleichung von links mit e−τB und von rechts mit e−τA liefert die gesuchte Differenzialgleichung K (τ) = e−τB Ae τB K(τ) − K(τ)A .
(C.15)
Aus Gleichung (C.13) und (C.14) folgt ferner, dass K(τ) der Anfangsbedingung K(τ = 0) = 1̂
(C.16)
genügt. Durch Taylor-Entwicklung finden wir: ∞
(−τ)n [B, [B, . . . , [B , A] . . . ]] . n! ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ n=0 n
e−τB Ae τB = ∑
(C.17)
Dieser Ausdruck ist vollständig durch die Kommutatoren von B und A gegeben. So bald für ein n der Vielfachkommutator eine c-Zahl ist, verschwinden sämtliche hö here Kommutatoren, was eine explizite Lösung der Differenzialgleichung (C.15) ge stattet. Falls z. B. der Kommutator [A, B] bereits eine c-Zahl ist, vereinfacht sich der Ausdruck (C.17) zu e−τB Ae τB = A − τ[B, A] , und die Differenzialgleichung (C.15) reduziert sich auf: K (τ) = [A, K(τ)] − τ[B, A]K(τ) .
(C.18)
Da die Größe K(τ) eine Funktion allein des Kommutators [A, B] ist, dieser aber wie hier angenommen eine c-Zahl ist, muss K(τ) selbst eine c-Zahl sein, und somit verschwin det der erste Ausdruck auf der rechten Seite der Gleichung (C.18). Damit vereinfacht sich die Differenzialgleichung zu K (τ) = −τ[B, A]K(τ) ,
514 | C Funktionen von Operatoren
deren Lösung mit der Anfangsbedingung (C.16) durch 1
K(τ) = e− 2 τ
2
[B,A]
gegeben ist. Einsetzen dieses Ausdruckes in (C.14) liefert die Glauber-Formel 1
e τ(A+B) = e τB e− 2 τ
2
[B,A] τA
e
,
(C.19)
die oftmals auch als Baker-Campbell-Hausdorff-Formel bezeichnet wird. Durch zwei malige Anwendung dieser Formel folgt: e τA e τB = e τB e τA e−τ
2
[B,A]
.
(C.20)
Analog lässt sich folgende Beziehung für beliebige Operatoren A, B beweisen, e τA e τB = exp {τ(A + B) +
τ3 1 τ2 [A, B] + ( [[A, B], B] + 2! 3! 2
1 2
[A, [A, B]]) + . . . } ,
(C.21) die sich auf (C.19) reduziert, falls [A, B] eine c-Zahl ist.
C.4 Die Green’sche Funktion des Laplace-Operators im ℝn Bei vielen theoretischen Überlegungen in der Quantenmechanik und auch in der Elek trodynamik benötigt man die Green’sche Funktion des Laplace-Operators ∆. Ihre Be rechnung liefert gleichzeitig ein Beispiel für die Benutzung von Funktionen von Ope ratoren. Bezeichnen wir die kartesischen Koordinaten des ℝn mit x i , i = 1, 2, . . . , n, so lautet der Laplace-Operator n ∂2 . ∆=∑ 2 i=1 ∂x i Da −∆ ein positiv-semidefiniter Operator ist, definiert man die Green’sche Funktion des Laplace-Operators durch (−∆)G(x, x ) = δ(x, x ) .
(C.22)
Hierbei bezeichnet x = x i e i einen Vektor des ℝn . Formal können wir die Green’sche Funktion durch Multiplikation von Gleichung (C.22) mit dem inversen Operator (−∆)−1 erhalten: G(x, x ) = (−∆)−1 δ(x, x )
(C.23)
C.4 Die Green’sche Funktion des Laplace-Operators im ℝn
|
515
bzw. in der Dirac’schen bracket-Notation G(x, x ) = ⟨x (−∆)−1 x ⟩ .
(C.24)
Die Äquivalenz von den Gleichungen (C.24) und (C.23) zeigt man leicht, indem man im Matrixelement auf der rechten Seite von Gleichung (C.24) vor dem inversen LaplaceOperator die Vollständigkeitsrelation der Impulseigenzustände, dn k 1̂ = ∫ |k⟩⟨k| , (2π)3
⟨x|k⟩ = e ikx ,
einsetzt und die Fourier-Darstellung der δ-Funktion benutzt: dn k (2π)3 dn k =∫ (2π)3 dn k =∫ (2π)3
G(x, x ) = ∫
⟨x (−∆)−1 k⟩ ⟨k|x ⟩ 1 ⟨x|k⟩⟨k|x ⟩ k2 1 ik(x−x) e = (−∆)−1 δ(x, x ) . k2
Benutzen wir die Operatoridentität ∞
A
−1
= ∫ dτe−τA 0
für den Laplace-Operator, so erhalten wir für seine Green’sche Funktion (C.24) ∞
G(x, x ) = ∫ dτ ⟨x e−τ(−∆) x ⟩ .
(C.25)
0
Der Integrand wird als Wärmekern bezeichnet, da er als Lösung der Diffusionsglei chung in der Thermodynamik auftritt. Diese Größe lässt sich sehr einfach durch Fou rier-Transformation berechnen: dn k ⟨x e−τ(−∆) x ⟩ = ∫ ⟨x e−τ(−∆) k⟩ ⟨k|x ⟩ (2π)n d n k −τk2 ik⋅(x−x ) e e =∫ (2π)n 1 n/2 (x − x )2 =( ) exp (− ) . 4πτ 4τ Einsetzen dieses Ergebnisses in (C.25) liefert ∞
1 n/2 (x − x )2 G(x, x ) = ( ) ∫ dτ τ−n/2 exp (− ) . 4π 4τ
0
516 | C Funktionen von Operatoren
Um den Exponenten zu vereinfachen, führen wir die Variablensubstitution s=
1 , τ
dτ = −
durch, was
ds s2
∞
G(x, x ) = (
1 2 1 n/2 ) ∫ dss n/2−2 e−s 4 (x−x ) 4π
0
liefert. Der Integrand ist divergent an der unteren Integrationsgrenze. Diese Divergenz ist jedoch integrabel für n > 2. Um den Fall n = 2 mit behandeln zu können, schneiden wir das Integral an der unteren Integrationsgrenze mittels eines kleinen Abschneide parameters μ ab und erhalten die regularisierte Green’sche Funktion ∞
G μ (x, x ) = (
s 2 1 n/2 ) ∫ dss n/2−2 e− 4 (x−x) . 4π
μ
Es empfiehlt sich zur dimensionslosen Integrationsvariablen z=
1 s(x − x )2 4
überzugehen. Dies liefert G μ (x, x ) = (
n/2−1 1 n/2 4 ] ) [ 2 4π (x − x )
∞
∫
dzz n/2−2 e−z .
(C.26)
μ 2 4 (x−x )
Das verbleibende Integral lässt sich durch die unvollständige Γ-Funktion ∞
Γ(α, x) = ∫ dzz α−1 e−z
(C.27)
x
ausdrücken, die für α > 0 im Limes x → 0 in die normale Γ-Funktion (16.52) übergeht: Γ(α, x = 0) = Γ(α) ,
α>0.
Mit (C.27) erhalten wir aus (C.26) G μ (x, x ) =
n/2−1 μ 1 1 n [ ] Γ ( − 1, (x − x )2 ) . 2 n/2 2 4 (x − x ) 4π
Für n = 3 können wir den Limes μ → 0 nehmen und erhalten mit Γ ( 12 ) = √π
(C.28)
C.4 Die Green’sche Funktion des Laplace-Operators im ℝn
| 517
das bekannte Resultat G(x, x ) =
1 . 4π|x − x|
(C.29)
Für n = 2 müssen wir μ als Regulator behalten, den wir jedoch beliebig klein wählen können. Für x → 0 und α = 0 besitzt die unvollständige Γ-Funktion Γ(α, x) (C.27) die asymptotische Form Γ(0, x) = − ln x + γ , x → 0 , wobei γ = 0,57721 . . . die Euler’sche Konstante ist. Unter Benutzung dieses Ergeb nisses finden wir aus (C.28) für die Green’sche Funktion in n = 2 Dimensionen μ 1 ln (x − x )2 + γ 4π 4 1 ln |x − x | + const. . =− 2π
G(x, x ) = −
Bei der Differenziation fällt die Konstante heraus, und wir finden daher in n = 2 Di mensionen die Beziehung ∆ ln |x − x | = 2πδ(x − x ) . Diese Beziehung zeigt, dass in zwei Dimensionen bei Abwesenheit von singulären Po tenzialen vom Typ der δ-Funktion die Wellenfunktion in der Nähe des Koordinatenur sprungs kein logarithmisches Verhalten besitzen kann.
D Basiselemente der Variationsrechnung D.1 Definition von Funktionalen und ihren Variationsableitungen Eine reelle Funktion f(x) einer reellen Variablen x ist eine Abbildung von ℝ nach ℝ: f: ℝ→ℝ,
x → f(x) .
Eine reelle Funktion mehrerer reeller Variablen x1 , x2 , . . . , x N f(x) ≡ f(x1 , x2 , . . . x N ) ist eine Abbildung f : ℝN → ℝ . Ein Funktional ist eine Verallgemeinerung der Funktion auf unendlich viele (kontinu ierliche) Variablen. Unter einem Funktional versteht man eine Abbildung eines Funktio nenraumes auf die Menge der reellen oder komplexen Zahlen. Sei 𝕄 ein Funktionenraum, z. B. ein Hilbert-Raum, und die Funktion φ(x) ein Ele ment dieses Raumes. Ein reelles Funktional F[φ] auf diesem Raum definiert die Abbil dung¹ F : 𝕄 → ℝ , φ → F[φ] . Die erste Variation (das Differenzial) einer Funktion mehrerer Variablen, df(x) = f(x + dx) − f(x) = ∑ i
lässt sich in der Form df(x) = [
∂f(x) dx i , ∂x i
df(x + εdx) ] dϵ ε=0
darstellen, was sich unmittelbar durch Benutzung der Kettenregel zeigen lässt. Dieser Ausdruck lässt sich direkt auf die Variation von Funktionalen verallgemeinern. Die erste Variation δF[φ] eines Funktionals F[φ] wird definiert durch:
δF[φ] = [
∂ . F[φ + ε δφ]] ∂ε ε=0
(D.1)
1 Wir werden den Begriff des Funktionals im verallgemeinerten Sinn verwenden und zusätzlich noch Abhängigkeiten von diskreten und kontinuierlichen Variablen zulassen. Damit können wir eine Funk tion selbst als Funktional betrachten, z. B. F[φ](x) = φ(x). https://doi.org/10.1515/9783110586022-026
D.1 Definition von Funktionalen und ihren Variationsableitungen
| 519
Aus dieser Definition ist ersichtlich, dass die erste Variation δF[φ] linear in den Än derungen δφ(x) der Funktion ist,² d. h., es gilt: δF[φ] = ∫ dx F [φ](x) δφ(x) , wobei F [φ](x) ein Funktional von φ(x) ist, welches jedoch unabhängig von δφ(x) ist. Dieses Funktional wird als erste Variationsableitung³ von F[φ] nach φ(x) bezeichnet und in der Form δF[φ] F [φ](x) ≡ δφ(x) geschrieben. Damit ist die erste Variationsableitung δF[φ]/δφ(x) durch die Beziehung δF[φ] = [
δF[φ] ∂ F[φ + ε δφ]] δφ(x) = ∫ dx ∂ε δφ(x) ε=0
(D.2)
definiert. Da δφ(x) beliebig ist, wird die Variationsableitung durch die obige Bezie hung eindeutig definiert. In analoger Weise sind die höheren Variationsableitungen definiert. So ist z. B. die zweite Variation über δ2 F[φ] = [
δ2 F[φ] ∂2 F[φ + ε δφ]] = ∫ dx dx δφ(x) δφ(x ) ) 2 δφ(x) δφ(x ∂ε ϵ=0
(D.3)
definiert. Zur Illustration betrachten wir das einfache Funktional F[φ] =
1 2
∫ dx (φ(x))2 .
(D.4)
Aus der Definition (D.2) erhalten wir für die erste Variation dieses Funktionals: δF[φ] = [ 12
∂ ∫ dx [φ(x) + ε δφ(x)]2 ] ∂ε ε=0
= [∫ dx [φ(x) + ε δφ(x)]δφ(x)]
ε=0
δF[φ] δφ(x) = ∫ dx φ(x) δφ(x) = ∫ dx δφ(x) !
und somit für seine erste Variationsableitung δF[φ] = φ(x) . δφ(x)
2 Dies erkennt man sofort, wenn man F[φ + ε δφ] ≡ f(ε) in eine Taylor-Reihe nach Potenzen von ε entwickelt, diese nach ε differenziert und anschließend ε = 0 setzt. 3 Die Variationsableitung wird oftmals auch als Funktionalableitung bezeichnet.
520 | D Basiselemente der Variationsrechnung
Eine stetige Funktion φ(x) lässt sich selbst als Funktional betrachten, F[φ](x) = φ(x) ,
(D.5)
das von einer Variablen x abhängt. Berechnen wir für dieses Funktional die erste Variationsableitung nach der Definition (D.2), so erhalten wir: δF[φ](x) = [
∂ = δφ(x) . (φ(x) + ε δφ(x))] ∂ε ε=0
(D.6)
Nach Gleichung (D.2) lässt sich die erste Variation dieses Funktionals (D.5) ausdrü cken als: δF[φ](x) = ∫ dx
δF[φ](x) δφ(x) δφ(x ) = ∫ dx δφ(x ) . δφ(x ) δφ(x )
(D.7)
Vergleich der letzten beiden Beziehungen (D.6) und (D.7) zeigt: δφ(x) = δ(x − x ) . δφ(x )
(D.8)
Dies ist die Verallgemeinerung der Beziehung ∂x i = δ ik ∂x k für kartesische Koordinaten, wenn man beachtet, dass die δ-Funktion das Analo gon des Kronecker-Deltas für kontinuierliche „Indizes“ (Variablen) ist. Neben den stetigen Funktionen lassen sich natürlich auch die Ableitungen der ste tig differenzierbaren Funktionen als Funktionale betrachten. Zum Beispiel für die erste Ableitung dφ(x) F[φ] = = φ (x) dx finden wir mithilfe von (D.8): δφ (x) d δφ(x) d = = δ(x − x ) . δφ(x ) dx δφ(x ) dx
(D.9)
Es sei f(φ) eine differenzierbare Funktion von φ. Für die Variationsableitung des Funktionals F[φ] = f(φ(x)) erhalten wir aus der Definition (D.2) analog zur gewöhnlichen Differenzialrechnung die Kettenregel δf(φ(x)) df δφ(x) df = = δ(x − x ) . δφ(x ) dφ δφ(x ) dφ
(D.10)
D.1 Definition von Funktionalen und ihren Variationsableitungen | 521
Hieraus finden wir für die Variationsableitung von F[φ] = ∫ dxf(φ(x)) unmittelbar df δf(φ(x)) df δF[φ] ) = , = ∫ dx = ∫ dx δ(x − x δφ(x ) δφ(x ) dφ dφ φ=φ(x) vorausgesetzt x liegt im Integrationsgebiet. Für ein Funktional F von zwei Funktionen ψ(x) und φ(x), F = F[φ, ψ] , ist die erste Variation nach Gleichung (D.1) durch δF[φ, ψ] = [
∂ F[φ + ε δφ, ψ + ε δψ]] ∂ε ε=0
(D.11)
gegeben. Nach den Regeln der Differenziation gilt: [
∂ = F[φ + ε δφ, ψ + ε δψ]] ∂ε ε=0 [[
∂ ∂ + . F[φ + ε δφ, ψ]] F[φ, ψ + ε δψ]] ∂ε ∂ε ε=0 ε=0
Nach Gleichung (D.2) gilt für festgehaltenes φ(x): [
δF[φ, ψ] ∂ = ∫ dx F[φ, ψ + ε δψ]] δψ(x) ∂ε δψ(x) ε=0
und analog für festgehaltenes ψ(x): [
∂ δF[φ, ψ] = ∫ dx F[φ + ε δφ, ψ]] δφ(x) . ∂ε δφ(x) ε=0
Deshalb finden wir schließlich: δF[φ, ψ] = ∫ dx (
δF[φ, ψ] δF[φ, ψ] δφ(x) + δψ(x)) . δφ(x) δψ(x)
Als Beispiel hierzu betrachten wir das Funktional F[φ, ψ] = ∫ dx φ(x)ψ(x) , für welches nach (D.8) offenbar δF[φ, ψ] = ψ(x) , δφ(x)
δF[φ, ψ] = φ(x) δψ(x)
522 | D Basiselemente der Variationsrechnung
und somit δF[φ, ψ] = ∫ dx [ψ(x) δφ(x) + φ(x) δψ(x)] gilt. Dasselbe Ergebnis erhalten wir auch unmittelbar aus der Definition (D.11): δF[φ, ψ] = [
∂ ∫ dx [φ(x) + ε δφ(x)][ψ(x) + ε δψ(x)]] ∂ε ε=0
= [∫ dx [δφ(x) ψ(x) + φ(x) δψ(x) + 2ε δφ(x) δψ(x)]]
ε=0
= ∫ dx [ψ(x) δφ(x) + φ(x) δψ(x)] . Wir setzen jetzt in den obigen Betrachtungen ψ(x) = φ (x). Für die Variationsablei tung des Funktionals F[φ] = f(φ(x), φ (x)) erhalten wir dann mit (D.10) und (D.9) δf(φ(x), φ (x)) ∂f δφ(x) ∂f δφ (x) = + δφ(x ) ∂φ δφ(x ) ∂φ δφ(x ) =
∂f ∂f d δ(x − x ) + δ(x − x ) . ∂φ ∂φ dx
Hieraus finden wir für das Funktional F[φ] = ∫ dxf(φ(x), φ (x))
(D.12)
die Variationsableitung ∂f d δF[φ] ∂f = ∫ dx ( δ(x − x ) + δ(x − x )) δφ(x ) ∂φ ∂φ dx =
d ∂f ∂f (x ) . (x ) − ∂φ dx ∂φ
(D.13)
Die klassische Wirkung (3.9) ist ein Funktional der Form (D.12), und das Ver schwinden ihrer ersten Variationsableitung (D.13) liefert die Euler-Lagrange-Glei chung (3.11).
D.2 Regeln der Variationsableitung Aus den Definitionen der Variationsableitungen der Funktionale als Differenziation (nach ε, siehe Gleichungen (D.2), (D.3)) folgt, dass sie lineare Operationen sind, für die analoge Regeln wie für die Differenziation gelten:
D.2 Regeln der Variationsableitung
1.
| 523
Produktregel: δF[φ] δG δ (F[φ]G[φ]) = G[φ] + F[φ] . δφ(x) δφ(x) δφ(x)
2.
(D.14)
Kettenregel für Funktionale: δF[ψ[φ]] δψ[φ](y) δF[ψ[φ]] = ∫ dy . δφ(x) δψ[φ](y) δφ(x)
3.
Kettenregel für Funktionen von Funktionalen f(F[φ]): δF[φ] df(F) δf(F[φ]) = . δφ(x) dF F=F[φ] δφ(x)
4.
(D.15)
Quotientenregel (die unmittelbar aus Gleichung (D.14) und (D.15) folgt): 2 δ F[φ] δF[φ] 1 δG[φ] 1 ( )= − F[φ] ( ) . δφ(x) G[φ] δφ(x) G[φ] δφ(x) G[φ]
5.
Schwarz’scher Vertauschungssatz: δ δ δ δ F[φ] = F[φ] . δφ(x) δφ(x ) δφ(x ) δφ(x)
Die oben angegebenen Regeln wollen wir nun anhand einiger Beispiele illustrieren. Als erstes Beispiel betrachten wir das Funktional F[φ] = (φ(x))n . Unter Benutzung der Kettenregel (D.15) finden wir für dieses Funktional unmittel bar: δF[φ](x) δ(φ(x))n δφ(x) = = n(φ(x))n−1 = n(φ(x))n−1 δ(x − x ) . δφ(x ) δφ(x ) δφ(x ) Für die zweite Variationsableitung des elementaren Funktionals (D.5) erhalten wir: δ δ2 φ(x) = δ(x − x ) = 0 . δφ(x ) δφ(x ) δφ(x ) In analoger Weise findet man unter Benutzung der Kettenregel: δ2 (φ(x))2 δ =2 [φ(x) δ(x − x )] = 2δ(x − x )δ(x − x ) . δφ(x ) δφ(x ) δφ(x ) Als abschließendes Beispiel betrachten wir das häufig in der Feldtheorie auftreten de Funktional F[φ] = ∫ dx φ n (x) ,
524 | D Basiselemente der Variationsrechnung
dessen erste Variationsableitung durch δF[φ] = n(φ(x))n−1 δφ(x) gegeben ist.
D.3 Funktional über einen Hilbert-Raum Ist der Funktionenraum 𝕄 ein Hilbert-Raum ℍ, so lässt sich auf einfache Art die Bezie hung der Variationsableitung zu den gewöhnlichen partiellen Ableitungen herstellen. In einem Hilbert-Raum existiert ein vollständiges orthonormales Funktionensystem ψ i (x) ≡ ⟨x|i⟩ ,
ψ∗i (x) = ⟨i|x⟩
(D.16)
mit der Orthonormalitätsbeziehung ∫ dx ψ∗i (x)ψ k (x) = ∫ dx ⟨i|x⟩⟨x|k⟩ = δ ik
(D.17)
und der Vollständigkeitsrelation ∑⟨x|i⟩⟨i|x ⟩ = ∑ ψ i (x)ψ∗i (x ) = δ(x − x ) i
(D.18)
i
bzw. in koordinatenfreier Darstellung: ∑ |i⟩⟨i| = 1̂ . i
Daher können wir eine beliebige Funktion φ(x) entwickeln gemäß: φ(x) = ⟨x|φ⟩ = ∑⟨x|i⟩⟨i|φ⟩ = ∑ ψ i (x)φ i , i
(D.19)
i
wobei die Koeffizienten φ i = ⟨i|φ⟩ = ∫ dx ⟨i|x⟩⟨x|φ⟩ = ∫ dx ψ∗i (x)φ(x) die Koordinaten der Funktion φ(x) in der Basis (D.16) sind. Die Variation der Funktion φ(x) lässt sich jetzt aufgrund von Gleichung (D.19) unmittelbar durch die Variation der „Koordinaten“ δφ i ausdrücken: δφ(x) = ∑ ψ i (x)δφ i . i
Aus der Orthonormalitätsbedingung (D.17) folgt: δφ i = ∫ dx ψ∗i (x)δφ(x) .
(D.20)
D.3 Funktional über einen Hilbert-Raum
| 525
Benutzen wir die Zerlegung der Funktion φ(x) des Hilbert-Raumes nach den (fest ge wählten) Basisfunktionen ψ i (x) (siehe Gleichung (D.19)), so wird aus dem Funktional F[φ] eine Funktion der abzählbar unendlich vielen Variablen (Koordinaten) φ i . Damit gelingt es, Funktionale von Funktionen, die über einem Hilbert-Raum definiert sind, in gewöhnliche Funktionen von (abzählbar unendlich vielen) Variablen zurückzufüh ren, und das Variationskalkül kann durch das Kalkül der gewöhnlichen partiellen Ab leitungen ausgedrückt werden. So erhalten wir für die erste Variation δF[φ] = δF(φ i ) = ∑ i
∂F δφ i ∂φ i
∂F =∑ ∫ dx ψ∗i (x) δφ(x) ∂φ i i !
= ∫ dx
δF[φ] δφ(x) , δφ(x)
woraus wir die Beziehung ∂F(φ k ) ∗ δF[φ] ψ i (x) =∑ δφ(x) ∂φ i i
(D.21)
gewinnen. Damit ist die erste Variationsableitung auf die gewöhnlichen partiellen Ab leitungen zurückgeführt. In ähnlicher Weise lassen sich die höheren Variationsablei tungen durch die partiellen Ableitungen ausdrücken, z. B. erhalten wir für die zweite Variationsableitung in analoger Weise: δ2 F[φ] ∂2 F =∑ ψ∗ (x)ψ∗j (x) . δφ(x) δφ(x ) i,j ∂φ i ∂φ j i
(D.22)
Aus der Äquivalenz von Variationsableitung und partiellen Ableitungen nach den „Koordinaten“ φ i können wir auch die funktionale Taylor-Entwicklung gewinnen: F[φ + δφ] = F(φ k + δφ k ) = F(φ k ) + ∑ i
∂F δφ i + ∂φ i
1 2
∑ i,j
∂2 F δφ i δφ i + ⋅ ⋅ ⋅ . ∂φ i ∂φ j
(D.23)
Setzen wir hier für die Variationen der Koordinaten δφ i Gleichung (D.20) ein und be nutzen die Definition der Variationsableitungen (D.21) und (D.22), so lässt sich die Tay lor-Entwicklung (D.23) des Funktionals F[φ] in der Form
F[φ + δφ] = F[φ] + ∫ dx
δF[φ] δφ(x) + δφ(x)
1 2
∫ dx dx
δ2 F[φ] δφ(x) δφ(x ) + . . . δφ(x) δφ(x ) (D.24)
526 | D Basiselemente der Variationsrechnung
schreiben. Für infinitesimale δφ(x) können wir die Taylor-Entwicklung nach dem li nearen Term abbrechen und erhalten für die Variation von F[φ]: δF[φ] = F[φ + δφ] − F[φ] = ∫ dx
δF[φ] δφ(x) δφ(x)
in Übereinstimmung mit Gleichung (D.2). Abschließend wollen wir mittels der obigen Hilbert-Raum-Formulierung nochmal die elementare Beziehung (D.8) ableiten, d. h., wir betrachten das Funktional (D.5). Aus Gleichung (D.21) erhalten wir: ∂ δφ(x) =∑ (∑ ψ k (x)φ k ) ψ∗i (x ) δφ(x ) ∂φ i i k = ∑ ∑ ψ k (x)δ ik ψ∗i (x ) i
k
= ∑ ψ i (x)ψ∗i (x ) = δ(x − x ) , i
wobei wir die Zerlegung (D.19) und die Vollständigkeitsrelation (D.18) benutzt haben.
Stichwortverzeichnis Abweichung – mittlere quadratische 51 Alternative – exklusive 11 – interferierende 11 Anschlussbedingung 119 Antikommutator 236 antilinear 192 Aufenthaltswahrscheinlichkeitsdichte 49 Austrittsarbeit 185 Baker-Campbell-Hausdorff-Formel 514 Balmer-Serie 393 Banach-Raum 199 Besetzungszahldarstellung 256 Besetzungszahloperator 254 Bessel-Funktion 339 – sphärische 360, 362 Bessel’sche Differenzialgleichung 337 – sphärische 360 Bessel’sche Ungleichung 198 Bilinearform 192 Bloch’sches Theorem 276 Bloch-Welle 276 Bohr’scher Atomradius 386 Bohr’sches Atommodell 76 Bohr-Sommerfeld’sche Quantisierungsbedingung 70 bracket-Notation 211 bra-Vektor 211 Brillouin-Zone 287 Casimir-Operator 405 Cauchy-Folge 195 Clebsch-Gordan-Koeffizient 331 Coriolis-Wechselwirkung 483 Coulomb-Eichung 471 Coulomb-Potenzial 382 Dämpfungsglied 500 Darstellung – irreduzible 312 de Broglie-Quantisierungsbedingung 75 δ-Funktion 62, 144, 495 Diamagnetismus 473 Dichteoperator 112 Dirac, Paul 29 https://doi.org/10.1515/9783110586022-027
Dirac-Notation 208 diskretes Spektrum – der eindimensionalen Schrödinger-Gleichung 134 Dispersionsbeziehung 286 Doppelspaltexperiment 6 Drehimpuls 303 Drehimpulsoperator 303, 315 Drehimpulsquantenzahl 311 Dreiecksrelation 332 Dreiecksungleichung 194 Ehrenfest-Theorem 102, 106 Eigenenergie 94 Eigenfunktion 55, 205 Eigenraum 206 Eigenschaften – der Schrödinger-Gleichung 99 – des Kommutators 56 – hermitescher Operatoren 215 Eigenvektor 205 Eigenwert 189, 205 Eigenwerte – hermitescher Operatoren 215 Eigenzustand 55, 189 – hermitescher Operatoren 215 Einheitsvektor – sphärischer 320 Energiebänder 286 Energieeigenzustand 94 Entartungsgrad 206 – des zweidimensionalen rotationssymmetrischen Oszillators 346 Erhaltung der Energie 105 Erhaltung der Norm 104 Erhaltungsgröße 104 Erwartungswert 50 – des Impulses 105 – des Ortes 105 Erwartungswerte – hermitescher Operatoren 215 Erzeugungsoperator 252 Euler-Lagrange-Gleichung 24 Euler’sche Gammafunktion 350 Fabry-Perot-Interferometer 164 Faraday’sches Induktionsgesetz 462
528 | Stichwortverzeichnis
Feldemission 184 Feynman R. 29 Floquet-Index 275 Fresnel-Integral 507 Funktion – homogene 108 Funktional 200, 518 Funktionalintegral 29 Gauß’scher Satzes 103 Gauß-Integral 505 gebundenen Zustände – des endlichen Potenzialtopfes 166 Glauber-Formel 514 Green’sche Funktion – der Schrödinger-Gleichung 100 – des Laplace-Operators 514 Grenzwert – einer Folge 195 Grundpostulat der Quantentheorie 12 Gruppengeschwindigkeit 47 Halbleiter 291 Hamilton-Jacobi’sche Differenzialgleichung 67 Hamilton-Operator 98 Hankel-Funktion 340 Hauptquantenzahl 377 Hauptwert 503 Heavyside-Funktion 501 Heisenberg’sche Unschärferelation 15 Heliumatom 444 Hermite-Funktionen 260 Hermite-Polynome 260 Hilbert-Basis 196 Hilbert-Raum 191, 198 Hilbert-Vektor 197 Impuls – kanonischer 464 – kinetischer 465 Impulsoperator 53, 55 – in der Ortsdarstellung 218 Impulsraum 51 Integrationsmaß – funktionales 29 Interferenz 5 Ionisationsarbeit 394 Isolator 291
Jacobi-Identität 56 Jönssen, Claus 6 Kern – eines Operators 202 ket-Vektor 211 Knotensatz 135 Kommutator 54 Kommutator-Algebra 107 Kontinuitätsgleichung 113 Koordinaten – sphärische 319 Kronig-Penney-Potenzial 284 Kugelflächenfunktion 326 Kugelfunktion 326 Kugelkoordinate 319 Kugelwelle 369 Kustaanheimo-Stiefel-Transformation 409 Lagrange-Funktion 24 Laguerre-Funktion 394 Laguerre-Polynom 394 Landau-Niveau 479 Landé-Faktor 472 Laplace-Operator 514 Legendre-Funktion 327 – zugeordnete 350 Legendre-Polynome 327 Leiteroperator 251, 308 Lie-Algebra – der Gruppe O(4) 404 Lorentz-Heavyside-Maßsystem 462 Lorentz-Kraft 465 Lyman-Serie 393 Mächtigkeit 196 Masse – reduzierte 384 Materiewellen 46, 51 Matrixdarstellung 315 – linearer Operatoren 206 Messung – der Observablen 227 Metalle 291 Mittelpunktsvorschrift 490 Möbius-Band 300 Möllenstedt, Gottfried 6 Moment – magnetisches 301, 472
Stichwortverzeichnis
Näherung – semiklassische 69 Neumann-Funktion 340 – sphärische 360, 362 Newton’sche Bewegungsgleichung 24 Norm 193 Norm des Operators 204 Nullvektor 191 Observable 227 Operator 200 – adjungierter 201 – beschränkter 204 – hermitescher 201, 219 – inverser 202 – linearer 200 – selbstadjungierter 201 – stetiger 205 – unitärer 203, 206 Operatornorm 204 Orbital 387 Orthogonalprojektor 222 Orthogonalsysteme – vollständige 196 Orthonormalsystem – vollständiges 197 Ortsoperator 55 Oszillator – axialsymmetrischer harmonischer 343 – dreidimensionaler harmonischer 262, 374 – harmonischer 240, 247, 250 – isotroper harmonischer 264, 373 – vierdimensionaler harmonischer 412 Oszillatorlänge 248, 374 Parallelogrammgleichung 195 Paramagnetismus 472 Parität 139 Paritätsoperator 139 Paschen-Serie 393 Pauli-Matrizen 317, 318, 407 Pfadintegral 29 Phasenapproximation – stationäre 57 Phasengeschwindigkeit 46 Phasenraumdarstellung – des Propagators 30 Planck’sches Wirkungsquantum 27 Poisson-Formel 72, 78, 93
|
Poisson-Klammer 107 Polarkoordinaten – dreidimensionale 319 Potenzial – axialsymmetrisches 335 – reflexionsfreies 432 Potenzialbox – sphärisch symmetrische 370 Potenziale – kugelsymmetrische 355 – sphärisch symmetrische 357 Potenzialkante – unendlich hohe 81 Potenzialtopf – rechteckiger 74 – unendlich hoher 89, 141 Produkt – direktes 224 – dyadisches 214 – inneres 192 Projektionsoperator 221 Propagator – bei Anwesenheit einer unendlich hohen Potenzialwand 82 – eines freien Teilchens 32 Punktspektrum 205 Quantenzahl – magnetische 311 Quasiimpuls 276 Radialfunktion 356 Raum – antilinearer 210 – dualer 209 – linearer 191 – normierter 199 – semilinearer 210 Raumquantisierung 313 Rayleigh-Schrödinger-Störungstheorie 440 Reflexionskoeffizient 152 Reflexionsstrom 152 Reihe – konfluente hypergeometrische 379 Relativkoordinate 383 Residuensatz 78 Resonanzen 164 Richtungsableitung 124 Riesz’scher Darstellungssatz 210
529
530 | Stichwortverzeichnis
Ritz’sches Variationsverfahren 449 Runge-Lenz-Vektor 398 Rydberg-Konstante 387 Säkulargleichung 442 Satz von Hellinger und Toeplitz 215 Satz von Wielandt und Wintner 205 Schrödinger-Gleichung 96, 98 – eindimensionale 127 – stationäre 101 – zeitabhängige 96 Schwankungsquadrat – mittleres 51 Schwarz’sche Ungleichung 193 Schwarz’scher Vertauschungssatz 523 Schwerpunktskoordinate 383 Schwingungsquant 254 separabel 199 Separationsansatz 264 Sesquilinearform 192 Skalarprodukt 192 SO(4)-Gruppe 404 Sommerfeld’sche Feinstrukturkonstante 387 Spektraldarstellung 216 Spektrum 205 – des harmonischen Oszillators 253 – kontinuierliches 205 Spiegelladung 86 Spin 300 Spur 208 Spurklasse 208 Standardabweichung 51 stationäre – Phasenapproximation 57 Stern-Gerlach-Experiment 475 Stokes’scher Integralsatz 121 Störungstheorie 436 Strahl 227 Streuung – am Potenzialtopf 159 – an einer Potenzialstufe 147 Stromdichte 113 Stufenoperator 251 SU(2)-Lie-Algebra 306 Summe – direkte 224 Superpositionsprinzip 7, 99 Superpotenzial 424
Teilchendichte 112 Teilchen-Welle-Dualismus 1, 6 Tensorprodukt 223 Totalreflexion – frustrierte innere 175 Translationsoperator 274 Transmissionskoeffizient 152, 163, 166 Transmissionsstrom 152 Tunneleffekt 174 Übergangsamplitude 19 Überlappungsintegral 198 Unschärferelation 236, 255 – für Drehimpulskomponenten 307 Unschärferelation-Energie-Zeit 237 Unschärferelation-Ort-Impuls 237 Variationsableitung 519 Vektor – dualer 209 Vektorpotenzial 462 Vektorraum – komplexer 191 Vernichtungsoperator 252 Verträglichkeit – von Observablen 230 Virialsatz – quantenmechanischer 108, 109 vollständige orthogonale Basis 216 Vollständiger Satz – kommutierender Observablen 234 Vollständigkeitsrelation 213 Wahrscheinlichkeitsamplitude 6, 16 Wahrscheinlichkeitsdichte 49, 112 Wärmekern 515 Wellenfunktion 38 – des Grundzustandes 136 – im Impulsraum 52 – im klassisch verbotenen Bereich 76 – stationäre 69 Wellenpaket 43, 46, 51 Wirkung 24 – kanonische Form 68 Wronskian 134 Zeeman-Effekt 475 Zentralpotenzial 355 Zentrifugalpotenzial 356 Zerlegungssatz 20, 121
Stichwortverzeichnis
Zustand – kohärenter 267 – quantenmechanischer 235 Zustände – gebundene 131 – stationäre 101 Zustandsreduktion 228 Zyklotronfrequenz 478 Zylinderfunktion 340 Zylinderkoordinate 335
|
531