182 111 6MB
German Pages 620 Year 2020
Hugo Reinhardt Quantenmechanik 2 De Gruyter Studium
Weitere empfehlenswerte Titel Quantenmechanik 1 Pfadintegralformulierung und Operatorformalismus Hugo Reinhardt, 2018 ISBN 978-3-11-058595-7, e-ISBN: 978-3-11-058602-2, e-ISBN (EPUB) 978-3-11-058647-3 Quantenelektrodynamik kompakt Karl Schilcher, 2019 ISBN 978-3-11-048858-6, e-ISBN: 978-3-11-048859-3, e-ISBN (EPUB) 978-3-11-048860-9
Quantenmechanik Band 1 Claude Cohen-Tannoudji, Bernard Diu, Franck Laloë, 2019 ISBN 978-3-11-062600-1, e-ISBN (PDF) 978-3-11-063873-8, e-ISBN (EPUB) 978-3-11-063930-8 Quantenmechanik Band 2 Claude Cohen-Tannoudji, Bernard Diu, Franck Laloë, 2019 ISBN 978-3-11-062609-4, e-ISBN (PDF) 978-3-11-063876-9, e-ISBN (EPUB) 978-3-11-063933-9 Quantenchemie Eine Einführung Michael Springborg, 2017 ISBN 978-3-11-050079-0, e-ISBN (PDF) 978-3-11-050080-6, e-ISBN (EPUB) 978-3-11-049813-4
Hugo Reinhardt
Quantenmechanik 2
| Pfadintegralformulierung und Operatorformalismus 2. Auflage
Autor Prof. Dr. Hugo Reinhardt Eberhard-Karls-Universität Inst. für theoretische Physik Auf der Morgenstelle 14 72076 Tübingen
ISBN 978-3-11-058596-4 e-ISBN (PDF) 978-3-11-058607-7 e-ISBN (EPUB) 978-3-11-058649-7 Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2020 Walter de Gruyter GmbH, Berlin/Boston Umschlaggestaltung: Studio-Pro / DigitalVision Vectors / Getty Images Satz: le-tex publishing services GmbH, Leipzig Druck und Bindung: CPI books GmbH, Leck www.degruyter.com
| Meiner Mutter
Vorwort zur 2. Auflage Die 2. Auflage wurde in großen Teilen komplett überarbeitet. Auch die Themenanord nung wurde teilweise verändert, um eine noch kohärentere Darstellung des Stoffs zu erreichen. Einige Themen sind in der neuen Auflage ausführlicher behandelt, wie z. B. die Quantentheorie des starren Körpers, die in vielen Bereichen, insbesondere in der Atom- und Kernphysik, benötigt wird. Die Wärmestrahlung, die in der ersten Auflage im einleitenden Kapitel über historische Experimente zur Entstehung der Quantenme chanik besprochen wurde, ist jetzt in das Kapitel Quantenstatistik eingearbeitet. Neu aufgenommen wurden die Vielteilchen-Green’schen Funktionen und deren erzeugen des Funktional sowie die zeitabhängige Hartree-Fock-Theorie. Das Layout wurde komplett überarbeitet und an die neuen Vorgaben des Verlags angepasst. Wichtige Gleichungen sind eingerahmt, wichtige Aussagen farbig hinter legt und bei besonderer Bedeutung zusätzlich mit dem Icon versehen. Beweise sind durch ein , Kommentare durch ein gekennzeichnet. Tübingen, im Juni 2019 Hugo Reinhardt
https://doi.org/10.1515/9783110586077-201
Vorwort zur 1. Auflage Dieses Lehrbuch gibt eine moderne Darstellung des Stoffs, der typischerweise Gegen stand der Vorlesung Quantenmechanik II ist. Schwerpunkte des Buchs sind neben den Symmetrien, der Streutheorie und der relativistischen Quantenmechanik vor allem die Vielteilchentheorie einschließlich der Quantenstatistik. Ausführlich wird die Zwei te Quantisierung behandelt. Die statistischen Ensembles werden aus dem Prinzip der maximalen Entropie abgeleitet. Aufgenommen wurde auch die Berry-Phase, in deren Kontext der Bohm-Aharonov-Effekt erklärt wird. Wie schon in Band 1 wird neben dem traditionellen Operatorformalismus auch die Pfad- oder Funktionalintegralbeschrei bung entwickelt, die bisher noch recht wenig Einzug in die Standardkursvorlesungen gefunden hat, aber eine Reihe von konzeptionellen und praktischen Vorzügen besitzt. Detailliert wird deshalb die Funktionalintegralbeschreibung von Bose- und FermiSystemen ausgearbeitet, die den unmittelbaren Einstieg in die Quantenfeldtheorie er möglicht. Große Sorgfalt wird auf Verständlichkeit gelegt: Bei den mathematischen Ab leitungen werden sämtliche erforderlichen Teilschritte angegeben, sodass das Buch auch zum Selbststudium geeignet ist. Wesentliche Formeln sind besonders markiert, Nebenrechnungen sowie erläuternde Bemerkungen sind grau hinterlegt. Erstmals benutzte Fachbegriffe sowie wichtige Textpassagen sind kursiv gedruckt. Einige Kapi tel bzw. Unterkapitel, die für ein Verständnis des restlichen Stoffs nicht unmittelbar notwendig sind und deshalb bei einer ersten Lektüre übergangen werden können, sind mit einem Stern * gekennzeichnet. Zur einfacheren Referenzierung der Kapitel wurden diese fortlaufend von Band 1 nummeriert. Wie schon im Band 1 wird in diesem Buch durchgängig das in der Quantenfeld theorie übliche Heaviside-Lorentz-Maßsystem benutzt, das eine Reihe von Vorteilen bietet. In Abweichung von den Gepflogenheiten der Quantenfeldtheorie wird aus di daktischen Gründen jedoch ℏ und c nicht auf Eins gesetzt. Das vorliegende Buch ist aus Skripten zu Vorlesungen entstanden, die der Au tor an der TU Dresden und vor allem an der Universität Tübingen gehalten hat. Allen Studenten, die durch ihre konstruktive Kritik zur Verbesserung des Buchs beigetra gen haben, sei an dieser Stelle gedankt, auch wenn sie nicht alle namentlich erwähnt werden können. Das gesamte Manuskript wurde von Herrn Marco Herbst aus der Sicht eines Studenten hinsichtlich Verständlichkeit gelesen. Neben zahlreichen Hinweisen zum Inhalt hat er sehr zur Vereinheitlichung der Notation beigetragen. Einige Abbil dungen wurden von Dr. Davide Campagnari und Priv. Doz. Dr. Markus Quandt angefer tigt. Das LaTeX-Manuskript inklusive Abbildungen wurde von meiner Sekretärin, Frau Ingrid Estiry, erstellt. Ihnen allen sei für ihre mühevolle Arbeit und ihr Engagement gedankt. Mein besonderer Dank gilt Herrn Priv. Doz. Dr. Markus Quandt und Herrn Dr. Davide Campagnari, die das gesamte Manuskript gelesen haben und durch zahl
https://doi.org/10.1515/9783110586077-202
VIII | Vorwort zur 1. Auflage
reiche wertvolle Hinweise und Kommentare zur Verbesserung des Buchs beigetragen haben. Schließlich sei dem Verlag für die aufgebrachte Geduld und die angenehme Zusammenarbeit gedankt. Tübingen, im August 2013 Hugo Reinhardt
Inhaltsübersicht Band 1 1 Teilchen-Welle-Dualismus 2 Der Einfluss der Messung 3 Die Wahrscheinlichkeitsamplitude 4 Die Wellenfunktion 5 Der klassische Grenzfall 6 Unendlich große Potenzialsprünge 7 Die Schrödinger-Gleichung 8 Die eindimensionale stationäre Schrödinger-Gleichung 9 Eindimensionale Streuprobleme 10 Mathematische Grundlagen der Quantenmechanik 11 Axiomatische Quantenmechanik 12 Der harmonische Oszillator 13 Periodische Potenziale: Das BänderModell des Festkörpers 14 Drehimpuls und Spin (Heuristische Behandlung)
Band 2 23 Zeitentwicklung 24 Zeitabhängige Prozesse 25 Streutheorie 26 Symmetrien 27 Starre Körper 28 Relativistische Quantenmechanik 29 Adiabatische Beschreibung: Die Berry-Phase 30 Vielteilchensysteme 31 Die Zweite Quantisierung 32 Quantenstatistik 33 Kohärente Boseund Fermi-Zustände
https://doi.org/10.1515/9783110586077-203
15 Der Drehimpuls 16 Axialsymmetrische Potenziale 17 Kugelsymmetrische Potenziale (Zentralpotenziale) 18 Das Wasserstoff-Atom 19 Algebraischer Zugang zur Quantenmechanik 20 Störungstheorie 21 Das Ritz’sche Variationsverfahren 22 Geladenes Teilchen im elektro magnetischen Feld A Die Dirac’sche δ-Funktion B Gauß-Integrale C Funktionen von Operatoren D Basiselemente der Variations rechnung
34 Wick’sches Theorem, Green’sche Funktionen und Erzeugendes Funktional* 35 Pfadintegralbeschreibung von Vielteilchensystemen 36 Theorie der Supraleitung E Grundzüge der Gruppentheorie F Zweite Quantisierung G Komplexe Gauß-Integrale H (Anti-)Periodische Funktionen und Matsubara-Summen
Inhalt Vorwort zur 2. Auflage | VI Vorwort zur 1. Auflage | VII Inhaltsübersicht | IX 23 Zeitentwicklung | 1 23.1 Der Zeitentwicklungsoperator | 1 23.2 Explizite Darstellung des Zeitentwicklungsoperators | 4 23.3 Das Heisenberg-Bild | 9 23.3.1 Erhaltungsgrößen | 12 23.3.2 Bewegungsgleichungen im Heisenberg-Bild | 12 23.4 Das Wechselwirkungsbild | 13 23.5 Zeitabhängige Störungstheorie | 17 23.6 Formale Aufsummation der Störreihe | 20 23.7 Zeitabhängige Störungstheorie im Pfadintegralzugang: Feynman-Diagramme | 22 23.8 Die Green’sche Funktion der Schrödinger-Gleichung | 29 23.8.1 Zeitabhängige und stationäre Green’sche Funktion | 29 23.8.2 Die Green’sche Funktion des freien Teilchens | 32 24 Zeitabhängige Prozesse | 36 24.1 Übergänge infolge einer äußeren Störung | 36 24.2 Störreihe für die Übergangsamplitude | 37 24.3 Fermis Goldene Regel | 39 24.3.1 Zeitlich begrenzte Störung | 39 24.3.2 Instantanes Ein- bzw. Ausschalten der Störung | 41 24.3.3 Periodische Störung | 50 25 Streutheorie | 52 25.1 Der Streuprozess | 53 25.2 Streuung eines Wellenpakets am Potenzial | 56 25.3 Stationäre Streutheorie: Die Lippmann-Schwinger-Gleichung | 60 25.4 Die Streuamplitude | 62 25.5 Der Wirkungsquerschnitt | 64 25.6 Die Born’sche Näherung | 67 25.6.1 Streuung am Yukawa-Potenzial | 70 25.6.2 Streuung am Coulomb-Potenzial | 72
Inhalt | XI
25.7 25.7.1 25.7.2 25.7.3 25.8 25.8.1 25.8.2 25.8.3 25.8.4 25.9 25.10 25.11 25.11.1 25.11.2 25.11.3 25.11.4 25.11.5 25.11.6
Die Streumatrix | 73 Die S-Matrix | 74 Die T -Matrix | 76 Das optische Theorem | 78 Streuung am Zentralpotenzial: Partialwellenzerlegung | 80 Partialwellenzerlegung der Streufunktion | 80 Die Streuphase | 81 Partialwellenzerlegung des Streuquerschnitts | 86 Konvergenz der Partialwellenzerlegung | 87 Hartkugelstreuung | 88 Erklärung der Schattenstreuung | 96 Streuung am Potenzialtopf | 101 Die Streuphasen | 102 Resonanzstreuung | 106 Die s-Streuung am Potenzialtopf | 112 Levinson-Theorem | 113 Die Streulänge | 117 Streuung am kugelsymmetrischen Potenzialberg | 119
26 Symmetrien | 121 26.1 Euklidische Koordinatentransformationen | 121 26.2 Symmetrietransformationen | 126 26.3 Kontinuierliche Symmetrietransformationen | 127 26.4 Translation des Raums | 129 26.5 Drehungen | 130 26.5.1 Der Drehoperator | 131 26.5.2 Matrixdarstellung des Drehoperators | 134 26.5.3 Das Drehverhalten von Observablen: Skalare, Vektoren und Tensoren | 137 26.5.4 Passive Drehung | 141 26.5.5 Teilchen im rotierenden Bezugssystem: Die Coriolis-Wechselwirkung | 146 26.6 Diskrete Symmetrien | 150 26.6.1 Raumspiegelung | 150 26.6.2 Zeitumkehr | 151 26.7 Innere Symmetrien | 153 26.8 Eichsymmetrien | 156 27 Starre Körper | 161 27.1 Darstellung der Drehung durch Euler-Winkel | 163 27.1.1 Der Drehoperator | 164 27.1.2 Die Drehmatrix | 168
XII | Inhalt
27.2 27.2.1 27.2.2 27.3 27.3.1 27.3.2 27.4 27.4.1 27.4.2
Die Wigner’schen D-Funktionen | 169 Explizite Darstellung | 172 Eigenschaften | 174 Die Drehimpulse des starren Körpers | 178 Darstellung der Drehimpulsoperatoren im Raum der D-Funktionen | 180 Euler-Winkel-Darstellung der Drehimpulsoperatoren | 183 Rotation eines starren Körpers | 186 Symmetrischer Kreisel | 187 Asymmetrischer Kreisel | 189
28 Relativistische Quantenmechanik | 194 28.1 Relativistische Kinematik | 194 28.2 Lagrange- und Hamilton-Formulierung | 197 28.3 Elektromagnetische Felder | 201 28.4 Die Klein-Gordon-Gleichung | 208 28.5 Die Dirac-Gleichung | 213 28.6 Die Lösungen der freien Dirac-Gleichung | 216 28.6.1 Stationäre Dirac-Gleichung | 216 28.6.2 Kovariante Dirac-Gleichung | 219 28.7 Der Drehimpuls des Dirac-Teilchens | 224 28.8 Ladung im Magnetfeld | 227 28.9 Nichtrelativistischer Limes der Dirac-Gleichung | 233 28.10 Elektron im Coulomb-Potenzial | 237 28.10.1 Punktmasse im Zentralpotenzial | 237 28.10.2 Lösung der Dirac-Gleichung für das Coulomb-Potenzial | 241 29 Adiabatische Beschreibung: Die Berry-Phase | 251 29.1 Adiabatische Prozesse | 251 29.2 Die adiabatische Näherung | 253 29.3 Die Berry-Phase | 256 29.3.1 Die geometrische Phase | 256 29.3.2 Das Berry-Potenzial | 258 29.3.3 Das induzierte Magnetfeld | 261 29.4 Spin im homogenen Magnetfeld | 263 29.4.1 Das Berry-Potenzial | 263 29.4.2 Das induzierte Magnetfeld | 265 29.5 Der Bohm-Aharonov-Effekt | 272 29.5.1 Elektron im Magnetfeld einer sehr dünnen Spule | 272 29.5.2 Interpretation des Bohm-Aharonov-Effekts mittels der Berry-Phase | 274 29.5.3 Pfadintegralbeschreibung des Bohm-Aharonov-Effekts | 277
Inhalt |
29.6 29.6.1 29.6.2 29.6.3
Pfadintegralableitung der Berry-Phase | 280 Pfadintegralbeschreibung der langsamen Freiheitsgrade | 280 Adiabatische Näherung im Pfadintegral | 283 Mechanische Interpretation der Berry-Phase | 285
30 Vielteilchensysteme | 287 30.1 Unterscheidbare Teilchen | 287 30.2 Identische Teilchen | 289 30.3 Permutationen | 291 30.4 Zwei identische Teilchen | 294 30.5 Systeme identischer Teilchen | 296 30.6 Spin-Statistik-Theorem | 299 30.7 Observablen von Systemen identischer Teilchen | 301 30.8 Fermi-Systeme | 303 30.8.1 Slater-Determinanten | 303 30.8.2 Zwei identische Fermionen mit Spin 1/2 | 305 30.9 Das Helium-Atom | 310 30.9.1 Das ungestörte Helium-Spektrum | 311 30.9.2 Einschluss der Coulomb-Wechselwirkung | 314 30.10 Die Hartree-Fock-Methode | 315 30.10.1 Hartree-Näherung | 316 30.10.2 Hartree-Fock-Näherung | 320 30.11 Das ideale Fermi-Gas | 323 30.12 Die Thomas-Fermi-Näherung | 330 31 Zweite Quantisierung | 336 31.1 Identische Teilchen | 336 31.2 Besetzungszahldarstellung | 338 31.3 Der harmonische Oszillator als ein Ensemble von Phononen | 341 31.4 Der Fock-Raum | 342 31.5 Bosonen | 344 31.6 Fermionen | 347 31.7 Operatoren | 351 31.7.1 Einteilchenoperatoren | 352 31.7.2 Zweiteilchenoperatoren | 356 31.7.3 Nützliche Operatorbeziehungen | 357 31.7.4 Das Wick’sche Theorem | 360 31.8 Die Ortsdarstellung | 361 31.8.1 Feldoperatoren | 361 31.8.2 Die Dichtematrix | 366 31.9 Fermi-Systeme | 368 31.9.1 Slater-Determinanten | 368
XIII
XIV | Inhalt
31.9.2 31.9.3
Das Quasiteilchen-Bild | 371 Das Thouless-Theorem | 374
32 Quantenstatistik | 378 32.1 Gemischte Zustände | 378 32.1.1 Der statistische Operator | 379 32.1.2 Der statistische Operator für einen Spin 1/2 | 381 32.1.3 Beziehung zu reinen Zuständen | 383 32.2 Statistische Ensembles | 385 32.2.1 Das Prinzip der maximalen Entropie | 385 32.2.2 Das kanonische Ensemble | 388 32.2.3 Das großkanonische Ensemble | 391 32.3 Das großkanonische Ensemble identischer Teilchen | 393 32.3.1 Fermi-Statistik | 396 32.3.2 Bose-Statistik | 397 32.3.3 Gibbs-Statistik | 400 32.3.4 Die Entropie identischer Teilchen | 401 32.4 Die Wärmestrahlung | 402 32.5 Approximation des mittleren Felds bei endlichen Temperaturen | 408 33 Kohärente Bose- und Fermi-Zustände | 414 33.1 Bose-Systeme | 414 33.1.1 Kohärente Bose-Zustände | 414 33.1.2 Darstellung des Fock-Raums | 417 33.2 Fermi-Systeme | 419 33.2.1 Der fermionische Oszillator | 419 33.2.2 Kohärente Fermi-Zustände und Graßmann-Variablen | 420 33.2.3 Differentiation und Integration für Graßmann-Variablen | 422 33.2.4 Darstellung des Fock-Raums | 426 33.2.5 Verallgemeinerung auf Fermi-Systeme mit mehreren Freiheitsgraden | 428 33.3 Beschreibung von Bose- und Fermi-Systemen mittels kohärenter Zustände | 431 33.3.1 Die Schrödinger-Gleichung in klassischen Variablen | 433 33.3.2 Das erzeugende Funktional | 437 33.3.3 Die Spur im Fock-Raum | 442 33.3.4 Ensemble-Mittel | 444 34
Wick’sches Theorem, Green’sche Funktionen und Erzeugendes Funktional | 447 34.1 Wick’sches Theorem | 447 34.1.1 Abstrakte Form des Wick’schen Theorems | 448
Inhalt | XV
34.1.2 34.1.3 34.2 34.2.1 34.2.2 34.2.3 34.2.4 34.3 34.3.1 34.3.2 34.3.3
Normal- und zeitgeordnetes Produkt sowie Kontraktion von Feldoperatoren | 452 Wick’sches Theorem für Feldoperatoren | 455 Green’sche Funktionen | 458 Feldoperatoren im Heisenberg- und Wechselwirkungsbild | 458 Vielteilchen-Green’sche Funktionen | 461 Die Einteilchen-Green’sche Funktion | 464 Zeitabhängige Hartree-Fock-Theorie | 465 Erzeugendes Funktional | 467 Heisenberg-Bild | 468 Wechselwirkungsbild | 469 Wick’sches Theorem für erzeugende Funktionale | 470
35 Pfadintegralquantisierung von Vielteilchensystemen | 477 35.1 Pfadintegraldarstellung der Übergangsamplitude | 478 35.1.1 Ableitung des Pfadintegrals | 478 35.1.2 Der Kontinuum-Limes: Glatte Pfade | 481 35.2 Pfadintegraldarstellung der großkanonischen Zustandssumme | 485 35.3 Pfadintegraldarstellung des erzeugenden Funktionals | 487 35.4 Nichtdifferenzierbare Pfade | 488 35.5 Funktionalintegraldarstellung der Eichtheorien | 494 36 Theorie der Supraleitung | 500 36.1 Paarkorrelationen: Die BCS-Wellenfunktion | 501 36.2 Variation der Energie | 506 36.3 Quasiteilchen | 510 36.4 Die Bogoljubov-Transformation | 512 36.4.1 Diagonalisierung des Hamilton-Operators | 514 36.4.2 Bestimmung der Wellenfunktionen | 516 36.5 Die Energielücke | 518 36.6 BCS-Theorie bei endlichen Temperaturen | 524 36.6.1 Bosonisierung | 525 36.6.2 Ableitung der Gap-Gleichung | 529 E E.1 E.2 E.3 E.4 E.5 E.6
Grundzüge der Gruppentheorie | 533 Grundlagen | 533 Kontinuierliche Gruppen | 536 Die Drehgruppe in N = 2 Dimensionen: SO(2) | 538 Die Gruppen O(N) und SO(N) | 539 Die Drehgruppe SO(3) | 542 Die Gruppe der unitären Matrizen U(N) und SU(N) | 544
XVI | Inhalt
E.7 E.7.1 E.7.2 E.8 E.9 E.10 E.10.1 E.10.2 E.11 E.11.1 E.11.2 E.12 E.12.1 E.12.2 E.12.3 E.12.4
Homomorphismus und Isomorphismus | 546 Der Isomorphismus U(1) ≃ SO(2) | 546 Der Homomorphismus SO(3) ∼ SU(2) | 548 Nicht-kompakte Gruppen: Die Lorentz-Gruppe | 550 Minimale Darstellung der Lorentz-Transformationen durch die Gruppe SL(2, ℂ) | 554 Die Poincaré-Gruppe | 557 Definition und Casimir-Operatoren | 557 Physikalische Bedeutung der Casimir-Operatoren | 558 Spinoren | 561 Spinor-Darstellung der O(N) | 562 Spinor-Darstellung der Lorentz-Gruppe | 564 Die Algebra einfacher und halbeinfacher Lie-Gruppen | 565 Gewichte und Wurzeln | 566 Leiteroperatoren | 567 Normalform der Algebra | 570 Gewichte und Wurzeln der speziellen unitären Gruppen SU(2) und SU(3) | 572
F F.1 F.1.1 F.1.2 F.2
Zweite Quantisierung | 578 Operatoren in der Zweiten Quantisierung | 578 Einteilchenoperatoren | 580 Zweiteilchenoperatoren | 581 Spuridentitäten im Fock-Raum | 583
G
Komplexe Gauß-Integrale | 587
H H.1 H.2
(Anti-)Periodische Funktionen und Matsubara-Summen | 592 (Anti-)Periodische δ-Funktionen | 592 Matsubara-Summen | 595
Stichwortverzeichnis | 599
23 Zeitentwicklung Unsere bisherigen Betrachtungen der Quantenmechanik basieren auf der Schrödin ger-Gleichung, die eine Wellengleichung ist. Deshalb wird dieser von Erwin Schrödin ger geprägte Zugang oftmals auch als Wellenmechanik bezeichnet. Eine alternative Formulierung der Quantenmechanik geht auf Werner Heisenberg zurück und wurde von ihm zusammen mit Max Born und Pascual Jordan ausgearbeitet. In dieser Formu lierung bleiben die Zustandsvektoren (Wellenfunktionen) zeitunabhängig und die Dy namik eines Systems wird durch zeitabhängige Operatoren beschrieben. Dies ist das sogenannte Heisenberg-Bild, das in Abschnitt 23.3 besprochen wird. Da in diesem Bild die gesamte Dynamik in den Operatoren steckt, die in einer diskreten Hilbert-Raum basis dargestellt als Matrizen erscheinen, wird dieser Zugang zur Quantenmechanik auch als Matrizenmechanik bezeichnet.
23.1 Der Zeitentwicklungsoperator Die Quantenmechanik ist eine kausale Theorie, die es gestattet, aus der Kenntnis eines Systems zu einem Zeitpunkt t0 das Verhalten zu einem späteren Zeitpunkt t > t0 vor herzusagen. Wie bereits in früheren Kapiteln erläutert, ist sie jedoch keine streng de terministische Theorie, sondern erlaubt nur Wahrscheinlichkeitsaussagen, welche in einer Wahrscheinlichkeitsamplitude, der Wellenfunktion, enthalten sind. Für die Wel lenfunktionen zu verschiedenen Zeiten muss deshalb ein kausaler Zusammenhang |ψ(t = t0 )⟩ → |ψ(t > t0 )⟩ bestehen. Wie wir bereits wissen, wird dieser Zusammenhang durch ein differenzielles Evolutionsgesetz, die zeitabhängige Schrödinger-Gleichung d |ψ(t)⟩ = H(t)|ψ(t)⟩ , dt beschrieben. Da diese Differenzialgleichung linear ist, muss es einen linearen Zusam menhang zwischen der Wellenfunktion zu verschiedenen Zeiten |ψ(t0 )⟩ und |ψ(t)⟩ geben, den wir in der Form iℏ
|ψ(t)⟩ = U(t, t0 )|ψ(t0 )⟩
(23.1)
schreiben können. Hierbei ist U(t, t0 ) ein linearer Operator, der offenbar die Zeit entwicklung der Wellenfunktion festlegt und deshalb als Zeitentwicklungsoperator bezeichnet wird. Die explizite Form dieses Operators wird durch die SchrödingerGleichung festgelegt. Setzen wir (23.1) in die zeitabhängige Schrödinger-Gleichung ein, so erhalten wir: iℏ
d U(t, t0 )|ψ(t0 )⟩ = H(t)U(t, t0 )|ψ(t0 )⟩ . dt
https://doi.org/10.1515/9783110586077-001
2 | 23 Zeitentwicklung Da diese Gleichung für beliebige Anfangszustände |ψ(t0 )⟩ gilt, folgt für den Zeitent wicklungsoperator das Evolutionsgesetz
iℏ
d U(t, t0 ) = H(t)U(t, t0 ) . dt
(23.2)
Damit ist U(t, t0 ) unabhängig vom Anfangszustand und allein durch den HamiltonOperator bestimmt. Der durch den Zeitentwicklungsoperator U vermittelte lineare Zu sammenhang (23.1) muss insbesondere auch zur Anfangszeit t = t0 gelten. Der Zeit entwicklungsoperator muss deshalb der Anfangsbedingung U(t0 , t0 ) = 1̂
(23.3)
genügen. Damit ist U(t, t0 ) eindeutig festgelegt. Bevor wir U(t, t0 ) explizit bestimmen, wollen wir einige Eigenschaften angeben, die bereits aus seiner Definition folgen: 1.
Der Zeitentwicklungsoperator U(t, t0 ) besitzt die Gruppeneigenschaft U(t2 , t1 )U(t1 , t0 ) = U(t2 , t0 ) ,
(23.4)
welche analog zum Zerlegungssatz (3.4) für Übergangsamplituden ist. Setzen wir t = t2 in (23.1), so erhalten wir |ψ(t2 )⟩ = U(t2 , t0 )|ψ(t0 )⟩ .
(23.5)
Zweimalige Anwendung der Definition von U(t, t0 ) liefert andererseits: |ψ(t2 )⟩ = U(t2 , t1 )|ψ(t1 )⟩ = U(t2 , t1 )U(t1 , t0 )|ψ(t0 )⟩ .
2.
Da der Anfangszustand |ψ(t0 )⟩ beliebig sein kann, liefert Vergleich mit (23.5) die gesuchte Beziehung (23.4). Bei Umkehrung der Zeitrichtung geht U in sein Inverses über, d. h. U −1 (t, t0 ) = U(t0 , t) .
(23.6)
In der Tat, setzen wir in (23.4) t2 = t0 , so erhalten wir unter Beachtung der Randbedingung (23.3): U(t0 , t)U(t, t0 ) = U(t0 , t0 ) = 1̂ , 3.
was U(t0 , t) als Inverses zu U(t, t0 ) definiert. U(t, t0 ) ist unitär, d. h. U −1 (t, t0 ) = U † (t, t0 ) ,
(23.7)
und wegen (23.6): U † (t, t0 ) = U(t0 , t) .
(23.8)
23.1 Der Zeitentwicklungsoperator
| 3
Der Beweis ergibt sich wieder unmittelbar aus der Definition von U(t, t0 ): Bil den wir das Adjungierte von Gl. (23.1), ⟨ψ(t)| = ⟨ψ(t0 )|U † (t, t0 ) , so lässt sich die Norm als ⟨ψ(t)|ψ(t)⟩ = ⟨ψ(t0 )|U † (t, t0 )U(t, t0 )|ψ(t0 )⟩
(23.9)
schreiben. Wie wir in Abschnitt 7.3.2 gesehen hatten, bleibt die Norm der Wel lenfunktion (als Lösung der zeitabhängigen Schrödinger-Gleichung) für belie bige zeitabhängige Hamilton-Operatoren erhalten, d. h. ⟨ψ(t)|ψ(t)⟩ = ⟨ψ(t0 )|ψ(t0 )⟩ . Die Gleichung (23.9) verlangt deshalb: U † (t, t0 )U(t, t0 ) = 1̂ ,
(23.10)
womit die Beziehung (23.7) bewiesen ist.
Ähnlich wie die Erhaltung der Norm folgt auch (23.10) unmittelbar aus der Schrödinger-Gleichung: Wegen der Anfangsbedingung (23.3) ist (23.10) richtig für t = t 0 . Da die rechte Seite von (23.10) un abhängig von t ist, bleibt nur noch zu zeigen, dass auch die linke Seite unabhängig von t ist. Dazu benutzen wir die Produktregel iℏ
d d d (U † (t, t 0 )U(t, t 0 )) = iℏ ( U † (t, t 0 )) U(t, t 0 ) + U † (t, t 0 )iℏ U(t, t 0 ) . dt dt dt
Einsetzen der Schrödinger-Gleichung (23.2) und ihres Adjungierten, − iℏ
d † U (t, t 0 ) = U † (t, t 0 )H(t) , dt
(23.11)
liefert unmittelbar das gewünschte Ergebnis d (U † (t, t 0 )U(t, t 0 )) = 0̂ . dt
Mit (23.8) erhalten wir aus (23.11) die Beziehung
−iℏ
d U(t0 , t) = U(t0 , t)H(t) . dt
(23.12)
4 | 23 Zeitentwicklung
23.2 Explizite Darstellung des Zeitentwicklungsoperators Für einen zeitunabhängigen Hamilton-Operator wird die zeitliche Entwicklung von U durch eine lineare Differenzialgleichung (23.2) mit konstanten (Operator-)Koeffizi enten gegeben. Die Lösung dieser Gleichung mit der Anfangsbedingung (23.3) lau tet: U(t, t0 ) = e− ℏ H(t−t 0) . i
(23.13)
Aus dieser expliziten Darstellung folgt sofort das Multiplikationsgesetz (Gruppen eigenschaft) (23.4) U(t2 , t1 )U(t1 , t0 ) = U(t2 , t0 ) . Beachten wir, dass der Hamilton-Operator hermitesch ist, so folgt aus dieser Darstel lung auch sofort, dass der Zeitentwicklungsoperator unitär sein muss, U † (t, t0 ) = e ℏ H(t−t 0) = U −1 (t, t0 ) i
= e− ℏ H(t 0−t) = U(t0 , t) , i
in Übereinstimmung mit unseren früher gefundenen Eigenschaften von U, die auch für zeitabhängige H(t) gültig sind. Für einen zeitabhängigen Hamilton-Operator stellt die den Operator U definieren de Evolutionsgleichung (23.2) eine Differenzialgleichung erster Ordnung mit zeitab hängigen (Operator-)Koeffizienten dar, die sich i. A. nicht in geschlossener Form lösen lässt. Wir betrachten deshalb zunächst infinitesimale Zeitintervalle. Für infinitesimal benachbarte Zeitargumente erhalten wir aus der Bewegungsglei chung des Zeitentwicklungsperators (23.2) bis auf Terme der Ordnung ε2 : U(t + ε, t0 ) = U(t, t0 ) + ε
d U(t, t0 ) dt
i = (1̂ − εH(t)) U(t, t0 ) ℏ = e− ℏ εH(t) U(t, t0 ) , i
d. h., für infinitesimale Zeitintervalle ε hat der Zeitentwicklungsoperator für zeitab hängige Hamilton-Operatoren dieselbe Gestalt wie für zeitunabhängige. Wir können deshalb den Zeitentwicklungsoperator für zeitabhängige H(t) explizit konstruieren, indem wir das endliche Zeitintervall in infinitesimal kleine Intervalle der Länge ε un terteilen: t − t0 = Nε ,
t k = t0 + kε .
23.2 Explizite Darstellung des Zeitentwicklungsoperators
|
5
Sukzessive Anwendung der obigen Beziehung liefert dann: U(t1 , t0 ) = U(t0 + ε, t0 ) = e− ℏ εH(t 0) , i
U(t2 , t0 ) = U(t1 + ε, t0 ) = e− ℏ εH(t 1) U(t1 , t0 ) i
= e− ℏ εH(t 1) e− ℏ εH(t 0) , i
U(t, t0 ) = U(t N , t0 )
(23.14)
.. .
.. .
.. .
i
= e− ℏ εH(t N−1) . . . e− ℏ εH(t 0) . i
i
Die einzelnen Exponenten der infinitesimalen Zeitevolution sind nach wachsendem Zeitargument angeordnet. Die Reihenfolge ist absolut wichtig, da die Operatoren H(t) zu verschiedenen Zeiten i. A. nicht kommutieren. Um diese Darstellung für U(t, t0 ) in eine kompaktere Form zu bringen, führen wir das sogenannte zeitgeordnete Produkt ein: Für zwei zeitabhängige Operatoren A(t) und B(t ) ist das zeitgeordnete Produkt T(A(t)B(t )) durch
A(t)B(t ) , { { { T(A(t)B(t )) = { 21 (A(t)B(t) + B(t)A(t)) , { { {B(t )A(t) ,
t > t t = t t
t von null verschieden ist. Sie beschreibt die Evolution des Quantensystems in positiver Zeitrichtung. α = 1: Dies liefert die avancierte oder akausale Green’sche Funktion G(−) (t, t ) =
i Θ(t − t)U(t, t ) , ℏ
welche nur für t < t von null verschieden ist und welche die Zeitentwicklung in die negative Zeitrichtung, d. h. von der Gegenwart in die Vergangenheit, be schreibt. Für zeitunabhängige Hamilton-Operatoren kann die Green’sche Funktion G(t, t ) we gen der Homogenität der Zeit¹⁰ nur von der Zeitdifferenz abhängen: G(t, t ) = G(t − t ) , was auch unmittelbar aus der expliziten Darstellung (23.54) ersichtlich ist, wenn man beachtet, dass für zeitunabhängige Hamilton-Operatoren der Zeitentwicklungsope rator durch i U(t, t ) = e− ℏ H(t−t ) 10 Homogenität der Zeit bedeutet, dass die physikalischen Gesetze invariant unter Zeittranslationen sind.
23.8 Die Green’sche Funktion der Schrödinger-Gleichung
|
31
gegeben ist. Es empfiehlt sich dann, eine Fourier-Transformation der Green’sche Funk tion bezüglich der Zeit vorzunehmen: ∞ i
G(E) = ∫ dτ e ℏ τE G(τ) . −∞
Unter Benutzung der Fourier-Darstellung der Θ-Funktion (siehe Gl. (A.23)) ∞
∞
−∞
−∞
dω e iωτ dω e iωτ = ± lim ℏ ∫ , Θ(±τ) = ± lim ∫ ̄ε→0 ε→0 2πi ω ∓ i ̄ε 2πi ℏω ∓ iε
ε = ℏ̄ε
(23.55)
erhalten wir¹¹ mit τ := t − t : ∞
∞
G(±) (E) = −i ∫ dτ ∫ −∞ ∞ (A.17)
−∞
= −ℏ ∫ dω −∞ ∞
= − ∫ dE −∞
i
dω e ℏ τ(ℏω+E−H) 2πi ℏω ∓ iε
δ(ℏω + E − H) , ℏω ∓ iε δ(E + E − H) , E ∓ iε
bzw. nach Ausführen der verbleibenden Integration: 1 (23.56) := (E − H ± iε)−1 . E − H ± iε Diese Darstellung der Green’schen Funktion, die auch als Resolvente des Operators H oder als stationäre Green’sche Funktion bezeichnet wird, werden wir des Öfteren, ins besondere bei der Entwicklung der Streutheorie benutzen. Die normierten Eigenfunktionen des Hamilton-Operators H, G(±) (E) =
H|n⟩ = E n |n⟩ , bilden ein vollständiges Orthonormalsystem: ⟨n|m⟩ = δ nm ,
1̂ = ∑ |n⟩⟨n| . n
Multiplizieren wir die Green’sche Funktion von rechts und links mit der Vollständig keitsrelation und benutzen die Eigenwertgleichung und Orthonormiertheit der Eigen funktionen, so erhalten wir die Spektraldarstellung G(±) (E) = ∑ |n⟩ n
1 ⟨n| , E − E n ± iε
11 Im Folgenden werden wir nicht immer den Limes ε → 0 explizit angeben, aber stets voraussetzen, dass er zu nehmen ist. Ferner werden wir in den formalen Manipulationen für const⋅ ε mit const > 0 gewöhnlich nur ε schreiben. In dieser Notation ist es nicht notwendig, zwischen ε und ̄ε zu unter scheiden, wie explizit in Gl. (23.55) getan.
32 | 23 Zeitentwicklung oder im Ortsraum mit ⟨x|n⟩ = φ n (x): G(±) (x, x ; E) ≡ ⟨x|G(±) (E)|x ⟩ = ∑ φ n (x) n
1 φ∗ (x ) . E − E n ± iε n
23.8.2 Die Green’sche Funktion des freien Teilchens Die Green’sche Funktion des freien Teilchens (±)
G0 (E) =
1 , E − H0 ± iε
H0 =
p̂ 2 , 2m
(23.57)
nimmt eine besonders einfache Form in der Impulsdarstellung an: (±)
(±)
G0 (k, k ; E) ≡ ⟨k|G0 (E)|k ⟩ =
1 ⟨k|k ⟩ , E − E k ± iε
(23.58)
wobei
(ℏk)2 . (23.59) 2m Für viele Anwendungen ist es bequem, die Green’sche Funktion in der Ortsdarstellung zu benutzen. Die Ortsraumdarstellung der (retardierten) Green’schen Funktion Ek =
(+)
(+)
G0 (x, x ; E) = ⟨x|G0 (E)|x ⟩ lässt sich aus ihrer Impulsraumdarstellung (23.58) durch Einfügen der Vollständig keitsrelation (10.53) d3 k 1̂ = ∫ |k⟩⟨k| (23.60) (2π)3 gewinnen. Mit ⟨x|k⟩ = e ik⋅x , ⟨k|k ⟩ = (2π)3 δ(k − k ) erhalten wir: (+)
d3 k d3 k (+) ∫ ⟨x|k⟩⟨k|G0 (E)|k ⟩⟨k |x ⟩ 3 (2π) (2π)3 1 d3 k ik⋅(x−x) . e =∫ 3 E − E k + iε (2π)
G0 (x, x ; E) = ∫
R
k ϑ
23.8 Die Green’sche Funktion der Schrödinger-Gleichung
|
33
Das verbleibende Impulsintegral lässt sich elementar ausführen. Dazu gehen wir zu Kugelkoordinaten (k, ϑ, φ) im Impulsraum über und legen die Polarachse (ϑ = 0) in Richtung von x − x =: R und erhalten mit R = |R|: (+)
G0 (x, x ; E) = (
2π
π
∞
0
0
0
e ikR cos ϑ 1 3 ) ∫ dφ ∫ dϑ sin ϑ ∫ dk k 2 . 2π E − E k + iε
Das φ-Integral ist trivial. Das ϑ-Integral liefert mit der Substitution z = cos ϑ: 1
∫ dz e ikRz = −1
e ikR − e−ikR . ikR
Für die Green’schen Funktionen finden wir damit: ∞
(+) G0 (x, x ; E)
∞
1 2 1 [ e ikR e−ikR ] =( ) ∫ dk k − ∫ dk k . 2π iR E − E k + iε E − E k + iε 0 [0 ]
Nehmen wir ferner im zweiten Integral eine Umbenennung der Integrationsvariablen k → (−k) vor, so erhalten wir schließlich: ∞
(+) G0 (x, x ; E)
1 2 1 e ikR =( ) ∫ dk k . 2π iR E − E k + iε
(23.61)
−∞
Das verbleibende k-Integral lässt sich mit Hilfe der Residuentheorie in der komple xen Ebene auswerten. Wegen R > 0 können wir den Integrationsweg in der oberen komplexen Halbebene schließen, ∞
∫ dk
→
∮
dk ,
−∞
denn der Beitrag vom Integral über den Halbkreis verschwindet, da der Integrand für k → ∞ auf dem Halbkreis verschwindet, siehe Abb. 23.6a. Die Pole der freien Green’schen Funktion liegen bei: k = ±(k 0 + iε) ,
k0 =
√2mE ℏ
≡ k 0 (E) .
Durch Partialbruchzerlegung 1 1 2m ≡ 2 2 E − E k + iε ℏ k 0 − k 2 + iε 1 1 2m 1 − = 2 [ ] ℏ 2k k 0 + iε − k k 0 + iε + k
(23.62)
34 | 23 Zeitentwicklung Im{k}
k0 + iε ×
−k0
Re{k} ×
k0
−k0 − iε
(a)
Im{k}
−k0 + iε × Re{k} × k0 − iε
(b)
Abb. 23.6: Integrationsweg in der komplexen k-Ebene für die Berechnung der Green’schen Funktio (±) (+) (−) nen G0 . Die Kreuze (×) geben die Lage der Pole (a) für G0 und (b) für G0 an.
erhalten wir: ∮
dk k
m e ikR = E − E k + iε ℏ2
∮
dk (
e ikR e ikR − ) . k 0 + iε − k k 0 + iε + k
(23.63)
Die verbleibenden Integrale werten wir mit Hilfe der Residuentheorie (Cauchy’sche Integralformel als Anwendung des Residuensatzes) aus, ∮ C
dz f(z) = 2πif(z0 ) , z − z0
wobei z0 ein Punkt der komplexen Ebene im Inneren der geschlossenen Kurve C und f eine im eingeschlossenen Gebiet holomorphe Funktion ist. Es trägt nur der Pol ober
23.8 Die Green’sche Funktion der Schrödinger-Gleichung
|
35
halb der reellen Achse (d. h. lediglich der erste Summand in (23.63)) zum Integral bei (+) (siehe Abb. 23.6a) und wir erhalten schließlich im Limes ε → 0 für G0 (23.61) mit R = |x − x |: m e ik0 (E)|x−x | (+) G0 (x, x ; E) = − , 2πℏ2 |x − x | wobei k0 (E) in (23.62) definiert ist. Für E = E k (23.59) haben wir k 0 (E k ) = k und erhal ten:
(+)
G0 (x, x ; E k ) = −
2m e ik|x−x | , ℏ2 4π|x − x |
Ek =
(ℏk)2 . 2m
(23.64)
Die retardierte Green’sche Funktion stellt eine auslaufende Kugelwelle dar. In großen Entfernungen sieht die Kugelwelle lokal wie eine ebene Welle aus. Durch analoge Rechnungen findet man die avancierte Green’sche Funktion. Die (−) freie avancierte Green’sche Funktion G0 (E) unterscheidet sich (im Impulsraum) von (+) der retardierten G0 (E) nur im Vorzeichen des Dämpfungsglieds iε, das die akausalen Randbedingungen festlegt (siehe Gl. (23.57)). Ersetzen von iε durch (−iε) in Gl. (23.61) liefert: ∞ 1 2 1 e ikR (−) G0 (x, x ; E) = ( ) ∫ dk k . 2π iR E − E k − iε −∞
Dieses Integral lässt sich wieder durch Schließen des Integrationswegs im Komplexen (siehe Abb. 23.6b) mittels Residuentheorie berechnen, wobei die Pole jetzt bei (vgl. Gl. (23.62)) √2mE ≡ k 0 (E) k = ±(k 0 − iε) , k 0 = ℏ liegen. Wir erhalten dann für die freie avancierte Green’sche Funktion eine einlaufende Kugelwelle:
(−)
G0 (x, x ; E k ) = −
2m e−ik|x−x | , ℏ2 4π|x − x |
Ek =
(ℏk)2 . 2m
(±)
Die beiden Green’schen Funktionen G0 unterscheiden sich damit nur im Vorzeichen des Exponenten. Man beachte, dass (±) G0 (x, x ; E k
≡ 0) ≡
−⟨x|H0−1 |x ⟩
−1 ℏ2 = − ⟨x (− △) x ⟩ , 2m
woraus die bekannte Green’sche Funktion des Laplace-Operators ∆ folgt: ⟨x|(−△)−1 |x ⟩ =
1 . 4π|x − x |
24 Zeitabhängige Prozesse Im Folgenden betrachten wir quantenmechanische Systeme, die sich in einem äuße ren zeitabhängigen Feld befinden. Diese Art von Problemstellung tritt bei fast allen Messprozessen in atomaren Systemen auf. Als typisches Beispiel sei ein Atom in ei nem von außen angelegten elektromagnetischen Feld genannt. Wir interessieren uns für den Einfluss des äußeren Felds auf das quantenmechanische System. Das isolier te System werde durch einen (zeitunabhängigen) Hamilton-Operator H0 , das äußere Feld durch ein zeitabhängiges Potenzial V(t) beschrieben. Bei Abwesenheit von äuße ren Feldern wird sich das isolierte Quantensystem in seinem Grundzustand befinden. Durch Einschalten des äußeren Felds kann Energie in das Quantensystem gepumpt werden und dieses aus dem Grundzustand in energetisch höher liegende Eigenzu stände von H0 angeregt werden. Ziel unserer Untersuchungen wird es sein, die Wahr scheinlichkeit für diese Anregung als Funktion der Zeit zu berechnen.
24.1 Übergänge infolge einer äußeren Störung Wir nehmen an, dass das durch V(t) gestörte System so präpariert ist, dass es sich zur Zeit t = t0 in einem Eigenzustand |m⟩ des ungestörten Hamilton-Operators H0 befindet: H0 |m⟩ = E m |m⟩ . Bei Abwesenheit der Störung würde sich dieser Zustand in der Zeit wie |m, t⟩ := U0 (t, t0 )|m⟩ = e− ℏ E m (t−t 0) |m⟩ i
(24.1)
entwickeln, wobei offenbar |m, t0 ⟩ = |m⟩ gilt. Wegen der Störung V(t) ist jedoch zu einem späteren Zeitpunkt t > t0 das System i. A. nicht mehr im Zustand |m, t⟩, sondern die Wellenfunktion des Systems (im Schrödinger-Bild) ist durch (vgl. Gl. (23.1)) |ψ m (t)⟩ = U(t, t0 )|m, t0 ⟩ gegeben und stellt eine Überlagerung der zeitabhängigen Zustände (24.1) |n, t⟩ dar, |ψ m (t)⟩ = ∑ C nm (t)|n, t⟩ , n
die wegen der Unitarität von U0 eine vollständige orthonormale Basis bilden: ⟨m, t|n, t⟩ = ⟨m|n⟩ = δ mn . Wir fragen nach der Wahrscheinlichkeit, mit der das System unter dem Einfluss der Störung V(t) nach der Zeit t − t0 aus dem Zustand |m, t0 ⟩ in den Zustand |n, t⟩ über https://doi.org/10.1515/9783110586077-002
24.2 Störreihe für die Übergangsamplitude | 37
gegangen ist. Für diesen Prozess ist die Wahrscheinlichkeitsamplitude durch C nm (t) = ⟨n, t|ψ m (t)⟩ = ⟨n, t0 |U0 (t0 , t)U(t, t0 )|m, t0 ⟩ = ⟨n|UW (t, t0 )|m⟩
(24.2)
gegeben. Sie enthält allein den Wechselwirkungsanteil des Zeitentwicklungsopera tors UW (t, t0 ) und ist durch dessen Matrixelement in den ungestörten zeitunabhän gigen Zuständen |m⟩ gegeben. Das Wechselwirkungsbild ist damit die geeignete Dar stellung, um den Einfluss einer äußeren Störung zu beschreiben. Aus der Übergangsamplitude finden wir die Übergangswahrscheinlichkeit w m→n (t) = |C nm (t)|2 = |⟨n|UW (t, t0 )|m⟩|2
(24.3)
und aus dieser die Übergangsrate (Übergangswahrscheinlichkeit pro Zeiteinheit)
Γ m→n (t) =
dw m→n (t) . dt
(24.4)
Es ist diese Übergangsrate, die in den meisten Experimenten direkt gemessen wird, während die Übergangswahrscheinlichkeit erst durch Integration (Summation) der gemessenen Übergangsraten über ein endliches Zeitintervall erhalten wird.
24.2 Störreihe für die Übergangsamplitude Setzen wir die in Abschnitt 23.5 gewonnene Störreihe für den Zeitentwicklungsope rator im Wechselwirkungsbild UW (t, t0 ) in den Ausdruck (24.2) für die Übergangsam plitude ein, so erhalten wir für die letztere ebenfalls eine Störreihenentwicklung, wel che die Gestalt C nm (t) = ⟨n|UW (t, t0 )|m⟩ (0)
(1)
(2)
∞
(k)
= C nm (t) + C nm (t) + C nm (t) + ⋅ ⋅ ⋅ = ∑ C nm (t) , k=0 (k) C nm (t)
=
(k) ⟨n|UW (t, t0 )|m⟩
(k)
besitzt, wobei UW (t, t0 ) den k-ten Term (23.41) der Neumann-Reihe für UW (t, t0 ) be zeichnet. Im Folgenden wollen wir die einzelnen Terme dieser Störreihe etwas genauer untersuchen. Der Term nullter Ordnung ist durch (0)
C nm (t) = ⟨n|m⟩ = δ nm
38 | 24 Zeitabhängige Prozesse
gegeben. In dieser Ordnung, in der der Effekt der Störung völlig vernachlässigt wird, gibt es keine Übergänge, da die Eigenzustände des ungestörten Hamilton-Operators orthogonal sind. Für die Koeffizienten erster Ordnung finden wir: t
i (1) C nm (t) = − ∫ dt ⟨n|VW (t )|m⟩ ℏ t0
t
i = − ∫ dt ⟨n|U0 (t0 , t )V(t )U0 (t , t0 )|m⟩ ℏ t0
t
i = − ∫ dt e iω nm (t −t 0) V nm (t ) . ℏ
(24.5)
t0
Hierbei haben wir die Übergangsfrequenz ω nm =
En − Em , ℏ
sowie die abkürzende Schreibweise V nm (t) = ⟨n|V(t)|m⟩ für das Übergangsmatrixelement eingeführt. In dieser Ordnung gibt es offenbar nur dann eine von null verschiedene Übergangswahrscheinlichkeit zwischen den äußeren Zuständen |m⟩ und |n⟩, wenn das Störpotenzial ein von null verschiedenes Matrixele ment zwischen diesen beiden Zuständen besitzt. Die Störung induziert in diesem Fall einen direkten Übergang zwischen den beiden betrachteten Zuständen. Falls das direkte Matrixelement des Störpotenzials zwischen den betrachteten Zu ständen verschwindet, sind dennoch indirekte Übergänge möglich, die durch die Ko effizienten höherer Ordnung beschrieben werden. Für den Koeffizienten zweiter Ord nung erhalten wir nach Einsetzen der Vollständigkeitsrelation (10.45): (2) C nm (t)
t
t1
t0
t0
t
t1
t0
t0
i 2 = (− ) ∫ dt1 ∫ dt2 ∑⟨n|VW (t1 )|k⟩⟨k|VW (t2 )|m⟩ ℏ k i 2 = (− ) ∫ dt1 ∫ dt2 ∑ e iω nk (t 1 −t 0)+iω km (t 2−t 0 ) V nk (t1 )V km (t2 ) . ℏ k
Diese Ordnung der Störungstheorie beschreibt den Übergang aus dem Zustand |m⟩ in den Zustand |n⟩ über einen Zwischenzustand |k⟩. Im Gegensatz zu dem direkten Über gangsprozess, der durch die erste Ordnung Störungstheorie beschrieben wird, wer den solche Prozesse als indirekte Übergänge bezeichnet. Ganz allgemein beschreibt die k-te Ordnung Störungstheorie Prozesse, bei denen der Übergang aus dem Zustand
24.3 Fermis Goldene Regel |
m
m
39
m
k
m
n
n
(b)
(c)
n k
(a)
(d)
Abb. 24.1: Illustration der durch die Störung induzierten Übergänge zwischen den ungestörten Zuständen von H 0 . (a) Kein Übergang zwischen verschiedenen Zuständen |n⟩ und |m⟩ ≠ |n⟩ in nullter Ordnung, (b) direkter Übergang zwischen den Zuständen |m⟩ und |n⟩, der in erster Ordnung Störungstheorie beschrieben wird. (c) und (d) zeigen die Prozesse zweiter bzw. dritter Ordnung, bei denen sich der Übergang über einen bzw. zwei Zwischenzustände vollzieht.
|m⟩ in den Zustand |n⟩ über (k − 1) Zwischenzustände verläuft. Dies ist in Abb. 24.1 für die Prozesse nullter, erster, zweiter und dritter Ordnung illustriert. Die gesuchte Übergangswahrscheinlichkeit (24.3) erhalten wir schließlich durch kohärente Summation der Störbeiträge zu den Übergangsamplituden: (0) 2 (1) (2) w m→n = C nm + C nm + C nm + ⋅ ⋅ ⋅ . Dabei kann es zu Interferenzphänomenen zwischen den einzelnen Ordnungen der Störungstheorie kommen. Abschließend sei bemerkt, dass die oben berechnete Größe C mn (t) die Wahr scheinlichkeitsamplitude für den Übergang zwischen den ungestörten Zuständen |m⟩ und |n⟩ von H0 angibt. Zwischen den exakten Eigenzuständen von H = H0 + V (mit zeitunabhängigem V) gibt es natürlich ohne zusätzliche äußere Störung keine Übergänge.
24.3 Fermis Goldene Regel 24.3.1 Zeitlich begrenzte Störung Im Folgenden nehmen wir an, dass die äußere Störung V(t) klein genug ist, sodass Stö rungstheorie erster Ordnung ausreichend ist. Die Übergangswahrscheinlichkeit (24.3) ist dann für m ≠ n mit (24.5) durch 1 w m→n (t) = 2 ℏ
t 2 ∫ dt e iω nm (t −t 0 ) V nm (t ) t 0
(24.6)
40 | 24 Zeitabhängige Prozesse gegeben. Gültigkeit dieser Formel setzt voraus, dass entweder der Betrag von V nm (t) oder die Zeitdauer, über die V(t) wirkt, klein sind. Ohne äußere Störung V(t) = 0 bleibt das System natürlich unendlich lange in dem ursprünglichen stationären Eigenzu stand¹ |m⟩. Bei den meisten praktischen Anwendungen haben wir es mit einer zeitlich be grenzten Störung zu tun, d. h., die Störung wird zu einem Zeitpunkt t = t0 eingeschal tet, wirkt über eine endliche Zeitdauer τ und verschwindet wieder für t > t0 + τ, siehe Abb. 24.2. Bei Ein- und Ausschalten der Störung ändert diese sich zwar abrupt, aber stetig. Bezüglich der Zeit t können wir drei Fälle unterscheiden: 1. t < t0 : In diesem Fall wirkt keine Störung und die Übergangswahrscheinlichkeit ver schwindet. 2. t0 < t < t0 + τ: Dies ist der interessanteste Fall, da hier die Übergangswahrscheinlichkeit zeitab hängig ist, d. h. von dem aktuellen Wert von t abhängt. 3. t > t0 + τ: Da die Störung für Zeiten t > t0 + τ verschwindet, ändert sich die Übergangswahr scheinlichkeit w m→n (t) für diese Zeiten nicht mehr. Das in dem Ausdruck (24.6) für die Übergangswahrscheinlichkeit auftretende Zeitin tegral reduziert sich wegen V nm (t) = 0 für t > t0 + τ auf t 0 +τ
∫ dt e iω nm t V nm (t ) =: V nm (ω nm ) t0
und definiert eine Funktion der Übergangsfrequenz ω nm . Die konstante Phase e−iω nm t 0 fällt bei der Betragsbildung heraus. Im vorliegenden Fall können wir wegen des Ver schwindens der Störung für t < t0 und t > t0 + τ die untere bzw. obere Integrations grenze nach −∞ bzw. +∞ verschieben. Die Frequenzfunktion V(ω nm ) ist dann gerade die Fourier-Transformierte der zeitabhängigen Störung. Mittels der Fourier-Transfor mierten lässt sich der Ausdruck für die Übergangswahrscheinlichkeit in erster Ord nung Störungstheorie zu (1)
w m→n =
1 |V nm (ω nm )|2 ℏ2
1 Dies gilt zumindest im Rahmen der nichtrelativistischen Quantenmechanik. Wie jedoch in der Quantenfeldtheorie erklärt wird, gibt es immer Störungen (Quantenfluktuationen des Vakuums), die das System aus einem angeregten Zustand in den Grundzustand übergehen lassen (spontane Emis sion).
24.3 Fermis Goldene Regel | 41
V(t)
(a)
τs
τs
t
V(t)
(b)
t0 + τ
t0
t
Abb. 24.2: Zeitverlauf eines (a) realistischen Schaltprozesses und (b) seiner mathematischen Ideali sierung (τ s → 0).
vereinfachen. In dieser Ordnung gibt es demnach zwischen zwei Zuständen m und n nur dann einen Übergang, wenn die Energiedifferenz En − Em ℏ im Fourier-Spektrum der Störung enthalten ist, d. h., wenn V nm (ω nm ) ≠ 0. Die Über gänge haben also in dieser Ordnung Resonanzcharakter. ω nm =
24.3.2 Instantanes Ein- bzw. Ausschalten der Störung Jeder realistische Ein- bzw. Ausschaltprozess dauert eine endliche Zeit τ s , die soge nannte Schaltzeit, und hat den in Abb. 24.2a dargestellten qualitativen Verlauf. Die Schaltzeit ist eine Eigenschaft der Störung bzw. der Apparatur, mit der die Störung generiert wird, und ist deshalb unabhängig von dem zu messenden System, auf das die Störung einwirkt. Die charakteristische Zeitskala τc des ungestörten Systems ist die Zeit, welche das System benötigt, um einen Übergang zwischen den (ungestörten) Eigenzuständen zu vollziehen. Für Übergänge zwischen Zuständen mit Energieunter schied ∆E = ℏω nm = E n − E m ist nach der Unschärferelation (11.13) die charakteristische Zeit τc durch ℏ 1 τc ≃ = ∆E ω nm
(24.7)
42 | 24 Zeitabhängige Prozesse
gegeben. In vielen praktischen Anwendungen ist die Schaltzeit τs klein gegenüber der charakteristischen Zeit τc des untersuchten Systems und wir können die mathe matische Idealisierung τs → 0 vornehmen. Der Zeitverlauf der Störung eines solchen idealisierten Schaltprozesses ist in Abb. 24.2b dargestellt und besitzt die Form V(x, t) = V(x)Θ(t − t0 )Θ(t0 + τ − t) .
(24.8)
Die Störung wird hier instantan eingeschaltet, ist über eine Periode τ zeitlich konstant und wird danach wieder instantan abgeschaltet. Diese mathematische Idealisierung ist sehr gut realisiert, wenn Störung und gestörtes System zwei sehr verschiedene Zeit skalen besitzen. Als Beispiel sei hier der α-Zerfall erwähnt. Ein Atomkern emittiert ein α-Teilchen (4 He-Kern), was die Kernladungszahl um zwei verringert und somit die Elektronenhülle stört. Die Elektronen müssen sich an die neue Kernladungszahl (d. h. an das damit verknüpfte Coulomb-Potenzial) anpassen. Die dazu notwendige charak teristische Zeit ist sehr viel größer als die Dauer des α-Zerfalls. In der Tat sind die Anre gungsenergien eines Nukleons im Atomkern von der Ordnung MeV, während die An regungsenergien eines Elektrons in der Atomhülle im eV-Bereich liegen. Demzufolge laufen in einem Atom die Kernprozesse in Zeiten von der Ordnung ℏ 200 fm ≃ ≃ 10−21 s 1 MeV c ab, während die charakteristische Zeit für atomare Prozesse, d. h. für die Elektronen bewegung in der Hülle, von der Ordnung τK ≃
ℏ ≃ 10−15 s 1 eV ist. Beim α-Zerfall ist die Schaltzeit τ s = τ K also sechs Größenordnungen kleiner als die charakteristische Zeit τ c = τ A , sodass dieser Prozess in sehr guter Näherung als eine instantane Störung der Elektronenhülle betrachtet werden kann. Wie bereits oben allgemein festgestellt wurde, bleibt die Übergangswahrschein lichkeit nach Abschalten der Störung zeitlich konstant. Wir beschränken uns deshalb auf eine Zeit t, zu der die Störung von null verschieden ist: τA ≃
t0 < t < t0 + τ . Ohne Beschränkung der Allgemeinheit können wir den Anfangszeitpunkt t0 = 0 set zen. Die durch die Störung (24.8) hervorgerufene Übergangswahrscheinlichkeit ist in erster Ordnung Störungstheorie nach (24.6) mit t0 = 0, t > 0 durch t 2 iω nm t V nm (t ) ∫ dt e 0 t 2 1 = 2 |V nm |2 ∫ dt Θ(τ − t )e iω nm t ℏ 0 1 = 2 |V nm |2 [Θ(τ − t)|g t (ω nm )|2 + Θ(t − τ)|g τ (ω nm )|2 ] ℏ
1 w m→n (t) = 2 ℏ
(24.9)
24.3 Fermis Goldene Regel
| 43
gegeben, wobei ̂ V nm = ⟨n|V(x)|m⟩
(24.10)
zeitunabhängig ist (siehe Gl. (24.8)) und wir die Funktion t
g t (ω) = ∫ dt e iωt =
1 iωt (e − 1) iω
0
=
1 sin(ωt) [cos(ωt) − 1] + , iω ω
(24.11)
eingeführt haben. Für ihr Betragsquadrat erhalten wir f t (ω) := |g t (ω)|2 [cos(ωt) − 1]2 + sin2 (ωt) 1 − cos(ωt) =2 ω2 ω2 2 sin (ωt/2) = . (ω/2)2 =
(24.12)
Die Übergangswahrscheinlichkeit w m→n (t) (24.9) ist für 0 < t < τ ω m→n (t) =
2 1 1 2 2 sin (ω nm t/2) |V | f (ω ) = |V | nm t nm nm ℏ2 ℏ2 (ω nm /2)2
(24.13)
offensichtlich eine periodische Funktion der Zeit, siehe Abb. 24.3.
|Vnm|2 (¯hωnm/2)2
wm→n(t)
π/ωnm
3π/ωnm
t
Abb. 24.3: Die Übergangswahrscheinlichkeit w m→n (t) (24.13) als Funktion der Zeit t.
Wir wollen jetzt die Abhängigkeit der Übergangswahrscheinlichkeit von der Frequenz ω nm etwas genauer untersuchen. Die Funktion f t (ω) ist in Abb. 24.4 dargestellt. Sie besitzt ein ausgeprägtes Maximum bei ω = 0, dessen Höhe durch t2 gegeben ist und dessen Breite proportional zu 1/t ist. Ferner gilt die Beziehung (siehe Gl. (A.8)): lim
t→∞
1 f t (ω) = 2πδ(ω) . t
(24.14)
44 | 24 Zeitabhängige Prozesse ft(ω) t2
−6π/t −4π/t −2π/t
2π/t
4π/t
6π/t
ω
Abb. 24.4: Die Funktion f t (ω) (24.12).
Für Argumente |ω| > 2π t erreicht die Funktion f t (ω) nur noch Werte, die sehr klein gegenüber dem Hauptmaximum f t (ω = 0) = t2 sind. Die Übergangswahrscheinlich keit zu einem festen Zeitpunkt t ist deshalb nur wesentlich von null verschieden für Frequenzen der Ordnung 2π |ω nm | ≤ . t Beachten wir, dass ω nm =
E n − E m ∆E = ℏ ℏ
und dass wegen t0 = 0 unsere Zeit t die Zeitdauer ∆t = t0 + t − t0 = t der Störung darstellt, so finden wir, dass im Wesentlichen nur Übergänge stattfinden, für die ∆E ∆t ≲ ℏ⋅2π gilt. Andererseits gilt wegen der Unschärferelation (11.13): ∆E ∆t ≥
ℏ , 2
sodass nach der Zeit ∆t = t nur Zustände mit Anregungsenergie ∆E ≃ angeregt sind.
ℏ t
24.3 Fermis Goldene Regel |
45
Dieses Ergebnis hat eine sehr anschauliche Erklärung: Für 0 < t < τ (t 0 = 0) hat die oben be trachtete Störung (24.8) die Form einer Stufenfunktion. Die Stufenfunktion besitzt beliebig hohe Fou rier-Frequenzen (siehe Gl. (A.23)), d. h., durch das plötzliche Einschalten werden zunächst Zustän de mit beliebig großer Anregungsenergie ∆E angeregt. Diese hoch angeregten Zustände verletzen jedoch sehr stark die Energieerhaltung und regen sich gemäß der Unschärferelation nach der Zeit t ≡ ∆t ≃ ℏ/∆E = 1/ω mn wieder ab. Das für 0 < t < τ vorliegende konstante Störpotenzial regt für gro ße (τ >)t ≫ 1/ω mn jedoch praktisch keine Zustände mehr an, da für diese Zeiten seine Fourier-Trans formierte nach (24.14) de facto durch δ(ω mn ) gegeben ist. Nach einer Zeit t = ∆t nach dem Einschalten sind deshalb nur noch Zustände mit der Energie ∆E = |E n − E m | ≃ ℏ/∆t angeregt. Je größer die Zeit t = ∆t, umso weniger können sich deshalb die Energien der durch die Störung angeregten Zustände von der Energie des Anfangszustands unterscheiden und für sehr große Zeiten t = ∆t(< τ) → ∞ kön nen nur Zustände mit ∆E = 0, d. h. E n = E m überleben. Für kleine Zeiten t hingegen ist die Verteilung f t (ω) breit und Übergänge mit relativ großen Energieänderungen ∆E = ℏω nm können stattfinden – in Übereinstimmung mit der Unschärferelation.
Ist t groß gegenüber der charakteristischen Zeit τ c (24.7), so können wir die für t → ∞ gültige asymptotische Darstellung (24.14) benutzen und die stark lokalisierte Funktion f t (ω)/2πt durch die δ-Funktion ersetzen. Für die Übergangswahrscheinlichkeit (24.13) erhalten wir dann: 2π w m→n (t) = t |V nm |2 δ(E n − E m ) . (24.15) ℏ Hierbei haben wir die Beziehung (A.11) δ(ax) =
1 δ(x) |a|
verwendet. Für große t ist die Übergangswahrscheinlichkeit (24.15) proportional zur Zeitdau er der Störung – ein plausibles Ergebnis. Hieraus finden wir für die Übergangswahr scheinlichkeit pro Zeiteinheit, d. h. die Übergangsrate, siehe Gl. (24.4): Γ m→n =
2π |V nm |2 δ(E n − E m ) . ℏ
(24.16)
Diese Übergangsrate ist unabhängig von der Zeit. Wir betonen, dass dieser Ausdruck (genau wie derjenige für die Übergangswahrscheinlichkeit (24.15)) nur für große t gilt. Die δ-Funktion δ(E n − E m ) drückt die Energieerhaltung beim Übergang |m⟩ → |n⟩ aus und ist eine Konsequenz des Limes t → ∞. Für endliche Zeiten t hingegen erhalten wir anstatt der δ-Funktion die Funktion f t (ω)/2πt, die eine endliche Breite besitzt. Es sind dann auch Übergänge in Zustände erlaubt, deren Energie sich von der des Anfangszustands unterscheidet. Für entartete Systeme mit E n = E m ist die obige Formel unmittelbar anwendbar. Sie ist jedoch wenig sinnvoll für Energien E n , E m aus dem diskreten Spektrum. Bei al len praktisch relevanten Problemen gehören jedoch entweder Anfangs- oder Endzu
46 | 24 Zeitabhängige Prozesse k
k
Abb. 24.5: Streuung von Elektronen an einem Potenzial endlicher Reichweite.
V(x)
stand oder beide zum kontinuierlichen oder nahezu kontinuierlichen Spektrum des ungestörten Hamilton-Operators² H0 . Zur Illustration betrachten wir einige Beispiele: 1. Elastische Streuung von Elektronen: Wir betrachten die Streuung von Elektronen an einem lokalisierten Potenzial end licher Reichweite, siehe Abb. 24.5. Anfangs- und Endzustände der Elektronen sind ebene Wellen mit den Wellenzahlen k bzw. k . Bei der elastischen Streuung (ein fallendes und gestreutes Teilchen besitzen dieselbe Energie) haben die Wellen vektoren des Anfangs- und Endzustands gleiche Länge, |k| = |k |, besitzen jedoch i. A. verschiedene Richtungen. Bei fest vorgegebenem Anfangsimpuls k kann die Richtung des Impulses der gestreuten Welle k kontinuierlich auf der Kugelober fläche variieren. Die Endstreuzustände sind damit entartet. 2. Der α-Zerfall: Der Atomkern zerfällt unter Aussendung eines α-Teilchens (4 He-Kern) in einen Kern mit einer um zwei Einheiten geringeren Kernladungszahl (siehe Abb. 24.6). Der Impuls des α-Teilchens ist kontinuierlich verteilt. Wir haben deshalb auch hier ein Kontinuum von Endzuständen. V(r)
p
r
Abb. 24.6: Illustration des Potenzials, das ein α-Teilchen im Atomkern spürt. Der kurzreich weitige anziehende Teil wird durch die starke Wechselwirkung, der abstoßende langreichwei tige Teil durch die Coulomb-Wechselwirkung hervorgerufen. Durch das Wechselspiel von Kern kräften und Coulomb-Wechselwirkung entsteht eine Potenzialbarriere, die das α-Teilchen beim Zerfall durchtunnelt.
2 Die gemessenen Spektrallinien werden gewöhnlich von bewegten Quellen ausgesandt. (Atome in einem Gas sind in Bewegung.) Durch die Bewegung kommt es zu einer sogenannten Doppler-Verschie bung, was zu einer „Ausschmierung“ der Spektrallinien führt. Damit wird ein ursprünglich diskretes Spektrum quasikontinuierlich.
24.3 Fermis Goldene Regel
| 47
δE Em
En
}
̄ ∆E
En
̄ Abb. 24.7: Zur Ableitung von Fermis Goldener Regel: Gezeigt ist das Energieauflösungsvermögen ∆E der Messapparatur, sowie der Niveauabstand δE im Spektrum des gestörten System.
Selbst wenn Anfangs- und Endzustand des gestörten Systems in einem diskre ten Spektrum liegen, so können wir dennoch die einzelnen Zustände nicht auflösen, da jede Messapparatur nur ein endliches (begrenztes) Auflösungsvermögen besitzt. Wir können deshalb in einem Messprozess i. A. nur die Übergänge in eine Gruppe ̄ liegen, welches von Endzuständen erfassen, deren Energien in einem Intervall ∆E das Auflösungsvermögen der Messapparatur charakterisiert,³ siehe Abb. 24.7. Wir sind deshalb nur an der Berechnung der Gesamtübergangsrate aus einem gegebenen An ̄ um eine fangszustand |m⟩ in eine Gruppe von Endzuständen im Energieintervall ∆E Energie E n , ̄ = ∑ Γ m→n , Γ m (∆E) ̄ E n ∈ ∆E
interessiert, wobei Γ m→n die oben berechnete Übergangsrate aus dem Zustand m in einen einzelnen Zustand n ist. Zur Ausführung der Summation ist es bequem, die Niveaudichte bzw. Zustandsdichte ρ(E) einzuführen, welche durch dN(E) = ρ(E) dE ≡
∂N(E) dE ∂E
definiert ist. Sie gibt die Anzahl der Zustände pro Energieintervall an. Mit der Defi nition der Niveaudichte können wir die Summation über die Endzustände durch ein ̄ ersetzen und erhalten für die Übergangsrate: Integral über das Energieintervall ∆E ̄ = ∫ dN(E n ) Γ m→n = ∫ dE n ρ(E n )Γ m→n . Γ m (∆E) ̄ ∆E
̄ ∆E
Der Einfachheit halber nehmen wir im Folgenden an, dass die Wechselwirkungsma trixelemente V nm in (24.16) für alle Zustände mit nahezu gleicher Energie E n densel ̄ haben wir dann das ben Wert besitzen. Für alle Endzustände aus dem Intervall ∆E gleiche Störungsmatrixelement. Für die Gesamtübergangsamplitude erhalten wir da mit: ̄ = 2π |V nm |2 ∫ dE n ρ(E n ) δ(E n − E m ) , Γ m (∆E) (24.17) ℏ ̄ ∆E
3 Aus konzeptioneller Sicht stellt der Messprozess eine Störung des Systems dar. Wir können deshalb den Messapparat wie eine äußere Störung behandeln.
48 | 24 Zeitabhängige Prozesse wobei voraussetzungsgemäß der Zustand |n⟩ (mit Energie E n ), für den das Matrix ̄ element V nm der Störung genommen wird, im betrachteten Energieintervall ∆E liegt. Aufgrund der δ-Funktion lässt sich nun die Integration über die Energie explizit ̄ um E n liegt, d. h. die singuläre ausführen. Falls die Anfangsenergie E m im Intervall ∆E Stelle der δ-Funktion sich im Integrationsbereich befindet, erhalten wir: Γm =
2π |V nm |2 ρ(E m ) . ℏ
(24.18)
Dieser Ausdruck für die Übergangsrate wird als Fermis Goldene Regel bezeichnet, er wurde jedoch zuerst von W. Pauli gefunden. Die Gesamtübergangsrate ist demnach umso größer, je größer das Wechselwirkungsmatrixelement der Störung V nm und die Niveaudichte der Endzustände bei der Energie des Anfangszustands ist. Fermis Goldene Regel hat vielfältige experimentelle Bestätigung erfahren. Abschließend wollen wir die Bedingungen für die Gültigkeit dieser Formel zusam menstellen. Bei der Ableitung von (24.18) wurden folgende Annahmen gemacht: 1.
Instantanes Einschalten: Dazu musste die Einschaltzeit τs sehr viel kleiner sein als die charakteristische Zeit τc ∼ ℏ/(E n − E m ) des gestörten Systems: τs ≪ τc .
2.
Nach dem instantanen Einschalten wirkt die Störung zeitlich konstant über ein sehr großes Zeitintervall t → ∞. Die Funktion f t (ω)/2πt (24.12) wurde für große Zeiten t durch eine δ-Funktion ersetzt (siehe Gl. (24.14)). Für endliches t besitzt f t (ω) die Breite 2π/t bzw. in Energieeinheiten 2πℏ/t. Damit diese Funk tion durch die δ-Funktion ersetzt werden kann, muss ihre Breite klein gegen ̄ d. h. der Breite ∆E ̄ der über dem Auflösungsvermögen der Messapparatur ∆E, Energieverteilung der Endzustände sein, über die wir in (24.17) mitteln, siehe Abb. 24.8. Daher erhalten wir die Bedingung ̄ ≫ 2πℏ . ∆E t
3. 4.
Die zeitunabhängigen Matrixelemente V nm (24.10) der Störung sind über das ̄ energieunabhängig. Energieintervall ∆E Damit das Spektrum der Endzustände als Kontinuum betrachtet werden kann und somit die Definition einer Niveaudichte ρ(E) sinnvoll ist, müssen sehr viele Zustände des ungestörten Systems innerhalb der Breite 2πℏ/t der Verteilung f t (ω) liegen, d. h., für den mittleren Energieniveauabstand⁴ δE muss gelten: 2πℏ ≫ δE , t
24.3 Fermis Goldene Regel |
49
siehe Abb. 24.8. Der mittlere Energieabstand δE definiert aber über ℏ ∼ τc δE die charakteristische Zeit τc , sodass t ≪ τc gelten muss.
f t (E/ℏ2)
δE E − 2πℏ t
En
2πℏ t
̄ ∆E
Em Abb. 24.8: Illustration der Bedingungen für die Anwendbarkeit von Fermis Goldener Regel, siehe Text.
Aus 2) und 4) erhalten wir somit als Bedingung für die Anwendbarkeit von Fermis Goldener Regel ̄ ≫ 2πℏ ≫ δE bzw. 2πℏ ≪ t ≪ τc . ∆E ̄ t ∆E ̄ muss sehr klein gegenüber der Die charakteristische Zeit der Messapparatur 2πℏ/ ∆E Zeitdauer der Störung t sein, die wiederum klein gegenüber der charakteristischen Zeit des ungestörten Systems 2πℏ/δE sein muss.
4 Der mittlere Niveauabstand δE bei der Energie E lässt sich über E+δE
∫ dE ρ(E ) = 1 E
definieren.
50 | 24 Zeitabhängige Prozesse
24.3.3 Periodische Störung Bei vielen praktischen Anwendungen, insbesondere mit einem äußeren elektroma gnetischen Feld, haben wir es häufig mit Störungen zu tun, die zur Zeit t = 0 einge schaltet werden und eine periodische Zeitabhängigkeit besitzen. Eine solche Störung können wir nach Fourier-Zerlegung bezüglich der Zeit auf die Form V(x, t) = Θ(t) (V(x)e−iωt + V † (x)e iωt )
(24.19)
reduzieren, wobei V(x) ein zeitunabhängiger Operator ist, der von der Koordinate des zu störenden Systems abhängen kann. Die Übergangsamplitude aus einem Zustand m in einen Zustand n ist in erster Ordnung Störungstheorie nach Gl. (24.5) durch (t0 = 0) t
i C nm (t) = − ∫ dt [e i(ω nm −ω)t ⟨n|V|m⟩ + e i(ω nm +ω)t ⟨n|V † |m⟩] ℏ
0
i ∗ = − [g t (ω nm − ω)V nm + g t (ω nm + ω)V mn ] ℏ (−) (+) ≡ C nm (t) + C nm (t)
(24.20)
gegeben. Hierbei ist g t (ω) die in Gl. (24.11) eingeführte Funktion. Wie f t (ω) = |g t (ω)|2 (24.12) ist g t (ω) für große t bei ω = 0 stark gepeakt, wobei die Breite des Peaks 2π/t beträgt. Ist die Übergangsfrequenz ω nm größer als diese Peakbreite, siehe Abb. 24.9, so besitzen die beiden Funktionen g t (ω nm ∓ ω) , die bei ω = ±ω nm gepeakt sind, praktisch keinen Überlapp, sodass gilt: (−)
(+)
|C nm (t)|2 ≃ |C nm (t)|2 + |C nm (t)|2 . Wegen des verschwindenden Überlapps gibt es keine Interferenz zwischen der Stö rung mit positiver und negativer Frequenz. Für die Übergangswahrscheinlichkeit fin den wir deshalb aus (24.20) w m→n = |C nm (t)|2 = =
1 |V nm |2 (|g t (ω nm − ω)|2 + |g t (ω nm + ω)|2 ) ℏ2
1 |V nm |2 [f t (ω nm − ω) + f t (ω nm + ω)] . ℏ2
Ersetzen wir hier die Funktion f t (ω) für große t wieder durch ihren asymptotischen Wert (24.14) 2πtδ(ω), w m→n =
2π t|V nm |2 [δ(ω nm − ω) + δ(ω nm + ω)] , ℏ2
und drücken hierin die Frequenzen durch die Energien aus, so erhalten wir schließlich für die Übergangsrate: Γ m→n =
2π |V nm |2 [δ(E n − E m − ℏω) + δ(E n − E m + ℏω)] . ℏ
(24.21)
24.3 Fermis Goldene Regel |
51
Γ m→n
En E m − ℏω
E m + ℏω Em
Abb. 24.9: Die Übergangsrate Γ m→n (24.21) als Funktion der Energie E n .
Diese Größe ist zeitunabhängig und besitzt Resonanzcharakter, siehe Abb. 24.9: Ei ne periodische Störung (24.19) mit Frequenz ω bewirkt Übergänge in Zustände, deren Energien sich um ±ℏω unterscheiden: E n = E m ± ℏω .
(24.22)
Dabei ist ℏω offenbar die Energie, die durch die Störung in das System hinein- bzw. aus dem System herausgepumpt wird. Im Fall der Bestrahlung eines Atoms ist ℏω die Ener gie der Strahlung, d. h. des elektromagnetischen Felds. Bringt die Störung Energie in das System hinein, d. h., wird das System angeregt (oberes Vorzeichen in Gl. (24.22)), so spricht man von Absorption, wird hingegen durch die Störung dem System Energie entzogen, wobei das System sich abregt, sprechen wir von stimulierter Emission, siehe Abb. 24.10. Der obige Ausdruck für die Übergangsrate wurde abgeleitet unter der Vorausset zung, dass die Zeitdauer der Störung t groß gegenüber der charakteristischen Zeit 2π/ω nm ist. Nur für solche Zeiten können wir die Funktion f t (ω) durch eine δ-Funk tion ersetzen, was auf die energieerhaltenden Übergänge führt. Für periodische Stö rungen, die nur über eine kurze Zeit wirken, werden die Abweichungen der Funktion f t (ω) von der δ-Funktion wesentlich und wir erhalten auch Übergänge, bei denen sich die Energie ändert. En
Em
ℏω
ℏω
En
Em (a)
(b)
Abb. 24.10: (a) Absorption, (b) stimulierte Emission.
25 Streutheorie Um die Struktur kleiner Objekte wie Mikroorganismen (z. B. Bakterien) zu untersu chen, betrachten wir diese unter einem Mikroskop. Das Prinzip des Mikroskopierens basiert auf der Streuung des Lichts an dem zu untersuchenden Objekt: Licht fällt auf das zu untersuchende Objekt und wird an diesem gestreut und gelangt über ein Sys tem von optischen Linsen schließlich in unser Auge. Das gestreute Licht enthält die gesamte Information über die Struktur des zu untersuchenden Objekts. Das Linsen system dient lediglich zur Vergrößerung, d. h. der „Spreizung“ der gestreuten Licht strahlen, damit wir die in ihnen enthaltene Information mit unserem Auge auflösen, d. h. wahrnehmen können. Das Auflösungsvermögen eines Mikroskops wird bekannt lich durch die Wellenlänge des Lichts begrenzt. Die Wellenlänge der benutzten Wel len muss klein gegenüber den Abmessungen der zu untersuchenden Objekte sein, da sonst Interferenzeffekte das Bild verwaschen. Um die Struktur von sehr kleinen Objekten wie den Atomkernen oder den Ele mentarteilchen auflösen zu können, reichen Lichtwellen nicht mehr aus. Man benö tigt dazu Wellen sehr viel kleinerer Wellenlängen, wie sie quantenmechanische Wel len hochenergetischer Teilchen besitzen. Aus diesem Grunde baut man gigantische Teilchenbeschleuniger, um Ionen, Atomkerne oder Elementarteilchen auf sehr hohe Energien zu beschleunigen und diese hochenergetischen Teilchen dann an den zu un tersuchenden Mikroobjekten zu streuen. Vom konzeptionellen Standpunkt her sind diese Streuexperimente nichts weiter als Mikroskopieren mit sehr kurzwelligen Strah len. Die meisten unserer Daten bzw. Informationen über den Aufbau von Atomkernen und Elementarteilchen sind aus Streuexperimenten gewonnen. Durch die Streuung von geladenen Teilchen (z. B. α-Teilchen, E. Rutherford 1900) wissen wir, dass Atome aus einem positiv geladenen Kern bestehen, der nahezu die gesamte Masse trägt und von Elektronen umgeben ist. Die Streuung von Elektronen oder Photonen (RöntgenStrahlung) am Festkörper gibt Information über die räumliche Anordnung der Ato me. Diese können z. B. periodische Strukturen (Kristalle) bilden. Durch Elektronen streuung an Atomkernen bzw. Nukleonen lassen sich die Ladungsverteilungen dieser Objekte bestimmen. Dabei wurde gefunden, dass die Protonen und Neutronen keine „elementaren Teilchen“ sind, sondern eine innere Struktur besitzen. Die Streuung von Protonen an Protonen oder schwereren Atomkernen gibt Aufschlüsse über die Form, Stärke und Reichweite der starken Wechselwirkung (Kernkräfte). Um die in den ex perimentellen Streudaten enthaltene Information zu extrahieren, benötigt man eine theoretische Analyse dieser Streuexperimente. Im Folgenden soll deshalb die Quan tentheorie der Streuung behandelt werden.
https://doi.org/10.1515/9783110586077-003
25.1 Der Streuprozess
| 53
25.1 Der Streuprozess Der prinzipielle Aufbau eines Streuprozesses ist in Abb. 25.1 dargestellt. Eine Teilchen quelle, die z. B. bei Elektronen oder α-Teilchen durch eine radioaktive Substanz gege ben sein kann, emittiert Teilchen, die anschließend in einem Beschleuniger auf eine bestimmte Energie beschleunigt werden. Die Teilchen, welche die Quelle bzw. den Be schleuniger verlassen, repräsentieren Wellenpakete mit mittlerem Impuls p, die sich kräftefrei auf das Streuzentrum, das sogenannte Target („Zielscheibe“), zubewegen. Damit diese Teilchen einen einigermaßen gut definierten Impuls besitzen, muss die mittlere Wellenlänge λ klein gegenüber der räumlichen Ausdehnung d des Wellen pakets sein: Ein wohl definierter Impuls verlangt, dass die Impulsunschärfe ∆p klein gegenüber dem Impuls p = kℏ = 2πℏ/λ ist. Die räumliche Ausdehnung d definiert die Ortsunschärfe ∆x ≃ d und aufgrund der Unschärferelation gilt: ∆p ≳
ℏ ℏ ≃ . ∆x d
Daher finden wir:
∆p ℏ λ λ ≳ ≃ , p d 2πℏ d sodass ein wohl definierter Impuls ∆p/p ≪ 1 in der Tat λ ≪ d impliziert. Dennoch soll te das Wellenpaket hinreichend scharf gebündelt sein, damit das Teilchenbild noch realisiert ist. Am Target, welches durch ein zweites Teilchen gegeben sein kann, wird ein Teil des Wellenpakets gestreut. Bei der theoretischen Beschreibung des Streuprozesses werden wir voraussetzen, dass die Wechselwirkung zwischen einfallendem Teilchen und Streuzentrum eine relativ kurze Reichweite besitzt und durch ein (lokalisiertes und zeitunabhängiges) Potenzial V(x) beschrieben werden kann, das in diesem Zusammenhang als Streu potenzial bezeichnet wird. Letztere Annahme impliziert, dass das Target ruht und unendlich schwer ist, sodass kein Rückstoß entsteht. Für ein zeitunabhängiges Streu Detektor
gestreutes Teilchen
Teilchenquelle
Beschleuniger
emittiertes Teilchen (Wellenpaket)
beschleunigtes Teilchen v
d
Abb. 25.1: Schematische Darstellung eines Streuexperiments.
θ-Streuwinkel
T
54 | 25 Streutheorie
potenzial tritt wegen der Energieerhaltung nur elastische Streuung auf. Wir nennen ein Potenzial kurzreichweitig, wenn die Bedingung lim |x| |V(x)| = 0
(25.1)
|x|→∞
erfüllt ist. Dazu ist offenbar erforderlich, dass das Potenzial V(x) für |x| → ∞ schnel ler als 1/|x| abfällt. Das Coulomb-Potenzial erfüllt offensichtlich gerade nicht diese Bedingung. In Abb. 25.2 ist die räumliche Ausdehnung der Wellenfunktion in den einzelnen Phasen des Streuexperiments schematisch dargestellt. Das gestreute Wellenpaket besteht i. A., ähnlich wie im eindimensionalen Fall (siehe Abschnitt 9.2), aus einem gestreuten und einem ungestreuten Anteil (Abb. 25.2b) und bewegt sich asympto tisch (d. h. in großen Entfernungen vom Streuzentrum) wieder wechselwirkungsfrei (Abb. 25.2c). Der gestreute Teil des Wellenpakets wird dann von einem Detektor in gro ßer Entfernung vom Streuzentrum unter einem Winkel (θ, ϕ) dem sogenannten Streu winkel, relativ zur Richtung des einfallenden Wellenpakets registriert (Abb. 25.2d). Die Wahrscheinlichkeit, dass ein Teilchen in dem Detektor unter dem Raumwinkel dΩ(θ, ϕ) = dΩ(x)̂ nachgewiesen wird, ist durch R D →∞
dw(x)̂ = dΩ
∫
dr r2 |ψ(x, t → ∞)|2 ,
r = |x| ,
x̂ =
x r
0
gegeben, wobei ψ(x, t) die Wellenfunktion bezeichnet und RD der Abstand des Detek tors vom Streuzentrum ist.¹ Spricht der Detektor auf ein Teilchen an, so findet durch diesen Messprozess eine Zustandsreduktion statt. Der nicht in dΩ(θ, ϕ) gestreute Teil der Wellenfunktion (bzw. des Wellenpakets), der eine Alternative zur detektierten Streuung darstellt, wird dabei vernichtet. Hatte die Wellenfunktion vor Registrierung des Teilchens im Detektor die Gestalt ψ = ψ dΩ(θ,ϕ) + ψ , wobei ψ der Teil der Wellenfunktion ist, der nicht in den Raumwinkel dΩ(θ, ϕ) ge streut wird, so ist nach Registrierung des Teilchens im Detektor unter dem Raumwin kel dΩ(ϑ, ϕ) die Wellenfunktion durch ψ dΩ(θ,ϕ) gegeben. Die durch die Teilchendetektierung erfolgte Zustandsreduktion ψ → ψ dΩ(θ,ϕ) ist eine Folge der Wechselwirkung des Teilchens mit dem Detektor, was ein allgemei nes Charakteristikum eines quantenmechanischen Messprozesses ist und nicht Ergeb nis des Streuprozesses.
1 Da der Abstand Detektor – Streuzentrum als sehr groß gegenüber der Ausdehnung des Streuzen trums vorausgesetzt wird, können wir R D → ∞ setzen. Dies bedingt formal auch eine unendlich gro ße Flugzeit t → ∞. Im realen Streuexperiment ist die Flugzeit jedoch endlich und (in Abhängigkeit von der Teilchenenergie) i. A. auch sehr kurz. Dennoch ist die Flugzeit sehr groß gegenüber der Zeit, die das gestreute Teilchen im Gebiet mit V(x) ≠ 0 verbringt.
25.1 Der Streuprozess
|
55
v
T
(a)
T (b)
TT
(c)
D
(d)
T
θ
Abb. 25.2: Schematischer Ablauf des Streu prozesses: (a) einfallendes (ebenes) Wellen paket, (b) eigentlicher Streuprozess: Wech selwirkung des eingelaufenen Wellenpakets mit dem Target (T), (c) Nach der Streuung: Überlagerung von durchlaufendem ebenen Wellenpaket und gestreutem kugelförmigen Wellenpaket. Wegen der Teilchenzahlerhal tung müssen einfallendes und gestreutes Wellenpaket destruktiv in Vorwärtsrichtung interferieren. (d) Detektierung (D) des ge streuten Teilchens (ebenes Wellenpaket).
In diesem Zusammenhang sei daran erinnert, dass das Wellenpaket zwar Lösung der freien zeitabhängigen Schrödinger-Gleichung, jedoch kein stationärer Eigenzu stand von H0 = p2 /2m ist, d. h., das Wellenpaket zerfließt auch bereits ohne Streu potenzial. Die Flugzeit des Wellenpakets darf deshalb nicht zu groß sein (d. h. seine Geschwindigkeit nicht zu klein), damit dieses Zerfließen vernachlässigt werden kann.
56 | 25 Streutheorie
1.
2.
3.
4.
In einem Streuexperiment werden i. A. nicht einzelne Teilchen beschleunigt. Vielmehr fällt ein stetiger (oder gepulster) Teilchenstrom auf das Target. Die Teilchendichte in dem einfallenden Teilchenstrom muss so klein sein, dass deren Wechselwirkung untereinander vernachlässigt wer den kann. Damit eine Streuung (Störung) des Wellenpakets stattfindet, muss seine transversale Ausdeh nung in das Wirkungsgebiet des Potenzials reichen (siehe Abb. 25.2a). Für zu große Stoßpara meter b (siehe Abb. 25.4) überlappt das Wellenpaket nicht mehr mit dem Streupotenzial und es erfolgt keine Streuung. Ein Target besteht i. A. aus vielen Atomen, die alle als Streuzentren fungieren. Zweckmäßigerwei se werden deshalb gewöhnlich dünne Targets benutzt, sodass das einfallende Wellenpaket nur an einem einzelnen Atom gestreut wird (keine Mehrfachstreuung). Der ungestört durchlaufende Teil und der in Vorwärtsrichtung gestreute Teil des Wellenpakets lassen sich experimentell nicht trennen. Aus diesem Grunde muss ein Detektor unter hinreichend großem Winkel Θ aufgestellt werden, damit dieser durch den durchlaufenden Teil des Wellen pakets nicht zerstört wird.
25.2 Streuung eines Wellenpakets am Potenzial Im Folgenden wollen wir die Streuung eines einzelnen Wellenpakets beschreiben. Da zu müssen wir die zeitabhängige Schrödinger-Gleichung für das einfallende Wellen paket bei Anwesenheit des Streupotenzials lösen. Dies liefert uns dann ein dynami sches Bild des Streuprozesses, das die zeitliche Evolution des Wellenpakets von der Quelle bis zum Detektor aufzeigt und in Abb. 25.2 schematisch dargestellt ist: Zur Zeit t0 → −∞ verlässt das einfallende Wellenpaket ψ0 (x, t) die Quelle bzw. den Beschleuniger. Das freie Wellenpaket ψ0 (x, t) zerlegen wir nach den Eigenzustän den |k⟩ des ungestörten Hamilton-Operators H0 = −
ℏ2 ∆, 2m
H0 |k⟩ = E k |k⟩ ,
Ek =
ℏ2 k 2 , 2m
(25.2)
welche durch die ebenen Wellen ⟨x|k⟩ = e ik⋅x gegeben sind: i d3 k C(k)e− ℏ E k t |k⟩ . (25.3) 3 (2π) ̄ „gepeakt“, der durch die Gruppen Die Amplituden C(k) sind bei dem Impuls ℏk = ℏk
|ψ0 (t)⟩ = ∫
geschwindigkeit (4.26) des Wellenpakets vg =
̄ ℏk m
gegeben ist. Das Wellenpaket |ψ0 (t)⟩ (25.3) löst die zeitabhängige Schrödinger-Glei chung d iℏ |ψ0 (t)⟩ = H0 |ψ0 (t)⟩ , dt
25.2 Streuung eines Wellenpakets am Potenzial
| 57
ist jedoch kein stationärer Eigenzustand zu H0 . Das Wellenpaket zerfließt deshalb selbst ohne äußere Störung. Dieses Zerfließen ist allerdings für die nachfolgenden Be trachtungen irrelevant. Das Wellenpaket |ψ0 (t)⟩ (25.3) repräsentiert den Anfangszustand des Streupro zesses: lim |ψ(t0 )⟩ = lim |ψ0 (t0 )⟩ . (25.4) t 0 →−∞
t 0 →−∞
Die Veränderung der Wellenfunktion im Verlauf des Streuprozesses wird durch die zeitabhängige Schrödinger-Gleichung iℏ
d |ψ(t)⟩ = H|ψ(t)⟩ dt
beschrieben. Hierbei ist H = H0 + V(x) der vollständige Hamilton-Operator des Systems, der neben dem Operator der freien Bewegung H0 auch das Streupotenzial V(x) enthält, das die Wechselwirkung des ein laufenden Teilchens mit dem Streuzentrum repräsentiert. Für ein zeitunabhängiges Streuzentrum ist die Lösung der zeitabhängigen Schrö dinger-Gleichung durch i |ψ(t)⟩ = e− ℏ H(t−t 0) |ψ(t0 )⟩ (25.5) gegeben. Der Streuzustand |ψ(t)⟩, der sich aus dem für t0 → −∞ vorgegebenen freien Wellenpaket |ψ0 (t0 )⟩ entwickelt, muss der Randbedingung (25.4) genügen. Wir wäh len deshalb in (25.5) t0 → −∞ und erhalten nach Einsetzen der Randbedingung (25.4): |ψ(t)⟩ = e− ℏ Ht lim e ℏ Ht 0 |ψ0 (t0 )⟩ . i
i
t 0 →−∞
(25.6)
Für t0 → −∞ war das Wellenpaket ψ0 (x, t) in der Nähe der Quelle lokalisiert, wo das Streupotenzial verschwindet. Deshalb hat H auf ψ0 (x, t) asymptotisch (für t0 → −∞) denselben Effekt wie H0 und der Limes t0 → −∞ existiert, da i
i
lim e ℏ Ht 0 |ψ0 (t0 )⟩ = lim e ℏ H0 t 0 |ψ0 (t0 )⟩
t 0 →−∞
t 0 →−∞
= lim e ℏ H0 t 0 e− ℏ H0 t 0 |ψ0 (0)⟩ = |ψ0 (0)⟩ . i
i
t 0 →−∞
Setzen wir in (25.6) die Zerlegung (25.3) des Wellenpakets |ψ0 (t0 )⟩ ein, so erhalten wir für den Streuzustand: |ψ(t)⟩ = e− ℏ Ht lim ∫ i
t 0 →−∞
i d3 k C(k)e− ℏ (E k −H)t 0 |k⟩ . 3 (2π)
(25.7)
Aus der Tatsache, dass der Limes t0 → −∞ für das gesamte (im Ortsraum lokali sierte) Wellenpaket |ψ(t)⟩ existiert, kann noch nicht geschlossen werden, dass dieser Limes auch für eine einzelne (unendlich ausgedehnte) ebene Welle |k⟩ existiert. Im Abschnitt 25.3 wird sich jedoch zeigen, dass dies der Fall ist. Dann können wir den
58 | 25 Streutheorie Grenzwert vor der Integration ausführen und der Streuzustand (Wellenpaket) |ψ(t)⟩ (25.7) lässt sich in der Form |ψ(t)⟩ = e− ℏ Ht ∫ i
schreiben, wobei
d3 k (+) C(k)|φ k ⟩ (2π)3
(+)
|φ k ⟩ = lim e− ℏ (E k −H)t 0 |k⟩ . i
(25.8)
(25.9)
t 0 →−∞
Für eine Funktion f(t0 ), für welche der Grenzwert t0 → −∞ existiert, kann dieser in der Form 0
lim f(t0 ) = lim ε ∫ dt e εt f(t ) ,
t 0 →−∞
ε→0
ε>0
(25.10)
−∞
geschrieben werden, die als Abel’scher Grenzwertsatz bezeichnet wird. Zum Beweis bemerken wir, dass das Integral auf der rechten Seite dieser Gleichung nach Skalie rung der Integrationsvariablen mit ε die Gestalt 0
0
−∞
−∞
x ε ∫ dt e εt f(t ) = ∫ dx e x f ( ) ε
annimmt. Für alle x < 0 liefert der Limes ε → 0: x lim f ( ) = f(−∞) , ε→0 ε
x 0) durchgeführt, sodass sämtliche mathematischen Operationen erlaubt wa ren und erst am Ende der Rechnungen den Regulator μ entfernt, d. h. den Limes μ → 0 genommen. * Dieser Abschnitt ist für das Verständnis der übrigen Abschnitte nicht erforderlich und kann deshalb beim ersten Lesen übersprungen werden.
74 | 25 Streutheorie teressiert, ist die Wellenfunktion |ψ(t)⟩ im asymptotischen Bereich t → ∞, wo sich das gestreute Wellenpaket wegen der endlichen Reichweite des Streupotenzials be reits wieder kräftefrei bewegt.⁶ In diesem Gebiet muss es sich deshalb, wie auch der Anfangszustand |ψ(t → −∞)⟩, siehe Gl. (25.3), als Überlagerung von ebenen Wellen schreiben lassen, |ψ(t → ∞)⟩ = lim ∫ t→∞
i d3 k ̃ C(k)e− ℏ E k t |k⟩ , 3 (2π)
̃ mit Koeffizienten C(k), die sich aufgrund der Streuung von denen des einfallenden ̃ Wellenpakets C(k) unterscheiden. Ziel der Streutheorie ist es, die Koeffizienten C(k) des gestreuten Wellenpakets aus den C(k) des einfallenden Wellenpakets zu bestim men. Diese Aufgabe lässt sich am einfachsten im Wechselwirkungsbild lösen, wo die ungestörte Evolution aus der Wellenfunktion eliminiert ist und eine nichttriviale Zeit evolution nur durch die Störung generiert wird (siehe Gl. (23.29)).
25.7.1 Die S-Matrix Im Wechselwirkungsbild⁷ i
|ψW (t)⟩ = e ℏ H0 t |ψ(t)⟩ werden die Wellenfunktionen von einlaufenden und auslaufenden Wellenpaketen asymptotisch zeitunabhängig: d3 q C(q)|q⟩ , t→−∞ (2π)3 d3 q ̃ C(q)|q⟩ . lim |ψW (t)⟩ = ∫ t→∞ (2π)3 lim |ψW (t)⟩ = ∫
Beachten wir, dass die Zeitevolution im Wechselwirkungsbild sich mittels Evolutions operator UW (t, t0 ) durch (23.33) |ψW (t)⟩ = UW (t, t )|ψW (t )⟩ ausdrücken lässt, so erhalten wir für die exakte Wellenfunktion im Wechselwirkungs bild (unter Benutzung der Vollständigkeitsrelation der Impulseigenzustände) die Dar stellung d3 k ⟨k |ψW (t)⟩ = ∫ ⟨k |UW (t, t )|k⟩⟨k|ψW (t )⟩ (2π)3 6 Die charakteristische Zeitskala beim Streuprozess ist durch R/|v g | gegeben, wobei R die Reichweite des Streupotenzials und v g die Gruppengeschwindigkeit des Wellenpakets bezeichnet. Asymptotisch große Zeiten bedeutet deshalb t ≫ R/|v g |. 7 Den Referenzzeitpunkt t0 (siehe Fußnote 5 in Abschnitt 23.4), an dem |ψW (t0 )⟩ = |ψ(t0 )⟩ gilt, haben wir hier willkürlich auf t0 = 0 gesetzt.
25.7 Die Streumatrix
| 75
Zwischen den asymptotischen Werten C(k) = lim ⟨k|ψW (t)⟩ , t→−∞
̃ ) = lim ⟨k |ψW (t)⟩ C(k t→∞
besteht daher ein linearer Zusammenhang 3 ̃ ) = ∫ d k S(k , k)C(k) , C(k (2π)3
(25.37)
wobei die hier enthaltenen Koeffizienten S(k , k) = lim ⟨k |UW (t, t )|k⟩
(25.38)
t→∞ t →−∞
die Elemente der Streumatrix bzw. S-Matrix sind. Die S-Matrix, definiert durch die Ma trixelemente des unitären Zeitentwicklungsoperators UW (t, t ), ist offensichtlich auch unitär, was die Erhaltung der Wahrscheinlichkeit in einem Streuprozess ausdrückt. Setzen wir in die Definition der S-Matrix (25.38) für den Zeitentwicklungsopera tor im Wechselwirkungsbild den expliziten Ausdruck (23.34) ein und berücksichtigen, dass |k⟩ Eigenvektor zu H0 mit Eigenwert E k ist, so erhalten wir:
S(k , k) = lim ⟨k |e ℏ H0 t e− ℏ H(t−t ) e− ℏ H0 t |k⟩ i
i
i
t→∞ t →−∞
= lim ⟨k |e ℏ (E k −H)t e− ℏ (E k −H)t |k⟩ . i
i
t→∞ t →−∞
Mit der Definition
(±)
|φ k ⟩ = lim e− ℏ (E k −H)t |k⟩ i
(25.39)
t→∓∞
lässt sich die S-Matrix schreiben als (−)
(+)
S(k , k) = ⟨φ k |φ k ⟩ .
(25.40)
(+)
Nach Gl. (25.9) ist |φ k ⟩ gerade die bereits früher eingeführte Streuwellenfunktion. Die (+)
in den Abschnitten 25.2 und 25.3 für |φ k ⟩ vorgenommenen Manipulationen lassen (−)
sich analog für |φ k ⟩ durchführen. Unter Benutzung des Abel’schen Grenzwertsatzes⁸ ∞
lim f(t) = lim ε ∫ dt e−εt f(±t ) ,
t→±∞
ε→0
ε>0
(25.41)
0
8 Gl. (25.41) folgt für t → −∞ aus der früher bewiesenen Beziehung (25.10) durch Variablensubstitu tion t → −t . Für t → +∞ lässt sich Gl. (25.41) analog zu Gl. (25.10) beweisen.
76 | 25 Streutheorie (±)
erhalten wir für die Funktionen |φ k ⟩ (25.39) die Darstellung (vgl. Gl. (25.11)) (±)
|φ k ⟩ = lim
ε→0
iε |k⟩ . ±(E k − H) + iε
(−)
(25.42)
(+)
Hieraus findet man, dass |φ k ⟩ genau wie |φ k ⟩ der stationären Schrödinger-Glei chung, vgl. (25.13), (ℏk)2 (±) (±) , H|φ k ⟩ = E k |φ k ⟩ , E k = 2m und außerdem der Lippmann-Schwinger-Gleichung (25.16) (±)
(±)
(±)
|φ k ⟩ = |k⟩ + G0 (E k )V|φ k ⟩ genügt.
25.7.2 Die T -Matrix Wir formen die Darstellung (25.42) der Streuwellenfunktionen noch etwas um, indem wir im Zähler eine 0 addieren (±)
iε ± (E k − H) ∓ (E k − H) |k⟩ ± (E k − H) + iε 1 = lim (1 + (H − E k )) |k⟩ . ϵ→0 E k − H ± iε
|φ k ⟩ = lim
ε→0
Ersetzen wir hier im Zähler H durch seine explizite Form H0 + V und beachten, dass |k⟩ Eigenzustand zu H0 mit Eigenwert E k ist, so erhalten wir: (±)
|φ k ⟩ = lim (1 + ε→0
1 V) |k⟩ . E k − H ± iε
Man beachte, dass hier im Nenner der volle Hamilton-Operator H steht. Mit der Defi nition (23.56) der vollen Green’schen Funktion G(+) (E) können wir diese Darstellung noch etwas kompakter schreiben (±)
|φ k ⟩ = (1 + G(±) (E k )V) |k⟩ . Hieraus ergibt sich unmittelbar der Zusammenhang (−)
(+)
|φ k ⟩ = |φ k ⟩ + (G(−) (E k ) − G(+) (E k )) V|k⟩ bzw. die adjungierte Gleichung (−)
(+)
⟨φ k | = ⟨φ k | + ⟨k|V (G(+) (E k ) − G(−) (E k )) , wobei wir die Beziehung G(±) (E)† = G(∓) (E)
(25.43)
25.7 Die Streumatrix
| 77
benutzt haben, welche unmittelbar aus der Definition (23.56) der Green’schen Funk (±) tion folgt. Benutzen wir ferner die Tatsache, dass die Streuzustände |φ k ⟩ (nichtnor mierbare) Eigenzustände des vollen Hamilton-Operators H sind, so gilt: (+)
1 1 (+) − ) |φ k ⟩ E − H + iε E − H − iε 1 1 (+) = lim ( − ) |φ k ⟩ ε→0 E − E k + iε E − E k − iε −2iε (+) = lim |φ k ⟩ ε→0 (E − E k )2 + ε2
(G(+) (E) − G(−) (E)) |φ k ⟩ = lim ( ε→0
(+)
= −i2πδ(E − E k )|φ k ⟩ .
(25.44)
Im letzten Schritt haben wir die Definition der δ-Funktion (A.5), (A.6) benutzt. Dassel be Ergebnis lässt sich auch unmittelbar aus der bekannten Beziehung (A.27) 1 1 = P ∓ iπδ(x) ε→0 x ± iε x lim
gewinnen, wobei P den Hauptwert bezeichnet. Unter Benutzung der oben abgeleiteten Beziehungen (25.43) und (25.44) erhalten wir für die S-Matrix (25.40) die Darstellung (+)
S(k , k) = (2π)3 δ(k − k) − i2πδ(E k − E k )⟨k |V|φ k ⟩ .
(25.45)
Der erste Term verändert die Wellenfunktion nicht (siehe Gl. (25.37)) und gibt damit die durchgehende Welle wieder. Der zweite Term hingegen enthält den gesamten Ef fekt der Streuung und verschwindet offenbar für V → 0. Das hier auftretende Matrix element stellt bis auf Normierung gerade die früher eingeführte Streuamplitude f k (k̂ ) (25.22) dar. Somit finden wir: S(k , k) = (2π)3 δ(k − k) + i2πδ(E k − E k )
2πℏ2 f k (k̂ ) . m
Die δ-Funktion in der S-Matrix garantiert die Energieerhaltung. Die oben abgeleitete S-Matrix beschreibt damit nur die elastische Streuung. Die durch die S-Matrix gewähr leistete Energieerhaltung ist eine Folge der Annahme, dass die Streuung durch ein zeitunabhängiges Potenzial beschrieben wird. Wenn das Streuzentrum oder ein ge streutes Teilchen innere Anregung besitzt, so kann ein Teil der Bewegungsenergie des gestreuten Teilchens in Anregungsenergie umgewandelt werden. Wir sprechen dann von einer inelastischen Streuung. Energieerhaltung gilt dann nur für die Gesamtener gie, d. h. kinetische Energie plus innere (Anregungs-)Energie. (+) Es hat sich eingebürgert, die Matrixelemente ⟨k |V|φ k ⟩ als Elemente einer Matrix zwischen ebenen Wellen zu interpretieren: (+)
⟨k |V|φ k ⟩ =: ⟨k |T|k⟩ = T(k , k) .
(25.46)
78 | 25 Streutheorie Die so definierte Matrix T(k , k) wird als Transfermatrix bzw. T-Matrix bezeichnet. (+) Setzen wir in der Definition der T-Matrix für die Streuwellenfunktion |φ k ⟩ die Lipp mann-Schwinger-Gleichung (25.16) ein, so erhalten wir eine Integralgleichung für die T-Matrix, (+)
(+)
⟨k |T|k⟩ = ⟨k |V|k⟩ + ⟨k |VG0 (E k )V|φ k ⟩ d3 k (+) (+) ⟨k |VG0 (E k )|k ⟩⟨k |V|φ k ⟩ (2π)3 d3 k (+) ⟨k |VG0 (E k )|k ⟩⟨k |T|k⟩ , = ⟨k |V|k⟩ + ∫ (2π)3 = ⟨k |V|k⟩ + ∫
die wir formal auch als
(+)
T(E) = V + VG0 (E)T(E) schreiben können. Per Definition (25.46) der T-Matrix hängt sie mit der Streuampli tude (25.22) zusammen über: ⟨k |T|k⟩ = −
2πℏ2 f k (k̂ ) m
und die S-Matrix (25.45) besitzt die Gestalt S(k , k) = (2π)3 δ(k − k) − i2πδ(E k − E k )⟨k |T(E k )|k⟩ .
25.7.3 Das optische Theorem Aus der Definition der S-Matrix als Matrixelement des Zeitentwicklungsoperators im Wechselwirkungsbild folgt unmittelbar, dass die S-Matrix unitär ist: (2π)3 δ(k − k) = ∫
d3 k d3 k S(k , k )S† (k , k) = ∫ S(k , k )S∗ (k, k ) . 3 (2π) (2π)3
Dies gewährleistet die Erhaltung der Teilchenzahl während des Streuprozesses. Set zen wir in die obige Unitaritätsbedingung den expliziten Ausdruck für die S-Matrix (25.45) ein, so erhalten wir: (2π)3 δ(k − k ) = ∫
d3 k (+) [(2π)3 δ(k − k ) − i2πδ(E k − E k )⟨k |V|φ k ⟩] (2π)3 (+)
× [(2π)3 δ(k − k ) − i2πδ(E k − E k )⟨k|V|φ k ⟩] und nach Auflösung der Klammern: (+)
(+)
0 = −i2πδ(E k − E k )⟨k |V|φ k ⟩ + i2πδ(E k − E k )⟨k|V|φ k ⟩∗ + (2π)2 ∫
d3 k (+) (+) δ(E k − E k )δ(E k − E k )⟨k |V|φ k ⟩⟨k|V|φ k ⟩∗ . (2π)3
∗
25.7 Die Streumatrix
| 79
Im letzten Ausdruck lässt sich hier das Integral über den Betrag von k aufgrund der δ-Funktion ausführen, und wir finden mit m d3 k = k 2 dk dΩ k , δ(E k − E k ) = 2 δ(k − k ) ℏ k die Beziehung (+)
(+)
{i⟨k |V|φ k ⟩ − i⟨k|V|φ k ⟩∗ −
2πm k (+) (+) ∫ dΩ k 2 ⟨k |V|φ k ⟩⟨k|V|φ k ⟩∗ } δ(E k − E k ) = 0 , (2π)3 ℏ
wobei |k | = |k|. Diese Gleichung ist trivial erfüllt für E k ≠ E k . Für k = k liefert sie jedoch eine nichttriviale Bedingung (+)
−2 Im {⟨k|V|φ k ⟩} =
mk ∫ dΩ k (2π)2 ℏ2
2 ⟨k|V|φ(+) k ⟩ .
Benutzen wir die Definition der Streuamplitude (25.22), so können wir die letzte Glei chung in der Form ̂ = k ∫ dΩ k |f k (Ω k )|2 2 Im {f k (k)} (25.47) 2π schreiben. Die beiden Vektoren k und k , von denen die Streuamplitude f k (k̂ ) ab
hängt, besitzen den gleichen Betrag (elastische Streuung) |k | = |k| und spannen den Streuwinkel θ auf (siehe Abb. 25.7). Charakterisieren wir die Streuamplitude wie üb lich durch den Streuwinkel θ und den Betrag der Wellenzahl,⁹ f k (k̂ ) ≡ f k (θ) , und beachten, dass für k = k der Streuwinkel verschwindet, so liefert die linke Seite von Gl. (25.47): 2 Im {f k (θ = 0)} . Mit der Definition des totalen Wirkungsquerschnitts (siehe Gl. (25.31)) σ = ∫ dΩ |f k (Ω)|2 erhalten wir dann aus Gl. (25.47): σ=
4π Im{f k (θ = 0)} . k
(25.48)
Dies ist das optische Theorem. Aus der obigen Ableitung wird ersichtlich, dass das optische Theorem eine unmittelbare Konsequenz aus der Unitarität der S-Matrix ist und damit die Erhaltung der Teilchenzahl im quantenmechanischen Streuprozess ausdrückt. 9 Wir ignorieren hier die Abhängigkeit der Streuamplitude vom Polarwinkel ϕ (siehe Abb. 25.4), da in dem nachfolgend interessierenden Fall θ = 0 der Winkel ϕ irrelevant ist.
80 | 25 Streutheorie
25.8 Streuung am Zentralpotenzial: Partialwellenzerlegung 25.8.1 Partialwellenzerlegung der Streufunktion Falls das Streupotenzial sphärische Symmetrie besitzt, ist der Drehimpuls während des gesamten Streuprozesses erhalten. Ähnlich wie bei den gebundenen Zuständen lässt sich dann auch bei der Bestimmung der Streuzustände sehr vorteilhaft die Dreh impulserhaltung ausnutzen. Dazu zerlegen wir die Streuzustände nach Drehimpuls eigenfunktionen (+)
(+)
∞
l
φ k (x) = ⟨x|φ k ⟩ = ∑ ∑ a klm (r)Y lm (x)̂ .
(25.49)
l=0 m=−l
Zweckmäßigerweise legen wir den Wellenvektor k der einfallenden ebenen Welle in z-Richtung (Quantisierungsachse des Drehimpulses): k = ke z . Durch die einfallende ebene Welle wird die Richtung k̂ = e z ausgezeichnet und somit die ursprüngliche durch das Zentralpotenzial V(r) vorgege bene sphärische Symmetrie auf die axiale Symmetrie (Invarianz gegenüber Drehun gen um die z-Achse) gebrochen. Aufgrund der axialen Symmetrie des Streuprozesses (+) dürfen die Streuzustände φ k (x) nicht vom Winkel ϕ abhängen. Da die Kugelfunk tionen von der Form (15.60) Y lm (θ, ϕ) = e imϕ χ lm (θ) sind, können dann zur obigen Zerlegung nach Drehimpulseigenzuständen (25.49) nur Zustände mit m = 0 beitragen. Benutzen wir (15.71) Y l,m=0(θ, ϕ) = √
2l + 1 P l (cos θ) , 4π
(25.50)
so können wir die Streufunktion in der Form (+)
∞
∞
u kl (r) P l (cos θ) r l=0
φ k (x) = ∑ R kl (r)P l (cos θ) = ∑ l=0
schreiben, wobei wie üblich (siehe Abschnitt 17.2) R kl (r) =
u kl (r) r
(25.51)
25.8 Streuung am Zentralpotenzial: Partialwellenzerlegung |
81
die Radialfunktion bezeichnet. Unter Benutzung von (17.6) und¹⁰ L2 P l (cos θ) = ℏ2 l(l + 1)P l (cos θ) reduziert sich dann die Schrödinger-Gleichung für die Streufunktionen, Gl. (25.13), auf die Radialgleichung (17.13) für einen festen Drehimpuls l u kl (r) + (k 2 − v l (r))u kl (r) = 0 ,
(25.52)
wobei k = √2mE/ℏ wieder die Wellenzahl bezeichnet und v l (r) =
2m ℏ2 l(l + 1) (V(r) + ) , ℏ2 2mr2
das mit Faktor 2m/ℏ2 skalierte effektive Radialpotenzial (17.11) ist, das neben dem ursprünglichen Streupotenzial V(r) noch das Zentrifugalpotenzial L2 /2mr2 enthält. Aufgrund der sphärischen Symmetrie des Streupotenzials wird jede l-Komponente der Wellenfunktion unabhängig von den übrigen Drehimpulskomponenten gestreut. Eine l-Komponente der Streuwellenfunktion wird als Partialwelle bezeichnet.
25.8.2 Die Streuphase Da das Streupotenzial nur eine endliche Reichweite besitzt, muss die Wellenfunk (+) tion φ k (x) des vollen Streuproblems asymptotisch für k|x| ≫ l (d. h. außerhalb der Reichweite des Potenzials) ebenfalls die Form der Wellenfunktion der freien Be wegung besitzen. Wir kennen die Lösung der Radialgleichung für verschwindendes Streupotenzial V(r) = 0 (freie Bewegung). Dazu beachten wir, dass die Lösung der freien Schrödinger-Gleichung durch eine ebene Welle e ik⋅x gegeben ist. Fällt diese parallel zur z-Achse ein (d. h. k̂ = e z ), so besitzt diese die Partialwellenzerlegung ∞
e ik⋅x = e ikr cos θ = ∑ i l (2l + 1)j l (kr)P l (cos θ) .
(25.53)
l=0
Wir betonen, dass die Darstellung (25.53) nur für k̂ = e z gilt! Der Vergleich von (25.53) mit Gl. (25.51) liefert für die Radialfunktion der freien Bewegung (0)
u kl (r) = i l (2l + 1)j l (kr) . r
10 Diese Beziehung folgt unmittelbar aus L2 Y lm (θ, φ) = ℏ2 l(l + 1)Y lm (θ, φ) und (25.50).
82 | 25 Streutheorie
Dies ist in Übereinstimmung mit dem bereits früher bei der Behandlung der gebun denen Zustände gewonnenen Ergebnis (siehe Abschnitt 17.4): Die Lösungen der freien Radialgleichung (die mit der sphärischen Bessel’schen Differenzialgleichung über einstimmt) sind durch die sphärischen Bessel- bzw. Neumann-Funktionen, j l (kr) und (±) n l (kr), bzw. deren Linearkombinationen h l (z) = j l (z) ± in l (z), den sphärischen Hankel-Funktionen, gegeben. Da die ebene Welle e ik⋅x überall regulär ist, kann in ihrer Partialwellenzerlegung nur die reguläre sphärische Besselfunktion j l (kr), nicht aber die Neumann-Funktion auftreten. Unter Benutzung des asymptotischen Ausdrucks für die sphärischen BesselFunktionen (17.36) lπ 1 j l (z) ≃ sin (z − ) , z ≫ l (25.54) z 2 nimmt die freie Lösung der Radialgleichung die asymptotische Gestalt 1 l lπ i (2l + 1) sin (kr − ) , k 2
(0)
u kl (r) ≃
kr ≫ l
(25.55)
an. Außerhalb der Reichweite des Potenzials muss der Radialanteil u kl (r) der Streu (+) wellenfunktion φ k (x) (25.51) ebenfalls diese Form besitzen. Durch den Einfluss des Streupotenzials ist die Streuwellenfunktion jedoch i. A. gegenüber der frei propagie renden, ungestreuten Welle (25.55) phasenverschoben, sodass ihr Radialanteil die asymptotische Gestalt u kl (r) = C l sin (kr −
lπ + δ l (k)) , 2
kr ≫ l
(25.56)
besitzt, wobei C l ein noch zu bestimmender, komplexer Koeffizient ist, der von der Wellenzahl k abhängt. Die auftretende Phase δ l (k) wird als Streuphase der l-ten Par tialwelle bezeichnet. Sie ist eine für das jeweilige Streupotenzial charakteristische Größe, die von der Energie bzw. Wellenzahl k der einfallenden Teilchen abhängt und offenbar nur bis auf ein Vielfaches von π definiert ist, da sin(x + π) = − sin x und das Vorzeichen der Wellenfunktion irrelevant ist. Mit dem obigen Ausdruck (25.56) für die Radialfunktion nimmt die Streufunktion (25.51) asymptotisch für kr ≫ l die Gestalt (+)
φ k (x) ≃
1 ∞ lπ ∑ C l sin (kr − + δ l ) P l (cos θ) r l=0 2
an. Benutzen wir jetzt 1 ix (e − e−ix ) , 2i so lässt sich der asymptotische Ausdruck der Streufunktion als Summe von ein- und auslaufender Kugelwelle schreiben: sin x =
(+)
φ k (x) ≃
lπ Cl e ikr ∑ e iδ l −i 2 P l (cos θ) r l 2i
−
lπ e−ikr Cl ∑ e−iδ l +i 2 P l (cos θ) , r 2i l
r→∞.
(25.57)
25.8 Streuung am Zentralpotenzial: Partialwellenzerlegung | 83
Die Summe läuft hier im Prinzip über alle Drehimpulse l. Für sehr große l ist die Vor aussetzung für die Gültigkeit der asymptotischen Darstellung (25.54) der Bessel-Funk tionen, kr ≫ l, allerdings nicht mehr erfüllt. Wir werden jedoch im nächsten Abschnitt sehen, dass für ein kurzreichweitiges Potenzial nicht beliebig hohe Drehimpulse l zum Streuprozess beitragen können und somit die Summen in Gl. (25.57) de facto abbre chen. Andererseits wissen wir, dass die Streufunktion ganz allgemein die asymptotische Gestalt (25.20) e ikr (+) , r→∞ (25.58) φ k (x) ≃ e ik⋅x + f k (θ) r besitzen muss, die eine unmittelbare Konsequenz aus der Lippmann-Schwinger-Glei chung (25.16) war. Für die einfallende ebene Welle e ik⋅x , k = ke z , nehmen wir die Zer legung nach Drehimpulseigenzuständen (25.53) und benutzen dabei für die BesselFunktionen die für kr ≫ l gültige asymptotische Darstellung (25.54) ∞
e ik⋅x ≃ ∑ i l (2l + 1) l=0 ∞
= ∑ i l (2l + 1) l=0
1 lπ sin (kr − ) P l (cos θ) kr 2 lπ lπ 1 (e ikr−i 2 − e−ikr+i 2 ) P l (cos θ) . 2ikr
(25.59)
Damit ergibt sich für die asymptotische Form (25.58) der Streuwellenfunktion: (+)
φ k (x) ≃
lπ il e ikr 1 [ ∑ (2l + 1)e−i 2 P l (cos θ) + f k (θ)] r k l 2i
−
lπ il e−ikr 1 [ ∑ (2l + 1)e i 2 P l (cos θ)] , r k l 2i
r→∞.
(25.60)
Sie setzt sich damit aus einer einlaufenden und einer mit einer θ-abhängigen Ampli tude modulierten auslaufenden Kugelwelle zusammen. Die auslaufende Kugelwelle enthält hier auch den gestreuten Anteil (proportional zu f k (θ)), während die einlau fende Kugelwelle e−ikr /r allein durch die einfallende Welle e ik⋅x generiert wird. Vergleich des einlaufenden sphärischen Wellenteils in Gln. (25.57) und (25.60) lie fert wegen der linearen Unabhängigkeit der P l (cos θ) zu verschiedenen l für die Ent wicklungskoeffizienten der Streufunktion: Cl =
lπ 1 l 1 i (2l + 1)e iδ l = (2l + 1)e i(δ l + 2 ) , k k
(25.61)
wobei wir im letzten Ausdruck die Identität e±i 2 l = (±i)l π
benutzt haben. Vergleich der Amplituden der auslaufenden sphärischen Welle in Gln. (25.57) und (25.60) liefert: lπ 1 1 ∑ C l e iδ l −i 2 P l (cos θ) = ∑(2l + 1)P l (cos θ) + f k (θ) . 2i l 2ik l
(25.62)
84 | 25 Streutheorie
Einsetzen von (25.61) in (25.62) liefert für die Streuamplitude: f k (θ) =
1 ∞ 1 ∑ (2l + 1) (e i2δ l − 1) P l (cos θ) . k l=0 2i
Mit
1 i2δ l e iδ l iδ l − 1) = (e (e − e−iδ l ) = e iδ l sin δ l 2i 2i erhalten wir schließlich die Partialwellenzerlegung der Streuamplitude: f k (θ) =
1 ∑(2l + 1)e iδ l sin δ l ⋅P l (cos θ) . k l
(25.63)
Der Einfluss des Streupotenzials ist hier vollständig in den Streuphasen δ l (k) enthal ten: Verschwinden sämtliche Streuphasen δ l (k) = 0, so verschwindet auch die Streu amplitude. Ferner gehen die einzelnen Partialwellen l mit komplexer Amplitude ein. Setzen wir den Ausdruck (25.61) für C l in Gl. (25.56) ein, so erhalten wir die asympto tische Form der Radialfunktion R kl (r) in der Partialwellenzerlegung (25.51) der Streu wellenfunktion: R kl (r) =
u kl (r) lπ il ≃ (2l + 1)e iδ l sin (kr − + δ l (k)) , r kr 2
kr ≫ l .
(25.64)
Dieser Ausdruck gilt unabhängig von der konkreten Form des (sphärisch symmetri schen) Streupotenzials. Für δ l = 0 reduziert sich dieser Ausdruck in der Tat auf die Radialfunktion der freien Bewegung (25.55). Die Streuphasen sind nur bis auf ein Viel faches von π definiert. Diese Unbestimmtheit können wir eliminieren, indem wir die Streuphase für ein verschwindendes Potenzial auf δ l = 0 setzen und das gegebene Po tenzial V(r) aus dem Potenzial λV(r) (λ > 0) durch stetige Variation des Parameters λ von 0 auf 1 erzeugen und dabei fordern, dass die Streuphase eine stetige Funktion von λ ist. Die Streuphase besitzt dann einen eindeutigen Wert. Mit dieser Konvention gilt folgender Zusammenhang zwischen dem (abstoßenden oder anziehenden) Charakter des Potenzials und dem Vorzeichen der Streuphase: Für ein anziehendes Potenzial V(r) < 0 ist die Radialfunktion u kl (r) im Potenzial stärker gekrümmt als die Radial (0) funktion u kl (r) (25.55) des freien Teilchens. Die Wellenfunktion wird in das Poten zialgebiet „hineingezogen“, siehe Abb. 25.10a. Dementsprechend ist die Streuphase positiv: V(r) < 0 , δ l (k) > 0 . Im Fall eines abstoßenden Potenzials V(r) > 0 hingegen ist die Radialfunktion u kl (r) (0) im Potenzialgebiet V(r) < E k schwächer gekrümmt als u kl (r) und wird folglich aus dem Potenzialgebiet „herausgeschoben“ (siehe Abb. 25.10b). Dementsprechend ist die Streuphase negativ: V(r) > 0 , δ l (k) < 0 .
25.8 Streuung am Zentralpotenzial: Partialwellenzerlegung | 85
Für ein anziehendes Potenzial V(r) < 0 befindet sich das gestreute Teilchen immer im klassisch erlaubten Bereich. Für ein abstoßendes Potenzial können auch klassisch verbotene Bereiche E k < V(r) existieren, in denen die Wellenfunktion bekanntlich exponentiell abfällt und somit nicht oszilliert. Durch den klassisch verbotenen Be reich wird die Wellenfunktion ebenfalls nach außen gedrängt (was zu einer positi ven Streuphase führt), auch wenn dies vielleicht nicht offensichtlich ist. Wir werden dies explizit am Beispiel des abstoßenden Kastenpotenzials demonstrieren (siehe Ab schnitt 25.11.6).
ul (r)
δl
r
−V0 (a)
ul (r) V0
−δl
r
(b) Abb. 25.10: Die Radialfunktion u kl (r) (durchgezogene Linie) für (a) ein anziehendes und (b) absto (0) ßendes sphärisches Kastenpotenzial. Die gestrichelte Linie ist die Radialfunktion u kl des freien Teilchens.
86 | 25 Streutheorie
25.8.3 Partialwellenzerlegung des Streuquerschnitts Setzen wir die Partialwellenzerlegung der Streuamplitude (25.63) in Gl. (25.30) ein, so erhalten wir für den differenziellen Wirkungsquerschnitt: 1 dσ(θ) = 2 ∑(2l + 1)(2l + 1) sin δ l sin δ l e i(δ l −δ l ) P l (cos θ)P l (cos θ) . dΩ k l,l
(25.65)
Die verschiedenen Partialwellen interferieren hier miteinander und die Winkelvertei lung wird i. A. typische Interferenzerscheinungen zeigen. Die Interferenz der verschiedenen Partialwellen im Wirkungsquerschnitt widerspricht nicht der Dreh impulserhaltung, sondern resultiert aus der einfallenden ebenen Welle, die sämtliche Drehimpulszu stände (Partialwellen) enthält. Könnten wir unser Streuexperiment so gestalten, dass nur eine einzige Partialwelle einfiele (z. B. eine s-Welle durch eine sphärisch symmetrische Anordnung der Quelle¹¹), so würde auch die gestreute Welle nur eine einzige Partialwelle enthalten.
Aus (25.65) erhalten wir für den totalen Wirkungsquerschnitt 2π
π
0
0
dσ dσ(θ) σ = ∫ dΩ = ∫ dϕ ∫dθ sin θ dΩ dΩ unter Benutzung der Orthogonalitätsrelation für die Legendre-Polynome 1
∫ dz P l (z)P l (z) = −1
2 δ ll 2l + 1
den einfachen Ausdruck σ = ∑σ l , l
σl =
4π (2l + 1) sin2 δ l . k2
(25.66)
Der totale Wirkungsquerschnitt setzt sich additiv aus den Beiträgen der einzelnen Par tialwellen, den sogenannten Partialquerschnitten σ l , zusammen, wie dies aufgrund der Drehimpulserhaltung zu erwarten war. In Analogie zu den gebundenen Zustän den bezeichnet man die (l = 0, 1, 2, . . . )-Beiträge als s-, p-, d-,. . . Streuung. Wegen sin2 δ l ≤ 1 ist der Beitrag einer Partialwelle zum totalen Wirkungsquer schnitt für feste Energie nach oben beschränkt σl ≤
4π 1 (2l + 1) =: σ max ∼ . l 2 Ek k
(25.67)
11 Ein solcher sphärisch symmetrischer Streuprozess liegt bei der Zündung einer Atombombe vor, wo das spaltbare Material gleichmäßig auf einer Kugelschale verteilt ist, die wiederum von einer Kugel schale mit konventionellem Sprengstoff umgeben ist, der instantan gezündet wird.
25.8 Streuung am Zentralpotenzial: Partialwellenzerlegung |
87
Für festes l nimmt der Beitrag einer einzelnen Partialwelle zum Streuquerschnitt mit wachsender Energie ab. Gleichzeitig tragen mit wachsender Energie mehr und mehr Partialwellen l zum Streuquerschnitt bei, siehe Gl. (25.68) unten. Wegen P l (z = 1) = 1 erhalten wir aus (25.63) für den Imaginärteil der Streuampli tude in Vorwärtsrichtung Im{f k (θ = 0)} =
1 ∑(2l + 1) sin2 δ l (k) . k l
Vergleich mit (25.66) liefert für den totalen Wirkungsquerschnitt die Beziehung σ=
4π Im{f k (θ = 0)} . k
Dies ist das optische Theorem, das wir bereits in (25.48) gefunden hatten und das sich anschaulich wie folgt erklären lässt: Der Streuprozess ändert die Teilchenzahl nicht. Deshalb müssen die gestreuten Teilchen (die sämtlich durch den totalen Wirkungs querschnitt erfasst werden) aus dem einfallenden Teilchenstrom entfernt werden. Dies ist quantenmechanisch nur durch Interferenz möglich. Interferenz ist aber nur zwischen (in Richtung θ = 0) einfallender und in Vorwärtsrichtung (θ = 0) gestreu ter Welle möglich. Diese Interferenz bewirkt im einfallenden Teilchenstrahl einen sogenannten Teilchenschatten, der gerade dem gestreuten Teilchenstrom entspricht, siehe Abb. 25.11. Wir werden diesen Teilchenschatten etwas genauer in Abschnitt 25.10 anhand der Streuung an einer harten Kugel untersuchen.
k
Abb. 25.11: Illustration des optischen Theorems.
25.8.4 Konvergenz der Partialwellenzerlegung Der Vorteil der Partialwellenzerlegung besteht darin, dass für ein lokalisiertes Streu potenzial nur einige wenige Partialwellen zum Streuquerschnitt beitragen. Um dies zu veranschaulichen, betrachten wir zunächst die Streuung eines klassischen Teilchens an einem lokalisierten Potenzial mit effektiver Reichweite R. Klassisch findet keine Streuung statt, wenn der Stoßparameter b (siehe Abb. 25.4) größer als die Reichweite
88 | 25 Streutheorie des Potenzials ist. Damit eine Streuung stattfindet, muss also die Bedingung b < R erfüllt sein. Für eine Bewegung im Zentralpotenzial, für welche die Partialwellenzer legung definiert ist, bleibt der Drehimpuls |L| = |x × p| = bp∞ erhalten. Hierbei ist p∞ = √2mE der asymptotische Wert des Teilchenimpulses in großer Entfernung vom Streuzentrum. Bei gegebener Teilchenenergie E erfolgt (klas sische) Streuung nur für b ≤ R, also nur für Drehimpulse mit |L| ≤ R√2mE . Aus der Pfadintegralformulierung der Quantenmechanik wissen wir, dass die volle quantenmechanische Zeitentwicklung durch Überlagerung der Beiträge aller mögli chen Trajektorien aufgebaut werden kann. Trajektorien, die außerhalb der Reichweite des Potenzials verlaufen, liefern offenbar keinen Beitrag zum Streuprozess. Quanten mechanische Teilchen mit großem Drehimpuls besitzen auch eine große kinetische Energie. Hochenergetische Teilchen verhalten sich aber quasiklassisch und können folglich in der semiklassischen Näherung beschrieben werden. In dieser Näherung tragen zur quantenmechanischen Übergangsamplitude nur die Trajektorien in der Nä he der klassischen Trajektorie bei. Wie oben besprochen, tragen klassische Trajekto rien nur zum Streuprozess bei, wenn ihr Stoßparameter b kleiner als die Reichweite R des Potenzials ist, d. h., wenn der Drehimpuls |L| ≤ |Lmax | = R|p∞ | ist. Folglich tragen auch in der Quantenmechanik nur Partialwellen mit einem Drehimpuls lℏ ≲ |Lmax | zum Streuquerschnitt bei. Somit sind auch in der Quantentheorie die beitragenden Drehimpulse durch die Reichweite des Streupotenzials begrenzt: Nur solche Partial wellen tragen wesentlich zum Wirkungsquerschnitt bei, für die 1 l ≲ √l(l + 1) ≤ R √2mE = Rk ℏ
(25.68)
erfüllt ist. Für kleine Teilchenenergien und kurzreichweitige Streupotenziale sollte demnach dominante s-Streuung (l = 0) vorliegen, die wegen P l=0 (z) = 1 einen iso tropen (d. h. vom Streuwinkel unabhängigen) partiellen Querschnitt (25.65) (
dσ 1 sin2 δ0 ) = dΩ l=0 k 2
liefert. Dies soll im Folgenden am Beispiel der Streuung an einer harten Kugel illus triert werden.
25.9 Hartkugelstreuung Wie wir bereits in Abschnitt 25.6.1 kennengelernt haben, wird die Nukleon-NukleonKraft dominant durch ein Zentralpotenzial V(x1 , x2 ) = V(|x1 − x2 |) = V(r) be schrieben, das den in Abb. 25.12a dargestellten qualitativen Verlauf besitzt. Es ist
| 89
25.9 Hartkugelstreuung
anziehend bei mittleren Abständen von etwa 1 fm und stark abstoßend bei kurzem Abstand. Für die Streuung von hochenergetischen Protonen am Nukleon (Proton oder Neutron) können wir den anziehenden Teil des Potenzials vernachlässigen und den abstoßenden Teil in erster Näherung durch ein unendlich hohes Kastenpotenzial er setzen, das in diesem Zusammenhang auch als „hard core“-Potenzial bezeichnet wird (siehe Abb. 25.12b): {∞ , r ≤ R . V(r) = { 0, r>R { Ein solches Potenzial beschreibt auch die Wechselwirkung zwischen zwei sehr harten, d. h. ideal elastischen Kugeln mit Radius R. Dieses Potenzial besitzt daher ein weites Anwendungsfeld, nicht nur in der Kernphysik, sondern auch in der Atom-, Molekülund Cluster-Physik. Im Folgenden wollen wir deshalb die Streuung an einem solchen Potenzial untersuchen. V(r)
V(r)
r
r R
(a)
(b)
Abb. 25.12: Das Nukleon-Nukleon-Wechselwirkungspotenzial: (a) realistischer Potenzialverlauf, (b) Idealisierung durch ein „hard core“-Potenzial.
(+)
Die Streuwellenfunktion φ k (x) muss, wie jede Wellenfunktion, im Gebiet eines un endlich hohen Potenzials verschwinden. Sie muss deshalb der Randbedingung (+)
φ k (x) = 0 ,
|x| ≤ R
(25.69)
genügen. Für |x| > R verschwindet das Potenzial, und die Wellenfunktion muss der freien Schrödinger-Gleichung genügen. In Anbetracht der sphärischen Symmetrie der Randbedingung empfiehlt es sich, die Wellenfunktion in Kugelkoordinaten anzuge ben. Legen wir den Impuls der einfallenden Welle wieder parallel zur z-Achse, so hat die Streufunktion die Gestalt (25.51), wobei u kl (r) eine Lösung der freien Radialglei chung (25.52) mit V(r) = 0 ist. Da aufgrund der unendlich hohen Potenzialbarriere die
90 | 25 Streutheorie Wellenfunktion im Gebiet r ≤ R nicht definiert ist, müssen wir im Außenraum r ≥ R auch Lösungen der freien Radialgleichung (sphärische Bessel’sche Differenzialglei chung) zulassen, die am Ursprung r = 0 singulär sind. Die allgemeine Lösung dieser Gleichung lautet deshalb R kl (r) =
u kl (r) = a l j l (kr) + b l n l (kr) , r
(25.70)
wobei j l und n l die sphärischen Bessel- bzw. sphärischen Neumann-Funktionen und a l und b l zunächst beliebige Koeffizienten sind, die jedoch so gewählt werden müs sen, dass die Randbedingung (25.69) erfüllt ist. Alternativ lässt sich die allgemeine Lösung auch durch die sphärischen Hankel-Funktionen (±)
h l (z) = j l (z) ± in l (z) oder durch zwei beliebige andere linear unabhängige Kombinationen der j l und n l ausdrücken. Des Weiteren müssen die in der Radialfunktion (25.70) auftretenden Ko effizienten a l , b l so gewählt werden, dass die resultierende Streufunktion (25.51) für r → ∞ die asymptotische Form (25.20) (einfallende ebene Welle plus auslaufende Kugelwelle) annimmt. Die einfallende ebene Welle besitzt nach Gl. (25.53) gerade die sphärischen Bessel-Funktionen als Radialfunktionen. Die einzige Lösung der freien Radialgleichung (Bessel’sche Differenzialgleichung), welche die asymptotische Form einer auslaufenden Kugelwelle besitzt, ist die Hankel-Funktion (17.45) (+)
h l (kr) ≃
lπ −i i(kr− lπ2 ) e ikr i = e (− e−i 2 ) , kr r k
kr ≫ l .
Deshalb können wir den gestreuten Teil φstr k (x) der Wellenfunktion (25.19) in der Form (+)
l φstr k (x) = ∑ c l (2l + 1)i h l (kr)P l (cos θ)
(25.71)
l
ansetzen, wobei die numerischen Faktoren (2l + 1)i l in Analogie zur Partialwellenent wicklung (25.53) der einfallenden ebenen Welle gewählt wurden. Die Entwicklungs koeffizienten c l werden sicherlich von der Energie bzw. Wellenzahl k des einfallenden Teilchens abhängen. Die Wellenfunktion (25.71) hat per Konstruktion die geforderte asymptotische Form einer auslaufenden Kugelwelle φstr k (x) → f k (θ)
e ikr , r
kr ≫ l
mit der Streuamplitude lπ i f k (θ) = − ∑(2l + 1)i l e−i 2 c l P l (cos θ) k l
i = − ∑ c l (2l + 1)P l (cos θ) . k l
25.9 Hartkugelstreuung
| 91
Vergleichen wir diesen Ausdruck mit der Streuphasendarstellung der Streuamplitude (25.63), so erhalten wir wegen der linearen Unabhängigkeit der Legendre-Polynome die Beziehung c l = ie iδ l sin δ l . (25.72) Damit sind die Streuphasen, welche ein Maß für die Stärke der Streuung sind, auf die Koeffizienten c l der Streupartialwelle zurückgeführt. Letztere sind durch das Streupo tenzial bestimmt, das die Randbedingung (25.69) erzwingt. Mit (25.53) und (25.71) hat die Streuwellenfunktion für |x| > R die Gestalt (+)
φ k (x) = e ik⋅x + φstr k (x) (+)
= ∑(2l + 1)i l (j l (kr) + c l h l (kr))P l (cos θ) l
≡ ∑ R kl (r)P l (cos θ) . l
Wegen der linearen Unabhängigkeit der Legendre-Polynome muss jede einzelne Par (+) tialwelle l von φ k (x) bei r = R verschwinden: R kl (r = R) = 0 . Diese Bedingung fixiert die Koeffizienten c l auf: cl = −
j l (kR) (+) h l (kR)
=−
j l (kR) 1 =− . (kR) j l (kR) + in l (kR) 1 + i nj ll(kR)
Vergleich mit der Streuphasendarstellung (25.72) dieser Koeffizienten, cl = i
sin δ l sin δ l 1 =i =− , cos δ l − i sin δ l e−iδ l 1 + i tan1 δ l
liefert die Beziehung tan δ l =
j l (kR) . n l (kR)
(25.73)
Damit sind die Streuphasen vollständig durch die Energie des gestreuten Teilchens E k = (ℏk)2 /2m und die Reichweite R des unendlich hohen Streupotenzials festgelegt. Mit der Beziehung sin2 δ l =
sin2 δ l sin2 δ l + cos2 δ l
=
tan2 δ l 1 + tan2 δ l
erhalten wir schließlich für den Streuquerschnitt (25.66):
σ = ∑σ l , l
σl =
j2l (kR) 4π (2l + 1) . k2 n2l (kR) + j2l (kR)
(25.74)
92 | 25 Streutheorie
σl 4πR2
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0
l l l l
0
1
2
3
4 kR
(a)
lmax l=0 σl 4πR2
1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0
5
=0 =1 =2 =3
6
7
8
σ
lmax = 0 lmax = 1 lmax = 2 lmax = 3 lmax = 4
0
1
(b)
2
3
4 kR
5
6
7
8
Abb. 25.13: (a) Die Partialquerschnitte σ l der Hartkugelstreuung für l = 0, 1, 2, 3, sowie (b) der totale Wirkungsquerschnitt σ in Abhängigkeit von dem maximalen eingeschlossenen Drehimpuls lmax als Funktion von kR.
Die vier untersten Partialquerschnitte σ l=0,1,2,3 sind in Abb. 25.13a dargestellt. Für niedrige Energien kR < 1 dominiert die s-Streuung σ l=0 , die wir deshalb etwas ge nauer betrachten wollen. Mit der expliziten Form der sphärischen Bessel- und Neumann-Funktion (siehe Abschnitt 17.4.1) sin z cos z , n0 (z) = − j0 (z) = z z erhalten wir aus (25.73): tan δ0 (k) = − tan(kR) .
25.9 Hartkugelstreuung |
93
Mit unserer Konvention der Streuphasen (δ l = 0 für V(r) = 0) finden wir hieraus δ0 (k) = −kR . Wie erwartet, ist die Streuphase für das abstoßende Hartkugelpotenzial negativ. Der zugehörige Partialquerschnitt σ l=0 (k) =
4π sin2 δ0 (k) = 4πR2 (j0 (kR))2 k2
wird maximal für verschwindende Energie σ l=0 (k → 0) = 4πR2 . Wir werden gleich streng zeigen, dass für k → 0 die höheren Partialquerschnitte σ l>0 sämtlich verschwinden. Mit wachsender Energie kommen die dominanten Bei träge jedoch von zunehmend höheren Drehimpulsen, siehe Abb. 25.13b. Für beliebige Partialwellen l können wir analytische Aussagen nur in den zwei folgenden Grenzfäl len machen: 1. Streuung sehr langsamer Teilchen kR ≪ 1: Die Wellenlänge λ = 2π/k des Streuteilchens sei viel größer als die Reichweite R des Streupotenzials, siehe Abb. 25.14a. Für die sphärischen Bessel- und NeumannFunktionen an der Stelle kR können wir dann ihre asymptotische Darstellung (17.42) für kleine Argumente z → 0 j l (z) ≃
zl , (2l + 1)!!
n l (z) ≃ −
(2l + 1)!! (2l + 1)z l+1
(25.75)
benutzen und erhalten für die Streuphase: tan δ l = −
(2l + 1)(kR)2l+1 ≃ sin δ l . ((2l + 1)!!)2
(25.76)
Diese Beziehung zeigt, dass für kR < 1 mit wachsendem Drehimpuls die Streu phasen sehr schnell abnehmen bzw. sehr nahe bei einem Vielfachen von π liegen.
λ
λ r
r
R (a)
R (b)
Abb. 25.14: Streuung (a) langsamer und (b) schneller Teilchen am Hartkugelpotenzial.
94 | 25 Streutheorie Für kR ≪ 1 trägt praktisch nur die unterste Partialwelle l = 0 bei und wir haben reine s-Streuung vorliegen. Dieses Ergebnis ist in Übereinstimmung mit unseren allgemeinen Überlegungen, dass nur Partialwellen l ≤ kR wesentlich zum Streu querschnitt beitragen. Die s-Streuung liefert für das vorliegende Hartkugelpoten zial einen totalen Wirkungsquerschnitt σ ≃ σ0 =
2.
4π sin2 δ0 = 4πR2 . k2
(25.77)
Dies ist gerade das Vierfache des geometrischen Querschnitts πR2 , der für das be trachtete Potenzial mit dem klassischen Streuquerschnitt zusammenfällt. Der zu sätzliche Faktor 4 im quantenmechanischen Wirkungsquerschnitt reflektiert of fenbar den Effekt von Quantenfluktuationen. Ein quantenmechanisches Teilchen spürt offenbar die gesamte Kugeloberfläche 4πR2 , während ein klassisches Teil chen nur den Querschnitt der Kugel πR2 sieht. Diese „Flächenvergrößerung“ wird auch in der Optik bei der Streuung von langwelligem Licht beobachtet und ist of fenbar ein Wellenphänomen. Aufgrund der Wellennatur der Teilchen muss dieses Phänomen auch in der Quantenmechanik auftreten. Streuung sehr schneller Teilchen kR ≫ 1: Die Wellenlänge λ = 2π/k des betrachteten Streuteilchens soll jetzt sehr klein gegenüber der Reichweite des Potenzials R sein, siehe Abb. 25.14b. Das Streuteil chen sollte sich deshalb quasiklassisch verhalten. Dies bedeutet insbesondere, dass nur Partialwellen l bis zu einem maximalen Drehimpuls lmax ≃ kR beitragen können (siehe Gl. (25.68)). Für kR ≫ l können wir die asymptotische Form der sphärischen Bessel- und Neumann-Funktionen für große Argumente, Gl. (17.36), benutzen lπ 1 j l (z) ≃ sin (z − ) , z → ∞ , z 2 (25.78) 1 lπ n l (z) ≃ − cos (z − ) , z → ∞ , z 2 und finden aus (25.73): tan δ l ≃ − tan (kR −
lπ ) , 2
kR ≫ l .
Die Streuphase ist deshalb bis auf ein Vielfaches von π durch δ l → −kR +
lπ , 2
kR ≫ l
(25.79)
gegeben. Wie am Ende des Abschnitts 25.8.4 gezeigt, tragen nur die Drehimpulse l ≲ lmax ≃ kR ≫ 1 zum Streuprozess bei. Außerdem gilt die asymptotische Form (25.79) für die Streu phase streng genommen nur für l ≤ kR, d. h., wir dürfen ohnehin nicht beliebig
25.9 Hartkugelstreuung |
95
hohe Partialwellen l ≥ kR aufsummieren. Zur Berechnung des totalen Wirkungs querschnitts summieren wir deshalb alle Partialwellen l ≤ lmax auf. Elementare Rechnung liefert: σ
=
4π l max 4π l max ∑ (2l + 1) sin2 δ l = 2 ∑ [(l + 1) sin2 δ l + l sin2 δ l ] 2 k l=0 k l=0
=
4π l max π π ∑ [(l + 1) cos2 (kR − (l + 1) ) + l sin2 (kR − l )] 2 2 k 2 l=0
=
π π 4π l max { ∑ l [cos2 (kR − l ) + sin2 (kR − l )] 2 2 2 k l =1
(25.79)
π + (lmax + 1) cos2 (kR − (lmax + 1) )} 2 =
π 4π l max { ∑ l + (lmax + 1) cos2 (kR − (lmax + 1) )} . 2 k 2 l =1
Unter der Annahme, dass lmax ≫ 1 ist, genügt es, diesen Ausdruck in führender Ordnung in 1/lmax auszuwerten. Da l max
∑l=
l=1
1 lmax (lmax + 1) , 2
liefert dies 4π lmax (lmax + 1) { + O(lmax )} 2 k2 2π 1 = 2 l2max [1 + O ( )] . lmax k
σ=
Für lmax ≃ kR ≫ 1 erhalten wir damit für den totalen Streuquerschnitt σ ≃ 2πR2 . Bei sehr hohen Energien (kleine Wellenlängen) ist der quantenmechanische Wir kungsquerschnitt doppelt so groß wie der klassische Wirkungsquerschnitt, der hier durch den geometrischen Querschnitt πR2 gegeben ist. Dieses Ergebnis ist sehr verwunderlich, da sehr hochenergetische Teilchen sich wie klassische Teil chen verhalten und folglich der quantenmechanische Wirkungsquerschnitt bei sehr großen Energien in den klassischen übergehen sollte. Wie wir im nächs ten Abschnitt zeigen werden, besteht der quantenmechanische Wirkungsquer schnitt σ aus zwei Teilen: einem echten Streuterm („Reflexion“) σ ref , der die tatsächliche Teilchenstreuung in Richtung θ > 0 beschreibt und den korrekten klassischen Hochenergielimes enthält, und einem Beugungsterm („Schatten“) σ sch , der eine „Teilchenstreuung“ in Vorwärtsrichtung (θ ≃ 0) beschreibt. Die in
96 | 25 Streutheorie
Vorwärtsrichtung gestreute Welle interferiert destruktiv mit der einfallenden Wel le, löscht diese teilweise aus und führt zu einem Schatten hinter der Kugel, wie wir bereits im Zusammenhang mit den optischen Theorem gefunden hatten. We gen der Teilchenzahlerhaltung beim Streuprozess ist die Intensität (erfasst durch den Wirkungsquerschnitt¹²) σ ref der unter endlichen Winkeln θ > 0 gestreuten Welle genau so groß wie die Intensität des Teils der einfallenden Welle, der durch die in Vorwärtsrichtung unter θ ≃ 0 gestreute Welle ausgelöscht wird. Da die se Auslöschung durch Interferenz mit der in Vorwärtsrichtung gestreuten Welle erfolgt, muss auch die Intensität der in Vorwärtsrichtung gestreuten Welle σ sch genauso groß sein wie die Intensität der unter θ > 0 gestreuten Welle (eigentliche Streuung) σ ref , d. h. σ = σ ref + σ sch , σ ref = σ sch . Im Folgenden wollen wir den eigentlichen Streuanteil in Richtung θ > 0 (Refle xionsanteil) σ ref und den Schattenanteil σ sch am Streuquerschnitt identifizieren.
25.10 Erklärung der Schattenstreuung* Zur Identifikation des Schattenteils am Streuquerschnitt setzen wir die Beziehung e iδ l sin δ l =
1 i2δ l − 1) (e 2i
in den ursprünglichen Ausdruck für die Streuamplitude (25.63) ein. Diese zerfällt dann in zwei Teile: f(θ) = fref (θ) + fsch (θ) , 1 ∑(2l + 1)e i2δ l P l (cos θ) , fref (θ) = 2ik l fsch (θ) = −
1 ∑(2l + 1)P l (cos θ) , 2ik l
(25.80) (25.81) (25.82)
wobei fref (θ) die gesamte Abhängigkeit von der Streuphase enthält, während fsch (θ) offenbar unabhängig vom Streupotenzial ist. Letztere ist rein imaginär und stark in Vorwärtsrichtung (θ ≃ 0) gepeakt. Dies erkennt man sofort, wenn man beachtet, dass P l (1) = 1 für alle l und wegen der Orthogonalität der P l (z) diese mit wachsenden l im mer mehr Nullstellen besitzen müssen. Die einzelnen Partialwellen l liefern deshalb
12 Die Intensität einer Welle ist durch das Betragsquadrat ihrer Amplitude definiert. Die Amplitude ̂ deren Betragsquadrat den (differen der gestreuten (Kugel-)Welle (25.20) ist die Streuamplitude f k ( x), ziellen) Wirkungsquerschnitt (25.30) liefert. Deshalb lässt sich der Wirkungsquerschnitt auch als In tensität der gestreuten Welle interpretieren. * Dieser Abschnitt ist für das Verständnis der übrigen Abschnitte nicht erforderlich und kann deshalb beim ersten Lesen übersprungen werden.
25.10 Erklärung der Schattenstreuung | 97
konstruktiv interferierende Beiträge zu fsch (θ) für θ = 0 und löschen sich hingegen für θ ≠ 0 aus. Mit wachsendem l wird die Auslöschung immer schärfer und fsch (θ) immer mehr um θ = 0 konzentriert (siehe Abb. 25.15). In der Tat, führen wir die Summation über l bis l → ∞ aus, so erhalten wir wegen¹³ 1 ∞ ∑ (2l + 1)(±1)l P l (cos θ) = δ(1 ∓ cos θ) 2 l=0
(25.83)
für die Schattenamplitude: fsch (θ) =
i δ(1 − cos θ) . k
(25.84)
Der von der Streuphase δ l unabhängige Teil der Streuamplitude, fsch , beschreibt of fenbar den in Vorwärtsrichtung gestreuten Teil der einlaufenden Welle. Mit der Zerlegung (25.80) zerfällt auch der gestreute Teil der Wellenfunktion (25.19), (25.20) asymptotisch für r → ∞ in zwei Teile: sch ref φstr k (x) ≃ φ k (x) + φ k (x) ,
φsch k (x) = f sch (θ)
e ikr , r
φref k (x) = f ref (θ)
e ikr . r
(25.85)
Es lässt sich nun leicht zeigen, dass der in Vorwärtsrichtung (θ ≃ 0) konzentrierte Schattenteil φsch k (x) gerade einen Teil der einlaufenden ebenen Welle durch destruk tive Interferenz auslöscht. Dazu benutzen wir die Zerlegung der ebenen Welle nach Legendre-Polynomen (25.53) und verwenden für die sphärischen Bessel-Funktionen ihre asymptotische Darstellung (25.54) für kr ≫ l, was auf Gl. (25.59) führt e ik⋅x ≃ (e ik⋅x )ein + (e ik⋅x )aus , wobei (e ik⋅x )ein = −
e−ikr ∑(−1)l (2l + 1)P l (cos θ) i2kr l
bzw. (e ik⋅x )aus =
e ikr ∑(2l + 1)P l (cos θ) i2kr l
(25.86)
13 Die Beziehung (25.83) ergibt sich unmittelbar aus der Vollständigkeitsrelation der Legendre-Poly nome 1 ∞ ∑ (2l + 1)P l (z )P l (z) = δ(z − z) . 2 l=0 Setzen wir hier z = 1 und z = cos θ, so erhalten wir mit P l (1) = 1 die Beziehung (25.83) für das obere Vorzeichen: 1 ∞ ∑ (2l + 1)P l (cos θ) = δ(1 − cos θ) . 2 l=0 Ersetzen wir hier cos θ → − cos θ und beachten, dass P l (−z) = (−1)l P l (z), so folgt die Beziehung (25.83) für das untere Vorzeichen.
98 | 25 Streutheorie ̄f (θ) = ∑lmax (2l + 1)P l (cos θ) l=0
450 400
lmax = 5 lmax = 20
350 300 250 200 f¯(θ) 150 100 50 0 −50 −100
0
0.2
0.4
0.6
0.8 θ
1
1.2
1.4
1.6
Abb. 25.15: Die Schattenstreuamplitude −2ikfsch (θ) =: ̄f (θ) als Funktion des Streuwinkels θ in Abhängigkeit von der Zahl der eingeschlossenen Partialwellen lmax .
der Anteil der einfallenden Welle ist, der sich asymptotisch wie eine einlaufende bzw. auslaufende (modulierte) Kugelwelle verhält. Vergleich von (25.86) mit (25.82), (25.85) zeigt: (e ik⋅x )aus + φsch k (x) = 0 . Der Schattenteil der Streuwellenfunktion kompensiert in der Tat asymptotisch den vom Streuzentrum sphärisch auslaufenden Teil der einfallenden ebenen Welle und (+) eliminiert diesen damit aus der Gesamtwellenfunktion φ k (x). (Diese Kompensation gilt für jede einzelne Partialwelle l ≪ kr.) Da φsch k (x) ∼ f sch (θ) bei θ = 0 gepeakt ist (siehe Abb. 25.15), führt diese Auslöschung zu einem Schatten hinter dem Streuzen trum. Dies rechtfertigt den Namen Schattenstreuung. Der streuphasenabhängige Teil der Streuamplitude, fref (θ), Gl. (25.81), verschwin det hingegen genähert für θ = 0, da die Partialwellen sich hier destruktiv addieren:
25.10 Erklärung der Schattenstreuung | 99
Für kR ≫ l erfüllen die Streuphasen die Beziehung (25.79) 2δ l+1 = 2δ l + π ,
(25.87)
sodass benachbarte Partialwellen mit entgegengesetzter Phase e iπ = −1 zu fref (θ) bei tragen und sich bei θ = 0 auslöschen. In der Tat, setzen wir den asymptotischen Aus druck (25.79) lπ δ l = −kR + (25.88) 2 in die Reflexionsamplitude fref (θ) (25.81) ein, so erhalten wir fref (θ) =
e−i2kR ∑(2l + 1)(−1)l P l (cos θ) . 2ik l
(25.89)
Führen wir hier die Summation über l bis l → ∞ aus (was streng genommen wegen der Voraussetzung kR ≫ l nicht erlaubt ist), so erhalten wir mit (25.83) fref (θ) =
e−i2kr δ(1 + cos θ) . ik
(25.90)
Diese Amplitude ist bei θ = π gepeakt, was den Namen Reflexionsamplitude recht fertigt. Wir betonen jedoch, dass Gl. (25.89) und somit auch Gl. (25.90) nur genähert gelten, da hier der asymptotische Ausdruck (25.88) für die Streuphasen benutzt wur de, während Gl. (25.84) exakt ist. Wird die Summation über l in (25.89) auf l ≤ kR = lmax eingeschränkt, so gilt zwar Gl. (25.90) nicht mehr, dennoch ist die resultierende fref (θ) bei θ ≃ 0 stark un terdrückt. Deshalb beschreibt fref (θ) die Streuung in einen endlichen Winkel θ > 0. Nur dieser Teil der Streuung besitzt ein klassisches Äquivalent, da wir in der klassi schen Mechanik nur dann von einer Streuung eines Teilchens sprechen, wenn dieses um einen Winkel θ ≠ 0 aus seiner ursprünglichen Bahn abgelenkt wird. Um dies zu demonstrieren, berechnen wir die totalen Wirkungsquerschnitte, die durch die Refle xions- und Schattenamplituden separat hervorgerufen werden. Beachtet man, dass fsch (θ) (25.82) mit der vollen Streuamplitude f k (θ) (25.63) über fsch (θ) = − 12 f k (θ)|δ l = π2 verknüpft ist, so finden wir aus (25.66) unmittelbar für die Schattenstreuung σ sch = ∫ dΩ |fsch (θ)|2 =
π ∑(2l + 1) . k2 l
Denselben Wirkungsquerschnitt findet man von der Reflexionsamplitude (25.81) σ ref = ∫ dΩ |fref (θ)|2 =
π2 ∑(2l + 1) , k2 l
(25.91)
wie man leicht durch Ausführen der Winkelintegration nachprüft. Der obige Ausdruck für σ ref = σ sch liefert ein divergentes Ergebnis, falls die Partialsummation nicht bei einem maximalen Drehimpuls lmax abgebrochen wird.
100 | 25 Streutheorie
Der exakte totale Wirkungsquerschnitt (25.74) bleibt hingegen endlich, selbst wenn die Summation über sämtliche Drehimpulse l ausgeführt wird. Der totale Wirkungs querschnitt kann aber nur dann endlich werden, wenn der divergierende Anteil der Schattenamplitude fsch (θ) durch einen entsprechenden Anteil der Reflexionsampli tude fref (θ) kompensiert wird. Dazu darf fref (θ) bei θ ≃ 0 nicht verschwinden. Die oben gefundene Auslöschung aufeinander folgender Partialwellen in fref (θ) bei θ = 0, sie he Gl. (25.87) bzw. (25.90), wurde aus dem asymptotischen Ausdruck (25.79) für die Streuphase gewonnen. Dieser asymptotische Wert verliert jedoch seine Gültigkeit für große Drehimpulse l ≫ Rk. Für große Drehimpulse gilt deshalb der oben erklärte Auslöschungsmechanismus in Vorwärtsrichtung in der Reflexionsamplitude nicht mehr. In der Tat, für alle realistischen Potenziale sollte ein Teilchen mit sehr ho hem Drehimpuls und folglich mit sehr hoher Energie keine Ablenkung mehr durch das Streupotenzial erfahren, und die Streuphasen sollten asymptotisch für k → ∞ verschwinden: δ l (k) → 0 , k → ∞ . Für verschwindende Streuphasen kompensieren sich aber gerade Schatten- und Refle xionsanteil der Streuamplitude einer Partialwelle (vgl. Gln. (25.81) und (25.82)), sodass diese für k → ∞ keinen Beitrag zum totalen Wirkungsquerschnitt liefert. Wir dürfen deshalb die Summation über die Drehimpulse l in (25.91) nur bis zu einem maximalen Drehimpuls lmax ≃ kR ausführen: σ ref =
1 π l max π π ∑ (2l + 1) = 2 (lmax + 1)2 = 2 l2max [1 + O ( )] . 2 lmax k l=0 k k
In führender Ordnung in lmax ≃ kR ≫ 1 erhalten wir für den totalen Querschnitt σ ref ≃ πR2 . Dies ist das klassisch erwartete Resultat: Der totale Querschnitt der reflektierten Welle ist durch den geometrischen Querschnitt der Kugel gegeben. Zusammenfassend können wir feststellen, siehe Abb. 25.16: Die gestreute Wel le enthält einen Teil, der in Vorwärtsrichtung gestreut wird. Dieser kompensiert ei nen Teil der einfallenden ebenen Welle durch destruktive Interferenz. Dadurch wird ein Teil des einfallenden Teilchenstroms ausgeblendet, und es entsteht ein Schat ten hinter dem Streuzentrum ähnlich wie in der Optik. In Übereinstimmung mit der Teilchenzahlerhaltung ist der aus dem einfallenden Teilchenstrom herausgeblendete Fluss gleich dem in endliche Winkel θ > 0 gestreuten Teilchenstrom, der durch den reflektierten Anteil der Streuwellenfunktion beschrieben wird. Nur dieser reflektier te Anteil besitzt ein klassisches Analogon. In der klassischen Mechanik versteht man unter Streuung, dass das Teilchen aus seiner ursprünglichen Bahn abgelenkt wird, und nur die abgelenkten Teilchen tragen zum Wirkungsquerschnitt bei. In der Quan tenmechanik trägt hingegen auch der in Vorwärtsrichtung gestreute (Schatten-)Anteil zum Wirkungsquerschnitt bei.
25.11 Streuung am Potenzialtopf
| 101
(a) k
(b)
(c)
Abb. 25.16: Illustration des Ausbildens der Schattenstreuung (c) durch Interferenz von einfallender ebener Welle (a) und auslaufender gestreuter Kugelwelle (b).
25.11 Streuung am Potenzialtopf Viele realistische Probleme lassen sich qualitativ durch die Streuung am sphärischen Potenzialtopf {−V0 , r ≤ R V(r) = { (25.92) 0, r>R { verstehen. Wir wollen deshalb im Folgenden die Streuung an diesem Potenzial exem plarisch für die Streuung an lokalisierten Potenzialen mit der Reichweite R behan deln. Der Prototyp eines solchen Streuproblems ist die Nukleon-Streuung am Atom kern. Das Kernpotenzial der starken Wechselwirkung hat qualitativ den in Abb. 25.17 dargestellten Verlauf und lässt sich in guter Näherung durch ein Kastenpotenzial er setzen, wobei R den Kernradius repräsentiert. Die gebundenen Zustände des Kastenpotenzials (mit Energien −V0 < E < 0) ha ben wir bereits in Abschnitt 17.5 untersucht. Wir hatten gefunden, dass gebundene Zustände existieren, falls das Potenzial hinreichend attraktiv ist, d. h., falls die effek tive Potenzialstärke (17.63) R√2mV0 γ= ℏ
102 | 25 Streutheorie V(r)
R r realistisches Potenzial
Modell
−V 0
Abb. 25.17: Das Kernpotenzial, das ein einzelnes Neutron aufgrund seiner Wechselwirkung mit den übrigen Nukleonen des Atomkerns spürt.
groß genug ist. Im Folgenden interessieren wir uns für die Streuung eines Teilchens mit Energie ℏ2 k 2 >0 Ek = 2m an einem solchen Potenzial. Zur Berechnung des Streuquerschnitts müssen wir die stationären Eigenzustände des Hamilton-Operators mit positiver Energie, d. h. die (+) Streuzustände φ k (x) bzw. die Streuamplituden f(θ) bestimmen. Wir benutzen dazu wieder die Partialwellenzerlegung der Streufunktionen nach Drehimpulseigenzu ständen (25.51).
25.11.1 Die Streuphasen Für r > R, wo das Potenzial verschwindet, ist die radiale Schrödinger-Gleichung die eines freien Teilchens (17.22) [
d2 2 d l(l + 1) + k2 − + ] R kl (r) = 0 , dr2 r dr r2
wobei k=
(25.93)
√2mE
(25.94) ℏ die Wellenzahl des Teilchens ist. Für r < R erhalten wir dieselbe Gleichung mit k er setzt durch die effektive Wellenzahl im Potenzialtopf √2m(E + V0 ) . (25.95) ℏ Wie wir bereits aus der Behandlung der gebundenen Zustände des Potenzialtopfs wissen, ist die Radialgleichung (25.93) aus mathematischer Sicht die sphärische q=
25.11 Streuung am Potenzialtopf
|
103
Bessel’sche Differenzialgleichung, deren Lösungen durch die sphärischen BesselFunktionen j l (kr) bzw. die sphärischen Neumann-Funktionen n l (kr) (oder deren (±) Linearkombinationen, die sphärischen Hankel-Funktionen h l (kr)) gegeben sind. Da die Radialfunktion R kl (r) am Ursprung regulär sein muss, hat die allgemeinste Lösung die Gestalt { c l j l (qr) , r≤R R kl (r) = { , (25.96) a l j l (kr) + b l n l (kr) , r > R { wobei die hier auftretenden Koeffizienten a l , b l und c l aus der Anschlussbedingung der Wellenfunktion am Potenzialsprung r = R bestimmt werden. (Einer der drei Koeffi zienten, z. B. c l , wird durch die Normierung der Wellenfunktion festgelegt.) An einem endlichen Potenzialsprung müssen die Wellenfunktion und ihre erste Ableitung stetig sein. Beide Bedingungen lassen sich in der Stetigkeit der logarithmischen Ableitung d 1 dR kl (r) (ln(R kl (r))) = dr R kl (r) dr zusammenfassen. Dies liefert die Bedingung q
a l jl (kR) + b l nl (kR) jl (qR) =k , j l (qR) a l j l (kR) + b l n l (kR)
(25.97)
wobei der Strich Ableitung nach dem gesamten Argument bedeutet. Die Koeffizien ten c l sind nicht in der logarithmischen Ableitung der Wellenfunktion enthalten und werden durch ihre Normierung festgelegt. Für große r → ∞ hat die Radialfunktion (25.96) aufgrund der asymptotischen Formen (25.78) der sphärischen Bessel- und Neumann-Funktionen die Gestalt R kl (r) ≃
1 lπ lπ [a l sin (kr − ) − b l cos (kr − )] . kr 2 2
Andererseits hatten wir in Abschnitt 25.8 gesehen, dass unabhängig von der konkre ten Form des lokalisierten Streupotenzials V(r) die Radialfunktion R kl (r) für kr ≥ l die asymptotische Gestalt (25.64) R kl (r) ≃ i l (2l + 1) = i l (2l + 1)
lπ e iδ l sin (kr − + δl ) kr 2 lπ e iδ l lπ [sin (kr − ) cos δ l + cos (kr − ) sin δ l ] kr 2 2
besitzt, wobei δ l die Streuphase der l-ten Partialwelle ist. Setzen wir diese beiden asymptotischen Formen der Radialwellenfunktion gleich, so erhalten wir wegen der linearen Unabhängigkeit der Sinus- und Kosinusfunktionen die Beziehungen a l = i l (2l + 1)e iδ l cos δ l , b l = −i l (2l + 1)e iδ l sin δ l und hieraus:
bl = − tan δ l . al
(25.98)
104 | 25 Streutheorie
Die Anschlussbedingung an die Wellenfunktion Gl. (25.97) stellt eine Gleichung für das Verhältnis b l /a l dar. Lösen wir diese Gleichung nach b l /a l auf und benutzen die oben gewonnene Beziehung (25.98), so erhalten wir: tan δ l =
k jl (kR) j l (qR) − q jl (qR) j l (kR)
k nl (kR) j l (qR) − q jl (qR)n l (kR)
.
(25.99)
Damit ist die Streuphase als Funktion der Energie bzw. der Wellenzahl k sowie der Potenzialtiefe V0 und Potenzialreichweite R bekannt. Diese Beziehung lässt sich jedoch nur numerisch auswerten. Die numerische Lösung dieser Gleichung ist in Abb. 25.18 für die untersten Partialwellen l = 0, 1, 2, 3 gegeben. Gezeigt sind die Streuphasen δ l (k) und die zugehörigen partiellen Wirkungsquerschnitte σ l (k) als Funktion von kR. Um ein qualitatives Verständnis des Verhaltens der Streuphasen zu bekommen, betrachten wir die Streuung sehr langsamer Teilchen kR ≪ 1 .
(25.100)
Diese Bedingung hat nicht notwendig auch qR ≪ 1 zur Folge, sodass wir die asym ptotischen Formen (25.75) der sphärischen Bessel- und Neumann-Funktionen nur für das Argument z = kR benutzen dürfen. Der Ausdruck (25.99) für die Streuphase ver einfacht sich dann zu: tan δ l =
2l + 1 (kR)2l+1 g l (qR) , [(2l + 1)!!]2
(25.101)
wobei wir die Funktion g l (z) :=
l j l (z) − z jl (z) (l + 1) j l (z) +
z jl (z)
≡
Z l (z) N l (z)
(25.102)
eingeführt haben. Der Vorfaktor von g l (qR) in (25.101) hängt nur von der Energie bzw. der Wellenzahl k und der Reichweite des Potenzials R ab, während g l (qR) auch von der Tiefe des Potenzials V0 abhängt.¹⁴ Mit Ausnahme von möglichen Nullstellen des Nenners ist g l (z) eine glatte Funk tion. Wir nehmen zunächst an, dass für die betrachtete Energie E die Funktion g l (qR) beschränkt ist, d. h. der Nenner keine Nullstellen besitzt. Für beschränkte g l (qR) von der Ordnung 1 und kR ≪ 1 sind nach (25.101) die Streuphasen klein und nehmen mit wachsendem l rasch ab: δ l+1 tan δ l+1 (kR)2 . ≃ ∼ δl tan δ l (2l + 1)(2l + 3)
14 Der Vorfaktor von g l (qR) in (25.101) ist (bis auf ein Minuszeichen) gerade tan δ l für das Hartkugel potenzial, siehe Gl. (25.76).
25.11 Streuung am Potenzialtopf
0.4
4
δ0 δ1 δ2 δ3
0.35 0.3 0.25
3 2.5
v = 1.0
0.2
v = 1.0
2 1.5
0.1
1
0.05
0.5
0
σ0/R 2 σ1/R 2 σ2/R 2 σ3/R 2
3.5
0.15
| 105
0
2
4
6
8 kR
10
3.5
12
14
2.5
0
2
4
6
8 kR
10
25
δ0 δ1 δ2 δ3
3
0
12
14
σ0/R 2 σ1/R 2 σ2/R 2 σ3/R 2
20 15
2
v = 6.0
v = 6.0
1.5
10
1 5
0.5 0
0
2
4
6
8 kR
10
3.5
12
14
2.5 2
0
2
4
6
8 kR
10
45
δ0 δ1 δ2 δ3
3
0
35 30 25
v = 8.0
14
σ0/R 2 σ1/R 2 σ2/R 2 σ3/R 2
40
v = 8.0
20
1.5
12
15
1
10 0.5 0
5 0
2
4
6
8 kR
10
3.5
12
14
2.5 2
1
4
0.5
2
(a)
4
6
8 kR
10
6
12
8 kR
10
14
0
12
14
σ0/R 2 σ1/R 2 σ2/R 2 σ3/R 2
8 6
2
4
10
v = 10.0
0
2
12
1.5
0
0
14
δ0 δ1 δ2 δ3
3
0
v = 10.0
0
2
4
6
8 kR
10
12
14
(b)
Abb. 25.18: (a) Streuphasen δ l (k) und (b) partielle Wirkungsquerschnitte σ l (k) für die Streuung eines Teilchens mit Wellenzahl k am endlichen Potenzialtopf mit Radius R als Funktion von kR für die untersten Partialwellen l = 0, 1, 2, 3. Die Streuphasen δ l sind durch numerische Lösung der Gl. (25.99) erhalten worden, wobei v ≡ γ2 = 2mV 0 R 2 /ℏ2 die dimensionslose Potenzialstärke bezeichnet.
106 | 25 Streutheorie
V(r)
Hartkugel
Drehimpulsbarriere
ℏ2 l(l+1) 2mr 2
Gesamtpotenzial r
Kasten −V 0
Abb. 25.19: Das Streupotenzial (rechteckiger Kasten), das Zentrifugalpotenzial (Drehimpulsbarriere) und das effektive Gesamtpotenzial.
Wie beim (unendlich hohen) Hartkugelpotenzial14 ist auch hier die Streuung für lang same Teilchen durch die unterste (l = 0)-Partialwelle dominiert (s-Streuung). Auch die höheren Streuphasen sind mit demselben Faktor unterdrückt wie beim Hartkugel potenzial. Ursache hierfür ist, dass für kleine Energien das einlaufende Teilchen im Wesentlichen nur die Zentrifugalbarriere sieht, die in beiden Fällen dieselbe ist, siehe Abb. 25.19. Für kleine Energien gilt deshalb für alle Potenziale endlicher Reichweite R: tan δ l ∼ (kR)2l+1 ,
kR ≪ 1 ,
(25.103)
was als Potenzialstreuung bezeichnet wird. Diese ist folglich durch s-Streuung domi niert und liefert deshalb wegen P0 (cos θ) = 1 einen näherungsweise isotropen dif ferenziellen Wirkungsquerschnitt. (Es sei an dieser Stelle noch einmal betont, dass die Dominanz der s-Streuung ein gutartiges Verhalten der Funktion g l (z) für z = qR und l > 1 voraussetzt.) Die s-Streuung (l = 0), für welche die Zentrifugalbarriere ver schwindet, ist jedoch sehr wohl sensitiv auf die Details des Streupotenzials. Deshalb werden wir die s-Streuung in Abschnitt 25.11.3 etwas genauer untersuchen.
25.11.2 Resonanzstreuung Bei der Behandlung der Streuung eines langsamen Teilchens kR ≪ 1 am sphärischen Potenzialtopf haben wir bisher vorausgesetzt, dass die in Gl. (25.102) definierte Funk
25.11 Streuung am Potenzialtopf
|
107
tion g l (qR) beschränkt ist. Diese Voraussetzung wird verletzt für solche Wellenzahlen q = q(E) (25.95), für die diese Funktion einen Pol entwickelt: N l (qR) = (l + 1) j l (qR) + q R jl (qR) = 0 .
(25.104)
Für die Energien E = ER , für die diese Bedingung erfüllt ist, divergiert nach Gl. (25.101) der Tangens der Streuphase, sodass δ l = (n +
1 )π , 2
n∈ℤ.
(25.105)
Für diese Werte nimmt der partielle Wirkungsquerschnitt (25.66) sein Maximum σl =
4π (2l + 1) k2
an. Wir sprechen deshalb von einer Resonanz bzw. von Resonanzstreuung. Außerhalb der Resonanz k ≠ k R = k(ER ) sind die Streuphasen δ l wegen der Bedingung kR ≪ 1 sehr klein (siehe Gl. (25.103)) und das Teilchen erfährt nur eine geringe Streuung. Mit wachsendem Drehimpuls l sind die Streuphasen mehr und mehr unterdrückt und die Resonanz wird deshalb immer schärfer. Damit die Bedingung kR ≪ 1 nicht nur für extrem niedrige Energien bzw. Wellenzahlen k gilt, muss das Potenzial eine kleine Reichweite R besitzen. Des Weiteren nehmen wir der Einfachheit halber an, dass das Potenzial sehr tief ist, sodass neben der obigen Bedingung (25.100) noch die Bedin gung qR ≫ l erfüllt ist. Für die Bessel-Funktionen j l (qR) können wir dann die für große Argumente gültige asymptotische Form (25.54) j l (qR) ≃
1 lπ sin (qR − ) , qR 2
jl (qR) ≃ − (
1 lπ 1 2 lπ ) sin (qR − ) + cos (qR − ) qR 2 qR 2
benutzen. Damit vereinfacht sich die Resonanzbedingung (25.104) auf: l lπ lπ sin (qR − ) + cos (qR − ) = 0 . qR 2 2 Beschränken wir uns hier auf die führenden Terme in 1/(qR), cot (qR −
1 lπ ) = 0 + O( ) , 2 qR
so erhalten wir als Resonanzbedingung q(E)R = (2n + l + 1)
π , 2
n = 0, 1, 2, 3, . . . .
(25.106)
108 | 25 Streutheorie Wegen qR ≫ l muss hier streng genommen nπ ≫ 1 gelten, zumindest darf n keine ne gativen Werte annehmen. Für gegebenes n und l legt diese Bedingung die Resonanz energien fest. Setzt man hierin die Energie E zu negativen Werten fort, so erhält man gerade die Bedingung für gebundene Zustände in einem sehr tiefen sphärisch-sym metrischen Potenzialtopf. Die Resonanzen sind damit die Positive-Energie-Pendants der gebundenen Zustände.¹⁵ Für Energien außerhalb der Resonanz erfährt eine Parti alwelle mit l ≥ 1 im hier betrachteten Fall eines engen und sehr tiefen Potenzialtopfs nur eine unbedeutende Streuung und kann nicht wesentlich in den Potenzialbereich eindringen. Der große Wirkungsquerschnitt im Resonanzbereich kommt dadurch zu stande, dass die entsprechende Partialwelle zum großen Teil die Zentrifugalbarriere durchtunnelt und im Inneren des effektiven Potenzials V l (r) = V(r) +
ℏ2 l(l + 1) 2mr2
(25.107)
einen quasigebundenen Zustand besetzt. Die Wellenfunktion wird also im Resonanz bereich vom Potenzial „eingefangen“. Dies ist unmittelbar aus der Resonanzbedin gung (25.106) ablesbar, die für die Wellenlänge λ = 2π/q des eingefangenen Teilchens verlangt: λ R = (2n + l + 1) . (25.108) 4 Diese Bedingung ist das Analogon der eindimensionalen Resonanzbedingung im Fabry-Perot-Interferometer (siehe Abschnitt 9.2). Wegen des hier vorausgesetzten sehr tiefen Potenzials (qR ≫ 1) ist die Ausdehnung des effektiven Potenzials für positive Energien praktisch durch den Potenzialradius R gegeben, siehe Abb. 25.20. In der Resonanz „passt“ die Streuwellenfunktion gerade in das Potenzial: Die Resonanzbedingung (25.108) garantiert, dass es ähnlich wie im Fabry-Perot-Inter ferometer zu einer quasistehenden Welle im effektiven Potenzial V l (r) (25.107) kommt. Ähnlich wie im eindimensionalen Fall wird bei diesen Resonanzenergien die Poten zialbarriere für das Teilchen quasi transparent, sodass es diese durchtunneln und sehr lange im Potenzial verbleiben kann. Diese große Aufenthaltsdauer des Teilchens im Potenzial ist die Ursache für den großen Wirkungsquerschnitt im Resonanzbe reich. Im Gegensatz zu einem echten gebundenen Zustand (E < 0) besitzt das Teilchen in der Resonanz nur eine endliche Verweilzeit im Potenzialtopf. Der Resonanzzustand ist damit kein echter gebundener Zustand, der eine unendlich große Lebensdauer ha ben würde, sondern stellt einen metastabilen Zustand dar, der nach einer endlichen Lebensdauer τ zerfällt. Nach der Unschärferelation steht diese Lebensdauer mit der Energieunschärfe, d. h. mit der Breite der Resonanz im Wirkungsquerschnitt σ l (E), in Beziehung, wie wir weiter unten explizit sehen werden.
15 Einen ähnlichen Sachverhalt hatten wir in einer Dimension gefunden, siehe Kapitel 9. Das ein dimensionale Analogon des Wirkungsquerschnitts ist der Transmissionskoeffizient. Für positive Energien nimmt dieser seinen maximalen Wert T = 1 für die Resonanzen an, während er bei den (negativen) Energien der Bindungszuständen Polstellen besitzt.
25.11 Streuung am Potenzialtopf
| 109
E
E>0 Resonanzen 0 }
r
gebundene Zustände E 0 verschwinden, siehe Abb. 25.22 und Abb. 25.18. Im nächsten Abschnitt wird deshalb die s-Streuung etwas genauer unter sucht.
25.11 Streuung am Potenzialtopf
| 111
δ0(k) δ1(k)
π
π 2
0
1
2
50 45 40 35 30 σ 25 R2 20 15 10 5 0
(b)
3
4
5
kR
(a)
σ0(k) σ1(k)
0
1
2
3
4
kR
5
Abb. 25.22: (a) Streuphase δ l=0,1 (k) und (b) zu gehörige partielle Wirkungsquerschnitte σ l für ein sphärisch-symmetrisches Kastenpotenzial der Stärke γ = 2√2. Im (l = 1)-Kanal tritt bei kR ≃ 1 eine Resonanz auf.
Aus den Definitionen der Wellenzahlen (25.94) und (25.95) folgt die Beziehung q2 = k 2 + q20 ,
q0 =
√2mV0 . ℏ
(25.111)
Für Energien E, die klein gegenüber der Tiefe des Potenzialtopfs V0 sind, gilt k 2 ≪ q20 und somit in guter Näherung: q2 ≃ q20 . (25.112) Die Resonanzbedingung (25.106) reduziert sich mit (25.112) für s-Streuung (l = 0) auf: π γ := q0 R = (2n + 1) , n = 0, 1, 2, . . . . 2 Nach Abschnitt 17.5 ist dies gerade die Bedingung dafür, dass in einem sphärisch symmetrischen Potenzialtopf mit Radius R und Tiefe V0 ein s-Niveau mit der Energie E = 0 (quasigebundener Zustand) sowie n gebundene s-Zustände mit E < 0 auftre ten. Für die Streuung langsamer Teilchen k → 0 wird der Wirkungsquerschnitt der s-Streuung folglich maximal, wenn in dem Potenzialtopf ein quasigebundener s-Zu stand (mit E = 0) vorliegt. Der Wirkungsquerschnitt σ 0 = 4π sin δ0 (k)/k 2 divergiert dann bei E ∼ k 2 → 0.
112 | 25 Streutheorie
25.11.3 Die s-Streuung am Potenzialtopf Die s-Wellenstreuung nimmt eine Sonderstellung ein, da zum einen für den Drehim puls l = 0 keine Zentrifugalbarriere existiert; zum anderen lässt sich die Streuphase für die s-Streuung analytisch angeben. Dazu setzen wir in den allgemeinen Ausdruck für die Streuphasen am sphärischen Potenzialtopf (25.99) die expliziten Werte für die sphärischen Bessel- und Neumann-Funktionen nullter Ordnung ein: sin z , z cos z sin z − 2 , j0 (z) = z z
j0 (z) =
cos z , z sin z cos z + 2 . n0 (z) = z z n0 (z) = −
Den resultierenden Ausdruck erweitern wir mit (R⋅kR⋅qR). Dies liefert: tan δ0 =
[kR cos(kR) − sin(kR)] sin(qR) − [qR cos(qR) − sin(qR)] sin(kR) . [kR sin(kR) + cos(kR)] sin(qR) + [qR cos(qR) − sin(qR)] cos(kR)
Im Zähler und Nenner klammern wir cos(kR)⋅cos(qR) aus und erhalten: tan δ 0 = =
[kR − tan(kR)] tan(qR) − [qR − tan(qR)] tan(kR) [kR tan(kR) + 1] tan(qR) + [qR − tan(qR)] kR tan(qR) − qR tan(kR) . qR + kR tan(kR) tan(qR)
(25.113)
Dividieren wir schließlich Zähler und Nenner durch qR, so erhalten wir: tan δ0 =
k q
tan(qR) − tan(kR)
1+
k q
tan(qR) tan(kR)
.
Zur weiteren Vereinfachung dieses Ausdrucks setzen wir k tan(qR) = tan(pR) q
(25.114)
und benutzen das Additionstheorem für den Tangens: tan(x ± y) =
tan x ± tan y . 1 ∓ tan x tan y
Dann vereinfacht sich der Ausdruck für die Streuphase zu: tan δ0 = tan(pR − kR) . Diese Gleichung lässt sich nun trivial nach der Streuphase δ0 auflösen. Benutzen wir die Definition der Variablen p (25.114), so erhalten wir schließlich für die Streuphase der s-Welle: k (25.115) δ0 (k) = [arctan ( tan(qR)) − kR] mod π . q
25.11 Streuung am Potenzialtopf
| 113
Für kleine Wellenzahlen k ≪ q (und endlichen Tangens) können wir den Arkustan gens in eine Taylor-Reihe entwickeln. In unterster Ordnung reduziert sich dann die Streuphase auf: tan(qR) δ0 (k) = kR ( − 1) mod π . (25.116) qR Setzen wir dieses Ergebnis in den Ausdruck für den Wirkungsquerschnitt (25.66) ein, wobei wir wegen der Kleinheit der Streuphase δ0 den Sinus durch sein Argument er setzen dürfen, so finden wir: σ 0 = 4πR2 (
2 tan(qR) − 1) . qR
(25.117)
Die scheinbare Divergenz des Wirkungsquerschnitts für qR = π/2 ist eine Folge der in Gl. (25.116), (25.117) benutzten Näherung arctan x ≃ x ≃ sin x, die jedoch in diesem Fall nicht mehr gerechtfertigt ist. In der Tat folgt für qR = π/2 aus Gl. (25.115) für die Streuphase δ 0 (k) = π/2 − kR und für kR ≪ 1 gilt somit sin δ 0 ≃ 1, womit der partielle Wirkungsquerschnitt σ l=0 (25.66) sein Maximum (25.67) annimmt, aber endlich bleibt.
Für bestimmte Energien, für die tan(qR) = qR gilt, verschwindet der Wirkungsquerschnitt (25.117) selbst bei sehr attraktiven Poten zialen. Dies ist der sogenannte Ramsauer-Effekt, der 1923 noch vor der Entwicklung der Wellenmechanik entdeckt wurde: Bei der Streuung von Elektronen an Edelga sen, wie Argon, Krypton, Xenon, beobachtet man ein Verschwinden des Wirkungs querschnitts bei einer Einschussenergie von E ≃ 0,7 eV. Das Edelgasatom wird für Elektronen dieser Energie völlig transparent.¹⁶ Die obigen Betrachtungen liefern ei ne Erklärung für dieses Phänomen: Das elektrostatische Potenzial der Edelgasatome nimmt mit der Entfernung wesentlich stärker ab als das Feld der übrigen Atome und kann in guter Näherung durch ein (anziehendes) Kastenpotenzial ersetzt werden. Fer ner ist die Energie E ≃ 0,7 eV hinreichend klein, sodass die obige Näherung (25.116) anwendbar ist.
25.11.4 Levinson-Theorem Wir werden jetzt einen allgemeinen Zusammenhang zwischen dem Verhalten der Streuphase bei niedrigen Energien und dem Auftreten von Bindungszuständen auf decken. Dazu betrachten wir die exakte Gleichung für die s-Wellenstreuphase (25.115),
16 Der Ramsauer-Effekt (d. h. das Verschwinden des Wirkungsquerschnitts bei gewissen Energien) ist gewissermaßen das Gegenstück zu den Resonanzen, bei denen der Wirkungsquerschnitt maximal wird.
114 | 25 Streutheorie
die wir in der Form
tan(kR + δ0 ) k = , (25.118) tan(qR) q schreiben. Zwischen der Wellenzahl k (25.94) außerhalb des Potenzials und der Wel lenzahl q (25.95) im Potenzial besteht der Zusammenhang q = k √1 +
2mV0 . ℏ2 k 2
Für k → ∞ strebt die Wellenzahl q gegen k und die rechte Seite der Gl. (25.118) gegen 1 geht. Folglich gilt: tan(k(R + δ0 /k)) lim =1. tan(kR) k→∞ Da tan x für x → ∞ eine singuläre, alternierende Funktion ist, lässt sich die letzte Gleichung nur für δ0 (k → ∞) = 0 mod π . erfüllen. Um die in der Definition der Streuphase enthaltene Willkür zu beseitigen, wählen wir folgende Konvention: Falls die Größe qR im Intervall π π (25.119) (2n − 1) < qR ≤ (2n + 1) 2 2 liegt, so wählen wir die Streuphase δ0 (k) derart, dass π π (2n − 1) < (kR + δ0 (k)) ≤ (2n + 1) (25.120) 2 2 gilt.¹⁷ Mit dieser Konvention verschwindet die Streuphase asymptotisch für k → ∞ wegen der Konvergenz von q und k: δ0 (k → ∞) = 0 . Wir untersuchen jetzt die Streuphase δ0 (k) für kleine Energien. Für k → 0 erhalten wir aus (25.120) π π (2n − 1) < δ0 (0) ≤ (2n + 1) . (25.121) 2 2 Die hier auftretende ganze Zahl n ist durch den Limes k → 0 von Gl. (25.119), π π (2n − 1) ≤ γ ≤ (2n + 1) , (25.122) 2 2 festgelegt, wobei die Größe R√2mV0 (25.123) ℏ die Stärke des Potenzials charakterisiert. Die hier erhaltene Ungleichung (25.122) für γ ist aber nach (17.64) nichts weiter als die Bedingung für die Existenz von n gebunde nen s-Zuständen im sphärischen Potenzialtopf. Des Weiteren wurde in Abschnitt 17.5 gezeigt, dass für π (25.124) γ = (2n + 1) 2 γ = q(k = 0)R =
17 Diese Konvention ist in Anbetracht von Gl. (25.118) sicherlich sinnvoll.
25.11 Streuung am Potenzialtopf
115
√ γ = 1.5 γ = π/2 √ γ = 4.5
π
δ0
|
π 2
0
0.5
1
1.5
(a)
2 kR
2.5
3
3.5
4
√ γ = 1.5 γ = π/2 √ γ = 4.5
60 50 40 σ0 30 R2 20 10 0
(b)
0
0.5
1
1.5
2 kR
2.5
3
3.5
4
Abb. 25.23: (a) Streuphasen δ 0 (kR) und (b) Wirkungsquerschnitt σ 0 (kR) der s-Streuung für die kritische Potenzial stärke γ = π/2, bei welcher der erste quasigebundene s-Zustand mit E = 0 auf tritt, sowie für γ = √1.5, √4.5. Für γ = π/2 divergiert der Wirkungsquerschnitt bei k = 0.
der Potenzialtopf neben den n Bindungszuständen noch einen quasigebundenen Zu stand mit Energie E = 0 besitzt. Die Streuphase δ0 (k → 0) ist offenbar direkt mit der Potenzialstärke γ korreliert. Für kleine Energien können wir in führender Ordnung in k die Wellenzahl im Potenzialinneren q(k) durch ihren Wert (25.123) bei k = 0 ersetzen. Für die Streuphase (25.115) finden wir dann δ0 (k) = [arctan (kR
tan γ ) − kR] . γ
(25.125)
Dieser Ausdruck gilt für beliebige Potenzialstärken γ und kR ≪ qR. Für γ = (2n + 1) π2 finden wir hieraus mit der Bedingung (25.121) π (25.126) δ0 (k → 0) = (2n + 1) = γ . 2 Für diese Potenzialstärken, bei denen ein quasigebundener Zustand mit E = 0 vor liegt, tritt somit eine Resonanz im s-Kanal bei der Energie (bzw. Wellenzahl) k = 0 auf, bei welcher der Wirkungsquerschnitt σ 0 (k) (25.66) divergiert, siehe Abb. 25.23. Für Potenzialstärken γ ≠ (2n + 1) π2 ist tan γ endlich. Für k → 0 können wir dann den Arkustangens in (25.125) in führender Ordnung entwickeln und erhalten δ0 (k) = kR [
tan γ − 1] γ
(25.127)
116 | 25 Streutheorie
und somit δ0 (0) = 0 mod π , bzw. mit der Konvention (25.121) π π < γ < (2n + 1) . (25.128) 2 2 Betrachten wir die Streuphase δ l=0 (0) als Funktion der Potenzialstärke γ, so finden wir aus Gln. (25.126) und (25.128): δ0 (0) = nπ ,
(2n − 1)
Mit jedem neuen Bindungszustand nimmt δ0 (0) um π zu. Dabei durchläuft δ0 (0) den Wert 2π mod π, wenn der neue Bindungszustand bei der Energie E = 0 auf taucht. Dieses Ergebnis wird durch die numerische Lösung von Gl. (25.115) bestätigt, siehe Abb. 25.24 und ist Inhalt des Levinson-Theorems, das sich auch für Drehimpulse l ≠ 0 beweisen lässt: In einem Potenzial mit n (echten) Bindungszuständen mit Drehimpuls l gilt: δ l (0) − δ l (∞) = nπ . Existiert neben den n echten gebundenen s-Zuständen (mit E < 0) noch ein quasigebun dener s-Zustand mit Energie E = 0, so gilt δ0 (0) − δ0 (∞) = (n +
1 )π . 2
3π
2π δ0 π
π
2π
3π
γ Abb. 25.24: Die Streuphase δ 0 (kR) (25.115) als Funktion des Stärkeparameters γ (25.123) des Streu potenzials für kR = 0,01.
25.11 Streuung am Potenzialtopf
3π
2π
2π
π
π
0
2
4
6
8 kR
10
12
δ0
3π
δ0
0
14
2
4
6
8 kR
10
1
12
14
σ0/R 2
14 12
| 117
σ0 /R2 4π/(kR)2
10 8
4πa2
6 4 2 0
0
2
4
6
8 kR
10
12
14
0
2
4
6
8 kR
10
12
14
Abb. 25.25: Streuphase (oben) und Wirkungsquerschnitt (unten) für s-Streuung an einem sphärisch symmetrischen Potenzialtopf, der drei gebundene s-Zustände besitzt, für die Potenzialstärken γ = 8,94 (links) und γ = 10,92 (rechts) a ist die Streulänge (25.130).
Als illustratives Beispiel geben wir in Abb. 25.25 die Streuphase der s-Streuung und den zugehörigen Wirkungsquerschnitt für den Fall an, dass drei gebundene s-Zustän de im Potenzialtopf vorliegen.
25.11.5 Die Streulänge Es hat sich eingebürgert, insbesondere in der Kernphysik, für die Niederenergies-Streuung (k → 0) folgende Entwicklung zu benutzen: 1 1 k cot δ0 (k) = − + r0 k 2 + ⋅ ⋅ ⋅ . (25.129) a 2 Hierbei ist 1 a = − lim (25.130) k→0 k cot δ 0 (k) die Streulänge und r0 die effektive Reichweite des Potenzials. Da für k → 0 die Streu phasen sehr klein sind, gilt sin δ0 (k) ≃ tan δ0 (k) und mit (25.130) finden wir aus (25.66) für den totalen Querschnitt der s-Streuung σ 0 (k → 0) = 4πa2 .
118 | 25 Streutheorie
Der Vergleich dieses Ausdrucks mit dem Wirkungsquerschnitt der s-Streuung (25.77) an einer harten Kugel zeigt, dass die Streulänge die Bedeutung eines effektiven Streu radius besitzt. Die Streulänge erlangt eine sehr anschauliche Bedeutung, wenn man die asym ptotische Form der Radialwellenfunktion (25.56) für l = 0 ̄ k (r) u k0 (r) ≃ C0 (k) sin(kr + δ0 (k)) =: u zu kleinen Werten von r fortsetzt und die Normierungskonstante C0 so wählt, dass ̄ k (r = 0) = 1. Dies liefert: u ̄ k (r) = cos(kr) + cot δ0 (k) sin(kr) . u ̄ k (r) stimmt außerhalb des asymptotischen Bereichs r ≫ R Die so erhaltene Funktion u nicht mit der tatsächlichen Radialfunktion u k0 (r) überein. Entwickeln wir diese Funk tion für kr ≪ 1 in führender Ordnung, erhalten wir: ū k (r) = 1 − rk cot δ0 (k) . Hieraus finden wir für k → 0 mit (25.130) ū k→0 (r) = 1 −
r , a
womit sich die Streulänge a als Schnittpunkt der Funktion ū k→0 (r) mit der r-Achse erweist, siehe Abb. 25.26. Während die tatsächliche Radialfunktion u kl (r) bei r = 0 verschwindet (damit die Gesamtwellenfunktion dort regulär ist), besitzt die zu klei ̄ k (r) eine Nullstelle bei r = a (während nen r fortgesetzte asymptotische Funktion u ̄ k (r) u u k0 (r)
1
1
1 r
r
r a
a −V 0
R
−V 0 R −V 0
δ0 > 0, (a)
a0
(c)
Abb. 25.26: Zur Definition der Streulänge: (a) schwach anziehendes Potenzial ohne Bindungszu stand a < 0, (b) anziehendes Potenzial mit quasigebundenem Zustand bei E = 0, (c) anziehendes Potenzial mit einem echten Bindungszustand E B < 0.
25.11 Streuung am Potenzialtopf |
119
ū k (r = 0) = 1). Diese Verschiebung der Nullstelle um die Streulänge a in der asym ̄ k (r) relativ zur exakten Radialwellen ptotischen Form der Radialwellenfunktion u funktion u kl=0 (r) ist eine charakteristische Größe für die Streuung. Wir illustrieren die Entwicklung (25.129) anhand der Streuung am sphärischen Potenzialtopf (25.92). Nach (25.113) gilt für die exakte Streuphase der s-Streuung cot δ0 (k) =
qR + kR tan(kR) tan(qR) , kR tan(qR) − qR tan(kR)
wobei q2 = k 2 + q20 ,
q0 =
√2mV0 . ℏ
Für die Streulänge (25.130) finden wir hieraus a = −R (
tan γ − 1) , γ
(25.131)
wobei γ = Rq0 die effektive Potenzialstärke (25.123) ist. Dieser Ausdruck für a lässt sich auch direkt aus (25.127) gewinnnen, da tan δ0 (k) ≈ δ0 (k) für k → 0. Die Streulänge a ist mit der Natur des Streupotenzials verknüpft. Für ein schwach attraktives Potenzial (ohne Bindungszustand), γ = Rq0 < π/2, ist die Streuphase δ0 positiv (siehe Gl. (25.127)) und somit die Streulänge a (25.131) negativ, Abb. 25.26a. Liegt ein quasigebundener Zustand bei der Energie E = 0 (und kein echter gebunde ner Zustand mit E < 0) vor, so ist nach Gl. (25.126) δ0 (0) = π/2 = γ, was eine divergente Streulänge (25.131) impliziert. Für E = 0 ist die Wellenfunktion außerhalb des kurz reichweitigen Potenzials konstant und kann deshalb niemals die r-Achse schneiden, siehe Abb. 25.26b. Folglich strebt die Streulänge gegen ±∞. Nimmt die Stärke des an ziehenden Potenzials weiter zu, γ > π/2, kommt es zur Ausbildung eines gebundenen Zustands mit E < 0, Abb. 25.26c. Nach Gl. (25.128) gilt in diesem Fall δ0 (0) = π und für kleine k > 0 folglich 2π < δ(k) < π. Aus Gl. (25.130) erhalten wir dann eine positive Streulänge. Für abstoßende Potenziale ist die Streuphase negativ (siehe Abschnitt 25.8.2) und folglich die Streulänge a stets positiv. Sie ist dann vergleichbar mit der Ausdehnung des Potenzials.
25.11.6 Streuung am kugelsymmetrischen Potenzialberg Wir betrachten die Streuung eines Teilchens am kugelsymmetrischen Potenzial {V0 , V(r) = { 0, {
r≤R r>R.
(25.132)
Dieses Potenzial resultiert aus dem der sphärischen Box (25.92) durch die Ersetzung (−V0 ) → V0 . Dementsprechend können wir die Wellenfunktion und damit auch die
120 | 25 Streutheorie
Streuphase für den Potenzialberg (25.132) aus den Ausdrücken für die sphärische Box (25.92) durch die Ersetzung V0 → (−V0 ) gewinnen. Für E > V0 bleibt die Wellenzahl im Gebiet des nichtverschwindenden Potenzials, r ≤ R, q=
√2m(E − V0 ) , ℏ
(25.133)
reell. Sie ist jedoch kleiner als die Wellenzahl des einfallenden Teilchens: k=
√2mE ℏ
.
Die oben abgeleiteten Ausdrücke für die Streuphasen (25.115) und Wirkungsquer schnitte (25.117) bleiben in diesem Fall unmittelbar bestehen. Für E < V0 hingegen wird die Wellenzahl q (25.133) rein imaginär q = iκ ,
κ=
√2m(V0 − E) . ℏ
(25.134)
Mit tan(iκ) = i tanh κ finden wir aus (25.115) für die Streuphase der s-Streuung: k δ0 (k) = [arctan ( tanh(κR)) − kR] κ
mod π .
Diese Streuphase verschwindet für k → 0. Mit der analytischen Fortsetzung (25.134) q = iκ folgt aus (25.117) für den Streuquerschnitt langsamer Teilchen E ≪ V0 : σ 0 = 4πR2 ( wobei κ≃
2 tanh(κR) − 1) , κR
(25.135)
√2mV0 . ℏ
Mit wachsendem κR nähert sich der Streuquerschnitt (25.135) für langsame Teilchen (E ≪ V0 ) monoton dem Wirkungsquerschnitt σ 0 = 4πR2 der Hartkugelstreuung, die bereits in Abschnitt 25.9 behandelt wurde. Dies war natür lich zu erwarten, da für κ ∼ √V0 → ∞ das Potenzial (25.132) in das der harten Kugel übergeht.
26 Symmetrien Wir haben bereits mehrfach festgestellt, dass Symmetrien das Lösen der Schrödin ger-Gleichung vereinfachen: Bei einem axialsymmetrischen System hängt das Poten zial nicht vom Drehwinkel um die Symmetrieachse ab. Dementsprechend bleibt die Projektion des Drehimpulses auf die Symmetrieachse erhalten und die dreidimen sionale Schrödinger-Gleichung reduziert sich auf eine Differenzialgleichung in den beiden verbleibenden Variablen (Abstand von der Symmetrieachse und Koordinate längs der Symmetrieachse), siehe Kapitel 16. Hängt das Potenzial nur vom Abstand zum Ursprung ab (Zentralpotenzial), so ist es invariant unter beliebigen Drehun gen und der gesamte Drehimpuls bleibt erhalten. Die dreidimensionale SchrödingerGleichung lässt sich dann auf eine eindimensionale Differenzialgleichung im Ra dius (Radialgleichung) bei vorgegebenen Drehimpuls reduzieren, siehe Kapitel 17. Im vorliegenden Kapitel wollen wir Symmetrien und ihre Konsequenzen in der Quanten mechanik von einem allgemeinen Standpunkt aus betrachten. Jede Symmetrie ist mit einer Invarianz gegenüber bestimmten Transformationen verbunden. Es ist deshalb nicht verwunderlich, dass jede Symmetrie die Existenz einer Invarianten, einer so genannten Erhaltungsgröße impliziert. Erhaltungsgrößen erleichtern sehr wesentlich das Lösen der Bewegungsgleichungen. Dies gilt sowohl in der klassischen Mechanik als auch in der Quantenmechanik. Aus diesem Grunde ist es immer ratsam, vor der Lösung eines konkreten Problems die Symmetrien des zugrunde liegenden Systems aufzudecken. Bevor wir zur allgemeinen Behandlung von Symmetrien in der Quantenmecha nik kommen, wollen wir zunächst untersuchen, wie sich die Wellenfunktionen eines Teilchens unter der Transformation seiner Koordinaten verändert.
26.1 Euklidische Koordinatentransformationen Die Untersuchung der Eigenschaften eines Systems unter Raum-Zeit-Transforma tionen lässt sich von zwei verschiedenen Standpunkten aus durchführen: Halten wir die Koordinatenachsen fest und bewegen das betrachtete physikalische Sys tem, so spricht man von aktiver Transformation. Bewegen wir hingegen das Ko ordinatensystem und halten das physikalische System fest, so spricht man von passiven Koordinatentransformationen. Die aktive Transformation des physikali schen Systems und die inverse passive Transformation führen auf dasselbe Ergeb nis, wie wir jetzt anhand der räumlichen Koordinatentransformationen illustrieren wollen. Wir betrachten die Position eines Teilchens in einem Koordinatensystem, sie he Abb. 26.1. Den Ortsvektor x können wir nach den Basisvektoren e i , i = 1, 2, 3,
https://doi.org/10.1515/9783110586077-004
122 | 26 Symmetrien e2
e2 e2̃
x
x
x
α
e1̃
β e1
(a)
e1 (b)
Abb. 26.1: (a) Aktive Drehung des Ortsvektors x um einen Winkel α in den Vektor x bei festgehalte nen Koordinatenachsen e1 , e2 . (b) Passive Drehung der Koordinatenachsen e1 , e2 um den Winkel β bei festgehaltenem Ortsvektor x.
zerlegen:¹ x = ei xi . Die Koordinaten x i hängen offenbar von der Wahl des Koordinatensystems (d. h. der Basisvektoren e i ) ab. Eine Änderung der Teilchenkoordinaten lässt sich auf zwei Arten erreichen: 1. Aktive Koordinatentransformationen: Verschieben wir das Teilchen im Raum, so ändert sich sein Ortsvektor: x → x . Halten wir bei dieser Verschiebung das Koordinatensystem, d. h. die Basisvekto ren e i , fest, so müssen sich die Koordinaten des Teilchens ändern: x i → xi , 2.
x = xi e i .
Passive Koordinatentransformationen: Wir können alternativ auch die Position x des Teilchens im Raum festhalten und das Koordinatensystem (d. h. die Basisvektoren e i ) verschieben: e i → ẽı . Durch die Änderung der Basisvektoren müssen sich bei festgehaltener Teilchen position x auch die Koordinaten des Teilchens ändern: x = x̃ı ẽı .
1 Wie im Band 1 benutzen wir auch hier die Einstein’sche Summenkonvention: Über doppelt auftre tende Indizes wird summiert.
26.1 Euklidische Koordinatentransformationen
| 123
Allgemein kann das Ergebnis einer aktiven Koordinatentransformation auch durch die zugehörige inverse passive Transformation der Basisvektoren erreicht werden.² Es ist deshalb ausreichend, das Transformationsverhalten der Wellenfunktion unter aktiven Koordinatentransformationen zu betrachten. Wir wollen jetzt untersuchen, wie sich die Wellenfunktion unter einer aktiven Koordinatentransformation x → x = Ux (26.1) verändert. Hierbei soll U eine invertierbare euklidische Transformation³ bezeichnen, sodass auch die inverse Beziehung x = U −1 x gilt. Durch die aktive Koordinatentransformation (26.1) wird der Wert der Wellenfunk tion aus dem Punkt x in den Punkt x übertragen. Bezeichnen wir die transformierte Wellenfunktion (d. h. die Wellenfunktion nach Koordinatentransformation) mit ψ , so gilt offenbar der Zusammenhang
und somit
ψ (x ) = ψ(x)
(26.2)
ψ (x) = ψ(U −1 x)
(26.3)
⟨x|ψ ⟩ = ⟨U −1 x|ψ⟩ .
(26.4)
bzw. in der bracket-Notation
Andererseits muss sich die ursprüngliche Wellenfunktion ψ (als Element eines HilbertRaums) durch Anwendung eines Operators U in die transformierte Wellenfunktion ψ (bei gleichem Argument) überführen lassen, d. h., wir können einen Operator U so definieren, dass |ψ ⟩ = U|ψ⟩
(26.5)
gilt. Vergleich von Gl. (26.4) und (26.5) liefert
bzw.
⟨x|U|ψ⟩ = ⟨U −1 x|ψ⟩
(26.6)
Uψ(x) = ψ(U −1 x) .
(26.7)
2 Werden sämtliche Vektoren einschließlich der Basisvektoren e i , welche die Koordinatenachsen de finieren, in gleicher Weise transformiert (d. h., es wird die aktive und passive Transformation durch geführt) e i → ẽı , x = x i e i → ̃ x = x i ẽı , so ändern sich die Koordinaten der Vektoren natürlich nicht. 3 Eine euklidische Transformation ist von der Form (Ux)i = A ij x j + a i , wobei A ij eine invertierbare Matrix ist. Euklidische Transformationen enthalten somit Verschiebungen a i sowie Drehungen und Spiegelungen und werden in der Mathematik oftmals auch als Bewegungen bezeichnet.
124 | 26 Symmetrien
Die rechte Seite dieser Gleichung ist für eine gegebene Wellenfunktion allein durch die Koordinatentransformation U festgelegt und definiert die Wirkung des quantenme chanischen Operators U (auf der linken Seite der Gleichung) auf die Wellenfunktion. Gl. (26.6) bzw. (26.7) gestattet es uns daher, für eine gegebene euklidische Transfor mation U (26.1) den zugehörigen Operator U (26.5) zu bestimmen, der die Wellenfunk tionen transformiert. Dies werden wir in Abschnitt 26.4 bzw. 26.5 für die Translation bzw. die Drehung tun. Wir betrachten einen Eigenzustand |x⟩ des Ortsoperators x.̂ Unter der Transfor mation (26.1) geht dieser in den Zustand |x ⟩ = |Ux⟩ über. Dieser Zustand muss nach (26.5) durch den oben eingeführten Operator U aus |x⟩ erzeugt werden: |x ⟩ = U|x⟩ . Damit gilt die Beziehung U|x⟩ = |Ux⟩ ,
(26.8)
die den Zusammenhang zwischen der Koordinatentransformation U und dem zuge hörigen Operator U im Hilbert-Raum der Zustände herstellt. Wenden wir den Ortsoperator x̂ auf Gl. (26.8) an und benutzen dessen Eigenwert gleichung ̂ ⟩ = x |x ⟩ , x|x (26.9) so erhalten wir: x̂ U|x⟩ = Ux|Ux⟩ ,
(26.10)
wobei Ux als Eigenwert (von x)̂ eine c-Zahl ist, d. h. ein Objekt, welches mit sämtlichen Operatoren kommutiert. Wirken wir mit U−1 auf Gl. (26.10), so erhalten wir deshalb: ̂ U−1 x̂ U|x⟩ = Ux U−1 |Ux⟩ = Ux|U −1 Ux⟩ = Ux|x⟩ = U x|x⟩ , wobei wir wieder (26.8) und die Eigenwertgleichung (26.9) benutzt haben. Da diese Gleichung für sämtliche |x⟩ gilt, folgt aus ihr die Operatorbeziehung U−1 x̂ U = U x̂ .
(26.11)
̂ der eine Funktion des Ortsoperators ist, folgt aus Für einen beliebigen Operator O(̂ x), (26.11) durch Taylor-Entwicklung ̂ x)̂ ≡ O(̂ x̂ ) . ̂ = O(U U−1 O(̂ x)U
(26.12)
Gehen wir hier zur inversen Transformation (U → U −1 , U → U−1 ) über, so erhalten wir: ̂ −1 x)̂ . ̂ −1 = O(U U O(̂ x)U (26.13)
26.1 Euklidische Koordinatentransformationen
| 125
Diese Gleichung ist das Analogon zu Gl. (26.7) und stellt den Zusammenhang zwischen der Koordinatentransformation (26.1) und dem zugehörigen quantenmechanischen Operator U auf der Ebene der Observablen her. Transformation der Observablen Nach Gleichung (26.9) besitzt der untransformierte Operator x̂ in den transformier ten Zuständen |x ⟩ die transformierten Eigenwerte x = Ux. Konsistent damit for dern wir allgemein für den transformierten Operator Ô einer Observablen Ô die Beziehung⁴ ̂ ⟩ =: ⟨x|Ô |ψ⟩ . ⟨x |O|ψ
(26.14)
Damit ist die Transformation der Zustände äquivalent zur Transformation der Ob servablen. Für die linke Seite finden wir unter Benutzung von (26.1), (26.5) und (26.6) ̂ ⟩ = ⟨Ux|O|ψ ̂ ⟩ ⟨x |O|ψ (26.1)
̂ ⟩ (26.5) ̂ . = ⟨x|U−1 O|ψ = ⟨x|U−1 OU|ψ⟩
(26.6)
Vergleich dieses Ausdrucks mit der rechten Seite von Gl. (26.14) liefert für den trans formierten Operator ̂ . Ô = U−1 OU
(26.15)
Dies ist das Transformationsgesetz von Observablen unter euklidischen Transfor mationen (26.1), bei denen sich die Zustände nach (26.5) |ψ ⟩ = U|ψ⟩ transformieren. Mit (26.12) folgt aus (26.15) für die transformierte Observable ̂ x)̂ . Ô (x)̂ = O(̂ x̂ ) ≡ O(U
(26.16)
4 Andere Definitionen (mit folglich anderen Eigenschaften) des transformierten Operators sind hier möglich. Dies ist jedoch die einzige Definition, mit der sich der Ortsoperator wie die Ortsvariable (26.1) transformiert, d. h. x̂ = U x,̂ was wegen ̂ ⟩ = x |x ⟩ x|x die Beziehung ̂ ⟩ = x̂ |x⟩ x|x impliziert.
126 | 26 Symmetrien
26.2 Symmetrietransformationen Oben haben wir beliebige Transformationen der Zustände (26.5) bzw. der Observablen (26.15) betrachtet. Unter solchen Transformationen bleibt der Hamilton-Operator ei nes physikalischen Systems i. A. nicht invariant. Je nach vorliegendem physikalischen System gibt es jedoch Transformationen, die den Hamilton-Operator und damit die physikalischen Eigenschaften des Systems invariant lassen. Solche Transformationen werden als Symmetrietransformationen bezeichnet. Wir wollen jetzt solche Symmetrietransformationen in der Quantenmechanik von allgemeinen Standpunkten aus untersuchen. Wir nehmen an, ein System sei in einem Zustand |ψ⟩ präpariert. Ein Operator U transformiere diesen Zustand in einen neuen Zustand (26.5) |ψ ⟩ = U|ψ⟩ . Wir betrachten jetzt einen zweiten Zustand |ϕ⟩ unter derselben Transformation U, die diesen Zustand in einen neuen Zustand |ϕ ⟩ = U|ϕ⟩ überführt. Ohne Beschränkung der Allgemeinheit können wir |ϕ⟩ als einen Eigen vektor einer Observablen Ô interpretieren. Dann gibt |⟨ϕ|ψ⟩|2 bekanntlich die Wahr scheinlichkeit an, dass bei einer Messung von Ô an einem System, das ursprünglich im Zustand |ψ⟩ präpariert wurde, dieses als Ergebnis der Messung in den neuen Eigen zustand |ϕ⟩ übergeht. Ist das betrachtete Quantensystem invariant unter der Trans formation U, so muss eine Messung das System mit gleicher Wahrscheinlichkeit aus dem Zustand |ψ⟩ in den Zustand |ϕ⟩ wie aus dem Zustand |ψ ⟩ in den Zustand |ϕ ⟩ überführen, d. h., das betrachtete System besitzt die Symmetrie U, falls |⟨ψ |ϕ ⟩|2 ≡ |⟨Uψ|Uϕ⟩|2 = |⟨ψ|ϕ⟩|2 gilt. Dazu muss (bis auf eine irrelevante Phase) eine der beiden Beziehungen ⟨ψ |ϕ ⟩ = ⟨ψ|ϕ⟩ ,
⟨ψ |ϕ ⟩ = ⟨ϕ|ψ⟩
erfüllt sein. Wegen ⟨ψ |ϕ ⟩ ≡ ⟨Uψ|Uϕ⟩ = ⟨ψ|U† U|ϕ⟩ muss im ersten Fall der Operator U unitär sein, während im zweiten Fall gelten muss: ⟨Uψ|Uϕ⟩ = ⟨ϕ|ψ⟩ , was den Operator U als einen antiunitären Operator qualifiziert. Antiunitäre Opera toren gehören zur Klasse der antilinearen Operatoren, die durch folgende Beziehung definiert sind: U (|ψ⟩ + |ϕ⟩) = U|ψ⟩ + U|ϕ⟩ , Uc|ψ⟩ = c ∗ U|ψ⟩ , wobei c eine komplexe Zahl ist. Damit ist das sogenannte Wigner’sche Theorem ge zeigt:
26.3 Kontinuierliche Symmetrietransformationen
| 127
Sämtliche Symmetrien der Quantenmechanik, d. h. Abbildungen U, welche die Zu stände |ψ⟩ und |ϕ⟩ in U|ψ⟩ und U|ϕ⟩ überführen und dabei das Betragsquadrat des Skalarprodukts invariant lassen, |⟨Uψ|Uϕ⟩|2 = |⟨ψ|ϕ⟩|2 , sind entweder unitär (und damit linear) oder antiunitär (und damit antilinear). Eine Transformation heißt kontinuierlich, wenn sie sich durch stetige Veränderung von Parametern auf die identische Transformation zurückführen lässt, die durch den Ein heitsoperator 1̂ definiert ist. Da kontinuierliche Symmetrietransformationen U somit die identische Transformation 1̂ enthalten, müssen sie durch unitäre Operatoren re präsentiert werden. Diskrete Symmetrien müssen hingegen nicht notwendigerweise unitär sein. Wir werden in Abschnitt 26.6 ein Beispiel für eine diskrete antiunitäre Symmetrie kennenlernen.
26.3 Kontinuierliche Symmetrietransformationen Kontinuierliche Symmetrietransformationen müssen sich durch kontinuierlich verän derliche Parameter charakterisieren lassen, die wir reell wählen können. (Komplexe Parameter können wir stets durch zwei reelle Parameter ausdrücken.) Wir betrachten zunächst eine kontinuierliche Transformation, die durch einen einzigen reellen Para meter α charakterisiert wird. Der zugehörige unitäre Operator U(α) lässt sich in der Form U(α) = e−iαG darstellen, wobei G ein hermitescher Operator ist. Offensichtlich gilt: U(α 1 ) U(α 2 ) = U(α 1 + α 2 ) ,
(26.17)
was U(α = 0) = 1̂ impliziert. Gleichung (26.17) definiert eine Abel’sche Gruppe mit Elementen U(α), wo bei G als Generator der Gruppe bezeichnet wird. Im allgemeinen Fall hängt die kontinuierliche Symmetrietransformation von mehreren reellen Parametern α k ab und die zugehörigen unitären Operatoren
U(α) = exp (−i∑ α k G k ) k
(26.18)
128 | 26 Symmetrien
sind gewöhnlich Elemente einer nicht-Abel’schen Gruppe, da die Generatoren G k i. A. nicht miteinander kommutieren. Für reelle α k sind die Generatoren G k hermitesch, damit U(α) unitär ist. Endliche kontinuierliche Symmetrietransformationen U(α) lassen sich durch wiederholte Anwendung von infinitesimalen Transformationen U(δα) erzeugen. Um die Konsequenzen von kontinuierlichen Symmetrietransformationen aufzuzeigen, genügt es folglich, infinitesimale Transformationen zu betrachten. Für infinitesimale δα k können wir den Exponenten in Gl. (26.18) in eine Taylor-Reihe entwickeln und diese nach der ersten Ordnung abbrechen: U(δα) = 1̂ − i ∑ δα k G k + ⋅ ⋅ ⋅ .
(26.19)
k
Ein quantenmechanisches System wird durch seinen Hamilton-Operator charakteri siert. Besitzt es eine kontinuierliche Symmetrie, so darf sich sein Hamilton-Operator unter der zugehörigen Symmetrietransformation U(α) nicht ändern. Dies impliziert nach (26.15): ! H ≡ U−1 (α)HU(α) = H . Für infinitesimale Transformationen U(δα) (26.19) erhalten wir mit U−1 (δα) = 1 + i ∑ δα k G k k
in erster Ordnung in δα k : U−1 (δα)HU(δα) = H + i ∑ δα k [G k , H] . k
Da die δα k unabhängig voneinander gewählt werden können, verlangt die Invarianz von H unter der Symmetrietransformation U(δα) [G k , H] = 0̂ . Nach der Heisenberg’schen Bewegungsgleichung (23.27) für Observablen,⁵ d G k = [G k , H] , dt folgt somit, dass die Generatoren der Symmetrie zeitlich erhalten sind: iℏ
d G k = 0̂ . dt Damit gelangen wir zu dem wichtigen Satz: Besitzt ein quantenmechanisches System eine kontinuierliche Symmetrie, so kommu tiert der Hamilton-Operator mit den zugehörigen Generatoren und die Generatoren sind folglich Erhaltungsgrößen.
5 Wir setzen natürlich voraus, dass die G k nicht explizit zeitabhängig sind.
26.4 Translation des Raums | 129
Dies ist die quantenmechanische Version des Noether-Theorems. In den Abschnit ten 26.4 und 26.5 werden wir Beispiele für kontinuierliche Symmetrietransforma tionen kennenlernen: Verschiebungen (Translationen) und Drehungen (Rotationen) im gewöhnlichen Ortsraum ℝ3 . Dabei werden wir die Impuls- bzw. Drehimpulsopera toren als die entsprechenden Generatoren identifizieren. Eine beliebige kontinuierliche euklidische Transformation im ℝ3 lässt sich in eine Translation und eine Rotation zerlegen. Es genügt deshalb, diese beiden Transforma tionen separat zu behandeln.
26.4 Translation des Raums Unter einer Translation des Raums U = T(a) verschieben sich die Koordinaten x i um einen konstanten Beitrag a i : x → x = x + a =: T(a)x .
(26.20)
Die zugehörige inverse Transformation lautet: x = T −1 (a)x = x − a . Den durch Gl. (26.7) definierten zugehörigen Translationsoperator U = T(a), T(a)ψ(x) = ψ(x − a) ,
(26.21)
haben wir bereits in Abschnitt 13.1 kennen gelernt: T(a) = e− ℏ a ⋅ p . i
(26.22)
Er ist offensichtlich unitär (und damit linear)⁶ T † (a) = T −1 (a) . Man überzeugt sich leicht, dass dieser Operator der Gl. (26.21) genügt: T(a)ψ(x) ≡ ⟨x|T(a)|ψ⟩ d3 p ⟨x|p⟩⟨p|T(a)|ψ⟩ (2πℏ)3 i i d3 p e ℏ p ⋅ x e− ℏ a ⋅ p ⟨p|ψ⟩ =∫ 3 (2πℏ) d3 p ⟨x − a|p⟩⟨p|ψ⟩ =∫ (2πℏ)3
=∫
= ⟨x − a|ψ⟩ ≡ ψ (x − a) . 6 Obwohl die Translation (26.20) keine lineare Transformation ist, T(a)(x + y) ≠ T(a)x + T(a)y, wird sie dennoch durch einen linearen Operator vermittelt.
130 | 26 Symmetrien Genauso leicht zeigt man, dass der Operator T(a) die Beziehung (26.11) erfüllt: ̂ = T(a)x̂ , T −1 (a)xT(a) wobei T(a) die in Gl. (26.20) definierte Translation der Koordinate ist. Zwei aufeinander folgende Translationen ergeben offensichtlich wieder eine Translation: T(a1 )T(a2 ) = T(a1 + a2 ) . (26.23) Damit bilden die Translationen eine Gruppe, die Translationsgruppe. Gleichung (26.23) ist das Multiplikationsgesetz dieser Gruppe, das auch von den dazugehöri gen Operatoren (26.22) T(a) erfüllt wird: T(a1 )T(a2 ) = T(a1 + a2 ) . Da das Ergebnis zweier Translationen unabhängig von der Reihenfolge ist, in der sie ausgeführt werden, T(a1 )T(a2 ) = T(a2 )T(a1 ) , ist die Translationsgruppe Abel’sch. Die Translationsoperatoren (26.22) liefern eine Darstellung der Translationsgruppe im Hilbert-Raum der Wellenfunktionen (Zustän de). Wegen des Abel’schen Charakters dieser Gruppe kommutieren die Operatoren zu verschiedenen Translationen: [T(a1 ), T(a2 )] = 0̂ . Vergleich von Gln. (26.22) und (26.18) !
U(α) = T(α) zeigt, dass die gewöhnlichen (linearen) Impulse die Generatoren der Translation sind Gk = pk .
26.5 Drehungen Bei einer (aktiven) Drehung ändert sich die Richtung eines Vektors, jedoch nicht seine Länge. Ferner bleiben bei einer Drehung die Winkel zwischen verschiedenen Vekto ren und damit auch ihr Skalarprodukt erhalten. Deshalb müssen Drehungen durch orthogonale Koordinatentransformationen x i → xi = R ij x j
(26.24)
gegeben sein. Bevor wir die orthogonale Drehmatrix R ij für eine beliebige Drehung im ℝ3 explizit bestimmen, wollen wir jedoch noch den Unterschied zwischen einer
26.5 Drehungen
e2
| 131
e2
e2̃ x
x2
x
x2
x
x2
ω
e 1̃
x2̃ x1
x1
(a)
x1̃
ω
e1
x1
e1
(b)
Abb. 26.2: (a) Aktive und (b) passive Drehung um einen Winkel ω um die 3-Achse.
aktiven und einer passiven Drehung illustrieren. Dazu betrachten wir eine Drehung in einer Ebene. In Abb. 26.2a,b sind die aktive und die passive Drehung jeweils um den Winkel ω um die 3-Achse gegenübergestellt. Bei der aktiven Drehung des Vektors x = x i e i in den Vektor x = xi e i transformieren sich die Koordinaten gemäß (
x1 cos ω )=( sin ω x2
x1 − sin ω )( ) , cos ω x2
x3 = x3 ,
(26.25)
während die passive Drehung der Koordinatenachsen, d. h. des Dreibeins [e i ] in das Dreibein [ẽı ] durch die inverse Matrix vermittelt wird (
cos ω e1̃ )=( e2̃ − sin ω
sin ω e1 )( ) , e2 cos ω
e3̃ = e3 .
(26.26)
Mittels der inversen Matrix transformieren sich auch die Koordinaten eines bei der passiven Drehung festgehaltenen Vektors x = x i e i = x̃ı ẽı : (
cos ω x1̃ )=( − sin ω x2̃
x1 sin ω )( ) , cos ω x2
x3̃ = x3 .
Man beachte, dass (26.26) im Gegensatz zu (26.25) ein System vektorieller Gleichungen ist. Ferner gilt offensichtlich x̃ı (ω) = xi (−ω) .
26.5.1 Der Drehoperator Eine Drehung im ℝ3 lässt sich durch einen Vektor ω charakterisieren. Dabei gibt seine Richtung ω̂ = ω/|ω| die Drehachse und seinen Betrag ω = |ω| den Drehwinkel an. Bei
132 | 26 Symmetrien
einer infinitesimalen Drehung δω ändern sich die Ortsvektoren wie (siehe Abb. 26.3): x → x = x + δω × x ≡ x + δx
(26.27)
oder in Komponentenschreibweise: !
xi = (δ ij + ε ikj δω k )x j ≡ R ij (δω)x j ,
(26.28)
wobei sich die letzte Identität aus der Definition der Drehmatrix (26.24) ergibt.
Abb. 26.3: Darstellung einer infinitesimalen Drehung mittels eines Vektors δω = δω ω,̂ dessen Betrag δω = |δω| den Drehwinkel (schattiert) und dessen Richtung ω̂ = δω/δω die Drehachse angibt.
Wir betrachten die Wellenfunktion in den gedrehten Koordinaten ψ(x ). Für infinite simale δx finden wir durch Taylor-Entwicklung: ψ(x ) = ψ(x + δx) = ψ(x) + δx⋅∇ψ(x) . Einsetzen der expliziten Form von δx (26.27) liefert ψ(x ) = [1̂ + (δω × x)⋅∇]ψ(x) = [1̂ + δω⋅(x × ∇)]ψ(x) und unter Benutzung der Definition des Drehimpulses L = x × ℏi ∇: i i ψ(x ) = (1̂ + δω⋅L) ψ(x) ≅ e ℏ δω⋅L ψ(x) , ℏ
(26.29)
wobei wir im letzten Schritt ausgenutzt haben, dass δω infinitesimal ist. Nach Gl. (26.7) gilt mit U = R und U = R: ψ(x ) ≡ ψ(Rx) = R−1 ψ(x) . Vergleich mit (26.29) liefert für den Operator infinitesimaler Drehungen: R(δω) = e− ℏ δω⋅L . i
26.5 Drehungen |
133
Endliche Drehungen ω = ω n̂ können wir durch wiederholte Ausführung von infinite simalen Drehungen δω = δω n̂ um dieselbe Drehachse n̂ erzeugen ̂ . R(Nδω) = (R(δω)) N = e− ℏ Nδω n⋅L i
Mit ω = Nδω, N → ∞ finden wir für den Operator der endlichen Drehungen: R(ω) = e− ℏ ω⋅L . i
(26.30)
Offensichtlich ist der Drehoperator unitär: R† (ω) = R−1 (ω) und es gilt R−1 (ω) = R(−ω) .
(26.31)
Der Vergleich von (26.30) mit (26.18) !
U(α) = R(α) zeigt, dass die Drehimpulsoperatoren die Generatoren der Rotation sind: Gk = Lk . In Kapitel 15 hatten wir bereits festgestellt, dass die Drehimpulsoperatoren aufgrund ihrer Vertauschungsrelationen die Generatoren der SU(2)-Gruppe bzw. deren Un tergruppe, der Drehgruppe SO(3) sind. Dementsprechend sind die Drehoperatoren (26.30) die Elemente der SU(2)-Gruppe und für ganzzahlige Drehimpulse auch der SO(3)-Gruppe. Die Matrixelemente des (inversen) Drehoperators⁷ D lmm (ω) = ⟨lm|R−1 (ω)|lm ⟩
(26.32)
in den Drehimpulseigenzuständen |lm⟩, die wir im Abschnitt 27.2 behandeln wer den, bilden die (2l + 1)-dimensionalen irreduziblen Darstellungen der SU(2)-Gruppe und für ganzzahlige l auch der Drehgruppe SO(3). Die Dlmm (ω) mit l = 1/2 bzw. l = 1 liefern die fundamentale Darstellung (nichttriviale, irreduzible Darstellung mi nimaler Dimension) der SU(2)- bzw. SO(3)-Gruppe. Die fundamentale Darstellung der SO(3)-Gruppe ist gleichzeitig die adjungierte Darstellung der SU(2)-Gruppe, siehe Anhang E.5. Die fundamentale Darstellung der SU(2)-Gruppe ist durch die (zweidimensionalen) Pauli-Matrizen σ k gegeben, welche die Spin-1/2-Realisierung L k = ℏ2 σ k der Drehimpulsalgebra (15.10) liefern (siehe Abschnitt 15.4). Wir erinnern daran, dass die Drehimpulsdifferenzialoperatoren L k = ( x̂ × p)k keine Darstellungen zu halbzahligen Drehimpulsen l = 1/2, 3/2, . . . besitzen. Jedoch bleibt die Form des Drehoperators (26.30) auch für halbzahlige Drehimpulse gültig.
7 Für die Behandlung des starren Körpers in Kapitel 27 erweist es sich als zweckmäßig, nicht die Ma trixelemente des Drehoperators R(ω) selbst, sondern die seines Inversen R−1 (ω) zu benutzen.
134 | 26 Symmetrien
26.5.2 Matrixdarstellung des Drehoperators Analog zur Vorgehensweise beim Drehoperator können wir auch die Drehmatrix R ij (ω) für endliche Drehungen ω aus ihrer infinitesimalen Form (26.28) R ij (δω) = δ ij + ε ikj δω k gewinnen. Nach Einführung der hermiteschen Matrizen (S l )km = iϵ klm
(26.33)
R(ω) = e−iω⋅S .
(26.34)
finden wir
Diese Matrix hat dieselbe Gestalt wie der unitäre Drehoperator R(ω) (26.30), jedoch ist in R(ω) der Drehimpulsoperator L durch die (3 × 3)-Matrix ℏS (26.33) ersetzt. Die Matrizen ℏS k (26.33) erfüllen die Drehimpulsalgebra [S k , S l ] = iϵ klm S m
(26.35)
und sind die (l = 1)-Darstellung der Drehimpulsoperatoren in der kartesischen Basis⁸. Dementsprechend ist R(ω) die (l = 1)-Darstellung des Drehoperators. Da die Matri zen iS k reell sind, ist die Drehmatrix R(ω) ebenfalls reell und somit nicht nur unitär sondern auch orthogonal: R† (ω) = R T (ω) = R−1 (ω) . Ferner gilt wie für den Drehoperator (26.31) R−1 (ω) = R(−ω) .
(26.36)
Man überzeugt sich leicht, dass die Matrix R(ω) (26.34) in der Tat eine Drehung um den Winkel ω um die Drehachse ω̂ beschreibt. Dies erkennt man sofort, wenn man Drehungen um die Koordinatenachsen betrachtet: Drehungen um die kartesischen Koordinatenachsen Im Folgenden berechnen wir explizit die Drehmatrizen für die Drehungen um die kartesischen Koordinatenachsen R i (ω) := R(ωe i ) .
(26.37)
Die Matrizen (26.33) lauten explizit 0 (S 1 )kl = i (0 0
0 0 1
0 0 , (S ) = i ) ( −1 0 2 kl 0 −1
0 0 0
1 0 , (S ) = i ) ( 0 1 3 kl 0 0
−1 0 0
0 0) . 0 (26.38)
8 In Abschnitt 15.4 hatten wir bereits die (l = 1)-Darstellung der Drehimpulsoperatoren in der Basis der Drehimpulseigenfunktionen ⟨l = 1, m|L k |l = 1, m ⟩ gefunden, siehe Gl. (15.46).
26.5 Drehungen |
135
Wir betrachten zunächst eine Drehung um die 3-Achse, ω k = δ k3 ω. Die Matrix S3 können wir darstellen als 0 σ2 (26.39) S3 = ( 0) , 0 0 0 wobei σ2 = (
−i ) 0
0 i
die zweite Pauli-Matrix ist. Dementsprechend haben wir für die durch (26.34) defi nierte Drehmatrix: σ2 [ R3 (ω) = e−iωS3 = exp [−iω ( 0 0 [
0 ] 0)] . 0 ]
(26.40)
Die Matrix S3 ist Block-diagonal. Für Block-diagonale Matrizen gilt exp (
A 0
exp A 0 )=( 0 B
0 ) , exp B
und zwar für beliebige, quadratische Matrizen A und B, wie man leicht durch Potenzreihenentwicklung der Exponenten zeigt. Deshalb erhalten wir für die Dreh matrix (26.40) 0 e−iωσ2 R3 (ω) = ( (26.41) 0) . 0 0 1 Wegen (σ 2 )2 = 𝟙 gilt
e−iωσ2 = 𝟙 cos ω − iσ 2 sin ω ,
wobei 𝟙 die zweidimensionale Einheitsmatrix ist. Mit dieser Beziehung finden wir für die Drehmatrix (26.41) die Darstellung cos ω R3 (ω) = ( sin ω 0
− sin ω cos ω 0
0 0) , 1
(26.42)
die in der Tat eine Drehung in der 1-2-Ebene um den Winkel ω beschreibt, siehe Gln. (26.24), (26.25). In analoger Weise berechnet man die Drehmatrizen für Drehungen um die beiden anderen Koordinatenachsen. Mit 0 S1 = (0 0 findet man
1 R1 (ω) = (0 0
0 σ2
0 cos ω sin ω
0 )
0 − sin ω ) . cos ω
136 | 26 Symmetrien
Analog erhält man R2 (ω) = (
cos ω 0 − sin ω
0 1 0
sin ω 0 ) . cos ω
(26.43)
Die drei Drehmatrizen R i (ω), i = 1, 2, 3, lassen sich durch Permutation der Spalten und Zeilen ineinander überführen. Die oben benutzte kartesische Basis (26.33) resultierte aus der Betrachtung des Dreh verhaltens des Ortsvektors und ist offenbar auf den Drehimpuls l = 1 beschränkt.⁹ Für Drehimpulse l ≠ 1 empfiehlt es sich, als Basis die Drehimpulseigenzustände (15.32) |lm⟩ zu benutzen, die auch als sphärische Basis bezeichnet werden. Zusammenhang zwischen sphärischer und kartesischer Basis: Abschließend geben wir noch den Zusammenhang zwischen den Elementen der Drehmatrix in kartesischen Koordinaten R kl (ω) (26.34) und der sphärischen Dar l=1 stellung Dmm (ω) (26.32) an: l=1 ∗ −1 Dmm (ω) = (e m ) k R kl (ω) (e m ) l .
Hierbei bezeichnet (e m )k die kartesischen Komponenten der sphärischen Basisvek toren e m im ℝ3 , die durch e m=±1 = ∓
1 (e x ± ie y ) , √2
e m=0 = e z
(26.44)
definiert sind. Sie besitzen die Symmetrie e∗m = (−1)m e−m und erfüllen die Orthonormalitätsbedingung e∗m ⋅e m = δ mm sowie die Vollständigkeitsrelation ∑ (e m ) k (e∗m ) l = δ kl .
(26.45)
m
9 Wir erinnern in diesem Zusammenhang daran, dass die Komponenten des Ortseinheitsvektors ̂ x(ϑ, φ) sich durch die Y1m (x) ausdrücken lassen. In der sphärischen Basis e m (26.44) gilt ̂ x(ϑ, φ) = √
4π ∑ Y1m (ϑ, φ)e∗m . 3 m
26.5 Drehungen
| 137
Aus (26.45) folgt die inverse Relation l=1 ∗ R−1 kl (ω) = (e m ) k D mm (ω) (e m )l .
Für eine Drehung um die 3-Achse, ω = ωe3 , erhalten wir wegen L ⋅ e3 = L3 und unter Benutzung von L3 |lm⟩ = ℏm|lm⟩ und ⟨lm|lm ⟩ = δ mm für die Drehmatrix in der sphärischen Basis (26.32): Dlmm (ω = ωe3 ) = δ mm e iωm .
26.5.3 Das Drehverhalten von Observablen: Skalare, Vektoren und Tensoren In Abschnitt 26.1 haben wir den allgemeinen Zusammenhang zwischen einer euklidi schen Koordinatentransformation U (26.1) und dem quantenmechanischen Operator U, der die zugehörige Transformation (26.5) der Zustände erzeugt, herausgearbeitet. Dieser Zusammenhang ist in der Beziehung (26.7) zusammengefasst. Für eine Dre hung (26.24) (26.46) xk = R kl (ω)x l lautet diese Beziehung R(ω)ψ(x) = ψ(R−1 (ω)x) ,
(26.47)
wobei R(ω) der zur Drehmatrix R(ω) (26.34) gehörige Drehoperator (26.30) ist. Tat sächlich haben wir oben aus dieser Beziehung den Drehoperator R bestimmt. In der bracket-Notation ⟨x|R(ω)|ψ⟩ = ⟨R −1 (ω)x|ψ⟩ , sieht man sehr leicht, dass diese Beziehung bereits aus der Unitarität des Drehoperators (26.30) und Gl. (26.8) folgt: ⟨x|R(ω)|ψ⟩ = ⟨ψ|R† (ω)|x⟩∗ = ⟨ψ|R−1 (ω)|x⟩∗ = ⟨ψ|R −1(ω)x⟩∗ = ⟨R −1 (ω)x|ψ⟩ . Ersetzen wir hier ω durch (−ω), so gehen wir zur inversen Drehung über (siehe Gln. (26.31), (26.36)) ⟨x|R−1 (ω)|ψ⟩ = ⟨R(ω)x|ψ⟩ .
(26.48)
Wir wollen jetzt untersuchen, wie sich die verschiedenen Observablen unter Drehun gen verhalten. Ausgangspunkt ist das Transformationsgesetz (26.11) des Ortsoperators für Drehungen U = R(ω), U = R(ω): R−1 (ω)x̂ k R(ω) = R kl (ω)x̂ l .
(26.49)
138 | 26 Symmetrien
Wir bilden das Quadrat dieser Gleichung und erhalten unter Berücksichtigung der Or thogonalität von R: R−1 (ω)x̂ 2 R(ω) = x̂ 2 . Dieses Ergebnis hatten wir natürlich erwartet, da die Länge eines Vektors invariant unter Drehungen ist. Allgemein bezeichnet man Observablen S,̂ die invariant unter Rotationen sind, ̂ R−1 (ω)SR(ω) = Ŝ ,
(26.50)
als skalare Observablen. Offensichtlich kommutieren skalare Größen mit dem Dreh operator [S,̂ R(ω)] = 0̂ . Betrachten wir infinitesimale Drehungen δω, für welche sich der Drehoperator (26.30) auf i R(δω) = 1̂ − δω⋅L (26.51) ℏ reduziert, so erhalten wir aus Gl. (26.50) unter Beachtung, dass die δω beliebig sein können: [L k , S]̂ = 0̂ . (26.52) Skalare Observablen kommutieren daher mit dem Drehimpulsoperator. Diese Glei chung kann auch als Definition einer skalaren Observablen benutzt werden. Skalare sind insbesondere das Quadrat des Ortsoperators x2 , des Impulsoperators p2 sowie des Drehimpulsoperators L2 . Aus Gl. (26.52) finden wir deshalb unmittelbar¹⁰: [L k , x2 ] = 0̂ ,
[L k , p2 ] = 0̂ ,
[L k , L2 ] = 0̂ .
Als Nächstes betrachten wir vektorielle Observablen V̂ i , i = 1, 2, 3, die sich per Defini tion unter Drehungen wie der Ortsoperator (26.49) transformieren: R−1 (ω)V̂ i R(ω) = R ij (ω)V̂ j .
(26.53)
Für infinitesimale Drehungen δω finden wir mit (26.51) und R kl (δω) = 1̂ − i(δω ⋅S)kl = 1̂ − iδω m iϵ kml aus (26.53) von den Termen linear in δω: [L k , V̂ l ] = iℏϵ klm V̂ m .
(26.54)
10 Wie bei L lassen wir auch bei x und p im Folgenden das Operatorsymbol „^“ weg, wenn klar ist, dass es sich um die Operatoren handelt.
26.5 Drehungen | 139
Wir betonen, dass die Beziehungen (26.53) und (26.54) völlig äquivalent sind. Aus (26.53) folgt nicht nur, wie oben gezeigt, für infinitesimale Drehungen die Beziehung (26.54), sondern aus (26.54) lässt sich auch sehr leicht (mit Hilfe von (C.17)) die Bezie hung (26.53) für endliche Drehungen beweisen. Als Beispiele betrachten wir den Ortsoperator x,̂ den Impulsoperator p und den Drehimpulsoperator L, für welche wir aus Gl. (26.54) unmittelbar [L k , x l ] = iℏϵ klm x m , [L k , p l ] = iℏϵ klm p m ,
(26.55)
[L k , L l ] = iℏϵ klm L m erhalten. Dies sind die bekannten Kommutationsbeziehungen dieser Observablen mit dem Drehimpulsoperator, siehe Gln. (15.10) bis (15.12). Setzen wir in Gl. (26.53) für V i den Impulsoperator p i bzw. den Drehimpulsopera tor L i ein, so erhalten wir die zu (26.49) analogen Beziehungen R−1 (ω)p i R(ω) = R ij (ω)p j , R−1 (ω)L i R(ω) = R ij (ω)L j .
(26.56)
Da die Matrizen ℏS k (26.33) bzw. R(ω) (26.34) die (l = 1)-Darstellung der Drehimpuls operatoren L k bzw. des Drehoperators R(ω) sind, gilt eine zu (26.56) analoge Bezie hung für diese Größen, R−1 (ω)S k R(ω) = R kl (ω)S l , (26.57) die sich sehr leicht verifizieren lässt: Mit dem expliziten Ausdruck (26.34) für R(ω) finden wir unter Verwendung von Gl. (C.17) ∞
R −1 (ω)S k R(ω) = ∑ n=0
(−i)n ⋅ S] , ⏟.⏟⏟.⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ . , ω ⋅ S⏟⏟] . [. . . [S k , ⏟⏟ω ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ n! n
Aus der Algebra der Spinmatrizen (26.35) folgt [S k , ω ⋅ S] = ω l iε klm S m = (ω ⋅ S)km S m . Wiederholte Anwendung dieser Beziehung führt auf ∞
R −1 (ω)S k R(ω) = ∑ n=0
(−i)n [(ω ⋅ S)n ]kl S l = R kl (ω)S l . n!
Eine Verallgemeinerung des Transformationsgesetzes (26.53) für Vektoren auf Objekte mit mehreren Indizes führt auf die Definition von Tensoren: Die Komponenten (Koor dinaten) eines Tensors n-ter Stufe T̂ i1 i2 ...i n transformieren sich unter Drehungen wie die Koordinaten des Ortsvektors: R−1 (ω)T̂ i1 i2 ...i n R(ω) = R i1 k1 (ω)R i2 k2 (ω) . . . R i n k n (ω)T̂ k1 k2 ...k n .
(26.58)
Da in der Ortsdarstellung x̂ k = x k , liefert der Vergleich von Gln. (26.46) und (26.49) für den transformierten Ortsoperator x̂ k = R−1 (ω)x̂ k R(ω) .
140 | 26 Symmetrien ̂ Für beliebige Observablen O(x), die vom Ort x abhängen, finden wir aus dem allgemei nen Transformationsgesetz (26.12) mit U = R(ω) die Observable am transformierten Ort x ̂ . (26.59) O(̂ x̂ ) = R−1 (ω)O(̂ x)R(ω) Hieraus erhalten wir mit Hilfe von Gln. (26.50), (26.53) und (26.58) die Transformati onsgesetze für skalare, vektorielle und tensorielle Observablen ̂ ) = S(x) ̂ S(x , V̂ k (x ) = R kl (ω)V̂ l (x) ,
(26.60)
T̂ k1 ...k n (x ) = R k1 l 1 (ω) . . . R k n l n (ω)T̂ l 1 ...l n (x) ,
welche die Observablen an den gedrehten Koordinaten x (26.46) durch die Observa blen an den ursprünglichen Koordinaten x ausdrücken. Wie die obigen Betrachtungen zeigen, folgen diese Relationen allein aus den Kommutationsbeziehungen (26.55). Nach unserer allgemeinen Definition (26.14) der transformierten Observablen (mit U = R)̂ (26.15) ̂ R(ω) ̂ Ô (x) = R−1 (ω)O(x) bei aktiven Transformationen (hier Drehungen) haben wir mit (26.59) ̂ ) , Ô (x) = O(x
(26.61)
in Übereinstimmung mit (26.16). Zur Illustration überprüfen wir die Relation (26.60) für den Drehimpulsoperator. Dazu drücken wir den Drehimpuls nach der Drehung L k (x ) =
∂ ℏ ε klm x l , i ∂x m
x k = R kl (ω)x l
durch die ursprünglichen Koordinaten x k = R −1 kl (ω)x l
aus. Mit
∂ ∂x l
=
∂ ∂ ∂x k ∂ = R −1 kl ∂x = R lk ∂x ∂x l ∂x k k k
erhalten wir L k (x ) =
∂ ℏ ε klm R lp (ω)R mq (ω)x p i ∂x q
= ℏ (R −1 (ω)S k R(ω))pq x p
∂ , ∂x q
wobei wir im letzten Schritt die Definition der Spinmatrizen S k (26.33) benutzt haben. Die Verwendung von (26.57) liefert schließlich das gewünschte Ergebnis L k (x ) = ℏR kl (ω)(S l )pq x p
∂ = R kl (ω)L l (x) . ∂x q
26.5 Drehungen |
141
26.5.4 Passive Drehung Für die spätere Behandlung des starren Körpers betrachten wir die Drehung eines kartesischen Koordinatensystems K, aufgespannt durch ein orthogonales Dreibein [e i , e2 , e3 ], in ein Koordinatensystem ̃ K mit orthogonalem Dreibein [e1̃ , e2̃ , e3̃ ]: Da bei werden wir K mit dem raumfesten Laborsystem identifizieren, während ̃ K fest mit dem starren Körper verbunden ist und folglich als körperfestes Bezugssystem bezeichnet wird. Bei einer Drehung des Dreibeins e i um den Winkel ω geht dieses in ẽı = R̃−1 ıj (ω)e j = e j R j̃ı (ω)
(26.62)
über, wobei die Elemente R j̃ı (ω) mit denen der Drehmatrix (26.34) (der aktiven Dre hung) übereinstimmen, R j̃ı (ω) = R ji (ω) , (26.63) und wir deren Orthogonalität benutzt haben. Der Index „̃ı“ besitzt denselben Wert wie der Index „i“. Die Tilde weist jedoch darauf hin, dass dieser Index sich auf die gedrehte Basis ẽı bezieht. Diese Unterscheidung ist notwendig, wenn eine Folge von passiven Drehungen betrachtet wird (wie wir dies im Kapitel 27 tun werden), damit nur Indizes, die sich auf dieselbe Basis beziehen, verknüpft werden. Wegen e i ⋅ e j = δ ij finden wir aus (26.62) R ĩȷ (ω) = e i ⋅ ẽȷ ,
(26.64)
woraus aufgrund der Vollständigkeit und Orthogonalität der Basisvektoren [e i ] und [ẽı ] bereits die Orthogonalität von R ĩȷ (ω) folgt. Mit (26.63) ergibt sich aus (26.64) folgender Zusammenhang zwischen den Kom ponenten der gedrehten Basisvektoren im Laborsystem (e ̃k )i = e i ⋅ e ̃k und denen der ursprünglichen Basisvektoren (e k )i = e i ⋅ e k = δ ik : (e ̃k )i = R ij (ω)(e k )j , was formal dem Transformationsgesetz (26.24) der Koordinaten des Vektors e k bei ei ner aktiven Drehung entspricht. Wir betonen jedoch, dass wir hier eine passive Dre hung (26.62) der Koordinatenachsen e k → e ̃k betrachten! Zwischen den Koordinaten eines Vektors x x = x i e i = x̃ı ẽı im Laborsystem K, [x i ], und denen im körperfesten System ̃ K, [x̃ı ], besteht der Zusam menhang x̃ı = R̃−1 ıj (ω)x j = x j R j̃ı (ω) .
(26.65)
142 | 26 Symmetrien
Im Gegensatz zur aktiven Drehung (26.24) transformieren sich die Koordinaten hier mit der inversen Drehmatrix R−1 (ω). Bei einer Drehung transformieren sich sämtliche Vektoren wie der Ortsvektor, sie he Abschnitt 26.5.3. Deshalb besteht zwischen den Koordinaten eines Vektors V im Laborsystem K Vi = ei ⋅ V und denen im körperfesten System ̃ K Ṽı = ẽı ⋅ V ebenfalls der Zusammenhang (26.65) Ṽı = R̃−1 ıj (ω)V j .
(26.66)
Mit der Identität (26.63) und dem allgemeinen Transformationsgesetz (26.53) vektori eller Größen unter Drehungen ergibt sich hieraus für vektorielle Observablen die Be ziehung Ṽı = R(ω)V i R−1 (ω) ,
(26.67)
wobei R(ω) wieder der zu R(ω) gehörige Drehoperator (26.30) ist. Für den Operator (26.30) einer Drehung um eine Koordinatenachse e ̃k , die durch die passive Drehung (26.62) aus der raumfesten Achse e k gewonnen wurde, i R̃k (φ) := R(φe ̃k ) = exp [− φL ̃k ] , ℏ
L ̃k = e ̃k ⋅ L
finden wir mit (26.67) i R̃k (φ) = exp [− φR(ω)L k R−1 (ω)] ℏ und nach Taylor-Entwicklung des Exponenten und Resummation der entstehenden Reihe R̃k (φ) = R(ω)Rk (φ)R−1 (ω) , (26.68) wobei Rk (φ) = R(φe k )
(26.69)
der Operator der Drehung um die raumfeste Achse e k ist. Gleichung (26.68) ist im Einklang mit dem Transformationsgesetz (26.67) für Vektorkomponenten, wenn wir R̃k (φ) als die transformierte Komponente der vektoriellen Größe Rk (φ) (26.69) inter pretieren.
26.5 Drehungen | 143
Für die Drehmatrizen (26.34) R ̃k (φ) = R(φe ̃k ) (als Drehimpuls-(l = 1)-Darstellung des Drehoperators) gilt eine zu (26.68) analoge Beziehung R ̃k (φ) = R(ω)R k (φ)R−1 (ω) , die sich explizit unter Benutzung von (26.57) beweisen lässt, wonach die gedrehten Komponenten (26.66) der Vektormatrix S S ̃k ≡ e ̃k ⋅ S = R−1 kl (ω)S l die Darstellung S ̃k = R(ω)S k R−1 (ω) besitzen. Transformation der Felder unter Drehungen Wir betrachten ein Vektorfeld V(x) = V i (x)e i . Um dieses Feld einer Drehung zu unterwerfen, heften wir die kartesischen Kompo nenten (bezüglich des raumfesten Laborsystems e i ) V i (x) an die Basisvektoren des ̃ i := ẽi gedrehten Bezugssystems e V (x ) := V i (x)ẽ i .
(26.70)
̃ i und des Laborsystems e i Zwischen den Basisvektoren der gedrehten Systeme e besteht der Zusammenhang (26.63) ̃e i = e j R ji (ω) .
(26.71)
Für die Komponenten des gedrehten Vektorfelds V (x ) (26.70) im Laborsystem V (x ) = V i (x )e i erhalten wir dann V i (x ) = R ij (ω)V j (x) .
(26.72)
Dies ist das Transformationsgesetz von Vektorfeldern unter Drehungen. Drehung eines Vektorfelds transformiert nicht nur das Gebiet, auf dem das Feld definiert ist, sondern dreht auch die Feldvektoren, siehe Abb. 26.4.
144 | 26 Symmetrien
Für das spezielle Vektorfeld V i (x) = x i erhalten wir aus (26.72) die Transformation der Koordinaten unter einer aktiven Drehung (26.24). Vektorfelder transformieren sich offenbar unter Drehungen wie der Ortsvektor. Ein skalares Feld S(x) lässt sich aus dem Skalarprodukt zweier Vektorfelder V(x) und W(x) gewinnen S(x) = V(x) ⋅ W(x) . Da die Drehmatrix R ij (ω) orthogonal ist, finden wir aus (26.72) das Transformati onsverhalten skalarer Felder: S (x ) = S(x) . Dasselbe Verhalten hatten wir für die Wellenfunktion (26.2) gefunden, die still schweigend als Skalar vorausgesetzt wurde. Die obigen Betrachtungen zum Vektorfeld lassen sich unmittelbar auf Tensorfel der T(x) = T i1 ...i N (x)e i1 ⊗ ⋅ ⋅ ⋅ ⊗ e i N verallgemeinern. Das gedrehte Tensorfeld ergibt sich wieder durch Ersetzen der Ba sisvektoren des Laborsystems e i durch die des gedrehten Bezugssystems T (x ) := T i1 ...i N (x)ẽ i1 ⊗ ⋅ ⋅ ⋅ ⊗ ẽ i N . Zerlegen wir das gedrehte Tensorfeld wieder entlang der ursprünglichen Basisvek toren e i T (x ) = T i1 ...i N (x )e i1 ⊗ ⋅ ⋅ ⋅ ⊗ e i N , so finden wir mit (26.71) T i1 ...i N (x ) = R i1 j1 (ω) . . . R i N j N (ω)T j1 ...j N (x) .
e2 e˜2 e˜1
e1 Abb. 26.4: Transformation eines Vektorfelds unter Drehungen.
26.5 Drehungen |
145
Das Transformationsgesetz (26.72) für Vektorfelder V i (x) ist konsistent mit dem in Abschnitt 26.5.3 gefundenen Transformationsgesetz (26.60) für vektorielle Observablen V̂ i (x) V̂ i (x ) = R ij (ω) V̂ j (x) ,
(26.73)
auch wenn dies auf den ersten Blick nicht offensichtlich ist. Um dies zu erkennen, betrachten wir zunächst das spezielle Vektorfeld V i (x) = x i , (26.74) das auch eine Observable ist, nämlich die Ortsdarstellung des Ortsoperators x̂ i . Aus (26.72) finden wir für das Vektorfeld (26.74) die Transformation der Koordinaten unter aktiven Drehungen (26.24) x i = R ij (ω)x j .
(26.75)
Dasselbe Transformationsgesetz erhalten wir aus (26.73) auch für die Ortsobservable V̂ i (x) = x̂ i = x i . Um den Unterschied zwischen Vektorfeldern und vektoriellen Observablen zu verdeutlichen, be trachten wir das Vektorfeld W i (x) = x i + a i (26.76) mit einem konstanten Vektor a i . Dieses Feld transformiert sich nach (26.72) unter Drehungen (26.75) in das Feld W i (x ) = x i + ai = R ij (ω)(x j + a j ) . (26.77) Eine naive Anwendung des Transformationsgesetzes für vektorielle Observablen (26.73) auf W i (x) = x i + a i würde hingegen liefern W i (x ) = x i + a i = R ij (ω)(x i + a i ) ,
(26.78)
im Widerspruch zu Gl. (26.77). (An der Stelle des transformierten Vektors ai in Gl. (26.77) steht in Gl. (26.78) der untransformierte Vektor a i .)¹¹ Jedoch ist die Anwendung von (26.73) auf das Vektorfeld W i (x) (26.76) nicht erlaubt, da W i (x) keine vektorielle Observable ist. Da [L k , a i ] = 0, genügt W i (x) nicht der Definitionsgleichung (26.54) von vektoriellen Observablen [L k , W l (x)] = iℏϵ klm x m ≠ iℏϵ klm W m (x) . Wir können jedoch das Vektorfeld W i (x) zu einer vektoriellen Observablen machen, indem wir es durch eine Translation des Ortsvektors x um den konstanten Vektor a erzeugen ̄x := T −1 (a)xT(a) = x + a = W (x) ,
(26.79)
wobei T(a) der Translationsoperator (26.22) ist. Bei der Translation transformieren sich sämtliche Vektoren wie der Ortsvektor. Dies gilt insbesondere für den Drehimpuls L → ̄L = T −1 (a)LT(a) = L + a × p .
(26.80)
Es ist leicht zu sehen, dass das Vektorfeld W (x) der Definitionsgleichung für vektorielle Observablen bezüglich des transformierten Drehimpulses ̄L genügt [̄L k , W l (x)] = iℏϵ klm W m (x) .
(26.81)
11 Die „Gleichung“ (26.78) ist bereits in sich widersprüchlich: Mit (26.75) würde aus ihr folgen a i = R ij (ω)a j , was nur für R ij (ω) = δ ij , d. h. ω = 0 erfüllbar ist.
146 | 26 Symmetrien
Dazu bemerken wir, dass die Beziehung [̄L k , ̄x l ] = iℏϵ klm ̄x m sich mit ̄x i = T −1 x i T und ̄L i = T −1 L i T unmittelbar aus [L k , x l ] = iℏϵ klm x m ergibt. Für die Observable ̄x i = W i (x) finden wir aus (26.73) in der Tat dasselbe Transformationsgesetz ̄x i ≡ x i + ai = R ij (ω)(x j + a j ) ≡ R ij (ω)̄x j wie für das Vektorfeld W(x) (26.77). Abschließend sei noch bemerkt: Mit der Transformation (26.80) des Drehimpulses transformiert sich natürlich auch der Drehoperator (26.30) i R(ω) → ̄ R(ω) = T −1 (a)R(ω)T(a) = exp (− ω ⋅ ̄L) . ℏ
26.5.5 Teilchen im rotierenden Bezugssystem: Die Coriolis-Wechselwirkung Aus der klassischen Mechanik ist bekannt, dass bei der Beschreibung einer Punkt masse in einem rotierenden Bezugssystem Trägheitskräfte auftreten. Diese sollten sich auch in einer quantenmechanischen Beschreibung zeigen. Um diese zu identifizieren, transformieren wir die Schrödinger-Gleichung iℏ∂ t |ψ(t)⟩ = H|ψ(t)⟩ in ein rotierendes Bezugssystem. Ein rotierendes Bezugssystem ̃ K ist über eine (zeitab hängige) passive Drehung R(ω(t)) mit dem Laborsystem K verknüpft. Da eine passive Drehung invers zur aktiven Drehung ist, folgt aus (26.5) mit U = R folgender Zusam ̃ und der im Labor menhang zwischen der Wellenfunktion im gedrehten System |ψ⟩ system |ψ⟩: ̃ . |ψ⟩ = R(ω(t))|ψ⟩ Einsetzen dieses Ausdrucks in die Schrödinger-Gleichung liefert nach elementaren Umformungen ̃ ̃ ̃ ψ(t)⟩ iℏ∂ t |ψ(t)⟩ = H| , wobei ̃ = R−1 (ω(t))HR(ω(t)) − iℏR−1 (ω(t))∂ t R(ω(t)) H
(26.82)
der Hamilton-Operator im rotierenden Bezugssystem ist, den wir in der nachfolgenden Box berechnen.
26.5 Drehungen | 147
Der Hamilton-Operator im rotierenden Bezugssystem Bei der Ableitung des Rotationsoperators (26.30) müssen wir beachten, dass die ̇ = (∂ t ω)⋅L und ω⋅L nicht miteinander kommutieren Operatoren ω⋅L ̇ [ω⋅L, ω ⋅L] = iℏ(ω̇ × ω)⋅L ,
(26.83)
falls ω̇ und ω nicht parallel stehen. Unter Benutzung der Beziehung (C.11) erhalten wir für beliebige ω(t): 1
̇ iℏ∂ t R(ω(t)) = ∫ dλ R1−λ (ω(t)) (ω(t)⋅L) Rλ (ω(t)) 0 1
= R(ω(t)) ∫ dλ R(−λω(t)) (ω̇ ⋅L) R(λω(t)) .
(26.84)
0
Unter Verwendung von Gl. (26.56) finden wir: R(−λω(t))(ω̇ ⋅L)R(λω(t)) = ω̇ k R−1 (λω(t))L k R(λω(t)) = ω̇ k R kl (λω(t))L l . (26.85) Mit der expliziten Form der Drehmatrix R kl (ω) (26.34) können wir das Integral über λ ausführen und erhalten: 1
1
∫ dλ R(λω) = ∫ dλ e−iλω⋅S = 0
𝟙 − e−iω⋅S 𝟙 − R(ω) = , iω⋅S iω⋅S
(26.86)
0
wobei wie üblich eine Matrix im Nenner ihr Inverses bedeutet.¹² Wir erinnern hier daran, dass Funktionen von Operatoren und Matrizen durch ihre Taylor-Reihen de finiert sind. Die Beziehung (26.86) lässt sich auch unmittelbar durch Taylor-Ent wicklung des Exponenten, Integration über λ und nachfolgender Aufsummation der entstehenden Reihe gewinnen. Mit (26.85) und (26.86) erhalten wir für die Zeitableitung des Drehoperators aus (26.84): 𝟙 − R(ω(t)) iℏ∂ t R(ω(t)) = R(ω(t))ω̇ k (t) ( ) Ll . iω(t)⋅S kl Einsetzen dieser Beziehung in (26.82) liefert für den Hamilton-Operator im rotie renden Bezugssystem: ̃ ≡ R−1 (ω(t))HR(ω(t)) − ω̇ k (t) ( 𝟙 − R(ω(t)) ) L l . (26.87) H iω(t)⋅S kl Setzen wir voraus, dass der Hamilton-Operator im Laborsystem invariant unter Dre hung ist, R−1 (ω(t))HR(ω(t)) = H , (26.88) was [L k , H] = 0 erfordert, so erhalten wir für den Hamilton-Operator im rotierenden Bezugssystem ̃ = H − ω̇ k ( 𝟙 − R(ω(t)) ) L l . H (26.89) iω(t)⋅S kl
12 Die Reihenfolge der Matrizen ist hier irrelevant, da [ω ⋅ S, R(ω)] = 0.
148 | 26 Symmetrien
Der zweite Term enthält offenbar die „Trägheitskräfte“, die im rotierenden Bezugs system auftreten. Dieser Term ist proportional zum Drehimpulsoperator und zur Winkelgeschwindigkeit ω.̇ Wir wollen jetzt den wichtigen Spezialfall einer Rotation mit konstanter Winkelge schwindigkeit ω̇ = Ω = const betrachten. Ohne Beschränkung der Allgemeinheit können wir den Anfangszeitpunkt so wählen, dass ω(t) = Ωt (26.90) gilt und damit der Drehwinkel ω und die Winkelgeschwindigkeit Ω parallel zueinan der sind. Da jetzt ̇ [ω⋅L, ω ⋅L] = 0̂ gilt (vgl. (26.83)), vereinfacht sich in diesem Fall die Zeitableitung des Rotationsope rators (26.84) zu iℏ∂ t R(Ωt) = (Ω⋅L)R(Ωt) = R(Ωt)(Ω ⋅L) . Setzen wir voraus, dass der Hamilton-Operator im Laborsystem H drehinvariant ist (26.88), so finden wir für den Hamilton-Operator im rotierenden Bezugssystem (26.82)¹³ ̃ = H − Ω⋅L . H
(26.91)
Der im rotierenden Bezugssystem auftretende Trägheitsterm ist jetzt durch die CoriolisWechselwirkung gegeben. Dieser Term tritt auch in der klassischen Hamilton-Funktion im rotierenden Bezugssystem auf, wobei natürlich der Drehimpulsoperator durch den klassischen Drehimpuls ersetzt ist. Der Coriolis-Term geht mit (gegenüber der Hamilton-Funktion) umgekehrtem Vorzeichen in die La grange-Funktion im rotierenden Bezugssystem ein. Man überzeugt sich leicht, dass der Zusatzterm LΩ = Ω ⋅ L
(26.92)
zur Lagrange-Funktion einer Punktmasse mit Drehimpuls L = mr × r ̇
13 Dasselbe Ergebnis (26.91) erhält man natürlich auch durch explizite Berechnung des Operators in der Klammer von Gl. (26.89) für ω(t) = Ωt (26.90) und unter Berücksichtigung der Antisymmetrie der Matrix (S k )lm (26.33), die Ω k (Ω ⋅ S)kl = 0 impliziert: Ωk (
𝟙 − R(Ωt) ) = Ωl . itΩ⋅S kl
26.5 Drehungen |
149
in der Euler-Lagrange-Gleichung eine Coriolis-Kraft hervorruft: Aus L Ω = mΩ ⋅ (r × r)̇ = m(Ω × r) ⋅ r ̇ = −mr ⋅ (Ω × r)̇ folgt ∂L Ω = mΩ × r , ∂ ṙ ∂L Ω = −mΩ × r ̇ ∂r und somit
∂L Ω d ∂L Ω − = −2mΩ × r ̇ − m Ω̇ × r . ∂r dt ∂ r ̇ Die beiden Terme auf der rechten Seite sind die Corioliskraft und der Drehrückstoß. Letzterer ver schwindet für eine konstante Winkelgeschwindigkeit Ω̇ = 0.
Zeitabhängige Drehungen: Die Winkelgeschwindigkeit Für spätere Anwendungen betrachten wir eine zeitabhängige aktive Drehung ω(t). Während einer infinitesimalen Zeit δt erfolgt eine Drehung um den Winkel δω = Ωδt , wobei ̇ Ω(t) = ω(t) = dω/dt die (instantane) Winkelgeschwindigkeit ist. Zwischen einem Vektor vor und nach dieser Drehung, x = x(t) und x = x(t + δt), besteht dann nach Gl. (26.27) der Zusammenhang x(t + δt) = x(t) + δω × x(t) = x(t) + Ω(t) × x(t)δt . Hieraus folgt für die zeitliche Ableitung x(t + δt) − x(t) δt δt→0
̇ = lim x(t)
eines mit der Winkelgeschwindigkeit Ω(t) rotierenden Vektors x(t) ̇ = Ω(t) × x(t) . x(t)
(26.93)
̇ Da x(t) ⊥ x(t), ändert sich die Länge des Vektors, |x(t)|, bei der Rotation nicht. Wegen d|x(t)|/dt = 0 gilt die Beziehung (26.93) auch für den zugehörigen Einheits ̂ = x(t)/|x(t)|: vektor x(t) ̇̂ = Ω(t) × x(t) ̂ . x(t) (26.94) Für Einheitsvektoren, x̂ ⋅ x̂ = 1, gilt x̂ ⋅ ẋ̂ = 0, was bereits die Beziehung (26.94) und somit die Definition einer Winkelgeschwindigkeit Ω(t) impliziert. In der Tat, ein Einheitsvektor x̂ definiert eine Richtung im Raum, die nur durch eine Drehung verändert werden kann. Gleichung (26.94) gilt deshalb ganz allgemein für beliebige zeitliche Änderungen von Einheitsvektoren. Dies bedeutet:
150 | 26 Symmetrien
̂ im ℝ3 definiert über Gl. (26.94) eine zeitab Jeder zeitabhängige Einheitsvektor x(t) hängige Drehung mit der Winkelgeschwindigkeit¹⁴ Ω = x̂ × ẋ̂ .
(26.95)
Dies ist formal der klassische Drehimpuls einer „Punktmasse“ m = 1 mit „Ortsvek ̂ tor“ x(t).
26.6 Diskrete Symmetrien In Abschnitt 26.2 hatten wir festgestellt, dass Symmetrien entweder durch unitäre oder durch antiunitäre Operatoren vermittelt werden, wobei kontinuierliche Symmetrien stets durch unitäre Operatoren realisiert sind, die sich mittels Erzeuger infinitesima ler Transformationen darstellen lassen. Wie die kontinuierlichen Symmetrien führen auch diskrete Symmetrien auf Erhaltungsgrößen. Diskrete Symmetrien lassen sich je doch nicht durch infinitesimale Transformationen erzeugen. Nachfolgend werden wir die wichtigsten Beispiele für diskrete Symmetrien behandeln: Raumspiegelung und Zeitumkehr. Dabei werden wir feststellen, dass sich die Raumspiegelung durch einen unitären Operator realisieren lässt, während die Zeitumkehr durch einen antiunitären Operator realisiert werden muss.
26.6.1 Raumspiegelung Unter Raumspiegelung (bezüglich des Koordinatenursprungs) x → −x ändern polare Vektoren wie der Impuls ihr Vorzeichen, p → −p , während axiale Vektoren wie der Drehimpuls L = x × p (die sich als Kreuzprodukt zweier polarer Vektoren darstellen lassen) invariant bleiben: L→L. 14 Vektorielle Multiplikation von (26.94) mit x̂ liefert x̂ × ẋ̂ = Ω − x̂ ( x̂ ⋅ Ω) , woraus (26.95) folgt.
26.6 Diskrete Symmetrien | 151
Dasselbe gilt für den Spin. Wir hatten bereits in Abschnitt 8.4 den Operator der Raum spiegelung in einer Dimension kennen gelernt. Auch in drei Raumdimensionen wird er als Paritätsoperator U = Π̂ bezeichnet. In der Ortsdarstellung ist er durch ̂ Πψ(x) = ψ(−x)
(26.96)
definiert. Im Kontext der allgemeinen Koordinatentransformation (26.1) finden wir für die Raumspiegelung x → x = −x = Ux die Transformationsmatrix der Koordinaten U = −𝟙 , wobei 𝟙 die dreidimensionale Einheitsmatrix ist. Mit U = Π̂ finden wir dann aus dem allgemeinen Transformationsgesetz (26.7) der Wellenfunktion gerade die Gleichung (26.96). Ferner erhalten wir aus Gl. (26.11) Π̂ −1 x̂ Π̂ = −x̂ . Dieses Gesetz gilt offenbar für alle polare Vektoren und damit insbesondere für den Impuls Π̂ −1 p Π̂ = −p , während für die axialen Vektoren wie Drehimpuls und Spin Π̂ −1 LΠ = L ,
Π̂ −1 S Π̂ = S
gilt. Somit kommutieren letztere mit dem Paritätsoperator. Da zwei aufeinander fol gende Raumspiegelungen wieder den ursprünglichen Vektor liefern, gilt offenbar: Π̂ 2 = 1̂ .
(26.97)
Die Eigenwerte des Raumspiegelungsoperators Π̂ sind deshalb ±1 und werden als Pa rität bezeichnet. Π̂ kann unitär gewählt werden und ist dann wegen (26.97) sogar her mitesch: Π̂ † = Π̂ = Π̂ −1 .
26.6.2 Zeitumkehr Wir setzen voraus, dass keine äußeren zeitabhängigen Felder vorliegen, sodass der Hamilton-Operator H zeitunabhängig ist. Dann ist die Zeitabhängigkeit der Wellen funktion durch i |ψ(t)⟩ = e− ℏ Ht |ψ(0)⟩ ≡ U t |ψ(0)⟩
152 | 26 Symmetrien gegeben, wobei U t ≡ U(t, 0) der Zeitentwicklungsoperator (23.13) ist. Bekanntlich ist K(t) = ⟨ψ(0)|ψ(t)⟩ = ⟨ψ(0)|U t |ψ(0)⟩
(26.98)
die Wahrscheinlichkeitsamplitude dafür, dass ein System, welches zur Zeit t = 0 im Zustand |ψ(0)⟩ präpariert wird, sich nach Verstreichen der Zeit t noch im selben Zu stand |ψ(0)⟩ befindet. Bilden wir das komplex Konjugierte von Gl. (26.98) und benut zen U t† = U−t , so finden wir K ∗ (t) = ⟨ψ(0)|U−t |ψ(0)⟩ = ⟨ψ(0)|ψ(−t)⟩ = K(−t) . Offensichtlich ist die komplexe Konjugation äquivalent zur Zeitumkehr t → −t . Bezeichnen wir mit U T den Operator der Zeitumkehr, der durch U T |ψ(t)⟩ = |ψ(−t)⟩ definiert ist, so genügt er wegen ⟨ψ(0)|ψ(t)⟩∗ = ⟨ψ(0)|ψ(−t)⟩ der Beziehung ⟨ψ(0)|U T |ψ(t)⟩ = ⟨ψ(0)|ψ(t)⟩∗ und besitzt folglich die Eigenschaft U T c|ψ(t)⟩ = c∗ U T |ψ(t)⟩ ,
(26.99)
wobei c eine komplexe Zahl ist. Damit ist U T antilinear und folglich antiunitär. Aus (26.99) folgt für den reellen Ortsvektor U T x̂ = x̂ U T . Für den Impulsoperator p = von U T auf pψ(x, t)
ℏ i∇
(26.100)
finden wir hingegen aus (26.99) durch Anwendung
ℏ ℏ U T pψ(x, t) = U T ( ∇ψ(x, t)) = − ∇U T ψ(x, t) = −p U T ψ(x, t) , i i und, da der Zustand ψ(x, t) beliebig war, U T p = −p U T .
(26.101)
Aus Gl. (26.100) und (26.101) folgt eine analoge Beziehung für den Drehimpuls L = x̂ × p: U T L = −L U T .
26.7 Innere Symmetrien | 153
26.7 Innere Symmetrien* Bisher haben wir nur Symmetrietransformationen betrachtet, die auf die Raum-ZeitKoordinaten der Teilchen wirken, ihre Wesensart jedoch unverändert lassen. Die Inva rianz unter solchen Transformationen wird als äußere Symmetrie bezeichnet. Darüber hinaus gibt es eine wichtige Klasse von Symmetrietransformationen, die nur die We sensart bzw. Erscheinungsform der Teilchen betreffen, aber ihre Raum-Zeit-Koordina ten unberührt lassen. Die Invarianz unter solchen Transformationen wird als innere Symmetrie bezeichnet. Die historisch zuerst entdeckte innere Symmetrie der Elementarteilchen war die Isospinsymmetrie der starken Wechselwirkung: Obwohl Proton p und Neutron n unter schiedliche elektrische Ladung Q tragen (Q p = e, Q n = 0), besitzen sie dieselbe starke Wechselwirkung, was als Ladungsunabhängigkeit bzw. Ladungssymmetrie der star ken Wechselwirkung bezeichnet wird. Darüber hinaus besitzen Protonen und Neutro nen annähernd dieselbe Masse (m p c2 = 938,272 MeV, m n c2 = 939,565 MeV). Dies suggeriert, Proton p und Neutron n zum Nukleondublett zusammenzufassen¹⁵: p N=( ) . n
(26.102)
Die kleine Massendifferenz lässt sich als elektromagnetische Korrektur interpretieren. Da die starke Wechselwirkung nicht nur zwischen zwei Protonen dieselbe wie zwi schen zwei Neutronen ist, sondern auch dieselbe Kraft zwischen Proton und Neutron wirkt, kann man erwarten, dass die starke Wechselwirkung auch invariant bezüglich Transformationen ist, die Proton und Neutron ineinander umwandeln p p ( )→U( ) , n n
(26.103)
wobei U zunächst eine beliebige komplexe (2 × 2)-Matrix ist. Da die Norm der Zustän de bei dieser Transformation erhalten bleiben muss, ist U eine unitäre Matrix, was in Übereinstimmung mit unseren allgemeinen Erkenntnissen über kontinuierliche Sym metrietransformationen aus Abschnitt 26.3 ist. Da die globale Phase eines Zustands irrelevant ist, kann U auf unitäre Matrizen mit det U = 1 eingeschränkt werden. Die unitären (2 × 2)-Matrizen U mit det U = 1 bilden bekanntlich die Gruppe SU(2), sie he Anhang E. Diese Gruppe war uns bereits bei der Behandlung des Spins begegnet. In Analogie zu den (Pauli-)Spinoren wird die zweikomponentige Nukleonwellenfunk
* Dieser Abschnitt ist für das Verständnis der übrigen Abschnitte nicht erforderlich und kann deshalb beim ersten Lesen übersprungen werden. 15 Hier stehen p und n für die Proton- und Neutronwellenfunktionen. Da Proton und Neutron Spin 1/2 besitzen, sind diese Wellenfunktionen Dirac-Spinoren, siehe Kapitel 28, die generisch komplex sind.
154 | 26 Symmetrien
tion (26.102) als Isospinor und die Symmetrie bezüglich der Transformation (26.103) als Isospinsymmetrie bezeichnet.¹⁶ Die Ladungssymmetrie der starken Wechselwirkung wird auch bei den später ent deckten Hadronen¹⁷ beobachtet. So existiert das leichteste Hadron, das Pion, in drei Ladungszuständen π+ , π0 , π− , die sich bezüglich der starken Wechselwirkung nicht unterscheiden und darüber hinaus auch annähernd dieselbe Masse besitzen. Defi niert man 1 π± = (π1 ± iπ2 ) , π0 = π3 , √2 so lassen sich die drei Pionen zu dem Isospintriplett π1 π = (π2 ) π3
(26.104)
zusammenfassen. Die Isospinsymmetrie der starken Wechselwirkung verlangt für die Pionen die Invarianz unter der Transformation ̂ , π → Uπ wobei Û jetzt die dreidimensionale (adjungierte) Darstellung der SU(2)-Isospingruppe ist. Wie im Abschnitt 26.3 erläutert, lassen sich die kontinuierlichen (und damit unitären) Symmetrietransformationen durch Generatoren erzeugen, die wir für die SU(2)-Isospingruppe mit I a=1,2,3 bezeichnen. Die Erzeuger der SU(2)-Gruppe erfül len bekanntlich dieselben Kommutationsbeziehungen wie die Drehimpulsoperatoren L k /ℏ, d. h. [I a , I b ] = iϵ abc I c . (26.105) Hieraus folgt, dass die I a mit dem Quadrat des Isospinoperators I = I a e a 3
I 2 = ∑ I 2a a=1
16 Der Name Isospin entstand historisch als Abkürzung von Isobarenspin, der sich aus dem griechi schen Wort isobar = „gleich schwer“ ableitet: Aufgrund der Ladungssymmetrie der starken Wechsel wirkung besitzen die Atomkerne mit gleicher Nukleonenzahl, aber unterschiedlicher Neutronen- bzw. Protonenzahl, (annähernd) die gleiche Masse und werden deshalb als Isobaren bezeichnet. Sie lassen sich zu Multipletts zusammenfassen, die durch ihren Isobarenspin bzw. Isospin klassifiziert werden können. 17 Unter Hadronen verstehen wir die starkwechselwirkenden Elementarteilchen. Sie werden unter teilt in Baryonen, die aus drei Quarks aufgebaut sind, und Mesonen, die aus einem Quark und einem Antiquark bestehen. Da die Quarks den Spin 1/2 besitzen, folgt aus der Drehimpulskopplung, dass Mesonen einen ganzzahligen und Baryonen einen halbzahligen Spin haben. Allgemein bezeichnet man Teilchen mit ganzzahligem bzw. halbzahligem Spin als Bosonen bzw. Fermionen, siehe Kapitel 30.
26.7 Innere Symmetrien
| 155
kommutieren, [I a , I 2 ] = 0. Die Isospineigenzustände lassen sich folglich nach den Ei genwerten von I 2 und einer Komponente, z. B. I3 , klassifizieren. Wie im Abschnitt 15.2 für die Drehimpulse gezeigt wurde, folgt aus den Kommutationsbeziehungen (26.105) bereits die Form der Eigenwerte I2 :
I(I + 1) ,
I3 :
M = −I, −I + 1, . . . , I ,
I = 0, 12 , 1, . . . ,
wobei die Quantenzahl I als Isospin bezeichnet wird. Analog zum Drehimpuls treten deshalb die Zustände mit gutem Gesamtisospin I in Multipletts von (2I +1)-Zuständen |IM⟩ auf, die sich in der Projektion M des Isospins unterscheiden. Das Nukleon (26.102) trägt offenbar den Isospin I = 12 (wobei M = 12 zum Proton und M = − 12 zum Neutron gehört), während das Pion (26.104) den Isospin I = 1 besitzt. Mit wachsenden Beschleunigerenergien wurden immer neue Elementarteilchen entdeckt, wobei sich herausstellte, dass diese aus elementareren Bausteinen, den Quarks¹⁸, aufgebaut sind. Es zeigte sich ebenfalls, dass die Isospingruppe nur ei ne Untergruppe der größeren Flavour-Symmetriegruppe ist, unter der die starke Wechselwirkung invariant ist. Die Quarks treten in sechs verschiedenen FlavourZuständen auf (up (u), down (d), strange (s), charm (c), bottom (b) und top (t)), die sich jedoch sehr erheblich in ihrer Masse unterscheiden, siehe Tab. 26.1. Ob wohl die starke Wechselwirkung invariant unter der gesamten Flavour-Gruppe SU(6) ist, lässt sich diese Symmetriegruppe aufgrund der großen Massenunterschiede der Quarks nur für die drei leichten Flavours u, d, s vorteilhaft ausnutzen, was auf die SU(3)-Flavour-Symmetrie führt. Gemäß dieser Symmetrie lassen sich die Hadronen, die aus den u-, d- und s-Quarks aufgebaut sind, durch Darstellungen der SU(3)-Flavour-Gruppe klassifizieren, was diese Hadronen in Multipletts gruppiert. Abbildung 26.5 zeigt exemplarisch das Oktett der pseudoskalaren Mesonen. (Dies sind die leichtesten Mesonen; sie sind spinlos und besitzen eine negative (Eigen-) Parität.) In diesen Multipletts gibt die horizontale Achse die Isospinprojektion I3 und die vertikale Achse die Hyperladung Y an, die über die Beziehung Q = I3 +
1 Y 2
(bei gegebener Isospinkomponente I3 ) durch die Ladung Q der Hadronen festgelegt ist.
18 Dieser Name geht auf Gell-Mann zurück, der die Quarks ursprünglich als fiktive Bausteine ein führte, um den „Zoo“ der Elementarteilchen systematisch zu ordnen. Da er sie nicht für reale Teilchen hielt, suchte er nach einem Namen ohne offensichtliche Bedeutung und wählte Quarks nach einem Gedicht aus „Finnegans Wake“ von James Joyce. Joyce selbst hatte das Wort auf einem Bauernmarkt bei der Durchreise in Freiburg i.B. gehört, als Marktfrauen ihre Milchprodukte anboten.
156 | 26 Symmetrien
Y K0
K+
-1
-1/2
K-
1/2
1
I3
K0
Abb. 26.5: Oktett der pseudoskalaren Mesonen.
26.8 Eichsymmetrien* Bei den obigen Betrachtungen haben wir die Transformationsmatrix U der Isospin multipletts als von Raum und Zeit unabhängig angenommen, d. h., an jedem RaumZeit-Punkt wird dieselbe Symmetrietransformation durchgeführt. Solche inneren Symmetrien werden als globale Symmetrien bezeichnet. Raum-Zeit-abhängige Sym metrietransformationen U(x, t) hingegen lassen die Schrödinger-Gleichung aufgrund der darin enthaltenen Ableitungsoperatoren zunächst nicht invariant. Die Invari anz unter solchen Transformationen lässt sich jedoch herstellen, wenn man zusätz lich Eichfelder einführt, die durch ihr nichttriviales Transformationsverhalten die durch die Differenzialoperatoren hervorgerufenen Änderungen in der SchrödingerGleichung kompensieren. Dies führt auf die Eichtheorien, die invariant unter den Raum-Zeit-abhängigen Eichtransformationen sind. Solch eine lokale Eichsymmetrie haben wir bereits im Zusammenhang mit der elektromagnetischen Wechselwirkung in Kapitel 22 kennengelernt. Die Schrödinger-Gleichung der Elektronen in einem elektromagnetischen Feld ist invariant unter der gleichzeitigen Eichtransformati on von Elektronenwellenfunktion und elektromagnetischem Feld. Den Eichtheorien liegt also immer eine bestimmte lokale Symmetrie, die Eichsymmetrie, zugrunde. Die zugehörigen Eichtransformationen lassen sämtliche physikalischen Eigenschaften invariant und bilden eine Gruppe. Für die Elektrodynamik ist dies die Gruppe U(1) der Phasentransformationen der Elektronenwellenfunktion. Allgemein wechselwir ken in den Eichtheorien Materieteilchen, die gewöhnlich Fermionen (d. h. Teilchen mit halbzahligem Spin sind, siehe Abschnitt 30.6) durch den Austausch von Eich
* Dieser Abschnitt ist für das Verständnis der übrigen Abschnitte nicht erforderlich und kann deshalb beim ersten Lesen übersprungen werden.
26.8 Eichsymmetrien |
157
bosonen, den Quanten des Eichfelds, die ganzzahligen Spin besitzen. Dies ist analog zur (Quanten-)Elektrodynamik, in der die Elektronen durch ihre Kopplung an das elektromagnetische Feld bzw. durch den Austausch seiner Quanten, den Photonen, wechselwirken. Nach unserem heutigen Erkenntnisstand lassen sich alle fundamentalen Kräfte der Natur durch Eichtheorien beschreiben. Die Eichtheorien der elektromagnetischen, schwachen und starken Wechselwirkung bilden das sogenannte Standardmodell der Elementarteilchen. (Die Gravitation¹⁹ ist hier ausgeschlossen.) Die Materieteilchen des Standardmodells sind sämtlich Fermionen mit Spin 1/2 und werden in Quarks und Leptonen unterteilt. Zu den Leptonen gehören die Elektronen (e), Myonen (μ) und die Taus (τ), sowie deren Neutrinos (ν e , ν μ , ν τ ). Während die Leptonen nur elektroma gnetische und schwache Wechselwirkung besitzen, unterliegen die Quarks darüber hinaus auch der starken Wechselwirkung. Leptonen und Quarks lassen sich gemäß ihrer (elektro-)schwachen Wechselwirkung in jeweils drei Familien gruppieren, siehe Tab. 26.1. Ähnlich wie Proton und Neutron (26.102) bilden die beiden Teilchen einer Familie ein Isospindublett, z. B. (u, d). Tab. 26.1: Fermionen des Standardmodells der Elementarteilchen. Die Zahlen unter den Symbolen geben die Teilchenmassen (genauer die Ruheenergien mc 2 ) in GeV an. Elek. Ladung
Spin = 1/2
Familie
+2/3
u
c
t
0,002
1,3
175
−1/3
d
s
b
0,005
0,1
4,2
0 −1
νe
10−9
νμ
Quarks
ντ
0) der Trajektorien des Minkowski-Raums.³ In der Tat, führen wir die Umparametrisierung τ → τ(σ) durch und bezeichnen ̃x (σ) = x(τ(σ)), so erhalten wir wegen d ̃x μ (σ) dx μ (τ) dτ dτ = = ẋ μ (τ) , x̃̇ μ (σ) = dσ dτ dσ dσ
dτ =
dτ dσ dσ
für die Wirkung: S [x μ (τ)] = −mc ∫dτ √ẋ 2 (τ) = −mc ∫dσ
dτ 1 √ ̇ 2 ̃x (σ) . dσ dτ dσ
Unter der Bedingung dτ/dσ > 0 hat die Wirkung in der neuen Parametrisierung der Trajektorie ̃x μ (σ) exakt dieselbe Gestalt wie in der ursprünglichen Parametrisierung x μ (τ): S [x μ (τ)] = −mc ∫dσ √̃ẋ 2 (σ) = S [ ̃x μ (σ)] .
3 Die Reparametrisierungsinvarianz entspricht der Eichinvarianz der Elektrodynamik. Deshalb wer den wir eine Umparametrisierung der Trajektorien auch als Eichtransformation bezeichnen. Genau wie in der Elektrodynamik können wir die „Eichinvarianz“ ausnutzen, um die Wirkung in eine mög lichst einfache Form zu bringen. Ebenfalls kann die Reparametrisierungsinvarianz durch Eichfixie rung beseitigt werden.
28.3 Elektromagnetische Felder | 201
28.3 Elektromagnetische Felder Da wir im weiteren Verlauf dieses Kapitels auch relativistische Ladungen in elektro magnetischen Feldern untersuchen werden, empfiehlt es sich vorab, die wesentlichen Grundlagen der Elektrodynamik zu rekapitulieren. Die Grundgleichungen der Elektrodynamik sind bekanntlich die Maxwell-Glei chungen⁴ ∇⋅E = ρ,
∇×B =
1 1 j + ∂t E c c
(28.9)
∇⋅B =0,
∇×E+
1 ∂t B = 0 , c
(28.10)
wobei E das elektrische und B das magnetische Feld ist. Ferner ist ρ die Ladungsdichte und j die Stromdichte, welche die Felder erzeugen. Die Potenzialansätze B =∇×A,
E = −∇Φ −
1 ∂t A c
(28.11)
lösen die letzten beiden Maxwell-Gleichungen (28.10). Die Maxwell-Gleichungen respektieren bereits die relativistische Invarianz, d. h. die Konstanz der Lichtgeschwindigkeit in allen Inertialsystemen. Sie sind relativis tisch kovariant, d. h., sie behalten ihre Form unter Lorentz-Transformationen bei, obgleich sich dabei E- und B-Felder ineinander umwandeln. Dass E- und B-Felder unter Lorentz-Transformationen ihre Identität nicht beibehalten können, ist völlig offensichtlich, da z. B. eine im Laborsystem ruhende Ladung in einem dazu bewegten Bezugssystem als Strom erscheint. Die relativistische Kovarianz der Maxwell-Glei chungen wird in der kompakten Vierer-Notation manifest, die auch eine wesentlich elegantere Formulierung der Elektrodynamik gestattet: Das skalare Potenzial Φ und das Vektorpotenzial A(x) lassen sich zu einem Vie rer-Potenzial A μ ≡ {A0 , A} = {Φ, A} zusammenfassen. In analoger Weise bilden die Ladungsdichte ρ und die Stromdichte j den Vierer-Strom j μ ≡ {j0 , j} = {cρ, j} . (28.12)
4 Wir erinnern daran, dass wir in diesem Buch durchgehend das Heaviside-Lorentz-Maßsystem ver wenden, in welchem die Faktoren 4π sowie die Dielektrizitätskonstante des Vakuums, ε 0 , aus den Maxwell-Gleichungen eliminiert sind. Die dimensionslose Feinstrukturkonstante ist α = e 2 /(4πℏc) ≃ 1/137 und das Coulomb’sche Gesetz lautet |F 12 | = q 1 q 2 /(4π|x 1 − x 2 |2 ). In Kapitel 22 (Band 1) ha ben wir zusätzlich c = 1 gesetzt. Da wir im vorliegenden Kapitel auch den Übergang von der relati vistischen zur nichtrelativistischen Beschreibung vollziehen, behalten wir die Lichtgeschwindigkeit explizit in den Gleichungen.
202 | 28 Relativistische Quantenmechanik
Die Potenzialansätze (28.11) werden dann durch den Feldstärketensor F μν = ∂ μ A ν − ∂ ν A μ
(28.13)
erfasst, der das elektrische und magnetische Feld vereinigt
F μν = (
0
−E1
−E2
−E3
E1
0
−B3
B2
E2
B3
0
−B1
E3
−B2
B1
0
) .
(28.14)
Es gelten offensichtlich die Beziehungen F i0 = E i ,
F ij = −ϵ ijk B k .
Der Feldstärketensor ist invariant unter den Eichtransformationen A μ (x) → A μ (x) + ∂ μ Λ(x) ,
(28.15)
wobei Λ(x) eine beliebige differenzierbare Funktion von Raum und Zeit ist. Dies folgt aus (∂ μ ∂ ν − ∂ ν ∂ μ )Λ(x) = 0 . Aufgrund seiner Eichabhängigkeit wird A μ (x) auch als Eichpotenzial oder Eichfeld be zeichnet. Weiterhin genügt der Feldstärketensor (28.13) der Bianchi-Identität ̃ μν = 0 , ∂μ F
(28.16)
wobei
̃ μν = 1 ϵ μνκλ F κλ = ϵ μνκλ ∂ κ A λ F 2 der duale Feldstärketensor ist. Dieser ergibt sich aus F μν (28.14) durch die Ersetzung E→B,
B → −E .
Die Bianchi-Identität (28.16) ist äquivalent zu den beiden homogenen Maxwell-Glei chungen (28.10). Die beiden inhomogenen Maxwell-Gleichungen (28.9) lauten in der kovarianten Formulierung 1 (28.17) ∂ μ F μν = j ν . c Die Maxwell-Gleichungen (28.16) und (28.17) sind offenbar relativistisch forminvari ant, sofern sich unter Lorentz-Transformationen (28.3) x μ → xμ = Λ μ ν x ν A μ und j μ wie Vierer-Vektoren, A μ (x) → Aμ (x ) = Λ μ ν A ν (x) , j μ (x) → jμ (x ) = Λ μ ν j ν (x) , und somit F μν und F̃ μν wie Tensoren zweiter Stufe transformieren.
28.3 Elektromagnetische Felder |
203
Bei Abwesenheit von äußeren Ladungen und Strömen, j μ (x) = 0, reduzieren sich die Maxwell-Gleichungen (28.17) auf ∂ μ F μν = 0 und in der Lorentz-Eichung ∂ μ A μ = 0 genügt jede Komponente des Eichfelds der Wel lengleichung ◻A μ (x) = 0 , (28.18) wobei
1 ∂ −∆ (28.19) c2 ∂t2 der d’Alambert’sche Operator ist. Dieselbe Wellengleichung wird dann auch von den zugehörigen E- und B-Feldern erfüllt. Die Vakuumlösungen der Maxwell-Gleichungen sind die elektromagnetischen Wellen, die sich mit der Lichtgeschwindigkeit ausbrei ten. Die Maxwell-Gleichungen (28.17) lassen sich als Euler-Lagrange-Gleichung ◻ = ∂μ ∂μ =
δS[A]/δA μ (x) = 0 des Eichfelds A μ (x) aus der Wirkung S[A] = S em [A] + Sint
(28.20)
ableiten, wobei Sem [A] = −
1 1 ∫ d4 x F μν F μν = ∫ dt d3 x (E2 − B2 ) 4c 2
(28.21)
die Wirkung des freien elektromagnetischen Felds ist, das nach Gl. (28.13) durch ein Eichpotenzial A μ (x) generiert wird, und Sint = −
1 ∫d4 x j μ (x)A μ (x) c2
(28.22)
die Wechselwirkung einer elektrischen Vierer-Stromdichte j μ (x) mit dem elektro magnetischen Feld A μ (x) beschreibt.⁵ Hierbei ist d4 x = dx0 dx1 dx2 dx3 das Volu
5 Tatsächlich hatten wir bereits in Abschnitt 22.1 die Größe (22.4) W=
1 ∫ d 3 xj μ (x)A μ (x) c
als die potenzielle Energie der in j μ (x) (28.12) enthaltenden Ladungen ρ(x) und Ströme j(x) im elek tromagnetischen Feld identifiziert.
204 | 28 Relativistische Quantenmechanik
menelement im Minkowski-Raum. Wegen der Antisymmetrie des Feldstärketensors F μν = −F νμ gilt ∂ μ ∂ ν F μν = 0, womit aus der Maxwell-Gleichung (28.17) die Strom erhaltung ∂ μ j μ (x) = 0 folgt. Dies ist die bekannte Kontinuitätsgleichung ∂t ρ + ∇ ⋅ j = 0 , welche die lokale Erhaltung der elektrischen Ladung gewährleistet. Offenbar lassen sich also nur erhaltene Ströme bzw. Ladungen konsistent an das Maxwell-Feld kop peln. Eine Punktladung q, die sich auf der Weltlinie ̃x μ (τ) bewegt, erzeugt einen ViererStrom, der durch das Linienintegral entlang seiner Weltlinie gegeben ist, j μ (x) = qc ∫ dτ ̃ẋ μ (τ)δ4 (x − ̃x(τ)) = qc ∫ d ̃x μ δ4 (x − ̃x) ,
wobei δ4 (x) = δ(x0 )δ(x1 )δ(x2 )δ(x3 ) . Mit der Parametrisierung τ = x0 = ct, siehe Gl. (28.8), findet man hieraus unmittelbar die bekannten Ausdrücke der dreidimensionalen Notation j0 (x) ≡ cρ (t, x) ,
ρ(t, x) = qδ3 (x − x̃ (t))
j(x) ≡ j(t, x) = q x̃̇ (t)δ3 (x − x̃ (t)) , wobei x̃ (t) die Trajektorie der Punktladung im gewöhnlichen Ortsraum ℝ3 ist. Be findet sich die Punktladung im äußeren elektromagnetischen Feld, erfährt sie nach Gl. (28.22) die Wirkung q Sint = − ∫dτ ẋ μ (τ)A μ (̃x (τ)) . c Mit der Parametrisierung τ = x0 = ct geht dieser Ausdruck in die bekannte Form (22.4), (29.52) q Sint = ∫dt [−qΦ ( x̃ (t)) + x̃̇ (t)⋅A(x̃ (t))] c über. In der klassischen Elektrodynamik erscheint Licht als elektromagnetische Welle und die hierauf beruhende Wellenoptik erklärt die meisten Lichtphänomene in unse rem Alltagsleben. Die korpuskulare Natur des Lichts und damit die Quantennatur des elektromagnetischen Felds tritt jedoch in folgenden Experimenten zutage:
28.3 Elektromagnetische Felder | 205
E
Licht e− Ee ℏω 0
W
Metallfolie Abb. 28.2: Der fotoelektrische Effekt.
Historische Experimente zum Nachweis der Quantennatur des Lichts 1. Der fotoelektrische Effekt Wird Licht mit der Frequenz ω (gewöhnlich UV-Strahlung, bei Alkali-Metallen genügt auch Licht im sichtbaren Bereich) auf eine Metallfolie oder Metallober fläche gestrahlt (H. Hertz 1887, P. Lenard 1902), treten Elektronen aus der Me talloberfläche. Nach der klassischen Physik sollte die kinetische Energie der Elektronen m E e = v2e 2 nur von der Intensität des eingestrahlten Lichts abhängen, nicht aber von der Frequenz. Insbesondere sollte es keine untere Grenzfrequenz für das Licht ge ben, um Elektronen herauszulösen. Man beobachtet aber, dass die Elektronen mit einer maximalen kinetischen Energie von E e = ℏω − W aus der Metalloberfläche austreten, wobei W die Austrittsarbeit ist (Abb. 28.2). Die Energie der Elektronen hängt also entgegen der klassischen Erwartung von der Frequenz des Lichts ab, und es gibt eine Grenzfrequenz ω0 mit ℏω0 = W, unterhalb der keine Elektronen herausgelöst werden.
206 | 28 Relativistische Quantenmechanik
Die Erklärung dieses fotoelektrischen Effekts erfolgte 1905 durch A. Einstein. Seine Erklärung basiert auf der Hypothese, dass Licht aus Energiequanten der Energie ℏω besteht, die, wie oben bereits erwähnt, als Photonen bezeich net werden. Die Elektronen werden demzufolge durch einzelne Photonen aus der Metalloberfläche geschlagen. Ein im Metall gebundenes Elektron kann nur dann aus der Oberfläche austreten, wenn die Energie des Photons die Austritts arbeit des Elektrons übertrifft. Wir kommen also zu folgendem Schluss: (a) Einige Experimente zeigen, dass Licht aus Photonen mit der Energie E = ℏω besteht. (b) In anderen Experimenten erweist sich Licht als klassische elektromagneti sche Welle, die sich mit der Lichtgeschwindigkeit c in Richtung von k aus breitet und der Dispersionsbeziehung ω = c|k|
(28.23)
genügt. Benutzen wir beide Ergebnisse, so finden wir für die Energie der Photonen: E = ℏc|k| .
(28.24)
Die elektromagnetischen Wellen gehorchen der relativistischen Physik, in der für Energie und Impuls folgende Beziehung gilt: E = c√m2 c2 + p2 .
(28.25)
Der Transport physikalischer Größen wie der Energie erfolgt in einer Welle be kanntlich mit der Gruppengeschwindigkeit (siehe auch Abschnitt 4.4) v=
pc ∂E ! = = |v|v̂ . ∂p √m2 c2 + p2
Da sich die Lichtwellen mit der Geschwindigkeit |v| = c ausbreiten, kann diese Beziehung nur erfüllt sein, wenn die Photonen masselos sind. Mit m = 0 folgt aus (28.25) für die Energie der Photonen E = c|p| , und durch Vergleich mit (28.24) für den Impuls der Photonen |p| = ℏ|k| ,
28.3 Elektromagnetische Felder | 207
bzw. da k und p in einer Welle parallel zueinander sind, p = ℏk .
2.
Dieselbe Beziehung hatten wir auch in (3.28) für Materiewellen gefunden. Der Compton-Effekt Die korpuskulare Natur des Lichts zeigt sich auch im Compton-Effekt (Abb. 28.3): Röntgen-Strahlung bzw. sehr kurzwelliges Licht trifft auf ein Elek tron, das als ruhend angenommen werden soll. Bei dem elastischen Stoß zwi schen Elektron und Photon bleiben Energie und Impuls erhalten. Da das Elek tron kinetische Energie gewinnt, muss sich die Energie des Photons verringern. Wegen E = ℏω heißt das aber, dass ω und nach (28.23) auch die Wellenzahl |k| = 2π/λ kleiner wird. Die Wellenlänge des gestreuten Lichts wird also grö ßer. Dies wird in der Tat im Experiment beobachtet. Die Abnahme der Energie lässt sich aus Energie- und Impulserhaltung berechnen. Wird der Streuwinkel zwischen auslaufendem und einfallendem Photon mit θ bezeichnet, so erhält man E E = , 1 + E(1 − cos θ)/mc2 wobei E und E die Energien von auslaufendem und einfallendem Photon sind und m die Elektronenmasse ist. Für die Änderung der Wellenlänge findet man λ − λ = 4π𝜆C sin2
θ , 2
wobei 𝜆C = ℏ/mc = 3,86 × 10−13 m die Compton-Wellenlänge des Elektrons ist. Die in den oben beschriebenen Experimenten mit Licht zutage tretende Teil chen-Wellen-Dualität existiert, wie bereits im Kapitel 1 ausführlich erläutert, auch für massive Teilchen. Für Elektronen wurde diese Dualität erstmalig im historischen Doppelspaltexperiment von Jönssen und Möllenstedt in Tübingen nachgewiesen, siehe Band 1, S. 6.
γ γ
θ
e−
Abb. 28.3: Der Compton-Effekt.
208 | 28 Relativistische Quantenmechanik
28.4 Die Klein-Gordon-Gleichung In der nichtrelativistischen Quantenmechanik hatten wir die quantenmechanische Übergangsamplitude aus dem Grundprinzip der Summation über interferierende Al ternativen abgeleitet. Dieses Grundprinzip war in keiner Weise an die nichtrelativis tische Kinematik gebunden. Wir können deshalb erwarten, dass dieses Grundprin zip auch in der relativistischen Physik Gültigkeit hat, und die quantenmechanische Übergangsamplitude analog zur nichtrelativistischen Quantenmechanik als Summa tion über alle Trajektorien des Minkowski-Raums konstruiert werden kann. Leider hat die Ableitung der quantenmechanischen Bewegungsgleichungen relativistischer Teil chen über das Pfadintegral noch nicht das Stadium der Lehrbuchreife erreicht, sodass wir hier darauf verzichten wollen. Darüber hinaus lassen sich diese Gleichungen sehr viel effizienter als Euler-Lagrange-Gleichungen im Rahmen der Quantenfeldtheorie gewinnen, die jedoch nicht Gegenstand dieses Buchs ist. Wir wollen deshalb an die ser Stelle auf eine strenge Ableitung dieser Gleichungen verzichten und begnügen uns mit einer heuristischen Herleitung, die auf unseren Erfahrungen in der nichtrelativis tischen Quantenmechanik basiert: Aus der nichtrelativistischen Energie-Impuls-Beziehung des freien Teilchens E=
p2 2m
folgt mittels der Ersetzungen ∂ ℏ , p→ ∇ (28.26) ∂t i und Anwendung auf die Wellenfunktion ψ(x, t) die Schrödinger-Gleichung⁶ E → iℏ
∂ ℏ2 ψ(x, t) = − ∆ ψ(x, t) . ∂t 2m Führen wir dieselbe Ersetzung (28.26) in der relativistischen Energie-Impuls-Bezie hung einer Punktmasse E2 = c2 p2 + (mc2 )2 iℏ
durch, so erhalten wir die Materiewellengleichung −ℏ2
∂2 2 ψ(x, t) = −c2 ℏ2 ∆ψ(x, t) + (mc2 ) ψ(x, t) . ∂t2
Nach Division durch c2 und Benutzung des d’Alembert’schen Operators (28.19) nimmt sie die Gestalt [ℏ2 ◻ + (mc)2 ] ψ(x, t) = 0
(28.27)
6 Diese heuristische Ersetzung wurde historisch als Spaten-Mistgabel-Methode bezeichnet. Mit etwas Fantasie lassen sich die Symbole für diese Operatoren (28.26) als Karikaturen dieser Gegenstände in terpretieren.
28.4 Die Klein-Gordon-Gleichung |
209
an. Dies ist die Klein-Gordon-Gleichung. Sie stellt die direkte relativistische Verallge meinerung der zeitabhängigen Schrödinger-Gleichung dar und beschreibt die Bewe gung eines relativistischen spinlosen Teilchens der Ruhemasse m. Für m → 0 geht sie in die aus der Elektrodynamik bekannte gewöhnliche Wellengleichung (28.18) über, ◻ψ(x, t) = 0 , die für jede einzelne Komponente des elektrischen und magnetischen Felds einer elek tromagnetischen Welle erfüllt ist. (Dies ist nicht verwunderlich, da das Photon ein masseloses Teilchen ist.) In der relativistisch kovarianten Notation wird bei der Sub stitution (28.26) der klassische Vierer-Impuls p μ durch den Vierer-Impulsoperator p̂ μ = iℏ∂ μ ersetzt und der d’Alembert’sche Operator ist durch ◻ = ∂μ ∂μ gegeben. In dieser Notation lautet deshalb die Klein-Gordon-Gleichung (28.27): [ℏ2 ∂ μ ∂ μ + (mc)2 ] ψ(x) = 0
(28.28)
[p̂ μ p̂ μ − (mc)2 ] ψ(x) = 0 .
(28.29)
bzw.
In der letzten Darstellung erkennen wir unmittelbar die relativistische EnergieImpuls-Beziehung wieder. Aus mathematischer Sicht stellt die Klein-Gordon-Gleichung eine lineare partiel le Differenzialgleichung zweiter Ordnung dar. Solche Differenzialgleichungen lassen sich bekanntlich durch Fourier-Transformation lösen. Wir Fourier-transformieren des halb die Wellenfunktion bezüglich Raum und Zeit, ψ(x) = ∫
i μ d4 p e− ℏ p μ x a(p) , (2πℏ)4
(28.30)
wobei im Exponenten das vierdimensionale Skalarprodukt p μ x μ = Et − p⋅x steht. Einsetzen der Fourier-Darstellung (28.30) in die Klein-Gordon-Gleichung (28.29) liefert für die Amplitudenfunktionen a(p): [p μ p μ − (mc)2 ]a(p) = 0 .
210 | 28 Relativistische Quantenmechanik Neben der trivialen Lösung a(p) = 0 besitzt diese Gleichung eine nichttriviale Lösung für: p2 = (mc)2 , p2 ≡ p μ p μ . (28.31) Diese Bedingung ist gerade die relativistische Energie-Impuls-Beziehung, d. h., die Klein-Gordon-Gleichung beschreibt freie Teilchen, deren Impuls und Energie über die relativistische Formel Gl. (28.1) zusammenhängen. In der Tat, drücken wir die Zeit komponente p0 durch die Energie aus, p0 = E/c, so hat die Bedingung (28.31) die Lösungen E = ±c√p2 + (mc)2 =: ±E p . Die allgemeine Lösung der Fourier-transformierten Klein-Gordon-Gleichung hat da mit die Gestalt a(p) = a+ (p)2πℏ δ(p0 −
Ep Ep ) + a− (p)2πℏ δ(p0 + ) , c c
wobei a+ und a− willkürliche (p-abhängige) Koeffizienten sind und der Faktor 2πℏ aus Zweckmäßigkeitsgründen eingeführt wurde. Setzen wir diesen Ausdruck in Gl. (28.30) ein, so erhalten wir für die Wellenfunktion im Minkowski-Raum: ψ(x) = ψ(x, t) = ∫
i i i d3 p e ℏ p⋅x [a+ (p)e− ℏ E p t + a− (p)e ℏ E p t ] . (2πℏ)3
(28.32)
Sie ist eine Überlagerung von ebenen Wellen mit Koeffizienten a± (p). Im ersten Term erkennen wir das bereits aus der nichtrelativistischen Quantenmechanik bekannte Wellenpaket, wobei jedoch in (28.32) E p die Energie eines relativistischen freien Teil chens ist. Der zweite Ausdruck repräsentiert ein Wellenpaket mit negativen Energien. Diese negativen Energielösungen können wir als Teilchen mit positiven Energien in terpretieren, die sich in negative Zeitrichtung entwickeln. Solche Teilchen werden als Antiteilchen bezeichnet. Als Beispiel sei hier das Pion erwähnt, das in drei Ladungs zuständen π+ , π0 und π− auftritt. Während das π0 elektrisch neutral ist und bereits allein in elektromagnetische Strahlung zerfallen kann, taucht das π + in elektroma gnetischen Zerfallsprozessen nur zusammen mit dem π− auf. In diesem Sinne ist das π− das Antiteilchen des π+ , während das π 0 kein Antiteilchen besitzt, sondern sein eigenes Antiteilchen darstellt. Dementsprechend wird das π0 durch eine reelle Wel lenfunktion beschrieben,⁷ während die Wellenfunktionen von π+ und π− zueinander komplex konjugiert sind. Auf die Problematik der negativen Energiezustände werden wir später im Zusammenhang mit der Dirac-Gleichung zurückkommen.
7 Für eine reelle Lösung der Klein-Gordon-Gleichung ψ(x) (28.32) muss offenbar a∗− (−p) = a+ (p) gelten. Sie muss deshalb stets auch die Antiteilchenkomponente ∼ exp(iEt/ℏ) enthalten.
28.4 Die Klein-Gordon-Gleichung |
211
Die Klein-Gordon-Gleichung besitzt jedoch ein weiteres Problem, was die Interpre tation der Wellenfunktion betrifft. Um dies zu verdeutlichen, multiplizieren wir die Klein-Gordon-Gleichung (28.28) mit ψ∗ /ℏ2 , ψ∗ (x) (∂ μ ∂ μ + (
mc 2 ) ) ψ(x) = 0 , ℏ
und ziehen hiervon die komplex konjugierte Gleichung ψ(x) (∂ μ ∂ μ + (
mc 2 ) ) ψ∗ (x) = 0 ℏ
ab. Dies liefert 0 = ψ∗ ∂ μ ∂ μ ψ − ψ∂ μ ∂ μ ψ∗ = ∂ μ (ψ∗ ∂ μ ψ − ψ∂ μ ψ∗ ) 1 = 2 ∂ t (ψ∗ ∂ t ψ − ψ∂ t ψ∗ ) − ∇⋅(ψ∗ ∇ψ − ψ∇ψ∗ ) . c Der Ausdruck in der letzten Klammer ist bis auf einen Faktor ℏ/2mi die aus der nichtrelativistischen Quantenmechanik bekannte (Wahrscheinlich keits)-Stromdichte (7.42). Die obige Gleichung ließe sich deshalb als Kontinuitäts gleichung (7.41) ∂ t ρ + ∇⋅j = 0 schreiben, wenn wir iℏ (ψ∗ ∂ t ψ − ψ∂ t ψ∗ ) (28.33) 2mc2 als (Wahrscheinlichkeits-)Dichte interpretieren dürften. Leider ist diese Interpreta tion nicht zulässig, da ρ (28.33) im Gegensatz zum nichtrelativistischen Ausdruck (7.38) ψ∗ ψ nicht positiv definit ist: Da die Klein-Gordon-Gleichung eine Differen zialgleichung zweiter Ordnung bezüglich der Zeit ist, können die Anfangswerte von ψ und ∂ t ψ unabhängig vorgegeben werden, sodass ρ(x, t) für festes t als Funktion des Orts x sowohl positiv als auch negativ sein kann. Setzen wir die Lösung (28.32) der Klein-Gordon-Gleichung in die Dichte (28.33) ein, so erhalten wir nach Integra tion über den Raum ρ=
∫d3 x ρ(x, t) =
1 d3 p ∫ E p [|a+ (p)|2 − |a− (p)|2 ] . 2 mc (2πℏ)3
Die Anteile negativer Energie verursachen somit auch die negativen Beiträge zur Wahrscheinlichkeitsdichte. Die beiden Probleme der Klein-Gordon-Gleichung, nämlich Lösungen negativer Energien und eine nicht positiv definite Wahrschein lichkeitsdichte, sind also miteinander verknüpft. Beide Probleme werden im Rah men der Quantenfeldtheorie beseitigt, in welcher die Entwicklungskoeffizienten a± (p) in (28.32) zu Operatoren erhoben werden. (Die Wellenfunktion (28.32) wird dann selbst zum Operator.) Es zeigt sich dann, dass ρ (28.33) und j multipliziert mit der Ladung gerade die elektrische Ladungsdichte und Stromdichte des spinlosen Teilchens liefern.
212 | 28 Relativistische Quantenmechanik
Die Klein-Gordon-Gleichung in der Form (28.28) beschreibt die Ausbreitung eines frei en, massiven, spinlosen Teilchens, das sich mit relativistischen Geschwindigkeiten bewegt. Gleichung (28.28) enthält zunächst noch keinerlei Wechselwirkung des spin losen Teilchens mit äußeren Feldern. Wir wollen jetzt untersuchen, wie die Klein-Gor don-Gleichung modifiziert werden muss, wenn das spinlose Teilchen eine Ladung q besitzt und sich in einem elektromagnetischen Feld befindet. Dies ist das einzige Feld mit einer relativistischen Dynamik, das wir bisher kennengelernt haben. Für eine nichtrelativistische Ladung q führte das Einschalten eines äußeren Ma gnetfelds B = ∇ × A zur Ersetzung ∇→∇−i
q A(x) ℏc
(28.34)
im Hamilton-Operator, siehe Kapitel 22. Im relativistischen Fall wird wegen der gleich berechtigten Behandlung von Raum und Zeit eine analoge Ersetzung auch für die Zeit ableitung erwartet. Eine solche Ersetzung findet bereits in der zeitabhängigen Schrö dinger-Gleichung statt, wenn ein äußeres elektrisches Feld⁸ E = −∇Φ eingeschaltet wird, welches zu einem Potenzial V(x) = qΦ(x) im Hamilton-Operator der Ladung q führt. In der Schrödinger-Gleichung iℏ∂ t ψ = Hψ ist die Addition dieses Potenzials zum Hamilton-Operator H →H+V äquivalent zur Ersetzung iℏ∂ t → iℏ∂ t − qΦ = iℏ (∂ t + i
q Φ) . ℏ
(28.35)
In der relativistisch kovarianten Notation (siehe Abschnitt 28.3), in welcher Φ(x) = A0 (x), lassen sich die beiden Transformationen (28.34) und (28.35) zu⁹ ∂μ → ∂μ + i
q A μ (x) =: D μ (x) ℏc
(28.36)
zusammenfassen, wobei D μ (x) als kovariante Ableitung bezeichnet wird. Mit der Erset zung (28.36) erhalten wir aus der Klein-Gordon-Gleichung (28.28) die Grundgleichung
8 Wir setzen hier der Einfachheit halber Ȧ = 0 voraus. 9 Man beachte die Definition (28.6) der Vektorkomponenten des ∇-Operators.
28.5 Die Dirac-Gleichung
| 213
für eine relativistische (spinlose) Punktladung in einem äußeren elektromagnetischen Feld A μ (x): [ℏ2 D μ (x)D μ (x) + (mc)2 ]ψ(x) = 0 . Die Klein-Gordon-Gleichung wurde zuerst von Schrödinger gefunden. Er fand diese Gleichung vor der eigentlichen Schrödinger-Gleichung, publizierte sie jedoch nicht, da ihre Anwendung auf die Bewegung eines geladenen Teilchens im Coulomb-Poten zial eine sehr schlechte Beschreibung des Wasserstoff-Atoms lieferte: Die Feinstruk turaufspaltung der Energieniveaus, die zur damaligen Zeit bereits gemessen war, wird durch diese Gleichung inkorrekt wiedergegeben, siehe Abb. 28.7. In der nichtrelati vistischen Näherung dieser Gleichung, die dann später den Namen Schrödinger-Glei chung erhielt, hingegen fehlt die Feinstrukturaufspaltung. Der Grund für das Versa gen der Klein-Gordon-Gleichung bei der Beschreibung des Wasserstoff-Spektrums ist, dass diese Gleichung nur spinlose Teilchen beschreibt, das Elektron aber einen halb zahligen Spin besitzt. Wir werden später bei der Behandlung der Dirac-Gleichung se hen, dass der Spin sehr wesentlich an die relativistische Bewegung gekoppelt ist. Dem gegenüber spielt in der nichtrelativistischen Näherung der Spin eine untergeordnete Rolle, was die Dynamik des Teilchens betrifft.
28.5 Die Dirac-Gleichung Mit der Klein-Gordon-Gleichung ist es gelungen, die Schrödinger-Gleichung auf eine relativistische Dynamik zu verallgemeinern. Der Vorteil der Klein-Gordon-Gleichung besteht darin, dass sie dem Minkowski-Raum entsprechend Raum und Zeit auf gleiche Weise behandelt. Damit ist diese Gleichung jedoch auch eine Differenzialgleichung zweiter Ordnung bezüglich der Zeit. Dies verlangt, dass zur Lösung dieser Gleichung neben der Wellenfunktion auch noch ihre Ableitung am Anfangszeitpunkt bekannt sein muss. Die relativistische Klein-Gordon-Gleichung hat deshalb ein völlig anderes kausales Verhalten als ihre nichtrelativistische Näherung, die Schrödinger-Gleichung. Diese Tatsache ist vom physikalischen Standpunkt aus sehr verwunderlich, da der Übergang von der klassischen Mechanik zur relativistischen Mechanik das Kausali tätsverhalten der Wellenfunktion nicht so gravierend ändern sollte. Aus diesem Grun de versuchte Paul Dirac, eine Bewegungsgleichung für die Wellenfunktion abzuleiten, die einerseits der relativistischen Kinematik Rechnung trägt, zum anderen aber das selbe Kausalitätsverhalten wie die Schrödinger-Gleichung besitzt, nämlich erster Ord nung bezüglich der Zeit ist. Aufgrund der relativistischen Kovarianz darf eine solche Bewegungsgleichung dann auch die Ortsableitung nur in erster Ordnung enthalten. Dirac versuchte daher, die Klein-Gordon-Gleichung zu „linearisieren“, gewisserma
214 | 28 Relativistische Quantenmechanik
ßen „die Wurzel aus dieser zu ziehen“, und eine Gleichung der Form iℏ
∂ Ψ(x, t) = (cα⋅ p̂ + βmc2 )Ψ(x, t) ∂t
(28.37)
aufzuschreiben, wobei die α i=1,2,3 und β noch zu bestimmende Koeffizienten sind. Diese Koeffizienten sind so zu bestimmen, dass „Quadrierung“ dieser Gleichung die relativistisch invariante Klein-Gordon-Gleichung liefert:¹⁰ 2
−ℏ2 ∂2t Ψ(x, t) = (cα⋅ p̂ + βmc2 ) Ψ(x, t) ̂ + βα⋅ p)̂ + (mc2 )2 β 2 ] Ψ(x, t) = [c2 (α⋅ p)̂ 2 + mc3 (α⋅ pβ !
= c2 (−ℏ2 ∆ + (mc)2 ) Ψ(x, t) .
(28.38)
Die letzte Gleichung ist nicht erfüllbar, wenn α i und β komplexe Zahlen sind, da dies immer auf einen Term linear in p̂ führen würde. Sie lässt sich jedoch erfüllen, wenn α i=1,2,3 und β als sogenannte Quaternionen gewählt werden, die über die folgende Algebra¹¹ {α i , α j } = 2δ ij , {α i , β} = 0 , {β, β} ≡ 2β 2 = 2 definiert sind. Hierbei bezeichnet die geschweifte Klammer den Antikommutator {A, B} = AB + BA . Die Quaternionen α i , β lassen sich durch vierdimensionale Matrizen realisieren.¹² Ei ne spezielle Darstellung ist α=(
0 σ
σ ) , 0
β=(
𝟙 0
0 ) , −𝟙
(28.39)
wobei 𝟙 die zweidimensionale Einheitsmatrix und σ i die gewöhnlichen Pauli-Matri zen (15.44) bezeichnen. Alternative Matrixdarstellungen der Quaternionen sind mög lich. Jedoch hängen die physikalischen Ergebnisse nicht von der speziellen Wahl der Darstellung ab. Damit Gl. (28.37) für vierdimensionale Matrizen α, β mathematisch sinnvoll ist, muss die Wellenfunktion ein vierkomponentiger Spaltenvektor sein: ψ1 ψ2 Ψ =( ) , ψ3 ψ4
10 Falls Gl. (28.37) für jede Wellenfunktion ψ(x, t) gilt, müssen die Operatoren ihrer beiden Seiten äquivalent sein und aus (28.37) folgt durch Quadrieren dieser Operatoren Gl. (28.38). 11 Dies ist eine Unteralgebra der Clifford-Algebra. 12 Man überzeugt sich leicht, dass die Dimension N dieser Matrizen gerade sein muss. In der Tat, aus ! α i α j = −α j α i für i ≠ j folgt det(α i ) det(α j ) = det(−1)̂ det(α j ) det(α i ) und somit det(−1)̂ = (−1)N = 1.
28.5 Die Dirac-Gleichung
| 215
der als Dirac-Spinor bezeichnet wird. Gleichung (28.37) wird nach ihrem Entdecker Dirac-Gleichung genannt. Sie besitzt dieselbe Form wie die zeitabhängige Schrödin ger-Gleichung iℏ
∂ Ψ(x, t) = hΨ(x, t) ∂t
(28.40)
h = cα⋅ p̂ + βmc2 .
(28.41)
mit dem Hamilton-Operator
Aus der expliziten Darstellung (28.39) von α und β ist ersichtlich, dass h hermitesch ist. Für einen zeitunabhängigen Hamiltonian (= Hamilton-Operator) besitzt die DiracGleichung (analog zur Schrödinger-Gleichung) stationäre Lösungen der Gestalt Ψ(x, t) = e− ℏ Et φ(x) , i
(28.42)
wobei φ der Eigenwertgleichung hφ(x) = Eφ(x)
(28.43)
genügt, die das relativistische Pendant zur stationären Schrödinger-Gleichung ist. Während die Wellenfunktionen von der gewählten Darstellung der Quaternionen α, β abhängen, sind die Energieeigenwerte darstellungsunabhängig. Die Dirac-Gleichung (28.37) lässt sich in eine symmetrischere Form umschreiben, die der äquivalenten Behandlung von Raum und Zeit Rechnung trägt. Dazu führen wir die Dirac-Matrizen γ μ mit γ0 = β , γ i = βα i ein, welche die Clifford-Algebra {γ μ , γ ν } = 2g μν 1̂
(28.44)
erfüllen, wobei g μν den in Gl. (28.5) definierten Metriktensor und 1̂ die vierdimen sionale Einheitsmatrix bezeichnen.¹³ Nach Multiplikation mit β nimmt die Dirac-Glei chung (28.37) die folgende kovariante Gestalt an: (iℏγ μ ∂ μ − mc)Ψ(x) = 0 .
(28.45)
13 Die vierdimensionale Einheitsmatrix 1̂ werden wir im Folgenden oft weglassen, wenn sie als Mul tiplikator auftritt.
216 | 28 Relativistische Quantenmechanik Aus der expliziten Darstellung von α und β (28.39) finden wir für die Dirac-Matrizen γ μ
γ0 = (
𝟙 0
0 ) , −𝟙
0 γi = ( i −σ
σi ) . 0
(28.46)
Aus der Dirac-Gleichung folgt unmittelbar, dass jede einzelne Komponente ψ i des Dirac-Spinors die Klein-Gordon-Gleichung erfüllt: [ℏ2 ∂ μ ∂ μ + (mc)2 ]ψ i (x) = 0 . Um dies zu zeigen, multiplizieren wir die Dirac-Gleichung (28.45) von links mit (iℏγ ν ∂ ν + mc): 0 = (iℏγ ν ∂ ν + mc)(iℏγ μ ∂ μ − mc)Ψ(x) = [−ℏ2 γ ν γ μ ∂ ν ∂ μ − (mc)2 ]Ψ(x) .
(28.47)
Benutzen wir, dass ∂ ν ∂ μ = ∂ μ ∂ ν , so können wir im obigen Ausdruck γ ν γ μ durch {γ ν , γ μ }/2 ersetzen, [ℏ2
1 ν μ {γ , γ } ∂ μ ∂ ν + (mc)2 ] Ψ(x) = 0 , 2
̂ = ψ: und aus der Definition der Clifford-Algebra (28.44) folgt mit 1ψ [ℏ2 g νμ ∂ μ ∂ ν + (mc)2 ]Ψ(x) = 0 ,
(28.48)
was wegen g νμ ∂ ν = ∂ μ die gewünschte Klein-Gordon-Gleichung für den gesamten Spi nor Ψ(x) und somit für jede einzelne Komponente ψ i (x) liefert. Die Dirac-Gleichung stellt jedoch eine stärkere Bedingung an den Spinor dar als die Klein-Gordon-Glei chung (28.48), d. h., ein Dirac-Spinor, der die Dirac-Gleichung erfüllt, genügt auch der Klein-Gordon-Gleichung, aber nicht umgekehrt. Während die Klein-Gordon-Glei chung (28.48) die einzelnen Spinorkomponenten unabhängig lässt, sind diese in der Dirac-Gleichung aufgrund deren Matrixstruktur korreliert.
28.6 Die Lösungen der freien Dirac-Gleichung 28.6.1 Stationäre Dirac-Gleichung Der Dirac-Hamiltonian (28.41) ist ein linearer Differenzialoperator und dementspre chend lässt sich die stationäre Dirac-Gleichung (28.43) durch Fourier-Transformation lösen. Anstatt der Fourier-Transformation können wir auch gleich die Lösung in Form einer ebenen Welle ansetzen: φ(x) = e ℏ p⋅x w(p) . i
28.6 Die Lösungen der freien Dirac-Gleichung
| 217
Mit diesem Ansatz reduziert sich die stationäre Dirac-Gleichung (28.43) auf eine alge braische Matrixgleichung h(p)w(p) = E(p)w(p) ,
h(p) = cα⋅p + βmc2 .
(28.49)
Aufgrund der Drehinvarianz im ℝ3 hängen die Energieeigenwerte E(p) nur vom Betrag p = |p| des Impulses ab.¹⁴ Die Bestimmung des Energieeigenwerts E(p) für vorgege benen Impulsvektor p ist ein vierdimensionales Matrixeigenwertproblem, das sich in Standardweise lösen lässt. Bevor wir die allgemeine Lösung angeben, wollen wir zunächst den Spezialfall eines verschwindenden Impulses p = 0 untersuchen. Da die Matrix β = γ0 bereits diagonal ist (siehe (28.39)), sind die Lösungen unmittelbar bekannt: Die Energieei genwerte E(0) sind durch ±mc2 , d. h. durch die Ruhemasse, gegeben. Die zugehörigen Eigenvektoren können wir in Form der vierdimensionalen Einheitsvektoren wählen: 1 0 w(1) (0) = ( ) , 0 0
0 1 w(2) (0) = ( ) , 0 0
E(0) = mc2 ,
0 0 w(3) (0) = ( ) , 1 0
0 0 w(4) (0) = ( ) , 0 1
E(0) = −mc2 .
(28.50)
Auch im allgemeinen Fall p ≠ 0 lassen sich die Energieeigenwerte E(p) sehr ein fach algebraisch bestimmen. Dazu bilden wir das Quadrat des Dirac-Hamiltonians (28.49) (h(p))2 = (cα ⋅ p + βmc2 )2 = c2 (α ⋅ p)2 + mc3 p ⋅ {α, β} + β 2 (mc2 )2 . Unter Ausnutzung der Algebra der Dirac-Matrizen (Clifford-Algebra) (28.44), {α k , α l } = 2δ kl ,
{α k , β} = 0 ,
β2 = 1 ,
finden wir (h(p))2 = E2p ,
E p = c√p2 + (mc)2
(28.51)
und somit die Energieeigenwerte E(p) = ±E p .
14 Die Gruppe O(1, 3) der Lorentz-Transformationen im Minkowski-Raum enthält die Drehgruppe O(3) im ℝ3 als Untergruppe, siehe Anhang E.8.
218 | 28 Relativistische Quantenmechanik
Wegen (28.51) sind die Operatoren Λ± (p) =
1 h(p) ) (1 ± 2 Ep
(28.52)
orthogonale Projektoren Λ2± (p) = Λ± (p) ,
Λ± (p)Λ∓ (p) = 0 ,
Λ+ (p) + Λ− (p) = 1
(28.53)
auf die Unterräume der positiven bzw. negativen Energie-Eigenzustände: Offenbar gilt h(p) = E p (Λ+ (p) − Λ− (p)) und somit wegen (28.53) h(p)Λ± (p) = ±E p Λ± (p) . Aufgrund dieser Beziehung erhalten wir einen Eigenvektor von h(p) zum positiven bzw. negativen Energieeigenwert, ±E p , indem wir mit dem Projektor Λ+ (p) bzw. Λ− (p) auf einen beliebigen konstanten Dirac-Spinor wirken. Um sämtliche linear unab hängige Eigenvektoren zu finden, wirken wir mit Λ± (p) auf die vier Basisspinoren w(α) (0), α = 1, 2, 3, 4 (28.50). Dies liefert acht Eigenvektoren, Λ± (p)w(α) (0), von de nen nur vier linear unabhängig sind. Diese wählen wir so, dass sie für p = 0 in die bereits bekannten Eigenvektoren w(α) (0) (28.50) übergehen. Beachten wir, dass Λ± (0) =
1 (1 ± β) 2
und somit Λ+ (0)w(α) (0) = w(α) (0) , Λ+ (0)w
(α)
(0) = 0 ,
Λ− (0)w(α) (0) = 0 , Λ− (0)w
(α)
(0) = w
(α)
α = 1, 2 , (0) ,
α = 3, 4 ,
so sind die vier linear unabhängigen Eigenvektoren von h(p) durch Λ+ (p)w(α) (0) , Λ− (p)w
(α)
(0) ,
α = 1, 2 ,
E(p) = E p ,
α = 3, 4 ,
E(p) = −E p
(28.54)
gegeben. In der Darstellung (28.39) der Dirac-Matrizen lautet der Dirac-Hamiltonian (28.49) mc2 cσ ⋅ p h(p) = ( ) cσ ⋅ p −mc2 und dementsprechend die orthogonalen Projektoren (28.52) Λ± (p) =
1 E p ± mc2 ( 2E p cσ ⋅ p
cσ ⋅ p ) . E p ∓ mc2
(28.55)
Damit sind die vier linear unabhängigen Lösungen der stationären Dirac-Gleichung (28.49) für ein freies Teilchen (bis auf Normierung) explizit bekannt. Die Normierung dieser Zustände werden wir im nächsten Abschnitt bestimmen, wo wir die allgemei nen zeitabhängigen Lösungen der freien Dirac-Gleichung finden werden.
28.6 Die Lösungen der freien Dirac-Gleichung
| 219
28.6.2 Kovariante Dirac-Gleichung Zur Bestimmung der allgemeinen zeitabhängigen Lösung empfiehlt es sich, von der kovarianten Form der Dirac-Gleichung (28.45) auszugehen. Der Einfachheit halber wer den wir dabei c = 1 setzen. Nach Fourier-Transformation der Wellenfunktion: Ψ(x) = ∫
i μ d4 p e− ℏ p μ x w(p) . 4 (2πℏ)
reduziert sich die Dirac-Gleichung (28.45) (mit c = 1) auf eine algebraische Gleichung für die Fourier-Amplituden w(p): (p/ − m)w(p) = 0 ,
p/ = γ μ p μ ,
(28.56)
wobei wir die übliche Abkürzung benutzt haben, dass ein Schrägstrich durch einen Vierer-Vektor seine Kontraktion mit den γ-Matrizen bedeutet (d. h. Multiplikation mit γ μ und Summation über μ). Diese algebraische Gleichung ist äquivalent zu der oben angegebenen Form (28.49) und lässt sich unmittelbar lösen, wenn wir beachten, dass sich die Matrix (p/ − m) nach Multiplikation mit (p/ + m) diagonalisieren lässt (siehe Gln. (28.47) und (28.48)). In der Tat, mit (p/ + m)(p/ − m) = p2 − m2
(28.57)
erhalten wir aus (28.56): (p2 − m2 )w(p) = 0 ,
p2 = p μ p μ .
Dies ist die Klein-Gordon-Gleichung (für jede einzelne Komponente des Dirac-Spinors w(p)), die nichttriviale Lösungen nur für p0 = ±E p ,
E p = √m2 + p2
besitzt. Damit sind die Energieeigenwerte der stationären Lösungen der Dirac-Glei chung eines freien Teilchens bekannt. Um die Eigenvektoren w(p) ≡ w(±E p , p) zu finden, beachten wir, dass wegen der Beziehung (28.57) und p2 = m2 für p0 = ±E p die Lösung der Dirac-Gleichung (28.56) in der Form w(α) (p) = N(p/ + m)w(α) (0) ,
p0 = ±E p
(28.58)
geschrieben werden kann, wobei w(α) (0) , α = 1, 2, 3, 4 , die in Gl. (28.50) gefundenen Eigenvektoren der stationären Dirac-Gleichung für verschwindende Impulse p = 0 sind und N eine Normierungskonstante ist.¹⁵ Für p0 = ±E p liefert dieser Ansatz acht 15 Prinzipiell könnte anstatt der w (α) (0) auf der rechten Seite von Gl. (28.58) auch ein beliebiger kon stanter Dirac-Spinor stehen. Da jedoch die allgemeinen Lösungen w (α) (p) = w (α) (p0 , p) für p = 0 in die bereits bekannten Lösungen (28.50) übergehen sollen, empfiehlt es sich, den beliebigen DiracSpinor gleich in Form der w (α) (0) zu wählen.
220 | 28 Relativistische Quantenmechanik
Lösungen der Dirac-Gleichung. Wir wissen jedoch, dass nur vier linear unabhängige Lösungen existieren. Es empfiehlt sich, diese so zu wählen, dass sie für p = 0 in die oben angegebenen Eigenvektoren (28.50) übergehen. Die so festgelegten linear unab hängigen Lösungen der Dirac-Gleichungen lauten:¹⁶ w(α=1,2) (p0 = E p , p) ,
w(α=3,4) (p0 = −E p , p) .
Ferner hat es sich eingebürgert, die Lösungen positiver bzw. negativer Energie mit den Buchstaben U bzw. V zu bezeichnen. Aus Symmetriegründen wählt man bei den Lö sungen negativer Energie auch das Impulsargument negativ und definiert: U (α=1,2) (p) = w(α=1,2) (p0 = E p , p) , V (α=1,2) (p) = w(α=3,4) (p0 = −E p , −p) . Die so definierten linear unabhängigen Lösungen der Dirac-Gleichung U (α) (p), V (α) (p), α = 1, 2 lassen sich nach Gl. (28.58) dann in der kompakten Form U (α) (p) = N(p/ + m)w(α) (0) , V (α) (p) = N(−p/ + m)w(α+2) (0)
(28.59)
schreiben, wobei α = 1, 2 und p0 = E p = √m2 + p2 > 0. Man beachte, dass auch in der negativen Energie-Lösung V (α) (p) die Zeitkomponente des Impulses jetzt auf p0 = E p > 0 fixiert ist. Im Gegensatz zur stationären Schrödinger-Gleichung sollten wir die Größe Ψ † Ψ hier nicht als Norm verwenden, da sie kein Lorentz-Skalar ist, sondern unter LorentzTransformationen ihren Wert ändert. Zur Normierung der Dirac-Spinoren empfiehlt es sich, die Lorentz-invariante Größe ̄Ψ , Ψ † γ0 Ψ = Ψ
̄ = Ψ † γ0 Ψ
zu benutzen. Die Normierung der Lösung der freien Dirac-Gleichung wählen wir des halb zweckmäßigerweise als: ̄ (α) (p)U (β) (p) = δ αβ , U
̄(α) (p)V (β) (p) = −δ αβ . V
(28.60)
Da die U(p) und V(p) zu verschiedenen Eigenwerten p0 = ±E p gehören, erfüllen sie außerdem die Orthogonalitätsrelationen ̄ (α) (p)V (β) (p) = 0 , U
̄ V (α) (p)U (β) (p) = 0 .
16 Die vier übrigen Lösungen (28.58) verschwinden für p = 0: w (α=3,4) (p0 = m, p = 0) = 0, w (α=1,2) (p0 = −m, p = 0) = 0.
28.6 Die Lösungen der freien Dirac-Gleichung
| 221
Die so gewählte Normierung legt die Konstante N in (28.59) auf N=
1
(28.61)
√2m(E p + m)
fest. Mit der expliziten Form der Dirac’schen γ-Matrizen (28.46) und der Normie rungskonstante (28.61) lauten die normierten Eigenlösungen der Dirac-Gleichung (α = 1, 2): U (α) (p) = S(p)w(α) (0) , V (α) (p) = S(p)w(α+2) (0) , wobei 𝟙 Ep + m S(p) = √ ( σ⋅p 2m Ep + m
σ⋅p Ep + m 𝟙
)=
Ep + m + α ⋅ p √2m(E p + m)
.
Dieselben Zustandsvektoren findet man mit (28.55) aus Gl. (28.54) nach entsprechen der Normierung (28.60). Man beachte, dass wir oben c = 1 gesetzt hatten. Behalten wir die Lichtgeschwindigkeit explizit in den Ausdrücken, so müssen wir m → mc2 bzw. σ⋅p → cσ⋅p ersetzen (siehe Gl. (28.49)) und erhalten:
E p + mc2 S(p) = √ ( 2mc2 c
𝟙 σ⋅p E p + mc2
c
σ⋅p E p + mc2 𝟙
) .
Hieraus ist ersichtlich, dass für positive Energielösungen E = E p > 0 die oberen Kom ponenten von der Ordnung 1 sind, während die unteren Komponenten von der Ord nung |v|/c sind und damit für eine nichtrelativistisch verlaufende Bewegung |v| ≪ c sehr klein sind: c
σ⋅p σ⋅p σ⋅p σ⋅v |v| =c ≃ ≃ ∼ . 2 2 2 2 2mc 2c c E p + mc c√(mc) + p + mc
Für die negativen Energielösungen E = −E p < 0 sind umgekehrt die unteren Kom ponenten des Dirac-Spinors von der Ordnung 1, während die oberen Komponenten von der Ordnung |v|/c sind. Wir erkennen insbesondere, dass im nichtrelativistischen Grenzfall |v| ≪ c die oberen und unteren Komponenten entkoppeln. Die relativen Größen der oberen und unteren Komponenten der positiven bzw. negativen EnergieLösungen der Dirac-Gleichung erklären auch die unterschiedlichen Vorzeichen in der Norm (28.60).
222 | 28 Relativistische Quantenmechanik
E
mc 2
(a)
E
E = +E p > 0
mc 2
(b)
p2
Teilchen
p1
Antiteilchen
0 −mc 2
E = −E p < 0
−mc 2
Abb. 28.4: Schematische Darstellung des Energiespektrums eines freien Dirac-Teilchens der Mas se m: (a) Vakuum (gefüllter Dirac-See) und (b) Teilchen-Antiteilchen-Anregung des Dirac-Sees.
Die Dirac’sche Theorie der Antiteilchen Das Spektrum des Dirac-Hamiltonians ist in Abb. 28.4 illustriert. Oberhalb der Ru heenergie mc2 gibt es ein Kontinuum von Zuständen, die durch den räumlichen Impuls p klassifiziert sind. Zu diesen Zuständen gibt es ein spiegelsymmetrisch ge legenes Kontinuum negativer Energiezustände, das bei der negativen Ruheenergie −mc2 beginnt und sich bis minus unendlich erstreckt. Auch diese Zustände werden durch den räumlichen Impuls p klassifiziert. Nehmen wir an, die Zustände mit negativer Energie seien unbesetzt. Wir könnten dann Energie durch Besetzung dieser Zustände gewinnen. Da unendlich viele ne gative Energiezustände existieren, ließe sich unendlich viel Energie gewinnen. Dies muss notwendigerweise zu einer Instabilität des Vakuums führen. Die Instabili tät lässt sich nur dann vermeiden, wenn alle Zustände negativer Energie mit Fer mionen besetzt sind. Diese unterliegen dem Pauli-Prinzip, wonach jeder Zustand höchstens durch ein einziges Fermion besetzt sein kann. Sind also diese Zustände bereits durch Fermionen besetzt, kann keine weitere Besetzung erfolgen und ein solcher Zustand wäre stabil. Die Gesamtheit der mit Fermionen besetzten negati ven Energiezustände wird als Dirac-See bezeichnet. Es drängt sich hier die Frage auf: Sind diese besetzten negativen Energiezustände nur ein Artefakt der Theorie oder existieren sie real und lassen sich im Experiment nachweisen? Falls die negativen Energiezustände mit E = −E p tatsächlich existieren und mit Teilchen besetzt sind, müssen sich diese Teilchen durch äußere Felder auch auf die unbesetzten positiven Energiezustände mit E = E p anregen lassen (siehe Abb. 28.4). Eine solche Anregung wäre ähnlich einer Teilchen-Loch-Anregung in einem Vielteilchensystem und würde die Anregungsenergie ∆E = E p2 − (−E p1 ) = E p2 + E p1 ≥ 2mc2 besitzen. Das zurückbleibende Loch im Dirac-See repräsentiert eine fehlende ne gative Energie und besitzt somit selbst eine positive Energie E = E p1 wie ein ge
28.6 Die Lösungen der freien Dirac-Gleichung
|
223
wöhnliches Teilchen. Wir können deshalb das Loch im Dirac-See als ein Teilchen interpretieren. Andererseits kann dieses Teilchen durch Abregung des auf positi ve Energiezustände angeregten Fermions wieder vernichtet werden. Das Loch wird deshalb als Antiteilchen zu dem Teilchen, das den positiven Energiezustand E = E p2 besetzt, bezeichnet. Mit dieser Interpretation der Lösungen der Dirac-Gleichung ist es deshalb möglich, aus dem Vakuum ein Teilchen-Antiteilchen-Paar zu erzeugen. Umgekehrt können Teilchen-Antiteilchen-Paare sich zu Energie vernichten. Diese Prozesse werden als Paarerzeugung bzw. Paarvernichtung bezeichnet und lassen sich im Experiment nachweisen. Zum Beispiel können durch starke elektromagnetische Felder, d. h. durch Photonen in der Nähe von Atomkernen, aus dem Vakuum Elektron-PositronPaare erzeugt werden. Der Atomkern ist dabei erforderlich, um einen Teil des Im pulses des Photons aufzunehmen. Wenn unser Vakuum aus dem gefüllten Dirac-See besteht, so muss es auf (äuße re) Felder reagieren und somit experimentell nachweisbar sein. Wie wir oben gese hen haben, können Felder, falls sie stark genug sind, Teilchen-Antiteilchen-Paare aus dem Vakuum erzeugen. Selbst schwache Felder können aufgrund der Energie unschärfe virtuelle Teilchen-Antiteilchen-Paare erzeugen, die mit den realen Teil chen wechselwirken und deren Eigenschaften verändern können. Damit müssten auch die Elektronen im Coulomb-Feld des Atomkerns eine Änderung ihrer Energie niveaus aufgrund des Vakuums, d. h. des gefüllten Dirac-Sees erfahren. In der Tat wird eine zusätzliche Verschiebung der Elektronenniveaus gegenüber den Lösun gen der Dirac-Gleichung experimentell gemessen. Diese Verschiebung lässt sich im Rahmen der Quantenfeldtheorie berechnen und wird als Lamb-Shift bezeich net.
Nach eigenen Aussagen ist Dirac auf die Antiteilcheninterpretation der Lochzustän de durch folgende Aufgabe gekommen, die bei einem Schülerwettbewerb gestellt wurde: Drei Fischer fuhren aufs Meer um zu fischen. Als sie zurückkehrten, war es bereits spät in der Nacht. Sie beschlossen, sich schlafen zu legen und erst am Morgen die gefangenen Fische aufzuteilen. Der Fischer, der zuerst am nächsten Morgen auf wachte, zählte die Fische und teilte sie durch drei. Dabei blieb ein Fisch übrig, den er zurück ins Meer warf. Kurze Zeit darauf wachte der zweite Fischer auf, der jedoch nicht wusste, dass bereits einer seiner Kollegen seinen Anteil der Fische mitgenom men hatte. Er teilte wieder die Fische durch drei, wobei wieder ein Fisch übrig blieb, den er ins Meer warf. Auch dieser Fischer nahm sich ein Drittel der Fische und ging heim. Als der letzte Fischer aufwachte, zählte er wieder die Fische, teilte sie durch drei und es blieb wieder ein Fisch übrig. Wie groß ist die kleinstmögliche Zahl der ursprünglich gefangenen Fische? Die Antwort lautet 25. Die Aufgabe besitzt jedoch auch eine unphysikalische Lösung, nämlich −2.
224 | 28 Relativistische Quantenmechanik
28.7 Der Drehimpuls des Dirac-Teilchens In der nichtrelativistischen Quantenmechanik bleibt der Erwartungswert einer Obser vablen erhalten, wenn der zugehörige Operator nicht explizit von der Zeit abhängt und mit dem Hamilton-Operator kommutiert. Dies gilt offensichtlich auch für die Observ able eines Dirac-Teilchens, da die Dirac-Gleichung (28.40) bezüglich ihrer Zeitabhän gigkeit die Form der nichtrelativistischen Schrödinger-Gleichung besitzt. Sowohl in der nichtrelativistischen Mechanik als auch in der nichtrelativistischen Quantenmechanik hatten wir gefunden, dass der Drehimpuls eines freien Teilchens oder eines Teilchens im Zentralpotenzial erhalten bleibt. Um zu sehen, ob der Drehim puls für ein Dirac-Teilchen erhalten bleibt, berechnen wir den Kommutator des Dreh impuls-Operators L = x × p mit dem Dirac-Hamiltonian h = cα⋅p + βmc2 . Der Drehimpulsoperator kommutiert natürlich mit dem konstanten Massenterm, [L, mc2 ] = 0̂ ; deshalb finden wir: [L i , h] = [L i , cα⋅p] = cα k [L i , p k ] . Der hier auftretende Kommutator von Drehimpuls- und Impulsoperator wurde in Ab schnitt 15.1 berechnet (siehe Gln. (15.12) oder (26.55)), [L i , p k ] = iℏϵ ikl p l , sodass wir schließlich erhalten: [L i , h] = iℏc (α × p) i ≠ 0̂ .
(28.62)
Somit ist der Bahndrehimpuls für ein freies Dirac-Teilchen nicht erhalten. Die Ver letzung der Drehimpulserhaltung kommt offenbar durch die Tatsache zustande, dass die Dirac-Gleichung keine skalare Gleichung, sondern eine Matrixgleichung ist, was durch Anwesenheit der Clifford-Zahlen α k , β angezeigt wird. Die Nichterhaltung des Bahndrehimpulses hätten wir bereits vermuten können, da der Dirac-Hamiltonian ei nen konstanten Vektor α enthält, der die Rotationssymmetrie bricht. In der Tat enthält der nichtverschwindende Kommutatorterm von Drehimpuls mit Dirac-Operator gera de diese Dirac-Matrizen. Wir können jedoch den Bahndrehimpuls-Operator erweitern zu einem Operator, der dieselbe Drehimpuls-Algebra erfüllt und dennoch mit dem Dirac-Hamiltonian für zentralsymmetrische Potenziale kommutiert. Dazu betrachten wir den Operator
S=
ℏ Σ, 2
Σ=(
σ 0
0 ) , σ
(28.63)
28.7 Der Drehimpuls des Dirac-Teilchens |
225
wobei die σ i wieder die Pauli-Matrizen (15.44) sind, die den Kommutationsbeziehun gen [σ i , σ j ] = 2iϵ ijk σ k genügen. Diese Beziehungen stimmen bis auf einen Faktor ℏ/2 mit der DrehimpulsAlgebra überein. Der oben eingeführte Operator (28.63) erfüllt in der Tat die Drehim puls-Algebra [S i , S j ] = iℏϵ ijk S k . (28.64) Für den Kommutator des Operators S i mit dem Dirac-Hamiltonian finden wir: [S i , h] = c[S i , α⋅p] =
1 ℏcp k [Σ i , α k ] . 2
(28.65)
Unter Benutzung der expliziten Form der Matrizen α k (28.39) finden wir: [Σ i , α k ] = i2ϵ ikl α l und somit aus (28.65): [S i , h] = iℏc (p × α)i = −iℏc (α × p) i . Vergleich mit Gl. (28.62) zeigt, dass der Operator J =L+S mit dem Dirac-Hamiltonian kommutiert, [J, h] = 0̂ , und folglich im Sinne der Quantenmechanik erhalten bleibt. Bei Anwesenheit eines skalaren Zentralpotenzials können die Eigenfunktionen des Dirac-Hamiltonians folg lich nach den Eigenwerten des Operators J klassifiziert werden.¹⁷ Beachten wir, dass sowohl der Bahndrehimpuls L i als auch der Operator S i dieselbe Algebra erfüllen und ferner diese beiden Operatoren in unterschiedlichen Hilbert-Räumen wirken und so mit [S k , L i ] = 0,̂ so folgt unmittelbar, dass auch ihre Summe, d. h. der Operator J, dieselbe Algebra erfüllt: [J k , J l ] = iℏϵ klm J m .
(28.66)
Wie wir bereits in Abschnitt 15.1 für den Bahndrehimpuls festgestellt hatten, sind auf grund dieser Kommutationsbeziehungen nicht alle Komponenten J k=1,2,3 gleichzeitig messbar, sondern wegen (28.66) [J k , J 2 ] = 0 17 Wie die obige Ableitung von [J, h] = 0 zeigt, ist die Darstellung (28.63) des Spinoperators S an die Darstellung (28.39) der Dirac-Matrizen geknüpft. Alternative Darstellungen der Dirac-Matrizen α führen auch auf andere Darstellungen des Spinoperators S.
226 | 28 Relativistische Quantenmechanik
nur das Quadrat und eine Komponente, die gewöhnlich als die dritte Komponente ge wählt wird. Ferner hatten wir gesehen, dass aufgrund der Drehimpuls-Algebra (28.64), (28.66) die Eigenwerte folgende Gestalt besitzen müssen: S 2 : ℏ2 s(s + 1) ,
S3 : ℏm s ,
− s ≤ ms ≤ s ,
J 2 : ℏ2 j(j + 1) ,
J 3 : ℏm ,
−j≤m≤j,
wobei die Quantenzahlen s und j halbzahlig oder ganzzahlig sein müssen. Ihre tat sächlichen Werte werden durch die explizite Darstellung der Drehimpulsoperatoren festgelegt. Im vorliegenden Fall findet man mit (σ i )2 = 𝟙 für die Operatoren S i (28.63): 3
S 2 = ∑ (S i )2 = i=1
3 ! ℏ2 3 i 2 ℏ2 3 ∑ (σ ) = ∑ 1 = ℏ2 = ℏ2 s(s + 1) , 4 i=1 4 i=1 4
woraus s = 1/2 folgt. Aus den allgemeinen Gesetzen der Drehimpuls-Vektoraddition, die in Ab schnitt 15.7 besprochen wurde, folgt dann, dass die Quantenzahl des Operators J durch j = |l ± 1/2| gegeben ist und somit ebenfalls halbzahlig ist, da die Quantenzahl l des Bahndreh impulses ganzzahlig ist. Für l = 0 tritt nur der Wert j = 12 auf, da j nicht negativ sein kann. Der Drehimpuls s = 1/2, dessen Operatoren S i nicht wie der Bahndrehimpuls durch Differenzialoperatoren im Ortsraum realisiert werden können, sondern sich al lein durch die Pauli-Matrizen darstellen lassen, wird als innerer Drehimpuls bzw. als Spin des Dirac-Teilchens bezeichnet. Damit kommen wir zu dem wichtigen Schluss, dass ein Dirac-Teilchen einen inneren Drehimpuls S mit der Quantenzahl s = 1/2 besitzt. Dieser koppelt zusammen mit dem Bahndrehimpuls L zu einem Gesamtdreh impuls, J = L + S, der für zentralsymmetrische Potenziale erhalten bleibt. Für letzte re können wir folglich die Lösung der Dirac-Gleichung durch die Quantenzahlen des Quadrats des Gesamtdrehimpulses j und dessen Projektion m charakterisieren. Es sei an dieser Stelle noch einmal betont: Für ein Dirac-Teilchen im zentralsymmetrischen Potenzial sind Bahndrehim puls L und Spin S nicht separat erhalten, sondern nur der Gesamtdrehimpuls J = L + S.
28.8 Ladung im Magnetfeld |
227
28.8 Ladung im Magnetfeld Für ein spinloses Teilchen wurde in der Klein-Gordon-Gleichung bei Einschalten ei nes äußeren elektromagnetischen Felds der Vierer-Impulsoperator p μ = iℏ∂ μ um das Eichpotenzial A μ (x) verschoben, pμ → pμ −
q A μ (x) , c
(28.67)
d. h., die gewöhnliche Ableitung ∂ μ wurde durch die kovariante Ableitung (28.36) Dμ = ∂μ + i
q A μ (x) ℏc
(28.68)
ersetzt. Der Spin als (innerer) Drehimpuls eines Teilchens hat a priori nichts mit seiner elektrischen Ladung zu tun, welche die Stärke charakterisiert, mit der das Teilchen an ein elektromagnetisches Feld koppelt. In der Tat können Elementarteilchen unter schiedlichen Spins dieselbe Ladung besitzen. Beispielsweise besitzt das Proton mit Spin 1/2 dieselbe Ladung wie das spinlose Pion π + , siehe Abschnitt 26.7. Wir können deshalb erwarten, dass die Ersetzung (28.67) bei Einschalten eines elektromagneti schen Felds unabhängig vom Spin der Ladung gilt und somit auch für Teilchen mit Spin 1/2. Durch die Ersetzung ∂ μ → D μ erhält man aus der Dirac-Gleichung eines freien Teilchens (28.45) die Dirac-Gleichung einer Punktladung q in einem äußeren elektro magnetischen Feld A μ (x) (iℏD/ − mc) Ψ(x) = 0 . Diese Gleichung enthält die allgemeinst mögliche Kopplung eines Dirac-Teilchens der Masse m und der Ladung q an ein äußeres elektromagnetisches Feld A μ (x). Schreiben wir diese Gleichung in der Form der zeitabhängigen Schrödinger-Gleichung (28.40), so finden wir für den Dirac-Hamilton-Operator h = cα⋅π + βmc2 + qA0 ,
(28.69)
wobei A0 das skalare Potenzial und π=p−
q A c
der Operator des kinetischen Impulses ist. Das skalare Potenzial A0 geht wie ein ge wöhnliches Potenzial in den Hamilton-Operator (28.69) ein. Deshalb beschränken wir uns im Folgenden auf eine Punktladung in einem äußeren Magnetfeld und setzen A0 = 0.
228 | 28 Relativistische Quantenmechanik
In vielen praktischen Anwendungen kann das äußere Magnetfeld, das auf die Elektronen wirkt, in guter Näherung als konstant angenommen werden. Für ein (raum-zeitlich) konstantes Magnetfeld B = const lässt sich die Dirac-Gleichung genau wie die Schrödinger-Gleichung analytisch lösen. Dazu benutzen wir die DiracGleichung in Form der zeitabhängigen Schrödinger-Gleichung (28.40), wobei der Dirac-Hamiltonian nach (28.69) für A0 = 0 durch h = cα⋅π + βmc2
(28.70)
gegeben ist. Da h zeitunabhängig ist, können wir die zeitabhängige Dirac-Gleichung (28.40) mit dem Ansatz (28.42) auf die stationäre Gleichung (28.43) h(x)φ(x) = Eφ(x) reduzieren, wobei φ(x) ein Dirac-Spinor ist, den wir durch zwei gewöhnliche (zwei komponentige) Spinoren ϕ, χ ausdrücken ϕ φ=( ) . χ
(28.71)
In der Darstellung (28.39) α=(
0 σ
σ ) , 0
β=(
𝟙 0
0 ) −𝟙
zerfällt die stationäre Dirac-Gleichung in ein System von zwei gekoppelten Gleichun gen für ϕ und χ c σ⋅π χ = (E − mc 2 )ϕ , c σ⋅π ϕ = (E + mc2 )χ . Wir lösen die zweite Gleichung nach χ auf 1 σ⋅π ϕ E + mc2 und setzen diesen Ausdruck in die erste Gleichung ein χ=
c2 (σ⋅π)2 ϕ = (E − mc2 )(E + mc2 )ϕ .
(28.72)
(28.73)
Damit haben wir die Dirac-Gleichung auf eine Gleichung für den zweikomponentigen Spinor ϕ reduziert. Diese Gleichung lässt sich weiter vereinfachen, wenn man die Ei genschaften der Pauli-Matrizen {σ i , σ j } = 2δ ij ,
[σ i , σ j ] = 2iϵ ijk σ k
benutzt, woraus 1 i j 1 {σ , σ } + [σ i , σ j ] = δ ij + iϵ ijk σ k 2 2 folgt. Multiplizieren wir diese Identität mit den Koordinaten zweier beliebiger Vekto ren a und b, so finden wir σi σj =
(a⋅σ)(σ⋅b) = a⋅b + i(a × b)⋅σ .
(28.74)
28.8 Ladung im Magnetfeld | 229
Setzen wir in dieser Beziehung a = b = π, so erhalten wir: (σ⋅π)(σ⋅π) = π 2 + iσ⋅(π × π) . Für A ≠ 0 verschwindet das Vektorprodukt π × π nicht: q ℏ q ℏ π × π ϕ = ( ∇ − A) × ( ∇ − A) ϕ i c i c ℏ q =− (∇ × A + A × ∇) ϕ i c ℏ q =− ((∇ × A) − A × ∇ + A × ∇) ϕ i c q q = iℏ (∇ × A) ϕ = iℏ Bϕ . c c Somit erhalten wir:
q ℏσ⋅B . c Mit dieser Beziehung vereinfacht sich die Gleichung (28.73) zu (σ⋅π)2 = π 2 −
c2 (π 2 −
q ℏσ⋅B) ϕ = (E2 − (mc2 )2 ) ϕ . c
(28.75)
(28.76)
Zweckmäßigerweise legen wir die Quantisierungsachse des Drehimpulses in Richtung des (konstanten) qB-Felds. Dann gilt qσ⋅B = |q|Bσ 3 ,
B = |B| .
Die Eigenfunktionen von σ 3 kennen wir bereits: σ 3 χ σ = σχ σ ,
σ = ±1
mit 1 χ1 = ( ) , 0
0 χ −1 = ( ) . 1
Mit dem Separationsansatz ϕ(x) = φ σ (x)χ σ ,
(28.77)
wobei φ σ (x) eine gewöhnliche skalare Wellenfunktion ist, reduziert sich dann die Dirac-Gleichung (28.76) auf c2 π 2 φ σ (x) = (E2 − (mc2 )2 + σℏc|q|B) φ σ (x) .
(28.78)
Diese Gleichung hat dieselbe mathematische Struktur wie die nichtrelativistische Schrödinger-Gleichung für eine Punktladung im homogenen Magnetfeld (22.22) π 2 φNR (x) = 2mENR φNR (x) ,
(28.79)
deren Lösungen die Landau-Niveaus sind, die wir bereits in Kapitel 22 gefunden ha ben. Zur Unterscheidung von dem Dirac-Teilchen haben wir die nichtrelativistischen
230 | 28 Relativistische Quantenmechanik
Energieeigenwerte und Wellenfunktionen mit einem Index „NR“ gekennzeichnet. Vergleich von Gln. (28.78) und (28.79) liefert für die Eigenenergien des Dirac-Teil chens im konstanten Magnetfeld B: E2 = (mc2 )2 − σℏc|q|B + 2mc2 ENR ,
(28.80)
während die Wellenfunktion φ σ (x) (der oberen Komponenten des Dirac-Spinors, sie he Gln. (28.71), (28.77)) dieselbe ist wie die Wellenfunktion des entsprechenden nicht relativistischen Landau-Niveaus φ σ (x) = φNR (x) ,
σ = ±1 ,
(28.81)
und zwar sowohl für σ = 1 als auch für σ = −1. Die nichtrelativistischen LandauNiveaus ENR hatten wir in Abschnitt 22.4.1 auf eichinvariante Weise bestimmt: ‖
ENR = E k + E⊥n , ‖
Ek =
(ℏk ‖ )2 , 2m
E⊥n = ℏωc (n +
1 ) , 2
ωc =
|q|B , mc
(28.82)
wobei ℏk ‖ der Impuls der Punktladung parallel zur Richtung des B-Felds und n = 0, 1, 2, . . . die Quantenzahl eines eindimensionalen harmonischen Oszillators in der Ebene senkrecht zum B-Feld ist. Mit (28.82) erhalten wir aus (28.80) für die relativisti schen Landau-Niveaus: E2 = (mc2 )2 + c2 (ℏk ‖ )2 + |q|Bℏc(2n + 1 − σ) .
(28.83)
Der erste Term ist die Ruheenergie, der zweite die kinetische Energie für die (freie) Bewegung parallel zum B-Feld und der letzte Term die Energie der Bewegung in der Ebene senkrecht zum B-Feld. Nur dieser Term hängt vom B-Feld ab. Ziehen wir die Wurzel aus (28.83), so erhalten wir die Energieeigenwerte des Dirac-Hamilton-Opera tors (28.70) E = ±√(mc2 )2 + c2 (ℏk ‖ )2 + |q|Bℏc(2n + 1 − σ) =: ±E σnk‖ .
(28.84)
Während die Energieeigenwerte ENR und somit E eichinvariant sind, hängen die Wel lenfunktionen von der Eichung ab. Ferner sind die Landau-Niveaus unendlichfach entartet. Je nach der gewählten Eichung besitzt die Oszillatorquantenzahl n eine an dere Interpretation und der Entartungsgrad zeigt sich in unterschiedlicher Form, d. h. in unterschiedlichen Quantenzahlen. Wählen wir die Coulomb-Eichung und das Eich potenzial in der asymmetrischen Form A = Bxe y ,
(28.85)
so ist die nichtrelativistische Wellenfunktion der Punktladung q durch (siehe Ab schnitt 22.4.2) φNR (x) ≡ φNR (x, y, z) = e ik⊥ y+ik‖ z ⟨x − x0 |n⟩ =: φ nk⊥ k‖ (x)
(28.86)
28.8 Ladung im Magnetfeld | 231
gegeben, wobei |n⟩ die gewöhnlichen Eigenfunktionen des eindimensionalen harmo nischen Oszillators sind (siehe Gln. (12.51), (12.63), (12.65)), der bei x0 =
cℏk ⊥ |q|B
lokalisiert ist und mit der Zyklotronfrequenz ωc (28.82) schwingt. In der Ortsdar stellung sind diese Funktionen durch die Hermite-Polynome H n (Q) gegeben, siehe Gl. (12.66): 1 2 1 H n (Q)e− 2 Q , ⟨x − x0 |n⟩ = φ n (Q) = √2n n!xc √π wobei Q=
x − x0 xc
(28.87)
und xc = √
ℏ ℏc =√ mωc |q|B
die zu ωc gehörige Oszillatorlänge ist. Mit (28.81) und (28.86) finden wir für die oberen Komponenten (28.77) der Wellen funktionen (Dirac-Spinoren) (28.71) ϕ σnk⊥ ,k‖ (x) = χ σ φ nk⊥ k‖ (x) . Die zugehörigen unteren Komponenten ergeben sich dann aus (28.72) mit E = ±E σnk n (28.84) und der expliziten Form (28.85) des Eichpotenzials, für welches π = p− qB c xe y . Dies führt auf die folgenden vier orthogonalen Dirac-Spinor-Wellenfunktionen 1 0
( ( (±) (±) ( ψ σ=1,nk⊥ k‖ (x) = N1 ( ( (
cℏk ‖ ±E1,nk‖ + mc2
−i (
) ) ) ) φ nk⊥ k‖ (x) , ) )
d cℏ dx + qB(x − x0 )
±E1,nk‖ + mc2
) (28.88)
0 1 ( ) ( ) (±) (±) ( cℏ d − qB(x − x ) ) 0 ) φ nk k (x) . ψ σ=−1,nk⊥ k‖ (x) = N−1 ( dx ⊥ ‖ (−i ) ( ±E−1,nk‖ + mc2 ) (
−
cℏk ‖ ±E−1,nk‖ + mc2 ) (±)
Der Einfachheit halber haben wir hier qB > 0 vorausgesetzt. Ferner sind N±1 Normie (±) rungskonstanten. Die ψ σnk⊥ k‖ gehören zu den Energieeigenwerten E = ±E σnk‖ .
232 | 28 Relativistische Quantenmechanik
Die Ableitung, siehe Gl. (28.87), d 1 d = dx xc dQ lässt sich elementar mittels der bekannten Beziehung der Hermite-Funktionen (siehe die Formel vor Gl. (12.71)) d φ n (Q) = √2nφ n−1 (Q) − Qφ n (Q) dQ nehmen. Dies liefert mit (28.87) [ℏ
d qB ± (x − x0 )] φ n (Q) dx c d ℏ ± Q] φ n (Q) = [ xc dQ ℏ √ [ 2nφ n−1 (Q) − Qφ n (Q) ± Qφ n (Q)] = xc ℏ √ = [ 2nφ n−1 (Q) − (1 ∓ 1)Qφ n (Q)] . xc
Für das untere Vorzeichen erhalten wir mit der Beziehung (siehe Kapitel 12 vor Gl. (12.70)) √2Qφ n (Q) = √n + 1φ n+1 (Q) + √nφ n−1 (Q) den Ausdruck √2nφ n−1 (Q) − 2Qφ n (Q) = −√2(n + 1)φ n+1 (Q) . Damit finden wir für die Wellenfunktionen (28.88) der relativistischen Landau-Niveaus φ n (Q) ( ( (±) (±) ( ψ σ=1,nk⊥ k‖ (x) = N1,nk‖ ( ( (
0 cℏk ‖ φ n (Q) ±E1,nk‖ + mc2
) ) ) ik⊥ y+ik‖ z , )e ) )
√2nℏcqB −i φ n−1 (Q) ( ±E1,nk‖ + mc2 ) (28.89) 0 φ n (Q) ( ) ( ) ( √2(n + 1)ℏcqB (±) (±) ) ik⊥ y+ik‖ z ψ σ=−1,nk⊥ k‖ (x) = N−1,nk‖ (i . e φ n+1 (Q)) ( ) 2 ( ±E−1,nk‖ + mc ) (
−
cℏk ‖ φ n (Q) ±E−1,nk‖ + mc2 )
28.9 Nichtrelativistischer Limes der Dirac-Gleichung
| 233
Unter Berücksichtigung der Orthonormalität der Oszillatoreigenfunktionen, ∞
∞
∫ dx φ∗n (Q)φ m (Q) ≡ ∫ dx φ∗n ( −∞
−∞
x x ) φ m ( ) = δ nm , xc xc
können wir die Wellenfunktionen (28.89) auf (τ)†
(τ )
∫ d3 xψ σ,nk⊥ k‖ (x)ψ σ ,n k k (x) = δ ττ δ σσ δ nn (2π)2 δ(k ⊥ − k ⊥ )δ(k ‖ − k ‖ ) ⊥ ‖
normieren. Dies liefert für die Normierungskonstanten (±)
Nσ,nk‖ = √
±E σnk‖ + mc2 . ±2E σ,nk‖
28.9 Nichtrelativistischer Limes der Dirac-Gleichung: Die Pauli-Gleichung Im Folgenden wollen wir die Dirac-Gleichung für den Fall untersuchen, dass das ge ladene Teilchen sich langsam bewegt, d. h., dass die kinetische Energie klein ist im Vergleich zur Ruheenergie. Betrachten wir dazu die Dirac-Gleichung bei Anwesenheit eines äußeren elektromagnetischen Felds: q [ ] iℏ∂ t Ψ = [cα⋅(p − A) +βmc2 + qA0 ] Ψ . ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ c π [ ] Im nichtrelativistischen Limes ist die größte aller Energien auf der rechten Seite die ser Gleichung durch die Ruheenergie mc2 gegeben. Diese Ruheenergie induziert da mit die stärkste zeitliche Oszillation der Wellenfunktion. Diese Oszillation ist jedoch uninteressant, wenn wir uns für die Evolution der Wellenfunktion aufgrund der kine tischen bzw. potenziellen Energie des Teilchens interessieren, die beide klein gegen über der Ruheenergie im nichtrelativistischen Limes sind. Der uninteressante Phasen i 2 faktor e− ℏ mc t kann von der Wellenfunktion absepariert werden, wenn wir ähnlich wie beim Übergang vom Schrödinger-Bild zum Wechselwirkungsbild vorgehen und eine neue Wellenfunktion i 2 ϕ Ψ = e− ℏ mc t ( ) (28.90) χ definieren. Mit diesem Ansatz nimmt die Dirac-Gleichung unter Benutzung der expli ziten Darstellung (28.39) der α i und β die Gestalt ϕ ϕ 0 cσ⋅π χ iℏ∂ t ( ) = ( ) + qA0 ( ) − 2mc2 ( ) χ χ χ cσ⋅π ϕ
(28.91)
234 | 28 Relativistische Quantenmechanik
an. Wie wir sehen, ist es uns gelungen, den Massenterm für die oberen Komponen ten zu beseitigen. Es tritt jedoch jetzt die doppelte Ruheenergie in der Gleichung für die untere Komponente auf, die jedoch klein im Vergleich zur oberen Komponente ist. Dieser Massenterm muss nicht zu einer sehr raschen Oszillation der unteren Kompo nente führen, falls er durch den kinetischen Term, der die große Komponente ϕ im unteren Teils des Spinors enthält, kompensiert wird. Unter den Voraussetzungen (im Sinne der Vektornorm) iℏ∂ t χ ≪ 2mc2 χ ,
Φχ ≪ 2mc2 χ
(28.92)
führt die untere Komponente der Dirac-Gleichung (28.91) auf die Beziehung χ=
σ⋅π ϕ. 2mc
(28.93)
Für kleine Geschwindigkeiten v = π/m, |v| ≪ c, ist die untere Komponente χ gegen über der oberen Komponente ϕ mit dem Faktor |v|/c unterdrückt. Somit ist die untere Komponente χ in der Tat klein gegenüber der oberen Komponente ϕ, was die Bezeich nung von χ als kleine Komponente rechtfertigt. Wenn wir ferner die zeitliche Ableitung der Gl. (28.93) nehmen, so erkennen wir, dass in der Tat v ∂t χ ∼ ∂t ϕ c eine kleine Größe ist, da die Ruhemasse mc2 nicht zur zeitlichen Änderung von ϕ beiträgt und somit die Voraussetzung (28.92) iℏ∂ t χ ≪ 2mc2 χ durch die genäherte Lösung (28.93) erfüllt wird. Setzen wir die Beziehung (28.93) in die Gleichung für die obere Komponente in (28.91) ein, so nimmt diese die Gestalt iℏ
(σ⋅π)(σ ⋅π) ∂ ϕ=[ + qA0 ] ϕ ∂t 2m
(28.94)
an. Für ein verschwindendes Vektorpotenzial A = 0 ⇒ π = p reduziert sich diese Gleichung auf die gewöhnliche (nichtrelativistische) Schrödinger-Gleichung iℏ∂ t ϕ = (
p2 + qA0 ) ϕ , 2m
die für jede Komponente des Spinors ϕ=(
ϕ1 ) ϕ2
(28.95)
unabhängig erfüllt sein muss. Für A ≠ 0 benutzen wir die Beziehung (28.75) und er halten für den nichtrelativistischen Limes der Dirac-Gleichung (28.94) iℏ∂ t ϕ = [
qℏ π2 − σ⋅B + qA0 ] ϕ , 2m 2mc
π=p−
q A. c
(28.96)
28.9 Nichtrelativistischer Limes der Dirac-Gleichung
| 235
Diese Gleichung wird als Pauli-Gleichung bezeichnet. Sie beschreibt eine nichtrela tivistische Punktladung q mit Spin 1/2 im elektromagnetischen Feld. Man beachte, dass ϕ (28.95) ein zweikomponentiger Spinor ist und den beiden oberen Komponen ten des Dirac-Spinors (28.90) entspricht. Diese sind durch das Magnetfeld gekoppelt.¹⁸ Durch den Wegfall der beiden unteren Komponenten χ reduziert sich der Spin-Opera tor (28.63) auf den nichtrelativistischen Spin S=
ℏ σ. 2
Neben dem gewöhnlichen kinetischen Term 2
(p − qc A) π2 = , 2m 2m
(28.97)
den ein spinloses geladenes Teilchen in einem äußeren magnetischen Feld besitzt, tritt in der Pauli-Gleichung noch die Kopplung des Spins an das äußere Magnetfeld auf: qℏ q σ⋅B = S⋅B . (28.98) 2mc mc Ein analoger Kopplungsterm zwischen dem Bahndrehimpuls L und Magnetfeld B ist in dem kinetischen Term (28.97) enthalten. Um dies zu erkennen, betrachten wir der Einfachheit halber ein homogenes Magnetfeld B = const, für welches wir in Abschnitt 22.3 die Beziehung π 2 (x) ≡ (p −
q q q2 2 A(x)) ≡ p2 − L⋅B + 2 A2 (x) c c c
abgeleitet hatten. Für ein schwaches B-Feld kann der letzte Term vernachlässigt wer den, sodass q π 2 = p2 − L⋅B . c Der Hamilton-Operator in der Pauli-Gleichung (28.96) h=
qℏ π2 − σ⋅B + qA0 (x) 2m 2mc
(28.99)
vereinfacht sich dann zu: h= =
p2 q − (L + ℏσ)⋅B + qA0 (x) 2m 2mc p2 q − (L + 2S)⋅B + qA0 (x) . 2m 2mc
(28.100)
18 Bei Abwesenheit eines Magnetfelds, B = 0, gibt es im Hamilton-Operator (28.96) keine σ-abhän gigen Terme, welche die beiden Spinorkomponenten ϕ 1 und ϕ 2 koppeln.
236 | 28 Relativistische Quantenmechanik
Wie wir explizit sehen, koppelt der halbzahlige Spin doppelt so stark an das äußere Magnetfeld wie der ganzzahlige Bahndrehimpuls. Diese Tatsache hatten wir bereits in Kapitel 14 gefunden. Wie oben gezeigt, folgt sie zwangsläufig aus der Dirac-Gleichung. Die Kopplung an den Bahndrehimpuls hatten wir in Abschnitt 22.3 in der Form q L⋅B = μ l ⋅B 2mc
(28.101)
geschrieben, wobei
q L (28.102) 2mc das magnetische Moment des Bahndrehimpulses bezeichnet. In Analogie zu Gl. (28.101) schreiben wir den Kopplungsterm (28.98) des Spins an das Magnetfeld in der Form q S⋅B = μ s ⋅B , mc wobei q μs = S (28.103) mc als magnetisches Moment des Spins bezeichnet wird. Um das von Spin und Bahndrehimpuls erzeugte magnetische Moment in einer einheitlichen Notation zu erfassen, schreibt man allgemein das magnetische Moment μ j , welches durch einen beliebigen Drehimpuls J erzeugt wird, in der Form μl =
μj = gj
q J, 2mc
wobei der Faktor g j als Landé-Faktor bezeichnet wird. Vergleich mit Gln. (28.102), (28.103) zeigt:¹⁹ gl = 1 , gs = 2 . Die oben als nichtrelativistischer Limes der Dirac-Gleichung abgeleitete Pauli-Glei chung liefert automatisch für ein Spin 1/2 den korrekten Landé-Faktor g s = 2, wäh rend für einen ganzzahligen (Bahn-)Drehimpuls die nichtrelativistische Beziehung g l = 1 gilt. Ersetzen wir in der Pauli-Gleichung (28.96) den exakten Hamilton-Operator (28.99) durch den genäherten Ausdruck (28.100), so finden wir die Bewegungsglei chung für eine Punktladung q mit Spin s = 1/2, die sich in einem schwachen, homo genen Magnetfeld B = ∇ × A mit Geschwindigkeiten bewegt, die klein gegenüber der Lichtgeschwindigkeit sind:
iℏ
∂ p2 q ϕ=[ − (L + 2S)⋅B + qA0 ] ϕ . ∂t 2m 2mc
19 Ursprünglich wurde nur das Verhältnis g s /g l = 2 nach seinem Entdecker als Landé-Faktor be zeichnet.
28.10 Elektron im Coulomb-Potenzial | 237
Hierbei ist S = ℏσ/2 und ϕ=(
ϕ1 ) ϕ2
ein gewöhnlicher (nichtrelativistischer) Spinor (ϕ1 und ϕ2 sind die Wellenfunktio nen für die Spinkomponenten m s = ±1/2). Wie die obige Ableitung zeigt, folgt diese Gleichung im nichtrelativistischen Limes aus der Dirac-Gleichung für ein schwaches, konstantes Magnetfeld, wenn Terme der Ordnung A2 (x) vernachlässigt werden kön nen. Die Pauli-Gleichung (28.96) hingegen gilt für eine nichtrelativistische Ladung mit Spin 1/2 in einem beliebigen (auch starken und inhomogenen) Magnetfeld.
28.10 Elektron im Coulomb-Potenzial Die stationäre Dirac-Gleichung (28.43) lässt sich exakt für eine Punktladung im Cou lomb-Potenzial lösen. Im Folgenden tun wir dies für ein Elektron im Coulomb-Poten zial des Atomkerns Ze2 V(r) = − . (28.104) 4πr Für qA0 = V(r) und A = 0 lautet der Dirac-Hamilton-Operator (28.69) h = cα⋅p + βmc2 + V(r) .
28.10.1 Punktmasse im Zentralpotenzial Wir betrachten zunächst die stationäre Dirac-Gleichung für ein beliebiges (skalares) Potenzial V(r). Nach Division durch ℏc lautet diese (−iα⋅∇ + βμ + v(r)) φ = ϵφ ,
(28.105)
wobei wir die skalierten Größen ϵ=
E , ℏc
μ=
mc2 mc = , ℏc ℏ
v(r) =
V(r) ℏc
(28.106)
eingeführt haben. Zur Lösung der Dirac-Gleichung (28.105) benutzen wir zweckmäßi gerweise die chirale Darstellung der Dirac-Matrizen α=(
σ 0
0 ) , −σ
0 β=( −𝟙
−𝟙 ) 0
und drücken den Dirac-Spinor φ durch zwei gewöhnliche (nichtrelativistische) Spi noren ϕ± aus, ϕ+ φ=( ) , ϕ−
238 | 28 Relativistische Quantenmechanik
für welche wir dann die gekoppelten Gleichungen (ϵ − v(r) + iσ⋅∇) ϕ+ = −μϕ− , (ϵ − v(r) − iσ⋅∇) ϕ− = −μϕ+
(28.107)
erhalten. Vertauschung von ϕ+ ←→ ϕ− in diesen Gleichungen ist äquivalent zur Er setzung σ → (−σ). Definieren wir die Operatoren Q± := ϵ − v(r) ± iσ⋅∇ ,
(28.108)
so lassen sich die Gleichungen (28.107) in der kompakten Form Q± ϕ± = −μϕ∓
(28.109)
schreiben. Wir multiplizieren diese Gleichung mit Q∓ und erhalten Q∓ Q± ϕ± = μ 2 ϕ± .
(28.110)
Dies sind zwei entkoppelte Gleichungen für die Spinoren ϕ± . Die beiden Gleichungen (28.110) sind nicht mehr äquivalent zur Dirac-Gleichung (28.109).²⁰ Durch die Multiplikation der letzteren mit Q ∓ haben wir deren Lösungen auf den Raum projiziert, der senkrecht auf dem Kern von Q ∓ steht. Jede Lösung von (28.109) ist zwar auch Lösung von (28.110), jedoch sind die Lösungen ϕ± von (28.110) i. A. noch keine Lösungen von (28.109). Wir können aber für²¹ μ ≠ 0 sehr einfach aus den Lösungen ϕ± der entkoppelten Gleichungen (28.110) die Lösungen der Dirac-Glei chung (28.109) gewinnen, indem wir die Lösungen ϕ± von (28.110) auf der linken Seite von (28.109) einsetzen und von der rechten Seite die zugehörigen ϕ∓ gewinnen. Dies liefert die beiden Lösungen der Dirac-Gleichung ϕ+ − 1 Q− ϕ− ψ=( 1 ) , ψ=( μ ) , − μ Q+ ϕ+ ϕ− wobei ϕ± Lösungen der Gl. (28.110) sind. Die Operatoren Q ± sind zwar hermitesch Q †± = Q ± , aber vertauschen nicht miteinander [Q − , Q + ] = 2 [iσ⋅∇, v(r)] = 2iσ⋅∇v(r) . Mit (Q ∓ Q ± )† = Q ± Q ∓ folgt aus (28.110) die adjungierte Gleichung ϕ†± Q ± Q ∓ = μ2 ϕ†± .
(28.111)
Vergleich von (28.111) mit (28.110) zeigt, dass zu einem rechtsseitigen Eigenvektor ϕ± von Q ∓ Q ± der linksseitige Eigenvektor ϕ†∓ gehört. Deshalb muss als Norm ϕ†∓ ϕ± gewählt werden.
20 Für die Bestimmung der Energieeigenwerte ist dieser Umstand irrelevant. 21 Für μ = 0 entkoppeln die beiden Gleichungen (28.107).
28.10 Elektron im Coulomb-Potenzial |
239
Mit dem expliziten Ausdruck (28.108) für Q± lautet Gl. (28.110) ((ϵ − v(r)) 2 + (σ⋅∇)2 ± [iσ⋅∇ , v(r)]) ϕ± = μ 2 ϕ± . Mit
(σ⋅∇)2 = ∇2 = ∆ ,
̂ (r) , ∇v(r) = xv
[σ⋅∇, v(r)] = σ⋅(∇v(r)) , x x x̂ = = |x| r
vereinfacht sich diese Gleichung weiter zu [(ϵ − v(r)) 2 + ∆ ± iv (r)x̂ ⋅σ] ϕ± = μ 2 ϕ± .
(28.112)
Über die Ableitung des Potenzials koppelt der Spin an die Bahnbewegung. Bereits für ein freies Dirac-Teilchen hatten wir festgestellt, dass Drehimpuls L und Spin S = 2ℏ σ nicht separat erhalten bleiben, sondern nur der Gesamtdrehimpuls J =L+S
(28.113)
erhalten ist. Daran ändert sich nichts durch die Anwesenheit des Zentralpotenzials V(r), da dieses mit L kommutiert und außerdem unabhängig vom Spin ist. In der Tat zeigt man leicht analog zum Abschnitt 28.7, in welchem [J, α ⋅ p] = 0 gezeigt wurde, dass [J, σ⋅∇] = 0 und somit [J, Q± ] = 0 . Damit lassen sich die Spinorlösungen ϕ± der Dirac-Gleichung durch die Quantenzah len von J 2 und J z klassifizieren. Die Spinorkugelfunktionen Im Folgenden bestimmen wir die Eigenfunktionen zum Gesamtdrehimpuls J, J 2 |jm⟩ = ℏ2 j(j + 1)|jm⟩ , J z |jm⟩ = ℏm|jm⟩ . Wir kennen bereits die Eigenfunktionen des Drehimpulses L2 |lm l ⟩ = ℏ2 l(l + 1)|lm l ⟩ ,
L z |lm l ⟩ = ℏm|lm l ⟩ ,
die in der Ortsdarstellung durch die Kugelfunktionen ⟨x|lm l ⟩ = Y lm (x)̂ gegeben sind. Ebenso sind die Eigenfunktionen des Spins, S 2 |sm s ⟩ = ℏ2 s(s + 1)|sm s ⟩ , S z |sm s ⟩ = ℏm s |sm s ⟩ ,
240 | 28 Relativistische Quantenmechanik
bekannt; für s =
1 2
lauten sie 1 | 12 m s = 12 ⟩ = ( ) , 0
0 | 12 m s = − 12 ⟩ = ( ) . 1
(28.114)
Durch elementare Drehimpulskopplung, siehe Abschnitt 15.7, können wir hieraus die Eigenfunktionen zum Gesamtdrehimpuls J gewinnen, |l, jm⟩ = ∑ ⟨lm l , 12 m s |jm⟩|lm l ⟩| 12 m s ⟩ ,
(28.115)
m s ,m l
wobei ⟨lm l , sm s |jm⟩ die Clebsch-Gordan-Koeffizienten sind. Nach der Dreiecks relation (15.76) ist die Quantenzahl j auf die Werte j=l±
1 2
beschränkt. (Wir erinnern hier daran, dass j ≥ 0 und somit für l = 0 nur j = möglich ist.) Die Ortsdarstellung der Drehimpulseigenfunktionen (28.115)
1 2
l ̂ jm⟩ = ∑ ⟨lm l , 12 m s |jm⟩Y lm l (x)| ̂ 12 m s ⟩ Y jm (x)̂ := ⟨x|l, m s ,m l
wird als Spinorkugelfunktion bezeichnet. Mit den expliziten Werten der ClebschGordan-Koeffizienten ⟨lm l , 12 m s |jm⟩ (siehe Tab. 28.1) und der expliziten Form der Spineigenfunktionen (28.114) erhalten wir für die Spinorkugelfunktionen l=j− 1 Y jm 2
l=j+ 1 Y jm 2
√j + m 1 = ( √2j √j − m
Y j− 12 ,m− 12
) ,
Y j− 12 ,m+ 12
−√j − m + 1 1 = ( √2j + 2 √j + m + 1
Y j+ 12 ,m− 12
) .
Y j+ 12 ,m+ 12
l (x)̂ = ⟨x|l, jm⟩ Eigenfunktionen von J 2 , J z , L2 , S 2 Per Konstruktion sind die Y jm (jedoch nicht von L z , S z )
J 2 |l, jm⟩ = ℏ2 j(j + 1)|l, jm⟩ , J z |l, jm⟩ = ℏm|l, jm⟩ , L2 |l, jm⟩ = ℏ2 l(l + 1)|l, jm⟩ , S 2 |l, jm⟩ = ℏ2 21 ( 12 + 1) |l, jm⟩ ,
(28.116)
28.10 Elektron im Coulomb-Potenzial | 241
und erfüllen die Orthonormierungsbedingung ∗
l (Ω)] Y jl m (Ω) = δ ll δ jj δ mm . ⟨l, jm|l , j m ⟩ = ∫dΩ [Y jm
(28.117)
Beachten wir, dass [L k , S l ] = 0 (da die Operatoren L k und S k in unterschiedlichen Hilbert-Räumen wirken), erhalten wir durch Quadrieren von Gl. (28.113) ℏσ⋅L = 2S⋅L = J 2 − L2 − S 2 und somit aus Gl. (28.116) 2L⋅S|l, jm⟩ = ℏ2 [j(j + 1) − l(l + 1) −
3 ] |l, jm⟩ . 4
Weitere nützliche Beziehungen der Ortsdarstellung der Spinorkugelfunktionen, die wir ohne Beweis angeben, sind j± 1
j∓ 1
2 2 ̂ ̂ ̂ x⋅σY jm (x) = −Y jm (x) ,
j± 1
rσ⋅∇Y jm2 (x)̂ = ∓ (j +
1 2
j∓ 1
(28.118)
± 1) Y jm2 (x)̂ .
Tab. 28.1: Die Clebsch-Gordan-Koeffizienten ⟨lm l , 12 m s |jm⟩ für die Kopplung eines Spins s = 1/2 mit dem Bahndrehimpuls l zum Gesamtspin j. ms =
j
1 2
m s = − 12
1/2
( j−m ) 2j
l+
1 2
( j+m ) 2j
l−
1 2
− ( j−m+1 2j+2 )
1/2
(
1/2
j+m+1 1/2 2j+2 )
28.10.2 Lösung der Dirac-Gleichung für das Coulomb-Potenzial Die obigen Umformungen gelten allgemein für beliebige Zentralpotenziale. Wir be trachten jetzt das Coulomb-Potenzial (28.104), für das v(r) = −
Zα . r
Hierbei ist α die Feinstrukturkonstante α=
e2 1 = , 4πℏc μa
(28.119)
242 | 28 Relativistische Quantenmechanik
wobei μ die skalierte Masse (28.106) und a der Bohr’sche Atomradius (18.7) ist. Wie für Zentralpotenziale üblich drücken wir den Laplace-Operator in Kugelkoordinaten aus (17.6) L2 1 ∆ = ∂2r r − 2 2 r ℏ r und erhalten aus Gl. (28.112) nach elementaren Umformungen [−
1 2 K± Zα ∂r r + 2 − 2 ϵ] ϕ± = (ϵ2 − μ2 ) ϕ± , r r r
(28.120)
wobei wir die Abkürzung K± =
1 2 L − Z 2 α 2 ∓ iZα x̂ ⋅σ ℏ2
(28.121)
eingeführt haben.²² Dieser Operator kommutiert mit sämtlichen Operatoren in den Klammern von Gl. (28.120). Die Lösungen dieser Gleichungen können deshalb als Ei genvektoren von K± gewählt werden, die sich algebraisch bestimmen lassen. Dazu führen wir zunächst den Operator Λ± = M ± iZα x̂ ⋅σ mit M =1+
(28.122)
1 L⋅σ ℏ
ein. Durch elementare Rechnungen zeigt man unter Ausnutzung der Kommutations beziehung (15.11) und der Eigenschaften der Pauli-Matrizen, dass ̂ ̂ =0. x⋅σM + M x⋅σ Mit dieser Beziehung und (x̂ ⋅σ)2 = 1 folgt Λ2± = M 2 − (Zα)2 . Unter Ausnutzung von Gl. (28.74) und der Drehimpulsalgebra (15.10) findet man (L⋅σ)2 = L2 − ℏL⋅σ , womit M2 = M +
L2 ℏ2
22 Wird der letzte Term ∼ x̂ ⋅ σ in K± vernachlässigt, geht Gleichung (28.120) in die Klein-GordonGleichung für eine Punktladung q = −e im elektrostatischen Coulomb-Potenzial über. Dies ist nicht verwunderlich, da dieser Term gerade die gesamte Kopplung der Bahnbewegung an den Spin enthält.
28.10 Elektron im Coulomb-Potenzial | 243
folgt. Damit gilt Λ2± =
L2 − (Zα)2 + M , ℏ2
(28.123)
woraus mit (28.122) unmittelbar Λ± (Λ± − 1) = Λ2± − Λ± =
L2 ̂ = K± − (Zα)2 ∓ iZα x⋅σ ℏ2
(28.124)
folgt. Damit lassen sich die Eigenwerte von K± durch die von Λ± ausdrücken. Letztere lassen sich aber sehr einfach ermitteln. Wir bestimmen zunächst die Eigenwerte des Operators Λ2± (28.123), den wir in der Form 1 [(L + S)2 − S 2 ] + 1 − (Zα)2 ℏ2 1 1 = 2 J 2 + − (Zα)2 4 ℏ
Λ2± =
schreiben. Hierbei haben wir S = ℏσ/2 und S 2 = ℏ2 s(s + 1) = 3ℏ2 /4 benutzt. Da die Eigenfunktion |ϕ± ⟩ ≡ |ϕ± (jm)⟩ guten Gesamtdrehimpuls besitzt J 2 |ϕ± (jm)⟩ = ℏ2 j(j + 1)|ϕ± (jm)⟩ finden wir Λ2± |ϕ± (jm)⟩ = [j(j + 1) + = [(j +
1 − (Zα)2 ] |ϕ± (jm)⟩ 4
1 2 ) − (Zα)2 ] |ϕ± (jm)⟩ . 2
Die Eigenwerte von sowohl Λ+ als auch Λ− lauten deshalb ±√(j +
1 2 ) − (Zα)2 . 2
Nach (28.124) ergeben sich dann die Eigenwerte von K± |ϕ(jm)⟩ = k(j)|ϕ(jm)⟩ zu k(j) = √(j +
1 2 1 2 ) − (Zα)2 (√(j + ) − (Zα)2 ± 1) . 2 2
(28.125)
Man beachte, dass diese Eigenwerte für die beiden Matrizen K+ (j) und K− (j) dieselben sind.²³ (Ihre Eigenvektoren sind jedoch verschieden.)
23 Das ± Zeichen in der zweiten Klammer von Gl. (28.125) hat nichts mit dem Index ± von K± zu tun!
244 | 28 Relativistische Quantenmechanik
Die Eigenwerte von K± (28.121) lassen sich auch sehr leicht durch Diagonalisierung im Raum der Spinorkugelfunktionen (28.115) finden: Die Beziehung (28.118) zeigt, dass der Operator K± (28.121) in der Basis der Spinorkugelfunk tionen nicht diagonal ist. Die übrigen Terme in der Dirac-Gleichung (28.120) hängen weder vom Dreh impuls L noch vom Spin σ, sondern allein vom Radius r = |x| ab. Die Matrix K± kann deshalb separat im Raum der Spinorkugelfunktionen (28.115) diagonalisiert werden. Unter Benutzung der Eigenwert gleichungen (28.116) und der Beziehungen (28.118) und (28.117) finden wir für die Matrixelemente dieses Operators ⟨l, jm|K± |l , j m ⟩ = δ jj δ mm [δ ll (l(l + 1) − Z 2 α 2 ) ± iZα (δ l,l +1 + δ l,l −1 )] =: δ jj δ mm (K± (j))ll .
(28.126)
Diese Matrixelemente sind unabhängig von der Projektion des Drehimpulses m. Für festes j, m müs sen wir deshalb die (2 × 2)-Matrix (28.126) in den Indizes l, l = j ∓ 12 (j − 12 ) (j + 12 ) − Z 2 α 2 K± (j) = ( ±iZα
±iZα a ) =: ( ±ib (j + 12 ) (j + 32 ) − Z 2 α 2
±ib ) c
diagonalisieren. Die Eigenwerte dieser Matrix lauten k(j) =
a+c √ a−c 2 ± ( ) − b2 2 2
= (j +
1 2 1 2 ) − Z 2 α 2 ± √ (j + ) − Z 2 α 2 2 2
= √ (j +
1 2 1 2 ) − Z 2 α 2 (√ (j + ) − Z 2 α 2 ± 1) 2 2
und stimmen mit den in Gl. (28.125) gegebenen Ausdrücken überein.
Die Eigenwerte (28.125) lassen sich in der Form k(j) = λ(λ + 1)
(28.127)
schreiben mit λ=j±
1 − δj , 2
δj = j +
1 √ 1 2 − (j + ) − Z 2 α 2 . 2 2
(28.128)
Beachten wir, dass
1 (28.129) 2 die beiden möglichen Drehimpulsquantenzahlen für gegebenes j sind, so haben wir l=j±
λ = l − δj .
(28.130)
Wir können deshalb die beiden Eigenwerte k(j) (28.127), (28.130) der Matrix K± (neben j noch) durch die Quantenzahl l (28.129) charakterisieren k(j) ≡ k(j, l). Die zugehöri gen Eigenvektoren bezeichnen wir mit |ϕ± (j, l)⟩. Sie sind zweikomponentige Spinoren und genügen der Eigenwertgleichung K± |ϕ± (j, l)⟩ = λ(λ + 1)|ϕ± (j, l)⟩ .
28.10 Elektron im Coulomb-Potenzial |
245
Mit dem Ansatz
1 ± ̂ ± (j, l)⟩ u (r)⟨x|ϕ r jl reduziert sich Gl. (28.120) auf die Radialgleichung ϕ± (x) =
(−∂2r +
λ(λ + 1) Zα −2 ϵ) u jl (r) = (ϵ2 − μ2 ) u jl (r) . 2 r r
(28.131)
Die l-Abhängigkeit des Ausdrucks auf der linken Seite entsteht durch die Größe λ (28.130). Gleichung (28.131) hat dieselbe Form wie die radiale Schrödinger-Gleichung für ein Elektron im Coulomb-Potenzial (18.11) (−∂2r +
l(l + 1) Z α̃ 2m ̃ ̃ l (r) = 2 E −2 μ) u ũ l (r) . 2 r r ℏ
(28.132)
̃ statt α Aus didaktischen Gründen haben wir hier die Feinstrukturkonstante mit α bezeichnet und auch die Energieeigenwerte sowie die Radialwellenfunktion mit ei ner Tilde versehen. Der Operator auf der linken Seite der Schrödinger-Gleichung (28.132) geht in den der Dirac-Gleichung (28.131) über, wenn wir die Ersetzun gen ℏ ϵ ̃=α =α ϵ (28.133) l→λ, α μ mc vornehmen, mit denen dann die Beziehungen ϵ2 − μ2 =
2m ̃ E, ℏ2
̃ λ (r) u jl (r) = u
(28.134)
folgen. Die radiale Schrödinger-Gleichung (28.132) konnten wir durch den Potenzreihen ansatz (18.16), (18.18) kmax
̃ l (r) ∼ r l+1 e−κr ∑ c k r k , u
κ=
k=0
1√ ̃ −2m E ℏ
lösen, wobei für gebundene Zustände wegen ihrer Normierbarkeit die Potenzreihe bei einem endlichen kmax abbrechen musste, was auf die Abbruchbedingung Z α̃ μ ! = k max + l + 1 =: n κ
(28.135)
̃ darstellt und aus der führte, die eine Quantisierungsbedingung an die Energien E die quantisierten Energieeigenwerte 2 ̃ n = − 1 mc2 α̃ 2 Z E 2 2 n
folgten.
(28.136)
246 | 28 Relativistische Quantenmechanik
Analog zur Schrödinger-Gleichung (28.122) können wir die radiale Dirac-Gleichung (28.131) durch den Ansatz kmax
u jl (r) ∼ r λ+1 e−κr ∑ c k r k
(28.137)
k=0
lösen, was analog zur Gleichung (28.135) auf die Abbruchbedingung ̃μ ! Zα = k max + λ + 1 =: ñ κ
(28.138)
führt. Mit dem expliziten Ausdruck (28.130) für λ sowie der Definition (28.135) von n haben wir (28.139) ñ = n − δ j . ̃ ñ , die aus Die Quantisierungsbedingung (28.138) liefert die Energieeigenwerte E Gl. (28.136) durch die Ersetzung n → ñ hervorgehen 2 2 2 ̃ ñ = − 1 mc2 α̃ 2 Z = − 1 mc2 ( ϵ ) ( αZ ) , E ̃ n 2 2 μ ñ 2
(28.140)
wobei wir wieder gemäß (28.133) α̃ = αϵ/μ eingesetzt haben. Aus Gl. (28.134) finden wir dann für die quantisierten Energien der Dirac-Gleichung ϵ2 = μ2 +
2m ̃ E ñ . ℏ2
Setzen wir hier den Ausdruck (28.140) ein, so erhalten wir nach elementaren Umfor mungen und Benutzung von μ = mc/ℏ (28.106) μ
ϵ=
. 2
√1 + ( αZ ̃ ) n
Für die dimensionsbehaftete Energie (28.106) E = ℏcϵ finden wir hieraus mit den ex pliziten Ausdrücken für ñ (28.139) und δ j (28.128)
E nj
Zα 2 = mc [1 + ( )] n − δj
− 12
2
− 12
2
[ = mc2 [ [1 + ( [
Zα 2
n − (j + 12 ) + √(j + 12 ) − (Zα)2
] )] ] ]
.
(28.141)
28.10 Elektron im Coulomb-Potenzial | 247
Im Gegensatz zu den nichtrelativistischen Energien (28.136) hängen die relativisti schen Energieeigenwerte (28.141) neben der Hauptquantenzahl n auch vom Gesamt drehimpuls j ab. Sie hängen jedoch nicht zusätzlich von der Drehimpulsquantenzahl l ab. Die Aufspaltung der Energieniveaus mit verschiedenen j zum selben n wird durch 2 in der Dirac-Gleichung (28.120), (28.121) hervor ̂ die Spin-Bahn-Kopplung ∓iZα x⋅σ/r gerufen und als Feinstrukturaufspaltung bezeichnet. Wie aus Gl. (28.141) ersichtlich, liegen für festes n die Zustände mit größeren j generell energetisch höher. Da die Quan tenzahl l = j ± 12 die Werte l = 0, 1, . . . , n − 1 annimmt (siehe Gl. (28.135)), ergeben sich für den Gesamtdrehimpuls j = l ∓ Werte 1 3 1 j = , ,⋅ ⋅ ⋅, n − . 2 2 2
1 2
die
Jedes Energieniveau E nj ist (2j + 1)-fach in der Drehimpulsprojektion entartet. Dies ist die übliche Konsequenz der Rotationsinvarianz des Hamilton-Operators, [J, h] = 0. Darüber hinaus sind die Zustände mit j ≤ n − 32 noch zweifach entartet, sodass sich insgesamt folgender Entartungsgrad ergibt 2j + 1
für
j=n−
1 , 2
2(2j + 1)
für
j≤n−
3 . 2
Man überprüft leicht, dass die Gesamtzahl der Zustände zu einem festen n gerade 2n2 beträgt, wie in der nichtrelativistischen Theorie: n− 32
n−2
j= 12
k=0
2 ∑ (2j + 1) + (2j + 1)|j=n− 12 = 2 ∑ (2k + 2) + 2n =4
(n − 2)(n − 1) + 4(n − 1) + 2n = 2n2 . 2
Das exakte Spektrum der Dirac-Gleichung (28.141) ist in Abb. 28.5 für die Haupt quantenzahlen n = 1, 2, 3 illustriert. Dabei ist für die Quantenzahl l, siehe Gl. (28.129), die übliche spektroskopische Notation für den Drehimpuls benutzt worden, d. h., die Quantenzahlen l = 0, 1, 2 sind mit den Buchstaben s, p und d bezeichnet. Wir be tonen jedoch, dass die Eigenzustände der Dirac-Gleichung keinen guten Drehimpuls tragen und die in Gl. (28.129) eingeführte Quantenzahl l formal nur der Unterschei dung der beiden Eigenwerte der Matrix K± dient. Dass sie dieselben Werte wie der Bahndrehimpuls für ein Teilchen mit Spin 12 bei vorgegebenen Gesamtdrehimpuls j annimmt, ist als Zufall zu betrachten. Im nichtrelativistischen Limes hingegen wird l die Quantenzahl des dann erhaltenen Bahndrehimpuls.
248 | 28 Relativistische Quantenmechanik
n=3
n=2
{ { {
p 3/2 s1/2
d 5/2 d 3/2
p 1/2
p 3/2
{
s1/2
p 1/2
s1/2
n=1
Abb. 28.5: Schematische Darstellung der Elektronenniveaus des Wasserstoffatoms gemäß der Lö sung der Dirac-Gleichung für die Hauptquantenzahlen n = 1, 2 und 3.
Schließlich geben wir in Tab. 28.2 die analytischen Ausdrücke der niedrigsten Energieeigenwerte an. Die Energie des Grundzustands verschwindet für Z = 1/α ≃ 137 . Die Bindungsenergie durch das Coulomb-Potenzial ist dann so groß wie die Ruheener gie. Für Z > 1/α wird die Energie des Grundzustands imaginär, was auf eine Instabili tät des Vakuums (d. h. des besetzten Dirac-Sees) bei Anwesenheit starker elektrischer Felder hindeutet. Für real existierende Kerne ist jedoch α ⋅ Z < 1. Darüber hinaus be sitzen reale Kerne eine endliche Ausdehnung. Wird diese im Coulomb-Potenzial be rücksichtigt, verschiebt sich das kritische Z zu größeren Werten. Tab. 28.2: Die untersten Energieniveaus im Coulomb-Potenzial. n 1s1/2 2s1/2
1 2
l
j
E nj /(mc 2 )
0
1 2
√1 − (Zα)2
0
1 2
}√ 1+√1−(Zα)2 } 2 } √4 − (Zα)2
2p 1/2
2
1
1 2
2p 3/2
2
1
3 2
Die Lösungen der Dirac-Gleichungen liefern noch nicht die experimentellen Elektro nenniveaus. Diese werden noch durch die Anregung virtueller Elektron-Positron-Paa re verschoben. Diese sogenannte Lamb-Shift wird im Rahmen der Quantenfeldtheo rie erklärt und führt zu einer Aufspaltung der Niveaus mit gleichem Gesamtdrehim
28.10 Elektron im Coulomb-Potenzial |
249
puls j einer Hauptschale n. Darüber hinaus wechselwirken die Elektronen noch mit dem magnetischen Moment der Atomkerne, was zur sogenannten Hyperfeinstruktur aufspaltung führt. Der Effekt der verschiedenen Beiträge zu den Elektronenniveaus ist schematisch in Abb. 28.6 für die Hauptschale n = 2 dargestellt.
Schro¨dingerGleichung
Feinstruktur (Dirac-Gl.)
Lamb-Shift
Hyperfeinstruktur
n = 2, l = 0, 1 2p3/2
2s1/2 2s1/2, 2p1/2
2p1/2
Abb. 28.6: Schematische Darstellung der verschiedenen Beiträge zu den Energieniveaus des Elek trons im Wasserstoffatom. Die Lamb-Shift-Aufspaltung wurde zur besseren Darstellung um einen Faktor 2, die Hyperfeinstrukturaufspaltung um einen Faktor 4 gegenüber der Feinstrukturaufspal tung vergrößert.
Entwicklung des Ausdrucks (28.141) nach Potenzen von Zα liefert E nj = mc2 {1 −
(Zα)2 (Zα)4 1 3 − ( − ) + O ((Zα)6 )} . 2n2 2n3 j + 12 4n
Der erste Term ist hier die Ruheenergie, der zweite liefert die nichtrelativistischen Energieeigenwerte der Schrödinger-Gleichung, alle weiteren Terme sind relativisti sche Korrekturen. Abbildung 28.7 zeigt die Energieniveaus der (n = 2)-Hauptschale, die durch Lösen der Schrödinger-, Dirac- und Klein-Gordon-Gleichung erhalten wer den. In der Schrödinger-Theorie fehlt die Aufspaltung der 2s-, 2p-Niveaus, sie liegen jedoch dichter an dem Ergebnis der Dirac-Theorie als die der Klein-Gordon-Gleichung. Die radiale Wellenfunktion der Dirac-Gleichung (28.131) lässt sich analog zu der Schrödinger-Gleichung (28.132) durch einen Potenzreihenansatz (28.137) mit der Ab bruchbedingung (28.138) bestimmen. Darauf soll jedoch hier verzichtet werden. Abschließend sei bemerkt, dass auch die Dirac-Gleichung im Rahmen der ge wöhnlichen Quantenmechanik noch zu weiteren Inkonsistenzen führt. Als Beispiel sei das Klein’sche Paradoxon genannt: In gewissen Situationen (Potenzialschwellen in der Größenordnung der Ruheenergie) liefert die Dirac-Gleichung Transmissions koeffizienten, die größer als eins sind, was als Hinweis auf Paarerzeugung verstanden
250 | 28 Relativistische Quantenmechanik
2s, 2p 2p3/2 2p 10.9 GHz
2s1/2, 2p1/2 29.2 GHz
2s Schro¨dinger
Dirac
Klein-Gordon
Abb. 28.7: Vergleich der (n = 2)-Energieniveaus von Schrödinger-, Dirac- und Klein-Gordon-Glei chung.
werden kann. Die Existenz von Antiteilchen und die damit verbundene Paarerzeugung und -vernichtung lassen sich jedoch nicht im Rahmen einer Einteilchen-Quantenme chanik beschreiben, sondern erfordern eine relativistische Vielteilchentheorie, die durch die Quantenfeldtheorie geliefert wird. Sie vereinheitlicht die Quantentheorie mit der speziellen Relativitätstheorie und bildet die Grundlage für die Theorie der Elementarteilchen.
29 Adiabatische Beschreibung: Die Berry-Phase In vielen wechselwirkenden Systemen treten mehrere charakteristische Zeitskalen auf. Ein typisches Beispiel sind die Moleküle, in denen sich die Atomkerne aufgrund ihrer sehr viel größeren Masse viel langsamer als die Elektronen bewegen. In erster Näherung können die Atomkerne als statisch betrachtet werden. Wir können deshalb zunächst die Elektronen für ruhende Atomkerne beschreiben, was offenbar eine we sentliche Vereinfachung liefert, und erst in einem zweiten Schritt die (langsame) Be wegung der Atomkerne betrachten. Dies ist die sogenannte adiabatische¹ Näherung, die ursprünglich im Zusammenhang mit den Molekülen von M. Born und R. Oppen heimer eingeführt wurde und als Born-Oppenheimer-Approximation bezeichnet wird. Die Moleküle sind nur ein Beispiel für Systeme, in denen langsame und schnel le Freiheitsgrade gleichzeitig auftreten und miteinander wechselwirken. Ein anderes bekanntes Beispiel sind die stark deformierten Atomkerne, deren kollektive Bewegun gen wie Rotation und Vibration oder Spaltung langsam gegenüber der Bewegung der einzelnen Nukleonen erfolgen. In vielen Fällen interessiert man sich nur für die Bewe gung der langsamen Freiheitsgrade, die experimentell leichter zu untersuchen ist. Die Bewegung der langsamen Freiheitsgrade wird durch ihre Wechselwirkungen mit den schnellen Freiheitsgraden jedoch verändert. In diesem Kapitel wollen wir den Einfluss der schnellen Freiheitsgrade auf die langsamen Freiheitsgrade in einer adiabatischen Beschreibung untersuchen. Dazu werden wir zunächst anhand eines einfachen ein dimensionalen Beispiels den Unterschied zwischen adiabatischen und nichtadiaba tischen Bewegungen erläutern.
29.1 Adiabatische Prozesse Wir betrachten einen Behälter, der aus zwei Kammern besteht. Die eine Kammer sei mit einem Gas gefüllt, das sich im thermodynamischen Gleichgewicht befindet; in der anderen herrsche Vakuum, siehe Abb. 29.1a. Wird die Trennwand zwischen den bei den Kammern plötzlich entfernt oder ein Ventil in der Trennwand geöffnet, kommt es zur irreversiblen Expansion des Gases. Dabei verrichtet dieses keine Arbeit und seine Energie bleibt erhalten.² Wir betrachten jetzt einen ähnlichen Behälter, jedoch mit einer beweglichen Trennwand, z. B. einen Zylinder mit einem beweglichen Kolben. Der Zylinder sei wär
1 Der Begriff „adiabatisch“ stammt ursprünglich aus der Thermodynamik und bedeutet dort „ohne Austausch von Wärme“. In der Quantenmechanik wird der Begriff „adiabatisch“ zweckentfremdet als Synonym für „quasistatisch“ benutzt. 2 Für die irreversible Expansion eines idealen Gases ist es irrelevant, ob der Behälter isoliert ist oder sich in einem Wärmebad befindet. https://doi.org/10.1515/9783110586077-007
252 | 29 Adiabatische Beschreibung: Die Berry-Phase
(a)
(b)
Abb. 29.1: Anordnung (a) zur irreversiblen schnellen Expansion und (b) zur reversiblen adiabati schen Expansion eines Gases.
meisoliert. Das Gas sei zunächst mittels des Kolbens komprimiert worden. Ferner sei der Kolben durch eine Feder mit der gegenüber liegenden Zylinderwand verbunden, siehe Abb. 29.1b. Geben wir nun die Feder frei, so kann sich das Gas durch Verschie ben des Kolbens entspannen. Dabei muss es jedoch gegen die Federkraft eine Arbeit verrichten, die dann als potenzielle Energie in der gespannten Feder gespeichert ist. Die Geschwindigkeit des Kolbens sei dabei so klein, dass sich das Gas zu jedem Zeit punkt im thermodynamischen Gleichgewicht befindet. Dieser reversible Prozess wird als adiabatisch³ bezeichnet. Allgemein nennt man in der Quantenmechanik einen Prozess adiabatisch, wenn die äußeren (makroskopischen) Freiheitsgrade (hier der Kolben) sich sehr langsam gegenüber den inneren (mikroskopischen) Freiheitsgraden (hier die Gasmoleküle) bewegen. Für die Gasmoleküle stellen die Gefäßwände unendlich hohe Potenzialwände dar. Wir wollen jetzt ein einzelnes Teilchen in einem solchen Potenzialtopf mit bewegli chen Potenzialwänden betrachten. Der Einfachheit halber beschränken wir uns auf einen eindimensionalen unendlich hohen Potenzialtopf mit einer beweglichen Wand, siehe Abb. 29.2. Die zeitabhängige Schrödinger-Gleichung für die Punktmasse in ei nem eindimensionalen unendlich hohen Potenzialtopf mit sich bewegenden Wänden lässt sich exakt lösen. Hier sind wir jedoch nicht an einer exakten Lösung interessiert, sondern nur an den Grenzfällen einer sich sehr langsam bzw. sehr schnell bewegen den Potenzialwand.
L0 (a)
x
L0 L (b)
x
L0 L
x
(c)
Abb. 29.2: Die Wellenfunktion eines Teilchens (a) im Grundzustand des unendlich hohen Poten zialtopfs der Breite L 0 , (b) nach einer adiabatischen und (c) nach einer plötzlichen Verbreiterung des Potenzialtopfs.
3 Dieser Prozess verläuft adiabatisch sowohl im Sinne der Thermodynamik als auch im Sinne der Quantenmechanik.
29.2 Die adiabatische Näherung | 253
Im Abschnitt 8.5 haben wir die exakten Eigenenergien und Eigenfunktionen des unendlich hohen Potenzialtopfs der Breite L gefunden, siehe Gln. (8.17) und (8.21): E n (L) =
ℏ2 nπ 2 ( ) , 2m L
φ n (x, L) = √
2 π sin (n x) , L L
n = 1, 2, 3, . . . .
Wir betrachten ein Teilchen, dass sich anfangs im Grundzustand φ1 (x, L) = √
2 π sin ( x) L L
des unendlich hohen Potenzialtopfs der Breite L(t = 0) = L0 befindet. Dieser Zustand ist eine stehende Welle mit Wellenzahl k = π/L bzw. Impuls p = ℏπ/L. Ein Teilchen mit diesem Impuls und der Masse m besitzt die Geschwindigkeit v = p/m = ℏπ/(mL). Wird die Potenzialwand mit einer Geschwindigkeit ̇ ≪v L(t) bewegt, so besitzt das Teilchen genügend Zeit, um den zur Breite L(t) gehörenden Grundzustand φ1 (x, L(t)) einzunehmen (adiabatische Bewegung). In diesem Zustand besitzt das Teilchen die Energie E1 (L(t)) =
1 ℏπ 2 ( ) , 2m L(t)
die offensichtlich bei einer Änderung der Potenzialbreite L(t) nicht erhalten bleibt. Bei einer adiabatischen Verbreiterung des Potenzialtopfs wird dem Teilchen Energie entzogen, ähnlich wie bei der reversiblen Expansion des Gases. Wird die Potenzialwand hingegen schnell bewegt, hat das Teilchen nicht genü gend Zeit, sich an die zeitlich verändernde Potenzialbreite anzupassen und verharrt (zumindest für eine gewisse Zeit) in dem ursprünglichen Grundzustand φ1 (x, L0 ), wo mit die Energie des Teilchens erhalten bleibt, wie bei der irreversiblen Expansion des Gases. Der Grundzustand des ursprünglichen Potenzialtopfs φ1 (x, L0 ) ist jedoch eine Überlagerung der Eigenzustände des Potenzialtopfs der Breite L(t) > L0 .
29.2 Die adiabatische Näherung Falls der Hamilton-Operator nicht von der Zeit abhängt, lässt sich die zeitabhängige Schrödinger-Gleichung d (29.1) iℏ |ψ(t)⟩ = H(t)|ψ(t)⟩ dt auf die stationäre Gleichung H|φ n ⟩ = E n |φ n ⟩ reduzieren und die gesamte Zeitabhängigkeit der Wellenfunktion steckt in einer Phase |ψ n (t)⟩ = e− ℏ E n t |φ n ⟩ . i
254 | 29 Adiabatische Beschreibung: Die Berry-Phase
Die instantanten Eigenwerte und Eigenzustände eines zeitabhängigen Hamilton-Ope rators H(t)|φ n (t)⟩ = E n (t)|φ n (t)⟩
(29.2)
hingegen besitzen eine nichttriviale Zeitabhängigkeit, liefern jedoch noch nicht die Lösung des zeitabhängigen Problems. Dennoch bilden diese Eigenfunktionen zu je dem festen Zeitpunkt t eine vollständige orthogonale Basis, sodass mit entsprechen der Normierung ⟨φ n (t)|φ m (t)⟩ = δ nm
(29.3)
gilt. Die allgemeine Lösung der zeitabhängigen Schrödinger-Gleichung (29.1) lässt sich folglich nach den instantanen Eigenfunktionen |φ n (t)⟩ entwickeln, t
|ψ(t)⟩ = ∑ c n (t)e− ℏ ∫0 dt E n (t ) |φ n (t)⟩ , i
(29.4)
n
wobei wir aus den Entwicklungskoeffizienten c n (t) die dynamische Phase t
i exp (− ∫dt E n (t )) ℏ
(29.5)
0
herausgezogen haben, die eine direkte Verallgemeinerung der gewöhnlichen stationä ren Phase exp(−itE n /ℏ) auf zeitabhängige Eigenwerte E n (t) ist. Einsetzen des Ansatzes (29.4) in die Schrödinger-Gleichung (29.1) liefert unter Ausnutzung der Eigenwertglei chung (29.2) t
∑ [ċ n (t)|φ n (t)⟩ + c n (t)|φ̇ n (t)⟩] e− ℏ ∫0 dt E n (t ) = 0 , i
n
wobei ein Punkt wie üblich die Ableitung nach der Zeit bezeichnet.⁴ Bilden wir von dieser Gleichung das Skalarprodukt mit ⟨φ m (t)|, so erhalten wir unter Ausnutzung der Orthonormierungsbedingung (29.3) ċ m (t) + ∑ c n (t)⟨φ m (t)|φ̇ n (t)⟩e− ℏ ∫0 dt (E n (t )−E m (t )) = 0 . i
t
(29.6)
n
Differentiation der Eigenwertgleichung (29.2) nach der Zeit liefert ̇ ̇ H(t)|φ n (t)⟩ + H(t)| φ̇ n (t)⟩ = E n (t)|φ n (t)⟩ + E n (t)| φ̇ n (t)⟩ .
4 Prinzipiell können die Phasen der Eigenfunktionen |φ n (t)⟩ zu verschiedenen Zeiten t willkürlich gewählt werden. Wir werden jedoch hier voraussetzen, dass die Phasen so gewählt wurden, dass die |φ n (t)⟩ differenzierbare Funktionen der Zeit sind.
255
29.2 Die adiabatische Näherung |
Nach skalarer Multiplikation dieser Gleichung mit ⟨φ m (t)| folgt unter Ausnutzung der Eigenwertgleichung (29.2) und der Orthonormiertheit (29.3) ̇ ̇ ⟨φ m (t)|H(t)|φ n (t)⟩ + E m (t)⟨φ m (t)| φ̇ n (t)⟩ = E n (t)δ nm + E n (t)⟨φ m (t)| φ̇ n (t)⟩ . Hieraus finden wir für m ≠ n ̇ ⟨φ m (t)|H(t)|φ n (t)⟩ = (E n (t) − E m (t)) ⟨φ m (t)| φ̇ n (t)⟩ . Einsetzen dieser Beziehung in Gl. (29.6) liefert ċ m (t) + c m (t)⟨φ m (t)|φ̇ m (t)⟩ + ∑ c n (t) n=m ̸
̇ ⟨φ m (t)|H(t)|φ n (t)⟩ − ℏi ∫t dt (E n (t )−E m (t )) e 0 =0. E n (t) − E m (t)
Diese Gleichung ist exakt und damit äquivalent zur zeitabhängigen Schrödinger-Glei ̇ chung (29.1). Wir werden jetzt voraussetzen, dass H(t) klein ist und dass keine Entar tung im Spektrum von H(t) (über das gesamte betrachtete Zeitintervall) auftritt. Dann können wir den letzten Term, der die verschiedenen Eigenzustände |φ n (t)⟩ mischt, vernachlässigen, was als adiabatische Näherung bezeichnet wird, und erhalten ċ m (t) + c m (t)⟨φ m (t)|φ̇ m (t)⟩ = 0 . Diese Gleichung besitzt die Lösung c m (t) = c m (0)e iγ m (t) ,
(29.7)
wobei t
γ m (t) = ∫dt ⟨φ m (t )|i
d |φ m (t )⟩ . dt
(29.8)
0
Wird das System so präpariert, dass es sich zum Zeitpunkt t = 0 in einem Eigenzustand |ψ(t = 0)⟩ = |φ n (t = 0)⟩ befindet, d. h. c n (0) = 1 ,
c m=n̸ (0) = 0 ,
so finden wir mit (29.7) für die Wellenfunktion zum späteren Zeitpunkt aus Gl. (29.4) t
|ψ(t)⟩ = e iγ n (t) e− ℏ ∫0 dt E n (t ) |φ n (t)⟩ . i
(29.9)
In der hier betrachteten adiabatischen Näherung verweilt damit das Teilchen in dem (zeitabhängigen) Eigenzustand |φ n (t)⟩, erhält jedoch neben der erwarteten dynami schen Phase (29.5) noch eine zusätzliche zeitabhängige Phase, die wir noch etwas genauer untersuchen werden. In der adiabatischen Näherung gibt es folglich keine Übergänge zwischen den verschiedenen Eigenzuständen |φ n (t)⟩.
256 | 29 Adiabatische Beschreibung: Die Berry-Phase
29.3 Die Berry-Phase Die adiabatische Beschreibung ist gewöhnlich für solche Systeme anwendbar, in de nen zwei sehr verschiedene Zeitskalen vorliegen. Die Freiheitsgrade lassen sich dann in langsame und schnelle unterteilen. Die Koordinaten der langsamen Freiheitsgrade bezeichnen wir im Folgenden mit R i , i = 1, 2, . . . , d, und fassen sie zu einem Vektor R = (R1 , R2 , . . . , R d ) zusammen. Wir betrachten die R(t) zunächst als klassische, zeitabhängige Koordina ten. Der Hamilton-Operator der schnellen Freiheitsgrade H(t) = H(R(t)) hängt über die Koordinaten R(t) der langsamen Freiheitsgrade parametrisch von der Zeit ab. Dasselbe gilt für die instantanen Eigenwerte E n (t) = E n (R) und Eigenfunk tionen |φ n (t)⟩ = |n(R)⟩, vgl. Gl. (29.2), H(R)|n(R)⟩ = E n (R)|n(R)⟩ ,
(29.10)
die der Orthonormierungsbedingung (29.3) ⟨n(R)|m(R)⟩ = δ nm genügen. Wir betonen hier, dass die Eigenwertgleichung (29.10) keinerlei Phasenbe ziehungen zwischen den |n(R)⟩ bei verschiedenen R impliziert. Die Phasen der Zu stände |n(R)⟩ können für jeden Wert des Parameters R unabhängig und beliebig ge wählt werden.
29.3.1 Die geometrische Phase Wir setzen voraus, dass die Bewegung adiabatisch erfolgt, d. h., die Koordinaten R(t) verändern sich so langsam, dass keine Übergänge zwischen verschiedenen |n(R)⟩ er folgen. Wird das System der schnellen Freiheitsgrade anfangs in einem Eigenzustand |n(R(t = 0))⟩ präpariert, so verbleibt es auch zu allen späteren Zeiten in diesem Zu stand |n(R(t))⟩. Unter dieser Voraussetzung ist die zeitabhängige Wellenfunktion der schnellen Freiheitsgrade durch Gl. (29.9) gegeben t
|ψ(t)⟩ = e iγ n (t) e− ℏ ∫0 dt E n (R(t )) |n(R(t))⟩ . i
Unter Benutzung der Kettenregel ̇ ∂ t |n(R)⟩ = R(t)⋅∇ R |n(R)⟩
(29.11)
29.3 Die Berry-Phase
| 257
erhalten wir für die Phase (29.8) t
̇ )⋅⟨n(R)|∇ R |n(R)⟩R=R(t ) γ n (t) = i ∫dt R(t 0 R(t)
= i ∫ dR⋅⟨n(R)|∇ R |n(R)⟩ .
(29.12)
R(0)
Die langsamen Freiheitsgrade sind oft makroskopischer Natur oder lassen sich zumin dest häufig semiklassisch behandeln. Für gebundene Systeme führen sie periodische Bewegungen aus. Wir sind deshalb hier hauptsächlich an einer periodischen Zeitevo lution der langsamen Koordinaten R(t + T) = R(t) interessiert, wobei T die Periode ist. Für eine periodische Bewegung beschreibt der Vektor R(t) eine geschlossene Kurve C, siehe Abb. 29.3. Für eine geschlossene Periode der langsamen Freiheitsgrade erhalten wir für die Phase (29.12): γ n (T) = i∮dR ⋅ ⟨n(R)|∇ R |n(R)⟩ .
(29.13)
C
Gibt es nur einen sich langsam ändernden Parameter R = R1 , über den die Wellen funktion |n(R)⟩ von der Zeit abhängt, so verschwindet die Phase γ n (29.12), nachdem das System in den Ausgangszustand zurückgekehrt ist. Eine nicht verschwindende Phase γ n (29.13) verlangt also, dass der Koordinatenraum der langsamen Freiheitsgra de R(t) mindestens zweidimensional ist. Für d ≥ 2 verschwindet das Linienintegral entlang eines geschlossenen Wegs C im Parameterraum ℝd gewöhnlich nicht.
Σ R(t) C R3
R2 R1
Abb. 29.3: Geschlossene Kurve C, die bei einer periodischen Bewegung von R(t) im Parameterraum ℝ3 durchlaufen wird.
Es stellt sich allgemein die Frage, inwieweit die Phase γ n (t) (29.12) überhaupt für die physikalischen Eigenschaften des Systems relevant ist. Sie ist sicher nicht relevant für Observablen, die ausschließlich von den Koordinaten der schnellen (inneren) Freiheitsgrade abhängen, da sie aus deren Erwartungswerten herausfällt. Die Phase
258 | 29 Adiabatische Beschreibung: Die Berry-Phase (29.12) bzw. (29.13) hängt jedoch von den Koordinaten R(t) der langsamen Freiheits grade ab. Im Abschnitt 29.6 werden wir sehen, dass die Phase γ n (T) einen Zusatzterm zur klassischen Wirkung der langsamen Freiheitsgrade liefert und folglich deren Be wegung beeinflusst. M. Berry war der erste, der erkannte, dass die Phase (29.13) selbst für geschlossene Trajektorien i. A. nicht verschwindet. Deshalb wird sie zu Recht auch Berry-Phase genannt. Wie wir später sehen werden, hängt γ n von der Geometrie der Trajektorie R(t) ab und wird deshalb auch als geometrische Phase bezeichnet. Sie kann sehr wesentlich die physikalischen Eigenschaften eines Systems beeinflussen. Geometrische (Berry-)Phasen tauchen immer dann auf, wenn ein isoliertes Sys tem aus zwei miteinander wechselwirkenden Teilen besteht, die wesentlich verschie dene Zeitskalen besitzen, und die langsamen Freiheitsgrade einer adiabatischen Be schreibung unterworfen werden. Die Berry-Phase entsteht durch die Kopplung der langsamen Freiheitsgrade an die schnellen Freiheitsgrade. Sie resultiert ursprünglich aus der Wellenfunktion der schnellen Freiheitsgrade. Da sie jedoch von den Koordina ten der langsamen Freiheitsgrade abhängt, muss sie als Bestandteil der Wellenfunk tion der langsamen Freiheitsgrade betrachtet werden. Sie repräsentiert den Effekt der schnellen inneren Freiheitsgrade auf die langsame adiabatische Bewegung.
29.3.2 Das Berry-Potenzial Bisher haben wir die schwach zeitabhängigen Parameter R(t) als klassische Koordi naten betrachtet. In vielen Fällen sind diese Parameter jedoch die Koordinaten quan tenmechanischer Freiheitsgrade. (Im oben betrachteten Beispiel der Moleküle sind die R(t) die Schwerpunktskoordinaten der Atomkerne.) Wir betrachten deshalb ein quantenmechanisches System langsamer und schneller Freiheitsgrade, R und x, mit Massen M und m, die durch ein Potenzial V(x, R) gekoppelt sind: Htot =
p2 P2 + + V(x, R) , 2M 2m
P=
ℏ ∇R , i
p=
ℏ ∇x . i
Das Potenzial V(x, R) kann neben den Kopplungstermen auch Potenziale enthalten, die ausschließlich von den Koordinaten der langsamen oder ausschließlich von den Koordinaten der schnellen Freiheitsgrade abhängen. Für die adiabatische Beschrei bung empfiehlt es sich, den Potenzialterm mit in den Hamilton-Operator der inneren (schnellen) Freiheitsgrade p2 H(R) = + V(x, R) (29.14) 2m einzubeziehen, sodass Htot = H0 + H(R) ,
H0 = −
ℏ2 2 ∇ . 2M R
(29.15)
Dieser Hamilton-Operator ist zeitunabhängig, falls V(x, R) keine explizite Zeitabhän gigkeit besitzt, was wir voraussetzen und was gewöhnlich auch der Fall ist. Die exakte
29.3 Die Berry-Phase
|
259
Wellenfunktion |φ(R)⟩ des wechselwirkenden Gesamtsystems Htot |φ(R)⟩ = Etot |φ(R)⟩
(29.16)
kann nach den Eigenfunktionen |n(R)⟩ (29.10) der inneren Freiheitsgrade entwickelt werden⁵: |φ(R)⟩ = ∑ ϕ n (R)|n(R)⟩ . n
Einsetzen dieses Ausdrucks in (29.16) liefert unter Benutzung der Eigenwertgleichung (29.10) −
ℏ2 ∑ ∇2 |n(R)⟩ϕ n (R) + ∑ E n (R)|n(R)⟩ϕ n (R) = Etot ∑ |n(R)⟩ϕ n (R) . 2M n R n n
(29.17)
Im kinetischen Term haben wir unter Ausnutzung der Vollständigkeit der |n(R)⟩: ∇ R [|n(R)⟩ϕ n (R)] = (|n(R)⟩∇ R + [∇ R |n(R)⟩]) ϕ n (R) = ∑ |m(R)⟩ [δ mn ∇ R + ⟨m(R)|∇ R |n(R)⟩] ϕ n (R) .
(29.18)
m
Im Abschnitt 29.2 hatten wir festgestellt, dass bei einer adiabatischen Bewegung keine Übergänge zwischen verschiedenen inneren Zuständen |φ n (t)⟩ ≡ |n(R(t))⟩ stattfinden. In der hier betrachteten stationären Beschreibung besteht die adiabatische Näherung folglich darin, dass nichtdiagonale Matrixelemente von ∇ R vernachlässigt werden ⟨m(R)|∇ R |n(R)⟩ ≈ 0 ,
m ≠ n .
Mit dieser Näherung vereinfacht sich Gl. (29.18) zu ∇R [|n(R)ϕ n (R)] = |n(R)⟩ [∇ R + ⟨n(R)|∇ R |n(R)⟩] ϕ n (R) . Nochmalige Benutzung dieser Beziehung mit der Ersetzung ϕ n (R) → [∇R + ⟨n(R)|∇ R |n(R)⟩] ϕ n (R) liefert ∇2R [|n(R)⟩ϕ n (R)] = |n(R)⟩ [∇R + ⟨n(R)|∇ R |n(R)⟩]2 ϕ n (R) . Setzen wir diesen Ausdruck in (29.17) ein und benutzen die Orthogonalität der |n(R)⟩, so erhalten wir schließlich die (stationäre) Schrödinger-Gleichung für die Wellenfunk tion ϕ n (R) der langsamen Freiheitsgrade ̃ n ϕ n (R) = Etot ϕ n (R) H
(29.19)
5 Die bracket-Darstellung bezieht sich hier nur auf die schnellen Freiheitsgrade, während wir für die langsamen Freiheitsgrade die Ortsdarstellung benutzen.
260 | 29 Adiabatische Beschreibung: Die Berry-Phase
mit einem effektiven Hamilton-Operator 2 ̃ n = − ℏ [∇R + ⟨n(R)|∇ R |n(R)⟩]2 + E n (R) . H 2M
(29.20)
Dies ist formal der Hamilton-Operator einer Punktladung q = ℏc (in einem (skalaren) Potenzial E n (R) und) in einem Magnetfeld, das durch das Vektorpotenzial⁶ An (R) = i⟨n(R)|∇ R |n(R)⟩
(29.21)
erzeugt wird, siehe Gl. (22.15). Die Kopplung an die schnellen Freiheitsgrade erzeugt nicht nur ein Potenzial E n (R) (bzw. modifiziert dieses), sondern induziert auch ein Vektorpotenzial für die langsamen Freiheitsgrade. Dies ist sehr bemerkenswert. Das Auftauchen eines Eichpotenzials in der kinetischen Energie weist auf eine lokale Eichinvarianz hin. Tatsächlich induziert eine R-abhängige Phasenänderung von |n(R)⟩, |n(R)⟩ → e −iΛ(R) |n(R)⟩ , eine Änderung des Eichpotenzials, An (R) → An (R) + ∇R Λ(R) ,
(29.22)
die wiederum durch eine entsprechende Phasentransformation der Funktion ϕ n (R), ϕ n (R) → e iΛ(R) ϕ n (R) ,
(29.23)
kompensiert werden kann, sodass die Wellenfunktion des Gesamtsystems, |φ(R)⟩ = ϕ n (R)|n(R)⟩ , insgesamt lokal (im R-Raum) phaseninvariant ist. Wie man sofort erkennt, ist Gl. (29.22) nichts wei ter als eine gewöhnliche (aus der Elektrodynamik bekannte) Eichtransformation, siehe Gl. (22.3). Die Schrödinger-Gleichung (29.19) ist offenbar invariant unter der gleichzeitigen Eichtransformation des Eichpotenzials (29.22) und der Wellenfunktion (29.23).
Mit Hilfe des induzierten Eichpotenzials (29.21) lässt sich die Berry-Phase (29.12) um schreiben zu: R(t)
t
̇ ) = ∫ dR⋅A n (R) , γ n (t) = ∫dt An (R(t ))⋅ R(t
0
R(0)
6 Da die Ladung q = ℏc nicht die übliche Dimension besitzt, hat auch A nicht die übliche Dimension, sondern die einer inversen Länge im Parameterraum.
29.3 Die Berry-Phase
|
261
weshalb An (R) (29.21) auch als Berry-Potenzial bezeichnet wird. Aus dieser Darstel lung ist offensichtlich, dass die Berry-Phase durch die Kopplung der betrachteten langsamen Freiheitsgrade an die schnellen und Eliminierung der letzteren in der adiabatischen Näherung entsteht. Dieser Zusammenhang zeigt sich sehr klar in der Pfadintegralableitung der Berry-Phase bzw. des induzierten Eichpotenzials, die im Abschnitt 29.6 gegeben wird. Für spätere Zwecke bemerken wir noch, dass das Vektorpotenzial (29.21) vollstän dig durch den Imaginärteil von ⟨n|∇ R |n⟩ gegeben ist, An (R) = −Im{⟨n(R)|∇ R |n(R)⟩} ,
(29.24)
da der Realteil Re{⟨n|∇ R |n⟩} wegen der Normierbarkeit der stationären Zustände |n(R)⟩ verschwindet.⁷
29.3.3 Das induzierte Magnetfeld Mit (29.21), (29.24) lautet die Berry-Phase (29.13) γ n (C) = ∮dR⋅A n (R) = −Im [∮dR⋅⟨n(R)|∇ R |n(R)⟩] . [C ] C
(29.25)
Direkte Berechnung der Berry-Phase bzw. des Eichpotenzials A n (R), d. h. des Aus drucks |∇ R n(R)⟩, verlangt differenzierbare Basiszustände |n(R)⟩ entlang einer ge schlossenen Schleife C im Parameterraum. Dies bezieht sich insbesondere auch auf die Phasen dieser Zustände. Als Eigenfunktionen von H(R) besitzen die adiabatischen Zustände |n(R)⟩ jedoch für jedes R i. A. eine willkürliche und damit nicht differen zierbare Phase. Für explizite Berechnungen erweist sich dies als ziemlich störend. Diese Schwierigkeit lässt sich umgehen, wenn man das Wegintegral entlang der ge schlossenen Trajektorie C in ein Oberflächenintegral über irgendeine von C begrenzte Fläche im Parameterraum umwandelt, siehe dazu Abb. 29.3. Um die gewöhnliche Vektoranalysis benutzen zu können, nehmen wir der Einfachheit halber an, dass der R-Parameterraum dreidimensional ist. Unter Benutzung des Satzes von Stokes erhalten wir aus (29.25) γ n (C) = ∫ dΣ⋅(∇ R × An (R)) = ∫ dΣ⋅B n , Σ
(29.26)
Σ
7 Aus ⟨n(R)|n(R)⟩ = 1 folgt unmittelbar 0 = ⟨∇R n(R)|n(R)⟩ + ⟨n(R)|∇R )n(R)⟩ = ⟨n(R)|∇R n(R)⟩∗ + ⟨n(R)|∇R n(R)⟩ . Damit Re⟨n(R)|∇R n(R)⟩ = 0 müssen allerdings die Zustände |n(R)⟩ nicht notwendigerweise auf 1 normiert sein. Es genügt offensichtlich bereits, dass diese Zustände normierbar sind.
262 | 29 Adiabatische Beschreibung: Die Berry-Phase wobei dΣ ein Flächenelement im Parameterraum ℝ3 bezeichnet und Σ eine Fläche mit Rand ∂Σ = C ist. Ferner ist B n (R) = ∇R × An (R) (29.27) das Magnetfeld zum induzierten Eichpotenzial (29.21). Mit (29.24) erhalten wir für die ses Bn = −Im∇R × ⟨n|∇ R n⟩ = −Im⟨∇ R n| × |∇R n⟩ + ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ ⟨n|∇ R × ∇ R |n⟩ =0
= −Im ∑ ⟨∇R n|m⟩ × ⟨m|∇R n⟩ .
(29.28)
m=n ̸
Zur Vereinfachung der Schreibweise haben wir die übliche Vektornotation auch für vektorielle Argumente in den bra- und ket-Zuständen benutzt: ⟨a| × |b⟩i := ϵ ijk ⟨a j |b k ⟩ ,
(⟨a|m⟩ × ⟨n|b⟩) i := ϵ ijk ⟨a j |m⟩⟨n|b k ⟩ .
Im letzten Schritt von Gl. (29.28) haben wir die Vollständigkeitsrelation der Zustän de |n(R)⟩ eingeschoben. Dabei können wir uns auf die Summation über die Zustände m ≠ n beschränken, da das Matrixelement ⟨n|∇ R n⟩ aufgrund der Normierung der sta tionären Zustände |n(R)⟩ rein imaginär ist. Wie gewöhnliche Magnetfelder ist das Feld (29.27) für differenzierbare Potenziale An (R) quellenfrei: ∇ R ⋅B n (R) = 0 .
(29.29)
Wir werden jedoch in Abschnitt 29.4.2 feststellen, dass das Berry-Potenzial auch ma gnetische Monopole (und allgemein magnetische Ladungen) besitzen kann und somit die Bianchi-Identität (29.29) verletzen kann. Wenden wir den ∇R -Operator auf Gl. (29.10) an und multiplizieren von links mit ⟨m|, so erhalten wir: ⟨m|∇ R |n⟩ =
⟨m|(∇ R H)|n⟩ , En − Em
m ≠ n .
Nach Einsetzen dieses Ausdrucks in (29.28) finden wir für das induzierte Magnetfeld ⟨n(R)|(∇ R H)|m(R)⟩ × ⟨m(R)|(∇ R H)|n(R)⟩ } (E m (R) − E n (R))2 m=n ̸
Bn (R) = −Im { ∑
(29.30)
In diesem Ausdruck geht nicht mehr die Ableitung der adiabatischen Zustände, ∇R |n(R)⟩, ein. Deshalb muss die Phase dieser Zustände |n(R)⟩ entlang des Wegs C nicht länger differenzierbar in R gewählt werden. Ferner sieht man unmittelbar, dass das Magnetfeld B n (R) (29.30) invariant gegenüber einer Änderung der Phase der Zustände |n(R)⟩ ist.
29.4 Spin im homogenen Magnetfeld | 263
29.4 Spin im homogenen Magnetfeld Die obigen allgemeinen Überlegungen zur Berry-Phase sollen jetzt anhand eines ein fachen Beispiels illustriert werden: Eine Punktladung q mit Masse M und Spin S ruhe an einem festen Ort und werde einem homogenen, aber zeitabhängigen Magnetfeld B(t) ausgesetzt. Der Hamilton-Operator der Punktladung (siehe Gln. (28.96, 28.98)) ist dann allein durch die Wechselwirkung ihres Spins S mit dem äußeren Magnetfeld B(t) gegeben H(B) =
q B⋅S . Mc
(29.31)
Für einen Spin s besitzt der Hamilton-Operator (29.31) die (2s + 1) Eigenwerte E m (B) =
qℏ mB , Mc
m = −s, −s + 1, . . . , s ,
wobei B = |B|. An der Stelle B = 0 haben wir eine (2s + 1)-fache Entartung. Der Einfachheit halber beschränken wir uns auf einen Spin s = 1/2: S=
ℏ σ, 2
wobei σ = (σ 1 , σ 2 , σ 3 ) die Pauli-Matrizen (15.44) sind. Nehmen wir an, dass sich das Magnetfeld B zeitlich langsam ändert. Dann können wir es mit den langsamen Para metern R des letzten Abschnitts identifizieren. Zweckmäßigerweise wählen wir diese als qℏ R= B, (29.32) 2Mc sodass der Hamilton-Operator (29.31) die einfache Form H(R) = R⋅σ
(29.33)
annimmt. Man beachte, dass die langsamen Parameter R i hier die Dimension einer Energie besitzen. Dies ist jedoch für die weiteren Überlegungen belanglos, da wir kei nerlei Voraussetzungen an die Dimensionalität der langsamen Parameter R gestellt haben.
29.4.1 Das Berry-Potenzial Mit R = (X, Y, Z) lautet der Hamilton-Operator (29.33) explizit: H(R) = Xσ 1 + Yσ 2 + Zσ 3 = (
Z X + iY
X − iY ) . −Z
(29.34)
264 | 29 Adiabatische Beschreibung: Die Berry-Phase Dies ist eine hermitesche (2 × 2)-Matrix, die sich folglich durch eine unitäre (2 × 2)Matrix diagonalisieren lässt. Da nur σ3 = (
1 0
0 ) −1
diagonal ist, wird bei der Diagonalisierung de facto der Vektor R = (X, Y, Z) in die 3-Richtung gedreht, was seine Länge nicht verändert. Deshalb sind die Eigenwerte von H (29.33) durch E± (R) = ±R ,
R = |R| = √X 2 + Y 2 + Z 2
(29.35)
gegeben. Die Entartung E± (R) = 0 verlangt offenbar, dass sämtliche drei Parame ter X, Y, Z verschwinden, was drei unabhängige Bedingungen impliziert. Dies zeigt, dass Entartungen nur an isolierten Punkten in einem dreidimensionalen Parameter raum auftreten können. Ist dieser Parameterraum Teil eines (d ≥ 3)-dimensionalen Parameterraums, so bleiben die oben durchgeführten Überlegungen offenbar auch in diesem dreidimensionalen Unterraum gültig. Isolierte Punkte in diesem dreidimensio nalen Unterraum entsprechen dann (d − 3)-dimensionalen Untermannigfaltigkeiten des d-dimensionalen Parameterraums. Dies zeigt, dass im (d ≥ 3)-dimensionalen Pa rameterraum Entartungen auf (d − 3)-dimensionalen Untermannigfaltigkeiten auftre ten. Unabhängig von der Dimension d des Parameterraums sind am Zustandekommen einer zufälligen Entartung (d. h. eine Entartung, die nicht aufgrund einer vorhande nen Symmetrie auftritt) stets drei Dimensionen beteiligt. Mathematisch ausgedrückt heißt dies, dass eine Entartung die Kodimension 3 besitzt. Sei V die unitäre (2 × 2)-Matrix, die H (29.33) diagonalisiert, d. h., es gelte: ̂ V † (σ⋅ R)V = σ3 ,
R R̂ = . R
(29.36)
Offensichtlich hängt V nur von der Richtung R̂ ab. Benutzen wir für R die üblichen sphärischen Koor dinaten (R, ϑ, φ), so ist die Matrix V durch V( R)̂ = exp (−i
ϑ σφ ) 2
(29.37)
gegeben, wobei σ φ = e φ ⋅σ = − sin φσ 1 + cos φσ 2 die σ-Matrix in Richtung von e φ ist. Die Matrix V( R)̂ (29.37) ist die Spin-(s = 1/2)-Darstellung des Drehoperators (26.30). Sie beschreibt die Drehung eines Spins s = 1/2 um den Winkel ϑ um die e φ -Achse und ist explizit durch cos ( ϑ2 ) ϑ ϑ V( R)̂ = cos ( ) − iσ φ sin ( ) = ( iφ 2 2 e sin ( ϑ2 )
−e −iφ sin ( ϑ2 ) ) cos ( ϑ2 )
gegeben. Die explizite Form von V( R)̂ werden wir im Folgenden nicht benötigen; die definierende Glei chung (29.36) ist für die folgenden Betrachtungen ausreichend.
29.4 Spin im homogenen Magnetfeld | 265
Aus den Eigenvektoren von σ 3 , σ 3 |±⟩ = ±|±⟩ ,
1 |+⟩ = ( ) , 0
0 |−⟩ = ( ) , 1
(29.38)
erhalten wir mit (29.36) die Eigenvektoren von H (29.34) ̂ = ±| ± (R)⟩ ̂ σ⋅ R|̂ ± (R)⟩
(29.39)
̂ = V(R)|±⟩ ̂ | ± (R)⟩ .
(29.40)
zu:
Damit finden wir für das Berry-Potenzial (29.21) den folgenden Ausdruck ̂ R V(R)|±⟩ ̂ . A± (R) = i⟨±|V † (R)∇
29.4.2 Das induzierte Magnetfeld Für den Hamiltonian (29.34) haben wir: ∇ R H(R) = σ . Mit dieser Beziehung und der expliziten Form der Eigenwerte (29.35) finden wir für das Magnetfeld (29.30) B± (R)̂ = −Im {
̂ ̂ × ⟨∓(R)|σ| ̂ ̂ ⟨±(R)|σ| ∓ (R)⟩ ± (R)⟩ } . 2 4R
(29.41)
̂ (29.40) lassen sich die Matrixelemente im Mit der Form der Eigenfunktionen | ± (R)⟩ Zähler leicht auswerten: ̂ ̂ × ⟨∓(R)|σ| ̂ ̂ ∓ (R)⟩ ± (R)⟩ M± := ⟨±(R)|σ| = ⟨±|V † σV|∓⟩ × ⟨∓|V † σV|±⟩ = Sp (σV|∓⟩ × ⟨∓|V † σV|±⟩⟨±|V † ) . Für die Projektoren auf die ungestörten Basiszustände (29.38) benutzen wir die Dar stellung 1 |±⟩⟨±| = (𝟙 ± σ 3 ) , 2 wobei 𝟙 die zweidimensionale Einheitsmatrix ist. Dies liefert: M± =
1 Sp (σ × V(𝟙 ∓ σ 3 )V † σV(𝟙 ± σ 3 )V † ) . 4
266 | 29 Adiabatische Beschreibung: Die Berry-Phase Beachten wir, dass V † V = 𝟙 und wegen (29.36) Vσ 3 V † = σ⋅ R̂ , so finden wir: M± =
1 ̂ ± σ × σ(σ⋅ R)̂ − σ(σ⋅ R)̂ × σ(σ⋅ R)) ̂ . Sp (σ × σ ∓ σ × (σ⋅ R)σ 4
Wegen σ × σ = i2σ und Sp σ = 0 verschwinden der erste Term und der letzte Term. Der zweite und dritte Term sind gleich aufgrund der zyklischen Eigenschaft der Spur und der Antisymmetrie des Kreuzprodukts. Mit ̂ = i2 Sp(σ(σ⋅ R)) ̂ = i4R̂ Sp(σ × σ(σ⋅ R)) folgt M ± = ±i2R̂ und wir erhalten für das induzierte Magnetfeld (29.41):
B± (R) = ∓
1 R̂ . 2 R2
Interpretieren wir R (29.32) als gewöhnliche Koordinate, so ist dies das Magnetfeld eines magnetischen Monopols mit „magnetischer Ladung“ (∓2π) am Koordinatenur sprung R = 0. Dementsprechend repräsentiert die Berry-Phase γ+ (C) (29.26) den ma gnetischen Fluss durch die geschlossene Schleife⁸ C = ∂Σ, der von diesem magneti schen Monopol ausgeht: R̂ 1 γ± (C) = ∫dΣ⋅B+ (R) = ∓ ∫dΣ⋅ 2 . 2 R Σ
Σ
Hierbei ist Ω(C) = ∫dΣ⋅
R̂ R2
Σ
8 Der Einfachheit halber setzen wir hier voraus, dass die Schleife C nicht durch den Entartungspunkt R = 0 läuft.
29.4 Spin im homogenen Magnetfeld | 267
der Raumwinkel, den die geschlossene Trajektorie C vom Entartungspunkt R = 0 aus gesehen aufspannt, siehe Abb. 29.4a. Deshalb gilt:
γ± (C) = ∓
1 Ω(C) . 2
(29.42)
Der Phasenfaktor e iγ±(C) ist unabhängig von der Wahl der Fläche Σ, die von C be grenzt wird. Dies ist zwar eine offensichtliche Folge des Stokes’schen Integralsatzes, ist aber auch eine Eigenschaft des Raumwinkels Ω. Dieser ändert sich bei Deforma tion von Σ bei festgehaltenen Rand ∂Σ = C nicht, solange Σ den Koordinatenur sprung R = 0 nicht durchquert. Bei Durchqueren des Koordinatenursprungs ändert sich Ω(C) um ±4π je nach Orientierung der Fläche Σ, siehe Abb. 29.4. Dabei ändert sich die Berry-Phase (29.42) um ∓2π, was jedoch die Wellenfunktion (29.9) invariant lässt. Σ1
C
C
Ω
Ω1
0
0
Σ2
(a)
Ω2 = 4π − Ω1
(b)
Abb. 29.4: (a) Der vom Ursprung 0 durch C aufgespannte Raumwinkel im Parameterraum ℝ3 . (b) Wird die von C eingeschlossene Fläche so deformiert, dass sie den Ursprung durchquert, än dert sich der Raumwinkel dabei je nach Orientierung der Fläche um ±4π. Man beachte, dass sich bei der Deformation der Fläche ihre Orientierung (d. h. ihre Flächennormale) nicht ändert. In (b) sollen Σ1 und Σ2 die beiden von C aufgespannten Oberflächen mit nach außen gerichteter Flächennorma len sein. Ihre Summe Σ1 + Σ2 ist topologisch äquivalent zur Kugeloberfläche S2 um den Ursprung, die den Raumwinkel 4π aufspannt. Spannt Σ1 den Raumwinkel Ω1 auf, so spannt Σ2 den Raumwin kel Ω2 = 4π − Ω1 auf. Wird die Fläche Σ1 so deformiert, dass sie dabei den Ursprung durchquert, so spannt sie nach Durchqueren des Ursprungs den Raumwinkel −Ω2 = Ω1 − 4π auf, da ihre Flä chennormale dann (im Gegensatz zu der von Σ2 ) nach innen gerichtet ist. Beim Durchqueren des Ursprungs hat sich somit der Raumwinkel um 4π verringert.
268 | 29 Adiabatische Beschreibung: Die Berry-Phase
–
φ
b φ
n
–
n
b
a
φ –φ a (a)
(b)
̍
φ
b a
̍ n (φ-2π)n (c)
Abb. 29.5: (a) Zur Definition (29.43) des gewöhnlichen Winkels in ℝ3 mittels eines Wegintegrals. ̄ ist die Projektion der Kurve C in die durch a und b aufgespannte Ebene. Die gestrichelte Kurve C (b) resultiert aus (a) durch Änderung der Orientierung des Wegs C. Deformation des Wegs C in C mit ̄ des Wegs liefert (c). Überqueren des Koordinatenursprungs durch die Projektion C
Der Raumwinkel Wir betrachten zunächst einen gewöhnlichen (ebenen) Winkel. Im ℝ3 definieren zwei Vektoren a und b eindeutig eine Ebene mit Flächennormalen n̂ =
a×b , |a × b|
siehe Abb. 29.5. Der Winkel dφ, der von zwei infinitesimal benachbarten Vektoren r und r + dr aufgespannt wird, ist durch dφ =
r × dr r2
29.4 Spin im homogenen Magnetfeld | 269
gegeben. Integration dieses Ausdrucks entlang einer Kurve C, die von a nach b läuft, liefert den Winkel ∠(a, b) = φ, der von diesen beiden Vektoren aufgespannt wird: 1 ̇ r × dr r(s) × r(s) φ ≡ φ n̂ = ∫ = ds . (29.43) ∫ 2 2 r r (s) C
0
̇ Hierbei ist die Kurve C durch r(s), s ∈ [0, 1] parametrisiert (r(s) = dr(s)/ds, ̂ r(s) = r(s)/|r(s)|). Ändern wir die Orientierung der Kurve C, so erhalten wir die Kurve (−C), die von b nach a läuft. Änderung der Orientierung einer Kurve ändert ̇ ̇ das Vorzeichen ihres Tangentenvektors (r(s) → −r(s)) und somit das Vorzeichen des von der Kurve aufgespannten Winkels: ∠(b, a) = −φ. Das Vorzeichen des Win kels wird also durch die Orientierung der Kurve festgelegt, die die Endpunkte der beiden Schenkel des Winkels verbindet. Die Größe des Winkels ist unabhängig von der Form der Kurve C. Deformation der Kurve C (bei festgehaltenen Endpunkten) ̄ den Ursprung nicht ändert den Wert des Winkels nicht, so lange ihre Projektion C überquert. Abbildung 29.5c zeigt eine Kurve C , die durch Deformation von C ent ̄ den Ursprung überquert. Da C ∪ (−C ) eine ge steht, wobei aber ihre Projektion C schlossene Schleife bilden, zu der der Winkel 2π gehört, erzeugt die Kurve (−C ) den Winkel 2π − φ und somit die Kurve C den Winkel φ − 2π. Deformation der Kurve C in C hat somit den Winkel um (−2π) geändert. Die entgegengesetzt ori entierte Kurve (−C) spannt den Winkel −φ auf. Wird diese in (−C ) deformiert, so ändert sich der Winkel um 2π. Ganz allgemein gilt: Der Winkel, der von einer Kurve in einer Ebene durch ihre Endpunkte bezüglich eines (in der Ebene liegenden) Refe renzpunkts aufgespannt wird, ändert sich bei Deformation der Kurve nicht, solange deren Projektion in die Ebene nicht den Referenzpunkt überquert. Beim Überque ren des Referenzpunkts ändert sich der Winkel um ±2π je nach Orientierung der Kurve. Analoges gilt für den Raumwinkel, der von einer Fläche Σ in ℝ3 aufgespannt wird. Dieser ändert sich nicht bei Deformation der Fläche Σ, solange ihr Rand ∂Σ fest gehalten wird und die Fläche den Nullpunkt nicht überquert. Bei Überqueren des Nullpunkts ändert sich der Raumwinkel um ±4π je nach Orientierung der Fläche. (Die Orientierung einer Fläche wird durch die Richtung ihres Normalenvektors fest gelegt.) Dieser Sachverhalt ist in Abb. 29.4 illustriert. Um dies explizit zu demonstrieren, betrachten wir eine geschlossene Kurve C in der XY-Ebene. Der Einfachheit halber wählen wir C als Kreis mit Radius R und Mittel punkt M und legen M in den Koordinatenursprung O. Zur Berechnung des Raum winkels Ω(C), der von C aufgespannt wird, legen wir C zunächst in eine Ebene, die sich infinitesimal oberhalb der XY-Ebene befindet und parallel zu dieser verläuft, siehe Abb. 29.6. Das infinitesimale Flächenelement dieser Ebene am Ort r lautet in Zylinderkoordinaten (ρ, φ, z) dΣ = dρρdφe z .
270 | 29 Adiabatische Beschreibung: Die Berry-Phase
Der durch C aufgespannte Raumwinkel ist dann durch 2π
R
0
0
r̂ e z ⋅ r̂ Ω(C, ε) = ∫ dΣ⋅ 2 = ∫ dφ ∫dρ ρ 2 r r Σ(C)
gegeben, wobei (siehe Abb. 29.7)
r2 = r2 = ρ 2 + ε2 ,
r̂ =
r = sin ϑe ρ + cos ϑe z , r
cos ϑ =
ε . r
Z
C
M
Y
0 ε
X Abb. 29.6: Zur Berechnung des Raumwinkels Ω(C), der von einem Kreis C in einer Ebene durch den Koordinatenursprung aufgespannt wird. Die Ebene mit C wurde als XY -Ebene gewählt und zur mathematischen Regularisierung des Ausdrucks für den Raumwinkel um den (infinitesima len) Abstand ε parallel zur Z-Achse verschoben.
ez
r
M ε −R
ϑ eρ
ρ
Abb. 29.7: Schnitt entlang der YZ-Ebene durch Abb. 29.6.
R
29.4 Spin im homogenen Magnetfeld | 271
Wegen e z ⋅e ρ = 0 folgt: 2π
R
Ω(C, ε) = ∫ dφ ∫ dρ ρ 0
0 R
= −2πε ∫dρ 0
= 2π (1 −
ε (ρ 2 + ε2 )3/2
d 1 dρ √ρ 2 + ε2
ε ) . √ R2 + ε2
Im Limes ε → 0 finden wir: Ω(C) = lim Ω(C, ε) = 2π . ε→0
(29.44)
Dieses Ergebnis hätten wir erwarten können, da das Innere einer planaren ge schlossenen Schleife als deformierte Halbsphäre betrachtet werden kann und Halbsphären einen Raumwinkel von 2π aufspannen. (Die gesamte Kugeloberflä che spannt den Raumwinkel 4π auf.) Damit ist auch klar, dass das Ergebnis (29.44) nicht auf kreisförmige Schleifen beschränkt ist. Legen wir die Ebene mit der geschlossenen Kurve C zunächst unterhalb der XY-Ebene in die Ebene Z = −ε und nehmen anschließend den Limes ε → 0, so erhalten wir: Ω(C) = −2π . (29.45) Dieses Ergebnis unterscheidet sich von (29.44) im Vorzeichen. Die Ursache hier für ist, dass der Raumwinkel Ω(C), der durch eine ebene Fläche Σ(C) in der XY-Ebene bzw. durch deren Rand C = ∂Σ aufgespannt wird, nicht wohl definiert ist, sondern eine Regularisierung verlangt, die darin besteht, dass die Fläche Σ(C) infinitesimal oberhalb oder unterhalb der XY-Ebene verlegt wird. Der Vorzeichenwechsel von (29.45) zu (29.44) bedeutet, dass sich der von Σ(C) aufgespannte Raumwinkel Ω(C) um 4π ändert, wenn der Referenz punkt (hier der Koordinatenursprung) bezüglich dessen der Raumwinkel de finiert ist, die Fläche Σ(C) in entgegengesetzter Richtung zur Flächennorma len durchstößt. Man beachte auch, dass der Raumwinkel Ω(C), der durch die Fläche Σ(C) aufgespannt wird, das Vorzeichen ändert, wenn die Orientierung der Fläche Σ(C) (d. h. die Richtung des Flächennormalenvektors) umgekehrt wird. Man kann sich leicht davon überzeugen, dass das obige Ergebnis unabhängig von der Form der Kurve C gilt, solange C den Ursprung umschließt. Falls C (in einer Ebene liegt, die den Ursprung enthält aber) den Ursprung nicht umschließt, ver schwindet der durch C vom Ursprung aus aufgespannte Raumwinkel.
272 | 29 Adiabatische Beschreibung: Die Berry-Phase
29.5 Der Bohm-Aharonov-Effekt Ein sehr anschauliches Beispiel für das Auftreten einer geometrischen Berry-Phase ist der Bohm-Aharonov-Effekt. Dieser Effekt gestattet es, die Berry-Phase direkt zu mes sen. Gleichzeitig offenbart er einen Wesensunterschied zwischen klassischer Physik und Quantenphysik bezüglich der Rolle des Vektorpotenzials.
29.5.1 Elektron im Magnetfeld einer sehr dünnen Spule Die klassische Bewegung einer Punktladung im Magnetfeld, q m ẍ = ẋ × B , c
(29.46)
hängt nicht vom (eichabhängigen!) Vektorpotenzial A(x), sondern nur vom (eichinva rianten!) Magnetfeld B(x) = ∇× A(x) ab. Demgegenüber erlangt in der Quantenphysik das Vektorpotenzial A(x) eine eigenständige Bedeutung. Selbst in den Gebieten mit verschwindendem Magnetfeld kann das Vektorpotenzial in der Quantentheorie phy sikalisch relevant sein, wie das von Bohm und Aharonov beschriebene Experiment verdeutlicht: Ein Elektronenstrahl wird in zwei gleiche Teilstrahlen aufgespalten, die rechts und links einer langen, aber sehr dünnen Spule vorbei laufen und danach wie der vereinigt werden, siehe Abb. 29.8. Obwohl die Elektronen nur durch Gebiete mit B = 0 laufen, besitzen die beiden Teilstrahlen bei der Wiedervereinigung unterschied liche Phasen, wie wir weiter unten zeigen werden. Sind C 1 und C2 die Wege, die die Elektronen in den Teilchenstrahlen durchlaufen, so beträgt der Wegunterschied zwi schen den Elektronen der beiden Teilstrahlen C = C1 ∪ (−C2 ), wobei −C2 den Weg C2 mit umgekehrter Richtung bezeichnet. Den Wegunterschied können wir deshalb auch aus der Bewegung entlang des geschlossenen Wegs C bestimmen. B
I
Abb. 29.8: Illustration der Elektronenwege durch den feldfreien Raum beim Bohm-Aharonov-Effekt. Die dünne Spule ist stark vergrößert dargestellt.
29.5 Der Bohm-Aharonov-Effekt | 273
Wir betrachten eine sehr dünne, jedoch sehr lange Spule. Fließt durch die Spu le ein Strom, so wird im Inneren der Spule ein Magnetfeld erzeugt, das längs der Spulenachse gerichtet ist, siehe Abb. 29.8. Ist die Spule hinreichend lang, kann das Magnetfeld im Außenraum der Spule vernachlässigt werden. Der Einfachheit halber können wir die mathematische Idealisierung einer infinitesimal dünnen und unend lich langen Spule betrachten, sodass nur eine einzige magnetische Flusslinie vorliegt. Ein solches linienförmiges Magnetfeld wird als magnetische Vortexlinie bzw. einfach magnetischer Vortex bezeichnet. Allgemein versteht man unter einem magnetischen Vortex bzw. Wirbel ein Magnetfeld mit einer linienförmigen Singularität. Verläuft die Vortexlinie entlang einer Kurve C S , so besitzt sie das Magnetfeld B(x) = Φ ∫ dx δ(3) (x − x ) ,
(29.47)
CS
wobei Φ = ∫dΣ⋅B
(29.48)
Σ
den zugehörigen Magnetfluss durch eine Fläche Σ bezeichnet, die genau einmal von der Vortexlinie durchstoßen wird, siehe Abb. 29.9. Das B-Feld zeigt in Richtung der Tangente der Vortexlinie C S , wie aus Gl. (29.47) ersichtlich ist.
n̂ B Σ C CS
Abb. 29.9: Zur Illustration von Gln. (29.47) und (29.48).
Für Punkte x, die nicht auf der Flusslinie (d. h. nicht im Inneren der Spule) liegen, verschwindet das Magnetfeld. Dennoch muss es im Raum außerhalb der Spule ein nichtverschwindendes Vektorpotenzial A(x) geben, sodass der Stokes’sche Satz
∫ dΣ⋅B = ∮ dx⋅A(x) Σ(C)
C=∂Σ
für geschlossene Wege C um die Flusslinie C S erfüllt ist, siehe Abb. 29.9.
274 | 29 Adiabatische Beschreibung: Die Berry-Phase
Eine Realisierung des zu B(x) (29.47) gehörigen Vektorpotenzials lautet A(x) = Φ ∫ dx × ∇x CS
1 , 4π|x − x |
wovon man sich leicht überzeugt: Mit ∇x f(x − x ) = −∇x f(x − x ) und ∇ × (dx × ∇) = dx ∇⋅∇ − ∇ dx ⋅∇ , erhalten wir ∇ × A(x) = Φ ∫ dx (−∆ CS
∇ ≡ ∇x
1 1 ) − Φ∇x ∫ dx ⋅∇x . 4π|x − x | 4π|x − x | CS
Mit Gln. (C.22), (C.29) 1 = δ(x − x ) 4π|x − x | liefert der erste Term gerade das B-Feld (29.47), während der zweite Term verschwindet, da magneti sche Flusslinien (und somit C S ) geschlossen sind. −∆
29.5.2 Interpretation des Bohm-Aharonov-Effekts mittels der Berry-Phase Im Außenraum der Spule befinde sich eine Ladung q, die in eine Box eingeschlossen ist.⁹ Die Box sei am Ort R zentriert und werde nicht von der Flusslinie durchstoßen (siehe Abb. 29.10). Ohne den Fluss (Φ = 0) hat der Hamilton-Operator H = H(p, x − R) Eigenwerte E n , die unabhängig von R sind, und die normierbaren Eigenfunktionen hängen nur von der Relativposition zur Boxmitte R(t) ab, ψ n = ψ n (x − R). In Anwe senheit des magnetischen Flusses (Φ ≠ 0) wird die Schrödinger-Gleichung H (p −
q A(x), x − R) |n(R)⟩ = E n |n(R)⟩ c
(29.49)
Φ
C
q
R(t)
Abb. 29.10: Zur theoretischen Erklärung des Bohm-Aharonov-Effekts als Berry-Phase.
9 Die Box wird nur benötigt, um normierbare Eigenfunktionen des Hamilton-Operators zu erhalten.
29.5 Der Bohm-Aharonov-Effekt | 275
durch die Eigenfunktionen x
iq ⟨x|n(R)⟩ = exp [ ∫dx ⋅A(x )] ψ n (x − R) ℏc ] [ R
(29.50)
gelöst, wobei ψ n (x − R) die Eigenfunktionen des Hamilton-Operators bei Abwesenheit des Magnetfelds sind. In der Tat liefert Einsetzen von (29.50) in (29.49) die Schrödin ger-Gleichung bei Abwesenheit des Flusses, d. h. für A(x) = 0: H(p, x − R)ψ n (x − R) = E n ψ n (x − R) . Für festes R sind die ⟨x|n(R)⟩ eindeutige Funktionen von x. Des Weiteren bleiben die Eigenwerte E n vom Vektorpotenzial A unberührt. Wir bewegen nun die Box mit der Ladung entlang eines geschlossenen Wegs C um die Flusslinie herum und betrachten dabei den Ort R der Box als langsamen äußeren klassischen Parameter. (In diesem Fall muss die Bewegung nicht notwendigerweise adiabatisch sein.) Obwohl die Bewegung der Ladung ausschließlich im (magnet-)feldfreien Raum erfolgt, sammelt die Ladung eine geometrische (Berry-)Phase auf. Aus Gl. (29.50) folgt: ⟨n(R)|∇ R |n(R)⟩ = ∫d3 x ⟨n(R)|x⟩⟨x|∇ R |n(R)⟩ = ∫d3 x ⟨n(R)|x⟩∇ R ⟨x|n(R)⟩ = ∫ d3 x ψ∗n (x − R) (−
iq A(R) + ∇R ) ψ n (x − R) . ℏc
Der letzte Term ist proportional zum Erwartungswert des Impulses und verschwindet wegen der Normierung der Wellenfunktion ψ n (x − R) in der Box ∫d3 x ψ∗n (x − R)∇ R ψ n (x − R) = 0 . Wir erhalten deshalb ⟨n(R)|∇ R |n(R)⟩ = −
iq A(R) . ℏc
Ein Vergleich dieses Ausdrucks mit Gl. (29.21) zeigt, dass das induzierte Berry-Poten zial A n bis auf einen konstanten Faktor q/ℏc mit dem tatsächlichen Vektorpotenzial A übereinstimmt: An (R) =
q A(R) . ℏc
Entsprechend stimmt die Berry-Phase (29.25), (29.26) bis auf den Faktor q/ℏc mit dem magnetischen Fluss Φ (29.48) überein und ist unabhängig vom betrachteten Eigenzu stand |n(R)⟩: q γ(C) = Φ. ℏc
276 | 29 Adiabatische Beschreibung: Die Berry-Phase Hierbei wurde vorausgesetzt, dass die geschlossene Kurve C den magnetischen Fluss Φ genau einmal im mathematisch positiven Sinn umläuft, siehe Abb. 29.10. Prinzipiell kann eine geschlossene Schleife C die magnetische Flusslinie mehr fach umlaufen, was durch ihre Windungszahl erfasst wird, siehe Abb. 29.11. Jedes Mal, wenn die Ladung q auf der Bahn C die Flusslinie im mathematisch positi ven (negativen) Sinne umläuft, vergrößert (verringert) sich die Windungszahl um 1 und die Berry-Phase (29.25), (29.26) erhält einen Beitrag von ±qΦ/ℏc. Entspre chend ist die Berry-Phase für einen geschlossenen Weg C mit Windungszahl ν[C] durch q γ(C) = ν[C]⋅ Φ (29.51) ℏc gegeben.
(a)
(b)
(c)
(d)
Abb. 29.11: Zur Definition der Windungszahl ν[C] des geschlossenen Wegs C bezüglich des Orts des magnetischen Flusses, der durch einen fetten Punkt markiert ist: (a) ν[C] = 0, (b) ν[C] = 1, (c) ν[C] = 2 und (d) ν[C] = −1.
Die Phasenveränderung in der Wellenfunktion einer Punktladung, welche sich in der Nähe eines Magnetfelds bewegt, wird als Bohm-Aharonov-Effekt bezeichnet. Der Effekt wurde zuerst in Tübingen von C. Jönssen und G. Möllenstedt gemessen und zwar noch vor der theoretischen „Vorhersage“ von D. Bohm und Y. Aharonov. Zum Nachweis des Bohm-Aharonov-Effekts wird ein Doppelspaltexperiment durchgeführt: Elektronen werden von einer Quelle Q emittiert und gelangen durch einen Doppelspalt auf einen dahinter stehenden Schirm S, wo sie mittels Detektoren registriert werden. Auf der Rückseite des Doppelspalts wird zwischen den beiden Spalten eine dünne Spule angebracht, siehe Abb. 29.12. Der Durchmesser der Spule soll klein im Vergleich zum Abstand der beiden Spalte sein, sodass die Wellenfunkti on der Elektronen nicht (wesentlich) ins Innere der Spule eindringt. Fließt kein Strom durch die Spule, erzeugen die Elektronen auf dem Schirm das bekannte Interferenz muster. Wird der Spulenstrom eingeschaltet, wird im Inneren der Spule ein Magnet feld parallel zur Spule erzeugt, während der Außenraum feldfrei bleibt. Obwohl die Elektronen nur durch den feldfreien Raum laufen, ändert sich durch Einschalten des B-Felds das Interferenzmuster. Aus der Änderung des Interferenzmusters lässt sich die Phasenänderung der Wellenfunktion bestimmen.
29.5 Der Bohm-Aharonov-Effekt | 277
Q
S Abb. 29.12: Schematische Anordnung des Doppelspaltexperiments zum Nachweis des BohmAharonov-Effekts. Hinter dem Doppelspalt befindet sich eine sehr dünne und sehr lange Spule, die senkrecht auf der Zeichenebene steht.
29.5.3 Pfadintegralbeschreibung des Bohm-Aharonov-Effekts Wie wir bereits in Kapitel 3 gesehen haben, lässt sich das Doppelspaltexperiment sehr einfach im Pfadintegralzugang zur Quantenmechanik erklären. Auch die Pha senänderung der Wellenfunktion durch Einschalten des Magnetfelds lässt sich sehr bequem im Pfadintegralzugang berechnen. Dazu betrachten wir die Übergangsam plitude K(xS , T; xQ , 0) der Elektronen von der Quelle bei xQ zu einem Ort xS auf dem Schirm. Durch das äußere Magnetfeld erhält die Lagrange-Funktion einer Punktla dung q den Zusatzterm (22.5) LM =
q ̇ ⋅ A(x(t)) . x(t) c
(29.52)
Die Euler-Lagrange-Gleichung zur Gesamt-Lagrange-Funktion L = L0 + L M ,
L0 =
m 2 ẋ 2
liefert die klassische Bewegungsgleichung (29.46), die nur vom B-Feld abhängt, wäh rend die Lagrange-Funktion das Eichpotenzial selbst enthält. Da die Übergangsampli tude durch die Wirkung T
T
xS
0
0
xQ
q q S = ∫dt L = S0 + ∫dt ẋ ⋅ A(x(t)) = S0 + ∫ dx⋅A(x) c c
(29.53)
gegeben ist, hängt diese explizit vom Eichpotenzial ab. Die Übergangsamplitude er gibt sich bekanntlich durch Summation der Beiträge sämtlicher Wege C Q→S , die zwi
278 | 29 Adiabatische Beschreibung: Die Berry-Phase C1
C1
xQ
−C1 xS C2
C2
(a)
(b)
(c)
(d)
Abb. 29.13: (a) Alternative Wege C1 und C2 mit demselben Anfangs- und Endpunkt, xQ und xS . (b) geschlossener Weg C2 ∪ (−C1 ). (c) und (d) zeigen einen geschlossenen Weg mit Windungszahl ν[C] = 0 bzw. ν[C] = 1 bezüglich der Position der Spule, die durch eine schraffierte Kreisscheibe gekennzeichnet ist.
schen den betrachteten Anfangs- und Endpunkten verlaufen: K(xS , T; xQ , 0) = ∑ K[CQ→S ] ,
K[CQ→S ] = e ℏ S[CQ→S ] . i
{CQ→S }
Abbildung 29.13a zeigt zwei solcher Wege C1 und C2 . Der Weg C2 unterscheidet sich von C1 durch den geschlossenen Weg C = (−C1 ) ∪ C2 , denn es gilt: C1 ∪ C ≡ C1 ∪ (−C1 ) ∪ C2 = C2 , wobei wir mit −C den zu C entgegengesetzten Weg bezeichnen. Da die Wirkung additiv ist, S[C2 ] = S[C1 ] + S[C] , können wir die Übergangsamplitude in der Form K(xS , T; xQ , 0) = K[C1 ] ∑ K[C] {C}
schreiben, wobei die Summation sich jetzt über sämtliche geschlossene Wege C er streckt, die entlang des Wegs (−C1 ) von xS nach xQ laufen, siehe Abb. 29.13b. Durch eine Eichtransformation lässt sich das Eichpotenzial entlang des gesamten Wegs C1 zum Verschwinden bringen, siehe die Graubox am Ende dieses Abschnitts. Die Ampli tude K[C1 ] hängt dann nicht mehr vom Eichpotenzial ab und ist durch die des freien Teilchens gegeben: i K[C1 ] = K0 [C1 ] = e ℏ S0 [C1 ] .
29.5 Der Bohm-Aharonov-Effekt | 279
Die gesamte Abhängigkeit vom Eichpotenzial ist dann in den Amplituden der ge schlossenen Wege K[C] enthalten. Mit Gl. (29.53) erhalten wir für die Amplitude eines einzelnen geschlossenen Wegs i K[C] = K0 [C] exp [ q ∮dx⋅A(x)] , ℏc [ ] C wobei K0 [C] die Amplitude der freien Punktladung (d. h. bei Abwesenheit des Magnet felds) ist. Das Magnetfeld der Spule erzeugt eine zusätzliche Phase e iγ[C]: q γ[C] = ∮dx⋅A(x) . ℏc C
Diese Phase ist (obwohl sie das eichabhängige Vektorpotenzial A(x) enthält) eine eichinvariante Größe, die nach dem Stokes’schen Satz durch den magnetischen Fluss Φ[C], q (29.54) Φ[C] , Φ[C] = ∫ dΣ⋅B(x) , γ[C] = ℏc Σ(C)
gegeben ist, den die geschlossene Schleife C einschließt. Die Änderung des Inter ferenzmusters beim Einschalten des Spulenstroms hängt damit (bei gegebener La dung q) ausschließlich vom magnetischen Fluss ab. Falls der geschlossene Weg C die Spule nicht umschlingt, verschwindet der von C eingeschlossene Fluss. Die geschlos senen Wege C lassen sich nach der Windungszahl ν[C] klassifizieren, die angibt, wie oft die Schleife C die Spule (im mathematisch positiven Sinn) umläuft. Ist Φ der Fluss der Spule, so ist der von der Schleife C mit Windungszahl ν[C] eingeschlossene ma gnetische Fluss durch Φ[C] = ν[C]Φ (29.55) gegeben. Einsetzen von (29.55) in (29.54) liefert das frühere Ergebnis (29.51). Im Expe riment wird die Amplitude der Elektronen durch Wege mit Windungszahl 0 und ±1 dominiert, deren Überlagerung die Veränderung der Interferenzmuster hervorruft. Eichpotenzial einer Spule Wir betrachten eine (unendlich) lange dünne Spule mit der z-Achse als Symme trieachse, siehe Abb. 29.8. Aufgrund der Translationsinvarianz entlang der z-Achse kann das Eichpotenzial unabhängig von z gewählt werden. Im Außenraum der Spu le findet man in Coulomb-Eichung ∇ ⋅ A = 0 das Potenzial (22.48) A(x) ≡ A(ρ, φ) =
Φ eφ , 2πρ
wobei Φ (29.48) der Magnetfluss der Spule und (ρ, φ, z) die üblichen Zylinderkoor dinaten sind. Durch die Eichtransformationen A(x) + ∇Λ(x) → A(x)
280 | 29 Adiabatische Beschreibung: Die Berry-Phase
mit Λ(x) = − und ∇ = eρ
Φ φ 2π
∂ 1 ∂ ∂ + eφ + ez ∂ρ ρ ∂φ ∂z
entsteht hieraus das Potenzial A(x) = ΦΘ(x)δ(y)e y ,
(29.56)
das ausschließlich auf der positiven x-Achse lokalisiert ist und sonst überall ver schwindet. Die Singularität auf der positiven x-Achse entsteht durch den Sprung des Azimutwinkels φ von 2π auf 0 beim Überqueren der positiven x-Achse von un ten (d. h. in Richtung von e y ): ∇φ = e φ
1 − 2πe y Θ(x)δ(y) . ρ
Aufgrund der Translationsinvarianz in z-Richtung ist das Potenzial (29.56) auf der ganzen Halbebene lokalisiert, die durch die positive x-Achse und die z-Achse auf gespannt wird. Durch Eichtransformation lässt sich diese Fläche mit A ≠ 0 um die z-Achse drehen oder sogar deformieren. Durch geeignete Eichtransformationen können wir deshalb immer erreichen, dass diese Fläche nicht vom Weg C1 durch quert wird, der vollständig im Außenraum der Spule verläuft. Somit können wir stets das Eichpotenzial entlang des Wegs C1 zum Verschwinden bringen.
29.6 Pfadintegralableitung der Berry-Phase* Die langsamen Freiheitsgrade besitzen i. A. eine viel größere Masse und damit auch eine viel größere Wirkung und lassen sich deshalb oftmals semiklassisch behandeln, was am bequemsten in der Pfadintegralformulierung geschieht. Wir werden jedoch im Folgenden nicht voraussetzen, dass die langsamen Freiheitsgrade semiklassischer Natur sind.
29.6.1 Pfadintegralbeschreibung der langsamen Freiheitsgrade Die Berry-Phase tritt natürlich auch in der Pfadintegralformulierung auf. Da wir an den gebundenen Zuständen des Gesamtsystems interessiert sind, betrachten wir die
* Dieser Abschnitt ist für das Verständnis der übrigen Abschnitte nicht erforderlich und kann deshalb beim ersten Lesen übersprungen werden.
29.6 Pfadintegralableitung der Berry-Phase
|
281
Spur des Zeitentwicklungsoperators T
i Z(T) = Sp T exp [− ∫ dtHtot (t)] , ℏ 0 ] [
(29.57)
deren Fourier-Transformierte bezüglich der Zeit T bei den Energien der exakten Bin dungszustände eine δ-förmige Singularität besitzt, siehe Gl. (23.23). Hierin bezeichnet Htot (t) den Hamilton-Operator des gekoppelten Gesamtsystems, der durch Gl. (29.14) und (29.15) definiert ist. Da wir an der Bewegung der langsamen Freiheitsgrade R(t) interessiert sind, lei ten wir für diese eine Pfadintegraldarstellung von Z(T) (29.57) ab. Zur Berechnung der Spur wählen wir die Basiszustände des Gesamtsystems in der Produktform |n(R), R⟩ = |n(R)⟩ ⊗ |R⟩ ,
(29.58)
wobei |n(R)⟩ die Eigenvektoren (29.10) und |R⟩ die Eigenfunktionen des Ortsoperators R̂ der langsamen Freiheitsgrade R sind. Mit der Vollständigkeitsrelation 1̂ = ∑ ∫d d R |n(R), R⟩⟨n(R), R|
(29.59)
n
finden wir für die Spur (29.57) T
i Z(T) = ∑ ∫d R ⟨n(R), R|T exp [− ∫dtHtot (t)] |n(R), R⟩ . ℏ n 0 [ ] d
Zur Ableitung der Pfadintegraldarstellung zerlegen wir das Zeitintervall T in N infini tesimale Intervalle der Länge ε = T/N. Mit t k = kε haben wir dann nach Gl. (23.16) T
N i i T exp [− ∫dtHtot (t)] = ∏ e− ℏ εHtot (t k ) , ℏ 0 ] k=1 [
wobei die Exponentialfaktoren auf der rechten Seite nach wachsenden Zeiten ange ordnet sind. Setzen wir zwischen zwei aufeinanderfolgende Exponentialfaktoren je weils die Vollständigkeitsrelation (29.59) ein, so erhalten wir Z(T) =
N i ∫ ∏ d d R k ⟨n k (R k ), R k | exp [− εHtot (t k )] |n k−1 (R k−1 ) , R k−1 ⟩ , ℏ n1 ,...,n N k=1 (29.60)
∑
wobei wir R N := R =: R0 ,
n N := n =: n0
gesetzt haben. Für ε → 0 gilt i i 2 i ̂ ̂ ̂ = e− ℏ εH0 (R) e− ℏ εH(R) e O(ε ) , exp [− ε (H0 (R)̂ + H(R))] ℏ
(29.61)
282 | 29 Adiabatische Beschreibung: Die Berry-Phase
sodass wir für die Matrixelemente in Gl. (29.60) in der Produktbasis (29.58) erhalten¹⁰ i ̂ |n k−1 (R k−1 ) , R k−1 ⟩ ⟨n k (R k ), R k | exp [− ε (H0 (R)̂ + H(R))] ℏ ̂
̂
= ⟨R k |e− ℏ εH0(R k ) |R k−1 ⟩⟨n k (R k )|e− ℏ εH(R k ) |n k−1 (R k−1 )⟩ . i
i
(29.62)
Das verbleibende Matrixelement der langsamen Freiheitsgrade berechnen wir analog zu Kapitel 3 durch Einschieben der Vollständigkeitsrelation im Impulsraum, dd P |P⟩⟨P| , 1̂ = ∫ (2π)d vergleiche auch Gl. (3.20): ̂
i dd P ̂ ⟨R k |e− ℏ εH0(R) |P⟩⟨P|R k−1 ⟩ d (2πℏ) d d P − i ε P2 i P(R k −R k−1 ) e ℏ 2M e ℏ =∫ (2πℏ)d
⟨R k |e− ℏ εH0 (R) |R k−1 ⟩ = ∫ i
d
M i M R k − R k−1 2 = (√ ) exp [ ε ( ) ] , i2πℏε ℏ 2 ε
(29.63)
wobei wir ⟨R|P⟩ = exp (iP⋅R/ℏ) benutzt haben. Im Matrixelement der schnellen Variablen benutzen wir die Eigenwert gleichung (29.10) und finden ⟨n k (R k )|e− ℏ εH(R k ) |n k−1 (R k−1 )⟩ = e− ℏ εE nk (R k ) ⟨n k (R k )|n k−1 (R k−1 )⟩ . i
i
(29.64)
Mit Gln. (29.62), (29.63) und (29.64) erhalten wir aus Gl. (29.60) Z(T) = (
N N Nd/2 M R k − R k−1 2 M ∫ ∏ d d R k exp [iε ∑ ) ( ) ] i2πℏε 2 ε k=1 k=1 N
∑
∏ e− ℏ εE nk (R k ) ⟨n k (R k )|n k−1 (R k−1 )⟩ . i
(29.65)
n1 ,n2 ,...n N k=1
Wir können jetzt die R k als die Koordinatenwerte einer Trajektorie R(t) zum Zeitpunkt t = t k interpretieren. Da R N = R(t N ) = R(Nε) = R(T) und R0 = R(t0 ) = R(0), erfüllen diese Trajektorien nach Gl. (29.61) die periodischen Randbedingungen R(T) = R(0) .
10 Wir erinnern hier daran, dass H( R)̂ nur vom Ortsoperator R,̂ nicht jedoch vom zugehörigen Im pulsoperator P = ℏi ∇R abhängt, vgl. (29.14).
29.6 Pfadintegralableitung der Berry-Phase
|
283
Im Limes ε → 0 liefert dann die erste Zeile auf der rechten Seite von Gl. (29.65) gera de das Funktionalintegral für die Übergangsamplitude der ungekoppelten langsamen Freiheitsgrade ∫
DR(t)e ℏ S0 [R] i
(29.66)
R(T)=R(0)
mit der freien Wirkung T
S0 [R] = ∫dt
M ̇2 R (t) . 2
(29.67)
0
29.6.2 Adiabatische Näherung im Pfadintegral Der obige Ausdruck (29.65) ist exakt und unterliegt keinerlei Einschränkungen der Zeitskalen der verschiedenen Freiheitsgraden. Wir beschränken uns jetzt jedoch auf eine adiabatische Bewegung und setzen gemäß der Adiabatenhypothese voraus, dass keine Übergänge der inneren schnellen Freiheitsgrade aus dem Anfangszustand |n(R(t = 0))⟩ in andere Zustände |n ≠ n⟩ erfolgen, d. h., die schnellen Freiheitsgrade bleiben zu allen Zeiten im Zustand |n(R(t))⟩. Die Summation über die Quantenzah len n k in Gl. (29.65) ist dann auf n k = n eingeschränkt. Die zweite Zeile der rechten Seite von Gl. (29.65) vereinfacht sich dann zu N
∏ e− ℏ εE n (R k ) ⟨n(R k )|n(R k−1 )⟩ . i
(29.68)
k=1
Um von der Pfadintegraldarstellung (29.66) Gebrauch zu machen, benötigen wir auch diesen Ausdruck im Limes ε → 0. Für den ersten Faktor erhalten wir dann N i i N lim ∏ e− ℏ εE n (R k ) = lim exp [− ε ∑ E n (R(t k ))] ε→0 ε→0 ℏ k=1 k=1 T
= e− ℏ ∫0 i
dtE n (R(t))
.
Da für kleine ε ̇ k) R k−1 ≡ R(t k−1 ) = R(t k − ε) = R(t k ) − ε R(t und somit ̇ k ))⟩ |n(R k−1 )⟩ = |n (R(t k ) − ε R(t ̇ k )⋅(∇R |n(R)⟩) R=R(t ) , = |n(R k )⟩ − ε R(t k
(29.69)
284 | 29 Adiabatische Beschreibung: Die Berry-Phase finden wir für den zweiten Faktor in (29.68) im Limes ε → 0 mit ⟨n(R)|n(R)⟩ = 1 N
N
̇ k )⋅⟨n(R)|∇ R |n(R)⟩R=R(t ) ) lim ∏⟨n(R k )|n(R k−1 )⟩ = lim ∏ (1 − ε R(t k
ε→0
k=1
ε→0
k=1 N
̇ k )⋅⟨n(R)|∇ R |n(R)⟩R=R(t ) ] = lim exp [−ε ∑ R(t k ε→0
k=1 T
̇ ] = exp [− ∫dt R(t)⋅⟨n(R(t))|∇ R |n(R(t))⟩ [ 0 ] = exp iγ n (T) ,
(29.70)
wobei wir im letzten Ausdruck die Definition der Berry-Phase (29.12) benutzt haben. Mit Gln. (29.66), (29.69) und (29.70) finden wir aus (29.65) für eine adiabatische Bewe gung Z(T) =
∫
i
̃
DR(t)e ℏ S[R]
R(T)=R(0)
mit der effektiven Wirkung der langsamen Freiheitsgrade R T
T
̃ S[R] = S0 [R] − ∫dtE n (R(t)) + ℏγ n (T) =: ∫dt L̃ . 0
0
Diese enthält neben der Wirkung S0 [R] (29.67) der freien Bewegung der langsamen Freiheitsgrade noch die Energie der inneren Freiheitsgrade E n (R(t)), sowie die BerryPhase für einen Umlauf auf der periodischen Trajektorie R(T) = R(0). Für die zugehö rige Lagrange-Funktion der langsamen Freiheitsgrade finden wir
mit
̃ = M Ṙ 2 − E n (R) + L γ L 2
(29.71)
L γ = iℏṘ ⋅⟨n(R)|∇ R |n(R)⟩ .
(29.72)
Die instantane Energie der (inneren) schnellen Freiheitsgrade, E n (R), stellt ein Poten zial für die langsamen Freiheitsgrade dar. Den Term von der Berry-Phase können wir gemäß Gl. (22.5) als die Wechselwirkung einer Punktladung q = ℏc mit einem äußeren Magnetfeld B = ∇ × A interpretieren, das von dem Vektorpotenzial (29.21) An (R) = i⟨n(R)|∇ R |n(R)⟩ erzeugt wird. Gemäß Kapitel 22.6 führt die Lagrange-Funktion (29.71) in der Pfadinte gralquantisierung gerade auf den Hamilton-Operator (29.20).
29.6 Pfadintegralableitung der Berry-Phase
|
285
29.6.3 Mechanische Interpretation der Berry-Phase Wie wir oben gesehen haben, liefert die Berry-Phase (29.8) einen Zusatzterm zur klas sischen Wirkung der langsamen Freiheitsgrade S γ = ℏγ n = ∫ dtL γ (t) ,
L γ (t) = iℏṘ ⋅ ⟨n(R)|∇ R |n(R)⟩) = ⟨n(R)|iℏ∂ t |n(R)⟩ .
(29.73)
Dieser erlangt eine anschauliche mechanische Bedeutung, wenn wir die langsamen Freiheitsgrade R(t) als die Koordinaten einer Punktmasse interpretieren, sodass P=
ℏ ∇R i
der Impulsoperator der langsamen Freiheitsgrade ist. Den von der Berry-Phase gelie ferten Zusatzterm zur Lagrange-Funktion können wir dann schreiben als L γ = −Ṙ ⋅ P ,
(29.74)
wobei P = ⟨n(R)|P|n(R)⟩ ein klassischer Impuls ist, den die langsamen Freiheitsgrade aufgrund ihrer Kopp lung an die schnellen Freiheitsgrade erhalten. In der Form (29.74) repräsentiert L γ einen Trägheitsterm, den ein klassisches Teilchen mit Impuls P in einem mit der Geschwindigkeit Ṙ bewegten Bezugssystem erfährt. L γ enthält insbesondere auch die Trägheitsterme, die im rotierenden Bezugssystem auftreten. Um diese zu identifizieren, empfiehlt es sich, die üblichen sphärischen Koordinaten (R, ϑ, φ) zu benutzen und den ∇R -Operator in Radial- und Winkelanteil zu zerlegen (siehe Gl. (25.28)) ∂ 1 ∇R = ̂ R + ∇̂ , ∂R R R wobei R = |R| , ̂ R = R/R und ∇̂R = e ϑ
∂ 1 ∂ + eφ ∂ϑ sin ϑ ∂φ
nur von den Winkeln abhängt. Für den Drehimpulsoperator erhalten wir dann L=R×
ℏ ℏ ∇R = ̂ R × ∇̂R . i i
Hieraus finden wir mit ̂ R ⋅ ∇̂R = 0 für den Winkelanteil des ∇ R -Operator die Darstel lung ̂ iℏ∇̂ R = R×L.
286 | 29 Adiabatische Beschreibung: Die Berry-Phase
Mit diesen Beziehungen erhalten wir für L γ (29.73) L γ = L Rγ + L∡γ , wobei
∂ L Rγ = iℏṘ ⟨n(R)| |n(R)⟩ , ∂R ̇ ̇ R ⋅ ⟨n(R)|∇ ̂R |n(R)⟩ = ̂ R ⋅ ⟨n(R)|̂ R × L|n(R)⟩ . L∡γ = iℏ̂
Nach Einführen des Drehimpulses L = ⟨n(R)|L|n(R)⟩ finden wir für den Winkelanteil ̇ L∡γ = (̂ R×̂ R) ⋅ L .
(29.75)
Offenbar ist L ein zusätzlicher Drehimpuls, den die langsamen Freiheitsgrade R(t) durch ihre Kopplung an die schnellen Freiheitsgrade erhalten. Seinem physikalischen Wesen nach ist L ein innerer Drehimpuls, d. h. ein Spin. Die langsamen Freiheitsgrade erhalten demnach durch ihre Kopplung an die schnellen Freiheitsgrade (in der adia batischen Näherung) einen Spin. Aufgrund ihrer Zeitabhängigkeit rotieren die langsamen Freiheitsgrade ̂ R(t) mit der klassischen Winkelgeschwindigkeit (26.95) ̇ R. Ω=̂ R×̂ Der durch die Berry-Phase gelieferte winkelabhängige Zusatzterm (29.75) zur Lagran ge-Funktion lautet deshalb: L∡γ (t) = −Ω ⋅ L .
(29.76)
Dies ist der aus der klassischen Mechanik bekannte Trägheitsterm (26.92), der in der Lagrange-Funktion eines Teilchens mit Drehimpuls L in einem mit der Frequenz (−Ω) rotierenden Bezugssystem auftritt. In der Euler-Lagrange-Gleichung führt dieser Term auf die Corioliskraft und den Drehrückstoß, siehe Abschnitt 26.5.5.
30 Vielteilchensysteme Unsere bisherigen Überlegungen waren auf die quantenmechanische Beschreibung eines einzelnen Teilchens gerichtet. Im Folgenden wollen wir nun Quantensysteme aus mehreren Teilchen untersuchen.
30.1 Unterscheidbare Teilchen Wir betrachten zunächst ein System aus zwei verschiedenen Teilchen, z. B. ein Elek tron und ein Neutron. Das Elektron besitzt nur elektromagnetische Wechselwirkung, jedoch keine starke Wechselwirkung. Das Neutron hingegen unterliegt der starken Wechselwirkung, ist jedoch elektrisch neutral. Solange wir von seiner Mikrostruktur absehen, wechselwirkt es folglich nicht mit dem Elektron. Der Hamilton-Operator eines einzelnen Teilchens habe die übliche Form H (i) =
p2i + V (i) (x i ) , 2m i
i = 1, 2
und besitze die Eigenzustände |ν i ⟩(i) , (i)
H (i) |ν i ⟩(i) = ϵ ν i |ν i ⟩(i) , wobei für den Zustandsvektor |ν i ⟩(i) das Superskript „(i)“ den Hilbert-Raum des i-ten Teilchens bezeichnet, während „ν i “ für einen vollständigen Satz von EinteilchenQuantenzahlen des i-ten Teilchens steht. Falls keine Wechselwirkung zwischen den Teilchen besteht, so ist der HamiltonOperator des Zweiteilchen-Systems offenbar H = H (1) + H (2) .
(30.1)
Dementsprechend ist die Wellenfunktion des Zweiteilchen-Systems |ν1 , ν2 ⟩ durch das Produkt |ν1 , ν2 ⟩ = |ν1 ⟩(1) |ν2 ⟩(2) der Einteilchenwellenfunktionen gegeben. Anwendung des Gesamt-Hamilton-Opera tors auf die Produktwellenfunktion liefert in der Tat H|ν1 , ν2 ⟩ = (H (1) + H (2) )|ν1 ⟩(1) |ν2 ⟩(2) = H (1) |ν1 ⟩(1) |ν2 ⟩(2) + |ν1 ⟩(1) H (2) |ν2 ⟩(2) (1)
(2)
(1)
(2)
= (ϵ ν1 + ϵ ν2 )|ν1 ⟩(1) |ν2 ⟩(2) = (ϵ ν1 + ϵ ν2 )|ν1 , ν2 ⟩ . Entsprechend der Produktform der Wellenfunktion ist der Hilbert-Raum des Zweiteil chen-Systems durch das Tensorprodukt der Hilbert-Räume der beiden Teilchen gege ben. Während die H (i) Operatoren auf ℍ(i) sind, ist der Hamilton-Operator des Zwei teilchen-Systems H ein Operator auf dem Gesamt-Hilbert-Raum ℍ = ℍ(1) ⊗ ℍ(2) , https://doi.org/10.1515/9783110586077-008
288 | 30 Vielteilchensysteme wobei ⊗ das Tensorprodukt bezeichnet, siehe Abschnitt 10.7. Dementsprechend müss te der Gesamt-Hamilton-Operator streng genommen geschrieben werden als: H = H (1) ⊗ 1̂ (2) + 1̂ (1) ⊗ H (2) ,
(30.2)
wobei 1̂ (i) der Einheitsoperator im Einteilchen-Hilbert-Raum ℍ(i) ist. Wechselwirken die beiden Teilchen miteinander, wie z. B. Proton und Elektron, so enthält der Hamilton-Operator des Gesamtsystems noch einen Wechselwirkungsterm H (1,2) : H = H (1) + H (2) + H (1,2) . Die Eigenfunktionen des Hamilton-Operators H|φ⟩ = E|φ⟩ sind dann nicht mehr die Produktzustände |φ⟩ ≠ |ν1 ⟩(1) |ν2 ⟩(2) und dementsprechend sind die Energieeigenwerte nicht mehr durch die Summe der Energieeigenwerte der einzelnen Teilchen gegeben: H ≠ H (1) + H (2) ,
(1)
(2)
E ≠ ϵ ν 1 + ϵ ν 2 .
Der Hilbert-Raum ändert sich durch Einschalten der Wechselwirkung nicht, ℍ = ℍ(1) ⊗ ℍ(2) , und die Produktwellenfunktionen |ν1 ⟩(1) |ν2 ⟩(2) bilden auch für ein wech selwirkendes System eine vollständige Basis. Die Hamilton-Operatoren der beiden unabhängigen Teilchen, H (i) (x i ), wirken auf verschiedene Koordinaten und daher in verschiedenen Hilbert-Räumen und müssen deshalb miteinander kommutieren, [H (1) (x1 ), H (2) (x2 )] = 0̂ . Dies kommt in der ausführlichen Schreibweise (30.2) [H (1) ⊗ 1̂ (2) , 1̂ (1) ⊗ H (2) ] = (H (1) ⊗ 1̂ (2) )(1̂ (1) ⊗ H (2) ) − (1̂ (1) ⊗ H (2) )(H (1) ⊗ 1̂ (2) ) = H (1) ⊗ H (2) − H (1) ⊗ H (2) = 0̂ , unmittelbar zum Ausdruck. Operatoren, die ausschließlich auf verschiedene, d. h. dis junkte Variablen wirken, kommutieren. Die Hamilton-Operatoren der einzelnen unab hängigen Teilchen, H (i) , kommutieren jedoch i. A. nicht mit dem Wechselwirkungs term, [H (i) (x i ), H (1,2) (x1 , x2 )] ≠ 0̂ , i = 1, 2 , z. B. wenn dieser durch ein Potenzial V(x1 , x2 ) gegeben ist. Falls die Wechselwirkung jedoch nur von der Relativkoordinate abhängt, H (1,2) (x1 , x2 ) = V(x1 − x2 ) , lässt sich die Schwerpunktsbewegung, wie wir in Abschnitt 18.1 gesehen haben, sepa rieren und das Zweiteilchenproblem reduziert sich auf ein Einteilchenproblem für die Relativbewegung.
30.2 Identische Teilchen | 289
Die obigen Überlegungen lassen sich unmittelbar auf ein System von N unter scheidbaren Teilchen verallgemeinern. Falls die Teilchen miteinander wechselwirken, ist der Hamilton-Operator durch N
H(x1 , . . . , x N ) = ∑ H (i) (x i ) + ∑H (i,j) (x i , x j ) i=1
i>j
gegeben, wobei H (i,j) die Wechselwirkung des i-ten mit dem j-ten Teilchen repräsen tiert. Auch bei Anwesenheit einer Wechselwirkung bilden die Produktfunktionen |ν1 , ν2 , . . . , ν N ⟩ = |ν1 ⟩(1) . . . |ν N ⟩(N)
(30.3)
eine vollständige Basis und die exakte Wellenfunktion kann als Superposition dieser Basisfunktionen geschrieben werden: |φ⟩ = ∑ C ν1 ...ν N |ν1 , ν2 , . . . , ν N ⟩ . N
ν 1 ...ν N
Dementsprechend ist der Hilbert-Raum des wechselwirkenden N-Teilchen-Systems durch das Tensorprodukt der Hilbert-Räume der einzelnen Teilchen gegeben: ℍ = ℍ(1) ⊗ ℍ(2) ⊗ ⋅ ⋅ ⋅ ⊗ ℍ(N) .
(30.4)
30.2 Identische Teilchen Bisher haben wir vorausgesetzt, dass es sich um Teilchen verschiedener Sorten han delt, die sich unterscheiden lassen, z. B. ein Elektron und ein Proton, die sich z. B. in der elektrischen Ladung unterscheiden. Wir wollen jetzt identische Teilchen, d. h. Teilchen derselben Sorte, betrachten. Unter identischen Teilchen verstehen wir solche Teilchen, die in sämtlichen inneren Eigenschaften wie Masse, Ladung, Spin nicht un terscheidbar sind, z. B. ein System von Elektronen (wie Leitungselektronen im Fest körper) oder ein System von Neutronen (z. B. ein Neutronenstern). In der klassischen Mechanik bewegen sich die Teilchen auf wohldefinierten Bah nen bzw. Trajektorien. Die einzelnen Teilchen derselben Sorte bewegen sich auf ver schiedenen Trajektorien und können deshalb unterschieden werden. Wir können z. B. die Teilchen dadurch unterscheiden, dass wir ihre Trajektorien nummerieren und die Nummern der Trajektorien den entsprechenden Teilchen zuordnen. Die Bewegung ei nes quantenmechanischen Teilchens hingegen verläuft auf allen möglichen Trajekto rien und jede Trajektorie liefert einen Beitrag exp(iS/ℏ) zur Gesamtübergangsamplitu de. Haben wir mehrere identische Teilchen vorliegen, so läuft jedes dieser Teilchen auf allen möglichen Trajektorien und wir können nicht mehr unterscheiden, welches der Teilchen sich gerade auf einer herausgegriffenen Trajektorie bewegt. Nach dem Un schärfeprinzip besitzt ein quantenmechanisches Teilchen keine wohldefinierte Tra jektorie, sondern die Teilchen sind als Wellenpakete mit Orts- und Impulsunschärfe realisiert. Sind die identischen Teilchen nahe beieinander, überlappen ihre Wellen
290 | 30 Vielteilchensysteme
(a)
(b)
Abb. 30.1: Überlappende Wellenpakete: (a) Wellenfunktionen und (b) Aufenthaltswahrscheinlichkei ten.
funktionen (siehe Abb. 30.1). Im Überlappungsgebiet ist ohnehin keine Unterschei dung der überlappenden Anteile des Wellenpakets möglich, da wir im Experiment nur die Aufenthaltswahrscheinlichkeit eines Teilchens am Ort messen können. Die se gibt jedoch keine Auskunft darüber, welches der Teilchen wir gerade mit unserer Messapparatur nachweisen. Selbst gut separierte identische Teilchen können wir in der Quantenmechanik nicht unterscheiden. Ursache hierfür ist die Einwirkung des Messapparats auf das Messobjekt. Wir können die Teilchen in der Quantenmechanik nur nach einem voll ständigen Satz von Zuständen bzw. nach den Eigenwerten von kommutierenden Ob servablen klassifizieren. Darüber hinaus ist keine weitere Unterscheidung z. B. durch Nummerierung oder farbiges Anstreichen der Teilchen möglich, da dies den Zustand des Teilchens wesentlich verändern würde, d. h., die Unterscheidbarkeit der Teilchen würde erst durch den Einfluss des „Messapparats der Unterscheidbarkeit“ (z. B. „An streichen“) auf die Teilchen möglich. Durch einen solchen Messprozess würden aus ununterscheidbaren (identischen) Teilchen unterscheidbare gemacht. Der Teilchen-Welle-Dualismus verbietet bereits eine Unterscheidbarkeit der iden tischen Teilchen. Die Teilcheneigenschaft ist nur eine mögliche Erscheinungsform ei nes quantenmechanischen Objekts. Für Wellenphänomene ist die Teilchenvorstellung ohnehin sinnlos. Zur Illustration betrachten wir die Streuung zweier identischer Teilchen, siehe Abb. 30.2. Während in der klassischen Mechanik direkter Streuprozess (a) und Aus
(a)
(b)
Abb. 30.2: Streuung zweier identischer Teilchen: (a) direkte Streuung, (b) Austauschstreuung.
30.3 Permutationen | 291
tauschprozess (b) unterschieden werden können, ist in der Quantenmechanik keine Unterscheidung möglich, da wir nur asymptotisch das Teilchen in großer Entfernung vom Streuzentrum nachweisen, jedoch nicht seinen Ort während des Streuprozesses verfolgen können. Bevor wir zur Behandlung von identischen Teilchen kommen, ist es ratsam, sich einige mathematische Eigenschaften von Permutationen in Erinnerung zu rufen.
30.3 Permutationen Die Anordnung einer Menge von Elementen in einer bestimmten Reihenfolge wird als Permutation bezeichnet. Für N Elemente existieren N! verschiedene Permutationen, was man leicht durch vollständige Induktion beweist. Werden zwei Permutationen P und P nacheinander ausgeführt, was ihr Produkt P P definiert, so erhalten wir eine dritte Permutation P = P P . Dies zeigt, dass die Gesamtheit der N! Permutationen von N Elementen eine Grup pe bildet (siehe Anhang E), die sogenannte symmetrische Gruppe oder Permutations gruppe S N . Für eine Permutation P der Zahlen 1, 2, . . . , N wählen wir die Darstellung P=(
1 p1
2 p2
3 p3
... ...
N ) ≡ [p1 , p2 , p3 , . . . , p N ] , pN
(30.5)
wobei der Satz {p i , i = 1, . . . , N} jede der Zahlen 1, 2, . . . , N genau einmal enthält. Steht eine größere Zahl vor einer kleineren Zahl, d. h. pi > pj ,
für i < j ,
so spricht man von einer Inversion; z. B. enthält die Permutation [3214] drei Inversionen: 3 vor 2 ,
3 vor 1 ,
2 vor 1 .
Eine Permutation heißt gerade (ungerade), wenn sie eine gerade (ungerade) Anzahl von Inversionen enthält. Der Charakter einer Permutation χ(P) ist durch χ(P) = (−1)I(P)
(30.6)
definiert, wobei I(P) die Zahl der Inversionen der Permutation P ist. Folglich gilt: {1 , χ(P) = { −1 , {
P – gerade Permutation , P – ungerade Permutation.
(30.7)
292 | 30 Vielteilchensysteme
Eine Vertauschung (Permutation) zweier benachbarter Elemente ändert die Anzahl der Inversionen um 1 und damit den Charakter der Permutation. Hieraus lässt sich unmittelbar der folgende Satz beweisen: Der Charakter einer Permutation ändert sich, wenn in ihr irgend zwei Elemente mit einander vertauscht werden.
P ij bezeichne die Vertauschung (Permutation) des i-ten mit dem j-ten Element. Offenbar gilt P ij = P ji . Sei P = [p 1 , . . . , p i , . . . , p j , . . . , p N ] , dann gilt per Definition von P ij : P ij P = [p 1 , . . . , p j , . . . , p i , . . . , p N ] . Zwischen dem i-ten und j-ten Element (p i und p j ) befinden sich k Elemente. Um von der ursprünglichen Permutation P zur Permutation P ij P zu gelangen, muss zunächst p i an k Elementen vorbeigezogen werden, was k Zweier-Permutationen von benachbarten Elementen liefert und folglich den Charakter der Permutation um (−1)k ändert. Anschließend werden das i-te und j-te Element vertauscht, was den Charakter der Permutation um (−1) verändert. Schließlich muss das j-te Element p j an k Elementen vorbeigezogen werden, was k Zweier-Permutationen erfordert und somit den Charakter der Permu tation um (−1)k ändert. Insgesamt finden wir, dass die Vertauschung von zwei Elementen, zwischen denen sich k Elemente befinden, den Charakter der Permutation um (−1)2k+1 = −1 ändert. Damit finden wir χ(P ij P) = −χ(P) .
(30.8)
Eine Vertauschung von zwei Elementen wird als Transposition bezeichnet. Nach dem obigen Satz ändert sich der Charakter einer Permutation bei jeder Transposition. Aus der Definition (30.6) des Charakters folgt: χ(P P) = χ(P )χ(P)
(30.9)
χ(P ij ) = −1 .
(30.10)
und somit aus (30.8) Mit Hilfe des obigen Satzes zeigt man auch: Unter den N! Permutationen (N ≥ 2) gibt es N!/2 gerade und N!/2 ungerade Permutationen. Hieraus folgt unmittelbar: ∑ χ(P) = 0 ,
(30.11)
P
wobei die Summation über sämtliche N! Permutationen läuft. Eine beliebige Permutation P lässt sich durch nacheinander Ausführen von Zweier-Permutationen erzeugen: P = P ij . . . P kl .
(30.12)
30.3 Permutationen |
293
Hieraus folgt mit (30.9) und (30.10), dass χ(P) = (−1)T(P) ,
(30.13)
wobei T(P) die Zahl der Transpositionen ist, die zur Erzeugung von P erforderlich sind. Für die Permutation P (30.5) der Einteilchen-Indizes in einem N-Teilchen-Zustand |ν1 , . . . , ν N ⟩ definieren wir den Operator P dieser Permutation durch: P|ν1 , . . . , ν N ⟩ = |ν p1 , . . . , ν p N ⟩ . Der Operator P einer beliebigen Permutation lässt sich gemäß (30.12) durch ein Pro dukt von Operatoren Pij von Transpositionen P ij darstellen: P = Pij . . . Pkl . Die Operatoren der Transpositionen sind hermitesch und unitär: P†ij = Pij = P−1 ij .
(30.14)
Da die verschiedenen Pij nicht miteinander kommutieren, ist der Operator P einer beliebigen Permutation P i. A. nicht hermitesch, sondern nur unitär: P† = P−1 ≠ P . Aus den Operatoren P der Permutationen P der N Teilchen konstruieren wir den Sym metrisierungsoperator 1 S= (30.15) ∑P N! P sowie den Antisymmetrisierungsoperator A=
1 ∑ χ(P)P . N! P
(30.16)
Für einen beliebigen Permutationsoperator P gilt: PS = S ,
PA = χ(P)A .
(30.17)
Diese Beziehungen lassen sich unmittelbar beweisen, wenn man die Gruppeneigen schaft der Permutationen beachtet. Zur Illustration beweisen wir die zweite Gleichung in (30.17): Aus der Definition des Antisymmetrisierungsoperators (30.16) folgt: PA =
1 ∑ χ(P )PP . N! P
Sei
PP
=
P
und somit
PP
=
P .
Aus Gl. (30.9) und (χ(P))2 = 1 folgt dann unmittelbar:
PA =
1 ∑ χ(P)χ(PP )PP N! P
1 = χ(P) ∑ χ(P )P = χ(P)A . N! P
294 | 30 Vielteilchensysteme
In ähnlicher Weise zeigt man unter Ausnutzung der Gruppeneigenschaft der Permu tationen, dass der Symmetrisierungs- und Antisymmetrisierungsoperator Projektoren sind: SS = S , AA = A , AS = SA = 0̂ . (30.18) Beim Beweis benutzt man Gl. (30.11). Ferner lässt sich leicht zeigen, dass diese Opera toren auch hermitesch sind, S† = S , A† = A . Bei der nachfolgenden Behandlung von Systemen aus identischen Teilchen werden wir von den oben angegebenen Eigenschaften der Permutationen des Öfteren Ge brauch machen.
30.4 Zwei identische Teilchen Jedes einzelne Teilchen wird durch einen vollständigen Satz von Quantenzahlen, ν, charakterisiert, die seinen Zustand |ν⟩ festlegen. Für zwei unterscheidbare Teilchen konnten wir jedem Teilchen einen eigenen Hilbert-Raum zuordnen, |ν1 ⟩(1) ∈ ℍ(1) ,
|ν2 ⟩(2) ∈ ℍ(2) ,
und die Basiszustände des Zweiteilchen-Systems waren durch |ν1 , ν2 ⟩ = |ν1 ⟩(1) |ν2 ⟩(2) gegeben. Für unterscheidbare Teilchen ist dieser Basiszustand verschieden von dem Zustand mit vertauschten Quantenzahlen, |ν1 , ν2 ⟩ ≠ |ν2 , ν1 ⟩ = |ν2 ⟩(1) |ν1 ⟩(2) , und in der Tat sind diese beiden Zustände für ν1 ≠ ν2 orthogonal. Für identische Teilchen hingegen können wir zwischen diesen beiden Zuständen nicht unterscheiden. Finden wir in einer Messung die Quantenzahlen ν1 für eines der beiden identischen Teilchen und ν2 für das andere Teilchen, so wissen wir a priori nicht, ob der zugehörige Zustand |ν1 , ν2 ⟩ oder |ν2 , ν1 ⟩ ist. Jeder dieser beiden Zustän de und in der Tat jede Linearkombination dieser Zustände, |φ ν1 ν2 ⟩ = c1 |ν1 , ν2 ⟩ + c2 |ν2 , ν1 ⟩ ≡ c1 |ν1 ⟩(1) |ν2 ⟩(2) + c2 |ν2 ⟩(1) |ν1 ⟩(2) , führt auf dasselbe Messergebnis. Dieser Umstand wird als Austauschentartung be zeichnet: Die Spezifikation der Quantenzahlen der einzelnen Teilchen legt noch nicht eindeutig die Wellenfunktion des Gesamtsystems fest. Für ein System von ununterscheidbaren Teilchen darf sich der Hamilton-Operator bei Vertauschung zweier beliebiger Teilchen nicht ändern. Zum Beispiel muss der
30.4 Zwei identische Teilchen |
295
Hamilton-Operator eines Systems von zwei identischen Teilchen, H(ξ1 , ξ2 ), wobei ξ i = (x i , m si , . . . ) einen vollständigen Satz von Einteilchen-Variablen (Ort, Spinkom ponente, . . . ) bezeichnet, die Symmetrie H(ξ1 , ξ2 ) = H(ξ2 , ξ1 )
(30.19)
besitzen. Der Hamilton-Operator (30.1) zweier nichtwechselwirkender Teilchen ge nügt offenbar dieser Bedingung. Wir wollen diese Beziehung jetzt in darstellungsunabhängiger Form ausdrücken. Dazu benutzen wir den Permutationsoperator Pij für die Vertauschung des i-ten mit dem j-ten Teilchen. Anwendung des Permutationsoperators Pij auf die SchrödingerGleichung liefert: Pij H|φ⟩ = EPij |φ⟩ . Durch Einschieben von 1̂ = P−1 ij Pij erhalten wir: Pij HP−1 ij (Pij |φ⟩) = E(Pij |φ⟩) . Dies zeigt: Vertauschen der Teilchen i, j in der Wellenfunktion |φ⟩ → Pij |φ⟩ verlangt die Transformation des Hamilton-Operators H → Pij HP−1 ij . Für den Hamilton-Operator zweier identischer Teilchen gilt die Operatorbeziehung H(ξ2 , ξ1 ) = P12 H(ξ1 , ξ2 )P−1 12 . Hiermit lässt sich die Symmetriebeziehung (30.19) in koordinatenunabhängiger Form P12 HP−1 12 = H bzw. [P12 , H] = 0̂ ausdrücken. Wir können deshalb die Eigenfunktionen |φ ν1 ν2 ⟩ des Hamilton-Operators des Systems zweier identischer Teilchen, H|φ ν1 ν2 ⟩ = E ν1 ν2 |φ ν1 ν2 ⟩ , gleichzeitig als Eigenfunktionen des Operators P12 der Permutation der beiden Teil chen wählen: P12 |φ ν1 ν2 ⟩ = |φ ν2 ν1 ⟩ = λ|φ ν1 ν2 ⟩ . Wegen (P12 )2 = 1,̂ siehe Gl. (30.14), sind die Eigenwerte des Permutationsoperators λ = ±1 und seine Eigenfunktionen sind entweder symmetrisch oder antisymmetrisch: |φ ν2 ν1 ⟩ = ±|φ ν1 ν2 ⟩ . Die Wellenfunktion eines Systems aus zwei identischen Teilchen ist deshalb entwe der symmetrisch oder antisymmetrisch bezüglich Vertauschung der beiden Teilchen. Dieses Ergebnis lässt sich unmittelbar auf ein System von N identischen Teilchen ver allgemeinern.
296 | 30 Vielteilchensysteme
30.5 Systeme identischer Teilchen Besitzt irgendein Paar des Systems die Eigenschaft, durch symmetrische bzw. anti symmetrische Wellenfunktionen beschrieben zu werden, so muss wegen der Un unterscheidbarkeit der Teilchen auch jedes andere Teilchenpaar diese Eigenschaft besitzen. Die Wellenfunktion eines Systems von identischen Teilchen muss damit entweder symmetrisch oder antisymmetrisch bezüglich Vertauschung zweier beliebi ger Teilchen sein: Pij |φ ν1 ...ν i ...ν j ...ν N ⟩ ≡ |φ ν1 ...ν j ...ν i ...ν N ⟩ = ±|φ ν1 ...ν i ...ν j ...ν N ⟩ . Ferner müssen offenbar die Wellenfunktionen sämtlicher Zustände eines Systems einund dasselbe Symmetrieverhalten besitzen. Das heißt: Falls Vertauschung des i-ten und j-ten Teilchens in einer Wellenfunktion das Vorzeichen unverändert lässt (wech selt), muss dies für alle Wellenfunktionen des Systems gelten. Anderenfalls könnten wir aufgrund des Superpositionsprinzips Wellenfunktionen konstruieren, die weder symmetrisch noch antisymmetrisch sind. Da jede Permutation aus Transpositionen erzeugt werden kann, muss die Wellenfunktion auch für jede beliebige Vertauschung von Teilchen entweder unverändert bleiben oder ihr Vorzeichen ändern. Die Wellen funktionen |φ⟩, die sich bei Vertauschung zweier Teilchen nicht ändern, Pij |φ⟩ = |φ⟩, müssen folglich auch unter einer beliebigen Permutation P der Teilchen invariant blei ben: P|φ⟩ = |φ⟩ . (30.20) Die Wellenfunktionen |φ⟩, die bei Vertauschen zweier Teilchen ihr Vorzeichen wech seln, Pij |φ⟩ = −|φ⟩, multiplizieren sich hingegen nach Gl. (30.13) bei einer beliebigen Permutation P der Teilchen mit deren Charakter χ(P): P|φ⟩ = χ(P)|φ⟩ .
(30.21)
N-Teilchen-Wellenfunktionen mit der Eigenschaft (30.20) bzw. (30.21) werden als total symmetrisch bzw. total antisymmetrisch bezeichnet. Wir erhalten damit das wichtige Ergebnis: Systeme aus identischen Teilchen werden entweder durch total symmetrische oder total antisymmetrische Wellenfunktionen beschrieben. Identische Teilchen mit total symmetrischer (antisymmetrischer) Wellenfunktion werden als Bosonen (Fermionen) bezeichnet. Wir setzen im Folgenden voraus, dass die Wechselwirkung zwischen den Teilchen vernachlässigbar ist. Für identische Teilchen sind die Einteilchen-Hamilton-Operato ren für alle Teilchen dieselben. Es ist somit kein Index zur Unterscheidung erforder lich und wir werden deshalb H (i) (ξ i ) durch h(ξ i ) ersetzen. Der Hamilton-Operator des
30.5 Systeme identischer Teilchen | 297
wechselwirkungsfreien N-Teilchen-Systems ist damit durch H = ∑ h(ξ i ) ,
ξ i = (x i , m si , . . . )
(30.22)
i
gegeben. Wir setzen voraus, dass wir das Einteilchenproblem bereits gelöst haben, d. h. die Lösungen der Einteilchen-Schrödinger-Gleichung h(ξ)φ ν (ξ) = ϵ ν φ ν (ξ) und somit die Wellenfunktion der einzelnen Teilchen φ ν i (ξ i ) ≡ ⟨ξ i |ν i ⟩(i) bereits kennen. Für ein System von N unterscheidbaren (nicht wechselwirkenden) Teilchen ist die Wellenfunktion durch das Produkt der Wellenfunktionen der einzel nen Teilchen (30.3) ⟨ξ1 , . . . , ξ N |ν1 , . . . , ν N ⟩ = ⟨ξ1 |ν1 ⟩(1) ⟨ξ2 |ν2 ⟩(2) . . . ⟨ξ N |ν N ⟩(N) = φ ν1 (ξ1 )φ ν2 (ξ2 ) . . . φ ν N (ξ N )
(30.23)
gegeben. Die Produktwellenfunktion ist offenbar Eigenfunktion des Hamilton-Opera tors (30.22) des wechselwirkungsfreien Vielteilchensystems H|ν1 , . . . , ν N ⟩ = E|ν1 , . . . , ν N ⟩ , zur Energie E = ϵ ν1 + ⋅ ⋅ ⋅ + ϵ ν N . Die Produktwellenfunktion |ν1 , . . . , ν N ⟩ (30.23) gibt jedoch an, welches der Teilchen i sich in welchem Zustand |ν i ⟩ befindet. Für nicht unterscheidbare Teilchen ist dies je doch eine Information, die nicht verfügbar ist. Für Systeme aus identischen Teilchen können wir nur angeben, wie viele Teilchen sich in welchem Zustand befinden. Die Produktwellenfunktion (30.23) enthält deshalb für ein System aus identischen Teil chen irrelevante Information. Außerdem hatten wir gesehen, dass für identische Teil chen die Wellenfunktionen entweder total symmetrisch oder total antisymmetrisch bezüglich Vertauschung der Teilchen sind. Für Bose-Systeme muss die Wellenfunktion total symmetrisch sein. Wir können aus der Produktwellenfunktion total symmetrische Wellenfunktionen erzeugen, in dem wir über alle Permutationen P der Teilchen in den Produktfunktionen summie ren, (+)
|ν1 , ν2 , . . . , ν N ⟩ = N+ (N) ∑ |ν p1 , ν p2 , . . . ν P N ⟩ P
= N+ (N) ∑ |ν p1 ⟩(1) |ν p2 ⟩(2) . . . |ν p N ⟩(N) , P
und somit die irrelevante Information eliminieren. Den Vorfaktor N+ (N) können wir aus der Normierung bestimmen.
298 | 30 Vielteilchensysteme
Aus den Produktwellenfunktionen lassen sich auch total antisymmetrische Wel lenfunktionen erzeugen. Dies gelingt ähnlich wie bei der Symmetrisierung, indem wir über alle Permutationen summieren, jedoch zusätzlich jede Produktfunktion mit dem Charakter der Permutation (30.7) multiplizieren: (−)
|ν1 , ν2 , . . . , ν N ⟩ = N− (N) ∑ χ(P)|ν p1 , ν p2 , . . . ν P N ⟩ P
= N− (N) ∑ χ(P)|ν p1 ⟩(1) |ν p2 ⟩(2) . . . |ν p N ⟩(N) .
(30.24)
P
Da jede einzelne Produktwellenfunktion |ν p1 ⟩(1) . . . |ν p N ⟩(N) Eigenfunktion von H (30.22) zur selben Energie E = ϵ ν1 + ⋅ ⋅ ⋅ + ϵ ν N ist, gilt dies auch für die (anti-)symmetrischen Wellenfunktionen (±)
(±)
H|ν1 , . . . ν N ⟩ = (ϵ ν1 + ⋅ ⋅ ⋅ + ϵ ν N )|ν1 , . . . , ν N ⟩ . (+)
In den total symmetrischen Wellenfunktionen |ν1 . . . ν N ⟩ können mehrere der Ein teilchen-Quantenzahlen ν i denselben Wert annehmen, d. h., mehrere Bosonen kön nen sich in ein und demselben Einteilchenzustand befinden. Demgegenüber ver (−) schwindet die total antisymmetrische Wellenfunktion |ν1 . . . ν N ⟩ , wenn zwei Sätze von Einteilchen-Quantenzahlen übereinstimmen, ν i = ν j für i ≠ j. In einem Fermi-Sys tem können sich deshalb nie zwei Teilchen in ein und demselben Einteilchenzustand befinden. Dies ist der Inhalt des Pauli-Prinzips. Das Pauli-Prinzip hat weitreichende Konsequenzen für den Aufbau unserer Mate rie und gibt insbesondere eine Erklärung für die Schalenstruktur der Elektronenhülle und des periodischen Systems der chemischen Elemente. Die Elektronen in einem Atom besetzen die Quantenzustände niedrigster Energie. Aufgrund des Pauli-Prinzips kann sich jedoch in jedem Zustand höchstens ein Elektron befinden, sodass die Elek tronen sukzessiv die energetisch niedrigst liegenden Zustände in einem Atom beset zen, bis alle Elektronen untergebracht sind. Die Elektronenanordnungen der ersten zehn chemischen Elemente sind in Tab. 30.1 angegeben. Wie wir beim Wasserstoff-Atom in Abschnitt 18.3 kennengelernt haben, beträgt die Entartung einer Hauptschale: n−1
2 ∑ (2l + 1) = 2n2 , l=0
wobei n die Hauptquantenzahl ist und der Faktor 2 von der Entartung im Elektronen spin kommt. Auf die erste Hauptschale n = 1 (l = 0) passen demnach genau zwei Elektronen. Diese Schale ist ab dem Helium-Atom gefüllt. In der zweiten Hauptscha le n = 2 finden acht Elektronen Platz. Diese Schale wird erstmals beim Neon-Atom aufgefüllt, das zehn Elektronen besitzt.
30.6 Spin-Statistik-Theorem |
299
Tab. 30.1: Elektronenverteilung der ersten zehn chemischen Elemente im Grundzustand. Die Notati on nl k (n = 1, 2, 3, . . . Hauptquantenzahl, l = 0, 1, . . . , n − 1 = s, p, d, . . . Drehimpulsquanten zahl) besagt, dass sich – sofern vorhanden – in der l-ten Unterschale der n-ten Schale k Elektronen [k ≤ 2(2l + 1)] befinden.
1H 2 He 3 Li 4 Be 5B 6C 7N 8O 9F 10 Ne
Element
Elektronenkonfiguration
Wasserstoff Helium Lithium Beryllium Bor Kohlenstoff Stickstoff Sauerstoff Fluor Neon
1s1 1s2 1s2 2s1 1s2 2s2 1s2 2s2 2p 1 1s2 2s2 2p 2 1s2 2s2 2p 3 1s2 2s2 2p 4 1s2 2s2 2p 5 1s2 2s2 2p 6
Das chemische Verhalten der Atome wird durch ihre Schalenstruktur bestimmt. Abgeschlossene Elektronenschalen sind chemisch inaktiv. Die chemische Aktivität kommt dadurch zustande, dass Atome ihre Elektronen so austauschen, dass abge schlossene Schalen entstehen. Atome, die bereits vollständig abgeschlossene Schalen besitzen, sind deshalb chemisch inaktiv. Dies sind die Edelgase Helium, Neon, Argon, Krypton, Xenon und Radon, bei denen sämtliche Elektronenschalen abgeschlossen sind.
30.6 Spin-Statistik-Theorem Es besteht ein direkter Zusammenhang zwischen dem Spin der Teilchen und der Sym metrie ihrer Wellenfunktion: Teilchen mit ganzzahligem Spin werden durch total symmetrische Wellenfunktio nen beschrieben und sind folglich Bosonen. Teilchen mit halbzahligem Spin werden durch total antisymmetrische Wellenfunktionen beschrieben und sind folglich Fer mionen. Dieser Zusammenhang wurde von W. Pauli abgeleitet und wird als Spin-Statistik-Theo rem bezeichnet. Auf seinen Beweis soll aufgrund seiner Komplexität verzichtet wer den. Eine Übersicht über die gegenwärtig als elementar angesehenen fundamentalen Teilchen, aus denen unsere gesamte (bekannte) Materie aufgebaut ist, wurde in den Abschnitten 26.7 und 26.8 gegeben.
300 | 30 Vielteilchensysteme
Wie wir oben gesehen haben, bestimmt die Symmetrie der Wellenfunktionen die Besetzungszahlen der Zustände, d. h., wie viele Teilchen einer Sorte sich in einem Einteilchenzustand befinden können. Für Bose-Systeme kann ein Einteilchenzustand mit beliebig vielen Teilchen besetzt werden. Demgegenüber kann ein Einteilchenzu stand für Fermi-Systeme entweder nur unbesetzt oder mit einem Teilchen besetzt sein. Die bisherigen Überlegungen lassen sich unmittelbar auch auf zusammengesetzte Teil chen verallgemeinern. Unter einem zusammengesetzten Teilchen verstehen wir einen Satz von aneinander gebundenen Elementarteilchen. Beispiele für zusammengesetzte Teilchen sind die Atome. Das Wasserstoff-Atom ist aus einem Proton und einem Elek tron zusammengesetzt, die durch die Coulomb-Wechselwirkung gebunden sind. Ein anderes Beispiel sind die Mesonen, die aus einem Quark und einem Antiquark aufge baut sind. Durch die starke Wechselwirkung zwischen den Quarks können diese nicht frei, sondern nur in Bindungszuständen wie den Mesonen oder Baryonen existieren, siehe Abschnitt 26.8. Die Symmetrie der Wellenfunktionen von zusammengesetzten Teilchensystemen ergibt sich unmittelbar aus dem Symmetrieverhalten der Wellenfunktionen bezüglich Vertauschen der Elementarteilchen, da die Vertauschung eines zusammengesetzten Teilchens dem Austausch von Gruppen von Elementarteilchen entspricht. Offenbar verhält sich ein vollständig aus Bosonen aufgebautes zusammengesetztes Teilchen wie ein Boson, d. h. wird durch total symmetrische Wellenfunktionen beschrieben. Enthält das zusammengesetzte Teilchen auch Fermionen, so bestimmt die Anzahl der Fermionen die Statistik des zusammengesetzten Teilchens. Für eine gerade Anzahl von Fermionen verhält sich das zusammengesetzte Teilchen wie ein Boson, da der Austausch von Fermionenpaaren die bezüglich Austausch von Elementarteilchen total antisym metrische Wellenfunktion nicht ändert. Enthält das zusammengesetzte Teilchen hinge gen eine ungerade Anzahl von Fermionen, so verhält es sich selbst wie ein Fermion. Dies ist in Übereinstimmung mit der Drehimpuls-Kopplung. Eine gerade Anzahl von halb zahligen Spins koppelt stets zu einem ganzzahligen Gesamtspin, während eine unge rade Anzahl von halbzahligen Spins zu einem halbzahligen Gesamtspin koppelt. Für die Wellenfunktion des zusammengesetzten Teilchens gilt somit ebenfalls das SpinStatistik-Theorem. Als Beispiel betrachten wir die stark wechselwirkenden „Elementarteilchen“, die Hadronen. Die elementaren Bausteine der Hadronen sind die Quarks und Gluonen. Quarks sind Fermionen mit Spin s = 1/2, während Gluonen den Spin s = 1 besitzen. Die Anzahl der Gluonen im Hadron ist damit irrelevant für die Statistik der Hadronen, die allein durch die Anzahl der Quarks bestimmt wird. Ein Meson ist aus einem Quark und einem Antiquark aufgebaut, die beide Spin 1/2 besitzen und somit zum Gesamtspin S = 0 oder S = 1 koppeln können. Die Meso nen müssen sich deshalb wie Bosonen verhalten. Die Baryonen sind aus drei Quarks aufgebaut. Elementare Drehimpuls-Algebra liefert, dass der Gesamtspin die Werte 1/2 und 3/2 annehmen kann. Baryonen müssen sich deshalb wie Fermionen verhal
30.7 Observablen von Systemen identischer Teilchen |
301
ten. Dies wird in der Tat beobachtet: Im Grundzustand besitzen die Mesonen Spin 0 oder 1, während die Baryonen Spin 1/2 oder 3/2 besitzen. Als weiteres Beispiel betrachten wir das Helium-Atom. Die chemischen Eigen schaften der Elemente werden durch die Elektronenhülle bestimmt. Helium-Atome besitzen eine abgeschlossene Elektronenschale (die (n = 1)-Schale ist mit 2 Elektro nen besetzt) und ist deshalb chemisch inaktiv, d. h. ein Edelgas. Da die abgeschlos sene Elektronenschale im Grundzustand den Spin 0 besitzt, ist der Gesamtspin eines Helium-Atoms durch seinen Kernspin gegeben. Helium existiert in zwei Isotopen, 3 He und 4 He. Beide Isotope haben natürlich dieselbe Elektronenschale, unterscheiden sich jedoch in ihrem Atomkern. Der 3 He-Kern ist aus zwei Protonen und einem Neu tron aufgebaut, während der 4 He-Kern zwei Protonen und zwei Neutronen enthält. Die drei Nukleonen des 3 He können nur zu halbzahligen Spins koppeln, während die vier Nukleonen des 4 He-Kerns zu ganzzahligem Gesamtspin koppeln. Wir erwarten deshalb, dass 3 He-Atome sich wie Fermionen, 4 He-Atome jedoch wie Bosonen ver halten. Dies wird in der Tat beobachtet: 3 He-Atome zeigen die für Fermionen typische Suprafluidität, die analog der Supraleitung der Elektronen ist, siehe Kapitel 36. Dem gegenüber zeigen 4 He-Atome typische Bose-Einstein-Kondensation, siehe Kapitel 32.
30.7 Observablen von Systemen identischer Teilchen Wir hatten oben festgestellt, dass die Wellenfunktion eines Systems aus identischen Teilchen, (±) (±) (±) |φ⟩ ≡ |φ ν1 ...ν N ⟩ = |ν1 , . . . , ν i , . . . , ν j , . . . , ν N ⟩ , bei Vertauschung zweier Fermionen das Vorzeichen ändert, bei Vertauschung zweier Bosonen hingegen unverändert bleibt.¹ Bezeichnen wir wieder mit Pij den Permutati onsoperator, der das i-te mit dem j-ten Teilchen vertauscht, so gilt offenbar: (±)
(±)
Pij |φ⟩ = |ν1 , . . . , ν j , . . . , ν i , . . . , ν N ⟩ (±)
= ±|φ⟩ .
(30.25)
In der Quantentheorie werden messbare Größen bekanntlich durch hermitesche Ope ratoren beschrieben. Die Symmetrie bzw. Antisymmetrie der Wellenfunktionen hat unmittelbar Konsequenzen für das Verhalten der Operatoren O gegenüber Vertau schung von Teilchen. In der Tat, betrachten wir den Erwartungswert eines solchen
1 Diese Aussage gilt auch für gemischte Systeme, die sowohl Bosonen als auch Fermionen enthalten. Wird in einem solchen System ein Fermion mit einem Boson vertauscht, ändert sich das Vorzeichen der Wellenfunktion (nicht), wenn das Fermion dabei eine ungerade (gerade) Anzahl von Fermionen passiert, d. h., wenn dabei eine ungerade (gerade) Anzahl von Vertauschungen benachbarter Fermio nen erforderlich ist.
302 | 30 Vielteilchensysteme
Operators, der eine physikalisch messbare Größe darstellt, (±)
(±)
⟨φ|O|φ⟩ ,
und benutzen die Eigenschaft (30.25), so erhalten wir: ⟨φ|O|φ⟩ = ⟨φ|P†ij OPij |φ⟩ .
(±)
(±)
(±)
(±)
(±)
Da diese Beziehung für beliebige Wellenfunktionen |φ⟩ gelten muss, erhalten wir die Operatoridentität P†ij OPij = O . Multiplizieren wir diese Gleichung von links mit dem Permutationsoperator Pij und benutzen (30.14) P†ij = P−1 ij , so erhalten wir: [Pij , O] = 0̂ .
(30.26)
Da sich jede beliebige Permutation von N Elementen aus Zweier-Permutationen (Transpositionen) aufbauen lässt, erhalten wir das wichtige Ergebnis: Die Observablen eines Systems aus identischen Teilchen vertauschen mit den Permutationsoperatoren [P, O] = 0̂ .
(30.27)
Damit existiert keine Observable, die die Individualität der Teilchen festlegt. Dies war natürlich für ununterscheidbare Teilchen zu erwarten. Die Bedingung (30.27) ist trivial erfüllt für sogenannte Einteilchenoperatoren, die sich als Summe der Operatoren der einzelnen Teilchen darstellen lassen: N
O(ξ1 , ξ2 , . . . , ξ N ) = ∑ O(i) (ξ i ) . i=1
Die Wechselwirkung zwischen zwei Teilchen wird durch sogenannte Zweiteilchen operatoren beschrieben, die gleichzeitig in den Hilbert-Räumen zweier Teilchen wir ken bzw. definiert sind und damit von den Koordinaten zweier Teilchen abhängen: O(ξ1 , ξ2 , . . . , ξ N ) = ∑O(i,j) (ξ i , ξ j ) .
(30.28)
i Eion . Dieser Zustand n1 = n2 = 2 kann folglich kein Bindungszustand sein, sondern liegt im Kontinuum. Er wird jedoch als Resonanz beobachtet. Demnach sind alle unge störten Zustände, in denen sich beide Elektronen in angeregten Einteilchen-Niveaus n1 , n2 ≥ 2 befinden, keine Bindungszustände, da sie eine höhere Energie als der ein fach ionisierte Zustand n1 = 1, n2 = ∞ besitzen (siehe Abb. 30.4). Befinden sich beide Elektronen in einem angeregten Zustand, so kommt es deshalb zur spontanen Emis sion eines der beiden Elektronen (Autoionisation), wobei das im Atom verbleibende Elektron in den Grundzustand zurückfällt. E
(2, 2)
(1, ∞) (1, 3) (1, 2)
(1, 1)
−27,2 eV
} } Kontinuum } } −54,4 eV } −60,4 eV } } } } −68,0 eV } } } } } } } Ionisationsenergie } } } } } } } } } −108,8 eV} } }
Abb. 30.4: Das ungestörte Spektrum des Helium-Atoms. Angegeben sind die Energien eines Elek trons, wenn sich das andere Elektron im Grundzustand n = 1 befindet, sowie die Energie des Zu stands, in welchem beide Elektronen sich im ersten angeregten Zustand n = 2 befinden.
314 | 30 Vielteilchensysteme
30.9.2 Einschluss der Coulomb-Wechselwirkung der Elektronen in Störungstheorie Der Hamilton-Operator des Helium-Atoms, insbesondere die Coulomb-Wechselwir kung zwischen den Elektronen, ist unabhängig vom Spin. Deshalb kann dieser Ha milton-Operator keine Zustände mit verschiedenem Gesamtspin der Elektronen mi schen. Der Gesamtspin ist erhalten, und da der Hamilton-Operator nicht vom Spin abhängt, fallen die Spinfunktionen bei der Berechnung des Erwartungswerts heraus. Der Gesamtspin bestimmt jedoch die Symmetrie des Ortsanteils der Wellenfunkti on. Nach Multiplikation von Gl. (30.40) mit der Coulomb-Wechselwirkung (30.42) und Ausnutzung deren Symmetrie V (1,2) (x1 , x2 ) = V (2,1) (x2 , x1 ) sowie Integration über die Teilchenkoordinate erhalten wir für die Energiekorrektur in erster Ordnung Störungstheorie: ∆E Sα1 α2 = ⟨α 1 α 2 , SM|H (1,2) |α 1 α 2 , SM⟩ (−)
(−)
(±)
(±)
= ⟨φ α1 α2 |V (1,2) |φ α1 α2 ⟩ = (I α1 α2 ± J α1 α2 ) / (1 + δ α1 α2 ) , wobei das obere (untere) Vorzeichen für den Spin S = 0 (S = 1) gilt und e2 φ α (x1 )φ α2 (x2 ) 4π|x1 − x2 | 1 e2 |φ α2 (x2 )|2 = ∫ d3 x1 d3 x2 |φ α1 (x1 )|2 4π|x1 − x2 |
I α1 α2 = ∫ d3 x1 d3 x2 φ∗α1 (x1 )φ∗α2 (x2 )
bzw. J α1 α2 = ∫ d3 x1 d3 x2 φ∗α1 (x1 )φ∗α2 (x2 )
e2 φ α (x2 )φ α2 (x1 ) 4π|x1 − x2 | 1
den direkten bzw. Austauschterm des Erwartungswerts der Coulomb-Wechselwirkung repräsentieren. Wie wir oben gesehen haben, existieren gebundene Zustände nur, wenn sich mindestens eines der Elektronen im Einteilchenzustand niedrigster Ener gie befindet. Für diese Fälle kann man zeigen, dass sowohl der direkte Term I als auch der Austauschterm J positiv sind. Wir erhalten deshalb in führender Ordnung Stö rungstheorie das in Abb. 30.5 dargestellte Schema der Energieniveaus. Dieses besitzt eine anschauliche physikalische Interpretation. Im Spin-(S = 0)-Zustand ist die räum liche Wellenfunktion symmetrisch und die Elektronen sind bestrebt, sich sehr nahe zu kommen. Insbesondere können sie sich beliebig dicht beieinander aufhalten. Deshalb spüren sie die Coulomb-Abstoßung sehr stark, und dieser Zustand wird stark nach oben verschoben. Demgegenüber ist die Ortswellenfunktion zum Gesamtspin S = 1 antisymmetrisch. Die beiden Elektronen weichen einander aus, kommen sich daher nicht sehr nahe, sodass die Coulomb-Abstoßung nicht sehr wirksam werden kann. Die Austauschkorrelationen J kompensieren hier teilweise die direkte Abstoßung der Cou lomb-Wechselwirkung I. Direkte Coulomb-Abstoßung I und Austauschkorrelationen J wirken demnach konstruktiv im Spin-(S = 0)-Zustand (Parahelium) und destruktiv im Spin-(S = 1)-Zustand (Orthohelium).
30.10 Die Hartree-Fock-Methode | 315
S=0 J
I
J S=1
E α1 + E α2 Abb. 30.5: Verschiebung und Aufspaltung der Elektronenniveaus im Helium-Atom aufgrund der ab stoßenden Coulomb-Wechselwirkung der Elektronen.
Abschließend betonen wir, dass diese Aufspaltung der Niveaus mit verschie denem Spin erhalten wurde, obwohl der Hamilton-Operator unabhängig vom Spin ist. Die Aufspaltung der Niveaus mit verschiedenem Spin ist allein eine Folge der Identität der Teilchen, die eine total antisymmetrische Wellenfunktion fordert. Da (S = 0)- und (S = 1)-Zustände verschiedene Symmetrien bezüglich Vertauschen der beiden Teilchen besitzen, haben diese Zustände auch im Ortsanteil ihrer Wellenfunk tion verschiedene Symmetrien – verschiedene Ortswellenfunktionen geben natürlich verschiedene Erwartungswerte für den ortsabhängigen Hamilton-Operator. Befinden sich beide Elektronen im selben (Einteilchen-)Zustand φ α (x), so ver (−) schwindet die antisymmetrische Ortswellenfunktion (30.43), φ αα (x1 , x2 ) = 0, und die Elektronen können nur den Gesamtdrehimpuls S = 0 besitzen, der folglich über dem ungestörten Zustand liegt, siehe Abb. 30.5.
30.10 Die Hartree-Fock-Methode Für Atome mit mehr als zwei Elektronen wird die störungstheoretische Behandlung der Elektronenniveaus wegen der Coulomb-Wechselwirkung der Elektronen unterein ander fragwürdig. Letztere wächst mit der Kernladungszahl Z wie Z 2 , während das Po tenzial des Kerns nur linear in Z ansteigt. Demzufolge sollte für große Z die Wechsel wirkungsenergie der Elektronen gegenüber der Summe der Einteilchenenergien der Elektronen im Coulomb-Potenzial des Atomkerns dominieren und die Störungstheo rie sollte folglich zusammenbrechen. Im Folgenden wollen wir deshalb eine nichtstö rungstheoretische Behandlung der Coulomb-Wechselwirkung der Elektronen vorneh men, die es uns erlaubt, auch Atome mit größeren Kernladungszahlen zu behandeln. Bei dieser Methode geht man von der Vorstellung aus, dass ein Elektron in einem Atom neben dem Coulomb-Potenzial des Atomkerns noch ein zusätzliches effektives Poten zial erfährt, das durch seine Wechselwirkung mit den übrigen Elektronen der Hülle entsteht. Zweckmäßigerweise legen wir den Atomkern in den Koordinatenursprung und be trachten ihn der Einfachheit halber wieder als unendlich schwer. Er besitzt dann keine
316 | 30 Vielteilchensysteme
kinetische Energie und der Hamilton-Operator der Elektronen ist durch H = ∑ H (k) + k
1 ∑ V (k,l) 2 k=l̸
gegeben. Hierbei ist H (k) =
p2k Ze2 + ≡ H0 (x k ) 2m 4π|x k |
der Hamilton-Operator eines einzelnen Elektrons im Coulomb-Feld des Atomkerns der Kernladungszahl Z und V (k,l) =
e2 ≡ V(x k , x l ) 4π|x k − x l |
ist die Coulomb-Wechselwirkung zwischen dem k-ten und l-ten Elektron. Im Folgen den werden wir uns jedoch nicht auf geladene Vielteilchensysteme mit CoulombWechselwirkung beschränken, sondern beliebige Einteilchenoperatoren H0 (x) =
p2 + U0 (x) 2m
und spinunabhängige Zweiteilchenwechselwirkungen V (k,l) = V(x k , x l ) zulassen. Zur Berechnung der Grundzustandsenergie des Vielteilchensystems benutzen wir die Variationsmethode. Uneingeschränkte Variation der Energie E[ψ] = ⟨ψ|H|ψ⟩ → min
(30.46)
unter der Nebenbedingung ⟨ψ|ψ⟩ = 1 liefert die exakte Lösung der stationären Schrödinger-Gleichung, siehe Kapitel 21. Für ein System mit vielen Teilchen ist die uneingeschränkte Variation unmöglich und wir sind gezwungen, den Raum der Testwellenfunktionen |ψ⟩ einzuschränken. Der Erfolg des Variationsverfahren hängt bekanntlich von der Wahl der Testfunktionen |ψ⟩ ab. Bei der praktischen Durchführung des Variationsproblems ist man gezwungen, einen Kompromiss zwischen Komplexität der Testwellenfunktionen und der Güte der Nähe rungen einzugehen.
30.10.1 Hartree-Näherung Eine besonders einfache Testwellenfunktion für ein Vielteilchensystem ist die Pro duktwellenfunktion ψ(ξ 1 , ξ2 , . . . , ξ N ) = ϕ1 (ξ1 )ϕ2 (ξ2 ) . . . ϕ N (ξ N ) , wobei ϕ i (ξ i ) ≡ φ i (x i )χ i (m si )
(30.47)
30.10 Die Hartree-Fock-Methode | 317
die Wellenfunktion des i-ten Teilchens ist. Sie setzt sich zusammen aus einer Ortsund einer Spinwellenfunktion. Im Folgenden werden wir jedoch der Einfachheit hal ber wieder den Spin der Teilchen vernachlässigen. Dies ist gerechtfertigt, da der Ha milton-Operator H unabhängig vom Spin ist und folglich die Spinwellenfunktionen bei der Bildung des Erwartungswerts von H herausfallen. Die Produktwellenfunktion N
ψ (x1 , x2 , . . . , x N ) = ∏ φ k (x k )
(30.48)
k=1
beschreibt ein System unabhängiger, unterscheidbarer Teilchen. Sie trägt weder der Wechselwirkung zwischen den Teilchen noch ihrer Ununterscheidbarkeit (Identität) Rechnung. Effekte, die von der Identität der Teilchen herrühren, wie die Austausch korrelationen, können deshalb im Rahmen dieses Ansatzes nicht erfasst werden. Um für Fermi-Systeme das Pauli-Prinzip wenigstens teilweise zu berücksichtigen, müssen sämtliche Einteilchenwellenfunktionen in dem Produktansatz verschieden bzw. zu einander orthogonal sein. Mit Hilfe des Variationsprinzips erhalten wir die bestmögli che Wellenfunktion im Rahmen unseres Variationsansatzes (30.47), d. h. die bestmög liche Beschreibung des wechselwirkenden Systems aus identischen Teilchen als ein System unabhängiger, unterscheidbarer Teilchen. Wir setzen die Produktwellenfunktion (30.48) in das Energiefunktional (30.46) ein: N 1 N E[ψ] = ∑ ⟨ψ|H0 (x k )|ψ⟩ + ∑ ⟨ψ|V(x k , x l )|ψ⟩ . 2 k=l=1 k=1 ̸ Da H (k) = H0 (x k ) nur auf die k-te Teilchenkoordinate x k und V (k,l) = V(x k , x l ) nur auf die k-te und die l-te Teilchenkoordinate wirken, erhalten wir: E[ψ] = ∑ ∫ d3 x k φ∗k (x k )H0 (x k )φ k (x k ) k
+
1 ∑ ∫ d3 x k d3 x l φ∗k (x k )φ∗l (x l )V(x k , x l )φ k (x k )φ l (x l ) , 2 k=l̸
(30.49)
wobei wir die korrekte Normierung der Einteilchenwellenfunktionen ∫ d3 xφ∗k (x)φ k (x) = 1
(30.50)
vorausgesetzt haben. Diese Normierung muss bei der Variation des Energiefunktio nals erhalten werden. Die Nebenbedingung (30.50) können wir durch Einführung von Lagrange-Multiplikatoren ϵ k gewährleisten, was auf das Energiefunktional ̄ E[ψ] = E[ψ] − ∑ ϵ k ∫ d3 x φ∗k (x)φ k (x) k
(30.51)
318 | 30 Vielteilchensysteme führt. Variation nach den Einteilchenwellenfunktionen φ k (x) liefert unter Berücksich tigung von⁵ δφ k (y) = δ kl δ(x − y) δφ l (x) die Beziehung (H0 (x) + V k (x)) φ k (x) = ϵ k φ k (x) ,
(30.52)
Vk (x) = ∑ ∫ d3 x l V(x, x l )|φ l (x l )|2
(30.53)
wobei die Größe
l =k ̸
ein effektives Potenzial für das k-te Teilchen darstellt, das von den Wellenfunktionen φ l (x) der übrigen Teilchen l ≠ k abhängt. Es ist nur eine Funktion der Koordinate des k-ten Teilchens. Es stellt ein mittleres Potenzial dar, welches das k-te Teilchen auf grund seiner Wechselwirkung mit den übrigen Teilchen erfährt. Führen wir die Dichte 2 ρ k (x) = ∑ φ l (x)
(30.54)
l =k ̸
dieser Teilchen ein, so lässt sich das mittlere Potenzial V k (x) (30.53) als Faltung der Wechselwirkung mit dieser Teilchendichte schreiben: V k (x) = ∫ d3 y V(x, y)ρ k (y) .
(30.55)
Das effektive Potenzial Vk (x) entsteht damit durch Mittelung der Zweiteilchenwech selwirkung über die Dichte der übrigen Teilchen. Es wird deshalb als mittleres Feld bezeichnet. Gleichung (30.52) ist die Hartree-Gleichung. Sie hat die Form einer Einteil chen-Schrödinger-Gleichung. Durch den Produktansatz im Variationsproblem ist es uns gelungen, das N-Teil chen-Problem auf N gekoppelte Einteilchen-Probleme h k (x)φ k (x) = ϵ k φ k (x)
(30.56)
zurückzuführen, wobei die Kopplung durch das mittlere Feld V k (x) im effektiven Ein teilchen-Hamilton-Operator h k (x) = H0 (x) + V k (x)
(30.57)
hervorgerufen wird, da das mittlere Potenzial V k (x) für das k-te Teilchen von den Wellenfunktionen der übrigen Teilchen abhängt. Die Einteilchen-Schrödinger-Glei chungen (30.56) sind jedoch keine gewöhnlichen Differenzialgleichungen, sondern
5 Man beachte, dass bei der Variation nach einer speziellen Einteilchenfunktion φ l (x) die übrigen Einteilchenwellenfunktionen φ k=l̸ (x) festgehalten werden.
30.10 Die Hartree-Fock-Methode | 319
wegen der φ l=k̸ (x)-Abhängigkeit des mittleren Felds sogenannte Integrodifferenzial gleichungen, die sich i. A. nur iterativ lösen lassen. Zur iterativen Lösung der HartreeGleichung wählt man einen Satz von N linear unabhängigen, i. A. orthonormierten (0) Einteilchen-Funktionen φ k (x), z. B. die untersten Zustände im harmonischen Oszil latorpotenzial, berechnet mit diesen Wellenfunktionen das mittlere Potenzial Vk (x) (30.53) und löst mit diesem Potenzial die Hartree-Gleichung (30.52). Dies liefert ei (1) nen neuen Satz von N Wellenfunktionen φ k (x), mit denen die Iteration wiederholt wird, bis es zur Konvergenz der Einteilchenenergien ϵ k und der Wellenfunktionen φ k (x) kommt. Das mit den Lösungen der Hartree-Gleichung berechnete effektive Po tenzial Vk (x) (30.53) wird als Hartree’sches selbstkonsistentes oder mittleres Feld be zeichnet. Da das mittlere Potenzial V k (x) (30.55) und damit der Hartree-Hamiltonian h k (x) (30.57) für jedes der N Teilchen prinzipiell verschieden ist, sind die Einteilchenwel lenfunktionen φ k (x), die als Lösung der Hartree-Gleichung (30.56) erhalten werden, nicht orthogonal. Für eine sehr große Anzahl von Teilchen hängt jedoch das mittlere Potenzial V k (x) nur wenig von k ab und es empfiehlt sich deshalb, die Dichte ρ k (x) (30.54) der (N − 1) Teilchen l ≠ k durch die Einteilchendichte des Gesamtsystems zu ersetzen: 2 ρ(x) = ∑ φ l (x) . l
Das mittlere Potenzial (30.55) V(x) = ∫ d3 y V(x, y)ρ(y) und damit der Hartree-Hamiltonian sind dann für alle Zustände dieselben. Da der Hartree-Hamiltonian außerdem hermitesch ist, erhalten wir dann orthogonale Ein teilchenzustände φ k (x). Für lokalisierte Probleme, wie z. B. die Berechnung der Elektronenenergie im Atom, wird das numerische Lösen der Hartree-Gleichung dadurch erschwert, dass das mittlere Hartree-Potenzial V k (x) im Gegensatz zum Coulomb-Potenzial des Atom kerns nicht sphärisch symmetrisch ist. Eine Vereinfachung ergibt sich, wenn das Hartree-Potenzial V k (x) durch das kugelsymmetrische Potenzial ̄ k (|x|) = 1 ∫ dΩ Vk (x) Vk (x) → V 4π ersetzt wird, das durch Mittelung über den Raumwinkel entsteht. Für translationsinvariante Probleme, wie z. B. bei unendlich ausgedehnter Kern materie ist die Teilchendichte (30.54) und damit das mittlere Potenzial Vk (x) (30.55) ortsunabhängig. Die Lösungen der Hartree-Gleichung sind dann ebene Wellen. Die ϵ k hatten wir ursprünglich als Lagrange-Multiplikatoren eingeführt. In der Hartree-Gleichung (30.56) erscheinen sie als die Eigenwerte des Hartree-HamiltonOperators h k (x) (30.57) und können deshalb als die Einteilchenenergien in Hartree-
320 | 30 Vielteilchensysteme
Näherung interpretiert werden. Beachten wir, dass ϵ k = ⟨φ k |h k |φ k ⟩ = ∫ d3 x φ∗k (x)H0 (x)φ k (x) + ∑ ∫ d3 x ∫ d3 y φ∗k (x)φ∗l (y)V(x, y)φ k (x)φ l (y) , l =k ̸
so erkennen wir, dass die Summe der Einteilchenenergien ∑ ϵk k
nicht mit dem Energiefunktional in Hartree-Näherung E[ψ] (30.49) zusammenfällt, sondern die Wechselwirkungsenergie doppelt enthält: 1 E[ψ] = ∑ ϵ k − ∑ ∫ d3 x ∫ d3 y φ∗k (x)φ∗l (y)V(x, y)φ k (x)φ l (y) . 2 k=l̸ k Der zweite Term korrigiert die doppelte Berücksichtigung der Wechselwirkung in der Summe der Einteilchenenergien.
30.10.2 Hartree-Fock-Näherung Der Nachteil der Hartree-Näherung besteht in der Vernachlässigung der Identität der Teilchen durch den Produktansatz für die Wellenfunktion. Für Fermionen sollte die Wellenfunktion antisymmetrisch bezüglich Vertauschen von Teilchenpaaren sein. Deshalb ist für Fermi-Systeme die Slater-Determinante (30.32) φ1 (x1 ) φ1 (x2 ) . . . φ1 (x N ) 1 φ2 (x1 ) φ2 (x2 ) . . . φ2 (x N ) ψ(x1 , . . . , x N ) = (30.58) .. .. . √N! .. . . φ N (x1 ) φ N (x2 ) . . . φ N (x N ) ein besserer Variationsansatz. Hierbei sind die φ k (x) wieder orthonormierte Einteil chenwellenfunktionen. Zur Berechnung des Energiefunktionals E[ψ] = ⟨ψ|H|ψ⟩ be merken wir, dass ein Einteilchenoperator im Determinantenzustand (30.58) densel ben Erwartungswert wie im Produktzustand (30.47) besitzt. Dies erkennt man sofort, wenn man die Determinante nach einer Zeile oder Spalte entwickelt (Laplace’scher Entwicklungssatz). Entwicklung nach der i-ten Spalte liefert: ψ(x1 , . . . , x N ) =
1 N ∑ (−1)i+k φ k (x i )ψ ik (x1 , . . . , x i−1 , x i+1 , . . . , x N ) , √N k=1
(30.59)
wobei ψ ik ein normierter Zustand des (N − 1)-Fermionensystems ist, in welchem der k-te Einteilchenzustand φ k und die i-te Koordinate x i fehlen.⁶ Man kann sich leicht 6 Wir haben hier N! = N(N − 1)! benutzt und den Normierungsfaktor 1/√(N − 1)! in die Zustände ψ ik einbezogen.
30.10 Die Hartree-Fock-Methode | 321
davon überzeugen, dass ∗
∫ ∏ d3 x m ψ ik (. . . )ψ il (. . . ) = δ kl m=i̸
gilt, vorausgesetzt, die Einteilchenwellenfunktionen φ k (x) der Slater-Determinante (30.58) sind korrekt normiert, Gl. (30.50). Folglich liefert der Zustand (30.59) zum Er wartungswert von H0 (x i ) (für festes i) den Beitrag ⟨ψ|H0 (x i )|ψ⟩ = =
1 N ∑ ∫ d3 x i φ∗k (x i )H0 (x i )φ k (x i ) N k=1 1 N ∑ ⟨k|H0 |k⟩ . N k=1
Dieser ist unabhängig von dem betrachteten Teilchen i, was die Identität der Teil chen widerspiegelt. Deshalb erhalten wir für den Erwartungswert des gesamten Ein teilchenoperators: N
N
N
1 N ∑ ⟨k|H0 |k⟩ = ∑ ⟨k|H0 |k⟩ . N k=1 i=1 k=1
⟨ψ| ∑ H0 (x i )|ψ⟩ = ∑ ⟨ψ|H0 (x i )|ψ⟩ = ∑ i=1
i=1
(30.60)
Für einen Zweiteilchenoperator sind nur zwei der N Einteilchenwellenfunktionen re levant. Zur Berechnung des Erwartungswerts der Zweiteilchenwechselwirkung ent wickeln wir deshalb die ψ ik (30.59) noch nach der j-ten Spalte. Das führt auf einen Zustand N 1 ij ψ ik (. . . ) = ∑ (−1)j+l φ l (x j )ψ kl (. . . ) , (30.61) √N − 1 l=1 (l =k) ̸
ij
wobei die ψ kl normierte Slater-Determinanten der Dimension (N − 2) sind, die aus der ursprünglichen Determinante durch Streichen der i-ten und j-ten Spalte und der k-ten und l-ten Zeile entstehen. Dementsprechend fehlen die i-te und j-te Koordinate ij im Argument von ψ kl (. . . ). Für i < j haben wir: ij
ij
ψ kl (. . . ) = ψ kl (x1 , . . . , x i−1 , x i+1 , . . . , x j−1 , x j+1 , . . . , x N ) . Für festes (i, j) gilt wegen der Antisymmetrie der Slater-Determinante die Orthogona litätsbeziehung ∫ ∏ d3 x m ψ kl (. . . )∗ ψ k l (. . . ) = δ kk δ ll − δ kl δ lk . ij
ij
m=i,j ̸
Einsetzen von (30.61) in (30.59) liefert für die Gesamtwellenfunktion die Entwicklung ψ(x1 , . . . , x N ) =
1 √N(N − 1)
N
N
ij
∑ ∑ (−1)i+j+k+l φ k (x i )φ l (x j )ψ kl (. . . ) . k=1 l=1 (l =k) ̸
322 | 30 Vielteilchensysteme
Mit dieser Darstellung der Slater-Determinante erhalten wir für den Erwartungswert von V (i,j) = V(x i , x j ) (für festes i und j): ⟨ψ|V(x i , x j )|ψ⟩ =
N N N N 1 ∑ ∑ (−1)i+j+k+l ∑ ∑ (−1)i+j+k +l N(N − 1) k=1 l=1 k =1 l =1 (l =k ̸ )
(l=k) ̸
× ∫ d3 x i ∫ d3 x j φ∗k (x i )φ∗l (x j )V(x i , x j )φ k (x i )φ l (x j )(δ kk δ ll − δ kl δ lk ) =
N N 1 ∑ ∑ [⟨kl|V|kl⟩ − ⟨kl|V|lk⟩] , N(N − 1) k=1 l=1 (l =k) ̸
wobei ⟨kl|V|mn⟩ = ∫ d3 x ∫ d3 y φ∗k (x)φ∗l (y)V(x, y)φ m (x)φ n (y) die Matrixelemente der Zweiteilchenwechselwirkung bezeichnen. Das Ergebnis ist un abhängig von dem betrachteten Teilchenpaar (i, j), was aufgrund der Identität der Teilchen nicht verwunderlich ist. Wegen N
N
∑ 1 = ∑ ∑ 1 = N(N − 1) i =j̸
i=1 j=1 (j=i) ̸
erhalten wir für den Erwartungswert der gesamten Zweiteilchenwechselwirkung in der Slater-Determinante |ψ⟩ (30.58): ⟨ψ| ∑ V(x i , x j )|ψ⟩ = ∑[⟨kl|V|kl⟩ − ⟨kl|V|lk⟩] . i =j̸
(30.62)
k,l
Die hier erhaltene Antisymmetrisierung der Zweiteilchen-Matrixelemente der Wech selwirkung ist eine Folge der Antisymmetrie der Slater-Determinante bezüglich Teil chenaustausch und stellt den Unterschied zur Hartree-Näherung dar, welche die Produktwellenfunktion (30.47) benutzt. Mit (30.60) und (30.62) finden wir für das Energiefunktional (30.46) für die Slater-Determinante (30.58) E[ψ] = ∑⟨k|H0 |k⟩ + k
1 ∑[⟨kl|V|kl⟩ − ⟨kl|V|lk⟩] . 2 k,l
(30.63)
Diese Größe wird als Hartree-Fock-Energie bezeichnet. Variation von (30.63) nach den Einteilchenwellenfunktionen φ∗k (x) liefert unter Berücksichtigung der Nebenbedin gung ⟨k|k⟩ = 1, siehe Gl. (30.51), die Hartree-Fock-Gleichung ̃ k (x)) φ k (x) = ϵ k φ k (x) . (H0 (x) + V
(30.64)
30.11 Das ideale Fermi-Gas
| 323
Diese besitzt formal dieselbe Gestalt wie die Hartree-Gleichung (30.52), jedoch ist das mittlere Einteilchen-Potenzial jetzt durch ̃ k (x)φ k (x) = ∑ ∫ d3 y φ∗ (y)V(x, y)[φ l (y)φ k (x) − φ k (y)φ l (x)] V l l =k ̸
gegeben. Der von der Antisymmetrie der Slater-Determinante herrührende zweite ̃ k (x) und Term wird als Austauschterm bezeichnet. Durch ihn ist das mittlere Feld V damit der Hartree-Fock-Hamiltonian nicht lokal. Die Hartree-Fock-Gleichung (30.64) lässt sich genau wie die Hartree-Gleichung (30.52) iterativ lösen. Die obigen Berechnungen der Erwartungswerte lassen sich wesentlich vereinfa chen, wenn die Methode der Zweiten Quantisierung benutzt wird, die im Kapitel 31 entwickelt wird.
30.11 Das ideale Fermi-Gas Wir betrachten ein Gas aus nicht wechselwirkenden Fermionen, die in einem quader förmigen Volumen V = L1 L2 L3 mit den Abmessungen L i , i = 1, 2, 3 eingeschlossen sind. Die Fermionen sollen sich frei im Inneren des Volumens bewegen, jedoch dieses nicht verlassen können. Die undurchdringlichen Außenwände stellen für die Teilchen unendlich hohe Potenzial wände dar {0 , V(x) = V(x1 , x2 , x3 ) = { ∞, {
0 < x i < L i , i = 1, 2, 3 , sonst.
Für 0 < x i < L i können wir die Schrödinger-Gleichung durch den Produktansatz φ(x1 , x2 , x3 ) = φ1 (x1 )φ2 (x2 )φ3 (x3 ) auf die freie eindimensionale Schrödinger-Gleichung φi (x i ) = k 2i φ i (x i ) ,
ki =
√2mE i ℏ
für jede der drei Dimensionen zurückführen, sodass E = E1 + E2 + E3
(30.65)
die Gesamtenergie des Teilchens ist. Mit den durch die unendlich hohen Potenzial wände induzierten Randbedingungen φ i (x i = 0) = 0 = φ i (x i = L i )
(30.66)
324 | 30 Vielteilchensysteme
lauten die normierten Lösungen (siehe Kapitel 8.5) φ n i (x i ) = √
2 sin(k i x i ) , Li
wobei die Wellenzahlen quantisiert sind ki = ni
π , Li
n i = 1, 2, 3, . . . .
(30.67)
Da sin(−x) = − sin x, liefern negative n i keine neuen Zustände, sodass die n i auf die positiven ganzen Zahlen beschränkt sind. Die Gesamtenergie (30.65) eines Teilchens erhalten wir deshalb zu 3 (ℏk i )2 ℏ2 k 2 E=∑ = , (30.68) 2m 2m i=1 wobei k = |k| der Betrag des Wellenvektors k = k1 e1 + k2 e2 + k3 e3 ist. Unterscheidbare Teilchen oder Bosonen würden sämtlich den Zustand niedrigs ter Energie n1 = n2 = n3 = 1 besetzen. Für Fermionen ist dies jedoch aufgrund des Pauli-Prinzips nicht möglich. Vielmehr können diese jeden Einteilchenzustand nur mit 2s + 1 Teilchen besetzen, wobei s der Spin des Teilchens ist. Die Fermionen besetzen somit sukzessiv die untersten Einteilchenzustände mit 2s + 1 Teilchen, bis sämtliche Teilchen untergebracht sind. Die dabei maximal auftretende (Einteilchen-) Energie wird als Fermi-Energie ϵF bezeichnet. Sie hängt offenbar von der Teilchenzahl N ab. Um ϵF zu bestimmen, betrachten wir die Einteilchenzustände im dreidimen sionalen Raum mit den kartesischen Koordinaten k i=1,2,3. An jeden Koordinatenwert k i = n i π/L i (30.67) zeichnen wir eine Ebene senkrecht zur i-ten Koordinatenachse. Die Schnittpunkte dieser Ebenen im Oktanten k i > 0 repräsentieren die möglichen Einteil chenzustände. Sie bilden ein reguläres kubisches Gitter mit Gitterabstand a i = π/L i , siehe Abb. 30.6. Die minimalen Quader des Gitters (auch Elementarzellen genannt) besitzen das Volumen π π π π3 a1 a2 a3 = . (30.69) = L1 L2 L3 V Man überzeugt sich leicht, dass es so viele elementare Quader wie Zustände auf dem Gitter gibt. Formal lässt dies sich wie folgt erkennen: Durch die Verschiebung ki = ni
π 1 π → k ∗i = (n i + ) Li 2 Li
(30.70)
in jeder Richtung i = 1, 2, 3 entsteht aus dem ursprünglichen k-Gitter ein neues k∗ -Gitter, das als duales Gitter bezeichnet wird. Die dualen Gitterpunkte k∗ sind aber gerade die Mittelpunkte der Elementarzellen (Quader) des ursprünglichen k-Gitters.
30.11 Das ideale Fermi-Gas
| 325
Abb. 30.6: Kubisches Gitter, das durch die quantisierten Wellenzahlen k i=1,2,3 (30.67) eines Teil chens in einer Box aufgespannt wird. Jeder Gitterpunkt definiert einen Einteilchenzustand im k-Raum. Gezeigt ist auch eine Elementarzelle dieses Gitters.
Aus der bijektiven Beziehung (30.70) zwischen k und k∗ folgt aber, dass es genau einen Zustand k (d. h. einen Gitterpunkt) pro Elementarzelle gibt. Jeder Einteilchen zustand nimmt deshalb im k-Raum das Volumen der Elementarzelle (30.69) ein. Da die Einteilchenenergie (30.68) nur vom Betrag des Wellenvektors k abhängt, besetzen die Fermionen eine Kugel im k-Raum (genauer den durch k i > 0 definierten Oktanten der Kugel), die als Fermi-Kugel bezeichnet wird, siehe Abb. 30.7. Der Radius dieser Kugel, k F , definiert den Fermi-Impuls pF = ℏk F bzw. die Fermi-Energie ϵF =
(pF )2 (ℏk F )2 = 2m 2m
und ist dadurch festgelegt, dass jeweils 2s + 1 Fermionen ein Volumen (30.69) π 3 /V einnehmen. Für N Fermionen führt dies auf die Bedingung 1 4 3 N π3 πk F = , 8 3 2s + 1 V die k F als Funktion der Teilchendichte ρ=
N V
festlegt: 1/3
kF = (
6π2 ρ) 2s + 1
.
(30.71)
326 | 30 Vielteilchensysteme
Abb. 30.7: Fermi-Kugel (mit Radius kF ) der besetzten Einteilchenzustände im k-Raum.
Streng genommen bilden die besetzten Zustände im k-Raum keine Kugel, sondern ei ne Gitterapproximation der Kugel. Für (große Teilchenzahlen N und) große Volumi na, wie dies für die Elektronen in einem Festkörper der Fall ist, ist jedoch π 3 /V sehr klein und die Einteilchenzustände sind quasi kontinuierlich verteilt, sodass die glat te Kugeloberfläche eine sehr gute Näherung zur tatsächlichen eckigen Oberfläche des Volumens ist, das durch die besetzten Zustände des k-Raums aufgespannt wird. Die Grenzflächen zwischen den besetzten und unbesetzten Zuständen im k-Raum werden allgemein als Fermi-Flächen bezeichnet. Im vorliegenden Fall nichtwechsel wirkender Fermionen ist die Fermi-Fläche durch die Oberfläche der Kugel mit Ra dius k F im Oktanten k i > 0 gegeben. Für wechselwirkende Systeme besitzen die Fermi-Flächen jedoch im Allgemeinen eine kompliziertere Form. Aus Gl. (30.71) folgt für die Fermi-Energie ϵF =
2/3 ℏ2 k 2F ℏ2 6π2 . = ( ρ) 2m 2m 2s + 1
Schließlich wollen wir die Gesamtenergie des Fermi-Gases berechnen. Dazu müs sen wir die Energien sämtlicher besetzter Zustände aufsummieren. Eine Kugelschale mit Radius k und Dicke dk besitzt in einem Oktanten das Volumen (siehe Abb. 30.8) 1 (4πk 2 )dk . 8
30.11 Das ideale Fermi-Gas
| 327
Abb. 30.8: Oktant einer Kugelschale mit Radius k und Dichte dk im k-Raum.
Da jeder Zustand das Volumen π3 /V einnimmt, befinden sich in der Kugelschale 2s + 1 1 Vk 2 dk dN = (2s + 1) (4πk 2 )dk/(π 3 /V) = 8 2π2
(30.72)
Zustände. Jeder dieser Zustände besitzt die Energie ℏ2 k 2 /2m. Folglich beträgt die Energie der besetzten Kugelschale dE =
ℏ2 2s + 1 ℏ2 k 2 dN = Vk 4 dk . 2m 2m 2π2
Für die Gesamtenergie aller bis zum Fermi-Impuls ℏk F besetzten Zustände finden wir kF
E = ∫dE =
2s + 1 ℏ2 k 5F ℏ2 2s + 1 V V ∫ dk k 4 = 2 2m 2π 2 10π2 m 0
bzw. nach Einsetzen des Ausdrucks für k F (30.71) 5/3
E=
2s + 1 ℏ2 6π2 N) ( 2 10π2 m 2s + 1
V −2/3 .
(30.73)
Für die wechselwirkungsfreien Fermionen, die sich im Inneren des Volumens frei be wegen können, ist diese Energie rein kinetischer Natur und verursacht wie bei klassi schen Teilchen einen Druck auf die Wände des Behälters. Um diesen zu bestimmen,
328 | 30 Vielteilchensysteme
expandieren wir das Volumen um einen Beitrag dV. Dabei verringert sich die Energie (30.73) des Fermisystems um 2 dV . dE = − E 3 V Nach dem Energiesatz verrichtet das expandierende System die Arbeit dW = PdV = −dE an der Umgebung, woraus wir den Druck 2 E 3 V erhalten. Dieser Druck, der rein quantenmechanischen Ursprungs und letztendlich eine Konsequenz des Pauli-Prinzips ist, stabilisiert das Fermi-System und verhindert, dass es bei niedrigen Temperaturen kollabiert, wie dies Bose-Systeme tun. Er wird als Entartungsdruck bezeichnet. Allgemein werden (wechselwirkungsfreie) Fermi-Syste me bei niedrigen Temperaturen als entartete Fermi-Gase bezeichnet. P=
Zustandsbelegung des Phasenraums Wir haben oben festgestellt, dass die Quantenzahlen n i und damit die k i (30.67) prinzipiell auf positive Werte beschränkt sind. Wegen φ−n i (x) = φ n i (−x) = −φ n i (x) können wir jedoch auch mit negativen n i arbeiten bzw. mit positiven und negativen n i , wenn wir durch geeignete Zählweise ∞
∑ → n i =1
1 ∞ ∑ 2 n i =−∞
eine Doppelberücksichtigung der Zustände vermeiden. Der Term n i = 0 trägt wegen φ n i =0 (x) = 0 nicht zur Summe bei. In drei Dimensionen können wir entsprechend die Ersetzung ∞ ∞ ∞ ∞ ∞ 1 ∞ ∑ ∑ ∑ → 3 ∑ ∑ ∑ (30.74) 2 n1 =−∞ n2 =−∞ n3 =−∞ n1 =1 n2 =1 n3 =1 vornehmen. Statt über die ganzen Zahlen n i können wir auch über die quantisierten Wellen zahlen k i (30.67) summieren. Für große L i liegen diese sehr dicht auf der reellen Achse und wir können von der Summation zur Integration übergehen. Dabei müs sen wir jedoch beachten, dass jeder Einteilchenzustand im Oktanten (k i > 0) des k-Raums das Volumen (30.69) π 3 /V der Elementarzelle besetzt. Durch dieses Volu men müssen wir das Integral über die k i dividieren, um die korrekte Zählung der Einteilchenzustände zu gewährleisten. Deshalb finden wir ∞
∞
∞
∞
∞
∞
0
0
0
V ∑ ∑ ∑ ⋅ ⋅ ⋅ = ∑ ∑ ∑ ⋅ ⋅ ⋅ = 3 ∫ dk 1 ∫ dk 2 ∫ dk 3 . . . . π n1 =1 n2 =1 n3 =1 k >0 k >0 k >0 1
2
3
30.11 Das ideale Fermi-Gas |
329
Nehmen wir schließlich noch die Ersetzung (30.74) vor, so können wir über den gesamten k-Raum integrieren und erhalten die Beziehung ∞
∞
∞
∞
∞
∞
−∞
−∞
−∞
V V ∑ ∑ ∑ ⋅⋅⋅ = ∫ dk 1 ∫ dk 2 ∫ dk 3 ⋅ ⋅ ⋅ ≡ ∫ d3 k . . . . 3 (2π) (2π)3 n1 =1 n2 =1 n3 =1
(30.75)
Dies zeigt, dass wir bei der Summation über die Zustände die Einschränkung auf k i > 0 fallen lassen können und stattdessen über den gesamten k-Raum integrieren dürfen, vorausgesetzt, wir ordnen einem Zustand im k-Raum das Volumen (2π)3 /V statt (30.69) zu. In einer Kugelschale des k-Raums mit Radius k = |k| und Dicke dk befinden sich dann dN = (2s + 1)(4πk 2 )dk/((2π)3 /V) =
2s + 1 2 Vk dk 2π2
Zustände. Dieses Ergebnis stimmt mit Gl. (30.72) überein, welche durch Einschrän kung auf n i > 0, d. h. auf einen Oktanten der Kugelschale, erhalten wurde. Benutzen wir statt der Wellenzahl k den Impuls p = ℏk, so lautet (30.75) ∞
∞
∞
∑ ∑ ∑ ⋅⋅⋅ = V ∫ n1 =1 n2 =1 n3 =1
d3 p ... . (2πℏ)3
(30.76)
Jeder Zustand nimmt somit im Impulsraum das Volumen (2πℏ)3 /V ein. Im Phasenraum besetzt er daher das Volumen (2πℏ)3 . Dieses Ergebnis ist in Übereinstimmung mit der Bohr-Sommerfeld’schen Quanti sierungsbedingung (5.37), wonach sich der Phasenraum (für ein eindimensiona les System) beim Übergang zum benachbarten Energiezustand um 2πℏ vergrö ßert. Wir betonen, dass die Beziehung (30.75) bzw. (30.76) auf der Quantisierungsbedin gung (30.67) basiert, die eine Folge der Randbedingung (30.66) an die Wellenfunk tionen ist. Liegen statt Gl. (30.66) hingegen periodische Randbedingungen φ i (x i + L i ) = φ i (x i )
330 | 30 Vielteilchensysteme
vor, wie sie gewöhnlich in der Festkörperphysik auftreten, so sind die auf dem Vo lumen V = L1 L2 L3 normierten Eigenfunktionen durch φ n j (x j ) =
1 √L j
e ik j x j
gegeben, wobei die quantisierten Wellenzahlen k i jetzt die Werte ki =
2π ni , Li
n i = 0, ±1, ±2, . . .
annehmen. Sie unterscheiden sich von den Wellenzahlen (30.67) durch einen zu sätzlichen Faktor 2. Darüber hinaus können die n i jetzt sämtliche ganze Zahlen annehmen. Die zu (30.75) bzw. (30.76) analoge Beziehung lautet in diesem Fall ∞
∑
∞
∑
∞
∑ ⋅ ⋅ ⋅ ≡ ∑∑∑ ⋅ ⋅ ⋅
n1 =−∞ n2 =−∞ n3 =−∞
k1 k2 k3
=V∫
d3 k d3 p ⋅ ⋅ ⋅ ≡ V ∫ ⋅⋅⋅ . (2π)3 (2πℏ)3
(30.77)
Man beachte, dass die rechten Seiten von Gln. (30.77) und (30.76) übereinstimmen, obwohl sie unterschiedlichen Ursprungs sind. Wir werden des Öfteren von diesen Beziehungen Gebrauch machen.
30.12 Die Thomas-Fermi-Näherung Die Anwendung der Hartree-(Fock-)Methode zur Berechnung der Elektronenvertei lung in einem Atom ist numerisch sehr aufwendig, insbesondere für große Kern ladungszahlen. In diesen Atomen befinden sich die meisten Elektronen in Einteil chenzuständen mit relativ großen Hauptquantenzahlen, sodass eine semiklassische Behandlung möglich ist. Für große Teilchenzahlen ist der Beitrag eines einzelnen Teilchens zum mittle ren Potenzial V k (x) (30.53) unwichtig und wir können die Summation über sämtliche besetzten Einteilchenzustände (einschließlich des Zustands k) erstrecken. Sämtliche Teilchen sehen dann das gleiche mittlere Potenzial U(x) = U0 (x) + V(x) ,
V(x) = ∫d 3 y V(x, y)ρ(y) ,
(30.78)
wobei ρ(x) = ∑ |φ k (x)|2 k
(30.79)
30.12 Die Thomas-Fermi-Näherung |
331
die gesamte Teilchendichte ist. Im Folgenden werden wir eine Methode ableiten, die eine genäherte Berechnung der Teilchendichte erlaubt, ohne die Hartree-Gleichungen explizit lösen zu müssen. Wir setzen voraus, dass das mittlere Potenzial eine glatte Funktion des Orts ist, ̄ entwickeln kön sodass wir es in eine Taylor-Reihe um einen zunächst beliebigen Ort x nen: U(x) = U(x̄ ) + (x − x̄ )⋅∇U(x̄ ) + ⋅ ⋅ ⋅ . (30.80) Wir setzen diese Entwicklung in die Hartree-Gleichung (30.52) ein: (
p2 + U(x̄ ) + (x − x̄ )⋅∇U(x̄ ) + ⋅ ⋅ ⋅ ) φ k (x) = ϵ k φ k (x) . 2m
(30.81)
Falls die Entwicklung (30.80) konvergent ist und wir diese bis zur unendlichen Ord nung ausführen, erhalten wir natürlich das korrekte Ergebnis unabhängig von der Wahl des Orts x̄ . Dies würde jedoch auch keine Vereinfachung mit sich bringen. Bre chen wir die Entwicklung (30.80) in unterster Ordnung ab, so vereinfacht sich die Hartree-Gleichung (30.81) zu: (
p2 + U(x̄ )) φ k (x) = ϵ k φ k (x) . 2m
Das Potenzial ist dann unabhängig von der Teilchenkoordinate x und die zugehörigen Eigenfunktionen φ k (x) sind durch ebene Wellen φ k (x) ∼ e ik⋅x gegeben, was auf die Energieeigenwerte ϵ k (x̄ ) =
(ℏk)2 + U(x̄ ) 2m
(30.82)
̄ sind dies aber gerade die Eigenenergien nichtwechselwirkender führt.⁷ Für festes x Teilchen in einem konstanten Potenzial. Für nichtkonstante Potenziale kann die Er setzung U(x) → U(x̄ ) offensichtlich nur für x ≃ x̄ brauchbare Näherungen liefern. Wir ersetzen deshalb in den obigen Ausdrücken den Ort x̄ durch die tatsächliche Teil chenkoordinate x. Unsere Teilchen erhalten dann eine ortsabhängige Energie ϵ k (x), Gl. (30.82), und werden folglich durch ihre Koordinate x und ihre Wellenzahl k (bzw. Impuls p = ℏk) beschrieben, die bekanntlich den Phasenraum aufspannen. Wir wis sen bereits aus Abschnitt 30.11, dass jeder Einteilchenzustand ein Volumen von (2πℏ)3 im Phasenraum einnimmt. Im Phasenraumvolumen d3 x d3 p befinden sich folglich d2 N =
d3 x d3 p d3 x d3 k = (2πℏ)3 (2π)3 2
p ̄) bedeutet de facto die Vernachlässigung von [ 2m 7 Die Ersetzung U(x) → U( x , U(x)], was nur für schwach ortsabhängige Potenziale eine brauchbare Näherung ist.
332 | 30 Vielteilchensysteme
Zustände. Besetzen wir gemäß dem Pauli-Prinzip jeden Zustand des Phasenraums, beginnend bei k = 0 bis zu einer maximalen Einteilchenenergie ϵF , der Fermienergie, mit jeweils einem Fermion, so erhalten wir die Teilchendichte ρ(x) =
dN d2 N = Θ (ϵF − ϵ k (x)) ∫ d3 x d3 x
=∫
d3 k Θ (ϵF − ϵ k (x)) . (2π)3
(30.83)
Die bisher noch unbekannte Fermi-Energie ϵF wird so gewählt, dass die Gesamtteil chenzahl ! ∫ d3 x ρ(x) = N (30.84) den (für das betrachtete Fermi-System) vorgegebenen Wert N annimmt. Definieren wir den zugehörigen (lokalen) Fermi-Impuls k F (x) durch ϵF =
(ℏk F (x))2 + U(x) , 2m
(30.85)
d3 k Θ(k 2F (x) − k 2 ) . (2π)3
(30.86)
so lautet die Teilchendichte (30.83): ρ(x) = ∫
Elementare Ausführung der k-Integration liefert: ρ(x) =
1 3 k (x) Θ(ϵF − U(x)) , 6π2 F
(30.87)
wobei die Θ-Funktion die Bedingung k 2F (x) > 0 berücksichtigt, die sich aus Gl. (30.86) an der unteren Integrationsgrenze k 2 = 0 ergibt. Dabei wurde (30.85) benutzt, wonach Θ(k 2F (x)) = Θ (ϵF − U(x)) und der Fermi-Impuls durch k F (x) =
1 √2m(ϵF − U(x)) ℏ
(30.88)
gegeben ist. Man beachte, dass das mittlere Potenzial U(x) bzw. V(x) (30.78) von der Teilchendichte ρ(x) (30.87) selbst abhängt. Für feste Fermi-Energien ϵF stellt Gl. (30.87) mit k F (x), definiert in (30.88), und U(x), definiert in (30.78), eine nichtli neare und nichtlokale Gleichung für die Teilchendichte ρ(x) dar, die iterativ gelöst werden muss. Diese Gleichung ist jedoch wesentlich einfacher als das Hartree-Fockoder Hartree-Problem zu lösen, da hier nur eine einzige Funktion, die Teilchendichte
30.12 Die Thomas-Fermi-Näherung | 333
ρ(x), bei gegebenem äußeren Potenzial U0 (x) und gegebener Zweiteilchenwechsel wirkung V(x, y) iterativ bestimmt werden muss. Diese Vereinfachung des Vielfer mionenproblems auf die effektive Gleichung (30.87) für die Teilchendichte wird als Thomas-Fermi-Näherung bezeichnet. Die Thomas-Fermi-Approximation wird nicht nur zur genäherten Behandlung von wechselwirkenden Fermi-Systemen angewandt, sondern auch für Fermionen, die sich (ohne gegenseitige Wechselwirkung nur) in einem gegebenen äußeren Potenzial befinden, wenn man die numerische Lösung der Einteilchen-Schrödinger-Gleichung umgehen möchte. Bei der Thomas-Fermi-Näherung wird de facto das Potenzial lokal durch eine Konstante ersetzt. Die Näherung ist deshalb besonders gut für räumlich schwach veränderliche Potenziale und für große Teilchenzahlen, da bei diesen (we gen des Pauli-Prinzips) die Mehrheit der Teilchen große Energien besitzen, sodass semiklassische Betrachtungen anwendbar sind. In der Thomas-Fermi-Näherung wer den die Teilchen de facto wie klassische Teilchen in einem (lokal) konstanten Poten zial behandelt. Von der Quantentheorie wird nur das Pauli-Prinzip bei der Besetzung des Phasenraums berücksichtigt. Um die charakteristischen Eigenschaften der Thomas-Fermi-Näherung aufzuzei gen, betrachten wir wechselwirkungsfreie Fermionen im isotropen harmonischen Os zillatorpotenzial 1 U(x) = U0 (x) = mω2 x2 . 2 Bei gegebenem mittleren Potenzial U(x) sind der Fermi-Impuls k F (x) (30.88) und die Teilchendichte ρ(x) (30.87) explizit als Funktion der Fermi-Energie ϵ F bekannt und wir müssen nur noch letztere über Gl. (30.84) für die vorgegebene Teilchenzahl N be stimmen. Das Integral (30.84) über die Teilchendichte (30.87) lässt sich für das Oszil latorpotenzial analytisch auswerten. Dazu benutzen wir natürlich sphärische Koordi naten: r cl 3/2 1 2m 3/2 1 N= ∫ dΩ ∫ dr r2 ( 2 ) (ϵF − mω2 r2 ) . 2 2 6π ℏ 0
Hierbei bezeichnet r cl = |x cl | den klassischen Umkehrpunkt, der durch !
ϵF = U(x cl ) ≡
1 mω2 r2cl 2
⇒
r2cl =
2ϵF mω2
definiert ist. Das Integral über den Raumwinkel Ω lässt sich trivial ausführen und lie fert den Faktor 4π. Zur Auswertung des verbleibenden Integrals über den Radius füh ren wir die dimensionslose Variable t= ein und finden:
r r cl 1
2 2m 3/2 3 3/2 ) r cl ϵF ∫ dt t2 (1 − t2 )3/2 . N= ( 3π ℏ2 0
334 | 30 Vielteilchensysteme
Mit
1
∫ dt t2 (1 − t2 )3/2 =
π 32
0
erhalten wir schließlich:
1 ϵF 3 (30.89) ( ) . 6 ℏω Für gegebene Oszillatorfrequenz ω ist die Fermi-Energie ϵF allein durch die Teilchen zahl bestimmt. Auflösen der Beziehung (30.89) nach der Fermi-Energie ϵF und Einset zen in Gl. (30.87) liefert mit (30.88) die Teilchendichte als Funktion der Teilchenzahl N und des Radius r. Für sphärisch symmetrische Potenziale wie das des isotropen harmonischen Os zillators liefert die Thomas-Fermi-Näherung offenbar stets sphärisch symmetrische Teilchendichten (30.87), die in der exakten Teilchendichte (30.79) nur bei abgeschlos senen (Drehimpuls-) Schalen auftreten, siehe Abschnitt 17.6.3. Solche (sphärisch sym metrischen) abgeschlossenen l-Schalen lassen sich natürlich auch in der kartesischen Basis ausdrücken. Dazu ist es jedoch am bequemsten, abgeschlossene Hauptschalen zu betrachten, die durch die Gesamtoszillatorzahl N=
n = n1 + n2 + n3
(30.90)
charakterisiert sind, wobei n i die Anzahl der Schwingungsquanten in der kartesischen Richtung i = 1, 2, 3 bezeichnet. Um ein Fermi-System mit abgeschlossenen Hauptschalen zu erhalten, beset zen wir gemäß (30.90) und entsprechend dem Pauli-Prinzip jeden Oszillatorzustand |n1 n2 n3 ⟩ mit einem Fermion bis zu einer maximalen Oszillatorquantenzahl nmax . Die Energieniveaus des isotropen harmonischen Oszillators mit Gesamtoszillatorzahl (Hauptquantenzahl) n sind g n -fach, gn =
1 (n + 2)(n + 1) , 2
entartet (siehe Abschnitt 12.9 bzw. Abschnitt 17.6). Die Gesamtzahl der Zustände mit n ≤ nmax beträgt deshalb: nmax
Zmax = ∑ g n = n=0
Mit
nmax
∑ n=
n=0 nmax
∑ n2 =
n=0
finden wir: Zmax =
1 nmax 2 ∑ (n + 3n + 2) . 2 n=0
1 nmax (nmax + 1) , 2 1 nmax (nmax + 1)(2nmax + 1) 6
1 (nmax + 1)(nmax + 2)(nmax + 3) . 6
30.12 Die Thomas-Fermi-Näherung | 335
Bei Vernachlässigung des Spins können wir entsprechend dem Pauli-Prinzip jeden Os zillatorzustand mit einem Fermion besetzen. In den Oszillatorzuständen mit n ≤ nmax befinden sich dann Zmax Fermionen. Für Zmax Teilchen sind im Grundzustand alle Drehimpulsschalen bis zur Hauptquantenzahl n = nmax abgeschlossen, sodass ρ(x) sphärisch symmetrisch ist und die Thomas-Fermi-Methode (mit N = Zmax ) besonders gut funktionieren sollte. Für nicht abgeschlossene Schalen ist die Elektronenvertei lung deformiert. In Abb. 30.9 ist die exakte Teilchendichte für nmax = 2, 3, 4, 5, 6, 7 gezeigt. Dies entspricht einer Gesamtteilchenzahl von N = Zmax = 10, 20, 35, 56, 84, 120. Die gestrichelte Kurve zeigt die zugehörige Dichte in Thomas-Fermi-Näherung. Die Fluk tuation der exakten Teilchendichte im Inneren des Potenzials sowie der Abfall der Teilchendichte am Potenzialrand werden durch die Thomas-Fermi-Näherung nicht korrekt beschrieben. Während die exakte Teilchendichte nur exponentiell abklingt, verschwindet die Thomas-Fermi-Dichte am klassischen Umkehrpunkt r cl . Für die mitt lere Teilchendichte liefert die Thomas-Fermi-Methode jedoch eine brauchbare Nähe rung. 1.4 120
1.2 84 1 56
r03 ρ
0.8
35 0.6 20 0.4
10
0.2 0 0
0.5
1
1.5
2
2.5
3
3.5
4
4.5
5
r/r0 Abb. 30.9: Teilchendichte eines nichtwechselwirkenden Fermi-Systems, das sich im isotropen har monischen Oszillatorpotenzial befindet und die untersten nmax = 2, 3, 4, 5, 6, 7 Hauptschalen besetzt. Die durchgezogenen Kurven sind die exakten Teilchendichten, die gestrichelten Kurven sind die entsprechenden Dichten in Thomas-Fermi-Näherung (r0 = (ℏ/mω)1/2 ist die Oszillatorlänge (17.66)).
31 Zweite Quantisierung Die Zweite Quantisierung ist eine elegante Methode, quantenmechanische Systeme aus identischen Teilchen zu beschreiben. Der Name „Zweite Quantisierung“ ist et was irreführend. Es handelt sich hierbei nicht um eine neue Quantentheorie, die über die ursprüngliche Quantentheorie hinausgeht, sondern um eine vereinfachende Beschreibung von Systemen aus identischen Teilchen in der gewöhnlichen Quan tentheorie, die in diesem Kontext auch als Erste Quantisierung bezeichnet wird. Die Methode ist insbesondere vorteilhaft für die Beschreibung von Prozessen, bei de nen die Teilchenzahl nicht erhalten bleibt, wie dies in der Quantenfeldtheorie der Fall ist. Deshalb liefert die Zweite Quantisierung auch die Basis für die Quantenfeld theorie.
31.1 Identische Teilchen Zunächst rufen wir uns noch einmal einige wesentliche Erkenntnisse des vorangegan genen Kapitels in Erinnerung. Dort hatten wir bereits festgestellt, dass in der Quan tenmechanik Teilchen derselben Sorte keine Individualität besitzen. Sie lassen sich nicht unterscheiden, sie sind ununterscheidbar oder identisch. Dies bedeutet: Es gibt keine Observable, welche die Individualität der Teilchen festlegt. Observablen eines Systems identischer Teilchen dürfen folglich nicht zwischen den einzelnen Teilchen unterscheiden und müssen deshalb bei einer beliebigen Permutation der Teilchen in variant bleiben. Daher müssen sämtliche Observablen eines Systems identischer Teil chen mit den zugehörigen Permutationsoperatoren P kommutieren [O, P] = 0̂ .
(31.1)
Diese Symmetrie der Observablen schlägt sich auch in der Wellenfunktion eines Sys tems identischer Teilchen nieder. Die Ununterscheidbarkeit oder Identität der Teil chen verlangt, dass ihre Wellenfunktion entweder total symmetrisch oder total anti symmetrisch bezüglich der Vertauschung von Teilchen ist, siehe Abschnitt 30.5. Zur Konstruktion der Wellenfunktionen für Systeme aus identischen Teilchen betrachten wir zunächst ein System aus N unterscheidbaren Teilchen. Sei ℍ(i) der Hilbert-Raum des i-ten Teilchens. Der Hilbert-Raum des N-Teilchen-Systems ist dann durch das Tensorprodukt der Hilbert-Räume der einzelnen Teilchen ℍN = ℍ(1) ⊗ ℍ(2) ⊗ ⋅ ⋅ ⋅ ⊗ ℍ(N)
(31.2)
gegeben, siehe Abschnitt 10.7. Jedes Teilchen besitzt hier seinen eigenen Unterraum und ist deshalb unterscheidbar. Sei |k⟩(i) eine vollständige Basis des Hilbert-Raumes des i-ten Teilchens ℍ(i). Eine Basis des Hilbert-Raumes des N-Teilchensystems ℍN https://doi.org/10.1515/9783110586077-009
31.1 Identische Teilchen |
337
erhalten wir nach (31.2) durch die Produktwellenfunktion¹ |k 1 , . . . , k N ⟩ = |k 1 ⟩(1) ⊗ |k 2 ⟩(2) ⊗ ⋅ ⋅ ⋅ ⊗ |k N ⟩(N) . N
(31.3)
Das Tensorproduktzeichen ⊗ werden wir in der Wellenfunktion (31.3), wie allgemein üblich, im Folgenden weglassen. Der Hilbert-Raum ℍ N (31.2) des Systems aus N un terscheidbaren Teilchen lässt sich zerlegen in Unterräume der total symmetrischen (+) (−) Wellenfunktionen ℍN , der total antisymmetrischen Wellenfunktionen ℍN und der (∼) Wellenfunktionen mit gemischter Symmetrie ℍN : (+)
(−)
(∼)
ℍN = ℍN ⊕ ℍN ⊕ ℍN .
(31.4)
Aus den Basisfunktionen (31.3) des Systems aus N unterscheidbaren Teilchen lassen sich mit Hilfe des Symmetrisierungs- bzw. Antisymmetrisierungsoperators (30.15), (+) (30.16) die Basiszustände von ℍ N , |k 1 , . . . , k N ⟩ = √N! S|k 1 , . . . , k N ⟩ ,
(31.5)
|k 1 , . . . , k N ⟩ = √N! A|k 1 , . . . , k N ⟩ ,
(31.6)
(+)
N
N
(−)
bzw. von ℍ N ,
(−)
N
N
konstruieren. Wegen (30.18) AS = SA = 0̂
(31.7)
sind die total symmetrischen Zustände orthogonal zu den total antisymmetrischen Zuständen: (−) (+) ⟨k 1 , . . . , k N |l1 , . . . , l N ⟩ = 0 . N N
Da die Observablen von Systemen identischer Teilchen mit sämtlichen Permutations operatoren kommutieren (31.1), müssen sie folglich auch mit dem Symmetrisierungsbzw. Antisymmetrisierungsoperator kommutieren: [S, O] = 0̂ ,
[A, O] = 0̂ .
Hieraus folgt mit (31.7), dass es keine Observablen gibt, die eine total symmetrische Wellenfunktion in eine total antisymmetrische Wellenfunktion überführen können (±) (±) oder umgekehrt. Falls also ψ ∈ ℍN , so ist auch Oψ ∈ ℍN . In einem Vielteilchensystem klassifiziert man die Observablen bzw. Operatoren nach der Anzahl der Teilchen, auf die sie wirken. Operatoren, die nur auf die Koordi nate eines einzelnen Teilchens wirken, werden als Einteilchenoperatoren bezeichnet. Für ein System aus N (unterscheidbaren) Teilchen sind dies Operatoren in ℍ N , die
1 Aus didaktischen Gründen geben wir in diesem Kapitel (im Gegensatz zum vorigen Kapitel) die Teil chenzahl N eines Zustandes als Index an.
338 | 31 Zweite Quantisierung
sich additiv aus den N Operatoren der einzelnen Teilchen zusammensetzen und des halb die Gestalt N
O = ∑ Ô i
(31.8)
i=1
besitzen, wobei Ô i , i = 1, 2, . . . , N, der Operator des i-ten Teilchens ist (d. h. der Operator des N-Teilchensystems, der auf die Koordinate des i-ten Teilchens wirkt). Beachten wir, dass ℍ N durch das Tensorprodukt der N Hilbert-Räume der einzelnen Teilchen gegeben ist, siehe Gl. (31.2), so haben die Ô i , i = 1, 2, . . . , N die explizite Form Ô i = 1̂ (1) ⊗ 1̂ (2) ⊗ ⋅ ⋅ ⋅ ⊗ Ô (i) ⊗ ⋅ ⋅ ⋅ ⊗ 1̂ (N) , (31.9) wobei Ô (i) der Operator ist, der im Einteilchen-Hilbert-Raum des i-ten Teilchens, ℍ(i), wirkt und 1̂ (i) der Einheitsoperator in diesem Raum ist. Der Einfachheit halber werden wir im Folgenden gewöhnlich die Einheitsoperatoren in den Observablen (31.9) nicht explizit angeben, sodass nach Gl. (31.8) N
O = ∑ Ô (i) .
(31.10)
i=1
Relevant sind vor allem noch Zweiteilchenoperatoren, die in der Ersten Quantisierung die Gestalt 1 O = ∑ Ô (i,j) (31.11) 2 i=j̸ besitzen, wobei Ô (i,j) ein Operator ist, der auf die Koordinate des i-ten und j-ten Teil chens wirkt. Offenbar sind sowohl die Einteilchen- als auch die Zweiteilchenoperato ren invariant gegenüber einer beliebigen Permutation der Teilchen. Somit kommutie ren sie mit den (Anti-)Symmetrisierungsoperatoren A bzw. S und können somit auch (±) als Operatoren identischer Teilchen betrachtet werden, die in den Räumen ℍN wir ken, aber nicht aus diesen Räumen herausführen.
31.2 Besetzungszahldarstellung In den Gln. (31.5), (31.6) haben wir die total (anti-)symmetrischen Basisfunktionen (±) |k 1 , . . . , k N ⟩ durch (Anti-)Symmetrisierung der Produktzustände (31.3) |k 1 , . . . , k N ⟩ N N gewonnen. Für Fermi-Systeme sind die antisymmetrisierten Zustände (31.6) korrekt normiert, falls die Einteilchenzustände |k i ⟩, aus denen die Produktzustände (31.3) auf gebaut sind, korrekt orthonormiert sind ⟨k|l⟩ = δ kl .
(31.12)
In der antisymmetrischen Wellenfunktion können nicht zwei Sätze von Einteilchen quantenzahlen k i und k j übereinstimmen, d. h. es gilt hier stets k i ≠ k j für i ≠ j. Für
31.2 Besetzungszahldarstellung | 339
Bose-Systeme hingegen kann ein Einteilchenzustand |k i ⟩ mehrfach im N-Teilchenzu (+) stand |k 1 , . . . , k N ⟩ besetzt sein, d. h. k i = k j für i ≠ j. Der symmetrisierte Zustand N
(+)
|k 1 , . . . , k N ⟩ (31.5) ist dann nicht mehr auf 1 normiert. Nehmen wir an, der Einteil N chenzustand |k⟩ tritt n k -mal im N-Teilchen-Zustand auf, wobei n k ∈ {0, 1, . . . , N} und ferner die Summe dieser Besetzungszahlen n k die Gesamtteilchenzahl N ergeben muss: ∑ nk = N . (31.13) k (+)
Der total symmetrische Zustand |k 1 , . . . , k N ⟩ enthält insgesamt N! Terme (bestehend N jeweils aus einem Produkt von N Einteilchenwellenfunktionen), von denen jedoch dann nur (∑k n k )! N! = ∏k n k ! ∏k n k ! Terme voneinander verschieden sind und diese jeweils mit der Vielfachheit ∏ k n k ! auftreten. Für die Norm der total symmetrischen Zustände (31.5) erhalten wir folglich: 2
(+)
(+)
⟨k 1 , . . . , k N |k 1 , . . . , k N ⟩ = ( N N
1 2 N! ) (∏ n k !) = ∏ n k ! , ∏k n k ! k √N! k
wobei der Faktor 1/√N! aus dem Faktor √N! in der Definition des Zustands (31.5) (±) |k 1 , . . . , k N ⟩ und dem Faktor 1/N! aus der Definition des Symmetrisierungsopera tors (30.15) resultiert. Bei Mehrfachbesetzungen der Einteilchenzustände lauten die korrekt normierten total symmetrischen Basisfunktionen: (+)
1
(+)
|{n k }⟩ ≡ |n1 , n2 , . . . , n k , . . .⟩ :=
√∏k n k !
(+)
|k 1 , . . . , k N ⟩ . N
(31.14)
Diese Zustände sind vollständig durch die Besetzungszahlen n k charakterisiert, die angeben, wie oft ein Einteilchenzustand |k⟩ in der N-Teilchen-Wellenfunktion vor kommt, bzw. mit wieviel Teilchen dieser Zustand besetzt ist, d. h. n k ist die Anzahl der Teilchen im (Einteilchen-)Zustand |k⟩. Der Index k = 1, 2, 3, . . . an den Beset zungszahlen n k bezeichnet also die Einteilchen-Quantenzahl k und nummeriert nicht die Teilchen (wie der Index i = 1, . . . , N an k i in den Basisfunktionen (31.3)). Wie be reits oben bemerkt, muss die Summe der n k die Gesamtteilchenzahl ergeben, siehe Gl. (31.13). Die Besetzungszahldarstellung (31.14) können wir auch für Fermi-Systeme benut zen, indem wir definieren (−)
(−)
(−)
|{n k }⟩ ≡ |n1 , n2 , . . . , n k , . . .⟩ := |k 1 , k 2 , . . . , k N ⟩ , N
(31.15)
wobei wieder (31.13) gilt und aufgrund der Antisymmetrie der Wellenfunktion die Be setzungszahlen auf n k = 0, 1 beschränkt sind. Mit dieser Besonderheit lassen sich
340 | 31 Zweite Quantisierung
Bose- und Fermi-Systeme weitgehend parallel behandeln. Wir werden deshalb im Fol (±) genden das Superskript (±) an den Zuständen |{n k }⟩ oftmals weglassen. Aus der Definition (31.14) bzw. (31.15) folgt unmittelbar, dass Zustände |n1 , n2 , . . . ⟩ mit verschiedenen Besetzungszahlen zueinander orthogonal sind: ⟨n1 , n2 , . . . |n1 , n2 , . . . ⟩ = δ n1 n1 δ n2 n2 . . . .
(31.16)
Damit sind insbesondere auch Zustände mit verschiedener Gesamtteilchenzahl ortho gonal. Da für Fermi-Systeme die Besetzungszahlen prinzipiell auf n k = 0, 1 beschränkt sind, ist die Besetzungszahldarstellung für diese Systeme etwas aufgebläht. Für Fermi-Systeme ist es oft bequemer, die Basiszustände nur durch Angabe der besetzten Einteilchenzustände, d. h. der Zustände mit n k = 1, zu charakterisieren, wie dies in (−) der Notation (31.6) |k 1 , . . . , k n ⟩N geschieht. In der nichtrelativistischen Physik, sowohl in der klassischen Mechanik als auch in der nichtrelativistischen Quantenmechanik, bleibt die Identität und die Anzahl der Teilchen streng erhalten. Wir wissen jedoch, dass es in der Natur Prozesse gibt, bei denen Teilchen spontan erzeugt und vernichtet bzw. in andere Teilchen umgewandelt werden. Als Beispiel sei der β-Zerfall erwähnt n → p + e− + ̄ν e , bei dem ein Neutron in ein Proton und ein Elektron, sowie ein Anti-Neutrino zerfällt. Beim β-Zerfall eines Atomkerns erhöht sich folglich die Anzahl der Protonen um 1, während die Anzahl der Neutronen um 1 abnimmt. Bei einem Prozess, in dem sich die Zahl der identischen Teilchen verändert, wird ein Zustandsvektor aus einem Hilbert(±) (±) Raum ℍ N in einen Zustandsvektor eines anderen Hilbert-Raumes ℍM=N ̸ überführt. Zur Beschreibung solcher Prozesse ist unsere bisherige Formulierung der Quanten theorie, die als Erste Quantisierung bezeichnet wird, nicht geeignet. (Die Operatoren, die wir bisher in der Ersten Quantisierung betrachtet haben, wirken alle nur inner halb eines Unterraumes mit fester Teilchenzahl und führen somit einen N-TeilchenZustand wieder in einen N-Teilchen-Zustand über.) Vielmehr ist es zweckmäßiger, zur (±) Beschreibung von Prozessen mit variabler Teilchenzahl sämtliche Hilbert-Räume ℍN mit den verschiedenen Teilchenzahlen N zu einem Gesamtraum ℍ(±) zusammenzu fassen, der als Fock-Raum bezeichnet wird. Dies ist Gegenstand der sogenannten Zwei ten Quantisierung, welche die Grundlage für die (relativistische) Quantenfeldtheorie ist. Bevor wir die Theorie des Fock-Raumes entwickeln, empfiehlt es sich, die alge braische Behandlung des harmonischen Oszillators zu rekapitulieren (siehe Kapi tel 12).
31.3 Der harmonische Oszillator als ein Ensemble von Phononen
| 341
31.3 Der harmonische Oszillator als ein Ensemble von Phononen In Kapitel 12 konnten wir den Hamilton-Operator des harmonischen Oszillators durch Einführung von Erzeugungs- und Vernichtungsoperatoren a† , a algebraisch diago nalisieren. Mit den Operatoren a† bzw. a ist die Erzeugung bzw. Vernichtung eines Schwingungsquants (Phonon) verbunden, d. h. der Operator a† regt den Oszillator in den nächst höher gelegenen Zustand an a† |n⟩ = √n + 1 |n + 1⟩ ,
(31.17)
während der Operator a den Oszillator in den darunter liegenden Zustand abregt: a|n⟩ = √n |n − 1⟩ .
(31.18)
Der n-te angeregte Zustand wird durch n-malige Anwendung des Operators a† auf den Grundzustand |0⟩ erzeugt |n⟩ =
1 (a† )n |0⟩ √n!
(31.19)
und lässt sich somit als ein Zustand mit n Phononen interpretieren. Da die Phono nen sämtlich durch denselben Operator a† bzw. a erzeugt bzw. vernichtet werden, existieren sie nur in einem einzigen Einteilchenzustand.² Wegen [a† , a† ] = 0 ist der n-Phononenzustand (31.19) symmetrisch bezüglich Vertauschung der Phononen und Phononen sind somit Bosonen. Der harmonische Oszillator lässt sich somit als ein Ensemble von Bosonen (Phononen) interpretieren, die nur in einem einzigen Einteil chenzustand existieren. Bei An- bzw. Abregung des harmonischen Oszillators ändert sich die Phononenzahl. Bezeichnen wir mit ℍn den (eindimensionalen) Hilbert-Raum, der nur aus dem n-ten angeregten Zustand |n⟩ besteht, so ist der gesamte Hilbert-Raum des harmoni schen Oszillators ℍ durch die direkte Summe der Hilbert-Räume der einzelnen Zu stände ∞
ℍ = ℍ0 ⊕ ℍ1 ⊕ ℍ2 ⊕ ⋅ ⋅ ⋅ ⊕ ℍ n ⊕ ⋅ ⋅ ⋅ = ⨁ ℍ n
(31.20)
n=0
gegeben. Die Zustände der einzelnen Hilbert-Räume ℍ n sind zueinander orthogonal: ⟨n|m⟩ = 0 ,
n ≠ m .
2 Dieser ist durch den ersten angeregten Zustand des harmonischen Oszillators gegeben.
342 | 31 Zweite Quantisierung
Interpretieren wir wieder den n-ten angeregten Zustand des harmonischen Oszillators als einen Zustand aus n Phononen, dann stellt offenbar der gesamte Hilbert-Raum des harmonischen Oszillators die Summe der Hilbert-Räume der Systeme mit fester Phononenzahl dar. Die obige Behandlung des harmonischen Oszillators stellt bereits die Zweite Quantisierung für das einfachste Bose-System dar, nämlich für ein System von Boso nen, die nur in einem einzigen Einteilchenzustand existieren. Im Folgenden werden wir dieses Konzept der Zweiten Quantisierung auf beliebige Bose- und Fermi-Systeme verallgemeinern.
31.4 Der Fock-Raum In Analogie zum harmonischen Oszillator konstruieren wir jetzt den Hilbert-Raum ℍ mit einer beliebigen Anzahl von identischen Teilchen, vgl. Gl. (31.20): Wir bezeichnen mit |0⟩ den Vakuumzustand, der kein Teilchen enthält und mit ℍ0 = {|0⟩} den HilbertRaum, der nur durch diesen einzigen Zustand aufgespannt ist. Zu diesem HilbertRaum addieren wir orthogonal den Hilbert-Raum ℍ1 = {|k⟩}, der sämtliche Zustän de mit einem einzelnen Teilchen (Einteilchenzustände) |k⟩ enthält,³ siehe Abb. 31.1. Zu dem so gewonnenen Raum addieren wir alle (anti-)symmetrischen Zweiteilchen (±) zustände, die den Hilbert-Raum ℍ2 bilden. Setzen wir dieses Verfahren fort, so er halten wir den Gesamtraum der total (anti-)symmetrischen Zustände mit beliebiger |k2 ⟩
ℍ1 |0⟩ : ℍ0
|k1 ⟩ Abb. 31.1: Illustration des Hilbert-Raumes ℍ0 ⊕ ℍ1 der Null- und Einteilchenzustände für den Fall, dass nur zwei Einteilchenzustände vorliegen.
3 An den „brackets“ des Null- und Einteilchen-Sektors lassen wir die Indizes, welche die Teilchenzahl angeben, gewöhnlich weg und schreiben |0⟩ statt |0⟩ und |k⟩ statt |k⟩ . 0
1
31.4 Der Fock-Raum | 343
Teilchenzahl (vgl. Gl. (31.20)): (±)
∞
(±)
(±)
ℍ(±) = ℍ0 ⊕ ℍ1 ⊕ ℍ2 ⊕ ⋅ ⋅ ⋅ ⊕ ℍN ⊕ ⋅ ⋅ ⋅ = ⨁ ℍN .
(31.21)
N=0
Dieser Raum wird als Fock-Raum bezeichnet. Er ist die direkte Summe der Zustands räume zu einer festen Teilchenzahl. Wegen der orthogonalen Konstruktion von ℍ(±) sind Zustände in diesem Raum mit verschiedener Teilchenzahl zueinander orthogo nal. Ein Element |ψ⟩ des Fock-Raumes ist i. A. eine Linearkombination von Zuständen verschiedener Teilchenzahlen. Der Fock-Raum ist zunächst ein unitärer Raum. Durch die Einschränkung auf normierbare Zustände wird er zum Hilbert-Raum. (±) Da ℍ(±) (31.21) die direkte Summe der ℍN ist, ist auch der Einheitsoperator des Fock-Raumes durch die direkte Summe der Einheitsoperatoren der Teilräume gege ben: ∞ (±) 1̂ (±) = ∑ 1̂ , (31.22) N
N=0
wobei
1 (±) 1̂ N = N!
(±) (±)
|k 1 , k 2 , . . . , k N ⟩
∑
⟨k 1 , k 2 , . . . , k N |
N
N
k1 ,k2 ,...,k N
der Einheitsoperator im Raum der total (anti-)symmetrischen Zustände mit fester Teil chenzahl N ist. Drücken wir letztere in der Besetzungszahldarstellung (31.14), (31.15) aus, so erhalten wir für den Einheitsoperator des Fock-Raumes (±)(±) 1̂ (±) = ∑ |{n k }⟩ ⟨{n k }|
{n k } (±)(±)
≡ ∑ ∑ . . . |n1 , n2 , . . .⟩
⟨n1 , n2 , . . . | ,
(31.23)
n1 n2
wobei die Summation über die Besetzungszahlen n k für Fermi-Systeme auf n k = 0, 1 beschränkt ist, für Bose-Systeme jedoch über sämtliche natürlichen Zahlen n k = (±) 0, 1, 2, . . . läuft. Ein beliebiger Vektor |ϕ⟩ aus ℍ(±) besitzt dann die Entwicklung |ϕ⟩ ≡ 1̂ (±) |ϕ⟩ (±)
(±) (±)(±)
= ∑ |{n k }⟩
(±)
⟨{n k }|ϕ⟩ ,
{n k } (±)
(±)
wobei die hier auftretenden Amplituden ⟨{n k }|ϕ⟩ die übliche Wahrscheinlichkeits (±) (±) (±) interpretation besitzen: Falls der Zustand |ϕ⟩ korrekt normiert ist, ⟨ϕ|ϕ⟩ = 1, ist (±) 2 (±) |⟨{n k }|ϕ⟩ | die Wahrscheinlichkeit, dass sich im Zustand |ϕ⟩ jeweils n k Teilchen im Einteilchenzustand |k⟩ befinden.⁴ 4 Es sei an dieser Stelle nochmal daran erinnert, dass der Index k an den Besetzungszahlen n k einen kompletten Satz von Quantenzahlen bezeichnet, der den Einteilchenzustand |k⟩ vollständig charak terisiert. Sofern die Gesamtheit der Zustände {|k⟩} abzählbar ist, kann man unter k auch eine einzelne natürliche Zahl in der gewählten Abzählung (Nummerierung) der Einteilchenzustände verstehen. (±) Den Superscript „(±)“ an den Wellenfunktionen | . . .⟩ werden wir im Folgenden gewöhnlich weglas sen, wenn die Zuordnung eindeutig ist.
344 | 31 Zweite Quantisierung
31.5 Bosonen In Analogie zum harmonischen Oszillator können wir auch für beliebige Bose-Syste me Erzeugungs- und Vernichtungsoperatoren definieren, die einen Zustand mit N Teil chen in einen Zustand mit N ± 1 Teilchen überführen, siehe Gln. (31.17), (31.18). Der Erzeugungsoperator a†k ist durch⁵ a†k | . . . , n k , . . . ⟩ = √n k + 1 | . . . , n k + 1, . . . ⟩
(31.24)
definiert und erhöht die Besetzungszahl des Einteilchenzustandes |k⟩ um 1. Der auf der rechten Seite auftretende Faktor garantiert, dass der neue Zustand mit der um 1 vergrößerten Besetzungszahl wieder korrekt normiert ist. Derselbe Normierungsfak tor trat bereits beim harmonischen Oszillator auf, siehe Gl. (31.17). Durch Bildung des hermitesch Adjungierten der Gl. (31.24) erhalten wir: ⟨. . . , n k , . . . |a k = √n k + 1 ⟨. . . , n k + 1, . . . | , wobei
†
a k = (a†k )
der zu a†k adjungierte Operator ist. Multiplikation dieser Gleichung mit | . . . , nk , . . . ⟩ ergibt: ⟨. . . , n k , . . . |a k | . . . , nk , . . . ⟩ = √n k + 1 δ n k +1,nk = √nk δ n k ,nk −1 .
(31.25)
Der Operator a k verringert somit die Besetzungszahl n k um 1 und wird als Vernich tungsoperator bezeichnet. In der Tat gilt die Beziehung a k | . . . , n k , . . . ⟩ = √n k | . . . , n k − 1, . . . ⟩ .
(31.26)
Zum Beweis multiplizieren wir diese Gleichung von links mit der Vollständigkeitsre lation (31.23) und benutzen Gl. (31.25): ∞
a k | . . . , n k , . . . ⟩ = ∑ | . . . , nk , . . . ⟩⟨. . . , nk , . . . |a k | . . . , n k , . . . ⟩ nk =0 ∞
= ∑ | . . . , nk , . . . ⟩√n k δ nk ,n k −1 nk =0
= √n k | . . . , n k − 1, . . . ⟩ .
5 Da wir in diesem Abschnitt ausschließlich Bose-Zustände |n 1 , n 2 , . . . ⟩(+) betrachten, unterdrücken wir das Superskript (+).
31.5 Bosonen | 345
Für n k = 0 verschwindet die rechte Seite und wir erhalten a k | . . . , n k = 0, . . . ⟩ = o , womit garantiert ist, dass die Besetzungszahlen nicht negativ werden können. Aus den Beziehungen (31.24) und (31.26) folgt, dass die Bose-Erzeugungs- und Vernich tungsoperatoren den Vertauschungsrelationen [a k , a l ] = 0̂ ,
[a†k , a†l ] = 0̂ ,
[a k , a†l ] = δ kl
(31.27)
genügen. In der Tat ergibt sich aus (31.26) unmittelbar: a l a k | . . . , n k , . . . , n l , . . . ⟩ = a l √n k | . . . , n k − 1, . . . , n l , . . . ⟩ = √n k √n l | . . . , n k − 1, . . . , n l − 1, . . . ⟩ . Der erhaltene Ausdruck ist unabhängig von der Reihenfolge der Vernichtungsopera toren auf der linken Seite der Gleichung. Damit ist die erste der Beziehungen in (31.27) bewiesen. Die zweite Beziehung folgt dann unmittelbar durch Bildung des Adjungier ten der ersten Relation. Zum Beweis der letzten Relation in Gl. (31.27) betrachten wir zunächst den Fall k ≠ l und verwenden nacheinander die Beziehungen (31.24) und (31.26). Dies liefert: a k a†l | . . . , n k , . . . , n l , . . . ⟩ = √n l + 1 a k | . . . , n k , . . . , n l + 1, . . . ⟩ = √n l + 1 √n k | . . . , n k − 1, . . . , n l + 1, . . . ⟩ = √n k a†l | . . . , n k − 1, . . . , n l , . . . ⟩ = a†l a k | . . . , n k , . . . , n l , . . . ⟩ , womit die Beziehung für k ≠ l bewiesen ist. Für k = l finden wir aus (31.24) und (31.26) hingegen: a k a†k | . . . , n k , . . . ⟩ = √n k + 1 a k | . . . , n k + 1, . . . ⟩ = √n k + 1 √n k + 1 | . . . , n k , . . . ⟩ ,
(31.28)
während die Anwendung der Operatoren in umgekehrter Reihenfolge liefert: a†k a k | . . . , n k , . . . ⟩ = √n k a†k | . . . , n k − 1, . . . ⟩ = √n k √n k | . . . , n k , . . . ⟩ .
(31.29)
Subtraktion der letzten Gleichung von Gl. (31.28) liefert die gewünschte Beziehung. Ähnlich wie beim harmonischen Oszillator lassen sich ausgehend vom Vakuum zustand (Grundzustand) |0⟩ ≡ |0, 0, . . . ⟩ ,
346 | 31 Zweite Quantisierung
in welchem keine Teilchen vorhanden sind, sämtliche Zustände mit beliebiger Boso nenzahl durch wiederholte Anwendung der Erzeugungsoperatoren unter Benutzung von Gl. (31.24) aufbauen, z. B.: – Ein-Boson-Zustände: a†k |0⟩ = |k⟩ . –
Zwei-Bosonen-Zustände: 1 (a† )2 |0⟩ , √2! k
a†k a†l |0⟩ ,
k ≠ l .
Für den allgemeinen, korrekt normierten Mehr-Bosonen-Zustand liefert dies die Be setzungszahldarstellung |n1 , n2 , . . . ⟩ =
1 (a† )n1 (a†2 )n2 . . . |0⟩ . √n1 !n2 ! . . . 1
(31.30)
Dies sind aber gerade die Wellenfunktionen eines Systems ungekoppelter harmo nischer Oszillatoren. Jeder unabhängige Einteilchenzustand k der Bosonen ent spricht einem harmonischen Oszillator, wobei die Besetzungszahl n k dieses Einteil chenzustandes dem n k -ten angeregten Zustand des k-ten harmonischen Oszillators entspricht, wie wir es im vorangegangenen Kapitel gesehen haben. Wie beim har monischen Oszillator sind auch hier die Besetzungszahlen n k die Eigenwerte des Besetzungszahloperators⁶ nk = a†k a k .
(31.31)
nk | . . . , n k , . . . ⟩ = n k | . . . , n k , . . . ⟩ .
(31.32)
In der Tat folgt aus Gl. (31.29)
Wegen (31.13) ist der Operator der Gesamtteilchenzahl durch N = ∑n k
(31.33)
k
gegeben. Mit (31.32) liefert seine Anwendung auf die Zustände |n1 , n2 , . . . ⟩: N|n1 , n2 , . . . ⟩ = (∑ n k ) |n1 , n2 , . . . ⟩ . k
Die Summe auf der rechten Seite ist nach Gl. (31.13) die Gesamtteilchenzahl im Zustand |n1 , n2 . . . ⟩. 6 Hier und im Folgenden bezeichnen wir Operatoren im Fock-Raum (außer den Feldoperatoren) mit serifenlosen Buchstaben.
31.6 Fermionen |
347
31.6 Fermionen Die oben durchgeführte Zweite Quantisierung von Bose-Systemen lässt sich sofort auf Fermi-Systeme übertragen. Dabei sind die total symmetrischen Basiszustände durch total antisymmetrische zu ersetzen. Des Weiteren ist zu beachten, dass sich nicht mehrere Fermionen im selben Einteilchenzustand befinden können, sodass die Beset zungszahlen auf n k = 0, 1 beschränkt sind. Dies führt zu Vereinfachungen gegenüber den Bose-Systemen. Die von den Besetzungszahlen abhängigen Normierungsfakto ren (siehe Gl. (31.14)) entfallen. Gleichzeitig ist damit die Besetzungszahldarstellung ({n k }⟩) etwas aufgebläht und wir werden deshalb oftmals die etwas effizientere Dar (−) stellung (31.6) |k 1 , k 2 , . . . , k N ⟩N der Fermi-Basiszustände benutzen, in der wir nur die besetzten Einteilchenzustände explizit angeben. Wie für Bose-Systeme können wir auch für Fermi-Systeme Erzeugungs- und Ver (−) (−) nichtungsoperatoren definieren, die uns hier von dem Raum ℍ N in die Räume ℍN±1 † , bringen: Den Erzeugungsoperator a k definieren wir durch die Beziehung⁷ ⁸ a†k |k 1 , . . . , k N ⟩ = |k, k 1 , . . . , k N ⟩ N
N+1
.
(31.34)
Bezeichnen wir wieder mit |0⟩ den Zustand, der kein Fermion enthält, so haben wir insbesondere |k⟩ = a†k |0⟩ , |k, k 1 ⟩ = a†k |k 1 ⟩ = a†k a†k1 |0⟩ . 2
Der Operator a†k
erzeugt aus dem Vakuum |0⟩ ein Teilchen im Einteilchenzustand |k⟩ in ℍ1 (siehe Abb. 31.2), aus einem Einteilchenzustand |k 1 ⟩ erzeugt er einen antisymme trischen Zweiteilchenzustand |k, k 1 ⟩ , der sich wiederum durch Anwendung von a†k a†k1 2 auf das Vakuum erzeugen lässt. Dementsprechend lassen sich durch sukzessive An wendung von Erzeugungsoperatoren a†k auf das Vakuum |0⟩ die antisymmetrischen N-Teilchen-Zustände erzeugen: |k 1 , . . . , k N ⟩ = a†k1 . . . a†k N |0⟩ . N
(31.35)
Da bei Vertauschung zweier Teilchen, d. h. zweier Einteilchenindizes (Quantenzahlen der Einteilchenzustände), der antisymmetrische Zustand sein Vorzeichen wechselt, |k 2 , k 1 ⟩ = −|k 1 , k 2 ⟩ , 2
2
muss gelten: a†k1 a†k2 = −a†k2 a†k1 , bzw. {a†k1 , a†k2 } ≡ a†k1 a†k2 + a†k2 a†k1 = 0̂ .
(31.36)
7 Der für Bose-Systeme in Gl. (31.24) zusätzlich auftretende Normierungsfaktor ist für Fermi-Systeme nicht notwendig, da die Besetzungszahlen hier nur die Werte n k = 0, 1 annehmen können, für welche n k ! = 1. 8 Da wir es in diesem Abschnitt ausschließlich mit Fermionen zu tun haben, unterdrücken wir das (−) Superskript (−) an den total antisymmetrischen Zuständen | . . .⟩ .
348 | 31 Zweite Quantisierung |k2 ⟩
ℍ1
a†k2 |0⟩ a k1
|k1 ⟩ Abb. 31.2: Illustration der Wirkungsweise der Erzeugungs- und Vernichtungsoperatoren.
Hieraus folgt insbesondere, dass (a†k )2 = a†k a†k und alle höheren Potenzen von a†k ver schwinden und somit a†k |k⟩ = |k, k⟩ = o , 2
was Ausdruck des Pauli-Prinzips ist, wonach sich zwei Fermionen nicht im selben Ein teilchenzustand befinden können. Für den zu a†k hermitesch adjungierten Operator a k = (a†k )
†
(31.37)
finden wir aus (31.34) ⟨k 1 , . . . , k N |a k = ⟨k, k 1 , . . . , k N | ,
N
N+1
bzw. aus Gl. (31.35): ⟨k 1 , . . . , k N | = ⟨0|a k N . . . a k1
N
und somit insbesondere:
(31.38)
⟨k| = ⟨0|a k , ⟨k 1 , k 2 | = ⟨0|a k2 a k1 .
2
Aus (31.36) folgt mit (31.37), dass die a k ebenfalls antikommutieren {a k , a l } = 0̂ .
(31.39)
Wir multiplizieren a†k von rechts mit dem Einheitsoperator des Fock-Raumes (31.22) und benutzen die Definition des Erzeugungsoperators (31.34) 1 a†k ≡ a†k 1̂ (−) = |k⟩⟨0| + ∑ |kk 1 ⟩ ⟨k 1 | + ∑ |kk 1 k 1 ⟩ ⟨kk 2 | + ⋅ ⋅ ⋅ . 2 32 2! k k ,k 1
1
2
(31.40)
31.6 Fermionen | 349
Hieraus erhalten wir für den zu a†k hermitesch adjungierten Operator (31.37) unter Be achtung von (|a⟩⟨b|)† = |b⟩⟨a| (31.41) die Spektraldarstellung im Fock-Raum 1 ∑ |k 1 k 2 ⟩ ⟨kk 1 k 2 | + ⋅ ⋅ ⋅ . 23 2! k N oberhalb der Fermi-Kante besitzt. Um die Symmetrie zwischen den Zuständen oberhalb und unterhalb der FermiKante herzustellen, nehmen wir eine Uminterpretation der Erzeugungs- und Vernich tungsoperatoren für Zustände unterhalb der Fermi-Kante vor, indem wir die FermiOperatoren b k := a†k , k = h ≤ N einführen, woraus b †k = a k ,
k=h≤N
(31.111)
folgt. Wegen (31.110) gilt: b k |ϕ⟩ = o . Man beachte, dass die Operatoren b k , b †k nur für Zustände k = h unterhalb der FermiKante definiert sind. Ferner folgt aus den Antikommutationsbeziehungen der ur
31.9 Fermi-Systeme |
373
sprünglichen Operatoren: {b †k , b †l } = 0̂ ,
{b k , b l } = 0̂ , {b k , b †l } = δ kl ,
{b k , a p } = {b k , a†p } = 0̂ . Der Operator b †k entfernt per Definition (31.111) ein Teilchen aus dem Zustand k unter halb der Fermi-Kante. Ein ungefüllter Einteilchenzustand unterhalb der Fermi-Kante wird als Loch bezeichnet. Die Operatoren b †k bzw. b k erzeugen bzw. vernichten folglich ein Loch im Grundzustand |ϕ⟩. Die Löcher (d. h. unbesetzte Zustände mit ϵ k < ϵF ) besitzen ähnliche Eigenschaf ten wie die besetzten Zustände oberhalb der Fermi-Kante (tatsächliche „Teilchen“). (In der Tat besitzt ein Atom mit einem Elektron auf der Valenzschale sehr ähnliche Ei genschaften wie ein Atom mit nur einem unbesetzten Zustand der Valenzschale.) Um die Gemeinsamkeiten der Teilchen (mit ϵ k > ϵF ) und Löcher (mit ϵ k < ϵF ) zu betonen und diese gemeinsam behandeln zu können, bezeichnet man in diesem Kontext beide als Quasiteilchen. Statt einer Teilchen-Loch-Anregung, d. h. der Anregung eines Teil chens von einem besetzten Zustand |h⟩ (mit ϵ h < ϵF ) in einen unbesetzten Zustand |p⟩ (mit ϵ p > ϵF ), spricht man von einer Zweiquasiteilchen-Anregung: a†p a h |ϕ⟩ = a†p b †h |ϕ⟩ .
(31.112)
Um die Symmetrie zwischen Teilchen und Löchern zu betonen, definiert man die Qua siteilchenoperatoren¹⁵ { a† , c†k = { †k b = ak , { k
k=p,
ϵ p > ϵF ,
k=h,
ϵ h ≤ ϵF .
,
(31.113)
sodass nach (31.109) und (31.110) der Grundzustand |ϕ⟩ (31.102) das Quasiteilchenva kuum ist: c k |ϕ⟩ = 0 , ⟨ϕ|c†k = 0 . (31.114) Ferner empfiehlt es sich, die Einteilchenenergien von der Fermi-Kante aus zu messen (ϵ k − ϵF → ϵ k ), sodass ϵ k > 0 (ϵ k < 0) für Zustände oberhalb (unterhalb) der FermiKante, und dann als Quasiteilchen-Energien {ϵ k , ̄ϵ k = { −ϵ , { k
k=p k=h
15 Der Begriff „Quasiteilchen“ wird gewöhnlich in einem etwas allgemeineren Sinne gebraucht und schließt dann auch eine Überlagerung von Teilchen- und Lochoperatoren ein, siehe Abschnitt 36.4.
374 | 31 Zweite Quantisierung zu definieren, die sämtlich positiv sind, ̄ϵ k > 0. Der Einteilchen-Hamiltonian (31.92) nimmt dann in der Quasiteilchen-Basis die Gestalt H0 = ∑ ϵ k a†k a k = ∑ ̄ϵ k c†k c k + ∑ (−̄ϵ k )c k c†k k
k ϵ k >ϵ F
k ϵ k 0 besitzen und völlig symmetrisch in den Hamilton-Operator eingehen. Relativistische Fermionen mit Spin s = 1/2 werden durch die Dirac-Gleichung beschrieben (siehe Abschnitt 28.5), die sowohl positive als auch negative Energielö sungen besitzt. Aus Stabilitätsgründen sind im Vakuum sämtliche negativen Ener giezustände besetzt. Die Gesamtheit der besetzten negativen Energiezustände bilden den sogenannten Dirac-See, der den oben betrachteten besetzten Zuständen unter halb der Fermi-Kante entspricht. Für die Dirac-Fermionen liegt somit die Fermi-Kante bei ϵ F = 0. Das oben betrachtete Quasiteilchen-Bild findet auch hier Anwendung: Teilchen-Loch-Anregungen eines Dirac-Fermions aus einem besetzten (negativen Energie-)Zustand des Dirac-Sees in einen positiven Energiezustand wird als TeilchenAntiteilchen-Anregung (Paarproduktion) interpretiert, d. h., ein Loch (unbesetzter Zustand) im Dirac-See wird als Antiteilchen bezeichnet. Die Antiteilchen besitzen ähnliche Eigenschaften wie die Teilchen: dieselbe (positive!) Masse, denselben Spin, jedoch entgegengesetzte Ladung.¹⁶ Prominentes Beispiel ist das Elektron, dessen An titeilchen, das Positron, sich vom Elektron nur im Vorzeichen der elektrischen Ladung unterscheidet.
31.9.3 Das Thouless-Theorem Teilchen-Loch-Anregungen (31.112) sind offenbar orthogonal auf dem unkorrelierten Grundzustand |ϕ⟩ (31.102). In der Tat gilt wegen (31.114): ⟨ϕ|a†p a h |ϕ⟩ ≡ ⟨ϕ|a†p b †h |ϕ⟩ ≡ ⟨ϕ|c†p c†h |ϕ⟩ = 0 .
(31.115)
16 Wie in dem oben entwickelten Quasiteilchenbild führt man auch in der relativistischen Quanten feldtheorie zwei Arten von Erzeugungs- und Vernichtungsoperatoren ein, nämlich a† , a für die Teil chen und b † , b für die Antiteilchen. Das physikalische Vakuum (der besetzte Dirac-See) wird dann sowohl von den Vernichtungsoperatoren der Teilchen als auch der Antiteilchen vernichtet: a|0⟩ = o = b|0⟩.
31.9 Fermi-Systeme |
375
Für ein wechselwirkendes Fermi-System wird die Wellenfunktion eine Überlagerung von Slater-Determinanten mit beliebiger Anzahl von Teilchen-Loch-Anregungen sein. Solche korrelierten Zustände lassen sich i. A. nicht als reine Fermion-Determinante schreiben. Es gibt jedoch spezielle Überlagerungen von Fermion-Determinanten, die sich wieder als Fermion-Determinanten ausdrücken lassen: Es sei |ϕ⟩ eine FermionDeterminante von der Art, wie sie in Gl. (31.102) definiert ist. Dabei ist es unwichtig, ob die besetzten Einteilchenzustände |h⟩ die energetisch niedrigsten sind oder nicht. Es lässt sich dann folgendes Theorem von D. J. Thouless zeigen: Jede Slater-Determinante |Z⟩, die nicht orthogonal zur ursprünglichen Determinante |ϕ⟩ ist, lässt sich (bis auf Normierung) in der Form |Z⟩ = exp [ ∑ Z ph a†p a h ] |ϕ⟩ ] [p,h
(31.116)
darstellen, wobei Z ph im Allgemeinen komplexe Zahlen sind.
In der Quasiteilchendarstellung (31.113) besitzt der Zustand (31.116) die Gestalt |Z⟩ = exp [ ∑ Z ph c †p c †h ] |ϕ⟩ ] [p,h
(31.117)
und ist somit eine Überlagerung von Quasiteilchenpaaranregungen über dem Zustand |ϕ⟩, der das Quasiteilchenvakuum ist, da nach (31.114) c p |ϕ⟩ = 0 ,
c h |ϕ⟩ = 0 .
Zunächst ist sehr leicht einzusehen, dass die Determinante |Z⟩ nicht orthogonal auf der Determinante |ϕ⟩ ist. Dazu entwickeln wir den Exponenten in eine Taylor-Reihe: |Z⟩ = (1 + ∑ Z ph a†p a h + p,h
1 ∑ ∑ Z ph Z p h a†p a h a†p a h + ⋅ ⋅ ⋅ ) |ϕ⟩ . 2 p,h p ,h
Der Term unterster Ordnung liefert die ursprüngliche Determinante |ϕ⟩, während die nächsten Terme Teilchen-Loch-Anregungen enthalten, die nach Gl. (31.115) sämtlich orthogonal auf der ursprünglichen Determinante sind. Damit gilt: ⟨ϕ|Z⟩ = ⟨ϕ|ϕ⟩ = 1 .
376 | 31 Zweite Quantisierung
Beweis des Thouless-Theorems (31.116) Zum Beweis des Theorems müssen wir zeigen, dass sich |Z⟩ (31.116) in der Form einer Determinante (31.102) oder (31.106) schreiben lässt. Dazu benutzen wir die Identität¹⁷ N
exp [ ∑ Z ph a†p a h ] = ∏ exp [∑ Z ph a†p a h ] p [p,h ] h=1 N
= ∏ (1̂ + ∑ Z ph a†p a h ) , h=1
p
wobei wir im letzten Schritt die Exponentialfunktion in eine Taylor-Reihe entwickelt haben. Wegen (a h )2 = 0̂ bricht diese Entwicklung nach dem linearen Term ab. Setzen wir diesen Ausdruck und (31.102) in Gl. (31.116) ein und benutzen die fermionischen Antikommutationsbeziehungen, so erhal ten wir: N
N
|Z⟩ = [ ∏ (1̂ + ∑ Z ph a†p a h )] ∏ a†h |0⟩ h =1
p
h=1 N
= ∏ [(1̂ + ∑ Z ph a†p a h ) a†h ] |0⟩ p
h=1 N
= ∏ [a†h + ∑ Z ph a†p ] |0⟩ ,
(31.118)
p
h=1
wobei wir in der zweiten Zeile wieder benutzt haben, dass die a†h für h ≠ h mit den a h antikommu tieren. In der letzten Zeile haben wir (31.104) und (31.103) benutzt. Führen wir die neuen Einteilchen zustände ̃ = |h⟩ + ∑ Z ph |p⟩ | h⟩ (31.119) p
ein, bzw. die durch
̃ =a ̃ †h |0⟩ | h⟩
(31.120)
̃ †h = a†h + ∑ Z ph a†p , a
(31.121)
definierten zugehörigen Fermi-Operatoren p
so erhält der Zustand |Z⟩ (31.118) in der Tat die Form einer Slater-Determinante (31.102): N
̃ †h |0⟩ . |Z⟩ = ∏ a
(31.122)
h=1
Aus (31.119) erhalten wir mit ⟨h|p⟩ = 0 für die Norm der neuen Einteilchenzustände ̃ = ⟨h |h⟩ + ∑ Z ∗ Z ph ⟨p |p⟩ ⟨̃ h |h⟩ ph p,p
= δ h h + ∑ Z ∗ph Z ph = (𝟙 + Z † Z)h h ,
(31.123)
p
17 Man beachte, dass exp(A + B) = exp A exp B nur gilt, falls [A, B] = 0. Im vorliegenden Fall ist A = ∑p Z ph a†p a h und B = ∑p Z ph a†p a h mit h ≠ h . Die Relation [A, B] = 0 ergibt sich hier unmittelbar aus den fundamentalen Antivertauschungsrelationen der a†k , a k .
31.9 Fermi-Systeme |
377
wobei wir vorausgesetzt haben, dass die ursprünglichen Einteilchenzustände |k⟩ kor rekt orthonormiert sind, siehe Gl. (31.105). Man beachte, dass Z † Z eine quadratische, hermitesche Matrix im Raum der Lochzustände ist: (Z † Z) hh = ∑ (Z † )hp Z ph = ∑ Z ∗ph Z ph . p
p
Ihre Spur ist nicht nur reell, sondern auch positiv definit Sp(Z † Z) = ∑(Z † Z)hh = ∑ ∑ |Z ph |2 . h
h
p
Aus den Antikommutationsbeziehungen der ursprünglichen Fermi-Operatoren a k , a†k folgt für die in Gl. (31.121) definierten Operatoren ̃ †h , a ̃ †h } = 0̂ , {a ̃h , a ̃ †h } = (𝟙 + Z † Z) . {a hh Die Slater-Determinante |Z⟩ (31.122) ist offensichtlich das Vakuum für die Quasiteil chenoperatoren {a ̃† , k = h , ck = { h (31.124) ap , k = p . { Die Determinante |Z⟩ (31.122) beschreibt ein Fermi-System mit derselben Anzahl von Teilchen wie die Determinante |ϕ⟩ (31.102), ist jedoch nicht auf 1 normiert, da die Ein ̃ (31.119) nicht auf 1 normiert sind. Analog zur Gl. (31.108) ergibt teilchenzustände |h⟩ sich die Norm der Determinante |Z⟩ (31.122) zu: ̃̃ ⟨Z|Z⟩ = det(⟨h| h ⟩) .
(31.125)
⟨Z|Z⟩ = det(𝟙 + Z † Z) .
(31.126)
Hieraus folgt mit (31.123)
Somit lautet die auf 1 normierte Slater-Determinante ̃ = |Z⟩ =
1 √det(𝟙 + Z † Z) 1 √det(1 + Z † Z)
|Z⟩ exp [ ∑ Z ph a†p a h ] |ϕ⟩ . ] [p,h
(31.127)
̃ (31.127) mit beliebigen komplexen Die Slater-Determinanten |Z⟩ (31.116) bzw. |Z⟩ Z ph bilden eine übervollständige Basis für Fermi-Systeme mit fester Teilchenzahl. Für ein festes |ϕ⟩ besitzen sämtliche |Z⟩ dieselbe Teilchenzahl wie |ϕ⟩.
32 Quantenstatistik Die bisher von uns betrachteten Zustände |ψ⟩ eines quantenmechanischen Systems sind sogenannte reine Zustände. Sie werden durch Vektoren (genauer gesagt Strahlen) im Hilbert-Raum beschrieben und enthalten die maximale, im Rahmen der Quanten mechanik zugängige Information über das System. Jeder reine Zustand lässt sich nach einer vollständigen Basis entwickeln, wobei die Basiszustände |ν i ⟩ durch einen vollständigen Satz von kommutierenden Observablen (hermiteschen Operatoren) O i spezifiziert werden. Werden alle diese Operatoren gleichzeitig gemessen, so spricht man von einer vollständigen Präparation des Systems. Bei dieser Messung geht der ur sprüngliche reine Zustand |ψ⟩ in einen der Basiszustände |ν i ⟩ über, was bekanntlich als Zustandsreduktion oder Kollaps der Wellenfunktion bezeichnet wird. (Die Basiszu stände sind natürlich auch reine Zustände.) Welcher Basiszustand |ν i ⟩ nach der Mes sung der Observablen O i angenommen wird, lässt sich aufgrund des intrinsischen Wahrscheinlichkeitscharakters (Indeterminismus) der Quantenmechanik nicht mit Sicherheit vorhersagen. Wir kennen nur die Wahrscheinlichkeit |⟨ψ|ν i ⟩|2 , mit welcher der Zustand |ν i ⟩ nach der Messung realisiert ist.
32.1 Gemischte Zustände Oftmals bilden die gemessenen Observablen jedoch keinen vollständigen Satz. Das System ist dann unvollständig präpariert. Ein quantenmechanisches System befindet sich zwar immer in einem reinen Zustand, allerdings wissen wir nicht, in welchem, so lange nicht sämtliche Observablen des vollständig kommutierenden Satzes gemessen wurden.¹ Wir sind dann gezwungen, statistische Methoden zu benutzen und dem Sys tem ein statistisches Gemisch (Ensemble) von Zuständen |α⟩ zuzuordnen, die mit ei ner gewissen Wahrscheinlichkeit (statistischem Gewicht) w α realisiert sind. Ein durch diese Wahrscheinlichkeiten w α definiertes Gemisch von Zuständen ist kein reiner Zu stand, sondern wird als gemischter Zustand oder statistisches Gemisch bzw. statisti sches Ensemble bezeichnet. Beim gemischten Zustand besitzt die Vorhersage eines Messergebnisses in zwei facher Hinsicht Wahrscheinlichkeitscharakter: Zum einen kennen wir nur die Wahr scheinlichkeit w α , mit der sich das betreffende System in einem konkreten reinen Zu stand |α⟩ befindet. Zum anderen können wir aufgrund der unkontrollierten Störung des quantenmechanischen Systems beim Messprozess nur Wahrscheinlichkeitsaussa 1 Diese Unkenntnis aufgrund der fehlenden Präparationen des Quantensystems hat nichts mit dem Indeterminismus der Quantenmechanik zu tun. Dieser besteht vielmehr darin, dass das Ergebnis einer Messung nicht mit Sicherheit vorhergesagt werden kann, sondern nur die Wahrscheinlichkeit ange geben werden kann, mit der ein bestimmter Messwert bei einer Messung gefunden wird, wenn diese am selben Ausgangszustand (d. h. an identisch präparierten Systemen) sehr oft wiederholt wird. https://doi.org/10.1515/9783110586077-010
32.1 Gemischte Zustände | 379
gen über den Ausgang der Messung machen, selbst wenn sich das zu messende Sys tem in einem reinen Zustand |α⟩ befindet. Dies ist der übliche quantenmechanische Indeterminismus.
32.1.1 Der statistische Operator Der Erwartungswert einer Observablen O in einem reinen Zustand |α⟩ ist bekanntlich durch ⟨O⟩ = ⟨α|O|α⟩ (32.1) gegeben, vorausgesetzt, |α⟩ ist korrekt normiert, ⟨α|α⟩ = 1, was wir im Folgenden für die reinen Zustände annehmen wollen. Den Erwartungswert in einem statistischen Gemisch von reinen Zuständen |α⟩, die mit der Wahrscheinlichkeit w α realisiert sind, definieren wir als statistisches Mittel der Erwartungswerte in den reinen Zuständen: ⟨O⟩ = ∑ w α ⟨α|O|α⟩ .
(32.2)
α
Dieser Ausdruck enthält sowohl die quantenmechanische Mittelung ⟨α|O|α⟩ (d. h. die quantenmechanische Wahrscheinlichkeitsverteilung) der Eigenwerte der Observ ablen O in einem reinen Quantenzustand |α⟩, als auch die statistischen Wahrschein lichkeiten w α , die der Bedingung ∑ wα = 1
(32.3)
α
genügen müssen und folglich auf das Intervall 0 ≤ wα ≤ 1 beschränkt sind. Mit Hilfe des Projektors (vgl. Abschnitt 10.6) P α = |α⟩⟨α| lässt sich der quantenmechanische Erwartungswert (32.1) als Spur schreiben: ⟨α|O|α⟩ = Sp (P α O) .
(32.4)
Diese Beziehung folgt unmittelbar, wenn man beachtet, dass die Spur in einer belie bigen Basis berechnet werden kann. Ist {|k⟩} eine vollständige Basis, so gilt: Sp (P α O) = ∑⟨k|P α O|k⟩ k
= ∑⟨k|α⟩⟨α|O|k⟩ = ∑⟨α|O|k⟩⟨k|α⟩ k
k
= ⟨α|O|α⟩ . Mit (32.4) können wir den Erwartungswert im statistischen Gemisch (32.2) in der Form ⟨O⟩ = ∑ w α Sp (P α O) = Sp (∑ w α P α O) α
α
(32.5)
380 | 32 Quantenstatistik
schreiben. Mit der Definition des statistischen Operators D = ∑ w α P α = ∑ |α⟩w α ⟨α| α
(32.6)
α
nimmt der Erwartungswert im statistischen Gemisch (32.5) die gewöhnliche Form ei nes statistischen Mittelwerts an: ⟨O⟩ = Sp (DO) .
(32.7)
Ein reiner Zustand |β⟩ ist ein Spezialfall des gemischten Zustands, für den w α = δ αβ
⇒
D = Pβ
gilt. Für diesen reduziert sich der Mittelwert (32.7) auf den gewöhnlichen quantenme chanischen Erwartungswert (32.1). Der statistische Operator wird auch als Dichteope rator bezeichnet. Seine Matrixelemente Dkl = ⟨k|D|l⟩ = ∑⟨k|α⟩w α ⟨α|l⟩ α
bilden die Dichtematrix. Eigenschaften des statistischen Operators D 1. Hermitezität: D† = D , 2.
da w∗α = w α und |α⟩† = ⟨α|. Normierung: Sp D = 1 ,
(32.8)
da Sp D = ∑ Sp (|α⟩w α ⟨α|) = ∑ w α ⟨α|α⟩ = ∑ w α = 1 . α
3.
α
α
Positivität: Für einen beliebigen reinen Zustand |ψ⟩ gilt: ⟨ψ|D|ψ⟩ ≥ 0 , da ⟨ψ|D|ψ⟩ = ∑⟨ψ|α⟩w α ⟨α|ψ⟩ = ∑ w α |⟨α|ψ⟩|2 ≥ 0 . α
4.
α
Spurkriterium: Sp (D2 ) ≤ 1 . Falls Sp (D2 ) = 1, so beschreibt D einen reinen Zustand.
32.1 Gemischte Zustände | 381
Beweis des Spurkriteriums: Der Einfachheit halber setzen wir voraus, dass die Zustände |α⟩ im statistischen Operator (32.6) orthonormiert sind: ⟨α|β⟩ = δ αβ . Dann folgt unmittelbar aus (32.6) Sp D2 = ∑ w 2α . α
Falls D keinen reinen Zustand beschreibt, sind nach (32.3) sämtliche w α < 1 und somit w 2α < w α , woraus ∑ w 2α < ∑ w α = 1 α
α
folgt. Falls andererseits Sp D2 = 1, d. h. ∑ w 2α = 1 , α
so folgt nach Abzug von Gl. (32.3) ∑ w α (1 − w α ) = 0 . α
Da sämtliche 0 ≤ w α ≤ 1 und somit jeder Summand nichtnegativ ist, wird diese Gleichung nur für w α = 0, 1 erfüllt. Wegen der Normierung (32.3) kann aber w β = 1 nur für einen einzigen Zustand |β⟩ gelten, während sämtliche w α=β̸ = 0. Dies definiert einen reinen Zustand D = |β⟩⟨β|: {0 , wα = { 1, {
α ≠ β α=β
.
32.1.2 Der statistische Operator für einen Spin 1/2 Als Beispiel für die Beschreibung eines Systems durch gemischte Zustände betrachten wir das sogenannte Stern-Gerlach-Experiment, dass 1922 von O. Stern und W. Gerlach zum Nachweis der Quantisierung des Drehimpulses durchgeführt wurde: Ein Atom strahl, bestehend aus Silberatomen, wird durch ein inhomogenes Magnetfeld ge schickt, siehe Abb. 32.1. Die Atome wechselwirken über das magnetische Moment mit dem äußeren B-Feld und erfahren eine Ablenkung, die proportional zur Komponente des magnetischen Moments in Richtung des Magnetfelds ist. Das Silberatom besitzt in seiner Valenzschale ein Elektron, das den Spin der Atom hülle bestimmt. Die übrigen Elektronen bilden abgeschlossene Schalen, die zum Ge samtdrehimpuls null koppeln. Ferner kann der Kernspin unberücksichtigt bleiben, da das zugehörige magnetische Moment gegenüber dem des Valenzelektrons vernach lässigbar ist. Deshalb ist das magnetische Moment μ proportional zum Spin S des Va lenzelektrons (siehe Gl. (22.19)). Für den Spin s = 1/2 gibt es 2s + 1 = 2 verschiedene Spinprojektionen und man erwartet deshalb eine Aufspaltung des Silberatomstrahls in zwei Teilstrahlen, was in der Tat im Experiment beobachtet wird.
382 | 32 Quantenstatistik
B
N
Ag−Atome
S
Abb. 32.1: Schematischer Aufbau des Stern-Gerlach-Experiments.
Wir legen das Magnetfeld parallel zur z-Achse. Wir präparieren die Atome so, dass ihr Spin in eine fest vorgegebene Richtung in der xy-Ebene, ̂ n(φ) = cos φe x + sin φe y zeigt, d. h., die Spinfunktionen der Elektronen sollen Eigenfunktionen zum Operator ̂ S n(φ) = S⋅ n(φ) ̂ sein. Wegen S=
ℏ σ 2
mit den Pauli-Matrizen σ i (15.44) haben wir: ℏ (cos φσ x + sin φσ y ) 2 ℏ 0 0 1 = (cos φ ( ) + sin φ ( 2 i 1 0
S n(φ) = ̂
=
ℏ 0 ( 2 e iφ
−i )) 0
e−iφ ) . 0
Die Eigenfunktion von S n(φ) zum Eigenwert ℏ/2 ist durch ̂ |φ⟩ =
1 1 ( ) √2 e iφ
(32.9)
gegeben. Der statistische Operator zu diesem reinen Zustand lautet: Dφ = P φ = |φ⟩⟨φ| =
1 1 ( 2 e iφ
e−iφ ) . 1
(32.10)
32.1 Gemischte Zustände |
383
Für ihn gilt, wie man durch explizites Nachrechnen überprüft: D2φ = Dφ ,
Sp (D2φ ) = 1 .
Schicken wir einen im Zustand |φ⟩ präparierten Teilchenstrahl durch eine SternGerlach-Apparatur, so erfolgt eine Aufspaltung in zwei Teilchenstrahlen, in denen die Atome (Elektronen) ihren Spin parallel bzw. antiparallel zur z-Achse (Richtung des B-Felds) ausgerichtet haben. Dies sind die Spin-Eigenzustände von S z = ℏσ z /2: ℏ S z |±⟩ = ± |±⟩ , 2
1 |+⟩ = ( ) , 0
0 |−⟩ = ( ) . 1
(32.11)
Zerlegen wir den ursprünglichen Zustand |φ⟩ (32.9) nach den Eigenzuständen der z-Komponente des Spin-Operators (32.11), |φ⟩ =
1 (|+⟩ + e iφ |−⟩) , √2
so erkennen wir, dass diese mit gleicher Wahrscheinlichkeit im ursprünglichen Strahl vorkommen (was intuitiv auch sofort klar ist). Folglich besitzen die beiden aus der Stern-Gerlach-Apparatur austretenden Teilchenstrahlen dieselbe Intensität. Durch äußere Einflüsse kann die Phasenbeziehung zwischen den beiden Teil strahlen gestört werden. Dabei ändert sich die relative Phase e iφ zwischen den SpinEigenzuständen |−⟩ und |+⟩. Da wir als Ergebnis der äußeren Störung keine Kenntnis mehr über die relative Phase e iφ haben, erhalten wir die bestmögliche Beschreibung, indem wir über diese Phase mitteln. Mitteln wir den Dichteoperator Dφ (32.10) des reinen Zustands |φ⟩ (32.9) über sämtliche Phasen φ, so erhalten wir den Dichteope rator eines statistischen Gemischs. Da sämtliche Phasen (Winkel) φ gleich gewichtet sind, ist das statistische Gewicht eines Winkels φ durch w φ = 1/2π gegeben, und wir erhalten für das Gemisch: 2π
2π
0
0
̄ = ∫ dφ w φ Dφ = 1 ∫ dφ Dφ = 1 (1 D 2π 2 0 1 = (|+⟩⟨+| + |−⟩⟨−|) , 2
̄ 2) = Sp(D
0 ) 1
1 0⟩ gegenüber dem Grundzustand |n = 0⟩ exponentiell unterdrückt und im Limes β → ∞ (T → 0) überlebt nur der Grundzustand lim D = |0⟩⟨0| . (32.25) β→∞
Die kanonische Zustandssumme (32.20), (32.24) definiert über Z =: e−βF .
(32.26)
die freie Energie F. Da die exakten Energieniveaus E n von der Teilchenzahl N und dem Volumen V abhängen, hängt die freie Energie F (32.26) wie die kanonische Zustands summe Z (32.24) neben der Temperatur T auch von N und V ab F = F(T, N, V) . Aus der Entropie (32.14) des kanonischen Ensembles (32.19) S = −⟨ln D⟩ = −Sp (D ln D) = βSp (DH) + ln Z finden wir die thermodynamische Beziehung F = E − TS zwischen Energie E = ⟨H⟩ und freier Energie F.
32.2 Statistische Ensembles | 391
32.2.3 Das großkanonische Ensemble Kann das betrachtete System nicht nur Energie, sondern auch Teilchen mit der Umge bung austauschen, so besitzt es weder feste Energie noch feste Teilchenzahl. Es las sen sich dann nur deren statistischen Mittelwerte ⟨H⟩ bzw. ⟨N⟩ angeben⁷, wobei die Mittelung ⟨. . . ⟩ die Summation über die Teilchenzahl mit einschließt. Besitzen wir nur Kenntnis über diese beiden Observablen, so ergibt sich die optimale statistische Beschreibung, in dem wir nur diese beiden Observablen als relevant betrachten. Mit R1 = H und R2 = N finden wir aus (32.17), (32.18) den Dichteoperator 1 −β(H−μN) , e Z
D=
(32.27)
wobei Z = Sp (e−β(H−μN) )
(32.28)
und wir λ1 = β und λ2 = −βμ gesetzt haben. Diese Lagrange-Multiplikatoren legen die statistischen Erwartungswerte von Energie und Teilchenzahl E = ⟨H⟩ = Sp (DH) ,
N = ⟨N⟩ = Sp (DN)
fest. Dabei wird T = 1/β wie bereits beim kanonischen Ensemble als die Temperatur und μ als das chemische Potenzial bezeichnet. Die Spur Sp in (32.28) läuft über sämt liche Zustände mit beliebiger Teilchenzahl. Sie erstreckt sich damit über sämtliche Hilbert-Räume mit beliebiger Teilchenzahl, d. h. über den direkten Produktraum ℍ (30.4) für unterscheidbare Teilchen bzw. über den Fock-Raum (31.21) für identische Teilchen. Aus (32.27) und (32.28) folgt die Normierung Sp D = 1 . Der Dichteoperator (32.27) definiert das großkanonische Ensemble. Dieses gilt für alle Vielteilchensysteme, die sich mit ihrer Umgebung im thermodynamischen Gleichge wicht bezüglich Energie- und Teilchenaustausch befinden. Das großkanonische En semble gilt gleichermaßen für Systeme aus unterscheidbaren und identischen Teil chen. Mit der Eigenwertgleichung von H, H|n, N⟩ = E n (N)|n, N⟩ , und der des Teilchenzahloperators N, N|n, N⟩ = N|n, N⟩ , 7 Für Systeme mit variabler Teilchenzahl benutzen wir die im Rahmen der Zweiten Quantisierung eingeführte Notation, in welcher Operatoren durch serifenlose Buchstaben bezeichnet werden.
392 | 32 Quantenstatistik sowie der Vollständigkeitsrelation des Raums ℍ (30.4), ∞
1̂ = ∑ ∑ |n, N⟩⟨n, N| , N=0 n
erhalten wir für den Dichteoperator die Spektraldarstellung ∞
D = ∑ ∑ |n, N⟩w n,N ⟨n, N| . N=0 n
Hierbei ist
1 −β(E n (N)−μN) e (32.29) Z die Wahrscheinlichkeit, das System in einem Zustand |n, N⟩ mit Energie E n (N) und Teilchenzahl N anzutreffen. In analoger Weise erhält man für die großkanonische Zustandssumme (32.28) w n,N =
∞
Z = ∑ ∑ e−β(E n (N)−μN) .
(32.30)
N=0 n
Offensichtlich sind die Wahrscheinlichkeiten w n,N (32.29) korrekt normiert: ∞
∑ ∑ w n,N = 1 . N=0 n
Der thermische Erwartungswert im großkanonischen Ensemble ⟨O⟩ = Sp (DO)
(32.31)
enthält die Summation über alle Teilchenzahlen ∞
∞
⟨O⟩ = ∑ ∑ Sp (|n, N⟩w n,N ⟨n, N|O) = ∑ ∑ w n,N ⟨n, N|O|n, N⟩ . N=0 n
N=0 n
Wie bereits angedeutet, hängen die Energien E n (N) neben dem Volumen auch von der Teilchenzahl N ab. Diese Abhängigkeit wird im kanonischen Ensemble unterdrückt, da dort die Teilchenzahl unveränderlich ist. Die Zustandssumme Z (32.28) bzw. (32.30) definiert über Z = e−βΩ
(32.32)
das großkanonische Potenzial Ω, welches von der Temperatur T = 1/β, dem chemi schen Potenzial μ und dem Volumen V abhängt: Ω = Ω(T, μ, V) . Aus der Entropie (32.14) des großkanonischen Ensembles (32.27) S = −⟨ln D⟩ = −Sp (D ln D) = −Sp (D [−β(H) − μN) − ln Z]) = β (⟨H⟩ − μ⟨N⟩ − Ω)
32.3 Das großkanonische Ensemble identischer Teilchen | 393
finden wir mit β = 1/T die bekannte thermodynamische Beziehung Ω = E − TS − μN
(32.33)
zwischen Ω, der mittleren Energie E = ⟨H⟩ und der mittleren Teilchenzahl N = ⟨N⟩. Aus der Herleitung des großkanonischen Ensembles ist ersichtlich: Das chemische Potenzial μ ist der Lagrange-Multiplikator, der die Teilchenzahlerhaltung (im Mit tel) bei der Variation der Entropie gewährleistet. Für Teilchensorten, deren Zahl nicht erhalten bleibt, wie z. B. die Photonen, die spontan von einem elektrisch ge ladenen Teilchen emittiert oder absorbiert werden können, kann die Bedingung der Teilchenzahlerhaltung nicht gestellt werden. Diese Bedingung lässt sich aus dem großkanonischen Ensemble entfernen, indem das chemische Potenzial auf null ge setzt wird, μ = 0. Ganz allgemein gilt deshalb: Eichbosonen besitzen das chemische Potenzial μ = 0.
32.3 Das großkanonische Ensemble identischer Teilchen Für Systeme aus identischen Teilchen bleibt die Definition des großkanonischen En sembles, Gln. (32.31), (32.27), (32.28) gültig, wenn H, N und somit auch D als die ent sprechenden Operatoren in der Zweiten Quantisierung interpretiert werden und die Spur „Sp“ über den gesamten Fock-Raum erstreckt wird. Der Hamilton-Operator eines realen Quantengases enthält aufgrund der Wech selwirkung der Konstituenten neben einem Einteilchenoperator auch einen Zweiteil chenoperator. Für viele thermodynamische Betrachtungen ist es jedoch ausreichend, im Dichteoperator den vollen Hamilton-Operator durch einen effektiven Einteilchen operator zu ersetzen, während in der Energie ⟨H⟩ des Gases die Zweiteilchenwechsel wirkung mitgenommen werden muss. Wie ein geeigneter effektiver Einteilchenopera tor gefunden werden kann, werden wir in Abschnitt 32.5 erfahren. Wir wollen deshalb im Folgenden zunächst Dichteoperatoren betrachten, die durch den Exponenten ei nes Einteilchenoperators K = ∑ K kl a†k a l (32.34) k,l
gegeben sind, D=
1 −K e , Z
Z = Sp e−K .
(32.35)
Insbesondere betrachen wir hier das großkanonische Ensemble (32.27): K = β(H − μN) .
(32.36)
394 | 32 Quantenstatistik
Ein Dichteoperator der Form (32.34), (32.35) beschreibt ein System unabhängiger (nichtwechselwirkender) identischer Teilchen. Für solche Systeme kann der Hamil ton-Operator in die Diagonalform nk = a†k a k
H = ∑ ϵ k nk ,
(32.37)
k
gebracht werden, wobei ϵ k die Einteilchenenergie und nk der Besetzungszahloperator (31.31) ist. Dies erfordert lediglich eine geeignete Wahl der Einteilchenbasis |k⟩, siehe Anhang F.2, wo wir nichtdiagonale Hamilton-Operatoren explizit behandeln werden. Der Teilchenzahloperator N = ∑ nk k
ist in jeder orthonormierten Einteilchenbasis diagonal. Zur Berechnung der Spur über den Fock-Raum wählen wir zweckmäßigerweise die Basiszustände in der Besetzungszahldarstellung (31.30), |n, N⟩ = |n1 , n2 , . . . , n k , . . . ⟩ ,
(32.38)
wobei die Gesamtteilchenzahl N durch die Summe der Besetzungszahlen n k gegeben ist: N = ∑ nk . k
Mit (31.32) bzw. (31.56) folgt: N|n1 , n2 , . . . ⟩ = ∑ n k |n1 , n2 , . . . ⟩ , k
H|n1 , n2 , . . . ⟩ = ∑ ϵ k n k |n1 , n2 , . . . ⟩ . k
und unter Benutzung von (31.23) finden wir: Z = Sp (e−β(H−μN)) =
∑ ⟨n1 , n2 , . . . |e−β(H−μN)|n1 , n2 , . . . ⟩ n1 ,n2 ,...
∑ ⟨n1 , n2 , . . . |e−β ∑k (ϵ k −μ)n k |n1 , n2 , . . . ⟩
=
n1 ,n2 ,...
=
e−β ∑k (ϵ k −μ)n k =
∑ n1 ,n2 ,...
∑
∏ e−β(ϵ k −μ)n k
n1 ,n2 ,... k
= ∏ ∑ e−β(ϵ k −μ)n k . k
nk
Für unabhängige, d. h. nichtwechselwirkende Teilchen zerfällt die großkanonische Zustandssumme in das Produkt Z = ∏Z k , k
(32.39)
32.3 Das großkanonische Ensemble identischer Teilchen | 395
wobei Zk = ∑e−β(ϵ k −μ)n k
(32.40)
nk
die großkanonische Zustandssumme der Teilchen im Einteilchenzustand |k⟩ ist. Das über Gl. (32.32) definierte großkanonische Potenzial Ω = Ω(T, μ) zerfällt dann in eine Summe von Beiträgen Ω k der einzelnen Einteilchenzustände: Ω = ∑ Ωk , k
1 Ω k = − ln(Zk ) . β
(32.41)
Für spätere Betrachtungen geben wir nachfolgend noch die (Einteilchen-)Dichtema trix (31.94) im großkanonischen Ensemble (32.35) an. Diese ist weiterhin durch (31.95) gegeben, wobei allerdings ⟨a†k a l ⟩ jetzt den durch (32.31) definierten thermischen Er wartungswert bezeichnet. In der Einteilchenbasis, in der D diagonal ist, folgt unter Benutzung von (31.26) bzw. (31.55) und der Orthogonalität der Basiszustände (32.38) für verschiedene Besetzungszahlen {n k } ⟨a†k a l ⟩ = δ kl Nk ,
(32.42)
Nk = ⟨nk ⟩ = ⟨a†k a k ⟩ ,
(32.43)
wobei
die thermische Besetzungszahl des Einteilchenzustands |k⟩ ist. Offensichtlich ist Nk die mittlere Besetzungszahl eines Einteilchen-Niveaus |k⟩ der Energie ϵ k in einem Sys tem identischer Teilchen, welches sich im thermodynamischen Gleichgewicht bei der Temperatur T = 1/β und dem chemischen Potenzial μ befindet. Mit (32.42) finden wir aus (31.95) für die Dichtematrix bei endlichen Temperaturen ̂ ⟩ , ρ(x, x ) = ∑ φ k (x)Nk φ∗k (x ) = ⟨x|ρ|x
(32.44)
k
wobei ρ̂ = ∑ |k⟩Nk ⟨k|
(32.45)
der zugehörige thermische (Einteilchen-)Dichteoperator ist.⁸ Gegenüber dem entspre chenden Ausdruck (31.98) bei T = 0 sind hier die Besetzungszahlen n k durch ihr thermischen Pendant Nk ersetzt. Mittels der Zustandssumme (32.28) können wir un
8 Unglücklicherweise wird in der physikalischen Literatur der Begriff Dichteoperator sowohl für die (Vielteilchen-)Operatoren D der statistischen Ensembles, siehe Gln. (32.19), (32.27), als auch für den Einteilchenoperator ρ̂ (32.45) benutzt.
396 | 32 Quantenstatistik
ter Berücksichtigung der Form des Hamilton-Operators (32.37) die thermischen Beset zungszahlen Nk (32.43) durch Nk = −
1 ∂ ln Z 1 ∂ ln Zk 1 ∂ ln Zk =− = β ∂ϵ k β ∂ϵ k β ∂μ
(32.46)
ausdrücken. Mit (32.41) erhalten wir Nk = −
∂Ω k ∂μ
(32.47)
und mit (32.45) finden wir für die mittlere Gesamtteilchenzahl N = Sp ρ̂ = ∑ Nk
(32.48)
k
die bekannte thermodynamische Beziehung N=−
∂Ω . ∂μ
32.3.1 Fermi-Verteilung Für Fermi-Systeme sind die (tatsächlichen) Besetzungszahlen n k der Einteilchenzu stände |k⟩ wegen des Pauli-Prinzips auf n k = 0, 1 beschränkt und wir erhalten für die großkanonische Zustandssumme (32.40): (−)
Zk = ∑ e−β(ϵ k −μ)n k = 1 + e−β(ϵ k −μ) .
(32.49)
n k =0,1
Hiermit finden wir aus (32.46) für die thermischen Besetzungszahlen eines Systems unabhängiger Fermionen: (−)
Nk =
1 . 1 + e β(ϵ k −μ)
(32.50)
Dies ist die Fermi-Verteilung (oftmals auch als Fermi-Dirac-Statistik bezeichnet). Sie ist qualitativ in Abb. 32.2 dargestellt. Im Limes β → ∞ (T → 0) finden wir: {1 , (−) Nk (β → ∞) = { 0, {
ϵk < μ ϵk > μ
.
(32.51)
Bei T = 0 sind offenbar sämtliche Einteilchenzustände mit einer Energie ϵ k < μ mit (−) jeweils einem Fermion besetzt, Nk = 1, während alle Zustände oberhalb des chemi
32.3 Das großkanonische Ensemble identischer Teilchen | 397
(−)
Nk
T =0
1 0.8
T = 0,2ϵF
0.6 0.4
T ≫ ϵF
0.2 0
ϵk ϵF (−)
Abb. 32.2: Die Fermi-Verteilung Nk als Funktion der Einteilchenenergie ϵ k für verschiedene Tem peraturen. Für T = 0 ist das chemische Potenzial μ durch die Fermi-Kante ϵF gegeben. Der Grenzfall T → ∞ verlangt bei fester Teilchenzahl μ → −∞. (−)
schen Potenzials ϵ k > μ unbesetzt sind, Nk = 0. Die scharfe Kante der Besetzungs zahl bei ϵ k = μ wird als Fermi-Kante bezeichnet. Wächst die Temperatur an, so wird diese Fermi-Kante „aufgeweicht“ und es kommt zu den Besetzungszahlverteilungen, die in Abb. 32.2 angegeben sind.
32.3.2 Bose-Verteilung Für Bose-Systeme können die Besetzungszahlen n k der Einteilchenzustände |k⟩ sämt liche nichtnegativen ganzen Zahlen annehmen: n k = 0, 1, 2, . . . . Die Zustandssumme (32.40) führt dann auf die geometrische Reihe ∞
(+)
Zk = ∑ e−β(ϵ k −μ)n k , n k =0
deren Summation für ϵ k > μ 1 (32.52) 1 − e−β(ϵ k −μ) liefert. Hiermit finden wir aus (32.46) für die thermischen Besetzungszahlen eines Sys tems unabhängiger Bosonen (+)
Zk =
(+)
Nk =
1 , e β(ϵ k −μ) − 1
(32.53)
398 | 32 Quantenstatistik
was als Bose-Verteilung (bzw. Bose-Einstein-Statistik) bezeichnet wird. Sie wurde ur sprünglich von S. Bose für Photonen (μ = 0) eingeführt und von A. Einstein auf μ ≠ 0 verallgemeinert. Bei der obigen Ableitung der Bose-Statistik haben wir μ < ϵ k vorausgesetzt. In der Tat sehen wir, dass für ϵ k = μ Besetzungszahl in einem Bose-System divergiert. Wir können hieraus schließen, dass für Bose-Systeme das chemische Potenzial nicht grö ßer sein kann als die niedrigste Einteilchenenergie, die wir mit ϵ0 bezeichnen wollen: μ ≤ ϵ0 ,
ϵ0 = min{ϵ k } .
Für μ < ϵ k fällt die mittlere Besetzungszahl (32.53) stark mit wachsender Energie ab, sodass sich die Bosonen bevorzugt im Zustand niedrigster Energie ϵ0 aufhalten. Die Bose-Verteilung (32.53) ist in der Abb. 32.3 illustriert. (+)
Nk
niedrige Temperatur
hohe Temperatur ϵk
(+)
Abb. 32.3: Die Bose-Verteilung Nk (32.53) als Funktion der Einteilchenenergie ϵ k für niedrige und hohe Temperaturen.
(+)
Im Limes β → ∞ (T → 0) verschwinden sämtliche Bose-Besetzungszahlen Nk (32.53) mit ϵ k > μ. Da für diese Systeme μ ≤ ϵ0 = min{ϵ k } gilt, ist nur die Beset zungszahl des untersten Energieniveaus ϵ0 von null verschieden. Sämtliche Teilchen besetzen deshalb den Zustand minimaler Energie⁹ {N , (+) Nk (β → ∞) = { 0, {
ϵ k = ϵ0 ϵ k > ϵ0
.
(32.54)
Dieses Phänomen wird als Bose-Einstein-Kondensation bezeichnet. Ein Bose-EinsteinKondensat konnte erstmalig 1995 im Labor hergestellt werden, wofür E. A. Cornell, C. E. Wieman und W. Ketterle 2001 den Nobelpreis enthielten. Abschließend betrachten wir noch den Beitrag der Zustände nahe dem che mischen Potenzial zur Energie. Entwicklung der Bose-Verteilung (32.53) für kleine
9 Die Beziehung (32.54) für ϵ k = ϵ 0 impliziert, dass für β → ∞ das chemische Potenzial sich wie μ = ϵ 0 − c/β verhält mit c = ln(1 + 1/N).
32.3 Das großkanonische Ensemble identischer Teilchen | 399
β(ϵ k − μ) liefert (+)
Nk ≃
1 , β(ϵ k − μ)
woraus
|ϵ k − μ| ≪ 1/β = T ,
1 =T (32.55) β folgt. Sämtliche Zustände in der Nähe des chemischen Potenzials (ϵ k ≈ μ) liefern den selben Beitrag T zur Energie, unabhängig vom konkreten Wert der ϵ k . (+)
lim (ϵ k − μ)Nk =
ϵ k →μ
Der harmonische Oszillator bei endlichen Temperaturen Der Hamilton-Operator des harmonischen Oszillators lässt sich in die Form (12.41) 1 H = ℏω (n + ) 2 bringen, wobei n = a† a der Besetzungszahloperator ist, der die Anzahl der Schwin gungsquanten (Phononen) misst. Dies ist der Hamilton-Operator eines Systems nichtwechselwirkender Bosonen (Phononen), denen nur ein einziger EinteilchenZustand, mit Energie ℏω, zur Verfügung steht und deren Vakuum-Zustand |0⟩ die Energie 12 ℏω besitzt. Wir betrachten einen harmonischen Oszillator im Wärmebad. Durch Energieaus tausch mit der Umgebung wird der Oszillator angeregt oder abgeregt und somit die Phononenzahl verändert. Das Wärmebad ist somit gleichzeitig ein Teilchenreser voir für die Phononen. Folglich ist das kanonische Ensemble des Oszillators gleich zeitig das großkanonische Ensemble der Phononen. Da die Phononenzahl durch die Anregungsenergie gegeben ist, die prinzipiell nicht erhalten ist, besitzen die Phononen das chemische Potenzial μ = 0, siehe die Blaubox am Ende von Ab schnitt 32.3. Mit E n = ℏω(n + 1/2) finden wir aus (32.24) für die kanonische Zu standssumme des Oszillators ∞
Z n0 (β) = e− 2 ℏω ∑ e−nℏω = e− 2 ℏω Z(+) (β) , 1
1
n=0
wobei
1 1 − e−βℏω die großkanonische Zustandssumme (32.52) der Phononen mit Energie ℏω und che mischem Potenzial μ = 0 ist. Die Temperatur T = 1/β legt die mittlere thermische Phononenzahl (32.53) 1 N(ω) = βℏω (32.56) e −1 und damit die mittlere Energie Z(+) (β) =
⟨H⟩ = −
1 ∂ ln Z = ℏω (N + ) = E(ω) + E0 , ∂β 2
des Oszillators fest.
E(ω) = ℏωN(ω)
(32.57)
400 | 32 Quantenstatistik
32.3.3 Gibbs-Statistik Für große Einteilchenenergien ϵ k ≫ μ können wir im Nenner der Gln. (32.50) bzw. (32.53) die 1 gegenüber der Exponentialfunktion vernachlässigen und die mittleren Fermi- bzw. Bose-Besetzungszahlen vereinfachen sich zur Gibbs- oder BoltzmannVerteilung (±) Nk (ϵ k ≫ μ) ≃ e−β(ϵ k −μ) , die sowohl für unterscheidbare als auch klassische Teilchen gilt. Abbildung 32.4 zeigt die Bose-, Fermi- und die Boltzmann-Verteilung jeweils für dieselbe Teilchenzahl. Für große ϵ k nähert sich sowohl die Bose- als auch die Fermi-Verteilung der BoltzmannVerteilung an. Dies ist nicht verwunderlich, da sich die Teilchen bei sehr hohen Ener gien wie klassische Teilchen verhalten und dabei ihre Identität, die in ihrer Quanten natur begründet ist, verlieren. Außerdem sind für sehr hohe Energien die mittleren (±) Besetzungszahlen so klein, Nk ≪ 1, dass die Identität der Teilchen irrelevant wird. (−)
Insbesondere wird das Pauli-Prinzip für Nk ≪ 1 bedeutungslos. Nk
Boltzmann
Bose
Fermi ϵk Abb. 32.4: Vergleich von Fermi-, Bose- und Boltzmann-Verteilung für Systeme, die aus der gleichen Anzahl von Teilchen bestehen.
In Abb. 32.5 ist das chemische Potenzial als Funktion der Temperatur für Bose- und Fermi-Systeme und im Vergleich dazu für ein ideales klassisches Gas dargestellt. Für T → ∞ nähern sich die chemischen Potenziale aller drei Gase an. Dies ist nicht ver wunderlich, da bei hohen Temperaturen die mittleren kinetischen Energien der Kon stituenten sehr groß werden und der Einfluss der Quantenmechanik, insbesondere die Austauschwechselwirkung, vernachlässigbar ist. Für das Bose-System ist das chemische Potenzial stets negativ und strebt gegen null für T → 0, in Übereinstimmung mit den Ergebnissen des Abschnitts 32.3.2.
32.3 Das großkanonische Ensemble identischer Teilchen |
401
μ T
Fermi
T Bose Boltzmann Abb. 32.5: Das chemische Potenzial μ (in Einheiten von T ) als Funktion der Temperatur T für ein ideales Gas aus Fermionen, Bosonen bzw. klassischen Teilchen mit jeweils derselben Teilchenzahl.
32.3.4 Die Entropie identischer Teilchen Wie wir bereits in Abschnitt 32.2 bemerkt haben, ist die Entropie (32.14) die zentrale Größe in der Beschreibung von statistischen Systemen. Nachfolgend wollen wir diese Größe für das großkanonische Ensemble D (32.27) identischer Teilchen, S = −⟨ln D⟩ = −Sp (D ln D) ,
(32.58)
berechnen, da sie im Abschnitt 32.5 benötigt wird. Unter Ausnutzung der expliziten Gestalt von D (32.27) können wir die Entropie (32.58) in der Form
S = ln Z − β
∂ ln Z ∂β
(32.59)
schreiben. Für die Überlegungen des Abschnitts 32.5 ist es ausreichend, Systeme un abhängiger Teilchen zu betrachten. Die Zustandssumme für ein System unabhängi ger Bosonen bzw. Fermionen haben wir bereits in den Abschnitten 32.3.1 bzw. 32.3.2 berechnet. Aus (32.39) und (32.49) bzw. (32.52) erhalten wir (±)
(±)
ln Z(±) = ∑ ln Zk = ∓ ∑ ln (1 ∓ e−β(ϵ k −μ) ) = ± ∑ ln (1 ± Nk ) , k
k
k
wobei wir die expliziten Ausdrücke für die thermischen Besetzungszahlen (±)
Nk = [e β(ϵ k −μ) ∓ 1]
−1
(32.60)
402 | 32 Quantenstatistik
benutzt haben. Aus (32.60) folgt ∂ ln Z (±) (±) = − ∑(ϵ k − μ)Nk ∂β k und mit e β(ϵ k −μ) =
(±)
1 ± Nk (±)
Nk
finden wir
(±)
β
1 ± Nk ∂ ln Z(±) (±) = − ∑ Nk ln (±) ∂β N k
.
k
Zusammen mit (32.60) erhalten wir schließlich für die Entropie (32.59) (±)
(±)
(±)
(±)
S = −∑ [Nk ln Nk ∓ (1 ± Nk ) ln (1 ± Nk )] .
(32.61)
k
Man beachte, dass für Fermi-Systeme (unteres Vorzeichen) dieser Ausdruck invariant ist gegenüber der Ersetzung (−) (−) Nk → 1 − Nk . Mit Hilfe der Dichtematrix ρ̂ (32.45) lässt sich die Entropie (32.61) in der kompakten Form ̂ ln (1̂ ± ρ)] ̂ S = −Sp [ρ̂ ln ρ̂ ∓ (1̂ ± ρ)
(32.62)
schreiben. Die Spur läuft hier über den Hilbert-Raum der Einteilchenzustände.
32.4 Die Wärmestrahlung Bei hohen Temperaturen glühen Festkörper bekanntlich. Sie emittieren dabei sicht bares Licht, d. h. elektromagnetische Wellen. Bei niedrigeren Temperaturen geben sie Wärmestrahlung in Form unsichtbarer elektromagnetischer Wellen im InfrarotBereich ab. Da beide Formen der Strahlung gleichen elektromagnetischen Ursprungs sind, müssen sie durch dieselben Gesetze beschreibbar sein. Wir werden deshalb generell von Wärmestrahlung sprechen, auch wenn sie sich im sichtbaren Bereich befindet. Die erste systematische Theorie der Wärmestrahlung wurde 1859 von G. Kirch hoff aufgestellt. Dazu führte er die mathematische Idealisierung eines „Schwarzen
32.4 Die Wärmestrahlung
| 403
Körpers“ ein, der sämtliche auf ihn einfallende Strahlung absorbiert. In guter Nähe rung lässt sich ein Schwarzer Körper durch einen Hohlraum mit einem kleinen Loch als Öffnung realisieren. Dieses Loch ist ein fast idealer Absorber. Die aus ihm heraustre tende Strahlung ist weitgehend identisch mit der Wärmestrahlung, welche zwischen den Innenwänden des Hohlraums ausgetauscht wird. In einem Hohlraum mit dem Volumen V = L3 und der Temperatur T soll Strah lungsgleichgewicht herrschen (Abb. 32.6). Die Wände sollen aus einem ideal leiten den Metall bestehen. Aus der Elektrodynamik wissen wir, dass das elektrische Feld in einem idealen Leiter verschwindet. Die Metallwände sind deshalb für elektroma gnetische Wellen ideal reflektierende Wände, auf denen E(x) = 0 gilt. Die Lösungen der Maxwell-Gleichungen für das Vakuum im Hohlraum sind deshalb durch stehende Wellen E(x, t) = e−iωt E0 (x) , E0 (x) ∼ sin(k 1 x1 ) sin(k 2 x2 ) sin(k 3 x3 ) gegeben, welche Knoten an den Wänden besitzen. Dazu muss in jede der drei Rich tungen des Hohlraums L3 gerade ein Vielfaches der halben Wellenlängen λ i passen (Abb. 32.6), d. h.: λi n i = L , n i = 1, 2, . . . , i = 1, 2, 3 , 2 π 2π = ni . ki = λi L
T
L
L
L Abb. 32.6: Stehende Welle in einem Hohlraum.
404 | 32 Quantenstatistik
Dies ist gerade die de-Broglie-Quantisierungsbedingung, die wir in Abschnitt 5.4 gefunden haben. Ferner gilt für elektromagnetische Wellen die Dispersionsbeziehung ω(k) = ck ,
k = |k| ,
k = (k 1 , k 2 , k 3 ) ,
(32.63)
wobei c die Lichtgeschwindigkeit bezeichnet. Bei stehenden Wellen können wir uns auf positive Wellenzahlen k i > 0 beschrän ken (k i → −k i führt zu keiner neuen stehenden Welle). Demzufolge sind die mögli chen k-Werte durch diskrete Punkte im Oktanten des k-Raums mit k i > 0 gegeben, die ̄ der Wellenvek einen Abstand π/L voneinander besitzen (Abb. 32.7). Die Anzahl d N tor-Punkte k mit Beträgen k = |k| im Intervall [k, k + dk] ist demnach durch ̄= dN
1 8
Volumen der k-Raum-Kugelschale (k, dk) Volumen pro Punkt im k-Raum
(32.64)
gegeben, wobei 1/8 von der Beschränkung auf den Oktanten mit k i > 0 herrührt. Eine Kugelschale mit (innerem) Radius k und infinitesimaler Dicke dk besitzt das Volumen dV(k) = 4πk 2 dk , wobei 4πk 2 die Oberfläche der Kugelschale ist. Dasselbe Ergebnis erhält man natür lich auch durch Bildung des Differenzials des Volumens der Kugel mit Radius k V(k) =
4π 3 k . 3
Abb. 32.7: Wellenvektor-Punkte im Oktanten des k-Raums.
32.4 Die Wärmestrahlung
| 405
Das Volumen pro Punkt (erlaubter Wellenzahl) im k-Raum beträgt wie oben festge stellt (π/L)3 . Beachten wir noch, dass eine elektromagnetische Welle bei gegebenem Wellenvektor k zwei Polarisationsrichtungen besitzt, so erhalten wir für die Anzahl der stehenden Wellen mit |k| im Intervall [k, k + dk]:¹⁰ 2 2 ̄ = 2 ⋅ 1 4πk dk = 2 ⋅ 4πk dk . dN = 2d N 3 8 (π/L) (2π/L)3
Mittels der Dispersionsbeziehung (32.63) lässt sich dN durch ω statt k ausdrücken: dN =
L3 2 ω dω , π2 c3
dω = c dk .
(32.65)
Damit gibt dN auch die Zahl der Wellen mit einer Frequenz im Intervall [ω, ω+dω] an. Die stehenden elektromagnetischen Wellen im Hohlraum sollen sich nun im thermo dynamischen Gleichgewicht mit den Wänden des Kastens befinden. Dies bedeutet ins besondere, dass im Hohlraum die gleiche Temperatur wie auf den Wänden herrscht, die als Wärmereservoir (oder Wärmebad) für den Hohlraum dienen. Die mittlere ther mische Energie eines Oszillators mit der Frequenz ω im thermodynamischen Gleich gewicht mit einem Wärmebad der Temperatur T ist nach Gl. (32.57) durch E(ω) = ℏωN(ω) gegeben, wobei N(ω) die thermische Phononenzahl (32.56) N(ω) =
1 −1
e βω
(32.66)
ist. Eine elektromagnetische Welle der Frequenz ω hat deshalb die Energie E(ω) =
ℏω . −1
e βℏω
(32.67)
Die Energie dE der stehenden Wellen mit Frequenzen im Intervall [ω, ω + dω] beträgt dE = dN E(ω) . Hieraus finden wir mit (32.65) und (32.67) für die zugehörige Energiedichte e := E/V (Energie pro Volumen V = L3 ) de(ω) =
dE dE ω2 dω ℏω = 3 = 2 3 βℏω = u(ω) dω . V L π c e −1
10 Das hier gewonnene Ergebnis ist nicht auf stehende Wellen begrenzt, falls wir die Einschränkung k i > 0 fallen lassen. Berücksichtigen wir, dass 4πk2 dk das Volumen der Kugelschale im k-Raum ist, so zeigt (32.64), dass jede Welle (fester Polarisation) ein Volumen (2π/L)3 im k-Raum einnimmt. Dasselbe Ergebnis hatten wir auch in Abschnitt 30.11 für Materiewellen gefunden.
406 | 32 Quantenstatistik
Abb. 32.8: Die spektrale Energiedichte u(ω) (32.68): Angegeben sind die Gesetze für die Grenzfälle ω → 0 und ω → ∞.
Dies liefert für die spektrale Energiedichte, die Energiedichte pro Frequenzeinheit, u(ω) =
de(ω) , dω
die Planck’sche Strahlungsformel u(ω) =
ℏ π2 c3
ω3 eℏω/T
−1
,
(32.68)
die für alle ω sehr gut mit dem Experiment übereinstimmt (Abb. 32.8). M. Planck fand diese Formel 1900 unter der Hypothese, dass Energie von den Wänden des Hohlraums an die Strahlung nur in Vielfachen von Strahlungsquanten ℏω, abgegeben wird. Der Erfolg dieser Hypothese war der erste deutliche Hinweis auf die Quantisierung der Strahlungsenergie. Das elektromagnetische Strahlungsfeld muss also quantisiert sein: Es besteht aus Strahlungsquanten mit der Energie ℏω, die als Photonen bezeichnet werden. Durch Anpassen von Gl. (32.68) an die gemessenen Spektraldichten wurde der numerische Wert von ℏ ermittelt ℏ = 1,0546 ⋅ 10−34 J ⋅ s . Diese Größe wurde später als Planck’sches Wirkungsquantum bezeichnet. Die Ablei tung der Strahlungsformel (32.68) durch Planck gilt als die Geburtsstunde der Quan tentheorie. Für kleine Frequenzen ℏω ≪ 1/β = T reduziert sich die Energie (32.67) der elek tromagnetischen Welle mit Frequenz ω auf¹¹ E(ω) = T 11 Dies ist die klassische Energie, welche die elektromagnetische Welle nach dem Gleichverteilungs satz besitzen würde. Dieser besagt, dass jeder Freiheitsgrad im thermodynamischen Gleichgewicht
32.4 Die Wärmestrahlung
| 407
und die spektrale Energiedichte (32.68) auf das Rayleigh-Jeans’sche Strahlungsgesetz T de(ω) (32.69) = 2 3 ω2 . dω π c Dieses ursprünglich im Rahmen der klassischen Elektrodynamik gewonnene Ergebnis stimmt für kleine ω sehr gut mit dem Experiment überein, führt jedoch bei Integration über den gesamten Frequenzbereich zur sogenannten „Ultraviolett-Katastrophe“ u(ω) =
∞
∞
∫ de = ∫ dω u(ω) ∼ ∫ dω ω2 = ∞ . 0
0
Der Hohlraum müsste demzufolge eine unendlich große Energiedichte e besitzen. Die ses unsinnige Resultat zeigte, dass die spektrale Energiedichte für große Frequenzen einem anderen Gesetz als (32.69) gehorchen muss. Die Energiedichte der Planck’schen Strahlungsformel (32.68) besitzt die Gestalt ω u(ω) = ω3 f ( ) . (32.70) T Vor Planck fand bereits W. Wien durch Kombination von Thermodynamik und der elektromagnetischen Theorie des Lichts dieses empirisch bestätigte Verhalten für gro ße ω. Misst man die spektrale Energiedichte u(ω) bei verschiedenen Temperaturen T, so findet man für u(ω)/ω3 als Funktion von ω/T jeweils dieselbe Kurve f(ω/T). Ferner konnte Wien unter gewissen Annahmen zeigen, dass diese Funktion für ω → ∞ die asymptotische Gestalt ω f ( ) ∼ e−gω/T , g = const (32.71) T besitzt, was im Experiment verifiziert wurde und mit der führenden Ordnung der Planck’schen Strahlungsformel (32.68) für βω ≫ 1 übereinstimmt. Berechnen wir die zum Wien’schen Gesetz (32.70) gehörende Gesamtenergie dichte ∞
e = ∫ dω u(ω) , 0
so finden wir nach Variablensubstitution x = ω/T: ∞
e = T 4 ∫ dx x3 f(x) = T 4 ⋅ const . 0
Dies ist das empirisch gut bestätigte Stefan-Boltzmann-Gesetz (1884). mit einem Wärmebad der Temperatur T die Energie 12 T besitzt. (Man beachte, dass in unseren Einhei ten kB = 1.) Die elektromagnetische Welle besitzt zwei Freiheitsgrade aufgrund ihrer beiden Polari sationsrichtungen. Die Anzahl N(ω) (32.66) der Strahlungsquanten oder Photonen mit der Frequenz ω = c|k| bzw. Wellenzahl |k|, die im thermodynamischen Gleichgewicht bei der Temperatur T an geregt sind, divergiert für ω → 0. Im thermodynamischen Gleichgewicht sind also unendlich viele Photonen mit k = 0 bzw. ω = 0 angeregt. Obwohl ihre Anzahl unendlich groß ist, liefern sie insge samt nur einen endlichen Beitrag zur thermodynamischen Energie: limω→0 E(ω) = T. Dieses Ergebnis folgt auch unmittelbar aus Gl. (32.55) mit μ = 0.
408 | 32 Quantenstatistik ̄ der spektralen Energiedichte finden wir aus der Wien’schen Für das Maximum ω Verteilung (32.70) die Bestimmungsgleichung: ̄3 ω ̄ ̄ ̄ ̄ ̄ ω ω du(ω) ω ω ω ̄ 2 [3f ( ) + f ( )] = 0 . ̄2 f ( ) + f ( )=ω = 3ω dω ̄ T T T T T T ω ̄: Hieraus ergibt sich mit Hilfe von (32.71) für die Lage des Maximums ω ̄ = T ⋅ const . ω Dies ist das Wien’sche Verschiebungsgesetz.
32.5 Approximation des mittleren Felds bei endlichen Temperaturen Wir wollen jetzt mittels des Variationsprinzips eine genäherte Beschreibung von wechselwirkenden Systemen identischer Teilchen bei endlichen Temperaturen errei chen. Für Fermi-Systeme wird dies eine Verallgemeinerung der im Abschnitt 30.10 (im Rahmen der Ersten Quantisierung) besprochenen Hartree-Fock-Methode auf endli che Temperaturen sein. Wir werden dabei feststellen, dass die Zweite Quantisierung eine wesentlich kompaktere und elegantere Formulierung der Hartree-Fock-Methode erlaubt. Wie bereits oben festgestellt, beschreiben die in der Besetzungszahldarstellung angegebenen Basiszustände (31.30) Systeme unabhängiger Teilchen. Sie können des halb nicht die exakten Zustände von wechselwirkenden Vielteilchensystemen reprä sentieren. Allerdings besitzen sie die aufgrund der Identität der Teilchen erforderliche Symmetrie bezüglich einer Permutation der Teilchen. Wir werden jetzt diese Zustände benutzen, um zumindest eine approximative Beschreibung von wechselwirkenden Vielteilchensystemen zu erhalten. Dazu werden wir mit Hilfe des Variationsprin zips die für das betrachtete wechselwirkende System bestmöglichen (optimalen) Basisfunktionen finden. Dies verlangt nicht nur die Bestimmung der EinteilchenBasisfunktionen |k⟩ = a†k |0⟩, sondern auch der optimalen Besetzungszahlen dieser Zustände. Wir erwarten, dass die Besetzungszahlen von der Temperatur abhängen, was möglicherweise auch eine Temperaturabhängigkeit der optimalen Einteilchen zustände zur Folge hat. Systeme bei endlichen Temperaturen werden nicht durch eine einzelne (Viel teilchen-)Wellenfunktion, sondern durch den Dichteoperator charakterisiert. Für ein System im thermischen und chemischen Gleichgewicht¹² ist dieser durch das großka
12 Ein System befindet sich im thermischen (chemischen) Gleichgewicht, wenn es sich im Gleich gewicht mit seiner Umgebung bezüglich Energie-(Teilchen-)Austausch befindet. Die Umgebung wird in diesem Zusammenhang als Wärmebad (Teilchenreservoir) bezeichnet und durch eine Temperatur T = 1/β (ein chemisches Potenzial μ) charakterisiert, siehe Abschnitt 32.2.3.
32.5 Approximation des mittleren Felds bei endlichen Temperaturen | 409
nonische Ensemble (32.27) 1 −β(H−μN) (32.72) e Z gegeben, wobei H der exakte Hamilton-Operator, N der Teilchenzahl-Operator und D=
Z = Sp e−β(H−μN) die Zustandssumme ist, die die Normierung Sp D = 1 gewährleistet. Für wechselwirkende Systeme kann der exakte Dichteoperator (32.72) i. A. nicht streng behandelt werden. Wir werden deshalb einen geeigneten Ansatz für den Dichteoperator D machen und diesen dann durch das Variationsprinzip optimie ren. Wie aus der Thermodynamik bekannt, wird für Systeme, die sich im thermischen Gleichgewicht (mit Temperatur T) und im chemischen Gleichgewicht (mit chemi schem Potenzial μ) befinden, das großkanonische Potenzial Ω (32.33) Ω = E − TS − μN
(32.73)
statt der Energie E = ⟨H⟩ minimal. Um die thermischen Erwartungswerte mittels des Wick’schen Theorems (siehe Abschnitt 31.7.4) berechnen zu können, approximieren wir den Hamilton-Operator H im Dichteoperator (32.72) durch einen Einteilchenope rator h = ∑ ω k a†k a k (32.74) k
mit (bisher noch) unbekannten Einteilchenenergien ω k . Der Dichteoperator des groß kanonischen Ensembles lautet dann D=
1 −β(h−μN) e , Z
Z = Sp e−β(h−μN) .
(32.75)
Die Einteilchenenergie ω k werden wir durch Minimierung des großkanonischen Po tenzials Ω (32.73), ∂Ω =0, ∂ω k bestimmen, was uns den optimalen Dichteoperator innerhalb des Ansatzes (32.75) lie fern wird. Formal ist der durch die Zustandssumme Z (32.32) definierte Ausdruck für Ω äqui valent zu dem in Gl. (32.73) angegebenen Ausdruck. Allerdings besteht diese Äqui valenz nur für den exakten Dichteoperator (32.72). Da wir jedoch für den Dichteope rator den (Einteilchen-)Ansatz (32.75) gemacht haben, würden wir bei der Berech nung von Ω aus der zugehörigen Zustandssumme Z (32.75) die Zweiteilchenwechsel wirkung vollständig verlieren. Deshalb berechnen wir Ω über Gleichung (32.73), wobei die Energie E = ⟨H⟩ durch den thermischen Erwartungswert des vollen Hamilton-Ope rators H (31.90) gegeben ist.
410 | 32 Quantenstatistik
Unter Benutzung des Wick’schen Theorems (siehe Abschnitt 31.7.4), das auch für die thermischen Erwartungswerte gilt, falls D die Exponentialfunktion eines Einteil chenoperators ist (wie in Kapitel 34 bewiesen wird), finden wir für ⟨H⟩ formal densel ben Ausdruck (31.100) wie für den Erwartungswert in einem Basiszustand (31.30): E[ρ] = ⟨H⟩ = ∫d3 x ∫d3 x H0 (x, x )ρ(x , x) 1 ∫d3 x ∫d3 x V(x, x ) [ρ(x, x)ρ(x , x ) ± ρ(x , x)ρ(x, x )] , (32.76) 2 jedoch ist die Dichtematrix ρ jetzt durch ihren Ausdruck (32.44) bei endlichen Tempe raturen gegeben, +
(±)
(±)
ρ(x, x ) = ∑ φ k (x)Nk φ∗k (x ) = ∑⟨x|k⟩Nk ⟨k|x ⟩ , k
(32.77)
k
mit den thermischen Besetzungszahlen (32.50) bzw. (32.53) −1
(±)
Nk = (e β(ω k −μ) ∓ 1)
(32.78)
a†k |0⟩
für Bose- bzw. Fermi-Systeme. Ferner sind |k⟩ = die Eigenzustände des Ein teilchen-Hamilton-Operators (32.74), den wir im Ansatz (32.75) für den statistischen Operator gewählt haben. Die Energie E[ρ] (32.76) ist offensichtlich ein Funktional der Dichtematrix ρ. Dasselbe gilt für die Teilchenzahl N (32.48) und die Entropie S (32.62) und damit für das großkanonische Potenzial (32.73) Ω[ρ] = E[ρ] − TS[ρ] − μN[ρ] . (±)
Über die Besetzungszahlen Nk hängt ρ (32.77) von den noch unbekannten Einteil chenenergien ω k ab, die wir jetzt durch Minimierung von Ω[ρ] bestimmen. Da die (±) Besetzungszahlen Nk monotone Funktionen der Energien ω k sind (siehe Abbn. 32.2, (±) 32.3), können wir statt der Ableitung nach ω k auch die Ableitung nach Nk nehmen. Die Ableitung der Teilchenzahl (32.48) ist dann trivial ∂N (±)
∂Nk
=1.
Für die Ableitung der Entropie (32.61) finden wir ∂S (±) ∂Nk
(±)
= − ln
Nk 1±
(±) Nk
=
ωk − μ . T
Somit lautet die Ableitung des großkanonischen Potenzials Ω (32.73) nach den Beset zungszahlen¹³ ∂Ω ∂E[ρ] ! = − μ − (ω k − μ) = 0 . (32.79) (±) (±) ∂Nk ∂Nk 13 Wir erinnern an dieser Stelle daran, dass die Temperatur T und das chemische Potenzial μ durch die Umgebung vorgegeben sind, mit der sich das betrachtete System im thermischen und chemischen Gleichgewicht befindet. T und μ sind also keine inneren Eigenschaften des betrachteten Systems und können folglich auch nicht von ω k oder der benutzten Einteilchenbasis abhängen.
32.5 Approximation des mittleren Felds bei endlichen Temperaturen | 411
Zur Ableitung der Energie E[ρ] benutzen wir die (funktionale) Kettenregel (siehe An hang D.2) δE[ρ] ∂ρ(x, x ) ∂E[ρ] = ∫d3 x d3 x . (32.80) ∂Nk δρ(x, x ) ∂Nk Variation der Energie E[ρ] (32.76) δE[ρ] =: h[ρ](x , x) δρ(x, x )
(32.81)
liefert unter Berücksichtigung der Symmetrie der Wechselwirkung V(x, x ) = V(x , x) den effektiven Einteilchen-Hamilton-Operator h[ρ](x, x ) = H0 (x)δ(x − x ) + δ(x − x ) ∫d3 y V(x, y)ρ(y, y) ± V(x, x )ρ(x, x ) ,
(32.82)
der von der Dichtematrix ρ abhängt. Für Fermi-Systeme stimmt h[ρ] formal mit dem Hartree-Fock-Hamilton-Operator (30.64) überein, wenn für ρ die Dichtematrix (31.98) bei T = 0 eingesetzt wird. Jedoch ist ρ hier die thermische Dichtematrix (32.77), für welche ∂ρ(x, x ) = ⟨x|k⟩⟨k|x ⟩ (32.83) ∂Nk gilt. Einsetzen von Gln. (32.81) und (32.83) in Gl. (32.80) liefert ∂E[ρ] = ∫d3 x d3 x ⟨k|x ⟩h[ρ](x , x)⟨x|k⟩ = ⟨k|h[ρ]|k⟩ =: ϵ k . ∂Nk
(32.84)
Nach Gl. (32.79) wird das großkanonische Potenzial folglich extremal für ωk = ϵk ,
(32.85)
was die Energien ω k im Dichteoperator mit den Erwartungswerten ϵ k des EinteilchenHamiltonian (32.82) in der gewählten Einteilchenbasis |k⟩ identifiziert, ein sehr plau sibles Ergebnis. Mit ω k = ϵ k liefern Gln. (32.74) und (32.75) die optimale Einteilchen näherung zum Dichteoperator bei gegebener Einteilchenbasis |k⟩. Bisher haben wir Ω bezüglich der Parameter (Einteilchenenergien) ω k im Dichte operator D (32.75) bei fester, d. h. gegebener, Einteilchenbasis |k⟩ minimiert. Zur Be rechnung der Spur in den thermischen Erwartungswerten kann jede beliebige voll ständige Basis verwendet werden und das Ergebnis ist unabhängig von der Wahl der Basis, solange der exakte Dichteoperator verwendet wird. Da wir jedoch im exakten Dichteoperator H durch den Einteilchenoperator h ersetzt haben, hängen die resultie renden thermischen Erwartungswerte sehr wohl von der Wahl der verwendeten Ein teilchenbasis |k⟩ ab. Die optimale Basis ist diejenige, die das großkanonische Poten zial (bei vorgegebenen D bzw. ω k ) minimiert. Wir werden deshalb jetzt Ω bezüglich
412 | 32 Quantenstatistik der Basiszustände ⟨x|k⟩ = φ k (x) variieren. Da die Entropie (32.61) und die Teilchen zahl (32.48) nur von den Besetzungszahlen Nk , nicht aber von den Wellenfunktionen φ k (x) abhängen, erhalten wir δE[ρ] δΩ = . δφ k (x) δφ k (x) Bei der Variation der Energie bezüglich der Wellenfunktion φ k (x) dürfen wir nur sol che Variationen zulassen, welche die Norm der Zustände erhalten. Wir berücksichti gen die Erhaltung der Norm eines Zustands φ k (x) mittels eines Lagrange-Multiplika tors λ k , in dem wir statt E[ρ] das Funktional ̄ E[ρ] = E[ρ] − ∑ λ k ⟨k|k⟩ k
= E[ρ] − ∑ λ k ∫d3 x φ∗k (x)φ k (x)
(32.86)
k
variieren. Wir führen die Variation zweckmäßigerweise nach φ∗k (x) durch.¹⁴ Zur Va riation von E[ρ] benutzen wir die Kettenregel (siehe Anhang D.2): δE[ρ] 3 3 δE[ρ] δρ(y , y) y d y = ∫d . δφ∗k (x) δρ(y , y) δφ∗k (x)
Aus (32.44) folgt mit δφ k (x)/δφ∗l (y) = 0: δρ(y , y) = δ(x − y)Nk φ k (y ) δφ∗k (x) und mit der Definition (32.81) finden wir δE[ρ] = Nk ∫d3 y h[ρ](x, y)φ k (y) . ∂φ∗k (x) ̄ Das Funktional E[ρ] (32.86) wird deshalb extremal bezüglich Variation der Basisfunk ∗ ̄ tionen, δ E[ρ]/δφ k (x) = 0, falls diese der Bedingung Nk ∫d3 x h[ρ](x, y)φ k (y) = λ k φ k (x)
(32.87)
genügen. Bilden wir das Skalarprodukt dieser Gleichung mit φ k (x), so folgt mit (32.84) Nk ϵ k = λ k
14 Wir erinnern daran, dass wir bei der Variation nach einer komplexwertigen Funktion φ k (x) an stelle von Real- und Imaginärteil auch die Funktion φ k (x) und ihr komplex Konjugiertes φ ∗k (x) als unabhängig betrachten können (siehe Abschnitt 21.3).
32.5 Approximation des mittleren Felds bei endlichen Temperaturen | 413
und die Bedingung (32.87) reduziert sich auf die Eigenwertgleichung h[ρ]|k⟩ = ϵ k |k⟩ .
(32.88)
Die optimale Einteilchenbasis |k⟩ ist deshalb durch die Eigenfunktionen des Einteil chen-Hamilton-Operators h[ρ] (32.82) gegeben und seine Eigenwerte liefern die op timalen Einteilchenenergien ϵ k (32.84), (32.85) des Dichteoperators bzw. der thermi schen Besetzungszahlen (32.78). Zusammen mit der Gleichung für die Dichtematrix (32.77) stellt (32.88) ein abgeschlossenes Eigenwertproblem dar, das für beliebig vorge gebene Temperatur T und chemisches Potenzial μ im Prinzip gelöst werden kann. Da ρ (32.77) selbst von der Einteilchenbasis |k⟩ abhängt, ist Gl. (32.88) hochgradig nichtli near. Für Systeme mit einer gegebenen (endlichen) Teilchenzahl N muss darüber hin aus noch aus Gl. (32.48) das zugehörige chemische Potenzial μ bestimmt werden. Die Gln. (32.88), (32.77) und (32.48) definieren die Näherungen des mittleren Felds für Sys teme aus identischen Teilchen bei gegebener Temperatur T und Teilchenzahl N. In dieser Näherung wird das wechselwirkende Vielteilchensystem durch ein System un abhängiger Teilchen ersetzt, die optimal gewählte Einteilchenzustände entsprechend dem thermodynamischen Gleichgewicht besetzen. Die Wechselwirkung der Teilchen wird hier nur durch ein mittleres (nichtlokales) Feld (zweiter Term auf der rechten Seite von Gl. (32.82)) berücksichtigt, das durch Faltung der Wechselwirkung mit der temperaturabhängigen Dichtematrix ρ (32.77) entsteht. Korrekt berücksichtigt sind je doch die Austauschkorrelationen aufgrund der Identität der Teilchen, die zur Bosebzw. Fermi-Statistik führen. Die durch Gln. (32.88), (32.77) und (32.48) definierte Theorie des mittleren Felds ist für beliebige Temperaturen T definiert. Wir können deshalb diese Theorie auch für T → 0 untersuchen. Für T → 0 sind die fermionischen Besetzungszahlen in Gl. (32.51) gegeben. Sämtliche Einteilchenzustände |k⟩ mit Energien ϵ k unterhalb der Fermi-Kante ϵF = μ sind dann entsprechend dem Pauli-Prinzip mit einem Fermion besetzt, während die Zustände oberhalb von ϵF unbesetzt bleiben. Die Theorie des mittleren Felds reduziert sich dann auf die gewöhnliche Hartree-Fock-Theorie, siehe Abschnitt 30.10. Für Bose-Systeme verschwinden für T → 0 ebenfalls alle Besetzungs zahlen mit ϵ k − μ > 0, siehe Gl. (32.54). In diesem Fall halten sich sämtliche Bosonen im Zustand niedrigster Energie ϵ0 = min{ϵ k } auf, was bekanntlich als Bose-EinsteinKondensation bezeichnet wird, siehe Abschnitt 32.3.2.
33 Kohärente Bose- und Fermi-Zustände Die Überlegungen im Rahmen der Zweiten Quantisierung haben gezeigt, dass BoseSysteme sich als Ensembles von Oszillatoren interpretieren lassen. Umgekehrt stellt ein eindimensionaler harmonischer Oszillator das einfachste Bose-System dar, bei welchem die Bosonen nur in einem einzigen Einteilchenzustand existieren, der durch den ersten angeregten Zustand des harmonischen Oszillators gegeben ist. Dieser kann jedoch mehrfach mit den Bosonen (Phononen) derselben Sorte besetzt werden. Der n-te angeregte Oszillatorzustand entspricht dem n-Bosonen-Zustand. Die Oszillatoreigenzustände nehmen eine besonders einfache Form in der Basis der kohärenten Zustände an, welche sich durch eine Reihe von sehr vorteilhaften Ei genschaften, wie z. B. minimale Unschärfe, auszeichnen, siehe Abschnitt 12.11. Wir werden jetzt analoge kohärente Zustände für Bose- und Fermi-Systeme kennenler nen, die sich ebenfalls sehr vorteilhaft für die Beschreibung dieser Systeme benutzen lassen. Für Bose-Systeme sind diese Zustände die direkte Verallgemeinerung der ko härenten Zustände des harmonischen Oszillators auf mehrere (i. A. unendlich viele) Freiheitsgrade. Mit jedem Freiheitsgrad ist ein komplexer Parameter (eine klassische Variable) verknüpft. Von diesen Parametern hängen die kohärenten Bose-Zustände wie beim Oszillator ab. Die kohärenten Fermi-Zustände ergeben sich aus den BoseZuständen, wenn die komplexen Parameter durch antikommutierende GraßmannVariablen ersetzt werden. Diese sind Objekte, die ähnliche algebraische Eigenschaften wie komplexe Zahlen besitzen, jedoch nicht kommutieren, sondern antikommutie ren, d. h., die Vertauschung zweier Graßmann-Variablen führt zum Vorzeichenwech sel. Diese Eigenschaft ist erforderlich, um die Antisymmetrie der Wellenfunktion von Fermi-Systemen zu gewährleisten. Mittels der komplexen bzw. Graßmann-Variablen lässt sich eine analytische Formulierung der Zweiten Quantisierung geben, die eine Alternative zur üblichen algebraischen Formulierung mittels Feldoperatoren ist und in diesem Kapitel entwickelt wird. Unter Benutzung der kohärenten Zustände wird im Kapitel 35 die Funktionalintegralbeschreibung von Bose- und Fermi-Systemen abgeleitet, aus der sich unmittelbar die Funktionalintegralformulierung der Quan tenfeldtheorie ergibt. Für eine Funktionalintegralbeschreibung von Fermi-Systemen ist die Benutzung der kohärenten Zustände unumgänglich.
33.1 Bose-Systeme 33.1.1 Kohärente Bose-Zustände Die beim harmonischen Oszillator definierten kohärenten Zustände können wir un mittelbar für ein Ensemble von harmonischen Oszillatoren, d. h. für ein Bose-System, verallgemeinern. In Analogie zum harmonischen Oszillator definieren wir die kohä https://doi.org/10.1515/9783110586077-011
33.1 Bose-Systeme | 415
renten Bose-Zustände |ζ⟩ als Eigenfunktionen der Vernichtungsoperatoren a k : a k |ζ⟩ = ζ k |ζ⟩ ,
(33.1)
wobei die ζ k komplexe Zahlen sind. Der einzige Unterschied zum harmonischen Os zillator besteht darin, dass die Vernichtungsoperatoren a k jetzt einen zusätzlichen In dex k tragen, der die Quantenzahlen der Einteilchenzustände des Bose-Systems cha rakterisiert. Die in Abschnitt 12.11 gegebene Ableitung der kohärenten Zustände des harmonischen Oszillators können wir Schritt für Schritt für Bose-Systeme (Ensemble von Oszillatoren) wiederholen und finden die Darstellung: |ζ⟩ = exp (∑ a†k ζ k ) |0⟩ .
(33.2)
k
Der Einfachheit halber haben wir hier die unnormierten kohärenten Zustände (12.91) benutzt. Die Gesamtheit der Bosonen in ein und demselben Einteilchenzustand |k⟩ ist äquivalent zu einem harmonischen Oszillator. Entsprechend ist ihr kohärenter Zu stand durch den des Oszillators gegeben: †
|ζ k ⟩ = e a k ζ k |0⟩ . Den kohärenten Zustand für ein System von Bosonen, die sich in mehreren Einteil chenzuständen |k⟩ aufhalten können, erhalten wir, indem wir das Produkt der kohä renten Zustände |ζ k ⟩ von sämtlichen Einteilchenzuständen |k⟩ nehmen: †
|ζ⟩ = ∏ |ζ k ⟩ = ∏ e a k ζ k |0⟩ . k
k
[a†k , a†l ]
= 0 genau den oben angegebenen Ausdruck (33.2). Dies liefert wegen Der zu |ζ⟩ adjungierte Zustand ⟨ζ| = ⟨0| exp (∑ ζ k∗ a k )
(33.3)
k
genügt der zur Definitionsgleichung (33.1) dualen Relation ⟨ζ|a†k = ⟨ζ|ζ k∗ .
(33.4)
Aus der expliziten Form der kohärenten Zustände (33.2) und (33.3) folgen unmittelbar die Beziehungen a†k |ζ⟩ =
∂ |ζ⟩ , ∂ζ k
⟨ζ|a k =
∂ ⟨ζ| . ∂ζ k∗
(33.5)
416 | 33 Kohärente Bose- und Fermi-Zustände Genau wie beim harmonischen Oszillator bilden die kohärenten Zustände |ζ⟩ eine (über-)vollständige Basis mit dem Skalarprodukt
⟨ζ|γ⟩ = exp (∑ζ k∗ γ k ) k
und gestatten eine Darstellung des Einheitsoperators des Fock-Raums
1̂ = ∫ ∏ k
dζ k∗ dζ k exp (−∑ζ k∗ ζ k ) |ζ⟩⟨ζ| . 2πi k
(33.6)
Zur Abkürzung der Notation definieren wir für die Integration über komplexe Varia blen ζ, ζ ∗ das Integrationsmaß d(ζ ∗ , ζ) :=
dζ ∗ dζ , 2πi ∗
dμ(ζ) := (∏ d(ζ k∗ , ζ k )) exp (− ∑ ζ k∗ ζ k ) = ∏ (d(ζ k∗ , ζ k ) e−ζ k ζ k ) , k
k
(33.7)
k
womit sich die Vollständigkeitsrelation (33.6) auf 1̂ = ∫ dμ(ζ) |ζ⟩⟨ζ|
(33.8)
reduziert. Mit Hilfe dieser Relation können wir sämtliche Zustände und Operatoren des Fock-Raums von Bose-Systemen in der Basis der kohärenten Zustände ausdrü cken. Für einen Zustand |ψ⟩ finden wir dann: |ψ⟩ = ∫ dμ(ζ) |ζ⟩⟨ζ|ψ⟩ , wobei nach der üblichen bracket-Notation ⟨ζ|ψ⟩ die Darstellung von |ψ⟩ in der Ba sis der kohärenten Zustände bezeichnet. Aus Gl. (33.3) ist jedoch ersichtlich, dass die Funktion ⟨ζ|ψ⟩ nicht von ζ selbst, sondern allein von ζ ∗ abhängt. Dies mag als Fol ge einer ungeschickten Notation in der Definition der kohärenten Zustände (33.1) er scheinen, die wir in Kauf nehmen, damit der Eigenwert von a durch ζ und nicht ζ ∗ gegeben ist. Tatsächlich sollten wir jedoch erwarten, dass ⟨ζ|ψ⟩ = ⟨ψ|ζ⟩∗ von ζ ∗ statt ζ abhängt. Gewöhnlich tritt dieser Sachverhalt nicht zutage, da man üblicherweise als Basis die Eigenzustände von hermiteschen Operatoren benutzt und ihre reellen Eigenwerte zur Bezeichnung der Basiszustände verwendet; z. B. ist die Ortsdarstel lung ⟨x|ψ⟩ ≡ ψ(x) durch die reellen Eigenwerte x des Ortsoperators x̂ charakteri siert.
33.1 Bose-Systeme | 417
33.1.2 Darstellung des Fock-Raums Ein beliebiger Zustand |ψ⟩ des Fock-Raums lässt sich in der Form |ψ⟩ = ψ(a† )|0⟩ darstellen, wobei ψ(a† ) eine bestimmte Funktion der Erzeugungsoperatoren ist. In der üblichen bracket-Notation finden wir dann für die Darstellung dieses Zustands in der Basis der kohärenten Zustände wegen (33.4) ⟨ζ|ψ⟩ = ⟨ζ|ψ(a† )|0⟩ = ψ(ζ ∗ )⟨ζ|0⟩ . Da a k |0⟩ = o, folgt ⟨ζ|0⟩ = ⟨0| exp (∑ ζ k∗ a k ) |0⟩ = ⟨0|0⟩ = 1 k
und somit die Beziehung ⟨ζ|ψ⟩ = ψ(ζ ∗ ) .
(33.9)
Wie bereits oben bemerkt, steht im Argument der Funktion ψ hier die komplex konju gierte Variable ζ ∗ statt ζ . Bilden wir das komplex Konjugierte von Gl. (33.9), so erhalten wir ∗ ̄ . ⟨ψ|ζ⟩ = (ψ(ζ ∗ )) =: ψ(ζ)
(33.10)
̄ bezeichnet das komplex Konjugierte der Funktion ψ, Die hier definierte Operation ψ wobei jedoch das Argument der Funktion von der komplexen Konjugation ausge ̄ schlossen wird; ψ(ζ) hängt somit von ζ statt ζ ∗ ab. Um den Unterschied zum ge wöhnlich komplex Konjugierten „∗“ zu verdeutlichen, betrachten wir eine beliebige Funktion ψ(ζ) der komplexen Variablen ζ , die wir in eine Taylorreihe entwickeln können ψ(ζ) = c0 + c1 ζ + ⋅ ⋅ ⋅ , c0 , c1 ∈ ℂ . Während die gewöhnliche komplexe Konjugation ∗
ψ∗ (ζ) := (ψ(ζ)) = c∗0 + c∗1 ζ ∗ + ⋅ ⋅ ⋅ liefert, ist die Operation „−“ durch ̄ = c∗ + c∗ ζ + ⋅ ⋅ ⋅ ψ(ζ) 0 1 definiert. Vergleich dieser beiden Operationen zeigt den Zusammenhang ̄ ∗) . ψ∗ (ζ) = ψ(ζ
(33.11)
418 | 33 Kohärente Bose- und Fermi-Zustände
Für die in Abschnitt 31.5 eingeführten Basiszustände (31.30) der Bose-Systeme in der Besetzungszahldarstellung |n1 , n2 , . . . ⟩ =
1 (a† )n1 (a†2 )n2 ⋅ ⋅ ⋅ |0⟩ √n1 !n2 ! . . . 1
erhalten wir dann in der Basis der kohärenten Zustände unter Benutzung von Gl. (33.4): ⟨ζ|n1 , n2 , . . . ⟩ =
1 √n1 !n2 ! . . .
(ζ1∗ )n1 (ζ2∗ )n2 ⋅ ⋅ ⋅ .
(33.12)
Das Skalarprodukt von zwei Zuständen des Fock-Raums ergibt sich mit (33.8) in der Basis der kohärenten Zuständen zu ∗ ̄ ⟨ϕ|ψ⟩ = ∫ dμ(ζ)ϕ(ζ)ψ(ζ ),
(33.13)
wobei das Integrationsmaß dμ(ζ) in (33.7) definiert ist. Schließlich wollen wir die Dar stellung von Operatoren in der Zweiten Quantisierung O(a† , a) in der Basis der kohä renten Zustände angeben. Dazu multiplizieren wir den gegebenen Operator von rechts und links mit der Vollständigkeitsrelation (33.8): † ̂ , a)1̂ O(a† , a) = 1O(a
= ∫ dμ(ζ) ∫ dμ(γ) |ζ⟩⟨ζ|O(a† , a)|γ⟩⟨γ| . Zur Berechnung der Matrixelemente des Operators O(a† , a) in den kohärenten Zustän den setzen wir der Einfachheit halber voraus, dass der Operator O(a† , a) normalgeord net ist, d. h., die Erzeugungsoperatoren a† stehen links von den Vernichtungsoperato ren a. Dies können wir immer unter Benutzung der Kommutationsbeziehungen dieser Operatoren erreichen. Mit Gl. (33.1) und (33.4) erhalten wir unmittelbar: ⟨ζ|:O(a† , a):|γ⟩ = O(ζ ∗ , γ)⟨ζ|γ⟩ , wobei die Größe
O(ζ ∗ , γ)
aus dem Operator a†k → ζ k∗ ,
O(a† , a)
(33.14)
durch die Ersetzung
ak → γk .
hervorgeht. Unter Benutzung von Gln. (33.4) und (33.5) erhalten wir für einen beliebi gen, nicht notwendigerweise normalgeordneten Operator ⟨ζ|O(a† , a) = O (ζ ∗ ,
∂ ) ⟨ζ| ∂ζ ∗
und hieraus mit (33.9) für einen beliebigen Zustand |ψ⟩ ⟨ζ|O(a† , a)|ψ⟩ = O (ζ ∗ ,
∂ ) ψ(ζ ∗ ) . ∂ζ ∗
(33.15)
Damit ist es uns gelungen, Bose-Systeme vollständig in der Basis der kohärenten Zu stände zu beschreiben.
33.2 Fermi-Systeme |
419
33.2 Fermi-Systeme 33.2.1 Der fermionische Oszillator Wir betrachten zunächst das fermionische Analogon des eindimensionalen harmo nischen Oszillators. Dies ist offenbar ein Fermi-System, in welchem die Fermionen nur in einem einzigen Einteilchenzustand existieren können. Da die Fermionen dem Pauli-Prinzip unterliegen, kann der Einteilchenzustand maximal mit einem einzigen Fermion besetzt werden. Folglich besteht dieses System nur aus zwei Zuständen: dem Vakuum |0⟩, in welchem der Einteilchenzustand unbesetzt ist, und dem Einfermio nenzustand |1⟩, in welchem der Einteilchenzustand einfach besetzt ist. Die einfachste Realisierung eines solchen Systems ist durch einen Spin s = 1/2 gegeben, ein Teil chen mit Spin 1/2, dessen Ortsbewegung eingefroren wurde. Dieses System ist das fermionische Analogon eines harmonischen Oszillators, der ebenfalls nur Schwin gungsquanten (Phononen) einer einzigen Sorte (Frequenz) besitzt, die jedoch auf grund der Bose-Statistik in beliebiger Teilchenzahl vorliegen können. Der Spin 1/2 besitzt zwei Quantenzustände, die einer parallelen oder antiparalle len Einstellung des Spins zur Quantisierungsachse entsprechen, | ↑ ⟩ und | ↓ ⟩. Ohne Beschränkung der Allgemeinheit können wir den Zustand mit nach unten gerichte ten Spin | ↓ ⟩ mit dem fermionischen Vakuum |0⟩ identifizieren. Der Zustand mit nach oben gerichteten Spin | ↑ ⟩ repräsentiert dann den Einfermionenzustand |1⟩. Wir können diese Zustände wieder durch Fermionen-Erzeugungs- und Vernich tungsoperatoren a† , a generieren, die den üblichen Antivertauschungsrelationen {a, a} = 0̂ = {a† , a† } ,
{a, a† } = 1̂
genügen. Im vorliegenden Fall ist kein Einteilchen-Index erforderlich, da nur ein ein ziger Einteilchenzustand existiert. Mittels dieser Operatoren sind die Zustände durch a|0⟩ = o ,
|1⟩ = a† |0⟩
definiert. Unter Ausnutzung der Antivertauschungsrelationen folgt: a|1⟩ = |0⟩ ,
a† |1⟩ = a† a† |0⟩ = o .
Die letzte Gleichung drückt das Pauli-Prinzip aus. Den Hamilton-Operator des fermio nischen Oszillators wählen wir in der Form h = ϵ a† a .
(33.16)
Nach den obigen Beziehungen gilt dann h|0⟩ = o ,
h|1⟩ = ϵ|1⟩ .
Folglich ist ϵ die Einteilchenenergie, während im Vakuum |0⟩ die Energie verschwin det.
420 | 33 Kohärente Bose- und Fermi-Zustände
33.2.2 Kohärente Fermi-Zustände und Graßmann-Variablen Beim harmonischen Oszillator hatten wir kohärente Zustände definiert, die Eigenfunk tionen des Vernichtungsoperators waren. Die Eigenwerte der Bose-Vernichtungsope ratoren waren durch die komplexen Zahlen gegeben. In Analogie hierzu definieren wir im Folgenden kohärente Fermi-Zustände als Eigenfunktionen der Fermi-Vernichtungs operatoren. Aufgrund der Antikommutationsbeziehungen der Fermi-Operatoren kön nen die zugehörigen Eigenwerte nicht durch gewöhnliche komplexe Zahlen gegeben sein. Bei der Einführung dieser Zustände werden wir uns zunächst auf das einfachste Fermi-System, den fermionischen Oszillator, beschränken. Dieser besteht aus einem einzigen Einteilchenzustand, der entweder besetzt oder unbesetzt sein kann. Demzu folge gibt es nur die beiden Zustände |0⟩ und |1⟩. Wir definieren die kohärenten Fermi-Zustände |ζ⟩ analog zu denen der Bose-Sys teme als Eigenfunktionen des Vernichtungsoperators: a|ζ⟩ = ζ|ζ⟩ .
(33.17)
⟨ζ|a† = ⟨ζ|ζ ∗ .
(33.18)
Durch Adjungieren folgt hieraus:
Wegen aa = 0̂ muss gelten: o = aa|ζ⟩ = aζ|ζ⟩ = a|ζ⟩ζ = ζ 2 |ζ⟩ . Die Objekte ζ können deshalb keine von null verschiedenen Zahlen sein, sondern sind nilpotente Objekte, deren Quadrat verschwindet: ζ2 = 0 ,
(ζ ∗ )2 = 0 .
(33.19)
Diese Bedingungen lassen sich nicht im Körper der komplexen Zahlen erfüllen, wohl aber im Körper der sogenannten Graßmann-Variablen, welche die fermionischen Ana loga der komplexen Zahlen sind. Diese sind durch die folgende Graßmann-Algebra definiert:¹ {ζ, ζ} = 0 ,
{ζ ∗ , ζ ∗ } = 0 ,
{ζ, ζ ∗ } = 0 .
(33.20)
1 Streng genommen ist die „0“ auf der rechten Seite der Gln. (33.19), (33.20) nicht die gewöhnliche null, sondern das Nullelement in der Algebra der Graßmann-Variablen (vergleiche hierzu das Null element im Körper der komplexen Zahlen). Wir werden jedoch für die verschiedenen Nullelemente dasselbe Symbol benutzen.
33.2 Fermi-Systeme | 421
Sie besitzt eine ähnliche Struktur wie die Algebra der Fermi-Operatoren, unterschei det sich jedoch von der letzteren dadurch, dass der Antikommutator von ζ mit ζ ∗ ver schwindet. Die Operation „∗“ ist das Gegenstück zu der komplexen Konjugation der gewöhnlichen komplexen Zahlen und wird als Involution bezeichnet, da (ζ ∗ )∗ = ζ . Diese Operation ordnet jedem Element ζ ein Element ζ ∗ zu und ist ähnlich definiert wie das Adjungieren von Operatoren. Wie letztere verändert die Involution die Rei henfolge der Objekte: Sind ζ, γ zwei Graßmann-Variablen derselben Algebra, so folgt für ihr Produkt unter der Involution: (ζγ)∗ = γ∗ ζ ∗ . Um komplexe Zahlen und Graßmann-Variablen gemeinsam behandeln zu können, vereinbaren wir, dass die Operation „∗“ die Involution für Graßmann-Variablen η, γ und die gewöhnliche komplexe Konjugation für komplexe Zahlen z, u bedeutet: (zuηγ)∗ = γ∗ η∗ u ∗ z∗ = z∗ u ∗ γ∗ η∗ . Diese Konvention ist besonders zweckmäßig für den Umgang mit Funktionen von Graßmann-Variablen f(ζ ∗ , ζ). Jede Funktion der Graßmann-Variablen f(ζ ∗ , ζ) besitzt eine endliche Taylor-Entwicklung: f(ζ ∗ , ζ) = f0 + f1 ζ + f2 ζ ∗ + f12 ζ ∗ ζ ,
(33.21)
wobei die f0 , f1 , f2 , f12 gewöhnliche komplexe Zahlen sind, die mit den GraßmannZahlen kommutieren. Wegen der Antikommutationsbeziehungen (ζ ∗ )2 = ζ 2 = 0 kön nen keine höheren Potenzen der Graßmann-Variablen in der Taylor-Entwicklung auf treten. Neben der Graßmann-Algebra (33.20) fordert man von den Graßmann-Varia blen, dass sie mit den Fermi-Operatoren a, a† antikommutieren, {a, ζ} = {a† , ζ} = {a, ζ ∗ } = {a† , ζ ∗ } = 0̂ , und dass ferner (aζ)† = ζ ∗ a† . Unter Berücksichtigung der Eigenschaften der Fermi-Operatoren und GraßmannVariablen lassen sich die in den Beziehungen (33.17), (33.18) eingeführten kohärenten Fermi-Zustände explizit darstellen als: †
|ζ⟩ = e a ζ |0⟩ = |0⟩ + a† ζ|0⟩ , ⟨ζ| = ⟨0|e ζ
∗
a
= ⟨0| + ⟨0|ζ ∗ a .
(33.22)
422 | 33 Kohärente Bose- und Fermi-Zustände
Zur Illustration zeigen wir, dass diese Darstellung in der Tat die Beziehung (33.17) er füllt: † a|ζ⟩ = ae a ζ |0⟩ = a (|0⟩ + a† ζ|0⟩) = aa† ζ|0⟩ = ζ(1̂ − a† a)|0⟩ = ζ|0⟩ = ζ|0⟩ − ζ 2 a† |0⟩ = ζ (|0⟩ + a† ζ|0⟩) = ζ|ζ⟩ , wobei wir
ζ2
= 0 benutzt haben. Analog zeigt man mit (33.22) die Beziehungen ⟨0|ζ⟩ = 1 ,
⟨1|ζ⟩ ≡ ⟨0|a|ζ⟩ = ζ .
(33.23)
Die so definierten kohärenten Fermi-Zustände spannen keinen gewöhnlichen FockRaum, sondern einen erweiterten Raum auf, der die Multiplikation des Vektors (Zu stands) mit einer Graßmann-Variablen einschließt, d. h., dieser erweiterte Fock-Raum wird nicht über dem Körper der komplexen Zahlen (wie der gewöhnliche Fock-Raum), sondern über der Algebra der Graßmann-Variablen definiert, siehe Abschnitt 33.2.4. Wie die kohärenten Zustände des harmonischen Oszillators sind auch die fermio nischen kohärenten Zustände zu verschiedenem „Argument“ nicht orthogonal: ⟨ζ|γ⟩ = 1 + ζ ∗ γ = e ζ
∗
γ
,
(33.24)
wie man unmittelbar unter Benutzung von Gl. (33.22) zeigt. Sie bilden jedoch ebenfalls eine vollständige Basis, wie wir im nächsten Abschnitt sehen werden.
33.2.3 Differentiation und Integration für Graßmann-Variablen Für die Graßmann-Variablen lässt sich ähnlich wie für die komplexen Zahlen die Ope ration der Differentiation und Integration definieren. Die Differentiation ∂/∂ζ bzw. ∂/∂ζ ∗ ist durch ∂ ∂ 1=0, 1=0, ∂ζ ∂ζ ∗ ∂ ∂ (33.25) ζ = 1 , ∗ ζ∗ = 1 , ∂ζ ∂ζ ∂ ∗ ∂ ζ =0, ζ =0 ∂ζ ∂ζ ∗ definiert. Ferner gelten die Antivertauschungsregeln mit den Graßmann-Variablen: ∂ ∂ , ζ } = 1 ,{ ∗ , ζ ∗ } = 1 , ∂ζ ∂ζ ∂ ∂ ∗ { , ζ } = 0 , { ∗ , ζ} = 0 . ∂ζ ∂ζ {
(33.26)
33.2 Fermi-Systeme | 423
Bei den ersten beiden Beziehungen ist zu beachten, dass diese streng genommen stets auf Testfunktionen f = f(ζ ∗ , ζ) wirken, sodass nach der Produktregel der Differentia tion ∂ ∂ ∂ ∂ ζf = ζf + ζf = f − ζ f ∂ζ ∂ζ ∂ζ ∂ζ gilt. Hierbei wirkt der Ableitungsoperator stets nur auf das unterstrichene Objekt „ “, d. h. im ersten Summanden lediglich auf ζ und im zweiten lediglich auf f . Damit er halten wir: ∂ { , ζ} f = f . ∂ζ Ferner fordert man, dass die Ableitungen nach den Graßmann-Variablen mit den kom plexen Zahlen kommutieren. Damit gilt die Produktregel ∂ ∂f(ζ) ∂g(ζ) (f(ζ)g(ζ)) = ( ) g(ζ) + f(−ζ) ∂ζ ∂ζ ∂ζ für beliebige Funktionen f(ζ) und g(ζ) der Graßmann-Variablen. Die Integration über Graßmann-Variablen ist formal durch ∫ dζ = 0 = ∫ dζ ∗ ,
∫ dζ ζ = 1 = ∫ dζ ∗ ζ ∗
∫ dζ ζ ∗ = 0 = ∫ dζ ∗ ζ
(33.27)
definiert.² Diese Regeln ergeben sich zwangsläufig, wenn man fordert, dass die Integration ein komplexwertiges, lineares Funktional auf der Graßmann-Algebra bildet, für das der Hauptsatz ∫ dζ
∂ f(ζ) = 0 ∂ζ
gilt. Mit f(ζ) = ζ folgt die erste Regel in (33.27) und das einzige nichtverschwindene Integral ∫ dζζ = ∫ dζ ∗ ζ ∗ wird auf 1 normiert.
2 Mit dieser Definition der Integration lassen sich auch die „Differenziale“ dζ, dζ ∗ formal wie Graß mann-Variablen behandeln, die den Antivertauschungsrelationen {dζ, dζ} = {dζ ∗ , dζ ∗ } = {dζ, dζ ∗ } = 0 , {dζ, ζ} = {dζ ∗ , ζ ∗ } = {dζ ∗ , ζ} = {dζ, ζ ∗ } = 0 genügen. Diese Beziehungen müssen jedoch nicht gefordert werden, sondern folgen aus Gln. (33.20) und (33.27).
424 | 33 Kohärente Bose- und Fermi-Zustände
Das so definierte Integral über Graßmann-Variablen kann aber nicht als Grenzwert ei ner Summe (wie beim Riemann-Integral) aufgefasst werden. Diese Integration ist auch nicht das Inverse der Differentiation. So folgt unter Benutzung der Taylor-Entwicklung (33.21): ∂ f(ζ ∗ , ζ) , ∫ dζ f(ζ ∗ , ζ) = f1 − f12 ζ ∗ = ∂ζ ∂ ∫ dζ ∗ f(ζ ∗ , ζ) = f2 + f12 ζ = ∗ f(ζ ∗ , ζ) , ∂ζ ∂ ∂ f(ζ ∗ , ζ) , ∫ dζ dζ ∗ f(ζ ∗ , ζ) = f12 = ∂ζ ∂ζ ∗ d. h., die Integration über eine Graßmann-Variable ist de facto äquivalent zu einer Dif ferentiation. Dies ist auch der Grund, weshalb bei einer Variablentransformation ζ → γ = zζ ,
ζ ∗ → γ ∗ = z∗ ζ ∗
(33.28)
mit z ∈ ℂ sich die Differenziale invers zu den Graßmann-Variablen transformieren dγ =
1 dζ , z
dγ∗ =
1 ∗ dζ , z∗
(33.29)
was direkt aus der zweiten Gleichung von (33.27) folgt. Aus den Integrationsregeln (33.27) ergeben sich unmittelbar die Integrale ∫ dζ e zζ = z ,
∫ dζ e−zζ
∗
ζ
= zζ ∗ .
Integration der letzten beiden Beziehungen über ζ ∗ liefert: ∫ dζ ∗ dζ e zζ = 0 ,
∫ dζ ∗ dζ e−zζ
∗
ζ
=z.
(33.30)
Mit den oben angegebenen Regeln und der expliziten Darstellung (33.22) der kohären ten Zustände zeigt man leicht, dass folgende Beziehungen gelten: → ← ∂ ∂ |ζ⟩ = |ζ⟩ = a† |0⟩ = |1⟩ , ∂ζ ∂ζ ← → ∂ ∂ ⟨ζ|a = ⟨ζ| (− ∗ ) = ∗ ⟨ζ| = ⟨0|a = ⟨1| , ∂ζ ∂ζ
a† |ζ⟩ = −
(33.31) (33.32)
wobei die Pfeile die Richtung der Wirkung des entsprechenden Ableitungsoperators → angeben. Nachfolgend werden wir den Pfeil „ “ an den Differenzialoperatoren, die nach rechts wirken, weglassen. Die kohärenten Fermi-Zustände (33.22) erfüllen die Vollständigkeitsrelation ∫ dμ(ζ) |ζ⟩⟨ζ| = 1̂ ,
dμ(ζ) = e−ζ
∗
ζ
dζ ∗ dζ ,
(33.33)
33.2 Fermi-Systeme | 425
deren Richtigkeit schnell gezeigt ist: ∫ dμ(ζ) |ζ⟩⟨ζ| = ∫ dζ ∗ dζ (1 − ζ ∗ ζ) (|0⟩ + a† ζ|0⟩) (⟨0| + ⟨0|ζ ∗ a) = |0⟩⟨0| + a† |0⟩⟨0|a = |0⟩⟨0| + |1⟩⟨1| = 1̂ . Die Spur des Einheitsoperators (im Fock-Raum) liefert die Zahl der Zustände: Sp1̂ = Sp(|0⟩⟨0| + |1⟩⟨1|) = Sp(|0⟩⟨0|) + Sp(|1⟩⟨1|) = ⟨0|0⟩ + ⟨1|1⟩ = 1 + 1 = 2 . Dasselbe Ergebnis müssen wir natürlich auch durch Spurbildung von Gl. (33.33) er halten. Dabei ist zu beachten, dass für die kohärenten Fermi-Zustände die folgende Beziehung gilt: Sp(|ζ⟩⟨γ|) = ⟨γ|−ζ⟩ = ⟨−γ|ζ⟩ , (33.34) die sich sehr leicht in der Besetzungszahldarstellung beweisen lässt: Sp(|ζ⟩⟨γ|) = ∑ ⟨n|ζ⟩⟨γ|n⟩ n=0,1
= ⟨0|ζ⟩⟨γ|0⟩ + ⟨1|ζ⟩⟨γ|1⟩ = 1 + ζγ∗ = 1 − γ∗ ζ = ⟨−γ|ζ⟩ = ⟨γ|−ζ⟩ , wobei wir Gln. (33.23) und (33.24) benutzt haben. Analog zu den komplexen Zahlen definieren wir die δ-Funktion für Graßmann-Zahlen durch ∫ dζ δ(ζ, γ)f(ζ) = f(γ) , was ∫ dζ δ(ζ, γ) = 1 impliziert. Eine Darstellung dieser Funktion ist durch δ(ζ, γ) = ζ − γ =: δ(ζ − γ)
(33.35)
gegeben, wie man leicht durch Einsetzen in die obige Definition und Ausnutzung der Integrationsregeln überprüft. Ebenso leicht zeigt man, dass die δ-Funktion eine Art Fourier-Darstellung δ(ζ, γ) = ∫ dζ ∗ e ζ
∗
(ζ −γ)
besitzt, denn ∫ dζ ∗ e ζ
∗
(ζ −γ)
= ∫ dζ ∗ [1 + ζ ∗ (ζ − γ)] = ζ − γ .
(33.36)
426 | 33 Kohärente Bose- und Fermi-Zustände
Aus der Darstellung (33.35) folgt unmittelbar δ(zζ) = zδ(ζ) ,
z∈ℂ,
(33.37)
was das Gegenstück zur Gl. (A.11) für die gewöhnliche δ-Funktion einer reellen Varia blen ist. Setzen wir hier z = −1, so finden wir, dass die δ-Funktion (33.35) „ungerade“ δ(−ζ) = −δ(ζ) bzw. „antisymmetrisch“ ist δ(γ, ζ) = −δ(ζ, γ) ,
δ(−ζ, γ) = −δ(ζ, −γ) .
Ferner gilt offenbar: δ∗ (ζ, γ) = δ(ζ ∗ , γ∗ ) ,
δ∗ (ζ) = δ(ζ ∗ ) .
Für eine beliebige Funktion f(ζ) der Graßmann-Variablen folgt aus der Darstellung (33.35) δ(γ, η)f(ζ) = f(−ζ)δ(γ, η) .
33.2.4 Darstellung des Fock-Raums Jeder Zustand im Fock-Raum lässt sich in der Form |ϕ⟩ = ϕ(a† )|0⟩
(33.38)
darstellen, wobei ϕ(a† ) eine beliebige differenzierbare Funktion der Erzeugungsope ratoren ist. Mit Hilfe der Vollständigkeitsrelation (33.33) lassen sich die Zustände des Fock-Raums als Linearkombination der kohärenten Zustände schreiben: ̂ |ϕ⟩ = 1|ϕ⟩ = ∫ dμ(ζ) |ζ⟩⟨ζ|ϕ⟩ . Nach der üblichen bracket-Notation liefert das Skalarprodukt ⟨ζ|ϕ⟩ die Darstellung des Zustandsvektors |ϕ⟩ in der Basis der kohärenten Zustände |ζ⟩. Mit (33.18) erhalten wir aus (33.38) für diese Darstellung: ⟨ζ|ϕ⟩ = ⟨ζ|ϕ(a† )|0⟩ = ϕ(ζ ∗ )⟨ζ|0⟩ = ϕ(ζ ∗ ) , wobei wir im letzten Schritt ⟨ζ|0⟩ = 1 (33.23) benutzt haben. Somit gilt: ⟨ζ|ϕ⟩ = ϕ(ζ ∗ ) .
(33.39)
33.2 Fermi-Systeme | 427
Aus (33.38) finden wir für die zugehörigen bra-Vektoren des Fock-Raums † ̄ ⟨ϕ| = [ϕ(a† )|0⟩] = ⟨0|ϕ(a) ,
(33.40)
wobei die Operation „−“ das komplex Konjugierte einer Funktion bezeichnet, ohne dabei das Argument der Funktion mit einzubeziehen. Sie ist in Gln. (33.10), (33.11) definiert. Bilden wir das Skalarprodukt von (33.40) mit dem kohärenten Zustand |ζ⟩ (33.17), so finden wir ⟨ϕ|ζ⟩ = ̄ ϕ(ζ) . Dasselbe Ergebnis finden wir auch aus Gl. (33.39) durch Bildung der Involution „∗“ ̄ = (ϕ(ζ ∗ ))∗ . ϕ(ζ) Damit lassen sich die Skalarprodukte beliebiger Zustandsvektoren durch ∗ ̄ ⟨ψ|ϕ⟩ = ∫ dμ(ζ) ⟨ψ|ζ⟩⟨ζ|ϕ⟩ = ∫ dμ(ζ) ψ(ζ)ϕ(ζ )
darstellen. Für die Matrixelemente der Erzeugungs- und Vernichtungsoperatoren fin den wir: ⟨ζ|a|γ⟩ = γ⟨ζ|γ⟩ = ∂ ζ ∗ ⟨ζ|γ⟩ , ← ⟨ζ|a† |γ⟩ = ζ ∗ ⟨ζ|γ⟩ = ⟨ζ|γ⟩ ∂ γ , und analog:
⟨ζ|a|ϕ⟩ = ∂ ζ∗ ⟨ζ|ϕ⟩ = ∂ ζ ∗ ϕ(ζ ∗ ) , ⟨ζ|a† |ϕ⟩ = ζ ∗ ⟨ζ|ϕ⟩ = ζ ∗ ϕ(ζ ∗ ) .
Die Operatoren a und a† werden somit durch ∂ ζ ∗ = ∂/∂ζ ∗ und ζ ∗ dargestellt. Wir betrachten einen beliebigen Operator der Erzeugungs- und Vernichtungsope ratoren O(a† , a). Durch Taylor-Entwicklung können wir diesen Operator als Summe von Produkten der a und a† darstellen. Dabei können prinzipiell die a und a† in belie biger Reihenfolge auftreten. Wir betrachten einen typischen Term . . . a† aa† a† a . . . . Unter Benutzung von Gln. (33.18) und (33.32) erhalten wir: ⟨ζ| ⋅ ⋅ ⋅ a† aa† a† a ⋅ ⋅ ⋅ = ⋅ ⋅ ⋅ ζ ∗
∂ ∗ ∗ ∂ ζ ζ ⋅ ⋅ ⋅ ⟨ζ| . ∂ζ ∗ ∂ζ ∗
Für einen beliebigen Operator finden wir deshalb: ⟨ζ|O(a† , a) = O (ζ ∗ ,
∂ ) ⟨ζ| . ∂ζ ∗
(33.41)
Jeder Operator im Fock-Raum ist eine Funktion O(a† , a) der Operatoren a und a† und kann deshalb als eine Funktion O(ζ ∗ , ∂ ζ ∗ ) der Graßmann-Variablen dargestellt wer den. Aus Gl. (33.41) erhalten wir unmittelbar: ⟨ζ|O(a† , a)|γ⟩ = O(ζ ∗ , ∂ ζ ∗ )⟨ζ|γ⟩ ,
(33.42)
428 | 33 Kohärente Bose- und Fermi-Zustände bzw. für beliebige Fock-Zustände |ϕ⟩ ⟨ζ|O(a† , a)|ϕ⟩ = O(ζ ∗ , ∂ ζ ∗ )ϕ(ζ ∗ ) .
(33.43)
Umgekehrt definiert jede Funktion von Graßmann-Variablen O(ζ ∗ , γ) ein Matrixele ment des normalgeordneten Operators :O(a† , a): in den kohärenten Zuständen: ⟨ζ|:O(a† , a):|γ⟩ = O(ζ ∗ , γ)⟨ζ|γ⟩ ,
(33.44)
wobei unter normalgeordnet wieder zu verstehen ist, dass alle Erzeugungsoperatoren links von den Vernichtungsoperatoren stehen (bei jeder Zweierpermutation ist aber ein Faktor (−1) zu berücksichtigen). Man beachte den Unterschied zwischen Gl. (33.42) und Gl. (33.44): Die Matrixelemente des normalgeordneten Produkts :O(a† , a): zwi schen kohärenten Fermi-Zuständen erhält man unmittelbar unter Benutzung von Gln. (33.17), (33.18) durch Ersetzen von a bzw. a† durch γ bzw. ζ ∗ . Das Matrixelement des nicht normalgeordneten Operators O(a† , a) hingegen erhält man durch Ersetzen von a bzw. a† durch ∂ ζ ∗ bzw. ζ ∗ , siehe Gl. (33.41). Gln. (33.42) und (33.43) haben formal dieselbe Gestalt wie die analogen Beziehungen (33.14) und (33.15) für Bose-Systeme.
33.2.5 Verallgemeinerung auf Fermi-Systeme mit mehreren Freiheitsgraden Die Graßmann-Variablen lassen sich sehr leicht für Fermi-Systeme mit mehreren Ein teilchenzuständen verallgemeinern. Für jeden Einteilchenzustand |k⟩ = a†k |0⟩ gibt es dann entsprechende Graßmann-Variablen ζ k , ζ k∗ , die sich im oben angegebenen Sin ne als die (rechts- bzw. linksseitigen) Eigenwerte der Fermi-Vernichtungs- bzw. Erzeu gungsoperatoren a k , a†k interpretieren lassen. Im Folgenden betrachten wir ein Fermi-System mit n Einteilchenzuständen. Für reale Systeme haben wir gewöhnlich n → ∞. Die zugehörige Graßmann-Algebra be sitzt dann 2n verschiedene Elemente ζ k , ζ k∗ , k = 1, 2, . . . , n, die sämtlich miteinander {ζ k , ζ l } = 0 ,
{ζ k∗ , ζ l∗ } = 0 ,
{ζ k , ζ l∗ } = 0
und mit den Fermi-Operatoren {ζ k , a l } = 0 ,
{ζ k , a†l } = 0 ,
etc.
antikommutieren. Die Taylor-Entwicklung einer Funktion dieser Graßmann-Variablen bricht dann erst nach dem n-ten Glied ab, d. h., die Terme der Entwicklung enthalten höchstens n Vorkommen von ζ und ζ ∗ . Die im vorigen Abschnitt für den Fall eines
33.2 Fermi-Systeme |
429
einzigen Einteilchenzustands angegebenen Beziehungen lassen sich unmittelbar auf ein Fermi-System mit n Einteilchenzuständen verallgemeinern. So haben wir jetzt für die Differentiation (33.25) ∂ ζ l = δ kl , ∂ζ k
∂ ∗ ζ = δ kl ∂ζ k∗ l
und Integration (33.27) ∫ dζ k ζ l = δ kl ,
∫ dζ k∗ ζ l∗ = δ kl .
Die zu Gl. (33.26) analogen Beziehungen lauten jetzt { {
∂ ∂ , ζ l } f = δ kl f ,{ , ζ ∗} f = 0 , ∂ζ k ∂ζ k l
∂ ∂ ∗ , ζl } f = 0 , ∗ , ζ l } f = δ kl f ,{ ∂ζ k ∂ζ k∗
wobei f eine beliebige Funktion der ζ, ζ ∗ ist. Die kohärenten Zustände (33.22) sind jetzt durch
|ζ⟩ = exp (∑ a†k ζ k ) |0⟩
(33.45)
k
gegeben, wobei im Exponenten über sämtliche Einteilchenzustände |k⟩ summiert wird. Für diese Zustände gilt: a k |ζ⟩ = ζ k |ζ⟩ ,
⟨ζ|a†k = ⟨ζ|ζ k∗ ,
(33.46)
sowie (vgl. Gln. (33.31), (33.32) und die analogen Beziehungen (33.5) für Bose-Systeme) a†k |ζ⟩ = −
∂ |ζ⟩ , ∂ζ k
⟨ζ|a k =
∂ ⟨ζ| . ∂ζ k∗
Der Überlapp zweier kohärenter Zustände ist durch
⟨ζ|γ⟩ = exp (∑ ζ k∗ γ k ) k
430 | 33 Kohärente Bose- und Fermi-Zustände
gegeben, was unmittelbar aus Gln. (33.45) und (33.46) mittels Taylor-Entwicklung folgt: ⟨ζ|γ⟩ = ⟨ζ| exp (∑ a†k γ k ) |0⟩ = ⟨ζ| exp (∑ ζ k∗ γ k ) |0⟩ k
k
= exp (∑ ζ k∗ γ k ) ⟨ζ|0⟩ = exp (∑ ζ k∗ γ k ) ⟨0| exp (∑ ζ l∗ a l ) |0⟩ k
k
l
= exp (∑ ζ k∗ γ k ) ⟨0|0⟩ = exp (∑ ζ k∗ γ k ) , k
k
wobei wir a l |0⟩ = o benutzt haben. Für γ = ζ ergibt sich hieraus die Norm der kohä renten Zustände: ⟨ζ|ζ⟩ = exp (∑ ζ k∗ ζ k ) . k
Unter Benutzung von Gl. (33.46) erhalten wir für die Basiszustände (31.35) bzw. (31.53) des Fock-Raums in der Darstellung der kohärenten Zustände ⟨ζ|k 1 , k 2 , . . . , k N ⟩ = ζ k∗1 ζ k∗2 ⋅ ⋅ ⋅ζ k∗N = ∏(ζ k∗ )n k = ⟨ζ|n1 , n2 , . . . ⟩ . N
(33.47)
k
Die Vollständigkeitsrelation hat formal dieselbe Gestalt wie in Gl. (33.33), 1̂ = ∫ dμ(ζ) |ζ⟩⟨ζ| ,
(33.48)
jedoch ist das Integrationsmaß jetzt durch
∗
dμ(ζ) = (∏ d(ζ k∗ , ζ k )) exp (−∑ζ k∗ ζ k ) = ∏ (d(ζ k∗ , ζ k ) e−ζ k ζ k ) k
k
(33.49)
k
gegeben. Hierbei haben wir zur Vereinheitlichung der Notation mit dem bosonischen Fall (33.7) für Graßmann-Variablen d(ζ ∗ , ζ) := dζ ∗ dζ
(33.50)
definiert. Die Integrationsmaße für Bose- und Fermi-Systeme, (33.7) und (33.49), sind dann formal identisch. Wegen ⟨l1 , l2 , . . . , l N |k 1 , k 2 . . . , k N ⟩ = ∫ dμ(ζ)⟨l1 , l2 , . . . , l N |ζ⟩⟨ζ|k 1 , k 2 . . . , k n ⟩
33.3 Beschreibung von Bose- und Fermi-Systemen mittels kohärenter Zustände |
431
folgt aus der Norm (31.52) der Basiszustände (33.47) die Beziehung ∫ dμ(ζ) ζ l N . . . ζ l 2 ζ l 1 ζ k∗1 ζ k∗2 . . . ζ k∗N = det(δ(l i , k j )) ,
i, j = 1, 2, . . . , N ,
wovon man sich leicht überzeugt. Die Verallgemeinerung der im Abschnitt 33.2.4 ab geleiteten Beziehungen auf Fermi-Systeme mit mehreren Einteilchenzuständen ist tri vial; wir geben sie deshalb nicht explizit an.
33.3 Beschreibung von Bose- und Fermi-Systemen mittels kohärenter Zustände Die in Kapitel 31 entwickelte Zweite Quantisierung führte auf einen einheitlichen For malismus für Bose- und Fermi-Systeme. Der einzige Unterschied zwischen diesen bei den Systemen besteht darin, dass die Feldoperatoren a k , a†k für Bose-Systeme den Kommutationsbeziehungen (31.27), für Fermi-Systeme hingegen den Antikommuta tionsbeziehungen (31.51) genügen: [a k , a l ]∓ = 0̂ = [a†k , a†l ]∓ [a k , a†l ]∓ = δ kl .
(33.51)
Diese Beziehungen garantieren die (Anti-)Symmetrie der Wellenfunktion bezüglich einer Permutation der Teilchen. Eine ähnliche Analogie zwischen Bose- und FermiSystemen haben wir auch bei den kohärenten Zuständen festgestellt, deren wichtigste Eigenschaften wir nachfolgend zusammenstellen: Die kohärenten Zustände sind als Eigenfunktionen der Vernichtungsoperatoren de finiert, a k |ζ⟩ = ζ k |ζ⟩ , ⟨ζ|a†k = ⟨ζ|ζ k∗ , (33.52) wobei die „Eigenwerte“ ζ k gewöhnliche komplexe Variablen für Bose-Systeme, je doch antikommutierende Graßmann-Variablen für Fermi-Systeme sind: [ζ k , ζ l ]∓ = 0 = [ζ k∗ , ζ l∗ ]∓ , [ζ k , ζ k∗ ]∓ = 0 . Aus Gründen, die im Kapitel 35 klar werden, werden wir im Folgenden diese Grö ßen kollektiv als klassische Variablen oder klassische Koordinaten der Bose- bzw. Fermi-Systeme bezeichnen.³
3 In der Funktionalintegralbeschreibung der Bose- und Fermi-Systeme, die im Kapitel 35 entwickelt wird, wird genau über diese Variablen funktional integriert, analog zur Funktionalintegration über die klassischen Koordinaten eines Punktteilchens, siehe Kapitel 3, Band 1.
432 | 33 Kohärente Bose- und Fermi-Zustände
Die kohärenten Zustände sind explizit durch †
|ζ⟩ = e a ⋅ζ |0⟩ ,
⟨ζ| = ⟨0|e ζ
∗
⋅a
(33.53)
gegeben. Hierbei bezeichnet |0⟩ das Teilchenvakuum a k |0⟩ = o ,
⟨0|a†k = o .
Ferner haben wir das Skalarprodukt im Raum der Einteilchenzustände a† ⋅ ζ = ∑ a†k ζ k ,
ζ ∗ ⋅ a = ∑ ζ k∗ a k ,
k
k
ζ ∗ ⋅ η = ∑ ζ k∗ η k
(33.54)
k
eingeführt. In einer kontinuierlichen Basis ist das Kronecker-Symbol δ kl in (33.51) durch eine Deltafunktion und die Summation in (33.54) durch eine Integration zu ersetzen. So haben wir in der Ortsdarstellung, in der wir die Feldoperatoren gewöhnlich mit ψ(x), ψ† (x) bezeichnen, [ψ(x), ψ† (y)]∓ = δ(x, y) und die kohärente Zustände sind in Analogie zu (33.52) durch ψ(x)|ζ⟩ = ζ(x)|ζ⟩ ,
⟨ζ|ψ† (x) = ⟨ζ|ζ ∗ (x)
(33.55)
definiert, wobei die ζ(x) jetzt Funktionen des Orts x sind: gewöhnliche komplexe Funktionen für Bose-Systeme und Graßmann-Variablen, die von einem kontinuier lichen „Index“ x abhängen, für Fermi-Systeme. Da nach Definition (33.55) der ko hährenten Zustände die ζ(x) die Eigenwerte und somit auch die Erwartungswerte der Feldoperatoren ⟨ζ|ψ(x)|ζ⟩ ζ(x) = ⟨ζ|ζ⟩ sind, werden wir die ζ(x) als klassische Bose- bzw. Fermi-Felder bezeichnen. In Ana logie zu Gl. (33.53) finden wir die explizite Darstellung |ζ⟩ = exp (ψ† ⋅ ζ ) |0⟩ ,
⟨ζ| = ⟨0| exp (ζ ∗ ⋅ ψ)
mit ψ† ⋅ ζ = ∫ d3 x ψ† (x) ζ(x) ,
ζ ∗ ⋅ ψ = ∫ d3 x ζ ∗ (x) ψ(x) .
Das Skalarprodukt zweier kohärenter Zustände ist durch ⟨η|ζ⟩ = exp(η ∗ ⋅ ζ)
(33.56)
33.3 Beschreibung von Bose- und Fermi-Systemen mittels kohärenter Zustände | 433
gegeben. Ein beliebiger Zustand im Fock-Raum |ϕ⟩ = ϕ(a† )|0⟩ wird in der Basis der kohärenten Zustände ⟨ζ|ϕ⟩ = ϕ(ζ ∗ ) , ̄ ⟨ϕ|ζ⟩ = (ϕ(ζ ∗ ))∗ =: ϕ(ζ) zu einer gewöhnlichen Funktion ϕ(ζ ∗ ) der klassischen Variablen ζ k (genauer ζ k∗ ). (ϕ(ζ ∗ ) ergibt sich aus ϕ(a† ) durch Ersetzen von a†k durch ζ k∗ .) Für einen beliebigen, nicht notwendigerweise normalgeordneten Operator O(a† , a) findet man in der Ba sis der kohärenten Zustände ⟨ζ|O(a† , a) = O (ζ ∗ ,
∂ ) ⟨ζ| ∂ζ ∗
und somit für die Wirkung des Operators auf einen Zustand des Fock-Raums: ⟨ζ|O(a† , a)|ϕ⟩ = O (ζ ∗ ,
∂ ) ϕ(ζ ∗ ) . ∂ζ ∗
(33.57)
Bei der Ersetzung der a†k bzw. a k durch ζ k∗ bzw. ∂/∂ζ k∗ ist unbedingt die gegebene Reihenfolge einzuhalten, da [
∂ , ζ ∗ ] = δ kl . ∂ζ k∗ l ∓
Mit Ausnahme der (Anti-)Kommutationsrelationen gelten sämtliche Beziehungen sowohl für Bose- als auch für Fermi-Systeme. Wir werden deshalb im Folgenden beide Systeme zusammen behandeln.
33.3.1 Die Schrödinger-Gleichung in klassischen Variablen Nachfolgend wollen wir die oben entwickelte Beschreibung von Bose- und Fermi-Sys temen mittels kohärenter Zustände anhand der stationären Schrödinger-Gleichung für ein System unabhängiger Teilchen illustrieren. Zunächst müssen wir die Schrödinger-Gleichung H(a† , a)|ϕ⟩ = E|ϕ⟩
(33.58)
in die Basis der kohärenten Zustände transformieren, d. h. durch die klassischen Va riablen ausdrücken. Dazu multiplizieren wir diese Gleichung skalar mit einem kohä renten Zustand ⟨ζ|: ⟨ζ|H(a† , a)|ϕ⟩ = E⟨ζ|ϕ⟩ .
434 | 33 Kohärente Bose- und Fermi-Zustände Beachten wir, dass ⟨ζ|ϕ⟩ = ϕ(ζ ∗ ), und verwenden Gl. (33.57), so nimmt die Schrödin ger-Gleichung die Form H (ζ ∗ ,
∂ ) ϕ(ζ ∗ ) = Eϕ(ζ ∗ ) ∂ζ ∗
(33.59)
an. Dies ist eine Differenzialgleichung in den klassischen Variablen ζ k∗ , die völlig äqui valent zu der algebraischen Gleichung (33.58) in den Feldoperatoren ist. Der Hamilton-Operator eines Systems nichtwechselwirkender Teilchen ist durch einen Einteilchenoperator H(a† , a) = ∑ a†k H kl a l k,l
gegeben. O. B. d. A. können wir in eine Basis gehen, in welcher die hermitesche Matrix H kl diagonal ist H kl = ϵ k δ kl , wobei die reellen Eigenwerte ϵ k die Einteilchenenergien sind. Setzen wir diesen Ha milton-Operator H(a† , a) = ∑ ϵ k a†k a k (33.60) k
in die Schrödinger-Gleichung (33.59) ein, so lautet diese (∑ ϵ k ζ k∗ k
∂ ) ϕ(ζ ∗ ) = Eϕ(ζ ∗ ) . ∂ζ k∗
(33.61)
Wie wir nachfolgend zeigen, besitzt die Schrödinger-Gleichung (33.61) die normierten Lösungen 1 ϕ{n k } (ζ ∗ ) = ∏ (ζ k∗ )n k (33.62) √ nk ! k mit den Eigenenergien E = ∑ nk ϵk , k
wobei n k die Besetzungszahlen sind, die für Bose-Systeme alle nichtnegativen ganzen Zahlen n k = 0, 1, 2, . . . annehmen können und für Fermi-Systeme auf n k = 0, 1 beschränkt sind. Die Zustände (33.62) zu verschiedenen Sätzen {n k } von Besetzungs zahlen sind orthogonal, ⟨ϕ{n k } |ϕ{nk } ⟩ = ∏ δ n k ,nk , k
und sind gerade die in (33.25), (33.34) definierten Basiszustände des Fock-Raums in der Darstellung der kohärenten Zustände (33.12), (33.47).
33.3 Beschreibung von Bose- und Fermi-Systemen mittels kohärenter Zustände | 435
Lösung der Schrödinger-Gleichung (33.61) Da der Hamilton-Operator (33.60) H (ζ ∗ ,
∂ ) = ∑ hk , ∂ζ ∗ k
hk = ϵ k ζ k∗
∂ ∂ζ k∗
in eine Summe von unabhängigen Operatoren zerfällt, lässt sich die SchrödingerGleichung (33.61) durch einen Produktansatz ϕ(ζ ∗ ) = ∏ φ k (ζ k∗ ) ,
E = ∑ Ek
k
k
lösen und es genügt, die Eigenwertgleichung für einen einzelnen Summanden hk φ k (ζ k∗ ) = E k φ k (ζ k∗ ) zu betrachten. Zur Vereinfachung der Notation setzen wir hier λ = E k /ϵ k und igno rieren den Index k im Folgenden: ζ∗
∂ φ(ζ ∗ ) = λφ(ζ ∗ ) . ∂ζ ∗
(33.63)
Wir betrachten zunächst den bosonischen Fall. Für eine komplexe Variable ζ ∗ wird diese Gleichung durch φ α (ζ ∗ ) = Nα (ζ ∗ )α , λ = α mit beliebigem α gelöst, wobei Nα eine noch zu bestimmende Normierungskon stante ist. Jedoch nicht alle Lösungen qualifizieren sich als Wellenfunktion, die be kanntlich normierbar sein muss. In der Basis der kohärenten Bose-Zustände ist das Skalarprodukt durch (33.13) ⟨ϕ|ψ⟩ = ∫
dζ ∗ dζ −ζ ∗ ζ ̄ ϕ(ζ)ψ(ζ ∗ ) e 2πi
(33.64)
gegeben. Aufgrund der Anwesenheit der Gauß-Funktion im Integrationsmaß exis tiert das Normierungsintegral ⟨φ|φ⟩ (siehe unten) für |ζ| → ∞ für alle α. Damit es jedoch auch bei |ζ| = 0 existiert, muss α > −1 gelten. Außerdem muss die Wellen funktion eine analytische Funktion sein, insbesondere bei ζ = 0. Dies schränkt die α auf die nichtnegativen ganzen Zahlen ein. Damit finden wir für Bose-Systeme die Lösungen φ n (ζ ∗ ) = Nn (ζ ∗ )n , E = nϵ mit n = 0, 1, 2, . . . .
436 | 33 Kohärente Bose- und Fermi-Zustände
Die φ n (ζ ∗ ) zu verschiedenen n sind orthogonal: Nach Gl. (33.64) haben wir ⟨φ n |φ n ⟩ = N∗n Nn ∫
dζ ∗ ζ −ζ ∗ ζ n ∗ n ζ (ζ ) . e 2πi
(33.65)
Die Integrale lassen sich elementar auswerfen. Dazu benutzen wir zweckmäßiger weise Polarkoordinaten ζ = Re iϕ , in welchen das Integrationsmaß durch dζ ∗ dζ R dR dϕ = 2πi π gegeben ist (siehe Abschnitt 12.11): In diesen Koordinaten lautet (33.65) ⟨φ n |φ n ⟩ =
∞
2π
0
0
2 1 ∗ N Nn ∫ dR R n+n +1 e−R ∫ dϕe iϕ(n−n ) . π n
Das Winkelintegral liefert 2πδ nn . Nach Substitution x = R2 reduziert sich das ver bleibende Radialintegral auf ∞
∫ dxx n e−x = Γ(n + 1) = n! . 0
Damit erhalten wir ⟨φ n |φ n ⟩ = δ nn |Nn |2 n! , sodass |Nn | =
1 . √n!
Somit lauten die normierten Lösungen von (33.63) φ n (ζ ∗ ) =
1 (ζ ∗ )n . √n!
(33.66)
Dies sind die bekannten Eigenzustände des harmonischen Oszillators in der Basis der kohärenten Zustände ⟨ζ|n⟩, siehe Gln. (12.85), (12.90), (12.91). Dies war natür lich zu erwarten, da H(a† , a) (33.60) für Bose-Systeme der Hamilton-Operator eines Systems ungekoppelter harmonischer Oszillatoren mit Frequenzen ϵ k ist. Für Graßmann-Variablen ζ besitzt Gl. (33.63) wegen ζ 2 = 0 nur die beiden Lösun gen (33.66) mit n = 0, 1. Die Rechnungen sind für Graßmann-Variablen sehr ein fach, sodass wir sie hier nicht explizit angeben, sondern dem Leser als Übung über lassen.
33.3 Beschreibung von Bose- und Fermi-Systemen mittels kohärenter Zustände |
437
33.3.2 Das erzeugende Funktional Die stationäre Beschreibung eines Vielteilchensystems lässt sich auf die Berechnung der n-Teilchendichtematrizen (auch kurz als n-Teilchendichten bezeichnet) zurückfüh ren. Diese sind als Grundzustandserwartungwerte von Produkten von n Erzeugungsund Vernichtungsoperatoren definiert: ρ(l1 l2 . . . , k 1 k 2 . . . ) = ⟨ϕ|a†k1 a†k2 ⋅ ⋅ ⋅ a l 2 a l 1 |ϕ⟩ .
(33.67)
Hierbei bezeichnet |ϕ⟩ die Wellenfunktion des Grundzustands. Die Kenntnis sämt licher n-Teilchendichten ist äquivalent zur Kenntnis der Wellenfunktion |ϕ⟩. Dies erkennt man sofort, wenn man beachtet, dass sich die Erwartungswerte sämtlicher Observablen vollständig durch die n-Teilchendichten ausdrücken lassen. Für den Erwartungswert eines Einteilchenoperators (31.61) ⟨ϕ|O|ϕ⟩ = ∑ O(k, l)ρ(l, k) = Sp (Oρ) k,l
benötigen wir die Einteilchendichte ρ(l, k) = ⟨ϕ|a†k a l |ϕ⟩ ,
(33.68)
die bereits in (31.94) in der Ortsdarstellung eingeführt wurde, während für einen Zwei teilchenoperator (31.63) ⟨ϕ|O|ϕ⟩ = ∑ O(kl, mn)ρ(mn, kl) kl,mn
die Zweiteilchendichte ρ(mn, kl) = ⟨ϕ|a†k a†l a n a m |ϕ⟩
(33.69)
erforderlich ist. Aufgrund der (Anti-)Kommutationsbeziehungen der Feldoperatoren ist sie (anti-)symmetrisch bezüglich einer Vertauschung der Indizes der Erzeugungsbzw. Vernichtungsoperatoren ρ(mn, kl) = ±ρ(nm, kl) = ±ρ(mn, lk) = ρ(nm, lk) . Sämtliche n-Teilchendichten (33.67) lassen sich aus dem erzeugenden Funktional Z[η ∗ , η] = ⟨ϕ| exp (a† ⋅ η) exp (η ∗ ⋅ a) |ϕ⟩
(33.70)
durch Differentiation nach den Quellen η k , η∗k gewinnen.⁴ Für Bose-Systeme sind die Quellen η, η∗ gewöhnliche komplexe Variablen, während sie Graßmann-Variablen für
4 Die Bezeichnung „Quelle“ ergibt sich, da η k bzw. η ∗k die Amplituden für die Erzeugung bzw. Ver nichtung eines Teilchens durch a†k bzw. a k sind.
438 | 33 Kohärente Bose- und Fermi-Zustände
Fermi-Systeme sind. Mit diesem Unterschied gelten die nachfolgenden Überlegungen sowohl für Bose- als auch für Fermi-Systeme. Die Ein- und Zweiteilchendichtematrizen aus (33.68), (33.69) lassen sich zum Beispiel durch ρ(l, k) = ρ(mn, kl) =
δ δ ∗ Z[η , η] , δη∗k δη l η=0,η∗=0
(33.71)
δ δ δ δ Z[η∗ , η] ∗ ∗ η=0,η∗ =0 δη m δη n δη l δη k
(33.72)
ausdrücken. Für Fermi-Systeme ist die Reihenfolge der Variation (nach den Graß mann-Variablen) wichtig. Unter Benutzung der Definition der Norm eines Zustands lässt sich das erzeugen de Funktional (33.70) auch in der Form 2 Z[η∗ , η] = exp (η ∗ ⋅ a) |ϕ⟩
(33.73)
schreiben. Für den Fall, dass der Grundzustand durch das triviale Vakuum |ϕ⟩ = |0⟩ gegeben ist, welches durch a k |0⟩ = o definiert ist, erhalten wir mit exp(η∗ ⋅ a)|0⟩ = |0⟩ Z[η ∗ , η] = ⟨0|0⟩ = 1 und sämtliche n-Teilchendichten verschwinden. Das erzeugende Funktional (33.70) ist bequem zur Berechnung von Erwartungs werten von Produkten von Feldoperatoren, bei denen die Vernichtungsoperatoren a rechts von den Erzeugungsoperatoren a† stehen: ⟨ϕ|a† ⋅ ⋅ ⋅ a† a ⋅ ⋅ ⋅ a|ϕ⟩
(33.74)
Erwartungswerte mit einer anderen Reihenfolge der Feldoperatoren können prinzi piell unter Benutzung der (Anti)-Kommutationsbeziehungen auf die Form (33.74) zu rückgeführt werden. Für Erwartungswerte der Form ⟨ϕ|a ⋅ ⋅ ⋅ aa† ⋅ ⋅ ⋅ a† |ϕ⟩ . ist es jedoch bequemer, statt (33.70) das erzeugende Funktional ̃ ∗ , η] = ⟨ϕ| exp (η ∗ ⋅ a) exp (a† ⋅ η) |ϕ⟩ Z[η
(33.75)
zu benutzen, welches sich jedoch auf Z (33.70) zurückführen lässt: Da [η ∗ ⋅ a, a† ⋅ η] ≡ ∑[η∗k a k , a†l η l ] = ∑ η∗k η l [a k , a†l ]∓ = ∑ η∗k η l δ(k, l) = ∑ η∗k η k ≡ η∗ ⋅ η k,l
k,l
k,l
k,l
33.3 Beschreibung von Bose- und Fermi-Systemen mittels kohärenter Zustände | 439
eine c-Zahl ist, folgt mittels Gl. (C.20) e A e B = e−[B,A] e B e A , für die Operatoren in Gl. (33.70): exp (a† ⋅ η) exp (η ∗ ⋅ a) = exp (−η ∗ ⋅ η) exp (η ∗ ⋅ a) exp (a† ⋅ η) . Damit erhalten wir die Beziehung ̃ ∗ , η] . Z[η∗ , η] = exp (−η∗ ⋅ η) Z[η
(33.76)
Der zusätzliche Exponent mit den Quellen ist jedoch einfach zu handhaben. ̃ ∗ , η] (33.75) lässt sich unmittelbar durch kohären Das erzeugende Funktional Z[η te Zustände ausdrücken. Dazu schieben wir zwischen den beiden Exponenten den Einheitsoperator (33.8) bzw. (33.48) in der Basis der kohärenten Zustände ein: ̃ ∗ , η] = ∫ dμ(ζ) ⟨ϕ| exp (η ∗ ⋅ a) |ζ⟩⟨ζ| exp (a† ⋅ η) |ϕ⟩ . Z[η Unter Benutzung der Eigenwertgleichung (33.52) der Feldoperatoren erhalten wir dann: ̃ ∗ , η] = ∫ dμ(ζ) ⟨ϕ|ζ⟩ exp (η ∗ ⋅ ζ + ζ ∗ ⋅ η) ⟨ζ|ϕ⟩ Z[η = ∫ d(ζ ∗ , ζ) ̄ ϕ(ζ) exp (−ζ ∗ ⋅ ζ + η∗ ⋅ ζ + ζ ∗ ⋅ η) ϕ(ζ ∗ ) .
(33.77)
̃ ∗ , η] (33.75) aus Zur Illustration berechnen wir das erzeugende Funktional Z[η Gl. (33.77) für den unkorrelierten Zustand⁵ N
|ϕ⟩ = ∏ a†h |0⟩ = a†N ⋅ ⋅ ⋅ a†2 a†1 |0⟩
(33.78)
h=1
als Modell des Grundzustands. In der Basis der kohärenten Zustände besitzt dieser Zustand die Darstellung, siehe Gl. (33.12) bzw. (33.47), N
⟨ζ|ϕ⟩ = ϕ(ζ ∗ ) = ∏ ζ k∗ = ζ N∗ ⋅ ⋅ ⋅ ζ2∗ ζ1∗ , h=1
woraus sich
̄ ≡ (ϕ(ζ ∗ ))∗ = ζ1 ζ2 ⋅ ⋅ ⋅ ζ N ϕ(ζ)
5 Die Reihenfolge der a†k können wir willkürlich wählen, da eine Permutation der a†k den Zustand |ϕ⟩ invariant lässt für Bose-Systeme und höchstens eine nicht beobachtbare Phase (−1) für Fermi-Systeme hervorruft.
440 | 33 Kohärente Bose- und Fermi-Zustände
ergibt. Einsetzen dieser Ausdrücke in (33.77) liefert N
̃ ∗ , η] = ∫ dμ(ζ) ( ∏ ζ h ζ ∗ ) e ζ ∗ ⋅η+η∗ ⋅ζ . Z[η h h=1
Die aus
ζ h , ζ h∗
vor dem Exponenten drücken wir durch Ableitung nach den Quellen η∗k , η k N ̃ ∗ , η] = ( ∏ δ δ ) ∫ dμ(ζ)e ζ ∗ η+η∗ ⋅ζ . Z[η δη h δη∗h h=1
Mit dem Integrationsmaß der kohärenten Zustände (33.7) bzw. (33.49) ist dies ein kom plexes Gauß-Integral (G.13) und wir erhalten N ̃ ∗ , η] = ( ∏ δ δ ) e η∗ ⋅η . Z[η δη h δη∗h h=1
Die verbleibenden Ableitungen lassen sich elementar nehmen δ δ η∗ ⋅η ∗ δ ∗ ∗ δ e = η h e η ⋅η = (1 ± η h ) e η ⋅η = (1 + η h η∗h ) e η ⋅η . δη h δη∗h δη h δη h Damit finden wir schließlich N
̃ ∗ , η] = e η∗ ⋅η ∏ (1 + η h η∗ ) Z[η h h=1
und aus (33.76) N
Z[η∗ , η] = ∏ (1 + η h η∗h ) .
(33.79)
h=1
Dieses Ergebnis lässt sich natürlich auch direkt in der Operatorformulierung der Zwei ten Quantisierung gewinnen (wenn auch nicht so elegant). Ableitung von Gl. (33.79) in der Operatorformulierung: Wir gehen von der Darstellung (33.73) aus und betrachten zunächst die Wirkung von exp(η∗ ⋅ a) auf den Zustand |ϕ⟩ (33.78). Da eη
∗
⋅a
|0⟩ = |0⟩ ,
(33.80)
empfiehlt es sich, den Exponenten an den Erzeugungsoperatoren von |ϕ⟩ vorbei zukommutieren. Das gelingt durch Einfügen von 1̂ = exp(−η ∗ ⋅ a) exp(η ∗ ⋅ a) zwischen benachbarten a†h und Benutzung von (33.80): eη
∗
⋅a
N
|ϕ⟩ = ∏ (e η h=1
∗
⋅a † −η∗ ⋅a ah e ) |0⟩
.
(33.81)
33.3 Beschreibung von Bose- und Fermi-Systemen mittels kohärenter Zustände | 441
Sowohl für Bose- als auch für Fermi-Systeme gilt [η∗ ⋅ a, a†h ] = η∗h .
(33.82)
Für Bose-Operatoren folgt diese Beziehung unmittelbar aus ihren Kommutations relationen: [η∗ ⋅ a, a†h ] = ∑ η∗k [a k , a†h ] = ∑ η∗k δ kh = η∗h . k
k
Für Fermi-Systeme müssen wir zusätzlich beachten, dass die Graßmann-Variablen mit den Fermi-Operatoren antikommutieren, sodass [η∗ ⋅ a, a†h ] = η∗ ⋅ {a, a†h } . Mit (33.82) folgt unter Benutzung von (C.17) eη
∗
⋅a † −η∗ ⋅a ah e
= a†h + η∗h ,
wobei Kommutatoren höherer Ordnung verschwinden, da [η∗h , η∗ ⋅ a] = 0. Damit erhalten wir aus (33.81) eη
∗
⋅a
N
|ϕ⟩ = ∏ (a†h + η∗h )|0⟩ . h=1
Das erzeugende Funktional ergibt sich nach Gl. (33.73) als Norm dieses Zu stands: N
N
Z[η ∗ , η] = ⟨0| ∏ (a h + η h ) ∏ (a†h + η∗h )|0⟩ . h =1
Berücksichtigen wir, dass die a h mit den finden wir
h=1
a†h
für h ≠ h (anti-)kommutieren, so
N
Z[η∗ , η] = ⟨0| ∏ (a h + η h )(a†h + η∗h )|0⟩ h=1 N
= ⟨0| ∏ (a h a†h + η h a†h + a h η∗h + η h η∗h ) |0⟩ . h=1
Mit a h a†h = 1 ± a†h a h und a h |0⟩ = 0 = ⟨0|a†h erhalten wir schließlich Gl. (33.79). Aus Gl. (33.79) ergibt sich die Einteilchendichte (33.71) { δ kl , ρ kl = { 0, {
k ∈ {h} sonst ,
442 | 33 Kohärente Bose- und Fermi-Zustände wobei wir mit {h} den Satz der in |ϕ⟩ besetzten Einteilchenzustände bezeichnet haben. Für die Zweiteilchendichte (33.72) finden wir für k, l ∈ {h}: δ δ δ δ ∗ ∏ (1 + η η ) h ∗ ∗ h δη m δη n δη l δη k h η=0,η∗ =0 δ δ δ = ∏(1 + η h η∗h )η∗k ∗ ∗ δη m δη n δη l h=k̸ η=0,η∗ =0 δ δ = ∏ (1 + η h η∗h )η∗l η∗k δη∗m δη∗n h=k,l ̸ η=0,η∗ =0 δ ∗ ∗ ∗ = ∏ (1 + η h η h ) ∗ (δ nl η k ± δ nk η l ) . δη m h=k,l ̸ η=0,η∗=0
ρ(mn, kl) =
Für k, l ∉ {h} verschwinden diese Ausdrücke. Damit erhalten wir {δ mk δ nl ± δ nk δ ml , ρ(mn, kl) = { 0, {
k, l ∈ {h} sonst .
Korrelierte Vielteilchensysteme besitzen eine Wellenfunktion |ϕ⟩, die sich nicht in der Produktform (33.78) darstellen lässt. Die explizite Berechnung des erzeugenden Funktionals (33.70) lässt sich dann nicht mehr exakt (d. h. in geschlossener Form) durchführen. In vielen Fällen lassen sich jedoch auch korrelierte Systeme durch nicht wechselwirkende Quasiteilchen approximieren, deren Grundzustandswellenfunktion wieder die Produktform (33.78) besitzt. Dies gilt insbesondere für supraleitende Sys teme, die wir im Kapitel 36 behandeln.
33.3.3 Die Spur im Fock-Raum Für die statistische Beschreibung von Vielteilchensystemen im Rahmen des großka nonischen Ensembles sowie für die Quantenfeldtheorie, die mit Prozessen der Teil chenerzeugung und -vernichtung konfrontiert ist, benötigen wir die Spur über den Fock-Raum. Wir betrachten die Spur eines Operators in der Zweiten Quantisierung O(a† , a) im Fock-Raum Sp O = ∑⟨n|O|n⟩ , n
wobei sich die Summation über einen vollständigen Satz von orthonormierten Zu ständen des Fock-Raums erstreckt. Wir erinnern daran, dass der Fock-Raum Zustände mit fester, aber beliebiger Teilchenzahl enthält. Die Summation über die Zustände des Fock-Raums schließt somit die Summation über die Teilchenzahl mit ein.
33.3 Beschreibung von Bose- und Fermi-Systemen mittels kohärenter Zustände | 443
Multiplizieren wir den Operator O(a† , a) von rechts und links jeweils mit dem Ein heitsoperator in der Darstellung der kohärenten Zustände,⁶ Gln. (33.8) bzw. (33.48), so erhalten wir für seine Spur Sp O = ∫ dμ(ζ) ∫ dμ(ζ ) ∑⟨n|ζ⟩⟨ζ|O|ζ ⟩⟨ζ |n⟩ .
(33.83)
n
Für die |n⟩ können wir die Basiszustände des Fock-Raums (31.30) bzw. (31.53) wäh len. Ihre Darstellung in der Basis der kohärenten Zustände ⟨ζ|n⟩ ist in Gln. (33.12) bzw. (33.47) gegeben. Für Bose-Systeme können wir in Gl. (33.83) die Wellenfunktio nen an dem Matrixelement des Operators O vorbeiziehen, da hier die Variablen ζ ge wöhnliche komplexe Zahlen sind. Für Fermi-Systeme oder gemischte Systeme müs sen wir jedoch beachten, dass jede Vertauschung zweier Graßmann-Variablen einen Vorzeichenwechsel zur Folge hat. Wir setzen deshalb jetzt der Einfachheit halber vor aus, dass der Operator O(a† , a) so beschaffen ist, dass seine Matrixelemente ⟨ζ|O|ζ ⟩ nur Terme mit einer geraden Anzahl von Graßmann-Variablen enthalten. Dies stellt ge wöhnlich keinerlei Einschränkung dar, insbesondere nicht, wenn die Fermionenzahl durch den Operator O(a† , a) erhalten wird. (Auch der Operator im erzeugenden Funk tional (33.70) erfüllt diese Voraussetzung.) Wir können dann die Wellenfunktion ⟨n|ζ⟩ in Gl. (33.83) an dem Matrixelement vorbeiziehen, Sp O = ∫ dμ(ζ)dμ(ζ )⟨ζ|O|ζ ⟩ ∑⟨n|ζ⟩⟨ζ |n⟩ .
(33.84)
n
Für Bose-Systeme können wir auch die beiden Skalarprodukte vertauschen. Für FermiSysteme hingegen erhalten wir ein zusätzliches Vorzeichen, wenn die Wellenfunktion ⟨ζ|n⟩ (33.47) eine ungerade Potenz der Graßmann-Variablen ist. Dies führt auf die Be ziehung ⟨n|ζ⟩⟨ζ |n⟩ = ⟨ζ |n⟩⟨n|±ζ⟩ , wobei das obere Vorzeichen für Bose-, das untere für Fermi-Systeme gilt.⁷ Mit dieser Beziehung und unter Ausnutzung der Vollständigkeitsrelation der Zustände |n⟩ erhal ten wir Sp(|ζ⟩⟨ζ |) ≡ ∑⟨n|ζ⟩⟨ζ |n⟩ n
= ∑⟨ζ |n⟩⟨n|±ζ⟩ = ⟨ζ |±ζ⟩ . n
6 Die Vollständigkeitsrelation der kohärenten Zustände liefert den Einheitsoperator im gesamten Fock-Raum, d. h. im Raum der Bose- bzw. Fermi-Zustände mit einer beliebigen Teilchenzahl. 7 ⟨n| − ζ⟩ bedeutet, dass in ⟨n|ζ⟩ (33.47) jedes ζ k durch (−ζ k ) ersetzt wird. Der Leser mache sich klar, dass das Minuszeichen sowohl für Wellenfunktionen mit einer ungeraden als auch mit einer geraden Anzahl von Graßmann-Variablen gilt. Für eine ungerade Zahl von Graßmann-Variablen ist das Minus zeichen absolut notwendig; für eine gerade Zahl ist es zwar nicht notwendig, kann aber gesetzt werden (da es sich herauskürzt), um sämtliche Fermi-Zustände auf einheitliche Weise zu behandeln.
444 | 33 Kohärente Bose- und Fermi-Zustände
Für Fermi-Systeme (unteres Vorzeichen) ist dies die Verallgemeinerung der Beziehung (33.34) auf eine beliebige Zahl von Einteilchenzuständen. Für die Spur eines Operators O(a† , a) mit einer geraden Anzahl von Feldoperatoren erhalten wir somit aus (33.84) Sp O = ∫ dμ(ζ)dμ(ζ )⟨ζ|O|ζ ⟩⟨ζ |±ζ⟩ . Unter der Ausnutzung der Vollständigkeitsrelation (33.8) bzw. (33.48) in den kohären ten Zuständen finden wir schließlich Sp O = ∫ dμ(ζ)⟨ζ|O|±ζ⟩ .
(33.85)
Für Bose-Systeme (oberes Vorzeichen) ist dies die intuitiv erwartete Beziehung. Für Fermi-Systeme (unteres Vorzeichen) tritt hingegen ein zusätzliches Minuszeichen zwischen bra- und ket-Zustand auf. Dieses Minuszeichen ist ein Wesensmerkmal der Beschreibung von Fermi-Systemen mittels Graßmann-Variablen und besitzt weitrei chende Konsequenzen. Es bewirkt beispielsweise, dass Fermi-Felder antiperiodische Randbedingungen erfüllen, wo Bose-Felder periodischen Randbedingungen genügen (siehe Abschnitt 35.2). Abschließend bemerken wir noch: Da das Integrationsmaß dμ(ζ) invariant gegen über der Ersetzung ζ → (−ζ), ζ ∗ → (−ζ ∗ ) ist, können wir die Spur (33.85) auch in der alternativen Form Sp O = ∫ dμ(ζ)⟨±ζ|O|ζ⟩
(33.86)
schreiben.
33.3.4 Ensemble-Mittel Die oben abgeleitete Formel (33.86) für die Spur im Fock-Raum lässt sich vorteilhaft für die Berechnung der thermischen Erwartungswerte (Ensemble-Mittel) benutzen. Dazu ersetzen wir den Operator O durch O(a† , a)e−K , wobei e−K ,
K = β(H − μN)
(33.87)
der (unnormierte) Dichteoperator des großkanonischen Ensembles ist: Sp(O(a† , a)e−K ) = ∫ dμ(ζ)⟨±ζ|O(a† , a)e−K |ζ⟩ .
(33.88)
Wählen wir hier O(a† , a) = 1,̂ so erhalten wir die großkanonische Zustandssumme Z = Sp e−K = ∫ dμ(ζ)⟨±ζ|e−K |ζ⟩ .
(33.89)
33.3 Beschreibung von Bose- und Fermi-Systemen mittels kohärenter Zustände | 445
Schließen wir auch Quellterme mit ein (siehe Gl. (33.70)) O(a† , a) = e a
†
⋅η η∗ ⋅a
e
,
so erhalten wir das erzeugende Funktional der thermischen Erwartungswerte Z[η∗ , η] = Sp (e a
†
⋅η η∗ ⋅a −K
e
e ) = ∫ dμ(ζ)⟨±ζ|e a
†
⋅η η∗ ⋅a −K
e
e |ζ⟩ ,
(33.90)
welches sich für verschwindende Quellen η, η∗ auf die Zustandssumme (33.89) redu ziert. Die Rechnungen werden besonders einfach, wenn der Dichteoperator (33.87) durch den Exponenten eines Einteilchenoperators K = ∑ K kl a†k a l
(33.91)
k,l
gegeben ist. Wir betrachten die Wirkung des Operators exp(−K) auf einen kohärenten Zustand. Da der Operator K (33.91) das Vakuum vernichtet, K|0⟩ = ∑ K kl a†k a l |0⟩ = o , k,l
gilt eK |0⟩ = |0⟩ und somit für die kohärenten Zustände †
†
e−K |ζ⟩ = e−K e a ⋅ζ |0⟩ = e−K e a ⋅ζ eK |0⟩ = exp (e−K a† ⋅ζ eK ) |0⟩ . Die letzte Beziehung folgt durch Taylor-Entwicklung von exp(a† ⋅ ζ), Einfügen von 1̂ = eK e−K zwischen benachbarten a† ⋅ζ -Termen und Aufsummation der verbleibenden Reihe. Unter Benutzung von Gl. (31.78) haben wir e−K a† ⋅ζ eK = ∑ e−K a†k eK ζ k = ∑ a†l (e−K )lk ζ k = a† ⋅(e−K ζ ) k
k,l
und somit e−K |ζ⟩ = |e−K ζ⟩ . Mit dieser Beziehung finden wir aus (33.88) Sp (O(a† , a)e−K ) = ∫ dμ(ζ)⟨±ζ|O(a† , a)|e−K ζ⟩ und aus Gl. (33.90) für das erzeugende Funktional die Darstellung Z[η∗ , η] = ∫ dμ(ζ)⟨±ζ|e a
†
⋅η η∗ ⋅a
e
|e−K ζ⟩ .
(33.92)
446 | 33 Kohärente Bose- und Fermi-Zustände
Mit der Definition (33.52) der kohärenten Zustände und Gl. (33.56) erhalten wir hieraus Z[η∗ , η] = ∫ dμ(ζ) e±ζ
∗
⋅η
eη
∗
⋅e −K ζ
⟨±ζ|e−K ζ⟩
= ∫ dμ(ζ) e±ζ
∗
⋅η
eη
∗
⋅e −K ζ
e±ζ
= ∫∏
dζ k∗ dζ k (2πi)λ
k
∗
⋅e −K ζ
exp [−ζ ∗ ⋅ (1 ∓ e−K ) ζ ± ζ ∗ ⋅ η + η∗ ⋅ e−K ζ ] ,
wobei λ = 1 bzw. λ = 0 für Bose- bzw. Fermi-Systeme. Nach Ausführen des verbleiben den Gauß-Integrals mittels (G.13) erhalten wir ∓1
Z[η∗ , η] = det (1 ∓ e−K )
exp [η∗ e−K (1 ∓ e−K )
−1
(±η)] .
(33.93)
Setzen wir hier η = 0, so finden wir für die großkanonische Zustandssumme ∓1
Z = det (1 ∓ e−K )
.
(33.94)
Vergleich mit der Definition der Zustandssumme (33.89) liefert die Beziehung ∓1
Sp e−K = det (1 ∓ e−K )
.
(33.95)
Man beachte, dass auf der linken Seite der Operator K in der Zweiten Quantisierung, auf der rechten Seite jedoch die Matrix K steht (siehe Gl. (33.91)). Mit (33.94) erhalten wir aus (33.93) Z[η∗ , η] = Z exp [±η∗ ρη] , wobei wir die Abkürzung ρ = (e K ∓ 1)
−1
(33.96)
(33.97)
eingeführt haben. Man erkennt leicht, dass ρ gerade die Dichtematrix (32.45) des groß kanonischen Ensembles ist: In der Basis, in der H diagonal ist, H kl = δ kl ϵ k ,
K kl = δ kl β (ϵ k − μ) ,
besitzt ρ (33.97) die Spektraldarstellung (±)
ρ = ∑ |k⟩Nk ⟨k| , k
wobei
(±)
Nk = (e β(ϵ k −μ) ∓ 1)
−1
die thermischen Besetzungszahlen (32.53), (32.50) sind.
34 Wick’sches Theorem, Green’sche Funktionen und Erzeugendes Funktional* Um die Eigenschaften physikalischer Systeme zu untersuchen, werden diese äußeren Störungen unterworfen. Diese Störungen können z. B. von außen angelegte elektro magnetische Felder sein. Die Reaktion des Systems auf die Störung liefert uns Infor mationen über Struktur und dynamisches Verhalten des Systems. Aus theoretischer Sicht sind die Störungen nichts weiter als Operatoren, die im Hilbert-Raum der Wellen funktion des Systems wirken. In der Zweiten Quantisierung von Vielteilchensystemen sind die Störungen durch Funktionen der Feldoperatoren gegeben. (In den meisten Fällen sind dies Ein- oder Zweiteilchenoperatoren.) Wir benötigen daher die Wirkung von diversen Funktionen der Feldoperatoren auf die Wellenfunktion des Vielteilchen systems. Diese lassen sich auf sehr elegante Weise aus dem erzeugenden Funktional gewinnen, wie wir in Abschnitt 33.3.2 gesehen haben. Dort hatten wir uns auf zeit unabhängige Feldoperatoren beschränkt. Zur Beschreibung von zeitabhängigen Pro zessen ist es jedoch gewöhnlich vorteilhaft, vom bisher betrachteten Schrödinger-Bild zum Heisenberg-Bild oder Wechselwirkungsbild überzugehen, womit die Operatoren zwangsläufig zeitabhängig werden, siehe die Abschnitte 23.3 und 23.4. Diese induzier te Zeitabhängigkeit der Operatoren lässt sich in der Zweiten Quantisierung vollstän dig durch zeitabhängige Feldoperatoren erfassen. Erwartungswerte von Observablen lassen sich dann sämtlich durch Erwartungswerte von Produkten der zeitabhängigen Feldoperatoren ausdrücken, die als Green’sche Funktionen bezeichnet werden. Diese lassen sich sämtlich aus einem erzeugenden Funktional gewinnen. Ihre explizite Be rechnung vereinfacht sich sehr wesentlich durch das Wick’sche Theorem.
34.1 Wick’sches Theorem Systeme aus identischen Teilchen werden vorteilhaft in der Zweiten Quantisierung be schrieben, da hier die erforderliche (Anti-)Symmetrie der Wellenfunktion automatisch durch die Algebra der Feldoperatoren gewährleistet wird. Nichtwechselwirkende Teil chen oder Quasiteilchen besitzen einen Hamilton-Operator, der quadratisch in den Feldoperatoren ist und für den die Schrödinger-Gleichung folglich exakt lösbar ist. Die Wellenfunktionen nichtwechselwirkender Systeme sind reine Produktzustände, siehe Gl. (31.102), d. h. (anti-)symmetrisierte Produkte von Einteilchenfunktionen (Sla ter-Determinanten für Fermi-Systeme). Selbst für wechselwirkende Systeme empfiehlt es sich, diese Produktzustände als Basiszustände zu benutzen, nach denen der exak
* Dieses Kapitel ist für das Verständnis der übrigen Kapitel nicht erforderlich und kann deshalb beim ersten Lesen übersprungen werden. https://doi.org/10.1515/9783110586077-012
448 | 34 Wick’sches Theorem, Green’sche Funktionen und Erzeugendes Funktional
te Zustand entwickelt wird. Die Berechnung der Erwartungswerte von Produkten von Feldoperatoren in solchen Basiszuständen vereinfacht sich enorm durch die Benut zung des Wick’schen Theorems, welches wir in vereinfachter Form (d. h. für zeitunab hängige Feldoperatoren) bereits in Abschnitt 31.7.4 kennengelernt haben und das im Folgenden in seiner allgemeinsten Form entwickelt werden soll.
34.1.1 Abstrakte Form des Wick’schen Theorems Wir leiten zunächst einige nützliche Operatorbeziehungen her, die es uns später erlau ben werden, das Wick’sche Theorem in allgemeiner und kompakter Form abzuleiten. Wir betrachten zwei Operatoren A und B, deren Kommutator [A, B] sowohl mit A als auch B vertauscht. Dann gilt bekanntlich die Baker-Campbell-Hausdorff-Formel (C.19) 1 e A e B = e A+B e 2 [A,B] . (34.1) Diese Beziehung lässt sich unmittelbar verallgemeinern auf einen Satz von Operato ren A1 , A2 , . . . , A n , deren Kommutatoren [A k , A l ] mit sämtlichen A k kommutieren. Sukzessive Anwendung von Gl. (34.1) liefert: n 1 e A n e A n−1 ⋅ ⋅ ⋅ e A 2 e A 1 = exp ( ∑ A k ) exp ( ∑[A i , A j ]) . 2 i>j k=1
(34.2)
Schließlich betrachten wir zwei Sätze von Operatoren A1 , . . . , A n und B1 , . . . , B n mit den folgenden Eigenschaften: 1. die A k und B k kommutieren jeweils untereinander, [A k , A l ] = 0̂ , 2.
[B k , B l ] = 0̂ ,
(34.3)
ihre Kommutatoren [A k , B l ] vertauschen mit sämtlichen A k und B k , [A i , [A k , B l ]] = 0̂ ,
[B i , [A k , B l ]] = 0̂ .
Offenbar vertauschen dann die Kommutatoren [A k + B k , A l + B l ] = [A k , B l ] + [B k , A l ] mit den Operatoren (A k + B k ) und wir dürfen in Gl. (34.2) die A k durch A k + B k ersetzen und erhalten: e A n +B n e A n−1 +B n−1 ⋅ ⋅ ⋅ e A 1 +B1 n
= exp ( ∑ (A k + B k )) exp ( k=1
1 ∑ [A k + B k , A l + B l ]) 2 k>l
= exp (∑ A k + ∑ B k ) exp ( k
k
1 ∑ ([A k , B l ] + [B k , A l ])) . 2 k>l
(34.4)
34.1 Wick’sches Theorem | 449
Wenden wir jetzt noch einmal Gl. (34.1) auf die Operatoren A = ∑ Ak ,
B = ∑ Bk
k
k
an, so haben wir: 1 ∑[A k , B l ]) . 2 k,l
(34.5)
1 = exp (∑ A k ) exp (∑ B k ) exp (− ∑ [A k , B l ]) exp (− ∑[A k , B k ]) . 2 k k kl
k=l
kl k=l ,
(34.11)
k t t = t , t
t , t = t ,
(34.26)
t < t .
Offensichtlich gilt T(c k (t)c l (t )) = ±T(c l (t )c k (t)) . 3.
Die Kontraktion zweier Feldoperatoren ist analog zu Gl. (34.10) durch die Diffe renz von T-Produkt und Normalprodukt definiert c k (t)c l (t ) = T (c k (t)c l (t )) − :c k (t)c l (t ): .
(34.27)
Während die Kontraktion von zwei Erzeugungsoperatoren oder zwei Vernich tungsoperatoren verschwindet, a(t1 )a(t2 ) = 0̂ ,
a† (t1 )a † (t2 ) = 0̂ ,
gilt a l (t)a †k (t ) = Θ1/2 (t − t )[a l (t), a†k (t )]∓ ,
(34.28)
wobei Θ1/2 (x) die Θ-Funktion ist, deren Wert an der Sprungstelle x = 0 auf 1/2 gesetzt ist: Θ1/2 (x = 0) = 1/2. Ferner bezeichnet [⋅, ⋅]− den gewöhnlichen Kommutator und [⋅, ⋅]+ den Antikommutator. Außerdem gilt a†k (t )a l (t) = ± a l (t)a †k (t ) ,
(34.29)
wovon man sich leicht überzeugt. Die Kontraktionen der Feldoperatoren lassen sich auch unmittelbar aus den Kontraktionen (34.18), (34.19) der Operatoren (34.22) A(t) und B(t) gewinnen.
34.1 Wick’sches Theorem |
455
Die Definition (34.26) des zeitgeordneten Produkts von Fermi-Operatoren unterscheidet sich durch den Einschluss des Charakters χ(P) der erforderlichen Permutation P offenbar von der in Gln. (23.15) bzw. (34.17) gegebenen allgemeinen Definition des T -Produkts, die wir auch in der Darstellung des Zeitentwicklungsoperators benutzt haben. Dies führt jedoch zu keinem Widerspruch, da die Observ ablen (insbesondere der Hamilton-Operator) in der Zweiten Quantisierung stets eine gerade Anzahl von Fermi-Operatoren enthalten.
34.1.3 Wick’sches Theorem für Feldoperatoren Die Zeitabhängigkeit der Feldoperatoren a l (t), a†l (t) wird gewöhnlich durch den Über gang zum Wechselwirkungsbild hervorgerufen, siehe die Abschnitte 23.4 und 34.2.1. Für die nachfolgenden Betrachtungen ist es allerdings nicht notwendig, dass die Zeit abhängigkeit der Feldoperatoren durch das Wechselwirkungsbild induziert ist. Sie kann auch durch das Heisenberg-Bild hervorgerufen sein oder einfach als eine para metrische Abhängigkeit künstlich eingeführt sein, um dann durch geeignete Wahl des Zeitarguments eine Reihenfolge der Operatoren mit Hilfe des zeitgeordneten Produkts festzulegen. Von dieser Möglichkeit werden wir auch Gebrauch machen. Notwendig ist jedoch, dass die zeitabhängigen Feldoperatoren den üblichen (Anti-)Kommutati onsbeziehungen genügen: [a k (t), a l (t )]∓ = 0̂ = [a†k (t), a†l (t )] ,
(34.30)
[a k (t), a†l (t )]∓
(34.31)
= c-Zahl .
Die letzte Bedingung ist notwendig, damit die [a k , a†l ]± mit den a k und a†k kommutie ren.³ Unter der Voraussetzung (34.30) genügen die in Gl. (34.22) definierten Operatoren A(t), B(t) den Kommutationsbeziehungen [A(t), A(t )] = 0̂ ,
[B(t), B(t )] = 0̂ .
(34.32)
Für Bose-Operatoren ist dies offensichtlich, da die komplexen Zahlen ζ l (t) aus den Kommutatoren gezogen werden können. Auch für Fermi-Systeme überzeugt man sich leicht von der Gültigkeit der Kommutationsbeziehungen (34.32) unter Beachtung der Eigenschaften der Graßmann-Variablen, mit deren Hilfe man z. B. [B(t), B(t )] = ∑ η∗k (t )η∗l (t) {a l (t), a k (t )} = 0̂ l,k
3 In Abschnitt 34.2.1 werden wir explizit sehen, dass die Bedingungen (34.30), (34.31) erfüllt sind, wenn die Zeitabhängigkeit der Feldoperatoren durch einen Einteilchen-Hamilton-Operator induziert ist.
456 | 34 Wick’sches Theorem, Green’sche Funktionen und Erzeugendes Funktional
erhält. Für den noch verbleibenden Kommutator finden wir [B(t), A(t )] = ∑ η∗k (t)η l (t ) [a k (t), a†l (t )]∓ . k,l
Da nach Voraussetzung (34.31) diese Größe kein Operator mehr ist, kommutiert sie mit A(t ) und B(t ): [A(t ), [B(t), A(t )]] = 0̂ (34.33) [B(t ), [B(t), A(t )]] = 0̂ . Damit erfüllen die in Gl. (34.22) definierten Operatoren A(t), B(t) sämtliche Vorausset zungen, die bei der Ableitung der Beziehung (34.21) gestellt wurden. Setzen wir diese Operatoren in Gl. (34.21) ein und benutzen (34.20), A(t)B(t ) = B(t )A(t) = η ∗ (t )⋅a(t )a † (t)⋅η(t) , so erhalten wir die Beziehung tb
T exp [∫ dt (η∗ (t)⋅a(t) + a† (t)⋅η(t)) ] [t a ] tb
= : exp [∫ dt (η∗ (t)⋅a(t) + a† (t)⋅η(t)) ] : ]
[t a tb
tb
exp [∫ dt ∫ dt η∗ (t) ⋅ a(t)a† (t ) ⋅ η(t )] . ] [t a t a
(34.34)
Dies ist die allgemeinste Form des Wick’schen Theorems für Feldoperatoren. Die ge wöhnliche Form des Wick’schen Theorems erhält man hieraus, indem man die Expo nentialfunktionen entwickelt und die Koeffizienten der unabhängigen Potenzen von η und η∗ auf der rechten und linken Seite gleichsetzt. Identifiziert man die Koeffizienten von η ∗ (t)η(t ), so erhält man: T (a(t)a† (t )) = :a(t)a† (t ): + a(t)a† (t ) .
(34.35)
Dies ist gerade die Definition (34.27) der Kontraktionen von Erzeugungs- und Vernich tungsoperatoren. Durch Identifikation der Koeffizienten von η∗ (t1 )η∗ (t2 )η(t3 )η(t4 ) er
34.1 Wick’sches Theorem | 457
hält man die Beziehung T (a(t1 )a(t2 )a† (t3 )a† (t4 )) = :a(t1 )a(t2 )a† (t3 )a† (t4 ): + :a(t1 )a† (t4 ): a(t2 )a† (t3 ) + :a(t2 )a† (t3 ): a(t1 )a† (t4 ) ± :a(t1 )a† (t3 ): a(t2 )a† (t4 ) ± :a(t2 )a† (t4 ): a(t1 )a† (t3 ) + a(t1 )a† (t4 ) a(t2 )a† (t3 ) ± a(t1 )a† (t3 ) a(t2 )a† (t4 ) .
(34.36)
Ganz allgemein (für eine beliebige Potenz von η und η∗ ) findet man die gewöhnliche Form des Wick’schen Theorems: Das T-Produkt von Erzeugungs- und Vernichtungsoperatoren ist gleich dem normal geordneten Produkt plus der Summe aller normalgeordneten Produkte mit einem Paar von kontrahierten Operatoren plus der Summe aller normalgeordneten Produk te mit zwei Kontraktionen usw., bis alle möglichen Kontraktionen der Operatoren er schöpft sind. Jeder dabei entstehende Term wird multipliziert mit dem Charakter χ(P) der Permutation P, die erforderlich ist, um die kontrahierten Fermi-Operatoren zu sammenzubringen.
Das durch die Permutation P der Fermi-Operatoren auftretende Vorzeichen χ(P) = ±1 lässt sich ver meiden, wenn man beim Bilden der Kontraktion die Positionen der Operatoren beibehält. So lässt sich Gl. (34.36) alternativ schreiben als T (a(t 1 )a(t 2 )a† (t 3 )a† (t 4 )) = :a(t 1 )a(t 2 )a† (t 3 )a† (t 4 ): + :a(t 1 ) a(t 2 )a † (t 3 )a† (t 4 ): + : a(t 1 )a(t 2 )a† (t 3 )a † (t 4 ): + :a(t 1 ) a(t 2 )a† (t 3 )a † (t 4 ): + : a(t 1 )a(t 2 )a † (t 3 )a† (t 4 ): + : a(t 1 )a(t 2 )a† (t 3 )a † (t 4 ): + : a(t 1 )a(t 2 )a† (t 3 )a † (t 4 ) : . Das zeitgeordnete Produkt ergibt sich dann einfach als Summe der Normalprodukte mit allen mög lichen Kontraktionen der Feldoperatoren. Diese Darstellung besitzt jedoch nur formale Bedeutung. Wenn die explizite Form der Kontraktionen eingesetzt werden soll, kehrt man zwangsläufig wieder zu der Form (34.36) zurück.
458 | 34 Wick’sches Theorem, Green’sche Funktionen und Erzeugendes Funktional
34.2 Green’sche Funktionen 34.2.1 Feldoperatoren im Heisenberg- und Wechselwirkungsbild Wie wir im Kapitel 24 gesehen haben, ist es bei der Beschreibung zeitabhängiger Pro zesse oft vorteilhaft, das Heisenberg- oder das Wechselwirkungsbild zu benutzen, in welchem die Operatoren zeitabhängig sind. In der Zweiten Quantisierung kann die durch diese Bilder induzierte Zeitabhängigkeit vollständig in die Feldoperatoren ab sorbiert werden, wovon man sich leicht überzeugt: Es sei t
i U(t, t0 ) = T exp [− ∫ dt H(t )] ℏ [ t0 ]
(34.37)
der Zeitentwicklungsoperator (23.13) in der Zweiten Quantisierung. Offenbar besitzt dieser Operator dieselben Eigenschaften wie in der Ersten Quantisierung: U(t2 , t1 )U(t1 , t0 ) = U(t2 , t0 ) , †
U (t, t0 ) = U−1 (t, t0 ) = U(t0 , t) . Im Heisenberg-Bild sind die Wellenfunktionen zeitunabhängig, während die Opera toren die gesamte Zeitabhängigkeit tragen: OH (t) = U† (t, t0 )OU(t, t0 ) . In der Zweiten Quantisierung ist jeder Operator O = O(a† , a) durch eine Linearkombi nation von Produkten von Erzeugungs- und Vernichtungsoperatoren gegeben. Wegen U(t, t0 )U† (t, t0 ) = 1̂ gilt dann U† (t, t0 )O(a† , a)U(t, t0 ) = O (U† (t, t0 )a† U(t, t0 ) , U† (t, t0 )aU(t, t0 )) = O (a†H (t) , aH (t)) und die Zeitabhängigkeit kann in die Feldoperatoren absorbiert werden aH (t) = U† (t, t0 )aU(t, t0 ) , a†H (t) = U† (t, t0 )a† U(t, t0 ) .
(34.38)
Für wechselwirkende Vielteilchensysteme ist der volle Zeitentwicklungsoperator U(t, t0 ) schwierig zu handhaben. Die Feldoperatoren im Heisenberg-Bild aH (t), a†H (t) sind komplizierte Vielteilchenoperatoren, wie man durch Taylor-Entwicklung der Zeitentwicklungsoperatoren erkennt. In vielen Fällen wird jedoch der Hamilton-Ope rator H des Vielteilchensystems durch einen Einteilchenoperator h = ∑ h kl a†k a l
(34.39)
k,l
dominiert (der z. B. durch den Hartree-Fock-Hamilton-Operator (32.82) gegeben sein kann), während die residuellen Korrelationen V in Störungstheorie behandelt werden können: H= h+V. (34.40)
34.2 Green’sche Funktionen
| 459
Dann empfiehlt es sich, das Wechselwirkungsbild zu benutzen, wobei der Einteilchen operator h (34.39) als „ungestörter“ Hamilton-Operator betrachtet wird, der die Zeit abhängigkeit der Operatoren generiert⁴ O(t) := u† (t, t0 )Ou(t, t0 ) mit
(34.41)
t
i u(t, t0 ) = T exp [− ∫ dt h(t )] . ℏ [ t0 ]
(34.42)
Natürlich kann auch in diesem Bild die Zeitabhängigkeit der Operatoren u† (t, t0 )O(a† , a)u(t, t0 ) = O(a† (t), a(t)) in die Feldoperatoren
a(t) := u† (t, t0 )a u(t, t0 ) , a† (t) := u† (t, t0 )a† u(t, t0 )
(34.43)
absorbiert werden. Für die Anwendung des Wechselwirkungsbilds ist es nicht prinzipiell erforderlich, dass h ein Einteilchenoperator ist. Jedoch vereinfachen sich die Rechnungen sehr wesentlich für einen Einteilchenoperator und die zeitabhängigen Feldoperatoren (34.43) lassen sich in geschlossener Form angeben. Man findet: a k (t) = u kl (t, t0 ) a l a†k (t) = a†l u †lk (t, t0 ) ,
(34.44)
wobei über doppelt auftretende Indizes summiert wird und t2
i u(t2 , t1 ) = T exp [− ∫ dth(t)] ℏ [ t1 ]
(34.45)
der Zeitentwicklungsoperator eines einzelnen Teilchens (in der Ersten Quantisie rung) ist, dessen Hamilton-Operator durch die in (34.39) auftretende Matrix h ge geben ist.⁵ (Man beachte den Unterschied zwischen (34.42) und (34.45): u(t) ist ein Operator im Fock-Raum, während u(t) im Hilbert-Raum eines einzelnen Teilchens definiert ist.)
4 Wir verzichten hier auf den in Abschnitt 23.4 benutzen Index „W“ zur Kennzeichnung des Wechsel wirkungsbilds. 5 D. h., h und u(t) (34.45) sind Matrizen (mit i. A. komplexen Matrixelementen) im Raum der Einteil chenzustände |k⟩.
460 | 34 Wick’sches Theorem, Green’sche Funktionen und Erzeugendes Funktional
Beweis von (34.44) Den zeitabhängigen Vernichtungsoperator (34.43) schreiben wir in der Form a k (t) = a k + u† (t, t 0 )[a k , u(t, t 0 )] .
(34.46)
Unter Benutzung von (C.10) haben wir t
i [a k , u(t, t 0 )] = − ∫ dt u(t, t )[a k , h(t )]u(t , t 0 ) . ℏ t0
Der Kommutator wurde in (31.75) berechnet: [a k , h(t)] = h kl (t)a l . Mit u(t, t ) = u(t, t 0 )u(t 0 , t ) und der Definition (34.43) erhalten wir t
i [a k , u(t, t 0 )] = u(t, t 0 ) (− ) ∫ dt h kl (t )a l (t ) . ℏ t0
Einsetzen dieses Ausdrucks in (34.46) liefert die Integralgleichung t
a k (t) = a k −
i ∫ dt h kl (t )a l (t ) . ℏ t0
Iteration dieser Gleichung und Aufsummation der entstehenden Reihe mittels Gl. (23.45) liefert die erste Beziehung in Gl. (34.44). Die zweite Beziehung ist das hermitesch Konjugierte der ersten.
Die zeitabhängigen Operatoren a k (t) bzw. a†k (t) sind nach (34.44) durch lineare Kombinationen der zeitunabhängigen Operatoren a k bzw. a†k gegeben. Insbeson dere bleiben die a k (t) zu allen Zeiten reine Vernichtungsoperatoren, d. h., im Lauf der Zeit erhalten die a k (t) keine Beimischungen der a†k . Dasselbe gilt natürlich auch entsprechend für die Erzeugungsoperatoren a†k (t). Mit Gl. (34.44) finden wir aus den (Anti-)Kommutationsbeziehungen der a k , a†k (31.51) bzw. (31.27) die entsprechen den Beziehungen für die zeitabhängigen Feldoperatoren [a l (t), a k (t )]∓ = 0
[a†l (t), a†k (t )]∓ = 0
[a l (t), a†k (t )]∓ = u lk (t, t ) .
(34.47)
In der letzten Beziehung haben wir die Unitarität von u(t) ausgenutzt. Aus dieser Beziehung folgt mit (34.28) für die Kontraktion a l (t)a †k (t ) = Θ(t − t )u lk (t, t ) .
(34.48)
Auch dieser Ausdruck gilt gleichermaßen für Bose- und Fermi-Systeme. Ferner er kennen wir, dass im vorliegenden Fall die Kontraktion kein Operator, sondern eine gewöhnliche komplexe Zahl ist.
34.2 Green’sche Funktionen
| 461
Wir betrachten jetzt die Wirkung der zeitabhängigen Feldoperatoren auf die ko härenten Zustände |ζ⟩. Diese sollen wie bisher bezüglich der zeitunabhängigen Feldoperatoren a, a† definiert sein, siehe Gl. (33.52). Ferner setzen wir wieder vor aus, dass die Zeitabhängigkeit der a(t), a† (t) durch Gl. (34.44) gegeben ist. Es gilt dann a k (t)|ζ⟩ = ζ k (t)|ζ⟩ ⟨ζ|a†k (t)
=
⟨ζ|ζ k∗ (t)
(34.49) ,
(34.50)
wobei wir die Abkürzungen ζ k∗ (t) := ζ l∗ u †lk (t, t0 )
ζ k (t) := u kl (t, t0 )ζ l ,
(34.51)
eingeführt haben. Die so definierten zeitabhängigen komplexen bzw. GraßmannVariablen ζ k (t), ζ k∗ (t) besitzen dieselbe Zeitabhängigkeit wie die Feldoperatoren a k (t), a†k (t) (34.44), womit Gln. (34.49), (34.50) die direkte Verallgemeinerung von (33.52) für zeitabhängige Operatoren sind. Ist der Einteilchen-Hamilton-Operator (34.39) zeitunabhängig, empfiehlt es sich, in eine Basis zu gehen, in der dieser diagonal ist, h kl = ϵ k δ kl .
(34.52)
Dasselbe gilt dann auch für den Zeitentwicklungsoperator (34.45) u kl (t, t0 ) = δ kl e−iϵ k (t−t 0) . Die Feldoperatoren des Wechselwirkungsbilds (34.44) a k (t) = e− ℏ ϵ k (t−t 0) a k , i
a†k (t) = e ℏ ϵ k (t−t 0) a†k i
(34.53)
unterscheiden sich dann von den zeitunabhängigen Feldoperatoren nur durch eine zeitabhängige Phase.
34.2.2 Vielteilchen-Green’sche Funktionen Wie in der Quantenmechanik eines einzelnen Teilchens ist auch für die Beschrei bung von dynamischen Prozessen in Vielteilchensystemen die zentrale Größe die Übergangsamplitude (34.54) ⟨ϕ f |U(t f , t i )|ϕ i ⟩ , wobei U(t f , t i ) (34.37) der Zeitentwicklungsoperator und |ϕ i ⟩ bzw. |ϕ f ⟩ die Zustände des Vielteilchensystems zur Zeit t i bzw. t f sind. Ihr Betragsquadrat gibt die Wahr
462 | 34 Wick’sches Theorem, Green’sche Funktionen und Erzeugendes Funktional scheinlichkeit an, dass sich der Anfangszustand |ϕ i ⟩ während der Zeit t f − t i in den Endzustand |ϕ f ⟩ entwickelt. Unter Benutzung von U(t f , t i ) = U(t f , t)U(t, t i ) = U† (t, t f )U(t, t i ) können wir die Übergangsamplitude (34.54) auch durch die zeitabhängigen Wellen funktionen |ϕ i,f (t)⟩ = U(t, t i,f )|ϕ i,f ⟩ ausdrücken: ⟨ϕ f |U(t f , t i )|ϕ i ⟩ = ⟨ϕ f (t)|ϕ i (t)⟩ = ⟨ϕ f (t2 )|U(t2 , t1 )|ϕ i (t1 )⟩ , wobei t1 und t2 beliebige Zeiten sind. In der Natur gibt es Prozesse, in denen Teilchen erzeugt bzw. vernichtet werden. Zum Beispiel wird beim β-Zerfall des Neutrons n → p + e− + ̄ν ein Neutron n vernichtet und gleichzeitig ein Proton p, ein Elektron e− und ein Anti neutrino ̄ν erzeugt. Die Zweite Quantisierung erlaubt auf sehr elegante Art, auch die Teilchenerzeugung bzw. -vernichtung zu beschreiben. Anfangs- und Endzustand in der Übergangsamplitude müssen deshalb nicht notwendigerweise dieselbe Teilchen zahl enthalten. Oftmals benötigen wir nicht die gesamte Übergangsamplitude, sondern interes sieren uns für die Bewegung eines einzelnen Teilchens oder zweier Teilchen in einem wechselwirkenden System. Schließlich sind die meisten Observablen von physikali schem Interesse Ein- und Zweiteilchenoperatoren. Zwar wird die exakte Bewegung ei nes herausgegriffenen Teilchens i. A. durch die Dynamik des gesamten Systems beein flusst, in vielen Fällen sind jedoch Vielteilchenkorrelationen vernachlässigbar. Dies ist insbesondere der Fall in stark verdünnten Systemen mit einer kurzreichweitigen Wechselwirkung. Dann ist es vorteilhaft, neben der eigentlichen Übergangsamplitude zwischen beliebigen Zuständen |ϕ i ⟩ und |ϕ f ⟩ (die sich auch in der Teilchenzahl un terscheiden können) auch die Wahrscheinlichkeit dafür zu betrachten, dass in einem Vielteilchensystem, welches sich in einem Zustand |ϕ⟩ befindet, ein Teilchen zum Zeitpunkt t1 im Zustand k 1 erzeugt und zu einem späteren Zeitpunkt t2 ein Teilchen⁶ im Zustand k2 vernichtet wird, d. h., wir betrachten die spezielle Übergangsamplitude für |ϕ i (t1 )⟩ = a†k1 |ϕ(t1 )⟩ und ⟨ϕ f (t2 )| = ⟨ϕ(t2 )|a k2 , ⟨ϕ(t2 )|a k2 U(t2 , t1 )a†k1 |ϕ(t1 )⟩ .
6 Aufgrund der Identität der Teilchen können wir nicht unterscheiden, ob es sich hier um dasselbe oder ein anderes Teilchen handelt.
34.2 Green’sche Funktionen |
463
In der Heisenberg-Darstellung der Feldoperatoren (34.38), für welche wir die kompak te Notation a(1) = (a k2 (t2 ))H = U(t0 , t1 )a k1 U(t1 , t0 ) einführen, finden wir für diese Größe ⟨ϕ(t0 )|a(2)a† (1)|ϕ(t0 )⟩ .
(34.55)
Analog können wir nach der Wahrscheinlichkeit fragen, dass zunächst ein Teilchen zum Zeitpunkt t2 im Zustand k 2 vernichtet wird und zu einem späteren Zeitpunkt t1 > t2 ein Teilchen im Zustand k 1 erzeugt wird: ± ⟨ϕ(t0 )|a† (1)a(2)|ϕ(t0 )⟩ .
(34.56)
Die Summe beider Amplituden (34.55) und (34.56) lässt sich mittels des zeitgeordneten Produkts (34.26) zur Einteilchen-Green’schen Funktion G(2, 1) = ⟨ϕ|Ta(2)a† (1)|ϕ⟩
(34.57)
zusammenfassen, wobei wir der Einfachheit halber |ϕ(t0 )⟩ = |ϕ⟩ gesetzt haben. Ganz allgemein können wir natürlich auch Übergangsamplituden zwischen Zu ständen |ϕ i ⟩ und |ϕ f ⟩ betrachten, die sich durch Erzeugung bzw. Vernichtung einer beliebigen Anzahl von Teilchen aus einem Zustand |ϕ⟩ gewinnen lassen. Insbesonde re müssen |ϕ i ⟩ und |ϕ f ⟩ nicht dieselbe Anzahl von Teilchen enthalten. Dies führt auf die allgemeinen Green’schen Funktionen G(1, . . . , n; 1 , . . . , m ) = ⟨ϕ|Ta(1) . . . a(n)a† (m ) . . . a† (1 )|ϕ⟩ .
(34.58)
Wie aus den obigen Betrachtungen hervorgeht, ist die Kenntnis sämtlicher Green’scher Funktionen äquivalent zur Kenntnis sämtlicher Übergangsamplituden und damit zur Kenntnis der Wellenfunktion |ϕ⟩, und zwar in ihrer gesamten zeitlichen Entwick lung. Dies erkennt man sofort, wenn man beachtet, dass sich die Erwartungswerte sämtlicher Observablen vollständig durch die n-Teilchen-Green’schen Funktionen ausdrücken lassen. Für den Erwartungswert eines Einteilchenoperators (31.61) haben wir ⟨ϕ|O|ϕ⟩ = ∑ O(k 1 , k 2 )⟨ϕ|a†k1 a k2 |ϕ⟩ = lim Sp (OG(t0 , t1 )t 1 =t 0+ε ) , k2 ,k1
ε→0
wobei wir im letzten Ausdruck G(2, 1) =: G k2 k1 (t2 , t1 ) gesetzt haben. Zum Glück benötigen wir in praktischen Anwendungen i. A. nur die untersten Green’schen Funktionen. Dies sind vor allem die Ein- und ZweiteilchenGreen’schen Funktionen, die durch (34.57) und G(2, 1; 2 , 1 ) = ⟨ϕ|Ta(2)a(1)a† (1 )a† (2 )|ϕ⟩ gegeben sind.
(34.59)
464 | 34 Wick’sches Theorem, Green’sche Funktionen und Erzeugendes Funktional
Die explizite Form der Green’schen Funktionen hängt natürlich vom HamiltonOperator H ab, der in die Definition der zeitabhängigen Feldoperatoren aH (t), a†H (t) eingeht, und von der Wahl des Zustands |ϕ⟩. Für Vielteilchensysteme sind vor allem die Green’schen Funktionen zum Grundzustand |ϕ⟩ von Interesse (der sich als Va kuum von Quasiteilchen interpretieren lässt, siehe Abschnitt 31.9.2), während in der Quantenfeldtheorie |ϕ⟩ das physikalische Teilchenvakuum darstellt.
34.2.3 Die Einteilchen-Green’sche Funktion Zur Illustration betrachten wir die Einteilchen-Green’sche Funktion (34.57) für ein System unabhängiger Teilchen. Bei Abwesenheit einer Wechselwirkung V = 0 sind die zeitabhängigen Feldoperatoren des Heisenberg- und des Wechselwirkungsbilds (34.43) identisch und mit der Definition des zeitgeordneten Produkts finden wir G(2, 1) = Θ(t2 − t1 )⟨ϕ|a(2)a† (1)|ϕ⟩ ± Θ(t1 − t2 )⟨ϕ|a† (1)a(2)|ϕ⟩ = G k2 k1 (t2 , t1 ) .
(34.60)
Ist der Einteilchen-Hamilton-Operator h (34.39) zeitunabhängig, so erhalten wir in der Basis (34.52), in der dieser diagonal ist, mit (34.53) G kl (t2 , t1 ) = e− ℏ ϵ k (t 2−t 0 ) e ℏ ϵ l (t 1−t 0 ) [Θ(t2 − t1 )⟨ϕ|a k a†l |ϕ⟩ ± Θ(t1 − t2 )⟨ϕ|a†l a k |ϕ⟩] . i
i
(34.61)
Ist |ϕ⟩ einer der Basis-Zustände (31.30), (31.53), so haben wir ⟨ϕ|a†l a k |ϕ⟩ = δ k,l n k , ⟨ϕ|a k a†l |ϕ⟩ = δ k,l (1 ± n k ) , wobei n k die Besetzungszahl des Einteilchen-Zustands |k⟩ in |ϕ⟩ ist. Die Green’sche Funktion (34.61) ist dann ebenfalls diagonal G kl (t2 , t1 ) = δ k,l G k (t2 , t1 ) , G k (t2 , t1 ) = e− ℏ ϵ k (t 2 −t 1) [Θ(t2 − t1 )(1 ± n k ) ± Θ(t1 − t2 )n k ] . i
Wie erwartet, hängt die Green’sche Funktion für einen zeitunabhängigen HamiltonOperator nur von Zeitdifferenzen ab. Es ist dann zweckmäßig, eine Fourier-Transfor mation bezüglich der Zeit vorzunehmen: G k (t2 , t1 ) = ∫
dω − i ω(t 2−t 1 ) G k (ω) . e ℏ 2π
Mit der Fourier-Darstellung der θ-Funktion (A.23), ∞
Θ(±x) = ± lim ∫ δ→0
−∞
dω e iωx/ℏ , 2πi ω ∓ iδ
(34.62)
34.2 Green’sche Funktionen |
465
haben wir ∞
G k (t2 , t1 ) = e
− ℏi ϵ k (t 2 −t 1 )
∫ −∞
dω − i ω(t 2 −t 1) 1 1 e ℏ ± nk [−(1 ± n k ) ] . 2πi ω + iδ ω − iδ
Verschieben wir die Integrationsvariable ω + ϵ k → ω, so finden wir G k (t2 , t1 ) = i ∫
dω − i ω(t 2−t 1) 1 ± nk nk lim [ e ℏ ∓ ] . 2π ω − ϵ k − iδ δ→0 ω − ϵ k + iδ
Der Vergleich mit (34.62) liefert − iG k (ω) = lim [ δ→0
1 ± nk nk ∓ ] . ω − ϵ k + iδ ω − ϵ k − iδ
(34.63)
Die Fourier-Transformierte der Green’schen Funktion besitzt Pole bei den Einteilchen energien ϵ k , die jedoch in die komplexe ω-Ebene unterhalb bzw. oberhalb der reellen Achse verschoben sind, siehe Abb. 34.1. Die Residuen dieser Pole sind durch die Be setzungszahlen n k gegeben. Für einen in |ϕ⟩ unbesetzten Einteilchenzustand, n k = 0, verschwindet der zweite Term in (34.63) und −iG k (ω) ist gerade die Green’sche Funk (+) tion eines einzelnen Teilchens, G0 (ω), die wir bereits in Gl. (23.57) kennengelernt haben. Für Fermi-Systeme verschwindet hingegen der erste Term in (34.63) für einen besetzten Zustand, n k = 1. Im ω
δ
×
Re ω ϵk ×
Abb. 34.1: Position (×) der Pole der Einteilchen-Green’schen Funktion (34.63) in der komplexen ω-Ebene.
34.2.4 Zeitabhängige Hartree-Fock-Theorie Differenzieren wir G(t, t1 ) (34.60) nach t, so finden wir unter Benutzung von (34.44) und (23.18), iℏ∂ t u kl (t, t1 ) = h km (t)u ml (t, t1 ) ,
466 | 34 Wick’sches Theorem, Green’sche Funktionen und Erzeugendes Funktional
die Beziehung iℏ∂ t G kl (t, t1 ) = h km (t)G ml (t, t1 ) + iℏδ(t − t1 )⟨ϕ|[a k (t), a†l (t1 )]∓ |ϕ⟩ . Aufgrund der δ-Funktion können wir das Zeitargument von a†l (t1 ) durch t ersetzen. Mit [a k (t), a†l (t)]∓ = [a k , a†l ]∓ = δ kl erhalten wir schließlich (iℏ∂ t δ km − h km (t)) G ml (t, t1 ) = iℏδ kl δ(t − t1 ) ,
(34.64)
was G(t2 , t1 ) in der Tat als Green’sche Funktion zur Schrödinger-Gleichung mit dem Hamilton-Operator h kl (t) qualifiziert. Bezüglich des zweiten Zeitarguments findet man mit iℏ∂ t u kl (t2 , t) = −u km (t2 , t)h ml (t) die hermitesch adjungierte Gleichung ←
G km (t2 , t) (−iℏ ∂ t δ ml − h ml (t)) = iℏδ kl δ(t2 − t) ,
(34.65)
←
wobei G ∂ t = ∂ t G. Es sind diese Bewegungsgleichungen, die den Namen „Green’sche Funktion“ für die Größen (34.58) rechtfertigen. Im Limes t2 → t1 liefert der zweite Term in (34.60) die (Einteilchen)-Dichtematrix (33.68) ρ lk (t) = ± lim G lk (t, t + ϵ) . ϵ→0
(34.66)
Hieraus finden wir für die Zeitableitung der Dichtematrix ±
d ρ(t) = lim ∂ t G(t, t1 ) + lim ∂ t G(t2 , t) . t 1 →t+0 t 2 →t−0 dt
Setzen wir auf der rechten Seite die Gln. (34.64) und (34.65) ein und benutzen aus schließlich (34.66), so erhalten wir die Bewegungsgleichung der Dichtematrix iℏρ̇ = [h, ρ] .
(34.67)
Wählen wir für h(t) den Hartree-Fock-Hamilton-Operator h[ρ] (32.82), der selbst von der Dichtematrix abhängt, so finden wir aus (34.67) die zeitabhängige Hartree-FockGleichung iℏρ̇ = [h[ρ], ρ] . (34.68) Diese Gleichung gestattet die Beschreibung von zeitabhängigen Prozessen in stark wechselwirkenden Systemen: Ist die Dichtematrix ρ(t) zu einem Anfangszeitpunkt t0 bekannt, kann sie für einen späteren Zeitpunkt t > t0 aus Gleichung (34.68) berech
34.3 Erzeugendes Funktional
|
467
net werden. Die zeitabhängige Hartree-Fock-Gleichung (34.64) wurde sehr erfolgreich auf die Beschreibung von Schwerionenreaktionen angewandt. In diesen Streuexperi menten werden zwei schwere Atomkerne, z. B. Uran oder Blei, aufeinander geschos sen. Dabei verschmelzen die Atomkerne (zumindest teilweise, je nach Einschuss geschwindigkeit) und fragmentieren anschließend. Aus der (Massen-, Energie- und Winkel-)Verteilung der entstehenden Reaktionsprodukte lassen sich Rückschlüsse über das Verhalten von Kernmaterie bei endlichen Temperaturen und Baryonendich ten ziehen.
34.3 Erzeugendes Funktional Um den Einfluss äußerer Felder zu untersuchen, die in der Zweiten Quantisierung durch Funktionen der Feldoperatoren gegeben sind, empfiehlt es sich, zum HamiltonOperator H(a† , a) des Vielteilchensystems Störterme linear in den Erzeugungs- und Vernichtungsoperatoren hinzuzufügen: Hη = H(a† , a) − ℏ(η∗ (t) ⋅ a + a† ⋅ η(t)) .
(34.69)
Hierbei sind η k (t), η ∗k (t) gewöhnliche Funktionen der Zeit für Bose-Systeme und zeit abhängige Graßmann-Variablen für Fermi-Systeme; aus Bequemlichkeitsgründen wurde ein Faktor ℏ eingeführt. Die Feldoperatoren a k , a†k können explizit von der Zeit abhängen (z. B. wenn eine zeitabhängige Einteilchenbasis verwendet wird), müssen dies aber nicht. Da die Zusatzterme in Hη ein Teilchen erzeugen bzw. vernichten, werden die Funktionen η k (t), η ∗k (t) als Quellen bezeichnet. Offensichtlich verletzen die Quellterme in Hη (34.69) die Teilchenzahlerhaltung [Hη , N] ≠ 0. Dies ist aber hier gewollt und kein prinzipielles Problem. Schließlich gibt es in der Natur Teilchenzahl-verletzende Prozesse, wie z. B. den β-Zerfall. Es ist ein wesentlicher Vorteil der Zweiten Quantisierung, dass sie Teilchenerzeugung und -ver nichtung beschreiben kann, was in der gewöhnlichen (ersten) Quantisierung proble matisch ist. Um den Einfluss der Quellterme zu erfassen, betrachten wir das Verhältnis der Übergangsamplitude bei Anwesenheit der Quellen zu der ungestörten Amplitude Z[η∗ , η] =
⟨ϕ f |Uη (t f , t i )|ϕ i ⟩ , ⟨ϕ f |Uη=0 (t f , t i )|ϕ i ⟩
(34.70)
wobei tf
[ i ] Uη (t i , t f ) = T exp [− ∫ dtHη (t)] ℏ ti [ ]
(34.71)
der Zeitentwicklungsoperator zum Hamilton-Operator Hη (34.69) bei Anwesenheit der Quellen ist.
468 | 34 Wick’sches Theorem, Green’sche Funktionen und Erzeugendes Funktional
34.3.1 Heisenberg-Bild Um den Einfluss der Quellterme von der Dynamik des ungestörten Systems zu sepa rieren, gehen wir zu einem Wechselwirkungsbild über, siehe Abschnitt 23.4, wobei wir die Quellterme als Störung des tatsächlichen („ungestörten“) Hamilton-Operators H betrachten, den wir als zeitunabhängig voraussetzen. Für verschwindende Quellen entspricht dies dem gewöhnlichen Heisenberg-Bild.⁷ Nach Gl. (23.34) gilt Uη (t, t ) = U(t, t0 )UH (t, t )U(t0 , t ) ,
(34.72)
wobei
i U(t f , t i ) = Uη=0 (t f , t i ) = exp [− H(t f − t i )] ℏ der Zeitentwicklungsoperator des „ungestörten“ Systems ist und
(34.73)
tf
[ ] UH (t f , t i ) = T exp [−i ∫ dt(η ∗ (t) ⋅ aH (t) + a†H (t) ⋅ η(t))] [
(34.74)
]
ti
aH (t), a†H (t)
die Feldoperatoren in der durch die Störung generiert wird. Hierin sind Heisenberg-Darstellung (34.38) zum ursprünglichen Hamilton-Operator H. Für einen Eigenzustand |ϕ⟩ des ungestörten Hamilton-Operators H(a† , a), H(a† , a)|ϕ⟩ = E|ϕ⟩ ,
(34.75)
gilt U(t2 , t1 )|ϕ⟩ = e− ℏ E(t 2−t 1) |ϕ⟩ . i
Mit |ϕ i ⟩ = |ϕ f ⟩ = |ϕ⟩ folgt dann nach Einsetzen von Gl. (34.72) in (34.70) unter der Voraussetzung, dass der Zustand |ϕ⟩ korrekt normiert ist, ⟨ϕ|ϕ⟩ = 1, Z[η ∗ , η] = ⟨ϕ|UH (t f , t i )|ϕ⟩ .
(34.76)
Für spätere Anwendungen schreiben wir diesen Ausdruck mittels Gl. (34.72) um zu Z[η ∗ , η] = ⟨ϕ|U(t0 , t f )Uη (t f , t i )U(t i , t0 )|ϕ⟩ .
(34.77)
Von besonderem Interesse sind die Prozesse, bei denen das System zur Zeit t i → −∞ im Grundzustand |ϕ i ⟩ = |ϕ⟩ präpariert ist, sich dann unter dem Einfluss äußerer Fel der in der Zeit entwickelt und schließlich nach unendlich langer Zeit t f → ∞ wieder in den Grundzustand |ϕ f ⟩ = |ϕ⟩ zurückkehrt: Z[η ∗ , η] = lim
lim ⟨ϕ|UH (t f , t i )|ϕ⟩
t f →∞ t i →−∞
∞
= ⟨ϕ|T exp [i ∫ dt(η ∗ (t)⋅aH (t) + a†H (t)⋅η(t))] |ϕ⟩ . ] [ −∞
(34.78)
7 Bei Abschalten der Störung geht das Wechselwirkungsbild in das Heisenberg-Bild des ungestörten Systems über, siehe Kapitel 23.
34.3 Erzeugendes Funktional
| 469
Dies ist das erzeugende Funktional der n-Teilchen-Green’schen Funktionen (34.58), die sich sämtlich durch Variation nach den Quellen, η, η∗ , gewinnen lassen, δ δ G(1, . . . , n; 1 , . . . , m ) = , ⋅ ⋅ ⋅ (± ) ⋅ ⋅ ⋅ Z[η∗ , η] ∗ η=0,η∗=0 iδη (1) iδη(1 ) wobei wir die kompakte Notation η(1) = η k1 (t1 ) benutzt haben und das obere (untere) Vorzeichen für Bose-(Fermi-)Systeme gilt. Falls der Zustand |ϕ⟩ eine wohl definierte Teilchenzahl besitzt, sind nur solche Green’sche Funktionen von null verschieden, die dieselbe Anzahl von Erzeugungs- und Vernichtungsoperatoren besitzen. Die einfachs te Green’sche Funktion ist dann die Einteilchen-Funktion (34.57). Für diese finden wir δ δ G(1, 2) = ± Z[η ∗ , η] . (34.79) ∗ η=0,η∗ =0 iδη (1) iδη(2) Die nächstkompliziertere ist die Zweiteilchen-Green’sche Funktion (34.59), die sich wie folgt darstellen lässt: δ δ δ δ ∗ Z[η G(1, 2; 1 , 2 ) = , η] . η=0,η∗=0 iδη∗ (1) iδη∗ (2) iδη(2 ) iδη(1 ) Die obigen Betrachtungen gelten natürlich auch in der Ortsdarstellung, in welcher das erzeugende Funktional (34.78) lautet: ∞
Z[η , η] = ⟨ϕ|T exp [i ∫ dt ∫ d3 x(η ∗ (x, t)ψH (x, t) + ψ†H (x, t)η(x, t))] |ϕ⟩ . [ −∞ ] ∗
34.3.2 Wechselwirkungsbild Im vorigen Abschnitt haben wir ein Wechselwirkungsbild benutzt, in welchem wir lediglich die Quellterme als Störung betrachtet haben. Dies führte auf zeitabhängi ge Operatoren, die im gewöhnlichen Heisenberg-Bild definiert sind. Wie bereits frü her bemerkt, sind die Feldoperatoren im Heisenberg-Bild (34.38) für wechselwirkende Vielteilchensysteme komplizierte n-Teilchen-Operatoren, wobei generisch auch Ter me mit n → ∞ auftreten, sodass dieses Bild für praktische Rechnungen wenig geeig net ist. Wir werden deshalb jetzt ein Wechselwirkungsbild benutzen, in welchem wir neben den Quelltermen auch die Zweiteilchenwechselwirkung V des vollen HamiltonOperators H (34.40) mit in die Störung einbeziehen und nur den Einteilchenoperator h (34.39) als „ungestörten“ Hamiltonian betrachten. Für den Zeitentwicklungsoperator (34.71) gilt nach Gl. (23.34) Uη (t, t ) = u(t, t0 )UW (t, t )u(t0 , t ) , η
wobei u(t2 , t1 ) in (34.42) definiert ist und t2
t2
i η UW (t2 , t1 ) = T exp [− ∫ dt V(t) + ∫ dt (η∗ (t) ⋅ a(t) + a† (t) ⋅ η(t))] ℏ t1 [ t1 ]
(34.80)
470 | 34 Wick’sches Theorem, Green’sche Funktionen und Erzeugendes Funktional
der Zeitentwicklungsoperator des Wechselwirkungsbilds ist. Hierin sind V(t) und a(t), a† (t) die durch Gl. (34.41) bzw. (34.43) definierten zeitabhängigen Operatoren des Wechselwirkungsbilds. Die Beziehung (34.80) gilt natürlich auch bei Abwesen heit der Quellen. Setzen wir in (34.80) die Quellen auf null, so finden wir U(t2 , t1 ) = u(t2 , t0 )UW (t2 , t1 )u(t0 , t1 ) ,
(34.81)
wobei U(t2 , t1 ) der Zeitentwicklungsoperator (34.73) des isolierten Systems ist, und η=0
UW (t2 , t1 ) = UW (t2 , t1 ) . Einsetzen von (34.80) und (34.81) in Gl. (34.77) liefert Z[η∗ , η] = ⟨ϕ|UW (t0 , t f )UW (t f , t i )UW (t i , t0 )|ϕ⟩ , η
(34.82)
wobei |ϕ⟩ nach Voraussetzung ein exakter Eigenzustand von H mit ⟨ϕ|ϕ⟩ = 1 ist. Mit Hilfe der Wellenfunktion im Wechselwirkungsbild (23.29), |ϕW (t)⟩ = UW (t, t0 )|ϕ⟩ , können wir Gl. (34.82) kompakt schreiben als Z[η ∗ , η] = ⟨ϕW (t f )|UW (t f , t i )|ϕW (t i )⟩ . η
(34.83)
Diese Darstellung ist vorteilhafter als das Heisenberg-Bild (34.76) für eine störungs theoretische Berücksichtigung der Restwechselwirkung V, da diese hier nicht in den zeitabhängigen Feldoperatoren enthalten ist. Mit (34.83) finden wir zum Beispiel aus (34.79) für die Einteilchen-Green’sche Funktion (34.57) tf
[ i ] G(1, 2) = ⟨ϕW (t f )|T (a k1 (t1 )a†k2 (t2 ) exp [− ∫ dt V(t)]) |ϕW (t i )⟩ . ℏ ti [ ] Taylor-Entwicklung des Exponenten nach Potenzen von V(t) ist Ausgangspunkt der störungstheoretischen Berechnung der Green’schen Funktionen.
34.3.3 Wick’sches Theorem für erzeugende Funktionale Die allgemeine Form (34.34) des Wick’schen Theorems gilt für zeitabhängige Feld operatoren a(t), a† (t), deren (Anti-)Kommutatoren c-Zahlen sind. Dies ist insbeson dere der Fall, wenn die Zeitabhängigkeit der Feldoperatoren durch einen Einteil chen-Hamilton-Operator h (34.39) beim Übergang zum Wechselwirkungsbild (34.43) induziert wurde. Dies werden wir im Folgenden voraussetzen. Die zeitabhängigen
34.3 Erzeugendes Funktional
| 471
Feldoperatoren sind dann Linearkombinationen (34.44) der zeitunabhängigen Ope ratoren und vernichten folglich das Vakuum |0⟩: a k (t)|0⟩ = o ,
⟨0|a†k (t) = o .
(34.84)
Der Vakuumerwartungswert eines normalgeordneten Produkts von einem Polynom von Erzeugungs- und Vernichtungsoperatoren verschwindet dann offensichtlich: ⟨0|:aa† ⋅ ⋅ ⋅ aa† ⋅ ⋅ ⋅ a† :|0⟩ = ⟨0|a† a† ⋅ ⋅ ⋅ a|0⟩ = 0 .
(34.85)
34.3.3.1 Vakuumerwartungswerte Nehmen wir den Vakuumerwartungswert von Gl. (34.35), so folgt wegen (34.85) a l (t)a †k (t ) = ⟨0|T (a l (t)a†k (t )) |0⟩ , womit die Kontraktionen als Vakuumerwartungswerte der zeitgeordneten Produkte der entsprechenden Paare von Feldoperatoren identifiziert sind. Bilden wir den Vakuumerwartungswert der Identität (34.34) und beachten, dass wegen (34.84), (34.85) tb
⟨0|: exp [∫ dt (η∗ (t)⋅a(t) + a† (t)⋅η(t)) ] :|0⟩ [t a ] tb
tb
= ⟨0| exp [∫ dta† (t) ⋅ η(t)] exp [∫ dtη∗ (t) ⋅ a(t)] |0⟩ [t a ] ] [t a = ⟨0|0⟩ = 1 , so erhalten wir: tb
⟨0|T exp [∫ dt (η∗ (t)⋅a(t) + a† (t)⋅η(t)) ] |0⟩ [t a ] tb
tb
= exp [∫ dt ∫ dt η∗l (t) a l (t)a †k (t )η k (t )] . ] [t a t a
(34.86)
Die linke Seite ist aber gerade das erzeugende Funktional für Vakuumerwartungswerte von zeitgeordneten Produkten von Feldoperatoren, eine Verallgemeinerung des in Ab schnitt 33.3 angegebenen erzeugenden Funktionals Z[η∗ , η] (33.70) für gewöhnliche Produkte von zeitunabhängigen Feldoperatoren. Durch Ableitung der linken Seite von (34.86) nach den Quellen η(t), η∗ (t) können wir die Vakuumserwartungswerte belie biger zeitgeordneter Produkte der Feldoperatoren gewinnen.
472 | 34 Wick’sches Theorem, Green’sche Funktionen und Erzeugendes Funktional
Wie wir in Abschnitt 31.9.2 gesehen haben, kann jede Slater-Determinante als Va kuumzustand von Quasiteilchenoperatoren interpretiert werden, die den gewöhnli chen Antikommutationsbeziehungen genügen. Gleichung (34.86) kann deshalb auch zur Berechnung von Erwartungswerten in beliebigen Zuständen unabhängiger Teil chen benutzt werden. 34.3.3.2 Matrixelemente in kohärenten Zuständen Wir bilden das Matrixelement der Identität (34.34) zwischen zwei kohärenten Zustän den ⟨α| und |β⟩. Der Exponent mit den Kontraktionen aa † ist eine c-Zahl und kann aus dem Matrixelement herausgezogen werden. Da im Normalprodukt die a† sämtlich links von den a stehen, lässt sich dessen Matrixelement sehr leicht unter Benutzung von Gln. (34.49), (34.50) nehmen: tb
⟨α|: exp [∫ dt (η∗ (t)⋅a(t) + a† (t)⋅η(t)) ] :|β⟩ ] [t a tb
= exp [∫ dt (η∗ (t)⋅β(t) + α ∗ (t)⋅η(t)) ] ⟨α|β⟩ , ]
[t a
wobei die Zeitabhängigkeit der Variablen α(t), β(t) durch (34.51) gegeben ist. Folglich erhalten wir aus (34.34) tb
⟨α|T exp [∫ dt (η∗ (t)⋅a(t) + a† (t)⋅η(t)) ] |β⟩/⟨α|β⟩ [t a
]
tb
= exp [∫ dt (η∗ (t)⋅β(t) + α ∗ (t)⋅η(t)) ] ] [t a tb
tb
exp [∫ dt ∫ dt (η∗ (t)⋅a(t)a † (t )⋅η(t ))] . ] [t a t a
(34.87)
Durch Ableiten nach den Quellen η(t), η ∗ (t) erhalten wir aus (34.87) ein Wick-Theorem für die Matrixelemente zwischen kohärenten Zuständen. Da die kohärenten Zustände eine (über-)vollständige Basis für den Fock-Raum bilden, können wir mittels (34.87) die Matrixelemente zwischen beliebigen Zuständen durch die Kontraktionen ausdrü cken. Für α = β = 0 reduziert sich (34.87) auf das Wick’sche Theorem (34.86) für Vaku umerwartungswerte. Bilden wir von der Beziehung (34.87) die Ableitung δη lδ(t ) δηδ∗ (t) k und setzen anschließend η = 0 = η∗ , so erhalten wir ⟨α|Ta k (t)a†l (t )|β⟩ = β k (t)α ∗l (t ) + a k (t)a †l (t ) . ⟨α|β⟩
34.3 Erzeugendes Funktional
|
473
Dieselbe Beziehung erhält man natürlich auch, indem man das Matrixelement ⟨α|⋅ ⋅ ⋅ |β⟩ von Gl. (34.35) nimmt. 34.3.3.3 Ensemble-Mittel Für die Beschreibung von Vielteilchensystemen bei endlichen Temperaturen benöti gen wir Ensemble-Mittelwerte (32.31) von Funktionen der Feldoperatoren: ⟨O(a† , a)⟩ =
Sp (e−K O(a† , a)) Sp e−K
.
(34.88)
Diese lassen sich ähnlich wie die Vakuumerwartungswerte elegant mittels des Wick’schen Theorems berechnen, falls K ein Einteilchenoperator ist. Für das groß kanonische Ensemble ist K in Gl. (32.36) definiert. Für wechselwirkende Systeme ist K = β(H − μN) jedoch kein Einteilchenoperator. Um das Wick’sche Theorem dennoch benutzen zu können, wird deshalb in vielen Anwendungen der volle Hamilton-Opera tor H in K durch einen effektiven Einteilchenoperator h (34.39) ersetzt, der z. B. durch Minimierung der freien Energie bestimmt wird, wie in Abschnitt 32.5 beschrieben. Die nachfolgenden Betrachtungen werden wir deshalb für K = β(h − μN)
(34.89)
durchführen. Wir nehmen jetzt das durch Gln. (34.88), (34.89) definierte Ensemble-Mittel von der Identität (34.34) (allgemeinste Form des Wick’schen Theorems). Dazu drücken wir die Spur mittels Gl. (33.92) durch die kohärenten Zustände aus Sp (e −K T(⋅ ⋅ ⋅ )) = ∫ dμ(ζ)⟨±ζ|T(⋅ ⋅ ⋅ )|e−K ζ⟩ . Für den Integranden benutzen wir jetzt Gl. (34.87), wo wir α = ±ζ und β = e−K ζ setzen und erhalten Sp (e−K T exp ∫ dt (η∗ (t)⋅a(t) + a† (t)⋅η(t))) = ∫ dμ(ζ)⟨±ζ|e −K ζ⟩ exp [∫ dt (η∗ (t)⋅(e−k ζ ) (t) ± ζ ∗ (t)⋅η(t))] tb
tb
exp [∫ dt ∫ dt η∗ (t)⋅a(t)a † (t )⋅η(t )] . [t a t a ]
(34.90)
Der letzte Exponent hängt nicht von den Integrationsvariablen ζ k , ζ k∗ ab. Mit dem Aus druck (33.56) für den Überlapp von zwei kohärenten Zuständen und der expliziten Zeitabhängigkeit (34.51) der klassischen Variablen ζ k (t) = u kl (t)ζ l , (e
−K
ζ ) k (t) = u kl (t) (e
−K
u(t) := u(t, t0 ) ζ )l
474 | 34 Wick’sches Theorem, Green’sche Funktionen und Erzeugendes Funktional
erhalten wir dann das Gauß-Integral ∫
dζ ∗ dζ exp [−ζ ∗ (1̂ ∓ e−K ) ζ + ∫ dt (η∗ (t)u(t)e −K ⋅ζ ± ζ ∗ ⋅u † (t)η(t))] (2πi)λ ∓1 −1 = det (1̂ ∓ e−K ) exp [± ∫ dtdt η∗ (t)u(t)e −K (1 ∓ e−K ) u † (t )η(t )] .
(34.91)
Die Determinante ist nach Gl. (33.95) gerade die Zustandssumme Sp exp(−K). Mit (34.91) und den expliziten Ausdrücken für die Kontraktionen (34.48) finden wir dann aus (34.90) ⟨T exp ∫ dt(η ∗ (t)⋅a(t) + a† (t)⋅η(t))⟩ = exp ∫ dtdt η∗ (t) ⋅ u(t) [±ρ + Θ(t − t )] u † (t )η(t ) ,
(34.92)
wobei ⟨. . . ⟩ auf der linken Seite das Ensemblemittel (34.88) bezeichnet. Ferner ha ben wir die Definition (33.97) des thermischen Dichteoperators ρ benutzt.⁸ Gleichung (34.92) ist die allgemeinste Form des Wick’schen Theorems für Ensemble-Mittel. Nach dieser Gleichung lassen sich die Ensemble-Mittel von zeitgeordneten Produkten der Feldoperatoren (34.44) vollständig durch die thermische Dichtematrix ρ und den Zeitentwicklungsoperator u(t) (34.45) ausdrücken. Da im rechten Exponenten η∗ stets gepaart mit η auftritt, verschwinden alle thermischen Erwartungswerte (Ensem ble-Mittel) von Produkten von Feldoperatoren mit einer ungleichen Zahl von a- und a† - Operatoren. Dies ist Ausdruck der Teilchenzahlerhaltung. Im großkanonischen Ensemble treten zwar beliebige Teilchenzahlen auf, jedoch hat jeder Zustand des Fock-Raums eine feste Teilchenzahl. Für zeitunabhängige Feldoperatoren benutzen wir die Zeitabhängigkeit der Quel len η(t), η ∗ (t) nur als Label, um eine vorgegebene Reihenfolge der Feldoperatoren mittels des zeitgeordneten Produkts zu gewährleisten. In diesem Fall ist u(t) = 1 und Gl. (34.92) vereinfacht sich zu ⟨T exp ∫ dt (η∗ (t)⋅a + a† ⋅η(t))⟩ = exp ∫ dtdt η∗ (t) [±ρ + Θ(t − t )] η(t ) .
(34.93)
Die Ensemble-Mittel der Produkte von Feldoperatoren lassen sich dann allein durch die thermische Dichtematrix ρ (33.97) ausdrücken. Durch Ableitung nach den Quellen
8 Wir erinnern daran, dass die hier auftretenden Größen Vektoren η k bzw. Matrizen u kl , ρ kl in der Basis der Einteilchen-Zustände sind, wir aber Indizes, über die summiert wird, nicht angeben.
34.3 Erzeugendes Funktional
|
475
η, η∗ in Gl. (34.93) lassen sich die gewünschten Erwartungswerte der Feldoperatoren erzeugen. Gleichung (34.93) ist deshalb das erzeugende Funktional für Ensemble-Mit tel (34.88), für welche der Dichteoperator exp(−K) durch den Exponent des Einteil chenoperators K (34.89) gegeben ist. Wählen wir in Gl. (34.93) die Zeitabhängigkeit der Quellen in der Form η(t) = δ(t − ε)η ,
η ∗ (t) = δ(t + ε)η ∗
mit ε > 0, so werden im zeitgeordneten Produkt die a† links der a angeordnet, T exp ∫ dt (η ∗ (t)⋅a + a† ⋅η(t)) = exp(a† ⋅η) exp (η∗ ⋅a) , was gerade das Normalprodukt liefert, während sich der Exponent auf der rechten Seite zu ∫ dt ∫ dt η∗ (t) [±ρ + Θ(t − t )] η(t ) = ±η∗ ρη vereinfacht, sodass wir die Beziehung ⟨exp(a† ⋅η) exp(η ∗ ⋅a)⟩ = exp [±η ∗ ρη]
(34.94)
erhalten, die wir bereits in (33.96) gefunden haben. Zur Illustration der Nützlichkeit des Wick’schen Theorems in der Form des erzeu genden Funktionals berechnen wir aus (34.93) einige (thermische) Erwartungswer te, die wir in früheren Betrachtungen benötigten. Bilden wir die Ableitung⁹ lim
ε→0
δ δ δη l (t + ε) δη∗k (t)
und setzen anschließend η = 0 = η ∗ , so erhalten wir ⟨a†l a k ⟩ = ρ kl .
(34.95)
Aus der Ableitung lim
ε→0
δ δ δη l (t − ε) δη∗k (t)
finden wir hingegen ⟨a k a†l ⟩ = δ kl ± ρ kl . Schließlich betrachten wir noch die Ableitung lim
ε→0
δ δ δ δ , δη k (t + 3ε) δη l (t + 2ε) δη∗m (t + ε) δη∗n (t)
9 Der Limes ϵ → 0 darf erst genommen werden, nachdem sämtliche Ableitungen nach den Quellen η, η ∗ ausgeführt wurden.
476 | 34 Wick’sches Theorem, Green’sche Funktionen und Erzeugendes Funktional
welche auf ⟨a†k a†l a m a n ⟩ = ρ ml ρ nk ± ρ mk ρ nl
(34.96)
führt. In analoger Weise findet man in der Ortsdarstellung der Feldoperatoren ⟨ψ† (y)ψ(x)⟩ = ρ(x, y) ⟨ψ† (y1 )ψ† (y2 )ψ(x2 )ψ(x1 )⟩ = ρ(x2 , y2 )ρ(x1 , y1 ) ± ρ(x2 , y1 )ρ(x1 , y2 ) .
(34.97)
Die Erwartungswerte (34.95), (34.96) lassen sich natürlich einfacher aus Gl. (34.94) berechnen.
35 Pfadintegralquantisierung von Vielteilchensystemen In Band 1 haben wir ausgehend vom Doppelspaltexperiment die Quantenmechanik aus dem Prinzip der Summation über interferierende Alternativen gewonnen. Die ses Prinzip führte auf die Pfad- oder Funktionalintegraldarstellung der Übergangs amplitude, aus der wir die Schrödinger-Gleichung abgeleitet haben. Dieser Zugang besitzt zweifelsohne konzeptionelle Vorzüge. Für konkrete Probleme eines Punktteil chens ist jedoch die Lösung der Schrödinger-Gleichung im Allgemeinen wesentlich einfacher als die explizite Berechnung des zugehörigen Pfadintegrals. Als Beispiel vergleiche man etwa die Pfadintegralbehandlung des unendlich hohen Potenzial topfs in Abschnitt 6.2 mit der Lösung der zugehörigen Schrödinger-Gleichung in Ab schnitt 8.5. Der Pfadintegralzugang entfaltet seine Vorzüge erst bei der Beschreibung von komplexeren Systemen wie Vielteilchensystemen oder in der Quantenfeldtheo rie. Numerische Behandlungen von Quantenfeldtheorien erfolgen gewöhnlich unter Benutzung der Pfadintegralformulierung. Diese ist insbesondere die Grundlage für die sogenannten Gitterrechnungen in den Eichtheorien. Auch die Störungstheorie in der Quantenfeldtheorie lässt sich am bequemsten und elegantesten im Rahmen der Pfadintegralbeschreibung formulieren. In der Quantenfeldtheorie, aber auch in der Vielteilchenphysik, gehört die Pfadintegralbeschreibung zum wichtigsten Handwerk zeug und ihre Kenntnis ist für Theoretiker absolut notwendig. Wir werden deshalb in diesem Kapitel die Pfadintegralformulierung von Vielteilchensystemen ableiten. Da zu werden wir die im Kapitel 33 behandelten kohärenten Zustände benutzen. Aus der Pfadintegralformulierung der Vielteilchensysteme ergibt sich dann zwangsläufig die Pfadintegraldarstellung der Quantenfeldtheorie, denn ein Quantenfeld ist nichts ande res als ein Vielteilchensystem, das aus unendlich vielen realen oder virtuellen Teilchen besteht. Im Kapitel 7 (Band 1) haben wir aus der Pfadintegraldarstellung (3.36) der Über gangsamplitude K(x, t; x , t ) die (zeitabhängige) Schrödinger-Gleichung abgeleitet. Im Abschnitt 23.2 haben wir festgestellt, dass die quantenmechanische Übergangs amplitude gerade durch das Matrixelement ⟨x|U(t, t )|x ⟩ des Zeitentwicklungsope rators U(t, t ) gegeben ist, der eine formale Lösung der Schrödinger-Gleichung re präsentiert. Wir wollen jetzt den umgekehrten Weg beschreiten und bei gegebenem Hamilton-Operator eine Funktionalintegraldarstellung für die Matrixelemente des Zeitentwicklungsoperators für Systeme aus identischen Teilchen ableiten. Dazu wer den wir zweckmäßigerweise die Zweite Quantisierung benutzen und den Fock-Raum durch kohärente Zustände darstellen. Wir können die Ableitung gleichzeitig für Boseund Fermi-Systeme durchführen, da sowohl der Hamilton-Operator als auch die ko härenten Zustände für beide Arten von Systemen formal übereinstimmen. Um die formalen Manipulationen nicht durch Indizes unnötig zu verkomplizieren, werden wir nachfolgend die Einteilchenindizes gewöhnlich unterdrücken. Formal entspricht https://doi.org/10.1515/9783110586077-013
478 | 35 Pfadintegralquantisierung von Vielteilchensystemen
das der Behandlung von Systemen, in welchen die identischen Teilchen nur in einem einzigen Einteilchenzustand existieren können (harmonischer oder fermionischer Oszillator). Die Verallgemeinerung auf beliebig viele Einteilchenzustände, d. h. die Wiederherstellung der Einteilchenindizes, wird jedoch trivial sein.
35.1 Pfadintegraldarstellung der Übergangsamplitude Wir betrachten ein beliebiges Matrixelement des Zeitentwicklungsoperators U(t f , t i ) zwischen zwei Zuständen |ϕ i ⟩ und ⟨ϕ f |. Unter Benutzung der Vollständigkeitsrelation (33.8), (33.48) der kohärenten Zustände 1̂ = ∫dμ(ζ) |ζ⟩⟨ζ|
(35.1)
können wir dies in der Form ⟨ϕ f |U(t f , t i ) |ϕ i ⟩ = ∫dμ(ζ f ) ∫dμ(ζ i ) ⟨ϕ f |ζ f ⟩⟨ζ f |U (t f , t i ) |ζ i ⟩⟨ζ i |ϕ i ⟩ ̄ f (ζ f )⟨ζ f |U (t f , t i ) |ζ i ⟩ϕ i (ζ ∗ ) = ∫dμ(ζ f )dμ(ζ i ) ϕ i
(35.2)
schreiben. Hieraus ist ersichtlich, dass es ausreichend ist, Matrixelemente von U(t f , t i ) in der Basis der kohärenten Zustände zu betrachten.
35.1.1 Ableitung des Pfadintegrals Zur Ableitung einer Funktionalintegraldarstellung für die Matrixelemente des Zeitent wicklungsoperators ⟨ζ f |U(t f , t i )|ζ i ⟩ zerlegen wir das Zeitintervall in infinitesimale Ab schnitte der Längen ε t f − t i = Nε , t k = t i + kε (35.3) und benutzen für den Zeitentwicklungsoperator (23.17) die Darstellung (23.16) tf
i U(t f , t i ) = T exp (− ∫dt H(t)) ℏ ti
=e
− ℏi εH(t N−1 ) N−1
⋅ ⋅ ⋅ e− ℏ εH(t 1 ) e− ℏ εH(t 0) i
i
≡ T ∏ e− ℏ εH(t k ) i
k=0 N
≡ T ∏ e− ℏ εH(t k −ε) , i
k=1
die auch für zeitabhängige Hamilton-Operatoren (im Limes ε → 0) gültig ist. Hierbei wurde für das Riemann-Integral im Exponenten die sogenannte Untersumme verwen det, in welcher der Integrand jeweils am unteren Ende der Zeitintervalle ε = t k − t k−1
35.1 Pfadintegraldarstellung der Übergangsamplitude | 479
genommen wird. Benutzt man stattdessen die Obersumme, in welcher der Integrand jeweils am oberen Ende der Zeitintervalle ε = t k − t k−1 genommen wird, erhält man N
U(t f , t i ) = T ∏ e− ℏ εH(t k ) . i
k=1
Im Limes ε → 0 liefert die Ober- und Untersumme dasselbe Riemann-Integral. Für endliche ε erhält man eine bessere Approximation als die Ober- und Untersumme, wenn der Integrand jeweils in der Mitte des Zeitintervalls ε = t k − t k−1 genommen wird, N
U(t f , t i ) = T ∏ e− ℏ εH(t k − 2 ) , i
ε
(35.4)
k=1
was als Mittelpunktsvorschrift bezeichnet wird. Diese werden wir im Folgenden benut zen.¹ Ohne Beschränkung der Allgemeinheit können wir jetzt voraussetzen, dass der Hamilton-Operator in der Zweiten Quantisierung H(t) ≡ H(a† , a; t) normalgeordnet ist, d. h., sämtliche Erzeugungsoperatoren a† stehen links von den Vernichtungsope ratoren a. Für infinitesimale ε → 0 können wir dann jeden Exponentialfaktor durch sein normalgeordnetes Produkt ersetzen e− ℏ εH(t k − 2 ) → :e− ℏ εH(t k − 2 ) : . i
ε
i
ε
Durch Taylor-Entwicklung des Exponenten erkennt man sofort, dass die nicht normal geordneten Terme, die in dem ursprünglichen Ausdruck exp(− ℏi εH(t k − 2ε )) enthalten sind, von der Ordnung O(ε2 ) sind (bzw. nach Summation über k von der Ordnung O(ε)) und somit im Limes ε → 0 wegfallen. Zur Vereinfachung der Notation setzen wir hier voraus, dass die Erzeugungs- und Vernichtungsopera toren a† , a zeitunabhängig sind, d. h. bezüglich einer zeitunabhängigen Einteilchenbasis |l⟩ definiert sind, |l⟩ = a†l |0⟩. Man überzeugt sich jedoch leicht, dass die nachfolgenden Betrachtungen auch für explizit zeitabhängige Operatoren a†l (t), a l (t) gelten.
Schieben wir in Gl. (35.4) zwischen zwei aufeinanderfolgende Exponenten e− ℏ εH(t k + 2 ) i
ε
und
e− ℏ εH(t k − 2 ) i
ε
jeweils eine Vollständigkeitsrelation (35.1) 1̂ = ∫ dμ(ζ k )|ζ k ⟩⟨ζ k |
1 Im Abschnitt 22.2 wurde gezeigt, dass die Mittelpunktsvorschrift bei Anwesenheit von Eichfeldern erforderlich ist, um die Eichinvarianz auch in der diskretisierten Form der klassischen Wirkung auf rechtzuerhalten. Da wir die unten abgeleitete Funktionalintegraldarstellung im Abschnitt 35.5 auf die Eichtheorien anwenden wollen, empfiehlt es sich, von vornherein die Mittelpunktsvorschrift zu be nutzen.
480 | 35 Pfadintegralquantisierung von Vielteilchensystemen
der kohärenten Zustände ein, so finden wir für das Matrixelement des Zeitentwick lungsoperators (35.2): i ε ⟨ζ f |U(t f , t i ) |ζ i ⟩ = ∫dμ(ζ N−1 )⋅ ⋅ ⋅ dμ(ζ1 ) ⟨ζ f |: exp (− εH (a† , a; t f − )) :|ζ N−1 ⟩ ℏ 2 i ε ⟨ζ N−1 |: exp [− ε H (a† , a; t N−1 − )] :|ζ N−2 ⟩⋅ ⋅ ⋅ ℏ 2 i ε ⋅ ⋅ ⋅ ⟨ζ1 |: exp (− εH (a† , a; t1 − )) :|ζ i ⟩ ℏ 2 N−1
= ∫ ( ∏ dμ(ζ k )) k=1 N
i ε ∏⟨ζ k |: exp (− εH (a† , a; t k − )) :|ζ k−1 ⟩ . ℏ 2 k=1
(35.5)
Im letzten Schritt haben wir ⟨ζ N | := ⟨ζ f | ,
|ζ0 ⟩ := |ζ i ⟩
(35.6)
gesetzt. Diese Notation ist konsistent mit Gl. (35.3), wonach t f = t N und t i = t0 . Da |ζ⟩ nur von ζ , ⟨ζ| nur von ζ ∗ abhängt, sind die Beziehungen (35.6) äquivalent zu ζ N∗ := ζ f∗ ,
ζ0 := ζ i .
(35.7)
Unter Benutzung von Gl. (33.14) bzw. (33.44) finden wir für die Matrixelemente der infinitesimalen Zeitentwicklungsoperatoren i ε i ε ⟨ζ k |: exp (− εH(a† , a; t k − )) :|ζ k−1 ⟩ = ⟨ζ k |ζ k−1 ⟩ exp (− εH(ζ k∗ , ζ k−1 ; t k − )) , ℏ 2 ℏ 2 womit wir aus (35.5) N−1 N i ε ⟨ζ f |U(t f , t i ) |ζ i ⟩ = ∫ ∏ dμ(ζ k ) ∏⟨ζ k |ζ k−1 ⟩ exp [− εH(ζ k∗ , ζ k−1 ; t k − )] ℏ 2 k=1 k=1
erhalten. Unter Benutzung des expliziten Ausdrucks (33.56) der Überlappintegrale ⟨ζ k |ζ k−1 ⟩ können wir diese umschreiben zu ⟨ζ k |ζ k−1 ⟩ = exp [ζ k∗ ζ k−1 ] = exp [ζ k∗ (ζ k − (ζ k − ζ k−1 ))] = ⟨ζ k |ζ k ⟩ exp [−ζ k∗ (ζ k − ζ k−1 )]
(35.8)
35.1 Pfadintegraldarstellung der Übergangsamplitude |
481
und finden N−1
⟨ζ f |U(t f , t i ) |ζ i ⟩ = ⟨ζ f |ζ f ⟩ ∫ ∏ dμ(ζ k ) ⟨ζ k |ζ k ⟩ k=1
i N ζ k − ζ k−1 ε − H(ζ k∗ , ζ k−1 ; t k − )]} . exp { ε ∑ [ζ k∗ iℏ ℏ k=1 ε 2
(35.9)
Diese Integraldarstellung der Übergangsamplitude ist exakt im Limes ε → 0.
35.1.2 Der Kontinuum-Limes: Glatte Pfade Die Darstellung (35.9) der Übergangsamplitude ist jedoch noch nicht sehr bequem (außer für numerische Rechnungen). Wir können jetzt jedoch die ζ k als Werte einer Trajektorie ζ(t) im Raum der komplexen Zahlen bzw. der Graßmann-Variablen zur Zeit t k + ε/2 interpretieren, sodass ζ k = ζ (t k +
ε ) , 2
ζ k∗ = ζ ∗ (t k −
ε ) 2
(35.10)
gilt. Wegen (35.7) und ζ N∗ = ζ ∗ (t N −
ε ε ) ≡ ζ ∗ (t f − ) , 2 2
ζ0 = ζ (t0 +
ε ε ) ≡ ζ (t i + ) 2 2
genügen diese Trajektorien im Limes ε → 0 den Randbedingungen ζ ∗ (t f ) = ζ f∗ ,
ζ(t i ) = ζ i .
(35.11)
Ferner wird im Limes ε → 0 (N → ∞) aus der Summe im Exponenten von Gl. (35.9) ein gewöhnliches Riemann-Integral über die Zeit. Dabei erhalten wir im ersten Term des Exponenten ζ (t k + 2ε ) − ζ (t k−1 + 2ε ) ζ k − ζ k−1 = lim ε→0 ε→0 ε ε lim
ζ (t k + 2ε ) − ζ (t k − 2ε ) ε = ζ ̇ (t k ) = lim ζ ̇ (t k − ) , ε→0 ε→0 ε 2
= lim sodass N
lim ε ∑
ε→0
k=1
ζk ζ k∗
tf
N − ζ k−1 ε ε = lim ε ∑ ζ ∗ (t k − ) ζ ̇ (t k − ) = ∫ dt ζ ∗ (t)ζ ̇ (t) . ε→0 ε 2 2 k=1 ti
(35.12)
482 | 35 Pfadintegralquantisierung von Vielteilchensystemen
Der zweite Term im Exponenten von (35.9) liefert in diesem Limes N
lim ε ∑ H(ζ k∗ , ζ k−1 ; t k −
ε→0
k=1
N ε ε ε ε )) = lim ε ∑ H(ζ ∗ (t k − ) , ζ (t k − ) ; t k − ) ε→0 2 2 2 2 k=1 tf
= ∫ dt H(ζ ∗ (t), ζ(t); t) . ti
Per Konstruktion können wir die in Gl. (35.10) definierten Trajektorien ζ(t) als stetig voraussetzen. Die meisten Trajektorien sind jedoch „gezackt“, d. h. nicht überall dif ferenzierbar, sodass der Limes in (35.12) für diese Trajektorien nicht existiert. Nachfol gend werden wir jedoch annehmen, dass die dominanten Beiträge zur Übergangsam plitude von den glatten Trajektorien ζ(t) kommen und den Limes ε → 0 nehmen.² Für die Übergangsamplitude zwischen den kohärenten Zuständen erhalten wir dann die Funktionalintegraldarstellung i ⟨ζ f |U(t f , t i ) |ζ i ⟩ = ∫ D (ζ ∗ , ζ ) exp { S [ζ ∗ , ζ ](ζ f , ζ i )} ℏ
(35.13)
mit der Wirkung tf
S [ζ ∗ , ζ ](ζ f∗ , ζ i ) = ∫dt [iℏζ ∗ (t)ζ ̇ (t) − H(ζ ∗ , ζ; t)] − iℏζ f∗ ζ f
(35.14)
ti
und dem Funktionalintegrationsmaß N−1
N−1
k=1
k=1
D (ζ ∗ , ζ ) = ∏ dμ (ζ k ) ⟨ζ k |ζ k ⟩ = ∏
dζ ∗ (t k )dζ(t k ) dζ ∗ (t)dζ(t) =: ∏ , C C t
(35.15)
wobei {1 , Fermi-Systeme, C={ 2πi , Bose-Systeme. { Für die komplexen Bose-Variablen gilt außerdem d Re(ζ)d Im(ζ) dζ ∗ dζ = . 2πi π
(35.16)
2 Obwohl fast alle Trajektorien nicht differenzierbar sind, kommen dennoch die dominanten Beiträge zum Funktionalintegral von den „glatten“ Trajektorien, da nur diese eine endliche Wirkung besitzen. Die Dominanz der glatten Trajektorien tritt unmittelbar in der semiklassischen Näherung zutage. Den Einfluss der „gezackten“ Trajektorien werden wir in Abschnitt 35.3 untersuchen.
35.1 Pfadintegraldarstellung der Übergangsamplitude | 483
Die Trajektorien ζ(t), über die im Funktionalintegral (35.13) integriert wird, müssen per Konstruktion den Randbedingungen (35.11) genügen. Die äußeren kohärenten Zustände |ζ i ⟩ bzw. ⟨ζ f | hängen von den Variablen ζ i bzw. ζ f∗ , jedoch nicht von ζ i∗ oder ζ f ab. Dementsprechend kann auch das Matrixelement ⟨ζ f |U(t f , t i )|ζ i ⟩ nur von ζ f∗ und ζ i , aber nicht von ζ f oder ζ i∗ abhängen. Die Randbedingungen (35.11) enthalten in der Tat nur ζ f∗ und ζ i . In der Wirkung (35.14) tritt jedoch explizit die Variable ζ f auf. Die scheinbare Abhängigkeit der Wirkung (35.14) von ζ f ist durch die Umformung (35.8) des Terms mit k = N entstanden. Der Überlapp ⟨ζ N |ζ N−1 ⟩ = ⟨ζ f |ζ N−1 ⟩ hängt in der Tat nur von ζ f∗ (und ζ N−1 ), nicht aber von ζ f = ζ N ab. Da (35.8) eine identische Umformung ist, muss sich die scheinbare ζ f -Abhängigkeit auch in dem Endergebnis (35.14) herauskürzen. Dies erkennt man sofort, wenn man den ersten Term partiell integriert tf
S[ζ
∗
, ζ](ζ f∗ , ζ i )
= ∫ dt [−iℏ ζ̇ ∗ (t)ζ(t) − H(ζ ∗ , ζ; t) − iℏζ i∗ ζ i ] .
(35.17)
ti
Die Variable ζ f tritt jetzt nicht mehr in der Wirkung auf, dafür haben wir uns aber eine (scheinbare) ζ i∗ -Abhängigkeit eingehandelt, die jedoch wieder durch den ersten Term in (35.17) kompensiert wird, wie die Darstellung (35.14) zeigt.
Die beiden äquivalenten Formen der Wirkung (35.14) und (35.17) sind offensichtlich nicht symmetrisch in den Variablen des Anfangs- und Endzustands, ζ i und ζ f . Die se Symmetrie lässt sich jedoch leicht herstellen, indem man das arithmetische Mittel dieser beiden äquivalenten Formen benutzt, was auf den Ausdruck S[ζ ∗ , ζ] (ζ f∗ , ζ i ) tf
= ∫dt [
iℏ ∗ 1 (ζ (t)ζ ̇ (t) − ζ ̇ ∗ (t)ζ(t)) − H (ζ ∗ , ζ; t)] − iℏ (ζ f∗ ζ f + ζ i∗ ζ i ) 2 2
(35.18)
ti
führt, der offensichtlich symmetrisch in den Variablen des Anfangs- und Endzustands ist. Gleichungen (35.11), (35.13), (35.15) und (35.18) liefern die gesuchte Funktionalin tegraldarstellung der quantenmechanischen Übergangsamplitude von Systemen aus identischen Teilchen. Die Funktionalintegration erstreckt sich dabei über Trajektorien ζ(t) im Raum der komplexen Zahlen bzw. Graßmann-Variablen für Bose- bzw. FermiSysteme. Die Funktionalintegraldarstellung (35.13) gilt für beliebige Systeme, die in der Zweiten Quantisierung durch die Feldoperatoren a† , a des Fock-Raums beschrie ben werden. Bei der Ableitung der Funktionalintegraldarstellung wurden keine ein schränkenden Voraussetzungen über die Form des Hamilton-Operators H(a† , a; t) ge macht. Es wurde lediglich vorausgesetzt, dass dieser normalgeordnet ist, was jedoch keine Einschränkung ist, da jeder Operator in der Zweiten Quantisierung durch Be nutzung der (Anti-)Kommutationsbeziehungen der Feldoperatoren in normalgeord nete Form gebracht werden kann. Die oben abgeleitete Funktionalintegraldarstellung
484 | 35 Pfadintegralquantisierung von Vielteilchensystemen
bleibt deshalb auch in der relativistischen Quantenfeldtheorie gültig. Sie gilt auch, wenn die Feldoperatoren in H(a† , a) explizit von der Zeit abhängen, wie wir bereits einleitend bemerkt haben. Sämtliche oben angegebenen Beziehungen gelten auch für Systeme mit einer be liebigen Anzahl von Einteilchenzuständen. Charakterisieren wir die Einteilchenzu stände durch einen Index l, so haben wir dann in expliziter Form ζ ∗ (t)ζ ̇ (t) = ∑ ζ l∗ (t)ζ l̇ (t) , l
dζ ∗ (t)dζ l (t) dζ ∗ (t)dζ(t) =∏ l . C C l Schließlich wollen wir die Funktionalintegraldarstellung explizit für die Standard form des Hamilton-Operators in der Ortsdarstellung der Feldoperatoren, ψ† (x), ψ(x), angeben. Unter Benutzung von Gl. (33.55) finden wir für den Hamilton-Operator (31.90) die klassische Wirkung (35.18) S[ζ ∗ , ζ](ζ f , ζ i ) i = − ℏ ∫ d3 x [ζ f∗ (x)ζ f (x) + ζ i∗ (x)ζ i (x)] 2 tf
+ ∫ dt ∫ d3 x [
iℏ ∗ (ζ (x, t)∂ t ζ(x, t) − (∂ t ζ ∗ (x, t)) ζ(x, t)) − H(ζ ∗ , ζ)] , 2
(35.19)
ti
wobei sich H(ζ ∗ , ζ) aus H(ψ† , ψ) durch Ersetzen der Feldoperatoren ψ† , ψ durch die klassischen Felder ζ ∗ (x, t), ζ(x, t) ergibt: H(ζ ∗ , ζ) = ∫ d3 xd3 x ζ ∗ (x, t)H0 (x, x )ζ(x , t) +
1 ∫ d3 xd3 x ζ ∗ (x, t)ζ ∗ (x , t)V(x, x )ζ(x , t)ζ(x, t) . 2
(35.20)
Die Funktionalintegration (35.15) ∫ D(ζ ∗ , ζ) ⋅ ⋅ ⋅ = ∫ ∏ ∏ t
x
dζ ∗ (x, t)dζ(x, t) ⋅⋅⋅ C
(35.21)
in der Übergangsamplitude (35.13) ⟨ζ f |U(t f , t i )|ζ i ⟩ erstreckt sich jetzt über alle (klassi schen) Felder ζ(x, t), ζ ∗ (x, t), die den Randbedingungen (35.11) ζ ∗ (x, t f ) = ζ f∗ (x) ,
ζ(x, t i ) = ζ i (x)
genügen. Gleichung (35.13) liefert mit (35.19), (35.20) und (35.21) die Funktionalinte gralbeschreibung in der Ortsdarstellung. Diese wird gewöhnlich in der relativistischen Quantenfeldtheorie verwendet.
35.2 Pfadintegraldarstellung der großkanonischen Zustandssumme |
485
35.2 Pfadintegraldarstellung der großkanonischen Zustandssumme Wir wenden jetzt Gl. (33.86) auf den Zeitentwicklungsoperator an: Sp U(t f , t i ) = ∫ dμ(ζ)⟨±ζ|U(t f , t i )|ζ⟩ .
(35.22)
Für das hier auftretende Matrixelement des Zeitentwicklungsoperators zwischen den kohärenten Zuständen können wir jetzt die oben abgeleitete Funktionalintegraldar stellung, Gl. (35.13), benutzen. Dazu müssen wir dort ζ f = ±ζ ,
ζi = ζ
(35.23)
setzen. Der Zusatzterm −iℏζ f∗ ζ f = −iℏζ ∗ ζ in der Wirkung (35.14) kürzt sich dann ge gen den Exponentialfaktor im Integrationsmaß dμ(ζ), siehe z. B. Gl. (33.33), und wir erhalten die folgende Funktionalintegraldarstellung: i Sp U(t f , t i ) = ∫ D (ζ ∗ , ζ ) exp { S [ζ ∗ , ζ ]} . ℏ
(35.24)
Hierbei ist die Wirkung jetzt durch tf
S [ζ , ζ ] = ∫dt [iℏζ ∗ (t)ζ ̇ (t) − H (ζ ∗ , ζ )] ∗
(35.25)
ti
gegeben. Das Funktionalintegrationsmaß ist analog zur Gleichung (35.15) definiert, N
D (ζ ∗ , ζ ) = ∏ k=1
dζ ∗ (t k )dζ(t k ) dζ ∗ (t)dζ(t) =: ∏ , C C t
enthält aber jetzt auch die Integration über die Variablen an der Endzeit t f . Ferner erstreckt sich die Funktionalintegration in (35.24) wegen (35.23) und (35.11) über peri odische bzw. antiperiodische Trajektorien ζ(t) für Bose- bzw. Fermi-Systeme ζ(t f ) = ±ζ(t i ) .
(35.26)
Wir betrachten jetzt den Fall, dass der Hamilton-Operator nicht explizit von der Zeit abhängt. In diesem Fall ist der Zeitentwicklungsoperator durch Gl. (23.13) gegeben und hängt nur von der Zeitdifferenz t f −t i =: T ab. Wir können deshalb ohne Beschränkung der Allgemeinheit t i = −T/2 und t f = T/2 setzen. Aus Gl. (35.24) erhalten wir dann die Beziehung Sp (e− ℏ TH ) = i
∫ ζ(T/2)=±ζ(−T/2)
i D (ζ ∗ , ζ ) exp ( S[ζ ∗ , ζ]) . ℏ
(35.27)
486 | 35 Pfadintegralquantisierung von Vielteilchensystemen
Wir haben hier explizit am Integralzeichen die Randbedingungen (35.26) an die Tra jektorien ζ(t) angegeben. Setzen wir in (35.27) jetzt die Zeit zu imaginären Werten fort. t = −iℏτ ,
τ=
i t, ℏ
(35.28)
und setzen außerdem
i T =: β , (35.29) ℏ so erhalten wir aus Gl. (35.27) die Funktionalintegraldarstellung der großkanonischen Zustandssumme (32.28) für μ = 0 Z(β) = Sp (e−βH ) =
D (ζ ∗ , ζ ) e−S E [ζ
∫
∗
,ζ]
,
(35.30)
ζ(β/2)=±ζ(−β/2)
wobei die hier auftretende Wirkung durch analytische Fortsetzung der Zeit, Gl. (35.28), aus (35.25) folgt: β/2
S E [ζ ∗ , ζ] = ∫ dτ [ζ ∗ (τ)∂ τ ζ(τ) + H(ζ ∗ , ζ)] . −β/2
Ferner erstreckt sich die Funktionalintegration wieder über periodische bzw. anti periodische Trajektorien in der imaginären Zeit, ζ(β/2) = ±ζ(−β/2) . Gleichung (35.30) liefert die großkanonische Zustandssumme nur für ein verschwin dendes chemisches Potenzial μ = 0. Um die Zustandssumme für μ ≠ 0 zu erhalten, brauchen wir lediglich den Hamilton-Operatoren H(a† , a) durch H (a† , a) = H(a† , a) − μN(a† , a) zu ersetzen, wobei N(a† , a) = ∑ a†l a l l
der Teilchenzahloperator ist. Die großkanonische Zustandssumme ist dann nach wie vor durch das Funktionalintegral (35.30) gegeben, Z(β, μ) = Sp e−β(H−μN) =
∫
D(ζ ∗ , ζ)e−S E [ζ
∗
,ζ]
,
(35.31)
ζ(β/2)=±ζ(−β/2)
die Wirkung lautet jetzt jedoch β/2 ∗
S E [ζ , ζ] = ∫ dτ (∑ ζ l∗ (τ)(∂ τ − μ)ζ l (τ) + H(ζ ∗ , ζ)) . −β/2
l
(35.32)
35.3 Pfadintegraldarstellung des erzeugenden Funktionals
|
487
Auf der Funktionalintegraldarstellung (35.31), (35.32) der großkanonischen Zustands summe basiert die Pfadintegralbeschreibung von Vielteilchensystemen. In Abschnitt 36.6 werden wir ausgehend von dieser Darstellung eine elegante Ableitung der BCS-Theorie der Supraleitung bei endlichen Temperaturen geben.
35.3 Pfadintegraldarstellung des erzeugenden Funktionals Die oben angegebene Ableitung der Pfadintegraldarstellung (35.31) der Zustandssum me bleibt natürlich richtig, wenn wir Quellterme in den Hamilton-Operator einbezie hen, siehe Gl. (34.69), wodurch dieser dann zeitabhängig wird. Dies führt auf die Pfad integraldarstellung β/2
Z[η , η](β, μ) ≡ Sp T exp (− ∫ dτ [H − μN − ∑ (η∗l (τ)a l + a†l η l (τ))]) ∗
l
−β/2 β/2
=
∗
∗
∫ D(ζ , ζ) exp (−S E [ζ , ζ] + ∫ dτ ∑ [η∗l (τ)ζ l (τ) + ζ l∗ (τ)η l (τ)]) (35.33) −β/2
ζ(β/2)=±ζ(−β/2)
l
mit der Wirkung S[ζ ∗ , ζ] (35.32) und den Feldoperatoren im Schrödinger-Bild. Ferner haben wir hier explizit die Einteilchenindizes angegeben. Wie im Abschnitt 32.2.2 erläutert, überlebt für β → ∞ aus der Spur nur der Grund zustand |0⟩ (siehe Gl. (32.25)) und wir finden deshalb aus (35.33) ∞
Z[η∗ , η](β → ∞, μ) = ⟨0|T exp (− ∫ dτ [H − μN − ∑(η∗l (τ)a l + a†l η l (τ))]) |0⟩ l
−∞ ∞
= ∫ D(ζ ∗ , ζ) exp (− ∫ dτ [∑ ζ l∗ (τ)(∂ τ − μ)ζ l (τ) + H(ζ ∗ , ζ) −∞
l
− ∑(η∗l (τ)ζ l (τ) + ζ l∗ (τ)η(τ)]) ,
(35.34)
l
wobei wir die (anti-)periodischen Randbedingungen nicht explizit angegeben haben, da sich zeigen lässt, dass diese im Limes β → ∞ irrelevant werden. Setzen wir hier die euklidische Zeit τ wieder zu reellen Werten fort, siehe Gl. (35.28), und nehmen ferner μ = 0, erhalten wir schließlich die Pfadintegraldarstellung der Vakuumübergangsam plitude bei Anwesenheit äußerer Quellen, Z[η ∗ , η] ∞
i := ⟨0|T exp (− ∫ dt [H(t) − ∑ (η∗l (t)a l (t) + a†l (t)η l (t))]) |0⟩ ℏ l −∞
∞
i i = ∫ D(ζ , ζ) exp ( S[ζ ∗ , ζ] + ∫ dt ∑ (η∗l (t)ζ l (t) + ζ l∗ (t)η l (t))) , ℏ ℏ l ∗
−∞
(35.35)
488 | 35 Pfadintegralquantisierung von Vielteilchensystemen
mit der „klassischen“ Wirkung des Vielteilchensystems ∞
S[ζ ∗ , ζ] = ∫ dt (∑ ζ l∗ (t)iℏ∂ t ζ l (t) − H(ζ ∗ , ζ)) . −∞
l
Wie die Ableitung dieser Identität zeigt, ist |0⟩ der exakte Grundzustand des Systems. Ferner gilt Gl. (35.35) für zeitabhängige Hamilton-Operatoren bzw. Feldoperatoren a† (t), a(t). Die Identität (35.35) ist die Grundlage für die Pfadintegralbeschreibung der Vielteilchensysteme bzw. der Quantenfeldtheorie. In Abschnitt 35.5 werden wir aus Gl. (35.35) die Pfadintegraldarstellung des erzeu genden Funktonals der Quantenelektrodynamik gewinnen.
35.4 Nichtdifferenzierbare Pfade Die Funktionalintegraldarstellungen (35.24), (35.27), (35.30), (35.31), (35.34) und (35.35) gelten genau wie Gl. (35.13) streng genommen nur für „glatte” Trajektorien ζ(t). Eine exakte Darstellung der Zustandssumme, die auch die Beiträge der „gezack ten“ Trajektorien korrekt berücksichtigt, erhält man, wenn man Gl. (35.9) in Gleichung (35.22) einsetzt, N
N
k=1
k=1
Sp U(t f , t i ) = ∫ ∏ dμ(ζ k )⟨ζ k |ζ k ⟩ exp { ∑ [−ζ k∗ (ζ k − ζ k−1 ) −
i εH(ζ k∗ , ζ k−1 )]} , ℏ
wobei im Gegensatz zu (35.9) die Integration sich jetzt auch über ζ N ≡ ζ f erstreckt und ζ0 = ±ζ N zu setzen ist. Nach analytischer Fortsetzung (35.28), (35.29) und der Ersetzung H → H − μN erhalten wir die entsprechende Darstellung für die großkanonische Zustands summe, Z(β, μ) = Sp e−β(H−μN) N
= ∫ ∏ dμ(ζ k )⟨ζ k |ζ k ⟩ k=1 N
exp {− ∑ [ζ k∗ (ζ k − ζ k−1 ) + ε (H(ζ k∗ , ζ k−1 ) − μζ k∗ ζ k−1 )]} ,
(35.36)
k=1
wobei wieder ζ0 = ±ζ N zu setzen ist. Um den Einfluss der nichtdifferenzierbaren Pfade zu illustrieren, berechnen wir die großkanonische Zustandssumme des fermionischen Oszillators (33.16) Z(β, μ) = Sp e−β(ϵ−μ)a
†
a
.
(35.37)
35.4 Nichtdifferenzierbare Pfade | 489
Diese Größe wurde bereits in (32.49) im Operator-Zugang berechnet. Wir berechnen die Zustandssumme (35.37) zunächst über die exakte Funktio nalintegraldarstellung (35.36), die sämtliche Pfade (auch die „gezackten“) korrekt berücksichtigt. Mit der expliziten Form des Hamilton-Operators (33.16) haben wir H(ζ k∗ , ζ k−1 ) = ϵ ζ k∗ ζ k−1 und somit N
N
k=1
k=1
Z(β, μ) = ∫ ∏ dζ k∗ dζ k exp {− ∑ [ζ k∗ (ζ k − ζ k−1 ) + ε(ϵ − μ)ζ k∗ ζ k−1 ]} ,
(35.38)
wobei ζ0 = −ζ N . Die Integrationen über die ζ k∗ lassen sich unmittelbar ausführen, ∗
(−1) ∫dζ k∗ e−ζ k [ζ k −ζ k−1 +ε(ϵ−μ)ζ k−1] = δ (ζ k − ζ k−1 (1 − ε(ϵ − μ))) , wobei wir die Fourier-Darstellung (33.36) der δ-Funktion von Graßmann-Variablen be nutzt haben. Aufgrund der entstehenden δ-Funktionen lassen sich auch die verblei benden Integrale über ζ k sukzessiv ausführen. Die Integration über ζ1 liefert 2
∫dζ1 δ (ζ2 − ζ1 (1 − ε(ϵ − μ))) δ (ζ1 − ζ0 (1 − ε(ϵ − μ))) = δ (ζ2 − ζ0 (1 − ε(ϵ − μ)) ) . Nach Ausführen der N − 1 Integrationen über ζ1 ⋅ ⋅ ⋅ ζ N−1 erhalten wir N
Z(β, μ) = ∫dζ N δ (ζ N − ζ0 (1 − ε(ϵ − μ)) ) und mit ζ0 = −ζ N finden wir nach Ausführen der verbleibenden Integration unter Be nutzung von (33.37) N Z(β, μ) = 1 + (1 − ε(ϵ − μ)) . Da ε = β/N, erhalten wir im Limes N → ∞ mit lim (1 −
N→∞
x N ) = e−x N
schließlich Z(β, μ) = 1 + e−β(ϵ−μ) .
(35.39)
Dies ist das exakte Ergebnis (32.49). Wir wollen jetzt alternativ die Zustandssumme des fermionischen Oszillators über den Kontinuum-Limes (35.31)³ ̄ Z(β, μ) =
∫
D (ζ ∗ , ζ ) e−S[ζ
∗
,ζ]
(35.40)
ζ(β/2)=−ζ(−β/2)
3 Zur Unterscheidung vom exakten Ausdruck Z (35.38), (35.39) haben wir die Zustandssumme im Kon ̄ bezeichnet. tinuum-Limes mit Z
490 | 35 Pfadintegralquantisierung von Vielteilchensystemen berechnen, wobei die Wirkung (35.32) mit H(ζ ∗ , ζ) = ϵ ζ ∗ ζ jetzt durch β/2 ∗
S[ζ , ζ] = ∫ dτ ζ ∗ (τ) (∂ τ + ϵ − μ) ζ(τ) −β/2
gegeben ist. Die Funktionalintegration erstreckt sich über zeitabhängige GraßmannVariablen ζ(τ), die den antiperiodischen Randbedingungen ζ(β/2) = −ζ(−β/2) genü gen. Wir entwickeln deshalb die ζ(τ) nach einer vollständigen Basis von antiperiodi schen (differenzierbaren!) Funktionen in der euklidischen Zeit τ, ∞
ζ(τ) = ∑ φ n (τ)ζ(n) ,
(35.41)
n=−∞
die wir in der Form φ n (τ) = wählen, wobei ωn =
1 iω n τ e √β
(2n + 1)π β
(35.42)
(35.43)
die fermionischen Matsubara-Frequenzen sind, siehe Anhang H. Diese Funktionen sind für verschiedene n orthogonal und korrekt normiert: β/2
∫ dτ φ∗n (τ)φ m (τ) = δ nm .
(35.44)
−β/2
Die Funktionalintegration erstreckt sich dann über die Entwicklungskoeffizienten ζ(n), die ebenfalls Graßmann-Variablen sind, ∞
D(ζ ∗ , ζ) = α ∏ dζ ∗ (n)dζ(n) .
(35.45)
n=−∞
Hierbei ist α eine Konstante, die wir weiter unten bestimmen werden. Prinzipiell kann α wie die Basisfunktionen φ n (τ) (35.42) von β abhängen, jedoch nicht von ϵ oder μ. Mit (35.41) und unter Ausnutzung der Orthormalitätsrelation (35.44) haben wir β/2
∞
∫ dτ ζ ∗ (τ) (∂ τ + ϵ − μ) ζ(τ) = ∑ ζ ∗ (n) (iω n + ϵ − μ) ζ(n) n=−∞
−β/2
und erhalten aus (35.40) ∞
̄ l (β, μ) = α ∏ ∫dζ ∗ (n)dζ (n) e−ζ ∗ (n)(iω n +ϵ−μ)ζ (n) Z n=−∞ ∞
= α ∏ [iω n + ϵ − μ] . n=−∞
35.4 Nichtdifferenzierbare Pfade | 491
Mit der expliziten Form (35.43) der Matsubara-Frequenzen, für die ω−n−1 = −ω n gilt, können wir diesen Ausdruck umformen zu ∞ ∞ ϵ−μ ̄ Z(β, μ) = α ( ∏ iω n ) ∏ [1 + ] iω n n=−∞ n=−∞ ∞
∞
n=0
n=0
= α ( ∏ ω2n ) ∏ [1 + (
ϵ−μ 2 ) ] . ωn
Unter Benutzung von⁴ ∞
cosh x = ∏ (1 + n=0
4x2 ) (2n + 1)2 π2
finden wir ∞
1 ̄ Z(β, μ) = α ( ∏ ω2n ) cosh [ β (ϵ − μ)] 2 n=0 =α
1 1 ∞ 2 ( ∏ ω ) e 2 β(ϵ−μ) (1 + e−β(ϵ−μ) ) . 2 n=0 n
(35.46)
Da die Konstante α, die in Gleichung (35.45) eingeführt wurde, nicht von μ oder ϵ ab hängt, können wir α bei μ = ϵ bestimmen, wo die Zustandssumme des fermionischen Oszillators (35.37) den Wert Z(β, μ = ϵ) = 2 besitzt, unabhängig von dem Wert von β. (Der fermionische Oszillator besitzt nur zwei Zustände: |0⟩ und |1⟩, sodass Sp(1)̂ = 2.) Aus (35.46) finden wir dann 1 ∞ α ∏ ω2n = 1 . 2 n=0 Damit erhalten wir für die großkanonische Zustandssumme des fermionischen Oszil lators mit der Energie ϵ 1 ̄ Z(β, μ) = e 2 β(ϵ−μ) (1 + e−β(ϵ−μ) ) .
Vergleich mit dem exakten Ausdruck Z (35.39), der die „gezackten“ Pfade mit ein schließt, zeigt ̄ μ) , (35.47) Z(β, μ) = e−β∆E Z(β, wobei
1 (ϵ − μ) . (35.48) 2 Im obigen Beispiel bewirkt das Weglassen der „gezackten“ Pfade in der Zustandssum me des Gesamtsystems ∑ e−βE n ∆E =
n
4 Siehe I. S. Gradshteyn und I. M. Ryzhik, Table of Integrals, Series, and Products, Academic Press, San Diego, 1994.
492 | 35 Pfadintegralquantisierung von Vielteilchensystemen
offenbar eine Verschiebung der Energien E n → E n − ∆E . Eine Verschiebung der Energie um eine Konstante ist zwar sowohl in der nichtrelati vistischen Physik als auch in der relativistischen Quantenfeldtheorie (mit Ausnahme der allgemeinen Relativitätstheorie) irrelevant, da die Energie hier nur bis auf eine additive Konstante definiert ist. Jedoch hängt ∆E (35.48) von der Einteilchenenergie ϵ und dem chemischen Potenzial μ ab und lässt sich somit durch externe Bedingungen manipulieren. Dies kann prinzipiell zu messbaren Konsequenzen wie dem CasimirEffekt führen. Die Energiekorrektur ∆E (35.48), die durch die gezackten Pfade hervorgerufen wird, ist die gewöhnliche quantenmechanische Nullpunktsenergie, die aufgrund der Heisenberg’schen Unschärferelation stets auftritt und die wir bereits beim harmoni schen Oszillator kennengelernt haben. Tatsächlich lässt sich zeigen: Die gezackten Wege im Funktionalintegral verursachen die Unschärferelation des Operatorzuganges. Dies wird in der nachfolgenden Blaubox anhand der eindimensionalen Bewegung ei ner Punktmasse gezeigt. Die Unschärferelation als Folge nichtdifferenzierbarer Pfade Wir betrachten den Erwartungswert eines Funktionals F[x] der Trajektorie x(t) der Punktmasse m im Funktionalintegralzugang i ⟨F[x]⟩ := ∫ Dx(t)F[x] exp ( S[x]) , ℏ
(35.49)
wobei wir der Einfachheit halber die Randbedingungen am Funktionalintegral (sie he Gl. (3.23)) weggelassen haben. Da das funktionale Integrationsmaß invariant ge genüber einer Verschiebung um eine feste Funktion η(t) ist⁵, D(x(t) + η(t)) = Dx(t) , folgt i
i
∫ Dx(t) (F[x + η]e ℏ S[x+η] − F[x]e ℏ S[x] ) = 0 .
5 Man beachte, dass im Funktionalintegral für die Übergangsamplitude nicht über die Randpunkte der Trajektorien integriert wird, sodass durch die Verschiebung der Integrationsvariablen die Rand bedingungen nicht geändert werden, d. h. die Verschiebung η(t) kann so gewählt werden, dass sie an den Rändern verschwindet.
35.4 Nichtdifferenzierbare Pfade | 493
Für infintesimale η(t) genügt es, den Integranden bis zur ersten Ordnung in η(t) funktional zu entwickeln (siehe Gl. (D.24)). Dies liefert ∫ dsη(s) ∫ Dx(t) (
i δF[x] i δS[x] + F[x] ) e ℏ S[x] = 0 . δx(s) ℏ δx(s)
Da η(s) (zwar infinitesimal aber) beliebig ist, folgt ⟨
i δS[x] δF[x] ⟩ = − ⟨F[x] ⟩ , δx(t) ℏ δx(t)
(35.50)
wobei wir wieder die Definition (35.49) des Erwartungswertes benutzt haben.⁶ Wäh len wir hier F[x] = 1, so folgt mit δF[x]/δx(t) = 0 das Ehrenfest-Theorem (siehe Abschnitt 7.3) δS[x] ̈ + V (x(t))⟩ = 0 . ⟨ ⟩ ≡ − ⟨m x(t) δx(t) In der diskretisierten Form des Funktionalintegrals (3.20) wird aus der funktionalen Ableitung in (35.50) eine gewöhnliche Ableitung nach der Koordinate x k = x(t k ) zu einer intermediären Zeit t k : ⟨
∂F[x] ∂S[x] i ⟩ = − ⟨F[x] ⟩ . ∂x k ℏ ∂x k
(35.51)
Aus der diskretisierten Form der Wirkung (siehe Gl. (3.20)) finden wir ∂S[x] x k+1 − x k x k − x k−1 = −m +m − εV (x k ) . ∂x k ε ε Setzen wir diesen Ausdruck in (35.51) ein und wählen F[x] = x k , so erhalten wir mit ∂F[x]/∂x k = 1: ℏ x k − x k−1 x k+1 − x k xk − xk m ⟩= . (35.52) ⟨m ε ε i Für glatte Pfade verschwindet dieser Ausdruck im Limes ε → 0: ̇ ̇ ⟨m x(t)x(t) − x(t)m x(t)⟩ =0. Gezackte Pfade (wie sie z. B. bei der Brown’schen Bewegung auftreten) besitzen hingegen eine Ortsunschärfe (∆x)2 ∼ ∆t = ε, sodass die Geschwindigkeit ẋ = ∆x/∆t fast nirgendwo existiert. Der Einschluss dieser Pfade bewirkt, dass der Erwartungs wert (35.52) auch im Limes ε → 0 nicht verschwindet, sondern, wie für endliche ε, den Wert ℏ/i besitzt: lim ⟨m
ε→0
x k+1 − x k x k − x k−1 ℏ xk − xk m ⟩= . ε ε i
6 In der Quantenfeldtheorie, wo die Teilchenkoordinate x(t) durch ein Feld φ(x) ersetzt ist, liefert (35.50) die Master-Gleichung für die sogenannten Dyson-Schwinger-Gleichungen.
494 | 35 Pfadintegralquantisierung von Vielteilchensystemen
Dies ist das Pfadintegraläquivalent der Kommutationsbeziehung [p,̂ x]̂ =
ℏ , i
(35.53)
wobei p̂ = ℏ/i∂/∂x und x̂ die quantenmechanischen Operatoren zum klassischen ̇ und zur Koordinate x(t) sind. Die Kommutationsbeziehung (35.53) Impuls m x(t) bedingt nach (11.10) die Unschärferelation ∆p∆x ≥
ℏ . 2
Die Unschärferelation ist somit eine Folge der gezackten Pfade. Dies zeigt, dass die gezackten Pfade zwangsläufig im Pfadintegral auftreten müssen.
35.5 Funktionalintegraldarstellung der Eichtheorien Wir haben bereits einleitend in diesem Kapitel darauf hingewiesen, dass aus konzep tioneller Sicht ein Quantenfeld ein System unendlich vieler identischer Teilchen re präsentiert. Deshalb lässt sich die oben abgeleitete Funktionalintegralquantisierung von Vielteilchensystemen auch unmittelbar auf die Quantenfeldtheorie anwenden. Wir wollen dies exemplarisch für die Dirac-Fermionen bzw. für die Quantenelektro dynamik (QED) tun. Ein Fermion mit Spin 1/2 besitzt den Einteilchen-(Dirac)-Hamilton-Operator (28.41) h(x) = cαp + βmc2 . Dementsprechend lautet der Hamilton-Operator eines Systems von Fermionen mit Spin 1/2 in der Zweiten Quantisierung⁷ ̂ = ∫ d3 x ψ̂ † (x)h(x)ψ(x) ̂ , H(ψ̂ † , ψ)
(35.54)
̂ wobei die Feldoperatoren ψ(x), ψ̂ † (x) jetzt Dirac-Spinoren sind, ψ̂ 1 (x) ψ̂ 2 (x) ̂ ψ(x) =( ̂ ) , ψ3 (x) ψ̂ 4 (x)
7 Zur Unterscheidung von den später auftretenden Graßmann-Feldern haben wir die Feldoperatoren ψ,̂ ψ̂ † hier mit einem „ ̂ “ gekennzeichnet.
35.5 Funktionalintegraldarstellung der Eichtheorien | 495
deren Komponenten ψ̂ r (x) ≡ ψ̂ r (t, x) zu einer festen Zeit t die üblichen Antivertau schungsrelationen (31.87) { ψ̂ r (t, x), ψ̂ s (t, y)} = 0 ,
{ψ̂ †r (t, x), ψ̂ †s (t, y)} = 0 ,
{ψ r (t, x), ψ†s (t, y)} = δ rs δ3 (x, y) erfüllen. Mit dem Hamilton-Operator (35.54) erhalten wir aus (35.35) die Funktional integraldarstellung der Vakuumübergangsamplitude bzw. des erzeugenden Funktio nals, i Z[η, η] = ∫ Dψ† Dψ exp ( ∫ dt ∫ d3 x (ψ† (x)[iℏ∂ t − h(x)]ψ(x) ℏ + ψ† (x)η(x) + η † (x)ψ(x))) ,
(35.55)
wobei die ψ(x) jetzt Dirac-Spinoren sind, deren Komponenten Graßmann-Felder sind. Benutzen wir die übliche kovariante Notation aus Kapitel 28 mit γ0 = β ,
γ = βα ,
∂/ = γ μ ∂ μ
und definieren auch für die Graßmann-Felder ̄ ψ(x) = ψ† (x)γ0 ,
̄ (x) = η † (x)γ0 , η
so lautet das Funktionalintegral (35.55) i ̄ ̄ ψ] + i ∫ d4 x[η ̄ ̄ , η] = ∫ DψDψ ̄ (x)ψ(x) + ψ(x)η(x)]) Z[η exp ( S f [ψ, , ℏ ℏ
(35.56)
wobei ̄ ψ] = ∫ d4 x ψ(x) ̄ (iℏ∂/ − mc) ψ(x) S f [ψ,
(35.57)
̄ ψ] nach dem Fermidie „klassische“ fermionische Wirkung ist. Variation von S f [ψ, ̄ Feld ψ(x) liefert die Dirac-Gleichung (28.45) iℏ∂/ ψ = mcψ . Man beachte: Die Dirac-Gleichung erscheint in der Quantenfeldtheorie als klassische Bewegungsgleichung des Fermi-Felds, während sie in der Quantenmechanik (siehe Kapitel 28) als relativistische Verallgemeinerung der Schrödinger-Gleichung betrach tet wird. Wie wir im Abschnitt 28.8 gesehen haben, erfolgt die Kopplung von Fermionen mit elektrischer Ladung q an das elektromagnetische Feld durch Ersetzen des Ablei tungsoperators ∂ μ durch die kovariante Ableitung (28.68) D μ = ∂ μ + iqA μ /ℏc ,
(35.58)
496 | 35 Pfadintegralquantisierung von Vielteilchensystemen wobei A μ (x) das Eichpotenzial des elektromagnetischen Felds ist. Nach dieser Erset zung erhalten wir aus (35.57) die fermionische Wirkung ̄ ψ] = ∫ d4 x ψ(x) ̄ (iℏD S f [ψ, / − mc) ψ(x) .
(35.59)
In der Quantenfeldtheorie wird das Eichpotenzial A μ (x) ebenfalls zum fluktuierenden Quantenfeld. Addieren wir zum Exponenten von Gl. (35.56) die klassische Wirkung des elektromagnetischen Felds Sem [A] (28.21), integrieren auch über das Eichfeld A μ (x) und führen für dieses auch eine Quelle j μ (x) ein, so erhalten wir das erzeugende Funk tional der Quantenelektrodynamik⁸, i ̄ ̄ ψ, A] ̄ , η, j] = ∫ DA μ (x) ∫ Dψ(x)Dψ(x) Z[η exp ( SQED [ψ, ℏ i ̄ ̄ (x)ψ(x) + ψ(x)η(x)]) , + ∫ d4 x [j μ (x)A μ (x) + η ℏ
(35.60)
wobei ̄ ψ, A] = S f [ψ, ̄ ψ] + Sem [A] SQED [ψ, mit 1 ∫ d4 xF μν (x)F μν (x)] Sem [A] = − 4c
(35.61)
die klassische Wirkung der QED ist. Über die kovariante Ableitung D μ (35.58) enthält S f (35.59) auch die Kopplung des Elektronenfelds ψ(x) an das Eichfeld (Photonfeld) A μ (x) q μ ̄ / (x)ψ(x) = − q ∫ d4 x ψ(x)γ ̄ ψ(x)A μ (x) , Sint = − ∫ d4 x ψ(x)A c c
(35.62)
die Feynman-diagrammatisch in Abb. 35.1a dargestellt ist. Man beachte, dass die La dung q hier als Kopplungsstärke auftritt. Dieser Term hat genau die Form der Wir kung (28.22), welche die Kopplung des Eichfelds A μ (x) an den (äußeren) Strom j μ (x) beschreibt, wenn wir μ ̄ j μ (x) = qc ψ(x)γ ψ(x) als den elektrischen Strom des Elektronenfelds interpretieren.
8 Für das elektromagnetische Feld A μ (x), das als Vektorfeld den Spin 1 besitzt und folglich ein BoseFeld ist, lässt sich das Funktionalintegral ebenfalls aus Gl. (35.34) ableiten, ähnlich wie wir das oben explizit für die Fermionen mit Spin 1/2 getan haben. Da diese Ableitung keine wesentlich neuen Ele mente enthält, geben wir sie nicht explizit an.
35.5 Funktionalintegraldarstellung der Eichtheorien | 497
(a)
(b)
Abb. 35.1: Feynman-diagrammatische Darstellung der Elektron-Photon-Kopplung. (a) Kopplungs term in der Wirkung (35.62), (b) führende Korrektur in der QED. Eine durchgezogene Linie mit Pfeil repräsentiert ein Elektron, eine Wellenlinie ein Photon.
Die Wirkung des Eichfelds Sem [A] (35.61) ist bekanntlich invariant unter den Eich transformationen (28.15) A μ (x) → A μ (x) + ∂ μ Λ(x) . ̄ ψ] Unter diesen Transformationen bleibt auch der fermionische Teil der Wirkung S f [ψ, (35.59) invariant, vorausgesetzt, das Fermi-Feld wird ebenfalls der Eichtransformation q Λ(x)) ψ(x) ℏc ̄ ̄ exp (i q Λ(x)) ψ(x) → ψ(x) ℏc ψ(x) → exp (−i
unterworfen. Aufgrund dieser lokalen Symmetrie ist das Funktionalintegral (35.60) streng genommen erst nach Eichfixierung mathematisch wohl definiert. Man beach te auch, dass sich der Feldstärketensor F μν (28.13) mittels der kovarianten Ableitung (35.62) in der Form ℏc (35.63) F μν = −i [D μ , D ν ] q schreiben lässt. ̄ , η, j] (35.60) nach den Quellen η ̄ , η, j lassen sich sämt Durch Ableitung von Z[η liche Green’schen Funktionen bzw. Vakuumerwartungswerte der QED erzeugen, ̄ 1 ) . . . ψ(x2 ) . . . A μ (x3 )⟩ ⟨ψ(x ̄ ̄ 1 ) . . . ψ(x2 ) . . . A μ (x3 ) exp (iSQED [ψ, ̄ ψ, A]) . ψ(x = ∫ DA μ (x) ∫ Dψ(x)Dψ(x) Das Funktionalintegral (35.60) beschreibt sämtliche elektromagnetischen Prozesse bzw. Phänomene in der Quantenwelt. Da die Kopplungskonstante, mit welcher die Elektronen (q = −e) an das Eichfeld koppeln, also die Feinstrukturkonstante (28.119) α=
e2 1 ≃ , 4πℏc 137
sehr klein ist, lässt sich das Funktionalintegral (35.60) störungstheoretisch, d. h. durch Entwicklung nach Potenzen von α, berechnen. Diese Rechnungen wurden teilweise bis zur Ordnung α 5 durchgeführt. Dabei wurde eine exzellente Übereinstim mung mit dem Experiment erhalten. Als Beispiel geben wir das magnetische Moment
498 | 35 Pfadintegralquantisierung von Vielteilchensystemen
des Elektrons an: In Abschnitt 28.9 haben wir gesehen, dass die Dirac-Gleichung für einen Spin s = 1/2 mit Ladung q das magnetische Moment (28.92) μs = gs
q s 2mc
mit einem Landé-Faktor g s = 2 liefert. Zu diesem Wert gibt es im Rahmen der QED aufgrund der Quantenfluktuationen des Eichfelds A μ (x) Korrekturen, die sich stö rungstheoretisch berechnen lassen. Die Korrektur führender Ordnung ist durch das in Abb. 35.1b gezeigte Feynman-Diagramm gegeben und beträgt α/π, sodass in dieser Ordnung α g s = 2 + + O(α 2 ) . π Führt man die Berechnung von g s bis zur Ordnung α 5 durch, erhält man mit α −1 = 137,035999174(35) folgendes Ergebnis: α 3 g−2 1 α α 2 = − 0,328478966 ( ) + 1,181241456 ( ) 2 2π π π α 4 α 5 − 1,9097(20) ( ) + 9,16(58) ( ) π π = 1159652181, 78(77) ⋅ 10−12 , während der experimentelle Wert g−2 = 1159652188,4 ⋅ 10−12 2 beträgt. Die Übereinstimmung von Theorie und Experiment ist beeindruckend. Sol che präzisen Vorhersagen, wie sie die QED liefert, wurden bisher in keiner anderen Theorie erreicht. Die QED ist die einfachste realistische Eichtheorie. Sie ist Bestandteil des Stan dardmodells der Elementarteilchen. Die übrigen Eichtheorien des Standardmodells sind analog zu Gl. (35.60) definiert. Allerdings trägt das Fermi-Feld ψ(x) dann einen weiteren Index, der die Quantenzahlen der schwachen bzw. starken Wechselwirkung (schwacher Isospin bzw. Farbe) unterscheidet, siehe Abschnitt 26.8. Dementspre chend ist das Eichfeld A μ (x) dann durch eine hermitesche (Isospin- bzw. Farb-)Matrix gegeben. Da die Matrizen A μ (x) zu verschiedenen μ i. A. nicht kommutieren, enthält der Feldstärketensor (35.63) F μν = ∂ μ A ν − ∂ ν A μ + i
q [A μ , A ν ] ℏc
dann auch Terme quadratisch im Eichfeld. In der Wirkung des Eichfelds (vgl. (35.61)), Sg = −
1 ∫ d4 x Sp(F μν F μν ) , 4c
35.5 Funktionalintegraldarstellung der Eichtheorien | 499
treten dann neben den üblichen quadratischen Termen (die bereits in der QED vor handen sind) auch Terme dritter und vierter Ordnung im Eichfeld auf, ∼ q ∫ d4 x Sp (∂ μ A ν [A μ , A ν ]) , ∼ q2 ∫ d4 x Sp ([A μ , A ν ][A μ , A ν ]) , die eine Selbstwechselwirkung des Eichfelds repräsentieren, wobei q die Bedeutung der Kopplungsstärke besitzt. Diese Selbstwechselwirkung führt zu qualitativ neuen Phänomenen wie der asymptotischen Freiheit und des Farbeinschlusses, die im Ab schnitt 26.8 besprochen wurden. In der Quantenfeldtheorie geht man gewöhnlich nicht von der kanonischen, sondern von der Funktio nalintegralquantisierung (35.60) aus, die heutzutage die Standardmethode der Feldquantisierung ist. Gemäß dem Prinzip der interferierenden Alternativen schreibt man in Analogie zur Quantenmechanik unmittelbar das Funktionalintegral für die Übergangsamplitude bzw. für das erzeugende Funktional auf.
Der aufmerksame Leser mag sich fragen, wieso in der Quantenfeldtheorie der Über gang zu kontinuierlichen Trajektorien (Feldkonfigurationen) stillschweigend vorge nommen wird, ohne auf die Rolle der nichtdifferenzierbaren („gezackten“) Feldkon figurationen einzugehen, die bei der Ableitung der Funktionalintegraldarstellung zunächst vorhanden sind. Die Antwort ist einfach: Die Funktionalintegrale der Quan tenfeldtheorie werden entweder numerisch, in der semiklassischen Näherung oder in der Störungstheorie berechnet. Bei der numerischen Berechnung werden Raum und Zeit diskretisiert und somit sämtliche nichtdifferenzierbaren Feldkonfigurationen vollständig berücksichtigt. In der semiklassischen Näherung tragen nur die Feldkon figurationen in der Umgebung der klassischen Feldkonfigurationen bei, welche die Wirkung minimieren und sämtlich glatt, d. h. differenzierbar sind. Die Störungstheo rie reduziert sich auf die Berechnung von Gauß-Integralen. Die Quantenfeldtheorie wurde ursprünglich in der Elementarteilchentheorie ent wickelt, hat aber inzwischen auch in vielen anderen Gebieten der modernen Physik Einzug gehalten, insbesondere in der Theorie der kondensierten Materie. Zur Illustra tion und als eine nichttriviale Anwendung der in diesem Buch entwickelten feldtheo retischen Methoden behandeln wir im abschließenden Kapitel die Supraleitung.
36 Theorie der Supraleitung Einige Stoffe besitzen die Eigenschaft, dass ihr elektrischer Widerstand unterhalb ei ner kritischen Temperatur Tc verschwindet; sie werden als Supraleiter bezeichnet. Ein elektrischer Strom fließt in einem Supraleiter unterhalb von Tc ohne Verluste. Wird ein Supraleiter mit T < Tc in ein äußeres Magnetfeld (magnetische Feldstärke) H ge bracht, so werden dessen Feldlinien aus dem Gebiet des Supraleiters herausgedrängt, was als Meißner-Effekt bezeichnet wird. Genauer gesagt, fällt ein Magnetfeld, das an der Oberfläche eines Supraleiters wirkt, im Inneren des Supraleiters exponentiell mit dem Abstand von der Oberfläche ab. Im Inneren des Supraleiters verschwindet das Magnetfeld (magnetische Induktion), B = 0. Wegen B = H + M (wobei M die Magne tisierung ist) folgt M = −H und der Supraleiter ist folglich ein perfekter Diamagnet. Das Eindringen des Magnetfelds wird durch (sogenannte London-)Ströme an der Ober fläche des Supraleiters verhindert, die ein Gegenfeld zum äußeren Feld erzeugen, so dass das Gesamtmagnetfeld B im Inneren des Supraleiters verschwindet. Übersteigt das äußere Magnetfeld H eine kritische Stärke Hc (T), die von der Temperatur T < Tc des Supraleiters abhängt, so wird der supraleitende Zustand zerstört und das Material wird normal leitend, siehe Abb. 36.1a. B
(a)
B
Hc
H
(b)
H c0
Hc
H
Abb. 36.1: Die magnetische Induktion B im Supraleiter als Funktion der (von außen angelegten) magnetischen Feldstärke H: (a) Typ-I- und (b) Typ-II-Supraleiter.
Supraleiter mit den oben beschriebenen Eigenschaften werden als Typ-I-Supraleiter bezeichnet. In einigen Stoffen wird die Supraleitfähigkeit bis zu einer oberen kri tischen Feldstärke Hc (T), der (vollständige) Meißner-Effekt B = 0 jedoch nur bis zu einer kleineren kritischen Feldstärke H c 0 (T) beobachtet, siehe Abb. 36.1b. Die se Materialien werden als Typ-II-Supraleiter bezeichnet. Magnetfelder der Stärke H c 0 < H < Hc können in den Typ-II-Supraleiter zwar eindringen, zerstören jedoch dessen Supraleitfähigkeit nicht. Ihre Feldlinien bilden stattdessen reguläre Gitter von magnetischen Flusswirbeln (Vortexlinien), die auch als Abrikosov-Vortices bezeichnet https://doi.org/10.1515/9783110586077-014
36.1 Paarkorrelationen: Die BCS-Wellenfunktion | 501
H
Hc
B ≠ 0 magnetische Flusswirbel
H c0 B=0
Tc
T
Abb. 36.2: Die kritischen magnetischen Feldstärken des Typ-II-Supraleiters als Funktion der Tempe ratur.
werden, siehe Abb. 36.2. Im Inneren der Flusswirbel befindet sich das Material in der normal leitenden Phase. Die seit dem Jahr 1986 entdeckten sogenannten Hochtempe ratursupraleiter sind sämtlich Typ-II-Supraleiter. Vor der Entdeckung der Hochtempe ratursupraleiter war Nb der Supraleiter mit der höchsten kritischen Temperatur von Tc ∼ 9,26 K. Die Hochtemperatursupraleiter besitzen hingegen kritische Temperatu ren um die 100 K. Die bisher höchste kritische Temperatur von Tc ∼ 138 K wurde für Hg12 Tl3 Ba30 Ca30 Cu45 O127 gefunden. Die theoretische Erklärung der gewöhnlichen Supraleitung wurde von Bardeen, Cooper und Schrieffer gegeben und ist heute unter dem Namen BCS-Theorie bekannt. Im Folgenden werden die Grundzüge dieser Theorie entwickelt. Diese Theorie besitzt auch konzeptionelle Bedeutung für die Kernphysik und Elementarteilchenphysik, worauf wir später noch eingehen werden.
36.1 Paarkorrelationen: Die BCS-Wellenfunktion Die Leitungselektronen in einem Festkörper können in grober Näherung als unab hängige Teilchen betrachtet werden, deren Zustände durch den Impuls p und die Spinprojektion σ =↑, ↓ bezüglich einer willkürlich wählbaren Quantisierungsrichtung charakterisiert werden.¹ Der Hamilton-Operator freier Leitungselektronen lautet in der Zweiten Quantisierung H0 = ∑ e0p ∑ a†pσ a pσ , p
σ
e0p =
p2 . 2m
1 Da der Supraleiter eine endliche Ausdehnung besitzt, können wir die Impulse als diskret annehmen.
502 | 36 Theorie der Supraleitung
Im Grundzustand besetzen die Leitungselektronen sämtliche Einteilchenzustände |pσ⟩ = a†pσ |0⟩ unterhalb der Fermi-Kante e0F = p2F /2m, sodass ihre Wellenfunktion durch |ϕ0 ⟩ = ∏ a†p↑ a†−p↓ |0⟩
(36.1)
|p|
pF
(36.7)
in der BCS-Funktion (36.5) enthalten. Für die von diesem Spezialfall abweichenden Werte der Amplituden u p und v p besitzt die BCS-Wellenfunktion keine gute Teilchen zahl mehr, sondern ist eine Überlagerung von Zuständen mit einer beliebigen geraden Anzahl von Teilchen |BCS⟩ = (∏ u p ) |0⟩ + ∑ ( ∏ u p ) v p a†p ↑ a†−p ↓ |0⟩ p
p
+ ∑ ( ∏ p ,p
p=p ̸ ,p
p =p ̸
u p ) v p v p a†p ↑ a†−p ↓ a†p ↑ a†−p ↓ |0⟩
+ ⋅⋅⋅ . Die BCS-Wellenfunktion ist damit keine Eigenfunktion zum Teilchenzahloperator N = ∑ npσ , p,σ
npσ = a†pσ a pσ ,
(36.8)
wobei npσ der Besetzungszahloperator des Einteilchenzustands |pσ⟩ ist. Zur Verein fachung der Notation ist es zweckmäßig, die Fermionenpaaroperatoren b†p = a†p↑ a†−p↓ ,
bp = a−p↓ a p↑
(36.9)
einzuführen, die den Kommutationsbeziehungen [bp , b†p ] = δ pp (1̂ − np↑ − np↓) , [np σ , b†p ] = (δ pp δ σ↑ + δ p,−p δ σ↓ ) b†p
(36.10) (36.11)
504 | 36 Theorie der Supraleitung
genügen. Diese lassen sich sehr einfach unter Benutzung der Antikommutations beziehungen der fundamentalen Fermi-Operatoren zeigen. Werden die Besetzungs zahloperatoren auf der rechten Seite von Gl. (36.10) vernachlässigt, so verhalten sich die Fermionenpaaroperatoren (36.9) in dieser Näherung wie Bose-Operatoren. Die Anwesenheit der Besetzungszahloperatoren n pσ zerstört jedoch die idealen BoseKommutationsbeziehungen und ist Ausdruck des Pauli-Prinzips. Wegen der Antikommutationsbeziehungen der Fermi-Operatoren gilt [b†p , b† ] = 0̂ p
und die einzelnen Faktoren im BCS-Zustand (36.5), |BCS⟩ = ∏ (u p + v p b†p ) |0⟩ ,
(36.12)
p
vertauschen. Da (b†p )2 = 0,̂ können wir den BCS-Zustand alternativ in der Form |BCS⟩ = const exp (∑ w p b†p ) |0⟩ p
= const exp (∑ w p a†p↑ a†−p↓ ) |0⟩
(36.13)
p
mit const = ∏ u p , p
wp =
vp up
schreiben, die an einen kohärenten Zustand erinnert. Der letzte Ausdruck ist aber ge rade die in (31.117) gefundene Quasiteilchendarstellung der Slater-Determinanten ge mäß des Thouless-Theorems. Der Unterschied zu Gl. (31.117) besteht lediglich darin, dass im BCS-Zustand (36.13) die Slater-Determinante |ϕ⟩ von Gl. (31.117) durch das tat sächliche Teilchenvakuum |0⟩ und die Quasiteilchenoperatoren c†p c†h durch tatsäch liche Teilchenoperatoren a†p↑ a†−p↓ ersetzt wurden. Der BCS-Zustand besitzt deshalb die Eigenschaften von Slater-Determinanten, insbesondere gilt für diesen Zustand das Wick’sche Theorem. Wegen bp |0⟩ = o , ⟨0|b†p = o (36.14) und npσ |0⟩ = o folgt aus Gl. (36.10) bp b†p |0⟩ = δ p,p |0⟩ .
(36.15)
Mit den obigen Beziehungen ist es jetzt sehr einfach, die Norm des BCS-Zustands (36.12) zu berechnen: ⟨BCS|BCS⟩ = ⟨0| ∏ [|u p |2 + u ∗p v p b†p + v∗p bp u p + |v p |2 bp b†p ] |0⟩ . p
36.1 Paarkorrelationen: Die BCS-Wellenfunktion | 505
Mit (36.14) und (36.15) folgt ⟨BCS|BCS⟩ = ∏ (|u p |2 + |v p |2 ) . p
Fordern wir, dass dieser Zustand auf 1 normiert ist, so erhalten wir die Normierungs bedingung an die Amplituden |u p |2 + |v p |2 = 1 .
(36.16)
Dass die BCS-Wellenfunktion keine gute Teilchenzahl besitzt, erkennt man auch, wenn man den Erwartungswert des Paaroperators (36.9) berechnet. Wir betrachten zunächst die Wirkung des Paarvernichtungsoperators bp auf |BCS⟩. Um ein nicht verschwindendes Ergebnis zu erhalten, muss bp durch den Erzeugungsoperator b†p daran gehindert werden, auf das Fermi-Vakuum |0⟩ zu wirken, da er dieses vernichtet, bp |0⟩ = 0. Mit Gl. (36.15) erhalten wir deshalb bp |BCS⟩ = v p ∏ (u p + v p b†p ) |0⟩ .
(36.17)
p =p ̸
Bilden wir das Skalarprodukt dieser Gleichungen mit der BCS-Wellenfunktion, so trägt aus dem bra-Vektor ⟨BCS| vom Einteilchenzustand p = p nur die Amplitude u ∗p bei und wir finden ⟨bp ⟩ = u ∗p v p , (36.18) wobei wir die Abkürzung ⟨ ⋅ ⋅ ⋅ ⟩ = ⟨BCS|⋅ ⋅ ⋅|BCS⟩ benutzt haben. Der Erwartungswert (36.18) verschwindet für einen normal leitenden Zustand (36.1), für den Gl. (36.7) gilt. Bilden wir das Skalarprodukt von Gl. (36.17) mit der hermitesch adjungierten Gleichung ⟨BCS|b†p = v∗p ⟨0| ∏ (u ∗p + v∗p bp ) , p =p ̸
so finden wir für p ≠ p
⟨b†p bp ⟩ = v∗p v p u p u ∗p .
(36.19)
Für p = p finden wir hingegen ⟨b†p bp ⟩ = |v p |2 . Somit gibt |v p |2 die mittlere Zahl der Cooper-Paare mit Impuls p im BCS-Zustand an. Dies ist bereits aus der BCS-Wellenfunktion (36.12) ersichtlich, in der |v p |2 die Wahr scheinlichkeit für das Auftreten eines Cooper-Paars mit Impuls p ist.
506 | 36 Theorie der Supraleitung
36.2 Variation der Energie Die noch unbekannten Amplituden u p , v p im BCS-Zustand lassen sich durch Mini mierung der Energie bestimmen. Wie oben gezeigt, besitzt die BCS-Wellenfunktion keine gute Teilchenzahl. Wir können jedoch bei der Variation die Teilchenzahl im Mit tel erhalten, d. h., wir verlangen, dass die mittlere Teilchenzahl ⟨N⟩ mit der (als gerade vorausgesetzten) tatsächlichen Teilchenzahl N übereinstimmt, was wir mit Hilfe eines Lagrange-Multiplikators μ erreichen, indem wir die Energie E = ⟨H ⟩
(36.20)
H = H − μN
(36.21)
mit minimieren. In Analogie zur Thermodynamik wird μ als chemisches Potenzial be zeichnet. Der Erwartungswert des Besetzungszahloperators npσ (36.8) lässt sich leicht unter Benutzung der Kommutationsbeziehung (36.11) und npσ |0⟩ = o berechnen. Dies liefert {|v p |2 , ⟨npσ ⟩ = { |v |2 , { −p
σ =↑
.
σ=↓
(36.22)
Wegen v−p = −v p (36.6) finden wir deshalb ⟨H0 ⟩ = 2 ∑ e0p |v p |2 , p
⟨N⟩ = 2 ∑ |v p |2 .
(36.23)
p
Die letzte Gleichung zeigt, dass |v p |2 die Wahrscheinlichkeit ist, dass im BCS-Zustand (36.5) der Einteilchenzustand mit Impuls p mit zwei Elektronen (bzw. einem CooperPaar) besetzt ist. Zur Berechnung von ⟨Hint ⟩ (36.3) benutzen wir die Beziehung (36.19). Der Einfach heit halber verwenden wir diese Beziehung auch für p = p . Dies ist gerechtfertigt, da der Beitrag von den Termen mit p = p gegenüber den vielen Beiträgen von p ≠ p vernachlässigbar ist. Wir erhalten dann ⟨Hint ⟩ = − ∑ V(p, p )v∗p u p u ∗p v p p,p
und für die Gesamtenergie (36.20) finden wir E = 2 ∑ e p |v p |2 − ∑ V(p, p )v∗p u p u ∗p v p , p
(36.24)
p,p
wobei wir die Abkürzung e p = e0p − μ eingeführt haben.
(36.25)
36.2 Variation der Energie
| 507
Wir bestimmen jetzt die Amplituden u p , v p durch Minimierung der Energie E (36.24). Statt Real- und Imaginärteil können wir auch u p und u ∗p bzw. v p und v∗p als unabhängige Variablen betrachten. Da das Energiefunktional E (36.24) reell ist, lie fert die Variation bezüglich u ∗p und v∗p die komplex konjugierten Gleichungen zu den Extremalbedingungen, die aus der Variation nach u p und v p folgen. Wir beschränken uns deshalb im Folgenden auf die Variation von E (36.24) bezüglich u ∗p und v∗p bei festgehaltenen u p und v p . Aufgrund der Nebenbedingung (36.16) sind jedoch die Va riationen δu ∗p und δv∗p nicht unabhängig voneinander, sondern (für festgehaltene u p und v p ) durch die Beziehung u p δu ∗p + v p δv∗p = 0 bzw.
δu ∗p δv∗p
=−
vp up
verknüpft. Unter Berücksichtigung dieser Bedingung liefert die Variation von E (36.24) nach v∗p v2p ! δE ∗ ∗ =0. ∗ = 2e p v p − ∑ V(p, p )u p u p v p + ∑ V(p , p)v p u p δv p up p p
(36.26)
Nach Einführen der Größe ∆ p := ∑ V(p, p )u ∗p v p
(36.27)
p
vereinfacht sich Gl. (36.26) zu 2e p v p − u p ∆ p +
v2p up
∆∗p = 0 .
(36.28)
Hierbei haben wir V ∗ (p, p ) = V(p , p) benutzt, was aus der Hermitizität der Paar wechselwirkung (36.3), H†int = Hint , folgt. Multiplizieren wir Gl. (36.28) mit ∆∗p /u p , er halten wir die quadratische Gleichung !
( deren Lösungen durch
vp ∗ 2 vp ∗ ∆ p ) + 2e p ( ∆ ) − |∆ p |2 = 0 , up up p vp 1 = (−e p ± √e2p + |∆ p |2 ) u p ∆∗p
gegeben sind. Führen wir die Abkürzung ε p = √e2p + |∆ p |2
(36.29)
508 | 36 Theorie der Supraleitung
ein, so finden wir nach elementaren Umformungen e2p − ε2p −e p ± ε p ∆p vp = = ∗ . = ∗ up ∆p ∆ p (−e p ∓ ε p ) e p ± ε p
(36.30)
Für freie Teilchen (∆ p = 0) muss das Verhältnis v p /u p der Amplituden nach Gl. (36.7) die Werte v p {∞ , p ≤ pF = u p {0 , p > pF { annehmen. Dies ist nur für das obere Vorzeichen in Gl. (36.30) der Fall (und nur dann, falls außerdem μ = e0F gesetzt wird). Deshalb ist die physikalische Lösung durch ∆p vp = . up ep + εp
(36.31)
gegeben. Einsetzen dieses Ausdrucks in die Normierungsbedingung (36.16) liefert nach elementarer Rechnung |u p |2 =
ep 1 (1 + ) , 2 εp
(36.32)
ep 1 ) (1 − 2 εp
(36.33)
womit aus der Normierungsbedingung |v p |2 = folgt.³ Die Phase von einer der beiden Amplituden u p , v p können wir willkürlich wählen. Wählen wir z. B. die u p reell und positiv, u p = |u p | , (36.34) so wird die Phase von v p nach Gl. (36.31) durch die von ∆ p festgelegt, da εp + ep > 0
für
|∆ p | ≠ 0 .
Für die weiteren Rechnungen ist es jedoch nicht notwendig, eine spezifische Wahl der Phasen der Amplituden u p bzw. v p vorzunehmen.
3 Einsetzen des Ausdrucks (36.33) in Gl. (36.23) liefert für ∆ p = 0 die korrekte Teilchenzahl ⟨N⟩ = 2 ∑ 1 , p l) beschränkt. Wegen M kl = −M lk können wir die ω kl als Elemente einer antisymmetrischen Matrix ω kl = −ω lk auffassen und die Summation dann über beide Indizes unabhängig voneinander lau fen lassen, 1 R(ω) = e− 2 ω kl M kl , (E.15) was auf den zusätzlichen Faktor 1/2 führt. (Das Summationszeichen haben wir hier wieder entsprechend unserer Konvention, über wiederholte Indizes zu summie ren, fallen gelassen.) Die R(ω) (E.15) definieren die fundamentale Darstellung der SO(N)-Gruppe. Wegen der Antisymmetrie der Matrizen M kl (E.12), (M kl ) ij = − (M kl ) ji , sind die R(ω) (E.14) offensichtlich orthogonal. In Analogie zum ℝ2 definieren wir eine Drehung im ℝN durch eine orthogonale Koordinatentransformation in einer zweidimensionalen Unterebene. Im ℝN gibt es ( N2 ) linear unabhängige (zweidimensionale) Ebenen, die wir als die Koordinatenebenen wählen können, welche jeweils durch zwei Koordinatenachsen aufgespannt werden. Folglich gibt es im ℝN genau (N2 ) unabhängige Drehungen, welche jeweils durch die unabhängigen Paare (k, l) von Koordinatenachsen charakterisiert werden. Im ℝ3 können wir mittels des total antisymmetrischen Tensors ϵ ikl jedem Paar (k, l) von Koordina tenachsen eindeutig eine dritte Koordinatenachse i zuordnen, bzw. eine Ebene lässt sich durch ihren Normalenvektor charakterisieren. Folglich lässt sich im ℝ3 eine Drehung statt durch eine Ebene auch durch einen Vektor charakterisieren, dessen Richtung die Drehachse definiert. Dies ist aber eine Be sonderheit des ℝ3 .
In Analogie zum zweidimensionalen Fall (E.10) führen wir deshalb die folgenden ver allgemeinerten Drehimpulsoperatoren L kl =
ℏ (x k ∂ l − x l ∂ k ) = x̂ k p̂ l − x̂ l p̂ k i
(E.16)
ein, wo k und l zwei Koordinatenachsen des ℝN bezeichnen und p̂ k = ℏi ∂ k der Impuls operator ist. Unter Benutzung der Vertauschungsrelation zwischen Ort- und Impuls operator, [x̂ k , p̂ l ] = iℏδ kl , (E.17) zeigt man leicht, dass diese verallgemeinerten Drehimpulsoperatoren der Lie-Algebra [L kl , L mn ] = iℏf(kl)(mn)(pq)L pq
(E.18)
542 | E Grundzüge der Gruppentheorie
genügen, wobei die f(kl)(mn)(pq) die bereits in (E.13) eingeführten Strukturkonstanten der Gruppe SO(N) sind: [L kl , L mn ] = iℏ(δ km L ln − δ lm L kn − δ kn L lm + δ ln L km ) .
(E.19)
Vergleich von (E.13) und (E.18) zeigt, dass die Operatoren ℏi L kl dieselben Kommutati onsbeziehungen wie die Matrizen M kl erfüllen und somit Generatoren der SO(N) sind. Folglich erhalten wir durch die Ersetzung M kl → ℏi L kl aus (E.15) eine Operatordarstel lung der SO(N)-Gruppe im Hilbert-Raum: R(ω) = e− 2 ℏ ω kl L kl , 1 i
(E.20)
wobei die ω kl in Analogie zum zweidimensionalen Fall verallgemeinerte Rotations winkel sind. Dementsprechend sind die R(ω) die verallgemeinerten Drehoperatoren der SO(N)-Gruppe. Da die Drehimpulsoperatoren hermitesch sind, ist der Drehopera tor unitär: R† (ω) = R−1 (ω) = R(−ω) . Wählt man eine konkrete Basis des Hilbert-Raums, auf welchem die L k definiert sind, so sind in dieser Basis die Drehoperatoren (E.20) durch unendlich dimensionale Ma trizen gegeben. Diese stellen reduzible Darstellungen der Gruppe SO(N) dar, die sich in unendlich viele endlich dimensionale irreduzible Darstellungen zerlegen lassen (siehe das weiter unten angegebene Beispiel der Gruppe SO(3)). Die fundamentale Darstel lung (nichttriviale irreduzible Darstellung niedrigster Dimension) steht mit den oben eingeführten antisymmetrischen Matrizen (E.12) über ⟨m|L kl |n⟩ =
ℏ (M kl )mn i
in Beziehung. Wegen der Vertauschungsregeln (E.17) vertauschen offenbar Drehimpulsoperato ren L kl (E.16), die zu disjunkten Koordinatenebenen gehören, z. B. [L12 , L34 ] = 0,̂ wäh rend [L12 , L23 ] ≠ 0.̂ In N = 2ν und N = 2ν + 1 Dimensionen gibt es ν disjunkte Koordi natenebenen und somit ν Erzeuger der Gruppen SO(2ν) und SO(2ν + 1), die sämtlich miteinander kommutieren und folglich die entsprechende Cartan-Algebra aufspan nen. Als diese können wir offensichtlich wählen: L2k−1,2k ,
k = 1, 2, . . . , ν .
E.5 Die Drehgruppe SO(3) Für die Anwendungen in der Physik ist von besonderem Interesse die Gruppe SO(3), die Gruppe der Drehungen im dreidimensionalen Raum ℝ3 . Im ℝ3 lässt sich jeder antisymmetrische Tensor zweiter Stufe durch einen Vektor repräsentieren. Diese Ver knüpfung erfolgt mit Hilfe des total antisymmetrischen Tensors dritter Stufe ϵ klm . Die
E.5 Die Drehgruppe SO(3) | 543
Drehimpulstensoren L kl (E.16) lassen sich im ℝ3 durch die gewöhnlichen Drehimpuls operatoren L k ausdrücken: L kl = ϵ klm L m , (E.21) welche der Algebra [L k , L l ] = iℏϵ klm L m
(E.22)
genügen. Dementsprechend lassen sich die Drehoperatoren (E.20) in der Form R(ω) = e− ℏ ω⋅L i
(E.23)
angeben, wobei wegen (E.21) die Drehwinkel ω k durch die früher eingeführten ω kl definiert sind: 1 ω k = ϵ klm ω lm . 2 Den Drehoperator (E.23) haben wir bereits in Abschnitt 26.5 kennengelernt (siehe Gl. (26.30)). Die Drehoperatoren (E.23) sind wie die Drehimpulse Operatoren im Hil bert-Raum der Zustandsfunktionen. Für ein spinloses Teilchen lassen sich die Basis zustände des entsprechenden Hilbert-Raums als |n⟩|lm⟩ wählen, wobei |n⟩ die Radialwellenfunktionen und |lm⟩ die Drehimpulseigenzu stände L2 |lm⟩ = ℏ2 l(l + 1)|lm⟩ , L z |lm⟩ = ℏm|lm⟩ sind. Da die Drehimpulsoperatoren nur auf die Winkelvariablen wirken, können wir die Radialfunktionen zur Berechnung der Matrixelemente von R(ω) außer Acht las sen. Da ferner die Drehimpulsoperatoren L k mit L2 kommutieren und somit keine nichtverschwindenen Matrixelemente zwischen Zuständen mit unterschiedlichen l besitzen, erhalten wir: ⟨lm|R−1 (ω)|l m ⟩ = δ ll Dlmm (ω) .
(E.24)
Für feste l bilden die Dlmm (ω) eine (2l + 1)-dimensionale irreduzible Darstellung der Drehgruppe SO(3). Die Hilbert-Raum-Matrix des (inversen) Drehoperators ⟨lm|R−1 (ω)|l m ⟩ zerfällt damit in irreduzible Darstellungen Dlmm (ω), welche durch die Drehimpulsquantenzahl l charakterisiert werden: D0 (ω) 0 ( 0 .. .
0 D1 (ω) 0 .. .
0 0 D2 (ω)
... ... ..
) .
.
Hierbei ist D0 (ω) = 1 die triviale Darstellung, welche zum Drehimpuls l = 0 gehört. Eine analoge Struktur hatten wir für die Matrix des Drehimpulsoperators in Gl. (15.40)
544 | E Grundzüge der Gruppentheorie gefunden. Eine alternative Darstellung des Drehoperators R(ω) (E.23) haben wir in (27.10) kennen gelernt: R(α, β, γ) = e− ℏ γL z e− ℏ βL y e− ℏ αL z , i
i
i
wobei die (α, β, γ) als Euler-Winkel bezeichnet werden. Die zugehörigen Matrixele mente Dlmm (α, β, γ) = ⟨lm|R−1 (α, β, γ)|lm ⟩ = ⟨lm|e ℏ αL z e ℏ βL y e ℏ γL z |lm ⟩ i
i
i
sind die Wigner’schen D-Funktionen, die ausführlich in Kapitel 27 behandelt wurden. Analog zu (E.21) können wir im ℝ3 die antisymmetrischen Matrizen M kl (E.12) durch drei unabhängige antisymmetrische Matrizen M m ausdrücken: M kl = ϵ klm M m , deren Matrixelemente durch (M k )ij = ϵ kij
(E.25)
gegeben sind. Die fundamentale Darstellung (E.15) der Gruppe SO(3) nimmt dann die Gestalt R(ω) = e−ω⋅M (E.26) an. Die Matrizen M k (E.25) liefern gerade die Drehimpuls (l = 1)-Darstellung S k (26.33) des Drehimpulsoperators L k im Hilbert-Raum, ℏ (E.27) (M k ) lm = iℏϵ lkm , i und somit ist die fundamentale Darstellung R(ω) (E.26) die irreduzible Darstellung, D l=1(ω) zum Drehimpuls l = 1. Mit der Beziehung (E.27) erkennen wir die fundamen tale Darstellung R(ω) (E.26) als die in (26.34) definierte Drehmatrix. (S k ) lm =
E.6 Die Gruppe der unitären Matrizen U(N) und SU(N) Diese Gruppe ist das komplexe Analogon der N-dimensionalen Drehgruppe O(N). Ge nau wie die orthogonalen Matrizen sind auch die unitären Matrizen U † = U −1 abge schlossen unter Multiplikation und erfüllen auch die übrigen Gruppenaxiome. Da jede reelle orthogonale Matrix auch gleichzeitig unitär ist, bildet die orthogonale Gruppe O(N) eine Untergruppe der unitären Gruppe U(N). Die unitären Matrizen erzeugen unitäre Transformationen im N-dimensionalen komplexen Vektorraum ℂN , welcher 2N reelle Dimensionen besitzt. Die Elemente die ses Raums sind N-komponentige Vektoren z1 z2 z=(.) .. zn
E.6 Die Gruppe der unitären Matrizen U(N) und SU(N) | 545
mit i. A. komplexen Koordinaten z i ∈ ℂ. Das in diesem Raum definierte Skalarprodukt N
(z, w) = z† w ≡ z∗ ⋅ w = ∑ z∗i w i i=1
von Vektoren z, w ∈ ℂN bleibt unter unitären Transformationen z → z = Uz
(E.28)
invariant. Unitäre Matrizen besitzen Determinanten vom Betrag 1: det(U) = e iα ,
α∈ℝ.
Die Untermenge der unitären Matrizen mit Determinante det(U) = 1 bildet die Gruppe der speziellen unitären Matrizen SU(N). Für die Physik sind von besonderem Interesse die Gruppen U(2) bzw. SU(2) sowie SU(3). Die Erzeuger G k der SU(2) sind in der fundamentalen Darstellung durch die PauliMatrizen σ k (15.44), (E.29) G k = 12 σ k , k = 1, 2, 3 , gegeben, welche den Kommutationsbeziehungen [σ k , σ l ] = 2iϵ klm σ m
(E.30)
genügen. Folglich sind die Strukturkonstanten f klm (E.2) der SU(2) durch den antisym metrischen Tensor ϵ klm gegeben. Dieselben Strukturkonstanten findet man auch für die Gruppe SO(3), was bedeutet, dass SO(3) und SU(2) lokal isomorph sind, vgl. Ab schnitt E.7. Mit (E.29) erhalten wir für die Elemente der SU(2) in der fundamentalen Darstellung: i U(ω) = e − 2 ω⋅σ . (E.31) Für die unitären Gruppen SU(N ≥ 3) gibt es neben den antisymmetrischen Struktur konstanten (E.2) noch symmetrische Strukturkonstanten d klm , die über den Antikom mutator der Generatoren in der fundamentalen Darstellung definiert sind: {G k , G l } = d klm G m +
1 δ kl . N
(E.32)
Da die Generatoren der SU(N) spurlos sind, Sp G k = 0 ,
(E.33)
folgt aus (E.32) die Orthonormierungsbedingung: Sp (G k G l ) =
1 δ kl . 2
(E.34)
Mit (E.33) und (E.34) erhalten wir aus den Beziehungen (E.2) und (E.32) Sp (G k [G l , G m ]) =
1 if klm , 2
Sp (G k {G l , G m }) =
1 d klm . 2
546 | E Grundzüge der Gruppentheorie Unter Ausnutzung der zyklischen Eigenschaft der Spur (Sp (AB) = Sp (BA)) folgt Sp (G k [G l , G m ]) = Sp (G l [G m , G k ]) = Sp (G m [G k , G l ]) , Sp(G k {G l , G m }) = Sp (G l {G m , G k }) = Sp (G m {G k , G l }) . Die f klm bzw. d klm sind folglich antisymmetrisch bzw. symmetrisch in jedem Index paar. Ferner bleiben diese Strukturkonstanten offensichtlich invariant unter zykli scher Permutation der Indizes.
E.7 Homomorphismus und Isomorphismus Eine Gruppe H heißt homomorph zu einer Gruppe G (H ∼ G), wenn es eine Abbildung ϕ : G → H mit der Eigenschaft ϕ(g1 g2 ) = ϕ(g1 )ϕ(g2 ) ,
∀ g1 , g2 ∈ G
gibt. Bei der homomorphen Abbildung können mehr als ein Element von G in das selbe Element von H abgebildet werden (d. h., sie muss nicht injektiv sein). Für jede Untergruppe U ⊆ G ist auch ihr Bild unter ϕ, ϕ(U) := {ϕ(g), g ∈ U} , eine Untergruppe von H. Die Menge ϕ(G) := {ϕ(g), g ∈ G} wird als das Bild von ϕ bezeichnet. Das Bild von ϕ ist stets eine Untergruppe von H. Ferner folgt aus den Gruppenaxiomen, dass das Einselement von G stets auf das Eins element von H abgebildet wird. Die Menge aller Elemente von G, die auf das Eins element von H abgebildet werden, heißt der Kern von ϕ. Er enthält mindestens das Einselement von G und ist stets ein Normalteiler (siehe Abschnitt E.1) von G. Ist die homomorphe Abbildung von G nach H darüber hinaus eineindeutig (bijek tiv), d. h., auch jedem Element von H ist genau ein Element von G zugeordnet, so ist H isomorph zu G. Falls H isomorph zu G ist, so ist offensichtlich auch G isomorph zu H. Wir sagen deshalb einfach H und G sind isomorph und bezeichnen dies mit G ≃ H. Im Folgenden geben wir einige Beispiele für Isomorphismus und Homomorphis mus an. Wir werden uns dabei auf die orthogonalen und unitären Gruppen beschrän ken.
E.7.1 Der Isomorphismus U(1) ≃ SO(2) Die zweidimensionale Ebene ℝ2 , die durch die Koordinaten (x1 , x2 ) aufgespannt wird, ist isomorph zur komplexen Zahlenebene ℂ1 , die durch die Gesamtheit der komplexen
E.7 Homomorphismus und Isomorphismus |
547
Zahlen z = x1 + ix2
(E.35)
aufgespannt wird. Eine komplexe Zahl x1 + ix2 definiert damit einen Vektor x=(
x1 ) x2
(E.36)
in ℝ2 . Ferner ist der Betrag der komplexen Zahl gleich der Norm des entsprechenden Vektors |z| = √z∗ z = √(x, x) = √x T x = √x21 + x22 . Der Betrag einer komplexen Zahl ändert sich bekanntlich nicht unter Multiplikation mit einer Phase z → e iω z . Die Gesamtheit der Phasen bilden die Gruppe der eindimensionalen unitären Matri zen U(1). Die Multiplikation der komplexen Zahl z (E.35) mit der Phase e iω ist äquiva lent zur Drehung (E.7), (E.8) des zugehörigen zweidimensionalen Vektors x (E.36) um den Winkel ω. In der Tat, aus z = e iω z !
= (cos ω + i sin ω)(x1 + ix2 ) = x1 + ix2 finden wir die aktive Drehung (26.25) des Vektors x um den Winkel ω: (
cos ω x1 )=( x2 sin ω
x1 − sin ω )( ) . x2 cos ω
Eine orthogonale Transformation im ℝ2 ist damit äquivalent zur einer unitären Trans formation in der komplexen Ebene ℂ1 . Somit haben wir folgenden Isomorphismus: ϕ : U(1) → SO(2) ,
e iω → R(ω) ,
wobei R(ω) die in Gln. (E.8) bzw. (E.9) definierte Matrix bezeichnet. Deshalb sind die zugehörigen Gruppen isomorph: SO(2) ≃ U(1) . Die oben angegebene Operatordarstellung der Gruppe SO(2) liefert automatisch auch eine Darstellung der Gruppe U(1), was man unmittelbar erkennt, wenn man den Dreh impulsoperator (E.10) in Radialkoordinaten (r, φ), z = re iφ = x1 + ix2 , aufschreibt: L=
ℏ ∂ . i ∂φ
548 | E Grundzüge der Gruppentheorie E.7.2 Der Homomorphismus SO(3) ∼ SU(2) Die Gruppen SO(3) und SU(2) besitzen dieselbe Lie-Algebra. Die Erzeuger der Gruppe SO(3) sind (bis auf einen Faktor ℏ) durch die antisymmetrischen Tensoren L kl (E.16) bzw. die gewöhnlichen Drehimpulsoperatoren L k (E.21) gegeben, die der Lie-Algebra (E.22) genügen. Dieselbe Algebra wird von den Erzeugern 2ℏ σ k der Gruppe SU(2) (E.29) erfüllt (siehe Gl. (E.30)). Die Gruppen SO(3) und SU(2) besitzen jedoch verschiedene Darstellungen. Um den Zusammenhang zwischen den beiden Gruppen zu finden, kon struieren wir zunächst eine Abbildung von ℂ2 auf ℝ3 . Dazu stellen wir die Vektoren z ∈ ℂ2 als Spaltenvektor z1 z=( ) , z2
z† = (z∗1 , z∗2 )
dar, wobei z1 , z2 ∈ ℂ gewöhnliche komplexe Zahlen sind. Mit Hilfe der Pauli-Matri zen σ k (15.44) können wir die z ∈ ℂ2 auf die Koordinaten x k des ℝ3 abbilden x k = z† σ k z .
(E.37)
Unter einer unitären Transformation U ∈ SU (2) transformieren sich die Vektoren z ∈ ℂ2 und ihre Adjungierten nach (E.28): z → z = Uz
⇒ z† → z† = zU † .
Über die Abbildung (E.37) transformieren sich dabei die Koordinaten x k des ℝ3 : x k → xk = z† σ k z = z† U † σ k Uz .
(E.38)
Für die speziellen unitären (2 × 2)-Matrizen U ∈ SU(2) wählen wir die Darstellung (E.31) i U(ω) = e − 2 ωσ . Unter Benutzung der SU(2)-Lie-Algebra (E.30) lässt sich unmittelbar folgende Identi tät beweisen: (E.39) U † (ω)σ k U(ω) = R kl (ω)σ l , wobei R(ω) = e−ω⋅M
(E.40)
die fundamentale Darstellung (E.26) der Gruppe SO(3) ist, welche mit der Drehmatrix (26.34) zusammenfällt. Zum Beweis von (E.39) muss man lediglich die linke Seite der Gleichung in ei ne Reihe von Vielfach-Kommutatoren entwickeln (siehe Gl. (C.17)) und wiederholt die Algebra (E.30) benutzen. Da die Generatoren (der fundamentalen Darstellung) der
E.7 Homomorphismus und Isomorphismus
| 549
SU(2), σ k /2, dieselbe Algebra erfüllen wie die Generatoren der SO(3), L k /ℏ, folgt die Gl. (E.39) bereits aus der Gl. (26.56). Einsetzen von (E.39) in (E.38) liefert unter Benutzung von (E.37) das Transforma tionsgesetz (26.46) der aktiven Drehung: xk = R kl (ω)x l . Durch die Abbildung (E.37) induziert eine unitäre Transformation U(ω) der z ∈ ℂ2 eine orthogonale Transformation R(ω) (Drehung) der x ∈ ℝ3 . Dies ist der gesuchte Zusammenhang zwischen SU(2)- und SO(3)-Transformationen. Multiplizieren wir Gl. (E.39) mit σ l , bilden die Spur und benutzen Sp(σ k σ l ) = 2δ kl , so erhalten wir für die Drehmatrix R(ω) (E.40) die Darstellung R kl (ω) =
1 Sp(σ k U(ω)σ l U † (ω)) , 2
(E.41)
welche den gesuchten Homomorphismus ϕ : SU(2) → SO(3) ,
U(ω) → R(ω)
(E.42)
liefert. Man beachte, dass ein Vorzeichenwechsel U(ω) → −U(ω) die Drehmatrix R(ω) (E.41) invariant lässt. Damit bildet der Homomorphismus (E.42) U ∈ SU(2) und (−U) ∈ SU(2) auf dieselbe Matrix R ∈ SO(3) ab. Damit ist die Abbildung (E.42) nicht injektiv und die Gruppen SU(2) und SO(3) sind nicht isomorph. Beachten wir, dass die ϵ klm die Strukturkonstanten f klm der SU(2) sind, so er kennen wir aus (E.3), dass die Matrizen −iM k (E.25) bzw. S k /ℏ (E.27) die Erzeuger der SU(2) in der adjungierten Darstellung sind. Dementsprechend definiert die Dreh matrix (E.40) R(ω) ∈ SO(3) die adjungierte Darstellung der SU(2). (Gleichzeitig bilden die R(ω) die fundamentale Darstellung der SO(3).) Neben den oben bereits besprochenen Iso- bzw. Homomorphismen zwischen den orthogonalen und unitären Gruppen existieren noch folgende weitere Homomorphis men: SO(4) ∼ SU(2) × SU(2) , SO(6) ∼ SU(4) . Man überzeugt sich leicht, dass keine weiteren Isomorphismen zwischen orthogona len und unitären Gruppen existieren können, indem man die Anzahl der Erzeuger der beiden Gruppen betrachtet. Während die Gruppe O(N) N ( ) 2
550 | E Grundzüge der Gruppentheorie
Erzeuger besitzt, nämlich die Anzahl der linear unabhängigen antisymmetrischen N-dimensionalen Matrizen, hat die Gruppe SU(N) N2 − 1 Erzeuger, was der Anzahl der linear unabhängigen N-dimensionalen hermiteschen spurlosen Matrizen entspricht. Die Gruppe U(N) besitzt darüber hinaus die N-dimen sionale Einheitsmatrix als Erzeuger, sodass die Gesamtheit der Erzeuger der Gruppe U(N) durch die N 2 unabhängigen hermiteschen (N × N)-Matrizen gegeben sind.
E.8 Nicht-kompakte Gruppen: Die Lorentz-Gruppe Bisher haben wir solche Lie-Gruppen behandelt, deren Parameterräume kompakte Mannigfaltigkeiten waren. Beispielsweise waren bei den orthogonalen Drehgrup pen die Parameter durch Winkel gegeben, deren Definitionsbereich auf das Intervall [0, 2π] beschränkt werden konnte. Ähnliches gilt für die unitären Gruppen, z. B. für die Gruppe U(1), deren Darstellungen durch die Phasen e iω mit reellem Winkel ω ∈ [0, 2π] gegeben sind. Deshalb ist die Gruppenmannigfaltigkeit dieser Gruppe durch den Einheitskreis S1 in zwei Dimensionen gegeben. Ähnlich ist die Gruppen mannigfaltigkeit der Gruppe SU(2) durch die Einheitskugel S3 in vier Dimensionen gegeben. Neben diesen kompakten Gruppen existieren auch nichtkompakte Grup pen, bei denen die Definitionsbereiche der Gruppenparameter nichtkompakte (unbe schränkte) Mannigfaltigkeiten sind. Wir wollen uns im Folgenden auf die nichtkom pakten pseudoorthogonalen Gruppen O(n, m) beschränken. Wir hatten festgestellt, dass die orthogonalen Gruppen O(N) das Skalarprodukt im euklidischen Raum ℝN invariant lassen. Schreiben wir dieses Skalarprodukt wie allgemein üblich mit Hilfe eines Metriktensors, x ⋅ y = x μ g μν y ν = x μ y μ ,
(E.43)
so besitzt dieser für den euklidischen Raum die einfache Gestalt g μν = δ μν = diag(1, 1, . . . , 1) . Der Metriktensor ist hier durch die Einheitsmatrix gegeben. Neben diesen euklidi schen Räumen gibt es sogenannte pseudoeuklidische Räume ℝn,m , in denen die Metrik durch g μν = diag(1, 1, . . . , 1, −1, −1, . . . , −1) (E.44) ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ n
m
definiert ist. Im Gegensatz zu den euklidischen Räumen ist die Metrik hier nicht positiv definit. Ein wichtiger Spezialfall der pseudoeuklidischen Räume ist der MinkowskiRaum, in welchem die Metrik durch g μν = diag(1, −1, −1, −1)
E.8 Nicht-kompakte Gruppen: Die Lorentz-Gruppe |
551
definiert ist. Lineare Koordinatentransformationen x μ → xμ = Λ ν x ν , μ
(E.45)
welche die Metrik (E.43) mit dem Metriktensor (E.44) invariant lassen, werden als pseudoorthogonale Transformationen bezeichnet. Sie werden durch pseudoorthogo μ nale Matrizen Λ ν vermittelt, die wie die orthogonalen Matrizen eine Gruppe bilden, die mit O(n, m) bezeichnet wird. Im Folgenden wollen wir uns auf die pseudoortho gonale Gruppe O(1, 3) ≃ O(3, 1) beschränken, welche die Drehgruppe im MinkowskiRaum repräsentiert und als Lorentz-Gruppe bezeichnet wird. Ihre Elemente sind die Lorentz-Transformationen. Die Lorentz-Transformation lässt die Länge eines Vektors im Minkowski-Raum 2
3
2
x2 = x μ g μν x ν = (x0 ) − ∑ (x i ) i=1
invariant. Diese ist offenbar nicht positiv definit. Da die Lorentz-Transformation diese Länge invariant lässt, können wir drei Bereiche des Minkowski-Raums unterscheiden, siehe Abb. 28.1: 1. zeitartig: x2 > 0 , 2. lichtartig: x2 = 0 , 3. raumartig: x2 < 0 . Aus der Relativitätstheorie wissen wir, dass die Lichtgeschwindigkeit die maxima le Signalgeschwindigkeit darstellt. Jeder Punkt im Minkowski-Raum repräsentiert ein Ereignis. Ereignisse, die sich mit Lichtgeschwindigkeit ausbreiten, werden durch Vektoren verbunden, welche die Länge null besitzen. Solche Ereignisse sind mit der Bewegung von masselosen Teilchen wie den Photonen verbunden, die sich mit Licht geschwindigkeit bewegen. Massive Teilchen breiten sich demgegenüber mit einer Geschwindigkeit aus, die kleiner als die Lichtgeschwindigkeit ist. Deshalb sind die Punkte der Trajektorien von massiven Teilchen im Minkowski-Raum durch zeitartige Vektoren verknüpft, die eine positive Länge besitzen. Hypothetische Teilchen, die sich mit Überlichtgeschwindigkeit bewegen, werden Tachyonen genannt. Die Punkte der Trajektorien dieser Teilchen im Minkowski-Raum sind durch raumartige Vektoren, d. h. Vektoren mit negativer Länge verbunden. Diese Sachverhalte sind in Abb. 28.1 dargestellt. Auf dem Lichtkegel befinden sich die Trajektorien der masselosen Teil chen, die sich mit Lichtgeschwindigkeit bewegen. Ereignisse, zwischen denen ein kausaler Zusammenhang besteht, d. h., die sich mit einer Geschwindigkeit kleiner als der Lichtgeschwindigkeit ausbreiten, sind durch Vektoren im Inneren des Lichtkegels gegeben. Dieses Gebiet heißt deshalb der kausale oder zeitartige Bereich. Trajektori en von Tachyonen verlaufen hingegen außerhalb des Lichtkegels. Kausalität bedeutet auch, dass Signale nur vorwärts in der Zeit propagiert werden, d. h. vom Ursprung in den Vorwärtslichtkegel. (In der Quantenfeldtheorie ist man allerdings auch ge zwungen, Propagatoren in dem Rückwärtskegel zu betrachten. Sie verletzen nicht die
552 | E Grundzüge der Gruppentheorie
Kausalität, da sie als (kausale) Propagatoren von Antiteilchen in dem Vorwärtskegel interpretiert werden können.) Aus der Forderung nach der Invarianz der Länge unter Lorentz-Transformation (E.45), x2 = x2 , erhalten wir die Bedingung an die Matrizen Λ μ ν g μν Λ μ κ Λ ν λ = g κλ
(E.46)
bzw. in Matrixschreibweise² Λ T gΛ = g . Hieraus finden wir det Λ = ±1 .
(E.47)
Setzen wir in (E.46) κ = λ = 0, so folgt 3
2
2
(Λ0 0 ) = 1 + ∑ (Λ i 0 ) , i=1
was Λ0 0 ≥ 1
Λ0 0 ≤ −1
oder
impliziert. Damit lassen sich die Lorentz-Transformationen nach dem Vorzeichen von Λ0 0 und dem von det Λ klassifizieren, siehe Tab. E.1, und somit zu vier Klassen zusam ↑ menfassen. Die Lorentz-Transformationen L↑ bzw. L+ werden als orthochron bzw. ei gentlich orthochron bezeichnet. Sie bilden jeweils eine Untergruppe der Lorentz-Grup ↑ ↓ pe. Die Klassen L− , L∓ bilden offensichtlich keine Untergruppe der Lorentz-Gruppe, da sie das Einselement nicht enthalten. Sie gehen durch Raum (P)- bzw. Zeitspiege ↑ lung (T) oder beiden aus der Gruppe L+ hervor ↑
↑
L− = PL+ ,
↓
↑
L− = TL+ ,
↓
↑
L+ = PTL+ .
Tab. E.1: Klassifikation der Lorentz-Transformationen (LT). sgn Λ 0 0
LT
+1
L↑
−1
L↓
det Λ
LT
+1
L+
−1
L−
+1
L+
−1
L−
↑ ↑ ↓ ↓
Wie im euklidischen Raum können wir auch im Minkowski-Raum verallgemeinerte Drehimpulsoperatoren definieren, die durch L μν = x̂ μ p̂ ν − x̂ ν p̂ μ = iℏ(x μ ∂ ν − x ν ∂ μ ) ,
p̂ μ = iℏ∂ μ
2 Hierbei wird Λ μ ν als die gewöhnliche Matrix M μν := Λ μ ν interpretiert.
(E.48)
E.8 Nicht-kompakte Gruppen: Die Lorentz-Gruppe | 553
gegeben sind. Diese Operatoren erfüllen die Lie-Algebra der Lorentz-Gruppe: [L μν , L ρσ ] = iℏ(g νρ L μσ − g μρ L νσ − g νσ L μρ + g μσ L νρ ) .
(E.49)
Ersetzen wir den Metriktensor g μν durch (−δ μν ), so geht diese Algebra in die der ortho gonalen Gruppen (E.19) über. Analog zu den orthogonalen Gruppen (vgl. Gl. (E.20)) ist die Hilbert-Raum-Darstellung der pseudoorthogonalen Gruppen durch R(ω) = e− 2 ℏ ω μν L 1 i
μν
(E.50)
gegeben. Hierbei sind die ω μν Parameter, die den Drehwinkeln der orthogonalen Gruppen entsprechen. Diese Parameter stehen in einem nichtlinearen Zusammen μ hang mit der Matrix Λ ν der zugehörigen Lorentz-Transformation der Koordinaten. Für infinitesimale Lorentz-Transformationen, d. h. infinitesimale Parameter ω μν , be steht der lineare Zusammenhang Λ μν (ω) = g μν + ω μν .
(E.51)
Schließlich geben wir noch die Wirkung der Lorentz-Gruppe auf ein Vektorfeld ϕ μ (x) im Minkowski-Raum an. Dieses transformiert sich nach: R−1 (ω)ϕ μ (x)R(ω) = Λ(ω) ν ϕ ν (x) , μ
xμ = Λ(ω) ν x ν , μ
(E.52)
was die Verallgemeinerung des Transformationsgesetzes (26.53) von Vektoren im ℝ3 unter Drehungen ist. Für eine infinitesimale Lorentz-Transformation (E.51) genügt es, diese Gleichung in führender Ordnung in ω μν zu entwickeln. Dies liefert ϕ μ (x) +
i ω κλ [L κλ , ϕ μ (x)] = ϕ μ (x) + ω μ ν ϕ ν (x) . 2ℏ
Berücksichtigen wir die Antisymmetrie ω κλ = −ω λκ , so erhalten wir von den Termen linear in ω κλ die Beziehung [L κλ , ϕ μ (x)] = iℏ (g μλ ϕ κ (x) − g μκ ϕ λ (x)) ,
(E.53)
was die differenzielle Form des Transformationsgesetzes (E.52) für Vektorfelder ϕ μ (x) unter Lorentz-Transformationen ist. Gl. (E.53) ist die Verallgemeinerung der Bezie hung (26.54) für Vektoren V k in ℝ3 auf Vierervektoren im Minkowski-Raum. Wir hatten oben einen Gruppenhomomorphismus zwischen der SO(4) und der Produktgruppe SU(2) × SU(2) angegeben. Da die Lorentz-Gruppe der Gruppe SO(4) sehr ähnlich ist, sollte auch ein Zusammenhang zwischen ihr und der Gruppe SU(2) × SU(2) bestehen. Um diesen Zusammenhang herzustellen, bezeichnen wir die Erzeuger der Lorentz-Gruppe mit zeitartigem Anteil mit L0k = K k , und ersetzen die räumlichen Komponenten durch die zugehörigen Drehimpulsopera toren 1 L k = ϵ klm L lm . 2
554 | E Grundzüge der Gruppentheorie
Es lässt sich dann leicht zeigen, dass die so eingeführten Operatoren der Algebra [K k , K l ] = −iℏϵ klm L m , [L k , K l ] = iℏϵ klm K m , [L , L ] = iℏϵ klm L k
l
(E.54)
m
genügen. Diese Algebra unterscheidet sich von der der Gruppe SO(4) nur durch das Vorzeichen auf der rechten Seite der ersten Gleichung. Die letzte Beziehung ist die gewöhnliche Kommutationsbeziehung für Drehimpulsoperatoren. Die beiden ersten Gleichungen verkoppeln die räumlichen und zeitlichen Komponenten der Genera toren der Lorentz-Gruppe. Die Operatoren K i erzeugen einen sogenannten LorentzBoost (d. h. eine Lorentz-Transformation, die Raum- und Zeitkoordinaten mischt, siehe Gl. (28.2)), während die L i die gewöhnlichen Drehimpulsoperatoren des dreidi mensionalen Raums sind. Da die Generatoren K i der Boost-Transformationen keine abgeschlossene Algebra bilden (d. h. bezüglich Kommutation nicht abgeschlossen sind), siehe Gl. (E.54), bilden die Boosts keine Untergruppe der Lorentz-Transforma tionen. Vielmehr zeigt Gl. (E.54), dass eine Folge zweier Boosts eine Drehung enthält. Führen wir schließlich die Linearkombinationen k I(±) =
1 k (L ± iK k ) 2
ein, so zerfällt die obige Algebra der Lorentz-Gruppe in zwei unabhängige SU(2)Algebren: k l [I(+) , I(−) ] = 0̂ , k l m , I(±) ] = iℏϵ klm I(±) . [I(±)
Damit lassen sich sämtliche Darstellungen der Lorentz-Gruppe aus zwei irreduziblen SU(2)-Darstellungen aufbauen. Die Quantenzahlen j(±) der zugehörigen Casimirope ratoren I 2(±) 2 I(±) : ℏ2 j(±) (j(±) + 1) können die Werte j(±) = 0, 12 , 1, 32 , . . . annehmen. Wenn j(+) , j(−) halbzahlig ist, besit zen die resultierenden Darstellungen der Lorentz-Gruppe Spinor-Charakter, d. h. be schreiben Teilchen mit halbzahligem Spin (Fermionen). Im alternativen Fall beschrei ben sie Teilchen mit ganzzahligem Spin (Bosonen).
E.9 Minimale Darstellung der Lorentz-Transformationen durch die Gruppe SL(2, ℂ) Bekanntlich werden Drehungen im dreidimensionalen Raum durch dreidimensionale orthogonale Matrizen mit Determinante 1 beschrieben und die Gesamtheit der Dre hungen bildet die Gruppe SO(3). Die Darstellungen dieser Gruppe besitzen ungerade
E.9 Minimale Darstellung der Lorentz-Transformationen durch die Gruppe SL(2, ℂ) |
555
Dimension (2l + 1) und erlauben nur die Beschreibung von ganzzahligen Drehimpul sen l. Halbzahlige Drehimpulse werden durch Darstellungen der SU(2) beschrieben, die dieselbe Algebra wie die SO(3) besitzt und als universelle Überlagerungsgruppe (oder kleinste getreue Abbildung ihrer Algebra) bezeichnet wird. Zwischen diesen bei den Gruppen besteht ein Homomorphismus mit Kern Z(2) = {−e, e}, d. h., es existiert der Zusammenhang (Isomorphismus) SU(2)/Z(2) ≃ SO(3) .
(E.55)
Im Gegensatz zur SO(3) ist die Gruppe SU(2) einfach zusammenhängend. Dies be deutet, dass jede geschlossene Kurve in der Gruppenmannigfalt (S 3 für SU(2)) topo logisch trivial ist, d. h. sich stetig auf einen Punkt zusammenziehen lässt. Ähnlich ↑ besitzt die zusammenhängende Komponente L+ der Lorentz-Gruppe als universel le Überlagerungsgruppe die SL(2, ℂ), die „spezielle lineare“ Gruppe der komplexen (2 × 2)-Matrizen mit Determinante 1. Um dies zu sehen, stellen wir den Vierervektor x μ als hermitesche (2 × 2)-Matrix dar: X = x0 𝟙 + x ⋅ σ = (
x0 + x3 x1 + ix2
x1 − ix2 ) , x0 − x3
(E.56)
wobei σ k=1,2,3 die Pauli-Matrizen sind. Offenbar gilt: det(X) = (x0 )2 − x2 = x μ x μ = x2 . μ
Eine Lorentz-Transformation Λ ν (E.45) des Vierervektors x μ lässt sich durch die linea re Transformation der Matrix (E.56), X → X = L(Λ)XL† (Λ) ,
(E.57)
beschreiben, wobei L(Λ) eine zweidimensionale Darstellung der Lorentz-Gruppe³ ist. Die Invarianz der Länge des Vierervektors x μ verlangt, dass: !
det(X ) = det(X)| det(L(Λ))|2 = det(X) , d. h. | det L(Λ)| = 1 . Da eine globale Phase der Matrix L(Λ) aus dem transformierten Vierervektor X (E.57) herausfällt, können wir uns o. B. d. A. auf Matrizen mit det L(Λ) = 1 beschränken. Die komplexen (2 × 2)-Matrizen L mit det L = 1 bilden aber gerade die Gruppe SL(2, ℂ). 3 Man beachte, dass bei dieser Transformation die Hermitizität erhalten bleiben muss, d. h., X muss wie X hermitesch sein.
556 | E Grundzüge der Gruppentheorie Um den Zusammenhang zwischen der vierdimensionalen Matrix Λ μ ν der Lo rentz-Transformation (E.45) und der in Gl. (E.57) definierten zugehörigen Matrix L(Λ) ∈ SL (2, ℂ) herzustellen, führen wir zunächst die Vierervektoren σ μ = (σ 0 , σ 1 , σ 2 , σ 3 ) ≡ (𝟙, σ) , ̃0 , σ ̃1, σ ̃2, σ ̃ 3 ) = (𝟙, −σ) ̃ μ = (σ σ ein, mit deren Hilfe sich die Matrix X (E.56) als Skalarprodukt im Minkowski-Raum, ̃μ , X = xμ σ
(E.58)
schreiben lässt. Wegen ̃ ν ) = 2g μν Sp(σ μ σ
bzw.
̃ ν ) = 2δ μ ν Sp (σ μ σ
erhalten wir
1 Sp (σ μ X) . 2 Unter Benutzung dieser Beziehung liefert Einsetzen von (E.58) in Gl. (E.57), Multipli kation mit σ μ und Bildung der Spur nach Vergleich mit (E.45) den gesuchten Zusam menhang: 1 ̃ ν L† ) . Λ(L)μ ν = Sp (σ μ L σ (E.59) 2 Hieraus folgt unmittelbar 1 Λ0 0 = Sp (LL† ) . (E.60) 2 Jede komplexe (2 × 2)-Matrix L lässt sich in der Form (vgl. (E.58)) xμ =
̃μ L = z0 + z ⋅ σ = z μ σ
(E.61)
mit komplexen z μ schreiben. Ihre Determinante ist dann durch det L = z20 − z2 gegeben. Für die L(Λ) ∈ SL(2, ℂ) gilt dann z20 − z2 = 1 .
(E.62)
Mit der Darstellung (E.61) finden wir aus (E.60) Λ0 0 = |z0 |2 + z∗ ⋅ z > 0 und somit sgn (Λ0 0 ) = 1 . Nach (E.47) besitzen die Lorentz-Matrizen Λ μ ν die Determinanten ±1. Da die Matrizen Λ(L)μ ν (E.59) analytische Funktionen der komplexen Parameter z μ in L (E.61) sind, lässt sich durch Änderung dieser Parameter kein sprunghaftes Ändern von det(Λ(L)) und damit auch kein Vorzeichenwechsel erreichen. Um festzustellen, welches Vorzei
E.10 Die Poincaré-Gruppe | 557
chen die Determinante der Matrix Λ(L) (E.59) besitzt, genügt es daher, diese für einen speziellen Parameterwert zu berechnen. Zweckmäßigerweise wählen wir dazu z = 0, was nach (E.62) z20 = 1 impliziert. Für z = 0 ist die Berechnung der Matrix (E.59) trivial. Man findet Λ(L)μ ν |z=0 = δ μ ν |z0 |2 und somit det Λ(L) = 1 . Damit gehören die durch die Matrizen L ∈ SL (2, ℂ) generierten Lorentz-Transforma ↑ tionen Λ(L) zur eigentlichen orthochronen Lorentz-Gruppe L+ . Da mit L ∈ SL (2, ℂ) μ auch (−L) ∈ SL(2, ℂ), das Vorzeichen von L aber für Λ(L) ν (E.59) irrelevant ist, d. h. Λ(−L)μ ν = Λ(L)μ ν , gilt der Zusammenhang
↑
SL (2, ℂ)/Z(2) = L+ analog zur Beziehung (E.55) zwischen SU(2) und SO(3). Als illustratives Beispiel wählen wir L = U als unitäre Matrix U mit det U = 1. Wegen U † U = 1 erhalten wir aus (E.59) unmittelbar Λ(U)0 0 = 1 ,
Λ(U)0 i = Λ(U)i 0 = 0
und ferner
1 Sp (σ i Uσ j U † ) . 2 Nach Gl. (E.41) ist dies aber gerade die SU(2)-Darstellung der Drehmatrix R ij ∈ SO (3). Die zu L = U ∈ SU(2) gehörige Lorentz-Transformation ist somit eine Drehung im ℝ3 . Λ(U)i j =
E.10 Die Poincaré-Gruppe E.10.1 Definition und Casimir-Operatoren Die Poincaré-Transformationen x μ → xμ = Λ ν x ν + a μ μ
enthalten neben den Lorentz-Transformationen noch die (linearen) Translationen. Wie bereits aus der nichtrelativistischen Quantenmechanik bekannt, sind die Erzeu ger der Translationen die Impulse, d. h. im Minkowski-Raum die Vierer-Impulse p̂ μ = iℏ∂ μ . Die Gesamtheit der Poincaré-Transformationen bilden ebenfalls eine Gruppe, die Poincaré-Gruppe. Sie ist ebenfalls eine Lie-Gruppe, die von den Generatoren der Lo rentz-Gruppe L μν und den Impulsen p̂ μ erzeugt wird. Die zugehörige Poincaré-Algebra
558 | E Grundzüge der Gruppentheorie
enthält neben der Lorentz-Algebra (E.49) noch die Kommutationsbeziehungen [L μν , p̂ ρ ] = iℏ(g νρ p̂ μ − g μρ p̂ ν ) , [p̂ μ , p̂ ν ] = 0̂ . Die erste dieser beiden Gleichungen zeigt, dass der Impuls selbst ein Lorentz-Vek tor ist, d. h. sich wie ein Vierervektor unter Lorentz-Transformationen verhält, siehe Gl. (E.53). Die Poincaré-Gruppe besitzt zwei Casimir-Operatoren: 1. p̂ 2 = p̂ μ p̂ μ Diese Größe ist ein Casimir-Operator, da p̂ 2 ein Skalar unter Lorentz-Transforma tionen ist, d. h. [p̂ 2 , L μν ] = 0̂ ,
2.
was unmittelbar aus der Poincaré-Algebra folgt. Ferner kommutieren die Impulse untereinander. Damit kommutiert p̂ 2 mit allen Erzeugern der Poincaré-Gruppe. Ŵ 2 = Ŵ μ Ŵ μ Hierbei ist
1 Ŵ μ = ϵ μνκλ p̂ ν L κλ 2 der Pauli-Lubanski-Vektor. (Streng genommen ist diese Größe ein Pseudovektor wegen der Anwesenheit des total antisymmetrischen Tensors vierter Stufe ϵ μνκλ , der sich unter Raumspiegelungen wie ein Pseudoskalar verhält.) Aus der Definition des Pauli-Lubanski-Vektors folgt unmittelbar: p̂ μ Ŵ μ = 0̂ . Alle physikalischen Teilchenzustände lassen sich nach den Eigenwerten dieser zwei Casimir-Operatoren klassifizieren. Der gewöhnliche Spinoperator S 2 ist kein Casimir-Operator der Lorentz-Gruppe. Dies ist intuitiv klar, da bei einem Lorentz-Boost eines Teilchens Zeit- und Raumkoordinaten gemischt werden, und so die Definition eines Drehimpulses ihren Sinn verliert.
E.10.2 Physikalische Bedeutung der Casimir-Operatoren Wie bereits aus der relativistischen Kinematik einer Punktmasse bekannt ist, ist das Quadrat des Vierer-Impulses durch die Ruhemasse des Teilchens gegeben: p2 = (mc)2 . Die Ruhemasse m legt den Eigenwert des Casimir-Operators p̂ 2 fest und charakterisiert somit die Darstellungen der Poincaré-Gruppe. Im Ruhesystem des Teilchens, p μ = (mc, 0) ,
E.10 Die Poincaré-Gruppe |
559
nimmt der Pauli-Lubanski-Vektor die Gestalt Ŵ 0 = 0̂ ,
1 Ŵ i = − mcϵ ijk0 L jk 2
an. Beachten wir, dass ϵ ijk0 = ϵ ijk , und führen die gewöhnlichen Drehimpulsoperatoren J î =
1 ϵ ijk L jk 2
ein, so nimmt der Pauli-Lubanski-Vektor im Ruhesystem die Gestalt ̂ , Ŵ μ = (0,̂ W)
Ŵ = −mc J ̂
an. Sein räumlicher Anteil repräsentiert (bis auf einen Proportionalitätsfaktor) somit den Drehimpuls im Ruhesystem des Teilchens, der als Spin bezeichnet wird. (Im Ruhe system kann das Teilchen keinen Bahndrehimpuls besitzen.) Für das Quadrat dieses Vektors erhalten wir daher: −Ŵ 2 = −Ŵ μ Ŵ μ = Ŵ 2 = m2 c2 J 2̂ = m2 c2 ℏ2 s(s + 1)1̂ ≡ −W 2 1̂ , wobei wir die Quantenzahl des Quadrats des inneren Drehimpulses mit s bezeichnet haben. Für masselose Teilchen mit Impuls p (d. h. für Teilchen, die sich in einem ViererImpulseigenzustand |p⟩ befinden) haben wir offenbar: Wμ W μ = 0 ,
Wμ pμ = 0 ,
pμ pμ = 0 .
Diese drei Gleichungen können nur dann gleichzeitig erfüllt sein, wenn ein linearer Zusammenhang zwischen W μ und p μ besteht, wie wir im Folgenden zeigen. Ohne Beschränkung der Allgemeinheit gilt: W = hp + gW⊥ , wobei W⊥ der Anteil von W ist, der senkrecht auf p steht, d. h. p ⋅ W⊥ = 0 , und h und g zunächst beliebige reelle Zahlen sind. Aus W 2 = 0 folgt: W02 = W 2 = h2 p2 + g2 W⊥2 ,
(E.63)
p20 = p2
(E.64)
aus p2 = 0 folgt: und aus pW = 0 folgt: p0 W0 = p ⋅ W = hp2 .
560 | E Grundzüge der Gruppentheorie
Setzen wir hier (E.64) ein, so erhalten wir W0 = hp0 .
(E.65)
Aus (E.63), (E.64) und (E.65) folgt schließlich g = 0 und somit: W = hp . Damit gilt für ein masseloses Teilchen der lineare Zusammenhang W μ = hp μ . Die hier auftretende Größe h wird als Helizität bezeichnet. Nehmen wir diese Bezie hung für μ = 0 und benutzen die Definition des Pauli-Lubanski-Vektors 1 0νκλ p ν L κλ ϵ 2 1 = − ϵ ijk p i L jk = −p i J i = p i J i = p ⋅ J 2
W0 =
und beachten ferner, dass für ein masseloses Teilchen die Beziehung p0 = |p| besteht, so finden wir für die Helizität: J⋅p h= . |p| Unter Paritätstransformationen (Raumspiegelungen) ändert die Helizität offenbar ihr Vorzeichen, h → −h, da der Impuls als Vektor sein Vorzeichen ändert, p μ → −p μ , während der Pauli-Lubanski-Pseudo-Vektor sich nicht verändert, W μ → W μ . Masselo se Teilchen besitzen daher zwei Helizitätszustände, in denen der Pauli-Lubanski-Vek tor W μ parallel oder antiparallel zum Vierer-Impuls p μ ausgerichtet ist. Damit kann die Helizität für jeden Wert des Spins nur zwei verschiedene Werte ±|h| annehmen. Sämtliche physikalische Teilchen sind durch irreduzible Darstellungen der Poin caré-Gruppe charakterisiert und müssen sich deshalb durch die Eigenwerte der beiden Casimir-Operatoren, d. h. durch die Masse und den Spin im Ruhesystem des Teilchens ausdrücken lassen. Die Poincaré-Gruppe besitzt die in Tab. E.2 angegebenen irreduzi blen Darstellungen. Tab. E.2: Darstellungen der Poincaré-Gruppe. p 2 (Massen) p2
=
m2
>0
Spin s 0,
Teilchenzustände
1 3 2 , 1, 2 ,
...
|ms⟩
p2 = 0
1 3 2 , 1, 2 , .
p2 = 0
kontinuierlich
–
–
Tachyonen
p2
0 ist der Integrand von der Ordnung 1 exp (−(β − δ) Re z) , |z|
H.2 Matsubara-Summen | 597
während für |z| → ∞ und Re z < 0 der Integrand von der Ordnung 1 exp(δ Re z) |z| ist. Da β > δ > 0, verschwinden die Beiträge zum Integral von den halbkreisförmigen Abschnitten des Wegs C . Die Beiträge von den beiden Wegen parallel zur Re z-Achse kompensieren sich, da diese beiden Wege in entgegengesetzter Richtung durchlau fen werden. Der einzige nicht verschwindende Beitrag kommt von dem geschlossenen Weg um den Pol bei z = x und wir erhalten unter Benutzung des Residuensatzes +
1 e iω n δ 1 . ∑ + = − βx δ→0 β n iω n − x e −1 lim
(H.13)
Das Minuszeichen entsteht, da der Kreis um den Pol bei z = x vom Weg C im mathe matisch negativen Sinn durchlaufen wird. Für die analoge Summe über die fermioni schen Matsubara-Frequenzen finden wir unter Benutzung von Gln. (H.12) und (H.10) −
1 e iω n δ 1 dz e izδ 1 ∑ − ∮ βz = βx = − lim . β 2πi z − x δ→0 δ→0 e +1 e +1 n iω n − x lim
(H.14)
C
Die Brüche auf der rechten Seite von Gln. (H.13) bzw. (H.14) sind die Bose- bzw. FermiVerteilungsfunktionen.
Stichwortverzeichnis Abel’scher Grenzwertsatz 58 Ableitung, kovariante 227, 495 Abrikosov-Vortex 500 adiabatische Näherung 251 Antikommutationsbeziehung 350 Antiteilchen 210, 222, 223, 374 antiunitärer Operator 127 asymptotische Freiheit 158 Austauschentartung 294 Austauschwechselwirkung 309 Baryon 154 Basis, kartesische 134 BCS-Theorie 501 – bei endlichen Temperaturen 522, 524 BCS-Zustand 504 Berry-Phase 256, 258 – mechanische Interpretation 285 Berry-Potenzial 261 Besetzungszahl, thermische 395, 410, 446 Besetzungszahldarstellung 339 Besetzungszahloperator 346 Bezugssystem, körperfestes 179 Bianchi-Identität 202 Bogoljubov-Transformation 516 Bohm-Aharonov-Effekt 272, 276 Boltzmann-Konstante 389 Boltzmann-Verteilung 390 Born-Oppenheimer Approximation 251 Born’sche Näherung 67, 68 Born’sche Reihe 68 Bose-Einstein-Kondensation 301, 398 Bose-Einstein-Statistik 398 Bose-Operator 352 Bose-Verteilung 398 Bose-Zustand, kohärenter 414 Boson 296 Bosonisierung 524 Breit-Wigner-Formel 109 Cartan-Untergruppe 537 Casimir-Operator 538, 558 Charakter einer Permutation 292 chemisches Potenzial 391 chirale Symmetrie, spontane Brechung 523 Clifford-Algebra 214, 562 https://doi.org/10.1515/9783110586077-019
Clifford-Zahl 562 Compton-Effekt 207 Compton-Wellenlänge des Elektrons 207 Confinement 159 Cooper-Paar 502 Coriolis-Kraft 149 Coriolis-Wechselwirkung 148, 286 c-Zahl 124 Darstellung – adjungierte 536 – des Fock-Raums durch Graßmann-Variablen 426 – einer Gruppe 535 – fundamentale 535 – irreduzible 535 – reguläre 536 δ-Funktion – antiperiodische 592 – periodische 592 Dichtematrix 366 Differentiation von Graßmann-Variablen 422 Dimension der Algebra 536 Dirac-Gleichung 215 – einer Punktladung 227 – Lösung der freien 216 Dirac-Matrix 216 Dirac-See 222 Dirac-Spinor 215, 495 Drehgruppe SO(3) 542 Drehimpuls des Dirac-Teilchens 224 Drehoperator 133, 356 – Matrixdarstellung 134 Drehrückstoß 149 Drehung 130 – zeitabhängige 149 Dyson-Gleichung 27 Effekt, fotoelektrischer 205 Eichboson 157 Eichfeld 156 Eichsymmetrie 156 Eichtheorien 156 Eichtransformation 497 Einteilchen-Green’sche Funktion 463, 464 Einteilchenoperator 352 – in der Zweiten Quantisierung 353
600 | Stichwortverzeichnis
elektromagnetisches Feld, Wirkung 203 Elementarteilchen 153 – Standardmodell 157 Energiedichte, spektrale 406 Energie-Impuls-Beziehung 194 – relativistische 195, 196 Ensemble – großkanonisches 391, 399 – identischer Teilchen 393 – kanonisches 388, 399 – statistisches 378, 385 Ensemble-Mittel 444 Entartung 264 Entartungsdruck 328 Entropie 385 – identischer Teilchen 401 – Prinzip der maximalen 386 Ereignis 195 Erhaltungsgröße 12 Erwartungswert, thermischer 444 Erzeuger 536 Erzeugungsoperator 344, 347 euklidische Transformation 123 Euler-Lagrange-Gleichung 203 Euler-Winkel 163–165 Faktorgruppe 535 Farbeinschluss 159 Feinstrukturaufspaltung 247 Feinstrukturkonstante 497 Feldoperator in der Ortsdarstellung 361 Feldstärke, magnetische 500 Feldstärketensor 202 – dualer 202 Fermi-Dirac-Statistik 396 Fermi-Energie 324, 371 Fermi-Fläche 326 Fermi-Gas – entartetes 328 – ideales 323 Fermi-Kante 371, 397, 413 Fermi-Kugel 325 Fermion 296 Fermi-Operator 352 Fermis Goldene Regel 48 Fermi-System 303 Fermi-Verteilung 396 Fermi-Zustand, kohärenter 420 Feynman-Diagramm 22, 27
Feynman-Graphen 27 Flavour 155 Flavour-Symmetrie 155 Flusswirbel, magnetischer 500 Fock-Raum 340, 343 Funktion, Green’sche 447 Funktional, erzeugendes 437 Funktionalintegral 590 Funktionalintegraldarstellung 482 – der großkanonischen Zustandssumme 486 Funktionalintegrationsmaß 482 Gap-Gleichung 509, 517, 519 – bei endlichen Temperaturen 532 Gauß-Integral, fermionisches 590 Gell-Mann-Matrizen 573 Gemisch, statistisches 378 geometrische Phase 258 Gewichte – der SU(2)-Gruppe 572 – der SU(3)-Gruppe 574 Gewichte einer Gruppe 566 Gibbs-Verteilung 390 Gitter, duales 324 Gleichgewicht, thermodynamisches 388 Gleichgewichtszustand 388 Gleichverteilungssatz 406 Gluon 157 Graßmann-Algebra 428 Graßmann-Variable 414, 420 – Integration 423 Green’sche Funktion 463 – der Schrödinger-Gleichung 29 – des freien Teilchens 32 – Einteilchen 463, 464 – kausale 30 – retardierte 30 – stationäre 31 – Zweiteilchen 463 Gruppe 533 – Abel’sche 533 – der orthogonalen Matrizen O(N) 534, 539 – der speziellen orthogonalen Matrizen SO(N) 534 – der unitären Matrizen U(N) 544 – diskrete 533 – kontinuierliche 533, 536 – pseudoorthogonale 550 Gruppe SL(2, ℂ) 555
Stichwortverzeichnis
Gruppe SO(4) 554 Gruppe SU(2) 572 Gruppe SU(3) 573 Hadron 154 Hartkugelstreuung 88 Hartree-Fock-Energie 322 Hartree-Fock-Gleichung 322 Hartree-Fock-Näherung 320 Hartree-Fock-Theorie, zeitabhängige 465 Hartree-Gleichung 318 Hartree-Näherung 316 Heisenberg-Bild 9, 458, 468 Helium-Atom 310 Higgs-Boson 157 Hochtemperatursupraleiter 501 Hohlraumstrahlung 402 homomorph 546 Hyperfeinstrukturaufspaltung 249 Hyperladung 155 identische Teilchen 289, 336 Induktion, magnetische 500 Integration über Graßmann-Variablen 423 Integrationsmaß über die Euler-Winkel 176 Involution 421 isomorph 546 Isospin 155 Isospinor 154 Isospinsymmetrie 153 Jacobi-Identität 537 Kastenpotenzial 89 Klein-Gordon-Gleichung 209 kohärente Zustände, Norm 430 kohärenter Bose-Zustand 414 kohärenter Fermi-Zustand 420 Konstituentenquark 524 Kontinuitätsgleichung 204, 211 Kontraktion 360, 450 – von Feldoperatoren 454 Koordinate, klassische 431 Koordinatentransformation – aktive 122 – euklidische 121 – passive 122 k-Raum 404
|
601
Kreisel – asymmetrischer 189 – symmetrischer 188 Kugelkreisel 187 Laborsystem 179 Lamb-Shift 223, 248 Landau-Niveau, relativistisches 230 Landé-Faktor 236, 498 Lepton 157 Levinson-Theorem 116 Lichtkegel 198 Lie-Algebra 536, 537 – der SO(N) 540 Lie-Gruppe 536 Lippmann-Schwinger-Gleichung 61 Lochzustand 371 London-Ströme 500 Lorentz-Gruppe 551 – eigentliche orthochrone 552 – orthochrone 552 Lorentz-Transformation 195, 202 magnetisches Moment des Spins 236 Materie, dunkle 158 Materieteilchen 156 Matrizen, pseudoorthogonale 196 Matrizenmechanik 1 Matsubara-Frequenz 490, 592 Maxwell-Gleichung 201 – homogene 202 – inhomogene 202 Mean-Field-Approximation bei endlichen Temperaturen 408 Meißner-Effekt 500 Meson 154 – pseudoskalares 156 Minkowski-Raum 195 Näherung, adiabatische 251, 255 Näherungen des mittleren Felds bei endlichen Temperaturen 413 Neutron 153 Niveaudichte 47 Noether-Theorem 129 Normalprodukt 360, 449, 453 – von Feldoperatoren 453 Normalteiler 534
602 | Stichwortverzeichnis
n-Teilchendichte 437 n-Teilchendichtematrix 437
Propagator 6 Proton 153
Observable – skalare 138, 140 – tensorielle 140 – vektorielle 138, 140 – Verhalten unter Drehungen 137 Operator – antilinearer 127 – antiunitärer 127 – d’Alembert’scher 208 – statistischer 380 – unitärer 127 Orthohelium 314 Oszillator – harmonischer 399 – bei endlichen Temperaturen 399
Quantenchromodynamik 158 Quantenelektrodynamik 496 – Wirkung 496 Quantenfeld 477 Quantisierung – Erste 336, 340 – Zweite 336, 340 Quark 155, 157 Quasiteilchen 373, 442 Quasiteilchendarstellung 372 Quasiteilchenenergie 521 Quasiteilchenoperator 512 Quaternion 214
Paarerzeugung 223 Paarvernichtung 223 Paarwechselwirkung 502 Parahelium 314 Partialquerschnitt 86 Partialwelle 81 Partialwellenzerlegung 80 – der Streuamplitude 84 – des Streuquerschnitts 86 Pauli-Gleichung 235 Pauli-Lubanski-Vektor 558 Pauli-Prinzip 298 Permutation 291 Phase, geometrische 258 Photon 157, 406 Pion 154 Planck 406 Planck’sche Strahlungsformel 406 Planck’sches Wirkungsquantum 406 Poincaré-Gruppe 557 Potenzial – chemisches 391 – großkanonisches 395 Potenzialstreuung 106 Prinzip der maximalen Entropie 386 Produkt – normalgeordnetes 360, 453 – von Feldoperatoren 453 – zeitgeordnetes 5
Ramsauer-Effekt 113 Randbedingung, periodische 329 Rang einer Gruppe 537 Rapidität 195 Raum, unitärer 343 Raumspiegelung 150 Raumwinkel 268 Rayleigh-Jeans’sches Strahlungsgesetz 407 Reichweite, effektive 117 Residuensatz 595 Resonanz 107 Resonanzstreuung 106, 107 Rotation 161 – eines starren Körpers 186 Rotationsspektrum 187 Rutherford-Formel 72 Schattenstreuung 96 Schrödinger-Bild 9 Schwarzer Körper 403 Slater-Determinante 320 – in der Zweiten Quantisierung 368 S-Matrix 75 SO(2)-Gruppe 539 SO(N)-Gruppe 540 Spin 226, 559 Spinorkugelfunktion 240 Spur im Fock-Raum 442 Standardmodell 157 – der Elementarteilchen 157 starrer Körper 161 statistischer Operator 380
Stichwortverzeichnis
Stefan-Boltzmann-Gesetz 407 Störungstheorie, zeitabhängige 17 Stoßparameter 65 Streuamplitude 63 Streuexperiment 53 Streulänge 117 Streumatrix 75 Streuphase 81, 82 Streuprozess 53 Streutheorie, stationäre 60 Streuung – am Coulomb-Potenzial 72 – am Potenzialtopf 101 – am Yukawa-Potenzial 70 – am Zentralpotenzial 80 – eines Wellenpakets am Potenzial 56 – inelastische 77 Streuwinkel 54, 64 Strukturkonstante 536 – antisymmetrische 545 – symmetrische 545 Suprafluidität 301 Supraleiter 500 – Typ-I 500 – Typ-II 500 Symmetrie – äußere 153 – diskrete 150 – globale 156 – innere 153 Symmetrietransformation 126 – kontinuierliche 127 Tachyon 198 Target 53 Teilchen – identische 289, 336 – unterscheidbare 287, 336 Teilchen-Antiteilchen-Anregung 374 Teilchendichte 363 Teilchen-Loch-Anregung 371 Teilchenzahloperator 354 Tensor 139 Theorem, optisches 79, 87 thermodynamisches Gleichgewicht 388 Thomas-Fermi-Näherung 330, 333 Thouless-Theorem 374 T-Matrix 78
| 603
T-Produkt 450 – von Feldoperatoren 454 Trägheitstensor 162 Transformation – euklidische 123 – pseudoorthogonale 551 Translation des Raums 129 Translationsoperator 129 Übergangsamplitude 482 Übergangsrate 37 Überlapp zweier kohärenter Zustände 429 unitärer Operator 127 Unteralgebra, invariante 565 Untergruppe, invariante 534 Variable, klassische 431 Vernichtungsoperator 344 Vierer-Geschwindigkeit 197 Vierer-Impulsvektor 196 Vierer-Vektor 195, 202 Vollständigkeitsrelation – der D-Funktionen 178 – der kohärenten – Bose-Zustände 416 – Fermi-Zustände 430 Vortex, magnetischer 273 Wärmestrahlung 402 W-Boson 157 Wechselwirkungsbild 13, 14, 459, 469 Wellenmechanik 1 Wick’sches Theorem 361, 448, 456, 457 – für Ensemble-Mittel 473 – für erzeugende Funktionale 470 Wien’sches Verschiebungsgesetz 408 Wigner’sche D-Funktion – Eigenschaften 174 Winkelgeschwindigkeit 149 Wirkung – des elektromagnetischen Felds 203 – einer freien relativistischen Punktmasse 197 – fermionische 495 Wirkungsquerschnitt – differenzieller 64 – totaler 86 Wurzeln der SU(3)-Gruppe 574 Wurzeln einer Gruppe 567 Yukawa-Potenzial 70
604 | Stichwortverzeichnis
Z-Boson 157 Zeitentwicklung 1 Zeitentwicklungsoperator 1 Zeitordnungsoperator 5 Zeitumkehr 151 Zustand – gemischter 378 – kohärenter 414 – reiner 378 Zustandsdichte 47 Zustandssumme, kanonische 389 Zweiteilchen-Green’sche Funktion 463 Zweiteilchenoperator 302, 356 – in der Zweiten Quantisierung 356