226 70 6MB
German Pages 695 [698] Year 2019
Claude Cohen-Tannoudji, Bernard Diu, Franck Laloë Quantenmechanik De Gruyter Studium
Weitere empfehlenswerte Titel Quantenmechanik Band 1 Claude Cohen-Tannoudji, Bernard Diu, Franck Laloë, 2019 ISBN 978-3-11-062600-1, e-ISBN (PDF) 978-3-11-063873-8, e-ISBN (EPUB) 978-3-11-063930-8 Quantenmechanik Band 3 Claude Cohen-Tannoudji, Bernard Diu, Franck Laloë, 2020 ISBN 978-3-11-062064-1, e-ISBN (PDF) 978-3-11-064913-0, e-ISBN (EPUB) 978-3-11-064921-5 Quantenmechanik 1 Pfadintegralformulierung und Operatorformalismus Hugo Reinhardt, 2018 ISBN 978-3-11-058595-7, e-ISBN: 978-3-11-058602-2, e-ISBN (EPUB) 978-3-11-058647-3 Quantenmechanik 2 Pfadintegralformulierung und Operatorformalismus Hugo Reinhardt, 2019 ISBN 978-3-11-058596-4, e-ISBN (PDF) 978-3-11-058607-7, e-ISBN (EPUB) 978-3-11-058649-7 Quantenchemie Eine Einführung Michael Springborg, 2017 ISBN 978-3-11-050079-0, e-ISBN (PDF) 978-3-11-050080-6, e-ISBN (EPUB) 978-3-11-049813-4 Quantenelektrodynamik kompakt Karl Schilcher, 2019 ISBN 978-3-11-048858-6, e-ISBN: 978-3-11-048859-3, e-ISBN (EPUB) 978-3-11-048860-9
Claude Cohen-Tannoudji, Bernard Diu, Franck Laloë
Quantenmechanik
| Band 2 Aus dem Französischen übersetzt von Joachim Streubel, Jochen Balla, Carsten Henkel und Karen Lippert 5. Auflage
Titel der Originalausgabe Claude Cohen-Tannoudji, Bernard Diu, Franck Laloë Mécanique Quantique. Tome II First published by Hermann Éditeurs des Sciences et des Arts, France Copyright © Claude Cohen-Tannoudji, Bernard Diu, Franck Laloë Übersetzer Prof. Joachim Streubel, Prof. Jochen Balla, Prof. Carsten Henkel, Dr. Karen Lippert
ISBN 978-3-11-062609-4 e-ISBN (PDF) 978-3-11-063876-9 e-ISBN (EPUB) 978-3-11-063933-9 Bibliografische Information der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.dnb.de abrufbar. © 2019 Walter de Gruyter GmbH, Berlin/Boston Einbandabbildung: Winter, Dr. Mark J./Science Photo Library Satz: le-tex publishing services GmbH, Leipzig Druck und Bindung: CPI books GmbH, Leck www.degruyter.com
Wichtiger Hinweis Dieses Buch besteht aus drei Bänden mit insgesamt 21 Kapiteln. Zu jedem Kapitel ge hören Ergänzungen. Die Kapitel bilden für sich eine Einheit und können unabhängig von den Ergän zungen gelesen werden. Die Ergänzungen schließen jeweils an das entsprechende Kapitel an und sind in der Kopfzeile durch das Zeichen ∙ gesondert gekennzeichnet. Sie beginnen mit einer kurzen Inhaltsübersicht, die als Leseanleitung verstanden werden kann. Die Abschnitte in den Ergänzungen sind von verschiedener Art: Einige erleichtern das Verständnis des zugehörigen Kapitels oder dienen der weiteren Präzisierung; an dere befassen sich mit konkreten physikalischen Anwendungen oder verweisen auf bestimmte Teilgebiete der Physik. Ein Abschnitt enthält schließlich die Aufgaben zum betreffenden Kapitel. Es wird nicht erwartet und ist auch nicht immer zweckmäßig, die Ergänzungen in der angegebenen Reihenfolge zu erarbeiten. In den beiden ersten Bänden wird gelegentlich auf die Anhänge I bis III verwiesen. Diese befinden sich am Ende des zweiten Bands.
https://doi.org/10.1515/9783110638769-201
Vorwort Die Bedeutung der Quantenmechanik ist in der Physik über die letzten Jahrzehn te ständig gestiegen. Sie ist natürlich ein wesentliches Werkzeug, um Struktur und Dynamik von mikroskopischen Körpern zu verstehen, etwa von Atomen, Molekülen sowie ihrer Wechselwirkung mit elektromagnetischer Strahlung. Die Quantenme chanik liefert aber auch das grundlegende Verständnis für zahlreiche technische Systeme: Quellen von Laserlicht (mit Anwendungen in Telekommunikation, Medi zintechnik, Materialbearbeitung), Atomuhren (zentrale Bausteine insbesondere für die Navigationssysteme GPS und Galileo), Transistoren (Computer- und Kommuni kationstechnik), bildgebende Tomographen per Magnetresonanz, Energiegewinnung (Solarzellen, Kerntechnik) usw. – die Liste der Anwendungen hört praktisch nicht auf. Überraschende physikalische Erscheinungen wie Supraflüssigkeiten und Supraleiter haben eine quantenmechanische Erklärung. Großes Interesse wird derzeit bestimm ten verschränkten Quanten-Zuständen gewidmet, die nicht-intuitive Eigenschaften aufweisen: sie sind nicht-lokal, nicht in ihre Teile separierbar und versprechen bemer kenswerte Anwendungen auf dem Gebiet der Quanten-Informatik. Unsere Zivilisation wird also mehr und mehr von technologischen Anwendungen durchdrungen, deren Wurzeln in den Konzepten der Quantenmechanik liegen. Demzufolge verdient das Lernen und Lehren dieser Konzepte besondere Aufmerksamkeit. Das vorliegende dreibändige Werk will einen Beitrag zu diesem Ziel leisten. In der Tat können die ersten Kontakte mit der Quantenmechanik sehr verstörend sein. Dieses Buch entstand aus zahlreichen Lehrveranstaltungen für Studierende mit dem Vorsatz, ihnen den Zugang zu erleichtern und das Verständnis der Leserin und des Lesers von Anfang an bis auf ein fortgeschrittenes Niveau hin stetig zu vertiefen. Die ersten beiden Bände erschienen vor mehr als vierzig Jahren in erster Auflage, sie fanden auf allen Kontinenten Verwendung und wurden in viele Sprachen übersetzt. Sie beschränkten sich inhaltlich allerdings auf ein mittleres Niveau; seit 2017 wer den sie durch den dritten Band ergänzt, der den Lesern erlaubt, weitere Schritte zu gehen. Das gesamte Werk verfolgt systematisch die Strategie, sich den Fragestellun gen schrittweise zu nähern: keine Schwierigkeit wird verschwiegen, und jeder Aspekt der diversen Probleme wird im Detail besprochen. Dabei erinnern wir oft an die Be griffe aus der klassischen Physik (d. h. aus der makroskopischen Welt oder vor der Quanten-Ära). Dieser Wunsch, den Dingen auf den Grund zu gehen, nichts zu „vertuschen“ und keine „Abkürzungen“ einzuschlagen, spiegelt sich in der Struktur des Lehrwerks wider: der Leser findet zwei verschiedene, aber ineinander verschränkte Stränge – Kapitel und Ergänzungen. Die Kapitel stellen in ihrer Abfolge die Ideen und Begriffe allgemein vor. Auf jedes Kapitel folgen eine oder mehrere Ergänzungen, die die zuvor erarbeiteten Methoden und Konzepte illustrieren. Die Ergänzungen sind voneinander unabhängig, ihr Ziel ist es, einen breiten Fächer von Anwendungen und interessanten https://doi.org/10.1515/9783110638769-202
VIII | Vorwort
Vertiefungen vorzustellen. Damit der Leser sich in seiner Auswahl besser orientieren kann, endet jedes Kapitel mit einer Übersicht, die mit ein paar Kommentaren die darauf folgenden Ergänzungen kurz anreißt. In Band 1 beginnen wir mit einer allgemeinen Einführung in das Thema, dar auf folgt eine detaillierte Beschreibung des mathematischen Handwerkzeugs für die Quantenmechanik. Dieses Kapitel II mag ein wenig lang und dicht erscheinen, die Autoren haben allerdings in der Lehre die Erfahrung gemacht, dass diese Art der Dar stellung letztendlich die größte Wirkung zeitigt. Beginnend mit dem dritten Kapitel werden die Axiome sorgfältig formuliert und in zahlreichen Ergänzungen veranschau licht. Einige wichtige Themen der Quantenmechanik werden dann durchgenommen, etwa der harmonische Oszillator, der sehr viele Anwendungen findet (Molekülschwin gungen, Phonon usw.); eine Reihe von ihnen werden in eigenen Ergänzungen bes prochen. Diesen Weg beschreiten wir weiter im Band 2, erweitern den Blickwinkel und erreichen einen etwas höheren Schwierigkeitsgrad. Der Stoff wendet sich der Streu theorie zu, dem Spin und der Addition von Drehimpulsen, sowie der Behandlung von stationären und zeitabhängigen Störungen. Mit einem ersten Blick auf die Be schreibung von ununterscheidbaren Teilchen endet Band 2. Wie im vorangehenden Band wird jeder theoretische Begriff sofort an Hand von diversen Anwendungen in den Ergänzungen veranschaulicht. Beide Bände wurden in der Neuausgabe 2018 an zahlreichen Stellen korrigiert; dem Kapitel XIII wurden zwei Abschnitte (§§ D und E) hinzugefügt, die sich mit zufälligen Störungen befassen, sowie eine weitere Ergän zung mit der Modellierung von Relaxationsprozessen. Der Band 3 ergänzt seit der Neuausgabe die ersten beiden Bände und siedelt sich auf einem fortgeschrittenen Niveau an. Seine Grundlage bildet der Formalismus der Erzeuger- und Vernichter-Operatoren (zweite Quantisierung), der in der Quantenfeld theorie durchgängig verwendet wird. Wir beginnen mit Systemen von ununterscheid baren Teilchen wie Fermi- und Bose-Gasen. Die Eigenschaften eines idealen Gases im thermischen Gleichgewicht werden dargestellt. Für Fermionen wird das Hartree-FockVerfahren im Detail eingeführt: es bildet die Grundlage für zahlreiche Untersuchun gen in der Chemie, der Atomphysik, der Festkörperphysik usw. Für Bosonen disku tieren wir die Gross-Pitaevskii-Gleichung und die Bogoliubov-Theorie. Mit Hilfe einer originellen Formulierung, die die Bildung von Paaren sowohl von Fermionen als auch von Bosonen erfasst, können die BCS-Theorie (Bardeen-Cooper-Schrieffer) der Supra leitung und die Bogoliubov-Theorie einheitlich dargestellt werden. Ein zweiter Teil von Band 3 ist der Quanten-Elektrodynamik gewidmet: diese wird allgemein einge führt, wir untersuchen Wechselwirkungen zwischen Atomen und Photonen sowie di verse Anwendungen (spontaner Zerfall, Multiphoton-Übergänge, optisches Pumpen usw.). Wir stellen die Methode der „beleuchteten Zustände“ (dressed atom) vor und veranschaulichen sie an Hand von konkreten Beispielen. Ein abschließendes Kapitel behandelt den Begriff der quantenmechanischen Verschränkung und gewisse funda mentale Fragen, insbesondere die Bellschen Ungleichungen und ihre Verletzung.
Vorwort
| IX
Es muss erwähnt sein, dass wir uns weder der Diskussion um die philosophischen Konsequenzen aus dem Weltbild der Quantenmechanik noch ihren zahlreichen Inter pretationen zuwenden, trotz des großen Interesses, das diesen Themen entgegenge bracht wird. Wir haben uns in der Tat darauf beschränkt, den so genannten „ortho doxen Standpunkt“ vorzustellen. Nur das Kapitel XXI nähert sich ein wenig gewissen Fragestellungen, die die Grundlagen der Quantenmechanik betreffen (etwa die NichtLokalität). Wir haben diese Wahl getroffen, weil es uns scheint, dass man sich noch wirksamer mit diesen Problemen befassen kann, wenn man sich vorher eine gewisse Geläufigkeit in der quantenmechanischen Praxis und ihren zahlreichen Anwendun gen erarbeitet hat. Diese Themen behandelt etwa das Buch Do we really understand quantum mechanics? (F. Laloë, Cambridge University Press 2012, französisches Origi nal: Comprenons-nous vraiment la mécanique quantique?, EDP Sciences/CNRS Editi ons, 2. Auflage 2017). Weitere Verweise bietet der Abschnitt 5 des Literaturverzeich nisses.
Danksagung Den Ausgangspunkt für das vorliegende Lehrbuch bilden Lehrveranstaltungen, die wir über mehrere Jahre hinweg in Teamarbeit durchgeführt haben. Es ist uns ein Anlie gen, allen Mitgliedern der Arbeitsgruppen, denen wir angehört haben, unseren Dank auszusprechen, ganz besonders aber Jacques Dupont-Roc und Serge Haroche für die freundschaftliche Zusammenarbeit und die fruchtbaren Diskussionen während der wöchentlichen Gruppensitzungen sowie für die Ideen zu Aufgaben und Übungen, die sie mit uns geteilt haben. Ohne ihren Enthusiasmus und ihre Unterstützung hätten wir dieses Werk niemals unternehmen und zu Ende schreiben können. Unvergessen bleibt auch, was wir den Physikern schulden, die uns in das Forschen eingeweiht ha ben: für zwei von uns waren dies Alfred Kastler und Jean Brossel, für den dritten war es Maurice Lévy. In dem „Stallgeruch“ ihrer Labore durften wir entdecken, was für ein schönes und und mächtiges Instrument die Quantenmechanik ist. Eine bleiben de wichtige Erinnerung sind für uns die Vorlesungen über moderne Physik, die am Commissariat pour l’Energie Atomique (C. E. A.) von Albert Messiah, Claude Bloch und Anatole Abragam in einer Zeit gehalten wurden, als es noch keine universitäre Lehre (« troisième cycle ») jenseits des Magisters/Diploms gab. Wir sind Nicole und Dan Ostrowsky sehr dankbar, die uns zahlreiche Verbesse rungen und Begriffsklärungen vorgeschlagen haben, als sie den Text ins Englische übersetzt haben. Danach hat uns auch Carsten Henkel bei seiner Übersetzung ins Deutsche zahlreiche nützliche Vorschläge gemacht, die in einen verbesserten Text eingeflossen sind; wir sprechen ihm unseren herzlichen Dank aus. Viele weitere Kolle gen und Freunde haben dazu beigetragen, die Feineinstellungen für diesen Band vor zunehmen. Besonders wertvoll war dabei, dass jeder von ihnen mit seinem eigenen Stil Bemerkungen und Vorschläge gemacht hat, die stets hilfreich waren. Unser Dank
X | Vorwort
geht besonders an Pierre-François Cohadon, Jean Dalibard, Sébastien Gleyzes, Mar kus Holzmann, Thibaut Jacqmin, Philippe Jacquier, Amaury Mouchet, Jean-Michel Raimond, Félix Werner. Eine große Hilfe waren uns Marco Picco und Pierre Cladé, um gewisse sensible Aufgaben im Latex-Schriftsatz zu meistern und um die Abbildungen in Vektor-Grafiken umzuwandeln. Roger Balian, Edouard Brézin und William Mullin haben uns mit ihren Vor- und Ratschlägen bereichert. Und für ihre Unterstützung mit einer Reihe von Abbildungen danken wir herzlich Geneviève Tastevin, Pierre-François Cohadon und Samuel Deléglise.
Inhalt Wichtiger Hinweis | V Vorwort | VII VIII A B C
Elementare Streutheorie | 915 Einleitung | 915 Stationäre Streuzustände. Streuquerschnitt | 920 Streuung am Zentralpotential. Partialwellenmethode | 933
Übersicht über die Ergänzungen zu Kapitel VIII | 948 AVIII Freies Teilchen: Drehimpulseigenzustände | 949 1 Die Radialgleichung | 949 2 Freie Kugelwellen | 951 3 Freie Kugelwellen und ebene Wellen | 958 Inelastische Streuung | 962 BVIII 1 Methodisches | 962 2 Berechnung der Wirkungsquerschnitte | 963 Beispiele zur Streutheorie | 969 CVIII 1 Die Bornsche Näherung für ein Yukawa-Potential | 969 2 Niederenergiestreuung an einer harten Kugel | 972 3 Aufgaben | 973 IX A B C
Der Spin des Elektrons | 977 Einführung des Elektronenspins | 978 Die Eigenschaften eines Drehimpulses 1/2 | 982 Das nichtrelativistische Spin-1/2-Teilchen | 984
Übersicht über die Ergänzungen zu Kapitel IX | 992 AIX Drehoperatoren für ein Spin-1/2-Teilchen | 993 1 Drehoperatoren im Zustandsraum | 993 2 Drehung von Spinzuständen | 994 3 Drehung zweikomponentiger Spinoren | 998 Aufgaben | 1000 BIX X A B C
Addition von Drehimpulsen | 1007 Einleitung | 1007 Addition zweier Spins 1/2 | 1011 Addition von zwei beliebigen Drehimpulsen | 1017
XII | Inhalt
Übersicht über die Ergänzungen zu Kapitel X | 1033 Beispiele für die Addition von Drehimpulsen | 1034 AX 1 Addition von j1 = 1 und j2 = 1 | 1034 2 Addition eines ganzzahligen Bahndrehimpulses l und eines Spins 1/2 | 1036 BX Clebsch-Gordan-Koeffizienten | 1041 1 Eigenschaften der Clebsch-Gordan-Koeffizienten | 1042 2 Phasenkonventionen | 1045 3 Einige nützliche Beziehungen | 1046 CX Addition von Kugelflächenfunktionen | 1050 1 Die Funktionen Φ M J (Ω 1 ; Ω 2 ) | 1050 m 2 Die Funktionen F l (Ω) | 1051 3 Entwicklung eines Produkts von Kugelflächenfunktionen | 1053 Das Wigner-Eckart-Theorem | 1055 DX 1 Definition von Vektoroperatoren | 1056 2 Das Wigner-Eckart-Theorem für Vektoroperatoren | 1057 3 Anwendung: Berechnung des Landé-Faktors | 1062 EX Elektrische Multipolmomente | 1066 1 Definition von Multipolmomenten | 1066 2 Matrixelemente elektrischer Multipolmomente | 1074 FX Entwicklung gekoppelter Drehimpulse | 1080 1 Erinnerung an die klassischen Ergebnisse | 1081 2 Bewegungsgleichungen für die Drehimpulserwartungswerte | 1083 3 System mit zwei Spins 1/2 | 1084 4 Stoß zwischen zwei Spin-1/2-Teilchen | 1090 Aufgaben | 1095 GX XI A B C
Stationäre Störungstheorie | 1103 Beschreibung der Methode | 1104 Störung eines nichtentarteten Niveaus | 1108 Störung eines entarteten Niveaus | 1112
Übersicht über die Ergänzungen zu Kapitel XI | 1117 AXI Gestörter harmonischer Oszillator | 1118 1 Störung durch ein lineares Potential | 1118 2 Störung durch ein quadratisches Potential | 1121 3 Störung durch ein Potential in x 3 | 1122 Wechselwirkung zwischen magnetischen Dipolen | 1128 BXI 1 Der Wechselwirkungs-Hamilton-Operator | 1128 2 Dipol-Dipol-Wechselwirkung und Zeeman-Unterniveaus | 1131 3 Einfluss der Wechselwirkung bei einem gebundenen Zustand | 1137 CXI Van-der-Waals-Kräfte | 1139 1 Hamilton-Operator der elektrostatischen Wechselwirkung | 1140
Inhalt |
2 3 4 DXI 1 2 EXI 1 2 3 FXI 1 2 GXI 1 2 3 4 5 HXI
Zwei Wasserstoffatome im Grundzustand | 1142 Van-der-Waals-Kräfte zwischen zwei Wasserstoffatomen | 1147 Wasserstoffatom an einer leitenden Wand | 1148 Der Volumeneffekt | 1151 Energiekorrektur erster Ordnung | 1152 Anwendung auf wasserstoffartige Systeme | 1155 Die Variationsmethode | 1158 Prinzip der Methode | 1158 Anwendung auf ein einfaches Beispiel | 1161 Diskussion | 1164 Energiebänder im Festkörper | 1167 Ein erster Zugang: qualitative Diskussion | 1168 Genauere Untersuchung an einem einfachen Modell | 1172 Chemische Bindung: Das H+2 -Ion | 1180 Einleitung | 1180 Berechnung der Energien mit der Variationsmethode | 1184 Mögliche Verbesserungen des Modells | 1193 Andere Molekülorbitale des H+2 -Ions | 1197 Ursprung der chemischen Bindung. Virialtheorem | 1202 Aufgaben | 1213
XII A B C D E
Fein- und Hyperfeinstruktur des Wasserstoffatoms | 1223 Einleitung | 1223 Zusätzliche Terme im Hamilton-Operator | 1224 Feinstruktur des n = 2-Niveaus | 1231 Die Hyperfeinstruktur des n = 1-Niveaus | 1238 Hyperfeinstruktur und Zeeman-Effekt | 1244
Übersicht über die Ergänzungen zu Kapitel XII | 1257 AXII Der Hyperfeinstruktur-Hamilton-Operator | 1258 1 Das Elektron im Feld des Protons | 1258 2 Genaue Form des Hyperfeinstruktur-Hamilton-Operators | 1260 3 Schlussfolgerung | 1265 BXII Erwartungswerte und Feinstruktur | 1267 1 Berechnung von ⟨1/R⟩, ⟨1/R 2 ⟩ und ⟨1/R 3 ⟩ | 1267 2 Die Erwartungswerte ⟨W mv ⟩ | 1269 3 Die Erwartungswerte ⟨WD ⟩ | 1270 4 Berechnung des Koeffizienten ξ2p für WSB | 1271 CXII Hyperfeinstruktur und Zeeman-Effekt für das Myonium und das Positronium | 1272 1 Die Hyperfeinstruktur des 1s-Grundzustands | 1272 2 Der Zeeman-Effekt des 1s-Grundzustands | 1273
XIII
XIV | Inhalt
DXII 1 2 3 4 EXII 1 2
Elektronenspin und Zeeman-Effekt | 1280 Einleitung | 1280 Zeeman-Diagramme des 1s- und 2s-Niveaus | 1281 Zeeman-Diagramme des 2p-Niveaus | 1282 Zeeman-Effekt der Resonanzlinie | 1284 Stark-Effekt des Wasserstoffatoms | 1289 Stark-Effekt beim n = 1-Niveau | 1289 Stark-Effekt beim n = 2-Niveau | 1291
XIII A B C D E
Näherungsmethoden für zeitabhängige Probleme | 1293 Problemstellung | 1293 Näherungslösung der Schrödinger-Gleichung | 1295 Sinusförmige oder konstante Störung | 1299 Stochastische Störung | 1311 Verhalten eines zwei-Niveau-Atoms auf langen Zeitskalen | 1315
Übersicht über die Ergänzungen zu Kapitel XIII | 1330 AXIII Atom und elektromagnetische Strahlung | 1331 1 Der Wechselwirkungs-Operator. Auswahlregeln | 1332 2 Anregung außerhalb der Resonanz | 1342 3 Resonanzanregung. Absorption und induzierte Emission | 1346 BXIII Zweiniveausystem und sinusförmige Störung | 1350 1 Beschreibung des Modells | 1351 2 Näherungslösung der Bloch-Gleichungen | 1354 3 Physikalische Diskussion | 1357 4 Aufgaben | 1366 CXIII Oszillationen zwischen zwei Zuständen | 1367 1 Säkularnäherung | 1367 2 Lösung des Gleichungssystems | 1368 3 Physikalische Diskussion | 1369 DXIII Zerfall eines diskreten Zustands in ein Kontinuum | 1371 1 Problemstellung | 1371 2 Beschreibung des Modells | 1372 3 Näherung für kurze Zeiten | 1377 4 Eine zweite Näherungsmethode | 1378 5 Physikalische Diskussion | 1380 EXIII Stochastische zeitabhängige Störung. Relaxation | 1384 1 Entwicklung des Dichteoperators | 1385 2 Relaxation eines Spin-1/2-Ensembles | 1395 3 Schlussfolgerungen | 1407 FXIII Aufgaben | 1409
Inhalt | XV
XIV A B C D
Systeme identischer Teilchen | 1421 Problemstellung | 1421 Permutationsoperatoren | 1428 Das Symmetrisierungspostulat | 1438 Physikalische Diskussion | 1448
Übersicht über die Ergänzungen zu Kapitel XIV | 1461 Mehrelektronenatome. Konfigurationen | 1462 AXIV 1 Die Zentralfeldnäherung | 1462 2 Elektronenkonfigurationen verschiedener Elemente | 1466 Energieniveaus des Heliumatoms | 1470 BXIV 1 Zentralfeldnäherung. Konfigurationen | 1470 2 Einfluss der Elektronenabstoßung | 1473 3 Feinstrukturniveaus. Multipletts | 1482 CXIV Elektronengas. Anwendung auf Festkörper | 1485 1 Freies Elektronengas in einem Kasten | 1486 2 Elektronen in Festkörpern | 1495 DXIV Aufgaben | 1500 Anhänge | 1509 I 1 2
Fourier-Reihen. Fourier-Transformation | 1509 Fourier-Reihen | 1509 Die Fourier-Transformation | 1512
II 1 2 3 4
Die Diracsche δ-Funktion | 1519 Einleitung; grundlegende Eigenschaften | 1519 δ-Funktion und Fourier-Transformation | 1524 Integral und Ableitung der δ-Funktion | 1526 Die δ-Funktion im dreidimensionalen Raum | 1528
III 1 2 3 4 5
Lagrange- und Hamilton-Mechanik | 1533 Die Newtonschen Axiome | 1533 Lagrange-Funktion und Euler-Lagrange-Gleichungen | 1536 Hamilton-Funktion und kanonische Gleichungen | 1537 Anwendungen des Hamilton-Formalismus | 1540 Das Prinzip der kleinsten Wirkung | 1546
Bibliographie | 1551 Sach- und Namenverzeichnis | 1573
Inhaltsübersicht zu Band 1 Wichtiger Hinweis | V Vorwort | VII I
Welle und Teilchen | 1
Übersicht über die Ergänzungen zu Kapitel I | 35 AI
De-Broglie-Wellenlängen | 36
BI
Zur Unschärferelation | 39
CI
Unschärferelationen und Atomparameter | 41
DI
Ein Experiment zur Unschärferelation | 44
EI
Ein zweidimensionales Wellenpaket | 47
FI
Zusammenhang zwischen ein- und dreidimensionalen Problemen | 51
GI
Eindimensionales Gaußsches Wellenpaket | 56
HI
Stationäre Zustände eines Teilchens in einem eindimensionalen Rechteckpotential | 62
JI
Wellenpaket an einer Potentialstufe | 74
KI
Aufgaben | 81
II
Der mathematische Rahmen | 85
Übersicht über die Ergänzungen zu Kapitel II | 158 AII
Schwarzsche Ungleichung | 159
BII
Eigenschaften linearer Operatoren | 160
CII
Unitäre Operatoren | 170
DII
Orts- und Impulsdarstellung | 177
EII
Eigenschaften zweier Observabler mit dem Kommutator iℏ | 181
FII
Der Paritätsoperator | 186
GII
Zweidimensionaler unendlich tiefer Potentialtopf | 193
HII
Aufgaben | 197
XVIII | Inhaltsübersicht zu Band 1
III
Die Postulate der Quantenmechanik | 205
Übersicht über die Ergänzungen zu Kapitel III | 262 AIII
Teilchen in einem unendlich tiefen Potentialtopf | 264
BIII
Wahrscheinlichkeitsstrom. Spezialfälle | 274
CIII
Standardabweichung konjugierter Observabler | 280
DIII
Messung an einem Teilsystem | 284
EIII
Der Dichteoperator | 289
FIII
Der Entwicklungsoperator | 303
GIII
Schrödinger- und Heisenberg-Bild | 307
HIII
Eichinvarianz | 310
JIII
Der Propagator der Schrödinger-Gleichung | 325
KIII
Instabile Niveaus. Lebensdauer | 333
LIII
Aufgaben | 337
MIII
Gebundene Zustände in einem Potentialtopf | 348
NIII
Nichtgebundene Zustände | 355
OIII
Eindimensionales periodisches Potential | 363
IV
Einfache Systeme | 381
Übersicht über die Ergänzungen zu Kapitel IV | 410 AIV
Die Pauli-Matrizen | 411
BIV
Diagonalisierung einer hermiteschen 2 × 2-Matrix | 415
CIV
System mit zwei Niveaus. Fiktiver Spin | 419
DIV
Systeme mit zwei Spins 1/2 | 425
EIV
Dichtematrix für einen Spin 1/2 | 432
FIV
Magnetische Resonanz | 437
GIV
Modell des Ammoniakmoleküls | 450
HIV
Kopplung zwischen stabilem und instabilem Zustand | 465
JIV
Aufgaben | 471
Inhaltsübersicht zu Band 1 | XIX
V
Der harmonische Oszillator | 477
Übersicht über die Ergänzungen zu Kapitel V | 503 AV
Beispiele für harmonische Oszillatoren | 505
BV
Stationäre Zustände. Hermitesche Polynome | 524
CV
Lösung der Eigenwertgleichung mit der Polynommethode | 531
DV
Stationäre Zustände in der Impulsdarstellung | 539
EV
Dreidimensionaler isotroper harmonischer Oszillator | 544
FV
Geladener harmonischer Oszillator im konstanten elektrischen Feld | 549
GV
Quasiklassische Zustände des Oszillators | 556
HV
Eigenschwingungen gekoppelter Oszillatoren | 573
JV
Lineare Oszillatorenkette. Phononen | 584
KV
Kontinuierliches System. Photonen | 603
LV
Oszillator im thermodynamischen Gleichgewicht | 619
MV
Aufgaben | 634
VI
Der Drehimpuls in der Quantenmechanik | 639
Übersicht über die Ergänzungen zu Kapitel VI | 675 AVI
Die Kugelflächenfunktionen | 676
BVI
Drehimpuls und Drehungen | 689
CVI
Drehung zweiatomiger Moleküle | 712
DVI
Drehimpuls eines zweidimensionalen Oszillators | 727
EVI
Geladenes Teilchen im Magnetfeld. Landau-Niveaus | 742
FVI
Aufgaben | 766
VII
Teilchen in einem Zentralpotential. Das Wasserstoffatom | 775
Übersicht über die Ergänzungen zu Kapitel VII | 806 AVII
Wasserstoffartige Systeme | 807
BVII
Der dreidimensionale isotrope harmonische Oszillator | 817
XX | Inhaltsübersicht zu Band 1
CVII
Wahrscheinlichkeitsströme der stationären Zustände des Wasserstoffatoms | 827
DVII
Das Wasserstoffatom im homogenen Magnetfeld. Paramagnetismus und Diamagnetismus. Der Zeeman-Effekt | 831
EVII
Einige Atomorbitale. Hybridorbitale | 844
FVII
Vibrations- und Rotationsniveaus zweiatomiger Moleküle | 860
GVII
Aufgaben | 874
Bibliographie | 877 Sach- und Namenverzeichnis | 899
Inhaltsübersicht zu Band 3
| XXI
Inhaltsübersicht zu Band 3 Wichtiger Hinweis Vorwort XV
Erzeugungs- und Vernichtungsoperatoren von identischen Teilchen
Übersicht über die Ergänzungen zu Kapitel XV AXV
Teilchen und Löcher
BXV
Ideale Fermi- und Bose-Gase. Quantenstatistik
CXV
Kondensierte Bosonen. Gross-Pitaevskii-Gleichung
DXV
Zeitabhängige Gross-Pitaevskii-Gleichung
EXV
Wechselwirkende Fermionen. Hartree-Fock-Verfahren
FXV
Zeitabhängiges Hartree-Fock-Verfahren
GXV
Anwendung: wechselwirkende Fermi- und Bose-Gase
XVI
Feldoperatoren
Übersicht über die Ergänzungen zu Kapitel XVI AXVI
Korrelationen in idealen Bose- und Fermi-Gasen
BXVI
Greensche Funktionen und Korrelationen
CXVI
Wick-Theorem
XVII
Gepaarte Zustände identischer Teilchen
Übersicht über die Ergänzungen zu Kapitel XVII AXVII
Feldoperatoren für gepaarte Teilchen
BXVII
Berechnung der mittleren Energie von gepaarten Teilchen
CXVII
BCS-Theorie
DXVII
Das Cooper-Modell
EXVII
Kondensierte Bosonen mit abstoßenden Wechselwirkungen
XVIII
Elektrodynamik: Abriss der klassischen Theorie
Übersicht über die Ergänzungen zu Kapitel XVIII AXVIII
Lagrange-Formulierung der Elektrodynamik
XXII | Inhaltsübersicht zu Band 3
XIX
Quantisierung des Strahlungsfelds
Übersicht über die Ergänzungen zu Kapitel XIX AXIX
Impulsaustausch zwischen Atomen und Photonen
BXIX
Drehimpuls des Strahlungsfelds
CXIX
Drehimpulsaustausch zwischen Atomen und Photonen
XX
Atom-Photon-Wechselwirkungen: Absorption, Emission, Streuung
Übersicht über die Ergänzungen zu Kapitel XX AXX
Zwei-Photonen-Absorption
BXX
Photo-Ionisation
CXX
Beleuchtete Atome (Dressed Atoms)
DXX
Lichtverschiebungen (Light Shifts) als Werkzeug
EXX
Detektion und Interferenz von photonischen Wellenpaketen
XXI
Verschränkung, Messung, Nichtlokalität
Übersicht über die Ergänzungen zu Kapitel XXI AXXI
Gemischte, korrelierte und separable Zustände
BXXI
GHZ-Zustände. Übertrag von Verschränkung
CXXI
Entstehen einer relativen Phase im Messprozess
DXXI
Relative Phase eines Spin-Kondensats, Nichtlokalität
Anhänge IV
Das Feynman Pfadintegral
V
Variation unter Nebenbedingungen
VI
Abriss der statistischen Mechanik
VII
Die Wigner-Transformation
Bibliographie Sach- und Namenverzeichnis
VIII Elementare Streutheorie A A-1 A-2 A-3 A-4 B B-1 B-2 B-3 B-4 C C-1 C-2 C-3 C-4
Einleitung | 915 Die Bedeutung der Streuphänomene | 915 Potentialstreuung | 916 Definition des Streuquerschnitts | 917 Kapitelüberblick | 919 Stationäre Streuzustände. Streuquerschnitt | 920 Definition der stationären Streuzustände | 920 Berechnung des Streuquerschnitts | 924 Integralgleichung für die gestreute Welle | 927 Die Bornsche Näherung | 931 Streuung am Zentralpotential. Partialwellenmethode | 933 Prinzip der Partialwellenmethode | 933 Stationäre Zustände eines freien Teilchens | 934 Partialwellen im Potential V(r) | 940 Streuquerschnitt als Funktion der Streuphasen | 944
A Einleitung A-1 Die Bedeutung der Streuphänomene In der Physik und insbesondere in der Hochenergiephysik bestehen viele Experimen te darin, einen Strahl von Teilchen (1) (der z. B. von einem Beschleuniger produziert wird) auf ein Target aus Teilchen (2) zu richten und die auftretende Streuung zu unter suchen: Die verschiedenen Teilchen¹, die den Endzustand des Systems – das ist der Zustand nach der Streuung (s. Abb. 1) – bilden, werden ermittelt und ihre Eigenschaf
Abb. 1: Prinzip eines Streuexperiments zwischen den Teilchen (1) des einfallenden Strahls und den Teilchen (2) des Targets. Die beiden in der Abbildung gezeigten Detektoren messen die Anzahl der Teilchen, die unter einem Winkel θ 1 bzw. θ 2 zum einfallenden Strahl gestreut wurden. 1 In der Praxis kann man nicht immer alle emittierten Teilchen entdecken und muss sich oft mit nur unvollständigen Informationen über das Endsystem zufriedengeben. https://doi.org/10.1515/9783110638769-001
916 | VIII Elementare Streutheorie
ten (Emissionsrichtung, Energie usw.) gemessen. Das Ziel solcher Untersuchungen ist natürlich, etwas über die Wechselwirkungen zwischen den verschiedenen an der Re aktion beteiligten Teilchen zu erfahren. Die beobachtbaren Phänomene sind zum Teil äußerst verwickelt. Setzen sich z. B. die Teilchen (1) und (2) aus noch elementareren Komponenten zusammen (wie Protonen und Neutronen in einem Atomkern), so können sich diese während der Streuung zu zwei oder mehreren zusammengesetzten Endteilchen verbinden, die nicht mehr mit den Anfangsteilchen übereinstimmen. Darüber hinaus besteht bei ausreichend hohen Energien die relativistische Möglichkeit der Materialisation eines Teils der Energie: Es werden neue Teilchen erzeugt, und im Endzustand können viele solcher Teilchen enthalten sein (je größer die Energie des einfallenden Strahls ist, desto größer die Anzahl). Man spricht davon, dass die Streuung zu Reaktionen² führt, und beschreibt die Vorgänge wie in der Chemie durch Reaktionsgleichungen der Art (1) + (2) → (3) + (4) + (5) + . . .
(A-1)
Bestehen Anfangs- und Endzustand einer Reaktion aus denselben Teilchen (1) und (2), so nennt man sie eine Streureaktion. Sie heißt elastisch, wenn während der Reaktion die inneren Zustände der Teilchen unverändert bleiben.
A-2 Potentialstreuung Wir beschränken uns in diesem Kapitel auf die Untersuchung der elastischen Streu ung der einfallenden Teilchen (1) an den Targetteilchen (2). Wenn die Gesetze der klassischen Mechanik anwendbar wären, würde man zur Lösung dieses Problems die Änderungen der Bahnkurven der einlaufenden Teilchen aufgrund der von den Teil chen (2) ausgeübten Kräfte bestimmen. Für Prozesse, die in atomaren oder nuklearen Bereichen auftreten, kann die klassische Mechanik natürlich nicht angewandt wer den; vielmehr müssen wir die Entwicklung der Wellenfunktionen der einlaufenden Teilchen unter dem Einfluss ihrer Wechselwirkungen mit den Targetteilchen betrach ten (weshalb wir von der „Streuung“ der Teilchen (1) durch die Teilchen (2) sprechen). Zur Vereinfachung treffen wir die folgenden Voraussetzungen: 1. Wir nehmen an, dass die Teilchen (1) und (2) keinen Spin besitzen. Dadurch wird die Theorie beträchtlich vereinfacht, besagt jedoch nicht, dass der Spin der Teil chen für Streuprozesse grundsätzlich ohne Bedeutung wäre. 2. Wir werden die innere Struktur der Teilchen (1) und (2) nicht berücksichtigen. Die folgende Diskussion ist daher auf inelastische Streuphänomene, bei denen ein Teil
2 Da die betrachteten Prozesse quantenmechanischer Natur sind, ist es nicht allgemein möglich, den Endzustand einer gegebenen Reaktion mit Sicherheit vorherzusagen; es können nur die Wahrschein lichkeiten für das Auftreten verschiedener möglicher Zustände bestimmt werden.
A Einleitung
|
917
der kinetischen Energie von (1) durch die inneren Freiheitsgrade der Teilchen (1) und (2) im Endzustand absorbiert wird (s. z. B. den Franck-Hertz-Versuch), nicht anwend bar. Wir beschränken uns somit auf die elastische Streuung. 3. Wir nehmen an, das Target sei so dünn, dass wir Mehrfachstreuprozesse – das sind Prozesse, in denen ein einfallendes Teilchen mehrere Male gestreut wird, bevor es das Target verlässt – vernachlässigen können. 4. Wir vernachlässigen jede Möglichkeit der Kohärenz zwischen den an den ver schiedenen Targetteilchen gestreuten Wellen. Diese Vereinfachung ist gerechtfertigt, wenn die räumliche Ausdehnung der zu den Teilchen (1) gehörenden Wellenpakete klein ist gegenüber dem mittleren Abstand der Teilchen (2). Wir befassen uns also nur mit dem elementaren Prozess der Streuung eines Teilchens (1) des einlaufenden Strahls an einem Teilchen (2) des Targets. Dadurch wird eine Reihe von Phänomenen wie z. B. die kohärente Streuung an einem Kristall (Bragg-Streuung) oder die Streuung langsamer Neutronen an den Phononen eines Kristalls ausgeschlossen, obwohl sich durch sie wichtige Informationen über die Struktur und Dynamik von Kristallgittern gewinnen lassen. Wenn diese Kohärenzeffekte vernachlässigt werden können, ist der Fluss der vom Detektor nachgewiesenen Teilchen gleich der Summe der Flüsse der an jedem einzelnen der N Targetteilchen gestreuten Teilchen (die genaue Lage des Streu teilchens im Target ist unwichtig, da die Ausdehnungen des Targets sehr viel geringer als der Abstand zwischen Target und Detektor sind). 5. Wir nehmen an, dass die Wechselwirkung zwischen den Teilchen (1) und (2) durch die potentielle Energie V(r1 − r2 ) beschrieben werden kann, die nur von der re lativen Lage r = r1 − r2 der Teilchen abhängt. Folgen wir der Darstellung aus § B von Kapitel VII, so reduziert sich das Problem im Ruhesystem des Massenmittelpunkts³ der beiden Teilchen (1) und (2) auf die Untersuchung der Streuung eines einzelnen Teilchens am Potential V(r). Die Masse μ dieses „Relativteilchens“ hängt mit den Mas sen m1 und m2 von (1) und (2) über die Beziehung 1 1 1 + = μ m1 m2
(A-2)
zusammen.
A-3 Definition des Streuquerschnitts Die z-Achse sei die Richtung der einfallenden Teilchen mit der Masse μ (Abb. 2). Das Potential V(r) wirkt in der Umgebung des Ursprungs O des Koordinatensystems [der der Massenmittelpunkt der beiden realen Teilchen (1) und (2) ist]. Mit Fi bezeichnen
3 Um die in Streuexperimenten gewonnenen Ergebnisse auszuwerten, ist es natürlich notwendig, ins Laborsystem zurückzukehren. Der Wechsel von einem Bezugssystem in ein anderes ist ein einfaches kinematisches Problem, auf das wir hier nicht eingehen wollen.
918 | VIII Elementare Streutheorie
wir den Fluss der einfallenden Teilchen, das ist die Anzahl der Teilchen pro Zeit, die die Flächeneinheit senkrecht zur Einfallsrichtung bei großen negativen Werten von z passieren. (Der Fluss Fi wird als ausreichend klein angenommen, so dass wir Wech selwirkungen zwischen verschiedenen Teilchen des einfallenden Strahls vernachläs sigen können.)
Abb. 2: Der einfallende Strahl, dessen Teilchenfluss gleich Fi ist, ist parallel zur z-Achse gerichtet; er wird als viel breiter als der Wirkungsbereich des Potentials V(r) in der Umgebung des Ursprungs O angenommen. Weit von diesem Bereich entfernt misst ein Detektor D die Anzahl dn der Teilchen, die pro Zeiteinheit in den Raumwinkel dΩ gestreut werden. Seine Richtung wird durch die Polar winkel θ und φ gegeben. Die Zahl dn ist proportional zu Fi und dΩ; der Proportionalitätskoeffizient σ(θ, φ) ist per Definition der Streuquerschnitt oder Wirkungsquerschnitt in der (θ, φ)-Richtung.
In großer Entfernung vom Wirkungsbereich des Potentials stellen wir in der durch die Polarwinkel θ und φ festgelegten Richtung einen Detektor auf, der in Richtung des Ursprungs O zeigt und den Raumwinkel dΩ abdeckt (die Entfernung des Detektors von O ist groß verglichen mit der räumlichen Ausdehnung des Wirkungsbereichs des Potentials). Auf diese Weise können wir die Anzahl dn der Teilchen bestimmen, die pro Zeiteinheit in den Raumwinkel dΩ mit der Richtung (θ, φ) gestreut werden. Die Zahl dn ist offensichtlich proportional zu dΩ und dem einfallenden Strom Fi . Den Proportionalitätsfaktor zwischen dn und Fi dΩ bezeichnen wir mit σ(θ, φ): dn = Fi σ(θ, φ) d Ω
(A-3)
Die Dimensionen von dn und Fi sind T −1 bzw. (L2 T)−1 ; σ(θ, φ) hat daher die Dimension einer Fläche. Man bezeichnet σ(θ, φ) als differentiellen Streuquerschnitt oder differentiellen Wirkungsquerschnitt in Richtung (θ, φ). Querschnitte werden oft in Barn angegeben: 1 Barn = 10−24 cm2
(A-4)
Die Definition (A-3) kann in folgender Weise interpretiert werden: Die Anzahl der Teilchen pro Zeit, die den Detektor erreichen, ist gleich der Anzahl der einfallenden Teilchen, die eine Fläche σ(θ, φ) d Ω senkrecht zur z-Achse passiert hätten.
A Einleitung
| 919
Der totale Streuquerschnitt σ oder totale Wirkungsquerschnitt ist dann σ = ∫ σ(θ, φ) d Ω
(A-5)
Bemerkungen: 1. Bei der Definition (A-3), in der dn proportional zu dΩ ist, geht man davon aus, dass nur ge streute Teilchen betrachtet werden. Der Fluss dieser Teilchen, die einen gegebenen Detektor D [mit bestimmter Fläche und in Richtung (θ, φ)] erreichen, ist umgekehrt proportional zum Qua drat des Abstands zwischen D und O (diese Eigenschaft ist für einen Streufluss charakteristisch). Praktisch ist der einfallende Strahl räumlich begrenzt [trotzdem bleibt seine Breite viel größer als der Wirkungsbereich von V(r)], und der Detektor befindet sich außerhalb dieses Strahls, so dass er nur die gestreuten Teilchen auffängt. Natürlich kann man mit einer solchen Anordnung nicht den Querschnitt in der Richtung θ = 0 (Vorwärtsrichtung) messen; dieser kann nur durch Extra polation aus den Werten von σ(θ, φ) für kleine θ erhalten werden. 2. Der Begriff des Querschnitts ist nicht auf den Fall der elastischen Streuung beschränkt: Reak tions- oder Wirkungsquerschnitte werden analog definiert.
A-4 Kapitelüberblick In § B befassen wir uns kurz mit der Streuung an einem beliebigen Potential V(r) (das jedoch für r gegen unendlich schneller als 1/r abfallen soll): Zunächst führen wir in § B-1 die grundlegenden Begriffe des stationären Streuzustands und der Streuampli tude ein; dann zeigen wir in § B-2, wie sich aus dem asymptotischen Verhalten der Wellenfunktionen der stationären Streuzustände die Streuquerschnitte erhalten las sen. In § B-3 diskutieren wir die stationären Streuzustände genauer, indem wir von einer Integralgleichung ausgehen. Schließlich leiten wir in § B-4 für schwache Poten tiale eine Näherungslösung dieser Gleichung her, die Bornsche Näherung, bei der der Streuquerschnitt in sehr einfacher Weise mit der Fourier-Transformierten des Poten tials zusammenhängt. Für ein Zentralpotential V(r) bleiben die allgemeinen in § B beschriebenen Me thoden anwendbar, doch bevorzugt man in diesem Fall meist die Streuphasenmetho de (§ C). Sie basiert (§ C-1) auf dem Vergleich der stationären Zustände mit wohldefi niertem Drehimpuls im Potential V(r) (Partialwellen) mit den zugehörigen Funktionen bei Abwesenheit des Potentials (freie Kugelwellen). Deshalb beginnen wir in § C-2 mit der Untersuchung der stationären Zustände eines freien Teilchens und insbesonde re der freien Kugelwellen. Danach zeigen wir (§ C-3), dass der Unterschied zwischen einer Partialwelle im Potential V(r) und einer freien Kugelwelle mit demselben Dreh impuls l durch eine Phasenverschiebung δ l charakterisiert wird. Man muss also nur wissen, wie die stationären Streuzustände aus den Partialwellen konstruiert werden können, um den Ausdruck für die Streuquerschnitte in Abhängigkeit von den Phasen verschiebungen zu erhalten (§ C-4).
920 | VIII Elementare Streutheorie
B Stationäre Streuzustände. Streuquerschnitt Um den Streuprozess eines einfallenden Teilchens am Potential V(r) quantenmecha nisch zu beschreiben, müssen wir die zeitliche Entwicklung des zugehörigen Wellen pakets untersuchen. Befindet sich das Teilchen genügend weit im negativen Bereich der z-Achse und noch nicht unter dem Einfluss des Potentials V(r) (die Zeit t ist nega tiv), so wird sein Zustand als bekannt vorausgesetzt. Seine weitere Entwicklung erhält man unmittelbar als eine Überlagerung stationärer Zustände. Deshalb untersuchen wir zunächst die Eigenwertgleichung des Hamilton-Operators H = H0 + V(r)
(B-1)
worin H0 =
P2 2μ
(B-2)
die kinetische Energie des Teilchens ist. Zur Vereinfachung der Rechnung verwenden wir die stationären Zustände selbst und keine Wellenpakete. In dieser Weise sind wir bereits in Kapitel I (§ D-2 und Ergän zung HI ) bei der Behandlung von eindimensionalen Rechteckpotentialen vorgegan gen. Wir sehen also einen stationären Zustand als eine (stationäre) „Wahrscheinlich keitsflüssigkeit“ an und untersuchen die Struktur des zugehörigen Wahrscheinlich keitsstroms. Das Vorgehen ist nicht streng. Man müsste vielmehr zeigen, dass man dabei zu denselben Ergebnissen wie bei der korrekten Behandlung des Problems ge langt, bei der man von Wellenpaketen ausgehen muss.⁴ Es ermöglicht uns aber ein leichteres Verständnis allgemeiner Zusammenhänge, ohne dass diese von verwickel ten Rechnungen verdeckt werden.
B-1 Definition der stationären Streuzustände B-1-a Eigenwertgleichung des Hamilton-Operators Die Schrödinger-Gleichung, die die zeitliche Entwicklung eines Teilchens im Potential V(r) beschreibt, erlaubt Lösungen mit wohldefinierter Energie (stationäre Zustände) ψ(r, t) = φ(r) e−iEt/ℏ
(B-3)
worin φ(r) eine Lösung der Eigenwertgleichung [−
ℏ2 ∆ + V(r)] φ(r) = Eφ(r) 2μ
ist.
4 Für ein spezielles eindimensionales Problem ist dies in Ergänzung JI bewiesen worden.
(B-4)
B Stationäre Streuzustände. Streuquerschnitt | 921
Wir nehmen an, dass das Potential V(r) für r gegen unendlich schneller als 1/r fällt. Dies schließt das Coulomb-Potential aus. Wir betrachten nur Lösungen von Gl. (B-4) mit positiver Energie E; sie ist gleich der kinetischen Energie des einfallenden Teilchens, bevor es den Wirkungsbereich des Potentials erreicht. Definieren wir E= V(r) =
ℏ2 k 2 2μ
(B-5)
ℏ2 U(r) 2μ
(B-6)
so können wir Gl. (B-4) in der Form schreiben [∆ + k 2 − U(r)] φ(r) = 0
(B-7)
Für jeden Wert von k (d. h. der Energie E) besitzt Gl. (B-7) eine unendliche Anzahl von Lösungen (die positiven Eigenwerte des Hamilton-Operators H sind unendlich fach entartet). Wie bei der Behandlung von eindimensionalen Rechteckpotentialen (Kap. I, § D-2 und Ergänzung HI ) müssen wir eine Lösung suchen, die dem betrach teten Problem entspricht (wenn wir z. B. die Wahrscheinlichkeit bestimmen wollen, mit der ein Teilchen gegebener Energie eine eindimensionale Potentialbarriere durch läuft, wählen wir den stationären Zustand, der in der Region hinter der Barriere nur aus der transmittierten Welle besteht). Hier ist die Wahl der richtigen Zustände natür lich schwieriger, weil sich das Teilchen im dreidimensionalen Raum bewegt und die Form des Potentials V(r) zunächst einmal beliebig ist. Wir werden daher auf heuris tische Weise die Bedingungen präzisieren, denen die Lösungen von Gl. (B-7) zur Be schreibung eines Streuprozesses genügen müssen. Die entsprechenden Eigenzustän de des Hamilton-Operators nennen wir stationäre Streuzustände, und die zugehörigen (st) Wellenfunktionen bezeichnen wir mit v k (r). B-1-b Asymptotische Form der stationären Streuzustände. Streuamplitude Für große negative Werte von t ist das einlaufende Teilchen frei (V(r) ist praktisch gleich null, wenn man weit genug vom Ursprung O entfernt ist), und sein Zustand wird durch ein ebenes Wellenpaket beschrieben. Die gesuchte stationäre Wellenfunk tion muss also einen Term der Form eikz enthalten, worin k die Konstante aus Gl. (B-7) ist. Wenn das Wellenpaket den Wirkungsbereich des Potentials V(r) erreicht, wird sei ne Struktur grundlegend verändert und seine zeitliche Entwicklung kompliziert. Für große positive Werte von t verlässt es aber den Wirkungsbereich wieder und nimmt ei ne einfache Form an: Es ist jetzt aufgeteilt in ein transmittiertes Wellenpaket, das sich weiter in Richtung der z-Achse bewegt (und daher von der Form eikz ist) und ein ge (st) streutes Wellenpaket. Die Wellenfunktion v k (r), die den stationären Streuzustandq zu einer bestimmten Energie E = ℏ2 k 2 /2μ beschreibt, ergibt sich also aus der Überla gerung einer ebenen Welle eikz und einer gestreuten Welle (wir lassen hier das Problem der Normierung beiseite).
922 | VIII Elementare Streutheorie
Die Struktur der gestreuten Welle hängt natürlich vom Potential V(r) ab. Seine asymptotische Form (weit weg vom Wirkungsbereich des Potentials) bleibt aber ein fach; in Analogie zur Wellenoptik sehen wir, dass die gestreute Welle für große r die folgenden Eigenschaften aufweisen muss: 1. In einer gegebenen Richtung ist die Radialabhängigkeit von der Form eikr /r. Es handelt sich um eine gestreute (oder auslaufende) Welle mit derselben Energie wie die einlaufende Welle. Der Faktor 1/r resultiert aus den drei räumlichen Dimensionen: (∆ + k 2 )eikr verschwindet nicht, während: (∆ + k 2 )
eikr = 0 für r ≥ r0 , r0 > 0 beliebig r
(B-8)
gilt (in der Optik wird durch den Faktor 1/r der Energiefluss durch eine Kugeloberflä che vom Radius r für große r unabhängig von r; in der Quantenmechanik hängt der Wahrscheinlichkeitsfluss durch diese Fläche nicht von r ab). 2. Da die Streuung im Allgemeinen nicht isotrop ist, ist die Amplitude der auslau fenden Welle von der betrachteten Richtung (θ, φ) abhängig. (st) Nach Definition ist schließlich die Wellenfunktion v k (r) des stationären Streu zustands die Lösung von Gl. (B-7), deren asymptotisches Verhalten von der Form (st)
v k (r)
r→∞
∼
eikz + f k (θ, φ)
eikr r
(B-9)
ist. In diesem Ausdruck hängt nur die Funktion f k (θ, φ), die sogenannte Streuampli tude, vom Potential V(r) ab. Man kann zeigen (s. § B-3), dass Gl. (B-7) tatsächlich für jeden Wert von k nur genau eine Lösung hat, die die Bedingung (B-9) erfüllt. Bemerkungen: 1. Wir haben bereits darauf hingewiesen, dass man das Wellenpaket des einlaufenden Teilchens nach Eigenfunktionen des vollständigen Hamilton-Operators H und nicht nach ebenen Wellen entwickeln muss, um seine zeitliche Entwicklung angeben zu können. Wir betrachten also eine Wellenfunktion der Form⁵ ∞
(st)
ψ(r, t) = ∫ dk g(k) v k (r) e−iEk t/ℏ
(B-10)
0
mit Ek =
ℏ2 k 2 2μ
(B-11)
und mit einer der Einfachheit halber reell gewählten Funktion g(k), die bei k = k0 ein ausgepräg tes Maximum hat und an den anderen Stellen praktisch verschwindet. Die Funktion ψ(r, t) ist eine
5 Eigentlich muss man auch die ebenen Wellen mit Wellenvektoren k mit leicht abweichenden Ori entierungen überlagern, weil das einlaufende Wellenpaket in der Richtung senkrecht zur z-Achse be schränkt ist. Der Einfachheit halber beschäftigen wir uns hier nur mit der Streuung der Energie (die die Ausdehnung des Wellenpakets in z-Richtung beschränkt).
B Stationäre Streuzustände. Streuquerschnitt |
923
Lösung der Schrödinger-Gleichung und beschreibt daher die zeitliche Entwicklung des Teilchens richtig. Es bleibt zu zeigen, dass diese Funktion die Randbedingungen des Problems erfüllt. Ge mäß der Beziehung (B-9) geht sie asymptotisch in die Summe aus einem ebenen Wellenpaket und einem gestreuten Wellenpaket über: ∞
∞
r→∞
ψ(r, t) ∼ ∫ dk g(k) eikz e−iEk t/ℏ + ∫ dk g(k) f k (θ, φ) 0
eikr −iEk t/ℏ e r
(B-12)
0
Die Lage des Maximums dieser Wellenpakete kann man aus der Bedingung der stationären Phase erhalten (s. Kap. I, § C-2). Eine einfache Rechnung ergibt dann für das ebene Wellenpaket zM (t) = vG t
(B-13)
mit der Gruppengeschwindigkeit vG =
ℏk0 μ
(B-14)
Für das Maximum des gestreuten Wellenpakets in der (θ, ϕ)-Richtung findet man den folgenden Abstand von O: rM (θ, φ; t) = −α k0 (θ, φ) + vG t
(B-15)
worin α k (θ, φ) die Ableitung des Arguments der Streuamplitude f k (θ, φ) nach k ist. Zu beachten ist, dass Gl. (B-13) und Gl. (B-15) nur im asymptotischen Bereich gelten (d. h. für große |t|). Für große negative Werte von t existiert kein gestreutes Wellenpaket, wie man aus Gl. (B-15) sieht. Die Wellen, aus denen es zusammengesetzt ist, interferieren nur für negative Werte von r kon struktiv, also in einem Bereich, der für r gar nicht erlaubt ist. Wir finden also hier nur das ebene Wellenpaket, das sich nach Gl. (B-13) mit der Gruppengeschwindigkeit vG auf den Bereich der Wechselwirkung zubewegt. Für große positive Werte von t existieren beide Wellenpakete: Das erste bewegt sich entlang der positiven z-Achse und setzt den Weg des einlaufenden Wellenpa kets fort, das zweite wird in alle Richtungen gestreut. Der Streuprozess wird demnach durch die asymptotische Bedingung (B-9) korrekt beschrieben. 2. Die räumliche Ausdehnung ∆z des Wellenpakets (B-10) hängt mit der Streuung des Impulses ℏ∆k über die Beziehung ∆z ≈
1 ∆k
(B-16)
zusammen. Wir wollen annehmen, dass ∆k klein genug ist, damit ∆z sehr viel größer als die räum liche Ausdehnung des Wirkungsbereichs des Potentials wird. Unter dieser Bedingung benötigt das Wellenpaket, das sich mit der Geschwindigkeit vG auf O zubewegt (Abb. 3), zur Durchquerung dieses Bereichs die Zeit ∆T ≈
∆z 1 ≈ vG vG ∆k
(B-17)
Wir wählen als Nullpunkt der Zeitachse den Augenblick, in dem das Zentrum des einlaufenden Wellenpakets den Punkt O erreicht: Gestreute Wellen existieren nur für t ≥ −∆T/2, d. h. nachdem der vordere Rand des Wellenpakets den Wirkungsbereich des Potentials erreicht hat. Für t = 0 befindet sich der am weitesten entfernte Teil der Streuwelle in einem Abstand der Größe ∆z/2 von O. Wir betrachten jetzt ein zunächst anderes Problem mit einem zeitabhängigen Potential, das wir durch Multiplikation von V(r) mit einer Funktion f(t) erhalten, die zwischen t = −∆T/2 und t = 0 langsam von null auf eins wächst. Für t sehr viel kleiner als −∆T/2 ist das Potential
924 | VIII Elementare Streutheorie
Abb. 3: Das einfallende Wellenpaket der Länge ∆z bewegt sich mit der Geschwindigkeit v G auf das Potential V(r) zu; es tritt mit dem Potential während einer Zeitspanne ∆T = ∆z/v G in Wechselwirkung (wenn man annimmt, der Wirkungsbereich des Potentials sei klein gegen ∆z).
gleich null, und wir können annehmen, dass der Zustand des Teilchens durch eine ebene Welle gegeben ist (und den gesamten Raum ausfüllt). Diese wird ab t ≈ −∆T/2 verändert, und zum Zeitpunkt t = 0 verhält sie sich wie die gestreuten Wellen im vorhergehenden Fall. Wir sehen also, dass zwischen den beiden Problemen eine gewisse Analogie besteht. Auf der ei nen Seite haben wir die Streuung eines einfallenden Wellenpakets, dessen Amplitude zwischen t = −∆T/2 und t = 0 langsam wächst, an einem konstanten Potential; auf der anderen Seite ha ben wir die Streuung einer ebenen Welle konstanter Amplitude an einem Potential, das während desselben Zeitintervalls [−∆T/2, 0] langsam „angeschaltet“ wird. Für ∆k → 0 geht das Wellenpaket (B-10) in einen stationären Streuzustand über (g(k) geht in δ(k−k0 ) über); zusätzlich wird nach Gl. (B-17) ∆T unendlich groß, und der mit der Funktion f(t) zu sammenhängende Anschaltvorgang des Potentials verläuft unendlich langsam (er wird deshalb oft „adiabatisch“ genannt). Unsere Überlegungen sind im Wesentlichen qualitativ; trotzdem er lauben sie es, einen stationären Streuzustand als das Ergebnis des adiabatischen Einschaltens eines Streupotentials zu beschreiben, das auf eine freie ebene Welle wirkt. Man kann diese Inter pretation präzisieren, indem man die zeitliche Entwicklung der ebenen Welle unter dem Einfluss des Potentials f(t)V(r) im Detail untersucht.
B-2 Berechnung des Streuquerschnitts B-2-a Stationärer Zustand und Wahrscheinlichkeitsfluid Zur Bestimmung des Streuquerschnitts müsste man die Streuung eines einlaufenden Wellenpakets am Potential V(r) untersuchen. Man kann das Ergebnis jedoch sehr viel einfacher erhalten, wenn man den Begriff der stationären Streuzustände verwendet; man betrachtet einen derartigen Zustand als ein stationäres Wahrscheinlichkeits fluid und berechnet den Streuquerschnitt aus dem einlaufenden und dem gestreuten Strom. Wir wiesen bereits darauf hin, dass diese Methode analog zu der ist, die wir im Zusammenhang mit der Behandlung eindimensionaler Rechteckstufen verwendet
B Stationäre Streuzustände. Streuquerschnitt |
925
haben: In diesen Problemen ergab sich der Reflexions- (oder Transmissions-) Koeffi zient sofort aus dem Verhältnis des reflektierten (oder transmittierten) Stroms zum einfallenden Strom. Wir berechnen daher die Beiträge der einfallenden und der gestreuten Welle zum Wahrscheinlichkeitsstrom eines stationären Streuzustands. Wir erinnern an den Aus druck für den zu einer Wellenfunktion φ(r) gehörenden Strom J(r): J(r) =
1 ℏ Re [φ∗ (r) ∇φ(r)] μ i
(B-18)
B-2-b Einfallender und gestreuter Strom Der einfallende Strom Ji ergibt sich aus Gl. (B-18), indem wir φ(r) durch die ebene Welle eikz ersetzen; Ji zeigt also in die positive z-Richtung und hat den Betrag |Ji | =
ℏk μ
(B-19)
Da die gestreute Welle in der Beziehung (B-9) in Kugelkoordinaten angegeben ist, berechnen wir die Komponenten des gestreuten Stroms Jd (Index „d“ für Diffusion) in Richtung der Achsen des lokalen Dreibeins. Die entsprechenden Komponenten des Operators ∇ lauten ∂ ∂r 1 ∂ (∇)θ = r ∂θ ∂ 1 (∇)φ = r sin θ ∂φ (∇)r =
(B-20)
Ersetzen wir φ(r) in Gl. (B-18) durch die Funktion f k (θ, φ)eikr /r, so können wir den gestreuten Strom im asymptotischen Bereich leicht angeben: ℏk 1 |f k (θ, φ)|2 μ r2 ℏ 1 1 ∂ (Jd )θ = Re [ f k∗ (θ, φ) f k (θ, φ)] μ r3 i ∂θ 1 ℏ ∂ 1 (Jd )φ = f k (θ, φ)] Re [ f k∗ (θ, φ) μ r3 sin θ i ∂φ (Jd )r =
(B-21)
Da r groß ist, sind (Jd )θ und (Jd )φ im Vergleich zu (Jd )r vernachlässigbar und der ge streute Strom verläuft praktisch radial. B-2-c Streuquerschnitt Der einfallende Strahl besteht aus unabhängigen Teilchen, die alle in derselben Weise präpariert sein sollen; lässt man eine große Anzahl dieser Teilchen einfallen, so ent spricht das der vielfachen Wiederholung eines Experiments, bei dem ein Teilchen im
926 | VIII Elementare Streutheorie (st)
mer im selben Zustand ist. Wird dieser Zustand durch v k (r) beschrieben, so ist klar, dass der einfallende Fluss Fi , also die Anzahl der Teilchen des einfallenden Strahls, die eine Flächeneinheit senkrecht zur z-Achse pro Zeiteinheit passieren, proportional zum Fluss des Vektors Ji durch diese Fläche ist. Nach Gl. (B-19) ist daher Fi = C|Ji | = C
ℏk μ
(B-22)
Entsprechend ist die Anzahl dn der Teilchen, die auf die Detektoröffnung treffen (Abb. 2), proportional zum Fluss des Vektors Jd durch die Fläche dS dieser Öffnung [die Proportionalitätskonstante ist dieselbe wie in Gl. (B-22)]: dn = CJd ⋅ dS = C(Jd )r r2 dΩ =C
ℏk |f k (θ, φ)|2 dΩ μ
(B-23)
Wir sehen, dass dn für genügend große r unabhängig von r ist. Setzen wir Gl. (B-22) und Gl. (B-23) in die Definition (A-3) des differentiellen Quer schnitts σ(θ, φ) ein, so erhalten wir σ(θ, φ) = |f k (θ, φ)|2
(B-24)
Der differentielle Querschnitt ist also gleich dem Quadrat des Betrags der Streuampli tude. B-2-d Interferenz zwischen einfallender und gestreuter Welle (st) In den vorhergehenden Abschnitten haben wir einen Beitrag zu dem zu v k (r) im asymptotischen Bereich gehörenden Strom vernachlässigt. Dieser rührt von der Inter ferenz zwischen der ebenen Welle eikz und der gestreuten Welle her und ergibt sich, wenn man φ∗ (r) in Gl. (B-18) durch e−ikz und φ(r) durch f k (θ, φ)eikr /r und umgekehrt ersetzt. Wir können uns jedoch davon überzeugen, dass diese Interferenzterme nicht auftreten, solange wir die Streuung in einer anderen als der Vorwärtsrichtung (θ = 0) betrachten: Dazu greifen wir auf die Beschreibung der Streuung mit Hilfe von Wel lenpaketen (Abb. 4) zurück und beachten die Tatsache, dass das Wellenpaket in der Praxis stets eine endliche Breite hat. Zunächst bewegt sich das einfallende Wellenpa ket auf den Wirkungsbereich von V(r) zu (Abb. 4a). Nach dem Stoß (Abb. 4b) finden wir zwei Wellenpakete: ein ebenes, das sich aus der Fortbewegung des einfallenden Wellenpakets ergibt (so, als ob kein Potentialstreuer vorhanden wäre) und ein gestreu tes, das sich von O aus in alle Richtungen entfernt. Die transmittierte Welle resultiert aus der Interferenz dieser beiden Wellentypen. Im Allgemeinen jedoch platzieren wir den Detektor außerhalb des Strahls, so dass er von den ungestreuten Teilchen nicht
B Stationäre Streuzustände. Streuquerschnitt
(a)
| 927
(b)
Abb. 4: a) Vor der Streuung bewegt sich das einfallende Wellenpaket auf den Wirkungsbereich des Potentials zu. b) Nach der Streuung beobachten wir ein ebenes Wellenpaket und ein vom Poten tial gestreutes kugelförmiges Wellenpaket (gestrichelte Linien). Die ebene und die gestreute Wel le interferieren in der Vorwärtsrichtung destruktiv (Erhaltung der Gesamtwahrscheinlichkeit); der Detektor D befindet sich in seitlich verschobener Richtung und registriert nur die gestreuten Wellen.
getroffen wird; wir beobachten also nur das gestreute Wellenpaket und brauchen den angesprochenen Interferenzterm nicht zu beachten. Allerdings ersieht man aus Abb. 4b, dass die Interferenz zwischen der ebenen und der gestreuten Welle in Vorwärtsrichtung, in der beide denselben Raumbereich einnehmen, nicht vernachlässigt werden kann. Das transmittierte Wellenpaket ergibt sich aus dieser Interferenz. Es muss eine kleinere Amplitude als die des einfallenden Pakets haben, weil die Gesamtwahrscheinlichkeit erhalten bleibt (die Gesamtzahl der Teilchen darf sich nicht ändern): Die nicht in Vorwärtsrichtung gestreuten Teilchen verlassen den Strahl, dessen Intensität sich somit nach dem Durchgang durch das Tar get verringert. Die destruktive Interferenz zwischen dem ebenen und dem nach vorn gestreuten Wellenpaket sichert gerade die Erhaltung der Gesamtteilchenzahl.
B-3 Integralgleichung für die gestreute Welle Wir wollen nun genauer als in § B-1-b zeigen, wie man sich von der Existenz stationä rer Wellenfunktionen mit dem in der Beziehung (B-9) vorgegebenen asymptotischen Verhalten überzeugen kann. Dazu stellen wir eine Integralgleichung auf, deren Lö sungen gerade die Wellenfunktionen sind, die zu den stationären Streuzuständen ge hören.
928 | VIII Elementare Streutheorie
Wir gehen zurück zur Eigenwertgleichung von H [Gl. (B-7)] und schreiben sie in der Form (∆ + k 2 )φ(r) = U(r)φ(r)
(B-25)
Wir nehmen an (wir werden später sehen, dass das tatsächlich der Fall ist), es existiere eine Funktion G(r), so dass (∆ + k 2 )G(r) = δ(r)
(B-26)
[G(r) heißt Greensche Funktion des Operators ∆ + k 2 .] Dann erfüllt jede Funktion φ(r), für die φ(r) = φ0 (r) + ∫ d3 r G(r − r )U(r )φ(r )
(B-27)
gilt und worin φ0 (r) eine Lösung der homogenen Gleichung (∆ + k 2 )φ0 (r) = 0
(B-28)
ist, die Differentialgleichung (B-25). Um das zu sehen, wenden wir den Operator ∆ + k 2 auf beide Seiten von Gl. (B-27) an; mit Gl. (B-28) erhalten wir (∆ + k 2 )φ(r) = (∆ + k 2 ) ∫ d3 r G(r − r )U(r )φ(r )
(B-29)
Wir gehen davon aus, dass wir den Operator in das Integral ziehen können. Er wirkt dann nur auf die Variable r, und wir finden mit Gl. (B-26) (∆ + k 2 )φ(r) = ∫ d3 r δ(r − r )U(r )φ(r ) = U(r)φ(r)
(B-30)
Umgekehrt kann gezeigt werden, dass jede Lösung von Gl. (B-25) die Gl. (B-27) erfüllt.⁶ Die Differentialgleichung (B-25) kann also durch die Integralgleichung (B-27) ersetzt werden. Oft ist es einfacher, die Integralgleichung zu verwenden. Ihr prinzipieller Vorteil besteht darin, dass mit der richtigen Wahl von φ0 (r) und G(r) das asymptotische Ver halten in die Gleichung mit eingebaut wird. Es besteht also Äquivalenz zwischen der Integralgleichung (B-27) einerseits und der Differentialgleichung (B-25) zusammen mit der asymptotischen Bedingung (B-9) andererseits. Wir betrachten zunächst Gl. (B-26). Danach muss (∆ + k 2 )G(r) in jedem Gebiet, das den Ursprung nicht enthält, identisch verschwinden [was nach Gl. (B-8) für G(r)
6 Dies erkennt man, wenn man U(r)φ(r) als Inhomogenitätsglied einer Differentialgleichung ansieht: Man erhält dann eine allgemeine Lösung von Gl. (B-25), indem man zur allgemeinen Lösung der ho mogenen Gleichung eine spezielle Lösung der vollständigen Gleichung addiert [zweiter Term von Gl. (B-27)].
B Stationäre Streuzustände. Streuquerschnitt |
929
gleich eikr /r erfüllt ist]. Darüber hinaus muss sich G(r) nach Gl. (61) aus Anhang II für r gegen null wie −1/4πr verhalten. Tatsächlich lässt sich zeigen, dass die Funktionen G± (r) = −
1 e±ikr 4π r
(B-31)
Lösungen von Gl. (B-26) sind. Dazu können wir schreiben ∆G± (r) = e±ikr ∆ (−
1 1 1 )− ∆ (e±ikr ) + 2 [∇ (− )] [∇ ⋅ e±ikr ] 4πr 4πr 4πr
(B-32)
eine einfache Rechnung ergibt dann (s. Anhang II) ∆G± (r) = −k 2 G± (r) + δ(r)
(B-33)
was wir zeigen wollten. Die Funktionen G+ und G− heißen auslaufende bzw. einlau fende Greensche Funktionen. Die Bedingung (B-9) führt hier auf die Wahl einer einfallenden ebenen Welle eikz für φ0 (r) und auf die Wahl der auslaufenden Greenschen Funktion G+ (r) für G(r); wir werden zeigen, dass die integrale Streugleichung, deren Lösungen das durch Bezie hung (B-9) gegebene asymptotische Verhalten aufweisen, als (st)
(st)
v k (r) = eikz + ∫ d3 r G+ (r − r )U(r )v k (r )
(B-34)
geschrieben werden kann. Dazu begeben wir uns an einen Punkt M (Ortsvektor r), der sich weit entfernt von den Punkten P (Ortsvektor r ) im Wirkungsbereich des Potentials mit der räumlichen Ausdehnung von der Größenordnung L befindet (Abb. 5):⁷ r≫L r ≲ L
(B-35)
Da der Winkel zwischen MO und MP sehr klein ist, ist die Strecke MP (das ist die Länge |r − r |) in guter Näherung gleich der Projektion von MP auf MO, |r − r | ≈ r − u ⋅ r
(B-36)
worin u der Einheitsvektor in r-Richtung ist. Für große r folgt
G+ (r − r ) = −
1 eik|r−r | 4π |r − r |
r→∞
∼ −
1 eikr −iku⋅r e 4π r
(B-37)
Setzen wir diesen Ausdruck wieder in Gl. (B-34) ein, erhalten wir das asymptotische (st) Verhalten von v k (r): (st)
r→∞
v k (r) ∼ eikz −
1 eikr (st) ∫ d3 r e−iku⋅r U(r )v k (r ) 4π r
(B-38)
7 Man beachte, dass wir ausdrücklich voraussetzen, dass U(r) für r gegen unendlich schneller fällt als 1/r.
930 | VIII Elementare Streutheorie
Abb. 5: Näherungsweise Bestimmung des Abstands |r − r | zwischen einem weit von O entfernten Punkt M und einem Punkt P, der sich im Wirkungsbereich des Potentials befin det (die räumliche Ausdehnung dieses Bereichs ist von der Größenordnung L).
darin erkennen wir die Form (B-9) wieder, da das Integral nicht länger eine Funktion des Abstands r = OM ist, sondern (über den Einheitsvektor u) nur noch der Polar winkel θ und φ, die die Richtung des Vektors OM angeben. Wir erhalten also, indem wir f k (θ, φ) = −
1 (st) ∫ d3 r e−iku⋅r U(r )v k (r ) 4π
(B-39)
setzen, einen zu (B-9) identischen Ausdruck. Damit ist gezeigt, dass die Lösungen der Integralgleichung (B-34) tatsächlich sta tionäre Streuzustände sind.⁸ Bemerkung: Es erweist sich oft als zweckmäßig, den Wellenvektor ki des einfallenden Strahls als einen Vektor der Länge k in Richtung der z-Achse zu definieren, so dass eikz = eiki ⋅r
(B-40)
gilt. Ebenso heißt der Vektor kd mit der gleichen Länge k wie der Wellenvektor der einfallen den Welle, aber mit einer durch die Winkel θ und φ gegebenen Richtung, Wellenvektor der in (θ, φ)-Richtung kd = ku
(B-41)
gestreuten Welle. Schließlich ist der Streuwellenvektor in (θ, φ)-Richtung die Differenz zwischen kd und ki (Abb. 6): K = kd − ki
(B-42)
8 Um die Existenz stationärer Streuzustände zu beweisen, genügt es daher zu zeigen, dass Gl. (B-34) eine Lösung besitzt.
B Stationäre Streuzustände. Streuquerschnitt | 931
Abb. 6: Wellenvektor der einfallenden Welle ki , Wellenvektor kd der gestreuten Welle und Streuwellenvektor K.
B-4 Die Bornsche Näherung B-4-a Näherungsweise Lösung der Integralgleichung Unter Verwendung von Gl. (B-40) können wir die Integralgleichung in der Form schrei ben (st)
(st)
v k (r) = eiki ⋅r + ∫ d3 r G+ (r − r )U(r )v k (r )
(B-43)
wir werden versuchen, diese Gleichung durch Iteration zu lösen. Eine einfache Umbenennung der Variablen (r → r ; r → r ) ergibt (st)
(st)
v k (r ) = eiki ⋅r + ∫ d3 r G+ (r − r )U(r )v k (r )
(B-44)
Setzen wir diesen Ausdruck in Gl. (B-43) ein, so erhalten wir (st)
v k (r) = eiki ⋅r + ∫ d3 r G+ (r − r )U(r )eiki ⋅r
(st)
+ ∫ d3 r ∫ d3 r G+ (r − r )U(r )G+ (r − r )U(r )v k (r )
(B-45)
Die ersten beiden Terme der rechten Seite von Gl. (B-45) sind bekannt, nur der dritte (st) enthält die unbekannte Funktion v k (r). Der obige Schritt kann wiederholt werden: (st)
Wenn wir in Gl. (B-43) r in r und r in r umbenennen, erhalten wir v k (r ), das wiederum in Gl. (B-45) eingesetzt werden kann. Damit wird (st)
v k (r) = eiki ⋅r + ∫ d3 r G+ (r − r )U(r )eiki ⋅r
+ ∫ d3 r ∫ d3 r G+ (r − r )U(r )G+ (r − r )U(r )eiki ⋅r
+ ∫ d3 r ∫ d3 r ∫ d3 r G+ (r − r )U(r )G+ (r − r )U(r ) (st)
× G+ (r − r )U(r )v k (r )
(B-46) (st)
worin die ersten drei Terme bekannt sind; die unbekannte Funktion v k (r) wurde in den vierten Term geschoben. Auf diese Weise können wir Schritt für Schritt die Bornsche Reihe der stationären Streuwellenfunktion konstruieren. Mit jedem Term dieser Entwicklung wird eine wei tere Potenz des Potentials eingebracht; für schwache Potentiale ist also der folgende
932 | VIII Elementare Streutheorie
Term jeweils kleiner als der vorhergehende. Wenn wir die Entwicklung weit genug trei (st) ben, können wir den letzten Term auf der rechten Seite vernachlässigen und so v k (r) in Abhängigkeit von bekannten Größen erhalten. (st) Setzen wir diese Entwicklung für v k (r) in Gl. (B-39) ein, so erhalten wir die Born sche Reihe für die Streuamplitude. Beschränken wir uns insbesondere auf die erste (st) Ordnung in U, brauchen wir nur auf der rechten Seite von Gl. (B-39) v k (r ) durch ik ⋅r e i zu ersetzen; das ist die erste Bornsche Näherung: (B)
1 ∫ d3 r e−iku⋅r U(r )eiki ⋅r 4π 1 =− ∫ d3 r e−i(kd −ki )⋅r U(r ) 4π 1 =− ∫ d3 r e−iK⋅r U(r ) 4π
f k (θ, φ) = −
(B-47)
worin K der in Gl. (B-42) definierte Streuwellenvektor ist. Der Streuquerschnitt hängt so in der Bornschen Näherung in sehr einfacher Weise mit der Fourier-Transformierten des Potentials zusammen, da aus Gl. (B-24), Gl. (B-6) und Gl. (B-47) folgt (B)
σ k (θ, φ) =
μ2 4π2 ℏ4
3 2 ∫ d r e−iK⋅r V(r)
(B-48)
Nach Abb. 6 hängen Richtung und Betrag des Streuwellenvektors K sowohl vom Betrag k von ki und kd als auch von der Streurichtung (θ, φ) ab. Für eine gegebene Richtung (θ, φ) ändert sich also der Bornsche Streuquerschnitt mit k, d. h. mit der Energie des einfallenden Strahls; ebenso ändert sich σ (B) für eine gegebene Energie mit θ und φ. Die Bornsche Näherung zeigt also, wie sich aus der Untersuchung der Abhängigkeiten des differentiellen Querschnitts von der Streurichtung und der Ein fallsenergie Rückschlüsse auf das Potential V(r) ziehen lassen. B-4-b Interpretation der Gleichungen Wir können Gl. (B-45) eine physikalische Bedeutung geben, die die formale Analogie zwischen der Quantenmechanik und der Wellenoptik deutlich werden lässt. Wir betrachten den Wirkungsbereich des Potentials als ein Streumedium, dessen Dichte proportional zu U(r) ist. Die Funktion G+ (r − r ) [Gl. (B-31)] stellt die Amplitude einer Welle am Punkt r dar, die von einer Punktquelle am Ort r ausgestrahlt wird. Die ersten beiden Terme von Gl. (B-45) beschreiben daher die Gesamtwelle am Punkt r als das Ergebnis der Überlagerung der einlaufenden Welle eiki ⋅r und einer unendlichen Anzahl von Wellen, die von Sekundärquellen herrühren, die im Streumedium von der einlaufenden Welle induziert werden. Die Amplitude dieser Quellen ist proportional zur einlaufenden Welle (eiki ⋅r ) und zur Dichte des Streumaterials [U(r )] am jeweiligen Punkt r . Diese (in Abb. 7 schematisch veranschaulichte) Interpretation ist mit dem Huygensschen Prinzip der Wellenoptik zu vergleichen.
C Streuung am Zentralpotential. Partialwellenmethode | 933
Abb. 7: Schematische Darstellung der Born schen Näherung: Wir betrachten nur die einlaufende Welle und die durch einmalige Wechselwirkung mit dem Potential gestreuten Wellen.
Tatsächlich enthält Gl. (B-45) noch einen dritten Term. Wir können jedoch auch die weiteren Terme der Bornschen Reihe in analoger Weise interpretieren: Da das Streumedium sich über einen gewissen Bereich erstreckt, kann eine Sekundärquelle nicht nur von der einlaufenden Welle, sondern auch von gestreuten Wellen anderer Sekundärquellen angeregt werden. Abbildung 8 stellt symbolisch den dritten Term der Bornschen Reihe dar [s. Gl. (B-46)]. Hat das Streumedium eine sehr geringe Dich te [U(r) sehr klein], so können wir den gegenseitigen Einfluss von Sekundärquellen aufeinander vernachlässigen.
Abb. 8: Schematische Darstellung des Terms zweiter Ordnung in U in der Bornschen Nähe rung: Hier betrachten wir Wellen, die zweimal am Potential gestreut werden.
Bemerkung: Die Interpretation, die wir soeben für Terme höherer Ordnung in der Bornschen Reihe gegeben haben, hat nichts mit Vielfachstreuprozessen zu tun, die in einem dichten Medium auftreten kön nen; wir betrachten hier nur die Streuung eines einfallenden Teilchens an einem Targetteilchen, während Vielfachstreuung die mehrmalige Wechselwirkung desselben einlaufenden Teilchens an mehreren verschiedenen Targetteilchen bedeutet.
C Streuung am Zentralpotential. Partialwellenmethode C-1 Prinzip der Partialwellenmethode Für den Fall eines Zentralpotentials V(r) ist der Bahndrehimpuls L des Teilchens ei ne Konstante der Bewegung. Es gibt daher stationäre Zustände mit wohldefiniertem Drehimpuls, d. h. gemeinsame Eigenzustände zu H, L2 und L z . Wir wollen die zu die sen Zuständen gehörenden Wellenfunktionen Partialwellen nennen und sie φ k,l,m (r) schreiben. Die entsprechenden Eigenwerte zu H, L2 und L z sind ℏ2 k 2 /2μ, l(l + 1)ℏ2 bzw. mℏ. Ihre Winkelabhängigkeit wird allein durch die Kugelflächenfunktionen Y lm (θ, φ) gegeben; das Potential V(r) beeinflusst nur die Radialabhängigkeit.
934 | VIII Elementare Streutheorie
Wir erwarten für große r, dass sich die Partialwellen den gemeinsamen Eigen funktionen zu H0 , L2 und L z annähern, wobei H0 der freie Hamilton-Operator (B-2) ist. Deshalb werden wir in § C-2 zunächst die stationären Zustände eines freien Teilchens und insbesondere solche mit wohldefiniertem Drehimpuls untersuchen. Die zugehöri (0) gen Wellenfunktionen φ k,l,m (r) sind freie Kugelwellen: Ihre Winkelabhängigkeit wird durch die Kugelflächenfunktionen gegeben, und wir werden zeigen, dass der asym ptotische Ausdruck für ihre Radialfunktion die Überlagerung einer einlaufenden Wel le e−ikr /r und einer auslaufenden Welle eikr /r mit wohlbestimmter Phasendifferenz ist. Der asymptotische Ausdruck für die Partialwelle φ k,l,m (r) im Potential V(r) ist ebenfalls (§ C-3) die Überlagerung einer einlaufenden und einer auslaufenden Welle. Ihre Phasendifferenz unterscheidet sich jedoch von derjenigen, die die entsprechen de freie Welle charakterisiert: Das Potential V(r) bewirkt eine zusätzliche Phasenver schiebung δ l . Sie macht den einzigen Unterschied im asymptotischen Verhalten von (0) φ k,l,m und φ k,l,m aus. Für festes k brauchen wir daher nur die Phasenverschiebungen δ l für alle l zu kennen, um den Querschnitt berechnen zu können. (st) Für die Rechnung drücken wir (§ C-4) die stationären Streuzustände v k (r) als Linearkombination von Partialwellen φ k,l,m (r) aus, die dieselbe Energie bei unter schiedlichem Drehimpuls haben. Einfache physikalische Überlegungen ergeben, dass die Koeffizienten dieser Linearkombination dieselben sein sollten wie die der Entwick lung der ebenen Welle eikz nach freien Kugelwellen; das wollen wir explizit bestätigen. Mit der Verwendung von Partialwellen können wir die Streuamplitude und damit auch den Querschnitt in Abhängigkeit von den Phasenverschiebungen δ l ausdrücken. Diese Methode ist besonders vorteilhaft, wenn die Ausdehnung des Potentials nicht viel größer als die zu der Bewegung des Teilchens gehörende Wellenlänge ist, weil in diesem Fall nur eine geringe Anzahl von Phasenverschiebungen einen Beitrag liefert (§ C-3-b-β).
C-2 Stationäre Zustände eines freien Teilchens In der klassischen Mechanik bewegt sich ein freies Teilchen mit der Masse μ gleich förmig entlang einer geradlinigen Bahn. Sein Impuls p, seine Energie E = p2 /2μ und sein Drehimpuls 𝓛 = r × p in Bezug auf den Koordinatenursprung sind Konstanten der Bewegung. In der Quantenmechanik vertauschen die Observablen P und L = R × P nicht. Sie stellen also inkompatible Größen dar: Es ist unmöglich, Impuls und Drehimpuls eines Teilchens gleichzeitig scharf zu messen. Der Hamilton-Operator H0 lautet H0 =
1 2 P 2μ
(C-1)
C Streuung am Zentralpotential. Partialwellenmethode | 935
H0 allein stellt noch keinen vollständigen Satz kommutierender Observabler (V. S. K. O.) dar: Seine Eigenwerte sind unendlichfach entartet (s. § C-2-a). Die vier Observa blen H0 , P x , P y , P z
(C-2)
hingegen bilden einen V. S. K. O. Ihre gemeinsamen Eigenzustände sind stationäre Zu stände mit wohldefiniertem Impuls. Ein freies Teilchen kann auch als Teilchen in einem Zentralpotential null angese hen werden. Die Ergebnisse aus Kapitel VII sagen dann aus, dass die drei Observablen H0 , L2 , L z
(C-3)
einen V. S. K. O. bilden. Die zugehörigen Eigenzustände sind stationäre Zustände mit wohldefiniertem Drehimpuls (genauer gesagt haben L2 und L z wohldefinierte Werte, L x und L y jedoch nicht). Die Basen des Zustandsraums, die durch die vollständigen Sätze kommutierender Observabler (C-2) und (C-3) definiert werden, sind verschieden, weil P und L inkom patible Größen sind. Wir werden beide Basen untersuchen und zeigen, wie man von der einen zur anderen gelangen kann. C-2-a Stationäre Zustände mit wohldefiniertem Impuls. Ebene Wellen Wir wissen bereits (s. Kap. II, § E-2-d), dass die drei Observablen P x , P y , P z einen V. S. K. O. definieren (für ein spinloses Teilchen). Die gemeinsamen Eigenzustände bil den eine Basis der Impulsdarstellung: P|p⟩ = p|p⟩
(C-4)
Da H0 mit diesen drei Observablen vertauscht, sind die Zustände |p⟩ notwendig Ei genzustände von H0 : H0 |p⟩ =
p2 |p⟩ 2μ
(C-5)
Das Spektrum von H0 ist daher kontinuierlich und umfasst alle nichtnegativen Zahlen. Jeder Eigenwert ist unendlichfach entartet: Zu einer gegebenen positiven Energie E gehört eine unendliche Anzahl von Ketvektoren |p⟩, weil es unendlich viele Vektoren p gibt, für deren Betrag gilt |p| = √2μE
(C-6)
Die zu den Ketvektoren |p⟩ gehörenden Wellenfunktionen sind die ebenen Wellen (s. Kap. II, § E-1-a) ⟨r|p⟩ = (
1 3/2 ip⋅r/ℏ ) e 2πℏ
(C-7)
936 | VIII Elementare Streutheorie Wir wollen hier den Wellenvektor k zur Beschreibung einer ebenen Welle einführen, k=
p ℏ
(C-8)
und wir definieren |k⟩ = ℏ3/2 |p⟩
(C-9)
Die Ketvektoren |k⟩ sind stationäre Zustände mit wohldefiniertem Impuls: H0 |k⟩ =
ℏ2 k2 |k⟩ 2μ
P|k⟩ = ℏk|k⟩
(C-10a) (C-10b)
Sie sind im erweiterten Sinne orthonormal, ⟨k|k ⟩ = δ(k − k )
(C-11)
und bilden eine Basis des Zustandsraums: ∫ d3 k |k⟩⟨k| = 𝟙
(C-12)
Die zugehörigen Wellenfunktionen sind die ebenen Wellen, die in leicht veränderter Weise normiert sind: ⟨r|k⟩ = (
1 3/2 ik⋅r ) e 2π
(C-13)
C-2-b Zustände mit wohldefiniertem Drehimpuls. Freie Kugelwellen Um die gemeinsamen Eigenfunktionen zu H0 , L2 und L z zu erhalten, brauchen wir nur die Radialgleichung für ein identisch verschwindendes Zentralpotential zu lösen. Die detaillierte Lösung dieses Problems findet sich in Ergänzung AVIII ; hier wollen wir uns darauf beschränken, die Ergebnisse anzugeben. Freie Kugelwellen sind die Wellenfunktionen, die zu den stationären Zuständen (0) |φ k,l,m ⟩ eines freien Teilchens mit wohldefiniertem Drehimpuls gehören; sie lauten (0)
φ k,l,m (r) = √
2k 2 j l (kr) Y lm (θ, φ) π
(C-14)
worin j l eine sphärische Bessel-Funktion ist: j l (ρ) = (−1)l ρ l (
1 d l sin ρ ) ρ dρ ρ
(C-15)
Die entsprechenden Eigenwerte zu H0 , L2 und L z sind ℏ2 k 2 /2μ, l(l + 1)ℏ2 bzw. mℏ.
C Streuung am Zentralpotential. Partialwellenmethode | 937
Die freien Kugelwellen (C-14) sind in erweitertem Sinne orthonormal, ∞
(0)
(0)
⟨φ k,l,m |φ k ,l ,m ⟩ =
2 kk ∫ j l (kr)j l (k r) r2 dr × ∫ dΩ Y lm ∗ (θ, φ)Y lm (θ, φ) π
0
= δ(k − k )δ ll δ mm
(C-16)
und bilden eine Basis des Zustandsraums: ∞
∞
+l
(0)
(0)
∫ dk ∑ ∑ |φ k,l,m ⟩⟨φ k,l,m | = 𝟙 0
(C-17)
l=0 m=−l
C-2-c Physikalische Eigenschaften freier Kugelwellen α Winkelabhängigkeit (0) Die Winkelabhängigkeit einer freien Kugelwelle φ k,l,m (r) ist vollständig durch die Ku gelflächenfunktion Y lm (θ, φ) gegeben. Sie ist also durch die Eigenwerte von L2 und L z (d. h. durch die Indizes l und m) festgelegt, und nicht durch die Energie. Zum Beispiel ist eine freie s(l = 0)-Welle immer isotrop. β Verhalten um den Ursprung Wir betrachten einen infinitesimalen Raumwinkel dΩ0 in (θ0 , φ0 )-Richtung: Ist das (0) Teilchen im Zustand |φ k,l,m ⟩, so ist die Wahrscheinlichkeit, das Teilchen in diesem Raumwinkel zwischen r und r + dr zu finden, proportional zu r2 j2l (kr)|Y lm (θ0 , φ0 )|2 dr d Ω 0
(C-18)
Man kann zeigen (Ergänzung AVIII , § 2-c-α), dass für ρ gegen null ρ→0
j l (ρ) ∼
ρl (2l + 1)!!
(C-19)
gilt. Dieses Ergebnis (s. die Diskussion in Kapitel VII, § A-2-c) bedeutet, dass sich die Wahrscheinlichkeit (C-18) in der Nähe des Ursprungs wie r2l+2 verhält; je größer also l ist, umso langsamer steigt sie an. Der Verlauf von ρ 2 j2l (ρ) ist in Abb. 9 gezeigt. Wir sehen, dass die Funktion klein bleibt, solange ρ < √l(l + 1)
(C-20)
Wir können daher annehmen, dass die Wahrscheinlichkeit (C-18) für r
0
(C-37)
für r < 0
Abb. 11: Das effektive Potential V eff (r) ist die Summe des Potentials V(r) und des 2 Zentrifugalterms l(l+1)ℏ . 2μr 2
Für große r reduziert sich Gl. (C-35) auf [
d2 r→∞ + k 2 ] u k,l (r) ≈ 0 dr2
(C-38)
mit der allgemeinen Lösung r→∞
u k,l (r) ≈ Aeikr + Be−ikr
(C-39)
Weil u k,l (r) die Bedingung (C-36) erfüllen muss, sind die Konstanten A und B nicht frei wählbar. Beim äquivalenten eindimensionalen Problem (C-37) hängt die Bedin gung (C-36) damit zusammen, dass das Potential für negative r unendlich ist, und
942 | VIII Elementare Streutheorie
Gl. (C-39) ist die Überlagerung aus einer einlaufenden, von rechts kommenden ebenen Welle e−ikr (auf der Achse, entlang der sich das fiktive Teilchen bewegt) und einer re flektierten ebenen Welle eikr , die sich von links nach rechts bewegt. Da es keine trans mittierte Welle geben kann [weil V(r) auf der negativen Achse unendlich ist], muss der reflektierte Strom gleich dem einlaufenden Strom sein. Wir sehen also, dass aus der Bedingung (C-36) für den asymptotischen Ausdruck (C-39) folgt |A| = |B|
(C-40)
Daher ist r→∞
u k,l (r) ≈ |A| [eikr eiφ A + e−ikr eiφ B ]
(C-41)
was wir in der Form r→∞
u k,l (r) ≈ C sin(kr − β l )
(C-42)
schreiben können. Die reelle Phase β l wird vollständig bestimmt, wenn wir verlan gen, dass der Ausdruck (C-42) und die Lösung von Gl. (C-35), die im Ursprung gegen null geht, stetig anschließen. Für den Fall des identisch verschwindenden Potentials V(r) sahen wir in § C-2-c-γ, dass β l gleich lπ/2 ist. Es ist zweckmäßig, diesen Wert als Bezugspunkt zu nehmen und π r→∞ u k,l (r) ≈ C sin (kr − l + δ l ) (C-43) 2 zu setzen. Die so definierte Phasenverschiebung δ l heißt Streuphase der Partialwelle φ k,l,m (r); sie hängt offensichtlich von k, d. h. von der Energie, ab. C-3-b Physikalische Bedeutung der Streuphasen α Vergleich von Partialwellen und freien Kugelwellen Den Ausdruck für das asymptotische Verhalten von φ k,l,m (r) können wir mit Gl. (C-34) und Gl. (C-43) in der Form schreiben sin(kr − lπ/2 + δ l ) m Y l (θ, φ) r π π e−ikr ei(l 2 −δ l ) − eikr e−i( l 2 −δ l ) r→∞ m ≈ −CY l (θ, φ) 2ir r→∞
φ k,l,m (r) ≈ C
(C-44)
Wir sehen, dass die Partialwelle φ k,l,m (r) wie die freie Kugelwelle aus der Überlage rung einer einlaufenden Welle und einer auslaufenden Welle entsteht. Um die Partialwelle und die freie Kugelwelle genau vergleichen zu können, mo difizieren wir die einlaufende Welle in Gl. (C-44) so, dass sie gleich der Funktion in Gl. (C-25) ist. Dazu definieren wir eine neue Partialwelle ̃ φ k,l,m (r), indem wir φ k,l,m (r) mit eiδ l multiplizieren (ein globaler Phasenfaktor ist physikalisch ohne Bedeutung) und die Konstante C so wählen, dass gilt r→∞
̃ φ k,l,m (r) ≈ −Y lm (θ, φ)
e−ikr eilπ/2 − eikr e−ilπ/2e2iδ l 2ikr
(C-45)
C Streuung am Zentralpotential. Partialwellenmethode | 943
Dieser Ausdruck kann dann in der folgenden Weise interpretiert werden (s. Bemer kung in § C-2-c-γ): Zu Anfang haben wir dieselbe einlaufende Welle wie im Fall ei nes freien Teilchens (abgesehen vom Normierungsfaktor √2k 2 /π). Wenn sie den Wir kungsbereich des Potentials erreicht, wird sie mehr und mehr von diesem Potential gestört. Bei ihrer Umkehr wird sie in eine auslaufende Welle transformiert, sie erlangt gegenüber der freien auslaufenden Welle, die bei identisch verschwindendem Poten tial V(r) entstanden wäre, eine Phasenverschiebung von 2δ l . Der Faktor e2iδ l (der so wohl von l als auch von k abhängt) erfasst also die Gesamtwirkung des Potentials auf das Teilchen mit Drehimpuls l. Bemerkung: Tatsächlich ist die obige Diskussion nur richtig, wenn wir unsere Überlegungen auf ein Wellen paket anwenden, das sich aus Partialwellen φ k,l,m (r) mit gleichem l und m und nur leicht ver schiedenem k zusammensetzt. Für große negative Werte von t haben wir nur ein einfallendes Wellenpaket; es ist die nachfolgende Entwicklung dieses Wellenpakets in Richtung des Wirkungs bereichs des Potentials, die wir oben untersucht haben. Wir könnten auch die Sichtweise aus Bemerkung 2 in § B-1-b anwenden, d. h. wir könnten den Effekt eines langsamen „Einschaltens“ des Potentials V(r) auf eine stationäre freie Kugelwelle untersuchen. Dieselbe Beweisführung würde dann zeigen, dass die Partialwelle φ k,l,m (r) durch (0) adiabatisches Einschalten des Potentials V(r) aus einer freien Kugelwelle φ k,l,m (r) erhalten wer den kann.
β Potentiale endlicher Reichweite Wir nehmen an, dass das Potential V(r) eine endliche Reichweite r0 habe, d. h. es gelte V(r) = 0 für r > r0
(C-46)
Wir wiesen bereits darauf hin (§ C-2-c-β), dass eine freie Kugelwelle praktisch nicht in eine Kugel mit dem Radius b l (k) um O [Gl. (C-22)] eindringt. Kehren wir nun zur gerade gegebenen Interpretation von Gl. (C-45) zurück, so sehen wir, dass ein Potential mit der Bedingung (C-46) so gut wie keinen Einfluss auf Wellen hat, für die b l (k) ≫ r0
(C-47)
gilt, da die zugehörige einlaufende Welle umkehrt, bevor sie den Wirkungsbereich von V(r) erreicht. Es gibt also für jeden Wert der Energie einen kritischen Wert lM des Dreh impulses, der nach Gl. (C-22) näherungsweise gegeben wird durch √lM (lM + 1) ≈ kr0
(C-48)
Die Phasenverschiebungen δ l machen sich nur für Werte von l, die kleiner oder gleich der Größe lM sind, bemerkbar.
944 | VIII Elementare Streutheorie
Je kleiner die Reichweite des Potentials und je kleiner die Einfallsenergie ist, desto kleiner ist lM .⁹ Man kann dadurch erreichen, dass nur die zu den ersten Partialwellen gehörenden Phasenverschiebungen nicht verschwinden: das sind die s(l = 0)-Welle mit sehr kleiner Energie und die s- und p-Wellen mit etwas höheren Energien usw.
C-4 Streuquerschnitt als Funktion der Streuphasen Die Streuphasen beschreiben die Änderungen im asymptotischen Verhalten stationä rer Zustände mit wohldefiniertem Drehimpuls, wie sie vom Potential hervorgerufen werden. Aus ihnen sollten wir daher den Streuquerschnitt bestimmen können. Dafür (st) brauchen wir nur die stationären Streuzustände v k (r) in Abhängigkeit von den Par tialwellen auszudrücken¹⁰ und die Streuamplitude auf diese Weise auszurechnen. C-4-a Konstruktion der stationären Streuzustände aus Partialwellen Wir müssen eine lineare Überlagerung von Partialwellen finden, deren asympto tisches Verhalten durch die Beziehung (B-9) gegeben ist. Da der stationäre Streu zustand Eigenzustand des Hamilton-Operators H ist, enthält die Entwicklung von (st) v k (r) nur Partialwellen mit derselben Energie ℏ2 k 2 /2μ. Zu beachten ist ebenfalls, dass bei einem Zentralpotential V(r) das Streuproblem in Bezug auf Drehungen um die durch den einfallenden Strahl definierte z-Achse symmetrisch ist. Die stationäre (st) Streuwellenfunktion v k (r) ist daher unabhängig vom Azimutalwinkel φ, so dass ihre Entwicklung nur Partialwellen mit m = 0 enthält. So haben wir schließlich einen Ausdruck der Form ∞
(st) φ k,l,0(r) v k (r) = ∑ c l ̃
(C-49)
l=0
Das Problem besteht darin, die Koeffizienten c l zu bestimmen. α Intuitive Beweisführung (st) Wenn V(r) identisch verschwindet, reduziert sich die Funktion v k (r) auf die ebene (0) Welle eikz , und die Partialwellen sind freie Kugelwellen φ k,l,m (r). Für diesen Fall ken nen wir die Entwicklung (C-49) bereits: Sie wird durch Gl. (C-31) gegeben. (st) Für nichtverschwindendes V(r) enthält v k (r) neben der ebenen auch eine di vergierende gestreute Welle. Weiter sahen wir, dass sich die Funktion ̃ φ k,l,0(r) von 9 Der kritische Wert l M ist von der Größe kr 0 und gleich dem Verhältnis zwischen der Reichweite des Potentials und der Wellenlänge des einlaufenden Teilchens. 10 Wenn im Potential V(r) gebundene Zustände des Teilchens existieren (stationäre Zustände negati ver Energie), bildet das System der Partialwellen keine Basis des Zustandsraums; um eine solche Basis zu konstruieren, muss man die Wellenfunktionen der gebundenen Zustände und die Partialwellen zu sammennehmen.
C Streuung am Zentralpotential. Partialwellenmethode | 945
(0)
φ k,l,0(r) in ihrem asymptotischen Verhalten nur durch das Auftreten der auslaufen den Welle unterscheidet, die dieselbe Radialabhängigkeit wie die gestreute Welle hat. Wir sollten daher erwarten, dass die Koeffizienten c l der Entwicklung (C-49) dieselben wie in Gl. (C-31)¹¹ sind, d. h. (st)
∞
v k (r) = ∑ il √4π(2l + 1) ̃ φ k,l,0 (r)
(C-50)
l=0
Bemerkung: Wir können Gl. (C-50) auch durch die Interpretation aus Bemerkung 2 in § B-1-b und der Bemer kung in § C-3-b-α verstehen. Betrachten wir eine ebene Welle, deren Entwicklung durch Gl. (C-31) gegeben ist, und schalten das Potential V(r) adiabatisch ein, dann wird die Welle in einen sta (st) tionären Streuzustand überführt: Die linke Seite von Gl. (C-31) muss durch v k (r) ersetzt wer den. Außerdem wird jede freie Kugelwelle auf der rechten Seite von Gl. (C-31) in die Partialwelle ̃ φ k,l,0 (r) überführt, wenn das Potential eingeschaltet wird. Wegen der Linearität der SchrödingerGleichung erhalten wir schließlich Gl. (C-50).
β Explizite Herleitung Wir betrachten nun Gl. (C-50), die wir durch physikalische Überlegung erhalten ha ben, und zeigen, dass es sich dabei tatsächlich um die gesuchte Entwicklung handelt. Zunächst stellen wir fest, dass die rechte Seite von Gl. (C-50) eine Überlagerung von Eigenzuständen zu H mit derselben Energie ℏ2 k 2 /2μ ist; auch die Überlagerung bleibt daher ein stationärer Zustand. Wir müssen daher nur sicher sein, dass das asymptotische Verhalten der Sum me (C-50) tatsächlich durch die Beziehung (B-9) beschrieben wird. Dazu verwenden wir Gl. (C-45): ∞
r→∞
∞
∑ il √4π(2l + 1) ̃ φ k,l,0(r) ∼ − ∑ il √4π(2l + 1) Y l0 (θ) l=0
l=0
1 (C-51) [e−ikr eilπ/2 − eikr e−ilπ/2e2iδ l ] 2ikr Um das asymptotische Verhalten der Entwicklung (C-31) zu bestimmen, schreiben wir ×
e2iδ l = 1 + 2i eiδ l sin δ l
(C-52)
und erhalten, indem wir die von δ l unabhängigen Terme umgruppieren, ∞
r→∞
∞
∑ il √4π(2l + 1) ̃ φ k,l,0(r) ∼ − ∑ il √4π(2l + 1) Y l0 (θ) l=0
×[
l=0 −ikr ilπ/2 e e
− eikr e−ilπ/2 eikr 1 −ilπ/2 iδ l e sin δ l ] − e 2ikr r k (0)
(C-53)
11 Die Entwicklung (C-31) enthält j l (kr)Y l0 (θ), also die freie Kugelwelle φ k,l,0 , geteilt durch den Nor mierungsfaktor √2k2 /π; das ist der Grund, warum wir ̃ φ k,l,m (r) [Gl. (C-45)] definierten, indem wir Beziehung (C-25) durch diesen Faktor dividierten.
946 | VIII Elementare Streutheorie
Beachten wir nun Beziehung (C-25) und Gl. (C-31), so erkennen wir im ersten Term auf der rechten Seite die asymptotische Entwicklung der ebenen Welle eikz und gelangen schließlich zu ∞
r→∞
∑ il √4π(2l + 1) ̃ φ k,l,0(r) ∼ eikz + f k (θ) l=0
eikr r
(C-54)
mit¹² f k (θ) =
1 ∞ ∑ √4π(2l + 1) eiδ l sin δ l Y l0 (θ) k l=0
(C-55)
Damit ist gezeigt, dass die Entwicklung (C-50) richtig ist, und gleichzeitig haben wir den Ausdruck für die Streuamplitude als Funktion der Streuphasen δ l gefunden. C-4-b Berechnung des Streuquerschnitts Der differentielle Streuquerschnitt wird nun durch Gl. (B-24) gegeben: σ(θ) = |f k (θ)|2 =
1 k2
2 ∞ ∑ √4π(2l + 1) eiδ l sin δ l Y 0 (θ) l l=0
(C-56)
woraus wir den totalen Streuquerschnitt durch Integration über die Winkel erhalten: σ = ∫ dΩ σ(θ) =
1 ∑4π√(2l + 1)(2l + 1) ei(δ l −δ l ) sin δ l sin δ l k 2 l,l ∗
× ∫ dΩ Y l0 (θ)Y l0 (θ)
(C-57)
Da die Kugelflächenfunktionen orthonormal sind [s. Kap. VI, Gl. (D-23)], ergibt sich schließlich σ=
4π ∞ ∑ (2l + 1) sin2 δ l k 2 l=0
(C-58)
Die Terme, die sich aus der Interferenz zwischen Wellen unterschiedlicher Drehimpul se ergeben, treten also im totalen Streuquerschnitt nicht mehr auf. Für jedes Potential (2l + 1) sin2 δ l positiv und hat V(r) ist der zu einem Wert von l gehörende Beitrag 4π k2 4π für eine gegebene Energie die obere Schranke von k2 (2l + 1). Prinzipiell benötigt man für Gl. (C-56) und Gl. (C-58) die Kenntnis aller Streupha sen δ l . Sie können für ein bekanntes Potential V(r) aus der Radialgleichung berechnet
12 Der Faktor il wird durch e−ilπ/2 = (−i)l = (1/i)l kompensiert.
C Streuung am Zentralpotential. Partialwellenmethode | 947
werden (s. § C-3-a); die Gleichung muss separat für jeden Wert von l gelöst werden (wo zu in den meisten Fällen numerische Verfahren erforderlich sind). Die Partialwellen methode ist also aus praktischer Sicht nur dann günstig, wenn die Anzahl der nicht verschwindenden Streuphasen gering ist. Für Potentiale V(r) endlicher Reichweite sa hen wir in § C-3-b-β, dass die Streuphasen δ l für l > lM vernachlässigbar sind, wobei der kritische Wert lM durch Gl. (C-48) definiert wird. Ist das Potential V(r) zunächst nicht bekannt, so versucht man, die experimentel len Ergebnisse, die den differentiellen Streuquerschnitt bei einer bestimmten Energie ergeben, durch Einführung einer kleinen Anzahl von nichtverschwindenden Streu phasen zu reproduzieren. Aus der genauen Form der θ-Abhängigkeit lässt sich oft die minimale Anzahl der benötigten Streuphasen erschließen. Beschränken wir uns z. B. auf eine s-Welle, so ergibt Gl. (C-56) einen isotropen differentiellen Querschnitt (Y 00 ist eine Konstante). Wenn die experimentellen Ergebnisse also zeigen, dass σ(θ) von θ ab hängig ist, müssen neben der Streuphase der s-Welle noch andere ungleich null sein. Hat man aus dem Experiment für verschiedene Energien die zum Querschnitt effektiv beitragenden Streuphasen bestimmt, kann man nach theoretischen Modellen für Po tentiale suchen, die gerade diese Streuphasen mit ihrer Energieabhängigkeit ergeben. Bemerkung: Die Abhängigkeit der Streuquerschnitte von der Energie E = ℏ2 k2 /2μ des einlaufenden Teilchens ist ebenso wichtig wie ihre θ-Abhängigkeit. So beobachtet man in gewissen Fällen in der Nähe be stimmter Energiewerte rasche Änderungen des totalen Streuquerschnitts σ. Nimmt z. B. eine der Streuphasen δ l für E = E 0 den Wert π/2 an, erreicht der entsprechende Beitrag zu σ seine obere Schranke und der Streuquerschnitt kann für E = E 0 ein scharfes Maximum aufweisen. Dieses Phänomen heißt Streuresonanz. Man kann es mit dem in Kapitel I (§ D-2-c-β) beschriebenen Ver halten des Transmissionskoeffizienten eines eindimensionalen Rechteckpotentials vergleichen.
Referenzen und Literaturhinweise Streuung und Coulomb-Potential: Messiah (1.17), Kap. XI; Schiff (1.18), § 21; Davydov (1.20), Kap. XI, § 100. Streutheorie: Merzbacher (1.16), Kap. 19; Roman (2.3), Teil II; Messiah (1.17), Kap. XIX; Schweber (2.16), Teil 3, Kap. 11. Beschreibung von Stößen mithilfe von Wellenpaketen: Messiah (1.17), Kap. X, § 4, § 5, § 6; Goldberger und Watson (2.4), Kap. 3 und 4. Bestimmung des Potentials aus der Phasenverschiebung (inverses Problem): Wu und Ohmura (2.1), § G. Anwendungen: Davydov (1.20), Kap. XI; Sobel’man (11.12), Kap. 11; Mott und Massey (2.5); Martin und Spearman (16.18). Streuung eines Teilchensystems in der Bornschen Näherung und räumlich-zeitliche Korrelationsfunktionen: Van Hove (2.39).
•
948 | Übersicht über die Ergänzungen zu Kapitel VIII
Übersicht über die Ergänzungen zu Kapitel VIII AVIII Freies Teilchen: Drehimpulseigenzustände
Diese Ergänzung befasst sich mit der formalen Untersuchung der stationären Wellenfunktionen eines freien Teilchens mit wohldefiniertem Drehimpuls. Die Verwendung der L + - und L− -Operatoren erlaubt die Einführung der sphärischen Bessel-Funktionen, wobei wir einige ihrer Eigenschaften, die wir in § C von Kapitel VIII benutzt haben, zeigen können.
BVIII Inelastische Streuung
Der bisher entwickelte Formalismus wird auf Streuvorgänge verallgemeinert, bei denen zusätzlich Absorption auftritt. Dies erfolgt unter einer phänomenologischen Betrachtungsweise, wie wir sie in Ergänzung KIII kennengelernt haben. Ferner wird das optische Theorem aufgestellt. (nicht schwierig, wenn man mit dem Stoff von Kapitel VIII vertraut ist)
CVIII Beispiele zur Streutheorie
In dieser Ergänzung werden die Ergebnisse aus Kapitel VIII durch spezielle Beispiele illustriert. § 1 ist auch für das erste Lesen ratsam, da in einfacher Weise wichtige physikalische Resultate abgeleitet werden (Rutherford-Formel). § 2 kann als ausgearbeitete Aufgabe angesehen werden, und § 3 enthält Aufgaben.
Freies Teilchen: Drehimpulseigenzustände |
949
•
Ergänzung AVIII Freies Teilchen: Drehimpulseigenzustände 1 2 2-a 2-b 2-c 3
Die Radialgleichung | 949 Freie Kugelwellen | 951 Rekursionsbeziehungen | 951 Berechnung freier Kugelwellen | 952 Eigenschaften | 956 Freie Kugelwellen und ebene Wellen | 958
Wir haben in § C-2 von Kapitel VIII zwei verschiedene Basen für die stationären Zustän de eines freien Teilchens (ohne Spin) eingeführt, dessen Hamilton-Operator gegeben wird durch H0 =
P2 2μ
(1)
Die erste Basis besteht aus gemeinsamen Eigenzuständen von H0 und den drei Kom ponenten des Impulses P; die zugehörigen Wellenfunktionen sind die ebenen Wellen. Die zweite wird aus stationären Zuständen mit wohldefiniertem Drehimpuls gebildet, d. h. es handelt sich um gemeinsame Eigenzustände zu H0 , L2 und L z , deren grund legende Eigenschaften wir in § C-2-b von Kapitel VIII angegeben haben. Hier werden wir die zweite Basis genauer untersuchen; insbesondere wollen wir einige der in Ka pitel VIII verwendeten Resultate herleiten.
1 Die Radialgleichung Der Hamilton-Operator (1) vertauscht mit den drei Komponenten des Bahndrehimpul ses L des Teilchens: [H0 , L] = 0
(2)
Daher können wir die in § A von Kapitel VII entwickelte allgemeine Theorie auf dieses spezielle Problem anwenden. Wir wissen also, dass die freien Kugelwellen (gemeinsa me Eigenfunktionen von H0 , L2 und L z ) notwendig von der Form sind (0)
(0)
φ κ,l,m (r) = R κ,l (r) Y lm (θ, φ)
(3)
(0)
Die Radialfunktion R κ,l (r) ist eine Lösung der Gleichung [−
l(l + 1)ℏ2 ℏ2 1 d2 (0) (0) r+ ] R κ,l (r) = E κ,l R κ,l (r) 2 2μ r dr 2μr2
(4)
(0)
worin E κ,l der zu φ κ,l,m (r) gehörende Eigenwert von H0 ist. Setzen wir (0)
R κ,l (r) =
1 (0) u (r) r κ,l
https://doi.org/10.1515/9783110638769-002
(5)
•
950 | Ergänzung AVIII (0)
so wird die Funktion u κ,l durch die Gleichung [
l(l + 1) 2μE κ,l d2 (0) − + ] u κ,l (r) = 0 2 dr r2 ℏ2
(6)
gegeben, wobei wir die Bedingung hinzufügen müssen (0)
u κ,l (0) = 0
(7)
Zunächst kann man zeigen, dass mit Hilfe von Gl. (6) und Gl. (7) das Spektrum des Hamilton-Operators H0 bestimmt werden kann, das wir bereits aus der Untersu chung der ebenen Wellen kennen [Gl. (C-5) aus Kap. VIII]. Dazu beachten wir, dass der minimale Wert des Potentials null ist (da es ja identisch verschwindet) und dass es da her keinen stationären Zustand mit negativer Energie geben kann (s. Ergänzung MIII ). Betrachten wir also im Folgenden einen beliebigen positiven Wert der in Gl. (6) auftretenden Konstanten E κ,l und setzen k=
1 √2μE κ,l ℏ
(8)
Für r gegen unendlich kann der Zentrifugalterm l(l + 1)/r2 gegen den konstanten Term in Gl. (6) vernachlässigt werden, der daher näherungsweise lautet [
d2 r→∞ (0) + k 2 ] u κ,l (r) ≈ 0 dr2
(9)
Alle Lösungen von Gl. (6) haben darum ein physikalisch vernünftiges asymptoti sches Verhalten (Linearkombination von Deikr und e−ikr ). Die einzige Einschränkung stammt daher von der Bedingung (7): Wir wissen, dass es zu einem gegebenen Wert von E κ,l nur genau eine Funktion (bis auf einen konstanten Faktor) gibt, die Gl. (6) und Gl. (7) erfüllt (s. Kap. VII, § A-3-b). Für jedes positive E κ,l hat die Radialgleichung (6) also genau eine sinnvolle Lösung. Folglich enthält das Spektrum von H0 alle positiven Energien. Darüber hinaus se hen wir, dass die Menge möglicher Werte von E κ,l nicht von l abhängt; wir werden daher den Index l fortlassen. Den Index κ identifizieren wir mit der in Gl. (8) definier ten Konstanten und können daher schreiben Ek =
ℏ2 k 2 ; 2μ
k≥0
(10)
Diese Energien sind unendlichfach entartet. Für festes k gibt es zu jedem nicht negativen ganzzahligen Wert von l eine zur Energie E k gehörende passende Lösung (0) (0) u k,l (r) der Radialgleichung. Ferner ordnet Gl. (3) jeder Radialfunktion u k,l (r) (2l + 1) (0)
unabhängige Wellenfunktionen φ k,l,m (r) zu. Wir finden also für diesen speziellen Fall noch einmal das in § A-3-b von Kapitel VII erhaltene allgemeine Ergebnis: H0 , L2 und L z bilden einen V. S. K. O. in Hr , und die Angabe der drei Indizes k, l und m ist ausrei chend, um eine bestimmte Funktion der entsprechenden Basis festzulegen.
Freies Teilchen: Drehimpulseigenzustände |
951
•
2 Freie Kugelwellen (0)
(0)
Die Radialfunktionen R k,l (r) = u k,l (r)/r können als Lösung von Gl. (6) oder direkt aus Gl. (4) bestimmt werden. Letztere lässt sich leicht auf die als „Gleichung der sphäri schen Bessel-Funktionen“ bekannte Differentialgleichung reduzieren (s. die Bemer kung am Ende von § 2-c-β), deren Lösungen bekannt sind. Anstatt diese Ergebnisse direkt zu verwenden, werden wir zeigen, wie sich die verschiedenen gemeinsamen Eigenfunktionen von H0 , L2 und L z aus den Eigenfunktionen von L2 zum Eigenwert null erhalten lassen.
2-a Rekursionsbeziehungen Wir definieren den Operator P+ = P x + iP y
(11)
als Funktion der Komponenten P x und P y des Impulses P. Wie wir wissen, ist P eine vektorielle Variable (s. Ergänzung BVI , § 5-c), woraus die folgenden Vertauschungsre lationen¹ zwischen ihren Komponenten und denen des Drehimpulses L folgen: [L x , P x ] = 0 [L x , P y ] = iℏP z
(12)
[L x , P z ] = −iℏP y sowie die daraus durch zyklisches Vertauschen der Indizes x, y, z hervorgehenden Re lationen. Mit Hilfe dieser Beziehungen erhält man durch eine einfache algebraische Rechnung die Kommutatoren von L z und L2 mit dem Operator P+ : [L z , P+ ] = ℏP+
(13a)
2
2
[L , P+ ] = 2ℏ(P+ L z − P z L+ ) + 2ℏ P+
(13b) (0)
Wir betrachten also eine beliebige gemeinsame Eigenfunktion φ k,l,m (r) von H0 , L2 und L z mit den zugehörigen Eigenwerten E k , l(l + 1)ℏ2 und mℏ. Durch Anwendung der Operatoren L+ und L− können wir die 2l anderen zur selben Energie E k und zum selben Wert l gehörenden Eigenfunktionen erhalten. Weil H0 mit L vertauscht, ergibt sich z. B. (0)
(0)
(0)
H0 L+ φ k,l,m (r) = L+ H0 φ k,l,m (r) = E k L+ φ k,l,m (r)
(14)
(0)
und L+ φ k,l,m (r) (die für m ungleich l nicht null ist) ist Eigenfunktion von H0 mit dem
1 Diese Relationen kann man direkt aus der Definition L = R×P und den kanonischen Vertauschungs relationen ableiten.
•
952 | Ergänzung AVIII (0)
selben Eigenwert wie der von φ k,l,m (r). Somit ist (0)
(0)
L± φ k,l,m (r) ∝ φ k,l,m±1(r) Was die Wirkung von P+ auf (0)
(15)
(0) φ k,l,m (r) betrifft, so können wir die obige Überlegung
für
P+ φ k,l,m wiederholen, da H0 mit P vertauscht. Weiter folgt aus Gl. (13a) (0)
(0)
(0)
L z P+ φ k,l,m (r) = P+ L z φ k,l,m (r) + ℏP+ φ k,l,m (r) (0)
= (m + 1)ℏ P+ φ k,l,m (r)
(16)
(0)
P+ φ k,l,m ist also Eigenfunktion von L z mit dem Eigenwert (m + 1)ℏ. Verwenden wir (0)
Gl. (13b) in derselben Weise, so sehen wir, dass wegen des P z L+ -Terms P+ φ k,l,m im Allgemeinen nicht auch Eigenfunkion zu L2 ist; für l = m verschwindet jedoch der Beitrag dieses Terms: (0)
(0)
(0)
(0)
L2 P+ φ k,l,l = P+ L2 φ k,l,l + 2ℏP+ L z φ k,l,l + 2ℏ2 P+ φ k,l,l (0)
= [l(l + 1) + 2l + 2] ℏ2 P+ φ k,l,l (0)
= (l + 1)(l + 2)ℏ2 P+ φ k,l,l
(17)
(0) P+ φ k,l,l
Die Funktion ist also gemeinsame Eigenfunktion zu H0 , L2 und L z mit den Eigenwerten E k , (l + 1)(l + 2)ℏ2 bzw. (l + 1)ℏ. Da diese drei Observablen einen V. S. K. O. bilden (§ 1), gibt es nur eine Eigenfunktion (bis auf einen konstanten Faktor²), die zu diesem Satz von Eigenwerten gehört: (0)
(0)
P+ φ k,l,l (r) ∝ φ k,l+1,l+1(r)
(18)
Wir werden die Rekursionsbeziehungen (15) und (18) verwenden, um die (0) {φ k,l,m (r)}-Basis aus den zu verschwindenden Eigenwerten von L2 und L z gehörenden (0)
Funktionen φ k,0,0 (r) zu konstruieren.³
2-b Berechnung freier Kugelwellen α Lösung der Radialgleichung für l = 0 (0) Um die Funktionen φ k,0,0 (r) zu bestimmen, kehren wir zur Radialgleichung (6) zu rück, wobei wir l = 0 setzen; unter Verwendung der Definition (10) lautet diese Glei chung dann [
d2 (0) + k 2 ] u k,0 (r) = 0 dr2
(19)
2 Im folgenden Abschnitt (§ 2-b) bestimmen wir die Koeffizienten, die die Orthonormierung der (0) {φ k,l,m (r)}-Basis (im erweiterten Sinne, da k ein kontinuierlicher Index ist) sicherstellen. 3 Man darf nicht glauben, dass der Operator P − = P x − iP y das „Absteigen“ von einem beliebigen Wert von l auf 0 ermöglicht. Mit einer ähnlichen Überlegung wie oben kann man nämlich zeigen, dass gilt (0) (0) P − φ k,l,−l (r) ∝ φ k,l+1,−(l+1) (r) .
Freies Teilchen: Drehimpulseigenzustände |
953
•
Die Lösungen, die im Ursprung gegen null gehen [Bedingung (7)], sind von der Form (0)
u k,0 (r) = a k sin kr
(20) (0)
Wir wählen die Konstante a k so, dass die Funktionen φ k,0,0 (r) im erweiterten Sinne orthonormal sind, d. h. es gilt (0)∗
(0)
∫ d3 r φ k,0,0 (r)φ k ,0,0 (r) = δ(k − k )
(21)
Es ist leicht zu zeigen (s. unten), dass die Bedingung (21) für ak = √
2 π
(22)
erfüllt ist, woraus sich ergibt (Y00 ist gleich 1/√4π) (0)
φ k,0,0 (r) = √
2k 2 1 sin kr π √4π kr
(23)
Nun überprüfen wir, ob die Funktionen (23) tatsächlich die Bedingung (21) erfüllen. Dazu reicht es, den folgenden Ausdruck zu berechnen: ∞
(0)∗
(0)
∫ d3 r φ k,0,0 (r)φ k ,0,0 (r) =
2 1 sin kr sin k r ∫ r2 dr kk ∫ dΩ π 4π kr k r 0 ∞
=
2 ∫ dr sin kr sin k r π
(24)
0
Ersetzen wir die Sinusfunktionen durch komplexe Exponentialfunktionen und erwei tern das Integrationsintervall auf die gesamte r-Achse, so erhalten wir ∞
∞
0
−∞
2 1 2 ∫ dr sin kr sin k r = (− ) ∫ dr [ei(k+k )r − ei(k−k )r ] π π 4
(25)
Weil sowohl k als auch k positiv sind, kann k + k nicht null werden und der Beitrag vom ersten Term in der Klammer verschwindet immer. Mit der Beziehung (34) aus An hang II ergibt dann der zweite Term schließlich (0)∗
(0)
1 2 (− ) (−2π)δ(k − k ) π 4 = δ(k − k )
∫ d3 r φ k,0,0 (r)φ k ,0,0 (r) =
(26)
β Konstruktion der anderen Wellen durch Rekursion (0) Wenden wir nun auf die eben bestimmte Funktion φ k,0,0 (r) den in Gl. (11) definierten Operator P+ an, so folgt mit dem Ausdruck (18) (0)
(0)
φ k,1,1 (r) ∝ P+ φ k,0,0 (r) ∝ P+
sin kr kr
(27)
•
954 | Ergänzung AVIII
In der hier verwendeten Ortsdarstellung wird P+ durch den Differentialoperator gege ben P+ =
ℏ ∂ ∂ ( +i ) i ∂x ∂y
(28)
In der Beziehung (27) wirkt er auf eine nur von r abhängige Funktion; es ist ℏ x y d ( +i ) f(r) i r r dr d ℏ f(r) = sin θ eiφ i dr
P+ f(r) =
(29)
So erhalten wir (0)
φ k,1,1 (r) ∝ sin θ eiφ [
cos kr sin kr − ] kr (kr)2
(30)
Wir erkennen die Winkelabhängigkeit der Funktion Y11 (θ, φ) [Ergänzung AVI , Bezie (0) (0) hung (32)]; durch Anwendung von L− können φ k,1,0 (r) und φ k,1,−1 (r) berechnet wer den. (0) Obwohl φ k,1,1 (r) von θ und φ abhängt, bleibt die Anwendung von P+ auf diese Funktion sehr einfach. Aus den kanonischen Vertauschungsrelationen folgt unmittel bar [P+ , X + iY] = 0
(31)
(0)
Daher wird φ k,2,2 (r) durch (0)
sin kr kr x + iy d sin kr ∝ P+ r dr kr 1 d sin kr ∝ (x + iy)P+ r dr kr 1 d 1 d sin kr [ ] ∝ (x + iy)2 r dr r dr kr
φ k,2,2 (r) ∝ P2+
(32)
gegeben oder allgemein durch (0)
φ k,l,l (r) ∝ (x + iy)l (
1 d l sin kr ) r dr kr
(33)
(0)
Die Winkelabhängigkeit von φ k,l,l ist in dem Faktor (x + iy)l = r l (sin θ)l eilφ enthalten, der proportional zu Y ll (θ, φ) ist.
(34)
Freies Teilchen: Drehimpulseigenzustände | 955
•
Wir definieren j l (ρ) = (−1)l ρ l (
1 d l sin ρ ) ρ dρ ρ
(35)
Diese Funktion j l ist die sphärische Bessel-Funktion l-ter Ordnung. Wie die folgende (0) Rechnung zeigt, ist φ k,l,l proportional zum Produkt aus Y ll (θ, φ) und j l (kr). Wir haben (s. unten zum Problem der Normierung) (0)
R k,l (r) = √
2k 2 j l (kr) π
(36)
Die freien Kugelwellen werden dann geschrieben (0)
φ k,l,m (r) = √
2k 2 j l (kr) Y lm (θ, φ) π
(37)
Sie erfüllen die Orthonormierungsbedingungen (0)∗
(0)
∫ d3 r φ k,l,m (r)φ k ,l ,m (r) = δ(k − k )δ ll δ mm
(38)
und die Vollständigkeitsrelation ∞
∞
+l
(0)
(0)∗
∫ dk ∑ ∑ φ k,l,m (r)φ k,l,m (r ) = δ(r − r ) 0
(39)
l=0 m=−l
Wir fragen jetzt nach der Normierung der Funktionen (37): Zunächst bestimmen wir die Proportionalitätsfaktoren, die in den Rekursionsbeziehungen (15) und (18) auftreten. Für die erste Gleichung kennen wir den Faktor bereits aus den Eigenschaften der Kugelflächenfunktionen (s. Ergänzung AVI ): (0)
(0)
L± φ k,l,m (r) = ℏ√l(l + 1) − m(m ± 1) φ k,l,m±1(r)
(40)
Für (18) kann man leicht zeigen, indem man die expliziten Ausdrücke für Y ll (θ, φ) [Gl. (4) und (14) aus Ergänzung AVI ], die Gleichungen (31), (29), die Definition (35) und Gl. (37) verwendet, dass sie lautet (0)
P+ φ k,l,l (r) =
ℏk √ 2l + 2 (0) (r) φ i 2l + 3 k,l+1,l+1
(41)
Die Faktoren δ ll und δ mm auf der rechten Seite der Orthonormierungsbedin gung (38) stammen aus der Winkelintegration und der Orthonormalität der Kugelflä chenfunktionen. Um Gl. (38) zu überprüfen, müssen wir daher nur zeigen, dass das Integral (0)∗
(0)
I l (k, k ) = ∫ d3 r φ k,l,l (r)φ k ,l,l (r)
(42)
•
956 | Ergänzung AVIII
gleich δ(k − k ) ist. Aus Gl. (26) wissen wir bereits, dass I0 (k, k ) dieser Bedingung genügt. Wenn I l (k, k ) = δ(k − k )
(43)
erfüllt ist, gilt dasselbe auch für I l+1 (k, k ). Mit Gl. (41) können wir I l+1 (k, k ) in fol gender Weise schreiben: 1 ℏ2 kk 1 = 2 ℏ kk
I l+1 (k, k ) =
∗ 2l + 3 (0) (0) ∫ d3 r [P+ φ k,l,l (r)] [P+ φ k ,l,l (r)] 2l + 2 2l + 3 (0)∗ (0) ∫ d3 r φ k,l,l (r) P− P+ φ k ,l,l (r) 2l + 2
(44)
worin P− = P x − iP y der zu P+ konjugierte Operator ist. Dann ist P− P+ = P2x + P2y = P2 − P2z
(45)
(0)
φ k ,l,l ist eine Eigenfunktion zu P2 . Da außerdem P z hermitesch ist, folgt I l+1 (k, k ) =
1 ℏ2 kk
2l + 3 2l + 2 (0)
∗
(0)
× {ℏ2 k 2 I l (k, k ) − ∫ d3 r [P z φ k,l,l (r)] [P z φ k ,l,l (r)]}
(46)
(0)
Jetzt müssen wir P z φ k,l,l (r) berechnen. Wir verwenden die Proportionalität von Y ll (θ, φ) zu (x + iy)l /r l und finden nach Gl. (35) aus Ergänzung AVI (0)
ℏk √ 2k 2 cos θ Y ll (θ, φ) j l+1 (kr) i π 1 ℏk (0) φ (r) =− i √2l + 3 k,l+1,l
P z φ k,l,l (r) = −
(47)
Wir setzen dieses Ergebnis in Gl. (46) ein und erhalten schließlich I l+1 (k, k ) =
2l + 3 k 1 I l (k, k ) − I l+1 (k, k ) 2l + 2 k 2l + 2
(48)
Aus der Annahme (43) folgt daher I l+1 (k, k ) = δ(k − k )
(49)
womit der Beweis durch vollständige Induktion geführt ist.
2-c Eigenschaften α Verhalten am Ursprung Für ρ gegen null verhält sich (s. unten) die Funktion j l (ρ) wie ρ→0
j l (ρ) ∼
ρl (2l + 1)!!
(50)
Freies Teilchen: Drehimpulseigenzustände | 957
•
(0)
φ k,l,m (r) ist daher in der Nähe des Ursprungs proportional zu r l : 2k 2 m (kr)l r→0 (0) φ k,l,m (r) ∼ √ Y l (θ, φ) π (2l + 1)!!
(51)
Um zu zeigen, dass die Beziehung (50) aus der Definition (35) folgt, entwickeln wir sin ρ/ρ in eine Potenzreihe von ρ: ∞ ρ 2p sin ρ = ∑ (−1)p ρ (2p + 1)! p=0
(52)
Dann wenden wir den Operator ( 1ρ ddρ )l an und erhalten j l (ρ) = (−1)l ρ l (
2p 1 d l−1 ∞ ρ 2p−1−1 ) ∑ (−1)p ρ dρ (2p + 1)! p=0
∞
= (−1)l ρ l ∑ (−1)p p=0
2p(2p − 2)(2p − 4) . . . [2p − 2(l − 1)] 2p−2l ρ (2p + 1)!
(53)
Die ersten l Terme der Summe (p = 0 bis p = l−1) verschwinden, und für den (l+1)-ten Term haben wir ρ→0 2l(2l − 2)(2l − 4) . . . 2 (54) j l (ρ) ∼ (−1)l ρ l (−1)l (2l + 1)! womit die Relation (50) bewiesen ist. β Asymptotisches Verhalten Für ein gegen unendlich strebendes Argument hängen die Bessel-Funktionen in der folgenden Weise mit den trigonometrischen Funktionen zusammen: ρ→∞
j l (ρ) ∼
1 π sin (ρ − l ) ρ 2
(55)
Das asymptotische Verhalten der freien Kugelwelle lautet also 2k sin(kr − lπ/2) r→∞ (0) Y m (θ, φ) φ k,l,m (r) ∼ √ π l kr 2
Wenden wir den Operator j l (ρ) = (−1)l ρ l (
1 d ρ dρ
einmal auf
sin ρ ρ
1 d l−1 cos ρ sin ρ ) [ 2 − 3 ] ρ dρ ρ ρ
(56)
an, so können wir j l (ρ) schreiben (57)
Der zweite Term in der Klammer ist für ρ gegen unendlich gegenüber dem ersten ver nachlässigbar; darüber hinaus rührt auch dann, wenn wir 1ρ ddρ ein zweites Mal anwen den, der dominante Term immer noch von der Ableitung des Kosinus her. Wir sehen also, dass ρ→∞
j l (ρ) ∼ (−1)l ρ l
1 1 d l ( ) sin ρ ρ l ρ dρ
(58)
•
958 | Ergänzung AVIII
Wegen (
π d l ) sin ρ = (−1)l sin (ρ − l ) dρ 2
(59)
erhalten wir tatsächlich die Beziehung (55). Bemerkung: Setzen wir kr = ρ
(60)
[k ist durch Gl. (10) definiert], so wird aus der Radialgleichung (4) [
d2 2 d l(l + 1) + + (1 − )] R l (ρ) = 0 dρ2 ρ dρ ρ2
(61)
Das ist die Differentialgleichung für die sphärischen Bessel-Funktionen l-ter Ordnung. Sie besitzt zwei linear unabhängige Lösungen, die sich z. B. durch ihr Verhalten am Ursprung unterscheiden. Eine von ihnen ist die sphärische Bessel-Funktion j l (ρ), die die Beziehungen (50) und (55) erfüllt. Als zweite Lösung können wir die „sphärische Neumann-Funktion l-ter Ordnung“ n l (ρ) mit den folgenden Eigenschaften wählen: (2l − 1)!! ρ l+1 ρ→∞ 1 π n l (ρ) ∼ cos (ρ − l ) ρ 2 ρ→0
n l (ρ) ∼
(62a) (62b)
3 Freie Kugelwellen und ebene Wellen Wir kennen bereits zwei verschiedene Basen aus Eigenzuständen von H0 : Die ebenen (0) Wellen vk (r) sind Eigenzustände der drei Komponenten des Impulses P; die freien (0) Kugelwellen φ k,l,m (r) sind Eigenfunktionen von L2 und L z . Beide Basen sind verschie den, weil P nicht mit L2 und L z vertauscht. Eine gegebene Funktion in der einen Basis kann natürlich nach der anderen Basis (0) entwickelt werden. Wir werden als Beispiel eine ebene Welle vk (r) als Linearkombi (0) nation von Kugelwellen ausdrücken. Weil bei festem Vektor k die ebene Welle vk (r) als Eigenfunktion von H0 mit dem Eigenwert ℏ2 k2 /2μ aufgefasst werden kann, ent (0) hält ihre Entwicklung nur die Funktionen φ k,l,m , die zu dieser Energie gehören, für die also k = |k|
(63)
ist. Die Entwicklung lautet darum (0)
∞
+l
(0)
vk (r) = ∑ ∑ c l,m (k) φ k,l,m (r) l=0 m=−l
(64)
Freies Teilchen: Drehimpulseigenzustände | 959
•
Berücksichtigt man die Eigenschaften der Kugelflächenfunktionen (Ergänzung AVI ) und der sphärischen Bessel-Funktionen, so kann man zeigen, dass +l
∞
eik⋅r = 4π ∑ ∑ il Y lm ∗ (θ k , φ k )j l (kr)Y lm (θ, φ)
(65)
l=0 m=−l
worin θ k und φ k die Polarwinkel sind, die die Richtung des Vektors k festlegen. Wenn k in z-Richtung zeigt, reduziert sich diese Beziehung auf ∞
eikz = ∑ il √4π(2l + 1) j l (kr) Y l0 (θ) l=0 ∞
= ∑ il (2l + 1) j l (kr) P l (cos θ)
(66)
l=0
darin ist P l das Legendre-Polynom l-ter Ordnung [Gl. (57) aus Ergänzung AVI ]. Wir beweisen zuerst Gl. (66). Dazu nehmen wir an, dass der gewählte Vektor k in z-Richtung weist. Dann ist kx = ky = 0
(67)
Für diesen Fall wird aus Gl. (63) kz = k
(68)
Dann entwickeln wir die Funktion eikz = eikr cos θ
(69)
(0)
in der {φ k,l,m (r)}-Basis. Da die Funktion nicht vom Winkel φ abhängt, ist sie eine Li nearkombination aus den Basisfunktionen mit m = 0: ∞
(0)
eikr cos θ = ∑ a l φ k,l,0(r) l=0 ∞
= ∑ c l j l (kr) Y l0 (θ)
(70)
l=0
Zur Berechnung der Zahlen c l können wir eikr cos θ als Funktion der Variablen θ ansehen und r als Parameter betrachten. Weil die Kugelflächenfunktionen eine Or thonormalbasis aller Funktionen von θ und φ bilden, kann der „Koeffizient“ c l j l (kr) ausgedrückt werden als c l j l (kr) = ∫ dΩ Y l0∗ (θ) eikr cos θ
(71)
Ersetzen wir Y l0 durch den entsprechenden Ausdruck in Y ll (θ, φ) [Gl. (25) aus Ergän zung AVI ] so erhalten wir c l j l (kr) = =
1 √(2l)! 1 √(2l)!
∗
∫ dΩ [(
L− l l ) Y l (θ, φ)] eikr cos θ ℏ
∫ dΩ Y ll∗ (θ, φ) [(
L+ l ikr cos θ ] ) e ℏ
(72)
•
960 | Ergänzung AVIII
da L+ der zu L− adjungierte Operator ist. Gemäß Gl. (16) aus Ergänzung AVI ergibt sich dann (
dl L+ l ikr cos θ = (−1)l eilφ (sin θ)l eikr cos θ ) e ℏ d(cos θ)l = (−1)l eilφ (sin θ)l (ikr)l eikr cos θ
(73)
Nun ist (sin θ)l eilφ bis auf einen konstanten Faktor gerade gleich Y ll (θ, φ) [Gl. (4) und Gl. (14) aus Ergänzung AVI ]. Also wird c l j l (kr) = (ikr)l
2l l! 4π √ ∫ dΩ |Y ll (θ, φ)|2 eikr cos θ √(2l)! (2l + 1)!
(74)
Um c l zu berechnen, müssen wir einen bestimmten Wert von kr wählen, für den wir den Wert von j l (kr) kennen. Wir betrachten z. B. den Fall kr gegen null: Wir wissen, dass sich j l (kr) wie (kr)l verhält, und das stimmt auch für die rechte Seite von Gl. (74). Genauer erhalten wir gemäß (50) cl
1 2l l! 4π √ = il ∫ dΩ |Y ll (θ, φ)|2 (2l + 1)!! √(2l)! (2l + 1)!
(75)
d. h. also, weil Y ll auf eins normiert ist, c l = il √4π(2l + 1)
(76)
Die allgemeine Beziehung (65) erhält man jetzt aus dem Additionstheorem für Ku gelflächenfunktionen [Gl. (70) aus Ergänzung AVI ]: Für jede beliebige Richtung von k (definiert durch die Polarwinkel θ k und φ k ) ist es möglich, durch eine Rotation des Achsensystems zum eben betrachteten Fall zurückzukehren. Die Entwicklung (66) bleibt also gültig, wobei wir kz durch k ⋅ r und cos θ durch cos α ersetzen (α ist der Winkel zwischen k und r): ∞
eik⋅r = ∑ il (2l + 1) j l (kr) P l (cos α)
(77)
l=0
Mit dem Additionstheorem für Kugelflächenfunktionen kann man P l (cos α) in Abhän gigkeit von den Winkeln (θ, φ) und (θ k , φ k ) ausdrücken, woraus sich wieder Gl. (65) ergibt. Wie die Entwicklungen (65) und (66) zeigen, gehören zu einem Zustand mit wohl definiertem linearem Impuls alle möglichen Bahndrehimpulse. (0) Um die Entwicklung einer gegebenen Funktion φ k,l,m (r) in ebene Wellen zu erhal ten, müssen wir lediglich Gl. (65) invertieren, indem wir die Orthonormierungsbedin gungen der Kugelflächenfunktionen, die Funktionen von θ k und φ k sind, benutzen. Das ergibt ∫ dΩ k Y lm (θ k , φ k ) eik⋅r = 4πil j l (kr) Y lm (θ, φ)
(78)
Freies Teilchen: Drehimpulseigenzustände | 961
•
und damit (0)
φ k,l,m (r) =
(−1)l l √ 2k 2 i ∫ dΩ k Y lm (θ k , φ k ) eik⋅r 4π π
(79)
Eine Eigenfunktion von L2 und L z ist also eine Linearkombination aller ebenen Wellen mit derselben Energie: Zu einem Zustand mit wohldefiniertem Drehimpuls gehören alle möglichen Richtungen des linearen Impulses.
Referenzen und Literaturhinweise Messiah (1.17), Anhang B, § 6; Arfken (10.4), § 11.6; Butkov (10.8), Kap. 9, § 9; siehe Un terabschnitt „Spezielle Funktionen und Tabellen“ in Abschnitt 10 der Bibliographie.
•
962 | Ergänzung BVIII
Ergänzung BVIII Inelastische Streuung 1 2 2-a 2-b 2-c
Methodisches | 962 Berechnung der Wirkungsquerschnitte | 963 Elastischer Streuquerschnitt | 964 Absorptionsquerschnitt | 964 Totaler Streuquerschnitt. Optisches Theorem | 966
In Kapitel VIII haben wir uns auf die Untersuchung elastischer¹ Streuung von Teilchen an einem Potential beschränkt. In der Einleitung haben wir jedoch bereits darauf hin gewiesen, dass die Streuung zwischen Teilchen inelastisch erfolgen kann und dass dann unter bestimmten Bedingungen zahlreiche andere Reaktionen (wie z. B. die Er zeugung oder Vernichtung von Teilchen) insbesondere dann auftreten können, wenn die Energie der einlaufenden Teilchen groß ist. Wenn solche Reaktionen möglich sind und man nur die elastisch gestreuten Teilchen beobachtet, so stellt man fest, dass bestimmte Teilchen des einfallenden Strahls „verschwinden“, d. h. man findet sie we der im transmittierten Strahl noch unter den elastisch gestreuten Teilchen. Man sagt, diese Teilchen werden während der Wechselwirkung „absorbiert“; in Wirklichkeit ha ben sie an anderen Reaktionen als der einfachen elastischen Streuung teilgenommen. Interessiert man sich nur für die elastische Streuung, so versucht man, die „Absorp tion“ global zu beschreiben, ohne die möglichen Reaktionen genauer zu betrachten. Wir werden zeigen, dass die Partialwellenmethode für eine phänomenologische Be schreibung gut geeignet ist.
1 Methodisches Wir wollen annehmen, die für das Verschwinden der einfallenden Teilchen verant wortliche Wechselwirkung sei gegenüber Drehungen um den Ursprung invariant. Die Streuamplitude kann daher immer in Partialwellen zerlegt werden, von denen jede zu einem festen Wert des Drehimpulses gehört. In diesem Abschnitt werden wir sehen, wie die Partialwellenmethode modifiziert werden muss, damit eine mögliche Absorption von Teilchen berücksichtigt werden kann. Dazu kehren wir zu der in § C-3-b-α von Kapitel VIII gegebenen Interpretation der Partialwellen zurück: Eine freie einlaufende Welle trifft auf den Einflussbereich des Potentials, und es entsteht eine auslaufende Welle. Die Wirkung des Potentials besteht in der Multiplikation dieser auslaufenden Welle mit e2iδ l . Da der Betrag dieses
1 Eine Streuung heißt elastisch, wenn weder die Natur noch der interne Zustand der beteiligten Teil chen verändert werden; andernfalls heißt sie inelastisch. https://doi.org/10.1515/9783110638769-003
Inelastische Streuung
| 963
•
Faktors eins ist (die Phasenverschiebung δ l ist reell), ist die Amplitude der auslau fenden Welle gleich der der einlaufenden Welle. Daher (s. die Rechnung in § 2-b) ist der Gesamtfluss der einlaufenden Welle gleich dem der auslaufenden Welle; während der Streuung wird die Wahrscheinlichkeit erhalten, d. h. die Gesamtzahl der Teilchen bleibt konstant. Diese Überlegungen legen nahe, Absorptionsphänomene einfach da durch zu beschreiben, dass man bei der Phasenverschiebung einen nichtverschwin denden Imaginärteil zulässt, so dass gilt |e2iδ l | < 1
(1)
Die Amplitude der auslaufenden Welle mit dem Drehimpuls l ist dann kleiner als die der sie erzeugenden einlaufenden Welle. Die Tatsache, dass der auslaufende Wahr scheinlichkeitsfluss kleiner ist als der einlaufende drückt das „Verschwinden“ einer gewissen Anzahl von Teilchen aus. Wir werden dies im Folgenden genauer ausführen und die Ausdrücke für die Streu- und Absorptionsquerschnitte herleiten. Es handelt sich hier, und darauf weisen wir noch einmal ausdrücklich hin, nur um einen rein phänomenologischen Ansatz; die Parameter, mit denen wir die Absorption beschreiben (der Betrag von e2iδ l für jede Partialwelle), verschleiern einen oft sehr komplizierten Sachverhalt. Ebenfalls zu beachten ist, dass sich die Wechselwirkung nicht mehr durch ein einfaches Po tential beschreiben lässt, wenn die Gesamtwahrscheinlichkeit nicht erhalten bleibt. Eine korrekte Beschreibung aller Phänomene, die während einer Streuung auftreten können, erfordert einen sehr viel aufwendigeren Formalismus.
2 Berechnung der Wirkungsquerschnitte Wir kehren zurück zu den Rechnungen in § C-4 von Kapitel VIII und setzen η l = e2iδ l
(2)
Da andere Reaktionen neben der elastischen Streuung immer eine Verringerung der Anzahl der elastisch gestreuten Teilchen bewirken, muss gelten |η l | ≤ 1
(3)
(das Gleichheitszeichen gilt für rein elastische Streuung). Die asymptotische Form der Wellenfunktionen, die elastische Streuung beschreiben, lautet daher jetzt [s. Bezie hung (C-51), Kap. VIII] (st)
r→∞
∞
v k (r) ∼ − ∑ il √4π(2l + 1) Y l0 (θ) l=0
e−ikr eilπ/2 − η l eikr e−ilπ/2 2ikr
(4)
•
964 | Ergänzung BVIII
2-a Elastischer Streuquerschnitt Die Aussage von § C-4-a, Kap. VIII bleibt gültig und ergibt die Streuamplitude f k (θ) in der Form f k (θ) =
1 ∞ ηl − 1 ∑ √4π(2l + 1) Y l0 (θ) k l=0 2i
(5)
Daraus können wir den elastischen differentiellen Streuquerschnitt 1 σ el (θ) = 2 k
∞ 2 ∑ √4π(2l + 1) Y 0 (θ) η l − 1 l 2i l=0
(6)
und den totalen elastischen Streuquerschnitt σ el =
π ∞ ∑ (2l + 1)|1 − η l |2 k 2 l=0
(7)
ableiten. Bemerkung: Nach den in § 1 angestellten Überlegungen erreicht die Absorption der Welle (l) ein Maximum, wenn ηl = 0
(8)
Gleichung (7) sagt jedoch aus, dass selbst für diesen Grenzfall der Beitrag der Welle (l) zum elas tischen Streuquerschnitt nicht verschwindet.² Mit anderen Worten tritt selbst dann elastische Streuung auf, wenn der Einflussbereich des Potentials vollständig absorbiert. Dieses wichtige Phänomen ist ein rein quantenmechanischer Effekt. Der Vorgang entspricht dem Verhalten einer Lichtwelle, die auf ein absorbierendes Medium trifft: Selbst bei vollständiger Absorption (wie bei einer vollkommen schwarzen Kugel oder Scheibe) lässt sich eine gestreute Welle beobachten (die übrigens auf einen Raumwinkel beschränkt ist, der umso kleiner wird, je größer die Oberfläche der Kugel bzw. Scheibe ist). Daher wird die bei einer Wechselwirkung mit totaler Absorption auftretende elastische Streuung Schattenstreuung genannt.
2-b Absorptionsquerschnitt Wir definieren den Absorptionsquerschnitt σ abs wie in § A-3 von Kapitel VIII: Er ist gleich der Anzahl der absorbierten Teilchen geteilt durch Zeit und Einfallsstrom. Um diesen Querschnitt zu berechnen, betrachten wir wie in § B-2 von Kapitel VIII den Gesamtbetrag der pro Zeiteinheit „verschwindenden“ Wahrscheinlichkeit ∆𝒫.
2 Dieser Beitrag verschwindet nur für η l = 1, d. h. wenn die Phasenverschiebung reell und gleich einem ganzzahligen Vielfachen von π ist.
Inelastische Streuung
| 965
•
Man erhält sie aus dem zur Wellenfunktion (4) gehörenden Strom J; ∆𝒫 ist gleich der Differenz zwischen dem Fluss der einlaufenden Wellen und dem der auslaufen den Wellen durch eine Kugelschale (S) von sehr großem Radius R0 , also gleich dem Negativen des diese Fläche verlassenden Nettoflusses: ∆𝒫 = − ∫ J ⋅ dS
(9)
(S)
mit (st) ∗
J = Re [v k
(r)
ℏ (st) ∇ v k (r)] iμ
(10)
Nur die Radialkomponente J r des Stroms trägt zum Integral (9) bei: ∆𝒫 = − ∫ J r r2 dΩ
(11)
r=R 0
mit (st) ∗
J r = Re [v k
(r)
ℏ ∂ (st) v (r)] iμ ∂r k
(12)
Die Differentiation in Gl. (12) verändert die Radialabhängigkeit der verschiedenen enthaltenen Terme nicht [Beziehung (4)]. Daher liefern wegen der Orthogo in nalität der Kugelflächenfunktionen die gekreuzten Terme zwischen einer Partialwelle (st) (st) ∗ (l) in v k (r) und einer anderen Welle (l ) in v k (r) im Integral (11) keinen Beitrag; wir haben also (st) v k (r)
∞
(l)
∆𝒫 = − ∑ ∫ J r r2 dΩ l=0 r=R
(13)
0
(l)
worin J r die Radialkomponente des Stroms zur Partialwelle (l) ist. Eine einfache Rechnung ergibt (l) r→∞
Jr
∼ −
ℏk π(2l + 1) [1 − |η l |2 ] |Y l0 (θ)|2 μ k 2 r2
(14)
d. h. schließlich, weil Y l0 (θ) normiert ist, ∆𝒫 =
ℏk π ∞ ∑ (2l + 1) [1 − |η l |2 ] μ k 2 l=0
(15)
Der Absorptionsquerschnitt σ abs ist gleich der Wahrscheinlichkeit ∆𝒫 dividiert durch den einlaufenden Strom ℏk/μ: σ abs =
π ∞ ∑ (2l + 1) [1 − |η l |2 ] k 2 l=0
(16)
•
966 | Ergänzung BVIII
Offensichtlich verschwindet σ abs , wenn alle η l den Betrag eins haben, d. h. nach Gl. (2), wenn alle Phasenverschiebungen reell sind. Für diesen Fall liegt nur elastische Streuung vor und der die Kugelschale von großem Radius R0 verlassende Nettofluss verschwindet immer. Die von den einlaufenden Wellen getragene Gesamtwahrschein lichkeit wird vollständig auf die auslaufenden Wellen übertragen. Wenn hingegen η l verschwindet, ist der Beitrag der Welle (l) zum Absorptionsquerschnitt maximal. Bemerkung: π Wie die Berechnung des Ausdrucks (15) zeigt, ist ℏk μ k2 (2l + 1) der von der Partialwelle (l) stam mende Teil der pro Zeiteinheit einlaufenden Wahrscheinlichkeit. Teilen wir diese Größe durch den einlaufenden Strom ℏk/μ, so erhalten wir eine Fläche, die als „Einfallsquerschnitt der Partialwel le (l)“ bezeichnet werden kann: π σ l = 2 (2l + 1) (17) k Dieser Ausdruck kann klassisch interpretiert werden: Wir betrachten eine einfallende ebene Wel le als einen homogenen Teilchenstrahl mit dem Impuls ℏk parallel zur z-Achse. Welcher Bruchteil dieser Teilchen erreicht das Streupotential mit dem Drehimpuls ℏ√l(l + 1)? Wir haben bereits auf den Zusammenhang zwischen dem Drehimpuls und dem Stoßparameter in der klassischen Me chanik hingewiesen [s. Gl. (C-23) aus Kap. VIII]: |𝓛| = b|p| = ℏk b
(18)
Wir zeichnen nun in der Ebene durch O und senkrecht zur z-Achse einen um O zentrierten Kreis ring (Abb. 1) mit einem mittleren Radius b l , so dass ℏ√ l(l + 1) = ℏk b l
(19)
und einer Dicke ∆b l , die in Gl. (19) ∆l = 1 entspricht. Alle Teilchen, die diese Fläche passieren, erreichen das Streupotential mit dem Drehimpuls ℏ√l(l + 1) bis auf eine Genauigkeit von ℏ. Aus Gl. (19) erhalten wir bl =
1 1 1 √ l(l + 1) ≈ (l + ) k k 2
(20)
für l ≫ 1 und daher ∆b l =
1 k
Die Fläche des Kreisrings in Abb. 1 ist dann π 2π b l ∆b l ≈ 2 (2l + 1) k
(21)
(22)
also wieder σ l
2-c Totaler Streuquerschnitt. Optisches Theorem Wenn bei einer Streuung verschiedene Reaktions- oder Streuphänomene auftreten, so ist der totale Streuquerschnitt σ tot als die Summe der einzelnen, zu den verschie denen Prozessen gehörenden und über alle Raumrichtungen integrierten Wirkungs querschnitte definiert. Er gibt also die Anzahl der Teilchen an, die pro Zeiteinheit an einer der möglichen Reaktionen teilnehmen, normiert auf den einlaufenden Fluss.
Inelastische Streuung
•
| 967
Abb. 1: Wenn die einlaufenden Teilchen das Potential mit dem Stoßparameter b l bis auf eine Genauigkeit ∆b l erreichen, haben sie bis auf ℏ einen klassischen Drehimpuls von ℏ√l(l + 1).
Wenn wir alle Reaktionen außer der elastischen Streuung pauschal zusammen fassen, ist σ tot = σ el + σ abs
(23)
Mit Gl. (7) und Gl. (16) ergibt das σ tot =
2π ∞ ∑ (2l + 1)(1 − Re η l ) k 2 l=0
(24)
Nun ist 1 − Re η l der Realteil des Ausdrucks 1 − η l , der in der elastischen Streu amplitude auftaucht [Gl. (5)]. Außerdem kennen wir den Wert von Y l0 (θ) für θ = 0: Y l0 (0) = √
2l + 1 4π
(25)
[s. Ergänzung AVI , Gl. (58) und Gl. (60)]. Berechnen wir daher aus Gl. (5) den Imagi närteil der elastischen Streuamplitude in Vorwärtsrichtung, so finden wir Im f k (0) =
1 ∞ 1 − Re η l ∑ (2l + 1) k l=0 2
(26)
Vergleichen wir diesen Ausdruck mit Gl. (24), wird schließlich σ tot =
4π Im f k (0) k
(27)
Dieser Zusammenhang zwischen dem totalen Streuquerschnitt und dem Imaginärteil der elastischen Streuamplitude in Vorwärtsrichtung ist ganz allgemein gültig; man bezeichnet ihn als das optische Theorem.
•
968 | Ergänzung BVIII
Bemerkung: Das optische Theorem ist offensichtlich für den Fall der rein elastischen Streuung richtig (σ abs = 0; σ tot = σ el ). Die Tatsache, dass f k (0) – das ist die in Vorwärtsrichtung gestreute Welle – mit dem totalen Streuquerschnitt in Verbindung steht, hätte man schon aus den Überlegungen in Kapi tel VIII, § B-2-d ersehen können. Die Ausdünnung des transmittierten Strahls aufgrund der Teil chenstreuung in alle Raumrichtungen wird durch die Interferenz zwischen der einlaufenden ebe nen Welle und der gestreuten Welle in Vorwärtsrichtung hervorgerufen.
Referenzen und Literaturhinweise Optisches Modell: Valentin (16.1), § X-3. Proton-Proton-Kollisionen bei hoher Energie: Amaldi (16.31).
Beispiele zur Streutheorie |
969
•
Ergänzung CVIII Beispiele zur Streutheorie 1 1-a 1-b 2 3 3-a 3-b
Die Bornsche Näherung für ein Yukawa-Potential | 969 Berechnung der Streuamplitude und des Streuquerschnitts | 969 Der Grenzfall unendlicher Reichweite | 971 Niederenergiestreuung an einer harten Kugel | 972 Aufgaben | 973 Streuung der p-Welle an der harten Kugel | 973 Kugelförmiger Potentialtopf: Gebundene Zustände und Streuresonanzen | 974
Es gibt kein Potential, für das das Streuproblem durch eine einfache analytische Rech nung exakt¹ gelöst werden kann. Wir werden uns daher mit der Anwendung der in Kapitel VIII eingeführten Näherungen zufrieden geben.
1 Die Bornsche Näherung für ein Yukawa-Potential Wir betrachten ein Potential der Form e−αr V(r) = V0 (1) r wobei V0 und α reelle Konstanten sind, α positiv. Dieses Potential ist anziehend oder abstoßend, je nachdem ob V0 negativ oder positiv ist. Je größer |V0 | ist, desto stärker ist das Potential. Seine Reichweite wird durch 1 (2) r0 = α charakterisiert, da (s. Abb. 1) V(r) praktisch gleich null ist, wenn r den Wert 2r0 oder 3r0 erreicht. Das Potential (1) trägt den Namen von Yukawa, der mit dieser Potentialform Kern kräfte mit einer Reichweite von etwa einem Fermi beschrieb. Zur Erklärung dieses Po tentials postulierte er die Existenz des π-Mesons, das später auch entdeckt wurde. Für α = 0 reduziert sich dieses Potential auf das Coulomb-Potential, das man somit als ein Yukawa-Potential unendlicher Reichweite ansehen kann.
1-a Berechnung der Streuamplitude und des Streuquerschnitts Wir nehmen an, |V0 | sei ausreichend klein, um die Bornsche Näherung (§ B-4 von Ka (B) pitel VIII) anwenden zu können. Gemäß Gl. (B-47) wird die Streuamplitude f k (θ, φ) 1 Der Fall des Coulomb-Potentials lässt sich exakt behandeln, erfordert jedoch die Anwendung einer speziellen Methode. https://doi.org/10.1515/9783110638769-004
•
970 | Ergänzung CVIII
Abb. 1: Yukawa-Potential und CoulombPotential. Der e−αr -Term lässt das YukawaPotential für r ≫ r0 = 1/α (Reichweite des Potentials) sehr viel schneller den Wert null erreichen.
dann gegeben durch (B)
f k (θ, φ) = −
−αr 1 2μV0 3 −iK⋅r e d r e ∫ 4π ℏ2 r
(3)
worin K für den in die (θ, φ)-Richtung übertragenen Impuls steht, wie er in Gl. (B-42) aus Kapitel VIII definiert ist. Gleichung (3) enthält die Fourier-Transformierte des Yukawa-Potentials. Weil es nur von der Variablen r abhängt, können die Winkelintegrationen leicht ausgeführt werden (s. Anhang I, § 2-e). Damit ist die Streuamplitude ∞
(B)
f k (θ, φ) = −
1 2μV0 4π e−αr ∫ r dr sin |K|r 2 4π ℏ |K| r
(4)
0
Nach einer einfachen Rechnung erhalten wir (B)
f k (θ, φ) = −
1 2μV0 ℏ2 α 2 + |K|2
(5)
Abbildung 6 aus Kapitel VIII ist zu entnehmen, dass |K| = 2k sin
θ 2
(6)
worin k der Betrag des Einfallswellenvektors und θ der Streuwinkel ist. Wir erhalten daher den differentiellen Streuquerschnitt in der Bornschen Nähe rung zu σ (B) (θ) =
4μ 2 V02 1 ℏ4 [α 2 + 4k 2 sin2 θ/2]2
(7)
Beispiele zur Streutheorie
| 971
•
Er hängt nicht vom Azimutalwinkel φ ab, was man bereits aus der Tatsache vorherse hen konnte, dass die Streuung an einem Zentralpotential gegenüber Drehungen um die Richtung des einfallenden Strahls symmetrisch ist. Auf der anderen Seite hängt er aber bei gegebener Energie (d. h. für festes k) vom Streuwinkel ab; insbesondere ist der Querschnitt in Vorwärtsrichtung (θ = 0) größer als in Rückwärtsrichtung (θ = π). Schließlich ist σ (B) für festes θ eine fallende Funktion der Energie. Darüber hinaus ist, zumindest in der Bornschen Näherung, das Vorzeichen von V0 für die Streuung ohne Belang. Den totalen Streuquerschnitt erhält man leicht durch Integration: σ (B) = ∫ dΩ σ (B) (θ) =
4μ 2 V02 4π 4 2 2 ℏ α (α + 4k 2 )
(8)
1-b Der Grenzfall unendlicher Reichweite Wir stellten fest, dass das Yukawa-Potential für α gegen null in das Coulomb-Potential übergeht. Wie sehen nun für diesen Grenzfall die oben abgeleiteten Beziehungen aus? Um das Potential der Coulomb-Wechselwirkung zwischen zwei Teilchen der La dungen Z1 q bzw. Z2 q (q ist die Ladung eines Elektrons) zu erhalten, setzen wir α=0, V0 = Z 1 Z 2 e 2
(9)
mit e2 =
q2 4πε0
(10)
Gleichung (7) ergibt dann σ (C) (θ) = =
Z12 Z22 e4 4μ 2 4 ℏ 16k 4 sin4 θ/2 Z12 Z22 e4 16E2 sin4 θ/2
(11)
(für k wurde sein Zusammenhang mit der Energie eingesetzt). Bei Gl. (11) handelt es sich tatsächlich um den Ausdruck für den Coulomb-Streu querschnitt (Rutherford-Formel). Natürlich kann diese Herleitung keinen Beweis dar stellen; die zugrundeliegende Theorie ist auf das Coulomb-Potential nicht anwendbar. Bemerkung: Der totale Streuquerschnitt für ein Coulomb-Potential ist unendlich, weil das entsprechende In tegral für kleine Werte von θ divergiert [der Ausdruck (8) wird unendlich, wenn α gegen null geht]. Das resultiert aus der unendlichen Reichweite des Coulomb-Potentials: Das Teilchen wird auch
•
972 | Ergänzung CVIII
dann beeinflusst, wenn es den Potentialbereich weit entfernt vom Punkt O passiert. In der Rea lität beobachtet man allerdings nie eine reine Coulomb-Wechselwirkung mit unendlicher Aus dehnung. Das von einem geladenen Teilchen erzeugte Potential wird immer durch andere Teil chen mit entgegengesetzter Ladung modifiziert, die sich in der Umgebung befinden (ScreeningEffekt).
2 Niederenergiestreuung an einer harten Kugel Wir betrachten ein Zentralpotential der Form {0 für r > r0 V(r) = { ∞ für r < r0 {
(12)
Man spricht in diesem Fall von einer „harten Kugel“ mit dem Radius r0 . Wir wollen annehmen, die Energie der einfallenden Teilchen sei ausreichend klein, so dass kr0 sehr viel kleiner als eins ist. Dann können wir (Kap. VIII, § C-3-b-β und Aufgabe in § 3-a) alle Phasenverschiebungen bis auf die der s-Welle (l = 0) vernachlässigen. Die Streuamplitude f k (θ) lautet dann f k (θ) =
1 iδ0 (k) sin δ0 (k) e k
(13)
(da Y 00 = 1/√4π); der differentielle Streuquerschnitt ist isotrop, σ(θ) = |f k (θ)|2 =
1 sin2 δ0 (k) k2
(14)
so dass der totale Streuquerschnitt σ=
4π sin2 δ0 (k) k2
(15)
wird. Zur Berechnung der Phasenverschiebung δ0 (k) muss die Radialgleichung für l = 0 gelöst werden. Diese Gleichung lautet [Gl. (C-35) aus Kapitel VIII] [
d2 + k 2 ] u k,0 (r) = 0 für r > r0 dr2
(16)
was durch die Bedingung u k,0 (r0 ) = 0
(17)
vervollständigt werden muss, da das Potential für r = r0 unendlich wird. Die Lösung u k,0 (r) von Gl. (16) und Gl. (17) ist bis auf einen konstanten Faktor eindeutig: { C sin k(r − r0 ) u k,0 (r) = { 0 {
für r > r0 für r < r0
(18)
Beispiele zur Streutheorie
| 973
•
Die Phasenverschiebung δ0 wird ihrer Definition nach durch die asymptotische Form von u k,0 (r) gegeben: r→∞
u k,0 (r) ∼ sin(kr + δ0 )
(19)
Mit der Lösung (18) erhalten wir also δ0 (k) = −kr0
(20)
Setzen wir diesen Wert in Gl. (15) für den totalen Wirkungsquerschnitt ein, so ergibt sich 4π σ = 2 sin2 kr0 ≈ 4πr20 (21) k da nach Annahme kr0 sehr viel kleiner als 1 ist. Der totale Streuquerschnitt σ ist al so unabhängig von der Energie und gleich dem Vierfachen der von den Teilchen des einfallenden Strahls gesehenen scheinbaren Oberfläche der harten Kugel. Die entspre chende Rechnung in der klassischen Mechanik ergäbe für den Querschnitt die schein bare Oberfläche; nur die Teilchen, die elastisch an der Oberfläche abprallen, würden abgelenkt. In der Quantenmechanik hingegen betrachtet man die Entwicklung der zu den einfallenden Teilchen gehörenden Welle, und die plötzliche Veränderung von V(r) bei r = r0 erzeugt ein Phänomen analog zur Beugung einer Lichtwelle. Bemerkung: Selbst dann, wenn die Wellenlänge der einlaufenden Teilchen im Vergleich zu r 0 vernachlässig bar wird (kr0 ≫ 1), erreicht der quantenmechanische Querschnitt nicht den Wert πr 20 . Für sehr große Werte von k ist es möglich, die Reihe, die den totalen Streuquerschnitt in Abhängigkeit von den Phasenverschiebungen ergibt [Gl. (C-58) aus Kapitel VIII], aufzusummieren, und man erhält k→∞
σ ∼ 2πr 20
(22)
Welleneffekte bleiben daher auch im Grenzfall sehr kleiner Wellenlängen erhalten. Das liegt dar an, dass das betrachtete Potential bei r = r 0 nicht stetig ist: Es variiert in jedem Intervall merk lich, das kleiner als die Wellenlänge der Teilchen ist (s. Kap. I, § D-2-a).
3 Aufgaben 3-a Streuung der p-Welle an der harten Kugel Wir wollen die Phasenverschiebung δ1 (k) untersuchen, die die Streuung an einer har ten Kugel bei einer p-Welle (l = 1) erzeugt. Insbesondere wollen wir dabei überprüfen, dass sie im Vergleich mit δ0 (k) bei niedrigen Energien vernachlässigbar wird. 1. Man schreibe die Radialgleichung für die Funktion u k,1 (r) für r > r0 auf. Man zeige, dass ihre allgemeine Lösung von der Form u k,1 (r) = C [
cos kr sin kr − cos kr + a ( + sin kr)] kr kr
ist, wobei C und a Konstanten sind.
•
974 | Ergänzung CVIII
2. Man zeige, dass aus der Definition von δ1 (k) folgt a = tan δ1 (k) 3. Man bestimme die Konstante a aus der bei r = r0 an u k,1 (r) gestellten Bedingung. 4. Man zeige, dass sich für k gegen null δ1 (k) wie (kr0 )3 verhält,² weshalb δ1 (k) im Vergleich mit δ0 (k) vernachlässigbar ist.
3-b Kugelförmiger Potentialtopf: Gebundene Zustände und Streuresonanzen Wir betrachten ein Potential V(r) von der folgenden Form: {−V0 V(r) = { 0 {
für r < r0 für r > r0
worin V0 eine positive Konstante ist, und definieren k0 = √
2μV0 ℏ2
Wir beschränken uns auf die Untersuchung der s-Welle. α Gebundene Zustände (E < 0) 1. Man schreibe die Radialgleichung für die zwei Gebiete mit r > r0 bzw. r < r0 und die Bedingung im Ursprung nieder. Man zeige, dass für ρ=√
−2μE ℏ2
K = √k 20 − ρ 2 die Funktion u 0 (r) notwendig die Form hat {A e−ρr u 0 (r) = { B sin Kr {
für r > r0 für r < r0
2. Man stelle die Anschlussbedingungen bei r = r0 auf und folgere daraus, dass die einzig möglichen Werte für ρ die folgende Gleichung erfüllen müssen: tan Kr0 = −
K ρ
2 Dieses Ergebnis ist allgemein gültig: Für ein beliebiges Potential der Reichweite r 0 verhält sich die Phasenverschiebung δ l (k) für niedrige Energien wie (kr 0 )2l+1 .
Beispiele zur Streutheorie
| 975
•
3. Man diskutiere diese Gleichung: Man bestimme die Anzahl der gebundenen s-Zu stände als Funktion der Tiefe des Topfs (für festes r0 ) und zeige insbesondere, dass es keine Bindungszustände gibt, wenn diese Tiefe zu klein ist. β Streuresonanzen (E > 0) 1. Man schreibe ein weiteres Mal die Radialgleichung nieder, diesmal sei k=√
2μE ℏ2
K = √k 20 + k 2 Man zeige, dass u k,0 (r) die folgende Form hat: {A sin(kr + δ0 ) u k,0 (r) = { B sin K r {
für r > r0 für r < r0
2. Man wähle A = 1 und zeige mit Hilfe der Stetigkeitsbedingungen bei r = r0 , dass die Konstante B und die Phasenverschiebung δ0 durch B2 =
k2 +
k 20
k2 cos2 K r0
δ0 = −kr0 + α(k) mit tan α(k) =
k tan K r0 K
gegeben werden. 3. Man zeichne den Graphen für B2 als Funktion von k. Es sind deutlich Resonanzen sichtbar, bei denen B2 ein Maximum erreicht. Welche Werte von k gehören zu diesen Maxima? Wie groß ist α(k) bei diesen Resonanzen? Man zeige, dass der zugehörige Beitrag der s-Welle zum totalen Querschnitt praktisch maximal ist, wenn es eine sol che Resonanz für eine kleine Energie (kr0 ≪ 1) gibt. γ Die Beziehung zwischen gebundenen Zuständen und Streuzuständen Man nehme an, k 0 r0 sei fast (2n + 1)π/2, worin n eine ganze Zahl ist, und setze k 0 r0 = (2n + 1)
π +ε 2
mit |ε| ≪ 1
1. Man zeige, dass es für positives ε einen gebundenen Zustand gibt, dessen Bin dungsenergie E = −ℏ2 ρ 2 /2μ gegeben ist durch ρ ≈ εk 0
•
976 | Ergänzung CVIII
2. Man zeige andererseits, dass für negatives ε eine Streuresonanz bei der Energie E = ℏ2 k 2 /2μ existiert, wobei gilt k2 ≈ −
2k 0 ε r0
3. Man schließe daraus, dass bei allmählicher Verringerung der Tiefe des Topfs (bei festem r0 ) der Bindungszustand, der verschwindet, wenn k 0 r0 ein ungerades Vielfa ches von π/2 durchläuft, eine niederenergetische Streuresonanz erzeugt.
Referenzen und Literaturhinweise Messiah (1.17), Kap. IX, § 10 und Kap. X, § III und § IV; Valentin (16.1), Anhang II.
IX Der Spin des Elektrons A A-1 A-2 B C C-1 C-2
Einführung des Elektronenspins | 978 Experimentelle Nachweise | 978 Die Postulate der Pauli-Theorie | 980 Die Eigenschaften eines Drehimpulses 1/2 | 982 Das nichtrelativistische Spin-1/2-Teilchen | 984 Observable und Zustandsvektoren | 984 Berechnung von Vorhersagen | 989
Bis jetzt haben wir ein Elektron stets als ein punktförmiges Teilchen angesehen, das drei Koordinaten x, y und z entsprechend seinen drei Freiheitsgraden besitzt. Wir ent wickelten daher eine Quantentheorie auf der Annahme, dass der Zustand eines Elek trons zu einem gegebenen Zeitpunkt durch eine Wellenfunktion beschrieben werden kann, die nur von x, y und z abhängt. In diesem Rahmen untersuchten wir eine Rei he von physikalischen Systemen: Neben anderen auch das Wasserstoffatom (in Ka pitel VII), das besonders wichtig ist, weil an ihm sehr genaue Experimente durchge führt werden können. Die in Kapitel VII gefundenen Ergebnisse beschreiben in der Tat die Emissions- und Absorptionsspektren des Wasserstoffatoms sehr genau. Sie liefern die richtigen Energieniveaus und ermöglichen es mit Hilfe der entsprechenden Wel lenfunktionen, die Auswahlregeln (die angeben, welche Frequenzen aus der Reihe der Bohr-Frequenzen, die a priori möglich sind, tatsächlich im Spektrum auftreten) zu erklären. Auch Atome mit mehreren Elektronen können in analoger Weise behan delt werden (wenn auch unter Verwendung von Näherungen, weil die Komplexität der Schrödinger-Gleichung selbst schon für das Heliumatom mit zwei Elektronen eine ge naue analytische Lösung unmöglich macht). Für diesen Fall ist die Übereinstimmung zwischen Theorie und Experiment ebenfalls befriedigend. Wenn jedoch atomare Spektren im Detail untersucht werden, treten bestimmte Phänomene auf, die im Rahmen der bisher entwickelten Theorie nicht erklärt werden können. Diese Aussage ist nicht überraschend; vielmehr ist klar, dass die bisherige Theorie durch eine bestimmte Anzahl von relativistischen Korrekturen vervollständigt werden muss: Es müssen die Modifikationen aufgrund der relativistischen Kinematik (Veränderung der Masse mit der Geschwindigkeit usw.) und vernachlässigte magne tische Effekte zusätzlich berücksichtigt werden. Wir wissen, dass diese Korrekturen klein sind (Kap. VII, § C-4-a), aber sie treten auf und können gemessen werden. Die Dirac-Gleichung ist eine relativistische quantenmechanische Beschreibung des Elektrons. Sie weist zur Schrödinger-Gleichung einen grundlegenden Unterschied auf: Zusätzlich zu den bereits angesprochenen, die Ortsvariablen betreffenden Korrek turen tritt eine neue charakteristische Eigenschaft des Elektrons auf: sein Spin. Allge meiner ausgedrückt erweist sich der Spin aufgrund der Struktur der Lorentz-Gruppe (die Gruppe der relativistischen Raum-Zeit-Transformationen) als eine intrinsische Eigenschaft zahlreicher Teilchen, ähnlich wie etwa ihre Ruhemasse (dies bedeutet https://doi.org/10.1515/9783110638769-005
978 | IX Der Spin des Elektrons
nicht, dass der Spin rein relativistischen Ursprungs ist: Er kann ebenso aus der Struk tur der nichtrelativistischen Transformationsgruppe, der Galilei-Gruppe, abgeleitet werden). Der Elektronenspin wurde experimentell entdeckt, bevor die Dirac-Gleichung aufgestellt wurde. Wofgang Pauli entwickelte eine Theorie, die es ermöglichte, den Spin einfach in die nichtrelativistische Quantenmechanik aufzunehmen, indem eini ge zusätzliche Postulate hinzugefügt wurden.¹ Die auf diese Weise erhaltenen theore tischen Vorhersagen stimmen glänzend mit den experimentellen Daten überein.² In diesem Kapitel wollen wir die Pauli-Theorie entwickeln, die sehr viel einfacher als die Dirac-Theorie ist. Wir beginnen in § A damit, einige experimentelle Ergebnis se zu beschreiben, die die Existenz des Elektronenspins zeigen. Dann geben wir die Postulate an, auf die sich Paulis Theorie stützt, und untersuchen in § B die speziellen Eigenschaften eines Drehimpulses 1/2. Schließlich zeigen wir in § C, wie man die Orts variablen und den Spin eines Teilchens wie des Elektrons gleichzeitig berücksichtigen kann.
A Einführung des Elektronenspins A-1 Experimentelle Nachweise Die experimentellen Nachweise für die Existenz des Elektronenspins sind zahlreich und zeigen sich in vielen bedeutenden physikalischen Phänomenen. So können z. B. die magnetischen Eigenschaften zahlreicher Stoffe, insbesondere die ferromagneti scher Metalle, nur unter Berücksichtigung des Spins erklärt werden. Wir wollen uns hier jedoch auf einfache Phänomene beschränken, die in der Atomphysik experimen tell beobachtet werden: die Feinstruktur der Spektrallinien, den Zeeman-Effekt und schließlich das Verhalten von Silberatomen im Stern-Gerlach-Versuch. A-1-a Feinstruktur der Spektrallinien Die genaue experimentelle Untersuchung von atomaren Spektrallinien (z. B. des Was serstoffatoms) deckt eine Feinstruktur auf: Jede Linie besteht aus mehreren Kompo nenten mit annähernd gleichen Frequenzen, die jedoch mit ausreichender Auflösung
1 Man erhält Paulis Theorie als Grenzfall der Dirac-Theorie, wenn die Geschwindigkeit des Elektrons im Vergleich zur Lichtgeschwindigkeit klein ist. 2 Wir werden z. B. in Kapitel XII bei der Anwendung der allgemeinen Störungstheorie sehen, wie es re lativistische Korrekturen und die Berücksichtigung des Spins ermöglichen, die Details des atomaren Wasserstoffspektrums quantitativ zu erklären (was bei einer Beschränkung auf die Theorie in Kapi tel VII unmöglich wäre).
A Einführung des Elektronenspins | 979
klar unterschieden werden können.³ Es gibt also Gruppen von atomaren Zuständen, die sehr dicht benachbart, aber verschieden sind. Die Rechnungen in § C von Ka pitel VII ergeben nur die durchschnittlichen Energien der verschiedenen Gruppen von Zuständen, während sie die Aufspaltung innerhalb einer Gruppe nicht erklären können. A-1-b Der anomale Zeeman-Effekt Bringt man ein Atom in ein homogenes Magnetfeld, so spaltet sich jede Linie (d. h. jede Komponente der Feinstruktur) in eine gewisse Anzahl äquidistanter Linien auf, wobei der Abstand proportional zur Stärke des Magnetfelds ist; das ist der ZeemanEffekt. Die Ursache des Zeeman-Effekts lässt sich mit den Ergebnissen der Kapitel VI und VII (Ergänzung DVII ) leicht verstehen. Die theoretische Erklärung stützt sich auf die Tatsache, dass mit dem Bahndrehimpuls L des Elektrons ein magnetisches Mo ment M verbunden ist, M=
μB L ℏ
(A-1)
wobei μB das Bohr-Magneton μB =
qℏ 2me
(A-2)
bedeutet. Während jedoch die Theorie in bestimmten Fällen experimentell bestä tigt wird (normaler Zeeman-Effekt), vermag sie in anderen Fällen die Beobachtungen quantitativ nicht zu erklären (anomaler Zeeman-Effekt). Die auffallendste „Anomalie“ tritt für Atome mit ungerader Ordnungszahl Z (insbesondere für das Wasserstoffatom) auf: Ihre Zustände spalten sich in eine gerade Anzahl von Zeeman-Unterzuständen auf, während der Theorie nach diese Anzahl immer ungerade sein sollte, nämlich gleich 2l + 1 mit ganzzahligen l. A-1-c Existenz halbzahliger Drehimpulse Wir stehen vor derselben Schwierigkeit wie im Zusammenhang mit dem in § A-1 von Kapitel IV beschriebenen Stern-Gerlach-Versuch, bei dem sich der Strahl von Silber atomen symmetrisch in zwei Teile aufspaltet. Diese Ergebnisse legen nahe, dass halb zahlige Werte von j (die nach Kap. VI, § C-2 a priori möglich sind) tatsächlich existieren. Die Aussage stellt ein Problem dar, da wir in § D-1-b von Kapitel VI zeigten, dass der Bahndrehimpuls eines Teilchens wie des Elektrons nur ganzzahlig sein kann (genau er gesagt kann die Quantenzahl l nur ganzzahlige Werte annehmen). Auch in Atomen
3 Zum Beispiel setzt sich die Resonanzlinie des Wasserstoffatoms (2p ↔ 1s-Übergang) aus zwei Lini en zusammen: Die beiden Komponenten sind durch eine Lücke von der Größe 10−4 eV getrennt (das ist etwa 105 mal kleiner als die durchschnittliche 2p ↔ 1s-Übergangsenergie von 10.2 eV).
980 | IX Der Spin des Elektrons
mit mehreren Elektronen besitzen alle einen ganzzahligen Bahndrehimpuls, und wir werden in Kapitel X zeigen, dass dann auch der Gesamtbahndrehimpuls des Atoms notwendig ganzzahlig ist. Die Existenz halbzahliger Drehimpulse kann also ohne zu sätzliche Annahmen nicht erklärt werden. Bemerkung: Es ist nicht möglich, den Drehimpuls des Elektrons mit Hilfe der Stern-Gerlach-Apparatur direkt zu messen. Im Unterschied zu den Silberatomen besitzen Elektronen eine elektrische Ladung q, und die Wechselwirkung zwischen ihrem magnetischen Moment und dem inhomogenen Magnet feld würde von der Lorentz-Kraft q v × B vollständig überdeckt.
A-2 Die Postulate der Pauli-Theorie Zur Lösung der obigen Probleme schlugen Uhlenbeck und Goudsmit (1925) die fol gende Hypothese vor: Das Elektron „dreht sich um sich selbst“ (englisch: „to spin“), was einen inneren Drehimpuls erzeugt, den Spin. Um die oben beschriebenen experi mentellen Ergebnisse zu erklären, muss man zusätzlich annehmen, dass mit diesem Drehimpuls S ein magnetisches Moment MS verbunden ist:⁴ MS = 2
μB S ℏ
(A-3)
Man beachte, dass der Proportionalitätsfaktor zwischen dem Drehimpuls und dem magnetischen Moment in Gl. (A-3) zweimal so groß ist wie in Gl. (A-1); man sagt, das gyromagnetische Verhältnis des Spins ist zweimal so groß wie das der Bahnbewegung. Pauli präzisierte diese Annahme später und lieferte eine quantenmechanische Beschreibung des Spins, die im nichtrelativistischen Grenzfall gültig ist. Den in Kapi tel III eingeführten, allgemeinen Postulaten der Quantenmechanik müssen nun einige neue, den Spin betreffende Postulate hinzugefügt werden. Bisher haben wir die Quantisierung von Bahnvariablen untersucht. Dem Ort r und dem Impuls p eines Teilchens wie des Elektrons ordneten wir die Observablen R und P zu, die im Zustandsraum Hr wirken, der zum Raum der Wellenfunktionen F isomorph ist. Alle physikalischen Größen sind Funktionen der fundamentalen Variablen r und p, und mit Hilfe der Quantisierungsregeln können ihnen in Hr wirkende Observablen zugeordnet werden. Wir wollen Hr den Bahnzustandsraum nennen. Den Bahnvariablen fügen wir Spinvariablen hinzu, die die folgenden Postulate er füllen:
4 Tatsächlich findet man, wenn man die Kopplung des Elektrons mit dem quantisierten elektroma gnetischen Feld (Quantenelektrodynamik) beachtet, dass der Proportionalitätsfaktor zwischen MS und S nicht genau gleich 2μ B /ℏ ist. Die Differenz von der relativen Größe 10−3 kann experimentell leicht beobachtet werden; sie wird oft das anomale magnetische Moment des Elektrons genannt.
A Einführung des Elektronenspins | 981
1. Der Spinoperator S ist ein Drehimpuls. Seine drei Komponenten sind Observa blen (s. Kap. VI, § B-2), die die Vertauschungsregel [S x , S y ] = iℏS z
(A-4)
und die beiden entsprechenden Regeln, die sich durch zyklisches Vertauschen der Indizes x, y und z ergeben, erfüllen. 2. Die Spinoperatoren wirken in einem neuen Raum, dem Spinzustandsraum HS , in dem S2 und S z einen V. S. K. O. bilden. Der Raum HS wird also durch die Menge der gemeinsamen Eigenzustände |s, m⟩ von S2 und S z aufgespannt: S2 |s, m⟩ = s(s + 1)ℏ2 |s, m⟩
(A-5a)
S z |s, m⟩ = mℏ |s, m⟩
(A-5b)
Der allgemeinen Theorie des Drehimpulses (Kap. VI, § C) zufolge wissen wir, dass s ganz- oder halbzahlig sein muss und m alle Werte zwischen −s und +s, die sich von diesen um eine ganze Zahl (auch null) unterscheiden, annimmt. Ein gegebenes Teil chen ist durch einen bestimmten Wert von s charakterisiert; man sagt, es habe den Spin s. Der Spinzustandsraum hat daher stets die (endliche) Dimension (2s + 1), und alle Spinzustände sind Eigenvektoren von S2 mit demselben Eigenwert s(s + 1)ℏ2 . 3. Der Zustandsraum H des betrachteten Teilchens ist das Tensorprodukt von Hr und HS , H = Hr ⊗ HS
(A-6)
Daher (s. Kap. II, § F) vertauschen alle Spinobservablen mit allen Bahnobservablen. Außer in dem speziellen Fall s = 0 reicht es zur Beschreibung des Zustands des Teilchens also nicht aus, einen Ketvektor aus Hr (d. h. eine quadratintegrable Wellen funktion) anzugeben. Anders ausgedrückt bilden die Observablen X, Y und Z keinen vollständigen Satz kommutierender Observabler (V. S. K. O.) im Zustandsraum H des Teilchens (ebenso wenig wie P x , P y , P z oder jeder andere V. S. K. O. von Hr ). Vielmehr ist es zusätzlich nötig, den Spinzustand des Teilchens zu kennen, d. h. dem V. S. K. O. von Hr einen V. S. K. O. von HS zuzufügen, das sich aus Spinobservablen wie z. B. S2 und S z (oder S2 und S x ) zusammensetzt. Jeder Teilchenzustand ist eine Linearkom bination von Vektoren, die ihrerseits Tensorprodukte je eines Ketvektors aus Hr und aus HS sind (s. § C). 4. Das Elektron ist ein Spin-1/2-Teilchen (s = 1/2) und sein inneres magnetisches Moment ist durch Gl. (A-3) gegeben. Für das Elektron ist der Raum HS daher zweidi mensional. Bemerkungen: 1. Das Proton und das Neutron, beides Kernbausteine, sind ebenfalls Spin-1/2-Teilchen, aber ihre gyromagnetischen Verhältnisse unterscheiden sich von dem des Elektrons. Zur Zeit kennt man Teilchen mit dem Spin 0, 1/2, 1, 3/2, 2, . . . bis hin zu höheren Werten wie 11/2.
982 | IX Der Spin des Elektrons
2. Um die Existenz des Spins zu erklären, könnten wir uns vorstellen, dass ein Teilchen wie das Elektron eine gewisse räumliche Ausdehnung besitzt. Die Rotation des Elektrons um seine Ach se würde dann den inneren Drehimpuls ergeben. Dabei ist jedoch zu bedenken, dass es zur Be schreibung einer komplizierteren Struktur als dem Massenpunkt erforderlich ist, mehr als drei Ortsvariablen einzuführen. Verhielte sich das Elektron z. B. wie ein Festkörper, wären sechs Va riablen nötig: drei Koordinaten zur Bestimmung der Lage eines einmal gewählten Punkts des Körpers, wie z. B. des Massenmittelpunkts, und drei Winkel zur Festlegung seiner Orientierung im Raum. Die hier betrachtete Theorie ist grundlegend anders: Wir behandeln das Elektron weiter als einen Massenpunkt (dessen Lage durch drei Koordinaten bestimmt ist), und der Spindrehim puls wird nicht aus irgendeiner Orts- oder Impulsvariablen abgeleitet⁵. Der Spin besitzt daher kein klassisches Analogon.
B Die Eigenschaften eines Drehimpulses 1/2 Wir beschränken uns von nun an auf Elektronen, also Teilchen mit dem Spin 1/2. In den vorhergehenden Kapiteln haben wir uns mit den Bahnvariablen befasst und wol len nun die Spinfreiheitsgrade genauer untersuchen. Der Spinzustandsraum HS ist zweidimensional. Als Basis nehmen wir das Ortho normalsystem {|+⟩, |−⟩}, das aus gemeinsamen Eigenvektoren von S2 und S z besteht, die die folgenden Gleichungen erfüllen: 3 2 ℏ |±⟩ 4 1 S z |±⟩ = ± ℏ |±⟩ 2
S2 |±⟩ =
(B-1a) (B-1b)
⟨+|−⟩ = 0
(B-2a)
⟨+|+⟩ = ⟨−|−⟩ = 1
(B-2b)
|+⟩⟨+| + |−⟩⟨−| = 𝟙
(B-3)
Dabei bezeichnet 𝟙 den Einsoperator. Der allgemeinste Spinzustand wird durch einen beliebigen Vektor aus HS beschrieben, |χ⟩ = c+ |+⟩ + c− |−⟩
(B-4)
worin c+ und c− komplexe Zahlen sind. Gleichung (B-1a) zufolge sind alle Ketvekto ren aus HS Eigenvektoren von S2 zum selben Eigenwert 3ℏ2 /4, was bedeutet, dass S2 proportional zum Einheitsoperator von HS ist: S2 =
3 2 ℏ 4
5 Wenn das so wäre, müsste er darüber hinaus ganzzahlig sein.
(B-5)
B Die Eigenschaften eines Drehimpulses 1/2 |
983
Da S per Definition ein Drehimpuls ist, besitzt er alle in § C von Kapitel VI abge leiteten allgemeinen Eigenschaften. Die Wirkung der Operatoren S± = S x ± iS y
(B-6)
auf die Basisvektoren wird daher (indem man jetzt j = s = 1/2 setzt) gegeben durch S+ |+⟩ = 0
S+ |−⟩ = ℏ |+⟩
S− |+⟩ = ℏ |−⟩
S− |−⟩ = 0
(B-7)
Jeder Operator in HS kann in der {|+⟩, |−⟩}-Basis durch eine 2 × 2-Matrix dargestellt werden. Insbesondere finden wir mit Hilfe der Systeme (B-1b) und (B-7) für die Matri zen der Operatoren S x , S y und S z die Form (S) =
ℏ σ 2
(B-8)
worin σ die Menge der drei Pauli-Matrizen bezeichnet: 0 σx = ( 1
1 ) 0
σy = (
0 i
−i ) 0
1 σz = ( 0
0 ) −1
(B-9)
Die Pauli-Matrizen besitzen folgende Eigenschaften, die sich leicht aus ihrer ex pliziten Form (B-9) ableiten lassen (s. auch Ergänzung AIV ): σ 2x = σ 2y = σ 2z = I
(B-10a)
σx σy + σy σx = 0
(B-10b)
[σ x , σ y ] = 2i σ z
(B-10c)
σ x σ y = iσ z
(B-10d)
(den letzten drei Gleichungen müssen jeweils die durch zyklisches Vertauschen der In dizes x, y, z entstehenden hinzugefügt werden). Ebenso folgt aus den Identitäten (B-9) Tr σ x = Tr σ y = Tr σ z = 0 det σ x = det σ y = det σ z = −1
(B-11a) (B-11b)
Jede beliebige 2 × 2-Matrix lässt sich als Linearkombination (mit komplexen Koeffi zienten) der drei Pauli-Matrizen und der Einheitsmatrix schreiben. Das folgt daraus, dass eine 2 × 2-Matrix nur vier Elemente hat. Schließlich zeigt man leicht (s. Ergän zung AIV ) die folgende Identität: (σ ⋅ A)(σ ⋅ B) = (A ⋅ B) 𝟙 + i σ ⋅ (A × B)
(B-12)
wobei A und B zwei beliebige Vektoren oder zwei Vektoroperatoren sind, deren Kom ponenten mit denen des Spins vertauschen. Wenn A und B untereinander nicht ver tauschen, so bleibt die Identität gültig, solange A und B auf der rechten Seite in der selben Reihenfolge wie auf der linken stehen.
984 | IX Der Spin des Elektrons
Die Operatoren des Elektronenspins besitzen zunächst alle Eigenschaften, wie sie sich unmittelbar aus der allgemeinen Theorie des Drehimpulses ergeben. Zusätzlich weisen sie einige spezielle Eigenschaften auf. Sie rühren daher, dass s den kleinstmög lichen Wert annimmt (vom Wert null abgesehen) und ergeben sich sofort aus Gl. (B-8) und den Gleichungen (B-10): ℏ2 4 Sx Sy + Sy Sx = 0
S2x = S2y = S2z =
i S x S y = ℏS z 2 S2+ = S2− = 0
(B-13a) (B-13b) (B-13c) (B-13d)
C Nichtrelativistische Beschreibung eines Spin-1/2-Teilchens Wir wissen nun, wie die äußeren (Bahn-) und die inneren (Spin-) Freiheitsgrade eines Elektrons separat beschrieben werden. In diesem Abschnitt wollen wir diese beiden verschiedenen Konzepte zu einem Formalismus zusammenfügen.
C-1 Observable und Zustandsvektoren C-1-a Der Zustandsraum Unter Beachtung aller Freiheitsgrade wird der quantenmechanische Zustand eines Elektrons durch einen Ketvektor aus dem Raum H gegeben, der gleich dem Tensor produkt aus Hr und HS ist (§ A-2). Wir erweitern nach der in § F-2-b von Kapitel II beschriebenen Methode sowohl die ursprünglich in Hr wirkenden als auch die in HS definierten Operatoren auf H (und verwenden für diese erweiterten Operatoren weiterhin dieselbe Notation wie für die Operatoren, aus denen sie abgeleitet sind). Wir erhalten so einen V. S. K. O. in H durch das Zusammenfügen je eines V. S. K. O. aus Hr und aus HS . Aus HS können wir z. B. S2 und S z (oder S2 und eine beliebige andere Komponente von S) wählen, aus Hr die Sätze {X, Y, Z}, {P x , P y , P z } oder wenn H den zu einem Zentralpotential gehören den Hamilton-Operator bezeichnet, {H, L2 , L z } usw. Daraus erhalten wir verschiedene V. S. K. O. in H: {X, Y, Z, S2 , S z } 2
{P x , P y , P z , S , S z } 2
2
{H, L , L z , S , S z }
(C-1a) (C-1b) (C-1c)
usw. Da alle Ketvektoren ausl H Eigenvektoren von S2 zum selben Eigenwert sind [Gl. (B-5)], können wir S2 in den Mengen von Observablen weglassen.
C Das nichtrelativistische Spin-1/2-Teilchen |
985
Wir wollen hier den ersten V. S. K. O. (C-1a) verwenden: Als Basis von H nehmen wir die Menge der Vektoren, die sich als Tensorprodukt der Ketvektoren |r⟩ ≡ |x, y, z⟩ aus Hr und der Vektoren |ε⟩ aus HS ergeben, |r, ε⟩ ≡ |x, y, z, ε⟩ = |r⟩ ⊗ |ε⟩
(C-2)
wobei x, y, z, die Komponenten des Vektors r, von −∞ bis +∞ laufen (kontinuierliche Indizes) und ε gleich + oder − ist (diskrete Indizes). Seiner Definition nach ist |r, ε⟩ gemeinsamer Eigenvektor von X, Y, Z, S2 und S z : X |r, ε⟩ = x |r, ε⟩ Y |r, ε⟩ = y |r, ε⟩ Z |r, ε⟩ = z |r, ε⟩ (C-3) 3 S2 |r, ε⟩ = ℏ2 |r, ε⟩ 4 ℏ S z |r, ε⟩ = ε |r, ε⟩ 2 Jeder Ketvektor |r, ε⟩ ist bis auf einen konstanten Faktor vollständig bestimmt, da X, Y, Z, S2 und S z einen V. S. K. O. bilden. Das |r, ε⟩-System ist orthonormal (im erweiterten Sinne), weil die Mengen {|r⟩} und {|+⟩, |−⟩} in Hr bzw. HS jeweils orthonormal sind: ⟨r , ε | r, ε⟩ = δ ε ε δ(r − r)
(C-4)
ist gleich 1 oder 0, je nachdem, ob ε und ε gleich oder verschieden sind). Schließ
(δ ε ε lich erfüllt es die Vollständigkeitsrelation in H:
∑ ∫ d3 r |r, ε⟩⟨r, ε| = ∫ d3 r |r, +⟩⟨r, +| + ∫ d3 r |r, −⟩⟨r, −| = 1
(C-5)
ε
C-1-b Die {|r, ε⟩}-Darstellung α Zustandsvektoren Ein beliebiger Zustand |ψ⟩ des Raums H kann in der {|r, ε⟩}-Basis entwickelt werden; dazu verwendet man die Vollständigkeitsrelation (C-5) |ψ⟩ = ∑ ∫ d3 r |r, ε⟩⟨r, ε|ψ⟩
(C-6)
ε
Der Vektor |ψ⟩ kann also durch die Menge seiner Koordinaten in der {|r, ε⟩}-Basis dar gestellt werden, d. h. durch die Zahlen ⟨r, ε|ψ⟩ = ψ ε (r)
(C-7)
die von den drei kontinuierlichen Indizes x, y, z (oder kürzer r) und dem diskreten In dex ε (+ oder −) abhängen. Um den Zustand eines Elektrons vollständig zu beschrei ben, ist daher die Angabe von zwei Funktionen der Raumvariablen x, y und z erfor derlich: ψ+ (r) = ⟨r, + | ψ⟩ ψ− (r) = ⟨r, − | ψ⟩
(C-8)
986 | IX Der Spin des Elektrons
Diese beiden Funktionen schreibt man oft in der Form eines zweikomponentigen Spinors, den wir mit [ψ](r) bezeichnen wollen, [ψ](r) = (
ψ+ (r) ) ψ− (r)
(C-9)
Der zum Ketvektor |ψ⟩ gehörende Bravektor ⟨ψ| wird durch die Adjungierte des Ausdrucks (C-6) gegeben, ⟨ψ| = ∑ ∫ d3 r ⟨ψ|r, ε⟩⟨r, ε|
(C-10)
ε
woraus sich unter der Verwendung von Gl. (C-7) ⟨ψ| = ∑ ∫ d3 r ψ∗ε (r) ⟨r, ε|
(C-11)
ε
ergibt. Der Bravektor ⟨ψ| wird also durch die beiden Funktionen ψ∗+ (r) und ψ∗− (r) dar gestellt, die in der Form des zu Gl. (C-9) adjungierten Spinors geschrieben werden kön nen [ψ]† (r) = (ψ∗+ (r), ψ∗− (r))
(C-12)
In dieser Notation kann das Skalarprodukt zweier Zustandsvektoren |ψ⟩ und |φ⟩, das nach Gl. (C-5) ⟨ψ|φ⟩ = ∑ ∫ d3 r ⟨ψ|r, ε⟩⟨r, ε|φ⟩ ε
= ∫ d3 r [ψ∗+ (r) φ+ (r) + ψ∗− (r) φ− (r)]
(C-13)
ist, geschrieben werden ⟨ψ|φ⟩ = ∫ d3 r [ψ]† (r) [φ](r)
(C-14)
Diese Formel ist der für die Berechnung des Skalarprodukts zweier Ketvektoren in Hr aus den entsprechenden Wellenfunktionen ähnlich. Wichtig ist jedoch, dass hier die Matrixmultiplikation der Spinoren [ψ]† (r) und [ψ](r) vor der Raumintegration ausge führt werden muss. Die Normierung des Vektors |ψ⟩ wird durch ⟨ψ|ψ⟩ = ∫ d3 r [ψ]† (r) [ψ](r) = ∫ d3 r [|ψ+ (r)|2 + |ψ− (r)|2 ] = 1
(C-15)
ausgedrückt. Einige Vektoren aus H sind Tensorprodukte je eines Ketvektors aus Hr und aus HS (z. B. der Basisvektoren). Wenn der betrachtete Zustandsvektor von diesem Typ ist, |ψ⟩ = |φ⟩ ⊗ |χ⟩
(C-16)
C Das nichtrelativistische Spin-1/2-Teilchen |
987
mit |φ⟩ = ∫ d3 r φ(r) |r⟩ ∈ Hr
(C-17)
|χ⟩ = c+ |+⟩ + c− |−⟩ ∈ HS nimmt der zugehörige Spinor die einfache Form an [ψ](r) = (
φ(r) c+ c+ ) = φ(r) ( ) φ(r) c− c−
(C-18)
Das folgt aus der Definition des Skalarprodukts in H, und für den obigen Fall haben wir ψ+ (r) = ⟨r, +|ψ⟩ = ⟨r|φ⟩⟨+|χ⟩ = φ(r) c+
(C-19a)
ψ− (r) = ⟨r, −|ψ⟩ = ⟨r|φ⟩⟨−|χ⟩ = φ(r) c−
(C-19b)
Das Quadrat der Norm von |ψ⟩ lautet dann ⟨ψ|ψ⟩ = ⟨φ|φ⟩⟨χ|χ⟩ = (|c+ |2 + |c− |2 ) ∫ d3 r |φ(r)|2
(C-20)
β Operatoren Es sei |ψ ⟩ der Ketvektor, der sich aus der Wirkung des linearen Operators A auf den Vektor |ψ⟩ aus H ergibt. Nach den Ergebnissen des vorherigen Abschnitts können |ψ ⟩ und |ψ⟩ durch die zweikomponentigen Spinoren [ψ ](r) und [ψ](r) dargestellt werden. Wir wollen nun zeigen, dass sich dem Operator A eine 2 × 2-Matrix [A] so zuordnen lässt, dass gilt [ψ ](r) = [A] [ψ](r)
(C-21)
wobei die Matrixelemente im Allgemeinen wieder Differentialoperatoren in Bezug auf die Variable r sind. 1. Spinoperatoren Diese waren ursprünglich in HS definiert; sie wirken daher nur auf den ε-Index der Ba sisvektoren |r, ε⟩, und ihre Matrixform wurde bereits in § B angegeben. Wir beschrän ken uns hier auf ein Beispiel, und zwar auf den Operator S+ . Seine Wirkung auf einen Vektor |ψ⟩, der nach Gl. (C-6) entwickelt wird, ergibt den Vektor |ψ ⟩ = ℏ ∫ d3 r ψ− (r) |r, +⟩
(C-22)
da S+ alle Vektoren |r, +⟩ vernichtet und die Vektoren |r, −⟩ in ℏ|r, +⟩ überführt. Die Komponenten von |ψ ⟩ in der {|r, ε⟩}-Basis lauten nach Gl. (C-22) ⟨r, +|ψ ⟩ = ψ+ (r) = ℏψ− (r) ⟨r, −|ψ ⟩ = ψ− (r) = 0
(C-23)
988 | IX Der Spin des Elektrons Der den Vektor |ψ ⟩ darstellende Spinor ist also [ψ ](r) = ℏ (
ψ− (r) ) 0
(C-24)
Zum selben Ergebnis gelangt man durch die Multiplikation von [ψ](r) mit [S+ ] =
0 ℏ (σ x + iσ y ) = ℏ ( 2 0
1 ) 0
(C-25)
2. Bahnoperatoren Im Unterschied zu den vorhergehenden Operatoren lassen die Bahnoperatoren den Index ε des Basisvektors |r, ε⟩ ungeändert; die zugehörigen 2×2-Matrizen sind immer proportional zur Einheitsmatrix. Andererseits wirken sie auf die r-Abhängigkeit der Spinoren in derselben Weise wie auf die üblichen Wellenfunktionen. Betrachten wir z. B. die Ketvektoren |ψ ⟩ = X|ψ⟩ und |ψ ⟩ = P x |ψ⟩. Ihre Komponenten lauten in der {|r, ε⟩}-Basis ψε (r) = ⟨r, ε | X | ψ⟩ = x ψ ε (r) ψε (r) = ⟨r, ε | P x | ψ⟩ =
ℏ ∂ ψ ε (r) i ∂x
(C-26a) (C-26b)
Die Spinoren [ψ ](r) und [ψ ](r) ergeben sich also aus [ψ](r) über die folgenden 2 × 2Matrizen: [X] = (
x 0
0 ) x ∂
ℏ ∂x [P x ] = ( i 0
(C-27a) 0 ∂ ∂x
)
(C-27b)
3. Gemischte Operatoren Der allgemeinste in H wirkende Operator wird in Matrixnotation durch eine 2 × 2Matrix dargestellt, deren Elemente Differentialoperatoren in Bezug auf die r-Variablen sind. So ist z. B. ℏ ∂
[L z S z ] =
ℏ i ∂φ ( 2 0
0 ∂ − ℏi ∂φ
)
(C-28)
oder ℏ (σ x P x + σ y P y + σ z P z ) 2 ∂ ∂ ∂ ℏ2 ∂z ∂x − i ∂y ) = ( ∂ ∂ ∂ 2i − ∂z ∂x + i ∂y
[S ⋅ P] =
(C-29)
C Das nichtrelativistische Spin-1/2-Teilchen | 989
Bemerkungen: 1. Die Spinordarstellung {|r, ε⟩} entspricht der {|r⟩}-Darstellung von Hr : Das Matrixelement ⟨ψ|A|φ⟩ eines beliebigen Operators A in H wird durch die Gleichung ⟨ψ|A|φ⟩ = ∫ d3 r [ψ]† (r) [A] [φ](r)
(C-30)
gegeben, worin [A] die 2×2-Matrix bezeichnet, die den Operator A darstellt (zuerst führt man die Matrixmultiplikation aus und integriert dann über den ganzen Raum). Diese Darstellung werden wir nur dann verwenden, wenn die Rechnungen dadurch vereinfacht werden; wie in Hr werden wir soweit wie möglich die Vektoren und Operatoren selbst benutzen. 2. Natürlich gibt es auch eine {|p, ε⟩}-Darstellung, deren Basisvektoren gemeinsame Eigenzu stände zum V. S. K. O. {P x , P y , P z , S2 , S z } sind. Die Definition des Skalarprodukts in H ergibt ⟨r, ε | p, ε ⟩ = ⟨r|p⟩⟨ε|ε ⟩ =
1 eip⋅r/ℏ δ εε (2πℏ)3/2
(C-31)
In der {|p, ε⟩}-Darstellung ordnet man jedem Vektor |ψ⟩ aus H einen zweikomponentigen Spinor zu, [ψ](p) = (
ψ+ (p) ψ− (p)
)
(C-32)
mit ψ+ (p) = ⟨p, + | ψ⟩
(C-33)
ψ− (p) = ⟨p, − | ψ⟩
Gleichung (C-31) zufolge sind ψ+ (p) und ψ− (p) die Fourier-Transformierten von ψ+ (r) und ψ− (r): ψ ε (p) = ⟨p, ε | ψ⟩ = ∑ ∫ d3 r ⟨p, ε | r, ε ⟩⟨r, ε | ψ⟩ ε
=
1 ∫ d3 r e−ip⋅r/ℏ ψ ε (r) (2πℏ)3/2
(C-34)
Die Operatoren werden wieder durch 2 × 2-Matrizen dargestellt, und die zu den Spinoperatoren gehörigen Matrizen bleiben dieselben wie in der {|r, ε⟩}-Darstellung.
C-2 Berechnung von Vorhersagen Auf der Grundlage des gerade beschriebenen Formalismus können wir die Postulate aus Kapitel III anwenden, um für verschiedene Messungen an einem Elektron Vorher sagen zu erhalten. Wir geben mehrere Beispiele an. Wir präzisieren zunächst die Wahrscheinlichkeitsinterpretation der Komponen ten ψ+ (r) und ψ− (r) des Zustandsvektors |ψ⟩, den wir als normiert voraussetzen [Gl. (C-15)]. Wir stellen uns vor, dass wir gleichzeitig den Ort des Elektrons und die z-Komponente seines Spins messen. Da X, Y, Z und S z einen V. S. K. O. bilden, gibt es zu einem bestimmten Ergebnis x, y, z und ±ℏ/2 genau einen Zustandsvektor.
990 | IX Der Spin des Elektrons Die Wahrscheinlichkeit d3 𝒫(r, +), das Elektron mit dem Spin aufwärts (z-Komponen te gleich +ℏ/2) im Volumenelement d3 r um den Punkt r(x, y, z) zu finden, ist gleich d3 𝒫(r, +) = |⟨r, + | ψ⟩|2 d3 r = |ψ+ (r)|2 d3 r
(C-35)
Entsprechend ist d3 𝒫(r, −) = |⟨r, − | ψ⟩|2 d3 r = |ψ− (r)|2 d3 r
(C-36)
die Wahrscheinlichkeit, das Elektron im selben Volumen, aber jetzt mit dem Spin abwärts (z-Komponente gleich −ℏ/2) zu finden. Messen wir gleichzeitig mit dem Ort des Elektrons die x-Komponente des Spins, so können wir die Gleichungen (A-20) aus Kapitel IV anwenden: Die Operatoren X, Y, Z und S x bilden ebenfalls einen V. S. K. O.; zum Messergebnis {x, y, z, ±ℏ/2} gehört ein einziger Zustandsvektor, nämlich |r⟩|±⟩x =
1 [|r, +⟩ ± |r, −⟩] √2
(C-37)
Die Wahrscheinlichkeit, das Elektron im Volumenelement d3 r um den Punkt r mit einem Spin in positiver x-Richtung zu finden, ist dann 1 2 1 d3 r [⟨r, + | ψ⟩ + ⟨r, − | ψ⟩] = |ψ+ (r) + ψ− (r)|2 d3 r √2 2
(C-38)
Natürlich kann man auch den Impuls des Elektrons anstelle seines Orts mes sen. Man verwendet dann die Komponenten von |ψ⟩ in Bezug auf die Vektoren |p, ε⟩ (s. Bemerkung 2 in § C-1), d. h. die Fourier-Transformierten ψ ± (p) von ψ± (r). Die Wahr scheinlichkeit d3 𝒫(p, ±), den Impuls innerhalb d3 p um p und die z-Komponente des Spins als ±ℏ/2 zu finden, ist d3 𝒫(p, ±) = |⟨p, ± | ψ⟩|2 d3 p = |ψ ± (p)|2 d3 p
(C-39)
Die verschiedenen bisher betrachteten Messungen sind vollständig in dem Sinne, dass sie jeweils zu einem V. S. K. O. gehören. Bei unvollständigen Messungen tragen mehrere orthogonale Zustände zum gleichen Messergebnis bei, und es müssen die Betragsquadrate der entsprechenden Wahrscheinlichkeitsamplituden summiert wer den. Verzichtet man z. B. auf die Messung des Spins, so ist die Wahrscheinlichkeit, ein Elektron im Volumen d3 r um den Punkt r zu finden, gleich d3 𝒫(r) = [|ψ+ (r)|2 + |ψ− (r)|2 ] d3 r
(C-40)
weil zu dem Messergebnis {x, y, z} zwei orthogonale Zustandsvektoren |r, +⟩ und |r, −⟩ gehören, deren Wahrscheinlichkeitsamplituden gleich ψ+ (r) bzw. ψ− (r) sind. Schließlich wollen wir die Wahrscheinlichkeit 𝒫+ dafür bestimmen, dass die z-Komponente des Spins gleich +ℏ/2 ist (ohne die Bahnvariablen zu messen). Zu
C Das nichtrelativistische Spin-1/2-Teilchen | 991
diesem Ergebnis gehört eine unendliche Anzahl von Zuständen wie z. B. alle Vekto ren |r, +⟩ mit beliebigem r. Wir müssen daher die Betragsquadrate der Amplituden ⟨r, + | ψ⟩ = ψ+ (r) über alle möglichen Werte von r summieren, also ist 𝒫+ = ∫ d3 r |ψ+ (r)|2
(C-41)
Sind wir an der x-Komponente des Spins anstelle der z-Komponente interessiert, so integrieren wir natürlich das Ergebnis (C-38) über den gesamten Raum. Diese Darstel lung ist eine Verallgemeinerung von Kap. IV, § B-2, wo wir nur die Spinobservablen betrachtet haben, da die Bahnvariablen klassisch behandelt werden konnten.
Referenzen und Literaturhinweise Entdeckungsgeschichte des Spins und Referenzen auf Originalartikel: Jammer (4.8), § 3-4. Manifestation des Spins in der Atomphysik: Eisberg und Resnick (1.3), Kap. 8; Born (11.4), Kap. VI; Kuhn (11.1), Kap. III, § A5, § A6 und § F; siehe Referenzen in Kapitel IV zum Stern-Gerlach-Versuch. Magnetisches Moment des Elektronenspins: Cagnac und Pebay-Peyroula (11.2), Kap. XII; Crane (11.16). Dirac-Gleichung: Schiff (1.18), Kap. 13; Messiah (1.17), Kap. XX; Bjorken und Drell (2.6), Kap. 1 bis 4. Siehe auch Omnès (16.13), Kap. X. Lorentz-Gruppe: Bacry (10.31), Kap. 7 und 8; Omnès (16.13), Kap. IV. Teilchen mit Spin 1: Messiah (1.17), Kap. XIII, § 21.
•
992 | Übersicht über die Ergänzungen zu Kapitel IX
Übersicht über die Ergänzungen zu Kapitel IX AIX Drehoperatoren für ein Spin-1/2-Teilchen
Diese Ergänzung ist eine Fortsetzung von Ergänzung BVI . Der Zusammenhang zwischen Spin-1/2-Drehimpulsen und den geometrischen Drehungen dieses Spins wird im Detail untersucht. (von mittlerer Schwierigkeit, kann beim ersten Lesen übersprungen werden)
BIX Aufgaben
Ergänzung BIX enthält Aufgaben zu Kapitel IX. Aufgabe 4 wird ausführlich behandelt; es wird die Polarisation eines Strahls von Spin-1/2-Teilchen untersucht, wie sie durch die Reflexion an einem magnetisierten ferromagnetischen Körper verursacht wird. Diese Methode findet bei verschiedenen Experimenten ihre Anwendung.
Drehoperatoren für ein Spin-1/2-Teilchen | 993
•
Ergänzung AIX Drehoperatoren für ein Spin-1/2-Teilchen 1 1-a 1-b 2 2-a 2-b 2-c 3
Drehoperatoren im Zustandsraum | 993 Gesamtdrehimpuls | 993 Zerlegung von Drehoperatoren in Tensorprodukte | 993 Drehung von Spinzuständen | 994 Berechnung der Drehoperatoren in HS | 994 Operator für die Drehung um den Winkel 2π | 995 Vektorcharakter von S und Spinzustand bei Drehungen | 996 Drehung zweikomponentiger Spinoren | 998
Wir wollen die in Ergänzung BVI angestellten Überlegungen auf ein Spin-1/2-Teilchen anwenden. Zuerst betrachten wir die Form der Drehoperatoren für diesen speziellen Fall. Dann untersuchen wir das Verhalten des Zustandsvektors und des zugehörigen zweikomponentigen Spinors bei Drehungen.
1 Drehoperatoren im Zustandsraum 1-a Gesamtdrehimpuls Ein Spin-1/2-Teilchen besitzt einen Bahndrehimpuls L und einen Spindrehimpuls S. Seinen Gesamtdrehimpuls definiert man als die Summe dieser Drehimpulse: J=L+S
(1)
Das stimmt mit den allgemeinen Betrachtungen in Ergänzung BVI überein. Es stellt sicher, dass nicht nur R und P, sondern auch S eine vektorielle Observable ist (Zur Überprüfung muss man die Kommutatoren zwischen den Komponenten dieser Observablen und denen von J berechnen; s. Ergänzung BVI , § 5-c.)
1-b Zerlegung von Drehoperatoren in Tensorprodukte Der geometrischen Drehung Ru (α) mit einem Winkel α um den Einheitsvektor u wird der Drehoperator Ru (α) im Zustandsraum des untersuchten Teilchens zugeordnet, s. Ergänzung BVI , § 4): Ru (α) = e−iαJ⋅u/ℏ
(2)
Dabei ist J der in (1) definierte Gesamtdrehimpuls. Da L nur in Hr und S nur in HS wirkt (was insbesondere bedeutet, dass alle Kom ponenten von L mit allen Komponenten von S vertauschen), können wir Ru (α) in Form https://doi.org/10.1515/9783110638769-006
•
994 | Ergänzung AIX
eines Tensorprodukts schreiben, Ru (α) =
(r)
Ru (α) ⊗
(S)
Ru (α)
(3)
worin (r)
Ru (α) = e−iαL⋅u/ℏ
(4)
und (S)
Ru (α) = e−iαS⋅u/ℏ
(5)
die in Hr bzw. HS zu Ru (α) gehörenden Drehoperatoren sind. Wenn man also die Drehung Ru (α) auf ein Spin-1/2-Teilchen anwendet, dessen Zustand durch einen Ketvektor gegeben wird, der selbst ein Tensorprodukt ist, |ψ⟩ = |φ⟩ ⊗ |χ⟩
(6)
mit |φ⟩ ∈ Hr |χ⟩ ∈ HS
(7)
so wird sein Zustand nach der Drehung gegeben sein durch |ψ ⟩ = Ru (α) |ψ⟩ = [ (r)Ru (α) |φ⟩] ⊗ [ (S)Ru (α) |χ⟩]
(8)
Auch der Spinzustand des Teilchens wird also durch die Rotation geändert, was wir im nächsten Abschnitt genauer zeigen werden.
2 Drehung von Spinzuständen Die Drehoperatoren (r)R im Raum Hr haben wir in § 3 von Ergänzung BVI bereits unter sucht. Hier interessieren wir uns nun für die Operatoren (S)R, die im Spinzustandsraum HS wirken.
2-a Berechnung der Drehoperatoren in HS Wir setzen S=
ℏ σ 2
(9)
Wir wollen den Operator (S)
Ru (α) = e−iαS⋅u/ℏ = e−iασ⋅u/2
(10)
Drehoperatoren für ein Spin-1/2-Teilchen | 995
•
berechnen. Dazu verwenden wir die Definition eines Exponentialoperators, 1 α 2 iα σ ⋅ u + (−i ) (σ ⋅ u)2 + . . . 2 2! 2 α n 1 n + (−i ) (σ ⋅ u) + . . . n! 2
(S)
Ru (α) = 1 −
(11)
Jetzt sehen wir mit der Identität (B-12) aus Kapitel IX, dass (σ ⋅ u)2 = u2 = 1
(12)
gilt, was auf {1 für n gerade (σ ⋅ u)n = { σ ⋅ u für n ungerade {
(13)
führt. Wenn wir die geraden und die ungeraden Terme zusammenfassen, können wir den Ausdruck (11) schreiben 1 α 2 (−1)p α 2p ( ) +...+ ( ) + . . .] 2! 2 (2p)! 2 α 2p+1 (−1)p α 1 α 3 ( ) +...+ ( ) + . . .] − iσ ⋅ u [ − 2 3! 2 (2p + 1)! 2
(S)
Ru (α) = [1 −
(14)
d. h. also (S)
Ru (α) = cos
α α − iσ ⋅ u sin 2 2
(15)
In dieser Form kann man die Wirkung des Operators auf einen beliebigen Spinzustand sehr einfach bestimmen. Die Darstellungsmatrizen der Operatoren σ x , σ y und σ z in der {|+⟩, |−⟩}-Basis ken nen wir bereits [s. Gl. (B-9) aus Kap. IX]. Darum erhalten wir mit der Beziehung (15) (1/2) sofort die Darstellungsmatrix des Drehoperators Ru (α): (1/2)
Ru
cos 2α − iu z sin 2α (α) = ( (−iu x + u y ) sin 2α
(−iu x − u y ) sin
α 2
+ iu z sin
α 2
cos
α 2
)
(16)
worin u x , u y und u z die kartesischen Komponenten des Vektors u sind.
2-b Operator für die Drehung um den Winkel 2π Nehmen wir für den Drehwinkel α den Wert 2π, so entspricht die räumliche Drehung Ru (2π) für jeden beliebigen Vektor u der Identität. Setzen wir jedoch in Gl. (15) α = 2π, so finden wir (S)
Ru (2π) = −1
(17)
•
996 | Ergänzung AIX
während (S)
Ru (0) = 1
(18)
gilt. Der zu einer Drehung um den Winkel 2π gehörende Operator ist nicht der Iden titätsoperator, sondern sein Negatives. Beim Zusammenhang zwischen den geometri schen Drehungen und den Drehoperatoren in HS bleibt die Gruppeneigenschaft daher nur lokal erhalten (s. die Diskussion in Ergänzung BVI , Bemerkung 3 in § 3-c-γ). Dies ist eine Folge des halbzahligen Spindrehimpulses. Die Tatsache, dass der Spinzustand bei einer Drehung um den Winkel 2π sein Vor zeichen wechselt, ist nicht problematisch, da zwei Zustandsvektoren, die sich nur um einen globalen Phasenfaktor unterscheiden, dieselben physikalischen Eigenschaften haben. Wichtiger ist die Untersuchung, wie sich eine Observable A bei einer solchen Drehung verhält. Es ist leicht zu zeigen, dass gilt A =
(S)
Ru (2π) A
(S) † Ru (2π)
=A
(19)
Dieses Ergebnis ist zufriedenstellend, da eine Drehung um 2π die zu A gehörige Mess vorrichtung nicht verändern kann. Das Spektrum von A bleibt also dasselbe wie das von A. Bemerkung: Wir zeigten in Ergänzung BVI (Bemerkung 3 in § 3-c-γ), dass gilt (r)
R u (2π) = 1
(20)
Im gesamten Zustandsraum H = Hr ⊗ HS gilt daher wie in HS R u (2π) =
(r)
R u (2π) ⊗
(S)
R u (2π) = −1
(21)
2-c Vektorcharakter von S und Spinzustand bei Drehungen Wir betrachten einen beliebigen Spinzustand |χ⟩. In Kapitel IV (§ B-1-c) zeigten wir, dass es Winkel θ und φ so geben muss, dass |χ⟩ (bis auf einen globalen Phasenfaktor, der ohne physikalische Bedeutung ist) als θ θ |+⟩ + eiφ/2 sin |−⟩ (22) 2 2 geschrieben werden kann; |χ⟩ erscheint dann als Eigenvektor mit dem Eigenwert +ℏ/2 zur Komponente S ⋅ v des Spins S in Richtung des durch die Polarwinkel θ und φ de finierten Einheitsvektors v. Wir führen nun eine beliebige Drehung des Zustands |χ⟩ aus; v sei das Ergebnis der Anwendung dieser Drehung auf v. Da S eine vektorielle Ob servable ist, muss der Zustand |χ ⟩ nach der Drehung Eigenvektor mit dem Eigenwert +ℏ/2 zur Komponente S⋅v von S entlang dem Einheitsvektor v sein (s. Ergänzung BVI , § 5), |χ⟩ = e−iφ/2 cos
|χ⟩ = |+⟩v
⇒
|χ ⟩ = R |χ⟩ ∝ |+⟩v
(23)
Drehoperatoren für ein Spin-1/2-Teilchen |
997
•
Abb. 1: Eine Drehung mit dem Winkel θ um u überführt den Vektor v = ez in den Einheitsvektor v mit den Polarwinkeln θ und φ.
mit v = R v
(24)
Wir beschränken uns auf einen speziellen Fall (s. Abb. 1). Für v wählen wir den Einheitsvektor ez der z-Achse und für v einen beliebigen Einheitsvektor mit den Po larwinkeln θ und φ. Man erhält v aus v = ez durch eine Drehung mit dem Winkel θ um den Einheitsvektor u, der durch die Polarwinkel θu =
π 2
φu = φ +
(25)
π 2
festgelegt ist. Wir müssen also zeigen, dass gilt (S)
Ru (θ) |+⟩ ∝ |+⟩v
(26)
Die kartesischen Komponenten des Vektors u sind u x = − sin φ
u y = cos φ
uz = 0
(27)
so dass der Operator (S)Ru (θ) mit Hilfe von Gl. (15) wie folgt geschrieben werden kann: (S)
θ θ − iσ ⋅ u sin 2 2 θ θ = cos − i(−σ x sin φ + σ y cos φ) sin 2 2 θ θ 1 = cos − (σ + e−iφ − σ − eiφ ) sin 2 2 2
Ru (θ) = cos
(28)
mit σ ± = σ x ± iσ y
(29)
•
998 | Ergänzung AIX
Wir wissen nun, dass gilt [s. Kapitel IX, Ausdrücke (B-7)] σ + |+⟩ = 0
(30)
σ − |+⟩ = 2 |−⟩ Das Ergebnis der Transformation des Ketvektors |+⟩ durch den Operator daher (S)
Ru (θ) |+⟩ = cos
(S)R
θ θ |+⟩ + eiφ sin |−⟩ 2 2
u (θ)
ist
(31)
und wir erkennen bis auf einen Phasenfaktor den Ketvektor |+⟩v [s. Gl. (22)], (S)
Ru (θ) |+⟩ = eiφ/2 |+⟩v
(32)
3 Drehung zweikomponentiger Spinoren Wir sind nun in der Lage, das globale Verhalten eines Spin-1/2-Teilchens unter Dre hungen zu untersuchen, d. h. wir wollen sowohl die externen als auch die internen Freiheitsgrade berücksichtigen. Wir betrachten ein Spin-1/2-Teilchen, dessen Zustand durch den Ketvektor |ψ⟩ des Zustandsraums H = Hr ⊗ HS gegeben ist; |ψ⟩ kann durch den Spinor [ψ](r) mit den beiden Komponenten ψ ε (r) = ⟨r, ε | ψ⟩
(33)
dargestellt werden. Führen wir eine beliebige geometrische Drehung R mit diesem Teilchen aus, so transformiert sich sein Zustand in |ψ ⟩ = R |ψ⟩
(34)
worin R=
(r)
R⊗
(S)
R
(35)
der in H zu der geometrischen Drehung R gehörende Operator ist. Wie erhält man nun aus [ψ](r) den zum Zustand |ψ ⟩ gehörenden Spinor [ψ ](r)? Um diese Frage zu beantworten, sehen wir uns die Komponenten ψε (r) von [ψ ] an: ψε (r) = ⟨r, ε | ψ ⟩ = ⟨r, ε | R | ψ⟩
(36)
Wir können die Komponenten von [ψ](r) erhalten, indem wir die Vollständigkeitsre lation der {|r , ε ⟩}-Basis zwischen R und |ψ⟩ einfügen: ψε (r) = ∑ ∫ d3 r ⟨r, ε | R | r , ε ⟩⟨r , ε | ψ⟩ ε
(37)
Drehoperatoren für ein Spin-1/2-Teilchen | 999
•
Da die Vektoren der {|r, ε⟩}-Basis Tensorprodukte sind, können jetzt die Matrixelemen te des Operators R in dieser Basis in der folgenden Weise zerlegt werden: ⟨r, ε | R | r , ε ⟩ = ⟨r |
(r)
R | r ⟩⟨ε |
(S)
R | ε ⟩
(38)
Wir wissen bereits [s. Ergänzung BVI , Gl. (26)], dass gilt ⟨r |
(r)
R | r ⟩ = ⟨R−1 r | r ⟩ = δ [r − (R−1 r)]
(39)
Setzen wir ⟨ε |
(1/2)
(S)
R | ε ⟩ = R εε
(40)
so lautet Gl. (37) schließlich (1/2)
ψε (r) = ∑ ε R εε ψ ε (R−1 r)
(41)
ε
das ist ausgeschrieben (
ψ+ (r) ψ− (r)
(1/2)
)=(
R++
(1/2)
R−+
(1/2)
R+−
(1/2)
R−−
)(
ψ+ (R−1 r) ) ψ− (R−1 r)
(42)
Wir erhalten somit das folgende Ergebnis: Jede Komponente des neuen Spinors [ψ ] im Punkt r ist eine Linearkombination der beiden Komponenten des ursprüngli chen Spinors [ψ] im Punkt R−1 r (das ist der Punkt, den die Drehung auf r abbildet)¹. Die Koeffizienten dieser Linearkombinationen sind die Elemente der 2 × 2-Matrix, die (S)R in der {|+⟩, |−⟩}-Basis von H darstellt [s. Gl. (16)]. S
Referenzen und Literaturhinweise Feynman, Bd. 5 (1.2), Kap. 6, § 18–4 und Anmerkung 1 in Kap. 18; Messiah (1.17), An hang C; Edmonds (2.21), Kap. 4. Drehgruppe und SU(2): Bacry (10.31), Kap. 6; Wigner (2.23), Kap. 15; Meijer und Bauer (2.18), Kap. 5. Experiment zur Rotation eines Spins 1/2: Artikel von Werner et al. (11.18).
1 Man beachte die enge Analogie zwischen diesem Verhalten und dem eines Vektorfeldes bei Drehun gen.
•
1000 | Ergänzung BIX
Ergänzung BIX Aufgaben 1. Wir betrachten ein Spin-1/2-Teilchen mit dem Spin S, dem Bahndrehimpuls L und dem Zustandsvektor |ψ⟩. Die beiden Funktionen ψ+ (r) und ψ− (r) werden definiert durch ψ± (r) = ⟨r, ± | ψ⟩ Man nehme an, dass gilt ψ+ (r) = R(r) [Y00 (θ, φ) + ψ− (r) =
1 1 Y (θ, φ)] √3 0
R(r) 1 [Y 1 (θ, φ) − Y 01 (θ, φ)] √3
worin r, θ, φ die Koordinaten des Teilchens und R(r) eine gegebene Funktion sind. a) Welche Bedingung muss R(r) erfüllen, damit |ψ⟩ normiert ist? b) An dem Teilchen im Zustand |ψ⟩ wird S z gemessen. Welche Ergebnisse werden mit welchen Wahrscheinlichkeiten erhalten? Dieselbe Frage beantworte man für L z und S x . c) Eine Messung von L2 am Teilchen im Zustand |ψ⟩ ergibt den Wert null. In wel chem Zustand befindet sich das Teilchen unmittelbar nach dieser Messung? Man beantworte dieselbe Frage, wenn die Messung für L2 den Wert 2ℏ2 ergeben hätte. 2. Wir betrachten ein Spin-1/2-Teilchen. Mit P und S werden die Observablen be zeichnet, die zu seinem Impuls und seinem Spin gehören. Als Basis des Zustands raums wählen wir die Orthonormalbasis {|p x , p y , p z , ±⟩} von gemeinsamen Eigenvek toren zu P x , P y , P z und S z (mit den Eigenwerten p x , p y , p z bzw. ±ℏ/2). Wir wollen die Eigenwertgleichung des Operators A lösen, der definiert ist durch A =S⋅P a) Ist A hermitesch? b) Man zeige, dass es eine Basis von Eigenvektoren von A gibt, die ebenfalls Eigen vektoren von P x , P y , P z sind. Wie lautet die A darstellende Matrix in dem Unter raum, der durch die Ketvektoren |p x , p y , p z , ±⟩ mit den festen Werten p x , p y , p z aufgespannt wird? c) Wie lauten die Eigenwerte von A, und wie sind sie entartet? Man suche ein System von gemeinsamen Eigenvektoren zu A und P x , P y , P z . 3. Der Pauli-Hamilton-Operator Der Hamilton-Operator eines Elektrons mit der Masse m, der Ladung q und dem Spin ℏ 2 σ (σ x , σ y , σ z : Pauli-Matrizen), das sich in einem durch das Vektorpotential A(r, t) https://doi.org/10.1515/9783110638769-007
Aufgaben |
1001
•
und das skalare Potential U(r, t) beschriebenen elektromagnetischen Feld befindet, lautet H=
qℏ 1 σ ⋅ B(R, t) [P − qA(R, t)] 2 + qU(R, t) − 2m 2m
qℏ Der letzte Term stellt die Wechselwirkung zwischen dem magnetischen Moment 2m σ des Spins und dem magnetischen Feld B(R, t) = ∇ × A(R, t) dar. Man zeige unter Verwendung der Eigenschaften der Pauli-Matrizen, dass dieser Hamilton-Operator auch in der Form (Pauli-Hamilton-Operator)
H=
1 {σ ⋅ [P − qA(R, t)]}2 + qU(R, t) 2m
geschrieben werden kann. 4. Wir wollen die Reflexion eines monoenergetischen Neutronenstrahls untersuchen, der senkrecht auf ein ferromagnetisches Material trifft. Die x-Achse liege in Richtung des Einfallstrahls, und die y, z-Ebene bilde die Oberfläche des ferromagnetischen Ma terials, das die gesamte x > 0-Region ausfülle (s. Abbildung). Jedes einfallende Neu tron habe die Energie E und die Masse m. Der Spin der Neutronen sei s = 1/2 und ihr magnetisches Moment M = γS (γ ist das gyromagnetische Verhältnis und S der Spin-Operator).
–
–
Die potentielle Energie des Neutrons ist die Summe aus zwei Termen: Der erste beschreibt die Wechselwirkung mit den Atomkernen des Materials. Er wird phänomenologisch dargestellt durch ein Potential V(x), das durch V(x) = 0 für x ≤ 0, V(x) = V0 > 0 für x > 0 definiert ist. Der zweite Term entspricht der Wechselwirkung des magnetischen Moments eines Elektrons mit dem inneren Magnetfeld B0 des Materials (B0 wird als homogen und parallel zur z-Achse angenommen). Es ist also W = 0 für x ≤ 0, W = ω0 S z für x > 0 (mit ω0 = −γB0 ). Wir beschränken uns in dieser Aufgabe auf den Fall 0
0-Region ist V(x) gleich V0 , und die Wellenfunktionen verhalten sich, abhängig von den relativen Werten von E und V0 ± ℏω0 /2, wie oszillierende oder fal lende Exponentialfunktionen. Wir betrachten drei Fälle: 1. Für E > V0 + ℏω0 /2 setzen wir k ± = √
2m ℏω0 (E − V0 ∓ ) 2 ℏ2
(8)
und die transmittierte Welle verhält sich wie eine oszillierende Exponentialfunk tion,
φ±E (x) = C± eik± x
für x > 0
(9)
Aus den Stetigkeitsbedingungen für die Wellenfunktion und deren Ableitung folgt außerdem [s. Ergänzung HI , Gl. (13) und Gl. (14)] B± k − k ± = A± k + k ± 2.
C± 2k = A± k + k ±
(10)
Für E < V0 − ℏω0 /2 müssen wir die Größen ρ ± einführen: ρ± = √
2m ℏω0 (V0 ± − E) 2 ℏ2
(11)
und die Welle in der x > 0-Region ist eine reelle, fallende Exponentialfunktion, φ±E (x) = D± e−ρ± x
für x > 0
(12)
wobei in diesem Fall [s. Ergänzung HI , Gl. (22) und Gl. (23)] B± k − iρ ± = A± k + iρ ±
D± 2k = A± k + iρ ±
(13)
•
1004 | Ergänzung BIX
3.
Für den dazwischen liegenden Fall V0 − ℏω0 /2 < E < V0 + ℏω0 /2 erhalten wir schließlich φ+E (x) = D+ e−ρ+ x
für x > 0
(14a)
ik− x
für x > 0
(14b)
φ−E (x)
= C− e
[k − und ρ + werden weiter durch die Definitionen (8) und (11) gegeben]. Abhängig von der Orientierung des Spins ist die Welle entweder eine abfallende oder eine oszillierende Exponentialfunktion. Wir erhalten dann B+ k − iρ + = A+ k + iρ +
D+ 2k = A+ k + iρ +
(15a)
B− k − k − = A− k + k −
C− 2k = A− k + k −
(15b)
b) Die Voraussetzung V0 − ℏω0 /2 < E < V0 + ℏω0 /2 entspricht dem vorstehenden Fall 3. Wenn für das einfallende Neutron die Spinprojektion auf die z-Achse gleich ℏ/2 ist, so ist der zugehörige Reflexionskoeffizient gleich B 2 k − iρ 2 + + R+ = = =1 A+ k + iρ +
(16)
Wenn hingegen die Projektion des Spins auf die z-Achse gleich −ℏ/2 ist, hat der Refle xionskoeffizient nicht länger den Wert eins, da er gegeben wird durch 2 B 2 k − k − − ) V0 + ℏω0 /2 sehen wir aus (10), dass B+ und B− reell sind. Die Gleichun gen (23) zeigen dann, dass ⟨S x ⟩ und ⟨S z ⟩ nicht verschwinden, wohl aber ⟨S z ⟩ = 0 gilt. Bei der Reflexion des Neutrons ist der Spin daher um die y-Achse gedreht worden. Physikalisch erklärt der unterschiedliche Reflexionsgrad von Neutronen mit Spin parallel oder antiparallel zur z-Richtung, warum die Komponente ⟨S z ⟩ positiv wird.
•
1006 | Ergänzung BIX
2.
Für E < V0 − ℏω0 /2 zeigen die Gleichungen (13), dass B+ und B− nicht reell sind; vielmehr sind es zwei komplexe Zahlen mit unterschiedlichen Phasen aber glei chem Betrag. Mit den Ausdrücken (23) erhalten wir in diesem Fall ⟨S z ⟩ = 0, aber ⟨S x ⟩ ≠ 0 und ⟨S y ⟩ ≠ 0. Bei der Reflexion des Neutrons wird der Spin daher um die z-Achse gedreht. Der physikalische Grund für diese Rotation ist folgender: Auf grund der Existenz der abfallenden, in das Material eindringenden Welle hält sich das Neutron eine gewisse Zeitspanne in der x > 0-Region auf; die Larmor-Präzes sion um B0 , die es während dieser Zeit erfährt, verursacht die Drehung seines Spins. Für V0 − ℏω0 /2 < E < V0 + ℏω0 /2 ist B+ komplex, während B− reell ist, auch ihre Beträge sind verschieden. Keine Spinkomponente ⟨S x ⟩, ⟨S y ⟩ oder ⟨S z ⟩ ver schwindet dann. Die Drehung des Spins bei der Reflexion des Neutrons ist somit eine Kombination der in Fall 1 und 2 erläuterten Effekte.
3.
X Addition von Drehimpulsen A A-1 A-2 B B-1 B-2 B-3 B-4 C C-1 C-2 C-3 C-4
Einleitung | 1007 Gesamtdrehimpuls in der klassischen Mechanik | 1007 Gesamtdrehimpuls in der Quantenmechanik | 1008 Addition zweier Spins 1/2 | 1011 Problemstellung | 1011 Die Eigenwerte von S z und ihre Entartungen | 1014 Diagonalisierung von S2 | 1014 Ergebnisse: Triplett und Singulett | 1016 Addition von zwei beliebigen Drehimpulsen | 1017 Wiederholung der allgemeinen Theorie | 1017 Problemstellung | 1018 Eigenwerte von J 2 und J z | 1021 Gemeinsame Eigenvektoren von J 2 und J z | 1026
A Einleitung A-1 Gesamtdrehimpuls in der klassischen Mechanik Wir betrachten ein System von N klassischen Teilchen. Der Gesamtdrehimpuls 𝓛 die ses Systems in Bezug auf einen festen Punkt O ist gleich der Vektorsumme der einzel nen Drehimpulse der N Teilchen in Bezug auf diesen Punkt O: N
𝓛 = ∑ 𝓛i
(A-1)
i=1
mit 𝓛i = ri × pi
(A-2)
Die Zeitableitung von 𝓛 ist gleich dem von den äußeren Kräften in Bezug auf O er zeugten Drehmoment. Wenn also die äußeren Kräfte verschwinden (isoliertes System) oder wenn sie alle auf ein Zentrum hin gerichtet sind, ist der Gesamtdrehimpuls des Systems (bezogen auf einen beliebigen Punkt im ersten und bezogen auf das Kraftzen trum im zweiten Fall) eine Konstante der Bewegung. Für die einzelnen Drehmomente 𝓛i trifft das beim Vorhandensein innerer Kräfte, d. h. wenn die verschiedenen Teil chen des Systems miteinander wechselwirken, nicht zu. Wir wollen uns dies an einem Beispiel klarmachen: Betrachten wir ein System aus zwei Teilchen (1) und (2), die dem gleichen zentralen Kraftfeld unterliegen (das man sich durch ein drittes Teilchen mit so großer Masse erzeugt denken kann, dass es im Ursprung ruht). Wenn die beiden Teilchen keine Kraft aufeinander ausüben, sind ihre Drehimpulse 𝓛1 und 𝓛2 in Bezug auf das Kraftzentrum O Konstanten der Bewegung. Die einzige Kraft, der dann z. B. Teilchen (1) ausgesetzt ist, wirkt in Rich tung von O; ihr Drehmoment in Bezug auf diesen Punkt ist daher null und somit auch https://doi.org/10.1515/9783110638769-008
1008 | X Addition von Drehimpulsen d dt
𝓛1 . Unterliegt jedoch Teilchen (1) auch einer von Teilchen (2) ausgehenden Kraft, deren Drehmoment bezüglich O im Allgemeinen nicht verschwindet, so ist 𝓛1 keine Konstante der Bewegung. Weil aber die Wechselwirkung zwischen den beiden Teil chen dem Prinzip von Aktion und Reaktion genügt, kompensiert das Drehmoment der von (1) auf (2) wirkenden Kraft bezüglich O gerade das Drehmoment der von (2) auf (1) wirkenden: Der Gesamtdrehimpuls 𝓛 bleibt erhalten. In einem System wechselwirkender Teilchen ist daher nur der Gesamtdrehimpuls eine Konstante der Bewegung; Kräfte innerhalb des Systems bewirken einen Übertrag des Drehimpulses von einem Teilchen auf das andere. Wir sehen also, warum eine Untersuchung der Eigenschaften des Gesamtdrehimpulses sinnvoll ist.
A-2 Gesamtdrehimpuls in der Quantenmechanik Wir behandeln nun das vorhergehende Beispiel quantenmechanisch: Im Fall von zwei nicht wechselwirkenden Teilchen wird der Hamilton-Operator des Systems in der {|r1 , r2 ⟩}-Darstellung durch H = H1 + H2
(A-3)
gegeben mit H1 = −
ℏ2 ∆1 + V(r1 ) 2μ1
ℏ2 H2 = − ∆2 + V(r2 ) 2μ2
(A-4)
[μ 1 und μ2 sind die Massen der beiden Teilchen, V(r) ist das Zentralpotential, dem sie unterliegen, und ∆1 und ∆2 bezeichnen die Laplace-Operatoren, bezogen auf die Ko ordinaten des Teilchens (1) bzw. (2)]. Wie wir aus Kap. VII, § A-2-a wissen, vertauschen die drei Komponenten des Operators L1 , der dem Drehimpuls 𝓛1 des Teilchens (1) zugeordnet ist, mit H1 : [L1 , H1 ] = 0
(A-5)
Außerdem vertauschen alle Observablen des einen Teilchens mit allen Observablen des anderen Teilchens; insbesondere ist [L1 , H2 ] = 0
(A-6)
Gleichung (A-5) und Gl. (A-6) entnehmen wir, dass die drei Komponenten von L1 Kon stanten der Bewegung sind. Natürlich gilt eine entsprechende Argumentation auch für L2 . Wir nehmen nun an, dass die beiden Teilchen miteinander wechselwirken und dass die zugehörige potentielle Energie v(|r1 − r2 |) nur von ihrem relativen Abstand
A Einleitung
|
1009
|r1 − r2 | abhängt:¹ |r1 − r2 | = √(x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2
(A-7)
In diesem Fall lautet der Hamilton-Operator des Systems H = H1 + H2 + v(|r1 − r2 |)
(A-8)
wobei H1 und H2 durch die Gleichungen (A-4) gegeben sind. Nach Gl. (A-5) und Gl. (A-6) reduziert sich der Kommutator von L1 und H auf [L1 , H] = [L1 , v(|r1 − r2 |)]
(A-9)
was z. B. für die Komponente L1z heißt [L1z , H] = [L1z , v(|r1 − r2 |)] =
∂v ∂v ℏ − y1 ) (x1 i ∂y1 ∂x1
(A-10)
Der Ausdruck (A-10) verschwindet im Allgemeinen nicht; L1 ist keine Konstante der Bewegung mehr. Definieren wir allerdings den Gesamtdrehimpulsoperator L durch ei nen Ausdruck ähnlich Gl. (A-1), L = L1 + L2
(A-11)
so erhalten wir einen Operator, dessen drei Komponenten Konstanten der Bewegung sind. Zum Beispiel haben wir [L z , H] = [L1z + L2z , H]
(A-12)
Nach Gl. (A-10) ist dieser Kommutator gleich [L z , H] = [L1z + L2z , H] =
ℏ ∂v ∂v ∂v ∂v − y1 + x2 − y2 ) (x1 i ∂y1 ∂x1 ∂y2 ∂x2
(A-13)
Da aber v nur von |r1 − r2 | abhängt [Gl. (A-7)], finden wir ∂|r1 − r2 | x1 − x2 ∂v = v = v ∂x1 ∂x1 |r1 − r2 | ∂v ∂|r1 − r2 | x2 − x1 =v =v ∂x2 ∂x2 |r1 − r2 |
(A-14a) (A-14b)
∂v ∂v ∂v ∂v , ∂y , ∂z und ∂z (v ist die gewöhnliche Ableitung und analoge Ausdrücke für ∂y 1 2 1 2 von v). Setzen wir diese Werte in Gl. (A-13) ein, so erhalten wir
[L z , H] =
ℏ v {x1 (y1 − y2 ) − y1 (x1 − x2 ) + x2 (y2 − y1 ) − y2 (x2 − x1 )} i |r1 − r2 |
=0
(A-15)
also dasselbe Ergebnis wie in der klassischen Mechanik.
1 Die zugehörige klassische Kraft erfüllt dann automatisch das Prinzip von Aktion gleich Reaktion.
1010 | X Addition von Drehimpulsen
Bis jetzt haben wir der Einfachheit halber angenommen, dass die betrachteten Teilchen keinen Spin haben. Wir untersuchen nun ein anderes wichtiges Beispiel: ein einzelnes Teilchen mit Spin. Zunächst nehmen wir an, dass es nur einem Zen tralpotential V(r) unterliegt. Sein Hamilton-Operator entspricht dann dem bereits in Kap. VII, § A untersuchten; wir wissen, dass die drei Komponenten des Bahndreh impulses L mit diesem Hamilton-Operator vertauschen. Außerdem sind, da die Spin operatoren mit den Bahnobservablen kommutieren, auch die drei Komponenten des Spins S Konstanten der Bewegung. Wie wir jedoch in Kapitel XII sehen werden, führen relativistische Korrekturen auf einen Zusatzterm im Hamilton-Operator, einen SpinBahn-Kopplungsterm von der Form HSB = ξ(r)L ⋅ S
(A-16)
worin ξ(r) eine bekannte Funktion nur der Variablen r ist (die physikalische Bedeu tung dieser Kopplung werden wir in Kapitel XII erläutern). Zieht man diesen Term mit in Betracht, so vertauschen L und S nicht mehr mit dem vollständigen Hamilton-Ope rator. Zum Beispiel gilt² [L z , HSB ] = ξ(r) [L z , L x S x + L y S y + L z S z ] = ξ(r)(iℏL y S x − iℏL x S y )
(A-17)
und analog [S z , HSB ] = ξ(r) [S z , L x S x + L y S y + L z S z ] = ξ(r)(iℏL x S y − iℏL y S x )
(A-18)
Setzen wir jedoch J= L+S
(A-19)
so sind die drei Komponenten von J Konstanten der Bewegung. Um das zu sehen, ad dieren wir Gl. (A-17) und Gl. (A-18): [J z , HSB ] = [L z + S z , HSB ] = 0
(A-20)
(ein analoger Beweis kann für die anderen Komponenten von J gegeben werden). Der in Gl. (A-19) definierte Operator wird als der Gesamtdrehimpuls eines Teilchens mit Spin bezeichnet. In den beiden gerade beschriebenen Fällen hatten wir jeweils zwei Teildrehimpul se J1 und J2 , die miteinander vertauschen. Wir kennen eine Basis des Zustandsraums, die von gemeinsamen Eigenzuständen von J21 , J 1z , J22 , J 2z gebildet wird; J1 und J2 sind jedoch keine Konstanten der Bewegung, während die Komponenten des Gesamtdreh impulses J = J1 + J2
(A-21)
2 Um Gl. (A-17) und Gl. (A-18) zu erhalten, benutzt man die Vertauschbarkeit von L, das nur auf die Winkelvariablen θ und φ wirkt, mit ξ(r), das nur von r abhängt.
B Addition zweier Spins 1/2 |
1011
mit dem Hamilton-Operator des Systems vertauschen. Wir werden daher versuchen, aus der alten Basis eine neue Basis von Eigenvektoren von J2 und J z zu konstruieren. Das Problem, das dabei auftritt, ist die Addition (oder Zusammensetzung) von zwei Drehimpulsen J1 und J2 . Die Bedeutung dieser aus Eigenvektoren von J2 und J z gebildeten Basis ist leicht einzusehen: Um die stationären Zustände eines Systems, d. h. die Eigenzustände von H, zu bestimmen, fällt es leichter, die Matrix zu diagonalisieren, die H in dieser neuen Basis darstellt. Weil H mit J2 und J z vertauscht, kann diese Matrix in so viele Blöcke zerlegt werden, wie es Eigenräume zu den verschiedenen Sätzen von Eigenwerten von J2 und J z gibt (s. Kap. II, § D-3-a). Ihre Struktur ist sehr viel einfacher als die der Matrix, die H in der Basis der gemeinsamen Eigenzustände von J21 , J 1z , J22 , J 2z darstellt, da im Allgemeinen weder J 1z noch J 2z mit H vertauschen. Für den Augenblick lassen wir das Problem der Diagonalisierung von H in der Basis von J2 und J z (ob exakt oder näherungsweise) beiseite und konzentrieren uns stattdessen auf die Konstruktion der neuen Basis aus den Eigenzuständen von J21 , J 1z , J22 , J 2z . Wir werden einige physikalische Anwendungen (Vielelektronen-Atome, Fein- und Hyperfeinstruktur usw.) behandeln, nachdem wir uns mit der Störungsthe orie befasst haben (s. Ergänzungen zu Kapitel XI und Kapitel XII). Wir beginnen (§ B) mit der elementaren Behandlung eines einfachen Falls, in dem die beiden zu addierenden Teildrehimpulse jeweils 1/2-Spins sind. Das erlaubt mit verschiedenen Aspekten des Problems vertraut zu werden, bevor wir in § C die Addi tion von zwei beliebigen Drehimpulsen behandeln.
B Addition zweier Spins 1/2. Elementare Methode B-1 Problemstellung Wir wollen ein System aus zwei Spin-1/2-Teilchen (z. B. Elektronen oder Silberatome im Grundzustand) betrachten und uns nur mit ihren Spinfreiheitsgraden befassen; S1 und S2 sind die Spinoperatoren dieser beiden Teilchen. B-1-a Zustandsraum Den Zustandsraum eines solchen Systems haben wir bereits definiert: Es handelt sich um einen vierdimensionalen Raum, der sich aus dem Tensorprodukt der einzelnen Spinzustände der beiden Teilchen ergibt. Eine Orthonormalbasis dieses Raums, die wir mit {|ε1 , ε2 ⟩} bezeichnen wollen, kennen wir bereits; sie lautet explizit {|ε1 , ε2 ⟩} = {|+, +⟩, |+, −⟩, |−, +⟩, |−, −⟩}
(B-1)
Diese Vektoren sind Eigenzustände der vier Observablen S21 , S1z , S22 , S2z (bei denen es sich um Erweiterungen auf den Tensorproduktraum von ursprünglich in den einzel
1012 | X Addition von Drehimpulsen
nen Spinräumen definierten Operatoren handelt): S21 |ε1 , ε2 ⟩ = S22 |ε1 , ε2 ⟩ =
3 2 ℏ |ε1 , ε2 ⟩ 4
ℏ |ε1 , ε2 ⟩ 2 ℏ S2z |ε1 , ε2 ⟩ = ε2 |ε1 , ε2 ⟩ 2
S1z |ε1 , ε2 ⟩ = ε1
(B-2a) (B-2b) (B-2c)
Die Operatoren S21 , S1z , S22 und S2z bilden einen V. S. K. O. (die ersten beiden Observa blen sind dabei Vielfache des Einheitsoperators, und das System bleibt auch ohne sie vollständig). B-1-b Gesamtspin S. Vertauschungsrelationen Der Gesamtspin S des Systems wird definiert durch S = S1 + S2
(B-3)
Da S1 und S2 Drehimpulse sind, kann man dasselbe auch für S zeigen. Zum Beispiel können wir den Kommutator von S x und S y berechnen: [S x , S y ] = [S1x + S2x , S1y + S2y ] = [S1x , S1y ] + [S2x , S2y ] = iℏ S1z + iℏ S2z = iℏ S z
(B-4)
Den Operator S2 erhält man, indem man das (skalare) Quadrat von Gl. (B-3) bildet, S2 = (S1 + S2 )2 = S21 + S22 + 2S1 ⋅ S2
(B-5)
da S1 und S2 vertauschen. Das Skalarprodukt S1 ⋅ S2 kann mit Hilfe der Operatoren S1± , S1z und S2± , S2z ausgedrückt werden; man zeigt leicht S1 ⋅ S2 = S1x S2x + S1y S2y + S1z S2z 1 = (S1+ S2− + S1− S2+ ) + S1z S2z 2
(B-6)
Da S1 und S2 beide mit S21 und S22 vertauschen, gilt dies auch für die drei Kompo nenten von S. Insbesondere vertauschen S2 und S z mit S21 und S22 : [S2 , S21 ] = [S2 , S22 ] = 0
(B-7a)
[S z , S21 ]
(B-7b)
=
[S z , S22 ]
=0
Außerdem vertauscht S z offensichtlich mit S1z und S2z : [S z , S1z ] = [S z , S2z ] = 0
(B-8)
B Addition zweier Spins 1/2 | 1013
Dagegen vertauscht S2 weder mit S1z noch mit S2z , da nach Gl. (B-5) gilt [S2 , S1z ] = [S21 + S22 + 2S1 ⋅ S2 , S1z ] = 2 [S1 ⋅ S2 , S1z ] = 2 [S1x S2x + S1y S2y , S1z ] = 2iℏ(−S1y S2x + S1x S2y )
(B-9)
[diese Rechnung entspricht der in Gl. (A-17) und Gl. (A-18)]. Der Kommutator von S2 und S2z ist natürlich entgegengesetzt gleich dem obigen, so dass S z = S1z + S2z mit S2 vertauscht. B-1-c Basiswechsel Die Basis (B-1) ist, wie wir gesehen haben, aus gemeinsamen Eigenvektoren des V. S. K. O. {S21 , S22 , S1z , S2z }
(B-10)
aufgebaut. Daneben haben wir gerade gezeigt, dass auch die vier Observablen S21 , S22 , S2 , S z
(B-11)
paarweise vertauschen, und wir werden im Folgenden sehen, dass auch sie einen V. S. K. O. bilden. Die Zusammensetzung der beiden Spins S1 und S2 bedeutet, ein Orthonormalsys tem von gemeinsamen Eigenvektoren zur Observablenmenge (B-11) zu konstruieren. Dieses System wird von der Basis (B-1) verschieden sein, weil S2 nicht mit S1z und S2z vertauscht. Wir wollen die Vektoren der neuen Basis |S, M⟩ nennen, wobei die Eigen werte von S21 und S22 (die sich nicht verändern) implizit enthalten sind. Die Vektoren |S, M⟩ erfüllen also die Gleichungen 3 2 ℏ |S, M⟩ 4 S2 |S, M⟩ = S(S + 1)ℏ2 |S, M⟩
(B-12b)
S z |S, M⟩ = Mℏ |S, M⟩
(B-12c)
S21 |S, M⟩ = S22 |S, M⟩ =
(B-12a)
Wie wir wissen, ist S ein Drehimpuls. Also muss S positiv ganz oder halbzahlig sein und M in ganzzahligen Schritten zwischen −S und +S laufen. Man muss daher die Werte von S und M finden, die tatsächlich auftreten können, und die entsprechenden Basisvektoren |S, M⟩ in der bekannten Basis ausdrücken. In diesem Abschnitt wollen wir uns darauf beschränken, diese Aufgabe durch die elementare Methode der Berechnung und Diagonalisierung der 4 × 4-Matrizen zu lö sen, die die Operatoren S2 und S z in der {|ε1 , ε2 ⟩}-Basis darstellen. In § C werden wir eine andere, etwas elegantere Methode verwenden und sie für zwei beliebige Drehim pulse verallgemeinern.
1014 | X Addition von Drehimpulsen B-2 Die Eigenwerte von S z und ihre Entartungen Die Observablen S21 und S22 sind leicht zu behandeln: Alle Vektoren des Zustands raums sind Eigenvektoren von S21 und S22 zum selben Eigenwert 3ℏ2 /4. Also ist Gl. (B-12a) automatisch für alle Ketvektoren |S, M⟩ erfüllt. Wir haben bereits festgestellt [Gleichungen (B-7) und (B-8)], dass S z mit den vier Observablen des V. S. K. O. (B-10) vertauscht. Wir erwarten daher, dass die Basisvek toren {|ε1 , ε2 ⟩} auch Eigenvektoren von S z sind. Tatsächlich können wir mit Hilfe der Gleichungen (B-2b) und (B-2c) zeigen, dass S z |ε1 , ε2 ⟩ = (S1z + S2z ) |ε1 , ε2 ⟩ =
1 (ε1 + ε2 )ℏ |ε1 , ε2 ⟩ 2
(B-13)
|ε1 , ε2 ⟩ ist also Eigenzustand von S z mit dem Eigenwert M=
1 (ε1 + ε2 ) 2
(B-14)
Da ε1 und ε2 jeweils gleich ±1 sein können, kann also M die Werte −1, 0 und +1 an nehmen. Die Werte M = 1 und M = −1 sind nichtentartet. Zu ihnen gehört jeweils nur ein Eigenvektor: einmal |+, +⟩ und zum anderen |−, −⟩. Der Wert M = 0 hingegen ist zweifach entartet: Zu ihm gehören zwei orthogonale Eigenvektoren |+, −⟩ und |−, +⟩. Jede Linearkombination dieser beiden Vektoren ist Eigenzustand von S z zum Eigen wert null. Diese Ergebnisse lassen sich sofort an der Matrix, die S z in der {|ε1 , ε2 ⟩}-Basis darstellt, ablesen. Wählen wir die Basiszustände in der in Gl. (B-1) angegebenen Rei henfolge, so lautet die Matrix 1 0 (S z ) = ℏ ( 0 0
0 0 0 0
0 0 0 0
0 0 ) 0 −1
(B-15)
B-3 Diagonalisierung von S2 Wir müssen nun die Darstellungsmatrix von S2 in der {|ε1 , ε2 ⟩}-Basis bestimmen und diagonalisieren. Wir wissen im Voraus, dass sie nicht diagonal ist, weil S2 nicht mit S1z und S2z vertauscht. B-3-a Berechnung der Darstellungsmatrix von S2 Wir wenden S2 auf jeden Basisvektor an; dazu beachten wir Gl. (B-5) und Gl. (B-6): S2 = S21 + S22 + 2S1z S2z + S1+ S2− + S1− S2+
(B-16)
B Addition zweier Spins 1/2 | 1015
Die vier Vektoren |ε1 , ε2 ⟩ sind Eigenvektoren von S21 , S22 , S1z und S2z [Beziehun gen (B-2)], und die Wirkung der Operatoren S1± und S2± erhalten wir aus den Bezie hungen (B-7) des Kapitels IX: 3 3 1 S2 |+, +⟩ = ( ℏ2 + ℏ2 ) |+, +⟩ + ℏ2 |+, +⟩ 4 4 2 = 2ℏ2 |+, +⟩ (B-17a) 3 3 1 S2 |+, −⟩ = ( ℏ2 + ℏ2 ) |+, −⟩ − ℏ2 |+, −⟩ + ℏ2 |−, +⟩ 4 4 2 = ℏ2 [|+, −⟩ + |−, +⟩] (B-17b) 1 3 3 S2 |−, +⟩ = ( ℏ2 + ℏ2 ) |−, +⟩ − ℏ2 |−, +⟩ + ℏ2 |+, −⟩ 4 4 2 = ℏ2 [|−, +⟩ + |+, −⟩] (B-17c) 1 3 3 S2 |−, −⟩ = ( ℏ2 + ℏ2 ) |−, −⟩ + ℏ2 |−, −⟩ 4 4 2 = 2ℏ2 |−, −⟩ (B-17d) Die Matrix, die S2 in der Basis der vier Vektoren |ε1 , ε2 ⟩ in der in Gl. (B-1) angege benen Reihenfolge darstellt, lautet also 2 0 (S2 ) = ℏ2 ( 0 0
0 1 1 0
0 1 1 0
0 0 ) 0 2
(B-18)
Bemerkung: Die Nullen, die in dieser Matrix auftauchen, waren zu erwarten: S2 vertauscht mit S z , und man erhält daher nichtverschwindende Matrixelemente nur zwischen Eigenvektoren von S z mit dem selben Eigenwert. Nach § B-2 sind die einzigen Nichtdiagonalelemente von S2 , die von null ver schieden sein können, diejenigen, die |+, −⟩ und |−, +⟩ verknüpfen.
B-3-b Eigenwerte und Eigenvektoren von S2 Die Matrix (B-18) kann in drei Untermatrizen aufgeteilt werden. Zwei von ihnen sind eindimensional: Die Vektoren |+, +⟩ und |−, −⟩ sind Eigenvektoren von S2 , wie sich auch aus den Beziehungen (B-17) ersehen lässt; die zugehörigen Eigenwerte sind je weils gleich 2ℏ2 . Wir müssen jetzt die 2 × 2-Untermatrix (S2 )0 = ℏ2 (
1 1
1 ) 1
(B-19)
diagonalisieren, die S2 in dem von |+, −⟩ und |−, +⟩ aufgespannten zweidimensio nalen Unterraum, das ist der Eigenraum zum Eigenwert M = 0 von S z , darstellt. Die Eigenwerte λℏ2 der Matrix (B-19) erhält man als Lösungen der charakteristischen Gleichung (1 − λ)2 − 1 = 0
(B-20)
1016 | X Addition von Drehimpulsen Die Wurzeln dieser Gleichung sind λ = 0 und λ = 2; die beiden letzten Eigenwerte von S2 sind also 0 bzw. 2ℏ2 . Eine elementare Rechnung ergibt die entsprechenden Eigenvektoren: 1 [|+, −⟩ + |−, +⟩] √2 1 [|+, −⟩ − |−, +⟩] √2
für den Eigenwert 2ℏ2
(B-21a)
für den Eigenwert 0
(B-21b)
(sie sind natürlich nur bis auf einen globalen Phasenfaktor definiert; die Koeffizienten 1/√2 stellen die Normierung sicher). Der Operator S2 besitzt also zwei verschiedene Eigenwerte: 0 und 2ℏ2 . Der erste ist nichtentartet und gehört zu (B-21b). Der zweite ist dreifach entartet, und die Vektoren |+, +⟩, |−, −⟩ und (B-21a) bilden eine Orthonormalbasis des zugehörigen Eigenraums.
B-4 Ergebnisse: Triplett und Singulett Somit haben wir sowohl die Eigenwerte von S2 und S z als auch ein System von ge meinsamen Eigenvektoren zu diesen beiden Observablen gefunden. Wir fassen die Ergebnisse noch einmal in der Notation von der Gleichungen (B-12) zusammen: Die Quantenzahl S in (B-12b) kann zwei Werte annehmen: null und eins. Der erste gehört zu einem einzigen Vektor, dem Vektor (B-21b). Er ist Eigenvektor von S z mit dem Eigenwert null, da es sich um eine Linearkombination von |+, −⟩ und |−, +⟩ handelt; wir bezeichnen diesen Vektor daher mit |0, 0⟩, |0, 0⟩ =
1 [|+, −⟩ − |−, +⟩] √2
(B-22)
Zu S = 1 gehören drei Vektoren, die sich durch die Werte von M unterscheiden: |1, 1⟩ = |+, +⟩ 1 |1, 0⟩ = [|+, −⟩ + |−, +⟩] √2
(B-23)
|1, −1⟩ = |−, −⟩ Man kann leicht zeigen, dass die Vektoren (B-22) und (B-23) eine Orthonormalba sis bilden. Die Festlegung von Werten für S und M bestimmt eindeutig einen Vektor dieser Basis. Daraus lässt sich zeigen, dass S2 und S z einen V. S. K. O. bilden (dem man auch S21 und S22 hinzufügen könnte, was hier allerdings nicht nötig ist). Wenn also zwei Spins 1/2 (s1 = s2 = 1/2) addiert werden, kann die Zahl S, die den Eigenwert S(S + 1)ℏ2 der Observablen S2 bestimmt, entweder den Wert 0 oder den Wert 1 annehmen. Zu jedem dieser beiden Werte von S gehört eine Familie von (2S +1) orthogonalen Vektoren (drei für S = 1, einer für S = 0), entsprechend den (2S + 1) mit S verträglichen Werten von M.
C Addition von zwei beliebigen Drehimpulsen | 1017
Bemerkungen: 1. Die Familie (B-23) der drei Vektoren |1, M⟩ (M = 1, 0, −1) bildet ein sogenanntes Triplett; der Vektor |0, 0⟩ ist ein Singulettzustand. 2. Die Triplettzustände sind symmetrisch unter dem Austausch von zwei Spins, während der Sin gulettzustand antisymmetrisch ist. Das bedeutet: Ersetzt man jeden Vektor |ε 1 , ε 2 ⟩ durch den Vektor |ε 2 , ε 1 ⟩, bleiben die Ausdrücke (B-23) invariant, während der Vektor (B-22) das Vorzeichen wechselt. In Kapitel XIV werden wir die Bedeutung dieser Eigenschaft sehen, wenn die beiden Teilchen, deren Spins addiert werden, identisch sind. Außerdem hilft sie die richtige Linearkom bination von |+, −⟩ und |−, +⟩ zu finden, die |+, +⟩ und |−, −⟩ (natürlich symmetrisch) zugeordnet werden muss, um das Triplett zu vervollständigen. Der Singulettzustand hingegen ist die anti symmetrische Linearkombination von |+, −⟩ und |−, +⟩, die zur obigen orthogonal ist.
C Addition von zwei beliebigen Drehimpulsen. Allgemeine Methode C-1 Wiederholung der allgemeinen Theorie Wir betrachten ein beliebiges System mit dem Zustandsraum H und mit einem Dreh impuls J (J kann ein Teildrehimpuls oder der Gesamtdrehimpuls des Systems sein). In Kapitel VI, § C-3 haben wir gezeigt, dass es immer möglich ist, eine Standardba sis {|k, j, m⟩}, die sich aus gemeinsamen Eigenzuständen von J2 und J z zusammen setzt, J2 |k, j, m⟩ = j(j + 1)ℏ2 |k, j, m⟩
(C-1a)
J z |k, j, m⟩ = mℏ |k, j, m⟩
(C-1b)
so zu konstruieren, dass die Wirkung der Operatoren J+ und J − durch J± |k, j, m⟩ = ℏ√j(j + 1) − m(m ± 1) |k, j, m ± 1⟩
(C-2)
gegeben wird. Mit H(k, j) bezeichnen wir den Vektorraum, der durch die Menge der Vektoren mit festen Werten von k und j aufgespannt wird. Es gibt (2j + 1) davon, und nach den Gleichungen (C-1) und (C-2) können sie durch J2 , J z , J+ und J − inein ander transformiert werden. Man kann den Zustandsraum als direkte Summe von or thogonalen Unterräumen H(k, j) auffassen, die die folgenden Eigenschaften besit zen: 1. H(k, j) ist (2j + 1)-dimensional. 2. H(k, j) ist global invariant unter der Wirkung von J2 , J z , J± und allgemeiner jeder Funktion F(J). Anders ausgedrückt haben diese Operatoren nur innerhalb eines Unterraums H(k, j) nichtverschwindende Matrixelemente. 3. Innerhalb des Unterraums H(k, j) sind die Matrixelemente jeder Funktion F(J) des Drehimpulses J unabhängig von k.
1018 | X Addition von Drehimpulsen
Bemerkung: Wie wir bereits in Kapitel VI, § C-3-a festgestellt haben, können wir dem Index k eine konkrete physikalische Bedeutung zuordnen, indem wir als Standardbasis ein System von gemeinsamen Eigenvektoren zu J2 , J z und einer oder mehreren Observablen wählen, die mit den drei Kompo nenten von J vertauschen und zusammen einen V. S. K. O. bilden. Wenn z. B. [A, J] = 0
(C-3)
gilt und die Menge {A, J2 , J z } einen V. S. K. O. bildet, so verlangen wir, dass die Vektoren |k, j, m⟩ Eigenvektoren von A sind: A |k, j, m⟩ = a k,j |k, j, m⟩
(C-4)
Die Beziehungen (C-1), (C-2) und (C-4) bestimmen in diesem Fall die Standardbasis {|k, j, m⟩}. Jeder Raum H(k, j) ist ein Eigenraum von A, und der Index k beziffert die verschiedenen Eigen werte a k,j , die zu jedem Wert von j gehören.
C-2 Problemstellung C-2-a Zustandsraum Wir betrachten ein aus zwei Untersystemen gebildetes physikalisches System (z. B. ein Zweiteilchen-System). Wir verwenden die Indizes 1 und 2 zur Bezeichnung der sich auf die beiden Untersysteme beziehenden Größen. Wir nehmen an, uns wäre eine Standardbasis {|k 1 , j1 , m1 ⟩} aus gemeinsamen Eigenvektoren von J21 und J1z im Zustandsraum H1 des Untersystems (1) bekannt, wobei J1 der Drehimpulsoperator des Untersystems (1) ist: J21 |k 1 , j1 , m1 ⟩ = j1 (j1 + 1)ℏ2 |k 1 , j1 , m1 ⟩
(C-5a)
J 1z |k 1 , j1 , m1 ⟩ = m1 ℏ |k 1 , j1 , m1 ⟩
(C-5b)
J 1± |k 1 , j1 , m1 ⟩ = ℏ√j1 (j1 + 1) − m1 (m1 ± 1) |k 1 , j1 , m1 ± 1⟩
(C-5c)
Analog wird der Zustandsraum H2 des Untersystems (2) durch eine Standardbasis {|k 2 , j2 , m2 ⟩} aufgespannt: J22 |k 2 , j2 , m2 ⟩ = j2 (j2 + 1)ℏ2 |k 2 , j2 , m2 ⟩
(C-6a)
J2z |k 2 , j2 , m2 ⟩ = m2 ℏ |k 2 , j2 , m2 ⟩
(C-6b)
J 2± |k 2 , j2 , m2 ⟩ = ℏ√j2 (j2 + 1) − m2 (m2 ± 1) |k 2 , j2 , m2 ± 1⟩
(C-6c)
Der Zustandsraum des Gesamtsystems ist das Tensorprodukt aus H1 und H2 : H = H1 ⊗ H 2
(C-7)
Wir kennen eine Basis des Gesamtsystems, nämlich das Tensorprodukt der in H1 bzw. in H2 gewählten Basen. Die Vektoren dieser Basis bezeichnen wir mit |k 1 , k 2 ; j1 , j2 ; m1 , m2 ⟩: |k 1 , k 2 ; j1 , j2 ; m1 , m2 ⟩ = |k 1 , j1 , m1 ⟩ ⊗ |k 2 , j2 , m2 ⟩
(C-8)
C Addition von zwei beliebigen Drehimpulsen | 1019
Die Räume H1 und H2 können als direkte Summen der Unterräume H1 (k 1 , j1 ) bzw. H2 (k 2 , j2 ), die die in § C-1 wiederholten Eigenschaften haben, angesehen werden: H1 = ∑ H1 (k 1 , j1 )
(C-9a)
H2 = ∑ H2 (k 2 , j2 )
(C-9b)
⊕ ⊕
Folglich ist H die direkte Summe der Unterräume H(k 1 , k 2 ; j1 , j2 ), die die Tensorpro dukte eines Raums H1 (k 1 , j1 ) mit einem Raum H2 (k 2 , j2 ) sind: H = ∑ H(k 1 , k 2 ; j1 , j2 )
(C-10)
H(k 1 , k 2 ; j1 , j2 ) = H1 (k 1 , j1 ) ⊗ H2 (k 2 , j2 )
(C-11)
⊕
mit
Die Dimension des Unterraums H(k 1 , k 2 ; j1 , j2 ) ist (2j1 + 1)(2j2 + 1). Dieser Unterraum ist global invariant unter der Wirkung irgendeiner Funktion von J1 und J2 (J1 und J2 bezeichnen hier die Erweiterungen der ursprünglich in H1 bzw. H2 definierten Dreh impulsoperatoren auf H). C-2-b Gesamtdrehimpuls. Vertauschungsrelationen Der Gesamtdrehimpuls des betrachteten Systems ist definiert durch J = J1 + J2
(C-12)
wobei J1 und J2 , die Erweiterungen der in den verschiedenen Räumen H1 bzw. H2 wirkenden Operatoren, vertauschen. Natürlich erfüllen die Komponenten von J1 und J2 jeweils für sich die charakteristischen Drehimpulsvertauschungsrelationen. Man kann zeigen, dass diese Relationen auch von den Komponenten von J erfüllt werden [die Rechnung ist dieselbe wie in Gl. (B-4)]. Da sowohl J1 als auch J2 jeweils mit J21 und J22 vertauschen, gilt dies auch für J. Insbesondere vertauschen J2 und J z mit J21 und J22 : [J z , J21 ] = [J z , J22 ] = 0 [J
2
, J21 ]
2
= [J
, J22 ]
(C-13a)
=0
(C-13b)
Außerdem vertauschen J 1z und J2z offensichtlich mit J z , [J 1z , J z ] = [J 2z , J z ] = 0
(C-14)
jedoch nicht mit J2 , da dieser Operator als Funktion von J1
und J2 ausgedrückt werden
kann, J2 = J21 + J22 + 2J1 ⋅ J2 und [s. Gl. (B-9)] J 1z und J2z nicht mit J1 ⋅ J2 vertauschen. wir auch schreiben J2 = J21 + J22 + 2J 1z J 2z + J 1+ J 2− + J 1− J 2+
(C-15) Den Ausdruck für J2
können (C-16)
1020 | X Addition von Drehimpulsen
C-2-c Basiswechsel Ein Vektor |k 1 , k 2 ; j1 , j2 ; m1 , m2 ⟩ der Basis (C-8) ist ein gemeinsamer Eigenzustand der Observablen J21 , J22 , J 1z , J 2z
(C-17)
mit den Eigenwerten j1 (j1 + 1)ℏ2 , j2 (j2 + 1)ℏ2 , m1 ℏ bzw. m2 ℏ. Die Wahl der Basis (C-8) ist für die Untersuchung der einzelnen Drehimpulse J1 und J2 der beiden Teilsysteme besonders geeignet. Nach den Gleichungen (C-13) vertauschen auch die Observablen J21 , J22 , J2 , J z
(C-18)
paarweise. Wir werden ein Orthonormalsystem aus gemeinsamen Eigenzuständen dieser Observablen konstruieren: Diese neue Basis eignet sich vor allem für die Unter suchung des Gesamtdrehimpulses des Systems. Sie wird sich von der vorhergehenden unterscheiden, da J2 mit J1z und J2z nicht vertauscht (s. vorheriger Abschnitt). Bemerkung: Um den Indizes k1 und k2 eine physikalische Bedeutung zu geben, nehmen wir an (Bemerkung in § C-1), wir würden einen V. S. K. O. in H1 , {A 1 , J21 , J1z }, kennen, worin A 1 mit den drei Kompo nenten von J1 vertauscht, und ebenso einen V. S. K. O. in H2 , {A 2 , J22 , J2z }, worin A 2 mit den drei Komponenten von J2 vertauscht. Als Standardbasis {|k1 , j 1 , m 1 ⟩} können wir das Orthonormal system von gemeinsamen Eigenvektoren zu A 1 , J21 und J1z wählen, und entsprechend als Stan dardbasis {|k2 , j 2 , m 2 ⟩} das Orthonormalsystem von gemeinsamen Eigenvektoren zu A 2 , J22 und J2z . Die Menge {A 1 , A 2 ; J21 , J22 ; J1z , J2z }
(C-19)
bildet dann einen V. S. K. O. in H, dessen Eigenvektoren die Ketvektoren (C-8) sind. Da die Observable A 1 mit den Komponenten von J1 und J2 vertauscht, vertauscht sie ebenso mit J und insbe sondere mit J2 und J z . Dasselbe gilt natürlich auch für A 2 . Folglich vertauschen die Observablen A 1 , A 2 , J21 , J22 , J2 , J z
(C-20)
paarweise. Wir werden sehen, dass sie sogar einen V. S. K. O. bilden; die neue Basis, die wir zu finden versuchen, ist das Orthonormalsystem von Eigenvektoren dieses V. S. K. O.
Der in Gl. (C-11) definierte Unterraum H(k 1 , k 2 ; j1 , j2 ) ist global invariant unter der Wir kung von allen Operatoren, die Funktionen von J1 und J2 und damit auch des Gesamt drehimpulses J sind. Es folgt, dass die Observablen J2 und J z , die wir diagonalisieren wollen, nur zwischen Vektoren aus demselben Unterraum H(k 1 , k 2 ; j1 , j2 ) nichtver schwindende Matrixelemente haben. Die (im Allgemeinen unendlichdimensionalen) Darstellungsmatrizen von J2 und J z in der Basis (C-8) sind „blockdiagonal“, d. h. sie können in eine Reihe von Untermatrizen aufgespalten werden, die jeweils zu einem bestimmten Unterraum H(k 1 , k 2 ; j1 , j2 ) gehören. Das Problem reduziert sich folglich auf einen Basiswechsel innerhalb dieser einzelnen Unterräume H(k 1 , k 2 ; j1 , j2 ), die von endlicher Dimension (2j1 + 1)(2j2 + 1) sind.
C Addition von zwei beliebigen Drehimpulsen | 1021
Außerdem sind die Matrixelemente in der Basis (C-8) jeder Funktion von J1 und J2 unabhängig von k 1 und k 2 , was daher auch für die Matrixelemente von J2 und J z gilt. Das Problem der Diagonalisierung von J2 und J z ist daher in allen Unterräumen H(k 1 , k 2 ; j1 , j2 ), die zu denselben Werten von j1 und j2 gehören, dasselbe. Aus diesem Grund spricht man üblicherweise von der Addition der Drehimpulse j1 und j2 , ohne die anderen Quantenzahlen zu spezifizieren. Zur Vereinfachung der Notation werden wir daher im Folgenden die Indizes k 1 und k 2 weglassen. Den Unterraum H(k 1 , k 2 ; j1 , j2 ) bezeichnen wir mit H(j1 , j2 ), und die Vektoren der Basis (C-8), die zu diesem Unter raum gehören, mit |j1 , j2 ; m1 , m2 ⟩: H(j1 , j2 ) ≡ H(k 1 , k 2 ; j1 , j2 )
(C-21a)
|j1 , j2 ; m1 , m2 ⟩ ≡ |k 1 , k 2 ; j1 , j2 ; m1 , m2 ⟩
(C-21b)
Da J ein Drehimpuls und H(j1 , j2 ) global invariant unter der Wirkung einer Funktion von J ist, sind die oben (§ C-1) wiederholten Ergebnisse des Kapitels VI anwendbar. Folglich ist H(j1 , j2 ) eine direkte Summe von orthogonalen Unterräumen H(k, J), die alle unter der Wirkung von J2 , J z , J + und J − global invariant sind: H(j1 , j2 ) = ∑ H(k, J)
(C-22)
⊕
Es bleiben also die folgenden zwei Probleme: 1. Wie lauten bei gegebenen Werten von j1 und j2 die Werte von J, die in Gl. (C-22) auftauchen, und wie viele verschiedene Unterräume H(k, J) gehören jeweils zu ihnen? 2. Wie können die zu H(j1 , j2 ) gehörenden Eigenwerte von J2 und J z in der {|j1 , j2 ; m1 , m2 ⟩}-Basis entwickelt werden? Die beiden Fragen werden wir in § C-3 bzw. § C-4 beantworten. Bemerkungen: 1. Wir haben J1 und J2 als Drehimpulse von zwei verschiedenen Unterräumen eingeführt. Zum Beispiel (§ A-2) werden wir daran interessiert sein, den Bahn- und den Spindrehimpuls desselben Teilchens zu addieren. Alle Überlegungen und Ergebnisse dieses Abschnitts sind auf diesen Fall anwendbar, indem man einfach H1 und H2 durch Hr und HS ersetzt. 2. Um mehrere Drehimpulse zu addieren, addiert man zunächst die ersten beiden, zum Ergebnis davon den dritten usw., bis der letzte addiert worden ist.
C-3 Eigenwerte von J 2 und J z C-3-a Spezieller Fall mit zwei Spins 1/2 Betrachten wir zunächst noch einmal das einfachere, in § B behandelte Problem. Die Räume H1 und H2 enthalten in diesem Fall nur je einen invarianten Unterraum, und der Tensorproduktraum H dementsprechend einen einzigen Unterraum H(j1 , j2 ), für den j1 = j2 = 1/2 gilt.
1022 | X Addition von Drehimpulsen
Mit den in § C-1 wiederholten Ergebnissen lassen sich die Werte der zum Gesamt spin gehörenden Quantenzahl S leicht finden: Der Raum H = H(1/2, 1/2) muss die direkte Summe von (2S + 1)-dimensionalen Unterräumen H(k, S) sein. Jeder Unter raum enthält einen Eigenvektor von S z , und jedem Wert von M mit |M| ≤ S entspricht jeweils genau ein Vektor. Wir wissen aber (s. § B-2), dass M nur die Werte 1, −1 und 0 annehmen kann, wobei die ersten beiden nichtentartet und der dritte zweifach entar tet ist. Daraus können wir die folgenden Schlüsse ziehen: 1. Werte von S größer als eins sind ausgeschlossen. Damit z. B. S = 2 möglich wäre, müsste es mindestens einen Eigenvektor von S z mit dem Eigenwert 2ℏ geben. 2. Der Wert S = 1 tritt auf (weil dasselbe für M = 1 gilt), und zwar nur einmal: M = 1 ist nichtentartet. 3. Dasselbe gilt für S = 0. Der durch S = 1 gegebene Unterraum enthält nur einen Vektor mit M = 0, und dieser Wert von M ist im Raum H(1/2, 1/2) zweifach ent artet. Der vierdimensionale Raum H(1/2, 1/2) kann daher in einen zu S = 1 gehörenden (dreidimensionalen) Unterraum und einen zu S = 0 gehörenden (eindimensionalen) Unterraum aufgespaltet werden. Mit einer analogen Überlegung werden wir nun die möglichen Werte von J für beliebige j 1 und j2 bestimmen. C-3-b Eigenwerte von J z und ihre Entartungen Im Anschluss an die Ergebnisse in § C-2-c betrachten wir einen wohldefinierten Un terraum H(j1 , j2 ) der Dimension (2j1 + 1)(2j2 + 1). Wir nehmen an, j1 und j2 seien so gewählt, dass j1 ≥ j2
(C-23)
Die Vektoren |j1 , j2 ; m1 , m2 ⟩ sind bereits Eigenzustände von J z , J z |j1 , j2 ; m1 , m2 ⟩ = (J 1z + J 2z ) |j1 , j2 ; m1 , m2 ⟩ = (m1 + m2 )ℏ |j1 , j2 ; m1 , m2 ⟩
(C-24)
und für die entsprechenden Eigenwerte Mℏ gilt M = m1 + m2
(C-25)
Also kann M die Werte annehmen j1 + j2 , j1 + j2 − 1 , j1 + j2 − 2 , . . . , −(j1 + j2 )
(C-26)
Um die Entartungen g j1 ,j2 (M) dieser Werte zu finden, können wir die folgende geo metrische Konstruktion verwenden: In einem zweidimensionalen Diagramm ordnen wir jedem Vektor |j1 , j2 ; m1 , m2 ⟩ den Punkt mit der Abszisse m1 und der Ordinate m2
C Addition von zwei beliebigen Drehimpulsen |
1023
zu. Alle Punkte liegen innerhalb oder auf dem Rand eines Rechtecks mit den Ecken (j1 , j2 ), (j1 , −j2 ), (−j1 , −j2 ) und (−j1 , j2 ). In Abb. 1 sind die fünfzehn zu den Basisvek toren für j1 = 2 und j2 = 1 gehörenden Punkte dargestellt (die Werte von m1 und m2 werden neben jedem Punkt angegeben). Alle Punkte, die sich auf derselben ge strichelten Linie (der Steigung −1) befinden, haben denselben Wert von M = m1 + m2 . Die Anzahl dieser Punkte ist also gleich der Entartung g j1 ,j2 (M) dieses Wertes von M.
Abb. 1: Paare möglicher Werte (m 1 , m 2 ) für die Ketvektoren |j 1 , j 2 ; m 1 , m 2 ⟩. Es ist der Fall j 1 = 2 und j 2 = 1 dargestellt. Die Punkte, die zu einem vorgegebenen Wert von M = m 1 + m 2 gehören, befinden sich auf einer geraden Linie der Steigung −1 (gestrichelte Linien).
Wir betrachten nun die verschiedenen Werte von M in absteigender Folge, indem wir die durch sie definierten Linien verfolgen (Abb. 1): M = j1 + j2 ist nichtentartet, da die zugehörige Linie nur die obere rechte Ecke mit den Koordinaten (j1 , j2 ) trifft: g j1 ,j2 (j1 + j2 ) = 1
(C-27)
M = j1 + j2 − 1 ist zweifach entartet, da die zugehörige Linie die Punkte (j1 , j2 − 1) und (j1 − 1, j2 ) trifft, g j1 ,j2 (j1 + j2 − 1) = 2
(C-28)
Die Entartung vergrößert sich also um eins, wenn M um eins kleiner wird, bis die un tere rechte Ecke des Rechtecks (m 1 = j1 , m2 = −j2 ), d. h. der Wert M = j1 − j2 erreicht ist. Die Anzahl der Punkte auf einer Linie erreicht dann ein Maximum und ist g j1 ,j2 (j1 − j2 ) = 2j2 + 1
(C-29)
Wenn M unter j1 − j2 fällt, bleibt g j1 ,j2 (M) zunächst gleich seinem maximalen Wert, solange die zu M gehörende Linie die gesamte Höhe des Rechtecks durchmisst, d. h. bis sie die obere linke Ecke des Rechtecks (m1 = −j1 , m2 = j2 ) trifft, g j1 ,j2 (M) = 2j2 + 1 für − (j1 − j2 ) ≤ M ≤ j1 − j2
(C-30)
1024 | X Addition von Drehimpulsen Für M kleiner als −(j1 − j2 ) schließlich schneidet die entsprechende Linie die obere horizontale Seite des Rechtecks nicht mehr, und g j1 ,j2 (M) nimmt so wie M um eins ab und erreicht für M = −(j1 + j2 ) wieder den Wert eins (untere linke Ecke des Rechtecks). Folglich gilt g j1 ,j2 (−M) = g j1 ,j2 (M)
(C-31)
Diese Ergebnisse sind für j1 = 2 und j2 = 1 in Abb. 2 zusammengefasst, in der g2,1 (M) als Funktion von M aufgetragen ist.
Abb. 2: Entartung g j1 ,j2 (M) als Funktion von M. Wie in Abb. 1 zeigen wir den Fall j 1 = 2 und j 2 = 1. Die Entartung g j1 ,j2 (M) erhält man einfach durch Abzählen der Punkte auf der entsprechenden gestrichelten Linie in Abb. 1.
C-3-c Eigenwerte von J 2 Wir stellen zunächst fest, dass die Werte (C-26) von M alle ganzzahlig sind, wenn j1 und j2 beide ganz- oder halbzahlig sind, bzw. halbzahlig, wenn einer von ihnen ganzund der andere halbzahlig ist. Ebenso werden die entsprechenden Werte von J im ers ten Fall alle ganz- und im zweiten Fall alle halbzahlig sein. Da der maximale von M angenommene Wert gleich j1 + j2 ist, findet sich in H(j1 , j2 ) kein größerer Wert von J als j1 + j2 , und dementsprechend taucht auch in der direkten Summe (C-22) kein solcher Wert auf. Zu J = j1 + j2 gehört genau ein invarian ter Unterraum (da M = j1 + j2 existiert und nichtentartet ist). In diesem Unterraum H(J = j1 + j2 ) gibt es genau einen Vektor, der zu M = j1 + j2 − 1 gehört; dieser Wert von M ist in H(j1 , j2 ) zweifach entartet, der Wert J = j1 + j2 − 1 tritt daher ebenfalls auf und ihm entspricht ein invarianter Unterraum H(J = j1 + j2 − 1). Wir bezeichnen nun allgemeiner die Anzahl der zu einem gegebenen Wert von J gehörenden Unterräume H(k, J) von H(j1 , j2 ) mit p j1 ,j2 (J), das ist die Anzahl der ver schiedenen Werte von k für diesen Wert von J (j1 und j2 waren von Beginn an fest gelegt); p j1 ,j2 (J) und g j1 ,j2 (M) hängen auf einfache Weise zusammen: Betrachten wir einen bestimmten Wert von M, so gehört zu ihm in jedem Unterraum H(k, J) genau ein Vektor mit J ≥ |M|. Seine Entartung g j1 ,j2 (M) in H(j1 , j2 ) lässt sich dann wie folgt
C Addition von zwei beliebigen Drehimpulsen |
1025
schreiben: g j1 ,j2 (M) = p j1 ,j2 (J = |M|) + p j1 ,j2 (J = |M| + 1) + p j1 ,j2 (J = |M| + 2) + . . .
(C-32)
Umgekehrt erhalten wir p j1 ,j2 (J) in Abhängigkeit von g j1 ,j2 (M): p j1 ,j2 (J) = g j1 ,j2 (M = J) − g j1 ,j2 (M = J + 1) = g j1 ,j2 (M = −J) − g j1 ,j2 (M = −J − 1)
(C-33)
Mit den Ergebnissen des vorhergehenden Unterabschnitts können wir nun die in H(j1 , j2 ) tatsächlich auftretenden Werte der Quantenzahl J und die Anzahl der zu ihnen gehörenden invarianten Unterräume H(k, J) leicht bestimmen. Zunächst gilt offensichtlich p j1 ,j2 (J) = 0 für J > j1 + j2
(C-34)
da g j1 ,j2 (M) für |M| > j1 + j2 verschwindet. Außerdem folgt aus Gl. (C-27) und Gl. (C-28) p j1 ,j2 (J = j1 + j2 ) = g j1 ,j2 (M = j1 + j2 ) = 1 p j1 ,j2 (J = j1 + j2 − 1) = g j1 ,j2 (M = j1 + j2 − 1) − g j1 ,j2 (M = j1 + j2 ) = 1
(C-35a) (C-35b)
Durch Iteration finden wir so alle Werte p j1 ,j2 (J): p j1 ,j2 (J = j1 + j2 − 2) = 1 , . . . , p j1 ,j2 (J = j1 − j2 ) = 1
(C-36)
und schließlich mit Gl. (C-30) p j1 ,j2 (J) = 0 für j < j1 − j2
(C-37)
Bei festen Werten von j1 und j2 , d. h. in einem gegebenen Raum H(j1 , j2 ), sind also die Eigenwerte von J2 die, für die J = j1 + j2 , j1 + j2 − 1 , j1 + j2 − 2 , . . . , |j1 − j2 |
(C-38)
ist.³ Zu jedem Wert gehört ein einziger invarianter Unterraum H(J), so dass der in Gl. (C-22) auftauchende Index k überflüssig ist. Das heißt insbesondere, dass es zu einem festen Wert J aus der Menge (C-38) und einem zugehörigen Wert von M genau einen Vektor in H(j1 , j2 ) gibt: Eine Wahl von J bestimmt den Unterraum H(J), in dem dann die Festlegung von M genau einen Vektor definiert. Anders ausgedrückt bilden also J2 und J z einen V. S. K. O. in H(j1 , j2 ).
3 Bisher haben wir immer j 1 ≥ j 2 angenommen; natürlich lassen sich die Überlegungen sofort auf den Fall j 1 < j 2 erweitern: Es müssen nur die Indizes 1 und 2 vertauscht werden.
1026 | X Addition von Drehimpulsen
Bemerkung: Man kann zeigen, dass die Anzahl der Paare (J, M) in H(j 1 , j 2 ) tatsächlich gleich der Dimension (2j 1 + 1)(2j 2 + 1) dieses Raums ist. Diese Zahl ist (für j 1 ≥ j 2 ) gleich j1 +j2
∑ (2J + 1)
(C-39)
J=j1 −j2
Setzen wir J = j1 − j2 + i
(C-40)
so lässt sich die Summe (C-39) leicht berechnen: j1 +j2
2j2
J=j1 −j2
i=0
∑ (2J + 1) = ∑ [2(j 1 − j 2 + i) + 1] = [2(j 1 − j 2 ) + 1] (2j 2 + 1) + 2
2j 2 (2j 2 + 1) 2
= (2j 2 + 1)(2j 1 + 1)
(C-41)
C-4 Gemeinsame Eigenvektoren von J 2 und J z Mit |J, M⟩ wollen wir die zum Raum H(j1 , j2 ) gehörenden gemeinsamen Eigenvektoren von J2 und J z bezeichnen. Um genau zu sein, müßten wir in dieser Notation noch die Werte von j1 und j2 zufügen. Wir verzichten jedoch auf deren explizite Angabe, da es dieselben sind wie bei den Vektoren (C-21b) und |J, M⟩ eine Linearkombination dieser Vektoren ist. Die Indizes J und M bezeichnen natürlich die Eigenwerte von J2 und J z , J2 |J, M⟩ = J(J + 1)ℏ2 |J, M⟩
(C-42a)
J z |J, M⟩ = Mℏ |J, M⟩
(C-42b)
und die Vektoren |J, M⟩ sind wie alle Vektoren des Raums H(j1 , j2 ) Eigenvektoren von J21 und J22 mit den Eigenwerten j1 (j1 + 1)ℏ2 bzw. j2 (j2 + 1)ℏ2 . C-4-a Spezieller Fall mit zwei Spins 1/2 Zunächst werden wir zeigen, wie man mit Hilfe der allgemeinen Ergebnisse für Dreh impulse auf den in § B-3 erhaltenen Ausdruck für die Vektoren |S, M⟩ geführt wird. Man braucht dafür die Matrix, die S2 darstellt, nicht zu diagonalisieren. In Verallge meinerung dieser Methode werden wir dann die Vektoren |J, M⟩ für den Fall beliebiger j1 und j2 konstruieren. α Der Unterraum H(S = 1) Im Zustandsraum H = H(1/2, 1/2) ist der Ketvektor |+, +⟩ der einzige Eigenvektor von S z mit M = 1. Da S2 und S z vertauschen und der Wert M = 1 nichtentartet ist, ist |+, +⟩ auch Eigenvektor von S2 (§ D-3-a von Kapitel II). Nach § C-3-a muss der entsprechende
C Addition von zwei beliebigen Drehimpulsen |
1027
Wert von S gleich eins sein. Wir können also die Phase des Vektors |S = 1, M = 1⟩ so wählen, dass gilt |1, 1⟩ = |+, +⟩
(C-43)
Es ist dann leicht, die anderen Zustände des Tripletts zu finden, wissen wir doch aus der allgemeinen Theorie der Drehimpulse S− |1, 1⟩ = ℏ√1(1 + 1) − 1(1 − 1) |1, 0⟩ = ℏ√2 |1, 0⟩
(C-44)
1 S− |+, +⟩ ℏ√2
(C-45)
also |1, 0⟩ =
Um den Vektor |1, 0⟩ explizit in der Basis {|ε1 , ε2 ⟩} zu berechnen, erinnern wir uns, dass aus der Definition des Gesamtspins (B-3) folgt S− = S1− + S2−
(C-46)
damit erhalten wir 1 (S1− + S2− ) |+, +⟩ ℏ√2 1 = [ℏ |−, +⟩ + ℏ |+, −⟩] √ ℏ 2 1 = [|−, +⟩ + |+, −⟩] √2
|1, 0⟩ =
(C-47)
Schließlich können wir erneut S− auf |1, 0⟩, d. h. (S1− + S2− ) auf Gl. (C-47) anwenden. Das ergibt 1 S− |1, 0⟩ ℏ√2 1 1 = (S1− + S2− ) [|−, +⟩ + |+, −⟩] √2 ℏ√2 1 = [ℏ |−, −⟩ + ℏ |−, −⟩] 2ℏ = |−, −⟩
|1, −1⟩ =
(C-48)
Natürlich hätten wir dieses Ergebnis auch direkt erhalten können, indem wir eine ana loge Überlegung wie oben bei |+, +⟩ anwenden. Unsere Rechnung hat jedoch einen kleinen Vorteil: Sie ermöglicht es, in Übereinstimmung mit den allgemeinen Verein barungen aus § C-3-a von Kapitel VI die Phasenfaktoren, die in |1, 0⟩ und |1, −1⟩ auftreten können, in Bezug auf den in Gl. (C-43) für |1, 1⟩ gewählten festzulegen.
1028 | X Addition von Drehimpulsen β Der Zustand |S = 0, M = 0⟩ Der eine Vektor |S = 0, M = 0⟩ des Unterraums H(S = 0) wird bis auf einen konstanten Faktor durch die Bedingung festgelegt, dass er orthogonal zu den drei Vektoren |1, M⟩ ist, die wir soeben konstruiert haben. Da |0, 0⟩ orthogonal zu |1, 1⟩ = |+, +⟩ und |1, −1⟩ = |−, −⟩ ist, muss er eine Linear kombination von |+, −⟩ und |−, +⟩ sein: |0, 0⟩ = α |+, −⟩ + β |−, +⟩
(C-49)
dieser Vektor ist normiert für ⟨0, 0 | 0, 0⟩ = |α|2 + |β|2 = 1
(C-50)
Wir verlangen nun, dass sein Skalarprodukt mit |1, 0⟩ [s. Gl. (C-47)] gleich null ist: 1 (α + β) = 0 √2
(C-51)
Die Koeffizienten sind also ihrem Absolutwert nach gleich und von entgegengesetztem Vorzeichen. Mit Gl. (C-50) sind sie damit bis auf einen Phasenfaktor bestimmt, α = −β =
1 iχ e √2
(C-52)
worin χ eine beliebige reelle Zahl ist. Wir wählen χ = 0 und erhalten |0, 0⟩ =
1 [|+, −⟩ − |−, +⟩] √2
(C-53)
Wir haben also die vier Vektoren |S, M⟩ berechnet, ohne die Matrix, die S2 in der {|ε1 , ε2 ⟩}-Basis darstellt, explizit angeben zu müssen. C-4-b Allgemeiner Fall (beliebige j1 und j2 ) Wie wir in § C-3-c zeigten, kann H(j1 , j2 ) in folgender Weise in eine direkte Summe invarianter Unterräume H(J) zerlegt werden: H(j1 , j2 ) = H(j1 + j2 ) ⊕ H(j1 + j2 − 1) ⊕ ⋅ ⋅ ⋅ ⊕ H(|j1 − j2 |)
(C-54)
Wir wollen nun die Vektoren |J, M⟩ bestimmen, die diese Unterräume aufspannen. α Der Unterraum H(J = j1 + j2 ) In H(j1 , j2 ) ist |j1 , j2 ; m1 = j1 , m2 = j2 ⟩ der einzige Eigenvektor von J z zu M = j1 + j2 . Da J2 und J z vertauschen und der Wert M = j1 + j2 nichtentartet ist, ist |j1 , j2 ; m1 = j1 , m2 = j2 ⟩ auch Eigenvektor von J2 . Nach Gl. (C-54) kann der zugehörige Wert von J nur gleich j1 + j2 sein. Wir wählen die Phase des Vektors |J = j1 + j2 , M = j1 + j2 ⟩ so, dass gilt |j1 + j2 , j1 + j2 ⟩ = |j1 , j2 ; j1 , j2 ⟩
(C-55)
C Addition von zwei beliebigen Drehimpulsen | 1029
Durch die wiederholte Anwendung des Operators J − auf diesen Ausdruck können wir die Familie der Vektoren |J, M⟩ mit J = j1 + j2 vervollständigen. Nach den Glei chungen (C-50) aus Kapitel VI gilt J − |j1 + j2 , j1 + j2 ⟩ = ℏ√2(j1 + j2 ) |j1 + j2 , j1 + j2 − 1⟩
(C-56)
Wir können also den zu J = j1 + j2 und M = j1 + j2 − 1 gehörenden Vektor durch Anwendung des Operators J− = J 1− + J 2− auf den Vektor |j1 , j2 ; j1 , j2 ⟩ erhalten: |j1 + j2 , j1 + j2 − 1⟩ = = =
1 ℏ√2(j1 + j2 ) 1 ℏ√2(j1 + j2 ) 1 ℏ√2(j1 + j2 )
J − |j1 + j2 , j1 + j2 ⟩ (J 1− + J 2− ) |j1 , j2 ; j1 , j2 ⟩ [ℏ√2j1 |j1 , j2 ; j1 − 1, j2 ⟩ + ℏ√2j2 |j1 , j2 ; j1 , j2 − 1⟩]
(C-57)
d. h. |j1 + j2 , j1 + j2 − 1⟩ = √
j1 j2 |j1 , j2 ; j1 − 1, j2 ⟩ + √ |j1 , j2 ; j1 , j2 − 1⟩ (C-58) j1 + j2 j1 + j2
Wir erhalten auf diese Weise tatsächlich eine Linearkombination der beiden Basisvek toren, die zu M = j1 + j2 − 1 gehören, und diese Kombination ist bereits normiert. Nun wiederholen wir diesen Schritt: Wir konstruieren |j1 +j2 , j1 +j2 −2⟩, indem wir J − auf beide Seiten von Gl. (C-58) anwenden (für die rechte Seite nehmen wir diesen Operator in der Form J1− + J2− ) usw., bis wir den Vektor |j1 + j2 , −(j1 + j2 )⟩ erhalten, der gleich |j1 , j2 ; −j1 , −j2 ⟩ ist. Wir wissen nun, wie wir die ersten [2(j1 + j2 ) + 1] Vektoren der {|J, M⟩}-Basis be rechnen, die zu J = j1 + j2 und M = j1 + j2 , j1 + j2 − 1, . . . , −(j1 + j2 ) gehören und den Unterraum H(J = j1 + j2 ) von H(j1 , j2 ) aufspannen. β Die anderen Unterräume H(J) Wir betrachten nun den Raum S(j1 + j2 ), das ist die Ergänzung von H(j1 + j2 ) auf H(j1 , j2 ). Nach Gl. (C-54) kann S(j1 + j2 ) zerlegt werden in S(j1 +j2 ) = H(j1 +j2 −1) ⊕ H(j1 +j2 −2) ⊕ ⋅ ⋅ ⋅ ⊕ H(|j1 −j2 |)
(C-59)
Wir können also auf diesen Raum dieselbe Überlegung wie oben anwenden. In S(j1 + j2 ) ist die Entartung gj1 ,j2 (M) eines gegebenen Werts von M um eins klei ner als g j1 ,j2 (M), da es in H(j1 + j2 ) genau einen Vektor zu diesem Wert von M gibt, gj1 ,j2 (M) = g j1 ,j2 (M) − 1
(C-60)
1030 | X Addition von Drehimpulsen Das bedeutet insbesondere, dass der Wert M = j1 + j2 in S(j1 + j2 ) nicht mehr auftritt und dass der neue maximale Wert M = j1 + j2 − 1 nichtentartet ist. Darum muß der entsprechende Vektor zu |J = j1 + j2 − 1, M = j1 + j2 − 1⟩ proportional sein. Es ist leicht, seine Entwicklung in der {|j1 , j2 ; m1 , m2 ⟩}-Basis zu finden, da er aufgrund seines Werts von M sicher die Form |j1 +j2 −1, j1 +j2 −1⟩ = α |j1 , j2 ; j1 , j2 −1⟩ + β |j1 , j2 ; j1 −1, j2 ⟩
(C-61)
|α|2 + |β|2 = 1
(C-62)
mit
hat, um die Normierung sicherzustellen. Außerdem muss er orthogonal zu dem durch Gl. (C-58) gegebenen Vektor |j1 + j2 , j1 + j2 − 1⟩ sein, da dieser zu H(j1 + j2 ) gehört. Die Koeffizienten α und β müssen also die Gleichung α√
j2 j1 + β√ =0 j1 + j2 j1 + j2
(C-63)
erfüllen. Durch Gl. (C-62) und Gl. (C-63) werden α und β bis auf einen Phasenfaktor festgelegt. Wir wählen α und β reell und beispielsweise α positiv. Mit diesen Verein barungen gilt |j1 + j2 − 1, j1 + j2 − 1⟩ = √
j1 |j1 , j2 ; j1 , j2 − 1⟩ j1 + j2
−√
j2 |j1 , j2 ; j1 − 1, j2 ⟩ j1 + j2
(C-64)
Damit haben wir den ersten Vektor einer neuen Familie erhalten, die durch J = j1 + j2 − 1 charakterisiert wird. Wie oben können wir die anderen durch mehrfaches Anwenden von J − ableiten. Auf diese Weise erhalten wir [2(j1 + j2 − 1) + 1] Vektoren |J, M⟩ entsprechend den Werten J = j1 + j2 − 1 M = j1 + j2 − 1 , j1 + j2 − 2 , . . . , −(j1 + j2 − 1) die den Unterraum H(J = j1 + j2 − 1) aufspannen. Betrachten wir nun den Raum S(j1 + j2 , j1 + j2 − 1), das ist die Ergänzung der direkten Summe H(j1 + j2 ) ⊕ H(j1 + j2 − 1) auf H(j1 , j2 ):⁴ S(j1 + j2 , j1 + j2 − 1) = H(j1 + j2 − 2) ⊕ . . . ⊕ H(|j1 − j2 |)
(C-65)
In S(j1 + j2 , j1 + j2 − 1) ist die Entartung aller Werte von M gegenüber der in S(j1 + j2 ) wiederum um eins verkleinert. Insbesondere ist der maximale Wert von M jetzt gleich j1 + j2 − 2, und er ist nichtentartet. Der zugehörige Vektor in S(j1 + j2 , j1 + j2 − 1) muss
4 Natürlich existiert S(j 1 + j 2 , j 1 + j 2 − 1) nur, wenn j 1 + j 2 − 2 nicht bereits kleiner als |j 1 − j 2 | ist.
C Addition von zwei beliebigen Drehimpulsen | 1031
daher gleich |J = j1 + j2 − 2, M = j1 + j2 − 2⟩ sein. Um ihn in der {|j1 , j2 ; m1 , m2 ⟩}Basis zu berechnen, genügt die Feststellung, dass er eine Linearkombination der drei Vektoren |j1 , j2 ; j1 , j2 −2⟩, |j1 , j2 ; j1 −1, j2 −1⟩ und |j1 , j2 ; j1 −2, j2 ⟩ ist; die Koeffizienten dieser Kombination werden bis auf einen Phasenfaktor durch die drei Bedingungen festgelegt, dass er normiert und orthogonal zu |j1 +j2 , j1 +j2 −2⟩ und |j1 +j2 −1; j1 +j2 −2⟩ (die wir bereits kennen) ist. Schließlich findet man durch die Anwendung von J − die anderen Vektoren dieser dritten Familie und kann somit H(j1 + j2 − 2) definieren. Dieser Vorgang kann ohne Schwierigkeiten wiederholt werden, bis alle Werte von M größer oder gleich |j1 − j2 | (und damit nach Gl. (C-31) auch alle kleiner oder gleich −|j1 − j2 |) erschöpft sind; wir kennen dann alle gewünschten Vektoren |J, M⟩. Wir wer den diese Methode in Ergänzung AX anhand von zwei Beispielen erläutern. C-4-c Clebsch-Gordan-Koeffizienten In jedem Raum H(j1 , j2 ) sind die Eigenvektoren von J2 und J z Linearkombinationen der ursprünglichen {|j1 , j2 ; m1 , m2 ⟩}-Basis, j1
|J, M⟩ =
∑
j2
∑ |j1 , j2 ; m1 , m2 ⟩⟨j1 , j2 ; m1 , m2 | J, M⟩
(C-66)
m1 =−j1 m2 =−j2
Die Koeffizienten ⟨j1 , j2 ; m1 , m2 | J, M⟩ heißen Clebsch-Gordan-Koeffizienten. Bemerkung: Um genau zu sein, müssten wir die Vektoren |j 1 , j 2 ; m 1 , m 2 ⟩ und |J, M⟩ in der Form |k1 , k2 ; j 1 , j 2 ; m 1 , m 2 ⟩ bzw. |k1 , k2 ; j 1 , j 2 ; J, M⟩ schreiben (die Werte von k1 und k2 wären dann wie die von j 1 und j 2 auf beiden Seiten von Gl. (C-66) dieselben). In den Bezeichnungen für Clebsch-GordanKoeffizienten werden wir jedoch k1 und k2 nicht mitführen, da diese Koeffizienten von k1 und k2 unabhängig sind.
Es ist nicht möglich, einen allgemeinen Ausdruck für die Clebsch-Gordan-Koeffizien ten anzugeben; die vorgestellte Methode ermöglicht es aber, sie für jeden Wert von j1 und j2 zu berechnen. Für praktische Anwendungen liegen numerische Tafeln vor. Zur eindeutigen Festlegung der Clebsch-Gordan-Koeffizienten müssen Phasen konventionen getroffen werden [im Zusammenhang mit Gl. (C-55) und Gl. (C-64) haben wir darauf hingewiesen]. Clebsch-Gordan-Koeffizienten sollen immer reell sein. Die Wahl betrifft dann die Vorzeichen von bestimmten Koeffizienten (offensichtlich sind die relativen Vorzeichen der Koeffizienten, die in der Entwicklung ein und desselben Vektors |J, M⟩ auftreten, festgelegt; nur das Vorzeichen vor der Entwicklung kann willkürlich gewählt werden). Wie die Ergebnisse des vorigen Abschnitts zeigen, ist ⟨j1 , j2 ; m1 , m2 | J, M⟩ nur dann von null verschieden, wenn gilt M = m1 + m2
(C-67a)
|j1 − j2 | ≤ J ≤ j1 + j2
(C-67b)
1032 | X Addition von Drehimpulsen wobei J vom selben Typ (ganz- oder halbzahlig) wie j1 + j2 und |j1 − j2 | ist. Die zweite Beziehung wird oft Dreiecksregel genannt: Es muss möglich sein, aus den drei Gera denstücken mit den Längen j1 , j2 und J ein Dreieck zu bilden. Da auch die Vektoren |J, M⟩ eine Orthonormalbasis des Raums H(j1 , j2 ) bilden, kann man als Umkehrung von Gl. (C-66) schreiben |j1 , j2 ; m1 , m2 ⟩ =
j1 +j2
∑
J
∑ |J, M⟩⟨J, M | j1 , j2 ; m1 , m2 ⟩
(C-68)
J=|j1 −j2 | M=−J
Weil die Clebsch-Gordan-Koeffizienten alle reell gewählt wurden, gilt für die in Gl. (C-68) auftretenden Skalarprodukte ⟨J, M | j1 , j2 ; m1 , m2 ⟩ = ⟨j1 , j2 ; m1 , m2 | J, M⟩
(C-69)
Mit Hilfe der Clebsch-Gordan-Koeffizienten können wir also die Vektoren der alten Ba sis {| j1 , j2 ; m1 , m2 ⟩} in Abhängigkeit von denen der neuen Basis {|J, M⟩} darstellen. Auf einige Eigenschaften der Clebsch-Gordan-Koeffizienten gehen wir in Ergän zung BX ein.
Referenzen und Literaturhinweise Messiah (1.17), Kap. XIII, § V; Rose (2.19), Kap. III; Edmonds (2.21), Kap. 3 und 6. Verbindungen mit der Gruppentheorie: Meijer und Bauer (2.18), Kap. 5, § 5 und Anhang III des Kapitels; Bacry (10.31), Kap. 6; Wigner (2.23), Kap. 14 und 15. Kugelflächenfunktionen: Edmonds (2.21), § 5-10; Jackson (7.5), Kap. 16; Berestetskii et al. (2.8), § 6 und § 7; Akhiezer und Berestetskii (2.14), § 4.
Übersicht über die Ergänzungen zu Kapitel X
|
1033
•
Übersicht über die Ergänzungen zu Kapitel X AX Beispiele für die Addition von Drehimpulsen
Die Ergebnisse von Kapitel X werden an einfachen Beispielen erläutert: zwei Drehimpulse mit dem Wert 1, ein ganzzahliger Drehimpuls l zusammen mit einem Spin 1/2. (leicht, als Übung zur Methode der Addition von Drehimpulsen empfohlen) In diesen Ergänzungen werden nützliche mathematische Zusammenhänge vorgestellt.
BX Clebsch-GordanKoeffizienten
BX behandelt die Clebsch-Gordan-Koeffizienten, die im Zusammenhang mit Drehimpulsen und der Drehinvarianz häufig auftreten.
CX
In CX wird eine Gleichung für das Produkt von Kugelflächenfunktionen bewiesen, die für einige der folgenden Ergänzungen und Aufgaben von Nutzen ist.
Addition von Kugelflächenfunktionen
In diesen Ergänzungen werden physikalische Begriffe eingeführt (Vektorobservablen, Multipolmomente), die in zahlreichen Problemen der Physik eine wichtige Rolle spielen. DX Das Wigner-EckartTheorem
In DX untersuchen wir Vektoroperatoren und beweisen das Wigner-Eckart-Theorem. (theoretischer, aber wegen seiner zahlreichen Anwendungen vor allem in der Atomphysik – VektorModell, Berechnung von Landé-Faktoren usw. – empfohlen)
EX
Elektrische Multipolmomente
EX stellt Definition und Eigenschaften der elektrischen Multipolmomente klassischer oder quantenmechanischer Systeme vor und befasst sich mit den Auswahlregeln (Multipolmomente finden in der Atom- und Kernphysik häufige Anwendung). (von mittlerer Schwierigkeit)
FX
Entwicklung gekoppelter Drehimpulse
Diese Ergänzung kann als Aufgabe mit Lösung angesehen werden, die das grundlegende Problem des Vektormodells von Atomen behandelt: die zeitliche Entwicklung von zwei Drehimpulsen J1 und J2 , die über die Wechselwirkung W = aJ1 ⋅ J2 gekoppelt sind. Dieser dynamische Ansatz vervollständigt die bisherigen Resultate dieses Kapitels in Bezug auf die Eigenzustände von W. (verhältnismäßig leicht)
GX Aufgaben
Aufgaben zu Kapitel X, wobei die Aufgaben 7 bis 10 schwieriger als die übrigen sind. Die Aufgaben 7, 8 und 9 können als Erweiterungen der Ergänzungen DX und FX angesehen werden (Begriff der Standardkomponente und des irreduziblen Tensoroperators; Wigner-Eckart-Theorem). Aufgabe 10 greift das Problem der Kopplungsmöglichkeiten für drei Drehimpulse auf.
•
1034 | Ergänzung AX
Ergänzung AX Beispiele für die Addition von Drehimpulsen 1 1-a 1-b 1-c 2 2-a 2-b
Addition von j 1 = 1 und j 2 = 1 | 1034 Der Unterraum H(J = 2) | 1034 Der Unterraum H(J = 1) | 1035 Der Vektor |J = 0, M = 0⟩ | 1036 Addition eines ganzzahligen Bahndrehimpulses l und eines Spins 1/2 | 1036 Der Unterraum H(J = l + 1/2) | 1037 Der Unterraum H(J = l − 1/2) | 1039
Zur Erläuterung der in Kapitel X behandelten allgemeinen Methode der Addition von Drehimpulsen wenden wir sie im Folgenden auf zwei Beispiele an.
1 Addition von j 1 = 1 und j 2 = 1 Wir betrachten zunächst den Fall j1 = j2 = 1. Er tritt z. B. in einem Zweiteilchensystem auf, in dem beide Bahndrehimpulse gleich eins sind. Da dann jedes der Teilchen in einem p-Zustand ist, spricht man von einer p2 -Konfiguration. Der Zustandsraum H(1, 1), mit dem wir es hier zu tun haben, hat die Dimension 3 × 3 = 9. Eine Basis aus gemeinsamen Eigenzuständen zu J21 , J22 , J 1z und J 2z sei bekannt, {|1, 1; m1 , m2 ⟩}
mit m1 , m2 = 1, 0, −1
(1)
und wir suchen die {|J, M⟩}-Basis gemeinsamer Eigenvektoren von J21 , J22 , J2 und J z , worin J der Gesamtdrehimpuls ist. Nach § C-3 von Kapitel X sind die folgenden Werte für die Quantenzahl J möglich: J = 2, 1, 0
(2)
Daher müssen wir drei Familien von Vektoren |J, M⟩ konstruieren, die fünf, drei bzw. einen Vektor der neuen Basis enthalten. 1-a Der Unterraum H(J = 2) Der Ketvektor |J = 2, M = 2⟩ kann einfach geschrieben werden |2, 2⟩ = |1, 1; 1, 1⟩ Wenn wir J − auf ihn anwenden, finden wir den Vektor |J = 2, M = 1⟩: 1 |2, 1⟩ = J − |2, 2⟩ 2ℏ 1 = (J 1− + J 2− ) |1, 1; 1, 1⟩ 2ℏ 1 [ℏ√2 |1, 1; 0, 1⟩ + ℏ√2 |1, 1; 1, 0⟩] = 2ℏ 1 = [|1, 1; 1, 0⟩ + |1, 1; 0, 1⟩] √2 https://doi.org/10.1515/9783110638769-009
(3)
(4)
Beispiele für die Addition von Drehimpulsen |
1035
•
Wir verwenden erneut J − , um |J = 2, M = 0⟩ zu berechnen; nach einfacher Rechnung erhalten wir 1 (5) |2, 0⟩ = [|1, 1; 1, −1⟩ + 2|1, 1; 0, 0⟩ + |1, 1; −1, 1⟩] √6 dann |2, −1⟩ =
1 [|1, 1; 0, −1⟩ + |1, 1; −1, 0⟩] √2
(6)
und schließlich |2, −2⟩ = |1, 1; −1, −1⟩
(7)
1-b Der Unterraum H(J = 1) Wir wenden uns nun dem Unterraum H(J = 1) zu. Der Vektor |J = 1, M = 1⟩ muss eine Linearkombination der beiden Basisvektoren |1, 1; 1, 0⟩ und |1, 1; 0, 1⟩ (der einzigen mit M = 1) sein, |1, 1⟩ = α |1, 1; 1, 0⟩ + β |1, 1; 0, 1⟩
(8)
|α|2 + |β|2 = 1
(9)
mit
Damit er orthogonal zum Vektor |2, 1⟩ ist, muss notwendig [s. Gl. (4)] α+β=0
(10)
gelten. Wir wählen α und β reell und nach Konvention α positiv.¹ Damit erhalten wir |1, 1⟩ =
1 [|1, 1; 1, 0⟩ − |1, 1; 0, 1⟩] √2
(11)
Die Anwendung von J− ermöglicht es jetzt wieder, die Vektoren |1, 0⟩ und |1, −1⟩ zu berechnen. Mit demselben Verfahren wie oben finden wir leicht 1 |1, 0⟩ = (12) [|1, 1; 1, −1⟩ − |1, 1; −1, 1⟩] √2 1 (13) |1, −1⟩ = [|1, 1; 0, −1⟩ − |1, 1; −1, 0⟩] √2 Die Entwicklung (12) enthält den Vektor |1, 1; 0, 0⟩ nicht, obwohl auch er zu M = 0 gehört; der entsprechende Clebsch-Gordan-Koeffizient verschwindet also: ⟨1, 1; 0, 0 | 1, 0⟩ = 0
(14)
1 Die Komponente des Vektors |J, J⟩ in Richtung des Vektors |j 1 , j 2 ; m 1 = j 1 , m 2 = J − j 1 ⟩ wird generell reell und positiv gewählt (s. Ergänzung BX , § 2).
•
1036 | Ergänzung AX
1-c Der Vektor |J = 0, M = 0⟩ Schließlich muss noch der letzte Vektor der {|J, M⟩}-Basis, der zu J = M = 0 gehört, berechnet werden. Er ist eine Linearkombination der drei Basisvektoren mit M = 0, |0, 0⟩ = a |1, 1; 1, −1⟩ + b |1, 1; 0, 0⟩ + c |1, 1; −1, 1⟩
(15)
|a|2 + |b|2 + |c|2 = 1
(16)
mit
Außerdem muss er zu |2, 0⟩ [Gl. (5)] und |1, 0⟩ [Gl. (12)] orthogonal sein. Daraus erhal ten wir zwei Bedingungen: a + 2b + c = 0
(17a)
a−c=0
(17b)
also ist a = −b = c
(18)
Wir wählen a, b und c wieder reell und a positiv (s. Fußnote auf S. 1035) und erhalten so mit Gl. (16) und Gl. (18) 1 |0, 0⟩ = (19) [|1, 1; 1, −1⟩ − |1, 1; 0, 0⟩ + |1, 1; −1, 1⟩] √3 Damit ist die {|J, M⟩}-Basis für den Fall j1 = j2 = 1 vollständig bestimmt. Bemerkung: Handelt es sich bei dem betrachteten physikalischen Problem um die p2 -Konfiguration eines Zweiteilchensystems, so sind die Wellenfunktionen, die die Zustände der ursprünglichen Basis darstellen, von der Form m
m
⟨r1 , r2 | 1, 1; m 1 , m 2 ⟩ = R k1 ,1 (r 1 )R k2 ,1 (r 2 )Y1 1 (θ1 , φ 1 )Y1 2 (θ2 , φ 2 )
(20)
worin r1 (r 1 , θ1 , φ 1 ) und r2 (r 2 , θ2 , φ 2 ) die Positionen der beiden Teilchen bezeichnen. Da die Radialfunktionen unabhängig von den Quantenzahlen m 1 und m 2 sind, sind die Linearkombina tionen, die die zu den Ketvektoren |J, M⟩ gehörenden Wellenfunktionen ergeben, nur Funktionen der Winkelvariablen. Zum Beispiel schreibt sich Gl. (19) in der {|r1 , r2 ⟩}-Darstellung ⟨r1 , r2 | 0, 0⟩ = R k1 ,1 (r 1 )R k2 ,1 (r 2 )
1 [Y11 (θ1 , φ 1 )Y1−1 (θ2 , φ 2 ) √3 −Y10 (θ1 , φ 1 )Y10 (θ2 , φ 2 ) + Y1−1 (θ1 , φ 1 )Y11 (θ2 , φ 2 )]
(21)
2 Addition eines ganzzahligen Bahndrehimpulses l und eines Spins 1/2 Betrachten wir die Addition eines Bahndrehimpulses (j1 = l, ganzzahlig) mit einem Spin 1/2 (j2 = 1/2). Auf dieses Problem stößt man z. B. bei der Beschreibung des Gesamtdrehimpulses eines Spin-1/2-Teilchens wie etwa des Elektrons.
Beispiele für die Addition von Drehimpulsen |
1037
•
Der hier betrachtete Raum H(l, 1/2) ist 2(2l + 1)-dimensional, und wir kennen bereits eine Basis,² {|l, 1/2; m, ε⟩}
mit m = l, l − 1, . . . , −l und ε = ±
(22)
die aus den Eigenzuständen der Observablen L2 , S2 , L z und S z gebildet wird, wobei L und S der betrachtete Drehimpuls bzw. Spin ist. Wir wollen nun die Eigenvekto ren |J, M⟩ von J2 und J z konstruieren, wobei J für den Gesamtdrehimpuls des Systems steht: J=L+S
(23)
Zunächst sehen wir, dass die Lösung des Problems für l gleich null offensichtlich ist: Man zeigt leicht, dass in diesem Fall die Vektoren |0, 1/2; 0, ε⟩ auch Eigenvektoren von J2 und J z mit den Eigenwerten J = 1/2 und M = ε/2 sind. Ist dagegen l nicht null, gibt es zwei mögliche Werte von J: J=l+
1 , 2
l−
1 2
(24)
2-a Der Unterraum H(J = l + 1/2) Die 2l + 1 Vektoren, die den Unterraum H(J = l + 1/2) aufspannen, erhalten wir, wenn wir die allgemeine Methode anwenden. Zunächst haben wir 1 1 1 l + , l + ⟩ = l, ; l, +⟩ 2 2 2
(25)
Das Anwenden von J− ergibt |l + 1/2, l − 1/2⟩:³ 1 1 1 1 1 J − l + , l + ⟩ l + , l − ⟩ = 2 2 2 2 ℏ√2l + 1 1 1 (L− + S− ) l, ; l, +⟩ = 2 √ ℏ 2l + 1 1 1 = [ℏ√2l l, ; l − 1, +⟩ + ℏ ℏ√2l + 1 2 =√
2l 2l + 1
1 1 l, ; l − 1, +⟩ + 2 √2l + 1
1 l, ; l, −⟩] 2
1 l, ; l, −⟩ 2
(26)
2 Wollten wir uns streng an die oben in diesem Kapitel verwendete Notation halten, müssten wir in den Basisvektoren ±1/2 anstelle von ε schreiben. Wir hatten uns allerdings in Kapitel IV und IX darauf geeinigt, die Eigenvektoren von S z im Spinzustandsraum mit |+⟩ bzw. |−⟩ zu bezeichnen. 3 Um die in den folgenden Gleichungen auftretenden numerischen Koeffizienten zu bestimmen, kön nen wir einfach die Relation j(j + 1) − m(m − 1) = (j + m)(j − m + 1) verwenden.
•
1038 | Ergänzung AX
Wir wenden erneut J − an; eine ähnliche Rechnung ergibt 1 1 1 3 1 [√2l − 1 l, ; l − 2, +⟩ + √2 l, ; l − 1, −⟩] l + , l − ⟩ = 2 2 2 2 √2l + 1
(27)
Allgemeiner wird also der Vektor |l + 1/2, M⟩ eine Linearkombination der bei den einzigen zu M gehörenden Basisvektoren sein: dies sind |l, 1/2; M − 1/2, +⟩ und |l, 1/2; M + 1/2, −⟩ (M ist natürlich halbzahlig). Wenn wir die Gleichungen (25) bis (27) vergleichen, können wir erraten, dass es sich bei der gesuchten Linearkombina tion um die folgende handelt: 1 1 1 1 1 [√l + M + l, ; M − , +⟩ l + , M⟩ = 2 2 2 2 √2l + 1 1 1 1 + √l − M + l, ; M + , −⟩] 2 2 2
(28)
mit M=l+
1 1 3 1 1 , l − , l − , . . . , −l + , − (l + ) 2 2 2 2 2
(29)
Wir können rekursiv zeigen, dass diese Beziehung richtig ist, ergibt doch die Anwen dung von J − auf beide Seiten von Gl. (28) 1 1 1 J − l + , M⟩ l + , M − 1⟩ = 2 2 ℏ√(l + M + 12 ) (l − M + 32 ) =
1
1
ℏ√(l + M + 12 ) (l − M + 32 ) √2l + 1
1 1 3 1 3 × [√l + M + ℏ√(l + M − ) (l − M + ) l, ; M − , +⟩ 2 2 2 2 2 [ 1 1 1 + √l + M + ℏ l, ; M − , −⟩ 2 2 2 1 1 1 1 1 + √l − M + ℏ√(l + M + ) (l − M + ) l, ; M − , −⟩] 2 2 2 2 2 ] 1 3 1 1 = [√l + M − l, ; M − , +⟩ 2 2 2 √2l + 1 3 1 1 (30) + √l − M + l, ; M − , −⟩] 2 2 2 Wir erhalten also tatsächlich denselben Ausdruck wie in Gl. (28), wobei M durch M −1 ersetzt ist.
Beispiele für die Addition von Drehimpulsen | 1039
•
2-b Der Unterraum H(J = l − 1/2) Wir wollen jetzt den Ausdruck für die 2l zu J = l − 1/2 gehörenden Vektoren |J, M⟩ bestimmen. Bei demjenigen, der dem maximalen Wert l − 1/2 von M entspricht, han delt es sich um eine normierte Linearkombination der Vektoren |l, 1/2; l − 1, +⟩ und |l, 1/2; l, −⟩, und er muss außerdem orthogonal sein zu |l + 1/2, l − 1/2⟩ [Gl. (26)]. In dem wir den Koeffizienten von |l, 1/2; l, −⟩ reell und positiv wählen (s. Fußnote auf S. 1035), finden wir leicht 1 1 1 [√2l l − , l − ⟩ = 2 2 √2l + 1
1 1 l, ; l, −⟩ − l, ; l − 1, +⟩] 2 2
(31)
Mit Hilfe des Operators J − können wir nun schrittweise alle anderen der zu J = l − 1/2 gehörenden Vektoren errechnen. Da es zu einem gegebenen Wert von M nur zwei Basisvektoren gibt und |l − 1/2, M⟩ orthogonal zu |l + 1/2, M⟩ ist, erwarten wir anhand von Gl. (28) die folgende Beziehung: 1 1 1 1 1 [√l + M + l, ; M + , −⟩ l − , M⟩ = 2 2 2 2 √2l + 1 1 1 1 − √l − M + l, ; M − , +⟩] 2 2 2
(32)
wobei M=l−
3 3 1 1 , l − , . . . , −l + , − (l − ) 2 2 2 2
(33)
Ähnlich wie oben kann auch diese Beziehung durch Rekursion nachgewiesen werden. Bemerkungen: 1. Die Zustände |l, 1/2; m, ε⟩ eines Spin-1/2-Teilchens lassen sich durch zweikomponentige Spinoren der folgenden Form darstellen: 1 [ψ l,1/2;m,+ ] (r) = R k,l (r)Y lm (θ, φ) ( ) 0
(34a)
0 [ψ l,1/2;m,− ] (r) = R k,l (r)Y lm (θ, φ) ( ) 1
(34b)
Wie die vorhergehenden Überlegungen zeigen, schreiben sich dann die zu den Zuständen |J, M⟩ gehörenden Spinoren [ψ l+1/2,M ] (r) =
[ψ l−1/2,M ] (r) =
1 √2l + 1
1 √2l + 1
R k,l (r) (
R k,l (r) (
M−1/2
√l + M +
1 2
Yl
√l − M +
1 2
M+1/2 Yl (θ, φ)
−√ l − M + √l + M +
1 2 1 2
(θ, φ) )
M−1/2
Yl
(θ, φ) )
M+1/2 Yl (θ, φ)
(35a)
(35b)
•
1040 | Ergänzung AX 2. Für den speziellen Fall l = 1 ergeben die Gleichungen (25), (28), (31) und (32) 3 , 2 3 , 2
1 3 ⟩ = 1, ; 1, +⟩ 2 2
1 1, ; 0, +⟩ + 1 1, 1 ; 1, −⟩ 2 √3 2 3 1 2 1 1 1 , − ⟩ = 1, ; −1, +⟩ + √ 1, ; 0, −⟩ 2 2 3 2 √3 2 3 3 1 , − ⟩ = 1, ; −1, −⟩ 2 2 2 2 1 ⟩=√ 2 3
(36a)
und 1 1 2 , ⟩=√ 3 2 2
1 1, ; 1, −⟩ − 1 2 √3 1 1 2 1 1 , − ⟩= 1, ; 0, −⟩ − √ 2 2 3 √3 2
1, 1,
1 ; 0, +⟩ 2
(36b)
1 ; −1, +⟩ 2
Referenzen und Literaturhinweise Zusammensetzung eines Drehimpulses l und eines Drehimpulses S = 1: siehe die unter „Kugelflächenfunktionen“ genannten Referenzen in Kapitel X.
Clebsch-Gordan-Koeffizienten | 1041
•
Ergänzung BX Clebsch-Gordan-Koeffizienten 1 1-a 1-b 1-c 2 2-a 2-b 3 3-a 3-b 3-c 3-d
Eigenschaften der Clebsch-Gordan-Koeffizienten | 1042 Auswahlregeln | 1042 Orthogonalitätsrelationen | 1043 Rekursionsbeziehungen | 1044 Phasenkonventionen | 1045 Die Koeffizienten ⟨j 1 , j 2 ; m 1 , m 2 | J, J⟩; Phase des Vektors |J, J⟩ | 1045 Weitere Clebsch-Gordan-Koeffizienten | 1046 Einige nützliche Beziehungen | 1046 Vorzeichen einiger Koeffizienten | 1046 Vertauschen der Reihenfolge von j 1 und j 2 | 1047 Wechsel des Vorzeichens von M, m 1 und m 2 | 1048 Die Koeffizienten ⟨j, j; m, −m | 0, 0⟩ | 1048
Die Clebsch-Gordan-Koeffizienten sind in Kapitel X [s. Gl. (C-66)] eingeführt worden: Es sind die Koeffizienten ⟨j1 , j2 ; m1 , m2 | J, M⟩, die in der Entwicklung des Vektors |J, M⟩ in der {|j1 , j2 ; m1 , m2 ⟩}-Basis auftreten: j1
|J, M⟩ =
∑
j2
∑ ⟨j1 , j2 ; m1 , m2 | J, M⟩|j1 , j2 ; m1 , m2 ⟩
(1)
m1 =−j1 m2 =−j2
In dieser Ergänzung leiten wir Eigenschaften der Clebsch-Gordan-Koeffizienten her, die wir zum Teil bereits in Kapitel X angegeben hatten. Es ist zu beachten, dass Gl. (1) nicht ausreicht, um die ⟨j1 , j2 ; m1 , m2 |J, M⟩ voll ständig zu definieren. Der normierte Vektor |J, M⟩ ist durch seine Eigenwerte J(J + 1)ℏ2 und Mℏ nur bis auf einen Phasenfaktor bestimmt, und wir müssen uns auf eine Pha senkonvention einigen, um die Definition zu vervollständigen. Oben benutzten wir die Wirkung der Operatoren J − und J + , um die relative Phase der 2J + 1 zu demsel ben Wert von J gehörenden Vektoren |J, M⟩ festzulegen. In diesem Abschnitt vervoll ständigen wir dies, indem wir eine Konvention für die Phasen der Vektoren |J, J⟩ ein führen. Wir werden dann zeigen können, dass alle Clebsch-Gordan-Koeffizienten reell sind. Bevor wir uns in § 2 dem Problem der Phasenwahl für die ⟨j1 , j2 ; m1 , m2 | J, M⟩ zu wenden, untersuchen wir in § 1 die Eigenschaften, die in der Quantenmechanik beson ders nützlich sind und von dieser Phasenkonvention nicht abhängen. In § 3 schließ lich geben wir verschiedene Beziehungen an, die wir in anderen Ergänzungen brau chen werden.
https://doi.org/10.1515/9783110638769-010
•
1042 | Ergänzung BX
1 Eigenschaften der Clebsch-Gordan-Koeffizienten 1-a Auswahlregeln Zwei wichtige Auswahlregeln, die unmittelbar aus den oben erhaltenen Ergebnis sen über die Addition von Drehimpulsen folgen, sind bereits angegeben worden: Der Clebsch-Gordan-Koeffizient ⟨j1 , j2 ; m1 , m2 | J, M⟩ verschwindet, wenn die beiden folgenden Bedingungen nicht gleichzeitig erfüllt sind: M = m1 + m2
(2)
|j1 − j2 | ≤ J ≤ j1 + j2
(3a)
Die Ungleichung (3a) wird oft Dreiecksregel genannt. Sie besagt, dass aus drei Strecken der Längen j1 , j2 und J ein Dreieck gebildet werden kann (s. Abb. 1). Diese drei Zahlen treten hier symmetrisch auf, und Ungleichung (3a) kann auch in der folgenden Form angegeben werden: |J − j1 | ≤ j2 ≤ J + j1
(3b)
oder |J − j2 | ≤ j1 ≤ J + j2
(3c)
Abb. 1: Nach der Dreiecksregel kann der Koeffizient ⟨j 1 , j 2 ; m 1 , m 2 | J, M⟩ nur dann von null verschieden sein, wenn es möglich ist, aus den drei Strecken der Längen j 1 , j 2 und J ein Dreieck zu bilden.
Darüber hinaus verlangen die allgemeinen Eigenschaften des Drehimpulses, dass der Vektor |J, M⟩ und damit auch der Koeffizient ⟨j1 , j2 ; m1 , m2 | J, M⟩ nur definiert ist für M = J, J − 1, J − 2, . . . , −J
(4a)
Ebenso muss gelten m1 = j1 , j1 − 1, . . . , −j1
(4b)
m2 = j2 , j2 − 1, . . . , −j2
(4c)
Treffen diese Bedingungen nicht zu, sind die Clebsch-Gordan-Koeffizienten nicht de finiert. Allerdings wird sich die Annahme als nützlich erweisen, dass sie für alle Werte von m1 , m2 und M existieren, wobei sie den Wert null annehmen, wenn mindestens eine der Bedingungen (4) nicht erfüllt ist. Diese spielen somit die Rolle neuer Aus wahlregeln für die Clebsch-Gordan-Koeffizienten.
Clebsch-Gordan-Koeffizienten | 1043
•
1-b Orthogonalitätsrelationen Indem wir die Vollständigkeitsrelation¹ j1
∑
j2
∑ |j1 , j2 ; m1 , m2 ⟩⟨j1 , j2 ; m1 , m2 | = 1
(5)
m1 =−j1 m2 =−j2
in die Orthogonalitätsrelation der Vektoren |J, M⟩ ⟨J, M|J , M ⟩ = δ JJ δ MM
(6)
einsetzen, erhalten wir j1
∑
j2
∑ ⟨J, M | j1 , j2 ; m1 , m2 ⟩⟨j1 , j2 ; m1 , m2 | J , M ⟩ = δ JJ δ MM
(7a)
m1 =−j1 m2 =−j2
Wie wir unten sehen werden [s. Gl. (18b)], sind die Clebsch-Gordan-Koeffizienten reell, so dass wir diese Beziehung schreiben können als j1
∑
j2
∑ ⟨j1 , j2 ; m1 , m2 | J, M⟩⟨j1 , j2 ; m1 , m2 | J , M ⟩ = δ JJ δ MM
(7b)
m1 =−j1 m2 =−j2
Damit haben wir eine erste Orthogonalitätsrelation für die Clebsch-Gordan-Koeffizi enten gefunden. Hierbei ist zu beachten, dass die auftretende Summation tatsächlich nur über einen Index ausgeführt wird: Damit die Koeffizienten auf der linken Seite von null verschieden sind, müssen m1 und m2 Gl. (2) gehorchen. Ebenso fügen wir die Vollständigkeitsrelation j1 +j2
∑
J
∑ |J, M⟩⟨J, M| = 1
(8)
J=|j1 −j2 | M=−J
in die Orthogonalitätsrelation der Vektoren |j1 , j2 ; m1 , m2 ⟩ ein; wir erhalten j1 +j2
∑
J
∑ ⟨j1 , j2 ; m1 , m2 | J, M⟩⟨J, M | j1 , j2 ; m1 , m2 ⟩ = δ m1 m1 δ m2 m2
(9a)
J=|j1 −j2 | M=−J
d. h. unter Beachtung von Gl. (18b) j1 +j2
∑
J
∑ ⟨j1 , j2 ; m1 , m2 | J, M⟩⟨j1 , j2 ; m1 , m2 | J, M⟩ = δ m1 m1 δ m2 m2
(9b)
J=|j1 −j2 | M=−J
Wieder wird die Summation nur über einen Index ausgeführt: Da M = m1 + m2 gilt, reduziert sich die Summation über M auf einen einzigen Term.
1 Diese Vollständigkeitsrelation gilt für einen Unterraum H(k1 , k2 ; j 1 , j 2 ) (s. Kap. X, § C-2).
•
1044 | Ergänzung BX
1-c Rekursionsbeziehungen In diesem Abschnitt machen wir von der Tatsache Gebrauch, dass die Vektoren |j1 , j2 ; m1 , m2 ⟩ eine Standardbasis bilden. Es gilt also J 1± |j1 , j2 ; m1 , m2 ⟩ = ℏ√j1 (j1 + 1) − m1 (m1 ± 1) |j1 , j2 ; m1 ± 1, m2 ⟩ J 2± |j1 , j2 ; m1 , m2 ⟩ = ℏ√j2 (j2 + 1) − m2 (m2 ± 1) |j1 , j2 ; m1 , m2 ± 1⟩
(10)
Ebenso genügen die Vektoren |J, M⟩ aufgrund ihrer Konstruktion der Beziehung J ± |J, M⟩ = ℏ√J(J + 1) − M(M ± 1) |J, M ± 1⟩
(11)
Wir wenden also den Operator J − auf Gl. (1) an: Wegen J− = J 1− + J 2− erhalten wir (für M > −J) √J(J + 1) − M(M − 1) |J, M − 1⟩ =
j1
∑
j2
∑ ⟨j1 , j2 ; m1 , m2 | J, M⟩
m1 =−j1 m2 =−j2
× [√j1 (j1 + 1) − m1 (m1 − 1) |j1 , j2 ; m1 − 1, m2 ⟩ + √j2 (j2 + 1) − m2 (m2 − 1) |j1 , j2 ; m1 , m2 − 1⟩]
(12)
Indem wir diese Gleichung mit dem Bravektor ⟨j1 , j2 ; m1 , m2 | multiplizieren, finden wir √J(J + 1) − M(M − 1)⟨j1 , j2 ; m1 , m2 | J, M − 1⟩ = √j1 (j1 + 1) − m1 (m1 + 1)⟨j1 , j2 ; m1 + 1, m2 | J, M⟩ + √j2 (j2 + 1) − m2 (m2 + 1)⟨j1 , j2 ; m1 , m2 + 1 | J, M⟩
(13)
Ist der Wert von M gleich −J, so gilt J− |J, −J⟩ = 0 und Gl. (13) bleibt gültig, wenn wir die oben eingeführte Konvention beachten, nach der ⟨j1 , j2 ; m1 , m2 |J, M⟩ für |M| > J gleich null ist. Ebenso gelangt man durch Anwendung des Operators J + = J 1+ + J 2+ auf Gl. (1) zu √J(J + 1) − M(M + 1)⟨j1 , j2 ; m1 , m2 | J, M + 1⟩ = √j1 (j1 + 1) − m1 (m1 − 1)⟨j1 , j2 ; m1 − 1, m2 | J, M⟩ + √j2 (j2 + 1) − m2 (m2 − 1)⟨j1 , j2 ; m1 , m2 − 1 | J, M⟩
(14)
(die linke Seite dieser Gleichung verschwindet für M = J). Mit Gl. (13) und Gl. (14) erhalten wir Rekursionsbeziehungen für die Clebsch-Gordan-Koeffizienten.
Clebsch-Gordan-Koeffizienten |
1045
•
2 Phasenkonventionen Wie wir gesehen haben, legt Gl. (12) die relativen Phasen der zum selben Wert von J gehörenden Vektoren |J, M⟩ fest. Um die Definition der Clebsch-Gordan-Koeffizienten, wie sie sich in Gl. (1) ausdrückt, zu vervollständigen, müssen wir eine Phase für die verschiedenen Vektoren |J, J⟩ wählen. Dazu untersuchen wir zunächst einige Eigen schaften der Koeffizienten ⟨j1 , j2 ; m1 , m2 | J, J⟩.
2-a Die Koeffizienten ⟨j1 , j2 ; m1 , m2 | J, J⟩; Phase des Vektors |J, J⟩ Der maximale Wert von m1 im Koeffizienten ⟨j1 , j2 ; m1 , m2 | J, J⟩ ist m1 = j1 . Nach der Auswahlregel Gl. (2) ist dann m2 gleich J − j1 [dessen Betrag nach der Relation (3b) sicher kleiner als j2 ist]. Wenn m1 jeweils in Einerschritten von seinem Maximalwert abnimmt, so nimmt m2 entsprechend zu, bis es sein Maximum m2 = j2 erreicht [m1 ist dann gleich J − j2 , dessen Betrag nach Ungleichung (3c) sicher kleiner als j1 ist]. Theoretisch kann es also j1 + j2 − J + 1 nichtverschwindende Clebsch-Gordan-Koeffizi enten ⟨j1 , j2 ; m1 , m2 | J, J⟩ geben. Wir wollen nun zeigen, dass tatsächlich keiner von ihnen je den Wert null annimmt. Setzen wir in Gl. (14) M = J, erhalten wir ⟨j1 , j2 ; m1 − 1, m2 | J, J⟩ = −√
j2 (j2 + 1) − m2 (m2 − 1) ⟨j1 , j2 ; m1 , m2 − 1 | J, J⟩ j1 (j1 + 1) − m1 (m1 − 1)
(15)
Solange die in dieser Gleichung auftretenden Clebsch-Gordan-Koeffizienten die Be dingungen (4b) und (4c) erfüllen, kann der Radikand auf der rechten Seite dieser Glei chung weder verschwinden noch unendlich groß werden. Aus Gl. (15) folgt daher, dass beim Verschwinden von ⟨j1 , j2 ; j1 , J − j1 | J, J⟩ auch der Koeffizient ⟨j1 , j2 ; j1 − 1, J − j1 + 1 | J, J⟩ gleich null wäre und ebenso alle folgenden Koeffizienten ⟨j1 , j2 ; m1 , J − m1 | J, J⟩. Das ist aber unmöglich, da der normierte Vektor |J, J⟩ nicht gleich null sein kann. Darum sind alle Koeffizienten ⟨j1 , j2 ; m1 , J − m1 | J, J⟩ (mit j1 ≥ m1 ≥ J − j2 ) von null verschieden. Insbesondere ist der Koeffizient ⟨j1 , j2 ; j1 , J − j1 | J, J⟩, bei dem m1 seinen Maxi malwert annimmt, nicht gleich null. Um die Phase des Vektors |J, J⟩ festzulegen, ver langen wir, dass dieser Koeffizient die folgende Bedingung erfüllt: ⟨j1 , j2 ; j1 , J − j1 | J, J⟩
reell und positiv
Aus Gl. (15) folgt dann rekursiv, dass alle Koeffizienten ⟨j1 , j2 ; m1 , J − m1 | J, J⟩ reell sind [mit dem Vorzeichen (−1)j1 −m1 ].
(16)
•
1046 | Ergänzung BX
Bemerkung: Durch die Wahl dieser Phasenkonvention für den Vektor |J, J⟩ spielen die Drehimpulse J1 und J2 eine asymmetrische Rolle. Es hängt jetzt von der Reihenfolge ab, in der die Quantenzahlen j 1 und j 2 im Clebsch-Gordan-Koeffizienten auftreten: Vertauscht man j 1 und j 2 , so ist die Phase des Vektors |J, J⟩ festgelegt durch die Bedingung ⟨j 2 , j 1 ; j 2 , J − j 2 | J, J⟩
reell und positiv
(17)
was a priori nicht zu (16) äquivalent ist [die durch die Bedingungen (16) und (17) definierten Pha sen der Vektoren |J, J⟩ können verschieden sein]. Wir werden darauf in § 3-b zurückkommen.
2-b Weitere Clebsch-Gordan-Koeffizienten Mit Hilfe von Gl. (13) können wir alle Koeffizienten ⟨j1 , j2 ; m1 , m2 | J, J − 1⟩ in Abhän gigkeit von ⟨j1 , j2 ; m1 , m2 | J, J⟩ ausdrücken, ebenso alle Koeffizienten ⟨j1 , j2 ; m1 , m2 | J, J − 2⟩ usw. Aufgrund dieser Beziehung, die keine imaginären Zahlen enthält, müs sen also alle Clebsch-Gordan-Koeffizienten reell sein: ⟨j1 , j2 ; m1 , m2 | J, M⟩∗ = ⟨j1 , j2 ; m1 , m2 | J, M⟩
(18a)
was wir auch schreiben können als ⟨j1 , j2 ; m1 , m2 | J, M⟩ = ⟨J, M | j1 , j2 ; m1 , m2 ⟩
(18b)
Das Vorzeichen von ⟨j1 , j2 ; m1 , m2 | J, M⟩ gehorcht allerdings für M ≠ J keiner einfachen Regel.
3 Einige nützliche Beziehungen In diesem Abschnitt geben wir, ergänzend zu § 1, einige nützliche Beziehungen an. Um sie zu beweisen, beginnen wir damit, die Vorzeichen bestimmter Clebsch-Gordan-Ko effizienten zu untersuchen.
3-a Vorzeichen einiger Koeffizienten α Die Koeffizienten ⟨j1 , j2 ; m1 , m2 | j1 + j2 , M⟩ Die Konvention (16) verlangt, dass der Koeffizient ⟨j1 , j2 ; j1 , j2 | j1 + j2 , j1 + j2 ⟩ reell und positiv ist; er ist darüber hinaus gleich eins (s. Kap X, § C-4-b-α). Setzen wir in Gl. (13) M = J = j1 + j2 , so sehen wir, dass die Koeffizienten ⟨j1 , j2 ; m1 , m2 | j1 + j2 , j1 + j2 − 1⟩ positiv sind. Durch Rekursion lässt sich dann leicht zeigen, dass gilt ⟨j1 , j2 ; m1 , m2 | j1 + j2 , M⟩ ≥ 0
(19)
Clebsch-Gordan-Koeffizienten | 1047
•
β Koeffizienten für den Maximalwert von m1 Wir betrachten den Koeffizienten ⟨j1 , j2 ; m1 , m2 | J, M⟩. Theoretisch ist der Maximal wert von m1 gleich j1 . Dann ist jedoch m2 = M − j1 , was nach den Gleichungen (4c) nur für M − j1 ≥ −j2 , d. h. M ≥ j1 − j2
(20)
möglich ist. Gilt andererseits M ≤ j1 − j2
(21)
so entspricht der Maximalwert von m1 dem Minimalwert von m2 (m2 = −j2 ), und es ist daher m1 = M + j2 . Wir zeigen nun, dass alle Clebsch-Gordan-Koeffizienten, bei denen m1 seinen Maximalwert annimmt, ungleich null und positiv sind. Dazu setzen wir in Gl. (13) m1 = j1 ; wir finden √J(J + 1) − M(M − 1)⟨j1 , j2 ; j1 , m2 | J, M − 1⟩ = √j2 (j2 + 1) − m2 (m2 + 1)⟨j1 , j2 ; j1 , m2 + 1 | J, M⟩
(22)
Mit Hilfe dieser Beziehung lässt sich von von der Beziehung (16) ausgehend rekursiv zeigen, dass alle Koeffizienten ⟨j1 , j2 ; j1 , M − j1 | J, M⟩ positiv sind [und ungleich null, wenn M Gl. (20) erfüllt]. Indem wir in Ungleichung (14) m2 = −j2 setzen, könnten wir ebenfalls zeigen, dass alle Koeffizienten ⟨j1 , j2 ; M + j2 , −j2 | J, M⟩ positiv sind [wenn M die Ungleichung (21) erfüllt]. γ Die Koeffizienten ⟨j1 , j2 ; m1 , m2 | J, J⟩ und ⟨j1 , j2 ; m1 , m2 | J, −J⟩ Wie wir in § 2-a sahen, hat ⟨j1 , j2 ; m1 , m2 | J, J⟩ das Vorzeichen (−1)j1 −m1 . Insbesondere hat ⟨j1 , j2 ; J − j2 , j2 | J, J⟩ das Vorzeichen (−1)j1 +j2 −J
(23)
Um das Vorzeichen von ⟨j1 , j2 ; m1 , m2 | J, −J⟩ zu bestimmen, können wir in Gl. (13) M = −J setzen, wobei dann die linke Seite der Gleichung verschwindet. Das Vor zeichen von ⟨j1 , j2 ; m1 , m2 | J, −J⟩ wechselt also, wenn sich m1 (oder m2 ) um ±1 än dert. Da, wie oben gesehen, ⟨j1 , j2 ; j2 − J, −j2 | J, −J⟩ positiv ist, ist das Vorzeichen von ⟨j1 , j2 ; m1 , m2 | J, −J⟩ folglich (−1)m2 +j2 und insbesondere hat ⟨j1 , j2 ; −j1 , −J + j1 | J, −J⟩} das Vorzeichen (−1)j1 +j2 −J
(24)
3-b Vertauschen der Reihenfolge von j1 und j2 Mit den von uns gewählten Konventionen hängt die Phase des Vektors |J, J⟩ von der Reihenfolge ab, in der die beiden Drehimpulse j1 und j2 im Clebsch-Gordan-Koeffizi
•
1048 | Ergänzung BX
enten auftreten (s. Bemerkung in § 2-a). Ist ihre Reihenfolge j1 , j2 , so ist die Komponen te von |J, J⟩ in Richtung von |j1 , j2 ; j1 , J−j1 ⟩ positiv. Das bedeutet nach Bedingung (23), dass das Vorzeichen der Komponente in Richtung von |j1 , j2 ; J−j2 , j2 ⟩ gleich (−1)j1 +j2 −J ist. Nehmen wir dagegen die Reihenfolge j2 , j1 , so zeigt Bedingung (17), dass diese Komponente positiv ist. Unter Vertauschung von j1 und j2 wird also |J, J⟩ mit (−1)j1 +j2 −J multipliziert. Dasselbe gilt für die Vektoren |J, M⟩, die sich aus |J, J⟩ durch Anwendung des Operators J − ergeben, wobei die Reihenfolge von j1 und j2 keine Rolle spielt. Der Austausch von j1 und j2 führt also auf die Beziehung ⟨j2 , j1 ; m2 , m1 | J, M⟩ = (−1)j1 +j2 −J ⟨j1 , j2 ; m1 , m2 | J, M⟩
(25)
3-c Wechsel des Vorzeichens von M, m1 und m2 Wir haben in diesem Kapitel alle Vektoren |J, M⟩ (und damit die Clebsch-Gordan-Ko effizienten) aus den Vektoren |J, J⟩ konstruiert, indem wir den Operator J − angewandt haben. Wir können umgekehrt mit dem Vektor |J, −J⟩ beginnen und J+ verwenden. Die weiteren Überlegungen sind dann genau gleich, und für die Vektoren |J, −M⟩ finden wir dieselben Koeffizienten in der Entwicklung nach den |j1 , j2 ; −m1 , −m2 ⟩ wie für die Vektoren |J, M⟩, wenn sie nach den |j1 , j2 ; m1 , m2 ⟩ entwickelt werden. Der einzige Unterschied, der auftreten kann, hängt mit den Phasenkonventionen für die Vektoren |J, M⟩ zusammen, da die zur Bedingung (16) analoge Beziehung dann verlangt, dass ⟨j1 , j2 ; −j1 , −J + j1 | J, −J⟩ reell und positiv ist. Nach (24) ist aber das Vorzeichen dieses Koeffizienten tatsächlich gleich (−1)j1 +j2 −J . Also gilt ⟨j1 , j2 ; −m1 , −m2 | J, −M⟩ = (−1)j1 +j2 −J ⟨j1 , j2 ; m1 , m2 | J, M⟩
(26)
Setzen wir insbesondere m1 = m2 = 0, so sehen wir, dass der Koeffizient ⟨j1 , j2 ; 0, 0 | J, 0⟩ verschwindet, wenn j1 + j2 − J eine ungerade Zahl ist.
3-d Die Koeffizienten ⟨j, j; m, −m | 0, 0⟩ Der Ungleichung (3a) folgend kann J nur null sein, wenn j1 und j2 gleich sind. Wir setzen daher in Gl. (13) die Werte j1 = j2 = j, m1 = m, m2 = −m − 1 und J = M = 0 ein; wir erhalten ⟨j, j; m + 1, −(m + 1) | 0, 0⟩ = −⟨j, j; m, −m | 0, 0⟩
(27)
Alle Koeffizienten ⟨j, j; m, −m | 0, 0⟩ haben daher den gleichen Betrag. Ihr Vorzei chen wechselt, wenn m sich um eins ändert, und wird durch (−1)j−m gegeben, da ⟨j, j; j, −j | 0, 0⟩ positiv ist. Unter Verwendung der Orthogonalitätsrelation (7b), aus
Clebsch-Gordan-Koeffizienten |
1049
•
der j
∑ ⟨j, j; m, −m | 0, 0⟩2 = 1
(28)
m=−j
folgt, finden wir ⟨j, j; m, −m | 0, 0⟩ =
(−1)j−m √2j + 1
(29)
Referenzen und Literaturhinweise Messiah (1.17), Anhang C; Rose (2.19), Kap. III und Anhang I; Edmonds (2.21), Kap. 3; Sobel’man (11.12), Kap. 4, § 13. Tabellen der Clebsch-Gordan-Koeffizienten: Condon und Shortley (11.13), Kap. III, § 14; Bacry (10.34), Anhang C. Tabellen der Koeffizienten 3j und 6j: Edmonds (2.21), Tabelle 2; Rotenberg et al. (10.48).
•
1050 | Ergänzung CX
Ergänzung CX Addition von Kugelflächenfunktionen 1 2 3
Die Funktionen Φ M J (Ω 1 ; Ω 2 ) | 1050 Die Funktionen F lm (Ω) | 1051 Entwicklung eines Produkts von Kugelflächenfunktionen | 1053
In diesem Abschnitt verwenden wir die Eigenschaften der Clebsch-Gordan-Koeffizi enten, um Gleichungen aufzustellen, die später, insbesondere in den Ergänzungen EX und AXIII , von Nutzen sein werden: Es sind die Additionsrelationen für die Kugelflä chenfunktionen. Zu diesem Zweck beginnen wir mit der Einführung und Untersu chung der Funktionen zweier Sätze von Polarwinkeln Ω1 und Ω2 , den Funktionen ΦM J (Ω 1 ; Ω 2 ).
1 Die Funktionen Φ M J (Ω 1 ; Ω 2 ) Wir betrachten zwei Teilchen (1) und (2) mit den Zustandsräumen Hr1 und Hr2 und den Bahndrehimpulsen L1 und L2 . Für den Raum Hr1 wählen wir eine Standardbasis, gebildet durch die Vektoren {|φ k1 ,l 1 ,m1 ⟩}, mit den entsprechenden Wellenfunktionen m
φ k1 ,l 1 ,m1 (r1 ) = R k1 ,l 1 (r1 )Y l 1 1 (Ω1 )
(1)
(Ω1 bezeichnet den Satz der Polarwinkel {θ1 , φ1 } des ersten Teilchens). In gleicher Weise wählen wir für Hr2 eine Standardbasis {|φ k2 ,l 2 ,m2 ⟩}. Wir wollen im Folgenden die Zustände der Teilchen auf die Unterräume H(k 1 , l1 ) und H(k 2 , l2 ) beschränken, wobei k 1 , l1 , k 2 und l2 fest vorgegeben sind und die Radialfunktionen R k1 ,l 1 (r1 ) und R k2 ,l 2 (r2 ) keine Rolle spielen. Der Drehimpuls des Gesamtsystems (1) + (2) ist J = L1 + L2
(2)
Wir können eine Basis von H(k 1 , l1 ) ⊗ H(k 2 , l2 ) konstruieren, die aus den gemeinsa 2 2 men Eigenvektoren |Φ M J ⟩ von J (Eigenwert J(J + 1)ℏ ) und J z (Eigenwert Mℏ) gebildet wird. Diese Vektoren haben die Form |Φ M J ⟩=
l1
∑
l2
∑ ⟨l1 , l2 ; m1 , m2 | J, M⟩|φ k1 ,l 1 ,m1 (1)⟩ ⊗ |φ k2 ,l 2 ,m2 (2)⟩
(3a)
m1 =−l 1 m2 =−l 2
wobei der umgekehrte Basiswechsel gegeben wird durch |φ k1 ,l 1 ,m1 (1)⟩ ⊗ |φ k2 ,l 2 ,m2 (2)⟩ =
l 1 +l 2
∑
J
∑ ⟨l1 , l2 ; m1 , m2 | J, M⟩|Φ M J ⟩
J=|l 1−l 2 | M=−J https://doi.org/10.1515/9783110638769-011
(3b)
Addition von Kugelflächenfunktionen | 1051
•
Wie Gl. (3a) zeigt, wird die Winkelabhängigkeit der Zustände |Φ M J ⟩ durch die folgen den Funktionen beschrieben: ΦM J (Ω 1 ; Ω 2 ) =
l1
l2
∑
m
m
∑ ⟨l1 , l2 ; m1 , m2 | J, M⟩ Y l 1 1 (Ω1 )Y l 2 2 (Ω2 )
(4a)
m1 =−l 1 m2 =−l 2
Analog folgt aus Gl. (3b) Y lm1 1 (Ω1 )Y lm2 2 (Ω2 ) =
l 1 +l 2
∑
J
∑ ⟨l1 , l2 ; m1 , m2 | J, M⟩Φ M J (Ω 1 ; Ω 2 )
(4b)
J=|l 1−l 2 | M=−J
Im Raum der Wellenfunktionen entsprechen die Observablen L1 und L2 Differential operatoren, die auf die Variablen Ω1 = {θ1 , φ1 } und Ω2 = {θ2 , φ2 } wirken; insbeson dere gilt ℏ ∂ i ∂φ1 ℏ ∂ ⇒ i ∂φ2
L1z ⇒
(5a)
L2z
(5b)
Da nach Konstruktion der Vektor |Φ M J ⟩ ein Eigenvektor von J z = L 1z + L 2z ist, können wir schreiben ℏ ∂ ∂ M + ) ΦM ( J (θ 1 , φ 1 ; θ 2 , φ 2 ) = Mℏ Φ J (θ 1 , φ 1 ; θ 2 , φ 2 ) i ∂φ1 ∂φ2
(6)
Darüber hinaus gilt M±1 √ ⟩ J ± |Φ M J ⟩ = ℏ J(J + 1) − M(M ± 1) |Φ J
(7)
woraus gemäß den Gleichungen (D-6) aus Kapitel VI folgt {e±iφ1 [±
∂ ∂ ∂ ∂ + i cot θ1 ] + e±iφ2 [± + i cot θ2 ]} × Φ M J (θ 1 , φ 1 ; θ 2 , φ 2 ) ∂θ1 ∂φ1 ∂θ2 ∂φ2
= √J(J + 1) − M(M ± 1) Φ JM±1 (θ1 , φ1 ; θ2 , φ2 )
(8)
2 Die Funktionen F lm (Ω) Wir führen die Funktionen F lm ein, die definiert sind durch M=m F lm (θ, φ) ≡ F lm (Ω) = Φ J=l (Ω1 = Ω; Ω2 = Ω)
(9)
F lm hängt nur von einem Paar von Polarwinkeln Ω = {θ, φ} ab und kann daher die Win kelabhängigkeit einer Wellenfunktion beschreiben, die zu einem Teilchen mit dem Zu standsraum Hr und dem Drehimpuls L gehört. Wir werden sehen, dass F lm keine neue Funktion, sondern proportional zur Kugelflächenfunktion Y lm ist.
•
1052 | Ergänzung CX
Um das zu beweisen, zeigen wir, dass F lm Eigenfunktion von L2 und L z mit den Eigenwerten l(l + 1)ℏ2 und mℏ ist. Wir beginnen damit, die Wirkung von L z auf F lm zu berechnen: Nach Gl. (9) hängt F lm von θ und φ über Ω1 = {θ1 , φ1 } und Ω2 = {θ2 , φ2 } ab, die beide gleich Ω gesetzt werden. Unter Anwendung der Kettenregel für die Dif ferentiation von Funktionen erhalten wir ℏ ∂ m F (θ, φ) i ∂φ l ∂ ℏ ∂ M=m = {[ + (Ω1 ; Ω2 )} ] Φ J=l i ∂φ1 ∂φ2 Ω 1 =Ω 2 =Ω
L z F lm (θ, φ) =
(10)
Gleichung (6) ergibt dann L z F lm (θ, φ) = mℏ F lm (θ, φ)
(11)
womit ein Teil des gewünschten Nachweises geführt ist. Um die Wirkung von L2 auf F lm zu berechnen, verwenden wir die Beziehung L2 =
1 (L+ L− + L− L+ ) + L2z 2
(12)
Indem wir nun ähnlich wie bei der Ableitung von Gl. (10) und Gl. (11) argumentieren, führt uns Gl. (8) auf L± F lm (θ, φ) = ℏ√l(l + 1) − m(m ± 1) F lm±1 (θ, φ)
(13)
Damit ergibt dann Gl. (12) ℏ2 {[l(l + 1) − m(m − 1)] [l(l + 1) − m(m + 1)] + 2m 2 } F lm (θ, φ) 2 (14) = l(l + 1)ℏ2 F lm (θ, φ)
L2 F lm (θ, φ) =
Die Funktion F lm , die nach Gl. (11) Eigenfunktion von L z mit dem Eigenwert mℏ ist, ist also auch Eigenfunktion von L2 mit dem Eigenwert l(l + 1)ℏ2 . Da L2 und L z einen V. S. K. O. im Raum der Funktionen von θ und φ bilden, ist F lm notwendig proportional zur Kugelflächenfunktion Y lm . Mit Hilfe von Gl. (13) können wir leicht zeigen, dass der Proportionalitätskoeffizient nicht von m abhängt, F lm (θ, φ) = λ(l) Y lm (θ, φ)
(15)
Den Proportionalitätsfaktor λ(l) müssen wir nun berechnen. Dazu wählen wir ei ne bestimmte Raumrichtung, nämlich die z-Richtung (θ = 0, φ unbestimmt). Auf der z-Achse müssen alle Kugelflächenfunktionen Y lm bis auf die für m = 0 verschwinden¹.
1 Da die Y lm proportional zu eimφ sind, müssen sie gleich null sein, damit der Wert von Y lm auf der z-Achse eindeutig bestimmt ist; s. die Gleichungen (66), (67) und (69) aus Ergänzung AVI .
Addition von Kugelflächenfunktionen | 1053
•
Für m = 0 ist die Kugelflächenfunktion Y lm (θ = 0, φ) [s. Ergänzung AVI , Gl. (58) und Gl. (60)] Y l0 (θ = 0, φ) = √
2l + 1 4π
(16)
Indem wir diese Ergebnisse in Gl. (4a) und Gl. (9) einsetzen, finden wir F lm=0 (θ = 0, φ) = ⟨l1 , l2 ; 0, 0 | l, 0⟩
√(2l1 + 1)(2l2 + 1) 4π
(17)
Außerdem gilt nach Gl. (15) und Gl. (16) 2l + 1 F lm=0 (θ = 0, φ) = λ(l)√ 4π
(18)
so dass wir erhalten λ(l) = √
(2l1 + 1)(2l2 + 1) ⟨l1 , l2 ; 0, 0 | l, 0⟩ 4π(2l + 1)
(19)
3 Entwicklung eines Produkts von Kugelflächenfunktionen Mit (9), (15) und (19) folgt aus den Gleichungen (4a) und (4b) −1
Y lm (Ω)
(2l1 + 1)(2l2 + 1) ⟨l1 , l2 ; 0, 0 | l, 0⟩] = [√ 4π(2l + 1) [ ] m m × ∑ ∑⟨l1 , l2 ; m1 , m2 | l, m⟩ Y l 1 1 (Ω)Y l 2 2 (Ω)
(20)
m1 m2
und m
m
Y l 1 1 (Ω)Y l 2 2 (Ω)/
l 1 +l 2
∑
l
∑√
l=|l 1−l 2 | m=−l
(2l1 + 1)(2l2 + 1) ⟨l1 , l2 ; 0, 0 | l, 0⟩ 4π(2l + 1)
× ⟨l1 , l2 ; m1 , m2 | l, m⟩ Y lm (Ω)
(21)
Diese letzten Beziehungen (in der die Summation über m eigentlich unnötig ist, da die einzigen nichtverschwindenden Terme notwendig m = m1 +m2 erfüllen) werden Addi tionsrelationen für Kugelflächenfunktionen genannt². Nach Gl. (26) aus Ergänzung BX ist der Clebsch-Gordan-Koeffizient ⟨l1 , l2 ; 0, 0 | l, 0⟩ nur dann von null verschieden, m m wenn l1 + l2 − l gerade ist. Das Produkt Y l 1 1 (Ω)Y l 2 2 (Ω) kann daher nur in Kugelflä chenfunktionen der Ordnungen l = l1 + l2 , l1 + l2 − 2 , l1 + l2 − 4 , . . . , |l1 − l2 | 2 Im Spezialfall l 2 = 1, m 2 = 0 [Y10 (θ, φ) ∝ cos θ] führen diese auf Gl. (35) aus Ergänzung AVI .
(22)
•
1054 | Ergänzung CX
entwickelt werden. In Gl. (21) ist die Parität (−1)l der Terme in der Entwicklung auf der rechten Seite tatsächlich gleich (−1)l 1 +l 2 , also gleich der Parität des Produkts, das die linke Seite bildet. Wir wollen die Additionsrelationen für die Kugelflächenfunktionen verwenden, um das Integral m
m
m
I = ∫ Y l 1 1 (Ω)Y l 2 2 (Ω)Y l 3 3 (Ω) d Ω
(23)
zu berechnen. Setzen wir Gl. (21) in (23) ein, so erhalten wir Ausdrücke vom Typ m
K(l, m; l3 , m3 ) = ∫ Y lm (Ω)Y l 3 3 (Ω) d Ω
(24)
die sich mit Hilfe der Konjugationsrelationen für Kugelflächenfunktionen und den Orthogonalitätsrelationen [s. Ergänzung AVI , Gl. (55) und Gl. (45)] zu K(l, m; l3 , m3 ) = (−1)m δ ll 3 δ m,−m3
(25)
ergeben. Für den Wert von I erhalten wir daher ∫ Y l 1 1 (Ω)Y l 2 2 (Ω)Y l 3 3 (Ω) dΩ = (−1)m3 √ m
m
m
(2l1 + 1)(2l2 + 1) 4π(2l3 + 1)
× ⟨l1 , l2 ; 0, 0 | l3 , 0⟩⟨l1 , l2 ; m1 , m2 | l3 , −m3 ⟩ (26) Dieses Integral ist nur dann von null verschieden, 1. wenn m1 + m2 + m3 = 0 gilt, was man auch direkt hätte sehen können, wenn man die Integration über φ in Gl. (23) ausführt: 2π
∫ dφ ei(m1 +m2 +m3 )φ = δ0,m1 +m2 +m3 0
2. 3.
wenn sich aus den drei Strecken der Längen l1 , l2 und l3 ein Dreieck bilden lässt; wenn l1 + l2 − l3 gerade ist (das ist notwendig, damit ⟨l1 , l2 ; 0, 0 | l3 , 0⟩ ungleich m m null ist), d. h. wenn das Produkt der drei Kugelflächenfunktionen Y l 1 1 , Y l 2 2 und m3 Y l 3 eine gerade Funktion ist (offensichtlich eine notwendige Bedingung, damit das Integral über alle Raumrichtungen nicht verschwindet).
Durch Gl. (26) wird für den speziellen Fall der Kugelflächenfunktionen ein allgemeine res Theorem ausgedrückt, das sogenannte Wigner-Eckart-Theorem (s. Ergänzung DX ).
Das Wigner-Eckart-Theorem |
1055
•
Ergänzung DX Das Wigner-Eckart-Theorem 1 2 2-a 2-b 2-c 3 3-a 3-b
Definition von Vektoroperatoren | 1056 Das Wigner-Eckart-Theorem für Vektoroperatoren | 1057 Nichtverschwindende Matrixelemente von V | 1057 Proportionalität zwischen Matrixelementen von J und V | 1058 Das Projektionstheorem | 1061 Anwendung: Berechnung des Landé-Faktors | 1062 Rotationsentartungen. Multipletts | 1063 Aufhebung der Entartung durch ein Magnetfeld | 1064
In Ergänzung BVI , § 5-b führten wir den Begriff eines skalaren Operators ein: Man versteht darunter einen Operator A, der mit dem Drehimpuls des betrachteten Sys tems vertauscht. Eine wichtige Eigenschaft dieser Operatoren ist (s. Ergänzung BVI , § 6-c-β), dass in einer Standardbasis {|k, j, m⟩} die nichtverschwindenden Matrixele mente ⟨k, j, m | A | k , j , m ⟩ eines skalaren Operators die Bedingungen j = j und m = m erfüllen müssen; darüber hinaus hängen diese Matrixelemente nicht von m ab,¹ weshalb wir schreiben können ⟨k, j, m | A | k , j , m ⟩ = a j (k, k )δ jj δ mm
(1)
Insbesondere erhalten wir für feste Werte von k und j, also für die „Einschränkung“ von A (s. Ergänzung BII , § 3) auf den Unterraum H(k, j), aufgespannt durch die (2j + 1) Vektoren |k, j, m⟩ (m = −j, −j + 1, . . . , +j), eine sehr einfache (2j + 1) × (2j + 1)-Matrix: Sie ist diagonal, und die Diagonalelemente sind alle gleich. Betrachten wir nun einen anderen skalaren Operator B. Die zugehörige Matrix im Unterraum H(k, j) besitzt dieselbe Eigenschaft: Sie ist proportional zur Einheitsmatrix. Die zu B gehörende Matrix kann daher leicht aus der zu A gehörenden gewonnen wer den, indem man alle (diagonalen) Matrixelemente mit derselben Konstanten multipli ziert. Wie wir sehen, sind die Einschränkungen zweier skalarer Operatoren auf einen Unterraum H(k, j) immer proportional zueinander. Wenn wir den Projektor auf den Unterraum H(k, j) mit P(k, j) bezeichnen, können wir dieses Ergebnis schreiben als² P(k, j) B P(k, j) = λ(k, j) P(k, j) A P(k, j)
(2)
Gegenstand dieses Abschnitts ist es, andere Operatoren zu untersuchen, die ähn liche Eigenschaften wie die soeben wiederholten aufweisen: die Vektoroperatoren.
1 Der Beweis dieser Eigenschaften wurde in Ergänzung BVI gegeben. Wir werden auf diesen Punkt in § 3-a zurückkommen, wo wir die Matrixelemente eines skalaren Hamilton-Operators untersuchen. 2 Für zwei gegebene Operatoren A und B hängt der Proportionalitätskoeffizient im Allgemeinen vom Unterraum H(k, j) ab; deshalb schreiben wir λ(k, j). https://doi.org/10.1515/9783110638769-012
•
1056 | Ergänzung DX
Wir werden sehen, dass die Matrixelemente der Vektoren V und V Auswahlregeln gehorchen, die wir beweisen wollen. Darüber hinaus werden wir zeigen, dass die Ein schränkungen von V und V auf H(k, j) immer proportional zueinander sind: P(k, j) V P(k, j) = μ(k, j) P(k, j) V P(k, j)
(3)
Diese Aussagen stellen das Wigner-Eckart-Theorem für Vektoroperatoren dar. Bemerkung: Das Wigner-Eckart-Theorem ist eigentlich eine sehr viel allgemeinere Aussage. Zum Beispiel er laubt es uns, Auswahlregeln für die Matrixelemente von V zwischen zwei Vektoren, die zu unter schiedlichen Unterräumen H(k, j) und H(k , j ) gehören, zu erhalten oder diese Elemente mit den entsprechenden Elementen von V in Verbindung zu setzen. Das Wigner-Eckart-Theorem kann auch auf eine ganze Klasse von Operatoren angewendet werden, von denen Skalare und Vektoren nur Spezialfälle sind: die irreduziblen Tensoroperatoren (s. Aufgabe 8 in Ergänzung GX ), die wir hier allerdings nicht behandeln wollen.
1 Definition von Vektoroperatoren Wie wir in § 5-c von Ergänzung BVI zeigten, handelt es sich bei einer Observablen V um einen Vektor, wenn ihre drei Komponenten V x , V y und V z in einem orthonormalen x, y, z-Koordinatensystem die folgenden Vertauschungsrelationen erfüllen: [J x , V x ] = 0
(4a)
[J x , V y ] = iℏ V z
(4b)
[J x , V z ] = −iℏ V y
(4c)
zusammen mit den sich durch zyklisches Vertauschen der Indizes x, y und z ergeben den Relationen. Wir geben einige Beispiele für Vektoroperatoren an: 1. Der Drehimpuls J ist selbst ein Vektor; ersetzt man in den Ausdrücken (4) V durch J, erhält man die definierenden Eigenschaften für einen Drehimpuls (s. Kapi tel VI). 2. Für ein spinloses Teilchen, dessen Zustandsraum Hr ist, gilt J = L. Man kann dann zeigen, dass R und P Vektoroperatoren sind. So gilt z. B.
3.
[L x , X] = [YP z − ZP y , X] = 0
(5a)
[L x , Y] = [−ZP y , Y] = iℏ Z
(5b)
[L x , Z] = [YP z , Z] = −iℏ Y
(5c)
Für ein Teilchen mit dem Spin S, dessen Zustandsraum Hr ⊗ HS ist, wird J durch J = L+S gegeben. In diesem Fall sind die Operatoren L, R, S, P Vektoren. Beachten wir, dass alle Spinoperatoren (die nur in HS wirken) mit den Bahnoperatoren (die nur in Hr wirken) vertauschen, so folgt der Beweis dieser Eigenschaft sofort aus (1) und (2).
Das Wigner-Eckart-Theorem | 1057
4.
•
Andererseits sind Operatoren des Typs L2 , L ⋅ S usw. keine Vektoren, sondern Ska lare (s. Bemerkung 1 in § 5-c von Ergänzung BVI ). Aus den angegebenen Operato ren können wir jedoch weitere Vektoroperatoren erhalten: R × S, (L ⋅ S)P usw. Betrachten wir das System (1) + (2), das aus der Vereinigung zweier Systeme ge bildet wird: (1) mit dem Zustandsraum H1 und (2) mit dem Zustandsraum H2 . Wenn V(1) ein nur in H1 wirkender Vektoroperator ist [d. h. er erfüllt die Vertau schungsrelationen (4) mit dem Drehimpuls J1 des ersten Systems], dann ist die Erweiterung von V(1) auf H1 ⊗ H2 ebenfalls ein Vektor. Zum Beispiel sind für ein Zweielektronensystem die Operatoren L1 , R1 , S1 usw. Vektoren.
2 Das Wigner-Eckart-Theorem für Vektoroperatoren 2-a Nichtverschwindende Matrixelemente von V Wir führen die Operatoren V+ , V− , J + und J − ein, die definiert werden durch V± = V x ± iV y J ± = J x ± iJ y
(6)
Mit Hilfe der Gleichungen (4) zeigen wir leicht [J x , V± ] = ∓ℏ V z
(7a)
[J y , V± ] = −iℏ V z
(7b)
[J z , V± ] = ±ℏ V±
(7c)
woraus die Vertauschungsrelationen von J± und V± folgen: [J + , V+ ] = 0
(8a)
[J+ , V− ] = 2ℏ V z
(8b)
[J − , V+ ] = −2ℏ V z
(8c)
[J − , V− ] = 0
(8d)
Wir betrachten nun die Matrixelemente von V in einer Standardbasis. Wie wir se hen werden, folgt aus der Tatsache, dass V ein Vektoroperator ist, dass eine große Anzahl von ihnen verschwindet. Zunächst werden wir zeigen, dass die Matrixelemen te ⟨k, j, m | V z | k , j , m ⟩ notwendig verschwinden, wenn m von m verschieden ist. Dazu genügt die Feststellung, dass V z und J z vertauschen [was sich nach zyklischer Vertauschung der Indizes aus Gl. (4a) ergibt]. Aus diesem Grund sind die Matrixele mente von V z zwischen zwei Vektoren |k, j, m⟩, die verschiedenen Eigenwerten mℏ von J z entsprechen, gleich null (s. Kap. II, § D-3-a-β). Für die Matrixelemente ⟨k, j, m | V± | k , j , m ⟩ von V± werden wir zeigen, dass sie nur dann von null verschieden sind, wenn m − m = ±1 gilt. Aus Gl. (7c) erhalten wir J z V± = V± J z ± ℏ V±
(9)
•
1058 | Ergänzung DX
Wenden wir beide Seiten dieser Beziehung auf den Vektor |k , j , m ⟩ an, so ergibt sich J z (V± |k , j , m ⟩) = V± J z |k , j , m ⟩ ± ℏ V± |k , j , m ⟩ = (m ± 1)ℏ V± |k , j , m ⟩
(10)
Aus dieser Gleichung folgt, dass V± |k , j , m ⟩ Eigenvektor von J z mit dem Eigen wert (m ± 1)ℏ ist. Da zwei Eigenvektoren des hermiteschen Operators J z mit un terschiedlichen Eigenwerten orthogonal sind, muss demnach das Skalarprodukt ⟨k, j, m | V± | k , j , m ⟩ für m ≠ m ± 1 gleich null sein.³ Zusammenfassend erhalten wir also die folgenden Auswahlregeln für die Matrix elemente des Operators V: V z ⇒ ∆m = m − m = 0
(11a)
(11b)
(11c)
V+ ⇒ ∆m = m − m = +1 V− ⇒ ∆m = m − m = −1
Aus diesen Ergebnissen können wir leicht auf die Form der Matrizen schließen, die die Einschränkungen der Komponenten von V auf einen Unterraum H(k, j) darstellen. Die zu V z gehörende Matrix ist diagonal, und die zu V± gehörenden haben nur unmittelbar über und unter der Hauptdiagonalen nichtverschwindende Matrixelemente.
2-b Proportionalität zwischen Matrixelementen von J und V α Matrixelemente von V+ und V− Da das Matrixelement des Kommutators (8a) zwischen dem Bravektor ⟨k, j, m + 2| und dem Ketvektor |k, j, m⟩ verschwindet, können wir schreiben ⟨k, j, m + 2 | J + V+ | k, j, m⟩ = ⟨k, j, m + 2 | V+ J + | k, j, m⟩
(12)
Auf beiden Seiten dieser Gleichung fügen wir zwischen den Operatoren J+ und V+ die Vollständigkeitsrelation ∑ |k , j , m ⟩⟨k , j , m | = 1
(13)
k ,j ,m
ein. So erhalten wir die Matrixelemente ⟨k, j, m | J + | k , j , m ⟩ von J+ ; aufgrund der Konstruktion der Standardbasis {|k, j, m⟩} sind sie nur dann von null verschieden, 3 Man sollte nicht folgern, dass V± |k, j, m⟩ notwendig proportional zu |k, j, m ± 1⟩ ist. Die obige Ar gumentation zeigt nur, dass gilt V± |k, j, m⟩ = ∑ ∑ c k ,j |k , j , m ± 1⟩ k j
Damit wir z. B. die Summation über j weglassen dürften, wäre es notwendig, dass V± mit J2 ver tauscht, was im Allgemeinen nicht der Fall ist.
Das Wigner-Eckart-Theorem
•
| 1059
wenn k = k , j = j und m = m + 1 gilt. Die Summationen über k , j und m sind daher überflüssig und Gl. (12) lautet dann ⟨k, j, m + 2 | J + | k, j, m + 1⟩⟨k, j, m + 1 | V+ | k, j, m⟩ = ⟨k, j, m + 2 | V+ | k, j, m + 1⟩⟨k, j, m + 1 | J + | k, j, m⟩
(14)
d. h. ⟨k, j, m + 1 | V+ | k, j, m⟩ ⟨k, j, m + 2 | V+ | k, j, m + 1⟩ = ⟨k, j, m + 1 | J + | k, j, m⟩ ⟨k, j, m + 2 | J+ | k, j, m + 1⟩
(15)
(solange die in dieser Gleichung auftretenden Bra- und Ketvektoren existieren, d. h. wenn j − 2 ≥ m ≥ −j gilt, lässt sich sofort zeigen, dass der Nenner nie null werden kann). Indem wir die so erhaltene Gleichung für m = −j, −j + 1, . . . , j − 2 niederschrei ben, erhalten wir ⟨k, j, −j + 1 | V+ | k, j, −j⟩ ⟨k, j, −j + 2 | V+ | k, j, −j + 1⟩ = = ... ⟨k, j, −j + 1 | J+ | k, j, −j⟩ ⟨k, j, −j + 2 | J+ | k, j, −j + 1⟩ ⟨k, j, m + 1 | V+ | k, j, m⟩ = ... = ⟨k, j, m + 1 | J+ | k, j, m⟩ ⟨k, j, j | V+ | k, j, j − 1⟩ = ⟨k, j, j | J+ | k, j, j − 1⟩
(16)
d. h. wenn wir den gemeinsamen Wert dieser Verhältnisse mit α + (k, j) bezeichnen, ⟨k, j, m + 1 | V+ | k, j, m⟩ = α+ (k, j) ⟨k, j, m + 1 | J + | k, j, m⟩
(17)
wobei α+ (k, j) von k und j, aber nicht von m abhängt. Außerdem folgt aus der Auswahlregel (11b), dass alle Matrixelemente ⟨k, j, m | V+ | k, j, m ⟩ und ⟨k, j, m | J + | k, j, m ⟩ für ∆m = m − m ≠ +1 verschwinden. Damit erhal ten wir für beliebige m und m ⟨k, j, m | V+ | k, j, m ⟩ = α + (k, j) ⟨k, j, m | J + | k, j, m ⟩
(18a)
Dieses Ergebnis drückt die Tatsache aus, dass alle Matrixelemente von V+ innerhalb H(k, j) proportional zu denen von J + sind. Eine analoge Überlegung lässt sich auf das Matrixelement des Kommutators (8d) zwischen dem Bravektor ⟨k, j, m − 2| und dem Ketvektor |k, j, m⟩ anwenden. Das führt uns auf ⟨k, j, m | V− | k, j, m ⟩ = α − (k, j) ⟨k, j, m | J − | k, j, m ⟩
(18b)
Diese Gleichung drückt aus, dass die Matrixelemente von V− und J − innerhalb von H(k, j) proportional zueinander sind.
•
1060 | Ergänzung DX
β Matrixelemente von V z Um die Matrixelemente von V z mit denen von J z zu verknüpfen, betrachten wir nun den Kommutator (8c) zwischen dem Bravektor ⟨k, j, m| und dem Ketvektor |k, j, m⟩: −2ℏ⟨k, j, m | V z | k, j, m⟩ = ⟨k, j, m | (J− V+ − V+ J − ) | k, j, m⟩ = ℏ√j(j+1) − m(m+1)⟨k, j, m + 1 | V+ | k, j, m⟩ − ℏ√j(j+1) − m(m−1)⟨k, j, m | V+ | k, j, m−1⟩
(19)
Mit Gl. (18a) erhalten wir 1 ⟨k, j, m | V z | k, j, m⟩ = − α + (k, j) {√j(j + 1) − m(m + 1)⟨k, j, m + 1 | J + | k, j, m⟩ 2 −√j(j + 1) − m(m − 1)⟨k, j, m | J + | k, j, m − 1⟩} ℏ = − α + (k, j) {j(j + 1) − m(m + 1) − j(j + 1) + m(m − 1)} 2
(20)
d. h. ⟨k, j, m | V z | k, j, m⟩ = mℏ α + (k, j)
(21)
Ausgehend von dem Kommutator (8b) und Gl. (18b) führt uns analoges Vorgehen auf ⟨k, j, m | V z | k, j, m⟩ = mℏ α − (k, j)
(22)
Wie Gl. (21) und Gl. (22) zeigen, sind α + (k, j) und α − (k, j) notwendig gleich, und wir werden von nun an ihren gemeinsamen Wert mit α(k, j) bezeichnen: α(k, j) = α + (k, j) = α − (k, j)
(23)
Außerdem folgt aus diesen Beziehungen ⟨k, j, m | V z | k, j, m ⟩ = α(k, j)⟨k, j, m | J z | k, j, m ⟩
(24)
γ Verallgemeinerung auf eine beliebige Komponente von V Jede Komponente von V ist eine Linearkombination von V+ , V− und V z . Wir können daher die Beziehungen nach den Gleichungen (23), (18a), (18b) und (24) zusammen fassen und schreiben ⟨k, j, m | V | k, j, m ⟩ = α(k, j)⟨k, j, m | J | k, j, m ⟩
(25)
Also sind innerhalb von H(k, j) alle Matrixelemente von V proportional zu denen von J. Dieses Ergebnis stellt das Wigner-Eckart-Theorem für einen speziellen Fall dar. Indem wir die „Einschränkungen“ von V und J auf H(k, j) einführen (s. Ergänzung BII , § 3), können wir auch P(k, j) V P(k, j) = α(k, j) P(k, j) J P(k, j) schreiben.
(26)
Das Wigner-Eckart-Theorem
| 1061
•
Bemerkung: Der Operator J vertauscht mit P(k, j) [s. Gl. (27)]; da darüber hinaus [P(k, j)]2 = P(k, j) gilt, können wir einen Projektionsoperator P(k, j) auf der rechten Seite von Gl. (26) weglassen.
2-c Das Projektionstheorem Wir betrachten den Operator J ⋅ V; seine Einschränkung auf H(k, j) wird durch P(k, j) J ⋅ V P(k, j) gegeben. Um diesen Ausdruck umzuformen, benutzen wir die Be ziehung [J, P(k, j)] = 0
(27)
Ihre Gültigkeit zeigen wir, indem wir auf einen beliebigen Vektor der {|k, j, m⟩}-Basis die Kommutatoren [J z , P(k, j)] und [J ± , P(k, j)] anwenden. Mit Gl. (26) erhalten wir dann P(k, j) J ⋅ V P(k, j) = J ⋅ [P(k, j) V P(k, j)] = α(k, j) J2 P(k, j) = α(k, j) j(j + 1)ℏ2 P(k, j)
(28)
Die Einschränkung des Operators J ⋅ V auf den Raum H(k, j) ist also gleich dem mit α(k, j)j(j+1)ℏ2 multiplizierten Einheitsoperator.⁴ Daher ist, wenn wir einen beliebigen normierten Zustand des Unterraums H(k, j) mit |ψ k,j ⟩ bezeichnen, der Erwartungs wert ⟨J ⋅ V⟩k,j unabhängig vom gewählten Vektor |ψ k,j ⟩, ⟨J ⋅ V⟩k,j = ⟨ψ k,j | J ⋅ V | ψ k,j ⟩ = α(k, j) j(j + 1)ℏ2
(29)
Setzen wir dies in Gl. (26) ein, so sehen wir, dass innerhalb des Unterraums H(k, j) gilt⁵ V=
⟨J ⋅ V⟩k,j ⟨J ⋅ V⟩k,j J= J ⟨J2 ⟩k,j j(j + 1)ℏ2
(30)
Dieses Resultat wird oft als Projektionstheorem bezeichnet: Unabhängig vom be trachteten physikalischen System und solange wir es nur mit Zuständen desselben Unterraums H(k, j) zu tun haben, können wir alle Vektoroperatoren proportional zu J annehmen. 4 Da J⋅V ein Skalar ist, war zu erwarten, dass seine Einschränkung proportional zum Einheitsoperator ist. 5 Wir sagen, eine Operatorrelation sei nur innerhalb eines gegebenen Unterraums gültig, wenn sie nur für die Einschränkungen der betrachteten Operatoren auf diesen Unterraum gilt. Um ganz genau zu sein, müssten wir also beide Seiten von Gl. (30) zwischen zwei Projektoren P(k, j) setzen.
•
1062 | Ergänzung DX
Man kann die folgende klassische physikalische Interpretation dieser Eigenschaft angeben (s. § 1 der Ergänzung FX ): Wenn j den Gesamtdrehimpuls eines isolierten phy sikalischen Systems bezeichnet, präzessieren alle physikalischen Größen des Systems um den konstanten Vektor j (s. Abb. 1). Insbesondere verbleibt für eine vektorielle Grö ße v nach Mittelung über die Zeit nur ihre Projektion v‖ auf j, d. i. ein Vektor parallel zu j, j⋅v (31) v‖ = 2 j j diese Gleichung ist analog zu Gl. (30).
Abb. 1: Klassische Deutung des Projektionstheorems: Da der Vektor v sehr schnell um den Gesamtdrehimpuls j präzessiert, ist nur seine statische Komponente v‖ beobachtbar. Bemerkungen: 1. Man kann aus Gl. (30) nicht schließen, dass V und J im gesamten Zustandsraum (der direkten Summe aller Unterräume H(k, j)) proportional zueinander sind. Es ist zu beachten, dass die Proportionalitätskonstante α(k, j) (oder ⟨J ⋅ V⟩k,j ) vom gewählten Unterraum H(k, j) abhängt. Außerdem kann ein Vektoroperator V nichtverschwindende Matrixelemente zwischen Vektoren, die zu verschiedenen Unterräumen H(k, j) gehören, besitzen, während die entsprechenden Matrixelemente von J immer verschwinden. 2. Wir betrachten einen zweiten Vektoroperator W. Seine Einschränkung auf H(k, j) ist propor tional zu J und damit auch zu der Einschränkung von V. Daher sind innerhalb eines Unterraums H(k, j) alle Vektoroperatoren zueinander proportional. Um jedoch den Proportionalitätskoeffizienten von V und W zu berechnen, können wir nicht einfach in Gl. (30) J durch W ersetzen (was den Wert ⟨V ⋅ W⟩k,j /⟨W2 ⟩k,j ergäbe). Zur Herleitung von Gl. (30) ver wenden wir in Gl. (28) die Tatsache, dass J mit P(k, j) vertauscht, was für W im Allgemeinen nicht der Fall ist. Um den Proportionalitätsfaktor richtig zu bestimmen, müssen wir beachten, dass innerhalb eines Unterraums H(k, j) ⟨J ⋅ W⟩k,j W= J (32) ⟨J2 ⟩k,j gilt; daraus folgt mit Gl. (30) ⟨J ⋅ V⟩k,j V= W ⟨J ⋅ W⟩k,j
(33)
3 Anwendung: Berechnung des Landé-Faktors In diesem Abschnitt wollen wir das Wigner-Eckart-Theorem anwenden, um den Ein fluss eines magnetischen Felds B auf die Energieniveaus eines Atoms zu berechnen. Wir werden sehen, dass sich mit diesem Theorem die Rechnungen beträchtlich ver einfachen und wir ganz allgemein vorhersagen können, dass ein magnetisches Feld
Das Wigner-Eckart-Theorem |
1063
•
Entartungen aufhebt und stattdessen äquidistante Energieniveaus erzeugt (in erster Ordnung in B). Die Energiedifferenz dieser Zustände ist proportional zu B und zu einer Konstanten g J (dem Landé-Faktor), die wir berechnen werden. Es sei L der Gesamtbahndrehimpuls der Elektronen eines Atoms (die Summe der einzelnen Bahndrehimpulse Li ) und S ihr Gesamtspin (die Summe der einzelnen Spins S i ). Der gesamte innere Drehimpuls (unter der Annahme, dass der Spin des Atomkerns null ist) ist dann J=L+S
(34)
Bei Abwesenheit des Magnetfelds bezeichnen wir den Hamilton-Operator des Atoms mit H0 ; H0 vertauscht mit J.⁶ Wir nehmen an, dass H0 , L2 , S2 , J2 und J z einen V. S. K. O. bilden und bezeichnen ihre gemeinsamen Eigenvektoren zu den Eigenwer ten E0 , L(L + 1)ℏ2 , S(S + 1)ℏ2 , J(J + 1)ℏ2 bzw. Mℏ mit |E0 , L, S, J, M⟩. Diese Annahme ist für eine gewisse Zahl von leichten Atomen erfüllt, für die die Drehimpulskopplung vom L ⋅ S-Typ ist (s. Ergänzung BXIV ). Bei anderen Atomen je doch, die eine andere Art der Kopplung aufweisen (z. B. bei den Edelgasen außer He lium), ist das nicht der Fall. Auf dem Wigner-Eckart-Theorem basierende Rechnungen können ähnlich wie hier durchgeführt werden, die physikalischen Grundideen blei ben gleich. Der Einfachheit halber beschränken wir uns hier auf den Fall, dass L und S für den zu untersuchenden Atomzustand gute Quantenzahlen sind. 3-a Rotationsentartungen. Multipletts Wir betrachten den Vektor J ± |E0 , L, S, J, M⟩. Nach unserer Voraussetzung vertauscht J ± mit H0 ; daher ist J ± |E0 , L, S, J, M⟩ Eigenvektor von H0 mit dem Eigenwert E0 . Nach den allgemeinen Eigenschaften von Drehimpulsen und ihrer Addition haben wir au ßerdem J ± |E0 , L, S, J, M⟩ = ℏ√J(J + 1) − M(M ± 1) J ± |E0 , L, S, J, M ± 1⟩
(35)
Diese Beziehung zeigt, dass wir aus einem Zustand |E0 , L, S, J, M⟩ andere Zustän de mit derselben Energie konstruieren können: diejenigen mit −J ≤ M ≤ J. Daraus folgt, dass der Eigenwert E0 mindestens (2J + 1)-fach entartet ist. Dabei handelt es sich um eine wesentliche Entartung, da sie mit der Drehinvarianz von H0 zusammen hängt (eine zufällige Entartung kann zusätzlich auftreten). In der Atomphysik wird das entsprechende (2J + 1)-fach entartete Energieniveau Multiplett genannt. Den zu gehörigen Eigenraum, der von den Vektoren |E0 , L, S, J, M⟩ mit M = J, J − 1, . . . , −J aufgespannt wird, bezeichnen wir mit H(E0 , L, S, J). 6 Diese allgemeine Eigenschaft folgt aus der Invarianz der Energie des Atoms gegenüber einer Dre hung aller Elektronen um eine Achse durch den Ursprung (den Ort des ruhenden Atomkerns). Der Operator H 0 , der bei Drehungen invariant ist, vertauscht daher mit J (H 0 ist ein skalarer Operator; s. Ergänzung BVI , § 5-b).
•
1064 | Ergänzung DX
3-b Aufhebung der Entartung durch ein Magnetfeld In Gegenwart eines Magnetfelds B parallel zur z-Achse wird der Hamilton-Operator des Systems (s. Ergänzung DVII ) H = H0 + H1
(36)
H1 = ωL (L z + 2S z )
(37)
mit
(der Faktor 2 vor S z stammt vom gyromagnetischen Verhältnis des Elektronenspins). Die Larmor-Frequenz ωL des Elektrons wird in Abhängigkeit von seiner Masse m und der Ladung q mit ωL = −
qB μB =− B 2m ℏ
(38)
definiert, worin μ B das Bohr-Magneton ist. Um den Einfluss des Magnetfelds auf die Energieniveaus des Atoms zu berech nen, untersuchen wir nur die Matrixelemente von H1 innerhalb des zum betrachteten Multiplett gehörenden Unterraums H(E0 , L, S, J). Die Störungstheorie, auf die wir in Kapitel XI eingehen werden, rechtfertigt dieses Vorgehen, solange B nicht zu groß ist. Im Unterraum H(E0 , L, S, J) gilt nach dem Projektionstheorem (s. § 2-c) ⟨L ⋅ J⟩E0 ,L,S,J J J(J + 1)ℏ2 ⟨S ⋅ J⟩E0 ,L,S,J J S= J(J + 1)ℏ2
L=
(39a) (39b)
worin ⟨L ⋅ J⟩E0 ,L,S,J und ⟨S ⋅ J⟩E0 ,L,S,J die Erwartungswerte der Operatoren L ⋅ J bzw. S ⋅ J für die zu H(E0 , L, S, J) gehörenden Zustände des Systems sind. Nun ist L ⋅ J = L ⋅ (L + S) = L2 +
1 2 (J − L2 − S2 ) 2
(40a)
1 2 (J − L2 − S2 ) 2
(40b)
sowie S ⋅ J = S ⋅ (L + S) = S2 + Daraus folgt ⟨L ⋅ J⟩E0 ,L,S,J = L(L + 1)ℏ2 +
ℏ2 [J(J + 1) − L(L + 1) − S(S + 1)] 2
(41a)
⟨S ⋅ J⟩E0 ,L,S,J = S(S + 1)ℏ2 +
ℏ2 [J(J + 1) − L(L + 1) − S(S + 1)] 2
(41b)
und
Das Wigner-Eckart-Theorem |
•
1065
Setzt man die Gleichungen (41) in (39) und dann in (37) ein, so wird der Operator H1 im Unterraum H(E0 , L, S, J) durch H1 = g J ωL J z
(42)
gegeben, wobei sich der Landé-Faktor g J des betrachteten Multipletts als gJ =
3 S(S + 1) − L(L + 1) + 2 2J(J + 1)
(43)
ergibt. Aus Gl. (42) folgt, dass im Unterraum H(E0 , L, S, J) die Eigenzustände von H1 die Basisvektoren |E0 , L, S, J, M⟩ mit den Eigenwerten E1 (M) = g J M ℏωL
(44)
sind. Wir sehen also, dass das Magnetfeld die Entartung des Multipletts vollständig aufhebt. Wie in Abb. 2 dargestellt, entsteht ein Satz von (2J + 1) äquidistanten Ener gieniveaus, die zu den einzelnen möglichen Werten von M gehören. Ein solches Dia gramm erlaubt die Verallgemeinerung unserer früheren Untersuchungen der Polari sation und Frequenz optischer Linien, die von einem gedachten Atom mit einem ein zelnen spinlosen Elektron („normaler“ Zeeman-Effekt, s. Ergänzung DVII ) abgestrahlt werden, auf Atome mit mehreren Elektronen, deren Spin berücksichtigt werden muss.
Abb. 2: Energiediagramm, das die Aufhebung der (2J + 1)-fachen Entartung eines Multipletts (hier J = 5/2) durch ein statisches Magnetfeld zeigt. Der Abstand zweier benachbarter Niveaus ist proportional zu |B| und zum Landé-Faktor g J .
Referenzen und Literaturhinweise Tensoroperatoren: Schiff (1.18), § 28; Messiah (1.17), Kap. XIII, § VI; Edmonds (2.21), Kap. 5; Rose (2.19), Kap. 5; Meijer und Bauer (2.18), Kap. 6.
•
1066 | Ergänzung EX
Ergänzung EX Elektrische Multipolmomente 1 1-a 1-b 1-c 1-d 2 2-a 2-b 2-c
Definition von Multipolmomenten | 1066 Entwicklung des Potentials nach Kugelflächenfunktionen | 1066 Physikalische Interpretation von Multipoloperatoren | 1069 Parität der Multipoloperatoren | 1072 Andere Möglichkeit der Einführung von Multipolmomenten | 1072 Matrixelemente elektrischer Multipolmomente | 1074 Allgemeiner Ausdruck für die Matrixelemente | 1074 Auswahlregeln | 1077 Physikalische Folgerungen | 1077
Wir betrachten ein System S aus N geladenen Teilchen, die sich in einem elektrosta tischen Potential U(r) befinden. In dieser Ergänzung wollen wir zeigen, wie man die Wechselwirkungsenergie des Systems S mit dem Potential U(r) berechnet, indem wir die elektrischen Multipolmomente von S einführen. Dazu erinnern wir uns zunächst, wie diese Momente in der klassischen Physik definiert sind. Dann konstruieren wir die entsprechenden quantenmechanischen Operatoren, unter deren Verwendung in einer Vielzahl der Fälle die Untersuchung der elektrostatischen Eigenschaften eines quantenmechanischen Systems beträchtlich vereinfacht wird. Der Grund dafür ist, dass diese Operatoren, unabhängig von dem gerade untersuchten System, allgemeine Eigenschaften besitzen, z. B. erfüllen sie gewisse Auswahlregeln. Hat beispielsweise das betrachtete System S einen Drehimpuls j [d. h. es gibt einen Eigenvektor von J2 mit dem Eigenwert j(j + 1)ℏ2 ], so werden die Erwartungswerte aller Multipoloperato ren von höherer Ordnung als 2j notwendig verschwinden.
1 Definition von Multipolmomenten 1-a Entwicklung des Potentials nach Kugelflächenfunktionen Der Einfachheit halber beginnen wir mit der Untersuchung eines Systems S, das aus einem Einzelteilchen am Ort r mit der Ladung q unter dem Einfluss des Potentials U(r) besteht. Wir werden dann die gewonnenen Ergebnisse auf ein N-Teilchensystem verallgemeinern. α Fall eines Einzelteilchens In der klassischen Physik wird die potentielle Energie des Teilchens gegeben durch V(r) = q U(r)
https://doi.org/10.1515/9783110638769-013
(1)
Elektrische Multipolmomente | 1067
•
Da die Kugelflächenfunktionen eine Basis für die Funktionen von θ und φ bilden, können wir U(r) entwickeln: ∞
l
U(r) = ∑ ∑ f l,m (r) Y lm (θ, φ)
(2)
l=0 m=−l
Wir wollen annehmen, dass sich die das elektrische Potential erzeugenden La dungen außerhalb des Raumbereichs befinden, in dem sich das untersuchte Teilchen bewegen kann. In diesem Bereich gilt dann ∆U(r) = 0
(3)
Wir wissen [s. Kap. VII, Gl. (A-15)], dass der Laplace-Operator ∆ in folgender Weise mit dem auf die Variablen θ und φ wirkenden Differentialoperator L2 zusammenhängt: ∆=
L2 1 ∂2 r − r ∂r2 ℏ2 r2
(4)
Außerdem gilt nach der Definition der Kugelflächenfunktionen L2 Y lm (θ, φ) = l(l + 1)ℏ2 Y lm (θ, φ)
(5)
Wir können daher leicht den Laplace-Operator auf die Entwicklung (2) anwenden. Set zen wir nach Gl. (3) jeden Term gleich null, so erhalten wir [
l(l + 1) 1 ∂2 r− ] f l,m (r) = 0 r ∂r2 r2
(6)
Diese Gleichung hat zwei linear unabhängige Lösungen: r l und r−(l+1) . Da U(r) für r = 0 nicht divergiert, muss gelten f l,m (r) = √
4π c l,m r l 2l + 1
(7)
wobei die Koeffizienten c l,m vom betrachteten Potential abhängen (wie später klar werden wird, ist der Faktor √4π/(2l + 1) der Bequemlichkeit halber eingeführt wor den). Wir können also Gl. (2) in der folgenden Form schreiben: ∞
l
V(r) = q U(r) = ∑ ∑ c l,m Qm l (r)
(8)
l=0 m=−l
worin die Funktionen Qm l (r) durch einen Ausdruck in Kugelkoordinaten definiert sind: √ Qm l (r) = q
4π l m r Y l (θ, φ) 2l + 1
(9)
•
1068 | Ergänzung EX
Dieselbe Art der Entwicklung ist in der Quantenmechanik möglich: Der Operator der potentiellen Energie des Teilchens ist V(R) = qU(R), und seine Matrixelemente in der {|r⟩}-Darstellung lauten (s. Ergänzung BII , § 4-b) ⟨r | qU(R) | r ⟩ = qU(r) δ(r − r )
(10)
Gleichung (8) ergibt dann ∞
l
V(R) = qU(R) = ∑ ∑ c l,m Q m l
(11)
l=0 m=−l
wobei die Operatoren Q m l durch m ⟨r | Q m l | r ⟩ = Q l (r) δ(r − r )
= q√
4π l m r Y l (θ, φ) δ(r − r ) 2l + 1
(12)
definiert sind. Die Q m l heißen elektrische Multipoloperatoren. β Verallgemeinerung auf N Teilchen Wir betrachten nun N Teilchen an den Orten r1 , r2 , . . . , rN mit den Ladungen q1 , q2 , . . . , q N . Ihre Kopplungsenergie mit dem äußeren Potential U(r) ist N
V(r1 , r2 , . . . , rN ) = ∑ q n U(rn )
(13)
n=1
Die Überlegungen des vorangegangenen Unterabschnitts lassen sich sofort verallge meinern: ∞
l
V(r1 , r2 , . . . , r N ) = ∑ ∑ c l,m Qm l (r1 , r2 , . . . , r N )
(14)
l=0 m=−l
wobei die Koeffizienten c l,m [die vom Potential U(r) abhängen)] dieselben Werte wie oben haben und die Funktionen Qm l in Polarkoordinaten ausgedrückt werden: √ Qm l (r1 , r2 , . . . , r N ) =
N 4π ∑ q n (r n )l Y lm (θ n , φ n ) 2l + 1 n=1
(15)
(θ n und φ n sind die Polarwinkel von rn ). Die Multipolmomente des Gesamtsystems sind daher einfach die Summen der zu den einzelnen Teilchen gehörenden Mo mente.
Elektrische Multipolmomente |
1069
•
Analog wird in der Quantenmechanik die Kopplungsenergie der N Teilchen mit dem äußeren Potential durch den Operator beschrieben ∞
l
V(R1 , R2 , . . . , RN ) = ∑ ∑ c l,m Q m l
(16)
l=0 m=−l
mit ⟨r1 , r2 , . . . , rN | Q m l | r1 , r2 , . . . , r N ⟩ = Qm l (r1 , r2 , . . . , r N ) δ(r1 − r1 ) δ(r2 − r2 ) . . . δ(r N − r N )
(17)
1-b Physikalische Interpretation von Multipoloperatoren α Der Operator Q00 ; die Gesamtladung des Systems Da Y 00 eine Konstante ist (Y00 = 1/√4π), folgt aus der Definition (15) N
Q00 = ∑ q n
(18)
n=1
Der Operator Q00 ist demnach eine Konstante, die gleich der Gesamtladung des Sys tems ist. Der erste Term der Entwicklung (14) gibt unter der Voraussetzung, dass sich alle Teilchen im Ursprung befinden, die Kopplungsenergie des Systems mit dem Potential U(r) an. Dabei handelt es sich offenbar um eine gute Näherung, wenn der relative Wert des Potentials über Abstände, die vergleichbar mit denen der Teilchen vom Ursprung sind, nicht stark variiert (ist das System S um den Ursprung zentriert, entspricht dieser Abstand der Größenordnung der Ausdehnung von S). Darüber hinaus gibt es einen Spezialfall, für den die Entwicklung (14) exakt durch den ersten Term gegeben wird: wenn das Potential U(r) konstant und daher proportional zur Kugelflächenfunktion mit l = 0 ist. β Die Operatoren Q1m ; das elektrische Dipolmoment Nach Gl. (15) und dem Ausdruck für die Kugelflächenfunktionen Y1m [s. Gleichun gen (32) aus Ergänzung AVI ] haben wir Q11 = −
1 ∑ q n (x n + iy n ) √2 n
Q01 = ∑ q n z n n
Q−1 1 =
1 ∑ q n (x n − iy n ) √2 n
(19)
•
1070 | Ergänzung EX
Diese drei Größen können als die Komponenten eines Vektors in der komplexen Basis von drei Vektoren e1 , e0 und e−1 aufgefasst werden: 0 1 𝓓 = −Q−1 1 e1 + Q1 e0 − Q1 e−1
(20)
mit 1 1 (21) (ex + iey ) ; e0 = ez ; e−1 = (ex − iey ) √2 √2 (worin ex , ey , ez die Einheitsvektoren in x-, y-, z-Richtung sind). Die Komponenten des Vektors 𝓓 in der x, y, z-Basis lauten dann 1 1 Q1x = [Q−1 1 − Q1 ] = ∑ q n x n √2 n i y 1 (22) Q1 = [Q−1 1 + Q1 ] = ∑ q n y n √2 n e1 = −
Q1z = Q01 = ∑ q n z n n
Wir erkennen hier die drei Komponenten des elektrischen Gesamtdipolmoments des Systems S in Bezug auf den Ursprung O, N
𝓓 = ∑ q n rn
(23)
n=1
Bei den Operatoren Q1m handelt es sich daher um die Komponenten des elektrischen Dipols D = ∑n q n Rn . Mit Hilfe der Beziehungen (19) können wir die l = 1-Terme der Entwicklung (14) in der folgenden Form schreiben: +1
1 (c1,1 − c1,−1 ) ∑ q n x n √2 n i − (c1,1 + c1,−1 ) ∑ q n y n + c1,0 ∑ q n z n √2 n n
∑ c1,m Q1m = − m=−1
(24)
Wir wollen nun zeigen, dass die Kombinationen der Koeffizienten c1,m , die in dieser Beziehung auftreten, die Komponenten des Gradienten des Potentials U(r) bei r = 0 sind: Bilden wir den Gradienten der Entwicklung (8) von U(r), so verschwindet der (konstante) l = 0-Term; der l = 1-Term kann in eine zu Gl. (24) analoge Form gebracht werden und liefert 1 i (25) (c1,1 − c1,−1 ) ex − (c1,1 + c1,−1 ) ey + c1,0 ez [∇U(r)]r=0 = − √2 √2 Bei den l > 1-Termen handelt es sich wie in Gl. (8) um Polynome in x, y, z von einem Grad größer als eins (s. § 1-b-γ und § 1-b-δ), die zu dem Gradienten bei r = 0 nicht beitragen. Der l = 1-Term der Entwicklung (14) kann daher mit Hilfe von Gl. (23) und Gl. (25) geschrieben werden N
( ∑ q n r n ) (∇U)r=0 = −𝓓 ⋅ 𝓔(r = 0) n=1
(26)
Elektrische Multipolmomente | 1071
•
worin 𝓔(r) = −∇U(r)
(27)
das elektrische Feld am Punkt r ist. In Gl. (26) erkennen wir den wohlbekannten Aus druck für die Kopplungsenergie zwischen einem elektrischen Dipol und dem Feld 𝓔 wieder. Bemerkungen: 1. In der Physik haben wir es oft mit Systemen zu tun, deren Gesamtladung null ist (z. B. Atome); Q00 verschwindet dann, und der erste Multipoloperator, der in der Entwicklung (14) einen Beitrag liefert, ist das elektrische Dipolmoment. Man kann diese Entwicklung oft auf die l = 1-Terme [also Gl. (26)] beschränken, da die Terme mit l ≥ 2 im Allgemeinen viel kleiner sind (das ist z. B. der Fall, wenn das elektrische Feld über Distanzen, die vergleichbar mit dem Abstand der Teilchen vom Ursprung sind, nur wenig variiert; die l ≥ 2-Terme sind darüber hinaus in einem Spezialfall exakt gleich null, nämlich wenn das elektrische Feld konstant ist; s. § 1-b-γ und § 1-b-δ). 2. Für ein System S aus zwei Teilchen entgegengesetzter Ladung +q und −q (ein elektrischer Dipol) ist das Dipolmoment 𝓓 gegeben durch 𝓓 = q(r1 − r2 )
(28)
Sein Wert, der mit der Position des zu dem System S gehörenden „Relativteilchens“ (s. Kap. VII, § B) in Verbindung steht, hängt daher nicht von der Wahl des Ursprungs O ab. Es handelt sich dabei um eine allgemeinere Eigenschaft: Man zeigt leicht, dass das elektrische Dipolmoment eines elektrisch neutralen Systems S von der Wahl des Ursprungs O unabhängig ist.
γ Die Operatoren Q2m ; elektrisches Quadrupolmoment Mit Hilfe des expliziten Ausdrucks für die Y2m [s. die Beziehungen (33) in Ergän zung AVI ] ließe sich ohne Schwierigkeiten zeigen, dass gilt Q±2 2 =
√6 4
Q±1 2 =∓ Q02 =
∑ q n (x n + iy n )2 n
√6 2
∑ q n z n (x n + iy n )
(29)
n
1 ∑ q n (3z2n − r2n ) 2 n
So erhalten wir also die fünf Komponenten des elektrischen Quadrupolmoments des Systems S. Während die Gesamtladung von S ein Skalar und sein Dipolmoment 𝓓 ein Vektor ist, kann man zeigen, dass es sich beim Quadrupolmoment um einen Ten sor zweiter Stufe handelt. Außerdem könnten wir mit einer analogen Überlegung wie oben die l = 2-Terme der Entwicklung (14) schreiben +2
∑ c2,m Q2m = m=−2
N 1 ∂2 U j ∑ q n x in x n ∑[ i j] 2 i,j ∂x ∂x r=0 n=1
(30)
(mit x i , x j = x, y oder z). Diese Terme beschreiben die Kopplung zwischen dem elek trischen Quadrupolmoment des Systems S und dem Gradienten des Felds 𝓔(r) am Punkt r = 0.
•
1072 | Ergänzung EX
δ Verallgemeinerung: elektrisches l-Polmoment Man kann die vorstehenden Überlegungen verallgemeinern: Mit Hilfe des allgemeinen Ausdrucks für die Kugelflächenfunktionen [s. Ergänzung AVI , Gl. (26) oder Gl. (30)] lässt sich zeigen, dass – die Größen Qm l Polynome (die homogen in x, y und z sind) l-ten Grades sind; – der Beitrag der l-Terme zur Entwicklung (14) Ableitungen l-ter Ordnung des Po tentials U(r) bei r = 0 enthält. Der Ausdruck (14) für das Potential kann daher als Taylor-Reihenentwicklung um den Ursprung angesehen werden. Je komplizierter die Änderungen des Potentials U(r) im Bereich des Systems S werden, desto höher wird die Ordnung der Terme, die zur Entwicklung beitragen. Ist U(r) z. B. konstant, so haben wir gesehen, dass nur der l = 0-Term erforderlich ist. Ist das Feld 𝓔(r) konstant, müssen die l = 1-Terme mit hin zugenommen werden. Ist der Gradient des Felds 𝓔 konstant, tragen die Terme l ≤ 2 bei, usw.
1-c Parität der Multipoloperatoren Zum Abschluss wollen wir die Parität der Q m l betrachten: Wie wir bereits wissen, ist die Parität der Kugelflächenfunktionen Y lm gleich (−1)l [s. Kap. VI, Gl. (D-28)]. Also (s. Ergänzung FII , § 2-a) hat auch der elektrische Multipoloperator Q m l eine definierte Parität, nämlich (−1)l unabhängig von m. Diese Eigenschaft wird sich im Folgenden als nützlich erweisen.
1-d Andere Möglichkeit der Einführung von Multipolmomenten Wir betrachten dasselbe System N geladener Teilchen wie oben, interessieren uns aber nicht für die Wechselwirkungsenergie dieses Systems mit einem gegebenen äußeren Potential U(r), sondern berechnen das Potential W(ρ), das diese Teilchen in einem entfernten Punkt ρ erzeugen (s. Abb. 1). Der Einfachheit halber verwenden wir zur Lösung dieses Problems die klassische Mechanik. Das Potential W(ρ) lautet dann W(ρ) =
1 N qn ∑ 4πε0 n=1 |ρ − r n |
(31)
Für |ρ| ≫ |r n | lässt sich nun zeigen, dass 1 1 ∞ rn l = ∑ ( ) P l (cos α n ) |ρ − r n | ρ l=0 ρ
(32)
Elektrische Multipolmomente |
1073
•
Abb. 1: Das Potential W(ρ), das von einem Sys tem N geladener Teilchen (an den Orten r1 , r2 , . . .) in einem entfernten Punkt erzeugt wird, kann in Abhängigkeit von den Multipolmomenten von S ausgedrückt werden.
worin α n den Winkel (ρ, rn ) bezeichnet und P l das Legendre-Polynom l-ter Ordnung ist. Mit Hilfe des Additionstheorems der Kugelflächenfunktionen (s. Ergänzung AVI , § 2-e-γ) können wir schreiben P l (cos α n ) =
+l 4π ∑ (−1)m Y l−m (θ n , φ n ) Y lm (Θ, Φ) 2l + 1 m=−l
(33)
(wobei Θ und Φ die Polarwinkel von ρ sind). Indem wir Gl. (32) und Gl. (33) in Gl. (31) einsetzen, erhalten wir schließlich W(ρ) =
4π 1 1 ∞ l (−1)m Q−m ∑ ∑ √ Y m (Θ, Φ) l 4πε0 l=0 m=−l 2l + 1 ρ l+1 l
(34)
worin Qm l (r1 , r2 , . . . , r N ) durch Gl. (15) definiert ist. Die Beziehung (34) zeigt, dass die Angabe der Qm l das von dem Teilchensystem S in Raumbereichen außerhalb dieses Systems erzeugte Potential vollständig definiert. Dieses Potential W(ρ) kann somit als die Summe einer unendlichen Anzahl von Ter men angesehen werden: 1. Der l = 0-Term liefert den Beitrag der Gesamtladung des Systems. Dieser Term ist isotrop (er hängt nicht von Θ und Φ ab) und lautet W0 (ρ) =
1 1 ∑ qn 4πε0 ρ n
(35)
Wir erkennen hier das 1/ρ-Potential, das die Ladungen erzeugen würden, wenn sie sich alle im Ursprung O befänden. Es ist gleich null, wenn das System insgesamt neu tral ist. 2. Der l = 1-Term liefert den Beitrag des elektrischen Dipolmoments 𝓓 des Sys tems. Analog zu den Umformungen in § 1-b-β können wir zeigen, dass er lautet W1 (ρ) =
1 𝓓⋅ρ 4πε0 ρ 3
Dieses Potential fällt mit steigendem ρ wie 1/ρ 2 .
(36)
•
1074 | Ergänzung EX
3. Die l = 2, 3, . . .-Terme liefern in gleicher Weise die Beiträge der folgenden Mul tipolmomente des betrachteten Systems zum Potential W(ρ). Mit steigendem ρ fällt je der Beitrag wie 1/ρ l+1 , und seine Winkelabhängigkeit wird durch eine Kugelflächen funktion l-ter Ordnung beschrieben. Außerdem können wir an Gl. (34) und der De finition (15) ablesen, dass das Potential der Multipolmomente Ql höchstens von der Größenordnung W0 (ρ) × (d/ρ)l ist, worin d der maximale Abstand der Teilchen des Systems S vom Ursprung ist. Betrachten wir daher das Potential an einem Punkt ρ mit ρ ≫ d, so fallen die Terme W l (ρ) mit wachsendem l sehr schnell ab, so dass der Fehler klein ist, wenn wir in Gl. (34) nur die niedrigsten Ordnungen von l berücksichtigen. Bemerkung: Wenn wir das von einem System bewegter Ladungen erzeugte Magnetfeld berechnen wollen, können wir in analoger Weise die magnetischen Multipolmomente des Systems einführen: das magnetische Dipolmoment¹, das magnetische Quadrupolmoment usw. Die Paritäten der magne tischen Momente sind denen der entsprechenden elektrischen Momente entgegengesetzt: Das magnetische Dipolmoment ist gerade, das magnetische Quadrupolmoment ungerade usw. Das kommt daher, dass das elektrische Feld ein polarer Vektor ist, während es sich beim Magnetfeld um einen axialen Vektor handelt.
2 Matrixelemente elektrischer Multipolmomente Wir betrachten erneut der Einfachheit halber ein aus einem einzelnen spinlosen Teil chen bestehendes System. Die Verallgemeinerung auf N-Teilchensysteme bietet keine theoretischen Schwierigkeiten. Der Zustandsraum Hr des Teilchens wird durch eine orthonormale Basis aufge spannt, {|χ n,l,m ⟩}, die aus gemeinsamen Eigenvektoren von L2 zum Eigenwert l(l+1)ℏ2 und L z zum Eigenwert mℏ besteht. Wir wollen die Matrixelemente eines Multipolope rators Q m l in einer solchen Basis berechnen.
2-a Allgemeiner Ausdruck für die Matrixelemente α Entwicklung der Matrixelemente Nach Kapitel VII sind die zu den Zuständen |χ n,l,m⟩ gehörenden Wellenfunktionen not wendig von der Form χ n,l,m (r) = R n,l (r) Y lm (θ, φ)
(37)
1 Es gibt kein magnetisches Multipolmoment von der Ordnung l = 0 (magnetischer Monopol). Die se Tatsache hängt damit zusammen, dass der Strom des magnetischen Felds, dessen Divergenz den Maxwell-Gleichungen zufolge verschwindet, erhalten bleibt.
Elektrische Multipolmomente |
1075
•
Das Matrixelement von Q m l kann daher mit Gl. (12) geschrieben werden ⟨χ n1 ,l 1 ,m1 | Q m l | χ n2 ,l 2 ,m2 ⟩ ∞
π
2π
= ∫ r2 dr ∫ sin θ dθ ∫ dφ χ ∗n1 ,l 1 ,m1 (r, θ, φ) Q m l (r, θ, φ) χ n2 ,l 2 ,m2 (r, θ, φ) 0
0
= q√
0 ∞
π
0
0
4π ∫ r2 dr R∗n1 ,l 1 (r) R n2 ,l 2 (r) r l ∫ sin θ dθ 2l + 1
2π
× ∫ dφ Y lm1 1 ∗ (θ, φ) Y lm (θ, φ) Y lm2 2 (θ, φ)
(38)
0
Darin tritt eine Radial- und eine Winkelintegration auf. Diese kann weiter verein facht werden: Mit Hilfe der Konjugationsbeziehungen für Kugelflächenfunktionen [Gl. (D-29) aus Kapitel VI] und des Wigner-Eckart-Theorems [Gl. (26) aus Ergänzung CX ] können wir zeigen, dass π
2π −m
m
(−1)m1 ∫ sin θ dθ ∫ dφ Y l 1 1 (θ, φ) Y lm (θ, φ) Y l 2 2 (θ, φ) 0
=√
0
(2l + 1)(2l2 + 1) ⟨l2 , l; 0, 0 | l1 , 0⟩⟨l2 , l; m2 , m | l1 , m1 ⟩ 4π(2l1 + 1)
(39)
Schließlich erhalten wir ⟨χ n1 ,l 1 ,m1 | Q m l | χ n2 ,l 2 ,m2 ⟩ 1 ⟨χ n1 ,l 1 ‖ Q l ‖ χ n2 ,l 2 ⟩⟨l2 , l; m2 , m | l1 , m1 ⟩ = √2l1 + 1
(40)
wobei das reduzierte Matrixelement ⟨χ n1 ,l 1 ‖ Q l ‖ χ n2 ,l 2 ⟩ des elektrischen Multipolope rators l-ter Ordnung definiert ist durch ⟨χ n1 ,l 1 ‖ Q l ‖ χ n2 ,l 2 ⟩ ∞
= q√2l2 + 1 ⟨l2 , l; 0, 0 | l1 , 0⟩ ∫ dr r l+2 R∗n1 ,l 1 (r) R n2 ,l 2 (r)
(41)
0
Gleichung (40) drückt speziell für den elektrischen Dipoloperator ein allgemeines Theorem aus, dessen Anwendung wir für Vektoroperatoren bereits dargestellt haben (s. Ergänzung CX ): das Wigner-Eckart-Theorem.
•
1076 | Ergänzung EX
Bemerkung: Wir haben uns hier auf ein System S aus einem spinlosen Einzelteilchen beschränkt. Allerdings können unsere Ergebnisse auf ein System von N Teilchen, die auch einen Spin aufweisen dürfen, verallgemeinert werden. Dazu müssen wir den Gesamtdrehimpuls J des Systems (die Summe der Bahn- und Spindrehimpulse der N Teilchen) einführen und bezeichnen mit |χ n,j,m ⟩ dann die ge meinsamen Eigenvektoren von J2 und J z . Es lässt sich dann eine zu Gl. (40) analoge Beziehung ableiten, in der l 1 und l 2 durch j 1 und j 2 ersetzt sind (s. Ergänzung GX , Aufgabe 8). Die Quanten zahlen j 1 , j 2 , m 1 und m 2 können dann allerdings in Abhängigkeit vom betrachteten physikali schen System ganz- oder halbzahlige Werte annehmen.
β Reduziertes Matrixelement Das reduzierte Matrixelement ⟨χ n1 ,l 1 ‖ Q l ‖χ n2 ,l 2 ⟩ ist unabhängig von m, m1 und m2 ; es enthält nur den Radialteil R n,l (r) der Wellenfunktionen χ n,l,m (r, θ, φ). Sein Wert hängt daher von der gewählten {|χ n,l,m ⟩}-Basis ab, so dass man schwer allgemeingülti ge Eigenschaften angeben kann. Man sieht aber, dass der Clebsch-Gordan-Koeffizient ⟨l2 , l; 0, 0 | l1 , 0⟩ in Gl. (41) verschwindet, wenn l1 +l2 +l ungerade ist (s. Ergänzung BX , § 3-c); daraus folgt dieselbe Eigenschaft für das reduzierte Matrixelement. Bemerkung: Diese Eigenschaft hängt mit der Parität (−1)l des elektrischen Multipoloperators Q m zusammen. l Für magnetische Multipoloperatoren haben wir bereits gezeigt, dass ihre Parität (−1)l+1 ist; des halb verschwinden ihre Matrixelemente, wenn l 1 + l 2 + l gerade ist.
γ Winkelanteil des Matrixelements In Gl. (40) stammt der Clebsch-Gordan-Koeffizient ausschließlich vom Winkelinte gral ab, das im Matrixelement Q m l [s. Gl. (38)] auftritt. Er hängt nur von den Dreh impulsquantenzahlen der betrachteten Zustände ab, während die Radialabhängig keit R n,l (r) der Wellenfunktionen keine Rolle spielt. Darum tritt er immer dann in Matrixelementen von Multipoloperatoren auf, wenn man eine Basis von gemeinsa men Eigenvektoren von L2 und L z (oder J2 und J z für ein System von N Teilchen, möglicherweise mit Spin; s. vorletzte Bemerkung) gewählt hat. Nun wissen wir, dass solche Basen in der Quantenmechanik oft Verwendung finden und dass insbesonde re die stationären Zustände eines Teilchens in einem Zentralpotential W(r) in dieser Form gewählt werden können. Die Radialfunktionen R n,l (r), die zu den stationären Zuständen gehören, hängen daher vom betrachteten Potential W(r) ab, was folglich auch für die reduzierten Matrixelemente ⟨χ n1 ,l 1 ‖ Q l ‖ χ n2 ,l 2 ⟩ Gültigkeit hat. Das gilt je doch nicht für die Winkelabhängigkeit der Wellenfunktionen, und für alle W(r) tritt derselbe Clebsch-Gordan-Koeffizient auf; aus diesem Grund kommt ihm eine allge meine Bedeutung zu.
Elektrische Multipolmomente | 1077
•
2-b Auswahlregeln Den Eigenschaften der Clebsch-Gordan-Koeffizienten (s. Ergänzung BX , § 1) zufolge kann ⟨l2 , l; m2 , m | l1 , m1 ⟩ nur dann von null verschieden sein, wenn gleichzeitig gilt m1 = m2 + m
(42)
|l1 − l2 | ≤ l ≤ l1 + l2
(43)
Aus Gl. (40) folgt daher, dass das Matrixelement ⟨χ n1 ,l 1 ,m1 | Q m l | χ n2 ,l 2 ,m2 ⟩ notwendig verschwindet, wenn mindestens eine dieser Bedingungen nicht erfüllt ist. Damit er halten wir Auswahlregeln, mit denen man die Suche nach den Darstellungsmatri zen eines beliebigen Multipoloperators Q m l ohne Rechnung beträchtlich vereinfachen kann. Darüber hinaus haben wir in § 2-a-β gesehen, dass das reduzierte Matrixelement eines Multipoloperators eine weitere Auswahlregel erfüllt: – für einen elektrischen Multipoloperator: l1 + l2 + l = gerade Zahl –
(44a)
für einen magnetischen Multipoloperator: l1 + l2 + l = ungerade Zahl
(44b)
2-c Physikalische Folgerungen α Erwartungswert eines Multipoloperators in wohldefiniertem Drehimpulszustand Nehmen wir an, bei dem Zustand |ψ⟩ des Teilchens handle es sich um einen Basiszu stand |χ n1 ,l 1 ,m1 ⟩, dann ist der Erwartungswert des Operators Q m l m ⟨Q m l ⟩ = ⟨χ n1 ,l 1 ,m1 | Q l | χ n1 ,l 1 ,m1 ⟩
(45)
Die Bedingungen (42) und (43) lauten jetzt m=0
(46)
0 ≤ l ≤ 2l1
(47)
So erhalten wir die folgenden wichtigen Regeln: – Für m ≠ 0 verschwinden im Zustand |χ n1 ,l 1 ,m1 ⟩ die Erwartungswerte aller Opera toren Q m l : ⟨Q m l ⟩ = 0 für m ≠ 0 –
(48)
im Zustand |χ n1 ,l 1 ,m1 ⟩ verschwinden die Erwartungswerte aller Operatoren Q m l der Ordnung l größer als 2l1 : ⟨Q m l ⟩ = 0 für l > 2l 1
(49)
•
1078 | Ergänzung EX
Wir nehmen nun an, dass der Zustand |ψ⟩ nicht durch einen der Zustände |χ n1 ,l 1 ,m1 ⟩, sondern durch eine beliebige Überlagerung solcher Zustände gegeben ist, die alle zu demselben Wert l1 gehören; es ist leicht zu zeigen, dass die Regel (49) dann gültig bleibt [die Regel (48) hingegen nicht, da nun im Allgemeinen Matrixelemente mit m1 ≠ m2 zum Erwartungswert ⟨Q m l ⟩ beitragen]. Gleichung (49) ist also von sehr allgemeiner Bedeutung und kann immer dann angewandt werden, wenn das System ein Eigenzu stand von L2 ist. Darüber hinaus folgt aus den Eigenschaften (44), dass der Erwartungswert eines Multipoloperators l-ter Ordnung nur dann von null verschieden sein kann, wenn – für einen elektrischen Multipoloperator l = gerade Zahl –
(50a)
für einen magnetischen Multipoloperator l = ungerade Zahl
(50b)
Die vorstehenden Regeln liefern bereits ohne Rechnung einige physikalische Ergeb nisse. Zum Beispiel sind in einem l = 0-Zustand (wie dem Grundzustand des Wasser stoffatoms) alle (elektrischen oder magnetischen) Dipolmomente, Quadrupolmomen te usw. gleich null. Für einen l = 1-Zustand können nur die Multipoloperatoren null ter, erster und zweiter Ordnung von null verschieden sein; wie die Paritätsregeln (50) zeigen, handelt es sich dabei um die Gesamtladung, den elektrischen Quadrupol so wie um den magnetischen Dipol des Systems. Bemerkung: Die Aussagen können für kompliziertere Systeme (z. B. Atome mit mehreren Elektronen) verall gemeinert werden. Ist der Drehimpuls eines solchen Systems gleich j (ganz- oder halbzahlig), so braucht man nur in Gl. (49) l 1 durch j zu ersetzen. Wir wollen die Gleichungen (49) und (50) z. B. auf die Untersuchung der elektrischen Eigenschaf ten eines Atomkerns anwenden: Wie wir wissen, handelt es sich um ein aus Protonen und Neu tronen aufgebautes System, das über Kernkräfte wechselwirkt. Ist der Eigenwert des Quadrats des Drehimpulses im Grundzustand² gleich I(I + 1)ℏ2 , so bezeichnet man die Quantenzahl I als Kernspin. Aus den oben angeführten Regeln folgt, dass – für I = 0 die elektromagnetische Wechselwirkung des Kerns durch seine Gesamtladung gegeben wird, während die anderen Multipolmomente verschwinden. Dieser Fall tritt z. B. für den 4 He-Kern (α-Teilchen), den 20 Ne-Kern usw. auf; – für I = 1/2 der Kern eine elektrische Ladung und ein magnetisches Dipolmoment besitzt [die Paritätsregel (50a) schließt ein elektrisches Dipolmoment aus]. Dies betrifft den 3 He- und den 1 H-Kern (das Proton) wie auch alle Spin-1/2-Teilchen (Elektronen, Myonen, Neutronen usw.);
2 In der Atomphysik geht man im Allgemeinen davon aus, dass sich der Atomkern im Grundzustand befindet; die betrachteten Energien sind zwar groß genug, um die Elektronenwolke des Atoms anzu regen, reichen aber bei weitem nicht zur Anregung des Kerns aus.
Elektrische Multipolmomente |
1079
•
für I = 1 der Ladung und dem magnetischen Dipolmoment das elektrische Quadrupolmo ment hinzugefügt werden muss, z. B. für 2 H (Deuterium), 6 Li usw. Diese Überlegung kann für alle beliebigen Werte von I verallgemeinert werden. Tatsächlich haben aber nur sehr wenige Kerne Spins größer als 3 oder 4.
–
β Matrixelemente zwischen Zuständen mit verschiedenen Quantenzahlen Für beliebige l1 , l2 , m1 und m2 müssen die Auswahlregeln in ihrer allgemeinen Form, Gleichungen (42), (43) und (44), angewandt werden. Betrachten wir z. B. ein Teilchen der Ladung q unter dem Einfluss eines Zentralpotentials V0 (r), dessen stationäre Zustände gerade die |χ n,l,m ⟩ sind. Wir nehmen an, wir würden nun ein elektrisches Feld 𝓔 hinzufügen, das homogen und parallel zur z-Achse ist. In dem entsprechen den Kopplungsterm des Hamilton-Operators ist dann der elektrische Dipolterm der einzige nichtverschwindende Anteil (s. § 1-b-β): V(R) = −D ⋅ 𝓔 = −D z ℰ
(51)
Wie wir aufgrund der Beziehungen (22) sahen, ist der Operator D z gleich Q01 . Aus den Auswahlregeln (42) und (43) folgt dann, dass – die Zustände |χ n,l,m ⟩, die durch den zusätzlichen Beitrag zum Hamilton-Operator V(R) gekoppelt werden, notwendig zum selben Wert von m gehören; – die l-Werte von zwei solchen Zuständen sich notwendig um ±1 unterscheiden [nach Beziehung (44a) können sie nicht gleich sein]. Wir können also ohne Rech nung vorhersagen, dass eine große Anzahl der Matrixelemente von V(R) gleich null ist. Dadurch wird z. B. die Behandlung des Stark-Effekts (s. Ergänzung EXII ) und der Auswahlregeln, die die Emissionsspektren von Atomen beschreiben (s. Ergänzung AXIII ), erheblich vereinfacht.
Referenzen und Literaturhinweise Cagnac und Pebay-Peyroula (11.2), Anhang IV; Valentin (16.1), Kap. VIII; Jackson (7.5), Kap. 4 und 16.
•
1080 | Ergänzung FX
Ergänzung FX Entwicklung gekoppelter Drehimpulse 1 1-a 1-b 2 2-a 2-b 3 3-a 3-b 3-c 4 4-a 4-b 4-c
Erinnerung an die klassischen Ergebnisse | 1081 Die Bewegungsgleichungen | 1081 Die Bewegung von 𝓙1 und 𝓙2 | 1082 Bewegungsgleichungen für die Drehimpulserwartungswerte | 1083 Berechnung von d⟨J1 ⟩/ dt und d⟨J2 ⟩/ dt | 1083 Diskussion | 1083 System mit zwei Spins 1/2 | 1084 Stationäre Zustände | 1084 Berechnung von ⟨S1 ⟩(t) | 1085 Diskussion. Polarisation magnetischer Dipolübergänge | 1087 Stoß zwischen zwei Spin-1/2-Teilchen | 1090 Beschreibung des Modells | 1090 Der Zustand des Systems nach dem Stoß | 1091 Physikalische Diskussion: Korrelation | 1092
Bei der Beschreibung physikalischer Systeme muss man oft eine Kopplung zwischen zwei Teildrehimpulsen J1 und J2 berücksichtigen. Dabei kann es sich z. B. um die Dreh impulse von zwei Atomelektronen oder um den Bahn- und Spindrehimpuls eines Elek trons handeln. Tritt eine solche Kopplung auf, sind J1 und J2 nicht länger Konstanten der Bewegung, vielmehr vertauscht erst J = J1 + J2
(1)
mit dem Gesamt-Hamilton-Operator des Systems. Wir wollen annehmen, dass der Term des Hamilton-Operators, der die Kopplung zwischen J1 und J2 beschreibt, von der einfachen Form W = a J1 ⋅ J2
(2)
mit einer reellen Konstante a ist. Diesen Fall trifft man in der Atomphysik häufig an. In Kapitel XII werden wir bei der Anwendung der Störungstheorie auf das Wasser stoffspektrum eine Reihe von Beispielen kennenlernen, bei denen die Wechselwir kungen mit dem Elektron- oder Protonspin eine Rolle spielen. Für eine Kopplung von der Form (2) sagt die klassische Theorie voraus, dass die klassischen Drehimpulse 𝓙1 und 𝓙2 mit einer Winkelgeschwindigkeit proportional zu a um die Resultierende 𝓙 präzessieren (s. § 1). Das Vektormodell des Atoms, das in der Entwicklung der Atom physik eine wichtige Rolle gespielt hat, stützt sich auf dieses Ergebnis. In diesem Ab schnitt wollen wir zeigen, wie man aus den gemeinsamen Eigenzuständen von J2 und J z die zeitliche Entwicklung der Erwartungswerte ⟨J1 ⟩ und ⟨J2 ⟩ untersuchen und damit wenigstens teilweise die Resultate des Vektormodells erneut herleiten kann (§ 2 und § 3). Außerdem wird es dadurch möglich, in einigen einfachen Fällen die Polarisation https://doi.org/10.1515/9783110638769-014
Entwicklung gekoppelter Drehimpulse | 1081
•
der in magnetischen Dipolübergängen emittierten oder absorbierten elektromagneti schen Strahlung zu bestimmen. Schließlich (§ 4) greifen wir den Fall auf, dass die zwei Drehimpulse J1 und J2 nur während eines Stoßes, also nicht permanent gekoppelt sind. Dieser Fall illustriert auf einfache Weise den wichtigen Begriff der Korrelation zwischen zwei Systemen.
1 Erinnerung an die klassischen Ergebnisse 1-a Die Bewegungsgleichungen Bezeichnen wir den Winkel zwischen den klassischen Drehimpulsen 𝓙1 und 𝓙2 mit θ (Abb. 1), so beträgt die Kopplungsenergie W = a 𝓙1 ⋅ 𝓙2 = a 𝒥1 𝒥2 cos θ
(3)
Abb. 1: Zwei klassische Drehimpulse 𝓙1 und 𝓙2 , die durch die Wechselwirkung W = a 𝓙1 ⋅ 𝓙2 = a 𝒥1 𝒥2 cos θ gekoppelt sind.
Es sei H0 die Energie des Systems ohne Kopplung [H0 kann z. B. die Summe der kine tischen Rotationsenergie der Systeme (1) und (2) darstellen]. Wir wollen annehmen W ≪ H0
(4)
Wir berechnen nun das Drehmoment 𝓜1 der Kräfte, die auf System (1) wirken: Es seien u ein Einheitsvektor und dW die Änderung der Kopplungsenergie, wenn das System (1) mit dem Winkel dα um u gedreht wird. Wir wissen (Prinzip der virtuellen Arbeit), dass gilt 𝓜1 ⋅ u = −
dW dα
(5)
Aus Gl. (3) und Gl. (5) erhalten wir dann durch eine einfache Rechnung 𝓜1 = −a 𝓙1 × 𝓙2
(6a)
𝓜2 = −a 𝓙2 × 𝓙1
(6b)
•
1082 | Ergänzung FX
und damit d𝓙1 = −a 𝓙1 × 𝓙2 dt d𝓙2 = −a 𝓙2 × 𝓙1 dt
(7a) (7b)
1-b Die Bewegung von 𝓙1 und 𝓙2 Addieren wir die beiden Gleichungen (7), so erhalten wir d (𝓙1 + 𝓙2 ) = 0 dt
(8)
woraus folgt, dass der Gesamtdrehimpuls 𝓙1 + 𝓙2 eine Konstante der Bewegung ist. Darüber hinaus können wir aus den Gleichungen (7) leicht schließen, dass gilt 𝓙1 ⋅ (
d𝓙1 d𝓙2 ) = 𝓙2 ⋅ ( )=0 dt dt
𝓙1 ⋅ (
d𝓙2 d𝓙1 d )+( ) ⋅ 𝓙2 = (𝓙1 ⋅ 𝓙2 ) = 0 dt dt dt
(9)
und (10)
Somit sind der Winkel zwischen 𝓙1 und 𝓙2 und ihre Beträge zeitlich konstant. Schließlich ist d 𝓙 = a 𝓙2 × 𝓙1 = a (𝓙 − 𝓙1 ) × 𝓙1 = a 𝓙 × 𝓙1 dt 1
(11)
Da 𝓙 = 𝓙1 + 𝓙2 konstant ist, zeigt die vorstehende Gleichung, dass 𝓙1 mit einer Winkelgeschwindigkeit a|𝓙| um 𝓙 präzessiert (Abb. 2). Unter dem Einfluss der Kopplung präzessieren die Momente 𝓙 1 und 𝓙2 daher mit einer Winkelgeschwindigkeit proportional zu |𝓙| und der Kopplungskonstanten a um ihre Resultierende 𝓙.
Abb. 2: Unter dem Einfluss der Kopplung W = a 𝓙1 ⋅ 𝓙2 präzessieren die Drehmomente 𝓙1 und 𝓙2 um ihre Summe 𝓙, die eine Konstante der Bewegung ist.
Entwicklung gekoppelter Drehimpulse | 1083
•
2 Bewegungsgleichungen für die Drehimpulserwartungswerte 2-a Berechnung von d⟨J1 ⟩/ dt und d⟨J2 ⟩/ dt Wir erinnern uns zunächst daran, dass für die zeitliche Änderung der Observablen A eines quantenmechanischen Systems mit dem Hamilton-Operator H gilt (s. Kap. III, § D-1-d) d 1 ⟨A⟩(t) = ⟨[A, H]⟩(t) dt iℏ
(12)
Im vorliegenden Fall wird der Hamilton-Operator durch H = H0 + W
(13)
gegeben, wobei H0 die Summe der Energien der Systeme (1) und (2) ist und W die Kopplung zwischen J1 und J2 , Gl. (2), darstellt. Ohne Kopplung sind J1 und J2 Konstan ten der Bewegung (sie kommutieren mit H0 ). Mit Kopplung haben wir also einfach d 1 a ⟨J1 ⟩ = ⟨[J1 , W]⟩ = ⟨[J1 , J1 ⋅ J2 ]⟩ dt iℏ iℏ
(14)
sowie die entsprechende Gleichung für ddt ⟨J2 ⟩. Die Berechnung des in Gl. (14) auftretenden Kommutators bietet keine Schwierigkeiten. So gilt z. B. [J 1x , J1 ⋅ J2 ] = [J 1x , J 1y J 2y ] + [J 1x , J 1z J 2z ] = iℏ J 1z J 2y − iℏ J 1y J 2z = −iℏ (J1 × J2 ) x
(15)
Daraus erhalten wir schließlich d ⟨J1 ⟩ = −a ⟨J1 × J2 ⟩ dt d ⟨J2 ⟩ = −a ⟨J2 × J1 ⟩ dt
(16a) (16b)
2-b Diskussion Es gibt eine enge Analogie zwischen den Beziehungen (7a) und (7b) einerseits und den Beziehungen (16a) und (16b) andererseits. Indem wir (16a) und (16b) addieren, erhalten wir erneut, dass J eine Konstante der Bewegung ist, da d d d ⟨J1 ⟩ + ⟨J2 ⟩ = ⟨J⟩ = 0 dt dt dt
(17)
Wir müssen jedoch darauf achten, dass im Allgemeinen ⟨J1 × J2 ⟩ ≠ ⟨J1 ⟩ × ⟨J2 ⟩
(18)
•
1084 | Ergänzung FX
gilt. Die Bewegung der Erwartungswerte ist daher nicht unbedingt mit der klassischen Bewegung identisch. Um diesen Punkt genauer zu untersuchen, betrachten wir nun den Spezialfall, dass J1 und J2 zwei Spins 1/2 sind, die wir mit S1 und S2 bezeichnen wollen.
3 System mit zwei Spins 1/2 Die zeitliche Entwicklung eines quantenmechanischen Systems kann in der Basis der Eigenzustände des Hamilton-Operators leicht berechnet werden. Wir beginnen daher mit der Bestimmung der stationären Zustände des Zweispinsystems.
3-a Stationäre Zustände Der Gesamtspin des Systems sei S = S1 + S2
(19)
Wenn wir beide Seiten von Gl. (19) quadrieren, erhalten wir S2 = S21 + S22 + 2S1 ⋅ S2 so dass wir W schreiben können a a 3 W = a S1 ⋅ S2 = [S2 − S21 − S12 ] = [S2 − ℏ2 ] 2 2 2
(20)
(21)
(alle Vektoren des Zustandsraums sind Eigenvektoren von S21 und S22 mit dem Eigen wert 3ℏ2 /4). Ohne Kopplung ist der Hamilton-Operator H0 des Systems sowohl in der {|ε1 , ε2 ⟩}Basis (mit ε1 , ε2 = ±) von Eigenzuständen zu S1z und S2z , als auch in der {|S, M⟩}Basis (mit S = 0 oder 1, −S ≤ M ≤ +S) von Eigenzuständen zu S2 und S z diagonal. Die verschiedenen Vektoren |ε1 , ε2 ⟩ und |S, M⟩ sind Eigenvektoren von H0 mit demselben Eigenwert, den wir als Energienullpunkt wählen wollen. Berücksichtigen wir zusätzlich die Kopplung W, so sehen wir anhand von Gl. (21), dass der Gesamt-Hamilton-Operator H = H0 + W in der {|ε1 , ε2 ⟩}-Basis nicht mehr diagonal ist. Wir können jedoch schreiben 3 aℏ2 (22) [S(S + 1) − ] |S, M⟩ 2 2 Die stationären Zustände des Zweispinsystems werden daher in zwei Energieni veaus aufgespalten (Abb. 3): in das dreifach entartete S = 1-Niveau mit der Energie E1 = aℏ2 /4 und in das nicht entartete S = 0-Niveau mit der Energie E0 = −3aℏ2 /4. Der Abstand zwischen den beiden Niveaus ist gleich aℏ2 . Setzen wir (H0 + W) |S, M⟩ =
aℏ2 = ℏ Ω
(23)
so ist Ω/2π die einzige nicht verschwindende Bohr-Frequenz des Zweispinsystems.
Entwicklung gekoppelter Drehimpulse | 1085
•
Abb. 3: Energieniveaus eines Systems mit zwei Spins 1/2. Auf der linken Seite der Abbildung ist die Kopplung als null angenommen, und man erhält ein einzelnes Energieniveau, das vierfach entartet ist. Die Kopplung W = a S1 ⋅ S2 spaltet es in zwei Niveaus auf, die durch die Energie aℏ2 voneinander getrennt sind: das Triplettniveau (S = 1, dreifach entartet) und das Singulettniveau (S = 0, nicht entartet).
3-b Berechnung von ⟨S1 ⟩(t) Um die Zeitentwicklung des Erwartungswerts ⟨S1 ⟩(t) zu bestimmen, müssen wir zunächst die Matrizen berechnen, die S1x , S1y und S1z (oder einfacher S1z und S1+ = S1x + iS1y ) in der {|S, M⟩}-Basis der stationären Zustände darstellen. Mit Hilfe der Ausdrücke (B-22) und (B-23) aus Kapitel X, die die Entwicklungen der Zustände |S, M⟩ in der {|ε1 , ε2 ⟩}-Basis angeben, ist es leicht möglich, die Wirkung von S1z oder S1+ auf die Vektoren |S, M⟩ zu berechnen. Wir finden ℏ |1, 1⟩ 2 ℏ S1z |1, 0⟩ = |0, 0⟩ 2 ℏ S1z |1, −1⟩ = − |1, −1⟩ 2 ℏ S1z |0, 0⟩ = |1, 0⟩ 2 S1z |1, 1⟩ =
(24)
und S1+ |1, 1⟩ = 0 ℏ |1, 1⟩ √2 ℏ S1+ |1, −1⟩ = (|1, 0⟩ + |0, 0⟩) √2 ℏ S1+ |0, 0⟩ = − |1, 1⟩ √2 S1+ |1, 0⟩ =
(25)
•
1086 | Ergänzung FX
Daraus können wir sofort die Matrizen ableiten, die S1z und S1+ in der Basis der vier Zustände |S, M⟩ (in der Reihenfolge |1, 1⟩, |1, 0⟩, |1, −1⟩, |0, 0⟩) darstellen, 1 ℏ 0 (S1z ) = ( 2 0 0 0 ℏ 0 ( (S1+ ) = √2 0 0
0 0 0 1
0 0 −1 0 1 0 0 0
0 1 0 1
0 1 ) 0 0
(26)
−1 0 ) 0 0
(27)
Bemerkung: Man kann zeigen, dass die Einschränkungen der S 1z - und S 1+ -Matrizen auf den S = 1-Unterraum proportional (mit demselben Proportionalitätsfaktor) zu den Matrizen sind, die S z bzw. S + in die sem Unterraum darstellen. Dieses Ergebnis hätte man aufgrund des Wigner-Eckart-Theorems für Vektoroperatoren (s. Ergänzung DX ) vorhersagen können.
Es sei |ψ(0)⟩ = α |0, 0⟩ + β −1 |1, −1⟩ + β 0 |1, 0⟩ + β 1 |1, 1⟩
(28)
der Zustand des Systems zum Zeitpunkt t = 0. Daraus folgt der Ausdruck für |ψ(t)⟩ (bis auf den Faktor e3iaℏt/4 ) |ψ(t)⟩ = α |0, 0⟩ + [β −1 |1, −1⟩ + β 0 |1, 0⟩ + β 1 |1, 1⟩] e−iΩt
(29)
Mit den Ausdrücken (26) und (27) erhält man dann ⟨S1z ⟩(t) = ⟨ψ(t) | S1z | ψ(t)⟩ =
ℏ [|β 1 |2 − |β −1 |2 + eiΩt αβ ∗0 + e−iΩt α ∗ β 0 ] 2
(30)
⟨S1+ ⟩(t) = ⟨ψ(t) | S1+ | ψ(t)⟩ =
ℏ [β ∗ β 0 + β ∗0 β −1 − eiΩt β ∗1 α + e−iΩt α ∗ β −1 ] √2 1
(31)
Die Erwartungswerte ⟨S1x ⟩(t) und ⟨S1y ⟩(t) können in Abhängigkeit von ⟨S1+ ⟩(t) ange geben werden: ⟨S1x ⟩(t) = Re⟨S1+ ⟩(t)
(32)
⟨S1y ⟩(t) = Im⟨S1+ ⟩(t)
(33)
Analoge Rechnungen ergeben die drei Komponenten von ⟨S2 ⟩(t).
Entwicklung gekoppelter Drehimpulse | 1087
•
3-c Diskussion. Polarisation magnetischer Dipolübergänge Die Untersuchung der Zeitabhängigkeit von ⟨S1 ⟩(t) ermöglicht neben einem Vergleich der quantenmechanischen Vorhersagen mit dem Vektormodell des Atoms auch die Bestimmung der Polarisation der elektromagnetischen Wellen, die aufgrund der Be wegung von ⟨S1 ⟩(t) abgestrahlt werden. Die Bohr-Frequenz Ω/2π tritt in den Gleichungen für die Zeitentwicklung von ⟨S1 ⟩(t) auf, weil es nichtverschwindende Matrixelemente von S1x , S1y oder S1z zwi schen dem Zustand |0, 0⟩ und einem der Zustände |1, M⟩ (mit M = −1, 0, +1) gibt. Für Gl. (28) oder Gl. (29) wollen wir annehmen, dass bei nichtverschwindendem α nur einer der drei Koeffizienten β −1 , β 0 oder β 1 von null verschieden ist. Die Untersuchung der Bewegung von ⟨S1 ⟩(t) wird es uns in den drei entsprechenden Fällen dann ermög lichen, die Polarisation der Strahlung der drei magnetischen Dipolübergänge |0, 0⟩ ←→ |1, 0⟩ , |0, 0⟩ ←→ |1, 1⟩
und |0, 0⟩ ←→ |1, −1⟩
anzugeben. Wir können α immer reell wählen; wir setzen β M = |β M | eiφ M
(M = −1, 0, 1)
(34)
Bemerkung: Eigentlich werden die magnetischen Wellen von den zu S1 und S2 gehörenden magnetischen Momenten M1 und M2 abgestrahlt (daher der Name: magnetische Dipolübergänge); M1 und M2 sind proportional zu S1 bzw. S2 . Um ganz genau zu sein, sollten wir dann die Zeitentwicklung von ⟨M1 + M2 ⟩(t) untersuchen. Wir wollen hier voraussetzen, dass ⟨M1 ⟩ ≫ ⟨M2 ⟩ gilt. Eine sol che Situation liegt z. B. im Grundzustand des Wasserstoffatoms vor: Die Hyperfeinstruktur die ses Zustands entsteht aufgrund der Kopplung zwischen dem Spin des Elektrons und dem des Protons (s. Kap. XII, § D). Das magnetische Moment des Elektronenspins ist sehr viel größer als das des Protonenspins, so dass die Emission und Absorption elektromagnetischer Wellen mit der Frequenz des Hyperfeinübergangs im Wesentlichen durch die Bewegung des Elektronenspins be stimmt werden. Zögen wir also auch ⟨M2 ⟩ in die Betrachtungen mit ein, würden die Rechnungen komplizierter werden, ohne dass sich die Ergebnisse änderten.
α Der |0, 0⟩ ↔ |1, 0⟩-Übergang (β1 = β −1 = 0) Setzen wir in den Gleichungen (31) und (33) β 1 = β −1 = 0, so erhalten wir ⟨S1x ⟩(t) = ⟨S1y ⟩(t) = 0 ⟨S1z ⟩(t) = ℏα |β 0 | cos(Ωt − φ0 )
(35)
Außerdem gilt ⟨S x ⟩(t) = ⟨S y ⟩(t) = ⟨S z ⟩(t) = 0
(36)
⟨S1 ⟩(t) und ⟨S2 ⟩(t) sind also entgegengesetzt gleich und oszillieren in z-Richtung mit der Frequenz Ω/2π (Abb. 4). Die von ⟨S1 ⟩ emittierten elektromagnetischen Wellen
•
1088 | Ergänzung FX
Abb. 4: Handelt es sich bei dem Zustand des Zweispinsystems nur um eine Überlagerung der beiden stationären Zustände |0, 0⟩ und |1, 0⟩, sind ⟨S1 ⟩ und ⟨S2 ⟩ immer entgegengesetzt gleich und oszillieren in z-Richtung mit der Frequenz Ω/2π.
weisen daher ein magnetisches Feld¹ auf, das in z-Richtung linear polarisiert ist (π-Po larisation). Wie wir an diesem Beispiel sehen, ändert sich (⟨S1 ⟩)2 mit der Zeit und ist darum nicht gleich ⟨S21 ⟩ (das konstant gleich 3ℏ2 /4 ist). Dies stellt einen wichtigen Unter schied zu der in § 1 behandelten klassischen Situation dar, in der der Betrag von 𝓙1 zeitlich konstant ist. β Der |0, 0⟩ ↔ |1, 1⟩-Übergang (β 0 = β −1 = 0) In diesem Fall ergibt sich ℏ |β 1 |2 2 ℏ α|β 1 | cos(Ωt − φ1 ) ⟨S1x ⟩(t) = − √2 ℏ ⟨S1y ⟩(t) = − α|β 1 | sin(Ωt − φ1 ) √2 ⟨S1z ⟩(t) =
(37)
Außerdem kann leicht gezeigt werden, dass gilt ⟨S z ⟩(t) = ℏ |β 1 |2 ⟨S x ⟩(t) = ⟨S y ⟩(t) = 0
(38)
Daraus lässt sich ablesen (Abb. 5), dass ⟨S1 ⟩(t) und ⟨S2 ⟩(t) mit der Winkelgeschwin digkeit Ω im Gegenuhrzeigersinn um ihre Resultierende ⟨S⟩, die parallel zur z-Achse verläuft, präzessieren. Die elektromagnetischen Wellen, die von ⟨S1 ⟩(t) im vorliegen den Fall emittiert werden, sind daher rechtshändig polarisiert (σ + -Polarisation). Wir erhalten hier eine Bewegung der Erwartungswerte ⟨S1 ⟩(t) und ⟨S2 ⟩(t), die der klassi schen Bewegung entspricht.
1 Da es sich hier um magnetische Dipolübergänge handelt, haben wir es mit dem magnetischen Feld vektor der emittierten Welle zu tun. Für den Fall eines elektrischen Dipolübergangs (s. Ergänzung DVII , § 2-c) müssten wir dementsprechend das emittierte elektrische Feld betrachten.
Entwicklung gekoppelter Drehimpulse |
1089
•
Abb. 5: Ist der Zustand des Zweispinsystems nur eine Überlagerung der beiden stationären Zustände |0, 0⟩ und |1, 1⟩, präzessieren ⟨S1 ⟩ und ⟨S2 ⟩ mit der Winkelgeschwindigkeit Ω im Gegenuhrzeigersinn um die Resultierende ⟨S⟩.
γ Der |0, 0⟩ ↔ |1, −1⟩-Übergang (β 0 = β 1 = 0) Die Rechnungen sind hier vollkommen analog zu denen des vorhergehenden Unter abschnitts und führen auf die folgenden Ergebnisse (Abb. 6): ⟨S1 ⟩(t) und ⟨S2 ⟩(t) prä zessieren wieder mit der Winkelgeschwindigkeit Ω um die z-Achse, diesmal allerdings im Uhrzeigersinn. Der Erwartungswert ⟨S z ⟩ = −ℏ|β −1 |2 ist jetzt negativ, so dass er re lativ zu ⟨S⟩ gleich bleibt, obwohl sich der Umlaufsinn von ⟨S1 ⟩(t) und ⟨S2 ⟩(t) um die z-Achse geändert hat. Die von ⟨S1 ⟩(t) emittierten elektromagnetischen Wellen sind jetzt linkshändig polarisiert (σ − -Polarisation).
Abb. 6: Ist der Zustand des Zweispinsystems nur eine Überlagerung der beiden stationären Zustände |0, 0⟩ und |1, −1⟩, präzessieren ⟨S1 ⟩ und ⟨S2 ⟩ mit der Winkelgeschwindigkeit Ω wieder im Gegenuhrzeigersinn um die Resultierende ⟨S⟩, jetzt jedoch entgegengesetzt zur z-Richtung.
δ Allgemeiner Fall Für den allgemeinen Fall (beliebiges α, β −1 , β 0 und β 1 ) sehen wir aus den Beziehun gen (30) bis (33), dass die drei Komponenten von ⟨S1 ⟩(t) jeweils einen konstanten und einen mit der Frequenz Ω/2π modulierten Anteil aufweisen. Da diese drei auf die Ko ordinatenachsen projizierten Bewegungen sinusförmig mit derselben Frequenz sind, beschreibt die Spitze von ⟨S1 ⟩(t) eine Ellipse im Raum; da die Summe ⟨S1 ⟩(t) + ⟨S2 ⟩(t) = ⟨S⟩ konstant ist, beschreibt auch die Spitze von ⟨S2 ⟩(t) eine Ellipse (Abb. 7). Für den allgemeinen Fall finden wir also nur teilweise die Ergebnisse des Vek tormodells wieder. Zwar ergibt sich auch hier, dass mit wachsender Kopplungskon
•
1090 | Ergänzung FX
Abb. 7: Bewegung von ⟨S1 ⟩(t) und ⟨S2 ⟩(t) im allgemeinen Fall, wenn der Zustand des Zweispinsystems eine Überlagerung der vier stationären Zu stände |0, 0⟩, |1, 1⟩, |1, 0⟩ und |1, −1⟩ ist. Die Resultierende ⟨S⟩ ist wie der zeitlich konstant, weist aber nicht notwendig in z-Richtung; ⟨S1 ⟩ und ⟨S2 ⟩ haben keine konstanten Beträge mehr, und ihre Spitzen beschreiben Ellipsen im Raum.
stante a die Präzessionsgeschwindigkeit von ⟨S1 ⟩(t) und ⟨S2 ⟩(t) um ⟨S⟩ zunimmt, al lerdings ist wie im zuerst behandelten Fall |⟨S1 ⟩(t)| nicht konstant, und die Spitze von ⟨S1 ⟩(t) beschreibt keinen Kreisbogen.
4 Stoß zwischen zwei Spin-1/2-Teilchen 4-a Beschreibung des Modells Wir betrachten zwei Spin-1/2-Teilchen, für die wir die äußeren Freiheitsgrade klas sisch, die inneren Spinfreiheitsgrade dagegen quantenmechanisch beschreiben wol len. Ihre Bahnen sollen geradlinig verlaufen (Abb. 8), und die Wechselwirkung zwischen den beiden Spins S1 und S2 habe die Form W = a S1 ⋅ S2 , wobei die Kopp lungskonstante a eine Funktion des Abstands r der beiden Teilchen ist, die mit größer werdendem r rasch abfällt.
Abb. 8: Stoß zwischen zwei Spin-1/2-Teilchen (1) und (2), deren Bahnvariablen klassisch behandelt werden können. Der Spinzustand der Teilchen wird durch einen Doppelpfeil veranschaulicht.
Mit r ändert sich auch a zeitlich. Den Verlauf von a(t) gibt Abb. 9 wieder. Das Maxi mum entspricht dem Augenblick, in dem der Abstand der beiden Teilchen minimal ist. Um die Rechnungen zu vereinfachen, ersetzen wir den zeitlichen Verlauf nach Abb. 9 durch den nach Abb. 10.
Entwicklung gekoppelter Drehimpulse |
1091
•
Abb. 9: Zeitabhängigkeit der Kopplungskonstanten a(t) während des Stoßes
Abb. 10: Vereinfachter Verlauf von a(t) während des Stoßes
Das Problem ist das folgende: Vor dem Stoß, d. h. bei t → −∞, ist der Spinzustand des Zweiteilchensystems gegeben durch |ψ(−∞)⟩ = |+, −⟩
(39)
Wie lautet der Zustand des Systems |ψ(+∞)⟩ nach dem Stoß?
4-b Der Zustand des Systems nach dem Stoß Da der Hamilton-Operator für t < 0 null ist, haben wir |ψ(0)⟩ = |ψ(−∞)⟩ = |+, −⟩ =
1 [|1, 0⟩ + |0, 0⟩] √2
(40)
Die Ergebnisse des vorhergehenden Abschnitts für die Eigenzustände und Eigenwerte von W = a S1 ⋅ S2 sind für den Zeitraum zwischen 0 und T anwendbar und erlauben die Berechnung von |ψ(T)⟩: |ψ(T)⟩ =
1 [|1, 0⟩ e−iE1 T/ℏ + |0, 0⟩ e−iE0 T/ℏ ] √2
(41)
Wir multiplizieren Gl. (41) mit dem Phasenfaktor ei(E0 +E1 )T/(2ℏ) (physikalisch ohne Be deutung), setzen E1 − E0 = ℏΩ [s. Gl. (23)], kehren zur {|ε1 , ε2 ⟩}-Basis zurück und erhalten so ΩT ΩT |ψ(T)⟩ = cos |+, −⟩ − i sin |−, +⟩ (42) 2 2
•
1092 | Ergänzung FX
Da der Hamilton-Operator für t > T null ist, erhalten wir schließlich |ψ(+∞)⟩ = |ψ(T)⟩
(43)
Bemerkung: Die Rechnung hätte auch für eine beliebige Funktion a(t) der in Abb. 9 gezeigten Form durch geführt werden können. Es müsste dann in der vorhergehenden Beziehung aT = ΩT 2 durch +∞ ∫−∞ a(t) dt ersetzt werden (s. Aufgabe 2 in Ergänzung EXIII ).
4-c Physikalische Diskussion: Korrelation Wenn die Bedingung ΩT π = + kπ 2 2
(44)
für eine ganze Zahl k ≠ 0 erfüllt ist, so ergibt Gl. (42) |ψ(+∞)⟩ = |−, +⟩
(45)
Die Orientierung der beiden Spins kehrt sich für diesen Fall um. Gilt dagegen ΩT = kπ 2
(46)
für eine ganze Zahl k ≠ 0, so finden wir |ψ(+∞)⟩ = |+, −⟩ = |ψ(−∞)⟩
(47)
Für diesen Fall hat also der Stoß keinen Einfluss auf die Orientierung der Spins. Für andere Werte von T gilt |ψ(+∞)⟩ = α |+, −⟩ + β |−, +⟩
(48)
wobei α und β ungleich null sind. Der Zustand des Zweispinsystems ist durch den Stoß in eine lineare Überlagerung der beiden Zustände |+, −⟩ und |−, +⟩ überführt wor den. Der Vektor |ψ(+∞)⟩ ist daher kein Tensorprodukt mehr, obwohl |ψ(−∞)⟩ eines war: Die Wechselwirkung der beiden Spins hat zu Korrelationen zwischen ihnen ge führt. Um die Bedeutung dieser Aussage zu verstehen, betrachten wir ein Experiment, bei dem ein Beobachter (1) nach dem Stoß S1z misst. Nach Gl. (48) beobachtet er mit der Wahrscheinlichkeit |α|2 den Wert +ℏ/2 und mit der Wahrscheinlichkeit |β|2 den Wert −ℏ/2 [nach Gl. (42) gilt |α|2 + |β|2 = 1]. Nehmen wir an, er fände −ℏ/2. Unmit telbar nach dieser Messung befindet sich das ganze System nach dem Postulat der Zustandsreduktion im Zustand |−, +⟩. Wenn in diesem Moment ein zweiter Beobach ter (2) S2z misst, wird er immer +ℏ/2 finden. Analog kann leicht gezeigt werden, dass
Entwicklung gekoppelter Drehimpulse | 1093
•
es auch umgekehrt so wäre: Hat Beobachter (1) den Wert +ℏ/2 gemessen, erhält Beob achter (2) immer den Wert −ℏ/2. Das Ergebnis des Beobachters (1) beeinflusst also ent scheidend das von Beobachter (2) später erhaltene Resultat, selbst dann, wenn zum Zeitpunkt der Messung die beiden Teilchen weit voneinander entfernt sind. Dieses scheinbar paradoxe Ergebnis (das Einstein-Podolsky-Rosen-Paradoxon) spiegelt eine starke Korrelation zwischen den beiden Spins wider, die ihre Ursache in der Wechsel wirkung während des Stoßes hat. Abschließend bemerken wir: Interessiert man sich nur für einen der beiden Spins, so ist es unmöglich, seinen Zustand nach dem Stoß durch einen Zustandsvektor zu beschreiben, da nach Gl. (48) |ψ(+∞)⟩ kein tensorielles Produkt ist. Der Spin (1) etwa kann in diesem Fall nur durch einen Dichteoperator (s. Ergänzung EIII ) beschrieben werden. Sei also ρ = |ψ(+∞)⟩⟨ψ(+∞)|
(49)
der Dichteoperator des gesamten Zweispinsystems. Nach den Ergebnissen aus Ergän zung EIII , § 5-b erhält man den Dichteoperator des Spins (1) durch Bilden der Partial spur von ρ in Bezug auf die Spinvariablen von Teilchen (2): ρ(1) = Sp 2 ρ
(50)
und analog ρ(2) = Sp 1 ρ
(51)
Aus der Beziehung (48) für |ψ(+∞)⟩ lässt sich die Matrix, die ρ in der Basis aus den vier Zuständen {|+, +⟩, |+, −⟩, |−, +⟩|−, −⟩} darstellt, leicht berechnen. Wir finden 0 0 ρ=( 0 0
0 |α|2 βα ∗ 0
0 αβ ∗ |β|2 0
0 0 ) 0 0
(52)
Wenn wir Gl. (50) und Gl. (51) anwenden, so erhalten wir ρ(1) = (
|α|2 0
0 ) |β|2
(53)
ρ(2) = (
|β|2 0
0 ) |α|2
(54)
Ausgehend von den Gleichungen (53) und (54) bilden wir dann ρ = ρ(1) ⊗ ρ(2)
(55)
•
1094 | Ergänzung FX
dessen Matrixdarstellung so aussieht |α|2 |β|2 0 ρ = ( 0 0
0 |α|4 0 0
0 0 |β|4 0
0 0 ) 0 |α|2 |β|2
(56)
Wir sehen also, dass ρ von ρ verschieden ist, eine Folge der Korrelation zwischen den beiden Spins.
Referenzen und Literaturhinweise Vektormodell des Atoms: Eisberg und Resnick (1.3), Kap. 8, § 5; Cagnac und PebayPeyroula (11.2), Kap. XVI, § 3B und XVII, § 3E und § C. Einstein-Podolsky-Rosen-Paradoxon: siehe Referenzen in Ergänzung DIII .
Aufgaben | 1095
•
Ergänzung GX Aufgaben 1. Man betrachte ein Deuteriumatom (bestehend aus einem Atomkern mit Spin I = 1 und einem Elektron). Der von dem Elektron herrührende Drehimpuls ist J = L + S, wobei L den Bahndrehimpuls und S den Spin des Elektrons bezeichnet. Der Gesamt drehimpuls des Atoms ist F = J+I, wobei I der Spin des Kerns ist. Die Eigenwerte von J2 und F2 sind J(J + 1)ℏ2 bzw. I(I + 1)ℏ2 . a) Welche Werte haben die Quantenzahlen J und F für ein Deuteriumatom im 1s-Grundzustand? b) Welche Werte haben sie im angeregten 2p-Zustand? 2. Der Kern des Wasserstoffatoms ist ein Proton mit dem Spin I = 1/2. a) Welche Werte haben (in der Notation der vorhergehenden Aufgabe) die Quanten zahlen J und F für ein Wasserstoffatom auf dem 2p-Niveau? b) Es seien {|n, l, m⟩} die stationären Zustände des Hamilton-Operators H0 des in § C von Kapitel VII behandelten Wasserstoffatoms. Es sei {|n, l, s, J, M J ⟩} die Basis, die sich durch Addition von L und S zu J ergibt (M J ℏ ist der Eigenwert von J z ), und sei {|n, l, s, J, I, F, M F ⟩} dementsprechend die Basis, die sich durch Addition von J und I zu F ergibt (M F ℏ ist der Eigenwert von F z ). Der Operator des magnetischen Moments des Elektrons lautet M = μ B (L + 2S)/ℏ In jedem Unterraum H(n = 2, l = 1, s = 1/2, J, I = 1/2, F) des 2p-Niveaus, aufge spannt durch die zu festen Werten für J und F gehörenden 2F + 1 Vektoren |n = 2, l = 1, s = 1/2, J, I = 1/2, F, M F ⟩ können wir wegen des Projektionstheorems (s. Ergänzung DX , § 2-c und § 3) schreiben M = g JF μ B F/ℏ Man berechne die verschiedenen möglichen Werte des Landé-Faktors g JF des 2p-Ni veaus. 3. Man betrachte ein System aus zwei Spin-1/2-Teilchen, deren Bahnvariablen nicht berücksichtigt werden sollen. Der Hamilton-Operator des Systems ist H = ω1 S1z + ω2 S2z worin S1z und S2z die Projektionen der Teilchenspins S1 und S2 auf die z-Achse und ω1 und ω2 reelle Konstanten sind. https://doi.org/10.1515/9783110638769-015
•
1096 | Ergänzung GX
a) Der Anfangszustand des Systems zur Zeit t = 0 sei 1 |ψ(0)⟩ = [| + −⟩ + | − +⟩] √2 (in der Notation von Kap. X, § B). Zur Zeit t werde S2 = (S1 +S2 )2 gemessen. Welche Ergebnisse kann man mit welchen Wahrscheinlichkeiten finden? b) Welche Bohr-Frequenzen können in der Zeitentwicklung von ⟨S2 ⟩ auftreten, wenn der Anfangszustand des Systems beliebig ist, welche für S x = S1x + S2x ? 4. Man betrachte ein Teilchen (a) mit Spin 3/2, das in zwei Teilchen (b) mit dem Spin 1/2 und (c) mit dem Spin 0 zerfallen kann. Wir befinden uns im Ruhesystem von (a). Der Gesamtdrehimpuls bleibt während des Zerfalls erhalten. a) Welche Werte kann der relative Bahndrehimpuls der beiden Produktteilchen an nehmen? Man zeige, dass es nur einen möglichen Wert gibt, wenn die Parität des relativen Bahnzustands festgelegt ist. Würde das Ergebnis gültig bleiben, wenn der Spin von Teilchen (a) größer als 3/2 wäre? b) Man nehme an, das Teilchen (a) sei anfangs in einem Spinzustand mit dem Eigen wert m a ℏ der z-Komponente des Spins. Wir wissen, dass der End-Bahnzustand wohldefinierte Parität besitzt. Ist es möglich, diese Parität durch die Messung der Wahrscheinlichkeiten, Teilchen (b) entweder im Zustand |+⟩ oder im Zustand |−⟩ zu finden, zu bestimmen (die allgemeinen Beziehungen aus Ergänzung AX , § 2 können benutzt werden)? 5. Es sei S = S1 + S2 + S3 der Gesamtdrehimpuls von drei Spin-1/2-Teilchen (deren Bahnvariablen vernachlässigt werden sollen); |ε1 , ε2 , ε3 ⟩ seien die gemeinsamen Ei genvektoren von S1z , S2z und S3z mit den Eigenwerten ε1 ℏ/2, ε2 ℏ/2 bzw. ε3 ℏ/2. Man gebe eine Basis von gemeinsamen Eigenzuständen von S2 und S z in Abhängigkeit von den Vektoren |ε1 , ε2 , ε3 ⟩ an. Bilden diese beiden Operatoren einen vollständigen Satz kommutierender Observabler? (Man addiere zunächst zwei Spins, um dann den so erhaltenen Teildrehimpuls zum dritten zu addieren.) 6. Es seien S1 und S2 die inneren Drehimpulse zweier Spin-1/2-Teilchen, R1 und R2 ihre Ortsvariablen und m1 und m2 ihre Massen (mit der reduzierten Masse μ = m1 m2 /(m1 + m2 )). Man nehme an, dass die Wechselwirkung W zwischen den beiden Teilchen S1 ⋅ S2 W = U(R) + V(R) ℏ2 ist, wobei U(R) und V(R) nur vom Abstand R = |R1 −R2 | der beiden Teilchen abhängen. a) Es sei S = S1 + S2 der Gesamtspin der beiden Teilchen. α) Man zeige, dass 3 S1 ⋅ S2 P1 = + 4 ℏ2 1 S1 ⋅ S2 P0 = − 4 ℏ2 die Projektoren auf die Zustände des Gesamtspins S = 1 bzw. S = 0 sind.
Aufgaben |
1097
•
β) Man folgere daraus W = W1 (R)P1 + W0 (R)P0 , wobei W1 (R) und W0 (R) zwei Funktionen von R sind, die in Abhängigkeit von U(R) und V(R) auszudrücken sind. b) Man gebe den Hamilton-Operator H des „Relativteilchens“ im Ruhesystem des Massenmittelpunkts an; der Impuls dieses Relativteilchens werde mit P bezeich net. Man zeige, dass H mit S2 vertauscht und nicht von S z abhängt. Man folgere daraus, dass es möglich ist, die zu S = 1 und S = 0 gehörenden Eigenzustände von H getrennt voneinander zu behandeln. Man zeige, dass man Eigenzustände von H mit dem Eigenwert E von der folgenden Form finden kann: +1
|ψ E ⟩ = λ00 |φ0E ⟩|S = 0, M = 0⟩ + ∑ λ1M |S = 1, M⟩ M=−1
wobei λ00 und λ1M Konstanten und |ψ0E ⟩ und |ψ1E ⟩ Vektoren des Zustandsraums Hr des Relativteilchens sind. Man gebe die Eigenwertgleichung für |ψ0E ⟩ und |ψ1E ⟩ an. c) Wir wollen Stöße zwischen den beiden betrachteten Teilchen untersuchen. E = ℏ2 k 2 /2μ sei die Energie des Systems im Ruhesystem des Massenmittelpunkts. Wir nehmen im Folgenden an, dass vor dem Stoß ein Teilchen im |+⟩-Spinzustand ↑↓ und das andere im |−⟩-Spinzustand ist. Es sei |ψ k ⟩ der entsprechende stationäre Streuzustand (s. Kap. VIII, § B). Man zeige, dass gilt ↑↓
|ψ k ⟩ =
1 1 |φ0 ⟩|S = 0, M = 0⟩ + |φ1 ⟩|S = 1, M = 0⟩ √2 k √2 k
worin |φ0k ⟩ und |φ1k ⟩ die stationären Streuzustände eines spinlosen Teilchens der Masse μ sind, das an einem Potential W0 (R) bzw. W1 (R) gestreut wird. d) Es seien f0 (θ) und f1 (θ) die zu |φ0k ⟩ und |φ1k ⟩ gehörenden Streuamplituden. Man berechne den Streuquerschnitt σ b (θ) der beiden Teilchen in θ-Richtung bei gleichzeitigem Umklappen der beiden Spins (der Spin geht aus dem |+⟩-Zustand in den |−⟩-Zustand über und umgekehrt) in Abhängigkeit von f0 (θ) und f1 (θ). e) Es seien δ0l und δ1l die Phasenverschiebungen der l zu W0 (R) bzw. W1 (R) gehö renden Partialwellen (s. Kap. VIII, § C-3). Man zeige, dass der totale Wirkungsquer schnitt σ b für gleichzeitiges Umklappen der beiden Spins gegeben wird durch σb =
π ∞ ∑ (2l + 1) sin2 (δ1l − δ0l ) k 2 l=0
7. Wir definieren die Standardkomponenten eines Vektors V durch die drei Operato ren 1 (1) V1 = − (V x + iV y ) √2 (1)
V0 = V z 1 (1) (V x − iV y ) V−1 = √2
•
1098 | Ergänzung GX (1)
(1)
Mit Hilfe der Standardkomponenten V p und W q der beiden Vektoroperatoren V und W konstruieren wir die Operatoren (K)
(1)
(1)
[V (1) ⊗ W (1) ]M = ∑ ∑⟨1, 1; p, q | K, M⟩ V p W q p
q
wobei ⟨1, 1; p, q | K, M⟩ die Clebsch-Gordan-Koeffizienten sind, die bei der Addition zweier Drehimpulse vom Wert eins auftreten (man kann diese Koeffizienten aus den Ergebnissen aus Ergänzung AX , § 1 erhalten). (0) a) Man zeige, dass [V (1) ⊗ W (1) ]0 proportional zu dem Skalarprodukt V ⋅ W der bei den Vektoroperatoren ist. (1) b) Man zeige, dass die drei Operatoren [V (1) ⊗ W (1) ]M proportional zu den drei Stan dardkomponenten des Vektoroperators V × W sind. (2) c) Man gebe die fünf Komponenten [V (1) ⊗ W (1) ]M in Abhängigkeit von V z , V± = V x ± iV y , W z , W± = W x ± iW y an. d) Wir wählen V = W = R, wobei R die Ortsobservable eines Teilchens ist. Man (2) zeige, dass die fünf Operatoren [R(1) ⊗ R(1) ]M proportional zu den fünf Kompo M nenten Q2 des Operators des elektrischen Quadrupolmoments dieses Teilchens sind [s. Gl. (29) aus Ergänzung EX ]. e) Wir wählen V = W = L, wobei L der Bahndrehimpuls des Teilchens ist. Man (2) gebe die fünf Operatoren [L(1) ⊗ L(1) ]M in Abhängigkeit von L z , L+ , L− an. Wie lauten die Auswahlregeln, die für diese fünf Operatoren in einer Standardbasis {|k, l, m⟩} von gemeinsamen Eigenzuständen zu L2 und L z gelten? Mit anderen Worten: Welche Bedingungen müssen erfüllt sein, damit das Matrixelement (2) ⟨k, l, m [L(1) ⊗ L(1) ]M k , l , m ⟩
nicht verschwindet? 8. Irreduzible Tensoroperatoren; Wigner-Eckart-Theorem (K) Nach Definition handelt es sich bei den 2K + 1 Operatoren T Q , worin K eine positive ganze Zahl und Q = −K, −K +1, . . . , +K ist, um die 2K +1 Komponenten eines irredu ziblen Tensoroperators K-ter Stufe, wenn sie die folgenden Vertauschungsrelationen mit dem Gesamtdrehimpuls J des physikalischen Systems erfüllen: (K)
(K)
[J z , T Q ] = ℏQ T Q
(1)
(K)
(K)
(K)
(K)
[J + , T Q ] = ℏ√K(K + 1) − Q(Q + 1) T Q+1 [J − , T Q ] = ℏ√K(K + 1) − Q(Q − 1) T Q−1
(2) (3)
Aufgaben | 1099
•
a) Man zeige, dass ein skalarer Operator ein irreduzibler Tensoroperator K = 0-ter Stufe ist und dass die drei Standardkomponenten eines Vektoroperators (s. Auf gabe 7) die Komponenten eines irreduziblen Tensoroperators K = 1-ter Stufe sind. b) Es sei {|k, J, M⟩} eine Standardbasis gemeinsamer Eigenzustände von J2 und J z . Indem man ausnutzt, dass beide Seiten von Gl. (1) dieselben Matrixelemente zwischen |k, J, M⟩ und |k , J , M ⟩ haben, zeige man, dass das Matrixelement (K) ⟨k, J, M | T Q | k , J , M ⟩ verschwindet, wenn M nicht gleich Q + M ist. c) Indem man in gleicher Weise mit Gl. (2) und Gl. (3) verfährt, zeige man, dass die (2J + 1)(2K + 1)(2J + 1) zu festen Werten von k, J, K, k , J gehörenden Matrixele (K) mente ⟨k, J, M | T Q | k , J , M ⟩ Rekursionsrelationen erfüllen, die mit den für die (2J + 1)(2K + 1)(2J + 1) zu festen Werten von J, K, J gehörenden Clebsch-GordanKoeffizienten ⟨J , K; M , Q | J, M⟩ (s. Ergänzung BX , § 1-c und § 2) geltenden iden tisch sind. d) Man zeige (K)
⟨k, J, M | T Q | k , J , M ⟩ = α⟨J , K; M , Q | J, M⟩
(4)
wobei α eine Konstante ist, die nur von k, J, K, k , J abhängt und häufig in der Form geschrieben wird α=
1 ⟨k, J ‖ T (K) ‖ k , J ⟩ √2J + 1 (K)
e) Man zeige umgekehrt, dass die (2K + 1) Operatoren T Q die Beziehungen (1), (2) und (3) erfüllen, d. h. dass sie die (2K+1) Komponenten eines irreduziblen Tensor operators K-ter Stufe bilden, wenn für sie Gl. (4) für alle |k, J, M⟩ und |k , J , M ⟩ gilt. f) Man zeige, dass die in Ergänzung EX eingeführten elektrischen Multipoloperato ren Q m l eines spinlosen Teilchens im Zustandsraum Hr irreduzible Tensoropera toren l-ter Stufe sind. Man zeige zusätzlich, dass die Operatoren Q m l irreduzible Tensoroperatoren im Zustandsraum Hr ⊗ HS (wobei HS der Spinzustandsraum ist) bleiben, wenn man die Spinfreiheitsgrade mit beachtet. g) Man leite die Auswahlregeln ab, die die Operatoren Q m l in einer Standardbasis {|k, l, J, M J ⟩} erfüllen, die sich aus der Addition des Bahndrehimpulses L und des Spins S des Teilchens zum Gesamtdrehimpuls J = L + S ergibt (l(l + 1)ℏ2 , J(J + 1)ℏ2 und M J ℏ sind die Eigenwerte von L2 , J2 bzw. J z ). (K )
9. Es sei A Q11 ein irreduzibler Tensoroperator (Aufgabe 8) K1 -ter Stufe, der in einem (K )
Zustandsraum H1 wirkt, und B Q22 ein irreduzibler Tensoroperator K2 -ter Stufe in ei (K )
(K )
nem Zustandsraum H2 . Aus A Q11 und B Q22 konstruieren wir den Operator (K)
(K)
(K ) (K )
C Q = [A(K1 ) ⊗ B(K2 ) ]Q = ∑ ⟨K1 , K2 ; Q1 , Q2 | K, Q⟩ A Q11 B Q22 Q1 Q2
•
1100 | Ergänzung GX
a) Man zeige mit Hilfe der Rekursionsbeziehungen für Clebsch-Gordan-Koeffizien (K) ten (s. Ergänzung BX ), dass die Operatoren C Q die Vertauschungsrelationen (1), (2) und (3) aus Aufgabe 8 erfüllen, wobei J = J1 + J2 der Gesamtdrehimpuls des (K) Systems ist. Man zeige, dass die C Q die Komponenten eines irreduziblen Tensor operators K-ter Stufe sind. (K) (K) b) Man zeige, dass der Operator ∑Q (−1)Q A Q B−Q ein skalarer Operator ist (die Er gebnisse aus § 3-d der Ergänzung BX dürfen benutzt werden). 10. Addition von drei Drehimpulsen Es seien H(1), H(2) und H(3) die Zustandsräume dreier Systeme (1), (2) und (3) mit den Drehimpulsen J1 , J2 und J3 . Mit J = J1 + J2 + J3 bezeichnen wir den Gesamtdreh impuls. {|k a , j a , m a ⟩}, {|k b , j b , m b ⟩}, {|k c , j c , m c ⟩} seien die Standardbasen von H(1), H(2) bzw. H(3). Zur Vereinfachung der Notation lassen wir wie oben die Indizes k a , k b , k c weg. Wir interessieren uns für die Eigenzustände und Eigenwerte des Gesamtdrehim pulses in dem Unterraum H(j a , j b , j c ), aufgespannt durch die Vektoren {|j a m a ⟩|j b m b ⟩|j c m c ⟩} mit −j a ≤ m a ≤ j a , −j b ≤ m b ≤ j b , −j c ≤ m c ≤ j c
(1)
Wir wollen j a , j b , j c so zusammensetzen, dass ein Eigenzustand von J2 und J z mit den Quantenzahlen j f und m f entsteht. Wenn man zuerst j b und j c addiert und dann zu ih rer Summe j e den Drehimpuls j a addiert, so nennen wir den entstehenden normierten Zustand |j f m f ⟩ |j a , (j b j c )j e ; j f m f ⟩
(2)
Man kann ebenso zunächst aus j a und j b die Summe j g bilden und hierzu j c addieren, um den Zustand |j f m f ⟩ zu erhalten; diesen schreiben wir dann |(j a j b )j g , j c ; j f m f ⟩
(3)
a) Man zeige, dass das System der zu den verschiedenen möglichen Werten von j e , j f , m f gehörenden Vektoren (2) in H(j a , j b , j c ) eine Orthonormalbasis bildet. Diesel be Frage beantworte man für das System von Vektoren (3) zu den verschiedenen Werten von j g , j f , m f . b) Man zeige unter Verwendung der Operatoren J ± , dass das Skalarprodukt ⟨(j a j b )j g , j c ; j f m f | j a , (j b j c )j e ; j f m f ⟩ nicht von m f abhängt, so dass man ein solches Skalar produkt als ⟨(j a j b )j g , j c ; j f | j a , (j b j c )j e ; j f ⟩ schreibt. c) Man zeige |j a , (j b j c )j e ; j f m f ⟩ = ∑⟨(j a j b )j g , j c ; j f | j a , (j b j c )j e ; j f ⟩|(j a j b )j g , j c ; j f m f ⟩ jg
(4)
Aufgaben | 1101
•
d) Man gebe unter Verwendung der Clebsch-Gordan-Koeffizienten die Entwicklun gen der Vektoren (2) und (3) in der Basis (1) an. Man zeige ∑⟨j b , j c ; m b , m c | j e , m e ⟩⟨j a , j e ; m a , m e | j f , m f ⟩ me
= ∑ ⟨j a , j b ; m a , m b | j g , m g ⟩⟨j g , j c ; m g , m c | j f , m f ⟩ jg mg
× ⟨(j a j b )j g , j c ; j f | j a , (j b j c )j e ; j f ⟩
(5)
e) Ausgehend von Gl. (5) beweise man unter Verwendung der Orthogonalitätsrela tionen für Clebsch-Gordan-Koeffizienten die folgenden Beziehungen: ∑ ⟨j b , j c ; m b , m c | j e , m e ⟩⟨j a , j e ; m a , m e | j f , m f ⟩⟨j d , m d | j a , j b ; m a , m b ⟩ ma mb me
= ⟨j d , j c ; m d , m c | j f , m f ⟩⟨(j a j b )j d , j c ; j f | j a , (j b j c )j e ; j f ⟩
(6)
und ⟨(j a j b )j d , j c ; j f | j a , (j b j c )j e ; j f ⟩ 1 ∑ = ⟨j b , j c ; m b , m c | j e , m e ⟩ 2j f + 1 m a m b m c m d m e m f × ⟨j a , j e ; m a , m e | j f , m f ⟩⟨j d , m d | j a , j b ; m a , m b ⟩⟨j f , m f | j d , j c ; m d , m c ⟩
Referenzen und Literaturhinweise Aufgaben 8 und 9: siehe Referenzen in Ergänzung DX . Aufgabe 10: Edmonds (2.21), Kap. 6; Messiah (1.17), Kap. XIII, § 29 und Anhang C; Rose (2.19), Anhang I.
XI Stationäre Störungstheorie A A-1 A-2 B B-1 B-2 C
Beschreibung der Methode | 1104 Problemstellung | 1104 Näherungsweise Lösung der Eigenwertgleichung von H(λ) | 1106 Störung eines nichtentarteten Niveaus | 1108 Korrekturen erster Ordnung | 1108 Korrekturen zweiter Ordnung | 1110 Störung eines entarteten Niveaus | 1112
Die quantenmechanische Behandlung konservativer physikalischer Systeme (das sind Systeme mit Hamilton-Funktionen, die nicht explizit von der Zeit abhängen) beruht auf der Untersuchung der Eigenwertgleichung des Hamilton-Operators. Wir haben bereits zwei wichtige Beispiele von physikalischen Systemen behandelt (den harmonischen Oszillator und das Wasserstoffatom), deren Hamilton-Operatoren so einfach waren, dass wir ihre Eigenwertgleichungen exakt lösen konnten. Im Allge meinen ist die Gleichung jedoch zu kompliziert, als dass man ihre Lösungen in analy tischer Form bestimmen könnte.¹ Zum Beispiel wissen wir bei Mehrelektronenatomen (selbst beim Helium) nicht, wie sie sich exakt behandeln lassen. Außerdem trägt die Theorie des Wasserstoffatoms, wie wir sie in § C von Kapitel VII entwickelt haben, nur der elektrostatischen Wechselwirkung zwischen dem Proton und dem Elektron Rechnung; erweitert man sie um relativistische Korrekturen (wie Magnetkräfte), so können auch die Gleichungen für das Wasserstoffatom nicht länger analytisch gelöst werden. Wir müssen dann auf numerische Lösungen zurückgreifen, häufig unter Ver wendung eines Computers. Es gibt jedoch auch Näherungsmethoden, mit denen wir in bestimmten Fällen analytische Näherungen für die Lösung der zugrundeliegenden Ei genwertgleichung finden können. In diesem Kapitel wollen wir eine dieser Methoden, die stationäre Störungstheorie², entwickeln. (In Kapitel XIII behandeln wir die zeit abhängige Störungstheorie, mit deren Hilfe sich Systeme mit explizit zeitabhängigen Hamilton-Operatoren behandeln lassen.) Die stationäre Störungstheorie findet in der Quantenphysik vielfache Verwen dung, da sie der Art und Weise, wie Physiker üblicherweise an Probleme herangehen, sehr gut entspricht. Bei der Untersuchung eines Phänomens oder eines physikali schen Systems beginnt man damit, die grundsätzlichen Effekte zu isolieren, die für die wesentlichen Eigenschaften dieses Phänomens oder Systems verantwortlich sind. Hat man diese verstanden, versucht man die „feineren“ Details zu erklären, indem man weniger wichtige Effekte, die in der ersten Näherung vernachlässigt wurden, mit 1 Natürlich gilt das nicht nur für die Quantenmechanik; es gibt in allen Bereichen der Physik nur sehr wenige Fälle, die vollständig analytisch behandelt werden können. 2 Eine Störungstheorie gibt es auch in der klassischen Mechanik, und sie ist mit der hier im Folgenden entwickelten weitgehend identisch. https://doi.org/10.1515/9783110638769-016
1104 | XI Stationäre Störungstheorie
in Betracht zieht. Bei der Behandlung dieser sekundären Effekte bedient man sich normalerweise der Störungstheorie. In Kapitel XII werden wir z. B. die Bedeutung der Störungstheorie für die Atomphysik kennenlernen: Mit ihrer Hilfe werden wir in der Lage sein, die relativistischen Korrekturen für das Wasserstoffatom zu berechnen. Ähnlich werden wir in Ergänzung BXIV bei der Behandlung des Heliumatoms sehen, wie man mit der Störungstheorie Vielelektronenatome behandeln kann. Zahlreiche andere Anwendungen der Störungstheorie finden sich in den Ergänzungen zu diesem und den nächsten Kapiteln. Schließlich wollen wir noch eine andere oft benutzte Näherungsmethode erwäh nen: die Variationsmethode, die wir in Ergänzung EXI vorstellen. Es werden außerdem ihre Anwendungen in der Festkörperphysik (Ergänzung FXI ) und der Molekülphysik (Ergänzung GXI ) kurz besprochen.
A Beschreibung der Methode A-1 Problemstellung Die Störungstheorie lässt sich anwenden, wenn der Hamilton-Operator des untersuch ten Systems in die Form H = H0 + W
(A-1)
gebracht werden kann, wobei die Eigenzustände und Eigenwerte von H0 bekannt sind und W viel kleiner als H0 ist. Der zeitunabhängige Operator H0 wird als ungestörter Hamilton-Operator und W als die Störung bezeichnet. Wenn W nicht zeitabhängig ist, sprechen wir von einer stationären Störung: mit diesem Fall wollen wir uns in diesem Kapitel befassen (zeitabhängige Störungen werden in Kapitel XIII behandelt). Unsere Aufgabe besteht darin, die Änderungen der Energieniveaus und der stationären Zu stände des Systems zu bestimmen, die durch die Addition der Störung W verursacht werden. Wenn wir sagen, W sei viel kleiner als H0 , so meinen wir damit, dass die Matrixele mente von W viel kleiner als die von H0 sind.³ Um das deutlicher zu machen, nehmen wir W als proportional zu einem reellen Parameter λ mit der Dimension eins an, der viel kleiner als eins ist: ̂ W = λW
mit
λ≪1
(A-2)
̂ ein Operator ist, dessen Matrixelemente vergleichbar mit denen von H0 (wobei W sind). Die Störungstheorie stellt eine Entwicklung der Eigenwerte und Eigenzustän
3 Genauer gesagt müssen die Matrixelemente von W viel kleiner als die Differenzen zwischen den Eigenwerten von H 0 sein (s. Bemerkung in § B-1-b).
A Beschreibung der Methode | 1105
de von H in Potenzen von λ dar, wobei man nur eine endliche Anzahl von Termen (oft nur einen oder zwei) betrachtet. Die Eigenzustände und Eigenwerte des ungestörten Hamilton-Operators H0 sei en bekannt. Außerdem setzen wir voraus, dass die ungestörten Energien ein diskretes Spektrum bilden, und nummerieren sie mit einem ganzzahligen Index p: E0p . Die ent sprechenden Eigenzustände bezeichnen wir mit |φ ip ⟩, wobei wir mit Hilfe des zusätz lichen Index i im Fall eines entarteten Eigenwerts E0p zwischen den verschiedenen Vektoren einer Orthonormalbasis des zugehörigen Eigenraums unterscheiden kön nen. Wir schreiben also H0 |φ ip ⟩ = E0p |φ ip ⟩
(A-3)
wobei die Menge der Vektoren |φ ip ⟩ eine Orthonormalbasis des Zustandsraums bildet:
⟨φ ip | φ ip ⟩ = δ pp δ ii
(A-4a)
∑ ∑ |φ ip ⟩⟨φ ip | = 1
(A-4b)
p
i
Wenn wir Gl. (A-2) in Gl. (A-1) einsetzen, so können wir den Hamilton-Operator des Systems als stetig vom Störparameter λ abhängig betrachten: ̂ H(λ) = H0 + λ W
(A-5)
Für λ gleich null erhalten wir den ungestörten Hamilton-Operator H0 . Die Eigenwerte E(λ) von H(λ) hängen im Allgemeinen von λ ab; in Abb. 1 sind mögliche Formen ihrer Abhängigkeiten von λ dargestellt. Zu jeder Kurve in Abb. 1 gehört ein Eigenvektor von H(λ). Für einen gegebenen Wert von λ bilden diese Vektoren eine Basis des Zustandsraums (H(λ) ist eine Obser vable). Wenn λ viel kleiner als eins ist, liegen die Eigenwerte E(λ) und die Eigenvek toren |ψ(λ)⟩ sehr dicht bei denen von H0 = H(λ = 0) und gehen für λ → 0 in diese über.
Abb. 1: Abhängigkeit der Eigenwerte E(λ) des Hamil tonoperators H(λ) = H 0 + λ ̂ W von λ. Jede Kurve ent spricht einem Eigenzustand von H(λ). Für λ = 0 ergibt sich das Spektrum von H 0 . Wir haben hier angenom men, dass die Eigenwerte E 30 und E 40 zweifach entartet sind; die Wirkung der Störung λ ̂ W hebt die Entartung von E 30 , aber nicht die von E 40 auf. Für λ = λ1 tritt eine zusätzliche zweifache Entartung auf.
1106 | XI Stationäre Störungstheorie
Natürlich kann H(λ) einen oder mehrere entartete Eigenwerte haben. Zum Bei spiel stellt in Abb. 1 die doppelte Kurve eine zweifach entartete Energie dar (die für λ → 0 den Wert E04 erreicht), zu der für alle λ ein zweidimensionaler Eigenraum ge hört. Dieselbe ungestörte Energie E0p kann für λ → 0 auch von mehreren unterschied lichen Eigenwerten E(λ) angenommen werden (dies tritt in Abb. 1 für E03 auf).⁴ Wir sagen dann, die Störung hebe die Entartung des entsprechenden Eigenwerts von H0 auf. Im folgenden Abschnitt wollen wir eine Näherungslösung der Eigenwertglei chung von H(λ) für λ ≪ 1 angeben.
A-2 Näherungsweise Lösung der Eigenwertgleichung von H(λ) Wir suchen die Eigenzustände |ψ(λ)⟩ und die Eigenwerte E(λ) des hermiteschen Ope rators H(λ): H(λ) |ψ(λ)⟩ = E(λ) |ψ(λ)⟩
(A-6)
Wir wollen annehmen,⁵ dass sich E(λ) und |ψ(λ)⟩ in Potenzen von λ entwickeln lassen: E(λ) = ε0 + λε1 + ⋅ ⋅ ⋅ + λ q ε q + . . .
(A-7a)
|ψ(λ)⟩ = |0⟩ + λ |1⟩ + ⋅ ⋅ ⋅ + λ |q⟩ + . . .
(A-7b)
q
Wir setzen diese Entwicklungen zusammen mit der Definition (A-5) von H(λ) in Gl. (A-6) ein, ∞
∞
∞
̂ [ ∑ λ q |q⟩] = [ ∑ λ q ε q ] [ ∑ λ q |q⟩] (H0 + λ W) (A-8) =0 q=0 q=0 q ][ [ ] [ ] und verlangen, dass diese Gleichung für kleine, aber beliebige λ erfüllt ist. Der Koef fizientenvergleich (hinsichtlich gleicher Potenzen in λ) liefert dann – für die Terme nullter Ordnung in λ H0 |0⟩ = ε0 |0⟩ –
für die Terme erster Ordnung ̂ − ε1 )|0⟩ = 0 (H0 − ε0 )|1⟩ + (W
–
(A-9)
(A-10)
für die Terme zweiter Ordnung ̂ − ε1 )|1⟩ − ε2 |0⟩ = 0 (H0 − ε0 )|2⟩ + (W
(A-11)
4 Es ist nicht ausgeschlossen, dass für bestimmte endliche Werte von λ zusätzliche Entartungen auftreten (Schnittpunkt bei λ = λ 1 in Abb. 1). Wir wollen hier λ als klein genug voraussetzen, damit solche Situationen vermieden werden. 5 Aus mathematischer Sicht ist das nicht offensichtlich, da sich die Frage nach der Konvergenz der Reihen (A-7a) und (A-7b) stellt.
A Beschreibung der Methode | 1107
–
für die Terme q-ter Ordnung ̂ − ε1 )|q − 1⟩ − ε2 |q − 2⟩ − ⋅ ⋅ ⋅ − ε q |0⟩ = 0 (H0 − ε0 )|q⟩ + (W
(A-12)
Wir wollen uns hier auf die Untersuchung der ersten drei Gleichungen beschrän ken, d. h. wir vernachlässigen in den Entwicklungen (A-7a) und (A-7b) Terme von hö herer als zweiter Ordnung in λ. Wie wir wissen, legt die Eigenwertgleichung (A-6) den Vektor |ψ(λ)⟩ nur bis auf einen konstanten Faktor fest. Wir können daher die Norm und die Phase von |ψ(λ)⟩ frei wählen: Wir verlangen, dass der Vektor |ψ(λ)⟩ normiert ist und legen seine Phase so fest, dass das Skalarprodukt ⟨0|ψ(λ)⟩ reell ist. In nullter Ordnung sehen wir dann, dass der mit |0⟩ bezeichnete Vektor normiert sein muss, ⟨0|0⟩ = 1
(A-13)
Seine Phase jedoch bleibt willkürlich; wir werden in § B und § C sehen, wie sie in jedem einzelnen Fall festgelegt werden kann. In erster Ordnung lässt sich das Quadrat der Norm von |ψ(λ)⟩ schreiben als ⟨ψ(λ) | ψ(λ)⟩ = [⟨0| + λ ⟨1|] [|0⟩ + λ |1⟩] + O (λ2 ) = ⟨0|0⟩ + λ [⟨1|0⟩ + ⟨0|1⟩] + O (λ2 )
(A-14)
Mit Gl. (A-13) sehen wir, dass dieser Ausdruck in erster Ordnung gleich eins ist, wenn der Term mit λ verschwindet. Aus der Wahl der Phasen folgt aber, dass das Skalarpro dukt ⟨0|1⟩ reell ist (da λ reell ist). Wir erhalten somit ⟨0|1⟩ = ⟨1|0⟩ = 0
(A-15)
Eine analoge Überlegung ergibt für die zweite Ordnung in λ ⟨0|2⟩ = ⟨2|0⟩ = −
1 ⟨1|1⟩ 2
(A-16)
und für die q-te Ordnung ⟨0|q⟩ = ⟨q|0⟩ 1 = − [⟨q − 1|1⟩ + ⟨q − 2|2⟩ + ⋅ ⋅ ⋅ + ⟨2|q − 2⟩ + ⟨1|q − 1⟩] 2
(A-17)
Wenn wir uns auf die zweite Ordnung in λ beschränken, werden die Störungsglei chungen also durch die Gleichungen (A-9), (A-10) und (A-11) gegeben. Nach den ver einbarten Konventionen müssen wir noch die Bedingungen (A-13), (A-15) und (A-16) hinzufügen. Durch Gl. (A-9) wird ausgedrückt, dass |0⟩ ein Eigenvektor von H0 mit dem Eigen wert ε0 ist, also ε0 zum Spektrum von H0 gehört. Das war zu erwarten, da schließlich jeder Eigenwert von H(λ) für λ → 0 gegen eine der ungestörten Energien geht. Wir
1108 | XI Stationäre Störungstheorie betrachten nun einen bestimmten Wert von ε0 , d. h. einen Eigenwert E0n von H0 . Wie Abb. 1 zeigt, kann es eine oder mehrere verschiedene Energien E(λ) von H(λ) geben, die für λ → 0 den Wert E0n erreichen. Die Menge der Eigenzustände von H(λ) zu den verschiedenen Eigenwerten E(λ), die für λ → 0 gegen E0n gehen, spannen einen Unterraum auf, dessen Dimension sich offensichtlich nicht sprunghaft ändern kann, wenn man λ in der Nähe von null än dert. Sie muss daher gleich der Entartung g n von E0n sein. Insbesondere kann es zu einer nichtentarteten Energie E0n nur eine einzige Energie E(λ) geben, die ebenfalls nichtentartet ist. Um den Einfluss der Störung W zu untersuchen, betrachten wir die Fälle nicht entarteter und entarteter Energieniveaus von H0 getrennt.
B Störung eines nichtentarteten Niveaus Wir betrachten einen bestimmten nichtentarteten Eigenwert E0n des ungestörten Ha milton-Operators H0 . Zu ihm gehört ein Eigenvektor |φ n ⟩, der bis auf einen konstanten Faktor eindeutig bestimmt ist. Wir wollen die Veränderungen untersuchen, die diese ungestörte Energie und der entsprechende stationäre Zustand durch die Addition der Störung W zum Hamilton-Operator erfahren. Dazu verwenden wir die Störungsgleichungen (A-9) bis (A-12) mit den Bedingun gen (A-13) und (A-15) bis (A-17). Für den Eigenwert von H(λ), der für λ → 0 gegen E0n geht, gilt ε0 = E0n
(B-1)
woraus mit Gl. (A-9) folgt, dass |0⟩ proportional zu |φ n ⟩ sein muss. Die Vektoren |0⟩ und |φ n ⟩ sind beide normiert [s. Gl. (A-13)], und wir wählen |0⟩ = |φ n ⟩
(B-2)
Für λ → 0 erhalten wir also wieder den ungestörten Zustand |φ n ⟩ mit derselben Phase. Mit E n (λ) bezeichnen wir den Eigenwert von H(λ), der für λ → 0 gegen den Ei genwert E0n von H0 geht. Dabei sei λ als genügend klein angenommen, damit dieser Eigenwert nichtentartet bleibt, d. h. dass zu ihm nur ein einzelner Eigenvektor |ψ n (λ)⟩ gehört (für das n = 2-Niveau von Abb. 1 ist das für λ < λ1 erfüllt). Wir wollen nun den ersten Term der Entwicklungen von E n (λ) und |ψ n (λ)⟩ in Potenzen von λ berechnen.
B-1 Korrekturen erster Ordnung Wir beginnen mit der Bestimmung von ε1 und dem Vektor |1⟩ aus Gl. (A-10) mit der Bedingung (A-15).
B Störung eines nichtentarteten Niveaus
| 1109
B-1-a Energiekorrekturen Wenn wir Gl. (A-10) auf den Vektor |φ n ⟩ projizieren, erhalten wir ̂ − ε1 ) | 0⟩ = 0 ⟨φ n | (H0 − ε0 ) | 1⟩ + ⟨φ n | (W
(B-3)
Der erste Term verschwindet, da |φ n ⟩ = |0⟩ ein Eigenvektor des hermiteschen Opera tors H0 mit dem Eigenwert E0n = ε0 ist. Mit Gl. (B-3) ergibt sich dann aus Gl. (B-2) ̂ | 0⟩ = ⟨φ n | W ̂ | φn ⟩ ε1 = ⟨φ n | W
(B-4)
Für den Fall eines nichtentarteten Niveaus E0n erhält man also den zugehörigen ̂ Eigenwert E n (λ) von H bis zur ersten Ordnung in der Störung W = λ W: E n (λ) = E0n + ⟨φ n | W | φ n ⟩ + O (λ2 )
(B-5)
Die Korrektur erster Ordnung zu einer nichtentarteten Energie ist einfach gleich dem Erwartungswert des Störungsterms W im ungestörten Zustand |φ n ⟩. B-1-b Korrekturen zum Eigenvektor Die Projektion (B-3) nutzt offensichtlich nicht die gesamte Information, die in der Stö rungsgleichung (A-10) enthalten ist. Wir müssen nun diese Gleichung noch auf alle von |φ n ⟩ verschiedenen Vektoren der {|φ ip ⟩}-Basis projizieren. Mit Gl. (B-1) und Gl. (B-2) erhalten wir ̂ − ε1 ) | φ n ⟩ = 0 (p ≠ n) ⟨φ ip | (H0 − E0n ) | 1⟩ + ⟨φ ip | (W
(B-6)
(da die Eigenwerte E0p im Unterschied zu E0n entartet sein können, müssen wir hier den Entartungsindex i beibehalten). Da die Eigenvektoren von H0 zu verschiedenen Eigen werten orthogonal sind, ist der letzte Term ε1 ⟨φ ip |φ n ⟩ gleich null. Außerdem können wir im ersten Term H0 nach links auf ⟨φ ip | wirken lassen. Gleichung (B-6) wird dann ̂ | φn ⟩ = 0 (E0p − E0n )⟨φ ip | 1⟩ + ⟨φ ip | W
(B-7)
woraus sich die Koeffizienten der gewünschten Entwicklung des Vektors |1⟩ auf alle ungestörten Basiszustände außer |φ n ⟩ ergeben: ⟨φ ip | 1⟩ =
1 E0n − E0p
̂ | φ n ⟩ (p ≠ n) ⟨φ ip | W
(B-8)
Der noch fehlende letzte Koeffizient ⟨φ n | 1⟩ ist nach Bedingung (A-15), die wir noch nicht benutzt haben, gleich null [nach Gl. (B-2) ist |φ n ⟩ gleich |0⟩], ⟨φ n | 1⟩ = 0
(B-9)
1110 | XI Stationäre Störungstheorie Wir kennen also jetzt den Vektor |1⟩, da wir seine Entwicklung in der {|φ ip ⟩}-Basis bestimmt haben: |1⟩ = ∑ ∑ p=n ̸ i
̂ | φn ⟩ ⟨φ ip | W E0n − E0p
|φ ip ⟩
(B-10)
̂ den zum ungestör Folglich können wir in erster Ordnung in der Störung W = λ W ten Zustand |φ n ⟩ gehörenden Eigenvektor |ψ n (λ)⟩ von H schreiben als |ψ n (λ)⟩ = |φ n ⟩ + ∑ ∑ p =n ̸ i
⟨φ ip | W | φ n ⟩ E0n − E0p
|φ ip ⟩ + O (λ2 )
(B-11)
Die Korrektur erster Ordnung zum Zustandsvektor ist eine lineare Überlagerung aller von |φ n ⟩ verschiedenen ungestörten Zustände: Man sagt, die Störung W erzeuge eine „Mischung“ des Zustands |φ n ⟩ mit den anderen Eigenzuständen von H0 . Der Beitrag eines gegebenen Zustands |φ ip ⟩ ist null, wenn das Matrixelement der Störung W zwi schen |φ n ⟩ und |φ ip ⟩ verschwindet. Allgemein ist die Mischung mit |φ ip ⟩ umso größer, je stärker die durch W induzierte Kopplung zwischen |φ n ⟩ und |φ ip ⟩ (charakterisiert durch das Matrixelement ⟨φ ip |W|φ n ⟩) ist und je enger die Niveaus E0p und E0n zusam menliegen. Bemerkung: Wir haben angenommen, dass die Störung W viel kleiner als der ungestörte Hamilton-Opera tor H 0 ist, d. h. dass die Matrixelemente von W viel kleiner als die von H 0 sind. Es kann passie ren, dass diese Annahme nicht ausreicht: Die Korrektur erster Ordnung zum Zustandsvektor ist nur klein, wenn die nichtdiagonalen Matrixelemente von W viel kleiner als die entsprechenden ungestörten Energiedifferenzen sind.
B-2 Korrekturen zweiter Ordnung Die Korrekturen zweiter Ordnung ergeben sich aus der Störungsgleichung (A-11) und der Bedingung (A-16) mit derselben Methode wie oben. B-2-a Energiekorrekturen Um ε2 zu berechnen, projizieren wir Gl. (A-11) auf den Vektor |φ n ⟩ und verwenden Gl. (B-1) und Gl. (B-2): ̂ − ε1 ) | 1⟩ − ε2 ⟨φ n | φ n ⟩ = 0 ⟨φ n | (H0 − E0n ) | 2⟩ + ⟨φ n | (W
(B-12)
Aus demselben Grund wie oben verschwindet der erste Term in dieser Gleichung. Das gilt ebenso für ε1 ⟨φ n |1⟩, da nach Gl. (B-9) |1⟩ orthogonal zu |φ n ⟩ ist. Wir erhalten also ̂ | 1⟩ ε2 = ⟨φ n | W
(B-13)
B Störung eines nichtentarteten Niveaus
| 1111
d. h. wenn wir für den Vektor |1⟩ den Ausdruck (B-10) einsetzen, ε2 = ∑ ∑
̂ | φ n ⟩|2 |⟨φ ip | W
p =n ̸ i
(B-14)
E0n − E0p
Mit diesem Ergebnis können wir die Energie E n (λ) bis zur zweiten Ordnung in der ̂ schreiben: Störung W = λ W E n (λ) = E0n + ⟨φ n | W | φ n ⟩ + ∑ ∑ p=n ̸ i
|⟨φ ip | W | φ n ⟩|2 E0n − E0p
+ O (λ3 )
(B-15)
Bemerkung: Die Energiekorrektur zweiter Ordnung für den Zustand |φ n ⟩ aufgrund der Anwesenheit des Zu stands |φ ip ⟩ hat das Vorzeichen von E 0n − E 0p . Wir können daher sagen, dass in zweiter Ordnung der Zustand |φ ip ⟩ den Zustand |φ n ⟩ umso stärker „abstößt“, je enger diese beiden Zustände bei sammen liegen und je stärker die Kopplung |⟨φ ip |W|φ n ⟩| ist.
B-2-b Korrekturen zum Eigenvektor Indem man Gl. (A-11) auf die Menge der von |φ n ⟩ verschiedenen Basisvektoren |φ ip ⟩ projiziert und die Bedingungen (A-16) verwendet, könnte man den Ausdruck für den Vektor |2⟩ und damit den Eigenvektor bis zur zweiten Ordnung erhalten. Diese Rech nung enthält keine theoretischen Schwierigkeiten und soll hier nicht ausgeführt wer den. Bemerkung: In Gl. (B-4) wird die Energiekorrektur erster Ordnung in Abhängigkeit vom Eigenvektor nullter Ord nung ausgedrückt. Analog enthält die Energiekorrektur zweiter Ordnung, Gl. (B-13), den Eigen vektor erster Ordnung (was die Ähnlichkeit von Gl. (B-10) und Gl. (B-14) erklärt). Dabei handelt es sich um ein allgemeines Ergebnis: Indem man Gl. (A-12) auf |φ n ⟩ projiziert, bringt man den ersten Term zum Verschwinden, womit man ε q in Abhängigkeit von den Korrekturen (q − 1)-ter, (q − 2)-ter, ...Ordnung zum Eigenvektor erhält. Das ist der Grund, warum wir in der Entwicklung der Energie immer einen Term mehr behalten als in der des Eigenvektors; z. B. wird die Energie in zweiter Ordnung und der Eigenvektor in erster Ordnung angegeben.
B-2-c Majorisierung von ε2 Wenn wir die Entwicklung der Energie auf die erste Ordnung in λ beschränken, kön nen wir eine näherungsweise Aussage über den Fehler machen, wenn wir den Term zweiter Ordnung berechnen. Wir betrachten den Ausdruck (B-14) für ε2 . Er enthält eine Summe von (im All gemeinen unendlich vielen) Termen, deren Zähler positiv oder null sind. Mit ∆E be zeichnen wir den Betrag der Differenz der Energie E0n des untersuchten Niveaus zu dem nächstliegenden Niveau. Für alle n gilt dann offensichtlich |E0n − E0p | ≥ ∆E
(B-16)
1112 | XI Stationäre Störungstheorie
Damit können wir ε2 majorisieren: |ε2 | ≤
1 ̂ | φ n ⟩|2 ∑ ∑ |⟨φ ip | W ∆E p=n̸ i
(B-17)
und weiter |ε2 | ≤ ≤
1 ̂ | φ i ⟩⟨φ i | W ̂ | φn ⟩ ∑ ∑⟨φ n | W p p ∆E p=n̸ i 1 ̂ [ ∑ ∑ |φ ip ⟩⟨φ ip |] W ̂ | φn ⟩ ⟨φ n | W ∆E p =n ̸ i
(B-18)
Der Operator, der hier in den Klammern auftaucht, unterscheidet sich vom Einheits operator nur durch den Projektor auf den Zustand |φ n ⟩, da die Basis der ungestörten Zustände die Vollständigkeitsrelation |φ n ⟩⟨φ n | + ∑ ∑ |φ ip ⟩⟨φ ip | = 1
(B-19)
p=n ̸ i
erfüllt. Die Ungleichung (B-18) wird daher 1 ̂ − |φ n ⟩⟨φ n |]W ̂ | φn ⟩ ⟨φ n | W[|1 ∆E 1 ̂ 2 | φ n ⟩ − (⟨φ n | W ̂ | φ n ⟩)2 ] [⟨φ n | W ≤ ∆E
|ε2 | ≤
(B-20)
Wenn wir die Beziehung (B-20) mit λ2 multiplizieren, erhalten wir eine obere Schranke für den Term zweiter Ordnung in der Entwicklung von E n (λ): |λ2 ε2 | ≤
1 (∆W)2 ∆E
(B-21)
wobei ∆W die Standardabweichung der Störung W im ungestörten Zustand |φ n ⟩ ist. Das liefert eine Abschätzung für die Größenordnung des Fehlers, wenn man nur die Korrekturen erster Ordnung berücksichtigt.
C Störung eines entarteten Niveaus Wir nehmen nun an, dass das Energieniveau E0n , dessen Störung wir untersuchen wol len, g n -fach entartet ist (wobei g n größer als eins aber endlich ist). Mit H0n bezeichnen wir den zugehörigen Eigenraum von H0 . In diesem Fall reicht die Wahl ε0 = E0n
(C-1)
nicht aus, um den Vektor |0⟩ festzulegen, da Gl. (A-9) theoretisch durch jede Linear kombination der g n Vektoren |φ in ⟩ (i = 1, 2, . . . , g n ) erfüllt werden kann. Wir wissen lediglich, dass |0⟩ zu dem durch sie aufgespannten Eigenraum gehört.
C Störung eines entarteten Niveaus |
1113
Wir werden sehen, dass sich diesmal das Niveau E0n unter der Wirkung der Stö rung W im Allgemeinen in mehrere verschiedene Unterniveaus aufspaltet, deren An zahl f n zwischen 1 und g n liegt. Ist f n kleiner als g n , so sind einige Unterniveaus entar tet, da die Gesamtzahl orthogonaler Eigenvektoren von H, die zu den f n Unterniveaus gehören, immer gleich g n ist. Bei der Berechnung der Eigenwerte und Eigenzustände des gesamten Hamilton-Operators H beschränken wir uns wie üblich für die Energien auf die erste Ordnung und für die Eigenvektoren auf die nullte Ordnung in λ. Um ε1 und |0⟩ zu bestimmen, können wir Gl. (A-10) auf die g n Basisvektoren |φ in ⟩ projizieren. Da die |φ in ⟩ Eigenvektoren von H0 mit dem Eigenwert E0n = ε0 sind, erhal ten wir die g n Beziehungen ̂ | 0⟩ = ε1 ⟨φ in |0⟩ ⟨φ in | W
(C-2)
̂ und dem Vektor |0⟩ fügen wir die Vollständigkeitsrelation Zwischen dem Operator W i der {|φ p ⟩}-Basis ein: ̂ |φ ip ⟩⟨φ ip | 0⟩ = ε1 ⟨φ in |0⟩ ∑ ∑⟨φ in | W
p
(C-3)
i
Der Vektor |0⟩, der zum Eigenraum von E0n gehört, ist orthogonal zu allen Basisvekto ren |φ ip ⟩, bei denen p verschieden von n ist. Folglich reduziert sich die Summe über p auf der linken Seite von Gl. (C-3) auf einen einzigen Term (p = n): gn
̂ |φ in ⟩⟨φ in | 0⟩ = ε1 ⟨φ in |0⟩ ∑ ⟨φ in | W
(C-4)
i =1
̂ |φ in ⟩ (worin n fest und i, i = 1, 2, . . . , g n ist) in Wir ordnen die g2n Zahlen ⟨φ in | W einer g n × g n -Matrix mit Reihenindex i und Spaltenindex i an. Diese quadratische Ma ̂ (n) ) bezeichnen, ist sozusagen aus der Matrix, die W ̂ in der {|φ i ⟩}trix, die wir mit (W p (n) 0 ̂ ) ist der Teil, der zu Hn gehört. System (C-4) Basis darstellt, herausgeschnitten; (W zeigt dann, dass der Spaltenvektor mit den Elementen ⟨φ in |0⟩ (i = 1, 2, . . . , g n ) Eigen ̂ (n) ) mit dem Eigenwert ε1 ist. vektor von (W Das Gleichungssystem (C-4) kann darüber hinaus in eine Vektorgleichung inner ̂ (n) definieren, halb H0n transformiert werden. Dazu müssen wir nur den Operator W ̂ auf den Unterraum H0 . W ̂ (n) wirkt nur in H0 , und er wird die Einschränkung von W n n ̂ |φ in ⟩, in diesem Unterraum dargestellt durch die Matrix mit den Elementen ⟨φ in | W ̂ (n) )∗ .⁶ Das Gleichungssystem (C-4) ist daher äquivalent zu der Vektor d. h. durch (W gleichung ̂ (n) |0⟩ = ε1 |0⟩ W
(C-5)
̂ (n) = P n ̂ W P n geschrieben werden (s. Er 6 Wenn P n der Projektor auf den Unterraum H0n ist, kann W gänzung BII , § 3).
1114 | XI Stationäre Störungstheorie ̂ (n) und der Operator W, ̂ dessen Einschrän Wir weisen darauf hin, dass der Operator W kung er ist, verschieden sind: Gl. (C-5) ist eine Eigenwertgleichung in H0n und nicht im gesamten Raum. Um also die Eigenwerte (in erster Ordnung) und Eigenzustände (in nullter Ord nung) des Hamilton-Operators zu berechnen, die zu einem entarteten ungestörten ̂ (n) ) diagonalisiert werden, die die Stö Energieniveau E0n gehören, muss die Matrix (W 0 rung⁷ W in dem zur Energie E n gehörenden Eigenraum H0n darstellt. Wir untersuchen die Effekte erster Ordnung in der Störung W auf das entartete Ni j (1) veau E0n etwas genauer. Es seien ε1 (j = 1, 2, . . . , f n ) die verschiedenen Wurzeln der (n) (n) ̂ ̂ charakteristischen Gleichung von (W ). Da (W ) hermitesch ist, sind ihre Eigen (1) werte reell, und die Summe ihrer Entartungen ist gleich g n (g n ≥ f n ). Jeder Eigenwert ̂ ergibt eine verschiedene Energiekorrektur. Unter dem Einfluss der Störung W = λ W (1) spaltet sich also in erster Ordnung das entartete Niveau in f n verschiedene Unterni veaus auf, deren Energien sich zu j
E n,j (λ) = E0n + λε1 ,
(1)
j = 1, 2, . . . , f n ≤ g n
(C-6)
(1)
ergeben. Wenn f n = g n gilt, so hebt die Störung W in erster Ordnung die Entartung (1) des Niveaus E0n vollständig auf. Für f n < g n ist die Entartung in erster Ordnung nur (1) teilweise aufgehoben (oder gar nicht für f n = 1). j ̂ (n) . Ist er nichtentartet, so ist der Wir betrachten nun einen Eigenwert ε1 von W zugehörige Eigenvektor |0⟩ durch Gl. (C-5) [oder das äquivalente System (C-4)] bis auf einen Phasenfaktor eindeutig bestimmt. Es gibt dann einen einzigen Eigenwert E(λ) j von H(λ), der in erster Ordnung gleich E0n + λε1 ist, und dieser Eigenwert ist nicht j ̂ (n) q-fach entartet, so lässt sich aus entartet.⁸ Ist andererseits der Eigenwert ε1 von W Gl. (C-5) nur folgern, dass der Vektor |0⟩ zu dem entsprechenden q-dimensionalen Un (1) terraum Fj gehört. j
Diese Eigenschaft von ε1 kann sehr verschiedene Situationen widerspiegeln. Man kann zwischen ihnen unterscheiden, indem man die Störungsrechnung zu höheren Ordnungen weiterführt und überprüft, ob die verbleibende Entartung aufgehoben wird. Im Einzelnen können die folgenden beiden Fälle auftreten: 1. Wir nehmen an, dass es genau eine Energie E(λ) gibt, die in erster Ordnung j gleich E0n + λε1 ist und die q-fach entartet ist (in Abb. 1 ist z. B. die Energie E(λ), die für λ → 0 gegen E04 geht, für jeden Wert von λ zweifach entartet). Zum Eigenwert E(λ) gehört dann für jeden beliebigen Wert von λ ein q-dimensionaler Eigenraum, so dass die Entartung der genäherten Eigenwerte in keiner Ordnung von λ aufgehoben wird. In diesem Fall kann der Eigenvektor |0⟩ nullter Ordnung von H(λ) nicht eindeutig festgelegt werden, da die einzige Bedingung an den Vektor |0⟩ ist, dass er zu einem Un terraum gehört, der der Limes des zu E(λ) gehörenden q-dimensionalen Eigenraums ̂ (n) ); daher liefern ihre Eigenwerte direkt die Korrekturen λε 1 . 7 Die Störung (W (n) ) ist gleich λ( W 8 Der Beweis dieser Aussage verläuft analog zu dem Beweis, dass aus einem nichtentarteten Niveau von H 0 nur ein nichtentartetes Niveau von H(λ) enstehen kann (s. das Ende von § A-2).
C Störung eines entarteten Niveaus
| 1115
(1)
von H(λ) für λ → 0 ist. Dieser Limes ist nichts anderes als der Eigenraum Fj ̂ (n) ), der zu dem betrachteten Eigenwert ε j gehört. (W
von
1
Dieser erste Fall tritt oft auf, wenn H0 und W gleiche Symmetrieeigenschaften besitzen, die eine wesentliche Entartung von H(λ) zur Folge haben. Eine solche Ent artung bleibt in allen Ordnungen der Störungstheorie bestehen. 2. In der umgekehrten Situation sind mehrere verschiedene Energien E(λ) in ers j ter Ordnung gleich E0n + λε1 (der Unterschied ist dann wenigstens von zweiter Ord nung und kann sich dann bei einer Störungsrechnung höherer Ordnung bemerkbar machen). ̂ )(n) erhaltene Unterraum F (1) In diesem Fall ist der durch Diagonalisierung von (W j nur die direkte Summe der Grenzwerte für λ → 0 der zu den verschiedenen Ener gien E(λ) gehörenden Eigenräume. Anders ausgedrückt streben alle Eigenvektoren (1) von H(λ), die zur Energie E(λ) gehören, gegen einen Vektor von Fj . Umgekehrt ist (1)
aber ein bestimmter Vektor aus Fj nicht notwendig der Grenzwert |0⟩ eines Eigen vektors von H(λ). Wenn man in einer solchen Situation zu höheren Ordnungen übergeht, so lassen sich nicht nur die Energien, sondern auch die Vektoren nullter Ordnung genauer be stimmen. In der Praxis wird allerdings der in Gl. (C-5) enthaltene Teil der Information oft als ausreichend angesehen. Bemerkungen: 1. Sollen alle Energien des Spektrums⁹ von H 0 störungstheoretisch behandelt werden, so müs sen wir die Störung W in jedem der zu diesen Energien gehörenden Eigenräume H0n diagonalisie ren. Das Problem ist dabei sehr viel einfacher als das ursprüngliche, das eine Diagonalisierung des Hamilton-Operators im gesamten Zustandsraum nötig macht. Die Störungstheorie ermög licht es, Matrixelemente von W zwischen Zuständen, die zu verschiedenen Unterräumen H0n ge hören, vollständig zu ignorieren. Dann genügt es, statt einer im Allgemeinen unendlichen Matrix für jede uns interessierende Energie E 0n nur eine Matrix geringerer (meist endlicher) Dimension zu diagonalisieren. ̂(n) ) hängt natürlich von der eingangs in diesem Unterraum H0n gewählten Ba 2. Die Matrix ( W ̂ (n) offensichtlich nicht von ihr sis {|φ in ⟩} ab (wogegen die Eigenwerte und Eigenvektoren von W abhängen). Bevor wir mit der Störungsrechnung anfangen, ist es daher vorteilhaft, eine Basis zu ̂(n) ) für diesen Unterraum und damit die Suche nach ihren Eigenwerten finden, die die Form von ( W und Eigenvektoren so weit wie möglich vereinfacht (der einfachste Fall ist offensichtlich der, dass sich die Matrix direkt in Diagonalform ergibt). Um eine solche Basis zu finden, benutzt man oft Observable, die mit H 0 und W vertauschen.¹⁰ Nehmen wir also an, wir hätten eine Observable A, die mit H 0 und W vertauscht. Dann können wir als Basisvektoren |φ in ⟩ die gemeinsamen Eigen zustände von H 0 und A wählen. Außerdem verschwinden, da der Operator W mit A vertauscht, seine Matrixelemente zwischen Eigenvektoren von A zu unterschiedlichen Eigenwerten. Die Ma ̂(n) ) enthält dann zahlreiche Nullen, wodurch ihre Diagonalisierung vereinfacht wird. trix ( W
9 Die Störung eines nichtentarteten Zustands (§ B) kann als Spezialfall eines entarteten Zustands auf gefasst werden. 10 Man beachte, dass dies nicht bedeutet, dass H 0 und W vertauschen.
1116 | XI Stationäre Störungstheorie
3. Genau wie für nichtentartete Niveaus (s. die Bemerkung in § B-1-b) ist die in diesem Abschnitt beschriebene Methode nur dann möglich, wenn die Matrixelemente der Störung viel kleiner sind als die Differenzen zwischen der Energie des untersuchten Niveaus und den Energien der anderen Niveaus (dieser Umstand wäre offensichtlich, wenn wir Korrekturen höherer Ordnung berechnet hätten). Es ist jedoch auch möglich, diese Methode auf eine Gruppe von ungestörten Niveaus aus zudehnen, die (voneinander verschieden) sehr dicht beieinander liegen, sich aber weit weg von den anderen Niveaus des betrachteten Systems befinden. Das bedeutet natürlich, dass die Ma trixelemente der Störung W von derselben Größenordnung wie die Energiedifferenzen innerhalb dieser Gruppe, aber vernachlässigbar im Vergleich zum Abstand eines Niveaus dieser Gruppe zu einem außerhalb liegenden Niveau sind. Wir können dann den Einfluss der Störung W nä herungsweise bestimmen, indem wir die Darstellungsmatrix von H = H 0 + W innerhalb dieser Gruppe von Niveaus diagonalisieren. Durch eine Näherung dieser Art können wir in bestimm ten Fällen die Untersuchung auf die eines Systems reduzieren, das nur zwei Zustände besitzt (s. Kap. IV, § C).
Referenzen und Literaturhinweise Weitere Methoden der Störungstheorie werden in den folgenden Werken behandelt: Brillouin-Wigner-Reihe: Ziman (2.26), § 3.1. Methode der Resolvente (gut geeignet zur Berechnung von Korrekturen höherer Ord nung): Messiah (1.17), Kap. XVI, § III; Roman (2.3), § 4-5 d. Methode von de Dalgarno und Lewis: Borowitz (1.7), § 14-5; Schiff (1.18), Kap. 8, § 33. Originalarbeiten: (2.34), (2.35), (2.36). WKB-Methode, anwendbar in quasi-klassischer Näherung: Landau und Lifschitz (1.19), Kap. 7; Messiah (1.17), Kap. VI, § II; Merzbacher (1.16), Kap. VII; Schiff (1.18), § 34; Borowitz (1.7), Kap. 8 und 9. Methode von Hartree und Hartree-Fock: Ergänzung EXV ; Messiah (1.17), Kap. XVIII, § II; Slater (11.8), Kap. 8, 9 (Hartree) und 17 (Hartree-Fock); Bethe und Jackiw (1.21), Kap. 4. Siehe auch die Referenzen in Ergänzung AXIV .
Übersicht über die Ergänzungen zu Kapitel XI |
1117
•
Übersicht über die Ergänzungen zu Kapitel XI Die Ergänzungen AXI , BXI , CXI und DXI illustrieren die Methode der Störungstheorie an einigen einfachen und wichtigen Beispielen. AXI Gestörter harmonischer Oszillator
In AXI wird der eindimensionale harmonische Oszillator untersucht, der durch Potentiale in x, x 2 , x 3 gestört wird. (einfach, beim ersten Lesen empfohlen) Das letzte Beispiel (Störpotential in x 3 ) ermöglicht die Untersuchung des anharmonischen Anteils in der Schwingung eines zweiatomigen Moleküls.
BXI Wechselwirkung zwischen magnetischen Dipolen
BXI kann als Aufgabe mit Lösung verstanden werden, die die Störungstheorie für nichtentartete und auch entartete Niveaus anwendet. Der Leser wird mit der Dipol-Dipol-Wechselwirkung zwischen den magnetischen Momenten zweier Spin-1/2Teilchen vertraut gemacht. (einfach)
CXI Van-der-Waals-Kräfte
In CXI werden die langreichweitigen Kräfte zwischen zwei neutralen Atomen mit Hilfe der Störungstheorie untersucht. Der Schwerpunkt liegt auf der physikalischen Interpretation der Ergebnisse. (nicht ganz so einfach wie die vorherigen Ergänzungen; kann beim ersten Lesen übergangen werden)
DXI Der Volumeneffekt
In DXI wird der Einfluss des endlichen Kernvolumens auf die Energieniveaus wasserstoffähnlicher Atome bestimmt. (einfach; kann als Fortsetzung von Ergänzung AVII verstanden werden)
EXI Die Variationsmethode
In dieser Ergänzung wird eine weitere Näherungsmethode vorgestellt: die Variationsmethode. (wichtig, da die Variationsmethode oft angewendet wird) In FXI und GXI werden zwei wichtige Anwendungen der Variationsmethode vorgestellt.
FXI Energiebänder im Festkörper
In FXI wird mit Hilfe der Näherung der starken Bindung der Begriff des erlaubten Energiebands für die Elektronen eines Festkörpers eingeführt. Der Schwerpunkt liegt in der Interpretation der Ergebnisse. (wichtig aufgrund seiner zahlreichen Anwendungen; von mittlerer Schwierigkeit)
GXI Chemische Bindung: Das H+2 -Ion
In GXI wird das Phänomen der chemischen Bindung für den einfachsten Fall, das (ionisierte) H+2 -Molekül, untersucht. Es wird gezeigt, wie die anziehende Kraft zwischen zwei Atomen mit überlappenden elektronischen Wellenfunktionen quantenmechanisch erklärt werden kann. Wir beweisen auch das Virialtheorem. (grundlegend für die physikalische Chemie; von mittlerer Schwierigkeit)
HXI Aufgaben
•
1118 | Ergänzung AXI
Ergänzung AXI Gestörter harmonischer Oszillator 1 1-a 1-b 2 3 3-a 3-b 3-c
Störung durch ein lineares Potential | 1118 Die exakte Lösung | 1119 Die Störungsentwicklung | 1120 Störung durch ein quadratisches Potential | 1121 Störung durch ein Potential in x 3 | 1122 Der anharmonische Oszillator | 1122 Die Störungsentwicklung | 1123 Anwendung: Schwingungen eines zweiatomigen Moleküls | 1125
Zur Anwendung der in Kapitel XI entwickelten allgemeinen Methoden der stationä ren Störungstheorie wollen wir hier den Einfluss eines Störpotentials in x, x2 oder x3 auf die Energieniveaus eines eindimensionalen harmonischen Oszillators untersu chen (kein Niveau ist entartet, s. Kapitel V). Die ersten beiden Fälle (eines Störpotentials in x und x2 ) sind exakt lösbar. Wir können daher für diese beiden Beispiele zeigen, dass die Störungsentwicklung mit der Entwicklung der exakten Lösung bezüglich des Parameters übereinstimmt, der die Stärke der Störung angibt. Der letzte Fall (Störpotential in x3 ) ist in der Praxis aus folgendem Grund von großer Bedeutung: Betrachten wir ein Potential V(x) mit einem Minimum bei x = 0, so kann in erster Näherung V(x) durch den ersten Term seiner Taylor-Entwicklung (ein x2 -Term) ersetzt werden; wir haben es dann mit einem harmonischen Oszillator und damit mit einem exakt lösbaren Problem zu tun. Der nächste Term in der Entwicklung von V(x), proportional zu x3 , stellt dann die erste Korrektur dieser Näherung dar. Die Berechnung des Einflusses dieses x3 -Terms ist da her notwendig, wenn wir die anharmonischen Anteile der Schwingungen eines physi kalischen Systems untersuchen wollen. Wir können dann z. B. die Abweichungen des Schwingungsspektrums eines zweiatomigen Moleküls von den Vorhersagen des (rein harmonischen) Modells von Ergänzung AV berechnen.
1 Störung durch ein lineares Potential Wir verwenden die Bezeichnungen aus Kapitel V. Es sei H0 =
P2 1 + mω2 X 2 2m 2
https://doi.org/10.1515/9783110638769-017
(1)
Gestörter harmonischer Oszillator
| 1119
•
der Hamilton-Operator eines eindimensionalen harmonischen Oszillators mit den Ei genvektoren |φ n ⟩ und den Eigenwerten¹ E0n = (n +
1 ) ℏω 2
n = 0, 1, 2, . . .
(2)
Zu diesem Hamilton-Operator addieren wir die Störung ̂ W = λ ℏω X
(3)
wobei λ eine reelle Konstante (mit der Dimension eins) sehr viel kleiner als eins ist, ̂ wie in Kapitel V durch X ̂ = √mω/ℏX gegeben wird (da X ̂ von der Ordnung eins und X ̂ von der Ordnung von H0 und entspricht somit dem in Kapitel XI verwen ist, ist ℏω X ̂ Das Problem besteht in der Berechnung der Eigenzustände |φ n ⟩ deten Operator W). und der Eigenwerte E n des Hamilton-Operators H = H0 + W
(4)
1-a Die exakte Lösung Wir haben bereits ein Beispiel für eine lineare Störung in X kennengelernt: Wenn der als geladen angenommene Oszillator in ein homogenes elektrisches Feld ℰ gebracht wird, müssen wir zu H0 den elektrostatischen Hamilton-Operator W = −qℰX = −qℰ √
ℏ ̂ X mω
(5)
addieren, wobei q die Ladung des Oszillators ist. Die Auswirkung eines solchen Terms auf die stationären Zustände des harmonischen Oszillators ist in Ergänzung FV aus führlich untersucht worden. Wir können daher die dortigen Ergebnisse verwenden, um die Eigenzustände und Eigenvektoren des Hamilton-Operators (4) zu bestimmen. Wir substituieren λℏω ←→ −qℰ √
ℏ mω
(6)
und erhalten mit (Gl. 39) aus Ergänzung FV unmittelbar E n = (n +
λ2 1 ) ℏω − ℏω 2 2
(7)
Außerdem lesen wir ab [nachdem wir den Operator P durch die Erzeugungs- und Ver nichtungsoperatoren a† und a ausgedrückt haben, s. (Gl. 40) aus Ergänzung FV ] |ψ n ⟩ = e−λ(a
†
−a)/√2
|φ n ⟩
(8)
1 Um deutlich zu machen, dass wir hier den ungestörten Hamilton-Operator betrachten, fügen wir dem Eigenwert von H 0 wieder den Index 0 bei.
•
1120 | Ergänzung AXI
Die Entwicklung der Exponentialfunktion ergibt dann λ † (a − a) + ⋅ ⋅ ⋅ ] |φ n ⟩ √2 n+1 n = |φ n ⟩ − λ√ |φ n+1 ⟩ + λ√ |φ n−1 ⟩ + . . . 2 2
|ψ n ⟩ = [1 −
(9)
1-b Die Störungsentwicklung ̂ durch Wir ersetzen in Gl. (3) X W=λ
1 (a† √2
+ a) [s. Gl. (B-7a) aus Kapitel V] und erhalten
ℏω † (a + a) √2
(10)
Die Störung W mischt dann den Zustand |φ n ⟩ nur mit den beiden Zuständen |φ n+1 ⟩ und |φ n−1 ⟩. Die einzigen nichtverschwindenden Matrixelemente von W sind daher n+1 ℏω 2 n ⟨φ n−1 | W | φ n ⟩ = λ√ ℏω 2 ⟨φ n+1 | W | φ n ⟩ = λ√
(11)
Nach der allgemeinen Gleichung (B-15) aus Kapitel XI haben wir also E n = E0n + ⟨φ n | W | φ n ⟩ + ∑
|⟨φ n | W | φ n ⟩|2
n =n ̸
E0n − E0n
+...
(12)
Setzen wir die Gleichungen (11) in Gl. (12) ein und ersetzen E0n − E0n durch (n − n )ℏω, so ergibt sich λ2 (n + 1) λ2 n ℏω + ℏω + . . . 2 2 1 λ2 = (n + ) ℏω − ℏω + . . . 2 2
E n = E0n + 0 −
(13)
Daraus erkennen wir, dass die Störungsentwicklung des Eigenwerts bis zur zweiten Ordnung in λ mit der exakten Lösung (7) identisch² ist. Entsprechend ergibt sich aus der allgemeinen Beziehung (B-11) aus Kapitel XI |ψ n ⟩ = |φ n ⟩ + ∑ n =n ̸
⟨φ n | W | φ n ⟩ E0n − E0n
|φ n ⟩ + . . .
(14)
2 Man kann zeigen, dass alle Terme der Störungsentwicklung von höherer als zweiter Ordnung gleich null sind.
Gestörter harmonischer Oszillator
| 1121
•
woraus wir |ψ n ⟩ = |φ n ⟩ − λ√
n+1 n |φ n+1 ⟩ + λ√ |φ n−1 ⟩ + . . . 2 2
(15)
erhalten, also einen Ausdruck, der mit der Entwicklung (9) der exakten Lösung über einstimmt.
2 Störung durch ein quadratisches Potential Wir nehmen nun an, W habe die Form W=
1 ̂ 2 = 1 ρ mω2 X 2 ρ ℏω X 2 2
(16)
wobei ρ ein reeller Parameter (mit der Dimension eins) sehr viel kleiner als eins ist. Der Hamilton-Operator lautet dann H = H0 + W =
1 P2 + mω2 (1 + ρ)X 2 2m 2
(17)
In diesem Fall besteht also die Wirkung der Störung lediglich in einer Änderung der Richtgröße des harmonischen Oszillators. Wenn wir ω2 = ω2 (1 + ρ)
(18)
setzen, so sehen wir, dass es sich bei H wieder um einen harmonischen Oszillator handelt, dessen Kreisfrequenz jetzt gleich ω ist. In diesem Abschnitt wollen wir uns auf die Untersuchung der Eigenwerte von H beschränken. Nach Gl. (17) und Gl. (18) ist E n = (n +
1 1 ) ℏω = (n + ) ℏω√1 + ρ 2 2
(19)
d. h. nach Entwicklung der Wurzel E n = (n +
1 ρ ρ2 ) ℏω [1 + − + . . .] 2 2 8
(20)
Leiten wir nun das Ergebnis (20) mit Hilfe der stationären Störungstheorie ab, so kann Gl. (16) auch als 1 1 ρ ℏω(a† + a)2 = ρ ℏω(a†2 + a2 + aa† + a† a) 4 4 1 = ρ ℏω(a†2 + a2 + 2a† a + 1) 4
W=
(21)
•
1122 | Ergänzung AXI
geschrieben werden. Daraus ergeben sich die einzigen nichtverschwindenden Matrix elemente von W mit |φ n ⟩: 1 1 ρ (n + ) ℏω 2 2 1 ⟨φ n+2 | W | φ n ⟩ = ρ [(n + 1)(n + 2)]1/2 ℏω 4 1 ⟨φ n−2 | W | φ n ⟩ = ρ [(n(n − 1)]1/2 ℏω 4 ⟨φ n | W | φ n ⟩ =
(22)
Mit diesem Ergebnis berechnen wir die verschiedenen Terme der Entwicklung (12) und finden ρ 1 ρ2 ℏω ρ 2 ℏω (n + ) ℏω − (n + 1)(n + 2) + n(n − 1) +... 2 2 16 2 16 2 1 ρ 1 ρ2 +... = E0n + (n + ) ℏω − (n + ) ℏω 2 2 2 8 ρ ρ2 1 + . . .] = (n + ) ℏω [1 + − 2 2 8
E n = E0n +
(23)
was in der Tat mit der Entwicklung (20) übereinstimmt.
3 Störung durch ein Potential in x 3 Wir addieren zu H0 jetzt die Störung ̂3 W = σ ℏω X
(24)
wobei σ ein reeller Parameter (mit der Dimension eins) sehr viel kleiner als eins ist.
3-a Der anharmonische Oszillator Abbildung 1 stellt den Verlauf des Gesamtpotentials 12 mω2 x2 + W(x), in dem sich das Teilchen bewegt, in Abhängigkeit von x dar. Die gestrichelte Kurve gibt das paraboli sche Potential 12 mω2 x2 des „ungestörten“ harmonischen Oszillators wieder. Wir ha ben σ < 0 gewählt, so dass das Gesamtpotential (die durchgezogene Kurve) für x > 0 langsamer ansteigt als für x < 0. Behandelt man das Problem in der klassischen Mechanik, so oszilliert ein Teil chen mit der Gesamtenergie E zwischen den Punkten x A und x B (Abb. 1), die jetzt nicht mehr symmetrisch in Bezug auf den Ursprung O liegen. Diese Bewegung ver läuft weiterhin periodisch, ist aber nicht mehr sinusförmig: In der Fourier-Entwick lung von x(t) treten die höheren Harmonischen der Grundfrequenz auf. Aus diesem Grund wird ein solches System als anharmonischer Oszillator bezeichnet. Schließlich weisen wir darauf hin, dass im Gegensatz zum harmonischen Oszillator die Periode der Bewegung von der Energie E abhängt.
Gestörter harmonischer Oszillator
|
1123
•
Abb. 1: Verlauf des Potentials eines anharmonischen Oszillators in Abhängigkeit von x. Wir behan deln die Differenz zwischen dem tatsächlichen Potential (durchgezogene Linie) und dem harmoni schen Potential (gestrichelte Linie) des ungestörten Hamilton-Operators als Störung (x A und x B sind die Grenzen der klassischen Bewegung mit der Energie E).
3-b Die Störungsentwicklung α Matrixelemente der Störung W ̂ durch 1 (a† + a). Mit den Beziehungen (B-9) Wir ersetzen in Gl. (24) den Operator X √2 und (B-17) aus Kapitel V erhalten wir dann nach kurzer Rechnung W=
σℏω †3 [a + a3 + 3Na† + 3(N + 1)a] 23/2
(25)
wobei N = a† a wie in Gl. (B-13) aus Kapitel V definiert ist. Daraus können wir unmittelbar die nichtverschwindenden Matrixelemente von W mit |φ n ⟩ ableiten: ⟨φ n+3 | W | φ n ⟩ = σ [
(n + 3)(n + 2)(n + 1) 1/2 ] ℏω 8
⟨φ n−3 | W | φ n ⟩ = σ [
n(n − 1)(n − 2) 1/2 ] ℏω 8
(26)
n + 1 3/2 ⟨φ n+1 | W | φ n ⟩ = 3σ ( ) ℏω 2 n 3/2 ⟨φ n−1 | W | φ n ⟩ = 3σ ( ) ℏω 2 β Berechnung der Energien Wir setzen das Ergebnis (26) in die Störungsentwicklung von E n , Gl. (12), ein. Da das Diagonalmatrixelement von W null ist, gibt es keine Korrektur erster Ordnung; die vier
•
1124 | Ergänzung AXI
Matrixelemente (26) gehen jedoch in die Korrektur zweiter Ordnung ein. Eine einfache Rechnung ergibt dann E n = (n +
1 1 2 7 2 15 2 ) ℏω − σ (n + ) ℏω − σ ℏω + . . . 2 4 2 16
(27)
Die Störung W bewirkt also eine Absenkung der Energieniveaus (unabhängig vom Vorzeichen von σ). Je größer n ist, desto größer ist auch die Verschiebung des ent sprechenden Niveaus (s. Abb. 2). Die Differenz zwischen zwei benachbarten Niveaus beträgt E n − E n−1 = ℏω [1 −
15 2 σ n] 2
(28)
sie ist im Gegensatz zum harmonischen Oszillator nicht mehr unabhängig von n. Die Energieniveaus sind nicht mehr äquidistant und rücken mit wachsendem n dichter zusammen.
Abb. 2: Energieniveaus von H 0 (gestrichelte Linien) und H (durchgezogene Linien). Unter dem Einfluss der Störung W werden die Niveaus von H 0 abgesenkt, und zwar ist die Verschiebung umso größer, je höher n ist.
γ Berechnung der Eigenzustände Setzen wir die Ausdrücke (26) in die Entwicklung (14) ein, so erhalten wir |ψ n ⟩ = |φ n ⟩ − 3σ (
n + 1) 3/2 n 3/2 ) |φ n+1 ⟩ + 3σ ( ) |φ n−1 ⟩ 2 2
−
σ (n + 3)(n + 2)(n + 1) 1/2 [ ] |φ n+3 ⟩ 3 8
+
σ n(n − 1)(n − 2) 1/2 [ ] |φ n−3 ⟩ + . . . 3 8
(29)
Unter dem Einfluss der Störung W mischt der Zustand |φ n ⟩ mit den Zuständen |φ n+1 ⟩, |φ n−1 ⟩, |φ n+3 ⟩ und |φ n−3 ⟩.
Gestörter harmonischer Oszillator
|
1125
•
3-c Anwendung: Schwingungen eines zweiatomigen Moleküls In Ergänzung AV sahen wir, dass ein heteropolares zweiatomiges Molekül elektroma gnetische Strahlung absorbieren oder emittieren kann, deren Frequenz der Schwin gung der beiden Atomkerne des Moleküls um ihre Gleichgewichtslage entspricht. Wenn wir die Auslenkung r − re der beiden Kerne aus ihrer Gleichgewichtslage re mit x bezeichnen, kann das elektrische Dipolmoment des Moleküls geschrieben wer den D(x) = d0 + d1 x + . . .
(30)
Die Schwingungsfrequenzen dieses Dipols sind also die Bohr-Frequenzen, die in dem Ausdruck für ⟨X⟩(t) auftreten können. Für den harmonischen Oszillator besagen die Auswahlregeln für X, dass nur eine Bohr-Frequenz auftreten kann, nämlich die Fre quenz ω/2π (s. Ergänzung AV ). Wenn wir die Störung W berücksichtigen, werden die Zustände |φ n ⟩ des Oszilla tors „gemischt“ [s. Gl. (29)], und durch X können Zustände |ψ n ⟩ und |ψ n ⟩ gekoppelt werden, für die n − n ≠ ±1 gilt: Das Molekül kann also neue Frequenzen absorbieren oder emittieren. Um dieses Phänomen genauer zu untersuchen, wollen wir annehmen, das Mole kül befinde sich anfangs in seinem Schwingungsgrundzustand |ψ0 ⟩ (das ist bei nor malen Temperaturen T praktisch immer der Fall, da dann ℏω ≫ kT gilt). Mit Hilfe von ̂ zwischen dem Gl. (29) können wir in erster Ordnung³ in σ die Matrixelemente von X Zustand |ψ0 ⟩ und einem beliebigen Zustand |ψ n ⟩ berechnen. Nach einer einfachen Rechnung erhält man so die folgenden Matrixelemente (alle anderen verschwinden in erster Ordnung in σ): ̂ | ψ0 ⟩ = ⟨ψ1 | X
1 √2
(31a)
̂ | ψ0 ⟩ = 1 σ ⟨ψ2 | X √2
(31b)
̂ | ψ0 ⟩ = − 3 σ ⟨ψ0 | X 2
(31c)
Daraus können wir die Übergangsfrequenzen bestimmen, die im Absorptions spektrum des Grundzustands beobachtbar sind; es ergibt sich die Frequenz ν1 =
E1 − E0 h
(32a)
3 Es wäre inkorrekt, in der Rechnung Terme von höherer als erster Ordnung mitzunehmen, da die Entwicklung (29) nur bis zur ersten Ordnung in σ gültig ist.
•
1126 | Ergänzung AXI
̂ | ψ0 ⟩ von der die größte Intensität zufällt, da nach Gl. (31a) das Matrixelement ⟨ψ1 | X nullter Ordnung in σ ist. Dann finden wir mit viel kleinerer Intensität die Frequenz ν2 =
E2 − E0 h
(32b)
die oft die zweite Harmonische genannt wird (obwohl sie nicht exakt doppelt so groß wie ν1 ist). Bemerkung: Die Beziehung (31c) besagt, dass der Erwartungswert von ̂ X im Grundzustand nicht verschwindet. Das ist aus Abb. 1 leicht verständlich, da die oszillatorische Bewegung nicht mehr symmetrisch zum Ursprung O verläuft. Wenn σ negativ ist (wie in Abb. 1), verbringt der Oszillator mehr Zeit im Bereich mit x > 0 als im Bereich mit x < 0, und der Erwartungswert von X muss daher positiv sein. Das erklärt das in Gl. (31c) auftetende Vorzeichen.
Abb. 3: Form des Schwingungsspektrums eines heteropolaren zweiatomigen Moleküls. Wegen der anharmonischen Anteile des Potentials und der Terme höherer Ordnung in der Potenzreihenentwick lung des molekularen Dipolmonents D(x) nach x (dem Abstand der beiden Atome), tritt zusätzlich zur Grundfrequenz ν 1 eine Serie von „Harmonischen“ ν 2 , ν 3 , . . . , ν n , . . . auf. Man beachte, dass die entsprechenden Linien nicht äquidistant sind und dass ihre Intensität mit wachsendem n rasch abfällt.
Die Rechnung ergibt also nur eine neue Linie im Absorptionsspektrum. Allerdings könnte die Störungsrechnung bis zu höheren Ordnungen in σ fortgeführt werden, in dem man sowohl in der Entwicklung des Dipolmoments, Gl. (30), höhere Terme mit nimmt, als auch in der Entwicklung des Potentials um x = 0 Terme in x4 , x5 , . . . be rücksichtigt. Für das Absorptionsspektrum des Moleküls fände man dann alle Fre quenzen νn =
E n − E0 h
(33)
mit n = 3, 4, 5, . . . (mit Intensitäten, die mit wachsendem n rasch abfallen). Damit ergäbe sich schließlich für dieses Spektrum eine Form wie in Abb. 3, und ein solches
Gestörter harmonischer Oszillator
| 1127
•
Spektrum wird auch tatsächlich beobachtet. Es ist ersichtlich, dass die verschiedenen Spektrallinien von Abb. 3 nicht äquidistant sind, da ja nach Gl. (28) gilt ν1 − 0 =
E1 − E0 ω 15 2 = (1 − σ ) h 2π 2
(34)
ν2 − ν1 =
E2 − E1 ω = (1 − 15σ 2 ) h 2π
(35)
ν3 − ν2 =
E3 − E2 ω 45 2 = (1 − σ ) h 2π 2
(36)
woraus die Beziehung (ν2 − ν1 ) − ν1 = (ν3 − ν2 ) − (ν2 − ν1 ) = −
15ω 2 σ 4π
(37)
folgt. Wir sehen also, dass die Messung der genauen Lage der Linien des Absorptions spektrums es ermöglicht, den Parameter σ zu bestimmen. Bemerkungen: 1. Die Konstante ξ , die in der Beziehung (52) aus Ergänzung FVII auftritt, kann mit Hilfe von Gl. (27) berechnet werden. Vergleicht man die beiden Beziehungen [und ersetzt in Gl. (27) n durch v], so ergibt sich ξ =−
15 2 σ 4
(38)
Nun ist das Störpotential, das in Ergänzung FVII betrachtet wurde, gleich −gx 3 , während wir es hier gleich σℏω̂x3 , d. h. gleich 1/2
σ(
m3 ω5 ) ℏ
x3
(39)
gewählt haben. Es ist daher σ = −g (
ℏ m3 ω5
1/2
)
(40)
was eingesetzt in Gl. (38) schließlich ergibt ξ =−
15 g2 ℏ 4 m3 ω5
(41)
2. In der Entwicklung des Potentials um x = 0 ist der x 4 -Term sehr viel kleiner als der x 3 -Term, jedoch korrigiert er die Energien in erster Ordnung, während der x3 -Term nur in zweiter Ordnung eingeht. Wenn das Spektrum von Abb. 3 daher genau untersucht werden soll, ist es notwendig, beide Korrekturen gleichzeitig zu berechnen (sie können vergleichbar groß sein).
Referenzen und Literaturhinweise Anharmonische Schwingungen eines zweiatomigen Moleküls: Herzberg (12.4), Bd. I, Kap. III, § 2.
•
1128 | Ergänzung BXI
Ergänzung BXI Wechselwirkung zwischen magnetischen Dipolen 1 1-a 1-b 1-c 2 2-a 2-b 2-c 3
Der Wechselwirkungs-Hamilton-Operator | 1128 Die Form des Hamilton-Operators W. Physikalische Interpretation | 1128 Ein äquivalenter Ausdruck für W | 1129 Auswahlregeln | 1130 Dipol-Dipol-Wechselwirkung und Zeeman-Unterniveaus | 1131 Zwei verschiedene magnetische Momente | 1132 Zwei gleiche magnetische Momente | 1134 Beispiel: Das magnetische Resonanzspektrum von Gips | 1136 Einfluss der Wechselwirkung bei einem gebundenen Zustand | 1137
In dieser Ergänzung wollen wir die stationäre Störungstheorie anwenden, um die Energieniveaus eines Systems von zwei Spin-1/2-Teilchen zu untersuchen, die sich in einem statischen Magnetfeld B0 befinden und über eine magnetische Dipol-DipolWechselwirkung gekoppelt sind. Es gibt solche Systeme in der Natur: Zum Beispiel nehmen in einem Gips-Mono kristall (CaSO4 ⋅ 2H2 O) die beiden Protonen eines Kristallisationswassermoleküls fes te Positionen im Raum ein, und die Dipol-Dipol-Wechselwirkung zwischen ihnen er zeugt eine Feinstruktur im nuklearen magnetischen Resonanzspektrum. Auch im Wasserstoffatom gibt es eine Dipol-Dipol-Wechselwirkung zwischen den Spins des Elektrons und des Protons. In diesem Fall bewegen sich jedoch die beiden Teilchen relativ zueinander, und wir werden sehen, dass der Effekt der Dipol-DipolWechselwirkung aufgrund der Symmetrie des 1s-Grundzustands verschwindet. Die Hyperfeinstruktur dieses Zustands entsteht durch andere Wechselwirkungen (Kon taktwechselwirkung; s. Kapitel XII, § B-2 und § D-2 sowie Ergänzung AXII ).
1 Der Wechselwirkungs-Hamilton-Operator 1-a Die Form des Hamilton-Operators W. Physikalische Interpretation Es seien S1 und S2 die Spins der Teilchen (1) und (2) und M1 und M2 die entsprechen den magnetischen Momente: M1 = γ 1 S1 M2 = γ 2 S2
(1)
(wobei γ1 und γ2 die gyromagnetischen Verhältnisse von (1) und (2) sind). Mit W bezeichnen wir die Wechselwirkung des magnetischen Moments M2 mit dem durch M1 bei (2) hervorgerufenen Magnetfeld. Wenn wir n für den Einheitsvek
https://doi.org/10.1515/9783110638769-018
Wechselwirkung zwischen magnetischen Dipolen | 1129
•
tor auf der Verbindungslinie der beiden Teilchen und r für ihren Abstand schreiben (Abb. 1), nimmt W die folgende Form an: W=
1 μ0 γ1 γ2 3 [S1 ⋅ S2 − 3(S1 ⋅ n)(S2 ⋅ n)] 4π r
(2)
In Ergänzung CXI werden wir den Ausdruck für die Wechselwirkung zwischen zwei elektrischen Dipolen ableiten. Diese Rechnung verläuft in jeder Hinsicht analog zu der Ableitung von Gl. (2).
Abb. 1: Relative Anordnung der magnetischen Mo mente M1 und M2 der Teilchen (1) und (2) zueinander (r ist der Abstand zwischen den beiden Teilchen und n der Einheitsvektor auf der Verbindungslinie zwischen ihnen).
1-b Ein äquivalenter Ausdruck für W Es seien θ und φ die Polarwinkel von n. Wenn wir ξ(r) = −
μ0 γ1 γ2 4π r3
(3)
setzen, erhalten wir W = ξ(r) {3 [S1z cos θ + sin θ(S1x cos φ + S1y sin φ)] × [S2z cos θ + sin θ(S2x cos φ + S2y sin φ)] − S1 ⋅ S2 } 1 sin θ(S1+ e−iφ + S1− eiφ )] 2 1 × [S2z cos θ + sin θ(S2+ e−iφ + S2− eiφ )] − S1 ⋅ S2 } 2
= ξ(r) {3 [S1z cos θ +
(4)
d. h. W = ξ(r) [T0 + T0 + T1 + T−1 + T2 + T−2 ]
(5)
•
1130 | Ergänzung BXI
wobei T0 = (3 cos2 θ − 1)S1z S2z 1 T0 = − (3 cos2 θ − 1) (S1+ S2− + S1− S2+ ) 4 3 T1 = sin θ cos θ e−iφ (S1z S2+ + S1+ S2z ) 2 3 T−1 = sin θ cos θ eiφ (S1z S2− + S1− S2z ) 2 3 T2 = sin2 θ e−2iφ S1+ S2+ 4 3 T−2 = sin2 θ e2iφ S1− S2− 4
(6)
Alle Terme T q (oder T q ), die in Gl. (5) auftreten, sind, wie wir aus Gleichungssys tem (6) ersehen, das Produkt einer Funktion von θ und φ, die proportional zu einer q Kugelflächenfunktion zweiter Ordnung Y2 ist, und eines Operators, der nur auf die Spinfreiheitsgrade wirkt (die Raum- und Spinoperatoren des Systems (6) sind Tenso ren zweiter Stufe; W wird aus diesem Grund oft als Tensorwechselwirkung bezeichnet).
1-c Auswahlregeln Die Variablen r, θ und φ sind die Polarkoordinaten des Relativteilchens, das dem Sys tem der beiden Teilchen (1) und (2) zugeordnet ist. Der Operator W wirkt nur auf die se Variablen und auf die Spinfreiheitsgrade der beiden Teilchen. Es sei {|φ n,l,m ⟩} ei ne Standardbasis des Zustandsraums Hr des Relativteilchens und {|ε1 , ε2 ⟩} eine Ba sis des Spinzustandsraums (ε1 = ±, ε2 = ±) aus gemeinsamen Eigenvektoren von S1z und S2z . Der Zustandsraum, in dem W wirkt, wird aufgespannt durch die Basis {|φ n,l,m⟩ ⊗ |ε1 , ε2 ⟩}; in dieser Basis fällt es mit Gl. (5) und den Gleichungen (6) leicht, die Auswahlregeln für die Matrixelemente von W zu bestimmen. α Spinfreiheitsgrade – T0 ändert weder ε1 noch ε2 – T0 klappt beide Spins um: |+, −⟩ → |−, +⟩ und –
T1 dreht einen Spin nach oben: |−, ε2 ⟩ → |+, ε2 ⟩ oder
–
|−, +⟩ → |+, −⟩
|ε1 , −⟩ → |ε1 , +⟩
T−1 dreht einen Spin nach unten: |+, ε2 ⟩ → |−, ε2 ⟩ oder
|ε1 , +⟩ → |ε1 , −⟩
•
Wechselwirkung zwischen magnetischen Dipolen | 1131
–
Schließlich klappen T2 und T−2 beide Spins nach oben bzw. unten um: |−, −⟩ → |+, +⟩ und |+, +⟩ → |−, −⟩
β Bahnfreiheitsgrade Bei der Berechnung des Matrixelements von ξ(r)T q zwischen den Zuständen |φ n,l,m ⟩ und |φ n ,l ,m ⟩ tritt das Winkelintegral
∫ Y lm ∗ (θ, φ) Y 2 (θ, φ) Y lm (θ, φ) d Ω q
(7)
auf, das nach den Ergebnissen aus Ergänzung CX nur von null verschieden ist für l = l, l − 2, l + 2
m =m+q
(8a) (8b)
Zu beachten ist, dass der Fall l = l = 0 ausgeschlossen ist, obwohl er nicht im Wi derspruch zur ersten Beziehung (8) steht. Aus den Seiten l, l und 2 muss immer ein Dreieck konstruierbar sein, was für l = l = 0 unmöglich ist. Es ist notwendig l, l ≥ 1
(8c)
2 Dipol-Dipol-Wechselwirkung und Zeeman-Unterniveaus In diesem Abschnitt nehmen wir an, dass die beiden Teilchen im Raum fixiert sind. Wir quantisieren daher nur die Spinfreiheitsgrade und betrachten die Größen r, θ und φ als vorgegebene Parameter. Die beiden Teilchen befinden sich in einem statischen Magnetfeld B0 parallel zur z-Achse. Der Zeeman-Hamilton-Operator H0 , der die Wechselwirkung der beiden ma gnetischen Momente mit B0 beschreibt, lautet dann H0 = ω1 S1z + ω2 S2z
(9)
mit ω1 = −γ1 B0 ω2 = −γ2 B0
(10)
Mit der Dipol-Dipol-Wechselwirkung W wird der Gesamt-Hamilton-Operator des Sys tems H = H0 + W
(11)
Wir nehmen an, dass das Feld B0 groß genug ist, um W als Störung behandeln zu können.
•
1132 | Ergänzung BXI
2-a Zwei verschiedene magnetische Momente α Zeeman-Niveaus und Resonanzspektrum ohne Wechselwirkung Nach Gl. (9) gilt H0 |ε1 , ε2 ⟩ =
ℏ (ε1 ω1 + ε2 ω2 ) |ε1 , ε2 ⟩ 2
(12)
In Abb. 2a sind die Energieniveaus des Zwei-Spin-Systems ohne Dipol-Dipol-Wechsel wirkung dargestellt (wobei wir ω1 > ω2 > 0 angenommen haben). Wegen ω1 ≠ ω2 sind alle Niveaus nichtentartet. Legen wir ein oszillierendes Feld B1 cos ωt in x-Richtung an, so erhalten wir eine Serie von magnetischen Resonanzlinien. Die Frequenzen dieser Resonanzen entspre chen den verschiedenen Bohr-Frequenzen, die in der Zeitentwicklung von ⟨γ1 S1x + γ2 S2x ⟩ auftreten können (das oszillierende Feld wechselwirkt mit der x-Komponente des magnetischen Gesamtmoments). Die durchgezogenen (bzw. gestrichelten) Pfeile in Abb. 2a verbinden Zustände, zwischen denen das Matrixelement von S1x (bzw. S2x ) nicht verschwindet. Wir sehen also, dass es zwei verschiedene Bohr-Frequenzen ω1 und ω2 gibt (Abb. 3a), die den Resonanzen der Spins (1) bzw. (2) entsprechen.
(a)
(b)
Abb. 2: Energieniveaus für zwei Spin-1/2-Teilchen in einem statischen Magnetfeld B0 parallel zur z-Achse. Die beiden Larmor-Kreisfrequenzen ω1 = −γ1 B 0 und ω 2 = −γ2 B 0 wurden als verschie den angenommen. In (a) sind die Energieniveaus ohne Dipol-Dipol-Wechselwirkung W zwischen den beiden Spins dargestellt, während sie in (b) berücksichtigt ist. Die Niveaus durchlaufen hier eine Verschiebung, deren Größe rechts in der Abbildung näherungsweise, in erster Ordnung in W, angegeben ist. Die durchgezogenen Pfeile verbinden die Niveaus, zwischen denen S1x ein nicht verschwindendes Matrixelement hat, und die gestrichelten Pfeile diejenigen, bei denen das für S2x gilt.
Wechselwirkung zwischen magnetischen Dipolen
•
| 1133
β Änderungen durch die Wechselwirkung Da alle Niveaus von Abb. 2a nichtentartet sind, kann man den Einfluss der Wechselwir kung W in erster Ordnung erhalten, wenn man die Diagonalmatrixelemente von W, ⟨ε1 , ε2 |W|ε1 , ε2 ⟩, berechnet. Aus den Gleichungen (5) und (6) ist klar, dass nur der Term T0 einen nichtverschwindenden Beitrag zu diesem Matrixelement liefern kann; er ist gleich ⟨ε1 , ε2 | W | ε1 , ε2 ⟩ = ξ(r)(3 cos 2 θ − 1)
ε1 ε2 ℏ2 = ε1 ε2 ℏΩ 4
(13)
mit Ω=
−ℏμ 0 γ1 γ2 ℏ (3 cos2 θ − 1) ξ(r)(3 cos 2 θ − 1) = 4 16π r3
(14)
Da W sehr viel kleiner als H0 ist, gilt Ω ≪ ω1 − ω2
(15)
Daraus können wir unmittelbar die Verschiebungen der Niveaus in erster Ordnung in W erhalten: ℏΩ für |+, +⟩ und |−, −⟩ und −ℏΩ für |+, −⟩ und |−, +⟩ (Abb. 2b). Was geschieht nun mit dem magnetischen Resonanzspektrum von Abb. 3a? Wenn wir es nur mit Linien zu tun haben, deren Intensitäten von nullter Ordnung in W sind (das sind diejenigen, die für W gegen null gegen die Linien von Abb. 2a gehen), kön nen wir zur Berechnung der Bohr-Frequenzen, die in ⟨S1x ⟩ und ⟨S2x ⟩ auftreten, die
(a)
(b) Abb. 3: Aus den Bohr-Frequenzen, die in der Zeitentwicklung von ⟨S1x ⟩ und ⟨S2x ⟩ auftreten, erge ben sich die Positionen der magnetischen Resonanzlinien, die bei einem Zwei-Spin-System beob achtet werden können (die Übergänge entsprechen den Pfeilen von Abb. 2). In Abwesenheit einer Dipol-Dipol-Wechselwirkung erhält man zwei Resonanzen, die jeweils zu einem der beiden Spins gehören (a). Die Dipol-Dipol-Wechselwirkung drückt sich in einer Aufspaltung der beiden Linien aus (b).
•
1134 | Ergänzung BXI
Ausdrücke nullter Ordnung für die Eigenvektoren benutzen.¹ Es treten dann diesel ben Übergänge auf (man vergleiche die Pfeile von Abb. 2a und 2b). Wir sehen aller dings, dass die beiden Linien, die in Abwesenheit der Kopplung (durchgezogene Pfei le) zur Frequenz ω1 gehören, jetzt unterschiedliche Frequenzen aufweisen: ω1 + 2Ω und ω1 − 2Ω. Analog haben die beiden zu ω2 gehörenden Linien (gestrichelte Pfeile) jetzt die Frequenzen ω2 + 2Ω und ω2 − 2Ω. Das magnetische Resonanzspektrum be steht also aus zwei Dubletts symmetrisch zu ω1 und ω2 , wobei der Abstand zwischen den beiden Komponenten eines Dubletts gleich 4Ω ist (Abb. 3b). Die Dipol-Dipol-Wechselwirkung führt folglich zu einer Feinstruktur im magneti schen Resonanzspektrum, für die man eine einfache physikalische Erklärung geben kann: Das zu S1 gehörende magnetische Moment M1 erzeugt ein „lokales Feld“ b am Ort des Teilchens (2). Da wir B0 als sehr groß annehmen, präzessiert S1 sehr schnell um die z-Achse, so dass wir nur die Komponente S1z zu berücksichtigen brauchen (das lokale Feld, das durch die anderen Komponenten erzeugt wird, oszilliert zu schnell, um einen merklichen Effekt auszuüben). Die Richtung des lokalen Felds b hängt da her davon ab, ob sich der Spin im Zustand |+⟩ oder |−⟩ befindet, ob er also nach oben oder nach unten zeigt. Daraus folgt, dass das vom Teilchen (2) „gesehene“ Gesamt feld, die Summe aus B0 und b, zwei mögliche Werte annehmen kann.² Das erklärt das Auftreten der beiden Resonanzfrequenzen für den Spin (2). Mit demselben Argument könnten wir natürlich auch das Auftreten des Dubletts um ω1 erklären.
2-b Zwei gleiche magnetische Momente α Zeeman-Niveaus und Resonanzspektrum ohne Kopplung Gleichung (12) behält ihre Gültigkeit, wenn wir für ω1 und ω2 denselben Wert wählen. Wir setzen ω1 = ω2 = ω = −γB0
(16)
Die Energieniveaus sind in Abb. 4a dargestellt. Das obere und untere Niveau, |+, +⟩ und |−, −⟩, der Energien ℏω bzw. −ℏω sind nichtentartet. Das mittlere Niveau der Ener gie 0 ist jedoch zweifach entartet: Zu ihm gehören die beiden Eigenzustände |+, −⟩ und |−, +⟩. Die Frequenzen der magnetischen Resonanzlinien ergeben sich als die Bohr-Fre quenzen, die in der Zeitentwicklung von ⟨S1x + S2x ⟩ auftreten (das magnetische Ge samtmoment ist jetzt proportional zum Gesamtspin S = S1 + S2 ). So finden wir leicht die vier Übergänge, die durch die Pfeile in Abb. 4a dargestellt werden; sie entsprechen derselben Kreisfrequenz ω. Daraus ergibt sich schließlich das Spektrum von Abb. 5a. 1 Hätten wir für die Eigenvektoren Ausdrücke höherer Ordnung verwendet, würden andere Linien mit geringerer Intensität auftreten (sie verschwinden für W → 0). 2 Tatsächlich spielt wegen |B0 | ≫ |b| nur die Komponente von b längs B0 eine Rolle.
Wechselwirkung zwischen magnetischen Dipolen
(a)
| 1135
•
(b)
Abb. 4: Die beiden Spin-1/2-Teilchen haben gleiche magnetische Momente und demzufolge diesel be Larmor-Frequenz ω = −γB 0 . Ohne Dipol-Dipol-Wechselwirkung erhalten wir drei Niveaus, von denen eines zweifach entartet ist (a). Unter dem Einfluss der Dipol-Dipol-Wechselwirkung (b) wer den diese Niveaus verschoben, wobei die Größe dieser Verschiebungen näherungsweise (in erster Ordnung in W) rechts in der Abbildung angegeben ist. In nullter Ordnung in W sind die stationä ren Zustände Eigenzustände |S, M⟩ des Gesamtspins. Die Pfeile verbinden die Zustände, zwischen denen S1x + S2x ein nichtverschwindendes Matrixelement hat.
(a)
(b)
Abb. 5: Verlauf des magnetischen Resonanzspektrums, das bei einem System mit zwei Spin-1/2Teilchen mit demselben gyromagnetischen Verhältnis in einem statischen Magnetfeld B 0 beobach tet werden kann. Ohne Dipol-Dipol-Wechselwirkung beobachten wir eine einzige Resonanz (a). In Gegenwart der Wechselwirkung (b) spaltet sich die Linie auf. Der Abstand 6Ω zwischen den bei den Komponenten des Dubletts ist proportional zu 3 cos2 θ − 1, wobei θ der Winkel zwischen dem statischen Feld B 0 und der Verbindungslinie der beiden Teilchen ist.
β Änderungen durch die Wechselwirkung Die Verschiebungen der nichtentarteten Niveaus |+, +⟩ und |−, −⟩ ergeben sich wie oben und sind beide gleich ℏΩ (allerdings müssen wir im Ausdruck für Ω, Gl. (14), γ1 und γ2 durch γ ersetzen). Da das mittlere Niveau zweifach entartet ist, erhalten wir die Wirkung von W auf dieses Niveau, indem wir die Matrix, die die Einschränkung von W auf den Unter
•
1136 | Ergänzung BXI
raum {|+, −⟩, |−, +⟩} darstellt, diagonalisieren. Die Berechnung der Diagonalelemente erfolgt wie oben und ergibt ⟨+, − | W | +, −⟩ = ⟨−, + | W | −, +⟩ = −ℏΩ
(17)
Für das Nichtdiagonalelement ⟨+, − | W | −, +⟩ ersehen wir aus den Gleichungen (5) und (6) leicht, dass nur der Term T0 einen Beitrag leistet: ξ(r) (3 cos2 θ − 1) ⟨+, − | (S1+ S2− + S1− S2+ ) | −, +⟩ 4 ℏ2 = −ξ(r) (3 cos2 θ − 1) = −ℏΩ 4
⟨+, − | W | −, +⟩ = −
(18)
Wir müssen also die Matrix −ℏΩ (
1 1
1 ) 1
(19)
diagonalisieren; sie hat die Eigenwerte −2ℏΩ und 0, zu denen die Eigenvektoren ge hören |ψ1 ⟩ =
1 (|+, −⟩ + |−, +⟩) √2
bzw.
|ψ2 ⟩ =
1 (|+, −⟩ − |−, +⟩) √2
In Abb. 4b sind die Energieniveaus eines Systems aus zwei gekoppelten Spins dar gestellt. Die Energien werden in erster Ordnung in W durch die Eigenzustände in null ter Ordnung gegeben. Diese Eigenzustände sind nichts anderes als die gemeinsamen Eigenzustände zu S2 und S z , |S, M⟩, wobei S = S1 + S2 der Gesamtspin des Systems ist. Da der Operator S x mit S2 vertauscht, kann er nur die Triplettzustände koppeln, d. h. |1, 0⟩ mit |1, 1⟩ und |1, 0⟩ mit |1, −1⟩. Daraus ergeben sich die beiden in Abb. 4b durch die Pfeile angedeuteten Übergänge, die den Bohr-Frequenzen ω+3Ω und ω−3Ω entsprechen. Das magnetische Resonanzspektrum besteht daher aus einem um ω zen trierten Dublett, dessen Komponenten einen Abstand von 6Ω aufweisen (Abb. 5b).
2-c Beispiel: Das magnetische Resonanzspektrum von Gips Der oben untersuchte Fall entspricht dem von zwei Protonen eines Kristallisations wassermoleküls in einem Gipsmonokristall (CaSO4 ⋅ 2H2 O). Die beiden Protonen ha ben identische magnetische Momente und können als im Kristall an festen Positionen fixiert aufgefasst werden. Darüber hinaus befinden sie sich in sehr viel kürzerem Ab stand zueinander als zu anderen Protonen (die zu anderen Wassermolekülen gehö ren). Da die Dipol-Dipol-Wechselwirkung mit wachsendem Abstand sehr schnell ab fällt (wie 1/r3 ), können wir die Wechselwirkungen zwischen Protonen verschiedener Wassermoleküle vernachlässigen.
Wechselwirkung zwischen magnetischen Dipolen | 1137
•
Im magnetischen Resonanzspektrum beobachtet man tatsächlich ein Dublett mit einem vom Winkel θ zwischen dem Feld B0 und der Verbindungslinie der beiden Protonen abhängenden Abstand der Komponenten (in einem Gipsmonokristall liegen zwei verschiedene Orientierungen der Wassermoleküle vor, und man beobachtet zwei zu den beiden möglichen Werten von θ gehörende Dubletts). Wenn wir den Kristall in Bezug auf B0 drehen, ändern sich dieser Winkel und der Abstand. Daraus können wir die Orte der Wassermoleküle relativ zu den Kristallachsen bestimmen. Wenn es sich bei der untersuchten Probe nicht um einen Monokristall, sondern um ein aus kleinen, zufällig orientierten Monokristallen zusammengesetztes Pulver handelt, nimmt θ alle möglichen Werte an. Aufgrund der Überlagerung der Dubletts mit unterschiedlichen Abständen beobachten wir dann ein breites Band.
3 Einfluss der Wechselwirkung bei einem gebundenen Zustand Wir wollen annehmen, dass die beiden Teilchen (1) und (2) nicht an einem Ort im Raum fixiert sind, sondern sich gegeneinander bewegen können. Wir betrachten z. B. den Fall des Wasserstoffatoms. Berücksichtigen wir nur die elektrostatischen Kräfte, so wird der Grundzustand (im Schwerpunktsystem) durch den Vektor |φ1,0,0 ⟩ mit den Quantenzahlen n = 1, l = 0, m = 0 beschrieben (s. Ka pitel VII). Proton und Elektron sind Spin-1/2-Teilchen. Der Grundzustand ist daher vierfach entartet, und eine mögliche Basis des Unterraums wird durch die vier Vekto ren {|φ1,0,0 ⟩ ⊗ |ε1 , ε2 ⟩}
(20)
gebildet, worin ε1 und ε2 (gleich + oder −) für die Eigenwerte von S z bzw. I z stehen (S und I sind die Spins des Elektrons bzw. des Protons). Wie sieht der Einfluss der Dipol-Dipol-Wechselwirkung zwischen S und I auf diesen Grundzustand aus? Die Matrixelemente von W sind sehr viel kleiner als die Energiedifferenz zwischen dem 1s-Niveau und den angeregten Niveaus, so dass die Wirkung von W mit der Störungstheorie behandelt werden kann. In erster Ord nung kann sie durch die Diagonalisierung der 4 × 4-Matrix mit den Elementen ⟨φ1,0,0 ε1 ε2 | W | φ1,0,0 ε1 ε2 ⟩ berechnet werden. Die Bestimmung dieser Matrixele mente führt nach den Gleichungen (5) und (6) auf Winkelintegrale der Form q
∫ Y 00∗ (θ, φ) Y 2 (θ, φ) Y 00 (θ, φ) d Ω
(21)
die nach den Auswahlregeln in § 1-c gleich null sind (für diesen Fall lässt sich zeigen, dass das Integral (21) null ist: Da Y 00 eine Konstante ist, ist der Ausdruck (21) propor q tional zum Skalarprodukt von Y2 und Y00 , das aufgrund der Orthogonalitätsrelationen der Kugelflächenfunktionen verschwindet).
•
1138 | Ergänzung BXI
Die Grundzustandsenergie wird daher in erster Ordnung durch die Dipol-DipolWechselwirkung nicht geändert. Diese spielt jedoch bei der (Hyperfein-)Struktur an geregter Zustände mit l ≥ 1 eine Rolle. Dann müssen die Matrixelemente ⟨φ n,l,m ε1 ε2 | W | φ n,l,m ε1 ε2 ⟩, d. h. die Integrale
∫ Y lm ∗ (θ, φ) Y 2 (θ, φ) Y lm (θ, φ) d Ω q
(22)
berechnet werden, die wegen der Beziehung (8c) mit l ≥ 1 ungleich null sind.
Referenzen und Literaturhinweise Experimenteller Nachweis der magnetischen Dipol-Dipol-Wechselwirkung: Abragam (14.1), Kap. IV, § II und Kap. VII, § IA; Slichter (14.2), Kap. 3; Pake (14.6).
Van-der-Waals-Kräfte |
1139
•
Ergänzung CXI Van-der-Waals-Kräfte 1 1-a 1-b 2 2-a 2-b 2-c 3 3-a 3-b 4
Hamilton-Operator der elektrostatischen Wechselwirkung | 1140 Notationen | 1140 Berechnung der elektrostatischen Wechselwirkungsenergie | 1141 Zwei Wasserstoffatome im Grundzustand | 1142 Existenz eines anziehenden Potentials der Form −C/R 6 | 1142 Näherungsweise Berechnung der Konstanten C | 1144 Diskussion | 1145 Van-der-Waals-Kräfte zwischen zwei Wasserstoffatomen | 1147 Energien der stationären Zustände. Resonanzeffekt | 1147 Übertragung der Anregung von einem Atom auf das andere | 1148 Wasserstoffatom an einer leitenden Wand | 1148
Die Art der Kräfte, die zwischen zwei neutralen Atomen wirken, hängt von der Grö ßenordnung ihres Abstands R ab. Wir betrachten z. B. zwei Wasserstoffatome. Ist R von der Größenordnung atoma rer Dimensionen (d. h. von der Größe des Bohr-Radius a0 ), so überlappen die elek tronischen Wellenfunktionen und die beiden Atome ziehen sich an; sie streben da nach, ein H2 -Molekül zu bilden. Die potentielle Energie des Systems weist für einen bestimmten Wert Re des Abstands zwischen den Atomen ein Minimum auf.¹ Der physi kalische Ursprung dieser Anziehung (und damit der chemischen Bindung) liegt darin, dass die Elektronen zwischen den beiden Atomen oszillieren können (s. Kap. IV, § C-2-c und § C-3-d). Die stationären Wellenfunktionen der beiden Elektronen sind nicht län ger um nur einen der beiden Kerne lokalisiert, wodurch die Energie des Grundzu stands gesenkt wird (s. Ergänzung GXI ). Bei größeren Abständen treten grundsätzlich verschiedene Phänomene auf. Die Elektronen können sich nicht mehr von einem Atom zum anderen bewegen, da die Wahrscheinlichkeitsamplitude für einen solchen Prozess mit der kleiner werdenden Überlappung der Wellenfunktionen, d. h. exponentiell mit dem Abstand abnimmt. Der dominierende Effekt ist dann die elektrostatische Wechselwirkung zwischen den elektrischen Dipolmomenten der beiden neutralen Atome. Dadurch wird ein anzie hendes Gesamtpotential erzeugt, das nicht exponentiell, sondern mit 1/R6 abfällt. Das ist der Ursprung der Van-der-Waals-Kräfte, die wir in dieser Ergänzung mit Hilfe der stationären Störungstheorie untersuchen wollen (wobei wir uns der Einfachheit halber auf den Fall von zwei Wasserstoffatomen beschränken). Es sollte klar sein, dass Van-der-Waals-Kräfte denselben Ursprung wie die für die chemische Bindung verantwortlichen Kräfte haben; in beiden Fällen ist der HamiltonOperator elektrostatischer Natur. Nur wegen der unterschiedlichen Abhängigkeit der
1 Bei sehr kurzen Abständen dominiert immer die Abstoßung zwischen den beiden Atomkernen. https://doi.org/10.1515/9783110638769-019
•
1140 | Ergänzung CXI
Energie der stationären Quantenzustände von R können wir zwischen diesen beiden Arten von Kräften unterscheiden. Van-der-Waals-Kräfte spielen in der physikalischen Chemie eine wichtige Rolle, insbesondere wenn die beiden Atome keine Valenzelektronen haben (Kräfte zwischen Edelgasatomen, stabilen Molekülen usw.). Sie sind teilweise für die Unterschiede im Verhalten von realen und idealen Gasen verantwortlich. Schließlich handelt es sich bei ihnen um langreichweitige Kräfte; daher sind sie für die Stabilität von Kolloiden von Bedeutung. Wir wollen mit der Bestimmung des Ausdrucks für den Hamilton-Operator der Dipol-Dipol-Wechselwirkung zwischen zwei Wasserstoffatomen beginnen (§ 1). Wir werden dann in der Lage sein, die Van-der-Waals-Kräfte zwischen zwei Atomen im 1s-Zustand (§ 2) oder zwischen einem Atom im 2p- und einem im 1s-Zustand (§ 3) zu untersuchen. Schließlich zeigen wir (§ 4), dass ein Wasserstoffatom im 1s-Zu stand von seinem elektrischen Spiegelbild in einer perfekt leitenden Wand angezogen wird.
1 Hamilton-Operator der elektrostatischen Wechselwirkung 1-a Notationen Für die beiden Protonen der beiden Wasserstoffatome nehmen wir an, dass sie an den Punkten A bzw. B ruhen (Abb. 1). Wir setzen R = OB − OA
(1)
R = |R|
(2)
R |R|
(3)
n=
Abb. 1: Relative Anordnung der beiden Wasserstoffato me. R ist der Abstand zwischen den beiden Protonen, die sich bei A und B befinden, und n ist der Einheitsvek tor auf der Verbindungslinie zwischen ihnen; rA und rB sind die Ortsvektoren der beiden Elektronen in Bezug auf die Punkte A bzw. B.
R ist der Abstand zwischen den beiden Atomen und n der Einheitsvektor auf der Ver bindungslinie zwischen ihnen. rA sei der Ortsvektor des zum Atom (A) gehörenden Elektrons in Bezug auf den Punkt A und rB entsprechend der Ortsvektor des zum
Van-der-Waals-Kräfte | 1141
•
Atom (B) gehörenden Elektrons in Bezug auf den Punkt B. Mit 𝓓A = qrA
(4)
𝓓B = qrB
(5)
bezeichnen wir die elektrischen Dipolmomente der beiden Atome (q ist die Ladung des Elektrons). Wir wollen in dieser Ergänzung voraussetzen, dass R ≫ |rA | und
R ≫ |rB |
(6)
Obwohl die Elektronen der beiden Atome identisch sind, sind sie voneinander ge trennt, und ihre Wellenfunktionen überlappen nicht. Es ist daher nicht notwendig, das Symmetrisierungspostulat (s. Kap. XIV, § D-2-b) anzuwenden.
1-b Berechnung der elektrostatischen Wechselwirkungsenergie Das Atom (A) erzeugt bei (B) ein elektrostatisches Potential U, mit dem die Ladungen von (B) wechselwirken. Dadurch wird eine Wechselwirkungsenergie W erzeugt. Wie wir in Ergänzung EX gesehen haben, kann U in Abhängigkeit von R, n und den Multipolmomenten des Atoms (A) berechnet werden. Da (A) neutral ist, wird der wich tigste Beitrag zu U vom elektrischen Dipolmoment 𝓓A kommen. Analog stammt, da auch (B) neutral ist, der wichtigste Term in W aus der Wechselwirkung zwischen dem Dipolmoment 𝓓B von (B) und dem elektrischen Feld E = −∇U, das im Wesentlichen von 𝓓A erzeugt wird. Daraus erklärt sich der Name „Dipol-Dipol-Wechselwirkung“ für den dominierenden Term von W. Es gibt natürlich auch kleinere Terme (Dipol-Qua drupol, Quadrupol-Quadrupol usw.), und für W können wir schreiben W = Wdd + Wdq + Wqd + Wqq + . . .
(7)
Um Wdd zu berechnen, beginnen wir mit dem Ausdruck für das in (B) durch 𝓓A erzeugte elektrostatische Potential: U(R) =
1 𝓓A ⋅ R 4πε0 R3
(8)
woraus wir E = −∇R U = −
q 1 [rA − 3(rA ⋅ n)n] 4πε0 R3
(9)
erhalten und damit Wdd = −E ⋅ 𝓓B =
e2 [rA ⋅ rB − 3(rA ⋅ n)(rB ⋅ n)] R3
(10)
•
1142 | Ergänzung CXI
Wir haben e2 = q2 /4πε0 gesetzt und die Ausdrücke (4) und (5) für 𝓓A und 𝓓B ver wendet. In dieser Ergänzung wählen wir die z-Achse parallel zu n, so dass Gl. (10) geschrieben werden kann Wdd =
e2 (xA xB + yA yB − 2zA zB ) R3
(11)
Wir gehen von Wdd zum Operator Wdd über, indem wir in Gl. (11) xA , yA , . . . , zB durch die entsprechenden Observablen XA , Y A , . . . , ZB ersetzen (diese wirken in den Zustandsräumen HA und HB der beiden Wasserstoffatome):² Wdd =
e2 (XA XB + YA YB − 2ZA ZB ) R3
(12)
2 Zwei Wasserstoffatome im Grundzustand 2-a Existenz eines anziehenden Potentials der Form −C/R 6 α Prinzipielles Vorgehen Der Hamilton-Operator des Systems lautet H = H0A + H0B + Wdd
(13)
wobei H0A und H0B die Energien der isoliert betrachteten Atome (A) bzw. (B) sind. In Abwesenheit von Wdd sind die Eigenzustände von H durch die Gleichung (H0A + H0B ) |φAn,l,m ; φBn ,l ,m ⟩ = (E n + E n ) |φAn,l,m ; φBn ,l ,m ⟩
(14)
gegeben, wobei die Zustände |φ n,l,m ⟩ und die Energien E n in Abschnitt 7.3 berechnet wurden. Der Grundzustand von H0A + H0B ist |φA1,0,0 ; φB1,0,0 ⟩ und hat die Energie −2EI . Er ist nichtentartet (wir lassen die Spins außer Betracht). Unsere Aufgabe ist es, die Verschiebung des Grundzustands aufgrund von Wdd und insbesondere ihre R-Abhängigkeit zu bestimmen. Diese Verschiebung stellt die potentielle Wechselwirkungsenergie der beiden Atome im Grundzustand dar. Da Wdd sehr viel kleiner als H0A und H0B ist, können wir diesen Effekt mit der stationären Störungstheorie berechnen. β Einfluss der Dipol-Dipol-Wechselwirkung in erster Ordnung Wir wollen zeigen, dass die Korrektur erster Ordnung, ε1 = ⟨φA1,0,0 ; φB1,0,0 | Wdd | φA1,0,0 ; φB1,0,0 ⟩
(15)
2 Die externen Translationsfreiheitsgrade der beiden Atome sind nicht quantisiert; der Einfachheit halber nehmen wir die beiden Protonen als unendlich schwer und bewegungslos an. In (12) ist R daher ein Parameter und keine Observable.
Van-der-Waals-Kräfte | 1143
•
verschwindet. Die Energie ε1 enthält dem Ausdruck (12) für Wdd zufolge Produkte der Form ⟨φA1,0,0 | XA | φA1,0,0 ⟩⟨φB1,0,0 | XB | φB1,0,0 ⟩ (und analoge Terme, bei denen XA durch YA , ZA und XB durch YB , ZB ersetzt sind); sie verschwinden, da in einem stationären Zustand des Atoms die Erwartungswerte der Komponenten des Ortsoperators gleich null sind. Bemerkung: Die anderen Terme der Entwicklung (7), Wdq , Wqd , Wqq , . . ., enthalten Produkte zweier Multipol momente (eines in Bezug auf (A) und das andere in Bezug auf (B)), von denen mindestens eins von höherer als erster Ordnung ist. Auch ihre Beiträge verschwinden in erster Ordnung: Sie lassen sich als Erwartungswerte von Multipolmomenten von einer Ordnung größer oder gleich eins im Grundzustand ausdrücken, und wir wissen (s. Ergänzung EX , § 2-c), dass diese Erwartungswer te in einem l = 0-Zustand verschwinden (Dreiecksregel für Clebsch-Gordan-Koeffizienten). Wir müssen daher den Einfluss der zweiten Ordnung von Wdd berechnen, der dann den wichtigsten Beitrag zur Energiekorrektur bildet.
γ Einfluss der Dipol-Dipol-Wechselwirkung in zweiter Ordnung Nach den Ergebnissen von Kapitel XI ist die Energiekorrektur zweiter Ordnung ε2 = ∑
|⟨φAn,l,m ; φBn ,l ,m | Wdd | φA1,0,0 ; φB1,0,0 ⟩|2
(16)
−2EI − E n − E n
nlm n l m
wobei die Schreibweise ∑ bedeutet, dass der Zustand | φA1,0,0 ; φB1,0,0 ⟩ bei der Summa tion ausgeschlossen ist.³ Da Wdd proportional zu 1/R3 ist, ist ε2 proportional zu 1/R6 . Außerdem sind alle Energienenner negativ, da wir vom Grundzustand ausgehen. Die Dipol-Dipol-Wech selwirkung erzeugt also eine negative Energie proportional zu 1/R6 : ε2 = −
C R6
(17)
Van-der-Waals-Kräfte sind also anziehend und verhalten sich wie 1/R7 . Schließlich wollen wir die Entwicklung des Grundzustands in erster Ordnung in Wdd berechnen. Nach Gl. (B-11) aus Kapitel XI ergibt sich |ψ0 ⟩ = |φA1,0,0 ; φB1,0,0 ⟩
+ ∑ |φAn,l,m ; φBn ,l ,m ⟩ nlm n l m
⟨φAn,l,m ; φBn ,l ,m | Wdd | φA1,0,0 ; φB1,0,0 ⟩ −2EI − E n − E n
+ ...
(18)
Bemerkung: Die Matrixelemente, die in Gl. (16) und (18) auftreten, enthalten Terme der Form ⟨φ An,l,m | XA | φ A1,0,0 ⟩⟨φ Bn ,l ,m | XB | φ B1,0,0 ⟩ (und analoge Terme, bei denen XA und XB durch YA und YB oder
3 Die Summation wird nicht nur über die gebundenen Zustände, sondern auch über das kontinuier liche Spektrum von H 0A + H 0B ausgeführt.
•
1144 | Ergänzung CXI Z A und Z B ersetzt sind); sie sind nur für l = 1 und l = 1 von null verschieden. Diese Größen sind proportional zu Produkten von Winkelintegralen
q
[∫ Y lm∗ (Ω A ) Y1 (Ω A ) Y00 (Ω A ) dΩ A ] × [∫ Y lm ∗ (Ω B ) Y1 (Ω B ) Y00 (Ω B ) dΩ B ] q
die nach den Ergebnissen von Ergänzung CX null sind, falls l ≠ 1 oder l ≠ 1. Wir können daher in Gl. (16) und Gl. (18) l und l durch 1 ersetzen.
2-b Näherungsweise Berechnung der Konstanten C Nach Gl. (16) und Gl. (12) ist die in Gl. (17) auftretende Konstante C gegeben durch C = e4 ∑
A B |⟨φ n,l,m ; φ n ,l ,m
| (XA XB + YA YB − 2ZA ZB ) | φA1,0,0 ; φB1,0,0 ⟩|2 2EI + E n + E n
lmn l m n
(19)
Dabei muss n ≥ 2 und n ≥ 2 sein. Für gebundene Zustände ist |E n | = EI /n2 kleiner als EI , und der Fehler, der sich ergibt, wenn man in Gl. (19) E n und E n durch 0 ersetzt, ist vernachlässigbar. Für Zustände des kontinuierlichen Spektrums variiert E n zwischen 0 und +∞. Sobald jedoch E n eine merkliche Größe erreicht, werden die Matrixelemente des Zählers klein, da dann in dem Bereich, in dem φ1,0,0 (r) von null verschieden ist, zahlreiche räumliche Oszillationen auftreten. Um die Größenordnung von C abzuschätzen, können wir daher die Energienen ner von Gl. (19) durch 2EI ersetzen. Mit Hilfe der Vollständigkeitsrelation und unter Ausnutzung der Tatsache, dass das Diagonalmatrixelement von Wdd verschwindet, ergibt sich dann C≈
e4 ⟨φA ; φB | (XA XB + YA YB − 2ZA ZB )2 | φA1,0,0 ; φB1,0,0 ⟩ 2EI 1,0,0 1,0,0
(20)
Dieser Ausdruck lässt sich leicht berechnen: Wegen der Kugelsymmetrie des 1s-Zu stands sind die Erwartungswerte der gemischten Terme des Typs XA YA , XB YB , . . . gleich null. Aus dem gleichen Grund sind die Größen ⟨φA1,0,0 | XA2 | φA1,0,0 ⟩, ⟨φA1,0,0 | YA2 | φA1,0,0 ⟩, . . . , ⟨φB1,0,0 | ZB2 | φB1,0,0 ⟩ alle gleich einem Drittel des Erwartungswerts von R2A = XA2 + YA2 + ZA2 . Somit erhalten wir unter Verwendung des Ausdrucks für die Wellenfunktion φ1,0,0 (r) schließlich 2 R2A e4 A A | φ1,0,0 ⟩ = 6e2 a50 × 6 ⟨φ1,0,0 | C≈ 2EI 3
(21)
(wobei a0 der Bohr-Radius ist) und damit ε2 ≈ −6e2
a50 e 2 a0 5 = −6 ( ) R R R6
(22)
Van-der-Waals-Kräfte | 1145
•
Die Rechnung setzt a0 ≪ R voraus (keine Überlappung der Wellenfunktionen). Wir sehen also, dass ε2 von der Größenordnung der elektrostatischen Wechselwirkung zwischen zwei Ladungen q und −q ist, multipliziert mit dem Verkleinerungsfaktor (a0 /R)5 ≪ 1.
2-c Diskussion α „Dynamische“ Interpretation der Van-der-Waals-Kräfte Zu einem bestimmten Zeitpunkt hat das elektrische Dipolmoment (wir wollen einfa cher vom Dipol sprechen) eines Atoms im Grundzustand |φA1,0,0 ⟩ oder |φB1,0,0 ⟩ den Er wartungswert null. Das bedeutet nicht, dass jede Einzelmessung einer Komponente dieses Dipols null ergibt. Bei einer solchen Messung finden wir vielmehr im Allgemei nen einen nichtverschwindenden Wert, wobei jedoch mit derselben Wahrscheinlich keit der entgegengesetzt gleiche Wert gemessen wird. Man kann sich daher den Dipol eines Wasserstoffatoms ständigen Fluktuationen unterworfen vorstellen. Vernachlässigen wir zunächst den Einfluss des einen Dipols auf die Bewegung des anderen. Da die beiden Dipole dann zufällig und unabhängig voneinander fluk tuieren, ist ihre mittlere Wechselwirkung gleich null. Daraus erklärt sich, dass Wdd in erster Ordnung keinen Effekt verursacht. Tatsächlich sind die beiden Dipole aber nicht wirklich unabhängig voneinander. Betrachten wir das elektrostatische Feld, das vom Dipol (A) bei (B) erzeugt wird. Die ses Feld folgt den Fluktuationen des Dipols (A). Der in (B) induzierte Dipol ist daher mit dem Dipol (A) korreliert, so dass das elektrostatische Feld, das nach (A) „zurück kehrt“, nicht mehr unkorreliert zu der Bewegung von (A) ist. Obwohl also die Bewe gung des Dipols (A) zufällig ist, hat seine Wechselwirkung mit seinem eigenem Feld, das von (B) zu ihm „reflektiert“ wird, einen Erwartungswert ungleich null. So lässt sich der Effekt zweiter Ordnung von Wdd physikalisch erklären. Der dynamische Gesichtspunkt hilft den Ursprung der Van-der-Waals-Kräfte zu verstehen. Würden wir uns die beiden Wasserstoffatome im Grundzustand als zwei kugelsymmetrische und „statische“ Wolken negativer Ladung (mit einer positiven Punktladung im Zentrum jeder Wolke) vorstellen, würden wir auf eine exakt ver schwindende Wechselwirkungsenergie geführt werden. β Korrelationen zwischen den beiden Dipolen Wir wollen genauer zeigen, dass eine Korrelation zwischen den beiden Dipolen exis tiert. Wenn wir Wdd berücksichtigen, ist der Grundzustand des Systems nicht mehr |φA1,0,0 ; φB1,0,0 ⟩, sondern |ψ0 ⟩ [s. Gl. (18)]. Eine einfache Rechnung ergibt dann ⟨ψ0 | XA | ψ0 ⟩ = ⋅ ⋅ ⋅ = ⟨ψ0 | ZB | ψ0 ⟩ = 0 für die erste Ordnung in Wdd .
(23)
•
1146 | Ergänzung CXI
Betrachten wir beispielsweise ⟨ψ0 | XA | ψ0 ⟩. Der Term nullter Ordnung, ⟨φA1,0,0 ; | φA1,0,0 ; φB1,0,0 ⟩, ist null, da er gleich dem Erwartungswert von XA im Grund zustand |φA1,0,0 ⟩ ist. In erster Ordnung muss die Summation von Gl. (18) ausgeführt werden. Da Wdd nur Produkte der Form XA XB enthält, sind die Koeffizienten der Vek toren |φA1,0,0 ; φBn ,l ,m ⟩ und |φAn,l,m ; φB1,0,0 ⟩ in dieser Summation gleich null. Die Terme erster Ordnung, die von null verschieden sein könnten, sind also proportional zu φB1,0,0 | XA
⟨φAn,l,m ; φBn ,l ,m | XA | φA1,0,0 ; φB1,0,0 ⟩ mit l ≠ 0 und l ≠ 0 Auch diese Terme verschwinden alle, da XA auf |φB1,0,0 ⟩ nicht wirkt und für l ≠ 0 ⟨φBn ,l ,m |φB1,0,0 ⟩ = 0 gilt. Auch in Gegenwart der Wechselwirkung sind also die Erwartungswerte der Kom ponenten eines Dipols gleich null. Das ist nicht überraschend: In der oben angegebe nen Interpretation fluktuiert der durch das Feld des Dipols (A) in (B) induzierte Dipol wie dieses Feld statistisch und hat folglich den Erwartungswert null. Wir wollen nun andererseits zeigen, dass die beiden Dipole korreliert sind, indem wir den Erwartungswert des Produkts zweier Komponenten, eine bezüglich (A) und die andere bezüglich (B), berechnen, z. B. ⟨ψ0 | (XA XB + YA YB − 2ZA ZB ) | ψ0 ⟩ 3
was nach Gl. (12) Re2 ⟨ψ0 | Wdd | ψ0 ⟩ ist. Aus Gl. (18) und unter Verwendung von Gl. (15) und Gl. (16) ergibt sich dann unmittelbar ⟨ψ0 | (XA XB + YA YB − 2ZA ZB ) | ψ0 ⟩ = 2ε2
R3 ≠ 0 e2
(24)
Die Erwartungswerte der Produkte XA XB , YA YB und ZA ZB sind nach Gl. (21) und im Ge gensatz zu den Produkten der Erwartungswerte ⟨XA ⟩⟨XB ⟩, ⟨Y A ⟩⟨YB ⟩, ⟨ZA ⟩⟨ZB ⟩ nicht null. Das beweist eine Korrelation zwischen den beiden Dipolen. γ Modifizierung der Van-der-Waals-Kräfte in großen Abständen Aufgrund der Interpretation in § 2-c-α können wir verstehen, dass die Rechnungen nicht mehr gültig sind, wenn die beiden Atome zu weit voneinander entfernt sind. Das von (A) produzierte und von (B) reflektierte Feld kehrt mit einer Zeitverzögerung aufgrund der Ausbreitung entlang des Weges (A) → (B) → (A) nach (A) zurück, wäh rend wir die Wechselwirkungen als augenblicklich annahmen. Diese Laufzeit kann nicht mehr vernachlässigt werden, wenn sie die Größenord nung der charakteristischen Zeit der atomaren Schwingung erreicht, d. h. von der Grö ßenordnung 2π/ω n1 ist, wobei ω n1 = (E n − E1 )/ℏ die zugehörige Bohr-Frequenz ist. Mit anderen Worten setzen also die in diesem Abschnitt durchgeführten Rechnungen voraus, dass der Abstand R zwischen zwei Atomen sehr viel kleiner als die Wellenlän gen 2πc/ω n1 des Spektrums dieser Atome (um 1 × 10−5 cm) ist. Eine Rechnung, die Laufzeiteffekte mit in Betracht zieht, ergibt eine Wechselwir kungsenergie, die bei großen Abständen wie 1/R7 abfällt. Die von uns gefundene
Van-der-Waals-Kräfte |
1147
•
1/R6 -Abhängigkeit findet daher für den Bereich mittlerer Abstände Verwendung, die weder zu groß (wegen der Zeitverzögerung) noch zu klein (um eine Überlappung der Wellenfunktionen auszuschließen) sind.
3 Van-der-Waals-Kräfte zwischen zwei Wasserstoffatomen 3-a Energien der stationären Zustände. Resonanzeffekt Der erste angeregte Zustand des ungestörten Hamilton-Operators H0A + H0B ist acht fach entartet. Der zugehörige Eigenunterraum wird durch die acht Zustände {|φA1,0,0 ; φB2,0,0 ⟩ ; |φA2,0,0 ; φB1,0,0 ⟩ ; |φA1,0,0 ; φB2,1,m ⟩ mit m = −1, 0, +1 |φA2,1,m ; φB1,0,0 ⟩ mit m = −1, 0, +1} aufgespannt; dies entspricht einem System aus einem Atom im Grundzustand und einem Atom in einem Zustand des n = 2-Niveaus. Um den Effekt erster Ordnung der Störung Wdd zu berechnen, haben wir nach der Störungstheorie eines entarteten Zustands die 8 × 8-Matrix zu diagonalisieren, die die Einschränkung von Wdd auf den Eigenunterraum darstellt. Wir wollen zeigen, dass die einzigen nichtverschwindenden Matrixelemente von Wdd diejenigen sind, die einen Zustand |φA1,0,0 ; φB2,1,m ⟩ mit einem Zustand |φA2,1,m ; φB1,0,0 ⟩ verknüpfen. Die Operato ren XA , Y A , ZA , die im Ausdruck für Wdd vorkommen, sind ungerade und können da her |φA1,0,0 ⟩ nur mit |φA2,1,m ⟩ koppeln, was analog auch für XB , Y B , ZB gilt. Schließlich ist die Dipol-Dipol-Wechselwirkung invariant unter einer Drehung der beiden Atome um die sie verbindende z-Achse; Wdd vertauscht daher mit LAz + LBz und kann damit nur Zustände verknüpfen, für die die Summe der Eigenwerte von LAz und LBz gleich sind. Die oben angesprochene 8 × 8-Matrix kann somit in vier 2 × 2-Matrizen aufgespal ten werden. Eine von ihnen verschwindet vollständig (die zu den 2s-Zuständen), und die anderen drei sind von der Form (
0 k m /R3
k m /R3 ) 0
(25)
wobei wir ⟨φA1,0,0 ; φB2,1,m | Wdd | φA2,1,m ; φB1,0,0 ⟩ =
km R3
(26)
gesetzt haben; k m ist eine berechenbare Konstante von der Größenordnung e2 a20 , auf die wir hier nicht näher eingehen wollen. Die Matrix (25) können wir sofort diagonalisieren und erhalten als Eigenwerte +k m /R3 und −k m /R3 , die zu den Eigenzuständen 1 (|φA1,0,0 ; φB2,1,m ⟩ + |φA2,1,m ; φB1,0,0 ⟩) √2
•
1148 | Ergänzung CXI
und 1 (|φA1,0,0 ; φB2,1,m ⟩ − |φA2,1,m ; φB1,0,0 ⟩) √2 gehören. Damit ergeben sich die folgenden wichtigen Ergebnisse: – Die Wechselwirkungsenergie verhält sich wie 1/R3 und nicht wie 1/R6 , da Wdd die Energien nun in erster Ordnung verändert. Die Van-der-Waals-Kräfte spielen eine größere Rolle, als es zwischen zwei Wasserstoffatomen im 1s-Zustand der Fall war (Resonanzeffekt zwischen zwei verschiedenen Zuständen des Gesamtsystems mit gleicher ungestörter Energie). – Das Vorzeichen der Wechselwirkung kann positiv oder negativ sein (Eigenwerte +k m /R3 und −k m /R3 ). Es gibt daher beim System aus zwei Atomen Zustände, für die Anziehung, und andere, für die Abstoßung vorliegt.
3-b Übertragung der Anregung von einem Atom auf das andere Die beiden Zustände |φA1,0,0 ; φB2,1,m ⟩ und |φA2,1,m ; φB1,0,0 ⟩ haben dieselben ungestör ten Energien und sind durch eine nichtdiagonale Störung gekoppelt. Aufgrund der allgemeinen Ergebnisse aus § C von Kapitel IV (System mit zwei Zuständen) wissen wir, dass es Oszillationen des Systems von einem Zustand zum anderen mit einer Fre quenz proportional zur Stärke der Kopplung gibt. Wenn das System also zum Zeitpunkt t = 0 im Zustand |φA1,0,0 ; φB2,1,m ⟩ star tet, ist es nach einer gewissen Zeit (je größer R, desto länger diese Zeit) im Zustand |φA2,1,m ; φB1,0,0 ⟩. Die Anregung geht demnach von (B) nach (A) über, kehrt dann zu (B) zurück usw. Bemerkung: Wenn die beiden Atome nicht fixiert sind, sondern z. B. an Stößen teilnehmen, ändert sich R mit der Zeit, und der Übergang von einem Atom zum anderen verläuft nicht mehr periodisch. Die entsprechenden Stöße, sogenannte Resonanzstöße, spielen bei der Verbreiterung von Spektral linien eine wichtige Rolle.
4 Wasserstoffatom an einer leitenden Wand Wir betrachten nun ein einzelnes Wasserstoffatom (A), das sich im Abstand d vor einer ideal leitenden Wand befindet. Als z-Achse wählen wir die Senkrechte auf der Wand, die durch (A) geht (Abb. 2). Der Abstand d sei sehr viel größer als die atomaren Di mensionen, so dass die atomare Struktur der Wand vernachlässigt werden kann. Wir können annehmen, dass das Atom nur mit seinem elektrischen Spiegelbild auf der an deren Seite dieser Wand (das ist ein symmetrisches Atom mit entgegengesetzten La dungen) wechselwirkt. Die Dipol-Wechselwirkungsenergie zwischen dem Atom und
Van-der-Waals-Kräfte | 1149
•
Abb. 2: Um die Wechselwirkungsenergie eines Was serstoffatoms mit einer ideal leitenden Wand zu berechnen, können wir annehmen, das elektri sche Dipolmoment q rA des Atoms wechselwirke mit seinem elektrischen Bild −qrA (d ist der Abstand zwischen dem Proton A und der Wand).
der Wand kann leicht aus Gl. (12) für Wdd gewonnen werden, wenn wir die folgenden Substitutionen vornehmen: e2 → − e2 R
→ 2d
XB → XA = XA YB → ZB →
YB ZA
(27)
= YA = −ZA
der Vorzeichenwechsel von e2 kommt durch den der Bildladung zustande. Außerdem müssen wir durch den Faktor 2 teilen, da das Bild des Dipols fiktiv und das elektrische Feld unterhalb der x, y-Ebene null ist. Wir erhalten dann e2 (X 2 + YA2 + 2ZA2 ) (28) 16d3 A für die Wechselwirkungsenergie des Atoms mit der Wand [W wirkt nur auf die Frei heitsgrade von (A)]. Für ein Atom im Grundzustand lautet die Energiekorrektur in erster Ordnung in W W =−
ε1 = ⟨φ1,0,0 | W | φ1,0,0 ⟩
(29)
Aufgrund der Kugelsymmetrie des 1s-Zustands ergibt sich R2A e2 a20 e2 4⟨φ | ⟩ = − (30) | φ 1,0,0 1,0,0 3 16d3 4d3 Wie wir sehen, wird das Atom von der Wand angezogen; die Wechselwirkungs energie ändert sich mit 1/d3 und die Anziehungskraft daher mit 1/d4 . Den Umstand, dass W zu einem Effekt erster Ordnung führt, können wir wegen der oben (§ 2-c) gegebenen Interpretation leicht verstehen. Im vorliegenden Fall liegt vollständige Korrelation zwischen den beiden Dipolen vor, da sie Spiegelbilder von einander sind. ε1 = −
•
1150 | Ergänzung CXI
Referenzen und Literaturhinweise Kittel (13.2), Kap. 3, S. 82; Davydov (1.20), Kap. XII, § 124 und § 125; Langbein (12.9). Diskussion von Verzögerungseffekten: Power (2.11), § 7.5 und § 8.4 (Quantenelektrody namik); Landau und Lifshitz (7.12), Kap. XIII, § 90 (Fluktuationen elektromagnetischer Felder). Siehe außerdem den Artikel von Derjaguin (12.12).
Der Volumeneffekt | 1151
•
Ergänzung DXI Der Volumeneffekt 1 1-a 1-b 2 2-a 2-b
Energiekorrektur erster Ordnung | 1152 Berechnung der Korrektur | 1152 Diskussion | 1153 Anwendung auf wasserstoffartige Systeme | 1155 Das Wasserstoffatom und wasserstoffartige Ionen | 1155 Myonenatome | 1156
In Kapitel VII haben wir die stationären Zustände und die Energieniveaus des Wasser stoffatoms unter der Annahme untersucht, dass es sich bei dem Proton um ein gelade nes Punktteilchen handelt, das ein elektrostatisches 1/r-Coulomb-Potential erzeugt. Diese Annahme ist allerdings nicht ganz richtig: Tatsächlich ist das Proton keine ex akte Punktladung; seine Ladung füllt ein Volumen gewisser Größe aus (in der Größen ordnung von 1 Fermi = 10−13 cm). Wenn sich das Elektron extrem nahe am Zentrum des Protons befindet, „sieht“ es kein 1/r-Potential mehr, sondern eines, das von der räumlichen Ladungsverteilung des Protons abhängt. Das gilt natürlich für alle Atome: Innerhalb des Atomkerns hängt das elektrostatische Potential von der örtlichen Ver teilung der Ladungen ab. Wir erwarten daher, dass die atomaren Energieniveaus von dieser Ladungsverteilung beeinflusst werden; man spricht hier vom Volumeneffekt. Er ist von Bedeutung, da aus ihm auf die interne Struktur von Atomkernen geschlossen werden kann. In diesem Abschnitt behandeln wir den Volumeneffekt bei wasserstoffähnlichen Atomen. Um eine Idee von der Größenordnung der Energieverschiebungen zu bekom men, beschränken wir uns auf ein Modell, bei dem der Atomkern durch eine Kugel vom Radius ρ 0 ersetzt wird, in der die Ladung −Zq gleichförmig verteilt ist. Das Potential lautet dann (s. Ergänzung AV , § 4-b) 2
Ze { − { { { r V(r) = { 2 2 { { { Ze [( r ) − 3] ρ0 { 2ρ 0
für r ≥ ρ 0 (1) für r ≤ ρ 0
(wir haben e2 = q2 /4πε0 gesetzt). Der Verlauf von V(r) ist in Abb. 1 dargestellt. Die exakte Lösung der Schrödinger-Gleichung für ein Elektron, das diesem Po tential unterliegt, stellt ein kompliziertes Problem dar. Wir wollen uns daher mit einer näherungsweisen Lösung zufriedengeben. In einem ersten Schritt nehmen wir das Po tential als Coulomb-Potential an (das wäre der Fall, bei dem wir in Gl. (1) ρ 0 = 0 set zen). Die Energieniveaus des Wasserstoffatoms entsprechen dann den Ergebnissen, die wir in § C von Kapitel VII erhalten haben. Die Differenz W(r) zwischen dem Poten tial V(r) aus Gl. (1) und dem Coulomb-Potential wollen wir als Störung betrachten. Sie verschwindet, wenn r größer als der Radius ρ 0 des Atomkerns ist. Daher kann man an https://doi.org/10.1515/9783110638769-020
•
1152 | Ergänzung DXI
Abb. 1: Verlauf des elektrostatischen Potentials V(r), das von einer homogenen Ladungsverteilung −Zq in einer Kugel vom Radius ρ 0 herrührt. Für r ≤ ρ0 verläuft das Potential parabolisch. Für r ≥ ρ0 ist es coulombartig (die Fortsetzung in den Bereich mit r ≤ ρ 0 ist durch die gestrichelte Linie dargestellt; W(r) ist die Differenz zwischen V(r) und dem Coulomb-Potential).
nehmen, dass die von ihr verursachten Verschiebungen der atomaren Energieniveaus klein sind (die entsprechenden Wellenfunktionen erstrecken sich auf Dimensionen von der Ordnung a0 ≫ ρ 0 ). Eine Behandlung des Problems in erster Ordnung mittels der Störungstheorie ist deshalb gerechtfertigt.
1 Energiekorrektur erster Ordnung 1-a Berechnung der Korrektur Nach Definition ist Ze2 r 2 2ρ 0 { { { 2ρ [( ρ ) + r − 3] für 0 ≤ r ≤ ρ 0 0 (2) W(r) = { 0 { { für r ≥ ρ 0 {0 Die stationären Zustände des Wasserstoffatoms ohne die Störung W bezeichnen wir mit |φ n,l,m ⟩. Um den Effekt von W in erster Ordnung zu bestimmen, müssen wir die Matrixelemente
⟨φ n,l,m | W | φ n,l ,m ⟩ = ∫ dΩ Y lm∗ (Ω) Y lm (Ω) ∞
× ∫ r2 dr R∗n,l (r) R n,l (r) W(r)
(3)
0
berechnen. Das Winkelintegral in diesem Ausdruck ergibt δ ll δ mm . Zur Vereinfachung des Radialintegrals nehmen wir näherungsweise ρ 0 ≪ a0
(4)
Der Volumeneffekt |
1153
•
an,¹ d. h. dass der r ≤ ρ 0 -Bereich, in dem W(r) nicht null ist, sehr viel kleiner als die räumliche Ausdehnung der Funktionen R n,l (r) sein soll. Für r ≤ ρ 0 gilt dann R n,l (r) ≈ R n,l (0)
(5)
und das Radialintegral kann geschrieben werden ρ0
I=
r 2 2ρ 0 Ze2 − 3] |R n,l (0)|2 ∫ r2 dr [( ) + 2ρ 0 ρ0 r
(6)
0
es ergibt sich I=
Ze2 2 ρ |R n,l (0)|2 10 0
(7)
und ⟨φ n,l,m | W | φ n,l ,m ⟩ =
Ze2 2 ρ |R n,l (0)|2 δ ll δ mm 10 0
(8)
Wie wir sehen, ist die Matrix diagonal, die W in dem zum n-ten Niveau des unge störten Hamilton-Operators gehörenden Unterraum Hn darstellt. Die Energiekorrek tur erster Ordnung, die sich für jeden Zustand |φ n,l,m ⟩ ergibt, lautet daher ∆E n,l =
Ze2 2 ρ |R n,l (0)|2 10 0
(9)
Diese Korrektur hängt nicht von m ab.² Außerdem sind, da R n,l (0) außer für l = 0 null ist (s. Kap. VII, § C-4-c), nur die s-Zustände (l = 0-Zustände) verschoben, und zwar um einen Betrag Ze2 2 ρ |R n,l (0)|2 10 0 2πZe2 2 = ρ 0 |φ n,0,0 (0)|2 5
∆E n,0 =
(10)
(wir haben Y00 = 1/√4π benutzt).
1-b Diskussion Wir können ∆E n,0 schreiben als ∆E n,0 =
3 w𝒫 10
(11)
1 Dies ist für das Wasserstoffatom natürlich erfüllt. In § 2 gehen wir auf die Bedingung (4) genauer ein. 2 Das war zu erwarten, da es sich bei der Störung W, die unter Drehungen invariant ist, um eine skalare Größe handelt (s. Ergänzung BVI , § 5-b).
•
1154 | Ergänzung DXI
wobei w=
Ze2 ρ0
(12)
der Betrag der potentiellen Energie des Elektrons im Abstand ρ 0 vom Mittelpunkt des Atomkerns ist und 𝒫=
4 3 πρ |φ n,0,0 (0)|2 3 0
(13)
die Wahrscheinlichkeit, das Elektron innerhalb des Kerns zu finden. Die Größen 𝒫 und w gehen in Gl. (11) ein, weil sich der Effekt der Störung W(r) nur innerhalb des Atomkerns bemerkbar macht. Damit die Methode, die uns auf Gl. (10) und Gl. (11) geführt hat, konsistent ist, muss die Korrektur ∆E n,0 sehr viel kleiner als die Energiedifferenzen zwischen den ungestörten Niveaus sein. Da w sehr groß ist (ein Elektron und ein Proton ziehen sich, wenn sie dicht beisammen sind, sehr stark an), muss 𝒫 dementsprechend extrem klein sein. Bevor wir in § 2 eine genauere Rechnung durchführen, wollen wir hier die Größenordnung dieser Terme bestimmen. Es sei a0 (Z) =
ℏ2 Zme2
(14)
der Bohr-Radius für eine Gesamtladung des Kerns von −Zq. Solange n nicht zu groß ist, sind die Wellenfunktionen φ n,0,0 (r) praktisch in einem Raumbereich lokalisiert, dessen Volumen näherungsweise durch [a0 (Z)]3 gegeben wird. Das Volumen des Atomkerns ist von der Ordnung ρ 30 , so dass wir 𝒫≈[
ρ0 3 ] a0 (Z)
(15)
erhalten. Gleichung (11) ergibt dann ∆E n,0 ≃ =
Ze2 ρ0 3 [ ] ρ 0 a0 (Z) Ze2 ρ0 2 [ ] a0 (Z) a0 (Z)
(16)
Nun ist Ze2 /a0 (Z) von der Größenordnung der Bindungsenergie EI (Z) des ungestörten Atoms. Die relative Größe der Korrektur ist daher ∆E n,0 ρ0 2 ≈[ ] EI (Z) a0 (Z)
(17)
Wenn die Bedingung (4) zutrifft, wird die Korrektur tatsächlich sehr klein sein. Wir wollen sie im Folgenden für einige Spezialfälle genauer berechnen.
Der Volumeneffekt | 1155
•
2 Anwendung auf wasserstoffartige Systeme 2-a Das Wasserstoffatom und wasserstoffartige Ionen Für den Grundzustand des Wasserstoffatoms haben wir [s. Kap. VII, Gl. (C-39a)] R1,0 (r) = 2(a0 )−3/2 e−r/a0
(18)
wobei sich a0 aus Gl. (14) ergibt, wenn wir Z = 1 setzen. Mit Gl. (10) folgt dann ∆E1,0 =
2 e2 ρ0 2 4 ρ0 2 ( ) = EI ( ) 5 a0 a0 5 a0
(19)
Nun ist für das Wasserstoffatom a0 ≈ 5.3 × 10−11 m
(20)
während der Radius ρ 0 des Protons von der Größenordnung ρ 0 (Proton) ≈ 1 fm = 10−15 m
(21)
ist. Indem wir diese numerischen Werte in Gl. (19) einsetzen, erhalten wir ∆E1,0 ≈ 4.5 × 10−10 EI ≈ 6 × 10−9 eV
(22)
die Korrektur ist also sehr klein. Bei wasserstoffartigen Ionen hat der Atomkern eine Ladung −Zq. Wir können dann Gl. (10) anwenden, e2 wird durch Ze2 und a0 durch a0 (Z) = a0 /Z in Gl. (19) ersetzt, und erhalten ∆E1,0 (Z) =
2 2 Z 2 e2 ρ 0 (A, Z) [ × Z] 5 a0 a0
(23)
worin ρ 0 (A, Z) der Radius des Atomkerns ist, der aus A Nukleonen (Protonen und Neu tronen) besteht, von denen Z Protonen sind. In der Realität weicht die Anzahl von Nu kleonen in einem Atomkern nicht viel von 2Z ab; außerdem drückt sich die konstante Dichte der Kernmaterie in der näherungsweisen Beziehung ρ 0 (A, Z) ∝ A1/3 ∝ Z 1/3
(24)
aus. Die Abhängigkeit der Energiekorrektur von Z wird dann gegeben durch ∆E1,0 (Z) ∝ Z 14/3
(25)
oder ∆E1,0 (Z) ∝ Z 8/3 EI (Z)
(26)
∆E1,0 (Z) ändert sich daher aufgrund einer Reihe sich ergänzender Effekte sehr stark mit Z: Wenn Z wächst, wird a0 kleiner und ρ 0 größer. Der Volumeneffekt ist daher für schwere wasserstoffartige Ionen wesentlich größer als für Wasserstoff.
•
1156 | Ergänzung DXI
Bemerkung: Der Volumeneffekt tritt auch bei allen anderen Atomen auf. Er ist verantwortlich für die Isoto pieverschiebung der Linien des Emissionsspektrums: Für zwei verschiedene Isotope desselben chemischen Elements ist die Anzahl Z der Protonen gleich, die Anzahl A−Z der Neutronen jedoch verschieden; die räumlichen Verteilungen der Kernladungen unterscheiden sich somit voneinan der. Tatsächlich wird bei leichten Atomen die Isotopieverschiebung prinzipiell durch die endliche Masse des Atomkerns verursacht (s. Ergänzung AVII , § 1-a-α). Dieser Effekt ist allerdings für schwere Atome (bei denen sich die reduzierte Masse nur wenig von Isotop zu Isotop ändert) klein, während der Volumeneffekt mit Z anwächst und zum dominierenden Beitrag wird.
2-b Myonenatome Wir haben bereits einige einfache Eigenschaften myonischer Atome untersucht (s. Er gänzungen AV , § 4 und AVII , § 2-a). Insbesondere stellten wir fest, dass ihr Bohr-Radius beträchtlich kleiner als der normaler Atome ist (der Grund dafür ist, dass die Masse des Myons etwa 207-mal so groß wie die des Elektrons ist). Der qualitativen Diskussion aus § 1-b zufolge erwarten wir daher für Myonenatome einen großen Volumeneffekt. Wir wollen ihn für zwei Grenzfälle berechnen: ein leichtes myonisches Wasserstoffund ein schweres myonisches Bleiatom. α Das myonische Wasserstoffatom Der Bohr-Radius ist a0 (μ− , p+ ) ≈
a0 207
(27)
d. h. in der Größenordnung von 250 fm. Er ist daher bedeutend größer als ρ0 . Wenn wir in Gl. (19) a0 durch a0 /207 ersetzen, ergibt sich ∆E1,0 (μ− , p+ ) ≈ 1.9 × 10−5 × EI (μ− , p+ ) ≈ 5 × 10−2 eV
(28)
Obwohl der Volumeneffekt hier sehr viel größer ist als für das normale Wasserstoff atom, ist die Korrektur der Energieniveaus immer noch klein. β Das myonische Bleiatom Der Bohr-Radius des myonischen Bleiatoms ist [s. Ergänzung AV , Gl. (25)] a0 (μ− , Pb) ≈ 3 fm = 3 × 10−15 m
(29)
Das μ− -Myon befindet sich sehr dicht am Bleikern und wird daher von den atomaren Elektronen, die sich in sehr viel größerer Entfernung bewegen, praktisch nicht abge stoßen. Wir könnten daher auf die Idee kommen, Gl. (10), die wir für wasserstoffartige
Der Volumeneffekt | 1157
•
Atome und Ionen bewiesen haben, sei in diesem Fall direkt anwendbar. Das ist aller dings nicht möglich, da der Radius des Bleikerns ρ 0 (Pb) ≈ 8.5 fm = 8.5 × 10−15 m
(30)
ist, was im Vergleich zu a0 (μ− , Pb) nicht klein ist. Gleichung (10) würde daher zu großen Korrekturen (mehrere MeV) führen, die von der gleichen Größenordnung wie EI (μ− , Pb) sind. Wir sehen also, dass für diesen Fall der Volumeneffekt nicht länger als Störung behandelt werden kann (s. die Diskussion in § 4 von Ergänzung AV ). Um die Energieniveaus zu berechnen, muss man daher das Potential V(r) exakt kennen und die entsprechende Schrödinger-Gleichung lösen. Das Myon befindet sich öfter innerhalb des Atomkerns als außerhalb, d. h. nach Gl. (1) in einem Bereich, in dem das Potential parabolisch ist. In einer ersten Nähe rung könnten wir das Potential als durchgehend parabolisch annehmen (wie in Er gänzung AV ) und die Differenz zwischen dem tatsächlichen Potential und dem para bolischen, die sich für r ≥ ρ 0 ergibt, als Störung behandeln. Doch ist die Ausdehnung der Wellenfunktion bei diesem Potential im Verhältnis zu ρ 0 nicht klein genug, als dass die Näherung zu genauen Ergebnissen führen könnte. Die einzig gültige Metho de besteht in der Lösung der Schrödinger-Gleichung für das reale Potential.
Referenzen und Literaturhinweise Volumeneffekt der Isotopieverschiebung: Kuhn (11.1), Kap. VI, § C-3; Sobel’man (11.12), Kap. 6, § 24. Myonenatome: Cagnac und Pebay-Peyroula (11.2), Kap. XIX, § 7-C; De Benedetti (11.21); Wiegand (11.22); Weissenberg (16.19), § 4-2.
•
1158 | Ergänzung EXI
Ergänzung EXI Die Variationsmethode 1 1-a 1-b 1-c 2 2-a 2-b 3
Prinzip der Methode | 1158 Eigenschaft des Grundzustands eines Systems | 1158 Verallgemeinerung: Das Ritzsche Theorem | 1159 Spezialfall: Unterraum aus Vergleichsfunktionen | 1160 Anwendung auf ein einfaches Beispiel | 1161 Exponentielle Vergleichsfunktionen | 1162 Rationale Wellenfunktionen | 1163 Diskussion | 1164
Die in Kapitel XI behandelte Störungstheorie ist nicht die einzige allgemeine Nähe rungsmethode, die auf konservative Systeme angewandt werden kann. Wir wollen hier eine andere Methode kurz beschreiben, die ebenfalls zahlreiche Anwendungen, insbesondere in der Atom- und Molekülphysik, der Kernphysik und der Festkörper physik findet. In § 1 gehen wir zunächst auf das Prinzip der Variationsmethode ein. Wir zeigen dann am einfachen Beispiel des eindimensionalen harmonischen Oszilla tors ihre grundlegenden Eigenschaften (§ 2) und diskutieren diese in § 3. Die Ergän zungen FXI und GXI wenden die Variationsmethode auf einfache Modelle an, wodurch das Verhalten von Elektronen in einem Festkörper und bei der chemischen Bindung verständlich wird.
1 Prinzip der Methode Wir betrachten ein beliebiges physikalisches System, dessen Hamilton-Operator H zeitunabhängig ist. Um die Notation zu vereinfachen, nehmen wir an, dass das voll ständige Spektrum von H diskret und nichtentartet ist: H |φ n ⟩ = E n |φ n ⟩ ;
n = 0, 1, 2, . . .
(1)
Obwohl der Hamilton-Operator H bekannt ist, trifft das für seine Eigenwerte E n und die entsprechenden Eigenzustände |φ n ⟩ nicht unbedingt zu. Die Variationsmethode erweist sich natürlich in den Fällen als besonders nützlich, in denen wir den Hamil ton-Operator nicht exakt diagonalisieren können.
1-a Eigenschaft des Grundzustands eines Systems Wir wählen einen beliebigen Ketvektor |ψ⟩ im Zustandsraum des Systems. Der Erwar tungswert des Hamilton-Operators H ist in diesem Zustand ⟨H⟩ =
⟨ψ | H | ψ⟩ ≥ E0 ⟨ψ | ψ⟩
https://doi.org/10.1515/9783110638769-021
(2)
Die Variationsmethode | 1159
•
(E0 ist der kleinste Eigenwert von H), wobei das Gleichheitszeichen genau dann gilt, wenn |ψ⟩ ein Eigenvektor von H mit dem Eigenwert E0 ist. Um die Ungleichung (2) zu beweisen, entwickeln wir den Vektor |ψ⟩ in der Basis der Eigenzustände von H: |ψ⟩ = ∑ c n |φ n ⟩
(3)
n
Wir erhalten dann ⟨ψ | H | ψ⟩ = ∑ |c n |2 E n ≥ E0 ∑ |c n |2 n
(4)
n
wobei natürlich ⟨ψ | ψ⟩ = ∑ |c n |2
(5)
n
ist; somit ist die Beziehung (2) gezeigt. Damit aus Ungleichung (4) eine Gleichung wird, ist es notwendig und hinreichend, dass alle Koeffizienten c n mit Ausnahme von c0 verschwinden; dann ist |ψ⟩ ein Eigenvektor von H mit dem Eigenwert E0 . Diese Eigenschaft stellt die Grundlage für die näherungsweise Bestimmung von E0 dar. Wir wählen (theoretisch beliebig, in der Praxis aber physikalisch sinnvoll) eine Menge von Ketvektoren |ψ(α)⟩, die von einer gewissen Zahl von Parametern abhän gen, die wir durch α symbolisieren. Wir berechnen den Erwartungswert ⟨H⟩(α) des Hamilton-Operators H in diesen Zuständen und minimieren dann ⟨H⟩(α) hinsichtlich der Parameter α. Der so erhaltene Wert stellt eine Näherung für die Grundzustandsen ergie E0 des Systems dar. Die Vektoren |ψ(α)⟩ bezeichnet man als Vergleichsvektoren, und die Methode selbst als Variationsmethode. Bemerkung: Der vorstehende Beweis lässt sich leicht auf Fälle verallgemeinern, in denen das Spektrum von H entartet ist oder einen kontinuierlichen Anteil enthält.
1-b Verallgemeinerung: Das Ritzsche Theorem Wir wollen zeigen, dass allgemein der Erwartungswert des Hamilton-Operators H in der Umgebung seiner diskreten Eigenwerte stationär ist. Wir betrachten den Erwartungswert von H im Zustand |ψ⟩ ⟨H⟩ =
⟨ψ | H | ψ⟩ ⟨ψ | ψ⟩
(6)
als Funktional des Zustandsvektors |ψ⟩ und berechnen seine Variation δ⟨H⟩, wenn |ψ⟩ in |ψ⟩ + |δψ⟩ übergeht, wobei |δψ⟩ als infinitesimal klein angenommen wird. Dazu ist es hilfreich, Gl. (6) in der Form ⟨H⟩⟨ψ | ψ⟩ = ⟨ψ | H | ψ⟩
(7)
•
1160 | Ergänzung EXI
zu schreiben und beide Seiten dieser Gleichung zu differenzieren: ⟨ψ | ψ⟩δ⟨H⟩+⟨H⟩ [⟨ψ | δψ⟩+⟨δψ | ψ⟩] = ⟨ψ | H | δψ⟩+⟨δψ | H | ψ⟩
(8)
Damit wird, da ⟨H⟩ eine Zahl ist, ⟨ψ | ψ⟩δ⟨H⟩ = ⟨ψ | [H − ⟨H⟩] | δψ⟩ + ⟨δψ | [H − ⟨H⟩] | ψ⟩
(9)
Der Erwartungswert ⟨H⟩ ist stationär, wenn δ⟨H⟩ = 0
(10)
gilt, was nach Gl. (9) heißt ⟨ψ | [H − ⟨H⟩] | δψ⟩ + ⟨δψ | [H − ⟨H⟩] | ψ⟩ = 0
(11)
Wir setzen |φ⟩ = [H − ⟨H⟩] |ψ⟩
(12)
womit Gl. (11) lautet ⟨φ | δψ⟩ + ⟨δψ | φ⟩ = 0
(13)
Diese Beziehung muss für jeden beliebigen infinitesimalen Vektor |δψ⟩ erfüllt sein. Wählen wir insbesondere |δψ⟩ = δλ |φ⟩
(14)
(worin δλ eine infinitesimale reelle Zahl ist), wird Gl. (13) zu 2⟨φ | φ⟩δλ = 0
(15)
Die Norm des Vektors |φ⟩ ist somit null, und folglich muss |φ⟩ gleich null sein. Nach Definition (12) bedeutet das H |ψ⟩ = ⟨H⟩ |ψ⟩
(16)
Der Erwartungswert ⟨H⟩ ist also genau dann stationär, wenn der Zustandsvektor |ψ⟩ ein Eigenvektor von H ist und die stationären Werte von H die Eigenwerte des Hamil ton-Operators sind. Die Variationsmethode kann somit verallgemeinert und für die näherungswei se Bestimmung der Eigenwerte des Hamilton-Operators H benutzt werden. Wenn die Funktion ⟨H⟩(α), die sich aus den Vergleichsvektoren |ψ(α)⟩ ergibt, mehrere Extre ma hat, so liefern diese die Näherungswerte mehrerer Energien E n (s. Aufgabe 10 in Ergänzung HXI ).
1-c Spezialfall: Unterraum aus Vergleichsfunktionen Wir wählen nun für die Menge der zu einem Unterraum F von H gehörenden Vek toren Vergleichsvektoren. In diesem Fall reduziert sich die Variationsmethode auf
Die Variationsmethode |
1161
•
die Lösung der Eigenwertgleichung des Hamilton-Operators H in F , und nicht mehr in ganz H. Um das einzusehen, folgen wir der Überlegung aus § 1-b, beschränken uns aber auf die Vektoren |ψ⟩ des Unterraums F . Die Maxima und Minima von ⟨H⟩, charak terisiert durch δ⟨H⟩ = 0, erhält man, wenn |ψ⟩ ein Eigenvektor von H in F ist. Die entsprechenden Eigenwerte stellen die Approximation für die wahren Eigenwerte von H in H dar. Durch die Einschränkung der Eigenwertgleichung von H auf einen Unterraum F des Zustandsraums H lässt sich ihre Lösung beträchtlich vereinfachen. Wenn aller dings F schlecht gewählt ist, kann das Ergebnis stark von den richtigen Eigenwerten und Eigenvektoren von H in H abweichen (s. § 3). Der Unterraum F muss also so ge wählt werden, dass sich das Problem genügend vereinfacht, ohne aber die physikali sche Realität zu sehr zu verfälschen. In bestimmten Fällen ist es möglich, die Unter suchung eines komplexen Systems auf die eines Zwei-Zustand-Systems zu reduzieren (s. Kapitel IV), oder zumindest auf ein System mit einer beschränkten Anzahl von Zu ständen. Ein anderes wichtiges Beispiel für diese Vorgehensweise ist die Methode der linearen Überlagerung von Atomorbitalen, die in der Molekülphysik breite Verwendung findet. Diese Methode besteht im Wesentlichen (s. Ergänzung GXI ) darin, dass man die Wellenfunktionen der Elektronen in einem Molekül in Form einer linearen Überlage rung der isoliert betrachteten Eigenfunktionen der zu den einzelnen, zum Molekül gehörenden Atome bestimmt. Die Suche nach molekularen Zuständen wird somit auf einen Unterraum eingeschränkt, wobei physikalische Kriterien angewendet werden. Analog wählen wir in Ergänzung FXI eine Linearkombination von atomaren Orbitalen der verschiedenen, einen Festkörper bildenden Ionen als Vergleichsfunktionen für ein Elektron in diesem Festkörper. Bemerkung: Die Störungstheorie erster Ordnung ist in diesem Spezialfall der Variationsmethode enthalten: F ist dann ein Eigenraum des ungestörten Hamilton-Operators H 0 .
2 Anwendung auf ein einfaches Beispiel Zur Erläuterung der Diskussion in § 1 und um einen Eindruck von der Gültigkeit der mit der Variationsmethode erhaltenen Näherungen zu gewinnen, wollen wir sie auf den eindimensionalen harmonischen Oszillator anwenden, dessen Eigenwerte und Eigenvektoren wir bereits kennen (s. Kap. V). Wir betrachten den Hamilton-Operator H=−
ℏ2 d2 1 + mω2 x2 2m dx2 2
(17)
und lösen seine Eigenwertgleichung näherungsweise mit Hilfe der Variationsmetho de.
•
1162 | Ergänzung EXI
2-a Exponentielle Vergleichsfunktionen Da der Hamilton-Operator (17) gerade ist, kann man leicht zeigen, dass sein Grundzu stand notwendig durch eine gerade Wellenfunktion beschrieben wird. Um die Eigen schaften dieses Grundzustands zu bestimmen, wählen wir daher gerade Vergleichs funktionen. Wir nehmen z. B. die einparametrige Familie von Funktionen ψ α (x) = e−αx
2
mit α > 0
(18)
Das Quadrat der Norm des Ketvektors |ψ α ⟩ ist +∞
⟨ψ α | ψ α ⟩ = ∫ dx e−2αx
2
(19)
−∞
und wir finden +∞
⟨ψ α | H | ψ α ⟩ = ∫ dx e−αx [− 2
−∞
2 ℏ2 d2 1 + mω2 x2 ] e−αx 2m dx2 2
+∞
=[
2 1 ℏ2 1 α + mω2 ] ∫ dx e−2αx 2m 8 α
(20)
−∞
so dass also ⟨H⟩(α) =
ℏ2 1 1 α + mω2 2m 8 α
(21)
Die Ableitung der Funktion ⟨H⟩(α) verschwindet für α = α0 =
1 mω 2 ℏ
(22)
wobei dann gilt ⟨H⟩(α 0 ) =
1 ℏω 2
(23)
Der minimale Wert von ⟨H⟩(α) ist also genau gleich der Energie des Grundzustands des harmonischen Oszillators. Dieses Ergebnis ergibt sich aufgrund der Einfachheit des Problems: Die Wellenfunktion des Grundzustands entspricht zufälligerweise genau einer der Funktionen der Familie von Vergleichsfunktionen (18), nämlich derjenigen zum Wert (22) für den Parameter α. Die Variationsmethode ergibt also für diesen Fall die exakte Lösung des Problems (ein Beispiel für das zu Beginn von § 1-a bewiesene Theorem). Wenn wir den ersten angeregten Zustand E1 des Hamilton-Operators (17) berech nen wollen (theoretisch näherungsweise), sollten wir Vergleichsfunktionen wählen, die orthogonal zu der Wellenfunktion des Grundzustands sind. Das ergibt sich aus der
Die Variationsmethode | 1163
•
Diskussion zu Beginn von § 1-a, die zeigt, dass ⟨H⟩ statt E0 die untere Grenze E1 hat, wenn der Koeffizient c0 verschwindet. Wir wählen also eine Familie von ungeraden Funktionen als Vergleichsfunktionen: ψ α (x) = x e−αx
2
(24)
In diesem Fall ist +∞
⟨ψ α | ψ α ⟩ = ∫ dx x2 e−2αx
2
(25)
−∞
und +∞
3 2 ℏ2 1 3α + mω2 ] ∫ dx x2 e−2αx ⟨ψ α | H | ψ α ⟩ = [ 2m 2 4α
(26)
−∞
woraus sich ⟨H⟩(α) =
1 3 3ℏ2 α + mω2 2m 8 α
(27)
ergibt. Diese Funktion nimmt für denselben Wert wie oben [Gl. (22)] ein Minimum mit dem Wert 3 ⟨H⟩(α 0 ) = ℏω (28) 2 an. Wir finden hier wieder exakt die Energie E1 mit dem zugehörigen Eigenzustand, weil die Familie von Vergleichsfunktionen die richtige Wellenfunktion enthält.
2-b Rationale Wellenfunktionen Durch die Rechnung in § 2-a sind wir mit der Variationsmethode ein wenig vertrau ter geworden, ohne dass wir jedoch ihre Effizienz als Näherungsmethode abschätzen konnten, da die gewählte Familie von Vergleichsfunktionen jeweils die exakte Wellen funktion enthielt. Daher wollen wir jetzt Vergleichsfunktionen einer völlig anderen Art wählen, z. B.¹ ψ a (x) =
1 x2 + a
mit a > 0
(29)
Eine einfache Rechnung ergibt dann +∞
⟨ψ a | ψ a ⟩ = ∫ −∞
(x2
dx π = 2 + a) 2a√a
(30)
1 Unsere Wahl wird hier von dem Wunsch bestimmt, dass die Integrale analytisch berechenbar sind. In realen Fällen wird man natürlich meist numerisch integrieren müssen.
•
1164 | Ergänzung EXI
und schließlich ⟨H⟩(a) =
ℏ2 1 1 + mω2 a 4m a 2
(31)
Die Funktion nimmt ihren kleinsten Wert für a = a0 =
1 ℏ √2 mω
(32)
an und ist gleich ⟨H⟩(a0 ) =
1 ℏω √2
(33)
Dieses Minimum ist somit gleich dem √2-fachen der exakten Grundzustandsenergie ℏω/2. Um den sich ergebenden Fehler zu quantifizieren, können wir das Verhältnis von ⟨H⟩(a0 ) − ℏω/2 und dem Energiequant ℏω bilden: ⟨H⟩(a0 ) − ℏω/2 √2 − 1 = ≈ 20 % ℏω 2
(34)
3 Diskussion Wie das in § 2-b betrachtete Beispiel zeigt, lässt sich die Grundzustandsenergie ei nes Systems leicht ohne großen Fehler bestimmen, wenn man von beliebig gewähl ten Vergleichsvektoren ausgeht. Das ist einer der grundlegenden Vorteile der Varia tionsmethode. Da der exakte Eigenwert ein Minimum des Erwartungswerts ⟨H⟩ ist, überrascht es nicht, dass sich ⟨H⟩ in der Nähe dieses Minimums nicht stark verän dert. Andererseits zeigt dasselbe Beispiel, dass sich der „genäherte“ Zustand recht deutlich von dem exakten Eigenzustand unterscheiden kann. In dem Beispiel aus § 2-b fällt die Wellenfunktion 1/(x2 + a0 ) [wobei a0 durch Gl. (32) gegeben ist] für klei ne x zu schnell ab, während sie für große x viel zu langsam abfällt. In Schema 1 geben wir zu dieser qualitativen Aussage die quantitativen Werte an: Für verschiedene Werte von x2 sind die Werte der exakten normierten Eigenfunktion ψ0 (x) = (2α 0 /π)1/4 e−α0 x
2
[wobei α 0 durch Gl. (22) definiert ist] und der normierten genäherten Eigenfunktion 3/4 1/4 2 1 √ 2 (a0 )3/4 ψ a0 (x) = √ 2 (a0 ) = √ (2α 0 √2) π π x2 + a0 π 1 + 2α 0 √2 x2
angegeben.
(35)
Die Variationsmethode | 1165
•
Schema 1
x√α 0
2 1/4 −α0 x2 ( ) e π
√ 1/4 √ 2 (2 2) π 1 + 2α 0 √2 x 2
0 1/2 1 3/2 2 5/2 3
0.893 0.696 0.329 0.094 0.016 0.002 0.0001
1.034 0.605 0.270 0.140 0.083 0.055 0.039
Man muss also große Vorsicht walten lassen, wenn man für die Berechnung an derer physikalischer Größen als der Energie vom Näherungszustand ausgeht,den man mit der Variationsmethode erhalten hat. Die Gültigkeit des Ergebnisses hängt stark von der betrachteten physikalischen Größe ab. In dem hier behandelten speziellen Problem weicht z. B. der genäherte Erwartungswert des Operators X 2 nicht wesent lich von seinem exakten Wert ab:² ⟨ψ a0 | X 2 | ψ a0 ⟩ 1 ℏ = ⟨ψ a0 | ψ a0 ⟩ √2 mω
(36)
was mit ℏ/2mω verglichen werden muss. Andererseits ist der Erwartungswert von X 4 für die Wellenfunktionen (35) unendlich, während er natürlich für die richtigen Wel lenfunktionen endlich ist. Allgemeiner können wir Schema 1 entnehmen, dass die Nä herung für alle Eigenschaften sehr schlecht sein wird, die stark von dem Verhalten der Wellenfunktion für x ≥ 2/√α 0 abhängen. Der soeben angesprochene Nachteil ist umso gravierender, als es sehr schwierig wenn nicht unmöglich ist, den Fehler einer Variationsrechnung zu bestimmen, ohne die exakte Lösung des Problems zu kennen (und natürlich verwenden wir die Variati onsmethode, weil wir diese exakte Lösung nicht kennen). Die Variationsmethode ist somit eine sehr flexible Näherungsmethode, die auf sehr spezielle Probleme zugeschnitten werden kann und die der physikalischen Intui tion bei der Wahl der Vergleichsfunktionen großen Spielraum lässt. Man erhält gute Werte für die Energie, aber die genäherten Zustandsvektoren können einige unvorher sehbare fehlerhafte Eigenschaften aufweisen, und wir haben keine Möglichkeit zur Überprüfung dieser Fehler. Die Methode ist daher besonders wertvoll, wenn wir an hand physikalischer Überlegungen die qualitative oder halbqualitative Form der Lö sungen erschließen können.
2 Der Erwartungswert von X ist automatisch gleich null, wie auch aus unserer Wahl von geraden Ver gleichsfunktionen folgt.
•
1166 | Ergänzung EXI
Referenzen und Literaturhinweise Die Hartree-Fock-Methode, die in der Physik sehr oft benutzt wird, ist eine Anwendung der Variationsrechnung, siehe die Referenzen in Kapitel XI und Ergänzung EXV (Band III). Das Variationsprinzip ist in der Molekülphysik von grundlegender Bedeutung, siehe die Referenzen in Ergänzung GXI . Für eine einfache Darstellung des Variationsprinzips in der Physik siehe Feynman, Bd. 3 (7.2), Kap. 19. J. K. L. MacDonald, Physical Review vol. 143, S. 830–833 (1933).
Energiebänder im Festkörper |
1167
•
Ergänzung FXI Energiebänder im Festkörper 1 2 2-a 2-b
Ein erster Zugang: qualitative Diskussion | 1168 Genauere Untersuchung an einem einfachen Modell | 1172 Berechnung der Energien und der stationären Zustände | 1172 Diskussion | 1177
Ein Kristall besteht aus einer extrem großen Anzahl von Atomen, die in einem dreidi mensionalen periodischen Gitter regelmäßig angeordnet sind. Die exakte theoretische Beschreibung eines derart komplexen Systems ist offensichtlich unmöglich, so dass man grundsätzlich zu Näherungen gezwungen ist. Die erste ist vom selben Typ wie die Born-Oppenheimer-Näherung, der wir bereits in § 1 von Ergänzung AV begegnet sind. Man setzt zunächst voraus, dass die Atomkerne an ihren Gitterplätzen ruhen, bestimmt unter dieser Voraussetzung die stationären Elektronenzustände, um erst dann die Kernbewegung zu berücksichtigen.¹ In dieser Ergänzung wollen wir uns nur mit dem ersten Schritt dieser Rechnung befassen. Das Problem bleibt trotzdem äußerst verwickelt: Man muss nämlich die Energien eines Systems von Elektronen bestimmen, die sowohl der Wechselwirkung mit den Kernen (sie wird durch ein periodisches Potential beschrieben) als auch der gegen seitigen Wechselwirkung unterworfen sind. Daher wird eine weitere Näherung einge führt: Man nimmt an, dass jedes Elektron am Ort ri dem Einfluss eines Potentials V(ri ) unterliegt, das sowohl die von den Atomkernen ausgeübte Anziehung als auch den mittleren Abstoßungseffekt durch die anderen Elektronen berücksichtigt.² Auf diese Weise gelangt man zu einem Problem, bei dem sich unabhängige Teilchen in einem Potential mit der Periodizität des Kristallgitters bewegen. Man könnte nun zunächst vermuten, dass wie bei isolierten Atomen jedes Elek tron an einen bestimmten Kern gebunden bleibt. Tatsächlich ergibt sich aber eine gänzlich andere Situation. Durch den Tunneleffekt kann ein Elektron in den anzie henden Bereich des benachbarten Kerns gelangen, von dort dann zum nächsten Kern usw., selbst wenn es anfänglich zu einem bestimmten Kern gehörte. Die stationären Zustände sind nicht mehr in der Umgebung eines Kerns lokalisiert, sondern vollstän dig delokalisiert: Die Wahrscheinlichkeitsdichte verteilt sich gleichmäßig über alle Kerne.³ Befindet sich ein Elektron in einem periodischen Potential, so erinnern seine
1 Die Behandlung der Bewegung der Atomkerne führt zur Einführung der Schwingungs-Normalmo den des Kristalls, der Phononen (s. Ergänzung JV ). 2 Diese Näherung ist vom Typ der Zentralfeld-Näherung für isolierte Atome (s. Ergänzung AXIV , § 1). 3 Dabei handelt es sich um ein Phänomen, dem wir ähnlich bereits beim Ammoniakmolekül begegnet sind (s. Ergänzung GIV ): Das Stickstoffatom kann über den Tunneleffekt von der einen Seite der Ebene, in denen die Wasserstoffatome liegen, auf die andere Seite gelangen; die stationären Zustände liefern für beide Positionen die gleiche Wahrscheinlichkeit. https://doi.org/10.1515/9783110638769-022
•
1168 | Ergänzung FXI
Eigenschaften eher an ein Elektron, das sich frei im Kristall bewegen kann und nicht an ein spezielles Atom gebunden ist. In der klassischen Mechanik gibt es dieses Phä nomen nicht: Hier würde ein Teilchen beim Durchqueren des Kristalls seine Richtung ständig ändern (z. B. in der Nähe eines Ions). In der Quantenmechanik bestimmen die Interferenzen der an den Kernen gestreuten Wellen die Ausbreitung eines Elektrons im Kristallinneren. In § 1 wollen wir uns qualitativ überlegen, wie die Energieniveaus isolierter Atome modifiziert werden, wenn die Atome allmählich dichter zusammenrücken, um eine li neare Kette zu bilden. Wir werden dann in § 2 die Energien und Wellenfunktionen der stationären Zustände genauer berechnen, indem wir uns weiterhin auf eine lineare Kette beschränken. Die Rechnung wird mit der Näherungsmethode der starken Bin dung durchgeführt: Wenn sich das Elektron an einer bestimmten Stelle befindet, kann es durch den Tunneleffekt nur zu einem der beiden nächsten Nachbarn gelangen. Man setzt in dieser Näherung der starken Bindung also voraus, dass die Wahrscheinlich keit für diesen Übergang nur gering ist. Wir werden auf diese Weise eine Reihe von Ergebnissen erhalten (die Delokalisierung der stationären Zustände, das Auftreten er laubter und verbotener Energiebänder, die Form der Bloch-Funktionen), die auch in realistischeren Modellen gültig bleiben (dreidimensionale Kristalle, Bindungen belie biger Stärke). Der „störungstheoretische“ Zugang, den wir hier anwenden wollen, konstruiert die stationären Zustände der Elektronen aus atomaren Wellenfunktionen, die an den verschiedenen Ionen lokalisiert sind. Er hat den Vorteil, den allmählichen Über gang von den atomaren Niveaus zu den Energiebändern des Kristalls aufzuzeigen. Allerdings lässt sich die Existenz von Energiebändern bereits direkt aus der peri odischen Struktur des Potentials folgern, in dem sich das Elektron befindet (s. z. B. Ergänzung OIII , wo die Quantisierung der Energieniveaus eines eindimensionalen periodischen Potentials untersucht wird). Schließlich weisen wir darauf hin, dass wir hier nur auf die Eigenschaften der ein zelnen stationären Zustände der Elektronen eingehen. Zur Konstruktion der stationä ren Zustände eines Systems aus N Elektronen muss man das Symmetrisierungspos tulat anwenden (s. Kapitel XIV), weil man es mit einem System identischer Teilchen zu tun hat. Wir werden auf dieses Problem in Ergänzung CXIV zurückkommen, wenn wir auf die Bedeutung des Ausschließungsprinzips von Pauli für das physikalische Verhalten von Festkörperelektronen eingehen.
1 Ein erster Zugang: qualitative Diskussion Wir kehren zum Beispiel des ionisierten H+2 -Moleküls zurück, das wir in Kapitel IV, § C-2-c und § C-3-d bereits untersucht haben. Wir betrachten also zwei im Abstand R voneinander ruhende Protonen P1 und P2 und ein Elektron, das einem Potential V(r)
Energiebänder im Festkörper | 1169
•
Abb. 1: Potential, das das Elektron in einem ionisierten H+2 -Molekül spürt, wenn es sich auf der durch die Lage der beiden Protonen definierten x-Achse bewegt. Es ergeben sich zwei Potentialtöpfe, die durch eine Barriere getrennt sind. Ist zu einem beliebigen Zeitpunkt das Elektron in einem der beiden Töpfe lokalisiert, kann es aufgrund des Tunneleffekts in den anderen gelangen.
wie in Abb. 1 unterliegt. Wir suchen nach den erlaubten Energien und den zugehörigen stationären Zuständen in Abhängigkeit vom Parameter R. Man beginnt mit der Betrachtung des Grenzfalls R ≫ a0 (a0 ist der Bohr-Radius des Wasserstoffatoms). Der Grundzustand ist dann zweifach entartet: Das Elektron kann entweder mit P1 oder mit P2 ein Wasserstoffatom bilden, das von der Anzie hung des weit entfernten anderen Protons praktisch nicht beeinflusst wird. Anders ausgedrückt ist die Kopplung zwischen den in Kapitel IV behandelten Zuständen |φ1 ⟩ und |φ2 ⟩ (lokalisierte Zustände in der Nähe von P1 oder P2 ; s. Abb. 13 in Kapitel IV) vernachlässigbar, so dass |φ1 ⟩ und |φ2 ⟩ als stationäre Zustände angesehen werden können. Wählen wir jetzt einen Wert von R, der mit a0 vergleichbar ist, so ist es nicht mehr möglich, die Anziehung durch eines der beiden Protonen zu vernachlässigen. Befindet sich das Elektron zur Zeit t = 0 in der Nähe des einen Protons, kann es aufgrund des Tunneleffekts selbst dann, wenn seine Energie niedriger als die Höhe der Potential barriere zwischen P1 und P2 ist (s. Abb. 1), zu dem anderen Proton überwechseln. In Kapitel IV haben wir die Kopplung zwischen den Zuständen |φ1 ⟩ und |φ2 ⟩ untersucht und gezeigt, dass sie zu einer Oszillation des Systems zwischen diesen beiden Zustän den führt (dynamischer Aspekt). Ebenso haben wir gesehen (statischer Effekt), dass diese Kopplung die Entartung des Grundzustands aufhebt und dass die entsprechen den stationären Zustände delokalisiert sind (für diese Zustände ist die Wahrschein lichkeit, das Elektron in der Nähe von P1 und P2 zu finden, gleich). In Abb. 2 ist der Verlauf der erlaubten Energien des Systems in Abhängigkeit von R dargestellt.⁴
4 Eine detaillierte Untersuchung des H+2 -Ions wird in Ergänzung GXI durchgeführt.
•
1170 | Ergänzung FXI
Abb. 2: Verlauf der Energie der stationären Zustände in Abhängigkeit vom Abstand R der beiden Protonen des H+2 -Ions. Für große R lie gen zwei entartete Zustände der Energie −E I vor. Bei kleiner werdendem R wird diese Entar tung aufgehoben; je kleiner R ist, desto größer die Aufspaltung.
Zwei Effekte treten auf, wenn der Abstand R zwischen P1 und P2 verkleinert wird. Zum einen entstehen aus der Energie für R → ∞ mit kleiner werdendem R zwei un terschiedliche Energien (die Differenz zwischen diesen beiden Energien ist bei festem Wert R0 umso größer, je stärker die Kopplung zwischen den Zuständen |φ1 ⟩ und |φ2 ⟩ ist), und zum anderen sind die stationären Zustände delokalisiert. Man kann sich leicht vorstellen, wie sich ein Elektron unter dem Einfluss von drei identischen anziehenden Teilchen verhält, die sich z. B. auf einer Linie im Abstand R voneinander befinden: Wenn R sehr groß ist, sind die Energieniveaus dreifach ent artet, und die stationären Zustände des Elektrons sind in der Nähe eines Teilchens lokalisiert. Wird R verringert, so entstehen aus jedem Niveau drei im Allgemeinen ver schiedene Niveaus, und man hat vergleichbare Wahrscheinlichkeiten, das Elektron in einem der drei Potentialtöpfe zu finden. Außerdem bewegt sich das Elektron, das an fangs z. B. im rechten Potentialtopf lokalisiert war, in die anderen Töpfe.⁵ Dieselben Überlegungen bleiben auch für eine Kette aus einer beliebigen An zahl N von anziehenden Ionen gültig. Das vom Elektron gespürte Potential besteht nun aus N räumlich regelmäßig angeordneten identischen Potentialtöpfen (im Limes N → ∞ handelt es sich um ein periodisches Potential). Solange der Abstand R zwi schen den Ionen groß ist, sind die Energieniveaus N -fach entartet. Diese Entartung wird aufgehoben, wenn die Ionen dichter zusammengeführt werden: Jedes Niveau spaltet sich in verschiedene Niveaus auf, die, wie in Abb. 3 dargestellt, in einem Energieintervall der Breite ∆ liegen. Was geschieht nun, wenn der Wert von N sehr groß ist? Die erlaubten Energien liegen dann in jedem Intervall ∆ so dicht, dass sie praktisch ein Kontinuum bilden: Es ergeben sich erlaubte Energiebänder, die durch verbotene Bänder getrennt werden. Jedes erlaubte Band enthält N Niveaus (in Wirklichkeit 2N , wenn man den Spin des Elektrons mit in Betracht zieht). Je stärker die Kopplung ist, die das Elektron von ei
5 Siehe Aufgabe 8 in Ergänzung JIV .
Energiebänder im Festkörper |
1171
•
Abb. 3: Energieniveaus eines Elektrons unter dem Einfluss N regelmäßig angeordneter identischer Ionen. Wenn R sehr groß ist, sind die Wellenfunktionen an einem der zahlreichen Ionen lokalisiert, die Energieniveaus entsprechen den atomaren Niveaus und sind N -fach entartet (das Elektron kann mit jedem der N Ionen ein Atom bilden). In der Abbildung sind zwei solche Niveaus mit den Ener gien −E bzw. −E dargestellt. Wenn R kleiner wird, kann das Elektron über den Tunneleffekt von einem Ion zum nächsten wandern, und die Entartung der Niveaus wird aufgehoben. Je kleiner R ist, umso größer ist die Aufspaltung. Für den speziellen Wert R 0 werden die beiden ursprünglich atoma ren Niveaus somit in N sehr dicht beieinander liegende Niveaus aufgespalten. Wenn N sehr groß ist, liegen sie so dicht beinander, dass sie Energiebänder der Breiten ∆ bzw. ∆ ergeben, die durch ein verbotenes Band getrennt sind.
nem Potentialtopf zum nächsten wandern lässt, desto größer ist die Breite des Bands. (Folglich erwarten wir, dass die niedrigsten Energiebänder am schmalsten sind, da der Tunneleffekt, der für den Übergang verantwortlich ist, bei kleineren Energien we niger wahrscheinlich ist.) Die stationären Zustände des Elektrons sind alle deloka lisiert. Das Analogon zu Abb. 3 in Ergänzung MIII wird durch Abb. 4 gegeben, in der die Energieniveaus dargestellt sind und ein Eindruck von der räumlichen Ausdehnung der entsprechenden Wellenfunktionen gegeben wird. Schließlich stellen wir fest, dass sich das Elektron längs der Kette fortbewegt, falls es sich anfänglich an einem Ende befand.
•
1172 | Ergänzung FXI
Abb. 4: Energieniveaus eines Potentials aus mehreren regelmäßig angeordneten Potentialtöpfen. In der Abbildung sind zwei Bänder mit der Breite ∆ und ∆ dargestellt. Je tiefer das Band liegt, umso schmaler ist es, da das Durchtunneln der Barriere dann schwieriger ist.
2 Genauere Untersuchung an einem einfachen Modell 2-a Berechnung der Energien und der stationären Zustände Zur Vervollständigung der qualitativen Überlegungen im vorigen Abschnitt wollen wir ein einfaches Modell genauer untersuchen. Die Rechnungen werden analog zu denen aus Kapitel IV, § C sein, allerdings auf ein System verallgemeinert, das aus einer un endlichen Anzahl von Ionen besteht (anstatt aus zwei Ionen), die regelmäßig in einer linearen Kette angeordnet sind. α Beschreibung des Modells; vereinfachende Annahmen Wir betrachten eine unendliche lineare Kette regelmäßig angeordneter positiver Io nen. Wie in Kapitel IV nehmen wir an, dass das Elektron, wenn es an ein bestimmtes Ion gebunden ist, nur einen möglichen Zustand besitzt; den Zustand des Elektrons, wenn es mit dem n-ten Ion der Kette ein Atom bildet, wollen wir mit |v n ⟩ bezeichnen. Der Einfachheit halber vernachlässigen wir die gegenseitige Überlappung der Wellen funktionen v n (x) benachbarter Atome. Wir nehmen die {|v n ⟩}-Basis als orthonormal an: ⟨v n |v p ⟩ = δ np
(1)
Außerdem beschränken wir uns auf den Unterraum des Zustandsraums, der durch die Vektoren |v n ⟩ aufgespannt wird. Diese Näherung kann man mit Hilfe der Variations
Energiebänder im Festkörper | 1173
•
methode rechtfertigen (s. Ergänzung EXI ): Diagonalisiert man den Hamilton-Opera tor H nicht im gesamten Raum, sondern in dem durch die |v n ⟩ aufgespannten Raum, lässt sich zeigen, dass sich für die wirklichen Energien des Elektrons eine gute Nähe rung ergibt. Wir betrachten nun die Darstellungsmatrix des Hamilton-Operators in der {|v n ⟩}Basis. Die Diagonalelemente ⟨v n |H|v n ⟩ sind gleich, weil alle Ionen dieselbe Rolle spie len. Die Nichtdiagonalelemente ⟨v n |H|v p ⟩ (mit denen die Kopplung zwischen den ver schiedenen Zuständen |v n ⟩, also die Möglichkeit ausgedrückt wird, dass das Elektron von einem Ion zum andern gelangen kann) sind für weit voneinander entfernte Ionen offensichtlich sehr klein, so dass wir nur die Matrixelemente ⟨v n |H|v n±1 ⟩ berücksich tigen müssen; wir setzen sie gleich einer reellen Konstanten −A. Unter diesen Voraus setzungen kann die (unendliche) Matrix geschrieben werden ..
.
( ( (H) = ( ( (
E0 −A 0 0
−A E0 −A 0
0 −A E0 −A
(
0 0 −A E0
) ) ) ) ) ..
(2)
.)
Um die erlaubten Energien und die zugehörigen stationären Zustände zu bestimmen, müssen wir diese Matrix diagonalisieren. β Erlaubte Energien; Energiebänder Der Vektor |φ⟩ sei ein Eigenvektor von H; wir schreiben ihn in der Form +∞
|φ⟩ = ∑ c q |v q ⟩
(3)
q=−∞
Mit Gl. (2) folgt aus der auf |v q ⟩ projizierten Eigenwertgleichung H |φ⟩ = E |φ⟩
(4)
die Beziehung E0 c q − Ac q+1 − Ac q−1 = Ec q
(5)
Wenn q alle positiven oder negativen ganzzahligen Werte durchläuft, erhalten wir ein unendliches System linearer Gleichungen, die an die gekoppelten Gleichungen (5) aus Ergänzung JV erinnern. Wie dort suchen wir nach einfachen Lösungen der Form c q = eikql
(6)
worin l der Abstand zweier benachbarter Ionen und k eine Konstante von der Dimen sion einer inversen Länge ist. Wir verlangen, dass k zur ersten Brillouin-Zone gehört,
•
1174 | Ergänzung FXI
d. h. dass gilt −
π π ≤k π/2l die Gruppengeschwindigkeit keine wachsende Funktion der Energie mehr. Sie wird sogar null, wenn k 0 = ±π/l gilt (an den Rändern der ersten Brillouin-Zone). Daraus ersieht man, dass sich das Elektron im Kristall nicht mehr bewegen kann, wenn seine Energie zu dicht am Maximalwert von E0 + 2A von Abb. 5 liegt. Das optische Analogon zu dieser Situation ist die BraggReflexion. Röntgen-Strahlung, deren Wellenlänge gleich der Einheitslänge des Kris tallgitters ist, kann sich in diesem Gitter nicht fortpflanzen: Die Interferenz der an den einzelnen Ionen gestreuten Wellen führt zur Totalreflexion.
Abb. 7: Gruppengeschwindigkeit des Elektrons als Funktion des Parameters k. Diese Geschwindig keit ist nicht nur für k = 0 gleich null (wie beim freien Elektron), sondern auch für k = ±π/l (an den Rändern der ersten Brillouin-Zone).
Referenzen und Literaturhinweise Feynman, Bd. 5 (1.2), Kap. 13; Mott und Jones (13.7), Kap. II, § 4; Referenzen des Ab schnitts 13 der Bibliographie.
•
1180 | Ergänzung GXI
Ergänzung GXI Chemische Bindung: Das H+2 -Ion 1 1-a 1-b 1-c 2 2-a 2-b 2-c 2-d 3 3-a 3-b 4 4-a 4-b 5 5-a 5-b 5-c 5-d
Einleitung | 1180 Allgemeine Methode | 1180 Bezeichnungen | 1181 Exakte Rechnung | 1183 Berechnung der Energien mit der Variationsmethode | 1184 Wahl der Vergleichsvektoren | 1184 Die Eigenwertgleichung von H im Unterraum F | 1185 Überlappungs-, Coulomb- und Resonanzintegrale | 1186 Bindende und bindungslockernde Zustände | 1189 Mögliche Verbesserungen des Modells | 1193 Ergebnisse für kleine R | 1193 Ergebnisse für große R | 1195 Andere Molekülorbitale des H+2 -Ions | 1197 Symmetrien und Quantenzahlen. Spektroskopische Notation | 1197 Konstruktion von Molekülorbitalen aus 2p-Atomorbitalen | 1199 Ursprung der chemischen Bindung. Virialtheorem | 1202 Problemstellung | 1202 Theoreme | 1203 Anwendung des Virialtheorems auf Moleküle | 1205 Diskussion | 1208
1 Einleitung In dieser Ergänzung zeigen wir, wie die Quantenmechanik die chemische Bindung er klären kann, die für die Bildung mehr oder weniger komplexer Moleküle aus isolierten Atomen verantwortlich ist. Dabei beschränken wir uns auf den allgemeinen Zusam menhang und gehen auf Einzelheiten nicht näher ein. Darum befassen wir uns auch nur mit dem H+2 -Ion als dem einfachsten Molekül. Es besteht aus zwei Protonen und ei nem Elektron. Einige Aspekte dieses Problems wurden bereits diskutiert (s. Kapitel IV, § C-2-c und Aufgabe 5 in Ergänzung KI ); hier wollen wir die Überlegungen genauer und systematischer wieder aufgreifen.
1-a Allgemeine Methode Wenn die Protonen weit voneinander entfernt sind, bildet das Elektron mit einem von ihnen ein Wasserstoffatom, während das andere in Form eines H+2 -Ions isoliert bleibt. Bringt man nun die beiden Protonen dichter zusammen, kann das Elektron von einem zu anderen „springen“. Dadurch wird die Situation entscheidend geändert (s. Kapi tel IV, § C-2). Wir wollen die Energieänderung der stationären Zustände des Systems
https://doi.org/10.1515/9783110638769-023
Chemische Bindung: Das H+2 -Ion |
1181
•
in Abhängigkeit vom Abstand der beiden Protonen untersuchen. Wir werden sehen, dass die Energie des Grundzustands für einen Abstand ein Minimum annimmt, was die Stabilität des H+2 -Moleküls erklärt. Um das Problem exakt zu behandeln, müsste man den Hamilton-Operator für ein System aus drei Teilchen aufstellen und seine Eigenwertgleichung lösen. Es ist jedoch mit Hilfe der Born-Oppenheimer-Näherung (s. Ergänzung AV , § 1-a) eine starke Ver einfachung möglich. Da die Bewegung des Elektrons im Molekül sehr viel schneller erfolgt als die der Protonen, kann letztere in erster Näherung vernachlässigt werden. Das Problem ist somit auf die Lösung der Eigenwertgleichung des Hamilton-Operators eines Elektrons unter dem Einfluss der Anziehung der beiden Protonen reduziert, die wir als ruhend voraussetzen. Anders ausgedrückt wird der Abstand R der beiden Pro tonen nicht als quantenmechanische Variable, sondern als Parameter aufgefasst, von dem der elektronische Hamilton-Operator und die Gesamtenergie des Systems abhän gen. Für das H+2 -Ion ist dann die vereinfachte Gleichung für alle Werte von R exakt lösbar, für komplexere Moleküle jedoch weiterhin nicht. Es muss dann die in Ergän zung EXI beschriebene Variationsmethode angewendet werden. Im Hinblick auf eine Verallgemeinerung wollen wir uns daher auch beim H+2 -Ion dieser Methode bedienen.
1-b Bezeichnungen Mit R bezeichnen wir den Abstand der beiden Protonen, die sich an den Punkten P1 und P2 befinden, und mit r1 und r2 die Abstände des Elektrons zu dem jeweiligen Proton (Abb. 1).
Abb. 1: Wir bezeichnen mit r1 den Abstand zwischen dem Elektron (M) und dem Proton P1 , mit r2 den Abstand zwischen dem Elektron und dem Proton P2 , und mit R den Abstand der beiden Protonen.
Wir setzen diese Abstände in Beziehung zu einer natürlichen atomaren Längenein heit, dem Bohr-Radius a0 (s. Kap. VII, § C-2); wir definieren ρ=
R a0
ρ1 =
r1 a0
ρ2 =
r2 a0
(1)
•
1182 | Ergänzung GXI
Die normierten Wellenfunktionen des 1s-Grundzustands des um das Proton P1 gebildeten Wasserstoffatoms können dann geschrieben werden φ1 =
1 √πa30
e−ρ1
(2)
Analog drücken wir die Energien in der natürlichen Einheit EI = e2 /2a0 aus; EI ist die Ionisierungsenergie des Wasserstoffatoms. Es wird im Folgenden manchmal von Nutzen sein, elliptische Koordinaten zu verwenden. In diesen ist ein Raumpunkt M (hier der Ort des Elektrons) definiert durch μ=
r1 + r2 ρ 1 + ρ 2 = R ρ
ν=
r1 − r2 ρ 1 − ρ 2 = R ρ
(3)
und den Winkel φ, der die Orientierung der MP1 P2 -Ebene zur P1 P2 -Achse festlegt (dieser Winkel geht auch in das System von Polarkoordinaten ein, dessen z-Achse durch P1 und P2 definiert ist). Legen wir μ und ν fest und ändern φ zwischen 0 und 2π, so beschreibt der Punkt M einen Kreis um die P1 P2 -Achse. Wenn μ (oder ν) und φ festgehalten werden und ν (oder μ) variieren, beschreibt M eine Ellipse (oder Hyperbel) mit den Brennpunkten P1 und P2 . Man kann leicht zeigen, dass das Volumenelement in diesem System gegeben wird durch d3 r =
R3 2 (μ − ν2 ) dμ dν dφ 8
(4)
Dazu berechnen wir die Jacobi-Determinante der Transformation {x, y, z} → {μ, ν, φ}
(5)
Wenn wir P1 P2 als z-Achse und die Mitte von P1 und P2 als Ursprung wählen, so erhalten wir unmittelbar r21 = x2 + y2 + (z −
R 2 ) 2
r22 = x2 + y2 + (z +
R 2 ) 2
tan φ =
y x
(6)
Chemische Bindung: Das H+2 -Ion | 1183
•
Damit ergibt sich ∂μ ∂x ∂ν ∂x ∂μ ∂y ∂ν ∂y ∂μ ∂z ∂ν ∂z ∂φ ∂x
x μx 1 ∂r1 ∂r2 1 x ( + )= ( + )= R ∂x ∂x R r1 r2 r1 r2 1 ∂r1 ∂r2 νx = ( − )=− R ∂x ∂x r1 r2 μy = r1 r2 νy =− r1 r2 μz + νR/2 1 z − R/2 z + R/2 + )= = ( R r1 r2 r1 r2 νz + μR/2 1 z − R/2 z + R/2 − )=− = ( R r1 r2 r1 r2 ∂φ ∂φ y x =− 2 = 2 =0 ∂y ∂z x + y2 x + y2 =
(7)
Die Jacobi-Determinante lautet dann μx 1 J= −νx (r1 r2 )2 −y/(x2 + y2 ) =
μy −νy x/(x2 + y2 )
μz + νR/2 −νz − μR/2 0
1 R 2 (μ − ν2 ) (r1 r2 )2 2
(8)
4r1 r2 R2
(9)
Wegen μ 2 − ν2 =
erhalten wir schließlich J=
8 R3 (μ 2 − ν2 )
(10)
1-c Exakte Rechnung In der Born-Oppenheimer-Näherung kann die Gleichung, die wir zur Bestimmung der Energieniveaus des Elektrons im Coulomb-Potential der beiden fixierten Protonen lö sen müssen, geschrieben werden [−
ℏ2 e2 e2 e2 ∆− − + ] φ(r) = Eφ(r) 2m r1 r2 R
(11)
Wenn wir zu den durch die Beziehungen (3) definierten elliptischen Koordinaten über gehen, können die Variablen μ, ν und φ separiert werden. Lösen wir die so erhalte
•
1184 | Ergänzung GXI
Abb. 2: Energieänderung des molekularen H+2 -Ions mit dem Protonenabstand R. Durchgezogene Linie: exakte Gesamtenergie des Grundzustands (die Stabilität des H+2 -Ions resultiert aus der Exis tenz eines Minimums in dieser Kurve). Gepunktete Linie: Diagonalmatrixelement H 11 = H 22 des Hamilton-Operators H (durch dieses Matrixelement kann die chemische Bindung nicht erklärt wer den). Gestrichelte Linie: Ergebnis der einfachen Variationsrechnung aus § 2 für die Bindungs- und Nichtbindungszustände (obwohl sie eine Näherung ist, erklärt diese Rechnung die Stabilität des H+2 -Ions). Dreiecke: Ergebnisse der fortgeschritteneren Variationsrechnung aus § 3-a (die Verwen dung atomarer Orbitale mit variablem Radius verbessert die Genauigkeit erheblich, insbesondere bei kleinen Abständen).
nen Gleichungen, finden wir für jeden Wert von R ein diskretes Spektrum möglicher Energien. Wir führen die Rechnung hier nicht durch, wollen jedoch die Änderung der Grundzustandsenergie in Abhängigkeit von R angeben (die durchgezogene Linie in Abb. 2). Dies ermöglicht dann den Vergleich mit der exakten Lösung von Gl. (11).
2 Berechnung der Energien mit der Variationsmethode 2-a Wahl der Vergleichsvektoren Wir nehmen R sehr viel größer als a0 an. Wenn wir es mit Werten von r1 in der Nähe von a0 zu tun haben, gilt e2 e2 ≈ r2 R
für R, r2 ≫ a0
(12)
Chemische Bindung: Das H+2 -Ion | 1185
•
Der Hamilton-Operator H=
e2 e2 e2 P2 − + − 2m r1 r2 R
(13)
unterscheidet sich dann nicht viel von dem eines Wasserstoffatoms um das Proton P1 . Analoge Ergebnisse erhält man natürlich auch für R sehr viel größer als a0 und r2 in der Nähe von a0 . Wenn die beiden Protonen weit voneinander entfernt sind, handelt es sich bei den Eigenfunktionen des Hamilton-Operators (13) praktisch um die statio nären Wellenfunktionen des Wasserstoffatoms. Das stimmt nicht mehr, wenn a0 im Vergleich zu R nicht vernachlässigbar ist. Wie wir jedoch sehen, ist es günstig, für al le Werte von R eine Familie von Vergleichsvektoren zu wählen, die aus den um die beiden Protonen zentrierten atomaren Zuständen konstruiert ist. Dies ist die Anwen dung einer als Linearkombination von Atomorbitalen bekannten allgemeinen Methode auf den speziellen Fall des H+2 -Ions. Um genau zu sein, wollen wir die Vektoren, die die 1s-Zustände der beiden Wasserstoffatome beschreiben, mit |φ1 ⟩ und |φ2 ⟩ bezeich nen: ⟨r | φ1 ⟩ = ⟨r | φ2 ⟩ =
1 √πa30 1 √πa30
e−ρ1 e−ρ2
(14)
Als Vergleichsvektoren wählen wir alle Vektoren, die zu dem durch diese beiden Vek toren aufgespannten Unterraum F gehören; das ist die Menge der Vektoren, für die gilt |ψ⟩ = c1 |φ1 ⟩ + c2 |φ2 ⟩
(15)
Die Variationsmethode (Ergänzung EXI ) besteht nun in der Bestimmung der sta tionären Werte von ⟨H⟩ =
⟨ψ | H | ψ⟩ ⟨ψ | ψ⟩
(16)
Da die Vergleichsfunktionen einen Unterraum bilden, wird der Erwartungswert ⟨H⟩ minimal oder maximal, wenn |ψ⟩ ein Eigenvektor von H in diesem Unterraum F ist; die zugehörigen Eigenwerte stellen eine Näherung der wahren Eigenwerte von H im gesamten Zustandsraum dar.
2-b Die Eigenwertgleichung von H im Unterraum F Die Lösung der Eigenwertgleichung des Hamilton-Operators H im Unterraum F wird etwas kompliziert, weil |φ1 ⟩ und |φ2 ⟩ nicht orthogonal sind.
•
1186 | Ergänzung GXI
Jeder Vektor |ψ⟩ aus F hat die Form (15). Damit er ein Eigenvektor von H aus F mit dem Eigenwert E ist, ist es notwendig und hinreichend, dass ⟨φ i | H | ψ⟩ = E ⟨φ i | ψ⟩
i = 1, 2
(17)
∑ c j ⟨φ i | H | φ j ⟩ = E ∑ c j ⟨φ i | φ j ⟩
(18)
d. h. 2
2
j=1
j=1
Wir setzen S ij = ⟨φ i | φ j ⟩ H ij = ⟨φ i | H | φ j ⟩
(19)
und müssen ein System von zwei linearen homogenen Gleichungen lösen: (H11 − ES11 )c1 + (H12 − ES12 )c2 = 0 (H21 − ES21 )c1 + (H22 − ES22 )c2 = 0 Es hat nur dann eine nichttriviale Lösung, wenn gilt H11 − ES11 H12 − ES12 H21 − ES21 H22 − ES22 = 0
(20)
(21)
Bei den möglichen Eigenwerten von H handelt es sich somit um die Wurzeln einer Gleichung zweiter Ordnung.
2-c Überlappungs-, Coulomb- und Resonanzintegrale Die Zustände |φ1 ⟩ und |φ2 ⟩ sind normiert; daher gilt S11 = S22 = 1
(22)
Andererseits sind |φ1 ⟩ und |φ2 ⟩ nicht orthogonal. Da die zu diesen Vektoren gehören den Wellenfunktionen (14) reell sind, ist S12 = S21 = S
(23)
S = ⟨φ1 | φ2 ⟩ = ∫ d3 r φ1 (r) φ2 (r)
(24)
mit
S wird Überlappungsintegral genannt, da seine Beiträge nur von Raumpunkten her rühren, in denen die atomaren Wellenfunktionen φ1 und φ2 beide von null verschie den sind (solche Punkte existieren, wenn die beiden Atomorbitale teilweise „überlap pen“). Eine einfache Rechnung ergibt S = e−ρ [1 + ρ +
1 2 ρ ] 3
(25)
Chemische Bindung: Das H+2 -Ion |
1187
•
Zu diesem Ergebnis können wir bei Verwendung elliptischer Koordinaten (3) gelan gen, denn es ist μ+ν ρ ρ1 = 2 (26) μ−ν ρ ρ2 = 2 Nach den Ausdrücken (14) für die Wellenfunktionen und mit dem Ausdruck für das Volumenelement (4) müssen wir S=
+∞
1 πa30
+1
−1
1 +∞
=
2π
∫ dμ ∫ dν ∫ dφ
ρ 3 a30 2 (μ − ν2 ) e−μρ 8
0
ρ3 1 ∫ dμ (μ 2 − ) e−μρ 2 3
(27)
1
berechnen, woraus sich Gl. (25) ergibt. Aus Symmetriegründen gilt H11 = H22
(28)
Mit dem Ausdruck (13) für den Hamilton-Operator H erhalten wir H11 = ⟨φ1 | (
P2 e2 e2 e2 | φ1 ⟩ + ⟨φ1 | φ1 ⟩ − ) | φ1 ⟩ − ⟨φ1 | 2m r1 r2 R
(29)
Nun ist |φ1 ⟩ ein normierter Eigenvektor von P2 /2m − e2 /r1 . Der erste Term von Gl. (29) ist daher gleich der Energie −EI des Grundzustands des Wasserstoffatoms und der drit te Term ist gleich e2 /R; wir erhalten also H11 = −EI +
e2 −C R
(30)
mit C = ⟨φ1 |
e2 e2 2 | φ 1 ⟩ = ∫ d3 r (φ1 (r)) r2 r2
(31)
C wird als Coulomb-Integral bezeichnet. Es beschreibt (bis auf das Vorzeichen) die elektrostatische Wechselwirkung zwischen dem Proton P2 und der Ladungsverteilung des Elektrons im atomaren 1s-Grundzustand um P1 . Es ergibt sich 2 C = EI [1 − e−2ρ (1 + ρ)] (32) ρ Zum Nachweis verwenden wir wiederum elliptische Koordinaten: C=
e2 1 ρ 3 a30 2 ∫(μ 2 − ν2 ) dμ dν dφ e−(μ+ν)ρ a0 ρ πa30 8 μ−ν +∞
+1
= EI ρ 2 ∫ dμ ∫ dν (μ + ν) e−(μ+ν)ρ 1
−1
Elementare Integration führt dann auf das Ergebnis (32).
(33)
•
1188 | Ergänzung GXI
In Gl. (30) kann C als Modifizierung der Abstoßungsenergie e2 /R der beiden Pro tonen aufgefasst werden: Wenn sich das Elektron im Zustand |φ1 ⟩ befindet, „schirmt“ die zugehörige Ladungsverteilung das Proton P1 „ab“. Da |φ1 (r)|2 kugelsymmetrisch um P1 ist, würde die entsprechende Ladungsverteilung von einem Proton P2 aus be trachtet, das sich weit genug entfernt befindet, wie eine negative Punktladung e bei P1 aussehen (so dass die Ladung des Protons P1 vollständig absorbiert wäre). Dieser Effekt tritt aber tatsächlich nur auf, wenn R viel größer als a0 ist: lim [
R→∞
e2 − C] = 0 R
(34)
Für endliche R kann der Abschirmeffekt nur teilweise eintreten, und es muss gelten e2 −C>0 R
(35)
Der Verlauf der Energie e2 /R − C in Abhängigkeit von R ist in Abb. 2 durch die gepunk tete Linie dargestellt. Es wird deutlich, dass die Variation von H11 (oder H22 ) mit R die chemische Bindung nicht erklären kann, weil in der Kurve kein Minimum auftritt. Schließlich wollen wir H12 und H21 berechnen. Da die Wellenfunktionen φ1 (r) und φ2 (r) reell sind, gilt H12 = H21
(36)
Der Ausdruck (13) für den Hamilton-Operator ergibt H12 = ⟨φ1 | (
P2 e2 e2 e2 | φ2 ⟩ − ) | φ2 ⟩ + ⟨φ1 | φ2 ⟩ − ⟨φ1 | 2m r2 R r1
(37)
was nach der Definition (24) für S auf H12 = −EI S +
e2 S−A R
(38)
führt mit A = ⟨φ1 |
e2 e2 | φ2 ⟩ = ∫ d3 r φ1 (r) φ2 (r) r1 r1
(39)
Wir bezeichnen A als Resonanzintegral¹. Es ist gleich A = EI 2e−ρ (1 + ρ)
(40)
1 Manche Autoren nennen A ein „Austauschintegral“. Wir ziehen es jedoch vor, diesen Ausdruck für eine andere Art von Integralen zu verwenden, wie sie bei der Beschreibung von Vielteilchensystemen auftreten (Ergänzung BXIV , § 2-c-β).
Chemische Bindung: Das H+2 -Ion | 1189
•
Unter Verwendung elliptischer Koordinaten können wir A in der Form schreiben A=
e2 1 ρ 3 a30 2e−μρ ∫(μ 2 − ν2 ) dμ dν dφ 3 a0 πa0 8 (μ + ν)ρ +∞
= ρ 2 EI ∫ dμ 2μ e−μρ
(41)
1
Die Tatsache, dass H12 von null verschieden ist, drückt die Möglichkeit aus, dass das Elektron von einem Proton zum anderen „springen“ kann. Wenn sich zu einem gegebenen Zeitpunkt das Elektron im Zustand |φ1 ⟩ (oder |φ2 ⟩) befindet, oszilliert es unter dem Einfluss des Nichtdiagonalelements H12 mit der Zeit zwischen den beiden Protonen. H12 ist somit verantwortlich für das Phänomen der Quantenresonanz, die wir qualitativ in § C-2-c von Kapitel IV beschrieben haben (daher der Name des Inte grals A). Zusammenfassend haben wir also die folgenden Parameter als Funktionen von R, die in Gl. (21) für die Näherungswerte der Energien E auftreten, S11 = S22 = 1 S12 = S21 = S e2 −C R e2 = (−EI + ) S − A R
H11 = H22 = −EI + H12 = H21
(42)
wobei S, C und A durch die Gleichungen (25), (32) bzw. (40) gegeben und in Abb. 3 dargestellt sind. Man erkennt, dass die Nichtdiagonalelemente der Determinante (21) nur dann merkliche Werte annehmen, wenn die Orbitale φ1 (r) und φ2 (r) teilweise überlappen, da sowohl in der Definition (39) von A als auch in der von S das Produkt φ1 (r)φ2 (r) auftritt.
2-d Bindende und bindungslockernde Zustände α Näherungsweise Berechnung der Energien Wir setzen E = εEI
A = αEI
C = γEI
(43)
Gleichung (21) nimmt dann die folgende Form an: −1 + 2ρ − γ − ε (−1 + 2 ) S − α − εS ρ
(−1 + 2ρ ) S − α − εS = 0 −1 + 2ρ − γ − ε
(44)
•
1190 | Ergänzung GXI
Abb. 3: Verlauf von S (Überlappungsintegral), C (Coulomb-Integral) und A (Resonanzintegral) in Abhängigkeit von ρ = R/a0 . Für R → ∞ gehen S und A exponentiell gegen null, während C nur wie e 2 /R fällt (die „abgeschirmte“ Wechselwirkung e 2 /R − C des Protons P1 mit dem Atom am Ort P2 fällt auch exponentiell ab).
oder [γ + ε + 1 −
2 2 2 2 ] = [α + (ε + 1 − ) S] ρ ρ
(45)
Das ergibt für ε die zwei Werte ε+ = −1 +
2 α−γ + ρ 1−S
(46a)
ε− = −1 +
2 α+γ − ρ 1+S
(46b)
Sowohl ε+ als auch ε− gehen gegen −1, wenn ρ gegen unendlich geht. Das bedeutet, dass die beiden Näherungswerte für die Energien E± wie erwartet (s. § 2-a) gegen −EI streben, also gegen die Grundzustandsenergie eines isolierten Wasserstoffatoms. Es bietet sich an, diesen Wert als Energienullpunkt zu wählen, d. h. ∆E = E(ρ) − E(∞) = E + EI
(47)
Chemische Bindung: Das H+2 -Ion | 1191
•
zu setzen. Mit den Gleichungen (25), (32) und (40) können die Energien ∆E+ und ∆E− wie folgt geschrieben werden: 2 −ρ −2ρ { 2 2e (1 + ρ) ∓ ρ [1 − e (1 + ρ)] } ∆E± = EI { ± } ρ 1 ∓ e−ρ (1 + ρ + ρ 2 /3) } {
(48)
Der Verlauf von ∆E± /EI in Abhängigkeit von ρ ist durch die gestrichelte Linie in Abb. 2 dargestellt. Wie wir sehen, nimmt ∆E− für einen bestimmten Wert des Abstands R der beiden Protonen ein negatives Minimum an. Obwohl es sich hierbei um eine Näherung handelt (s. Abb. 2), kann so das Auftreten der chemischen Bindung erklärt werden. Wir haben bereits darauf hingewiesen, dass die Diagonalelemente H11 und H22 der Determinante (21), als Funktion von R aufgefasst, kein Minimum besitzen (ge punktete Linie in Abb. 2). Das Minimum von ∆E− ist daher eine Folge der Nichtdia gonalelemente H12 und S12 . Das zeigt, dass das Phänomen der chemischen Bindung nur auftritt, wenn sich die Elektronenorbitale der beteiligten Atome ausreichend über lagern. β Eigenzustände von H im Unterraum F Der zu E− gehörende Eigenzustand wird als bindender Zustand bezeichnet, während man bei dem zu E+ gehörenden Zustand von einem bindungslockernden Zustand spricht, da E+ immer größer bleibt als die Energie −EI des aus einem Wasserstoffatom im Grundzustand und einem unendlich weit entfernten Proton gebildeten Systems. Nach Gl. (45) gilt γ+ε+1−
2 2 = ± [α + (ε + 1 − ) S] ρ ρ
(49)
Das Gleichungssystem (20) ergibt dann c1 ± c2 = 0
(50)
Die bindenden und bindungslockernden Zustände sind demnach symmetrische bzw. antisymmetrische Linearkombinationen der Zustände |φ1 ⟩ und |φ2 ⟩. Um sie zu normieren, müssen wir uns daran erinnern, dass |φ1 ⟩ und |φ2 ⟩ nicht orthogonal sind (ihr Skalarprodukt ist gleich S). Wir erhalten somit |ψ+ ⟩ = |ψ− ⟩ =
1
(|φ1 ⟩ − |φ2 ⟩)
(51a)
1 (|φ1 ⟩ + |φ2 ⟩) √2(1 + S)
(51b)
√2(1 − S)
Der bindende Zustand |ψ− ⟩ zur Energie E− ist symmetrisch in Bezug auf den Austausch von |φ1 ⟩ und |φ2 ⟩, während der bindungslockernde Zustand antisymmetrisch ist.
•
1192 | Ergänzung GXI
Bemerkung: Man hätte bereits erwarten können, dass die Eigenzustände von H im Unterraum F symmetri sche bzw. antisymmetrische Kombinationen von |φ 1 ⟩ und |φ 2 ⟩ sind: Für gegebene Positionen der beiden Protonen liegt bezüglich der Mittelebene Symmetrie von P 1 P 2 vor, und H bleibt gleich, wenn die beiden Protonen ihre Rollen tauschen.
Bindende und bindungslockernde Zustände sind angenäherte stationäre Zustände des untersuchten Systems. Wie wir in Ergänzung EXI herausgestellt haben, ergibt die Variationsmethode gute Näherungen für die Energien, während das Ergebnis für die Eigenfunktionen fraglich ist. Es lässt sich jedoch zumindest ein Eindruck vom Mechanismus der chemischen Bindung gewinnen; dazu ist es hilfreich, die Wellen funktionen des bindenden und des bindungslockernden Zustands, die man oft auch als bindende und bindungslockernde Molekülorbitale bezeichnet, grafisch darzustel len. Dazu können wir z. B. die Flächen mit gleichem |ψ| abbilden (auf denen also der Betrag |ψ| der Wellenfunktion einen gegebenen Wert hat). Wenn ψ reell ist, deuten wir durch ein +-Zeichen (oder −-Zeichen) die Bereiche an, in denen ψ positiv (oder negativ) ist. Diese Art der Veranschaulichung wird in Abb. 4 für ψ+ und ψ− gezeigt (die Flächen mit gleichem |ψ| sind Rotationsflächen um die Achse P1 P2 , und in Abb. 4 ist nur ein Schnitt längs einer Ebene, die P1 P2 enthält, dargestellt). Die Unterschie de zwischen dem bindenden und dem bindungslockernden Orbital fallen sofort ins Auge. Bei dem ersten „streckt“ sich die Elektronenwolke, um beide Protonen einzu schließen, während beim zweiten die Aufenthaltswahrscheinlichkeit des Elektrons in der Mittelebene von P1 P2 null ist.
(a)
(b)
Abb. 4: Schematische Darstellung des bindenden Molekülorbitals (a) und des bindungslockern den Molekülorbitals (b) des H+2 -Ions. Gezeigt wird der Schnitt entlang einer P1 P2 enthaltenden Ebene durch eine Familie von Flächen, auf denen |ψ| einen bestimmten Wert hat. Dabei handelt es sich um Rotationsflächen um P1 P2 (es sind 4 Flächen dargestellt, die 4 verschiedenen Werten von |ψ| entsprechen). Die in der Abbildung angegebenen +- und −-Zeichen geben den Betrag der (reellen) Wellenfunktion in den entsprechenden Bereichen an. Die gestrichelte Linie ist der Schnitt der Mittelebene zu P1 P2 , bei der es sich um eine Knotenfläche des bindungslockernden Orbitals handelt.
Chemische Bindung: Das H+2 -Ion |
1193
•
Bemerkung: Wir können den Erwartungswert der potentiellen Energie im Zustand |ψ− ⟩ berechnen; er ergibt sich mit den Gleichungen (51b), (31) und (39) zu ⟨V⟩ = ⟨ψ− | [ =
e2 e2 e2 − − ] | ψ− ⟩ R r1 r2
e2 e2 e2 e2 e2 1 | φ 1 ⟩ + ⟨φ 1 | | φ 2 ⟩ + ⟨φ 1 | | φ 1 ⟩ + ⟨φ 1 | | φ 2 ⟩] − [⟨φ 1 | R 1+S r1 r1 r2 r2
= EI [
2 1 − (2 + 2α + γ)] ρ 1+S
(52)
Ziehen wir dieses Resultat von (46b) ab, so erhalten wir die kinetische Energie P2 ⟩ = ⟨H − V⟩ 2m 1 = EI (1 − S + α) 1+S
⟨T⟩ = ⟨
(53)
Wir werden später (§ 5) diskutieren, wie gut die in Gl. (52) und Gl. (53) gegebenen Näherungen für die kinetische und potentielle Energie sind.
3 Mögliche Verbesserungen des Modells 3-a Ergebnisse für kleine R Wie verhalten sich die Energie des gebundenen Zustands und die entsprechende Wel lenfunktion, wenn R → 0 geht? Wie wir aus Abb. 3 ersehen, streben für ρ → 0 S, A und C gegen eins, 2EI bzw. 2EI . Ziehen wir zur Berechnung der elektronischen Energie den Abstoßungsterm e2 /R der beiden Protonen ab, erhalten wir E− −
e2 R→0 → −3EI R
(54)
Außerdem reduziert sich, da |φ1 ⟩ gegen |φ2 ⟩ geht, |ψ− ⟩ auf |φ1 ⟩ (den 1s-Grundzu stand des Wasserstoffatoms). Dieses Resultat kann offensichtlich nicht richtig sein. Für R = 0 haben wir das Äquivalent² eines Heliumions He+ vorliegen. Die Energie des Grundzustands von H+2 muss für R = 0 mit der des Grundzustands von He+ übereinstimmen. Da es sich beim Heliumkern um einen Atomkern mit Z = 2 handelt, ist diese Energie gleich −Z 2 EI = −4EI
(55)
(s. Ergänzung AVII ) und nicht −3EI . Außerdem sollte die Wellenfunktion ψ− (r) nicht gegen φ1 (r) = (πa30 )−1/2 e−ρ1 , sondern gegen (πa30 /Z 3 )−1/2 e−Zρ1 mit Z = 2 streben (die 2 Neben den beiden Protonen enthält der Heliumkern natürlich noch ein oder zwei Neutronen.
•
1194 | Ergänzung GXI
Bohrsche Bahn ist nur halb so groß). Nun verstehen wir, warum die Differenz zwischen dem exakten Ergebnis und dem Ergebnis von § 2 für kleine Werte von R merkbar wird (Abb. 2): Diese Rechnung verwendet Atomorbitale, die eine zu große Ausdehnung ha ben, wenn die Protonen zu dicht zusammen sind. Eine Verbesserung, die diesen physikalischen Überlegungen Rechnung trägt, be steht darin, die Familie von Vergleichsvektoren zu vergrößern. Wir betrachten Vekto ren der Form |ψ⟩ = c1 |φ1 (Z)⟩ + c2 |φ2 (Z)⟩
(56)
wobei die Zustände |φ1 (Z)⟩ und |φ2 (Z)⟩ zu um P1 bzw. P2 zentrierten 1s-Atomorbita len mit dem Radius a0 /Z gehören. Der Grundzustand entspricht aufgrund von Sym metrieüberlegungen wieder dem Fall c1 = c2 . Wir betrachten nun Z als Variationspa rameter, wobei seine Wahl für jeden Wert von R so erfolgt, dass die Energie minimiert wird. Die Rechnung kann vollständig in elliptischen Koordinaten durchgeführt werden. Es ergibt sich (s. Abb. 5), dass der optimale Wert von Z von Z = 2 bei R = 0 auf Z = 1 bei R → ∞ abfällt, wie es sein sollte. Die Kurve, die man für den Verlauf von ∆E− erhält, liegt sehr viel näher am ex akten Ergebnis (s. Abb. 2). In Schema 1 sind Lage und Tiefe des Minimums von ∆E− angegeben, die sich mit den verschiedenen in dieser Ergänzung betrachteten Model len ergeben. Wir können ablesen, dass die Werte aus der Variationsrechnung immer größer sind als die exakten Energien des Grundzustands; außerdem ist zu erkennen, dass eine Vergrößerung der Familie von Vergleichsvektoren die Ergebnisse verbessert.
Abb. 5: Für jeden Protonenabstand berechnet man den Wert von Z, der die Energie minimiert. R = 0 entspricht einem He+ -Ion, und in der Tat ergibt sich Z = 2. Für R ≫ a0 haben wir es im Wesentlichen mit einem isolierten Wasserstoffatom zu tun, was auf Z = 1 führt. Zwischen diesen beiden Extrema ist Z eine fallende Funktion von ρ. Die entsprechenden optimierten Energien sind in Abb. 2 durch Dreiecke dargestellt.
Chemische Bindung: Das H+2 -Ion |
1195
•
Schema 1
Variationsmethode von § 2 (1s-Orbitale mit Z = 1) Variationsmethode von § 3-a (1s-Orbitale mit Variabler Z) Variationsmethode von § 3-b (Hybridorbitale mit Variablen Z, Z und σ) Exakte Werte
Gleichgewichtsabstand der beiden Protonen (Lage des Minimums von ∆E − ) 2.50 a0
Tiefe des Minimums von ∆E −
2.00 a0
2.35 eV
2.00 a0
2.73 eV
2.00 a0
2.79 eV
1.76 eV
3-b Ergebnisse für große R Aus Gl. (48) sehen wir, dass E+ und E− für R → ∞ exponentiell gegen denselben Wert −EI streben. Tatsächlich sollte dieser Grenzwert aber nicht so schnell angenommen werden. Um das zu zeigen, verwenden wir einen störungstheoretischen Ansatz wie in Ergänzung CXI (Van-der-Waals-Kräfte) oder Ergänzung EXII (Stark-Effekt des Wasser stoffatoms). Wir berechnen also die Störung der Energie eines Wasserstoffatoms bei P2 (im 1s-Zustand), die durch die Anwesenheit eines Protons P1 im Abstand R, der sehr viel größer als a0 ist (ρ ≫ 1), hervorgerufen wird. In der Nähe von P2 erzeugt das Proton P1 ein elektrisches Feld E, das mit 1/R2 abfällt. Dieses Feld polarisiert das Wasserstoffatom und erzeugt ein zu E proportionales elektrisches Dipolmoment D. Die Elektronenwellenfunktion wird verzerrt und der Schwerpunkt der Elektronenla dungsverteilung rückt näher an P1 (Abb. 6). Sowohl E als auch D sind proportional zu 1/R2 und haben dasselbe Vorzeichen. Die elektrostatische Wechselwirkung zwischen dem Proton P1 und dem Atom bei P2 führt daher zur Absenkung der Energie um einen Betrag, der wie −E⋅D mit 1/R4 abfällt³. Folglich muss das asymptotische Verhalten von ∆E+ und ∆E− wie −a/R4 und nicht exponentiell sein (wobei a eine positive Konstante ist).
Abb. 6: Unter dem Einfluss des vom Proton P1 erzeugten elektrischen Felds E wird die Elektronen wolke des bei P2 lokalisierten Atoms verzerrt, so dass ein elektrisches Dipolmoment D erzeugt wird. Es ergibt sich eine Wechselwirkungsenergie, die für wachsende R mit 1/R 4 abfällt.
3 Genauer gesagt wird die Energie um −E ⋅ D/2 verringert, s. Ergänzung EXII , § 1.
•
1196 | Ergänzung GXI
Dieses Resultat lässt sich auch mit Hilfe der Variationsmethode erhalten. Anstatt 1s-Orbitale um P1 und P2 linear zu überlagern, betrachten wir nun Hybridorbitale χ1 und χ2 , die nicht kugelsymmetrisch um P1 und P2 sind. Zum Beispiel ergibt sich χ2 als lineare Überlagerung eines 1s- und eines 2p-Orbitals, die beide um P2 zentriert sind: χ2 (r) = φ21s (r) + σ φ22p (r)
(57)
die Form ist ähnlich wie in Abb. 6.⁴ Wir betrachten die Determinante (21): Die nicht diagonalen Elemente H12 = ⟨χ1 |H|χ 2 ⟩ und S12 = ⟨χ1 |χ 2 ⟩ gehen weiterhin für R → ∞ exponentiell gegen null. Das liegt daran, dass in den entsprechenden Integralen das Produkt χ 1 (r)χ 2 (r) auftritt; obwohl sie verzerrt sind, bleiben die Orbitale χ 1 (r) und χ 2 (r) in der Umgebung von P1 bzw. P2 , so dass ihre Überlappung für R → ∞ expo nentiell gegen null geht. Die beiden Eigenwerte E+ und E− streben daher beide gegen H11 = H22 , da die Determinante (21) diagonal wird. Was aber stellt nun H22 dar? Wie wir gesehen haben (s. § 2-c), ist es die Ener gie eines Wasserstoffatoms bei P2 , das vom Proton P1 gestört wird. In der Rechnung von § 2 haben wir jegliche Polarisation des elektronischen 1s-Orbitals durch das vom Proton P1 erzeugte elektrische Feld vernachlässigt, und aus diesem Grund ergab sich eine Energiekorrektur, die exponentiell mit R abfällt. Wenn wir jedoch wie hier die Polarisation des elektronischen Orbitals berücksichtigen, ergibt sich eine Korrektur in −a/R4 . Da wir in Gl. (57) nur die Mischung mit dem 2p-Orbital betrachten, han delt es sich bei dem Wert von a aus der Variationsrechnung um einen Näherungswert (während die Störungsrechnung für die Polarisation alle angeregten Zustände mit ein bezieht, s. Ergänzung EXII ). Die zwei Kurven, die ∆E+ und ∆E− darstellen, laufen exponentiell zusammen, da die Differenz zwischen E+ und E− nur mit den Nichtdiagonalelementen H12 und S12 zusammenhängt und ihr gemeinsamer Wert für große R wie −a/R4 gegen null geht (Abb. 7). Die vorstehende Diskussion führt dazu, die polarisierten Orbitale wie (57) nicht nur für große R, sondern auch für alle anderen Werte von R zu verwenden. Wir wür den damit die Familie der Vergleichsvektoren vergrößern und somit die Genauigkeit verbessern. Wir betrachten dann σ in Gl. (57) wie zuvor den Parameter Z, der den BohrRadius a0 /Z der 1s- und 2p-Orbitale definiert, als Variationsparameter. Zur größeren Flexibilität lassen wir darüber hinaus noch verschiedene Parameter Z und Z für φ1s und φ2p zu. Für jeden Wert von R minimieren wir dann den Erwartungswert von H im Grundzustand |χ 1 ⟩ + |χ 2 ⟩ (der aufgrund von Symmetrieüberlegungen immer noch der Grundzustand ist) und erhalten so die optimalen Werte von σ, Z und Z . Die Überein stimmung mit den exakten Ergebnissen ist dann ausgezeichnet (s. Schema 1).
4 Als Symmetrieachse des 2p-Orbitals wird die Verbindungsachse der beiden Protonen gewählt.
Chemische Bindung: Das H+2 -Ion
| 1197
•
Abb. 7: Für ρ → ∞ nähern sich die Energien des bindenden und des bindungslockernden Zustands exponentiell einander an. Ihren Grenzwert erreichen sie jedoch langsamer (wie 1/R 4 ).
4 Andere Molekülorbitale des H+2 -Ions In den vorstehenden Abschnitten haben wir mit Hilfe der Variationsmethode ein bin dendes und ein bindungslockerndes Molekülorbital konstruiert, indem wir von den 1s-Grundzuständen der beiden Wasserstoffatome ausgingen, die sich um die Proto nen bilden können. Um eine Näherung für den Grundzustand des Gesamtsystems (beide Protonen und Elektron) zu erhalten, war dies von vornherein die beste Wahl. Offensichtlich lassen sich mit der Methode der linearen Überlagerung atomarer Orbi tale (§ 2-a) weitere Molekülorbitale höherer Energie konstruieren, wenn man von an geregten Zuständen des Wasserstoffatoms ausgeht. Wir untersuchen diese angeregten Orbitale hauptsächlich, um einen Einblick in die Phänomene zu erhalten, die bei kom plizierteren Molekülen eine Rolle spielen. Um z. B. die Eigenschaften eines zweiatomi gen Moleküls mit mehreren Elektronen zu verstehen, können wir in erster Näherung annehmen, dass diese isoliert sind, also miteinander nicht in Wechselwirkung stehen. Wir bestimmen also die verschiedenen stationären Zustände für ein Einzelelektron im Coulomb-Feld der Kerne und bringen dann die Elektronen des Moleküls unter Beach tung des Pauli-Prinzips in diesen Zuständen unter (s. Kap. XIV, § D-1), wobei wir die niedrigsten Energiezustände zuerst auffüllen (dieser Vorgang wird in Ergänzung AXIV für Vielteilchensysteme näher beschrieben). Hier geben wir die prinzipiellen Eigen schaften der angeregten Molekülorbitale des H+2 -Ions an, wobei wir jeweils die Mög lichkeit zur Verallgemeinerung auf kompliziertere Moleküle im Auge behalten.
4-a Symmetrien und Quantenzahlen. Spektroskopische Notation 1. Das von den zwei Protonen erzeugte Potential V ist symmetrisch in Bezug auf die Rotation um die P1 P2 -Achse, die wir als z-Achse wählen wollen. Das bedeutet, dass V und damit der Hamilton-Operator H des Elektrons nicht von der Winkelvariablen φ
•
1198 | Ergänzung GXI
abhängt, die für einen gegebenen Punkt M die Orientierung der MP1 P2 -Ebene zur z-Achse angibt. Daraus folgt, dass H mit der Komponente L z des Bahndrehimpulses des Elektrons vertauscht (in der {|r⟩}-Darstellung wird L z durch den Differentialope ∂ rator ℏi ∂φ dargestellt, der mit jedem von φ unabhängigen Operator kommutiert). Wir können dann ein System von Eigenzuständen von H finden, die auch Eigenzustände von L z sind, und sie nach ihrem Eigenwert mℏ von L z klassifizieren. 2. Außerdem ist V invariant bezüglich der Spiegelung an einer beliebigen Ebene, die P1 P2 , d. h. die z-Achse enthält. Ein Eigenzustand von L z mit dem Eigenwert mℏ geht unter einer solchen Spiegelung in einen Eigenzustand von L z mit dem Eigenwert −mℏ über (die Spiegelung ändert den Umlaufsinn des Elektrons um die z-Achse). We gen der Invarianz von V hängt die Energie eines stationären Zustands nur von |m| ab. In der spektroskopischen Notation indizieren wir jedes Molekülorbital in der fol genden Weise mit einem griechischen Buchstaben, der den Wert von |m| angibt: |m| = 0 ←→ σ |m| = 1 ←→ π
(58)
|m| = 2 ←→ δ (man beachte die Analogie zur atomaren spektroskopischen Notation: σ, π, δ entspre chen s, p, d). Zum Beispiel handelt es sich bei den beiden in den vorangegangenen Abschnitten untersuchten Orbitalen um σ-Orbitale, da der 1s-Grundzustand des Was serstoffatoms den Bahndrehimpuls null hat (es lässt sich zeigen, dass dies auch für die exakte stationäre Wellenfunktion und nicht nur für die genäherten Zustände der Variationsmethode gilt). Bei dieser Notation wird nicht von der Tatsache Gebrauch gemacht, dass die bei den Protonen des H+2 -Ions die gleiche Ladung haben. Die σ, π, δ-Klassifikation mole kularer Orbitale bleibt also auch für heteropolare zweiatomige Moleküle gültig. 3. Für das H+2 -Ion (und allgemeiner für homöopolare zweiatomige Moleküle) ist das Potential V in Bezug auf eine Spiegelung am Mittelpunkt O der Strecke P1 P2 inva riant. Wir können also die Eigenfunktionen des Hamilton-Operators H so wählen, dass sie bezüglich des Punkts O eine definierte Parität haben. Für ein gerades Orbital fü gen wir dem griechischen Index zur Bezeichnung von |m| den Index g (von „gerade“) und für ein ungerades Orbital den Index u („ungerade“) hinzu. Das oben betrachte te aus dem atomaren 1s-Zustand erhaltene bindende Orbital ist somit ein σ g -Orbital, während es sich beim bindungslockernden um ein σ u -Orbital handelt. 4. Schließlich können wir aufgrund der Invarianz von H gegenüber Spiegelung an der Mittelebene von P1 P2 die stationären Wellenfunktionen so wählen, dass sie un ter dieser Operation eine definierte Parität haben, d. h. also eine Parität, die durch den Vorzeichenwechsel nur der einen Variablen z definiert ist. Funktionen, die bei dieser Spiegelung gerade sind, werden mit einem Stern gekennzeichnet. Sie verschwinden notwendig in allen Punkten der Mittelebene von P1 P2 (s. das Orbital in Abb. 4b); es handelt sich um bindungslockernde Orbitale.
Chemische Bindung: Das H+2 -Ion |
1199
•
Bemerkung: Die Spiegelung an der Mittelebene von P 1 P 2 lässt sich durch eine Spiegelung an O, gefolgt von einer Drehung um π um die z-Achse erhalten. Die Parität in (4) ist daher nicht unabhängig von den vorhergehenden Symmetrien (die g-Zustände haben für ungerade |m| einen Stern und für gerade |m| keinen Stern, umgekehrt verhält es sich für u-Zustände). Es ist trotzdem nützlich, diese Parität zu betrachten, da wir mit ihrer Hilfe die bindungslockernden Orbitale sofort bestimmen können.
4-b Konstruktion von Molekülorbitalen aus 2p-Atomorbitalen Wenn wir von den angeregten 2s-Zuständen des Wasserstoffatoms ausgehen, wer den wir analog wie oben ein bindendes σ g (2s)-Orbital und ein bindungslockerndes σ ∗u (2s)-Orbital mit einem ähnlichen Aussehen wie die Orbitale in Abb. 4 erhalten. Wir wollen uns also stattdessen mit den Molekülorbitalen befassen, die sich aus den an geregten atomaren 2p-Zuständen ergeben. α Konstruktion von Orbitalen aus 2p z -Zuständen Mit |φ12p z ⟩ und |φ22p z ⟩ wollen wir die atomaren 2p z -Zustände bezeichnen (s. Ergän zung EVII , § 2-b), die um P1 bzw. P2 zentriert sind. Die Form der entsprechenden Orbi tale ist in Abb. 8 dargestellt (man beachte die Vorzeichenwahl).
Abb. 8: Schematische Darstellung der um P1 und P2 zentrierten atomaren 2p z -Orbitale (die z-Achse ist entlang P1 P2 gewählt); diese Orbitale dienen als Basis zur Konstruktion der angeregten Molekülorbitale σ g (2p z ) und σ u∗ (2p z ), die in Abb. 9 dargestellt sind.
Ausgehend von diesen beiden atomaren Zuständen können wir mit Hilfe einer Varia tionsrechnung ähnlich der in § 2 zwei genäherte Eigenzustände des Hamilton-Ope rators (13) konstruieren. Aus den in § 4-a aufgeführten Symmetrien folgt, dass diese molekularen Zustände bis auf einen Normierungsfaktor lauten |φ12p z ⟩ + |φ22p z ⟩
(59a)
|φ12p z ⟩
(59b)
− |φ22p z ⟩
Die Form der so erhaltenen Molekülorbitale lässt sich aus Abb. 8 leicht ablesen; sie sind in Abb. 9 dargestellt.
•
1200 | Ergänzung GXI
Die beiden atomaren 2p z -Zustände sind Eigenzustände von L z mit dem Eigen wert null; dasselbe gilt demzufolge auch für die beiden Zustände (59). Das zu (59a) gehörende Molekülorbital ist gerade und wird mit σ g (2p z ) bezeichnet; das zu (59b) gehörende ist ungerade, sowohl bei Spiegelung an O als auch bei Spiegelung an der Mittelebene von P1 P2 , und wird demnach mit σ ∗u (2p z ) bezeichnet. β Konstruktion von Orbitalen aus 2p x - oder 2p y -Zuständen Wir gehen nun von den atomaren Zuständen |φ12p x ⟩ und |φ22p x ⟩ aus, zu denen die in Abb. 10 dargestellten reellen Wellenfunktionen (s. Ergänzung EVII , § 2-b) gehören (zu beachten ist, dass die Flächen mit konstantem Wert von |ψ|, deren Schnitte mit der x, z-Ebene in Abb. 10 dargestellt sind, Rotationsflächen sind, allerdings nicht bezüg lich der z-Achse, sondern bezüglich der Parallelen zur x-Achse, die durch P1 bzw. P2
(a)
(b)
Abb. 9: Schematische Darstellung der angeregten Molekülorbitale: das bindende Orbital σ g (2p z ) (a) und das bindungslockernde Orbital σ u∗ (2p z ) (b). Wie in Abb. 8 ist der Schnitt durch eine Fläche kon stanten Betrags |ψ| längs einer Ebene, die P1 P2 enthält, abgebildet. Dabei handelt es sich um eine Rotationsfläche in Bezug auf P1 P2 . Das angegebene Vorzeichen ist das der (reellen) Wellenfunktion. Die gestrichelten Kurven sind die Schnitte der Abbildungsebene mit den Knotenflächen (|ψ| = 0).
Abb. 10: Schematische Darstellung der atomaren 2p x -Orbitale, zentriert um P1 und P2 (die z-Achse ist längs P1 P2 gewählt), die als Basis für die Konstruktion der angeregten Molekülorbitale π u (2p x ) und π g∗ (2p x ) dienen, Abb. 11. Für die beiden Orbitale ist der Schnitt der x, z-Ebene mit einer Fläche mit konstantem |ψ| dargestellt; dabei handelt es sich um eine Rotationsfläche nicht um die z-Achse, sondern um die Parallelen zur x-Achse, die durch P1 bzw. P2 gehen.
Chemische Bindung: Das H+2 -Ion | 1201
•
laufen). Wir erinnern uns, dass sich die atomaren 2p x -Orbitale aus der Linearkombi nation von Eigenzuständen von L z mit den Eigenwerten m = 1 und m = −1 ergeben. Für die aus diesen Atomorbitalen konstruierten Molekülorbitale gilt daher |m| = 1; es sind π-Orbitale. Auch hier entstehen die Molekülzustände wieder als symmetrische oder antisym metrische Linearkombinationen aus den atomaren 2p x -Zuständen: |φ12p x ⟩ + |φ22p x ⟩
(60a)
|φ12p x ⟩
(60b)
− |φ22p x ⟩
Die qualitative Form dieser Molekülorbitale lässt sich aus Abb. 10 leicht ersehen. Die Flächen mit konstantem |ψ| sind keine Rotationsflächen in Bezug auf die z-Achse, son dern sind symmetrisch zur x, z-Ebene. Die Schnitte sind in Abb. 11 dargestellt. Wir können dieser Abbildung sofort entnehmen, dass das Orbital (60a) ungerade bezüg lich des Mittelpunkts O von P1 P2 und gerade in Bezug auf die Mittelsenkrechte von P1 P2 ist; es wird daher mit πu (2p x ) bezeichnet. Das Orbital (60b) hingegen ist gera de bezüglich O und ungerade bezüglich der Mittelsenkrechten von P1 P2 : Es handelt sich um ein bindungslockerndes Orbital, bezeichnet mit π∗g (2p x ). Es ist zu beachten, dass diese π-Orbitale Symmetrieflächen und keine Rotationsachsen wie die σ-Orbitale haben. Die entsprechenden Molekülorbitale, die sich aus den atomaren 2p y -Zuständen ergeben, gehen natürlich aus den obigen Orbitalen durch eine Drehung um π/2 um P1 P2 hervor.
(a)
(b)
Abb. 11: Schematische Darstellung der angeregten Molekülorbitale: das bindende π u (2p x )-Orbi tal (a) und das bindungslockernde π g∗ (2p x )-Orbital (b). Für jedes Orbital haben wir den Schnitt der x, z-Ebene mit einer Fläche, auf der |ψ| einen gegebenen konstanten Wert hat, dargestellt. Bei die ser Fläche handelt es sich nicht mehr um eine Rotationsfläche, es besteht nur noch Symmetrie zur x, z-Ebene. Die Bedeutung der Vorzeichen und der gestrichelten Linien ist dieselbe wie in den Abbildungen 4, 8, 9, 10.
•
1202 | Ergänzung GXI
π-Orbitale sind für die Zweifach- oder Dreifachbindungen verantwortlich, wie sie z. B. beim Kohlenstoffatom auftreten (s. Ergänzung EVII , § 3-c und § 4-c). Bemerkung: Wie wir zuvor (§ 2-d) gesehen haben, wird die Energielücke zwischen dem bindenden und dem bindungslockernden Niveau von der Überlappung der atomaren Wellenfunktionen erzeugt. Nun ist für einen gegebenen Abstand R die Überlappung der φ 12pz - und φ 22pz -Orbitale, die zueinan der zeigen, größer als die Überlappung der φ 12px - und φ 22px -Orbitale, deren Achsen parallel sind (Abb. 8 und Abb. 10). Wir sehen also, dass die Energiedifferenz zwischen σ g (2p z ) und σ ∗u (2p z ) größer ist als die zwischen π u (2p x ) und π ∗g (2p x ) [oder zwischen π u (2p y ) und π ∗g (2p y )]. Die An ordnung der entsprechenden Niveaus ist in Abb. 12 dargestellt.
Abb. 12: Energien der angeregten Molekülorbitale, die aus den atomaren 2p z -, 2p x und 2p y -Orbi talen um P1 und P2 konstruiert werden (die z-Achse verläuft längs P1 P2 ). Aufgrund der Symmetrie sind die Molekülorbitale, die sich aus den atomaren 2p x -Orbitalen ergeben, entartet und liegen auf der gleichen Höhe wie die aus den atomaren 2p y -Orbitalen. Die Energiedifferenz zwischen dem bin denden und dem bindungslockernden π u (2p x,y )- und π g∗ (2p x,y )-Orbital ist allerdings kleiner als die entsprechende Differenz zwischen den σ g (2p z )- und σ u∗ (2p z )-Molekülorbitalen. Der Grund hierfür liegt in der größeren Überlappung der beiden 2p z -Orbitale.
5 Ursprung der chemischen Bindung. Virialtheorem 5-a Problemstellung Mit kleiner werdendem Abstand R der beiden Protonen nimmt ihre elektrostatische Abstoßung e2 /R zu. Da die Gesamtenergie E− (R) des Bindungszustands zunächst ab nimmt (wenn R von großen Werten her kleiner wird) und dann ein Minimum durch läuft, folgt, dass die elektronische Energie zunächst schneller fällt als e2 /R zunimmt (natürlich überwiegt die Abstoßung für kurze Abstände, da dieser Term für R → 0 divergiert). Es stellt sich nun die folgende Frage: Geht die Verringerung der elektro nischen Energie, die die chemische Bindung möglich macht, aus einer Verringerung der potentiellen Energie, einer Verringerung der kinetischen Energie oder aus beidem hervor?
Chemische Bindung: Das H+2 -Ion | 1203
•
In Gl. (52) und Gl. (53) haben wir bereits die Näherungsausdrücke für die (gesamte) potentielle und die kinetische Energie abgeleitet. Wir könnten nun diese Ausdrücke in Abhängigkeit von R untersuchen. Da, wie wir bereits festgestellt haben, die aus einer Variationsrechnung erhaltenen Eigenfunktionen sehr viel ungenauer als die entspre chenden Energien sind, ist hierbei Vorsicht angebracht; auf dieses Problem werden wir in § 5-d-β genauer eingehen. Es ist allerdings möglich, diese Frage mit Hilfe des Virialtheorems, das exakte Aus sagen über die Beziehung zwischen der Gesamtenergie E(R) und den mittleren kine tischen und potentiellen Energien ermöglicht, in Strenge zu beantworten. Wir wollen dieses Theorem beweisen und seine physikalischen Konsequenzen diskutieren. Die sich ergebenden Aussagen gelten allgemein und können nicht nur auf das H+2 -Ion, sondern auch auf alle anderen Moleküle angewandt werden. Bevor wir nun das Viri altheorem selbst behandeln, stellen wir einige Ergebnisse zusammen, die wir später benötigen werden.
5-b Theoreme α Euler-Theorem Eine Funktion f(x1 , x2 , . . . , x n ) mehrerer Variablen x1 , x2 , . . . , x n heißt homogen vom Grad s, wenn sie durch Multiplikation aller Variablen mit λ in ihr λ s -faches übergeht: f(λx1 , λx2 , . . . , λx n ) = λ s f(x1 , x2 , . . . , x n )
(61)
Zum Beispiel ist das Potential eines dreidimensionalen harmonischen Oszillators, V(x, y, z) =
1 mω2 (x2 + y2 + z2 ) 2
(62)
homogen vom Grad 2, und die elektrostatische Wechselwirkungsenergie zweier Teil chen, ea eb ea eb = (63) 2 r ab √(x a − x b ) + (y a − y b )2 + (z a − z b )2 homogen vom Grad −1. Das Euler-Theorem besagt, dass für eine beliebige homogene Funktion f vom Grad s die folgende Identität gilt: n
∑ xi i=1
∂f = s f(x1 , . . . , x i , . . . , x n ) ∂x i
(64)
Zum Beweis berechnen wir die Ableitungen beider Seiten von Gl. (61) nach λ. Die linke Seite ergibt ∑ i
∂f ∂f ∂ (λx i ) = ∑ x i (λx1 , . . . , λx n ) (λx1 , . . . , λx n ) ∂x i ∂λ ∂x i i
(65)
•
1204 | Ergänzung GXI
und die rechte Seite s λ s−1 f(x1 , . . . , x n )
(66)
Das Gleichsetzen beider Ausdrücke ergibt für λ = 1 die Behauptung (64). β Das Hellman-Feynman-Theorem Es sei H(λ) ein hermitescher Operator, der von einem reellen Parameter λ abhängt, und |ψ(λ)⟩ ein normierter Eigenvektor von H(λ) zum Eigenwert E(λ): H(λ) |ψ(λ)⟩ = E(λ) |ψ(λ)⟩ ⟨ψ(λ) | ψ(λ)⟩ = 1
(67) (68)
Die Aussage des Hellman-Feynman-Theorems ist d d E(λ) = ⟨ψ(λ) | H(λ) | ψ(λ)⟩ dλ dλ
(69)
Es lässt sich wie folgt beweisen: Nach Gl. (67) und Gl. (68) gilt E(λ) = ⟨ψ(λ) | H(λ) | ψ(λ)⟩
(70)
Leiten wir diese Beziehung nach λ ab, ergibt sich d d E(λ) = ⟨ψ(λ) | H(λ) | ψ(λ)⟩ dλ dλ d d ⟨ψ(λ) |] H(λ) | ψ(λ)⟩ + ⟨ψ(λ) | H(λ) [ | ψ(λ)⟩] +[ dλ dλ
(71)
d. h. mit Hilfe von Gl. (67) und der adjungierten Beziehung [H(λ) ist hermitesch und E(λ) damit reell] wird d d E(λ) = ⟨ψ(λ) | H(λ) | ψ(λ)⟩ dλ dλ d d ⟨ψ(λ) |] |ψ(λ)⟩ + ⟨ψ(λ)| [ | ψ(λ)⟩]} + E(λ) {[ dλ dλ
(72)
Der Ausdruck in den geschweiften Klammern auf der rechten Seite stellt die Ablei tung von ⟨ψ(λ) | ψ(λ)⟩ dar; sie verschwindet, da |ψ(λ)⟩ normiert ist, und es ergibt sich Gl. (69). γ Erwartungswert von [H, A] in einem Eigenzustand von H Es sei |ψ⟩ ein normierter Eigenvektor des hermiteschen Operators H mit dem Eigen wert E. Für einen beliebigen Operator A gilt ⟨ψ | [H, A] | ψ⟩ = 0
(73)
da sich mit H|ψ⟩ = E|ψ⟩ und ⟨ψ|H = E⟨ψ| ⟨ψ | (HA − AH) | ψ⟩ = E⟨ψ | A | ψ⟩ − E⟨ψ | A | ψ⟩ = 0 ergibt.
(74)
Chemische Bindung: Das H+2 -Ion |
1205
•
5-c Anwendung des Virialtheorems auf Moleküle α Die potentielle Energie des Systems Wir betrachten ein beliebiges aus N Atomkernen und Q Elektronen bestehendes Mole kül. Mit rnk (k = 1, 2, . . . , N) bezeichnen wir die klassischen Orte der Kerne und mit rei und pei (i = 1, 2, . . . , Q) die klassischen Orte bzw. Impulse der Elektronen. Die Kom ponenten dieser Vektoren schreiben wir xnk , ynk , znk usw. Wir wollen hier die Born-Oppenheimer-Näherung anwenden und betrachten die rnk als gegebene klassische Parameter. In der quantenmechanischen Rechnung gehen nur die rei und pei in Operatoren Rei bzw. Pei über. Wir haben also die Eigenwertglei chung H(rn1 , . . . , rnN ) |ψ(rn1 , . . . , rnN )⟩ = E(rn1 , . . . , rnN ) |ψ(rn1 , . . . , rnN )⟩
(75)
eines Hamilton-Operators H zu lösen, der von den Parametern rn1 , . . . , rnN abhängt und im Zustandsraum der Elektronen wirkt; H kann geschrieben werden H = Te + V(rn1 , . . . , rnN )
(76)
wobei Te den Operator der kinetischen Energie der Elektronen bezeichnet, Q
1 2 (Pei ) 2m i=1
Te = ∑
(77)
und V(rn1 , . . . , rnN ) den Operator, der sich ergibt, wenn im Ausdruck für die klassische potentielle Energie die rei durch die Operatoren Rei ersetzt werden. Bei diesem Poten tial handelt es sich um die Summe aus der Abstoßungsenergie Vee zwischen den Elek tronen, der Anziehungsenergie Ven zwischen den Elektronen und den Kernen und schließlich der Abstoßungsenergie Vnn der Kerne untereinander, also V(rn1 , . . . , rnN ) = Vee + Ven (rn1 , . . . , rnN ) + Vnn (rn1 , . . . , rnN )
(78)
Da Vnn nur von den rnk , nicht aber von den Operatoren Rei abhängt, handelt es sich bei Vnn um eine Zahl und nicht um einen im Zustandsraum der Elektronen wirkenden Operator. Die Wirkung von Vnn besteht daher lediglich in einer gleichen Verschiebung aller Energien, da Gl. (75) äquivalent ist zu He (rn1 , . . . , rnN ) |ψ(rn1 , . . . , rnN )⟩ = Ee (rn1 , . . . , rnN ) |ψ(rn1 , . . . , rnN )⟩
(79)
Dabei ist He (rn1 , . . . , rnN ) = Te + Vee + Ven (rn1 , . . . , rnN ) = H − Vnn (rn1 , . . . , rnN )
(80)
und die elektronische Energie Ee hängt mit der Gesamtenergie E über Ee (rn1 , . . . , rnN ) = E(rn1 , . . . , rnN ) − Vnn (rn1 , . . . , rnN ) zusammen.
(81)
•
1206 | Ergänzung GXI
Wir können das Euler-Theorem auf die klassische potentielle Energie anwenden, da es sich dabei um eine homogene Funktion vom Grad −1 der Elektronen- und der Kernkoordinaten handelt. Da die Operatoren Rei alle untereinander vertauschen, er gibt sich die folgende Beziehung zwischen den quantenmechanischen Operatoren: N
Q
∑ rnk ⋅ ∇kn V + ∑ Rei ⋅ ∇ie V = −V
(82)
i=1
k=1
worin ∇kn und ∇ie für die Operatoren stehen, die sich ergeben, wenn man in den Gra dienten bezüglich rnk und rei , die im klassischen Ausdruck für die potentielle Energie auftreten, die rei durch die Rei ersetzt. Gleichung (82) wird als Grundlage für unseren Beweis des Virialtheorems dienen. β Beweis des Virialtheorems Wir wenden Gl. (73) auf den Spezialfall Q
A = ∑ Rei ⋅ Pei
(83)
i=1
an. Dazu berechnen wir den Kommutator von H mit A: Q
Q
[H, ∑ Rei ⋅ Pei ] = ∑ ∑ {[H, X ei ] Pexi + X ei [H, Pexi ]} i=1 x,y,z
i=1
Q
= iℏ ∑ {− i=1
2
(Pei ) + Rei ⋅ ∇ie V} m
(84)
(wir haben die Vertauschungsrelationen einer Funktion des Impulses mit dem Orts operator und umgekehrt angewandt; s. Ergänzung BII , § 4-c). Der erste Term in ge schweiften Klammern ist proportional zur kinetischen Energie Te . Der zweite Term ist nach Gl. (82) gleich N
−V − ∑ rnk ⋅ ∇kn V
(85)
k=1
Folglich erhalten wir aus Gl. (73) N
2⟨Te ⟩ + ⟨V⟩ + ∑ rnk ⋅ ⟨∇kn V⟩ = 0
(86)
k=1
d. h., da der Hamilton-Operator nur über V von den Parametern rnk abhängt, N
2⟨Te ⟩ + ⟨V⟩ = − ∑ rnk ⋅ ⟨∇kn H⟩
(87)
k=1
Die Komponenten rnk spielen hier eine ähnliche Rolle wie die Parameter λ in Gl. (69). Die Anwendung des Hellman-Feynman-Theorems auf die rechte Seite von Gl. (87) er
Chemische Bindung: Das H+2 -Ion | 1207
•
gibt dann N
2⟨Te ⟩ + ⟨V⟩ = − ∑ rnk ⋅ ∇kn E(rn1 , . . . , rnk , . . . , rnN )
(88)
k=1
Außerdem gilt offensichtlich ⟨Te ⟩ + ⟨V⟩ = E(rn1 , . . . , rnN )
(89)
Aus Gl. (88) und Gl. (89) ergibt sich dann leicht N
⟨Te ⟩ = −E − ∑ rnk ⋅ ∇kn E k=1
(90)
N
⟨V⟩ = 2E + ∑
rnk
⋅
∇kn E
k=1
Das ist ein sehr einfaches Ergebnis: das Virialtheorem für Moleküle. Mit seiner Hilfe können wir die mittlere kinetische und potentielle Energie berechnen, wenn wir die Abhängigkeit der Gesamtenergie von den Positionen der Atomkerne kennen. Bemerkung: Die elektronische Gesamtenergie E e und die potentielle elektronische Energie ⟨Ve ⟩ hängen auch über N
⟨Ve ⟩ = 2E e + ∑ rnk ⋅ ∇kn E e
(91)
k=1
zusammen. Diese Beziehung kann gezeigt werden, wenn man Gl. (81) und den expliziten Aus druck für Vnn in Abhängigkeit von den rnk in die zweite der Gleichungen (90) einsetzt. Sie lässt sich jedoch leicht einsehen, wenn man beachtet, dass die potentielle Elektronenenergie Ve = Vee + Ven wie die potentielle Gesamtenergie eine homogene Funktion vom Grad −1 der Koordi naten ist. Damit kann man die obige Überlegung für H auch auf H e anwenden, und in den Bezie hungen (90) E durch E e und V durch Ve ersetzen.
γ Ein Spezialfall: das zweiatomige Molekül Wenn die Anzahl N der Atomkerne gleich zwei ist, hängen die Energien nur vom Ab stand R der beiden Kerne ab. Damit werden die Aussagen des Virialtheorems weiter vereinfacht: ⟨Te ⟩ = −E − R
dE dR
dE ⟨V⟩ = 2E + R dR
(92)
•
1208 | Ergänzung GXI
Da E nur über R von den Koordinaten der Atomkerne abhängt, ist ∂E dE ∂R = ∂xnk dR ∂xnk
(93)
und damit ∑ ∑ xnk
k=1,2 x,y,z
∂E ∂R dE ∑ ∑ xnk n n = ∂x k dR k=1,2 x,y,z ∂x k
(94)
Der Abstand R der beiden Kerne ist eine homogene Funktion vom Grad 1 der Kern koordinaten. Mit der Anwendung des Euler-Theorems auf diese Funktion können wir die auf der rechten Seite von Gl. (94) auftretende Doppelsumme durch R ersetzen und erhalten schließlich ∑ rnk ⋅ ∇kn E = R k=1,2
dE dR
(95)
Das Einsetzen dieses Ergebnisses in die Gleichungen (90) ergibt Gl. (92). In den Gleichungen (92) wie in den Gleichungen (90) können wir E durch Ee und V durch Ve ersetzen.
5-d Diskussion α Chemische Bindung als Folge der Energieabsenkung Es sei E∞ die Gesamtenergie des Systems, wenn die Atomkerne unendlich weit von einander entfernt sind. Damit durch Annäherung der Atomkerne ein stabiles Molekül gebildet werden kann, muss eine bestimmte relative Anordnung dieser Kerne existie ren, bei der die Gesamtenergie E ein Minimum E0 < E∞ durchläuft. Für die entspre chenden Werte von rnk gilt dann ∇kn E = 0
(96)
Aus den Gleichungen (90) folgt somit, dass in dieser Gleichgewichtslage die kinetische bzw. die potentielle Energie ⟨Te ⟩0 = −E0 ⟨V⟩0 = 2E0
(97)
ist. Wenn die Kerne unendlich weit voneinander entfernt sind, besteht das System aus einer gewissen Anzahl von Atomen oder Ionen ohne gegenseitige Wechselwirkung (die Energie hängt nicht mehr von den rnk ab). Für jedes Untersystem folgt aus dem Virialtheorem ⟨Te ⟩ = −E, ⟨V⟩ = 2E, und für das Gesamtsystem muss gelten ⟨Te ⟩∞ = −E∞ ⟨V⟩∞ = 2E∞
(98)
Chemische Bindung: Das H+2 -Ion
| 1209
•
Die Subtraktion der Gleichungen (98) von den Gleichungen (97) ergibt dann ⟨Te ⟩0 − ⟨Te ⟩∞ = −(E0 − E∞ ) > 0 ⟨V⟩0 − ⟨V⟩∞ = 2(E0 − E∞ ) < 0
(99)
Die Bildung eines stabilen Moleküls geht daher immer mit einer Vergrößerung der ki netischen Energie der Elektronen und einer Verringerung der potentiellen Gesamt energie einher. Die potentielle elektronische Energie muss darüber hinaus noch wei ter abgesenkt werden, da der Erwartungswert ⟨Vnn ⟩ (die Abstoßung der beiden Ker ne), der im Unendlichen null ist, immer einen positiven Beitrag liefert. Somit ist es die Verringerung der potentiellen Energie der Elektronen ⟨Vee + Ven ⟩, die für das Auftreten der chemischen Bindung verantwortlich ist. Im Gleichgewichtsabstand muss diese Absenkung die Vergrößerung von ⟨Te ⟩ und ⟨Vnn ⟩ überwiegen. β Das H+2 -Ion 1. Anwendung des Virialtheorems auf die Näherungsenergie der Variationsrechnung: Wir kommen auf die Untersuchung von ⟨Te ⟩ und ⟨V⟩ für das H+2 -Ion zurück. Dabei gehen wir von den Vorhersagen des Variationsmodells von § 2 aus, das auf die Nähe rungsausdrücke (52) und (53) führte. Aus der zweiten Beziehung folgern wir ∆Te = ⟨Te ⟩ − ⟨Te ⟩∞ =
1 (A − 2SEI ) 1+S
(100)
Da S immer größer ist als A/2EI (s. Abb. 3), könnte man aus dieser Rechnung schlie ßen, dass ∆Te immer negativ ist. Das lässt sich auch aus Abb. 13 ablesen, wo das Verhalten der Ausdrücke (52) und (53) durch die gestrichelten Linien dargestellt ist. Insbesondere erkennt man, dass der Variationsrechnung zufolge ∆Te im Gleichge wichtsabstand (ρ ≈ 2.5) negativ und ∆V positiv ist. Diese Aussagen sind nach den Gleichungen (99) beide falsch. Wir stoßen hier an die Grenzen der Variationsrech nung, die zwar für die Gesamtenergie ⟨Te + V⟩ ein akzeptables Ergebnis lieferte, nicht aber getrennt für ⟨Te ⟩ und ⟨V⟩. Diese Erwartungswerte hängen zu stark von der Wel lenfunktion ab. Mit Hilfe des Virialtheorems können wir, ohne die in § 1-c erwähnte exakte Rech nung durchführen zu müssen, eine sehr viel bessere Näherung für ⟨Te ⟩ und ⟨V⟩ gewin nen. Dazu brauchen wir nur die exakten Beziehungen (92) auf die mit der Variations methode berechnete Energie E anzuwenden. Wir können dabei ein recht gutes Resul tat erwarten, da die Variationsrechnung nur für die Bestimmung der Gesamtenergie E benutzt wird. Die sich so ergebenden Werte für ⟨Te ⟩ und ⟨V⟩ sind in Abb. 13 durch die kurz gestrichelten Linien dargestellt. Zum Vergleich sind die exakten Werte für ⟨Te ⟩ und ⟨V⟩ als durchgezogene Linien wiedergegeben (man erhält sie durch Anwendung des Virialtheorems auf die durchgezogene Kurve in Abb. 2). Zunächst ersehen wir aus der kurz gestrichelten Kurve für ρ = 2.5 wie erwartet, dass ∆Te positiv und ∆V negativ ist. Der allgemeine Verlauf dieser Kurven folgt außerdem recht genau dem Verlauf der durchgezogenen Linien. Für ρ ≥ 1.5 ergibt die Anwendung des Virialtheorems auf die
•
1210 | Ergänzung GXI
Abb. 13: Die elektronische kinetische Energie ⟨Te ⟩ und die potentielle Energie ⟨V⟩ des H+2 -Ions als Funktionen von ρ = R/a0 (zum Vergleich ist auch die Gesamtenergie E = ⟨Te ⟩ + ⟨V⟩ eingezeichnet): durchgezogene Linien: die exakten Werte (die chemische Bindung kann zustandekommen, weil ⟨V⟩ etwas rascher abfällt als ⟨Te ⟩ ansteigt); lang gestrichelte Linien: aus der bindenden Wellenfunktion berechnete Erwartungswerte, wie sie sich aus der einfachen Variationsrechnung in § 2 ergaben; kurz gestrichelte Linien: die Werte, die sich ergeben, wenn man das Virialtheorem auf die Energie anwendet, die man durch dieselbe (einfache) Variationsrechnung erhält.
Variationsenergie Werte, die sehr gut mit der Wirklichkeit übereinstimmen, was eine wesentliche Verbesserung gegenüber der direkten Berechnung der Erwartungswerte in den genäherten Zuständen darstellt. 2. Das Verhalten von ⟨T⟩ und ⟨V⟩: Die durchgezogenen Linien in Abb. 13 (die ex akten Kurven) zeigen, dass für R gegen null ⟨Te ⟩ → 4EI und ⟨V⟩ → +∞ geht. Tat sächlich haben wir für R = 0 das Äquivalent eines He+ -Ions vorliegen, dessen kine tische elektronische Energie gleich 4EI ist. Die Divergenz von ⟨V⟩ folgt aus dem Term ⟨Vnn ⟩ = e2 /R, der für R gegen null unendlich wird (die potentielle elektronische Ener gie ⟨Ve ⟩ = ⟨V⟩−e2 /R bleibt endlich und geht gegen den Wert −8EI , ihren tatsächlichen Wert im He+ -Ion). Das Verhalten für große R verlangt eine genauere Diskussion. Wir haben oben gesehen (§ 3-b), dass die Energie E− des Grundzustands sich für R ≫ a0 wie E− ≈ −EI −
a R4
(101)
Chemische Bindung: Das H+2 -Ion
| 1211
•
verhält, worin a eine Konstante proportional zur Polarisierbarkeit des Wasserstoff atoms ist. Setzen wir diese Beziehung in die Gleichungen (92) ein, ergibt sich ⟨Te ⟩ ≈ EI −
3a R4
⟨V⟩ ≈ −2EI +
2a R4
(102)
Wird also R von großen Werten kommend kleiner, fällt ⟨Te ⟩ zunächst mit 1/R4 von seinem asymptotischen Wert EI ab, während ⟨V⟩ von −2EI aus ansteigt. Diese Ände rungen wechseln dann ihr Vorzeichen (das muss so sein, da ⟨Te ⟩0 größer als ⟨Te ⟩∞ und ⟨V⟩0 kleiner als ⟨V⟩∞ ist): Mit kleiner werdendem R (s. Abb. 13) durchläuft ⟨Te ⟩ ein Minimum und steigt dann zum Wert 4EI bei R = 0 an. Die potentielle Energie ⟨V⟩ hingegen durchläuft ein Maximum, fällt dann ab, durchläuft ein Minimum und geht für R → 0 gegen unendlich. Wie lässt sich dieses Verhalten interpretieren? Wir haben bereits mehrfach festgestellt, dass die nichtdiagonalen Matrixelemen te H12 und H21 der Determinante (21) für R → ∞ exponentiell gegen null gehen. Wir können uns daher bei der Diskussion der Energie des H+2 -Ions für große Abstände der beiden Kerne auf die Betrachtung von H11 und H22 beschränken. Das Problem reduziert sich dann darauf, die Störung eines sich bei P2 befindlichen Wasserstoff atoms durch das elektrische Feld des Protons P1 zu untersuchen. Dieses Feld führt zu einer Verzerrung der elektronischen Orbitale in Form einer Streckung in Richtung von P1 (s. Abb. 6). Die Wellenfunktion wird somit auf ein größeres Volumen ausge dehnt. Nach den Heisenbergschen Unschärferelationen kann die kinetische Energie also abgesenkt werden, wodurch sich das Verhalten von ⟨Te ⟩ für große R verstehen lässt. Ebenso lässt sich durch die Betrachtung von H22 das asymptotische Verhalten von ⟨V⟩ erklären. Wie die Diskussion in § 3-b zeigte, wird für R ≫ a0 durch die Po larisation des Wasserstoffatoms bei P2 die Wechselwirkungsenergie ⟨−e2 /r1 + e2 /R⟩ mit P1 leicht negativ (proportional zu −1/R4 ); ⟨V⟩ kann nur deshalb positive Werte annehmen, weil die potentielle Energie ⟨−e2 /r2 ⟩ des Atoms bei P2 , wenn P1 näher an P2 rückt, schneller steigt als ⟨−e2 /r1 + e2 /R⟩ abnimmt. Dieser Zuwachs von ⟨−e2 /r2 ⟩ entsteht dadurch, dass P1 das Elektron etwas von P2 wegzieht und somit in Bereiche bringt, in denen das von P2 erzeugte Potential weniger negativ ist. Für R ≈ R0 (Gleichgewichtsabstand des H+2 -Ions) ist die Wellenfunktion des Bin dungszustands im Bereich zwischen den beiden Protonen stark lokalisiert. Die Abnah me von ⟨V⟩ (trotz der Zunahme von e2 /R) entsteht dadurch, dass sich das Elektron in einem Bereich befindet, in dem es gleichzeitig der Anziehung beider Protonen unter liegt; dadurch wird die potentielle Energie abgesenkt (s. Abb. 14). Die gleichzeitige Anziehung durch beide Protonen führt außerdem zu einer Verkleinerung der räumli chen Ausdehnung der elektronischen Wellenfunktion, die auf den Zwischenbereich konzentriert wird. Aus diesem Grunde steigt ⟨Te ⟩ in der Nähe von R0 an, wenn R ver kleinert wird.
•
1212 | Ergänzung GXI
Abb. 14: Verlauf der potentiellen Energie V e des Elektrons, das dem Einfluss der gleichzeitigen An ziehung der beiden Protonen P1 und P2 auf der Verbindungsachse P1 P2 unterliegt. Im Bindungs zustand ist die Wellenfunktion im Bereich zwischen P1 und P2 konzentriert, und das Elektron wird gleichzeitig von beiden Protonen angezogen.
Referenzen und Literaturhinweise Pauling (12.2); Pauling und Wilson (1.9), Kap. XII und XIII; Levine (12.3), Kap. 13 und 14; Karplus und Porter (12.1), Kap. 5, § 6; Slater (1.6), Kap. 8 und 9; Eyring et al. (12.5), Kap. XI und XII; Coulson (12.6), Kap. IV; Wahl (12.13).
Aufgaben |
1213
•
Ergänzung HXI Aufgaben 1. Ein Teilchen der Masse m befinde sich in einem unendlich tiefen Potentialtopf der Breite a: {0 für 0 ≤ x ≤ a V(x) = { +∞ sonst { Es unterliege einer Störung W der Form W(x) = aw0 δ (x −
a ) 2
worin w0 eine reelle Konstante von der Dimension einer Energie ist. a) Man berechne die durch W(x) an den Energieniveaus des Teilchens hervorgerufe nen Änderungen in erster Ordnung in w0 . b) Das Problem ist exakt lösbar. Man setze k = √2mE/ℏ2 und zeige, dass man die möglichen Energiewerte aus den Gleichungen sin(ka/2) = 0 bzw. tan(ka/2) = −ℏ2 k/maw0 erhält (wie in Aufgabe 2 von Ergänzung KI achte man auf die Sprung stelle der Ableitung der Wellenfunktion bei x = a/2). Man diskutiere die Ergebnisse in Bezug auf das Vorzeichen und die Größe von w0 und überzeuge sich davon, dass man im Limes w0 → 0 die Ergebnisse der vorherigen Frage erhält. 2. Man betrachte ein Teilchen der Masse m, das sich in einem unendlich tiefen zwei dimensionalen Potentialtopf der Breite a befindet (s. Ergänzung GII ): {0 für 0 ≤ x ≤ a und 0 ≤ y ≤ a V(x, y) = { +∞ sonst { Das Teilchen unterliege zusätzlich einer Störung W, beschrieben durch das Potential {w0 W(x, y) = { 0 {
für 0 ≤ x ≤
a 2
und 0 ≤ y ≤
a 2
sonst
a) Man berechne in erster Ordnung in w0 die gestörte Energie des Grundzustands. b) Die gleiche Aufgabe löse man für den ersten angeregten Zustand. Man gebe die zugehörigen Wellenfunktionen in nullter Ordnung in w0 an. 3. Ein Teilchen der Masse m, das sich in der x, y-Ebene bewegen kann, habe den Ha milton-Operator H0 =
P2y P2x 1 + + mω2 (X 2 + Y 2 ) 2m 2m 2
https://doi.org/10.1515/9783110638769-024
•
1214 | Ergänzung HXI
(ein zweidimensionaler harmonischer Oszillator der Frequenz ω). Wir wollen den Ein fluss einer Störung W auf das Teilchen untersuchen, die durch W = λ1 W1 + λ2 W2 gegeben wird, wobei λ1 und λ2 Konstanten sind und für W1 und W2 W1 = mω2 XY W2 = ℏω (
L2z − 2) ℏ2
gelte (L z ist die z-Komponente des Bahndrehimpulses des Teilchens). In der Störungsrechnung betrachte man nur die Korrekturen erster Ordnung zur Energie und nullter Ordnung für die Zustandsvektoren. a) Man gebe ohne Rechnung die Eigenwerte von H0 , ihre Entartungen und die zuge hörigen Eigenvektoren an. Im Folgenden betrachte man nur den zweiten angeregten Zustand von H0 , der dreifach entartet ist und die Energie 3ℏω hat. b) Man berechne die Matrizen, die die Einschränkungen von W1 und W2 auf den Eigenraum des Eigenwerts 3ℏω von H0 darstellen. c) Man nehme λ2 = 0 und λ1 ≪ 1 an. Mit Hilfe der Störungstheorie berechne man den Einfluss des Terms λ1 W1 auf den zweiten angeregten Zustand von H0 . d) Man vergleiche die in c) erhaltenen Ergebnisse mit der beschränkten Entwicklung der exakten Lösung, die sich anhand der in Ergänzung HV beschriebenen Metho de ergibt (Normalmoden von zwei gekoppelten harmonischen Oszillatoren). e) Es sei λ2 ≪ λ1 ≪ 1. Indem man die Ergebnisse von c) als neuen ungestörten Ausgangspunkt ansieht, berechne man den Effekt des Terms λ2 W2 . f) Man nehme nun λ1 = 0 und λ2 ≪ 1 an. Mit Hilfe der Störungstheorie bestimme man den Einfluss des λ2 W2 -Terms auf den zweiten angeregten Zustand von H0 . g) Man vergleiche die in f) erhaltenen Ergebnisse mit der exakten Lösung, die sich in den Diskussionen von Ergänzung DVI findet. h) Schließlich sei λ1 ≪ λ2 ≪ 1. Indem man die Ergebnisse von f) als neuen unge störten Ausgangspunkt ansieht, berechne man den Effekt des Terms λ1 W1 . 4. Man betrachte ein Teilchen P mit der Masse μ, das sich in der x, y-Ebene auf einem Kreis mit dem festen Radius ρ um den Ursprung O bewegen kann (zweidimensionaler Rotator). Die einzige Variable des Systems ist der Winkel α zwischen der x-Achse und der Verbindungslinie OP, und der quantenmechanische Zustand des Teilchens wird durch die Wellenfunktion ψ(α) definiert (das ist die Wahrscheinlichkeitsamplitude, das Teilchen an dem durch den Winkel α bestimmten Punkt des Kreises zu finden). Auf jedem Punkt des Kreises kann ψ(α) nur einen Wert annehmen, also ψ(α + 2π) = ψ(α)
Aufgaben | 1215
•
ψ(α) ist normiert, wenn gilt 2π
∫ |ψ(α)|2 dα = 1 0
a) Man betrachte den Operator M = ℏi ddα . Ist M hermitesch? Man berechne die Ei genwerte und die normierten Eigenfunktionen von M. Welche physikalische Be deutung hat M? b) Die kinetische Energie des Teilchens kann geschrieben werden als H0 =
M2 2μρ 2
Man berechne die Eigenwerte und Eigenfunktionen von H0 . Sind die Energien ent artet? c) Für t = 0 sei die Wellenfunktion des Teilchens N cos2 α (N ist ein Normierungs faktor). Man diskutiere die Aufenthaltswahrscheinlichkeit des Teilchens auf dem Kreis zu einem späteren Zeitpunkt. d) Man nehme an, das Teilchen trage eine Ladung q und wechselwirke mit einem elektrischen Feld ℰ parallel zur x-Achse. Wir müssen also zum Hamilton-Opera tor H0 die Störung W = −qℰρ cos α addieren. Man berechne die neuen Wellenfunktionen des Grundzustands zur ersten Ord nung in ℰ. Man bestimme den Proportionalitätskoeffizienten χ (die lineare Sus zeptibilität) zwischen dem vom Teilchen angenommenen elektrischen Dipol par allel zur x-Achse und dem Feld ℰ. e) Man betrachte im Ethanmolekül CH3 –CH3 die Rotation einer CH3 -Gruppe um die Verbindungsachse der beiden Kohlenstoffatome relativ zur zweiten Gruppe. In erster Näherung ist diese Rotation frei und der in b) eingeführte Hamilton-Ope rator H0 stellt die kinetische Energie der Rotation einer CH3 -Gruppen relativ zur anderen dar (allerdings muss 2μρ 2 durch λI ersetzt werden, wobei I das Trägheits moment der CH3 -Gruppe bezüglich der Drehachse und λ eine Konstante ist). Um der elektrostatischen Wechselwirkung zwischen den beiden CH3 -Gruppen Rech nung zu tragen, addieren wir einen Term der Form W = b cos 3α zu H0 , wobei b eine reelle Konstante ist. Man gebe eine physikalische Begründung für die α-Abhängigkeit von W an. Man berechne die Energie und die Wellenfunktion des neuen Grundzustands (für die Wellenfunktion in erster Ordnung in b und für die Energie in zweiter Ordnung). Man interpretiere das Ergebnis physikalisch.
•
1216 | Ergänzung HXI
5. Man betrachte ein System mit dem Drehimpuls J. Wir beschränken uns in dieser Aufgabe auf einen dreidimensionalen Unterraum, der durch die drei gemeinsamen Eigenzustände | + 1⟩, |0⟩, | − 1⟩ von J2 (Eigenwert 2ℏ2 ) und J z (Eigenwerte +ℏ, 0, −ℏ) aufgespannt wird. Der Hamilton-Operator des Systems ist H0 = aJ z +
b 2 J ℏ z
worin a und b zwei positive Konstanten mit der Dimension von Kreisfrequenzen sind. a) Welche Energieniveaus hat das System? Für welche Werte des Verhältnisses b/a liegt Entartung vor? b) In Richtung u, gegeben durch die Polarwinkel θ und φ, werde ein statisches Ma gnetfeld B0 angelegt. Die Wechselwirkung von B0 mit dem magnetischen Moment des Systems, M = γJ (das gyromagnetische Verhältnis γ sei negativ), wird durch den Hamilton-Opera tor W = ω0 J u beschrieben, worin ω0 = −γ|B0 | die Larmor-Frequenz des Systems im Feld B0 ist und mit J u die Komponente von J in u-Richtung bezeichnet wird, J u = J z cos θ + J x sin θ cos φ + J y sin θ sin φ Man gebe die Matrix an, die W in der Basis der drei Eigenzustände von H0 be schreibt. c) Es sei a = b und u parallel zur x-Achse. Außerdem gelte ω0 ≪ a. Man berechne die Energien in erster Ordnung und die Eigenzustände in nullter Ordnung in ω0 . d) Man nehme b = 2a und wieder ω0 ≪ a an, die Richtung von u aber sei beliebig. Wie lautet die Entwicklung des Grundzustands |ψ0 ⟩ von H0 + W in der Basis {| + 1⟩, |0⟩, | − 1⟩} in erster Ordnung in ω0 ? Man berechne den Erwartungswert ⟨M⟩ des magnetischen Moments M des Sys tems im Zustand |ψ0 ⟩. Sind ⟨M⟩ und B0 parallel? Man zeige, dass sich schreiben lässt ⟨M i ⟩ = ∑ χ ij B j j
mit i, j = x, y, z. Man berechne die Koeffizienten χ ij (die Komponenten des Sus zeptibilitätstensors).
Aufgaben | 1217
•
6. Man betrachte ein System aus einem Elektronspin S und zwei Kernspins I1 und I2 (S ist z. B. der Spin des ungepaarten Elektrons eines paramagnetischen zweiatomigen Moleküls, und I1 und I2 sind die Spins der beiden Kerne). Man nehme an, dass S, I1 , I2 alle den Spin 1/2 haben. Der Zustandsraum des Systems wird durch die acht orthonormalen gemeinsamen Eigenvektoren |ε S , ε1 , ε2 ⟩ von S z , I1z , I2z (Eigenwerte ε S ℏ/2, ε1 ℏ/2 bzw. ε2 ℏ/2 (mit ε S = ±, ε1 = ±, ε2 = ±)) aufgespannt. Der Vektor |+, −, +⟩ gehört also zu den Eigenwerten +ℏ/2 für S z , −ℏ/2 für I1z und +ℏ/2 für I2z . a) Zunächst vernachlässigen wir jegliche Kopplung zwischen den drei Spins. Wir wollen jedoch annehmen, dass sie sich in einem homogenen Magnetfeld B par allel zur z-Achse befinden. Da die gyromagnetischen Verhältnisse von I1 und I2 gleich sind, lässt sich der Hamilton-Operator H0 des Systems schreiben H0 = ΩS z + ωI1z + ωI2z wobei Ω und ω reelle positive Konstanten proportional zu |B| sind. Man nehme Ω > 2ω an. Welche Energien hat das System und wie sind sie entartet? Man zeichne das Ener giediagramm. b) Wir betrachten nun die Kopplung der Spins, indem wir den Hamilton-Operator durch den Term W = aS ⋅ I1 + aS ⋅ I2 erweitern, wobei a eine positive reelle Konstante ist (die direkte Kopplung von I1 und I2 sei vernachlässigbar). Welche Bedingungen müssen ε S , ε1 , ε2 , εS , ε1 , ε2 erfüllen, damit aS ⋅ I1 ein nicht verschwindendes Matrixelement zwischen |ε S , ε1 , ε2 ⟩ und |εS , ε1 , ε2 ⟩ besitzt? Dieselbe Frage beantworte man für aS ⋅ I2 . c) Man nehme aℏ2 ≪ ℏΩ
und
aℏ2 ≪ ℏω
an, so dass W in Bezug auf H0 als Störung angesehen werden kann. Wie lauten die Eigenwerte des Gesamt-Hamilton-Operators H = H0 + W in erster Ordnung in W? Wie heißen die Eigenzustände von H in nullter Ordnung in W? Man zeichne das Energiediagramm. d) Man bestimme in der Näherung der vorherigen Frage die Bohr-Frequenzen, die in der zeitlichen Entwicklung von ⟨S x ⟩ auftreten können, wenn die Kopplung W der Spins mit in Betracht gezogen wird. In einem Experiment zur elektronischen paramagnetischen Resonanz sind die beobachteten Resonanzfrequenzen gleich diesen Bohr-Frequenzen. Welche Form hat das Spektrum, das bei einem System aus drei Spins beobachtet wird? Wie lässt sich die Kopplungskonstante a aus diesem Spektrum bestimmen?
•
1218 | Ergänzung HXI
e) Das magnetische Feld sei gleich null, also Ω = ω = 0. Der Hamilton-Operator reduziert sich dann auf W. α) Es sei I = I1 +I2 der Gesamtkernspin. Man bestimme die Eigenwerte von I2 und ihre Entartungen. Man zeige, dass W keine von null verschiedenen Matrix elemente zwischen Eigenzuständen von I2 zu unterschiedlichen Eigenwerten hat. β) Es sei J = S + I der Gesamtspin. Man bestimme die Eigenwerte von J2 mit ihren Entartungen und die Energieeigenwerte des Systems mit ihren Entartungen. Bildet die Menge {J2 , J z } bzw. {I2 , J2 , J z } einen vollständigen Satz kommutie render Observabler? 7. Man betrachte einen Kern mit dem Spin I = 3/2, dessen Zustandsraum durch die vier gemeinsamen Eigenvektoren |m⟩ (m = +3/2, +1/2, −1/2, −3/2) von I2 (Eigenwert 15ℏ2 /4) und I z (Eigenwert mℏ) aufgespannt wird. Der Kern befinde sich im Koordinatenursprung einem nicht homogenen elektri schen Feld ausgesetzt, das sich aus einem Potential U(x, y, z) ableitet. Die Lage der Koordinatenachsen sei so gewählt, dass im Ursprung ∂2 U ∂2 U ∂2 U = = =0 ∂x∂y ∂y∂z ∂z∂x gelte. Man beachte, dass U die Laplace-Gleichung erfüllt: ∆U = 0 Wir wollen annehmen, dass der Hamilton-Operator der Wechselwirkung zwi schen dem elektrischen Feldgradienten im Ursprung und dem elektrischen Quadru polmoment des Kerns lautet H0 =
qQ 1 (a x I 2x + a y I 2y + a z I 2z ) 2I(2I − 1) ℏ2
wobei q die Elektronladung, Q eine Konstante mit der Dimension einer Fläche und proportional zum Quadrupolmoment des Kerns ist und ax = (
∂2 U ) ∂x2 0
ay = (
∂2 U ) ∂y2 0
az = (
∂2 U ) ∂z2 0
(der Index 0 besagt, dass die Ableitungen am Ursprung gebildet werden). a) Man zeige, dass für symmetrisches U in Bezug auf Drehungen um die z-Achse H0 die Form annimmt H0 = A [3I 2z − I(I + 1)ℏ2 ] worin A eine zu bestimmende Konstante ist. Wie lauten die Eigenwerte von H0 , ihre Entartungen und die zugehörigen Eigenzustände?
Aufgaben | 1219
•
b) Man zeige, dass im allgemeinen Fall H0 geschrieben werden kann als H0 = A [3I 2z − I(I + 1)ℏ2 ] + B (I+2 + I−2 ) wobei A und B Konstanten sind, die in Abhängigkeit von a x und a y auszudrücken sind. Wie lautet die Matrix, die H0 in der {|m⟩}-Basis darstellt? Man zeige, dass sie in 2 × 2-Untermatrizen aufgespalten werden kann. Man bestimme die Eigenwerte von H0 , ihre Entartungen und die zugehörigen Eigenzustände. c) Zusätzlich zu seinem Quadrupolmoment besitzt der Kern ein magnetisches Mo ment M = γI (γ: gyromagnetisches Verhältnis). Dem elektrostatischen Feld werde ein magnetisches Feld B0 mit beliebiger Richtung u überlagert. Wir setzen ω0 = −γ|B0 |. Wie lautet der Term W, um den der Hamilton-Operator erweitert werden muss, um die Kopplung zwischen M und B0 zu beschreiben? Man berechne die Energien des Systems in erster Ordnung in B0 . d) Es sei B0 parallel zur z-Achse und schwach genug, damit die in c) in erster Ord nung in ω0 bestimmten Energien eine gute Näherung darstellen. Welche Bohr-Frequenzen können in der zeitlichen Entwicklung von ⟨I x ⟩ auftreten? Man schließe auf die Form des kernmagnetischen Resonanzspektrums, das sich mit einem im Radiofrequenzbereich in x-Richtung oszillierenden Feld beobachten lässt. 8. Ein Teilchen der Masse m befinde sich in einem unendlich tiefen Potentialtopf der Breite a: {0 für 0 ≤ x ≤ a V(x) = { +∞ sonst { Man nehme an, dieses Teilchen der Ladung −q unterliege einem homogenen elektri schen Feld ℰ, wobei die entsprechende Störung W gegeben wird durch W = qℰ (X −
a ) 2
a) Es seien ε1 und ε2 die Korrekturen erster bzw. zweiter Ordnung in ℰ zur Grund zustandsenergie. Man zeige, dass ε1 gleich null ist. Man gebe den Ausdruck für ε2 in Form einer Reihe an, deren Glieder in Abhängigkeit von q, ℰ, m, a, ℏ zu berechnen sind (die am Ende dieser Aufgabe angegebenen Integrale können benutzt werden). b) Indem man die Reihe für ε2 majorisiert, gebe man eine obere Grenze für ε2 an (s. § B-2-c von Kapitel XI). Ebenso gebe man eine untere Grenze für ε2 an, indem man nur den führenden Term der Reihe betrachtet. Wie genau können wir anhand dieser beiden Grenzen den exakten Wert für die Verschiebung ∆E des Grundzustands in zweiter Ordnung in ℰ eingrenzen?
•
1220 | Ergänzung HXI
c) Wir wollen nun die Verschiebung ∆E mit der Variationsmethode berechnen. Als Vergleichsfunktion wähle man ψ α (x) = √
2 πx a sin ( ) [1 + αqℰ (x − )] a a 2
wobei α der Variationsparameter ist. Man begründe diese Wahl der Vergleichs funktionen. Man berechne die mittlere Energie ⟨H⟩(α) des Grundzustands in zweiter Ordnung in ℰ (wobei man annimmt, dass die Entwicklung von ⟨H⟩(α) bis zur zweiten Ord nung in ℰ ausreichend ist). Man bestimme den optimalen Wert von α. Man berech ne das Ergebnis ∆Evar , das sich aus der Variationsmethode für die Verschiebung in zweiter Ordnung in ℰ ergibt. Durch den Vergleich von ∆Evar mit den Ergebnissen von b) ermittle man die Ge nauigkeit der Variationsrechnung für dieses Beispiel. Wir geben die folgenden Integrale an: a
1 a πx 2nπx 16na 2 ∫ (x − ) sin ( ) sin ( , ) dx = − 2 a 2 a a π (1 − 4n2 )2
n = 1, 2, 3, . . .
0
a
2 a 2 πx a2 1 1 ∫ (x − ) sin2 ( ) dx = ) ( − a 2 a 2 6 π2 0
a
2 a πx πx a ∫ (x − ) sin ( ) cos ( ) dx = − a 2 a a 2π 0
Für alle numerischen Berechnungen verwende man π2 = 9.87. 9. Wir wollen die Grundzustandsenergie des Wasserstoffatoms mit Hilfe der Varia tionsmethode berechnen, indem wir die kugelsymmetrischen Funktionen φ α (r) als Vergleichsfunktionen wählen, deren r-Abhängigkeit gegeben ist durch {C (1 − αr ) für r ≤ a φ α (r) = { φ (r) = 0 für r > a { α C ist eine Normierungskonstante und α der Variationsparameter. a) Man berechne den Erwartungswert der kinetischen und der potentiellen Energie des Elektrons im Zustand |φ α ⟩. Man drücke den Erwartungswert der kinetischen Energie in Abhängigkeit von ∇φ aus, um die „Deltafunktionen“ zu vermeiden, die in ∆φ auftreten (da ∇φ nicht stetig ist). b) Man bestimme den optimalen Wert α 0 von α und vergleiche ihn mit dem Bohr-Ra dius a0 . c) Man vergleiche den Näherungswert, der sich für die Grundzustandsenergie er gibt, mit dem exakten Wert −EI .
Aufgaben | 1221
•
10. Wir wollen die Variationsmethode für die Bestimmung der Energien eines Teil chens der Masse m in einem unendlich tiefen Potentialtopf, {0 für − a ≤ x ≤ a V(x) = { +∞ sonst { verwenden. a) Wir beginnen, indem wir die Wellenfunktion des Grundzustands im Intervall [−a, +a] durch das einfachste gerade Polynom annähern, das bei x = ±a null ist, {a2 − x 2 ψ(x) = { 0 {
für − a ≤ x ≤ a sonst
(eine Familie von Variationsfunktionen, die auf eine einzige Vergleichsfunktion reduziert ist). Man berechne den Erwartungswert des Hamilton-Operators H in diesem Zustand und vergleiche das Ergebnis mit dem exakten Wert. b) Man vergrößere die Familie von Vergleichsfunktionen durch die Wahl eines gera den Polynoms vierter Ordnung, das bei x = ±a null ist: {(a2 − x2 )(a2 − αx2 ) ψ α (x) = { 0 {
für − a ≤ x ≤ a sonst
(eine Familie von Vergleichsfunktionen, abhängig vom reellen Parameter α). α) Man zeige, dass für den Erwartungswert von H im Zustand ψ α (x) die folgende Gleichung gilt: ⟨H⟩(α) =
ℏ2 33α 2 − 42α + 105 2ma2 2α 2 − 12α + 42
β) Man zeige, dass die Werte von α, die ⟨H⟩(α) minimieren oder maximieren, durch die Wurzeln der Gleichung 13α 2 − 98α + 21 = 0 gegeben werden. γ) Man zeige, dass der Wert für die Grundzustandsenergie sehr viel genauer als der in a) erhaltene Wert ist, wenn man in ⟨H⟩(α) eine der Wurzeln dieser Glei chung einsetzt. δ) Welcher andere Eigenwert wird angenähert, wenn man die zweite Wurzel der in β) erhaltenen Gleichung verwendet? Hätte man das erwarten können? Man bestimme die Genauigkeit dieses Werts. c) Man erläutere, warum das einfachste Polynom, das eine Näherung der Wellen funktion des ersten angeregten Zustands erlaubt, x(a2 − x2 ) ist. Welcher Näherungswert ergibt sich dann für die Energie dieses Zustands?
XII Fein- und Hyperfeinstruktur des Wasserstoffatoms A B B-1 B-2 C C-1 C-2 C-3 D D-1 D-2 D-3 E E-1 E-2 E-3 E-4
Einleitung | 1223 Zusätzliche Terme im Hamilton-Operator | 1224 Der Feinstruktur-Hamilton-Operator | 1224 Der Hyperfeinstruktur-Hamilton-Operator | 1229 Feinstruktur des n = 2-Niveaus | 1231 Formulierung des Problems | 1231 Matrix des Feinstruktur-Hamilton-Operators | 1232 Ergebnisse: Feinstruktur des n = 2-Niveaus | 1236 Die Hyperfeinstruktur des n = 1-Niveaus | 1238 Formulierung des Problems | 1238 Matrixdarstellung von W hf im 1s-Niveau | 1239 Die Hyperfeinstruktur des 1s-Niveaus | 1241 Hyperfeinstruktur und Zeeman-Effekt | 1244 Formulierung des Problems | 1244 Zeeman-Effekt im schwachen Feld | 1246 Zeeman-Effekt im starken Feld | 1251 Zeeman-Effekt für mittelstarke Felder | 1254
A Einleitung Die wichtigste in Atomen wirkende Kraft ist die elektrostatische Coulomb-Kraft. Wir trugen ihr in Kapitel VII Rechnung, indem wir zur Beschreibung des Wasserstoffatoms den Hamilton-Operator H0 =
P2 + V(R) 2μ
(A-1)
wählten. Beim ersten Term handelt es sich um die kinetische Energie des Wasserstoff atoms im Ruhesystem des Massenmittelpunkts (μ ist die reduzierte Masse des Sys tems). Der zweite Term V(R) = −
e2 q2 1 =− 4πε0 R R
(A-2)
stellt die elektrostatische Wechselwirkungsenergie zwischen dem Elektron und dem Proton dar (q ist die Elektronenladung). In § C von Kapitel VII haben wir die Eigenzu stände und Eigenwerte von H0 bestimmt. Tatsächlich aber ist der Ausdruck (A-1) nur näherungsweise richtig: Es wurden keine relativistischen Effekte berücksichtigt. Insbesondere wurden die magnetischen Effekte vernachlässigt, die mit dem Elektronenspin zusammenhängen. Außerdem ha ben wir keinen Protonenspin mit den entsprechenden magnetischen Wechselwirkun gen eingeführt. In der Praxis ist der dadurch gemachte Fehler sehr klein, da es sich https://doi.org/10.1515/9783110638769-025
1224 | XII Fein- und Hyperfeinstruktur des Wasserstoffatoms
beim Wasserstoffatom um ein schwach relativistisches System handelt [wir erinnern uns, dass im Bohrschen Modell die Geschwindigkeit v der ersten Bahn (n = 1) die Be ziehung v/c = e2 /ℏc = 1/137 ≪ 1 erfüllt]. Außerdem ist das magnetische Moment des Protons sehr klein. Die große Genauigkeit spektroskopischer Experimente macht es trotzdem mög lich, Effekte zu beobachten, die sich mit dem Hamilton-Operator (A-1) nicht erklären lassen. Wir wollen daher die soeben angesprochenen Korrekturen berücksichtigen, indem wir den vollständigen Hamilton-Operator des Wasserstoffatoms in der Form H = H0 + W
(A-3)
schreiben, wobei H0 durch Gl. (A-1) gegeben wird und W alle Terme enthält, die bisher vernachlässigt wurden. Da W sehr viel kleiner als H0 ist, lassen sich die Effekte dieses Terms mit Hilfe der in Kapitel XI entwickelten Störungstheorie berechnen. Darum soll es in diesem Kapitel gehen. Wir wollen zeigen, dass W sowohl für eine „Feinstruktur“ als auch für eine „Hyperfeinstruktur“ der verschiedenen in Kapitel VII berechneten Energieniveaus verantwortlich ist. Diese Strukturen können experimentell mit großer Genauigkeit gemessen werden (die Hyperfeinstruktur des 1s-Grundzustands des Was serstoffatoms ist zur Zeit die physikalische Größe, die mit der größten Zahl von Stel len bekannt ist). Außerdem wollen wir in diesem Kapitel und seinen Ergänzungen den Einfluss eines äußeren statischen magnetischen oder elektrischen Felds auf die Ener gieniveaus des Wasserstoffatoms untersuchen (Zeeman- und Stark-Effekt). Wir verfolgen zwei Ziele: Zum einen wollen wir an einem konkreten und realisti schen Fall die allgemeine stationäre Störungstheorie aus dem vorangegangenen Kapi tel illustrieren, zum anderen werden bei der Untersuchung des Wasserstoffatoms be stimmte, für die Atomphysik fundamentale Konzepte herausgearbeitet. Zum Beispiel ist § B einer eingehenden Diskussion verschiedener relativistischer und magnetischer Korrekturen gewidmet. Dieses Kapitel bildet somit einen wichtigen Beitrag zum bes seren Verständnis der Physik der Atome, ohne dass jedoch seine Lektüre für das Ver ständnis der nachfolgenden beiden Kapitel unbedingt notwendig wäre.
B Zusätzliche Terme im Hamilton-Operator B-1 Der Feinstruktur-Hamilton-Operator B-1-a Die Dirac-Gleichung im schwach relativistischen Grenzfall Wir erwähnten in Kapitel IX, dass der Spin in natürlicher Weise auftritt, wenn man eine Gleichung für das Elektron aufzustellen versucht, die gleichzeitig den speziellrelativistischen wie den quantenmechanischen Postulaten gerecht wird. Eine solche Gleichung gibt es: Es ist die Dirac-Gleichung, mit der zahlreiche Phänomene (unter anderem der Spin des Elektrons, die Feinstruktur des Wasserstoffspektrums oder die Existenz des Positrons) beschrieben werden können.
B Zusätzliche Terme im Hamilton-Operator
| 1225
In voller Strenge erhält man den Ausdruck für die relativistischen Korrekturen [die im Term W von Gl. (A-3) auftreten], wenn man die Dirac-Gleichung für ein Elektron nie derschreibt, das sich im Coulomb-Feld eines (als unendlich schwer und bewegungslos im Koordinatenursprung angenommenen) Protons bewegt, und dann zum schwach relativistischen Grenzfall übergeht. Dabei ergibt sich, dass die Beschreibung des Elek tronenzustands durch einen zweikomponentigen Spinor erfolgen muss (s. Kap. IX, § C-1), während der Hamilton-Operator die Form (A-3) mit einem Term W annimmt, der als Potenzreihe in v/c vollständig bestimmt werden kann. Beides überschreitet die Grenzen dieser Darstellung. Wir beschränken uns allein darauf, die ersten Glieder der Entwicklung von W anzugeben und sie physikalisch zu interpretieren: Sie lauten H = me c2 +
P2 P4 1 1 dV(R) ℏ2 L ⋅ S+ + V(R) − + ∆V(R) + . . . 3 2 2me ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ 2me c2 R dR 8m2e c2 8me c2 ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ H0
W mv
W SB
WD
(B-1) Wir finden mit dem ersten Term die Ruheenergie me c2 des Elektrons und mit dem zweiten und dritten Term den nichtrelativistischen Hamilton-Operator H0 wieder.¹ Die anderen Terme werden Feinstrukturterme genannt. Bemerkung: Es ist möglich, die Dirac-Gleichung für ein Elektron in einem Coulomb-Potential exakt zu lösen. Man erhält dann die Energieniveaus des Wasserstoffatoms, ohne eine (konvergierende) Entwick lung der Eigenfunktionen und Eigenwerte von H nach Potenzen von v/c bestimmen zu müssen. Vom Standpunkt der Störungstheorie aus können wir die Form und die physikalische Bedeutung der verschiedenen in einem Atom existierenden Wechselwirkungen gut verstehen. Das wird uns später die Verallgemeinerung auf Vielelektronenatome ermöglichen (für die man kein Äquivalent zur Dirac-Gleichung angeben kann).
B-1-b Interpretation der Feinstrukturterme α Geschwindigkeitsabhängigkeit der Masse (W mv -Term) 1. Der physikalische Ursprung Der physikalische Ursprung des W mv -Terms ist sehr einfach. Wir entwickeln den re lativistischen Ausdruck für die Energie eines klassischen Teilchens mit der Ruhemas se me und dem Impuls p, E = c√p2 + m2e c2
(B-2)
1 Den Ausdruck (B-1) findet man unter der Annahme eines unendlich schweren Protons. Deshalb tritt die Masse m e des Elektrons und nicht wie in Gl. (A-1) die reduzierte Masse μ auf. Soweit es H 0 betrifft, wird der Einfluss der endlichen Masse des Protons durch Ersetzen von m e durch μ kompensiert. Dage gen wollen wir diesen Effekt für die weiteren Terme von H, bei denen es sich bereits um Korrekturen handelt, vernachlässigen. Er wäre außerdem schwierig zu berechnen, da die relativistische Beschrei bung eines Systems zweier wechselwirkender Teilchen ernsthafte Probleme aufweist [so genügt es für die weiteren Terme von Gl. (B-1) nicht, einfach m e durch μ zu ersetzen].
1226 | XII Fein- und Hyperfeinstruktur des Wasserstoffatoms nach Potenzen von |p|/me c und erhalten E = me c2 +
p2 p4 − +... 2me 8m3e c2
(B-3)
Zusätzlich zur Ruheenergie (me c2 ) und zur nichtrelativistischen kinetischen Energie (p2 /2me ) erhält man den in Gl. (B-1) angegebenen Term −p4 /8m3e c2 . Er stellt die ers te Korrektur der Energie dar, die wegen der Geschwindigkeitsabhängigkeit der Masse berücksichtigt werden muss. 2. Größenordnung Um die Größe dieser Korrektur zu ermitteln, berechnen wir die Größenordnung des Verhältnisses W mv /H0 : W mv p4 /8m3e c2 p2 1 v 2 1 2 2 ( ) ) ≈ = = ≈ α ≈ ( H0 137 p2 /2me 4m2e c2 4 c
(B-4)
da, wie bereits erwähnt, für das Wasserstoffatom v/c ≈ α gilt. Mit H0 ≈ 10 eV erhalten wir W mv ≈ 10−3 eV. β Spin-Bahn-Kopplung (WSB -Term) 1. Der physikalische Ursprung Das Elektron bewegt sich mit einer Geschwindigkeit v = p/me in dem vom Proton er zeugten elektrostatischen Feld E. Aus der speziellen Relativitätstheorie folgt dann das Auftreten eines magnetischen Felds B im Ruhesystem des Elektrons, das zur ersten Ordnung in v/c gegeben wird durch B = −
1 v×E c2
(B-5)
Da das Elektron ein inneres magnetisches Moment M S = qS/me besitzt, wechselwirkt es mit diesem Feld B . Die zugehörige Energie kann in der Form W = −M S ⋅ B
(B-6)
geschrieben werden. Das elektrostatische Feld E, das in Gl. (B-5) auftritt, ist gleich r 2 − 1q d V(r) d r r , wobei V(r) = −e /r die elektrostatische Energie des Elektrons ist. Damit erhalten wir B = −
1 1 dV(r) p ×r qc2 r dr me
(B-7)
Für den entsprechenden quantenmechanischen Operator haben wir P × R = −L
(B-8)
so dass wir schließlich erhalten W =
1 1 dV(R) e2 1 L⋅S L ⋅ S = m2e c2 R dR m2e c2 R3
(B-9)
B Zusätzliche Terme im Hamilton-Operator
|
1227
Bis auf den Faktor 1/2 finden wir somit den Spin-Bahn-Term WSB aus Gl. (B-1) wieder.² Dieser Term beschreibt die Wechselwirkung des magnetischen Moments des Elektron spins mit dem durch die Elektronenbewegung im elektrostatischen Feld des Protons „gesehenen“ magnetischen Feld. 2. Größenordnung Da L und S von der Größenordnung ℏ sind, haben wir WSB ≈
e2 ℏ2 m2e c2 R3
(B-10)
Vergleichen wir also WSB mit H0 , das von der Größenordnung e2 /R ist: WSB e2 ℏ2 /m2e c2 R3 ℏ2 ≈ = 2 2 H0 e /R m e c2 R2
(B-11)
R ist von der Größe des Bohr-Radius a0 = ℏ2 /me e2 . Also wird WSB e4 1 2 ≈ 2 2 = α2 = ( ) H0 137 ℏ c
(B-12)
γ Darwin-Term WD 1. Der physikalische Ursprung In der Dirac-Gleichung ist die Wechselwirkung zwischen dem Elektron und dem Coulomb-Feld des Kerns lokal; sie hängt nur vom Wert des Felds am Ort des Elek trons r ab. Die nichtrelativistische Näherung (das Abbrechen der Reihenentwicklung in v/c) führt jedoch für den zweikomponentigen Spinor, der den Elektronenzustand beschreibt, auf eine Gleichung, in der die Wechselwirkung zwischen dem Elektron und dem Feld nicht mehr lokal ist. Das Elektron wird darum auch von den Werten des Feldes in einer Umgebung um r beeinflusst, deren Ausdehnung von der Größe der Compton-Wellenlänge ℏ/me c des Elektrons ist. Das ist der Ursprung der durch den Darwin-Term beschriebenen Korrektur. Zum genaueren Verständnis nehmen wir an, dass die potentielle Energie des Elek trons anstatt durch V(r) durch einen Ausdruck der Form ∫ d3 ρ f(ρ)V(r + ρ)
(B-13)
gegeben ist; f(ρ) ist eine Funktion, deren Integral gleich eins ist, die nur von |ρ| ab hängt und nur in einem Volumen der Größenordnung (ℏ/me c)3 um ρ = 0 merklich von null verschieden ist. Wenn wir die Änderung von V(r) auf Entfernungen der Größe ℏ/me c vernachläs sigen, können wir im Ausdruck (B-13) V(r + ρ) durch V(r) ersetzen und V(r) vor das Integral ziehen. Der Term (B-13) reduziert sich in diesem Fall auf V(r). 2 Man kann zeigen, dass der Faktor 1/2 sich daraus ergibt, dass die Bewegung des Elektrons um das Proton nicht geradlinig erfolgt. Der Elektronspin rotiert daher in Bezug auf das Laborsystem (ThomasPräzession).
1228 | XII Fein- und Hyperfeinstruktur des Wasserstoffatoms
Eine bessere Näherung besteht darin, in (B-13) V(r+ρ) durch seine Taylor-Entwick lung in der Nähe von ρ = 0 zu ersetzen. Der Term nullter Ordnung ist gleich V(r). Der Term erster Ordnung verschwindet aufgrund der Kugelsymmetrie von f(ρ). Der Term zweiter Ordnung enthält die zweiten Ableitungen des Potentials V(r) am Punkt r und quadratische Funktionen der Komponenten von ρ, gewichtet mit f(ρ) und integriert über d3 ρ. Das führt auf ein Ergebnis von der Größenordnung (ℏ/me c)2 ∆V(r) Man erkennt, dass dieser Term zweiter Ordnung der Darwin-Term ist. 2. Größenordnung Indem wir V(R) durch −e2 /R ersetzen, können wir den Darwin-Term in der Form −e2
ℏ2 1 πe2 ℏ2 ∆( ) = δ(R) 2 2 R 8me c 2m2e c2
(B-14)
schreiben [dabei haben wir den Ausdruck für den Laplace-Operator von 1/R verwen det, s. Gl. (61) aus Anhang II]. Bilden wir nun den Erwartungswert vom Ausdruck (B-14) in einem atomaren Zu stand, so finden wir den Beitrag πe2 ℏ2 |ψ(0)|2 2m2e c2 wobei ψ(0) den Wert der Wellenfunktion im Ursprung bezeichnet. Der Darwin-Term wirkt sich daher nur auf s-Elektronen aus, da dies die einzigen sind, für die ψ(0) ≠ 0 gilt (s. Kap. VII, § C-4-c). Die Größenordnung von |ψ(0)|2 lässt sich ermitteln, wenn wir fordern, dass das Integral des Betragsquadrats der Wellenfunktion über ein Volumen von der Größe a30 (a0 ist der Bohr-Radius) gleich eins ist. So ergibt sich |ψ(0)|2 ≈
1 a30
=
m3e e6 ℏ6
(B-15)
woraus wir auf die Größenordnung des Darwin-Terms schließen können: WD ≈
8 πe2 ℏ2 2 2 e |ψ(0)| ≈ m c = me c2 α4 e ℏ4 c4 2m2e c2
(B-16)
Da H0 ≈ me c2 α 2 gilt, erhalten wir wiederum WD 1 2 ≈ α2 = ( ) H0 137
(B-17)
Somit sind alle Feinstrukturterme etwa 104 -mal kleiner als der nichtrelativisti sche Hamilton-Operator in Kapitel VII.
B Zusätzliche Terme im Hamilton-Operator
| 1229
B-2 Der Hyperfeinstruktur-Hamilton-Operator B-2-a Spin und magnetisches Moment des Protons Bisher haben wir das Proton physikalisch als einen Massenpunkt mit der Masse Mp aufgefasst, der eine Ladung qp = −q trägt. Tatsächlich aber ist das Proton wie das Elektron ein Spin-1/2-Teilchen; die entsprechende Spinobservable wollen wir mit I bezeichnen. Zum Spin I des Protons gehört ein magnetisches Moment MI . Das gyromagneti sche Verhältnis unterscheidet sich allerdings von dem des Elektrons: M I = gp μ n I/ℏ
(B-18)
wobei μn das Kernmagneton, μn =
qp ℏ 2Mp
(B-19)
und gp ≈ 5.585 ist. Da die Protonenmasse Mp im Nenner der rechten Seite von (B-19) auftritt, ist μn etwa 2000-mal kleiner als das Bohr-Magneton μB (μB = qℏ/2me ). Ob wohl also Protonen- und Elektronendrehimpuls gleich sind, ist wegen des Massenun terschieds der Kernmagnetismus viel unbedeutender als der elektronische Magnetis mus. Die magnetische Wechselwirkung aufgrund des Protonenspins I ist demzufolge sehr gering. B-2-b Der magnetische Hyperfeinstruktur-Hamilton-Operator Das Elektron bewegt sich also nicht nur im elektrostatischen Feld des Protons, son dern auch in dem magnetischen Feld, das durch M I hervorgerufen wird. Führen wir in der Schrödinger-Gleichung das entsprechende Vektorpotential ein,³ so ergibt sich, dass wir dem Hamilton-Operator (B-1) mit dem Ausdruck Whf = −
q μ0 1 L ⋅ M I + 3 [3(M S ⋅ n)(M I ⋅ n) − M S ⋅ M I ] { 3 4π me R R 8π + M S ⋅ M I δ(R)} 3
(B-20)
weitere Terme hinzufügen müssen (s. Ergänzung AXII ); M S ist das magnetische Mo ment des Elektronspins und n der Einheitsvektor auf der Verbindungslinie von Proton und Elektron (s. Abb. 1). Wir werden sehen, dass Whf Energieverschiebungen hervorruft, die klein sind ver glichen mit denen, die Wf erzeugt. Aus diesem Grund wird Whf als HyperfeinstrukturHamilton-Operator bezeichnet.
3 Da es sich bei den Hyperfeinstruktur-Wechselwirkungen um sehr kleine Korrekturen handelt, darf man die nichtrelativistische Schrödinger-Gleichung verwenden.
1230 | XII Fein- und Hyperfeinstruktur des Wasserstoffatoms
Abb. 1: Relative Lage der magnetischen Momente MI und MS von Proton und Elektron; n ist der Ein heitsvektor auf der Verbindungslinie der beiden Teilchen.
B-2-c Interpretation der verschiedenen Terme von Whf Der erste Term von Whf beschreibt die Wechselwirkung des magnetischen Moments des Kerns M I mit dem am Ort des Protons durch die Rotation der Elektronenladung erzeugten Magnetfeld (μ 0 /4π)qL/me r3 . Der zweite Term stellt die Dipol-Dipol-Wechselwirkung zwischen den magneti schen Momenten von Elektron und Kern dar: Die Wechselwirkung des magnetischen Moments des Elektronspins mit dem von M I erzeugten Magnetfeld (s. Ergänzung BXI ) und umgekehrt. Der letzte Term schließlich, der auch als Kontaktterm bezeichnet wird, stammt von der Singularität des vom magnetischen Moment des Protons erzeugten Felds bei r = 0. In der Realität ist das Proton kein Punkt; es kann gezeigt werden (s. Ergänzung AXII ), dass das magnetische Feld innerhalb des Protons nicht dieselbe Form wie das außer halb von M I erzeugte hat (das in der Dipol-Dipol-Wechselwirkung betrachtet wird). Durch den Kontaktterm wird die Wechselwirkung des magnetischen Moments des Elektronspins mit dem Magnetfeld innerhalb des Protons beschrieben (die δ-Funk tion drückt die Tatsache aus, dass dieser Kontaktterm, wie sein Name andeutet, nur dann auftritt, wenn die Wellenfunktionen des Elektrons und des Protons überlappen). B-2-d Größenordnung Es kann leicht gezeigt werden, dass die Größenordnung der ersten beiden Terme von Whf durch q2 ℏ2 μ 0 e2 ℏ2 1 = me Mp R3 4π me Mp c2 R3
(B-21)
gegeben wird. Mit Hilfe von Gl. (B-10) sehen wir, dass diese Terme etwa 2000-mal klei ner als WSB sind. Gleiches gilt für den letzten Term von Gl. (B-20); er ist 2000-mal kleiner als der Darwin-Term, der auch eine Deltafunktion enthält.
C Feinstruktur des n = 2-Niveaus
| 1231
C Feinstruktur des n = 2-Niveaus C-1 Formulierung des Problems C-1-a Entartung des n = 2-Niveaus Wir stellten in Kapitel VII fest, dass die Energie des Wasserstoffatoms nur von der Quantenzahl n abhängt. Die 2s(n = 2, l = 0)- und 2p(n = 2, l = 1)-Zustände haben also dieselbe Energie −
EI 1 = − μc2 α 2 4 8
Solange der Spin unberücksichtigt bleibt, besteht die 2s-Unterschale aus einem Zu stand und die 2p-Unterschale aus drei verschiedenen Zuständen, die sich durch ih ren Eigenwert m L ℏ der Komponente L z des Bahndrehimpulses L unterscheiden (m L = +1, 0, −1). Aufgrund der Existenz von Elektronen- und Protonenspin ist die Entartung des n = 2-Niveaus größer als in Kapitel VII berechnet. Die Komponenten S z und I z der beiden Spins können je zwei Werte annehmen: m S = ±1/2, m I = ±1/2. Eine mögliche Basis im n = 2-Niveau lautet dann {|n = 2; l = 0; m L = 0; m S = ±1/2; m I = ±1/2⟩} (2s-Unterschale, Dimension 4) {|n = 2; l = 1; m L = −1, 0, +1; m S = ±1/2; m I = ±1/2⟩} (2p-Unterschale, Dimension 12)
(C-1)
(C-2)
Die Gesamtentartung der n = 2-Schale beträgt somit 16. Nach den Ergebnissen aus Kapitel XI (§ C) müssen wir, um den Einfluss einer Stö rung W auf das n = 2-Niveau zu berechnen, die 16 × 16-Matrix diagonalisieren, die die Einschränkung von W auf dieses Niveau beschreibt. Die Eigenwerte dieser Matrix sind die Korrekturen erster Ordnung zur Energie, während die entsprechenden Eigen zustände die Eigenzustände des Hamilton-Operators in nullter Ordnung darstellen. C-1-b Störglied In diesem Abschnitt wollen wir davon ausgehen, dass das Atom keinem äußeren Feld unterliegt. Die Differenz W zwischen dem exakten Hamilton-Operator H und dem Ha milton-Operator H0 aus § C von Kapitel VII enthält die Feinstrukturterme aus § B-1, Wf = W mv + WSB + WD
(C-3)
und die Hyperfeinstrukturterme Whf aus § B-2. Wir haben also W = Wf + Whf
(C-4)
Da Wf etwa 2000-mal größer als Whf ist, haben wir natürlich zunächst den Effekt von Wf auf das n = 2-Niveau zu untersuchen, bevor wir Whf betrachten können. Wir wer
1232 | XII Fein- und Hyperfeinstruktur des Wasserstoffatoms den sehen, dass die n = 16-fache Entartung dieses Niveaus von Wf teilweise aufgeho ben wird. Die sich dadurch ergebende Struktur ist die Feinstruktur. Der Term Whf kann dann die verbleibende Entartung dieser Feinstrukturniveaus aufheben und so innerhalb dieser Niveaus eine Hyperfeinstruktur erzeugen. In diesem Abschnitt wollen wir uns auf die Untersuchung der Feinstruktur des n = 2-Niveaus beschränken. Die Rechnungen lassen sich leicht auf andere Niveaus verallgemeinern.
C-2 Matrix des Feinstruktur-Hamilton-Operators C-2-a Allgemeine Eigenschaften Wir werden anhand der Eigenschaften von Wf zeigen, dass sich die 16 × 16-Matrix, durch die Wf im n = 2-Niveau dargestellt wird, in eine Reihe quadratischer Unterma trizen kleinerer Dimension aufspalten lässt. Die Bestimmung der Eigenwerte und Ei genvektoren dieser Matrix wird dadurch beträchtlich vereinfacht. α Wf wirkt nicht auf die Spinvariablen des Protons Wie wir aus Gl. (B-1) ablesen können, hängen die Feinstrukturterme nicht von I ab. Folglich kann der Protonenspin bei der Untersuchung der Feinstruktur ignoriert wer den (wir werden später die sich ergebenden Entartungen mit 2 multiplizieren). Die Dimension der zu diagonalisierenden Matrix reduziert sich so von 16 auf 8. β Wf verbindet die 2s- und 2p-Unterschale nicht miteinander Wir zeigen zunächst, dass L2 mit Wf vertauscht: Der Operator L2 vertauscht mit den verschiedenen Komponenten von L, mit R (L2 wirkt nur auf die Winkelvariablen), mit P2 [s. Gl. (A-16) aus Kapitel VII] und mit S (L2 wirkt nicht auf die Spinvariablen). Somit vertauscht L2 mit W mv (proportional zu P4 ), mit WSB (hängt nur von R, L, S ab) und mit WD (hängt nur von R ab). Die 2s- und 2p-Zustände sind Eigenzustände von L2 zu verschiedenen Eigenwer ten (0 und 2ℏ2 ). Deshalb besitzt der Operator Wf , der mit L2 vertauscht, keine nichttri vialen Matrixelemente zwischen einem 2s- und einem 2p-Zustand. Die 8 × 8-Matrix, die Wf im n = 2-Niveau darstellt, kann also in eine 2 × 2-Matrix für den 2s-Zustand und eine 6 × 6-Matrix für den 2p-Zustand unterteilt werden: 2s 2s (Wf ) n=2 =
.. ..
2p ..
.
..
.
.
0
. ..
2p
0
.. ..
. . .
.. .. ..
. . .
.. .. ..
. . .
C Feinstruktur des n = 2-Niveaus |
1233
Bemerkung: Die vorstehende Eigenschaft ergibt sich auch aus der Tatsache, dass Wf gerade ist. Bei einer Spiegelung geht R in −R über (R = |R| bleibt gleich), P in −P, L in L und S in S. Nun zeigt man leicht, dass Wf invariant ist und somit keine Matrixelemente zwischen den 2s- und 2p-Zuständen haben kann, die von entgegengesetzter Parität sind (s. Ergänzung FII ).
C-2-b Matrixdarstellung von Wf in der 2s-Unterschale Die Dimension 2 des 2s-Unterraums resultiert aus den zwei möglichen Werten mS = ±1/2 von S z (im Moment unterdrücken wir I z ). Die Terme W mv und WD hängen nicht von S ab. Die Matrizen dieser beiden Ope ratoren im 2s-Unterraum sind daher Vielfache der Einheitsmatrix, wobei die Propor tionalitätskoeffizienten durch die reinen Bahnmatrixelemente ⟨n = 2; l = 0; m L = 0 | −
P4 8m3e c2
| n = 2; l = 0; m L = 0⟩
bzw. ⟨n = 2; l = 0; m L = 0 |
ℏ2 ∆V(R) | n = 2; l = 0; m L = 0⟩ 8m2e c2
gegeben werden. Da wir die Eigenfunktionen von H0 kennen, stellt die Berechnung dieser Matrixelemente theoretisch keine Schwierigkeit dar. Es ergibt sich (s. Ergän zung BXII ) ⟨W mv ⟩2s = − ⟨WD ⟩2s =
13 me c2 α4 128
1 me c2 α4 16
(C-5) (C-6)
Die Berechnung des Matrixelements von WSB enthält „Winkel“-Matrixelemente von der Form ⟨l = 0, m L = 0|L x,y,z |l = 0, m L = 0⟩, die wegen des Wertes l = 0 der Quantenzahl l verschwinden; daher wird ⟨WSB ⟩2s = 0
(C-7)
Unter dem Einfluss der Feinstrukturterme wird also die 2s-Unterschale als Ganzes um den Betrag −5me c2 α 4 /128 gegen den in Kapitel VII berechneten Wert verschoben. C-2-c Matrixdarstellung von Wf in der 2p-Unterschale α W mv - und WD -Term Der W mv - und der WD -Term vertauschen mit den verschiedenen Komponenten von L, da L nur auf die Winkelvariablen wirkt und mit R und P2 (das nur über L2 von die sen Variablen abhängt; s. Kapitel VII) vertauscht. Also vertauscht L mit W mv und WD .
1234 | XII Fein- und Hyperfeinstruktur des Wasserstoffatoms
Folglich handelt es sich bei W mv und WD in Bezug auf die Bahnvariablen um skala re Operatoren (s. Ergänzung BVI , § 5-b). Da W mv und WD nicht auf die Spinvariablen wirken, sind die Matrizen, die W mv und WD im 2p-Unterraum darstellen, Vielfache der Einheitsmatrix. Die Berechnung der Proportionalitätskoeffizienten ist in Ergän zung BXII angegeben und führt auf ⟨W mv ⟩2p = −
7 me c2 α4 384
⟨WD ⟩2p = 0
(C-8) (C-9)
Die zweite Gleichung folgt daraus, dass WD proportional zu δ(R) ist und daher nur in s-Zuständen nichtverschwindende Matrixelemente haben kann (für l ≥ 1 ist die Wellenfunktion im Ursprung gleich null). β WSB -Term Wir müssen die Matrixelemente ⟨n = 2; l = 1; s = 1/2; mL ; mS | ξ(R)L ⋅ S | n = 2; l = 1; s = 1/2; m L ; m S ⟩
(C-10)
mit ξ(R) =
1 e2 2 2 R3 2me c
(C-11)
berechnen. Wenn wir die {|r⟩}-Darstellung verwenden, können wir den Radialanteil des Ma trixelements (C-10) von den Winkel- und Spinanteilen trennen. So erhalten wir ξ2p ⟨l = 1; s = 1/2; mL ; mS | L ⋅ S | l = 1; s = 1/2; m L ; m S ⟩
(C-12)
wobei ξ2p eine Zahl gleich dem Radialintegral ∞
ξ2p =
1 e2 |R21 (r)|2 r2 dr ∫ 2m2e c2 r3
(C-13)
0
ist. Da wir die Radialfunktion R21 (r) des 2p-Zustands kennen, können wir ξ2p berech nen. Wir finden (s. Ergänzung BXII ) ξ2p =
1 me c2 α4 48ℏ2
(C-14)
Die Radialvariablen treten also nicht mehr auf. Mit dem Ausdruck (C-12) ist das Problem auf die Diagonalisierung des Operators ξ2p L ⋅ S reduziert, der nur auf die Winkel- und Spinvariablen wirkt. Zu seiner Darstellung können verschiedene Basen gewählt werden:
C Feinstruktur des n = 2-Niveaus |
–
zunächst die Basis {|l = 1; s = 1/2; m L ; m S ⟩}
–
1235
(C-15)
die wir bisher benutzt haben und die aus den gemeinsamen Eigenzuständen von L2 , S2 , L z , S z besteht; oder mit dem Gesamtdrehimpuls J=L+S
(C-16)
die aus den gemeinsamen Eigenzuständen von L2 , S2 , J2 , J z bestehende Basis {|l = 1; s = 1/2; J; m J ⟩}
(C-17)
Nach den Ergebnissen von Kapitel X kann J wegen l = 1 und s = 1/2 zwei Werte annehmen: J = 1 + 1/2 = 3/2 und J = 1 − 1/2 = 1/2. Außerdem wissen wir, wie wir mit Hilfe der Clebsch-Gordan-Koeffizienten von einer Basis zur anderen gelangen können [s. Gleichungen (36) aus Ergänzung AX ]. Wir wollen nun zeigen, dass die zweite Basis (C-17) dem Problem besser angepasst ist, da der Operator ξ2p L⋅S in dieser Basis diagonal ist. Um das einzusehen, quadrieren wir beide Seiten von Gl. (C-16). Wir erhalten (L und S vertauschen) J2 = (L + S)2 = L2 + S2 + 2L ⋅ S
(C-18)
und damit ξ2p L ⋅ S =
1 ξ2p (J2 − L2 − S2 ) 2
(C-19)
Jeder Basisvektor (C-17) ist ein Eigenzustand von L2 , S2 , J2 ; somit ergibt sich ξ2p L ⋅ S |l = 1; s = 1/2; J; m J ⟩ 3 1 = ξ2p ℏ2 [J(J + 1) − 2 − ] |l = 1; s = 1/2; J; m J ⟩ 2 4
(C-20)
Wie wir aus Gl. (C-20) sehen, hängen die Eigenwerte von ξ2p L ⋅ S nur von J und nicht von m J ab; sie lauten für J = 1/2 3 3 1 1 ξ2p [ − 2 − ] ℏ2 = −ξ2p ℏ2 = − me c2 α4 2 4 4 48
(C-21)
und für J = 3/2 15 1 1 3 1 ξ2p [ − 2 − ] ℏ2 = + ξ2p ℏ2 = me c2 α4 2 4 4 2 96
(C-22)
Die sechsfache Entartung des 2p-Niveaus wird also von WSB teilweise aufgeho ben. Wir erhalten für J = 3/2 ein vierfach entartetes und für J = 1/2 ein zweifach ent
1236 | XII Fein- und Hyperfeinstruktur des Wasserstoffatoms artetes Niveau. Bei der (2J + 1)-fachen Entartung eines J-Zustands handelt es sich um eine wesentliche Entartung, die mit der Rotationsinvarianz von Wf zusammenhängt. Bemerkungen: 1. In dem 2s-Unterraum (l = 0, s = 1/2) kann J nur einen Wert annehmen: J = 0 + 1/2 = 1/2. 2. In dem 2p-Unterraum werden W mv und WD von Vielfachen der Einheitsmatrix dargestellt. Die se Eigenschaft bleibt in jeder beliebigen Basis erhalten, da die Einheitsmatrix gegenüber einem Basiswechsel invariant ist. Die Wahl der Basis (C-17), die aufgrund von WSB erfolgte, ist also auch für den W mv - und WD -Term angemessen.
C-3 Ergebnisse: Feinstruktur des n = 2-Niveaus C-3-a Spektroskopische Notation Neben den Quantenzahlen n, l (und s) wurde in der vorstehenden Diskussion die Quantenzahl J eingeführt, von der die Energiekorrektur des Spin-Bahn-Terms ab hängt. Für das 2s-Niveau haben wir J = 1/2, für das 2p-Niveau J = 1/2 oder J = 3/2. Das Niveau, das zu einem Satz von Werten n, l, J gehört, wird im Allgemeinen durch Hin zufügung eines Index J an das Symbol der (n, l)-Unterschale in der spektroskopischen Notation bezeichnet (s. Kap. VII, § C-4-b): n lJ
(C-23)
wobei l bei l = 0 für den Buchstaben s, bei l = 1 für p, bei l = 2 für d, bei l = 3 für f usw. steht. Zum n = 2-Niveau des Wasserstoffatoms gehören also die Niveaus 2s1/2 , 2p1/2 und 2p3/2 . C-3-b Lage der 2s1/2 -, 2p1/2 - und 2p3/2 -Niveaus Mit Hilfe der Ergebnisse der vorhergehenden Abschnitte können wir nun die Lage der 2s1/2 -, 2p1/2 - und 2p3/2 -Niveaus in Bezug auf die in Kapitel VII zu −μc2 α 2 /8 bestimm te „ungestörte“ Energie des n = 2-Niveaus berechnen. Wie wir in § C-2 sahen, wird das 2s1/2 -Niveau um den Betrag −
5 me c2 α4 128
(C-24)
abgesenkt. Auch das 2p1/2 -Niveau wird um (−
5 1 7 − ) me c2 α4 = − me c2 α4 384 48 128
(C-25)
erniedrigt. Das 2s1/2 - und 2p1/2 -Niveau haben also dieselbe Energie. In der hier vorge stellten Theorie muss diese Entartung im Gegensatz zur wesentlichen (2J + 1)-fachen Entartung jedes J-Niveaus als zufällig betrachtet werden.
C Feinstruktur des n = 2-Niveaus
| 1237
Das 2p3/2 -Niveau schließlich wird um den Betrag von (−
1 1 7 + ) me c2 α4 = − me c2 α4 384 96 128
(C-26)
abgesenkt. Diese Ergebnisse sind in Abb. 2 dargestellt. Bemerkungen: 1. Für die Trennung des 2p1/2 - und 2p3/2 -Niveaus ist ausschließlich die Spin-Bahn-Kopplung verantwortlich, da W mv und WD das 2p-Niveau als Ganzes um denselben Betrag verschieben. 2. Das Wasserstoffatom kann aus dem 2p-Zustand durch Aussendung eines Lyman-α-Photons (λ = 1216 Å) in den 1s-Zustand übergehen. Wie wir nun sehen, besteht die Lyman-α-Linie auf grund der Spin-Bahn-Kopplung tatsächlich aus zwei benachbarten Linien, 2p1/2 → 1s1/2 und 2p3/2 → 1s1/2 , die durch die Energiedifferenz von 4 1 me c2 α4 = me c2 α4 128 32 voneinander getrennt sind.⁴ Bei ausreichender Auflösung weisen die Linien des Wasserstoff atoms deshalb eine „Feinstruktur“ auf. 3. Wir ersehen aus Abb. 2, dass die beiden Niveaus mit gleichem J dieselbe Energie haben. Die ses Ergebnis ist nicht nur in erster Ordnung von Wf gültig, es gilt vielmehr in jeder beliebigen Ordnung. Die exakte Lösung der Dirac-Gleichung ergibt für die Energie eines Niveaus, das durch die Quantenzahlen n, l, s, J bestimmt ist, den Wert E n,J = m e c2 [1 + α 2 (n − J −
−2 1 + √(J + 1/2)2 − α 2 ) ] 2
−1/2
(C-27)
Sie hängt also nur von n und J, nicht aber von l ab. Entwickeln wir Gl. (C-27) in Potenzen von α, so ergibt sich E n,J = m e c2 −
1 1 me c2 n 3 me c2 α2 2 − − ) α4 + . . . ( 2 n 2n 4 J + 1/2 4
(C-28)
Beim ersten Term handelt es sich um die Ruheenergie des Elektrons. Der zweite Term ergibt sich aus der Theorie in Kapitel VII. Der dritte Term ist die Korrektur in erster Ordnung in Wf , wie sie in diesem Kapitel berechnet wurde. 4. Selbst bei Abwesenheit eines äußeren Felds und einfallender Photonen muss die Existenz ei nes fluktuierenden elektromagnetischen Felds im Raum angenommen werden (s. Ergänzung KV , § 3-d-δ). Dieses Phänomen hängt mit der quantenmechanischen Natur des elektromagnetischen Felds zusammen, das wir hier nicht betrachtet haben. Die Kopplung des Atoms an diese Fluk tuationen hebt die Entartung des 2s1/2 - und 2p1/2 -Niveaus auf. Das 2s1/2 -Niveau wird relativ zum 2p1/2 -Niveau um den Betrag der sogenannten „Lamb-Shift“, die von der Größenordnung von 1060 MHz ist, angehoben (s. Abb. 4). Die theoretische und experimentelle Untersuchung dieses Phänomens, das im Jahr 1949 entdeckt wurde, war für die Physik von großer Bedeutung und führte schließlich zur Formulierung der Quantenelektrodynamik.
4 Im Grundzustand ist l = 0 und s = 1/2, so dass J nur den Wert J = 1/2 annehmen kann. Die Ent artung des 1s-Zustands wird daher von Wf nicht aufgehoben, und es gibt nur ein Feinstrukturniveau, eben das 1s1/2 -Niveau. Diese Situation stellt einen Spezialfall dar, da nur für den Grundzustand l not wendig gleich null ist. Aus diesem Grund haben wir hier das angeregte n = 2-Niveau untersucht.
1238 | XII Fein- und Hyperfeinstruktur des Wasserstoffatoms
Abb. 2: Feinstruktur des n = 2-Niveaus des Wasserstoffatoms. Unter dem Einfluss des FeinstrukturHamilton-Operators W f spaltet sich das n = 2-Niveau in drei Feinstrukturniveaus auf, die mit 2s1/2 , 2p 1/2 und 2p 3/2 bezeichnet werden. Die numerischen Werte der Verschiebungen, berechnet in ers ter Ordnung in W f , sind angegeben. Die Verschiebungen für das 2s1/2 - und 2p 1/2 -Niveau sind gleich (was für jede beliebige Ordnung in W f richtig bleibt). Wenn man zusätzlich die quantenmechanische Natur des elektromagnetischen Felds in Betracht zieht, wird die Entartung zwischen dem 2s1/2 - und dem 2p 1/2 -Niveau aufgehoben (Lamb-Shift; s. Abb. 4).
D Die Hyperfeinstruktur des n = 1-Niveaus Es erschiene nun logisch, den Einfluss von Whf auf die Feinstrukturniveaus 2s1/2 , 2p1/2 und 2p3/2 zu untersuchen und zu sehen, ob die mit dem Protonenspin I zusam menhängenden Wechselwirkungen das Auftreten einer Hyperfeinstruktur in diesen Niveaus verursachen. Da jedoch die Entartung des 1s-Grundzustands von Wf nicht aufgehoben wurde, fällt es leichter, den Einfluss von Whf auf diesen Zustand zu be trachten. Die für diesen Fall erhaltenen Ergebnisse können für die 2s1/2 -, 2p1/2 - und 2p3/2 -Niveaus verallgemeinert werden.
D-1 Formulierung des Problems D-1-a Entartung des 1s-Niveaus Im 1s-Zustand gibt es keine Bahnentartung (l = 0). Allerdings können die Kompo nenten S z und I z von S bzw. I immer noch je zwei Werte annehmen: m S = ±1/2 und m I = ±1/2. Das 1s-Niveau ist demnach vierfach entartet, und eine mögliche Basis dieses Niveaus wird durch die Vektoren {|n = 1; l = 0; m L = 0; m S = ±1/2; m I = ±1/2⟩} gegeben.
(D-1)
D Die Hyperfeinstruktur des n = 1-Niveaus
| 1239
D-1-b Das 1s-Niveau besitzt keine Feinstuktur Wir wollen zeigen, dass der Term Wf die Entartung des 1s-Niveaus nicht aufhebt. Die W mv - und WD -Terme wirken nicht auf m S und m I und werden im 1s-Unterraum durch Vielfache der Einheitsmatrix dargestellt. Es ergibt sich (s. Ergänzung BXII ) ⟨W mv ⟩1s = − ⟨WD ⟩1s =
5 me c2 α4 8
(D-2)
1 me c2 α4 2
(D-3)
Zur Berechnung der Matrixelemente des WSB -Terms benötigen wir schließlich die „Winkelmatrixelemente“ ⟨l = 0, m L = 0|L x,y,z |l = 0, m L = 0⟩, die offensichtlich verschwinden (l = 0); also ist ⟨WSB ⟩1s = 0
(D-4)
Zusammenfassend wird also das 1s-Niveau als Ganzes um den Betrag (−
5 1 1 + ) me c2 α4 = − me c2 α4 8 2 8
(D-5)
verschoben, ohne dass das Niveau aufgespalten wird. Man hätte dieses Ergebnis vor hersehen können: Da wir l = 0 und s = 1/2 haben, kann J nur den Wert J = 1/2 an nehmen, und aus dem 1s-Niveau entsteht folglich nur ein Feinstrukturniveau 1s1/2 . Da der Hamilton-Operator Wf das 1s-Niveau nicht aufspaltet, können wir nun die Wirkung des Whf -Terms betrachten. Dazu müssen wir zunächst die Matrixelemente berechnen, die Whf im 1s-Niveau darstellen.
D-2 Matrixdarstellung von Whf im 1s-Niveau D-2-a Terme von Whf Wir zeigen, dass die ersten beiden Terme von Whf [Gl. (B-20)] keinen Beitrag liefern. μ0 q Die Berechnung des Beitrags des ersten Terms − 4π L ⋅ M I führt auf die „Win me R 3 kelmatrixelemente“ ⟨l = 0, m L = 0|L|l = 0, m L = 0⟩, die offensichtlich verschwinden (l = 0). Entsprechend kann gezeigt werden (s. Ergänzung BXI , § 3), dass die Matrixelemen te des zweiten Terms (der Dipol-Dipol-Wechselwirkung) aufgrund der Kugelsymmetrie des 1s-Zustands gleich null sind. D-2-b Kontaktterm Die Matrixelemente des letzten Terms von Gl. (B-20), d. h. des Kontaktterms, sind von der Form ⟨n = 1; l = 0; m L = 0; mS ; mI | −
2μ 0 M S ⋅ M I δ(R) | n = 1; l = 0; m L = 0; m S ; m I ⟩ 3 (D-6)
1240 | XII Fein- und Hyperfeinstruktur des Wasserstoffatoms Wenn wir in die {|r⟩}-Darstellung gehen, können wir die Bahn- und Spinanteile dieses Matrixelements separieren und schreiben A ⟨mS ; mI | I ⋅ S | m S ; m I ⟩
(D-7)
wobei A eine Zahl ist, die gegeben wird durch gp q2 ⟨n = 1; l = 0; m L = 0 | δ(R) | n = 1; l = 0; m L = 0⟩ 2 3ε0 c me Mp gp 1 q2 |R10 (0)|2 = 2 3ε0 c me Mp 4π
A=
=
4 me me −3 1 me c2 α 4 (1 + ) gp 3 Mp Mp ℏ2
(D-8)
Das sind die Gleichungen, die M S und MI mit S und I verknüpfen [s. Gl. (B-18)] und auch den in § C-4-c von Kapitel VII angegebenen Ausdruck für die Radialfunktion R10 (r) verwenden.⁵ Die Bahnvariablen sind somit vollständig verschwunden, und es bleibt das Pro blem der beiden halbzahligen Spins S und I zu untersuchen, die durch die Wechsel wirkung AI ⋅ S
(D-9)
gekoppelt sind; A ist eine Konstante. D-2-c Eigenzustände und Eigenwerte des Kontaktterms Zur Darstellung des Operators A I ⋅ S betrachteten wir bisher nur die Basis {|s = 1/2; I = 1/2; m S ; m I ⟩}
(D-10)
die aus gemeinsamen Eigenzuständen von S2 , I2 , S z , I z gebildet wird. Wir können auch mit der Einführung des Gesamtdrehimpulses⁶ F= S+I
(D-11)
die Basis {|s = 1/2; I = 1/2; F; m F ⟩}
(D-12)
5 Der Faktor (1 + m e /Mp )−3 in Gl. (D-8) stellt die reduzierte Masse μ dar, die in R 10 (0) eingeht. Für den Kontaktterm ist es also richtig, die endliche Kernmasse in dieser Weise zu berücksichtigen. 6 Eigentlich ist der Gesamtdrehimpuls F = L + S + I, also F = J + I. Im Grundzustand ist der Bahn drehimpuls jedoch null, so dass sich F auf Gl. (D-11) reduziert.
D Die Hyperfeinstruktur des n = 1-Niveaus
| 1241
verwenden, die aus gemeinsamen Eigenzuständen zu S2 , I2 , F2 und F z besteht. Da s = I = 1/2 gilt, kann F nur die Werte F = 0 und F = 1 annehmen. Mit Hilfe der Gleichungen (B-22) und (B-23) aus Kapitel X können wir leicht von einer Basis in die andere wechseln. Die Basis {|F, m F ⟩} ist zur Untersuchung des Operators AI ⋅ S besser geeignet als die Basis {|m S , m I ⟩}, da er in der {|F, m F ⟩}-Basis durch eine Diagonalmatrix dargestellt wird (der Einfachheit halber schreiben wir s = 1/2 und I = 1/2 nicht explizit aus). Aus Gl. (D-11) ergibt sich nämlich AI ⋅ S =
A 2 2 (F − I − S2 ) 2
(D-13)
woraus wir sehen, dass die Zustände |F, m F ⟩ Eigenzustände von AI ⋅ S sind: AI ⋅ S |F, m F ⟩ =
Aℏ2 [F(F + 1) − I(I + 1) − S(S + 1)] |F, m F ⟩ 2
(D-14)
Wie wir Gl. (D-14) entnehmen können, hängen die Eigenwerte nur von F und nicht von m F ab. Sie sind für F = 1 Aℏ2 3 3 Aℏ2 [2 − − ] = 2 4 4 4
(D-15)
und für F = 0 Aℏ2 3 3 3Aℏ2 [0 − − ] = − 2 4 4 4
(D-16)
Die vierfache Entartung des 1s-Niveaus wird also von Whf teilweise aufgeho ben: Es ergibt sich ein dreifach entartetes F = 1-Niveau und ein nichtentartetes F = 0-Niveau. Die (2F + 1)-fache Entartung des F = 1-Niveaus ist wesentlich und hängt mit der Invarianz von Whf gegenüber Drehungen des Gesamtsystems zusam men.
D-3 Die Hyperfeinstruktur des 1s-Niveaus D-3-a Lage der Niveaus Unter dem Einfluss von Wf wird die Energie des 1s-Niveaus gegenüber dem in Ka pitel VII berechneten Wert von −μc2 α 2 /2 um den Betrag me c2 α 4 /8 abgesenkt. Whf spaltet dann das 1s1/2 -Niveau in zwei Hyperfeinniveaus auf, die durch eine Energie Aℏ2 getrennt sind (Abb. 3); Aℏ2 wird oft als „Hyperfeinstruktur des Grundzustands“ bezeichnet.
1242 | XII Fein- und Hyperfeinstruktur des Wasserstoffatoms
A A A
Abb. 3: Hyperfeinstruktur des n = 1-Niveaus des Wasserstoffatoms. Der Einfluss von W f besteht in der Verschiebung des n = 1-Niveaus als Ganzes um −m e c 2 α 4 /8; J kann nur den Wert J = 1/2 annehmen. Betrachtet man zusätzlich den Hyperfeinstrukturterm W hf , so wird das 1s1/2 -Niveau in zwei Hyperfeinniveaus aufgespalten entsprechend F = 1 und F = 0. Der Hyperfeinübergang F = 1 ↔ F = 0 (die in der Radioastronomie betrachtete 21 cm-Linie) tritt mit einer Frequenz auf, die (dank des Wasserstoffmasers) experimentell auf zwölf Stellen genau bekannt ist.
Bemerkung: Für Whf würden wir ebenso finden, dass jedes Feinstrukturniveau 2s1/2 , 2p1/2 und 2p3/2 nach den zwischen J + I und |J − I| möglichen Werten von F in eine Folge von Hyperfeinniveaus auf spaltet. Für das 2s1/2 - und das 2p1/2 -Niveau ist J = 1/2. Also kann F die beiden Werte F = 1 und F = 0 annehmen. Beim 2p3/2 -Niveau ist J = 3/2, und folglich F = 2 und F = 1 (s. Abb. 4).
D-3-b Bedeutung der Hyperfeinstruktur des 1s-Niveaus Bei der Hyperfeinstruktur des Grundzustands des Wasserstoffatoms handelt es sich um eine physikalische Größe, die derzeit experimentell mit der größten Anzahl von Stellen bekannt ist. In Hertz ausgedrückt ist sie⁷ Aℏ = 1 420 405 751.768 ± 0.001 Hz 2π
(D-17)
7 Die in diesem Abschnitt durchgeführten Rechnungen reichen natürlich bei weitem nicht aus, theo retische Vorhersagen dieser Genauigkeit zu erhalten. Selbst mit den fortschrittlichsten Theorien kön nen wir gegenwärtig nicht mehr als fünf oder sechs Stellen von (D-17) erklären.
D Die Hyperfeinstruktur des n = 1-Niveaus |
1243
S
Abb. 4: Hyperfeinstruktur des n = 2-Niveaus des Wasserstoffatoms. Bei dem Zwischenraum S zwischen den beiden Niveaus 2s1/2 und 2p 1/2 handelt es sich um den Lamb-Shift, die etwa zehn mal kleiner als die Feinstrukturaufspaltung ∆E zwischen den beiden Niveaus 2p 1/2 und 2p 3/2 ist (S ≈ 1057.8 MHz; ∆E ≈ 10969.1 MHz). Aufgrund der Hyperfeinstrukturkopplung W hf wird jedes Niveau in zwei Hyperfeinstrukturniveaus aufgespalten (der entsprechende Wert der Quantenzahl F ist rechts in der Abbildung angegeben). Die Hyperfeinaufspaltung beträgt für das 2p 3/2 -Niveau 23.7 MHz, für das 2s1/2 -Niveau 177.56 MHz und für das 2p 1/2 -Niveau 59.19 MHz (der Übersichtlichkeit halber ist die Abbildung nicht maßstabsgetreu).
Eine so hohe experimentelle Genauigkeit wurde durch die Entwicklung des Wasser stoffmasers im Jahre 1963 möglich; prinzipiell geht man dabei wie folgt vor: Wasser stoffatome, von denen sichergestellt wurde (durch eine magnetische Auswahl nach dem Stern-Gerlach-Prinzip), dass sie sich im oberen F = 1-Hyperfeinstrukturniveau befinden, werden in einem Glasbehälter gesammelt (die dabei verwandte Anordnung entspricht der in Abb. 6 der Ergänzung FIV ). Auf diese Weise erhält man ein verstär kendes Medium für die Hyperfeinfrequenz [E(F = 1) − E(F = 0)]/h. Plaziert man die sen Behälter in einen Hohlraum, der auf die Hyperfeinfrequenz abgestimmt ist, und sind seine Verluste geringer als die Gewinne, so wird das System instabil und kann oszillieren: Wir erhalten einen atomaren Oszillator (einen Maser). Die Frequenz die ses Oszillators ist sehr stabil und von großer spektraler Reinheit. Aus ihrer Messung erhält man direkt den Wert der Hyperfeinaufspaltung in Hertz. Schließlich weisen wir noch darauf hin, dass die Radioastronomie Wasserstoffato me im interstellaren Raum durch Strahlung aufspürt, wie sie spontan beim Übergang aus dem F = 1-Hyperfeinniveau in das F = 0-Hyperfeinniveau des Grundzustands entsteht (dieser Übergang entspricht einer Wellenlänge von 21 cm). Ein Großteil von dem, was wir über interstellare Wasserstoffwolken wissen, entstammt der Untersu chung dieser 21 cm-Linie.
1244 | XII Fein- und Hyperfeinstruktur des Wasserstoffatoms
E Hyperfeinstruktur und Zeeman-Effekt E-1 Formulierung des Problems E-1-a Der Zeeman-Hamilton-Operator WZ Wir nehmen jetzt an, das Atom befinde sich in einem statischen homogenen Magnet feld B0 , das parallel zur z-Achse gerichtet ist. Dieses Feld tritt mit den verschiedenen magnetischen Momenten des Atoms in Wechselwirkung: dem magnetischen Moment des Bahn- und des Spindrehimpulses des Elektrons, ML = qL/2me und M S = qS/me , und dem magnetischen Moment des Atomkerns, M I = −qgp I/2Mp [s. Gl. (B-18)]. Der Zeeman-Hamilton-Operator WZ , mit dem die Wechselwirkungsenergie des Atoms mit dem Feld B0 beschrieben wird, ist gegeben durch WZ = −B0 ⋅ (M L + M S + M I ) = ω0 (L z + 2S z ) + ω n I z
(E-1)
wobei ω0 (die Larmor-Frequenz im Feld B0 ) ist, und die ω n definiert sind durch q ω0 = − B0 (E-2) 2me q gp B0 (E-3) ωn = 2Mp Da Mp ≫ me , haben wir offensichtlich |ω0 | ≫ |ω n |
(E-4)
Bemerkung: Streng genommen enthält WZ noch einen weiteren Term, der quadratisch in B0 ist (der diamagne tische Term). Dieser Term wirkt nicht auf die Elektronen- und Kernspinvariablen und verschiebt lediglich das 1s-Niveau als Ganzes, ohne das Zeeman-Diagramm, das wir später untersuchen werden, zu verändern. Außerdem ist er sehr viel kleiner als die Terme in Gl. (E-1). Eine detaillierte Untersuchung des diamagnetischen Terms haben wir bereits in Ergänzung DVII gegeben.
E-1-b Die vom 1s-Zustand „gespürte“ Störung Im diesem Abschnitt untersuchen wir den Einfluss von WZ auf den 1s-Grundzustand des Wasserstoffatoms (der Fall des 2s-Niveaus ist etwas komplizierter, da dieses Ni veau auch ohne äußeres Magnetfeld sowohl eine Fein- als auch eine Hyperfeinstruk tur besitzt, während das n = 1-Niveau nur eine Hyperfeinstruktur aufweist; das Prin zip der Rechnung bleibt jedoch für beide Fälle gleich). Selbst für die stärksten Ma gnetfelder, die in einem Labor erzeugt werden können, ist WZ sehr viel kleiner als der Abstand zwischen dem 1s-Niveau und den benachbarten Zuständen, so dass wir WZ mit der Störungstheorie behandeln können. Der Einfluss eines Magnetfelds auf ein atomares Energieniveau wird als ZeemanEffekt bezeichnet. Trägt man B0 auf der Abszisse und die Energien der verschiedenen erzeugten Unterniveaus auf der Ordinate auf, so erhält man ein Zeeman-Diagramm.
E Hyperfeinstruktur und Zeeman-Effekt | 1245
Bei ausreichend starkem B0 kann der Zeeman-Hamilton-Operator WZ von der selben Größe wie der Hyperfein-Hamilton-Operator Whf oder sogar größer sein.⁸ An dererseits gilt für sehr schwache B0 , dass WZ ≪ Whf . Es lässt sich also keine all gemeine Aussage über die relative Größe von WZ und Whf treffen. Um die Energie der verschiedenen Unterniveaus zu berechnen, müssen wir (WZ + Whf ) innerhalb des n = 1-Niveaus diagonalisieren. Wie wir in § D-2 gesehen haben, kann die Einschränkung von Whf auf das 1s-Ni veau in der Form AI ⋅ S geschrieben werden. Dem Ausdruck (E-1) für WZ entnehmen wir, dass wir auch Matrixelemente der Form ⟨n = 1; l = 0; m L = 0, mS ; mI | ω0 (L z + 2S z ) + ω n I z | n = 1; l = 0; m L = 0, m S ; m I ⟩
(E-5)
zu berechnen haben. Der Beitrag von ω0 L z verschwindet, weil l und m L gleich null sind. Da der Operator 2ω0 S z + ω n I z nur auf die Spinvariablen wirkt, können wir für diesen Term den Bahnanteil des Matrixelements, ⟨n = 1; l = 0; m L = 0 | n = 1; l = 0; m L = 0⟩ = 1
(E-6)
und den Spinanteil getrennt betrachten. Insgesamt müssen wir also, wobei wir die Quantenzahlen n, l, m L nicht berück sichtigen, den Operator AI ⋅ S + 2ω0 S z + ω n I z
(E-7)
diagonalisieren, der nur auf die Spinfreiheitsgrade wirkt. Dazu können wir uns ent weder in die {|m S , m I ⟩}- oder in die {|F, m F ⟩}-Basis begeben. Nach der Beziehung (E-4) ist der letzte Term von (E-7) viel kleiner als der zweite Term. Zur Vereinfachung der Überlegungen wollen wir im Folgenden den Term ω n I z vernachlässigen (es wäre allerdings auch möglich, ihn weiter einzubeziehen)⁹. Die vom 1s-Niveau „gespürte“ Störung können wir schließlich also schreiben als AI ⋅ S + 2ω0 S z
(E-8)
E-1-c Verschiedene Feldstärkebereiche Mit veränderlichem B0 lässt sich die Stärke des Zeeman-Terms 2ω0 S z kontinuierlich variieren. Wir wollen drei verschiedene Feldstärkebereiche unterscheiden, die durch
8 Wir erinnern uns, dass Wf das gesamte 1s-Niveau verschiebt; somit wird auch das Zeeman-Dia gramm als Ganzes verschoben. 9 Eben das wollen wir in Ergänzung CXII tun, wo wir wasserstoffartige Systeme (Myonium, Positroni um) untersuchen, bei denen es nicht möglich ist, das magnetische Moment eines der beiden Teilchen zu vernachlässigen.
1246 | XII Fein- und Hyperfeinstruktur des Wasserstoffatoms
das jeweilige Größenverhältnis des Hyperfeinstrukturterms und des Zeeman-Terms bestimmt sind: (a)
ℏω0 ≪ Aℏ2 :
schwache Felder
(b)
ℏω0 ≫ Aℏ2 :
starke Felder
(c)
ℏω0 ≈ Aℏ2 :
mittelstarke Felder
Wir werden später sehen, dass man den Operator (E-8) exakt diagonalisieren kann. Wir werden jedoch, weil damit die Störungstheorie in einem besonders einfachen Bei spiel Anwendung findet, in den Fällen (a) und (b) leicht abweichende Methoden ver wenden: Im Fall (a) betrachten wir 2ω0 S z als eine Störung von AI ⋅ S, während wir im Fall (b) AI ⋅ S als Störung von 2ω0 S z ansehen. Anhand der exakten Diagonalisie rung der beiden Operatoren, unumgänglich für den Fall (c), werden wir dann unsere Ergebnisse für die ersten beiden Fälle überprüfen können.
E-2 Zeeman-Effekt im schwachen Feld Die Eigenzustände und Eigenwerte von AI ⋅ S sind bereits bestimmt worden (§ D-2). Wir erhalten zwei unterschiedliche Niveaus: das dreifach entartete Niveau {|F = 1; m F = −1, 0, +1⟩} der Energie Aℏ2 /4 und das nicht entartete Niveau |F = 0; m F = 0⟩ der Energie −3Aℏ2 /4. Da wir 2ω0 S z als Störung von A I ⋅ S auffassen, müssen wir nun die beiden Matrizen, die 2ω0 S z in den beiden Niveaus F = 1 und F = 0 darstellen, entsprechend den beiden verschiedenen Eigenwerten von AI ⋅ S getrennt voneinander diagonalisie ren. E-2-a Matrixdarstellung von S z in der {|F, m F ⟩}-Basis Wir beginnen mit der Bestimmung der Matrix, die S z in der {|F, m F ⟩}-Basis darstellt (für das hiesige Problem reicht es aus, die beiden Untermatrizen in den Unterräumen zu F = 1 bzw. F = 0 zu bestimmen). Mit Hilfe der Gleichungen (B-22) und (B-23) aus Kapitel X finden wir leicht ℏ |F = 1; m F = 1⟩ 2 ℏ S z |F = 1; m F = 0⟩ = |F = 0; m F = 0⟩ 2 ℏ S z |F = 1; m F = −1⟩ = − |F = 1; m F = −1⟩ 2 ℏ S z |F = 0; m F = 0⟩ = |F = 1; m F = 0⟩ 2 S z |F = 1; m F = 1⟩ =
(E-9)
E Hyperfeinstruktur und Zeeman-Effekt | 1247
und damit die folgende Matrix, die S z in der {|F, m F ⟩}-Basis darstellt (die Basisvekto ren ordnen wir in der Reihenfolge |1, 1⟩, |1, 0⟩, |1, −1⟩, |0, 0⟩ an): 1 0 ℏ (S z ) = ( 0 2 0
0 0 0 1
0 0 −1 0
0 1 ) 0 0
(E-10)
Bemerkung: Es ist interessant, diese Matrix mit der zu vergleichen, die F z in derselben Basis darstellt: 1 0 (F z ) = ℏ ( 0 0
0 0 0 0
0 0 −1 0
0 0 ) 0 0
(E-11)
Zunächst stellen wir fest, dass die Matrizen nicht proportional zueinander sind: Die Matrix (F z ) ist im Gegensatz zu (S z ) diagonal. Betrachten wir jedoch die Einschränkungen der beiden Matrizen auf den F = 1-Unterraum [in Gl. (E-10) und Gl. (E-11) durch die Linien angedeutet], so sehen wir, dass diese proportional zuein ander sind; wenn wir den Projektor auf den F = 1-Unterraum mit P 1 bezeichnen (s. Ergänzung BII ), so gilt P1 S z P1 =
1 P1 F z P1 2
(E-12)
Es ist leicht zu zeigen, dass dieselbe Beziehung auch zwischen S x und F x bzw. S y und F y gilt. Wir haben somit einen Spezialfall des Wigner-Eckart-Theorems (Ergänzung DX ) gefunden, das besagt, dass in einem gegebenen Eigenunterraum des Gesamtdrehimpulses alle Matrizen, die Vektoroperatoren darstellen, proportional zueinander sind. Aus dem hier vorliegenden Beispiel wird klar, dass diese Proportionalität nur für die Einschränkungen der Operatoren auf einen be stimmten Eigenunterraum des Gesamtdrehimpulses und nicht für die Operatoren selbst gilt. Der Proportionalitätskoeffizient 1/2, der in Gl. (E-12) auftritt, ergibt sich sofort aus dem Projekti onstheorem: Nach Gl. (30) aus Ergänzung EX ist dieser Koeffizient ⟨S ⋅ F⟩F=1 F(F + 1) + S(S + 1) − I(I + 1) = 2F(F + 1) ⟨F2 ⟩F=1
(E-13)
Da hier S = I = 1/2 gilt, finden wir tatsächlich den Faktor 1/2.
E-2-b Eigenzustände und Eigenwerte im schwachen Feld Den vorstehenden Ergebnissen zufolge stellt die folgende Matrix den Operator 2ω0 S z im F = 1-Niveau dar: ℏω0 ( 0 0
0 0 0
0 0 ) −ℏω0
Für F = 0 reduziert sich diese Matrix auf eine Zahl, nämlich null.
(E-14)
1248 | XII Fein- und Hyperfeinstruktur des Wasserstoffatoms
Da beide Matrizen diagonal sind, lassen sich die Eigenzustände (in nullter Ord nung in ω0 ) und Eigenwerte (in erster Ordnung in ω0 ) für ein schwaches Feld sofort angeben: Eigenzustände
Eigenwerte ⇔
|F = 1; m F = 0⟩
⇔
|F = 1; m F = −1⟩
⇔
|F = 0; m F = 0⟩
⇔
Aℏ2 + ℏω0 4 Aℏ2 +0 4 Aℏ2 − ℏω0 4 Aℏ2 −3 +0 4
(E-15)
A
|F = 1; m F = 1⟩
Abb. 5: Zeeman-Diagramm des 1s-Grundzustands des Wasserstoffatoms für ein schwaches Feld. Das F = 1-Hyperfeinstrukturniveau wird in drei äquidistante Ni veaus aufgespalten, die jeweils einem bestimmten Wert der Quantenzahl m F entsprechen. Zur ersten Ordnung in ω 0 wird das F = 0-Niveau nicht verschoben.
In Abb. 5 wird ℏω0 auf der x-Achse und die Energien der vier Zeeman-Unterniveaus auf der y-Achse aufgetragen (Zeeman-Diagramm). Wenn das Feld null ist, gibt es nur die beiden Hyperfeinstrukturniveaus zu F = 1 und F = 0. Wird das Feld B0 einge schaltet, so tritt an dem nicht entarteten |F = 0, m F = 0⟩-Unterniveau zunächst keine Änderung auf, es verläuft horizontal; die dreifache Entartung des F = 1-Niveaus je doch wird vollständig aufgehoben: Es ergeben sich drei äquidistante Unterniveaus, deren Abstand linear mit ℏω0 wächst und deren Steigung im Diagramm +1, 0 bzw. −1 beträgt. Die vorstehenden Überlegungen bleiben gültig, solange der Abstand ℏω0 von zwei benachbarten Zeeman-Unterniveaus des F = 1-Niveaus viel kleiner bleibt als der Ab stand zwischen dem F = 1- und dem F = 0-Niveau im verschwindenden Feld (die Hy perfeinstruktur).
E Hyperfeinstruktur und Zeeman-Effekt | 1249
Bemerkung: Mit dem Wigner-Eckart-Theorem lässt sich zeigen, dass für ein gegebenes Niveau F des Gesamt drehimpulses der Zeeman-Hamilton-Operator ω0(L z +2S z ) durch eine Matrix dargestellt wird, die proportional zu F z ist. Es gilt also, wenn wir den Projektor auf das F-Niveau mit P F bezeichnen, P F [ω0 (L z + 2S z )] P F = g F ω0 P F F z P F
(E-16)
g F wird als Landé-Faktor des F-Zustands bezeichnet. In unserem Fall ist g F=1 = 1.
E-2-c Erwartungswerte und Vergleich mit dem Vektormodell In diesem Abschnitt wollen wir die verschiedenen Bohr-Frequenzen bestimmen, die in der Zeitentwicklung von ⟨F⟩ und ⟨S⟩ auftreten. Dabei werden wir sehen, dass sich diese Ergebnisse teilweise schon mit dem Vektormodell des Atoms ergaben (s. Ergän zung FX ). Zunächst wiederholen wir die Vorhersagen des Vektormodells des Atoms (die auftretenden Drehmomente werden dabei wie klassische Vektoren behandelt), soweit sie die Hyperfeinkopplung zwischen I und S betreffen. Für ein verschwindendes äußeres Feld ist F = I + S eine Konstante der Bewegung; I und S präzessieren mit einer Winkel geschwindigkeit proportional zur Kopplungskonstanten A zwischen I und S um ihre Resultierende F. Wird das System in ein schwaches statisches Magnetfeld B0 parallel zur z-Achse gebracht, so wird die schnelle Präzessionsbewegung von I und S um F von einer langsamen Präzessionsbewegung von F um die z-Richtung überlagert (LarmorPräzession, s. Abb. 6). F z ist somit eine Konstante der Bewegung, während S z einen statischen Anteil (die Projektion der Komponente von S parallel zu F auf die z-Achse) und einen oszillierenden Anteil (die Projektion der Komponente von S senkrecht zu F, die um F rotiert, auf die z-Achse) aufweist, der mit der Frequenz der Hyperfeinstruk tur-Präzession moduliert ist. Wir vergleichen nun diese halbklassischen Vorhersagen mit den oben in diesem Abschnitt gefundenen Ergebnissen der Quantentheorie. Dazu müssen wir die Zeitent wicklung der Erwartungswerte ⟨F z ⟩ und ⟨S z ⟩ betrachten: Den Ergebnissen in § D-2-d von Kapitel III zufolge enthält der Erwartungswert ⟨G⟩(t) einer physikalischen Größe G eine Reihe von Komponenten, die mit den verschiedenen Bohr-Frequenzen (E − E )/h des Systems oszillieren. Außerdem tritt eine bestimmte Bohr-Frequenz nur dann in ⟨G⟩(t) auf, wenn das Matrixelement von G zwischen den zu den beiden Energien ge hörenden Zuständen von null verschieden ist. In dem hier vorliegenden Problem wer den die Eigenzustände des Hamilton-Operators des schwachen Felds durch die Zu stände |F, m F ⟩ gegeben. Wir betrachten nun die beiden Matrizen (E-10) und (E-11), die S z und F z in dieser Basis darstellen: Da F z nur Diagonalmatrixelemente hat, kann keine von null verschiedene Bohr-Frequenz in ⟨F z ⟩(t) auftreten; ⟨F z ⟩ ist somit kon stant. Die Matrix von S z hingegen hat nicht nur Diagonalelemente (zu denen eine statische Komponente von ⟨S z ⟩ gehört), sondern auch ein Nichtdiagonalelement zwi schen den Zuständen |F = 1, m F = 0⟩ und |F = 0, m F = 0⟩, deren Energiedifferenz nach den Beziehungen (E-15) (oder Abb. 5) gleich Aℏ2 ist. Folglich hat ⟨S z ⟩ zusätz
1250 | XII Fein- und Hyperfeinstruktur des Wasserstoffatoms
Abb. 6: Die Bewegung von S, I und F im Vektor modell des Atoms. S und I präzessieren unter dem Einfluss der Hyperfeinkopplung schnell um F. In einem schwachen Feld präzessiert F zusätzlich langsam um B0 (Larmor-Präzession).
lich zu seiner statischen Komponente auch eine mit der Kreisfrequenz Aℏ modulierte Komponente. Dieses Ergebnis stimmt mit den Vorhersagen des Vektormodells über ein.¹⁰ Bemerkung: Es lässt sich eine Verbindung zwischen der Störungstheorie und dem Vektormodell des Atoms herstellen: Den Einfluss eines schwachen Felds B0 auf das F = 1- und F = 0-Niveau kann man erhalten, indem man im Zeeman-Hamilton-Operator 2ω0 S z nur die Matrixelemente in den F = 1und F = 0-Niveaus beachtet, während man die Matrixelemente von S z zwischen |F = 1, m F = 0⟩ und |F = 0, m F = 0⟩ „vergisst“. Bei einem solchen Vorgehen „vergisst“ man auch die oszillieren de Komponente von ⟨S z ⟩, die proportional zu diesem Matrixelement ist. Wir betrachten also nur die Komponente von ⟨S⟩ parallel zu ⟨F⟩. Genau das aber geschieht im Vektormodell des Atoms, wenn wir die Wechselwirkungsenergie mit dem Feld B0 berechnen wollen. In einem schwachen Feld präzessiert F sehr viel langsamer um B0 als S um F. Die Wechselwirkung von B0 mit der Kom ponente von S senkrecht auf F wirkt sich daher im Mittel nicht aus; nur die Projektion von S auf F ist von Bedeutung. Auf diese Weise wird z. B. der Landé-Faktor berechnet.
10 Eine ähnliche Analogie könnte auch zwischen den Zeitentwicklungen von ⟨F x ⟩, ⟨S x ⟩, ⟨F y ⟩, ⟨S y ⟩ und denen der Projektionen der Vektoren F und S von Abb. 6 auf die x- und y-Richtung gefunden werden. Die Bewegung von ⟨F⟩ und ⟨S⟩ stimmt jedoch nicht vollständig mit der der klassischen Dreh impulse überein. Insbesondere ist der Betrag von ⟨S⟩ nicht notwendig konstant (in der Quantenme chanik ist im Allgemeinen ⟨S2 ⟩ ≠ ⟨S⟩2 ); s. die Diskussion in Ergänzung FX .
E Hyperfeinstruktur und Zeeman-Effekt |
1251
E-3 Zeeman-Effekt im starken Feld E-3-a Eigenzustände und Eigenwerte des Zeeman-Terms Dieser Term ist in der {|m S , m I ⟩}-Basis diagonal: 2ω0 S z |m S , m I ⟩ = 2m S ℏω0 |m S , m I ⟩
(E-17)
Da m S = ±1/2 ist, sind die Eigenwerte gleich ±ℏω0 . Jeder Eigenwert ist also wegen der beiden möglichen Werte für m I zweifach entartet. Es gilt 2ω0 S z |+, ±⟩ = +ℏω0 |+, ±⟩ 2ω0 S z |−, ±⟩ = −ℏω0 |−, ±⟩
(E-18)
(zur Vereinfachung der Bezeichnung schreiben wir oft |ε S , ε I ⟩ statt |m S , m I ⟩, wobei ε S und ε I entweder + oder − sind, je nach den Vorzeichen von m S und m I ). E-3-b Störungstheoretische Behandlung des Hyperfeinstrukturterms Die Korrektur in erster Ordnung von A lässt sich berechnen, indem man die Einschrän kungen des Operators A I ⋅ S auf die beiden Unterräume {|+, ±⟩} und {|−, ±⟩}, die zu den beiden Eigenwerten von 2ω0 S z gehören, diagonalisiert. Zunächst stellen wir fest, dass in beiden Unterräumen die zwei Basisvektoren |+, +⟩ und |+, −⟩ (oder |−, +⟩ und |−, −⟩) Eigenvektoren von F z sind, jedoch nicht zum selben Wert von m F = m S + m I gehören. Da der Operator A I ⋅ S = A(F2 − I2 − S2 )/2 mit F z vertauscht, besitzt er keine Matrixelemente zwischen den beiden Zuständen |+, +⟩ und |+, −⟩ bzw. |−, +⟩ und |−, −⟩. Die beiden Matrizen, die AI ⋅ S in den Unter räumen {|+, ±⟩} und {|−, ±⟩} darstellen, sind dann diagonal, und ihre Eigenwerte sind die Diagonalelemente ⟨m S , m I | AI ⋅ S | m S , m I ⟩, die mit Hilfe der Relation I ⋅ S = Iz Sz +
1 (I+ S− + I− S+ ) 2
(E-19)
auch in der folgenden Form geschrieben werden können: ⟨m S , m I | AI ⋅ S | m S , m I ⟩ = ⟨m S , m I | AI z S z | m S , m I ⟩ = Aℏ2 m S m I
(E-20)
Die Eigenzustände (in nullter Ordnung von A) und Eigenwerte (in erster Ordnung von A) in einem starken Feld lauten dann Eigenzustände
Eigenwerte
|+, +⟩
⇔
|+, −⟩
⇔
|−, +⟩
⇔
|−, −⟩
⇔
Aℏ2 4 Aℏ2 ℏω0 − 4 Aℏ2 −ℏω0 − 4 Aℏ2 −ℏω0 + 4 ℏω0 +
(E-21)
1252 | XII Fein- und Hyperfeinstruktur des Wasserstoffatoms Die durchgezogenen Geraden auf der rechten Seite (für ℏω0 ≫ Aℏ2 ) von Abb. 7 stellen die Energieniveaus im starken Feld dar: Wir erhalten zwei parallele Geraden mit der Steigung +1 und einem Energieabstand Aℏ2 /2 und zwei parallele Geraden mit der Steigung −1 und dem gleichen Abstand Aℏ2 /2. Die störungstheoretischen Zugänge dieses und des vorhergehenden Abschnitts liefern also den asymptotischen Verlauf für ein starkes Feld und den Ausgangspunkt der Energieniveaus (Tangenten im Ur sprung). Bemerkung: Die Aufspaltung Aℏ2 /2 der beiden Zustände |+, +⟩ und |+, −⟩ bzw. |−, +⟩ und |−, −⟩ im starken Feld kann in folgender Weise interpretiert werden: Wir sahen, dass in einem starken Feld nur der Term I z S z in Gl. (E-19) für I ⋅ S einen Beitrag liefert, wenn also die Hyperfeinstrukturkopplung als Störung des Zeeman-Terms aufgefasst wird. Der Gesamt-Hamilton-Operator kann dann mit (E-8) 2ω0 S z + AI z S z = 2 (ω0 + A I z /2) S z
(E-22)
A
geschrieben werden. Das bedeutet, dass der Elektronenspin zusätzlich zum äußeren Feld B0 noch ein schwächeres „inneres Feld“ „spürt“, das aus der Hyperfeinstrukturkopplung zwischen I und S resultiert und zwei mögliche Werte hat, je nachdem ob der Kernspin nach oben oder nach unten zeigt. Dieses Feld wird zu B0 addiert oder davon subtrahiert und ist für die Energiedifferenz zwischen |+, +⟩ und |+, −⟩ bzw. zwischen |−, +⟩ und |−, −⟩ verantwortlich.
Abb. 7: Zeeman-Diagramm des 1s-Grundzu stands des Wasserstoffatoms für ein starkes Feld. Für jede Orientierung des Elektronenspins (ε S = + oder ε S = −) erhalten wir zwei durch die Energie Aℏ2 /2 voneinander getrennte par allele Linien, die jeweils zu einer unterschied lichen Orientierung des Protonenspins (ε I = + oder ε I = −) gehören.
E Hyperfeinstruktur und Zeeman-Effekt |
1253
E-3-c Bohr-Frequenzen in der Entwicklung von ⟨S z ⟩ In einem starken Feld ist die Zeeman-Kopplung von S mit B0 wichtiger als die Hyper feinstrukturkopplung von S mit I. Vernachlässigen wir zunächst die Hyperfeinstruk turkopplung, so präzessiert nach dem Vektormodell des Atoms S (sehr schnell, da |B0 | groß ist) um B0 , d. h. um die z-Richtung (I bleibt konstant, da wir ω n als vernachläs sigbar angenommen haben).
Abb. 8: Die Bewegung von S im Vektormodell des Atoms. In einem starken Feld präzessiert S schnell um B0 (wir vernachlässigen hier sowohl die Zeeman-Kopplung zwischen I und B0 als auch die Hyperfeinstrukturkopplung zwischen I und S, so dass I konstant bleibt).
Der Ausdruck (E-19) für die Hyperfeinstrukturkopplung bleibt für klassische Vekto ren gültig. Wegen der sehr raschen Präzession von S oszillieren auch S+ und S− sehr schnell und erzielen im Mittel keinen Effekt, so dass nur der Term I z S z von Bedeutung ist. Die Wirkung der Hyperfeinstrukturkopplung besteht somit im Hinzufügen eines schwachen Felds in z-Richtung proportional zu I z (s. die Bemerkung des vorherigen Abschnitts), das die Präzession von S um die z-Richtung beschleunigt oder verlang samt, abhängig vom Vorzeichen von I z . Im Vektormodell des Atoms ist also S z in einem starken Feld konstant. Wir werden zeigen, dass die Quantentheorie für den Erwartungswert ⟨S z ⟩ der Ob servablen S z ein analoges Ergebnis liefert. In einem starken Feld werden die Zustände wohldefinierter Energie durch die Zustände |m S , m I ⟩ gegeben. In dieser Basis aber hat der Operator S z nur Diagonalmatrixelemente. Somit kann in ⟨S z ⟩ keine von null verschiedene Bohr-Frequenz auftreten; im Gegensatz zum schwachen Feld ist der Er wartungswert also zeitlich konstant (s. § E-2-c).¹¹ 11 Die Untersuchung von ⟨S x ⟩ und ⟨S y ⟩ stellt keine Schwierigkeit dar. Es ergeben sich zwei Bohr-Fre quenzen: die eine, ω0 + Aℏ/2, etwas größer als ω0 und die andere, ω0 − Aℏ/2, etwas kleiner. Sie ent sprechen den beiden möglichen Orientierungen des von I z erzeugten „inneren Felds“, das zum äuße ren Feld B0 hinzukommt. Analog ergibt sich, dass I um das von S z erzeugte „innere Feld“ präzessiert.
1254 | XII Fein- und Hyperfeinstruktur des Wasserstoffatoms
E-4 Zeeman-Effekt für mittelstarke Felder E-4-a Matrix der Gesamtstörung in der {|F, m F ⟩}-Basis Die Zustände |F, m F ⟩ sind Eigenzustände des Operators AI ⋅ S. Die Matrix, die diesen Operator in der {|F, m F ⟩}-Basis darstellt, ist daher diagonal. Die Diagonalelemente zu F = 1 sind gleich Aℏ2 /4 und die zu F = 0 gleich −3Aℏ2 /4. Außerdem haben wir mit Gl. (E-10) bereits die Matrixdarstellung von S z in derselben Basis angegeben und können nun sehr leicht die Matrix, die die Gesamtstörung (E-8) darstellt, angeben: Indem wir die Basisvektoren in der Reihenfolge |1, 1⟩, |1, −1⟩, |1, 0⟩, |0, 0⟩ anordnen, erhalten wir ℏω0 + A ℏ2 /4 ( (
0 A ℏ2 /4
0
0
0
0 ℏω0
0
−ℏω0 +
0
0
A ℏ2 /4
0
0
ℏω0
)
(E-23)
−3A ℏ2 /4)
Bemerkung: Die Operatoren S z und F z vertauschen; 2ω0 S z kann daher nur zwischen Zuständen mit demsel ben Wert von m F nichtverschwindende Matrixelemente haben. Wir hätten also alle Nullen der Matrix (E-23) vorhersehen können.
E-4-b Energiewerte im beliebigen Feld Die Matrix (E-23) kann in zwei 1 × 1- und eine 2 × 2-Matrix aufgespalten werden. Die beiden 1 × 1-Matrizen ergeben unmittelbar zwei Eigenwerte: E1 = ℏω0 + Aℏ2 /4 E2 = −ℏω0 + Aℏ2 /4
(E-24)
sie gehören zum Zustand |1, 1⟩ (das ist |+, +⟩) bzw. zum Zustand |1, −1⟩ (das ist |−, −⟩). Die beiden Geraden in Abb. 9 mit den Steigungen +1 und −1, die den Punkt mit der Ordinate +Aℏ2 /4 für verschwindendes Feld (für das die störungstheoretische Behand lung nur das anfängliche und das asymptotische Verhalten ergab) passieren, stellen also für beliebiges B0 zwei Zeeman-Unterniveaus dar. Die Eigenwertgleichung der verbleibenden 2 × 2-Matrix lautet
(
Aℏ2 3Aℏ2 − E) (− − E) − ℏ2 ω20 = 0 4 4
(E-25)
E Hyperfeinstruktur und Zeeman-Effekt | 1255
A
A
Abb. 9: Zeeman-Diagramm des 1s-Grundzustands des Wasserstoffatoms (für ein beliebiges Feld): m F bleibt für jeden Wert des Felds eine gute Quantenzahl. Es ergeben sich zwei Geraden mit den Steigungen +1 und −1 und eine Hyperbel, deren Äste zu den beiden m F = 0-Niveaus gehören. Abb. 5 und Abb. 7 liefern die Tangenten im Ursprung und die Asymptoten der in dieser Abbildung dargestellten Niveaus.
und ihre beiden Wurzeln lassen sich leicht bestimmen:
E3 = −
Aℏ2 √ Aℏ2 2 + ( ) + ℏ2 ω20 4 2
(E-26)
E4 = −
Aℏ2 √ Aℏ2 2 − ( ) + ℏ2 ω20 4 2
(E-27)
Ändert sich ℏω0 , so folgen die beiden Punkte mit der Abszisse ℏω0 und den Ordina ten E3 bzw. E4 den beiden Ästen einer Hyperbel (Abb. 9). Die Asymptoten dieser Hy perbel werden durch die beiden Geraden E = ±ℏω0 − Aℏ2 /4 gegeben, die wir bereits in § E-3 fanden. Die beiden Scheitelpunkte der Hyperbel liegen bei ω0 = 0 mit den
1256 | XII Fein- und Hyperfeinstruktur des Wasserstoffatoms Ordinaten ±(Aℏ2 /2) − Aℏ2 /4, d. h. bei Aℏ2 /4 und −3Aℏ2 /4. Die Tangenten sind in diesen beiden Punkten horizontal. Das stimmt mit den Ergebnissen von § E-2 für die Zustände |F = 1, m F = 0⟩ und |F = 0, m F = 0⟩ überein. Die vorstehenden Ergebnisse sind in Abb. 9 zusammengefasst, die das ZeemanDiagramm des 1s-Grundzustands darstellt. E-4-c Teilweise Hyperfeinstrukturentkopplung Die Energieeigenzustände sind in einem schwachen Feld die Zustände |F, m F ⟩, in ei nem starken Feld die Zustände |m S , m I ⟩; in einem mittelstarken Feld sind es die Ei genzustände der Matrix (E-23), die Zwischenzustände von |F, m F ⟩ und |m S , m I ⟩ dar stellen. Man gelangt also kontinuierlich von einer starken Kopplung zwischen I und S (gekoppelte Basen) zu einer vollständigen Entkopplung (entkoppelte Basen) über den Zwischenbereich einer teilweisen Kopplung. Bemerkung: Ein analoges Phänomen gibt es auch für den Zeeman-Effekt bei der Feinstruktur. Wenn wir der Einfachheit halber Whf vernachlässigen, so wissen wir (§ C), dass im verschwindenden äußeren Feld die Zustände |J, m J ⟩ die Eigenzustände des Hamilton-Operators entsprechend einer starken Kopplung zwischen L und S (Spin-Bahn-Kopplung) sind. Diese Eigenschaft bleibt erhalten, solan ge WZ ≪ Wf gilt. Ist allerdings B0 stark genug, um den umgekehrten Fall WZ ≫ Wf zu erzeugen, so sind die Zustände |m L , m S ⟩ die Eigenzustände von H entsprechend einer vollständigen Ent kopplung von L und S. Der Zwischenbereich (WZ ≈ Wf ) entspricht einer teilweisen Kopplung von L und S. Siehe dazu z. B. Ergänzung DXII , wo der Zeeman-Effekt beim 2p-Niveau untersucht wird (unter Vernachlässigung von Whf ).
Referenzen und Literaturhinweise Spektrum des Wasserstoffatoms: Series (11.7), Bethe und Salpeter in (11.10). Dirac-Gleichung: Unterabschnitt „Relativistische Quantenmechanik“ in Abschnitt 2 der Bibliographie; Messiah (1.17), Kap. XX, insbes. § V und § IV-27. Feinstruktur des n = 2-Niveaus. Lamb-Shift: Lamb und Retherford (3.11); Frisch (3.13); Series (11.7), Kap. VI, VII und VIII. Hyperfeinstruktur des Grundzustands: Crampton et al. (3.12). Zeeman-Effekt und Vektormodell des Atoms: Cagnac und Pebay-Peyroula (11.2), Kap. XVII, § 3E und § 4C; Born (11.4), Kap. 6, § 2.
Übersicht über die Ergänzungen zu Kapitel XII |
1257
•
Übersicht über die Ergänzungen zu Kapitel XII AXII Der HyperfeinstrukturHamilton-Operator
In AXII wird der Hyperfeinstruktur-Hamilton-Operator aufgestellt. Die einzelnen Terme und insbesondere der Kontaktterm werden physikalisch interpretiert. (verhältnismäßig schwierig)
BXII Erwartungswerte und Feinstruktur
Einige der in Kapitel XII im Zusammenhang mit den Energieverschiebungen auftretenden Radialintegrale werden im Detail berechnet. (ohne grundsätzliche Schwierigkeiten)
CXII Hyperfeinstruktur und Zeeman-Effekt für das Myonium und das Positronium
Die Überlegungen aus § D und § E von Kapitel XII werden auf zwei wichtige wasserstoffartige Systeme, das Myonium und das Positronium, angewendet. Auf experimentelle Methoden zur Untersuchung dieser Systeme wird kurz eingegangen. (einfach)
DXII Elektronenspin und Zeeman-Effekt
In dieser Ergänzung wird der Einfluss des Elektronenspins auf Frequenz und Polarisation der Zeeman-Komponenten in der Resonanzlinie des Wasserstoffs untersucht. Die in Ergänzung DVII ohne Berücksichtigung des Spins erhaltenen Ergebnisse werden präzisiert. (von mittlerer Schwierigkeit)
EXII Stark-Effekt des Wasserstoffatoms
In dieser Ergänzung wird der Einfluss eines statischen Magnetfelds auf den Grundzustand (n = 1) und den ersten angeregten Zustand (n = 2) des Wasserstoffatoms (Stark-Effekt) untersucht. (verhältnismäßig leicht)
•
1258 | Ergänzung AXII
Ergänzung AXII Der Hyperfeinstruktur-Hamilton-Operator 1 2 2-a 2-b 3
Das Elektron im Feld des Protons | 1258 Genaue Form des Hyperfeinstruktur-Hamilton-Operators | 1260 Kopplung des magnetischen Moments des Protons mit dem Bahndrehimpuls des Elektrons | 1260 Kopplung mit dem Elektronenspin | 1261 Schlussfolgerung | 1265
In dieser Ergänzung rechtfertigen wir den Ausdruck für den Hyperfeinstruktur-Hamil ton-Operator, den wir in Kapitel XII [Gl. (B-20)] lediglich angegeben haben. Auch hier beschränken wir uns auf das Wasserstoffatom, obwohl fast alle Ergebnisse auch für beliebige Atome gültig bleiben. Wir haben bereits darauf hingewiesen, dass der Hy perfeinstruktur-Hamilton-Operator die Kopplung des Elektrons mit dem vom Proton erzeugten elektromagnetischen Feld berücksichtigt. Dieses können wir durch das ska lare Potential U I (r) und das Vektorpotential A I (r) beschreiben, und wir beginnen mit der Untersuchung des zugehörigen Hamilton-Operators.
1 Das Elektron im Feld des Protons Ort und Impuls des Elektrons bezeichnen wir mit R bzw. P, seinen Spin mit S, seine Masse mit me , seine Ladung mit q; μ B = qℏ/2me ist das Bohr-Magneton. Dann lautet der Hamilton-Operator H des Elektrons im Feld des Protons H=
1 2μB S ⋅ (∇ × AI (R)) [P − qAI (R)]2 + qU I (R) − 2me ℏ
(1)
Dieser Operator ergibt sich, wenn wir zum Hamilton-Operator eines spinlosen Teil chens [s. Gl. (B-46) in Kap. III] die Kopplungsenergie des aus dem Spin resultierenden magnetischen Moments 2μB S/ℏ im Magnetfeld ∇ × AI (r) addieren. Zunächst wenden wir uns den Termen von Gl. (1) zu, die mit dem Skalarpoten tial U I (r) zusammenhängen. Nach Ergänzung EX ergibt sich dieses Potential aus der Überlagerung mehrerer Beiträge, die jeweils mit einem der elektrischen Multipolmo mente des Kerns zusammenhängen. Für einen beliebigen Atomkern müssen wir be trachten: 1. Die Gesamtladung −Zq des Kerns (das Moment der Ordnung k = 0), die eine potentielle Energie V0 (r) = qU0 (r) = −
Zq2 4πε0 r
https://doi.org/10.1515/9783110638769-026
(2)
Der Hyperfeinstruktur-Hamilton-Operator
| 1259
•
(für das Proton ist Z = 1) ergibt. Der Hamilton-Operator, den wir in Kapitel VII für die Untersuchung des Wasserstoffatoms verwendet haben, ist aber gerade H0 =
P2 + V0 (R) 2me
(3)
so dass V0 (R) im anfänglichen Hamilton-Operator H0 bereits enthalten ist. 2. Das elektrische Quadrupolmoment (k = 2) des Kerns. Das entsprechende Potential wird zu V0 addiert und führt auf einen Term des Hyperfeinstruktur-Hamil ton-Operators, den elektrischen Quadrupolterm. Mit Hilfe von Ergänzung EX lässt sich dieser Term ohne Schwierigkeiten angeben. Für das Wasserstoffatom ist er gleich null, da das Proton als Spin-1/2-Teilchen kein elektrisches Quadrupolmoment besitzt (s. § 2-c-α von Ergänzung EX ). 3. Die elektrischen Multipolmomente der Ordnungen k = 4, 6, . . . , die theore tisch für k ≤ 2I einen Beitrag liefern. Für das Proton verschwinden sie alle. Für das Wasserstoffatom gibt der Ausdruck (2) daher das Potential vollständig wieder.¹ Es sind keine weiteren Korrekturen notwendig (mit Wasserstoffatom meinen wir hier das Elektron-Proton-System, während Isotope wie etwa Deuterium ausge schlossen sind: Da der Deuteriumkern den Spin I = 1 besitzt, müssten wir bei ihm einen elektrischen Quadrupol-Hyperfeinstrukturterm hinzunehmen, s. Bemerkung 1 am Ende dieser Ergänzung). Wir betrachten nun die Terme unter Beteiligung des Vektorpotentials AI (r) in Gl. (1): Das magnetische Moment des Protons sei MI (das Proton kann aus demsel ben Grund wie oben keine magnetischen Multipolmomente einer Ordnung k > 1 besitzen). Es ist AI (r) =
μ0 MI × r 4π r3
(4)
Der Hyperfeinstruktur-Hamilton-Operator ist dann, wenn wir in Gl. (1) nur die linearen Terme in AI berücksichtigen, Whf = −
q 2μB S ⋅ (∇ × AI (R)) [P ⋅ AI (R) + AI (R) ⋅ P] − 2me ℏ
(5)
(da bereits Whf nur eine sehr kleine Korrektur der Energieniveaus von H0 ergibt, ist eine Vernachlässigung des Terms zweiter Ordnung in AI sicher erlaubt).
1 Wir betrachten hier nur das Potential außerhalb des Kerns, wo eine Multipolentwicklung möglich ist. Innerhalb des Kerns hat das Potential nicht die Form (2). Dadurch wird eine Verschiebung der ato maren Niveaus erzeugt; dies ist der sogenannte Volumeneffekt. Er wurde in Ergänzung DXI behandelt und wird hier nicht mehr berücksichtigt.
•
1260 | Ergänzung AXII
2 Genaue Form des Hyperfeinstruktur-Hamilton-Operators 2-a Kopplung des magnetischen Moments des Protons mit dem Bahndrehimpuls des Elektrons Zunächst bestimmen wir den ersten Term von Gl. (5): Mit Gl. (4) finden wir P ⋅ AI (R) + AI (R) ⋅ P =
μ0 1 1 {P ⋅ (MI × R) 3 + 3 (M I × R) ⋅ P} 4π R R
(6)
Wir können die Regel für ein gemischtes Vektorprodukt auf Operatoren anwenden, solange wir nicht die Reihenfolge zweier nichtkommutierender Operatoren ändern. Die Komponenten von M I vertauschen mit R und P, so dass gilt (M I × R) ⋅ P = (R × P) ⋅ M I = L ⋅ MI
(7)
worin L=R×P
(8)
der Bahndrehimpuls des Elektrons ist. Man kann zeigen, dass [L,
1 ]=0 R3
(9)
gilt (eine beliebige Funktion von |R| ist ein skalarer Operator); damit ergibt sich 1 L ⋅ MI (M I × R) ⋅ P = R3 R3
(10)
Entsprechend finden wir P ⋅ (M I × R)
1 1 MI ⋅ L = −M I ⋅ (P × R) 3 = R3 R R3
(11)
da −P × R = L
(12)
Zu Whf liefert also der erste Term von Gl. (5) den Beitrag L Whf =−
M I ⋅ (L/ℏ) μ0 q MI ⋅ L μ0 2 3 = − 2μB 4π 2me 4π R R3
(13)
Physikalisch beschreibt er die Kopplung zwischen dem magnetischen Moment MI des Kerns und dem Magnetfeld BL =
μ0 qL 4π me r3
das durch die Elektronenbewegung (sie kann als „Kreisstrom“ beschrieben werden) erzeugt wird (s. Abb. 1).
Der Hyperfeinstruktur-Hamilton-Operator
| 1261
•
Abb. 1: Relative Orientierung des magnetischen Moments MI des Protons und des Feldes BL ; dieses wird von dem Kreisstrom erzeugt, den man der Bewegung der Elektronenladung q mit der Geschwindigkeit v zuordnen kann (BL ist antiparallel zum Bahndrehimpuls L des Elektrons).
Bemerkung: Das Auftreten des 1/R 3 -Terms in Gl. (13) lässt zunächst vermuten, dass sich im Ursprung eine L Singularität befindet und somit bestimmte Matrixelemente von Whf unendlich sind. Das ist aller dings nicht richtig: Wir betrachten das Matrixelement L ⟨φ k,l,m |Whf |φ k ,l ,m ⟩
worin |φ k,l,m ⟩ und |φ k ,l ,m ⟩ die stationären Zustände des Wasserstoffatoms sind, die wir in Ka pitel VII bestimmt haben. In der Ortsdarstellung gilt ⟨r | φ k,l,m ⟩ = φ k,l,m (r) = R k,l (r)Y lm (θ, φ)
(14)
mit [s. Kapitel VII, Beziehungen (A-28)] r→0
R k,l (r) ∼ Cr l
(15)
Beachten wir den r 2 dr-Term im Volumenelement, so sehen wir, dass die über r zu integrierende Funktion sich im Ursprung wie r l+l +2−3 = r l+l −1 verhält. Außerdem folgt aus dem Auftreten des hermiteschen Operators L in Gl. (13), dass das Matrixelement L ⟨φ k,l,m |Whf |φ k ,l ,m ⟩
null ist, wenn l oder l verschwinden. Es ist damit l + l ≥ 2, und r l+l
−1
bleibt im Ursprung endlich.
2-b Kopplung mit dem Elektronenspin Beim letzten Term in Gl. (5) spielt die Singularität des Vektorpotentials im Ursprung eine Rolle. Deswegen wollen wir zur Untersuchung dieses Terms ein Proton von end licher Ausdehnung annehmen und erst zum Schluss der Rechnung den Radius gegen null gehen lassen. Vom physikalischen Standpunkt aus wissen wir ohnehin, dass das Proton eine gewisse räumliche Ausdehnung besitzt und dass sein Magnetismus über ein gewisses Volumen verteilt ist. Natürlich sind die Dimensionen des Protons sehr viel kleiner als der Bohr-Radius a0 , was die Behandlung des Protons als Punktteil chen im letzten Schritt der Rechnung rechtfertigt.
•
1262 | Ergänzung AXII
α Das Magnetfeld des Protons Wir betrachten das Proton als ein Teilchen mit dem Radius ρ 0 (Abb. 2), das sich im Ur sprung des Bezugssystems befindet. Die magnetischen Eigenschaften im Inneren des Protons können wir durch ein magnetisches Moment M I beschreiben, das wir parallel zur z-Achse wählen. In einem weit entfernten Punkt mit r ≫ ρ 0 erzeugt dieses Moment ein Feld mit den Komponenten xz μ0 3M I 5 4π r yz μ0 By = 3M I 5 4π r
Bx =
Bz =
(16)
3z2 − r2 μ0 MI 4π r5
die sich aus dem Ausdruck (4) durch Bildung der Rotation ergeben. Dies bleibt selbst dann gültig, wenn r im Vergleich zu ρ 0 nicht sehr groß ist. Wir haben bereits darauf hingewiesen, dass das Proton, da es ein Spin-1/2-Teilchen ist, keine magnetischen Momente der Ordnung k > 1 besitzt. Außerhalb des Protons liegt daher ein reines Dipolfeld vor. Das Magnetfeld innerhalb des Protons hängt von der genauen magnetischen Ver teilung ab. Wir nehmen an, dieses Feld Bi sei homogen (aus Symmetriegründen muss es dann parallel zu M I und damit zur z-Richtung sein). Um das Feld Bi zu berechnen, beachten wir, dass der Fluss des Magnetfelds durch die geschlossene Oberfläche, die in unserem Fall durch die x, y-Ebene und die obere Halbkugel mit dem Mittelpunkt O und dem unendlichen Radius begrenzt wird, gleich null ist. Da mit r → ∞ das Feld |B| wie 1/r3 abfällt, verschwindet der Fluss durch diese Halbkugel. Bezeichnen wir also den Fluss durch die in der x, y-Ebene liegende Kreisscheibe um O mit dem Radius ρ 0 mit Φi (ρ 0 ) und den Fluss durch den Rest der x, y-Ebene mit Φa (ρ 0 ), so gilt Φi (ρ 0 ) + Φa (ρ 0 ) = 0
(17)
Mit Hilfe der Gleichungen (16) lässt sich Φa (ρ 0 ) leicht berechnen; wir erhalten +∞
Φa (ρ 0 ) = 2π ∫ r dr [− ρ0
=−
1 μ0 MI 3 ] 4π r
2π μ0 MI 4π ρ0
(18)
Für den Fluss Φi (ρ 0 ) von Bi gilt Φi (ρ 0 ) = πρ 20 Bi
(19)
so dass wir aus Gl. (17) und Gl. (18) Bi =
2 μ0 MI 3 4π ρ0
(20)
Der Hyperfeinstruktur-Hamilton-Operator
|
1263
•
Abb. 2: Vom Proton erzeugtes Magnetfeld. Außerhalb des Protons handelt es sich um ein Dipolfeld, innerhalb hängt das Feld von der genauen Verteilung der Magnetisierung ab, die wir in erster Nä herung als homogen annehmen können. Der Kontaktterm entspricht der Wechselwirkung zwischen dem magnetischen Moment des Elektronenspins und dem Feld Bi innerhalb des Protons.
erhalten. Damit kennen wir den Wert des vom Proton erzeugten Felds in allen Raum punkten und können nun den Anteil von Whf , der mit dem Elektronenspin zusam menhängt, berechnen.² β Der magnetische Dipolterm Setzen wir in den Term −2μB (S/ℏ) ⋅ (∇ × AI ) die Ausdrücke (16) ein, so erhalten wir den Operator Dip
Whf = −
XS x + YS y + ZS z S z μ0 2μB M I − 3} {3Z 4π ℏ R5 R
(21)
d. h., weil M I nach Voraussetzung parallel zur z-Achse ist, Dip
Whf =
μ0 2μB 1 (S ⋅ R)(M I ⋅ R) {S ⋅ M I − 3 } 4π ℏ R3 R2
(22)
Dies ist der Ausdruck für den Hamilton-Operator der Dipol-Dipol-Wechselwirkung zwischen zwei magnetischen Momenten MI und M S = 2μB S/ℏ (s. Ergänzung BXI , § 1). Eigentlich ist der Ausdruck (16) für das vom Proton erzeugte Feld nur für r ≥ ρ 0 gültig und Gl. (22) sollte nur auf den Teil der Wellenfunktionen angewandt werden, der diese Bedingung erfüllt. Wenn wir ρ 0 jedoch gegen null gehen lassen, tritt in Gl. (22) im Ursprung keine Singularität auf; sie gilt daher im gesamten Raum. 2 Die Überlegungen können auf Fälle verallgemeinert werden, in denen Bi einen komplizierteren Ver lauf hat (s. Bemerkung 2 am Schluss dieser Ergänzung).
•
1264 | Ergänzung AXII
Betrachten wir nämlich das Matrixelement Dip
⟨φ k,l,m,ε | Whf | φ k ,l ,m ,ε ⟩ (wir fügen den Zuständen |φ k,l,m ⟩ hier die Indizes ε und ε hinzu, um die Eigenwer te εℏ/2 und ε ℏ/2 von S z zu kennzeichnen) und insbesondere das darin auftretende Radialintegral, so verhält sich der Integrand im Ursprung wie r l+l +2−3 = r l+l −1 . Nach der Bedingung (8c) aus Ergänzung BXI ergeben sich nichtverschwindende Matrixele mente nur für l + l ≥ 2. Es liegt daher keine Divergenz vor. Im Grenzfall ρ 0 → 0 wird das Integral über r zu einem Integral von 0 bis ∞ und Gl. (22) ist im gesamten Raum gültig. γ Der Kontaktterm Um den Beitrag des inneren Felds des Protons zu Whf zu erhalten, setzen wir nun den K Ausdruck (20) in den letzten Term von Gl. (5) ein. Das ergibt einen Operator Whf , den wir als Kontaktterm bezeichnen wollen und dessen Matrixelemente in der {|φ k,l,m,ε⟩}Darstellung lauten K ⟨φ k,l,m,ε | Whf | φ k ,l ,m ,ε ⟩
=−
2 μ0 2μB M I ⟨ε|S z |ε ⟩ 3 ∭ d3 r φ∗k,l,m (r) φ k ,l ,m (r) 4π ℏ ρ0
(23)
r≤ρ 0
Wenn nun ρ 0 gegen null geht, strebt auch das Integrationsvolumen 4πρ 30 /3 gegen null und die rechte Seite von Gl. (23) wird −
8π ∗ μ 0 2μB M I ⟨ε|S z |ε ⟩ φ (r = 0) φ k ,l ,m (r = 0) 4π ℏ 3 k,l,m
(24)
Der Ausdruck für den Kontaktterm lautet somit K =− Whf
μ0 8π 2μB S MI ⋅ ( ) δ(R) 4π 3 ℏ
(25)
K bleibt also endlich, auch wenn das Volumen, in dem das interne Der Wert von Whf Magnetfeld (20) wirkt, mit ρ 0 → 0 gegen null strebt, da das innere Feld wie 1/ρ 30 gegen unendlich geht.
Bemerkungen: 1. Die Funktion δ(R) des Operators R in Gl. (25) ist einfach der Projektor δ(R) = |r = 0⟩⟨r = 0|
(26)
2. Das Matrixelement in Gl. (23) ist nur für l = l = 0 von null verschieden. Das ist eine notwen dige Bedingung, damit φ k,l,m (r = 0) und φ k ,l ,m (r = 0) nicht null sind (s. Kap. VII, § C-4-c-β). Der Kontaktterm tritt somit nur für s-Zustände auf. 3. Um die Kopplung zwischen MI und dem Bahndrehimpuls des Elektrons zu untersuchen, ha ben wir angenommen, dass der Ausdruck (4) für AI (r) im gesamten Raum gilt. Damit haben wir
Der Hyperfeinstruktur-Hamilton-Operator
|
1265
•
vernachlässigt, dass das Feld B innerhalb des Protons die Form (20) hat. Es stellt sich die Frage, L ob dies korrekt ist und ob es auch in Whf einen Kontaktterm gibt. Das ist nicht der Fall. Der Term mit P ⋅ AI + AI ⋅ P würde uns für das Feld Bi auf einen Operator proportional zu Bi ⋅ L =
2 μ0 MI 3 L z 4π ρ0
(27)
führen. Wir berechnen das Matrixelement dieses Operators in der {|φ k,l,m,ε ⟩}-Darstellung: Wegen des Operators L z folgt wie oben l, l ≥ 1. Die Radialfunktion, die zwischen 0 und ρ0 zu integrieren ist, verhält sich im Ursprung wie r l+l +2 und geht daher mindestens wie r 4 gegen null. Trotz des 3 1/ρ0 -Terms in Gl. (27) strebt das Integral von r = 0 bis r = ρ0 deshalb für ρ0 → 0 gegen null.
3 Schlussfolgerung Dip
L K Wir bilden nun die Summe aus den Operatoren Whf , Whf und Whf . Dabei verwenden wir die Tatsache, dass das magnetische Dipolmoment MI des Protons proportional zu seinem Drehimpuls I ist:
M I = gp μ n I/ℏ
(28)
(s. § B-2-a von Kapitel XII); es ergibt sich Whf = −
μ 0 2μB μ n gp I ⋅ L (I ⋅ R)(S ⋅ R) I ⋅ S 8π { 3 +3 − 3 + I ⋅ Sδ(R)} 4π 3 ℏ2 R R5 R
(29)
Dieser Operator wirkt sowohl im Zustandsraum des Elektrons als auch im Zustands raum des Protons. Man sieht, dass er mit dem in Kapitel XII [s. Gl. (B-20)] eingeführten Operator übereinstimmt. Bemerkungen: 1. Wir wollen die Verallgemeinerung von Gl. (29) auf den Fall eines Atoms mit einem Kernspin I > 1/2 diskutieren: Für I = 1 haben wir bereits gesehen, dass der Kern ein elektrisches Quadrupolmoment haben kann, das zum Potential (2) beiträgt. Zusätzlich zum magnetischen Dipolterm (29) besitzt der Hy perfeinstruktur-Hamilton-Operator also einen elektrischen Quadrupolterm. Da eine elektrische Wechselwirkung den Elektronenspin nicht direkt beeinflusst, wirkt dieser Quadrupolterm nur auf die Bahnvariablen des Elektrons. Für I > 1 kann es weitere elektrische oder magnetische Momente des Kerns geben, deren Anzahl mit wachsendem I zunimmt. Aus den elektrischen Momenten ergeben sich Hyperfeinstruktur terme, die nur auf die Bahnvariablen des Elektrons wirken, während die magnetischen Terme sowohl auf die Bahn- als auch auf die Spinvariablen wirken. Für große Werte von I weist der Hyperfeinstruktur-Hamilton-Operator somit eine sehr komplexe Struktur auf. In der Praxis kann man allerdings in der überwiegenden Anzahl der Fälle den Hyperfeinstruktur-Hamilton-Operator auf die magnetischen Dipol- und die elektrischen Quadrupolterme beschränken, weil die Mul tipolmomente des Kerns mit einer Ordnung größer als Zwei nur sehr kleine Modifikationen der Hyperfeinstruktur der Atome ergeben. Das hängt mit der extrem kleinen Größe des Kerns im Ver gleich mit der räumlichen Ausdehnung a0 der Wellenfunktionen zusammen. Diese Effekte lassen sich experimentell nur sehr schwer beobachten.
•
1266 | Ergänzung AXII 2. Die vereinfachende Annahme, die wir über das vom Proton erzeugte Feld B(r) gemacht ha ben (ein homogenes Feld innerhalb des Kerns, ein Dipolfeld außerhalb), ist nicht von wesentli cher Bedeutung. Die Form (25) des magnetischen Dipol-Hamilton-Operators bleibt für eine belie bige Verteilung der Kernmagnetisierung gültig, die auf kompliziertere innere Felder Bi (r) führt, (wobei man allerdings annimmt, dass die räumliche Ausdehnung des Kerns im Vergleich zu a0 vernachlässigbar ist; s. die folgende Bemerkung). Begründen lässt sich das mit einer direkten Verallgemeinerung der Überlegungen in dieser Ergänzung. Wir betrachten eine Kugel S ε um den Ursprung, die den Kern enthält und einen Radius ε ≪ a0 besitzt. Für I = 1/2 ist das Feld außerhalb von S ε von der Form (16). Da ε im Vergleich zu a0 sehr klein ist, führt sein Beitrag auf die Terme (13) und (22). Der Beitrag des Felds B(r) innerhalb von S ε hängt nur von dem Wert der Elektronen-Wellenfunktionen im Ursprung und vom Integral von B(r) innerhalb von S ε ab. Da der Fluss von B(r) durch alle geschlossenenen Oberflächen null ist, kann das Integral jeder Komponente von B(r) innerhalb von S ε in ein Integral außerhalb von S ε über führt werden, wo B(r) die Form (16) besitzt. Eine einfache Rechnung führt dann wieder auf den Ausdruck (25), der somit unabhängig von der von uns verwendeten vereinfachenden Annahme gültig ist. Für I > 1/2 erzeugt der Beitrag des Kerns zum elektromagnetischen Feld außerhalb von S ε die in Bemerkung 1 diskutierten Multipolterme im Hyperfeinstruktur-Hamilton-Operator. Andererseits lässt sich leicht zeigen, dass der Beitrag des Felds innerhalb von S ε nicht auf neue Terme führt; nur der magnetische Dipolterm besitzt einen Kontaktterm. 3. Bei unseren Überlegungen haben wir die Dimensionen des Atomkerns im Vergleich zu den Elektronen-Wellenfunktionen durchgehend vernachlässigt (wir betrachteten den Grenz fall ρ0 /a0 → 0). Das ist offensichtlich nicht immer realistisch, insbesondere nicht bei schweren Atomen, deren Kerne eine relativ große räumliche Ausdehnung besitzen. Wenn man solche Vo lumeneffekte berücksichtigt (indem man z. B. Terme niedriger Ordnung in ρ0 /a0 mitnimmt), tritt im Hamilton-Operator für die Elektron-Kern-Wechselwirkung eine Reihe neuer Terme auf. Wir sind auf diesen Effekt bereits in Ergänzung DXI eingegangen, als wir den Einfluss der radialen Kernladungsverteilung untersuchten (Kernmultipolmomente der Ordnung k = 0). Analoge Phä nomene treten auch aufgrund der räumlichen Verteilung der Kernmagnetisierung auf und führen zu Modifikationen der verschiedenen Terme des Hyperfeinstruktur-Hamilton-Operators (29). Insbesondere wird der Kontaktterm (25) um einen Term erweitert, wenn die Elektronen-Wellen funktionen innerhalb des Kerns merklich variieren. Dieser neue Term ist weder zu δ(R) noch zum magnetischen Gesamtmoment des Kerns proportional. Er hängt vielmehr von der räumli chen Verteilung der Kernmagnetisierung ab. Ein solcher Term ist in der Praxis von Interesse, da sich mit Hilfe genauer Messungen der Hyperfeinstruktur schwerer Atome Rückschlüsse auf die Verteilung der Magnetisierung innerhalb des entsprechenden Kerns ziehen lassen.
Referenzen und Literaturhinweise Hyperfein-Hamilton-Operator unter Berücksichtigung der elektrischen Quadrupol wechselwirkung: Abragam (14.1), Kap. VI; Kuhn (11.1), Kap. VI, § B; Sobel’man (11.12), Kap. 6.
Erwartungswerte und Feinstruktur |
1267
•
Ergänzung BXII Erwartungswerte und Feinstruktur 1 2 3 4
Berechnung von ⟨1/R⟩, ⟨1/R2 ⟩ und ⟨1/R3 ⟩ | 1267 Die Erwartungswerte ⟨W mv ⟩ | 1269 Die Erwartungswerte ⟨W D ⟩ | 1270 Berechnung des Koeffizienten ξ2p für W SB | 1271
Für das Wasserstoffatom ist der Feinstruktur-Hamilton-Operator Wf die Summe aus drei Termen, Wf = W mv + WSB + WD
(1)
auf die wir im Einzelnen in § B-1 von Kapitel XII eingegangen sind. In dieser Ergänzung stellen wir uns die Aufgabe, die Erwartungswerte dieser drei Operatoren im 1s-, 2s- und 2p-Zustand des Wasserstoffatoms zu bestimmen; diese Rechnung haben wir in Kapitel XII zur Vereinfachung ausgelassen. Wir beginnen mit der Berechnung der Erwartungswerte ⟨1/R⟩, ⟨1/R2 ⟩ und ⟨1/R3 ⟩ in diesen Zuständen.
1 Berechnung von ⟨1/R⟩, ⟨1/R 2 ⟩ und ⟨1/R 3 ⟩ Die Wellenfunktion des stationären Zustands eines Wasserstoffatoms lautet (s. Kapi tel VII, § C) φ n,l,m (r) = R n,l (r) Y lm (θ, φ)
(2)
Y lm (θ, φ) ist eine Kugelflächenfunktion. Die Ausdrücke für die Radialfunktionen R n,l (r) der 1s-, 2s-, 2p-Zustände werden gegeben durch R1,0 (r) = 2(a0 )−3/2 e−r/a0 R2,0 (r) = 2(2a0 )−3/2 (1 − R2,1 (r) = (2a0 )−3/2 3−1/2
r ) e−r/2a0 2a0 r −r/2a0 e a0
(3)
wobei a0 der Bohr-Radius ist: a0 = 4πε0
ℏ2 ℏ2 = 2 me q me e2
(4)
Die Funktionen Y lm sind bezüglich θ und φ normiert, so dass der Erwartungswert ⟨R q ⟩ der q-ten Potenz (q ist eine positive oder negative ganze Zahl) des zu r = |r| gehören https://doi.org/10.1515/9783110638769-027
•
1268 | Ergänzung BXII
den Operators R im Zustand |φ n,l,m ⟩ geschrieben werden kann¹ ∞
⟨R q ⟩n,l,m = ∫ r q+2 |R n,l (r)|2 dr
(5)
0
Er hängt somit nicht von m ab. Setzt man die Ausdrücke (3) in Gl. (5) ein, so führt das auf Integrale der Form ∞
I(k, p) = ∫ r k e−pr/a0 dr
(6)
0
mit ganzen Zahlen p und k. Wir wollen hier k ≥ 0, d. h. q ≥ −2 annehmen. Partielle Integration ergibt dann ∞
∞ ka0 a0 ∫ r k−1 e−pr/a0 dr I(k, p) = [− e−pr/a0 r k ] + p p 0 0
ka0 I(k − 1, p) = p
(7)
Da außerdem ∞
I(0, p) = ∫ e−pr/a0 dr =
a0 p
(8)
0
gilt, erhalten wir durch Rekursion I(k, p) = k! (
a0 k+1 ) p
(9)
Nun wenden wir dieses Ergebnis auf die zu bestimmenden Erwartungswerte an und erhalten ⟨1/R⟩1s = = ⟨1/R⟩2s = =
4 a30 4 a30
∞
∫ r e−2r/a0 dr 0
I(1, 2) =
4
∞
∫ r [1 −
8a30 0 1 2a30
1 a0
(10a)
r 2 −r/a0 ] e dr 2a0
[I(1, 1) −
1 1 1 I(2, 1) + I(3, 1)] = a0 4a0 4a20
(10b)
1 Natürlich existiert dieser Erwartungswert nur für solche Werte von q, für die das Integral (5) kon vergiert.
Erwartungswerte und Feinstruktur | 1269
•
∞
⟨1/R⟩2p
1 1 r 2 = ∫ r ( ) e−r/a0 dr 3 3 a0 8a0 0
=
1 24a50
I(3, 1) =
1 4a0
(10c)
Entsprechend wird ⟨1/R2 ⟩1s =
a30
I(0, 2) =
2 a20
(11a)
1 1 1 I(1, 1) + I(2, 1)] = 2 a0 4a0 4a20 1 1 = I(2, 1) = 5 12a20 24a0
⟨1/R2 ⟩2s = ⟨1/R2 ⟩2p
4 1
2a30
[I(0, 1) −
(11b) (11c)
Es ist klar, dass der Ausdruck für den Erwartungswert von 1/R3 für den 1s- und den 2s-Zustand keine Bedeutung hat [das Integral (5) divergiert]. Für den 2p-Zustand er gibt sich ⟨1/R3 ⟩2p =
1 24a50
I(1, 1) =
1 24a30
(12)
2 Die Erwartungswerte ⟨W mv ⟩ Wir bezeichnen den Hamilton-Operator eines Elektrons unter dem Einfluss eines Cou lomb-Potentials mit P2 +V 2me
(13)
P4 = 4m2e [H0 − V]2
(14a)
H0 = Es ist
mit V =−
e2 R
(14b)
so dass wir erhalten W mv = −
1 [H0 − V]2 2me c2
(15)
Wir berechnen die Erwartungswerte der beiden Seiten dieser Gleichung in einem Zustand |φ n,l,m ⟩. Da H0 und V hermitesche Operatoren sind, finden wir ⟨W mv ⟩n,l,m = −
1 [E2 + 2E n e2 ⟨1/R⟩n,l + e4 ⟨1/R2 ⟩n,l ] 2me c2 n
(16)
•
1270 | Ergänzung BXII
In diesem Ausdruck verwendeten wir En = −
EI 1 = − 2 α2 me c2 2 n 2n
(17)
mit der Feinstrukturkonstanten α=
e2 ℏc
(18)
Wenden wir Gl. (16) auf den Fall des 1s-Zustands an, so erhalten wir mit den Glei chungen (10a) und (11a) ⟨W mv ⟩1s = −
e2 1 1 e4 [ α 4 m2e c4 − α 2 me c2 +2 2] 2 a0 2me c 4 a0
(19)
und da nach Gl. (4) und Gl. (18) e2 /a0 = α 2 me c2 gilt, 1 1 5 ⟨W mv ⟩1s = − α 4 me c2 [ − 1 + 2] = − α 4 me c2 2 4 8
(20)
Eine analoge Rechnung führt für den 2s-Zustand auf 1 1 2 11 1 13 4 ⟨W mv ⟩2s = − α 4 me c2 [( ) − 2 + ]=− α me c2 2 8 84 4 128
(21)
und für den 2p-Zustand auf 1 1 2 11 1 7 4 ⟨W mv ⟩2p = − α 4 me c2 [( ) − 2 + ]=− α me c2 2 8 8 4 12 384
(22)
3 Die Erwartungswerte ⟨WD ⟩ Unter Beachtung von Gl. (14b) und der Relation ∆(1/r) = −4πδ(r) kann der Erwar tungswert von WD geschrieben werden [s. auch Gl. (B-14) aus Kapitel XII] ⟨WD ⟩n,l,m =
ℏ2 4πe2 |φ n,l,m (r = 0)|2 8m2e c2
(23)
Dieser Ausdruck geht für φ n,l,m (r = 0) = 0 gegen null, also für l ≠ 0. Daher ist ⟨WD ⟩2p = 0
(24a)
Für das 1s- und das 2s-Niveau erhalten wir mit Gl. (2) und Gl. (23) und unter Verwen dung von Y00 = 1/√4π ⟨WD ⟩1s =
ℏ2 1 e2 |R1,0 (0)|2 = α 4 me c2 2 2 2 8me c
(24b)
ℏ2 1 4 e2 |R2,0 (0)|2 = α me c2 2 2 16 8me c
(24c)
bzw. ⟨WD ⟩2s =
Erwartungswerte und Feinstruktur | 1271
•
4 Berechnung des Koeffizienten ξ 2p für WSB In § C-2-c-β von Kapitel XII definierten wir den Koeffizienten ∞
ξ2p
|R2,1 (r)|2 e2 = ∫ dr 2 2 r 2me c
(25)
0
Mit der letzten der Gleichungen (3) ergibt sich ξ2p =
1 e2 I(1, 1) 2 2 2me c 24a50
(26)
woraus dann mit Gl. (9) folgt ξ2p =
1 e2 1 = α4 me c2 2 2 3 2 48ℏ 2me c 24a0
(27)
Referenzen und Literaturhinweise Mehr Integrale über die radialen Wellenfunktionen des Wasserstoffs sind in Bethe und Salpeter angegeben, siehe (11.10).
•
1272 | Ergänzung CXII
Ergänzung CXII Hyperfeinstruktur und Zeeman-Effekt für das Myonium und das Positronium 1 2 2-a 2-b 2-c 2-d
Die Hyperfeinstruktur des 1s-Grundzustands | 1272 Der Zeeman-Effekt des 1s-Grundzustands | 1273 Der Zeeman-Hamilton-Operator | 1273 Energien der stationären Zustände | 1274 Das Zeeman-Diagramm für das Myonium | 1275 Zeeman-Diagramm für das Positronium | 1278
In Ergänzung AVII untersuchten wir einige wasserstoffartige Systeme, also Systeme, die aus zwei entgegengesetzt geladenen Teilchen bestehen. Zwei Systeme sind beson ders interessant: das Myonium (aus einem Elektron e− und einem positiven Myon μ+ ) und das Positronium (aus einem Elektron e− und einem Positron e+ ). Ihre besondere Bedeutung liegt darin, dass die jeweils beteiligten Teilchen (das Elektron, das Positron und das Myon) im Gegensatz zum Proton nicht der starken Wechselwirkung unterlie gen. Die theoretische und experimentelle Untersuchung von Myonium und Positroni um ist daher ein sehr präziser Test für die Gültigkeit der Quantenelektrodynamik. Die genaueste Information, die wir zur Zeit über diese Systeme besitzen, erlangt man aus der Untersuchung der Hyperfeinstruktur ihres 1s-Grundzustands. Sie ist wie beim Wasserstoffatom das Ergebnis der magnetischen Wechselwirkung zwischen den Spins der beiden Teilchen. In dieser Ergänzung wollen wir einige interessante Eigen schaften der Hyperfeinstruktur und des Zeeman-Effekts für das Myonium und Posi tronium beschreiben.
1 Die Hyperfeinstruktur des 1s-Grundzustands Den Elektronenspin bezeichnen wir mit S1 und den Spin des anderen Teilchens (das Myon und das Positronium sind beide Spin-1/2-Teilchen) mit S2 . Der 1s-Grundzu stand ist wie beim Wasserstoffatom vierfach entartet. Die magnetische Wechselwirkung zwischen S1 und S2 lässt sich mit der statio nären Störungstheorie untersuchen; die Rechnung verläuft analog zu der in § D von Kapitel XII. Beide Teilchen haben den Spin 1/2. Dies führt zu einer Wechselwirkung der Form AS1 ⋅ S2
(1)
wobei A eine Konstante ist, die von dem betrachteten System abhängt. Mit AH , AM und AP wollen wir die drei Werte von A für Wasserstoff, Myonium bzw. Positronium bezeichnen. https://doi.org/10.1515/9783110638769-028
Hyperfeinstruktur und Zeeman-Effekt für das Myonium und das Positronium
|
1273
•
Offensichtlich gilt AH < AM < AP
(2)
da das magnetische Moment von Teilchen (2) umso größer ist, je kleiner seine Masse ist. Das Positron ist 200-mal leichter als das Myon, das wiederum etwa 10-mal leichter als das Proton ist. Bemerkung: Die in Kapitel XII entwickelte Theorie reicht für die extrem genaue Untersuchung der Hyperfein struktur von Wasserstoff, Myonium und Positronium nicht aus. Insbesondere beschreibt der in § B-2 von Kapitel XII angegebene Hyperfeinstruktur-Hamilton-Operator Whf nur einen Teil der Wechselwirkungen zwischen Teilchen (1) und (2). Zum Beispiel spiegelt sich die Tatsache, dass Elektron und Positron ihre jeweiligen Antiteilchen sind (sie können zerstrahlen), in einer zusätzli chen Kopplung wider, die für Wasserstoff und Myonium nicht auftritt. Zusätzlich muss eine Reihe anderer Korrekturen (relativistische Korrekturen, Strahlungskorrekturen, Rückstoßeffekte usw.) berücksichtigt werden; ihre Behandlung ist kompliziert und erfordert die Anwendung der Quan tenelektrodynamik. Schließlich treten für das Wasserstoffatom noch Kernkorrekturen auf, die mit der Struktur und der Polarisierbarkeit des Protons zusammenhängen. Es lässt sich jedoch zei gen, dass die Form (1) für die Kopplung zwischen S1 und S2 gültig bleibt, wobei allerdings die Konstante A durch einen sehr viel komplizierteren Ausdruck als den in Gl. (D-8) von Kapitel XII gegebenen. Die Bedeutung der in dieser Ergänzung untersuchten wasserstoffartigen Systeme liegt gerade darin, dass wir mit ihrer Hilfe den theoretischen Wert von A mit den experimentel len Ergebnissen vergleichen können.
Die Eigenzustände von AS1 ⋅ S2 sind die Zustände |F, m F ⟩, wobei F und m F die Quan tenzahlen des Gesamtdrehimpulses F = S1 + S2
(3)
sind. Wie beim Wasserstoffatom kann F zwei Werte annehmen: F = 1 und F = 0. Diese beiden Niveaus haben die Energie Aℏ2 /4 bzw. −3Aℏ2 /4. Ihr Abstand Aℏ2 er gibt die Hyperfeinstruktur des 1s-Grundzustands. In Megahertz ausgedrückt beträgt dieser Abstand für das Myonium ℏ AM = (4 463.317 ± 0.021) MHz 2π und für das Positronium ℏ AP = (203 403 ± 12) MHz 2π
(4)
(5)
2 Der Zeeman-Effekt des 1s-Grundzustands 2-a Der Zeeman-Hamilton-Operator Wenn wir ein konstantes Magnetfeld B0 parallel zur z-Achse anlegen, müssen wir zum Hyperfeinstruktur-Hamilton-Operator (1) den Zeeman-Hamilton-Operator addieren,
•
1274 | Ergänzung CXII
der die Kopplung von B0 an die magnetischen Momente M1 = γ 1 S1
(6)
M2 = γ 2 S2
(7)
und
der beiden Spins mit den gyromagnetischen Verhältnissen γ1 und γ2 beschreibt. In dem wir ω1 = −γ1 B0
(8)
ω2 = −γ2 B0
(9)
setzen, können wir den Zeeman-Hamilton-Operator schreiben ω1 S1z + ω2 S2z
(10)
Beim Wasserstoffatom ist das magnetische Moment des zweiten Teilchens, des Protons, sehr viel kleiner als das des Elektrons. Diese Eigenschaft verwendeten wir in § E-1 von Kapitel XII, um die Zeeman-Kopplung des Protons im Vergleich zu der des Elektrons vernachlässigen zu können.¹ Diese Näherung ist für das Myonium weniger gut gerechtfertigt, da das magnetische Moment des Myons größer als das des Protons ist. Wir wollen daher beide Terme von (10) berücksichtigen. Für das Positronium sind sie sogar gleich wichtig: Das Elektron und das Positron haben gleiche Massen und entgegengesetzte Ladungen, so dass gilt γ1 = −γ2
(11)
oder ω1 = −ω2
(12)
2-b Energien der stationären Zustände Wenn B0 nicht null ist, müssen wir zur Bestimmung der Energien der stationären Zu stände die Matrix diagonalisieren, die den Gesamt-Hamilton-Operator AS1 ⋅ S2 + ω1 S1z + ω2 S2z
(13)
in einer beliebigen orthonormalen Basis, etwa der {|F, m F ⟩}-Basis, darstellt. Eine Rechnung analog zu der in Kapitel XII, § E-4 führt auf die Matrix (die Reihenfolge der 1 Das gyromagnetische Verhältnis des Elektronenspins ist γ 1 = 2μ B /ℏ (μ B : Bohr-Magneton). Setzen wir ω0 = −μ B B0 /ℏ (Larmor-Frequenz), so ist die in der ersten Gleichung (8) definierte Konstante ω1 gleich 2ω0 (es handelt sich hierbei um die Bezeichnung aus Kap. XII, § E; um die Ergebnisse jenes Abschnitts zu erhalten, reicht es also aus, in dieser Ergänzung ω1 durch 2ω0 und ω2 durch 0 zu er setzen).
Hyperfeinstruktur und Zeeman-Effekt für das Myonium und das Positronium
|
1275
•
Basisvektoren ist {|1, 1⟩, |1, −1⟩, |1, 0⟩, |0, 0⟩}) Aℏ2 4
+ 2ℏ (ω1 + ω2 )
0 Aℏ2 4
− 2ℏ (ω1 + ω2 )
( ( ( (
0 0
0
(
0
0
0 0 Aℏ2 4 ℏ 2 (ω 1
− ω2 )
0 ) ) ) ) ℏ (ω − ω ) 1 2 2 0
(14)
2
− 3Aℏ 4
)
Die Matrix (14) kann in zwei 1×1- und eine 2×2-Untermatrix aufgespalten werden. Zwei Eigenwerte sind also unmittelbar abzulesen: Aℏ2 ℏ + (ω1 + ω2 ) 4 2 Aℏ2 ℏ E2 = − (ω1 + ω2 ) 4 2 E1 =
(15) (16)
Sie gehören zu den Zuständen |1, 1⟩ bzw. |1, −1⟩, die mit den Zuständen |+, +⟩ und |−, −⟩ aus der {|ε1 , ε2 ⟩}-Basis der gemeinsamen Eigenzustände von S1z und S2z über einstimmen. Die anderen beiden Eigenwerte ergeben sich mit der Diagonalisierung der verbleibenden 2 × 2-Matrix und sind E3 = −
Aℏ2 √ Aℏ2 2 ℏ2 + ( ) + (ω1 − ω2 )2 4 2 4
(17)
E4 = −
Aℏ2 √ Aℏ2 2 ℏ2 − ( ) + (ω1 − ω2 )2 4 2 4
(18)
In einem schwachen Feld entsprechen sie den Zuständen |1, 0⟩ bzw. |0, 0⟩ und in ei nem starken Feld den Zuständen |+, −⟩ und |−, +⟩.
2-c Das Zeeman-Diagramm für das Myonium Der einzige Unterschied zu den Ergebnissen in Kapitel XII, § E-4 besteht darin, dass wir hier auch die Zeeman-Kopplung des Teilchens (2) mit in Betracht ziehen. Dieser Unterschied wird nur in einem ausreichend starken Feld spürbar. Betrachten wir also die Ausdrücke für die Energien E3 und E4 für ℏ(ω1 − ω2 ) ≫ Aℏ2 , dann gilt Aℏ2 ℏ + (ω1 − ω2 ) 4 2 Aℏ2 ℏ E4 ≃ − − (ω1 − ω2 ) 4 2
E3 ≃ −
(19) (20)
Wir vergleichen nun den Ausdruck (19) mit (15) und (20) mit (16): Wir sehen, dass in einem starken Feld die Energieniveaus nicht mehr wie in Kapitel XII, § E-3 durch Paare paralleler Linien dargestellt werden. Die Steigungen der Asymptoten des E1 -
•
1276 | Ergänzung CXII
und des E3 -Niveaus sind −ℏ(γ1 + γ2 )/2 bzw. −ℏ(γ1 − γ2 )/2 und entsprechend die des E2 - und E4 -Niveaus ℏ(γ1 + γ2 )/2 und ℏ(γ1 − γ2 )/2. Da die beiden Teilchen (1) und (2) entgegengesetzt geladen sind, haben γ1 und γ2 entgegengesetzte Vorzeichen. In einem ausreichend starken Feld wandert demnach das E3 -Niveau (das dann dem Zu stand |+, −⟩ entspricht) über das E1 -Niveau (entsprechend dem Zustand |+, +⟩), da seine Steigung −ℏ(γ1 − γ2 )/2 größer als −ℏ(γ1 + γ2 )/2 ist. Der Abstand zwischen E1 und E3 hängt somit in folgender Weise von B0 ab (s. Abb. 1): Bei null beginnend steigt er für den Wert B0 auf ein Maximum, der die Ableitung von E1 − E3 =
Aℏ2 + f(B0 ) 2
(21)
mit ℏ Aℏ2 2 ℏ2 B20 f(B0 ) = − (γ1 + γ2 )B0 − √( (22) ) + (γ1 − γ2 )2 2 2 4 verschwinden lässt. Der Abstand geht dann erneut auf null und steigt schließlich un begrenzt an. Der Abstand zwischen E2 und E4 beginnt mit dem Wert Aℏ2 , fällt für den Wert B0 , bei dem die Ableitung von E2 − E4 =
Aℏ2 − f(B0 ) 2
(23)
verschwindet, auf ein Minimum und wächst dann wiederum unbegrenzt. Da in Gl. (21) und (23) dieselbe Funktion f(B0 ) auftritt, können wir zeigen, dass derselbe Wert B0 (derjenige, für den die Ableitung von f(B0 ) verschwindet) den Abstand zwischen dem E1 - und E3 -Niveau bzw. dem E2 - und E4 -Niveau entweder minimal oder maximal wer den lässt. Diese Eigenschaft lässt sich verwenden, um die Genauigkeit der experimen tellen Bestimmung der Hyperfeinstruktur des Myoniums zu erhöhen. Bremst man polarisierte Myonen (z. B. im Zustand |+⟩) in einem dünnen Gastar get ab, so kann man in einem starken Feld myonische Atome erzeugen, die vorzugs weise in den Zuständen |+, +⟩ und |−, +⟩ vorliegen. Wenn man nun gleichzeitig zwei Radiofrequenzfelder mit Frequenzen bei (E1 − E3 )/h und (E2 − E4 )/h anlegt, so wer den Resonanzübergänge von |+, +⟩ nach |+, −⟩ und von |−, +⟩ nach |−, −⟩ induziert (Pfeile in Abb. 1). Sie werden im Experiment nachgewiesen, da sie einem Umklappen des Myonenspins entsprechen, was sich beim β-Zerfall der Myonen in einer Aniso tropieänderung der emittierten Positronen widerspiegelt. Wählt man das Feld B0 so, dass die Ableitung von f(B0 ) verschwindet, so stellen die Inhomogenitäten des Fel des in der Gaszelle kein Problem dar, weil die Resonanzfrequenzen (E1 − E3 )/h und (E2 − E4 )/h des Myoniums von einer Magnetfeldänderung nicht in erster Ordnung be einflusst werden. Bemerkung: Für den Grundzustand des Wasserstoffatoms erhalten wir entsprechend zu Abb. 1 ein ZeemanDiagramm, wenn wir die Zeeman-Kopplung zwischen dem Protonenspin und dem Feld B0 mit berücksichtigen.
Hyperfeinstruktur und Zeeman-Effekt für das Myonium und das Positronium
|
1277
•
Abb. 1: Zeeman-Diagramm des 1s-Grundzustands von Myonium. Da wir hier die Zeeman-Kopplung zwischen dem magnetischen Moment des Myons und dem konstanten Magnetfeld B0 nicht vernach lässigen, sind die beiden durchgezogenen Linien (die in einem starken Feld derselben Orientierung des Elektronenspins aber entgegengesetzter Orientierung des Myonenspins entsprechen) nicht mehr wie für das Wasserstoffatom parallel (im Zeeman-Diagramm von Abb. 9 in Kapitel XII wurde die Larmor-Frequenz ω n des Protons vernachlässigt). Für denselben Wert des Felds B 0 wird der Abstand zwischen E 1 und E 3 maximal und zwischen E 2 und E 4 minimal. Die Pfeile stellen die Übergänge dar, die experimentell für diesen Wert B 0 untersucht werden.
•
1278 | Ergänzung CXII
2-d Zeeman-Diagramm für das Positronium Wenn wir in Gl. (15) und Gl. (16) ω1 = −ω2 setzen (diese Eigenschaft folgt direkt aus der Tatsache, dass das Positron das Antiteilchen des Elektrons ist), so ist das E1 - und das E2 -Niveau von B0 unabhängig: E1 = E2 =
Aℏ2 4
(24)
Andererseits erhalten wir aus Gl. (17) und Gl. (18) E3 = −
Aℏ2 √ Aℏ2 2 + ( ) + ℏ2 γ21 B20 4 2
(25)
E4 = −
Aℏ2 √ Aℏ2 2 − ( ) + ℏ2 γ21 B20 4 2
(26)
Das Zeeman-Diagramm für das Positronium hat daher die in Abb. 2 dargestellte Form. Es besteht aus zwei sich überlagernden Geraden parallel zur B0 -Achse und einer Hy perbel.
Abb. 2: Zeeman-Diagramm des 1s-Grundzu stands des Positroniums. Wie bei Wasserstoff und Myonium besteht das Diagramm aus einer Hyperbel und zwei geraden Linien. Da die gy romagnetischen Verhältnisse von Elektron und Positron entgegengesetzt gleich sind, haben die beiden geraden Linien jedoch die Steigung null und überlagern sich (in den beiden zuge hörigen Zuständen mit der Energie E 1 und E 2 ist das magnetische Gesamtmoment null, da Elektronen- und Positronenspin parallel sind). Der Pfeil stellt den experimentell untersuchten Übergang dar.
Hyperfeinstruktur und Zeeman-Effekt für das Myonium und das Positronium
| 1279
•
Das Positronium ist instabil; es zerfällt unter Emission von Photonen. In einem Feld null lässt sich anhand von Symmetrieüberlegungen zeigen, dass der F = 0-Zu stand (Singulett-Spinzustand oder Parapositronium) beim Zerfall zwei Photonen emittiert. Seine Halbwertszeit beträgt τ 0 ≈ 1.25 × 10−10 s. Der F = 1-Zustand (Tri plett-Spinzustand oder Orthopositronium) hingegen kann nur durch die Emission von drei Photonen zerfallen (der Zwei-Photonen-Übergang ist verboten). Dieser Pro zess ist viel weniger wahrscheinlich und die Halbwertszeit des Tripletts demnach viel größer: τ 1 ≈ 1.4 × 10−7 s. Wenn man ein konstantes Feld anlegt, behalten das E1 - und das E2 -Niveau diesel be Lebensdauer, da die entsprechenden Eigenzustände nicht von B0 abhängen. Der Zustand |1, 0⟩ hingegen ist mit |0, 0⟩ „gemischt“ und umgekehrt. Rechnungen ana log zu denen von Ergänzung HIV zeigen, dass die Lebensdauer des E3 -Niveaus im Ver gleich zu ihrem Wert τ 1 im verschwindenden Feld reduziert wird (die des E4 -Niveaus wird im Vergleich zu τ0 erhöht). Die Positroniumatome im E3 -Niveau zerfallen dann mit einer gewissen Wahrscheinlichkeit unter Emission zweier Photonen. Der Unterschied in den Lebensdauern der drei Energiezustände E1 , E2 , E3 in An wesenheit eines Felds B0 stellt die Grundlage für die Methoden zur Messung der Hy perfeinstruktur des Positroniums dar. Die Bildung von Positroniumatomen durch den Einfang eines Positrons durch ein Elektron führt allgemein zu einer gleichen Anzahl von Energiezuständen E1 , E2 , E3 , E4 . Bei angelegtem Feld B0 zerfallen die beiden Zu stände E1 und E2 langsamer als der E3 -Zustand, so dass sie im stationären Zustand häufiger sind. Legt man nun ein Radiofrequenzfeld mit der Oszillationsfrequenz (E3 − E1 )/h = (E3 −E2 )/h an, so werden Resonanzübergänge von den E1 - und E2 -Zuständen in den E3 -Zustand induziert (Pfeil in Abb. 2). Dadurch wird die Zerfallsrate über ZweiPhotonen-Emission erhöht und die Beobachtung der Resonanz ermöglicht, wenn (bei festgehaltenem B0 ) die Frequenz des oszillierenden Felds variiert wird. Über die Be stimmung von E3 − E1 bei einem gegebenen Wert B0 kann dann mit Hilfe von Gl. (24) und Gl. (25) die Konstante A ermittelt werden. Auch in einem verschwindenden Feld könnten Resonanzübergänge zwischen den ungleich besetzten F = 1- und F = 0-Niveaus induziert werden. Die entsprechende Re sonanzfrequenz (5) ist allerdings sehr groß und experimentell nicht leicht zu erzeu gen. Deshalb arbeitet man lieber mit dem „niederfrequenten“ Übergang, der durch den Pfeil in Abb. 2 dargestellt ist.
Referenzen und Literaturhinweise Siehe den Unterabschnitt „Exotische Atome“ im Abschnitt 11 der Bibliographie. Die Annihilation des Positroniums wird in Feynman, Bd. 5 (1.2), § 18-3 diskutiert.
•
1280 | Ergänzung DXII
Ergänzung DXII Elektronenspin und Zeeman-Effekt 1 2 3 4 4-a 4-b 4-c
Einleitung | 1280 Zeeman-Diagramme des 1s- und 2s-Niveaus | 1281 Zeeman-Diagramme des 2p-Niveaus | 1282 Zeeman-Effekt der Resonanzlinie | 1284 Problemstellung | 1284 Zeeman-Komponenten im schwachen Feld | 1285 Zeeman-Komponenten im starken Feld. Paschen-Back-Effekt | 1285
1 Einleitung Die Aussagen, die wir in Ergänzung DVII über den Zeeman-Effekt für die Resonanzlinie des Wasserstoffatoms (der Übergang 1s ↔ 2p) getroffen haben, müssen modifiziert werden, wenn zusätzlich der Elektronenspin mit den entsprechenden magnetischen Wechselwirkungen berücksichtigt werden soll. Unter Verwendung der Ergebnisse aus Kapitel XII wollen wir dies jetzt tun. Zur Vereinfachung vernachlässigen wir Effekte, die mit dem Kernspin zusammen hängen (sie sind sehr viel geringer als die Effekte des Elektronenspins). Wir sehen da her von der Hyperfeinstrukturkopplung Whf (Kap. XII, § B-2) ab und betrachten einen Hamilton-Operator der Form H = H0 + Wf + WZ
(1)
Dabei bezeichnet H0 den elektrostatischen Hamilton-Operator aus § C von Kapitel VII, Wf ist die Summe der Feinstrukturterme (s. Kap. XII, § B-1), Wf = W mv + WD + WSB
(2)
und WZ ist der Zeeman-Hamilton-Operator (s. Kap. XII, § E-1), der die Wechselwirkung des Atoms mit einem Magnetfeld B0 parallel zur z-Achse beschreibt: WZ = ω0 (L z + 2S z )
(3)
die Larmor-Frequenz ω0 wird gegeben durch ω0 = −
q B0 2me
(4)
[wir vernachlässigen ω n gegenüber ω0 ; s. Gl. (E-4) aus Kapitel XII]. Wir bestimmen die Eigenwerte und Eigenvektoren von H mit einer ähnlichen Me thode wie in § E von Kapitel XII: Wir behandeln Wf und WZ als Störungen von H0 . Ob wohl die 2s- und die 2p-Niveaus dieselbe ungestörte Energie haben, können wir sie https://doi.org/10.1515/9783110638769-029
Elektronenspin und Zeeman-Effekt | 1281
•
getrennt untersuchen, da sie weder untereinander, noch mit Wf (Kap. XII, § C-2-a-β) oder WZ in Zusammenhang stehen. In dieser Ergänzung bezeichnen wir das Magnet feld B0 als schwach oder stark, je nachdem ob WZ im Vergleich zu Wf klein oder groß ist. Zu beachten ist dabei, dass die hier als „schwach“ bezeichneten Felder solche sind, für die WZ klein ist verglichen mit Wf aber groß verglichen mit Whf ; diese „schwachen Felder“ sind somit viel stärker als die in § E von Kapitel XII betrachteten. Sind die Eigenwerte und Eigenzustände von H einmal ermittelt, so können wir die zeitliche Entwicklung der Erwartungswerte der drei Komponenten des elektri schen Dipolmoments des Atoms bestimmen. Da eine analoge Rechnung bereits in Ergänzung DVII durchgeführt wurde, werden wir sie hier nicht wiederholen. Wir wer den lediglich die Frequenzen und Polarisationszustände der verschiedenen ZeemanKomponenten der Resonanzlinie des Wasserstoffs (der Lyman-α-Linie) für starke und schwache Felder angeben.
2 Zeeman-Diagramme des 1s- und 2s-Niveaus Wie wir in § D-1-b von Kapitel XII sahen, verschiebt Wf das 1s-Niveau insgesamt und erzeugt nur ein Feinstrukturniveau 1s1/2 ; dasselbe gilt für das 2s-Niveau, das zu 2s1/2 wird. In beiden Niveaus können wir eine Basis {|n; l = 0; m L = 0; m S = ±1/2; m I = ±1/2⟩}
(5)
aus gemeinsamen Eigenvektoren von H0 , L2 , L z , S z , I z wählen (da H nicht auf den Protonenspin wirkt, unterdrücken wir im Folgenden m I ). Die Vektoren (5) sind offensichtlich Eigenvektoren von WZ mit den Eigenwerten 2m S ℏω0 . Jedes 1s1/2 - oder 2s1/2 -Niveau wird demnach in einem Feld B0 in zwei Zee man-Unterniveaus der Energien E(n; l = 0; m L = 0; m S ) = E(ns1/2 ) + 2m S ℏω0
(6)
aufgespalten, wobei E(ns1/2 ) die in § C-2-b und § D-1-b von Kapitel XII berechnete Ener gie des ns1/2 -Niveaus ohne Feld bezeichnet. Das Zeeman-Digramm des 1s1/2 -Niveaus (und des 2s1/2 -Niveaus) besteht somit aus zwei geraden Linien der Steigungen +1 und −1 (Abb. 1), die den beiden möglichen Orientierungen des Spins relativ zu B0 (m S = +1/2 bzw. m S = −1/2) entsprechen. Der Vergleich von Abb. 1 mit Abb. 9 aus Kapitel XII zeigt, dass die hier voraus gesetzte Vernachlässigung des Kernspins dazu führt, so große Felder B0 zu betrach ten, dass WZ ≫ Whf gilt. Wir befinden uns dann im asymptotischen Bereich des Diagramms in Abb. 9 aus Kapitel XII, für den die Aufspaltung der Energieniveaus durch den Protonenspin und die Hyperfeinstrukturkopplung vernachlässigt werden kann.
•
1282 | Ergänzung DXII
Abb. 1: Zeeman-Diagramm des 1s1/2 -Niveaus bei Ver nachlässigung der Hyperfeinstrukturkopplung W hf . Die Ordinate des Punkts, in dem sich die beiden Ni veaus m S = ±1/2 schneiden, ist gleich der Energie des 1s1/2 -Niveaus (das ist der Eigenwert −E I von H 0 , der aufgrund des Feinstruktur-Hamilton-Operators W f insgesamt verschoben ist). Die Modifizierungen die ses Diagramms unter der Wirkung von W hf lassen sich Abb. 9 in Kapitel XII entnehmen.
3 Zeeman-Diagramme des 2p-Niveaus Im sechsdimensionalen 2p-Unterraum können wir die Basis {|n = 2; l = 1; m L ; m S ⟩}
(7)
oder {|n = 2; l = 1; J; m J ⟩}
(8)
wählen, die den Drehimpulsen L und S bzw. dem Gesamtdrehimpuls J angepasst sind [s. Gleichungen (36a) und (36b) in Ergänzung AX ]. Die Terme W mv und WD , die im Ausdruck (2) für Wf auftreten, verschieben das 2p-Niveau als Ganzes. Zur Untersuchung der Zeeman-Niveaus des 2p-Niveaus diago nalisieren wir daher die 6 × 6-Matrix, die WSB + WZ in einer der beiden Basen (7) oder (8) darstellt. Diese Matrix kann, da WZ und WSB = ξ2p L ⋅ S beide mit J z = L z + S z vertauschen, in ebenso viele Untermatrizen aufgespalten werden, wie es verschiede ne Werte von m J gibt. Es treten somit zwei eindimensionale (entsprechend den Werten m J = +3/2 bzw. m J = −3/2) und zwei zweidimensionale Untermatrizen (entsprechend den Werten m J = +1/2 bzw. m J = −1/2) auf. Die Bestimmung der Eigenwerte und der zugehörigen Eigenvektoren (die der Rechnung in § E-4 von Kap. XII entspricht) stellt keine Schwierigkeit dar und führt auf das in Abb. 2 dargestellte Zeeman-Diagramm. Dieses Diagramm besteht aus zwei Geraden und vier Hyperbelzweigen. In einem Feld null hängen die Energien nur von J ab. Es ergeben sich die beiden Feinstrukturniveaus 2p3/2 und 2p1/2 , die wir bereits in § C von Kapitel XII untersucht haben, mit der Energie 1 ̃ E(2p3/2 ) = E(2p) + ξ2p ℏ2 (9) 2 ̃ − ξ2p ℏ2 (10) E(2p1/2 ) = E(2p)
Elektronenspin und Zeeman-Effekt |
1283
•
Abb. 2: Zeeman-Diagramm des 2p-Niveaus bei Vernachlässigung der Hyperfeinstruktur kopplung W hf . In einem Feld null liegen die Feinstrukturniveaus 2p 1/2 und 2p 3/2 vor. Das Zeeman-Diagramm besteht aus zwei geraden Linien und zwei Hyperbeln (deren Asymptoten als gestrichelte Linien eingezeichnet sind). Die Hyperfeinstrukturkopplung W hf würde das Diagramm nur in der Nähe von ω0 = 0 merk ̃ lich verändern. E(2p) bezeichnet die Energie des 2p-Niveaus (Eigenwert −E I /4 von H 0 ), die um die von W mv + W D erzeugte globale Verschiebung korrigiert ist.
̃ E(2p) ist die Energie des 2p-Niveaus E(2p), korrigiert um die globale Verschiebung aufgrund von W mv und WD . ξ2p ist die Konstante, die in der Einschränkung ξ2p L ⋅ S von WSB auf das 2p-Niveau auftritt [s. Gl. (C-13) in Kapitel XII]. In schwachen Feldern (WZ ≪ WSB ) lässt sich die Steigung der Energieniveaus erhalten, wenn man WZ als Störung von Wf behandelt. Es sind dann die 4 × 4- und 2×2-Matrizen zu diagonalisieren, die WZ im 2p3/2 - und 2p1/2 -Niveau darstellen. Rech nungen analog zu denen in Kapitel XII, § E-2 zeigen, dass diese beiden Untermatrizen jeweils proportional zu denen sind, die ω0 J z in denselben Unterräumen darstellen. Die Proportionalitätskoeffizienten, die Landé-Faktoren (s. Ergänzung DX , § 3), sind 4 g(2p3/2 ) = (11) 3 2 (12) g(2p1/2 ) = 3 In schwachen Feldern spaltet also jedes Feinstrukturniveau in 2J + 1 äquidistante Zee man-Unterniveaus auf. Die Eigenzustände sind dann Zustände der „gekoppelten“ Ba sis (8) mit den Eigenwerten E(J, m J ) = E(2p J ) + m J g(2p J ) ℏω0 wobei die E(2p J ) durch die Ausdrücke (9) und (10) gegeben werden.
(13)
•
1284 | Ergänzung DXII
In starken Feldern (WZ ≫ WSB ) können wir andererseits WSB = ξ2p L ⋅ S als Stö rung des Operators WZ , der in der Basis (7) diagonal ist, betrachten. Wie in § E-3-b von Kapitel XII lässt sich leicht zeigen, dass nur die Diagonalelemente von ξ2p L ⋅ S beitra gen, wenn die Korrekturen in erster Ordnung von WSB berechnet werden. Wir sehen also, dass die Eigenzustände in starken Feldern Zustände der „entkoppelten“ Basis (7) sind, und die zugehörigen Eigenwerte lauten ̃ E(m L , m S ) = E(2p) + (m L + 2m S )ℏω0 + m L m S ℏ2 ξ2p
(14)
Gl. (14) gibt die Asymptoten des Diagramms in Abb. 2 wieder. Mit dem Ansteigen des Felds B0 gehen wir kontinuierlich von Basis (8) zu Basis (7) über. Das magnetische Feld entkoppelt allmählich Bahndrehimpuls und Spin. Diese Situation entspricht der, die wir in § E von Kapitel XII untersuchten, wo die Drehim pulse S und I entweder ge- oder entkoppelt waren, je nach der relativen Stärke der Hyperfeinstrukturterme und des Zeeman-Terms.
4 Zeeman-Effekt der Resonanzlinie 4-a Problemstellung Mit Überlegungen wie in § 2-c von Ergänzung DVII (s. insbesondere die Bemerkung am Ende) lässt sich zeigen, dass der optische Übergang zwischen einem 2p- und einem 1s-Zeeman-Unterniveau nur dann möglich ist, wenn das Matrixelement des elektri schen Dipoloperators qR zwischen diesen beiden Zuständen nicht verschwindet (der elektrische Dipol hat als ungerader Operator keine Matrixelemente zwischen dem 1sund dem 2s-Zustand, die beide gerade sind. Deshalb gehen wir auf die 2s-Zustände hier nicht ein). Die Polarisation des emittierten Lichts ist σ + , σ − oder π, je nachdem ob der Operator q(X + iY), q(X − iY) oder qZ ein nichtverschwindendes Matrixelement zwischen den beiden betrachteten Zeeman-Unterniveaus hat. Wir können somit mit den oben ermittelten Eigenvektoren und Eigenwerten von H die verschiedenen Zee man-Komponenten der Wasserstoffresonanzlinie und die zugehörigen Polarisations zustände bestimmen. Bemerkung: Die Operatoren q(X + iY), q(X − iY) und qZ wirken nur auf den Bahnanteil der Wellenfunktionen und bewirken eine Änderung von m L um +1, −1 bzw. 0 (s. Ergänzung DVII , § 2-c); m S bleibt unver ändert. Da es sich bei m J = m L + m S um eine gute Quantenzahl handelt (für eine beliebige Stärke des Felds B0 ), sind ∆m J = +1-Übergänge σ + -polarisiert, ∆m J = −1-Übergänge σ − -polarisiert und ∆m J = 0-Übergänge π-polarisiert.
Elektronenspin und Zeeman-Effekt |
1285
•
4-b Zeeman-Komponenten im schwachen Feld In Abb. 4 sind die verschiedenen Zeeman-Unterniveaus, die aus den 1s1/2 -, 2p1/2 und 2p3/2 -Niveaus im schwachen Feld resultieren, dargestellt; sie ergeben sich aus den Gleichungen (6), (13), (11) und (12). Die vertikalen Pfeile geben die Zeeman-Kom ponenten der Resonanzlinie an. Die Polarisationen sind σ + , σ − oder π entsprechend ∆m J = +1, −1 oder 0.
(a)
(b) Abb. 3: Frequenzen der verschiedenen Zeeman-Komponenten der Wasserstoffresonanzlinie. (a) Feld null: Man beobachtet zwei durch das Feinstrukturintervall 3 ξ 2p ℏ/4π getrennte Linien (ξ 2p ist die Spin-Bahn-Kopplungskonstante des 2p-Niveaus), die zum Übergang 2p 3/2 ←→ 1s1/2 (rechte Linie) bzw. 2p 1/2 ←→ 1s1/2 (linke Linie) gehören. (b) Schwaches Feld B 0 : Jede Linie spaltet in eine Serie von Zeeman-Komponenten mit den angezeigten Polarisationen auf; ω 0 /2π ist die Larmor-Frequenz im Feld B 0 .
In Abb. 3 sind diese Komponenten auf einem Frequenzband relativ zu den Positionen für ein Feld null aufgetragen. Das Ergebnis unterscheidet sich beträchtlich von dem in Ergänzung DVII (s. Abb. 2 der Ergänzung), wo wir in einer Richtung senkrecht zu B0 drei äquidistante Komponenten der Polarisation σ + , π, σ − mit einem Frequenzabstand ω0 /2π gefunden haben.
4-c Zeeman-Komponenten im starken Feld. Paschen-Back-Effekt Abbildung 5 zeigt die verschiedenen Zeeman-Unterniveaus, die sich aus den 1s- und 2p-Niveaus im starken Feld ergeben [s. Gl. (6) und Gl. (14)]. In erster Ordnung von WSB wird die Entartung der zwei Zustände |m L = −1, m S = 1/2⟩ und |m L = 1, m S = −1/2⟩ nicht aufgehoben. Die vertikalen Pfeile geben die Zeeman-Komponenten der Resonanzlinie an. Die Polarisationen sind σ + , σ − oder π entsprechend ∆m J = +1, −1 oder 0 (bei einem elektrischen Dipolübergang wird die Quantenzahl m S nicht geän dert).
•
1286 | Ergänzung DXII
Abb. 4: Anordnung der Zeeman-Unterniveaus, die sich aus den Feinstrukturniveaus 1s1/2 , 2p 1/2 , 2p 3/2 (deren Energie im Feld null auf der vertikalen Energieskala angegeben ist) im schwachen Feld ergeben. Auf der rechten Seite der Abbildung sind die Aufspaltung zwischen benachbarten ZeemanUnterniveaus (zur Verdeutlichung ist diese Aufspaltung im Vergleich zur Feinstrukturaufspaltung zwischen dem 2p 1/2 - und 2p 3/2 -Niveau übertrieben groß dargestellt) und die Werte der Quanten zahlen J und m J von allen Unterniveaus angegeben. Die Pfeile zeigen die Zeeman-Komponenten der Resonanzlinie, die jeweils eine wohldefinierte Parität σ + , σ − oder π haben.
Das zugehörige optische Spektrum ist in Abb. 6 dargestellt. Während die beiden π-Übergänge dieselbe Frequenz aufweisen (s. Abb. 5), gibt es zwischen den Frequen zen der beiden σ + - und σ − -Übergänge eine kleine Aufspaltung ℏξ2p /2π. Der mittlere Abstand zwischen dem σ + -Dublett und der π-Linie (oder zwischen der π-Linie und dem σ− -Dublett) ist gleich ω0 /2π. Das Spektrum in Abb. 6 gleicht somit dem Spek trum in Abb. 2 von Ergänzung DVII . Die Aufspaltung der σ + - und σ − -Linien aufgrund des Elektronenspins lässt sich leicht verstehen: In starken Feldern sind L und S entkoppelt. Da der 1s ↔ 2p-Über
Elektronenspin und Zeeman-Effekt | 1287
•
Abb. 5: Anordnung der Zeeman-Unterniveaus, die aus den 1s- und 2p-Niveaus im starken Feld (ent koppelte Feinstruktur) entstehen. Auf der rechten Seite der Abbildung sind für die einzelnen Zee man-Unterniveaus die Werte der Quantenzahlen m L und m S und die entsprechenden Energien re ̃ lativ zu E(1s1/2 ) oder E(2p) angegeben. Die vertikalen Pfeile zeigen die Zeeman-Komponenten der Resonanzlinie.
gang ein elektrischer Dipolübergang ist, wirkt sich der optische Übergang nur auf den Bahndrehimpuls L des Elektrons aus. Eine Überlegung wie in § E-3-b von Kapitel XII zeigt, dass sich die mit dem Spin zusammenhängende magnetische Wechselwirkung durch ein „inneres Feld“, das zum äußeren Feld addiert wird, beschreiben lässt, des sen Vorzeichen davon abhängt, ob der Spin nach oben oder nach unten zeigt. Dieses innere Feld erzeugt die Aufspaltung der σ + - und σ − -Linien (die π-Linie wird nicht ver ändert, da ihre Quantenzahl m L gleich null ist).
•
1288 | Ergänzung DXII
Abb. 6: Lage der Zeeman-Komponenten der Wasserstoffresonanzlinie im starken Feld. Abgesehen von der Aufspaltung der σ + - und σ − -Linien entspricht dieses Spektrum dem aus Ergänzung DVII , wo die Spineffekte vernachlässigt wurden.
Referenzen und Literaturhinweise Cagnac und Pebay-Peyroula (11.2), Kap. XI und XVII (insbesondere § 5-A); White (11.5), Kap. X; Kuhn (11.1), Kap. III, § F; Sobel’man (11.12), Kap. 8, § 29.
Stark-Effekt des Wasserstoffatoms
|
1289
•
Ergänzung EXII Stark-Effekt des Wasserstoffatoms 1 1-a 1-b 2
Stark-Effekt beim n = 1-Niveau | 1289 Die Verschiebung des 1s-Zustands ist quadratisch in ℰ | 1289 Polarisierbarkeit des 1s-Zustands | 1290 Stark-Effekt beim n = 2-Niveau | 1291
Wir betrachten ein Wasserstoffatom in einem statischen elektrischen Feld 𝓔 parallel zur z-Achse. Zu dem in diesem Kapitel betrachteten Hamilton-Operator müssen wir dann den Stark-Hamilton-Operator WS addieren, der die Wechselwirkungsenergie des elektrischen Dipolmoments qR des Atoms mit dem Feld 𝓔 beschreibt; WS kann ge schrieben werden WS = −q𝓔 ⋅ R = −qℰZ
(1)
Selbst für die stärksten in einem Labor erzeugbaren elektrischen Felder gilt WS ≪ H0 . Allerdings kann für entsprechend starke Felder WS die Größenordnung von Wf oder Whf erreichen oder sogar übersteigen. Der Einfachheit halber wollen wir in die ser Ergänzung annehmen, dass das Feld ℰ stark genug ist, um den Einfluss von WS sehr viel größer als den von Wf oder Whf zu machen. Wir berechnen also mit Hilfe der Störungstheorie den Einfluss von WS direkt auf die in Kapitel VII bestimmten Eigenzu stände von H0 (der nächste Schritt, der hier allerdings nicht mehr durchgeführt wird, bestünde dann in der Berechnung des Einflusses von Wf und dann von Whf auf die Eigenzustände von H0 + WS ). Da weder H0 noch WS auf die Spinvariablen wirken, unterdrücken wir die Quan tenzahlen m S und m I .
1 Stark-Effekt beim n = 1-Niveau 1-a Die Verschiebung des 1s-Zustands ist quadratisch in 𝓔 Der Störungstheorie zufolge ergibt sich der Einfluss des elektrischen Felds in erster Ordnung aus der Berechnung des Matrixelements −qℰ⟨n = 1, l = 0, m L = 0 | Z | n = 1, l = 0, m L = 0⟩ Da der Operator Z ungerade ist und der Grundzustand eine wohldefinierte Parität be sitzt (er ist gerade), ist dieses Matrixelement gleich null. Es gibt daher keinen in ℰ linearen Effekt, und wir müssen zum nächsten Term der Störungsreihe gehen, ε2 = q2 ℰ 2
|⟨1, 0, 0 | Z | n, l, m⟩|2 E1 − E n n=1,l,m ̸ ∑
https://doi.org/10.1515/9783110638769-030
(2)
•
1290 | Ergänzung EXII
wobei E n = −EI /n2 der Eigenwert von H0 zum Eigenzustand |n, l, m⟩ ist (s. Kapitel VII, § C). Die vorstehende Summe verschwindet nicht, da es Zustände |n, l, m⟩ gibt, deren Parität entgegengesetzt zu der von |1, 0, 0⟩ ist. Wir schließen daher, dass der StarkEffekt des 1s-Grundzustands in niedrigster Ordnung quadratisch in ℰ ist. Da E1 − E n immer negativ ist, wird der Grundzustand abgesenkt.
1-b Polarisierbarkeit des 1s-Zustands Wir wiesen bereits darauf hin, dass wegen der Parität die Erwartungswerte der Kompo nenten des Operators qR im Zustand |1, 0, 0⟩ (ungestörter Grundzustand) verschwin den. In Gegenwart eines elektrischen Feldes 𝓔 parallel zur z-Achse ist der Grundzu stand nicht mehr |1, 0, 0⟩, sondern (s. § B-1-b von Kapitel XI) |ψ0 ⟩ = |1, 0, 0⟩ − qℰ
∑ n=1,l,m ̸
|n, l, m⟩
⟨n, l, m | Z | 1, 0, 0⟩ +... E1 − E n
(3)
Der Erwartungswert des Operators des elektrischen Dipolmoments qR im gestörten Grundzustand lautet also in erster Ordnung in ℰ: ⟨ψ0 |qR|ψ0 ⟩. Mit dem Ausdruck (3) für |ψ0 ⟩ erhalten wir dann ⟨ψ0 | qR | ψ0 ⟩ = −q2 ℰ ⟨1, 0, 0|R|n, l, m⟩⟨n, l, m|Z|1, 0, 0⟩ + ⟨1, 0, 0|Z|n, l, m⟩⟨n, l, m|R|1, 0, 0⟩ E1 − E n n =1,l,m ̸
× ∑
(4) Wie wir sehen, verursacht das Feld ℰ das Auftreten eines „induzierten“ Dipol moments mit einer Größe proportional zu ℰ. Mit Hilfe der Orthogonalitätsrelation der Kugelflächenfunktionen¹ lässt sich zeigen, dass ⟨ψ0 |qX|ψ0 ⟩ und ⟨ψ0 |qY|ψ0 ⟩ null sind und der einzige nichtverschwindende Wert durch ⟨ψ0 |qZ|ψ0 ⟩ = −2q2 ℰ
|⟨n, l, m | Z | 1, 0, 0⟩|2 E1 − E n n=1,l,m ̸ ∑
(5)
gegeben ist. Das induzierte Dipolmoment ist somit parallel zum angelegten Feld ℰ, was wegen der Kugelsymmetrie des 1s-Zustands nicht überrascht. Der Proportionali tätskoeffizient χ zwischen dem induzierten Dipolmoment und dem Feld wird als linea re elektrische Suszeptibilität bezeichnet. Wir sehen, dass die Quantenmechanik ihre
1 Aus dieser Beziehung folgt, dass ⟨1, 0, 0|Z|n, l, m⟩ nur dann von null verschieden ist, wenn l = 1, m = 0 gilt (dasselbe Argument verwenden wir zu Beginn von § 2 für ⟨2, 1, m|Z|2, 0, 0⟩). Die Summati on in den Gleichungen (2) bis (6) läuft somit eigentlich nur über n (sie enthält außerdem die Zustände des positiven Energiekontinuums).
Stark-Effekt des Wasserstoffatoms
| 1291
•
Berechnung für den 1s-Zustand ermöglicht: χ1s = −2q2
|⟨n, l, m | Z | 1, 0, 0⟩|2 E1 − E n n=1,l,m ̸ ∑
(6)
2 Stark-Effekt beim n = 2-Niveau Der Einfluss von WS auf das n = 2-Niveau ergibt sich in erster Ordnung durch die Diagonalisierung der Einschränkung von WS auf den durch die vier Vektoren der Basis {|2, 0, 0⟩; |2, 1, m⟩, m = −1, 0, +1} aufgespannten Unterraum. Der |2, 0, 0⟩-Zustand ist gerade; die drei |2, 1, m⟩-Zustände sind ungerade. Da WS ungerade ist, sind das Matrixelement ⟨2, 0, 0|WS |2, 0, 0⟩ und die neun Matrix elemente ⟨2, 1, m |WS |2, 1, m⟩ null (s. Ergänzung FII ). Da andererseits die Zustän de |2, 0, 0⟩ und |2, 1, m⟩ entgegengesetzte Parität haben, kann das Matrixelement ⟨2, 1, m|WS |2, 0, 0⟩ von null verschieden sein. Wir wollen zeigen, dass nur ⟨2, 1, 0|WS |2, 0, 0⟩ nicht verschwindet: WS ist pro portional zu Z = R cos θ und damit zu Y 10 (θ). Das Winkelintegral, das in die Matrix elemente ⟨2, 1, m|WS |2, 0, 0⟩ eingeht, hat daher die Form ∫ Y lm∗ (Ω)Y 10 (Ω)Y 00 (Ω) dΩ
(7)
Da Y 00 eine Konstante ist, ist dieses Integral proportional zum Skalarprodukt von Y10 und Y1m und somit nur für m = 0 ungleich null. Da außerdem Y10 , R20 (r) und R21 (r) reell sind, ist das entsprechende Matrixelement von WS auch reell. Wir setzen ⟨2, 1, 0|WS |2, 0, 0⟩ = γℰ
(8)
ohne uns um den genauen Wert von γ zu kümmern (er könnte ohne Schwierigkeiten berechnet werden, da wir die Wellenfunktionen φ2,1,0 (r) und φ2,0,0 (r) kennen). Die Matrix, die WS im n = 2-Niveau darstellt, ist somit von der folgenden Form (die Basisvektoren haben die Reihenfolge |2, 1, 1⟩, |2, 1, −1⟩, |2, 1, 0⟩, |2, 0, 0⟩): 0 0 ( 0 0
0 0 0 0
0 0 0 γℰ
0 0 ) γℰ 0
(9)
Daraus ergeben sich sofort die Korrekturen in erster Ordnung in ℰ und die Eigenzu stände nullter Ordnung: Eigenzustände
Korrekturen
|2, 1, 1⟩
⇔
0
|2, 1, −1⟩
⇔
0
(|2, 1, 0⟩ + |2, 0, 0⟩)/√2
⇔
γℰ
(|2, 1, 0⟩ − |2, 0, 0⟩)/√2
⇔
−γℰ
(10)
•
1292 | Ergänzung EXII
Die Entartung des n = 2-Niveaus wird also teilweise aufgehoben; die Energieverschie bungen sind linear in ℰ, also nicht quadratisch. Das Auftreten eines linearen StarkEffekts folgt aus der Existenz zweier Niveaus entgegengesetzter Parität und gleicher Energie, hier der 2s- und 2p-Niveaus. Dies tritt nur beim Wasserstoffatom auf (wegen der l-fachen Entartung der n ≠ 1-Schalen). Bemerkung: Die Zustände des n = 2-Niveaus sind nicht stabil. Die Lebensdauer des 2s-Zustands ist aller dings wesentlich größer als die der 2p-Zustände, da das Atom durch spontane Emission eines Lyman-α-Photons leichter von 2p nach 1s übergeht (die Lebensdauer ist von der Größenordnung 10−9 s), während der Zerfall des 2s-Zustands die Emission zweier Photonen erfordert (Lebens dauer von der Größenordnung einer Sekunde). Deshalb spricht man bei den 2p-Zuständen von instabilen und bei den 2s-Zuständen von metastabilen Zuständen. Da der Stark-Hamilton-Operator WS nichtverschwindende Matrixelemente zwischen 2s- und 2p-Zuständen besitzt, „vermischt“ ein beliebiges (konstantes oder oszillierendes) elektrisches Feld metastabile 2s- mit instabilen 2p-Zuständen, was die Lebensdauer der 2s-Zustände dras tisch verringert (s. auch Ergänzung HIV , wo die Wirkung einer Kopplung zwischen zwei Zuständen unterschiedlicher Lebensdauern untersucht wird).
Referenzen und Literaturhinweise Stark-Effekt in Atomen: Kuhn (11.1), Kap. III, § A-6 und § G; Ruark und Urey (11.9), Kap. V, § 2 und § 13; Sobel’man (11.12), Kap. 8, § 28. Die in (2) bis (6) auftretende Summe kann mit der Methode von de Dalgarno und Lewis exakt berechnet werden, siehe Borowitz (1.7), § 14-5; Schiff (1.18), § 33. Originalarbei ten: (2.34), (2.35), (2.36). Quenching und Metastabilität: siehe Lamb und Retherford (3.11), Anhang II; So bel’man (11.12), Kap. 8, § 28.5.
XIII Näherungsmethoden für zeitabhängige Probleme A B B-1 B-2 B-3 C C-1 C-2 C-3 D D-1 D-2 D-3 E E-1 E-2 E-3
Problemstellung | 1293 Näherungslösung der Schrödinger-Gleichung | 1295 Die Schrödinger-Gleichung in der {|φ n ⟩}-Darstellung | 1295 Störungsreihe | 1296 Lösung erster Ordnung | 1297 Sinusförmige oder konstante Störung | 1299 Anwendung der allgemeinen Gleichungen | 1299 Sinusförmige Störung. Resonanz | 1301 Kopplung an Zustände im kontinuierlichen Spektrum | 1306 Stochastische Störung | 1311 Statistische Eigenschaften der Störung | 1311 Störungsrechnung für die Übergangsamplitude | 1313 Gültigkeit der Störungsrechnung | 1315 Verhalten eines zwei-Niveau-Atoms auf langen Zeitskalen | 1315 Sinusförmige Störung | 1315 Stochastische Störung | 1317 Optisch breitbandige Anregung eines Atoms | 1326
A Problemstellung Ein physikalisches System werde durch einen Hamilton-Operator H0 beschrieben. Die Eigenwerte und Eigenvektoren von H0 bezeichnen wir mit E n bzw. |φ n ⟩: H0 |φ n ⟩ = E n |φ n ⟩
(A-1)
Der Einfachheit halber nehmen wir an, dass das Spektrum von H0 diskret und nicht entartet ist; die entsprechenden Gleichungen lassen sich leicht verallgemeinern (s. z. B. § C-3). Weiterhin sei H0 nicht explizit zeitabhängig, so dass seine Eigenzu stände stationäre Zustände sind. Zur Zeit t = 0 beginne auf das System eine Störung zu wirken. Der Hamilton-Ope rator lautet dann H(t) = H0 + W(t)
(A-2)
̂ W(t) = λ W(t)
(A-3)
mit
̂ λ ist ein reeller dimensionsloser Parameter, der sehr viel kleiner als eins ist, und W(t) eine Observable von derselben Größenordnung wie H0 (sie darf explizit von der Zeit abhängen), die für t < 0 verschwindet. https://doi.org/10.1515/9783110638769-031
1294 | XIII Näherungsmethoden für zeitabhängige Probleme Anfangs befinde sich das System im stationären Zustand |φ i ⟩, einem Eigenzu stand von H0 mit der Energie E i . Mit dem Einschalten der Störung bei t = 0 unter liegt das System einer Zeitentwicklung: Der Zustand |φ i ⟩ ist im Allgemeinen kein Ei genzustand des gestörten Hamilton-Operators mehr. Wir wollen in diesem Kapitel die Wahrscheinlichkeit 𝒫if (t) berechnen, das System zur Zeit t in einem anderen Eigen zustand |φ f ⟩ von H0 zu finden. Anders ausgedrückt untersuchen wir die Übergänge zwischen den stationären Zuständen des ungestörten Systems, die von der Störung W(t) induziert werden. Das Vorgehen ist einfach: Zwischen der Zeit 0 und t entwickelt sich das System gemäß der Schrödinger-Gleichung iℏ
d ̂ |ψ(t)⟩ = [H0 + λ W(t)]|ψ(t)⟩ dt
(A-4)
Die Lösung |ψ(t)⟩ dieser Differentialgleichung erster Ordnung, die die Anfangsbedin gung |ψ(t = 0)⟩ = |φ i ⟩
(A-5)
erfüllt, ist eindeutig bestimmt. Die gesuchte Wahrscheinlichkeit 𝒫if (t) lässt sich schreiben als 𝒫if (t) = |⟨φ f |ψ(t)⟩|2
(A-6)
Das gesamte Problem besteht darin, die Lösung |ψ(t)⟩ von Gl. (A-4) zu finden, die der Anfangsbedingung (A-5) genügt. Dies ist jedoch im Allgemeinen nicht exakt möglich, weshalb wir auf Näherungslösungen zurückgreifen müssen. In diesem Kapitel werden wir zeigen, wie die Lösung |ψ(t)⟩ für hinreichend kleine λ in Form einer Potenzreihen entwicklung in λ gefunden werden kann. Wir werden |ψ(t)⟩ mit der entsprechenden Wahrscheinlichkeit explizit in erster Ordnung in λ berechnen (§ B). Die allgemeinen Ergebnisse wenden wir dann (§ C) zur Untersuchung eines wichtigen Spezialfalls an, in dem die Störung einen mit der Zeit sinusförmigen Verlauf hat oder konstant ist. (Die Wechselwirkung eines Atoms mit einer elektromagnetischen Welle wird ausführlich in der Ergänzung AXIII behandelt.) Dabei haben wir es mit einem Beispiel für das Phäno men der Resonanz zu tun. Wir werden zwei Fälle betrachten: zum einen ein diskretes Spektrum von H0 und zum anderen den Fall, bei dem ein Anfangszustand |φ i ⟩ mit einem Kontinuum von Endzuständen gekoppelt wird. Dabei beweisen wir eine wich tige als Fermis Goldene Regel bekannte Formel. In § D wenden wir uns einem weiteren wichtigen Fall zu, wenn nämlich die Störung in zufälliger Weise fluktuiert. Sie wird dann durch ihre zeitabhängige Korrelationsfunktion beschrieben; wir behandeln sie mit einer Störungsrechnung, die für kurze Zeiten gültig ist. In § E werden wir sehen, wie die Gültigkeit dieser Rechnung auf lange Zeitskalen ausgedehnt werden kann. Die dabei verwendete Näherung ist allgemein anwendbar, wenn eine Bedingung vorliegt, die auf die sogenannte „Linieneinengung durch Bewegung“ (engl. motional line nar rowing) führt.
B Näherungslösung der Schrödinger-Gleichung
| 1295
Bemerkung: Das in Kapitel IV, § C-3 behandelte Problem kann als Spezialfall der allgemeineren Fragestellung dieses Kapitels aufgefasst werden. In Kapitel IV diskutierten wir ein zwei-Niveau-System (Zustän de |φ 1 ⟩ und |φ 2 ⟩), das zu Anfang im Zustand |φ 1 ⟩ ist und einer zur Zeit t = 0 einsetzenden kon stanten Störung W unterliegt. Die Wahrscheinlichkeit 𝒫12 (t) kann exakt berechnet werden und führt auf die Rabi-Formel. Das Problem, das wir hier angehen, ist viel allgemeiner. Wir wollen ein System mit einer belie bigen Anzahl von Niveaus (manchmal sogar, wie in § C-3, mit einem Kontinuum von Zuständen) unter dem Einfluss einer Störung W(t) betrachten, die eine beliebige Funktion der Zeit sein kann. Daraus wird klar, warum wir im Allgemeinen nur eine Näherungslösung erhalten können.
B Näherungslösung der Schrödinger-Gleichung B-1 Die Schrödinger-Gleichung in der {|φ n ⟩}-Darstellung Die Wahrscheinlichkeit 𝒫if (t) enthält explizit die Eigenzustände |φ i ⟩ und |φ f ⟩ von H0 ; es bietet sich daher an, die {|φ n ⟩}-Darstellung zu wählen. B-1-a Differentialgleichungssystem für den Zustandsvektor Die Komponenten des Ketvektors |ψ(t)⟩ in der {|φ n ⟩}-Basis bezeichnen wir mit c n (t), dann ist |ψ(t)⟩ = ∑ c n (t) |φ n ⟩
(B-1)
n
mit c n (t) = ⟨φ n |ψ(t)⟩
(B-2)
̂nk (t) steht für die Matrixelemente der Observablen W(t) ̂ in dieser Basis: W ̂ | φk ⟩ = W ̂nk (t) ⟨φ n | W(t)
(B-3)
Der Hamilton-Operator H0 wird in der {|φ n ⟩}-Basis durch eine Diagonalmatrix darge stellt ⟨φ n | H0 | φ k ⟩ = E n δ nk
(B-4)
Wir wollen beide Seiten der Schrödinger-Gleichung (A-4) auf |φ n ⟩ projizieren. Da zu fügen wir die Vollständigkeitsrelation ∑ |φ k ⟩⟨φ k | = 𝟙
(B-5)
k
ein und verwenden die Gleichungen (B-2) bis (B-4). Es ergibt sich iℏ
d ̂nk (t) c k (t) c n (t) = E n c n (t) + ∑ λ W dt k
(B-6)
1296 | XIII Näherungsmethoden für zeitabhängige Probleme
Dies ist ein System gekoppelter linearer Differentialgleichungen erster Ordnung in t, mit dem es theoretisch möglich ist, die Komponenten c n (t) von |ψ(t)⟩ zu bestimmen. ̂ Die Kopplung zwischen diesen Gleichungen stammt allein von der Störung λ W(t), die mit ihren Nichtdiagonalelementen die Zeitentwicklung von c n (t) mit der der anderen Koeffizienten c k (t) verknüpft. B-1-b Übergang ins Wechselwirkungsbild ̂ verschwindet, ist das System (B-6) nicht mehr gekoppelt und seine Lö Wenn λ W(t) sung ist sehr einfach; sie kann c n (t) = b n e−iE n t/ℏ
(B-7)
geschrieben werden; die Konstanten b n hängen von den Anfangsbedingungen ab. ̂ nicht null ist, aber aufgrund der Bedingung λ ≪ 1 sehr viel Wenn nun λ W(t) kleiner als H0 bleibt, werden sich die Lösungen c n (t) der Gleichungen (B-6) nur sehr wenig von den Lösungen (B-7) unterscheiden. Führen wir also den Funktionenwechsel c n (t) = b n (t) e−iE n t/ℏ
(B-8)
durch, so werden die Funktionen b n (t) relativ langsam veränderliche Funktionen der Zeit sein.* Wir setzen Gl. (B-8) in (B-6) ein und erhalten d b n (t) + E n b n (t) e−iE n t/ℏ dt ̂nk (t) b k (t) e−iE k t/ℏ = E n b n (t) e−iE n t/ℏ + ∑ λ W
iℏ e−iE n t/ℏ
(B-9)
k
Wir multiplizieren jetzt beide Seiten dieser Gleichung mit eiE n t/ℏ und führen die BohrFrequenz ω nk =
En − Ek ℏ
(B-10)
zu den Energien E n und E k ein; es ergibt sich iℏ
d ̂nk (t) b k (t) b n (t) = λ ∑ eiω nk t W dt k
(B-11)
B-2 Störungsreihe Das Gleichungssystem (B-11) ist äquivalent zur Schrödinger-Gleichung (A-4). Im Allge meinen lässt sich dafür keine exakte Lösung finden. Deshalb wollen wir die Tatsache
* Anm. d. Ü.: Mit dieser Transformation wechselt man den Standpunkt und arbeitet fürderhin im „Wechselwirkungsbild“. Den gewohnten Standpunkt nennt man auch „Schrödinger-Bild“.
B Näherungslösung der Schrödinger-Gleichung
|
1297
verwenden, dass λ sehr viel kleiner als eins ist, und versuchen, die Lösung in Form einer Potenzreihenentwicklung in λ zu bestimmen (von der wir hoffen dürfen, dass sie für genügend kleine λ rasch konvergiert): (0)
(1)
(2)
b n (t) = b n (t) + λ b n (t) + λ2 b n (t) + ⋅ ⋅ ⋅
(B-12)
Setzen wir diese Entwicklung in Gl. (B-11) ein und vergleichen die Koeffizienten mit denselben Potenzen von λ r , so erhalten wir 1. für r = 0: iℏ
2.
d (0) b n (t) = 0 dt
(B-13)
da die rechte Seite von Gl. (B-11) einen globalen Faktor λ hat. Gleichung (B-13) (0) drückt aus, dass b n nicht von t abhängt. Wenn λ gleich null ist, reduziert sich b n (t) also auf eine Konstante [s. Gl. (B-7)]; für r ≠ 0: iℏ
d (r) ̂ nk (t) b (r−1) (t) b n (t) = ∑ eiω nk t W k dt k
(B-14)
Mit der durch Gleichung (B-13) und die Anfangsbedingung festgelegten Lösung nullter Ordnung ermöglicht uns die Rekursionsbeziehung (B-14) die Bestimmung der Lösung erster Ordnung. Sie liefert dann die Lösung zweiter Ordnung in Ab hängigkeit von der erster Ordnung und weiter die Lösung zu beliebigem r in Ab hängigkeit von der Lösung der Ordnung r − 1.
B-3 Lösung erster Ordnung B-3-a Der Zustand des Systems zur Zeit t Für t < 0 befindet sich das System im Zustand |φ i⟩. Als einziger Koeffizient ist also b i (t) ̂ dann null ist). Zur Zeit t = 0 ungleich null (er ist außerdem unabhängig von t, da λ W ̂ möglicherweise unstetig von null in den Wert λ W(0) ̂ über. Da λ W(t) ̂ jedoch geht λ W(t) endlich bleibt, ist die Lösung der Schrödinger-Gleichung bei t = 0 stetig; daraus folgt b n (t = 0) = δ ni
(B-15)
Diese Beziehung gilt für jeden beliebigen Wert von λ. Demnach muss für die Koeffizi enten der Entwicklung (B-12) gelten (0)
b n (t = 0) = δ ni (r) b n (t
= 0) = 0
(B-16) für r ≥ 1
(B-17)
Gleichung (B-13) ergibt dann für alle positiven t sofort (0)
b n (t) = δ ni Damit ist die Lösung nullter Ordnung vollständig bestimmt.
(B-18)
1298 | XIII Näherungsmethoden für zeitabhängige Probleme Mit Hilfe dieses Ergebnisses können wir Gl. (B-14) für r = 1 in der Form iℏ
d (1) ̂ nk (t) δ ki b (t) = ∑ eiω nk t W dt n k ̂ ni (t) = eiω ni t W
(B-19)
schreiben und haben nun eine Gleichung, die ohne Schwierigkeiten integriert werden kann. Unter Beachtung der Anfangsbedingung (B-17) ergibt sich t
(1)
b n (t) =
1 ̂ni (t ) dt ∫ eiω ni t W iℏ
(B-20)
0
Setzen wir Gl. (B-18) und Gl. (B-20) in (B-8) und dann in (B-1) ein, erhalten wir den Zustand |ψ(t)⟩ des Systems zur Zeit t in erster Ordnung in λ. B-3-b Die Übergangswahrscheinlichkeit 𝓟 if (t) Nach Gl. (A-6) und der Definition (B-2) von c f (t) ist die Übergangswahrscheinlichkeit 𝒫if (t) gleich |c f (t)|2 . Da b f (t) und c f (t) denselben Betrag haben [s. Gl. (B-8)], heißt das 𝒫if (t) = |b f (t)|2
(B-21)
Mit den eben angegebenen Formeln berechnet man b f (t) aus (0)
(1)
b f (t) = b f (t) + λ b f (t) + ⋅ ⋅ ⋅
(B-22)
Von nun an nehmen wir an, die Zustände |φ i ⟩ und |φ f ⟩ seien verschieden. Wir ̂ induzierten Übergängen zwischen zwei unter haben es also nur mit den von λ W(t) (0) schiedlichen stationären Zuständen von H0 zu tun. Es gilt dann b f (t) = 0 und folg lich* (1)
𝒫if (t) = λ2 |b f (t)|2
(B-23)
̂ durch W(t) [s. Gl. (A-3)] erhalten wir Mit Gl. (B-20) und durch Ersetzen von λ W(t) schließlich 1 𝒫if (t) = 2 ℏ
t 2 iω fi t W fi (t ) dt ∫ e 0
(B-24)
̃ fi (t ), die für t < 0 und t > t verschwindet und Wir betrachten die Funktion W ̃fi (t ) ist das Matrixelement der im Intervall 0 ≤ t ≤ t gleich W fi (t ) ist (s. Abb. 1): W (2)
* Anm. d. Ü.: Wäre dem nicht so, müssten wir auch den Term b f (t) berechnen, damit unsere Rech nung bis zur zweiten Ordnung konsistent ist. In § E-2-a werden wir dafür ein Beispiel sehen.
C Sinusförmige oder konstante Störung
| 1299
Störung, die das System zwischen t = 0 und dem Zeitpunkt der Messung t „spürt“, zu dem wir festzustellen versuchen, ob das System im Zustand |φ f ⟩ ist. Gleichung (B-24) besagt, dass 𝒫if (t) proportional zum Betragsquadrat der Fourier-Transformierten der ̃fi (t ) ist. Diese Fourier-Transformierte wird für eine tatsächlich „gespürten“ Störung W Frequenz gleich der Bohr-Frequenz des betrachteten Übergangs berechnet. Andererseits stellen wir fest, dass die Übergangswahrscheinlichkeit 𝒫if (t) in ers ter Ordnung null ist, wenn das Matrixelement W fi (t) für alle t verschwindet.
Abb. 1: Verlauf der Funktion ̃ W fi (t ) in Abhängigkeit von t . Sie stimmt im Intervall 0 ≤ t ≤ t mit W fi (t ) überein und ist außerhalb dieses Intervalls null. Die Fourier-Transformierte von ̃ W fi (t ) bestimmt die Über gangswahrscheinlichkeit 𝒫if (t) in der niedrigsten Ordnung.
Bemerkung: Wir haben die Bedingungen für die Gültigkeit der Näherung in erster Ordnung in λ nicht disku tiert. Ein Vergleich von Gl. (B-11) mit (B-19) zeigt, dass diese Näherung in dem Ersetzen der Ko effizienten b k (t) auf der rechten Seite von Gl. (B-11) durch b k (0) besteht. Solange t also klein genug ist, so dass sich b k (0) nicht zu sehr von b k (t) unterscheidet, bleibt die Näherung gültig. Für große t andererseits gibt es keinen Grund, warum die Korrekturen in höherer Ordnung in λ vernachlässigbar sein sollten.
C Sinusförmige oder konstante Störung C-1 Anwendung der allgemeinen Gleichungen Wir wollen nun annehmen, W(t) habe eine der beiden einfachen Formen ̂ = W(t) ̂ = W(t)
̂ sin ωt W ̂ cos ωt W
(C-1a) (C-1b)
̂ eine zeitunabhängige Observable und ω eine konstante Winkelgeschwin wobei W digkeit ist. Eine solche Situation tritt in der Physik oft auf. In den Ergänzungen AXIII und BXIII untersuchen wir z. B. die Störung eines physikalischen Systems durch eine elektromagnetische Welle der Kreisfrequenz ω; 𝒫if (t) ist dann die durch die einfallen
1300 | XIII Näherungsmethoden für zeitabhängige Probleme
de monochromatische Strahlung induzierte Wahrscheinlichkeit für einen Übergang zwischen dem Anfangszustand |φ i ⟩ und dem Endzustand |φ f ⟩. ̂ lassen sich die Matrixelemente W ̂fi (t) Mit der speziellen Form (C-1a) von W(t) schreiben ̂ ̂fi (t) = W ̂fi sin ωt = W fi (eiωt − e−iωt ) W 2i
(C-2)
̂ fi eine zeitunabhängige komplexe Zahl ist. Wir bestimmen nun den Zustands wobei W vektor des Systems in erster Ordnung in λ: Wenn wir Gl. (C-2) in Gl. (B-20) einsetzen, erhalten wir t
(1)
b n (t) = −
̂ni W ∫ [ei(ω ni +ω)t − ei(ω ni −ω)t ] dt 2ℏ
(C-3)
0
Das Integral auf der rechten Seite dieser Gleichung kann leicht berechnet werden und ergibt (1)
b n (t) =
̂ni 1 − ei(ω ni +ω)t 1 − ei(ω ni −ω)t W [ − ] 2iℏ ω ni + ω ω ni − ω
(C-4)
Für den hier behandelten Spezialfall wird die allgemeine Beziehung (B-24) zu (1)
𝒫if (t; ω) = λ2 |b f (t)|2 =
|W fi |2 4ℏ2
2 1 − ei(ω fi +ω)t 1 − ei(ω fi −ω)t − ω fi + ω ω fi − ω
(C-5a)
(Wir haben die Variable ω hinzugefügt, da die Wahrscheinlichkeit von der Frequenz der Störung abhängt.) ̂ die Form (C-1b), so erhalten wir nach Wählen wir anstelle der Form (C-1a) für W(t) einer entsprechenden Rechnung 𝒫if (t; ω) =
|W fi |2 4ℏ2
2 1 − ei(ω fi +ω)t 1 − ei(ω fi −ω)t + ω fi + ω ω fi − ω
(C-5b)
̂ cos ωt eine zeitunabhängige Konstante; die von einer konstanten Für ω = 0 wird W Störung W induzierte Übergangswahrscheinlichkeit 𝒫if (t) ergibt sich also, indem wir in Gl. (C-5b) ω durch 0 ersetzen: 𝒫if (t) = =
|W fi |2 2 1 − eiω fi t 2 2 ℏ ω fi |W fi |2 F(t, ω fi ) ℏ2
(C-6)
mit F(t, ω fi ) = [
sin(ω fi t/2) 2 ] ω fi /2
(C-7)
C Sinusförmige oder konstante Störung
| 1301
Um den physikalischen Gehalt der Gleichungen (C-5b) und (C-6) zu untersuchen, be trachten wir zunächst den Fall, dass |φ i ⟩ und |φ f ⟩ zu zwei verschiedenen diskreten Niveaus gehören (§ C-2); danach nehmen wir an, |φ f ⟩ gehöre zu einem Kontinuum von Endzuständen (§ C-3). Im ersten Fall stellt 𝒫if (t; ω) [oder 𝒫if (t)] tatsächlich eine messbare Übergangswahrscheinlichkeit dar, während wir es im zweiten Fall mit einer Wahrscheinlichkeitsdichte zu tun haben (die eigentlich messbaren Größen enthalten dann eine Summation über eine bestimmte Menge von Endzuständen). Aus physika lischer Sicht unterscheiden sich diese beiden Fälle in einem entscheidenden Punkt: Wie wir in den Ergänzungen CXIII und DXIII sehen werden, oszilliert das System im ers ten Fall in einem ausreichend großen Zeitintervall zwischen den Zuständen |φ i ⟩ und |φ f ⟩, während es im zweiten Fall den Zustand |φ i ⟩ irreversibel verlässt. In § C-2 wählen wir zur Untersuchung des Resonanzphänomens eine sinusförmige Störung; die so erhaltenen Ergebnisse lassen sich aber leicht auf den Fall einer kon stanten Störung übertragen. Mit diesem Fall wird sich die Diskussion in § C-3 befassen.
C-2 Sinusförmige Störung. Resonanz C-2-a Resonanzcharakter der Übergangswahrscheinlichkeit Für einen festen Zeitpunkt t ist die Übergangswahrscheinlichkeit 𝒫if (t; ω) nur eine Funktion der Variablen ω. Wie wir sehen werden, hat diese Funktion bei ω ≃ ω fi
oder
ω ≃ −ω fi
(C-8)
ein Maximum. Es tritt daher Resonanz auf, wenn die Frequenz der Störung mit der Bohr-Frequenz des Zustandspaares |φ i ⟩ und |φ f ⟩ übereinstimmt. Nehmen wir ω ≥ 0 an, so stellen die Beziehungen (C-8) die Resonanzbedingungen für die Fälle ω fi > 0 bzw. ω fi < 0 dar. Im ersten Fall (s. Abb. 2a) geht das System vom niedrigeren Energieni veau E i durch resonante Absorption eines Energiequants ℏω in das höhere Niveau E f über. Im zweiten Fall (s. Abb. 2b) induziert die resonante Störung den Übergang des Systems aus einem höheren Niveau E i in das niedrigere Niveau E f (begleitet durch die induzierte Emission eines Energiequants ℏω). In diesem Abschnitt wollen wir ω fi po sitiv annehmen (wie in Abb. 2a); der Fall mit negativem ω fi kann in analoger Weise behandelt werden. Um das Resonanzverhalten der Übergangswahrscheinlichkeit genauer zu unter suchen, stellen wir zunächst fest, dass Gl. (C-5a) und Gl. (C-5b) für 𝒫if (t; ω) das Be tragsquadrat einer Summe von zwei komplexen Termen enthält. Der erste dieser Ter me ist proportional zu A+ =
sin [(ω fi + ω)t/2] 1 − ei(ω fi +ω)t = −i ei(ω fi +ω)t/2 ω fi + ω (ω fi + ω)/2
(C-9a)
und der zweite zu A− =
sin [(ω fi − ω)t/2] 1 − ei(ω fi −ω)t = −i ei(ω fi −ω)t/2 ω fi − ω (ω fi − ω)/2
(C-9b)
1302 | XIII Näherungsmethoden für zeitabhängige Probleme
(a)
(b)
Abb. 2: Relative Lage der Energien E i und E f der Zustände |φ i ⟩ und |φ f ⟩. Für E i < E f (a) tritt der Übergang |φ i ⟩ → |φ f ⟩ unter Absorption eines Energiequants ℏω auf. Ist andererseits E i > E f (b), so ist der Übergang |φ i ⟩ → |φ f ⟩ mit der induzierten Emission eines Energiequants ℏω verbunden.
Der Nenner des Terms A− geht für ω = ω fi und der von A+ für ω = −ω fi gegen null. Für ω in der Nähe von ω fi ist daher nur der Term A− von Bedeutung; er wird aus die sem Grund als Resonanzterm bezeichnet, während man bei A+ vom Antiresonanzterm spricht. (Für A+ tritt Resonanz auf, wenn ω für negative ω fi nahe bei −ω fi liegt.) Wir betrachten nun den Fall |ω − ω fi | ≪ |ω fi |
(C-10)
in dem wir den Antiresonanzterm A+ vernachlässigen dürfen (die Gültigkeit dieser Näherung wird in § C-2-c diskutiert): Mit Gl. (C-9b) erhalten wir dann 𝒫if (t; ω) =
|W fi |2 F(t, ω − ω fi ) 4ℏ2
(C-11)
mit F(t, ω − ω fi ) = {
sin [(ω fi − ω)t/2] } (ω fi − ω)/2
2
(C-12)
In Abb. 3 ist der Verlauf von 𝒫if (t; ω) in Abhängigkeit von ω bei festem t dargestellt. Der Resonanzcharakter der Übergangswahrscheinlichkeit ist deutlich sichtbar. Diese Wahrscheinlichkeit weist bei ω = ω fi , wo sie den Wert |W fi |2 t2 /4ℏ2 annimmt, ein ausgeprägtes Maximum auf. Wenn wir uns von ω fi wegbewegen, fällt sie ab und geht für |ω − ω fi | = 2π/t auf null. Wenn |ω − ω fi | weiter zunimmt, oszilliert sie zwischen |W fi |2 /ℏ2 (ω − ω fi )2 und null („Beugungsmuster“).* C-2-b Resonanzbreite und Energie-Zeit-Unschärferelation Die Resonanzbreite ∆ω kann näherungsweise als der Abstand der beiden ersten Null stellen von 𝒫if (t; ω) um ω = ω fi definiert werden. Innerhalb dieses Intervalls nimmt die Übergangswahrscheinlichkeit ihre größten Werte an (das erste Nebenmaximum von 𝒫if bei (ω − ω fi )t/2 = 3π/2 ist gleich |W fi |2 t2 /9π2 ℏ2 , d. h. weniger als 5 % der * Anm. d. Ü.: In der Tat entspricht 𝒫if (t; ω) als Funktion von ω dem Beugungsmuster an einem Ein fach-Spalt.
C Sinusförmige oder konstante Störung
| 1303
Abb. 3: Verlauf der Übergangswahrscheinlichkeit erster Ordnung 𝒫if (t; ω) einer sinusförmigen Stö rung der Kreisfrequenz ω bei festem t in Abhängigkeit von ω. Für ω ≃ ω fi tritt Resonanz mit einer Intensität proportional zu t 2 und einer Breite umgekehrt proportional zu t auf.
Übergangswahrscheinlichkeit bei Resonanz). Es gilt also ∆ω ≃
4π t
(C-13)
Je größer die Zeit t, desto kleiner wird diese Breite. Das Ergebnis (C-13) stellt eine gewisse Analogie zur Energie-Zeit-Unschärferelati on (s. Kapitel III, § D-2-e) dar: Nehmen wir nämlich an, wir wollten die Energiediffe renz E f − E i = ℏω fi messen, indem wir eine sinusförmige Störung der Kreisfrequenz ω auf das System wirken lassen und durch Ändern der Frequenz die Resonanzstelle su chen. Wirkt die Störung während einer Zeit t, so ist die Unsicherheit ∆E von E f − E i nach Gl. (C-13) von der Größenordnung ∆E = ℏ∆ω ≃
ℏ t
(C-14)
Das Produkt t∆E kann somit nicht kleiner als ℏ werden. Damit haben wir wieder die Energie-Zeit-Unschärferelation erhalten, obwohl t hier kein die freie Entwicklung des Systems charakterisierendes Zeitintervall ist, sondern im Gegenteil von außen vorge geben wurde. C-2-c Gültigkeit der störungstheoretischen Behandlung Wir überprüfen nun die Bedingungen für die Gültigkeit der Rechnungen, die uns auf das Ergebnis (C-11) geführt haben. Dabei gehen wir zunächst auf die Resonanznähe rung ein, die in der Vernachlässigung des Antiresonanzterms A+ besteht, und wenden uns dann der Näherung erster Ordnung in der störungstheoretischen Berechnung des Zustandsvektors zu.
1304 | XIII Näherungsmethoden für zeitabhängige Probleme α Diskussion der Resonanznäherung Mit der Annahme ω ≃ ω fi vernachlässigten wir A+ relativ zu A− . Wir werden also die Beträge von A+ und A− vergleichen. Der Verlauf der Funktion |A− (ω)|2 ist in Abb. 3 dargestellt. Wegen der Beziehung |A+ (ω)|2 = |A− (−ω)|2 ergibt sich der Verlauf von |A+ (ω)|2 als Spiegelung der obigen Kurve an der vertikalen Achse ω = 0. Wenn beide Kurven der Breite ∆ω um Punkte zentriert sind, deren Abstand viel größer als ∆ω ist, so ist offensichtlich der Betrag von A+ in der Nähe von ω = ω fi gegenüber dem Betrag von A− vernachlässigbar. Die Resonanznäherung ist also unter der Bedingung¹ 2|ω fi | ≫ ∆ω
(C-15)
erfüllt, d. h. mit Gl. (C-13) t≫
1 1 ≃ |ω fi | ω
(C-16)
Gleichung (C-11) ist somit nur gültig, wenn das Zeitintervall, in dem die sinusförmige Störung wirkt, im Vergleich zu 1/ω groß ist. Die physikalische Bedeutung einer sol chen Bedingung ist klar: Während des Intervalls [0, t] muss die Störung zahlreiche Oszillationen durchlaufen, damit sie als sinusförmige Störung auf das System wirkt. Wäre umgekehrt t klein im Vergleich zu 1/ω, so hätte die Störung keine Zeit zur Oszil lation und wäre somit äquivalent zu einer in der Zeit linearen [für den Fall (C-1a)] oder konstanten [für den Fall (C-1b)] Störung. Bemerkung: Für eine konstante Störung kann die Bedingung (C-16) nicht erfüllt sein, da ω null ist. Die Rech nung des vorhergehenden Abschnitts kann jedoch leicht auch auf diesen Fall übertragen werden. Die Übergangswahrscheinlichkeit 𝒫if (t) für eine konstante Störung haben wir bereits berechnet [s. Gl. (C-6)], indem wir in Gl. (C-5b) direkt ω = 0 gesetzt haben. Die beiden Terme A + und A − sind dann gleich: Wenn die Bedingung (C-16) nicht erfüllt ist, ist der Antiresonanzterm nicht vernach lässigbar. Der Verlauf der Wahrscheinlichkeit 𝒫if (t) in Abhängigkeit von der Energiedifferenz ℏω fi (bei fes ter Zeit t) ist in Abb. 4 wiedergegeben. Diese Wahrscheinlichkeit ist für ω fi = 0 maximal, was mit unseren Ergebnissen aus § C-2-b übereinstimmt: Eine Störung mit der Kreisfrequenz null führt für ω fi = 0 (entartete Niveaus) zur Resonanz. Auch die Überlegungen aus § C-2-b über die Eigen schaften der Resonanz lassen sich auf diesen Fall übertragen.
β Grenzen der Näherung erster Ordnung Wir haben bereits darauf hingewiesen (s. die Bemerkung am Ende von § B-3-b), dass die Näherung erster Ordnung ihre Gültigkeit verlieren kann, wenn t zu groß wird. Das
1 Zu beachten ist, dass Resonanz- und Antiresonanzterm interferieren, wenn die Relation (C-15) nicht erfüllt ist; man darf nicht einfach |A + |2 und |A − |2 addieren.
C Sinusförmige oder konstante Störung
|
1305
Abb. 4: Verlauf der Übergangswahrscheinlichkeit 𝒫if (t) ei ner konstanten Störung bei festem t in Abhängigkeit von ω fi = (E f − E i )/ℏ. Für ω fi = 0 (Energieerhaltung) tritt ei ne Resonanz derselben Breite, aber einer viermal größe ren Intensität (aufgrund der konstruktiven Interferenz des Resonanz- und Antiresonanzterms, die für eine konstante Störung gleich groß sind) wie in Abb. 3 auf.
lässt sich auch aus Gl. (C-11) ablesen, die bei Resonanz lautet 𝒫if (t; ω = ω fi ) =
|W fi |2 2 t 4ℏ2
(C-17)
Diese Funktion wird für t → ∞ unendlich; das ist sinnlos, da eine Wahrscheinlichkeit nie größer als eins sein kann. Im Grunde muss, damit die Näherung erster Ordnung bei Resonanz gültig bleibt, die Wahrscheinlichkeit in Gl. (C-17) sehr viel kleiner als eins sein, d. h.² t≪
ℏ |W fi |
(C-18)
Um genau zu zeigen, was diese Ungleichung über die Gültigkeit der Näherung erster Ordnung aussagt, muss man von Gl. (B-14) ausgehend Korrekturen höherer Ordnung berechnen und untersuchen, unter welchen Bedingungen sie vernachlässigbar sind. Wir würden dann sehen, dass Bedingung (C-18) notwendig ist, aber nicht in Strenge ausreicht. Zum Beispiel treten in den Termen zweiter oder höherer Ordnung andere ̂ als W ̂fi auf, für die bestimmte Bedingungen erfüllt sein ̂kn von W Matrixelemente W müssen, damit die entsprechenden Korrekturen klein sind. In der Ergänzung CXIII greifen wir die Berechnung der Übergangswahrscheinlich keit für Werte von t auf, die die Relation (C-18) nicht erfüllen, wobei wir eine andere Näherung (die säkulare Näherung) verwenden werden.
2 Damit die Theorie konsistent ist, müssen offensichtlich die Bedingungen (C-16) und (C-18) mitein ander verträglich sein. Es muss also gelten 1 ℏ ≪ |ω fi | |W fi | Diese Ungleichung besagt, dass die Energiedifferenz |E f − E i | = ℏ|ω fi | viel größer als die Matrixele mente von W(t) zwischen |φ i ⟩ und |φ f ⟩ sein muss.
1306 | XIII Näherungsmethoden für zeitabhängige Probleme
C-3 Kopplung an Zustände im kontinuierlichen Spektrum Wenn die Energie E f zu einem kontinuierlichen Teil des Spektrums von H0 gehört, d. h. wenn die Endzustände durch einen kontinuierlichen Index bezeichnet werden, können wir die Wahrscheinlichkeit, das System zur Zeit t in einem wohldefinierten Zu stand |φ f ⟩ zu finden, nicht messen. Den Postulaten des Kapitels III zufolge handelt es sich für diesen Fall bei der oben (näherungsweise) bestimmten Größe |⟨φ f |ψ(t)⟩|2 um eine Wahrscheinlichkeitsdichte. Die physikalischen Vorhersagen für eine bestimmte Messung erfordern dann die Integration dieser Wahrscheinlichkeitsdichte über eine gewisse Menge von Endzuständen (die von der durchgeführten Messung abhängt). Wir wollen untersuchen, wie die Ergebnisse des vorhergehenden Abschnitts für die sen Fall umformuliert werden müssen. C-3-a Integration über ein Kontinuum von Endzuständen. Zustandsdichte α Beispiel Zum besseren Verständnis für die Integration über die Endzustände betrachten wir zunächst ein konkretes Beispiel. Wir wollen die Streuung eines spinlosen Teilchens der Masse m an einem Potential W(r) diskutieren (s. Kap. VIII). Der Zustand |ψ(t)⟩ des Teilchens zur Zeit t kann in die Zustände |p⟩ wohldefinierter Impulse p und Energien E=
p2 2m
(C-19)
entwickelt werden. Bei den entsprechenden Wellenfunktionen handelt es sich um die ebenen Wellen ⟨r|p⟩ = (
1 3/2 ip⋅r/ℏ ) e 2πℏ
(C-20)
Die Wahrscheinlichkeitsdichte einer Messung des Impulses lautet |⟨p|ψ(t)⟩|2 (dabei wird |ψ(t)⟩ als normiert angenommen). Der in diesem Experiment verwendete Detektor (s. z. B. Abb. 2 in Kap. VIII) gibt ein Signal ab, wenn ein Teilchen mit dem Impuls pf gestreut wird. Selbstverständlich be sitzt dieser Detektor immer eine endliche Winkelauflösung, und auch die Energieauflösung ist nicht perfekt: es wird immer dann ein Signal ausgelöst, wenn der Impuls p des Teilchens in einen Raumwinkel δΩ f um pf zeigt und seine Energie im Intervall δE f um E f = p2f /2m liegt. Wenn wir den durch diese Bedingungen definierten Bereich des p-Raums mit D f bezeichnen, ist die Wahrscheinlichkeit für ein Ansprechen des Detektors also δ𝒫(p f , t) = ∫ d3 p |⟨p|ψ(t)⟩|2
(C-21)
p ∈ Df
Um die Ergebnisse der vorhergehenden Abschnitte verwenden zu können, müssen wir einen Variablenwechsel vornehmen, der uns auf ein Integral über die Energien führt.
C Sinusförmige oder konstante Störung
| 1307
Dieses Ziel erreichen wir leicht, indem wir d3 p = p2 dp dΩ
(C-22)
schreiben und die Variable p durch die Energie E ersetzen, mit der sie über Gl. (C-19) verknüpft ist. So erhalten wir d3 p = ρ(E) d E dΩ
(C-23)
wobei die Funktion ρ(E), die Zustandsdichte oder Dichte der Endzustände, mit den Gleichungen (C-19), (C-22) und (C-23) geschrieben werden kann ρ(E) = p2
dp m = p2 = m√2mE dE p
(C-24)
Wir erhalten dann für Gl. (C-21) δ𝒫(pf , t) =
∫
dΩ dE ρ(E) |⟨p|ψ(t)⟩|2
(C-25)
Ω ∈ δΩ f { E ∈ δE f
β Allgemeiner Fall Wir nehmen an, für ein bestimmtes Problem seien gewisse Eigenzustände von H0 durch eine kontinuierliche Menge von Indizes α bezeichnet, so dass die Orthonormie rungsbedingung die Form ⟨α|α ⟩ = δ(α − α )
(C-26)
annimmt. Das System wird zur Zeit t durch den normierten Vektor |ψ(t)⟩ beschrie ben. Wir wollen die Wahrscheinlichkeit δ𝒫(α f , t) berechnen, das System bei einer Messung in einer bestimmten Gruppe von Endzuständen zu finden. Diese Gruppe von Zuständen wird durch einen Bereich D f von Werten des Parameters α, zentriert um einen Wert α f , charakterisiert, und wir nehmen an, dass ihre Energien ein Kontinuum bilden. Mit den Postulaten der Quantenmechanik folgt dann δ𝒫(α f , t) = ∫ dα |⟨α|ψ(t)⟩|2
(C-27)
α ∈ Df
Wie im obigen Beispiel wollen wir die Variablen wechseln und die Endzustands dichte einführen. Anstelle des Parameters α verwenden wir also die Energie E und eine Menge anderer Parameter β (die notwendig sind, wenn H0 allein keinen voll ständigen Satz kommutierender Observabler bildet). Wir können dann dα durch dE und dβ ausdrücken, dα = ρ(β, E) d β dE
(C-28)
1308 | XIII Näherungsmethoden für zeitabhängige Probleme
worin die Endzustandsdichte ρ(β, E) auftritt.³ Wenn wir den durch D f definierten Wer tebereich der Parameter β und E mit δβ f bzw. δE f bezeichnen, erhalten wir also δ𝒫(α f , t) =
∫ {
dβ dE ρ(β, E) |⟨β, E|ψ(t)⟩|2
(C-29)
β ∈ δβ f E ∈ δE f
wobei wir die Notation |α⟩ durch |β, E⟩ ersetzt haben, um die E- und β-Abhängigkeit der Wahrscheinlichkeitsdichte |⟨α|ψ(t)⟩|2 deutlich zu machen. C-3-b Fermis Goldene Regel Beim Vektor |ψ(t)⟩ in Gl. (C-29) handelt es sich um den normierten Zustandsvektor des Systems zur Zeit t. Wie in § A wollen wir ein System betrachten, das sich anfangs in einem Eigenzustand |φ i ⟩ von H0 befindet (|φ i ⟩ muss also zum diskreten Spektrum von H0 gehören, da der Anfangszustand des Systems wie |ψ(t)⟩ normierbar sein muss). Wir ersetzen die Notation δ𝒫(α f , t) durch δ𝒫(φ i , α f , t), um deutlich zu machen, dass das System vom Zustand |φ i ⟩ aus startet. Die Rechnung in § B und ihre Anwendung auf den Fall einer sinusförmigen oder konstanten Störung (§ C-1 und § C-2) bleiben auch für einen Endzustand aus dem konti nuierlichen Spektrum von H0 gültig. Wenn wir W als konstant annehmen, können wir somit Gl. (C-6) verwenden, um die Wahrscheinlichkeitsdichte |⟨β, E|ψ(t)⟩|2 in erster Ordnung in W zu berechnen: |⟨β, E|ψ(t)⟩|2 =
1 2 ⟨β, E | W | φ i ⟩ F (t, (E − E i )/ℏ) ℏ2
(C-30)
wobei E und E i die Energien der Zustände |β, E⟩ bzw. |φ i ⟩ bezeichnen und die Funk tion F durch Gl. (C-7) definiert wird. Für δ𝒫(φ i , α f , t) erhalten wir schließlich δ𝒫(φ i , α f , t) 1 = 2 ∫ ℏ
2 dβ dE ρ(β, E) ⟨β, E | W | φ i ⟩ F (t, (E − E i )/ℏ)
(C-31)
β ∈ δβ f { E ∈ δE f
Die Funktion F(t, (E − E i )/ℏ) ändert sich bei E = E i sehr schnell (s. Abb. 4). Für ausrei chend große t kann diese Funktion bis auf einen konstanten Faktor durch die Funktion δ(E−E i ) approximiert werden, da den Ergebnissen des Anhangs II [Ausdrücke (11) und (20)] zufolge gilt lim F (t, (E − E i )/ℏ) = π t δ ((E − E i )/2ℏ) = 2πℏ t δ(E − E i )
t→∞
(C-32)
3 Im allgemeinen Fall hängt die Zustandsdichte ρ sowohl von E als auch von β ab; es tritt jedoch oft der einfachere Fall auf, dass ρ nur von E abhängt (s. obiges Beispiel).
C Sinusförmige oder konstante Störung
|
1309
Andererseits ändert sich die Funktion ρ(β, E) |⟨β, E | W | φ i ⟩|2 im Allgemeinen sehr viel langsamer mit E. Wir wollen hier t als groß genug annehmen, damit wir die Än derungen dieser Funktion über ein Energieintervall der Breite 4πℏ/t um E = E i ver nachlässigen können.⁴ Wir können dann in Gl. (C-31) F(t, (E − E i )/ℏ) durch seinen Grenzwert (C-32) ersetzen und die Integration über E sofort ausführen. Ist zusätzlich δβ f sehr klein, so ist die Integration über β unnötig, und wir erhalten schließlich – wenn die Energie E i zum Bereich δE f gehört, δ𝒫(φ i , α f , t) = δβ f –
2π 2 t ⟨β f , E f = E i | W | φ i ⟩ ρ(β f , E f = E i ) ℏ
(C-33a)
wenn die Energie E i nicht zu diesem Bereich gehört, δ𝒫(φ i , α f , t) = 0
(C-33b)
Wie wir in der Bemerkung am Ende von § C-2-c-α gesehen haben, kann eine konstante Störung nur Übergänge zwischen Zuständen gleicher Energie induzieren. Das System muss im Anfangs- und Endzustand (bis auf 2πℏ/t) dieselbe Energie besitzen. Aus die sem Grund ist die Übergangswahrscheinlichkeit null, wenn der Bereich δE f die Ener gie E i nicht einschließt. Die Wahrscheinlichkeit (C-33a) steigt linear mit der Zeit an. Die Übergangsrate (ei ne Übergangswahrscheinlichkeit pro Zeit) δ𝒲(φ i , α f ), die durch δ𝒲(φ i , α f ) =
d δ𝒫(φ i , α f , t) dt
(C-34)
definiert ist, ist daher zeitunabhängig. Wir führen die Übergangsrate pro Einheitsin tervall der Variablen β f ein: w(φ i , α f ) =
δ𝒲(φ i , α f ) δβ f
(C-35)
Sie lautet w(φ i , α f ) =
2π 2 ⟨β f , E f = E i | W | φ i ⟩ ρ(β f , E f = E i ) ℏ
(C-36)
Dieses wichtige Ergebnis ist als Fermis Goldene Regel bekannt.
4 Die Funktion ρ(β, E) |⟨β, E|W|φ i ⟩|2 muss sich langsam genug ändern, damit wir Werte von t finden können, für die die angesprochene Bedingung erfüllt ist, die aber trotzdem klein genug sind, damit die störungstheoretische Behandlung von W gültig bleibt. Wir nehmen hier zusätzlich δE f ≫ 4πℏ/t an.
1310 | XIII Näherungsmethoden für zeitabhängige Probleme
Bemerkungen: 1. Handelt es sich bei W um eine sinusförmige Störung der Form (C-1a) oder (C-1b), die einen Zustand |φ i ⟩ an ein Kontinuum von Zuständen |β f , E f ⟩ der Energien E f in der Nähe von E f + ℏω koppelt, so können wir ausgehend von Gl. (C-11) dieselbe Rechnung wie oben durchführen und erhalten w(φ i , α f ) =
π 2 ⟨β f , E f = E i + ℏω | W | φ i ⟩ ρ(β f , E f = E i + ℏω) 2ℏ
(C-37)
2. Wir kehren zum Problem der Streuung eines Teilchens an einem Potential W zurück, dessen Matrixelemente in der {|r⟩}-Darstellung gegeben werden durch ⟨r|W|r ⟩ = W(r) δ(r − r )
(C-38)
Wir nehmen nun an, der Anfangszustand des Systems habe den wohldefinierten Impuls |ψ(t = 0)⟩ = |pi ⟩
(C-39)
und berechnen die Wahrscheinlichkeit dafür, dass ein einfallendes Teilchen mit dem Impuls pi in Zustände mit einem Impuls p in der Nähe von pf (mit |pf | = |pi |) gestreut wird. Gleichung (C-36) gibt die Streuwahrscheinlichkeit w(pi , pf ) pro Zeit und Raumwinkel um p = pf an: w(pi , pf ) =
2π |⟨pf |W|pi ⟩|2 ρ(E f = E i ) ℏ
(C-40)
Mit den Gleichungen (C-20), (C-38) und dem Ausdruck (C-24) für ρ(E) ergibt sich dann w(pi , pf ) =
2 1 6 3 i(pi −pf )⋅r/ℏ 2π W(r) m √2mE i ( ) ∫ d r e ℏ 2πℏ
(C-41)
auf der rechten Seite dieser Beziehung tritt die Fourier-Transformierte des Potentials W(r) an der Stelle p = pi − pf auf. Der hier gewählte Anfangszustand |φ i ⟩ ist nicht normierbar und kann somit keinen physikali schen Zustand eines Teilchens darstellen. Obwohl die Norm von |pi ⟩ nicht existiert, bleibt die rechte Seite von Gl. (C-41) allerdings endlich. Wir können demnach erwarten, dass diese Bezie hung ein korrektes physikalisches Ergebnis liefert. Wenn wir die sich ergebende Wahrscheinlich keit durch den nach Gl. (C-20) zum Zustand |pi ⟩ gehörenden Wahrscheinlichkeitsstrom Ji = (
1 3 ℏk i 1 3 √ 2E i =( ) ) 2πℏ m 2πℏ m
(C-42)
dividieren, erhalten wir w(pi , pf ) m2 = Ji 4π 2 ℏ4
3 i(p −p )⋅r/ℏ 2 ∫ d r e i f W(r)
(C-43)
und finden also den Ausdruck für den Streuquerschnitt in der Bornschen Näherung wieder (s. Kap. VIII, § B-4). Obwohl es sich nicht um einen strengen Beweis handelt, zeigt die Rechnung, dass sich der Streu querschnitt der Born-Näherung mit Fermis Goldener Regel auch über einen zeitabhängigen An satz erhalten lässt.
D Stochastische Störung
|
1311
D Stochastische Störung Als einen weiteren interessanten Fall untersuchen wir nun ein System, das einer Stö rung unterworfen ist, die sich zeitlich in zufälliger Weise ändert. Betrachten wir etwa ein Atom (a), das ein magnetisches Spinmoment besitzt und sich in einem Gas von Teilchen (b) bewegt, die auch ein magnetisches Moment haben. Atom (a) wird stän digen Stößen unterworfen sein, wobei die Teilchen (b) an seinem Ort ein Magnetfeld erzeugen, das von einem Stoß zum nächsten zufällig fluktuiert. Die sich daraus erge benden Wechselwirkungen können die Ausrichtung des magnetischen Moments von Atom (a) ändern. Im vorliegenden Abschnitt soll so eine Situation untersucht werden. Wir greifen dazu auf die Rechnungen von § B zurück und nehmen an, das Matrixele ̂fi (t) sei eine zufällige (oder stochastische) Funktion der Zeit. Das Ziel wird sein, ment W die Übergangswahrscheinlichkeit 𝒫if (t) von einem Zustand |φ i ⟩ in einen Zustand |φ f ⟩ nach einem Zeitschritt t zu finden. Wir werden sehen, inwiefern sie sich von den Er gebnissen des vorherigen Abschnitts unterscheidet.
D-1 Statistische Eigenschaften der Störung Wir stellen uns hier auf den Standpunkt, dass wir uns nur für die Entwicklung eines Quantensystems interessieren, das oben erwähnte Atom (a), und zwar für seine zeit lich gemittelte Entwicklung. Es sind also die über die Zeit gemittelten Erwartungswer te⁵ der Störung W(t), die eine zentrale Rolle spielen werden. Wir bezeichnen mit W if (t) den Mittelwert des Matrixelements W if (t) und nehmen an, dass dieser verschwindet: W if (t) = 0
(D-1)
Dies bedeutet, dass W if (t) im Lauf der Zeit zwischen Werten mit entgegengesetzten Vorzeichen fluktuiert. Die Matrixelemente W if (t) und W fi (t) sind zueinander komplex konjugiert, so dass ihr Produkt notwendigerweise nichtnegativ ist. Dieses Produkt lie fert im Allgemeinen also im Mittel nicht Null: W fi (t)W if (t) ≥ 0
(D-2)
In der Folge wird es notwendig sein, auch Mittelwerte eines Produktes t und t + τ gehören: wir nennen Korrelationsfunktion C if (τ) die Größe C if (τ) = W fi (t + τ)W if (t) ≠ 0
(D-3)
5 In der Ergänzung EXIII werden wir dieses Problem unter einem anderen Gesichtspunkt betrachten: dort geht es um eine Menge von N Quantensystemen, die einzeln durch ihren Dichteoperator be schrieben werden. Die beiden Zugänge sind freilich äquivalent, solange die Mittelung über ein „GibbsEnsemble“ dasselbe ergibt wie die Messung an einem einzelnen System, aber gemittelt über einen langen Zeitraum (die sogenannte Ergoden-Hypothese der statistischen Mechanik, Anm. d. Ü.).
1312 | XIII Näherungsmethoden für zeitabhängige Probleme
Die Abhängigkeit der Korrelationsfunktion von der Zeitdifferenz τ charakterisiert die Zeit, während der die Störung einen bestimmten Wert im Gedächtnis behält: C if (τ) verschwindet nicht, solange der Wert W if (t + τ) mit W if (t) korreliert ist. Die Korrela tionsfunktion C if (τ) strebt nach Null, wenn die Zeitdifferenz |τ| viel größer als eine charakteristische Zeit τ c ist, die wir „Korrelationszeit“ nennen wollen: C if (τ) → 0 falls |τ| ≫ τ c
(D-4)
Wir werden uns auf den Fall konzentrieren, dass τ c viel kürzer als die anderen Zeitska len ist, die die Entwicklung des Systems charakterisieren.* Im oben angeführten Bei spiel des Atoms (a), das sich durch die Gasteilchen (b) bewegt, ist die Korrelationszeit τ c vergleichbar mit der Zeit für einen Stoß zwischen (a) und einem Teilchen (b), im Allgemeinen (viel) kürzer als 10−10 s. Wir nehmen an, dass die zufällige Störung stationär ist, was bedeutet, dass die Korrelationsfunktion nur von der Zeitdifferenz τ zwischen den beiden Zeitpunkten t + τ und t abhängt. Wir haben also auch W fi (t)W if (t − τ) = C if (τ)
(D-5)
Indem wir Gleichung (D-3) komplex konjugieren, erhalten wir W if (t + τ)W fi (t) = W fi (t)W if (t + τ) = C∗if (τ)
(D-6)
Der Vergleich mit Gl. (D-5) liefert also C∗if (τ) = C if (−τ)
(D-7)
Wenn die Variable τ ihr Vorzeichen wechselt, geht die Korrelation C if (τ) in ihr kom plex Konjugiertes über. Insbesondere ist C if (0) reell. ̃ if (τ) Für die folgenden Rechnungen ist es bequem, die Fourier-Transformierte C der Funktion C if (τ) einzuführen: +∞
̃ if (ω) = C
1 ∫ dτ e−iωτ C if (τ) √2π
(D-8)
−∞
woraus sich die spektrale Darstellung ergibt:† ∞
1 ̃ if (ω) ∫ dω e+iωτ C C if (τ) = √2π
(D-9)
−∞
̃ if (ω) reell ist. Aus der Beziehung (D-7) folgt, dass C * Anm. d. Ü.: Die Näherung, die mit dieser Bedingung gerechtfertigt wird, ist als Markow-Näherung bekannt. † Anm. d. Ü.: Die Formeln (D-8) und (D-9) sind in der Literatur als Wiener–Chintschin-Theorem be kannt. Der springende Punkt des Theorems sind die Bedingungen, unter denen die Fourier-Transfor ̃ if (ω) existiert. Sie wird auch als Rausch-Spektrum oder Leistungsspektrum bezeichnet. mierte C
D Stochastische Störung
| 1313
D-2 Störungsrechnung für die Übergangsamplitude Wir gehen wie in Gl. (B-8) vor und gehen von den Amplituden c n (t) zu den b n (t) über. So wird die Zeitabhängigkeit, die nur von H0 erzeugt wird, eliminiert. (Wir er innern, dass man dann im Wechselwirkungs-Bild arbeitet, s. § B-1-b und Ergänzung LIII , Übung 15.) Als Anfangsbedingung gelte b i (0) = 1 und b f (0) = 0. Wir suchen die Wahrscheinlichkeitsamplitude b f (t), das System zum Zeitpunkt t im Zustand |φ f ⟩ zu finden, wenn es also bei t = 0 im Zustand |φ i ⟩ startet. Die Gleichung (B-20) können wir dann umschreiben in t
(1)
b f (t) =
1 ∫ eiω fi t W fi (t ) dt iℏ
(D-10)
0
Die Wahrscheinlichkeit, das System im Zustand |φ f ⟩ zu finden, ergibt sich, indem wir Gl. (D-10) mit dem komplex konjugierten Ausdruck multiplizieren. Wegen ω fi = −ω if und W fi∗ = W if erhalten wir (1) (1) [b f (t)][b f (t)]∗
t
t
0
0
1 = 2 ∫ eiω fi t W fi (t ) dt ∫ eiω if t W if (t ) dt ℏ
(D-11)
Wir definieren die Übergangswahrscheinlichkeit 𝒫if (t) als den Mittelwert von (D-11) über die vielen Realisierungen der zufälligen Störung. So erhalten wir 𝒫if (t) =
(1) (1) [b f (t)]∗ [b f (t)]
t
t
0
0
1 = 2 ∫ dt ∫ dt e−iω if (t −t ) W fi (t )W if (t ) ℏ
(D-12)
Wir substituieren τ = t − t
(D-13)
und drücken mit Gl. (D-5) das Ergebnis (D-12) durch die Korrelationsfunktion aus: t
t
0
t −t
1 𝒫if (t) = 2 ∫ dt ∫ dτ e−iω if τ C if (τ) ℏ
(D-14)
(Der Vorzeichenwechsel wegen dτ = − dt wird durch das Vertauschen der Integrati onsgrenzen wieder aufgehoben.) Wie oben erwähnt, werden wir uns im Folgenden auf Zeiten t mit t ≫ τc
(D-15)
konzentrieren. Das Integral in Gl. (D-14) über dt läuft von 0 bis t, also ein Intervall, das viel länger als τc ist. Wir können dieses Intervall um ein paar Vielfache von τ c
1314 | XIII Näherungsmethoden für zeitabhängige Probleme
an beiden Grenzen verkürzen, ohne einen großen Fehler zu machen. Mit den Werten n = 2 oder n = 3 etwa haben wir also t−nτc
t
nτc
t −t
1 𝒫if (t) ≃ 2 ∫ dt ∫ dτ e−iω if τ C if (τ) ℏ
(D-16)
Im Integral über dτ ist die obere Grenze t > nτc . Da die Korrelation C if (τ) für τ ≫ τc nach Null strebt, können wir diese Grenze nach unendlich schieben: wir addieren so ohnehin nur einen Term, in dem der Integrand verschwindet. In gleicher Weise kön nen wir die untere Grenze t − t durch −∞ ersetzen, denn die Ungleichung t − t < −nτc garantiert, dass der Integrand in dem zusätzlichen Intervall verschwindet. Wir erhal ten so ein Integral über dτ, das nicht mehr von t abhängt. Über dt können wir nun sofort integrieren und finden einen Faktor: t−nτc
∫ dt = t − 2nτ c ≃ t
(D-17)
nτc
Insgesamt erhalten wir 𝒫if (t) ≃ Γ t
(D-18)
wo die Konstante Γ durch ∞
Γ=
√2π 1 ̃ if (ω if ) ∫ C if (τ) e−iω if τ dτ = 2 C 2 ℏ ℏ
(D-19)
−∞
̃ if (ω if ) der Korrelations definiert ist. Hier erscheint also die Fourier-Transformierte C funktion C if (τ), ausgewertet an der Bohr-Frequenz ω if = −ω fi des Übergangs zwi schen dem Anfangszustand |φ i ⟩ und dem Endzustand |φ f ⟩. Wie wir schon festgestellt haben, ist wegen der Beziehung (D-7) die Konstante Γ reell. Die Übergangswahrscheinlichkeit von |φ i ⟩ nach |φ f ⟩ nach einer Zeit t ist also pro portional zu t. Wenn die Störung sich zufällig ändert, kann man so eine Übergangsrate von |φ i ⟩ nach |φ f ⟩ (eine Wahrscheinlichkeit pro Zeit) definieren, zumindest für kurze Zeiten, in denen die Störungsrechnung in niedrigster Ordnung gültig ist.⁶ Diese Ra te (nämlich Γ) ist proportional zur Fourier-Transformierten der Korrelationsfunktion, ausgewertet an der Kreisfrequenz ω fi . Man beachte, wie deutlich sich dieses Ergebnis von dem für eine sinusförmige Störung [Gl. (C-11) und (C-12)] unterscheidet: dort war die Übergangswahrscheinlickeit für kurze Zeiten proportional zu t2 und oszillierte da nach.
6 Wir werden im nächsten Abschnitt sehen, unter welchen Bedingungen dieses Ergebnis auch auf lange Zeiten hin gültig bleibt.
E Verhalten eines zwei-Niveau-Atoms auf langen Zeitskalen | 1315
D-3 Gültigkeit der Störungsrechnung Das Ergebnis (D-18), das wir über eine Störungsrechnung erhalten haben, ist nur gül tig, solange die Übergangswahrscheinlichkeit klein ist, falls also gilt 1 (D-20) Γ Andererseits haben wir bei der Herleitung von (D-18) in Gl. (D-15) angenommen, dass t sehr groß gegenüber τc ist. Die beiden Bedingungen (D-20) und (D-15) sind mitein ander verträglich, falls gilt t≪
1 (D-21) Γ Die hier vorgestellte Rechnung beruht also auf einer Separation von Zeitskalen: die Entwicklung des Systems findet auf der typischen Skala 1/Γ statt, die oft „Relaxations zeit“ genannt wird. Die Korrelationszeit τ c ist dagegen viel kürzer und charakterisiert, wir erinnern uns, das Gedächtnis der Fluktuationen der stochastischen Störung. Die Gleichung (D-21) drückt einfach aus, dass sich das System während der Kor relationszeit nur geringfügig zeitlich entwickeln darf. Wenn wir Γ durch seinen expli ziten Ausdruck (D-19) ersetzen, erhalten wir eine Ungleichung, die nur von den Ei genschaften der Störung abhängt. Unter dieser Bedingung spricht man von „LinienEinengung durch Bewegung“ (engl.: motional line narrowing). Die Gründe für diese Bezeichnung werden wir uns im § 2-c-δ der Ergänzung EXIII genauer ansehen. τc ≪
E Verhalten eines zwei-Niveau-Atoms auf langen Zeitskalen Bislang haben wir in diesem Kapitel nur mit Hilfe der Störungsrechnung die Über gangswahrscheinlichkeit zum Zeitpunkt t berechnet: wir erinnern uns an ein Wachs tum proportional zu t2 für eine sinusförmige Störung, aber linear in t für eine zufällige Störung mit einem kurzen Gedächtnis. Da eine Wahrscheinlichkeit nicht größer als 1 werden darf, kann so ein Verhalten nicht für große Zeiten gültig bleiben. Das Ziel die ses Abschnitts ist es, Methoden vorzustellen, mit denen man Vorhersagen auch auf langen Zeitskalen machen kann, und zwar für beide Typen von Störungen. Wir wer den auch die Unterschiede zwischen den beiden Arten des zeitlichen Verhaltens inter pretieren. Die Rechnungen sind einfacher für ein System, das nur zwei Zustände hat, und deswegen beschränken wir uns auf diesen Fall.
E-1 Sinusförmige Störung Eigentlich haben wir bereits in der Ergänzung FIV das Langzeit-Verhalten eines zweiNiveau-Systems betrachtet, das einer periodischen (sinusförmigen) Störung ausge setzt ist. Wir haben nämlich die Zeitentwicklung eines Spin-1/2 für den Fall exakt
1316 | XIII Näherungsmethoden für zeitabhängige Probleme
berechnet, dass sein Hamilton-Operator durch die Gl. (14) aus Ergänzung FIV gegeben ist: H(t) =
ℎ ω0 ( 2 ω1 eiωt
ω1 e−iωt ) −ω0
(E-1)
(Diese Matrix ist in der Basis {|+⟩, |−⟩} der Eigenvektoren der Spin-Komponente S z auf geschrieben.) Die Matrixelemente des Hamilton-Operators H0 befinden sich auf der Diagonalen dieser Matrix: H0 beschreibt die Kopplung des Spins an ein statisches Magnetfeld B0 parallel zur z-Achse. Die Störung mit dem Hamilton-Operator W(t) ent spricht den nicht-Diagonalelementen der Matrix: sie beschreibt die Wirkung eines Ra diofrequenzfelds, das sich mit der Winkelfrequenz ω um die z-Achse dreht. Wir ha ben in der Ergänzung FIV gezeigt, dass die quantenmechanische Zeitentwicklung ei nes Spin-1/2 genau der klassischen Bewegung eines magnetischen Dipols entspricht, dessen Drehimpuls zu seinem magnetischen Moment proportional ist. Diese Analogie liefert ein anschauliches Bild der Entwicklung eines Spins in einem Magnetfeld, das sich aus einem konstanten Anteil und einem rotierenden Feld zusammensetzt. In der Ergänzung CIV haben wir nun gesehen, dass jedes zwei-Niveau-System ex akt isomorph zu einem Spin-1/2 ist. Die Zustände |φ i ⟩ und |φ f ⟩ werden auf die Spinzu stände |+⟩ und |−⟩ abgebildet, und der Hamilton-Operator H0 liefert zwei nicht-ent artete Energieniveaus E i = ℎω0 /2 und E f = −ℎω0 /2; wir haben also ω0 = ω if . Wir nehmen an, dass die Störung W, die die beiden Zustände |φ i ⟩ und |φ f ⟩ koppelt, ana log zu einem Magnetfeld B1 wirkt, das sich mit der Frequenz ω in der xy-Ebene dreht. Sie erzeugt dann die nicht-diagonalen Matrixelemente in (E-1) mit ℎω1 −iωt e 2 ℎω1 iωt W fi (t) = e 2
W if (t) =
(E-2)
(Die Größe ω1 ist hier reell angenommen; falls sie es nicht wäre, kann man sie durch eine Anpassung der relativen Phase von |φ i ⟩ und |φ f ⟩ reell machen.) Ohne weitere Rechnungen können wir also die Ergebnisse aus der Ergänzung FIV übernehmen. Der Gleichung (27) dort entnehmen wir, dass die Übergangswahrscheinlichkeit durch die „Rabi-Formel“ gegeben ist: 𝒫if (t) =
(ω1 )2
2 t sin2 [√(ω1 )2 + (ω − ω if ) ] 2 (ω1 ) + (ω − ω if ) 2
2
(E-3)
Weil die quantenmechanische und die klassische Zeitentwicklung des Spins in die ser Situation zusammenfallen, kann man sie sich einfach durch die Präzession eines klassischen magnetischen Dipols um ein „effektives Feld“ veranschaulichen. Auf der Resonanz (ω = ω if ) liegt das effektive Feld in der xy-Ebene, zum Beispiel entlang der x-Achse. Der Spinvektor zeigt anfangs in die positive z-Richtung und präzediert dann so, dass sein Endpunkt einen Großkreis in der yz-Ebene beschreibt. Die Glei chung (E-3) liefert dann für die Wahrscheinlichkeit, den Spin entlang der −z-Richtung
E Verhalten eines zwei-Niveau-Atoms auf langen Zeitskalen |
1317
zu finden, den Wert 𝒫if (t) = sin2 (
ω1 t ) 2
(E-4)
der zwischen 0 und 1 mit der Winkelfrequenz ω1 = 2W fi /ℎ oszilliert; diese Frequenz nennt man die „Rabi-Frequenz“. Es ist klar, dass man eine derartige, unendlich an dauernde Oszillation nicht mit einer Störungsmethode gewinnen kann.⁷ Ist die Störung gegenüber der Resonanzfrequenz des Spins verstimmt, dann hat das effektive Feld auch eine z-Komponente. Die Präzession um diese gekippte Achse lässt den Spinvektor einen Kegel beschreiben, dessen Öffnungswinkel um so kleiner ist, je mehr sich die Frequenz ω von der Resonanzfrequenz unterscheidet (s. die Abb. 2 in der Ergänzung FIV ). Man muss dann auf den vollständigen Ausdruck (E-3) zurück greifen, der wieder eine sinusförmige Oszillation vorhersagt. Wir bemerken en pas sant, dass man die Ergebnisse (C-11) und (C-12) als eine gute Näherung wiederfindet, falls |ω − ω if | ≫ W if /2ℎ gilt. Bemerkung: In dieser Überlegung haben wir angenommen, dass man die Störung als ein sich drehendes Feld auffassen kann. Wenn man aber in Gleichung (E-1) die komplexe e-Funktion e±iωt durch sin ωt oder cos ωt ersetzt, dann entstehen zwei rotierende Felder mit entgegengesetzten Frequenzen ±ω, die gleichzeitig auf das System wirken. Die Situation wird dann komplizierter. Unsere Er gebnisse bleiben allerdings gültig, solange die Störung genügend klein ist (unter der Bedingung ω1 ≪ ω0 ) und solange ω sich nicht zu weit von einer der beiden Resonanzen entfernt (man for dert also ω ≃ ω0 oder ω ≃ −ω0 ).*
E-2 Stochastische Störung Wie für das Spin-1/2-System von eben nehmen wir an, dass die Störung W keine dia gonalen Matrixelemente hat: W ii = W ff = 0
(E-5)
(In der Ergänzung EXIII diskutieren wir einen allgemeineren Fall, für den diese Annah me nicht zutrifft.) In § E-1 gingen wir davon aus, dass die Entwicklung des Systems im Zustand |φ i ⟩ beginnt, also nur die Amplitude b i anfangs von Null verschieden ist. Dadurch haben wir allerdings ausgeschlossen, dass das System in einer Superposition von zwei Zu ständen startet. Diese Einschränkung heben wir nun auf und nehmen an, dass zum 7 Man müsste unendlich viele Terme in der Störungsreihe aufsummieren, um das Quadrat der Sinus funktion zu erhalten. * Anm. d. Ü.: Diese Betrachtung liefert den Grund für die Bezeichnung „Drehwellennäherung“ (engl.: rotating wave approximation, RWA), womit die Resonanznäherung gemeint ist, die man unter der Be dingung (C-10) machen darf.
1318 | XIII Näherungsmethoden für zeitabhängige Probleme Zeitpunkt t eine beliebige Linearkombination der Zustände |φ i ⟩ et |φ f ⟩ vorliegt: |Ψ(t)⟩ = b i (t) e−iE i t/ℎ |φ i ⟩ + b f (t) e−iE f t/ℎ |φ f ⟩
(E-6)
Wir greifen einen späteren Zeitpunkt t + ∆t heraus und berechnen die Entwicklung des Systems von t bis t + ∆t bis zur zweiten Ordnung in der Störung W. E-2-a Zustand zum Zeitpunkt t + ∆t bis zur zweiten Ordnung in W Für die nullte Ordnung der Störung zeigt Gleichung (B-13), dass die Amplituden b i (t + ∆t) und b f (t + ∆t) nicht von ∆t abhängen: (0)
(0)
b i (t + ∆t) = b i (t)
b f (t + ∆t) = b f (t)
(E-7)
In der ersten Ordnung benutzen wir die Gleichung (B-14) für r = 1: aus der Annah me (E-5) folgt dann, dass die Ableitung db i / dt nur von b f abhängt und umgekehrt. Wir integrieren einmal über die Zeit und erhalten t+∆t
(1)
b i (t + ∆t) =
1 b f (t) ∫ eiω if t W if (t ) dt iℏ
t ∆t
=
1 b f (t) ∫ eiω if (t+t ) W if (t + t ) dt iℏ
(E-8)
0
(t = t − t substituieren); dazu kommt ein ähnlicher Ausdruck, in dem die Indizes i und f vertauscht sind: ∆t
(1)
b f (t + ∆t) =
1 b i (t) ∫ eiω fi (t+t ) W fi (t + t ) dt iℏ
(E-9)
0
Der Ausdruck (E-8) beschreibt ein Atom, das sich zum Zeitpunkt t im Zustand |φ f ⟩ be findet und bei t+t in den Zustand |φ i ⟩ übergegangen ist. Das Integral (E-9) beschreibt den umgekehrten Vorgang. In der zweiten Ordnung benötigen wir erneut die Gleichung (B-14), diesmal für r = 2. Eine Integration führt dann auf t+∆t
(2) b i (t
1 (1) + ∆t) = ∫ eiω if t W if (t )b f (t ) dt iℏ
t
∆t
=
1 (1) ∫ eiω if (t+t ) W if (t + t )b f (t + t ) dt iℏ
0
(E-10)
E Verhalten eines zwei-Niveau-Atoms auf langen Zeitskalen | 1319
(1)
In diesem Ausdruck schreiben wir t statt t und setzen das Ergebnis (E-9) für b f ein, ausgewertet für t statt ∆t; so erhalten wir t
∆t
(2) b i (t
1 + ∆t) = − 2 b i (t) ∫ eiω if (t+t ) W if (t + t ) dt ∫ eiω fi (t+t ) W fi (t + t ) dt ℏ
0
=−
0
∆t
t
0
0
1 b i (t) ∫ eiω if t W if (t + t ) dt ∫ eiω fi t W fi (t + t ) dt ℏ2
(E-11)
Dieser Term in der Störungsentwicklung beschreibt ein Atom, das anfangs (Zeit punkt t) im Zustand |φ i ⟩ ist, bei t + t (zwischen t und t + t ) in den Zustand |φ f ⟩ übergegangen ist und schließlich zum einem Zeitpunkt t + t (zwischen t und t + ∆t) in den Zustand |φ i ⟩ zurückkehrt. Auch in diesem Ausdruck können wir die Indizes i und f vertauschen, um die Wahrscheinlichkeitsamplitude für den umgekehrten Prozess zu erhalten. E-2-b Gemittelte Besetzungen bis zur zweiten Ordnung Für eine gegebene Realisierung der Zufallsvariablen W if und W fi ist |b i (t + ∆t)|2 die Wahrscheinlichkeit, das System im Zustand |φ i ⟩ zu finden. Bis einschließlich der zwei ten Ordnung in W enthält dieses Betragsquadrat folgende Terme: (0) – das Betragsquadrat von b i (t + ∆t), ein Term nullter Ordnung. (0) – einen Term erster Ordnung, nämlich das Produkt von b i (t + ∆t) mit dem kom (1) plex Konjugierten von b i (t + ∆t) oder umgekehrt. Wegen der Bedingung (E-5) verschwindet dieser Term, wenn wir den Mittelwert über die Realisierungen von W if und W fi nehmen. Aus diesem Grund nehmen wir ihn nicht weiter mit. (1) – das Betragsquadrat von b i (t + ∆t), ein Term zweiter Ordnung. (0) – und schließlich zweimal den Realteil des Produkts aus b i (t + ∆t) und dem kom (2) plex Konjugierten von b i (t + ∆t), dieser ist auch von der Ordnung 2. Insgesamt erhalten wir so |b i (t + ∆t)|2 (0)
(1)
(0)
(2)
≃ |b i (t + ∆t)|2 + |b i (t + ∆t)|2 + 2 Re {[b i (t + ∆t)][b i (t + ∆t)]∗ }
(E-12)
Wir schreiben dieses Ergebnis jetzt um und gruppieren den ersten und dritten Term zusammen, den zweiten behandeln wir separat. Im ersten Term benutzen wir Gl. (E-7), im dritten setzen wir die zweite Zeile aus Gl. (E-11) ein, und zwar komplex konjugiert, wodurch sowohl ω if und ω fi als auch W if und W fi die Plätze tauschen. Dies führt uns
1320 | XIII Näherungsmethoden für zeitabhängige Probleme
auf |b i (t + ∆t)|2 ≃ t
∆t
2 |b i (t)| (1 − 2 Re ∫ eiω fi t W fi (t + t ) dt ∫ eiω if t W if (t + t ) dt ) ℏ
2
0
+ |b f (t)|2
0
∆t
∆t
0
0
1 ∫ eiω fi t W fi (t + t ) dt ∫ eiω if t W if (t + t ) dt ℏ2
(E-13)
Jetzt führen wir die Mittelung über die Realisierungen der Zufallsvariablen W fi und W if durch. In Gl. (E-13) tauchen Produkte von zwei Matrixelementen von W auf, die mit den Quadraten der Amplituden b i (t) und b f (t) multipliziert werden. In voller Strenge sind diese Ausdrücke nicht unabhängig voneinander, weil der Zustand des Systems von den Werten der Störung vor dem Zeitpunkt t abhängt. Diese Korrelation dauert al lerdings nur eine kurze Zeit an, viel kürzer als ∆t, und zwar von der Ordnung der Korre lationszeit τc der stochastischen Funktionen W fi und W if – vgl. die Beziehung (D-4). Ist nach dem Zeitpunkt t ein kurzes Intervall τc vergangen, sind W fi und W if nicht mehr mit den Werten von |b i,f (t)|2 korreliert.* Wir können also die Mittelung separat über beide Faktoren ausführen: |b i,f (t)|2 × Doppel-Integral ≃ |b i,f (t)|2 × Doppel-Integral
(E-14)
Die Mittelwerte |b i (t)|2 und |b f (t)|2 der Besetzungen sind nichts anderes als die Diago nalelemente des Dichteoperators (Ergänzung EIII ); wenn wir diesen Operator mit ρ̃ (t) bezeichnen (die Tilde steht für das Wechselwirkungsbild), erhalten wir ρ̃ ii (t) = |b i (t)|2
(E-15)
ρ̃ ff (t) = |b f (t)|2 Die zeitliche Änderung von ρ̃ ii (t) zwischen t und t + ∆t ist ∆ ρ̃ ii (t) |b i (t + ∆t)|2 − |b i (t)|2 = ∆t ∆t Die Beziehung (E-13) liefert also ∆ ρ̃ ii (t) = −ρ̃ ii (t) [J 1 + J 1∗ ] + ρ̃ ff (t) J 2 ∆t wobei J1 und J 2 die gemittelten Doppel-Integrale sind: ∆t
t
0
0
∆t
∆t
0
0
(E-16)
(E-17)
1 1 J1 = 2 ∫ dt ∫ dt e−iω if (t −t ) W fi (t + t )W if (t + t ) ℏ ∆t
J2 =
1 1 ∫ dt ∫ dt e−iω if (t −t ) W fi (t + t )W if (t + t ) ℏ2 ∆t
* Anm. d. Ü.: Diese Vereinfachung wird auch als „Markow-Näherung“ bezeichnet.
(E-18)
E Verhalten eines zwei-Niveau-Atoms auf langen Zeitskalen | 1321
Den Mittelwert dieser zwei Doppel-Integrale kann man genau so berechnen, wie wir es in § D-2 getan haben. Dies ist weiter unten ausgeführt und liefert uns J2 = Γ
(E-19)
Γ J 1 = + i δ if 2
(E-20)
̃ if (ω) der In diesen Formeln kann man Γ und δ if durch die Fourier-Transformierte C Korrelationsfunktion C if (τ) ausdrücken, die wir in Gl. (D-8) definiert hatten. Die Kon stante Γ wurde in Gl. (D-19) definiert: Γ=
√2π ℏ2
∞
̃ if (ω if ) = 1 ∫ C if (τ) e−iω if τ dτ C ℏ2
(E-21)
−∞
während δ if durch folgendes Integral gegeben wird: δ if =
∞
1 √2πℏ2
P ∫ dω −∞
̃ if (ω) C ω − ω if
(E-22)
(Zum mit P bezeichneten Hauptwert-Integral s. Anhang II, § 1-b.) Berechnung von J1 und J2 : Das Doppel-Integral für J2 haben wir schon in Gl. (D-12) bestimmt, als wir dort 𝒫if (t) ausgerech net hatten; es genügt, dort t durch ∆t zu ersetzen. Das Ergebnis (D-18) liefert uns hier das Produkt Γ∆t, was wir noch wegen der Definition (E-18) von J2 durch ∆t teilen müssen. Auf diese Weise er hält man Gleichung (E-19). Das Integral für J1 rechnen wir ähnlich aus, bis auf die obere Grenze des Integrals über dt , die bei t statt bei ∆t liegt. In der ersten Zeile von (E-18) können wir t − t = τ substituieren und die Integrale in folgende Form überführen: ∆t
t
∆t
∫ dt ∫ dt 0
⇒
0
0
t
∆t
− ∫ dt ∫ dτ = ∫ dt ∫ dτ 0
t
0
(E-23)
0
Wie in Gl. (D-16) können wir, solange ∆t ≫ τ c gilt, die untere Grenze des dt -Integrals um einige τ c nach oben schieben, ohne signifikant das Ergebnis zu verändern. Die obere Grenze des dτ-Integrals ist dann mindestens einige τ c groß und kann durch +∞ ersetzt werden. Das dt -Integral reduziert sich dann einfach auf den Faktor ∆t, der sich aus (E-18) wieder herauskürzt. So ergibt sich ∞
J1 ≃
1 ∫ dτ e−iωif τ W fi (t )W if (t − τ) ℏ2
(E-24)
0
was man mit Hilfe der Beziehung (D-9) auch durch die spektrale (oder Fourier-) Darstellung von C if (τ) ausdrücken kann: J1 ≃
1 √2πℏ2
∞
∞
̃ if (ω) ∫ dτ ei(ω−ωif )τ ∫ dω C −∞
0
(E-25)
1322 | XIII Näherungsmethoden für zeitabhängige Probleme
Das Integral über τ ∞
∫ dτ ei(ω−ωif )τ
(E-26)
0
machen wir konvergent, indem wir einen Faktor e−ετ mit ε > 0 in den Integranden einführen und den Grenzwert ε → 0 betrachten. Dann erhalten wir ∞
∫ dτ ei(ω−ωif +iε)τ = − 0
1 i = i(ω − ω if + iε) ω − ω if + iε
(E-27)
Der Grenzwert ergibt wegen der Beziehung (12) aus Anhang II ∞
lim ∫ dτ ei(ω−ωif +iε)τ = πδ(ω − ω if ) + i P
ε→0
0
1 ω − ω if
(E-28)
Dieser Ausdruck in Gl. (E-25) eingesetzt, erhalten wir (E-20), wobei Γ und δ if durch (E-21) und (E-22) gegeben sind.
E-2-c Bewegungsgleichung für die Besetzungen Gemäß Gleichung (E-20) gilt J 1 +J 1∗ = Γ. Wenn wir dies in Gl. (E-17) einsetzen und (E-19) verwenden, erhalten wir ∆ ρ̃ ii (t) = −Γ ρ̃ ii (t) + Γ ρ̃ff (t) ∆t ∆ ρ̃ff (t) = +Γ ρ̃ ii (t) − Γ ρ̃ff (t) ∆t
(E-29)
Diese beiden Gleichungen sind unmittelbar anschaulich: zu jedem Zeitpunkt t macht das System einen Übergang von dem Zustand |φ i ⟩ nach |φ f ⟩, und zwar mit einer konstanten Rate Γ (Wahrscheinlichkeit pro Zeit).* Wenn sich zum Zeitpunkt t die Be setzungen der beiden Zustände |φ i ⟩ und |φ f ⟩ unterscheiden, werden sie sich anschlie ßend auf einen gemeinsamen Wert angleichen,† ohne je wieder ihren Anfangswert anzunehmen; dieses Verhalten wird durch eine Exponentialfunktion beschrieben. Auf langen Zeitskalen finden wir also ein irreversibles Verhalten, das sich offen sichtlich sehr von dem unterscheidet, was wir für ein zwei-Niveau-System mit einer periodischen (sinusförmigen) Störung gefunden haben; in jenem Fall ergab sich näm lich eine oszillierende und reversible Entwicklung, ähnlich der Rabi-Präzession eines Spin-1/2, als den man das zwei-Niveau-System auffassen kann (§ E-1). Der Leser mag sich fragen, wie es möglich ist, eine verlässliche Vorhersage auf langen Zeitskalen zu machen, obwohl wir nur eine Störungsrechnung bis zur zweiten Ordnung in W ausgeführt haben: Ausdrücke wie (E-11) und (E-13) sind ja sicherlich
* Anm. d. Ü.: Deswegen ist auch der Name „Ratengleichungen“ für das System (E-29) geläufig. † Anm. d. Ü.: Dazu berechne man aus Gl. (E-29) die stationäre Lösung ∆̃ ρff /∆t = 0.
E Verhalten eines zwei-Niveau-Atoms auf langen Zeitskalen |
1323
nicht mehr gültig, wenn ∆t groß wird. Die Vorhersage stützt sich auf den stochas tischen Charakter der Störung, und zwar auf ihre im Vergleich zu der Zeitskala 1/Γ kurzen Korrelationszeit τ c . In der Tat „erinnert“ sich das System zu jedem Zeitpunkt t nur sehr schwach an seine vergangene Entwicklung, auch wenn t viel später als der Anfangszustand bei t = 0 liegt: die zeitliche Änderung zwischen t und t + ∆t hängt nur von seiner unmittelbaren Vergangenheit im Intervall [t − τc , t] ab. Ist τc sehr kurz im Vergleich zu ∆t, dann wird sich das System zwischen t und t + ∆t nur geringfü gig ändern und deswegen kann dies mit einer Störungsrechnung erfasst werden. Die Rechnung läuft also darauf hinaus, die Zeitachse in Intervalle der Länge ∆t einzutei len, die sehr lang gegenüber τ c , aber kurz gegenüber der charakteristischen Zeitskala 1/Γ sind.* E-2-d Bewegungsgleichung für die Kohärenzen Neben den Besetzungen (E-15) der beiden Energieniveaus müssen wir uns auch mit den „Kohärenzen“ zwischen ihnen befassen: damit sind die nicht-Diagonalelemente des Dichteoperators gemeint: ρ̃ if (t + ∆t) = [b i (t + ∆t)] [b f (t + ∆t)]∗
(E-30)
An ihnen kann man ablesen, ob eine kohärente Superposition der beiden Zustände vorliegt. Dieses nicht-Diagonalelement enthält Terme in nullter, erster und zweiter Ordnung der Störung, s. Gleichungen (E-7) bis (E-11). Der Term nullter Ordnung ist eine Konstante, denn wir haben in Gleichung (E-6) die Amplituden b i (t) und b f (t) im Wechselwirkungsbild eingeführt. (In der gewöhnlichen Darstellung würden wir hier die freie Zeitentwicklung der Kohärenz an ihrer Bohr-Frequenz finden.) Diesen Term gibt es auch ohne die Störung, er liefert keine neue Information. Der Term erster Ord nung verschwindet, weil wir annehmen, dass die Matrixelemente der Störung im Mit tel Null ergeben. Die Kohärenzen bis zur zweiten Ordnung in W erhalten wir, indem wir in Gleichung (E-30) die Amplituden b i (t+∆t) und [b f (t+∆t)]∗ durch ihre Potenzrei he in W ersetzen und dann das Mittel über die Realisierungen der zufälligen Störung nehmen. So erhält man (0) (2) ρ̃ if (t + ∆t) − ρ̃ if (t) = [b i (t + ∆t)] [b f (t + ∆t)]∗ (2)
(0)
(1)
(1)
+ [b i (t + ∆t)] [b f (t + ∆t)]∗ + [b i (t + ∆t)] [b f (t + ∆t)]∗ + . . .
(E-31)
1. Beginnen wir mit den ersten zwei Zeilen dieses Ausdrucks. Wir werden etwas später (unter Punkt 2) zeigen, dass die dritte Zeile nicht berücksichtigt werden muss. * Anm. d. Ü.: Dieses Verfahren wird als Markow-Näherung bezeichnet. Es ist unter der Bedin gung (D-21) gültig und erlaubt es, die Differenzenquotienten in Gleichung (E-29) als Zeitableitungen aufzufassen.
1324 | XIII Näherungsmethoden für zeitabhängige Probleme (0)
(0)
Die Terme nullter Ordnung [b i (t + ∆t)] und [b f (t + ∆t)]∗ bleiben bei ihren Anfangs werten, so dass wir hier ∆t durch 0 ersetzen können. Indem wir die zweite Zeile von Gl. (E-11) verwenden, können wir umformen: (2)
(0)
[b i (t + ∆t)] [b f (t + ∆t)]∗ ∆t
t
0
0
1 = − 2 b i (t) b ∗f (t) ∫ eiω if t W if (t + t ) dt ∫ eiω fi t W fi (t + t ) dt ℏ
(E-32)
Nun genügt es, den Mittelwert dieses Ausdrucks zu nehmen, und wir haben die zweite Zeile von Gl. (E-31). Der Ausdruck aus der ersten Zeile von Gl. (E-31) wird berechnet, indem wir i und f in der zweiten Zeile von Gl. (E-11) vertauschen, komplex konjugieren und das Ergebnis mit b i (t) multiplizieren. Auf diese Weise erhält man (0)
(2)
[b i (t + ∆t)] [b f (t + ∆t)]∗ ∆t
t
1 = − 2 b i (t) b ∗f (t) ∫ e−iω fi t W fi∗ (t + t ) dt ∫ e−iω if t W if∗ (t + t ) dt ℏ
0
(E-33)
0
Dies ist identisch zu Gleichung (E-32), denn es gilt ω fi = −ω if und W fi∗ = W if . Wir werten jetzt den Mittelwert über die W if und W fi aus. Wie oben schon be sprochen, darf man das Produkt b i (t)b ∗f (t) und das Doppel-Integral in Gl. (E-32) unab hängig voneinander mitteln. Den Mittelwert des Integrals haben wir in § E-2-b bereits berechnet: er liefert als Ergebnis J 1∗ ∆t, wobei J 1 in Gl. (E-20) definiert ist. Dieses Er gebnis müssen wir mit 2 multiplizieren, weil die beiden Terme (E-32) und (E-33) sich addieren, wie wir gerade gesehen haben. Schließlich erhält man ρ̃ if (t + ∆t) = ρ̃ if (t)[1 − 2J 1∗ ∆t] = ρ̃ if (t)[1 − ∆t(Γ − 2i δ if )]
(E-34)
was wir auch so schreiben können: ∆ ρ̃ if (t) ρ̃ if (t + ∆t) − ρ̃ if (t) = = −(Γ − 2i δ if ) ρ̃ if (t) ∆t ∆t
(E-35)
Wir kommen jetzt auf die ursprünglichen Amplituden c i (t) und c f (t) des Zu standsvektors zurück. Die Relation (B-8) zeigt uns, dass wir die Matrixelemente des Dichteoperators wie folgt aus diesen Amplituden konstruieren können: ρ if (t) = [c i (t)] [c f (t)]∗ = e−i(E i −E f )t/ℎ [b i (t)] [b f (t)]∗ = e−iω if t ρ̃ if (t)
(E-36)
woraus folgt: d d ρ̃ if (t) ρ if (t) = −iω if ρ̃ if (t) + e−iω if t dt dt
(E-37)
E Verhalten eines zwei-Niveau-Atoms auf langen Zeitskalen |
1325
Aber die Ableitung von ρ̃ if (t) ist gerade durch den Differenzenquotienten (E-35) gegeben, wenn ∆t hinreichend kurz ist. Diese Gleichung eingesetzt in (E-37), erhalten wir d ρ if (t) = − [Γ + i(ω if − 2δ if )] ρ if (t) dt
(E-38)
Dieses Ergebnis zeigt, dass die Kohärenz zwischen |φ i ⟩ und |φ f ⟩ mit der Rate Γ ge dämpft wird; außerdem verschiebt sich ihre Frequenz um den Wert −2δ if . 2. Die dritte Zeile in Gl. (E-31) ist wegen Gl. (E-8) und Gl. (E-9) proportional zu b f (t)b ∗i (t) und erzeugt also eine Kopplung zwischen ρ̃ if (t + ∆t) und ρ̃ fi (t): die zeitliche Änderung von ρ̃ if (t + ∆t) hängt also scheinbar auch von dem anderen nicht-Diagonal element ρ̃ fi (t) ab. Ist die Energiedifferenz ℏ|ω if | allerdings genügend groß, dann ent hält die ungestörte Zeitentwicklung dieser nicht-Diagonalelemente sehr unterschied liche Frequenzen; aus diesem Grund kann man die Wirkung der sie koppelnden Stö rung vernachlässigen (sie verschwindet, wenn man die Säkularnäherung anwendet). Man kann außerdem zeigen, dass die erwähnte dritte Zeile verschwindet, wenn die Störung statistisch rotationssymmetrisch um die z-Achse ist.⁸ Der Beweis wird für ei nen allgemeineren Fall in der Ergänzung EXIII durchgeführt.⁹ E-2-e Energieverschiebungen Die eben durchgeführte Rechnung zeigt, dass zwei Energieniveaus durch die Störung verschoben werden, sagt uns aber nicht, wie groß die Verschiebung der einzelnen Zu stände ist. Wir können bislang nur die Differenz ℏ(δ i − δ f ) der Verschiebungen ange ben, sie ist nämlich gleich −2ℏδ if [s. Gl. (E-38)]. Man kann allerdings zeigen, dass δ i und δ f entgegengesetzte Vorzeichen haben, so dass δ i = −δ if und δ f = δ if gilt. Da von kann man sich am besten überzeugen, indem man die Theorie des „beleuchteten Atoms“ (engl.: dressed atom, frz.: atome habillé) verwendet, die in der Ergänzung CXX vorgestellt wird. Hier wollen wir einen weniger aufwändigen Beweis führen. Stellen wir uns vor, es gibt einen dritten Zustand |φ k ⟩, einen „Zuschauer“, der nicht an die Stö rung koppelt, so dass seine Energie nicht von ihr verschoben werden kann. Nehmen wir wei ter an, dass es eine Kohärenz ρ̃ ik (t) zwischen |φ i ⟩ und |φ k ⟩ gibt, und untersuchen wir, wie sie durch die Störung verändert wird, die auf den Zustand |φ i ⟩ wirkt. Wir rechnen ̃ ρ ik (t + ∆t) ge nau so aus wie die Kohärenz ̃ ρ if (t + ∆t) aus dem Abschnitt zuvor, bis auf den Unterschied, dass b k (t + ∆t) = b k (t) in allen Ordnungen in W gilt (denn die Störung koppelt ja nicht an den Zustand |φ k ⟩). Wenn wir f durch k in Gl. (E-31) ersetzen, verschwinden alle Terme bis auf die zweite Zeile (2)
(2)
mit b i (t + ∆t)b ∗k (t). Die weitere Rechnung ist dieselbe, die wir oben für b i (t + ∆t)b ∗f (t) ausge führt haben und liefert als Ergebnis dasselbe wie Gl. (E-32), mit f ersetzt durch k, außer in δ if .
8 Wir erinnern uns, dass die z-Achse für den Spin-1/2 definiert ist, den man dem zwei-Niveau-System zuordnen kann. 9 Die Diagonalelemente von W verschwinden im Allgemeinen nicht, so dass die Kohärenzen auch an die Besetzungen gekoppelt sein können. In der Ergänzung EXIII nehmen wir nur an, dass W invariant unter Drehungen um beliebige Achsen ist.
1326 | XIII Näherungsmethoden für zeitabhängige Probleme Der Faktor 2 vor J1∗ tritt hier nicht auf, denn er ergab sich oben aus der ersten Zeile in Gl. (E-31), die hier fehlt. Letztendlich erhält man ̃ ∆̃ ρ ik (t) ρ ik (t) ρ ik (t + ∆t) − ̃ Γ ρ ik (t) = = − ( − i δ if ) ̃ ∆t ∆t 2
(E-39)
Die Kohärenz zwischen |φ i ⟩ und |φ k ⟩ zerfällt also mit der Rate Γ/2; ihre Oszillationsfrequenz war ohne die Störung gleich ω i − ω k und wird jetzt um −δ if verändert. Weil nun die Störung den Zustand |φ k ⟩ nicht beeinflusst, folgt daraus, dass es der Zustand |φ i ⟩ ist, dessen Energie um den Wert ℏδ i = −ℏδ if verschoben wird. Der Zustand |φ f ⟩ dagegen wird um ℏδ f = +ℏδ if verschoben, denn die Differenz der Verschiebungen von |φ i ⟩ und |φ f ⟩ muss gemäß Gl. (E-38) gleich −2ℏδ if sein. Wir untersuchen schließlich noch das Vorzeichen von δ if an Hand des expliziten Ausdrucks ̃ if (ω) reell ist; nehmen wir weiter an, dass dies in (E-22). In § D-1 haben wir gesehen, dass C einem Frequenzband um ω = ωc eine positive Funktion ist, die außerhalb davon verschwindet. Aus Gl. (E-22) lesen wir dann ab ωc > ω if ⇒ δ if > 0 bzw.
ωc < ω if ⇒ δ if < 0
(E-40)
Falls die Energieniveaus so liegen, dass wir E i > E f haben, gilt ω if > 0. Für eine „hochfrequen te“ Störung mit ωc > ω if liefert uns Gl. (E-38), dass δ if die Energiedifferenz der beiden Zustände |φ i ⟩ und |φ f ⟩ verkleinert. Sind die Niveaus anders angeordnet (E i < E f ) dann ist ω if < 0, und nun ist eine Störung mit ωc < ω if < 0 nötig, um die Energiedifferenz zu verkleinern. In beiden Fällen können wir also sagen, dass sich die beiden Niveaus einander annähern, wenn ωc und ω if dasselbe Vorzeichen haben und |ωc | > |ω if | gilt. Dagegen werden die Niveaus „auseinan dergedrückt“, wenn eine niederfrequente Störung wirkt, so dass die umgekehrte Ungleichung gilt.
E-3 Optisch breitbandige Anregung eines Atoms Wir zeigen nun, wie mit den vorherigen Überlegungen die Anregung eines zweiNiveau-Atoms durch eine breitbandige Strahlungsquelle beschrieben werden kann. Eine derartige Quelle modellieren wir als eine inkohärente Superposition von mono chromatischen Feldern, deren Frequenzen sich über ein Frequenzband ∆ω erstrecken und deren Phasen zufällig sind. Die Kopplung zwischen dem Atom und dem Strah lungsfeld ist dann in der Tat eine stochastische Störung; die entsprechende Korrela tionszeit ist um so kürzer, je breiter das Spektrum ist (größeres ∆ω), was wir weiter unten noch genauer sehen werden. Wir befinden uns damit genau in dem Terrain, das wir in den § D und § E abgesteckt haben, und können deren Ergebnisse unmittelbar verwenden. Wir interessieren uns für die Rate, mit der das Atom die Strahlung absor biert, und für die Energieverschiebungen, die aufgrund der Kopplung zwischen Atom und Strahlung entstehen.¹⁰
10 Dieses Problem behandeln wir auch in der Ergänzung AXIII , § 3-b mit einer anderen Methode; dort werden wir die Übergangswahrscheinlichkeiten aufsummieren, die sich aus jeder einzelnen mono chromatischen Welle ergeben, die zusammen das Strahlungsfeld bilden, das das Atom beleuchtet.
E Verhalten eines zwei-Niveau-Atoms auf langen Zeitskalen | 1327
E-3-a Korrelationsfunktionen der Wechselwirkung Das Matrixelement W fi (t) der Störung W, die die Atom-Licht-Wechselwirkung be schreibt, können wir wie folgt schreiben (s. Ergänzung AXIII , § 1-c) W fi (t) = −⟨φ f | DE(t) | φ i ⟩ = −𝒟E(t)
(E-41)
wobei D der Operator für das elektrische Dipolmoment des Atoms ist und E(t) das elektrische Feld der auf das Atom einfallenden Strahlung.¹¹ Wir haben hier definiert 𝒟 = ⟨φ f | D | φ i ⟩
(E-42)
und als weitere Vereinfachung nehmen wir an, dass 𝒟 reell ist. (Dies kann man im mer erreichen, indem man die relative Phase der Zustände |φ i ⟩ und |φ f ⟩ anpasst.) Die Korrelationsfunktion der Störung ist nun proportional zu der des elektrischen Felds: W fi (t)W if (t − τ) = 𝒟 2 E(t)E(t − τ)
(E-43)
Wir zerlegen das Feld in sein Fourier-Spektrum, +∞
E(t) =
1 ̃ ∫ dω eiωt E(ω) √2π
(E-44)
−∞
und weil das Feld reell ist, haben wir ̃ ̃ ∗ (ω) E(−ω) =E
(E-45)
Alle Fourier-Komponenten haben Phasen, die wir als untereinander unabhängige und gleichverteilte Zufallsvariablen annehmen. Das bedeutet für den Mittelwert: ̃ ̃ ∗ (ω ) = ℐ(ω) δ(ω − ω ) E(ω) E
(E-46)
wobei die Größe 2 ̃ ℐ(ω) ∝ |E(ω)|
(E-47)
die spektrale Verteilung (oder spektrale Dichte) der einfallenden Strahlungsintensität beschreibt. Wir nehmen an, dass die Funktion ℐ(ω) eine Breite ∆ω hat. Mit diesen Voraussetzungen wird aus Gleichung (E-43) für die Korrelationsfunk tion [unter Verwendung von Gl. (E-45) und Gl. (E-46)] 𝒟2 ̃ ̃ ∗ (ω ) E ∫ dω ∫ dω eiωt e−iω (t−τ) E(ω) 2π 𝒟2 = ∫ dω ℐ(ω) eiωτ 2π
W fi (t)W if (t − τ) =
(E-48)
11 Um die Gleichungen zu vereinfachen, ignorieren wir, dass das Feld E(t) und der Dipol D Vektoren sind.
1328 | XIII Näherungsmethoden für zeitabhängige Probleme
Wir beobachten zunächst, dass diese Funktion nur von der Zeitdifferenz τ abhängt: die Störung ist also ein stationärer stochastischer Prozess. Weiterhin ist festzustellen, dass ein Strahlungsspektrum ℐ(ω) in Form einer Glockenkurve mit der Breite ∆ω zu einer Korrelationsfunktion in der Zeitdomäne führt, die auf einer Zeitskala τc zerfällt, die invers proportional zu der Frequenz-Breite ist (s. § 2 im Anhang I) τc ≃
1 ∆ω
(E-49)
Wird das Atom nun von einem hinreichend breitbandigen Spektrum angeregt, dann dürfen wir annehmen, dass die Korrelationszeit τc kurz genug ist, so dass die Ergeb nisse aus § D und § E anwendbar sind. E-3-b Absorption und Licht-Verschiebung Aus der Beziehung (E-48) lesen wir die Fourier-Transformierte der Korrelationsfunk tion ab: C if (ω) =
𝒟2 ℐ(ω) √2π
(E-50)
so dass wir für die Größe Γ aus Gl. (D-19) hier den folgenden Ausdruck erhalten: Γ=
𝒟2 ℐ(ω if ) ℎ2
(E-51)
Wir erinnern uns, dass Γ eine Übergangsrate beschreibt, d. h. die Wahrscheinlichkeit pro Zeiteinheit, dass ein Übergang von dem Zustand |φ i ⟩ nach |φ f ⟩ stattfindet. Diese Rate ist proportional zu der spektralen Dichte ℐ(ω if ), also zur Fourier-Transformier te der Korrelationsfunktion, ausgewertet an der Übergangsfrequenz ω if . Es ist bemer kenswert, wie sehr sich dieses Ergebnis von dem Fall eines monochromatischen Strah lungsfelds unterscheidet, in dem eine Rabi-Oszillation zwischen den Zuständen |φ i ⟩ und |φ f ⟩ erzeugt wird. Wenn man sich für die Wahrscheinlichkeit interessiert, dass die Strahlung das Atom aus seinem Grundzustand anregt, dann sind die Zustände |φ i ⟩ und |φ f ⟩ jeweils der „untere“ und „obere“ Zustand des Übergangs. Wir haben also E i − E f = ℏω if < 0
(E-52)
Die Winkelfrequenz ω if in Gl. (E-51) ist dann negativ: in einem Absorptionsvorgang spielen also die negativen Fourier-Komponenten ω eine Rolle. (Natürlich haben für ein elektrisches Feld proportional zu cos ωt oder sin ωt die positiven und negativen Frequenz-Komponenten dieselbe Intensität, s. Gl. (E-45), so dass diese Unterschei dung nicht wesentlich ist.) Die durchgeführte Rechnung ist auch für E i − E f > 0 gültig, und in diesem Fall haben wir es mit dem Vorgang der „stimulierten Emission“ (oder induzierten Emission) zu tun: hier bringt die Strahlung das Atom dazu, aus dem an geregten Zustand in den energetisch tiefer liegenden Grundzustand zu fallen. Unsere
E Verhalten eines zwei-Niveau-Atoms auf langen Zeitskalen | 1329
Überlegungen liefern also eine Begründung für das Einführen der Koeffizienten B fi und B if , die auf Einstein zurückgehen und die Absorption und Emission von Photo nen aus der Schwarzkörper-Strahlung beschreiben; in diesem Fall liegt natürlich ein breitbandiges Spektrum vor. Wir werten schließlich noch die Energie-Verschiebungen aus, die aufgrund der Störung durch das Strahlungsfeld entstehen. Aus den Ergebnissen in § E-2-c ist klar, dass die Anregung des Atoms durch breitbandige Strahlung die Energien der Zustände |φ i ⟩ und |φ f ⟩ jeweils um die Größen −ℏδ if und +ℏδ if verschiebt. Diese nennt man „Lichtverschiebungen“ (engl.: light shift oder AC Stark shift). Sie ergeben sich aus dem Hauptwert-Integral δ=
ℐ(ω) 𝒟2 P∫ dω ω − ω if 2πℎ2
(E-53)
Offenbar sind die Lichtverschiebungen proportional zur Intensitätsspektrum ℐ(ω). Ihr Vorzeichen hängt von der „Verstimmung“ zwischen der Zentralfrequenz ωc des Strahlungsspektrums und der Frequenz ω if des atomaren Übergangs ab. Ist |ωc | > |ω if |, spricht man von einer Strahlung, die gegenüber dem atomaren Übergang „blau verstimmt“ ist. Der Beziehung (E-40) entnehmen wir dann, dass die beiden Zustände sich in dem Strahlungsfeld energetisch annähern. Genau das Umgekehrte geschieht in einem „rotverstimmten“ Strahlungsfeld. Wir werden auf diese Lichtverschiebungen in der Ergänzung CXX zurückkommen, wo wir sie mit der Methode des „beleuchteten Atoms“ (engl.: dressed atom, frz.: atome habillé) behandeln. Dort werden wir sehen, dass sie auch bei der Anregung mit einem monochromatischen Strahlungsfeld vor kommen. Es stellt sich heraus, dass man damit ein nützliches Werkzeug zur Verfügung hat, um die Bewegung von Atomen zu manipulieren.
Referenzen und Literaturhinweise Zeitabhängige Störungstheorie (Potenzreihe für den Zeitentwicklungsoperator): Mes siah (1.17), Kap. XVII, § 1 und § 2. Plötzliche bzw. adiabatische Störung des Hamilton-Operators: Messiah (1.17), Kap. XVII, § II; Schiff (1.18), Kap. 8, § 35. Darstellung der Störungsreihe durch Feynman-Diagramme: Ziman (2.26), Kap. 3; Mandl (2.9), Kap. 12 bis 14; Bjorken und Drell (2.10), Kap. 16 und 17.
•
1330 | Übersicht über die Ergänzungen zu Kapitel XIII
Übersicht über die Ergänzungen zu Kapitel XIII AXIII Atom und elektromagnetische Strahlung
Wendet die allgemeinen Überlegungen aus § C-2 von Kapitel XIII auf das besonders wichtige Beispiel der Wechselwirkung eines Atoms mit einer sinusförmigen elektromagnetischen Welle an. Dabei werden grundlegende Begriffe wie die Auswahlregeln für Spektrallinien, die Absorption und stimulierte Emission von Strahlung, die Oszillatorstärke usw. eingeführt. (von mittlerer Schwierigkeit; wird wegen seiner Bedeutung für die Atomphysik auch für das erste Lesen empfohlen)
BXIII Zweiniveausystem und sinusförmige Störung
Betrachtet ein einfaches Modell zur Untersuchung von nichtlinearen Effekten, die bei der Wechselwirkung einer elektromagnetischen Welle mit einem atomaren System auftreten (Sättigung, Mehrphotonenübergänge usw.). (schwieriger)
CXIII Oszillationen zwischen zwei Zuständen
Untersucht ein System mit diskreten Energieniveaus unter dem Einfluss einer Resonanzstörung für ein langes Zeitintervall. Die Ergebnisse aus § C-2 von Kapitel XIII, die nur für kurze Zeitintervalle gültig sind, werden vervollständigt. (relativ leicht)
DXIII Zerfall eines diskreten Zustands in ein Kontinuum
Untersucht das Verhalten auf langen Zeitskalen eines diskreten Zustands, der resonant an ein Kontinuum von Endzuständen gekoppelt ist. Die Ergebnisse aus § C-3 von Kapitel XIII für kurze Zeitintervalle (Fermis Goldene Regel) werden vervollständigt und genauer gefasst. Wir zeigen, dass die Aufenthaltswahrscheinlichkeit des Systems im diskreten Niveau exponentiell abfällt, und rechtfertigen somit das Konzept der Lebensdauern, das in Ergänzung KIII phänomenologisch eingeführt wurde. (wichtig wegen der zahlreichen physikalischen Anwendungen; fortgeschrittenes Master-Niveau)
EXIII Stochastische zeitabhängige Störung. Relaxation
Behandelt genauer und allgemeiner die Wirkung einer zufälligen Störung aus § D und § E-2 von Kapitel XIII. Ausgangspunkt ist die Markow-Bedingung, wonach das zeitliche Gedächtnis der Störung viel kürzer als die Zeit ist, die für einen signifikanten Einfluss nötig wäre. In einem ersten Schritt leitet diese Ergänzung eine allgemeine Mastergleichung für die Matrixelemente des Dichteoperators her. Im zweiten Schritt wird die Theorie auf ein Spin-1/2-Ensemble angewendet, das an eine zufällige, isotrope Störung koppelt. (wichtig wegen vieler Anwendungen in Magnetresonanz und Optik)
FXIII Aufgaben
Aufgabe 10 kann im Anschluss an Ergänzung AXIII gelöst werden; sie befasst sich mit dem Zusammenhang zwischen den äußeren Freiheitsgraden eines quantenmechanischen Systems und der Absorption elektromagnetischer Strahlung (Doppler-Effekt, Rückstoßenergie, Mößbauer-Effekt). (einige Aufgaben, insbesondere 8 und 9, sind schwieriger, aber wichtig)
Atom und elektromagnetische Strahlung
| 1331
•
Ergänzung AXIII Atom und elektromagnetische Strahlung 1 1-a 1-b 1-c 1-d 2 2-a 2-b 2-c 3 3-a 3-b
Der Wechselwirkungs-Operator. Auswahlregeln | 1332 Felder und Potentiale einer ebenen elektromagnetischen Welle | 1332 Wechselwirkungs-Hamilton-Operator bei niedrigen Intensitäten | 1333 Elektrische Dipol-Kopplung | 1335 Magnetische Dipol- und elektrische Quadrupol-Kopplung | 1339 Anregung außerhalb der Resonanz | 1342 Klassisches Modell eines elastisch gebundenen Elektrons | 1343 Quantenmechanische Berechnung des induzierten Dipolmoments | 1344 Diskussion. Oszillatorstärke | 1345 Resonanzanregung. Absorption und induzierte Emission | 1346 Übergangswahrscheinlichkeit in einer monochromatischen Welle | 1346 Anregung durch eine breite Linie | 1347
In Kapitel XIII, § C untersuchten wir den Spezialfall einer sinusförmigen zeitabhängi gen Störung W(t) = W sin ωt. Dabei stießen wir auf das Resonanzphänomen, das bei Annäherung von ω an eine Bohr-Frequenz ω fi = (E f − E i )/ℏ des betrachteten physi kalischen Systems auftritt. Eine besonders wichtige Anwendung dieser Theorie ist die Untersuchung eines Atoms, das mit einer monochromatischen Welle in Wechselwirkung steht. Dabei ge langt man zu grundlegenden atomphysikalischen Begriffen und Zusammenhängen wie den Auswahlregeln für Spektrallinien, der induzierten Absorption und Emission von Strahlung, der Oszillatorstärke usw. Wir beschränken uns weiter auf die Störungstheorie erster Ordnung. Erst in der Ergänzung BXIII gehen wir dann auf einige Effekte höherer Ordnung (nichtlineare Ef fekte) ein. Wir untersuchen zunächst die Struktur des Wechselwirkungs-HamiltonOperators (§ 1). Dadurch können wir die elektrischen und magnetischen Dipolterme sowie den elektrischen Quadrupolterm isolieren und die zugehörigen Auswahlregeln untersuchen. Wir berechnen dann das von einer einfallenden Welle außerhalb der Re sonanz induzierte elektrische Dipolmoment (§ 2) und vergleichen die Ergebnisse mit dem Modell des elastisch gebundenen Elektrons. Schließlich gehen wir auf die Vor gänge der Absorption und der induzierten Emission von Strahlung ein (§ 3).
https://doi.org/10.1515/9783110638769-032
•
1332 | Ergänzung AXIII
1 Der Wechselwirkungs-Operator. Auswahlregeln 1-a Felder und Potentiale einer ebenen elektromagnetischen Welle Wir betrachten eine ebene elektromagnetische Welle¹ mit dem Wellenvektor k (par allel zur y-Achse) und der Kreisfrequenz ω = ck. Das elektrische Feld ist parallel zur z-Richtung, während das magnetische Feld in x-Richtung weist (Abb. 1).
Abb. 1: Elektrisches Feld E und magnetisches Feld B einer ebenen Welle mit dem Wellenvektor k.
Für diese Welle ist es bei geeigneter Eichung (s. Anhang III, § 4-b-α) immer möglich, das skalare Potential U(r, t) verschwinden zu lassen. Das Vektorpotential A(r, t) wird dann durch den reellen Ausdruck A(r, t) = 𝒜0 ez ei(ky−ωt) + 𝒜0∗ ez e−i(ky−ωt)
(1)
gegeben, wobei 𝒜0 eine komplexe Konstante ist, deren Phase von der Wahl des Zeit nullpunkts abhängt. Es gilt dann ∂ A(r, t) = iω𝒜0 ez ei(ky−ωt) − iω𝒜0∗ ez e−i(ky−ωt) ∂t B(r, t) = ∇ × A(r, t) = ik𝒜0 ex ei(ky−ωt) − ik𝒜0∗ ex e−i(ky−ωt) E(r, t) = −
(2) (3)
Wir wählen den Zeitnullpunkt so, dass die Konstante 𝒜0 rein imaginär wird und set zen iω𝒜0 = ℰ/2
(4a)
ik𝒜0 = ℬ/2
(4b)
1 Der Einfachheit halber beschränken wir uns hier auf ebene Wellen. Die Ergebnisse dieser Ergänzung können jedoch auch auf beliebige elektromagnetische Felder verallgemeinert werden.
Atom und elektromagnetische Strahlung
|
1333
•
worin ℰ und ℬ zwei reelle Größen sind, für die gilt ℰ ω = =c. ℬ k
(5)
Wir erhalten dann E(r, t) = ℰ ez cos(ky − ωt)
(6)
B(r, t) = ℬ ex cos(ky − ωt)
(7)
ℰ und ℬ sind demnach die Amplituden des elektrischen bzw. des magnetischen Fel des der betrachteten ebenen Welle. Schließlich berechnen wir den zu dieser ebenen Welle gehörenden Poynting-Vek tor² G, G = ε0 c2 E × B
(8)
Ersetzen wir E und B in Gl. (8) durch die Ausdrücke (6) und (7) und bilden den Zeit mittelwert über eine große Anzahl von Perioden, so erhalten wir mit Gl. (5) G = ε0 c
ℰ2 ey 2
(9)
1-b Wechselwirkungs-Hamilton-Operator bei niedrigen Intensitäten Die ebene elektromagnetische Welle falle auf ein atomares Elektron (mit der Masse m und der Ladung q), das über ein Zentralpotential V(r) im Abstand r vom Ursprung an einen dort ruhenden Kern gebunden ist. Der Hamilton-Operator dieses Elektrons lautet H=
1 q [P − qA(R, t)] 2 + V(R) − S ⋅ B(R, t) 2m m
(10)
Der letzte Term beschreibt die Wechselwirkung des magnetischen Moments des Elek tronenspins mit dem oszillierenden Magnetfeld der ebenen Welle. Die Operatoren A(R, t) und B(R, t) erhält man, indem man in den klassischen Ausdrücken (1) und (3) die Ortskoordinaten x, y, z durch die Observablen X, Y, Z ersetzt. Bei der Berechnung des Quadrats auf der rechten Seite der Gleichung müssen wir grundsätzlich beachten, dass P im Allgemeinen mit einer von R abhängigen Funktion nicht vertauscht. Diese Vorsicht ist hier allerdings nicht nötig, da wegen der Paralle lität von A zur z-Achse im gemischten Term nur die P z -Komponente auftritt; P z ver tauscht aber mit der Y-Komponente von R, die als einzige im Ausdruck (1) für A(R, t)
2 Man erinnere sich, dass der Energiefluss durch ein Oberflächenelement dS senkrecht zum Einheits vektor n gleich G ⋅ n dS ist.
•
1334 | Ergänzung AXIII
erscheint.* Wir bilden nun H = H0 + W(t)
(11)
wobei H0 =
P2 + V(R) 2m
(12)
der atomare Hamilton-Operator und W(t) = −
q q q2 2 P ⋅ A(R, t) − S ⋅ B(R, t) + A (R, t) m m 2m
(13)
der Operator für die Wechselwirkung mit der einfallenden Welle ist (die Matrixelemen te von W(t) gehen für 𝒜0 → 0 gegen null). Die ersten beiden Terme auf der rechten Seite von Gl. (13) hängen linear von 𝒜0 ab, während der dritte quadratisch in 𝒜0 ist. Bei den üblichen Lichtquellen ist die In tensität ausreichend klein, so dass der Einfluss des 𝒜02 -Terms gegen den der 𝒜0 -Terme vernachlässigt werden kann. Wir schreiben also W(t) ≈ WI (t) + WII (t)
(14)
mit q P ⋅ A(R, t) m q WII (t) = − S ⋅ B(R, t) m WI (t) = −
(15) (16)
Wir betrachten nun die relative Größenordnung der Matrixelemente von WI (t) und WII (t) zwischen zwei gebundenen Zuständen des Elektrons: die Matrixelemente von S sind von der Ordnung ℏ und die von B von der Ordnung k𝒜0 [s. Gl. (3)]. Also ist WII (t) qℏk𝒜0 /m ℏk ≈ = WI (t) qp𝒜0 /m p
(17)
Aufgrund der Unschärferelation ist ℏ/p höchstens von atomarer Größenordnung (cha rakterisiert durch den Bohr-Radius a0 ≈ 0.5 × 10−8 cm); k ist gleich 2π/λ, wobei λ die Wellenlänge der einfallenden Welle bezeichnet. Diese ist aber im optischen Spektral bereich (sichtbares Licht) sehr viel größer als a0 , so dass gilt WII (t) a0 ≈ ≪1 WI (t) λ
(18)
* Anm. d. Ü.: In der kinetischen Energie führt der Kommutator von P mit A im Allgemeinen auf einen Term proportional zu ∇⋅A. Man kann die Eichung des Vektorpotentials so wählen, dass diese Divergenz verschwindet („Coulomb-Eichung“).
Atom und elektromagnetische Strahlung
|
1335
•
1-c Elektrische Dipol-Kopplung α Elektrische Dipolnäherung. Physikalische Deutung Mit Gl. (1) für A(R, t) können wir WI (t) in der Form WI (t) = −
q P z (𝒜0 eikY e−iωt + 𝒜0∗ e−ikY eiωt ) m
(19)
schreiben. Die Entwicklung der Exponentialfunktion e±ikY in Potenzen von kY lautet e±ikY = 1 ± ikY −
1 2 2 k Y + ⋅⋅⋅ 2
(20)
Da Y von atomarer Größenordnung ist, gilt wie oben kY ≈
a0 ≪1 λ
(21)
Wir erhalten demnach eine gute Näherung für WI , wenn wir nur den ersten Term der Entwicklung (20) berücksichtigen. Den Operator, der sich ergibt, wenn wir in Gl. (19) e±ikY durch eins ersetzen, wollen wir mit WDE bezeichnen: WDE (t) =
qℰ P z sin ωt mω
(22)
WDE (t) ist der elektrische Dipol-Hamilton-Operator. Die elektrische Dipolnäherung, die auf den Bedingungen (18) und (21) beruht, besteht also in der Vernachlässigung von WII (t) gegenüber WI (t), wobei dann W(t) ≈ WDE (t)
(23)
ist. Wenn wir W(t) durch WDE (t) ersetzen, führt das Elektron Schwingungen aus, als wäre es einem homogenen sinusförmigen elektrischen Feld ℰez cos ωt ausgesetzt. Sei ne Amplitude stimmt mit der des elektrischen Feldes der einfallenden Welle im Ur sprung O überein. Physikalisch bedeutet dies, dass die Wellenfunktion des gebunde nen Elektrons so stark bei O lokalisiert ist, dass es die räumliche Variation des elek trischen Feldes der einfallenden Welle nicht „spüren“ kann. Wir berechnen daher die zeitliche Entwicklung von ⟨R⟩(t): Das Ehrenfest-Theorem ergibt (s. Kap. III, § D-1-d) d ⟨R⟩ = dt d ⟨P⟩ = dt
1 ⟨P⟩ qℰ ⟨[R, H0 + WDE ]⟩ = + ez sin ωt iℏ m mω 1 ⟨[P, H0 + WDE ]⟩ = −⟨∇V(R)⟩ iℏ
(24)
Eliminieren wir aus diesen beiden Gleichungen ⟨P⟩, so erhalten wir nach einfacher Rechnung m
d2 ⟨R⟩ = −⟨∇V(R)⟩ + qℰ ez cos ωt dt2
(25)
•
1336 | Ergänzung AXIII
womit wir das erwartete Ergebnis gefunden haben: Das Zentrum des dem Elektron zugeordneten Wellenpakets bewegt sich wie ein Teilchen mit der Masse m und der Ladung q, das der (atomaren) Zentralkraft [der erste Term auf der rechten Seite von Gl. (25)] und dem Einfluss eines homogenen elektrischen Feldes [zweiter Term in Gl. (25)] unterliegt. Bemerkung: Der Ausdruck (22) für den elektrischen Dipol-Hamilton-Operator scheint ziemlich ungewöhnlich für ein Teilchen der Ladung q, das mit einem homogenen elektrischen Feld E = ℰ ez cos ωt in Wechselwirkung steht. Vielmehr erwarten wir hierfür einen Wechselwirkungsoperator der Form WDE = −D ⋅ E = −qℰZ cos ωt
(26)
wobei D = qR das elektrische Dipolmoment des Elektrons ist. Die beiden Ausdrücke (22) und (26) sind jedoch äquivalent. Wir zeigen, dass wir durch eine Eich transformation (die den physikalischen Gehalt der Quantenmechanik nicht beeinflusst; s. Ergän zung HIII ) von der einen auf die andere Form übergehen können: Die Eichung, mit der sich Gl. (22) ergibt, lautet ℰ ez sin(ky − ωt) ω U(r, t) = 0 A(r, t) =
(27a) (27b)
[um (27a) zu erhalten, haben wir in Gl. (1) 𝒜0 durch ℰ/2iω ersetzt; s. Gl. (4a)]. Wir betrachten nun die Eichtransformation, die zu der Funktion χ(r, t) = z
ℰ sin ωt ω
(28)
gehört. Sie lautet A = A + ∇χ = ez
ℰ [sin(ky − ωt) + sin ωt] ω
∂χ U = U − = −zℰ cos ωt ∂t
(29a) (29b)
Die elektrische Dipolnäherung läuft darauf hinaus, ky durch 0 zu ersetzen. Es gilt dann A ≈ e z
ℰ [sin(−ωt) + sin ωt] = 0 ω
(30)
Wenn wir zusätzlich wie oben die mit dem Spin zusammenhängenden magnetischen Wechsel wirkungsterme vernachlässigen, erhalten wir für den Hamilton-Operator des Systems 1 2 (P − qA ) + V(R) + qU (R, t) 2m P2 = + V(R) + qU (R, t) 2m = H 0 + W (t)
H =
(31)
wobei H 0 der durch Gl. (12) gegebene atomare Hamilton-Operator ist und wir in W (t) = qU (R, t) = −qZ ℰ cos ωt = WDE (t)
(32)
die übliche Form (26) des Hamilton-Operators für die elektrische Dipol-Wechselwirkung wieder finden.
Atom und elektromagnetische Strahlung
| 1337
•
Zu beachten ist, dass das System nicht mehr durch denselben Ketvektor beschrieben wird, wenn wir von der Eichung (27) zur Eichung (29) übergehen (s. Ergänzung HIII ). Das Ersetzen von WDE (t) durch WDE (t) ist daher mit einem Wechsel des Zustandsvektors verbunden, wobei der physika lische Gehalt der Theorie natürlich nicht geändert wird. Im Folgenden werden wir weiter die Eichung (27) verwenden.
β Matrixelemente des elektrischen Dipol-Hamilton-Operators Später werden wir die Ausdrücke für die Matrixelemente von WDE zwischen Zustän den |φ i ⟩ und |φ f ⟩, nämlich Eigenzuständen von H0 mit den Eigenwerten E i und E f , benötigen. Nach Gl. (22) lauten sie ⟨φ f | WDE (t) | φ i ⟩ =
qℰ sin ωt ⟨φ f |P z |φ i ⟩ mω
(33)
Die Matrixelemente von P z auf der rechten Seite von Gl. (33) sind leicht durch Ma trixelemente von Z ersetzbar. Da wir alle magnetischen Effekte im atomaren Hamil ton-Operator vernachlässigen [s. Gl. (12) für H0 ], können wir schreiben [Z, H0 ] = iℏ
Pz ∂H0 = iℏ ∂P z m
(34)
woraus sich ergibt ⟨φ f | [Z, H0 ] | φ i ⟩ = ⟨φ f | ZH0 − H0 Z | φ i ⟩ = − (E f − E i ) ⟨φ f | Z | φ i ⟩ =
iℏ ⟨φ f | P z | φ i ⟩ m
(35)
Führen wir die Bohr-Frequenz ω fi = (E f − E i )/ℏ ein, erhalten wir also ⟨φ f | P z | φ i ⟩ = im ω fi ⟨φ f | Z | φ i ⟩
(36)
und damit ⟨φ f | WDE (t) | φ i ⟩ = iq
ω fi ℰ sin ωt ⟨φ f | Z | φ i ⟩ ω
(37)
Die Matrixelemente von WDE (t) sind somit proportional zu denen von Z. Bemerkung: In Gl. (37) tritt das Matrixelement von Z auf, weil wir ein elektrisches Feld E(r, t) parallel zur z-Achse betrachtet haben. In der Praxis kann es von Vorteil sein, ein Koordinaten-System zu wäh len, das nicht der Polarisation des Lichts, sondern der Symmetrie der Zustände |φ i ⟩ und |φ f ⟩ Rechnung trägt. Wenn sich das Atom z. B. in einem homogenen Magnetfeld B0 befindet, ist die günstigste Wahl der Quantisierungsachse zur Untersuchung seiner stationären Zustände |φ n ⟩ offensichtlich parallel zu B0 . Die Polarisation des elektrischen Feldes E(r, t) kann dann in Bezug auf die z-Richtung beliebig sein. In solchen Fällen ist das Matrixelement von Z in Gl. (37) durch das einer Linearkombination von X, Y und Z zu ersetzen.
•
1338 | Ergänzung AXIII
γ Auswahlregeln für elektrische Dipolübergänge Wenn das Matrixelement zwischen den Zuständen |φ i ⟩ und |φ f ⟩ von null verschieden, d. h. wenn ⟨φ f |Z|φ i ⟩ ungleich null ist,³ handelt es sich bei dem Übergang |φ i ⟩ → |φ f ⟩ um einen elektrischen Dipolübergang. Zur Untersuchung der Übergänge zwischen |φ i ⟩ und |φ f ⟩, die von der einfallenden Welle induziert werden, können wir dann W(t) durch WDE (t) ersetzen. Wenn hingegen das Matrixelement von WDE (t) zwischen |φ i ⟩ und |φ f ⟩ verschwindet, müssen wir die Entwicklung von W(t) weiterführen, und bei dem entsprechenden Übergang handelt es sich dann um einen magnetischen Dipol übergang, einen elektrischen Quadrupolübergang usw.⁴ (s. die folgenden Abschnitte). Da WDE (t) sehr viel größer ist als die folgenden Terme der Potenzreihenentwicklung von W(t) in a0 /λ, sind die elektrischen Dipolübergänge mit Abstand die intensivsten; tatsächlich handelt es sich bei den meisten von Atomen emittierten optischen Linien um elektrische Dipolübergänge. Die zu |φ i ⟩ und |φ f ⟩ gehörenden Wellenfunktionen seien m
φ n i ,l i ,m i (r) = R n i ,l i (r)Y l i i (θ, φ) m
φ n f ,l f ,m f (r) = R n f ,l f (r)Y l f f (θ, φ)
(38)
Da z = r cos θ = √
4π r Y10 (θ) 3
(39)
gilt, ist das Matrixelement von Z zwischen |φ i ⟩ und |φ f ⟩ proportional zum Winkelin tegral m ∗
m
∫dΩ Y l f f (θ, φ) Y 10 (θ) Y l i i (θ, φ)
(40)
Den Ergebnissen aus Ergänzung CX zufolge ist dieses Integral nur für lf = li ± 1
(41)
mf = mi
(42)
und
von null verschieden. Bei einer anderen Wahl der Polarisation des elektrischen Feldes (z. B. parallel zur x- oder y-Achse; s. obige Bemerkung) müsste gelten mf = mi ± 1
(43)
3 Tatsächlich reicht es aus, dass eine der drei Zahlen ⟨φ f |X|φ i ⟩, ⟨φ f |Y|φ i ⟩ oder ⟨φ f |Z|φ i ⟩ ungleich null ist (s. obige Bemerkung). 4 Es kann geschehen, dass alle Terme der Entwicklung verschwindende Matrixelemente haben. Der Übergang wird dann als in allen Ordnungen verboten bezeichnet (man kann zeigen, dass das immer auftritt, wenn sowohl |φ i ⟩ als auch |φ f ⟩ den Drehimpuls null haben).
Atom und elektromagnetische Strahlung
| 1339
•
Aus den Gleichungen (41), (42) und (43) erhalten wir die Auswahlregeln für elektrische Dipolübergänge: ∆l = l f − l i = ±1
(44a)
∆m = m f − m i = −1, 0, +1
(44b)
Bemerkungen: 1. Bei Z handelt es sich um einen ungeraden Operator. Er kann nur zwei Zustände unterschied licher Parität koppeln. Da die Paritäten von |φ i ⟩ und |φ f ⟩ die von l i und l f sind, muss ∆l = l f − l i ungerade sein in Übereinstimmung mit (44a). 2. In Gegenwart einer Spin-Bahn-Kopplung ξ(r)L ⋅ S zwischen L und S (s. Kapitel XII, § B-1-b-β) werden die stationären Zustände des Elektrons durch die Quantenzahlen l, s, J, m J bezeichnet (für J = L + S). Die Auswahlregeln für elektrische Dipolübergänge ergeben sich dann aus der Untersuchung der nichtverschwindenden Matrixelemente von R in der {|l, s, J, m J ⟩}-Basis. Mit Hilfe der Entwicklung dieser Basisvektoren in die Vektoren |l, m⟩|s, m S ⟩ (s. Ergänzung AX , § 2) erhalten wir ausgehend von den Regeln (44) die Auswahlregeln ∆J = 0, ±1
(45a)
∆l = ±1
(45b)
∆m J = 0, ±1
(45c)
Ein ∆J = 0-Übergang ist also nicht verboten (außer für J i = J f = 0; s. Fußnote 4 auf S. 1338). Das liegt daran, dass J nicht mit der Parität des Zustands zusammenhängt. Schließlich stellen wir fest, dass die Auswahlregeln (45) auf Mehrelektronenatome verallgemei nert werden können.
1-d Magnetische Dipol- und elektrische Quadrupol-Kopplung α Terme höherer Ordnung Der Operator in Gl. (14) kann in der Form W(t) = WI (t) + WII (t) = WDE (t) + [WI (t) − WDE (t)] + WII (t)
(46)
geschrieben werden. Bis jetzt haben wir nur WDE (t) untersucht. Wie wir gesehen ha ben, ist das Verhältnis von WI (t)−WDE (t) und WII (t) zu WDE (t) von der Größenordnung a0 /λ. Um WI (t) − WDE (t) zu berechnen, ersetzen wir in Gl. (19) e±ikY durch e±ikY − 1 ≈ ±ikY + ⋅ ⋅ ⋅ , was WI (t) − WDE (t) = −
q (ik𝒜0 e−iωt − ik𝒜0∗ eiωt ) P z Y + ⋅ ⋅ ⋅ m
(47)
q ℬ cos ωt P z Y + ⋅ ⋅ ⋅ m
(48)
ergibt oder mit Gl. (4b) WI (t) − WDE (t) = −
•
1340 | Ergänzung AXIII
Wenn wir P z Y in der Form Pz Y =
1 1 1 1 (P z Y −ZP y ) + (P z Y +ZP y ) = L x + (P z Y +ZP y ) 2 2 2 2
(49)
schreiben, erhalten wir schließlich WI (t) − WDE (t) = −
q q L x ℬ cos ωt − ℬ cos ωt (P z Y +ZP y ) + ⋅ ⋅ ⋅ 2m 2m
(50)
Im Ausdruck für WII (t) [Gl. (16) und Gl. (3)] ist es gerechtfertigt, e±ikY durch eins zu ersetzen. So erhalten wir einen Term der Ordnung a0 /λ relativ zu WI (t), d. h. von derselben Größenordnung wie WI (t) − WDE (t): WII (t) = −
q S x ℬ cos ωt + ⋅ ⋅ ⋅ m
(51)
Setzen wir die Gleichungen (50) und (51) in Gl. (46) ein und gruppieren die Terme um, so erhalten wir W(t) = WDE (t) + WDM (t) + WQE (t) + ⋅ ⋅ ⋅
(52)
mit q (L x + 2S x ) ℬ cos ωt , 2m q (YP z + ZP y ) ℰ cos ωt WQE (t) = − 2mc
WDM (t) = −
(53) (54)
[in Gl. (54) haben wir ℬ durch ℰ/c ersetzt]. Bei WDM und WQE (die a priori dieselbe Größenordnung haben) handelt es sich um die Hamilton-Operatoren für die magneti sche Dipol- bzw. die elektrische Quadrupol-Kopplung. β Magnetische Dipolübergänge Die von WDM induzierten Übergänge heißen magnetische Dipolübergänge; WDM be schreibt die Wechselwirkung des magnetischen Gesamtmoments des Elektrons mit dem oszillierenden Magnetfeld der einfallenden Welle. Die Auswahlregeln der magnetischen Dipolübergänge ergeben sich aus den Be dingungen, die |φ i ⟩ und |φ f ⟩ erfüllen müssen, damit WDM ein nichtverschwindendes Matrixelement zwischen diesen beiden Zuständen hat. Da weder L x noch S x die Quan tenzahl l beeinflussen, muss zunächst ∆l = 0 gelten; L x ändert den Eigenwert m L von L z um ±1, woraus ∆m L = ±1 folgt. Analog ändert S x den Eigenwert m S von S z um ±1, was ∆m S = ±1 ergibt. Außerdem haben wir zu beachten, dass wir für ein Magnetfeld der einlaufenden Welle parallel zur z-Achse ∆m L = 0 und ∆m S = 0 erhalten hätten. Zusammenfassend erhalten wir die Auswahlregeln für magnetische Dipolübergänge: ∆l = 0 ∆m L = ±1, 0 ∆m S = ±1, 0
(55)
Atom und elektromagnetische Strahlung
| 1341
•
Bemerkung: In Anwesenheit einer Spin-Bahn-Kopplung werden die Eigenzustände von H 0 durch die Quan tenzahlen l und J bestimmt. Da L x und S x nicht mit J2 vertauschen, kann WDM Zustände mit glei chem l aber unterschiedlichem J koppeln. Unter Verwendung der Additionstheoreme für einen Drehimpuls l und einen Drehimpuls 1/2 kann leicht gezeigt werden (s. Ergänzung AX , § 2), dass die Auswahlregeln (55) dann lauten ∆l = 0 ∆J = ±1, 0
(56)
∆m J = ±1, 0 Der Hyperfeinübergang F = 0 ↔ F = 1 des Grundzustands des Wasserstoffatoms (s. Kapitel XII, § D) ist ein magnetischer Dipolübergang, da die Komponenten von S nichtverschwindende Matrixelemente zwischen den Zuständen des F = 1-Niveaus und dem Zustand |F = 0, m F = 0⟩ besitzen.
γ Elektrische Quadrupolübergänge Mit Gl. (34) können wir schreiben YP z + ZP y = YP z + P y Z = =
m (Y [Z, H0 ] + [Y, H0 ] Z) iℏ
m (YZH0 − H0 YZ) iℏ
(57)
woraus wir wie in Gl. (36) erhalten ⟨φ f | WQE (t) | φ i ⟩ =
q ω fi ⟨φ f | YZ | φ i ⟩ ℰ cos ωt 2ic
(58)
Das Matrixelement von WQE (t) ist somit proportional zu dem von YZ, einer Kompo nente des elektrischen Quadrupolmoments des Atoms (s. Ergänzung EX ). Außerdem tritt in Gl. (58) die Größe ω fi ω ω fi qω fi ℰ=q ℰ=q kℰ c ω c ω
(59)
auf, die nach Gl. (2) von der Größenordnung q∂ℰz /∂y ist. Der Operator WQE (t) kann also als die Wechselwirkung des elektrischen Quadrupolmoments des Atoms mit dem Gradienten⁵ des elektrischen Feldes der ebenen Welle interpretiert werden. Um die Auswahlregeln der elektrischen Quadrupolübergänge zu erhalten, ma chen wir Gebrauch davon, dass in der Ortsdarstellung YZ eine lineare Überlagerung von r2 Y21 (θ, φ) und r2 Y2−1 (θ, φ) ist. In den Matrixelementen ⟨φ f |YZ|φ i ⟩ treten daher Winkelintegrale m ∗
∫dΩ Y l f f (θ, φ) Y 2±1 (θ, φ) Y l i i (θ, φ) m
(60)
5 Das Auftreten des elektrischen Feldgradienten ist nicht überraschend, da wir WQE (t) über eine Tay lor-Entwicklung der Potentiale am Ursprung erhalten haben.
•
1342 | Ergänzung AXIII
auf, die nach den Ergebnissen von Ergänzung CX nur für ∆l = 0, ±2 und ∆m = ±1 von null verschieden sind. Bei einer beliebigen Polarisation der einlaufenden Welle geht diese Beziehung in ∆m = ±2, ±1, 0 über, und die Auswahlregeln für elektrische Quadrupolübergänge lauten schließlich ∆l = 0, ±2 ∆m = 0, ±1, ±2
(61)
Bemerkungen: 1. Bei WDM und WQE handelt es sich um gerade Operatoren, die also in Übereinstimmung mit den Gleichungen (55) und (61) nur Zustände gleicher Parität koppeln können. Für einen gege benen Übergang können WDM und WQE nie in Konkurrenz mit WDE treten, wodurch die Beob achtung von magnetischen Dipol- und elektrischen Quadrupolübergängen vereinfacht wird. Die meisten Übergänge des Mikrowellen- oder Radiofrequenzbereichs, insbesondere magnetische Resonanzübergänge, sind magnetische Dipolübergänge (s. Ergänzung FIV ). 2. Für einen Übergang mit ∆l = 0, ∆m = 0, ±1 haben die beiden Operatoren WDM und WQE gleichzeitig nichtverschwindende Matrixelemente. Es ist allerdings möglich, experimentelle Be dingungen zu schaffen, so dass nur magnetische Dipolübergänge induziert werden. Anstatt es einer ebenen Welle auszusetzen, muss man dazu das Atom in einem Hohlraum oder in einer Ra diofrequenzschleife an einem Punkt platzieren, wo B groß, aber der Gradient von E vernachläs sigbar ist. 3. Bei einem ∆l = 2-Übergang können WDM und WQE nicht in Konkurrenz treten, und es handelt sich um einen reinen Quadrupolübergang. Ein Beispiel für einen Quadrupolübergang ist die grü ne Linie des atomaren Sauerstoffs (5 577 Å), die im Polarlichtspektrum auftritt. 4. Hätten wir die Entwicklung von e±ikY fortgeführt, würden sich elektrische Oktupolterme, ma gnetische Quadrupolterme usw. ergeben.
In dieser Ergänzung beschränken wir uns auf elektrische Dipolübergänge, während wir in der folgenden Ergänzung einen magnetischen Dipolübergang betrachten wer den.
2 Anregung außerhalb der Resonanz In diesem Abschnitt nehmen wir an, dass das Atom sich zu Anfang im Grundzustand |φ0 ⟩ befindet und durch eine ebene Welle angeregt wird, deren Frequenz ω sich von den möglichen Bohr-Frequenzen unterscheidet. In dem Atom wird dann ein elektrisches Dipolmoment ⟨D⟩(t) induziert, das mit der Frequenz ω oszilliert (also eine erzwungene Schwingung ausführt) und für klei ne ℰ proportional zu ℰ ist (lineare Antwort). Wir bestimmen dieses induzierte Dipol moment mit Hilfe der Störungstheorie und werden sehen, dass die Ergebnisse weit gehend mit den Aussagen übereinstimmen, die wir aus dem klassischen Modell eines elastisch gebundenen Elektrons erhalten. Dieses Modell hat bei der Untersuchung der optischen Eigenschaften materiel ler Stoffe eine wichtige Rolle gespielt. Mit seiner Hilfe lässt sich die von einer ebenen
Atom und elektromagnetische Strahlung
|
1343
•
Welle in einem Medium induzierte Polarisation berechnen. Diese linear vom Feld ℰ abhängende Polarisation verhält sich wie ein Quellterm in den Maxwell-Gleichungen. Löst man diese Gleichungen, so ergeben sich ebene Wellen, die sich mit einer von der Vakuumlichtgeschwindigkeit c verschiedenen Geschwindigkeit im Medium fortpflan zen. Damit lässt sich die Brechzahl des Mediums in Abhängigkeit von den verschie denen Eigenschaften elastisch gebundener Elektronen (wie den Eigenfrequenzen, der Anzahldichte der Elektronen usw.) angeben. Darum ist es von großer Bedeutung, die Vorhersagen dieses Modells mit den quantenmechanischen Vorhersagen zu verglei chen.
2-a Klassisches Modell eines elastisch gebundenen Elektrons α Bewegungsgleichung Wir betrachten ein Elektron unter dem Einfluss einer Rückstellkraft, die zum Koor dinaten-Ursprung gerichtet und proportional zur Auslenkung ist. In der klassischen Hamilton-Funktion, die Gl. (12) entspricht, ist das Potential dann V(r) =
1 mω20 r2 2
(62)
wobei ω0 die Eigenfrequenz des Elektrons ist. Verwenden wir nun für den klassischen Wechselwirkungsterm dieselben Nä herungen, die wir bei der Ableitung des quantenmechanischen Ausdrucks (22) für WDE (t) verwendet haben (also die elektrische Dipolnäherung), so erhalten wir analog zu den obigen Überlegungen die Differentialgleichung [s. Gl. (25)] qℰ d2 z + ω20 z = cos ωt 2 m dt
(63)
Das ist die Bewegungsgleichung für einen harmonischen Oszillator unter dem Einfluss einer sinusförmigen Kraft. β Allgemeine Lösung Die allgemeine Lösung von Gl. (63) lautet z = A cos(ω0 t − φ) +
qℰ cos ωt m(ω20 − ω2 )
(64)
wobei A und φ von den Anfangsbedingungen abhängende reelle Konstanten sind. Der erste Term in dieser Gleichung, A cos(ω0 t − φ), ist die allgemeine Lösung der homo genen Gleichung (freie Bewegung des Elektrons) und der zweite Term eine spezielle Lösung der Gleichung (erzwungene Bewegung des Elektrons). Bisher haben wir noch keine Dämpfungseffekte berücksichtigt. Ohne ins Detail zu gehen, geben wir die Effekte einer schwachen Dämpfung an: nach einer gewissen
•
1344 | Ergänzung AXIII
Zeit τ klingt die freie Bewegung ab, und die erzwungene Schwingung wird etwas mo difiziert (unter der Voraussetzung, dass |ω − ω0 | ≫ 1/τ ist, man also weit genug von der Resonanzstelle entfernt ist). Wir behalten daher nur den zweiten Term z=
qℰ cos ωt m(ω20 − ω2 )
(65)
Bemerkung: Weit außerhalb der Resonanz spielt der genaue Vorgang der Dämpfung, solange sie schwach ist, keine große Rolle; wir verzichten daher auf seine Beschreibung. Es genügt uns die Tatsache, dass durch ihn die freie Schwingung des Elektrons eliminiert wird. Bei Resonanzanregung ist die Situation anders: Das induzierte Dipolmoment hängt dann ent scheidend vom exakten Mechanismus der Dämpfung ab (spontane Emission, thermische Rela xation usw.). Aus diesem Grund werden wir uns erst in § 3 mit der Berechnung der Übergangs amplituden befassen. In Ergänzung BXIII werden wir ein genaues Modell für ein System untersuchen, das von einer elek tromagnetischen Welle beleuchtet und gleichzeitig dissipativen Prozessen ausgesetzt ist. Wir können dann das induzierte elektrische Dipolmoment für eine beliebige Anregungsfrequenz be rechnen.
γ Suszeptibilität Das elektrische Dipolmoment des Systems sei 𝒟 = qz. Es ist dann mit Gl. (65) 𝒟 = qz =
q2 ℰ cos ωt = χℰ cos ωt m(ω20 − ω2 )
(66)
wobei die Suszeptibilität χ gegeben wird durch χ=
q2 − ω2 )
(67)
m(ω20
2-b Quantenmechanische Berechnung des induzierten Dipolmoments Wir beginnen mit der Berechnung des Zustandsvektors |ψ(t)⟩ für das Atom zur Zeit t in erster Ordnung in ℰ. Als Wechselwirkungsoperator verwenden wir den elektrischen Dipoloperator WDE , Gl. (22). Außerdem nehmen wir |ψ(t = 0)⟩ = |φ0 ⟩
(68)
an. Unter Verwendung der Ergebnisse aus Kapitel XIII, § C-1 ersetzen wir W ni durch qℰ mω ⟨φ n |P z |φ i ⟩ und |φ i ⟩ durch |φ 0 ⟩; wir erhalten⁶ (1)
|ψ(t)⟩ = e−iE0 t/ℏ |φ0 ⟩ + ∑ λ b n (t) e−iE n t/ℏ |φ n ⟩
(69)
n=0 ̸
(1)
6 Da WDE ungerade ist, ist ⟨φ 0 |WDE (t)|φ 0 ⟩ gleich null und damit b 0 (t) = 0.
Atom und elektromagnetische Strahlung
| 1345
•
oder, indem wir |ψ(t)⟩ mit dem globalen Phasenfaktor eiE0 t/ℏ multiplizieren (der phy sikalisch keine Bedeutung hat), qℰ ⟨φ n | P z | φ0 ⟩ 2imℏω n=0 ̸
|ψ(t)⟩ = |φ0 ⟩ + ∑
×{
e−iω n0 t − eiωt e−iω n0 t − e−iωt − } |φ n ⟩ ω n0 + ω ω n0 − ω
(70)
Damit berechnen wir ⟨ψ(t)| und ⟨D z ⟩(t) = ⟨ψ(t)|qZ|ψ(t)⟩. Wir berücksichtigen nur die in ℰ linearen Glieder und unterdrücken alle Terme, die mit der Frequenz ±ω n0 oszillieren (weil sie zur freien Bewegung gehören). Wenn wir weiter ⟨φ n |P z |φ0 ⟩ durch ⟨φ n |Z|φ0 ⟩ ausdrücken [s. Gl. (36)], erhalten wir schließlich ⟨D z ⟩(t) =
ω n0 |⟨φ n | Z | φ0 ⟩|2 2q2 ℰ cos ωt ∑ ℏ ω2n0 − ω2 n
(71)
2-c Diskussion. Oszillatorstärke α Der Begriff der Oszillatorstärke Wir setzen f n0 =
2m ω n0 |⟨φ n | Z | φ0 ⟩|2 ℏ
(72)
f n0 ist eine reelle Zahl mit der Dimension eins, die den Übergang |φ0 ⟩ ↔ |φ n ⟩ charak terisiert und als Oszillatorstärke⁷ dieses Übergangs bezeichnet wird. Wenn es sich bei |φ0 ⟩ um den Grundzustand handelt, ist f n0 wie ω n0 positiv. Oszillatorstärken erfüllen die Summenregel (von Thomas-Reiche-Kuhn) ∑ f n0 = 1
(73)
n
Sie lässt sich wie folgt beweisen: Mit Gl. (36) können wir schreiben f n0 =
1 1 ⟨φ0 | Z | φ n ⟩⟨φ n | P z | φ0 ⟩ − ⟨φ0 | P z | φ n ⟩⟨φ n | Z | φ0 ⟩ iℏ iℏ
(74)
Die Summation über n lässt sich mit Hilfe der Vollständigkeitsrelation der {|φ n ⟩}-Basis ausführen, und es ergibt sich ∑ f n0 = n
1 ⟨φ0 | (ZP z − P z Z) | φ0 ⟩ = ⟨φ0 |φ0 ⟩ = 1 iℏ
(75)
7 In Gl. (72) geht der Operator Z ein, weil die einfallende Welle in z-Richtung linear polarisiert ist. Es wäre auch möglich, eine allgemeine Definition der Oszillatorstärke, unabhängig von der Polarisation der einlaufenden Welle, anzugeben.
•
1346 | Ergänzung AXIII
β Quantenmechanische Rechtfertigung des klassischen Modells Wir setzen die Definition (72) in Gl. (71) ein und multiplizieren den so erhaltenen Aus druck mit der Anzahl N der Atome, die sich in einem Volumen mit einer linearen Aus dehnung sehr viel kleiner als die Wellenlänge λ der Strahlung befinden. Das gesamte in diesem Volumen induzierte elektrische Dipolmoment lautet dann N ⟨D z ⟩(t) = ∑ N f n0 n
q2 ℰ cos ωt − ω2 )
m(ω2n0
(76)
Wenn wir das Ergebnis (76) mit Gl. (66) vergleichen, sieht es so aus, als ob wir es mit N klassischen Oszillatoren zu tun hätten [da nach Gl. (73) ∑n Nf n0 = N ist]. Ihre Eigenfre quenzen stimmen mit den Bohr-Frequenzen für den Übergang aus dem Zustand |φ0 ⟩ überein und sind darum im Allgemeinen voneinander verschieden. Nach Gl. (76) ist die relative Anzahl von Oszillatoren mit der Frequenz ω n0 gleich f n0 . Für eine Welle außerhalb der Resonanz haben wir somit das klassische Modell eines elastisch gebundenen Elektrons bestätigt. Die Quantenmechanik liefert die Ei genfrequenzen und den jeweiligen Anteil der Oszillatoren. Dies unterstreicht die Be deutung des Begriffs der Oszillatorstärke und macht im Nachhinein den Erfolg des klassischen Modells verständlich.
3 Resonanzanregung. Absorption und induzierte Emission 3-a Übergangswahrscheinlichkeit in einer monochromatischen Welle Wir betrachten ein Atom, das im Anfangszustand |φ i ⟩ von einer elektromagnetischen Welle mit einer Frequenz nahe der Bohr-Frequenz ω fi bestrahlt wird. Die Ergebnisse aus Kapitel XIII, § C-1 (für eine sinusförmige Anregung) sind auf die Berechnung der Übergangswahrscheinlichkeit 𝒫if (t; ω) direkt anwendbar. Mit Gl. (37) (d. h. in der elektrischen Dipolnäherung) ergibt sich 𝒫if (t; ω) =
q2 ω fi 2 ( ) |⟨φ f | Z | φ i ⟩|2 ℰ 2 F(t, ω − ω fi ) 4ℏ2 ω
(77)
mit F(t, ω − ω fi ) = {
sin [(ω fi − ω)t/2] } (ω fi − ω)/2
2
(78)
Den Resonanzcharakter von 𝒫if (t; ω) haben wir bereits weiter oben besprochen. Im Resonanzfall ist 𝒫if (t; ω) proportional zu ℰ 2 , d. h. zur einfallenden Intensität (Energiefluss) der elektromagnetischen Welle [s. Gl. (9)].
Atom und elektromagnetische Strahlung
| 1347
•
Bemerkungen: 1. Hätten wir statt der Eichung (27), die uns auf das Matrixelement (37) führte, die Eichung (29) verwendet, die den Hamilton-Operator in der Form (32) ergibt, würde der Faktor (ω fi /ω)2 in Gl. (77) fehlen. Das ist nicht überraschend: Die Zustände |φ f ⟩ und |φ i ⟩ und damit auch 𝒫if (t; ω) haben in beiden Eichungen unterschiedliche physikalische Bedeutungen. 2. Allerdings geht für t → ∞ die Beugungsfunktion F(t, ω − ω fi ) gegen δ(ω − ω fi ), so dass der Faktor (ω fi /ω)2 gegen eins strebt. Das führt für beide Eichungen auf dieselbe Wahrscheinlich keitsdichte 𝒫if (t; ω). Dieses Ergebnis lässt sich leicht verstehen, wenn wir als einfallende Welle ein fast monochromatisches Wellenpaket mit sehr großer, aber endlicher Ausdehnung anstelle einer ins Unendliche ausgedehnten ebenen Welle betrachten. Für t → ±∞ ist das vom Atom „gesehene“ Feld E dann gleich null, und die zur Funktion χ [Gl. (28)] gehörende Eichtransforma tion strebt gegen die identische Abbildung. Folglich stellen |φ i ⟩ und |φ f ⟩ in beiden Eichungen dieselben physikalischen Zustände dar. 3. Offensichtlich ist es auch möglich, die Übergangswahrscheinlichkeit zwischen zwei Zustän den des atomaren Systems mit wohldefinierter Energie in einem endlichen Zeitintervall zu be trachten. Für diesen Fall stellen die beiden Eigenzustände |φ i ⟩ und |φ f ⟩ des atomaren HamiltonOperators H 0 , Gl. (12), nur in der Eichung (29), in der A gleich null [s. Gl. (30)] und p2 /2m die kinetische Energie ist, Zustände mit wohldefinierter (kinetischer plus potentieller) Energie dar. In der Eichung (27) würden dieselben physikalischen Zustände durch exp(−iqχ(r, t)/ℏ)|φ i ⟩ bzw. exp(−iqχ(r, t)/ℏ)|φ f ⟩ gegeben. Für endliche t ist die Berechnung in der Eichung (29) leichter. Da wir im Weiteren F(t, ω − ω fi ) durch δ(ω − ω fi ) ersetzen werden [s. Gl. (80)], befinden wir uns im Grenzfall t → ∞, für den die eben angesprochenen Probleme verschwinden.
3-b Anregung durch eine breite Linie In der Praxis ist die Strahlung, die auf das Atom trifft, oft nicht monochromatisch. Mit ℐ(ω) dω wollen wir die spektrale Verteilung der einfallenden Intensität im Intervall [ω, ω + dω] bezeichnen. Der Verlauf von ℐ(ω) in Abhängigkeit von ω ist in Abb. 2 dargestellt; ∆ ist die Breite der anregenden Linie. Wenn ∆ unendlich ist, sprechen wir von einem „weißen Spektrum“.
Abb. 2: Spektrale Verteilung der Intensität der einfallenden elektromagnetischen Strahlung; ∆ ist die Breite dieser Spektralverteilung.
•
1348 | Ergänzung AXIII
Die verschiedenen monochromatischen Wellen, aus denen sich die einfallende Strahlung zusammensetzt, sind im Allgemeinen inkohärent: zwischen ihren Phasen besteht kein wohldefinierter Zusammenhang. Die Gesamtübergangswahrscheinlich keit 𝒫 if ergibt sich daher als Summation der Übergangswahrscheinlichkeiten der einzelnen monochromatischen Wellen. Wir haben demnach in Gl. (77) ℰ 2 durch 2ℐ(ω) d ω/ε0 c zu ersetzen und über ω zu integrieren. Das ergibt 𝒫 if (t) =
ω fi 2 q2 2 ( ) ℐ(ω) F(t, ω − ω fi ) |⟨φ | Z | φ ⟩| ∫dω f i ω 2ε0 cℏ2
(79)
Wir können dann wie in Kapitel XIII, § C-3 vorgehen, um das in Gl. (79) auftretende Integral zu berechnen. Verglichen mit einer Funktion von ω, deren Breite viel größer als 4π/t ist, verhält sich die Funktion F(t, ω − ω fi ) (s. Abb. 3) wie δ(ω − ω fi ). Für Werte von t, die groß genug sind, damit 4π/t ≪ ∆ gilt (∆: Breite des anregenden Spektrums), aber klein genug bleiben, damit die störungstheoretische Behandlung ihre Gültigkeit behält, können wir in Gl. (79) annähernd F(t, ω − ω fi ) ≈ 2πt δ(ω − ω fi )
(80)
setzen, womit wir erhalten 𝒫 if (t) =
πq2 |⟨φ f | Z | φ i ⟩|2 ℐ(ω fi ) t ε0 cℏ2
(81)
Man kann Gl. (81) in der Form 𝒫 if (t) = C if ℐ(ω fi ) t
(82)
mit C if =
4π2 |⟨φ f | Z | φ i ⟩|2 α ℏ
(83)
schreiben, wobei α die Feinstrukturkonstante ist: α=
e2 1 q2 1 = ≈ 4πε0 ℏc ℏc 137
(84)
Wir sehen also, dass 𝒫 if (t) mit der Zeit linear wächst. Die Übergangsrate 𝒲if (eine Wahrscheinlichkeit pro Zeit) ist somit 𝒲if = C if ℐ(ω fi )
(85)
𝒲if ist proportional zum Wert der Einfallsintensität bei der Resonanzfrequenz ω fi , zur Feinstrukturkonstanten α und zum Betragsquadrat des Matrixelements von Z, das [über Gl. (72)] mit der Oszillatorstärke des |φ f ⟩ ↔ |φ i ⟩-Übergangs zusammenhängt. In dieser Ergänzung haben wir Strahlung betrachtet, die sich entlang einer gege benen Ausbreitungsrichtung in einem wohldefinierten Polarisationszustand bewegt.
Atom und elektromagnetische Strahlung
| 1349
•
Durch Mittelung der Koeffizienten C if über alle Ausbreitungsrichtungen und alle mög lichen Polarisationszustände könnten wir analog zu den C if Koeffizienten B if einfüh ren, die die Übergangsraten für ein Atom bei isotroper Strahlung definieren. Bei diesen Koeffizienten B if (und B fi ) handelt es sich um diejenigen, die Einstein zur Beschrei bung von Absorption (und induzierter Emission) eingeführt hatte. Wir haben also ge sehen, wie die Quantenmechanik die Berechnung dieser Koeffizienten ermöglicht. Bemerkung: Einstein hatte einen dritten Koeffizienten A fi eingeführt, um die spontane Emission eines Pho tons zu beschreiben. Sie tritt auf, wenn ein Atom aus dem energetisch höheren Zustand |φ f ⟩ in den niedrigeren Zustand |φ i ⟩ zurückfällt. Mit Hilfe der in dieser Ergänzung behandelten Theorie kann spontane Emission nicht erklärt werden. Ohne einfallende Strahlung ist der Wechselwir kungs-Hamilton-Operator gleich null, und bei den Eigenzuständen von H 0 (der dann der gesamte Hamilton-Operator ist) handelt es sich um stationäre Zustände. Das vorstehende Modell ist unzureichend, weil die atomaren Elektronen (die quantisiert sind) und das elektromagnetische Feld (das klassisch betrachtet wird) auf unsymmetrische Weise be handelt werden. Wenn beide Systeme quantisiert werden, ergibt sich, dass selbst in Abwesen heit einfallender Photonen die Kopplung zwischen dem Atom und dem elektromagnetischen Feld beobachtbare Effekte verursacht (eine einfache Interpretation dieser Effekte ist in Ergänzung KV wiedergegeben). Die Eigenzustände von H 0 sind keine stationären Zustände mehr, da H 0 nicht länger der Hamilton-Operator des Gesamtsystems ist, und es lässt sich tatsächlich die Wahr scheinlichkeit pro Zeit für die spontane Emission eines Photons berechnen. Die Quantenmecha nik ermöglicht also auch die Berechnung des Einstein-Koeffizienten A fi .
Referenzen und Literaturhinweise Siehe z. B. Schiff (1.18), Kap. 11; Bethe und Jackiw (1.21), Teil II, Kap. 10 und 11; Bohm (5.1), Kap. 18, § 12 bis § 44. Modell des elastisch gebundenen Elektrons: Berkeley 3 (7.1), Zusatzthema 9; Feynman, Bd. 2 (6.3), Kap. 6 und Feynman, Bd. 4 (7.2), Kap. 3. Einstein-Koeffizienten: Originalartikel (1.31), Cagnac und Pebay-Peyroula (11.2), Kap. III und Kap. XIX, § 4. Genaue Definition der Oszillatorstärke: Sobel’man (11.12), Kap. 9, § 31. Multipolare Strahlung von Atomen und Auswahlregeln: Sobel’man (11.12), Kap. 9, § 32.
•
1350 | Ergänzung BXIII
Ergänzung BXIII Zweiniveausystem und sinusförmige Störung 1 1-a 1-b 1-c 2 2-a 2-b 2-c 3 3-a 3-b 3-c 3-d 4
Beschreibung des Modells | 1351 Bloch-Gleichungen | 1351 Lösbare und näherungsweise lösbare Fälle | 1352 Antwort des atomaren Systems | 1352 Näherungslösung der Bloch-Gleichungen | 1354 Störungsgleichungen | 1354 Fourier-Entwicklung der Lösung | 1355 Allgemeine Struktur der Lösung | 1356 Physikalische Diskussion | 1357 Lösung nullter Ordnung: Pumpen und Relaxation | 1357 Lösung erster Ordnung: Lineare Antwort | 1358 Lösung zweiter Ordnung: Absorption und induzierte Emission | 1360 Lösung dritter Ordnung: Sättigungseffekte und Mehrquantenübergänge | 1362 Aufgaben | 1366
In der vorherigen Ergänzung haben wir die zeitabhängige Störungstheorie erster Ord nung angewendet, um einige Effekte der Wechselwirkung eines atomaren Systems mit einer elektromagnetischen Welle zu beschreiben: das Auftreten eines induzierten Di polmoments, die Vorgänge der Absorption und der induzierten Emission usw. Wir wollen nun ein einfaches Beispiel betrachten, für das es möglich ist, die stö rungstheoretische Behandlung ohne zu große Schwierigkeiten zu höheren Ordnun gen fortzuführen. Damit werden wir einige interessante nichtlineare Effekte aufzeigen können wie Sättigungseffekte, die nichtlineare Suszeptibilität, die Absorption und die induzierte Emission mehrerer Photonen usw. Außerdem erlaubt das hier vorgestellte Modell die (phänomenologische) Beschreibung der dissipativen Kopplung des ato maren Systems an seine Umgebung (Relaxationsprozess). Wir werden damit die im Rahmen der linearen Antwort erhaltenen Ergebnisse vervollständigen können und als Beispiel das induzierte Dipolmoment des Atoms auch für den Resonanzfall berech nen. Einige Effekte, die wir hier beschreiben werden, sind in der aktuellen Forschung von großem Interesse. Ihre experimentelle Untersuchung erfordert sehr starke elek tromagnetische Felder, die erst seit der Entwicklung der Laser zur Verfügung stehen. Ganz neue Forschungsgebiete wie die Quantenelektronik oder die nichtlineare Optik sind dabei entstanden. Die in diesem Abschnitt (für ein sehr einfaches Modell) vorge stellten Rechenmethoden sind auf diese Probleme anwendbar.
https://doi.org/10.1515/9783110638769-033
Zweiniveausystem und sinusförmige Störung
| 1351
•
1 Beschreibung des Modells 1-a Bloch-Gleichungen In § 4-a der Ergänzung FIV beschrieben wir ein Ensemble aus Spin-1/2-Systemen, das sich in einem statischen Magnetfeld B0 parallel zur z-Achse befindet, mit einem oszil lierenden Radiofrequenzfeld in Wechselwirkung steht und Pump- und Relaxations prozessen unterworfen ist. Wenn 𝓜(t) die Gesamtmagnetisierung des in der Zelle enthaltenen Spinsystems (s. Abb. 6 in Ergänzung FIV ) bezeichnet, so gilt (wie wir in Ergänzung FIV zeigten) d 1 𝓜(t) = nμ 0 − 𝓜(t) + γ𝓜(t) × B(t) dt TR
(1)
Der erste Term auf der rechten Seite beschreibt die Präparation oder das Pumpen des Systems: n Spins treten pro Zeiteinheit neu in die Zelle ein, jeder mit einer elementaren Magnetisierung μ 0 parallel zur z-Achse. Der zweite Term stammt von Relaxationspro zessen, die durch die mittlere Zeit TR charakterisiert werden; TR ist (im Mittel) die Zeit, nach der ein Spin entweder die Zelle verlassen oder durch Stoß mit den Wänden der Zelle seine Richtung geändert hat. Der letzte Term von Gl. (1) schließlich beschreibt die Präzession der Spins um das magnetische Gesamtfeld B(t) = B0 ez + B1 (t)
(2)
B(t) ist die Summe des statischen Feldes B0 ez parallel zur z-Achse und des Radiofre quenzfeldes B1 (t) mit der Frequenz ω. Bemerkungen: 1. Bei den Übergängen (zwischen den beiden Zuständen |+⟩ und |−⟩ eines Spins 1/2), die wir in dieser Ergänzung betrachten, handelt es sich um magnetische Dipolübergänge. 2. Es stellt sich die Frage, warum wir Gl. (1) zur Beschreibung der Erwartungswerte und nicht die Schrödinger-Gleichung verwenden. Der Grund liegt darin, dass wir es mit einem statistischen En semble von Spins zu tun haben, die (über Stöße mit der Zellwand) an ein thermisches Reservoir gekoppelt sind. Dieses Ensemble kann nicht mit Hilfe eines Zustandsvektors beschrieben wer den: Wir müssen einen Dichteoperator verwenden (s. Ergänzung EIII ). Die Bewegungsgleichung dieses Operators ist als „Grundgleichung“ zu bezeichnen, und wir können zeigen, dass sie in Strenge äquivalent zu Gl. (1) ist (s. § 3 und § 4 der Ergänzung FIV sowie Ergänzung EIV , wo wir zei gen, dass der Erwartungswert der Magnetisierung die Dichtematrix eines Ensembles von Spins 1/2 vollständig bestimmt). Die Grundgleichung für den Dichteoperator und die in § C-1 von Kapitel XIII untersuchte Schrö dinger-Gleichung weisen dieselbe Struktur wie Gl. (1) auf: Es handelt sich um lineare Differen tialgleichungen mit konstanten oder sich sinusförmig ändernden Koeffizienten. Die Näherungs methoden, die wir in diesem Kapitel beschreiben, sind somit auf diese Gleichungen anwendbar.
•
1352 | Ergänzung BXIII
1-b Lösbare und näherungsweise lösbare Fälle Wenn es sich bei dem Radiofrequenzfeld B1 um ein rotierendes Feld handelt, d. h. wenn gilt B1 (t) = B1 (ex cos ωt + ey sin ωt)
(3)
kann Gl. (1) exakt gelöst werden (wenn wir uns in das System begeben, das mit B1 ro tiert, transformiert sich Gl. (1) in ein zeitunabhängiges lineares Differentialgleichungs system). Die exakte Lösung von Gl. (1) für diesen Fall ist in § 4-b von Ergänzung FIV angegeben. Hier nehmen wir B1 in x-Richtung linear polarisiert an: B1 (t) = B1 ex cos ωt
(4)
Für diesen Fall ist es nicht möglich, eine strenge analytische Lösung von Gl. (1) anzu geben (es gibt keine Transformation, die dem Wechsel in das rotierende System ent spricht).¹ Wir werden jedoch sehen, dass sich eine Lösung in Form einer Potenzrei henentwicklung in B1 angeben lässt. Bemerkung: Die Rechnungen, die wir hier für Spins 1/2 durchführen, können auch auf andere Fälle angewandt werden, in denen wir uns auf die Betrachtung zweier Niveaus des Systems beschränken können. Wie wir wissen (s. Ergänzung CIV ), lässt sich einem beliebigen Zweiniveausystem ein fiktiver Spin 1/2 zuordnen. Bei dem hier betrachteten Problem handelt es sich also um das eines beliebigen Zweiniveausystems unter dem Einfluss einer sinusförmigen Störung.
1-c Antwort des atomaren Systems Die Terme, die über ℳx , ℳy , ℳz von B1 abhängen, stellen die Antwort des Atoms auf die elektromagnetische Störung dar. Sie beschreiben das vom Radiofrequenzfeld im Spinsystem induzierte magnetische Dipolmoment. Wir werden sehen, dass dieses Di polmoment nicht proportional zu B1 sein muss; bei den Termen in B1 handelt es sich um die lineare Antwort, während die anderen Terme (in B21 , B31 usw.) die nichtlineare Antwort beschreiben. Außerdem werden wir sehen, dass das induzierte Dipolmoment nicht nur mit der Frequenz ω oszilliert, sondern dass auch Oberschwingungen p ω (p = 0, 2, 3, 4, . . .) auftreten. 1 Ein linear polarisiertes Feld ergibt sich als Überlagerung einer rechts- und einer linkszirkular po larisierten Komponente. Für jede Komponente ließe sich getrennt eine exakte Lösung finden. Glei chung (1) ist jedoch nichtlinear: Eine Lösung zu Gl. (4) lässt sich nicht durch Überlagerung von zwei strengen Lösungen erhalten, wobei eine dieser Lösungen Gl. (3) und die andere einem in entgegenge setzter Richtung rotierenden Feld entspricht [im Term γ 𝓜 × B, der auf der rechten Seite von Gl. (1) auftritt, hängt 𝓜 von B1 ab].
Zweiniveausystem und sinusförmige Störung
|
1353
•
Es ist leicht einzusehen, warum die Berechnung der Antwort eines atomaren Sys tems von Interesse ist. Sie spielt in der Theorie der Ausbreitung einer elektromagneti schen Welle in einem Medium oder der Theorie atomarer Oszillatoren, d. h. für Laser und Maser, eine entscheidende Rolle.
Abb. 1: Schematische Darstellung der Berechnung, die bei der Untersuchung der Ausbreitung ei ner elektromagnetischen Welle in einem Medium (oder der Wirkungsweise eines atomaren Oszil lators, eines Lasers oder Masers) durchgeführt werden muss. Man beginnt mit der Berechnung der durch ein gegebenes elektromagnetisches Feld im Medium induzierten Dipolmomente (die Antwort des atomaren Systems). Die zugehörige Polarisation stellt einen Quellenterm in den Maxwell-Glei chungen dar und trägt zur Erzeugung des elektromagnetischen Feldes bei. Das so erhaltene Feld betrachtet man dann als das ursprüngliche Feld.
Wir betrachten ein elektromagnetisches Feld. Aufgrund seiner Kopplung an die ato maren Systeme wird im Medium eine Polarisation erzeugt, die von den atomaren Di polmomenten herrührt (nach rechts zeigender Pfeil in Abb. 1). Diese Polarisation stellt einen Quellenterm für die Maxwell-Gleichungen dar und trägt somit zur Erzeugung des elektromagnetischen Feldes bei (nach links zeigender Pfeil in Abb. 1). Wenn dieser „Kreis geschlossen“ wird, d. h. wenn wir das so erzeugte Feld als ursprüngliches be trachten, erhalten wir die Gleichungen für die Wellenausbreitung im Medium (Brech zahl) oder die Oszillatorgleichungen (auch in Abwesenheit äußerer Felder kann im Medium ein elektromagnetisches Feld auftreten, wenn eine ausreichende Verstärkung vorliegt: Das System wird dann instabil und kann spontane Schwingungen ausfüh ren). In dieser Ergänzung werden wir uns nur mit dem ersten Schritt dieser Berech nung (der atomaren Antwort) befassen.
•
1354 | Ergänzung BXIII
2 Näherungslösung der Bloch-Gleichungen 2-a Störungsgleichungen Wie in Ergänzung FIV setzen wir ω0 = −γB0
(5)
ω1 = −γB1
(6)
ℏω0 ist die Energiedifferenz der Spinzustände |+⟩ und |−⟩ (Abb. 2). Setzen wir Gl. (4) in Gl. (2) und Gl. (2) in Gl. (1) ein, so erhalten wir nach einfacher Rechnung d ℳz ω1 +i ℳz = nμ 0 − cos ωt (ℳ− − ℳ+ ) dt TR 2
(7a)
ℳ± d ℳ± = − ± iω0 ℳ± ∓ iω1 cos ωt ℳz dt TR
(7b)
mit ℳ± = ℳx ± iℳy
(8)
Der Quellenterm nμ0 tritt nur in der Bewegungsgleichung für ℳz auf, weil μ 0 parallel zur z-Achse gerichtet ist. Dies wird als longitudinales Pumpen bezeichnet.² Weiterhin halten wir fest, dass die Relaxationszeit für die longitudinalen (ℳz ) und transversa len Komponenten (ℳ± ) der Magnetisierung verschieden sein können. Der Einfachheit halber gehen wir hier jedoch von einer einzigen Relaxationszeit aus. Die Bloch-Gleichungen (7) können nicht streng gelöst werden. Wir werden daher ihre Lösungen in Form einer Potenzreihenentwicklung in ω1 bestimmen, ℳz =
(0)
ℳz + ω1 (1)ℳz + ω21 (2)ℳz + . . . + ω1n (n)ℳz + . . .
(9a)
ℳ± =
(0)
(9b)
ℳ± + ω1 (1)ℳ± + ω21 (2)ℳ± + . . . + ω1n (n)ℳ± + . . .
Wenn wir die Beziehungen (9) in die Gleichungen (7) einsetzen und die Koeffizienten der Terme in ω1n gleichsetzen, erhalten wir die folgenden Störungsgleichungen: n = 0: d dt
(0)
d dt
(0)
ℳz = nμ0 −
ℳ± = −
1 TR
1 TR
(0)
(0)
ℳz
ℳ± ± iω0 (0)ℳ±
(10a) (10b)
2 In einigen Experimenten wird auch transversal gepumpt (μ 0 ist senkrecht zu B0 ), s. Aufgabe 1 am Ende dieser Ergänzung.
Zweiniveausystem und sinusförmige Störung
| 1355
•
n ≠ 0: d dt
(n)
1 TR
(n)
d dt
(n)
1 TR
(n)
ℳz = −
ℳ± = −
ℳz +
i cos ωt ((n−1)ℳ− − 2
(n−1)
ℳ+ )
ℳ± ± iω0 (n)ℳ± ∓ i cos ωt (n−1)ℳz
(11a) (11b)
Abb. 2: Energieniveaus eines Spins 1/2 in einem statischen Magnetfeld B0 ; ω 0 bezeichnet die Larmor-Frequenz im Feld B0 .
2-b Fourier-Entwicklung der Lösung Da die zeitabhängigen Terme auf den rechten Seiten von (10) und (11) sinusförmig verlaufen, sind auch die stabilen Lösungen der Gleichungen (10) und (11) mit 2π/ω periodisch. Sie können somit in Fourier-Reihen entwickelt werden: +∞
(n)
ℳz = ∑
(n) p ℳz
eipωt
(12a)
(n) p ℳ±
eipωt
(12b)
p=−∞ +∞
(n)
ℳ± = ∑
p=−∞ (n) p ℳz
(n)
und p ℳ± sind dabei die p ω-Fourier-Komponenten der Lösung n-ter Ordnung. Wenn wir (n)ℳz reell und (n)ℳ+ und (n)ℳ− als komplex konjugiert zueinander wählen, ergeben sich die Bedingungen (n)
∗
(n)
∗
(n) p ℳz
= (−p ℳz )
(n) p ℳ±
= (−p ℳ∓ )
(13a) (13b)
Setzen wir die Gleichungen (12) in die Beziehungen (10) und (11) ein und die Ko effizienten jeder Exponentialfunktion eipωt gleich null, so erhalten wir
•
1356 | Ergänzung BXIII
n = 0: (0) 0 ℳz
= nμ0 TR
(0) p ℳz
= 0 für p ≠ 0
(0) p ℳ±
= 0 für beliebige p
(14)
n ≠ 0: [ipω +
1 ] TR
(n) p ℳz
[i(pω ∓ ω0 ) +
=
1 ] TR
i (n−1) ℳ− + [ 4 p+1
(n) p ℳ±
(n−1) p−1 ℳ−
i (n−1) = ∓ [ p+1 ℳz + 2
−
(n−1) p+1 ℳ+
−
(n−1) p−1 ℳ+ ]
(n−1) p−1 ℳ z ]
(15a) (15b)
Diese algebraischen Gleichungen lassen sich sofort lösen. Es wird i (n−1) ℳ− + [ 4(ipω + 1/TR ) p+1
(n) p ℳz
=
(n) p ℳ±
=∓
(n−1) p−1 ℳ−
i (n−1) ℳz + [ 2 [i(pω ∓ ω0 ) + 1/TR ] p+1
−
(n−1) p+1 ℳ+
(n−1) p−1 ℳ z ]
−
(n−1) p−1 ℳ+ ]
(16a) (16b)
In diesen Beziehungen wird die Lösung n-ter Ordnung explizit durch die Lösung (n − 1)-ter Ordnung ausgedrückt. Da die Lösung nullter Ordnung bekannt ist [s. Glei chungen (14)], ist das Problem im Prinzip vollständig gelöst.
2-c Allgemeine Struktur der Lösung Die verschiedenen Terme in der Entwicklung lassen sich in einer Tabelle anordnen, wobei in den Spalten die Ordnung n der Störung und in den Zeilen der Grad p der (0) betrachteten Oberschwingung eingetragen wird. In nullter Ordnung ist nur 0 ℳz von null verschieden. Mit den Beziehungen (16) lassen sich iterativ die nichtverschwin denden Terme höherer Ordnung erhalten (Abb. 3), wobei sich eine „baumartige Struk tur“ ergibt. Die folgenden Eigenschaften folgen rekursiv aus den Gleichungen (16): 1. Für gerade Ordnungen der Störungstheorie wird nur die longitudinale Magneti sierung verändert, für ungerade Ordnungen nur die transversale. 2. Für gerade Ordnungen der Störungstheorie liefern nur die geraden Oberschwin gungen einen Beitrag, für ungerade Ordnungen nur die ungeraden. 3. Für einen gegebenen Wert von n gibt es nur die folgenden Werte von p: n, n − 2, . . . , −n + 2, −n. Bemerkung: Diese Struktur ergibt sich nur für eine bestimmte Polarisation des Radiofrequenzfeldes B1 (t) (senkrecht zu B0 ). Für andere Polarisationen lassen sich entsprechende Tabellen aufstellen.
Zweiniveausystem und sinusförmige Störung
•
| 1357
Abb. 3: Die pω-Fourier-Komponenten der Magnetisierung, die in n-ter Ordnung der Störung in ω 1 nicht verschwinden.
3 Physikalische Diskussion 3-a Lösung nullter Ordnung: Pumpen und Relaxation Gemäß der ersten Beziehung von (14) ist die einzige nichtverschwindende Komponen te nullter Ordnung (0) 0 ℳz
= nμ0 TR
(17)
In Abwesenheit des Radiofrequenzfeldes liegt also nur eine konstante longitudinale Magnetisierung vor (p = 0). Da ℳz proportional zur Differenz der Besetzungszahlen der in Abb. 2 dargestellten Zustände |+⟩ und |−⟩ ist (s. Ergänzung EIV ), folgt daraus, dass die beiden Zustände durch das Pumpen ungleich besetzt werden. Je größer die Zahl der Teilchen ist, die neu in die Zelle eintreten (je effizienter das Pumpen ist) und je größer TR ist (je langsamer die Relaxation erfolgt), desto größer (0) wird 0 ℳz . Die Lösung nullter Ordnung (17) beschreibt somit das dynamische Gleich gewicht, das sich als Folge der konkurrierenden Prozesse Pumpen und Relaxation ein stellt. Im Folgenden setzen wir zur Vereinfachung der Bezeichnung ℳ0 = ΓR =
(0) 0 ℳz
(18a)
1 TR
(18b)
•
1358 | Ergänzung BXIII
3-b Lösung erster Ordnung: Lineare Antwort In erster Ordnung ist nur die transversale Magnetisierung 𝓜⊥ von null verschieden. Wegen ℳ+ = ℳ−∗ genügt die Untersuchung von ℳ+ . α Variation der transversalen Magnetisierung Nach dem Schema in Abb. 3 sind für n = 1 die Werte von p = ±1. Damit und unter Verwendung der Notation (18) ergibt (16b) ℳ0 1 2 ω0 − ω + iΓR 1 ℳ0 (1) −1 ℳ+ = 2 ω0 + ω + iΓR (1) 1 ℳ+
=
(19a) (19b)
Setzen wir diese Ausdrücke in die Beziehungen (12b) und dann in (9b) ein, so erhalten wir ℳ+ in erster Ordnung in ω1 : ℳ+ = ω 1
ℳ0 e−iωt eiωt + ) ( 2 ω0 − ω + iΓR ω0 + ω + iΓR
(20)
Der Punkt, der ℳ+ in der komplexen Ebene darstellt, beschreibt dieselbe Bewe gung wie die Projektion 𝓜⊥ von 𝓜 auf die Ebene senkrecht zu B0 . Nach Gl. (20) ergibt sich diese Bewegung aus der Überlagerung zweier kreisförmiger Bewegungen dersel ben Frequenz, wobei die eine rechtszirkular (der eiωt -Term) und die andere linkszir kular (der e−iωt -Term) erfolgt. Das Ergebnis ist also eine im Allgemeinen elliptische Bewegung. β Existenz von zwei Resonanzen Die rechtszirkulare Bewegung weist für ω0 = ω eine maximale Amplitude auf, wäh rend sie für die linkszirkulare Bewegung bei ω0 = −ω liegt; 𝓜⊥ besitzt somit zwei Resonanzen (während für ein rotierendes Feld nur eine einzige Resonanz vorlag; s. Er gänzung FIV ). Dieses Phänomen lässt sich wie folgt interpretieren: Das lineare Radio frequenzfeld kann in ein links- und ein rechtszirkulares Feld aufgespalten werden, die beide eine Resonanz erzeugen; da die Rotationsrichtungen entgegengesetzt sind, gilt dasselbe auch für konstante Felder B0 , für die diese Resonanzen auftreten. γ Lineare Suszeptibilität In der Nähe einer Resonanz (z. B. bei ω0 ≈ ω) können wir in Gl. (20) den nicht zur Resonanz gehörenden Term vernachlässigen. Es ist dann ω≈ω0
ℳ+ ≈ ω 1
ℳ0 eiωt 2 ω0 − ω + iΓR
(21)
ℳ+ ist also proportional zu der dieser Resonanz entsprechenden rotierenden Kompo nente des Radiofrequenzfeldes, also hier B1 eiωt /2.
Zweiniveausystem und sinusförmige Störung
| 1359
•
Das Verhältnis von ℳ+ zu dieser Komponente wird als lineare Suszeptibilität χ(ω) bezeichnet: χ(ω) = −γℳ0
1 ω0 − ω + iΓR
(22)
bei χ(ω) handelt es sich wegen des Auftretens einer Phasendifferenz zwischen 𝓜⊥ und der die Resonanz verursachenden rotierenden Komponente des Radiofrequenz feldes um eine komplexe Suszeptibilität. Das Betragsquadrat von χ(ω) weist in der Nähe von ω = ω0 die klassische Reso nanzform (Abb. 4) mit der Breite ∆ω = 2ΓR =
2 TR
(23)
auf. Je größer also die Relaxationszeit TR ist, desto schärfer wird die Resonanz. Für die folgenden Überlegungen nehmen wir an, dass die beiden Resonanzen ω0 = ω und ω0 = −ω vollständig separiert sind, d. h. es gelte ω/ΓR = ωTR ≫ 1
(24)
Abb. 4: Verlauf des Betragsquadrats |χ(ω)|2 der linearen Suszeptibilität des Spinsystems in Abhängigkeit von ω. Bei ω = ω0 tritt eine Resonanz der Breite 2/TR auf.
Die Phasendifferenz ändert sich beim Durchgang durch die Resonanzstelle von 0 bis ±π. Bei Resonanz ist sie gleich ±π/2: 𝓜⊥ und die rotierende Komponente sind dann um π/2 phasenverschoben, und die Arbeit der vom Feld auf 𝓜 ausgeübten Kopplung ist maximal. Das Vorzeichen dieser Arbeit hängt vom Vorzeichen von ℳ0 , d. h. von μ 0 ab: Es kommt darauf an, ob die hinzutretenden Teilchen im Zustand |+⟩ oder |−⟩ sind. In einem Fall (Spins im unteren Niveau) leistet das Feld die Arbeit, und Energie wird vom Feld auf die Spins übertragen (Absorption). Im anderen Fall (Spins im oberen Ni veau) ist die Arbeit negativ, und die Spins übertragen Energie auf das Feld (induzierte Emission). Dieser Fall tritt bei atomaren Verstärkern und Oszillatoren (Maser und La ser) auf.
•
1360 | Ergänzung BXIII
3-c Lösung zweiter Ordnung: Absorption und induzierte Emission (2)
(2)
In zweiter Ordnung verschwinden nach dem Schema in Abb. 3 nur 0 ℳz und ±2 ℳz (2) nicht. Zunächst wollen wir 0 ℳz , d. h. die statische Besetzungszahldifferenz zwischen den Zuständen |+⟩ und |−⟩ in zweiter Ordnung untersuchen. Danach betrachten wir (2) ±2 ℳ z , d. h. die Erzeugung der zweiten Oberschwingung. α Änderung der Besetzungszahldifferenz der beiden Zustände (2) (0) Durch 0 ℳ0 wird das Ergebnis nullter Ordnung für 0 ℳ0 korrigiert. Nach (16a) und (13b) gilt (2) 0 ℳz
i (1) (1) [ ℳ− + −1 ℳ− − 4ΓR 1 i (1) (1) [ ℳ ∗ + 1 ℳ+∗ − = 4ΓR −1 +
=
(1) 1 ℳ+
− −1 ℳ+ ]
(1)
(1) 1 ℳ+
− −1 ℳ+ ]
(1)
(25)
woraus sich mit den Lösungen erster Ordnung, Gleichungen (19), ergibt (2) 0 ℳz
=−
ℳ0 1 1 + ] [ 2 2 4 (ω − ω0 ) + ΓR (ω + ω0 )2 + Γ2R
(26)
Berücksichtigen wir in (9a) die statischen Terme (p = 0) bis zur zweiten Ordnung einschließlich, so erhalten wir ℳz (statisch) = ℳ0 {1 −
ω21 1 1 [ + ] + . . .} 4 (ω − ω0 )2 + Γ2R (ω + ω0 )2 + Γ2R
(27)
diese konstante longitudinale Magnetisierung ist in Abb. 5 als Funktion von ω0 dar gestellt. Die Besetzungszahldifferenz wird daher in zweiter Ordnung gegenüber ihrem Wert in Abwesenheit des Radiofrequenzfeldes verringert. Diese Verringerung ist pro portional zur Intensität des Radiofrequenzfeldes. Das lässt sich leicht verstehen: Unter dem Einfluss des einlaufenden Feldes werden Übergänge von |+⟩ nach |−⟩ (induzierte Emission) oder von |−⟩ nach |+⟩ (Absorption) induziert; unabhängig vom Vorzeichen der anfänglichen Besetzungszahldifferenz sind die Übergänge aus dem stärker be setzten Niveau zahlreicher, so dass sie die Besetzungszahldifferenz verkleinern. Bemerkung: (2) Der Maximalwert von ω21 | 0 ℳz | ist ℳ0 ω21 /4Γ 2R = ℳ0 ω21 T R2 /4 (Resonanzamplitude, die in Abb. 5 als Senke auftritt). Damit die Störungsentwicklung gültig bleibt, muss daher gelten ω1 TR ≪ 1
(28)
Zweiniveausystem und sinusförmige Störung
•
| 1361
β Erzeugung der zweiten Harmonischen Nach den Beziehungen (16a), (13b), (19a) und (19b) haben wir (2) 2 ℳz
1 (1) (1) [ ℳ ∗ − 1 ℳ+ ] 4(2ω − iΓR ) −1 + 1 1 ℳ0 − ] [ = 8(2ω − iΓR ) ω0 + ω − iΓR ω0 − ω + iΓR
=
(29)
(2)
Der Beitrag 2 ℳz beschreibt die Vibration des magnetischen Dipols längs der z-Achse mit der Frequenz 2ω. Das System kann also eine Welle der Frequenz 2ω abstrahlen, die (für das magnetische Feld) linear in z-Richtung polarisiert ist.
Abb. 5: Verlauf der konstanten longitudinalen Magnetisierung in Abhängigkeit von ω 0 . In zweiter Ordnung der störungstheoretischen Behandlung treten zwei Resonanzen der Breite 2/TR mit dem Zentrum bei ω0 = ω bzw. bei ω 0 = −ω auf. Diese Ergebnisse sind nur richtig, wenn die relative Intensität der Resonanzen klein ist, d. h. wenn ω 1 TR ≪ 1 gilt.
Wir sehen also, dass ein atomares System im Allgemeinen kein lineares System ist; es kann die Anregungsfrequenz verdoppeln, verdreifachen (wie wir unten sehen wer den) usw. Ein analoges Phänomen tritt auch in der Optik bei sehr großen Intensitäten auf („nichtlineare Optik“): Ein roter Laserstrahl (z. B. durch einen Rubinlaser erzeugt) trifft auf ein Medium wie etwa einen Quarzkristall und kann so einen ultravioletten Lichtstrahl erzeugen (doppelte Frequenz). Bemerkung: (2) (2) Es ist nützlich, | 0 ℳz | und | 2 ℳz | in der Nähe von ω0 = ω zu vergleichen. Nach Gl. (29) gilt für ω ≈ ω0 (2)
| 2 ℳz | ≈
ℳ0 16ω0 Γ R
(30)
•
1362 | Ergänzung BXIII
Analog folgt aus Gl. (26) (2)
| 0 ℳz | ≈
ℳ0
(31)
4Γ 2R
Für ω ≈ ω0 ergibt sich schließlich mit der Beziehung (24) (2)
| 2 ℳz | (2)
| 0 ℳz |
≈
1 ΓR = ≪1 4ω0 4ω0 T R
(32)
3-d Lösung dritter Ordnung: Sättigungseffekte und Mehrquantenübergänge (3)
(3)
In dritter Ordnung entnehmen wir Abb. 3, dass nur ±1 ℳ± und ±3 ℳ± nicht verschwin den; es reicht, (3)ℳ+ zu untersuchen. (3) Der Term 1 ℳ+ korrigiert in dritter Ordnung die rechtszirkulare Bewegung von 𝓜⊥ , die wir in erster Ordnung gefunden hatten (s. § 3-b). Wir werden sehen, dass (3) 1 ℳ+ einem Sättigungseffekt der Suszeptibilität des Systems entspricht. (3) Der Term 3 ℳ+ stellt eine weitere Komponente der Bewegung von 𝓜⊥ mit ei ner Frequenz 3ω dar (Erzeugung der dritten Oberschwingung). Der Resonanzverlauf (3) von 3 ℳ+ in der Nähe von ω0 = 3ω lässt sich als Folge der gleichzeitigen Absorpti on von drei Radiofrequenzphotonen interpretieren, wobei die Gesamtenergie und der Gesamtdrehimpuls erhalten bleiben. α Sättigung der Suszeptibilität des Systems Nach der zweiten Gleichung (16b) gilt (3) 1 ℳ+
=
1 1 (2) [ ℳz + 2 ω0 − ω + iΓR 2
(2) 0 ℳz ]
(33)
Da wir an der Korrektur der in § 3-b besprochenen rechtszirkularen Bewegung inter essiert sind, die bei ω0 = ω eine Resonanz aufweist, begeben wir uns in die Nähe (2) (2) von ω0 = ω. Gleichung (32) zufolge können wir dann 2 ℳz gegen 0 ℳz vernachlässi (2) gen und erhalten mit Hilfe des Ausdrucks (26) für 0 ℳz (unter Vernachlässigung des Terms mit der Resonanz bei ω0 = −ω) (3) 1 ℳ+
≈−
1 1 ℳ0 8 ω0 − ω + iΓR (ω − ω0 )2 + Γ2R
(34)
Die Ergebnisse (34) und (19a) ergeben nach einer Umsortierung der Terme den folgenden Ausdruck für die rechtszirkulare Bewegung von ℳ+ mit der Frequenz ω/2π in dritter Ordnung in ω1 : ℳ+ (rechtszirkular) = ω1
ω2 ℳ0 eiωt 1 [1 − 1 ] 2 ω0 − ω + iΓR 4 (ω − ω0 )2 + Γ2R
(35)
Zweiniveausystem und sinusförmige Störung
| 1363
•
Vergleichen wir Gl. (35) mit Gl. (21), so sehen wir, dass sich für die Suszeptibilität statt des Ausdrucks (22) jetzt χ(ω) = −γℳ0
ω2 1 1 [1 − 1 ] ω0 − ω + iΓR 4 (ω − ω0 )2 + Γ2R
(36)
ergibt. Sie wird also mit einem Faktor kleiner als eins multipliziert; je größer die In tensität des Radiofrequenzfeldes ist und je dichter wir uns an der Resonanz befinden, desto kleiner wird dieser Faktor. Man sagt dann, das System sei gesättigt. Der ω21 -Term in Gl. (36) wird als nichtlineare Suszeptibilität bezeichnet. Die physikalische Bedeutung dieser Sättigung ist klar: Ein schwaches elektroma gnetisches Feld induziert im atomaren System ein Dipolmoment, das proportional zur Stärke des Feldes ist. Wird die Amplitude des Feldes erhöht, kann das Dipolmoment nicht weiter proportional mit dem Feld ansteigen. Die von dem Feld induzierten Ab sorptions- und Emissionsübergänge verringern die Besetzungszahldifferenz der be teiligten atomaren Zustände; das atomare System reagiert also immer weniger auf das Feld. Außerdem sehen wir, dass der Term in Klammern von Gl. (36) mit dem Term übereinstimmt, der die Abnahme der Besetzungszahldifferenz in zweiter Ordnung be schreibt [s. Gl. (27), bei der der Resonanzterm bei ω0 = −ω vernachlässigt wurde]. Bemerkung: Die Sättigungsterme spielen in allen Theorien für Maser und Laser eine wichtige Rolle. Wir be trachten erneut Abb. 1: Wenn wir im ersten Schritt der Rechnung (nach rechts zeigender Pfeil) nur die linearen Antwortterme beachten, ist das induzierte Dipolmoment proportional zum Feld. Wenn das Medium verstärkend wirkt (und wenn die Verluste des elektromagnetischen Hohlraums genügend klein sind), verursacht die Antwort des Dipols auf das einfallende Feld (nach links zei gender Pfeil) eine Verstärkung des Feldes um einen Beitrag proportional zum Feld. Es ergibt sich so eine lineare Differentialgleichung für das Feld, die auf eine linear mit der Zeit ansteigende Lösung führt. Die Sättigungsterme verhindern diesen unbegrenzten Anstieg. Sie ergeben eine Gleichung, de ren Lösung beschränkt bleibt und einen Grenzwert erreicht, der das konstante Laserfeld im Hohl raum darstellt. Physikalisch drücken diese Sättigungsterme die Tatsache aus, dass das atomare System dem Feld nicht mehr Energie zur Verfügung stellen kann als es der anfangs durch das Pumpen erzeugten Besetzungszahldifferenz entspricht.
β Dreiphotonenübergänge Nach den Gleichungen (16b) und (29) gilt (3) 3 ℳ+
1 1 (2) ℳz 2 ω0 − 3ω + iΓR 2 1 ℳ0 1 1 1 = [ − ] 16 ω0 − 3ω + iΓR 2ω − iΓR ω0 + ω − iΓR ω0 − ω + iΓR =
(3)
(2)
(37)
Für diesen Term 3 ℳ+ gilt dasselbe wie für 2 ℳz : Das atomare System erzeugt Oberschwingungen der Anregungsfrequenz (hier die dritte Oberschwingung).
•
1364 | Ergänzung BXIII (2)
Der Unterschied zum vorhergehenden Abschnitt in Bezug auf 2 ℳz besteht darin, dass eine Resonanz bei ω0 = 3ω auftritt [erster Resonanznenner in Gl. (37)]. Für die ω0 = ω-Resonanz der vorhergehenden Abschnitte können wir eine Teil chendeutung angeben: Der Spin geht aus dem Zustand |−⟩ in den Zustand |+⟩ über unter Absorption eines Photons (oder Emission eines Photons, je nach relativer Lage der Zustände |+⟩ und |−⟩). Es tritt eine Resonanz auf, wenn die Energie ℏω des Photons gleich der Energie ℏω0 des atomaren Übergangs ist. Für die ω0 = 3ω-Resonanz lässt sich eine analoge Teilchendeutung geben: Da ℏω0 = 3ℏω gilt, ist der Übergang mit der Emission oder Absorption von drei Photonen verbunden, da die Gesamtenergie erhalten bleiben muss. Wir könnten uns fragen, warum in zweiter Ordnung für ℏω0 = 2ℏω (Zweipho tonenübergang) keine Resonanz aufgetreten ist. Der Grund hierfür liegt darin, dass auch der Gesamtdrehimpuls während des Übergangs erhalten bleiben muss. Beim li nearen Radiofrequenzfeld handelt es sich um eine Überlagerung von zwei Feldern, die entgegengesetzt zueinander rotieren. Zu jedem Feld gehören Photonen unterschiedli cher Art. Dem rechtszirkularen Feld sind σ + -Photonen zugeordnet, die in z-Richtung einen Drehimpuls +ℏ tragen; zum linkszirkularen Feld gehören analog σ− -Photonen mit einem Drehimpuls −ℏ. Beim Übergang vom |−⟩-Zustand in den |+⟩-Zustand muss der Spin einen Drehimpuls +ℏ bezüglich der z-Achse absorbieren (die Differenz der beiden Eigenwerte von S z ), was durch Absorption eines σ + -Photons geschehen kann. Außerdem bleibt bei ω0 = ω die Gesamtenergie erhalten, womit sich das Auftreten einer Resonanz bei ω0 = ω erklärt. Ebenso kann durch die Absorption von drei Pho tonen ein Drehimpuls +ℏ aufgenommen werden (Abb. 6): zwei σ + -Photonen und ein σ − -Photon. Auch für ω0 = 3ω bleiben also Energie und Gesamtdrehimpuls erhalten, was das Auftreten einer ω0 = 3ω-Resonanz erklärt. Zwei Photonen können jedoch dem Atom nie einen Drehimpuls +ℏ übertragen: Entweder haben wir zwei σ+ -Photo nen mit einer Drehimpulssumme 2ℏ oder zwei σ − -Photonen mit insgesamt −2ℏ oder ein σ + - und ein σ − -Photon mit dem Gesamtdrehimpuls null.
Abb. 6: Der Spin kann aus dem |−⟩-Zustand in den |+⟩-Zustand durch Absorption von drei Photonen mit der Energie ℏω übergehen. Die Gesamtenergie bleibt für ℏω 0 = 3ℏω erhalten. Der Gesamtdrehimpuls bleibt erhalten, wenn zwei Photonen σ + -polarisiert (jedes trägt einen Drehimpuls +ℏ in Bezug auf die z-Richtung) sind und das dritte σ − -polarisiert (mit dem Drehimpuls −ℏ) ist.
Zweiniveausystem und sinusförmige Störung
| 1365
•
Diese Überlegung kann leicht verallgemeinert werden und es kann gezeigt wer den, dass Resonanzen auftreten für ω0 = ω, 3ω, 5ω, 7ω, . . . , (2n + 1)ω, . . . entspre chend der Absorption einer ungeraden Anzahl von Photonen. Außerdem können wir (2n+1) Gl. (16b) entnehmen, dass 2n+1 ℳ+ bei ω0 = (2n + 1)ω ein Resonanzmaximum auf weist. Für gerade Ordnungen ist kein analoges Verhalten zu beobachten, da wir dann nach Abb. 3 Gl. (16a) verwenden müssen. Bemerkungen: 1. Ist B1 ein rotierendes Feld, so gibt es nur σ + - oder σ − -Photonen. Dieselbe Überlegung zeigt dann, dass nur eine einzige Resonanz auftreten kann: für σ + -Photonen bei ω0 = ω und für σ − -Photonen bei ω0 = −ω. Dadurch ist die Rechnung für ein rotierendes Feld viel leichter und führt auf eine strenge Lösung. Man kann die hier vorgestellte Methode auf rotierende Felder an wenden und zeigen, dass die Störungsreihe aufsummiert werden kann und man wieder das in Ergänzung FIV direkt gefundene Ergebnis erhält. 2. Wir betrachten ein System mit zwei Zuständen unterschiedlicher Parität unter dem Einfluss ei nes oszillierenden elektrischen Felds. Der Wechselwirkungsoperator weist dann dieselbe Struk tur auf wie der, den wir in dieser Ergänzung untersuchen: S x hat nur Nichtdiagonalelemente. Entsprechend kann auch der elektrische Dipol-Hamilton-Operator, da er ungerade ist, keine Dia gonalelemente haben. Die Rechnung ist im zweiten Fall der obigen sehr ähnlich und führt auf ent sprechende Ergebnisse: Resonanzen treten auf für ω0 = ω, 3ω, 5ω, . . . Diese „ungerade“ Natur des Spektrums lässt sich wie folgt deuten: Die elektrischen Dipolphotonen haben negative Pa rität, und das System muss beim Übergang von einem Niveau in ein anderes entgegengesetzter Parität eine ungerade Anzahl dieser Photonen absorbieren. 3. Für den Fall des Spins 1/2 nehmen wir an, dass das lineare Radiofrequenzfeld weder parallel noch senkrecht zu B0 ist (Abb. 7); B1 kann dann in eine Komponente parallel zu B0 , B1‖ , zu der π-Photonen gehören (mit dem Drehimpuls null in Bezug auf die z-Richtung), und eine senkrechte Komponente B1⊥ mit σ + - und σ − -Photonen aufgespalten werden. In diesem Fall kann das Atom seinen Drehimpuls bezüglich der z-Achse durch die Absorption zweier Photonen, eines σ + - und eines π-Photons, um +ℏ erhöhen und aus dem Zustand |−⟩ in |+⟩ übergehen. Mit der hier vorge stellten Methode lässt sich dann zeigen, dass bei dieser Polarisation der Radiofrequenz ein voll ständiges (gerades und ungerades) Spektrum an Resonanzen auftritt: ω0 = ω, 2ω, 3ω, 4ω, . . .
Abb. 7: Konstantes Magnetfeld B0 und Radiofrequenzfeld B1 für den Fall, dass B1 weder parallel noch senkrecht zu B0 ist; B1‖ und B1⊥ sind die Komponenten von B1 parallel bzw. senkrecht zu B0 .
•
1366 | Ergänzung BXIII
4 Aufgaben 1. In Gl. (1) setze man ω1 = 0 (keine Radiofrequenz) und wähle μ0 parallel zur x-Achse (transversales Pumpen). Man berechne die sich einstellenden konstanten Werte von ℳx , ℳy und ℳz . Man zeige, dass ℳx und ℳy Resonanzverhalten zeigen, wenn das konstante Feld um null herum geändert wird (Hanle-Effekt). Man gebe eine physikalische Deutung dieser Re sonanzen (Pumpen in Konkurrenz mit Larmor-Präzession) und zeige, dass sie die Mes sung des Produkts γTR erlauben. 2. Wir betrachten ein Spinsystem unter dem Einfluss desselben konstanten Feldes B0 und derselben Pump- und Relaxationsprozesse wie in dieser Ergänzung. Die Spins sei en zusätzlich zwei Radiofrequenzfeldern ausgesetzt, einem ersten mit der Frequenz ω und der Amplitude B1 parallel zur z-Achse und einem zweiten mit der Frequenz ω und der Amplitude B1 parallel zur x-Achse. Man berechne mit Hilfe der allgemeinen Methoden dieser Ergänzung die Magneti sierung 𝓜 des Spinsystems in zweiter Ordnung in ω1 = −γB1 und ω1 = −γB1 (Terme 2 in ω21 , ω1 , ω1 ω1 ). Wir halten ω0 = −γB0 und ω1 fest. Man nehme ω0 > ω an und än dere ω . Man zeige in dieser Störungsordnung, dass zwei Resonanzen auftreten, eine bei ω = ω0 − ω und die andere bei ω = ω0 + ω. Man gebe eine physikalische Interpretation dieser Resonanzen (die erste ent spricht einer Zweiphotonenabsorption und die zweite dem Raman-Effekt).
Referenzen und Literaturhinweise Siehe Abschnitt 15 der Bibliographie. Semiklassische Theorie von Masern und Lasern: Lamb (15.4) und in (15.2), Sargent et al. (15.5), Kap. VIII, IX und X. Nichtlineare Optik: Baldwin (15.19), Bloembergen (15.21), Giordmaine (15.22). Iterative Lösung der Grundgleichung: Bloembergen (15.21), Kap. 2, § 3, § 4 und § 5, außerdem Anhang III. Mehrphotonenprozesse im RF-Bereich, Hanle-Effekt: Vorlesung von Brossel in (15.2).
Oszillationen zwischen zwei Zuständen | 1367
•
Ergänzung CXIII Oszillation zwischen zwei diskreten Zuständen bei einer sinusförmigen Störung 1 2 3
Säkularnäherung | 1367 Lösung des Gleichungssystems | 1368 Physikalische Diskussion | 1369
Die Näherungsmethode, die wir in Kapitel XIII zur Berechnung des Effekts einer Re sonanzstörung verwendet haben, verliert für lange Zeitintervalle ihre Gültigkeit. Wir wir gesehen haben [s. Gl. (C-18)], muss t die Bedingung ℏ (1) t≪ |W fi | erfüllen. Wir nehmen nun an, wir wollten das Verhalten eines Systems unter dem Ein fluss einer Resonanzstörung über ein längeres Zeitintervall [für das die Bedingung (1) nicht erfüllt ist] untersuchen. Da die Lösung erster Ordnung in diesem Fall nicht aus reicht, könnten wir versuchen, eine gewisse Anzahl von Termen höherer Ordnung zu berechnen, um so einen besseren Ausdruck für 𝒫if (t; ω) zu erhalten: (1)
(2)
(3)
𝒫if (t; ω) = |λ b f (t) + λ2 b f (t) + λ3 b f (t) + . . . |2
(2)
Dies erfordert jedoch unnötig lange Rechnungen. Wir werden sehen, dass das Problem eleganter und schneller gelöst werden kann, wenn wir die Näherungsmethode an den Resonanzcharakter der Störung anpassen. Aus der Resonanzbedingung ω ≈ ω fi folgt, dass durch W(t) effektiv nur die beiden diskreten Zustände |φ i ⟩ und |φ f ⟩ gekoppelt sind. Da sich das System anfangs im Zu stand |φ i ⟩ befindet [b i (0) = 1], kann die Wahrscheinlichkeitsamplitude b f (t) dafür, das System zur Zeit t im Zustand |φ f ⟩ zu finden, groß sein. Alle Koeffizienten b n (t) (mit n ≠ i, f ) bleiben jedoch sehr viel kleiner als eins, da sie die Resonanzbedingung nicht erfüllen. Das bildet die Grundlage einer Methode, die wir hier anwenden wollen.
1 Säkularnäherung In Gl. (B-11) von Kapitel XIII ersetzten wir alle Komponenten b k (t) durch ihre Werte b k (0). Wir gehen jetzt ebenso auch für alle Komponenten mit k ≠ i, f vor, behalten jedoch explizit b i (t) und b f (t). Zur Bestimmung von b i (t) und b f (t) werden wir dann auf das folgende System von Gleichungen geführt [die Störung hat dieselbe Form wie in Kapitel XIII, Gl. (C-1a)]: d 1 {[eiωt − e−iωt ] W ii b i (t) + [ei(ω−ω fi )t − e−i(ω+ω fi )t ] W if b f (t)} iℏ b i (t) = dt 2i (3) 1 d iℏ b f (t) = {[ei(ω+ω fi )t − e−i(ω−ω fi )t ] W fi b i (t) + [eiωt − e−iωt ] W ff b f (t)} dt 2i https://doi.org/10.1515/9783110638769-034
•
1368 | Ergänzung CXIII
Auf der rechten Seite haben wir einige Koeffizienten von b i (t) und b f (t), die pro portional zu e±i(ω−ω fi )t sind, die also für ω ≈ ω fi langsam oszillieren. Die Koeffizienten proportional zu e±iωt und e±i(ω+ω fi )t oszillieren hingegen sehr viel schneller. Die Säku larnäherung besteht darin, diesen zweiten Typ von Termen zu vernachlässigen. Bei den verbleibenden Termen, den sogenannten Säkulartermen, reduzieren sich die Ko effizienten für ω = ω fi auf eine Konstante. Bei der Integration über die Zeit liefern sie zu den Änderungen der Komponenten b i (t) und b f (t) wesentliche Beiträge. Dagegen sind die Beiträge der anderen Terme vernachlässigbar, da ihre Änderung zu schnell erfolgt (bei der Integration von eiΩt tritt ein Faktor 1/Ω auf, und der Mittelwert von eiΩt über eine große Anzahl von Perioden ist praktisch gleich null). Bemerkung: Damit die vorstehende Überlegung gültig ist, muss die Zeitabhängigkeit von eiωt b i,f (t) im We sentlichen durch die Exponentialfunktion und nicht durch die Komponente b i,f (t) gegeben sein. Da ω sehr dicht bei ω fi liegt, darf also b i,f (t) über ein Zeitintervall der Größenordnung 1/|ω fi | nicht stark variieren. Diese Bedingung ist bei den hier gemachten Annahmen, d. h. für W ≪ H 0 , tatsächlich erfüllt. Die Änderung von b i (t) und b f (t) (die für W = 0 Konstanten sind) werden durch die Störung W verursacht und für Zeiten von der Größenordnung ℏ/|W if | bemerkbar [das lässt sich anhand der weiter unten abgeleiteten Gleichungen (8) direkt nachweisen]. Da nach Annahme |W if | ≪ ℏ|ω fi | gilt, ist diese Zeit viel größer als 1/|ω fi |.
Zusammenfassend führt also die Säkularnäherung auf das folgende Gleichungssys tem: d 1 i(ω−ω fi )t W if b f (t) b i (t) = − e dt 2ℏ 1 −i(ω−ω fi )t d W fi b i (t) b f (t) = e dt 2ℏ
(4a) (4b)
Wie wir im nächsten Abschnitt sehen werden, lässt sich die Lösung dieses Systems, obwohl sie fast der von Gl. (3) entspricht, leichter bestimmen.
2 Lösung des Gleichungssystems Wir beginnen mit ω = ω fi : Wir leiten die Gleichung (4a) ab und setzen (4b) in das Ergebnis ein: d2 1 b i (t) = − 2 |W if |2 b i (t) dt2 4ℏ
(5)
Da sich das System zur Zeit t = 0 im Zustand |φ i ⟩ befindet, lauten die Anfangsbedin gungen b i (0) = 1
(6a)
b f (0) = 0
(6b)
Oszillationen zwischen zwei Zuständen |
1369
•
woraus mit den Gleichungen (4) folgt db i (0) = 0 dt W fi db f (0) = dt 2ℏ
(7a) (7b)
Die Lösung von Gl. (5), die die Bedingungen (6a) und (7a) erfüllt, lautet dann b i (t) = cos (
|W fi |t ) 2ℏ
(8a)
Aus der Beziehung (4a) können wir dann b f berechnen, b f (t) = eiα fi sin (
|W fi |t ) 2ℏ
(8b)
wobei α fi die Phase von W fi ist. Die Wahrscheinlichkeit 𝒫if (t; ω = ω fi ), das System zur Zeit t im Zustand |φ f ⟩ anzutreffen, ist in diesem Fall 𝒫if (t; ω = ω fi ) = sin2 (
|W fi |t ) 2ℏ
(9)
Wenn ω von ω fi verschieden ist (aber dicht am Resonanzwert bleibt), ist das Dif ferentialgleichungssystem (4) immer noch streng lösbar. Es ist vollständig analog zu den Gleichungen, die wir in Ergänzung FIV [s. Gl. (15)] bei der Untersuchung der ma gnetischen Resonanz eines Spins 1/2 gefunden hatten. Eine entsprechende Rechnung führt auf ein Analogon zu Gl. (27) von Ergänzung FIV (Formel von Rabi): 𝒫if (t; ω) =
|W if
|2
|W if |2 t |W if |2 sin2 ( √ 2 + (ω − ω fi )2 ) 2 2 2 + ℏ (ω − ω fi ) ℏ
(10)
[für ω = ω fi reduziert sich dieser Ausdruck auf Gl. (9)].
3 Physikalische Diskussion Die Diskussion des in Gl. (10) erhaltenen Ergebnisses ist dieselbe wie bei der magneti schen Resonanz eines Spins 1/2 (s. § 2-c von Ergänzung FIV ). Bei der Wahrscheinlich keit 𝒫if (t; ω) handelt es sich um eine in der Zeit oszillierende Funktion; für bestimmte Werte von t gilt 𝒫if (t; ω) = 0, und das System ist in seinen Anfangszustand |φ i ⟩ zu rückgekehrt. Gleichung (10) bestimmt die Größenordnung des Resonanzphänomens. Für ω = ω fi kann, wie klein die Störung auch sein mag, das System vollständig vom Zustand |φ i ⟩ in den Zustand |φ f ⟩ übergehen.¹ Ist die Störung andererseits nichtresonant, so bleibt die Wahrscheinlichkeit 𝒫if (t; ω) immer kleiner als eins. 1 Die Größenordnung der Störung, gegeben durch |W fi |, beeinflusst bei Resonanz nur das Zeitinter vall, das das System für den Übergang von |φ i ⟩ nach |φ f ⟩ benötigt. Je kleiner |W fi | ist, desto größer ist diese Zeit.
•
1370 | Ergänzung CXIII
Schließlich ist es interessant, die Ergebnisse dieser Ergänzung mit den Ergebnis sen der Störungstheorie erster Ordnung zu vergleichen: Zunächst stellen wir fest, dass für beliebige Werte von t die in Gl. (10) erhaltene Wahrscheinlichkeit 𝒫if (t; ω) zwi schen null und eins liegt. Mit der hier verwendeten Näherungsmethode umgehen wir also die Schwierigkeiten, auf die wir in § C-2-c-β von Kapitel XIII gestoßen waren. Für t gegen null in Gl. (9) reproduzieren wir das in Gl. (C-17) erhaltene Ergebnis. Die Stö rungstheorie erster Ordnung ist also für ausreichend kleine t tatsächlich gültig (s. die Bemerkung in § B-3-b von Kapitel XIII). Sie entspricht bildlich dem Ersetzen der Sinus kurve, die im Ausdruck für 𝒫if (t; ω) die Zeitabhängigkeit darstellt, durch eine Parabel.
Zerfall eines diskreten Zustands in ein Kontinuum | 1371
•
Ergänzung DXIII Zerfall eines diskreten Zustands in ein Kontinuum 1 2 2-a
Problemstellung | 1371 Beschreibung des Modells | 1372 Voraussetzungen an den ungestörten Hamilton-Operator H 0 | 1372
2-b 2-c 2-d 3 4 5 5-a 5-b 5-c
Voraussetzungen für die Kopplung W | 1373 Ergebnisse der Störungstheorie erster Ordnung | 1374 Äquivalente Integrodifferentialgleichung | 1376 Näherung für kurze Zeiten | 1377 Eine zweite Näherungsmethode | 1378 Physikalische Diskussion | 1380 Lebensdauer des diskreten Zustands | 1380 Verschiebung des diskreten Niveaus | 1381 Energieverteilung der Endzustände | 1382
1 Problemstellung In § C-3 von Kapitel XIII sahen wir, wie die durch eine konstante Störung bewirkte Kopplung eines diskreten Anfangszustands der Energie E i mit einem Kontinuum von Endzuständen (von denen einige die gleiche Energie E i besitzen können) den Über gang in diese Endzustände beeinflusst. Es zeigte sich, dass die Wahrscheinlichkeit dafür, das System in einer wohldefinierten Gruppe von kontinuierlichen Zuständen zu finden, mit der Zeit linear wächst. Folglich muss die Wahrscheinlichkeit 𝒫ii (t), das System zur Zeit t noch im Anfangszustand |φ i ⟩ zu finden, von ihrem Wert 𝒫ii (0) = 1 mit der Zeit linear fallen. Diese Aussage gilt natürlich nur für kurze Zeitabschnitte, da die Extrapolation des linearen Fallens von 𝒫ii (t) auf lange Zeiten zu negativen Werten von 𝒫ii (t) führen würde. Damit stellt sich das Problem, das Verhalten des Systems für große Zeiten zu bestimmen. Einem analogen Problem sind wir begegnet, als wir die Resonanzübergänge zwi schen zwei diskreten Zuständen |φ i ⟩ und |φ f ⟩ untersuchten, die von einer sinusför migen Störung bewirkt werden. Die Störungstheorie erster Ordnung sagt ein Fallen von 𝒫ii (t) aus dem Anfangswert 𝒫ii (0) = 1 voraus, das proportional zu t2 ist. Die in Ergänzung CXIII vorgestellte Methode zeigt, dass das System in Wirklichkeit zwischen den beiden Zuständen |φ i ⟩ und |φ f ⟩ oszilliert; der in Kapitel XIII, § C gefundene Abfall mit t2 stellt nur den „Anfang“ der entsprechenden Sinusfunktion dar. Wir könnten für das hier vorliegende Problem eine entsprechende Lösung erwar ten (Oszillationen des Systems zwischen dem diskreten Zustand und dem Kontinu um). Dies ist aber nicht der Fall: Das System verlässt den Zustand |φ i ⟩ irreversibel. Es ergibt sich ein exponentielles Abfallen e−Γt für 𝒫ii (t) (nach der Störungstheorie ist das Verhalten für kurze Zeiten wie 1 − Γt). Der kontinuierliche Charakter der Endzustän de hebt die in Ergänzung CXIII festgestellte Reversibilität auf. Er ist für den Zerfall des https://doi.org/10.1515/9783110638769-035
•
1372 | Ergänzung DXIII
Anfangszustands verantwortlich, so dass dieser eine endliche Lebensdauer erhält (er wird instabil, s. Ergänzung KIII ). Dieser Fall ist in der Physik sehr häufig anzutreffen. Zum Beispiel kann ein Sys tem, das sich anfangs in einem diskreten Zustand befindet, unter dem Einfluss einer internen Kopplung (die durch einen zeitabhängigen Hamilton-Operator W beschrie ben wird) in zwei Teile aufgespalten werden, deren Energien (kinetische Energien für den Fall materieller Teilchen, elektromagnetische für Photonen) von vornherein jeden beliebigen Wert besitzen können; damit haben wir ein Kontinuum von Endzuständen. So geht beim α-Zerfall ein Atomkern, der sich zunächst in einem diskreten Zustand be findet, (durch den Tunneleffekt) in ein System über, das aus einem α-Teilchen und ei nem anderen Atomkern besteht. Aus einem Mehrelektronenatom A, das sich anfangs in einer Konfiguration (s. Ergänzungen AXIV und BXIV ) mit mehreren angeregten Elek tronen befindet, kann unter dem Einfluss der elektrostatischen Wechselwirkung zwi schen den Elektronen ein Ion A+ und ein freies Elektron entstehen (die Energie der ursprünglichen Konfiguration muss natürlich größer als die Ionisierungsenergie von A sein): Dies ist das Phänomen der Selbstionisation. Auch die spontane Emission ei nes Photons durch einen angeregten atomaren (oder nuklearen) Zustand lässt sich hier anführen: Die Wechselwirkung des Atoms mit dem quantisierten elektromagne tischen Feld koppelt den diskreten Anfangszustand (das angeregte Atom ohne Photo nen) an ein Kontinuum von Endzuständen (das Atom in einem niedrigeren Niveau mit einem Photon beliebiger Richtung, Polarisation und Energie). Schließlich erwähnen wir den photoelektrischen Effekt, bei dem eine (sinusförmige) Störung den diskreten Zustand eines Atoms A an ein Kontinuum von Endzuständen (das Ion A+ und das Photoelektron e− ) koppelt. Diese wenigen Beispiele zeigen bereits die Bedeutung der Probleme, die wir in dieser Ergänzung behandeln wollen.
2 Beschreibung des Modells 2-a Voraussetzungen an den ungestörten Hamilton-Operator H0 Um die Rechnungen so weit wie möglich zu vereinfachen, treffen wir für das Spektrum des ungestörten Hamilton-Operators H0 die folgenden Voraussetzungen: Das Spek trum enthält 1. einen diskreten Zustand |φ i ⟩ der Energie E i (nichtentartet), H0 |φ i ⟩ = E i |φ i ⟩ 2.
(1)
eine Menge von Zuständen |α⟩, die ein Kontinuum bilden, H0 |α⟩ = E |α⟩
(2)
Zerfall eines diskreten Zustands in ein Kontinuum | 1373
•
E kann eine unendliche Menge kontinuierlicher Werte annehmen, die sich über einen Teil der reellen Achse unter Einschluss von E i verteilen. Wir werden z. B. annehmen, dass E zwischen 0 und +∞ liegt: E≥0
(3)
Jeder Zustand |α⟩ wird durch seine Energie E und einen Satz weiterer Parameter charakterisiert, den wir mit β bezeichnen wollen (wie in § C-3-a-β von Kapitel XIII); |α⟩ kann daher auch als |E, β⟩ geschrieben werden. Es ist dα = ρ(β, E) d β dE
(4)
[s. Gl. (C-28) aus Kap. XIII] wobei ρ(β, E) die Dichte der Endzustände bezeichnet. Die Eigenzustände von H0 erfüllen die folgenden Relationen (Orthogonalitätsund Vollständigkeitsrelation): ⟨φ i | φ i ⟩ = 1
(5a)
⟨φ i | α⟩ = 0
(5b)
⟨α | α ⟩ = δ(α − α )
(5c)
|φ i ⟩⟨φ i | + ∫ dα |α⟩⟨α| = 1
(6)
2-b Voraussetzungen für die Kopplung W Wir setzen voraus, dass W nicht explizit zeitabhängig ist und keine von null verschie denen Diagonalelemente besitzt: ⟨φ i | W | φ i ⟩ = ⟨α | W | α⟩ = 0
(7)
(wenn diese Diagonalelemente nicht verschwinden würden, könnten wir sie immer zu denen von H0 addieren, was lediglich der Änderung der ungestörten Energie entsprä che). Weiter setzen wir voraus, dass W keine zwei Zustände des Kontinuums koppelt: ⟨α | W | α ⟩ = 0
(8)
Die einzigen nichtverschwindenden Matrixelemente von W koppeln dann den diskre ten Zustand |φ i ⟩ mit den Zuständen des Kontinuums. Diese Matrixelemente ⟨α|W|φ⟩ sind verantwortlich für den Zerfall des Zustands |φ i ⟩. Diese Voraussetzungen sind nicht zu einschränkend. Insbesondere die Bedin gung (8) ist bei den oben angeführten Beispielen sehr oft erfüllt. Der Vorteil dieses Modells liegt darin, dass es die Untersuchung von Zerfallsprozessen erlaubt, oh ne dass die Rechnungen zu verwickelt werden. Die wesentlichen physikalischen Schlussfolgerungen würden durch ein komplizierteres Modell nicht geändert.
•
1374 | Ergänzung DXIII
Bevor wir die neue Lösungsmethode für die Schrödinger-Gleichung vorstellen, ge ben wir die Ergebnisse der Störungstheorie erster Ordnung für das ursprüngliche Mo dell an.
2-c Ergebnisse der Störungstheorie erster Ordnung Nach § C-3 von Kapitel XIII können wir [insbesondere mithilfe der Regel (C-36)] die Wahrscheinlichkeit bestimmen, das physikalische System (das anfangs im Zustand |φ i ⟩ ist) zur Zeit t mit einer beliebigen Energie in einem zu einer Gruppe gehörenden Endzustand zu finden, die durch das Intervall δβ f um den Wert β f charakterisiert ist. Wir fragen hier nach der Wahrscheinlichkeit, das System in irgendeinem Endzu stand |α⟩ zu finden: Es werden weder E noch β angegeben. Wir müssen daher die in Fermis goldener Regel auftretende Wahrscheinlichkeitsdichte über β integrieren [die Integration über die Energie haben wir in Kapitel XIII bereits ausgeführt; s. Gl. (C-36)]. Wir führen die Konstante Γ=
2π ∫ dβ |⟨β, E = E i | W | φ i ⟩|2 ρ(β, E = E i ) ℏ
(9)
ein. Die gesuchte Wahrscheinlichkeit ist dann gleich Γ t. Unter Beachtung der Voraus setzungen handelt es sich also um die Wahrscheinlichkeit, dass das System zur Zeit t den Zustand |φ i ⟩ verlassen hat. Nennen wir die Wahrscheinlichkeit dafür, dass sich das System noch in diesem Zustand befindet, 𝒫ii (t), so ist 𝒫ii (t) = 1 − Γ t
(10)
Für die Diskussion der folgenden Abschnitte ist es wichtig, an die Bedingungen für die Gültigkeit dieser Beziehung zu erinnern: 1. Sie folgt aus der Störungstheorie erster Ordnung, deren Anwendung nur erlaubt ist, wenn 𝒫ii (t) wenig vom Anfangswert 𝒫ii (0) = 1 abweicht. Es muss darum gel ten t≪ 2.
1 Γ
(11)
Andererseits gilt die Beziehung nur für genügend lange Zeiten t.
Um die zweite Bedingung zu präzisieren und insbesondere zu prüfen, ob sie mit der Relation (11) verträglich ist, betrachten wir noch einmal den Ausdruck (C-31) aus Ka pitel XIII (β und E sind nicht mehr auf die Intervalle δβ f und δE f beschränkt). Im Gegensatz dazu integrieren wir jetzt die Wahrscheinlichkeitsdichte δ𝒫(φ i , α f , t) =
1 ∫ dβ dE ρ(β, E) |⟨β, E | W | φ i ⟩|2 F (t, (E − E i )/ℏ) ℏ2 β∈δβ f E∈δE f
Zerfall eines diskreten Zustands in ein Kontinuum | 1375
•
zuerst über β und dann über E. Dabei tritt das folgende Integral auf: ∞
1 ∫ dE F (t, (E − E i )/ℏ) K(E) ℏ2
(12)
0
wobei K(E) als Ergebnis der ersten Integration über β gegeben wird durch K(E) = ∫ dβ |⟨β, E | W | φ i ⟩|2 ρ(β, E)
(13)
F(t, (E − E i )/ℏ) ist die um E = E i zentrierte Beugungsfunktion [s. Gl. (C-7) aus Kapi tel XIII] mit der Breite 4πℏ/t.
Abb. 1: Verlauf der Funktionen K(E) und F(t, (E − E i )/ℏ) in Abhängigkeit von E. Die „Breiten“ der beiden Kurven sind von der Größenordnung ℏ∆ bzw. 4πℏ/t. Für ausreichend große t verhält sich F(t, (E − E i )/ℏ) relativ zu K(E) wie eine Deltafunktion.
Mit ℏ∆ bezeichnen wir die „Breite“ von K(E): ℏ∆ gibt die Größenordnung der nötigen Variation von E wieder, damit K(E) sich merklich ändert (Abb. 1). Sobald t so groß ist, dass t≫
1 ∆
(14)
gilt, verhält sich F(t, (E − E i )/ℏ) relativ zu K(E) wie eine Deltafunktion. Nach Gl. (C-32) aus Kapitel XIII können wir dann das Integral (12) in der Form 2π 2πt t ∫ dE δ(E − E f ) K(E) = K(E = E i ) = Γt ℏ ℏ
(15)
schreiben, da der Vergleich von Gl. (9) und Gl. (13) 2π K(E = E i ) = Γ ℏ
(16)
•
1376 | Ergänzung DXIII
ergibt. Wieder erhalten wir, dass der lineare Zusammenhang in Gl. (10) nur für solche t gilt, die die Ungleichung (14) erfüllen. Die Bedingungen (11) und (14) sind offensichtlich miteinander verträglich, wenn ∆≫Γ
(17)
ist. Somit haben wir eine quantitative Form für die Bedingung gefunden, die wir in der Fußnote auf S. 1309 angegeben hatten. Im Folgenden wollen wir die Ungleichung (17) als erfüllt annehmen.
2-d Äquivalente Integrodifferentialgleichung Die Gleichungen (B-11) aus Kapitel XIII lassen sich leicht auf den hier vorliegenden Fall anwenden. Der Zustand des Systems zur Zeit t kann in der {|φ i ⟩, |α⟩}-Basis entwickelt werden: |ψ(t)⟩ = b i (t) e−iE i t/ℏ |φ i ⟩ + ∫ dα b(α, t) e−iEt/ℏ |α⟩
(18)
Wenn wir diesen Ausdruck in die Schrödinger-Gleichung einsetzen, erhalten wir unter Beachtung der oben genannten Voraussetzungen nach einer Rechnung, die in allen Punkten dem Vorgehen in § B-1 von Kapitel XIII entspricht, die folgenden Bewegungs gleichungen: d b i (t) = ∫ dα ei(E i −E)t/ℏ ⟨φ i | W | α⟩ b(α, t) dt d iℏ b(α, t) = ei(E−E i )t/ℏ ⟨α | W | φ i ⟩ b i (t) . dt iℏ
(19) (20)
Das Problem besteht nun darin, mit Hilfe dieser in Strenge gültigen Gleichungen das Verhalten des Systems nach einer langen Zeit vorherzusagen, wobei die folgenden An fangsbedingungen zu beachten sind: b i (0) = 1
(21a)
b(α, 0) = 0
(21b)
Aus den vereinfachenden Voraussetzungen für W folgt, dass
d d t b i (t)
nur von
d d t b(α, t)
nur von b i (t) abhängt. Somit können wir Gl. (20) mit Beachtung b(α, t) und der Anfangsbedingung (21b) integrieren. Wenn wir den so erhaltenen Ausdruck in Gl. (19) einsetzen, erhalten wir für die Beschreibung der zeitlichen Entwicklung von b i (t) die Gleichung t
d 1 b i (t) = − 2 ∫ dα ∫ dt ei(E i −E)(t−t )/ℏ |⟨α | W | φ i ⟩|2 b i (t ) dt ℏ 0
(22)
Zerfall eines diskreten Zustands in ein Kontinuum | 1377
•
Nun verwenden wir Gl. (4) und integrieren über β, was mit Gl. (13) auf ∞
t
0
0
d 1 b i (t) = − 2 ∫ dE ∫ dt K(E) ei(E i −E)(t−t )/ℏ b i (t ) dt ℏ
(23)
führt. In dieser Gleichung treten nur noch die b i (t) auf. Allerdings stellen wir fest, dass es sich bei dieser Gleichung nicht mehr um eine Differentialgleichung, sondern um eine Integrodifferentialgleichung handelt: ddt b i (t) hängt von der gesamten „Vor geschichte“ des Systems zwischen den Zeitpunkten 0 und t ab. Gleichung (23) ist äquivalent zur Schrödinger-Gleichung, allerdings können wir sie nicht streng lösen. In den folgenden Abschnitten beschreiben wir daher zwei Nä herungsmethoden. Die eine ist äquivalent zur Störungstheorie erster Ordnung (§ 3); die andere erweist sich als zweckmäßig, wenn man das System für lange Zeiten unter suchen will (§ 4).
3 Näherung für kurze Zeiten Wenn t nicht zu groß ist, d. h. wenn b i (t) sich nicht zu sehr von seinem Anfangswert b i (0) = 1 unterscheidet, können wir auf der rechten Seite von Gl. (23) b i (t ) durch b i (0) = 1 ersetzen. Diese rechte Seite reduziert sich damit auf ein Doppelintegral über E und t , ∞
−
t
1 ∫ dE ∫ dt K(E) ei(E i −E)(t−t )/ℏ ℏ2
0
(24)
0
dessen Berechnung keine Schwierigkeiten bietet. Wir führen sie explizit aus, da sie uns die Möglichkeit zur Einführung von zwei Konstanten liefert [eine davon ist die durch Gl. (9) definierte Größe Γ], die in der in § 4 vorgestellten Methode eine wichtige Rolle spielen. Wir beginnen mit der Integration über t : Gemäß Gl. (47) aus Anhang II stellt der Grenzwert dieses Integrals für t → ∞ die Fourier-Transformierte der HeavisideSprungfunktion dar; genauer gilt (wir setzen t − t = τ) t
lim ∫ dτ ei(E i −E)τ/ℏ = ℏ [π δ(E i − E) + iP (
t→∞
0
1 )] Ei − E
(25)
Es ist nicht unbedingt notwendig, t gegen unendlich gehen zu lassen, um Gl. (25) bei der Berechnung von (24) verwenden zu können. Es reicht aus, wenn ℏ/t sehr viel kleiner als die „Breite“ ℏ∆ von K(E), d. h. wenn t sehr viel größer als 1/∆ ist; wieder ergibt sich die Bedingung (14). Wenn diese erfüllt ist, lässt sich der Ausdruck (24) nach Gl. (25) schreiben ∞
K(E) i π − K(E = E i ) − P ∫ dE ℏ ℏ Ei − E 0
(26)
•
1378 | Ergänzung DXIII
Sein erster Term ist nach Gl. (16) einfach gleich −Γ/2. Wir setzen ∞
δE = P ∫ 0
K(E) dE Ei − E
(27)
womit sich für das Zweifachintegral (24) ergibt −
Γ δE −i 2 ℏ
(28)
Wenn wir in Gl. (23) b i (t ) durch b i (0) = 1 ersetzen, wird also diese Gleichung [solange die Ungleichung (14) erfüllt ist] zu d Γ δE b i (t) = − − i dt 2 ℏ
(29)
Die Lösung von Gl. (29) mit der Anfangsbedingung (21a) ist b i (t) = 1 − (
Γ δE +i )t 2 ℏ
(30)
Offensichtlich gilt dieses Ergebnis nur, wenn |b i (t)| in der Nähe von eins liegt, d. h. wenn gilt t≪
1 , Γ
t≪
ℏ δE
(31)
Wir finden hier die andere Gültigkeitsbedingung (11) für die Störungstheorie erster Ordnung wieder. Mit Gl. (30) lässt sich die Wahrscheinlichkeit 𝒫ii (t) = |b i (t)|2 dafür, dass sich das System zur Zeit t noch im Zustand |φ i ⟩ befindet, leicht berechnen. Unter Vernachläs sigung von Termen in Γ2 und δE2 erhalten wir 𝒫ii (t) = 1 − Γt
(32)
Alle in Kapitel XIII erhaltenen Ergebnisse lassen sich dann aus Gl. (23) ableiten, wenn b i (t ) durch b i (0) ersetzt wird. Diese Gleichung erlaubte uns auch die Einführung des Parameters δE, dessen physikalische Bedeutung weiter unten diskutiert wird [δE trat bei unseren Überlegungen in Kapitel XIII nicht auf, weil wir uns nur mit der Berech nung der Wahrscheinlichkeit |b i (t)|2 und nicht mit der der Wahrscheinlichkeitsampli tude b i (t) selbst befasst hatten].
4 Eine zweite Näherungsmethode Wir erhalten eine bessere Näherung, wenn wir in Gl. (23) b i (t ) statt durch b i (0) durch b i (t) ersetzen. Um das zu zeigen, berechnen wir zunächst das Integral über E auf der
Zerfall eines diskreten Zustands in ein Kontinuum |
1379
•
rechten Seite der streng gültigen Gl. (23). Es ergibt sich dann eine Funktion von E i und t − t , ∞
g(E i , t − t ) = −
1 ∫ dE K(E) ei(E i −E)(t−t )/ℏ ℏ2
(33)
0
die offensichtlich nur dann ungleich null ist, wenn t − t sehr klein ist. In Gl. (33) integrieren wir ein Produkt von K(E), das sich mit E langsam ändert (Abb. 1), mit einer Exponentialfunktion, deren Periode in Bezug auf die Variable E gleich 2πℏ/(t − t ) ist. Wenn wir die Werte von t und t so wählen, dass diese Periode sehr viel kleiner als die Breite ℏ∆ von K(E) ist, durchläuft diese Funktion zahlreiche Oszillationen und ihr Integral über E ist vernachlässigbar. Der Betrag von g(E i , t − t ) ist folglich für t − t ≈ 0 groß und wird für t − t ≫ 1/∆ vernachlässigbar. Diese Eigenschaft besagt, dass für beliebige t nur die Werte von b i (t ) auf der rechten Seite von Gl. (23) einen merklichen Beitrag liefern, für die t sehr nahe bei t liegt (t − t ≤ 1/∆). Nach Ausführung der Integration über E wird diese rechte Seite t
∫ g(E i , t − t ) b i (t) d t
(34)
0
und wir sehen, dass das Auftreten von g(E i , t − t ) die Beiträge von b i (t ) praktisch eliminiert, wenn t − t ≫ 1/∆ gilt. Die Ableitung ddt b i (t) hat also nur ein sehr kurzes „Gedächtnis“ für die vorherge henden Werte von b i (t) zwischen 0 und t. Sie hängt eigentlich nur von den Werten von b i für Zeiten unmittelbar vor t ab, und das gilt für alle t. Mit Hilfe dieser Eigenschaft können wir die Integrodifferentialgleichung (23) in eine Differentialgleichung über führen. Wenn b i (t) über ein Zeitintervall der Größenordnung 1/∆ nur wenig variiert, machen wir nur einen kleinen Fehler, wenn wir in Gl. (34) b i (t ) durch b i (t) ersetzen. Das ergibt t
b i (t) ∫ g(E i , t − t ) dt = − ( 0
δE Γ + i ) b i (t) 2 ℏ
(35)
[um die rechte Seite dieser Gleichung zu erhalten, verwendeten wir, dass das Integral von g(E i , t − t ) über t nach Gl. (33) gleich dem Zweifachintegral (24) ist, das wir in § 3 berechnet haben]. Nun ist nach den Ergebnissen in § 3 (wie wir auch später sehen werden) das für die Zeitentwicklung von b i (t) charakteristische Zeitintervall von der Größe 1/Γ oder ℏ/δE. Die Gültigkeitsbedingung für Gl. (35) lautet dann Γ≪∆,
δE/ℏ ≪ ∆
was wir bereits vorausgesetzt hatten [s. Ungleichung (17)].
(36)
•
1380 | Ergänzung DXIII
In guter Näherung kann Gl. (23) für beliebige t also geschrieben werden δE d Γ b i (t) = − ( + i ) b i (t) dt 2 ℏ
(37)
deren Lösung unter Beachtung von Gl. (21a) offensichtlich lautet b i (t) = e−Γt/2 e−iδE t/ℏ
(38)
Es lässt sich zeigen, dass die Entwicklung von Gl. (38) in erster Ordnung in Γ und δE Gl. (30) ergibt. Bemerkung: Wir haben keine obere Grenze für t eingeführt. Andererseits ist das in Gl. (35) auftretende Integral t ∫0 g(E i , t − t ) dt nach § 3 nur für t ≫ 1/∆ gleich −(Γ/2 + iδE/ℏ). Für kleine Zeiten treten in dieser Theorie also dieselben Probleme wie bei der Störungstheorie auf; ihr entscheidender Vorteil ist ihre Gültigkeit für lange Zeiten.
Setzen wir nun den Ausdruck (38) für b i (t) in Gl. (20) ein, so erhalten wir eine ein fache Gleichung, die uns die Bestimmung der Wahrscheinlichkeitsamplitude b(α, t) des Zustands |α⟩ ermöglicht: t
b(α, t) =
1 ⟨α | W | φ i ⟩ ∫ e−Γt /2 ei(E−E i −δE)t /ℏ dt iℏ
(39)
0
d. h. b(α, t) =
⟨α | W | φ i ⟩ 1 − e−Γt/2 ei(E−E i −δE)t/ℏ ℏ (E − E i − δE)/ℏ + iΓ/2
(40)
Gleichungen (38) und (40) beschreiben den Zerfall des Anfangszustands bzw. das „Auffüllen“ der Endzustände |α⟩. Wir wollen nun den physikalischen Gehalt dieser Gleichungen genauer untersuchen.
5 Physikalische Diskussion 5-a Lebensdauer des diskreten Zustands Nach Gl. (38) gilt 𝒫ii (t) = |b i (t)|2 = e−Γt
(41)
𝒫ii (t) sinkt daher irreversibel von 𝒫ii (0) = 1 ab und geht für t → ∞ gegen null (Abb. 2). Man sagt, der Anfangszustand habe eine endliche Lebensdauer τ; τ steht dabei für die in Abb. 2 eingezeichnete Zeitkonstante 1 τ= (42) Γ Dieses irreversible Verhalten steht im krassen Gegensatz zu den Oszillationen des Sys tems mit zwei diskreten Zuständen, zwischen denen Resonanzkopplung besteht.
•
Zerfall eines diskreten Zustands in ein Kontinuum | 1381
Abb. 2: Verlauf der Wahrscheinlichkeit, das System zur Zeit t im diskreten Zustand |φ i ⟩ zu finden. Es ergibt sich ein exponentieller Abfall e−Γt , dessen Tangente im Ursprung durch Fermis goldene Regel wiedergegeben wird (diese Tangente ist durch die gestrichelte Linie angedeutet).
5-b Verschiebung des diskreten Niveaus Wenn wir von den b i (t) auf die c i (t) übergehen [s. Gl. (B-8) aus Kapitel XIII], erhalten wir aus Gl. (38) c i (t) = e−Γt/2 e−i(E i +δE)t/ℏ
(43)
Ohne Kopplung W hätten wir c i (t) = e−iE i t/ℏ
(44)
Zusätzlich zum exponentiellen Abfall e−Γt/2 erzeugt die Kopplung mit dem Kontinuum also eine Verschiebung der Energie des diskreten Zustands von E i nach E i + δE, womit wir die Interpretation der in § 3 eingeführten Größe δE gefunden haben. Wir wollen den Ausdruck (27) für δE genauer analysieren. Dazu setzen wir die Definition (13) von K(E) ein und erhalten ∞
δE = P ∫ 0
dE ∫ dβ ρ(β, E) |⟨β, E | W | φ i ⟩|2 Ei − E
(45)
oder unter Verwendung von Gl. (4) und wenn man ⟨β, E| durch ⟨α| ersetzt, δE = P ∫ dα
|⟨α| W | φ i ⟩|2 Ei − E
(46)
Ein Zustand |α⟩ des Kontinuums, für den E ≠ E i ist, liefert daher zu diesem Inte gral den Beitrag |⟨α| W | φ i ⟩|2 Ei − E
(47)
Wir erkennen hierin einen bekannten Ausdruck aus der stationären Störungstheorie wieder [s. Gl. (B-14) aus Kapitel XI]: Der Quotient (47) stellt die Energieverschiebung des Zustands |φ i ⟩ aufgrund der Kopplung mit dem Zustand |α⟩ in zweiter Ordnung in W dar. Die Energie δE ist somit die Summe der Verschiebungen, die mit den ver schiedenen Kontinuumszuständen |α⟩ zusammenhängen. Die Zustände |α⟩ mit E = E i
•
1382 | Ergänzung DXIII
könnte man zunächst für problematisch halten. Durch das Auftreten des Hauptteils P in Gl. (46) kompensiert jedoch der Beitrag der Zustände |α⟩, die unmittelbar über |φ i ⟩ liegen, den der unmittelbar darunter liegenden. Wir fassen zusammen: 1. Die Kopplung von |φ i ⟩ mit den Zuständen |α⟩ derselben Energie des Kontinu ums ist verantwortlich für die endliche Lebensdauer von |φ i ⟩ (die Funktion δ(E i − E) aus Gl. (25) geht in den Ausdruck für Γ ein). 2. Die Kopplung von |φ i ⟩ mit den Zuständen |α⟩ unterschiedlicher Energien ver ursacht eine Energieverschiebung des Zustands |φ i ⟩. Sie lässt sich mit der stationären Störungstheorie berechnen (was nicht von vornherein klar war). Bemerkung: Für die spontane Emission eines Photons durch ein Atom ist δE die Verschiebung des betrachte ten atomaren Niveaus aufgrund der Kopplung mit dem Kontinuum von Endzuständen (ein Atom in einem anderen diskreten Zustand in Gegenwart eines Photons). Die Differenz zwischen den Verschiebungen der Zustände 2s1/2 und 2p1/2 des Wasserstoffatoms ist der Lamb-Shift (s. Er gänzung KV , § 3-d-δ und Kapitel XII, Bemerkung 4 in § C-3-b).
5-c Energieverteilung der Endzustände Wenn der diskrete Zustand einmal zerfallen ist, d. h. für t ≫ 1/Γ, gehört der Endzu stand des Systems zum Kontinuum von Zuständen |α⟩. Es ist interessant, die Energie verteilung der möglichen Endzustände zu untersuchen. Bei der spontanen Emission eines Photons durch ein Atom entspricht sie beispielsweise der des Photons, das das Atom bei seinem Übergang aus dem angeregten in ein niedrigeres Niveau emittiert (natürliche Breite von Spektrallinien).
Abb. 3: Energieverteilung der Endzustände, die ein System nach dem Zerfall des diskreten Zustands annimmt. Es ergibt sich eine Lorentz-Verteilung um E i + δE (Energie des diskre ten Zustands, korrigiert um die Verschiebung δE aufgrund der Kopplung mit dem Kontinu um). Je kleiner die Lebensdauer τ des diskreten Zustands ist, desto breiter ist die Verteilung (Energie-Zeit-Unschärferelation).
Zerfall eines diskreten Zustands in ein Kontinuum | 1383
•
Für t ≫ 1/Γ ist die Exponentialfunktion, die im Zähler von Gl. (40) auftritt, prak tisch gleich null. Es gilt dann |b(α, t)|2
t≫1/Γ
∼
|⟨α | W | φ i ⟩|2
1 (E − E i − δE)2 + ℏ2 Γ2 /4
(48)
|b(α, t)|2 ist eine Wahrscheinlichkeitsdichte. Die Wahrscheinlichkeit, das System nach dem Zerfall in einer Gruppe von Endzuständen zu finden, die durch die Interval le dβ f und dE f um β f bzw. E f gegeben werden, lässt sich direkt aus der Beziehung (48) bestimmen: Es ist d𝒫(β f , E f , t) = |⟨β f , E f | W | φ i ⟩|2 ρ(β f , E f )
1 dβ f dE f (49) (E − E i − δE)2 + ℏ2 Γ2 /4
Da |⟨β f , E f | W | φ i ⟩|2 ρ(β f , E f ) bei der Änderung von E f in einem Intervall der Breite ℏΓ praktisch konstant bleibt, wird die Änderung der Wahrscheinlichkeitsdichte in Bezug auf E f im Wesentlichen durch die Funktion 1 (E f − E i − δE)2 + ℏ2 Γ2 /4
(50)
bestimmt und hat somit die in Abb. 3 dargestellte Form. Die Energieverteilung der End zustände weist ein Maximum bei E f = E i + δE auf, d. h. wenn die Endzustandsenergie gleich der um die Verschiebung δE korrigierten Energie des Anfangszustands |φ i ⟩ ist. Die Energieverteilung hat die Form einer Lorentz-Kurve mit der Breite ℏ Γ, der soge nannten natürlichen Breite der Zustände |φ i ⟩. Es tritt daher eine Energiedispersion der Endzustände auf; je größer ℏ Γ ist (d. h. je kleiner die Lebensdauer τ = 1/Γ des diskreten Zustands ist), desto größer ist die Dispersion. Genauer gilt ∆E f = ℏΓ =
ℏ τ
(51)
Wir machen erneut auf die Analogie zwischen Gl. (51) und der Energie-Zeit-Unschärfe relation aufmerksam. Bei einer Kopplung W kann der Zustand |φ i ⟩ nur während einer beschränkten Zeit von der Größe seiner Lebensdauer τ beobachtet werden. Wenn wir seine Energie durch die Messung im Endzustand des Systems bestimmen wollen, kann die Unschärfe ∆E des Ergebnisses nicht sehr viel kleiner als ℏ/τ sein.
Referenzen und Literaturhinweise Originalartikel: Weisskopf und Wigner (2.33).
•
1384 | Ergänzung EXIII
Ergänzung EXIII Stochastische zeitabhängige Störung. Relaxation 1 1-a 1-b 1-c 1-d 2 2-a 2-b 2-c 3
Entwicklung des Dichteoperators | 1385 Stochastische Wechselwirkung. Korrelationszeit | 1386 Entwicklung eines einzelnen Systems | 1388 Entwicklung des Spin-Ensembles | 1391 Allgemeine Mastergleichung für Relaxation | 1392 Relaxation eines Spin-1/2-Ensembles | 1395 Darstellung der Operatoren. Isotrope Störung | 1395 Longitudinale Relaxation | 1397 Transversale Relaxation | 1401 Schlussfolgerungen | 1407
Wir kommen in dieser Ergänzung auf das Problem aus Kapitel XIII, § D zurück, be handeln es aber genauer und etwas allgemeiner. Statt eines einzigen Systems unter suchen wir ein Ensemble von Quantensystemen, die einer äußeren zufälligen Störung unterworfen sind. So eine Situation findet man häufig in Experimenten zur Magnet resonanz, in denen man die Gesamt-Magnetisierung eines Spinensembles misst, in dem jeder einzelne Spin ein kleines magnetisches Moment hat. Dies können z. B. die Kernspins eines Gases sein. Wenn die Gasteilchen sich bewegen, stoßen sie mit Fremd körpern zusammen, entweder im Inneren des Gasvolumens oder an den Wänden des Behälters. Wir haben in Kapitel XIII, § D erwähnt, dass Fremdteilchen, die selbst ein magnetisches Moment tragen, bei Stößen den Kernspin eines Gasatoms in seiner Rich tung verändern können. Dies wird durch eine Störung beschrieben, die nur kurz (über die Stoßzeit) andauert und von zufälliger (stochastischer) Natur ist, denn das magne tische Moment der Fremdteilchen zeigt in irgendeine unkontrollierte Richtung. Das Spin-Ensemble ist also ständig einer Summe von zufälligen Störungen unterworfen, die sich schnell in Betrag und Vorzeichen ändern, was gerade bedeutet, dass diese eine sehr kurze Korrelationszeit haben. Ein weiteres Beispiel für eine stochastische Störung liefern Experimente, in denen ein Ensemble von Atomen mit dem elektromagnetischen Feld einer Lichtquelle spek troskopiert wird. Es gibt mehrere Gründe dafür, dass die Wechselwirkung der Atome mit diesem elektromagnetischen Feld häufig von zufälliger Natur ist. Der erste Grund ist, dass die Felder vieler Lichtquellen rasche Fluktuationen in Frequenz und Phase aufweisen: deswegen muss das Feld selbst als ein stochastischer Prozess mit einer kurzen Korrelationszeit charakterisiert werden. Aber auch wenn die Lichtquelle ein fast perfekt monochromatischer Laser ist, führt die ungeordnete Bewegung der Atome wegen des Doppler-Effekts dazu, dass sie in ihrem mitbewegten Bezugssystem an ein Feld mit einer zufälligen Frequenz koppeln. Wenn man die Ausbreitung eines Licht strahls in dem Gas untersuchen möchte, steht man gleichermaßen vor der Aufgabe, eine große Anzahl von Atomen zu beschreiben, die einzeln je einer anderen zufälligen https://doi.org/10.1515/9783110638769-036
Stochastische zeitabhängige Störung. Relaxation
| 1385
•
Störung ausgesetzt sind. Es gibt viele weitere Beispiele und ähnliche Situationen, in denen schnell fluktuierende Störungen eine Rolle spielen. Wir wollen in dieser Ergänzung zeigen, wie man in der Quantenmechanik die Aus wirkungen einer solchen Störung auf ein Ensemble von Systemen behandeln kann. Unter Bedingungen, die allgemeiner sind als die aus Kapitel XIII, § D, werden wir se hen, dass die Kopplung an die stochastische Störung in dem Gesamtsystem zu dem Phänomen der „Relaxation“ führt, das sich deutlich von der Zeitentwicklung ohne zu fällige Elemente unterscheidet. Wie wir sahen, führt ja die Kopplung an eine konstan te oder periodische (sinusförmige) Störung zu Oszillationen in dem physikalischen System, und zwar mit den unter Berücksichtigung der Wechselwirkung berechneten Bohr-Frequenzen. In dieser Ergänzung zeigen wir dagegen, dass Relaxation mit einem exponentiellen Verhalten einhergeht, wobei die Exponenten reell sind und zu einer ir reversible Entwicklung führen. Es kann sich dabei um die Relaxation des Systems in Richtung des thermischen Gleichgewichts handeln, die sich deutlich von einer Oszil lation unterscheidet. In § 1 werden wir zunächst die Entwicklung des Dichteoperators untersuchen, der das Ensemble von Systemen charakterisiert. Wir leiten eine allgemeine Bewegungs gleichung für Relaxation her, die auf alle Fälle anwendbar ist, in denen die Korrela tionszeiten sehr kurz sind.* In § 2 wenden wir diese allgemeine Gleichung auf einen wichtigen Spezialfall an, nämlich ein Ensemble von Spin-1/2-Teilchen, die an statis tisch isotrope Störungen gekoppelt sind. Wir erarbeiten uns dabei die wichtigen Be griffe der „longitudinalen“ und „transversalen Relaxation“, die eine zentrale Rolle in vielen Experimenten zur Magnetresonanz spielen.
1 Entwicklung des Dichteoperators Wir betrachten ein Ensemble von N Quantensystemen, die mit dem Index q = 1, 2 . . . N abgezählt werden. Jedes einzelne System werde durch einen Dichteope rator (s. Ergänzungen EIII und EIV ) beschrieben, den wir mit ρ q (t) bezeichnen wollen. Der Dichteoperator, der die Statistik des gesamten Ensembles wiedergibt, ist dann ρ N (t) =
1 N ∑ ρ q (t) N q=1
(1)
Das einzelne System entwickelt sich gemäß einem Hamilton-Operator H q (t), den wir in zwei Terme zerlegen können: H q (t) = H0 + W q (t)
(2)
* Anm. d. Ü.: Diese Art von Bewegungsgleichung für den Ensemble-gemittelten Dichteoperator ist auch als Mastergleichung bekannt (engl.: master equation, frz.: équation pilote). Sie wird hier in der Markow-Näherung hergeleitet.
•
1386 | Ergänzung EXIII
Der erste Term H0 ist der allen Systemen gemeinsame Hamilton-Operator; er koppelt die Spins der Systeme z. B. an ein äußeres, homogenes Magnetfeld. Wir nehmen an, dass H0 zeitunabhängig ist. Der zweite Term W q (t) ist der Hamilton-Operator für die Wechselwirkung mit der zufälligen Störung; er hängt nicht nur von der Zeit, sondern auch von dem Index q des Systems ab. Die Eigenvektoren von H0 werden wir mit |φ n ⟩ bezeichnen: H0 | φ n ⟩ = E n | φ n ⟩
(3)
Ihre Energie-Eigenwerte definieren die Bohr-Frequenzen ω nk =
En − Ek ℏ
(4)
Die Matrixelemente der Störung bezüglich dieser Basis sind schließlich (q)
W nk (t) = ⟨φ n | W q (t) | φ k ⟩
(5)
1-a Stochastische Wechselwirkung. Korrelationszeit (q)
Betrachten wir einmal für feste Werte von n und k die N Funktionen W nk (t): wenn man q durchzählt, erhält man N verschiedene Realisierungen desselben Matrixele ments.¹ Durch das zufällige Herausgreifen von q wird also eine stochastische Funkti on W nk (t) der Zeit erzeugt. Sei P die Dimension des Zustandsraums, auf dem H0 wirkt, dann definieren die Indizes n und k insgesamt P2 solcher stochastischen Funktionen. Wir können diese stochastischen Funktionen als die Matrixelemente eines Operators W(t) auffassen, der ebenfalls eine zufällige Funktion der Zeit ist. Mit anderen Worten ist W(t) der Operator, den man erhält, wenn man aus den N Operatoren W q (t) einen Wert q zufällig herausgreift. In der Folge spielen die statistischen Eigenschaften dieses zufälligen Operators und seine Korrelationen eine zentrale Rolle. Die Menge aus N Systemen können wir auch als ein statistisches Ensemble von Realisierungen eines einzigen Systems auffassen: so ein Ensemble nennt man in der statistischen Mechanik ein „Gibbs-Ensemble“. Ein Mittelwert zu einem festen Zeit punkt über dieses Ensemble ist dann äquivalent zu der Mittelung über viele Zeitpunk te eines einzelnen Systems (Ergoden-Hypothese). Wir werden diese Mittelung mit ei nem Querstrich über dem Buchstaben W bezeichnen. Beginnen wir mit dem Mittelwert der Störung, den wir gleich Null annehmen wol len: W(t) = 0
d. h. :
W nk (t) = W kn (t) = 0
für alle k, n
(6)
1 Wir nehmen an, dass N eine sehr große Zahl ist. So enthält z. B. ein Kubikmillimeter eines Gases unter Standardbedingungen ungefähr 1016 Teilchen.
Stochastische zeitabhängige Störung. Relaxation
| 1387
•
Dies ist keine wirkliche Einschränkung, denn einen konstanten Mittelwert h = W(t) können wir einfach von der Störung abziehen und zu dem Operator H0 addieren. Weil die Matrixelemente W kn (t) und W nk (t) zueinander komplex konjugiert sind, ist ihr Produkt immer nicht-negativ, und der Mittelwert kann im Allgemeinen nicht ver schwinden. Die Stärke der Störung wird also durch den Mittelwert der Produkte cha rakterisiert W kn (t) W nk (t) = C0nk
(7)
Wir nehmen an, dass die stochastische Funktion (statistisch) stationär ist, so dass die se Varianz zeitunabhängig ist. Etwas allgemeiner können wir eine Reihe von „gekreuz ten“ Korrelationskoeffizienten definieren, die allesamt zeitunabhängig sind: W lp (t) W nk (t) = C0nk,lp
(8)
Eine stochastische Funktion der Zeit wird nicht nur durch ihren Mittelwert zu einem festen Zeitpunkt charakterisiert. Wie in Kapitel XIII, § D führen wir auch eine von zwei Zeiten t und t + τ abhängige Korrelationsfunktion ein W kn (t + τ) W nk (t) = C nk (τ)
(9)
Die Stationarität der stochastischen Funktionen bedeutet hier, dass C nk nur von der Zeitdifferenz τ abhängt und nicht von dem Zeitpunkt t. Wir haben also auch W kn (τ) W nk (0) = C nk (τ)
(10)
Per Definition nimmt die Funktion C nk (τ) einen positiven Wert bei τ = 0 an. Wenn die Zeitdifferenz τ immer mehr anwächst, wird die Korrelation zwischen W kn (τ) und W nk (0) verblassen, was bedeutet, dass C nk (τ) nach Null strebt. Dieses Abklingen findet auf einer charakteristischen Zeitskala statt, die wir „Korrelationszeit“ nennen wollen und mit τ c bezeichnen: W kn (t + τ)W nk (t) → 0
falls
τ ≫ τc
(11)
Entspricht die Störung etwa einem Stoß zwischen einem Atom und einem Fremdteil chen, dann ist es klar, dass sie sich von einem Stoß zum nächsten nicht mehr an ih ren Wert „erinnern“ kann; das Gedächtnis der Störung wird sogar kaum länger als die Dauer eines Stoßes sein. Es ist nun oft der Fall, dass Stoßzeiten sehr kurz sind: entsprechend häufig trifft man auf Situationen, in denen τc eine kleine Zeit ist. Diese Überlegungen können auch auf die gekreuzten Korrelationen von dem Typ in Gl. (8) verallgemeinert werden. Man verwendet oft ein Modell, in dem die Korrelationsfunktion C nk (τ) eine ab klingende Exponentialfunktion in der Zeitdifferenz τ ist:* W kn (t + τ)W nk (t) = C0nk e−τ/τc
(12)
* Anm. d. Ü.: Gleichung (12) gilt für τ ≥ 0. Wir werden später sehen, dass C nk (τ) eine gerade Funktion von τ ist, s. Gl. (56).
•
1388 | Ergänzung EXIII
Um die Notation zu vereinfachen, berücksichtigen wir hier nur eine einzige Korrelati onszeit τc , die unabhängig von k und n ist. Ohne Schwierigkeiten können etwas all gemeiner auch mehrere Korrelationszeiten eingeführt werden. Ähnliche Modelle wie in Gl. (12) beschreiben dann auch die gekreuzten Mittelwerte von zwei Matrixelemen ten [s. Gl. (8)]. So würde eine ganze Serie von Korrelationszeiten entstehen, die von vielen Indizes abhängen. In dem oben betrachteten Beispiel mit Stößen sind alle die se Zeiten von der Größenordnung her durch eine einzige Zeitskala bestimmt, nämlich die sehr kurze Stoßzeit. Als eine pragmatische Näherung wird man dann annehmen, dass sie ungefähr vergleichbar sind, und als Korrelationszeit τc die längste von ihnen verwenden.
1-b Entwicklung eines einzelnen Systems Wir untersuchen zunächst die Entwicklung eines einzigen Quantensystems (der In dex q wird festgehalten) vom Anfangszeitpunkt t i bis t. Dazu verwenden wir das Wech selwirkungsbild (Aufgabe 15 in Ergänzung LIII ), das wir hier noch einmal kurz wieder holen. α Wechselwirkungsbild Die Zeitentwicklung eines Dichteoperators ρ q (t) folgt der bekannten von NeumannGleichung, in der ein Kommutator vorkommt: iℎ
d ρ q (t) = [H0 + W q (t), ρ q (t)] dt
(13)
Auf der rechten Seite kann der Operator H0 eine schnelle Zeitentwicklung erzeugen. Wir nehmen an, dass der Operator W q (t) kleiner als H0 ist, so dass er nur zu einer langsameren Entwicklung führen kann. Wir werden ihn also mit einer geeigneten Nä herung behandeln. 1. Betrachten wir als Erstes den Fall, dass der Wechselwirkungs-Hamilton-Opera tor W q (t) verschwindet. Die Entwicklung von ρ q (t) wird dann von H0 allein erzeugt. Es ist bequem, dies durch den unitären Operator U0 (t, t i ) für die Zeitentwicklung von t i bis t auszudrücken (s. Ergänzung FIII ). Er ergibt sich aus dem Hamilton-Operator H0 : U0 (t, t i ) = e−iH0 (t−t i )/ℎ
(14)
Dieser Operator ist unitär: U0† (t, t i ) U0 (t, t i ) = U0 (t, t i ) U0† (t, t i ) = 𝟙
für alle t i und alle t.
(15)
Falls also W q (t) verschwindet, ergibt sich einfach ρ q (t) = U0 (t, t i ) ρ q (t i ) U0† (t, t i )
(16)
Stochastische zeitabhängige Störung. Relaxation
| 1389
•
Dies können wir leicht überprüfen, indem wir nach t ableiten: die Ableitung von U0 (t, t i ) erzeugt einen Term −iH0 ρ q (t)/ℎ, und die von U0† (t, t i ) erzeugt +iρ q (t)H0 /ℎ. Beide zusammen ergeben den Kommutator mit H0 aus Gl. (13), so dass ρ q (t) in Gl. (16) in der Tat die von Neumann-Gleichung erfüllt. Dies ist auch der Fall für die An fangsbedingung bei t = t i , weil der Operator U0 (t, t i ) dann mit dem Eins-Operator zusammenfällt [s. Gl. (14)]. Wir können U0 (t, t i ) auch verwenden, um eine unitäre Transformation auf ρ q (t) anzuwenden: der transformierte Dichteoperator ρ̃ q (t) sei wie folgt definiert: ρ̃ q (t) = U0† (t, t i ) ρ q (t) U0 (t, t i )
(17)
In diese Definition können wir die Relation (16) einsetzen: wir erkennen links und rechts das Operator-Produkt (15) wieder, so dass sich alle Entwicklungsoperatoren wegheben. So erhalten wir ρ̃ q (t) = ρ q (t i )
(18)
Dies zeigt, dass ρ̃ q (t) gar nicht von der Zeit abhängt, solange die Kopplung W q (t) ver schwindet. 2. Verschwindet nun die Störung W q (t) nicht länger, können wir die unitäre Transformation (17) immer noch auf den Dichteoperator anwenden. Diese Operation wird im Allgemeinen die Transformation in das „Wechselwirkungsbild“ (engl.: inter action picture) genannt.* In diesem Bild (oder: von diesem Standpunkt aus) wird die Zeitentwicklung des Dichteoperators ρ̃ q (t) allein durch die Wechselwirkung W q (t) erzeugt. Gemäß den anfangs gemachten Annahmen wird sich ρ̃ q (t) also viel langsa mer entwickeln als der Dichteoperator ρ q (t), der sich auch aufgrund von H0 ändert. Wegen dieser Eigenschaft können wir Näherungen leichter anwenden, und so gehen wir jetzt auch vor. Leiten wir also den Ausdruck (17) nach t ab, erhalten wir die Ableitungen der unitären Operatoren rechts und links von ρ q (t) und die von ρ q (t) selber. Man fasst zusammen: iℎ
d d ρ̃ q (t) = −H0 ρ̃ q (t) + ρ̃ q (t)H0 + U0† (t, t i ) iℎ ρ q (t) U0 (t, t i ) dt dt = − [H0 , ρ̃ q (t)] + U0† (t, t i ) [H0 + W q (t), ρ q (t)] U0 (t, t i )
(19)
Für einen beliebigen Operator A können wir den Kommutator allerdings wie folgt um formen: U0† (t, t i ) [A, ρ q (t)] U0 (t, t i ) = [U0† (t, t i ) A U0 (t, t i ), U0† (t, t i ) ρ q (t) U0 (t, t i )]
(20)
* Anm. d. Ü.: Vor dem Wechsel befanden wir uns im sogenannten „Schrödinger-Bild“, das im Kontext der Magnetresonanz dem „Labor-Bezugssystem“ zugeordnet wird.
•
1390 | Ergänzung EXIII
weil nämlich U0 unitär ist. (Das kann man einfach überprüfen, indem man den Kom mutator ausschreibt und die Beziehung U0 U0† = 𝟙 ausnutzt.) Mit dieser Umformung finden wir auf der rechten Seite von Gl. (20) den transformierten Dichteoperator ρ̃ q (t) aus Gl. (17) wieder. Mit A = H0 + W q (t) erhalten wir, weil H0 ja mit U0 vertauscht: U0† (t, t i ) [H0 + W q (t), ρ q (t)] U0 (t, t i ) = [H0 , ρ̃ q (t)] + [U0† (t, t i ) W q (t) U0 (t, t i ), ρ̃ q (t)]
(21)
̃q (t), der sich aus W q (t) durch die Hier erscheint der unitär transformierte Operator W selbe Transformation (17) ergibt, die wir beim Übergang ins Wechselwirkungsbild für ρ q (t) verwendet haben: ̃q (t) = U † (t, t i ) W q (t) U (t, t i ) W 0 0
(22)
Eingesetzt in Gleichung (19), heben sich die Kommutatoren mit H0 weg, und es ergibt sich schließlich die einfache Bewegungsgleichung iℎ
d ̃q (t), ρ̃ q (t)] ρ̃ q (t) = [W dt
(23)
Hier tauchen nur noch Operatoren im Wechselwirkungsbild auf. Der Hamilton-Opera tor H0 ist nicht mehr explizit vorhanden (geht aber implizit in die unitäre Transforma tion ein, die in das Wechselwirkungsbild führt). Offenbar entwickelt sich ρ̃ q (t) nicht ̃ q (t) verschwindet [s. Gl. (18)]. in der Zeit, falls die Störung W β Näherungsweise Berechnung der Zeitentwicklung Integrieren wir Gl. (23) einmal über die Zeit, ergibt sich t
1 ̃ q (t ), ρ̃ q (t )] ρ̃ q (t) = ρ̃ q (t i ) + ∫dt [W iℎ
(24)
ti
Dies Ergebnis erneut in die rechte Seite von Gl. (23) eingesetzt, führt uns auf t
d ̃q (t), ρ̃ q (t i )] + 1 ∫dt [W ̃q (t), [ W ̃q (t ), ρ̃ q (t )]] iℎ ρ̃ q (t) = [W dt iℎ
(25)
ti
Diese Gleichung mit dem doppelten Kommutator gilt exakt. Weil ρ̃ q (t ) unter dem In tegral auftritt, haben wir es mit einer Integro-Differentialgleichung für den Dichteope rator ρ̃ q zu tun. Es ist allerdings möglich, eine Näherung anzuwenden, die aus Gl. (25) eine ge wöhnliche Differentialgleichung macht. Wenn nämlich die Störung W q in dem Zeitin tervall von t i bis t klein bleibt, dann erhalten wir eine gute Näherung für die Änderung
Stochastische zeitabhängige Störung. Relaxation
|
1391
•
von ρ̃ q , wenn wir ρ̃ q (t ) unter dem Integral durch seinen Wert zu einem beliebigen Zeit punkt in diesem Intervall ersetzen. Wählen wir den Zeitpunkt t i , dann erhalten wir die Differentialgleichung t
iℎ
d ̃ q (t), ρ̃ q (t i )] + 1 ∫dt [W ̃q (t), [ W ̃q (t ), ρ̃ q (t i )]] ρ̃ q (t) = [W dt iℎ
(26)
ti
Die Zeitverzögerung τ kann über die Substitution τ = t − t
(27)
eingeführt werden. Teilen wir auf beiden Seiten durch iℎ, ergibt sich: t−t i
d 1 ̃ 1 ̃ q (t), [ W ̃ q (t − τ), ρ̃ q (t i )]] ̃ q (t i )] − 2 ∫ dτ [W ρ̃ q (t) = [W q (t), ρ dt iℎ ℎ
(28)
0
1-c Entwicklung des Spin-Ensembles Wir wollen nun die Bewegungsgleichung für den Dichteoperator ρ N (t) herleiten, der das Ensemble der N Systeme beschreibt. Dazu gehen wir wie in Gl. (17) ins Wechsel wirkungsbild über: ρ̃ N (t) = U0† (t, t i )ρ N (t)U0 (t, t i )
(29)
(Der Rückweg über die inverse Transformation zum gewöhnlichen Dichteoperator im Schrödinger-Bild stellt keine Schwierigkeit dar.) Per Definition (1) erhalten wir die Zeit entwicklung von ρ̃ N (t), indem wir Gleichung (28) über den Index q summieren und durch die Anzahl N der Systeme teilen. Anders ausgedrückt: wir müssen auf beiden Seiten von Gl. (28) das Ensemble-Mittel nehmen. Diese Operation wäre in voller Allge meinheit schwierig durchzuführen, ohne weitere Annahmen über die Eigenschaften der hier auftretenden stochastischen Funktionen zu machen. Wir werden annehmen, dass die Entwicklung von ρ̃ N (t) durch Zeitkonstanten charakterisiert ist, die viel län ger als die Korrelationszeit τc ist.* Weiter unten im § 1-d-β werden wir sehen, was das konkret für die Parameter bedeutet, die die Wechselwirkung bestimmen, und die Kon sistenz der Rechnung überprüfen. Zu jedem Zeitpunkt t können wir also einen früheren Zeitpunkt t i wählen, und zwar derart, dass t − t i sehr groß im Vergleich zu der Korrelationszeit τ c ist, aber klein gegenüber der charakteristischen Zeitskala, auf der sich der Dichteoperator im Wech selwirkungsbild entwickelt. Wir werden die Eigenschaften der stochastischen Störung
* Anm. d. Ü.: Dies ist auch als „Markow-Bedingung“ bekannt.
•
1392 | Ergänzung EXIII
aus den Gl. (11) und (12) ausnutzen. Betrachten wir den ersten Kommutator auf der rechten Seite der Bewegungsgleichung (28): er enthält Operatoren zu verschiedenen Zeiten, die nicht miteinander korreliert sein können. In der Tat hängt ρ̃ q (t i ) von den ̃q zu Zeiten früher als t i ab, während W ̃q (t) zu einer Zeit aus Werten der Störung W gewertet wird, deren Abstand von t i groß gegenüber τc ist. Unter der Ensemble-Mit telung verschwindet dieser Term, denn wir hatten in Gl. (6) angenommen, dass die Mittelwerte der Matrixelemente der Störung null sind. Im zweiten Term erkennen wir ̃q (t) W ̃q (t−τ) ρ̃ q (t i ), in dieser unter dem Integral das Ensemble-Mittel eines Produkts W oder einer anderen Reihenfolge. Zu dem Integral tragen effektiv nur Werte der Verzöge rung τ bei, die von der Ordnung der Korrelationszeit τc sind. Haben wird etwa τ ≫ τ c , ̃ q (t − τ) also auch von ρ̃ q (t i ) unabhängig, so dass der ̃ q (t) sowohl von W dann ist W Mittelwert des Produkts verschwindet. Daraus ergeben sich zwei Konsequenzen: zum ̃q -Faktoren korreliert, so dass wir einen ist der Dichteoperator ρ̃ q (t i ) nicht mit den W seinen Mittelwert separat berechnen können; dies läuft darauf hinaus, ρ̃ q (t i ) durch ρ̃ N (t i ) zu ersetzen. Zum anderen können wir die obere Grenze t − t i des Integrals ins Unendliche schieben, ohne signifikant seinen Wert zu ändern. Mit diesen Überlegun gen erhalten wir ∞
d 1 ̃ ̃ (t − τ), ρ̃ N (t i )]] ρ̃ N (t) = − 2 ∫ dτ [ W(t), [W dt ℎ
(30)
0
wobei der Strich über den Operatoren die Ensemble-Mittelung bedeutet. (Diese Mitte lung betrifft nur die Störung W, nicht aber den Dichteoperator.) Eine zusätzliche Vereinfachung ergibt sich noch daraus, dass wir t − t i als kurz ge genüber der Zeitskala angenommen haben, auf der sich ρ̃ N entwickelt. In guter Nähe rung dürfen wir also ρ̃ N (t i ) unter dem Integral durch ρ̃ N (t) ersetzen, was uns schließ lich auf folgende Bewegungsgleichung führt: ∞
1 d ̃ ̃ (t − τ), ρ̃ N (t)]] ρ̃ N (t) = − 2 ∫ dτ [ W(t), [W dt ℎ
(31)
0
Dies ist die gesuchte Mastergleichung in der Markow-Näherung (Anm. d. Ü.), die die Relaxation des Dichteoperators im Wechselwirkungsbild beschreibt Es reicht aus, die Transformation (29) zu verwenden, um die entsprechende Bewegungsgleichung im Schrödinger-Bild zu erhalten.
1-d Allgemeine Mastergleichung für Relaxation Die oben erhaltenen Ergebnisse wenden wir nun an und berechnen die zeitliche Ent wicklung der Matrixelemente des Dichteoperators.
Stochastische zeitabhängige Störung. Relaxation
| 1393
•
α Entwicklung der Matrixelemente des Dichteoperators Wir werten die Bewegungsgleichung (31) in der Basis der Eigenzustände |φ n ⟩ von H0 aus und finden so gekoppelte Gleichungen für die Matrixelemente des Dichteopera tors. Wegen der Beziehung [s. Gl. (22)] ̃q (t) | φ k ⟩ = eiω nk (t−t i ) ⟨φ n | W q (t) | φ k ⟩ ⟨φ n | W
(32)
mit der Bohr-Frequenz ω nk = (E n − E k )/ℏ erhalten wir ∞
d 1 ⟨φ n | ρ̃ N (t) | φ k ⟩ = − 2 ∫ dτ dt ℎ 0
∑ {eiω nr (t−t i ) e−iω pr τ ⟨φ n | W(t) | φ p ⟩⟨φ p | W(t − τ) | φ r ⟩⟨φ r | ρ̃ N (t) | φ k ⟩ p,r
− ei(ω np +ω rk )(t−t i ) e−iω rk τ ⟨φ n | W(t) | φ p ⟩⟨φ r | W(t − τ) | φ k ⟩⟨φ p | ρ̃ N (t) | φ r ⟩ − ei(ω np +ω rk )(t−t i ) e−iω np τ ⟨φ n | W(t − τ) | φ p ⟩⟨φ r | W(t) | φ k ⟩⟨φ p | ρ̃ N (t) | φ r ⟩ + eiω pk (t−t i ) e−iω pr τ ⟨φ n | ρ̃ N (t) | φ p ⟩⟨φ p | W(t − τ) | φ r ⟩⟨φ r | W(t) | φ k ⟩}
(33)
mit analog definierten Bohr-Frequenzen ω nr usw. Weil die stochastischen Funktionen auf der rechten Seite stationär sind [s. Gl. (9)], dürfen wir die beiden Argumente von W um eine beliebige Zeit verschieben; wir können also t durch τ und t − τ durch 0 ersetzen. Wir kehren vom Wechselwirkungsbild in das gewohnte Bild (d. h. in das Schrö dinger-Bild) zurück und schreiben die Wirkung der unitären Transformation (17) aus. In der |φ n ⟩-Basis führt das auf: ⟨φ n | ρ N (t) | φ k ⟩ = e−iω nk (t−t i ) ⟨φ n | ρ̃ N (t) | φ k ⟩
(34)
und durch Ableiten folgt daraus d d ⟨φ n | ρ N (t) | φ k ⟩ = −iω nk ⟨φ n | ρ N (t) | φ k ⟩ + e−iω nk (t−t i ) ⟨φ n | ρ̃ N (t) | φ k ⟩ dt dt
(35)
Die allgemeinen Bewegungsgleichungen für die Relaxation eines Quantensystems sind damit: ∞
d 1 1 ⟨φ n | ρ N (t) | φ k ⟩ = (E n − E k ) ⟨φ n | ρ N (t) | φ k ⟩ − 2 ∫ dτ dt iℏ ℎ 0
∑ {e−iω pr τ ⟨φ n | W(τ) | φ p ⟩⟨φ p | W(0) | φ r ⟩⟨φ r | ρ N (t) | φ k ⟩ p,r
− e−iω rk τ ⟨φ n | W(τ) | φ p ⟩⟨φ r | W(0) | φ k ⟩⟨φ p | ρ N (t) | φ r ⟩ − e−iω np τ ⟨φ n | W(0) | φ p ⟩⟨φ r | W(τ) | φ k ⟩⟨φ p | ρ N (t) | φ r ⟩ + e−iω pr τ ⟨φ n | ρ N (t) | φ p ⟩⟨φ p | W(0) | φ r ⟩⟨φ r | W(τ) | φ k ⟩} (36)
•
1394 | Ergänzung EXIII
Ist P die Dimension des Zustandsraums, dann liefern die Gleichungen (33) oder (36) ein System von P2 gekoppelten Differentialgleichungen, die die Zeitentwicklung der Matrixelemente von ρ̃ N (t) oder ρ N (t) bestimmen. Die Koeffizienten in diesen Gleichun gen sind Integrale über die Korrelationsfunktionen der Störung, die für ein gegebenes physikalisches System im Prinzip bekannt sind. β Störung mit kurzem Gedächtnis. Markow-Näherung Überprüfen wir nun, unter welchen Bedingungen diese Rechnung angesichts der ge machten Näherungen konsistent ist. Wir erinnern uns an die allgemeine Forderung, dass es zu jedem Zeitpunkt t eine frühere Zeit t i derart gibt, dass das Intervall t − t i zwei Bedingungen genügt: es ist lang gegenüber der Korrelationszeit τ c und klein auf der Skala, auf der die Zeitentwicklung im Wechselwirkungsbild stattfindet. Wir schätzen also die Größenordnung der Zeitskala ab, auf der sich die Matrix elemente von ρ̃ N (t) entwickeln. Dazu bestimmen wir näherungsweise die rechte Seite von Gl. (33). Wir haben in Gl. (7) die Varianz eines Matrixelements W nk (t) eingeführt; sei H 2 die Größenordnung dieser Varianzen für alle Indizes n und k. Das Integral in Gl. (33) liefert wegen Gl. (12) ungefähr einen Faktor τc . Die Koeffizienten, die in Gl. (33) die Matrixelemente von ρ̃ N (t) multiplizieren, sind also größenordnungsmäßig −
H 2 τc ℎ2
(37)
Die Bewegungsgleichung (33) erzeugt also eine Zeitentwicklung auf einer Zeitskala von der Ordnung ℎ2 /H 2 τc . Sie muss groß gegenüber τ c sein, damit unsere Rechnun gen in sich stimmig sind. Dies liefert die Ungleichung H 2 τ2c ≪ ℎ2
(38)
Wir haben damit die Bedingung für die Gültigkeit der durchgeführten Näherung ge funden: die Korrelationszeit (das Gedächtnis der Störung) muss kurz gegenüber der für ihre Stärke charakterischen Zeit ℎ/H sein. Die Störung fluktuiert dann oft in Wert (und Vorzeichen) hin und her, bevor sie signifikant das System beeinflussen kann. Die se Bedingung wird oft „Linieneinengung durch Bewegung“ genannt (engl.: motional line narrowing); den Grund für diese Bezeichnung lernen wir im § 2-c-δ kennen.* Die Ausdrücke (33) oder (36) definieren ein lineares System von Differentialglei chungen erster Ordnung; es lässt die Besetzungen (die Diagonalelemente des Dichte operators) in einen Zustand relaxieren, in dem sie alle gleich groß sind. Es ist nicht be sonders schwierig, dies in voller Allgemeinheit auszurechnen; allerdings sind die Glei chungen aufwändig aufzuschreiben, vor allem weil man es mit so vielen Indizes zu tun hat. Im Allgemeinen koppeln die Besetzungen ⟨φ n | ρ N (t) | φ n ⟩ nicht nur an andere
* Anm. d. Ü.: Als ein weiterer Name ist „Markow-Bedingung“ bzw. „Markow-Näherung“ geläufig.
Stochastische zeitabhängige Störung. Relaxation
| 1395
•
Besetzungen, sondern auch an nicht-Diagonalelemente ⟨φ n | ρ N (t) | φ k ⟩ mit n ≠ k. In der Tat können im Prinzip alle Matrixelemente des Dichteoperators untereinander ge koppelt sein. Man muss zusätzliche Näherungen einführen, um in diesen Gleichungen diejenigen Terme zu identifizieren, die die Eigenschaften des Relaxationsprozesses im Wesentlichen bestimmen. Aus diesem Grund beschränken wir uns in dieser Ergänzung auf einen einfachen konkreten Fall, aus dem wir freilich schon eine ganze Reihe von physikalischen Be griffen herausarbeiten können: wir untersuchen die Relaxation eines Ensembles von Spin-1/2-Teilchen, die an eine statistisch isotrope Störung koppeln.
2 Relaxation eines Spin-1/2-Ensembles Wir betrachten ein Ensemble von Spin-1/2-Teilchen, z. B. die Probe in einem Expe riment zur Magnetresonanz, das wir schon in der Einleitung erwähnten. Wir werden sehen, dass die Bewegungsgleichungen in diesem Fall eine einfache Form annehmen, die man anschaulich leicht interpretieren kann. Es gibt genau zwei Zustände |φ n ⟩, die wir mit |+⟩ und |−⟩ bezeichnen wollen. Ihre Energiedifferenz ist: E+ − E− = ℎω0
(39)
Es ist weiterhin bequem, den Dichteoperator der Spins über den Erwartungswert ih res Drehimpulses auszudrücken. Dies läuft darauf hinaus, diesen Operator durch die Pauli-Matrizen darzustellen (s. Ergänzung EIV , § 5).
2-a Darstellung der Operatoren. Isotrope Störung Alle Operatoren der voranstehenden Gleichungen wirken nun auf einen zwei-dimen sionalen Raum, sie sind also als Matrizen darstellbar, die man als Linearkombinatio nen der drei Pauli-Matrizen σ x , σ y und σ z sowie der Einheitsmatrix erhält, vgl. die Beziehung (22) in Ergänzung AIV . α Transformation der Operatoren Wir schreiben also den Dichteoperator in der Form ρ N (t) =
1 [𝟙 + M(t) ⋅ σ] 2
(40)
wobei σ der Vektor-Operator ist, dessen Komponenten die drei Pauli-Matrizen sind. Die Komponenten des Vektors M(t) sind drei reelle Zahlen, die wir verwenden, um den Dichteoperator ρ N (t) zu parametrisieren. Der Vektor M(t) ist freilich nichts anderes als der Mittelwert der Spins in der Probe, ist also proportional zur Gesamt-Magnetisierung
•
1396 | Ergänzung EXIII
des Spin-Ensembles. Dies sieht man in der Tat aus der Formel (11) in Ergänzung AIV , σ j σ k = i ∑ ε jkl σ l + δ jk 𝟙
(41)
l
Hier ist ε jkl null, wenn zwei Indizes zusammenfallen, gleich +1, falls das Tripel jkl eine gerade Permutation von xyz ist, und gleich −1 für eine ungerade Permutation. Die Spur eines Produkts aus Pauli-Matrizen verschwindet also, es sei denn, die bei den Faktoren sind dieselbe Matrix (die Spur hat dann den Wert 2). Der Mittelwert des Operators σ j (j = x, y, z) ist also ⟨σ j ⟩ (t) = Tr{σ j ρ N (t)} = = M j (t)
1 2 Tr {(σ j ) M j (t)} 2 (42)
Den Operator H0 schreiben wir in einer ähnlichen Form wie in Gl. (12) aus Ergän zung FIV :² H0 =
ℎω0 σz 2
(43)
Dieser Operator beschreibt die Wirkung eines Magnetfelds parallel zur z-Achse, das die Spins mit der Winkelfrequenz ω0 um diese Achse rotieren lässt, wie in dem Ex periment zur Magnetresonanz, das wir in der Ergänzung FIV besprochen haben. Der unitäre Operator U0 (t, t i ) aus Gl. (14) ist also ein Dreh-Operator für die Spins (s. Er gänzung AIX ) um dem Drehwinkel ω0 (t − t i ); der adjungierte Operator U0† (t, t i ) liefert die Drehung um den umgekehrten Winkel. Der Operator für die Wechselwirkung kann in analoger Weise geschrieben werden W(t) =
1 h(t) ⋅ σ 2
(44)
wobei h(t) eine zufällige vektorwertige Funktion ist, die die von den Spins „gespür ten“ Störungen beschreibt. Ihre statistischen Eigenschaften behandeln wir genauso wie im § 1-a, als wir W(t) als einen stochastischen Operator eingeführt haben, den man durch eine zufällige Wahl aus den N Realisierungen des Index q erhält, der die einzelnen Systeme durchzählt. Die Funktion h(t) liefert also die Statistik der drei Ma gnetfeldkomponenten, die zu einem Zeitpunkt t auf die Spins wirken. Im Gegensatz zu dem Magnetfeld, das der Hamilton-Operator H0 beschreibt, hat der Vektor h(t) ei ne zufällige Richtung, nicht notwendigerweise parallel zur z-Achse. Seine Komponen ten notieren wir als h k (t) mit k = x, y, z. Ihr Ensemble-Mittel verschwindet offenbar,
2 Ohne Beschränkung der Allgemeinheit lassen wir einen Beitrag zu H 0 proportional zum Eins-Ope rator weg. Dieser würde die Kommutatoren ohnehin nicht ändern, in denen der Hamilton-Operator vorkommt.
Stochastische zeitabhängige Störung. Relaxation
|
1397
•
h k (t) = 0. Die Korrelationsfunktionen schreiben wir wie in Gl. (9) und (12) in folgender Form: h k (t + τ) h l (t) = Q kl (τ)
(45)
wobei die Q kl (τ) Funktionen von τ sind, die rasch auf Null abklingen, wenn τ ver gleichbar oder größer als τ c ist. Hier beschreibt Q kk (τ) die Autokorrelation der Kom ponente h k (t) der Störung, während Q kl (τ) für k ≠ l die gekreuzten (oder gemischten) Korrelationen zwischen orthogonalen Komponenten charakterisiert. β Statistisch isotropes Magnetfeld Wir führen jetzt eine weitere Annahme ein, nämlich dass die auf die Spins wirkende Störung statistisch isotrop sei. Dies bedeutet, dass in den Korrelationen von h(t) keine Richtung des Raums bevorzugt ist. Es folgt daraus, dass die Korrelationsfunktionen Q kk (τ) entlang der drei Achsen (also für k = x, y, z) dieselben sind. Fassen wir die Q kl (τ) als Komponenten einer 3 × 3-Matrix auf, bedeutet Isotropie, dass diese Matrix invariant unter Drehungen ist. Deswegen ist sie notwendigerweise proportional zur Einheitsmatrix. Es sind also nicht nur die Diagonalelemente Q kk untereinander gleich, es müssen auch die gekreuzten Korrelationen Q kl (für k ≠ l) verschwinden. Zusammen mit der Stationarität der Störung führt diese Annahme auf h k (t + τ)h l (t) = δ kl Q(τ)
(46)
Ein häufig verwendetes Modell ist eine exponentielle Korrelation, so dass Q(τ) als Funktion von τ mit der Zeitkonstante τc abklingt. Dann hat man h k (t + τ)h l (t) = δ kl [h k (0)]2 e−τ/τc
(47)
2-b Longitudinale Relaxation Wir kommen auf die Bewegungsgleichung des Dichteoperators zurück und betrach ten das Diagonalelement für |φ n ⟩ = |φ k ⟩ = |+⟩. Der erste Term in Gl. (36) verschwindet (die Besetzungen verändern sich nicht unter H0 ). In den weiteren Termen ersetzen wir W(τ) und W(0) durch die Kopplung (44) an das Magnetfeld. Wir haben es dann mit Matrixelementen der Paulimatrizen σ k und σ l zu tun, die mit dem statistischen Mit tel (46) des störenden Magnetfelds multipliziert werden. Wegen des Faktors δ kl dort genügt es, in den Operatoren W(τ) und W(0) jeweils dieselbe Pauli-Matrix mitzuneh men. α Berechnung der Relaxationszeit Nehmen wir zweimal die Matrix σ z , dann treten in der Summation über die ZustandsIndizes p und r in Gl. (36) nur die Zustände |φ p ⟩ = |φ r ⟩ = |+⟩ auf, denn diese Pauli-
•
1398 | Ergänzung EXIII
Matrix koppelt die Zustände |+⟩ und |−⟩ nicht. Man überzeugt sich sofort davon, dass die vier Terme unter dem Integral sich gegenseitig wegheben. Wählen wir zweimal die Matrix σ x , ist es anders, denn diese Matrix hat nicht-dia gonale Elemente (beide sind eins). In Gl. (36), zweite Zeile, finden wir für n = k = + notwendigerweise |φ p ⟩ = |−⟩ und |φ r ⟩ = |+⟩, während es in der letzten Zeile umge kehrt ist (|φ p ⟩ = |+⟩ und |φ r ⟩ = |−⟩). In der dritten und vierten Zeile ergibt sich beides Mal |φ p ⟩ = |φ r ⟩ = |−⟩. Berücksichtigen wir noch den Vorfaktor 1/2 aus Gl. (44), erhal ten wir insgesamt folgenden Ausdruck: ∞
−
1 ∫ dτ h x (t)h x (t + τ) {eiω0 τ ⟨+ | ρ N (t) | +⟩ − e−iω0 τ ⟨− | ρ N (t) | −⟩ 4ℎ2 0 −eiω0 τ ⟨− | ρ N (t) | −⟩ + e−iω0 τ ⟨+ | ρ N (t) | +⟩}
(48)
oder zusammengefasst ∞
1 ∫ dτ h x (t)h x (t + τ) cos ω0 τ [⟨− | ρ N (t) | −⟩ − ⟨+ | ρ N (t) | +⟩] 2ℎ2
(49)
0
Der Ausdruck, der sich aus zwei Matrizen σ y ergibt, hat dieselbe Struktur, bis auf zwei Matrixelemente +i und −i, deren Produkt wieder eins ist. Wir kommen also wieder auf das Ergebnis (49), in dem h x durch h y zu ersetzen ist. Für die Relaxation der Besetzung erhalten wir schließlich eine sogenannte Raten gleichung in folgender Form: d 1 ⟨+ | ρ N (t) | +⟩ = [⟨− | ρ N (t) | −⟩ − ⟨+ | ρ N (t) | +⟩] dt 2T1
(50)
wobei die Rate ∞
1 1 = ∫ dτ [h x (t)h x (t + τ) + h y (t)h y (t + τ)] cos ω0 τ T1 ℎ2
(51)
0
die Wahrscheinlichkeit pro Zeit für Übergänge zwischen den Zuständen |+⟩ und |−⟩ angibt. Die Zeitskala T1 wird „longitudinale Relaxationszeit“ genannt; wir diskutieren ihre Eigenschaften weiter unten. Schreiben wir noch das Ergebnis für die andere Besetzung, das diagonale Matrix element ⟨− | ρ N (t) | −⟩, auf. Die Rechnung ist praktisch dieselbe und man erhält:* d 1 [⟨+ | ρ N (t) | +⟩ − ⟨− | ρ N (t) | −⟩] ⟨− | ρ N (t) | −⟩ = dt 2T1
(52)
* Anm. d. Ü.: Die Summe der Wahrscheinlichkeiten ⟨− | ρ N (t) | −⟩+⟨+ | ρ N (t) | +⟩ ist also konstant, wie es auch sein muss.
Stochastische zeitabhängige Störung. Relaxation
| 1399
•
Wegen Gl. (42) haben wir damit auch die Bewegungsgleichung für die z-Komponente der Magnetisierung gefunden: d d d M z (t) = Tr {σ z ρ N (t)} = [⟨+ | ρ N (t) | +⟩ − ⟨− | ρ N (t) | −⟩] dt dt dt
(53)
Subtrahieren wir Gl. (50) und Gl. (52), erhalten wir also die einfache Gleichung d 1 M z (t) = − M z (t) dt T1
(54)
Dies zeigt, dass die longitudinale Komponente von M(t) (parallel zum statischen Ma gnetfeld) exponentiell mit der Zeitkonstanten T1 abklingt, sie verschwindet also für t → ∞. Die Relaxationsrate 1/T1 hängt von den Korrelationsfunktionen der beiden transversalen Komponenten der Störung ab (senkrecht zur z-Achse). Dies ist physika lisch anschaulich, denn nur die Operatoren σ x und σ y können Übergänge zwischen den Spin-Zuständen |+⟩ und |−⟩ induzieren. β Einfluss der spektralen Dichte Das Verhalten der Relaxationsrate 1/T1 in Gl. (51) als Funktion von ω0 können wir im Licht der Ergebnisse aus Kapitel XIII, § C-2 verstehen. In der Tat sahen wir dort, dass eine periodische (sinusförmige) Störung zwei Zustände |+⟩ und |−⟩ um so wirksamer koppelt, je näher ihre Frequenz ω an der Bohr-Frequenz ω0 ist, die sich aus der Ener giedifferenz der beiden Niveaus ergibt. In unserem Fall ist die Störung keine gleich mäßige Sinusfunktion, sondern eine zufällige Funktion. Wir rechnen also damit, dass die Übergangsamplitude mit ihrer Fourier-Komponente an der Frequenz ω0 zusam menhängt, und zwar berechnet anhand der Störung, die zwischen den Zeitpunkten 0 und t ≫ τ c wirkt. Um dies genauer zu überprüfen, führen wir die Fourier-Transformierte I kk (ω) der Korrelationsfunktion ein, die man auch „spektrale Dichte“ nennt:* +∞
I kk (ω) =
1 ∫ dτ e−iωτ h k (t)h k (t − τ) √2π −∞ +∞
(55)
1 h k (t)h k (t − τ) = ∫ dω eiωτ I kk (ω) √2π −∞
Weil das zufällige Magnetfeld statistisch stationär ist, haben wir h k (t)h k (t − τ) = h k (t + τ)h k (t) = h k (t)h k (t + τ)
(56)
und deswegen ist die Korrelationsfunktion gerade in τ. Die Fourier-Transformierte ei ner geraden und reellen Funktion ist nun aber selbst gerade und reell (Anhang I), und
* Anm. d. Ü.: Gl. (55) ist der Satz von Wiener und Chintschin, s. Fußnote auf S. 1312.
•
1400 | Ergänzung EXIII
deswegen gilt I kk (−ω) = I kk (ω)
(57)
Den Ausdruck (51) können wir dann wie folgt ausschreiben: ∞
+∞
0
−∞
1 1 = ∫ dτ ∫ dω eiωτ [I xx (ω) + I yy (ω)] [eiω0 τ + e−iω0 τ ] T1 2√2πℎ2
(58)
Wegen Gl. (57) bekommen wir denselben Integranden, wenn τ und ω beide das Vor zeichen wechseln. Das Integral über dτ läuft dann von 0 bis −∞ und das über dω von +∞ bis −∞. Drehen wir die Integrationsgrenzen für beide Integrale um, kompensie ren sich zwei Faktoren −1, und wir erhalten eine äquivalente Darstellung: 0
+∞
−∞ ∞
−∞ +∞
−∞
−∞
1 1 = ∫ dτ ∫ dω eiωτ [I xx (ω) + I yy (ω)] [eiω0 τ + e−iω0 τ ] T1 2√2πℎ2 =
1 ∫ dτ ∫ dω eiωτ [I xx (ω) + I yy (ω)] [eiω0 τ + e−iω0 τ ] √ 4 2πℎ2
(59)
Hier ist die zweite Zeile einfach das arithmetische Mittel von Gl. (58) und der ersten Zeile. Das Integral über dτ ergibt sofort ∞
∫ dτ [ei(ω+ω0 )τ + ei(ω−ω0 )τ ] = 2π [δ(ω + ω0 ) + δ(ω − ω0 )]
(60)
−∞
Verwenden wir erneut Gl. (57), ergeben die beiden Terme δ(ω + ω0 ) und δ(ω − ω0 ) denselben Beitrag zu dem dω-Integral in Gl. (59). Damit erhalten wir schließlich 1 π I xx (ω0 ) + I yy (ω0 ) =√ [ ] T1 2 ℎ2
(61)
Die Übergangswahrscheinlichkeit ist also proportional zur Summe der spektralen Dichten der beiden Störungen, die Übergänge zwischen den Zuständen |+⟩ und |−⟩ bewirken können. Wie zu erwarten war, sind es genau die resonanten Komponenten an der (Winkel-)Frequenz ω0 , die die Übergänge erzeugen. γ Exponentielle Korrelationen Ein häufig vorkommender Fall ist, wie oben bemerkt, eine magnetische Störung, deren Korrelationsfunktionen einfach exponentiell abklingen, wie in Gl. (47). Das
Stochastische zeitabhängige Störung. Relaxation
| 1401
•
dτ-Integral (51) kann man dann elementar ausführen: ∞
∞
∫ dτ h x (t)h x (t + τ) [eiω0 τ + e−iω0 τ ] = [h x (0)]2 ∫ dτ e−τ/τc [eiω0 τ + e−iω0 τ ] 0
0
= − [h x (0)]2 [ = [h x (0)]2
1 1 + ] iω0 − 1/τ c −iω0 − 1/τ c 2τc
1 + (ω0 τc )2
(62)
Zusammen mit dem Beitrag der Magnetfeld-Komponente h y erhalten wir τc 1 1 2 = 2 [ [h x (0)]2 + [h y (0)] ] T1 ℎ 1 + (ω0 τc )2
(63)
Die longitudinale Relaxationsrate hängt von ω0 also in Form einer Lorentz-Kurve ab. Dieses Verhalten ist in Abb. 1 skizziert. Die Relaxationsrate ist maximal bei ω0 = 0 (das statische Magnetfeld verschwindet) und hat dort den Wert 1 1 2 = [ [h x (0)]2 + [h y (0)] ] τ c T1 (ω0 = 0) ℎ2
(64)
Mit den hier verwendeten Bezeichnungen können wir die Bedingung (38) für die Li nieneinengung durch Bewegung so formulieren: 2
[h x,y (0)] (τc )2 ≪ ℎ2
(65)
und daraus folgt 1 1 ≪ T1 τc
(66)
Wir finden also in der Tat, dass die Zeitskala T1 , die für die Relaxation der Magnetisie rung charakteristisch ist, viel länger als die Korrelationszeit τc ist. Unsere Rechnung ist also konsistent, denn mit dieser Annahme hatten wir die durchgeführten Näherun gen gerechtfertigt.
2-c Transversale Relaxation Wir untersuchen nun, wie sich das nicht-diagonale Element des Dichteoperators zwischen den Zuständen |+⟩ und |−⟩ entwickelt.* Wir beobachten zunächst, dass
* Anm. d. Ü.: Dieses Matrixelement wird auch „Kohärenz“ genannt, weil es ein Maß für eine quan tenmechanische Superposition im Unterschied zu einem statistischen Gemisch der beiden Zustände liefert.
•
1402 | Ergänzung EXIII
Abb. 1: Abhängigkeit der longitudinalen Relaxationsrate 1/T1 von der Differenz ℎω 0 zwischen den beiden Energieniveaus (links) und von der Korrelationszeit τ c (rechts). Die Rate ist proportional zur Spektraldichte der Störung an der Frequenz ω0 , die sich als Funktion von ω 0 wie eine Lorentz-Kurve verhält, s. Gl. (63). Für große Frequenzen (oder eine lange Korrelationszeit), ω 0 ≫ 1/τ c , fällt die spektrale Dichte der Störung proportional zu 1/ω20 ab, so dass man durch Vergrößern von ω 0 die Relaxation stark unterdrücken kann. Hält man ω 0 fest und verlängert die Korrelationszeit τ c , erhält man zunächst eine lineare Abhängigkeit der Relaxationswahrscheinlichkeit – sie ist proportional zur Zeitskala τ c , auf der die Störung kohärent wirken kann. Die Rate weist ein Maximum bei τ c = 1/ω 0 auf und fällt dann mit 1/τ c ab, weil die Fourier-Komponenten an der Frequenz ω 0 immer schwächer werden.
⟨+ | ρ N (t) | −⟩ und das komplex konjugierte Element ⟨− | ρ N (t) | +⟩ die transversalen Komponenten M x (t) und M y (t) der Magnetisierung M(t) (senkrecht zum statischen Feld) charakterisieren. In der Tat können wir mit Hilfe der Pauli-Matrizen (s. z. B. die Relationen (2) in Ergänzung AIV ) ausrechnen, dass folgende komplexe Linearkombi nation auf eine einfache Matrix führt σ x − iσ y = (
0 2
0 ) 0
(67)
so dass ⟨σ x − iσ y ⟩ = Tr {(σ x − iσ y ) ρ N (t)} = 2⟨+ | ρ N (t) | −⟩
(68)
Wir haben andererseits im § 2-a, Gl. (42), gesehen, dass die drei Komponenten der Magnetisierung M(t) den Mittelwerten der Pauli-Matrizen entsprechen. Damit haben wir M x (t) − iM y (t) = ⟨+ | ρ N (t) | −⟩ 2
(69)
Der Realteil des nicht-diagonalen Matrixelements ⟨+ | ρ N (t) | −⟩ liefert also sofort die Magnetisierungs-Komponente M x (t)/2 und sein (negativer) Imaginärteil liefert M y (t)/2. Damit wir die Entwicklung dieses Matrixelements unter dem Hamilton-Opera tor H0 nicht mitnehmen müssen [der erste Term mit E n − E k in Gl. (36)], werden wir die Rechnungen im Wechselwirkungsbild ausführen. Wir benutzen also die Relaxati onsgleichung (33), um die Zeitentwicklung von ⟨+ | ρ̃ N (t) | −⟩ zu bestimmen. In dieser
Stochastische zeitabhängige Störung. Relaxation
| 1403
•
Gleichung ersetzen wir die Wechselwirkungs-Operatoren W(t) und W(0) durch ih ren Ausdruck (44). Wie oben schon genügt es wegen der statistischen Isotropie der Störung, die Terme mitzunehmen, in denen dieselbe Komponente von h(t) in beiden Operatoren auftaucht. Wir beginnen mit den Komponenten h x (t) und h y (t) transver sal zum statischen Feld und behandeln die longitudinale Komponente h z (t) danach (§ 2-c-β). α Auswirkung der transversalen Störung Es geht hier um die Komponenten des Magnetfelds entlang der x- und y-Achse. 1. Das Störfeld h x (t) geht in Gl. (33) mit der Matrix σ x ein; ihre Matrixelemente sind allesamt nicht-diagonal und gleich eins. In jedem Matrixelement wird also der Ket |+⟩ auf den Bra ⟨−| abgebildet und umgekehrt, mit einem Vorfaktor +1. Weil wir uns für die Entwicklung von ⟨+ | ρ N (t) | −⟩ in Gl. (33) interessieren, haben wir n = +. Im ersten Term auf der rechten Seite wird dieser Index auf p = − und r = + abgebildet, wir finden also dasselbe Matrixelement ⟨+ | ρ̃ N (t) | −⟩ wieder. Die e-Funktionen liefern einen Faktor eiω0 τ . Dieselbe Struktur finden wir im vierten Term, denn nur die Indizes k = −, sowie r = + und p = − tragen bei; man erhält dasselbe Ergebnis. Mit dem Koeffizienten 1/2 aus Gl. (44) führt die Summe dieser beiden Terme auf ∞
−
1 ∫ dτ eiω0 τ h x (t)h x (t − τ)⟨+ | ρ̃ N (t) | −⟩ 2ℎ2
(70)
0
Die zweiten und dritten Terme in Gl. (33) verhalten sich anders; zwar erzwingt n = + den Wert p = −, während k = − auf r = + führt. Daraus ergibt sich aber das Ma trixelement ⟨− | ρ̃ N (t) | +⟩. Wir erhalten also eine Kopplung zwischen zwei komplex konjugierten Matrixelementen durch den Ausdruck ∞
−
e2iω0 (t−t i ) ∫ dτ e−iω0 τ h x (t)h x (t − τ)⟨− | ρ̃ N (t) | +⟩ 2ℎ2
(71)
0
2. Die y-Komponente der Störung trägt mit der Matrix σ y zu Gl. (33) bei, die eben falls nicht-diagonal ist, deren Matrixelemente aber diesmal die Werte ±i haben. Im ersten und vierten Term auf der rechten Seite von Gl. (33) erzeugt das einen Faktor (+i)(−i) = 1, was auch auf Gl. (70) führt. Im zweiten und dritten Term finden wir einen Faktor (±i)2 = −1, der im Vergleich zu Gl. (71) auf das entgegensetzte Vorzeichen führt. In der isotrop angenommenen Störung sind die Korrelationsfunktionen von h x (t) und h y (t) gleich, und deswegen heben sich ihre Beiträge gegenseitig auf. 3. Alles zusammengefasst erhalten wir als Beitrag zur Zeitableitung von ̃ ⟨+ | ρ N (t) | −⟩ ∞
1 − 2 ∫ dτ eiω0 τ [h x (t)h x (t − τ) + h y (t)h y (t − τ)] ⟨+ | ρ̃ N (t) | −⟩ 2ℎ 0
(72)
•
1404 | Ergänzung EXIII
Mit der Zerlegung eiω0 τ = cos(ω0 τ) + i sin(ω0 τ) und der Definition von T1 in Gl. (51), können wir für diesen Ausdruck auch schreiben 1 −[ + i∆] ⟨+ | ρ̃ N (t) | −⟩ (73) 2T1 wobei die Größe ∆ durch das Integral ∞
∆=
1 ∫ dτ sin (ω0 τ) [h x (t)h x (t − τ) + h y (t)h y (t − τ)] 2ℎ2
(74)
0
definiert ist. Seine physikalische Bedeutung diskutieren wir etwas weiter unten. β Auswirkung der longitudinalen Störung Die z-Komponente des zufälligen Magnetfelds klappt den Spin nicht um. In der ersten Zeile von Gl. (33) trägt nur die Index-Kombination n = p = r = + bei. Damit sind die e-Funktionen und die Matrixelemente von σ z allesamt gleich eins. In der vierten Zeile haben wir n = + und p = r = k = −, die Exponentialfunktionen liefern wieder nur einen Faktor eins, genauso wie das Produkt (−1)2 der Matrixelemente von σ z : wir erhalten denselben Beitrag. In der zweiten und dritten Zeile ist n = p = + und k = r = −, so dass die Exponentialfunktionen verschwinden, während die Matrixelemente sich zu −1 multiplizieren. Wegen ihres anderen Vorzeichens verdoppeln diese Zeilen den bereits berechneten Ausdruck. Wir erhalten schließlich den Ausdruck ∞
−
1 ∫ dτ h z (t)h z (t − τ)⟨+ | ρ̃ N (t) | −⟩ ℎ2
(75)
0
in dem wir einen Beitrag zur „transversalen Relaxationsrate“ identifizieren [s. unter Gl. (79)]: ∞
1 1 = ∫dτ h z (t)h z (t − τ) T2zz ℎ2
(76)
0
γ Physikalische Interpretation. Spektrale Dichte Wir fassen die Beiträge (73) und (75) zur Relaxation des nicht-diagonalen Matrixele ments des Dichteoperators zusammen und finden d 1 1 ⟨+ | ρ̃ N (t) | −⟩ = − [ + zz + i∆] ⟨+ | ρ̃ N (t) | −⟩ dt 2T1 T2
(77)
An dieser Stelle verlassen wir das Wechselwirkungsbild und kehren in das Labor system (gewöhnliches Schrödinger-Bild) zurück. Die Bewegungsgleichung (77) muss dann noch um den ersten Term auf der rechten Seite von Gl. (36) ergänzt werden; wir erhalten d 1 1 + + i (ω0 + ∆)] ⟨+ | ρ N (t) | −⟩ (78) ⟨+ | ρ N (t) | −⟩ = − [ dt 2T1 T2zz
Stochastische zeitabhängige Störung. Relaxation
|
1405
•
Die einzelnen Terme haben folgende physikalische Bedeutung. 1. Dämpfung Das Matrixelement des Dichteoperators, das die Magnetisierung in der xy-Ebene be schreibt, zerfällt in beiden Bildern mit einer Zeitkonstante T2 , die man die „transver sale Relaxationszeit“ nennt:* 1 1 1 = + T2 2T1 T2zz
(79)
Sie besteht aus zwei Beiträgen. – Der erste hängt direkt mit der longitudinalen Relaxation zusammen. Während sich die Verteilung der Besetzungen auf die beiden Niveaus + und − ändert, wird offenbar auch die Kohärenz zwischen ihnen zerstört. Dies geschieht mit derselben Rate, die direkt die Besetzungen in Gl. (50) ändert, und mit der halben Rate, die die Magnetisierung M z (t) relaxieren lässt [s. Gl. (54)]. Nur die transversalen An teile der Störung tragen zu diesem Prozess bei, denn sie induzieren die Übergän ge zwischen den Spin-Zuständen |+⟩ und |−⟩. Aus diesem Grund ist die spektrale Dichte an der Resonanzfrequenz ω = ω0 der relevante Parameter [s. Gl. (51)]. – Der zweite Beitrag in Gl. (79) hat seinen Ursprung allein in der longitudinalen Komponente der Störung. Wenn das Magnetfeld in dieser Richtung fluktuiert, dann verändert es die Energiedifferenz ℎω0 zwischen den Niveaus + und −. Wenn die Spins nun mit verschiedenen Geschwindigkeiten um die z-Achse präzedie ren, dann bilden ihre transversalen Komponenten einen „Fächer“, der sich im Lauf der Zeit immer weiter öffnet, so dass der aufsummierte Spin-Vektor kleiner wird.† Es ist anschaulich verständlich, dass deswegen die transversalen Kompo nenten des Gesamtspins kleiner werden. Wir halten fest, dass für die Rate dieses Prozesses die spektrale Dichte bei der Frequenz ω = 0 relevant ist [s. Gl. (76)]. 2. Frequenzverschiebung Der Gleichung (78) entnehmen wir, dass ∆ mit der Eigenfrequenz ω0 der Spinpräzes sion zusammengefasst werden kann. Die Störung verschiebt also die Frequenz der zeitlichen Entwicklung der nicht-diagonalen Elemente, zusätzlich zur Dämpfung, die mit der Relaxation einhergeht.
* Anm. d. Ü.: Man spricht in diesem Zusammenhang auch von den Zeitskalen für „Dekohärenz“ und „Dephasieren“. † Anm. d. Ü.: Wir haben rein fiktiv angenommen, dass die transversalen Komponenten der Spins zu einem Zeitpunkt alle in dieselbe Richtung zeigen. In der Praxis kann man so einen Zustand durch ein kurz gepulstes Magnetfeld erzeugen, das senkrecht zum statischen Feld polarisiert ist.
•
1406 | Ergänzung EXIII
Dieselbe Rechnung, die schon auf Gl. (58) geführt hat, liefert folgenden Ausdruck für die Frequenzverschiebung ∆: ∆=
∞
+∞
0
−∞
1 ∫ dτ ∫ dω eiωτ [I xx (ω) + I yy (ω)] [eiω0 τ − e−iω0 τ ] 4i√2πℎ2
(80)
Das dτ-Integral hier können wir ausführen [s. Anhang II, Gl. (2)]: ∞
1 ∫dτ [ei(ω+ω0 )τ − ei(ω−ω0 )τ ] i 0
= [P
1 1 −P ] − iπ [δ (ω + ω0 ) − δ (ω − ω0 )] ω + ω0 ω − ω0
(81)
Weil die spektralen Dichten I xx (ω) et I yy (ω) gerade in ω sind [s. Gl. (57)], heben sich die δ-Funktionen gegenseitig weg und die beiden Hauptwert-Terme addieren sich. So erhalten wir +∞
∆ = −√
I xx (ω) + I yy (ω) π 1 P ∫ dω 2 2ℎ ω − ω0
(82)
−∞
Im Unterschied zu der longitudinalen Relaxationszeit T1 hängt die Frequenzverschie bung nicht von der spektralen Dichte an der Resonanzfrequenz ω = ω0 ab. Ihre Bei träge stammen im Gegenteil gerade von den nicht-resonanten Frequenzen. δ Exponentielle Korrelationsfunktion Wir benutzen Gl. (47) und berechnen die Integrale (74) und (76). Zusammen mit der transversalen Relaxationsrate (63) finden wir so 1 τc 1 2 = [ [h x (0)]2 + [h y (0)] ] T1 ℎ2 1 + (ω0 τc )2 1 1 2 zz = 2 [h z (0)] τ c T2 ℎ
(63 ) (83)
sowie ∆=
1 ω0 τc 2 [h x (0)]2 + [h y (0)] 2 2ℎ 1 + (ω0 τc )2
(84)
Die magnetischen Fluktuationen haben bemerkenswerte Konsequenzen für die Rela xationszeit T2zz . Stellen wir uns ein Spin-Ensemble vor, in dem die Spins einem in homogenen Feld parallel zur z-Achse ausgesetzt ist, dessen Amplitude zeitlich kon stant ist, sich aber zufällig von einem zum nächsten Spins unterscheidet. Die Fluk tuation der Feldstärke in diesem Spin-Ensemble drücken wir durch die Varianz H des Hamilton-Operators aus. Starten die Spins mit einem gemeinsamen Zustand (mit ei ner festen Richtung), dann präzedieren ihre transversalen Komponenten mit unter schiedlichen Winkel-Geschwindigkeiten, so dass sie einen „Fächer“ bilden, der sich
Stochastische zeitabhängige Störung. Relaxation
| 1407
•
immer weiter öffnet. Der Mittelwert des transversalen Gesamtspins der Probe strebt dann nach Null auf einer Zeitskala von der Größenordnung ℎ/H. Wir erwarten also eine transversale Relaxationsrate von der Ordnung H/ℎ, die linear mit der typischen Stärke H der Störung wächst. Sind es aber zeitlich fluktuierende Felder, die auf jeden Spin wirken, dann sagt Gleichung (83) ein ganz anderes Verhalten voraus: die Rate 1/T2zz ≃ H 2 τc /ℎ2 ist nicht linear in der Amplitude H der Störung, sondern proportional zu ihrem Quadrat. Das Verhältnis der beiden Zeitskalen ist Hτc /ℎ, viel kleiner als eins, wenn die Bedin gung (38) für Linieneinengung durch Bewegung erfüllt ist. Die Relaxationszeit T2zz ist also viel länger als in dem Fall eines statischen zufälligen Felds. Dies ist um so aus geprägter, je kürzer die Korrelationszeit τ c ist: wir sehen daraus, dass es die schnelle zeitliche Variation der Störung ist, die die Relaxation verlangsamt. In Magnetresonanz-Experimenten haben die beobachteten Spektren eine Linien breite 1/T2 [s. Gl. (79)], die eine monoton wachsende Funktion der transversalen Rela xationsrate ist: je kürzer die Korrelationszeit, desto schmaler sind die Spektrallinien.³ Es ist in diesen Anwendungen oft so, dass die Fluktuationen der Störung dadurch ent stehen, dass die Spins sich zufällig durch ein inhomogenes Magnetfeld in der Probe bewegen. Wir schließen daraus, dass das Magnetresonanz-Spektrum um so engere Li nien hat, je schneller sich die Spins bewegen. Dies ist der Hintergrund des Begriffs „Li nieneinengung durch Bewegung“ (engl.: motional line narrowing). Man spricht auch von „extremer Einengung“ (extreme narrowing) und meint damit das Regime, in dem die Korrelationszeit so kurz ist, dass ω0 τc ≪ 1 gilt. In diesem Grenzfall liegen die longitudinale und transversale Relaxationszeit [s. Gl. (63 ) und (83)] sehr dicht bei einander. Wenn wir die Ausdrücke (63 ) und (84) vergleichen, stellen wir fest, dass die Rela xationsrate und die Frequenzverschiebung in völlig unterschiedlicher Weise von der Resonanzfrequenz ω0 abhängen: die erste Größe hat die Form einer Lorentz-Kurve mit einem Maximum bei ω0 τc = 0, die zweite ist dagegen maximal ω0 τc = 1. Dieses unterschiedliche Verhalten rührt daher, dass für die Frequenzverschiebung die nichtresonanten Komponenten der spektralen Dichte verantwortlich sind, wie bereits in § 2-c-γ besprochen.
3 Schlussfolgerungen Wir haben in der Einleitung viele Anwendungen erwähnt, in denen ein Ensemble von Quantensystemen einer Störung unterworfen ist, deren Korrelationszeit τc viel kürzer als die anderen für das System charakteristischen Zeitskalen ist. Mit einer Beschrei bung, die allgemeiner als in § D und § E von Kapitel XIII vorgeht, haben wir in dieser 3 Diese Spektren sind in Abb. 7 in Ergänzung FIV skizziert. Dabei haben wir angenommen, dass lon gitudinale und transversale Relaxationsrate zusammenfallen.
•
1408 | Ergänzung EXIII
Ergänzung ein Regime herausgearbeitet, in dem eine Störung nicht genug Zeit hat, um das System signifikant zu beeinflussen, weil die Zeitskala τ c so kurz ist. Die Stö rung führt dann nicht mehr zu etwas wie einer Rabi-Oszillation, sondern zu einem exponentiellen Abklingen (ohne Oszillationen) der Besetzungen, das durch eine Über gangsrate zwischen den Energieniveaus beschrieben wird. In Ergänzung DXIII haben wir ebenfalls eine Übergangsrate im Rahmen von Fer mis Goldener Regel abgeleitet. Dort war die Summe (Integration) über die Energien der Endzustände dafür verantwortlich, dass sich ein oszillierendes Verhalten in eine reel le, abklingende Exponentialfunktion verwandelt. Hier hat der zufällige, fluktuierende Charakter der Störung eine ähnliche Auswirkung und zwar, obwohl nur ein einziger Endzustand vorliegt, der eine genau definierte Energie hat. Als ein weiteres Ergebnis hat diese Ergänzung gezeigt, dass eine stochastische Störung auch die Frequenzen eines Systems verschiebt. Im Fall der Anregung eines optischen Übergangs (wie in Kapitel XIII, § E-3-b) handelt es sich dabei um „LichtVerschiebungen“ (engl. auch: AC Stark shift), die in der Atomphysik oft angewendet werden (s. Ergänzung CXX ).
Aufgaben |
1409
•
Ergänzung FXIII Aufgaben 1. Wir betrachten einen eindimensionalen harmonischen Oszillator mit der Masse m, der Frequenz ω0 und der Ladung q. Mit |φ n ⟩ und E n = (n + 1/2)ℏω0 bezeichnen wir die Eigenzustände bzw. Eigenenergien seines Hamilton-Operators H0 . Für t < 0 befinde sich der Oszillator im Grundzustand |φ0 ⟩. Bei t = 0 wird er einem elektromagnetischen „Puls“ der Dauer τ ausgesetzt. Die entsprechende Störung kann geschrieben werden {−qℰ X für 0 ≤ t ≤ τ W(t) = { 0 für t < 0 und t > τ { ℰ steht für die Amplitude des Feldes und X ist die Ortsobservable. Es sei 𝒫0n die Wahr scheinlichkeit, den Oszillator nach dem Puls im Zustand |φ n ⟩ zu finden. a) Man berechne 𝒫01 mit Hilfe der zeitabhängigen Störungstheorie erster Ordnung. Wie ändert sich 𝒫01 für festes ω0 mit τ? b) Man zeige, dass zur Bestimmung von 𝒫02 die zeitabhängige Störungstheorie min destens auf die zweite Ordnung ausgedehnt werden muss. Man berechne 𝒫02 . c) Man gebe die genauen Ausdrücke für 𝒫01 und 𝒫02 an, in denen der in Ergän zung FV verwendete Translationsoperator explizit auftritt. Anhand einer Potenz reihenentwicklung dieser Ausdrücke in ℰ bestätige man die Ergebnisse der vor hergehenden Fragen. 2. Man betrachte zwei Spins 1/2, S1 und S2 , die durch eine Wechselwirkung der Form a(t)S1 ⋅ S2 gekoppelt sind; a(t) ist dabei eine Funktion der Zeit, die für |t| gegen un endlich gegen null geht und nicht vernachlässigbare Werte (der Größenordnung a0 ) nur in einem Intervall der Breite τ um t = 0 annimmt. a) Bei t = −∞ befinde sich das System im Zustand |+, −⟩ (ein Eigenzustand von S1z und S2z mit den Eigenwerten +ℏ/2 bzw. −ℏ/2). Man berechne, ohne Näherungen zu machen, den Zustand des Systems bei t = +∞. Man zeige, dass die Wahrschein lichkeit 𝒫(+− → −+), das System bei t = +∞ im Zustand |−, +⟩ zu finden, nur von +∞ dem Integral ∫−∞ a(t) d t abhängt. b) Man berechne 𝒫(+− → −+) mit der zeitabhängigen Störungstheorie erster Ord nung. Man diskutiere anhand eines Vergleichs mit den Ergebnissen der vorigen Frage die Gültigkeit dieser Näherung. c) Man nehme nun an, dass die beiden Spins auch mit einem statischen Magnetfeld B0 parallel zur z-Achse in Wechselwirkung stehen. Der entsprechende ZeemanHamilton-Operator lautet H0 = −B0 (γ1 S1z + γ2 S2z ) wobei γ1 und γ2 die gyromagnetischen Verhältnisse der beiden Spins sind, die wir als verschieden annehmen wollen. https://doi.org/10.1515/9783110638769-037
•
1410 | Ergänzung FXIII Man nehme a(t) = a0 e−t /τ an. Man berechne 𝒫(+− → −+) mit der zeitabhängi gen Störungstheorie erster Ordnung. Für festes a0 und τ diskutiere man die Än derung von 𝒫(+− → −+) in Bezug auf B0 . 2
2
3. Zwei-Photonen-Übergänge zwischen nicht äquidistanten Niveaus Wir betrachten ein atomares Niveau mit dem Drehimpuls J = 1, das sich unter dem Einfluss konstanter elektrischer und magnetischer Felder befindet, die beide in z-Richtung weisen. Es lässt sich zeigen, dass sich drei nicht äquidistante Energie niveaus ergeben; zu ihnen gehören die Eigenzustände |φ M ⟩ von J z (M = −1, 0, +1) mit den Energien E M . Wir setzen E1 − E0 = ℏω0 , E0 − E−1 = ℏω0 (ω0 ≠ ω0 ). Außerdem ist das Atom einem Radiofrequenzfeld ausgesetzt, das mit der Fre quenz ω in der x, y-Ebene rotiert. Die entsprechende Störung lautet W(t) =
ω1 (J + e−iωt + J − eiωt ) 2
wobei ω1 eine zur Amplitude des rotierenden Feldes proportionale Konstante ist. a) Wir setzen (mit der Notation von Kapitel XIII) +1
|ψ(t)⟩ = ∑ b M (t) e−iE M t/ℏ |φ M ⟩ M=−1
Man schreibe das Differentialgleichungssystem auf, das die b M (t) erfüllen. b) Man nehme an, das System sei zur Zeit t = 0 im Zustand |φ−1 ⟩. Man zeige, dass zur Bestimmung von b 1 (t) mit Hilfe der zeitabhängigen Störungstheorie die Rech nung mindestens in zweiter Ordnung durchgeführt werden muss. Man berechne b 1 (t) in dieser Ordnung. c) Wie hängt die Wahrscheinlichkeit 𝒫−1,+1 (t) = |b 1 (t)|2 , das System zur Zeit t im Zustand |φ1 ⟩ zu finden, von ω ab? Man zeige, dass nicht nur für ω = ω0 und ω = ω0 , sondern auch für ω = (ω0 + ω0 )/2 eine Resonanz auftritt. Man gebe eine Teilchendeutung dieser Resonanz an. 4. Wir kehren zu Aufgabe 5 von Ergänzung HXI zurück und verwenden die dortige Notation: Man nehme an, das Feld B0 oszilliert mit einer Frequenz ω und kann in der Form B0 (t) = B0 cos ωt geschrieben werden. Weiter nehme man b = 2a an und setze voraus, dass ω keiner Bohr-Frequenz des Systems entspricht (Anregung außerhalb der Resonanz). Man führe den Suszeptibilitätstensor χ ein, dessen Komponenten χ ij (ω) definiert werden durch ⟨M i ⟩(t) = ∑ Re [χ ij (ω) B0j eiωt ] j
mit i, j = x, y, z. Mit Hilfe einer Methode entsprechend der in § 2 von Ergänzung AXIII berechne man χ ij (ω). Für ω = 0 bestätige man die Ergebnisse der Aufgabe 5 von Er gänzung HXI .
Aufgaben | 1411
•
5. Der Autler-Townes-Effekt Wir betrachten ein System mit drei Zuständen |φ1 ⟩, |φ2 ⟩ und |φ3 ⟩ und den Ener gien E1 , E2 und E3 . Man nehme E3 > E2 > E1 und E3 − E2 ≪ E2 − E1 an. Dieses System steht in Wechselwirkung mit einem Magnetfeld, das mit der Fre quenz ω oszilliert. Die Zustände |φ2 ⟩ und |φ3 ⟩ haben dieselbe Parität, die von |φ1 ⟩ ist dazu entgegengesetzt, so dass der Hamilton-Operator W(t) der Wechselwirkung mit dem oszillierenden Magnetfeld die Zustände |φ2 ⟩ und |φ3 ⟩ an |φ1 ⟩ koppeln kann. Man nehme an, dass W(t) in der Basis der drei Zustände |φ1 ⟩, |φ2 ⟩, |φ3 ⟩ (in dieser Reihenfolge angeordnet) durch die Matrix 0 (0 0
0 0 ω1 sin ωt
0 ω1 sin ωt ) 0
dargestellt wird, wobei ω1 eine Konstante proportional zur Amplitude des oszillieren den Feldes ist. a) Man setze (Notation von Kapitel XIII) 3
|ψ(t)⟩ = ∑ b i (t) e−iE i t/ℏ |φ i ⟩ i=1
Man schreibe das Differentialgleichungssystem auf, das die b i (t) erfüllen. b) Man nehme an, dass ω sehr nahe bei ω32 = (E3 − E2 )/ℏ liegt. Man verwende ent sprechende Näherungen wie in Ergänzung CXIII und integriere das vorstehende Gleichungssystem für die Anfangsbedingungen b 1 (0) = b 2 (0) = 1/√2 ,
b 3 (0) = 0
(man vernachlässige auf der rechten Seite der Differentialgleichungen die Terme, deren Koeffizienten e±i(ω+ω32)t sich mit der Zeit sehr rasch ändern, und behalte nur Terme, deren Koeffizienten konstant sind bzw. sich wie e±i(ω−ω32 )t nur sehr langsam ändern). c) Die Komponente D z des elektrischen Dipolmoments des Systems in z-Richtung wird in der Basis der drei Zustände |φ1 ⟩, |φ2 ⟩, |φ3 ⟩ (in dieser Reihenfolge) durch die Matrix 0 (d 0
d 0 0
0 0) 0
dargestellt, worin d eine reelle Konstante ist (D z ist ein ungerader Operator und kann nur Zustände verschiedener Parität verknüpfen). Man berechne ⟨D z ⟩(t) = ⟨ψ(t)|D z |ψ(t)⟩ unter Verwendung des in b) bestimmten Vektors |ψ(t)⟩.
•
1412 | Ergänzung FXIII Man zeige, dass die Zeitentwicklung von ⟨D z ⟩(t) durch eine Überlagerung sinus förmiger Terme gegeben wird. Man bestimme die Frequenzen ν k und die relativen Intensitäten π k dieser Terme. Dabei handelt es sich um die Frequenzen, die vom Atom absorbiert werden kön nen, wenn es einem oszillierenden elektrischen Feld parallel zur z-Achse ausge setzt wird. Man beschreibe die Veränderung dieses Absorptionsspektrums, wenn ω1 bei festem ω = ω32 von null beginnend ansteigt. Man zeige, dass durch das magnetische Feld, das mit der Frequenz ω32 /2π oszilliert, die Absorptionslinie des elektrischen Dipols mit der Frequenz ω21 /2π aufspaltet und dass der Abstand der beiden Komponenten des Dubletts proportional zur Amplitude des oszillie renden Magnetfelds ist (Autler-Townes-Dublett). Was geschieht, wenn bei festem ω1 die Differenz ω − ω32 geändert wird?
6. Streuung eines Teilchens in einem gebundenen Zustand. Formfaktor Wir betrachten ein Teilchen (a) in einem gebundenen Zustand |φ0 ⟩, beschrieben durch die Wellenfunktion φ0 (ra ), die um den Punkt O lokalisiert ist. Auf dieses Teil chen ist ein Strahl von Teilchen (b) mit der Masse m, dem Impuls ℏk i , der Energie E i = ℏ2 k2i /2m und der Wellenfunktion eiki ⋅rb /(2π)3/2 gerichtet. Jedes Teilchen (b) des Strahls wechselwirkt mit dem Teilchen (a). Die entsprechende potentielle Energie W hängt nur von der relativen Lage rb − ra der beiden Teilchen ab. a) Man berechne das Matrixelement ⟨a : φ0 ; b : k f | W(Rb − Ra ) | a : φ0 ; b : k i ⟩ von W(Rb − Ra ) zwischen zwei Zuständen, in denen Teilchen (a) im selben Zu stand |φ0 ⟩ ist und Teilchen (b) vom Zustand |k i ⟩ in den Zustand |k f ⟩ übergeht. Der Ausdruck für dieses Matrixelement sollte die Fourier-Transformierte W(k) des Potentials W(rb − ra ) enthalten: W(rb − ra ) =
1 ∫ W(k) eik⋅(rb −ra ) d3 k (2π)3/2
b) Man betrachte den Streuprozess, bei dem unter dem Einfluss der Wechselwir kung W Teilchen (b) in eine bestimmte Richtung gestreut wird, während Teil chen (a) nach der Streuung im selben Quantenzustand |φ0 ⟩ bleibt (elastische Streuung). Mit einer Methode analog zu der in Kapitel XIII (s. Bemerkung 2 in § C-3-b) be rechne man in der Bornschen Näherung den elastischen Streuquerschnitt für die Streuung von Teilchen (b) an Teilchen (a) im Zustand |φ0 ⟩. Man zeige, dass man zu diesem Streuquerschnitt gelangt, wenn man den Streu querschnitt für die Streuung am Potential W(r) (in der Bornschen Näherung) mit einem Faktor multipliziert, der den Zustand |φ0 ⟩ charakterisiert, dem sogenann ten Formfaktor.
Aufgaben |
1413
•
7. Ein einfaches Modell des photoelektrischen Effekts Wir betrachten das eindimensionale Problem eines Teilchens der Masse m, das sich in einem Potential der Form V(x) = −αδ(x) befindet, wobei α eine reelle positive Kon stante ist. Wir erinnern uns (s. Aufgabe 2 und 3 in Ergänzung KI ), dass es in diesem Potential einen einzigen gebundenen Zustand mit der negativen Energie E0 = −mα 2 /2ℏ2 gibt, zu dem eine normierte Wellenfunktion φ0 (x) = √mα/ℏ2 e−(mα/ℏ
2
)|x|
gehört. Zu jedem positiven Wert der Energie E = ℏ2 k 2 /2m gibt es andererseits zwei stationäre Wellenfunktionen, die einem von links bzw. einem von rechts einlaufenden Teilchen entsprechen. Der Ausdruck für die erste Eigenfunktion lautet z. B. 1 1 ikx −ikx ) für x < 0 { { { √2π (e − 1 + iℏ2 k/mα e χ k (x) = { iℏ2 k/mα { 1 { für x > 0 eikx { √2π 1 + iℏ2 k/mα a) Man zeige, dass χ k (x) die Orthonormierungsrelation (im erweiterten Sinn) erfüllt, ⟨χ k | χ k ⟩ = δ(k − k ) Dabei kann die folgende Beziehung [s. Gl. (47) aus Anhang II] verwendet werden: ∞
0 ikx
∫ e −∞
dx = ∫ e−ikx dx = lim
ε→0
0
1 1 = π δ(q) − iP ( ) ε + iq q
Man bestimme die Zustandsdichte ρ(E) für positive Energien E. b) Man berechne das Matrixelement ⟨χ k |X|φ0 ⟩ der Ortsobservablen X zwischen dem gebundenen Zustand |φ0 ⟩ und dem Zustand positiver Energie |χ k ⟩, dessen Wel lenfunktion oben angegeben ist. c) Das Teilchen sei geladen (Ladung q) und man betrachte seine Wechselwirkung mit einem mit der Frequenz ω rotierenden elektrischen Feld. Die entsprechende Störung lautet W(t) = −qℰ X sin ωt wobei ℰ eine Konstante ist. Das Teilchen befinde sich anfangs im gebundenen Zustand |φ0 ⟩. Man nehme ℏω > −E0 an. Man berechne mit Hilfe der Ergebnisse in § C von Kapitel XIII [s. insbeson dere Gl. (C-37)] die Übergangswahrscheinlichkeit w pro Zeit in einen beliebigen Zustand positiver Energie (photoelektrischer Effekt oder Photoionisationseffekt). Wie hängt w von ω und ℰ ab?
•
1414 | Ergänzung FXIII
8. Umorientierung eines atomaren Niveaus durch Stöße mit Edelgasatomen Wir betrachten ein im Ursprung des x, y, z-Koordinatensystems (s. Abbildung) ruhen des Atom A. Dieses Atom befinde sich in einem Zustand mit dem Drehimpuls J = 1, zu dem die drei orthonormalen Ketvektoren |M⟩ (M = −1, 0, +1), Eigenzustände von J z mit den Eigenwerten Mℏ, gehören.
Ein zweites Atom B in einem Zustand mit dem Drehimpuls null bewege sich geradlinig gleichförmig in der x, z-Ebene: Es folge mit der Geschwindigkeit v einer Geraden par allel zur z-Achse, die den Abstand b von dieser Achse hat (b ist der Stoßparameter). Als Zeitursprung wählen wir den Zeitpunkt, für den Atom B den Punkt H der x-Achse erreicht (OH = b). Zur Zeit t befindet sich Atom B also im Punkt M mit HM = vt. Den Winkel zwischen der z-Achse und OM bezeichnen wir mit θ. Dieses Modell, in dem die äußeren Freiheitsgrade der beiden Atome klassisch be handelt werden, erlaubt eine einfache Berechnung der Wirkung eines Stoßes mit Atom B (bei dem es sich z. B. um ein Edelgasatom im Grundzustand handelt) auf die in neren Freiheitsgrade des Atoms A (die quantenmechanisch behandelt werden). Man kann zeigen, dass das Atom A aufgrund der Van-der-Waals-Kräfte (s. Ergänzung CXI ) zwischen den beiden Atomen einer Störung W ausgesetzt ist, die auf die inneren Frei heitsgrade wirkt und gegeben wird durch C W = 6 J 2u r wobei C eine Konstante, r der Abstand zwischen den beiden Atomen und J u die Kom ponente des Drehimpulses J des Atoms A längs der Verbindungsachse OM der beiden Atome ist. a) Man drücke W in Abhängigkeit von C, b, v, t, J z , J ± = J x ± iJ y aus. Man führe dabei den Parameter τ = vt/b mit der Dimension eins ein. b) Man nehme an, dass kein äußeres Magnetfeld vorliegt, so dass die drei Zustände | + 1⟩, |0⟩, | − 1⟩ des Atoms A dieselbe Energie haben. Vor dem Stoß, d. h. bei t = −∞, befinde sich Atom A im Zustand |−1⟩. Mit Hilfe der zeitabhängigen Störungstheorie erster Ordnung berechne man die Wahrschein lichkeit 𝒫−1,+1 , das Atom A nach dem Stoß (d. h. für t → +∞) im Zustand | + 1⟩ zu finden. Man diskutiere die Abhängigkeit von 𝒫−1,+1 von b und v. In entsprechen der Weise berechne man 𝒫−1,0 .
Aufgaben | 1415
•
c) Man nehme nun an, es liege ein konstantes Feld B0 parallel zur z-Achse vor, so dass die drei Zustände |M⟩ eine zusätzliche Energie Mℏω0 erhalten (ZeemanEffekt), wobei ω0 die Larmor-Frequenz im Feld B0 ist. α) Für die üblichen Magnetfelder (B0 ∼ 102 G) ist ω0 ≈ 109 rad s−1 ; b betrage ungefähr 5 Å und v 5 × 102 m s−1 . Man zeige, dass die in b) erhaltenen Ergeb nisse unter diesen Bedingungen gültig bleiben. β) Man skizziere das Geschehen für sehr viel größere Werte von B0 . Ab welchem Wert für ω0 (wobei b und v die in α) angegebenen Werte behalten) verlieren die Ergebnisse von b) ihre Gültigkeit? d) Man erkläre ohne detaillierte Rechnung, wie sich die Umorientierungswahr scheinlichkeiten 𝒫−1,+1 und 𝒫−1,0 für ein Atom A bestimmen lassen, das sich in einem Gas von Atomen B befindet, die bei der Temperatur T im thermischen Gleichgewicht sind. Die Anzahl n der Atome durch Volumen sei ausreichend klein, so dass nur Zweierstöße betrachtet zu werden brauchen. +∞ Anmerkung: Es ist ∫−∞ dτ(1 + τ2 )−4 = 5π/16. 9. Einfaches Relaxationsmodell In dieser Aufgabe werden die Ergebnisse aus Ergänzung EXIII verwendet. Wir betrach ten N Spin-1/2-Teilchen mit dem gyromagnetischen Verhältnis γ, die sich in einem konstanten Magnetfeld B0 befinden (man setze ω0 = −γB0 ). Diese Teilchen seien in einer kugelförmigen Zelle mit dem Radius R eingeschlossen. Jedes Teilchen bewege sich ständig zwischen den Wänden der Zelle hin und her, und die mittlere Zeit zwi schen zwei Stößen mit der Wand bezeichnen wir als „Flugzeit“ τc . Während dieser Zeit „sieht“ das Teilchen nur das Feld B0 . Während des Stoßes mit der Wand bleibt je des Teilchen für eine mittlere Zeit τ a (τa ≪ τ c ) an der Oberfläche adsorbiert, während der es zusätzlich zu B0 ein konstantes mikroskopisches Feld b „spürt“, das von den in der Wand enthaltenen paramagnetischen Unreinheiten herrührt. Die Richtung von b ändert sich zufällig von Stoß zu Stoß; die mittlere Amplitude von b ist b 0 . a) Wie groß ist die Korrelationszeit der von den Spins gesehenen Störung? Man gebe eine physikalische Rechtfertigung für die folgende Form der Korrelationsfunktion der Komponenten des mikroskopischen Feldes b an: τa −τ/τa 1 b x (t)b x (t − τ) = b 20 e 3 τc und analoge Ausdrücke für die y- bzw. z-Komponenten, während die Kreuzterme b x (t)b y (t − τ), . . . alle verschwinden. b) Mit ℳz bezeichnen wir die Komponente der makroskopischen Magnetisierung der N Teilchen längs der durch das Feld B0 definierten z-Achse. Man zeige, dass unter dem Einfluss der Stöße mit der Wand ℳz mit einer Zeitkonstanten T1 „rela xiert“: dℳz ℳz =− dt T1 (T1 wird als longitudinale Relaxationszeit bezeichnet). Man gebe T1 in Abhängig keit von γ, B0 , τa , τ c , b 0 an.
•
1416 | Ergänzung FXIII
c) Man zeige, dass die Untersuchung der Änderung von T1 mit B0 die experimentelle Bestimmung der mittleren Adsorptionszeit τa erlaubt. d) Es gebe mehrere Zellen mit unterschiedlichen Radien R, die alle aus demselben Material bestehen. Wie können wir durch Messung von T1 die mittlere Amplitu de b 0 des mikroskopischen Feldes an der Wand experimentell bestimmen? 10. Strahlungsabsorption. Doppler-Effekt. Rückstoßenergie. Mößbauer-Effekt In § AXIII betrachteten wir die Absorption von Strahlung durch ein geladenes Teilchen, das von einem festem Zentrum O angezogen wurde (Wasserstoffatommodell, bei dem der Kern unendlich schwer ist). In dieser Aufgabe wollen wir die realistischere Situa tion annehmen, dass die einfallende Strahlung von einem System mehrerer Teilchen mit endlichen Massen absorbiert wird, die untereinander wechselwirken und einen gebundenen Zustand bilden. Wir untersuchen also den Einfluss der Freiheitsgrade des Massenmittelpunkts des Systems auf das Absorptionsphänomen. Teil I: Absorption durch ein freies Wasserstoffatom. Dopplereffekt. Rückstoßenergie Mit R1 und P1 bzw. R2 und P2 bezeichnen wir die Orts- und Impulsobservablen von zwei Teilchen (1) und (2) mit den Massen m1 bzw. m2 und den entgegenge setzten Ladungen q1 bzw. q2 (z. B. ein Wasserstoffatom); R und P bzw. RG und PG seien die Orts- und Impulsobservablen des Relativteilchens bzw. des Massenmittel punkts (s. Kap. VII, § B). Die Gesamtmasse ist M = m1 + m2 und die reduzierte Masse m = m1 m2 /(m1 + m2 ). Der Hamilton-Operator des Systems lässt sich schreiben als H0 = He + Hi
(1)
worin He =
1 2 P 2M G
(2)
die kinetische Translationsenergie des (freien) Atoms ist („äußere“ Freiheitsgrade) und Hi die (nur von R und P abhängende) innere Energie des Atoms („innere“ Frei heitsgrade). Mit |K⟩ bezeichnen wir die Eigenzustände von He mit den Eigenwerten ℏ2 K2 /2M. Wir betrachten nur zwei Eigenzustände von Hi , |χ a ⟩ und |χ b ⟩, mit den Ener gien E a und E b (E b > E a ) und setzen E b − E a = ℏω0
(3)
a) Welche Energie muss dem Atom zugeführt werden, um es vom Zustand |K, χ a ⟩ (das Atom im Zustand |χ a ⟩ mit einem Gesamtimpuls ℏK) in den Zustand |K , χ b ⟩ zu überführen? b) Das Atom wechselwirke mit einer ebenen elektromagnetischen Welle mit dem Wellenvektor k und der Frequenz ω = ck, die längs des Einheitsvektors e senk recht zu k polarisiert ist. Das zugehörige Vektorpotential A(r, t) lautet A(r, t) = 𝒜0 e ei(k⋅r−ωt) + k. k.
(4)
Aufgaben |
1417
•
worin 𝒜0 eine Konstante ist. Der dominierende Term des Hamilton-Operators der Wechselwirkung dieser ebenen Welle mit dem Zwei-Teilchen-System wird gege ben durch (s. Ergänzung AXIII , § 1-b) 2
qi Pi ⋅ A(Ri , t) m i i=1
W(t) = − ∑
(5)
Man drücke W(t) als Funktion von R, P, RG , PG , m, M und q (mit q1 = −q2 = q) aus und zeige, dass in der elektrischen Dipolnäherung, die in der Vernachlässigung von k ⋅ R (nicht aber k ⋅ RG ) gegen eins besteht, gilt W(t) = W e−iωt + W † eiωt
(6)
mit W=−
q𝒜0 e ⋅ P eik⋅RG m
(7)
c) Man zeige, dass das Matrixelement von W zwischen dem Zustand |K, χ a ⟩ und dem Zustand |K , χ b ⟩ nur dann von null verschieden ist, wenn K, k, K eine bestimmte Relation erfüllen (die anzugeben ist). Man interpretiere diese Relation als Folge der Erhaltung des Gesamtimpulses während der Absorption eines einfallenden Photons durch das Atom. d) Man zeige, dass bei einer Bestrahlung des Atoms im Zustand |K, χ a ⟩ durch die ebe ne Welle (4) Resonanz auftritt, wenn die Energie ℏω des zur einfallenden Welle ge hörenden Photons sich von der Energie ℏω0 des atomaren Übergangs |χ a ⟩ → |χ b ⟩ um eine Größe δ unterscheidet: Man gebe δ in Abhängigkeit von ℏ, ω0 , K, k, M, c an (da es sich dabei um einen Korrekturterm handelt, können wir im Ausdruck für δ die Frequenz ω durch ω0 ersetzen). Man zeige, dass δ die Summe von zwei Ter men ist, von denen einer (δ1 ) von K und dem Winkel zwischen K und k (DopplerEffekt) abhängt und der andere (δ2 ) von K unabhängig ist. Man gebe eine physi kalische Deutung von δ1 und δ2 an (und zeige dabei, dass δ2 die Rückstoßenergie ist, die das anfänglich ruhende Atom bei der Absorption des Photons aufgenom men hat). Man zeige, dass δ2 gegen δ1 vernachlässigbar ist, wenn ℏω0 von der Größenord nung 10 eV ist (Energiebereich der Atomphysik). Für M wähle man eine Masse von der Größe des Protons (Mc2 ≈ 109 eV), und für |K| einen Wert, der der ther mischen Geschwindigkeit bei T = 300∘ K entspricht. Wäre dies auch richtig, wenn ℏω0 eine Größenordnung von 105 eV hätte (Energiebereich der Kernphysik)? Teil II: Rückstoßfreie Kernresonanzabsorption. Mößbauer-Effekt Wir betrachten nun einen Atomkern der Masse M, der mit der Frequenz Ω um seine Gleichgewichtslage in einem Kristallgitter vibriert (Einstein-Modell; s. Ergänzung AV , § 2). Wieder bezeichne RG und PG den Ort bzw. den Impuls des Massenmittelpunkts dieses Kerns. Seine Vibrationsenergie wird beschrieben durch den Hamilton-Operator
•
1418 | Ergänzung FXIII
für einen dreidimensionalen harmonischen Oszillator: He =
1 2 1 2 PG + MΩ2 (XG2 + YG2 + ZG2 ) 2M 2
(8)
Den Eigenzustand von He mit dem Eigenwert (n x + n y + n z + 3/2)ℏΩ wollen wir mit |ψ n x ,n y ,n z ⟩ bezeichnen. Zusätzlich zu den äußeren besitzt der Kern innere Freiheits grade, zu denen Observable gehören, die alle mit RG und PG kommutieren. Es sei Hi der Hamilton-Operator, der die inneren Freiheitsgrade des Kerns beschreibt. Wie oben betrachten wir nur zwei Eigenzustände von Hi , |χ a ⟩ und |χ b ⟩ mit den Energien E a und E b und setzen ℏω0 = E b − E a . Da ℏω0 im Bereich der γ-Strahlung liegt, gilt offenbar ω0 ≫ Ω
(9)
e) Welche Energie muss dem Kern zugeführt werden, um den Übergang aus dem Zu stand |ψ0,0,0 , χ a ⟩ (Kern im durch die Quantenzahlen n x = 0, n y = 0, n z = 0 definierten Vibrationszustand und im inneren Zustand |χ a ⟩) in den Zustand |ψ n,0,0 , χ b ⟩ zu ermöglichen? f) Der Kern befinde sich in einem elektromagnetischen Feld des Typs (4), dessen Wellenvektor k parallel zur x-Achse sei. Es kann gezeigt werden, dass in der elek trischen Dipolnäherung der Hamilton-Operator der Wechselwirkung des Kerns mit dieser ebenen Welle (die verantwortlich für die Absorption der γ-Strahlung ist) eine Form wie Gl. (6) hat, wobei jetzt gilt W = 𝒜0 Si (k) eikXG
(10)
Si (k) ist ein Operator, der auf die inneren Freiheitsgrade wirkt und folglich mit RG und PG vertauscht. Man setze s(k) = ⟨χ b |Si (k)|χ a ⟩. Der Kern befinde sich anfangs im Zustand |ψ0,0,0 , χ a ⟩. Man zeige, dass unter dem Einfluss der einfallenden Welle immer dann eine Resonanz auftritt, wenn ℏω mit einer der in e) berechneten Energien übereinstimmt, wobei die Intensität der ent sprechenden Resonanz proportional zu |s(k)|2 |⟨ψ n,0,0 |eikXG |ψ0,0,0 ⟩|2 ist; der Wert von k ist anzugeben. Man zeige darüber hinaus, dass wir mit Hilfe von Bedin gung (9) im Ausdruck für die Intensität k durch k 0 = ω0 /c ersetzen können. g) Wir setzen π n (k 0 ) = |⟨φ n | eik0 XG | φ0 ⟩|2
(11)
wobei die Zustände |φ n ⟩ die Eigenzustände des eindimensionalen harmonischen Oszillators an der Stelle XG mit der Masse M und der Frequenz Ω sind. α) Man berechne π n (k 0 ) in Abhängigkeit von ℏ, M, Ω, k 0 , n (s. auch Aufgabe 7 von Ergänzung MV ). Man setze ξ = ℏ2 k 20 /2MℏΩ. Hinweis: Man leite eine Rekursionsbeziehung zwischen ⟨φ n |eik0 XG |φ0 ⟩ und ⟨φ n−1 |eik0 XG |φ0 ⟩ her und drücke sämtliche π n (k 0 ) in Abhängigkeit von π 0 (k 0 ) aus, das sich indirekt aus der Wellenfunktion des Grundzustands des harmonischen Oszillators ergibt. Man zeige, dass die π n (k 0 ) durch eine Poisson-Verteilung gegeben werden.
Aufgaben | 1419
•
β) Man überprüfe, dass gilt ∑∞ n=0 π n (k 0 ) = 1. nℏΩ π n (k 0 ) = ℏ2 ω20 /2Mc2 . γ) Man zeige, dass gilt ∑∞ n=0 2 2 2 h) Man nehme ℏΩ ≫ ℏ ω0 /2Mc an, d. h. die Vibrationsenergie des Kerns sei viel größer als die Rückstoßenergie (sehr starke kristalline Bindungen). Man zeige, dass das Absorptionsspektrum des Kerns im Wesentlichen aus einer einzelnen Li nie der Frequenz ω0 besteht. Diese Linie wird oft als rückstoßfreie Absorptionsli nie bezeichnet. Woher kommt diese Bezeichnung? Warum tritt der Doppler-Effekt nicht auf? i) Man nehme nun ℏΩ ≪ ℏ2 ω20 /2Mc2 an (sehr schwache kristalline Bindung). Man zeige, dass das Absorptionsspektrum des Kerns eine sehr große Anzahl äquidi stanter Linien enthält, deren Zentrum (das sich aus der Wichtung der Abszisse einer jeden Linie nach ihrer relativen Intensität ergibt) mit der Lage der Absorp tionslinie des freien und anfangs ruhenden Kerns übereinstimmt. Welche Grö ßenordnung hat die Breite dieses Spektrums (die Dispersion der Linien um ihr Zentrum)? Man zeige, dass sich im Limes Ω → 0 die Ergebnisse von Teil I dieser Aufgabe ergeben.
Referenzen und Literaturhinweise Aufgabe 3: Vorlesung von Brossel in (15.2). Aufgabe 5: siehe Townes und Schawlow (12.10), Kap. 10, § 9. Aufgabe 6: siehe Wilson (16.34). Aufgabe 9: siehe Abragam (14.1), Kap. VIII; Slichter (14.2), Kap. 5. Aufgabe 10: siehe De Benedetti (16.23); Valentin (16.1), Anhang XV.
XIV Systeme identischer Teilchen A A-1 A-2 A-3 B B-1 B-2 C C-1 C-2 C-3 C-4 D D-1 D-2
Problemstellung | 1421 Identische Teilchen: Definition | 1421 Identische Teilchen in der klassischen Mechanik | 1422 Identische Teilchen in der Quantenmechanik | 1423 Permutationsoperatoren | 1428 Zweiteilchensysteme | 1428 Systeme mit beliebiger Teilchenzahl | 1432 Das Symmetrisierungspostulat | 1438 Formulierung des Postulats | 1438 Beseitigung der Austauschentartung | 1439 Konstruktion der physikalischen Vektoren | 1439 Anwendung der anderen Postulate | 1445 Physikalische Diskussion | 1448 Unterschiede zwischen Bosonen und Fermionen | 1448 Folgerungen aus der Ununterscheidbarkeit | 1451
In Kapitel III formulierten wir die Postulate der nichtrelativistischen Quantenmecha nik und erweiterten sie in Kapitel IX um die Postulate zur Beschreibung der Spinfrei heitsgrade. Wie wir nun sehen werden (§ A), sind diese Postulate noch nicht ausrei chend, wenn wir Systeme aus vielen identischen Teilchen betrachten wollen, da sie in diesem Fall auf Mehrdeutigkeiten in den physikalischen Vorhersagen führen. Es muss ein weiteres Postulat eingeführt werden, das allein die quantenmechanische Be schreibung von Systemen identischer Teilchen betrifft. Wir werden dieses Postulat in § C formulieren und seine physikalischen Konsequenzen in § D diskutieren. Vorher definieren und untersuchen wir jedoch Permutationsoperatoren (§ B), mit denen die Überlegungen beträchtlich vereinfacht werden können.
A Problemstellung A-1 Identische Teilchen: Definition Zwei Teilchen heißen identisch, wenn alle inneren Eigenschaften (Masse, Spin, La dung, usw.) exakt übereinstimmen: Es gibt kein Experiment, mit dem man die Teil chen voneinander unterscheiden könnte. Alle Elektronen des Universums sind also identisch, ebenso alle Protonen oder alle Wasserstoffatome. Ein Elektron und ein Po sitron sind andererseits nicht identisch, da sie trotz gleicher Masse und gleichem Spin verschiedene elektrische Ladungen besitzen. Aus dieser Definition folgt unmittelbar eine wichtige Eigenschaft: Wenn ein phy sikalisches System zwei identische Teilchen enthält, werden seine Eigenschaften und seine Zeitentwicklung nicht beeinflusst, wenn diese Teilchen ihre Rollen tauschen. https://doi.org/10.1515/9783110638769-038
1422 | XIV Systeme identischer Teilchen
Bemerkung: Diese Definition ist unabhängig von den experimentellen Bedingungen. Selbst wenn in einem bestimmten Experiment die Ladungen der Teilchen nicht gemessen werden, können Elektron und Positron niemals als identische Teilchen behandelt werden.
A-2 Identische Teilchen in der klassischen Mechanik In der klassischen Mechanik stellt es kein besonderes Problem dar, wenn ein System aus identischen Teilchen besteht; dieser Spezialfall wird wie der allgemeine Fall be handelt: Jedes Teilchen bewegt sich längs einer wohldefinierten Bahnkurve, durch die wir die Teilchen voneinander unterscheiden und sie während ihrer zeitlichen Ent wicklung einzeln „verfolgen“ könnten. Zur Präzisierung dieses Sachverhalts betrachten wir ein System aus zwei identi schen Teilchen. Zum Anfangszeitpunkt t0 ist der physikalische Zustand des Systems durch die Angabe der Orte und der Geschwindigkeiten beider Teilchen definiert; wir bezeichnen sie mit {r0 , v0 } und {r0 , v0 }. Um den physikalischen Zustand zu beschrei ben und seine zeitliche Entwicklung zu bestimmen, nummerieren wir die beiden Teil chen: r1 (t) und v1 (t) bezeichnen den Ort und die Geschwindigkeit des Teilchens (1) zur Zeit t und entsprechend r2 (t) und v2 (t) die des Teilchens (2). Im Gegensatz zu dem Fall von zwei verschiedenen Teilchen hat diese Kennzeichnung keinerlei physikali schen Hintergrund. Folglich kann der Anfangszustand des Systems von vornherein durch zwei verschiedene „mathematische Zustände“ beschrieben werden, nämlich durch r1 (t0 ) = r0
r2 (t0 ) = r0
v1 (t0 ) = v0
v2 (t0 ) = v0
(A-1)
oder durch r1 (t0 ) = r0
r2 (t0 ) = r0
v0
v2 (t0 ) = v0
v1 (t0 ) =
(A-2)
Wir betrachten nun die zeitliche Entwicklung des Systems: Wir nehmen an, dass die durch die Anfangsbedingungen (A-1) definierte Lösung der Bewegungsgleichun gen lautet r1 (t) = r(t)
r2 (t) = r (t)
(A-3)
wobei r(t) und r (t) zwei Vektorfunktionen sind. Da beide Teilchen identisch sind, wird das System nicht geändert, wenn die beiden Teilchen ihre Rollen tauschen. Die Lagrange-Funktion L(r1 , v1 ; r2 , v2 ) und die Hamilton-Funktion H(r1 , p1 ; r2 , p2 ) des Systems sind demnach invariant unter Austausch der Indizes 1 und 2. Folglich lautet
A Problemstellung
| 1423
die Lösung der Bewegungsgleichungen zu den Anfangsbedingungen (A-2) r1 (t) = r (t)
r2 (t) = r(t)
(A-4)
wobei die Funktionen r(t) und r (t) dieselben wie in den Gleichungen (A-3) sind. Die beiden möglichen mathematischen Beschreibungen des betrachteten physi kalischen Zustands sind also völlig äquivalent, da sie auf dieselben physikalischen Vorhersagen führen. Das Teilchen, das sich zur Zeit t0 im Zustand {r0 , v0 } befand, ist zur Zeit t am Ort r(t) mit der Geschwindigkeit v(t) = dr/ dt, und das im Zustand {r0 , v0 } beginnende ist zur Zeit t an der Stelle r (t) mit der Geschwindigkeit v (t) = dr / dt (Abb. 1). Es genügt daher, lediglich einen der beiden möglichen „mathematischen Zu stände“ auszuwählen und die Existenz des anderen zu ignorieren: Wir behandeln das System so, wie wenn die beiden Teilchen verschieden wären. Die Zahlen (1) und (2), die wir ihnen zur Zeit t0 beliebig zugeordnet haben, verhalten sich dann wie innere Ei genschaften der Teilchen, die eine Unterscheidung ermöglichen. Da wir den Teilchen längs ihrer Bahn kontinuierlich folgen können (Pfeile in Abb. 1), wissen wir zu jedem Zeitpunkt, wo sich das Teilchen (1) oder das Teilchen (2) befindet.
Abb. 1: Ort und Geschwindigkeit der beiden Teilchen zum Anfangszeitpunkt t 0 und zur Zeit t.
A-3 Identische Teilchen in der Quantenmechanik A-3-a Qualitative Diskussion eines einfachen Beispiels Es leuchtet sofort ein, dass sich die Situation in der Quantenmechanik grundlegend ändert, da man hier den Teilchen keine wohldefinierten Bahnkurven zuweisen kann. Selbst wenn zur Zeit t0 die zu den beiden identischen Teilchen gehörenden Wellen pakete räumlich vollständig voneinander getrennt sind, können sie sich im weiteren Verlauf überlappen. Man „verliert die Spur“ der Teilchen: Weist man ein Teilchen in einem Raumgebiet nach, in dem beide eine nichtverschwindende Aufenthaltswahr scheinlichkeit besitzen, so hat man keine Möglichkeit festzustellen, ob das beobach tete Teilchen das mit (1) oder das mit (2) gekennzeichnete Teilchen ist. Bis auf Son derfälle (wenn z. B. die beiden Wellenpakete stets getrennt bleiben) wird bei einer Ortsmessung die Nummerierung der beiden Teilchen mehrdeutig: Wir werden näm lich zeigen, dass das System auf verschiedenen „Wegen“ aus seinem Anfangszustand in den bei der Messung festgestellten Zustand gelangen kann.
1424 | XIV Systeme identischer Teilchen
(a)
(b)
(c)
Abb. 2: Stoß von zwei identischen Teilchen im Schwerpunktsystem: schematische Darstellung der Wellenfunktion der Teilchen. Vor dem Stoß (a) sind die beiden Wellenfunktionen vollständig voneinander getrennt, und man kann ihnen eine „Nummer“ zuordnen. Während des Stoßes (b) überlappen die beiden Wellenpakete. Nach dem Stoß (c) hat der Raumbereich, in dem die Aufent haltswahrscheinlichkeit ungleich null ist, die Form einer Kugelschale, deren Radius mit der Zeit anwächst. Weil die beiden Teilchen identisch sind, kann man unmöglich feststellen, ob ein in D nachgewiesenes Teilchen vor dem Stoß zum Wellenpaket (1) oder (2) gehörte.
Zur näheren Untersuchung wollen wir als ein konkretes Beispiel den Stoß zweier identischer Teilchen im Ruhesystem ihres Massenmittelpunkts (Abb. 2) betrachten.¹ Vor dem Stoß liegen zwei vollständig voneinander getrennte Wellenpakete vor, die sich aufeinander zu bewegen (Abb. 2a). Wir können uns z. B. darauf einigen, das Teil chen links mit (1) und das Teilchen rechts mit (2) zu bezeichnen. Während des Stoßes (Abb. 2b) überlappen die beiden Wellenpakete. Nach dem Stoß entspricht der Raum bereich, in dem die Wahrscheinlichkeitsdichte der beiden Teilchen ungleich null ist, einer Kugelschale, deren Radius mit der Zeit zunimmt (Abb. 2c). Wir nehmen nun an, dass ein unter dem Winkel θ gegenüber der Einfallsrichtung von Teilchen (1) plazierter Detektor D ein Teilchen nachweist. Aufgrund der Impulserhaltung während des Sto ßes wissen wir dann mit Sicherheit, dass sich das andere Teilchen in die entgegenge setzte Richtung bewegt. Es ist jedoch unmöglich festzustellen, ob das in D nachgewie sene Teilchen das anfangs mit (1) oder das mit (2) nummerierte Teilchen ist. Somit gibt es zwei verschiedene „Wege“, auf denen das System aus dem in Abb. 2a dargestellten Anfangszustand in den bei der Messung festgestellten Endzustand übergegangen sein kann. Diese beiden Wege sind in Abb. 3a und Abb. 3b schematisch dargestellt. Wel chen Weg das System aber genommen hat, kann auf keine Weise festgestellt werden. Dies führt nun in der Quantenmechanik zu einer grundsätzlichen Schwierigkeit, wenn man die Postulate aus Kapitel III anwenden will: Zur Berechnung der Wahr scheinlichkeit eines Messergebnisses muss man die Vektoren des Endzustands ken nen. Hier gibt es entsprechend Abb. 3a bzw. 3b zwei solche Vektoren. Sie sind verschie 1 Die Wellenfunktion für die beiden Teilchen hängt von sechs Variablen ab (den Komponenten der beiden Teilchenkoordinaten r und r ) und lässt sich dreidimensional nur ungenügend darstellen. Ab bildung 2 ist daher sehr schematisch zu verstehen: In den grauen Bereichen liegen die Werte von r und r , für die die Wellenfunktion nicht verschwindende Werte annimmt.
A Problemstellung
| 1425
den (und darüber hinaus orthogonal). Trotzdem gehören sie zu einem einzigen phy sikalischen Zustand, weil eine vollständigere Messung zu ihrer Unterscheidung nicht vorstellbar ist. Soll man unter diesen Bedingungen zur Berechnung der Wahrschein lichkeit den Weg 3a, 3b oder beide verwenden? Sollte man im letzten Fall die Wahr scheinlichkeiten der beiden Wege addieren oder die Wahrscheinlichkeitsamplituden (und wenn, dann mit welchen Vorzeichen)? Wir werden rasch erkennen, dass diese verschiedenen Möglichkeiten zu verschiedenen physikalischen Vorhersagen führen. Die Antwort auf diese Fragen werden wir in § D nach der Formulierung des Sym metrisierungspostulats geben. Vorher untersuchen wir ein weiteres Beispiel, das uns zum Verständnis der mit der Ununterscheidbarkeit zweier Teilchen zusammenhän genden Schwierigkeiten behilflich sein wird.
(a)
(b)
Abb. 3: Schematische Darstellung der beiden „Wege“, auf denen das System beim Übergang aus dem Anfangszustand in den bei der Messung festgestellten Zustand gelangt sein könnte. Wegen der Identität der Teilchen kann man nicht entscheiden, welcher Weg tatsächlich gewählt wurde.
A-3-b Austauschentartung In unserem ersten Beispiel betrachteten wir zwei Wellenpakete, die sich anfangs nicht überlappen, so dass wir ihnen eine Zahl (1) oder (2) beliebig zuordnen konn ten. Als wir jedoch den (mathematischen) Ketvektor festzulegen suchten, der bei einer Ortsmessung einen bestimmten Endzustand beschreiben sollte, ergaben sich Mehrdeutigkeiten. Dieselbe Schwierigkeit zeigt sich aber auch bei der Wahl des Ket vektors, der zum physikalischen Anfangszustand gehört. Sie hängt mit dem Begriff der Austauschentartung zusammen, den wir darum in diesem Abschnitt einführen wollen. Zur Vereinfachung der Überlegungen wählen wir zunächst ein anderes Bei spiel mit einem endlichdimensionalen Raum. Erst danach verallgemeinern wir diesen Begriff und zeigen, dass er auf alle Quantensysteme anzuwenden ist, die aus identi schen Teilchen bestehen. α Austauschentartung für ein System von Spin-1/2-Teilchen Wir betrachten ein System, das aus zwei identischen Spin-1/2-Teilchen besteht, wo bei wir uns auf die Untersuchung der Spinfreiheitsgrade beschränken. Wie in § A-2
1426 | XIV Systeme identischer Teilchen
unterscheiden wir zwischen dem physikalischen Zustand des Systems und seiner ma thematischen Beschreibung (einem Ketvektor im Zustandsraum des Systems). Es erscheint als selbstverständlich, dass durch eine vollständige Messung an bei den Spins auch der physikalische Zustand des Gesamtsystems vollständig bekannt ist. Wir nehmen hier an, dass die z-Komponente des einen Spins +ℏ/2 und die des ande ren −ℏ/2 ist (dies entspricht im ersten Beispiel der Angabe von {r0 , v0 } und {r0 , v0 }). Zur mathematischen Beschreibung des Systems nummerieren wir die beiden Teil chen: Die Spinobservablen bezeichnen wir mit S1 und S2 , und {|ε1 , ε2 ⟩} (wobei ε1 und ε2 gleich + oder − sein können) ist die Orthonormalbasis aus den gemeinsamen Eigen vektoren von S1z (Eigenwert ε1 ℏ/2) und S2z (Eigenwert ε2 ℏ/2). So wie man in der klassischen Mechanik demselben physikalischen Zustand zwei verschiedene „mathematische Zustände“ zuordnen kann, so kann man zunächst auch hier den betrachteten physikalischen Zustand durch einen der beiden orthogonalen Kets |ε1 = +, ε2 = −⟩
(A-5a)
|ε1 = −, ε2 = +⟩
(A-5b)
beschreiben. Diese Vektoren spannen einen zweidimensionalen Unterraum auf, des sen normierte Vektoren von der Form α |+, −⟩ + β |−, +⟩
(A-6)
|α|2 + |β|2 = 1
(A-7)
mit
sind. Wegen des Superpositionsprinzips repräsentieren alle mathematischen Ketvek toren (A-6) denselben physikalischen Zustand wie die beiden Vektoren (A-5) (ein Spin zeigt nach oben und der andere nach unten). Dies bezeichnet man als Austauschent artung. Die Austauschentartung führt zu grundlegenden Schwierigkeiten, da die Anwen dung der Postulate aus Kapitel III auf die verschiedenen Ketvektoren (A-6) physikali sche Vorhersagen ergeben kann, die vom gewählten Vektor abhängen. Wir fragen z. B. nach der Wahrscheinlichkeit dafür, dass die x-Komponenten der beiden Spins gleich +ℏ/2 sind. Zu diesem Messergebnis gehört ein einziger Vektor des Zustandsraums. Ge mäß Gl. (A-20) aus Kapitel IV lautet er 1 1 (|ε1 = +⟩ + |ε1 = −⟩) ⊗ (|ε2 = +⟩ + |ε2 = −⟩) √2 √2 1 = (|+, +⟩ + |−, +⟩ + |+, −⟩ + |−, −⟩) 2
(A-8)
Die gesuchte Wahrscheinlichkeit hat also für den Vektor (A-6) den Wert 1 2 (α + β) 2
(A-9)
A Problemstellung
| 1427
Sie hängt von den Koeffizienten α und β ab. Man kann somit den physikalischen Zu stand weder durch die Gesamtheit der Vektoren (A-6) noch durch einen daraus zufällig gewählten Vektor beschreiben. Vielmehr muss man die Austauschentartung aufhe ben, d. h. eindeutig festlegen, welchen der Kets (A-6) man verwenden will. Bemerkung: In diesem Beispiel tritt die Austauschentartung nur im Anfangszustand auf, da wir für die bei den Komponenten der Spins im Endzustand dieselben Werte gewählt haben. Im allgemeinen Fall (wenn z. B. das Messergebnis zwei verschiedenen Eigenwerten von S x entspricht) haben wir es im Anfangs- und Endzustand mit Austauschentartung zu tun.
β Verallgemeinerung Die Schwierigkeiten im Zusammenhang mit der Austauschentartung treten bei der Un tersuchung aller Systeme auf, die eine beliebige Anzahl N identischer Teilchen enthal ten (N > 1). Betrachten wir z. B. ein Dreiteilchensystem. Zu jedem (getrennt betrachteten) Teilchen gehören ein Zustandsraum und Observable, die in diesem Raum wirken. Das führt uns auf eine Nummerierung der Teilchen: H(1), H(2) und H(3) bezeichnen die drei Einteilchenzustandsräume, und die entsprechenden Observablen werden mit denselben Indizes nummeriert. Der Zustandsraum des Dreiteilchensystems ist das Tensorprodukt H = H(1) ⊗ H(2) ⊗ H(3)
(A-10)
Wir betrachten nun eine Observable B(1), die ursprünglich in H(1) definiert ist. Wir nehmen an, dass B(1) für sich einen V. S. K. O. in H(1) bildet (oder dass B(1) für mehrere Observable steht, die einen V. S. K. O. bilden). Weil die drei Teilchen identisch sind, existieren die Observablen B(2) und B(3) und bilden vollständige Sätze kommu tierender Observabler in H(2) bzw. H(3); B(1), B(2) und B(3) haben jeweils dasselbe Spektrum {b n ; n = 1, 2, . . .}. Ausgehend von den Basen, die diese drei Observablen in H(1), H(2) bzw. H(3) definieren, können wir in H eine Orthonormalbasis angeben: Es ist das Tensorprodukt |1 : b i ; 2 : b j ; 3 : b k ⟩
i, j, k = 1, 2, . . .
(A-11)
Diese Vektoren sind gemeinsame Eigenvektoren der Erweiterungen von B(1), B(2) und B(3) auf H mit den Eigenwerten b i , b j bzw. b k . Da die drei Teilchen identisch sind, können wir nicht B(1) oder B(2) oder B(3) messen, weil die Nummerierung keinen physikalischen Hintergrund hat. Dagegen können wir die physikalische Größe B an jedem der drei Teilchen messen. Wir neh men an, eine solche Messung habe die drei unterschiedlichen Eigenwerte b n , b p und b q ergeben. Dann tritt Austauschentartung auf, da der Zustand des Systems nach der Messung a priori durch einen beliebigen Vektor des Unterraums von H gegeben
1428 | XIV Systeme identischer Teilchen
werden kann, der durch die folgenden sechs Basisvektoren aufgespannt wird: |1 : b n ; 2 : b p ; 3 : b q ⟩
|1 : b q ; 2 : b n ; 3 : b p ⟩
|1 : b p ; 2 : b q ; 3 : b n ⟩
|1 : b n ; 2 : b q ; 3 : b p ⟩
|1 : b p ; 2 : b n ; 3 : b q ⟩
|1 : b q ; 2 : b p ; 3 : b n ⟩
(A-12)
Es ist daher nicht möglich, durch eine vollständige Messung an jedem Teilchen einen eindeutigen Ketvektor aus dem Zustandsraum des Systems zu erhalten. Bemerkung: Die Unbestimmtheit aufgrund der Austauschentartung hat geringere Bedeutung, wenn zwei der bei der Messung gefundenen Eigenwerte gleich sind, und sie verschwindet für den Fall, dass alle drei Ergebnisse gleich sind.
B Permutationsoperatoren Bevor wir das neue Postulat formulieren, mit dessen Hilfe die mit der Austauschent artung zusammenhängenden Mehrdeutigkeiten beseitigt werden, wollen wir Opera toren untersuchen, die im Gesamtzustandsraum des betrachteten Systems definiert sind und deren Wirkung darin besteht, dass sie die Teilchen dieses Systems mitein ander vertauschen. Mit ihrer Verwendung werden die folgenden Überlegungen und Rechnungen einfacher.
B-1 Zweiteilchensysteme B-1-a Definition des Permutationsoperators P21 Wir betrachten ein aus zwei Teilchen mit demselben Spin s bestehendes System. Die beiden Teilchen müssen nicht identisch sein; es genügt, dass ihre Zustandsräume iso morph sind. So kann z. B. das Teilchen (1) ein Proton und das Teilchen (2) ein Elektron sein. Wir wählen eine Basis {|u i ⟩} im Zustandsraum H(1) des Teilchens (1). Da die bei den Teilchen denselben Spin haben, ist H(2) isomorph zu H(1) und kann von dersel ben Basis aufgespannt werden. Durch Bildung des Tensorprodukts konstruieren wir im Zustandsraum H des Systems die Basis {|1 : u i ; 2 : u j ⟩}
(B-1)
Da die Reihenfolge der Vektoren in einem Tensorprodukt keine Rolle spielt, ist |2 : u j ; 1 : u i ⟩ ≡ |1 : u i ; 2 : u j ⟩
(B-2)
Jedoch haben wir zu beachten, dass |1 : u j ; 2 : u i ⟩ ≠ |1 : u i ; 2 : u j ⟩
für i ≠ j
(B-3)
B Permutationsoperatoren
| 1429
Als Permutationsoperator P21 wird der lineare Operator definiert, dessen Wirkung auf die Basisvektoren durch die Beziehung P21 |1 : u i ; 2 : u j ⟩ = |2 : u i ; 1 : u j ⟩ = |1 : u j ; 2 : u i ⟩
(B-4)
gegeben wird. Die Wirkung auf einen beliebigen Vektor aus H erhält man dann, indem man diesen nach der Basis (B-1) entwickelt.² Bemerkung: Wählen wir eine Basis aus den gemeinsamen Eigenvektoren der Ortsobservablen R und der Spin komponente S z , so kann Gl. (B-4) geschrieben werden P 21 |1 : r, ε; 2 : r , ε ⟩ = |1 : r , ε ; 2 : r, ε⟩
(B-5)
Ein beliebiger Vektor |ψ⟩ des Zustandsraums H kann durch eine Menge von (2s + 1)2 Funktionen dargestellt werden, die ihrerseits von sechs Variablen abhängen: |ψ⟩ = ∑ ∫ d3 r d3 r ψ ε,ε (r, r ) |1 : r, ε; 2 : r , ε ⟩
(B-6)
ε,ε
mit ψ ε,ε (r, r ) = ⟨1 : r, ε; 2 : r , ε | ψ⟩
(B-7)
Es ist dann P 21 |ψ⟩ = ∑ ∫ d3 r d3 r ψ ε,ε (r, r ) |1 : r , ε ; 2 : r, ε⟩
(B-8)
ε,ε
Tauscht man die Namen der Summationsindizes und der Integrationsvariablen, ε ↔ ε
(B-9)
r ↔ r so wird Gl. (B-8) in P 21 |ψ⟩ = ∑ ∫ d3 r d3 r ψ ε ,ε (r , r) |1 : r, ε; 2 : r , ε ⟩
(B-10)
ε,ε
transformiert. Folglich ergeben sich die Funktionen ψε,ε (r, r ) = ⟨1 : r, ε; 2 : r , ε | P 21 | ψ⟩
(B-11)
die den Vektor |ψ ⟩ = P 21 |ψ⟩ darstellen, aus den Funktionen (B-7), die den Vektor |ψ⟩ darstellen, durch die Vertauschung von (r, ε) und (r , ε ), ψε,ε (r, r ) = ψ ε ,ε (r , r)
(B-12)
2 Es lässt sich zeigen, dass der so definierte Operator P 21 nicht von der gewählten Basis {|u i ⟩} abhängt.
1430 | XIV Systeme identischer Teilchen B-1-b Eigenschaften von P21 Aus der Definition (B-4) folgt sofort (P21 )2 = 1
(B-13)
der Operator P21 ist zu sich selbst invers. Weiter kann man zeigen, dass P21 hermitesch ist, P†21 = P21
(B-14)
In der {|1 : u i ; 2 : u j ⟩}-Basis lauten nämlich die Matrixelemente von P21 ⟨1 : u i ; 2 : u j | P21 | 1 : u i ; 2 : u j ⟩ = ⟨1 : u i ; 2 : u j | 1 : u j ; 2 : u i ⟩ = δ i j δ j i
(B-15)
Nach Definition sind dann die Matrixelemente von P†21 ⟨1 : u i ; 2 : u j | P†21 | 1 : u i ; 2 : u j ⟩ = (⟨1 : u i ; 2 : u j | P21 | 1 : u i ; 2 : u j ⟩) = (⟨1 : u i ; 2 : u j | 1 : u j ; 2 : u i ⟩) = δ ij δ ji
∗
∗
(B-16)
Jedes Matrixelement von P†21 ist darum gleich dem entsprechenden Matrixelement von P21 ; daraus folgt Gl. (B-14). Aus Gl. (B-13) und Gl. (B-14) folgt schließlich, dass P21 unitär ist: P†21 P21 = P21 P†21 = 1
(B-17)
B-1-c Symmetrische und antisymmetrische Vektoren Nach Gl. (B-14) sind die Eigenwerte von P21 reell. Da weiterhin nach Gl. (B-13) ihre Qua drate gleich 1 sind, sind diese Eigenwerte einfach +1 und −1. Die Eigenvektoren von P21 mit dem Eigenwert +1 heißen symmetrisch, die mit dem Eigenwert −1 antisymme trisch: P21 |ψS ⟩ = +|ψS ⟩
⇒ |ψS ⟩ ist symmetrisch
P21 |ψA ⟩ = −|ψA ⟩
⇒ |ψA ⟩ ist antisymmetrisch
(B-18)
Wir betrachten nun die beiden Operatoren 1 (1 + P21 ) 2 1 A = (1 − P21 ) 2 S=
(B-19a) (B-19b)
Sie sind Projektoren, da aus Gl. (B-13) folgt S2 = S
(B-20a)
A =A
(B-20b)
2
B Permutationsoperatoren
|
1431
außerdem können wir mit Hilfe von Gl. (B-14) zeigen S† = S
(B-21a)
†
A =A
(B-21b)
S und A sind Projektoren auf orthogonale Unterräume, da nach Gl. (B-13) gilt SA = AS = 0
(B-22)
Diese Unterräume sind komplementär, da die Definition (B-19) ergibt S+A=1
(B-23)
Für einen beliebigen Vektor |ψ⟩ des Zustandsraums H ist S|ψ⟩ ein symmetrischer und A|ψ⟩ ein antisymmetrischer Vektor, da wir erneut mit Hilfe von Gl. (B-13) leicht zeigen, dass P21 S|ψ⟩ = S|ψ⟩
(B-24)
P21 A|ψ⟩ = −A|ψ⟩
Aus diesem Grund bezeichnet man S als Symmetrisierungsoperator und A als Antisym metrisierungsoperator. Bemerkung: Bei der Anwendung von S auf P 21|ψ⟩ oder auf |ψ⟩ selbst ergibt sich derselbe symmetrische Vektor S P 21 |ψ⟩ = S |ψ⟩
(B-25)
für den Antisymmetrisierungsoperator gilt entsprechend A P 21 |ψ⟩ = −A |ψ⟩
(B-26)
B-1-d Transformation von Observablen durch Permutation Wir betrachten eine Observable B(1), die ursprünglich in H(1) definiert war und dann auf H erweitert wurde. Es ist immer möglich, die {|u i ⟩}-Basis aus Eigenvektoren von B(1) in H(1) zu konstruieren (die zugehörigen Eigenwerte bezeichnen wir mit b i ). Wir berechnen die Wirkung des Operators P21 B(1)P†21 auf einen beliebigen Basisvektor von H: P21 B(1)P†21 |1 : u i ; 2 : u j ⟩ = P21 B(1) |1 : u j ; 2 : u i ⟩ = b j P21 |1 : u j ; 2 : u i ⟩ = b j |1 : u i ; 2 : u j ⟩
(B-27)
Dasselbe Ergebnis ergäbe sich, wenn wir die Observable B(2) direkt auf den Basisvek tor angewandt hätten. Folglich gilt P21 B(1)P†21 = B(2)
(B-28)
1432 | XIV Systeme identischer Teilchen
Ebenso zeigt man P21 B(2)P†21 = B(1)
(B-29)
Darüber hinaus gibt es in H Observable wie B(1) + C(2) oder B(1)C(2), die beide Indizes enthalten. Offenbar gilt P21 [B(1) + C(2)] P†21 = B(2) + C(1)
(B-30)
analog erhalten wir mit Gl. (B-17) P21 B(1)C(2)P†21 = P21 B(1)P†21 P21 C(2)P†21 = B(2)C(1)
(B-31)
Diese Ergebnisse lassen sich auf sämtliche Observablen in H verallgemeinern, die als Funktion von Observablen des Typs B(1) oder C(2) ausgedrückt werden können und die wir als O(1, 2) schreiben wollen: P21 O(1, 2)P†21 = O(2, 1)
(B-32)
O(2, 1) ist dabei die Observable, die sich aus O(1, 2) durch das Vertauschen aller In dizes 1 und 2 ergibt. Eine Observable OS (1, 2) heißt symmetrisch, wenn gilt OS (2, 1) = OS (1, 2)
(B-33)
Nach Gl. (B-32) erfüllen alle symmetrischen Observablen die Relation P21 OS (1, 2) = OS (1, 2)P21
(B-34)
d. h. [OS (1, 2), P21 ] = 0
(B-35)
symmetrische Observable vertauschen mit dem Permutationsoperator.
B-2 Systeme mit beliebiger Teilchenzahl Im Zustandsraum eines Systems, das aus N Teilchen mit demselben Spin besteht (vor erst nehmen wir die Teilchen als verschieden an), lassen sich N! Permutationsopera toren definieren; einer davon ist der Einheitsoperator. Wenn N größer als zwei ist, sind die Eigenschaften dieser Operatoren komplizierter als die von P21 . Um einen Eindruck zu gewinnen, welche Änderungen sich für N größer zwei ergeben, untersuchen wir kurz den Fall N = 3.
B Permutationsoperatoren
| 1433
B-2-a Definition der Permutationsoperatoren Wir betrachten also ein System aus drei Teilchen, die nicht unbedingt identisch sind, aber denselben Spin haben. Wie in § B-1-a konstruieren wir eine Basis des Zustands raums durch Bildung des Tensorprodukts: {|1 : u i ; 2 : u j ; 3 : u k ⟩}
(B-36)
In diesem Fall gibt es sechs Permutationsoperatoren, die wir schreiben P123 , P312 , P231 , P132 , P213 , P321
(B-37)
Die Wirkung des linearen Operators P npq (wobei n, p, q eine beliebige Permutation der Zahlen 1, 2, 3 ist) auf die Basisvektoren ist nach Definition P npq |1 : u i ; 2 : u j ; 3 : u k ⟩ = |n : u i ; p : u j ; q : u k ⟩
(B-38)
z. B. P231 |1 : u i ; 2 : u j ; 3 : u k ⟩ = |2 : u i ; 3 : u j ; 1 : u k ⟩ = |1 : u k ; 2 : u i ; 3 : u j ⟩
(B-39)
Der Operator P123 stimmt also mit dem Einheitsoperator überein. Die Wirkung von P npq auf einen beliebigen Vektor des Zustandsraums ergibt sich aus der Entwicklung dieses Vektors nach der Basis (B-36). Die N! Permutationsoperatoren eines Systems von N Teilchen mit gleichem Spin lassen sich entsprechend definieren. B-2-b Eigenschaften α Die Permutationsoperatoren bilden eine Gruppe Diese Eigenschaft lässt sich für die Operatoren (B-37) leicht zeigen: 1. Der Operator P123 ist der Einheitsoperator. 2. Das Produkt zweier Permutationsoperatoren ist wieder ein Permutationsope rator. Als Beispiel beweisen wir P312 P132 = P321
(B-40)
Dazu wenden wir die rechte Seite auf einen beliebigen Basisvektor an, P312 P132 |1 : u i ; 2 : u j ; 3 : u k ⟩ = P312 |1 : u i ; 3 : u j ; 2 : u k ⟩ = P312 |1 : u i ; 2 : u k ; 3 : u j ⟩ = |3 : u i ; 1 : u k ; 2 : u j ⟩ = |1 : u k ; 2 : u j ; 3 : u i ⟩
(B-41)
Die Wirkung von P321 führt auf dasselbe Ergebnis, P321 |1 : u i ; 2 : u j ; 3 : u k ⟩ = |3 : u i ; 2 : u j ; 1 : u k ⟩ = |1 : u k ; 2 : u j ; 3 : u i ⟩
(B-42)
1434 | XIV Systeme identischer Teilchen
3. Jeder Permutationsoperator besitzt ein Inverses, das wieder ein Permutations operator ist. Analog wie in Punkt 2 zeigt man leicht, dass gilt P−1 123 = P 123
P−1 312 = P 231
P−1 231 = P 312
P−1 132 = P 132
P−1 213 = P 213
P−1 321 = P 321
(B-43)
Zu beachten ist, dass Permutationsoperatoren nicht miteinander vertauschen. Zum Beispiel gilt P132 P312 = P213
(B-44)
was zusammen mit Gl. (B-40) zeigt, dass der Kommutator von P132 und P312 nicht verschwindet. β Transpositionen. Parität eines Permutationsoperators Eine Transposition ist eine Permutation, bei der nur zwei Teilchen vertauscht werden. Die letzten drei Operatoren (B-37) sind Transpositionsoperatoren.³ Transpositionsope ratoren sind hermitesch, jeder von ihnen ist zu sich selbst invers, so dass sie auch unitär sind (die Beweise dieser Eigenschaften sind identisch mit denen für die Glei chungen (B-14), (B-13) und (B-17)). Jeder Permutationsoperator kann in ein Produkt von Transpositionsoperatoren zerlegt werden. Der zweite Operator (B-37) lässt sich z. B. schreiben P312 = P132 P213 = P321 P132 = P213 P321 = P132 P213 (P132 )2 = . . .
(B-45)
Diese Zerlegung ist nicht eindeutig. Für eine gegebene Permutation kann man jedoch zeigen, dass die Parität der Anzahl an Transpositionen, in die sie zerlegt werden kann, immer gleich ist: Man nennt sie die Parität der Permutation. Die ersten drei Operato ren (B-37) sind z. B. gerade, während die letzten drei ungerade sind. Für beliebiges N gibt es jeweils ebenso viele gerade wie ungerade Permutationen. γ Permutationsoperatoren sind unitär Permutationsoperatoren sind als Produkte von unitären Transpositionsoperatoren ebenfalls unitär. Sie sind jedoch nicht notwendig hermitesch, da Transpositionsope ratoren im Allgemeinen nicht miteinander vertauschen. Die Adjungierte eines gegebenen Permutationsoperators schließlich hat dieselbe Parität wie der Operator selbst, da sie gleich dem Produkt derselben Transpositionen in der umgekehrten Reihenfolge ist.
3 Offenbar ist für N = 2 die einzig mögliche Permutation eine Transposition.
B Permutationsoperatoren
| 1435
B-2-c Total symmetrische und total antisymmetrische Kets Da die Permutationsoperatoren für N > 2 nicht vertauschen, ist es nicht möglich, eine Basis aus gemeinsamen Eigenvektoren dieser Operatoren zu konstruieren. Wir werden jedoch sehen, dass es bestimmte Vektoren gibt, die gemeinsame Eigenvektoren aller Permutationsoperatoren sind. Mit P α wollen wir einen beliebigen Permutationsoperator eines Systems aus N Teilchen mit demselben Spin bezeichnen; α stellt eine beliebige Permutation der ers ten N natürlichen Zahlen dar. Ein Vektor |ψS ⟩, für den bei jeder beliebigen Permutati on P α gilt P α |ψS ⟩ = |ψS ⟩
(B-46)
heißt total symmetrisch. Entsprechend erfüllt ein total antisymmetrischer Vektor |ψA ⟩ nach Definition⁴ die Bedingung P α |ψA ⟩ = ε α |ψA ⟩
(B-47)
{+1 wenn P α eine gerade Permutation ist εα = { −1 wenn P α eine ungerade Permutation ist {
(B-48)
mit
Die Menge total symmetrischer Vektoren bildet einen Untervektorraum HS des Zu standsraums H, die Menge total antisymmetrischer Vektoren analog einen Untervek torraum HA . Wir betrachten nun die beiden Operatoren 1 ∑ Pα N! α 1 A= ∑ εα Pα N! α S=
(B-49) (B-50)
wobei die Summationen über alle N! Permutationen der ersten N natürlichen Zah len auszuführen sind und die ε α durch die Gleichungen (B-48) definiert werden. Wir wollen zeigen, dass S und A die Projektoren auf HS bzw. HA sind. Aus diesem Grund werden sie als Symmetrisierungs- bzw. Antisymmetrisierungsoperator bezeichnet. Zunächst sind S und A hermitesch, S† = S †
A =A
(B-51) (B-52)
4 Nach den in § B-2-b-β angegebenen Eigenschaften kann die Definition auch mittels Transpositions operatoren erfolgen: Ein beliebiger Transpositionsoperator lässt einen total symmetrischen Vektor in variant und transformiert einen total antisymmetrischen Vektor in sein Negatives.
1436 | XIV Systeme identischer Teilchen Die Adjungierte P†α eines gegebenen Permutationsoperators ist, wie wir oben gese hen haben, ein anderer Permutationsoperator derselben Parität (und er ist außerdem gleich P−1 α ). Die Bildung der Adjungierten der rechten Seiten der Definitionen für S und A entspricht daher einfach einem Wechsel der Reihenfolge der Terme dieser Summen (da die Menge der P−1 α wieder die Permutationsgruppe ist). Für einen beliebigen Permutationsoperator P α0 gilt außerdem P α0 S = SP α0 = S
(B-53a)
P α0 A = AP α0 = ε α0 A
(B-53b)
Das folgt aus der Tatsache, dass P α0 P α ebenfalls ein Permutationsoperator ist, P α0 P α = P β
(B-54)
ε β = ε α0 ε α
(B-55)
mit
Wenn wir bei festgehaltenem P α0 für P α nach und nach alle Permutationen der Grup pe wählen, so sehen wir, dass die P β jeweils mit genau einer dieser Permutationen übereinstimmen (natürlich in anderer Reihenfolge). Folglich gilt P α0 S =
1 1 ∑ P α0 P α = ∑ Pβ = S N! α N! β
(B-56a)
P α0 A =
1 1 ∑ ε α P α0 P α = ε α ∑ ε β P β = ε α0 A N! α N! 0 β
(B-56b)
Ebenso könnten wir analoge Beziehungen zeigen, bei denen S und A von rechts mit P α0 multipliziert werden. Aus den Gleichungen (B-53) erhalten wir S2 = S A2 = A
(B-57)
und außerdem AS = SA = 0
(B-58)
Das sieht man wie folgt: 1 1 ∑ Pα S = ∑S = S N! α N! α 1 1 A2 = ∑ εα Pα A = ∑ ε2 A = A N! α N! α α S2 =
(B-59)
B Permutationsoperatoren
|
1437
da jede Summe N! Terme enthält; außerdem ist AS =
1 1 ∑ εα Pα S = S ∑ εα = 0 N! α N! α
(B-60)
da die ε α zur Hälfte gleich +1 und −1 sind (s. § B-2-b-β). Die Operatoren S und A sind somit Projektoren. Sie projizieren auf HS bzw. HA , da wegen der Beziehungen (B-53) ihre Wirkung auf einen beliebigen Vektor |ψ⟩ des Zustandsraums einen total symmetrischen bzw. einen total antisymmetrischen Vektor ergibt: P α0 S |ψ⟩ = S |ψ⟩
(B-61a)
P α0 A |ψ⟩ = ε α0 A |ψ⟩
(B-61b)
Bemerkungen: 1. Der total symmetrische Vektor, der sich aus der Wirkung von S auf P α |ψ⟩ ergibt, wobei P α eine beliebige Permutation ist, ist derselbe, der sich auch direkt aus |ψ⟩ ergäbe, da nach Gl. (B-53) gilt SP α |ψ⟩ = S |ψ⟩
(B-62)
Die entsprechenden total antisymmetrischen Vektoren unterscheiden sich höchstens durch ihr Vorzeichen: AP α |ψ⟩ = ε α A |ψ⟩
(B-63)
2. Für N > 2 sind die Symmetrisierungs- und Antisymmetrisierungsoperatoren keine Projektoren auf komplementäre Unterräume. Zum Beispiel zeigt man für N = 3 leicht (unter Verwendung der Tatsache, dass die ersten drei der Operatoren (B-37) gerade und die anderen ungerade sind) die Beziehung S+A=
1 (P 123 + P 231 + P 312 ) ≠ 1 3
(B-64)
Der Zustandsraum ist also keine direkte Summe aus den Unterräumen HS total symmetrischer Vektoren und HA total antisymmetrischer Vektoren.
B-2-d Transformation von Observablen durch Permutation Wir haben bereits festgestellt (s. § B-2-b-β), dass sich jeder Permutationsoperator ei nes N-Teilchensystems in ein Produkt von Transpositionsoperatoren analog zum Ope rator P21 in § B-1 zerlegen lässt. Auf diese Transpositionsoperatoren können wir die Überlegung aus § B-1-d anwenden, um das Verhalten der verschiedenen Observablen des Systems bei der Multiplikation von links mit einem beliebigen Permutationsope rator P α bzw. von rechts mit P†α zu bestimmen. Insbesondere kommutieren die Observablen OS (1, 2, . . . , N), die total symme trisch in Bezug auf den Austausch der Indizes 1, 2, . . . , N sind, mit allen Transpo sitionsoperatoren und damit mit allen Permutationsoperatoren: [OS (1, 2, . . . , N), P α ] = 0
(B-65)
1438 | XIV Systeme identischer Teilchen
C Das Symmetrisierungspostulat C-1 Formulierung des Postulats Wenn ein System aus mehreren identischen Teilchen besteht, können nur bestimm te Vektoren seines Zustandsraums seine physikalischen Zustände beschreiben. Die physikalischen Vektoren sind je nach der Natur der identischen Teilchen entweder total symmetrisch oder total antisymmetrisch in Bezug auf die Permutationen die ser Teilchen. Sind die physikalischen Vektoren symmetrisch, so heißen die Teilchen Bosonen, sind sie antisymmetrisch, so nennt man sie Fermionen. Das Symmetrisierungspostulat beschränkt also den Zustandsraum eines Systems identischer Teilchen. Er ist nicht wie für verschiedene Teilchen das Tensorprodukt H der Zustandsräume der einzelnen Teilchen. Vielmehr wird er durch einen Unterraum von H, HS oder HA gebildet, je nachdem ob es sich bei den Teilchen um Bosonen oder um Fermionen handelt. Dieses Postulat teilt die in der Natur existierenden Teilchen in zwei Kategorien. Alle zur Zeit bekannten Teilchen erfüllen die folgende empirische Regel⁵: Teilchen mit halbzahligem Spin (Elektronen, Positronen, Protonen, Neutronen, Myonen usw.) sind Fermionen und Teilchen mit ganzzahligem Spin (Photonen, Mesonen usw.) sind Bo sonen. Bemerkung: Ist diese Regel einmal für Teilchen nachgewiesen, die wir als Elementarteilchen bezeichnen, so gilt sie auch für alle anderen Teilchen, soweit sie aus ihnen aufgebaut sind. Betrachten wir nämlich ein System von mehreren identischen zusammengesetzten Teilchen, so entspricht der Permuta tion zweier Teilchen die Permutation aller Elementarteilchen, die das erste Teilchen bilden, mit den entsprechenden (und zu den ersten identischen) Elementarteilchen des zweiten zusammen gesetzten Teilchens. Diese Permutation lässt den Zustandsvektor unverändert, wenn die zusam mengesetzten Teilchen nur aus elementaren Bosonen bestehen oder eine gerade Anzahl von Fer mionen enthalten (kein Vorzeichenwechsel bzw. eine gerade Anzahl von Vorzeichenwechseln); in diesem Fall handelt es sich um Bosonen. Enthalten die zusammengesetzten Teilchen ande rerseits eine ungerade Anzahl an Fermionen, so sind sie selbst Fermionen (ungerade Anzahl an Vorzeichenwechseln durch die Permutation). Im ersten Fall ist der Spin der zusammengesetzten Teilchen notwendig ganzzahlig und im zweiten halbzahlig (s. Kap. X, § C-3-c); sie gehorchen also der oben angegebenen Regel. Zum Beispiel bestehen Atomkerne aus Neutronen und Protonen, die beide Fermionen mit dem Spin 1/2 sind. Folglich handelt es sich bei Kernen, deren Massen zahl A gerade ist, um Bosonen, und bei Kernen mit ungerader Massenzahl um Fermionen. Der Kern des 3 He-Isotops von Helium ist somit ein Fermion, während der des 4 He-Isotops ein Boson ist.
5 Mit Hilfe des Spin-Statistik-Theorems, das in der Quantenfeldtheorie bewiesen wird, kann man diese Regel als Folge sehr allgemeiner Hypothesen auffassen, die sich auch als falsch erweisen könnten: Die Entdeckung eines Bosons mit halbzahligem Spin oder eines Fermions mit ganzzahligem Spin bleibt möglich. Es ist auch nicht ausgeschlossen, dass die physikalischen Vektoren für gewisse Teilchen kom pliziertere Symmetrieeigenschaften als die hier dargestellten besitzen.
C Das Symmetrisierungspostulat
| 1439
C-2 Beseitigung der Austauschentartung Wir zeigen jetzt, wie das neue Postulat die Austauschentartung und die damit zusam menhängenden Schwierigkeiten aufhebt. Die Diskussion in § A lässt sich wie folgt zu sammenfassen: Es sei |u⟩ ein Vektor, der mathematisch den physikalischen Zustand eines Systems beschreibt, das aus N identischen Teilchen besteht. Für jeden Permuta tionsoperator P α gilt, dass P α |u⟩ den Zustand ebenso gut wie |u⟩ repräsentieren kann. Dasselbe gilt für jeden Vektor aus dem Raum Hu , der von |u⟩ und den Transformationen P α |u⟩ aufgespannt wird. Abhängig vom gewählten Vektor |u⟩ kann die Dimension von Hu zwischen 1 und N! liegen. Ist sie größer als eins, entsprechen demselben physika lischen Zustand mehrere mathematische Vektoren: Es liegt Austauschentartung vor. Durch das neue Postulat wird die Klasse der mathematischen Vektoren, die den physikalischen Zustand beschreiben können, beträchtlich eingeschränkt: Für Boso nen müssen sie zu HS und für Fermionen zu HA gehören. Die mit der Austauschentar tung zusammenhängenden Probleme können wir als gelöst ansehen, wenn Hu genau einen Vektor aus HS oder genau einen aus HA enthält. Um dies zu zeigen, verwenden wir die bereits bewiesenen Beziehungen (B-53) S = SP α oder A = ε α AP α . Es ergibt sich S |u⟩ = SP α |u⟩
(C-1a)
A |u⟩ = ε α AP α |u⟩
(C-1b)
Diese Beziehungen drücken aus, dass die Projektionen aller Vektoren aus Hu auf HS bzw. HA kollinear sind. Das Symmetrisierungspostulat gibt damit eindeutig (bis auf einen konstanten Faktor) den Vektor von Hu an, der dem betrachteten physikalischen Zustand zugeordnet werden muss: Das ist S|u⟩ für Bosonen und A|u⟩ für Fermionen; wir nennen ihn den physikalischen Vektor. Bemerkung: Es ist möglich, dass die Projektion aller Vektoren von Hu auf HA (oder HS ) gleich null ist. In diesem Fall schließt das Symmetrisierungspostulat den entsprechenden physikalischen Zustand aus. In § C-3-b und § C-3-c werden wir hierfür im Zusammenhang mit Fermionen Beispiele ange ben.
C-3 Konstruktion der physikalischen Vektoren C-3-a Konstruktionsregel Die Diskussion des vorangegangenen Abschnitts führt uns unmittelbar auf die fol gende Regel zur Konstruktion des einzigen (physikalischen) Vektors, der zu einem be stimmten physikalischen Zustand eines Systems aus N identischen Teilchen gehört: 1. Man nummeriere die Teilchen willkürlich und konstruiere den Ketvektor |u⟩, der zu diesem physikalischen Zustand und der gewählten Nummerierung gehört.
1440 | XIV Systeme identischer Teilchen
2. 3.
Sind die identischen Teilchen Bosonen, so wende man S auf |u⟩ an, sind es Fer mionen, so wende man A auf diesen Ket an. Man normiere den auf diese Weise erhaltenen Vektor.
Zur Erläuterung dieser Regeln betrachten wir einige einfache Beispiele. C-3-b Anwendung auf Systeme mit zwei identischen Teilchen Ein System bestehe aus zwei identischen Teilchen. Ein Teilchen befinde sich in dem (Einteilchen-)Zustand, der durch den normierten Vektor |φ⟩ charakterisiert ist, das andere Teilchen in dem (Einteilchen-)Zustand, der durch den normierten Vektor |χ⟩ repräsentiert wird. Zunächst seien die beiden Vektoren |φ⟩ und |χ⟩ verschieden. Die obige Regel wird dann in der folgenden Weise angewendet: 1. Das Teilchen im Zustand |φ⟩ erhält z. B. die Nummer 1, das Teilchen im Zustand |χ⟩ die Nummer 2. Das ergibt |u⟩ = |1 : φ; 2 : χ⟩ 2.
(C-2)
Sind die Teilchen Bosonen, so symmetrisieren wir |u⟩: S |u⟩ =
1 (|1 : φ; 2 : χ⟩ + |1 : χ; 2 : φ⟩) 2
(C-3a)
sind es Fermionen, so antisymmetrisieren wir |u⟩: A |u⟩ = 3.
1 (|1 : φ; 2 : χ⟩ − |1 : χ; 2 : φ⟩) 2
(C-3b)
Die Vektoren (C-3a) und (C-3b) sind im Allgemeinen nicht normiert. Wenn wir |φ⟩ und |χ⟩ als orthogonal annehmen, ist die Normierungskonstante sehr leicht zu berechnen. Zur Normierung von S|u⟩ und A|u⟩ müssen wir lediglich den Faktor 1/2 in (C-3a) und (C-3b) durch 1/√2 ersetzen. Der normierte physikalische Vektor kann in diesem Fall geschrieben werden |φ; χ⟩ =
1 (|1 : φ; 2 : χ⟩ + ε |1 : χ; 2 : φ⟩) √2
(C-4)
mit ε = +1 für Bosonen und ε = −1 für Fermionen. Wir nehmen nun an, dass die beiden Einzelzustände |φ⟩ und |χ⟩ identisch sind, |φ⟩ = |χ⟩
(C-5)
Dann lautet Gl. (C-2) |u⟩ = |1 : φ; 2 : φ⟩
(C-6)
C Das Symmetrisierungspostulat
| 1441
d. h. |u⟩ ist bereits symmetrisch. Sind die beiden Teilchen Bosonen, so ist dieser Vektor auch der physikalische Vektor des Zustands, in dem die beiden Bosonen im selben Einzelzustand |φ⟩ sind. Sind dagegen die beiden Teilchen Fermionen, so stellt man fest, dass A |u⟩ =
1 (|1 : φ; 2 : φ⟩ − |1 : φ; 2 : φ⟩) = 0 2
(C-7)
ist. Es gibt folglich keinen Vektor aus HA , der den physikalischen Zustand von zwei Fermionen beschreiben kann, die sich im selben Einzelzustand |φ⟩ befinden. Ein sol cher physikalischer Zustand wird somit durch das Symmetrisierungspostulat ausge schlossen. Für diesen Spezialfall gelangen wir somit zu einem wichtigen Ergebnis, das man das Paulische Ausschließungsprinzip oder kürzer das Pauli-Prinzip nennt: Zwei identische Teilchen können nicht im selben Einzelzustand sein. Dieses Prinzip hat weitreichende physikalische Konsequenzen, die wir in § D-1 diskutieren werden. C-3-c Verallgemeinerung auf eine beliebige Anzahl von Teilchen Die Ergebnisse lassen sich auf eine beliebige Anzahl N von Teilchen verallgemeinern. Dazu untersuchen wir zunächst den Fall N = 3. Der physikalische Zustand dieses Systems sei durch die Angabe der drei normier ten Einzelzustände |φ⟩, |χ⟩ und |ω⟩ definiert. Der Zustand |u⟩ kann jetzt die Form |u⟩ = |1 : φ; 2 : χ; 3 : ω⟩
(C-8)
haben. Wir behandeln zunächst den Fall, dass es sich bei den drei identischen Teil chen um Bosonen handelt. α Bosonen Die Anwendung von S auf |u⟩ ergibt 1 ∑ P α |u⟩ 3! α 1 = (|1 : φ; 2 : χ; 3 : ω⟩ + |1 : ω; 2 : φ; 3 : χ⟩ + |1 : χ; 2 : ω; 3 : φ⟩ 6
S |u⟩ =
+ |1 : φ; 2 : ω; 3 : χ⟩ + |1 : χ; 2 : φ; 3 : ω⟩ + |1 : ω; 2 : χ; 3 : φ⟩)
(C-9)
Diesen Vektor müssen wir normieren. Zunächst nehmen wir an, dass die drei Vektoren |φ⟩, |χ⟩ und |ω⟩ orthogonal sind. Die sechs Vektoren, die auf der rechten Seite von Gl. (C-9) auftreten, sind dann eben falls orthogonal. Wir haben also zur Normierung des Vektors (C-9) lediglich den Faktor 1/6 durch 1/√6 zu ersetzen. Sind die beiden Vektoren |φ⟩ und |χ⟩ gleich und außerdem orthogonal zu |ω⟩, treten auf der rechten Seite von (C-9) nur drei verschiedene Vektoren auf. Man kann
1442 | XIV Systeme identischer Teilchen
dann zeigen, dass der physikalische Vektor |φ; φ; ω⟩ =
1 (|1 : φ; 2 : φ; 3 : ω⟩ √3 + |1 : φ; 2 : ω; 3 : φ⟩ + |1 : ω; 2 : φ; 3 : φ⟩)
(C-10)
lautet. Sind die drei Zustände |φ⟩, |χ⟩, |ω⟩ schließlich alle gleich, so ist der Vektor |u⟩ = |1 : φ; 2 : φ; 3 : φ⟩
(C-11)
bereits symmetrisch und normiert. β Fermionen Die Anwendung von A auf |u⟩ ergibt A |u⟩ =
1 ∑ ε α P α |1 : φ; 2 : χ; 3 : ω⟩ 3! α
(C-12)
Die Vorzeichen der verschiedenen Terme der Summe (C-12) gehorchen derselben Re gel, die auch bei der Berechnung einer 3 × 3-Determinante Anwendung findet. Es ist deshalb zweckmäßig, A|u⟩ in Form einer Slater-Determinante zu schreiben: |1 : φ⟩ 1 A |u⟩ = |2 : φ⟩ 3! |3 : φ⟩
|1 : χ⟩ |2 : χ⟩ |3 : χ⟩
|1 : ω⟩ |2 : ω⟩ |3 : ω⟩
(C-13)
Der Vektor A|u⟩ ist null, wenn zwei der Einzelzustände |φ⟩, |χ⟩ oder |ω⟩ überein stimmen, da die Determinante (C-13) dann zwei gleiche Spalten aufweist. Wir finden also wieder das Ausschließungsprinzip von Pauli (s. § C-3-b): Derselbe Quantenzu stand kann nicht gleichzeitig von mehreren identischen Fermionen besetzt sein. Schließlich halten wir fest: Sind die drei Zustände |φ⟩, |χ⟩, |ω⟩ orthogonal, so sind dies auch die sechs Ketvektoren auf der rechten Seite von Gl. (C-12). Zur Normierung von A|u⟩ muss man also nur den Faktor 1/3! in Gl. (C-12) bzw. Gl. (C-13) durch 1/√3! ersetzen. Besteht das betrachtete physikalische System aus mehr als drei identischen Fer mionen, so tritt keine wesentliche Veränderung ein. Es lässt sich zeigen, dass es für N identische Bosonen stets möglich ist, aus beliebigen Einzelzuständen |φ⟩, |χ⟩, . . . den physikalischen Zustand S|u⟩ zu konstruieren. Für Fermionen kann der physikalische Vektor A|u⟩ in Form einer N × N-Slater-Determinante geschrieben werden; dadurch werden die Fälle ausgeschlossen, für die zwei Einzelzustände übereinstimmen (der Vektor A|u⟩ ist dann null). Die Konsequenzen, die sich aus dem neuen Postulat er geben, können also für Fermionen und Bosonen ganz verschieden sein. Wir werden darauf in § D zurückkommen.
C Das Symmetrisierungspostulat | 1443
C-3-d Konstruktion einer Basis im Raum der physikalischen Zustände Wir betrachten ein System aus N identischen Teilchen. Ausgehend von einer Basis {|u i ⟩} im Zustandsraum eines einzelnen Teilchens können wir im Tensorprodukt raum H die Basis {|1 : u i ; 2 : u j ; . . . ; N : u p ⟩} konstruieren. Der Raum der physikalischen Zustände ist jedoch nicht H, sondern der Unterraum HS bzw. HA . Darum müssen wir in einem dieser Räume eine Basis bestim men. Durch Anwendung von S (bzw. A) auf die Basisvektoren {|1 : u i ; 2 : u j ; . . . ; N : u p ⟩} erhalten wir eine Menge von Vektoren, die HS (oder HA ) aufspannen. Es sei z. B. |φ⟩ ein beliebiger Vektor aus HS (der Fall, dass |φ⟩ aus HA ist, lässt sich genauso behan deln); |φ⟩ gehört zu H und kann somit entwickelt werden: |φ⟩ = ∑ a i,j,...,p |1 : u i ; 2 : u j ; . . . ; N : u p ⟩
(C-14)
i,j,...,p
Weil |φ⟩ nach Voraussetzung zu HS gehört, gilt S|φ⟩ = |φ⟩; wir wenden den Ope rator S auf beide Seiten von Gl. (C-14) an, um zu zeigen, dass sich |φ⟩ in Form einer Linearkombination der Vektoren S|1 : u i ; 2 : u j ; . . . ; N : u p ⟩ ausdrücken lässt. Dabei müssen wir jedoch beachten, dass die Vektoren S|1 : u i ; 2 : u j ; . . . ; N : u p ⟩ nicht unabhängig voneinander sind. Vertauschen wir die Rollen der einzelnen Teil chen in einem Vektor |1 : u i ; 2 : u j ; . . . ; N : u p ⟩ der ursprünglichen Basis (vor der Sym metrisierung), so führt die Anwendung von S oder A auf diesen neuen Vektor nach Gl. (B-62) und Gl. (B-63) auf denselben Vektor in HS bzw. HA (möglicherweise mit ei nem Vorzeichenwechsel). Wir führen darum den Begriff der Besetzungszahl ein: Bei einem Vektor |1 : u i ; 2 : u j ; . . . ; N : u p ⟩ ist die Besetzungszahl n k des Einzelzustands |u k ⟩ gleich der Anzahl des Auftretens dieses Zustands in der Folge {|u i ⟩, |u j ⟩, . . . , |u p ⟩}, also gleich der An zahl der Teilchen, die sich im Zustand |u k ⟩ befinden (offenbar gilt ∑k n k = N). Zwei verschiedene Kets |1 : u i ; 2 : u j ; . . . ; N : u p ⟩, für die alle Besetzungszahlen gleich sind, gehen durch die Wirkung eines Permutationsoperators auseinander hervor. Folglich liefern sie nach Anwendung des Symmetrisierungsoperators S (bzw. des Antisymme trisierungsoperators A) denselben physikalischen Zustand. Wir bezeichnen ihn mit |n1 , n2 , . . . , n k , . . .⟩: |n1 , n2 , . . . , n k , . . .⟩ = c S |1 : u 1 ; 2 : u 1 ; . . . ; n1 : u 1 ; ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ n1 + 1 : u 2 ; . . . ; n1 + n2 : u 2 ; . . .⟩ ⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟⏟ n1 Teilchen
n2 Teilchen
im Zustand |u1 ⟩
im Zustand |u2 ⟩
(C-15)
1444 | XIV Systeme identischer Teilchen
Für Fermionen müssen wir in Gl. (C-15) S durch den Antisymmetrisierungsoperator A ersetzen (c ist ein Normierungsfaktor⁶). Wir wollen die Eigenschaften der Zustände |n1 , n2 , . . . , n k , . . .⟩ hier nicht im Einzelnen untersuchen, sondern nur einige ihrer wichtigsten Eigenschaften angeben: 1. Das Skalarprodukt von |n1 , n2 , . . . , n k , . . .⟩ und |n1 , n2 , . . . , nk , . . .⟩ ist nur dann von null verschieden, wenn alle Besetzungszahlen gleich sind (n k = nk für alle k). Mit Gl. (C-15) und den Definitionen (B-49) und (B-50) von S und A erhalten wir die Entwicklung der beiden Vektoren in der Orthonormalbasis {|1 : u i ; 2 : u j ; . . . ; N : u p ⟩}. Sind die Besetzungszahlen nicht alle gleich, so können die beiden Vekto ren nicht gleichzeitig nichtverschwindende Komponenten in Bezug auf denselben Basisvektor haben. 2. Sind die Teilchen Bosonen, so bilden die Kets |n1 , n2 , . . . , n k , . . .⟩ mit beliebigen Besetzungszahlen n k (mit ∑k n k = N) eine Orthonormalbasis im Raum der physi kalischen Zustände. Wir zeigen, dass für Bosonen die durch Gl. (C-15) definierten Vektoren nie gleich null sind. Dazu setzen wir für den Operator S seine Definition (B-49) ein. Auf der rechten Seite von Gl. (C-15) treten dann verschiedene orthogonale Vektoren |1 : u i ; 2 : u j ; . . . ; N : u p ⟩ auf, deren Koeffizienten alle positiv sind; |n1 , n2 , . . . , n k , . . .⟩ kann somit nicht gleich dem Nullvektor sein. Die Vektoren |n1 , n2 , . . . , n k , . . .⟩ bilden in HS eine Basis, denn sie spannen HS auf, sind alle ungleich null und zueinander orthogonal. 3. Besteht das System aus identischen Fermionen, so bilden die Ketvektoren |n1 , n2 , . . . , n k , . . .⟩ (mit n k gleich null oder eins und ∑k n k = N) eine Basis im Raum HA der physikalischen Zustände. Beim Beweis müssen wir jetzt beachten, dass in der Definition (B-50) von A vor den ungeraden Permutationen ein Minuszeichen auftritt. Außerdem wissen wir, dass zwei identische Fermionen nicht denselben Quantenzustand besetzen kön nen: Ist eine Besetzungszahl größer als eins, so ist der durch Gl. (C-15) definier te Vektor gleich null. Dagegen ist er niemals gleich null, wenn alle Besetzungs zahlen gleich eins oder null sind. Zwei Teilchen befinden sich dann nämlich nie im selben Einzelzustand, so dass die Ketvektoren |1 : u i ; 2 : u j ; . . . ; N : u p ⟩ und P α |1 : u i ; 2 : u j ; . . . ; N : u p ⟩ stets voneinander verschieden und orthogonal sind. In diesem Fall wird durch Gl. (C-15) ein nichtverschwindender physikalischer Zu stand definiert. Der Rest des Beweises erfolgt wie oben für Bosonen.
6 Für Bosonen ergibt sich c = √ N!/n 1 !n 2 ! . . . und für Fermionen c = √N!.
C Das Symmetrisierungspostulat
| 1445
C-4 Anwendung der anderen Postulate Es bleibt die Frage, wie die allgemeinen Postulate der Quantenmechanik bei Berück sichtigung des Symmetrisierungspostulats anzuwenden sind und ob vielleicht Wider sprüche auftreten. Wir wollen darum sehen, wie die Messprozesse unter Verwendung von Zustandsvektoren beschrieben werden können, die ausschließlich zum Raum HS bzw. HA gehören. Wir werden zeigen, dass der Zustandsvektor |ψ(t)⟩ des physikali schen Systems während seiner zeitlichen Entwicklung diesen Unterraum nie verlässt: Der gesamte quantenmechanische Formalismus kann also innerhalb von HS bzw. HA angewendet werden. C-4-a Postulate über den Messprozess α Wahrscheinlichkeit Wir betrachten eine Messung an einem System aus identischen Teilchen. Der Vektor |ψ(t)⟩, mit dem man den Quantenzustand des Systems vor der Messung beschreibt, gehört nach dem Symmetrisierungspostulat bei einem Bosonensystem zu HS und bei einem Fermionensystem zu HA . Zur Berechnung der Wahrscheinlichkeit, mit der wir das System bei einer Messung im Zustand |u⟩ finden, müssen wir nach den Postulaten in Kapitel III das Skalarprodukt von |ψ(t)⟩ mit dem Vektor |u⟩ bilden. Dieser Vektor |u⟩ wird nach der Regel in § C-3-a konstruiert, so dass die Wahrscheinlichkeitsamplitude ⟨u|ψ(t)⟩ in Abhängigkeit von zwei Vektoren ausgedrückt wird, die beide zu HS (bzw. HA ) gehören. In § D-2 werden wir Beispiele diskutieren. Wenn es sich bei der betrachteten Messung um eine vollständige Messung handelt (man ermittelt z. B. die Lagen und die z-Komponenten der Spins aller Teilchen), so ist der physikalische Vektor |u⟩ (bis auf einen Faktor) eindeutig. Ist andererseits die Messung unvollständig (z. B. eine Messung nur der Teilchenspins, oder eine Messung nur an einem Teilchen), so erhält man mehrere orthogonale physikalische Vektoren und man muss die zugehörigen Wahrscheinlichkeiten summieren. β Physikalische Observable. Invarianz von HS und HA In bestimmten Fällen kann man die Systemobservablen explizit durch die Einzelteil chenobservablen R1 , P1 , S1 , R2 , P2 , S2 usw. ausdrücken. Für ein System, das aus drei identischen Teilchen besteht, geben wir einige Bei spiele: – Systemschwerpunkt RG , Gesamtimpuls P und Gesamtdrehimpuls L: 1 (R1 + R2 + R3 ) 3 P = P1 + P 2 + P 3
RG =
L = L1 + L2 + L3
(C-16) (C-17) (C-18)
1446 | XIV Systeme identischer Teilchen
–
elektrostatische Abstoßungsenergie: W=
–
q2 1 1 1 ( + + ) 4πε0 |R1 − R2 | |R2 − R3 | |R3 − R1 |
(C-19)
Gesamtspin: S = S1 + S2 + S3
(C-20)
In allen Ausdrücken spielen die Observablen der Einzelteilchen eine symmetrische Rolle. Diese wichtige Eigenschaft folgt unmittelbar aus der Identität der drei Teilchen: In Gl. (C-16) z. B. stehen bei R1 , R2 und R3 dieselben Koeffizienten, da die drei Teil chen dieselbe Masse besitzen. Die symmetrische Form von Gl. (C-19) beruht auf der Gleichheit der Ladungen. Weil allgemein keine physikalische Eigenschaft des Systems modifiziert wird, wenn man die identischen Teilchen vertauscht, muss jede tatsäch lich messbare Observable in Bezug auf die Observablen der N identischen Teilchen symmetrisch sein, und zwar sowohl bei Bosonen- wie Fermionensystemen. Mathe matisch ausgedrückt ist die entsprechende Observable G, die wir eine physikalische Observable nennen wollen, gegenüber allen Permutationen der N identischen Teil chen invariant. Sie muss daher mit allen Permutationsoperatoren P α der N Teilchen vertauschen (s. § B-2-d): [G, P α ] = 0 für alle P α
(C-21)
Besteht ein System aus zwei identischen Teilchen, so ist z. B. die Observable R1 − R2 (die Differenz der Ortsvektoren der beiden Teilchen) nicht invariant gegenüber der Per mutation P21 (denn R1 − R2 ändert sein Vorzeichen), darum also keine physikalische Observable. In der Tat müsste man bei einer Messung von R1 − R2 voraussetzen, dass Teilchen (1) von Teilchen (2) unterscheidbar ist. Der Abstand √(R1 − R2 )2 zwischen den beiden Teilchen ist hingegen als symmetrischer Ausdruck messbar. Aus Gl. (C-21) folgt, dass sowohl HS als auch HA in Bezug auf die Wirkung einer physikalischen Observablen G invariant sind. Wir zeigen, dass mit |ψ⟩ auch G|ψ⟩ zu HA gehört (derselbe Beweis gilt dann auch für HS ). Gehört |ψ⟩ zu HA , so bedeutet das P α |ψ⟩ = ε α |ψ⟩
(C-22)
Wir berechnen nun P α G|ψ⟩: Nach Gl. (C-21) und Gl. (C-22) gilt P α G |ψ⟩ = GP α |ψ⟩ = ε α G |ψ⟩
(C-23)
Weil die Permutation P α beliebig ist, folgt aus dieser Beziehung, dass G|ψ⟩ total anti symmetrisch ist und zu HA gehört. Somit können alle Operationen, die man üblicherweise mit einer Observablen vor nimmt, insbesondere die Bestimmung von Eigenwerten und Eigenvektoren, vollstän dig innerhalb des Unterraums HS bzw. HA ausgeführt werden. Man behält nur die zum physikalischen Unterraum gehörenden Eigenvektoren von G mit den zugehöri gen Eigenwerten.
C Das Symmetrisierungspostulat |
1447
Bemerkungen: 1. Wenn wir uns auf den Unterraum HS (bzw. HA ) beschränken, erhalten wir nicht unbedingt alle Eigenwerte von G, die es in H gibt. Durch das Symmetrisierungspostulat werden (unter Umstän den) bestimmte Eigenwerte unterdrückt. Es werden dem Spektrum von G jedoch keine neuen Ei genwerte hinzugefügt, denn wegen der Invarianz von HS (bzw. HA ) in Bezug auf die Wirkung von G ist jeder Eigenvektor von G in HS (bzw. HA ) ebenfalls Eigenvektor von G in H mit demselben Eigenwert. 2. Man kann versuchen, das Problem mathematisch zu behandeln und es in Abhängigkeit von den Observablen R1 , P1 , S1 usw. auszudrücken. Das ist aber nicht immer leicht. Man kann z. B. für ein System aus drei identischen Teilchen versuchen, die Observable, die zur gleichzeitigen Messung der drei Orte gehört, in Abhängigkeit von R1 , R2 und R3 anzugeben. Hierzu könnte man mehrere physikalische Observable betrachten, die man so wählt, dass bei ihrer Messung eindeutig auf die Lage der Teilchen geschlossen werden kann (ohne dass man jedem Ort ein nummeriertes Teilchen zuzuordnen vermag). Zum Beispiel könnte man die Menge X1 + X2 + X3 , X1 X2 + X2 X3 + X3 X1 , X1 X2 X3 (und die entsprechenden Observablen für die Y- und Z-Koordinate) wählen. Allerdings ist ein sol ches Vorgehen sehr formal. Anstatt zu versuchen, in jedem Fall den Ausdruck für die Observablen anzugeben, ist es einfacher, sich der oben beschriebenen Methode zu bedienen, bei der wir uns auf die Verwendung der physikalischen Eigenvektoren der Messung beschränkt haben.
C-4-b Postulate über die zeitliche Entwicklung Der Hamilton-Operator eines Systems aus identischen Teilchen muss eine Observable sein. Wir betrachten z. B. den Hamilton-Operator für die Bewegung der beiden Elek tronen im Heliumatom um den als ruhend angenommenen Kern:⁷ H(1, 2) =
P21 P2 2e2 2e2 e2 + 2 − − + 2me 2me R1 R2 |R1 − R2 |
(C-24)
Die ersten beiden Terme beschreiben die kinetische Energie des Systems; sie sind sym metrisch, weil die beiden Massen gleich sind. Die nächsten beiden Terme stellen die Anziehung des Kerns dar (dessen Ladung zweimal so groß wie die des Protons ist). Die Elektronen unterliegen dieser Anziehung offensichtlich auf die gleiche Weise. Der letzte Term beschreibt schließlich die gegenseitige Wechselwirkung der Elektronen untereinander. Auch er ist symmetrisch, da keines der beiden Elektronen vor dem an deren ausgezeichnet ist. Offenbar lässt sich diese Überlegung für ein beliebiges System identischer Teilchen verallgemeinern. Folglich vertauschen alle Permutationsopera toren mit dem Hamilton-Operator des Systems: [H, P α ] = 0
(C-25)
Wenn es sich also bei dem Vektor |ψ(t0 )⟩, der das System zu einer gegebenen Zeit t0 beschreibt, um einen physikalischen Vektor handelt, muss dasselbe auch für 7 Wir betrachten hier nur die wichtigsten Terme dieses Hamilton-Operators; s. Ergänzung BXIV für eine genauere Untersuchung des Heliumatoms.
1448 | XIV Systeme identischer Teilchen den Vektor |ψ(t)⟩ gelten, der sich aus |ψ(t0 )⟩ als Lösung der Schrödinger-Gleichung ergibt. Danach ist |ψ(t + dt)⟩ = (1 +
dt H) |ψ(t)⟩ iℏ
(C-26)
Wenden wir P α an und berücksichtigen Gl. (C-25), so erhalten wir P α |ψ(t + dt)⟩ = (1 +
dt H) P α |ψ(t)⟩ iℏ
(C-27)
Wenn also |ψ(t)⟩ Eigenvektor von P α ist, so ist auch |ψ(t+d t)⟩ Eigenvektor von P α zum selben Eigenwert. Da |ψ(t0 )⟩ nach Voraussetzung ein total symmetrischer oder total antisymmetrischer Vektor ist, bleibt diese Eigenschaft zeitlich erhalten. Das Symmetrisierungspostulat ist also auch mit dem Postulat über die zeitliche Entwicklung eines physikalischen Systems verträglich: Die Schrödinger-Gleichung belässt den Vektor |ψ(t)⟩ in HS bzw. HA .
D Physikalische Diskussion In diesem abschließenden Abschnitt werden wir auf die Konsequenzen eingehen, die sich aus dem Symmetrisierungspostulat für die physikalischen Eigenschaften eines Systems identischer Teilchen ergeben. Zunächst nennen wir die grundlegenden Un terschiede, die sich durch das Paulische Ausschließungsprinzip zwischen Systemen aus identischen Bosonen und Systemen aus identischen Fermionen ergeben. Danach untersuchen wir die Auswirkungen des Symmetrisierungspostulats auf die Berech nung von Wahrscheinlichkeiten.
D-1 Unterschiede zwischen Bosonen und Fermionen In der Formulierung des Symmetrisierungspostulats mag der Unterschied zwischen Bosonen und Fermionen unbedeutend erscheinen. Der schlichte Vorzeichenwechsel in Bezug auf die Symmetrie des physikalischen Vektors hat jedoch tiefgreifende Kon sequenzen. Wie wir in § C-3 sahen, schränkt das Symmetrisierungspostulat die Einzel zustände, die einem System identischer Bosonen zugänglich sind, nicht ein. Fermio nen müssen jedoch dem Ausschließungsprinzip von Pauli gehorchen: Zwei identische Fermionen können nicht denselben Quantenzustand besetzen. Das Ausschließungsprinzip wurde ursprünglich formuliert, um die Eigenschaften von Mehrelektronenatomen zu erklären (s. § D-1-a und Ergänzung AXIV ). Es gilt jedoch nicht nur für Elektronen, sondern ist eine Folgerung aus dem Symmetrisierungspos tulat und muss auf alle Systeme aus identischen Fermionen angewendet werden. Es führte zu oft spektakulären Vorhersagen, die aber durchweg experimentell bestätigt werden konnten. Wir wollen einige Beispiele angeben.
D Physikalische Diskussion
| 1449
D-1-a Grundzustand eines Systems unabhängiger identischer Teilchen Der Hamilton-Operator eines Systems aus identischen Bosonen bzw. Fermionen ist immer symmetrisch in Bezug auf Permutationen dieser Teilchen (§ C-4). Besteht ein solches System aus (zumindest in erster Näherung) voneinander unabhängigen Teil chen, so ist der Hamilton-Operator eine Summe von Einteilchenoperatoren: H(1, 2, . . . , N) = h(1) + h(2) + ⋅ ⋅ ⋅ + h(N)
(D-1)
h(1) ist dabei nur eine Funktion der Observablen des mit (1) nummerierten Teil chens. Aus der Identität der Teilchen (also der Symmetrie des Hamilton-Operators H(1, 2, . . . , N) folgt, dass h für alle N Terme gleich ist. Um die Eigenzustände und Eigenwerte des Gesamt-Hamilton-Operators H(1, 2, . . . , N) zu bestimmen, genügt es daher, das Problem des Einteilchen-Hamilton-Operators h(j) im Zustandsraum H(j) zu lösen: h(j) |φ n ⟩ = e n |φ n ⟩ ;
|φ n ⟩ ∈ H(j)
(D-2)
Der Einfachheit halber nehmen wir an, dass das Spektrum von h(j) diskret und nicht entartet ist. Für ein System aus identischen Bosonen ergeben sich die physikalischen Eigen vektoren des Hamilton-Operators H(1, 2, . . . , N) durch Symmetrisierung der Tensor produkte von N beliebigen Einzelzuständen |φ n ⟩: (S)
|Φ n1 ,n2 ,...,n N ⟩ = c ∑ P α |1 : φ n1 ; 2 : φ n2 ; . . . ; N : φ n N ⟩
(D-3)
α
wobei die zugehörige Energie gleich der Summe der N Einzelenergien ist: E n1 ,n2 ,...,n N = e n1 + e n2 + . . . + e n N
(D-4)
[es lässt sich zeigen, dass jeder Vektor auf der rechten Seite von Gl. (D-3) Eigenvektor von H zum Eigenwert (D-4) ist; dasselbe gilt auch für ihre Summe]. Bezeichnet insbe sondere e1 den kleinsten Eigenwert von h(j) und |φ1 ⟩ den zugehörigen Eigenvektor, so erhält man den Grundzustand des Systems, wenn sich alle N identischen Bosonen im Zustand |φ1 ⟩ befinden. Die Energie dieses Grundzustands ist E1,1,...,1 = N e1
(D-5)
und sein Zustandsvektor lautet (S)
|Φ1,1,...,1 ⟩ = |1 : φ1 ; 2 : φ1 ; . . . ; N : φ1 ⟩
(D-6)
Sind jetzt die N identischen Teilchen Fermionen, so können sie sich nicht mehr im selben Einzelzustand |φ1 ⟩ befinden: Wir müssen beim Grundzustand des Systems das Paulische Ausschließungsprinzip beachten. Ordnen wir die Einzelenergien in an steigender Folge an, e1 < e2 < . . . < e n−1 < e n < e n+1 < . . .
(D-7)
so hat der Grundzustand die Energie E1,2,...,N = e1 + e2 + . . . + e N
(D-8)
1450 | XIV Systeme identischer Teilchen
und wird durch den normierten physikalischen Vektor |1 : φ ⟩ |1 : φ ⟩ . . . |1 : φ ⟩ 1 2 N |2 : φ1 ⟩ |2 : φ2 ⟩ . . . |2 : φ N ⟩ 1 (A) |Φ1,2,...,N ⟩ = (D-9) .. √N! . |N : φ1 ⟩ |N : φ2 ⟩ . . . |N : φ N ⟩ beschrieben. Die größte Einzelenergie e N , die im Grundzustand auftritt, wird als Fer mi-Energie des Systems bezeichnet. Das Ausschließungsprinzip von Pauli spielt somit in allen Bereichen der Physik eine grundlegende Rolle, in denen Mehrelektronensysteme auftreten, wie etwa in der Atom- und Molekülphysik (s. Ergänzungen AXIV und BXIV ) oder in der Festkörperphy sik (Ergänzung CXIV ). Es muss aber auch in der Kernphysik beachtet werden, in der man es mit Protonen- und Neutronensystemen zu tun hat.⁸ Bemerkung: Häufig sind die Einzelenergien e n entartet. Sie können dann in der Summe (D-8) so oft auftreten, wie es der Grad der Entartung angibt.
D-1-b Quantenstatistik Gegenstand der statistischen Mechanik ist die Untersuchung von Systemen, die aus einer sehr großen Anzahl von Teilchen bestehen (oft sind ihre Wechselwirkungen so gering, dass man sie in erster Ordnung vernachlässigen kann). Da man den mikro skopischen Zustand eines Systems nicht genau kennt, beschränkt man sich auf eine globale Beschreibung anhand makroskopischer Eigenschaften (Druck, Temperatur, Dichte usw.). Ein bestimmter makroskopischer Zustand entspricht dann einer großen Anzahl mikroskopischer Zustände. Man führt darum Wahrscheinlichkeiten ein: Das statistische Gewicht eines makroskopischen Zustands ist proportional zur Anzahl der zu ihm gehörenden verschiedenen mikroskopischen Zustände, und das System befin det sich im thermodynamischen Gleichgewicht, wenn sein makroskopischer Zustand (unter Beachtung der Randbedingungen) der wahrscheinlichste ist. Für die Untersu chung der makroskopischen Eigenschaften eines Systems muss man daher wissen, wie viele mikroskopische Zustände die gegebenen Charakteristika besitzen, insbeson dere wie viele eine bestimmte Energie aufweisen. In der klassischen statistischen Mechanik (Maxwell-Boltzmann-Statistik) behan delt man die N Teilchen des Systems auch dann, wenn sie identisch sind, als unter scheidbar. Der mikroskopische Zustand wird durch die Angabe der Einzelzustände der N Teilchen definiert. Zwei mikroskopische Zustände werden als verschieden angese hen, wenn die N Einzelzustände zwar gleich sind, sie sich aber durch eine Permutati on der Teilchen unterscheiden. 8 Der Zustandsvektor für einen Kern muss sowohl in Bezug auf die Neutronen als auch auf die Proto nen antisymmetrisch sein.
D Physikalische Diskussion
| 1451
In der statistischen Quantenmechanik muss das Symmetrisierungspostulat be rücksichtigt werden. Der mikroskopische Zustand eines Systems aus identischen Teil chen wird durch Aufzählung der N Einzelzustände angegeben. Dabei spielt die An ordnung dieser Zustände keine Rolle, da ihr Tensorprodukt symmetrisiert oder anti symmetrisiert werden muss. Die Zählung der mikroskopischen Zustände führt daher nicht auf dasselbe Ergebnis wie in der klassischen statistischen Mechanik. Außerdem sind durch das Pauli-Prinzip Systeme identischer Bosonen und Systeme identischer Fermionen grundlegend anders zu behandeln: Die Anzahl an Teilchen, die einen be stimmten Einzelzustand besetzen, kann für Fermionen eins nicht übersteigen, wäh rend sie für Bosonen jeden beliebigen Wert annehmen kann (s. § C-3). Daraus ergeben sich unterschiedliche statistische Eigenschaften: Bosonen gehorchen der Bose-Ein stein-Statistik, Fermionen der Fermi-Dirac-Statistik. Die Bezeichnung „Bosonen“ bzw. „Fermionen“ rührt daher. Die physikalischen Eigenschaften von Systemen identischer Fermionen bzw. identischer Bosonen sind sehr verschieden. Das lässt sich z. B. bei tiefen Temperatu ren beobachten. Für identische Bosonen ist es dann möglich, sich im Einzelzustand der kleinstmöglichen Energie zu sammeln (dieses Phänomen wird als Bose-Kondensa tion bezeichnet), während Fermionen den Einschränkungen des Pauli-Prinzips unter liegen. Die Bose-Kondensation ist die Ursache für die Superfluidität des 4 He-Isotops von Helium, während das 3 He-Isotop als Fermion (s. die Bemerkung in § C-1) ein anderes Verhalten zeigt. D-2 Folgerungen aus der Ununterscheidbarkeit In der Quantenmechanik werden alle Vorhersagen über die Eigenschaften eines Sys tems in Form von Wahrscheinlichkeitsamplituden (Skalarprodukte zweier Zustands vektoren) oder Matrixelementen eines Operators ausgedrückt. Es kann daher nicht überraschen, dass die Symmetrisierung oder Antisymmetrisierung dazu führt, dass in Systemen identischer Teilchen bestimmte Interferenzeffekte auftreten. Wir beschrei ben zunächst diese Effekte und zeigen dann, dass sie unter gewissen Bedingungen verschwinden (die eigentlich identischen Teilchen verhalten sich dann, wie wenn sie unterscheidbar wären). Zur Vereinfachung der Diskussion beschränken wir uns auf Systeme, die nur zwei identische Teilchen enthalten. D-2-a Interferenzen zwischen direkten Prozessen und Austauschprozessen α Vorhersagen für die Messung: direkter Term und Austauschterm Wir betrachten ein System von zwei identischen Teilchen, wobei sich das eine im Ein zelzustand |φ⟩ und das andere im Einzelzustand |χ⟩ befindet. Wir nehmen |φ⟩ und |χ⟩ als orthogonal an, so dass der Zustand des Systems durch den normierten physikali schen Vektor [s. Gl. (C-4)] 1 |φ; χ⟩ = (D-10) (1 + εP21 ) |1 : φ; 2 : χ⟩ √2
1452 | XIV Systeme identischer Teilchen
mit {+1 für Bosonen ε={ (D-11) −1 für Fermionen { beschrieben wird. Wir messen an jedem Teilchen dieselbe physikalische Größe B, zu der die Obser vablen B(1) bzw. B(2) gehören. Der Einfachheit halber sei das Spektrum von B diskret und nichtentartet, B |u i ⟩ = b i |u i ⟩
(D-12)
Wie groß ist dann die Wahrscheinlichkeit, bestimmte Werte (b n für das eine Teilchen und b n für das andere) zu erhalten? Es seien zunächst b n und b n verschieden, so dass die zugehörigen Eigenvektoren |u n ⟩ und |u n ⟩ orthogonal sind. Unter diesen Be dingungen ist der durch das Messergebnis definierte (normierte) physikalische Vektor 1 (D-13) |u n ; u n ⟩ = (1 + εP21 ) |1 : u n ; 2 : u n ⟩ √2 und die Wahrscheinlichkeitsamplitude für dieses Resultat lautet 1 (D-14) ⟨u n ; u n | φ; χ⟩ = ⟨1 : u n ; 2 : u n | (1 + εP†21 ) (1 + εP21 ) | 1 : φ; 2 : χ⟩ 2 Mit Hilfe der Eigenschaften (B-13) und (B-14) des Operators P21 können wir schreiben 1 (D-15) (1 + εP†21 ) (1 + εP21 ) = 1 + εP21 2 so dass aus Gl. (D-14) wird ⟨u n ; u n | φ; χ⟩ = ⟨1 : u n ; 2 : u n | (1 + εP21 ) | 1 : φ; 2 : χ⟩
(D-16)
Lassen wir 1 + εP21 auf den Bravektor wirken, so erhalten wir ⟨u n ; u n | φ; χ⟩ = ⟨1 : u n ; 2 : u n | 1 : φ; 2 : χ⟩ + ε⟨1 : u n ; 2 : u n | 1 : φ; 2 : χ⟩ = ⟨1 : u n | 1 : φ⟩⟨2 : u n | 2 : χ⟩ + ε⟨1 : u n | 1 : φ⟩⟨2 : u n | 2 : χ⟩ = ⟨u n | φ⟩⟨u n | χ⟩ + ε⟨u n | φ⟩⟨u n | χ⟩
(D-17)
Die Nummerierung ist aus der Wahrscheinlichkeitsamplitude herausgefallen, und sie wird jetzt direkt mit Hilfe der Skalarprodukte ⟨u n |φ⟩, . . . , ⟨u n |χ⟩ ausgedrückt. Sie ist weiter entweder die Summe (für Bosonen) oder die Differenz (für Fermionen) von zwei Termen, denen wir die Diagramme von Abb. 4a bzw. 4b zuordnen können. Das Ergebnis (D-17) lässt sich in folgender Weise interpretieren: Die beiden Ketvek toren |φ⟩ und |χ⟩ des Anfangszustands können mit den beiden Bravektoren ⟨u n | und ⟨u n | des Endzustands über zwei verschiedene „Wege“ verbunden werden, die sche matisch in Abb. 4a und 4b dargestellt sind. Jedem Weg entspricht eine Wahrschein lichkeitsamplitude ⟨u n |φ⟩⟨u n |χ⟩ bzw. ⟨u n |φ⟩⟨u n |χ⟩, die für Bosonen mit einem Plus zeichen und für Fermionen mit einem Minuszeichen interferieren. Somit lautet die
D Physikalische Diskussion
(a)
| 1453
(b)
Abb. 4: Schematisierung des direkten Terms und des Austauschterms für eine Messung an einem System aus zwei identischen Teilchen. Vor der Messung weiß man, dass sich ein Teilchen im Zu stand |φ⟩ und das andere im Zustand |χ⟩ befindet. Das Messergebnis entspricht einer Situation, bei der ein Teilchen im Zustand |u n ⟩ und das andere im Zustand |u n ⟩ ist. Zu einer solchen Messung gehören zwei Wahrscheinlichkeitsamplituden: Sie sind schematisch in (a) und (b) dargestellt und interferieren für Bosonen mit dem Pluszeichen und für Fermionen mit dem Minuszeichen.
Antwort auf die oben gestellte Frage: Die Wahrscheinlichkeit 𝒫 (b n ; b n ) ist gleich dem Betragsquadrat von (D-17): 𝒫(b n ; b n ) = |⟨u n | φ⟩⟨u n | χ⟩ + ε⟨u n | φ⟩⟨u n | χ⟩|2
(D-18)
Ein Term auf der rechten Seite von Gl. (D-17), zu dem z. B. der Weg 4a gehört, wird oft als direkter Term bezeichnet; der andere Term heißt Austauschterm. Bemerkung: Was geschieht, wenn die beiden Teilchen nicht identisch, sondern unterscheidbar sind? Wir wäh len als Anfangszustand des Systems das Tensorpodukt |ψ⟩ = |1 : φ; 2 : χ⟩
(D-19)
und verwenden ein Messinstrument, das die Teilchen (1) und (2) nicht unterscheiden kann: Sind die Ergebnisse b n und b n , so wissen wir nicht, ob b n zu Teilchen (1) oder zu Teilchen (2) ge hört (z. B. könnte für ein System, das aus einem Myon μ− und einem Elektron e− besteht, das Messinstrument nur die Ladung der Teilchen erfassen, während es keine Information über die Massen liefert). Die beiden Eigenzustände |1 : u n ; 2 : u n ⟩ und |1 : u n ; 2 : u n ⟩ (die in diesem Fall unterschiedliche physikalische Zustände darstellen) gehören dann zum selben Messergebnis. Da sie orthogonal sind, müssen wir die Wahrscheinlichkeiten addieren: 𝒫 (b n ; b n ) = |⟨1 : u n ; 2 : u n |1 : φ; 2 : χ⟩|2 + |⟨1 : u n ; 2 : u n |1 : φ; 2 : χ⟩|2 = |⟨u n |φ⟩|2 |⟨u n |χ⟩|2 + |⟨u n |φ⟩|2 |⟨u n |χ⟩|2
(D-20)
Ein Vergleich von Gl. (D-18) mit Gl. (D-20) macht den wichtigen Unterschied in den quantenme chanischen Vorhersagen für Systeme deutlich, die einerseits aus identischen Teilchen und an dererseits aus unterscheidbaren Teilchen bestehen.
Wir betrachten nun den Fall, dass die beiden Zustände |u n ⟩ und |u n ⟩ gleich sind. Sind die beiden Teilchen Fermionen, so ist der entsprechende physikalische Zustand nach dem Pauli-Prinzip ausgeschlossen, und die Wahrscheinlichkeit 𝒫(b n ; b n ) ist gleich null. Für Bosonen haben wir andererseits |u n ; u n ⟩ = |1 : u n ; 2 : u n ⟩
(D-21)
1454 | XIV Systeme identischer Teilchen
und folglich 1 ⟨1 : u n ; 2 : u n | (1 + P21 ) | 1 : φ; 2 : χ⟩ √2 = √2 ⟨u n |φ⟩⟨u n |χ⟩
⟨u n ; u n | φ; χ⟩ =
(D-22)
woraus sich ergibt 𝒫(b n ; b n ) = 2|⟨u n |φ⟩⟨u n |χ⟩|2
(D-23)
Bemerkungen: 1. Vergleichen wir dieses Ergebnis mit dem oben betrachteten Fall, bei dem die beiden Teilchen verschieden sind, so müssen wir |φ; χ⟩ durch |1 : φ; 2 : χ⟩ und |u n ; u n ⟩ durch |1 : u n ; 2 : u n ⟩ erset zen, woraus sich die Wahrscheinlichkeitsamplitude ⟨u n |φ⟩⟨u n |χ⟩
(D-24)
ergibt; damit ist 𝒫 (b n ; b n ) = |⟨u n |φ⟩⟨u n |χ⟩|2
(D-25)
2. Für ein System von N identischen Teilchen gibt es im Allgemeinen N! verschiedene Austausch terme, die zur Wahrscheinlichkeitsamplitude addiert (bzw. von ihr subtrahiert) werden müssen. Für ein System aus drei identischen Teilchen in den Einzelzuständen |φ⟩, |χ⟩ und |ω⟩, bei dem die Messung die Werte b n , b n und b n liefert, sind die möglichen „Wege“ in Abb. 5 dargestellt. Es gibt sechs Wege (sie sind voneinander verschieden, wenn die drei Eigenwerte b n , b n und b n verschieden sind). Einige tragen zur Wahrscheinlichkeitsamplitude stets mit einem Pluszeichen bei, während andere das Vorzeichen ε haben (+ für Bosonen und − für Fermionen).
Abb. 5: Schematische Darstellung der sechs Wahrscheinlichkeitsamplituden für eine Messung an einem System aus drei identischen Teilchen. Vor der Messung befindet sich ein Teilchen im Zustand |φ⟩, ein anderes im Zustand |χ⟩ und das dritte im Zustand |ω⟩. Als Ergebnis der Messung ist ein Teil chen im Zustand |u n ⟩, eines im Zustand |u n ⟩ und das dritte im Zustand |u n ⟩. Die sechs Amplituden interferieren mit einem Vorzeichen, das unter jedem Weg angegeben ist (ε = +1 für Bosonen und −1 für Fermionen).
D Physikalische Diskussion
|
1455
β Beispiel: Elastischer Stoß Um die physikalische Bedeutung des Austauschterms zu verdeutlichen, wollen wir uns ein konkretes Beispiel ansehen (auf das wir uns bereits in § A-3-a bezogen): den elastischen Stoß zweier identischer Teilchen im Schwerpunktsystem.⁹ Anders als in § D-2-a-α müssen wir hier die zeitliche Entwicklung des Systems zwischen der An fangszeit, wenn sich das System im Zustand |ψi ⟩ befindet, und der Zeit t, zu der die Messung erfolgt, beachten. Wir werden allerdings sehen, dass dies das Problem nicht wesentlich ändert und der Austauschterm wie zuvor eingeht. Im Anfangszustand des Systems (Abb. 6a) bewegen sich die beiden Teilchen mit entgegengesetzt gleichen Impulsen aufeinander zu. Wir legen die z-Achse in Impuls richtung und bezeichnen den Impulsbetrag mit p. Ein Teilchen hat also den Impuls pez und das andere den Impuls −pez (wobei ez der Einheitsvektor der z-Achse ist). Den physikalischen Vektor, der diesen Anfangszustand repräsentiert, schreiben wir |ψi ⟩ =
1 (1 + εP21 ) |1 : pez ; 2 : −pez ⟩ √2
(D-26)
|ψi ⟩ ist der Zustand des Systems zur Zeit t0 vor dem Stoß.
(a)
(b)
Abb. 6: Stoß von zwei identischen Teilchen im Schwerpunktsystem: Es sind die Impulse der beiden Teilchen im Anfangszustand (a) und im gemessenen Enzustand (b) dargestellt. Der Teilchenspin wird nicht berücksichtigt.
Die Schrödinger-Gleichung ist linear. Folglich gibt es einen vom Hamilton-Operator abhängigen linearen Operator U(t, t ), dessen Anwendung auf |ψi ⟩ den Zustandsvek tor zur Zeit t liefert: |ψ(t)⟩ = U(t, t0 ) |ψi ⟩
(D-27)
9 Wir vereinfachen das Problem, weil wir nur auf den Zusammenhang zwischen dem direkten Term und dem Austauschterm eingehen wollen. Insbesondere wird der Spin der beiden Teilchen nicht be rücksichtigt. Die Rechnungen dieses Abschnitts bleiben jedoch für den Fall gültig, dass die Wech selwirkungen nicht spinabhängig sind und die beiden Teilchen sich anfangs im selben Spinzustand befinden.
1456 | XIV Systeme identischer Teilchen
(a)
(b)
Abb. 7: Stoß von zwei identischen Teilchen im Schwerpunktsystem: Schematische Darstellung der physikalischen Prozesse, die dem direkten Term und dem Austauschterm entsprechen. Die Streuamplituden interferieren für Bosonen mit einem Pluszeichen und für Fermionen mit einem Minuszeichen.
(Ergänzung FIII ). Insbesondere wird der Zustand des Systems zur Zeit t1 nach dem Stoß durch den physikalischen Vektor |ψ(t1 )⟩ = U(t1 , t0 ) |ψi ⟩
(D-28)
beschrieben. Da der Hamilton-Operator H symmetrisch ist, vertauscht der Zeitent wicklungsoperator U mit dem Permutationsoperator: [U(t, t ), P21 ] = 0
(D-29)
Wir berechnen nun die Wahrscheinlichkeitsamplitude dafür (s. § A-3-a), dass man die Teilchen in den entgegengesetzten Richtungen der durch den Einheitsvektor n defi nierten n-Achse nachweist (Abb. 6b). Den zu diesem Endzustand gehörenden physi kalischen Vektor schreiben wir |ψf ⟩ =
1 (1 + εP21 ) |1 : pn; 2 : −pn⟩ √2
(D-30)
Die gesuchte Wahrscheinlichkeitsamplitude ist also ⟨ψf | ψ(t1 )⟩ = ⟨ψf | U(t1 , t0 ) | ψi ⟩ 1 = ⟨1 : p n; 2 : −p n | (1 + εP†21 ) U(t1 , t0 ) (1 + εP21 ) | 1 : p ez ; 2 : −p ez ⟩ (D-31) 2 Mit Gl. (D-29) und unter Verwendung der Eigenschaften des Operators P21 erhalten wir schließlich ⟨ψf | U(t1 , t0 ) | ψi ⟩ = ⟨1 : pn; 2 : −pn | (1 + εP†21 ) U(t1 , t0 ) | 1 : pez ; 2 : −pez ⟩ = ⟨1 : pn; 2 : −pn | U(t1 , t0 ) | 1 : pez ; 2 : −pez ⟩ + ε⟨1 : −pn; 2 : pn | U(t1 , t0 ) | 1 : pez ; 2 : −pez ⟩
(D-32)
D Physikalische Diskussion
| 1457
Der direkte Term entspricht z. B. dem Prozess in Abb. 7a und der Austauschterm dem in Abb. 7b. Die Wahrscheinlichkeitsamplituden müssen addiert bzw. subtrahiert werden. Dadurch tritt, wenn wir das Betragsquadrat des Ausdrucks (D-32) bilden, ein Interferenzterm auf. Wenn wir n durch −n ersetzen, so wird dieser Ausdruck mit ε multipliziert, so dass die zugehörige Wahrscheinlichkeit bei dieser Transformation invariant ist. D-2-b Nichtberücksichtigung des Symmetrisierungspostulats Wäre die Anwendung des Symmetrisierungspostulats immer erforderlich, so wäre es unmöglich, die Eigenschaften eines Systems mit einer beschränkten Anzahl von Teil chen zu untersuchen. Man müsste dann alle mit den Teilchen des Systems identischen Teilchen des Universums mit berücksichtigen. Wir zeigen in diesem Abschnitt, dass das nicht notwendig ist. Unter bestimmten Bedingungen verhalten sich identische Teilchen so, als ob sie verschieden wären, und man kann dann das Symmetrisierungs postulat vernachlässigen und trotzdem zu richtigen physikalischen Vorhersagen ge langen. Nach dem vorherigen Abschnitt können wir erwarten, dass dies immer dann eintritt, wenn die durch das Symmetrisierungspostulat hervorgerufenen Austausch terme verschwinden. Wir geben zwei Beispiele. α Identische Teilchen in zwei getrennten Raumbereichen Wir betrachten zwei identische Teilchen, wobei sich das eine im Einzelzustand |φ⟩ und das andere im Zustand |χ⟩ befindet. Zur Vereinfachung der Notation vernach lässigen wir ihre Spins. Wir nehmen an, dass die Ausdehnungsbereiche der zu den Zuständen |φ⟩ und |χ⟩ gehörenden Wellenfunktionen räumlich voneinander getrennt sind: φ(r) = ⟨r|φ⟩ = 0
für r ∈ ̸ D
χ(r) = ⟨r|χ⟩ = 0
für r ∈ ̸ ∆
(D-33)
mit disjunkten Bereichen D und ∆. Diese Situation entspricht der in der klassischen Mechanik (§ A-2): Solange sich die Gebiete D und ∆ nicht überlappen, können die Teilchen „verfolgt“ werden; wir erwarten also, dass die Anwendung des Symmetri sierungspostulats nicht notwendig ist. Wir betrachten die Messung einer Observablen, die nur zu einem Teilchen gehört. Dazu müssen wir nur das Messinstrument so aufstellen, dass es nicht registriert, was im Bereich D bzw. im Bereich ∆ geschieht. Wird D auf diese Weise ausgeschlossen, betrifft die Messung nur das Teilchen in ∆ und umgekehrt. Wir nehmen nun eine Messung an beiden Teilchen gleichzeitig vor. Wir verwen den dazu zwei Messinstrumente, wobei das eine die in ∆ auftretenden Phänomene und das andere die in D auftretenden Phänomene nicht registriert. Wie lässt sich die Wahrscheinlichkeit für ein bestimmtes Ergebnis berechnen? Es seien |u⟩ und |v⟩ die
1458 | XIV Systeme identischer Teilchen
Einzelzustände, die zu den Messergebnissen der beiden Instrumente gehören. Da die Teilchen identisch sind, muss grundsätzlich das Symmetrisierungspostulat beach tet werden. In der Wahrscheinlichkeitsamplitude für das Messergebnis ist der direkte Term dann ⟨u|φ⟩⟨v|χ⟩ und der Austauschterm ⟨u|χ⟩⟨v|φ⟩. Aus der räumlichen Tren nung der Messinstrumente folgt aber u(r) = ⟨r|u⟩ = 0
für r ∈ ∆
v(r) = ⟨r|v⟩ = 0
für r ∈ D
(D-34)
Nach den Gleichungen (D-33) und (D-34) überlappen die beiden Wellenfunktionen u(r) und χ(r) bzw. v(r) und φ(r) nicht, so dass gilt ⟨u|χ⟩ = ⟨v|φ⟩ = 0
(D-35)
Der Austauschterm ist also null. Demnach ist es bei diesem Versuch nicht nötig, das Symmetrisierungspostulat anzuwenden. Das gewünschte Ergebnis lässt sich direkt er halten, indem wir die Teichen als unterscheidbar auffassen und z. B. dem Teilchen im Bereich D die Nummer 1 und dem in ∆ die Nummer 2 zuordnen. Vor der Messung wird der Zustand des Systems dann durch den Vektor |1 : φ; 2 : χ⟩ beschrieben, und dem Messergebnis entspricht der Vektor |1 : u; 2 : v⟩. Das Skalarprodukt der beiden Vektoren ergibt die Wahrscheinlichkeitsamplitude ⟨u|φ⟩⟨v|χ⟩. Damit haben wir gezeigt, dass die Existenz identischer Teilchen uns nicht daran hindert, beschränkte Systeme, die aus einer geringen Anzahl von Teilchen bestehen, für sich zu untersuchen. Bemerkung: In dem gewählten Anfangszustand befinden sich beide Teilchen in zwei verschiedenen Raumbe reichen. Außerdem wurde der Zustand des Systems durch die Angabe von zwei Einzelzuständen definiert. Kann man die Teilchen, nachdem das System eine zeitliche Entwicklung durchlaufen hat, immer noch als unabhängig voneinander ansehen? Tatsächlich ist das nur dann möglich, wenn die Teilchen in getrennten Raumbereichen bleiben und außerdem nicht miteinander wech selwirken. Eine Wechselwirkung erzeugt nämlich in jedem Fall Korrelationen zwischen den Teil chen, und es ist dann nicht mehr möglich, jedes Teilchen durch einen individuellen Zustandsvek tor zu beschreiben.
β Unterscheidung von Teilchen nach ihrer Spinrichtung Wir betrachten den elastischen Stoß zwischen zwei identischen Spin-1/2-Teilchen (z. B. Elektronen), wobei wir annehmen, dass spinabhängige Wechselwirkungen vernachlässigt werden können. Dann bleiben die Spins beider Teilchen während des Stoßes erhalten. Sind diese Spinzustände anfangs orthogonal, so können wir mit ihrer Hilfe die beiden Teilchen zu jeder Zeit unterscheiden, als wären sie nicht identisch. Das Symmetrisierungspostulat sollte demnach auch hier keinen Einfluss haben.
D Physikalische Diskussion
| 1459
Das lässt sich mit der obigen Rechnung zeigen: Der physikalische Anfangsvektor ist z. B. (Abb. 8a) |ψi ⟩ =
1 (1 − P21 ) |1 : p ez , +; 2 : −p ez , −⟩ √2
(D-36)
(wobei die Symbole + oder −, die nach den Impulsen angegeben sind, das Vorzeichen der Spinkomponenten längs einer bestimmten Achse angeben). Der betrachtete End zustand (Abb. 8b) wird beschrieben durch |ψf ⟩ =
1 (1 − P21 ) |1 : pn, +; 2 : −pn, −⟩ √2
(D-37)
Unter diesen Umständen ist nur der erste Term von Gl. (D-32) von null verschieden, da sich der zweite schreiben lässt ⟨1 : −p n, −; 2 : p n, + | U(t1 , t0 ) | 1 : p ez , +; 2 : −p ez , −⟩
(D-38)
Hier handelt es sich um das Matrixelement eines (nach Voraussetzung) spinunabhän gigen Operators zwischen zwei Vektoren, deren Spins orthogonal zueinander sind; es ist demnach gleich null. Wir würden also dasselbe Ergebnis erhalten, wenn wir die beiden Teilchen direkt als verschieden behandelt hätten, d. h. wenn wir die Anfangsund Endvektoren nicht antisymmetrisieren würden und dem Spinzustand |+⟩ den In dex 1 und dem Spinzustand |−⟩ den Index 2 zugeordnet hätten. Natürlich ist das nicht mehr möglich, wenn der Zeitentwicklungsoperator U und damit der Hamilton-Opera tor H des Systems, spinabhängig sind.
(a)
(b)
Abb. 8: Stoß von zwei identischen Spin-1/2-Teilchen im Schwerpunktsystem: schematische Dar stellung der Impulse und der Spins beider Teilchen im Anfangszustand (a) und im bei der Messung gefundenen Endzustand (b). Sind die Wechselwirkungen zwischen den beiden Teilchen spinunab hängig, so ändern sich die Spinorientierungen während des Stoßes nicht. Sind die beiden Teilchen vor dem Stoß nicht im selben Spinzustand (wie in der Abbildung), so lässt sich der „Weg“ des Sys tems bestimmen, auf dem es in einen gegebenen Endzustand gelangt ist. Zum Beispiel ist der einzi ge Streuprozess, der auf den Endzustand in Teil (b) führen kann und der eine nichtverschwindende Amplitude hat, von dem in Abb. 7a dargestellten Typ.
1460 | XIV Systeme identischer Teilchen
Referenzen und Literaturhinweise Zur Bedeutung von Interferenzen zwischen direkten Termen und Austauschtermen siehe Feynman, Bd. 5 (1.2), § 3.4 und Kap. 4. Quantenstatistik: Reif (8.4), Kittel (8.2). Permutationsgruppe: Messiah (1.17), Anhang D, § IV; Wigner (2.23), Kap. 13; Bacry (10.31), § 41 und § 42. Auswirkung des Symmetrisierungspostulats auf Molekülspektren: Herzberg (12.4), Bd. I, Kap. III, § 2f. Übersichtsartikel: Gamow (1.27).
Übersicht über die Ergänzungen zu Kapitel XIV |
1461
•
Übersicht über die Ergänzungen zu Kapitel XIV AXIV Mehrelektronenatome. Konfigurationen
Vorgestellt wird eine einfache Untersuchung von Mehrelektronenatomen in der Zentralfeldnäherung. Die Folgerungen aus dem Pauli-Prinzip werden diskutiert und der Begriff der Konfiguration wird eingeführt. Wir beschränken uns dabei auf qualitative Aussagen.
BXIV Energieniveaus des Heliumatoms
Am Beispiel des Heliumatoms wird der Effekt der elektrostatischen Abstoßung der Elektronen und der magnetischen Wechselwirkung betrachtet. Die Begriffe Terme und Multiplett werden eingeführt. (kann später gelesen werden)
CXIV Elektronengas. Anwendung auf Festkörper
Untersucht wird der Grundzustand eines freien Elektronengases, das in einem „Kasten“ eingeschlossen ist. Der Begriff der Fermi-Energie und periodische Randbedingungen werden eingeführt. Die Verallgemeinerung auf Elektronen in Festkörpern wird vorgenommen und die Beziehung zwischen elektrischer Leitfähigkeit und der Lage des Fermi-Niveaus qualitativ diskutiert. (von mittlerer Schwierigkeit) Den Schwerpunkt bildet die physikalische Diskussion. Kann als Fortsetzung von Ergänzung FXI angesehen werden.
DXIV Aufgaben
•
1462 | Ergänzung AXIV
Ergänzung AXIV Mehrelektronenatome. Konfigurationen 1 1-a 1-b 1-c 2
Die Zentralfeldnäherung | 1462 Wechselwirkung der Elektronen | 1463 Prinzip der Methode | 1463 Energieniveaus des Atoms | 1465 Elektronenkonfigurationen verschiedener Elemente | 1466
In Kapitel VII haben wir die Energieniveaus des Wasserstoffatoms ausführlich behan delt. Die Überlegungen waren verhältnismäßig einfach, weil das Wasserstoffatom nur ein einziges Elektron besitzt, so dass das Pauli-Prinzip nicht beachtet werden musste. Außerdem konnten wir das Problem im Schwerpunktsystem auf die Berechnung der Energieniveaus eines einzelnen Teilchens (des Relativteilchens) unter dem Einfluss eines Zentralpotentials zurückführen. In dieser Ergänzung wollen wir Mehrelektronenatome behandeln, bei denen diese Vereinfachungen nicht vorgenommen werden können. Im Schwerpunktsystem haben wir es jetzt mit mehreren, voneinander abhängigen Teilchen zu tun. Es handelt sich dabei um ein komplexes Problem, für das nur eine näherungsweise Lösung mittels der Zentralfeldnäherung möglich ist. Das Pauli-Prinzip wird dabei eine wichtige Rolle spielen.
1 Die Zentralfeldnäherung Wir betrachten ein Atom mit Z Elektronen. Da die Masse seines Kerns sehr viel größer (mehrere tausendmal) als die der Elektronen ist, fällt der Massenmittelpunkt prak tisch mit dem Kern zusammen, den wir daher als im Koordinatenursprung ruhend annehmen wollen. Der Hamilton-Operator für die Bewegung der Elektronen lautet un ter Vernachlässigung relativistischer Korrekturen, insbesondere der spinabhängigen Terme, Z P2i Ze2 e2 −∑ +∑ 2me i=1 R i |Ri − Rj | i=1 i 4 wird die 2p-Schale (s. Abb. 2) als nächste schrittweise aufgefüllt usw. Mit steigender Elektronenanzahl Z werden immer höhere Schalen erreicht (auf der rech ten Seite von Abb. 2 sind den ersten Schalen gegenüber die Symbole der Atome ange geben, für die sie die äußerste besetzte Schale sind). Auf diese Weise ergeben sich die Elektronenkonfigurationen der Grundzustände aller Atome (Mendelejewsches Sche ma). Man beachte, dass sehr dicht beieinander liegende Niveaus (in Abb. 2 in einer Klammer angeordnet) sehr unregelmäßig aufgefüllt werden können. Zum Beispiel be sitzt (Abb. 2 ordnet der 4s-Schale eine kleinere Energie als der 3d-Schale zu) Chrom (Z = 24) fünf 3d-Elektronen, obwohl die 4s-Schale unvollständig ist. Ähnliche Unre gelmäßigkeiten treten bei Kupfer (Z = 29), Niob (Z = 41) usw. auf. Bemerkungen: 1. Die hier analysierten Elektronenkonfigurationen stellen den Grundzustand der verschiedenen Atome in der Zentralfeldnäherung dar. Die niedrigsten angeregten Zustände des Hamilton-Opera tors H 0 erhält man, indem ein Elektron in ein über der letzten im Grundzustand besetzten Schale liegendes Energieniveau angehoben wird. Wie wir in Ergänzung BXIV sehen werden, ist z. B. die erste angeregte Konfiguration des Heliumatoms 1s, 2s
(15)
Mehrelektronenatome. Konfigurationen
| 1469
•
2. Zu einer Elektronenkonfiguration, die in einer vollständigen Schale endet, gibt es genau eine nichtverschwindende Slater-Determinante, da es dann ebenso viele orthogonale Einzelzustände wie Elektronen gibt. Die Grundzustände der Edelgase (. . . ns2 , np6 ) sind demnach nichtentartet; Gleiches gilt für die Erdalkalimetalle (. . . , ns2 ). Wenn die Anzahl der äußeren Elektronen anderer seits kleiner ist als die Entartung der äußersten Schale, ist der Grundzustand des Atoms entartet. Bei den Alkalimetallen (. . . , ns) ist diese Entartung gleich 2; für Kohlenstoff (1s2 , 2s2 , 2p2 ) ist sie gleich C26 = 15, da zwei Einzelzustände beliebig aus den sechs orthogonalen Zuständen gewählt werden können, die die 2p-Schale bilden. 3. Man kann zeigen, dass eine vollständige Schale den Gesamtdrehimpuls null hat. Das gilt be reits für den Gesamtbahndrehimpuls und den Gesamtspin (d. h. für die Summe der Bahndrehim pulse bzw. der Spins der Elektronen in dieser Schale). Der Drehimpuls eines Atoms¹ rührt daher nur von seinen äußeren Elektronen her. Der Gesamtdrehimpuls eines Heliumatoms im Grundzu stand ist gleich null, der eines Alkalimetalls 1/2 (ein einzelnes äußeres Elektron mit Bahndreh impuls null und Spin 1/2).
Referenzen und Literaturhinweise Pauling und Wilson (1.9), Kap. IX; Levine (12.3), Kap. 11, § 1, § 2 und § 3; Kuhn (11.1), Kap. IV, § A und § B; Schiff (1.18), § 47; Slater (1.6), Kap. 6; Landau und Lifshitz (1.19), § 68, § 69 und § 70. Siehe auch die Referenzen in Kap. XI (Methoden von Hartree und Hartree-Fock). Schalenmodell der Kernphysik: Valentin (16.1), Kap. VI; Preston (16.4), Kap. 7; Deshalit und Feshbach (16.6), Kap. IV und V. Siehe auch die Artikel von Mayer (16.20), Peierls (16.21) und Baranger (16.22).
1 Wir diskutieren hier nur den Drehimpuls der Elektronenwolke des Atoms. Der Kern besitzt ebenfalls einen Drehimpuls, der zu diesem addiert werden müsste.
•
1470 | Ergänzung BXIV
Ergänzung BXIV Energieniveaus des Heliumatoms 1 1-a 1-b 1-c 2 2-a 2-b 2-c 3
Zentralfeldnäherung. Konfigurationen | 1470 Der elektrostatische Hamilton-Operator | 1470 Grundzustandskonfiguration und angeregte Konfigurationen | 1471 Entartung der Konfigurationen | 1471 Einfluss der Elektronenabstoßung | 1473 Wahl einer geeigneten Basis in H(n, l; n , l ) | 1473 Spektralterme. Spektroskopische Notation | 1476 Physikalische Diskussion | 1477 Feinstrukturniveaus. Multipletts | 1482
Im vorhergehenden Abschnitt untersuchten wir Mehrelektronenatome in der Zentral feldnäherung, in der die Elektronen als voneinander unabhängig angesehen werden. Dadurch konnten wir den Begriff einer Konfiguration einführen. Wir wollen die Kor rekturen zu dieser Näherung berechnen, indem wir die gegenseitige elektrostatische Abstoßung der Elektronen genauer betrachten. Der Einfachheit halber beschränken wir uns dabei auf das einfachste Mehrelektronenatom, das Heliumatom. Wir werden zeigen, dass unter dem Einfluss der elektrostatischen Abstoßung die Elektronenkon figurationen (§ 1) dieses Atoms in Spektralterme (§ 2) aufgespalten werden. Daraus entstehen Feinstrukturmultipletts (§ 3), wenn im atomaren Hamilton-Operator noch kleinere Terme (magnetische Wechselwirkungen) berücksichtigt werden. Die Zusam menhänge lassen sich auf komplexere Atome verallgemeinern.
1 Zentralfeldnäherung. Konfigurationen 1-a Der elektrostatische Hamilton-Operator Wie im vorangegangenen Abschnitt betrachten wir zunächst nur die elektrostatischen Kräfte, die durch einen Hamilton-Operator der folgenden Form beschrieben werden [s. Gl. (C-24) aus Kapitel XIV]: H = H0 + W
(1)
mit H0 =
P21 P2 + 2 + Vc (R1 ) + Vc (R2 ) 2me 2me
(2)
und 2e2 2e2 e2 − Vc (R1 ) − Vc (R2 ) − + (3) R1 R2 |R1 − R2 | Das Zentralpotential Vc (r) ist dabei so gewählt, dass W eine kleine Korrektur zu H0 darstellt. W=−
https://doi.org/10.1515/9783110638769-040
Energieniveaus des Heliumatoms
|
1471
•
Solange W vernachlässigt wird, werden die Elektronen als voneinander unabhän gig angesehen (obwohl die mittlere elektrostatische Abstoßung durch das Potential Vc (r) berücksichtigt wird). Die Energieniveaus von H0 definieren dann die Elektronen konfiguration, die wir in diesem Abschnitt behandeln werden. Danach werden wir in § 2 mit Hilfe der stationären Störungstheorie den Einfluss von W untersuchen.
1-b Grundzustandskonfiguration und angeregte Konfigurationen Der Diskussion in § 2 von Ergänzung AXIV zufolge werden die Konfigurationen des He liumatoms durch die Quantenzahlen n, l und n , l der beiden Elektronen (die sich im Zentralpotential Vc (r) befinden) angegeben. Die entsprechenden Energien lauten Ec = E n,l + E n ,l
(4)
Die Grundzustandskonfiguration 1s2 wird erhalten (Abb. 1), wenn sich beide Elektro nen in der 1s-Schale befinden; in der ersten angeregten Konfiguration 1s, 2s befindet sich ein Elektron in der 1s-Schale und das andere in der 2s-Schale. Entsprechend ist die zweite angeregte Konfiguration die Konfiguration 1s, 2p.
Abb. 1: Grundzustandskonfiguration und die ersten zwei ange regten Konfigurationen des Heliumatoms (die Energien sind nicht maßstabsgerecht aufgetragen).
Die angeregten Konfigurationen des Heliumatoms sind von der Form 1s, n l . In Wirklichkeit gibt es auch zweifach angeregte Konfigurationen des Typs nl, n l (mit n, n > 1). Für Helium ist jedoch ihre Energie größer als die Ionisationsenergie EI des Atoms (der Grenzwert der Energie der Konfiguration 1s, n l für n → ∞). Die meis ten entsprechenden Zustände sind daher sehr instabil: Sie dissoziieren sehr schnell in ein Ion und ein Elektron und werden als selbstionisierende Zustände bezeichnet. Allerdings gibt es auch Zustände mit zweifach angeregten Konfigurationen, die über die Emission von Photonen zerfallen. Einige der zugehörigen Spektrallinien sind experimentell beobachtet worden.
1-c Entartung der Konfigurationen Da Vc ein Zentralpotential und nicht spinabhängig ist, hängt die Energie einer Konfiguration nicht von den magnetischen Quantenzahlen m und m (−l ≤ m ≤ l,
•
1472 | Ergänzung BXIV
−l ≤ m ≤ l ) oder den Spinquantenzahlen ε und ε (ε = ±, ε = ±) der beiden Elektro nen ab. Die meisten Konfigurationen sind daher entartet; wir wollen sie im Folgenden bestimmen. Ein zu einer Konfiguration gehörender Zustand wird durch die Angabe der vier Quantenzahlen (n, l, m, ε) und (n , l , m , ε ) der beiden Elektronen definiert. Da es sich bei den Elektronen um identische Teilchen handelt, ist das Symmetrisierungspos tulat zu beachten. Der physikalische Vektor dieses Zustands kann nach Kapitel XIV, § C-3-b geschrieben werden |n, l, m, ε; n , l , m , ε ⟩ =
1 (1 − P21 ) |1 : n, l, m, ε; 2 : n , l , m , ε ⟩ √2
(5)
Das Pauli-Prinzip schließt Zustände des Systems aus, bei denen sich beide Elektronen im selben Einzelzustand befinden (n = n , l = l , m = m , ε = ε ). Wie wir in Ka pitel XIV, § C-3-b gesehen haben, bildet die Menge der nichtverschwindenden (d. h. nicht vom Pauli-Prinzip ausgeschlossenen) physikalischen Vektoren (5) mit festem n, l, n , l eine Orthonormalbasis im zur Konfiguration nl, n l gehörenden Unterraum H(n, l; n , l ) von HA . Zur Berechnung der Entartung einer Konfiguration nl, n l unterscheiden wir zwei Fälle: 1. Die beiden Elektronen befinden sich nicht in derselben Schale (es gilt nicht n = n und l = l ). Die Einzelzustände der beiden Elektronen können nicht zusammenfallen, und m, m , ε, ε können unabhängig voneinander jeden beliebigen Wert annehmen. Die Entartung einer solchen Konfiguration ist folglich gleich 2(2l + 1) × 2(2l + 1) = 4(2l + 1)(2l + 1)
2.
(6)
Die Konfigurationen 1s, 2s und 1s, 2p fallen in diese Kategorie; ihre Entartungen sind gleich 4 bzw. 12. Die beiden Elektronen sind in derselben Schale (n = n und l = l ). In diesem Fall müssen die Zustände mit m = m und ε = ε ausgeschlossen wer den. Da die Anzahl der verschiedenen Einzelzustände gleich 2(2l + 1) ist, ist die Entartung der nl2 -Konfiguration gleich der Anzahl an Paaren, die sich aus diesen Einzelzuständen bilden lassen (s. Kap. XIV, § C-3-b), d. h. C22(2l+1) = (2l + 1)(4l + 1)
(7)
Die Konfiguration 1s2 , die in diese Kategorie fällt, ist also nicht entartet. Es ist interessant, die zu diesem Zustand gehörende Slater-Determinante zu entwickeln. Wenn wir in Gl. (5) n = n = 1, l = l = m = m = 0, ε = +, ε = − setzen und den Raumanteil als gemeinsamen Faktor schreiben, erhalten wir |1s2 ⟩ = |1 : 1, 0, 0; 2 : 1, 0, 0⟩ ⊗
1 (|1 : +; 2 : −⟩ − |1 : −; 2 : +⟩) √2
(8)
Energieniveaus des Heliumatoms
| 1473
•
Im Spinanteil von Gl. (8) erkennen wir den Ausdruck für den Singulettzustand |S = 0, M S = 0⟩, wobei S und M S die Quantenzahlen des Gesamtspins S = S1 + S2 (s. Kap. X, § B-4) sind. Obwohl der Hamilton-Operator H0 nicht vom Spin abhängt, folgt aus den Forderungen des Symmetrisierungspostulats, dass der Gesamtspin des Grundzustands den Wert S = 0 haben muss.
2 Einfluss der Elektronenabstoßung Wir untersuchen nun mit Hilfe der stationären Störungstheorie den Einfluss von W. Dazu müssen wir die Einschränkung von W in dem zur Konfiguration nl, n l gehö renden Unterraum H(n, l; n , l ) diagonalisieren. Die Eigenwerte der entsprechenden Matrix geben die Korrekturen der Konfigurationsenergie Ec in erster Ordnung in W an; die zugehörigen Eigenzustände sind die Eigenzustände nullter Ordnung. Um die Matrix zu berechnen, die W in H(n, l; n , l ) darstellt, können wir eine beliebige Basis wählen, insbesondere die der Vektoren (5). Zweckmäßig wäre dabei die Berücksichtigung der Symmetrien von W. So werden wir eine Basis angeben können, in der die Einschränkung von W bereits diagonal ist.
2-a Wahl einer geeigneten Basis in H(n, l; n , l ) α Gesamtbahndrehimpuls L und Gesamtspin S Der Operator W vertauscht nicht einzeln mit den Bahndrehimpulsen L1 und L2 der beiden Elektronen. Wie wir allerdings bereits gezeigt haben (s. Kap. X, § A-2), gilt für den Gesamtdrehimpuls L = L1 + L2
(9)
die Beziehung [W, L] = [
e2 , L] = 0 R12
(10)
L ist also eine Konstante der Bewegung.¹ Dasselbe gilt auch für den Gesamtspin S, da W nicht auf den Spinzustandsraum wirkt: [W, S] = 0
(11)
Wir betrachten nun die Menge der vier Operatoren L2 , S2 , L z , S z . Sie vertauschen untereinander und mit W. Wir wollen zeigen, dass sie im Unterraum H(n, l; n , l ) von 1 Diese Aussage hängt damit zusammen, dass der Abstand R 12 in Bezug auf eine Drehung beider Elektronen invariant ist. Das gilt jedoch nicht mehr, wenn nur ein Elektron gedreht wird; deshalb vertauscht W nicht mit L1 oder L2 .
•
1474 | Ergänzung BXIV
HA einen vollständigen Satz kommutierender Observabler (V. S. K. O.) bilden. Das wird uns in § 2-b ermöglichen, die Eigenwerte der Einschränkung von W in diesem Unter raum sofort zu erhalten. Dazu kehren wir zum Raum H zurück, dem Tensorprodukt der Zustandsräume H(1) und H(2) der beiden (beliebig nummerierten) Elektronen. Der zur Konfigurati on nl, n l gehörende Unterraum H(n, l; n , l ) von HA wird erhalten, wenn man die verschiedenen Vektoren des Unterraums Hn,l (1) ⊗ Hn ,l (2) von H antisymmetrisiert.² Wählen wir in diesem Unterraum die Basis |1 : n, l, m, ε⟩ ⊗ |2 : n , l , m , ε ⟩, so ergibt sich die Basis physikalischer Vektoren durch Antisymmetrisierung. Wie wir jedoch aus den Ergebnissen in Kapitel X wissen, können wir in Hn,l (1) ⊗ Hn ,l (2) auch eine andere Basis aus gemeinsamen Eigenvektoren von L2 , L z , S2 , S z wählen, die vollständig durch die Angabe der entsprechenden Eigenwerte definiert wird. Diese Basis lautet {|1 : n, l; 2 : n , l ; L, M L ⟩ ⊗ |S, M S ⟩}
(12)
mit L = l + l , l + l − 1, . . . , |l − l | S = 1, 0
(13)
Da L2 , L z , S2 , S z alle symmetrische Operatoren sind (sie vertauschen mit P21 ), bleiben die Vektoren der Basis (12) auch nach der Antisymmetrisierung Eigenvektoren von L2 , L z , S2 , S z mit denselben Eigenwerten (einige von ihnen können natürlich eine ver schwindende Projektion auf HA haben). Dies ist der Fall, wenn die entsprechenden physikalischen Vektoren durch das Pauli-Prinzip ausgeschlossen sind (s. unten). Die nichtverschwindenden Vektoren, die sich durch die Antisymmetrisierung von (12) er geben, sind demnach orthogonal, da sie zu verschiedenen Eigenwerten wenigstens einer der vier betrachteten Observablen gehören. Da sie H(n, l; n , l ) aufspannen, bil den sie eine Orthonormalbasis dieses Unterraums, die wir schreiben {|n, l; n , l ; L, M L ; S, M S ⟩}
(14)
|n, l; n , l ; L, M L ; S, M S ⟩ = c (1 − P21 ) (|1 : n, l; 2 : n , l ; L, M L ⟩ ⊗ |S, M S ⟩)
(15)
mit wobei c eine Normierungskonstante ist. Also bilden L2 , L z , S2 , S z einen V. S. K. O. in H(n, l; n , l ). (S) Wir führen nun den Permutationsoperator P21 im Spinzustandsraum ein, (S)
P21 |1 : ε; 2 : ε ⟩ = |1 : ε ; 2 : ε⟩
(16)
Wir haben in § B-4 von Kapitel X gezeigt (s. Bemerkung 2), dass gilt (S)
P21 |S, M S ⟩ = (−1)S+1 |S, M S ⟩
(17)
2 Wir könnten ebenso vom Unterraum Hn ,l (1) ⊗ Hn,l (2) ausgehen (s. Bemerkung 1 in § B-2-c von Kapitel XIV).
Energieniveaus des Heliumatoms
| 1475
•
Außerdem ist, wenn wir den Permutationsoperator im Zustandsraum der Bahnvaria (B) blen mit P21 bezeichnen, (B)
(S)
P21 = P21 ⊗ P21
(18)
Mit Gl. (17) und Gl. (18) können wir Gl. (15) schließlich in der folgenden Form schreiben: |n, l; n , l ; L, M L ; S, M S ⟩ (B)
= c {[1 − (−1)S+1 P21 ] |1 : n, l; 2 : n , l ; L, M L ⟩} ⊗ |S, M S ⟩
(19)
β Einschränkungen durch das Symmetrisierungspostulat Wie wir gesehen haben, ist die Dimension von H(n, l; n , l ) nicht immer gleich 4(2l + 1)(2l + 1), d. h. gleich der Dimension von Hn,l (1) ⊗ Hn ,l (2). Einige Vekto ren von Hn,l (1) ⊗ Hn ,l (2) können daher eine Projektion null auf H(n, l; n , l ) haben. Es ist interessant, die Bedingungen für die Basis (14) zu untersuchen, die durch das Symmetrisierungspostulat gestellt werden. Zunächst nehmen wir an, dass die beiden Elektronen nicht dieselbe Schale beset zen. Es ist dann leicht zu zeigen, dass der Bahnanteil von Gl. (19) gleich einer Summe oder Differenz von zwei orthogonalen Vektoren und damit niemals null ist.³ Da das selbe für |S, M S ⟩ gilt, sind alle möglichen Werte von L und S erlaubt [s. Gl. (13)]. Für die Konfiguration 1s, 2s können wir z. B. S = 0, L = 0 und S = 1, L = 0 haben, für die Konfiguration 1s, 2p entsprechend S = 0, L = 1 und S = 1, L = 1 usw. Wenn wir nun andererseits annehmen, die beiden Elektronen besetzen dieselbe Schale, d. h. es gilt n = n und l = l , so können einige Vektoren (19) null sein. Wir schreiben |1 : n, l; 2 : n , l ; L, M L ⟩ in der Form |1 : n, l; 2 : n , l ; L, M L ⟩ = ∑ ∑⟨l, l ; m, m | L, M L ⟩ |1 : n, l, m; 2 : n , l , m ⟩ (20) m m
Nach Gl. (25) aus Ergänzung BX ⟨l, l; m, m | L, M L ⟩ = (−1)L ⟨l, l; m , m | L, M L ⟩
(21)
Mit Hilfe von Gl. (20) erhalten wir (B)
P21 |1 : n, l; 2 : n, l; L, M L ⟩ = (−1)L |1 : n, l; 2 : n, l; L, M L ⟩
(22)
setzen wir diese Beziehung in Gl. (19) ein, so ergibt sich⁴ |n, l; n, l; L, M L ; S, M S ⟩ {0 für L + S ungerade ={ |1 : n, l; 2 : n, l; L, M L ⟩ ⊗ |S, M S ⟩ für L + S gerade { 3 Die Normierungskonstante c ist dann gleich 1/√2. 4 Die Normierungskonstante ist dann gleich 1/2.
(23)
•
1476 | Ergänzung BXIV
Die Werte für L und S sind daher nicht beliebig: L + S muss gerade sein. Insbesondere muss für eine 1s2 -Konfiguration L = 0 gelten, so dass S = 1 ausgeschlossen ist. Dieses Ergebnis haben wir oben bereits gefunden. Schließlich halten wir fest, dass das Symmetrisierungspostulat eine enge Korre lation zwischen der Symmetrie des Bahnanteils und der des Spinanteils des physika lischen Vektors (19) herstellt. Da der Gesamtvektor antisymmetrisch sein muss und der Spinanteil, abhängig vom Wert für S, symmetrisch (S = 1) oder antisymmetrisch (S = 0) ist, muss der Bahnanteil für S = 1 antisymmetrisch und für S = 0 symmetrisch sein. Wir werden die Bedeutung dieser Tatsache später verstehen.
2-b Spektralterme. Spektroskopische Notation Der Operator W vertauscht mit den vier Observablen L2 , L z , S2 , S z , die in H(n, l; n , l ) einen V. S. K. O. bilden. Daraus folgt, dass die Einschränkung von W auf H(n, l; n , l ) in der Basis {|n, l; n , l ; L, M L ; S, M S ⟩} diagonal mit den Eigenwerten δ(L, S) = ⟨n, l; n , l ; L, M L ; S, M S | W | n, l; n , l ; L, M L ; S, M S ⟩
(24)
ist. Die Energieniveaus hängen weder von M L noch von M S ab, da sich aus den Re lationen (10) und (11) ergibt, dass W nicht nur mit L z und S z , sondern auch mit L± und S± vertauscht: W ist demnach sowohl im Bahnzustandsraum als auch im Spinzu standsraum ein skalarer Operator (s. Ergänzung BVI , § 5-b und § 6-c). Innerhalb einer nl, n l -Konfiguration erhalten wir daher die durch ihre Werte von L und S gekennzeichneten Energieniveaus Ec (n, l; n , l ) + δ(L, S). Jedes Niveau ist (2L + 1)(2S + 1)-fach entartet. Diese Niveaus werden Spektralterme genannt und in der folgenden Weise bezeichnet: Jedem Wert von L wird in der spektroskopischen No tation (s. Kap. VII, § C-4-b) ein Buchstabe des Alphabets zugeordnet; wir geben also den entsprechenden Großbuchstaben an und fügen links oben eine Zahl für den Wert von 2S + 1 an. Die 1s2 -Konfiguration ergibt z. B. einen einzelnen Spektralterm: 1 S (der Term 3 S ist durch das Pauli-Prinzip verboten). Die 1s, 2s-Konfiguration enthält zwei Terme 1 S (nichtentartet) und 3 S (dreifach entartet), die 1s, 2p-Konfiguration zwei Ter me 1 P (Entartung 3) und 3 P (Entartung 9). Bei komplizierteren Konfigurationen wie z. B. 2p2 erhalten wir (s. oben) die Spektralterme 1 S, 1 D und 3 P (L + S muss gerade sein) usw. Unter dem Einfluss der elektrostatischen Abstoßung wird die Entartung der ein zelnen Konfigurationen also teilweise aufgehoben (die 1s2 -Konfiguration, die nicht entartet ist, wird verschoben). Wir wollen diesen Effekt für den einfachen Fall einer 1s, 2s-Konfiguration genauer untersuchen. Dabei wird klar werden, warum die beiden
Energieniveaus des Heliumatoms
| 1477
•
sich aus dieser Konfiguration ergebenden Terme 1 S und 3 S, deren Gesamtspins ver schiedene Werte aufweisen, unterschiedliche Energien haben, obwohl der HamiltonOperator rein elektrostatischer Natur ist.
2-c Physikalische Diskussion α Energien der Spektralterme der 1s, 2s-Konfiguration Für die 1s, 2s-Konfiguration gilt l = l = L = 0. Aus Gl. (20) erhält man dann den Vektor |1 : n = 1, l = 0; 2 : n = 2, l = 0; L = M L = 0⟩ = |1 : n = 1, l = m = 0; 2 : n = 2, l = m = 0⟩
(25)
den wir einfacher |1 : 1s; 2 : 2s⟩ schreiben wollen. Bezeichnen wir die Zustände zu den beiden Spektraltermen 3 S und 1 S der 1s, 2s-Konfiguration mit |3 S, M S ⟩ bzw. |1 S, 0⟩, so erhalten wir durch Einsetzen von Gl. (25) in Gl. (19) 1 (B) (26a) |3 S, M S ⟩ = [(1 − P21 ) |1 : 1s; 2 : 2s⟩] ⊗ |S = 1, M S ⟩ √2 1 (B) (26b) [(1 + P21 ) |1 : 1s; 2 : 2s⟩] ⊗ |S = 0, M S = 0⟩ |1 S, 0⟩ = √2 Da W nicht auf die Spinvariablen wirkt, können die durch Gl. (24) gegebenen Eigen werte geschrieben werden 1 (B) (B) (27a) δ(3 S) = ⟨1 : 1s; 2 : 2s | (1 − P21 ) W (1 − P21 ) |1 : 1s; 2 : 2s⟩ 2 1 (B) (B) (27b) δ(1 S) = ⟨1 : 1s; 2 : 2s | (1 + P21 ) W (1 + P21 ) |1 : 1s; 2 : 2s⟩ 2 (B)
(B)
(wir haben dabei verwendet, dass P21 hermitesch ist). Außerdem vertauscht P21 mit (B) W, und das Quadrat von P21 ist der Identitätsoperator. Daher gilt (B)
(B)
(B) 2
(B)
(1 ± P21 ) W (1 ± P21 ) = (1 ± P21 ) W = 2 (1 ± P21 ) W
(28)
und schließlich δ(3 S) = K − J
(29a)
1
δ( S) = K + J
(29b)
mit K = ⟨1 : 1s; 2 : 2s | W | 1 : 1s; 2 : 2s⟩ (B)
J = ⟨1 : 1s; 2 : 2s | P21 W | 1 : 1s; 2 : 2s⟩ = ⟨1 : 2s; 2 : 1s | W | 1 : 1s; 2 : 2s⟩
(30) (31)
K stellt also eine gemeinsame Energieverschiebung der beiden Terme dar und führt nicht zur Aufspaltung. Der Term J ist interessanter, da mit ihm eine Energiedifferenz zwischen den Termen 3 S und 1 S verbunden ist (s. Abb. 2). Wir wollen ihn daher näher untersuchen.
•
1478 | Ergänzung BXIV
Abb. 2: Relative Lage der Spektralterme 1 S und 3 S, die sich aus der 1s, 2s-Konfiguration des He liumatoms ergeben. Der Term K stellt eine Ge samtverschiebung der Konfiguration dar. Die Aufhebung der Entartung ist proportional zum Austauschintegral J.
β Das Austauschintegral Wenn wir den Ausdruck (3) für W in Gl. (31) einsetzen, treten folgende Terme auf ⟨1 : 2s; 2 : 1s | Vc (R1 ) | 1 : 1s; 2 : 2s⟩ = ⟨1 : 2s | Vc (R1 ) |1 : 1s⟩⟨2 : 1s | 2 : 2s⟩
(32)
Nun ist das Skalarprodukt der beiden orthogonalen Zustände |2 : 1s⟩ und |2 : 2s⟩ gleich null; damit verschwindet auch der Ausdruck (32). Eine analoge Argumentation zeigt, dass die Terme, die von den Operatoren Vc (R2 ), −2e2 /R1 , −2e2 /R2 herrüh ren, ebenfalls verschwinden, da diese Operatoren nur in den Zustandsräumen der einzelnen Elektronen wirken, während die Zustände der beiden Elektronen im Ketbzw. Bravektor von Gl. (31) verschieden sind. Schließlich verbleibt für J nur J = ⟨1 : 2s; 2 : 1s |
e2 | 1 : 1s; 2 : 2s⟩ |R1 − R2 |
(33)
J hängt also ausschließlich mit der elektrostatischen Abstoßung zwischen den beiden Elektronen zusammen. Es sei φ n,l,m (r) die zum Zustand |n, l, m⟩ gehörende Wellenfunktion (die statio nären Zustände eines Elektrons im Zentralpotential Vc ): φ n,l,m (r) = ⟨r|n, l, m⟩
(34)
In der Ortsdarstellung ergibt die Berechnung von J aus Gl. (33) J = ∫ d3 r1 ∫ d3 r2 φ∗2,0,0 (r1 ) φ∗1,0,0 (r2 )
e2 φ1,0,0 (r1 ) φ2,0,0 (r2 ) |r1 − r2 |
(35)
Dieses Integral wird Austauschintegral genannt. Wir wollen es hier nicht explizit be rechnen, sondern nur darauf hinweisen, dass es positiv ist. γ Ursprung der Energiedifferenz zwischen den beiden Termen Den Ausdrücken (26) und (27) können wir entnehmen, dass die Energieaufspaltung zwischen den Termen 3 S und 1 S in der unterschiedlichen Symmetrie der Bahnantei le dieser Terme begründet ist. Wir haben oben bereits festgestellt, dass ein Triplett (S = 1) einen in Bezug auf den Austausch der beiden Elektronen antisymmetrischen (B) Bahnanteil besitzen muss; daher stammt das Minuszeichen vor P21 in den Gleichun gen (26a) und (27a). Ein Singulett (S = 0) andererseits hat einen symmetrischen Bahn anteil [Pluszeichen in den Gleichungen (26b) und (27b)].
Energieniveaus des Heliumatoms
| 1479
•
Damit erklärt sich die in Abb. 2 dargestellte relative Lage der Terme 3 S und 1 S. Die Orbitalwellenfunktion des Singuletts ist symmetrisch in Bezug auf den Austausch der beiden Elektronen, die damit eine nichtverschwindende Wahrscheinlichkeit besitzen, sich am selben Raumpunkt aufzuhalten. Aus diesem Grund wird die Energie des Sin gulettzustands durch die elektrische Abstoßung merklich vergrößert; die mit dieser Abstoßung verbundene Energie e2 /r12 nimmt große Werte an, wenn die Elektronen dicht beisammen sind. Der Triplettzustand hingegen besitzt eine unter dem Austausch der beiden Elektronen antisymmetrische Bahnwellenfunktion: Die Elektronen halten sich dann mit der Wahrscheinlichkeit null am selben Ort auf. Der Erwartungswert der elektrostatischen Abstoßungsenergie ist somit kleiner. Die Energiedifferenz zwischen dem Singulett- und dem Triplettzustand erklärt sich also aus den Korrelationen zwi schen den Bahnvariablen der beiden Elektronen, die wegen des Symmetrisierungs postulats vom Wert des Gesamtspins abhängen.
δ Die Rolle des Symmetrisierungspostulats Man könnte nun annehmen, die Entartung einer Konfiguration werde durch das Sym metrisierungspostulat vollständig aufgehoben. Wir wollen zeigen,⁵ dass das nicht der Fall ist. Das Postulat legt lediglich den Wert des Gesamtspins der Terme fest, die sich aus einer bestimmten Konfiguration ergeben (wegen der gegenseitigen elektrostati schen Abstoßung der Elektronen). Um das zu zeigen, nehmen wir für einen Augenblick an, dass das Symmetrisie rungspostulat nicht angewandt zu werden braucht. Zum Beispiel können wir uns vor stellen, die beiden Elektronen wären durch zwei (natürlich fiktive) Teilchen dersel ben Masse, Ladung und Spin ersetzt, die aber durch andere innere Eigenschaften un terscheidbar sind [der Hamilton-Operator H des Systems soll dadurch nicht geändert werden; er wird weiter durch Gl. (1) gegeben]. Da H nicht vom Spin abhängt und das Symmetrisierungspostulat nicht angewendet werden muss, können wir die Spins bis zum Ende der Rechnungen vollständig vernachlässigen und die sich ergebenden Ent artungen einfach mit 4 multiplizieren. Das Energieniveau von H0 , das zur Konfigu ration 1s, 2s gehört, ist bezüglich seines Bahnanteils zweifach entartet, weil es die beiden orthogonalen Zustände |1 : 1s; 2 : 2s⟩ und |1 : 2s; 2 : 1s⟩ enthält (dabei handelt es sich um unterschiedliche physikalische Zustände, da die beiden Teilchen verschie den sind). Um den Einfluss von W zu untersuchen, müssen wir W in dem durch diese beiden Vektoren aufgespannten zweidimensionalen Raum diagonalisieren. Die ent sprechende Matrix lautet (
K
J
J
K
)
5 Siehe auch die Bemerkung 1 in § C-4-a-β von Kapitel XIV.
(36)
•
1480 | Ergänzung BXIV
wobei J und K durch Gl. (30) und Gl. (31) gegeben werden [die beiden Diagonalelemen te der Matrix (36) sind gleich, da W invariant gegenüber dem Austausch der beiden Teilchen ist]. Die Matrix (36) kann sofort diagonalisiert werden. Dabei ergeben sich die Eigenwerte K + J und K − J, die zu der symmetrischen bzw. antisymmetrischen Li nearkombination der beiden Vektoren |1 : 1s; 2 : 2s⟩ und |1 : 2s; 2 : 1s⟩ gehören. Dass diese Bahneigenzustände wohldefinierte Symmetrieeigenschaften bezüglich des Aus tauschs der beiden Teilchen besitzen, hat nichts mit dem Pauli-Prinzip zu tun, son (B) dern folgt allein aus der Tatsache, dass W mit P21 vertauscht (es lassen sich demnach (B) gemeinsame Eigenzustände zu W und P21 finden). Wenn also die beiden Teilchen nicht identisch sind, ergeben sich dieselbe Anord nung der Niveaus und dieselben Bahnsymmetrien wie zuvor. Die Entartung der Ni veaus ist jedoch verschieden: Das untere Niveau mit der Energie K − J kann wie das obere einen Gesamtspin von entweder S = 0 oder S = 1 haben. Wenn wir nun zum eigentlichen Heliumatom zurückkehren, erkennen wir deut lich die Rolle, die das Pauli-Prinzip spielt. Es ist nicht für die Aufspaltung des An fangsniveaus 1s, 2s in die beiden Energieniveaus K + J und K − J verantwortlich, da diese auch bei unterscheidbaren Teilchen zu beobachten ist. Das symmetrische oder antisymmetrische Verhalten der Bahnanteile der Eigenvektoren hängt mit der Inva rianz der elektrostatischen Wechselwirkung in Bezug auf den Austausch der beiden Teilchen zusammen. Das Pauli-Prinzip verbietet lediglich, dass der untere Zustand ei nen Gesamtspin S = 0 und der obere Zustand einen Gesamtspin S = 1 besitzt, da die entsprechenden Zustände insgesamt symmetrisch sind. Das ist für Fermionen nicht erlaubt.
ϵ Der effektive spinabhängige Hamilton-Operator Wir ersetzen W durch den Operator ̃ = α + βS1 ⋅ S2 W
(37)
worin S1 und S2 die beiden Elektronenspins sind. Es gilt auch 2 ̃ = α − 3βℏ + β S2 W 4 2
(38)
̃ durch die Triplettzustände mit dem Eigenwert α + so dass die Eigenzustände von W 2 βℏ /4 und die Singulettzustände mit dem Eigenwert α − 3βℏ2 /4 gegeben werden. Set zen wir daher α=K− 2J β=− 2 ℏ
J 2
(39)
Energieniveaus des Heliumatoms
|
1481
•
̃ dieselben Eigenzustände und Eigen so erhalten wir bei der Diagonalisierung von W ̃ (der „effektive“ werte, die sich oben ergeben haben.⁶ Wir können dann annehmen, W ̃ diesel Hamilton-Operator) sei für das Auftreten der Terme verantwortlich. Obwohl W be Form hat wie der Operator der magnetischen Wechselwirkung zwischen den beiden Spins, darf man nicht schließen, dass die für die Terme verantwortliche Kopplungs energie magnetischen Ursprungs ist: Zwei magnetische Momente von der Größe, die zwei Elektronen im Abstand von 1 × 10−8 cm haben, hätten eine sehr viel kleinere Wechselwirkungsenergie als J. Wegen seiner einfachen Form wird der effektive Ha ̃ jedoch sehr oft anstelle von W verwendet. milton-Operator W Einer ähnlichen Situation begegnet man bei der Beschreibung ferromagnetischer Stoffe. Darin ordnen sich die Spins der Elektronen parallel zueinander an. Da der Spinzustand dann vollständig symmetrisch ist, verlangt das Pauli-Prinzip einen voll ständig antisymmetrischen Bahnzustand. Aus dem gleichen Grund wie beim Heli umatom ist die elektronische Abstoßungsenergie dann minimal. Bei der Beschreibung solcher Phänomene verwendet man oft effektive Hamilton-Operatoren von derselben Form wie in Gl. (37). Dabei ist noch einmal darauf hinzuweisen, dass die physikali sche Wechselwirkung, die den Ursprung der Kopplung darstellt, elektrostatischer und nicht magnetischer Natur ist. Bemerkungen: 1. Die 1s, 2p-Konfiguration kann in derselben Weise behandelt werden. Es ist dann L = 1, so dass M L = +1, 0 oder −1 sein kann. Wie bei der 1s, 2s-Konfiguration besetzen die Elektronen verschiedene Schalen, so dass die beiden Terme 3 P und 1 P gleichzeitig existieren. Der erste ist neunfach und der zweite dreifach entartet. Wie oben lässt sich zeigen, dass der 3 P-Term eine geringere Energie als der 1 P-Term hat und ihre Differenz proportional zu einem Austauschintegral ist, das eine analoge Form wie in Gl. (35) aufweist. Wir können dann in derselben Weise für alle weiteren Konfigurationen des Typs 1s, n l vorgehen. 2. Wir haben W wie eine Störung von H 0 behandelt. Damit diese Näherung gerechtfertigt ist, müssen die mit W zusammenhängenden Energieverschiebungen [z. B. das Austauschinte gral (35)] sehr viel kleiner als die Energiedifferenzen zwischen den Konfigurationen sein. Das ist jedoch nicht der Fall: Für die Konfigurationen 1s, 2s und 1s, 2p ist z. B. der minimale Abstand zwischen den Niveaus ∆E[(1s, 2p)3 P − (1s, 2s)1 S] ≈ 0.35 eV, während die Energiedifferenz ∆E(1 S − 3 S) in der 1s, 2s-Konfiguration bei 0.8 eV liegt. Man könnte demnach denken, es sei nicht gerechtfertigt, W als Störung von H 0 zu betrachten. Die hier verwendete Näherung ist jedoch korrekt. Das liegt daran, dass für alle Konfiguratio nen des Typs 1s, n l gilt L = l . Die Matrixelemente des Operators W, der nach Gl. (10) mit L vertauscht, verschwinden zwischen Zuständen der Konfigurationen 1s, 2s und 1s, 2p, da sie zu verschiedenen Werten von L gehören. Durch W wird daher eine 1s, n l -Konfiguration nur an Kon figurationen mit wesentlich höheren Energien des Typs 1s, n l mit l = l (nur die Werte von n sind verschieden) oder des Typs nl, n l gekoppelt, wobei n und n ungleich eins sind (die Drehimpulse l und l können sich zu l addieren).
̃ behalten, die zu HA gehören. 6 Offenbar müssen wir nur die Eigenvektoren von W
•
1482 | Ergänzung BXIV
3 Feinstrukturniveaus. Multipletts Bisher haben wir im Hamilton-Operator nur rein elektrostatische Wechselwirkun gen betrachtet; die Effekte relativistischen oder magnetischen Ursprungs wurden vernachlässigt. Natürlich treten solche Effekte auf, und wir haben sie bereits für den Fall des Wasserstoffatoms untersucht (s. Kap. XII, § B-1), wo sie von einer ge schwindigkeitsabhängigen Elektronenmasse, von der Spin-Bahn-Kopplung L ⋅ S und vom Darwin-Term herrühren. Für Helium wird die Situation wegen der zwei Elek tronen komplizierter. Zum Beispiel existiert dann ein magnetischer Spin-Spin-Kopp lungsterm (s. Ergänzung BXI ), der sowohl im Spinzustandsraum als auch im Bahn zustandsraum der beiden Elektronen wirkt. Allerdings wird das Problem dadurch stark vereinfacht, dass die mit den Kopplungen relativistischen oder magnetischen Urspungs zusammenhängenden Energien sehr viel kleiner sind als die Abstände von zwei Spektraltermen, so dass der entsprechende Hamilton-Operator (der Feinstruk tur-Hamilton-Operator) wie eine Störung behandelt werden kann. Die genaue Untersuchung der Feinstrukturniveaus von Helium liegt außerhalb der Möglichkeiten dieser Ergänzung. Wir wollen uns darauf beschränken, die Symme trien des Problems zu beschreiben und anzugeben, wodurch sich die entsprechenden Energieniveaus unterscheiden. Dabei verwenden wir die Tatsache, dass der Feinstruk tur-Hamilton-Operator Hf invariant ist gegenüber einer gleichzeitigen Drehung aller Bahn- und Spinvariablen. Wenn wir den Gesamtdrehimpuls der Elektronen mit J be zeichnen, J= L+S
(40)
so bedeutet das (s. Ergänzung BVI , § 6) [Hf , J] = 0
(41)
Andererseits ändert sich der Feinstruktur-Hamilton-Operator, wenn die Drehung nur die Bahn- oder nur die Spinvariablen betrifft, [Hf , L] = − [Hf , S] ≠ 0
(42)
Diese Eigenschaften lassen sich für die Operatoren ∑i ξ(r i )Li ⋅ S i , z. B. für den Ha milton-Operator der magnetischen Dipol-Dipol-Wechselwirkung (s. Ergänzung BXI ), leicht nachweisen. Der Zustandsraum für einen Term wird durch die in Gl. (19) angegebenen Zu standsvektoren |n, l; n , l ; L, M L ; S, M S ⟩ aufgespannt, für die L und S vorgegeben sind; dabei gilt −L ≤ M L ≤ +L −S ≤ M S ≤ +S
(43)
Es lässt sich zeigen, dass in diesem Unterraum J2 und J z einen V. S. K. O. bilden, der nach Gl. (41) mit Hf vertauscht. Die gemeinsamen Eigenvektoren |J, M J ⟩ zu J2 [Eigen wert J(J + 1)ℏ2 ] und J z (Eigenwert M J ℏ) sind daher notwendig auch Eigenvektoren von
Energieniveaus des Heliumatoms
•
| 1483
Hf mit einem Eigenwert, der von J, aber nicht von M J abhängt (diese letzte Eigenschaft ergibt sich daraus, dass Hf mit J + und J − vertauscht). Der allgemeinen Theorie für die Addition von Drehimpulsen zufolge lauten die möglichen Werte von J J = L + S, L + S − 1, L + S − 2, . . . , |L − S|
(44)
Der Einfluss von Hf besteht daher in einer teilweisen Aufhebung der Entartung. In jedem Term treten so viele verschiedene Niveaus auf, wie es nach Gl. (44) ver schiedene Werte von J gibt. Jedes Niveau ist (2J + 1)-fach entartet und wird als ein Multiplett bezeichnet. In der üblichen spektroskopischen Notation bezeichnet man ein Multiplett durch die Angabe des Wertes von J in einem zusätzlichen rechten un teren Index an dem Term, aus dem es entsteht. Der Grundzustand von Helium ist z. B. ein einziges Multiplett 1 S0 . Entsprechend ergeben auch die beiden Terme 1 S und 3 S der 1s, 2s-Konfiguration je ein Multiplett, 1 S0 bzw. 3 S1 . Der 3 P-Term der 1s, 2p-Konfiguration hingegen besteht aus drei Multipletts, 3 P2 , 3 P1 und 3 P0 (s. Abb. 3) usw. Wir weisen darauf hin, dass die Messung und die theoretische Berechnung der Feinstruktur des 3 P-Niveaus der 1s, 2p-Konfiguration von grundlegendem Interesse ist, da sich daraus die Feinstrukturkonstante α = e2 /ℏc sehr genau bestimmen lässt.
Abb. 3: Relative Lage der Spektralterme und der Multipletts der 1s, 2p-Konfiguration des Helium atoms (die Aufspaltung der drei Multipletts 3 P0 , 3 P , 3 P ist stark übertrieben dargestellt). 1 2
Bemerkungen: 1. Für viele Atome wird der Feinstruktur-Hamilton-Operator im Wesentlichen gegeben durch N
H f ≈ ∑ ξ(R i )Li ⋅ Si
(45)
i=1
worin Ri , Li und Si die Lagen, die Drehimpulse und die Spins der N Elektronen bedeuten. Mit Hilfe des Wigner-Eckart-Theorems (s. Ergänzung DX ) lässt sich dann zeigen, dass die Energie des Multipletts J proportional zu J(J + 1) − L(L + 1) − S(S + 1) ist. Dieses Ergebnis bezeichnet man manchmal als die Landé-Abstandsregel. Bei Helium liegen die Niveaus 3 P 1 und 3 P 2 der 1s, 2p-Konfiguration sehr viel dichter zusammen, als diese Regel vorhersagt. Das liegt an der Stärke der magnetischen Dipol-Dipol-Kopplung zwi schen den Spins beider Elektronen.
•
1484 | Ergänzung BXIV
2. In dieser Ergänzung haben wir die mit dem Kernspin zusammenhängenden Hyperfeinstruktur effekte (s. Kap. XII, § B-2) nicht berücksichtigt. Sie existieren nur für das 3 He-Isotop, dessen Kern den Spin I = 1/2 besitzt (der Kern des 4 He-Isotops hat den Spin null). Jedes Multiplett mit einem Elektronendrehimpuls J wird für das 3 He in zwei Hyperfeinstrukturniveaus mit dem Gesamtdreh impuls F = J ± 1/2 aufgespalten, die (2F + 1)-fach entartet sind (natürlich nur für J ≠ 0).
Referenzen und Literaturhinweise Kuhn (11.1), Kap. III-B; Slater (11.8), Kap. 18; Bethe und Salpeter (11.10). Theorie der Multipletts und das Pauli-Prinzip: Landau und Lifshitz (1.19), § 64 und § 65; Slater (1.6), Kap. 7 und (11.8), Kap. 13; Kuhn (11.1), Kap. V, § A; Sobel’man (11.12), Kap. 2, § 5.3.
Elektronengas. Anwendung auf Festkörper | 1485
•
Ergänzung CXIV Elektronengas. Anwendung auf Festkörper 1 1-a 1-b 1-c 2 2-a 2-b
Freies Elektronengas in einem Kasten | 1486 Grundzustand eines Elektronengases. Fermi-Energie E F | 1486 Elektronen mit Energien in der Umgebung von E F | 1488 Periodische Randbedingungen | 1493 Elektronen in Festkörpern | 1495 Erlaubte Bänder | 1495 Lage des Fermi-Niveaus und elektrische Leitfähigkeit | 1496
In den Ergänzungen AXIV und BXIV untersuchten wir unter Beachtung des Symmetri sierungspostulats die Energieniveaus einer kleinen Anzahl unabhängiger Elektronen, die sich in einem Zentralpotential befinden (das Schalenmodell für Mehrelektronen atome). Nun wollen wir Systeme betrachten, die aus sehr viel mehr Elektronen be stehen und zeigen, dass das Pauli-Prinzip auch hier das Verhalten grundlegend be stimmt. Zur Vereinfachung vernachlässigen wir die Wechselwirkungen zwischen den Elektronen. Darüber hinaus wollen wir zunächst annehmen (§ 1), dass sie nur einem äußeren Potential ausgesetzt sind, das sie in einem bestimmten Volumen festhält und nur in unmittelbarer Nähe der Ränder existiert (man spricht von einem in einem „Kas ten“ eingeschlossenen freien Elektronengas). Wir werden den wichtigen Begriff der Fermi-Energie EF einführen, die nur von der Anzahldichte der Elektronen abhängt. Außerdem werden wir zeigen, dass die physikalischen Eigenschaften eines Elektro nengases (spezifische Wärme, magnetische Suszeptibilität usw.) im Wesentlichen durch die Elektronen bestimmt werden, deren Energie in der Nähe der Fermi-Energie liegt. Durch das Modell freier Elektronen werden die grundlegenden Eigenschaften ei niger Metalle recht gut beschrieben. In einem Festkörper unterliegen die Elektronen jedoch einem periodischen Potential, das von den Ionen des Kristallgitters erzeugt wird. Wie wir wissen, sind die Energieniveaus der Elektronen dann in erlaubten Ener giebändern angeordnet, die durch verbotene Bänder voneinander getrennt sind (s. Er gänzungen FXI und OIII ). In § 2 wollen wir qualitativ zeigen, dass die elektrische Leit fähigkeit eines Festkörpers im Wesentlichen durch die Lage des Fermi-Niveaus des Elektronensystems relativ zu den erlaubten Energiebändern bestimmt wird. In Ab hängigkeit von dieser Lage handelt es sich bei dem betrachteten Festkörper um einen Leiter oder einen Isolator.
https://doi.org/10.1515/9783110638769-041
•
1486 | Ergänzung CXIV
1 Freies Elektronengas in einem Kasten 1-a Grundzustand eines Elektronengases. Fermi-Energie EF Wir betrachten ein System von N Elektronen, deren gegenseitige Wechselwirkungen wir vernachlässigen und die außerdem keinem äußerem Potential unterliegen. Sie sol len jedoch in einem Kasten eingeschlossen sein, den wir der Einfachheit halber als einen Würfel der Kantenlänge L annehmen. Da die Elektronen die Wände des Kas tens nicht durchdringen können, stellen sie praktisch unendlich hohe Potentialwälle dar. Weil die potentielle Energie der Elektronen innerhalb des Kastens null ist, redu ziert sich das Problem auf das eines dreidimensionalen unendlich tiefen Potential topfs (s. Ergänzungen GII und HI ). Die stationären Zustände eines Teilchens in diesem Topf werden beschrieben durch die Wellenfunktionen πx πy πz 2 3/2 φ n x ,n y ,n z (r) = ( ) sin (n x ) sin (n y ) sin (n z ) L L L L n x , n y , n z = 1, 2, 3, . . .
(1a) (1b)
(der Ausdruck ist für 0 ≤ x, y, z ≤ L gültig, da die Wellenfunktion außerhalb des Kastens null ist). Die zu φ n x ,n y ,n z gehörende Energie ist E n x ,n y ,n z =
π2 ℏ2 (n2 + n2y + n2z ) 2me L2 x
(2)
Natürlich ist der Elektronenspin zu berücksichtigen: Jede Wellenfunktion (1) be schreibt den Raumanteil von zwei verschiedenen stationären Zuständen, die sich durch ihre Spinorientierung unterscheiden, aber dieselbe Energie haben, da der Ha milton-Operator des Problems spinunabhängig ist. Die Menge dieser stationären Zustände bildet eine diskrete Basis, die uns die Kon struktion eines beliebigen Zustands für ein in diesem Kasten eingeschlossenes Elek tron (dessen Wellenfunktion an den Wänden also gleich null ist) erlaubt. Mit einer Vergrößerung des Kastens können wir den Abstand zwischen zwei aufeinanderfol genden Energien beliebig klein werden lassen, da dieser Abstand umgekehrt propor tional zu L2 ist. Wenn L also ausreichend groß ist, können wir praktisch nicht mehr zwischen dem diskreten Spektrum (2) und einem kontinuierlichen Spektrum unter scheiden, das alle positiven Energiewerte enthält. Den Grundzustand erhält man, wenn man das Tensorprodukt der N Einzelzustän de, die zu den niedrigsten mit dem Pauli-Prinzip verträglichen Energien gehören, an tisymmetrisiert. Für kleine N kann man die ersten Einzelniveaus (2) leicht auffüllen und so das tiefste Niveau, seine Entartung und den zugehörigen antisymmetrisierten Vektor bestimmen. Ist N jedoch sehr viel größer als eins (in einem makroskopischen Festkörper ist N von der Größenordnung 1023 ), muss man anders vorgehen. Wir beginnen mit der Berechnung der Anzahl n(E) von Einzelzuständen, deren Energien kleiner sind als ein vorgegebener Wert E. Dazu schreiben wir den Aus
Elektronengas. Anwendung auf Festkörper | 1487
•
druck (2) für die möglichen Energien in der Form E n x ,n y ,n z =
ℏ2 2 k 2me n x ,n y ,n z
(3)
mit (k n x ,n y ,n z )x = n x π/L (k n x ,n y ,n z )y = n y π/L
(4)
(k n x ,n y ,n z )z = n z π/L Gleichung (1) entnehmen wir, dass zu jeder Funktion φ n x ,n y ,n z (r) ein Vektor k n x ,n y ,n z gehört. Umgekehrt gehört zu jedem Vektor genau eine Funktion φ n x ,n y ,n z . Die Anzahl der Zustände n(E) ergibt sich dann, indem wir die Anzahl der Vektoren, die einen Be trag kleiner als √2me E/ℏ2 haben, mit 2 multiplizieren (der Faktor 2 stammt von den Elektronenspins). Die Endpunkte der Vektoren k n x ,n y ,n z zerlegen den k-Raum in Ele mentarwürfel mit der Kantenlänge π/L (s. Abb. 1, in der der Einfachheit halber statt eines dreidimensionalen ein zweidimensionaler Raum dargestellt ist). Jeder Endpunkt gehört acht benachbarten Würfeln an, und jeder Würfel hat acht Ecken. Wenn wir die elementaren Würfel also als ausreichend klein annehmen (d. h. wenn L ausrei chend groß ist), können wir davon ausgehen, dass es pro Volumenelement (π/L)3 des k-Raums einen Vektor k n x ,n y ,n z gibt.
Abb. 1: Endpunkte der Vektoren kn x ,n y , die die stationären Wellenfunktionen in einem unend lich tiefen zweidimensionalen Potentialtopf charakterisieren.
Der vorgegebene Wert von E definiert im k-Raum eine Kugel mit dem Radius √ 2me E/ℏ2 um den Ursprung. Dabei liefert nur ein Achtel des Kugelvolumens einen Beitrag, da die Komponenten von k positiv sind [s. Gl. (1b) und Gl. (4)]. Wenn wir dieses Volumen durch das zu einem stationären Zustand gehörende Volumenelement (π/L)3 teilen und mit dem Faktor 2 den Spin berücksichtigen, so erhalten wir n(E) = 2
2me 3/2 1 L3 2me 3/2 14 π ( 2 E) = ( E) 3 83 ℏ (π/L) 3π2 ℏ2
(5)
•
1488 | Ergänzung CXIV
Mit diesem Ergebnis können wir sofort die maximale Energie eines Elektrons im Grundzustand des Systems, d. h. die Fermi-Energie EF des Elektronengases berechnen. Für sie gilt n(EF ) = N
(6)
woraus sich EF =
N 2/3 ℏ2 (3π2 3 ) 2me L
(7)
ergibt. Wie zu erwarten war, hängt die Fermi-Energie nur von der Anzahl N/L3 der Elektronen in der Volumeneinheit ab. Am absoluten Nullpunkt sind die Energiezu stände mit einer Energie kleiner als EF alle besetzt, während die Zustände mit einer Energie größer als EF leer sind. Wir werden in § 1-b sehen, wie sich das für Tempera turen größer als null ändert. Aus Gl. (5) lässt sich die Zustandsdichte ρ(E) bestimmen: Sie wird als die Anzahl der Zustände definiert, deren Energien zwischen E und E + dE liegen. Wie wir später sehen werden, ist sie physikalisch von großer Bedeutung. Man erhält sie, indem man n(E) nach E ableitet: ρ(E) =
dn(E) L3 2me 3/2 1/2 = ( ) E dE 2π2 ℏ2
(8)
Die Zustandsdichte ρ(E) verhält sich also wie √E. Am absoluten Nullpunkt ist die An zahl der Elektronen mit einer Energie zwischen E und E +dE (unterhalb von EF ) gleich ρ(E) dE. Mit Hilfe des Ausdrucks (7) für die Fermi-Energie EF können wir ρ(E) in der Form schreiben ρ(E) =
3 E1/2 N 2 E3/2
(9)
F
Bemerkung: Gleichung (5) zeigt, dass die Dimensionen des Kastens nur über das Volumenelement (π/L)3 ein gehen, das im k-Raum zu einem stationären Zustand gehört. Wenn wir anstelle eines Würfels mit der Kantenlänge L ein Parallelepiped mit den Kantenlängen L1 , L2 , L3 betrachtet hätten, würden wir ein Volumenelement π 3 /L1 L2 L3 erhalten: Nur das Volumen L1 L2 L3 des Kastens geht also in die Zustandsdichte ein. Man kann zeigen, dass diese Aussage unabhängig von der exakten geometrischen Form des Kastens gültig bleibt, vorausgesetzt, dass er ausreichend groß ist.
1-b Elektronen mit Energien in der Umgebung von EF Die Ergebnisse des vorangegangenen Abschnitts ermöglichen es, die physikalischen Eigenschaften eines freien Elektronengases zu verstehen. Wir zeigen dies an zwei ein fachen Beispielen: der spezifischen Wärme und der magnetischen Suszeptibilität des Systems. Dabei beschränken wir uns auf halbquantitative Überlegungen, mit denen wir die herausragende Rolle des Pauli-Prinzips verdeutlichen können.
Elektronengas. Anwendung auf Festkörper | 1489
•
α Spezifische Wärme Am absoluten Nullpunkt befindet sich das Elektronengas in seinem Grundzustand: Alle Einzelzustände mit einer Energie kleiner als EF sind besetzt und alle anderen leer. Unter Verwendung von Gl. (8) für die Zustandsdichte ρ(E) können wir diese Situation schematisch wie in Abb. 2a darstellen: Die Anzahl ν(E) d E an Elektronen mit einer Energie zwischen E und E + dE ist für E < EF gleich ρ(E) d E und für E > EF gleich null. Was geschieht, wenn die Temperatur etwas über dem absoluten Nullpunkt liegt?
(a)
(b)
Abb. 2: Verlauf von ν(E) in Abhängigkeit von E (ν(E) dE ist die Anzahl der Elektronen mit einer Ener gie zwischen E und E + dE). Am absoluten Nullpunkt sind alle Niveaus mit einer Energie kleiner als die Fermi-Energie E F besetzt (a). Bei einer etwas höheren Temperatur T treten zwischen freien und besetzten Niveaus über ein Energieintervall von einigen kT Übergänge auf (b).
Nach der klassischen Mechanik nehmen alle Elektronen beim Übergang vom abso luten Nullpunkt zu einer Temperatur T eine Energie von der Größe kT auf (k ist die Boltzmann-Konstante). Die Gesamtenergiedichte des Elektronengases ist danach nä herungsweise N Ukl (T) ≈ 3 kT (10) L und die spezifische Wärme ∂Ukl /∂T bei konstantem Volumen temperaturunabhängig. Dies widerspricht der Beobachtung. Wegen des Pauli-Prinzips können die meisten Elektronen keine Energie aufnehmen. Für ein Elektron, dessen ursprüngliche Ener gie E sehr viel kleiner als die Fermi-Energie EF ist (wenn also EF − E ≫ kT ist), sind die Zustände, die es mit einer Energieerhöhung um kT erreichen könnte, bereits be setzt und daher verboten. Nur Elektronen, deren Anfangsenergie E dicht bei EF liegt, können „erwärmt“ werden, s. Abb. 2b. Die Anzahl dieser Elektronen ist näherungs weise 3 kT ∆N ≈ ρ(EF )kT = N (11) 2 EF [nach Gl. (9)]. Da die Energie dieser Elektronen um etwa kT zunimmt, erhalten wir anstelle des klassischen Ausdrucks (10) die Gesamtenergiedichte N kT kT (12) U(T) ≈ 3 L EF
•
1490 | Ergänzung CXIV
Die spezifische Wärme bei konstantem Volumen ist daher proportional zur absoluten Temperatur T: cV =
∂U Nk kT ≈ 3 ∂T L EF
(13)
Bei Metallen, auf die das Modell eines freien Elektronengases angewendet werden kann, ist EF von der Größenordnung einiger Elektronvolt. Da kT bei normalen Tempe raturen bei etwa 0.03 eV liegt, ergibt sich für den auf das Pauli-Prinzip zurückgehen den Faktor kT/EF eine Größenordnung von 1/100. Bemerkungen: 1. Zur Berechnung der spezifischen Wärme des Elektronengases benötigen wir die Wahrschein lichkeit f(E, T) dafür, dass ein Einzelzustand der Energie E besetzt ist, wenn sich das System bei der Temperatur T im thermodynamischen Gleichgewicht befindet. Die Anzahl ν(E) dE von Elek tronen mit einer Energie zwischen E und E + dE ist dann gleich ν(E) dE = f(E, T) ρ(E) dE
(14)
In der statistischen Mechanik wird gezeigt, dass die Funktion f(E, T) für Fermionen lautet f(E, T) =
1 e(E−μ)/kT + 1
(15)
worin μ das chemische Potential ist, das auch als Fermi-Niveau des Systems bezeichnet wird. Dies ist die Fermi-Dirac-Verteilung. Das Fermi-Niveau wird bestimmt durch die Bedingung, dass die Gesamtzahl der Elektronen gleich N sein muss: +∞
∫ 0
ρ(E) dE =N e(E−μ)/kT + 1
(16)
μ hängt von der Temperatur ab, aber es lässt sich zeigen, dass diese Abhängigkeit für kleine T nur schwach ist. Der Verlauf der Funktion f(E, T) ist in Abb. 3 wiedergegeben. Am absoluten Nullpunkt ist f(E, 0) für E < μ gleich 1 und für E > μ gleich 0 („Stufenfunktion“). Für Temperaturen ungleich null hat f(E, T) die Form einer „abgerundeten Stufe“ (das Energieintervall, in dem Veränderungen auftreten, ist von der Größenordnung einiger kT, solange kT ≪ μ gilt). Für ein freies Elektronengas ist ersichtlich, dass das Fermi-Niveau μ am absoluten Nullpunkt mit der oben berechneten Fermi-Energie übereinstimmt. Aus Gl. (14) und der Form, die f(E, T) für T = 0 hat (Abb. 3), lässt sich ablesen, dass μ wie E F den höchsten besetzten Energiezustand angibt. Für ein System mit einem diskreten Energiespektrum (E 1 , E 2 , E 3 , . . . , E i , . . .) stimmt anderer seits das Fermi-Niveau, das sich aus Gl. (16) ergibt, am absoluten Nullpunkt nicht mit dem höchs ten im Grundzustand besetzten Energieniveau E m überein. In diesem Fall setzt sich die Zustands dichte aus einer Reihe von Deltafunktionen zusammen, die um E 1 , E 2 , E 3 , . . . , E i , . . . zentriert sind; folglich kann am absoluten Nullpunkt μ einen beliebigen Wert zwischen E m und E m+1 an nehmen, da nach Gl. (14) alle diese Möglichkeiten auf denselben Wert von ν(E) führen. Wir de finieren μ am absoluten Nullpunkt daher als den Grenzwert von μ(T) für T gegen null. Da bei Temperaturen ungleich null das Niveau E m etwas geleert wird und umgekehrt das Niveau E m+1 sich aufzufüllen beginnt, liefert der Grenzübergang für μ(T) einen Wert zwischen E m und E m+1 (er liegt genau in der Mitte, wenn die beiden Zustände E m und E m+1 dieselbe Entartung aufweisen). Entsprechend befindet sich für ein System mit einer Folge von erlaubten Energiebändern, die durch verbotene Bänder voneinander getrennt sind (Elektronen in einem Festkörper, s. Ergän
Elektronengas. Anwendung auf Festkörper | 1491
•
Abb. 3: Fermi-Dirac-Verteilung am absoluten Null punkt (gestrichelte Kurve) und bei tiefen Temperatu ren (durchgezogene Kurve). Für ein Elektronengas am absoluten Nullpunkt fällt μ mit der Fermi-Energie E F zusammen. Die Kurven aus Abb. 2 ergeben sich, in dem die Zustandsdichte ρ(E) mit f(E, T) multipliziert wird.
zung FXI ), das Fermi-Niveau μ in einem verbotenen Band, wenn der höchste besetzte Energie zustand am absoluten Nullpunkt mit dem oberen Rand eines erlaubten Bands zusammenfällt. Dagegen ist das Fermi-Niveau μ gleich E F , wenn E F in der Mitte eines erlaubten Bands liegt. 2. Das Verhalten der spezifischen Wärme von Metallen bei sehr tiefen Temperaturen ist mit den obigen Ergebnissen zu verstehen. Bei normalen Temperaturen hängt die spezifische Wärme im Wesentlichen mit den Schwingungen des Ionengitters zusammen (s. Ergänzung LV ), da der Bei trag des Elektonengases praktisch vernachlässigbar ist. Für kleine T geht die spezifische Wärme des Gitters jedoch wie T 3 gegen null, so dass für niedrige Temperaturen (um 1 K) die spezifische Wärme des Elektronengases überwiegt; und tatsächlich wird bei Metallen für diese Temperaturen ein Abfall linear mit T beobachtet.
β Magnetische Suszeptibilität Wir betrachten nun ein freies Elektronengas, das sich in einem homogenen magneti schen Feld B parallel zur z-Achse befindet. Die Energie der stationären Einzelzustände hängt dann von dem entsprechenden Spinzustand ab, da der Hamilton-Operator ei nen paramagnetischen Spinterm (s. Kap. IX, § A-2) enthält: W = −2
μB BS z ℏ
(17)
wobei μB das Bohr-Magneton μB =
qℏ 2me
(18)
und S der elektronische Spinoperator ist. Vereinfachend nehmen wir an, dass der Term (17) der einzige zusätzliche Term im Hamilton-Operator ist (das Verhalten der Wellenfunktion im Ortsraum wurde in Ergänzung EVI untersucht). Unter diesen Be dingungen ändern sich die stationären Zustände durch das Magnetfeld nicht, und die entsprechenden Energien werden abhängig vom Spinzustand um μB B angehoben oder abgesenkt. Die Zustandsdichten ρ + (E) und ρ − (E) der Spinzustände |+⟩ bzw. |−⟩ ergeben sich daher in einfacher Weise aus der oben berechneten Zustandsdichte ρ(E): ρ ± (E) =
1 ρ(E ± μ B B) 2
(19)
Am absoluten Nullpunkt finden wir also eine Situation vor, wie sie in Abb. 4 dargestellt ist.
•
1492 | Ergänzung CXIV
Abb. 4: Die Zustandsdichten ρ + (E) und ρ − (E) zu den Spinzuständen |+⟩ bzw. |−⟩ (μB ist negativ). Am absoluten Nullpunkt sind nur die Zustände mit Energien kleiner als E F besetzt.
Da die magnetische Energie |μ B |B sehr viel kleiner als EF ist, wird die Differenz zwischen der Anzahl der Elektronen mit dem Spin parallel und dem Spin antiparallel zu B am absoluten Nullpunkt gegeben durch 1 N− − N+ ≈ ρ(EF )2|μ B |B (20) 2 Das magnetische Moment M durch Volumen kann somit geschrieben werden 1 M = |μ B | 3 (N− − N+ ) L 1 2 (21) = μB B 3 ρ(EF ) L Es ist proportional zum angelegten Feld, so dass die magnetische Suszeptibilität durch Volumen 1 M = μ 2B 3 ρ(EF ) χ= (22) B L oder unter Verwendung des Ausdrucks (9) für ρ(E) χ=
3 N μ 2B 2 L3 EF
(23)
ist. Bemerkungen: 1. Das Ergebnis (23) für ein System am absoluten Nullpunkt bleibt auch für niedrige Temperatu ren gültig, da die Änderungen in der Anzahl der besetzten Zustände (Abb. 2b) für beide Spinzu stände praktisch gleich sind. Damit erhalten wir eine von der Temperatur unabhängige magneti sche Suszeptibilität, was bei Metallen auch beobachtet wird. 2. Wie im vorherigen Abschnitt sehen wir auch hier, dass das Verhalten des Systems in Gegen wart eines Magnetfelds im Wesentlichen durch die Elektronen bestimmt wird, deren Energie na he bei E F liegt. Wenn das Magnetfeld angelegt wird, streben die Elektronen im Zustand |+⟩ in den energetisch günstigeren Zustand |−⟩. Für die meisten von ihnen ist das jedoch aufgrund des Pauli-Prinzips unmöglich, da die benachbarten |−⟩-Zustände bereits besetzt sind.
Elektronengas. Anwendung auf Festkörper | 1493
•
1-c Periodische Randbedingungen α Einleitung Die in Gl. (1) angegebenen Funktionen φ n x ,n y ,n z weisen eine ganz andere Struktur auf als die ebenen Wellen eik⋅r , durch die sonst die stationären Zustände freier Elektro nen beschrieben werden. Dieser Unterschied rührt von den Randbedingungen durch die Wände des Kastens. Innerhalb des Kastens erfüllen die ebenen Wellen dieselbe Gleichung wie die φ n x ,n y ,n z : −
ℏ2 ∆φ(r) = Eφ(r) 2me
(24)
Die Funktionen (1) sind umständlicher zu handhaben als ebene Wellen, die darum be vorzugt werden. Dafür müssen die Lösungen von Gl. (24) neuen, künstlichen Randbe dingungen unterworfen werden, mit denen man die ebenen Wellen nicht ausschließt. Das physikalische Problem wir dadurch natürlich geändert. Man erhält jedoch wieder die wesentlichen Eigenschaften des ursprünglichen Systems. Dazu müssen die neuen Randbedingungen auf eine diskrete Menge möglicher Werte von k mit den folgenden Eigenschaften führen: 1. Das System der zu diesen Vektoren k gehörenden ebenen Wellen bildet eine Basis, nach der sich jede beliebige Funktion innerhalb des Kastens entwickeln lässt. 2. Die Zustandsdichte ρ (E), die zu diesen k gehört, ist gleich der Zustandsdichte ρ(E), die wir oben aus den richtigen stationären Zuständen berechnet haben. Da sich die neuen Randbedingungen von den reellen Randbedingungen unterschei den, ist klar, dass sich mit den ebenen Wellen das Verhalten des Systems in der Nähe der Wände nicht beschreiben lässt (Oberflächeneffekte). Wir verstehen jedoch aufgrund von Eigenschaft 2, dass sie auf sehr einfache Weise dem Volumeneffekt Rechnung tragen, der nur von der Zustandsdichte ρ(E) abhängt. Außerdem lässt sich wegen Eigenschaft 1 die Bewegung eines beliebigen Wellenpakets in ausrei chender Entfernung von den Wänden durch die Überlagerung ebener Wellen richtig beschreiben, da sich die Wellenpakete zwischen zwei Stößen mit der Wand frei bewe gen. β Born-von-Karman-Bedingungen Wir fordern nun nicht, dass die einzelnen Wellenfunktionen an den Wänden des Kas tens gegen null gehen, sondern stattdessen periodisch mit L sind: φ(x + L, y, z) = φ(x, y, z)
(25)
•
1494 | Ergänzung CXIV
mit entsprechenden Beziehungen für y und z. Diese Bedingung wird durch ebene Wel len der Form eik⋅r erfüllt, wenn für die Komponenten des Vektors k gilt 2π L 2π ky = ny L 2π kz = nz L
k x = nx
(26)
worin nx , ny und nz positive oder negative ganze Zahlen oder null sind. Wir führen also ein neues System von Wellenfunktionen φn ,n ,n (r) = x
y
z
1 i(2π/L)(nx x+ny y+nz z) e L3/2
(27)
ein, die im Innern des Kastens normiert sind. Die zugehörige Energie ergibt sich aus Gl. (24) zu E nx ,ny ,nz =
ℏ2 4π2 2 2 2 (n + ny + nz ) 2me L2 x
(28)
Jede Wellenfunktion, die innerhalb des Kastens definiert ist, kann auf eine pe riodische Funktion von x, y, z mit der Periode L erweitert werden. Da diese sich im mer in eine Fourier-Reihe (s. Anhang I, § 1-b) entwickeln lässt, bildet das System {φn ,n ,n (r)} für die Wellenfunktionen innerhalb des Kastens eine Basis. Zu jedem x
y
z
Vektor k nx ,ny ,nz , dessen Komponenten durch Gl. (26) gegeben werden, gehört ein wohldefinierter Wert der Energie E nx ,ny ,nz [Gl. (28)]. Zu beachten ist jedoch, dass die Vektoren k nx ,ny ,nz jetzt positive, negative oder verschwindende Komponenten haben können und ihre Endpunkte den Raum in doppelt so große Elementarwürfel wie in § 1-a aufteilen. Um nachzuweisen, dass die Randbedingungen (25) auf dieselben physikalischen Ergebnisse (soweit es Volumeneffekte betrifft) führen, berechnen wir die Anzahl n (E) stationärer Zustände mit einer Energie kleiner als E und zeigen, dass sich der Wert (5) ergibt (die Fermi-Energie EF und die Zustandsdichte leiten sich direkt aus n(E) ab). Wir bestimmen n (E) wie in § 1-a, wobei wir die neuen Eigenschaften der Vektoren k nx ,ny ,nz beachten müssen. Da die Komponenten von k nun beliebige Vorzeichen haben kön nen, müssen wir das Volumen der Kugel mit dem Radius √2me E/ℏ2 nicht mehr durch 8 teilen. Diese Änderung wird jedoch dadurch kompensiert, dass das Volumenele ment (2π/L)3 , das zu jedem der Zustände (27) gehört, achtmal größer ist als das ent sprechende, zu den obigen Randbedingungen gehörende Volumenelement. Folglich erhalten wir für n (E) denselben Ausdruck (5) wie für n(E). Mit den periodischen Randbedingungen (25) kann man daher den Eigenschaf ten 1 und 2 genügen. Sie werden allgemein die Born-von-Karman-Bedingungen ge nannt.
Elektronengas. Anwendung auf Festkörper | 1495
•
Bemerkung: Wir betrachten ein freies Elektron (das nicht in einem Kasten eingeschlossen ist). Die Eigenfunk tionen der drei Komponenten des Impulses P (und damit des Hamilton-Operators H = P2 /2m e ) bilden eine „kontinuierliche Basis“ {(
1 3/2 ip⋅r/ℏ } ) e 2πℏ
(29)
Wir haben bereits mehrfach darauf hingewiesen, dass dies keine physikalischen Zustände sind. Sie dienen aber als mathematische Hilfsmittel bei der Untersuchung von Wellenpaketen, mit de nen man physikalische Zustände umschreibt. Es ist manchmal vorteilhaft, anstelle der kontinuierlichen Basis (29) die diskrete Basis (27) zu ver wenden. Dazu stellen wir uns vor, das Elektron sei in einem fiktiven Kasten mit der Kantenlänge L, die sehr viel größer sein muss als die beim Problem auftretenden Dimensionen, eingeschlos sen, und verlangen die Born-Von-Karman-Bedingungen. Dann wird sich jedes Wellenpaket im mer innerhalb dieses Kastens befinden und kann genauso gut nach der diskreten Basis (27) wie nach der kontinuierlichen Basis (29) entwickelt werden. Wieder sind die Funktionen (27) ein ma thematisches Hilfsmittel, haben allerdings den Vorteil, innerhalb des Kastens normiert zu sein. Nach Berechnung der verschiedenen physikalischen Größen (Übergangswahrscheinlichkeiten, Wirkungsquerschnitte usw.) muss man natürlich überprüfen, dass sie nicht mehr von L abhän gen, sobald man L genügend groß wählt. Offenbar hat die Kantenlänge L für ein wirklich freies Elektron keine physikalische Bedeutung. Sie kann daher beliebig gewählt werden, solange sie ausreichend groß ist, damit die Zustände (27) eine Basis bilden können (Bedingung 1 in § 1-c-α). Dagegen ist bei dem hier untersuchten Problem L3 das Volumen, in dem N Elektronen eingeschlossen sind; die Länge L ist damit vorgegeben.
2 Elektronen in Festkörpern 2-a Erlaubte Bänder Das Modell eines in einem Kasten eingeschlossenen freien Elektronengases lässt sich recht gut auf die Leitungselektronen eines Metalls anwenden. Diese Metallelektronen können als freibeweglich angesehen werden, wobei die elektrostatische Anziehung des Kristallgitters verhindert, dass sie bei Erreichen der Oberfläche das Metall verlas sen. Das Modell kann jedoch nicht erklären, warum einige Festkörper gute elektrische Leiter und andere Isolatoren sind. Dabei handelt es sich um eine bemerkenswerte ex perimentelle Tatsache: Die elektronischen Eigenschaften aller Kristalle hängen mit den Elektronen der Atome zusammen, aus denen sie aufgebaut sind; die innere Leitfä higkeit variiert jedoch um einen Faktor 1030 zwischen einem guten Isolator und einem Metall. Wir werden wenigstens qualitativ zeigen, wie man dies mit dem Pauli-Prinzip und der Existenz von Energiebändern (s. Ergänzungen OIII und FXI ) erklären kann. Wenn wir, wie in Ergänzung FXI gezeigt, die Elektronen eines Festkörpers in erster Näherung als voneinander unabhängig ansehen, ordnen sich ihre möglichen Ener gien in erlaubten Bändern an, die durch verbotene Bänder voneinander getrennt sind. Dies haben wir für den Fall erklärt, bei dem sich jedes Elektron unter dem Einfluss einer linearen Kette aus positiven Ionen befindet. In einem realen dreidimensionalen
•
1496 | Ergänzung CXIV
Kristallgitter ist die Situation natürlich noch komplizierter. Das theoretische Verständ nis der Eigenschaften eines Festkörpers erfordert eine genaue Untersuchung der Ener giebänder, die wiederum auf den räumlichen Eigenschaften des Kristallgitters beruht. Wir werden darauf nicht im Einzelnen eingehen, sondern uns auf eine qualitative Dis kussion der Phänomene beschränken.
2-b Lage des Fermi-Niveaus und elektrische Leitfähigkeit Wenn wir die Bandstruktur und die Anzahl der Zustände in einem Band kennen, er gibt sich für einen Festkörper der Grundzustand durch sukzessives Auffüllen der Ein zelzustände in den erlaubten Bändern, wobei natürlich mit den niedrigsten Energien begonnen wird. Nur am absoluten Nullpunkt befindet sich das System wirklich in sei nem Grundzustand. Wie wir jedoch bereits in § 1-b-α festgestellt haben, kann man aus den Eigenschaften dieses Grundzustands halbquantitativ auf das Verhalten des Sys tems bei Temperaturen ungleich null – oft bis zu normalen Temperaturen – schließen. Wie die thermischen und magnetischen Eigenschaften (s. § 1-b) werden auch die elek trischen Eigenschaften des Systems grundsätzlich durch die Elektronen bestimmt, de ren Energien dicht bei der höchsten Energie EF liegen. Wenn wir den Festkörper einem elektrischen Feld aussetzen, kann ein Elektron, dessen Energie weit unter EF liegt, kei ne Energie durch Beschleunigung aufnehmen, da die Zustände, die es auf diese Weise erreichen würde, bereits besetzt sind. Es ist daher von grundlegender Bedeutung, die Lage von EF relativ zu den erlaubten Energiebändern zu kennen. Zunächst nehmen wir an (Abb. 5a), EF falle in die Mitte eines erlaubten Bands. Das Fermi-Niveau μ ist dann gleich EF (s. Bemerkung 1 in § 1-b-α). Die Elektronen mit Energien nahe bei EF können leicht beschleunigt werden, da für sie die etwas höheren Energiezustände frei und damit zugänglich sind. Folglich handelt es sich bei einem Festkörper, bei dem das Fermi-Niveau in die Mitte eines erlaubten Bands fällt, um ei nen Leiter. Die Elektronen mit den höchsten Energien verhalten sich dann annähernd wie freie Teilchen. Wir betrachten nun andererseits einen Festkörper, bei dem der Grundzustand aus vollständig besetzten erlaubten Bändern besteht (Abb. 5b). Die Energie EF fällt dann mit dem oberen Rand eines erlaubten Bands zusammen, und das Fermi-Niveau μ liegt im anschließenden verbotenen Band (s. Bemerkung 1 in § 1-b-α). In diesem Fall kön nen keine Elektronen beschleunigt werden, da die direkt über ihnen liegenden Ener giezustände verboten sind. Ein Festkörper, bei dem das Fermi-Niveau in die Mitte eines verbotenen Bands fällt, ist daher ein Isolator. Je größer der Abstand ∆E zwischen dem letzten besetzten Band und dem ersten leeren Band ist, desto besser ist der Isolator. Wir werden darauf später zurückkommen. Die tiefen erlaubten Bänder, die vollständig von Elektronen besetzt und deshalb in elektrischer und thermischer Hinsicht träge sind, werden als Valenzbänder bezeich net; sie sind im Allgemeinen schmal. Im Modell der starken Bindung (s. § 2 von Er
Elektronengas. Anwendung auf Festkörper | 1497
(a)
•
(b)
Abb. 5: Schematische Darstellung der einzelnen Energieniveaus, die die Elektronen am absoluten Nullpunkt besetzen (grau); E F ist die größte Einzelenergie. In einem Leiter (a) liegt E F (das mit dem Fermi-Niveau zusammenfällt) in einem erlaubten Energieband, dem sogenannten Leitungsband. Die Elektronen, deren Energien nahe bei E F liegen, können dann leicht beschleunigt werden, da die et was höheren Energieniveaus für sie zugänglich sind. In einem Isolator (b) liegt E F am oberen Rand eines erlaubten Bands, des sogenannten Valenzbands (das Fermi-Niveau liegt dann im benachbar ten verbotenen Band). Die Elektronen können nur angeregt werden, indem sie das verbotene Band überspringen. Dies erfordert eine Energie, die mindestens gleich der Breite ∆E dieses Bands sein muss.
gänzung FXI ) stammen diese Bänder von den niedrigen atomaren Niveaus, die von der Gegenwart der anderen Atome im Kristallgitter nur wenig beeinflusst werden. Die höheren Bänder hingegen sind breiter; ein teilweise besetztes Band ist ein Leitungs band. Bei einem guten Isolator muss das letzte besetzte Band nicht nur im Grundzustand vollständig besetzt sein, sondern vom nächsthöheren erlaubten Band auch durch ein ausreichend breites verbotenes Band getrennt sein. Wie wir bereits gesehen haben (§ 1-b-α), können bei Temperaturen ungleich null einige Zustände mit Energien klei ner als EF frei sein, während höhere Zustände besetzt werden (Abb. 2b). Damit der Festkörper bei der Temperatur T ein Isolator bleibt, muss die Breite ∆E des verbote nen Bands, das eine Anregung der Elektronen verhindert, sehr viel größer als kT sein. Wenn ∆E kleiner oder von der Größenordnung kT ist, verlassen einige Elektronen das Valenzband und besetzen Zustände des nächsthöheren erlaubten Bands (das am ab soluten Nullpunkt vollständig leer ist). Der Kristall besitzt dann eine beschränkte Zahl an Leitungselektronen: Es handelt sich um einen Halbleiter mit Eigenleitung (s. die Be merkung weiter unten). Diamant z. B. mit ∆E bei etwa 5 eV bleibt bei normalen Tem peraturen ein Isolator; Silicium und Germanium hingegen, obwohl sie Diamant sehr ähnlich sind, sind Halbleiter: Ihre verbotenen Bänder haben eine Breite ∆E von weni ger als 1 eV. Aufgrund dieser qualitativen Überlegungen können wir verstehen, warum
•
1498 | Ergänzung CXIV
die elektrische Leitfähigkeit eines Halbleiters mit steigender Temperatur sehr schnell zunimmt; tatsächlich ergeben quantitative Überlegungen eine Temperaturabhängig keit der Form e−∆E/2kT . Das Verhalten von Halbleitern weist ein scheinbar paradoxes Phänomen auf. Zu sätzlich zu den Elektronen, die bei einer Temperatur T das verbotene Band der Breite ∆E übersprungen haben, scheint es im Kristallgitter noch eine gleich große Anzahl po sitiv geladener Teilchen zu geben. Auch diese Teilchen tragen zum elektrischen Strom bei, doch hat ihr Anteil z. B. beim Hall-Effekt¹ das entgegengesetzte Vorzeichen, als man es für Elektronen erwarten würde. Dies lässt sich mit der Bändertheorie sehr gut erklären, und diese Erklärung stellt eine spektakuläre Manifestation des Pauli-Prin zips dar: Das letzte Valenzband kann, wenn es in der Nähe des absoluten Nullpunkts vollständig gefüllt ist, keinen Strom leiten (das Pauli-Prinzip verhindert, dass seine Elektronen beschleunigt werden können). Wenn durch thermische Anregung einige Elektronen in das Leitungsband übertreten, lassen sie im Valenzband freie Zustän de zurück. Diese freien Zustände in einem fast vollständig gefüllten Band nennt man Löcher. Löcher verhalten sich wie Teilchen mit entgegengesetzter Elektronenladung. Wird ein elektrisches Feld angelegt, so können sich die im Valenzband verbliebenen Elektronen bewegen, ohne dieses Band zu verlassen, und die leeren Zustände beset zen. Sie füllen also die Löcher und hinterlassen dabei wiederum neue Löcher. Löcher bewegen sich daher entgegengesetzt zur Elektronenrichtung, d. h. so als hätten sie ei ne positive Ladung. Löcher sind, wie eine genauere Untersuchung zeigen würde, in jeder Hinsicht zu positiven Ladungsträgern äquivalent. Bemerkung: Wir haben bisher nur von chemisch reinen und geometrisch perfekten Kristallen gesprochen. In Wirklichkeit aber weist jeder Festkörper Verunreinigungen und Fehler auf, die oft, insbesondere bei Halbleitern, eine wichtige Rolle spielen. Betrachten wir z. B. einen Kristall aus vierwertigem Silicium oder Germanium, in dem einige Ato me durch fünfwertige Verunreinigungsatome, etwa Phosphor, Arsen oder Antimon ersetzt wer den (das geschieht oft ohne gravierende Änderungen der Kristallstruktur). Ein solches Verun reinigungsatom besitzt ein Valenzelektron mehr als die benachbarten Silicium- oder Germani umatome; es wird als Donator bezeichnet. Die Bindungsenergie ∆E d des zusätzlichen Elektrons ist im Kristall sehr viel kleiner als im freien Atom (von der Größenordnung einiger hundertstel eV), was im Wesentlichen auf die große Dielektrizitätskonstante des Kristalls zurückzuführen ist. Sie reduziert die Coulomb-Kraft (s. Ergänzung AVII , § 1-a-δ). Folglich kann das vom Donatoratom ein gebrachte überschüssige Elektron leichter in das Leitungsband übergehen als die „normalen“ Elektronen des Valenzbands (Abb. 6a). Der Kristall wird somit bei sehr viel niedrigeren Tempera turen zum Leiter, als es bei reinem Silicium oder Germanium der Fall wäre. Diese Leitung aufgrund von Verunreinigungen bezeichnet man als Störstellenleitung. Analog verhält sich ein dreiwerti ges Verunreinigungsatom (wie Bor, Aluminium oder Gallium) in Silicium oder Germanium wie ein
1 Wir erinnern uns: In einem stromführenden Leiterstreifen, der sich in einem Magnetfeld senkrecht zu diesem Strom befindet, unterliegen die bewegten Ladungen der Lorentz-Kraft. Im stationären Zu stand tritt daher ein transversales elektrisches Feld auf (senkrecht zum Strom und zum Magnetfeld).
Elektronengas. Anwendung auf Festkörper |
1499
•
Akzeptor von Elektronen: Es kann leicht ein Elektron des Valenzbands einfangen (Abb. 6b), wobei dort ein stromleitendes Loch hinterlassen wird. In einem reinen Halbleiter mit Eigenleitung ist die Anzahl an Leitungselektronen immer gleich der Anzahl an Löchern im Valenzband. Ein Störstel len halbleiter kann jedoch abhängig vom Verhältnis der Anzahl von Donatoren und Akzeptoren mehr Leitungselektronen als Löcher (man spricht dann von Halbleitern vom Typ n, da die Mehr zahl der Ladungsträger negativ ist), oder mehr Löcher als Leitungselektronen (Typ p mit mehr positiven als negativen Ladungsträgern) enthalten. Diese Eigenschaften bilden die Grundlage für zahlreiche technische Anwendungen (Transistoren, Gleichrichter, photoelektrische Zellen usw.). Verunreinigungen werden oft absichtlich in Halbleiter implantiert, um ihre Eigenschaften zu be einflussen: Diesen Prozess bezeichnet man als Dotierung.
(a)
(b)
Abb. 6: Störstellenhalbleiter: Durch Donatoratome (a) werden Elektronen eingebracht, die leichter in das Leitungsband überwechseln, da ihr Grundzustand nur durch eine viel kleinere Energiedifferenz ∆E d vom Leitungsband getrennt ist. Akzeptoren (b) fangen leicht ein Elektron des Valenzbands ein, da diese Elektronen dafür nur eine Anregungsenergie ∆E a benötigen. Durch diesen Prozess wird im Valenzband ein Loch erzeugt, das Strom leiten kann.
Referenzen und Literaturhinweise Siehe Abschnitt 8 der Bibliographie, insbesondere Kittel (8.2) und Reif (8.4). Zur Fest körperphysik siehe Feynman, Bd. 5 (1.2), Kap. 14 sowie Abschnitt 13 der Bibliographie.
•
1500 | Ergänzung DXIV
Ergänzung DXIV Aufgaben 1. Es sei h0 der Hamilton-Operator eines Teilchens. Wir nehmen an, der Operator h0 wirke nur auf die Bahnvariablen und habe drei äquidistante Niveaus mit den Energien 0, ℏω0 , 2ℏω0 (wobei ω0 eine reelle positive Konstante ist), die im Bahnzustandsraum Hr nichtentartet sind (im Gesamtzustandsraum ist die Entartung jedes Niveaus gleich 2s + 1, wobei s der Spin des Teilchens ist). Wir haben in Bezug auf die Bahnvariablen nur den Unterraum von Hr zu betrachten, der durch die drei entsprechenden Eigen zustände von h0 aufgespannt wird. a) Man betrachte ein System aus drei unabhängigen Elektronen, dessen HamiltonOperator geschrieben werden kann H = h0 (1) + h0 (2) + h0 (3) Man bestimme die Energieniveaus von H und ihre Entartung. b) Dieselbe Frage beantworte man für ein System aus drei identischen Bosonen mit dem Spin 0. 2. Man betrachte ein System von identischen Bosonen mit dem Spin s = 1, die sich im selben Zentralpotential V(r) befinden. Wie lauten die Spektralterme (s. Ergän zung BXIV , § 2-b), die zu den Konfigurationen 1s2 , 1s2p, 2p2 gehören? 3. Wir betrachten den Zustandsraum eines Elektrons, der durch die beiden Vektoren |φ p x ⟩ und |φ p y ⟩, die zwei atomare Orbitale p x und p y mit den Wellenfunktionen φ p x (r) und φ p y (r) darstellen (s. Ergänzung EVII , § 2-b), aufgespannt wird: φ p x (r) = x f(r) = sin θ cos φ rf(r) φ p y (r) = y f(r) = sin θ sin φ rf(r) a) Man gebe in Abhängigkeit von |φ p x ⟩ und |φ p y ⟩ den Zustand |φ p α ⟩ für das p α -Or bital an, das in diejenige Richtung der x, y-Ebene zeigt, die mit der x-Achse einen Winkel α einschließt. b) Man betrachte zwei Elektronen, deren Spins beide im Zustand |+⟩ (dem Eigenzu stand von S z mit dem Eigenwert +ℏ/2) sind. Man gebe den normierten Zustandsvektor |ψ⟩ an, der das System der beiden Elek tronen darstellt, wobei ein Elektron im Zustand |φ p x ⟩ und das andere im Zustand |φ p y ⟩ ist. c) Dieselbe Frage beantworte man für ein Elektron im Zustand |φ p α ⟩ und ein Elektron im Zustand |φ p β ⟩, wobei α und β zwei beliebige Winkel sind. d) Das System befinde sich im Zustand |ψ⟩ von Teil b). Man berechne die Wahr scheinlichkeitsdichte 𝒫(r, θ, φ; r , θ , φ ) dafür, ein Elektron bei (r, θ, φ) und das andere bei (r , θ , φ ) zu finden. Man zeige, dass die Elektronendichte ρ(r, θ, φ) https://doi.org/10.1515/9783110638769-042
Aufgaben | 1501
•
(die Wahrscheinlichkeitsdichte, ein beliebiges Elektron bei (r, θ, φ) zu finden) symmetrisch ist bezüglich Drehungen um die z-Achse. Man bestimme die Wahr scheinlichkeitsdichte dafür, dass φ − φ = φ0 bei gegebenem φ0 ist. Man disku tiere den Verlauf dieser Wahrscheinlichkeitsdichte in Abhängigkeit von φ0 . 4. Stoß zweier identischer Teilchen Wir verwenden die Bezeichnungen aus § D-2-a-β von Kapitel XIV. a) Man betrachte zwei Teilchen (1) und (2) mit derselben Masse m, die zunächst als spinlos und unterscheidbar angenommen werden. Diese beiden Teilchen wechselwirken über ein Potential V(r), das nur von ihrem gegenseitigen Ab stand r abhängt. Zu einer Anfangszeit t0 befinde sich das System im Zustand |1 : pez ; 2 : −pez ⟩. U(t, t0 ) sei der Zeitentwicklungsoperator des Systems. Die Wahrscheinlichkeitsamplitude dafür, das System zur Zeit t1 im Zustand |1 : pn; 2 : −pn⟩ zu finden, ist F(n) = ⟨1 : pn; 2 : −pn | U(t1 , t0 ) | 1 : pez ; 2 : −pez ⟩ Mit θ und φ bezeichnen wir die Polarwinkel des Einheitsvektors n in einem ortho gonalen x, y, z-System. Man zeige, dass F(n) nicht von φ abhängt. Man berechne in Abhängigkeit von F(n) die Wahrscheinlichkeit, eines der beiden Teilchen (ohne festzulegen welches) mit dem Impuls pn und das andere mit dem Impuls −p n zu finden. Wie ändert sich diese Wahrscheinlichkeit, wenn sich θ in π − θ ändert? b) Wir betrachten Problem a) [mit demselben spinunabhängigen Wechselwirkungs potential V(r)] für zwei identische Teilchen mit den Anfangszuständen |pe z , m s ⟩ und |−pez , ms ⟩ befindet (die Quantenzahlen m s und ms gehören zu den Eigenwer ten m s ℏ und ms ℏ der Spinkomponente in z-Richtung). Es sei m s ≠ ms . Man gebe in Abhängigkeit von F(n) die Wahrscheinlichkeit an, zur Zeit t1 ein Teilchen mit dem Impuls pn und dem Spin m s und das andere mit dem Impuls −pn und dem Spin ms zu finden. Wie groß ist die Wahrscheinlichkeit, ein Teilchen mit dem Impuls pn und das andere mit dem Impuls −pn zu finden, wenn die Spins nicht gemessen werden? Wie ändern sich diese Wahrscheinlichkeiten, wenn sich θ in π−θ ändert? c) Man behandle das Problem b) für den Fall m s = ms . Insbesondere untersuche man die Richtung θ = π/2, indem man Bosonen und Fermionen getrennt behan delt. Man zeige wiederum, dass die Streuwahrscheinlichkeiten in Richtung θ und π − θ gleich sind. 5. Stoß zweier identischer unpolarisierter Teilchen Man betrachte den Stoß zweier identischer Teilchen mit dem Spin s. Ihre anfänglichen Spinzustände seien unbekannt: Beide Teilchen sind mit derselben Wahrscheinlich keit in einem der 2s + 1 möglichen orthogonalen Spinzustände. Man zeige, dass die Wahrscheinlichkeit, Streuung in Richtung n zu beobachten, gegeben ist durch ε |F(n)|2 + |F(−n)|2 + [F ∗ (n)F(−n) + k. k.] 2s + 1 (in der Notation von Aufgabe 4; ε = +1 für Bosonen und −1 für Fermionen).
•
1502 | Ergänzung DXIV
6. Mögliche Werte des Relativdrehimpulses zweier identischer Teilchen Man betrachte ein System zweier identischer Teilchen, die über ein Potential wech selwirken, das nur von ihrem gegenseitigen Abstand abhängt. Dann lautet der Hamil ton-Operator des Systems P21 P2 + 2 + V(|R1 − R2 |) 2m 2m Wie in § B von Kapitel VII setzen wir H=
RG =
1 (R1 + R2 ) 2
R = R1 − R2
PG = P1 + P 2 P=
1 (P1 − P2 ) 2
H wird dann H = HG + Hr mit HG =
P2G 4m
Hr =
P2 + V(R) m
a) Zunächst nehme man an, bei den beiden Teilchen handle es sich um identische Bosonen mit dem Spin null (z. B. π-Mesonen). α) Wir verwenden die Basis {|rG , r⟩} des Zustandsraums H des Systems, die aus gemeinsamen Eigenvektoren der Observablen RG und R besteht. Man zeige, dass für den Permutationsoperator P21 der beiden Teilchen gilt P21 |rG , r⟩ = |rG , −r⟩ β) Wir wechseln nun in die Basis {|pG ; E n , l, m⟩} gemeinsamer Eigenzustände von PG , Hr , L2 und L z (L = R × P ist der Relativdrehimpuls der beiden Teil chen). Man zeige, dass diese neuen Basisvektoren gegeben werden durch Aus drücke der Form 1 ∫ d3 rG eipG ⋅rG /ℏ ∫ d3 r R n,l (r)Y lm (θ, φ) |rG , r⟩ |pG ; E n , l, m⟩ = (2πℏ)3/2 Man zeige, dass gilt P21 |pG ; E n , l, m⟩ = (−1)l |pG ; E n , l, m⟩ γ) Welche Werte von l sind nach dem Symmetrisierungspostulat erlaubt? b) Bei den beiden betrachteten Teilchen handle es sich nun um Fermionen mit dem Spin 1/2 (Elektronen oder Protonen). α) Für den Zustandsraum des Systems verwenden wir zunächst die Basis {|rG , r; S, M⟩} gemeinsamer Eigenvektoren von RG , R, S2 und S z , wobei S = S1 + S2 der Gesamtspin des Systems ist (die Vektoren |S, M⟩ des Spinzustandsraums wurden in § B von Kapitel X bestimmt). Man zeige, dass gilt P21 |rG , r; S, M⟩ = (−1)S+1 |rG , −r; S, M⟩
Aufgaben |
1503
•
β) Wir wechseln nun in die Basis {|pG ; E n , l, m; S, M⟩} gemeinsamer Eigenzu stände von PG , Hr , L2 , L z , S2 und S z . Wie in Teil a-β zeige man, dass gilt P21 |pG ; E n , l, m; S, M⟩ = (−1)S+1 (−1)l |pG ; E n , l, m; S, M⟩ γ) Man leite die Werte von l her, die aufgrund des Symmetrisierungspostulats für die jeweiligen Werte von S (Triplett und Singulett) erlaubt sind. c) (Etwas schwieriger) Der totale Wirkungsquerschnitt zweier unterscheidbarer Teil chen, die über ein Potential V(r) wechselwirken, lässt sich im Schwerpunktsystem schreiben σ=
4π ∞ ∑ (2l + 1) sin2 δ l k 2 l=0
wobei δ l die zu V(r) gehörenden Phasenverschiebungen (Streuphasen) sind [s. Ka pitel VIII, Gl. (C-58)]. α) Was geschieht, wenn das Messinstrument auf beide Teilchen gleich anspricht (die beiden Teilchen haben dieselbe Masse)? β) Man zeige, dass sich für den in Teil a angegebenen Fall der Ausdruck für σ ändert in 8π σ = 2 ∑ (2l + 1) sin2 δ l k l gerade γ) Man zeige, dass für zwei unpolarisierte identische Fermionen mit dem Spin 1/2 (der in Teil b betrachtete Fall) gilt } 2π { ∑ (2l + 1) sin2 δ l + 3 ∑ (2l + 1) sin2 δ l } { 2 k l ungerade { l gerade } 7. Aufenthaltswahrscheinlichkeiten für ein System aus zwei identischen Teilchen Es seien |φ⟩ und |χ⟩ zwei orthogonale normierte Zustände des Bahnzustandsraums Hr eines Elektrons, und |+⟩ und |−⟩ die beiden Eigenvektoren der Komponente S z seines Spins im Spinzustandsraum Hs . a) Man betrachte ein System aus zwei Elektronen, wobei sich das eine im Zustand |φ, +⟩ und das andere im Zustand |χ, −⟩ befindet. Es sei ρ II (r, r ) d3 r d3 r die Wahr scheinlichkeit dafür, dass sich ein Elektron im Volumenelement d3 r um r und das andere im Volumenelement d3 r um r befindet (Zweiteilchendichtefunktion). Entsprechend sei ρ I (r) d3 r die Wahrscheinlichkeit dafür, ein Elektron im Volu menelement d3 r um r zu finden (Einteilchendichtefunktion). Man zeige, dass gilt σ=
ρ II (r, r ) = |φ(r)|2 |χ(r )|2 + |φ(r )|2 |χ(r)|2 ρ I (r) = |φ(r)|2 + |χ(r)|2 Man zeige, dass diese Ausdrücke auch dann gültig bleiben, wenn |φ⟩ und |χ⟩ in Hr nicht orthogonal sind.
•
1504 | Ergänzung DXIV
Man berechne die Integrale von ρ I (r) und ρ II (r, r ) über den gesamten Raum. Sind sie gleich eins? Man vergleiche die Ergebnisse mit denen, die sich für ein System von zwei unter scheidbaren Teilchen (beide mit dem Spin 1/2) ergäben, von denen das eine im Zustand |φ, +⟩ und das andere im Zustand |χ, −⟩ ist; das Messinstrument, das ihre Orte ermittelt, kann nicht zwischen ihnen unterscheiden. b) Man nehme nun an, dass sich ein Elektron im Zustand |φ, +⟩ und das andere im Zustand |χ, +⟩ befindet. Man zeige, dass dann gilt ρ II (r, r ) = |φ(r)χ(r ) − φ(r )χ(r)|2 ρ I (r) = |φ(r)|2 + |χ(r)|2 Man berechne die Integrale von ρ I (r) und ρ II (r, r ) über den gesamten Raum. Wie ändern sich ρ I und ρ II , wenn |φ⟩ und |χ⟩ in Hr nicht mehr orthogonal sind? c) Dieselbe Frage behandle man für zwei identische Bosonen, die entweder im sel ben Spinzustand oder in zwei orthogonalen Spinzuständen sind. 8. Diese Aufgabe soll Folgendes deutlich machen: Wurde der Zustandsvektor eines Systems N identischer Bosonen (oder Fermionen) symmetrisiert (oder antisymmetri siert), soisteszur Berechnungder Wahrscheinlichkeitfür einbestimmtesMessergebnis nicht nötig, die zur Messung gehörenden Vektoren ebenfalls zu symmetrisieren (oder zu antisymmetrisieren). Anders ausgedrückt können also, vorausgesetzt der Zustands vektor gehört zu HS (oder HA ), physikalische Vorhersagen so berechnet werden, als hätten wir es mit einem System unterscheidbarer Teilchen zu tun, die mit einem Mess instrument beobachtet werden, das keine Unterscheidung zwischen ihnen erlaubt. Es sei |ψ⟩ der Zustandsvektor eines Systems N identischer Bosonen (die folgende Argumentation gilt ebenso für Fermionen). Es gilt S |ψ⟩ = |ψ⟩
(1)
Teil I a) Es sei |χ⟩ der normierte physikalische Vektor, der zu einer Messung gehört, bei der die N Bosonen in verschiedenen orthonormalen Einzelzuständen |u α ⟩, |u β ⟩, . . . , |u ν ⟩ gefunden werden. Man zeige, dass gilt |χ⟩ = √N! S |1 : u α ; 2 : u β ; . . . ; N : u ν ⟩
(2)
b) Man zeige, dass aufgrund der Symmetrieeigenschaften von |ψ⟩ gilt |⟨1 : u α ; 2 : u β ; . . . ; N : u ν | ψ⟩|2 = |⟨i : u α ; j : u β ; . . . ; l : u ν | ψ⟩|2 wobei i, j, . . . , l eine beliebige Permutation der Zahlen 1, 2, . . . , N ist. c) Man zeige, dass die Wahrscheinlichkeit, das System im Zustand |χ⟩ vorzufinden, geschrieben werden kann |⟨χ|ψ⟩|2 = N! |⟨1 : u α ; 2 : u β ; . . . ; N : u ν | ψ⟩|2 =
∑ {i,j,...,l}
|⟨i : u α ; j : u β ; . . . ; l : u ν | ψ⟩|2
(3)
Aufgaben | 1505
•
wobei die Summation über alle Permutationen der Zahlen 1, 2, . . . , N auszufüh ren ist. d) Man nehme nun an, die Teilchen, deren Zustand durch den Vektor |ψ⟩ beschrie ben wird, seien unterscheidbar. Wie groß ist dann die Wahrscheinlichkeit, eines von ihnen im Zustand |u α ⟩, ein anderes im Zustand |u β ⟩, . . . und das letzte im Zustand |u ν ⟩ zu finden? Man folgere durch einen Vergleich mit den Ergebnissen aus c), dass es für identi sche Teilchen ausreichend ist, das Symmetrisierungspostulat auf den Zustands vektor |ψ⟩ des Systems anzuwenden. e) Wie müsste die vorstehende Überlegung geändert werden, wenn mehrere Einzel zustände, die den Zustand |χ⟩ bilden, gleich wären? (Der Einfachheit halber be trachte man nur den Fall N = 3.) Teil II (Etwas schwieriger) Wir betrachten nun den allgemeinen Fall, bei dem das Messergebnis nicht mehr durch die Angabe der Einzelzustände definiert wird, da die Messung unter Umständen nicht mehr vollständig ist. Nach den Postulaten von Kapitel XIV müssen wir zur Berechnung der entsprechenden Wahrscheinlichkeit in der folgenden Weise vorgehen: – Zunächst behandeln wir die Teilchen als unterscheidbar und nummerieren sie durch; ihr Zustandsraum ist dann H. Mit Hm bezeichnen wir den Unterraum von H, der zum betrachteten Messergebnis gehört, wobei die Messung mit Messinstru menten erfolgt, die die Teilchen nicht unterscheiden können. – Aus den Vektoren |ψ m ⟩ von Hm konstruieren wir die Menge der Vektoren S|ψ m ⟩, die einen Vektorraum HSm bilden (HSm ist die Projektion von Hm auf HS ); wenn die Dimension von HSm größer als eins ist, ist die Messung nicht vollständig. – Die gesuchte Wahrscheinlichkeit ist dann gleich dem Quadrat der Norm der ortho gonalen Projektion des Vektors |ψ⟩, der den Zustand der N identischen Teilchen beschreibt, auf HSm . a) Für einen beliebigen Permutationsoperator P α der N Teilchen zeige man, dass nach Konstruktion von Hm gilt P α |ψ m ⟩ ∈ Hm Man zeige, dass Hm unter der Wirkung von S global invariant ist und dass HSm die Schnittmenge von HS und Hm ist. b) Wir konstruieren eine Orthonormalbasis in Hm : p
k+1 {|φ1m ⟩, |φ2m ⟩, . . . , |φ km ⟩, |φ m ⟩, . . . , |φ m ⟩}
wobei die ersten k Vektoren eine Basis von HSm bilden sollen. Man zeige, dass es sich bei den Vektoren S|φ nm ⟩ mit k +1 ≤ n ≤ p um Linearkombinationen der ersten k Vektoren dieser Basis handeln muss. Man zeige, indem man ihr Skalarprodukt mit den Bravektoren ⟨φ1m |, ⟨φ2m |, . . . , ⟨φ km | bildet, dass die Vektoren S|φ nm ⟩ (mit n ≥ k + 1) notwendig gleich null sind.
•
1506 | Ergänzung DXIV
c) Man zeige anhand dieser Ergebnisse, dass aus der Symmetrie von |ψ⟩ folgt p
k
∑ |⟨φ nm |ψ⟩|2 = ∑ |⟨φ nm |ψ⟩|2 n=1
n=1
d. h. ⟨ψ | PSm | ψ⟩ = ⟨ψ | P m | ψ⟩ wobei PSm und P m die Projektoren auf HSm bzw. Hm sind. Schlussfolgerung: Die Wahrscheinlichkeiten der Messergebnisse können aus der Pro jektion des Vektors |ψ⟩ (der zu HS gehört) auf einen Eigenunterraum Hm berechnet werden, dessen Vektoren nicht alle zu HS gehören, in dem aber alle Teilchen dieselbe Rolle spielen. 9. Dichtefunktionen in einem Elektronengas am absoluten Nullpunkt Teil I a) Wir betrachten ein System von N Teilchen 1, 2, . . . , i, . . . , N mit demselben Spin s. Zunächst wollen wir annehmen, dass sie nicht identisch sind. Im Zu standsraum H(i) des Teilchens (i) stellt der Vektor |i : r0 , m⟩ einen Zustand dar, in dem sich das Teilchen (i) im Spinzustand |m⟩ (mℏ ist der Eigenwert von S z ) am Ort r0 befindet. Man betrachte den Operator N
F m (r0 ) = ∑ {|i : r0 , m⟩⟨i : r0 , m| ⊗ ∏ I(j)} j=i̸
i=1
wobei I(j) der Einheitsoperator im Raum H(j) ist. Es sei |ψ⟩ der Zustand des N-Teilchensystems. Man zeige, dass ⟨ψ|F m (r0 )|ψ⟩ d τ die Wahrscheinlichkeit dafür ist, ein Teilchen mit der Spinkomponente mℏ im in finitesimalen Volumenelement dτ um r0 zu finden. b) Man betrachte den Operator N
G mm (r0 , r0 ) = ∑ ∑ {|i : r0 , m; j : r0 , m ⟩⟨i : r0 , m; j : r0 , m | ⊗ ∏ I(k)} i=1 j=i̸
k=i,j ̸
Welche physikalische Bedeutung hat ⟨ψ|G mm (r0 , r0 )|ψ⟩ d τ dτ , worin dτ und dτ infinitesimale Volumenelemente bezeichnen? Die Erwartungswerte ⟨ψ|F m (r0 )|ψ⟩ und ⟨ψ|G mm (r0 , r0 )|ψ⟩ kürzen wir mit ρ Im (r0 ) bzw. ρ IImm (r0 , r0 ) ab und bezeichnen sie als Ein- bzw. Zweiteilchendichtefunktionen des N-Teilchensystems. Die vorstehenden Ausdrücke behalten auch für identische Teilchen ihre Gültig keit, vorausgesetzt |ψ⟩ stellt den entsprechend symmetrisierten oder antisymmetri sierten Zustandsvektor des Systems dar (s. vorhergehende Aufgabe).
Aufgaben | 1507
•
Teil II Man betrachte ein System von N Teilchen in den normierten und orthogonalen Ein zelzuständen |u 1 ⟩, |u 2 ⟩, . . . , |u N ⟩. Der normierte Zustandsvektor des Systems lautet |ψ⟩ = √N! T |1 : u 1 ; 2 : u 2 ; . . . ; N : u N ⟩ wobei T für Bosonen der Symmetrisierungsoperator und für Fermionen der Antisym metrisierungsoperator ist. In diesem Teil der Aufgabe wollen wir die Erwartungswerte im Zustand |ψ⟩ von symmetrischen Einteilchenoperatoren des Typs N
F = ∑ {f(i) ⊗ ∏ I(j)} i=1
j=i̸
und symmetrischen Zweiteilchenoperatoren des Typs N
G = ∑ ∑ {g(i, j) ⊗ ∏ I(k)} i=1 j=i̸
k=i,j ̸
berechnen. a) Man zeige, dass gilt ⟨ψ | F | ψ⟩ = ⟨1 : u 1 ; 2 : u 2 ; . . . ; N : u N | [∑ ε α P α ] F | 1 : u 1 ; 2 : u 2 ; . . . ; N : u N ⟩ α
wobei für Bosonen ε = +1 und für Fermionen ε = +1 oder −1 ist, je nachdem ob die Permutation P α gerade oder ungerade ist. Man zeige ferner, dass derselbe Ausdruck für den Operator G gilt. b) Man leite die folgenden Beziehungen her (ε = +1 für Bosonen und ε = −1 für Fermionen): N
⟨ψ | F | ψ⟩ = ∑ ⟨i : u i | f(i) | i : u i ⟩ , i=1 N
⟨ψ | G | ψ⟩ = ∑ ∑ {⟨i : u i ; j : u j | g(i, j) | i : u i ; j : u j ⟩ i=1 j=i̸
+ ε⟨i : u j ; j : u i | g(i, j) | i : u i ; j : u j ⟩} Teil III Wir wollen nun die Ergebnisse von Teil II auf die in Teil I eingeführten Operatoren F m (r0 ) und G mm (r0 , r0 ) anwenden. Bei dem betrachteten physikalischen System han delt es sich um ein Gas von N freien Elektronen am absoluten Nullpunkt, die in einem würfelförmigen Kasten der Kantenlänge L eingeschlossen sind (Ergänzung CXIV , § 1). Wenn wir das System periodischen Randbedingungen unterwerfen, ergeben sich Ein zelzustände der Form |φk ⟩|±⟩, wobei die zu |φk ⟩ gehörende Wellenfunktion eine ebe ne Welle eik⋅r /L3/2 ist und die Komponenten von k den Bedingungen (26) aus Ergän zung CXIV genügen. Mit EF = ℏ2 k 2F /2m bezeichnen wir die Fermi-Energie des Systems und mit λF = 2π/kF die Fermi-Wellenlänge.
•
1508 | Ergänzung DXIV
a) Man zeige, dass für die zwei Einteilchendichtefunktionen ρ I+ (r0 ) und ρ I− (r0 ) ρ I+ (r0 ) = ρ I− (r0 ) = ∑ |φk (r0 )|2 k
gilt, wobei die Summation über alle Werte von k mit einem Betrag kleiner als k F auszuführen ist, die den periodischen Randbedingungen genügen. Mit Hilfe von § 1 der Ergänzung CXIV zeige man, dass gilt ρ I+ (r0 ) = ρ I− (r0 ) = k 3F /6π2 = N/2L3 Hätte man dieses Ergebnis vorhersehen können? b) Man zeige, dass die beiden Zweiteilchendichtefunktionen ρ II+− (r0 , r0 ) und ρ II−+ (r0 , r0 ) gleich ∑ ∑ |φk (r0 )φk (r0 )|2 = N 2 /4L6 k k
sind, wobei die Summationen über k und k wie oben definiert sind. Man gebe eine physikalische Interpretation an. c) Schließlich betrachte man die Zweiteilchendichtefunktionen ρ II++ (r0 , r0 ) und ρ II−− (r0 , r0 ). Man zeige, dass sie gleich ∑ ∑ {|φk (r0 )φk (r0 )|2 − φ∗k (r0 )φ∗k (r0 )φk (r0 )φk (r0 )} k k =k ̸
sind. Man zeige dann, dass die Beschränkung k ≠ k fallengelassen werden kann und leite das folgende Ergebnis für die Zweiteilchendichtefunktionen ab: 2 N2 N 2 ∗ − φ (r )φ (r ) = [1 − C2 (k F d)] ∑ 0 k 0 4L6 k k 4L6 mit d = |r0 − r0 | und einer Funktion C(x), die definiert ist durch C(x) =
3 (sin x + x cos x) x3
(die Summe ∑k kann durch ein Integral über k ersetzt werden). Wie hängen die Zweiteilchendichtefunktionen ρ II++ (r0 , r0 ) und ρ II−− (r0 , r0 ) vom Ab stand d zwischen r0 und r0 ab? Man zeige, dass es praktisch unmöglich ist, zwei Elektronen mit gleichem Spin in einem Abstand sehr viel kleiner als λF voneinan der zu finden.
Anhang I Fourier-Reihen. Fourier-Transformation 1 1-a 1-b 1-c 2 2-a 2-b 2-c 2-d 2-e
Fourier-Reihen | 1509 Periodische Funktionen | 1509 Entwicklung einer periodischen Funktion in eine Fourier-Reihe | 1510 Die Parsevalsche Gleichung | 1512 Die Fourier-Transformation | 1512 Definitionen | 1512 Einfache Eigenschaften | 1514 Die Parsevalsche Gleichung | 1516 Beispiele | 1516 Die Fourier-Transformation im dreidimensionalen Raum | 1517
In diesem Anhang erinnern wir an eine Reihe von Definitionen, Gleichungen und Ei genschaften, die für die Quantenmechanik von Nutzen sind. Dabei gehen wir weder auf Einzelheiten noch auf strenge Beweise ein.
1 Fourier-Reihen 1-a Periodische Funktionen Eine Funktion f(x) einer Variablen heißt periodisch, wenn es eine reelle Zahl L un gleich null gibt, so dass für alle x gilt f(x + L) = f(x)
(1)
L bezeichnet man als die Periode der Funktion f(x). Ist f(x) periodisch mit der Periode L, so sind auch alle Zahlen nL mit einer ganzen Zahl n ungleich null Perioden von f(x). Die kleinste positive Periode einer solchen Funktion bezeichnet man genauer als primitive Periode L0 . Bemerkung: Aus einer Funktion f(x), die nur im Intervall [a, b] der reellen Achse definiert ist, können wir eine Funktion fp (x) konstruieren, die in [a, b] gleich f(x) und periodisch mit der Periode (b − a) ist. Diese Funktion fp (x) ist stetig, wenn f stetig ist und zusätzlich gilt f(b) = f(a)
(2)
Die trigonometrischen Funktionen sind periodisch; insbesondere haben cos 2π
x L
und
sin 2π
x L
die Periode L. https://doi.org/10.1515/9783110638769-043
(3)
1510 | I Fourier-Reihen. Fourier-Transformation
Ein anderes wichtiges Beispiel für periodische Funktionen sind die periodischen Exponentialfunktionen. Damit eine Exponentialfunktion eαx die Periode L hat, ist es nach Definition (1) notwendig und hinreichend, dass gilt eαL = 1
(4)
d. h. αL = 2 inπ
(5)
mit einer ganzen Zahl n. Es gibt somit zwei Exponentialfunktionen mit der Periode L: e±2iπx/L
(6)
Für sie gilt der folgende Zusammenhang mit den trigonometrischen Funktionen (3) derselben Periode: x x e±2iπx/L = cos 2π ± i sin 2π (7) L L Auch die Funktion e2inπx/L hat die Periode L, jedoch die primitive Periode L/n.
1-b Entwicklung einer periodischen Funktion in eine Fourier-Reihe Es sei f(x) eine periodische Funktion mit der Periode L. Wenn diese Funktion bestimm te mathematische Eigenschaften erfüllt (wie das in der Physik praktisch immer der Fall ist), kann sie in eine Reihe imaginärer Exponentialfunktionen oder trigonometrischer Funktionen entwickelt werden. α Die Reihe imaginärer Exponentialfunktionen Die Funktion f(x) lässt sich als Fourier-Reihe ausdrücken: +∞
f(x) = ∑ c n eik n x
(8)
n=−∞
mit kn = n
2π L
(9)
Die Koeffizienten c n dieser Reihe sind durch die Beziehung x 0 +L
1 ∫ dx e−ik n x f(x) cn = L x0
bestimmt, worin x0 eine beliebige reelle Zahl ist.
(10)
1 Fourier-Reihen | 1511
Zum Beweis von Gl. (10) multiplizieren wir Gl. (8) mit e−ik p x und integrieren von x0 bis x0 + L: x 0 +L −ik p x
∫ dx e
+∞
x 0 +L
f(x) = ∑ c n ∫ dx e−i(k n −k p )x n=−∞
x0
(11)
x0
Das Integral auf der rechten Seite ist für n ≠ p gleich null und für n = p gleich L. Daraus folgt Gl. (10). Es lässt sich zeigen, dass der Wert von c n unabhängig von der Wahl von x0 ist. Die Menge der Werte |c n | heißt das Fourier-Spektrum von f(x). Die Funktion f(x) ist genau dann reell, wenn gilt: c−n = c∗n
(12)
β Kosinus- und Sinusreihe Wir ordnen die Reihe (8) entsprechend den Vorzeichen von n um und erhalten ∞
f(x) = c0 + ∑ (c n eik n x + c−n e−ik n x )
(13)
n=1
was mit Gl. (7) auf ∞
f(x) = a0 + ∑ (a n cos k n x + b n sin k n x)
(14)
n=1
führt mit a0 = c0 und a n = c n + c−n b n = i (c n − c−n )
} n>0
(15)
Die Ausdrücke für die Koeffizienten a n und b n können demnach aus Gl. (10) abgeleitet werden: x 0 +L
a0 =
1 ∫ dx f(x) L x0
x 0 +L
an =
2 ∫ dx f(x) cos k n x L x0
x 0 +L
2 bn = ∫ dx f(x) sin k n x L x0
(16)
1512 | I Fourier-Reihen. Fourier-Transformation
Wenn f(x) eine bestimmte Parität besitzt, ist die Entwicklung (14) besonders prak tisch, da gilt bn = 0
wenn f(x) gerade ist
an = 0
wenn f(x) ungerade ist
(17)
Außerdem sind, wenn f(x) reell ist, auch die Koeffizienten a n und b n reell.
1-c Die Parsevalsche Gleichung Für die Fourier-Reihe (8) zeigt man leicht, dass gilt x 0 +L
+∞ 1 ∫ dx |f(x)|2 = ∑ |c n |2 L n=−∞
(18)
x0
Mit Gl. (8) ist nämlich x 0 +L
x 0 +L
1 1 ∫ dx |f(x)|2 = ∑ c∗p c n ∫ dx e−i(k n −k p )x L L n,p x0
(19)
x0
Wie in Gl. (11) ist das Integral auf der rechten Seite gleich Lδ np . Damit ist Gl. (18) be wiesen. Wenn die Entwicklung (14) verwendet wird, nimmt die Parsevalsche Gleichung (18) die Form an x 0 +L
1 1 ∞ ∫ dx |f(x)|2 = |a0 |2 + ∑ (|a n |2 + |b n |2 ) L 2 n=1
(20)
x0
Für zwei Funktionen f(x) und g(x) mit derselben Periode L und den Fourier-Koef fizienten c n bzw. d n kann Gl. (18) verallgemeinert werden: x 0 +L
+∞ 1 ∫ dx g∗ (x) f(x) = ∑ d∗n c n L n=−∞
(21)
x0
2 Die Fourier-Transformation 2-a Definitionen α Das Fourier-Integral als Grenzwert einer Fourier-Reihe Wir betrachten nun eine Funktion f(x), die nicht unbedingt periodisch sein muss. Wir definieren die mit der Periode L periodische Funktion f L (x), die im Intervall
2 Die Fourier-Transformation
|
1513
[−L/2, L/2] gleich f(x) ist; f L (x) kann in eine Fourier-Reihe entwickelt werden: +∞
f L (x) = ∑ c n eik n x
(22)
n=−∞
wobei k n durch Gl. (9) definiert ist und außerdem gilt x 0 +L
+L/2
x0
−L/2
1 1 cn = ∫ dx e−ik n x f L (x) = ∫ dx e−ik n x f(x) L L
(23)
Für L gegen unendlich geht f L (x) in f(x) über. Wir werden daher in den obigen Aus drücken den Grenzwert L gegen unendlich betrachten. Aus der Definition (9) für k n folgt dann k n+1 − k n =
2π L
(24)
Wir verwenden nun in Gl. (23) für 1/L den Ausdruck in (k n+1 − k n ) und setzen diesen Wert für c n in die Reihe (22) ein: +L/2
+∞
f L (x) = ∑
n=−∞
k n+1 − k n ik n x ∫ dξ e−ik n ξ f(ξ) e 2π
(25)
−L/2
Für L → ∞ geht k n+1 − k n gegen null [s. Gl. (24)], so dass die Summe über n in ein be stimmtes Integral übergeht; f L (x) wird gleichzeitig zu f(x). Das Integral, das in Gl. (25) auftritt, wird eine Funktion der kontinuierlichen Variablen k. Wir setzen ̃f (k) =
+∞
1 ∫ dx e−ikx f(x) √2π
(26)
−∞
und können damit Gl. (25) im Grenzwert L gegen unendlich schreiben als +∞
f(x) =
1 ∫ dk eikx ̃f (k) √2π
(27)
−∞
f(x) und ̃f (k) bezeichnet man als ihre gegenseitigen Fourier-Transformierten. β Die Fourier-Transformation in der Quantenmechanik In der Quantenmechanik verwendet man eine etwas andere Konvention: Wenn ψ(x) eine (eindimensionale) Wellenfunktion bezeichnet, definieren wir ihre Fourier-Trans formierte ψ(p) als
ψ(p) =
1
+∞
∫ dx e−ipx/ℏ ψ(x) √2πℏ −∞
(28)
1514 | I Fourier-Reihen. Fourier-Transformation
die umgekehrte Beziehung lautet
ψ(x) =
1
+∞
∫ dp eipx/ℏ ψ(p) √2πℏ −∞
(29)
Um von den Gleichungen (26) und (27) zu den Gleichungen (28) und (29) zu gelangen, setzen wir p = ℏk
(30)
(p hat die Dimension eines Impulses, wenn x eine Länge ist) und ψ(p) =
1 ̃ p 1 ̃ ψ(k) = ψ( ) ℏ √ℏ √ℏ
(31)
In diesem Anhang wollen wir, wie es in der Quantenmechanik üblich ist, anstelle der klassischen Definition (26) die Definition (28) für die Fourier-Transformierte ver wenden. Um wieder zur ursprünglichen Definition zurückzukehren, müssen wir le diglich in allen folgenden Ausdrücken ℏ durch 1 und p durch k ersetzen.
2-b Einfache Eigenschaften Wir schreiben die Gleichungen (28) und (29) in der kompakten Notation ψ(p) = F [ψ(x)]
(32a)
ψ(x) = F [ψ(p)]
(32b)
Die folgenden Eigenschaften lassen sich leicht zeigen: 1.
ψ(p − p0 ) = F [eip0 x/ℏ ψ(x)] (33)
e−ip0 x/ℏ ψ(p) = F [ψ(x − x0 )] Dies folgt unmittelbar aus der Definition (28). 2.
ψ(p) = F [ψ(x)]
⇒
F [ψ(cx)] =
1 p ψ( ) |c| c
(34)
Zum Beweis dieser Aussage müssen wir nur einen Wechsel der Integrationsvariablen vornehmen: u = cx
(35)
Insbesondere gilt F [ψ(−x)] = ψ(−p)
(36)
2 Die Fourier-Transformation
| 1515
Wenn also die Funktion ψ(x) eine bestimmte Parität besitzt, hat ihre Fourier-Transfor mierte dieselbe Parität. 3.
∗
ψ(x) reell
⇔
[ψ(p)] = ψ(−p)
ψ(x) rein imaginär
⇔
[ψ(p)] = −ψ(−p)
∗
(37)
Dieselben Ausdrücke gelten, wenn man die Funktionen ψ und ψ vertauscht. 4. Mit f (n) bezeichnen wir die n-te Ableitung der Funktion f . Das Ausführen der Ab leitungen unter dem Integral ergibt dann nach Gl. (28) und Gl. (29) F [ψ(n) (x)] = ( ψ
(n)
ip n ) ψ(p) ℏ
(p) = F [(−
(38a)
ix n ) ψ(x)] ℏ
(38b)
5. Als Faltung der Funktion ψ1 (x) mit der Funktion ψ2 (x) definiert man die Funktion +∞
ψ(x) = ∫ dy ψ1 (y) ψ2 (x − y)
(39)
−∞
Ihre Fourier-Transformierte ist proportional zum normalen Produkt der Transformier ten von ψ1 (x) und ψ2 (x), ψ(p) = √2πℏ ψ1 (p) ψ 2 (p)
(40)
Das lässt sich wie folgt zeigen: Wir bilden die Fourier-Transformierte von (39), ψ(p) =
1 √2πℏ
+∞
+∞ −ipx/ℏ
∫ dx e −∞
∫ dy ψ1 (y) ψ2 (x − y)
(41)
−∞
und führen den folgenden Wechsel der Integrationsvariablen durch: {x, y} → {u = x − y, y}
(42)
Indem wir mit eipy/ℏ erweitern, erhalten wir ψ(p) =
1 √2πℏ
+∞
+∞ −ipy/ℏ
∫ dy e −∞
ψ1 (y) ∫ du e−ipu/ℏ ψ2 (u)
(43)
−∞
womit Gl. (40) bewiesen ist. 6. Wenn es sich bei ψ(x) um eine Funktion mit einem ausgeprägten Maximum der Breite ∆x handelt, gilt für die Breite ∆p von ψ(p) ∆x ∆p ≥ ℏ (in § C-2 von Kapitel I wird diese Ungleichung analysiert).
(44)
1516 | I Fourier-Reihen. Fourier-Transformation
2-c Die Parsevalsche Gleichung Die Fourier-Transformierte einer Funktion hat dieselbe Norm wie die Funktion selbst: +∞
+∞
∫ dx |ψ(x)|2 = ∫ dp |ψ(p)|2 −∞
(45)
−∞
Zum Beweis brauchen wir nur Gl. (28) und Gl. (29) in der folgenden Weise zu verwen den: +∞
+∞
∫ dx |ψ(x)|2 = ∫ dx ψ∗ (x) −∞
−∞ +∞
= ∫ dp ψ(p) −∞ +∞
+∞
1 √2πℏ
∫ dp eipx/ℏ ψ(p) −∞ +∞
1 ∫ dx eipx/ℏ ψ∗ (x) √2πℏ −∞
∗
= ∫ dp ψ (p) ψ(p)
(46)
−∞
Wie in § 1-c kann die Parsevalsche Gleichung verallgemeinert werden: +∞
+∞
∫ dx φ (x) ψ(x) = ∫ dp φ∗ (p) ψ(p) ∗
−∞
(47)
−∞
2-d Beispiele Wir wollen uns auf drei Beispiele von Fourier-Transformierten beschränken, die direkt berechnet werden können: 1. die Stufenfunktion 1 { {a ψ(x) = { { 0 {
a a
} 2
für −
⇔
ψ(p) =
1 sin(pa/2ℏ) √2πℏ pa/2ℏ
(48)
2. die fallende Exponentialfunktion ψ(x) = e−|x|/a
⇔
ψ(p) = √
2 1/a 2 2 πℏ (p /ℏ ) + (1/a2 )
(49)
3. die Gauß-Funktion ψ(x) = e−x
2
/a 2
⇔
ψ(p) =
a −p2 a2 /4ℏ2 e √2ℏ
(50)
(die Form der Gauß-Funktion bleibt also bei einer Fourier-Transformation erhalten).
2 Die Fourier-Transformation
|
1517
Bemerkung: Für alle drei Fälle lassen sich Breiten ∆x und ∆p für ψ(x) bzw. ψ(p) definieren; diese Breiten erfüllen die Ungleichung (44).
2-e Die Fourier-Transformation im dreidimensionalen Raum Für die Wellenfunktionen ψ(r), die von den drei Raumkoordinaten x, y, z abhängen, werden Gl. (28) und Gl. (29) ersetzt durch 1 ∫ d3 r e−ip⋅r/ℏ ψ(r) (2πℏ)3/2 1 ψ(r) = ∫ d3 p eip⋅r/ℏ ψ(p) (2πℏ)3/2
ψ(p) =
(51a) (51b)
Die in § 2-b und § 2-c angegebenen Eigenschaften lassen sich leicht auf drei Dimensio nen verallgemeinern. Wenn ψ nur vom Betrag r des Radiusvektors r abhängt, hängt ψ nur vom Betrag p des Impulses ab und kann aus der Formel ψ(p) =
∞
2 pr ∫ r dr sin ψ(r) ℏ √2πℏ p 1
(52)
0
berechnet werden. Zum Beweis bestimmen wir zunächst mit Hilfe der ersten Gleichung (51a) den Wert von ψ für einen Vektor p , der aus p durch eine beliebige Drehung R hervorgeht: p = Rp ψ(p ) =
1 ∫ d3 r e−ip ⋅r/ℏ ψ(r) (2πℏ)3/2
(53) (54)
In diesem Integral ersetzen wir die Variable r durch r = Rr
(55)
Das Volumenelement bleibt bei Drehungen erhalten: d3 r = d 3 r
(56)
Auch die Funktion ψ bleibt unverändert, da der Betrag von r unter Drehungen gleich r bleibt. Darüber hinaus gilt p ⋅ r = p ⋅ r
(57)
da das Skalarprodukt drehinvariant ist. Es ergibt sich also ψ(p ) = ψ(p) d. h. ψ hängt nur von dem Betrag von p ab und nicht von seiner Richtung.
(58)
1518 | I Fourier-Reihen. Fourier-Transformation Zur Berechnung von ψ(p) legen wir also p in die z-Richtung: 1 ψ(p) = ∫ d3 r e−ipz/ℏ ψ(r) (2πℏ)3/2 ∞
2π
π
0 ∞
0
0
1 ∫ r2 dr ψ(r) ∫ dφ ∫ dθ sin θ e−ipr cos θ/ℏ = (2πℏ)3/2 =
1 2ℏ pr sin ∫ r2 dr ψ(r) 2π 3/2 pr ℏ (2πℏ) 0 ∞
=
1 2 pr ∫ r dr ψ(r) sin ℏ √2πℏ p
(59)
0
womit Gl. (52) bewiesen ist. Als ein Beispiel für Gl. (52) nehmen wir an, dass die Funktion Ψ(r) durch e−εr Ψ(r) = (60) r gegeben ist. Hier ist ε > 0 (und wir verzichten darauf, Ψ zu normieren). Die Bezie hung (52) wird dann zu ψ(p) =
∞
1 ∫ dr e−εr (eipr/ℏ − e−ipr/ℏ ) √2πℏ ip 1
0
1 −1 −1 = ( − ) √2πℏ ip −ε + ip/ℏ −ε − ip/ℏ 1
=√
2 1 3 2 πℏ ε + p2 /ℏ2
(61)
Man nennt ein Zentralpotential, das als Funktion von r durch Gl. (60) beschrieben wird, ein „Yukawa-Potential“. Im Grenzfall ε → 0 wird daraus das Coulomb-Potential, dessen Gradient das elektrische Feld ist. Nehmen wir den Gradienten von Gl. (51b), erhalten wir ein Fourier-Paar aus zwei Vektorfunktionen (wir verwenden hier die Variable k statt p) 1 e−εr r 2 ik ) ]=√ 2 r r r π ε + k2 Der Grenzfall ε → 0 liefert also 2 ik r F [− 3 ] = √ π k2 r F [(−ε −
(62)
(63)
Referenzen und Literaturhinweise Siehe zum Beispiel Arfken (10.4), Kap. 14 und 15, oder Butkov (10.8), Kap. 4 und 7; Bass (10.1), Bd. I, Kap. XVIII bis XX; Abschnitt 10 der Bibliographie, insbesondere Unterab schnitt „Fourier-Transformation“.
Anhang II Die Diracsche δ-Funktion 1 1-a 1-b 1-c 2 2-a 2-b 3 3-a 3-b 4
Einleitung; grundlegende Eigenschaften | 1519 Einführung der δ-Funktion | 1519 Näherungsfunktionen für δ(x) | 1520 Eigenschaften der δ-Funktion | 1522 δ-Funktion und Fourier-Transformation | 1524 Fourier-Transformation der δ-Funktion | 1524 Anwendungen | 1525 Integral und Ableitung der δ-Funktion | 1526 δ als Ableitung der Heavisideschen Sprungfunktion | 1526 Ableitungen von δ | 1527 Die δ-Funktion im dreidimensionalen Raum | 1528
Bei der δ-Funktion handelt es sich eigentlich um eine Distribution. Wir werden sie je doch, wie in der Physik üblich, wie eine normale Funktion behandeln. Dieser Zugang erweist sich für quantenmechanische Anwendungen als ausreichend, obwohl er ma thematischer Strenge nicht genügt.
Abb. 1: Die Funktion δ (ε) (x) ist eine Stufenfunktion der Breite ε und der Höhe 1/ε, deren Zentrum bei x = 0 liegt.
1 Einleitung; grundlegende Eigenschaften 1-a Einführung der δ-Funktion Wir betrachten die Funktion δ(ε) (x), die gegeben wird durch (s. Abb. 1) 1 ε ε { { ε für − 2 < x < 2 (ε) δ (x) = { ε { 0 für |x| > { 2 wobei ε eine positive Zahl ist. Wir berechnen das Integral
(1)
+∞
∫ dx δ(ε) (x) f(x) −∞ https://doi.org/10.1515/9783110638769-044
(2)
1520 | II Die Diracsche δ-Funktion mit einer beliebigen, bei x = 0 wohldefinierten Funktion f(x). Für ausreichend kleine Werte von ε ist die Änderung von f(x) im effektiven Integrationsintervall [−ε/2, ε/2] vernachlässigbar, und f(x) ist praktisch gleich f(0). Somit ergibt sich +∞
+∞ (ε)
∫ dx δ (x) f(x) ≈ f(0) ∫ dx δ(ε) (x) = f(0) −∞
(3)
−∞
Je kleiner ε ist, desto besser ist diese Näherung erfüllt. Wir untersuchen daher den Grenzwert ε = 0 und definieren die δ-Funktion durch die Beziehung +∞
∫ dx δ(x) f(x) = f(0)
(4)
−∞
die für jede im Ursprung definierte Funktion gültig ist. Allgemeiner wird δ(x − x0 ) definiert durch +∞
∫ dx δ(x − x0 ) f(x) = f(x0 )
(5)
−∞
Bemerkungen: 1. Eigentlich ist die Integralschreibweise in Gl. (5) mathematisch nicht gerechtfertigt; δ ist ma thematisch exakt nicht als Funktion, sondern als Distribution definiert. Physikalisch ist diese Unterscheidung von untergeordneter Bedeutung, da es unmöglich ist, zwischen δ (ε) und δ zu unterscheiden, sobald ε gegen alle in dem betrachteten Problem auftretenden Längen vernach lässigbar klein wird: Wir können die Änderung über ein Intervall der Länge ε jeder Funktion f(x) vernachlässigen. Wann immer wir auf eine mathematische Schwierigkeit stoßen, betrachten wir anstelle von δ(x) die Funktion δ (ε) (x) [oder eine ähnliche Funktion, wie etwa eine der Funktio nen (7), (8), (9), (10), (11)] mit einem sehr kleinen ε, das jedoch nicht exakt gleich null ist. 2. Für beliebige Integrationsgrenzen a und b gilt b
{f(0) ∫ dx δ(x) f(x) = { a {0
für 0 ∈ [a, b] für 0 ∉ [a, b]
(6)
1-b Näherungsfunktionen für δ(x) Es lässt sich leicht zeigen, dass neben der in Gl. (1) definierten Funktion δ(ε) (x) auch die folgenden Funktionen gegen δ(x) gehen, d. h. die Bedingung (5) erfüllen, wenn der Parameter ε aus dem positiven Bereich gegen null strebt: 1.
1 −|x|/ε e 2ε
(7)
2.
ε 1 π x2 + ε2
(8)
1 Einleitung; grundlegende Eigenschaften |
1521
3.
1 −x2 /ε2 e ε√π
(9)
4.
1 sin(x/ε) π x
(10)
5.
ε sin2 (x/ε) π x2
(11)
Schließlich geben wir eine Identität an, die sich in der Quantenmechanik (insbeson dere in der Streutheorie) oft als nützlich erweist: 1 1 = P ∓ iπδ(x) x ± iε x
lim
ε→0+
(12)
P bezeichnet dabei den Hauptteil¹ [f(x) ist bei x = 0 regulär]: +B
P∫ −A
−η
+B
dx dx f(x) = lim [ ∫ + ∫ ] f(x) ; η→0+ x x [−A +η ]
A, B > 0
(13)
Zum Beweis der Identität (12) betrachten wir den Real- und Imaginärteil von 1/(x± iε) getrennt: 1 x ∓ iε = x ± iε x2 + ε2
(14)
Der Imaginärteil ist proportional zur Funktion (8), also lim ∓i
ε→0+
ε = ∓iπ δ(x) x2 + ε2
(15)
Den Realteil multiplizieren wir mit einer im Ursprung regulären Funktion f(x) und integrieren über x: −η
+∞
+η +∞
x dx x dx f(x) = lim lim [ ∫ + ∫ + ∫ ] 2 f(x) lim ∫ 2 ε→0+ ε→0+ η→0+ x + ε2 x + ε2 −∞ [−∞ −η +η ]
(16)
Das zweite Integral verschwindet: +η
lim ∫
η→0+
−η
x dx 1 +η f(x) = f(0) lim [Log (x2 + ε2 )]−η = 0 η→0+ 2 x2 + ε2
(17)
1 Es finden oft die folgenden Beziehungen Verwendung: +B
P∫ −A
+B
−B
+B
−B
−A
−A
dx f− (x) f(x) f(x) − f(0) B f(x) = ∫ dx + ∫ dx = ∫ dx + f(0) Log x x x x A
wobei f− (x) = [f(x) − f(−x)]/2 der ungerade Anteil der Funktion f(x) ist. Mit Hilfe dieser Formeln kann die Divergenz im Ursprung explizit eliminiert werden.
1522 | II Die Diracsche δ-Funktion Wir vertauschen nun die Reihenfolge der Grenzübergänge in Gl. (16); der Limes ε → 0 stellt in den beiden verbleibenden Integralen keine Schwierigkeit dar. So ergibt sich −η
+∞
+∞
x dx dx f(x) = lim [ ∫ + ∫ ] f(x) lim ∫ 2 2 ε→0+ η→0 x x +ε + −∞ [−∞ +η ]
(18)
Damit ist Gl. (12) bewiesen.
1-c Eigenschaften der δ-Funktion Die Eigenschaften, die wir nun angeben wollen, können mit Hilfe von Gl. (5) gezeigt werden: Wenn man die beiden Seiten der folgenden Gleichungen mit einer Funktion f(x) multipliziert und anschließend integriert, erhält man auf beiden Seiten der Glei chung dasselbe Ergebnis: 1.
δ(−x) = δ(x)
2.
δ(cx) =
(19)
1 δ(x) |c|
(20)
und allgemeiner δ [g(x)] = ∑ j
1 δ(x − x j ) |g (x j )|
(21)
wobei g (x) die Ableitung von g(x) ist und x j die einfachen Nullstellen der Funktion g(x) sind: g(x j ) = 0 g (x j ) ≠ 0
(22)
Die Summation erfolgt über alle einfachen Nullstellen von g(x). Wenn g(x) vielfache Nullstellen [für die also g (x j ) null ist] besitzt, ist der Ausdruck δ[g(x)] nicht definiert. 3.
x δ(x − x0 ) = x0 δ(x − x0 )
(23)
und insbesondere x δ(x) = 0
(24)
Die Umkehrung gilt ebenso; es lässt sich zeigen, dass die Gleichung x u(x) = 0
(25)
die allgemeine Lösung u(x) = c δ(x)
(26)
besitzt, wobei c eine beliebige Konstante ist. Allgemeiner gilt g(x) δ(x − x 0 ) = g(x0 ) δ(x − x0 )
(27)
1 Einleitung; grundlegende Eigenschaften | 1523
+∞
4.
∫ dx δ(x − y) δ(x − z) = δ(y − z)
(28)
−∞
Diese Gleichung lässt sich beweisen, indem man Funktionen δ(ε) (x) wie in Abb. 1 betrachtet. Das Integral +∞
F (ε) (y, z) = ∫ dx δ(ε) (x − y) δ(ε) (x − z)
(29)
−∞
verschwindet, solange gilt |y − z| ≥ ε, d. h. also solange die beiden Stufenfunktionen nicht überlappen (Abb. 2).
Abb. 2: Die Funktionen δ (ε) (x − y) und δ (ε) (x − z) sind zwei Stufenfunktionen der Breite ε und der Höhe 1/ε, deren Zentrum bei x = y bzw. bei x = z liegt.
Der Maximalwert des Integrals, der sich für y = z ergibt, ist gleich 1/ε. Zwischen die sem Maximum und null hängt F (ε) (y, z) linear von y − z ab (Abb. 3). Es ergibt sich unmittelbar, dass F (ε) (y, z) für ε → 0 gegen δ(y − z) geht.
Abb. 3: Abhängigkeit des Skalarprodukts F (ε) (y, z) der beiden in Abb. 2 dargestellten Stufenfunk tionen von y − z. Es ist gleich null, wenn die beiden Funktionen nicht überlappen (|y − z| ≥ ε), und maximal, wenn sie übereinstimmen; F (ε) (y, z) strebt für ε → 0 gegen δ(y − z).
1524 | II Die Diracsche δ-Funktion
Bemerkung: Eine Summe äquidistanter δ-Funktionen, +∞
∑ δ(x − qL)
(30)
q=−∞
kann als eine periodische „Funktion“ mit der Periode L angesehen werden. Wir können sie unter Anwendung der Formeln (8), (9) und (10) in der Form schreiben: +∞
1 +∞ 2iπnx/L ∑ e L n=−∞
∑ δ(x − qL) =
q=−∞
(31)
2 δ-Funktion und Fourier-Transformation 2-a Fourier-Transformation der δ-Funktion Mit Hilfe der Definition (28) und Gl. (5) lässt sich die Fourier-Transformierte δ x0 (p) von δ(x − x0 ) direkt berechnen: +∞
1
δ x0 (p) =
√2πℏ
∫ dx e−ipx/ℏ δ(x − x0 ) = −∞
1 e−ipx0/ℏ √2πℏ
(32)
Insbesondere ist die Fourier-Transformierte von δ(x) eine Konstante: δ 0 (p) =
1 √2πℏ
(33)
Die inverse Fourier-Transformation [Gl. (29) von Anhang I] führt dann auf +∞
δ(x − x0 ) =
+∞
1 1 ∫ dp eip(x−x0)/ℏ = ∫ dk eik(x−x0) 2πℏ 2π −∞
(34)
−∞
Dasselbe Ergebnis findet man, wenn man von der durch (1) definierten Funktion δ(ε) (x) oder einer der anderen in § 1-b angegebenen Funktionen ausgeht. Mit Gl. (48) aus Anhang I können wir z. B. schreiben +∞
δ(ε) (x) =
sin(pε/2ℏ) 1 ∫ dp eipx/ℏ 2πℏ pε/2ℏ −∞
für ε gegen null ergibt sich dann in der Tat Gl. (34).
(35)
2 δ-Funktion und Fourier-Transformation
| 1525
2-b Anwendungen Der Ausdruck (34) für die δ-Funktion erweist sich oft als sehr nützlich. Beispielsweise wollen wir zeigen, wie sich damit die inverse Fourier-Transformation und die Parse valsche Gleichung ergibt [Gl. (29) und Gl. (45) aus Anhang I]. Ausgehend von ψ(p) =
1 √2πℏ
+∞
∫ dx e−ipx/ℏ ψ(x)
(36)
−∞
berechnen wir 1 √2πℏ
+∞
+∞
∫ dp eipx/ℏ ψ(p) = −∞
+∞
1 ∫ dξ ψ(ξ) ∫ dp eip(x−ξ)/ℏ 2πℏ −∞
(37)
−∞
Im zweiten Integral erkennen wir δ(x − ξ); also haben wir 1 √2πℏ
+∞
+∞
∫ dp eipx/ℏ ψ(p) = ∫ dξ ψ(ξ) δ(x − ξ) = ψ(x) −∞
(38)
−∞
die Inversionsformel für die Fourier-Transformation. Entsprechend berechnen wir +∞
|ψ(p)|2 =
+∞
1 ∫ dx eipx/ℏ ψ∗ (x) ∫ dx e−ipx /ℏ ψ(x ) 2πℏ
−∞
(39)
−∞
Wenn wir diesen Ausdruck über p integrieren, so erhalten wir +∞
+∞
∫ dp |ψ(p)|2 = −∞
+∞
+∞
1 ∫ dx ψ∗ (x) ∫ dx ψ(x ) ∫ dp eip(x−x )/ℏ 2πℏ
−∞
−∞
(40)
−∞
d. h. mit Gl. (34) die Parsevalsche Gleichung +∞
+∞
+∞
∫ dp |ψ(p)|2 = ∫ dx ψ∗ (x) ∫ dx ψ(x ) δ(x − x ) −∞
−∞ +∞
−∞
= ∫ dx |ψ(x)|2
(41)
−∞
Auch die Fourier-Transformation einer Faltung kann in analoger Weise berechnet werden [s. Gl. (39) und Gl. (40) aus Anhang I].
1526 | II Die Diracsche δ-Funktion
3 Integral und Ableitung der δ-Funktion 3-a δ als Ableitung der Heavisideschen Sprungfunktion Wir berechnen das Integral x (ε)
θ (x) = ∫ δ(ε) (x ) dx
(42)
−∞
wobei die Funktion δ(ε) (x) in Gl. (1) definiert ist. Man sieht leicht ein, dass θ(ε) (x) gleich 0 ist für x ≤ −ε/2, gleich 1 für x ≥ ε/2 und gleich (x + ε/2)/ε für −ε/2 ≤ x ≤ ε/2. Der Verlauf von θ(ε) (x) in Abhängigkeit von x ist in Abb. 4 dargestellt. Für ε → 0 strebt θ(ε) (x) gegen die Heavisidesche „Sprungfunktion“ θ(x), die definiert wird durch {1 θ(x) = { 0 {
für x > 0
(43)
für x < 0
Abb. 4: Verlauf der Funktion θ (ε) (x), deren Ablei tung δ(ε) (x) in Abb. 1 dargestellt ist. Für ε → 0 strebt θ (ε) (x) gegen die Heavisidesche Sprungfunktion θ(x).
Die Funktion δ(ε) (x) ist die Ableitung von θ(ε) (x). Im Grenzwert ε → 0 sehen wir dann, dass es sich bei δ(x) um die Ableitung von θ(x) handelt: d θ(x) = δ(x) dx
(44)
Wir betrachten nun eine Funktion g(x), die bei x = 0 eine Sprungstelle der Höhe σ 0 besitzt: lim g(x) − lim g(x) = σ 0
x→0+
x→0−
(45)
Eine solche Funktion kann in der Form: g(x) = g1 (x)θ(x) + g2 (x)θ(−x) geschrieben werden, wobei g1 (x) und g2 (x) stetige Funktionen sind, für die die Bedingung g1 (0) − g2 (0) = σ 0 gilt. Die Ableitung dieses Ausdrucks ergibt mit Gl. (44) g (x) = g1 (x)θ(x) + g2 (x)θ(−x) + g1 (x)δ(x) − g2 (x)δ(−x) = g1 (x)θ(x) + g2 (x)θ(−x) + σ 0 δ(x)
(46)
3 Integral und Ableitung der δ-Funktion |
1527
wobei wir die Eigenschaften (19) und (27) der δ-Funktion verwendet haben. Für ei ne unstetige Funktion wird also die normale Ableitung [die ersten beiden Terme von Gl. (46)] um einen Term proportional zur δ-Funktion erweitert, wobei der Proportio nalitätsfaktor durch die Höhe der Sprungstelle gegeben wird.² Bemerkung: Die Fourier-Transformierte der Heavisideschen Sprungfunktion θ(x) kann aus Gl. (12) berechnet werden. Es ergibt sich +∞
∞
∫ dk θ(k) eikx = lim ∫ dk eik(x+iε) = lim ε→0+
−∞
0
ε→0+
i 1 = iP + πδ(x) x + iε x
(47)
3-b Ableitungen von δ In Analogie zum Ausdruck für die partielle Integration wird die Ableitung δ (x) der δ-Funktion definiert über die Beziehung³ +∞
+∞
∫ dx δ (x) f(x) = − ∫ dx δ(x) f (x) = −f (0) −∞
(48)
−∞
Aus dieser Definition folgt sofort δ (−x) = −δ (x)
(49)
x δ (x) = −δ(x)
(50)
und
Umgekehrt lässt sich zeigen, dass die allgemeine Lösung der Gleichung x u(x) = δ(x)
(51)
geschrieben werden kann als u(x) = −δ (x) + c δ(x)
(52)
wobei der zweite Term von der homogenen Gleichung stammt [s. Gl. (25) und Gl. (26)]. Mit Gl. (34) können wir δ (x) schreiben als +∞
δ (x) =
+∞
1 ip i ∫ dp ( ) eipx/ℏ = ∫ k dk eikx 2πℏ ℏ 2π −∞
(53)
−∞
2 Wenn die Funktion bei x = x 0 unstetig ist, ist der zusätzliche Term natürlich von der Form [g1 (x 0 ) − g2 (x 0 )]δ(x − x 0 ). 3 Der Ausdruck δ (x) kann als Grenzwert der Ableitung einer der in § 1-b angegebenen Funktionen, die δ approximieren, angesehen werden.
1528 | II Die Diracsche δ-Funktion Die n-te Ableitung δ(n) (x) kann in derselben Weise definiert werden: +∞
∫ dx δ(n) (x) f(x) = (−1)n f (n) (0)
(54)
−∞
Die Beziehungen (49) und (50) können dann verallgemeinert werden zu δ(n) (−x) = (−1)n δ(n) (x)
(55)
x δ(n) (x) = −n δ(n−1) (x)
(56)
und
4 Die δ-Funktion im dreidimensionalen Raum Die δ-Funktion im dreidimensionalen Raum, die wir einfach δ(r) schreiben wollen, wird analog zu Gl. (4) definiert durch ∫ d3 r δ(r) f(r) = f(0)
(57)
oder allgemeiner durch ∫ d3 r δ(r − r0 ) f(r) = f(r0 )
(58)
δ(r −r0 ) kann in ein Produkt von drei eindimensionalen δ-Funktionen zerlegt werden: δ(r − r0 ) = δ(x − x0 ) δ(y − y0 ) δ(z − z0 )
(59)
bzw. in Polarkoordinaten: 1 δ(r − r0 ) = 2 δ(r − r0 ) δ(θ − θ0 ) δ(φ − φ0 ) r sin θ 1 (60) = 2 δ(r − r0 ) δ(cos θ − cos θ0 ) δ(φ − φ0 ) r Die oben angegebenen Eigenschaften von δ(x) lassen sich damit leicht auf δ(r) übertragen. Weiterhin geben wir die folgende wichtige Beziehung an: 1 ∆ ( ) = −4π δ(r) r
(61)
worin ∆ den Laplace-Operator bezeichnet. Gleichung (61) lässt sich leicht verstehen, wenn wir uns daran erinnern, dass in der Elektrostatik eine sich im Ursprung befind liche Punktladung durch die Raumladungsdichte ρ(r) = q δ(r)
(62)
beschrieben werden kann. Den Ausdruck für das elektrostatische Potential, das diese Ladung erzeugt, kennen wir: U(r) =
q 1 4πε0 r
(63)
4 Die δ-Funktion im dreidimensionalen Raum | 1529
Gleichung (61) stellt also die Poisson-Gleichung für diesen speziellen Fall dar: ∆U(r) = −
1 ρ(r) ε0
(64)
Ein strenger Beweis von Gl. (61) erfordert die Anwendung der mathematischen Theorie der Distributionen; wir wollen uns hier auf einen elementaren „Beweis“ be schränken. Zunächst stellen wir fest, dass der Laplace-Operator auf 1/r angewandt überall null ergibt außer vielleicht im Ursprung: (
d2 2 d 1 + ) =0 dr2 r dr r
für r ≠ 0
(65)
Wir betrachten nun die Kugel K ε mit dem Radius ε um den Ursprung. Es sei g ε (r) eine Funktion, die für r außerhalb K ε gleich 1/r ist, und die innerhalb dieser Kugel solche Werte (von der Größenordnung 1/ε) annimmt, dass g ε (r) hinreichend regulär ist (stetig, differenzierbar usw.). Es sei weiterhin f(r) eine beliebige Funktion von r, die ebenfalls in allen Raumpunkten regulär ist. Wir berechnen den Grenzwert des In tegrals I(ε) = ∫ d3 r f(r) ∆g ε (r)
(66)
für ε → 0. Nach Gl. (65) kann dieses Integral nur Beiträge aus dem Inneren der Kugel K ε enthalten, so dass wir schreiben können I(ε) = ∫ d3 r f(r) ∆g ε (r)
(67)
r≤ε
Wir wählen nun ε so klein, dass die Variation von f(r) innerhalb K ε vernachlässigt werden kann. Dann folgt I(ε) ≈ f(0) ∫ d3 r ∆g ε (r)
(68)
r≤ε
Wir transformieren dieses Integral in ein Integral über die Oberfläche Sε von K ε : I(ε) ≈ f(0) ∫ ∇g ε (r) ⋅ dn
(69)
Sε
Da g ε (r) auf der Fläche Sε stetig ist, haben wir [∇g ε (r)] r=ε = [−
1 1 ] er = − 2 er r2 r=ε ε
(70)
(er ist der Einheitsvektor r/r). Das ergibt I(ε) ≈ f(0) 4πε2 [−
1 ] ≈ −4πf(0) ε2
(71)
1530 | II Die Diracsche δ-Funktion
d. h. lim ∫ d3 r ∆g ε (r) f(r) = −4πf(0)
ε→0
(72)
Der Definition (57) zufolge entspricht dies Gl. (61). Mit Hilfe von Gl. (61) lässt sich z. B. eine Beziehung ableiten, die in der Streutheo rie (s. Kapitel VIII) nützlich ist: (∆ + k 2 )
e±ikr = −4π δ(r) r
(73)
Dazu betrachten wir e±ikr /r als ein Produkt: ∆[
e±ikr 1 1 1 ] = ∆ (e±ikr ) + e±ikr ∆ ( ) + 2∇ ( ) ⋅ ∇ (e±ikr ) r r r r
(74)
Nun gilt ∇ (e±ikr ) = ±ik e±ikr
r r
∆ (e±ikr ) = −k 2 e±ikr ±
2ik ±ikr e r
(75)
Somit erhalten wir schließlich (∆ + k 2 )
e±ikr k 2 2ik 2 k2 = [− ± 2 − 4πδ(r) − 2 (±ik) + ] e±ikr r r r r r = −4π e±ikr δ(r) = −4π δ(r)
(76)
nach Gl. (27). Man kann Gl. (61) verallgemeinern: Wendet man den Laplace-Operator auf die Funktion Y lm (θ, φ)/r l+1 an, so tritt darin die l-te Ableitung von δ(r) auf. Wir betrach ten z. B. cos θ/r2 . Wie wir wissen, wird der Ausdruck für das von einem entlang der z-Achse gerichteten elektrischen Dipol D in einem entfernten Punkt erzeugte elektro statische Potential durch D cos θ/4πε0 r2 gegeben. Es sei q der Betrag der beiden La dungen, die den Dipol bilden, und a der Abstand zwischen ihnen; der Betrag D des Dipolmoments ist dann gleich dem Produkt qa, und die entsprechende Ladungsdich te lässt sich schreiben ρ(r) = q δ (r −
a a ez ) − q δ (r + ez ) 2 2
(77)
(ez ist der Einheitsvektor der z-Achse). Wenn wir a gegen null gehen lassen, während das Produkt D = qa konstant bleibt, wird diese Ladungsdichte zu a→0
ρ(r) → D
∂ δ(r) ∂z
(78)
4 Die δ-Funktion im dreidimensionalen Raum | 1531
Im Limes a → 0 ergibt die Poisson-Gleichung (64) also ∆(
∂ cos θ ) = −4π δ(r) ∂z r2
(79)
Natürlich hätte man diese Gleichung auch wie Gl. (61) oder mit Hilfe der Theorie der Distributionen beweisen können. Eine entsprechende Überlegung lässt sich auf die Funktion Y lm (θ, φ)/r l+1 anwenden, woraus sich das Potential eines sich im Ursprung befindlichen elektrischen Multipolmoments Qm l ergibt (s. Ergänzung EX ).
Referenzen und Literaturhinweise Siehe Dirac (1.13), § 15, und zum Beispiel Butkov (10.8), Kap. 6, oder Bass (10.1), Bdl. I, § 21.7 und § 21.8; Abschnitt 10 der Bibliographie, insbesondere den Unterabschnitt „Fourier-Transformation“.
Anhang III Lagrange- und Hamilton-Mechanik 1 1-a 1-b 1-c 2 3 3-a 3-b 4 4-a 4-b 5 5-a 5-b 5-c
Die Newtonschen Axiome | 1533 Die Dynamik eines Massenpunktes | 1533 Systeme von Massenpunkten | 1534 Grundlegende Sätze | 1535 Lagrange-Funktion und Euler-Lagrange-Gleichungen | 1536 Hamilton-Funktion und kanonische Gleichungen | 1537 Kanonisch konjugierte Impulse | 1537 Die kanonischen Hamilton-Gleichungen | 1538 Anwendungen des Hamilton-Formalismus | 1540 Teilchen in einem Zentralpotential | 1540 Geladenes Teilchen im elektromagnetischen Feld | 1542 Das Prinzip der kleinsten Wirkung | 1546 Geometrische Darstellung der Bewegung eines Systems | 1546 Das Prinzip der kleinsten Wirkung | 1546 Die Euler-Lagrange-Gleichungen und das Wirkungsprinzip | 1547
Wir wollen die Definition und die grundlegenden Eigenschaften der Lagrange- und der Hamilton-Funktion in der klassischen Mechanik wiederholen. Dieser Anhang ist nicht als ein Kurs in analytischer Mechanik gedacht, sein Ziel besteht vielmehr darin, die klassische Grundlage anzugeben, von der man zu den Quantisierungsregeln (s. Ka pitel III) gelangen kann. Im Wesentlichen beschränken wir uns dabei auf Systeme von Massenpunkten.
1 Die Newtonschen Axiome 1-a Die Dynamik eines Massenpunktes Die nichtrelativistische klassische Mechanik beruht auf der Hypothese, dass es we nigstens ein geometrisches Bezugssystem gibt, das Galilei-System oder Inertialsystem, in dem das folgende Axiom gültig ist: Die Newtonsche Bewegungsgleichung: Ein Massenpunkt erfährt zu jedem Zeit punkt eine Beschleunigung a, die proportional zur resultierenden Kraft F ist, die auf den Massenpunkt einwirkt: F = ma
(1)
Die Konstante m ist dabei eine innere Eigenschaft des Teilchens, die sogenannte träge Masse. Gibt es ein Galilei-System, so lässt sich leicht zeigen, dass alle Systeme, die sich relativ zu diesem System geradlinig gleichförmig bewegen, ebenfalls Galilei-Systeme https://doi.org/10.1515/9783110638769-045
1534 | III Lagrange- und Hamilton-Mechanik
sind. Damit werden wir auf das Galileische Relativitätsprinzip geführt: Es gibt kein ab solutes Bezugssystem; kein Experiment erlaubt es, ein Inertialsystem vor einem ande ren auszuzeichnen.
1-b Systeme von Massenpunkten Wir betrachten ein System aus n Massenpunkten; jedes Teilchen gehorcht der New tonschen Bewegungsgleichung¹: m i r̈ i = F i
i = 1, 2, . . . , n
(2)
Die Kräfte, die auf die Teilchen wirken, lassen sich in zwei Kategorien einteilen: innere Kräfte, die von den Wechselwirkungen der Teilchen untereinander herrühren, und äußere Kräfte, deren Ursprung außerhalb des Systems liegt. Man postuliert, dass die inneren Kräfte dem Prinzip von Aktion und Reaktion genügen: Die Kraft, die das Teilchen (i) auf das Teilchen (j) ausübt, ist entgegengesetzt gleich der Kraft, die von Teilchen (j) auf Teilchen (i) ausgeht. Dieses Axiom gilt für Gravitationskräfte und elek trostatische Kräfte, jedoch nicht für magnetische Kräfte (deren Ursprung relativisti scher Natur ist). Wenn sich sämtliche Kräfte aus einem Potential ableiten lassen, können die Be wegungsgleichungen (2) in der Form m i r̈i = −∇i V
(3)
geschrieben werden. Dabei bezeichnet ∇i den Gradienten bezüglich der Koordinaten r i und die potentielle Energie V hat die Form n
V = ∑ V i (r i ) + ∑ V ij (r i − r j ) i=1
(4)
i